CN116710557A - 编码sars-cov-2抗原的优化核苷酸序列 - Google Patents

编码sars-cov-2抗原的优化核苷酸序列 Download PDF

Info

Publication number
CN116710557A
CN116710557A CN202180047594.XA CN202180047594A CN116710557A CN 116710557 A CN116710557 A CN 116710557A CN 202180047594 A CN202180047594 A CN 202180047594A CN 116710557 A CN116710557 A CN 116710557A
Authority
CN
China
Prior art keywords
seq
cov
lipid
nucleotide sequence
sars
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180047594.XA
Other languages
English (en)
Inventor
A·迪亚斯
K·A·陈
M·撒迦利亚
顾晓波
L·伯格林
J·A·斯凯勒斯基
S·卡弗
F·德索拉
T·M·付
K·卡尔宁
S·齐伍库拉
T·普里特尼克
D·卡西米罗
J·S·杜宾斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Translation Bio Co
Original Assignee
Translation Bio Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Translation Bio Co filed Critical Translation Bio Co
Priority claimed from PCT/US2021/031256 external-priority patent/WO2021226436A1/en
Publication of CN116710557A publication Critical patent/CN116710557A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明涉及编码SARS‑CoV‑2抗原的优化核苷酸序列。这些序列特别适用于疫苗组合物,所述疫苗组合物用于治疗或预防需要这种治疗的人或动物受试者的由β‑冠状病毒引起的感染,包括COVID‑19感染。

Description

编码SARS-COV-2抗原的优化核苷酸序列
相关申请的交叉引用
本申请要求2020年5月7日提交的美国临时专利申请序列号63/021,319、2020年6月1日提交的美国临时专利申请序列号63/032,825、2020年9月10日提交的美国临时专利申请序列号63/076,718、2020年9月10日提交的美国临时专利申请序列号63/076,729、2020年10月7日提交的美国临时专利申请序列号63/088,739、2021年1月29日提交的美国临时专利申请序列号63/143,604、2021年1月29日提交的美国临时专利申请序列号63/143,612和2021年2月8日提交的美国临时专利申请序列号63/146,807的权益和优先权,将其内容以其整体并入本文。
序列表
本说明书参考了序列表(在2021年5月7日以名为MRT-2161WO_SL的.txt文件的电子形式提交)。所述.txt文件在日期生成并且大小为757KB。将序列表的全部内容通过引用并入本文。
技术领域
本发明涉及SARS-CoV-2抗原多肽以及编码这些SARS-CoV-2抗原多肽的优化核苷酸序列。这些抗原多肽和优化核苷酸序列特别适用于疫苗组合物,所述疫苗组合物用于治疗或预防需要这种治疗的人或动物受试者的由β-冠状病毒引起的感染,包括COVID-19感染。
背景技术
冠状病毒疾病2019(COVID-19)大流行对全球公共卫生构成严重威胁。COVID-19的致病因子是严重急性呼吸综合征冠状病毒2(SARS-CoV-2),这是一种新出现的人类病原体。
蛋白质抗原的选择和设计都有助于疫苗的免疫原性,无论它是基于蛋白质的还是基于核酸的。此外,关于基于核酸的免疫原性组合物,诸如基于mRNA的疫苗,从编码一种或多种蛋白质抗原的核酸获得的表达水平可以显著影响功效。
重组DNA技术以及核酸测序和合成技术的进步使得一旦确定病原体的基因组序列就有可能快速设计蛋白质抗原。疫苗的成功或失败可以取决于体内产生中和抗体形式的高效反应的抗原多肽的选择。因此,需要提供源自SARS-CoV-2蛋白的新抗原多肽,用于针对COVID-19提供预防的免疫原性组合物。
在细胞内从mRNA有效表达或产生蛋白质取决于多种因素。编码蛋白质的核苷酸序列中密码子的组成和顺序的优化(“密码子优化”)可以导致mRNA编码的蛋白质的更高表达。进行密码子优化的各种方法是本领域中已知的,然而,从计算和/或治疗的角度来看,每种方法都有显著的缺点和局限性。特别地,已知的密码子优化方法通常涉及对于每种氨基酸,将每种密码子用对该氨基酸具有最高使用率的密码子替代,使得“优化”序列仅含有一种密码子编码每种氨基酸。
因此,需要改善的密码子优化方法,其产生优化核苷酸序列,用于增加编码所选择或设计的蛋白质抗原的mRNA的表达,用于生产有效mRNA疫苗。
此外,随着SARS-CoV-2在全球的传播,已出现新的病毒变体。因此,需要提供能够引发广泛中和抗体反应的药物组合物(例如,免疫原性组合物),所述反应有效针对SARS-CoV-2的多种天然存在的变体。
发明内容
本发明解决了选择和/或设计针对SARS-CoV-2产生有效免疫反应的蛋白质抗原的需要。本发明还解决了产生编码该蛋白抗原的优化核苷酸序列的需要,以通过提供包含具有优化核苷酸序列的核酸(例如,mRNA)的疫苗来有效治疗或预防COVID-19感染。本文提供了针对SARS-CoV-2的各种选择和/或设计的蛋白质抗原以及针对每种此类蛋白质抗原的至少一个优化核苷酸序列。
另外,提供了一种用于分析蛋白质抗原的氨基酸序列以产生至少一个优化核苷酸序列的方法。针对每种选择和/或设计的蛋白质抗原的优化核苷酸序列被设计成与天然存在的核苷酸序列相关的蛋白质的表达相比增加该编码的蛋白质抗原的表达。密码子优化基于各种标准产生编码蛋白质的核苷酸序列,而不改变编码蛋白质抗原的翻译氨基酸的序列,这是由于遗传密码的冗余。此外,此处公开的优化核苷酸序列被设计成在体外合成期间产生高质量全长转录物,并且因此可以比用现有技术密码子优化算法产生的优化核苷酸序列更具成本效益地制造。特别地,通过本文所述的序列优化过程,可以有效地去除在体外合成期间可能导致不完整转录物的终止序列及类似物。
如实施例中所证明,包含LNP包封的编码全长融合前稳定化SARS-CoV-2 S蛋白的本发明优化核苷酸序列的免疫原性组合物可以产生有效的中和抗体反应,并且因此可以提供针对COVID-19感染的保护功效。
本发明还解决了对免疫原性组合物的需求,所述免疫原性组合物能够针对SARS-CoV-2的天然存在的变体引发广泛有效的免疫反应,特别是呈中和抗体的形式。如实施例中所示,诸位发明人令人惊讶地发现,向先前用COVID-19疫苗免疫的受试者施用包含LNP包封的编码SARS-CoV-2 S蛋白的南非变体的优化核苷酸序列的免疫原性组合物可以针对宽范围的β-冠状病毒诱导有效的中和抗体反应,所述β-冠状病毒包括南非、日本/巴西和加利福尼亚分离的SARS-CoV-2的天然存在的变体以及在系统发育上更遥远的SARS-CoV-1毒株。
特别地,本发明提供了一种核酸,所述核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,其中所述优化核苷酸序列由与大于或等于10%的使用频率相关的密码子组成;其中所述优化核苷酸序列:不含具有以下核苷酸序列之一的终止信号:5’-X1ATCTX2TX3-3’,其中X1、X2和X3独立地选自A、C、T或G;以及5’-X1AUCUX2UX3-3’,其中X1、X2和X3独立地选自A、C、U或G;不含任何负顺式调控元件和负重复元件;以及具有大于0.8的密码子适应指数;其中当分成不重叠的30个核苷酸长的部分时,所述优化核苷酸序列的每个部分具有30%-70%的鸟嘌呤胞嘧啶含量范围。在具体实施方案中,所述核酸是mRNA。在一些实施方案中,所述核酸是DNA。在某些实施方案中,所述优化核苷酸序列不含具有以下序列之一的终止信号:TATCTGTT;TTTTTT;AAGCTT;GAAGAGC;TCTAGA;UAUCUGUU;UUUUUU;AAGCUU;GAAGAGC;UCUAGA。
在一些实施方案中,所述优化核苷酸序列编码氨基酸序列SEQ ID NO:11。在具体实施方案中,所述优化核苷酸序列与核酸序列SEQ ID NO:44或SEQ ID NO:148至少85%(例如,至少90%)相同并且编码氨基酸序列SEQ ID NO:11。在特定实施方案中,所述优化核苷酸序列具有核酸序列SEQ ID NO:44或SEQ ID NO:148。
在一些实施方案中,由所述优化序列编码的全长SARS-CoV-2刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。在这些实施方案中,所述优化核苷酸序列可以编码氨基酸序列SEQ ID NO:167。在具体实施方案中,所述优化核苷酸与核酸序列SEQ ID NO:166或SEQ ID NO:173至少85%(例如,至少90%)相同并且编码氨基酸序列SEQ ID NO:167。在特定实施方案中,所述优化核苷酸序列具有核酸序列SEQ ID NO:166或SEQ ID NO:173。
在某些实施方案中,本发明的核酸用于疗法。例如,本发明还提供了一种免疫原性组合物,所述免疫原性组合物包含本发明的核酸,所述免疫原性组合物用于预防由β-冠状病毒引起的感染。另外,本发明还提供了本发明的核酸在制造用于预防由β-冠状病毒引起的感染的药剂中的用途。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
本发明进一步提供了一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的免疫原性组合物,所述免疫原性组合物包含本发明的核酸。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
此外,本发明提供了一种药物组合物,所述药物组合物包含i)本发明的核酸,和ii)脂质纳米颗粒。在某些实施方案中,所述核酸是mRNA,其可以以约0.5mg/mL至约1.0mg/mL之间的浓度存在。在某些实施方案中,本发明的核酸(例如,根据本发明的mRNA)被包封在脂质纳米颗粒中。在某些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。在具体实施方案中,所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。在某些实施方案中,阳离子脂质占所述脂质纳米颗粒的按摩尔比计约30%-60%,例如约35%-40%。在某些实施方案中,阳离子脂质与非阳离子脂质与基于胆固醇的脂质与PEG修饰的脂质的比率是按摩尔比计大约30-60:25-35:20-30:1-15。
在某些实施方案中,包封本发明的核酸(例如,根据本发明的mRNA)的脂质纳米颗粒包含cKK-E12、DOPE、胆固醇和DMG-PEG2K;cKK-E10、DOPE、胆固醇和DMG-PEG2K;OF-Deg-Lin、DOPE、胆固醇和DMG-PEG2K;或OF-02、DOPE、胆固醇和DMG-PEG2K。在特定实施方案中,所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。在某些实施方案中,所述脂质纳米颗粒的平均尺寸小于150nm,例如小于130nm、小于110nm、小于100nm。在一些实施方案中,所述脂质纳米颗粒的平均尺寸为约90-110nm,或平均尺寸为约50-70nm,例如约55-65nm。
在某些实施方案中,本发明的药物组合物用于治疗或预防由β-冠状病毒引起的感染。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
在某些实施方案中,本发明的药物组合物是肌内施用的。在某些实施方案中,本发明的药物组合物施用至少一次。在一些实施方案中,药物组合物施用至少两次。在具体实施方案中,施用之间的时间段是至少2周,例如3周或1个月。在一些实施方案中,施用之间的时间段是约3周。
在一个具体实施方案中,本发明提供了一种mRNA构建体(mRNA构建体1),所述mRNA构建体由以下结构元件组成:
具有以下结构的5’帽:
具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
具有核酸序列SEQ ID NO:148的蛋白质编码区;
具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
聚A尾。
在另一个具体实施方案中,本发明提供了一种mRNA构建体(mRNA构建体2),所述mRNA构建体由以下结构元件组成:
具有以下结构的5’帽:
具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
具有核酸序列SEQ ID NO:173的蛋白质编码区;
具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
聚A尾。
在特定实施方案中,本发明提供了包封本发明的mRNA构建体的脂质纳米颗粒。在一些实施方案中,所述脂质纳米颗粒包封多于一种本发明mRNA构建体,例如,脂质纳米颗粒可以包封mRNA构建体1和mRNA构建体2两者。在某些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。在某些实施方案中,所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。在特定实施方案中,所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。
本发明还提供了一种免疫原性组合物,所述免疫原性组合物包含本发明的mRNA构建体或包封本发明的mRNA构建体的脂质纳米颗粒。在一些实施方案中,所述免疫原性组合物包含多于一种本发明mRNA构建体,例如mRNA构建体1和mRNA构建体2。在一些实施方案中,所述免疫原性组合物包含包封在同一脂质纳米颗粒中的多于一种mRNA构建体s(例如,mRNA构建体1和mRNA构建体2)。在其他实施方案中,所述多于一种mRNA构建体(例如,mRNA构建体1和mRNA构建体2)包封在单独的脂质纳米颗粒中。在某些实施方案中,所述免疫原性组合物包含5μg与200μg之间的一种或多种mRNA构建体。
在某些实施方案中,所述免疫原性组合物包含7μg与135μg之间的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少10μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少15μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少20μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少25μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少35μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少40μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含至少45μg的一种或多种mRNA构建体。在某些实施方案中,所述免疫原性组合物包含7.5μg、15μg、45μg或135μg的一种或多种mRNA构建体。典型地,对特定μg量的mRNA的提及是指免疫原性组合物中mRNA的总剂量。
在某些实施方案中,包含本发明mRNA构建体或包封本发明mRNA构建体的脂质纳米颗粒的免疫原性组合物用于治疗或预防由β-冠状病毒引起的感染。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
本发明还提供了一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的免疫原性组合物,所述免疫原性组合物包含本发明的mRNA构建体或包封本发明mRNA构建体的脂质纳米颗粒。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。在具体实施方案中,向受试者至少两次施用免疫原性组合物。在某些实施方案中,施用之间的时间段是至少2周。在一些实施方案中,施用之间的时间段是约3周。
在具体实施方案中,本发明提供了一种免疫原性组合物,所述免疫原性组合物包含至少两种核酸,其中所述第一核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸;以及所述第二核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,并且所述刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。
在一些实施方案中,第一核酸包含编码氨基酸序列SEQ ID NO:11的优化核苷酸序列。在具体实施方案中,第一核酸包含优化核苷酸序列,所述优化核苷酸序列与核酸序列SEQ ID NO:44或SEQ ID NO:148至少85%(例如,至少90%)相同并且编码氨基酸序列SEQID NO:11。在特定实施方案中,所述优化核苷酸序列具有核酸序列SEQ ID NO:44或SEQ IDNO:148。
在一些实施方案中,第二核酸包含编码氨基酸序列SEQ ID NO:167的优化核苷酸序列。在具体实施方案中,第二核酸包含优化核苷酸序列,所述优化核苷酸序列与核酸序列SEQ ID NO:168或SEQ ID NO:173至少85%(例如,至少90%)相同并且编码氨基酸序列SEQID NO:167。在特定实施方案中,所述优化核苷酸序列具有核酸序列SEQ ID NO:166或SEQID NO:169。
在某些实施方案中,所述至少两种核酸是mRNA构建体。在特定实施方案中,第一核酸的优化核苷酸序列具有核酸序列SEQ ID NO:148,并且第二核酸的优化核苷酸序列具有核酸序列SEQ ID NO:173。在具体实施方案中,第一核酸是mRNA构建体1,并且第二核酸是mRNA构建体2。在某些实施方案中,所述至少两种核酸被包封在脂质纳米颗粒中。在某些实施方案中,所述至少两种核酸被包封在同一脂质纳米颗粒中。在某些实施方案中,所述至少两种核酸被包封在单独的脂质纳米颗粒中。
在一些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。在某些实施方案中,所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。在特定实施方案中,所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。在进一步的特定实施方案中,所述免疫原性组合物包含总共7.5μg、15μg、45μg或135μg的所述至少两种核酸。
第[0030]-[0034]段中所述的免疫原性组合物可以用于预防由β-冠状病毒引起的感染。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%(例如,至少80%、90%、95%或99%)相同的刺突蛋白。
在某些实施方案中,受试者先前尚未施用用于预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的免疫原性组合物,即,第[0030]-[0034]段中所述的免疫原性组合物是为此目的向受试者施用的第一种免疫原性组合物。更通常地,受试者先前已被施用一种或多种免疫原性组合物用于预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染。为清楚起见,“受试者先前已被施用一种或多种免疫原性组合物”意指受试者先前已被施用一剂或多剂相同免疫原性组合物或一剂或多剂一种或多种不同免疫原性组合物。例如,受试者可能先前已被施用两种免疫原性组合物,间隔至少两周,用于预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染。在一些实施方案中,所述一种或多种免疫原性组合物不同于第[0030]-[0034]段中所述的免疫原性组合物。在特定实施方案中,所述一种或多种免疫原性组合物选自本文公开的药物组合物(例如,本文公开的免疫原性组合物或疫苗)和由以下生产的COVID-19疫苗:Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))或Novavax(NVX-CoV2373)。在某些实施方案中,在施用先前向受试者施用以预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的一种或多种免疫原性组合物后3-18个月施用第[0030]-[0034]段中所述的免疫原性组合物。在某些实施方案中,在施用先前向受试者施用以预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的一种或多种免疫原性组合物后至少9个月或至少12个月施用第[0030]-[0034]段中所述的免疫原性组合物。在某些实施方案中,施用第[0030]-[0034]段中所述的免疫原性组合物至少一次,例如至少两次。
在另一个具体实施方案中,本发明提供了一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的包含mRNA构建体的免疫原性组合物,其中所述mRNA构建体包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,并且所述刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。在一些实施方案中,所述优化核苷酸序列编码氨基酸序列SEQ ID NO:167。在具体实施方案中,所述优化核苷酸序列包含与核酸序列SEQ ID NO:166或SEQ ID NO:173至少85%(例如,至少90%)相同的核苷酸序列并且编码氨基酸序列SEQ ID NO:167。在特定实施方案中,所述优化核苷酸序列具有核酸序列SEQ ID NO:173。在某些实施方案中,所述mRNA构建体是mRNA构建体2。在某些实施方案中,所述mRNA构建体被包封在脂质纳米颗粒中。在某些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。在某些实施方案中,所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。在特定实施方案中,所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。在某些实施方案中,所述免疫原性组合物包含7.5μg、15μg、45μg或135μg的mRNA构建体。在某些实施方案中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。在特定实施方案中,所述β-冠状病毒是SARS-CoV-2。在其他实施方案中,所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
在第[0037]段中所述的方法中,受试者可能先前尚未施用用于预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的免疫原性组合物。更通常地,所述受试者先前已被施用一种或多种用于预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的免疫原性组合物,例如两种免疫原性组合物,间隔至少两周。在某些实施方案中,所述一种或多种免疫原性组合物不同于本发明的免疫原性组合物。在某些实施方案中,先前已向受试者施用的一种或多种免疫原性组合物选自本文公开的药物组合物(例如,本文公开的免疫原性组合物或疫苗)和由以下生产的COVID-19疫苗:Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))或Novavax(NVX-CoV2373)。在某些实施方案中,第[0037]段中所述的方法包括在施用先前已向受试者施用的一种或多种免疫原性组合物后约3-18个月施用该段中所述的免疫原性组合物。在某些实施方案中,第[0037]段中所述的方法包括在施用所述一种或多种免疫原性组合物后至少9个月或至少12个月施用该段中所述的免疫原性组合物。在某些实施方案中,第[0037]段中所述的方法包括施用该段中所述的免疫原性组合物至少一次,例如至少两次。
附图说明
图1A和图1B展示用于产生根据本发明的优化核苷酸序列的方法。如图1A所展示,所述方法接收目的氨基酸序列和第一密码子使用表,所述第一密码子使用表反映了给定生物体(例如,哺乳动物或人)中每个密码子频率。如果密码子与小于阈值频率(例如,10%)的密码子使用频率相关,则所述方法然后从第一密码子使用表中去除所述密码子。在第一步骤中未去除的密码子的密码子使用频率被归一化以生成归一化密码子使用表。所述方法使用归一化密码子使用表生成优化核苷酸序列列表。每个优化核苷酸序列编码目的氨基酸序列。如图1B所展示,将优化核苷酸序列列表通过按顺序应用基序筛选过滤器、鸟嘌呤胞嘧啶(GC)含量分析过滤器和密码子适应指数(CAI)分析过滤器进一步加工以生成更新的优化核苷酸序列列表。
图2展示了一个示例性条形图,其描绘了从各种密码子优化的核苷酸序列产生的蛋白质的产率,通过EPO的ELISA测定来确定。
图3展示了SARS-CoV-2的刺突蛋白的结构。SS=信号序列;NTD=N-末端结构域;RBD=受体结合结构域;FP=融合肽;HR1=七肽重复区-N(heptad repeat-N);CH,中央螺旋;CTD,连接器结构域;HR2,七肽重复区2;TM,跨膜结构域;CT,胞质尾。S2’、S2’蛋白酶切割位点用箭头表示。PP和GSAS突变导致刺突蛋白的融合前构象。此图像基于Wrap等人(2020)Science 367,6483,1260-1263中的图1。
图4展示了SARS-CoV-2的刺突蛋白及其变体,其可以形成本文公开的药物组合物的一部分或可以由本文公开的优化核苷酸序列编码,例如用于本文公开的基于核酸的疫苗。指示了结构域和亚基、去除弗林蛋白酶切割位点并且用脯氨酸替代残基985、986和987的突变(P、PP、PPP和GSAS突变)和相关SEQ ID NO。相同的缩写如图3中所用。
图5-7展示了表达编码全长天然SARS-CoV-2 S蛋白(构建体A)和SARS-CoV-2 S蛋白的三种稳定融合前构象(构建体B-D)的优化核酸序列的核酸载体构建体的蛋白质产生。构建体B编码变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白被修饰为缺少弗林蛋白酶切割位点(并且因此不被切割以形成S1和S2亚基),并且含有脯氨酸作为残基986和987(从而使蛋白质稳定为其融合前构象)。构建体C编码变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白被修饰为含有脯氨酸作为残基986和987,并且构建体D编码变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白被修饰为缺少弗林蛋白酶切割位点。图5-6示出了构建体A和B可以产生糖基化成熟蛋白(约225kDa带)和加工前的全长S蛋白(约170-180kDa带)。图5还示出了构建体A的S1和S2亚基带的存在,证明天然全长SARS-CoV-2 S蛋白被细胞正确加工。图7证明所有四种构建体都能够产生全长S蛋白。构建体A和构建体C中检测到S1和S2亚基带。构建体B和构建体D中检测到强的完全糖基化成熟S蛋白带。
图8展示了SARS-CoV-2的刺突蛋白及其变体,其可以形成本文公开的药物组合物的一部分或可以由本文公开的优化核苷酸序列编码,例如用于本文公开的基于核酸的疫苗。指示了结构域、亚基、去除弗林蛋白酶切割位点并且用脯氨酸突变残基817、892、899、942、986和987(P、PP、PPP、PPPPP和GSAS)的突变、D614G突变、ER回收信号的去除和延伸的N-末端信号肽以及相关SEQ ID NO。相同的缩写如图3中所用。
图9展示了脂质纳米颗粒(LNP)包封的mRNA的免疫原性组合物在小鼠中产生了稳健的结合和中和抗体反应,所述mRNA包含编码全长不可切割的融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列。图9A展示了在用两剂0.2μg、1μg、5μg或10μg LNP包封的mRNA免疫后,在小鼠体内引发的ELISA滴度。施用mRNA-LNP组合物的稀释剂的一组小鼠充当阴性对照。图9B展示了在用两剂0.2μg、1μg、5μg或10μg LNP包封的mRNA免疫后,在小鼠体内产生的中和抗体的滴度,如通过基于假病毒(pseudovirus)的测定确定的。来自具有轻度、强和重度症状的COVID-19患者的39份个体转化血清样品(Conv Sera)充当阳性对照。如图9C所展示,在第0天和第21天施用免疫原性组合物。在第-7天(基线)、第14天、第21天、第28天和第35天采集血液样品。
图10展示了LNP包封的mRNA的免疫原性组合物产生,所述mRNA包含编码全长不可切割的融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列在小鼠中产生Th1偏向性T细胞反应。图10A示出了在第35天分离的脾细胞分泌高水平的Th1细胞因子干扰素-γ(IFN-γ)。图10B示出了这些脾细胞不分泌可检测量的Th2细胞因子IL-5。如图10C所展示,在第0天和第21天用两剂5μg或10μg LNP包封的mRNA免疫小鼠,在第-4天、第14天、第21天、第28天和第35天采集血液样品,并且在第35天收获脾脏,用于通过ELISPOT测定确定IFN-γ和IL-5水平。
图11展示了LNP包封的mRNA的免疫原性组合物在食蟹猴中产生了稳健的结合和中和抗体反应,所述mRNA包含编码全长不可切割的融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列。图11A展示了在用两剂15μg、45μg或135μg LNP包封的mRNA免疫后,在食蟹猴体内引发的ELISA滴度。图11B展示了在用两剂15μg、45μg或135μg LNP包封的mRNA免疫后,在食蟹猴体内产生的中和抗体的滴度,如通过基于假病毒的测定确定的。图11C展示了在用两剂15μg、45μg或135μg LNP包封的mRNA免疫后,在食蟹猴体内产生的微中和滴度。在图11B和图11C展示的测定中,来自具有轻度、强和重度症状的COVID-19患者的39份个体转化血清样品(Conv Sera)充当阳性对照。如图11D所展示,在第0天和第21天施用免疫原性组合物。在第-4天(基线)、第2天、第7天、第14天、第21天、第23天、第28天和第35天和第42天采集血液样品。在第42天分离外周血单核细胞(PMC),以确定测试组合物引发的细胞介导免疫(CMI)。
图12展示了LNP包封的mRNA的免疫原性组合物产生,所述mRNA包含编码全长不可切割的融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列在食蟹猴中产生Th1偏向性T细胞反应。在第0天和第21天用两剂5μg或10μg LNP包封的mRNA免疫猴。图12A和图12C示出了在分别用肽库S1和S2(SARS-CoV-2 S蛋白衍生肽)刺激后,在第42天分离的PMBC分泌高水平的Th1细胞因子干扰素-γ(IFN-γ)。图12B和图12D示出了这些PMBC响应于肽刺激仅分泌基线水平的Th2细胞因子IL-13。幼稚(非激活和非刺激)脾细胞用作对照,以建立IFN-γ和IL-13的基线水平(短划线)。
图13描述了图9和图11中总结的数据的统计分析。对于1μg、5μg和10μg剂量水平的测试的免疫原性组合物的情况在小鼠体内的假病毒(PsV)滴度与对照人类恢复期血清PsV滴度显著不同(图13A)。对于图11中总结的食蟹猴实验,计算ELISA(IgG)、假病毒(PsV)和微中和(MN)滴度之间的斯皮尔曼相关系数(Spearman Correlation Coefficient,SCC)。对每个单独动物进行SCC,并且计算每剂量(N=4)或所有测试动物(N=12)的平均值(±标准误差)。此分析的结果示出在图13B中。图13C和图13D展示了食蟹猴中的微中和(MN)和假病毒(PsV)滴度显著高于用作对照的人类恢复期血清的MN和PsV滴度。
图14展示了通过包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化mRNA的LNP配制品免疫,小鼠和NHP中诱导的中和抗体滴度。以三周的间隔向小鼠施用两次免疫,其中每剂五种配制品(WT、2P、GSAS、2P/GSAS、2P/GSAS/ALAYT)中的每一种0.4μg。使用相同的免疫计划以每剂六种配制品(2P、GSAS、2P/GSAS、2P/GSAS/ALAYT、6P和6P/GSAS)5μg将非人灵长类动物(NHP)免疫。从免疫前动物(第-4天)以及在施用后第14、21、28、35和42天收集血清样品。每个点表示单独血清样品,并且线表示组的几何平均值。各图下方的虚线表示测定读数的下限。
图15展示了实施例5的LNP配制品在叙利亚金黄仓鼠(Syrian golden hamster)中的保护功效。(a)用单剂量或双剂量方案施用的仓鼠的体重减轻;(b)接受一剂0.15μg(-●-)、1.5μg(-■-)、4.5μg(-▲-)、13.5μg(-▼-)的仓鼠、假处理(sham)(-◆-)或未激发(-○-)动物的肺的H&E染色;(c)用一种或两种剂量方案免疫的仓鼠在激发后第4天和第7天的致病性得分;(d)在感染后第4天和第7天(DPI),与对照组(假处理和幼稚)相比,用两剂实施例5的LNP配制品免疫的仓鼠的肺和鼻组织中SARS-CoV-2亚基因组mRNA(sgmRNA)的定量。
图16提供了毒株,由其衍生S蛋白用于实施例14中所述中和测定的假病毒(PsV)的制备。对于SARS-CoV-2毒株,指示了与来自指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)相比的突变以及D614G突变的存在。在适用时,提供S蛋白氨基酸序列的GenBank编号。PsV是从Integral Molecular获得的,并且还指示了每种PsV的目录号和批号两者。
图17展示了在用编码SARS-CoV-2 S蛋白南非变体的加强mRNA疫苗免疫后,先前已用两剂实施例5的LNP配制品免疫的非人灵长类动物(NHP)针对源自原始毒株的S蛋白(SEQID NO:1)以及在南非、日本/巴西和加利福尼亚中观察到的S蛋白的天然存在的变体以及源自SARS-CoV-1毒株的S蛋白产生有效的中和抗体反应。在第0天和第35天用如实施例5所述的包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化mRNA的LNP配制品向NHP施用两次免疫。在第305天注射包含编码相应S蛋白的mRNA的加强LNP配制品,所述S蛋白具有在天然存在的南非毒株中观察到的突变。在第35、308、329和343天采集血清样品。每个点表示单独血清样品,并且线表示组的几何平均值。虚线表示检测下限。
定义
为了更容易理解本发明,首先在下面定义某些术语。以下术语和其他术语的另外定义阐述在本说明书中。
除非上下文另有明确规定,否则如在本说明书和所附权利要求中所用的,单数形式“一种/一个(a)”、“一种/一个(an)”和“所述”包括复数指示物。
除非特别说明或在上下文中显而易见,否则如本文所用,术语“或”应理解为包含性的并且涵盖“或”和“和”两者。
如本文所用的术语“例如”和“即”仅作为示例而使用,而且不旨在限制,并且不应被理解为仅指说明书中明确列举的那些项目。
除非具体规定或从上下文中明显看出,否则如本文所用的术语“约”应理解为在本领域的正常公差范围内,例如在平均值的2个标准偏差内。“约”可以理解为在所陈述值的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%、0.01%或0.001%之内。除非从上下文中另外清楚看出,否则本文提供的所有数值反映了技术人员可以理解的正常波动。
如本文所用,术语“流产性转录物”或“流产前转录物(pre-aborted transcript)”等是比由DNA模板编码的全长mRNA分子更短的任何转录物,其由RNA聚合酶以不依赖序列的方式从模板DNA中过早释放产生。在一些实施方案中,流产性转录物可以是从靶DNA分子转录的全长mRNA分子的长度的小于90%,例如全长mRNA分子的全长的小于80%、70%、60%、50%、40%、30%、20%、10%、5%、1%。
如本文所用,术语“密码子(codon)”和“密码子(codons)”是指三个核苷酸的序列,这三个核苷酸一起形成遗传密码单元。每个密码子对应于翻译或蛋白质合成过程中的特定氨基酸或停止信号。遗传密码是简并的,并且多于一种密码子可以编码特定的氨基酸残基。例如,密码子可以包括DNA或RNA核苷酸。
如本文所用,术语“密码子优化”和“密码子优化的”是指编码肽、多肽或蛋白质的天然存在的或野生型核酸的密码子组成的修饰,所述修饰不改变其氨基酸序列,从而改善所述核酸的蛋白质表达。在本发明的上下文中,“密码子优化”还可以指这样的过程,其中通过用过滤器从核苷酸序列列表中去除不太优的核苷酸序列获得一种或多种优化核苷酸序列,诸如通过鸟嘌呤-胞嘧啶含量、密码子适应指数、不稳定核酸序列或基序的存在和/或暂停位点和/或终止信号的存在进行过滤。
如本文所用,“全长mRNA”是如当使用特定测定(例如,凝胶电泳以及使用UV和UV吸收光谱法检测与通过毛细管电泳分离)时表征的。编码全长多肽的mRNA分子的长度是从靶DNA转录的全长mRNA分子长度的至少50%,例如,从靶DNA转录的全长mRNA分子的长度的至少60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.01%、99.05%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%。
如本文所用,术语“体外”是指在人工环境中(例如,在试管或反应容器中、在细胞培养物中等),而不是在多细胞生物体内发生的事件。
如本文所用,术语“体内”是指发生在多细胞生物体诸如人类和非人类动物内的事件。在基于细胞的系统的上下文中,所述术语可以用于指代在活细胞内发生的事件(与例如体外系统相反)。
如本文所用,术语“信使RNA(mRNA)”是指编码至少一种多肽的多核糖核苷酸。如本文所用的mRNA包括经修饰的RNA和未经修饰的RNA两者。mRNA可以含有一个或多个编码区和非编码区。mRNA可以从天然来源纯化,使用重组表达系统产生,以及任选地纯化、体外转录或化学合成。在适当情况下,例如,在化学合成分子的情况下,mRNA可能包含核苷类似物,诸如具有化学修饰的碱或糖、骨架修饰等的类似物。除非另有指示,否则mRNA序列以5’至3’方向呈现。
如本文所用,术语“核酸”在其最广义上是指掺入或可掺入多核苷酸链中的任何化合物和/或物质。在一些实施方案中,核酸是一种通过磷酸二酯键掺入或可掺入多核苷酸链中的化合物和/或物质。在一些实施方案中,“核酸”是指单独的核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含单独核酸残基的多核苷酸链。在一些实施方案中,“核酸”包括RNA以及单链和/或双链DNA和/或cDNA。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,即没有磷酸二酯骨架的类似物。除非另有指定,否则核酸序列以5’至3’方向呈现。
如本文所用,术语“核苷酸序列”在其最广义上是指核酸中核碱基的顺序。在一些实施方案中,“核苷酸序列”是指基因内单独核碱基的顺序。在一些实施方案中,“核苷酸序列”是指蛋白质编码基因内单独核碱基的顺序。在一些实施方案中,“核苷酸序列”是指单链和/或双链DNA和/或cDNA中单独核碱基的顺序。在一些实施方案中,“核苷酸序列”是指RNA内单独核碱基的顺序。在一些实施方案中,“核苷酸序列”是指mRNA内单独核碱基的顺序。在具体实施方案中,“核苷酸序列”是指RNA或DNA的蛋白质编码序列中单独核碱基的顺序。除非另有指定,否则核苷酸序列通常以5’至3’方向呈现。
如本文所用,术语“过早终止”是指在DNA模板的全长被转录之前终止转录。如本文所用,过早终止可能由DNA模板内存在核苷酸序列基序(本文中也简称为“基序”)(例如,终止信号)引起,并且导致短于全长mRNA的mRNA转录物(“过早终止的转录物”或“截短的mRNA转录”)。终止信号的例子包括大肠杆菌(E.coli)rrnB终止子t1信号(共有序列:ATCTGTT)及其变体,如本文所述。
如本文所用,术语“模板DNA”(或“DNA模板”)涉及DNA分子,其包含编码有待通过体外转录合成的mRNA转录物的核酸序列。模板DNA用作体外转录的模板,以便产生由模板DNA编码的mRNA转录物。模板DNA包含体外转录所需的所有元件,特别是用于结合DNA依赖性RNA聚合酶(例如像T3、T7和SP6 RNA聚合酶)的启动子元件,其可操作地连接至编码所希望的mRNA转录物的DNA序列。此外,模板DNA可以包含编码mRNA转录物的DNA序列的引物结合位点5’和/或3’,以例如通过PCR或DNA测序来鉴定编码mRNA转录物的DNA序列的同一性。本发明上下文中的“模板DNA”可以是线性或环形DNA分子。如本文所用,术语“模板DNA”可以指DNA载体,诸如质粒DNA,其包含编码所希望的mRNA转录物的核酸序列。
如本文所用,术语“预防(preventing)”是指部分或完全抑制特定感染、疾病、障碍和/或病症的一种或多种症状或特征的发作。
如本文所用,术语“预防(prophylaxis)”是指部分或完全抑制特定感染、疾病、障碍和/或病症的一种或多种症状或特征的发作。
如本文所用,术语“治疗”是指部分或完全缓解、减轻、改善、解除特定感染、疾病、障碍和/或病症的一种或多种症状或特征,延迟所述症状或特征的发作,抑制所述症状或特征的进展,降低所述症状或特征的严重程度,和/或降低所述症状或特征的发病率。
如本文所用,术语“免疫原性组合物”意指包含核酸或蛋白质的组合物,当施用于受试者时,所述组合物引发免疫反应。在一些实施方案中,“免疫原性组合物”包含核酸。在一些实施方案中,所述核酸是mRNA。在一些实施方案中,所述核酸是DNA。应当理解,术语“免疫原性组合物”和“疫苗”在本文中可互换使用并且因此意在具有同等含义。
两个核苷酸(或氨基酸)序列之间的百分比序列同一性在两个序列比对后确定。这种比对和序列同一性百分比可以使用本领域已知的软件程序(例如,Molecular Biology(F.M.Ausubel等人编辑,1987)增补30中的Current Protocols的第7.7.18节中所述的那些)来确定。在本发明的上下文中,通过Smith-Waterman同源性搜索算法使用仿射空位搜索来确定比对,其中空位开放罚分为12并且空位扩展罚分为2,BLOSUM矩阵为62。Smith-Waterman同源性搜索算法披露于Smith&Waterman(1981)Adv.Appl.Math.2:482-489中。然后在两个核苷酸(或氨基酸)序列中位于相同位置的相应核苷酸(或核酸)之间进行比较。当给定位置被两个核苷酸(或氨基酸)序列中的相同核苷酸(或氨基)占据时,这些序列对于此位置是相同的。然后,序列同一性的百分比由相对于进行比较的核苷酸(或核酸)序列中的总核苷酸(或氨基酸)数量,相应核苷酸(或氨基酸)相同的位置的数量确定。
本文中使用的所有技术和科学术语具有与本申请所属领域的普通技术人员通常理解的含义相同的含义以及与本申请所属领域中通常使用的含义相同的含义。将用于描述本发明的背景并且提供关于其实践的其他细节的本文引用的出版物和其他参考材料特此通过引用并入。
具体实施方式
本发明解决了产生编码蛋白质抗原的优化核苷酸序列的需要,以通过提供包含具有优化核苷酸序列的mRNA的疫苗来有效治疗或预防感染疾病。提供了一种用于加工编码蛋白质抗原的天然存在的核苷酸序列以产生至少一个优化核苷酸序列的方法。优化核苷酸序列被设计成与天然存在的核苷酸序列相关的蛋白质的表达相比增加编码的蛋白质抗原的表达。密码子优化可以基于各种标准修饰编码蛋白质的核苷酸序列的组成,而不改变编码蛋白质抗原的翻译氨基酸的序列,这是由于遗传密码的冗余。
为了避免mRNA密码子使用与同源tRNA丰度之间的不平衡,密码子优化可以提供核苷酸序列内的密码子组成,以更好地匹配宿主细胞中天然存在的转移RNA(tRNA)丰度,并且避免特定tRNA的耗竭。由于tRNA丰度影响蛋白质翻译的速率,因此核苷酸序列的密码子优化可以增加蛋白质翻译的效率和编码蛋白质的产率。例如,通过不使用以密码子使用率低为特征的稀有密码子,可以增加蛋白质翻译的效率和蛋白质产率,因为稀有tRNA的短缺可能搁置或终止蛋白质翻译。
密码子优化可能以编码蛋白质的功能活性降低和相关功效损失为代价,因为所述方法可能去除核苷酸序列中编码的信息,所述信息对于控制蛋白质的翻译和确保新生多肽链的正确折叠很重要(Mauro&Chappell,Trends Mol Med.2014;20(11):604-13)。诸位发明人已经发现,保留一些多样性(variety)(即,不一定仅包括一种密码子编码每个氨基酸)的优化序列可以实现增加的蛋白质产率,同时保留编码蛋白质的功能活性。
优化核苷酸序列的产生
图1A和图1B展示用于产生根据本发明的优化核苷酸序列的方法。所述方法首先生成密码子优化序列列表并且然后对所述列表应用三个过滤器。具体地,它应用基序筛选过滤器、鸟嘌呤-胞嘧啶(GC)含量分析过滤器和密码子适应指数(CAI)分析过滤器以产生更新的优化核苷酸序列列表。更新的列表不再包括含有预期干扰编码的蛋白质抗原的有效转录和/或翻译的特征的核苷酸序列。
密码子优化
遗传密码有64种可能密码子。每种密码子包含三个核苷酸的序列。基因组的蛋白质编码区中每种密码子的使用频率可以通过确定特定密码子在基因组的蛋白质编码区中出现的次数并且随后将所得值除以基因组的蛋白质编码区中编码相同氨基酸的密码子的总数来计算。
密码子使用表含有实验得出的数据,所述数据涉及对于产生表的特定生物来源,每种密码子用于编码某种氨基酸的频率。对于每种密码子,此信息表示为该密码子用于编码某种氨基酸的相对于密码子编码该氨基酸的总数的频率的百分比(0至100%)或分数(0-1)。
密码子使用表存储在公开可用的数据库中,诸如密码子使用数据库(Codon UsageDatabase)(Nakamura等人(2000)Nucleic Acids Research 28(1),292;可在线访问https://www.kazusa.or.jp/codon/)和高性能集成虚拟环境-密码子使用表(High-performance Integrated Virtual Environment-Codon Usage Table,HIVE-CUT)数据库(Athey等人,(2017),BMC Bioinformatics 18(1),391;可在线访问http://hive.biochemistry.gwu.edu/review/codon)。
在密码子优化的第一步中,如果密码子与小于阈值频率(例如,10%)的密码子使用频率相关,则将其从第一密码子使用表中去除,第一密码子使用表反映了给定生物体(例如,哺乳动物或人)中每种密码子的频率。在第一步骤中未去除的密码子的密码子使用频率被归一化以生成归一化密码子使用表。通过基于归一化密码子使用表中与给定氨基酸相关的一种或多种密码子的使用频率为氨基酸序列中每种氨基酸的密码子,产生编码目的氨基酸序列的优化核苷酸序列。为给定氨基酸选择某种密码子的概率等于归一化密码子使用表中与此氨基酸相关的密码子相关的使用频率。
本发明的密码子优化序列通过用于产生优化核苷酸序列的计算机实现方法产生。所述方法包括:(i)接收氨基酸序列,其中所述氨基酸序列编码肽、多肽或蛋白质;(ii)接收第一密码子使用表,其中第一密码子使用表包括氨基酸列表,其中表中的每种氨基酸与至少一种密码子相关,并且每种密码子与使用频率相关;(iii)从密码子使用表中去除与低于阈值频率的使用频率相关的任何密码子;(iv)通过归一化步骤(iii)中未去除的密码子的使用频率,生成归一化密码子使用表;以及(v)通过基于归一化密码子使用表中与氨基酸相关的一种或多种密码子的使用频率为氨基酸序列中每种氨基酸的密码子,产生编码所述氨基酸序列的优化核苷酸序列。阈值频率可以在5%-30%的范围内,特别是5%、10%、15%、20%、25%或30%。在本发明的上下文中,阈值频率典型地是10%。
生成归一化密码子使用表的步骤包括:(a)将与第一氨基酸相关并且在步骤(iii)中去除的每种密码子的使用频率分布于与第一氨基酸相关的剩余密码子;以及(b)为每种氨基酸重复步骤(a)以产生归一化密码子使用表。在一些实施方案中,被去除密码子的使用频率平均分布于剩余的密码子。在一些实施方案中,基于每种剩余密码子的使用频率,被去除密码子的使用频率按比例分布于剩余密码子。在此上下文中的“分布”可以定义为取与某种氨基酸相关的被去除密码子的使用频率的组合量,并且将此组合频率的一部分分配给编码氨基酸的剩余密码子中的每一种。
为每种氨基酸选择密码子的步骤包括:(a)在归一化密码子使用表中鉴定与氨基酸序列的第一氨基酸相关的一种或多种密码子;(b)选择与第一氨基酸相关的密码子,其中选择某种密码子的概率等于归一化密码子使用表中与第一氨基酸相关的密码子相关的使用频率;以及(c)重复步骤(a)和(b)直到已为氨基酸序列中的每个氨基酸选择密码子。
通过为氨基酸序列中的每个氨基酸选择密码子来生成优化核苷酸序列的步骤(上述方法中的步骤(v))进行n次,以生成优化核苷酸序列列表。
基序筛选
将基序筛选过滤器应用于优化核苷酸序列列表从列表中去除编码任何已知负顺式调控元件和负重复元件的优化核苷酸序列以生成更新的列表。
对于列表中的每个优化核苷酸序列,还确定其是否含有终止信号。从列表中去除含有一个或多个终止信号的任何核苷酸序列,产生更新的列表。在一些实施方案中,终止信号具有以下核苷酸序列:5’-X1ATCTX2TX3-3’,其中X1、X2和X3独立地选自A、C、T或G。在一些实施方案中,终止信号具有以下核苷酸序列之一:TATCTGTT;和/或TTTTTT;和/或AAGCTT;和/或GAAGAGC;和/或TCTAGA。在一些实施方案中,终止信号具有以下核苷酸序列:5’-X1AUCUX2UX3-3’,其中X1、X2和X3独立地选自A、C、U或G。在一些实施方案中,终止信号具有以下核苷酸序列之一:UAUCUGUU;和/或UUUUUU;和/或AAGCUU;和/或GAAGAGC;和/或UCUAGA。
鸟嘌呤-胞嘧啶(GC)含量
所述方法进一步包括确定更新的优化核苷酸序列列表中每个优化核苷酸序列的鸟嘌呤-胞嘧啶(GC)含量。序列的GC含量是核苷酸序列中鸟嘌呤或胞嘧啶碱基的百分比。如果任何核苷酸序列的GC含量落在预定的GC含量范围之外,则通过将其从列表中去除来进一步更新优化核苷酸序列列表。
每个优化核苷酸序列的GC含量的确定包括,对于每个核苷酸序列:确定核苷酸序列的一个或多个另外部分的GC含量,其中所述另外部分彼此不重叠并且与第一部分不重叠,并且其中优化序列列表的更新包括:如果任何部分的GC含量落在预定GC含量范围之外,则去除所述核苷酸序列,任选地其中当确定任何部分的GC含量在预定GC含量范围之外时,停止确定所述核苷酸序列的GC含量。在一些实施方案中,核苷酸序列的第一部分和/或一个或多个另外部分含有预定的核苷酸数量,任选地其中所述预定数量的核苷酸在5至300个核苷酸、或10至200个核苷酸、或15至100个核苷酸、或20至50个核苷酸的范围内。在本发明的上下文中,预定数量的核苷酸典型地是30个核苷酸。预定的GC含量范围可以是15%-75%、或40%-60%、或30%-70%。在本发明的上下文中,预定的GC含量范围典型地是30%-70%。
在本发明的上下文中,合适的GC含量过滤器可以首先分析优化核苷酸序列的前30个核苷酸,即优化核苷酸序列中的核苷酸1至30。分析可以包括确定具有G或C的部分中的核苷酸的数量,并且所述部分的GC含量的确定可以包括将所述部分中的G或C核苷酸的数量除以所述部分中核苷酸的总数。此分析的结果将提供描述所述部分中G或C核苷酸比例的值,并且可以是百分比,例如50%,或小数,例如0.5。如果第一部分的GC含量落在预定的GC含量范围之外,则可以从优化核苷酸序列列表中去除优化核苷酸序列。
如果第一部分的GC含量落在预定的GC含量范围内,则GC含量过滤器然后可以分析优化核苷酸序列的第二部分。在此例子中,这可以是优化核苷酸序列的第二30个核苷酸,即核苷酸31至60。可以对每个部分重复部分分析,直到:发现GC含量落在预定GC含量范围之外的部分,在这种情况下,可以从列表中去除优化核苷酸序列,或已经分析了整个优化核苷酸序列并且没有发现这样的部分,在这种情况下,GC含量过滤器将优化核苷酸序列保留在列表中并且可以继续到列表中的下一个优化核苷酸序列。
密码子适应指数(CAI)
所述方法进一步包括确定最新更新的优化核苷酸序列列表中的每个优化核苷酸序列的密码子适应指数。序列的密码子适应指数是密码子使用偏向性的度量,并且可以是0与1之间的值。如果任何核苷酸序列的密码子适应指数小于或等于预定的密码子适应指数阈值,则通过将其去除来进一步更新最近更新的优化核苷酸序列列表。密码子适应指数阈值可以是0.7、或0.75、或0.8、或0.85、或0.9。诸位发明人已发现,密码子适应指数等于或大于0.8的优化核苷酸序列提供非常高的蛋白质产率。因此,在本发明的上下文中,密码子适应指数阈值典型地是0.8。
对于每个优化核苷酸序列,可以以本领域技术人员显而易见的任何方式计算密码子适应指数,例如,如以下所述“The codon adaptation index--a measure ofdirectional synonymous codon usage bias,and its potential applications”(Sharp和Li,1987.Nucleic Acids Research 15(3),第1281-1295页);可在线访问https://www.ncbi.nlm.nih.gov/pmc/articles/PMC340524/。
密码子适应指数计算的实现可以包括根据或类似于以下的方法。对于序列中的每个氨基酸,序列中每个密码子的权重可以用称为相对适应性(wi)的参数来表示。相对适应性可以根据参考序列集计算为对于该氨基酸,密码子的观察频率fi与最大频率的同义密码子的频率fj之间的比率。序列的密码子适应指数然后可以计算为序列长度上每个密码子相关权重的几何平均值(以密码子测量)。用于计算密码子适应指数的参考序列集可以是用于本发明方法得出密码子使用表的相同参考序列集。
优化核苷酸序列的合成
一旦生成优化核苷酸序列列表,可以用核酸载体诸如含有启动子的线性或环状DNA模板、核糖核苷酸三磷酸库、可包含DTT和镁离子的缓冲体系、和适当RNA聚合酶(例如,T3、T7或SP6 RNA聚合酶)、脱氧核糖核酸酶I、焦磷酸酶和/或核糖核酸酶抑制剂进行体外合成(通常也称为“体外转录”)。确切的条件将根据具体应用而变化。
核酸载体典型地是质粒。术语’质粒’或’质粒核酸载体’是指环状核酸分子,例如人工核酸分子。本发明的上下文中的质粒DNA适用于掺入或包含所希望的核酸序列,诸如包含编码mRNA转录物的序列和/或至少编码蛋白质抗原的开放阅读框的核酸序列。此类质粒DNA构建体/载体可以是表达载体、克隆载体、转移载体等。
核酸载体典型地包含对应于(编码)所希望的mRNA转录物的序列或其部分,诸如对应于编码蛋白质抗原的优化核苷酸序列和mRNA的5’-和/或3’UTR的序列。在一些实施方案中,对应于所希望的mRNA转录物的序列也可以编码在3’UTR后的聚A尾,使得聚A尾包含在mRNA转录物中。更典型地,在本发明的上下文中,对应于所希望的mRNA转录物的序列由5’/3’UTR和开放阅读框组成。在本发明的一些实施方案中,在体外转录期间从核酸载体合成的mRNA转录物不含聚A尾。可以在合成后加工步骤中将聚A尾添加到mRNA转录物中。
优化核苷酸序列的筛选
编码优化核苷酸序列(编码蛋白质抗原)的单独体外转录、加帽和加尾mRNA可以在体内或体外转染到细胞中,以确定由优化核苷酸序列编码的蛋白质的表达水平。编码蛋白质抗原的mRNA(例如,编码蛋白质抗原的天然存在的核苷酸序列)或用除了本文所述的用于产生优化核苷酸序列的方法以外的方法制备的编码蛋白质抗原的密码子优化核苷酸序列可以用作对照mRNA。使每种mRNA和对照mRNA与单独的细胞或生物体接触,其中接触细胞或生物体。如果与由与对照mRNA接触的细胞或生物体产生的蛋白质的产率相比,包含根据本发明产生的优化核苷酸序列的mRNA产生增加的蛋白质抗原产率,则选择其用于根据本发明的免疫原性组合物。
本领域众所周知的方法,诸如蛋白质印迹,适用于以实验方式验证优化核苷酸序列导致编码的蛋白质抗原的表达和产生增加。此外,可以筛选由本发明方法产生的多个优化核苷酸序列,以鉴定产生最高蛋白质产率的一个或多个序列。在一些实施方案中,由优化核苷酸序列编码的蛋白质的表达水平增加至少2倍,例如至少3倍或4倍。
在一些实施方案中,确定由优化核苷酸序列编码的蛋白质抗原的功能活性。由优化核苷酸序列编码的蛋白质的功能活性可以使用一系列非常确实的方法来确定。这些方法可以根据编码蛋白质抗原的特性而变化。例如,识别蛋白质抗原上的构象表位的抗体可以用于确认由优化核苷酸序列表达的蛋白质抗原的正确折叠。可替代地或另外,在涉及SARS-CoV-2刺突蛋白的本发明实施方案中,刺突蛋白可以与人血管紧张素转化酶2(ACE2)接触以证实其受体结合活性。结合活性典型地相对于对照(诸如由天然存在的编码序列表达的SARS-CoV-2的刺突蛋白)来评估。
SARS-CoV-2蛋白
冠状病毒(CoV)是属于套式病毒目(Nidovirale)中最大的一组病毒,套式病毒目包括冠状病毒科(Coronaviridae)、动脉炎病毒科(Arteriviridae)和杆套病毒科(Roniviridae)。CoV是球形包膜病毒,具有正义单链RNA基因组和直径大约125nm的螺旋对称的核衣壳。
SARS-CoV-2是β-冠状病毒,像其他冠状病毒一样感染人类,诸如MERS-CoV和SARS-CoV。病毒30kb RNA基因组的前三分之二(主要命名为ORF1a/b区)编码两种多蛋白(pp1a和pp1ab),其构成主要的非结构蛋白。剩余的基因组编码辅助蛋白和四种必需的结构蛋白,即刺突(S)糖蛋白、小包膜(E)蛋白、基质/膜(M)蛋白和核衣壳(N)蛋白(Kang等人(2020)https://doi.org/10.1101/2020.03.06.977876)。SARS-CoV-2利用其S蛋白结合宿主细胞受体(人类的ACE2)并且介导细胞进入。这使得S蛋白成为中和抗体的主要靶标,如下面将详细讨论。
刺突糖蛋白(S蛋白)
细胞进入依赖于S蛋白与细胞表面上的受体的结合以及通过宿主细胞蛋白酶进行的S蛋白引发。S蛋白包含两个功能亚基,负责结合宿主细胞受体(S1亚基)以及融合病毒膜和细胞膜(S2亚基)(图3)。S蛋白形成同源三聚体,其在病毒表面上产生独特的刺突结构。S1亚基具有大的受体结合结构域(RBD),而S2形成刺突分子的茎。全长SARS-CoV-2 S糖蛋白的氨基酸序列由SEQ ID NO:1(Gen Bank QHD43416.1)提供。S1亚基位于残基1至681,S2亚基位于残基686至1208,并且S2’亚基位于残基816至1208。S蛋白的C-末端含有跨膜结构域,并且胞质尾的最后19个氨基酸含有内质网(ER)-滞留信号。
对天然存在的SARS-CoV-2 S蛋白的提及是指由SEQ ID NO:1提供的全长SARS-CoV-2 S糖蛋白。对天然存在的SARS-CoV-2 S蛋白的任何修饰是基于SEQ ID NO:1中的残基编号的。
尽管在大流行SARS-CoV-2序列中观察到的多样性很低,但其快速的全球传播为病毒提供了充分的自然选择机会,以作用于罕见但有利的突变。有利的是靶向流行的SARS-CoV-2病毒的序列,而不仅仅是指标毒株(即,SEQ ID NO:1)。
SARS-CoV-2 S糖蛋白中的氨基酸变化D614G在2020 COVID-19大流行中的早期出现,并且截至2020年7月,已成为全世界最流行的病毒形式。感染G614的患者比感染D614的患者脱落更多病毒核酸,并且携带G614的病毒显示出在体外比其D614对应物显著更高的感染滴度(Korber等人,2020,Cell 182,1-16)。编码包含D614G突变的SARS-CoV-2 S蛋白的优化核苷酸序列因此可以特别适用于如本文所述的免疫原性组合物。
下表总结了在SARS-CoV-2 S蛋白中鉴定的其他罕见突变(Korber等人2020-https://doi.org/10.1101/2020.04.29.069054):
刺突突变 刺突位置可能影响
L5F 信号肽
L8V/W 信号肽
H49Y S1 NTD结构域
Y145H/del S1 NTD结构域
Q239K S1 NTD结构域
V367F 上/下构象
G476S 直接在RBD中
V483A 上/下构象
V6151/F 在SARS-CoV ADE表位中
A831V 在S2中的潜在融合肽
D839Y/N/E S2亚基
S943P HR1的融合核
P1263L 胞质尾
进一步的SARS-CoV-2 S糖蛋白突变包括:L18F、HV 69-70缺失、Y144缺失、E154Q、Q218E、A222V、S447N、F490S、S494P、N501Y、A570D、E583D、T618E、P681H、A701V、T716I、T723I、I843V、S982A和D1118H。在2020年末,在英国、南非、巴西和加利福尼亚出现了含有多种突变的新SARS-CoV-2变体。英国变体(命名为谱系B.1.1.7)中SARS-CoV-2 S糖蛋白存在的突变包含H69缺失(ΔH69)、V70缺失(ΔV70)、Y144缺失(ΔY144)、N501Y、A570D、P681H、T716I、S982A和D1118H(Rambaut等人2020 https://virological.org/t/preliminary- genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-the-uk-defined- by-a-novel-set-of-spike-mutations/563)。在2020年10月,南非变体(命名为谱系B.1.351)包含SARS-CoV-2 S糖蛋白中的六个突变-D80A、K417N、E484K、N501Y、D614G和A701V。到11月底,出现了另外三个SARS-CoV-2 S糖蛋白突变(L18F、R246I和K417N)和L242(ΔL242)、A243(ΔA243)和L244(ΔL244)三个氨基酸的缺失(Tegally等人(2020)https:// doi.org/10.1101/2020.12.21.20248640)。巴西变体(命名为谱系P.1)中SARS-CoV-2 S糖蛋白中存在的突变包括L18F、T20N、P26S、D138Y、R190S、K417T、E484K、N501Y、H655Y、T1027I和V1176F。加利福尼亚变体(称为CAL.20C)中SARS-CoV-2 S糖蛋白中存在的突变包括S13I、W152C和L452R(Zhang等人(2021)https://doi.org/10.1101/2021.01.18.21249786)。
在一些实施方案中,全长SARS-CoV-2 S糖蛋白的氨基酸序列可以具有多个突变。例如,相对于氨基酸序列SEQ ID NO:1,两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个突变。SARS-CoV-2 S糖蛋白中的突变可以是氨基酸缺失或氨基酸取代。突变的可能组合包括:(a)L18F、A222V、D614G;(b)A222V、D614G;(c)A222V、E583D、D614G;(d)S447N、D614G;(e)E154Q、F490S、D614G、I834V;(f)D614G、A701V;(g)Q218E、D614G;(h)D614G、T618R;(i)ΔL242、ΔA243、ΔL244;(j)A222V、E583D、A701V;(k)ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A、D1118H(英国变体+D614G);(l)D80A、K417N、E484K、N501Y、D614G和A701V(南非固定突变+D614G);(m)D80A、K417N、E484K、N501Y和A701V(南非固定突变;(n)D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G、A701V(南非变体1+D614G);(o)L18F、D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V(南非变体2+D614G);(p)L18F、T20N、P26S、D138Y、R190S、K417T、E484K、N501Y、D614G、H655Y、T1027I和V1176F(巴西变体+D614G)和(q)S13I、W152C、L452R和D614G(加利福尼亚变体+D614G)。
在一些实施方案中,全长SARS-CoV-2 S糖蛋白的氨基酸序列可以具有相对于氨基酸序列SEQ ID NO:1一个或多个突变。这可以包括以下突变中的一种或多种:D614GW突变、L5FW突变、L8V/WW突变、H49YW突变、Y145H/delW突变、Q239KW突变、V367FW突变、G476SW突变、V483AW突变、V6151/FW突变、A831VW突变、D839Y/N/EW突变、S943PW突变、P1263L突变。因此,在具体实施方案中,本文所述的任何S蛋白或其抗原性片段包含D614G突变。例如,在具体实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段包含D614G突变。
在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含L5F突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含L8V/W突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含H49Y突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含Y145H/del突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含Q239K突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含V367F突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含G476S突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含V483A突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含V6151/F突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含A831V突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含D839Y/N/E突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含S943P突变。在一些实施方案中,本文所述的任何S蛋白或其抗原性片段包含P1263L突变。
根据本发明的优化核苷酸序列可以编码SARS-CoV-2 S蛋白或其抗原片段。在具体实施方案中,所述优化核苷酸序列编码全长SARS-CoV-2 S蛋白。全长SARS-CoV-2S蛋白可以具有包含SEQ ID NO:1的氨基酸序列或与SEQ ID NO:1至少95%、96%、97%、98%或99%相同的氨基酸序列。在一些实施方案中,编码全长SARS-CoV-2 S蛋白的优化核苷酸序列具有序列SEQ ID NO:29。在其他实施方案中,优化核苷酸序列与SEQ ID NO:29至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:1。
在一些实施方案中,所述优化核苷酸序列编码包含相对于氨基酸序列SEQ ID NO:1一个或多个突变的SARS-CoV-2 S蛋白。例如,在一些实施方案中,所述优化核苷酸序列编码包含以下突变中的一种或多种的SARS-CoV2 S蛋白:D614G突变、L5F突变、L8V/W突变、H49Y突变、Y145H/del突变、Q239K突变、V367F突变、G476S突变、V483A突变、V6151/F突变、A831V突变、D839Y/N/E突变、S943P突变、P1263L突变。因此,在具体实施方案中,所述优化核苷酸序列编码包含D614G突变的SARS-CoV2 S蛋白。例如,在具体实施方案中,所述优化核苷酸序列编码包含D614G突变的SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段。
在一些实施方案中,所述优化核苷酸序列编码包含L5F突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含L8V/W突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含H49Y突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含Y145H/del突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含Q239K突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含V367F突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含G467S突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含V483A突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含V6151/F突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含A831V突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含D839Y/N/E突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含S943P突变的SARS-CoV2 S蛋白。在一些实施方案中,所述优化核苷酸序列编码包含P1263L突变的SARS-CoV2 S蛋白。
可替代地,根据本发明的优化核苷酸序列可以编码SARS-CoV-2 S蛋白的抗原片段。在某些实施方案中,所述优化核苷酸序列可以编码SARS-CoV-2 S蛋白的膜外结构域,所述膜外结构域可以具有氨基酸序列SEQ ID NO:2或与SEQ ID NO:2至少95%、96%、97%、98%或99%相同的氨基酸序列。膜外结构域不含全长SARS-CoV-2 S蛋白残基1209-1273,其包括跨膜结构域和胞质尾。在一些实施方案中,编码SARS-CoV-2 S蛋白的膜外结构域的优化核苷酸序列具有序列SEQ ID NO:30。在其他实施方案中,优化核苷酸序列与SEQ ID NO:30至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:2。
在其他实施方案中,SARS-CoV-2 S蛋白的抗原片段可以包含以下中的一种或多种:SARS-CoV-2 S蛋白的S1亚基、S2亚基和/或S2’亚基。例如,优化核苷酸序列可以编码S1亚基,其具有氨基酸序列SEQ ID NO:3。因此,在一个实施方案中,优化核苷酸序列可以编码包含SEQ ID NO:3的氨基酸序列。在一个实施方案中,编码SARS-CoV-2 S蛋白的S1亚基的优化核苷酸序列具有序列SEQ ID NO:31。在其他实施方案中,优化核苷酸序列与SEQ ID NO:31至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:3。在替代实施方案中,优化核苷酸序列可以编码S2亚基,其具有氨基酸序列SEQ ID NO:4。因此,在一个实施方案中,优化核苷酸序列可以编码包含SEQ IDNO:4的氨基酸序列。在一个实施方案中,编码SARS-CoV-2 S蛋白的S2亚基的优化核苷酸序列具有序列SEQ ID NO:32。在其他实施方案中,优化核苷酸序列与SEQ ID NO:32至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:4。在替代实施方案中,优化核苷酸序列可以编码S2’亚基,其具有氨基酸序列SEQ ID NO:5。因此,在一个实施方案中,优化核苷酸序列可以编码包含SEQ ID NO:5的氨基酸序列。在一个实施方案中,编码SARS-CoV-2 S蛋白的S2’亚基的优化核苷酸序列具有序列SEQ ID NO:33。在其他实施方案中,优化核苷酸序列与SEQ ID NO:33至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:5。
在一些实施方案中,SARS-CoV-2 S蛋白的抗原片段可以包含SARS-CoV-2 S蛋白的全长S2亚基或S2’亚基。全长S2亚基或S2’亚基包含跨膜结构域和胞质尾。全长S2亚基包括SARS-CoV-2 S蛋白的残基686至1273,并且S2’亚基包括SARS-CoV-2 S蛋白的残基816至1273。例如,优化核苷酸序列可以编码全长S2亚基,其具有氨基酸序列SEQ ID NO:72。因此,在一个实施方案中,优化核苷酸序列可以编码包含SEQ ID NO:72的氨基酸序列。在一个实施方案中,编码SARS-CoV-2 S蛋白的全长S2亚基的优化核苷酸序列具有序列SEQ ID NO:71。在其他实施方案中,优化核苷酸序列与SEQ ID NO:71至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:72。在替代实施方案中,优化核苷酸序列可以编码全长S2’亚基,其具有氨基酸序列SEQ ID NO:98。因此,在一个实施方案中,优化核苷酸序列可以编码包含SEQ ID NO:98的氨基酸序列。在一个实施方案中,编码SARS-CoV-2 S蛋白的全长S2’亚基的优化核苷酸序列具有序列SEQ IDNO:97。在其他实施方案中,优化核苷酸序列是至少81并且编码氨基酸序列SEQ ID NO:98。
SARS-CoV-2 S蛋白通过以下方式介导病毒进入宿主细胞:首先经由位于S1亚基中的受体结合结构域(RBD)结合血管紧张素转化酶2(ACE2)受体,并且然后经由S2亚基融合病毒膜和宿主膜(Tai等人(2020)Cellular and Molecular immunology,doi.org/10.1038/s41423-020-0400-4)。Tai等人鉴定出在S蛋白的残基331至524的SARS-CoV-2的RBD区。下表2中的SEQ ID NO:6提供了SARS-CoV-2 S蛋白的残基331至521的推定RBD。含有SARS-CoV的193-氨基酸RBD(残基318-510)和人IgG1 Fc片段的重组融合蛋白已显示在用其免疫的兔中诱导高度有效的抗体反应(He等人(2004)Biochem Biophys Res Commun;324(2):773-781.)。因此,SARS-CoV-2 S蛋白的RBD也能够高度诱导抗体反应。SARS-CoV的RBD和SARS-CoV-2的RBD都与ACE2结合。因此,考虑了SARS-CoV-2 S蛋白的抗原片段可以编码RBD。因此,在具体实施方案中,优化核苷酸序列可以编码包含SARS-CoV-2 S蛋白的RBD的氨基酸序列,其具有氨基酸序列SEQ ID NO:6。在一个实施方案中,编码SARS-CoV-2 S蛋白的RBD的优化核苷酸序列具有序列SEQ ID NO:34。在其他实施方案中,优化核苷酸序列与SEQ ID NO:34至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:6。
在某些实施方案中,SARS-CoV-2 S蛋白的抗原片段与外源N-末端信号肽融合。信号肽将蛋白质导向ER和分泌途径,使得蛋白质进入表达其的宿主细胞中的分泌途径。在具体实施方案中,本发明提供了SARS-CoV-2 S蛋白的抗原片段,其与N-末端信号肽可操作地连接。例如,SARS-CoV-2 S蛋白的RBD可以可操作地连接至N-末端信号肽,这使得所得蛋白质能够从表达它的宿主细胞中分泌出来。
在特定实施方案中,N-末端信号肽可以具有序列MFVFLVLLPLVSSQC(SE Q ID NO:7),其为天然存在的SARS-CoV-2 S蛋白的天然信号肽。在一些实施方案中,信号肽由核苷酸序列ATGTTCGTCTTCCTCGTGCTGCTCCCACTCGTTTCTTCCCAGTG T(SEQ ID NO:37)编码。许多其他信号肽是本领域已知的,其可以用于从宿主细胞分泌蛋白质,例如Freudl(2018)MicrobialCell Factories 17:52的综述中提到的那些。可用作本发明一部分的替代信号肽是MATGSRTSLLLAFGLLCLPWLQEGSAFPTIPLS(SEQ ID NO:38)。在一些实施方案中,信号肽由核苷酸序列AUGGCCACUGGAUCAAGAA CCUCACUGCUGCUCGCUUUUGGACUGCUUUGCCUGCCCUGGUUGCAAGAAGGAUCGGCUUUCCCGACCAUCCCACUCUCC(SEQ ID NO:39)编码。
可用作本发明一部分的另一种信号肽是MATGSRTSLLLAFGLLCLPWLQEGSAFPTIP LS(SEQ ID NO:40)。在一些实施方案中,信号肽由核苷酸序列AUGGCAACUGGAU CAAGAACCUCCCUCCUGCUCGCAUUCGGCCUGCUCUGUCUCCCAUGGCUCCAAG AAGGAAGCGCGUUCCCCACUAUCCCCCUCUCG(SEQ ID NO:41)编码。
SARS-CoV-2基因组的原始注释将SARS-CoV-2 S蛋白的信号肽序列鉴定为SE Q IDNO:7。SARS-CoV-2基因组的替代注释鉴定了较长的天然N-末端信号肽序列MFLLTTKRTMFVFLVLLPLVSSQC(SEQ ID NO:142),其长九个氨基酸。在特定实施方案中,N-末端信号肽可以是具有序列SEQ ID NO:142。在一些实施方案中,信号肽由核苷酸序列ATGTTCCTGCTGACAACAAAAAGAACCATGTTTGTGTTCCTGGTGCTGCTGC CTCTGGTGTCCTCACAGTGT(SEQ ID NO:143)编码。
在具体实施方案中,本发明的优化核苷酸序列可以编码包含可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:8的氨基酸序列。在一个实施方案中,编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白RBD的优化核苷酸序列具有序列SEQ ID NO:35。在其他实施方案中,优化核苷酸序列与SEQ ID NO:35至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:8。
在具体实施方案中,本发明的优化核苷酸序列可以编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白S2亚基,其具有包含SEQ ID NO:74氨基酸序列。在一个实施方案中,编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白S2亚基的优化核苷酸序列具有序列SEQ ID NO:73。在其他实施方案中,优化核苷酸序列与SEQ ID NO:73至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:74。
在具体实施方案中,本发明的优化核苷酸序列可以编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白S2’亚基,其具有包含SEQ ID NO:66氨基酸序列。在一个实施方案中,编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白S2亚基的优化核苷酸序列具有序列SEQ ID NO:65。在其他实施方案中,优化核苷酸序列与SEQ ID NO:65至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:66。
在具体实施方案中,本发明的优化核苷酸序列可以编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白全长S2亚基,其具有包含SEQ ID NO:68氨基酸序列。在一个实施方案中,编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白全长S2亚基的优化核苷酸序列具有序列SEQ ID NO:67。在其他实施方案中,优化核苷酸序列与SEQ ID NO:67至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:68。在具体实施方案中,本发明的优化核苷酸序列可以编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白全长S2’亚基,其具有包含SEQ ID NO:96氨基酸序列。在一个实施方案中,编码可操作地与N-末端信号肽连接的SARS-CoV-2 S蛋白全长S2’亚基的优化核苷酸序列具有序列SEQ ID NO:95。在其他实施方案中,优化核苷酸序列与SEQID NO:95至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:96。
CoV S蛋白是典型的I类病毒融合蛋白,其需要蛋白酶切割以便激活S蛋白的融合潜力。对于SARS-CoV-2 S蛋白S蛋白的激活,已经提出了两步顺序蛋白酶切割模型,(1)引发S1亚基与S2亚基之间的切割,和(2)激活S2’位点上的切割(Ou等人(2020)Naturecommunications,11,1620)。SARS-CoV-2 S蛋白在S1/S2亚基之间的边界处包含弗林蛋白酶切割位点,所述位点在生物发生过程中被加工,这使得此病毒有别于SARS-CoV和SARS相关CoV(Walls等人(2020)Cell doi.org/10.1016/j.cell.2020.02.058)。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸并且其含有延伸的N-末端信号肽而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:123的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:122。在其他实施方案中,优化核苷酸序列与SEQ ID NO:122至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:123。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基817、892、899、942、986和987突变为脯氨酸并且其含有延伸的N-末端信号肽而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:137的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:136。在其他实施方案中,优化核苷酸序列与SEQ ID NO:136至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:137。
融合前稳定化倾向于增加病毒融合糖蛋白的重组表达,可能是通过防止由此类蛋白质倾向于采用更稳定的融合后结构而导致的错误折叠。融合前稳定化病毒糖蛋白被认为是优于其野生型对应物的免疫原。
SARS-CoV-2 S蛋白的融合前稳定化构象可以通过突变弗林蛋白酶切割位点来产生,从而防止S1和S2亚基的切割。例如,弗林蛋白酶切割位点中的RRAR残基(位置682-685)可以突变为GSAS残基(即,R682G R683S A684A R685S)。因此,在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点,例如通过将弗林蛋白酶识别的氨基酸残基替代为不形成弗林蛋白酶切割位点但维持S蛋白结构的替代氨基酸而相对于天然存在的SARS-CoV-2S蛋白被修饰。在特定实施方案中,可以将RRAR弗林蛋白酶切割位点残基682-685突变为残基GSAS以去除弗林蛋白酶切割位点。在具体实施方案中,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:9的氨基酸序列。在一个实施方案中,编码融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列具有序列SEQ ID NO:42。在其他实施方案中,优化核苷酸序列与SEQ IDNO:42至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:9。
SARS-CoV-2 S蛋白可以通过将残基985、986和987中的一个或多个用脯氨酸取代(即,D985P)来稳定其融合前构象。例如,SARS-CoV-2 S蛋白的融合前稳定化构象可以通过以下方式产生:在残基985处产生一个稳定化脯氨酸突变(即,D985P);在残基986和987处产生两个稳定化脯氨酸突变(即,K986P、V987P);或在残基985、986和987处产生三个稳定化脯氨酸突变(即,D985P、K986P、V987P)。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:10的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:43。在其他实施方案中,优化核苷酸序列与SEQ ID NO:43至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:10。在进一步的实施方案中,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:118的氨基酸序列。此氨基酸序列包含D614G突变。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:119。在特定实施方案中,优化核苷酸序列与SEQ ID NO:119至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:118。
在某些实施方案中,优化核苷酸序列可以编码SARS-CoV-2 S蛋白S2亚基的融合前稳定化变体,其具有包含SEQ ID NO:78的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:77。在其他实施方案中,优化核苷酸序列与SEQ ID NO:77至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:78。在某些实施方案中,优化核苷酸序列可以编码SARS-CoV-2 S蛋白全长S2亚基的融合前稳定化变体,其具有包含SEQ ID NO:70的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:69。在其他实施方案中,优化核苷酸序列与SEQ ID NO:69至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:70。
在某些实施方案中,优化核苷酸序列可以编码SARS-CoV-2 S蛋白S2’亚基的融合前稳定化变体,其具有包含SEQ ID NO:82的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:81。在其他实施方案中,优化核苷酸序列与SEQ ID NO:81至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:82。在某些实施方案中,优化核苷酸序列可以编码SARS-CoV-2 S蛋白全长S2’亚基的融合前稳定化变体,其具有包含SEQ ID NO:86的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:85。在其他实施方案中,优化核苷酸序列与SEQ ID NO:85至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:86。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基985突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:88的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:87。在其他实施方案中,优化核苷酸序列与SEQ ID NO:87至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:88。
在一些实施方案中,SARS-CoV-2 S蛋白的融合前稳定化构象可以通过以下方式产生:在S2亚基的C-末端的残基985、986和987处产生三个稳定化脯氨酸突变(即,D985P、K986P、V987P)。在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基985、986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ IDNO:92的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:91。在其他实施方案中,优化核苷酸序列与SEQ ID NO:91至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:92。
在一些实施方案中,SARS-CoV-2 S蛋白的融合前稳定化构象可以通过以下方式产生:突变弗林蛋白酶切割位点,从而防止S1和S2亚基的切割,以及(a)在残基986和987处产生两个稳定化脯氨酸突变(即,K986P、V987P)和/或(b)在残余基985处产生稳定化脯氨酸突变。例如,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点并且通过将残基986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。在一些实施方案中,在残基682-685处形成弗林蛋白酶切割位点的残基突变为残基GSAS。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:11的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQID NO:44。在其他实施方案中,优化核苷酸序列与SEQ ID NO:44至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:11。在进一步的实施方案中,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:120的氨基酸序列。此氨基酸序列包含D614G突变。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:121。在一些实施方案中,优化核苷酸序列与SEQID NO:121至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:120。可替代地,优化核苷酸序列编码SARS-CoV-2 S蛋白的融合前稳定化膜外结构域,其已相对于天然存在的SARS-CoV-2 S蛋白被修饰,其具有包含SEQ ID NO:12的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ IDNO:45。在其他实施方案中,优化核苷酸序列与SEQ ID NO:45至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:12。
在某些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点并且通过将残基985突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。在一些实施方案中,在残基682-685处形成弗林蛋白酶切割位点的残基突变为残基GSAS。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2S蛋白,其具有包含SEQ ID NO:90的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:89。在其他实施方案中,优化核苷酸序列与SEQ ID NO:89至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:90。
在某些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点并且通过将残基985、986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。在一些实施方案中,在残基682-685处形成弗林蛋白酶切割位点的残基突变为残基GSAS。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:94的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:93。在其他实施方案中,优化核苷酸序列与SEQ ID NO:93至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:94。
SARS-CoV-2 S蛋白可以通过将残基817、892、899和942中的一个或多个用脯氨酸取代(即,F817P、A892P、A899P和A942P)来进一步稳定其融合前构象。例如,SARS-CoV-2 S蛋白的融合前稳定化构象可以通过以下方式产生:在残基817处产生一个稳定化脯氨酸突变(即,F817P);在残基817和892处产生两个稳定化脯氨酸突变(即,F817P、A892P);或在残基817、892和899处产生三个稳定化脯氨酸突变(即,F817P、A892P、A899P);或在残基817、892、899和942处产生四个稳定化脯氨酸突变(即,F817P、A892P、A899P、A942P)。在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基817、892、899和942突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。
在优选实施方案中,SARS-CoV-2 S蛋白的融合前稳定化构象可以通过以下方式产生:在残基817、892、899、942、986处产生稳定化脯氨酸突变。在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基817、892、899、942、986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:129的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:128。在其他实施方案中,优化核苷酸序列与SEQ ID NO:128至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:129。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点并且通过将残基817、892、899、942、986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:131的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:130。在其他实施方案中,优化核苷酸序列与SEQ ID NO:130至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:131。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基817、892、899、942、986和987突变为脯氨酸并且其含有D614G突变而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:133的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:132。在其他实施方案中,优化核苷酸序列与SEQ ID NO:132至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:133。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基817、892、899、942、986和987突变为脯氨酸并且其含有D614G突变而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:135的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:134。在其他实施方案中,优化核苷酸序列与SEQ ID NO:134至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:135。
可以将T4噬菌体次要纤维蛋白(fibritin)Foldon置于SARS-CoV-2 S蛋白抗原片段的C末端,以便帮助诱导三聚体的形成。Foldon已被用于产生用于流感疫苗的三聚体流感血凝素茎结构域(Lu等人(2014)PNAS,111,1,124-130)。Foldon可以具有氨基酸序列GYIPEAPRDGQAYVRKDGEWVLLSTFL(SEQ ID NO:13)。因此,根据本发明的优化核苷酸序列可以编码SARS-CoV-2 S蛋白的膜外结构域或其抗原片段以及C末端Foldon。在具体实施方案中,Foldon置于SARS-CoV-2 S蛋白膜外结构域或SARS-CoV-2S蛋白S2’亚基的C末端。在一个实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含具有C末端Foldon的SARS-CoV-2 S蛋白膜外结构域的氨基酸序列,其具有包含SEQ ID NO:14的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:46。在其他实施方案中,优化核苷酸序列与SEQ ID NO:46至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:14。本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码包含具有C末端Foldon的SARS-CoV-2 S蛋白S2亚基的氨基酸序列,其具有包含SEQ ID NO:76的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:75。在其他实施方案中,优化核苷酸序列与SEQ ID NO:75至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:76。本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码包含具有C末端Foldon的SARS-CoV-2 S蛋白S2’亚基的氨基酸序列,其具有包含SEQ ID NO:15的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:47。在其他实施方案中,优化核苷酸序列与SEQ ID NO:47至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:15。
在一些实施方案中,优化核苷酸序列编码具有C末端Foldon的SARS-CoV-2 S蛋白的融合前稳定化膜外结构域,其中膜外结构域已通过去除激活所需的弗林蛋白酶切割位点和/或将残基986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白的膜外结构域被修饰。在具体实施方案中,优化核苷酸序列编码具有C末端Foldon的SARS-CoV-2 S蛋白的融合前稳定化膜外结构域,其具有包含SEQ ID NO:16的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:48。在其他实施方案中,优化核苷酸序列与SEQ IDNO:48至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:16。在其他具体实施方案中,优化核苷酸序列编码具有C末端Foldon的SARS-CoV-2 S蛋白的融合前稳定化膜外结构域,其中膜外结构域已通过去除激活所需的弗林蛋白酶切割位点和将残基986和987突变为脯氨酸而相对于天然存在的SARS-CoV-2 S蛋白被修饰。因此,在具体实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白的融合前稳定化膜外结构域,其具有包含SEQ ID NO:17的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:49。在其他实施方案中,优化核苷酸序列与SEQ IDNO:49至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:17。
在一些实施方案中,所述优化核苷酸序列编码具有C末端Foldon的SARS-CoV-2 S蛋白S2或S2’亚基的融合前稳定化膜外结构域,其中与天然存在的SARS-CoV-2 S蛋白相比,残基986和987已突变为脯氨酸。因此,在具体实施方案中,优化核苷酸序列编码SARS-CoV-2S蛋白的融合前稳定化S2亚基,其具有包含SEQ ID NO:80的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:79。在其他实施方案中,优化核苷酸序列与SEQ ID NO:79至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:80。因此,在具体实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白的融合前稳定化S2亚基,其具有包含SEQ ID NO:84的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:83。在其他实施方案中,优化核苷酸序列与SEQ ID NO:83至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:84。
蛋白质中Fc结构域的存在显著增加蛋白质的血浆半衰期并且从而延长分子的治疗活性。Fc结构域还能够减缓蛋白质从血流中的肾清除,并且使蛋白质能够与免疫细胞上发现的Fc受体(FCR)相互作用,这一特征可能有利于它们在疫苗中的用途。另外,Fc结构域独立折叠,并且可以在体外和体内两者改善伴侣分子的溶解性和稳定性(Czajkowsky等人(2012)EMBO Mol Med.(10):1015-1028)。因此,本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码包含SARS-CoV-2 S蛋白膜外结构域或其抗原片段与C-末端Fc结构域的氨基酸序列。Fc结构域可以包含以下氨基酸序列:PKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPG K(SEQ ID NO:18)。在具体实施方案中,抗原片段是SARS-CoV-2 S蛋白的RBD。在一些实施方案中,优化核苷酸序列编码包含SARS-CoV-2 S蛋白RBD和Fc结构域的氨基酸序列,其具有包含SEQ ID NO:19的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:50。在其他实施方案中,优化核苷酸序列与SEQ ID NO:50至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:19。
本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码SARS-CoV-2 S蛋白膜外结构域或其抗原片段,其可操作地与N-末端信号肽和C-末端Fc结构域连接。Fc可以具有氨基酸序列SEQ ID NO:18。信号肽可以具有氨基酸序列SEQ ID NO:7。在具体实施方案中,抗原片段是SARS-CoV-2 S蛋白的RBD。在一些实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含可操作地与N-末端信号肽和C-末端Fc结构域连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:20的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:36。在其他实施方案中,优化核苷酸序列与SEQ ID NO:36至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:20。
抗体的药代动力学特性主要取决于Fc结构域与新生Fc受体(FcRn)的pH依赖性结合。例如,含有氨基酸取代M428L/N434S(LS突变体)、M252Y/S254T/T256E(YTE突变体)或H433K/N434F(KF突变体)的Fc结构域赋予在pH 5.8下对FcRn的亲和力高10至12倍。这导致抗体半衰期大幅增加(循环时间长2至4倍)。因此,修饰包含在本发明融合蛋白中的Fc区可以延长其在血清中的半衰期。相对于天然IgG1和上述变体两者,含有L309D/Q311H/N434S(DHS)取代的Fc变体已显示进一步改善抗体的药代动力学(Lee等人(2019)Naturecommunications,10,5031)。因此,在某些实施方案中,使用基于人IGHG的EU编号系统,Fc区与野生型相比发生了突变。例如,位置309的L残基、位置311的Q残基和位置434的N残基可以分别突变为D、H和S(即,L309D;Q311H和N434S)。突变Fc结构域可以包含以下序列:PKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVDHHDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHSHYTQKSLSLSPGK(SEQID NO:100)。
在其他实施方案中,位置428的M残基和位置434的N残基可以分别突变为L和S(即,M428L和N434S)。突变Fc结构域可以包含以下序列:PKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVLHEALHSHYTQKSLSLSPGK(SEQ ID NO:101)。
在其他实施方案中,位置252的M残基、位置254的S残基和位置256的T残基可以分别突变为Y、T和E(即,M252Y、S254T和T256E)。突变Fc结构域可以包含以下序列:PKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLYITREPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK(SEQ IDNO:102)。
在其他实施方案中,位置433的H残基和位置434的N残基可以分别突变为K和F(即,H433K和N434F)。突变Fc结构域可以包含以下序列:PKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALKFHYTQKSLSLSPG
K(SEQ ID NO:103)。
因此,本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码SARS-CoV-2 S蛋白抗原片段或其抗原片段,其可操作地与N-末端信号肽和C-末端Fc结构域连接。Fc可以具有氨基酸序列SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103。信号肽可以具有氨基酸序列SEQ ID NO:7。在具体实施方案中,抗原片段是SARS-CoV-2 S蛋白的RBD。
在一些实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含可操作地与N-末端信号肽和C-末端突变Fc结构域连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:104的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:105。在其他实施方案中,优化核苷酸序列与SEQ ID NO:105至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:104。
在一些实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含可操作地与N-末端信号肽和C-末端突变Fc结构域连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:106的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:107。在其他实施方案中,优化核苷酸序列与SEQ ID NO:107至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:106。
在一些实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含可操作地与N-末端信号肽和C-末端突变Fc结构域连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:108的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:109。在其他实施方案中,优化核苷酸序列与SEQ ID NO:109至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:108。
在一些实施方案中,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含可操作地与N-末端信号肽和C-末端突变Fc结构域连接的SARS-CoV-2 S蛋白RBD的氨基酸序列,其具有包含SEQ ID NO:110的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:111。在其他实施方案中,优化核苷酸序列与SEQ ID NO:111至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:110。
冠状病毒在内质网(ER)-高尔基体中间室(ERGIC)的内腔处组装并且在其中出芽。SARS-CoV-2 S蛋白的胞质尾含有ER回收信号(ERRS),所述ER回收信号可以将S蛋白从高尔基体转移到内质网。此过程被认为是在ERGIC处积累S蛋白,这促进S蛋白并入病毒颗粒中。SARS CoV S蛋白中的ER回收信号是胞质尾中的二元基序(KxHxx),其与典型的二赖氨酸ER回收信号相似(McBride等人(2007)Journal Of Virology,81,5,2418-2428)。
ER回收信号的突变可以阻止病毒形成病毒颗粒。不希望被任何特定理论所束缚,诸位发明人相信有利的是从旨在包含在疫苗中的SARS-CoV-2 S蛋白中去除ER回收信号。因此,在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将ER回收信号突变而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,SARS-CoV-2 S蛋白的KLHYT ER回收信号可以通过将残基1268和1270突变为丙氨酸(即,ALAYT)来去除。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸通过去除ER回收信号而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:125的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:124。在其他实施方案中,优化核苷酸序列与SEQ ID NO:124至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:125。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸、通过去除ER回收信号并且其含有延伸的N-末端信号肽而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ IDNO:127的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:126。在其他实施方案中,优化核苷酸序列与SEQ ID NO:126至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:127。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基817、892、899、942、986和987突变为脯氨酸并且通过去除ER回收信号而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:139的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:138。在其他实施方案中,优化核苷酸序列与SEQ ID NO:138至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:139。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基817、892、899、942、986和987突变为脯氨酸、通过去除ER回收信号并且其含有延伸的N-末端信号肽而相对于天然存在的SARS-CoV-2 S蛋白被修饰。例如,优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:141的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:140。在其他实施方案中,优化核苷酸序列与SEQ ID NO:140至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:141。
第0和[0110]段中列出的突变的特定组合可以被引入本文公开的任何SARS-CoV-2S蛋白中。例如,在特定实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰为含有ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A和D1118H突变。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:151的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:150。在其他实施方案中,优化核苷酸序列与SEQ ID NO:150至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:151。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过将残基986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A和D1118H突变(英国变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:153的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:152。在其他实施方案中,优化核苷酸序列与SEQ ID NO:152至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:153。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点而相对于指标毒株的SARS-CoV-2S蛋白(SEQ IDNO:1)被修饰,并且其含有ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A和D1118H突变(英国变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:155的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:154。在其他实施方案中,优化核苷酸序列与SEQ ID NO:154至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:155。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A和D1118H突变(英国变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:157的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ IDNO:156。在其他实施方案中,优化核苷酸序列与SEQ ID NO:156至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:157。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基817、892、899和942、986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有ΔH69、ΔV70、ΔY144、N501Y、A570D、D614G、P681H、T716I、S982A和D1118H突变(英国变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:159的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:158。在其他实施方案中,优化核苷酸序列与SEQ ID NO:158至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:159。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰为含有D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变(南非变体1+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:161的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ IDNO:160。在其他实施方案中,优化核苷酸序列与SEQ ID NO:160至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:161。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变(南非变体1+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:163的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ IDNO:162。在其他实施方案中,优化核苷酸序列与SEQ ID NO:162至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:163。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰为含有L18F、D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变(南非变体2+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:165的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:164。在其他实施方案中,优化核苷酸序列与SEQ ID NO:164至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:165。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有L18F、D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变(南非变体2+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:167的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQID NO:166。在其他实施方案中,优化核苷酸序列与SEQ ID NO:166至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:167。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰为含有L18F、T20N、P26S、D138Y、R190S、K417T、E484K、N501Y、D614G、H655Y、T1027I和V1176F突变(巴西变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:169的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:168。在其他实施方案中,优化核苷酸序列与SEQ ID NO:168至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQ ID NO:169。
在一些实施方案中,根据本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白、SARS-CoV-2 S蛋白的融合前稳定化膜外结构域、或任一者的抗原片段,其已通过去除激活所需的弗林蛋白酶切割位点、通过将残基986和987突变为脯氨酸而相对于指标毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)被修饰,并且其含有L18F、T20N、P26S、D138Y、R190S、K417T、E484K、N501Y、D614G、H655Y、T1027I和V1176F突变(巴西变体+D614G)。因此,在某些实施方案中,本发明的优化核苷酸序列可以编码融合前稳定化SARS-CoV-2 S蛋白,其具有包含SEQ ID NO:171的氨基酸序列。在一个实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:170。在其他实施方案中,优化核苷酸序列与SEQ ID NO:170至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并且编码氨基酸序列SEQID NO:171。
编码SARS-CoV-2 S蛋白和抗原片段的示例性优化核苷酸序列
根据本发明的优化核苷酸序列可以编码SARS-CoV-2 S蛋白或其抗原片段。在一个实施方案中,本发明提供了核酸,所述核酸包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码SARS-CoV-2 S蛋白或其抗原片段优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码SARS-CoV-2S蛋白或其抗原片段的核苷酸序列,其被优化用于在人类细胞中高效表达。表1中示出了用根据本发明的用于产生优化核苷酸序列的方法产生的编码SARS-CoV-2 S蛋白或其抗原片段的示例性优化核苷酸序列以及其氨基酸序列。粗体残基指示与天然存在的SARS-CoV-2 S蛋白相比已经突变的氨基酸,带下划线的残基表示信号肽,并且斜体的残基指示Fc区或Foldon的存在。
表1.示例性SARS-CoV-2 S序列。
肽融合体
诸位发明人已经鉴定出SARS-CoV-2 S蛋白中可能具有高度抗原性的区域。它们包括残基815-833(FP)、820-846(D1)1078-1111(D2)和残基815-846(F1/D1)。具有氨基酸序列SEQ ID NO:1的全长SARS-CoV-2蛋白中这些抗原片段的序列分别为SFIEDLLFNKVTLADAGF(SEQ ID NO:21)、LLFNKVTLADAGFIKQYGDCLGDIAA(SEQ ID NO:22)、PAICHDGKAHFPREGVFVSNGTHWFVTQRNFYE(SEQ ID NO:23)和GGFNFSQILPDPSKPSKRSFIEDLLFNKVTLA(SEQ ID NO:24)。抗原区域可以以不同的顺序排列以形成多种融合肽,所述融合肽可能是高抗原性的并且因此预期会诱导强烈的免疫原性反应。所述结构域可以通过接头序列(例如,GGGGS)连接。可替代地,鉴于其氨基酸序列的相似性,FP区和D1区可以重叠以产生单一免疫原性基序:SFIEDLLFNKVTLADAGFIKQYGDCLGDIAA(FP/D1)(SEQ ID NO:99),其中重叠序列带下划线。
示例性肽融合体可以具有以下结构域:
D1-接头-FP-接头-D2-接头-D1(融合肽A)
FP/D1-接头-FP/D1-接头-FP/D1(融合肽B)
因此,本发明提供了优化核苷酸序列,所述优化核苷酸序列编码包含SARS-CoV-2S蛋白的抗原区域的融合肽。在一个实施方案中,优化核苷酸序列编码包含融合肽A的氨基酸序列。例如,优化核苷酸序列可以编码氨基酸序列SEQ ID NO:25。在具体实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:26。在另一个实施方案中,优化核苷酸序列编码包含融合肽B的氨基酸序列。例如,优化核苷酸序列可以编码氨基酸序列SEQ ID NO:27。在具体实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:28。
在某些实施方案中,所述融合肽可以可操作地连接至N末端信号序列,诸如SEQ IDNO:7。例如,优化核苷酸序列可以编码包含与N末端信号序列可操作地连接的融合肽A的氨基酸序列。优化核苷酸序列可以编码氨基酸序列SEQ ID NO:51。在具体实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:52。可替代地,优化核苷酸序列可以编码包含与N末端信号序列可操作地连接的融合肽B的氨基酸序列。优化核苷酸序列可以编码氨基酸序列SEQID NO:53。在具体实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:54。
另外地,典型地除了N末端信号序列之外,融合肽还可操作地连接C-末端Fc结构域。例如,优化核苷酸序列可以编码包含与C末端Fc结构域(例如,SEQ ID NO:18)和N末端信号序列(例如,SEQ ID NO:7)可操作地连接的融合肽A的氨基酸序列。优化核苷酸序列可以编码氨基酸序列SEQ ID NO:55。在具体实施方案中,所述优化核苷酸序列具有序列SEQ IDNO:56。可替代地,优化核苷酸序列可以编码包含与C末端Fc结构域(例如,SEQ ID NO:18)和N末端信号序列(例如,SEQ ID NO:7)可操作地连接的融合肽B的氨基酸序列。优化核苷酸序列可以编码氨基酸序列SEQ ID NO:57。在具体实施方案中,所述优化核苷酸序列具有序列SEQ ID NO:58。
在一些实施方案中,融合肽可以可操作地连接C末端Fc结构域,所述C末端Fc结构域已被改变为改善所得融合蛋白的循环半衰期。在具体实施方案中,循环半衰期改善的Fc结构域具有氨基酸序列SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103。因此,本发明还提供了优化核苷酸序列,所述优化核苷酸序列编码融合肽A或融合肽B,融合肽A或融合肽B可操作地连接N-末端信号肽和C-末端Fc结构域,所述C-末端Fc结构域具有氨基酸序列SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103。信号肽可以具有氨基酸序列SEQ ID NO:7。
编码融合肽的示例性优化核苷酸序列
根据本发明的优化核苷酸序列可以编码呈融合肽形式的SARS-CoV-2 S蛋白的一个或多个抗原区域。在一个实施方案中,本发明提供了核酸,所述核酸包含编码呈融合肽形式的SARS-CoV-2 S蛋白的一个或多个抗原区的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码呈融合肽形式的SARS-CoV-2 S蛋白的一个或多个抗原区的优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码呈融合肽形式的SARS-CoV-2 S蛋白的一个或多个抗原区的核苷酸序列,其被优化用于在人类细胞中高效表达。表2中示出了用根据本发明的用于产生优化核苷酸序列的方法产生的编码呈融合肽形式的SARS-CoV-2 S蛋白的抗原区域的示例性优化核苷酸序列以及相应的氨基酸序列。粗体残基指示与天然存在的SARS-CoV-2 S蛋白相比已经突变的氨基酸,带下划线的残基表示信号肽,并且斜体的残基指示Fc区的存在。
表2.示例性融合肽。
其他必需结构蛋白
基于它们与相关β-冠状病毒中的蛋白质的同源性,SARS-CoV-2的M、N和E蛋白被认为在形成病毒颗粒的结构中起重要作用。据信M蛋白是病毒粒子中最丰富的结构蛋白。其长度为222个氨基酸,具有3个跨膜结构域。提出了M蛋白赋予了病毒粒子形状。表明M蛋白在病毒粒子中作为二聚体存在,在病毒粒子中它可以采用两种不同的构象,从而允许它促进膜弯曲并且与核衣壳结合。
419个氨基酸的长N蛋白可能形成核衣壳。它由两个独立的结构域构成,这两个结构域都能够使用不同的机制在体外结合RNA。N蛋白以串珠(beads-on-a-string)型构象结合病毒基因组,并且还可以结合nsp3和M蛋白,nsp3是病毒复制酶复合体的关键组分。
E蛋白长度为77个氨基酸,并且据信在病毒颗粒中仅少量存在。E蛋白的提出的功能之一是促进病毒的组装和释放。表3中示出了SARS-CoV-2的M、N和E蛋白的氨基酸序列。
虽然记忆性CD8+T细胞对许多SARS-CoV-2蛋白(包括ORF1ab、S、N、M和ORF3a)具有广泛的反应性,但大多数表位位于ORF1ab中,并且最高密度的表位位于N蛋白中(Ferretti等人(2020)https://doi.org/10.1101/2020.07.24.20161653)。ORF1ab由NC_045512.2SARS-CoV-2基因组的残基266…13555编码。SARS-CoV-2的ORF1ab和N蛋白因此可用于诱导T细胞反应。
表3.SARS-CoV-2 M、E和N蛋白
根据本发明的优化核苷酸序列可以编码SARS-CoV-2 E蛋白或其抗原片段。在一个实施方案中,本发明提供了核酸,所述核酸包含编码SARS-CoV-2 E蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码SARS-CoV-2 E蛋白或其抗原片段优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码SARS-CoV-2小包膜蛋白或其抗原片段的核苷酸序列,其被优化用于在人类细胞中高效表达。
根据本发明的优化核苷酸序列可以编码SARS-CoV-2 M蛋白或其抗原片段。在一个实施方案中,本发明提供了核酸,所述核酸包含编码SARS-CoV-2 M蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码SARS-CoV-2 M蛋白或其抗原片段优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码SARS-CoV-2M蛋白或其抗原片段的核苷酸序列,其被优化用于在人类细胞中高效表达。根据本发明的优化核苷酸序列可以编码SARS-CoV-2 N蛋白或其抗原片段。在一个实施方案中,本发明提供了核酸,所述核酸包含编码SARS-CoV-2 N蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码SARS-CoV-2 N蛋白或其抗原片段优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码SARS-CoV-2 N蛋白或其抗原片段的核苷酸序列,其被优化用于在人类细胞中高效表达。
根据本发明的优化核苷酸序列可以编码SARS-CoV-2 ORF1ab蛋白或其抗原片段。在一个实施方案中,本发明提供了核酸,所述核酸包含编码SARS-CoV-2 ORF1ab蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,所述核酸是mRNA,所述mRNA包含编码SARS-CoV-2 ORF1ab蛋白或其抗原片段优化核苷酸序列。在一些实施方案中,合适的mRNA序列包含编码SARS-CoV-2 ORF1ab蛋白或其抗原片段的核苷酸序列,其被优化用于在人类细胞中高效表达。
在一些实施方案中,将包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列的第一核酸与包含编码SARS-CoV-2 M蛋白或其抗原片段的优化核苷酸序列的第二核酸组合。在一些实施方案中,将包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列的第一核酸与包含编码SARS-CoV-2 N蛋白或其抗原片段的优化核苷酸序列的第二核酸组合。在一些实施方案中,将包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列的第一核酸与包含编码SARS-CoV-2 E蛋白或其抗原片段的优化核苷酸序列的第二核酸组合。在其他实施方案中,将包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列的第一核酸与第二、第三和/或第四核酸组合,其中第二核酸包含编码SARS-CoV-2 M蛋白或其抗原片段的优化核苷酸序列,其中第三核酸包含编码SARS-CoV-2 N蛋白或其抗原片段的优化核苷酸序列,并且其中第四核酸包含编码SARS-CoV-2 E蛋白或其抗原片段的优化核苷酸序列。
mRNA序列
在一些实施方案中,包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列的mRNA还含有5’和3’UTR序列。示例性5’和3’UTR序列在下面示出:
示例性5’UTR序列
GGACAGAUCGCCUGGAGACGCCAUCCACGCUGUUUUGACCUCCAUAGAAGACACCGGGACCGAUCCAGCCUCCGCGGCCGGGAACGGUGCAUUGGAACGCGGAUUCCCCGUGCCAAGAGUGACUCACCGUCCUUGACACG(SEQID NO:144)
示例性3’UTR序列
CGGGUGGCAUCCCUGUGACCCCUCCCCAGUGCCUCUCCUGGCCCUGGAAGUUGCCACUCCAGUGCCCACCAGCCUUGUCCUAAUAAAAUUAAGUUGCAUCAAGCU
(SEQ ID NO:145)
GGGUGGCAUCCCUGUGACCCCUCCCCAGUGCCUCUCCUGGCCCUGGAAGUUGCCACUCCAGUGCCCACCAGCCUUGUCCUAAUAAAAUUAAGUUGCAUCAAAGCU
(SEQ ID NO:146)
示例性mRNA构建体
在具体实施方案中,包含编码SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA包含以下结构元件:
表4.示例性mRNA构建体的结构元件
NA=不适用
UTR=非翻译区
1编码突变为去除弗林蛋白酶切割位点并且残基986和987被脯氨酸替代的SARS-CoV-2 S蛋白的优化核苷酸序列
2编码突变为去除弗林蛋白酶切割位点并且残基986和987被脯氨酸替代并且进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变的SARS-CoV-2 S蛋白的优化核苷酸序列
3预期范围
在一个具体实施方案中,根据本发明的mRNA具有下列核酸序列:
+聚A尾
粗体的核酸表示起始和终止密码子
在另一个具体实施方案中,根据本发明的mRNA具有下列核酸序列:
+聚A尾
粗体的核酸表示起始和终止密码子
mRNA合成
体外转录
根据本发明的mRNA可以根据多种已知方法中的任一种来合成。在公开的美国申请号US 2018/0258423中描述了各种方法,并且所述方法可以用于实践本发明,所有这些方法通过引用并入本文。例如,根据本发明的mRNA可以经由体外转录(IVT)合成。简而言之,典型地用以下进行IVT:含有启动子的线性或环状DNA模板、核糖核苷酸三磷酸库、可包含DTT和镁离子的缓冲体系、和适当RNA聚合酶(例如,T3、T7或SP6 RNA聚合酶)、脱氧核糖核酸酶I、焦磷酸酶和/或核糖核酸酶抑制剂。确切的条件将根据具体应用而变化。
在一些实施方案中,为了制备本发明的mRNA,在体外转录DNA模板。合适的DNA模板典型地具有用于体外转录的启动子,例如T3、T7或SP6启动子,随后是所希望的mRNA的所希望的核苷酸序列和终止信号。
核苷酸
在一些实施方案中,mRNA包含天然存在的核苷(或未经修饰的核苷;即腺苷、鸟苷、胞苷和尿苷)或由其组成。在一些实施方案中,mRNA包含一个或多个经修饰的核苷,诸如核苷类似物(例如,腺苷类似物、鸟苷类似物、胞苷类似物或尿苷类似物)。一种或多种核苷类似物的存在可以使mRNA比具有相同序列但仅含天然存在的核苷的对照mRNA更稳定和/或免疫原性更低。在本发明的具体实施方案中,用天然存在的核苷合成包含编码SARS-CoV-2抗原的优化核苷酸序列的mRNA。不希望受任何特定理论的束缚,诸位发明人相信用天然存在的核苷制备的mRNA的使用有利于提供本发明的免疫原性组合物。
在一些实施方案中,mRNA包含未经修饰的核苷和经修饰的核苷两者。在一些实施方案中,所述一个或多个经修饰的核苷是核苷类似物。在一些实施方案中,所述一个或多个经修饰的核苷包含至少一个选自经修饰的糖和经修饰的核碱基的修饰。在一些实施方案中,mRNA包含一个或多个经修饰的核苷间键。
在一些实施方案中,所述一个或多个经修饰的核苷是核苷类似物,例如以下之一:2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-去氮腺苷、7-去氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、假尿苷(例如,N-1-甲基-假尿苷)、2-硫代尿苷和2-硫代胞苷。参见例如,美国专利号8,278,036或WO 2011/012316关于5-甲基-胞苷、假尿苷和2-硫代-尿苷以及将其掺入mRNA中的讨论。在一些实施方案中,mRNA可以是本文的RNA,其中25%的U残基是2-硫代-尿苷,并且25%的C残基是5-甲基胞苷。在美国专利公开US 2012/0195936和国际公开WO2011/012316中披露了使用此类经修饰的RNA的传授内容,这两篇文献通过引用以其整体特此并入。
合成后加工
典型地,可以在mRNA合成后添加5’帽和/或3’尾。帽的存在对于提供对大多数真核细胞中发现的核酸酶的抗性是重要的。“尾”的存在用于保护mRNA不被核酸外切酶降解。可替代地,5’帽和/或3’尾序列包含在用于体外转录反应的DNA模板序列中。
典型地如下添加5’帽:首先,RNA末端磷酸酶从5’核苷酸中去除一个末端磷酸基团,留下两个末端磷酸;然后,经由鸟苷酰基转移酶向末端磷酸中添加鸟苷三磷酸(GTP),产生5’5’5三磷酸键联;然后,通过甲基转移酶甲基化鸟嘌呤的7-氮。帽结构的例子包括但不限于m7G(5’)ppp(5’(A,G(5’)ppp(5’)A and G(5’)ppp(5’)G。在公开的美国申请号US2016/0032356和公开的美国申请号US 2018/0125989中描述了另外的帽结构,将所述申请通过引用并入本文。
典型地,尾结构包括聚(A)尾和/或聚(C)尾。mRNA 3’末端的聚A尾或聚C尾典型地分别包含至少50个腺苷或胞嘧啶核苷酸、至少150个腺苷或胞嘧啶核苷酸、至少200个腺苷或胞嘧啶核苷酸、至少250个腺苷或胞嘧啶核苷酸、至少300个腺苷或胞嘧啶核苷酸、至少350个腺苷或胞嘧啶核苷酸、至少400个腺苷或胞嘧啶核苷酸、至少450个腺苷或胞嘧啶核苷酸、至少500个腺苷或胞嘧啶核苷酸、至少550个腺苷或胞嘧啶核苷酸、至少600个腺苷或胞嘧啶核苷酸、至少650个腺苷或胞嘧啶核苷酸、至少700个腺苷或胞嘧啶核苷酸、至少750个腺苷或胞嘧啶核苷酸、至少800个腺苷或胞嘧啶核苷酸、至少850个腺苷或胞嘧啶核苷酸、至少900个腺苷或胞嘧啶核苷酸、至少950个腺苷或胞嘧啶核苷酸、或至少1kb个腺苷或胞嘧啶核苷酸。在一些实施方案中,聚A尾或聚C尾可以分别是约10至800个腺苷或胞嘧啶核苷酸(例如,约10至200个腺苷或胞嘧啶核苷酸、约10至300个腺苷或胞嘧啶核苷酸、约10至400个腺苷或胞嘧啶核苷酸、约10至500个腺苷或胞嘧啶核苷酸、约10至550个腺苷或胞嘧啶核苷酸、约10至600个腺苷或胞嘧啶核苷酸、约50至600个腺苷或胞嘧啶核苷酸、约100至600个腺苷或胞嘧啶核苷酸、约150至600个腺苷或胞嘧啶核苷酸、约200至600个腺苷或胞嘧啶核苷酸、约250至600个腺苷或胞嘧啶核苷酸、约300至600个腺苷或胞嘧啶核苷酸、约350至600个腺苷或胞嘧啶核苷酸、约400至600个腺苷或胞嘧啶核苷酸、约450至600个腺苷或胞嘧啶核苷酸、约500至600个腺苷或胞嘧啶核苷酸、约10至150个腺苷或胞嘧啶核苷酸、约10至100个腺苷或胞嘧啶核苷酸、约20至70个腺苷或胞嘧啶核苷酸、或约20至60个腺苷或胞嘧啶核苷酸)。在一些实施方案中,尾结构包括具有本文所述各种长度的聚(A)尾和聚(C)尾的组合。在一些实施方案中,尾结构包含至少50%、55%、65%、70%、75%、80%、85%、90%、92%、94%、95%、96%、97%、98%或99%个腺苷核苷酸。在一些实施方案中,尾结构包含至少50%、55%、65%、70%、75%、80%、85%、90%、92%、94%、95%、96%、97%、98%或99%个胞嘧啶核苷酸。
合成后纯化
合成后可以使用各种方法纯化mRNA。在一些实施方案中,使用切向流过滤纯化mRNA。合适的纯化方法包括公开的美国申请号US 2016/0040154、公开的美国申请号US2015/0376220、公开的美国申请号US 2018/0251755、公开的美国申请号US 2018/0251754、2018年11月8日提交的美国临时申请号62/757,612和2019年8月26日提交的美国临时申请号62/891,781中描述的那些,将所有这些申请通过引用并入本文,并且可以用于实践本发明。
在一些实施方案中,在加帽和加尾之前纯化mRNA。在一些实施方案中,在加帽和加尾之后纯化mRNA。在一些实施方案中,既在加帽和加尾之前又在之后都纯化mRNA。
在一些实施方案中,通过离心,在加帽和加尾之前或之后或既之前又之后纯化mRNA。
在一些实施方案中,通过过滤,在加帽和加尾之前或之后或既之前又之后纯化mRNA。
在一些实施方案中,切向流过滤(TFF),在加帽和加尾之前或之后或既之前又之后纯化mRNA。
脂质纳米颗粒
根据本发明,包含本发明优化核苷酸序列的mRNA可以在脂质纳米颗粒中递送。典型地,适用于本发明的脂质纳米颗粒包含一种或多种阳离子脂质。在一些实施方案中,脂质纳米颗粒包含一种或多种阳离子脂质、一种或多种非阳离子脂质、一种或多种基于胆固醇的脂质和一种或多种PEG修饰的脂质。在一些实施方案中,脂质纳米颗粒包含一种或多种阳离子脂质、一种或多种非阳离子脂质和一种或多种PEG修饰的脂质。在一些实施方案中,脂质纳米颗粒包含不超过四种不同的脂质组分。
用于本发明的典型脂质纳米颗粒由四种脂质组分构成:阳离子脂质(例如,基于固醇的阳离子脂质)、非阳离子脂质(例如,DOPE或DEPE)、基于胆固醇的脂质(例如,胆固醇)和PEG修饰的脂质(例如,DMG-PEG2K)。在一些实施方案中,脂质纳米颗粒包含不超过三种不同的脂质组分。示例性脂质纳米颗粒由三种脂质组分构成:阳离子脂质(例如,基于胆固醇的阳离子脂质)、非阳离子脂质(例如,DOPE或DEPE)和PEG修饰的脂质(例如,DMG-PEG2K)。
包封mRNA的脂质纳米颗粒的形成
用于本发明的脂质纳米颗粒可以通过本领域目前已知的各种技术来制备例如,可以根据常规技术制备多层囊泡(MLV),诸如通过使所选择的脂质沉积在合适的容器或器皿的内壁上(通过将脂质溶解在适当的溶剂中,然后蒸发溶剂以在器皿内部留下薄膜)或通过喷雾干燥来制备。然后可以伴随涡旋运动向器皿中添加水相,这导致MLV的形成。然后可以通过均质化、超声处理或挤出多层囊泡来形成单层囊泡(ULV)。另外,可以通过洗涤剂去除技术形成单层囊泡。
各种方法描述在公开的美国申请号US 2011/0244026、公开的美国申请号US2016/0038432、公开的美国申请号US 2018/0153822、公开的美国申请号US 2018/0125989和2019年7月23日提交的美国临时申请号62/877,597中并且可以用于实践本发明,将所有这些申请通过引用并入本文。如本文所用,方法A是指通过将mRNA与脂质混合物混合来包封mRNA的常规方法,而不需要首先将脂质预形成为脂质纳米颗粒,如US 2016/0038432中所述。如本文所用,方法B是指通过将预形成的脂质纳米颗粒与mRNA混合来包封mRNA的方法,如US 2018/0153822中所述。
简而言之,制备负载mRNA的脂质纳米颗粒的方法包括以下步骤:将一种或多种溶液加热(即,从热源向溶液应用热)至大于环境温度的温度(或维持在所述温度),所述一种或多种溶液是包含预形成的脂质纳米颗粒的溶液、包含mRNA的溶液和包含包封的mRNA的脂质纳米颗粒的混合溶液。在一些实施方案中,所述方法包括以下步骤:在混合步骤之前加热mRNA溶液和预形成的脂质纳米颗粒溶液中的一种或两种。在一些实施方案中,所述方法包括在混合步骤期间加热包含预形成的脂质纳米颗粒的溶液、包含mRNA的溶液和包含脂质纳米颗粒包封的mRNA的溶液中的一种或多种。在一些实施方案中,所述方法包括以下步骤:在混合步骤之后加热脂质纳米颗粒包封的mRNA。在一些实施方案中,一种或多种溶液被加热到的温度(或一种或多种溶液维持的温度)是或大于约30℃、37℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃。在一些实施方案中,一种或多种溶液被加热到的温度的范围为从约25℃-70℃、约30℃-70℃、约35℃-70℃、约40℃-70℃、约45℃-70℃、约50℃-70℃或约60℃-70℃。在一些实施方案中,一种或多种溶液被加热到的高于环境温度的温度是约65℃。
可以使用各种方法来制备适用于本发明的mRNA溶液。在一些实施方案中,可以将mRNA直接溶解在本文所述的缓冲溶液中。在一些实施方案中,可以通过在与用于包封的脂质溶液混合之前将mRNA储备溶液与缓冲溶液混合来产生mRNA溶液。在一些实施方案中,可以通过紧接在与用于包封的脂质溶液混合之前将mRNA储备溶液与缓冲溶液混合来产生mRNA溶液。在一些实施方案中,合适的mRNA储备溶液可以含有在水中的浓度为或大于约0.2mg/ml、0.4mg/ml、0.5mg/ml、0.6mg/ml、0.8mg/ml、1.0mg/ml、1.2mg/ml、1.4mg/ml、1.5mg/ml、或1.6mg/ml、2.0mg/ml、2.5mg/ml、3.0mg/ml、3.5mg/ml、4.0mg/ml、4.5mg/ml或5.0mg/ml的mRNA。
在一些实施方案中,使用泵将mRNA储备溶液与缓冲溶液混合。示例性泵包括但不限于齿轮泵、蠕动泵和离心泵。
典型地,将缓冲溶液以大于mRNA储备溶液的速率的速率混合。例如,缓冲溶液可以按mRNA储备溶液的速率的至少1x、2x、3x、4x、5x、6x、7x、8x、9x、10x、15x或20x的速率混合。在一些实施方案中,将缓冲溶液以范围在约100-6000ml/分钟之间(例如,约100-300ml/分钟、300-600ml/分钟、600-1200ml/分钟、1200-2400ml/分钟、2400-3600ml/分钟、3600-4800ml/分钟、4800-6000ml/分钟或60-420ml/分钟)的流速混合。在一些实施方案中,将缓冲溶液以为或大于约60ml/分钟、100ml/分钟、140ml/分钟、180ml/分钟、220ml/分钟、260ml/分钟、300ml/分钟、340ml/分钟、380ml/分钟、420ml/分钟、480ml/分钟、540ml/分钟、600ml/分钟、1200ml/分钟、2400ml/分钟、3600ml/分钟、4800ml/分钟或6000ml/分钟的流速混合。
在一些实施方案中,将mRNA储备溶液以范围在约10-600ml/分钟之间(例如,约5-50ml/分钟、约10-30ml/分钟、约30-60ml/分钟、约60-120ml/分钟、约120-240ml/分钟、约240-360ml/分钟、约360-480ml/分钟或约480-600ml/分钟)的流速混合。在一些实施方案中,将mRNA储备溶液以为或大于约5ml/分钟、10ml/分钟、15ml/分钟、20ml/分钟、25ml/分钟、30ml/分钟、35ml/分钟、40ml/分钟、45ml/分钟、50ml/分钟、60ml/分钟、80ml/分钟、100ml/分钟、200ml/分钟、300ml/分钟、400ml/分钟、500ml/分钟或600ml/分钟的流速混合。
根据本发明,脂质溶液包含适用于形成用于包封mRNA的脂质纳米颗粒的脂质混合物。在一些实施方案中,合适的脂质溶液是基于乙醇的。例如,合适的脂质溶液可以含有溶解在纯乙醇(即,100%乙醇)中的所希望的脂质的混合物。在另一个实施方案中,合适的脂质溶液是基于异丙醇的。在另一个实施方案中,合适的脂质溶液是基于二甲基亚砜的。在另一个实施方案中,合适的脂质溶液是合适溶剂的混合物,包括但不限于乙醇、异丙醇和二甲基亚砜。
合适的脂质溶液可以含有各种浓度的所希望的脂质的混合物。例如,合适的脂质溶液可以含有总浓度大于约0.1mg/ml、0.5mg/ml、1.0mg/ml、2.0mg/ml、3.0mg/ml、4.0mg/ml、5.0mg/ml、6.0mg/ml、7.0mg/ml、8.0mg/ml、9.0mg/ml、10mg/ml、15mg/ml、20mg/ml、30mg/ml、40mg/ml、50mg/ml或100mg/ml的所希望的脂质的混合物。在一些实施方案中,合适的脂质溶液可以含有总浓度范围为从约0.1-100mg/ml、0.5-90mg/ml、1.0-80mg/ml、1.0-70mg/ml、1.0-60mg/ml、1.0-50mg/ml、1.0-40mg/ml、1.0-30mg/ml、1.0-20mg/ml、1.0-15mg/ml、1.0-10mg/ml、1.0-9mg/ml、1.0-8mg/ml、1.0-7mg/ml、1.0-6mg/ml或1.0-5mg/ml的所希望的脂质的混合物。在一些实施方案中,合适的脂质溶液可以含有总浓度高达约100mg/ml、90mg/ml、80mg/ml、70mg/ml、60mg/ml、50mg/ml、40mg/ml、30mg/ml、20mg/ml或10mg/ml的所希望的脂质的混合物。
任何希望的脂质可以以任何适用于包封mRNA的比率混合。在一些实施方案中,合适的脂质溶液含有所希望的脂质的混合物,包括阳离子脂质、非阳离子脂质、基于胆固醇的脂质、两亲性嵌段共聚物(例如,泊洛沙姆)和/或PEG修饰的脂质。在一些实施方案中,合适的脂质溶液含有所希望的脂质的混合物,包括一种或多种阳离子脂质、一种或多种非阳离子脂质、一种或多种基于胆固醇的脂质和/或一种或多种PEG修饰的脂质。
在一些实施方案中,提供的药物组合物包含脂质纳米颗粒,其中mRNA既缔合在脂质纳米颗粒的表面上又包封在同一脂质纳米颗粒内。例如,在本发明药物组合物的制备过程中,阳离子脂质纳米颗粒可以通过静电相互作用与mRNA缔合。
在一些实施方案中,本发明的化合物、药物组合物和方法包括包封在脂质纳米颗粒中的mRNA。在一些实施方案中,mRNA可以是包封在同一脂质纳米颗粒。在一些实施方案中,mRNA可以包封在不同的脂质纳米颗粒中。在一些实施方案中,mRNA包封在一种或多种脂质纳米颗粒中,所述脂质纳米颗粒的脂质组成、脂质组分的摩尔比率、尺寸、电荷(ζ电势)、靶向配体和/或其组合不同。在一些实施方案中,所述一种或多种脂质纳米颗粒可以具有不同的基于固醇的阳离子脂质的组成、中性脂质、PEG修饰的脂质和/或其组合。在一些实施方案中,所述一种或多种脂质纳米颗粒可以具有不同的基于胆固醇的脂质的摩尔比率、阳离子脂质、中性脂质、和用于产生脂质纳米颗粒的PEG修饰的脂质。
将所希望的mRNA掺入脂质纳米颗粒中的过程通常称为“负载”。示例性方法描述于Lasic等人FEBS Lett.,312:255-258,1992中,将其通过引用并入本文。脂质纳米颗粒掺入的核酸可以完全或部分位于脂质纳米颗粒的内部空间中,脂质纳米颗粒膜的双层膜内,或与脂质纳米颗粒膜的外表面相关。将mRNA掺入脂质纳米颗粒中在本文中也称为“包封”,其中核酸完全包含在脂质纳米颗粒的内部空间内。将mRNA掺入脂质纳米颗粒中的目的通常是保护mRNA免受环境的影响,所述环境可能含有降解mRNA的酶或化学物质和/或导致mRNA快速分泌的系统或受体。因此,在一些实施方案中,合适的脂质纳米颗粒能够增强其中所含的mRNA的稳定性和/或促进mRNA向靶细胞或组织的递送。
根据本发明的合适的脂质纳米颗粒可以制成各种尺寸。在一些实施方案中,提供的脂质纳米颗粒可以制成小于先前已知的脂质纳米颗粒。在一些实施方案中,减小的脂质纳米颗粒尺寸与mRNA的更高效递送相关。选择适当的脂质纳米颗粒尺寸可以考虑靶细胞或组织的位点以及在某种程度上脂质纳米颗粒将用于的应用。
在一些实施方案中,选择脂质纳米颗粒的适当尺寸以促进mRNA的全身分布。可替代地或另外地,脂质纳米颗粒的尺寸被制定为可以使得脂质纳米颗粒的尺寸具有足够的直径,以限制或明确避免分布到某些细胞或组织中。
本领域已知的各种替代方法可用于改变脂质纳米颗粒群的尺寸。一种此类尺寸制定方法描述在美国专利号4,737,323中,将其通过引用并入本文。通过浴或探针超声处理对脂质纳米颗粒悬浮液进行超声处理产生逐渐减小的尺寸,直至直径小于约0.05微米的小ULV。匀浆是另一种方法,其依靠剪切能量将大的脂质纳米颗粒分裂成较小颗粒。在典型的匀浆程序中,MLV通过标准乳液匀浆器再循环,直到观察到选定的脂质纳米颗粒尺寸,典型地在约0.1微米与0.5微米之间。脂质纳米颗粒的尺寸可以通过准电光散射(QELS)来确定,如Bloomfield,Ann.Rev.Biophys.Bioeng.,10:421-450(1981)所述,将其通过引用并入本文。可以通过对形成的脂质纳米颗粒进行超声处理来减小平均脂质纳米颗粒直径。间歇超声处理循环可以与QELS评估交替,以指导有效的脂质纳米颗粒合成。
脂质纳米颗粒配制品
在一些实施方案中,药物组合物中的大多数纯化脂质纳米颗粒,即大于约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的脂质纳米颗粒,具有约150nm的尺寸(例如,约145nm、约140nm、约135nm、约130nm、约125nm、约120nm、约115nm、约110nm、约105nm、约100nm、约95nm、约90nm、约85nm或约80nm)。在一些实施方案中,基本上所有的纯化脂质纳米颗粒具有约150nm的尺寸(例如,约145nm、约140nm、约135nm、约130nm、约125nm、约120nm、约115nm、约110nm、约105nm、约100nm、约95nm、约90nm、约85nm或约80nm)。
在一些实施方案中,脂质纳米颗粒具有小于150nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于120nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于100nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于90nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于80nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于70nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于60nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于50nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于30nm的平均尺寸。在一些实施方案中,脂质纳米颗粒具有小于20nm的平均尺寸。
在一些实施方案中,由本发明提供的药物组合物中的大于约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%的脂质纳米颗粒的尺寸范围为从约40-90nm(例如,约45-85nm、约50-80nm、约55-75nm、约60-70nm)。在一些实施方案中,基本上所有的脂质纳米颗粒的尺寸范围为从约40-90nm(例如,约45-85nm、约50-80nm、约55-75nm、约60-70nm)。平均尺寸约50-70nm(例如,55-65nm)的脂质纳米颗粒的组合物特别适用于经由雾化进行肺递送。
在一些实施方案中,通过本发明提供的药物组合物中的脂质纳米颗粒的分散性或分子尺寸异质性量度(PDI)小于约0.5。在一些实施方案中,脂质纳米颗粒的PDI小于约0.5。在一些实施方案中,脂质纳米颗粒的PDI小于约0.4。在一些实施方案中,脂质纳米颗粒的PDI小于约0.3。在一些实施方案中,脂质纳米颗粒的PDI小于约0.28。在一些实施方案中,脂质纳米颗粒的PDI小于约0.25。在一些实施方案中,脂质纳米颗粒的PDI小于约0.23。在一些实施方案中,脂质纳米颗粒的PDI小于约0.20。在一些实施方案中,脂质纳米颗粒的PDI小于约0.18。在一些实施方案中,脂质纳米颗粒的PDI小于约0.16。在一些实施方案中,脂质纳米颗粒的PDI小于约0.14。在一些实施方案中,脂质纳米颗粒的PDI小于约0.12。在一些实施方案中,脂质纳米颗粒的PDI小于约0.10。在一些实施方案中,脂质纳米颗粒的PDI小于约0.08。
在一些实施方案中,本文提供的药物组合物中大于约75%、80%、85%、90%、95%、96%、97%、98%或99%的纯化脂质纳米颗粒将mRNA包封在每个单独的颗粒内。在一些实施方案中,药物组合物中基本上所有的经纯化的脂质纳米颗粒将mRNA包封在每个单独的颗粒内。在一些实施方案中,脂质纳米颗粒的包封效率在50%与99%之间。在一些实施方案中,脂质纳米颗粒的包封效率大于约60%。在一些实施方案中,脂质纳米颗粒的包封效率大于约65%。在一些实施方案中,脂质纳米颗粒的包封效率大于约70%。在一些实施方案中,脂质纳米颗粒的包封效率大于约75%。在一些实施方案中,脂质纳米颗粒的包封效率大于约80%。在一些实施方案中,脂质纳米颗粒的包封效率大于约85%。在一些实施方案中,脂质纳米颗粒的包封效率大于约90%。在一些实施方案中,脂质纳米颗粒的包封效率大于约92%。在一些实施方案中,脂质纳米颗粒的包封效率大于约95%。在一些实施方案中,脂质纳米颗粒的包封效率大于约98%。在一些实施方案中,脂质纳米颗粒的包封效率大于约99%。典型地,用于本发明的脂质纳米颗粒的包封效率是至少90%-95%。
在一些实施方案中,脂质纳米颗粒的N/P比率在1与10之间。在一些实施方案中,脂质纳米颗粒的N/P比率高于1。在一些实施方案中,脂质纳米颗粒的N/P比率为约1。在一些实施方案中,脂质纳米颗粒的N/P比率为约2。在一些实施方案中,脂质纳米颗粒的N/P比率为约3。在一些实施方案中,脂质纳米颗粒的N/P比率为约4。在一些实施方案中,脂质纳米颗粒的N/P比率为约5。在一些实施方案中,脂质纳米颗粒的N/P比率为约6。在一些实施方案中,脂质纳米颗粒的N/P比率为约7。在一些实施方案中,脂质纳米颗粒的N/P比率为约8。用于本发明的典型脂质纳米颗粒的N/P比率为约4。
在一些实施方案中,根据本发明的药物组合物含有至少约0.5mg、1mg、5mg、10mg、100mg、500mg或1000mg包封mRNA。在一些实施方案中,药物组合物含有约0.1mg至1000mg包封mRNA。在一些实施方案中,药物组合物含有至少约0.5mg包封mRNA。在一些实施方案中,药物组合物含有至少约0.8mg包封mRNA。在一些实施方案中,药物组合物含有至少约1mg包封mRNA。在一些实施方案中,药物组合物含有至少约5mg包封mRNA。在一些实施方案中,药物组合物含有至少约8mg包封mRNA。在一些实施方案中,药物组合物含有至少约10mg包封mRNA。在一些实施方案中,药物组合物含有至少约50mg包封mRNA。在一些实施方案中,药物组合物含有至少约100mg包封mRNA。在一些实施方案中,药物组合物含有至少约500mg包封mRNA。在一些实施方案中,药物组合物含有至少约1000mg包封mRNA。
阳离子脂质
用于本发明的药物组合物和方法的合适阳离子脂质包括如国际专利公开WO2010/144740所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质4-(二甲基氨基)丁酸(6Z,9Z,28Z,31Z)-三十七烷-6,9,28,31-四烯-19-基酯,其化合物结构为:
及其药学上可接受的盐。
用于本发明的药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2013/149140所述的可电离阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式之一的阳离子脂质:
或其药学上可接受的盐,其中R1和R2各自独立地选自氢、任选经取代的可变饱和或不饱和的C1-C20烷基和任选经取代的可变饱和或不饱和的C6-C20酰基;其中L1和L2各自独立地选自氢、任选经取代的C1-C30烷基、任选经取代的可变不饱和C1-C30烯基和任选经取代的C1-C30炔基;其中m和o各自独立地选自零和任何正整数(例如,其中m是三);并且其中n是零或任何正整数(例如,其中n是1)。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质(15Z,18Z)-N,N-二甲基-6-(9Z,12Z)-十八-9,12-二烯-l-基)二十四烷-15,18-二烯-1-胺(“HGT5000”),其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质(15Z,18Z)-N,N-二甲基-6-((9Z,12Z)-十八-9,12-二烯-1-基)二十四烷-4,15,18-三烯-l-胺(“HGT5001”),其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质和(15Z,18Z)-N,N-二甲基-6-((9Z,12Z)-十八-9,12-二烯-1-基)二十四烷-5,15,18-三烯-1-胺(“HGT5002”),其化合物结构为:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括国际专利公开WO2010/053572中描述为氨基醇脂质的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2016/118725所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2016/118724所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括具有式14,25-双十三烷基15,18,21,24-四氮杂-三十八烷的阳离子脂质及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2013/063468和WO 2016/205691中所述的阳离子脂质,将所述每个国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐,其中RL的每个实例独立地是任选经取代的C6-C40烯基。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2015/184256所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐,其中每个X独立地是O或S;每个Y独立地是O或S;每个m独立地是0至20;每个n独立地是1至6;每个RA独立地是氢、任选经取代的C1-50烷基、任选经取代的C2-50烯基、任选经取代的C2-50炔基、任选经取代的C3-10碳环基、任选经取代的3-14元杂环基、任选经取代的C6-14芳基、任选经取代的5-14元杂芳基或卤素;并且每个RB独立地是氢、任选经取代的C1-50烷基、任选经取代的C2-50烯基、任选经取代的C2-50炔基、任选经取代的C3-10碳环基、任选经取代的3-14元杂环基、任选经取代的C6-14芳基、任选经取代的5-14元杂芳基或卤素。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质“靶23”:
(靶23)
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2016/004202所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
或其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
或其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
或其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如2018年11月9日提交的美国临时专利申请序列号62/758,179和2019年7月8日提交的临时专利申请序列号62/871,510中所述的阳离子脂质,将所述申请通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐,其中每个R1和R2独立地是H或C1-C6脂族;每个m独立地是值为1至4的整数;每个A独立地是共价键或亚芳基;每个L1独立地是酯、硫酯、二硫化物或酸酐基团;每个L2独立地是C2-C10脂族;每个X1独立地是H或OH;并且每个R3独立地是C6-C20脂族。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如J.McClellan,M.C.King,Cell 2010,141,210-217和Whitehead等人,Nature Communications(2014)5:4277中所述的阳离子脂质,将所述文献通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法的阳离子脂质包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2015/199952所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2017/004143所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2017/075531所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
或其药学上可接受的盐,其中L1或L2之一是-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x、-S-S-、-C(=O)S-、-SC(=O)-、-NRaC(=O)-、-C(=O)NRa-、NRaC(=O)NRa-、-OC(=O)NRa-或-NRaC(=O)O-;并且L1或L2中的另一个是-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x、-S-S-、-C(=O)S-、SC(=O)-、-NRaC(=O)-、-C(=O)NRa-、NRaC(=O)NRa-、-OC(=O)NRa-或-NRaC(=O)O-或直接键;G1和G2各自独立地是未经取代的C1-C12亚烷基或C1-C12亚烯基;G3是C1-C24亚烷基、C1-C24亚烯基、C3-C8亚环烷基、C3-C8亚环烯基;Ra是H或C1-C12烷基;R1和R2各自独立地是C6-C24烷基或C6-C24烯基;R3是H、OR5、CN、-C(=O)OR4、-OC(=O)R4或-NR5C(=O)R4;R4是C1-C12烷基;R5是H或C1-C6烷基;并且x是0、1或2。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2017/117528所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2017/049245所述的阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法的阳离子脂质包括下式之一的化合物:
及其药学上可接受的盐。对于这四个式中的任何一个,R4独立地选自-(CH2)nQ和-(CH2)nCHQR;Q选自-OR、-OH、-O(CH2)nN(R)2、-OC(O)R、-CX3、-CN、-N(R)C(O)R、-N(H)C(O)R、-N(R)S(O)2R、-N(H)S(O)2R、-N(R)C(O)N(R)2、-N(H)C(O)N(R)2、-N(H)C(O)N(H)(R)、-N(R)C(S)N(R)2、-N(H)C(S)N(R)2、-N(H)C(S)N(H)(R)和杂环;并且n是1、2或3。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2017/173054和WO 2015/095340中所述的阳离子脂质,将所述每个国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如2019年6月24日提交的美国临时专利申请序列号62/865,555中所述的阳离子脂质,将所述申请通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明药物组合物和方法的其他合适阳离子脂质包括如2019年6月21日提交的美国临时专利申请序列号62/864,818中所述的阳离子脂质,将所述申请通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括具有根据下式的化合物结构的阳离子脂质:
或其药学上可接受的盐,其中R2、R3和R4之一独立地是C6-C30烷基、C6-C30烯基或C6-C30炔基;L1是C1-C30亚烷基;C2-C30亚烯基;或C2-C30亚炔基,并且B1是可电离的含氮基团。在实施方案中,L1是C1-C10亚烷基。在实施方案中,L1是未经取代的C1-C10亚烷基。在实施方案中,L1是(CH2)2、(CH2)3、(CH2)4或(CH2)5。在实施方案中,L1是(CH2)、(CH2)6、(CH2)7、(CH2)8、(CH2)9或(CH2)10。在实施方案中,B1独立地是NH2、胍、脒、单或二烷基胺、5至6元含氮杂环烷基或5至6元含氮杂芳基。在实施方案中,B1 在实施方案中,B1在实施方案中,B1在实施方案中,R2、R3和R4各自独立地是未经取代的直链C6-C22烷基、未经取代的直链C6-C22烯基、未经取代的直链C6-C22炔基、未经取代的支链C6-C22烷基、未经取代的支链C6-C22烯基、或未经取代的支链C6-C22炔基。在实施方案中,R2、R3和R4各自是未经取代的C6-C22烷基。在实施方案中,R2、R3和R4各自是-C6H13、-C7H15、-C8H17、-C9H19、-C10H21、-C11H23、-C12H25、-C13H27、-C14H29、-C15H31、-C16H33、-C17H35、-C18H37、-C19H39、-C20H41、-C21H43、-C22H45、-C23H47、-C24H49或-C25H51。在实施方案中,R2、R3和R4各自独立地是被-O(CO)R5或-C(O)OR5取代的C6-C12烷基,其中R5是未经取代的C6-C14烷基。在实施方案中,R2、R3和R4各自是未经取代的C6-C22烯基。在实施方案中,R2、R3和R4各自是-(CH2)4CH=CH2、-(CH2)5CH=CH2、-(CH2)6CH=CH2、-(CH2)7CH=CH2、-(CH2)8CH=CH2、-(CH2)9CH=CH2、-(CH2)10CH=CH2、-(CH2)11CH=CH2、-(CH2)12CH=CH2、-(CH2)13CH=CH2、-(CH2)14CH=CH2、-(CH2)15CH=CH2、-(CH2)16CH=CH2、-(CH2)17CH=CH2、-(C H2)18CH=CH2、-(CH2)7CH=CH(CH2)3CH3、-(CH2)7CH=CH(CH2)5CH3、-(CH2)4CH=CH(C H2)8CH3、-(CH2)7CH=CH(CH2)7CH3、-(CH2)6CH=CHCH2CH=CH(CH2)4CH3、-(CH2)7CH=CHCH2CH=CH(CH2)4CH3、-(CH2)7CH=CHCH2CH=CHCH2CH=CHCH2CH3、-(CH2)3CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)4CH3、-(CH2)3CH=CHCH2CH=CHCH2CH=C HCH2CH=CHCH2CH=CHCH2CH3、-(CH2)11CH=CH(CH2)7CH3或-(CH2)2CH=CHCH2CH=C HCH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CHCH2CH3
在实施方案中,所述C6-C22烯基是单烯基、二烯基或三烯基。在实施方案中,R2、R3和R4各自是
在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括具有以下化合物结构的阳离子脂质:
及其药学上可接受的盐。
用于本发明的药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2012/170889所述的可切割阳离子脂质,将所述国际专利通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括下式的阳离子脂质:
其中R1选自咪唑、胍鎓、氨基、亚胺、烯胺、任选经取代的烷基氨基(例如,烷基氨基,诸如二甲基氨基)和吡啶基;其中R2选自以下两式之一:
并且其中R3和R4各自独立地选自任选经取代的可变饱和或不饱和的C6-C20烷基和任选经取代的可变饱和或不饱和的C6-C20酰基;并且其中n是零或任何正整数(例如,一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十或更大)。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“HGT4001”,其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“HGT4002”,其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“HGT4003”,其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“HGT4004”,其化合物结构为:
及其药学上可接受的盐。在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“HGT4005”,其化合物结构为:
及其药学上可接受的盐。
用于本发明的药物组合物和方法的其他合适阳离子脂质包括如国际专利公开WO2019/222424所述的可切割阳离子脂质,并且将其通过引用并入本文。在一些实施方案中,本发明的药物组合物和方法包括作为国际专利公开WO 2019/222424中所述的任何通式或任何结构(1a)-(21a)和(1b)-(21b)和(22)-(237)的阳离子脂质。在一些实施方案中,本发明的药物组合物和方法包括具有根据式(I’)的结构的阳离子脂质
其中:
RX独立地是-H、-L1-R1或-L5A-L5B-B’;
L1、L2和L3各自独立地是共价键、-C(O)-、-C(O)O-、-C(O)S-或-C(O)NRL-;
L4A和L5A各自独立地是-C(O)-、-C(O)O-或-C(O)NRL-;
L4B和L5B各自独立地是C1-C20亚烷基;C2-C20亚烯基;或C2-C20亚炔基;
B和B’各自是NR4R5或5至10元含氮杂芳基;
R1、R2和R3各自独立地是C6-C30烷基、C6-C30烯基或C6-C30炔基;
R4和R5各自独立地是氢、C1-C10烷基;C2-C10烯基;或C2-C10炔基;并且
每个RL独立地是氢、C1-C20烷基、C2-C20烯基、或C2-C20炔基。
在一些实施方案中,本发明的药物组合物和方法包括作为国际申请号PCT/US2019/032522的化合物(139)的阳离子脂质,其化合物结构为:
(“18:1碳尾-核糖脂质”)。
在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质“RL3-DMA-07D”,其化合物结构为:
及其药学上可接受的盐。
在一些实施方案中,本发明的药物组合物和方法包括阳离子脂质N-[l-(2,3-二油烯基氧基)丙基]-N,N,N-三甲基氯化铵(“DOTMA”)。(Feigner等人(Proc.Nat’lAcad.Sci.84,7413(1987);美国专利号4,897,355,将其通过引用并入本文)。适用于本发明的药物组合物和方法的其他阳离子脂质包括例如,5-羧基鲸蜡酰甘氨酸双十八烷酰胺(“DOGS”);2,3-二油酰氧基-N-[2(精胺-甲酰胺基)乙基]-N,N-二甲基-l-丙胺鎓(“DOSPA”)(Behr等人Proc.Nat.’l Acad.Sci.86,6982(1989)、美国专利号5,171,678;美国专利号5,334,761);l,2-二油酰-3-二甲基胺鎓-丙烷(“DODAP”);l,2-二油酰-3-三甲基胺鎓-丙烷(“DOTAP”)。
适用于本发明药物组合物和方法的另外示例性阳离子脂质还包括:l,2-二硬脂酰氧基-N,N-二甲基-3-氨基丙烷(“DSDMA”);1,2-二油烯基氧基-N,N-二甲基-3-氨基丙烷(“DODMA”);1,2-二亚油酰氧基-N,N-二甲基-3-氨基丙烷(“DLinDMA”);l,2-二亚麻酰氧基-N,N-二甲基-3-氨基丙烷(“DLenDMA”);N-二油酰-N,N-二甲基氯化铵(“DODAC”);N,N-二硬脂酰-N,N-二甲基溴化铵(“DDAB”);N-(l,2-二肉豆蔻氧基丙-3-基)-N,N-二甲基-N-羟乙基溴化铵(“DMRIE”);3-二甲基氨基-2-(胆甾-5-烯-3-β-氧基丁-4-氧基)-l-(顺式,顺式-9,12-十八烷二烯氧基)丙烷(“CLinDMA”);2-[5’-(胆甾-5-烯-3-β-氧基)-3’-氧杂戊氧基)-3-二甲基-l-(顺式,顺式-9’,l-2’-十八烷二烯氧基)丙烷(“CpLinDMA”);N,N-二甲基-3,4-二油烯基氧基苄胺(“DMOBA”);1,2-N,N’-二油酰基氨基甲酰基-3-二甲基氨基丙烷(“DOcarbDAP”);2,3-二亚油酰氧基-Ν,Ν-二甲基丙胺(“DLinDAP”);l,2-N,N’-二亚油基氨基甲酰基-3-二甲基氨基丙烷(“DLincarbDAP”);l,2-二亚油酰基氨基甲酰基-3-二甲基氨基丙烷(“DLinCDAP”);2,2-二亚油基-4-二甲基氨基甲基-[l,3]-二氧戊环(“DLin-K-DMA”);2-((8-[(3P)-胆甾-5-烯-3-基氧基]辛基)氧基)-N,N-二甲基-3-[(9Z,12Z)-十八-9,12-二烯-1-基氧基]丙-1-胺(“辛基-CLinDMA”);(2R)-2-((8-[(3β)-胆甾-5-烯-3-基氧基]辛基)氧基)-N,N-二甲基-3-[(9Z,12Z)-十八-9,12-二烯-1-基氧基]丙-1-胺(“辛基-CLinDMA(2R)”);(2S)-2-((8-[(3P)-胆甾-5-烯-3-基氧基]辛基)氧基)-N,fsl-dimethyh3-[(9Z,12Z)-十八-9,12-二烯-1-基氧基]丙-1-胺(“辛基-CLinDMA(2S)”);2,2-二亚油基-4-二甲基氨基乙基-[l,3]-二氧戊环(“DLin-K-XTC2-DMA”);和2-(2,2-二((9Z,12Z)-十八-9,l 2-二烯-1-基)-l,3-二氧戊环-4-基)-N,N-二甲基乙胺(“DLin-KC2-DMA”)(参见WO 2010/042877,将其通过引用并入本文;Semple等人,Nature Biotech.28:172-176(2010))。(Heyes,J.等人,J Controlled Release 107:276-287(2005);Morrissey,DV.等人,Nat.Biotechnol.23(8):1003-1007(2005);国际专利公开WO 2005/121348)。在一些实施方案中,一种或多种阳离子脂质包含咪唑、二烷基氨基或胍鎓部分中的至少一种。
在一些实施方案中,适用于本发明药物组合物和方法的一种或多种阳离子脂质包括2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(“XTC”);(3aR,5s,6aS)-N,N-二甲基-2,2-二((9Z,12Z)-十八-9,12-二烯基)四氢-3aH-环戊二烯并[d][1,3]二氧代-5-胺(“ALNY-100”)和/或4,7,13-三(3-氧代-3-(十一烷基氨基)丙基)-N1,N16-双十一烷基-4,7,10,13-四氮杂十六烷-1,16-二酰胺(“NC98-5”)。
在一些实施方案中,本发明的药物组合物包含一种或多种阳离子脂质,其占药物组合物中的总脂质含量(例如,脂质纳米颗粒)的按重量测量的至少约5%、10%、20%、30%、35%、40%、45%、50%、55%、60%、65%或70%。在一些实施方案中,本发明的药物组合物包含一种或多种阳离子脂质,其占药物组合物中的总脂质含量(例如,脂质纳米颗粒)的按mol%测量的至少约5%、10%、20%、30%、35%、40%、45%、50%、55%、60%、65%或70%。在一些实施方案中,本发明的药物组合物包含一种或多种阳离子脂质,其占药物组合物中的总脂质含量(例如,脂质纳米颗粒)的按重量测量的约30%-70%(例如,约30%-65%、约30%-60%、约30%-55%、约30%-50%、约30%-45%、约30%-40%、约35%-50%、约35%-45%或约35%-40%)。在一些实施方案中,本发明的药物组合物包含一种或多种阳离子脂质,其占药物组合物中的总脂质含量(例如,脂质纳米颗粒)的按mol%测量的约30%-70%(例如,约30%-65%、约30%-60%、约30%-55%、约30%-50%、约30%-45%、约30%-40%、约35%-50%、约35%-45%或约35%-40%)。
非阳离子脂质
在一些实施方案中,脂质纳米颗粒含有一种或多种非阳离子脂质。如本文所用,短语“非阳离子脂质”是指任何中性、两性离子或阴离子脂质。如本文所用,短语“阴离子脂质”是指在选定的pH诸如生理pH下携带净负电荷的许多脂质种类中的任一种。非阳离子脂质包括但不限于二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷脂酰胆碱(DOPC)、二棕榈酰磷脂酰胆碱(DPPC)、二油酰磷脂酰甘油(DOPG)、二棕榈酰磷脂酰甘油(DPPG)、二油酰磷脂酰乙醇胺(DOPE)、棕榈酰油酰磷脂酰胆碱(POPC)、棕榈酰油酰-磷脂酰乙醇胺(POPE)、二油酰-磷脂酰乙醇胺4-(N-马来酰亚胺基甲基)-环己烷-l-甲酸酯(DOPE-mal)、二棕榈酰磷脂酰乙醇胺(DPPE)、二肉豆蔻酰磷酸乙醇胺(DMPE)、二硬脂酰-磷脂酰-乙醇胺(DSPE)、1,2-二瓢儿菜基-sn-甘油-3-磷酸乙醇胺(DEPE)、磷脂酰丝氨酸、鞘脂、脑苷脂、神经节苷脂、16-O-单甲基PE、16-O-二甲基PE、18-1-反式PE、l-硬脂酰-2-油酰-磷脂酰乙醇胺(SOPE)或其混合物。在一些实施方案中,适用于本发明的脂质纳米颗粒包含DOPE作为非阳离子脂质组分。在其他实施方案中,适用于本发明的脂质纳米颗粒包含DEPE作为非阳离子脂质组分。
在一些实施方案中,非阳离子脂质是中性脂质,即在配制和/或施用药物组合物的条件下不带净电荷的脂质。
在一些实施方案中,此类非阳离子脂质可以单独使用,但优选与其他脂质例如阳离子脂质组合使用。
在一些实施方案中,非阳离子脂质可以以药物组合物中存在的总脂质的约5%至约90%、约5%至约70%、约5%至约50%、约5%至约40%、约5%至约30%、约10%至约70%、约10%至约50%或约10%至约40%的摩尔比(mol%)存在。在一些实施方案中,总非阳离子脂质可以以药物组合物中存在的总脂质的约5%至约90%、约5%至约70%、约5%至约50%、约5%至约40%、约5%至约30%、约10%至约70%、约10%至约50%或约10%至约40%的摩尔比(mol%)存在。在一些实施方案中,脂质纳米颗粒中非阳离子脂质的百分比可以大于约5mol%、大于约10mol%、大于约20mol%、大于约30mol%或大于约40mol%。在一些实施方案中,脂质纳米颗粒中总非阳离子脂质的百分比可以大于约5mol%、大于约10mol%、大于约20mol%、大于约30mol%或大于约40mol%。在一些实施方案中,脂质纳米颗粒中非阳离子脂质的百分比不超过约5mol%、不超过约10mol%、不超过约20mol%、不超过约30mol%或不超过约40mol%。在一些实施方案中,脂质纳米颗粒中总非阳离子脂质的百分比可以不超过约5mol%、不超过约10mol%、不超过约20mol%、不超过约30mol%或不超过约40mol%。
在一些实施方案中,非阳离子脂质可以以药物组合物中存在的总脂质的约5%至约90%、约5%至约70%、约5%至约50%、约5%至约40%、约5%至约30%、约10%至约70%、约10%至约50%或约10%至约40%的重量比(wt%)存在。在一些实施方案中,总非阳离子脂质可以以药物组合物中存在的总脂质的约5%至约90%、约5%至约70%、约5%至约50%、约5%至约40%、约5%至约30%、约10%至约70%、约10%至约50%或约10%至约40%的重量比(wt%)存在。在一些实施方案中,脂质纳米颗粒中非阳离子脂质的百分比可以大于约5wt%、大于约10wt%、大于约20wt%、大于约30wt%或大于约40wt%。在一些实施方案中,脂质纳米颗粒中总非阳离子脂质的百分比可以大于约5wt%、大于约10wt%、大于约20wt%、大于约30wt%或大于约40wt%。在一些实施方案中,脂质纳米颗粒中非阳离子脂质的百分比不超过约5wt%、不超过约10wt%、不超过约20wt%、不超过约30wt%或不超过约40wt%。在一些实施方案中,脂质纳米颗粒中总非阳离子脂质的百分比可以不超过约5wt%、不超过约10wt%、不超过约20wt%、不超过约30wt%或不超过约40wt%。
基于胆固醇的脂质
在一些实施方案中,脂质纳米颗粒包含一种或多种基于胆固醇的脂质。例如,合适的基于胆固醇的阳离子脂质包括,例如,DC-Choi(N,N-二甲基-N-乙基甲酰胺基胆固醇)、l,4-双(3-N-油酰氨基-丙基)哌嗪(Gao,等人Biochem.Biophys.Res.Comm.179,280(1991);Wolf等人BioTechniques 23,139(1997);美国专利号5,744,335)、或如国际专利公开WO2011/068810中披露的咪唑胆固醇酯(ICE),其具有以下结构
在实施方案中,基于胆固醇的脂质是胆固醇。
在一些实施方案中,基于胆固醇的脂质可以占脂质纳米颗粒中存在的总脂质的约1%至约30%或约5%至约20%的摩尔比(mol%)。在一些实施方案中,脂质纳米颗粒中基于胆固醇的脂质的百分比可以大于约5mol%、大于约10mol%、大于约20mol%、大于约30mol%或大于约40mol%。在一些实施方案中,脂质纳米颗粒中基于胆固醇的脂质的百分比可以不超过约5mol%、不超过约10mol%、不超过约20mol%、不超过约30mol%或不超过约40mol%。
在一些实施方案中,基于胆固醇的脂质可以以脂质纳米颗粒中存在的总脂质的约1%至约30%或约5%至约20%的重量比(wt%)存在。在一些实施方案中,脂质纳米颗粒中基于胆固醇的脂质的百分比可以大于约5wt%、大于约10wt%、大于约20wt%、大于约30wt%或大于约40wt%。在一些实施方案中,脂质纳米颗粒中基于胆固醇的脂质的百分比可以不超过约5wt%、不超过约10wt%、不超过约20wt%、不超过约30wt%或不超过约40wt%。
PEG修饰的脂质
在一些实施方案中,脂质纳米颗粒包含一种或多种聚乙二醇化脂质。
例如,本发明还考虑使用聚乙二醇(PEG)修饰的磷脂和衍生化脂质,诸如衍生化神经酰胺(PEG-CER),包括N-辛酰-鞘氨醇-1-[琥珀酰(甲氧基聚乙二醇)-2000](C8 PEG-2000神经酰胺),单独使用或优选与包含转移载体(例如,脂质纳米颗粒)的其他脂质药物组合物组合使用。
考虑的PEG修饰的脂质包括但不限于与具有一个或多个长度为C6-C20的烷基链的脂质共价附接的长度高达5kDa的聚乙二醇链。在一些实施方案中,PEG修饰的脂质或聚乙二醇化脂质是聚乙二醇化胆固醇或PEG-2K。此类组分的添加可以防止复合物聚集,并且还可以提供用于增加脂质-核酸药物组合物的循环寿命并且增加向靶组织的递送的手段(Klibanov等人(1990)FEBS Letters,268(1):235-237),或者可以选择它们以快速交换出体内药物组合物(参见美国专利号5,885,613)。特别有用的可交换脂质是具有较短酰基链(例如,C14或C18)的PEG-神经酰胺。适用于本发明的脂质纳米颗粒典型地包含PEG修饰的脂质,诸如1,2-二肉豆蔻酰-外消旋-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG2K)。
本发明的PEG修饰的磷脂和衍生化脂质可以占脂质体转移载体(例如,本文公开的脂质纳米颗粒)中存在的总脂质的从约0%至约20%、约0.5%至约20%、约1%至约15%、约4%至约10%或约2%的摩尔比。在一些实施方案中,一种或多种PEG修饰的脂质占总脂质的按摩尔比计约4%。在一些实施方案中,一种或多种PEG修饰的脂质占总脂质的按摩尔比计约5%。在一些实施方案中,一种或多种PEG修饰的脂质占总脂质的按摩尔比计约6%。对于某些应用,诸如肺递送,其中PEG修饰的脂质组分占总脂质的按摩尔比计约5%的脂质纳米颗粒已发现是特别合适的。
不同脂质组分的比率
用于本发明的合适脂质纳米颗粒可以包含各种比率的本文所述的阳离子脂质、非阳离子脂质、胆固醇脂质、PEG修饰的脂质、两亲嵌段共聚物和/或聚合物中的任何一种或多种。在一些实施方案中,脂质纳米颗粒包含五种且不超过五种不同的纳米颗粒组分。在一些实施方案中,脂质纳米颗粒包含四种且不超过四种不同的纳米颗粒组分。在一些实施方案中,脂质纳米颗粒包含三种且不超过三种不同的纳米颗粒组分。作为非限制性例子,合适的脂质纳米颗粒药物组合物可以包含选自以下的组合:cKK-E12、DOPE、胆固醇和DMG-PEG2K;C12-200、DOPE、胆固醇和DMG-PEG2K;HGT4003、DOPE、胆固醇和DMG-PEG2K;ICE、DOPE、胆固醇和DMG-PEG2K;HGT4001、DOPE、胆固醇和DMG-PEG2K;HGT4002、DOPE、胆固醇和DMG-PEG2K;TL1-01D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-04D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-08D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-10D-DMA、DOPE、胆固醇和DMG-PEG2K;ICE、DOPE和DMG-PEG2K;HGT4001、DOPE和DMG-PEG2K;或HGT4002、DOPE和DMG-PEG2K。
在各种实施方案中,阳离子脂质(例如,cKK-E12、C12-200、TL1-01D-DMA、TL1-04D-DMA、TL1-08D-DMA、TL1-10D-DMA、ICE、HGT4001、HGT4002和/或HGT4003)占脂质纳米颗粒的按摩尔比计约30%-60%(例如,约30%-55%、约30%-50%、约30%-45%、约30%-40%、约35%-50%、约35%-45%或约35%-40%)。在一些实施方案中,阳离子脂质(例如,cKK-E12、C12-200、TL1-01D-DMA、TL1-04D-DMA、TL1-08D-DMA、TL1-10D-DMA、ICE、HGT4001、HGT4002和/或HGT4003)的百分比按摩尔比是或大于脂质纳米颗粒的约30%、约35%、约40%、约45%、约50%、约55%或约60%。
在一些实施方案中,一种或多种阳离子脂质与一种或多种非阳离子脂质与一种或多种基于胆固醇的脂质与一种或多种PEG修饰的脂质的摩尔比可以分别在约30-60:25-35:20-30:1-15之间。在一些实施方案中,一种或多种阳离子脂质与一种或多种非阳离子脂质与一种或多种基于胆固醇的脂质与一种或多种PEG修饰的脂质的比率分别是大约40:30:20:10。在一些实施方案中,一种或多种阳离子脂质与一种或多种非阳离子脂质与一种或多种基于胆固醇的脂质与一种或多种PEG修饰的脂质的比率分别是大约40:30:25:5。在一些实施方案中,一种或多种阳离子脂质与一种或多种非阳离子脂质与一种或多种基于胆固醇的脂质与一种或多种PEG修饰的脂质的比率分别是大约40:32:25:3。在一些实施方案中,一种或多种阳离子脂质与一种或多种非阳离子脂质与一种或多种基于胆固醇的脂质与一种或多种PEG修饰的脂质的比率是大约50:25:20:5。
在脂质纳米颗粒包含三种且不超过三种不同的脂质组分的实施方案中,总脂质含量的比率(即,脂质组分(1):脂质组分(2):脂质组分(3)的比率)可以表征为x:y:z,其中
(y+z)=100-x。
在一些实施方案中,“x”、“y”和“z”中的每一个都表示脂质的三种不同组分的摩尔百分比,并且所述比率是摩尔比。
在一些实施方案中,“x”、“y”和“z”中的每一个都表示脂质的三种不同组分的重量百分比,并且所述比率是重量比。
在一些实施方案中,由变量“x”表示的脂质组分(1)是基于胆固醇的阳离子脂质。
在一些实施方案中,由变量“y”表示的脂质组分(2)是基于非阳离子脂质。
在一些实施方案中,由变量“z”表示的脂质组分(3)是PEG脂质。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的摩尔百分比的变量“x”是至少约10%、约20%、约30%、约40%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的摩尔百分比的变量“x”不超过约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约40%、约30%、约20%或约10%。在实施方案中,变量“x”不超过约65%、约60%、约55%、约50%、约40%。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的摩尔百分比的变量“x”是:至少约50%但不少于约95%;至少约50%但不少于约90%;至少约50%但不少于约85%;至少约50%但不少于约80%;至少约50%但不少于约75%;至少约50%但不少于约70%;至少约50%但不少于约65%;或至少约50%但不少于约60%。在实施方案中,变量“x”是至少约50%但不少于约70%;至少约50%但不少于约65%;或至少约50%但不少于约60%。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的重量百分比的变量“x”是至少约10%、约20%、约30%、约40%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的重量百分比的变量“x”不超过约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约40%、约30%、约20%或约10%。在实施方案中,变量“x”不超过约65%、约60%、约55%、约50%、约40%。
在一些实施方案中,表示脂质组分(1)(例如,基于胆固醇的阳离子脂质)的重量百分比的变量“x”是:至少约50%但不少于约95%;至少约50%但不少于约90%;至少约50%但不少于约85%;至少约50%但不少于约80%;至少约50%但不少于约75%;至少约50%但不少于约70%;至少约50%但不少于约65%;或至少约50%但不少于约60%。在实施方案中,变量“x”是至少约50%但不少于约70%;至少约50%但不少于约65%;或至少约50%但不少于约60%。
在一些实施方案中,表示脂质组分(3)(例如,PEG脂质)的摩尔百分比的变量“z”不超过约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%或25%。在实施方案中,表示脂质组分(3)(例如,PEG脂质)的摩尔百分比的变量“z”是约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%。在实施方案中,表示脂质组分(3)(例如,PEG脂质)的摩尔百分比的变量“z”是约1%至约10%、约2%至约10%、约3%至约10%、约4%至约10%、约1%至约7.5%、约2.5%至约10%、约2.5%至约7.5%、约2.5%至约5%、约5%至约7.5%或约5%至约10%。
在一些实施方案中,表示脂质组分(3)(例如,PEG脂质)的重量百分比的变量“z”不超过约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%或25%。在实施方案中,表示脂质组分(3)(例如,PEG脂质)的重量百分比的变量“z”是约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%。在实施方案中,表示脂质组分(3)(例如,PEG脂质)的重量百分比的变量“z”是约1%至约10%、约2%至约10%、约3%至约10%、约4%至约10%、约1%至约7.5%、约2.5%至约10%、约2.5%至约7.5%、约2.5%至约5%、约5%至约7.5%或约5%至约10%。
对于具有三种且仅三种不同脂质组分的药物组合物,变量“x”、“y”和“z”可以是任何组合,只要三个变量的总和为总脂质含量的100%。例如,在适用于本发明的典型三组分脂质纳米颗粒中,阳离子脂质与非阳离子脂质与PEG修饰的脂质的摩尔比可以分别在约55-65:30-40:1-15之间。在一些实施方案中,阳离子脂质(例如,基于胆固醇的脂质)与非阳离子脂质(例如,DOPE或DEPE)与PEG修饰的脂质(例如,DMG-PEG2K)的摩尔比60:35:5是特别合适的,例如用于脂质纳米颗粒通过雾化的肺递送。
示例性脂质纳米颗粒配制品
根据本发明的用于体内递送核酸的示例性脂质纳米颗粒包含阳离子脂质(例如,cKK-E10)、非阳离子脂质(例如,DOPE)、胆固醇和PEG修饰的脂质(例如,DMG-PEG2K)。在具体实施方案中,本发明提供了用于递送本发明核酸的脂质纳米颗粒,所述脂质纳米颗粒具有由摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K组成的脂质组分。如实施例中所示,这种脂质纳米颗粒配制品已发现特别有效用于本发明免疫原性组合物,特别是用于包含本发明核酸的脂质纳米颗粒的肌内施用。
含有至少两种核酸的脂质纳米颗粒组合物
在一些实施方案中,包含不同的本发明优化核苷酸序列的至少两种核酸包封在同一脂质纳米颗粒(例如,包含cKK-E10、DOPE、胆固醇和DMG-PEG2K的脂质纳米颗粒)。例如,包含本发明的第一优化核苷酸序列的第一核酸(例如,mRNA)可以与包含本发明的第二优化核苷酸序列的第二核酸(例如,mRNA)组合并且包封在同一脂质纳米颗粒中。
在其他实施方案中,包含不同的本发明优化核苷酸序列的至少两种核酸单独包封(典型地使用具有相同脂质(例如,cKK-E10、DOPE、胆固醇和DMG-PEG2K)的脂质纳米颗粒配制品)。例如,包含本发明的第一优化核苷酸序列的第一核酸(例如,mRNA)和包含本发明的第二优化核苷酸序列的第二核酸(例如,mRNA)可以各自包封在单独的脂质纳米颗粒中,然后将其组合以提供包封第一核酸的脂质纳米颗粒和包封第二核酸的脂质纳米颗粒(典型地比率为1:1)的混合物。
例如,根据本发明的免疫原性组合物可以包含至少两种核酸,其中第一核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸(例如,包含优化核苷酸序列SEQ ID NO:44的mRNA或表4中示出的示例性mRNA构建体1);并且第二核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸并且进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变(例如,包含优化核苷酸序列SEQ ID NO:166的mRNA或表4中示出的示例性mRNA构建体2)。在一些实施方案中,第一核酸可以与第二核酸组合并且包封在同一脂质纳米颗粒中。在其他实施方案中,第一核酸和第二核酸可以各自包封在单独的脂质纳米颗粒(典型地由相同脂质组分(例如,cKK-E10、DOPE、胆固醇和DMG-PEG2K)形成)中。然后组合包封第一核酸的脂质纳米颗粒和包封第二核酸的脂质纳米颗粒(典型地比率为1:1)。
药物组合物
根据本发明的包含编码SARS-CoV-2抗原的优化核苷酸序列的核酸可以提供在药物组合物(例如,免疫原性组合物或疫苗)中。在典型的实施方案中,根据本发明的药物组合物包含根据本发明的核酸和脂质纳米颗粒。在具体实施方案中,所述核酸被包封在脂质纳米颗粒中。在一些实施方案中,所述脂质纳米颗粒可以包含以下中的一种或多种:阳离子脂质、非阳离子脂质、基于胆固醇的脂质、PEG修饰的脂质或其组合。在典型的实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质和PEG修饰的脂质。在一些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质和PEG修饰的脂质。
药学上可接受的赋形剂
为了稳定核酸和/或脂质纳米颗粒或者为了促进药物组合物的施用和/或增强本发明核酸的体内表达,所述核酸和/或脂质纳米颗粒可以与一种或多种另外的核酸、载体、靶向配体、稳定剂和/或其他药学上可接受的赋形剂组合配制。用于配制和施用药物的技术可以在“Remington’s Pharmaceutical Sciences,”Mack Publishing Co.,Easton,Pa.,最新版中找到。
在一些实施方案中,药物组合物用稀释剂配制。在一些实施方案中,稀释剂选自DMSO、乙二醇、甘油、2-甲基-2,4-戊二醇(MPD)、丙二醇、蔗糖和海藻糖。在一些实施方案中,所述配制品包含1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%的稀释剂。在具体实施方案中,mRNA配制在作为稀释剂的10%海藻糖中。
治疗有效量
根据本发明的核酸以治疗有效量提供在本文提供的药物组合物中。如本文所用,术语“治疗有效量”在很大程度上基于本发明的药物组合物所含治疗剂的总量确定。通常,治疗有效量足以对受试者实现有意义的益处(例如,治疗或预防被SARS-CoV-2感染的感染)。例如,治疗有效量可以是足以用本发明的免疫原性组合物实现所希望的预防效果的量。
在一些实施方案中,根据本发明的药物组合物(例如,免疫原性组合物)包含浓度范围为从0.1mg/mL至10.0mg/mL的包含编码SARS-CoV-2抗原的优化核苷酸序列的mRNA。在一些实施方案中,mRNA的浓度为至少0.1mg/mL。在一些实施方案中,mRNA的浓度为至少0.2mg/mL。在一些实施方案中,mRNA的浓度为至少0.3mg/mL。在一些实施方案中,mRNA的浓度为至少0.4mg/mL。在一些实施方案中,mRNA的浓度为至少0.5mg/mL。在一些实施方案中,mRNA的浓度为至少0.6mg/mL。在一些实施方案中,mRNA的浓度为至少0.7mg/mL。在一些实施方案中,mRNA的浓度为至少0.8mg/mL。在一些实施方案中,mRNA的浓度为至少0.9mg/mL。在一些实施方案中,mRNA的浓度为至少1.0mg/mL。在典型的实施方案中,mRNA的浓度为约0.5mg/mL至约1.0mg/mL,例如约0.6mg/mL至约0.8mg/mL。
在一些实施方案中,根据本发明的药物组合物(例如,免疫原性组合物)包含剂量在5μg与200μg之间的包含编码SARS-CoV-2抗原的优化核苷酸序列的mRNA。在一些实施方案中,药物组合物中的mRNA剂量是10μg和200μg。在一些实施方案中,药物组合物中的mRNA剂量在7μg与135μg之间。在具体实施方案中,药物组合物中的mRNA剂量在15μg与135μg之间(例如,在15μg与45μg之间)。
在一些实施方案中,药物组合物中的mRNA剂量是至少5μg。在一些实施方案中,药物组合物中的mRNA剂量是至少10μg。在一些实施方案中,药物组合物中的mRNA剂量是至少15μg。在一些实施方案中,药物组合物中的mRNA剂量是至少20μg。在一些实施方案中,药物组合物中的mRNA剂量是至少25μg。在一些实施方案中,药物组合物中的mRNA剂量是至少30μg。在一些实施方案中,药物组合物中的mRNA剂量是至少35μg。在一些实施方案中,药物组合物中的mRNA剂量是至少40μg。在一些实施方案中,药物组合物中的mRNA剂量是至少45μg。在一些实施方案中,药物组合物中的mRNA剂量是至少50μg。在一些实施方案中,药物组合物中的mRNA剂量是至少75μg。在一些实施方案中,药物组合物中的mRNA剂量是至少100μg。在一些实施方案中,药物组合物中的mRNA剂量是至少150μg。
在特定实施方案中,药物组合物中的mRNA剂量是约7.5μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约10μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约15μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约20μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约30μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约40μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约45μg。在另一个特定实施方案中,药物组合物中的mRNA剂量是约135μg。
在一些实施方案中,根据本发明的药物组合物(例如,免疫原性组合物)包含多于一种mRNA构建体(例如,至少两种mRNA构建体),其包含编码SARS-CoV-2抗原的优化核苷酸序列(例如,两种编码SARS-CoV-2 S蛋白的天然存在的变体的mRNA构建体)。因此,在一些实施方案中,mRNA构建体的总剂量是5μg和200μg。例如,mRNA构建体的总剂量在10μg与200μg之间。在一些实施方案中,mRNA构建体的总剂量在7μg与135μg之间。在具体实施方案中,mRNA构建体的总剂量在15μg与135μg之间(例如,在15μg与45μg之间)。
在一些实施方案中,mRNA构建体的总剂量是至少5μg。在一些实施方案中,mRNA构建体的总剂量是至少10μg。在一些实施方案中,mRNA构建体的总剂量是至少15μg。在一些实施方案中,mRNA构建体的总剂量是至少20μg。在一些实施方案中,mRNA构建体的总剂量是至少25μg。在一些实施方案中,mRNA构建体的总剂量是至少30μg。在一些实施方案中,mRNA构建体的总剂量是至少35μg。在一些实施方案中,mRNA构建体的总剂量是至少40μg。在一些实施方案中,mRNA构建体的总剂量是至少45μg。在一些实施方案中,mRNA构建体的总剂量是至少50μg。在一些实施方案中,mRNA构建体的总剂量是至少75μg。在一些实施方案中,mRNA构建体的总剂量是至少100μg。在一些实施方案中,mRNA构建体的总剂量是至少150μg。
在特定实施方案中,药物组合物中mRNA构建体的总剂量是约7.5μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约10μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约15μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约20μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约30μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约40μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约45μg。在另一个特定实施方案中,药物组合物中mRNA构建体的总剂量是约135μg。SARS-CoV-2 S蛋白的组合
在一些实施方案中,根据本发明的免疫原性组合物包含多于一种编码SARS-CoV-2刺突蛋白的优化核苷酸序列。在一些实施方案中,每种优化核苷酸序列编码SARS-CoV-2刺突蛋白的天然存在的变体。在一些实施方案中,这些优化核苷酸序列中的一种或多种编码已相对于天然存在的SARS-CoV-2刺突蛋白被修饰的SARS-CoV-2刺突蛋白。在具体实施方案中,所述修饰使SARS-CoV-2刺突蛋白稳定为其融合前构象,如上所详述。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:1、2、3、4、5、8、9、10、11、12、14、15、16、17、19、20、35、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、104、106、108、110、118、120、123、125、127、129、131、133、135、137、139或141,并且其中一种或多种另外的核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:151、153、155、157、159、161、163、165、167、169或171。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸编码包含SEQ ID NO:11的氨基酸序列;并且其中第二核酸包含编码氨基酸序列SEQ ID NO:157的优化核苷酸序列。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含与核酸序列SEQ ID NO:44至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:11的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44;并且其中第二核酸包含与核酸序列SEQ ID NO:156至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:157的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO 156。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸编码包含SEQ ID NO:11的氨基酸序列;并且其中第二核酸包含编码氨基酸序列SEQ ID NO:163的优化核苷酸序列。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含与核酸序列SEQ ID NO:44至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:11的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44;并且其中第二核酸包含与核酸序列SEQ ID NO:162至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:163的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO 162。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸编码包含SEQ ID NO:11的氨基酸序列;并且其中第二核酸包含编码氨基酸序列SEQ ID NO:167的优化核苷酸序列。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含与核酸序列SEQ ID NO:44至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:11的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44;并且其中第二核酸包含与核酸序列SEQ ID NO:166至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:167的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO 166。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸编码包含SEQ ID NO:11的氨基酸序列;并且其中第二核酸包含编码氨基酸序列SEQ ID NO:171的优化核苷酸序列。
在一些实施方案中,根据本发明的免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含与核酸序列SEQ ID NO:44至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:11的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44;并且其中第二核酸包含与核酸序列SEQ ID NO:170至少85%(例如,至少90%)相同并且编码包含SEQ ID NO:171的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO 170。
在一些实施方案中,根据本发明的免疫原性组合物包含至少三种、至少四种或至少五种核酸,用于预防SARS-CoV-2感染。适用时,第一、第二、第三、第四和第五核酸可以包封在同一脂质纳米颗粒中。可替代地,适用时,第一、第二、第三、第四和第五核酸可以包封在单独的脂质纳米颗粒中,然后将其混合在一起以形成根据本发明的药物组合物。
SARS-CoV-2抗原的组合
在一些实施方案中,根据本发明的药物组合物包含多于一种编码SARS-CoV-2抗原的优化核苷酸序列。在一些实施方案中,药物组合物可以包含第一核酸和第二核酸,第一核酸包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列,第二核酸包含编码SARS-CoV-2 M蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,药物组合物可以包含第一核酸和第二核酸,第一核酸包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列,第二核酸包含编码SARS-CoV-2 N蛋白或其抗原片段的优化核苷酸序列。在一些实施方案中,药物组合物可以包含第一核酸和第二核酸,第一核酸包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列,第二核酸包含编码SARS-CoV-2 E蛋白或其抗原片段的优化核苷酸序列。在其他实施方案中,药物组合物可以包含第一核酸和第二、第三和/或第四核酸,第一核酸包含编码SARS-CoV-2 S蛋白或其抗原片段的优化核苷酸序列,其中第二核酸包含编码SARS-CoV-2 M蛋白或其抗原片段的优化核苷酸序列,其中第三核酸包含编码SARS-CoV-2 N蛋白或其抗原片段的优化核苷酸序列,并且其中第四核酸包含编码SARS-CoV-2 E蛋白或其抗原片段的优化核苷酸序列。
适用时,第一、第二、第三和第四核酸可以包封在同一脂质纳米颗粒中。可替代地,适用时,第一、第二、第三和第四核酸可以包封在单独的脂质纳米颗粒中,然后将其混合在一起以形成根据本发明的药物组合物。
施用
典型地,根据本发明的药物组合物(例如,免疫原性组合物或疫苗)是肠胃外施用的,例如,通过静脉内、皮内、皮下或肌内途径。最常见的施用方式是肌内注射。可以通过注射施用,例如通过无针和/或针注射。
例如,使用含有阳离子脂质OF-Deg-Lin(Fenton等人(Adv Mater.2017;29(33)))的脂质纳米颗粒能够通过静脉注射成功地将包封的mRNA递送到脾脏。他们观察到总蛋白产量中的超过85%发生在脾脏。当他们分析测试动物的脾脏时,他们发现脂质纳米颗粒主要将包封的mRNA递送到B细胞和单核细胞/巨噬细胞群。一小百分比的mRNA似乎也被递送到嗜中性粒细胞和T细胞群。如本说明书的实施例中所示,包含具有由摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K组成的脂质组分的脂质纳米颗粒的药物组合物特别有效地引发针对被包封的一种或多种核酸的免疫反应,特别是当肌内施用时。
初免-加强免疫
在一些实施方案中,根据本发明的药物组合物施用一次。在一些实施方案中,根据本发明的药物组合物施用至少两次。
例如,先前尚未针对β-冠状病毒(例如,SARS-CoV-2)感染免疫的受试者的典型的初免-加强免疫典型地包括至少两种免疫。通常,这两种免疫接种是间隔施用的。因此,在一些实施方案中,根据本发明的药物组合物施用至少两次(例如,三次),间隔为2、3、4、5、6、7或8周。在一些实施方案中,根据本发明的药物组合物施用两次,间隔为2、3、4、5、6、7、8、9、10、11或12周。在典型的实施方案中,施用间隔是2周或4周(例如,1个月)。在其他实施方案中,施用间隔是11周或12周(例如,约3个月)。因此,在一个实施方案中,本发明提供了一种预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的方法,其中所述方法包括向受试者施用第一剂包含本发明mRNA构建体的免疫原性组合物和第二剂本发明免疫原性组合物,其中所述第一剂和第二剂的施用彼此间隔至少2周。在一个实施方案中,本发明提供了一种预防由β-冠状病毒(例如,SARS-CoV-2)引起的感染的方法,其中所述方法包括向受试者施用第一剂包含本发明mRNA构建体的免疫原性组合物和第二剂本发明免疫原性组合物,其中所述第一剂和第二剂的施用彼此间隔约3周。
有时,最初的初免-加强免疫之后是至少一次进一步的免疫,以刷新初始免疫系列的保护有效性。这种进一步的免疫典型地在最初的初免-加强免疫后几个月并且有时几年进行。因此,在一些实施方案中,在向受试者施用至少一剂用于预防β-冠状病毒(例如,表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒,诸如SARS-CoV-2)感染的免疫原性组合物之后3-18个月(例如,约9个月或约12个月),向受试者施用至少一次根据本发明的药物组合物。例如,受试者可能已接受至少一剂用于预防β-冠状病毒(例如,SARS-CoV-2)感染的免疫原性组合物,并且3-18个月(例如,约9个月或约12个月)后,向受试者施用本发明的药物组合物。更典型地,受试者可能已经接受两剂用于预防β-冠状病毒(例如,SARS-CoV-2)感染的免疫原性组合物,例如第一剂以及至少两周后的第二剂。在接受第二剂量后3-18个月,可以向受试者施用本发明的药物组合物。本发明药物组合物的施用通常可以在受试者接受第二剂用于预防β-冠状病毒(例如,SARS-CoV-2)感染的免疫原性组合物后至少9个月(例如,约12个月)进行。
在一些实施方案中,第一剂和第二剂可以是用于预防β-冠状病毒(例如,SARS-CoV-2)感染的免疫原性组合物,例如,引发针对SARS-CoV-2指标毒株S蛋白(SEQ ID NO:1)的中和抗体的疫苗。例如,所述疫苗可以包含编码全长SARS-CoV-2刺突蛋白的核酸,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为使残基986和987突变为脯氨酸以使全长SARS-CoV-2刺突蛋白稳定其融合前构象。引发中和抗体的疫苗包括本文公开的药物组合物(例如,本文公开的免疫原性组合物或疫苗)以及由以下生产的COVID-19疫苗:Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))和Novavax(NVX-CoV2373)。第一剂和第二剂可以包含相同的疫苗。第一剂和第二剂可以包含不同的疫苗。
在具体实施方案中,在3-18个月后施用的本发明药物组合物包含核酸(例如,mRNA),其包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸并且进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。在具体实施方案中,包含优化核苷酸序列的核酸(例如,mRNA)能够针对SARS-CoV-2的天然存在的变体(包括指标毒株(SEQ ID NO:1)以及在南非、日本、巴西、英国、印度和加利福尼亚观察到的变体)引发广泛的中和抗体反应。在一些实施方案中,包含优化核苷酸序列的核酸(例如,mRNA)能够针对SARS-CoV-1引发中和抗体反应。在特定实施方案中,包含优化核苷酸序列的核酸(例如,mRNA)能够针对表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒引发中和抗体反应。在一些实施方案中,所述刺突蛋白与SEQ ID NO:1至少75%(例如,至少80%、90%、95%或99%)相同。在特定实施方案中,所述核酸(例如,mRNA)包含编码包含SEQ ID NO:167的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:166。例如,所述mRNA的优化核苷酸序列可以具有核酸序列SEQ ID NO:173。
在一个特定实施方案中,在3-18个月后施用的本发明药物组合物包含至少两种核酸(例如,第一mRNA和第二mRNA),其中第一核酸(例如,第一mRNA)包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸;并且第二核酸(例如,第二mRNA)包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸并且进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。在具体实施方案中,包含第一mRNA和第二mRNA的药物组合物能够针对SARS-CoV-2的天然存在的变体(包括指标毒株(SEQ ID NO:1)以及在南非、日本、巴西、英国、印度和加利福尼亚观察到的变体)引发广泛的中和抗体反应。在一些实施方案中,包含第一mRNA和第二mRNA的药物组合物能够针对SARS-CoV-1引发中和抗体反应。在特定实施方案中,包含第一mRNA和第二mRNA的药物组合物能够针对表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒引发中和抗体反应。在一些实施方案中,所述刺突蛋白与SEQ ID NO:1至少75%(例如,至少80%、90%、95%或99%)相同。第一核酸可以包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQID NO:11的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44。第二核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQ ID NO:167的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:166。例如,第一mRNA的优化核苷酸序列可以具有核酸序列SEQ ID NO:148,其中第二mRNA的优化核苷酸序列可以具有核酸序列SEQ ID NO:173。典型地,所述至少两种核酸被包封在脂质纳米颗粒中。例如,第一核酸和第二核酸可以包封在同一脂质纳米颗粒。可替代地,第一核酸和第二核酸可以包封在单独的脂质纳米颗粒中。
如实施例中所示,先前已用针对SARS-CoV-2指标毒株S蛋白(SEQ ID NO:1)引发中和抗体的疫苗免疫并且在约9个月后施用包含编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的本发明优化核苷酸序列的mRNA疫苗的受试者能够有效针对由原始SARS-CoV-2毒株(SEQ ID NO:1)的天然存在的变体以及其他β-冠状病毒表达的各种各样的S蛋白,特别是表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的那些(诸如SARS-CoV-1)产生广泛的中和抗体反应。
因此,在一些实施方案中,本发明的药物组合物用于预防由β-冠状病毒,特别是表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒引起的感染。在一些实施方案中,本发明的药物组合物用于制造用于预防由β-冠状病毒,特别是表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒引起的感染的药剂。在一些实施方案中,所述刺突蛋白与SEQ ID NO:1至少75%(例如,至少80%、90%、95%或99%)相同。在典型的实施方案中,β-冠状病毒是SARS-CoV-2(例如,指标毒株(SEQ ID NO:1)的天然存在的变体,诸如南非变体、日本变体、巴西变体、英国变体、印度变体或加利福尼亚变体)。
在特定实施方案中,本发明提供了一种预防由SARS-CoV-2引起的感染的方法,其中所述方法包括向受试者施用有效量的包含mRNA构建体的免疫原性组合物,其中所述mRNA构建体包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ IDNO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸并且进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变,其中在受试者用第一COVID-19疫苗和第二COVID-19疫苗免疫之后至少3个月(例如,约6个月、约9个月或约12个月)向受试者施用所述免疫原性组合物,其中向受试者施用所述第一和第二COVID-19疫苗,彼此间隔至少两周,并且其中所述第一和第二COVID-19疫苗被设计为针对SARS-CoV-2 S蛋白(例如,SARS-CoV-2指标毒株S蛋白(SEQ ID NO:1))引发中和抗体。在一些实施方案中,第一和第二COVID-19疫苗相同。在其他实施方案中,所述第一和第二疫苗不同。在具体实施方案中,所述第一和第二COVID-19疫苗由以下产生:Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))或Novavax(NVX-CoV2373)。
在一些实施方案中,所述免疫原性组合物能够针对SARS-CoV-2的天然存在的变体(包括指标毒株(SEQ ID NO:1)以及在南非、日本、巴西、英国、印度和加利福尼亚观察到的变体)引发广泛的中和抗体反应。在一些实施方案中,所述免疫原性组合物能够针对SARS-CoV-1引发中和抗体反应。在具体实施方案中,所述免疫原性组合物能够针对表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的β-冠状病毒引发中和抗体反应。在具体实施方案中,所述刺突蛋白与SEQ ID NO:1至少75%(例如,至少80%、90%、95%或99%)相同。在具体实施方案中,所述优化核苷酸序列编码包含SEQ ID NO:167的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:173。在特定实施方案中,所述mRNA构建体是mRNA构建体2。在具体实施方案中,所述mRNA构建体被包封在脂质纳米颗粒中,所述脂质纳米颗粒具有由以下组成的脂质组分:cKK-E10、DOPE、胆固醇和DMG-PEG2K,例如摩尔比为40:30:28.5:1.5。在一些实施方案中,所述免疫原性组合物包含7μg与135μg之间的mRNA构建体,例如7.5μg、15μg、45μg或135μg。
本发明的进一步示例性实施方案
在一方面,本发明提供了一种核酸,所述核酸包含编码SARS-CoV-2抗原的优化核苷酸序列,其中所述优化核苷酸序列由与大于或等于10%的使用频率相关的密码子组成;其中所述优化核苷酸序列:
(i)不含具有以下核苷酸序列之一的终止信号:
5’-X1ATCTX2TX3-3’,其中X1、X2和X3独立地选自A、C、T或G;以及5’-X1AUCUX2UX3-3’,其中X1、X2和X3独立地选自A、C、U或G;
(ii)不含任何负顺式调控元件和负重复元件;以及
(iii)具有大于0.8的密码子适应指数;
其中当分成不重叠的30个核苷酸长的部分时,所述优化核苷酸序列的每个部分具有30%-70%的鸟嘌呤胞嘧啶含量范围。
在某些实施方案中,所述优化核苷酸序列不含具有以下序列之一的终止信号:TATCTGTT;TTTTTT;AAGCTT;GAAGAGC;TCTAGA;UAUCUGUU;UUUUUU;AAGCUU;GAAGAGC;UCUAGA。在某些实施方案中,所述核酸是mRNA或DNA。
在以下中,经修饰的SARS-CoV-2刺突蛋白或其抗原片段通过参考特定优化的核酸序列来描述。应当理解,尽管这些经修饰的SARS-CoV-2刺突蛋白或抗原片段在本发明公开的基于核酸的疫苗的上下文中可能具有特定的效用,但它们也可能在基于蛋白质的疫苗中具有效用。此外,优化核酸序列也可用于高效生产此类基于蛋白质的疫苗。
在某些方面,本发明的核酸是编码SARS-CoV-2刺突蛋白或其抗原片段的优化核苷酸序列。在某些实施方案中,优化核苷酸序列编码全长SARS-CoV-2刺突蛋白。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:1的氨基酸序列。在其他实施方案中,本发明的核酸是编码SARS-CoV-2刺突蛋白的膜外结构域或其抗原片段的优化核苷酸序列。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:2的氨基酸序列。在某些实施方案中,所述抗原片段包含所述SARS-CoV-2刺突蛋白的受体结合结构域(RBD)。在特定实施方案中,优化核苷酸测序编码包含SEQ ID NO:6的氨基酸序列。
在某些实施方案中,所述抗原片段进一步包含信号序列。在某些实施方案中,信号序列是SEQ ID NO:7。在其他实施方案中,本发明的优化核苷酸序列编码包含SEQ ID NO:8的氨基酸序列。在某些实施方案中,信号序列是SEQ ID NO:142。在其他实施方案中,本发明的优化核苷酸序列编码包含SEQ ID NO:143的氨基酸序列。在本发明的进一步方面,所述抗原片段可以包含另外的Fc区。在特定实施方案中,Fc区具有氨基酸序列SEQ ID NO:18。在某些实施方案中,所述抗原片段进一步包含信号序列和Fc区。
在某些实施方案中,所述抗原片段由可操作地连接至信号序列和Fc区的SARS-CoV-2刺突蛋白的RBD组成。在具体实施方案中,优化核苷酸序列编码包含SEQ ID NO:20的氨基酸序列。
在其他实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或其抗原片段已被修饰为形成稳定的融合前构象。在某些实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除激活所需的弗林蛋白酶切割位点.在特定实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除激活所需的弗林蛋白酶切割位点。在进一步的特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:9的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基985突变为脯氨酸和/或使残基986和987突变为脯氨酸。在特定实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基986和987突变为脯氨酸。在进一步的特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:10的氨基酸序列。在进一步的特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:118的氨基酸序列。
在某些实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基985、986和987突变为脯氨酸。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:92的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使(a)残基985突变为脯氨酸;和/或(b)残基986和987突变为脯氨酸。在特定实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸。在某些实施方案中,所述优化核苷酸序列编码SARS-CoV-2 S蛋白。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:11的氨基酸序列。例如,优化核苷酸序列具有核酸序列SEQ ID NO:44或SEQ ID NO:148。在进一步的特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:120的氨基酸序列。例如,优化核苷酸序列编码SARS-CoV-2 S蛋白膜外结构域。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:12的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、SARS-CoV-2刺突蛋白膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基985、986和987突变为脯氨酸。在特定实施方案中,优化核苷酸序列编码SARS-CoV-2 S蛋白。在进一步的特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:94的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于已被修饰为使残基986和987突变为脯氨酸并且含有D614G突变。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:118的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且含有D614G突变。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:120的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基817、892、899、942、986和987突变为脯氨酸。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:129的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基817、892、899、942、986和987突变为脯氨酸。在特定实施方案中,优化核苷酸序列编码包含SEQ IDNO:131的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基817、892、899、942、986和987突变为脯氨酸,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有D614G突变。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:133的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基817、892、899、942、986和987突变为脯氨酸并且含有D614G突变。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:135的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且含有延伸的N-末端信号肽。在特定实施方案中,优化核苷酸序列编码包含SEQID NO:123的氨基酸序列。在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基817、892、899、942、986和987突变为脯氨酸并且其含有延伸的N-末端信号肽。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:137的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为ER回收信号突变。在某些实施方案中,其中SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且去除ER回收信号。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:125的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸、去除ER回收信号并且其含有延伸的N-末端信号肽。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:127的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基817、892、899、942、986和987突变为脯氨酸并且去除ER回收信号。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:139的氨基酸序列。
在某些实施方案中,SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基817、892、899、942、986和987突变为脯氨酸、去除ER回收信号并且其含有延伸的N-末端信号肽。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:141的氨基酸序列。
在某些实施方案中,抗原片段包含SARS-CoV-2刺突蛋白S1、S2或S2’亚基或由其组成。在某些实施方案中,优化核苷酸序列编码包含SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列。
在某些实施方案中,优化核苷酸序列编码包含SARS-CoV-2 S蛋白的一个或多个抗原片段的融合肽。在特定实施方案中,SARS-CoV-2 S蛋白的一个或多个抗原片段具有氨基酸序列SEQ ID NO:21、氨基酸序列SEQ ID NO:22、氨基酸序列SEQ ID NO:23和/或氨基酸序列SEQ ID NO:24。
在某些实施方案中,所述一个或多个抗原片段通过接头序列连接,所述接头序列例如GGGGS。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:25或SEQ ID NO:27的融合肽。在某些实施方案中,所述融合肽包含N末端信号序列,例如,所述优化核苷酸序列编码包含SEQ ID NO:51或SEQ ID NO:53的融合肽。在某些实施方案中,所述融合肽包含C-末端Fc结构域。在其他实施方案中,所述融合肽包含N末端信号序列和C-末端Fc结构域。在特定实施方案中,优化核苷酸序列编码包含SEQ ID NO:55或SEQ ID NO:57的融合肽。
在其他方面,如上公开的本发明核酸用于疗法。例如,如上公开的本发明核酸可以用于制造用于预防SARS-CoV-2感染的药剂。在其他方面,提供了免疫原性组合物,所述免疫原性组合物包含用于预防an SARS-CoV-2感染的本发明核酸。本发明还提供了治疗或预防SARS-CoV-2感染的方法,所述方法包括向受试者施用有效量的包含本发明核酸的免疫原性组合物。
在其他方面,提供了根据本发明的免疫原性组合物,所述免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:1、2、3、4、5、8、9、10、11、12、14、15、16、17、19、20、35、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、104、106、108、110、118、120、123、125、127、129、131、133、135、137、139或141,并且其中一种或多种另外的核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:151、153、155、157、159、161、163、165、167、169或171。
在其他方面,提供了根据本发明的免疫原性组合物,所述免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含编码包含SEQ ID NO:11的氨基酸序列的优化核苷酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44,并且其中一种或多种另外的核酸选自:
(a)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:
157的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID
NO 156,以及
(b)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:
163的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID
NO:162;以及
(c)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:
167的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID
NO:166;以及
(d)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:
171的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID
NO:170。
在某些方面,本发明提供了一种药物组合物,所述药物组合物包含i)本发明的核酸,和ii)脂质纳米颗粒。在某些实施方案中,所述核酸被包封在脂质纳米颗粒中。所述脂质纳米颗粒可以包含以下中的一种或多种:阳离子脂质、非阳离子脂质、基于胆固醇的脂质、PEG修饰的脂质或其组合。在某些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
在某些实施方案中,所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质和PEG修饰的脂质。在某些实施方案中,所述脂质纳米颗粒包含:
(a)阳离子脂质,其选自DOTAP(1,2-二油烯基-3-三甲基铵丙烷)、DODAP(1,2-二油烯基-3-二甲基铵丙烷)、DOTMA(N-[l-(2,3-二油烯基氧基)丙基]-N,N,N-三甲基氯化铵)、DLinKC2DMA、DLin-KC2-DM、C12-200、cKK-E12、cKK-E10、HGT5000、HGT5001、HGT4003、ICE、HGT4001、HGT4002、TL1-01D-DMA、TL1-04D-DMA、TL1-08D-DMA、TL1-10D-DMA、OF-Deg-Lin和OF-02;
(b)非阳离子脂质,其选自DSPC(1,2-二硬脂酰-sn-甘油-3-磷酸胆碱)、DPPC(1,2-二棕榈酰-sn-甘油-3-磷酸胆碱)、DOPE(1,2-二油烯基-sn-甘油-3-磷酸乙醇胺)、DEPE 1,2-二瓢儿菜基-sn-甘油-3-磷酸乙醇胺、DOPC(1,2-二油烯基-sn-甘油-3-磷脂酰胆碱)、DPPE(1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺)、DMPE(1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺)和DOPG(1,2-二油烯基-sn-甘油-3-磷酸-(1’-外消旋-甘油));
(c)基于胆固醇的脂质,其选自DC-Choi(N,N-二甲基-N-乙基甲酰胺基胆固醇)、l,4-双(3-N-油烯基氨基-丙基)哌嗪、或咪唑胆固醇酯(ICE);和/或
(d)PEG修饰的脂质,其选自聚乙二醇化胆固醇和DMG-PEG-2K。
在药物组合物的某些实施方案中,
a.所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;
b.所述非阳离子脂质选自DOPE和DEPE;
c.所述基于胆固醇的脂质是胆固醇;以及
d.所述PEG修饰的脂质是DMG-PEG-2K。
在某些实施方案中,阳离子脂质占所述脂质纳米颗粒的按摩尔比计约30%-60%,例如约35%-40%。在某些实施方案中,阳离子脂质与非阳离子脂质与基于胆固醇的脂质与PEG修饰的脂质的比率是按摩尔比计大约30-60:25-35:20-30:1-15,或其中阳离子脂质与非阳离子脂质与PEG修饰的脂质的比率是按摩尔比计大约55-65:30-40:1-15。
在某些实施方案中,所述脂质纳米颗粒包含以下的组合:阳离子脂质、非阳离子脂质、PEG修饰的脂质和任选地胆固醇,所述胆固醇选自cKK-E12、DOPE、胆固醇和DMG-PEG2K;cKK-E10、DOPE、胆固醇和DMG-PEG2K;OF-Deg-Lin、DOPE、胆固醇和DMG-PEG2K;OF-02、DOPE、胆固醇和DMG-PEG2K;TL1-01D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-04D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-08D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-10D-DMA、DOPE、胆固醇和DMG-PEG2K;ICE、DOPE和DMG-PEG2K;HGT4001、DOPE和DMG-PEG2K;或HGT4002、DOPE和DMG-PEG2K。
在某些实施方案中,所述脂质纳米颗粒的平均尺寸小于150nm,例如小于100nm。在特定实施方案中,所述脂质纳米颗粒的平均尺寸为约50-70nm,例如约55-65nm。
在某些实施方案中,脂质纳米颗粒悬浮在注射用水中的10%海藻糖中。在某些实施方案中,所述核酸是浓度在约0.5mg/mL至约1.0mg/mL之间的mRNA。
在某些方面,本发明提供了一种药物组合物,所述药物组合物包含i)本发明的优化核酸(例如,mRNA),和ii)脂质纳米颗粒。此类药物组合物用于治疗或预防SARS-CoV-2感染。在某些实施方案中,所述药物组合物是肠胃外施用的。在某些实施方案中,所述药物组合物是静脉内、皮内、皮下或肌内施用的。在特定实施方案中,所述药物组合物是静脉内或肌内施用的。
在某些实施方案中,所述药物组合物施用至少一次。在特定实施方案中,所述药物组合物施用至少两次。在更特定实施方案中,施用之间的时间段是至少2周,例如1个月。在一些实施方案中,施用之间的时间段是约3周。
在某些方面,本发明提供了SARS-CoV-2抗原。例如,SARS-CoV-2抗原可以是参考特定优化的核酸序列在上文所述或在下文更详细描述的SARS-CoV-2刺突蛋白、抗原片段或抗原片段融合肽中的任一种。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:1或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:10或由其组成的多肽。。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:9或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:11或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:2或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:12或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:3或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:8或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:20或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:17或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:14或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:16或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:66或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:15或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:82或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:84或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:74或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:76或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:78或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:80或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:68或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:70或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:96或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:86或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:88或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:90或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:92或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:94或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:118或由其组成的多肽。在一些实施方案中,SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:120或由其组成的多肽。
在进一步的方面,本发明提供了一种肽融合构建体,所述肽融合构建体包含SARS-CoV-2 S蛋白的一个或多个抗原区,其中所述一个或多个抗原区包含以下组分或由其组成:FP、D1、D2和/或B1,其中FP包含所述SARS-CoV-2 S蛋白的残基815-833,其中D1包含所述SARS-CoV-2 S蛋白的残基820-846,其中D2包含所述SARS-CoV-2 S蛋白的残基1078-1111,并且其中B1包含所述SARS-CoV-2 S蛋白的残基798-829。所述肽融合构建体可以具有以下结构:D1-接头-FP-接头-D2-接头-D1。D1可以具有序列SEQ ID NO:22。FP可以具有序列SEQID NO:21。所述接头包含氨基酸序列GGGGS或由其组成。例如,所述肽融合构建体可以包含序列SEQ ID NO:25或51、55或由其组成。可替代地,肽融合构建体可以具有以下结构:FP-接头-FP-接头-FP、D1-接头-D1-接头-D1或FP/D1-接头-FP/D1-接头-FP/D1。FP/D1部分可以具有序列SEQ ID NO:99。所述接头可以包含氨基酸序列GGGGS或由其组成。例如,所述肽融合构建体可以包含序列SEQ ID NO:27或53、57或由其组成。
本发明还提供了一种药物组合物,所述药物组合物包含本发明的SARS-CoV-2抗原或肽融合构建体。在一些实施方案中,所述药物组合物进一步包含佐剂。在某些实施方案中,所述佐剂选自铝佐剂(alum)、CpG、PolyI:C、MF59、AS01、AS02、AS03、AS04、AF03、鞭毛蛋白、ISCOM和ISCOMMATRIX。在一些方面,所述药物组合物用于治疗或预防SARS-CoV-2感染。在一些实施方案中,所述药物组合物是肠胃外施用的。在一些实施方案中,所述药物组合物是皮内、皮下或肌内施用的。在一些实施方案中,所述药物组合物是肌内施用的。在一些实施方案中,所述药物组合物施用至少一次。在一些实施方案中,所述药物组合物施用至少两次。在一些实施方案中,施用之间的时间段是至少2周,例如1个月。在一些实施方案中,施用之间的时间段是约3周。
在具体实施方案中,本发明提供了一种mRNA构建体,所述mRNA构建体由以下结构元件组成:
(i)具有以下结构的5’帽:
(ii)具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
(iii)具有核酸序列SEQ ID NO:148的蛋白质编码区;
(iv)具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
(v)聚A尾。
在特定实施方案中,本发明提供了包封所述mRNA构建体的脂质纳米颗粒。脂质纳米颗粒可以包含阳离子脂质(例如,cKK-E12、cKK-E10、OF-Deg-Lin或OF-02)、非阳离子脂质(例如,DOPE或DEPE)、基于胆固醇的脂质(例如,胆固醇)和PEG修饰的脂质(例如,DMG-PEG-2K)。在具体实施方案中,mRNA构建体或包封它的脂质纳米颗粒提供为免疫原性组合物。在一些实施方案中,所述免疫原性组合物包含10μg与200μg之间的一种或多种mRNA构建体。在具体实施方案中,所述免疫原性组合物包含15μg与135μg之间(例如,15μg与45μg之间)的mRNA构建体。在一些实施方案中,所述免疫原性组合物可以包含至少20μg、至少25μg、至少30μg、至少35μg、至少40μg、或至少45μg的mRNA构建体。在特定实施方案中,所述免疫原性组合物包含15μg、45μg或135μg的mRNA构建体。本发明进一步提供了一种治疗或预防SARS-CoV-2感染的方法,其中所述方法包括向受试者施用有效量的免疫原性组合物。在一些实施方案中,向受试者至少两次施用免疫原性。在一些实施方案中,施用之间的时间段是至少2周。在一些实施方案中,施用之间的时间段是约3周。
在某些实施方案中,通过以下编号的实施方案进一步描述本发明:
1.一种核酸,所述核酸包含编码SARS-CoV-2抗原的优化核苷酸序列,其中所述优化核苷酸序列由与大于或等于10%的使用频率相关的密码子组成;其中所述优化核苷酸序列:
(i)不含具有以下核苷酸序列之一的终止信号:
5’-X1ATCTX2TX3-3’,其中X1、X2和X3独立地选自A、C、T或G;以及5’-X1AUCUX2UX3-3’,其中X1、X2和X3独立地选自A、C、U或G;
(ii)不含任何负顺式调控元件和负重复元件;以及
(iii)具有大于0.8的密码子适应指数;
其中当分成不重叠的30个核苷酸长的部分时,所述优化核苷酸序列的每个部分具有30%-70%的鸟嘌呤胞嘧啶含量范围。
2.根据实施方案1所述的核酸,其中所述优化核苷酸序列不含具有以下序列之一的终止信号:TATCTGTT;TTTTTT;AAGCTT;GAAGAGC;TCTAGA;UAUCUGUU;UUUUUU;AAGCUU;GAAGAGC;UCUAGA。
3.根据实施方案1或2所述的核酸,其中所述核酸是mRNA。
4.根据实施方案1或2所述的核酸,其中所述核酸是DNA。
5.根据前述实施方案中任一项所述的核酸,其中所述优化核苷酸序列编码所述SARS-CoV-2刺突蛋白或其抗原片段。
6.根据实施方案5所述的核酸,其中所述优化核苷酸序列编码所述全长SARS-CoV-2刺突蛋白。
7.根据实施方案5或实施方案6所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:1的氨基酸序列。
8.根据实施方案5所述的核酸,其中所述优化核苷酸序列编码所述SARS-CoV-2刺突蛋白的膜外结构域或其抗原片段。
9.根据实施方案8所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:2的氨基酸序列。
10.根据实施方案5所述的核酸,其中所述抗原片段包含所述SARS-CoV-2刺突蛋白的受体结合结构域(RBD)。
11.根据实施方案10所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:6的氨基酸序列。
12.根据实施方案10或11所述的核酸,其中所述抗原片段进一步包含信号序列。
13.根据实施方案12所述的核酸,其中所述信号序列是SEQ ID NO:7。
14.根据实施方案12或实施方案13所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:8的氨基酸序列。
15.根据实施方案12所述的核酸,其中所述信号序列是SEQ ID NO:142。
16.根据实施方案12或实施方案13所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:143的氨基酸序列。
17.根据实施方案10-16所述的核酸,其中所述抗原片段进一步包含Fc区。
18.根据实施方案17所述的核酸,其中所述Fc区是SEQ ID NO:18。
19.根据实施方案10-18所述的核酸,其中所述抗原片段进一步包含信号序列和Fc区。
20.根据实施方案10-18所述的核酸,其中所述抗原片段由可操作地连接至信号序列和Fc区的所述SARS-CoV-2刺突蛋白的RBD组成。
21.根据实施方案20所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:20的氨基酸序列。
22.根据实施方案5、实施方案6或实施方案8中任一项所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为呈现稳定的融合前构象。
23.根据实施方案22所述的核酸,其中所述SARS-CoV-2刺突蛋白、所述膜外结构域或所述抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除激活所需的弗林蛋白酶切割位点。
24.根据实施方案23所述的核酸,其中所述优化核苷酸序列编码SARS-CoV-2刺突蛋白,所述刺突蛋白相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除激活所需的弗林蛋白酶切割位点。
25.根据实施方案23所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:9的氨基酸序列。
26.根据实施方案22-25所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基985突变为脯氨酸和/或使残基986和987突变为脯氨酸。
27.根据实施方案26所述的核酸,其中所述优化核苷酸序列编码SARS-CoV-2刺突蛋白,所述刺突蛋白相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基986和987突变为脯氨酸。
28.根据实施方案27所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:10或SEQ ID NO:118的氨基酸序列。
29.根据实施方案26所述的核酸,其中所述优化核苷酸序列编码SARS-CoV-2刺突蛋白,所述刺突蛋白相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基985、986和987突变为脯氨酸。
30.根据实施方案29所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:92的氨基酸序列。
31.根据实施方案22-30所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使
(a)残基985突变为脯氨酸;和/或
(b)残基986和987突变为脯氨酸。
32.根据实施方案31所述的核酸,其中所述SARS-CoV-2刺突蛋白、所述SARS-CoV-2刺突蛋白的膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸。
33.根据实施方案32所述的核酸,其中所述优化核苷酸序列编码SARS-CoV-2刺突蛋白。
34.根据实施方案33所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:11的氨基酸序列或SEQ ID NO:120,任选地其中所述优化核苷酸序列具有核酸序列SEQ IDNO:44或SEQ ID NO:148。
35.根据实施方案32所述的核酸,其中所述优化核苷酸序列编码所述SARS-CoV-2刺突蛋白的膜外结构域。
36.根据实施方案35所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:12的氨基酸序列。
37.根据实施方案31所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基985、986和987突变为脯氨酸。
38.根据实施方案37所述的核酸,其中所述优化核苷酸序列编码SARS-CoV-2刺突蛋白。
39.根据实施方案38所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:94的氨基酸序列。
40.根据实施方案22-39所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于已被修饰为使残基986和987突变为脯氨酸并且含有D614G突变。
41.根据实施方案40所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:118的氨基酸序列。
42.根据实施方案22-41所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且含有D614G突变。
43.根据实施方案42所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:120的氨基酸序列。
44.根据实施方案22-43所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基817、892、899、942、986和987突变为脯氨酸。
45.根据实施方案44所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:129的氨基酸序列。
46.根据实施方案22-45所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基817、892、899、942、986和987突变为脯氨酸。
47.根据实施方案46所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:131的氨基酸序列。
48.根据实施方案22-47所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使残基817、892、899、942、986和987突变为脯氨酸,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有D614G突变。
49.根据实施方案48所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:133的氨基酸序列。
50.根据实施方案22-49所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基817、892、899、942、986和987突变为脯氨酸,并且述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有D614G突变。
51.根据实施方案50所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:135的氨基酸序列。
52.根据实施方案22-51所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、以使残基986和987突变为脯氨酸,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有延伸的N-末端信号肽。
53.根据实施方案52所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:123的氨基酸序列。
54.根据实施方案22-53所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、以使残基817、892、899、942、986和987突变为脯氨酸,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有延伸的N-末端信号肽。
55.根据实施方案54所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:137的氨基酸序列。
56.根据实施方案22-55所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为使ER回收信号突变。
57.根据实施方案56所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、以使残基986和987突变为脯氨酸并且去除ER回收信号。
58.根据实施方案57所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:125的氨基酸序列。
59.根据实施方案56所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸、去除ER回收信号,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有延伸的N-末端信号肽。
60.根据实施方案59所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:127的氨基酸序列。
61.根据实施方案56所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基817、892、899、942、986和987突变为脯氨酸并且去除ER回收信号。
62.根据实施方案61所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:139的氨基酸序列。
63.根据实施方案56所述的核酸,其中所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基817、892、899、942、986和987突变为脯氨酸、去除ER回收信号,并且所述SARS-CoV-2刺突蛋白、其膜外结构域或其抗原片段含有延伸的N-末端信号肽。
64.根据实施方案63所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:141的氨基酸序列。
65.根据实施方案5所述的核酸,其中所述抗原片段包含所述SARS-CoV-2刺突蛋白的S1、S2或S2’亚基或由其组成。
66.根据实施方案65所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列。
67.根据实施方案1-4所述的核酸,其中所述优化核苷酸序列编码融合肽,所述融合肽包含所述SARS-CoV-2刺突蛋白的一个或多个抗原片段。
68.根据实施方案67所述的核酸,其中所述SARS-CoV-2刺突蛋白的一个或多个抗原片段具有氨基酸序列SEQ ID NO:21、氨基酸序列SEQ ID NO:22、氨基酸序列SEQ ID NO:23和/或氨基酸序列SEQ ID NO:24。
69.根据实施方案67或68所述的核酸,其中所述一个或多个抗原片段通过接头序列连接,所述接头序列例如GGGGS。
70.根据实施方案69所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:25或SEQ ID NO:27的融合肽。
71.根据实施方案67-70所述的核酸,其中所述融合肽包含N末端信号序列。
72.根据实施方案71所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:51或SEQ ID NO:53的融合肽。
73.根据实施方案67-72所述的核酸,其中所述融合肽包含C-末端Fc结构域。
74.根据实施方案67-73所述的核酸,其中所述融合肽包含N末端信号序列和C-末端Fc结构域。
75.根据实施方案74所述的核酸,其中所述优化核苷酸序列编码包含SEQ ID NO:55或SEQ ID NO:57的融合肽。
76.根据实施方案1至75中任一项所述的核酸,所述核酸用于疗法。
77.一种免疫原性组合物,所述免疫原性组合物包含根据实施方案1-76中任一项所述的核酸,用于预防SARS-CoV-2感染。
78.一种治疗或预防SARS-CoV-2感染的方法,所述方法包括向受试者施用有效量的免疫原性组合物,所述免疫原性组合物包含根据实施方案1-76中任一项所述的核酸。
79.一种药物组合物,所述药物组合物包含i)根据实施方案1-76中任一项所述的核酸,和ii)脂质纳米颗粒。
80.根据实施方案79所述的药物组合物,其中所述核酸被包封在所述脂质纳米颗粒中。
81.根据实施方案79或实施方案80所述的药物组合物,其中所述脂质纳米颗粒包含以下中的一种或多种:阳离子脂质、非阳离子脂质、基于胆固醇的脂质、PEG修饰的脂质或其组合。
82.根据实施方案81所述的药物组合物,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
83.根据实施方案79所述的药物组合物,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、和PEG修饰的脂质。
84.根据实施方案79-83中任一项所述的药物组合物,其中所述脂质纳米颗粒包含:
a.阳离子脂质,其选自DOTAP(1,2-二油烯基-3-三甲基铵丙烷)、DODAP(1,2-二油烯基-3-二甲基铵丙烷)、DOTMA(N-[l-(2,3-二油烯基氧基)丙基]-N,N,N-三甲基氯化铵)、DLinKC2DMA、DLin-KC2-DM、C12-200、cKK-E12、cKK-E10、HGT5000、HGT5001、HGT4003、ICE、HGT4001、HGT4002、TL1-01D-DMA、TL1-04D-DMA、TL1-08D-DMA、TL1-10D-DMA、OF-Deg-Lin和OF-02;
b.非阳离子脂质,其选自DSPC(1,2-二硬脂酰-sn-甘油-3-磷酸胆碱)、DPPC(1,2-二棕榈酰-sn-甘油-3-磷酸胆碱)、DOPE(1,2-二油烯基-sn-甘油-3-磷酸乙醇胺)、DEPE 1,2-二瓢儿菜基-sn-甘油-3-磷酸乙醇胺、DOPC(1,2-二油烯基-sn-甘油-3-磷脂酰胆碱)、DPPE(1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺)、DMPE(1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺)和DOPG(1,2-二油烯基-sn-甘油-3-磷酸-(1’-外消旋-甘油));
c.基于胆固醇的脂质,其选自DC-Choi(N,N-二甲基-N-乙基甲酰胺基胆固醇)、l,4-双(3-N-油烯基氨基-丙基)哌嗪、或咪唑胆固醇酯(ICE);和/或
d.PEG修饰的脂质,其选自聚乙二醇化胆固醇和DMG-PEG-2K。
85.根据实施方案82所述的药物组合物,其中
a.所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;
b.所述非阳离子脂质选自DOPE和DEPE;
c.所述基于胆固醇的脂质是胆固醇;以及
d.所述PEG修饰的脂质是DMG-PEG-2K。
86.根据实施方案79-85中任一项所述的药物组合物,其中阳离子脂质占所述脂质纳米颗粒的按摩尔比计约30%-60%,例如约35%-40%。
87.根据实施方案79-86中任一项所述的药物组合物,其中阳离子脂质与非阳离子脂质与基于胆固醇的脂质与PEG修饰的脂质的比率是按摩尔比计大约30-60:25-35:20-30:1-15,或其中阳离子脂质与非阳离子脂质与PEG修饰的脂质的比率是按摩尔比计大约55-65:30-40:1-15。
88.根据实施方案79-87中任一项所述的药物组合物,其中所述脂质纳米颗粒包含以下的组合:阳离子脂质、非阳离子脂质、PEG修饰的脂质和任选地胆固醇,所述胆固醇选自cKK-E12、DOPE、胆固醇和DMG-PEG2K;cKK-E10、DOPE、胆固醇和DMG-PEG2K;OF-Deg-Lin、DOPE、胆固醇和DMG-PEG2K;OF-02、DOPE、胆固醇和DMG-PEG2K;TL1-01D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-04D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-08D-DMA、DOPE、胆固醇和DMG-PEG2K;TL1-10D-DMA、DOPE、胆固醇和DMG-PEG2K;ICE、DOPE和DMG-PEG2K;HGT4001、DOPE和DMG-PEG2K;或HGT4002、DOPE和DMG-PEG2K。
89.根据实施方案79-88中任一项所述的药物组合物,其中所述脂质纳米颗粒的平均尺寸小于150nm,例如小于100nm。
90.根据实施方案89所述的药物组合物,其中所述脂质纳米颗粒的平均尺寸为约50-70nm,例如约55-65nm。
91.根据实施方案79-90中任一项所述的药物组合物,其中所述脂质纳米颗粒悬浮在注射用水中的10%海藻糖中。
92.根据实施方案79-91中任一项所述的药物组合物,其中所述核酸是浓度在约0.5mg/mL至约1.0mg/mL之间的mRNA。
93.根据实施方案79-92中任一项所述的药物组合物,所述药物组合物治疗或预防SARS-CoV-2感染。
94.根据实施方案79-93所述的用于所述用途的药物组合物,其中所述药物组合物是肠胃外施用的。
95.根据实施方案79-93所述的用于所述用途的药物组合物,其中所述药物组合物是静脉内、皮内、皮下或肌内施用的。
96.根据实施方案95所述的用于所述用途的药物组合物,其中所述药物组合物是静脉内施用的。
97.根据实施方案95所述的用于所述用途的药物组合物,其中所述药物组合物是肌内施用的。
98.根据实施方案79-97中任一项所述的用于所述用途的药物组合物,其中所述药物组合物施用至少一次。
99.根据实施方案98所述的用于所述用途的药物组合物,其中所述药物组合物施用至少两次。
100.根据实施方案99所述的用于所述用途的药物组合物,其中施用之间的时间段是至少2周,例如3周或1个月。
101.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:1或由其组成的多肽。
102.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:10或由其组成的多肽。
103.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:9或由其组成的多肽。
104.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:11或由其组成的多肽。
105.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:2或由其组成的多肽。
106.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:12或由其组成的多肽。
107.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:3或由其组成的多肽。
108.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:8或由其组成的多肽。
109.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:20或由其组成的多肽。
110.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:17或由其组成的多肽。
111.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:14或由其组成的多肽。
112.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:16或由其组成的多肽。
113.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:66或由其组成的多肽。
114.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:15或由其组成的多肽。
115.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:82或由其组成的多肽。
116.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:84或由其组成的多肽。
117.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:74或由其组成的多肽。
118.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:76或由其组成的多肽。
119.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:78或由其组成的多肽。
120.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:80或由其组成的多肽。
121.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:68或由其组成的多肽。
122.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:70或由其组成的多肽。
123.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:96或由其组成的多肽。
124.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:86或由其组成的多肽。
125.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:88或由其组成的多肽。
126.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:90或由其组成的多肽。
127.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:92或由其组成的多肽。
128.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:94或由其组成的多肽。
129.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:118或由其组成的多肽。
130.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:120或由其组成的多肽。
131.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:123或由其组成的多肽。
132.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:125或由其组成的多肽。
133.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:127或由其组成的多肽。
134.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:129或由其组成的多肽。
135.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:131或由其组成的多肽。
136.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:133或由其组成的多肽。
137.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:135或由其组成的多肽。
138.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:139或由其组成的多肽。
139.一种SARS-CoV-2抗原,其中所述SARS-CoV-2抗原是包含氨基酸序列SEQ IDNO:141或由其组成的多肽。
140.一种肽融合构建体,所述肽融合构建体包含SARS-CoV-2 S蛋白的一个或多个抗原区,其中所述一个或多个抗原区包含以下组分或由其组成:FP、D1、D2和/或B1,其中FP包含所述SARS-CoV-2 S蛋白的残基815-833,其中D1包含所述SARS-CoV-2 S蛋白的残基820-846,其中D2包含所述SARS-CoV-2 S蛋白的残基1078-1111,并且其中B1包含所述SARS-CoV-2 S蛋白的残基798-829。
141.根据实施方案140所述的肽融合构建体,其中所述肽融合构建体具有以下结构:D1-接头-FP-接头-D2-接头-D1。
142.根据实施方案141所述的肽融合构建体,其中D1具有序列SEQ ID NO:22。
143.根据实施方案140或141所述的肽融合构建体,其中FP具有序列SEQ ID NO:21。
144.根据实施方案140、141和142中任一项所述的肽融合构建体,其中所述接头包含氨基酸序列GGGGS或由其组成。
145.根据实施方案140-144中任一项所述的肽融合构建体,所述肽融合构建体包含序列SEQ ID NO:25或51、55或由其组成。
146.根据实施方案140所述的肽融合构建体,其中所述肽融合构建体具有以下结构:FP-接头-FP-接头-FP、D1-接头-D1-接头-D1或FP/D1-接头-FP/D1-接头-FP/D1。
147.根据实施方案146所述的肽融合构建体,其中所述FP/D1部分具有序列SEQ IDNO:99。
148.根据实施方案146或147所述的肽融合构建体,其中所述接头包含氨基酸序列GGGGS或由其组成。
149.根据实施方案146-148中任一项所述的肽融合构建体,所述肽融合构建体包含序列SEQ ID NO:27或53、57或由其组成。
150.一种药物组合物,所述药物组合物包含根据实施方案101-131中任一项所述的SARS-CoV-2抗原或根据实施方案146-149中任一项所述的肽融合构建体。
151.根据实施方案150所述的药物组合物,所述药物组合物进一步包含佐剂。
152.根据实施方案151所述的药物组合物,其中所述佐剂选自铝佐剂、CpG、PolyI:C、MF59、AS01、AS02、AS03、AS04、AF03、鞭毛蛋白、ISCOM和ISCOMMATRIX。
153.根据实施方案150-152中任一项所述的药物组合物,所述药物组合物治疗或预防SARS-CoV-2感染。
154.根据实施方案153所述的用于所述用途的药物组合物,其中所述药物组合物是肠胃外施用的。
155.根据实施方案154所述的用于所述用途的药物组合物,其中所述药物组合物是皮内、皮下或肌内施用的。
156.根据实施方案155所述的用于所述用途的药物组合物,其中所述药物组合物是肌内施用的。
157.根据实施方案153-156中任一项所述的用于所述用途的药物组合物,其中所述药物组合物施用至少一次。
158.根据实施方案153-156所述的用于所述用途的药物组合物,其中所述药物组合物施用至少两次。
159.根据实施方案158所述的用于所述用途的药物组合物,其中施用之间的时间段是至少2周,例如3周或1个月。
160.一种mRNA构建体,所述mRNA构建体由以下结构元件组成:
(i)具有以下结构的5’帽:
(ii)具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
(iii)具有核酸序列SEQ ID NO:148的蛋白质编码区;
(iv)具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
(v)聚A尾。
161.一种脂质纳米颗粒,所述脂质纳米颗粒包封根据实施方案160所述的mRNA构建体。
162.根据实施方案161所述的脂质纳米颗粒,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
163.根据实施方案161或162所述的脂质纳米颗粒,其中所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。
164.一种免疫原性组合物,所述免疫原性组合物包含根据实施方案160所述的mRNA构建体或根据实施方案161-163中任一项所述的脂质纳米颗粒。
165.根据实施方案164所述的免疫原性组合物,所述免疫原性组合物包含10μg与200μg之间的所述mRNA构建体。
166.根据实施方案165所述的免疫原性组合物,所述免疫原性组合物包含15μg与135μg之间的所述mRNA构建体。
167.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含至少20μg的所述mRNA构建体。
168.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含至少25μg的所述mRNA构建体。
169.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含至少35μg的所述mRNA构建体。
170.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含至少40μg的所述mRNA构建体。
171.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含至少45μg的所述mRNA构建体。
172.根据实施方案166所述的免疫原性组合物,所述免疫原性组合物包含15μg、45μg或135μg的所述mRNA构建体。
173.一种治疗或预防SARS-CoV-2感染的方法,所述方法包括向受试者施用有效量的根据实施方案164至172中任一项所述的免疫原性组合物。
174.根据实施方案173所述的方法,其中向所述受试者至少两次施用所述免疫原性。
175.根据实施方案174所述的方法,其中施用之间的时间段是至少2周,例如3周或1个月。
176.一种免疫原性组合物,所述免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:1、2、3、4、5、8、9、10、11、12、14、15、16、17、19、20、35、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、104、106、108、110、118、120、123、125、127、129、131、133、135、137、139或141,并且其中一种或多种另外的核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含选自以下的序列的氨基酸序列:SEQ ID NO:151、153、155、157、159、161、163、165、167、169或171。
177.一种免疫原性组合物,所述免疫原性组合物包含至少两种核酸,用于预防SARS-CoV-2感染,其中第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQID NO:11的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44,并且
其中一种或多种另外的核酸选自:
(a)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:157的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO 156,以及
(b)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:163的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:162;以及
(c)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:167的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:166;以及
(d)包含优化核苷酸序列的核酸,所述优化核苷酸序列编码包含选自SEQ ID NO:171的序列的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:170。
178.根据实施方案176或实施方案177所述的免疫原性组合物,其中所述至少两种核酸是mRNA。
179.根据实施方案178所述的免疫原性组合物,其中所述第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQ ID NO:11的氨基酸序列,并且其中所述优化核苷酸序列具有核酸序列SEQ ID NO:148。
180.根据实施方案176-178所述的免疫原性组合物,其中所述核酸被包封在脂质纳米颗粒中。
181.一种治疗或预防SARS-CoV-2感染的方法,所述方法包括向受试者施用有效量的根据实施方案176-179中任一项所述的免疫原性组合物。
实施例
实施例1.产生优化核苷酸序列。
此实施例说明了产生根据本发明的优化核苷酸序列的方法,所述优化核苷酸序列被优化为在体外合成期间产生全长转录物并且导致编码蛋白质的高水平表达。
所述方法将图1A的密码子优化方法与图1B所展示的一系列过滤步骤相组合,以产生优化核苷酸序列列表。具体而言,如图1A所展示,所述方法接收目的氨基酸序列和第一密码子使用表,所述第一密码子使用表反映了给定生物体中每个密码子的频率(即,本实施例的上下文中的人类密码子使用偏向)。如果密码子与小于阈值频率(10%)的密码子使用频率相关,则所述方法然后从第一密码子使用表中去除所述密码子。在第一步骤中未去除的密码子的密码子使用频率被归一化以生成归一化密码子使用表。
对密码子使用表的归一化涉及为每个被去除密码子重新分布使用频率值;某个被去除密码子的使用频率被添加到与被去除密码子共享氨基酸的其他密码子的使用频率上。在此实施例中,重新分布与未从表中去除的密码子的使用频率的大小成比例。所述方法使用归一化密码子使用表生成优化核苷酸序列列表。每个优化核苷酸序列编码目的氨基酸序列。
如图1B所展示,将优化核苷酸序列列表通过按顺序应用基序筛选过滤器、鸟嘌呤胞嘧啶(GC)含量分析过滤器和密码子适应指数(CAI)分析过滤器进一步加工以生成更新的优化核苷酸序列列表。
如以下实施例所展示,此方法产生编码目的氨基酸序列的优化核苷酸序列。核苷酸序列在体外合成过程中产生全长转录物并且导致编码蛋白质的高水平表达(参见实施例2)。
实施例2.产生具有高CAI得分的核苷酸序列的密码子优化提高了蛋白质产率。
此实施例证明密码子适应指数(CAI)约0.8或更高的密码子优化蛋白质编码序列优于CAI低于0.8的密码子优化蛋白质编码序列。
对人促红细胞生成素(hEPO)的野生型氨基酸序列进行密码子优化。hEPO是一种由肾脏响应于低细胞氧水平(低氧)而分泌的蛋白质激素。hEPO对于红细胞生成是必不可少的,于红细胞生成是红血细胞的产生。重组hEPO通常用于治疗贫血,贫血是以红血细胞或血红蛋白计数低为特征的病症,所述病症可以发生在患有慢性肾病的受试者或接受癌症化疗的受试者中。
使用不同的密码子优化算法,生成总共5种新的编码hEPO的密码子优化核苷酸序列(#1至#5)。核苷酸序列#4和#5是根据密码子优化方法产生的,如图1A和图1B所展示。作为参考,提供了具有密码子优化hEPO编码序列的核苷酸序列,其先前已既在体外又在体内以实验方式得到验证。参考核苷酸序列已发现提供的蛋白质产率优于编码hEPO蛋白的野生型核苷酸序列和其他密码子优化核苷酸序列。
表5.hEPO编码核苷酸序列
表6总结了5种核苷酸序列中每一个在CAI、GC含量、密码子频率分布(CFD)以及负顺式元件和负重复元件的存在方面的特征。
表6.编码hEPO的优化核苷酸序列的特征
为了测试每种密码子优化序列的蛋白质产率,制备了6种核酸载体,每种核酸载体包含表达盒,所述表达盒含有6种编码hEPO蛋白的核苷酸序列之一,其侧翼是相同的3’和5’非翻译序列(3’和5’UTR)并且前面是RNA聚合酶启动子。这些核酸载体用作体外转录反应的模板,以提供6批mRNA,其含有6种密码子优化核苷酸序列(参考和核苷酸序列#1至#5)。加帽和加尾单独进行。将每个加帽和加尾的mRNA分别转染到细胞系(HEK293)中。通过ELISA评估编码hEPO蛋白的表达水平。此实验的结果总结在图2中。
如从图2可以看出,用核苷酸序列#3观察到最高水平的表达,其产生的hEPO蛋白几乎是实验验证的参考核苷酸序列的两倍。对于依赖于其CAI的序列,可以观察到更高蛋白质产率的趋势(参见表6)。具有最高蛋白质产率的核苷酸序列#3具有最高的CAI。第二和第三最高产率的核苷酸序列#4和#5具有第三和第四最高的CAI。性能最低的核苷酸序列#1和#2也具有最低的CAI。附带地,这些也是GC含量最低的核苷酸序列。然而,单独的GC含量不是决定性的。在所有测试的密码子优化序列中,参考核苷酸序列具有最高的GC含量(61%),但是表现不如核苷酸序列#3、#4和#5(都具有较低的GC含量)好。值得注意地,性能最低的核苷酸序列#1和#2也具有较高的CFD。
总之,此实施例中的数据证明,与例如为实现具有最高可能GC含量的核苷酸序列而进行的密码子优化相比,为实现CAI约0.8或更高而对治疗相关核苷酸序列的密码子优化导致更高的蛋白质产率。
实施例3.使用优化核酸构建体产生的刺突蛋白的检测
此实施例证明在转染后,编码全长SARS-CoV-2 S蛋白的优化核苷酸序列在培养细胞中以高水平成功表达。还证明了表达的蛋白质如预期那样被细胞加工。
根据如图1A和图1B所展示的密码子优化方法,生成包含编码全长SARS-CoV-2 S蛋白的优化核苷酸序列的核酸构建体。优化核苷酸序列示出在表7中。
表7.包含编码SARS-CoV-2 S蛋白的优化核苷酸序列的核酸
对于培养细胞的转染,将150μL OptiMEM减少血清培养基与0.5μg(图7)或1μg(图5和图6)mRNA和2.5μL Lipofectamine 2000一起添加到1.5mL Eppendorf管中,用于mRNA与转染试剂的复合。将每个管在Vortex上轻轻混合,并且在微型离心机中短暂旋转以收集内容物。将复合物在室温下孵育10±2分钟。然后将整个复合物体积小心地添加到12孔板的孔中,以便不干扰HEK293细胞单层(5x 105/孔)。将细胞返回37℃培养箱并且孵育18±2小时,然后收获。
通过去除培养基并且添加250μL CelLytic M(Sigma)+1x HALT来收获每个孔的内容物。将细胞悬浮液在冰上放置20分钟以允许细胞充分裂解,然后将裂解物收集在1.5mLEppendorf管中。将裂解物以13,000RPM离心3分钟以沉淀碎片。将上清液转移到清洁的1.5mL Eppendorf管中。从这一点开始,样品一直保存在冰上。
对于蛋白质印迹,将15μL每种细胞裂解物与5μL补充有1X NuPAGE样品还原剂的4xNovex NuPAGE LDS样品缓冲液合并。将样品在85℃下孵育5分钟,然后在冰上冷却。将整个样品体积负载到Novex WedgeWell 12孔6%tris-甘氨酸微凝胶(含3μg I-56578SS/凝胶)中,并且在165V下运行1-1.5小时。使用带有PVDF转移包的TransBlot Turbo进行转移,并且将膜在1x PBS中的0.2%iBlock(Thermo)与0.05% Tween-20中封闭。将膜与一级抗体(抗兔HRP#W401B)一起孵育≥1小时,所述一级抗体按规定稀释在封闭缓冲液中。然后将其用1xTBST(Thermo)洗涤两次。然后将膜与在封闭缓冲液中1:10,000稀释的物种适当的二级抗体一起孵育≥1小时。然后将其用1x TBST洗涤四次。然后在薄膜上使用SuperSignal PicoWest底物对膜进行显色。
含有表7中所述优化核苷酸序列的mRNA的转染导致培养的HEK293细胞中的蛋白质表达水平。图5和图6示出了与加工前的全长S蛋白对应的约170-180kDa带。图5还示出了S1和S2亚基带的存在,证明天然全长SARS-CoV-2 S蛋白(构建体A)被细胞正确加工。当细胞表达构建体B时,观察到对应于完全糖基化成熟蛋白的大带。构建体B编码变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2刺突蛋白被修饰为缺少弗林蛋白酶切割位点(并且因此不被切割以形成S1和S2亚基),并且含有脯氨酸作为残基986和987(从而使蛋白质稳定为其融合前构象)。
图7还示出了约170-180kDa的全长S蛋白带。在测试的所有4种构建体中观察到此带。在构建体A和构建体C的情况下检测到S1和S2亚基带。构建体C表达变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2 S蛋白被修饰为含有脯氨酸作为残基986和987(从而使蛋白质稳定为其融合前构象)。再次,在构建体B和构建体D的情况下,完全糖基化成熟蛋白被检测为强带。构建体D编码变体SARS-CoV-2 S蛋白,其相对于天然存在的SARS-CoV-2 S蛋白被修饰为缺少弗林蛋白酶切割位点(并且因此不被切割形成S1和S2亚基)。
此实施例证明编码全长SARS-CoV-2 S蛋白或其变体的优化核酸序列以高水平表达。还证明了表达的蛋白质如预期那样被细胞加工。
实施例4.用编码全长融合前稳定化SARS-CoV-2 S蛋白的序列优化的mRNA免疫的中和抗体反应
此实施例证明包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA有效诱导小鼠的中和抗体反应。
四种含有实施例3表7中所述优化核苷酸序列的mRNA中的每一种包封在脂质纳米颗粒(LNP)中。以0.4μg剂量的四种配制品之一向BALB/c小鼠组以三周的间隔施用两次免疫。通过酶联免疫吸附测定(ELISA)评估血清样品中的结合抗体活性。为了确定中和抗体的滴度,使用基于假病毒的中和测定。
对于ELISA,2019-nCoV刺突蛋白(S1+S2)膜外结构域(Sino Biological,目录号40589-V08B1)用作底物并且在4℃下以在碳酸氢盐缓冲液中2μg/mL浓度包被过夜。使用比色底物Sure Blue TMB 1-组分(SERA CARE,KPL目录号5120-0077)将板显色,并且通过停止溶液(SERA CARE Sure Blue,KPL目录号5120-0024)停止。每个样品的终点抗体滴度被确定为最高稀释度,其OD值比背景值高3倍。
对于基于假病毒的中和测定,将血清样品1:4稀释在培养基中(FluoroBrite无酚红DMEM+10% FBS+10mM HEPES+1% PS+1% Glutamax)中并且在56℃下热灭活0.5h。此外,制备2倍稀释系列的热灭活血清,并且与报告病毒颗粒(RVP)-GFP(Integral Molecular)混合,稀释至每个孔含有300个感染性颗粒,并且在37℃下孵育1h。将50%汇合的293T-hsACE2克隆细胞(75μL体积)的96孔板用50μL血清/病毒混合物接种并且在37℃下孵育72h。在孵育结束时,将板在高内涵成像仪上扫描,并且对单独的GFP表达细胞进行计数。将抑制稀释滴度(ID50)报告为将测试中的病毒噬斑数量减少50%的稀释度的倒数。每个测试样品的ID50是通过使用低于50%中和点的噬斑数量的最后一个稀释度和高于50%中和点的噬斑数量的第一个稀释度计算斜率和截距来内推。ID50滴度=(50%中和点-截距)/斜率。
所有四种mRNA配制品在第一次疫苗接种后14天诱导类似水平的结合抗体,并且在第28天第二剂后一周,反应进一步增强。在第35天,构建体A的如通过假病毒中和测定确定的中和抗体的几何平均滴度(GMT)是152,构建体B为354,构建体C为195,并且构建体D为1005。构建体D变体的中和潜力趋向于略高于构建体B。
在ELISA中针对结合检测到的血清学抗体滴度不能预测通过假病毒确定的中和滴度。构建体A和构建体C组中的一些小鼠在中和测定中没有血清转化,但它们在ELISA中的终点滴定滴度与组中的其他小鼠相当。构建体B和D在诱导中和抗体的免疫原性方面可能相当。
此实施例证明,包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA比编码天然全长SARS-CoV-2 S蛋白的mRNA更有效地诱导中和抗体滴度。除了将残基986和987突变为脯氨酸之外,阻断弗林蛋白酶切割位点还增加了另一个层面以防止融合前向融合后转化。考虑到融合前构象的重要性,选择构建体B(编码相对于天然存在的SARS-CoV-2 S蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸的SARS-CoV-2 S蛋白)用于进一步的临床前评价。
实施例5.包封mRNA的脂质纳米颗粒的制备
体外合成包含编码全长SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA,所述蛋白相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸。使用模板质粒制备mRNA,其包含与RNA聚合酶启动子序列可操作地连接的以下核酸序列:
未经修饰的核苷酸的模板依赖性RNA合成产生具有核酸序列SEQ ID NO:147的多核苷酸,其包含优化核酸序列SEQ ID NO:148。在多步骤酶催化过程中,合成最终mRNA产物,将其纯化以去除酶试剂和过早终止的合成产物(“短链”)。
最终mRNA具有表4所示的结构元件。SARS-CoV-2 S蛋白编码序列侧翼是分别140和105个核苷酸的5’和3’非翻译区(UTR)。mRNA还含有5’帽结构,其由经由倒5’5’三磷酸桥与5’UTR的第一个核苷连接的7-甲基鸟苷(m7G)残基组成,第一个核苷本身通过2’O核糖甲基化被修饰。5’帽对于核糖体起始翻译必不可少。整个线性结构在3’端以一束大约100至500个腺苷核苷(聚A)终止。聚A区为mRNA赋予稳定性,并且还被认为增强翻译。所有这些结构元件都是高效翻译SARS-CoV-2刺突mRNA所需的天然存在的组分。
将纯化mRNA包封在脂质纳米颗粒(LNP)中,所述脂质纳米颗粒包含专有阳离子脂质、非阳离子脂质(DOPE)、基于胆固醇的脂质(胆固醇)和PEG修饰的脂质(DMG-PEG-2K)。最终mRNA-LNP配制品是水性悬浮液。
实施例6.小鼠中的中和抗体反应的诱导
此实施例证明,LNP包封的包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA的免疫原性组合物诱导在小鼠中针对SARS-CoV-2 S蛋白诱导结合和中和抗体的稳健反应。
在第0天和第21天使用实施例5中制备的LNP配制品通过肌内注射(IM)将小鼠免疫两次(参见图9C)。将四组8只6-8周龄BALB/c小鼠分别用0.2μg、1μg、5μg或10μg mRNA/剂进行免疫。第五组小鼠(用作阴性对照)只接受mRNA-LNP组合物的稀释剂。在免疫前七天(第7天),从每只小鼠中采集血液样品,以确定针对SARS-CoV-2S蛋白的抗体的基线水平。在第14天、第21天、第28天和第35天采集另外的血液样品。按照所有相关的美国国立卫生研究院法规(US National Institutes of Health regulations)以及宾夕法尼亚州丹佛市CovanceInc动物护理和使用委员会(Animal Care and Use Committee of Covance Inc)的批准进行小鼠实验。
使用ELISA测定确定针对SARS-CoV-2 S蛋白的抗体滴度。将96孔板用可商购SARS-CoV-2 S蛋白(SinoBio)包被,从第-7天、第14天、第21天、第28天和第35天用连续稀释的小鼠血清孵育,并且用二级抗体探测以检测结合的总小鼠IgG。
为了确定中和抗体的滴度,使用基于假病毒的测定。来自具有轻度、强和重度症状的COVID-19患者的39份个体转化血清样品用作阳性对照。将血清样品以1:4稀释在培养基(FluoroBrite无酚红DMEM+10% FBS+10mM HEPES+1% PS+1% Glutamax)中,并且在56℃下热灭活30分钟。在相同的培养基中进行进一步的热灭活血清的2倍9点系列稀释系列。将稀释的血清样品与一定体积的报告病毒颗粒(RVP)-绿色荧光蛋白(GFP)(IntegralMolecular)混合,稀释至含有约300个感染性颗粒/孔,并且在37℃下孵育1小时。将75μL体积的约50%汇合的293T-hsACE2克隆细胞的96孔板单独接种50μL血清+病毒混合物,并且在37℃下孵育72h。在72小时孵育结束时,将板在高内涵成像仪上扫描,并且对单独的GFP表达细胞进行计数。将中和抗体滴度报告为将测试中的病毒噬斑数量减少50%的稀释度的倒数(参见图9B)。
图9A和图9B总结了此小鼠免疫实验的结果。即使在单次注射(shot)后,在第14天通过ELISA也观察到对于所有测试剂量,稳健的抗体反应(参见图9A)。第二次注射导致抗体反应显著加强,并且明显提高了中和抗体的滴度(参见图9B)。在第35天,如通过ELISA确定,两剂1μg、5μg或10μg mRNA的使用产生相当的抗体滴度。如在图9B中可见,两剂0.2μg mRNA在第35天诱导中和抗体方面稍微不太有效,而两剂1μg、5μg或10μg mRNA在第35天诱导了相当的抗体滴度,超过了先前感染SARS-CoV-2的人类患者的转化血清中观察到的中和抗体滴度。
此实施例证明在两剂后,在此实施例中测试的免疫原性组合物诱导了强的中和抗体反应。反应的强度是剂量依赖性的。结果表明,免疫原性组合物可以诱导中和抗体滴度,与恢复期人类患者的中和抗体滴度相当。
实施例7.在小鼠中Th1偏向性T细胞反应的诱导
促进Th1偏向性免疫的疫苗典型地比不这样的疫苗更大保护地抵抗病毒病原体。Th1细胞因子诸如IFN-γ的分泌激活了细胞毒性T淋巴细胞(CTL),这是一种T细胞亚群,其可以诱导感染病毒的细胞死亡。此实施例证明实施例6中测试的免疫原性组合物在小鼠中诱导了Th1偏向性T细胞反应。
为了进一步评估实施例6中测试的疫苗的免疫反应的质量,通过分别用5μg或10μgmRNA通过IM注射免疫小鼠组两次,重复该实施例中描述的实验。在第-4天(基线)、第14天、第21天、第28天和第35天采集血液样品(参见图10C)。按照所有相关的美国国立卫生研究院法规以及宾夕法尼亚州丹佛市Covance Inc动物护理和使用委员会的批准进行小鼠实验。在第35天处死小鼠,并且取出其脾脏。将分离的脾匀浆并且分离脾细胞,如下所述。通过ELISPOT测定确定肽刺激脾细胞的IFN-γ和IL-5分泌
将收获的脾脏储存在冰上的5mL冷冻培养基中。就在加工之前,将脾脏置于含有培养基的无菌培养皿中。10cc注射筒柱塞的背面用于使脾脏匀浆。使匀浆物通过过滤器并且转移到无菌管中。然后通过1200rpm离心8-10分钟使匀浆物沉淀。轻轻倒出上清液,并且用干净的纸巾擦拭管边缘。添加ACK裂解缓冲液以裂解红血细胞,并且将细胞在室温下孵育5min。将管以1200rpm离心8-10分钟。倒出上清液,并且将沉淀物重悬于2mM L-谷氨酰胺CTL测试培养基中。将悬浮液过滤到新的15mL锥形管中。将细胞维持在37℃、5% CO2的加湿培养箱中,直到使用。
使用测试培养基制备含有PepMixTM SARS-CoV-2(刺突糖蛋白,目录号PM-WCPV-S-1)肽库1和肽库2的溶液。测定中每种肽的最终浓度是2μg/ml。作为阳性对照,使用测试培养基中1μg/ml的ConA。这些抗原/丝裂原溶液以100μL/孔铺板。将含有抗原/丝裂原溶液的板置于37℃培养箱中10-20分钟,然后将细胞铺板,以确保pH和温度对细胞是最佳的。将细胞浓度调节至所希望的浓度。将0.3x106/100μl/孔的脾细胞添加到含有抗原/丝裂原溶液的板中。一旦完成,就将板轻轻贴上胶带,并且置于37℃、5% CO2的加湿培养箱中并且孵育过夜。将板用PBS洗涤2次,并且然后用0.05% Tween-PBS洗涤2次,200μL/孔。
根据制造商的方案使用小鼠IFN-γ/IL-5双色酶ELISPOT试剂盒(CTL ShakerHeights,Cleveland)。按照制造商的说明制备检测溶液,并且向每个孔中添加80μL。然后将板在室温下孵育2h。将板用0.05% Tween-PBS洗涤3次,200μL/孔。添加80μL/孔的三级溶液,并且将板在室温下孵育30min。将板用0.05% Tween-PBS洗涤2次,并且然后用蒸馏水洗涤2次,每次200μL/孔。将显色剂溶液以80μL/孔添加到孔中,并且在室温下孵育15min。通过用自来水轻轻冲洗膜三次,使反应停止。将板晾干并且使用CTL分析仪进行扫描。报告了产生细胞因子的细胞的数量/百万细胞(参见图10)。
如从图10A中可见,在第35天从用5μg或10μg mRNA免疫两次的小鼠中分离的脾细胞分泌大量Th1细胞因子IFN-γ。然而,如从图10B可见,这些细胞没有分泌可检测量的Th2细胞因子IL-5。
此实施例证明,测试的免疫原性组合物有效诱导小鼠中的Th1偏向性T细胞反应,表明用这种免疫原性组合物进行疫苗接种可以诱导识别和消除SARS-CoV-2感染细胞的CTL反应。
实施例8.食蟹猴中的中和抗体反应的诱导
此实施例证明,LNP包封的包含编码全长融合前稳定化SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA的免疫原性组合物诱导在食蟹猴中针对SARS-CoV-2 S蛋白诱导结合和中和抗体的稳健反应。
在第0天和第21天使用实施例5中制备的LNP配制品通过IM施用将猴免疫两次(参见图11D)。将三组四只3-4岁食蟹猴分别用15μg、45μg或135μg mRNA/剂进行免疫。在免疫前四天(第-4天),从每只猴中采集血液样品,以确定针对SARS-CoV-2 S蛋白的抗体的基线水平。在第-4天、第2天、第7天、第14天、第21天、第23天、第28天和第35天和第42天采集另外的血液样品。按照所有相关的美国国立卫生研究院法规以及新伊比利亚研究中心动物护理和使用委员会(Animal Care and Use Committee of the New Iberia Research Center)的批准进行食蟹猴实验。
使用ELISA测定来确定从食蟹猴获得的血液样品中针对SARS-CoV-2 S蛋白的抗体滴度。来自具有轻度、强和重度症状的COVID-19患者的39份个体血清样品用作阳性对照。将Nunc微孔板用在PBS中0.5ug/ml的SARS-CoV S-GCN4蛋白(GeneArt,在Expi 293细胞系中表达)在4℃下包被过夜。将板用PBS-Tween 0.1%洗涤3次,然后用在PBS-Tween 0.1%中的1% BSA封闭1小时。将样品以1:450的初始稀释度铺板,然后在封闭缓冲液中进行3倍7点连续稀释。将板在室温下孵育1小时后洗涤3次,然后将50ul的1:5000兔抗人IgG(JacksonImmuno Reserarch)添加至每个孔中。将板在室温下孵育1h并且洗涤3次。使用Pierce 1-Step Ultra TMB-ELISA底物溶液使板显色6分钟,并且用TMB终止溶液终止。在SpectraMax读板器中在450nm处读取板。将抗体滴度报告为等于0.2OD截止限的最高稀释度。
使用基于假病毒的测定确定食蟹猴血清中的中和抗体的滴度。来自具有轻度、强和重度症状的COVID-19患者的39份个体转化血清样品用作阳性对照。将血清样品以1:4稀释在培养基(FluoroBrite无酚红DMEM+10% FBS+10mM HEPES+1% PS+1%Glutamax)中,并且在56℃下热灭活30分钟。在培养基中进行进一步的热灭活血清的2倍9点系列稀释系列。将稀释的血清样品与一定体积的报告病毒颗粒(RVP)-GFP(Integral Molecular)混合,稀释至含有约300个感染性颗粒/孔,并且在37℃下孵育1小时。将75μL体积的约50%汇合的293T-hsACE2克隆细胞的96孔板单独接种50μL血清+病毒混合物,并且在37℃下孵育72h。在孵育结束时,将板在高内涵成像仪上扫描,并且对单独的GFP表达细胞进行计数。将中和抗体滴度报告为将测试中的病毒噬斑数量减少50%的稀释度的倒数(参见图11B)。
另外,使用39份人类转化血清作为阳性对照,确定每个猴样品的微中和滴度。在使用前一天将Vero E6细胞以每孔在0.1mL中2x104个细胞的浓度接种到96孔平底细胞培养板中。在实验当天,从1:10稀释度开始,将热灭活猴或人血清的2倍系列稀释液与SARS-CoV-2病毒(例如,分离物USA-WA1/2020[BEI Resources;目录号NR-52281])在37℃培养箱中孵育60±5分钟。然后从Vero E6细胞中无菌去除生长培养基,并且将测试样品(血清和病毒)添加到Vero E6接种的板中,并且在37℃培养箱中孵育30±5分钟。随后,在不去除现有接种物的情况下,向所有板的所有孔中添加100μL生长培养基。然后将板放回培养箱中并且孵育2天。感染后两天,将细胞固定并且用一级抗体(SARS-CoV抗核蛋白小鼠单克隆抗体(SinoBio目录号40143-MM05或等效物)染色,并且然后用带HRP标签的二级抗体(辣根过氧化物酶(HRP)缀合的山羊抗小鼠免疫球蛋白G(IgG)抗体(Jackson ImmunoResearchLaboratories,目录号115-035-062或等效物))染色。
这些测定的结果总结在图11中。即使在最低测试mRNA剂量为15μg时,两次注射后也观察到稳健的结合和中和抗体反应(参见图11A和图11B)。在第28、35和42天,如通过ELISA确定,两剂15μg、45μg或135μg mRNA的使用产生相当的抗体滴度(参见图11A)。两剂15μg或45μg mRNA在这些天也产生了相当水平的中和抗体(参见图11B)。在第28、35和42天,两剂135μg mRNA诱导的抗体滴度超过了在SARS-CoV-2感染的人类患者的转化血清中观察到的中和抗体滴度。微中和滴度测定提供了类似的结果,其中15μg和45μg mRNA剂量产生了相当的滴度,并且135μg剂量超过了在SARS-CoV-2感染的人类患者的转化血清中观察到的滴度(参见图11C)。
此实施例证明当施用之间的时间段是至少2周(特别是约3周)时,即使在两次注射后最低剂量为15μg的情况下,测试的免疫原性组合物也诱导了稳健的中和抗体反应。数据支持在人类患者中使用测试组合物来诱导保护性中和抗体反应。
实施例9.在食蟹猴中Th1偏向性T细胞反应的诱导
此实施例证明实施例8中测试的免疫原性组合物在食蟹猴中诱导了Th1偏向性T细胞反应。
为了进一步评估实施例8中测试的疫苗的免疫反应的质量,将PBMC分离为食蟹猴血液样品。将分离的PBMC储存在冷冻小瓶中。通过使用ELISPOT测定确定由肽刺激的PBMC分泌的IFN-γ和IL-13来评估T细胞反应。幼稚PBMC用作对照,以确立非激活非刺激的细胞中IFN-γ或IL-13分泌的基线水平。结果总结在图12中。
为了进行测定,将猴PBMC的完全培养基(DMEM1640+10%热灭活FCS)在37℃水浴中预温热。将PBMC冷冻小瓶在37℃水浴中快速解冻,并且将其内容物缓慢逐滴转移到在锥形管中预温热的培养基中。然后将管以1500RPM离心5min。将细胞沉淀用预温热的完全培养基洗涤一次,并且在1500RPM下再次沉淀15min。丢弃上清液,并且将PBMC用完全培养基重悬,并且使用Guava细胞计数器计数。
使用猴IFN-γELISPOT试剂盒(CTL,目录号3421M-4APW)和IL-13ELISPOT试剂盒(CTL,目录号3470M-4APW)确定肽刺激的PBMC分泌IFN-γ和IL-13的水平。将试剂盒提供的预包被板用无菌PBS洗涤4次,并且然后用200μl/孔的完全培养基封闭。封闭步骤在37℃培养箱中进行至少30分钟。在测定中将PepMixTM SARS-CoV-2(JPT,目录号PM-WCPV-S-1)肽库1和库2用作回忆抗原,最终浓度为每种肽2μg/ml。使用2μg/ml的伴刀豆球蛋白A(Sigma,目录号C5275)作为阳性对照。向每个孔中添加50μl回忆抗原和在50μl中的300,000个PBMC进行刺激。然后将板置于37℃、5% CO2加湿培养箱中24小时。孵育24小时后,将板用PBS洗涤5次。添加100μl/孔的在含有1%胎牛血清的PBS中制备的生物素化抗IFN-γ或抗IL-13检测抗体(1μg/ml),并且将板在室温下孵育2小时。然后如前所述将板用PBS洗涤5次,并且在室温下与100μl/孔的链霉亲和素在含有1%胎牛血清的PBS中以1:1000的稀释度孵育1h。再次将板用PBS洗涤5次,并且使用100μl/孔的BCIP/NBT底物溶液显色,直到斑点可见。通过用在自来水中将板洗涤,使显色停止。然后将板干燥过夜,扫描,并且使用CTL分析仪对斑点进行计数。将数据报告为斑点形成细胞(SFC)/百万PBMC(参见图12)。
如从图12A(肽库S1)和图12C(肽库S2)可见,在第42天从用15μg、45μg或135μg剂量的mRNA免疫两次的猴中分离的PBMC响应于源自SARS-CoV-2 S蛋白的肽的刺激而分泌大量Th1细胞因子IFN-γ。相反,这些细胞响应于肽刺激而仅分泌基线量的Th2细胞因子IL-13(参见图12B(肽库S1)和图12D(肽库S2))。
此实施例证明,测试的免疫原性组合物有效诱导食蟹猴中的Th1偏向性T细胞反应,表明用这种免疫原性组合物进行疫苗接种可以在人体中诱导识别和消除SARS-CoV-2感染细胞的CTL反应。
实施例10.剂量建模
此实施例证明实施例6和8中测试的免疫原性组合物的低mRNA剂量有效产生中和抗体滴度,其显著高于在COVID-19患者恢复期血清的对照组中观察到的相应滴度。
实施例6中所述的1μg、5μg和10μg免疫小鼠组之间在第35天的假病毒中和滴度没有统计学显著差异,表明超过1μg mRNA的剂量饱和效应,所述mRNA包含编码全长融合前稳定化SARS-CoV-2 S蛋白的测试优化核苷酸序列。在第35天小鼠的峰值假病毒中和滴度显著高于COVID-19患者恢复期血清对照组中观察到的相应滴度(参见图13A)。
实施例8中描述的食蟹猴实验的假病毒中和测定和微中和测定两者的结果高度相关(图13B)。无论剂量水平如何,第35天假病毒和微中和滴度都比免疫前动物高约130倍。对93份COVID-19患者恢复期血清的完整数据集的进一步统计分析揭示了用分别为15μg、45μg和135μg的mRNA剂量获得的滴度显著高于恢复期人类血清中观察到的相应滴度(所有P值均小于0.005;图13C和图13D)。
此实施例支持10μg至200μg的mRNA剂量范围用于研究实施例5中制备的免疫原性组合物的安全性和功效的人类临床试验。确实,15μg与45μg之间的剂量可能足以诱导有效的中和抗体反应,同时耐受性良好。
实施例11.编码全长融合前稳定化SARS-CoV-2 S蛋白的mRNA的免疫原性
此实施例证明相对于天然存在的SARS-CoV-2 S蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸(2P/GSAS)的编码SARS-CoV-2 S蛋白的mRNA比编码其他全长融合前稳定化SARS-CoV-2 S蛋白的mRNA更有效地引发中和抗体反应。
为了确定使SARS-CoV-2 S蛋白稳定为其融合前确认的突变对免疫原性的影响,将七种mRNA构建体-野生型SARS-CoV-2 S蛋白(WT)和对应的融合前稳定化SARS-CoV-2 S蛋白(分别为2P、GSAS、2P/GSAS、2P/GSAS/ALAYT、6P和6P/GSAS)-配制在脂质纳米颗粒(LNP)中作为实施例5中所述的mRNA疫苗。WT、2P/GSAS、2P、GSAS分别对应于实施例3中的构建体A-D。2P/GSAS/KLHYT是突变为去除弗林蛋白酶切割位点、残基986和987被脯氨酸替代并且ER回收信号突变的SARS-CoV-2 S蛋白,其具有优化核酸序列SEQ ID NO:124和氨基酸序列SEQID NO:125。6P是突变为残基817、892、899、942、986和987被脯氨酸替代的SARS-CoV-2 S蛋白,其具有优化核酸序列SEQ ID NO:128和氨基酸序列SEQ ID NO:129。6P/GSAS是突变为去除弗林蛋白酶切割位点并且残基817、892、899、942、986和987被脯氨酸替代的SARS-CoV-2S蛋白,其具有优化核酸序列SEQ ID NO:130和氨基酸序列SEQ ID NO:131。
两个动物模型用于免疫评估。以三周的间隔向BALB/c小鼠施用两次免疫,其中每剂五种配制品(WT、2P、GSAS、2P/GSAS、2P/GSAS/ALAYT)中的每一种0.4μg。平行地,使用相同的免疫计划以每剂六种S mRNA疫苗(2P、GSAS、2P/GSAS、2P/GSAS/ALAYT、6P和6P/GSAS)5μg将非人灵长类动物(NHP)免疫。
为了评价功能抗体(例如,nAb)滴度,测试了免疫血清中和稳定过表达人ACE2的HEK-293T细胞中GFP报告假病毒颗粒(RVP)的感染性的能力。表达SARS-CoV-2 S蛋白的RVP能够进行单轮感染,由进入时GFP的表达所指示。中和效力被确定为可实现50% RVP进入抑制的血清稀释度(ID50)。另外,使用由GCN4螺旋束三聚的重组可溶性S蛋白作为抗原评价酶联免疫吸附测定(ELISA)滴度。
尽管一些动物在第一次免疫后的第14天出现中和滴度,但滴度总体很低。预期地,大多数测试动物在第二次免疫后产生中和滴度(图14)。在第35天,小鼠中假病毒(PsV)nAb滴度的几何平均滴度(GMT)与95%置信区间(95% CI)是:WT为152(36;645),2P为195(44;870),GSAS为1005(261;3877),2P/GSAS为354(129;976),以及2P/GSAS/ALAYT为940。与WT和2P构建体相比,具有GSAS突变的三种构建体具有较高GMT的趋势,尤其是在第35天和第42天。
在NHP中,即使在第二次免疫后,各组内也观察到多样的中和滴度(图14)。2P和6P/GSAS疫苗显示出比其他构建体更低的免疫原性,在第35天GMT分别为78和10。6P疫苗未能引发任何可检测的中和滴度。与小鼠研究中的观察结果一致,与2P疫苗组相比,除6P/GSAS外的所有GSAS构建体在第二剂后均诱导了更高的中和滴度,在D35时的GMT(95% CI)记录为:GSAS为425(48;3769),2P/GSAS为772(116;5121),2P-GSAS/ALAYT为280(11;6970)。小鼠和NHP两者的GMT趋势表明,2P/GSAS的免疫原性优于其他构建体。此外,小鼠和NHP中2P/GSAS变体的峰值PsVNa滴度(第35天)与93份COVID-19患者恢复期血清组中观察到的滴度相当或更高。
此实施例证明GSAS突变有益于疫苗免疫原性。为稳定S蛋白的融合前形式而引入的2P突变在GSAS突变的背景下似乎是有益的,而ALAYT在2P/GSAS的背景下显示出对免疫原性较小的影响,尤其是在NHP中。因此,此实施例进一步证实了编码相对于天然存在的SARS-CoV-2 S蛋白被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸的SARS-CoV-2 S蛋白的优化mRNA可以比编码其他融合前稳定化SARS-CoV-2 S蛋白的mRNA更有效地诱导中和抗体。
实施例12.在叙利亚金黄仓鼠中的保护性功效
此实施例证明LNP包封的包含编码相对于天然存在的SARS-CoV-2 S蛋白被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸的SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA的免疫原性组合物可以在COVID-19动物模型中通过减少肺病毒感染和预防肺病理学而具有保护功效。
叙利亚金黄仓鼠的SARS-CoV-2感染是一种病理学模型,其中病毒感染与高水平的病毒复制相关,其中在感染后2天(DPI)肺和鼻上皮中出现峰值滴度,在7DPI时肺出现疾病的组织病理学证据,并且在7DPI左右体重减轻约8%-15%。
为了评价实施例5中制备的LNP配制品保护免于病毒感染和疾病的潜力,根据在D21时进行单次IM免疫或在第0天和第21天进行两次IM免疫,将叙利亚金黄仓鼠用四种疫苗配制品剂量水平(0.15、1.5、4.5或13.5μg/剂)免疫。在第49天通过鼻内(IN)接种SARS-CoV-2来激发动物,并且在8DPI时监测作为体重减轻的疾病临床表现。在4或7DPI时收获肺和鼻组织用于组织病理学,并且通过亚基因组RNA RT-PCR测定对病毒复制进行定量。
实施例5的LNP配制品在第一次疫苗接种后诱导了稳健的剂量依赖性中和抗体反应,其通过第二次免疫而显著增强。第一次免疫后,除0.15μg剂量组外,所有动物都产生了中和抗体,记录为针对野生型SARS-CoV-2病毒的噬斑减少中和滴度(PRNT)。对于1.5、4.5和13.5μg剂量,单剂量免疫计划的第35天PRNT50 GMT分别为237、410和711,而两剂组的相应值为3219、2446和3219。尽管观察到随着剂量的递增而朝向更高滴度的趋势,但1.5、4.5和13.5μg组之间的滴度差异不是统计学显著的。
为了测试疫苗接种的保护效果,所有组均被鼻内激发。每天监测每只动物的体重,持续7天(图15a)。观察到假处理(稀释剂)疫苗接种的动物的体重减轻最为显著,并且在7DPI时的减轻超过10%。1.5、4.5和13.5μg的疫苗接种方案(无论是一剂方案还是两剂方案)都保护动物免于体重减轻,并且大多数动物经历的体重减轻小于5%,并且减轻的峰值大多在2-3DPI左右。这些组之间的体重比较没有显著差异。与假处理组相比,唯一的经历程度相似的体重减轻的组是单次免疫的0.15μg剂量组。
为了评估由病毒感染引起的病理学,在4或7DPI时从每组4只动物中收获肺样品,并且对固定组织进行切片,并且随机分配和设盲用于组织病理学检查。基于组织损伤的严重程度,为每个样品指定0-3的病理学评分,并且较高的得分反映了更严重的病理学。得分1归因于肺切片,其揭示了在切片的小于25%中发现组织病理学。类似地,如果大于25%但小于50%的实质受累,则指定得分2。向总切片的大于50%受影响的那些切片指定得分3。接种SARS-CoV-2的假处理疫苗接种仓鼠揭示了广泛的肺组织病理学,类似于在COVID-19患者中检测到的严重肺炎的报告(图15b)。幼稚仓鼠的肺在组织学上不明显。在单次疫苗接种的0.15μg单剂组的肺样品中也可以看到类似的病变,盲检结果评分为3。相反,单次疫苗接种的13.5μg剂量组的肺样品没有揭示此类病变,与健康对照相似,并且两者均评分为0(图15c)。
在接受一剂或两剂实施例5的LNP配制品的仓鼠中,肺病理学明显减弱,并且在4DPI和7DPI两者时似乎存在剂量依赖性效应(图15b)。尽管1.5、4.5和13.5μg的单次疫苗接种显著减弱了由感染引起的病理学,但1.5、4.5、13.5μg两剂疫苗接种提供了几乎完全的针对病理学的保护。0.15μg的非常低剂量水平在单剂量方案中使用时没有显示出保护,但在两剂量疫苗接种方案中显示出一些微不足道的保护。
为了评估用实施例5的LNP配制品的免疫是否可能影响仓鼠的病毒感染,通过RTPCR测量来自肺和鼻样品的病毒亚基因组mRNA(sgRNA)。在4或7DPI时收集一半组(n=4)的肺和鼻样品,并且通过RT-PCR加工总RNA以检测sgRNA(图15d)。对于在4DPI和7DPI时收集的肺样品,假处理疫苗接种组产生约每克组织分别约108和105个拷贝,而接受13.5μg两剂方案的那些在两个时间点均低于检测水平。接受1.5μg和4.5μg两剂方案的那些的肺样品在4DPI时病毒sgRNA拷贝减少了近3log,并且在7DPI时低于检测。对于接受1.5、4.5和13.5μg单剂疫苗接种的那些的肺样品,在4DPI时的病毒载量与假处理疫苗接种组的病毒载量无差异,而在7DPI时的载量低于检测阈值。值得注意地,在4或7DPI时,接受一剂或两剂方案的0.15μg的情况的肺样品的病毒载量与假处理疫苗接种组相比相似或甚至更高。然而,病毒载量(sgRNA)在4DPI时在所有组中更为多样,大多数组中有一或两只动物测试为阴性。在7DPI时唯一实现清除鼻样品中病毒sgRNA的组是13.5μg两剂疫苗接种组。
此实施例证明实施例5中制备的免疫原性组合物可以降低肺的病毒感染并且预防COVID-19动物模型中的肺病理学。用实施例5中制备的免疫原性组合物进行免疫可能由于持续时间缩短和从上呼吸道脱落的病毒载量较低而对传播具有影响。
实施例13.包封mRNA的脂质纳米颗粒的制备
体外合成优化核苷酸序列的mRNA,所述优化核苷酸序列包含编码相对于天然存在的SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且含有L18F、D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变的全长SARS-CoV-2 S蛋白(南非变体2+D614G)。使用包含与RNA聚合酶启动子序列可操作连接的序列SEQ ID NO:166的模板质粒制备mRNA。
未经修饰的核苷酸的模板依赖性RNA合成产生具有核酸序列SEQ ID NO:172的多核苷酸,其包含优化核酸序列SEQ ID NO:173。在多步骤酶催化过程中,合成最终mRNA产物,将其纯化以去除酶试剂和过早终止的合成产物(“短链”)。
最终mRNA具有表4中的mRNA构建体2所示的结构元件。SARS-CoV-2 S蛋白编码序列侧翼是分别140和105个核苷酸的5’和3’非翻译区(UTR)。mRNA还含有5’帽结构,其由经由倒5’5’三磷酸桥与5’UTR的第一个核苷连接的7-甲基鸟苷(m7G)残基组成,第一个核苷本身通过2’O核糖甲基化被修饰。5’帽对于核糖体起始翻译必不可少。整个线性结构在3’端以一束大约100至500个腺苷核苷(聚A)终止。聚A区为mRNA赋予稳定性,并且还被认为增强翻译。所有这些结构元件都是高效翻译SARS-CoV-2刺突mRNA所需的天然存在的组分。
将纯化mRNA包封在脂质纳米颗粒(LNP)中,所述脂质纳米颗粒包含40%cKK-E10、30% DOPE、28.5%胆固醇和1.5% DMG-PEG-2K(摩尔比)。最终mRNA-LNP配制品是水性悬浮液。
实施例14.针对SARS-CoV-2变体毒株有效的中和抗体反应
此实施例证明,响应于LNP包封的包含编码相对于天然存在的SARS-CoV-2 S蛋白已被修饰为去除弗林蛋白酶切割位点、使残基986和987突变为脯氨酸并且含有SARS-CoV-2南非变体(南非变体2+D614G)的L18F、D80A、D215G、ΔL242、ΔA243、ΔL244、K417N、E484K、N501Y、D614G和A701V突变的SARS-CoV-2 S蛋白的优化核苷酸序列的mRNA的免疫原性组合物的暴露,先前已用两剂实施例5的LNP配制品免疫的非人灵长类动物(NHP)针对源自原始毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)以及在南非、日本/巴西和加利福尼亚观察到的SARS-CoV-2 S蛋白的天然存在的变体以及源自SARS-CoV-1的S蛋白产生有效的中和抗体反应。如实施例13中所述制备免疫原性组合物。
使用非人灵长类动物(NHP)模型(食蟹猴)来研究由实施例5中所述mRNA疫苗(编码SARS-CoV-2蛋白的融合前稳定的变体)诱导的针对原始毒株(SEQ ID NO:1)的原始抗原特异性是否可以通过以下方式来克服:随后用包含编码SARS-CoV-2 S蛋白的融合前稳定的南非(SA)变体的优化核苷酸序列的mRNA疫苗(单独地或与实施例5的mRNA疫苗)免疫,以便针对流行的不同SARS-CoV-2变体和源自SARS-CoV-1的S蛋白引发广泛的免疫反应。用15μg、45μg或135μg实施例5中制备的LNP配制品中的每一种免疫食蟹猴(n=4)两次,间隔三周(第0天和第21天)。在第315天,将动物随机分配,分布在两组中并且免疫。将第1组用实施例13中所述的mRNA疫苗免疫,其含有源自SARS-CoV-2南非变体(仅SA)的突变。将第2组用含有来自实施例5的原始mRNA疫苗+给予第1组的变体的配制品免疫。第1组和第2组两者均接受10μg的总mRNA剂量。研究被设计为评价是否需要二价免疫原性组合物来拓宽抗原反应或包含源自变体的SARS-CoV-2 S蛋白的单价免疫原性组合物(仅SA)是否足以拓宽抗原反应。
在S蛋白(SEQ ID NO:1)表达假病毒(PsV)中和测定中测试来自免疫前和加强前动物(第4天、第308天)的血清样品以及在第14天、第21天、第28天、第35天、第42天、第90天、第308天和第329天收集的样品。在假病毒(PsV)中和测定中测试在第35天、第308天和第329天收集的血清样品。测试的PsV表达源自原始毒株(SEQ ID NO:1)、南非(SA 20C和SA 20H)、日本/巴西(Jap/Braz)或加利福尼亚SARS-CoV-2毒株的S蛋白或者源自SARS-CoV-1毒株的S蛋白,如图16所示。将血清样品稀释在培养基(FluoroBrite无酚红DMEM+10% FBS+10mMHEPES+1% PS+1% Glutamax)中,并且在56℃下热灭活30分钟。在培养基中进行进一步的热灭活血清的2倍11点系列稀释系列。将稀释的血清样品与报告病毒颗粒(RVP)-GFP(Integral Molecular)混合,稀释至含有约300个感染性颗粒/孔,并且在37℃下孵育1小时。将75μL体积的约50%汇合的293T-hsACE2克隆细胞的96孔板单独接种50μL血清+RVP混合物,并且在37℃下孵育72h。在孵育结束时,将板在高内涵成像仪上扫描,并且对单独的GFP表达细胞进行计数。将抑制稀释滴度(ID50)报告为将测试中的病毒噬斑数量减少50%的稀释度的倒数。每个测试样品的ID50是通过使用低于50%中和点的噬斑数量的最后一个稀释度和高于50%中和点的噬斑数量的第一个稀释度计算斜率和截距来内推的(ID50滴度=(50%中和点-截距)/斜率)。结果总结在图17中。
如从图17中可见,在两个NHP加强组中,在原始2剂初免-加强免疫之后约9个月用包含编码SARS-CoV-2 S蛋白的融合稳定的南非变体的优化核苷酸序列的mRNA疫苗加强免疫导致对PsV具有高中和效力,所述PsV表达原始毒株的SARS-CoV-2 S蛋白(SEQ ID NO:1)。这些数据表明,暴露于编码SARS-CoV 2 S蛋白南非变体的mRNA疫苗增强针对原始mRNA疫苗编码的SARS-CoV-2 S蛋白的中和抗体反应。与仅暴露于编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的mRNA疫苗相比,暴露于编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的mRNA疫苗和编码源自毒株(SEQ ID NO:1)的融合前稳定化S蛋白的原始mRNA的混合物不会更有效地加强针对原始毒株S蛋白(SEQ ID NO:1)的中和抗体反应。
有趣的是,用编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的mRNA疫苗的免疫还针对表达在南非观察到的SARS-CoV-2 S蛋白的天然存在的变体以及在日本/巴西和加利福尼亚观察到的SARS-CoV-2 S蛋白的天然存在的变体的所有其他测试PsV产生高的中和效力。令人惊讶地,抗原反应如此广泛,以至于表达SARS-CoV-1的S蛋白的PsV也被NHP测试血清有效中和。这是出乎意料的,因为SARS-CoV-1的S蛋白与SARS-CoV-2的S蛋白(SEQ ID NO:1)仅76%相同。
如从图17可见,在大多数情况下,针对变体S蛋白的中和抗体反应与针对源自原始毒株的S蛋白(SEQ ID NO:1)一样有效。此外,在用编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的mRNA疫苗加强免疫后观察到的中和抗体反应的强度类似或大于在第35天响应于用实施例5的mRNA疫苗的原始初免-加强免疫诱导的中和抗体反应。
这些数据表明,先前用针对SARS-CoV-2 S蛋白(SEQ ID NO:1)引发中和抗体的疫苗免疫并且随后施用包含编码SARS-CoV-2 S蛋白的融合前稳定化南非变体的本发明优化核苷酸序列的mRNA疫苗的受试者能够有效针对多种多样的S蛋白变体产生广泛的中和抗体反应并且因此应有效保护免于由原始SARS-CoV-2毒株(SEQ ID NO:1)的天然存在的变体以及其他β-冠状病毒,特别是表达与血管紧张素转化酶2(ACE2)结合的刺突蛋白的那些(诸如SARS-CoV-1)引起的COVID-19感染。
SEQUENCE LISTING
<110> 翻译生物公司
圣诺菲·帕斯图尔公司
<120> 编码SARS-COV-2抗原的优化核苷酸序列
<130> MRT-2161WO
<141> 2021-05-07
<150> 63/021,319
<151> 2020-05-07
<150> 63/032,825
<151> 2020-06-01
<150> 63/076,718
<151> 2020-09-10
<150> 63/076,729
<151> 2020-09-10
<150> 63/088,739
<151> 2020-10-07
<150> 63/143,604
<151> 2021-01-29
<150> 63/143,612
<151> 2021-01-29
<150> 63/146,807
<151> 2021-02-08
<160> 173
<170> SeqWin2010, version 1.0
<210> 1
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 1
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 2
<211> 1208
<212> PRT
<213> SARS-CoV-2
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln
1205
<210> 3
<211> 681
<212> PRT
<213> SARS-CoV-2
<400> 3
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro
675 680
<210> 4
<211> 589
<212> PRT
<213> SARS-CoV-2
<400> 4
Met Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
1 5 10 15
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
20 25 30
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
35 40 45
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
50 55 60
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
65 70 75 80
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
85 90 95
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
100 105 110
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
115 120 125
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
130 135 140
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
145 150 155 160
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
165 170 175
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
180 185 190
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
195 200 205
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
210 215 220
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
225 230 235 240
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
245 250 255
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
260 265 270
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala
275 280 285
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
290 295 300
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
305 310 315 320
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
325 330 335
Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln
340 345 350
Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
355 360 365
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
370 375 380
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp
385 390 395 400
Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
405 410 415
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
420 425 430
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
435 440 445
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe
450 455 460
Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
465 470 475 480
Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln
485 490 495
Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser
500 505 510
Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp
515 520 525
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val
530 535 540
Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
545 550 555 560
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
565 570 575
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
580 585
<210> 5
<211> 394
<212> PRT
<213> SARS-CoV-2
<400> 5
Met Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
1 5 10 15
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
20 25 30
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
35 40 45
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
50 55 60
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
65 70 75 80
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
85 90 95
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
100 105 110
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
115 120 125
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
130 135 140
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
145 150 155 160
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
165 170 175
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
180 185 190
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
195 200 205
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
210 215 220
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
225 230 235 240
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
245 250 255
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
260 265 270
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
275 280 285
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
290 295 300
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
305 310 315 320
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
325 330 335
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
340 345 350
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
355 360 365
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
370 375 380
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln
385 390
<210> 6
<211> 193
<212> PRT
<213> SARS-CoV-2
<400> 6
Met Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
1 5 10 15
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
20 25 30
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
35 40 45
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
50 55 60
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
65 70 75 80
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
85 90 95
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
100 105 110
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
115 120 125
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
130 135 140
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys
145 150 155 160
Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly
165 170 175
Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala
180 185 190
Pro
<210> 7
<211> 15
<212> PRT
<213> SARS-CoV-2
<400> 7
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys
1 5 10 15
<210> 8
<211> 207
<212> PRT
<213> Artificial Sequence
<400> 8
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro
195 200 205
<210> 9
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 9
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 10
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 10
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 11
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 11
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 12
<211> 1208
<212> PRT
<213> Artificial Sequence
<400> 12
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln
1205
<210> 13
<211> 27
<212> PRT
<213> Artificial Sequence
<400> 13
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1 5 10 15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25
<210> 14
<211> 1235
<212> PRT
<213> Artificial Sequence
<400> 14
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
1220 1225 1230
Thr Phe Leu
1235
<210> 15
<211> 435
<212> PRT
<213> Artificial Sequence
<400> 15
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg
405 410 415
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
420 425 430
Thr Phe Leu
435
<210> 16
<211> 1235
<212> PRT
<213> Artificial Sequence
<400> 16
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
1220 1225 1230
Thr Phe Leu
1235
<210> 17
<211> 1235
<212> PRT
<213> Artificial Sequence
<400> 17
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
1220 1225 1230
Thr Phe Leu
1235
<210> 18
<211> 231
<212> PRT
<213> Artificial Sequence
<400> 18
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1 5 10 15
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
65 70 75 80
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
210 215 220
Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 19
<211> 423
<212> PRT
<213> Artificial Sequence
<400> 19
Met Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr
1 5 10 15
Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys
20 25 30
Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe
35 40 45
Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr
50 55 60
Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln
65 70 75 80
Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu
85 90 95
Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu
100 105 110
Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg
115 120 125
Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr
130 135 140
Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr
145 150 155 160
Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr
165 170 175
Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro
180 185 190
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
195 200 205
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
210 215 220
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
225 230 235 240
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
245 250 255
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
260 265 270
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
275 280 285
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
290 295 300
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
305 310 315 320
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
325 330 335
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
340 345 350
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
355 360 365
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
370 375 380
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
385 390 395 400
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
405 410 415
Leu Ser Leu Ser Pro Gly Lys
420
<210> 20
<211> 438
<212> PRT
<213> Artificial Sequence
<400> 20
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Pro
195 200 205
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
210 215 220
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
225 230 235 240
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
245 250 255
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
260 265 270
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
275 280 285
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
290 295 300
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
305 310 315 320
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
325 330 335
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
340 345 350
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
355 360 365
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
370 375 380
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
385 390 395 400
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
405 410 415
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
420 425 430
Ser Leu Ser Pro Gly Lys
435
<210> 21
<211> 18
<212> PRT
<213> Artificial Sequence
<400> 21
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
1 5 10 15
Gly Phe
<210> 22
<211> 26
<212> PRT
<213> Artificial Sequence
<400> 22
Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln
1 5 10 15
Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
20 25
<210> 23
<211> 33
<212> PRT
<213> Artificial Sequence
<400> 23
Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1 5 10 15
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
20 25 30
Glu
<210> 24
<211> 32
<212> PRT
<213> Artificial Sequence
<400> 24
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
1 5 10 15
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
20 25 30
<210> 25
<211> 142
<212> PRT
<213> Artificial Sequence
<400> 25
Met Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
1 5 10 15
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly Gly Gly Ser
20 25 30
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
35 40 45
Gly Phe Gly Gly Gly Gly Ser Pro Ala Ile Cys His Asp Gly Lys Ala
50 55 60
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
65 70 75 80
Val Thr Gln Arg Asn Phe Tyr Glu Gly Gly Gly Gly Ser Ser Phe Ile
85 90 95
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Gly
100 105 110
Gly Gly Gly Ser Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
115 120 125
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
130 135 140
<210> 26
<211> 1137
<212> DNA
<213> Artificial Sequence
<400> 26
atgctgctgt ttaacaaagt gactctggca gacgcaggct ttatcaagca gtacggagac 60
tgtctcgggg acattgcagc cggcggcgga ggctcatctt tcattgagga cctgctgttc 120
aacaaggtca ctctggcaga tgccggattc ggaggagggg gatctccagc tatctgccat 180
gacggaaagg ctcattttcc tcgggagggt gtgtttgtgt ccaacggaac ccattggttc 240
gtcacacagc gcaacttcta tgaaggaggg gggggctcca gcttcatcga ggacctgctc 300
tttaacaaag tgaccctggc cgatgctgga tttgggggag ggggatccct gctgttcaac 360
aaagttacac tggccgacgc aggcttcatc aaacagtacg gcgattgttt aggggacatc 420
gccgctggcg gcggaggatc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 480
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 540
accctcatga tctctcgcac accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 600
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 660
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtgctg 720
caccaggatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 780
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 840
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 900
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 960
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1020
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgatgcac 1080
gaagctctgc acaatcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1137
<210> 27
<211> 104
<212> PRT
<213> Artificial Sequence
<400> 27
Met Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
1 5 10 15
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
20 25 30
Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
35 40 45
Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly
50 55 60
Asp Ile Ala Ala Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu
65 70 75 80
Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly
85 90 95
Asp Cys Leu Gly Asp Ile Ala Ala
100
<210> 28
<211> 315
<212> DNA
<213> Artificial Sequence
<400> 28
atgtccttca ttgaggacct gctgtttaat aaggtgaccc tggccgacgc tgggttcatc 60
aaacagtatg gagattgtct gggagatatt gcagcaggcg ggggcggcag cagctttatt 120
gaggacctcc tgttcaacaa ggtgaccctt gccgacgcag ggtttattaa gcagtatggc 180
gactgtctgg gagacattgc agccggcggc ggcgggtctt cttttatcga ggacctgctg 240
ttcaacaagg tgacactggc cgacgcaggc tttattaagc agtacgggga ctgcctggga 300
gacattgccg cctga 315
<210> 29
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 29
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 30
<211> 3627
<212> DNA
<213> Artificial Sequence
<400> 30
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtga 3627
<210> 31
<211> 2046
<212> DNA
<213> Artificial Sequence
<400> 31
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
ccttga 2046
<210> 32
<211> 1770
<212> DNA
<213> Artificial Sequence
<400> 32
atgtccgttg ctagtcagtc tattattgcc tataccatga gcctcggagc tgagaatagc 60
gtggcctact ccaataattc catcgcaatc cctactaact tcactatttc tgtgaccacc 120
gagatcctgc ctgtgtctat gactaagact agcgttgatt gtaccatgta tatttgtggc 180
gactctaccg aatgttctaa cctgctgctt cagtacggct cattttgcac acagctgaac 240
agagccctga ctgggatcgc tgtggagcag gacaagaaca cacaggaggt gtttgcacag 300
gtgaagcaga tctataagac ccctcctatt aaggatttcg gcggattcaa tttctcacag 360
attctgccag accccagtaa gccttccaag aggagcttca tcgaggatct cctgtttaac 420
aaggtgaccc tggcagacgc cggctttatt aagcaatatg gggattgcct gggcgacatt 480
gctgccagag acctgatttg cgcccagaaa ttcaatggcc tcacagtgct gccacctctg 540
ctgaccgacg agatgatcgc tcaatacact agcgcactgc tggccggaac catcacatca 600
ggctggacct tcggggccgg agcagcactg cagattccat tcgccatgca gatggcctat 660
agattcaacg gcattggcgt cacacagaac gtgctgtacg aaaaccagaa gctcatcgct 720
aaccagttta attccgcaat tggaaagatc caagattcac tcagctcaac cgcctctgca 780
ctcggaaagc tgcaggacgt ggtcaaccag aatgctcagg ccctgaacac actcgtcaag 840
cagctgtcct ctaactttgg cgctatcagc tccgttctga acgacattct gagccgcctg 900
gataaggtgg aggctgaagt ccagattgac cgcctgatta ccggccggct gcagtctctg 960
caaacatacg tgacccagca gctgatcaga gcagccgaga tccgggcatc cgcaaatctg 1020
gcagcaacta agatgagcga atgcgtgctg ggccagtcca agcgggtgga cttttgtggc 1080
aagggctacc acctgatgag cttcccccag agcgccccac atggcgttgt ttttctgcac 1140
gtgacctatg tccctgctca ggaaaagaac tttacaactg ctcctgctat ctgccatgac 1200
ggcaaggccc acttcccacg ggagggagtg tttgtgtcca atggcacaca ctggttcgtg 1260
acccagagga acttctatga accccagatc atcaccactg acaatacctt cgtgtctgga 1320
aattgcgacg tcgtgatcgg catcgttaac aacaccgtgt acgaccctct ccagccagag 1380
ctggactcct ttaaggagga actggataag tattttaaga accacacaag cccagatgtg 1440
gatctcgggg acatctccgg aattaacgcc tccgtggtga atatccagaa ggagattgac 1500
cgcctaaatg aagttgccaa gaacctcaat gagtctctga ttgatctgca ggaactgggc 1560
aagtatgagc agtatatcaa atggccctgg tacatttggc tggggtttat cgccggactg 1620
attgccatcg tcatggtgac catcatgctg tgttgcatga cctcctgttg ttcctgtctg 1680
aagggctgct gtagttgcgg ctcttgctgt aaattcgacg aagatgatag cgagcccgtg 1740
ctgaagggcg tgaagctgca ttatacctga 1770
<210> 33
<211> 1185
<212> DNA
<213> Artificial Sequence
<400> 33
atgagcttca tcgaggatct cctgtttaac aaggtgaccc tggcagacgc cggctttatt 60
aagcaatatg gggattgcct gggcgacatt gctgccagag acctgatttg cgcccagaaa 120
ttcaatggcc tcacagtgct gccacctctg ctgaccgacg agatgatcgc tcaatacact 180
agcgcactgc tggccggaac catcacatca ggctggacct tcggggccgg agcagcactg 240
cagattccat tcgccatgca gatggcctat agattcaacg gcattggcgt cacacagaac 300
gtgctgtacg aaaaccagaa gctcatcgct aaccagttta attccgcaat tggaaagatc 360
caagattcac tcagctcaac cgcctctgca ctcggaaagc tgcaggacgt ggtcaaccag 420
aatgctcagg ccctgaacac actcgtcaag cagctgtcct ctaactttgg cgctatcagc 480
tccgttctga acgacattct gagccgcctg gataaggtgg aggctgaagt ccagattgac 540
cgcctgatta ccggccggct gcagtctctg caaacatacg tgacccagca gctgatcaga 600
gcagccgaga tccgggcatc cgcaaatctg gcagcaacta agatgagcga atgcgtgctg 660
ggccagtcca agcgggtgga cttttgtggc aagggctacc acctgatgag cttcccccag 720
agcgccccac atggcgttgt ttttctgcac gtgacctatg tccctgctca ggaaaagaac 780
tttacaactg ctcctgctat ctgccatgac ggcaaggccc acttcccacg ggagggagtg 840
tttgtgtcca atggcacaca ctggttcgtg acccagagga acttctatga accccagatc 900
atcaccactg acaatacctt cgtgtctgga aattgcgacg tcgtgatcgg catcgttaac 960
aacaccgtgt acgaccctct ccagccagag ctggactcct ttaaggagga actggataag 1020
tattttaaga accacacaag cccagatgtg gatctcgggg acatctccgg aattaacgcc 1080
tccgtggtga atatccagaa ggagattgac cgcctaaatg aagttgccaa gaacctcaat 1140
gagtctctga ttgatctgca ggaactgggc aagtatgagc agtaa 1185
<210> 34
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 34
atgcctaata tcactaacct gtgtcctttc ggtgaagtgt tcaacgccac caggtttgct 60
agcgtgtatg cctggaacag gaagaggatc tctaactgcg tcgccgacta ttccgtgctg 120
tataacagcg cctccttctc cacattcaaa tgctatggag tgagcccgac aaaactgaac 180
gatctctgct ttacaaatgt ctacgccgac tcttttgtga tcagagggga cgaggtccgg 240
cagatcgcac caggacagac aggcaagatt gctgactaca actataagct gcctgacgac 300
ttcacaggat gtgtgatcgc atggaactca aacaatctgg actccaaagt cgggggcaac 360
tataattacc tgtatcgcct gttccggaag tccaacctga agcccttcga gagggacatc 420
agtacagaga tctatcaggc tggctccacc ccttgcaatg gcgtcgaagg ctttaattgt 480
tattttcccc tgcagtctta cgggtttcag cctactaatg gagttgggta ccagccatac 540
agagtggtcg tgctcagctt cgagctcctg catgctccat aa 582
<210> 35
<211> 624
<212> DNA
<213> Artificial Sequence
<400> 35
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc ataa 624
<210> 36
<211> 1317
<212> DNA
<213> Artificial Sequence
<400> 36
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 660
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 720
accctcatga tctctcgcac accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 780
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 840
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtgctg 900
caccaggatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 960
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 1020
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 1080
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 1140
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1200
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgatgcac 1260
gaagctctgc acaatcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1317
<210> 37
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 37
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgt 45
<210> 38
<211> 33
<212> PRT
<213> Artificial Sequence
<400> 38
Met Ala Thr Gly Ser Arg Thr Ser Leu Leu Leu Ala Phe Gly Leu Leu
1 5 10 15
Cys Leu Pro Trp Leu Gln Glu Gly Ser Ala Phe Pro Thr Ile Pro Leu
20 25 30
Ser
<210> 39
<211> 99
<212> RNA
<213> Artificial Sequence
<400> 39
auggccacug gaucaagaac cucacugcug cucgcuuuug gacugcuuug ccugcccugg 60
uugcaagaag gaucggcuuu cccgaccauc ccacucucc 99
<210> 40
<211> 33
<212> PRT
<213> Artificial Sequence
<400> 40
Met Ala Thr Gly Ser Arg Thr Ser Leu Leu Leu Ala Phe Gly Leu Leu
1 5 10 15
Cys Leu Pro Trp Leu Gln Glu Gly Ser Ala Phe Pro Thr Ile Pro Leu
20 25 30
Ser
<210> 41
<211> 99
<212> RNA
<213> Artificial Sequence
<400> 41
auggcaacug gaucaagaac cucccuccug cucgcauucg gccugcucug ucucccaugg 60
cuccaagaag gaagcgcguu ccccacuauc ccccucucg 99
<210> 42
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 42
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 43
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 43
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 44
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 44
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 45
<211> 3627
<212> DNA
<213> Artificial Sequence
<400> 45
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtga 3627
<210> 46
<211> 3708
<212> DNA
<213> Artificial Sequence
<400> 46
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcaggggtac attcccgagg ctcctaggga cggccaggca 3660
tacgtgcgca aagacggcga gtgggtgctg ctgtccacat tcctgtaa 3708
<210> 47
<211> 1308
<212> DNA
<213> Artificial Sequence
<400> 47
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcaggggtac attcccgagg ctcctaggga cggccaggca 1260
tacgtgcgca aagacggcga gtgggtgctg ctgtccacat tcctgtaa 1308
<210> 48
<211> 3708
<212> DNA
<213> Artificial Sequence
<400> 48
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcaggggtac attcccgagg ctcctaggga cggccaggca 3660
tacgtgcgca aagacggcga gtgggtgctg ctgtccacat tcctgtaa 3708
<210> 49
<211> 3708
<212> DNA
<213> Artificial Sequence
<400> 49
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcaggggtac attcccgagg ctcctaggga cggccaggca 3660
tacgtgcgca aagacggcga gtgggtgctg ctgtccacat tcctgtaa 3708
<210> 50
<211> 1275
<212> DNA
<213> Artificial Sequence
<400> 50
atgcctaata tcactaacct gtgtcctttc ggtgaagtgt tcaacgccac caggtttgct 60
agcgtgtatg cctggaacag gaagaggatc tctaactgcg tcgccgacta ttccgtgctg 120
tataacagcg cctccttctc cacattcaaa tgctatggag tgagcccgac aaaactgaac 180
gatctctgct ttacaaatgt ctacgccgac tcttttgtga tcagagggga cgaggtccgg 240
cagatcgcac caggacagac aggcaagatt gctgactaca actataagct gcctgacgac 300
ttcacaggat gtgtgatcgc atggaactca aacaatctgg actccaaagt cgggggcaac 360
tataattacc tgtatcgcct gttccggaag tccaacctga agcccttcga gagggacatc 420
agtacagaga tctatcaggc tggctccacc ccttgcaatg gcgtcgaagg ctttaattgt 480
tattttcccc tgcagtctta cgggtttcag cctactaatg gagttgggta ccagccatac 540
agagtggtcg tgctcagctt cgagctcctg catgctccac ctaagtcctg cgacaaaacc 600
catacatgtc caccatgccc agctcctgaa ctgctcggcg ggcctagtgt tttcctcttc 660
cctcctaagc ccaaggatac cctcatgatc tctcgcacac cagaagtgac ctgcgtggtc 720
gtggatgtct ctcacgagga tcctgaagtg aagtttaact ggtatgtcga cggagtggaa 780
gtgcacaacg ccaagacaaa gccaagagaa gaacaataca attctactta tagggtggtg 840
tctgtgctga cagtgctgca ccaggattgg ctgaatggaa aagaatataa gtgtaaggtc 900
tctaacaagg ccctgcccgc tccaattgag aagacaattt ccaaggccaa ggggcagcct 960
cgggaacctc aggtgtacac actgccccca tccagggatg aactgactaa aaatcaggtg 1020
tctctgacat gcctggtgaa agggttttat ccaagtgaca ttgctgtgga gtgggagtct 1080
aatgggcagc ctgaaaataa ctacaagacc acaccaccag tgctcgatag cgacgggtct 1140
ttctttctgt attctaaact gaccgtggat aaatctcggt ggcagcaggg aaacgtgttt 1200
tcttgctcag tgatgcacga agctctgcac aatcactata cacagaaatc cctgtccctg 1260
tctccaggca aataa 1275
<210> 51
<211> 156
<212> PRT
<213> Artificial Sequence
<400> 51
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Leu
1 5 10 15
Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr
20 25 30
Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly Gly Gly Ser Ser Phe
35 40 45
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
50 55 60
Gly Gly Gly Gly Ser Pro Ala Ile Cys His Asp Gly Lys Ala His Phe
65 70 75 80
Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr
85 90 95
Gln Arg Asn Phe Tyr Glu Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp
100 105 110
Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Gly Gly Gly
115 120 125
Gly Ser Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile
130 135 140
Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
145 150 155
<210> 52
<211> 471
<212> DNA
<213> Artificial Sequence
<400> 52
atgttcgtgt tcctggtgct gctgccactg gtttcctccc agtgtctgct gtttaacaag 60
gttacactgg cagacgccgg cttcatcaag cagtatgggg actgtctggg cgatatcgcc 120
gctggcggcg gaggatctag cttcattgag gacctgctgt tcaacaaagt gactctggct 180
gacgccggat ttggcggagg agggtctcct gccatttgtc atgacgggaa ggctcatttc 240
cctagggagg gggtttttgt ctccaatgga actcactggt tcgtgaccca aagaaacttc 300
tatgagggag gtggcggatc ctcttttatc gaggacctgc tgtttaacaa ggtcactctg 360
gccgatgcag gcttcggagg aggagggtct ctgctgttca acaaagttac tctggcagat 420
gctgggttca ttaagcagta cggcgactgt ctgggcgata ttgccgcctg a 471
<210> 53
<211> 118
<212> PRT
<213> Artificial Sequence
<400> 53
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly
35 40 45
Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
50 55 60
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
65 70 75 80
Ala Ala Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu Phe Asn
85 90 95
Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys
100 105 110
Leu Gly Asp Ile Ala Ala
115
<210> 54
<211> 357
<212> DNA
<213> Artificial Sequence
<400> 54
atgttcgtgt tcctggtcct gctacccctg gtgtcctctc agtgctcctt cattgaggac 60
ctgctgttta ataaggtgac cctggccgac gctgggttca tcaaacagta tggagattgt 120
ctgggagata ttgcagcagg cgggggcggc agcagcttta ttgaggacct cctgttcaac 180
aaggtgaccc ttgccgacgc agggtttatt aagcagtatg gcgactgtct gggagacatt 240
gcagccggcg gcggcgggtc ttcttttatc gaggacctgc tgttcaacaa ggtgacactg 300
gccgacgcag gctttattaa gcagtacggg gactgcctgg gagacattgc cgcctga 357
<210> 55
<211> 392
<212> PRT
<213> Artificial Sequence
<400> 55
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Leu
1 5 10 15
Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr
20 25 30
Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly Gly Gly Ser Ser Phe
35 40 45
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
50 55 60
Gly Gly Gly Gly Ser Pro Ala Ile Cys His Asp Gly Lys Ala His Phe
65 70 75 80
Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr
85 90 95
Gln Arg Asn Phe Tyr Glu Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp
100 105 110
Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Gly Gly Gly
115 120 125
Gly Ser Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile
130 135 140
Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly Gly Gly
145 150 155 160
Ser Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
165 170 175
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
180 185 190
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
195 200 205
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
210 215 220
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
225 230 235 240
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
245 250 255
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
260 265 270
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
275 280 285
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
290 295 300
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
305 310 315 320
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
325 330 335
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
340 345 350
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
355 360 365
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
370 375 380
Ser Leu Ser Leu Ser Pro Gly Lys
385 390
<210> 56
<211> 1179
<212> DNA
<213> Artificial Sequence
<400> 56
atgtttgtgt tcctcgttct gctgcctctg gtgagctccc agtgtctgct gtttaacaaa 60
gtgactctgg cagacgcagg ctttatcaag cagtacggag actgtctcgg ggacattgca 120
gccggcggcg gaggctcatc tttcattgag gacctgctgt tcaacaaggt cactctggca 180
gatgccggat tcggaggagg gggatctcca gctatctgcc atgacggaaa ggctcatttt 240
cctcgggagg gtgtgtttgt gtccaacgga acccattggt tcgtcacaca gcgcaacttc 300
tatgaaggag gggggggctc cagcttcatc gaggacctgc tctttaacaa agtgaccctg 360
gccgatgctg gatttggggg agggggatcc ctgctgttca acaaagttac actggccgac 420
gcaggcttca tcaaacagta cggcgattgt ttaggggaca tcgccgctgg cggcggagga 480
tcacctaagt cctgcgacaa aacccataca tgtccaccat gcccagctcc tgaactgctc 540
ggcgggccta gtgttttcct cttccctcct aagcccaagg ataccctcat gatctctcgc 600
acaccagaag tgacctgcgt ggtcgtggat gtctctcacg aggatcctga agtgaagttt 660
aactggtatg tcgacggagt ggaagtgcac aacgccaaga caaagccaag agaagaacaa 720
tacaattcta cttatagggt ggtgtctgtg ctgacagtgc tgcaccagga ttggctgaat 780
ggaaaagaat ataagtgtaa ggtctctaac aaggccctgc ccgctccaat tgagaagaca 840
atttccaagg ccaaggggca gcctcgggaa cctcaggtgt acacactgcc cccatccagg 900
gatgaactga ctaaaaatca ggtgtctctg acatgcctgg tgaaagggtt ttatccaagt 960
gacattgctg tggagtggga gtctaatggg cagcctgaaa ataactacaa gaccacacca 1020
ccagtgctcg atagcgacgg gtctttcttt ctgtattcta aactgaccgt ggataaatct 1080
cggtggcagc agggaaacgt gttttcttgc tcagtgatgc acgaagctct gcacaatcac 1140
tatacacaga aatccctgtc cctgtctcca ggcaaataa 1179
<210> 57
<211> 354
<212> PRT
<213> Artificial Sequence
<400> 57
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Gly Gly
35 40 45
Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
50 55 60
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
65 70 75 80
Ala Ala Gly Gly Gly Gly Ser Ser Phe Ile Glu Asp Leu Leu Phe Asn
85 90 95
Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys
100 105 110
Leu Gly Asp Ile Ala Ala Gly Gly Gly Gly Ser Pro Lys Ser Cys Asp
115 120 125
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
130 135 140
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
145 150 155 160
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
165 170 175
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
180 185 190
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
195 200 205
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
210 215 220
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
225 230 235 240
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
245 250 255
Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu
260 265 270
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
275 280 285
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
290 295 300
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
305 310 315 320
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
325 330 335
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
340 345 350
Gly Lys
<210> 58
<211> 1065
<212> DNA
<213> Artificial Sequence
<400> 58
atgttcgtgt tcctggtcct gctgcctctg gtgtcctctc agtgcagctt catcgaggac 60
ctgctcttta acaaggtgac tctcgcagat gctggcttca tcaagcagta cggagactgc 120
cttggagaca tcgctgcagg cggagggggc agcagtttca tcgaggacct gctgtttaac 180
aaggtgaccc tggccgacgc cgggttcatt aagcaatacg gcgattgtct gggagacatc 240
gcagctgggg gaggggggag ctcttttatt gaggacctgc tgttcaacaa ggtgactctg 300
gccgacgcag ggttcatcaa acagtatggg gactgtctgg gagatatcgc agccggggga 360
ggaggctccc ctaagtcctg cgacaaaacc catacatgtc caccatgccc agctcctgaa 420
ctgctcggcg ggcctagtgt tttcctcttc cctcctaagc ccaaggatac cctcatgatc 480
tctcgcacac cagaagtgac ctgcgtggtc gtggatgtct ctcacgagga tcctgaagtg 540
aagtttaact ggtatgtcga cggagtggaa gtgcacaacg ccaagacaaa gccaagagaa 600
gaacaataca attctactta tagggtggtg tctgtgctga cagtgctgca ccaggattgg 660
ctgaatggaa aagaatataa gtgtaaggtc tctaacaagg ccctgcccgc tccaattgag 720
aagacaattt ccaaggccaa ggggcagcct cgggaacctc aggtgtacac actgccccca 780
tccagggatg aactgactaa aaatcaggtg tctctgacat gcctggtgaa agggttttat 840
ccaagtgaca ttgctgtgga gtgggagtct aatgggcagc ctgaaaataa ctacaagacc 900
acaccaccag tgctcgatag cgacgggtct ttctttctgt attctaaact gaccgtggat 960
aaatctcggt ggcagcaggg aaacgtgttt tcttgctcag tgatgcacga agctctgcac 1020
aatcactata cacagaaatc cctgtccctg tctccaggca aataa 1065
<210> 59
<211> 666
<212> DNA
<213> Artificial Sequence
<400> 59
atggcagaca acggtactat taccgttgag gagcttaaac aactcctgga acaatggaac 60
ctagtaatag gtttcctatt cctagcctgg attatgttac tacaatttgc ctattctaat 120
cggaacaggt ttttgtacat aataaagctt gttttcctct ggctcttgtg gccagtaaca 180
cttgcttgtt ttgtgcttgc tgctgtctac agaattaatt gggtgactgg cgggattgcg 240
attgcaatgg cttgtattgt aggcttgatg tggcttagct acttcgttgc ttccttcagg 300
ctgtttgctc gtacccgctc aatgtggtca ttcaacccag aaacaaacat tcttctcaat 360
gtgcctctcc gggggacaat tgtgaccaga ccgctcatgg aaagtgaact tgtcattggt 420
gctgtgatca ttcgtggtca cttgcgaatg gccggacact ccctagggcg ctgtgacatt 480
aaggacctgc caaaagagat cactgtggct acatcacgaa cgctttctta ttacaaatta 540
ggagcgtcgc agcgtgtagg cactgattca ggttttgctg catacaaccg ctaccgtatt 600
ggaaactata aattaaatac agaccacgcc ggtagcaacg acaatattgc tttgctagta 660
cagtaa 666
<210> 60
<211> 222
<212> PRT
<213> Artificial Sequence
<400> 60
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 61
<211> 231
<212> DNA
<213> Artificial Sequence
<400> 61
atgtactcat tcgtttcgga agaaacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagtcaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt ttagtaaaac caacggttta cgtctactcg 180
cgtgttaaaa atctgaactc ttctgaagga gttcctgatc ttctggtcta a 231
<210> 62
<211> 75
<212> PRT
<213> Artificial Sequence
<400> 62
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 63
<211> 1260
<212> DNA
<213> Artificial Sequence
<400> 63
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 64
<211> 419
<212> PRT
<213> Artificial Sequence
<400> 64
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Leu Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 65
<211> 1227
<212> DNA
<213> Artificial Sequence
<400> 65
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcagtaa 1227
<210> 66
<211> 803
<212> PRT
<213> Artificial Sequence
<400> 66
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln Gln Cys Ser Phe Ile Glu Asp Leu
405 410 415
Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr
420 425 430
Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln
435 440 445
Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met
450 455 460
Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly
465 470 475 480
Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln
485 490 495
Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr
500 505 510
Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys
515 520 525
Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln
530 535 540
Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln
545 550 555 560
Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu
565 570 575
Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile
580 585 590
Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile
595 600 605
Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met
610 615 620
Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys
625 630 635 640
Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val
645 650 655
Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr
660 665 670
Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly
675 680 685
Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe
690 695 700
Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn
705 710 715 720
Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu
725 730 735
Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
740 745 750
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
755 760 765
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val
770 775 780
Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys
785 790 795 800
Tyr Glu Gln
<210> 67
<211> 1812
<212> DNA
<213> Artificial Sequence
<400> 67
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggataaggt ggaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcagtatatc 1620
aaatggccct ggtacatttg gctggggttt atcgccggac tgattgccat cgtcatggtg 1680
accatcatgc tgtgttgcat gacctcctgt tgttcctgtc tgaagggctg ctgtagttgc 1740
ggctcttgct gtaaattcga cgaagatgat agcgagcccg tgctgaaggg cgtgaagctg 1800
cattatacct ga 1812
<210> 68
<211> 603
<212> PRT
<213> Artificial Sequence
<400> 68
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
530 535 540
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
545 550 555 560
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly
565 570 575
Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
580 585 590
Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
595 600
<210> 69
<211> 1812
<212> DNA
<213> Artificial Sequence
<400> 69
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggatccccc agaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcagtatatc 1620
aaatggccct ggtacatttg gctggggttt atcgccggac tgattgccat cgtcatggtg 1680
accatcatgc tgtgttgcat gacctcctgt tgttcctgtc tgaagggctg ctgtagttgc 1740
ggctcttgct gtaaattcga cgaagatgat agcgagcccg tgctgaaggg cgtgaagctg 1800
cattatacct ga 1812
<210> 70
<211> 603
<212> PRT
<213> Artificial Sequence
<400> 70
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
530 535 540
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
545 550 555 560
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly
565 570 575
Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
580 585 590
Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
595 600
<210> 71
<211> 1770
<212> DNA
<213> Artificial Sequence
<400> 71
atgtccgttg ctagtcagtc tattattgcc tataccatga gcctcggagc tgagaatagc 60
gtggcctact ccaataattc catcgcaatc cctactaact tcactatttc tgtgaccacc 120
gagatcctgc ctgtgtctat gactaagact agcgttgatt gtaccatgta tatttgtggc 180
gactctaccg aatgttctaa cctgctgctt cagtacggct cattttgcac acagctgaac 240
agagccctga ctgggatcgc tgtggagcag gacaagaaca cacaggaggt gtttgcacag 300
gtgaagcaga tctataagac ccctcctatt aaggatttcg gcggattcaa tttctcacag 360
attctgccag accccagtaa gccttccaag aggagcttca tcgaggatct cctgtttaac 420
aaggtgaccc tggcagacgc cggctttatt aagcaatatg gggattgcct gggcgacatt 480
gctgccagag acctgatttg cgcccagaaa ttcaatggcc tcacagtgct gccacctctg 540
ctgaccgacg agatgatcgc tcaatacact agcgcactgc tggccggaac catcacatca 600
ggctggacct tcggggccgg agcagcactg cagattccat tcgccatgca gatggcctat 660
agattcaacg gcattggcgt cacacagaac gtgctgtacg aaaaccagaa gctcatcgct 720
aaccagttta attccgcaat tggaaagatc caagattcac tcagctcaac cgcctctgca 780
ctcggaaagc tgcaggacgt ggtcaaccag aatgctcagg ccctgaacac actcgtcaag 840
cagctgtcct ctaactttgg cgctatcagc tccgttctga acgacattct gagccgcctg 900
gataaggtgg aggctgaagt ccagattgac cgcctgatta ccggccggct gcagtctctg 960
caaacatacg tgacccagca gctgatcaga gcagccgaga tccgggcatc cgcaaatctg 1020
gcagcaacta agatgagcga atgcgtgctg ggccagtcca agcgggtgga cttttgtggc 1080
aagggctacc acctgatgag cttcccccag agcgccccac atggcgttgt ttttctgcac 1140
gtgacctatg tccctgctca ggaaaagaac tttacaactg ctcctgctat ctgccatgac 1200
ggcaaggccc acttcccacg ggagggagtg tttgtgtcca atggcacaca ctggttcgtg 1260
acccagagga acttctatga accccagatc atcaccactg acaatacctt cgtgtctgga 1320
aattgcgacg tcgtgatcgg catcgttaac aacaccgtgt acgaccctct ccagccagag 1380
ctggactcct ttaaggagga actggataag tattttaaga accacacaag cccagatgtg 1440
gatctcgggg acatctccgg aattaacgcc tccgtggtga atatccagaa ggagattgac 1500
cgcctaaatg aagttgccaa gaacctcaat gagtctctga ttgatctgca ggaactgggc 1560
aagtatgagc agtatatcaa atggccctgg tacatttggc tggggtttat cgccggactg 1620
attgccatcg tcatggtgac catcatgctg tgttgcatga cctcctgttg ttcctgtctg 1680
aagggctgct gtagttgcgg ctcttgctgt aaattcgacg aagatgatag cgagcccgtg 1740
ctgaagggcg tgaagctgca ttatacctga 1770
<210> 72
<211> 589
<212> PRT
<213> Artificial Sequence
<400> 72
Met Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
1 5 10 15
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
20 25 30
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
35 40 45
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
50 55 60
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
65 70 75 80
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
85 90 95
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
100 105 110
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
115 120 125
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
130 135 140
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
145 150 155 160
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
165 170 175
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
180 185 190
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
195 200 205
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
210 215 220
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
225 230 235 240
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
245 250 255
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
260 265 270
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala
275 280 285
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
290 295 300
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
305 310 315 320
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
325 330 335
Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln
340 345 350
Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
355 360 365
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
370 375 380
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp
385 390 395 400
Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
405 410 415
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
420 425 430
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
435 440 445
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe
450 455 460
Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
465 470 475 480
Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln
485 490 495
Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser
500 505 510
Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp
515 520 525
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val
530 535 540
Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
545 550 555 560
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
565 570 575
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
580 585
<210> 73
<211> 1617
<212> DNA
<213> Artificial Sequence
<400> 73
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggataaggt ggaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcagtga 1617
<210> 74
<211> 538
<212> PRT
<213> Artificial Sequence
<400> 74
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln
530 535
<210> 75
<211> 1698
<212> DNA
<213> Artificial Sequence
<400> 75
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggataaggt ggaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcaggggtac 1620
attcccgagg ctcctaggga cggccaggca tacgtgcgca aagacggcga gtgggtgctg 1680
ctgtccacat tcctgtga 1698
<210> 76
<211> 565
<212> PRT
<213> Artificial Sequence
<400> 76
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala
530 535 540
Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu
545 550 555 560
Leu Ser Thr Phe Leu
565
<210> 77
<211> 1617
<212> DNA
<213> Artificial Sequence
<400> 77
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggatccccc agaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcagtga 1617
<210> 78
<211> 538
<212> PRT
<213> Artificial Sequence
<400> 78
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln
530 535
<210> 79
<211> 1698
<212> DNA
<213> Artificial Sequence
<400> 79
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgttccgt tgctagtcag 60
tctattattg cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat 120
tccatcgcaa tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct 180
atgactaaga ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct 240
aacctgctgc ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc 300
gctgtggagc aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag 360
acccctccta ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt 420
aagccttcca agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac 480
gccggcttta ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt 540
tgcgcccaga aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc 600
gctcaataca ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc 660
ggagcagcac tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc 720
gtcacacaga acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca 780
attggaaaga tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac 840
gtggtcaacc agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt 900
ggcgctatca gctccgttct gaacgacatt ctgagccgcc tggatccccc agaggctgaa 960
gtccagattg accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag 1020
cagctgatca gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc 1080
gaatgcgtgc tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg 1140
agcttccccc agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct 1200
caggaaaaga actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca 1260
cgggagggag tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat 1320
gaaccccaga tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc 1380
ggcatcgtta acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag 1440
gaactggata agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc 1500
ggaattaacg cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc 1560
aagaacctca atgagtctct gattgatctg caggaactgg gcaagtatga gcaggggtac 1620
attcccgagg ctcctaggga cggccaggca tacgtgcgca aagacggcga gtgggtgctg 1680
ctgtccacat tcctgtga 1698
<210> 80
<211> 565
<212> PRT
<213> Artificial Sequence
<400> 80
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
20 25 30
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
35 40 45
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
50 55 60
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
65 70 75 80
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
85 90 95
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
100 105 110
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
115 120 125
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
130 135 140
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
145 150 155 160
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
165 170 175
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
180 185 190
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
195 200 205
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
210 215 220
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
225 230 235 240
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
245 250 255
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
260 265 270
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
275 280 285
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
290 295 300
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
305 310 315 320
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
325 330 335
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
340 345 350
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
355 360 365
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
370 375 380
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
385 390 395 400
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
405 410 415
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
420 425 430
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
435 440 445
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
450 455 460
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
465 470 475 480
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
485 490 495
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
500 505 510
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
515 520 525
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala
530 535 540
Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu
545 550 555 560
Leu Ser Thr Phe Leu
565
<210> 81
<211> 1227
<212> DNA
<213> Artificial Sequence
<400> 81
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcagtga 1227
<210> 82
<211> 408
<212> PRT
<213> Artificial Sequence
<400> 82
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln
405
<210> 83
<211> 1308
<212> DNA
<213> Artificial Sequence
<400> 83
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcaggggtac attcccgagg ctcctaggga cggccaggca 1260
tacgtgcgca aagacggcga gtgggtgctg ctgtccacat tcctgtga 1308
<210> 84
<211> 435
<212> PRT
<213> Artificial Sequence
<400> 84
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg
405 410 415
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
420 425 430
Thr Phe Leu
435
<210> 85
<211> 1422
<212> DNA
<213> Artificial Sequence
<400> 85
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 1260
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 1320
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 1380
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 1422
<210> 86
<211> 473
<212> PRT
<213> Artificial Sequence
<400> 86
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
405 410 415
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
420 425 430
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
435 440 445
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
450 455 460
Leu Lys Gly Val Lys Leu His Tyr Thr
465 470
<210> 87
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 87
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tgcccaaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 88
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 88
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Pro Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 89
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 89
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tgcccaaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 90
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 90
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Pro Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 91
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 91
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tgcctccacc cgaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 92
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 92
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Pro Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 93
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 93
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tgcctccacc cgaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 94
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 94
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Pro Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 95
<211> 1422
<212> DNA
<213> Artificial Sequence
<400> 95
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtagctt catcgaggat 60
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 120
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 180
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 240
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 300
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 360
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 420
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 480
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 540
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 600
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 660
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 720
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 780
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 840
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 900
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 960
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 1020
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 1080
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 1140
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 1200
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 1260
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 1320
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 1380
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 1422
<210> 96
<211> 473
<212> PRT
<213> Artificial Sequence
<400> 96
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Ser
1 5 10 15
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
20 25 30
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
35 40 45
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
50 55 60
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
65 70 75 80
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
85 90 95
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
100 105 110
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
115 120 125
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
130 135 140
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
145 150 155 160
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
165 170 175
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
180 185 190
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
195 200 205
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
210 215 220
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
225 230 235 240
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
245 250 255
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
260 265 270
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
275 280 285
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
290 295 300
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
305 310 315 320
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
325 330 335
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
340 345 350
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
355 360 365
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
370 375 380
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
385 390 395 400
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
405 410 415
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
420 425 430
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
435 440 445
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
450 455 460
Leu Lys Gly Val Lys Leu His Tyr Thr
465 470
<210> 97
<211> 1380
<212> DNA
<213> Artificial Sequence
<400> 97
atgagcttca tcgaggatct cctgtttaac aaggtgaccc tggcagacgc cggctttatt 60
aagcaatatg gggattgcct gggcgacatt gctgccagag acctgatttg cgcccagaaa 120
ttcaatggcc tcacagtgct gccacctctg ctgaccgacg agatgatcgc tcaatacact 180
agcgcactgc tggccggaac catcacatca ggctggacct tcggggccgg agcagcactg 240
cagattccat tcgccatgca gatggcctat agattcaacg gcattggcgt cacacagaac 300
gtgctgtacg aaaaccagaa gctcatcgct aaccagttta attccgcaat tggaaagatc 360
caagattcac tcagctcaac cgcctctgca ctcggaaagc tgcaggacgt ggtcaaccag 420
aatgctcagg ccctgaacac actcgtcaag cagctgtcct ctaactttgg cgctatcagc 480
tccgttctga acgacattct gagccgcctg gataaggtgg aggctgaagt ccagattgac 540
cgcctgatta ccggccggct gcagtctctg caaacatacg tgacccagca gctgatcaga 600
gcagccgaga tccgggcatc cgcaaatctg gcagcaacta agatgagcga atgcgtgctg 660
ggccagtcca agcgggtgga cttttgtggc aagggctacc acctgatgag cttcccccag 720
agcgccccac atggcgttgt ttttctgcac gtgacctatg tccctgctca ggaaaagaac 780
tttacaactg ctcctgctat ctgccatgac ggcaaggccc acttcccacg ggagggagtg 840
tttgtgtcca atggcacaca ctggttcgtg acccagagga acttctatga accccagatc 900
atcaccactg acaatacctt cgtgtctgga aattgcgacg tcgtgatcgg catcgttaac 960
aacaccgtgt acgaccctct ccagccagag ctggactcct ttaaggagga actggataag 1020
tattttaaga accacacaag cccagatgtg gatctcgggg acatctccgg aattaacgcc 1080
tccgtggtga atatccagaa ggagattgac cgcctaaatg aagttgccaa gaacctcaat 1140
gagtctctga ttgatctgca ggaactgggc aagtatgagc agtatatcaa atggccctgg 1200
tacatttggc tggggtttat cgccggactg attgccatcg tcatggtgac catcatgctg 1260
tgttgcatga cctcctgttg ttcctgtctg aagggctgct gtagttgcgg ctcttgctgt 1320
aaattcgacg aagatgatag cgagcccgtg ctgaagggcg tgaagctgca ttatacctga 1380
<210> 98
<211> 459
<212> PRT
<213> SARS-CoV-2
<400> 98
Met Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
1 5 10 15
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
20 25 30
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
35 40 45
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
50 55 60
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
65 70 75 80
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
85 90 95
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
100 105 110
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
115 120 125
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
130 135 140
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
145 150 155 160
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
165 170 175
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
180 185 190
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
195 200 205
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
210 215 220
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
225 230 235 240
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
245 250 255
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
260 265 270
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
275 280 285
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
290 295 300
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
305 310 315 320
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
325 330 335
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
340 345 350
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
355 360 365
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
370 375 380
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
385 390 395 400
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
405 410 415
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly
420 425 430
Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
435 440 445
Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
450 455
<210> 99
<211> 31
<212> PRT
<213> Artificial Sequence
<400> 99
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
1 5 10 15
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
20 25 30
<210> 100
<211> 231
<212> PRT
<213> Artificial Sequence
<400> 100
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1 5 10 15
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
65 70 75 80
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Asp His His Asp
85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205
Cys Ser Val Met His Glu Ala Leu His Ser His Tyr Thr Gln Lys Ser
210 215 220
Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 101
<211> 231
<212> PRT
<213> Artificial Sequence
<400> 101
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1 5 10 15
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
65 70 75 80
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205
Cys Ser Val Leu His Glu Ala Leu His Ser His Tyr Thr Gln Lys Ser
210 215 220
Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 102
<211> 231
<212> PRT
<213> Artificial Sequence
<400> 102
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1 5 10 15
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30
Asp Thr Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val
35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
65 70 75 80
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
210 215 220
Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 103
<211> 231
<212> PRT
<213> Artificial Sequence
<400> 103
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1 5 10 15
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
20 25 30
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
35 40 45
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
50 55 60
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
65 70 75 80
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
85 90 95
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
100 105 110
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
115 120 125
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
130 135 140
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
145 150 155 160
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
165 170 175
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
180 185 190
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
195 200 205
Cys Ser Val Met His Glu Ala Leu Lys Phe His Tyr Thr Gln Lys Ser
210 215 220
Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 104
<211> 438
<212> PRT
<213> Artificial Sequence
<400> 104
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Pro
195 200 205
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
210 215 220
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
225 230 235 240
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
245 250 255
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
260 265 270
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
275 280 285
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Asp His His Asp Trp
290 295 300
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
305 310 315 320
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
325 330 335
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
340 345 350
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
355 360 365
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
370 375 380
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
385 390 395 400
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
405 410 415
Ser Val Met His Glu Ala Leu His Ser His Tyr Thr Gln Lys Ser Leu
420 425 430
Ser Leu Ser Pro Gly Lys
435
<210> 105
<211> 1317
<212> DNA
<213> Artificial Sequence
<400> 105
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 660
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 720
accctcatga tctctcgcac accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 780
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 840
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtggat 900
caccatgatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 960
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 1020
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 1080
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 1140
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1200
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgatgcac 1260
gaagctctgc actctcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1317
<210> 106
<211> 438
<212> PRT
<213> Artificial Sequence
<400> 106
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Pro
195 200 205
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
210 215 220
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
225 230 235 240
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
245 250 255
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
260 265 270
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
275 280 285
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
290 295 300
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
305 310 315 320
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
325 330 335
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
340 345 350
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
355 360 365
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
370 375 380
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
385 390 395 400
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
405 410 415
Ser Val Leu His Glu Ala Leu His Ser His Tyr Thr Gln Lys Ser Leu
420 425 430
Ser Leu Ser Pro Gly Lys
435
<210> 107
<211> 1317
<212> DNA
<213> Artificial Sequence
<400> 107
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 660
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 720
accctcatga tctctcgcac accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 780
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 840
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtgctg 900
caccaggatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 960
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 1020
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 1080
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 1140
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1200
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgttacac 1260
gaagctctgc actctcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1317
<210> 108
<211> 438
<212> PRT
<213> Artificial Sequence
<400> 108
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Pro
195 200 205
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
210 215 220
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
225 230 235 240
Thr Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val Asp
245 250 255
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
260 265 270
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
275 280 285
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
290 295 300
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
305 310 315 320
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
325 330 335
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
340 345 350
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
355 360 365
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
370 375 380
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
385 390 395 400
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
405 410 415
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
420 425 430
Ser Leu Ser Pro Gly Lys
435
<210> 109
<211> 1317
<212> DNA
<213> Artificial Sequence
<400> 109
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 660
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 720
accctctata tcactcgcga accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 780
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 840
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtgctg 900
caccaggatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 960
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 1020
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 1080
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 1140
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1200
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgatgcac 1260
gaagctctgc acaatcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1317
<210> 110
<211> 438
<212> PRT
<213> Artificial Sequence
<400> 110
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Pro
1 5 10 15
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
20 25 30
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
35 40 45
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
50 55 60
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
65 70 75 80
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
85 90 95
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
100 105 110
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
115 120 125
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
130 135 140
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
145 150 155 160
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
165 170 175
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
180 185 190
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Pro
195 200 205
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
210 215 220
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
225 230 235 240
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
245 250 255
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
260 265 270
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
275 280 285
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
290 295 300
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
305 310 315 320
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
325 330 335
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
340 345 350
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
355 360 365
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
370 375 380
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
385 390 395 400
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
405 410 415
Ser Val Met His Glu Ala Leu Lys Phe His Tyr Thr Gln Lys Ser Leu
420 425 430
Ser Leu Ser Pro Gly Lys
435
<210> 111
<211> 1317
<212> DNA
<213> Artificial Sequence
<400> 111
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtcctaa tatcactaac 60
ctgtgtcctt tcggtgaagt gttcaacgcc accaggtttg ctagcgtgta tgcctggaac 120
aggaagagga tctctaactg cgtcgccgac tattccgtgc tgtataacag cgcctccttc 180
tccacattca aatgctatgg agtgagcccg acaaaactga acgatctctg ctttacaaat 240
gtctacgccg actcttttgt gatcagaggg gacgaggtcc ggcagatcgc accaggacag 300
acaggcaaga ttgctgacta caactataag ctgcctgacg acttcacagg atgtgtgatc 360
gcatggaact caaacaatct ggactccaaa gtcgggggca actataatta cctgtatcgc 420
ctgttccgga agtccaacct gaagcccttc gagagggaca tcagtacaga gatctatcag 480
gctggctcca ccccttgcaa tggcgtcgaa ggctttaatt gttattttcc cctgcagtct 540
tacgggtttc agcctactaa tggagttggg taccagccat acagagtggt cgtgctcagc 600
ttcgagctcc tgcatgctcc acctaagtcc tgcgacaaaa cccatacatg tccaccatgc 660
ccagctcctg aactgctcgg cgggcctagt gttttcctct tccctcctaa gcccaaggat 720
accctcatga tctctcgcac accagaagtg acctgcgtgg tcgtggatgt ctctcacgag 780
gatcctgaag tgaagtttaa ctggtatgtc gacggagtgg aagtgcacaa cgccaagaca 840
aagccaagag aagaacaata caattctact tatagggtgg tgtctgtgct gacagtgctg 900
caccaggatt ggctgaatgg aaaagaatat aagtgtaagg tctctaacaa ggccctgccc 960
gctccaattg agaagacaat ttccaaggcc aaggggcagc ctcgggaacc tcaggtgtac 1020
acactgcccc catccaggga tgaactgact aaaaatcagg tgtctctgac atgcctggtg 1080
aaagggtttt atccaagtga cattgctgtg gagtgggagt ctaatgggca gcctgaaaat 1140
aactacaaga ccacaccacc agtgctcgat agcgacgggt ctttctttct gtattctaaa 1200
ctgaccgtgg ataaatctcg gtggcagcag ggaaacgtgt tttcttgctc agtgatgcac 1260
gaagctctga aatttcacta tacacagaaa tccctgtccc tgtctccagg caaataa 1317
<210> 112
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 112
atgggtgtgc acgaatgtcc tgcttggctg tggctccttc tctccctgct gtccctgcct 60
cttggactcc cggtgcttgg agcacccccg agactgatct gcgacagcag ggtgctcgag 120
cgctacctcc tggaagccaa ggaagccgaa aacatcacta ctggctgcgc cgaacactgc 180
tccctgaacg agaacatcac cgtgccggac accaaggtca acttctacgc gtggaagaga 240
atggaggtcg gacagcaagc cgtggaagtg tggcagggac ttgcgctcct gtcggaagcc 300
gtgctgaggg gacaagccct gctcgtgaac agctcacagc cttgggagcc cctgcagctg 360
catgtcgaca aggccgtgtc cggactgcgc tcactgacca ctctgctgag ggccttgggt 420
gcccagaaag aggctatttc cccaccggat gcagcctcgg cagctcctct gcggaccatt 480
acggcggaca cctttcggaa gctgttccgc gtctacagca atttcctccg ggggaagttg 540
aaactgtata ccggcgaagc ctgtcggact ggcgatcgct ga 582
<210> 113
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 113
atgggggttc atgagtgccc agcttggctt tggctcctgc tcagcttgct tagtctccct 60
ttgggcctgc ccgtgctggg cgcccctcca cgcttgatct gtgacagcag ggtcttggaa 120
cggtatttgc ttgaagctaa agaagctgag aacataacaa cgggatgtgc tgaacattgc 180
tccttgaacg aaaacatcac agttcccgac acaaaagtca atttttacgc atggaagcgg 240
atggaggttg gccagcaagc tgtggaggtc tggcaagggc tggctcttct cagtgaagcc 300
gtgctgcgcg gacaagcact cttggtgaac tccagccagc cctgggagcc ccttcagctc 360
catgtcgata aagcagttag cggcctccga tcattgacta ccctccttag ggctttgggt 420
gcacaaaaag aggccatttc accaccggac gcggcaagtg ctgctccgtt gcgaactata 480
actgctgaca ccttccggaa actttttcgg gtatattcca actttctcag ggggaaactc 540
aagctctaca ccggcgaggc gtgccgaact ggagaccgct ga 582
<210> 114
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 114
atgggcgtac atgaatgccc ggcatggctt tggctgctgc tgtccctgct gagtttgccg 60
ctgggcctcc ccgtcctcgg cgctcccccg agactcattt gcgactctag ggtcctcgaa 120
cgctatctgc tggaagcaaa agaagctgag aacataacta caggatgcgc tgagcactgt 180
tccttgaatg agaatatcac agtacctgac actaaggtga atttttacgc atggaaacgc 240
atggaagtgg gtcagcaggc cgtggaagtg tggcagggcc tggcgctgct gtccgaggct 300
gttcttagag gccaagcctt gttggtcaat tcctctcaac cctgggagcc cctccagctg 360
catgttgata aagccgtctc tggtctccgg tcccttacca ccctgctcag ggcacttggc 420
gcacagaagg aagctatctc ccccccagac gctgccagtg ccgcccccct ccggactatt 480
accgccgata ctttcaggaa actgtttcga gtctatagca attttctccg cgggaaactg 540
aagctgtata caggtgaggc ctgcaggaca ggagatcgct ga 582
<210> 115
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 115
atgggcgtgc acgaatgtcc tgcttggctg tggctgctgc tgagtctgct gtctctgcct 60
ctgggactgc ctgttcttgg agcccctcct agactgatct gcgacagcag agtgctggaa 120
agatacctgc tggaagccaa agaggccgag aacatcacaa caggctgtgc cgagcactgc 180
agcctgaacg agaatatcac cgtgcctgac accaaagtga acttctacgc ctggaagcgg 240
atggaagtgg gacagcaggc tgtggaagtt tggcaaggac tggccctgct gtctgaagct 300
gttctgagag gacaggctct gctggtcaat agctctcagc cttgggaacc tctccagctg 360
catgtggata aggccgtgtc tggcctgaga agcctgacaa cactgctgag agccctggga 420
gcccagaaag aggccatttc tccacctgat gctgccagcg ctgcccctct gagaacaatc 480
accgccgaca ccttcagaaa gctgttccgg gtgtacagca acttcctgcg gggcaagctg 540
aaactgtaca ccggcgaagc ctgcagaacc ggcgatagat aa 582
<210> 116
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 116
atgggggtgc acgagtgccc tgcctggctg tggttgctgc tgtccctgct gtctctgcca 60
ctgggactgc cagtgctggg agctccacct aggctgatct gcgacagccg ggtcctggag 120
aggtacctgc tcgaggccaa ggaggccgag aacattacca caggctgcgc cgagcactgc 180
agcctgaacg agaacattac agtgcccgat acaaaggtga acttctacgc ctggaagagg 240
atggaggtgg gccagcaggc cgtggaggtg tggcaggggc tggccctgct gagcgaggcc 300
gtgctgaggg gccaagccct gctggtcaac agcagccagc cttgggagcc cctgcagctc 360
cacgtggaca aggctgtgtc tggcttgagg tctctcacaa cattgctgag ggccctgggc 420
gcacagaaag aagctatcag cccacctgat gccgctagtg ccgctccact gcggacaatt 480
accgccgata cctttagaaa attgttcagg gtctactcca actttttgcg cgggaagctg 540
aagctctata ccggcgaggc ctgccggaca ggggacagat ga 582
<210> 117
<211> 582
<212> DNA
<213> Artificial Sequence
<400> 117
atgggagtgc acgaatgtcc tgcatggctc tggctcctgc tgtctctcct gagcctgcca 60
ctgggactcc cagtgctggg agcaccccct aggctgatct gcgattctcg ggtgctggag 120
cgctacctgc tcgaggctaa ggaggccgag aatatcacta ctgggtgtgc cgaacactgt 180
agcctcaatg aaaacattac agtcccagat accaaggtga acttttatgc atggaagagg 240
atggaggtcg ggcagcaggc agtggaggtg tggcagggac tggctctgct gtccgaagcc 300
gtgctcagag gtcaggccct gctggttaat tccagccagc cttgggaacc tctgcagctg 360
catgtggaca aggcagtgtc tggcctgaga tcccttacta cactgctgag agcactgggg 420
gctcagaaag aagctatttc cccaccagac gccgcctcag cagcacctct ccggaccatc 480
actgctgaca ccttccgcaa gctctttagg gtgtactcca acttcctgcg cgggaagctc 540
aagctgtaca ccggcgaagc ctgcaggacc ggggatcgct ga 582
<210> 118
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 118
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 119
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 119
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 120
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 120
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 121
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 121
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 122
<211> 3849
<212> DNA
<213> Artificial Sequence
<400> 122
atgttcctgc tgacaacaaa aagaaccatg tttgtgttcc tggtgctgct gcctctggtg 60
tcctcacagt gtgtcaacct gacaacaaga actcagctgc caccagccta caccaactcc 120
ttcaccagag gcgtgtatta cccagacaag gtgtttagaa gcagcgtgct gcactctacc 180
caggacctct ttctgccctt tttcagcaac gtgacatggt ttcacgcaat tcacgtgtcc 240
ggcactaatg gcacaaagcg gttcgacaat ccagtcctgc ctttcaacga tggcgtctac 300
tttgcatcta ctgagaaatc caatatcatt aggggatgga tcttcggcac aaccctggat 360
tctaagaccc agagcctgct gatcgtcaac aacgccacaa acgtggtcat taaggtttgc 420
gagtttcagt tctgtaacga tccttttctg ggcgtgtatt atcataagaa caataagagc 480
tggatggagt ccgagtttag agtgtatagc tctgcaaata attgtacctt tgagtacgtg 540
agccagccct ttctgatgga cctggaggga aaacaaggaa acttcaaaaa cctgcgggaa 600
ttcgttttca aaaacatcga cggctatttc aagatctata gcaagcatac cccaatcaac 660
ctcgtgaggg acctccccca gggctttagc gcactggagc cactggttga cctgcctatc 720
ggcattaata tcacaagatt tcagaccctg ctggcactgc atagaagcta tctgacccct 780
ggagactcct ctagtgggtg gactgccggc gccgctgcct actatgtggg ctatctgcag 840
ccacggacat tcctgctgaa atacaatgag aacgggacaa tcacagatgc tgttgattgc 900
gcactcgacc ccctgtccga gacaaagtgc actctcaaga gctttaccgt cgagaagggc 960
atctatcaga cctcaaactt cagggtgcag cccacagaat ctatcgtgcg cttccctaat 1020
atcactaacc tgtgtccttt cggtgaagtg ttcaacgcca ccaggtttgc tagcgtgtat 1080
gcctggaaca ggaagaggat ctctaactgc gtcgccgact attccgtgct gtataacagc 1140
gcctccttct ccacattcaa atgctatgga gtgagcccga caaaactgaa cgatctctgc 1200
tttacaaatg tctacgccga ctcttttgtg atcagagggg acgaggtccg gcagatcgca 1260
ccaggacaga caggcaagat tgctgactac aactataagc tgcctgacga cttcacagga 1320
tgtgtgatcg catggaactc aaacaatctg gactccaaag tcgggggcaa ctataattac 1380
ctgtatcgcc tgttccggaa gtccaacctg aagcccttcg agagggacat cagtacagag 1440
atctatcagg ctggctccac cccttgcaat ggcgtcgaag gctttaattg ttattttccc 1500
ctgcagtctt acgggtttca gcctactaat ggagttgggt accagccata cagagtggtc 1560
gtgctcagct tcgagctcct gcatgctcca gctacagttt gcgggccaaa gaagtccact 1620
aacctggtga agaataagtg cgtcaacttc aactttaacg ggctcaccgg caccggcgtg 1680
ctgactgaga gcaacaagaa gtttctgcca tttcaacagt ttggacggga cattgccgac 1740
accaccgatg ccgttcggga tccacagacc ctggaaattc tggacattac accgtgcagc 1800
ttcgggggcg tgagcgtgat cacacccgga accaatacaa gcaaccaggt tgccgtcctg 1860
tatcaggatg tcaattgcac agaagtgcca gttgctatcc acgcagacca gctgactccc 1920
acatggcggg tgtatagcac cggatccaac gtgtttcaga cccgcgccgg atgtctcatt 1980
ggggccgagc acgtgaataa cagctacgag tgcgacatcc ccattggcgc cggcatttgt 2040
gcgtcttacc agactcagac caactctcct ggctccgcct cttccgttgc tagtcagtct 2100
attattgcct ataccatgag cctcggagct gagaatagcg tggcctactc caataattcc 2160
atcgcaatcc ctactaactt cactatttct gtgaccaccg agatcctgcc tgtgtctatg 2220
actaagacta gcgttgattg taccatgtat atttgtggcg actctaccga atgttctaac 2280
ctgctgcttc agtacggctc attttgcaca cagctgaaca gagccctgac tgggatcgct 2340
gtggagcagg acaagaacac acaggaggtg tttgcacagg tgaagcagat ctataagacc 2400
cctcctatta aggatttcgg cggattcaat ttctcacaga ttctgccaga ccccagtaag 2460
ccttccaaga ggagcttcat cgaggatctc ctgtttaaca aggtgaccct ggcagacgcc 2520
ggctttatta agcaatatgg ggattgcctg ggcgacattg ctgccagaga cctgatttgc 2580
gcccagaaat tcaatggcct cacagtgctg ccacctctgc tgaccgacga gatgatcgct 2640
caatacacta gcgcactgct ggccggaacc atcacatcag gctggacctt cggggccgga 2700
gcagcactgc agattccatt cgccatgcag atggcctata gattcaacgg cattggcgtc 2760
acacagaacg tgctgtacga aaaccagaag ctcatcgcta accagtttaa ttccgcaatt 2820
ggaaagatcc aagattcact cagctcaacc gcctctgcac tcggaaagct gcaggacgtg 2880
gtcaaccaga atgctcaggc cctgaacaca ctcgtcaagc agctgtcctc taactttggc 2940
gctatcagct ccgttctgaa cgacattctg agccgcctgg atcccccaga ggctgaagtc 3000
cagattgacc gcctgattac cggccggctg cagtctctgc aaacatacgt gacccagcag 3060
ctgatcagag cagccgagat ccgggcatcc gcaaatctgg cagcaactaa gatgagcgaa 3120
tgcgtgctgg gccagtccaa gcgggtggac ttttgtggca agggctacca cctgatgagc 3180
ttcccccaga gcgccccaca tggcgttgtt tttctgcacg tgacctatgt ccctgctcag 3240
gaaaagaact ttacaactgc tcctgctatc tgccatgacg gcaaggccca cttcccacgg 3300
gagggagtgt ttgtgtccaa tggcacacac tggttcgtga cccagaggaa cttctatgaa 3360
ccccagatca tcaccactga caataccttc gtgtctggaa attgcgacgt cgtgatcggc 3420
atcgttaaca acaccgtgta cgaccctctc cagccagagc tggactcctt taaggaggaa 3480
ctggataagt attttaagaa ccacacaagc ccagatgtgg atctcgggga catctccgga 3540
attaacgcct ccgtggtgaa tatccagaag gagattgacc gcctaaatga agttgccaag 3600
aacctcaatg agtctctgat tgatctgcag gaactgggca agtatgagca gtatatcaaa 3660
tggccctggt acatttggct ggggtttatc gccggactga ttgccatcgt catggtgacc 3720
atcatgctgt gttgcatgac ctcctgttgt tcctgtctga agggctgctg tagttgcggc 3780
tcttgctgta aattcgacga agatgatagc gagcccgtgc tgaagggcgt gaagctgcat 3840
tatacctga 3849
<210> 123
<211> 1282
<212> PRT
<213> Artificial Sequence
<400> 123
Met Phe Leu Leu Thr Thr Lys Arg Thr Met Phe Val Phe Leu Val Leu
1 5 10 15
Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln
20 25 30
Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro
35 40 45
Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe
50 55 60
Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser
65 70 75 80
Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn
85 90 95
Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly
100 105 110
Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile
115 120 125
Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe
130 135 140
Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser
145 150 155 160
Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr
165 170 175
Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln
180 185 190
Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly
195 200 205
Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp
210 215 220
Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile
225 230 235 240
Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser
245 250 255
Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala
260 265 270
Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr
275 280 285
Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro
290 295 300
Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly
305 310 315 320
Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val
325 330 335
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
340 345 350
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
355 360 365
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
370 375 380
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
385 390 395 400
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
405 410 415
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
420 425 430
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
435 440 445
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
450 455 460
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
465 470 475 480
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
485 490 495
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
500 505 510
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
515 520 525
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys
530 535 540
Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val
545 550 555 560
Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg
565 570 575
Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu
580 585 590
Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr
595 600 605
Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val
610 615 620
Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro
625 630 635 640
Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala
645 650 655
Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp
660 665 670
Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn
675 680 685
Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr
690 695 700
Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser
705 710 715 720
Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
725 730 735
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys
740 745 750
Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe
755 760 765
Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp
770 775 780
Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr
785 790 795 800
Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro
805 810 815
Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe
820 825 830
Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp
835 840 845
Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe
850 855 860
Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala
865 870 875 880
Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr
885 890 895
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
900 905 910
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn
915 920 925
Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln
930 935 940
Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val
945 950 955 960
Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
965 970 975
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg
980 985 990
Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
995 1000 1005
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala
1010 1015 1020
Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1025 1030 1035 1040
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1045 1050 1055
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu
1060 1065 1070
His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1075 1080 1085
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1090 1095 1100
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu
1105 1110 1115 1120
Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1125 1130 1135
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1140 1145 1150
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His
1155 1160 1165
Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1170 1175 1180
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1185 1190 1195 1200
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1205 1210 1215
Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly
1220 1225 1230
Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1235 1240 1245
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys
1250 1255 1260
Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His
1265 1270 1275 1280
Tyr Thr
<210> 124
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 124
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtggccctg gcttatacct ga 3822
<210> 125
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 125
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Ala Leu Ala Tyr Thr
1265 1270
<210> 126
<211> 3849
<212> DNA
<213> Artificial Sequence
<400> 126
atgttcctgc tgacaacaaa aagaaccatg tttgtgttcc tggtgctgct gcctctggtg 60
tcctcacagt gtgtcaacct gacaacaaga actcagctgc caccagccta caccaactcc 120
ttcaccagag gcgtgtatta cccagacaag gtgtttagaa gcagcgtgct gcactctacc 180
caggacctct ttctgccctt tttcagcaac gtgacatggt ttcacgcaat tcacgtgtcc 240
ggcactaatg gcacaaagcg gttcgacaat ccagtcctgc ctttcaacga tggcgtctac 300
tttgcatcta ctgagaaatc caatatcatt aggggatgga tcttcggcac aaccctggat 360
tctaagaccc agagcctgct gatcgtcaac aacgccacaa acgtggtcat taaggtttgc 420
gagtttcagt tctgtaacga tccttttctg ggcgtgtatt atcataagaa caataagagc 480
tggatggagt ccgagtttag agtgtatagc tctgcaaata attgtacctt tgagtacgtg 540
agccagccct ttctgatgga cctggaggga aaacaaggaa acttcaaaaa cctgcgggaa 600
ttcgttttca aaaacatcga cggctatttc aagatctata gcaagcatac cccaatcaac 660
ctcgtgaggg acctccccca gggctttagc gcactggagc cactggttga cctgcctatc 720
ggcattaata tcacaagatt tcagaccctg ctggcactgc atagaagcta tctgacccct 780
ggagactcct ctagtgggtg gactgccggc gccgctgcct actatgtggg ctatctgcag 840
ccacggacat tcctgctgaa atacaatgag aacgggacaa tcacagatgc tgttgattgc 900
gcactcgacc ccctgtccga gacaaagtgc actctcaaga gctttaccgt cgagaagggc 960
atctatcaga cctcaaactt cagggtgcag cccacagaat ctatcgtgcg cttccctaat 1020
atcactaacc tgtgtccttt cggtgaagtg ttcaacgcca ccaggtttgc tagcgtgtat 1080
gcctggaaca ggaagaggat ctctaactgc gtcgccgact attccgtgct gtataacagc 1140
gcctccttct ccacattcaa atgctatgga gtgagcccga caaaactgaa cgatctctgc 1200
tttacaaatg tctacgccga ctcttttgtg atcagagggg acgaggtccg gcagatcgca 1260
ccaggacaga caggcaagat tgctgactac aactataagc tgcctgacga cttcacagga 1320
tgtgtgatcg catggaactc aaacaatctg gactccaaag tcgggggcaa ctataattac 1380
ctgtatcgcc tgttccggaa gtccaacctg aagcccttcg agagggacat cagtacagag 1440
atctatcagg ctggctccac cccttgcaat ggcgtcgaag gctttaattg ttattttccc 1500
ctgcagtctt acgggtttca gcctactaat ggagttgggt accagccata cagagtggtc 1560
gtgctcagct tcgagctcct gcatgctcca gctacagttt gcgggccaaa gaagtccact 1620
aacctggtga agaataagtg cgtcaacttc aactttaacg ggctcaccgg caccggcgtg 1680
ctgactgaga gcaacaagaa gtttctgcca tttcaacagt ttggacggga cattgccgac 1740
accaccgatg ccgttcggga tccacagacc ctggaaattc tggacattac accgtgcagc 1800
ttcgggggcg tgagcgtgat cacacccgga accaatacaa gcaaccaggt tgccgtcctg 1860
tatcaggatg tcaattgcac agaagtgcca gttgctatcc acgcagacca gctgactccc 1920
acatggcggg tgtatagcac cggatccaac gtgtttcaga cccgcgccgg atgtctcatt 1980
ggggccgagc acgtgaataa cagctacgag tgcgacatcc ccattggcgc cggcatttgt 2040
gcgtcttacc agactcagac caactctcct ggctccgcct cttccgttgc tagtcagtct 2100
attattgcct ataccatgag cctcggagct gagaatagcg tggcctactc caataattcc 2160
atcgcaatcc ctactaactt cactatttct gtgaccaccg agatcctgcc tgtgtctatg 2220
actaagacta gcgttgattg taccatgtat atttgtggcg actctaccga atgttctaac 2280
ctgctgcttc agtacggctc attttgcaca cagctgaaca gagccctgac tgggatcgct 2340
gtggagcagg acaagaacac acaggaggtg tttgcacagg tgaagcagat ctataagacc 2400
cctcctatta aggatttcgg cggattcaat ttctcacaga ttctgccaga ccccagtaag 2460
ccttccaaga ggagcttcat cgaggatctc ctgtttaaca aggtgaccct ggcagacgcc 2520
ggctttatta agcaatatgg ggattgcctg ggcgacattg ctgccagaga cctgatttgc 2580
gcccagaaat tcaatggcct cacagtgctg ccacctctgc tgaccgacga gatgatcgct 2640
caatacacta gcgcactgct ggccggaacc atcacatcag gctggacctt cggggccgga 2700
gcagcactgc agattccatt cgccatgcag atggcctata gattcaacgg cattggcgtc 2760
acacagaacg tgctgtacga aaaccagaag ctcatcgcta accagtttaa ttccgcaatt 2820
ggaaagatcc aagattcact cagctcaacc gcctctgcac tcggaaagct gcaggacgtg 2880
gtcaaccaga atgctcaggc cctgaacaca ctcgtcaagc agctgtcctc taactttggc 2940
gctatcagct ccgttctgaa cgacattctg agccgcctgg atcccccaga ggctgaagtc 3000
cagattgacc gcctgattac cggccggctg cagtctctgc aaacatacgt gacccagcag 3060
ctgatcagag cagccgagat ccgggcatcc gcaaatctgg cagcaactaa gatgagcgaa 3120
tgcgtgctgg gccagtccaa gcgggtggac ttttgtggca agggctacca cctgatgagc 3180
ttcccccaga gcgccccaca tggcgttgtt tttctgcacg tgacctatgt ccctgctcag 3240
gaaaagaact ttacaactgc tcctgctatc tgccatgacg gcaaggccca cttcccacgg 3300
gagggagtgt ttgtgtccaa tggcacacac tggttcgtga cccagaggaa cttctatgaa 3360
ccccagatca tcaccactga caataccttc gtgtctggaa attgcgacgt cgtgatcggc 3420
atcgttaaca acaccgtgta cgaccctctc cagccagagc tggactcctt taaggaggaa 3480
ctggataagt attttaagaa ccacacaagc ccagatgtgg atctcgggga catctccgga 3540
attaacgcct ccgtggtgaa tatccagaag gagattgacc gcctaaatga agttgccaag 3600
aacctcaatg agtctctgat tgatctgcag gaactgggca agtatgagca gtatatcaaa 3660
tggccctggt acatttggct ggggtttatc gccggactga ttgccatcgt catggtgacc 3720
atcatgctgt gttgcatgac ctcctgttgt tcctgtctga agggctgctg tagttgcggc 3780
tcttgctgta aattcgacga agatgatagc gagcccgtgc tgaagggcgt ggccctggct 3840
tatacctga 3849
<210> 127
<211> 1282
<212> PRT
<213> Artificial Sequence
<400> 127
Met Phe Leu Leu Thr Thr Lys Arg Thr Met Phe Val Phe Leu Val Leu
1 5 10 15
Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln
20 25 30
Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro
35 40 45
Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe
50 55 60
Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser
65 70 75 80
Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn
85 90 95
Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly
100 105 110
Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile
115 120 125
Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe
130 135 140
Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser
145 150 155 160
Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr
165 170 175
Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln
180 185 190
Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly
195 200 205
Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp
210 215 220
Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile
225 230 235 240
Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser
245 250 255
Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala
260 265 270
Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr
275 280 285
Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro
290 295 300
Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly
305 310 315 320
Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val
325 330 335
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
340 345 350
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
355 360 365
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
370 375 380
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
385 390 395 400
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
405 410 415
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
420 425 430
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
435 440 445
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
450 455 460
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
465 470 475 480
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
485 490 495
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
500 505 510
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
515 520 525
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys
530 535 540
Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val
545 550 555 560
Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg
565 570 575
Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu
580 585 590
Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr
595 600 605
Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val
610 615 620
Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro
625 630 635 640
Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala
645 650 655
Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp
660 665 670
Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn
675 680 685
Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr
690 695 700
Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser
705 710 715 720
Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
725 730 735
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys
740 745 750
Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe
755 760 765
Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp
770 775 780
Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr
785 790 795 800
Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro
805 810 815
Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe
820 825 830
Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp
835 840 845
Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe
850 855 860
Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala
865 870 875 880
Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr
885 890 895
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
900 905 910
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn
915 920 925
Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln
930 935 940
Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val
945 950 955 960
Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
965 970 975
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg
980 985 990
Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
995 1000 1005
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala
1010 1015 1020
Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1025 1030 1035 1040
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1045 1050 1055
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu
1060 1065 1070
His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1075 1080 1085
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1090 1095 1100
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu
1105 1110 1115 1120
Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1125 1130 1135
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1140 1145 1150
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His
1155 1160 1165
Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1170 1175 1180
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1185 1190 1195 1200
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1205 1210 1215
Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly
1220 1225 1230
Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1235 1240 1245
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys
1250 1255 1260
Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Ala Leu Ala
1265 1270 1275 1280
Tyr Thr
<210> 128
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 128
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagccc tatcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggaccagcac tgcagattcc attccctatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accccctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 129
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 129
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 130
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 130
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagccc tatcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggaccagcac tgcagattcc attccctatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accccctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 131
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 131
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 132
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 132
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagccc tatcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggaccagcac tgcagattcc attccctatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accccctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 133
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 133
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 134
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 134
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagccc tatcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggaccagcac tgcagattcc attccctatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accccctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 135
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 135
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 136
<211> 3849
<212> DNA
<213> Artificial Sequence
<400> 136
atgttcctgc tgacaacaaa aagaaccatg tttgtgttcc tggtgctgct gcctctggtg 60
tcctcacagt gtgtcaacct gacaacaaga actcagctgc caccagccta caccaactcc 120
ttcaccagag gcgtgtatta cccagacaag gtgtttagaa gcagcgtgct gcactctacc 180
caggacctct ttctgccctt tttcagcaac gtgacatggt ttcacgcaat tcacgtgtcc 240
ggcactaatg gcacaaagcg gttcgacaat ccagtcctgc ctttcaacga tggcgtctac 300
tttgcatcta ctgagaaatc caatatcatt aggggatgga tcttcggcac aaccctggat 360
tctaagaccc agagcctgct gatcgtcaac aacgccacaa acgtggtcat taaggtttgc 420
gagtttcagt tctgtaacga tccttttctg ggcgtgtatt atcataagaa caataagagc 480
tggatggagt ccgagtttag agtgtatagc tctgcaaata attgtacctt tgagtacgtg 540
agccagccct ttctgatgga cctggaggga aaacaaggaa acttcaaaaa cctgcgggaa 600
ttcgttttca aaaacatcga cggctatttc aagatctata gcaagcatac cccaatcaac 660
ctcgtgaggg acctccccca gggctttagc gcactggagc cactggttga cctgcctatc 720
ggcattaata tcacaagatt tcagaccctg ctggcactgc atagaagcta tctgacccct 780
ggagactcct ctagtgggtg gactgccggc gccgctgcct actatgtggg ctatctgcag 840
ccacggacat tcctgctgaa atacaatgag aacgggacaa tcacagatgc tgttgattgc 900
gcactcgacc ccctgtccga gacaaagtgc actctcaaga gctttaccgt cgagaagggc 960
atctatcaga cctcaaactt cagggtgcag cccacagaat ctatcgtgcg cttccctaat 1020
atcactaacc tgtgtccttt cggtgaagtg ttcaacgcca ccaggtttgc tagcgtgtat 1080
gcctggaaca ggaagaggat ctctaactgc gtcgccgact attccgtgct gtataacagc 1140
gcctccttct ccacattcaa atgctatgga gtgagcccga caaaactgaa cgatctctgc 1200
tttacaaatg tctacgccga ctcttttgtg atcagagggg acgaggtccg gcagatcgca 1260
ccaggacaga caggcaagat tgctgactac aactataagc tgcctgacga cttcacagga 1320
tgtgtgatcg catggaactc aaacaatctg gactccaaag tcgggggcaa ctataattac 1380
ctgtatcgcc tgttccggaa gtccaacctg aagcccttcg agagggacat cagtacagag 1440
atctatcagg ctggctccac cccttgcaat ggcgtcgaag gctttaattg ttattttccc 1500
ctgcagtctt acgggtttca gcctactaat ggagttgggt accagccata cagagtggtc 1560
gtgctcagct tcgagctcct gcatgctcca gctacagttt gcgggccaaa gaagtccact 1620
aacctggtga agaataagtg cgtcaacttc aactttaacg ggctcaccgg caccggcgtg 1680
ctgactgaga gcaacaagaa gtttctgcca tttcaacagt ttggacggga cattgccgac 1740
accaccgatg ccgttcggga tccacagacc ctggaaattc tggacattac accgtgcagc 1800
ttcgggggcg tgagcgtgat cacacccgga accaatacaa gcaaccaggt tgccgtcctg 1860
tatcaggatg tcaattgcac agaagtgcca gttgctatcc acgcagacca gctgactccc 1920
acatggcggg tgtatagcac cggatccaac gtgtttcaga cccgcgccgg atgtctcatt 1980
ggggccgagc acgtgaataa cagctacgag tgcgacatcc ccattggcgc cggcatttgt 2040
gcgtcttacc agactcagac caactctcct ggctccgcct cttccgttgc tagtcagtct 2100
attattgcct ataccatgag cctcggagct gagaatagcg tggcctactc caataattcc 2160
atcgcaatcc ctactaactt cactatttct gtgaccaccg agatcctgcc tgtgtctatg 2220
actaagacta gcgttgattg taccatgtat atttgtggcg actctaccga atgttctaac 2280
ctgctgcttc agtacggctc attttgcaca cagctgaaca gagccctgac tgggatcgct 2340
gtggagcagg acaagaacac acaggaggtg tttgcacagg tgaagcagat ctataagacc 2400
cctcctatta aggatttcgg cggattcaat ttctcacaga ttctgccaga ccccagtaag 2460
ccttccaaga ggagccctat cgaggatctc ctgtttaaca aggtgaccct ggcagacgcc 2520
ggctttatta agcaatatgg ggattgcctg ggcgacattg ctgccagaga cctgatttgc 2580
gcccagaaat tcaatggcct cacagtgctg ccacctctgc tgaccgacga gatgatcgct 2640
caatacacta gcgcactgct ggccggaacc atcacatcag gctggacctt cggggccgga 2700
ccagcactgc agattccatt ccctatgcag atggcctata gattcaacgg cattggcgtc 2760
acacagaacg tgctgtacga aaaccagaag ctcatcgcta accagtttaa ttccgcaatt 2820
ggaaagatcc aagattcact cagctcaacc ccctctgcac tcggaaagct gcaggacgtg 2880
gtcaaccaga atgctcaggc cctgaacaca ctcgtcaagc agctgtcctc taactttggc 2940
gctatcagct ccgttctgaa cgacattctg agccgcctgg atcccccaga ggctgaagtc 3000
cagattgacc gcctgattac cggccggctg cagtctctgc aaacatacgt gacccagcag 3060
ctgatcagag cagccgagat ccgggcatcc gcaaatctgg cagcaactaa gatgagcgaa 3120
tgcgtgctgg gccagtccaa gcgggtggac ttttgtggca agggctacca cctgatgagc 3180
ttcccccaga gcgccccaca tggcgttgtt tttctgcacg tgacctatgt ccctgctcag 3240
gaaaagaact ttacaactgc tcctgctatc tgccatgacg gcaaggccca cttcccacgg 3300
gagggagtgt ttgtgtccaa tggcacacac tggttcgtga cccagaggaa cttctatgaa 3360
ccccagatca tcaccactga caataccttc gtgtctggaa attgcgacgt cgtgatcggc 3420
atcgttaaca acaccgtgta cgaccctctc cagccagagc tggactcctt taaggaggaa 3480
ctggataagt attttaagaa ccacacaagc ccagatgtgg atctcgggga catctccgga 3540
attaacgcct ccgtggtgaa tatccagaag gagattgacc gcctaaatga agttgccaag 3600
aacctcaatg agtctctgat tgatctgcag gaactgggca agtatgagca gtatatcaaa 3660
tggccctggt acatttggct ggggtttatc gccggactga ttgccatcgt catggtgacc 3720
atcatgctgt gttgcatgac ctcctgttgt tcctgtctga agggctgctg tagttgcggc 3780
tcttgctgta aattcgacga agatgatagc gagcccgtgc tgaagggcgt gaagctgcat 3840
tatacctga 3849
<210> 137
<211> 1282
<212> PRT
<213> Artificial Sequence
<400> 137
Met Phe Leu Leu Thr Thr Lys Arg Thr Met Phe Val Phe Leu Val Leu
1 5 10 15
Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln
20 25 30
Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro
35 40 45
Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe
50 55 60
Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser
65 70 75 80
Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn
85 90 95
Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly
100 105 110
Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile
115 120 125
Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe
130 135 140
Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser
145 150 155 160
Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr
165 170 175
Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln
180 185 190
Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly
195 200 205
Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp
210 215 220
Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile
225 230 235 240
Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser
245 250 255
Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala
260 265 270
Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr
275 280 285
Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro
290 295 300
Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly
305 310 315 320
Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val
325 330 335
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
340 345 350
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
355 360 365
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
370 375 380
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
385 390 395 400
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
405 410 415
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
420 425 430
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
435 440 445
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
450 455 460
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
465 470 475 480
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
485 490 495
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
500 505 510
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
515 520 525
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys
530 535 540
Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val
545 550 555 560
Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg
565 570 575
Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu
580 585 590
Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr
595 600 605
Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val
610 615 620
Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro
625 630 635 640
Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala
645 650 655
Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp
660 665 670
Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn
675 680 685
Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr
690 695 700
Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser
705 710 715 720
Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
725 730 735
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys
740 745 750
Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe
755 760 765
Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp
770 775 780
Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr
785 790 795 800
Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro
805 810 815
Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe
820 825 830
Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp
835 840 845
Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe
850 855 860
Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala
865 870 875 880
Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr
885 890 895
Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala
900 905 910
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn
915 920 925
Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln
930 935 940
Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val
945 950 955 960
Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
965 970 975
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg
980 985 990
Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
995 1000 1005
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala
1010 1015 1020
Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1025 1030 1035 1040
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1045 1050 1055
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu
1060 1065 1070
His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1075 1080 1085
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1090 1095 1100
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu
1105 1110 1115 1120
Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1125 1130 1135
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1140 1145 1150
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His
1155 1160 1165
Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1170 1175 1180
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1185 1190 1195 1200
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1205 1210 1215
Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly
1220 1225 1230
Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1235 1240 1245
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys
1250 1255 1260
Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His
1265 1270 1275 1280
Tyr Thr
<210> 138
<211> 3822
<212> DNA
<213> Artificial Sequence
<400> 138
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcaa gattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtcg aaggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
aatggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg atgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agcacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagccc tatcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggaccagcac tgcagattcc attccctatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accccctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccgtggt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtggccctg gcttatacct ga 3822
<210> 139
<211> 1273
<212> PRT
<213> Artificial Sequence
<400> 139
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Ala Leu Ala Tyr Thr
1265 1270
<210> 140
<211> 3849
<212> DNA
<213> Artificial Sequence
<400> 140
atgttcctgc tgacaacaaa aagaaccatg tttgtgttcc tggtgctgct gcctctggtg 60
tcctcacagt gtgtcaacct gacaacaaga actcagctgc caccagccta caccaactcc 120
ttcaccagag gcgtgtatta cccagacaag gtgtttagaa gcagcgtgct gcactctacc 180
caggacctct ttctgccctt tttcagcaac gtgacatggt ttcacgcaat tcacgtgtcc 240
ggcactaatg gcacaaagcg gttcgacaat ccagtcctgc ctttcaacga tggcgtctac 300
tttgcatcta ctgagaaatc caatatcatt aggggatgga tcttcggcac aaccctggat 360
tctaagaccc agagcctgct gatcgtcaac aacgccacaa acgtggtcat taaggtttgc 420
gagtttcagt tctgtaacga tccttttctg ggcgtgtatt atcataagaa caataagagc 480
tggatggagt ccgagtttag agtgtatagc tctgcaaata attgtacctt tgagtacgtg 540
agccagccct ttctgatgga cctggaggga aaacaaggaa acttcaaaaa cctgcgggaa 600
ttcgttttca aaaacatcga cggctatttc aagatctata gcaagcatac cccaatcaac 660
ctcgtgaggg acctccccca gggctttagc gcactggagc cactggttga cctgcctatc 720
ggcattaata tcacaagatt tcagaccctg ctggcactgc atagaagcta tctgacccct 780
ggagactcct ctagtgggtg gactgccggc gccgctgcct actatgtggg ctatctgcag 840
ccacggacat tcctgctgaa atacaatgag aacgggacaa tcacagatgc tgttgattgc 900
gcactcgacc ccctgtccga gacaaagtgc actctcaaga gctttaccgt cgagaagggc 960
atctatcaga cctcaaactt cagggtgcag cccacagaat ctatcgtgcg cttccctaat 1020
atcactaacc tgtgtccttt cggtgaagtg ttcaacgcca ccaggtttgc tagcgtgtat 1080
gcctggaaca ggaagaggat ctctaactgc gtcgccgact attccgtgct gtataacagc 1140
gcctccttct ccacattcaa atgctatgga gtgagcccga caaaactgaa cgatctctgc 1200
tttacaaatg tctacgccga ctcttttgtg atcagagggg acgaggtccg gcagatcgca 1260
ccaggacaga caggcaagat tgctgactac aactataagc tgcctgacga cttcacagga 1320
tgtgtgatcg catggaactc aaacaatctg gactccaaag tcgggggcaa ctataattac 1380
ctgtatcgcc tgttccggaa gtccaacctg aagcccttcg agagggacat cagtacagag 1440
atctatcagg ctggctccac cccttgcaat ggcgtcgaag gctttaattg ttattttccc 1500
ctgcagtctt acgggtttca gcctactaat ggagttgggt accagccata cagagtggtc 1560
gtgctcagct tcgagctcct gcatgctcca gctacagttt gcgggccaaa gaagtccact 1620
aacctggtga agaataagtg cgtcaacttc aactttaacg ggctcaccgg caccggcgtg 1680
ctgactgaga gcaacaagaa gtttctgcca tttcaacagt ttggacggga cattgccgac 1740
accaccgatg ccgttcggga tccacagacc ctggaaattc tggacattac accgtgcagc 1800
ttcgggggcg tgagcgtgat cacacccgga accaatacaa gcaaccaggt tgccgtcctg 1860
tatcaggatg tcaattgcac agaagtgcca gttgctatcc acgcagacca gctgactccc 1920
acatggcggg tgtatagcac cggatccaac gtgtttcaga cccgcgccgg atgtctcatt 1980
ggggccgagc acgtgaataa cagctacgag tgcgacatcc ccattggcgc cggcatttgt 2040
gcgtcttacc agactcagac caactctcct ggctccgcct cttccgttgc tagtcagtct 2100
attattgcct ataccatgag cctcggagct gagaatagcg tggcctactc caataattcc 2160
atcgcaatcc ctactaactt cactatttct gtgaccaccg agatcctgcc tgtgtctatg 2220
actaagacta gcgttgattg taccatgtat atttgtggcg actctaccga atgttctaac 2280
ctgctgcttc agtacggctc attttgcaca cagctgaaca gagccctgac tgggatcgct 2340
gtggagcagg acaagaacac acaggaggtg tttgcacagg tgaagcagat ctataagacc 2400
cctcctatta aggatttcgg cggattcaat ttctcacaga ttctgccaga ccccagtaag 2460
ccttccaaga ggagccctat cgaggatctc ctgtttaaca aggtgaccct ggcagacgcc 2520
ggctttatta agcaatatgg ggattgcctg ggcgacattg ctgccagaga cctgatttgc 2580
gcccagaaat tcaatggcct cacagtgctg ccacctctgc tgaccgacga gatgatcgct 2640
caatacacta gcgcactgct ggccggaacc atcacatcag gctggacctt cggggccgga 2700
ccagcactgc agattccatt ccctatgcag atggcctata gattcaacgg cattggcgtc 2760
acacagaacg tgctgtacga aaaccagaag ctcatcgcta accagtttaa ttccgcaatt 2820
ggaaagatcc aagattcact cagctcaacc ccctctgcac tcggaaagct gcaggacgtg 2880
gtcaaccaga atgctcaggc cctgaacaca ctcgtcaagc agctgtcctc taactttggc 2940
gctatcagct ccgttctgaa cgacattctg agccgcctgg atcccccaga ggctgaagtc 3000
cagattgacc gcctgattac cggccggctg cagtctctgc aaacatacgt gacccagcag 3060
ctgatcagag cagccgagat ccgggcatcc gcaaatctgg cagcaactaa gatgagcgaa 3120
tgcgtgctgg gccagtccaa gcgggtggac ttttgtggca agggctacca cctgatgagc 3180
ttcccccaga gcgccccaca tggcgttgtt tttctgcacg tgacctatgt ccctgctcag 3240
gaaaagaact ttacaactgc tcctgctatc tgccatgacg gcaaggccca cttcccacgg 3300
gagggagtgt ttgtgtccaa tggcacacac tggttcgtga cccagaggaa cttctatgaa 3360
ccccagatca tcaccactga caataccttc gtgtctggaa attgcgacgt cgtgatcggc 3420
atcgttaaca acaccgtgta cgaccctctc cagccagagc tggactcctt taaggaggaa 3480
ctggataagt attttaagaa ccacacaagc ccagatgtgg atctcgggga catctccgga 3540
attaacgcct ccgtggtgaa tatccagaag gagattgacc gcctaaatga agttgccaag 3600
aacctcaatg agtctctgat tgatctgcag gaactgggca agtatgagca gtatatcaaa 3660
tggccctggt acatttggct ggggtttatc gccggactga ttgccatcgt catggtgacc 3720
atcatgctgt gttgcatgac ctcctgttgt tcctgtctga agggctgctg tagttgcggc 3780
tcttgctgta aattcgacga agatgatagc gagcccgtgc tgaagggcgt ggccctggct 3840
tatacctga 3849
<210> 141
<211> 1282
<212> PRT
<213> Artificial Sequence
<400> 141
Met Phe Leu Leu Thr Thr Lys Arg Thr Met Phe Val Phe Leu Val Leu
1 5 10 15
Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln
20 25 30
Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro
35 40 45
Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe
50 55 60
Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser
65 70 75 80
Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn
85 90 95
Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly
100 105 110
Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile
115 120 125
Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe
130 135 140
Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser
145 150 155 160
Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr
165 170 175
Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln
180 185 190
Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly
195 200 205
Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp
210 215 220
Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile
225 230 235 240
Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser
245 250 255
Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala
260 265 270
Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr
275 280 285
Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro
290 295 300
Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly
305 310 315 320
Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val
325 330 335
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
340 345 350
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
355 360 365
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
370 375 380
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
385 390 395 400
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
405 410 415
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
420 425 430
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
435 440 445
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
450 455 460
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
465 470 475 480
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
485 490 495
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
500 505 510
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
515 520 525
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys
530 535 540
Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val
545 550 555 560
Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg
565 570 575
Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu
580 585 590
Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr
595 600 605
Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val
610 615 620
Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro
625 630 635 640
Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala
645 650 655
Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp
660 665 670
Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn
675 680 685
Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr
690 695 700
Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser
705 710 715 720
Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
725 730 735
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys
740 745 750
Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe
755 760 765
Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp
770 775 780
Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr
785 790 795 800
Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro
805 810 815
Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe
820 825 830
Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp
835 840 845
Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe
850 855 860
Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala
865 870 875 880
Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr
885 890 895
Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala
900 905 910
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn
915 920 925
Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln
930 935 940
Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val
945 950 955 960
Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
965 970 975
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg
980 985 990
Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
995 1000 1005
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala
1010 1015 1020
Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1025 1030 1035 1040
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr
1045 1050 1055
His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu
1060 1065 1070
His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1075 1080 1085
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1090 1095 1100
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu
1105 1110 1115 1120
Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1125 1130 1135
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1140 1145 1150
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His
1155 1160 1165
Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1170 1175 1180
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1185 1190 1195 1200
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1205 1210 1215
Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly
1220 1225 1230
Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1235 1240 1245
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys
1250 1255 1260
Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Ala Leu Ala
1265 1270 1275 1280
Tyr Thr
<210> 142
<211> 24
<212> PRT
<213> SARS-COV-2
<400> 142
Met Phe Leu Leu Thr Thr Lys Arg Thr Met Phe Val Phe Leu Val Leu
1 5 10 15
Leu Pro Leu Val Ser Ser Gln Cys
20
<210> 143
<211> 72
<212> DNA
<213> Artificial Sequence
<400> 143
atgttcctgc tgacaacaaa aagaaccatg tttgtgttcc tggtgctgct gcctctggtg 60
tcctcacagt gt 72
<210> 144
<211> 140
<212> RNA
<213> Artificial Sequence
<400> 144
ggacagaucg ccuggagacg ccauccacgc uguuuugacc uccauagaag acaccgggac 60
cgauccagcc uccgcggccg ggaacggugc auuggaacgc ggauuccccg ugccaagagu 120
gacucaccgu ccuugacacg 140
<210> 145
<211> 105
<212> RNA
<213> Artificial Sequence
<400> 145
cggguggcau cccugugacc ccuccccagu gccucuccug gcccuggaag uugccacucc 60
agugcccacc agccuugucc uaauaaaauu aaguugcauc aagcu 105
<210> 146
<211> 105
<212> RNA
<213> Artificial Sequence
<400> 146
ggguggcauc ccugugaccc cuccccagug ccucuccugg cccuggaagu ugccacucca 60
gugcccacca gccuuguccu aauaaaauua aguugcauca aagcu 105
<210> 147
<211> 4067
<212> RNA
<213> Artificial Sequence
<400> 147
ggacagaucg ccuggagacg ccauccacgc uguuuugacc uccauagaag acaccgggac 60
cgauccagcc uccgcggccg ggaacggugc auuggaacgc ggauuccccg ugccaagagu 120
gacucaccgu ccuugacacg auguucgucu uccucgugcu gcucccacuc guuucuuccc 180
agugugucaa ccugacaacu aggacucagc ugccaccagc cuacaccaac uccuucacca 240
gaggcgugua uuacccagac aagguguuua gaagcagcgu gcugcacucu acccaggacc 300
ucuuucugcc cuuuuucagc aacgugacau gguuucacgc aauucacgug uccggcacua 360
auggcacaaa gcgguucgac aauccagucc ugccuuucaa cgauggcguc uacuuugcau 420
cuacugagaa auccaauauc auuaggggau ggaucuucgg cacaacccug gauucuaaga 480
cccagagccu gcugaucguc aacaacgcca caaacguggu cauuaagguu ugcgaguuuc 540
aguucuguaa cgauccuuuu cugggcgugu auuaucauaa gaacaauaag agcuggaugg 600
aguccgaguu uagaguguau agcucugcaa auaauuguac cuuugaguac gugagccagc 660
ccuuucugau ggaccuggag ggaaaacaag gaaacuucaa aaaccugcgg gaauucguuu 720
ucaaaaacau cgacggcuau uucaagaucu auagcaagca uaccccaauc aaccucguga 780
gggaccuccc ccagggcuuu agcgcacugg agccacuggu ugaccugccu aucggcauua 840
auaucacaag auuucagacc cugcuggcac ugcauagaag cuaucugacc ccuggagacu 900
ccucuagugg guggacugcc ggcgccgcug ccuacuaugu gggcuaucug cagccacgga 960
cauuccugcu gaaauacaau gagaacggga caaucacaga ugcuguugau ugcgcacucg 1020
acccccuguc cgagacaaag ugcacucuca agagcuuuac cgucgagaag ggcaucuauc 1080
agaccucaaa cuucagggug cagcccacag aaucuaucgu gcgcuucccu aauaucacua 1140
accugugucc uuucggugaa guguucaacg ccaccagguu ugcuagcgug uaugccugga 1200
acaggaagag gaucucuaac ugcgucgccg acuauuccgu gcuguauaac agcgccuccu 1260
ucuccacauu caaaugcuau ggagugagcc cgacaaaacu gaacgaucuc ugcuuuacaa 1320
augucuacgc cgacucuuuu gugaucagag gggacgaggu ccggcagauc gcaccaggac 1380
agacaggcaa gauugcugac uacaacuaua agcugccuga cgacuucaca ggauguguga 1440
ucgcauggaa cucaaacaau cuggacucca aagucggggg caacuauaau uaccuguauc 1500
gccuguuccg gaaguccaac cugaagcccu ucgagaggga caucaguaca gagaucuauc 1560
aggcuggcuc caccccuugc aauggcgucg aaggcuuuaa uuguuauuuu ccccugcagu 1620
cuuacggguu ucagccuacu aauggaguug gguaccagcc auacagagug gucgugcuca 1680
gcuucgagcu ccugcaugcu ccagcuacag uuugcgggcc aaagaagucc acuaaccugg 1740
ugaagaauaa gugcgucaac uucaacuuua acgggcucac cggcaccggc gugcugacug 1800
agagcaacaa gaaguuucug ccauuucaac aguuuggacg ggacauugcc gacaccaccg 1860
augccguucg ggauccacag acccuggaaa uucuggacau uacaccgugc agcuucgggg 1920
gcgugagcgu gaucacaccc ggaaccaaua caagcaacca gguugccguc cuguaucagg 1980
augucaauug cacagaagug ccaguugcua uccacgcaga ccagcugacu cccacauggc 2040
ggguguauag caccggaucc aacguguuuc agacccgcgc cggaugucuc auuggggccg 2100
agcacgugaa uaacagcuac gagugcgaca uccccauugg cgccggcauu ugugcgucuu 2160
accagacuca gaccaacucu ccuggcuccg ccucuuccgu ugcuagucag ucuauuauug 2220
ccuauaccau gagccucgga gcugagaaua gcguggccua cuccaauaau uccaucgcaa 2280
ucccuacuaa cuucacuauu ucugugacca ccgagauccu gccugugucu augacuaaga 2340
cuagcguuga uuguaccaug uauauuugug gcgacucuac cgaauguucu aaccugcugc 2400
uucaguacgg cucauuuugc acacagcuga acagagcccu gacugggauc gcuguggagc 2460
aggacaagaa cacacaggag guguuugcac aggugaagca gaucuauaag accccuccua 2520
uuaaggauuu cggcggauuc aauuucucac agauucugcc agaccccagu aagccuucca 2580
agaggagcuu caucgaggau cuccuguuua acaaggugac ccuggcagac gccggcuuua 2640
uuaagcaaua uggggauugc cugggcgaca uugcugccag agaccugauu ugcgcccaga 2700
aauucaaugg ccucacagug cugccaccuc ugcugaccga cgagaugauc gcucaauaca 2760
cuagcgcacu gcuggccgga accaucacau caggcuggac cuucggggcc ggagcagcac 2820
ugcagauucc auucgccaug cagauggccu auagauucaa cggcauuggc gucacacaga 2880
acgugcugua cgaaaaccag aagcucaucg cuaaccaguu uaauuccgca auuggaaaga 2940
uccaagauuc acucagcuca accgccucug cacucggaaa gcugcaggac guggucaacc 3000
agaaugcuca ggcccugaac acacucguca agcagcuguc cucuaacuuu ggcgcuauca 3060
gcuccguucu gaacgacauu cugagccgcc uggauccccc agaggcugaa guccagauug 3120
accgccugau uaccggccgg cugcagucuc ugcaaacaua cgugacccag cagcugauca 3180
gagcagccga gauccgggca uccgcaaauc uggcagcaac uaagaugagc gaaugcgugc 3240
ugggccaguc caagcgggug gacuuuugug gcaagggcua ccaccugaug agcuuccccc 3300
agagcgcccc acauggcguu guuuuucugc acgugaccua ugucccugcu caggaaaaga 3360
acuuuacaac ugcuccugcu aucugccaug acggcaaggc ccacuuccca cgggagggag 3420
uguuuguguc caauggcaca cacugguucg ugacccagag gaacuucuau gaaccccaga 3480
ucaucaccac ugacaauacc uucgugucug gaaauugcga cgucgugauc ggcaucguua 3540
acaacaccgu guacgacccu cuccagccag agcuggacuc cuuuaaggag gaacuggaua 3600
aguauuuuaa gaaccacaca agcccagaug uggaucucgg ggacaucucc ggaauuaacg 3660
ccuccguggu gaauauccag aaggagauug accgccuaaa ugaaguugcc aagaaccuca 3720
augagucucu gauugaucug caggaacugg gcaaguauga gcaguauauc aaauggcccu 3780
gguacauuug gcugggguuu aucgccggac ugauugccau cgucauggug accaucaugc 3840
uguguugcau gaccuccugu uguuccuguc ugaagggcug cuguaguugc ggcucuugcu 3900
guaaauucga cgaagaugau agcgagcccg ugcugaaggg cgugaagcug cauuauaccu 3960
gacggguggc aucccuguga ccccucccca gugccucucc uggcccugga aguugccacu 4020
ccagugccca ccagccuugu ccuaauaaaa uuaaguugca ucaagcu 4067
<210> 148
<211> 3822
<212> RNA
<213> Artificial Sequence
<400> 148
auguucgucu uccucgugcu gcucccacuc guuucuuccc agugugucaa ccugacaacu 60
aggacucagc ugccaccagc cuacaccaac uccuucacca gaggcgugua uuacccagac 120
aagguguuua gaagcagcgu gcugcacucu acccaggacc ucuuucugcc cuuuuucagc 180
aacgugacau gguuucacgc aauucacgug uccggcacua auggcacaaa gcgguucgac 240
aauccagucc ugccuuucaa cgauggcguc uacuuugcau cuacugagaa auccaauauc 300
auuaggggau ggaucuucgg cacaacccug gauucuaaga cccagagccu gcugaucguc 360
aacaacgcca caaacguggu cauuaagguu ugcgaguuuc aguucuguaa cgauccuuuu 420
cugggcgugu auuaucauaa gaacaauaag agcuggaugg aguccgaguu uagaguguau 480
agcucugcaa auaauuguac cuuugaguac gugagccagc ccuuucugau ggaccuggag 540
ggaaaacaag gaaacuucaa aaaccugcgg gaauucguuu ucaaaaacau cgacggcuau 600
uucaagaucu auagcaagca uaccccaauc aaccucguga gggaccuccc ccagggcuuu 660
agcgcacugg agccacuggu ugaccugccu aucggcauua auaucacaag auuucagacc 720
cugcuggcac ugcauagaag cuaucugacc ccuggagacu ccucuagugg guggacugcc 780
ggcgccgcug ccuacuaugu gggcuaucug cagccacgga cauuccugcu gaaauacaau 840
gagaacggga caaucacaga ugcuguugau ugcgcacucg acccccuguc cgagacaaag 900
ugcacucuca agagcuuuac cgucgagaag ggcaucuauc agaccucaaa cuucagggug 960
cagcccacag aaucuaucgu gcgcuucccu aauaucacua accugugucc uuucggugaa 1020
guguucaacg ccaccagguu ugcuagcgug uaugccugga acaggaagag gaucucuaac 1080
ugcgucgccg acuauuccgu gcuguauaac agcgccuccu ucuccacauu caaaugcuau 1140
ggagugagcc cgacaaaacu gaacgaucuc ugcuuuacaa augucuacgc cgacucuuuu 1200
gugaucagag gggacgaggu ccggcagauc gcaccaggac agacaggcaa gauugcugac 1260
uacaacuaua agcugccuga cgacuucaca ggauguguga ucgcauggaa cucaaacaau 1320
cuggacucca aagucggggg caacuauaau uaccuguauc gccuguuccg gaaguccaac 1380
cugaagcccu ucgagaggga caucaguaca gagaucuauc aggcuggcuc caccccuugc 1440
aauggcgucg aaggcuuuaa uuguuauuuu ccccugcagu cuuacggguu ucagccuacu 1500
aauggaguug gguaccagcc auacagagug gucgugcuca gcuucgagcu ccugcaugcu 1560
ccagcuacag uuugcgggcc aaagaagucc acuaaccugg ugaagaauaa gugcgucaac 1620
uucaacuuua acgggcucac cggcaccggc gugcugacug agagcaacaa gaaguuucug 1680
ccauuucaac aguuuggacg ggacauugcc gacaccaccg augccguucg ggauccacag 1740
acccuggaaa uucuggacau uacaccgugc agcuucgggg gcgugagcgu gaucacaccc 1800
ggaaccaaua caagcaacca gguugccguc cuguaucagg augucaauug cacagaagug 1860
ccaguugcua uccacgcaga ccagcugacu cccacauggc ggguguauag caccggaucc 1920
aacguguuuc agacccgcgc cggaugucuc auuggggccg agcacgugaa uaacagcuac 1980
gagugcgaca uccccauugg cgccggcauu ugugcgucuu accagacuca gaccaacucu 2040
ccuggcuccg ccucuuccgu ugcuagucag ucuauuauug ccuauaccau gagccucgga 2100
gcugagaaua gcguggccua cuccaauaau uccaucgcaa ucccuacuaa cuucacuauu 2160
ucugugacca ccgagauccu gccugugucu augacuaaga cuagcguuga uuguaccaug 2220
uauauuugug gcgacucuac cgaauguucu aaccugcugc uucaguacgg cucauuuugc 2280
acacagcuga acagagcccu gacugggauc gcuguggagc aggacaagaa cacacaggag 2340
guguuugcac aggugaagca gaucuauaag accccuccua uuaaggauuu cggcggauuc 2400
aauuucucac agauucugcc agaccccagu aagccuucca agaggagcuu caucgaggau 2460
cuccuguuua acaaggugac ccuggcagac gccggcuuua uuaagcaaua uggggauugc 2520
cugggcgaca uugcugccag agaccugauu ugcgcccaga aauucaaugg ccucacagug 2580
cugccaccuc ugcugaccga cgagaugauc gcucaauaca cuagcgcacu gcuggccgga 2640
accaucacau caggcuggac cuucggggcc ggagcagcac ugcagauucc auucgccaug 2700
cagauggccu auagauucaa cggcauuggc gucacacaga acgugcugua cgaaaaccag 2760
aagcucaucg cuaaccaguu uaauuccgca auuggaaaga uccaagauuc acucagcuca 2820
accgccucug cacucggaaa gcugcaggac guggucaacc agaaugcuca ggcccugaac 2880
acacucguca agcagcuguc cucuaacuuu ggcgcuauca gcuccguucu gaacgacauu 2940
cugagccgcc uggauccccc agaggcugaa guccagauug accgccugau uaccggccgg 3000
cugcagucuc ugcaaacaua cgugacccag cagcugauca gagcagccga gauccgggca 3060
uccgcaaauc uggcagcaac uaagaugagc gaaugcgugc ugggccaguc caagcgggug 3120
gacuuuugug gcaagggcua ccaccugaug agcuuccccc agagcgcccc acauggcguu 3180
guuuuucugc acgugaccua ugucccugcu caggaaaaga acuuuacaac ugcuccugcu 3240
aucugccaug acggcaaggc ccacuuccca cgggagggag uguuuguguc caauggcaca 3300
cacugguucg ugacccagag gaacuucuau gaaccccaga ucaucaccac ugacaauacc 3360
uucgugucug gaaauugcga cgucgugauc ggcaucguua acaacaccgu guacgacccu 3420
cuccagccag agcuggacuc cuuuaaggag gaacuggaua aguauuuuaa gaaccacaca 3480
agcccagaug uggaucucgg ggacaucucc ggaauuaacg ccuccguggu gaauauccag 3540
aaggagauug accgccuaaa ugaaguugcc aagaaccuca augagucucu gauugaucug 3600
caggaacugg gcaaguauga gcaguauauc aaauggcccu gguacauuug gcugggguuu 3660
aucgccggac ugauugccau cgucauggug accaucaugc uguguugcau gaccuccugu 3720
uguuccuguc ugaagggcug cuguaguugc ggcucuugcu guaaauucga cgaagaugau 3780
agcgagcccg ugcugaaggg cgugaagcug cauuauaccu ga 3822
<210> 149
<211> 4067
<212> DNA
<213> Artificial Sequence
<400> 149
ggacagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 60
cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 120
gactcaccgt ccttgacacg atgttcgtct tcctcgtgct gctcccactc gtttcttccc 180
agtgtgtcaa cctgacaact aggactcagc tgccaccagc ctacaccaac tccttcacca 240
gaggcgtgta ttacccagac aaggtgttta gaagcagcgt gctgcactct acccaggacc 300
tctttctgcc ctttttcagc aacgtgacat ggtttcacgc aattcacgtg tccggcacta 360
atggcacaaa gcggttcgac aatccagtcc tgcctttcaa cgatggcgtc tactttgcat 420
ctactgagaa atccaatatc attaggggat ggatcttcgg cacaaccctg gattctaaga 480
cccagagcct gctgatcgtc aacaacgcca caaacgtggt cattaaggtt tgcgagtttc 540
agttctgtaa cgatcctttt ctgggcgtgt attatcataa gaacaataag agctggatgg 600
agtccgagtt tagagtgtat agctctgcaa ataattgtac ctttgagtac gtgagccagc 660
cctttctgat ggacctggag ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt 720
tcaaaaacat cgacggctat ttcaagatct atagcaagca taccccaatc aacctcgtga 780
gggacctccc ccagggcttt agcgcactgg agccactggt tgacctgcct atcggcatta 840
atatcacaag atttcagacc ctgctggcac tgcatagaag ctatctgacc cctggagact 900
cctctagtgg gtggactgcc ggcgccgctg cctactatgt gggctatctg cagccacgga 960
cattcctgct gaaatacaat gagaacggga caatcacaga tgctgttgat tgcgcactcg 1020
accccctgtc cgagacaaag tgcactctca agagctttac cgtcgagaag ggcatctatc 1080
agacctcaaa cttcagggtg cagcccacag aatctatcgt gcgcttccct aatatcacta 1140
acctgtgtcc tttcggtgaa gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga 1200
acaggaagag gatctctaac tgcgtcgccg actattccgt gctgtataac agcgcctcct 1260
tctccacatt caaatgctat ggagtgagcc cgacaaaact gaacgatctc tgctttacaa 1320
atgtctacgc cgactctttt gtgatcagag gggacgaggt ccggcagatc gcaccaggac 1380
agacaggcaa gattgctgac tacaactata agctgcctga cgacttcaca ggatgtgtga 1440
tcgcatggaa ctcaaacaat ctggactcca aagtcggggg caactataat tacctgtatc 1500
gcctgttccg gaagtccaac ctgaagccct tcgagaggga catcagtaca gagatctatc 1560
aggctggctc caccccttgc aatggcgtcg aaggctttaa ttgttatttt cccctgcagt 1620
cttacgggtt tcagcctact aatggagttg ggtaccagcc atacagagtg gtcgtgctca 1680
gcttcgagct cctgcatgct ccagctacag tttgcgggcc aaagaagtcc actaacctgg 1740
tgaagaataa gtgcgtcaac ttcaacttta acgggctcac cggcaccggc gtgctgactg 1800
agagcaacaa gaagtttctg ccatttcaac agtttggacg ggacattgcc gacaccaccg 1860
atgccgttcg ggatccacag accctggaaa ttctggacat tacaccgtgc agcttcgggg 1920
gcgtgagcgt gatcacaccc ggaaccaata caagcaacca ggttgccgtc ctgtatcagg 1980
atgtcaattg cacagaagtg ccagttgcta tccacgcaga ccagctgact cccacatggc 2040
gggtgtatag caccggatcc aacgtgtttc agacccgcgc cggatgtctc attggggccg 2100
agcacgtgaa taacagctac gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt 2160
accagactca gaccaactct cctggctccg cctcttccgt tgctagtcag tctattattg 2220
cctataccat gagcctcgga gctgagaata gcgtggccta ctccaataat tccatcgcaa 2280
tccctactaa cttcactatt tctgtgacca ccgagatcct gcctgtgtct atgactaaga 2340
ctagcgttga ttgtaccatg tatatttgtg gcgactctac cgaatgttct aacctgctgc 2400
ttcagtacgg ctcattttgc acacagctga acagagccct gactgggatc gctgtggagc 2460
aggacaagaa cacacaggag gtgtttgcac aggtgaagca gatctataag acccctccta 2520
ttaaggattt cggcggattc aatttctcac agattctgcc agaccccagt aagccttcca 2580
agaggagctt catcgaggat ctcctgttta acaaggtgac cctggcagac gccggcttta 2640
ttaagcaata tggggattgc ctgggcgaca ttgctgccag agacctgatt tgcgcccaga 2700
aattcaatgg cctcacagtg ctgccacctc tgctgaccga cgagatgatc gctcaataca 2760
ctagcgcact gctggccgga accatcacat caggctggac cttcggggcc ggagcagcac 2820
tgcagattcc attcgccatg cagatggcct atagattcaa cggcattggc gtcacacaga 2880
acgtgctgta cgaaaaccag aagctcatcg ctaaccagtt taattccgca attggaaaga 2940
tccaagattc actcagctca accgcctctg cactcggaaa gctgcaggac gtggtcaacc 3000
agaatgctca ggccctgaac acactcgtca agcagctgtc ctctaacttt ggcgctatca 3060
gctccgttct gaacgacatt ctgagccgcc tggatccccc agaggctgaa gtccagattg 3120
accgcctgat taccggccgg ctgcagtctc tgcaaacata cgtgacccag cagctgatca 3180
gagcagccga gatccgggca tccgcaaatc tggcagcaac taagatgagc gaatgcgtgc 3240
tgggccagtc caagcgggtg gacttttgtg gcaagggcta ccacctgatg agcttccccc 3300
agagcgcccc acatggcgtt gtttttctgc acgtgaccta tgtccctgct caggaaaaga 3360
actttacaac tgctcctgct atctgccatg acggcaaggc ccacttccca cgggagggag 3420
tgtttgtgtc caatggcaca cactggttcg tgacccagag gaacttctat gaaccccaga 3480
tcatcaccac tgacaatacc ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta 3540
acaacaccgt gtacgaccct ctccagccag agctggactc ctttaaggag gaactggata 3600
agtattttaa gaaccacaca agcccagatg tggatctcgg ggacatctcc ggaattaacg 3660
cctccgtggt gaatatccag aaggagattg accgcctaaa tgaagttgcc aagaacctca 3720
atgagtctct gattgatctg caggaactgg gcaagtatga gcagtatatc aaatggccct 3780
ggtacatttg gctggggttt atcgccggac tgattgccat cgtcatggtg accatcatgc 3840
tgtgttgcat gacctcctgt tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct 3900
gtaaattcga cgaagatgat agcgagcccg tgctgaaggg cgtgaagctg cattatacct 3960
gacgggtggc atccctgtga cccctcccca gtgcctctcc tggccctgga agttgccact 4020
ccagtgccca ccagccttgt cctaataaaa ttaagttgca tcaagct 4067
<210> 150
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 150
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aatttccggc actaatggca caaagcggtt cgacaatcca 240
gtcctgcctt tcaacgatgg cgtctacttt gcatctactg agaaatccaa tatcattagg 300
ggatggatct tcggcacaac cctggattct aagacccaga gcctgctgat cgtcaacaac 360
gccacaaacg tggtcattaa ggtttgcgag tttcagttct gtaacgatcc ttttctgggc 420
gtttaccata agaacaataa gagctggatg gagtccgagt ttagagtgta tagctctgca 480
aataattgta cctttgagta cgtgagccag ccctttctga tggacctgga gggaaaacaa 540
ggaaacttca aaaacctgcg ggaattcgtt ttcaaaaaca tcgacggcta tttcaagatc 600
tatagcaagc ataccccaat caacctcgtg agggacctcc cccagggctt tagcgcactg 660
gagccactgg ttgacctgcc tatcggcatt aatatcacaa gatttcagac cctgctggca 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca agattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
gaaggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttatggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattga tgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggagtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcatagaagg 2040
gccaggtccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agctgagaat 2100
agcgtggcct actccaataa ttccatcgca atccctataa acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctggcacgc 2940
ctggataagg tggaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctcacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 151
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 151
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr His Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 152
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 152
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aatttccggc actaatggca caaagcggtt cgacaatcca 240
gtcctgcctt tcaacgatgg cgtctacttt gcatctactg agaaatccaa tatcattagg 300
ggatggatct tcggcacaac cctggattct aagacccaga gcctgctgat cgtcaacaac 360
gccacaaacg tggtcattaa ggtttgcgag tttcagttct gtaacgatcc ttttctgggc 420
gtttaccata agaacaataa gagctggatg gagtccgagt ttagagtgta tagctctgca 480
aataattgta cctttgagta cgtgagccag ccctttctga tggacctgga gggaaaacaa 540
ggaaacttca aaaacctgcg ggaattcgtt ttcaaaaaca tcgacggcta tttcaagatc 600
tatagcaagc ataccccaat caacctcgtg agggacctcc cccagggctt tagcgcactg 660
gagccactgg ttgacctgcc tatcggcatt aatatcacaa gatttcagac cctgctggca 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca agattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
gaaggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttatggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattga tgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggagtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcatagaagg 2040
gccaggtccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agctgagaat 2100
agcgtggcct actccaataa ttccatcgca atccctataa acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctggcacgc 2940
ctggatcccc cagaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctcacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 153
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 153
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr His Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 154
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 154
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aatttccggc actaatggca caaagcggtt cgacaatcca 240
gtcctgcctt tcaacgatgg cgtctacttt gcatctactg agaaatccaa tatcattagg 300
ggatggatct tcggcacaac cctggattct aagacccaga gcctgctgat cgtcaacaac 360
gccacaaacg tggtcattaa ggtttgcgag tttcagttct gtaacgatcc ttttctgggc 420
gtttaccata agaacaataa gagctggatg gagtccgagt ttagagtgta tagctctgca 480
aataattgta cctttgagta cgtgagccag ccctttctga tggacctgga gggaaaacaa 540
ggaaacttca aaaacctgcg ggaattcgtt ttcaaaaaca tcgacggcta tttcaagatc 600
tatagcaagc ataccccaat caacctcgtg agggacctcc cccagggctt tagcgcactg 660
gagccactgg ttgacctgcc tatcggcatt aatatcacaa gatttcagac cctgctggca 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca agattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
gaaggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttatggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattga tgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggagtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcatggctcc 2040
gcctcttccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agctgagaat 2100
agcgtggcct actccaataa ttccatcgca atccctataa acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctggcacgc 2940
ctggataagg tggaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctcacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 155
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 155
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr His Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 156
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 156
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aatttccggc actaatggca caaagcggtt cgacaatcca 240
gtcctgcctt tcaacgatgg cgtctacttt gcatctactg agaaatccaa tatcattagg 300
ggatggatct tcggcacaac cctggattct aagacccaga gcctgctgat cgtcaacaac 360
gccacaaacg tggtcattaa ggtttgcgag tttcagttct gtaacgatcc ttttctgggc 420
gtttaccata agaacaataa gagctggatg gagtccgagt ttagagtgta tagctctgca 480
aataattgta cctttgagta cgtgagccag ccctttctga tggacctgga gggaaaacaa 540
ggaaacttca aaaacctgcg ggaattcgtt ttcaaaaaca tcgacggcta tttcaagatc 600
tatagcaagc ataccccaat caacctcgtg agggacctcc cccagggctt tagcgcactg 660
gagccactgg ttgacctgcc tatcggcatt aatatcacaa gatttcagac cctgctggca 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca agattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
gaaggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttatggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattga tgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggagtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcatggctcc 2040
gcctcttccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agctgagaat 2100
agcgtggcct actccaataa ttccatcgca atccctataa acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctggcacgc 2940
ctggatcccc cagaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctcacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 157
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 157
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr His Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 158
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 158
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aatttccggc actaatggca caaagcggtt cgacaatcca 240
gtcctgcctt tcaacgatgg cgtctacttt gcatctactg agaaatccaa tatcattagg 300
ggatggatct tcggcacaac cctggattct aagacccaga gcctgctgat cgtcaacaac 360
gccacaaacg tggtcattaa ggtttgcgag tttcagttct gtaacgatcc ttttctgggc 420
gtttaccata agaacaataa gagctggatg gagtccgagt ttagagtgta tagctctgca 480
aataattgta cctttgagta cgtgagccag ccctttctga tggacctgga gggaaaacaa 540
ggaaacttca aaaacctgcg ggaattcgtt ttcaaaaaca tcgacggcta tttcaagatc 600
tatagcaagc ataccccaat caacctcgtg agggacctcc cccagggctt tagcgcactg 660
gagccactgg ttgacctgcc tatcggcatt aatatcacaa gatttcagac cctgctggca 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca agattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
gaaggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttatggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattga tgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggcgtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcatggctcc 2040
gcctcttccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agctgagaat 2100
agcgtggcct actccaataa ttccatcgca atccctataa acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagcc ctatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggaccagca ctgcagattc cattccctat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccccctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctggcacgc 2940
ctggatcccc cagaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctcacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 159
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 159
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr His Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 160
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 160
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgcc 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga ggggcctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca acattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
aagggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttacggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattgc cgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggcgtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcctagaagg 2040
gccaggtccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agtggagaat 2100
agcgtggcct actccaataa ttccatcgca atccctacta acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctgagccgc 2940
ctggataagg tggaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctgacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 161
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 161
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 162
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 162
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cctgacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgcc 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga ggggcctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca acattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
aagggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttacggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattgc cgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggcgtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcctggctcc 2040
gcctcttccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agtggagaat 2100
agcgtggcct actccaataa ttccatcgca atccctacta acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctgagccgc 2940
ctggatcccc cagaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctgacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 163
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 163
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 164
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 164
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cttcacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgcc 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga ggggcctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca acattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
aagggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttacggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattgc cgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggcgtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcctagaagg 2040
gccaggtccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agtggagaat 2100
agcgtggcct actccaataa ttccatcgca atccctacta acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctgagccgc 2940
ctggataagg tggaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctgacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 165
<211> 1270
<212> PRT
<213> Artificial Sequence
<400> 165
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 166
<211> 3813
<212> DNA
<213> Artificial Sequence
<400> 166
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa cttcacaact 60
aggactcagc tgccaccagc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgcc 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa cgatcctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgcgg gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga ggggcctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgcatagaa gctatctgac ccctggagac tcctctagtg ggtggactgc cggcgccgct 780
gcctactatg tgggctatct gcagccacgg acattcctgc tgaaatacaa tgagaacggg 840
acaatcacag atgctgttga ttgcgcactc gaccccctgt ccgagacaaa gtgcactctc 900
aagagcttta ccgtcgagaa gggcatctat cagacctcaa acttcagggt gcagcccaca 960
gaatctatcg tgcgcttccc taatatcact aacctgtgtc ctttcggtga agtgttcaac 1020
gccaccaggt ttgctagcgt gtatgcctgg aacaggaaga ggatctctaa ctgcgtcgcc 1080
gactattccg tgctgtataa cagcgcctcc ttctccacat tcaaatgcta tggagtgagc 1140
ccgacaaaac tgaacgatct ctgctttaca aatgtctacg ccgactcttt tgtgatcaga 1200
ggggacgagg tccggcagat cgcaccagga cagacaggca acattgctga ctacaactat 1260
aagctgcctg acgacttcac aggatgtgtg atcgcatgga actcaaacaa tctggactcc 1320
aaagtcgggg gcaactataa ttacctgtat cgcctgttcc ggaagtccaa cctgaagccc 1380
ttcgagaggg acatcagtac agagatctat caggctggct ccaccccttg caatggcgtc 1440
aagggcttta attgttattt tcccctgcag tcttacgggt ttcagcctac ttacggagtt 1500
gggtaccagc catacagagt ggtcgtgctc agcttcgagc tcctgcatgc tccagctaca 1560
gtttgcgggc caaagaagtc cactaacctg gtgaagaata agtgcgtcaa cttcaacttt 1620
aacgggctca ccggcaccgg cgtgctgact gagagcaaca agaagtttct gccatttcaa 1680
cagtttggac gggacattgc cgacaccacc gatgccgttc gggatccaca gaccctggaa 1740
attctggaca ttacaccgtg cagcttcggg ggcgtgagcg tgatcacacc cggaaccaat 1800
acaagcaacc aggttgccgt cctgtatcag ggcgtcaatt gcacagaagt gccagttgct 1860
atccacgcag accagctgac tcccacatgg cgggtgtata gcaccggatc caacgtgttt 1920
cagacccgcg ccggatgtct cattggggcc gagcacgtga ataacagcta cgagtgcgac 1980
atccccattg gcgccggcat ttgtgcgtct taccagactc agaccaactc tcctggctcc 2040
gcctcttccg ttgctagtca gtctattatt gcctatacca tgagcctcgg agtggagaat 2100
agcgtggcct actccaataa ttccatcgca atccctacta acttcactat ttctgtgacc 2160
accgagatcc tgcctgtgtc tatgactaag actagcgttg attgtaccat gtatatttgt 2220
ggcgactcta ccgaatgttc taacctgctg cttcagtacg gctcattttg cacacagctg 2280
aacagagccc tgactgggat cgctgtggag caggacaaga acacacagga ggtgtttgca 2340
caggtgaagc agatctataa gacccctcct attaaggatt tcggcggatt caatttctca 2400
cagattctgc cagaccccag taagccttcc aagaggagct tcatcgagga tctcctgttt 2460
aacaaggtga ccctggcaga cgccggcttt attaagcaat atggggattg cctgggcgac 2520
attgctgcca gagacctgat ttgcgcccag aaattcaatg gcctcacagt gctgccacct 2580
ctgctgaccg acgagatgat cgctcaatac actagcgcac tgctggccgg aaccatcaca 2640
tcaggctgga ccttcggggc cggagcagca ctgcagattc cattcgccat gcagatggcc 2700
tatagattca acggcattgg cgtcacacag aacgtgctgt acgaaaacca gaagctcatc 2760
gctaaccagt ttaattccgc aattggaaag atccaagatt cactcagctc aaccgcctct 2820
gcactcggaa agctgcagga cgtggtcaac cagaatgctc aggccctgaa cacactcgtc 2880
aagcagctgt cctctaactt tggcgctatc agctccgttc tgaacgacat tctgagccgc 2940
ctggatcccc cagaggctga agtccagatt gaccgcctga ttaccggccg gctgcagtct 3000
ctgcaaacat acgtgaccca gcagctgatc agagcagccg agatccgggc atccgcaaat 3060
ctggcagcaa ctaagatgag cgaatgcgtg ctgggccagt ccaagcgggt ggacttttgt 3120
ggcaagggct accacctgat gagcttcccc cagagcgccc cacatggcgt tgtttttctg 3180
cacgtgacct atgtccctgc tcaggaaaag aactttacaa ctgctcctgc tatctgccat 3240
gacggcaagg cccacttccc acgggaggga gtgtttgtgt ccaatggcac acactggttc 3300
gtgacccaga ggaacttcta tgaaccccag atcatcacca ctgacaatac cttcgtgtct 3360
ggaaattgcg acgtcgtgat cggcatcgtt aacaacaccg tgtacgaccc tctccagcca 3420
gagctggact cctttaagga ggaactggat aagtatttta agaaccacac aagcccagat 3480
gtggatctcg gggacatctc cggaattaac gcctccgtgg tgaatatcca gaaggagatt 3540
gaccgcctaa atgaagttgc caagaacctc aatgagtctc tgattgatct gcaggaactg 3600
ggcaagtatg agcagtatat caaatggccc tggtacattt ggctggggtt tatcgccgga 3660
ctgattgcca tcgtcatggt gaccatcatg ctgtgttgca tgacctcctg ttgttcctgt 3720
ctgaagggct gctgtagttg cggctcttgc tgtaaattcg acgaagatga tagcgagccc 3780
gtgctgaagg gcgtgaagct gcattatacc tga 3813
<210> 167
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 167
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1010 1015 1020
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys
1025 1030 1035 1040
Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1045 1050 1055
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe
1060 1065 1070
Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1075 1080 1085
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg
1090 1095 1100
Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser
1105 1110 1115 1120
Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1125 1130 1135
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1140 1145 1150
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly
1155 1160 1165
Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1170 1175 1180
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1185 1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1205 1210 1215
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1250 1255 1260
Val Lys Leu His Tyr Thr
1265 1270
<210> 168
<211> 3822
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 168
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa ctttacaaac 60
aggactcagc tgccatccgc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa ctaccctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgagc gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcac cattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtca agggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
tacggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agtacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctagaaggg ccaggtccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggataaggt ggaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaat caagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccttcgt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 169
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 169
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Tyr Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Ser Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Ile Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Phe Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 170
<211> 3822
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 170
atgttcgtct tcctcgtgct gctcccactc gtttcttccc agtgtgtcaa ctttacaaac 60
aggactcagc tgccatccgc ctacaccaac tccttcacca gaggcgtgta ttacccagac 120
aaggtgttta gaagcagcgt gctgcactct acccaggacc tctttctgcc ctttttcagc 180
aacgtgacat ggtttcacgc aattcacgtg tccggcacta atggcacaaa gcggttcgac 240
aatccagtcc tgcctttcaa cgatggcgtc tactttgcat ctactgagaa atccaatatc 300
attaggggat ggatcttcgg cacaaccctg gattctaaga cccagagcct gctgatcgtc 360
aacaacgcca caaacgtggt cattaaggtt tgcgagtttc agttctgtaa ctaccctttt 420
ctgggcgtgt attatcataa gaacaataag agctggatgg agtccgagtt tagagtgtat 480
agctctgcaa ataattgtac ctttgagtac gtgagccagc cctttctgat ggacctggag 540
ggaaaacaag gaaacttcaa aaacctgagc gaattcgttt tcaaaaacat cgacggctat 600
ttcaagatct atagcaagca taccccaatc aacctcgtga gggacctccc ccagggcttt 660
agcgcactgg agccactggt tgacctgcct atcggcatta atatcacaag atttcagacc 720
ctgctggcac tgcatagaag ctatctgacc cctggagact cctctagtgg gtggactgcc 780
ggcgccgctg cctactatgt gggctatctg cagccacgga cattcctgct gaaatacaat 840
gagaacggga caatcacaga tgctgttgat tgcgcactcg accccctgtc cgagacaaag 900
tgcactctca agagctttac cgtcgagaag ggcatctatc agacctcaaa cttcagggtg 960
cagcccacag aatctatcgt gcgcttccct aatatcacta acctgtgtcc tttcggtgaa 1020
gtgttcaacg ccaccaggtt tgctagcgtg tatgcctgga acaggaagag gatctctaac 1080
tgcgtcgccg actattccgt gctgtataac agcgcctcct tctccacatt caaatgctat 1140
ggagtgagcc cgacaaaact gaacgatctc tgctttacaa atgtctacgc cgactctttt 1200
gtgatcagag gggacgaggt ccggcagatc gcaccaggac agacaggcac cattgctgac 1260
tacaactata agctgcctga cgacttcaca ggatgtgtga tcgcatggaa ctcaaacaat 1320
ctggactcca aagtcggggg caactataat tacctgtatc gcctgttccg gaagtccaac 1380
ctgaagccct tcgagaggga catcagtaca gagatctatc aggctggctc caccccttgc 1440
aatggcgtca agggctttaa ttgttatttt cccctgcagt cttacgggtt tcagcctact 1500
tacggagttg ggtaccagcc atacagagtg gtcgtgctca gcttcgagct cctgcatgct 1560
ccagctacag tttgcgggcc aaagaagtcc actaacctgg tgaagaataa gtgcgtcaac 1620
ttcaacttta acgggctcac cggcaccggc gtgctgactg agagcaacaa gaagtttctg 1680
ccatttcaac agtttggacg ggacattgcc gacaccaccg atgccgttcg ggatccacag 1740
accctggaaa ttctggacat tacaccgtgc agcttcgggg gcgtgagcgt gatcacaccc 1800
ggaaccaata caagcaacca ggttgccgtc ctgtatcagg gcgtcaattg cacagaagtg 1860
ccagttgcta tccacgcaga ccagctgact cccacatggc gggtgtatag caccggatcc 1920
aacgtgtttc agacccgcgc cggatgtctc attggggccg agtacgtgaa taacagctac 1980
gagtgcgaca tccccattgg cgccggcatt tgtgcgtctt accagactca gaccaactct 2040
cctggctccg cctcttccgt tgctagtcag tctattattg cctataccat gagcctcgga 2100
gctgagaata gcgtggccta ctccaataat tccatcgcaa tccctactaa cttcactatt 2160
tctgtgacca ccgagatcct gcctgtgtct atgactaaga ctagcgttga ttgtaccatg 2220
tatatttgtg gcgactctac cgaatgttct aacctgctgc ttcagtacgg ctcattttgc 2280
acacagctga acagagccct gactgggatc gctgtggagc aggacaagaa cacacaggag 2340
gtgtttgcac aggtgaagca gatctataag acccctccta ttaaggattt cggcggattc 2400
aatttctcac agattctgcc agaccccagt aagccttcca agaggagctt catcgaggat 2460
ctcctgttta acaaggtgac cctggcagac gccggcttta ttaagcaata tggggattgc 2520
ctgggcgaca ttgctgccag agacctgatt tgcgcccaga aattcaatgg cctcacagtg 2580
ctgccacctc tgctgaccga cgagatgatc gctcaataca ctagcgcact gctggccgga 2640
accatcacat caggctggac cttcggggcc ggagcagcac tgcagattcc attcgccatg 2700
cagatggcct atagattcaa cggcattggc gtcacacaga acgtgctgta cgaaaaccag 2760
aagctcatcg ctaaccagtt taattccgca attggaaaga tccaagattc actcagctca 2820
accgcctctg cactcggaaa gctgcaggac gtggtcaacc agaatgctca ggccctgaac 2880
acactcgtca agcagctgtc ctctaacttt ggcgctatca gctccgttct gaacgacatt 2940
ctgagccgcc tggatccccc agaggctgaa gtccagattg accgcctgat taccggccgg 3000
ctgcagtctc tgcaaacata cgtgacccag cagctgatca gagcagccga gatccgggca 3060
tccgcaaatc tggcagcaat caagatgagc gaatgcgtgc tgggccagtc caagcgggtg 3120
gacttttgtg gcaagggcta ccacctgatg agcttccccc agagcgcccc acatggcgtt 3180
gtttttctgc acgtgaccta tgtccctgct caggaaaaga actttacaac tgctcctgct 3240
atctgccatg acggcaaggc ccacttccca cgggagggag tgtttgtgtc caatggcaca 3300
cactggttcg tgacccagag gaacttctat gaaccccaga tcatcaccac tgacaatacc 3360
ttcgtgtctg gaaattgcga cgtcgtgatc ggcatcgtta acaacaccgt gtacgaccct 3420
ctccagccag agctggactc ctttaaggag gaactggata agtattttaa gaaccacaca 3480
agcccagatg tggatctcgg ggacatctcc ggaattaacg cctccttcgt gaatatccag 3540
aaggagattg accgcctaaa tgaagttgcc aagaacctca atgagtctct gattgatctg 3600
caggaactgg gcaagtatga gcagtatatc aaatggccct ggtacatttg gctggggttt 3660
atcgccggac tgattgccat cgtcatggtg accatcatgc tgtgttgcat gacctcctgt 3720
tgttcctgtc tgaagggctg ctgtagttgc ggctcttgct gtaaattcga cgaagatgat 3780
agcgagcccg tgctgaaggg cgtgaagctg cattatacct ga 3822
<210> 171
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 171
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Tyr Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Ser Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Ile Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Phe Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 172
<211> 4058
<212> RNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 172
ggacagaucg ccuggagacg ccauccacgc uguuuugacc uccauagaag acaccgggac 60
cgauccagcc uccgcggccg ggaacggugc auuggaacgc ggauuccccg ugccaagagu 120
gacucaccgu ccuugacacg auguucgucu uccucgugcu gcucccacuc guuucuuccc 180
agugugucaa cuucacaacu aggacucagc ugccaccagc cuacaccaac uccuucacca 240
gaggcgugua uuacccagac aagguguuua gaagcagcgu gcugcacucu acccaggacc 300
ucuuucugcc cuuuuucagc aacgugacau gguuucacgc aauucacgug uccggcacua 360
auggcacaaa gcgguucgcc aauccagucc ugccuuucaa cgauggcguc uacuuugcau 420
cuacugagaa auccaauauc auuaggggau ggaucuucgg cacaacccug gauucuaaga 480
cccagagccu gcugaucguc aacaacgcca caaacguggu cauuaagguu ugcgaguuuc 540
aguucuguaa cgauccuuuu cugggcgugu auuaucauaa gaacaauaag agcuggaugg 600
aguccgaguu uagaguguau agcucugcaa auaauuguac cuuugaguac gugagccagc 660
ccuuucugau ggaccuggag ggaaaacaag gaaacuucaa aaaccugcgg gaauucguuu 720
ucaaaaacau cgacggcuau uucaagaucu auagcaagca uaccccaauc aaccucguga 780
ggggccuccc ccagggcuuu agcgcacugg agccacuggu ugaccugccu aucggcauua 840
auaucacaag auuucagacc cugcauagaa gcuaucugac cccuggagac uccucuagug 900
gguggacugc cggcgccgcu gccuacuaug ugggcuaucu gcagccacgg acauuccugc 960
ugaaauacaa ugagaacggg acaaucacag augcuguuga uugcgcacuc gacccccugu 1020
ccgagacaaa gugcacucuc aagagcuuua ccgucgagaa gggcaucuau cagaccucaa 1080
acuucagggu gcagcccaca gaaucuaucg ugcgcuuccc uaauaucacu aaccuguguc 1140
cuuucgguga aguguucaac gccaccaggu uugcuagcgu guaugccugg aacaggaaga 1200
ggaucucuaa cugcgucgcc gacuauuccg ugcuguauaa cagcgccucc uucuccacau 1260
ucaaaugcua uggagugagc ccgacaaaac ugaacgaucu cugcuuuaca aaugucuacg 1320
ccgacucuuu ugugaucaga ggggacgagg uccggcagau cgcaccagga cagacaggca 1380
acauugcuga cuacaacuau aagcugccug acgacuucac aggaugugug aucgcaugga 1440
acucaaacaa ucuggacucc aaagucgggg gcaacuauaa uuaccuguau cgccuguucc 1500
ggaaguccaa ccugaagccc uucgagaggg acaucaguac agagaucuau caggcuggcu 1560
ccaccccuug caauggcguc aagggcuuua auuguuauuu uccccugcag ucuuacgggu 1620
uucagccuac uuacggaguu ggguaccagc cauacagagu ggucgugcuc agcuucgagc 1680
uccugcaugc uccagcuaca guuugcgggc caaagaaguc cacuaaccug gugaagaaua 1740
agugcgucaa cuucaacuuu aacgggcuca ccggcaccgg cgugcugacu gagagcaaca 1800
agaaguuucu gccauuucaa caguuuggac gggacauugc cgacaccacc gaugccguuc 1860
gggauccaca gacccuggaa auucuggaca uuacaccgug cagcuucggg ggcgugagcg 1920
ugaucacacc cggaaccaau acaagcaacc agguugccgu ccuguaucag ggcgucaauu 1980
gcacagaagu gccaguugcu auccacgcag accagcugac ucccacaugg cggguguaua 2040
gcaccggauc caacguguuu cagacccgcg ccggaugucu cauuggggcc gagcacguga 2100
auaacagcua cgagugcgac auccccauug gcgccggcau uugugcgucu uaccagacuc 2160
agaccaacuc uccuggcucc gccucuuccg uugcuaguca gucuauuauu gccuauacca 2220
ugagccucgg aguggagaau agcguggccu acuccaauaa uuccaucgca aucccuacua 2280
acuucacuau uucugugacc accgagaucc ugccuguguc uaugacuaag acuagcguug 2340
auuguaccau guauauuugu ggcgacucua ccgaauguuc uaaccugcug cuucaguacg 2400
gcucauuuug cacacagcug aacagagccc ugacugggau cgcuguggag caggacaaga 2460
acacacagga gguguuugca caggugaagc agaucuauaa gaccccuccu auuaaggauu 2520
ucggcggauu caauuucuca cagauucugc cagaccccag uaagccuucc aagaggagcu 2580
ucaucgagga ucuccuguuu aacaagguga cccuggcaga cgccggcuuu auuaagcaau 2640
auggggauug ccugggcgac auugcugcca gagaccugau uugcgcccag aaauucaaug 2700
gccucacagu gcugccaccu cugcugaccg acgagaugau cgcucaauac acuagcgcac 2760
ugcuggccgg aaccaucaca ucaggcugga ccuucggggc cggagcagca cugcagauuc 2820
cauucgccau gcagauggcc uauagauuca acggcauugg cgucacacag aacgugcugu 2880
acgaaaacca gaagcucauc gcuaaccagu uuaauuccgc aauuggaaag auccaagauu 2940
cacucagcuc aaccgccucu gcacucggaa agcugcagga cguggucaac cagaaugcuc 3000
aggcccugaa cacacucguc aagcagcugu ccucuaacuu uggcgcuauc agcuccguuc 3060
ugaacgacau ucugagccgc cuggaucccc cagaggcuga aguccagauu gaccgccuga 3120
uuaccggccg gcugcagucu cugcaaacau acgugaccca gcagcugauc agagcagccg 3180
agauccgggc auccgcaaau cuggcagcaa cuaagaugag cgaaugcgug cugggccagu 3240
ccaagcgggu ggacuuuugu ggcaagggcu accaccugau gagcuucccc cagagcgccc 3300
cacauggcgu uguuuuucug cacgugaccu augucccugc ucaggaaaag aacuuuacaa 3360
cugcuccugc uaucugccau gacggcaagg cccacuuccc acgggaggga guguuugugu 3420
ccaauggcac acacugguuc gugacccaga ggaacuucua ugaaccccag aucaucacca 3480
cugacaauac cuucgugucu ggaaauugcg acgucgugau cggcaucguu aacaacaccg 3540
uguacgaccc ucuccagcca gagcuggacu ccuuuaagga ggaacuggau aaguauuuua 3600
agaaccacac aagcccagau guggaucucg gggacaucuc cggaauuaac gccuccgugg 3660
ugaauaucca gaaggagauu gaccgccuaa augaaguugc caagaaccuc aaugagucuc 3720
ugauugaucu gcaggaacug ggcaaguaug agcaguauau caaauggccc ugguacauuu 3780
ggcugggguu uaucgccgga cugauugcca ucgucauggu gaccaucaug cuguguugca 3840
ugaccuccug uuguuccugu cugaagggcu gcuguaguug cggcucuugc uguaaauucg 3900
acgaagauga uagcgagccc gugcugaagg gcgugaagcu gcauuauacc ugacgggugg 3960
caucccugug accccucccc agugccucuc cuggcccugg aaguugccac uccagugccc 4020
accagccuug uccuaauaaa auuaaguugc aucaagcu 4058
<210> 173
<211> 3813
<212> RNA
<213> Artificial Sequence
<220>
<223> Artificial Sequence
<400> 173
auguucgucu uccucgugcu gcucccacuc guuucuuccc agugugucaa cuucacaacu 60
aggacucagc ugccaccagc cuacaccaac uccuucacca gaggcgugua uuacccagac 120
aagguguuua gaagcagcgu gcugcacucu acccaggacc ucuuucugcc cuuuuucagc 180
aacgugacau gguuucacgc aauucacgug uccggcacua auggcacaaa gcgguucgcc 240
aauccagucc ugccuuucaa cgauggcguc uacuuugcau cuacugagaa auccaauauc 300
auuaggggau ggaucuucgg cacaacccug gauucuaaga cccagagccu gcugaucguc 360
aacaacgcca caaacguggu cauuaagguu ugcgaguuuc aguucuguaa cgauccuuuu 420
cugggcgugu auuaucauaa gaacaauaag agcuggaugg aguccgaguu uagaguguau 480
agcucugcaa auaauuguac cuuugaguac gugagccagc ccuuucugau ggaccuggag 540
ggaaaacaag gaaacuucaa aaaccugcgg gaauucguuu ucaaaaacau cgacggcuau 600
uucaagaucu auagcaagca uaccccaauc aaccucguga ggggccuccc ccagggcuuu 660
agcgcacugg agccacuggu ugaccugccu aucggcauua auaucacaag auuucagacc 720
cugcauagaa gcuaucugac cccuggagac uccucuagug gguggacugc cggcgccgcu 780
gccuacuaug ugggcuaucu gcagccacgg acauuccugc ugaaauacaa ugagaacggg 840
acaaucacag augcuguuga uugcgcacuc gacccccugu ccgagacaaa gugcacucuc 900
aagagcuuua ccgucgagaa gggcaucuau cagaccucaa acuucagggu gcagcccaca 960
gaaucuaucg ugcgcuuccc uaauaucacu aaccuguguc cuuucgguga aguguucaac 1020
gccaccaggu uugcuagcgu guaugccugg aacaggaaga ggaucucuaa cugcgucgcc 1080
gacuauuccg ugcuguauaa cagcgccucc uucuccacau ucaaaugcua uggagugagc 1140
ccgacaaaac ugaacgaucu cugcuuuaca aaugucuacg ccgacucuuu ugugaucaga 1200
ggggacgagg uccggcagau cgcaccagga cagacaggca acauugcuga cuacaacuau 1260
aagcugccug acgacuucac aggaugugug aucgcaugga acucaaacaa ucuggacucc 1320
aaagucgggg gcaacuauaa uuaccuguau cgccuguucc ggaaguccaa ccugaagccc 1380
uucgagaggg acaucaguac agagaucuau caggcuggcu ccaccccuug caauggcguc 1440
aagggcuuua auuguuauuu uccccugcag ucuuacgggu uucagccuac uuacggaguu 1500
ggguaccagc cauacagagu ggucgugcuc agcuucgagc uccugcaugc uccagcuaca 1560
guuugcgggc caaagaaguc cacuaaccug gugaagaaua agugcgucaa cuucaacuuu 1620
aacgggcuca ccggcaccgg cgugcugacu gagagcaaca agaaguuucu gccauuucaa 1680
caguuuggac gggacauugc cgacaccacc gaugccguuc gggauccaca gacccuggaa 1740
auucuggaca uuacaccgug cagcuucggg ggcgugagcg ugaucacacc cggaaccaau 1800
acaagcaacc agguugccgu ccuguaucag ggcgucaauu gcacagaagu gccaguugcu 1860
auccacgcag accagcugac ucccacaugg cggguguaua gcaccggauc caacguguuu 1920
cagacccgcg ccggaugucu cauuggggcc gagcacguga auaacagcua cgagugcgac 1980
auccccauug gcgccggcau uugugcgucu uaccagacuc agaccaacuc uccuggcucc 2040
gccucuuccg uugcuaguca gucuauuauu gccuauacca ugagccucgg aguggagaau 2100
agcguggccu acuccaauaa uuccaucgca aucccuacua acuucacuau uucugugacc 2160
accgagaucc ugccuguguc uaugacuaag acuagcguug auuguaccau guauauuugu 2220
ggcgacucua ccgaauguuc uaaccugcug cuucaguacg gcucauuuug cacacagcug 2280
aacagagccc ugacugggau cgcuguggag caggacaaga acacacagga gguguuugca 2340
caggugaagc agaucuauaa gaccccuccu auuaaggauu ucggcggauu caauuucuca 2400
cagauucugc cagaccccag uaagccuucc aagaggagcu ucaucgagga ucuccuguuu 2460
aacaagguga cccuggcaga cgccggcuuu auuaagcaau auggggauug ccugggcgac 2520
auugcugcca gagaccugau uugcgcccag aaauucaaug gccucacagu gcugccaccu 2580
cugcugaccg acgagaugau cgcucaauac acuagcgcac ugcuggccgg aaccaucaca 2640
ucaggcugga ccuucggggc cggagcagca cugcagauuc cauucgccau gcagauggcc 2700
uauagauuca acggcauugg cgucacacag aacgugcugu acgaaaacca gaagcucauc 2760
gcuaaccagu uuaauuccgc aauuggaaag auccaagauu cacucagcuc aaccgccucu 2820
gcacucggaa agcugcagga cguggucaac cagaaugcuc aggcccugaa cacacucguc 2880
aagcagcugu ccucuaacuu uggcgcuauc agcuccguuc ugaacgacau ucugagccgc 2940
cuggaucccc cagaggcuga aguccagauu gaccgccuga uuaccggccg gcugcagucu 3000
cugcaaacau acgugaccca gcagcugauc agagcagccg agauccgggc auccgcaaau 3060
cuggcagcaa cuaagaugag cgaaugcgug cugggccagu ccaagcgggu ggacuuuugu 3120
ggcaagggcu accaccugau gagcuucccc cagagcgccc cacauggcgu uguuuuucug 3180
cacgugaccu augucccugc ucaggaaaag aacuuuacaa cugcuccugc uaucugccau 3240
gacggcaagg cccacuuccc acgggaggga guguuugugu ccaauggcac acacugguuc 3300
gugacccaga ggaacuucua ugaaccccag aucaucacca cugacaauac cuucgugucu 3360
ggaaauugcg acgucgugau cggcaucguu aacaacaccg uguacgaccc ucuccagcca 3420
gagcuggacu ccuuuaagga ggaacuggau aaguauuuua agaaccacac aagcccagau 3480
guggaucucg gggacaucuc cggaauuaac gccuccgugg ugaauaucca gaaggagauu 3540
gaccgccuaa augaaguugc caagaaccuc aaugagucuc ugauugaucu gcaggaacug 3600
ggcaaguaug agcaguauau caaauggccc ugguacauuu ggcugggguu uaucgccgga 3660
cugauugcca ucgucauggu gaccaucaug cuguguugca ugaccuccug uuguuccugu 3720
cugaagggcu gcuguaguug cggcucuugc uguaaauucg acgaagauga uagcgagccc 3780
gugcugaagg gcgugaagcu gcauuauacc uga 3813

Claims (108)

1.一种核酸,所述核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,其中所述优化核苷酸序列由与大于或等于10%的使用频率相关的密码子组成;其中所述优化核苷酸序列:
(i)不含具有以下核苷酸序列之一的终止信号:
5’-X1ATCTX2TX3-3’,其中X1、X2和X3独立地选自A、C、T或G;以及5’-X1AUCUX2UX3-3’,其中X1、X2和X3独立地选自A、C、U或G;
(ii)不含任何负顺式调控元件和负重复元件;以及
(iii)具有大于0.8的密码子适应指数;
其中当分成不重叠的30个核苷酸长的部分时,所述优化核苷酸序列的每个部分具有30%-70%的鸟嘌呤胞嘧啶含量范围。
2.根据权利要求1所述的核酸,其中所述优化核苷酸序列不含具有以下序列之一的终止信号:TATCTGTT;TTTTTT;AAGCTT;GAAGAGC;TCTAGA;UAUCUGUU;UUUUUU;AAGCUU;GAAGAGC;UCUAGA。
3.根据权利要求1或2所述的核酸,其中由所述优化序列编码的全长SARS-CoV-2刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。
4.根据权利要求1-3中任一项所述的核酸,其中所述核酸是mRNA。
5.根据权利要求1-3中任一项所述的核酸,其中所述核酸是DNA。
6.根据权利要求1-5中任一项所述的核酸,其中所述优化核苷酸序列编码包含SEQ IDNO:11的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44或SEQID NO:148。
7.根据权利要求1-5中任一项所述的核酸,其中所述优化核苷酸序列编码包含SEQ IDNO:167的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:166或SEQID NO:173。
8.根据权利要求1-7中任一项所述的核酸,所述核酸用于疗法。
9.一种免疫原性组合物,所述免疫原性组合物包含根据权利要求1-7中任一项所述的核酸,用于预防由β-冠状病毒引起的感染。
10.根据权利要求9所述的用于所述用途的免疫原性组合物,其中所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
11.根据权利要求9或权利要求10所述的用于所述用途的免疫原性组合物,其中所述β-冠状病毒是SARS-CoV-2。
12.根据权利要求9-11所述的用于所述用途的免疫原性组合物,其中所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
13.一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的免疫原性组合物,所述免疫原性组合物包含根据权利要求1-7中任一项所述的核酸。
14.根据权利要求13所述的方法,其中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
15.根据权利要求13或权利要求14所述的方法,其中所述β-冠状病毒是SARS-CoV-2。
16.根据权利要求13-15所述的方法,其中所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
17.一种药物组合物,所述药物组合物包含i)根据权利要求1-7中任一项所述的核酸,和ii)脂质纳米颗粒。
18.根据权利要求17所述的药物组合物,其中所述核酸被包封在所述脂质纳米颗粒中。
19.根据权利要求17或权利要求18所述的药物组合物,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
20.根据权利要求19所述的药物组合物,其中
a.所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;
b.所述非阳离子脂质选自DOPE和DEPE;
c.所述基于胆固醇的脂质是胆固醇;以及
d.所述PEG修饰的脂质是DMG-PEG-2K。
21.根据权利要求19或20所述的药物组合物,其中阳离子脂质占所述脂质纳米颗粒的按摩尔比计约30%-60%,例如约35%-40%。
22.根据权利要求19-21中任一项所述的药物组合物,其中阳离子脂质与非阳离子脂质与基于胆固醇的脂质与PEG修饰的脂质的比率是按摩尔比计大约30-60:25-35:20-30:1-15。
23.根据权利要求19-22中任一项所述的药物组合物,其中所述脂质纳米颗粒包含cKK-E12、DOPE、胆固醇和DMG-PEG2K;cKK-E10、DOPE、胆固醇和DMG-PEG2K;OF-Deg-Lin、DOPE、胆固醇和DMG-PEG2K;或OF-02、DOPE、胆固醇和DMG-PEG2K。
24.根据权利要求19-23中任一项所述的药物组合物,其中所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。
25.根据权利要求17-24中任一项所述的药物组合物,其中所述脂质纳米颗粒的平均尺寸小于150nm,例如小于100nm。
26.根据权利要求25所述的药物组合物,其中所述脂质纳米颗粒的平均尺寸为约50-70nm,例如约55-65nm。
27.根据权利要求17-26中任一项所述的药物组合物,其中所述核酸是浓度在约0.5mg/mL至约1.0mg/mL之间的mRNA。
28.根据权利要求17-27中任一项所述的药物组合物,所述药物组合物用于治疗或预防由β-冠状病毒引起的感染。
29.根据权利要求28所述的用于所述用途的药物,其中所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
30.根据权利要求28或权利要求29所述的用于所述用途的药物组合物,其中所述β-冠状病毒是SARS-CoV-2。
31.根据权利要求28至30所述的用于所述用途的药物组合物,其中所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
32.根据权利要求28-31所述的用于所述用途的药物组合物,其中所述药物组合物是肌内施用的。
33.根据权利要求32所述的用于所述用途的药物组合物,其中所述药物组合物施用至少一次。
34.根据权利要求33所述的用于所述用途的药物组合物,其中所述药物组合物施用至少两次。
35.根据权利要求34所述的用于所述用途的药物组合物,其中施用之间的时间段是至少2周,例如3周或1个月。
36.一种mRNA构建体,所述mRNA构建体由以下结构元件组成:
(i)具有以下结构的5’帽:
(ii)具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
(iii)具有核酸序列SEQ ID NO:148的蛋白质编码区;
(iv)具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
(v)聚A尾。
37.一种mRNA构建体,所述mRNA构建体由以下结构元件组成:
(i)具有以下结构的5’帽:
(ii)具有核酸序列SEQ ID NO:144的5’非翻译区(5’UTR);
(iii)具有核酸序列SEQ ID NO:173的蛋白质编码区;
(iv)具有核酸序列SEQ ID NO:145的3’非翻译区(3’UTR);以及
(v)聚A尾。
38.一种脂质纳米颗粒,所述脂质纳米颗粒包封根据权利要求36所述的mRNA构建体。
39.一种脂质纳米颗粒,所述脂质纳米颗粒包封根据权利要求37所述的mRNA构建体。
40.一种脂质纳米颗粒,所述脂质纳米颗粒包封根据权利要求36所述的mRNA构建体和根据权利要求37所述的mRNA构建体。
41.根据权利要求38-40中任一项所述的脂质纳米颗粒,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
42.根据权利要求41所述的脂质纳米颗粒,其中所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。
43.根据权利要求42所述的脂质纳米颗粒,其中所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。
44.一种免疫原性组合物,所述免疫原性组合物包含根据权利要求36所述的mRNA构建体和/或根据权利要求37所述的mRNA构建体或根据权利要求38-43中任一项所述的脂质纳米颗粒。
45.根据权利要求44所述的免疫原性组合物,所述免疫原性组合物包含5μg与200μg之间的所述一种或多种mRNA构建体。
46.根据权利要求45所述的免疫原性组合物,所述免疫原性组合物包含7μg与135μg之间的所述一种或多种mRNA构建体。
47.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少10μg的所述一种或多种mRNA构建体。
48.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少15μg的所述一种或多种mRNA构建体。
49.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少20μg的所述一种或多种mRNA构建体。
50.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少25μg的所述一种或多种mRNA构建体。
51.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少35μg的所述一种或多种mRNA构建体。
52.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少40μg的所述一种或多种mRNA构建体。
53.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含至少45μg的所述一种或多种mRNA构建体。
54.根据权利要求46所述的免疫原性组合物,所述免疫原性组合物包含7.5μg、15μg、45μg或135μg的所述一种或多种mRNA构建体。
55.一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的根据权利要求44至54中任一项所述的免疫原性组合物。
56.根据权利要求55所述的方法,其中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
57.根据权利要求55或权利要求56所述的方法,其中所述β-冠状病毒是SARS-CoV-2。
58.根据权利要求55至57中任一项所述的方法,其中所述β-冠状病毒具有与SEQ IDNO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
59.根据权利要求55-58中任一项所述的方法,其中向所述受试者至少两次施用所述免疫原性组合物。
60.根据权利要求59所述的方法,其中施用之间的时间段是至少2周,例如3周或1个月。
61.一种免疫原性组合物,所述免疫原性组合物包含至少两种核酸,其中
1.所述第一核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸;以及
2.所述第二核酸包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,并且所述刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。
62.根据权利要求61所述的免疫原性组合物,其中所述第一核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQ ID NO:11的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:44或SEQ ID NO:148。
63.根据权利要求61或62所述的免疫原性组合物,其中所述第二核酸包含优化核苷酸序列,所述优化核苷酸序列编码包含SEQ ID NO:167的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:166或SEQ ID NO:173。
64.根据权利要求61-63中任一项所述的免疫原性组合物,其中所述至少两种核酸是mRNA构建体。
65.根据权利要求64所述的免疫原性组合物,其中所述第一核酸的优化核苷酸序列具有核酸序列SEQ ID NO:148,其中所述第二核酸的优化核苷酸序列具有核酸序列SEQ IDNO:173。
66.根据权利要求65所述的免疫原性组合物,其中所述第一核酸是根据权利要求36所述的mRNA构建体,其中所述第二核酸是根据权利要求37所述的mRNA构建体。
67.根据权利要求61-66中任一项所述的免疫原性组合物,其中所述至少两种核酸被包封在脂质纳米颗粒中。
68.根据权利要求67所述的免疫原性组合物,其中所述至少两种核酸被包封在同一脂质纳米颗粒中。
69.根据权利要求67所述的免疫原性组合物,其中所述至少两种核酸被包封在单独的脂质纳米颗粒中。
70.根据权利要求67-69中任一项所述的免疫原性组合物,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
71.根据权利要求70所述的免疫原性组合物,其中所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。
72.根据权利要求71所述的免疫原性组合物,其中所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。
73.根据权利要求61-72中任一项所述的免疫原性组合物,所述免疫原性组合物包含总共7.5μg、15μg、45μg或135μg的所述至少两种核酸。
74.根据权利要求61-73中任一项所述的免疫原性组合物,所述免疫原性组合物用于预防由β-冠状病毒引起的感染。
75.根据权利要求74所述的免疫原性组合物,其中所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
76.根据权利要求74或权利要求75所述的用于所述用途的免疫原性组合物,其中所述β-冠状病毒是SARS-CoV-2。
77.根据权利要求74至76所述的用于所述用途的免疫原性组合物,其中所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
78.一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的根据权利要求61-73中任一项所述的免疫原性组合物。
79.根据权利要求78所述的方法,其中,所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
80.根据权利要求78或权利要求79所述的方法,其中所述β-冠状病毒是SARS-CoV-2。
81.根据权利要求78至80所述的方法,其中所述β-冠状病毒具有与所述SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
82.根据权利要求78-81中任一项所述的方法,其中所述受试者先前未施用用于预防所述感染的免疫原性组合物。
83.根据权利要求78-81中任一项所述的方法,其中所述受试者先前已施用一种或多种用于预防所述感染的免疫原性组合物。
84.根据权利要求83所述的方法,其中所述受试者先前已施用两种用于预防所述感染的免疫原性组合物,间隔至少两周。
85.根据权利要求83或84所述的方法,其中所述一种或多种免疫原性组合物不同于根据权利要求61-73中任一项所述的免疫原性组合物。
86.根据权利要求83-85中任一项所述的方法,其中所述一种或多种免疫原性组合物选自
a.根据权利要求9-12所述的免疫原性组合物;
b.根据权利要求17-35中任一项所述的药物组合物;
c.根据权利要求44-54中任一项所述的免疫原性组合物;以及
d.Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))和Novavax(NVX-CoV2373)。
87.根据权利要求83至86中任一项所述的方法,其中在施用所述一种或多种免疫原性组合物之后3-18个月施用根据权利要求61-73中任一项所述的免疫原性组合物。
88.根据权利要求87所述的方法,其中在施用所述一种或多种免疫原性组合物之后至少9个月或至少12个月施用根据权利要求53-65中任一项所述的免疫原性组合物。
89.根据权利要求83至88中任一项所述的方法,其中施用根据权利要求61-73中任一项所述的免疫原性组合物至少一次,例如至少两次。
90.一种治疗或预防由β-冠状病毒引起的感染的方法,所述方法包括向受试者施用有效量的包含mRNA构建体的免疫原性组合物,其中所述mRNA构建体包含编码全长SARS-CoV-2刺突蛋白的优化核苷酸序列,所述刺突蛋白相对于SEQ ID NO:1的天然存在的全长SARS-CoV-2刺突蛋白已被修饰为去除弗林蛋白酶切割位点并且使残基986和987突变为脯氨酸,并且所述刺突蛋白进一步含有L18F、D80A、D215G、L242-、A243-、L244-、K417N、E484K、N501Y、D614G和A701V突变。
91.根据权利要求90所述的方法,其中所述优化核苷酸序列编码包含SEQ ID NO:167的氨基酸序列,任选地其中所述优化核苷酸序列具有核酸序列SEQ ID NO:173。
92.根据权利要求90或91所述的方法,其中所述mRNA构建体是根据权利要求31所述的mRNA构建体。
93.根据权利要求90-92中任一项所述的方法,其中所述mRNA构建体被包封在脂质纳米颗粒中。
94.根据权利要求93所述的方法,其中所述脂质纳米颗粒包含阳离子脂质、非阳离子脂质、基于胆固醇的脂质、和PEG修饰的脂质。
95.根据权利要求94所述的方法,其中所述阳离子脂质选自cKK-E12、cKK-E10、OF-Deg-Lin和OF-02;所述非阳离子脂质选自DOPE和DEPE;所述基于胆固醇的脂质是胆固醇;并且所述PEG修饰的脂质是DMG-PEG-2K。
96.根据权利要求95所述的方法,其中所述脂质纳米颗粒包含摩尔比为40:30:28.5:1.5的cKK-E10、DOPE、胆固醇和DMG-PEG2K。
97.根据权利要求90-96中任一项所述的方法,其中所述免疫原性组合物包含7.5μg、15μg、45μg或135μg的所述mRNA构建体。
98.根据权利要求90-97所述的方法,其中所述β-冠状病毒表达结合血管紧张素转化酶2(ACE2)的刺突蛋白。
99.根据权利要求90-98所述的方法,其中所述β-冠状病毒是SARS-CoV-2。
100.根据权利要求90-99所述的方法,其中所述β-冠状病毒具有与SEQ ID NO:1至少75%、80%、90%、95%或99%相同的刺突蛋白。
101.根据权利要求90-100所述的方法,其中所述受试者先前未施用用于预防所述感染的免疫原性组合物。
102.根据权利要求90-101所述的方法,其中所述受试者先前已施用一种或多种用于预防所述感染的免疫原性组合物。
103.根据权利要求102所述的方法,其中所述受试者先前已施用两种用于预防所述感染的免疫原性组合物,间隔至少两周。
104.根据权利要求102或103所述的方法,其中所述一种或多种免疫原性组合物不同于根据权利要求53-65中任一项所述的免疫原性组合物。
105.根据权利要求102-104中任一项所述的方法,其中所述第一免疫原性组合物和/或第二免疫原性组合物选自
a.根据权利要求9-12所述的免疫原性组合物;
b.根据权利要求17-35中任一项所述的药物组合物;或
c.根据权利要求44-54中任一项所述的免疫原性组合物;以及
d.Moderna(COVID-19疫苗Moderna,例如像mRNA-1273或mRNA-1283)、CureVac(CVnCoV)、Johnson&Johnson(COVID-19疫苗Janssen)、AstraZeneca(Vaxzevria)、Pfizer/BioNTech(Comirnaty)、Sputnik(Gam-COVID-Vac)、Sinovac(灭活COVID-19疫苗(Vero细胞))和Novavax(NVX-CoV2373)。
106.根据权利要求102至105中任一项所述的方法,其中在施用所述一种或多种免疫原性组合物之后3-18个月施用根据权利要求61-73中任一项所述的免疫原性组合物。
107.根据权利要求106所述的方法,其中在施用所述一种或多种免疫原性组合物之后至少9个月或至少12个月施用根据权利要求61-73中任一项所述的免疫原性组合物。
108.根据权利要求90-107中任一项所述的方法,其中施用根据权利要求61-73中任一项所述的免疫原性组合物至少一次,例如至少两次。
CN202180047594.XA 2020-05-07 2021-05-07 编码sars-cov-2抗原的优化核苷酸序列 Pending CN116710557A (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US63/021,319 2020-05-07
US63/032,825 2020-06-01
US63/076,718 2020-09-10
US63/076,729 2020-09-10
US63/088,739 2020-10-07
US63/143,604 2021-01-29
US63/143,612 2021-01-29
US202163146807P 2021-02-08 2021-02-08
US63/146,807 2021-02-08
PCT/US2021/031256 WO2021226436A1 (en) 2020-05-07 2021-05-07 Optimized nucleotide sequences encoding sars-cov-2 antigens

Publications (1)

Publication Number Publication Date
CN116710557A true CN116710557A (zh) 2023-09-05

Family

ID=87836098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180047594.XA Pending CN116710557A (zh) 2020-05-07 2021-05-07 编码sars-cov-2抗原的优化核苷酸序列

Country Status (1)

Country Link
CN (1) CN116710557A (zh)

Similar Documents

Publication Publication Date Title
KR20230008801A (ko) Sars-cov-2 항원을 암호화하는 최적화된 뉴클레오티드 서열
EP4147717A1 (en) Coronavirus vaccine
AU2014243756B2 (en) Prefusion RSV F proteins and their use
KR20220140528A (ko) Sars-cov-2 mrna 도메인 백신
US11964011B2 (en) Coronavirus vaccine
EP3498292B1 (en) Uspa2 protein constructs and uses thereof
CN114480442A (zh) 一种mRNA及包含其的新型冠状病毒mRNA疫苗
TW202222821A (zh) 用於預防及/或治療covid-19之組合物及方法
WO2022029011A1 (en) Binding agents for coronavirus s protein
AU2022368453A1 (en) Chimeric betacoronavirus spike polypeptides
WO2022171182A1 (zh) 一种治疗或者预防冠状病毒病突变株的疫苗试剂
CN116710557A (zh) 编码sars-cov-2抗原的优化核苷酸序列
US20230053555A1 (en) Mumps and measles virus immunogens and their use
US20230084012A1 (en) Vaccine for use against coronavirus and variants thereof
TW202438514A (zh) 鼻病毒mrna疫苗
WO2024133515A1 (en) Rhinovirus mrna vaccine
WO2024141784A2 (en) Broadly protective betacoronavirus vaccines and compositions
TW202217000A (zh) Sars—cov—2 mrna結構域疫苗
WO2024100583A1 (en) Stabilized vaccines
JP2024537847A (ja) COVID19 mRNAワクチン
CN116940372A (zh) 流感嗜血杆菌疫苗和使用方法
WO2023039396A1 (en) Universal influenza vaccine and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination