CN102300872A

CN102300872A - 猿腺病毒核酸和氨基酸序列，包含其的载体及其用途

Info

Publication number: CN102300872A
Application number: CN201080006197XA
Authority: CN
Inventors: S.科洛卡; A.尼科西亚; R.科尔特塞; V.安门多拉; M.安布罗西奥
Original assignee: Okairos AG
Current assignee: GlaxoSmithKline Biologicals SA
Priority date: 2009-02-02
Filing date: 2010-02-02
Publication date: 2011-12-28
Also published as: BRPI1008018A2; AU2017204292B2; US20120027788A1; JP2012516679A; WO2010086189A3; KR101761425B1; NZ594355A; US9718863B2; RU2604815C2; KR20110116144A; PL2391638T3; EP2391638B1; US10544192B2; IL214097B; MX2011007980A; EP3385387B1; WO2010086189A2; JP6262779B2; SG172935A1; AU2010209938A1

Abstract

本发明涉及具有改进的血清阳性率的新腺病毒毒株。在一个方面，本发明涉及腺病毒衣壳蛋白例如六邻体、五邻体和纤维蛋白的分离的多肽及其片段和编码其的多核苷酸。也提供了包含根据本发明的分离的多核苷酸的载体和包含根据本发明的分离的多核苷酸或多肽的腺病毒和包含所述载体、腺病毒、多肽和/或多核苷酸的药物组合物。本发明还涉及分离的多核苷酸、分离的多肽、载体、腺病毒和/或药物组合物用于疾病的治疗或预防的用途。

Description

猿腺病毒核酸和氨基酸序列，包含其的载体及其用途

背景技术

腺病毒（Ad）包括在两栖动物、鸟类和哺乳动物中发现的具有无囊膜二十面体衣壳结构的双链DNA病毒大家族(Straus, Adenovirus infections in humans; The Adenoviruses, 451-498, 1984; Hierholzer等人,J. Infect.Dis.,158 : 804-813,1988; Schnurr和Dondero, Intervirology., 36: 79-83,1993 ; Jong 等人, J. Clin. Microbiol., 37 : 3940-3945: 1999)。与逆转录病毒相比，腺病毒可以转导若干哺乳动物物种的许多细胞类型，包括分裂和不分裂细胞，并且不整合至宿主细胞的基因组。

一般而言，腺病毒DNA通常非常稳定和保持游离型（例如染色体外的），除非发生转化或肿瘤发生。此外，腺病毒载体可在良好确定的生产系统中增殖至高产量，所述生产系统易于临床级组合物的制药规模生产。这些特征和其表征良好的分子遗传学使重组腺病毒载体成为用作疫苗载体的有力候选者。重组腺病毒载体的产生可依赖于使用能够补充已被删除或被改造为无功能的腺病毒基因产物功能的包装细胞系。

目前，广泛使用2种表征良好的人C亚群腺病毒血清型（即hAd2和hAd5）作为用于基因治疗的大多数腺病毒载体的病毒骨架来源。还已检验了复制缺陷的人腺病毒载体作为疫苗载体用于递送来源于多种感染原（infectiuos agent）的多种免疫原。在实验动物（例如啮齿类、犬类和非人灵长类）中进行的研究表明携带编码免疫原和其他抗原的转基因的重组复制缺陷的人腺病毒载体引起针对转基因产物的体液和细胞介导的免疫应答。一般而言，研究者已报导了使用人腺病毒作为疫苗载体在非人实验系统中的成功，其通过使用利用高剂量的预计可引起免疫应答的重组腺病毒载体的免疫方案，或通过使用利用相继施用来源于不同血清型但携带相同的转基因产物的腺病毒载体用于加强免疫的免疫方案(Mastrangeli等人, Human Gene Therapy, 7: 79-87 (1996)。

已开发了基于人5型腺病毒（Ad5）的病毒载体用于不同的基因治疗和疫苗应用。尽管基于Ad5的载体在动物模型中极其有效，在临床试验中已证明了在人中存在的针对Ad5野生型病毒的先存（pre-existing）免疫力，以降低基因转导的效率。特别是在参与基于Ad5载体的疫苗临床试验的受试者中证明了免疫效率的明确降低，这些受试者具有超过200的中和抗体滴度。在Merck进行的HIV疫苗STEP试验(Moore JP 等人 Science. 2008 May 9; 320(5877):753-5)中得到以Ad5为载体的疫苗的最全面表征。所述疫苗研究基于在具有HIV感染高风险的受试者中共注射3个表达不同HIV抗原的Ad5载体作为概念研究的证据。令人惊讶地，数据显示在具有抗-Ad5先存免疫力的接种的受试者中HIV感染率提高而不是具有保护作用。尽管此矛盾的观察的机制尚不清楚，所述结果对基于人源腺病毒的疫苗在健康受试者中的疫苗应用的安全性和效率提出了另外的问题。综合考虑目前在不同疫苗和基因治疗临床试验例如使用Ad5载体的试验中得到的全部结果提高了对以在人中具有极低的或缺乏先存免疫力为特征的腺病毒的需要。

发明概述

在第一个方面，本发明提供了分离的多核苷酸，其编码腺病毒纤维蛋白或其功能性衍生物，并且所述多核苷酸选自：

（a）多核苷酸，其编码具有根据SEQ ID NO: 14-19、50和53中任意氨基酸序列的多肽，

（b）多核苷酸，其编码根据SEQ ID NO: 14-19、50和53中任意多肽的功能性衍生物，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换，和

（c）多核苷酸，其编码在全长上与SEQ ID NO: 14-19、50和53中任意氨基酸序列具有至少85%相同的氨基酸序列的功能性衍生物。

在另一个方面，本发明涉及分离的多核苷酸，其编码腺病毒六邻体蛋白或其功能性衍生物，并且所述多核苷酸选自：

（a）多核苷酸，其编码具有根据SEQ ID NO: 20-25、51和54中任意氨基酸序列的多肽，

（b）多核苷酸，其编码根据SEQ ID NO: 20-25、51和54中任意多肽的功能性衍生物，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换，和

（c）多核苷酸，其编码具有在全长上与SEQ ID NO: 20-25、51和54中任意氨基酸序列至少95%相同的氨基酸序列的功能性衍生物。

也提供了分离的多核苷酸，其编码腺病毒五邻体蛋白或其功能性衍生物，并且所述多核苷酸选自：

（a）多核苷酸，其编码具有根据SEQ ID NO: 26-31、52和55中任意氨基酸序列的多肽，

（b）多核苷酸，其编码根据SEQ ID NO: 26-31、52和55中任意多肽的功能性衍生物，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换，和

（c）多核苷酸，其编码具有在全长上与SEQ ID NO: 26-31、52和55中任意氨基酸序列至少85%相同的氨基酸序列的功能性衍生物。

本发明也涉及包含至少一种如上概述的根据本发明的分离的多核苷酸的多核苷酸。本发明还提供了由根据本发明的分离的多核苷酸编码的分离的腺病毒衣壳多肽或其功能性衍生物。

在另一个方面，本发明提供了包含根据本发明的分离的多核苷酸的载体。

也提供了重组腺病毒，优选不能复制的腺病毒，其包含根据本发明的分离的多核苷酸和/或至少一种根据本发明的分离的腺病毒衣壳多肽。

本发明的另一个方面是包含佐剂和以下（i）至（iv）中至少一种物质的组合物：

（i）一种或多种根据本发明的分离的腺病毒衣壳多肽；

（ii）根据本发明的分离的多核苷酸；

（iii）根据本发明的载体；

（iv）根据本发明的重组腺病毒；

和任选地，药学上可接受的赋形剂。

本发明还涉及包含以下至少一种的细胞：

（i）一种或多种根据本发明的分离的腺病毒衣壳多肽；

（ii）根据本发明的分离的多核苷酸；

（iii）根据本发明的载体；

（iv）根据本发明的重组腺病毒。

本发明的另一个方面涉及根据本发明的分离的腺病毒衣壳多肽、根据本发明的分离的多核苷酸、根据本发明的载体、根据本发明的重组腺病毒和/或根据本发明的组合物用于疾病的治疗或预防的用途。

发明详述

在以下详细描述本发明以前，应当理解本发明不受限于本文描述的特定方法、方案和试剂，因为这些可以变化。还应当理解本文使用的术语仅为了描述特定实施方案的目的，无意限制本发明的范围，本发明仅受限于所附权利要求书。除非另外定义，本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同的含义。

优选地，本文使用的术语如"A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", Leuenberger, H.G.W, Nagel, B.和Klbl, H.编(1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland)中所描述的以及Axel Kleemann和Jurgen Engel的"Pharmaceutical Substances: Syntheses, Patents, Applications" , Thieme Medical Publishing, 1999; "Merck Index: An Encyclopedia of Chemicals, Drugs, and Biologicals", Susan Budavari 等人编, CRC Press, 1996, 和United States Pharmcopeial Convention, Inc., Rockville Md., 2001出版的United States Pharmacopeia-25/National Formulary-20中所描述的定义。

在本说明书和后面的权利要求书通篇中，除非上下文另有需要，否则词语“包含（comprise）”和变体例如“包含（comprises）”和“包含（comprising）”应当被理解为指包含所述的特征、整体（integer）或步骤或多个特征、整体或步骤的组但不排除任意其他特征、整体或步骤或多个整体或步骤的组。在后面的段落中更详细地定义了本发明的不同方面。除非明确指出有相反的意思，这样定义的每个方面可与任意其他方面或多个方面组合。特别地，指示为优选的或有利的任意特征可与指示为优选的或有利的任意其他特征或多个特征组合。

在本说明书正文通篇中引用了一些文件。本文引用的每个文件（包括所有专利、专利申请、科学出版物、制造商的说明书、指示等），不管在上文或下文中，在此以其整体引入作为参考。不应将本文的任何内容解释为承认本发明无权先于因先前发明所作的此类公开。

下面提供了在本说明书中经常使用的一些术语的定义。这些术语在其每次使用时在说明书的其余部分具有分别定义的含义和优选的含义。

一般而言，腺病毒基因组是被良好地表征的。就具有类似位置的特定开放阅读框而言，在腺病毒基因组的总体组织中具有一般的保守性，例如每个病毒的E1A、E1B、E2A、E2B、E3、E4、LI、L2、L3、L4和L5基因的位置。腺病毒基因组的每个末端包含被称为反向末端重复（ITR）的序列，其对病毒复制是必需的。病毒也包含病毒编码的蛋白酶，其对加工某些产生感染性病毒粒子所需的结构蛋白是必需的。根据宿主细胞转导后表达的病毒基因的顺序描述腺病毒基因组的结构。更具体地，根据转录是否在DNA复制开始前或后发生将病毒基因称为早期（E）或晚期（L）基因。在转导的早期，腺病毒的E1A、 E1B、E2A、E2B、E3和E4基因被表达以制备适于病毒复制的宿主细胞。在感染的晚期，激活晚期基因L1-L5的表达，其编码病毒颗粒的结构成分。

下表1提供了本文涉及的序列的概述：

表1

如本文使用的，术语“分离的”指基本上不含与其天然有联系的其他分子的分子。因此分离的分子不含其在自然界的活动物中，即实验设备之外可能相遇或接触的其他分子。

如本文使用的，术语“蛋白质”、“肽”和“多肽” 可通篇互换使用。这些术语指天然存在的肽（例如天然存在的蛋白质）和可能包括天然或非天然存在的氨基酸的合成的肽二者。肽也可被化学修饰，通过修饰天然或非天然存在的氨基酸的侧链或游离氨基或羧基端。此化学修饰包括加入其他的化学部分以及在氨基酸侧链中的功能基团的修饰，例如糖基化。肽是优选具有至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或至少100个氨基酸，最优选至少8个或至少30个氨基酸的聚合物。由于本文公开的多肽和蛋白质来源于腺病毒，优选地本文使用的分离的多肽或蛋白质的分子量不超过200 kDa。

如本文使用的术语“载体”包括技术人员已知的任意载体，包括质粒载体，黏粒载体，噬菌体载体例如λ噬菌体，病毒载体例如腺病毒（Ad）载体（例如现有技术（例如WO 2005/071093 A2）已知的非复制型Ad5、Ad11、Ad26、Ad35、Ad49、ChAd3、ChAd4、ChAd5、ChAd7、ChAd8、ChAd9、ChAd10、ChAd11、ChAd16、ChAd17、ChAd19、ChAd20、ChAd22、ChAd24、ChAd26、ChAd30、ChAd31、ChAd37、ChAd38、ChAd44、ChAd63和ChAd82载体或可复制的Ad4和Ad7载体），腺相关病毒（AAV）载体（例如AAV 5型），甲病毒载体（例如委内瑞拉马脑脊髓炎病毒（VEE），辛德比斯病毒（SIN），塞姆利基森林病毒（SFV）和VEE-SIN嵌合体），疱疹病毒载体，麻疹病毒载体，痘病毒载体（例如牛痘病毒，修饰的牛痘病毒Ankara (MVA)，NYVAC（来源于牛痘病毒的Copenhagen毒株），和禽痘病毒载体：金丝雀痘（ALVAC）和禽痘病毒(FPV)载体），和水疱性口炎病毒载体，类病毒颗粒或细菌孢子。载体也包括表达载体，克隆载体和可用于在宿主细胞中产生重组腺病毒的载体。

术语“表达载体”指包含至少一种待表达的核酸序列以及其转录和翻译控制序列的核酸分子。改变表达盒将导致包含其的载体引导不同序列或序列组合的表达。因为限制性位点被优选地改造在5'和3'端，可容易地插入、去除表达盒，或将其替换为另一个表达盒。优选地，表达盒包括用于有效表达给定基因的顺式调控元件，例如启动子、起始位点和/或多聚腺苷酸化位点，如下进一步描述。

术语“抗体”指单克隆和多克隆抗体二者，即任意免疫球蛋白或其能够结合抗原或半抗原的部分。抗原结合部分可通过重组DNA技术或通过完整抗体的酶或化学切割产生。在某些实施方案中，抗原结合部分包括Fab、Fab'、F(ab')₂、Fd、Fv、dAb和互补决定区（CDR）变体，单链抗体(scFv)，嵌合抗体，人源化抗体，双抗体和包含抗体的至少一部分的多肽，所述抗体的至少一部分足以赋予特定抗原与该多肽结合。

在本发明上下文中将在哺乳动物中施用免疫原/抗原以引起/产生免疫应答称为“引发”，将在哺乳动物中施用免疫原/抗原以增强针对所述免疫原/抗原例如特定病原（例如病毒粒子或病毒病原体，病原细菌的抗原或肿瘤抗原）的免疫应答称为“加强”。短语“异源引发-加强”的意思是用于在哺乳动物中引起/产生免疫应答（引发）的载体和用于在哺乳动物中增强免疫应答（加强）的载体是不同的。如果受试者例如患者已对第一个载体产生了抗体并需要加强，“异源引发-加强”是有用的。因此，在异源引发-加强的优选实施方案中可使用2种不同的腺病毒，例如用于接种和/或基因治疗。在此上下文中，如果在第一种腺病毒引发过程中引起的抗体应答不能阻止超过70%或优选超过80%的施用的用于加强的第二种腺病毒颗粒进入已经历引发和加强的动物的细胞核，第一种和第二种腺病毒应具有足够大的差异。

术语“可复制的”重组腺病毒(AdV)指在细胞中不包含任意重组辅助蛋白质的情况下可以在宿主细胞中复制的腺病毒。优选地，“可复制的”腺病毒包含以下完整或功能必需的早期基因：E1A、E1B、E2A、E2B、E3和E4。从特定动物分离的野生型腺病毒可在该动物中复制。

术语“复制缺陷的”重组AdV指已变得不能复制的腺病毒，因为其已被改造为包含至少一个功能性缺失，即损伤基因功能但不完全将其去除的缺失，例如引入人工终止子，缺失或突变活性位点或相互作用结构域，突变或缺失基因的调控序列等等，或完全去除编码对于病毒复制所必需的基因产物的基因，例如一个或多个选自E1、E2、E3和E4的腺病毒基因。本发明的重组黑猩猩腺病毒载体优选地是复制缺陷的。

在多核苷酸、多肽或蛋白质序列的上下文中，术语“同一性”或“相同的”（“identical”）指当进行最大对应性比对时，在2条序列中相同的残基数。特别地，2条序列的序列同一性百分比（不管是核酸或氨基酸序列）是2条比对的序列之间的精确匹配数除以较短的序列长度然后乘以100。可用于比对2条序列的比对工具是本领域技术人员熟知的，例如可从万维网，例如ClustalW (www.ebi.ac.uk/clustalw)或Align (http://www.ebi.ac.uk/emboss/align/index.html)上获得。2条序列之间的比对可使用标准设置进行，对Align EMBOSS::needle优选: 矩阵: Blosum62, 缺口开放10.0, 缺口延伸0.5。本领域技术人员理解可能有必要在2条序列中的任一条中引入缺口以产生令人满意的比对。将2条多肽之间的“最佳序列比对”定义为产生最大的比对同一残基数的比对。

腺病毒

腺病毒（Ad）是已在若干禽类和哺乳动物宿主中鉴定的无囊膜二十面体病毒。人腺病毒(hAd)属于哺乳动物腺病毒属，其包括所有已知的人腺病毒和许多动物（例如牛、猪、犬、鼠、马、猿和羊）腺病毒。通常基于大量生物学、化学、免疫学和结构标准将人腺病毒分为6个亚群（A-F），这些标准包括大鼠和猕猴红细胞的血凝性能，DNA同源性，限制酶切割模式，G+C含量百分比和致癌性(Straus, 1984, in The Adenoviruses, H. Ginsberg编, pps.451-498, New York : Plenus Press,和Horwitz, 1990; in Virology, B. N. Fields和D. M. Knipe编, pps. 1679-1721)。

腺病毒粒子具有二十面体对称和60-90nm的直径（取决于血清型）。二十面体衣壳包含3种主要蛋白质、六邻体(II)、五邻体基质（III）和隆起的（knobbed）纤维(IV)蛋白(W. C. Russel, J. Gen.Virol., 81: 2573-2604 (2000))。在人中观察到的先存免疫力的一个方面是体液免疫，其可导致特异性针对腺病毒蛋白质的抗体的产生和持续。腺病毒引起的体液应答主要针对3个主要的结构蛋白：六邻体、五邻体和纤维。

至今已识别了51个不同的人腺病毒血清型并基于其血凝性能和生物物理和生物化学标准分为亚群。已发表的报导已确定包含针对多种血清型的抗体的滴度是普遍的(Dambrosio, E. (1982) J. Hyg. (London) 89: 209-219)并且滴度的相当大的一部分具有中和活性。

如所述，重组腺病毒可用于基因治疗和作为疫苗。基于黑猩猩腺病毒的病毒载体为使用人源Ad载体用于基因疫苗的开发提供了替代方案(Farina SF, J Virol. 2001 Dec;75(23):11603-13.; Fattori E, Gene Ther. 2006 Jul;13(14):1088-96)。从黑猩猩中分离的腺病毒与从人中分离的腺病毒紧密相关，如它们在人源细胞中的有效增殖所证明的。但是，由于人和黑猩猩腺病毒是近亲，可以预期在2个病毒物种之间的血清学交叉反应。

当黑猩猩腺病毒被分离和表征后，此推测得到证实。然而，来自黑猩猩的腺病毒分离株显示了与人腺病毒表位的普通血清型的减少的交叉反应。因此，黑猩猩腺病毒（本文中又将普通黑猩猩腺病毒简称为“ChAd”和将倭黑猩猩腺病毒简称为“PanAd”）提供了降低与人中针对人腺病毒普通血清型的先存免疫力相关的副作用的基础。但是，在人血清的亚群中检测到针对目前分离的黑猩猩腺病毒的低至中度中和滴度，因此所有已知的黑猩猩腺病毒血清型仍然可被人血清在一定程度上中和。

本发明包含意料之外的发现：可分离到新的黑猩猩腺病毒毒株，即从普通黑猩猩（Pan troglodytes）中分离的ChAd55、ChAd73、ChAd83、ChAd146、ChAd147和从倭黑猩猩(Pan paniscus)中分离的PanAd1、PanAd2和PanAd3。所有这些新的毒株在人中显示了测量不到的血清阳性率，即这些腺病毒毒株代表了迄今为止描述的黑猩猩腺病毒中的例外，因为检测的所有人血清对中和抗体的存在完全呈阴性。在此上下文中，中和抗体指这样的抗体，其结合腺病毒的表位并阻止腺病毒在宿主细胞中产生有效感染或阻止表达转基因的不能复制的载体转导靶细胞，例如腺病毒DNA能够进入宿主细胞。尽管在所有现有技术中的黑猩猩来源的腺病毒中观察到中和抗体，新的腺病毒类型ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2和PanAd3的特征在于：在人中完全缺乏针对这些腺病毒类型的先存中和抗体。因此，这些腺病毒提供了有价值的医学工具，例如可被用于免疫和/或基因治疗。

如下进一步详细描述的，本发明在一个方面提供了代表大部分暴露在表面的腺病毒表位的腺病毒衣壳蛋白，即六邻体、五邻体和纤维蛋白的新序列。如已经提到的，在人血清中不包含特异性针对根据本发明的病毒的中和抗体。因此，上述黑猩猩六邻体、五邻体和纤维蛋白的新序列的一个优势是可将这些蛋白质序列用于增强现有技术中已被改造用于例如医学目的的腺病毒。例如，本发明的衣壳蛋白或其功能片段可用于例如分别替换/置换不同的腺病毒（例如现有技术的腺病毒）的一个或多个主要结构衣壳蛋白或其功能片段以得到在人中具有减少的血清阳性率的改进的重组腺病毒。因为本发明的新腺病毒以及如上所述的已重新改造的腺病毒在施用时在人中不会遭遇任何显著的抑制性免疫应答，其总体转导效率和感染性将提高。因此，预期这样改进的腺病毒被期望是例如更有效的疫苗，因为病毒进入宿主细胞和抗原盒的表达将不会受到任何显著滴度的中和抗体的阻碍。此外，如在实施例中所示，甚至在使用包含ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2或PanAd3分离株的六邻体、五邻体和纤维蛋白的编码HIV-gag的重组腺病毒接种的初次接受实验的小鼠中引起了针对HIV gag的有效免疫应答。ChAd55-gag、ChAd73-gag、ChAd83-gag、ChAd146-gag、ChAd147-gag、PanAd1-gag、PanAd2-gag和PanAd3-gag腺病毒引起的免疫应答与迄今为止基于现有技术中表达HIV gag蛋白的重组人Ad5载体开发的最有效的载体所观察到的应答相当（见图5A、5B、5C中酶联免疫斑点（ELIspot）测定的数据）。

如上所述，腺病毒引起的体液应答主要针对3种主要的腺病毒结构蛋白质：六邻体、五邻体和纤维蛋白，其均包含组成腺病毒衣壳的一部分和暴露在病毒颗粒以外的多肽序列（又见：Madisch I, 等人, J. Virol. 2005 Dec;79(24):15265-76；又见：Madisch I, 等人, J Virol. 2007 Aug;81(15):8270-81和Pichla-Gollon SL, 等人, J. Virol. 2007 Feb;81(4):1680-9）。

如图1所示的多重序列比对所示，本发明的PanAd1、PanAd2、PanAd3、ChAd55、ChAd73、ChAd83、ChAd146和ChAd147这一组的新腺病毒分离株共有非常相似的六邻体蛋白质序列。在比对中也标记了高变区（HVR），其出现在六邻体分子顶端位于病毒粒子外部并覆盖大量病毒粒子表面的环中（见Jophn J. Rux et. Al, J. of Virology, Sept 2003, vol. 77, no.17）。在图2和3中分别提供了新的黑猩猩腺病毒的其他衣壳蛋白纤维蛋白和五邻体的序列相关性。预计所有3种结构衣壳蛋白均作用于低血清阳性率，因此可彼此独立地或组合用于抑制腺病毒与先存中和抗体的亲和力，例如用于制备具有减少的血清阳性率的重组嵌合腺病毒。

因此，在一个方面，本发明提供了分离的多核苷酸，其编码腺病毒纤维蛋白或其功能性衍生物并且其选自：

（a）编码具有根据SEQ ID NO: 14-19、50和53；即SEQ ID NO: 14、15、16、17、18 、19、50或53中任意氨基酸序列的多肽的多核苷酸；

（b）编码根据SEQ ID NO: 14-19、50和53；即SEQ ID NO: 14, 15, 16, 17, 18 , 19、50或53中任意多肽的功能性衍生物的多核苷酸，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换；和

（c）编码具有在全长上与SEQ ID NO: 14-19、50和53；即SEQ ID NO: 14、15、16、17、18 、19、50或53中任意氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列的功能性衍生物的多核苷酸。

“腺病毒纤维蛋白”的意思是腺病毒中包含的隆起的纤维（IV）蛋白。在优选的实施方案中，本发明第一个方面和以下描述的其优选的实施方案中包含的分离的多核苷酸编码与感染性腺病毒粒子中的纤维蛋白或其片段具有相同功能的纤维蛋白或其功能性衍生物。因此，优选包含所述纤维蛋白或功能纤维蛋白衍生物作为衣壳蛋白的重组腺病毒能够进入宿主细胞。可以容易地测定重组腺病毒是否能够进入宿主细胞。例如，在宿主细胞接触腺病毒后可洗涤并裂解重组宿主细胞，使用例如特异性针对腺病毒RNA和/或DNA的合适的杂交探针可测定是否在宿主细胞中发现了腺病毒RNA和/或DNA。可选或另外地，可洗涤、裂解并用腺病毒特异性抗体探测（例如使用蛋白质印迹）已与重组腺病毒接触的宿主细胞。在另一个可选方案中，例如在体内观察宿主细胞在被重组腺病毒感染后是否表达一种基因产物，例如荧光蛋白，所述重组腺病毒包含合适的表达盒以在宿主细胞中表达所述基因产物。

进一步优选地，纤维蛋白和其功能性衍生物对腺病毒五邻体蛋白例如对SEQ ID NO: 26-31、52和/或55具有亲和力。一般技术人员熟知如何检测蛋白质-蛋白质亲和力。为了测定第一种蛋白是否能够结合第二种蛋白，例如黑猩猩来源的腺病毒的五邻体蛋白，技术人员可使用例如遗传学的酵母双杂交测定或生物化学测定例如拉拽（pull-down），酶联免疫吸附测定（ELISA），基于荧光激活的细胞分选（FACS）测定或等离子共振测定。当使用拉拽或等离子共振测定时，将至少一种蛋白质与亲和标签例如HIS-标签、GST-标签或其他生物化学领域中熟知的其他标签融合是有用的。腺病毒纤维蛋白以其糖基化形式能够进一步三聚化。因此，也优选根据本发明的第一个方面的多核苷酸编码的纤维蛋白或其片段能够被糖基化和/或形成三聚体。

如本申请通篇使用的，短语蛋白质或多肽的“功能性衍生物”通常指蛋白质或多肽的修饰形式，例如蛋白质或多肽的一个或多个氨基酸可被缺失、插入、修饰和/或置换。上面也提到过，如果在其衣壳中包含功能性衍生物的嵌合腺病毒能够感染宿主细胞，则衍生物是有功能的。此外，在“功能性衍生物”的上下文中，插入指在原始多肽或蛋白质中插入一个或多个氨基酸。优选地功能性衍生物不含有超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100个氨基酸改变（即缺失、插入、修饰和/或置换的氨基酸）。在另一个实施方案中，优选地不超过1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%或不超过20%（最优选不超过5%）的蛋白质或多肽的所有氨基酸被改变（即缺失、插入、修饰和/或置换的氨基酸）。也可修饰，例如化学修饰蛋白质或多肽的氨基酸。例如，通过例如糖基化、酰胺化、磷酸化、泛素化等可修饰蛋白质或多肽的氨基酸的侧链或游离氨基或羧基末端。如本领域熟知的，也可在体内例如在宿主细胞内进行化学修饰。例如，在蛋白质的氨基酸序列中存在的合适的化学修饰基序，例如糖基化序列基序将导致蛋白质被糖基化。在衍生物中的置换可以为保守或非保守置换，优选保守置换。在某些实施方案中，置换也包括天然存在氨基酸和非天然存在氨基酸的交换。保守置换包含将氨基酸置换为另一个与被置换的氨基酸具有类似化学性质的氨基酸。优选地，保守置换是选自下述的置换：

（i）将碱性氨基酸置换为另一个不同的碱性氨基酸；

（ii）将酸性氨基酸置换为另一个不同的酸性氨基酸；

（iii）将芳香族氨基酸置换为另一个不同的芳香族氨基酸；

（iv）将非极性脂肪族氨基酸置换为另一个不同的非极性脂肪族氨基酸；

（v）将极性、不带电荷的氨基酸置换为另一个不同的极性、不带电荷的氨基酸。

碱性氨基酸优选地选自精氨酸、组氨酸和赖氨酸。酸性氨基酸优选地是天冬氨酸或谷氨酰胺。芳香族氨基酸优选地选自苯丙氨酸、酪氨酸和色氨酸。非极性、脂肪族氨基酸优选地选自甘氨酸、丙氨酸、缬氨酸、亮氨酸、甲硫氨酸和异亮氨酸。极性、不带电荷的氨基酸优选地选自丝氨酸、苏氨酸、半胱氨酸、脯氨酸、天冬酰胺和谷氨酰胺。与保守氨基酸置换相反，非保守氨基酸置换是一个氨基酸与任意不属于上述所列保守置换（i）至（v）的氨基酸的交换。

如果功能性衍生物包含缺失，那么在衍生物中已去除了在参考多肽或蛋白质序列中存在的一个或几个氨基酸。但是缺失不能过多以致衍生物总共包含的氨基酸少于200个。

上面已描述了测定序列同一性的方法。此外，也可使用Karlin和Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877的数学算法测定2条序列之间的百分比同一性。Altschul 等人 (1990) J. Mol. Biol. 215: 403-410的BLASTN和BLASTP程序也包含这样的算法。当使用BLASTN和BLASTP时优选使用这些程序的默认参数。

如上所述，腺病毒六邻体蛋白的高变结构域暴露在腺病毒的外侧。因此可通过中和抗体识别和结合腺病毒衣壳的这些区域。因此，具有包含来源于本发明的新的腺病毒分离株之一的六邻体蛋白的衣壳的腺病毒在人中将展示改进的即较小的血清阳性率。因此，在第二个方面，本发明提供了分离的多核苷酸，其编码腺病毒六邻体蛋白或其功能性衍生物并且其选自：

（a）编码具有根据SEQ ID NO: 20-25、51和54，即SEQ ID NO: 20、21、22、23、24、25、51或54中任意氨基酸序列的多肽的多核苷酸；

（b）编码根据SEQ ID NO: 20-25、51和54、即SEQ ID NO: 20、21、22、23、24、25、51或54中任意多肽的功能性衍生物的多核苷酸，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换；和

（c）编码具有在全长上与SEQ ID NO: 20-25、51和54，即SEQ ID NO: 20、21、22、23、24、25、51或54中任意氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99.95%相同的氨基酸序列的功能性衍生物的多核苷酸。

在优选的实施方案中，在本发明的第二个方面和以下描述的其优选实施方案中包含的分离的多核苷酸编码与感染性腺病毒粒子中的六邻体蛋白或其片段具有相同功能的六邻体蛋白或其功能性衍生物。因此，优选包含所述六邻体或功能性衍生物作为衣壳蛋白的重组腺病毒能够进入宿主细胞。产生六邻体蛋白的功能性衍生物的一种合适方法在美国专利5,922,315中描述，将其引入作为参考。在此方法中，腺病毒六邻体的至少一个环区域改变为另一种腺病毒血清型的至少一个环区域。例如，本发明的六邻体蛋白质的环区域可用于置换现有技术中的腺病毒的对应的六邻体环以产生改进的杂交腺病毒。类似地也可产生本发明的五邻体和纤维蛋白的衍生物。

在第三个方面，本发明提供了分离的多核苷酸，其编码腺病毒五邻体蛋白或其功能性衍生物并且其选自：

（a）编码具有根据SEQ ID NO: 26-31、52和55，即SEQ ID NO: 26、27、28、29、30、31、52或55中任意氨基酸序列的多肽的多核苷酸；

（b）编码根据SEQ ID NO: 26-31、52和55，即SEQ ID NO: 26、27、28、29、30、31、52或55中任意多肽的功能性衍生物的多核苷酸，其中所述功能性衍生物包含一个或多个氨基酸残基的缺失、插入和/或置换；和

（c）编码具有在全长上与SEQ ID NO: 26-31、52和55，即SEQ ID NO: 26、27、28、29、30、31、52或55中任意氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列的功能性衍生物的多核苷酸。

优选地，五邻体蛋白和其功能性衍生物对腺病毒纤维蛋白例如对SEQ ID NO: 14-19、50和/或53具有亲和力。如上所述一般技术人员熟知如何检测蛋白质-蛋白质亲和力。“腺病毒五邻体蛋白”的意思是在腺病毒中包含的五邻体基质（III）蛋白。腺病毒五邻体蛋白的特征在于其位于衣壳的二十面体对称的转角（corner）。如上所述，在本发明的第一、第二和/或第三个方面和如下文描述的其优选实施方案的多核苷酸的优选实施方案中，所述多核苷酸编码一种或多种多肽，其中优选包含所述一种或多种多肽作为衣壳蛋白的重组腺病毒能够感染，即进入宿主细胞。

下面将对本文公开的每个新黑猩猩腺病毒分离株详细说明本发明的第一、第二和第三个方面的优选实施方案。

腺病毒 ChAd55

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 14的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 14的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 20的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 20的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 26的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 26的氨基酸序列至少98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99.9%相同的氨基酸序列。

在另一个方面，本发明涉及包含第一、第二、第三、第一和第二、第一和第三、第二和第三或第一、第二和第三个方面的多核苷酸。优选包含这个或这些多核苷酸的多核苷酸包含其他在腺病毒基因组中（例如使用Ad5基因组作为参考）与六邻体、五邻体和/或纤维基因邻近的腺病毒基因和核苷酸区段。优选所述多核苷酸也包含将多核苷酸包装进腺病毒颗粒所需的序列。

腺病毒 ChAd73

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 15的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 15的氨基酸序列至少98%、99%或至少99.9%，更优选至少99%和最优选至少99.9%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 21的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 21的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 27的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 27的氨基酸序列至少98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

腺病毒 ChAd83

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 16的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有SEQ ID NO: 16的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 22的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 22的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 28的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 28的氨基酸序列至少98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

在最优选的实施方案中，本发明的多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与由SEQ ID NO: 65组成的序列或与由SEQ ID NO: 65组成的但缺乏SEQ ID NO: 65的基因组区域E1A、E1B、E2A、E2B、E3和/或E4中的任意区域，最优选缺乏SEQ ID NO: 65的基因组区域E1、E3和E4的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%同一和最优选至少99%或100%同一。

在另一个方面，本发明涉及包含第一、第二、第三、第一和第二、第一和第三、第二和第三或第一、第二和第三个方面的多核苷酸。优选包含这个或这些多核苷酸的多核苷酸包含其他在腺病毒基因组中（例如使用如SEQ ID NO: 65所示的ChAd83基因组）与六邻体、五邻体和/或纤维基因邻近的腺病毒基因和核苷酸区段。优选所述多核苷酸也包含将多核苷酸包装进腺病毒颗粒所需的序列。

腺病毒 ChAd146

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 17的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有SEQ ID NO: 17的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 23的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 23的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 29的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 29的氨基酸序列至少98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

腺病毒 ChAd147

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 18的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 18的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少90%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 24的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 24的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 30的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 30的氨基酸序列至少98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

腺病毒 PanAd1

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 19的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 19的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 25的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 25的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 31的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 31的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少90%相同的氨基酸序列。

在最优选的实施方案中，本发明的多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与由SEQ ID NO: 13组成的序列或与由SEQ ID NO: 13组成的但缺乏SEQ ID NO: 13的基因组区域E1A、E1B、E2A、E2B、E3和/或E4中任意区域，最优选缺乏SEQ ID NO: 13的基因组区域E1、E3和E4的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%同一和最优选至少99%或100%同一。

在另一个方面，本发明涉及包含第一、第二、第三、第一和第二、第一和第三、第二和第三或第一、第二和第三个方面的多核苷酸。优选包含这个或这些多核苷酸的多核苷酸包含其他在腺病毒基因组中（例如使用如SEQ ID NO: 13所示的PanAd1基因组）与六邻体、五邻体和/或纤维基因邻近的腺病毒基因和核苷酸区段。优选所述多核苷酸也包含将多核苷酸包装进腺病毒颗粒所需的序列。

腺病毒 PanAd2

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 50的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 50的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 51的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 51的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 52的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 52的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少90%相同的氨基酸序列。

在最优选的实施方案中，本发明的多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与由SEQ ID NO: 62组成的序列或与由SEQ ID NO: 62组成的但缺乏SEQ ID NO: 62的基因组区域E1A、E1B、E2A、E2B、E3和/或E4中任意区域，最优选缺乏SEQ ID NO: 62的基因组区域E1、E3和E4的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%同一和最优选至少99%或100%同一。

在另一个方面，本发明涉及包含第一、第二、第三、第一和第二、第一和第三、第二和第三或第一、第二和第三个方面的多核苷酸。优选包含这个或这些多核苷酸的多核苷酸包含其他在腺病毒基因组中（例如使用如SEQ ID NO: 62所示的PanAd1基因组）与六邻体、五邻体和/或纤维基因邻近的腺病毒基因和核苷酸区段。优选所述多核苷酸也包含将多核苷酸包装进腺病毒颗粒所需的序列。

腺病毒 PanAd3

在本发明的第一个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 53的氨基酸序列的腺病毒纤维蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 53的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少99%相同的氨基酸序列。

在本发明的第二个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 54的氨基酸序列的腺病毒六邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 54的氨基酸序列至少95%、98%、99%、99.5%、99.9%或至少99.95%，更优选至少98%和最优选至少99%相同的氨基酸序列。

在本发明的第三个方面的优选实施方案中，分离的多核苷酸编码具有根据SEQ ID NO: 55的氨基酸序列的腺病毒五邻体蛋白或其功能性衍生物，其中所述功能性衍生物（i）不包含超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或超过100，优选不超过10个缺失的、插入的、修饰的和/或置换的氨基酸或（ii）具有在全长上与SEQ ID NO: 55的氨基酸序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%，更优选至少85%和最优选至少90%相同的氨基酸序列。

在最优选的实施方案中，本发明的多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与由SEQ ID NO: 63组成的序列或与由SEQ ID NO: 63组成的但缺乏SEQ ID NO: 63的基因组区域E1A、E1B、E2A、E2B、E3和/或E4中任意区域，最优选缺乏SEQ ID NO: 63的基因组区域E1、E3和E4的序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%同一和最优选至少99%或100%同一。

在另一个方面，本发明涉及包含第一、第二、第三、第一和第二、第一和第三、第二和第三或第一、第二和第三个方面的多核苷酸。优选包含这个或这些多核苷酸的多核苷酸包含其他在腺病毒基因组中（例如使用如SEQ ID NO: 63所示的PanAd1基因组）与六邻体、五邻体和/或纤维基因邻近的腺病毒基因和核苷酸区段。优选所述多核苷酸也包含将多核苷酸包装进腺病毒颗粒所需的序列。

在重组腺病毒中，根据本发明的第一、第二和第三个方面和根据本文公开的各个优选的实施方案的纤维、六邻体和五邻体蛋白各自单独地作用于降低所述重组腺病毒与人和/或啮齿类中和抗体的相互作用。由此，编码本发明的所述纤维、六邻体和/或五邻体蛋白的多核苷酸可用于构建增强的重组腺病毒。因此，本发明的另一个即第四个方面提供了包含至少一种、优选至少2种和最优选3种分离的多核苷酸的多核苷酸，所述分离的多核苷酸选自由根据本发明的第一个方面、本发明的第二个方面和本发明的第三个方面的多核苷酸组成的多核苷酸组。因此，最优选地，第四个方面是包含本发明的第一、第二和第三个方面的分离的多核苷酸。在优选的实施方案中，根据本发明的第四个方面的多核苷酸是选自下述的多核苷酸：

（i）包含根据本发明的第一、第二或第三个方面的一种多核苷酸的多核苷酸；

（ii）包含根据本发明的第一个方面的多核苷酸和根据本发明的第二个方面的多核苷酸的多核苷酸；

（iii）包含根据本发明的第一个方面的多核苷酸和根据本发明的第三个方面的多核苷酸的多核苷酸；

（iv）包含根据本发明的第二个方面的多核苷酸和根据本发明的第三个方面的多核苷酸的多核苷酸；

（v）包含根据本发明的第一、第二和第三个方面的多核苷酸的多核苷酸；

其中优选地包含在根据（i）至（v）的多核苷酸中的所述多核苷酸选自相同的腺病毒分离株，例如分别编码纤维、六邻体和五邻体或其功能性衍生物的所有3种多核苷酸仅来自以下腺病毒中的一种：ChAd55、ChAd73、ChAd83、ChAd146、ChAd147 PanAd1、PanAd2或PanAd3。此外，优选地在本发明的第四个方面或其优选的实施方案中，例如如上概述的，每种“功能性衍生物”不包含超过10个、超过5个或超过3个氨基酸改变（即缺失、插入、修饰和/或置换的氨基酸）。

下表2列出了如上概述的本发明的第四个方面的多核苷酸的大量特别优选的实施方案。优选的多核苷酸选自表2所示的多核苷酸A1至AF1，其中所述多核苷酸包含根据本发明的第一、第二和第三个方面的可选项（c）的3种多核苷酸，每种多核苷酸分别编码腺病毒的纤维、六邻体和五邻体蛋白或其功能性衍生物。下表2显示了所述3种编码的蛋白质中的每一个在其全长上必须具有的与根据表2也显示的SEQ ID NO的氨基酸序列的最小序列同一性（即至少是指示的序列同一性）：

例如，如上表1中所示的优选多核苷酸A1包含：

（i）编码具有在全长上与SEQ ID NO: 14至少85%相同的氨基酸序列的多肽的多核苷酸；

（ii）编码具有在全长上与SEQ ID NO: 20至少95%相同的氨基酸序列的多肽的多核苷酸；

（iii）编码具有在全长上与SEQ ID NO: 26至少98%相同的氨基酸序列的多肽的多核苷酸；

如上所述最优选地在表2中所列的多核苷酸的所述“功能性衍生物”不包含超过10个氨基酸改变（即缺失、插入、修饰和/或置换的氨基酸）。

下表3列出了本发明的第四个方面的多核苷酸的进一步优选的实施方案。优选的多核苷酸选自从表3选择的多核苷酸A2至J2，其中所述多核苷酸包含命名为“多核苷酸1”、“多核苷酸2”和“多核苷酸3”的3种多核苷酸，其中每种多核苷酸在全长上分别与根据表3所示的SEQ ID NO的对应多核苷酸具有指示的序列同一性：

因此，作为实例，上表3的优选实施方案A2(“A2 – ChAd55”)是包含下述的多核苷酸：

（i）在全长上与SEQ ID NO: 32至少98%相同的多核苷酸；

（ii）在全长上与SEQ ID NO: 38至少98%相同的多核苷酸；

（iii）在全长上与SEQ ID NO: 44至少98%相同的多核苷酸。

下表4列出了上面概述的本发明的第四个方面的多核苷酸的大量进一步特别优选的实施方案。优选的多核苷酸选自表4所示的多核苷酸A3至H3，其中所述多核苷酸编码根据指示的SEQ ID NO的腺病毒纤维、六邻体和五邻体蛋白或其功能性衍生物，其中所有3种蛋白质和/或编码的功能性衍生物总共包含等于或少于1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或大于100，优选不超过20个缺失的、插入的、修饰的和/或置换的氨基酸：

在本发明的第四个方面的多核苷酸的另一个实施方案中，所述多核苷酸编码根据表4所示的各个SEQ ID NO的同一毒株的腺病毒纤维和六邻体蛋白或其功能性衍生物。在本发明的第四个方面的多核苷酸的另一个实施方案中，所述多核苷酸编码根据表4所示的各个SEQ ID NO的同一毒株的腺病毒纤维和五邻体蛋白或其功能性衍生物。在本发明的第四个方面的多核苷酸的另一个实施方案中，所述多核苷酸编码根据表4所示的各个SEQ ID NO的同一毒株的腺病毒六邻体和五邻体蛋白或其功能性衍生物。在此上下文中，在每种情况下所述功能性衍生物包含少于1、2、3、4、5、6、7、8、9或少于10，最优选少于3个缺失的、插入的、修饰的和/或置换的氨基酸。

在本发明的第四个方面的另一个优选的实施方案中，所述多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与（i）由SEQ ID NO: 13、62、63或65中的任一个组成的序列或（ii）由SEQ ID NO: 13、62、63或65中的任一个组成的并缺乏一个或多个基因组区域E1A、E1B、E2A、E2B、E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8、E3 ORF9、E4 ORF7、E4 ORF6、E4 ORF5、E4 ORF4、E4 ORF3、E4 ORF2和/或E4 ORF1的序列至少90%、91%、92%、94%、95%、96%、97%、98%、99%、99.9%或100%，优选98%同一。因此，上述一个或多个基因组区域优选地在测定同一性百分比的比对中不予考虑。在本发明的分离的多核苷酸的另一个优选的实施方案中，多核苷酸包含SEQ ID NO: 13、62、63或65或由SEQ ID NO: 13、62、63或65组成，其中一个或多个基因组区域E1A、E1B、E2A、E2B、E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8、E3 ORF9、E4 ORF7、E4 ORF6、E4 ORF5、E4 ORF4、E4 ORF3、E4 ORF2和E4 ORF1分别从SEQ ID NO: 13、62、63或65中被缺失或被置换为编码异源蛋白质的转基因或表达盒（如本文中描述的）。在最优选的实施方案中，缺失腺病毒区域E1、E3和/或E4，这也在实施例2中举例说明。上述优选的缺乏一个或多个指示的基因组区域的多核苷酸可进一步包含编码异源蛋白质的多核苷酸序列或包含这样的编码异源蛋白质的多核苷酸序列的表达盒。可将所述编码异源蛋白质的多核苷酸序列和所述包含这样的编码异源蛋白质的多核苷酸序列的表达盒插入例如本发明的多核苷酸的缺失区域，这是本领域所熟知的并也在下面的实施例中描述。所述异源蛋白质可为如本文描述的用于递送至靶细胞的分子，例如编码抗原蛋白或其片段，优选病原体的抗原蛋白或片段例如HIV gag蛋白，肿瘤抗原或单纯疱疹病毒的蛋白质的多核苷酸，如实施例中描述。因此，在优选的实施方案中，根据本发明的分离的多核苷酸进一步包含编码选自病毒抗原、病原细菌抗原和肿瘤抗原的抗原的多核苷酸。在一个实施方案中，所述异源蛋白质因此可为选自RNA病毒抗原、病原细菌抗原和肿瘤抗原的抗原。抗原指能够在哺乳动物中引起免疫应答的任意蛋白质或肽。抗原优选地包含至少8个氨基酸和最优选包含8至12个氨基酸。因此，当测定序列同一性时，在比对中优选地不考虑基因组区域E1A、E1B、E2A、E2B、E3和/或E4，即使用下述序列进行比对，其由SEQ ID NO: 13、62 63或65的全序列组成的但不包括基因组区域E1A、E1B、E2A、E2B、E3、E4和/或任意编码异源多肽的多核苷酸或包含这样的多核苷酸的表达盒。还如上所述地，优选根据本发明的第四个方面和所有其优选实施方案的多核苷酸编码功能性六邻体、五邻体和/或纤维衣壳蛋白或其功能性衍生物，例如编码的蛋白质具有与感染性腺病毒粒子中的各个衣壳蛋白具有相同的功能。因此，在其衣壳中包含所述编码的重组五邻体、六邻体和/或纤维蛋白或其功能性衍生物的重组腺病毒能够进入宿主细胞。进一步优选根据本发明的或由本发明的多核苷酸编码的衣壳蛋白或其功能性衍生物在人中没有血清阳性率。

本发明还提供了由根据本发明的分离的多核苷酸编码的分离的蛋白质，即由根据本发明的第一、第二和/或第三个方面的分离的多核苷酸编码的分离的腺病毒衣壳多肽或其功能性衍生物。在此上下文中，在一个实施方案中的“功能性衍生物”不包含超过5、10或不包括超过25个的氨基酸改变（即缺失的、插入的、修饰的和/或置换的氨基酸）。

本发明还涉及包含根据本发明的分离的多核苷酸的载体。

优选地，载体不包含选自E1A、E1B、E2A、E2B、E3和E4的基因组区域中的基因，和/或包含选自E1A、E1B、E2A、E2B、E3和E4的基因组区域的至少一个基因，其中所述至少一个基因包含使所述至少一个基因无功能的缺失和/或突变。使这些基因产物之一无功能的一种可能是在这些基因的开放阅读框中引入一个或多个人工终止子（例如TAA）。使病毒复制缺陷的方法是本领域熟知的（见例如Brody 等人, 1994 Ann NY Acad Sci., 716: 90-101）。

在一些实施方案中，本发明的多核苷酸包含编码本发明的六邻体蛋白；五邻体蛋白；纤维蛋白；六邻体蛋白和五邻体蛋白；六邻体蛋白和纤维蛋白；五邻体蛋白和纤维蛋白；或六邻体蛋白、五邻体蛋白和纤维蛋白的多核苷酸和还包含另外的腺病毒多核苷酸。因此，在一个优选的实施方案中，根据本发明的分离的多核苷酸包含以下至少一项：

（a）腺病毒5'-反向末端重复（ITR）；

（b）腺病毒E1a区，或其选自13S、12S和9S区的片段；

（c）腺病毒E1b区，或其选自小T、大T和IX区的片段；

（d）腺病毒E2b区，或其选自小pTP、聚合酶和IVa2区的片段；

（e）腺病毒L1区，或其片段，所述片段编码选自28.1 kD蛋白、聚合酶、agnoprotein、52/55 kDa蛋白和IIIa蛋白的腺病毒蛋白质；

（f）腺病毒L2区或包含编码本发明的五邻体蛋白的多核苷酸的L2区，或其片段，所述片段编码选自五邻体蛋白或本发明的五邻体蛋白、VII、V和Mu蛋白的腺病毒蛋白质；

（g）腺病毒L3区或包含编码本发明的六邻体蛋白的多核苷酸的L3区，或其片段，所述片段编码选自VI蛋白、六邻体蛋白或本发明的六邻体蛋白和内切蛋白酶的腺病毒蛋白质；

（h）腺病毒E2a区；

（i）腺病毒L4区，或其片段，所述片段编码选自100 kD蛋白、33 kD同源物和蛋白质VIII的腺病毒蛋白质；

（j）腺病毒E3区，或其选自E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8和E3 ORF9的片段；

（k）腺病毒L5区或包含编码本发明的纤维蛋白的多核苷酸的L5区，或其片段，所述片段编码纤维蛋白或本发明的纤维蛋白；

（l）腺病毒E4区，或其选自E4 ORF7、E4 ORF6、E4 ORF5、E4 ORF4、E4 ORF3、E4 ORF2和E4 ORF1的片段；特别是所述E4区的ORF6；

和/或

（m）腺病毒3'-ITR。

在上述多核苷酸的一些实施方案中可能也如上所述地希望，优选地，所述多核苷酸不包含如上概述的基因组区域的ORF（例如如在实施例2中定义的区域E3和/或E4）和/或包含下述腺病毒基因，其包含使至少一个基因无功能的缺失和/或突变。在这些优选的实施方案中，合适的腺病毒区将被修饰以不包含上述基因或使选定的基因无功能。任意腺病毒基因缺失将为插入转基因例如如本文描述的小基因盒制造空间。此外，基因缺失可用于产生下述腺病毒载体，其在不使用包装细胞系或辅助病毒的情况下不能复制，这是本领域熟知的。因此，包含如上所述的包含一个或多个特定的基因/区域缺失或丧失功能的突变的多核苷酸的最终重组腺病毒可为例如基因治疗或接种提供更安全的重组腺病毒。

在特别优选的实施方案中，本发明的多核苷酸包含以下至少一项：

（a）SEQ ID NO: 13、62、63或65中任一个的5'-反向末端重复（ITR）区；

（b）SEQ ID NO: 13、62、63或65中任一个的腺病毒E1a区，或其选自13S、12S和9S区的片段；

（c）SEQ ID NO: 13、62、63或65中任一个的腺病毒E1b区，或其选自小T、大T和IX区的片段；

（d）SEQ ID NO: 13、62、63或65中任一个的腺病毒E2b区；或其选自小pTP、聚合酶和IVa2区的片段；

（e）SEQ ID NO: 13、62、63或65中任一个的腺病毒L1区，或其片段，所述片段编码选自28.1 kD蛋白、聚合酶、agnoprotein、52/55 kDa蛋白和IIIa蛋白的腺病毒蛋白质；

（f）SEQ ID NO: 13、62、63或65中任一个的腺病毒L2区，或其片段，所述片段编码选自具有SEQ ID NO: 31、52或55的氨基酸序列的五邻体蛋白、VII、V和Mu蛋白的腺病毒蛋白质；

（g）SEQ ID NO: 13、62、63或65中任一个的腺病毒L3区，或其片段，所述片段编码选自VI蛋白、具有SEQ ID NO: 25、51或54的氨基酸序列的六邻体蛋白和内切蛋白酶的腺病毒蛋白质；

（h）SEQ ID NO: 13、62、63或65中任一个的腺病毒E2a区；

（i）SEQ ID NO: 13、62、63或65中任一个的腺病毒L4区，或其片段，所述片段编码选自100 kD蛋白、33 kD同源物和蛋白质VIII的腺病毒蛋白质；

（j）SEQ ID NO: 13、62、63或65中任一个的腺病毒E3区，或其选自E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8和E3 ORF9的片段；

（k）SEQ ID NO: 13、62、63或65中任一个的腺病毒L5区，或其片段，所述片段编码具有SEQ ID NO:19、50或53的氨基酸序列的纤维蛋白；

（l）SEQ ID NO: 13、62、63或65中任一个的腺病毒E4区，或其选自E4 ORF7、E4 ORF6、E4 ORF5、E4 ORF4、E4 ORF3、E4 ORF2和E4 ORF1的片段；或Ad5 E4区的ORF6(SEQ ID NO: 64)；

和

（m）SEQ ID NO: 13、62、63或65中任一个的3'-ITR。

在一个实施方案中，本发明的分离的多核苷酸还编码一个或多个优选所有以下腺病毒蛋白质：蛋白质VI、蛋白质VIII、蛋白质IX、蛋白质IIIa和蛋白质IVa2。优选地这些蛋白质由本文公开的PanAd1、PanAd2和PanAd3基因组序列的各自的开放阅读框编码。重组腺病毒领域的一般技术人员熟知如何测定编码上述特定腺病毒蛋白质的开放阅读框。他也知道腺病毒基因组的结构并可以不需过多劳动将本文概述的各个腺病毒区域和ORF定位至例如本发明的新腺病毒基因组PanAd1、PanAd2和PanAd3中的任一个。

为了表达多核苷酸，优选编码本发明的一个或多个腺病毒蛋白质的cDNA，可将所述多核苷酸亚克隆至表达载体，所述表达载体包含引导转录的强启动子，转录/翻译终止子和用于翻译起始的核糖体结合位点。合适的细菌启动子是本领域所熟知的，例如大肠杆菌、芽孢杆菌属物种和沙门氏菌，并且用于这些表达系统的试剂盒是可以商业获得的。类似的用于哺乳动物细胞、酵母和昆虫细胞的真核表达系统是本领域所熟知的并也可以商业获得。

除了启动子以外，表达载体通常包含转录单位或表达盒，所述转录单位或表达盒包含在宿主细胞中表达腺病毒蛋白质编码核酸所需的所有其他元件。因此一般的表达盒包含与编码腺病毒蛋白质/多肽的核酸序列可操作连接的启动子和转录物有效多聚腺苷酸化所需的信号，核糖体结合位点和翻译终止子。表达盒的其他元件可包括例如增强子。表达盒应也包含结构基因下游的转录终止区以提供有效终止。终止区可从与启动子序列相同的基因中得到，或可从不同的基因得到。

用于运送遗传信息至细胞的具体表达载体不是特别关键。可使用用于在真核或原核细胞中表达的任意传统载体。标准细菌表达载体包括质粒例如基于pBR322的质粒、pSKF、pET23D和融合表达系统例如GST和LacZ，但还有许多本领域技术人员已知的可被有效利用的载体。

包含来自真核病毒的调控元件的表达载体通常被用于真核表达载体，例如SV40载体，乳头状瘤病毒载体和EB病毒来源的载体。其他示例性真核载体包括pMSG, pAV009/A.sup.+、pMTO10/A.sup.+、pMAMneo-5、杆状病毒pDSVE、pcDNA3.1、pIRES和任意其他允许在下述启动子引导下表达蛋白质的载体：例如HCMV即早期启动子、SV早期启动子、SV晚期启动子、金属硫蛋白启动子、鼠乳腺瘤病毒启动子、劳氏肉瘤病毒启动子、多角体蛋白启动子或其他显示对真核细胞中的表达有效的启动子。

一些表达系统具有提供基因扩增的标记例如胸苷激酶、潮霉素B磷酸转移酶和二氢叶酸还原酶。可选地，不涉及基因扩增的高产表达系统也是合适的。

在表达载体中也可包括的元件包括在大肠杆菌中有功能的复制子，编码药物抗性以允许选择含有重组质粒的细菌的基因，和在质粒的非必需区的唯一限制性位点以允许插入真核序列。选择的具体药物抗性基因不是关键的——本领域已知的许多药物抗性基因中的任一种都是合适的。如果需要，任选地选择原核序列使其不干扰DNA在真核细胞中的复制。

可使用标准转染方法产生细菌、哺乳动物细胞、酵母或昆虫细胞系。可使用任意熟知的用于将外源多核苷酸序列引入宿主细胞的程序。例如，可商业获得的基于脂质体的转染试剂盒例如Lipofectamine^TM (Invitrogen)，可商业获得的基于脂的转染试剂盒例如Fugene (Roche Diagnostics)，基于聚乙二醇的转染，磷酸钙沉淀，基因枪（生物射弹），电穿孔或病毒感染和可使用任意其他熟知的用于将克隆的基因组DNA、cDNA、合成的DNA或其它外源遗传物质引入宿主细胞的方法。仅需要使用的特定基因工程程序能够成功地将至少一个基因引入能够表达受体的宿主细胞中。

可使用标准技术任选地纯化表达的腺病毒蛋白质。例如，可在细胞进行沉淀和层析步骤前机械地或通过渗压震扰裂解细胞，重组蛋白质的性质和序列将取决于待回收的特定重组材料。可选地，重组蛋白质可以被分泌并从培养重组细胞的培养基中回收，如蛋白质表达领域已知的。

在一个优选的实施方案中，本发明的载体是质粒载体，例如表达载体。根据本发明的质粒也可用于产生重组腺病毒。

因此，本发明的另一个方面是重组腺病毒，优选不能复制的腺病毒，其包含根据本发明的分离的多核苷酸和/或根据本发明的至少一种分离的腺病毒衣壳多肽。优选地本发明的重组腺病毒包含本发明的六邻体、纤维和五邻体蛋白，例如如在上表2中概述的组合。在优选的实施方案中，重组腺病毒的特征在于其能够感染人细胞——优选在所述腺病毒在人血清中孵育1小时后能够感染人细胞，所述人血清来源于以前从未接触黑猩猩腺病毒的人。

由于提供了本发明的新六邻体、五邻体和纤维蛋白的序列信息，可以获得所述重组腺病毒，例如通过构建由通常的腺病毒蛋白质组成但具有包含至少一种根据本发明的分离的腺病毒衣壳多肽或其功能性衍生物的衣壳的重组腺病毒。在这点上优选重组腺病毒包含含有编码本发明的五邻体蛋白的多核苷酸序列的L2区，含有编码本发明的六邻体蛋白的多核苷酸序列的L3区和/或含有编码本发明的纤维蛋白的多核苷酸序列的L5区。最优选地所述重组腺病毒包含分别编码本发明的五邻体、六邻体和纤维蛋白的L2区、L3区和L5区。

构建重组腺病毒的方法是本领域熟知的。例如在Graham & Prevec, 1991 In Methods in Molecular Biology: Gene Transfer and Expression Protocols, (Ed. Murray, EJ.), p. 109;和Hitt 等人, 1997 "Human Adenovirus Vectors for Gene Transfer into Mammalian Cells" Advances in Pharmacology 40:137-206中综述了制备重组腺病毒的有用技术。在WO 2006/086284中描述了其他方法。为了制备复制缺陷的腺病毒，可在补充细胞系（complementing cell line）中表达E1A、E1B、E2A、E2B、E3和E4基因产物中的一种或几种，所述补充细胞系可用于增殖和挽救不能复制的重组腺病毒，因为其缺乏例如上述基因产物中的一种。这些细胞系的使用也在上述参考中描述。

在一个实施方案中，使用本发明的多核苷酸（或包含本文描述的本发明的所述多核苷酸的载体）产生重组腺病毒颗粒。重组腺病毒优选地如上述在一个或多个腺病毒区域例如E1a或E1b区功能性缺失，和任选地具有其他突变，例如温度敏感突变或在其他腺病毒基因中的缺失。在其他实施方案中，希望在重组腺病毒中保留完整的E1a和/或E1b区。这样的完整E1区可位于其在腺病毒基因组中的天然位置或被置于天然腺病毒基因组中的缺失位点（例如在E3区）。

在构建腺病毒载体以递送基因至宿主例如人（或其它哺乳动物）细胞时，可在本发明的载体中使用一系列腺病毒核酸序列。例如，可从组成重组病毒一部分的腺病毒序列中除去腺病毒延迟早期基因E3的全部或部分。认为猿E3的功能和重组病毒颗粒的功能和产生无关。在某些实施方案中，也可构建具有E4基因的至少ORF6区缺失的，和更理想地因为此区域功能中的冗余性，缺失全部E4区的腺病毒载体。本发明的还另一个载体在延迟早期基因E2a中含有缺失。也可在猿腺病毒基因组晚期基因L1至L5中的任意基因中进行缺失。类似地，在中期基因IX和IVa2中的缺失可用于某些目的。可在其他结构和非结构腺病毒基因中进行其他缺失。可单独使用上面讨论的缺失，即用于本发明的腺病毒序列可仅在单个区域中包含缺失。可选地，可以任意组合使用整个基因的缺失或有效破坏其生物活性的其部分的缺失。例如，在根据本发明的一个示例性载体中，腺病毒序列可具有E1和E4区的缺失，或El, E2a和E3区的缺失，或E1和E3区的缺失，或El, E2a和E4区的缺失，具有或不具有E3缺失，等等。如上讨论地，这些缺失可与其他腺病毒基因突变例如温度敏感突变组合使用以获得预期结果。

可在存在缺少的、对病毒感染性和腺病毒颗粒增殖所必需的腺病毒基因产物的情况下培养缺乏任意必需腺病毒序列（例如选自Ela、Elb、E2a、E2b、E4 ORF6、L1或L4的区域）的腺病毒载体。可通过在一种或多种辅助构建体（例如质粒或病毒）或包装宿主细胞（如上所述的补充细胞系）的存在下培养腺病毒载体以提供这些辅助功能。见例如本文包括的实例和1996年5月9日公开的国际专利申请WO96/13597（引入本文作为参考）中所描述的用于制备“最小”人腺病毒载体的技术。

有用的辅助病毒包含补充在本发明的腺病毒载体的优选实施方案中缺失的和/或所述载体转染的包装细胞系不表达的各个基因的选定的腺病毒基因序列。在一个实施方案中，辅助病毒是复制缺陷的并包含除了上述序列以外的多种腺病毒基因。

可也使辅助病毒形成多聚阳离子缀合物，如Wu 等人, J. Biol. Chem., 264: 16985-16987 (1989); K. J. Fisher和J. M. Wilson, Biochem. J., 299: 49 (April 1, 1994)中所述。辅助病毒可任选地包含第二个报告小基因（minigene）。大量这样的报告基因是本领域已知的。在辅助病毒上存在不同于腺病毒载体上的转基因的报告基因允许独立地监控腺病毒载体和辅助病毒二者。在纯化时，此第二个报告基因可用于帮助得到的重组病毒和辅助病毒之间的分离。

为了产生在本文的优选实施方案中描述的缺失任意基因的重组腺病毒（Ad），如果缺失的基因对病毒的复制和感染性是必需的，优选地通过辅助病毒或细胞系，即补充或包装细胞系提供缺失的基因的功能。在许多情况下，表达人E1的细胞系可用于反式补充用于产生重组腺病毒的载体。这是特别有利地，因为由于在本发明的多核苷酸序列和在目前可利用的包装细胞中发现的人腺病毒E1序列之间的差异，使用目前包含人E1的细胞在复制和生产过程中将避免产生能够复制的腺病毒。然而，在某些情况下，希望使用表达E1基因产物的细胞系以产生E1缺失的重组腺病毒。

如果希望，可使用本文提供的序列以产生在用于在选定的亲本细胞系例如HeLa细胞中表达的启动子的转录控制下在最低程度上表达来自ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2或PanAd3腺病毒的腺病毒E1基因的包装细胞或细胞系。为此可使用诱导型或组成型启动子。例如在本文描述的实施例中提供了启动子的实例。这样的表达E1的细胞系可用于产生重组腺病毒E1缺失的载体。此外，或可选地，本发明提供了表达一种或多种腺病毒基因产物，例如Ela、Elb、E2a和/或E4 ORF6，优选Ad5 E4 ORF6（又见以下实施例）的细胞系，其可使用与在产生重组腺病毒载体中使用的基本上相同的程序构建。可使用这样的细胞系反式补充缺失了编码这些产物的必需基因的腺病毒载体或提供包装辅助依赖病毒（例如腺相关病毒）所必需的辅助功能。

通常，当通过转染递送本发明的包含例如小基因的载体时，以约0.1 μg至约100μg DNA，和优选约10至约50μg DNA的量将载体递送至约1 x 10⁴个细胞至约1 x 10³个细胞，和优选约10⁵个细胞。然而，可根据这些因素如选定的载体、递送方法和选定的宿主细胞来调节载体DNA与宿主细胞的相对量。载体至宿主细胞的引入可通过本领域已知的或本文公开的任意方法完成，包括转染和感染，例如使用CaPO₄转染或电穿孔。

为了构建和组装期望的包含小基因的重组腺病毒，在一个实施例中如本领域熟知的可在辅助病毒的存在下将载体体外转染至包装细胞系，从而允许辅助病毒和载体序列之间发生同源重组，使载体中的腺病毒转基因序列能够复制和包装进病毒粒子衣壳，得到重组腺病毒载体颗粒。本发明的重组腺病毒可用于例如将选定的转基因转移至选定的宿主细胞。

在本发明的腺病毒的优选实施方案中，腺病毒在人受试者中具有低于5%的血清阳性率和优选地在人受试者中没有血清阳性率，最优选在以前没有接触黑猩猩腺病毒的人受试者中没有血清阳性率。在此上下文中优选人受试者属于选自欧洲、非洲土著人、亚洲、美洲土著人和大洋洲土著人的种族群。鉴定人受试者的种族起源的方法是本领域包括的（见例如WO2003/102236）。

在根据本发明的重组腺病毒的另一个优选实施方案中，腺病毒DNA能够进入哺乳动物靶细胞，即其具有感染性。本发明的感染性重组腺病毒可用作疫苗和用于基因治疗，也如下述。因此，在另一个实施方案中，优选重组腺病毒包含用于递送至靶细胞的分子。优选地，靶细胞是哺乳动物细胞，例如黑猩猩细胞、啮齿类细胞或人细胞。例如，用于递送至靶细胞的分子可为如本文定义的表达盒。将表达盒引入腺病毒基因组的方法是本领域熟知的（见例如上面提供的文献引用）。在一个实施例中包含编码例如小基因或反义基因的表达盒的本发明的重组腺病毒可通过下述方法产生：用所述表达盒替换选自E1A、E1B、E2A、E2B、E3和E4的腺病毒基因组区域。通过与已知和有注释的腺病毒基因组例如人Ad5的基因组的比对可容易地鉴定本发明的腺病毒的基因组区域E1A、E1B、E2A、E2B、E3和E4（见：Birgitt Täuber和Thomas Dobner, Oncogene (2001) 20, p. 7847 – 7854;和又见: Andrew J. Davison, 等人, “Genetic content and evolution of adenoviruses”, Journal of General Virology (2003), 84, p. 2895–2908）。在如下实施例1和2和图4中也提供了如何产生包含用于递送至靶细胞的分子的修饰的腺病毒的非限制性实例。

用于递送至靶细胞的分子优选地为多核苷酸，但也可为优选具有治疗或诊断活性的多肽或小化学化合物。在一个特别优选的实施方案中，用于递送至靶细胞的分子是包含腺病毒５’反向末端重复序列（ITR），基因例如SEQ ID NO: 1和３’ITR的多核苷酸。对技术人员而言显而易见地，必须选择分子的分子大小使当重组腺病毒在例如包装细胞系中产生时衣壳可在分子周围形成并包装分子。因此，优选地基因是小基因，其可具有例如多达7000和最多可达8000个碱基对。

在优选的实施方案中，在根据本发明的重组腺病毒中包含的用于递送至靶细胞的分子是编码抗原蛋白质或其片段的多核苷酸。抗原蛋白质或其片段能够在哺乳动物中引起免疫应答，在一个特别优选的实施方案中可为如实施例中所示的HIV的gag蛋白并由根据SEQ ID NO: 1的多核苷酸编码。

在一个特别优选的实施方案中，本发明的重组腺病毒是已在ECACC（欧洲动物细胞保藏中心（European Collection of Cell Culture）, Porton Down, Salisbury, SP4 OJG, UK）保藏的腺病毒并具有选自08110601 (ChAd83)、08110602 (ChAd73)、08110603 (ChAd55)、08110604 (ChAd147)和08110605 (ChAd146)的保藏号。在2008年11月6日由Okairos AG, Elisabethenstr. 3, 4051 Basel, Switzerland完成了上述腺病毒毒株（腺病毒科，哺乳动物腺病毒属（拉丁文名：Mastadenovirus, Adenoviridae））的保藏。

将根据国际承认用于专利程序目的的微生物保藏的《布达佩斯条约》维持这些保藏。仅为本领域技术人员的便利进行这些保藏，根据35 U. S. C. 112并不承认保藏是必须的。除了根据37 C. F. R. 1. 808 (b)在授予专利权方面规定的要求以外，不能取消地去除对公众获得保藏材料的所有限制。

本发明的重组腺病毒的另一个优选的实施方案是由选自08110601 (ChAd83)、08110602 (ChAd73)、08110603 (ChAd55)、08110604 (ChAd147)和08110605 (ChAd146)的腺病毒衍生的腺病毒。优选地由上述保藏的腺病毒衍生的腺病毒已通过在其基因组中引入功能性缺失、缺失或修饰被改变，例如以得到不能复制的腺病毒和/或在能够在宿主细胞中表达转基因的腺病毒。例如，选自E1A、E1B、E2A、E2B、E3和E4基因的一个或多个基因可被缺失、使其无功能和/或可被如上概述的表达盒替换。此外，可引入一个或多个另一种腺病毒的基因，优选地用于缺失的基因。技术人员熟知如何在保藏的毒株中引入这些基因组改变。在这方面，上面已经描述了产生包含保藏毒株的优选修饰的、用于递送至靶细胞的分子的修饰的腺病毒的方法。

在另一个方面提供了组合物，其包含免疫佐剂和以下（i）至（iv）中至少一种：

（i）根据本发明的分离的蛋白质；

（ii）根据本发明的分离的多核苷酸；

（iii）根据本发明的载体；

（iv）根据本发明的重组腺病毒；

和任选地药学上可接受的赋形剂。

根据本发明的包含佐剂的组合物可用作疫苗，例如用于人受试者。本文中也被简称为“佐剂”的免疫佐剂与单独施用抗原相比加快、延长和/或增强对抗原/免疫原的免疫应答的质量和/或强度，因此减少在任意给定疫苗中必需的抗原/免疫原的量和/或对目的抗原/免疫原产生足够免疫应答所必需的注射频率。

在根据本发明的组合物的上下文中可使用的佐剂实例是氢氧化铝（矾）的凝胶样沉淀物；AlPO₄；铝胶；来自革兰氏阴性细菌外膜的细菌产品，特别是单磷酰脂质A（MPLA）、脂多糖（LPS）、胞壁酰二肽和其衍生物；弗氏不完全佐剂；脂质体，特别是中性脂质体，包含组合物和任选地包含细胞因子的脂质体；非离子嵌段共聚物；ISCOMATRIX佐剂(Drane 等人, 2007)；包含CpG二核苷酸（CpG基序）的未甲基化DNA，特别是具有硫代磷酸（PTO）骨架（CpG PTO ODN）或磷酸二酯(PO)骨架(CpG PO ODN)的CpG ODN；合成的脂肽衍生物，特别是Pam₃Cys；脂阿拉伯甘露聚糖；肽葡聚糖；酵母聚糖；热休克蛋白（HSP），热别是HSP70；dsRNA和其合成衍生物，特别是Poly I:poly C；聚阳离子肽，特别是聚-L-精氨酸；紫杉酚；纤连蛋白；鞭毛蛋白；咪唑并喹啉；具有佐剂活性的细胞因子，特别是GM-CSF,白介素- (IL-)2、IL-6、IL-7、IL-18，I和II型干扰素，特别是干扰素-γ，TNF-α；25-二羟维生素D3（骨化三醇）；和合成的寡肽，特别是MHCII呈递肽。可使用包含聚氧化乙烯（POE）和聚氧化丙烯（POP）的非离子嵌段共聚物例如POE-POP-POE嵌段共聚物作为佐剂(Newman 等人, 1998)。此类型的佐剂对包含核酸作为活性成分的组合物特别有用。

任选地，可使用各种药学上可接受的赋形剂。优选的药学上可接受的赋形剂在下面讨论根据本发明的用途时描述。

特定受体的活化可刺激免疫应答。这些受体是熟练技术人员已知的并包括例如细胞因子受体，特别是I型细胞因子受体，II型细胞因子受体，TNF受体；和担当转录因子的维生素D受体；和Toll样受体1(TLR1)、TLR-2、TLR 3、TLR4、TLR5、TLR-6、TLR7和TLR9。这些受体的激动剂具有佐剂活性，即为免疫刺激性的。在优选的实施方案中，本发明的组合物的佐剂可为一种或多种Toll样受体激动剂。在更优选的实施方案中，佐剂是Toll样受体4激动剂。在特别优选的实施方案中，佐剂是Toll样受体9激动剂，其优选地由核苷酸tccatgacgttcctgacgtt (SEQ ID NO: 2)编码。

在另一个方面，本发明提供了细胞，优选非猿细胞，其包含以下至少一种：

（i）根据本发明的分离的蛋白质；

（ii）根据本发明的分离的多核苷酸；

（iii）根据本发明的载体；

（iv）根据本发明的重组腺病毒。

细胞可选自细菌细胞例如大肠杆菌细胞，酵母细胞例如酿酒酵母或毕赤酵母，植物细胞，昆虫细胞例如SF9或Hi5细胞，或哺乳动物细胞。哺乳动物细胞的优选实例是中国仓鼠卵巢（CHO）细胞，人胚胎肾（HEK 293）细胞，HELA细胞，人肝癌细胞（例如Huh7.5），Hep G2人肝癌细胞，Hep 3B人肝癌细胞等等。

如果细胞包含根据（ii）的分离的多核苷酸，细胞中存在的此多核苷酸可（i）本身自由地分散，或（ii）整合至宿主细胞基因组或线粒体DNA。

在另一个优选的实施方案中，细胞是表达至少一种选自E1a、E1b、E2a、E2b、E4、L1、L2、L3、L4和L5的腺病毒基因的宿主细胞，优选293细胞或PER.C6^TM细胞。

也提供了根据本发明的分离的多核苷酸、根据本发明的分离的蛋白质、根据本发明的载体、根据本发明的重组腺病毒和/或根据本发明的药物组合物用于疾病的治疗或预防的用途。

已证明了腺病毒载体作为疫苗载体的巨大潜力。临床前和临床研究已证明使用此系统在载体设计、稳健的抗原表达和保护性免疫方面的可行性。因此，优选的实施方案是根据本发明的用途，其中治疗或预防是例如对人受试者的接种。本领域包含的大量文献提供了如何使用腺病毒和将其制备用于接种的详细说明，这是技术人员已知的。

如果用途是接种，可以免疫学和/或预防有效剂量即优选1 x 10⁸ 至1 x 10¹¹ 个病毒颗粒（即1 x 10⁸、5 x 10⁸、1 x 10⁹、5 x 10⁹、1 x 10¹⁰、2.5 x 10¹⁰或5 x 10¹⁰个颗粒）施用本发明的重组腺病毒。此外，对需要加强的接种，优选应用如上定义的“异源引发-加强”方法。此外，当在疫苗中使用根据本发明的分离的多核苷酸、根据本发明的分离的蛋白质、根据本发明的载体、根据本发明的重组腺病毒和/或根据本发明的药物组合物时，优选所述疫苗包含佐剂。优选的免疫佐剂已在本文中描述并可在这样的疫苗中使用。

使用根据本发明的多核苷酸或重组腺病毒蛋白质或其片段制备的重组腺病毒可用于转导多核苷酸例如DNA至宿主细胞。因此，优选地可制备虽然有感染性即能够进入宿主细胞但复制缺陷的腺病毒以在宿主细胞中表达任意定制的（custom）蛋白质或多肽。因此，在优选的实施方案中，在根据本发明的用途中列举的治疗是基因治疗。如果在基因治疗中使用根据本发明的分离的多核苷酸、分离的蛋白质、载体、重组腺病毒和/或药物组合物并对待治疗的受试者施用，优选其以足够大的剂量施用从而使治疗的结果是患者的一个或多个细胞被转染，即转导。如果通过本文公开的任意优选施用方法施用根据本发明的重组腺病毒和/或药物组合物，优选地施用优选1 x 10⁸至5 x 10¹¹个病毒颗粒(即1 x 10⁸、5 x 10⁸、1 x 10⁹、5 x 10⁹、1 x 10¹⁰、2.5 x 10¹⁰、5 x 10¹⁰、1 x 10¹¹，或最优选5 x 10¹¹ 个颗粒)的有效剂量。在优选的实施方案中，在本发明的重组腺病毒中包含的优选异源多核苷酸能够在受试者的宿主细胞中表达蛋白质或多肽，其中所述蛋白质或多肽包含影响蛋白质或多肽从所述宿主细胞中分泌的信号肽。例如，可使用本发明的腺病毒治疗需要特定蛋白质的患者，所述腺病毒包含编码该蛋白质的可分泌形式的cDNA。

在本发明的用途的另一个实施方案中，将根据本发明的分离的多核苷酸、分离的蛋白质、载体、腺病毒和/或药物组合物（以下称为根据本发明的药物）配制为进一步包含一种或多种药学上可接受的稀释剂；载体；赋形剂，包括填充料、粘结剂、润滑剂、助流剂、崩解剂和吸附剂；和/或防腐剂。

可通过各种熟知的途径施用本发明的药物，包括口服、直肠、胃肠内和胃肠外施用，例如静脉内、肌肉内、鼻内、皮内、皮下和类似的施用途径。优选胃肠外、肌肉内和静脉内施用。优选地将根据本发明的药物配制为糖浆、输注或注射溶液、药片、胶囊、囊片（capslet）、锭剂、脂质体、栓剂、膏药、创可贴、延迟胶囊、粉末或缓释制剂。优选地稀释剂为水、缓冲液、缓冲的盐溶液或盐溶液和载体优选地选自可可油和vitebesole。

用于在本发明的用途中施用根据本发明的药物的特别优选的药物形式是适于可注射的用途的形式并包含用于临时制备无菌可注射溶液或分散剂的无菌水溶液或分散剂和无菌粉末。通常，这样的溶液或分散剂将包含溶剂或分散介质，其包括例如水缓冲的水溶液，例如生物可相容的缓冲液，乙醇，多元醇，例如甘油，丙二醇，聚乙二醇，其合适的混合物，表面活性剂或植物油。

可通过本领域已知的许多技术制备输注或注射溶液，包括但不限于加入防腐剂例如抗细菌或抗真菌剂，例如对羟苯甲酸酯（parabene）、氯丁醇、酚、山梨酸或硫柳汞（thimersal）。此外，可在输注或注射溶液中加入等渗剂，例如糖或盐，特别是氯化钠。

本发明的优选稀释剂是水、生理上可接受的缓冲液、生理上可接受的缓冲盐溶液或盐溶液。优选的载体是可可油和vitebesole。与根据本发明的药物的多种药物形式可一起使用的赋形剂可选自以下非限制性列表：

a）粘结剂例如乳糖、甘露醇、结晶山梨醇、二元磷酸盐、磷酸钙、糖、微晶纤维素、羧甲基纤维素、羟乙基纤维素、聚乙烯吡咯烷酮等等；

b）润滑剂例如硬脂酸镁、滑石、硬脂酸钙、硬脂酸锌、硬脂酸、氢化植物油、亮氨酸、甘油酯和硬脂酰延胡索酸钠，

c）崩解剂例如淀粉、croscaramellose、甲基纤维素钠、琼脂、膨润土、藻酸、羧甲基纤维素、聚乙烯吡咯烷酮等等。

其他合适的赋形剂可见American Pharmaceutical Association出版的Handbook of Pharmaceutical Excipients，其在本文引入作为参考。

优选特定量的根据本发明的药物用于疾病的治疗或预防。但是应当理解取决于疾病的严重程度、疾病的类型以及待治疗的各个患者，例如患者的一般健康状态等等，需要不同剂量的根据本发明的药物引起治疗或预防作用。合适剂量的确定是主治医生的判断范围内的。

如果使用根据本发明的药物用于预防，可将其配制为疫苗。在这种情况下以上面概述的优选和特别优选剂量优选地施用根据本发明的药物。优选地，在确定的时间段中重复施用疫苗至少2、3、4、5、6、7、8、9或至少10次，直至接种的受试者已产生足够的针对本发明的药物的抗体从而降低发生各个疾病的风险。在这种情况下，取决于疫苗的抗原性，所述时间段通常是可变的。优选地所述时间段不超过4周、3个月、6个月或3年。在一个实施方案中，如果使用根据本发明的腺病毒用于接种的目的，可将六邻体蛋白的至少一个高变结构域替换为接种针对的各自疾病试剂的免疫原性表位。疫苗通常包含一种或多种如上概述的佐剂。在Bangari DS 和Mittal SK (2006) Vaccine, 24(7), p. 849-862;又见: Zhou D, 等人, Expert Opin Biol Ther. 2006 Jan;6(1):63-72;和: Folgori A, 等人, Nat Med. 2006 Feb;12(2):190-7.;又见: Draper SJ, 等人, Nat Med. 2008 Aug;14(8):819-21. Epub 2008 Jul 27中提供了用于接种的腺病毒的用途的详细总结和与其有关的方法。

在不背离本发明的范围下本发明的多种修改和变化对本领域技术人员而言将是显而易见的。尽管已结合特定优选的实施方案描述了本发明，应当理解要求保护的本发明不应当不适当地受限于这些特定实施方案。实际上，本发明旨在覆盖对相关领域技术人员而言显而易见的实施本发明的描述方式的多种修改。

下图仅为了说明本发明而不应被解释为限制本发明的范围，在任何方面，本发明的范围由附加的权利要求指出。

附图简述

图1：本发明的多个腺病毒分离株的六邻体蛋白之间的多重序列比对，使用具有默认设置的Clustal-W。显示了所述新黑猩猩腺病毒分离株的六邻体蛋白（名为PanAd1、PanAd2、PanAd3、ChAd55、ChAd73、ChAd83、 ChAd146和ChAd147）。将高变结构域1至7分别称为“HVR 1-6”和“HVR 7”。

图2：腺病毒ChAd55和其他新黑猩猩腺病毒分离株（名为PanAd1、PanAd2、PanAd3、ChAd73、ChAd83、ChAd146和ChAd147）的纤维蛋白之间的多重序列比对，使用具有默认设置的Clustal-W。

图3：腺病毒ChAd55和其他新黑猩猩腺病毒分离株（名为PanAd1、PanAd2、PanAd3、ChAd73、ChAd83、ChAd146和ChAd147）的五邻体蛋白之间的多重序列比对，使用具有默认设置的Clustal-W。

图4：通过野生型病毒基因组和对应的穿梭质粒的同源重组构建复制缺陷的腺病毒载体的图解。又见实施例2。

图5：在接种了包含用于表达HIV gag蛋白(SEQ ID NO:1)的表达盒的重组腺病毒的小鼠中的细胞介导的免疫应答。比较了重组人Ad5和黑猩猩ChAd55（图5A），重组人Ad5和倭黑猩猩PanAd1、PanAd2和PanAd3腺病毒(图5B)，和重组ChAd55、ChAd73、ChAd83、ChAd146和ChAd147(图5C)的接种效力。通过用定位于Balb/C小鼠的CD8 HIV gag表位孵育细胞，通过干扰素-γ ELIspot测定测量免疫应答。将结果报告为斑点形成细胞/10⁶个脾细胞。

图6：在一组欧洲来源的人血清中评估了新腺病毒载体的血清阳性率。在相同组中平行评估了人腺病毒5型（Ad5）和黑猩猩腺病毒ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2、PanAd3和CV-68的血清阳性率。将数据表示为显示免疫阳性率的受试者的%。仅检测到针对Ad5和CV-68腺病毒的中和抗体，但没有检测到针对本发明的新腺病毒中的任一种的中和抗体。

图7：在图7A中显示了BALB/c小鼠的PanAd HSV免疫和在图7B中显示了BALB/c小鼠的PanAd 癌症Ag免疫。

图8：在引发/加强接种实验中显示了食蟹猴（Macaca fascicularis）的PanAd HIV gag免疫。

实施例

实施例1：腺病毒的分离和表征

ChAd55、ChAd73、ChAd83、ChAd146、ChAd147是从在不同的欧洲和美国机构中饲养的健康动物中获得一组黑猩猩腺病毒。ChAd55、ChAd73、ChAd83、ChAd146、ChAd147具有与人血清没有可检测的反应性的性质。PanAd1、PanAd2和PanAd3是从在不同的欧洲和美国机构中饲养的健康倭黑猩猩(Pan Paniscus)中分离的新腺病毒。PanAd1、PanAd2和PanAd3具有与人血清没有可检测的反应性的性质。

通过感染接种在96孔板中的293细胞，在第一代扩增后克隆普通黑猩猩和倭黑猩猩腺病毒原种。通过有限稀释在第一代病毒扩增时得到的细胞裂解物进行病毒克隆。挑选出5个分离的克隆并连续增殖。在3-4代连续扩增后，在置于5个双层细胞工厂（NUNC）（2亿细胞/细胞工厂）的细胞上进行腺病毒的大规模制备。通过在氯化铯密度梯度上的2个超速离心步骤从细胞裂解物中得到纯化的病毒颗粒。

通过在1% SDS-TEN中的蛋白酶K(0.5 mg/ml)消化（55℃ 2小时）从3 X 10¹² pp的纯化病毒制品中分离基因组DNA。在酚-氯仿抽提和乙醇沉淀后，在水中重悬基因组DNA并用于基因组测序。

通过对六邻体基因的高变区7（HVR7）的序列分析获得新分离株的最初分类。为此在HVR7两侧的高度保守区设计了2个引物：TGTCCTACCARCTCTTGCTTGA (SEQ ID NO. 3)和GTGGAARGGCACGTAGCG (SEQ ID NO. 4)。使用纯化的病毒DNA或粗293裂解物作为模板通过PCR扩增HVR7并且然后测序。通过测序高变区1至6得到有关分离株的更详细的信息。通过PCR使用寡核苷酸HVR1-6fd, CAYGATGTGACCACCGACCG (SEQ ID NO. 5)和HVR1-6rev, GTGTTYCTGTCYTGCAAGTC (SEQ ID NO. 6)扩增包含HVR1-6的DNA区域。基于HVR序列分析将新分离的病毒归类为人Ad病毒分类(Horowitz, MS (1990), Adenoviridae and their replication. In Virology B.N. Fields和D.M. Knipe, 编 (raven Press, New York) pp.1679-1740)的亚群E(ChAd55、ChAd73、ChAd83、ChAd146、ChAd147)和亚群C(PanAd1、PanAd2和PanAd3)。

通过比对人和黑猩猩腺病毒的六邻体氨基酸序列得到系统树。结果与使用Align X程序(Informax, Inc)基于局限于六邻体HVR1-6和7的核苷酸序列比对的最初分类一致，证明ChAd55、ChAd73、ChAd83、ChAd146、ChAd147分离株与人Ad4（亚群E）的密切的系统发生关系，而倭黑猩猩腺病毒分离株PanAd1、PanAd2和PanAd3与人Ad1、2、5、6（亚群C）有关。

实施例2：载体构建

根据下述策略在质粒载体中克隆PanAd1、PanAd2和PanAd3以及ChAd55、ChAd73、ChAd83、ChAd146、ChAd147病毒基因组。对载体基因组的所有操作在大肠杆菌中根据标准技术进行。通过从ChAd和PanAd骨架缺失E1和E3区域构建载体系统。用基于人CMV IE启动子和BGHpA信号的包含HCV非结构区（HCV NS）和HIV gag (SEQ ID NO: 1)基因的表达盒替换E1区以用于在动物模型中评估免疫学效价。此外，构建了表达分泌的碱性磷酸酶基因(SEAP)的ChAd和PanAd载体用于中和测定。根据标准方案在293细胞中增殖载体并通过CsCl梯度纯化。

按照以下提供的步骤进行PanAd1、PanAd2和PanAd3 ΔE1载体的构建。

I.PanAd穿梭载体的构建

使用PanAd1基因组构建穿梭载体，用于通过PanAd1、PanAd2和PanAd3全基因组的同源重组的克隆。简单地说，如下构建用于克隆倭黑猩猩腺病毒1的穿梭载体，在本文中将其称为pBAd1RLD_EGFP：

通过PCR使用寡核苷酸5’- ATCTGGAATTCGTTTAAACCATCATCAATAATATACCTTATTTTG-3’ (SEQ ID NO: 7)和5’- TCAGGAACTAGTTCCGTATACCTATAATAATAAAACGGAGACTTTG-3’ (SEQ ID NO: 8)扩增PanAd1左端（nt 1-450），用SpeI和EcoRI消化，然后连接至已包含HCMV-EGFP-bgh polyA表达盒的质粒载体从而产生pBAd1-L。然后通过PCR使用寡核苷酸5’- TCCAGCGGCGCGCCAGACCCGAGTCTTACCAGGA-3’ (SEQ ID NO: 9)和5’- ATTCAGGATCCGAATTCGTTTAAACCATCATCAATAATATACCTTATTTTG-3’ (SEQ ID NO: 10)扩增PanAd1右端(nt 37362-37772)，然后克隆至pBAd1-L，由此产生质粒pBAd1-RL。

然后通过PCR使用寡核苷酸5’- TATTCTGCGATCGCTGAGGTGGGTGAGTGGGCG -3’ (SEQ ID NO: 11)和5’- TTACTGGCGCGCCTGCCTCGAGTAAACGGCATTTGCAGGAGAAG-3’ (SEQ ID NO: 12)扩增包含pIX编码区的PanAd1 DNA片段(nt 3498-4039)，然后将其克隆至pBAd1-RL，得到pBAd1RLD EGFP穿梭质粒。通过置换pBAd1RLD EGFP穿梭质粒中的EGFP基因也构建了包含分泌的碱性磷酸酶(SEAP)、HIV gag、HCV非结构区（NS）基因的表达盒的穿梭质粒。

如Emini 等人, 国际公开号WO 03/031588中所描述的构建基于人巨细胞病毒(HCMV)启动子和牛生长激素多聚腺苷酸化信号(Bgh polyA)的HIV gag、HCV NS区、SEAP和EGFP表达盒。病毒DNA表达盒被设计为包含仅在2个ITR的末端存在的限制酶位点(PmeI)以允许从质粒DNA中释放病毒DNA。

II.ΔE1 PanAd1、PanAd2和PanAd3载体的构建

通过在大肠杆菌菌株BJ5183中的同源重组构建PanAd1、PanAd2和PanAd3载体。用PanAd1、2和3的纯化病毒DNA和pBAd1RLD-EGFP或pBAd1RLD-Gag共转化BJ5183细胞。在线性化pBAd1RLD-EGFP或pBAd1RLD-Gag末端存在的pIX基因、右ITR DNA序列和病毒基因组DNA之间的同源重组允许病毒基因组DNA通过同时缺失E1区（其被表达盒置换）插入质粒载体。此策略允许构建表达EGFP或HIV gag转基因的preadeno质粒pPanAd1、pPanAd2和pPanAd3。然后通过替换EGFP或Gag表达盒将SEAP或HCV-NS表达盒克隆至pPanAd 1、2和3载体。

III. E3区的缺失

通过使用包括在大肠杆菌中的克隆和同源重组的若干步骤的策略在PanAd1, PanAd2和PanAd3载体骨架中引入E3区的缺失。PanAd1 E3缺失跨越基因组PanAd1序列(SEQ ID NO.: 13)的第28636位核苷酸至第32596位核苷酸；PanAd2 E3缺失跨越基因组PanAd2序列(SEQ ID NO.: 62)的第28653位核苷酸至第32599位核苷酸；PanAd3 E3缺失跨越基因组PanAd3序列(SEQ ID NO.: 63)的第28684位核苷酸至第32640位核苷酸。

IV. E4区的缺失

缺失PanAd1, PanAd2和PanAd3的天然E4区并替换为Ad5 E4 ORF6编码序列 (SEQ ID NO.: 64)。在PanAd 1, 2和3骨架中引入的E4缺失的坐标如下：

PanAd1 E4缺失跨越第34690至37369位核苷酸(SEQ ID NO.: 13)；

PanAd2 E4缺失跨越第34696至37400位核苷酸(SEQ ID NO.: 62)；

PanAd3 E4缺失跨越第34690至37369位核苷酸(SEQ ID NO.: 63)。

缺失的区域包括所有PanAd E4 ORF但E4的天然启动子和多聚腺苷酸化信号未被缺失。

如Emini 等人, 国际公开号WO 03/031588中所描述的构建基于人巨细胞病毒(HCMV)启动子和牛生长激素多聚腺苷酸化信号(Bgh polyA)的HIV gag和HCV NS区表达盒并利用HCMV和Bgh polyA DNA序列之间的同源性通过在大肠杆菌菌株BJ5183中的同源重组插入PanAd1、2和3 ΔE1 EGFP载体。

V. ChAd55 DE1表达载体的构建和挽救

构建用于ChAd55克隆的穿梭载体

根据上面描述的构建PanAd载体的相同策略构建ChAd55穿梭质粒，然后用于克隆ChAd55病毒基因组。为此，用AscI限制酶线性化包含病毒基因组右端和左端的穿梭载体pARS ChAd55（左端从ITR至pIX基因具有E1区被缺失并被置换为表达盒）并与ChAd55的纯化病毒DNA共转化至大肠杆菌菌株BJ5183。在线性化pARS ChAd55 以及ChAd55、ChAd73、ChAd83、ChAd146和ChAd147的纯化病毒基因组DNA末端存在的pIX基因和右ITR之间的DNA序列的同源重组允许病毒基因组DNA通过同时缺失E1区插入质粒载体。图4提供了黑猩猩腺病毒55（ChAd55）基因组克隆策略的图解。

构建了基于人巨细胞病毒(HCMV)启动子和牛生长激素多聚腺苷酸化信号(Bgh polyA)的表达盒以表达分泌的碱性磷酸酶（SEAP）、EGFP、HIV gag、HCV NS基因。将所有表达盒插入将要通过同源重组转移至ΔE1腺病毒预质粒（pre-plasmid）的pARS ChAd55载体的单个SnaBI位点中。

实施例3：免疫实验

使用表达HIV gag转基因的载体在小鼠中评估了ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2和PanAd3载体作为潜在的重组疫苗的效力。在平行进行的免疫实验中比较了ChAd55 gag和人Ad5 gag的载体效价。对10只动物的实验组在四头肌内注射10⁸ vp/小鼠载体剂量的Ad5gag或ChAd55gag（图5A）。在单独的实验中对5只动物的实验组注射10⁸ vp/小鼠载体剂量的Ad5gag或PanAd1gag, PanAd2gag和PanAd3gag (图5B)。通过用10⁸ vp/小鼠载体剂量的ChAd55 gag平行免疫5只小鼠的实验组也测定了ChAd73 gag、ChAd83 gag、ChAd146 gag 和Chad147gag的效价（图5C）。通过在脾细胞上的干扰素-γ Elispot测定测量针对HIV gag引起的免疫应答。相比人Ad5 gag载体，ChAd55、ChAd73、ChAd83、ChAd146、ChAd147以及PanAd1、PanAd2和PanAd3在免疫实验中的结果显示本发明的新腺病毒在引发特异性免疫应答方面至少和现有技术的重组腺病毒Ad5一样有效。

实施例4：中和研究

进行了中和测定以评估针对普通黑猩猩腺病毒55、73、83、146、147和倭黑猩猩腺病毒1、2和3型的中和抗体在人血清中的阳性率。该测定评估了血清预孵育对携带分泌的碱性磷酸酶(SEAP)基因的ChAd55、ChAd73、ChAd83、ChAd146、ChAd147、 PanAd1、PanAd2和PanAd3转导人293细胞的能力的影响。将中和滴度定义为使在具有病毒、缺乏血清的阳性对照中观察到的SEAP活性减少50%的血清稀释度。在多个稀释度上（5个4倍递增，从1/18稀释开始至1：4608）检测了每种血清样品。样品在37℃预孵育1小时，然后加入到接种至96孔板的293细胞中（3x10⁴个细胞/孔）。检测了一组人血清的中和活性。对Ad5和黑猩猩和倭黑猩猩Ad SEAP载体平行检测了相同的组。图6提供了结果。结果显示对黑猩猩腺病毒的血清阳性率低于人腺病毒Ad5。然而，通常在受试者的子集中可检测到针对已描述的ChAd (CV-68)的中和抗体的存在。相反地，目前检测的所有人血清不能中和ChAd55以及PanAd1、PanAd2和PanAd3，甚至在极低的滴度上。对ChAd73、ChAd83、ChAd146和ChAd147观察到相同的结果。因此，新腺病毒分离株ChAd55、ChAd73、ChAd83、ChAd146、ChAd147 以及PanAd1、PanAd2和PanAd3代表了限制基于普通人Ad血清型例如Ad5的病毒载体的施用的先存抗人Ad免疫力问题的理想解决方案。

实施例5：与Ad5载体相比PanAd1和3载体的免疫效力

使用表达单纯疱疹病毒（HSV）抗原的载体和使用表达癌症抗原的载体在BALB/c小鼠中评估了PanAd1和PanAd3载体作为潜在的重组疫苗的效力。比较了表达HSV Ag和癌症Ag的PanAd1和3的载体效价与基于人Ad5的对应载体。

为了评估抗病毒效价，对9组BALB/c小鼠在四头肌内以从10⁷ vp/小鼠开始直到10⁹ vp/小鼠的递增载体剂量平行注射PanAd1-HSV、PanAd3-HSV和Ad5-HSV（见图7A）。通过在与覆盖抗原的全部氨基酸序列的肽库孵育的小鼠脾细胞上的干扰素-γ Elispot测定来测量针对HSV抗原引起的免疫应答。在图7中报告的与人Ad5载体比较的PanAd1, PanAd2和PanAd3的免疫实验结果显示本发明的新腺病毒比现有技术的重组腺病毒Ad5在每个检测的浓度上均更有效地引起特异性免疫应答。在使用PanAd1和PanAd3载体免疫的小鼠中观察到的更高频率的抗原特异性T细胞明确证明了这一点。

通过对BALB/c小鼠组在四头肌内注射从10⁷ vp/小鼠开始直到10⁹ vp/小鼠的递增载体剂量免疫小鼠评估PanAd载体引起抗肿瘤T细胞应答的效力。对2组BALB/C小鼠以10⁷ vp/小鼠和10⁹vp/小鼠注射表达肿瘤抗原的Ad5载体。平行地用10⁷、10⁸、10⁹vp的携带相同肿瘤抗原的PanAd1或PanAd3载体免疫3组BALB/C小鼠。通过在脾细胞上使用表示已定位的CD8表位的单个肽的干扰素-γ Elispot测定来测量T细胞应答。图7B中显示的结果证明与用Ad5载体免疫的动物组相比，用PanAd载体免疫的动物组在最低载体剂量上应答的动物频率更高和抗原特异性T细胞的频率更高。

实施例6：用PanAd载体免疫食蟹猴

采用异源引发/加强方案通过肌肉内注射CsCl纯化的PanAd1和PanAd3免疫2组猕猴，每组3只。在第0周，组1中的每只动物在三角肌内接受10⁸ vp剂量的PanAd3 Gag载体，而组2中的动物接受10¹⁰ vp剂量。然后在第13周用10¹⁰ vp PanAd1 Gag的单一剂量加强两组中的所有动物。

通过IFN-γ ELISPOT测定在不同时间点测量CMI。此测定测量HIV抗原特异性CD8+ 和CD4+ T淋巴细胞应答。制备了基于HIV Gag蛋白的氨基酸序列的肽用于这些测定以测量接种腺病毒载体的猴子中的免疫应答。各个肽具有20-mer的重叠，10个氨基酸的偏移。

IFNγ-ELISPOT测定提供了抗原特异性T淋巴细胞应答的定量测定。连续稀释PBMC并将其置于用抗-恒河猴IFN-γ抗体(MD-1 U-Cytech)包被的微板孔中。它们与HIV Gag肽库一起培养20小时，导致前体细胞的再激发和IFN-γ的分泌。洗去细胞，留下在细胞存在的集中区域中与抗体包被的孔结合的分泌的IFN。用生物素化的抗-恒河猴IFN抗体（检测Ab U-Cytech）和之后用碱性磷酸酶缀合的链霉抗生物素(Pharmingen 13043E)检测捕获的IFN。不可溶的碱性磷酸酶底物的加入导致孔中在细胞存在（located）的位点处的暗斑，在分泌了IFN-γ的每个T细胞上留下一个斑点。

每个孔中的斑点数与抗原特异性T细胞的前体频率直接相关。在此测定中选择干扰素γ作为直观的细胞因子（使用特异性抗-干扰素γ单克隆抗体），因为它是活化的T淋巴细胞合成和分泌的最常见的细胞因子和最大量的细胞因子之一。在此测定中，测定了样品在存在或缺乏（培养基对照）肽抗原时的斑点形成细胞数（SFC）/百万个PBMC。图8显示了在剂量1后和剂量2后的不同时间点获得的PBMC的来自猕猴的数据。在两种剂量上用PanAd3引发的所有动物显示了针对HIV Gag的T细胞应答，通过PanAd1的第二次注射的有效加强证明：如六邻体、五邻体和纤维蛋白序列比对已暗示的，PanAd1和PanAd3是不同的血清型并可以在异源引发-加强免疫方案中组合。因此，在另一个方面，本发明提供了本发明的2种重组腺病毒在异源引发-加强免疫中的用途，其中本发明的2种重组腺病毒是不同的腺病毒血清型，最优选如本文描述的PanAd1和PanAd3。

序列表

<110> Okairos AG

<120> 猿腺病毒核酸和氨基酸序列，包含其的载体及其用途

<130> 578-13 PCT 2

<140>

<141> 2010-02-02

<150> PCT/EP2009/000672

<151> 2009-02-02

<150> US 61/172,624

<151> 2009-04-24

<150> US 61/174,852

<151> 2009-05-01

<150> US 61/266,342

<151> 2009-12-03

<160> 65

<170> PatentIn 版本3.5

<210> 1

<211> 1503

<212> DNA

<213> 人免疫缺陷病毒

<400> 1

atgggtgcta gggcttctgt gctgtctggt ggtgagctgg acaagtggga gaagatcagg 60

ctgaggcctg gtggcaagaa gaagtacaag ctaaagcaca ttgtgtgggc ctccagggag 120

ctggagaggt ttgctgtgaa ccctggcctg ctggagacct ctgaggggtg caggcagatc 180

ctgggccagc tccagccctc cctgcaaaca ggctctgagg agctgaggtc cctgtacaac 240

acagtggcta ccctgtactg tgtgcaccag aagattgatg tgaaggacac caaggaggcc 300

ctggagaaga ttgaggagga gcagaacaag tccaagaaga aggcccagca ggctgctgct 360

ggcacaggca actccagcca ggtgtcccag aactacccca ttgtgcagaa cctccagggc 420

cagatggtgc accaggccat ctccccccgg accctgaatg cctgggtgaa ggtggtggag 480

gagaaggcct tctcccctga ggtgatcccc atgttctctg ccctgtctga gggtgccacc 540

ccccaggacc tgaacaccat gctgaacaca gtggggggcc atcaggctgc catgcagatg 600

ctgaaggaga ccatcaatga ggaggctgct gagtgggaca ggctgcatcc tgtgcacgct 660

ggccccattg cccccggcca gatgagggag cccaggggct ctgacattgc tggcaccacc 720

tccaccctcc aggagcagat tggctggatg accaacaacc cccccatccc tgtgggggaa 780

atctacaaga ggtggatcat cctgggcctg aacaagattg tgaggatgta ctcccccacc 840

tccatcctgg acatcaggca gggccccaag gagcccttca gggactatgt ggacaggttc 900

tacaagaccc tgagggctga gcaggcctcc caggaggtga agaactggat gacagagacc 960

ctgctggtgc agaatgccaa ccctgactgc aagaccatcc tgaaggccct gggccctgct 1020

gccaccctgg aggagatgat gacagcctgc cagggggtgg ggggccctgg tcacaaggcc 1080

agggtgctgg ctgaggccat gtcccaggtg accaactccg ccaccatcat gatgcagagg 1140

ggcaacttca ggaaccagag gaagacagtg aagtgcttca actgtggcaa ggtgggccac 1200

attgccaaga actgtagggc ccccaggaag aagggctgct ggaagtgtgg caaggagggc 1260

caccagatga aggactgcaa tgagaggcag gccaacttcc tgggcaaaat ctggccctcc 1320

cacaagggca ggcctggcaa cttcctccag tccaggcctg agcccacagc ccctcccgag 1380

gagtccttca ggtttgggga ggagaagacc acccccagcc agaagcagga gcccattgac 1440

aaggagctgt accccctggc ctccctgagg tccctgtttg gcaacgaccc ctcctcccag 1500

taa 1503

<210> 2

<211> 20

<212> DNA

<213> 人工

<220>

<223> TLR9激动剂

<400> 2

tccatgacgt tcctgacgtt 20

<210> 3

<211> 22

<212> DNA

<213> 人工

<220>

<223> 引物: HVR7 引物1

<400> 3

tgtcctacca rctcttgctt ga 22

<210> 4

<211> 18

<212> DNA

<213> 人工

<220>

<223> 引物: HVR7 引物2

<400> 4

gtggaarggc acgtagcg 18

<210> 5

<211> 20

<212> DNA

<213> 人工

<220>

<223> 引物: HVR1-6fd

<400> 5

caygatgtga ccaccgaccg 20

<210> 6

<211> 20

<212> DNA

<213> 人工

<220>

<223> 引物: HVR1-6rev

<400> 6

gtgttyctgt cytgcaagtc 20

<210> 7

<211> 45

<212> DNA

<213> 人工

<220>

<223> 引物: PanAd1左端P1

<400> 7

atctggaatt cgtttaaacc atcatcaata atatacctta ttttg 45

<210> 8

<211> 46

<212> DNA

<213> 人工

<220>

<223> 引物: PanAd1左端P2

<400> 8

tcaggaacta gttccgtata cctataataa taaaacggag actttg 46

<210> 9

<211> 34

<212> DNA

<213> 人工

<220>

<223> 引物: PanAd1右端P1

<400> 9

tccagcggcg cgccagaccc gagtcttacc agga 34

<210> 10

<211> 51

<212> DNA

<213> 人工

<220>

<223> 引物: PanAd1右端P2

<400> 10

attcaggatc cgaattcgtt taaaccatca tcaataatat accttatttt g 51

<210> 11

<211> 33

<212> DNA

<213> 人工

<220>

<223> 引物: pIX P1

<400> 11

tattctgcga tcgctgaggt gggtgagtgg gcg 33

<210> 12

<211> 44

<212> DNA

<213> 人工

<220>

<223> 引物: pIX P2

<400> 12

ttactggcgc gcctgcctcg agtaaacggc atttgcagga gaag 44

<210> 13

<211> 37772

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 13

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag gtgggcggag 60

cggggcgggg cggggaggag cggcggcgcg gggcgggccg ggaggtgtgg cggaagttga 120

gtttgtaagt gtggcggatg tgacttgcta gcgccggatg tggtaaaagt gacgtttttt 180

ggagtgcgac aacgcccacg ggaagtgaca tttttcccgc ggtttttacc ggatgtcgta 240

gtgaatttgg gcgttaccaa gtaagatttg gccattttcg cgggaaaact gaaatgggga 300

agtgaaatct gattaatttc gcgttagtca taccgcgtaa tatttgccga gggccgaggg 360

actttgaccg attacgtgga ggaatcgccc aggtgttttt tgaggtgaat ttccgcgttc 420

cgggtcaaag tctccgtttt attattatag tcagctgacg cggagtgtat ttatacccgc 480

tgatctcgtc aagaggccac tcttgagtgc cagcgagtag agttttctcc tctgccgctc 540

cgctctgaca ccgggggaaa aatgagacat ttcacctacg atggcggtgt cctcaccggc 600

cagctggctg cctcggtcct ggacgccctg atcgaggagg tattggccga caattatcct 660

cctccagctc attttgagcc acctactctt cacgaactgt atgatttgga cgtggtggca 720

cctagcgacc cgaacgagca ggcggtttcc agtttttttc ctgactctat gctgttggcc 780

agccaggagg gggtcgagct cgagacccct cctccaatcg ccgtttctcc tgagcctccg 840

accctgacca ggcagcccga tcgccgtgtt ggacctgcga ctatgcccca tctgctgccc 900

gaggtgatcg atctcacctg taacgagtct ggttttccac ccagcgagga tgaggacgaa 960

gagggtgagc agtttgtgtt agattctgtg gaggaacccg ggcgcggttg cagatcttgt 1020

caataccatc ggaaaaatac aggagacccc caaattatgt gttccctgtg ttatatgaag 1080

acgacctgta tgtttattta cagtaagttt gtgattggtg ggtcggtggg ctgtagtgtg 1140

ggtaggtggt ctgtggtttt ttttttttta atatcagctt gggctaaaaa actgctatgg 1200

taattttttt aaggtccggt gtctgaacct gagcaggaag ctgaaccgga gcctgagagt 1260

cgccccagga gaaggcctgc aattctaact agaccgagtg cacctgtagc gagggacctc 1320

agcagtgcag agaccaccga ttccggtcct tcctcatccc ctccagagat tcatcccgtg 1380

gtgcctttgt gtcccctcaa gcccgttgcc gtgagagtta gtgggcggag ggccgccgtg 1440

gagagcattg aggacttgct taatgagaca caggaacctt tggacttgag ctgtaaacgc 1500

cctaggcaat aaacctgctt acctggactg aatgagttga cgcctatgtt tgcttttgaa 1560

tgacttaatg tgtatataat aaagagtgag ataatgttta attgcatggt gtgtttgatt 1620

ggggcggggt ttgttgggta tataagcttc cctgggctaa acttggttac acttgacctc 1680

atggaggcct gggagtgttt agagagcttt gccgaagtgc gtgccttgct ggaagagagc 1740

tctaataata cctctgggtg gtggaggtat ttttggggct ctccccaggc taagttagtt 1800

tgtagaatca aggaggatta caagtgggaa tttgaacagc ttttgaaatc ctgtggtgag 1860

ctcttggatt ctttgaatct gggccaccag gctcttttcc aggacaagat catcaggact 1920

ttggattttt ccacaccggg gcgcattgct gccggggttg cttttctagc ttttttgaag 1980

gataaatgga gcgaagagac ccacttgagt tcgggatacg tcctggattt tctggccata 2040

caactgtgga gagcatggat caggcacaag aacagaatgc aactgttgtc ttccgtccgt 2100

ccgttgctga ttcagccgga ggagcagcag accgggccgg aggaccgggc tcgtctggaa 2160

ccagaagaga gggcaccgga gaggagcgcg tggaacctgg gagccggcct gaacggccat 2220

ccacatcggg agtgaatgtt ggacaggtgg cggatctctt tccagaactg cgacgaatct 2280

taactatcag ggaggatgga caatttgtta aggggcttaa gagggagcgg ggggcttctg 2340

aacataacga ggaggccagt aatttagctt ttagtctgat gaccagacac cgtcccgagt 2400

gcattacttt tcagcagatt aaggataatt gtgccaatga gttagatctg ctgggtcaga 2460

agtacagcat agagcagttg accacttact ggctgcagcc gggtgatgat ctggaggaag 2520

ctattagggt gtatgccaag gtggccctga ggcccgattg caagtacaag ctcaaggggc 2580

tggtgaatat caggaattgt tgctacattt ctgggaacgg ggcggaggtg gagatagaga 2640

ccgatgacag ggtggccttt aggtgtagca tgatgaatat gtggcctggg gtgctgggca 2700

tggacggggt ggtgattatg aatgtgaggt tcacggggcc caattttaat ggcacggtgt 2760

tcctgggcaa caccaacttg gtgctgcacg gggtgagctt ctatggcttt aacaacacct 2820

gtgtggaggc ctggaccgat gtgaaggtcc gtggctgtgc cttctacgga tgttggaagg 2880

cggtagtgtg tcgccccaag agcaggagtt ccattaaaaa atgcttgttt gagaggtgca 2940

ccctgggggt gctggcggag ggcaactgtc gggtgcgcca caatgtggcc tcagaatgcg 3000

gttgcttcat gctagtcaag agcgtggcgg tcatcaagca taacatggtg tgcggcaaca 3060

gcgaggacaa ggcctcgcag atgctgacct gctcggatgg caactgccac ttactgaaga 3120

ccgtacatat aaccagccac agccgcaagg cctggcccgt gttcgagcac aacgtgttga 3180

cccgctgctc tttgcatctg ggcaacagga ggggtgtgtt cctgccctat caatgcaact 3240

tgagccacac caagatcttg ctagagcccg aaagcatgtc caaggtgaac ctgaacgggg 3300

tgtttgacat gaccctgaag atatggaagg tgctgaggta cgacgagacc aggtctcgat 3360

gcaggccctg cgagtgcggg ggcaagcata tgaggaacca gcctgtgatg ctggatgtga 3420

ccgaggagct gaggcctgac cacttggttc tggcctgcac cagggccgag tttggttcta 3480

gcgatgaaga cacagactga ggtgggtgag tgggcgtggt ctgggggtgg gaagcaatat 3540

ataagttggg ggtcttaggg tctctgtgtc tgttttgcag agggaccgcc ggcgccatga 3600

gcgggagcag tagcagcaac gccttggatg gcagcatcgt gagcccttat ttgacgacgc 3660

gcatgcccca ctgggccggg gtgcgtcaga atgtgatggg ctccagcatc gacggacgac 3720

ccgtgctgcc cgcaaattcc gccacgctga cctacgcgac cgtcgcgggg accccgttgg 3780

acgccaccgc cgccgccgcc gccaccgccg ccgcctcggc cgtgcgcagc ctggccacgg 3840

actttgcatt cttgggaccc ttggccaccg gggcggccgc ccgtgccgcc gttcgcgatg 3900

acaagctgac cgccctgctg gcgcagttgg atgcgcttac ccgggaactg ggtgaccttt 3960

cgcagcaggt cgtggccctg cgccagcagg tctccgccct gcaggctagc gggaatgctt 4020

ctcctgcaaa tgccgtttaa gataaataaa accagactct gtttggatta aagaaaagta 4080

gcaagtgcat tgctctcttt atttcataat tttccgcgcg cgataggccc gagtccagcg 4140

ttctcggtcg ttgagggtgc ggtgtatctt ctccaggacg tggtagaggt ggctctggac 4200

gttgagatac atgggcatga gcccgtcccg ggggtggagg tagcaccact gcagagcttc 4260

atgctccggg gtggtgttgt agatgatcca gtcgtagcag gagcgctggg catggtgcct 4320

aaaaatgtcc ttaagcagca ggccgatggc cagggggagg cccttggtgt aagtgtttac 4380

aaaacggttg agttgggaag ggtgcatgcg gggtgagatg atgtgcatct tagattgtat 4440

ttttagattg gcgatgtttc ctcccagatc ccttctggga ttcatgttgt ggaggaccac 4500

cagcacagta tatccggtgc acttgggaaa tttgtcatgc agcttagagg gaaatgcgtg 4560

gaagaacttg gagacgccct tgtggcctcc cagattctcc atgcattcgt ccatgatgat 4620

ggcaatgggc ccgcgggagg cggcctgggc aaagatgttt ctggggtcac tgacatcgta 4680

gttgtgttcc agggtgagat cgtcataggc catttttata aagcgcgggc ggagggtgcc 4740

cgactggggg atgatggttc cctcgggccc cggggcgtag ttgccttcgc agatctgcat 4800

ttcccaggcc ttaatctctg aggggggaat catatccact tgcggggcga tgaagaaaac 4860

ggtttccgga gccggggaga ttaactggga tgagagcagg tttctcagca gctgtgactt 4920

tccacagccg gtgggtccat aaataacacc tataaccggc tgcagctggt agttgagcga 4980

gctgcagctg ccgtcgtccc ggaggagggg ggccacctca ttgagcatgt cccggacgcg 5040

cttgttctcc tcgaccaggt ccgccagaag gcgctcgccg cccagggaca gcagctcttg 5100

caaggaagca aagtttttca gcggtttgag gccgtccgcc gtgggcatgt ttttcagggt 5160

ctggccgagc agctccaggc ggtcccagag ctcggtgacg tgctctacgg catctctatc 5220

cagcatatct cctcgtttcg cgggttgggg cggctttcgc tgtagggcac caggcgatgg 5280

tcgtccagcg cggccagagt catgtccttc catgggcgca gggtcctcgt cagggtggtc 5340

tgggtcacgg tgaaggggtg cgccccgggc tgggcgctgg ccagggtgcg cttgagactg 5400

gtcctgctgg tgctgaagcg ctgccggtct tcgccctgcg cgtcggccag gtagcatttg 5460

accatggtgt cgtagtccag cccctccgcg gcgtgtccct tggcgcgcag cttgcccttg 5520

gaggtggcgc cgcacgcggg gcactgcagg ctcttgagcg cgtagagctt gggggcgagg 5580

aagaccgatt cgggggagta ggcgtccgcg ccgcaggccc cgcacacggt ctcgcactcc 5640

accagccagg tgagctcggg gcgctcgggg tcaaaaacca ggtttccccc atgctttttg 5700

atgcgtttct tacctcgggt ctccatgagg cggtgtcccc gttcggtgac gaagaggctg 5760

tccgtgtctc cgtagaccga cttgaggggt ctgtcctcca ggggggtccc tcggtcctct 5820

tcgtagagaa actcggacca ctctgagaca aaggcccgcg tccaggccag gacgaaggag 5880

gccaggtggg aggggtaccg gtcgttgtcc actagggggt ccaccttctc caaggtgtga 5940

agacacatgt cgccctcctc ggcgtccagg aaggtgattg gcttgtaggt gtaggccacg 6000

tgacccgggg ttccggacgg gggggtataa aagggggtgg gggcgcgctc gtcctcactc 6060

tcttccgcat cgctgtctgc gagggccagc tgctggggtg agtattccct ctcgaaggcg 6120

ggcatgacct cagcgctgag gctgtcagtt tctaaaaacg aggaggattt gatgttcacc 6180

tgtcccgagc tgatgccttt gagggtgccc gcgtccatct ggtcagaaaa cacgatcttt 6240

ttattgtcca gcttggtggc gaacgacccg tagagggcgt tggagagcag cttggcgatg 6300

gagcgcaggg tctgattctt gtcccggtcg gcgcgctcct tggccgcgat gttgagctgc 6360

acgtactcgc gcgcgacgca gcgccactcg gggaagacgg tggtgcgctc gtcgggcacc 6420

aggcgcacgc gccagccgcg gttgtgcagg gtgacgaggt ccacgctggt ggcgacctcg 6480

ccgcgcaggc gctcgttggt ccagcagagg cgcccgccct tgcgcgagca gaaggggggc 6540

agggggtcga gttgggtttc gtccgggggg tccgcgtcca ccgtgaagac cccggggcgc 6600

aggcgcgcgt cgaagtagtc gatcttgcat ccttgcaagt ccagcgcccg ctgccagtcg 6660

cgggcggcga gcgcgcgctc gtaggggttg agcggcgggc cccagggcat ggggtgggtg 6720

agcgcggagg cgtacatgcc gcagatgtca tagacgtaga ggggctcccg gaggatgccc 6780

aggtaggtgg ggtagcagcg gccgccgcgg atgctggcgc gcacgtagtc gtagagctcg 6840

tgcgaggggg cgaggaggtc ggggcccagg ttggtgcggg cggggcgctc cgcgcggaag 6900

acgatctgcc tgaagatggc atgcgagttg gaagagatgg tggggcgctg gaagacgttg 6960

aagctggcgt cctgcaggcc gacggcgtcg cgcacgaagg aggcgtagga ctcgcgcagc 7020

ttgtgcacca gctcggcggt gacctgcacg tcgagcgcgc agtagtcgag ggtctcgcgg 7080

atgatgtcat acttagcctg ccccttcttt ttccacagct cgcggttgag gacgaactct 7140

tcgcggtctt tccagtactc ttggatcggg aaaccgtccg gctccgaacg gtaagagccc 7200

agcatgtaga actggttgac ggcctggtag gcgcagcagc ccttctccac gggcagggcg 7260

taggcctgcg cggccttgcg gagcgaggtg tgggtcaggg cgaaggtgtc cctgaccatg 7320

accttgaggt actggtgttt gaagtcggag tcgtcgcagc cgccccgctc ccagagcgag 7380

aagtcggtgc gctttttgga gcgggggttg ggcagcgcga aggtgacatc gttgtagagg 7440

atcttgcccg cgcgaggcat gaagttgcgg gtgatgcgga agggccccgg cacttccgag 7500

cggttgttga tgacctgggc ggcgagcacg atctcgtcga agccgttgat gttgtggccc 7560

acgatgtaga gttccaggaa gcggggccgg cccttgacgc tgggcagctt ctttagctct 7620

tcgtaggtga gctcctcggg cgaggcgagg ccgtgctcgg ccagggccca gtccgccagg 7680

tgcgggttgt ccgcgaggaa ggaccgccag aggtcgcggg ccaggagggt ctgcaggcgg 7740

tccctgaagg tcctgaactg gcggcctacg gccatctttt cgggggtgac gcagtagaag 7800

gtgagggggt cttgctgcca ggggtcccag tcgagctcca gggcgaggtc gcgcgcggcg 7860

gcgaccaggc gctcgtcgcc cccgaatttc atgaccagca tgaagggcac gagctgcttt 7920

ccgaaggcgc ccatccaagt gtaggtctct acatcgtagg tgacaaagag acgttccgtg 7980

cgaggatgcg agccgatcgg gaagaactgg atctcccgcc accagttgga ggagtggctg 8040

ttgatgtggt gaaagtagaa gtcccgtcgg cgggccgagc actcgtgctg gcttttgtaa 8100

aagcgagcgc agtactggca gcgctgcacg ggctgtacct cttgcacgag atgcacctgc 8160

cgaccgcgga cgaggaagct gagtgggaat ctgagccccc cgcatggctc gcggcctggc 8220

tggtgctctt ctactttgga tgcgtggccg tcaccgtctg gctcctcgag gggtgttacg 8280

gtggagcgga tcaccacgcc gcgcgagccg caggtccaga tatcggcgcg cggcggtcgg 8340

agtttgatga cgacatcgcg cagctgggag ctgtccatgg tctggagctc ccgcggcggc 8400

ggcaggtcag ccgggagttc ttgcaggttt acctcgcaga gacgggccag ggcgcggggc 8460

aggtccaggt ggtacttgaa ttcgagaggc gtgttggtgg cggcgtcgat ggcttgcagt 8520

atgccgcagc cccggggcgc gacgacggtg ccccgcgggg cggtgaagct cccgccgccg 8580

ctcctgctgt cgccgccggt ggcggggctt agaagcggtg ccgcggtcgg gcccccggag 8640

gtaggggggg ctccggtccc gcgggcaggg gcggcagcgg cacgtcggcg ccgcgcgcgg 8700

gcaggagctg gtgctgcgcc cggaggttgc tggcgaaggc gacgacgcgg cggttgatct 8760

cctggatctg gcgcctctgc gtgaagacga cgggtccggt gagcttgaac ctgaaagaga 8820

gttcgacaga atcaatctcg gtgtcattga ccgcgacctg gcgcaggatc tcctgcacgt 8880

cgcccgagtt gtcttggtag gcgatctcgg ccatgaactg ttcaatctct tcctcctgga 8940

ggtctccgcg tccggcgcgc tccacggtgg ccgccaggtc gttggagatg cgcgccatga 9000

gctgcgagaa ggcgttgagt ccgccctcgt tccacactcg gctgtagacc acgccgccct 9060

ggtcgtcgcg ggcgcgcatg accacctgcg cgaggttgag ttccacgtgg cgcgcaaaga 9120

cggcgtagtt gcgcaggcgc tggaagaggt agttgagggt ggtggcggtg tgctcggcca 9180

caaagaagta catgacccag cggcgcaacg tggattcgtt gatgtccccc aaggcctcca 9240

gtcgctccat ggcctcgtag aagtccacgg cgaagttgaa aaactgggag ttgcgcgccg 9300

acacggtcaa ctcctcctcc agaagacgga tgagctcggc gacggtgtcg cgcacctcgc 9360

gctcgaaggc tatgggaatc tcttcctccg ccagcatcac cacctcttcc tcttcttcct 9420

cctctggcac ttccatgatg gcttcctcct cttcgggggg tggcggcggg ggagggggcg 9480

ctcggcgccg gcggcggcgc accgggaggc ggtccacgaa gcgctcgatc atctccccgc 9540

ggcggcgacg catggtctcg gtgacggcgc ggccgttctc tcggggacgc agctggaaga 9600

cgccgccggt catctggtgc tggggcgggt ggccgtgggg cagcgagacc gcgctgacga 9660

tgcatcttaa caattgctgc gtaggtacgc cgccgaggga cctgagggag tccagatcca 9720

ccggatccga aaacctttcg aggaaggcat ctaaccagtc gcagtcgcaa ggtaggctga 9780

gcaccgtggc gggcggcggg gggtgggggg agtgtctggc ggaggtgctg ctgatgatgt 9840

aattgaagta ggcggtcttg acacggcgga tggtcgacag gagcaccata tctttgggcc 9900

cggcctgctg gatgcggagg cggtcggcca tgccccaggc ttcgttctgg catctgcgca 9960

ggtctttgta gtagtcttgc atgagccttt ccaccggcac ctcttctcct tcttcttctg 10020

acatctctgc tgcatctgcg gccctggggc gacggcgcgc gcccctgccc cccatgcgcg 10080

tcaccccgaa ccccctgagc ggctggagca gggccaggtc ggcgacgacg cgctcggcca 10140

ggatggcctg ctggacctgc gtgagggtgg tttggaagtc atccaagtcc acgaagcggt 10200

ggtaggcgcc cgtgttgatg gtgtaggtgc agttggccat gacggaccag ttgacggtct 10260

ggtggcccgg ttgcgtcatc tcggtgtacc tgaggcgcga gtaggcgcgc gagtcgaaga 10320

tgtagtcgtt gcaagtccgc accaggtact ggtagcccac caggaagtgc ggcggcggct 10380

ggcggtagag gggccagcgg agggtggcgg gggctccggg ggccaggtct tccagcatga 10440

ggcggtggta ttcgtagatg tacctggaca tccaggtgat gcccgcggcg gtggtggagg 10500

cgcgcgggaa gtcgcgcacc cggttccaga tgttgcgcag cggcagaaag tgctccatgg 10560

taggcgtgct ctggccggtc aggcgcgcgc agtcgttgat actctagacc agggaaaacg 10620

aaagccggtc agcgggcact cttccgtggt ctggtggata aattcgcaag ggtatcatgg 10680

cggagggcct cggttcgagc cccgggcccg ggccggacgg tccgccatga tccacgcggt 10740

taccgcccgc gtgtcgaacc caggtggcga cgtcagacaa cggtggagtg ttccttttgg 10800

gttttttttc caaatttttc tggccgggcg ccgacgccgc cgcgtaagag actagagtgc 10860

aaaagcgaaa gcagtaagtg gctcgctccc tgtagcccgg aggatccttg ctaagggttg 10920

cgttgcggcg aaccccggtt cgagtctggc tctcgcgggc cgctcgggtc ggccggaacc 10980

gcggctaagg cgggattggc ctccccctca ttaaagaccc cgcttgcgga ttcctccgga 11040

cacaggggac gagccccttt ttacttttgc ttttctcaga tgcatccggt gctgcggcag 11100

atgcgccccc cgccccagca gcagcagcaa catcagcaag agcggcacca gcagcagcgg 11160

gagtcatgca gggccccctc gcccacgctc ggcggtccgg cgacctcggc gtccgcggcc 11220

gtgtctggag ccggcggcgg ggggctggcg gacgacccgg aggagccccc gcggcgcagg 11280

gccagacagt acctggacct ggaggagggc gagggcctgg cgcgactggg ggcgccgtcc 11340

cccgagcgcc acccgcgggt gcagctgaag cgcgactcgc gcgaggcgta cgtgcctcgg 11400

cagaacctgt tcagagaccg cgcgggcgag gagcccgagg agatgcggga ccgcaggttc 11460

gccgcggggc gggagctgcg gcaggggctg aaccgggagc ggctgctgcg cgaggaggac 11520

tttgagcccg acgcgcggac ggggatcagc cccgcgcgcg cgcacgtggc ggccgccgac 11580

ctggtgacgg catacgagca gacggtgaac caggagatca acttccaaaa aagcttcaac 11640

aaccacgtgc gcacgctggt ggcgcgcgag gaggtgacca tcggcctgat gcacctgtgg 11700

gactttgtga gcgcgctgga gcagaacccc aacagcaagc ctctgacggc gcagctgttc 11760

ctgatagtgc agcacagcag ggacaacgag gcgttcaggg acgcgctgct gaacatcacc 11820

gagcccgagg gtcggtggct cctggacctg attaacatct tgcagagcat agtggtgcag 11880

gagcgcagcc tgagcctggc cgacaaggtg gcggccatca attactcgat gctcagtctg 11940

ggcaagtttt acgcgcgcaa aatctaccag acgccgtacg tgcccataga caaggaggtg 12000

aagatcgacg gcttctacat gcgcatggcg ctgaaggtgc tgaccctgag cgacgacctg 12060

ggcgtgtacc gcaacgagcg catccacaag gccgtgagcg tgagccggcg gcgcgagctg 12120

agcgaccgcg agctgatgca cagcctgcag cgggcgctgg cgggggccgg cagcggcgac 12180

agggaggccg agtcctactt cgaggcgggg gcggacctgc gctgggtgcc cagccggagg 12240

gccctggagg ccgcgggggc ccgccgcgag gactatgcag acgaggagga ggaggatgac 12300

gaggagtacg agctagagga gggcgagtac ctggactaaa ccgcaggtgg tgtttttggt 12360

agatgcaaga cccgaacgtg gtggacccgg cgctgcgggc ggctctgcag agccagccgt 12420

ccggccttaa ctctacagac gactggcgac aggtcatgga ccgcatcatg tcgctgacgg 12480

cgcgcaatcc ggacgcgttc cggcagcagc cgcaggccaa caggctctcc gccatcttgg 12540

aggcggtggt gcctgcgcgc gcgaacccca cgcacgagaa ggtgctggcc atagtgaacg 12600

cgctggccga gaacagggcc atccgcccgg acgaggccgg gctggtgtac gacgcgctgc 12660

tgcagcgcgt ggcccgctac aacagcggca acgtgcagac caacctggac cggctggtgg 12720

gggacgtgcg cgaggcggtg gcgcagcggg agcgcgcgga gcggcagggc aacctgggct 12780

ccatggtggc gctgaacgcc ttcctgagca cgcagccggc caacgtgccg cgggggcagg 12840

aggactacac caactttgta agcgcgctgc ggctgatggt gaccgagacc ccccagagcg 12900

aggtgtacca gtcggggccg gactacttct tccagaccag cagacagggc ctgcagacgg 12960

tgaacctgag ccaggctttc aagaacctgc gggggctgtg gggggtgaag gcgcccaccg 13020

gggaccgggc gacggtgtcc agcctgctga cgcccaactc gcgcctgctg ctgctgctga 13080

tcgcgccgtt cacggacagc ggcagcgtgt cccgggagac ctacctcggg cacctgctga 13140

cgctgtaccg cgaggccatc gggcagaccc aggtggacga gcacaccttc caggagatca 13200

ccagcgtgag ccgcgcgctg gggcaggagg acacgggcag cctggaggcg accctgaact 13260

acctgctgac caaccggcgg cagaagatcc cctcgctgca tagtttgacc accgaggagg 13320

agcgcatcct gcgctacgtg cagcagagcg tgagcctgaa cctgatgcgc gacggggtga 13380

cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga accgggcatg tacgccgcgc 13440

accggcctta catcaaccgc ctgatggact acttgcatcg cgcggcggcc gtgaaccccg 13500

agtacttcac caacgccatc ctgaacccgc actggctccc gccgcccggg ttctacagcg 13560

ggggcttcga ggtccccgag gccaacgacg gcttcctgtg ggacgacatg gacgacagcg 13620

tgttctcccc gcggccgcag gcgctggcgg aggcgtcgct gctccgcctc cccaagaagg 13680

aagagagccg ccggcccagc agcgcggcgg cctctctgtc cgagctgggg gcggcggccg 13740

cgcggcccgg gtccctgggg ggcagcccct ttcccagcct ggtggggtct ctgcagagcg 13800

ggcgcaccac ccggccccgg ctgctgggcg aggacgagta cctgaacaac tccctgatgc 13860

agccggtgcg ggagaaaaac ctgccccccg ccttccccaa caacgggata gagagcctgg 13920

tagacaagat gagcagatgg aagacctatg cgcaggagca cagggactcg cccgtgctcc 13980

gtccgcccac gcggcgccag cgccacgacc ggcagcgggg gctggtgtgg gatgacgagg 14040

actccgcgga cgatagcagc gtgctggacc tgggggggag cggcggcaac ccgttcgcgc 14100

acctgcgccc ccgcctgggg aggatgtttc aataaaaaaa aaaaaaaatc aagcatgatg 14160

caaggttttt taagcggata aataaaaaac tcaccaaggc catggcgacc gagcgttgtt 14220

ggtttcttgt tgtgttccct tagtatgcgg cgcgcggcga tgtaccacga gggacctcct 14280

ccctcttatg agagcgtggt gggcgcggcg gcggcctctc cctttgcgtc gcagctggag 14340

ccgccgtacg tgcctccgcg gtacctgcgg cctacggggg gaagaaacag catccgttac 14400

tcggagctgg cgcccctgta cgacaccacc cgggtgtacc tggtggacaa caagtcggcg 14460

gacgtggcct ccctgaacta ccagaacgac cacagcaatt ttttgaccac ggtcatccag 14520

aacaatgact acaccccgag cgaggccagc acccagacca tcaatctgga tgaccggtcg 14580

cactggggcg gcgacctgaa aaccatcctg cacaccaaca tgcccaacgt gaacgagttc 14640

atgttcacca ataagttcaa ggcgcgggtg atggtgtcgc gctcgcacac caaggacgac 14700

cgggtggagc tgaagtacga gtgggtagag ttcgagctgc ccgagggcaa ctactcggag 14760

accatgacca tagacctgat gaacaacgcg atcgtggagc actatctgaa agtgggcagg 14820

cagaacgggg tcctggagag cgacatcggg gtcaagttcg acaccaggaa cttccgcctg 14880

gggctggacc cggtcaccgg gctggttatg cccggggtct acaccaacga ggccttccac 14940

cccgacatca tcctgctgcc cggctgcggg gtggacttca cctacagccg cctgagcaac 15000

ctgctgggca tccgcaagcg gcagcccttc caggagggct tcaggatcac ctacgaggac 15060

ctggaggggg gcaacatccc cgcgctcctg gatgtggagg cctaccagga tagcttgaag 15120

gaagaagagg cgggagaggg cagcggcggt ggcgccggtc aggaggaggg cggggcctcc 15180

tctgaggcct ctgcggaccc agccgctgcc gccgaggcgg aggcggccga ccccgcgatg 15240

gtggtagagg aagagaagga tatgaacgac gaggcggtgc gcggcgacac ctttgccact 15300

cggggggagg agaagaaagc ggaggccgag gccgcggcag aggaggcggc agcagcggcg 15360

gcggcagtag aggcggcggc cgaggcggag aagcccccca aggagcccgt gattaagccc 15420

ctgaccgaag atagcaagaa gcgcagttac aacgtgctca aggacagcac caacaccgag 15480

taccgcagct ggtacctggc ctacaactac ggcgacccgg cgacgggggt gcgctcctgg 15540

accctgctgt gtacgccgga cgtgacctgc ggctcggagc aggtgtactg gtcgctgccc 15600

gacatgatgc aagaccccgt gaccttccgc tccacgcggc aggtcagcaa cttcccggtg 15660

gtgggcgccg agctgctgcc cgtgcactcc aagagcttct acaacgacca ggccgtctac 15720

tcccagctca tccgccagtt cacctctctg acccacgtgt tcaatcgctt tcctgagaac 15780

cagattctgg cgcgcccgcc cgcccccacc atcaccaccg tcagtgaaaa cgttcctgct 15840

ctcacagatc acgggacgct accgctgcgc aacagcatcg gaggagtcca gcgagtgacc 15900

gtaactgacg ccagacgccg cacctgcccc tacgtttaca aggccctggg catagtctcg 15960

ccgcgcgtcc tttccagccg cactttttaa gcatgtccat cctcatctcg cccagcaata 16020

acaccggctg gggcctgctg cgcgcgccca gcaagatgtt cggaggggcg aggaagcgct 16080

ccgaccagca ccccgtgcgc gtgcgcgggc actaccgcgc tccctggggc gcgcacaaac 16140

gcgggcgcac cggcaccgcg gggcgcacca ccgtggacga agccatcgac tcggtggtgg 16200

agcaggcgcg caactacacg cccgcggtct ccaccgtgga cgcggctatc gagagcgtgg 16260

tgcgaggcgc gcggcggtac gccaaggcga agagccgccg gaggcgcgtg gcccgccgcc 16320

accgccgccg acccgggagc gccgccaagc gcgccgccgc cgccttgctc cgtcgggcca 16380

gacgcacggg ccgccgtgcc gccatgaggg ccgcgcgccg cctggccgcc ggcatcacca 16440

ccgtggcccc ccgcgccaga agacgcgcgg ccgccgccgc cgccgcggcc atcagcgacc 16500

tggccaccag gcgccggggc aacgtgtact gggtgcgcga ctcggtgagc ggcacgcgcg 16560

tgcccgtgcg cttccgcccc ccgcggactt gagaggagag gacaggaaaa agcaacaaca 16620

tcaacaacac caccactgag tctcctgctg ttgtgtgtat cccagcggcg cgcgcgcaca 16680

cggcgacatg tccaagcgca aaatcaaaga agagatgctc caggtcgtcg cgccggagat 16740

ctatgggccc ccgaagaagg aagagcagga tttcaagccc cgcaagataa agcgggtcaa 16800

aaagaaaaag aaagatgacg atgatggcga ggtggagttt ctgcgcgcca cggcgcccag 16860

gcgcccgctg cagtggaagg gtcggcgcgt aaagcgcgtt ctgcgccccg gcaccgcggt 16920

ggtcttcacg cccggcgagc gctccacccg cactttcaag cgcgtctatg acgaggtgta 16980

cggcgacgaa gacctgctgg agcaggccaa cgatcgctcc ggagagtttg cttacgggaa 17040

gcggcaccgg gcgatggaga aggacgaggt gctggcgctg ccgctggacc ggggcaaccc 17100

cacccccagc ctgaagcccg tgaccctgca gcaggtgcta ccggccagcg cgccctccga 17160

gatgaagcgg ggcctgaagc gcgagggcgg cgacctggcg cccaccgtgc agctaatggt 17220

gcccaagcgg cagaggctgg aggacgtgct ggagaaaatg aaagtagacc ccggcctgca 17280

gccggacatc agggtccgcc ccatcaagca ggtggcgccg ggcctcggcg tgcagaccgt 17340

ggacgtggtc atccccaccg gcgcctcctc ttccagcgcc gccgccgccg ccactagcac 17400

cgcggacatg gagacgcaga ctagccccgc cgccacctcc tcggcggagg tacagacgga 17460

cccctggttg ccgccgccgg cgaccgcccc ctcgcgcgca cgccgcgggc gcaggaagta 17520

cggcgccgcc agcgcgctca tgcccgagta cgccttgcat ccttccatcg cgcccacccc 17580

cggctaccga ggctacagtt accgcccgcg aagagccaag ggctccaccc gccgcagccg 17640

ccgcgccgcc acctctaccc gccgccgcag tcgccgccgc cgccggcagc ccgcgctggc 17700

tccgatctcc gtgaaaagag tggcgcgcaa cgggaacacc ttggtgctgc ccagggcgcg 17760

ctaccacccc agcatcgttt aaaaagcctg ttgtggttct tgcagatatg gccctcactt 17820

gccgcctccg tttcccggtg ccgggatacc gaggaagatc gcgccgcagg aggggtatgg 17880

ccggacgcgg cctgagcgga ggcagtcgcc gtgcgcaccg gcggcgacgc gccaccagcc 17940

gacgcatgcg cggcggagtg ctgcctctgc tgatccccct gatcgccgcg gcgatcggcg 18000

ccgtgcccgg gatcgcctcc gtggccttgc aggcgtccca gaggcgttga cacagacttc 18060

ttgcaagctt gcaaaaatat ggaaaaatcc ccccaataaa aaagtctaga ctctcacgct 18120

cgcttggtcc tgtgactatt ttgtagaaaa aagatggaag acatcaactt tgcgtcgctg 18180

gccccgcgtc acggctcgcg cccgttcctg ggacactgga acgatatcgg caccagcaac 18240

atgagcggtg gcgccttcag ttggggctct ctgtggagcg gcattaaaaa tatcggttct 18300

gccgttaaga attacggcac caaggcctgg aacagcagca cgggccagat gttgagagac 18360

aagttgaaag agcagaactt ccagcagaag gtggtggagg gtctggcctc cggcatcaac 18420

ggggtggtgg acctggccaa tcaggccgtg caaaataaga tcaacagcag actggacccc 18480

cggccgccgg tggaggagct gccgccggcg ctggagacgg tgtcccccga tgggcggggc 18540

gaaaagcgcc cgcggcccga cagggaagag accactctgg tcacgcacac cgatgagccg 18600

cccccctacg aggaagccct gaagcaaggc ttgcccacca ctcggcccat cgcgcccatg 18660

gccaccgggg tggtgggccg ccacaccccc gccacgctgg acctgcctcc tcctcctgtt 18720

tcttcttcgg ccgccgatgc gcagcagcag aaggcggcgc tgcccggtcc gcccgcggcc 18780

gccccccgtc ccaccgccag tcgagcgccc ctgcgtcgcg cggccagcgg cccccgcggg 18840

gtcgcgaggc acagcagcgg caactggcag aacacgctga acagcatcgt gggtctgggg 18900

gtgcagtccg tgaagcgccg ccgatgctac tgaatagctt agctaacggt gttgtatgtg 18960

tgtatgcgtc ctatgtcacc gccagaggag ctgctgagtc gccgccgttc gcgcgcccac 19020

cgccactacc accgccggta ccactccagc gcccctcaag atggcgaccc catcgatgat 19080

gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc tcggagtacc tgagccccgg 19140

gctggtgcag ttcgcccgcg ccaccgacag ctacttcagc ctgagtaaca agtttaggaa 19200

ccccacggtg gcgcccacgc acgatgtgac caccgaccgg tcccagcgcc tgacgctgcg 19260

gttcatcccc gtggaccgcg aggacaccgc gtactcttac aaggcgcggt tcaccctggc 19320

cgtgggcgac aaccgcgtgc tggacatggc ctccacctac tttgacatcc gcggcgtgct 19380

ggacaggggc cccaccttca agccctactc cggcaccgcc tacaactccc tggcccccaa 19440

gggcgccccc aactcctgcg agtgggagca agtggagcca gctgaagagg cagcagaaaa 19500

tgaagatgaa gaagaagaag aggatgttgt tgatcctcag gaacaggagc ccactactaa 19560

aacacatgta tatgctcaag ctcccctttc tggcgagaaa attaccaaag atggtctgca 19620

aataggaact gaggctacgg cagcaggagg cactaaagac ttatttgcag accctacatt 19680

ccagccagaa ccccaagttg gcgaatctca gtggaatgag gcggatgcta cagcagctgg 19740

aggtagagtg ctcaaaaaga ccactcccat gaaaccttgc tatggctcat atgcccgccc 19800

cacaaatgcc aatgggggcc aaggtgtgct aaaggcaaat gcccagggag tgctcgagtc 19860

tcaggttgag atgcagttct tttccacttc tacaaatgcc acaaacgagc aaaacaacat 19920

ccagcccaaa ttggtgctgt acagcgagga tgtgcatatg gagaccccag acacacacat 19980

ctcctacaag cctacaaaaa gcgatgataa ttcaaaagtc atgctgggtc agcagtccat 20040

gcccaacagg ccaaattaca tcgccttcag agacaacttt atcgggctca tgtattataa 20100

cagcactggc aacatggggg tgctggcagg tcaggcctca cagttgaatg cagtggtgga 20160

cctgcaagac agaaacacag aactgtccta ccagctcttg cttgattcca tgggagacag 20220

aaccagatac ttttccatgt ggaatcaggc cgtggacagt tatgacccag atgtcagaat 20280

tattgaaaat catggaaccg aagatgagct gcccaactat tgtttccctc tgggaggcat 20340

agggataact gacacttacc aggccattaa gactaatggc aatggggcag gagatcaagc 20400

caccacgtgg cagaaagact cacaatttgc agaccgcaac gaaatagggg tgggaaacaa 20460

cttcgccatg gagatcaacc tcagtgccaa cctgtggagg aacttcctct actccaacgt 20520

ggccctgtac ctgccagaca agcttaagta caacccctcc aacgtggaaa tctctgacaa 20580

ccccaacacc tacgactaca tgaacaagcg agtggtggcc ccggggctgg tggactgcta 20640

catcaacctg ggcgcgcgct ggtccctgga ctacatggac aacgtcaacc ccttcaacca 20700

ccaccgcaat gcgggcctgc gctaccgctc catgcttctg ggcaacgggc gctacgtgcc 20760

cttccacatc caggtgcccc agaagttctt tgccatcaag aacctcctcc tcctgccggg 20820

ctcctacacc tacgagtgga acttcaggaa ggatgtcaac atggtcctgc agagctctct 20880

gggcaacgac ctcagggtcg acggggccag catcaagttc gagagcatct gcctctacgc 20940

caccttcttc cccatggccc acaacacggc ctccacgctc gaggccatgc tcaggaacga 21000

caccaacgac cagtccttca acgactacct ctccgccgcc aacatgctct accccatccc 21060

cgccaacgcc accaacgtcc ccatctccat cccctcgcgc aactgggcgg ccttccgcgg 21120

ctgggccttc acccgcctta agaccaagga gaccccctcc ctgggctcgg gtttcgaccc 21180

ctactacacc tactcgggct ccatacccta cctggacgga accttctacc tcaaccacac 21240

tttcaagaag gtctcggtca ccttcgactc ctcggtcagc tggccgggca acgaccgcct 21300

gctcaccccc aacgagttcg agatcaagcg ctcggtcgac ggggagggct acaacgtagc 21360

ccagtgcaac atgaccaagg actggttcct catccagatg ctggccaact acaacatcgg 21420

ctatcagggc ttctacatcc cagagagcta caaggacagg atgtactcct tctttaggaa 21480

cttccagccc atgagccggc aggtggtgga cgaaaccaag tacaaggact accagcaggt 21540

gggcatcatc caccagcaca acaactcggg cttcgtgggc tacctcgccc ccaccatgcg 21600

cgagggacag gcctaccccg ccaacttccc ctacccgctc attggcaaga ccgcggtcga 21660

cagcatcacc cagaaaaagt tcctctgcga ccgcaccctc tggcgcatcc ccttctccag 21720

caacttcatg tccatgggtg cgctcacgga cctgggccag aacctgctct atgccaactc 21780

cgcccacgcg ctcgacatga ccttcgaggt cgaccccatg gacgagccca cccttctcta 21840

tgttctgttc gaagtctttg acgtggttcg ggtccaccag ccgcaccgcg gcgtcatcga 21900

gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc accacctaaa gaagcaagcc 21960

gccaccgcca ccacctgcat gtcgtcgggt tccaccgagc aggagctcaa ggccatcgtc 22020

agagacctgg gatgcgggcc ctattttttg ggcaccttcg acaaacgctt cccgggcttc 22080

gtcgccccgc acaagctggc ctgcgccatc gtcaacacgg ccggccgcga gaccgggggc 22140

gtgcactggc tggccttcgc ctggaacccg cgctccaaaa catgctacct ctttgacccc 22200

ttcggattct cggaccagcg gctcaagcag atctaccagt tcgagtacga gggcctgctg 22260

cgccgcagcg ccatcgcctc ctcgcccgac cgctgcgtca ccctcgagaa gtccacccag 22320

accgtgcagg ggcccgactc ggccgcctgc ggtctcttct gctgcatgtt cctgcatgcc 22380

tttgtgcact ggccccagag tcccatggac cgcaacccca ccatgaactt gctgacgggg 22440

atccccaact ccatgctcca gagcccccag gccgcgccca ccctgcgccg caaccaggag 22500

cggctctaca gcttcctgga gcgccactcg ccctacttcc gccgccacag cgcgcagatc 22560

aggggggcca cctctttctg ccgcatgcaa gagatgcaag ggaaaatgca atgatgtaca 22620

cagacacttt ctttttctca ataaatggca actttattta tacatgctct ctctcgggta 22680

ttcatttccc caccacccac cacccgccgc cgtaaccatc tgctgctggc tttttaaaaa 22740

tcgaaagggt tctgccggga atcgccgtgc gccacgggca gggacacgtt gcggaactgg 22800

tagcgggtgc cccacttgaa ctcgggcacc accatgcggg gcaagtcggg gaagttgtcg 22860

gcccacaggc cgcgggtcag caccagcgcg ttcatcaggt cgggcgccga gatcttgaag 22920

tcgcagttgg ggccgccgcc ctgcgcgcgc gagttgcggt acaccgggtt gcaacactgg 22980

aacaccagca gcgccggata attcacgctg gccagcacgc tccggtcgga gatcagctcg 23040

gcgtccaggt cctccgcgtt gctcagcgcg aacggggtca gcttgggcac ctgccgcccc 23100

aggaagggag cgtgccccgg cttcgagttg cagtcgcagc gcagcgggat cagcaggtgc 23160

ccgcggccgg actcggcgtt ggggtacagc gcgcgcatga aggcctccat ctggcggaag 23220

gccatctggg ccttggcgcc ctccgagaag aacatgccgc aggacttgcc cgagaactgg 23280

ttcgcggggc agctagcgtc gtgcaggcag cagcgcgcgt cggtgttggc aatctgcacc 23340

acgttgcgcc cccaccggtt cttcacgatc ttggccttgg aagcctgctc cttcagcgcg 23400

cgctgcccgt tctcgctggt cacatccatc tcgatcacgt gctccttgtt caccatgctg 23460

ctgccgtgca gacacttcag ctcgccctcc acctcggtgc agcggtgctg ccacagcgcg 23520

cagcccgtgg gctcgaaatg cttgtaggtc acctccgcgt aggactgcag gtaggcctgc 23580

aggaagcgcc ccatcatggt cacgaaggtc ttgttgctgc tgaaggtcag ctgcagcccg 23640

cggtgctcct cgttcagcca ggccttgcac acggccgcca gcgcctccac ctggtcgggc 23700

agcatcttga agttcagctt cagctcattc tccacatggt acttgtccat cagcgcgcgc 23760

gcagcctcca tgcccttctc ccaggccgac accagcggca ggctcaaggg gttcaccacc 23820

gtcgcagtcg ccgccgcgct ttcgctttcc gctccgctgt tctcttcttc ctcctcctct 23880

tcttcctcgc cgcccgcgcg cagcccccgc accacggggt cgtcttcctg caggcgccgc 23940

accgagcgct tgccgctcct gccctgcttg atgcgcacgg gcgggttgct gaagcctacc 24000

atcaccagcg cggcctcttc ttgctcgtcc tcgctgtcca ctatgacctc gggggagggc 24060

gacctcagaa ccgtggcgcg ctgcctcttc tttttcctgg gggcgtttgc aagctccgcg 24120

gccgcggccg ccgccgaggt cgaaggccga gggctgggcg tgcgcggcac cagcgcgtcc 24180

tgcgagccgt cctcgtcctc ggactcgagg cggcagcgag cccgcttctt tgggggcgcg 24240

cggggcggcg gcggcggggg cggcggcgac ggagacgggg acgagacatc gtccagggtg 24300

ggaggacggc gggccgcgcc gcgtccgcgc tcgggggtgg tttcgcgctg gtcctcttcc 24360

cgactggcca tctcccactg ctccttctcc tataggcaga aagagatcat ggagtctctc 24420

atgcaagtcg agaaggagga ggacagccta accaccgccc cctctgagcc ctccgccgcc 24480

accgccgcgg acgacgcgcc taccaccgcc gccaccacca ccaccattac caccctaccc 24540

ggcgacgcag ccccgatcga gaaggaagtg ttgatcgagc aggacccggg ttttgtgagc 24600

gaagaggagg atgaggagga tgaaaaggag aaggataccg ccgcctcagt gccaaaagag 24660

gataaaaagc aagaccagga cgacgcagag acagatgagg cagcaatcgg gcggggggac 24720

gagaggcatg atgatgatga tgatgacggc tacctagacg tgggagacga cgtgctgctt 24780

aagcacctgc accgccagtg cgtcatcgtc tgcgacgcgc tgcaggagcg ctgcgaagtg 24840

cccctggacg tggcggaggt cagccgcgcc tacgagcggc acctcttcgc gccacacgtg 24900

ccccccaagc gccgggagaa cggcacctgc gagcccaacc cgcgcctcaa cttctacccg 24960

gtcttcgcgg tacccgaggt gctggccacc taccacatct tcttccaaaa ctgcaagatc 25020

cccctctcct gccgcgccaa ccgcacccgc gccgacaagg cgctggccct gcggcagggc 25080

gcccacatac ctgatatcgc ctctctggag gaggtgccca agatcttcga gggtctcggt 25140

cgcgacgaga aacgggcggc gaacgctctg caaggagaca gcgaaaacga gagtcactcg 25200

ggggtgctgg tggagctcga gggcgacaac gcgcgcctgg ccgtgctcaa gcgcagcatc 25260

gaagtcaccc acttcgccta cccggcgctc aacctgcccc ccaaggtcat gagtgtggtc 25320

atgagcgagc tcatcatgcg ccgcgcccag cccctggacg cggatgcaaa cttgcaagag 25380

ccctccgagg aaggcctgcc cgcggtcagc gacgagcagc tggcgcgctg gctggagacc 25440

cgcgaccccg cccagctgga ggagcggcgc aagctcatga tggccgcggt gctcgtcacc 25500

gtggagctcg agtgtctgca gcgcttcttc ggggaccccg agatgcagcg caagctcgag 25560

gagaccctgc actacacctt ccgccagggc tacgtgcgcc aggcctgcaa gatctccaac 25620

gtggagctct gcaacctggt ctcctacctg ggcatcctgc acgagaaccg cctcgggcag 25680

aacgtcctgc actccaccct caaaggggag gcgcgccgcg actacgtccg cgactgcgtc 25740

tacctcttcc tctgctacac gtggcagaca gccatggggg tctggcagca gtgcctggag 25800

gagcgcaacc tcaaggagct ggagaagctc ctcaggcgcg ccctcaggga cctctggagg 25860

ggcttcaacg agcgctcggt ggccgccgcg ctggcggaca tcatcttccc cgagcgcctg 25920

ctcaaaaccc tgcagcaggg cctgcccgac ttcaccagcc agagcatgct gcagaacttc 25980

aggaccttca tcctggagcg ctcgggcatc ctgccggcca cctgctgcgc gctgcccagc 26040

gacttcgtgc ccatcaggta cagggagtgc ccgccgccgc tctggggcca ctgctacctc 26100

ttccagctgg ccaactacct cgcctaccac tcggatctca tggaagacgt gagcggcgag 26160

ggcctgctcg agtgccactg ccgctgcaac ctgtgcacgc cccaccgctc tctagtctgc 26220

aacccgcagc tgctcagcga gagtcagatt atcggtacct tcgagctgca gggtccctcg 26280

cccgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacttccgcc 26340

tacctacgca aatttgtacc tgaagactac cacgcccacg agatcaggtt ttacgaagac 26400

caatcccgcc cgcccaaggc ggagctcacc gcctgcgtca ttacccaggg ccacatcctg 26460

ggccaattgc aagccatcaa caaagcccgc caagagttct tgctgaaaaa gggtcggggg 26520

gtgtacctgg acccccagtc cggcgaggag ctaaacccgc tacccccgcc gccgccccag 26580

cagcgggacc ttgcttccca ggatggcacc cagaaagaag cagccgccgc cgccgccagc 26640

atacatgctt ctggaggaag aggaggactg ggacagtcag gcagaggagg tttcggacga 26700

ggacgaggag gaggagatga tggaagactg ggaggaggac agcctagacg aggaagcttc 26760

agaggccgaa gaggtggcag acgcaacacc atcaccctcg gccgcagccc cctcgccggc 26820

gcccccgaaa tcctccgacc ccagcagcag cgctataacc tccgctcctc cggcgccggc 26880

gcccacccgc agcagaccca accgtagatg ggacactaca ggaaccgggg tcggtaagtc 26940

caagtgcccc ccagcgccgc ccccgcaaca ggagcaacag cagcagcagc ggcgacaggg 27000

ctaccgctcg tggcgcggac acaagaacgc catagtcgcc tgcttgcaag actgcggggg 27060

caacatctcc ttcgcccgcc gcttcctgct cttccaccac ggggtggctt ttccccgcaa 27120

tgtcctgcat tactaccgtc atctctacag cccctactgc ggcggcagcg gcgacccaga 27180

gggagcggcg gcagcagcag cgccagccac agcggcgacc acctaggaag acctccgcgg 27240

gcaagacggc gggagccggg agacccgcgg cggcggcggt agcggcggcg gcgggcgcac 27300

tgcgcctctc gcccaacgaa cccctctcga cccgggagct cagacacagg atcttcccca 27360

ctctgtatgc tatcttccag cagagcagag gccaggaaca ggagctgaaa ataaaaaaca 27420

gatctctgcg ctccctcacc cgcagctgtc tgtatcacaa aagcgaagat cagcttcggc 27480

gcacgctgga ggacgcggag gcactcttca gcaaatactg cgcgctgact cttaaggact 27540

agccgcgcgc ccttctcgaa tttaggcggg agaaagacta cgtcatcgcc gaccgccgcc 27600

cagcccaccc agccgacatg agcaaagaga ttcccacgcc ctacatgtgg agctaccagc 27660

cgcagatggg actcgcggcg ggagcggccc aagactactc cacccgcatg aactacatga 27720

gcgcggggcc ccacatgatc tcacgggtta atgggatccg cgcccagcga aaccaaatac 27780

tgctggaaca ggcggccata accgccacac cccgtcatga cctcaatccc cgaaattggc 27840

ccgccgccct cgtgtaccag gaaaccccct ctgccaccac cgtggtactt ccgcgtgaca 27900

cccaggccga agtccagatg actaactcag gggcgcagct cgcgggcggc tttcgtcacg 27960

gggtgcggcc gcaccggccg ggtatattac acctggcgat cagaggccga ggtattcagc 28020

tcaacgacga gtcggtgagc tcttcgctcg gtctccgtcc ggacggaacc ttccagatcg 28080

ccggatcagg tcgctcctca ttcacgcctc gccaggcgta cctgactctg cagacctcct 28140

cctcggagcc tcgctccggc ggcatcggca ccctccagtt cgtggaggag ttcgtgccct 28200

cggtctactt caaccccttc tcgggacctc ccggacgcta ccccgaccag ttcatcccga 28260

actttgacgc ggtgaaggac tcggcggacg gctacgactg aatgtcaagt gctgaggcag 28320

agagcgttcg cctgaaacac ctccagcact gccgccgctt cgcctgcttt gcccgcagct 28380

ccggtgagtt ctgctacttt cagctgcccg aggagcatac cgaggggccg gcgcacggcg 28440

tccgcctaac cacccagggc gaggttacct gtacccttat ccgggagttt accctccgtc 28500

ccctgctagt ggagcgggag cggggttctt gtgtcataac tatcgcctgc aactgcccta 28560

accctggatt acatcaagat ctttgttgtc acctgtgcgc tgagtataat aaacgctgag 28620

atcagactct actggggctc ctgtcgccat cctgtgaacg ccaccgtctt cacccacccc 28680

gagcagcccc aggcgaacct cacctgcggc ctgcgtcgga gggccaagaa gtacctcacc 28740

tggtacttca acggcacccc ctttgtggtt tacaacagct tcgaccagga cggagttgcc 28800

ttgagagacg acctttccgg tctcagctac tccattcaca agaacaccac cctccacctc 28860

ttccctccct acctgccggg aacctacgag tgcgtcaccg gccgctgcac ccacctcctc 28920

cgcctgatcg taaaccagac ctttccggga acacacctct tccccagaac aggaggtgag 28980

ctcaggaaac cccctggggc ccagggcgga gacttacctt cgacccttgt ggggttagga 29040

ttttttatcg ccgggttgct ggctctcctg atcaaagctt ccttgagatt tgttctctcc 29100

ctttactttt atgaacagct caacttctaa taacgctacc ttttctcagg aatcgggtag 29160

taacttctct tctgaaatcg ggctgggtgt gctgcttact ctgttgattt ttttccttat 29220

catacttagc cttctgtgcc tcaggctcgc cgcctgctgc gcacatatct acatctacag 29280

ccggttgctt aactgctggg gtcgccatcc aagatgaacg gggctcaggt gctatgtctg 29340

ctggccctgg tggcctgcag tgccgccgtc aattttgagg aacccgcttg caatgtgact 29400

ttcaagcctg aaggcgcaca ttgcaccact ctggttaaat gtgtgacctc tcatgagaaa 29460

ctgctcatcg cctacaaaaa caaaacaggc gagttcgcgg tctatagcgt gtggcaaccc 29520

ggagaccata ataactactc agtcaccgtc ttcgagggtg cggagtctaa gaaattcgat 29580

tacacctttc ccttcgagga gatgtgtgaa gcggtcatgt acctgtccaa acagtacaag 29640

ctgtggcccc ccacccccga ggcgtgtgtg gaaaacactg ggtctttctg ctgtctctct 29700

ctgacaatca ctgtgcttgc tctaatctgc acgctgctgt acatgaaatt caggcagagg 29760

cgaatcttta tcgatgagaa aaaaatgcct tgatcgctaa caccggcttt ctgtctgcag 29820

aatgaaagca atcacctccc tactaatcag caccaccctc cttgcgattg cccatgggtt 29880

gacacgaatc gaagtgccag tggggtccaa tgtcaccatg gtgggccccg ccggcaattc 29940

ctccctgatg tgggaaaaat atgtccgtaa tcaatgggat cattactgct ctaatcgaat 30000

ctgtatcaag cccagagcca tctgcgacgg gcaaaatcta actttgattg atgtgcaaat 30060

gacggatgct gggtactatt acgggcagcg gggagaaatg attaattact ggcgacccca 30120

caaggactac atgctgcatg tagtcaaggc agtccccact actaccaccc ccaccactac 30180

cactcccacc actcccacta ctaccacccc caccactact actagcactg ctactaccgc 30240

tgcccgcaaa gctattaccc gcaaaagcac catgcttagc accaagcccc attctcactc 30300

ccacgccggc gggcccaccg gtgcggcctc agaaaccacc gagctttgct tctgccaatg 30360

cactaacgcc agcgcccacg aactgttcga cctggagaat gaggatgatg accagctgag 30420

ctccgcttgc ccggtcccgc tgcccgcaga gccggtcgcc ctgaagcagc tcggtgatcc 30480

atttaatgac tctcctgttt atccctctcc cgaatacccg cccgactcta ccttccacat 30540

cacgggcacc aacgacccca acctctcctt ctacctgatg ctgctgcttt gtatctctgt 30600

ggtatcttcc gcgctcatgt tactgggcat gttctgctgc ctcatctgcc gcagaaagag 30660

aaagtctcgc tctcagggcc aaccactgat gcccttcccc taccccccag attttgcaga 30720

taacaagata tgagcacgct gctgacacta accgctttac tcgcctgcgc tctaaccctt 30780

gtcgcttgcg aatccagata ccacaatgtc acagttgtga caggagaaaa tgttacattc 30840

aactccacgg ccgacaccca gtggtcgtgg agcggccacg gtagctatgt atacatctgc 30900

aatagctcca cctcccctag catgtcctct cccaagtacc actgcaatgc cagcctgttc 30960

accctcatca acgcctccac ctcggacaat ggactctatg taggctatgt gacacccggt 31020

gggcggggaa agacccacgc ctacaacctg caagttcgcc acccctccac caccgccacc 31080

acctctgccg cccctacccg cagcagcagc agcatcagca gcagcagcag cagcagcaga 31140

ttcctgactt taatcctagc cagctcaaca accaccgcca ccgctgagac cacccacagc 31200

tccgcgcccg aaaccaccca cacccaccac ccagagacga ccgcggcctc cagtgaccag 31260

atgtcggcca acatcaccgc ctcgggtctt gaacttgctt caacccccac cccaaaacca 31320

gtggatgcag ccgacgtctc cgccctcgtc aatgactggg cggggctggg aatgtggtgg 31380

ttcgccatag gcatgatggc gctctgcctg cttctgctct ggctcatctg ctgcctcaac 31440

cgcaggcggg ccagacccat ctatagaccc atcattgttc tcaaccccgc tgatgatggg 31500

atccatagat tggatggtct gaaaaaccta cttttctctt ttacagtatg ataaattgag 31560

acatgcctcg cattttcatg tacttgacac ttctcccact ttttctgggg tgttctacgc 31620

tggccgccgt ctctcacctc gaggtagact gcctcacacc cttcactgtc tacctgattt 31680

acggattggt caccctcact ctcatctgca gcctaatcac agtagtcatc gccttcatcc 31740

agtgcattga ctacatctgt gtgcgcctcg catacctgag acaccacccg cagtaccgag 31800

acaggaacat tgcccaactc ctaagactgc tctaatcatg cataagactg tgatctgcct 31860

cctcatcctc ctctccctgc ccgctctcgt ctcatgccag cccgccacaa aacctccacg 31920

aaaaagacat gcctcctgtc gcttgagcca actgtggaat attcccaaat gctacaatga 31980

aaagagcgag ctttccgaag cctggctata tgcggtcatg tgtgtccttg tcttctgcag 32040

cacaatcttt gccctcatga tctaccccca ctttgatttg ggatggaatg cggtcgatgc 32100

catgaattac cctacctttc ccgcgcccga tatgattcca ctccgacagg ttgtggtgcc 32160

cgtcgccctc aatcaacgcc ccccatcccc tacacccact gaggtcagct actttaatct 32220

aacaggcgga gatgactgac actctagatc tagaaatgga cggcatcggc accgagcagc 32280

gtctcctaca gaggcgcaag caggcggctg aacaagagcg cctcaatcag gagctccgag 32340

atctcattaa cctgcaccag tgcaaaaaag gcatcttttg cctggtcaag caggccgatg 32400

tcacctacga gaaaaccggt aacagccacc gcctcagcta caagctgccc acccaacgcc 32460

agaagttggt gctcatggtg ggtcagaatc ccatcaccgt cacccagcac tcggtggaga 32520

ccgaggggtg tctgcactcc ccctgtcagg gtccggaaga cctctgcacc ctggtaaaga 32580

ccctgtgtgg tcttagagat ttaatcccct ttaactaatc aaacactgga atcaataaaa 32640

agaatcactt actttaaatc agtcagcagg tctctgtcca ctttattcag cagcacctcc 32700

ttcccctcct cccaactctg gtactccaaa cgcctcctgg cggcaaactt cctccacacc 32760

ctgaagggaa tgtcagattc ttgctcctgt ccctccgcac ccactatctt catgttgttg 32820

cagatgaagc gcgccaaaac gtctgacgag accttcaacc ccgtgtaccc ctatgacacg 32880

gaaaacgggc ctccctccgt ccctttcctc acccctccct tcgtgtcccc cgacggattt 32940

caagaaagcc ccccaggggt cctgtctctg cgcctgtcag agcccctggt cacttcccac 33000

ggcatgcttg ccctgaaaat gggaaatggc ctctccctgg atgacgccgg caacctcacc 33060

tctcaagatg tcaccaccgt cacccctccc ctcaaaaaaa ccaagaccaa cctcagcctc 33120

cagacctcag cccccctgac cgttagctct gggtccctca ccgtcgcggc cgccgctcca 33180

ctggcggtgg ccggcacctc tctcaccatg caatctcagg cccccttgac agtgcaagat 33240

gcaaaactcg gcctggccac ccagggaccc ctgaccgtgt ctgaaggcaa actcaccttg 33300

cagacatcgg ctccactgac ggccgctgac agcagcactc tcactgttag tgccacacct 33360

cccctcagca caagcaatgg tagtttgagc attgacatgc aggccccgat ttataccacc 33420

aatggaaaac tggcacttaa cattggtgct cccctgcatg tggtagacac cctaaatgca 33480

ctaactgtag taactggcca gggtcttacc ataaatggaa gagccctgca aactagagtc 33540

acgggtgccc tcagttatga cacagaaggc aacatccaac tgcaagccgg agggggtatg 33600

cgcattgaca ataatggcca acttatcctt aatgtagctt atccatttga tgctcaaaac 33660

aacctcagcc ttagacttgg ccaaggtccc ctaattgtta actctgccca caacttggat 33720

cttaacctta acagaggcct ttacttattt acatctggaa acacgaaaaa actggaagtt 33780

aacataaaaa cagccaaagg tctattttac gatggcaccg ctatagcaat caatgcaggt 33840

gacgggctac agtttgggtc tggttcagat acaaatccat tgcaaactaa acttggattg 33900

gggctggaat atgactccaa caaagctata atcactaaac ttggaactgg cctaagcttt 33960

gacaacacag gtgccatcac agtaggcaac aaaaatgatg acaagcttac cttgtggacc 34020

acaccagacc cctccccaaa ctgcagaatt aattcagaaa aagatgctaa actcacacta 34080

gttttgacta aatgcggcag ccaggtgtta gccagcgttt ctgttttatc tgtaaaaggc 34140

agccttgccc ccatcagcgg cacagtaact agcgcccaga ttgttttaag atttgatgaa 34200

aacggagttt tattgagcaa ttcttctctt gacccccaat actggaacta tagaaaaggc 34260

gattctacag aaggcactgc atatactaat gctgtgggat ttatgcccaa cctcacagca 34320

taccctaaaa cacagagcca gactgctaaa agcaacattg taagtcaagt ttacttgaat 34380

ggggacaaaa caaaacccat gaccctaacc atcaccctca atggaactaa tgaaacaggg 34440

gatgctacag taagcacata ctccatgtca ttttcatgga actggaatgg aagtaattac 34500

attaatgaca ccttccaaac caactccttt accttctcct acatcgccca agaataaaaa 34560

agcatgacgc tttgttctct gattcagtgt gtttctttta ttttttttca attacaacag 34620

aatcattcaa gtcattctcc atttagctta atagacccag tagtgcaaag ccccatacta 34680

gcttatttca gacagtataa attaaaccat accttttgat ttcaatatta aaaaaatcat 34740

cacaggatcc tagtcgtcag gccgccccct ccctgccaag acacagaata cacaatcctc 34800

tccccccggc tggctttaaa caacaccatc tggttggtga cagacaggtt cttcggggtt 34860

atattccaca cggtctcctg gcgggccagg cgctcgtcgg tgatgctgat aaactctccc 34920

ggcagctcgc tcaagttcac gtcgctgtcc agcggctgaa cctcatgctg acgcggtaac 34980

tgcgcgaccg gctgctgaac aaacggaggc cgcgcctaca agggggtaga gtcataatcc 35040

tccgtcagga tagggcggtt atgcagcagc agcgagcgaa tcatctgctg ccgccgccgc 35100

tccgtccggc aggaaaacaa catcccggtg gtctcctccg ctataatccg caccgcccgc 35160

agcataagcc tcctcgttct ccgcgcgcag caccgcaccc tgatctcact caggttggcg 35220

cagtaggtac agcacatcac cacgatgtta ttcatgatcc cacagtgcaa ggcgctgtat 35280

ccaaagctca tgcccgggac caccgccccc acgtgaccgt cgtaccagaa gcgcaggtaa 35340

atcaagtgcc gacccctcat gaacgtgctg gacataaaca tcacctcctt gggcatgttg 35400

taattcacca cctcccggta ccagatgaat ctctgattga acacggcccc ttccaccacc 35460

atcctgaacc aagaggctag gacctgccca ccggctatgc actgcaggga acccgggtta 35520

gaacaatgac aatgcagact ccagggctcg taaccgtgga tcatccggct gctgaagaca 35580

tcgatgttgg cgcaacacag acacacgtgc atacacttcc tcatgattag cagctcctcc 35640

ctcgtcagga tcatatccca agggataacc cattcttgaa tcaacgtaaa gcccacagag 35700

cagggaaggc ctcgcacata actcacgttg tgcatggtta gcgtgttgca ttccggaaac 35760

agcggatgat cctccagtat cgaggcgcgg gtctcgttct cacagggagg taaaggggcc 35820

ctgctgtacg gactgtggcg ggacgaccga gatcgtgttg agcgtaacgt catggaaaag 35880

ggaacgccgg acgtggtcat acttcttgaa gcagaaccag gctcgcgcgt gacagacctc 35940

cttgcgtcta cggtctcgcc gcttagctcg ctccgtgtga tagttgtagt acagccactc 36000

tctcaaagcg tcgaggcgac acctggcgtc aggatgtatg tagactccgt cttgcaccgc 36060

ggccctgata atatccacca ccgtagaata agccacacca agccaagcaa tacactcgct 36120

ttgcgagcgg cagacaggag gagcggggag agacggaagg accatcataa aattttaaag 36180

aatattttcc aatacttcga aatcaagatc taccaaatgg caacgctccc ctccactggc 36240

gcggtcaaac tctacggcca aagaacagat aacggcattt ttaagatgtt cccggacggc 36300

gtctaaaaga caaaccgctc tcaagtcgac ataaattata agccaaaagc catcgggatc 36360

catatccact atggacgcgc cggcggcgtc caccaaaccc aaataatttt cttctctcca 36420

gcgcagcaaa atcccagtaa gcaactccct gatattaaga tgaaccatgc caaaaatctg 36480

ttcaagagcg ccctccacct tcattctcaa gcagcgcatc atgattgcaa aaattcaggt 36540

tcctcagaca cctgtatgag attcaaaacg ggaatattaa caaaaattcc tctgtcgcgc 36600

agatcccttc gcagggcaag ctgaacataa tcagacaggt ctgaacgaac cagcgaggcc 36660

aaatccccgc caggaaccag atccagagac cctatgctga ttatgacgcg catactcggg 36720

gctatgctaa ccagcgtagc gccgatgtag gcgtgctgca tgggcggcga aataaaatgc 36780

aaggtgctgg ttaaaaaatc aggcaaagcc tcgcgcaaaa aagctaagac atcataatca 36840

tgctcatgca ggtagttgca ggtaagctca ggaaccaaaa cggaataaca cacgattttc 36900

ctctcaaaca tgacttccag gtgactgcat aagaaaaaaa ttataaataa taaatattaa 36960

ttaaataaat taaacattgg aagcctgtct cacaacagga aaaaccactc tgatcaacat 37020

aagacgggcc acgggcatgc ccgcgtgacc ataaaaaaat cggtctccgt gattacaaag 37080

caccacagat agctccccgg tcatgtcggg ggtcatcatg tgagactgtg tatacacgtc 37140

cgggctgttg acatcggtca aagaaagaaa tcgagctaca tagcccggag gaatcaacac 37200

ccgcacgcgg aggtacagca aaacggtccc cataggagga atcacaaaat tagtaggaga 37260

aaaaaaaaca taaacaccag aaaaaccctc ttgccgaggc aaaacagcgc cctcccgttc 37320

caaaacaaca taaagcgctt ccacaggagc agccatgaca aagacccgag tcttaccagg 37380

aaaattttaa aaaagattcc tcaacgcagc accagcacca acacctgtca gtgtaaaatg 37440

ccaagcgccg agcgagtata tataggaata aaaagtgacg taaacggtta aagtccagaa 37500

aacgcccaga aaaaccgcac gcgaacctac gccccgaaac gaaagccaaa aaacagtgaa 37560

cacgcccttt cggcgtcaac ttccgctttc ccacggtacg tcacttccgc atatagtaaa 37620

actacgctac ccaacatgca agaagccacg ccccaaaaca cgtcacacct cccggcccgc 37680

cccgcgccgc cgctcctccc cgccccgccc cgctccgccc acctcattat catattggct 37740

tcaatccaaa ataaggtata ttattgatga tg 37772

<210> 14

<211> 440

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 14

Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr

1 5 10 15

Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro

20 25 30

Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser

35 40 45

Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu

50 55 60

Lys Leu Gly Glu Gly Val Asp Leu Asp Asp Ser Gly Lys Leu Ile Ser

65 70 75 80

Lys Asn Ala Thr Lys Ala Thr Ala Pro Leu Ser Ile Ser Asn Ser Thr

85 90 95

Ile Ser Leu Asn Met Asp Ala Pro Leu Tyr Asn Asn Asn Gly Lys Leu

100 105 110

Gly Ile Arg Ile Gly Ala Pro Leu Lys Val Val Asp Leu Leu Asn Thr

115 120 125

Leu Ala Val Ala Tyr Gly Ser Gly Leu Gly Leu Lys Asn Asn Ala Leu

130 135 140

Thr Val Gln Leu Val Ser Pro Leu Thr Phe Asp Asn Lys Gly Asn Val

145 150 155 160

Lys Ile Asn Leu Gly Asn Gly Pro Leu Thr Val Ala Ala Asn Arg Leu

165 170 175

Ser Val Thr Cys Lys Arg Gly Leu Tyr Val Thr Thr Thr Gly Asp Ala

180 185 190

Leu Glu Ser Asn Ile Ser Trp Ala Lys Gly Ile Arg Phe Glu Gly Asn

195 200 205

Ala Ile Ala Ala Asn Ile Gly Lys Gly Leu Glu Phe Gly Thr Thr Ser

210 215 220

Ser Glu Ser Asp Val Ser Asn Ala Tyr Pro Ile Gln Val Lys Leu Gly

225 230 235 240

Thr Gly Leu Thr Phe Asp Ser Thr Gly Ala Ile Val Ala Trp Asn Lys

245 250 255

Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn

260 265 270

Cys His Ile Tyr Ser Asp Lys Asp Ala Lys Leu Thr Leu Cys Leu Thr

275 280 285

Lys Cys Gly Ser Gln Ile Leu Gly Thr Val Ser Leu Ile Ala Val Asp

290 295 300

Thr Gly Ser Leu Asn Pro Ile Thr Gly Gln Val Thr Thr Ala Leu Val

305 310 315 320

Ser Leu Lys Phe Asp Ala Asn Gly Val Leu Gln Thr Ser Ser Thr Leu

325 330 335

Asp Lys Glu Tyr Trp Asn Phe Arg Lys Gly Asp Val Thr Pro Ala Glu

340 345 350

Pro Tyr Thr Asn Ala Ile Gly Phe Met Pro Asn Ile Lys Ala Tyr Pro

355 360 365

Lys Asn Thr Asn Ser Ala Ala Lys Ser His Ile Val Gly Lys Val Tyr

370 375 380

Leu His Gly Glu Val Ser Lys Pro Leu Asp Leu Ile Ile Thr Phe Asn

385 390 395 400

Glu Thr Ser Asn Glu Thr Cys Thr Tyr Cys Ile Asn Phe Gln Trp Gln

405 410 415

Trp Gly Thr Asp Lys Tyr Lys Asn Glu Thr Leu Ala Val Ser Ser Phe

420 425 430

Thr Phe Ser Tyr Ile Ala Gln Glu

435 440

<210> 15

<211> 443

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 15

Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr

1 5 10 15

Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro

20 25 30

Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser

35 40 45

Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu

50 55 60

Lys Leu Gly Glu Gly Val Asp Leu Asp Asp Ser Gly Lys Leu Ile Ser

65 70 75 80

Lys Asn Ala Thr Lys Ala Thr Ala Pro Leu Ser Ile Ser Asn Ser Thr

85 90 95

Ile Ser Leu Asn Met Ala Ala Pro Phe Tyr Asn Asn Asn Gly Thr Leu

100 105 110

Ser Leu Asn Val Ser Thr Pro Leu Ala Val Phe Pro Thr Phe Asn Thr

115 120 125

Leu Gly Ile Ser Leu Gly Asn Gly Leu Gln Thr Ser Asn Lys Leu Leu

130 135 140

Ala Val Gln Leu Thr His Pro Leu Thr Phe Ser Ser Asn Ser Ile Thr

145 150 155 160

Val Lys Thr Asp Lys Gly Leu Tyr Ile Asn Ser Ser Gly Asn Arg Gly

165 170 175

Leu Glu Ala Asn Ile Ser Leu Lys Arg Gly Leu Ile Phe Asp Gly Asn

180 185 190

Ala Ile Ala Thr Tyr Leu Gly Ser Gly Leu Asp Tyr Gly Ser Tyr Asp

195 200 205

Ser Asp Gly Lys Thr Arg Pro Ile Ile Thr Lys Ile Gly Ala Gly Leu

210 215 220

Asn Phe Asp Ser Asn Asn Ala Met Ala Val Lys Leu Gly Thr Gly Leu

225 230 235 240

Ser Phe Asp Ser Ala Gly Ala Leu Thr Ala Gly Asn Lys Glu Asp Asp

245 250 255

Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Gln Leu

260 265 270

Leu Ser Asp Arg Asp Ala Lys Phe Thr Leu Cys Leu Thr Lys Cys Gly

275 280 285

Ser Gln Ile Leu Gly Thr Val Ala Val Ala Ala Val Thr Val Ser Ser

290 295 300

Ala Leu Asn Pro Ile Asn Asp Thr Val Lys Ser Ala Ile Val Phe Leu

305 310 315 320

Arg Phe Asp Ser Asp Gly Val Leu Met Ser Asn Ser Ser Met Val Gly

325 330 335

Asp Tyr Trp Asn Phe Arg Glu Gly Gln Thr Thr Gln Ser Val Ala Tyr

340 345 350

Thr Asn Ala Val Gly Phe Met Pro Asn Leu Gly Ala Tyr Pro Lys Thr

355 360 365

Gln Ser Lys Thr Pro Lys Asn Ser Ile Val Ser Gln Val Tyr Leu Asn

370 375 380

Gly Glu Thr Thr Met Pro Met Thr Leu Thr Ile Thr Phe Asn Gly Thr

385 390 395 400

Asp Glu Lys Asp Thr Thr Pro Val Ser Thr Tyr Ser Met Thr Phe Thr

405 410 415

Trp Gln Trp Thr Gly Asp Tyr Lys Asp Lys Asn Ile Thr Phe Ala Thr

420 425 430

Asn Ser Phe Thr Phe Ser Tyr Met Ala Gln Glu

435 440

<210> 16

<211> 425

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 16

Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr

1 5 10 15

Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro

20 25 30

Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser

35 40 45

Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu

50 55 60

Lys Leu Gly Glu Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser

65 70 75 80

Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr

85 90 95

Ile Ser Leu Asn Met Asp His Pro Phe Tyr Thr Lys Asp Gly Lys Leu

100 105 110

Ala Leu Gln Val Ser Pro Pro Leu Asn Ile Leu Arg Thr Ser Ile Leu

115 120 125

Asn Thr Leu Ala Leu Gly Phe Gly Ser Gly Leu Gly Leu Arg Gly Ser

130 135 140

Ala Leu Ala Val Gln Leu Val Ser Pro Leu Thr Phe Asp Thr Asp Gly

145 150 155 160

Asn Ile Lys Leu Thr Leu Asp Arg Gly Leu His Val Thr Thr Gly Asp

165 170 175

Ala Ile Glu Ser Asn Ile Ser Trp Ala Lys Gly Leu Lys Phe Glu Asp

180 185 190

Gly Ala Ile Ala Thr Asn Ile Gly Asn Gly Leu Glu Phe Gly Ser Ser

195 200 205

Ser Thr Glu Thr Gly Val Asp Asp Ala Tyr Pro Ile Gln Val Lys Leu

210 215 220

Gly Ser Gly Leu Ser Phe Asp Ser Thr Gly Ala Ile Met Ala Gly Asn

225 230 235 240

Lys Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro

245 250 255

Asn Cys Gln Ile Leu Ala Glu Asn Asp Ala Lys Leu Thr Leu Cys Leu

260 265 270

Thr Lys Cys Gly Ser Gln Ile Leu Ala Thr Val Ser Val Leu Val Val

275 280 285

Gly Ser Gly Asn Leu Asn Pro Ile Thr Gly Thr Val Ser Ser Ala Gln

290 295 300

Val Phe Leu Arg Phe Asp Ala Asn Gly Val Leu Leu Thr Glu His Ser

305 310 315 320

Thr Leu Lys Lys Tyr Trp Gly Tyr Arg Gln Gly Asp Ser Ile Asp Gly

325 330 335

Thr Pro Tyr Val Asn Ala Val Gly Phe Met Pro Asn Leu Lys Ala Tyr

340 345 350

Pro Lys Ser Gln Ser Ser Thr Thr Lys Asn Asn Ile Val Gly Gln Val

355 360 365

Tyr Met Asn Gly Asp Val Ser Lys Pro Met Leu Leu Thr Ile Thr Leu

370 375 380

Asn Gly Thr Asp Asp Ser Asn Ser Thr Tyr Ser Met Ser Phe Ser Tyr

385 390 395 400

Thr Trp Thr Asn Gly Ser Tyr Val Gly Ala Thr Phe Gly Ala Asn Ser

405 410 415

Tyr Thr Phe Ser Tyr Ile Ala Gln Glu

420 425

<210> 17

<211> 425

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 17

Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr

1 5 10 15

Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro

20 25 30

Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser

35 40 45

Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu

50 55 60

Lys Leu Gly Glu Gly Leu Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser

65 70 75 80

Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr

85 90 95

Ile Ser Leu Asn Met Asp His Pro Phe Tyr Thr Lys Asp Gly Lys Leu

100 105 110

Ser Leu Gln Val Ser Pro Pro Leu Asn Ile Leu Arg Thr Ser Ile Leu

115 120 125

Asn Thr Leu Ala Leu Gly Phe Gly Ser Gly Leu Gly Leu Arg Gly Ser

130 135 140

Ala Leu Ala Val Gln Leu Val Ser Pro Leu Thr Phe Asp Thr Asp Gly

145 150 155 160

Asn Ile Lys Leu Thr Leu Asp Arg Gly Leu His Val Thr Thr Gly Asp

165 170 175

Ala Ile Glu Ser Asn Ile Ser Trp Ala Lys Gly Leu Lys Phe Glu Asp

180 185 190

Gly Ala Ile Ala Thr Asn Ile Gly Asn Gly Leu Glu Phe Gly Ser Ser

195 200 205

Ser Thr Glu Thr Gly Val Asp Asp Ala Tyr Pro Ile Gln Val Lys Leu

210 215 220

Gly Ser Gly Leu Ser Phe Asp Ser Thr Gly Ala Ile Met Ala Gly Asn

225 230 235 240

Lys Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro

245 250 255

Asn Cys Gln Ile Leu Ala Glu Asn Asp Ala Lys Leu Thr Leu Cys Leu

260 265 270

Thr Lys Cys Gly Ser Gln Ile Leu Ala Thr Val Ser Val Leu Val Val

275 280 285

Gly Ser Gly Asn Leu Asn Pro Ile Thr Gly Thr Val Ser Ser Ala Gln

290 295 300

Val Phe Leu Arg Phe Asp Ala Asn Gly Val Leu Leu Thr Glu His Ser

305 310 315 320

Thr Leu Lys Lys Tyr Trp Gly Tyr Arg Gln Gly Asp Ser Ile Asp Gly

325 330 335

Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Lys Ala Tyr

340 345 350

Pro Lys Ser Gln Ser Ser Thr Thr Lys Asn Asn Ile Val Gly Gln Val

355 360 365

Tyr Met Asn Gly Asp Val Ser Lys Pro Met Leu Leu Thr Ile Thr Leu

370 375 380

Asn Gly Thr Asp Asp Ser Asn Ser Thr Tyr Ser Met Ser Phe Ser Tyr

385 390 395 400

Thr Trp Thr Asn Gly Ser Tyr Val Gly Ala Thr Phe Gly Ala Asn Ser

405 410 415

Tyr Thr Phe Ser Tyr Ile Ala Gln Glu

420 425

<210> 18

<211> 442

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 18

Met Ser Lys Lys Arg Ala Arg Val Asp Asp Gly Phe Asp Pro Val Tyr

1 5 10 15

Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro

20 25 30

Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser

35 40 45

Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Ala Val Pro Leu

50 55 60

Lys Leu Gly Glu Gly Val Asp Leu Asp Asp Ser Gly Lys Leu Ile Ser

65 70 75 80

Lys Lys Ser Thr Lys Ala Asn Ser Pro Leu Ser Ile Ser Asn Asn Thr

85 90 95

Ile Ser Leu Asn Met Asp Thr Pro Phe Tyr Thr Lys Asp Gly Lys Leu

100 105 110

Thr Met Gln Val Thr Ala Pro Leu Lys Leu Ala Asn Thr Ala Ile Leu

115 120 125

Asn Thr Leu Ala Met Ala Tyr Gly Asn Gly Leu Gly Leu Asn Asn Asn

130 135 140

Ala Leu Thr Val Gln Val Thr Ser Pro Leu Thr Phe Asp Asn Ser Lys

145 150 155 160

Val Lys Ile Asn Leu Gly Asn Gly Pro Leu Met Val Ser Ala Asn Lys

165 170 175

Leu Ser Ile Asn Cys Leu Arg Gly Leu Tyr Val Ala Pro Asn Asn Thr

180 185 190

Gly Leu Glu Thr Asn Ile Ser Trp Ala Asn Ala Met Arg Phe Glu Gly

195 200 205

Asn Ala Met Ala Val Tyr Ile Asp Thr Asn Lys Gly Leu Gln Phe Gly

210 215 220

Thr Thr Ser Thr Glu Thr Gly Val Thr Asn Ala Tyr Pro Ile Gln Val

225 230 235 240

Lys Leu Gly Ala Gly Leu Ala Phe Asp Ser Thr Gly Ala Ile Val Ala

245 250 255

Trp Asn Lys Glu Asn Asp Ser Leu Thr Leu Trp Thr Thr Pro Asp Pro

260 265 270

Ser Pro Asn Cys Lys Ile Ala Ser Glu Lys Asp Ala Lys Leu Thr Leu

275 280 285

Cys Leu Thr Lys Cys Gly Ser Gln Ile Leu Gly Thr Val Ser Leu Leu

290 295 300

Ala Val Ser Gly Ser Leu Ala Pro Ile Thr Gly Ala Val Ser Thr Ala

305 310 315 320

Leu Val Ser Leu Lys Phe Asn Ala Asn Gly Ala Leu Leu Asp Lys Ser

325 330 335

Thr Leu Asn Lys Glu Tyr Trp Asn Tyr Arg Gln Gly Asp Leu Ile Pro

340 345 350

Gly Thr Pro Tyr Thr His Ala Val Gly Phe Met Pro Asn Lys Lys Ala

355 360 365

Tyr Pro Lys Asn Thr Thr Ala Ala Ser Lys Ser His Ile Val Gly Asp

370 375 380

Val Tyr Leu Asp Gly Asp Ala Asp Lys Pro Leu Ser Leu Ile Ile Thr

385 390 395 400

Phe Asn Glu Thr Asp Asp Glu Thr Cys Asp Tyr Cys Ile Asn Phe Gln

405 410 415

Trp Lys Trp Gly Ala Asp Gln Tyr Lys Asp Lys Thr Leu Ala Thr Ser

420 425 430

Ser Phe Thr Phe Ser Tyr Ile Ala Gln Glu

435 440

<210> 19

<211> 577

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 19

Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro

1 5 10 15

Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro

20 25 30

Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser

35 40 45

Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu

50 55 60

Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser

65 70 75 80

Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn

85 90 95

Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu

100 105 110

Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr

115 120 125

Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu

130 135 140

Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln

145 150 155 160

Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Ser

165 170 175

Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Ser Ile Asp Met

180 185 190

Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Ala Leu Asn Ile Gly

195 200 205

Ala Pro Leu His Val Val Asp Thr Leu Asn Ala Leu Thr Val Val Thr

210 215 220

Gly Gln Gly Leu Thr Ile Asn Gly Arg Ala Leu Gln Thr Arg Val Thr

225 230 235 240

Gly Ala Leu Ser Tyr Asp Thr Glu Gly Asn Ile Gln Leu Gln Ala Gly

245 250 255

Gly Gly Met Arg Ile Asp Asn Asn Gly Gln Leu Ile Leu Asn Val Ala

260 265 270

Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly

275 280 285

Pro Leu Ile Val Asn Ser Ala His Asn Leu Asp Leu Asn Leu Asn Arg

290 295 300

Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val Asn

305 310 315 320

Ile Lys Thr Ala Lys Gly Leu Phe Tyr Asp Gly Thr Ala Ile Ala Ile

325 330 335

Asn Ala Gly Asp Gly Leu Gln Phe Gly Ser Gly Ser Asp Thr Asn Pro

340 345 350

Leu Gln Thr Lys Leu Gly Leu Gly Leu Glu Tyr Asp Ser Asn Lys Ala

355 360 365

Ile Ile Thr Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala

370 375 380

Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr Thr

385 390 395 400

Pro Asp Pro Ser Pro Asn Cys Arg Ile Asn Ser Glu Lys Asp Ala Lys

405 410 415

Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser Val

420 425 430

Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr Val

435 440 445

Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu Leu

450 455 460

Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly Asp

465 470 475 480

Ser Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro Asn

485 490 495

Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn Ile

500 505 510

Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Thr Lys Pro Met Thr Leu

515 520 525

Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val Ser

530 535 540

Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr Ile

545 550 555 560

Asn Asp Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Gln

565 570 575

Glu

<210> 20

<211> 937

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 20

Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr

65 70 75 80

Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Thr Ser Gln Trp Ile Thr Lys Asp Asn Gly Thr Asp Lys

130 135 140

Thr Tyr Ser Phe Gly Asn Ala Pro Val Arg Gly Leu Asp Ile Thr Glu

145 150 155 160

Glu Gly Leu Gln Ile Gly Pro Asp Glu Ser Gly Gly Glu Ser Lys Lys

165 170 175

Ile Phe Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Leu Gly Asp Glu

180 185 190

Glu Trp His Asp Thr Ile Gly Ala Glu Asp Lys Tyr Gly Gly Arg Ala

195 200 205

Leu Lys Pro Ala Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys

210 215 220

Pro Thr Asn Ala Lys Gly Gly Gln Ala Lys Ser Arg Thr Lys Asp Asp

225 230 235 240

Gly Thr Thr Glu Pro Asp Ile Asp Met Ala Phe Phe Asp Asp Arg Ser

245 250 255

Gln Gln Ala Ser Phe Ser Pro Glu Leu Val Leu Tyr Thr Glu Asn Val

260 265 270

Asp Leu Asp Thr Pro Asp Thr His Ile Ile Tyr Lys Pro Gly Thr Asp

275 280 285

Glu Thr Ser Ser Ser Phe Asn Leu Gly Gln Gln Ser Met Pro Asn Arg

290 295 300

Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr

305 310 315 320

Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu

325 330 335

Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln

340 345 350

Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp

355 360 365

Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn

370 375 380

His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly

385 390 395 400

Val Gly Phe Thr Asp Thr Phe Gln Gly Ile Lys Val Lys Thr Thr Asn

405 410 415

Asn Gly Thr Ala Asn Ala Thr Glu Trp Glu Ser Asp Thr Ser Val Asn

420 425 430

Asn Ala Asn Glu Ile Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn

435 440 445

Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu

450 455 460

Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro

465 470 475 480

Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro

485 490 495

Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp

500 505 510

Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu

515 520 525

Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His

530 535 540

Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu

545 550 555 560

Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met

565 570 575

Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser

580 585 590

Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala

595 600 605

His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn

610 615 620

Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro

625 630 635 640

Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn

645 650 655

Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu

660 665 670

Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly

675 680 685

Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys

690 695 700

Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp

705 710 715 720

Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly

725 730 735

Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu

740 745 750

Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val

755 760 765

Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln

770 775 780

Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln

785 790 795 800

Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr

805 810 815

Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro

820 825 830

Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys

835 840 845

Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe

850 855 860

Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala

865 870 875 880

Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp

885 890 895

Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg

900 905 910

Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr

915 920 925

Pro Phe Ser Ala Gly Asn Ala Thr Thr

930 935

<210> 21

<211> 937

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 21

Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Val Pro Val Asp Gly Glu Asp Asn Thr Tyr Ser Tyr

65 70 75 80

Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ala Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Thr Ser Gln Trp Ile Thr Lys Asp Asn Gly Thr Asp Lys

130 135 140

Thr Tyr Ser Phe Gly Asn Ala Pro Val Arg Gly Leu Asp Ile Thr Glu

145 150 155 160

Glu Gly Leu Gln Ile Arg Thr Asp Glu Ser Gly Gly Glu Ser Lys Lys

165 170 175

Ile Phe Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Leu Gly Asp Glu

180 185 190

Glu Trp His Asp Thr Ile Gly Ala Glu Asp Lys Tyr Gly Gly Arg Ala

195 200 205

Leu Lys Pro Ala Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys

210 215 220

Pro Thr Asn Ala Lys Gly Gly Gln Ala Lys Ser Arg Thr Lys Asp Asp

225 230 235 240

Gly Thr Thr Glu Pro Asp Ile Asp Met Ala Phe Phe Asp Asp Arg Ser

245 250 255

Gln Gln Ala Ser Phe Ser Pro Glu Leu Val Leu Tyr Thr Glu Asn Val

260 265 270

Asp Leu Asp Thr Pro Asp Thr His Ile Ile Tyr Lys Pro Gly Thr Asp

275 280 285

Glu Thr Ser Ser Ser Phe Asn Leu Gly Gln Gln Ser Met Pro Asn Arg

290 295 300

Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr

305 310 315 320

Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu

325 330 335

Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln

340 345 350

Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp

355 360 365

Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn

370 375 380

His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly

385 390 395 400

Val Gly Phe Thr Asp Thr Phe Gln Gly Ile Lys Val Lys Thr Thr Asn

405 410 415

Asn Gly Thr Ala Asn Ala Thr Glu Trp Glu Ser Asp Thr Ser Val Asn

420 425 430

Asn Ala Asn Glu Ile Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn

435 440 445

Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu

450 455 460

Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro

465 470 475 480

Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro

485 490 495

Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp

500 505 510

Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu

515 520 525

Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His

530 535 540

Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu

545 550 555 560

Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met

565 570 575

Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser

580 585 590

Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala

595 600 605

His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn

610 615 620

Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro

625 630 635 640

Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn

645 650 655

Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu

660 665 670

Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly

675 680 685

Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys

690 695 700

Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp

705 710 715 720

Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly

725 730 735

Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu

740 745 750

Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val

755 760 765

Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln

770 775 780

Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln

785 790 795 800

Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr

805 810 815

Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro

820 825 830

Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys

835 840 845

Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe

850 855 860

Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala

865 870 875 880

Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp

885 890 895

Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg

900 905 910

Val His Gln Pro His Arg Gly Val Ile Lys Ala Val Tyr Leu Arg Thr

915 920 925

Pro Phe Ser Ala Gly Asn Ala Thr Thr

930 935

<210> 22

<211> 937

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 22

Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr

65 70 75 80

Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Thr Ser Gln Trp Ile Thr Lys Asp Asn Gly Thr Asp Lys

130 135 140

Thr Tyr Ser Phe Gly Asn Ala Pro Val Arg Gly Leu Asp Ile Thr Glu

145 150 155 160

Glu Gly Leu Gln Ile Gly Thr Asp Glu Ser Gly Gly Glu Ser Lys Lys

165 170 175

Ile Phe Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Leu Gly Asp Glu

180 185 190

Glu Trp His Asp Thr Ile Gly Ala Glu Asp Lys Tyr Gly Gly Arg Ala

195 200 205

Leu Lys Pro Ala Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys

210 215 220

Pro Thr Asn Ala Lys Gly Gly Gln Ala Lys Ser Arg Thr Lys Asp Asp

225 230 235 240

Gly Thr Thr Glu Pro Asp Ile Asp Met Ala Phe Phe Asp Asp Arg Ser

245 250 255

Gln Gln Ala Ser Phe Ser Pro Glu Leu Val Leu Tyr Thr Glu Asn Val

260 265 270

Asp Leu Asp Thr Pro Asp Thr His Ile Ile Tyr Lys Pro Gly Thr Asp

275 280 285

Glu Thr Ser Ser Ser Phe Asn Leu Gly Gln Gln Ser Met Pro Asn Arg

290 295 300

Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr

305 310 315 320

Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu

325 330 335

Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln

340 345 350

Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp

355 360 365

Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn

370 375 380

His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly

385 390 395 400

Val Gly Phe Thr Asp Thr Phe Gln Gly Ile Lys Val Lys Thr Thr Asn

405 410 415

Asn Gly Thr Ala Asn Ala Thr Glu Trp Glu Ser Asp Thr Ser Val Asn

420 425 430

Asn Ala Asn Glu Ile Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn

435 440 445

Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu

450 455 460

Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro

465 470 475 480

Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro

485 490 495

Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp

500 505 510

Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu

515 520 525

Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His

530 535 540

Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu

545 550 555 560

Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met

565 570 575

Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser

580 585 590

Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala

595 600 605

His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn

610 615 620

Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro

625 630 635 640

Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn

645 650 655

Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu

660 665 670

Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly

675 680 685

Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys

690 695 700

Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp

705 710 715 720

Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly

725 730 735

Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu

740 745 750

Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val

755 760 765

Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln

770 775 780

Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln

785 790 795 800

Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr

805 810 815

Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro

820 825 830

Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys

835 840 845

Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe

850 855 860

Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala

865 870 875 880

Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp

885 890 895

Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg

900 905 910

Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr

915 920 925

Pro Phe Ser Ala Gly Asn Ala Thr Thr

930 935

<210> 23

<211> 937

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<220>

<221> misc_特征

<222> (296)..(296)

<223> Xaa可为任意天然存在的氨基酸

<400> 23

Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr

65 70 75 80

Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Thr Ser Gln Trp Ile Thr Lys Asp Asn Gly Thr Asp Lys

130 135 140

Thr Tyr Ser Phe Gly Asn Ala Pro Val Arg Gly Leu Asp Ile Thr Glu

145 150 155 160

Glu Gly Leu Gln Ile Gly Thr Asp Glu Ser Gly Gly Lys Ser Lys Lys

165 170 175

Ile Phe Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Leu Gly Asp Glu

180 185 190

Glu Trp His Asp Thr Ile Gly Ala Glu Asp Lys Tyr Gly Gly Arg Ala

195 200 205

Leu Lys Pro Ala Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys

210 215 220

Pro Thr Asn Ala Lys Gly Gly Gln Ala Lys Ser Arg Thr Lys Asp Asp

225 230 235 240

Gly Thr Thr Glu Pro Asp Ile Asp Met Ala Phe Phe Asp Asp Arg Ser

245 250 255

Gln Gln Ala Ser Phe Ser Pro Glu Leu Val Leu Tyr Thr Glu Asn Val

260 265 270

Asp Leu Asp Thr Pro Asp Thr His Ile Ile Tyr Lys Pro Gly Thr Asp

275 280 285

Glu Thr Ser Ser Ser Phe Asn Xaa Gly Gln Gln Ser Met Pro Asn Arg

290 295 300

Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr

305 310 315 320

Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu

325 330 335

Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln

340 345 350

Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp

355 360 365

Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn

370 375 380

His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly

385 390 395 400

Val Gly Phe Thr Asp Thr Phe Gln Gly Ile Lys Val Lys Thr Thr Asn

405 410 415

Asn Gly Thr Ala Asn Ala Thr Glu Trp Glu Ser Asp Thr Ser Val Asn

420 425 430

Asn Ala Asn Glu Ile Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn

435 440 445

Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu

450 455 460

Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Ile Thr Leu Pro

465 470 475 480

Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Ala Pro

485 490 495

Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp

500 505 510

Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu

515 520 525

Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His

530 535 540

Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu

545 550 555 560

Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met

565 570 575

Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser

580 585 590

Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala

595 600 605

His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn

610 615 620

Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro

625 630 635 640

Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn

645 650 655

Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Arg Glu

660 665 670

Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly

675 680 685

Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys

690 695 700

Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp

705 710 715 720

Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly

725 730 735

Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu

740 745 750

Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val

755 760 765

Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln

770 775 780

Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln

785 790 795 800

Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr

805 810 815

Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro

820 825 830

Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser Val Thr Gln Lys Lys

835 840 845

Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe

850 855 860

Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala

865 870 875 880

Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp

885 890 895

Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg

900 905 910

Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr

915 920 925

Pro Phe Ser Ala Gly Asn Ala Thr Thr

930 935

<210> 24

<211> 937

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<220>

<221> misc_特征

<222> (538)..(538)

<223> Xaa可为任意天然存在的氨基酸

<400> 24

Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr

65 70 75 80

Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Thr Ser Gln Trp Val Thr Lys Asp Asn Gly Thr Asp Lys

130 135 140

Thr Tyr Ser Phe Gly Asn Ala Pro Val Arg Gly Leu Asp Ile Thr Glu

145 150 155 160

Glu Gly Leu Gln Ile Gly Thr Asp Asp Ser Ser Thr Glu Ser Lys Lys

165 170 175

Ile Phe Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Val Gly Asp Glu

180 185 190

Glu Trp His Asp Thr Ile Gly Ala Glu Asp Lys Tyr Gly Gly Arg Ala

195 200 205

Leu Lys Pro Ala Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys

210 215 220

Pro Thr Asn Ala Lys Gly Gly Gln Ala Lys Thr Arg Thr Lys Asp Asp

225 230 235 240

Gly Thr Thr Glu Pro Asp Ile Asp Met Ala Phe Phe Asp Asp Arg Ser

245 250 255

Gln Gln Ala Ser Phe Ser Pro Glu Leu Val Leu Tyr Thr Glu Asn Val

260 265 270

Asp Leu Glu Thr Pro Asp Thr His Ile Ile Tyr Lys Pro Gly Thr Asp

275 280 285

Glu Thr Ser Ser Ser Phe Asn Leu Gly Gln Gln Ser Met Pro Asn Arg

290 295 300

Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr

305 310 315 320

Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu

325 330 335

Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln

340 345 350

Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp

355 360 365

Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn

370 375 380

His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly

385 390 395 400

Val Gly Phe Thr Asp Thr Phe Gln Gly Ile Lys Val Lys Thr Thr Asn

405 410 415

Asn Gly Thr Ala Asn Ala Thr Glu Trp Glu Ser Asp Thr Ser Val Asn

420 425 430

Asn Ala Asn Glu Ile Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn

435 440 445

Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala Asn Val Ala Leu

450 455 460

Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Val Thr Leu Pro

465 470 475 480

Thr Asn Thr Asn Thr Tyr Glu Tyr Met Asn Gly Arg Val Val Ala Pro

485 490 495

Ser Leu Val Asp Ser Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp

500 505 510

Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu

515 520 525

Arg Tyr Arg Ser Met Leu Leu Gly Asn Xaa Arg Phe Val Pro Phe His

530 535 540

Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Ser Leu Leu Leu Leu

545 550 555 560

Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met

565 570 575

Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Ser

580 585 590

Ile Ser Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala

595 600 605

His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn

610 615 620

Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro

625 630 635 640

Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn

645 650 655

Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu

660 665 670

Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly

675 680 685

Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys

690 695 700

Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp

705 710 715 720

Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly

725 730 735

Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu

740 745 750

Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val

755 760 765

Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln

770 775 780

Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Tyr Gln

785 790 795 800

Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr

805 810 815

Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro

820 825 830

Tyr Pro Leu Ile Gly Lys Ser Ala Val Thr Ser Val Thr Gln Lys Lys

835 840 845

Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe

850 855 860

Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala

865 870 875 880

Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val Asp Pro Met Asp

885 890 895

Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe Asp Val Val Arg

900 905 910

Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr

915 920 925

Pro Phe Ser Ala Gly Asn Ala Thr Thr

930 935

<210> 25

<211> 962

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 25

Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr

65 70 75 80

Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Ser Cys Glu Trp Glu Gln Val Glu Pro Ala Glu Glu Ala

130 135 140

Ala Glu Asn Glu Asp Glu Glu Glu Glu Glu Asp Val Val Asp Pro Gln

145 150 155 160

Glu Gln Glu Pro Thr Thr Lys Thr His Val Tyr Ala Gln Ala Pro Leu

165 170 175

Ser Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly Thr Glu Ala

180 185 190

Thr Ala Ala Gly Gly Thr Lys Asp Leu Phe Ala Asp Pro Thr Phe Gln

195 200 205

Pro Glu Pro Gln Val Gly Glu Ser Gln Trp Asn Glu Ala Asp Ala Thr

210 215 220

Ala Ala Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Lys Pro Cys

225 230 235 240

Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln Gly Val

245 250 255

Leu Lys Ala Asn Ala Gln Gly Val Leu Glu Ser Gln Val Glu Met Gln

260 265 270

Phe Phe Ser Thr Ser Thr Asn Ala Thr Asn Glu Gln Asn Asn Ile Gln

275 280 285

Pro Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr Pro Asp

290 295 300

Thr His Ile Ser Tyr Lys Pro Thr Lys Ser Asp Asp Asn Ser Lys Val

305 310 315 320

Met Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Ala Phe

325 330 335

Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met

340 345 350

Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu

355 360 365

Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Met

370 375 380

Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser

385 390 395 400

Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu Asp Glu

405 410 415

Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Ile Thr Asp Thr

420 425 430

Tyr Gln Ala Ile Lys Thr Asn Gly Asn Gly Ala Gly Asp Gln Ala Thr

435 440 445

Thr Trp Gln Lys Asp Ser Gln Phe Ala Asp Arg Asn Glu Ile Gly Val

450 455 460

Gly Asn Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu Trp Arg

465 470 475 480

Asn Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys Leu Lys

485 490 495

Tyr Asn Pro Ser Asn Val Glu Ile Ser Asp Asn Pro Asn Thr Tyr Asp

500 505 510

Tyr Met Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys Tyr Ile

515 520 525

Asn Leu Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val Asn Pro

530 535 540

Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu

545 550 555 560

Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe

565 570 575

Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu

580 585 590

Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly

595 600 605

Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser Ile Cys

610 615 620

Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu

625 630 635 640

Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr

645 650 655

Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn

660 665 670

Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp

675 680 685

Ala Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly

690 695 700

Phe Asp Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly

705 710 715 720

Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr Phe Asp

725 730 735

Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu

740 745 750

Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val Ala Gln

755 760 765

Cys Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ala Asn Tyr

770 775 780

Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys Asp Arg

785 790 795 800

Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val

805 810 815

Asp Glu Thr Lys Tyr Lys Asp Tyr Gln Gln Val Gly Ile Ile His Gln

820 825 830

His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Glu

835 840 845

Gly Gln Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly Lys Thr

850 855 860

Ala Val Asp Ser Ile Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Leu

865 870 875 880

Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr

885 890 895

Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala Leu Asp

900 905 910

Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Val

915 920 925

Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly

930 935 940

Val Ile Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala

945 950 955 960

Thr Thr

<210> 26

<211> 531

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 26

Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser

1 5 10 15

Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala

20 25 30

Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser

35 40 45

Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr

50 55 60

Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn

65 70 75 80

Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr

85 90 95

Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg

100 105 110

Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val

115 120 125

Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser

130 135 140

Arg Lys Thr Pro Asn Gly Val Ala Val Gly Asp Asp Tyr Asp Gly Gly

145 150 155 160

Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly

165 170 175

Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile

180 185 190

Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp

195 200 205

Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro

210 215 220

Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His

225 230 235 240

Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser

245 250 255

Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu

260 265 270

Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala

275 280 285

Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Glu Ser Ala Ala

290 295 300

Ala Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp

305 310 315 320

Asn Phe Ala Ser Ala Ala Ala Val Ala Glu Ala Ala Glu Thr Glu Ser

325 330 335

Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser Tyr

340 345 350

Asn Val Leu Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu

355 360 365

Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu

370 375 380

Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Ser

385 390 395 400

Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln

405 410 415

Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Ser

420 425 430

Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Ala

435 440 445

Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile

450 455 460

Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val

465 470 475 480

Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg

485 490 495

Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro

500 505 510

Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser Ser

515 520 525

Arg Thr Phe

530

<210> 27

<211> 541

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 27

Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser

1 5 10 15

Val Met Gln Gln Ala Val Ala Val Ala Met Gln Pro Pro Leu Glu Ala

20 25 30

Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser

35 40 45

Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr

50 55 60

Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn

65 70 75 80

Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr

85 90 95

Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg

100 105 110

Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val

115 120 125

Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser

130 135 140

Arg Lys Thr Pro Asn Gly Val Thr Val Gly Asp Asp Tyr Asp Gly Ser

145 150 155 160

Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly

165 170 175

Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile

180 185 190

Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp

195 200 205

Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro

210 215 220

Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His

225 230 235 240

Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser

245 250 255

Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu

260 265 270

Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala

275 280 285

Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Asp Ser Ala Ala

290 295 300

Ala Thr Thr Ala Ala Val Ala Thr Ala Ala Thr Thr Asp Ala Asp Ala

305 310 315 320

Thr Thr Thr Arg Gly Asp Thr Phe Ala Thr Gln Ala Glu Glu Ala Ala

325 330 335

Ala Leu Ala Ala Thr Asp Asp Ser Glu Ser Lys Ile Val Ile Lys Pro

340 345 350

Val Glu Lys Asp Ser Lys Asp Arg Ser Tyr Asn Val Leu Ala Asp Lys

355 360 365

Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp

370 375 380

Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val

385 390 395 400

Thr Cys Gly Val Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln

405 410 415

Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro Val

420 425 430

Val Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu

435 440 445

Gln Ala Val Tyr Ser Gln Gln Leu Arg Ala Phe Thr Ser Leu Thr His

450 455 460

Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala

465 470 475 480

Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His

485 490 495

Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr

500 505 510

Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu

515 520 525

Gly Val Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe

530 535 540

<210> 28

<211> 532

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 28

Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser

1 5 10 15

Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala

20 25 30

Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser

35 40 45

Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr

50 55 60

Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn

65 70 75 80

Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr

85 90 95

Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg

100 105 110

Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val

115 120 125

Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser

130 135 140

Arg Lys Thr Pro Asn Gly Val Thr Val Thr Asp Gly Ser Gln Asp Glu

145 150 155 160

Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Phe Ser

165 170 175

Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr

180 185 190

Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val

195 200 205

Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Glu

210 215 220

Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile

225 230 235 240

Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg Leu Ser

245 250 255

Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Gln

260 265 270

Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp

275 280 285

Val Glu Ala Tyr Glu Lys Ser Lys Glu Asp Ser Thr Ala Val Ala Thr

290 295 300

Ala Ala Thr Val Ala Asp Ala Thr Val Thr Arg Gly Asp Thr Phe Ala

305 310 315 320

Thr Gln Ala Glu Glu Ala Ala Ala Leu Ala Ala Thr Asp Asp Ser Glu

325 330 335

Ser Lys Ile Val Ile Lys Pro Val Glu Lys Asp Ser Lys Asp Arg Ser

340 345 350

Tyr Asn Val Leu Ser Asp Gly Lys Asn Thr Ala Tyr Arg Ser Trp Tyr

355 360 365

Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr

370 375 380

Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp

385 390 395 400

Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg

405 410 415

Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr

420 425 430

Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg

435 440 445

Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln

450 455 460

Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn

465 470 475 480

Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile

485 490 495

Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys

500 505 510

Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser

515 520 525

Ser Arg Thr Phe

530

<210> 29

<211> 528

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 29

Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser

1 5 10 15

Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala

20 25 30

Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser

35 40 45

Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr

50 55 60

Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn

65 70 75 80

Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr

85 90 95

Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg

100 105 110

Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val

115 120 125

Asn Glu Phe Leu Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser

130 135 140

Arg Lys Thr Pro Asn Gly Val Thr Val Thr Asp Gly Ser Gln Asp Glu

145 150 155 160

Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Phe Ser

165 170 175

Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr

180 185 190

Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val

195 200 205

Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Glu

210 215 220

Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile

225 230 235 240

Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg Leu Ser

245 250 255

Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Gln

260 265 270

Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp

275 280 285

Val Glu Ala Tyr Glu Lys Ser Lys Glu Asp Ser Ala Ala Ala Ala Thr

290 295 300

Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp Asn Phe Ala

305 310 315 320

Ser Ala Ala Ala Val Ala Glu Ala Ala Glu Thr Glu Ser Lys Ile Val

325 330 335

Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser Tyr Asn Val Leu

340 345 350

Ala Asp Lys Lys Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn

355 360 365

Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr

370 375 380

Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Ser Leu Pro Asp

385 390 395 400

Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn

405 410 415

Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys Ser Phe

420 425 430

Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Ala Phe Thr Ser

435 440 445

Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg

450 455 460

Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu

465 470 475 480

Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln

485 490 495

Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr

500 505 510

Lys Ala Leu Gly Val Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe

515 520 525

<210> 30

<211> 535

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 30

Met Met Arg Arg Ala Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser

1 5 10 15

Val Met Gln Gln Ala Met Ala Ala Ala Ala Ala Met Gln Pro Pro Leu

20 25 30

Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg

35 40 45

Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg

50 55 60

Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr

65 70 75 80

Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp

85 90 95

Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg

100 105 110

Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro

115 120 125

Asn Val Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met

130 135 140

Val Ser Arg Lys Thr Pro Asn Gly Val Thr Val Thr Glu Asp Tyr Asp

145 150 155 160

Gly Ser Gln Asp Glu Leu Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro

165 170 175

Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala

180 185 190

Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu

195 200 205

Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp

210 215 220

Asp Pro Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala

225 230 235 240

Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr

245 250 255

Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe

260 265 270

Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn Ile

275 280 285

Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Lys Ser Lys Glu Glu Ser

290 295 300

Ala Ala Ala Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg

305 310 315 320

Gly Asp Asn Phe Ala Ser Ala Ala Ala Val Ala Ala Ala Glu Ala Ala

325 330 335

Glu Thr Glu Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys

340 345 350

Asp Arg Ser Tyr Asn Val Leu Pro Asp Lys Ile Asn Thr Ala Tyr Arg

355 360 365

Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg

370 375 380

Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln

385 390 395 400

Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg

405 410 415

Ser Thr Arg Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu

420 425 430

Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln

435 440 445

Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro

450 455 460

Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val

465 470 475 480

Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg

485 490 495

Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg

500 505 510

Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg

515 520 525

Val Leu Ser Ser Arg Thr Phe

530 535

<210> 31

<211> 581

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 31

Met Arg Arg Ala Ala Met Tyr His Glu Gly Pro Pro Pro Ser Tyr Glu

1 5 10 15

Ser Val Val Gly Ala Ala Ala Ala Ser Pro Phe Ala Ser Gln Leu Glu

20 25 30

Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr Gly Gly Arg Asn

35 40 45

Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Val

50 55 60

Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser Leu Asn Tyr Gln

65 70 75 80

Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln Asn Asn Asp Tyr

85 90 95

Thr Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp Arg Ser

100 105 110

His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn

115 120 125

Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala Arg Val Met Val

130 135 140

Ser Arg Ser His Thr Lys Asp Asp Arg Val Glu Leu Lys Tyr Glu Trp

145 150 155 160

Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile

165 170 175

Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu Lys Val Gly Arg

180 185 190

Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg

195 200 205

Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu Val Met Pro Gly

210 215 220

Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile Leu Leu Pro Gly

225 230 235 240

Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn Leu Leu Gly Ile

245 250 255

Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile Thr Tyr Glu Asp

260 265 270

Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Gln

275 280 285

Asp Ser Leu Lys Glu Glu Glu Ala Gly Glu Gly Ser Gly Gly Gly Ala

290 295 300

Gly Gln Glu Glu Gly Gly Ala Ser Ser Glu Ala Ser Ala Asp Pro Ala

305 310 315 320

Ala Ala Ala Glu Ala Glu Ala Ala Asp Pro Ala Met Val Val Glu Glu

325 330 335

Glu Lys Asp Met Asn Asp Glu Ala Val Arg Gly Asp Thr Phe Ala Thr

340 345 350

Arg Gly Glu Glu Lys Lys Ala Glu Ala Glu Ala Ala Ala Glu Glu Ala

355 360 365

Ala Ala Ala Ala Ala Ala Val Glu Ala Ala Ala Glu Ala Glu Lys Pro

370 375 380

Pro Lys Glu Pro Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys Arg

385 390 395 400

Ser Tyr Asn Val Leu Lys Asp Ser Thr Asn Thr Glu Tyr Arg Ser Trp

405 410 415

Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Ala Thr Gly Val Arg Ser Trp

420 425 430

Thr Leu Leu Cys Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr

435 440 445

Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr

450 455 460

Arg Gln Val Ser Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val

465 470 475 480

His Ser Lys Ser Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu Ile

485 490 495

Arg Gln Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn

500 505 510

Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu

515 520 525

Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser

530 535 540

Ile Gly Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr

545 550 555 560

Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu

565 570 575

Ser Ser Arg Thr Phe

580

<210> 32

<211> 1323

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 32

atgtccaaaa agcgcgtccg ggtggatgat gacttcgacc ccgtctaccc ctacgatgca 60

gacaacgcac cgaccgtgcc cttcatcaac cctcccttcg tctcttcaga tggattccaa 120

gaaaagcccc tgggggtgtt gtccctgcga ctggctgacc ccgtcaccac caagaacggg 180

gaaatcaccc tcaagctggg agagggggtg gacctcgacg actcgggaaa actcatctcc 240

aaaaatgcca ccaaggccac tgcccctctc agtatttcca acagcaccat ttcccttaac 300

atggatgccc ctctttacaa caacaatgga aagttaggca taagaatagg agcacctcta 360

aaggtagtag acttactaaa cactttagct gtagcctatg gatcgggtct aggtctcaag 420

aataatgccc ttacagttca gttagtttct ccactcactt ttgataacaa aggcaatgta 480

aaaattaact tagggaatgg cccattaaca gttgcggcaa accgactgag tgttacctgc 540

aaaagaggtt tatatgtcac tactacagga gatgcactcg aaagcaacat aagctgggct 600

aaaggtataa gatttgaagg aaatgcaata gcagcaaata ttggcaaagg gcttgaattt 660

ggtactacta gttcagagtc agatgtcagc aatgcttatc ctatccaagt aaaactaggt 720

actggtctca cctttgacag cacaggtgca attgtcgctt ggaacaaaga agatgacaaa 780

cttacactgt ggaccacagc cgatccatct ccaaactgtc acatatattc tgacaaggat 840

gctaagctta cactctgctt gacaaagtgt ggcagtcaga tactgggcac tgtttctctc 900

atagctgttg atactggtag cttaaatcca ataacaggac aagtaaccac tgctcttgtt 960

tcacttaaat tcgatgccaa tggagttttg caaaccagtt caacattgga caaagaatat 1020

tggaatttta gaaaaggaga tgtgacacct gctgagccat atactaatgc tataggtttt 1080

atgcccaata taaaggcata tccgaaaaac acaaattcag ctgcaaaaag tcacattgtg 1140

ggaaaagtat acctacatgg ggaagtaagc aagccactag acttgataat tacatttaat 1200

gaaaccagta atgaaacctg tacctattgc attaactttc agtggcagtg gggaactgac 1260

aaatataaaa atgaaacgct tgctgtcagt tcattcacct tttcctacat tgcccaagaa 1320

taa 1323

<210> 33

<211> 1332

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 33

atgtccaaaa agcgcgtccg ggtggatgat gacttcgacc ccgtctaccc ctacgatgca 60

gacaacgcac cgaccgtgcc cttcatcaac ccccccttcg tctcttcaga tggattccaa 120

gagaagcccc tgggggtgtt gtccctgcga ctggccgacc ccgtcaccac caagaacggg 180

gaaatcaccc tcaagctggg agagggggtg gacctcgacg actcgggaaa actcatctcc 240

aaaaatgcca ccaaggccac tgcccctctc agtatttcca acagcaccat ttcccttaac 300

atggctgccc ctttttacaa caacaatgga acgttaagtc tcaatgtttc tacaccatta 360

gcagtatttc ccacttttaa cactttaggt atcagtcttg gcaacggtct tcaaacttct 420

aataagttgc tggctgtaca gttaactcat cctcttacat tcagctcaaa tagcatcaca 480

gtaaaaacag acaaaggact ctatattaat tctagtggaa acagagggct tgaggctaac 540

ataagcctaa aaagaggact gatttttgat ggtaatgcta ttgcaacata ccttggaagt 600

ggtttagact atggatccta tgatagcgat ggaaaaacaa gacccatcat caccaaaatt 660

ggagcaggct tgaattttga ttctaataat gccatggctg tgaagctagg cacaggttta 720

agttttgact ctgccggtgc cttaacagct ggaaacaaag aggatgacaa gctaacactt 780

tggactacac ctgaccccag ccctaattgt caattacttt cagacagaga tgccaaattt 840

accctatgtc ttacaaaatg cggtagtcaa atactaggca ctgttgcagt agctgctgtt 900

actgtaagtt cagcactaaa tccaattaat gacacagtaa aaagcgccat agtattcctt 960

agatttgact ctgacggtgt gctcatgtca aactcatcaa tggtaggtga ttactggaac 1020

tttagggaag gacagaccac ccaaagtgtg gcctatacaa atgctgtggg attcatgccc 1080

aatctaggtg catatcctaa aacccaaagc aaaacaccaa aaaatagtat agtaagccag 1140

gtatatttaa atggagaaac tactatgcca atgacactga caataacttt caatggcact 1200

gatgaaaaag acacaacacc tgtcagcact tactctatga cttttacatg gcagtggact 1260

ggagactata aggacaagaa tattaccttt gctaccaact cctttacttt ctcctacatg 1320

gcccaagaat aa 1332

<210> 34

<211> 1278

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 34

atgtccaaaa agcgcgtccg ggtggatgat gacttcgacc ccgtctaccc ctacgatgca 60

gacaacgcac cgaccgtgcc cttcatcaac ccccccttcg tctcttcaga tggattccaa 120

gagaagcccc tgggggtgtt gtccctgcga ctggccgacc ccgtcaccac caagaacggg 180

gaaatcaccc tcaagctggg agagggggtg gacctcgact cctcgggaaa actcatctcc 240

aacacggcca ccaaggccgc tgcccctctc agtttttcca acaacaccat ttcccttaac 300

atggatcacc ccttttacac taaagatgga aaattagcct tacaagtttc tccaccatta 360

aatatactga gaacaagcat tctaaacaca ctagctttag gttttggatc aggtttagga 420

ctccgtggct ctgccttggc agtacagtta gtctctccac ttacatttga tactgatgga 480

aacataaagc ttaccttaga cagaggtttg catgttacaa caggagatgc aattgaaagc 540

aacataagct gggctaaagg tttaaaattt gaagatggag ccatagcaac caacattgga 600

aatgggttag agtttggaag cagtagtaca gaaacaggtg tcgatgatgc ttacccaatc 660

caagttaaac ttggatctgg ccttagcttt gacagtacag gagccataat ggctggtaac 720

aaagaagacg ataaactcac tttgtggaca acacctgatc catcaccaaa ctgtcaaata 780

ctcgcagaaa atgatgcaaa actaacactt tgcttgacta aatgtggtag tcaaatactg 840

gccactgtgt cagtcttagt tgtaggaagt ggaaacctaa accccattac tggcaccgta 900

agcagtgctc aggtgtttct acgttttgat gcaaacggtg ttcttttaac agaacattct 960

acactaaaaa aatactgggg gtataggcag ggagatagca tagatggcac tccatatgtc 1020

aatgctgtag gattcatgcc caatttaaaa gcttatccaa agtcacaaag ttctactact 1080

aaaaataata tagtagggca agtatacatg aatggagatg tttcaaaacc tatgcttctc 1140

actataaccc tcaatggtac tgatgacagc aacagtacat attcaatgtc attttcatac 1200

acctggacta atggaagcta tgttggagca acatttggag ctaactctta taccttctcc 1260

tacatcgccc aagaatga 1278

<210> 35

<211> 1278

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 35

atgtccaaaa agcgcgtccg ggtggatgat gacttcgacc ccgtctaccc ctacgatgca 60

gacaacgcac cgaccgtgcc cttcatcaac ccccccttcg tctcttcaga tggattccaa 120

gagaagcccc tgggggtgct gtccctgcga ctggccgacc ccgtcaccac caagaacggg 180

gaaatcaccc tcaagctggg agaggggctg gacctcgact cctcgggaaa actcatctcc 240

aacacggcca ccaaggccgc cgcccctctc agtttttcca acaacaccat ttcccttaac 300

atggatcacc ccttttacac taaagatgga aaattatcct tacaagtttc tccaccatta 360

aatatactga gaacaagcat tctaaacaca ctagctttag gttttggatc aggtttagga 420

ctccgtggct ctgccttggc agtacagtta gtctctccac ttacatttga tactgatgga 480

aacataaagc ttaccttaga cagaggtttg catgttacaa caggagatgc aattgaaagc 540

aacataagct gggctaaagg tttaaaattt gaagatggag ccatagcaac caacattgga 600

aatgggttag agtttggaag cagtagtaca gaaacaggtg ttgatgatgc ttacccaatc 660

caagttaaac ttggatctgg ccttagcttt gacagtacag gagccataat ggctggtaac 720

aaagaagacg ataaacttac tttgtggaca acacctgatc catcaccaaa ctgtcaaata 780

ctcgcagaaa atgatgcaaa actaacactt tgcttgacta aatgtggtag tcaaatactg 840

gccactgtgt cagtcttagt tgtaggaagt ggaaacctaa accccattac tggcaccgta 900

agcagtgctc aggtgtttct acgttttgat gcaaacggtg ttcttttaac agaacattct 960

acactaaaaa aatactgggg gtataggcag ggagatagca tagatggcac tccatatacc 1020

aatgctgtag gattcatgcc caatttaaaa gcttatccaa agtcacaaag ttctactact 1080

aaaaataata tagtagggca agtatacatg aatggagatg tttcaaaacc tatgcttctc 1140

actataaccc tcaatggtac tgatgacagc aacagtacat attcaatgtc attttcatac 1200

acctggacta atggaagcta tgttggagcg acatttgggg ctaactctta taccttctca 1260

tacatcgccc aagaatga 1278

<210> 36

<211> 1329

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 36

atgtccaaaa agcgcgcgcg ggtggatgat ggcttcgacc ccgtgtaccc ctacgatgca 60

gacaacgcac cgactgtgcc cttcatcaac cctcccttcg tctcttcaga tggattccaa 120

gaaaagcccc tgggggtgtt gtccctgcgt ctggccgacc ccgtcaccac caagaatggg 180

gctgtccccc tcaagctcgg ggagggggtg gacctcgacg actcgggaaa actcatctcc 240

aaaaaatcca ccaaggccaa ttcccctctc agtatttcca acaacaccat ttcccttaac 300

atggataccc ctttttatac caaagatgga aaattaacca tgcaggtaac tgcaccatta 360

aagttagcaa acacggccat actaaacaca ctagctatgg cctatggaaa tggtttaggt 420

ctaaacaaca atgctctcac tgttcaggta acatctccac tcacatttga taatagcaaa 480

gtcaagatta acctagggaa tggaccacta atggtatctg ctaacaagct ttcaatcaac 540

tgcttacggg gtctatatgt tgcccctaat aataccggac tagaaaccaa cataagctgg 600

gcaaacgcaa tgcgctttga gggtaatgca atggctgttt atatagacac aaataaaggc 660

ctacaatttg gcactactag cacagaaaca ggtgtcacca atgcttaccc catacaagtc 720

aaacttggcg caggccttgc atttgatagc acaggagcta ttgttgcttg gaacaaagaa 780

aatgacagcc tcactttgtg gactacacca gatccctctc caaattgtaa aatagcatct 840

gaaaaggatg caaaactcac actttgcttg acaaagtgtg gtagtcaaat cctaggcact 900

gtctccctat tagcagtcag tggcagcttg gctcctatca caggggctgt tagtactgca 960

cttgtatcac tcaaattcaa tgctaatgga gcccttttgg acaaatcaac tctgaacaaa 1020

gaatactgga actacagaca aggagatcta attccaggta caccatatac acatgctgtg 1080

ggtttcatgc ctaacaaaaa agcctaccct aaaaacacaa ctgcagcttc caagagccac 1140

attgtgggtg atgtgtattt agatggagat gcagataagc ctttatctct tatcatcact 1200

ttcaatgaaa ctgatgatga aacctgtgat tactgcatca actttcaatg gaaatgggga 1260

gctgatcaat ataaggataa gacactcgca accagttcat tcaccttctc atacatcgcc 1320

caagaataa 1329

<210> 37

<211> 1731

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 37

atgaagcgcg ccaaaacgtc tgacgagacc ttcaaccccg tgtaccccta tgacacggaa 60

aacgggcctc cctccgtccc tttcctcacc cctcccttcg tgtcccccga cggatttcaa 120

gaaagccccc caggggtcct gtctctgcgc ctgtcagagc ccctggtcac ttcccacggc 180

atgcttgccc tgaaaatggg aaatggcctc tccctggatg acgccggcaa cctcacctct 240

caagatgtca ccaccgtcac ccctcccctc aaaaaaacca agaccaacct cagcctccag 300

acctcagccc ccctgaccgt tagctctggg tccctcaccg tcgcggccgc cgctccactg 360

gcggtggccg gcacctctct caccatgcaa tctcaggccc ccttgacagt gcaagatgca 420

aaactcggcc tggccaccca gggacccctg accgtgtctg aaggcaaact caccttgcag 480

acatcggctc cactgacggc cgctgacagc agcactctca ctgttagtgc cacacctccc 540

ctcagcacaa gcaatggtag tttgagcatt gacatgcagg ccccgattta taccaccaat 600

ggaaaactgg cacttaacat tggtgctccc ctgcatgtgg tagacaccct aaatgcacta 660

actgtagtaa ctggccaggg tcttaccata aatggaagag ccctgcaaac tagagtcacg 720

ggtgccctca gttatgacac agaaggcaac atccaactgc aagccggagg gggtatgcgc 780

attgacaata atggccaact tatccttaat gtagcttatc catttgatgc tcaaaacaac 840

ctcagcctta gacttggcca aggtccccta attgttaact ctgcccacaa cttggatctt 900

aaccttaaca gaggccttta cttatttaca tctggaaaca cgaaaaaact ggaagttaac 960

ataaaaacag ccaaaggtct attttacgat ggcaccgcta tagcaatcaa tgcaggtgac 1020

gggctacagt ttgggtctgg ttcagataca aatccattgc aaactaaact tggattgggg 1080

ctggaatatg actccaacaa agctataatc actaaacttg gaactggcct aagctttgac 1140

aacacaggtg ccatcacagt aggcaacaaa aatgatgaca agcttacctt gtggaccaca 1200

ccagacccct ccccaaactg cagaattaat tcagaaaaag atgctaaact cacactagtt 1260

ttgactaaat gcggcagcca ggtgttagcc agcgtttctg ttttatctgt aaaaggcagc 1320

cttgccccca tcagcggcac agtaactagc gcccagattg ttttaagatt tgatgaaaac 1380

ggagttttat tgagcaattc ttctcttgac ccccaatact ggaactatag aaaaggcgat 1440

tctacagaag gcactgcata tactaatgct gtgggattta tgcccaacct cacagcatac 1500

cctaaaacac agagccagac tgctaaaagc aacattgtaa gtcaagttta cttgaatggg 1560

gacaaaacaa aacccatgac cctaaccatc accctcaatg gaactaatga aacaggggat 1620

gctacagtaa gcacatactc catgtcattt tcatggaact ggaatggaag taattacatt 1680

aatgacacct tccaaaccaa ctcctttacc ttctcctaca tcgcccaaga a 1731

<210> 38

<211> 2814

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<220>

<221> misc_特征

<222> (345)..(345)

<223> n是a, c, g,或t

<220>

<221> misc_特征

<222> (360)..(360)

<223> n是a, c, g,或t

<400> 38

atggccaccc catcgatgct gccccagtgg gcgtacatgc acatcgccgg acaggacgct 60

tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcagt 120

ctggggaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgc 180

agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg aggacaacac ctactcgtac 240

aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc tggacatggc cagcacctac 300

tttgacatcc gcggcgtgct ggatcggggc cccagcttca aaccntactc cggcaccgcn 360

tacaacagcc tggctcccaa gggagcgccc aacacctcac agtggataac caaagacaat 420

ggaactgata agacatacag ttttggaaat gctccagtca gaggattgga cattacagaa 480

gagggtctcc aaataggacc cgatgagtca gggggtgaaa gcaagaaaat ttttgcagac 540

aaaacctatc agcctgaacc tcagcttgga gatgaggaat ggcatgatac tattggagct 600

gaagacaagt atggaggcag agcgcttaaa cctgccacca acatgaaacc ctgctatggg 660

tctttcgcca agccaactaa tgctaaggga ggtcaggcta aaagcagaac caaggacgat 720

ggcactactg agcctgatat tgacatggcc ttctttgacg atcgcagtca gcaagctagt 780

ttcagtccag aacttgtttt gtatactgag aatgtcgatc tggacacccc ggatacccac 840

attatttaca aacctggcac tgatgaaaca agttcttctt tcaacttggg tcagcagtcc 900

atgcccaaca gacccaacta catcggcttc agagacaact ttatcggtct catgtactac 960

aacagtactg gcaatatggg tgtactagct ggacaggcct cccagctgaa tgctgtggtg 1020

gacttgcagg acagaaacac tgaactgtcc taccagctct tgcttgactc tctgggtgac 1080

agaaccaggt atttcagtat gtggaaccag gcggtggaca gctacgaccc cgatgtgcgc 1140

attattgaaa atcacggtgt ggaggatgaa ctacccaact attgcttccc tttgaatggt 1200

gtgggcttta cagatacatt ccagggaatt aaggttaaaa ctaccaataa cggaacagca 1260

aatgctacag agtgggaatc tgatacctct gtcaataatg ctaatgagat tgccaagggc 1320

aatcctttcg ccatggagat caacatccag gccaacctgt ggcggaactt cctctacgcg 1380

aacgtggcgc tgtacctgcc cgactcctac aagtacacgc cggccaacat cacgctgccc 1440

accaacacca acacctacga ttacatgaac ggccgcgtgg tagcgccctc gctggtggac 1500

gcctacatca acatcggggc gcgctggtcg ctggacccca tggacaacgt caaccccttc 1560

aaccaccacc gcaacgcggg cctgcgctac cgctccatgc tcctgggcaa cgggcgctac 1620

gtgcccttcc acatccaggt gccccaaaag tttttcgcca tcaagagcct cctgctcctg 1680

cccgggtcct acacctacga gtggaacttc cgcaaggacg tcaacatgat cctgcagagc 1740

tccctcggca acgacctgcg cacggacggg gcctccatcg ccttcaccag catcaacctc 1800

tacgccacct tcttccccat ggcgcacaac accgcctcca cgctcgaggc catgctgcgc 1860

aacgacacca acgaccagtc cttcaacgac tacctctcgg cggccaacat gctctacccc 1920

atcccggcca acgccaccaa cgtgcccatc tccatcccct cgcgcaactg ggccgccttc 1980

cgcggctggt ccttcacgcg cctcaagacc cgcgagacgc cctcgctggg ctccgggttc 2040

gacccctact tcgtctactc gggctccatc ccctacctcg acggcacctt ctacctcaac 2100

cacaccttca agaaggtctc catcaccttc gactcctccg tcagctggcc cggcaacgac 2160

cgcctcctga cgcccaacga gttcgaaatc aagcgcaccg tcgacggaga ggggtacaac 2220

gtggcccagt gcaacatgac caaggactgg ttcctggttc agatgctggc ccactacaac 2280

atcggctacc agggcttcta cgtgcccgag ggctacaagg accgcatgta ctccttcttc 2340

cgcaacttcc agcccatgag ccgccaggtc gtggacgagg tcaactacaa ggactaccag 2400

gccgtcaccc tggcctacca gcacaacaac tcgggcttcg tcggctacct cgcgcccacc 2460

atgcgccagg gacagcccta ccccgccaac tacccctacc cgctcatcgg caagagcgcc 2520

gtcgccagcg tcacccagaa aaagttcctc tgcgaccggg tcatgtggcg catccccttc 2580

tccagcaact tcatgtccat gggcgcgctc accgacctcg gccagaacat gctctacgcc 2640

aactccgccc acgcgctaga catgaatttc gaagtcgacc ccatggatga gtccaccctt 2700

ctctatgttg tcttcgaagt cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc 2760

atcgaggccg tctacctgcg cacgcccttc tcggccggta acgccaccac ctaa 2814

<210> 39

<211> 2814

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 39

atggccaccc catcgatgct gccccagtgg gcgtacatgc acatcgccgg acaggacgct 60

tcggagtacc tgagtccggg tctggtgcag tttgcccgcg ccacagacac ctacttcagt 120

ctggggaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgc 180

agccagcggc tgacgctgcg cttcgtgccc gtggacggcg aggacaacac ctactcgtac 240

aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc tggacatggc cagcacctac 300

tttgacatcc gcggcgtgct ggatcggggc cccagcttca aaccctactc cggcaccgcc 360

tacaacgctc tggctcccaa gggagcgccc aacacctcac agtggataac caaagacaat 420

ggaactgata agacatacag ttttggaaat gctccagtca gaggattgga cattacagaa 480

gagggtctcc aaataagaac cgatgagtca gggggtgaaa gcaagaaaat ttttgcagac 540

aaaacctatc agcctgaacc tcagcttgga gatgaggaat ggcatgatac tattggagct 600

gaagacaagt atggaggcag agcgcttaaa cctgccacca acatgaaacc ctgctatggg 660

tctttcgcca agccaactaa tgctaaggga ggtcaggcta aaagcagaac caaggacgat 720

ggcactactg agcctgatat tgacatggcc ttctttgacg atcgcagtca gcaagctagt 780

ttcagtccag aacttgtttt gtatactgag aatgtcgatc tggacacccc ggatacccac 840

attatttaca aacctggcac tgatgaaaca agttcttctt tcaacttggg tcagcagtcc 900

atgcccaaca gacccaacta cattgggttc agagacaact ttatcgggct catgtactac 960

aacagcactg gcaatatggg tgtactggct ggtcaggcct cccagctgaa tgctgtggtg 1020

gacttgcagg acagaaacac cgaactgtcc taccagctct tgcttgactc tctgggtgac 1080

agaaccaggt atttcagtat gtggaatcag gcggtggaca gttatgaccc cgatgtgcgc 1140

attattgaaa atcacggtgt ggaggatgaa ctccccaact attgcttccc tttgaatggt 1200

gtgggcttta cagatacatt ccagggaatt aaggttaaaa ctaccaataa cggaacagca 1260

aatgctacag agtgggaatc tgatacctct gtcaataatg ctaatgagat tgccaagggc 1320

aatcctttcg ccatggagat caacatccag gccaacctgt ggcggaactt cctctacgcg 1380

aacgtggcgc tgtacctgcc cgactcctac aagtacacgc cggccaacat cacgctgccg 1440

accaacacca acacctacga ttacatgaac ggccgcgtgg tggcgccctc gctggtggac 1500

gcctacatca acatcggggc gcgctggtcg ctggacccca tggacaacgt caaccccttc 1560

aaccaccacc gaaacgcggg cctgcgatac cgctccatgc tcctgggcaa cgggcgctac 1620

gtgcccttcc acatccaggt gccccaaaag tttttcgcca tcaagagcct cctgctcctg 1680

cccgggtcct acacctacga gtggaacttc cgcaaggacg tcaacatgat cctgcagagc 1740

tccctcggca acgacctgcg cacggacggg gcttccatcg ccttcaccag catcaacctc 1800

tacgccacct tcttccccat ggcgcacaac accgcctcca cgctcgaggc catgctgcgc 1860

aacgacacca acgaccagtc cttcaacgac tacctctcgg cggccaacat gctctacccc 1920

atcccggcca acgccaccaa cgtgcccatc tccatcccct cgcgcaactg ggccgccttc 1980

cgcggmtggt ccttcacgcg cctcaagacc cgcgagacgc cctcgctagg ctccgggttc 2040

gacccctact tcgtctactc gggctccatc ccctaccttg acggcacctt ctacctcaac 2100

cacaccttca agaaggtctc catcaccttc gactcctccg tcagctggcc cggcaacgac 2160

cgcctcctga cgcccaacga gttcgaaatc aagcgcaccg tcgacggaga ggggtacaac 2220

gtggcccagt gcaacatgac caaggactgg ttcctggtcc agatgctggc ccactacaac 2280

atcggctacc agggcttcta cgtgcccgag ggctacaagg accgcatgta ctccttcttc 2340

cgcaacttcc agcccatgag ccgccaggtc gtggacgagg tcaactacaa ggactaccag 2400

gccgtcaccc tggcctacca gcacaacaac tcgggcttcg tcggctacct cgcgcccacc 2460

atgcgccagg gacagcccta ccccgccaac tacccctacc cgctcatcgg caagagcgcc 2520

gtcgccagcg tcacccagaa aaagttcctc tgcgaccggg tcatgtggcg catccccttc 2580

tccagcaact tcatgtccat gggcgcgctc accgacctcg gccaaaacat gctttacgcc 2640

aactccgccc acgcgctaga catgaatttc gaagtcgacc ccatggatga gtccaccctt 2700

ctctatgttg tcttcgaagt cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc 2760

atcaaggccg tctacctgcg cacccccttc tcggccggta acgccaccac ctaa 2814

<210> 40

<211> 2814

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 40

atggccaccc catcgatgct gccccagtgg gcgtacatgc acatcgccgg acaggacgct 60

tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcagt 120

ctggggaaca agtttaggaa ccccacggtg gcacccacgc acgatgtgac caccgaccgc 180

agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg aggacaacac ctactcgtac 240

aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc tggacatggc cagcacctac 300

tttgacatcc gcggcgtgct ggatcggggc cccagcttca aaccctactc cggcaccgcc 360

tacaacagcc tggctcccaa gggagcgccc aacacctcac agtggataac caaagacaat 420

ggaactgata agacatacag ttttggaaat gctccagtca gaggattgga cattacagaa 480

gagggtctcc aaataggaac cgatgagtca gggggtgaaa gcaagaaaat ttttgcagac 540

aaaacctatc agcctgaacc tcagcttgga gatgaggaat ggcatgatac tattggagct 600

gaagacaagt atggaggcag agcgcttaaa cctgccacca acatgaaacc ctgctatggg 660

tctttcgcca agccaactaa tgctaaggga ggtcaggcta aaagcagaac caaggacgat 720

ggcactactg agcctgatat tgacatggcc ttctttgacg atcgcagtca gcaagctagt 780

ttcagtccag aacttgtttt gtatactgag aatgtcgatc tggacacccc ggatacccac 840

attatttaca aacctggcac tgatgaaaca agttcttctt tcaacttggg tcagcagtcc 900

atgcccaaca gacccaacta cattggcttc agagacaact ttatcgggct catgtactac 960

aacagcactg gcaatatggg tgtactggcc ggtcaggcct cccagctgaa tgctgtggtg 1020

gacttgcagg acagaaacac tgaactgtcc taccagctct tgcttgactc tctgggtgac 1080

agaaccaggt atttcagtat gtggaatcag gcggtggaca gctatgaccc cgatgtgcgc 1140

attattgaaa atcacggtgt ggaggatgaa ctccccaact attgcttccc tttgaatggt 1200

gtgggcttta cagatacatt ccagggaatt aaggttaaaa ctacaaataa cggaacagca 1260

aatgctacag agtgggaatc tgatacctct gtcaataatg ctaatgagat tgccaagggc 1320

aatcctttcg ccatggagat caacatccag gccaacctgt ggcggaactt cctctacgcg 1380

aacgtggcgc tgtacctgcc cgactcctac aagtacacgc cggccaacat cacgctgccc 1440

accaacacca acacctacga ttacatgaac ggccgcgtgg tggcgccctc gctggtggac 1500

gcctacatca acatcggggc gcgctggtcg ctggacccca tggacaacgt caaccccttc 1560

aaccaccacc gcaacgcggg cctgcgctac cgctccatgc tcctgggcaa cgggcgctac 1620

gtgcccttcc acatccaggt gccccaaaag tttttcgcca tcaagagcct cctgctcctg 1680

cccgggtcct acacctacga gtggaacttc cgcaaggacg tcaacatgat cctgcagagc 1740

tccctcggca acgacctgcg cacggacggg gcctccatcg ccttcaccag catcaacctc 1800

tacgccacct tcttccccat ggcgcacaac accgcctcca cgctcgaggc catgctgcgc 1860

aacgacacca acgaccagtc cttcaacgac tacctctcgg cggccaacat gctctacccc 1920

atcccggcca acgccaccaa cgtgcccatc tccatcccct cgcgcaactg ggccgccttc 1980

cgcggatggt ccttcacgcg cctcaagacc cgcgagacgc cctcgctcgg ctccgggttc 2040

gacccctact tcgtctactc gggctccatc ccctacctcg acggcacctt ctacctcaac 2100

cacaccttca agaaggtctc catcaccttc gactcctccg tcagctggcc cggcaacgac 2160

cgcctcctga cgcccaacga gttcgaaatc aagcgcaccg tcgacggaga ggggtacaac 2220

gtggcccagt gcaacatgac caaggactgg ttcctggtcc agatgctggc ccactacaac 2280

atcggctacc agggcttcta cgtgcccgag ggctacaagg accgcatgta ctccttcttc 2340

cgcaacttcc agcccatgag ccgccaggtc gtggacgagg tcaactacaa ggactaccag 2400

gccgtcaccc tggcctacca gcacaacaac tcgggcttcg tcggctacct cgcgcccacc 2460

atgcgccagg gccagcccta ccccgccaac tacccctacc cgctcatcgg caagagcgcc 2520

gtcgccagcg tcacccagaa aaagttcctc tgcgaccggg tcatgtggcg catccccttc 2580

tccagcaact tcatgtccat gggcgcgctc accgacctcg gccagaacat gctctacgcc 2640

aactccgccc acgcgctaga catgaatttc gaagtcgacc ccatggatga gtccaccctt 2700

ctctatgttg tcttcgaagt cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc 2760

atcgaggccg tctacctgcg cacgcccttc tcggccggca acgccaccac ctaa 2814

<210> 41

<211> 2814

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<220>

<221> misc_特征

<222> (297)..(297)

<223> n是a, c, g,或t

<220>

<221> misc_特征

<222> (360)..(360)

<223> n是a, c, g,或t

<220>

<221> misc_特征

<222> (887)..(887)

<223> n是a, c, g,或t

<400> 41

atggccaccc catcgatgct gccccagtgg gcgtacatgc acatcgccgg acaggacgct 60

tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcagt 120

ctggggaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgc 180

agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg aggacaacac ctactcgtac 240

aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc tggacatggc cagcacntac 300

tttgacatcc gcggcgtgct ggatcggggc cccagcttca aaccctactc cggcaccgcn 360

tacaacagcc tggctcccaa gggagcgccc aacacctcac agtggataac caaagacaat 420

ggaactgata agacatacag ttttggaaat gctccagtca gaggattgga cattacagaa 480

gagggtctcc aaataggaac cgatgagtca gggggtaaaa gcaagaaaat ttttgcagac 540

aaaacctatc agcctgaacc tcagcttgga gatgaggaat ggcatgatac tattggagct 600

gaagacaagt atggaggcag agcgcttaaa cctgccacca acatgaaacc ctgctatggg 660

tctttcgcca agccaactaa tgctaaggga ggtcaggcta aaagcagaac caaggacgat 720

ggcactactg agcctgatat tgacatggcc ttttttgacg atcgcagtca gcaagctagt 780

ttcagtccag aacttgtttt gtatactgag aatgtcgatc tggacacccc ggatacccac 840

attatttaca aacctggcac tgatgaaaca agttcttctt tcaactnggg tcagcagtcc 900

atgcccaaca gacccaatta cattggcttc agagacaact ttatcggact catgtactac 960

aacagcactg gcaatatggg tgtactggct ggacaggcct cccagctgaa tgctgtggtg 1020

gacttgcagg acagaaacac cgaactgtcc taccagctct tgcttgactc tctgggcgac 1080

agaaccaggt atttcagtat gtggaatcag gcggtggaca gctatgaccc cgatgtgcgc 1140

attattgaaa atcacggtgt ggaggatgaa cttcccaact attgcttccc tttgaatggt 1200

gtgggcttta cagatacatt ccagggaatt aaggttaaaa ctaccaataa cggaacagca 1260

aacgctacag agtgggaatc tgatacctct gtcaataatg ctaatgagat tgccaagggc 1320

aatcctttcg ccatggagat caacatccag gccaacctgt ggcggaactt cctctacgcg 1380

aacgtggcgc tgtacctgcc cgactcctac aagtacacgc cggccaacat cacgctgccc 1440

accaacacca acacctacga ttacatgaac ggccgcgtgg tggcgccctc gctggtggac 1500

gcctacatca acatcggggc gcgctggtcg ctggacccca tggacaacgt caaccccttc 1560

aaccaccacc gcaacgcggg cctgcgatac cgctccatgc tcctgggcaa cgggcgctac 1620

gtgcccttcc acatccaggt gccccaaaag tttttcgcca tcaagaacct cctgctcctg 1680

cccgggtcct acacctacga gtggaacttc cgcaaggacg tcaacatgat cctgcagagc 1740

tccctcggca acgacctgcg cacggacggg gcctccatcg ccttcaccag catcaacctc 1800

tacgccacct tcttccccat ggcgcacaac accgcctcca cgctcgaggc catgctgcgc 1860

aacgacacca acgaccagtc cttcaacgac tacctctcgg cggccaacat gctctacccc 1920

atcccggcca acgccaccaa cgtgcccatc tccatcccct cgcgcaactg ggccgccttc 1980

cgcggatggt ccttcacgcg cctcaagacc cgcgagacgc cctcgctcgg ctccgggttt 2040

gacccctact tcgtctactc gggctccatc ccctacctcg acggcacctt ctacctcaac 2100

cacaccttca agaaggtctc catcaccttc gactcctccg tcagctggcc cggcaacgac 2160

cgcctcctga cgcccaacga gttcgaaatc aagcgcaccg tcgacggaga ggggtacaac 2220

gtggcccagt gcaacatgac caaggactgg ttcctggtcc agatgctggc ccactacaac 2280

atcggctacc agggcttcta cgtgcccgag ggctacaagg accgcatgta ctccttcttc 2340

cgcaacttcc agcccatgag ccgccaggtc gtggacgagg tcaactacaa ggactaccag 2400

gccgtcaccc tggcctacca gcacaacaac tcgggcttcg tcggctacct cgcgcccacc 2460

atgcgccagg gccagcccta ccccgccaac tacccctacc cgctcatcgg caagagcgcc 2520

gttgccagcg tcacccagaa aaagttcctc tgcgaccggg tcatgtggcg catccccttc 2580

tccagcaact tcatgtccat gggcgcgctc accgacctcg gccagaacat gctctacgcc 2640

aactccgccc acgcgctaga catgaatttc gaagtcgacc ccatggatga gtccaccctt 2700

ctctatgttg tcttcgaagt cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc 2760

atcgaggccg tctacctgcg cacgcccttc tcggccggca acgccaccac ctaa 2814

<210> 42

<211> 2814

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<220>

<221> misc_特征

<222> (1612)..(1612)

<223> n是a, c, g,或t

<400> 42

atggccaccc catcgatgct gccccagtgg gcgtacatgc acatcgccgg acaggacgct 60

tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcagt 120

ctggggaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgc 180

agccagcgac tgacgctgcg cttcgtgccc gtggaccgcg aggacaacac ctactcgtac 240

aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc tggacatggc cagcacctac 300

tttgacatcc gcggcgtgct ggaccggggc cctagcttca aaccctactc cggcaccgcc 360

tacaacagcc tggcccccaa gggagcaccc aacacctcac agtgggtgac caaagacaat 420

gggactgata aaacatacag ctttggtaat gctcctgtca gaggcttgga cattacagaa 480

gagggtctcc aaataggaac cgatgactct tcaaccgaaa gcaagaaaat ttttgcagac 540

aaaacatatc agcctgaacc tcaggttgga gatgaggaat ggcatgacac cattggggct 600

gaagacaaat atggaggcag agctcttaaa cctgccacca acatgaaacc ctgttatggt 660

tcttttgcca agccaactaa tgctaaggga ggtcaggcta aaaccagaac caaagacgat 720

ggaactaccg agcctgatat tgacatggcc ttctttgacg atcgcagtca gcaggctagt 780

ttcagcccag aacttgtttt gtatactgag aatgtggatt tggagacccc agatacccac 840

attatttaca aacccggtac tgatgaaaca agttcttctt tcaacttggg tcagcaatcc 900

atgcccaaca gacccaacta cattggtttc agagacaact ttattggctt gatgtactac 960

aacagcactg gcaacatggg tgtgctggct ggtcaggctt ctcagctgaa tgccgtggtt 1020

gacttgcaag acagaaacac cgagctgtcc taccagctct tgcttgactc tctgggcgac 1080

agaacccggt atttcagtat gtggaatcag gcggtggaca gctatgatcc tgatgtgcgc 1140

attattgaaa accatggtgt ggaagatgaa ctgccaaact attgcttccc tttaaatggt 1200

gtgggcttta cagacacatt ccagggaatt aaggttaaaa ctaccaacaa cggtactgct 1260

aatgctacag agtgggaatc tgatacttct gtcaataatg ccaatgagat tgccaagggt 1320

aatccattcg ccatggaaat caacatccaa gccaacctgt ggaggaactt cctctatgcc 1380

aacgtggccc tgtacttgcc cgattcttac aagtacacgc cggccaacgt caccctgccc 1440

accaacacca acacctacga gtacatgaac ggccgggtgg tggcgccctc gctggtggac 1500

tcctacatca acatcggggc gcgctggtcg ctggacccca tggacaacgt caatcccttc 1560

aaccaccacc gcaatgcggg gctgcgctac cgctccatgc tcctgggcaa cnggcgcttc 1620

gtgcccttcc acatccaggt gccccagaaa tttttcgcca tcaagagcct cctgctcctg 1680

cccgggtcct acacctacga gtggaacttc cgcaaggacg tcaacatgat cctgcagagc 1740

tccctcggca acgacctgcg cacggacggg gcctccatct ccttcaccag catcaacctc 1800

tacgccacct tcttccccat ggcgcacaac acggcctcca ctctcgaggc catgctgcgc 1860

aacgacacca acgaccagtc cttcaacgac tacctctcgg cggccaacat gctctacccc 1920

atcccggcca acgccaccaa cgtgcccatc tccatcccct cgcgcaactg ggccgccttc 1980

cgcggctggt ccttcacgcg cctcaagacc aaggagacgc cctcgctggg ctccgggttc 2040

gacccctact tcgtctactc gggctccatc ccctacctcg acggcacctt ctacctcaac 2100

cacaccttca agaaggtctc catcaccttc gactcctccg tcagctggcc cggcaacgac 2160

cggctcctga cgcccaacga gttcgaaatc aagcgcaccg tcgacggcga gggatacaac 2220

gtggcccagt gcaacatgac caaggactgg ttcctggtcc agatgctggc ccactacaac 2280

atcggctacc agggcttcta cgtgcccgag ggctacaagg accgcatgta ctccttcttc 2340

cgcaacttcc agcccatgag ccgccaggtg gtggacgagg tcaactacaa ggactaccag 2400

gccgtcaccc tggcctacca gcacaacaac tcgggcttcg tcggctacct cgcgcccacc 2460

atgcgtcagg gccagcccta ccccgccaac tacccctacc cgctcatcgg caagagcgcc 2520

gtcaccagcg tcacccagaa aaagttcctc tgcgaccgcg tcatgtggcg catccccttc 2580

tccagcaact tcatgtccat gggcgcgctc accgacctcg gccagaacat gctctatgcc 2640

aactccgccc acgcgctaga catgaatttc gaagtcgacc ccatggatga gtccaccctt 2700

ctctatgttg tcttcgaagt cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc 2760

atcgaggccg tctacctgcg cacccccttc tcggccggta acgccaccac ctaa 2814

<210> 43

<211> 2886

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 43

atggcgaccc catcgatgat gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc 60

tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccaccgacag ctacttcagc 120

ctgagtaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgg 180

tcccagcgcc tgacgctgcg gttcatcccc gtggaccgcg aggacaccgc gtactcttac 240

aaggcgcggt tcaccctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacctac 300

tttgacatcc gcggcgtgct ggacaggggc cccaccttca agccctactc cggcaccgcc 360

tacaactccc tggcccccaa gggcgccccc aactcctgcg agtgggagca agtggagcca 420

gctgaagagg cagcagaaaa tgaagatgaa gaagaagaag aggatgttgt tgatcctcag 480

gaacaggagc ccactactaa aacacatgta tatgctcaag ctcccctttc tggcgagaaa 540

attaccaaag atggtctgca aataggaact gaggctacgg cagcaggagg cactaaagac 600

ttatttgcag accctacatt ccagccagaa ccccaagttg gcgaatctca gtggaatgag 660

gcggatgcta cagcagctgg aggtagagtg ctcaaaaaga ccactcccat gaaaccttgc 720

tatggctcat atgcccgccc cacaaatgcc aatgggggcc aaggtgtgct aaaggcaaat 780

gcccagggag tgctcgagtc tcaggttgag atgcagttct tttccacttc tacaaatgcc 840

acaaacgagc aaaacaacat ccagcccaaa ttggtgctgt acagcgagga tgtgcatatg 900

gagaccccag acacacacat ctcctacaag cctacaaaaa gcgatgataa ttcaaaagtc 960

atgctgggtc agcagtccat gcccaacagg ccaaattaca tcgccttcag agacaacttt 1020

atcgggctca tgtattataa cagcactggc aacatggggg tgctggcagg tcaggcctca 1080

cagttgaatg cagtggtgga cctgcaagac agaaacacag aactgtccta ccagctcttg 1140

cttgattcca tgggagacag aaccagatac ttttccatgt ggaatcaggc cgtggacagt 1200

tatgacccag atgtcagaat tattgaaaat catggaaccg aagatgagct gcccaactat 1260

tgtttccctc tgggaggcat agggataact gacacttacc aggccattaa gactaatggc 1320

aatggggcag gagatcaagc caccacgtgg cagaaagact cacaatttgc agaccgcaac 1380

gaaatagggg tgggaaacaa cttcgccatg gagatcaacc tcagtgccaa cctgtggagg 1440

aacttcctct actccaacgt ggccctgtac ctgccagaca agcttaagta caacccctcc 1500

aacgtggaaa tctctgacaa ccccaacacc tacgactaca tgaacaagcg agtggtggcc 1560

ccggggctgg tggactgcta catcaacctg ggcgcgcgct ggtccctgga ctacatggac 1620

aacgtcaacc ccttcaacca ccaccgcaat gcgggcctgc gctaccgctc catgcttctg 1680

ggcaacgggc gctacgtgcc cttccacatc caggtgcccc agaagttctt tgccatcaag 1740

aacctcctcc tcctgccggg ctcctacacc tacgagtgga acttcaggaa ggatgtcaac 1800

atggtcctgc agagctctct gggcaacgac ctcagggtcg acggggccag catcaagttc 1860

gagagcatct gcctctacgc caccttcttc cccatggccc acaacacggc ctccacgctc 1920

gaggccatgc tcaggaacga caccaacgac cagtccttca acgactacct ctccgccgcc 1980

aacatgctct accccatccc cgccaacgcc accaacgtcc ccatctccat cccctcgcgc 2040

aactgggcgg ccttccgcgg ctgggccttc acccgcctta agaccaagga gaccccctcc 2100

ctgggctcgg gtttcgaccc ctactacacc tactcgggct ccatacccta cctggacgga 2160

accttctacc tcaaccacac tttcaagaag gtctcggtca ccttcgactc ctcggtcagc 2220

tggccgggca acgaccgcct gctcaccccc aacgagttcg agatcaagcg ctcggtcgac 2280

ggggagggct acaacgtagc ccagtgcaac atgaccaagg actggttcct catccagatg 2340

ctggccaact acaacatcgg ctatcagggc ttctacatcc cagagagcta caaggacagg 2400

atgtactcct tctttaggaa cttccagccc atgagccggc aggtggtgga cgaaaccaag 2460

tacaaggact accagcaggt gggcatcatc caccagcaca acaactcggg cttcgtgggc 2520

tacctcgccc ccaccatgcg cgagggacag gcctaccccg ccaacttccc ctacccgctc 2580

attggcaaga ccgcggtcga cagcatcacc cagaaaaagt tcctctgcga ccgcaccctc 2640

tggcgcatcc ccttctccag caacttcatg tccatgggtg cgctcacgga cctgggccag 2700

aacctgctct atgccaactc cgcccacgcg ctcgacatga ccttcgaggt cgaccccatg 2760

gacgagccca cccttctcta tgttctgttc gaagtctttg acgtggttcg ggtccaccag 2820

ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc 2880

accacc 2886

<210> 44

<211> 1596

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 44

atgatgaggc gcgtgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag 60

gcggtggcgg cggcgatgca gcccccgctg gaggcgcctt acgtgccccc gcggtacctg 120

gcgcctacgg aggggcggaa cagcattcgt tactcggagc tggcaccctt gtacgatacc 180

acccggttgt acctggtgga caacaagtcg gcggacatcg cctcgctgaa ctaccagaac 240

gaccacagca acttcctgac caccgtggtg cagaacaacg atttcacccc cacggaggcc 300

agcacccaga ccatcaactt tgacgagcgc tcgcggtggg gcggccagct gaaaaccatc 360

atgcacacca acatgcccaa cgtgaacgag ttcatgtaca gcaacaagtt caaggcgcgg 420

gtgatggtct cgcgcaagac ccccaacggg gtcgcggtag gggatgatta tgatggtggt 480

caggacgagc tgacctacga gtgggtggag tttgagctgc ccgagggcaa cttctcggtg 540

accatgacca tcgatctgat gaacaacgcc atcatcgaca actacttggc ggtggggcgg 600

cagaacgggg tgctggagag cgacatcggc gtgaagttcg acacgcgcaa cttccggctg 660

ggctgggacc ccgtgaccga gctggtgatg ccgggcgtgt acaccaacga ggccttccac 720

cccgacattg tcctgctgcc cggctgcggc gtggacttca ccgagagccg cctcagcaac 780

ctgctgggca tccgcaagcg gcagcccttc caggagggct tccagatcct gtacgaggac 840

ctggaggggg gcaacatccc cgcgctcttg gatgtcgaag cctacgagaa aagcaaggag 900

gagagcgccg ccgcggcgac cgcagccgta gccaccgcct ctaccgaggt gcggggcgat 960

aattttgcta gcgccgcagc agtggccgag gcggctgaaa ccgaaagtaa gatagtgatc 1020

cagccggtgg agaaggacag caaggacagg agctacaacg tgctcgcgga caagaaaaac 1080

accgcctacc gcagctggta cctggcctac aactacggcg accccgagaa gggcgtgcgc 1140

tcctggacgc tgctcaccac ctcggacgtc acctgcggcg tggagcaagt ctactggtcg 1200

ctgcccgaca tgatgcaaga cccggtcacc ttccgctcca cgcgtcaagt tagcaactac 1260

ccggtggtgg gcgccgagct cctgcccgtc tactccaaga gcttcttcaa cgagcaggcc 1320

gtctactcgc agcagctgcg cgccttcacc tcgctcacgc acgtcttcaa ccgcttcccc 1380

gagaaccaga tcctcgtccg cccgcccgcg cccaccatta ccaccgtcag tgaaaacgtt 1440

cctgctctca cagatcacgg gaccctgccg ctgcgcagca gtatccgggg agtccagcgc 1500

gtgaccgtca ctgacgccag acgccgcacc tgcccctacg tctacaaggc cctgggcgta 1560

gtcgcgccgc gcgtcctctc gagccgcacc ttctaa 1596

<210> 45

<211> 1626

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 45

atgatgaggc gcgtgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag 60

gcggtggcgg tggcgatgca gcccccgctg gaggcgcctt acgtgccccc gcggtacctg 120

gcgcctacgg aggggcggaa cagcattcgt tactcggagc tggcaccctt gtacgatacc 180

acccggttgt acctggtgga caacaagtcg gcggacatcg cctcgctgaa ctaccagaac 240

gaccacagca acttcctgac caccgtggtg cagaacaacg atttcacccc cacggaggcc 300

agcacccaga ccatcaactt tgacgagcgc tcgcggtggg gcggccagct gaaaaccatc 360

atgcacacca acatgcccaa cgtgaacgag ttcatgtaca gcaacaagtt caaggcgcgg 420

gtgatggtct cgcgcaagac ccccaacggg gtgacggtag gggatgatta tgatggtagt 480

caggacgagc tgacctacga gtgggtggag tttgagctgc ctgagggcaa cttctcggtg 540

accatgacca tcgatctgat gaacaacgcc atcatcgaca actacttggc ggtggggcgg 600

cagaacgggg tgctggaaag cgacatcggc gtgaagttcg acacgcgcaa cttccggctg 660

ggctgggacc ccgtgaccga gctggtgatg ccgggcgtgt acaccaacga ggccttccac 720

cccgacatcg tcctgctgcc cggctgcggc gtggacttca ccgagagccg cctcagcaac 780

ctgctgggca tccgcaagcg gcagcccttc caggagggct tccagatcct gtacgaggac 840

ctggaggggg gcaacatccc cgcgctcttg gatgtcgaag cctatgagaa aagcaaggag 900

gatagcgccg cagcgacgac cgcagccgtg gctactgccg cgaccaccga tgcagatgca 960

actactacca ggggcgatac atttgccacc caggcggagg aagcagccgc cctagcggcg 1020

accgatgata gtgaaagtaa gatagtcatc aagccggtgg agaaggacag caaggacagg 1080

agctacaacg tgctcgcgga caagaaaaac accgcctacc gcagctggta cctggcctac 1140

aactacggcg accccgagaa gggcgtgcgc tcctggacgc tgctcaccac ctcggacgtc 1200

acctgcggcg tggagcaagt ctactggtcg ctgcccgaca tgatgcaaga cccggtcacc 1260

ttccgctcca cgcgtcaagt tagcaactac ccggtggtgg gcgccgagct cctgcccgtc 1320

tactccaaga gcttcttcaa cgagcaggcc gtctactcgc agcagctgcg cgccttcacc 1380

tcgctcacgc acgtcttcaa ccgcttcccc gagaaccaga tcctcgttcg cccgcccgcg 1440

cccaccatta ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gaccctgccg 1500

ctgcgcagca gtatccgggg agtccagcgc gtgaccgtca ctgacgccag acgccgcacc 1560

tgcccctacg tctacaaggc cctgggcgta gtcgcgccgc gcgtcctctc gagccgcacc 1620

ttctaa 1626

<210> 46

<211> 1599

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 46

atgatgaggc gcgtgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag 60

gcggtggcgg cggcgatgca gcccccgctg gaggcgcctt acgtgccccc gcggtacctg 120

gcgcctacgg aggggcggaa cagcattcgt tactcggagc tggcaccctt gtacgatacc 180

acccggttgt acctggtgga caacaagtcg gcggacatcg cctcgctgaa ctaccagaac 240

gaccacagca acttcctgac caccgtggtg cagaacaacg atttcacccc cacggaggcc 300

agcacccaga ccatcaactt tgacgagcgc tcgcggtggg gcggccagct gaaaaccatc 360

atgcacacca acatgcccaa cgtgaacgag ttcatgtaca gcaacaagtt caaggcgcgg 420

gtgatggtct cgcgcaagac ccccaacggg gtcacagtaa cagatggtag tcaggacgag 480

ctgacctacg agtgggtgga gtttgagctg cccgagggca acttctcggt gaccatgacc 540

atcgatctga tgaacaacgc catcatcgac aactacttgg cggtggggcg gcagaacggg 600

gtgctggaga gcgacatcgg cgtgaagttc gacacgcgca acttccggct gggctgggac 660

cccgtgaccg agctggtgat gccgggcgtg tacaccaacg aggccttcca ccccgacatc 720

gtcctgctgc ccggctgcgg cgtggacttc accgagagcc gcctcagcaa cctgctgggc 780

atccgcaagc ggcagccctt ccaggagggc ttccagatcc tgtacgagga cctggagggg 840

ggcaacatcc ccgcgctctt ggatgtcgaa gcctacgaga aaagcaagga ggatagcacc 900

gccgtggcta ccgccgcgac tgtggcagat gccactgtca ccaggggcga tacattcgcc 960

acccaggcgg aggaagcagc cgccctagcg gcgaccgatg atagtgaaag taagatagtt 1020

atcaagccgg tggagaagga cagcaaggac aggagctaca acgttctatc ggatggaaag 1080

aacaccgcct accgcagctg gtacctggcc tacaactacg gcgaccccga gaagggcgtg 1140

cgctcctgga cgctgctcac cacctcggac gtcacctgcg gcgtggagca agtctactgg 1200

tcgctgcccg acatgatgca agacccggtc accttccgct ccacgcgtca agttagcaac 1260

tacccggtgg tgggcgccga gctcctgccc gtctactcca agagcttctt caacgagcag 1320

gccgtctact cgcagcagct gcgcgccttc acctcgctca cgcacgtctt caaccgcttc 1380

cccgagaacc agatcctcgt ccgcccgccc gcgcccacca ttaccaccgt cagtgaaaac 1440

gttcctgctc tcacagatca cgggaccctg ccgctgcgca gcagtatccg gggagtccag 1500

cgcgtgaccg tcactgacgc cagacgccgc acctgcccct acgtctacaa ggccctgggc 1560

gtagtcgcgc cgcgcgtcct ctcgagccgc accttctaa 1599

<210> 47

<211> 1587

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 47

atgatgaggc gcgtgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag 60

gcggtggcgg cggcgatgca gcccccgctg gaggcgcctt acgtgccccc gcggtacctg 120

gcgcctacgg aggggcggaa cagcattcgt tactcggagc tggcaccctt gtacgatacc 180

acccggttgt acctggtgga caacaagtcg gcggacatcg cctcgctgaa ctaccagaac 240

gaccacagca acttcctgac caccgtggtg cagaacaacg atttcacccc cacggaggcc 300

agcacccaga ccatcaactt tgacgagcgc tcgcggtggg gcggccagct gaaaaccatc 360

atgcacacca acatgcccaa cgtgaacgag ttcctgtaca gcaacaagtt caaggcgcgg 420

gtgatggtct cgcgcaagac ccccaacggg gtcacagtaa cagatggtag tcaggacgag 480

ctgacctacg agtgggtgga gtttgagctg cccgagggca acttctcggt gaccatgacc 540

atcgatctga tgaacaacgc cattatcgac aattacttgg cggtggggcg gcagaacggg 600

gtgctggaga gcgacatcgg cgtgaagttc gacacgcgca acttcaggct cggttgggac 660

cccgtgaccg agctggtcat gccgggcgtg tacaccaacg aggccttcca ccccgacatc 720

gtcctgctgc ccggctgcgg cgtggacttc accgagagcc gcctcagcaa cctgctgggc 780

attcgcaaga ggcagccctt ccaggagggt ttccagatca tgtacgagga tctggagggg 840

ggcaacatcc ccgcgctcct ggatgtcgag gcctacgaga aaagcaagga ggatagcgcc 900

gccgcggcga ccgcagccgt ggccaccgcc tctaccgagg tgcggggcga taattttgct 960

agcgccgcgg cagtggccga ggcggctgaa accgaaagta agatagtgat ccagccggtg 1020

gagaaggaca gcaaggacag gagctacaac gtgctcgcgg acaagaaaaa caccgcctac 1080

cgcagctggt acctggccta caactacggc gaccccgaga agggcgtgcg ctcctggacg 1140

ctgctcacca cctcggacgt cacctgcggc gtggagcaag tctactggtc gctgcccgac 1200

atgatgcaag acccggtcac cttccgctcc acgcgtcaag ttagcaacta cccggtggtg 1260

ggcgccgagc tcctgcccgt ctactccaag agcttcttca acgagcaggc cgtctactcg 1320

cagcagctgc gcgccttcac ctcgctcacg cacgtcttca accgcttccc cgagaaccag 1380

atcctcgtcc gcccgcccgc gcccaccatt accaccgtca gtgaaaacgt tcctgctctc 1440

acagatcacg ggaccctgcc gctgcgcagc agtatccggg gagtccagcg cgtgaccgtc 1500

actgacgcca gacgccgcac ctgcccctac gtctacaagg ccctgggcgt agtcgcgccg 1560

cgcgtcctct cgagccgcac cttctaa 1587

<210> 48

<211> 1608

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 48

atgatgaggc gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag 60

gcgatggcgg cggcggcggc gatgcagccc ccgctggagg ctccttacgt gcccccgcgg 120

tacctggcgc ctacggaggg gcggaacagc attcgttact cggagctggc acccttgtac 180

gataccaccc ggttgtacct ggtggacaac aagtcggcgg acatcgcctc gctgaactac 240

cagaacgacc acagcaactt cctgaccacc gtggtgcaga acaatgactt cacccccacg 300

gaggccagca cccagaccat caactttgac gagcgctcgc ggtggggcgg ccagctgaaa 360

accatcatgc acaccaacat gcccaacgtg aacgagttca tgtacagcaa caagttcaag 420

gcgcgggtca tggtctcccg caagaccccc aacggggtga cagtgacaga ggattatgat 480

ggtagtcagg atgagctgaa atacgagtgg gtggagtttg agctgcccga aggcaacttc 540

tcggtgacca tgactatcga cctgatgaac aacgccatca tcgacaatta cttggcggtg 600

gggcggcaga acggggtgct ggagagcgac atcggcgtga agttcgacac taggaacttc 660

aggctgggct gggaccccgt gaccgagctg gtcatgcccg gggtgtacac caacgaggcc 720

ttccatcccg atattgtctt gctgcccggc tgcggggtgg acttcaccga gagccgcctc 780

agcaacctgc tgggcattcg caagaggcag cccttccagg agggcttcca gatcatgtac 840

gaggatctgg aggggggtaa catccccgcg ctcctggatg tcgacgccta tgagaaaagc 900

aaggaggaga gcgccgccgc ggcgaccgca gccgtagcca ccgcctctac cgaggtcagg 960

ggcgataatt ttgctagcgc cgcagcagtg gcagcggccg aggcggctga aaccgaaagt 1020

aagatagtca ttcagccggt ggagaaggat agcaaagaca ggagctacaa cgtgctgccg 1080

gacaagataa acaccgccta ccgcagctgg tacctggcct acaactatgg cgaccccgag 1140

aagggcgtgc gctcctggac gctgctcacc acctcggacg tcacctgcgg cgtggagcaa 1200

gtctactggt cgctgcccga catgatgcaa gacccggtca ccttccgctc cacgcgtcaa 1260

gttagcaact acccggtggt gggcgccgag ctcctgcccg tctactccaa gagcttcttc 1320

aacgagcagg ccgtctactc gcagcagctg cgcgccttca cctcgctcac gcacgtcttc 1380

aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg cgcccaccat taccaccgtc 1440

agtgaaaacg ttcctgctct cacagatcac gggaccctgc cgctgcgcag cagtatccgg 1500

ggagtccagc gcgtgaccgt tactgacgcc agacgccgca cctgccccta cgtctacaag 1560

gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca ccttctaa 1608

<210> 49

<211> 1743

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 49

atgcggcgcg cggcgatgta ccacgaggga cctcctccct cttatgagag cgtggtgggc 60

gcggcggcgg cctctccctt tgcgtcgcag ctggagccgc cgtacgtgcc tccgcggtac 120

ctgcggccta cggggggaag aaacagcatc cgttactcgg agctggcgcc cctgtacgac 180

accacccggg tgtacctggt ggacaacaag tcggcggacg tggcctccct gaactaccag 240

aacgaccaca gcaatttttt gaccacggtc atccagaaca atgactacac cccgagcgag 300

gccagcaccc agaccatcaa tctggatgac cggtcgcact ggggcggcga cctgaaaacc 360

atcctgcaca ccaacatgcc caacgtgaac gagttcatgt tcaccaataa gttcaaggcg 420

cgggtgatgg tgtcgcgctc gcacaccaag gacgaccggg tggagctgaa gtacgagtgg 480

gtagagttcg agctgcccga gggcaactac tcggagacca tgaccataga cctgatgaac 540

aacgcgatcg tggagcacta tctgaaagtg ggcaggcaga acggggtcct ggagagcgac 600

atcggggtca agttcgacac caggaacttc cgcctggggc tggacccggt caccgggctg 660

gttatgcccg gggtctacac caacgaggcc ttccaccccg acatcatcct gctgcccggc 720

tgcggggtgg acttcaccta cagccgcctg agcaacctgc tgggcatccg caagcggcag 780

cccttccagg agggcttcag gatcacctac gaggacctgg aggggggcaa catccccgcg 840

ctcctggatg tggaggccta ccaggatagc ttgaaggaag aagaggcggg agagggcagc 900

ggcggtggcg ccggtcagga ggagggcggg gcctcctctg aggcctctgc ggacccagcc 960

gctgccgccg aggcggaggc ggccgacccc gcgatggtgg tagaggaaga gaaggatatg 1020

aacgacgagg cggtgcgcgg cgacaccttt gccactcggg gggaggagaa gaaagcggag 1080

gccgaggccg cggcagagga ggcggcagca gcggcggcgg cagtagaggc ggcggccgag 1140

gcggagaagc cccccaagga gcccgtgatt aagcccctga ccgaagatag caagaagcgc 1200

agttacaacg tgctcaagga cagcaccaac accgagtacc gcagctggta cctggcctac 1260

aactacggcg acccggcgac gggggtgcgc tcctggaccc tgctgtgtac gccggacgtg 1320

acctgcggct cggagcaggt gtactggtcg ctgcccgaca tgatgcaaga ccccgtgacc 1380

ttccgctcca cgcggcaggt cagcaacttc ccggtggtgg gcgccgagct gctgcccgtg 1440

cactccaaga gcttctacaa cgaccaggcc gtctactccc agctcatccg ccagttcacc 1500

tctctgaccc acgtgttcaa tcgctttcct gagaaccaga ttctggcgcg cccgcccgcc 1560

cccaccatca ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gacgctaccg 1620

ctgcgcaaca gcatcggagg agtccagcga gtgaccgtaa ctgacgccag acgccgcacc 1680

tgcccctacg tttacaaggc cctgggcata gtctcgccgc gcgtcctttc cagccgcact 1740

ttt 1743

<210> 50

<211> 577

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 50

Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro

1 5 10 15

Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro

20 25 30

Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser

35 40 45

Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu

50 55 60

Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser

65 70 75 80

Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn

85 90 95

Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu

100 105 110

Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr

115 120 125

Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu

130 135 140

Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln

145 150 155 160

Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Ser

165 170 175

Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Ser Ile Asp Met

180 185 190

Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Ala Leu Asn Ile Gly

195 200 205

Ala Pro Leu His Val Val Asp Thr Leu Asn Ala Leu Thr Val Val Thr

210 215 220

Gly Gln Gly Leu Thr Ile Asn Gly Arg Ala Leu Gln Thr Arg Val Thr

225 230 235 240

Gly Ala Leu Ser Tyr Asp Thr Glu Gly Asn Ile Gln Leu Gln Ala Gly

245 250 255

Gly Gly Met Arg Ile Asp Asn Asn Gly Gln Leu Ile Leu Asn Val Ala

260 265 270

Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly

275 280 285

Pro Leu Ile Val Asn Ser Ala His Asn Leu Asp Leu Asn Leu Asn Arg

290 295 300

Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val Asn

305 310 315 320

Ile Lys Thr Ala Lys Gly Leu Phe Tyr Asp Gly Thr Ala Ile Ala Ile

325 330 335

Asn Ala Gly Asp Gly Leu Gln Phe Gly Ser Gly Ser Asp Thr Asn Pro

340 345 350

Leu Gln Thr Lys Leu Gly Leu Gly Leu Glu Tyr Asp Ser Asn Lys Ala

355 360 365

Ile Ile Thr Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala

370 375 380

Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr Thr

385 390 395 400

Pro Asp Pro Ser Pro Asn Cys Arg Ile Asn Ser Glu Lys Asp Ala Lys

405 410 415

Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser Val

420 425 430

Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr Val

435 440 445

Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu Leu

450 455 460

Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly Asp

465 470 475 480

Ser Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro Asn

485 490 495

Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn Ile

500 505 510

Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Thr Lys Pro Met Thr Leu

515 520 525

Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val Ser

530 535 540

Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr Ile

545 550 555 560

Asn Asp Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Gln

565 570 575

Glu

<210> 51

<211> 955

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 51

Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr

65 70 75 80

Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Pro Cys Glu Trp Asp Glu Ala Val Thr Ala Val Asp Ile

130 135 140

Asn Leu Asp Glu Leu Gly Glu Asp Glu Asp Asp Ala Glu Gly Glu Ala

145 150 155 160

Glu Gln Gln Lys Ser His Val Phe Gly Gln Ala Pro Tyr Ser Gly Gln

165 170 175

Asn Ile Thr Lys Glu Gly Ile Gln Ile Gly Val Asp Thr Thr Ser Gln

180 185 190

Ala Gln Thr Pro Leu Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln

195 200 205

Val Gly Glu Ser Gln Trp Asn Glu Thr Glu Ile Asn Tyr Gly Ala Gly

210 215 220

Arg Val Leu Lys Lys Thr Thr Leu Met Lys Pro Cys Tyr Gly Ser Tyr

225 230 235 240

Ala Arg Pro Thr Asn Glu Asn Gly Gly Gln Gly Ile Leu Leu Glu Lys

245 250 255

Glu Gly Gly Lys Pro Glu Ser Gln Val Glu Met Gln Phe Phe Ser Thr

260 265 270

Thr Gln Ala Ala Ala Ala Gly Asn Ser Asp Asn Leu Thr Pro Lys Val

275 280 285

Val Leu Tyr Ser Glu Asp Val His Leu Glu Thr Pro Asp Thr His Ile

290 295 300

Ser Tyr Met Pro Thr Ser Asn Glu Ala Asn Ser Arg Glu Leu Leu Gly

305 310 315 320

Gln Gln Ala Met Pro Asn Arg Pro Asn Tyr Ile Ala Phe Arg Asp Asn

325 330 335

Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu

340 345 350

Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg

355 360 365

Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Met Gly Asp Arg

370 375 380

Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro

385 390 395 400

Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu Asp Glu Leu Pro Asn

405 410 415

Tyr Cys Phe Pro Leu Gly Gly Ile Ile Asn Thr Glu Thr Leu Thr Lys

420 425 430

Val Lys Pro Lys Thr Gly Gln Asp Ala Gln Trp Glu Lys Asp Thr Glu

435 440 445

Phe Ser Glu Lys Asn Glu Ile Arg Val Gly Asn Asn Phe Ala Met Glu

450 455 460

Ile Asn Leu Asn Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ser Asn Val

465 470 475 480

Ala Leu Tyr Leu Pro Asp Lys Leu Lys Tyr Thr Pro Ala Asn Val Gln

485 490 495

Ile Ser Ser Asn Ser Asn Ser Tyr Asp Tyr Met Asn Lys Arg Val Val

500 505 510

Ala Pro Gly Leu Val Asp Cys Tyr Ile Asn Leu Gly Ala Arg Trp Ser

515 520 525

Leu Asp Tyr Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala

530 535 540

Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro

545 550 555 560

Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu

565 570 575

Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val

580 585 590

Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Val Asp Gly

595 600 605

Ala Ser Ile Lys Phe Glu Ser Ile Cys Leu Tyr Ala Thr Phe Phe Pro

610 615 620

Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp

625 630 635 640

Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu

645 650 655

Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro Ser

660 665 670

Arg Asn Trp Ala Ala Phe Arg Gly Trp Ala Phe Thr Arg Leu Lys Thr

675 680 685

Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Tyr Thr Tyr

690 695 700

Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr

705 710 715 720

Phe Lys Lys Val Ser Val Thr Phe Asp Ser Ser Val Ser Trp Pro Gly

725 730 735

Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg Ser Val

740 745 750

Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp

755 760 765

Phe Leu Ile Gln Met Leu Ala Asn Tyr Asn Ile Gly Tyr Gln Gly Phe

770 775 780

Tyr Ile Pro Glu Ser Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn

785 790 795 800

Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Thr Lys Tyr Lys Asp

805 810 815

Tyr Gln Gln Val Gly Ile Ile His Gln His Asn Asn Ser Gly Phe Val

820 825 830

Gly Tyr Leu Ala Pro Thr Met Arg Glu Gly Gln Ala Tyr Pro Ala Asn

835 840 845

Phe Pro Tyr Pro Leu Ile Gly Lys Thr Ala Val Asp Ser Val Thr Gln

850 855 860

Lys Lys Phe Leu Cys Asp Arg Thr Leu Trp Arg Ile Pro Phe Ser Ser

865 870 875 880

Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Leu Leu

885 890 895

Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr Phe Glu Val Asp Pro

900 905 910

Met Asp Glu Pro Thr Leu Leu Tyr Val Leu Phe Glu Val Phe Asp Val

915 920 925

Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Thr Val Tyr Leu

930 935 940

Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr

945 950 955

<210> 52

<211> 582

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 52

Met Arg Arg Ala Ala Met Tyr His Glu Gly Pro Pro Pro Ser Tyr Glu

1 5 10 15

Ser Val Val Gly Ala Ala Ala Ala Ser Pro Phe Ala Ser Gln Leu Glu

20 25 30

Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr Gly Gly Arg Asn

35 40 45

Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Val

50 55 60

Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser Leu Asn Tyr Gln

65 70 75 80

Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln Asn Asn Asp Tyr

85 90 95

Thr Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp Arg Ser

100 105 110

His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn

115 120 125

Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala Arg Val Met Val

130 135 140

Ser Arg Ser His Thr Lys Asp Asp Arg Val Glu Leu Lys Tyr Glu Trp

145 150 155 160

Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile

165 170 175

Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu Lys Val Gly Arg

180 185 190

Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg

195 200 205

Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu Val Met Pro Gly

210 215 220

Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile Leu Leu Pro Gly

225 230 235 240

Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn Leu Leu Gly Ile

245 250 255

Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile Thr Tyr Glu Asp

260 265 270

Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Gln

275 280 285

Asn Ser Leu Lys Glu Glu Glu Ala Gly Glu Gly Ser Gly Gly Gly Gly

290 295 300

Ala Gly Gln Glu Glu Gly Gly Ala Ser Ser Glu Ala Ser Ala Asp Ala

305 310 315 320

Ala Ala Ala Glu Ala Glu Glu Ala Ala Asp Pro Ala Met Val Val Glu

325 330 335

Glu Glu Lys Asp Met Asn Asp Glu Ala Val Arg Gly Asp Thr Phe Ala

340 345 350

Thr Arg Gly Glu Glu Lys Lys Ala Glu Ala Glu Ala Ala Ala Glu Glu

355 360 365

Ala Ala Ala Ala Ala Ala Ala Val Glu Ala Ala Ala Glu Ala Glu Lys

370 375 380

Pro Pro Lys Glu Pro Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys

385 390 395 400

Arg Ser Tyr Asn Val Leu Lys Asp Ser Thr Asn Thr Glu Tyr Arg Ser

405 410 415

Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Ala Thr Gly Val Arg Ser

420 425 430

Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val

435 440 445

Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser

450 455 460

Thr Arg Gln Val Ser Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro

465 470 475 480

Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu

485 490 495

Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu

500 505 510

Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser

515 520 525

Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn

530 535 540

Ser Ile Gly Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg

545 550 555 560

Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val

565 570 575

Leu Ser Ser Arg Thr Phe

580

<210> 53

<211> 542

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 53

Met Lys Arg Ala Lys Thr Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro

1 5 10 15

Tyr Asp Thr Glu Asn Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro

20 25 30

Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser

35 40 45

Leu Arg Leu Ser Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu

50 55 60

Lys Met Gly Asn Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser

65 70 75 80

Gln Asp Val Thr Thr Val Thr Pro Pro Leu Lys Lys Thr Lys Thr Asn

85 90 95

Leu Ser Leu Gln Thr Ser Ala Pro Leu Thr Val Ser Ser Gly Ser Leu

100 105 110

Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu Thr

115 120 125

Met Gln Ser Gln Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Gly Leu

130 135 140

Ala Thr Gln Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Thr Leu Gln

145 150 155 160

Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val Gly

165 170 175

Thr Thr Pro Pro Ile Ser Val Ser Ser Gly Ser Leu Gly Leu Asp Met

180 185 190

Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile Gly

195 200 205

Gly Pro Leu Gln Val Val Asp Ser Leu His Thr Leu Thr Val Val Thr

210 215 220

Gly Asn Gly Ile Thr Val Ala Asn Asn Ala Leu Gln Thr Lys Val Ala

225 230 235 240

Gly Ala Leu Gly Tyr Asp Ser Ser Gly Asn Leu Glu Leu Arg Ala Ala

245 250 255

Gly Gly Met Arg Ile Asn Thr Gly Gly Gln Leu Ile Leu Asp Val Ala

260 265 270

Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln Gly

275 280 285

Pro Leu Tyr Val Asn Thr Asn His Asn Leu Asp Leu Asn Cys Asn Arg

290 295 300

Gly Leu Thr Thr Thr Thr Ser Ser Asn Thr Thr Lys Leu Glu Thr Lys

305 310 315 320

Ile Asp Ser Gly Leu Asp Tyr Asn Ala Asn Gly Ala Ile Ile Ala Lys

325 330 335

Leu Gly Thr Gly Leu Thr Phe Asp Asn Thr Gly Ala Ile Thr Val Gly

340 345 350

Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser

355 360 365

Pro Asn Cys Arg Ile His Ala Asp Lys Asp Cys Lys Phe Thr Leu Val

370 375 380

Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu Ala

385 390 395 400

Val Ser Gly Asn Leu Ser Ser Met Thr Gly Thr Val Ser Ser Val Thr

405 410 415

Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser Ser

420 425 430

Leu Asp Lys Glu Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn Ala

435 440 445

Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ser Ala Tyr

450 455 460

Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Glu Val

465 470 475 480

Tyr Leu His Gly Asp Lys Ser Lys Pro Met Ile Leu Thr Ile Thr Leu

485 490 495

Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr Ser

500 505 510

Met Ser Phe Thr Trp Ser Trp Asp Ser Gly Lys Tyr Ala Thr Glu Thr

515 520 525

Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln

530 535 540

<210> 54

<211> 964

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 54

Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser

1 5 10 15

Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala

20 25 30

Arg Ala Thr Asp Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro

35 40 45

Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu

50 55 60

Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr

65 70 75 80

Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met

85 90 95

Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr

100 105 110

Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly

115 120 125

Ala Pro Asn Ser Cys Glu Trp Glu Gln Glu Glu Thr Gln Thr Ala Glu

130 135 140

Glu Ala Gln Asp Glu Glu Glu Asp Glu Ala Glu Ala Glu Glu Glu Met

145 150 155 160

Pro Gln Glu Glu Gln Ala Pro Val Lys Lys Thr His Val Tyr Ala Gln

165 170 175

Ala Pro Leu Ser Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly

180 185 190

Thr Asp Ala Thr Ala Thr Glu Gln Lys Pro Ile Tyr Ala Asp Pro Thr

195 200 205

Phe Gln Pro Glu Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp

210 215 220

Ala Ser Val Ala Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Lys

225 230 235 240

Pro Cys Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln

245 250 255

Gly Val Leu Val Glu Lys Asp Gly Gly Lys Met Glu Ser Gln Val Asp

260 265 270

Met Gln Phe Phe Ser Thr Ser Glu Asn Ala Arg Asn Glu Ala Asn Asn

275 280 285

Ile Gln Pro Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr

290 295 300

Pro Asp Thr His Ile Ser Tyr Lys Pro Ala Lys Ser Asp Asp Asn Ser

305 310 315 320

Lys Val Met Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile

325 330 335

Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly

340 345 350

Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val

355 360 365

Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp

370 375 380

Ser Met Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val

385 390 395 400

Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu

405 410 415

Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Val Thr

420 425 430

Asp Thr Tyr Gln Ala Ile Lys Thr Asn Gly Asn Gly Asn Gly Gly Gly

435 440 445

Asn Thr Thr Trp Thr Lys Asp Glu Thr Phe Ala Asp Arg Asn Glu Ile

450 455 460

Gly Val Gly Asn Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu

465 470 475 480

Trp Arg Asn Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys

485 490 495

Leu Lys Tyr Asn Pro Ser Asn Val Glu Ile Ser Asp Asn Pro Asn Thr

500 505 510

Tyr Asp Tyr Met Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys

515 520 525

Tyr Ile Asn Leu Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val

530 535 540

Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met

545 550 555 560

Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln

565 570 575

Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr

580 585 590

Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser

595 600 605

Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser

610 615 620

Ile Cys Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser

625 630 635 640

Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn

645 650 655

Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala

660 665 670

Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg

675 680 685

Gly Trp Ala Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly

690 695 700

Ser Gly Phe Asp Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu

705 710 715 720

Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr

725 730 735

Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro

740 745 750

Asn Glu Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val

755 760 765

Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ala

770 775 780

Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys

785 790 795 800

Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln

805 810 815

Val Val Asp Glu Thr Lys Tyr Lys Asp Tyr Gln Gln Val Gly Ile Ile

820 825 830

His Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met

835 840 845

Arg Glu Gly Gln Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly

850 855 860

Lys Thr Ala Val Asp Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg

865 870 875 880

Thr Leu Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala

885 890 895

Leu Thr Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala

900 905 910

Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu

915 920 925

Tyr Val Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His

930 935 940

Arg Gly Val Ile Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly

945 950 955 960

Asn Ala Thr Thr

<210> 55

<211> 584

<212> PRT

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 55

Met Arg Arg Ala Ala Met Tyr His Glu Gly Pro Pro Pro Ser Tyr Glu

1 5 10 15

Ser Val Val Gly Ala Ala Ala Ala Ser Pro Phe Ala Ser Gln Leu Glu

20 25 30

Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr Gly Gly Arg Asn

35 40 45

Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Val

50 55 60

Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser Leu Asn Tyr Gln

65 70 75 80

Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln Asn Asn Asp Tyr

85 90 95

Thr Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp Arg Ser

100 105 110

His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn

115 120 125

Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala Arg Val Met Val

130 135 140

Ser Arg Ser His Thr Lys Asp Asp Arg Val Glu Leu Lys Tyr Glu Trp

145 150 155 160

Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile

165 170 175

Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu Lys Val Gly Arg

180 185 190

Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg

195 200 205

Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu Val Met Pro Gly

210 215 220

Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile Leu Leu Pro Gly

225 230 235 240

Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn Leu Leu Gly Ile

245 250 255

Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile Thr Tyr Glu Asp

260 265 270

Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Gln

275 280 285

Asp Ser Leu Lys Glu Glu Glu Ala Gly Glu Gly Ser Gly Gly Gly Gly

290 295 300

Gly Ala Gly Gln Glu Glu Gly Gly Ala Ser Ser Glu Ala Ser Ala Asp

305 310 315 320

Ala Ala Ala Ala Ala Glu Ala Glu Ala Ala Asp Pro Ala Met Val Val

325 330 335

Glu Glu Glu Lys Asp Met Asn Asp Glu Ala Val Arg Gly Asp Thr Phe

340 345 350

Ala Thr Arg Gly Glu Glu Lys Lys Ala Glu Ala Glu Ala Ala Ala Glu

355 360 365

Glu Ala Ala Ala Ala Ala Ala Ala Ala Val Glu Ala Ala Ala Glu Ala

370 375 380

Glu Lys Pro Pro Lys Glu Pro Val Ile Lys Ala Leu Thr Glu Asp Ser

385 390 395 400

Lys Lys Arg Ser Tyr Asn Val Leu Lys Asp Ser Thr Asn Thr Ala Tyr

405 410 415

Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Ala Thr Gly Val

420 425 430

Arg Ser Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys Gly Ser Glu

435 440 445

Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe

450 455 460

Arg Ser Thr Arg Gln Val Ser Asn Phe Pro Val Val Gly Ala Glu Leu

465 470 475 480

Leu Pro Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala Val Tyr Ser

485 490 495

Gln Leu Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe

500 505 510

Pro Glu Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr

515 520 525

Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu

530 535 540

Arg Asn Ser Ile Gly Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg

545 550 555 560

Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ser Pro

565 570 575

Arg Val Leu Ser Ser Arg Thr Phe

580

<210> 56

<211> 1734

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 56

atgaagcgcg ccaaaacgtc tgacgagacc ttcaaccccg tgtaccccta tgacacggaa 60

aacgggcctc cctccgtccc tttcctcacc cctcccttcg tgtcccccga cggatttcaa 120

gaaagccccc caggggtcct gtctctgcgc ctgtcagagc ccctggtcac ttcccacggc 180

atgcttgccc tgaaaatggg aaatggcctc tccctggatg acgccggcaa cctcacctct 240

caagatgtca ccaccgtcac ccctcccctc aaaaaaacca agaccaacct cagcctccag 300

acctcagccc ccctgaccgt tagctctggg tccctcaccg tcgcggccgc cgctccactg 360

gcggtggccg gcacctctct caccatgcaa tctcaggccc ccttgacagt gcaagatgca 420

aaactcggcc tggccaccca gggacccctg accgtgtctg aaggcaaact caccttgcag 480

acatcggctc cactgacggc cgctgacagc agcactctca ctgttagtgc cacacctccc 540

ctcagcacaa gcaatggtag tttgagcatt gacatgcagg ccccgattta taccaccaat 600

ggaaaactgg cacttaacat tggtgctccc ctgcatgtgg tagacaccct aaatgcacta 660

actgtagtaa ctggccaggg tcttaccata aatggaagag ccctgcaaac tagagtcacg 720

ggtgccctca gttatgacac agaaggcaac atccaactgc aagccggagg gggtatgcgc 780

attgacaata atggccaact tatccttaat gtagcttatc catttgatgc tcaaaacaac 840

ctcagcctta gacttggcca aggtccccta attgttaact ctgcccacaa cttggatctt 900

aaccttaaca gaggccttta cttatttaca tctggaaaca cgaaaaaact ggaagttaac 960

ataaaaacag ccaaaggtct attttacgat ggcaccgcta tagcaatcaa tgcaggtgac 1020

gggctacagt ttgggtctgg ttcagataca aatccattgc aaactaaact tggattgggg 1080

ctggaatatg actccaacaa agctataatc actaaacttg gaactggcct aagctttgac 1140

aacacaggtg ccatcacagt aggcaacaaa aatgatgaca agcttacctt gtggaccaca 1200

ccagacccct ccccaaactg cagaattaat tcagaaaaag atgctaaact cacactagtt 1260

ttgactaaat gcggcagcca ggtgttagcc agcgtttctg ttttatctgt aaaaggcagc 1320

cttgccccca tcagcggcac agtaactagc gcccagattg ttttaagatt tgatgaaaac 1380

ggagttttat tgagcaattc ttctcttgac ccccaatact ggaactatag aaaaggcgat 1440

tctacagaag gcactgcata tactaatgct gtgggattta tgcccaacct cacagcatac 1500

cctaaaacac agagccagac tgctaaaagc aacattgtaa gtcaagttta cttgaatggg 1560

gacaaaacaa aacccatgac cctaaccatc accctcaatg gaactaatga aacaggggat 1620

gctacagtaa gcacatactc catgtcattt tcatggaact ggaatggaag taattacatt 1680

aatgacacct tccaaaccaa ctcctttacc ttctcctaca tcgcccaaga ataa 1734

<210> 57

<211> 2868

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 57

atggcgaccc catcgatgat gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc 60

tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccaccgacag ctacttcagc 120

ctgagtaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgg 180

tcccagcgcc tgacgctgcg gttcatcccc gtggaccgcg aggacaccgc gtactcttac 240

aaggcgcggt tcaccctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacctac 300

tttgacatcc gcggcgtgct ggacaggggc cccaccttta agccctactc cggcactgcc 360

tacaactccc tggcccccaa gggcgccccc aacccctgtg agtgggatga agccgttact 420

gctgttgaca ttaacctgga tgagctcggc gaagatgaag acgacgccga aggggaagca 480

gaacagcaaa aaagtcatgt atttggtcaa gcgccctact caggacaaaa cattacgaag 540

gagggcatac aaattggggt agataccacc agccaagccc aaacaccttt atacgctgac 600

aaaacattcc aacccgaacc tcaggttgga gaatcccaat ggaatgagac agaaatcaat 660

tatggagcgg gacgagtgct aaaaaagacc accctcatga aaccatgcta tgggtcatat 720

gcaagaccta ctaatgaaaa cggcggtcag ggcatactgc tggagaaaga gggtggtaaa 780

ccagaaagtc aagttgaaat gcaatttttt tctactactc aggccgccgc ggctggtaat 840

tcagataatc ttactccaaa agttgttttg tatagcgagg atgttcacct ggaaacgcca 900

gatacacaca tttcatatat gcccactagc aacgaagcca attcaagaga actgttggga 960

caacaagcta tgcccaacag acccaactac attgccttca gagacaactt tattggcctt 1020

atgtattaca acagcactgg caacatggga gtgctggcag gtcaggcctc acagttgaat 1080

gcagtggtgg acttgcaaga cagaaacaca gaactgtcct accagctctt gcttgattcc 1140

atgggagaca gaaccagata cttttccatg tggaatcagg cggtggacag ttatgatcca 1200

gatgttagaa ttattgaaaa tcatggaact gaagatgagc tgcccaacta ttgtttcccc 1260

ctgggcggca taattaacac cgaaacttta actaaagtga aacctaagac tggacaagac 1320

gctcagtggg aaaaagatac tgagttttca gagaaaaatg aaataagggt gggaaacaac 1380

ttcgccatgg agattaacct caatgccaac ctgtggagga atttcctgta ctccaacgtg 1440

gccctgtacc tgccagacaa acttaagtac actccagcca acgtgcagat ttccagcaac 1500

tccaactcct acgactacat gaacaagcga gtggtggccc cggggctggt ggactgctac 1560

atcaacctgg gcgcgcgctg gtccctggac tacatggaca acgtcaaccc cttcaaccac 1620

caccgcaatg cgggcctgcg ctaccgctcc atgcttctgg gcaacgggcg ctacgtgccc 1680

ttccacatcc aggtgcccca gaagttcttt gccatcaaga acctcctcct cctgccgggc 1740

tcctacacct acgagtggaa cttcaggaag gatgtcaaca tggtcctcca gagctctctg 1800

ggtaacgacc tcagggtcga cggggccagc atcaagttcg agagcatctg cctctacgcc 1860

accttcttcc ccatggccca caacacggcc tccacgctcg aggccatgct caggaacgac 1920

accaacgacc agtccttcaa cgactacctc tccgccgcca acatgctcta ccccatcccc 1980

gccaacgcca ccaacgtccc catctccatc ccctcgcgca actgggcggc cttccgcggc 2040

tgggccttca ctcgcctcaa gaccaaggag accccctccc tgggctcggg tttcgacccc 2100

tactacacct actcgggctc cataccctac ctggacggaa ccttctacct caaccacacc 2160

ttcaagaagg tctcggtcac cttcgactcc tcggtcagct ggccgggcaa cgaccgcctg 2220

ctcaccccca acgagttcga gatcaagcgc tcggtcgacg gggagggcta caacgtggcc 2280

cagtgcaaca tgaccaagga ctggttcctc atccagatgc tggccaacta caacatcggc 2340

tatcagggct tctacatccc agagagctac aaggacagga tgtactcctt ctttaggaac 2400

ttccagccca tgagccggca ggtggtggac gaaaccaagt acaaggacta ccagcaggtg 2460

ggcatcatcc accagcacaa caactcgggc ttcgtgggct acctcgcccc caccatgcgc 2520

gagggacagg cctaccccgc caacttcccc tacccgctca ttggcaagac cgcggtcgac 2580

agcgtcaccc agaaaaagtt cctctgcgac cgcaccctct ggcgcatccc cttctccagc 2640

aacttcatgt ccatgggtgc gctcacggac ctgggccaga acctgctcta tgccaactcc 2700

gcccacgcgc tcgacatgac cttcgaggtc gaccccatgg acgagcccac ccttctctat 2760

gttctgttcg aagtctttga cgtggtccgg gtccaccagc cgcaccgcgg cgtcatcgag 2820

accgtgtacc tgcgcacgcc cttctcggcc ggcaacgcca ccacctaa 2868

<210> 58

<211> 1749

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 58

atgcggcgcg cggcgatgta ccacgaggga cctcctccct cttatgagag cgtggtgggc 60

gcggcggcgg cctctccctt tgcgtcgcag ctggagccgc cgtacgtgcc tccgcggtac 120

ctgcggccta cggggggaag aaacagcatc cgttactcgg agctggcgcc cctgtacgac 180

accacccggg tgtacctggt ggacaacaag tcggcggacg tggcctccct gaactaccag 240

aacgaccaca gcaatttttt gaccacggtc atccagaaca atgactacac cccgagcgag 300

gccagcaccc agaccatcaa tctggatgac cggtcgcact ggggcggcga cctgaaaacc 360

atcctgcaca ccaacatgcc caacgtgaac gagttcatgt tcaccaataa gttcaaggcg 420

cgggtgatgg tgtcgcgttc gcacaccaag gacgaccggg tggagctgaa gtacgagtgg 480

gtagagttcg agctgcccga gggcaactac tcggagacca tgaccataga cctgatgaac 540

aacgcgatcg tggagcacta tctgaaagtg ggcaggcaga acggggtcct ggagagcgac 600

atcggggtca agttcgacac caggaacttc cgcctggggc tggacccggt caccgggctg 660

gtcatgcccg gggtctacac caacgaggcc ttccaccccg acatcatcct gctgcccggc 720

tgcggggtgg acttcaccta cagccgcctg agcaacctgc tgggcatccg caagcggcag 780

cccttccagg agggctttag gatcacctac gaggacctgg aggggggcaa catccccgcg 840

ctcctggatg tggaggccta ccagaatagc ttgaaggaag aagaggcggg agagggcagc 900

ggcggcggcg gcgccggtca ggaggagggc ggggcctcct ctgaggcctc tgcggacgca 960

gctgccgccg aggcggagga ggcggccgac cccgcgatgg tggtagagga agagaaggat 1020

atgaatgacg aggcggtgcg cggcgacacc tttgccaccc ggggggagga gaagaaagcg 1080

gaggccgagg ccgcggcaga ggaggcggca gcagcggcgg cggcagtaga ggcggcggcc 1140

gaggcggaga agccccccaa ggagcccgtg attaagcccc tgaccgaaga tagcaagaag 1200

cgcagttaca acgtgctcaa ggacagcacc aacaccgagt accgcagctg gtacctggcc 1260

tacaactacg gcgacccggc gacgggggtg cgctcctgga ccctgctgtg tacgccggac 1320

gtgacctgcg gctcggagca ggtgtactgg tcgctgcccg acatgatgca agaccccgtg 1380

accttccgct ccacgcggca ggtcagcaac tttccggtgg tgggcgccga gctgctgccc 1440

gtgcactcca agagcttcta caacgaccag gccgtctact cccagctcat ccgccagttc 1500

acctctctga cccacgtgtt caatcgcttt cctgagaacc agattctggc gcgcccgccc 1560

gcccccacca tcaccaccgt cagtgaaaac gttcctgctc tcacagatca cgggacgcta 1620

ccgctgcgca acagcatcgg aggagtccag cgagtgaccg taactgacgc cagacgccgc 1680

acctgtccct acgtttacaa ggccctgggc atagtctcgc cgcgcgtcct ttccagccgc 1740

actttttaa 1749

<210> 59

<211> 1629

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 59

atgaagcgcg ccaaaacgtc tgacgagacc ttcaaccccg tgtaccccta tgacacggaa 60

aacgggcctc cctccgttcc tttcctcacc cctcccttcg tgtcccccga cggatttcaa 120

gaaagccccc caggggtcct gtctctgcgc ctgtcagagc ccctggtcac ttcccacggc 180

atgcttgccc tgaaaatggg aaatggcctc tccctggatg acgccggcaa cctcacctct 240

caagatgtca ccaccgtcac ccctcccctc aaaaaaacca agaccaacct cagcctccag 300

acctcagccc ccctgaccgt tagctctggg tccctcaccg tcgcggccgc cgctccactg 360

gcggtggccg gcacctctct caccatgcaa tctcaggccc ccttgacggt gcaagatgca 420

aaactgggtc tggccaccca gggacccctg accgtgtctg aaggcaaact caccttgcag 480

acatcggctc cactgacggc cgccgacagc agcactctca ctgttggcac cacaccgcca 540

atcagtgtga gcagtggaag tctaggctta gatatggaag accccatgta tactcacgat 600

ggaaaactgg gaatcagaat tggtggccca ctgcaagtag tagacagctt gcacacactc 660

actgtagtta ctggaaacgg aataactgta gctaacaatg cccttcaaac taaagttgcg 720

ggtgccctgg gttatgactc atctggcaat ctagaattgc gagccgcagg gggtatgcga 780

attaacacag ggggtcaact cattcttgat gtggcttatc catttgatgc tcagaacaat 840

ctcagcctta gactcggcca gggaccttta tatgtgaaca ccaatcacaa cctagattta 900

aattgcaaca gaggtctgac cacaaccacc agcagtaaca caaccaaact tgaaactaaa 960

atcgattcgg gcttagacta taacgccaat ggggctatca ttgctaaact tggcactggg 1020

ttaacctttg acaacacagg tgccataact gtgggaaaca ctggggatga caaactcact 1080

ctgtggacta ccccagatcc ctctcctaac tgcagaattc acgcagacaa agactgcaag 1140

tttactctag tcctgactaa gtgtggaagt caaattctgg cctccgtcgc cgccctggcg 1200

gtgtctggaa acctatcatc aatgacaggc actgtctcca gcgttaccat ctttctcaga 1260

ttcgatcaga atggagttct tatggaaaat tcctcgctag acaaggagta ctggaacttc 1320

agaaatggta attccaccaa tgccaccccc tacaccaatg cggttgggtt catgcccaac 1380

ctcagcgcct accccaaaac ccagagtcaa actgcaaaaa acaacattgt aagtgaggtt 1440

tacttacatg gggacaaatc taaacccatg atccttacca ttacccttaa tggcacaaat 1500

gaatccagtg aaactagtca ggtgagtcac tactccatgt catttacatg gtcctgggac 1560

agtgggaaat atgccaccga aacctttgcc accaactctt ttaccttctc ctacattgct 1620

gaacaataa 1629

<210> 60

<211> 2895

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 60

atggcgaccc catcgatgat gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc 60

tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccaccgacag ctacttcagc 120

ctgagtaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgg 180

tcccagcgcc tgacgctgcg gttcatcccc gtggaccgcg aggacaccgc gtactcttac 240

aaggcgcggt tcaccctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacctac 300

tttgacatcc gcggcgtgct ggacaggggc cccaccttca agccctactc cggcaccgcc 360

tacaactccc tggcccccaa gggcgccccc aactcctgcg agtgggagca agaggagact 420

cagacagctg aagaggcaca agacgaagaa gaagatgaag ctgaagctga ggaggaaatg 480

cctcaggaag agcaagcacc tgtcaaaaag actcatgtat atgctcaggc tcccctttct 540

ggcgaaaaaa ttactaaaga cggtctgcag ataggaacgg acgctacagc taccgaacaa 600

aaacctattt atgcagatcc cacattccag ccagaacccc aaattggtga atctcagtgg 660

aatgaggcag atgcttcagt tgccggcggt agagtgctga agaaaactac tcccatgaaa 720

ccctgttatg gttcctatgc caggcccaca aatgccaatg gaggtcaggg tgtattggtg 780

gagaaagacg gtggaaagat ggaaagccaa gtagatatgc aattcttttc gacttctgaa 840

aacgcccgta acgaggctaa caacattcag cccaaattgg tgctgtacag cgaggatgtg 900

catatggaga ccccagacac acacatttct tacaagcctg caaaaagcga tgataattcg 960

aaagtcatgc tgggtcagca gtccatgccc aacaggccaa attacatcgg cttcagagac 1020

aactttatcg ggctcatgta ttacaacagc actggcaaca tgggggtgct ggcaggtcag 1080

gcctcacagt tgaatgcggt ggtggacttg caagacagaa acacagaact gtcctaccag 1140

ctcttgcttg attccatggg agacagaacc agatactttt ccatgtggaa tcaggcggtg 1200

gacagttatg atccagatgt cagaattatt gaaaatcatg gaactgaaga tgagctgccc 1260

aactattgtt tccctctggg aggcataggg gtaactgaca cttaccaggc cattaagact 1320

aatggcaatg gcaacggcgg gggcaatacc acttggacca aggatgaaac ttttgcagac 1380

cgcaacgaga taggggtggg aaacaatttc gccatggaga tcaacctcag tgccaacctg 1440

tggaggaact tcctctactc caacgtggcc ctgtacctgc cagacaagct taagtacaac 1500

ccctccaacg tggaaatctc tgacaacccc aacacctacg actacatgaa caagcgagtg 1560

gtggccccgg ggctggtgga ctgctacatc aacctgggcg cgcgctggtc cctggactac 1620

atggacaacg tcaacccctt caaccaccac cgcaacgcgg gcctgcgcta ccgctccatg 1680

cttctgggca acgggcgcta cgtgcccttc cacatccagg tgccccagaa gttctttgcc 1740

atcaagaacc tcctcctcct gccgggctcc tacacctacg agtggaactt caggaaggat 1800

gtcaacatgg tcctccagag ctctctgggt aacgacctca gggtcgacgg ggccagcatc 1860

aagttcgaga gcatctgcct ctacgccacc ttcttcccca tggcccacaa cacggcctcc 1920

acgctcgagg ccatgctcag gaacgacacc aacgaccagt ccttcaacga ctacctctcc 1980

gccgccaaca tgctctaccc catccccgcc aacgccacca acgttcccat ctccatcccc 2040

tcgcgcaact gggcggcctt ccgcggctgg gccttcaccc gcctcaagac caaggagacc 2100

ccctccctgg gctcgggttt cgacccctac tacacctact cgggctccat accctacctg 2160

gacggaacct tctacctcaa ccacactttc aagaaggtct cggtcacctt cgactcctcg 2220

gtcagctggc cgggcaacga tcgcctgctc acccccaacg agttcgagat caagcgctcg 2280

gtcgacgggg agggctacaa cgtggcccag tgcaacatga ccaaggactg gttcctcatc 2340

caaatgctgg ccaactacaa catcggctat cagggcttct acatcccaga gagctacaag 2400

gacaggatgt actccttctt taggaacttc cagcccatga gccggcaggt ggtggacgaa 2460

accaagtaca aggactacca gcaggtgggc atcatccacc agcacaacaa ctcgggcttc 2520

gtgggctacc tcgcccccac catgcgcgag ggacaggcct accccgccaa cttcccctac 2580

ccgctcattg gcaagaccgc ggtcgacagc gtcacccaga aaaagttcct ctgcgaccgc 2640

accctctggc gcatcccctt ctccagcaac ttcatgtcca tgggtgcgct cacggacctg 2700

ggccagaacc tgctctatgc caactccgcc cacgcgctcg acatgacctt cgaggtcgac 2760

cccatggacg agcccaccct tctctatgtt ctgttcgaag tctttgacgt ggtccgggtc 2820

caccagccgc accgcggcgt catcgagacc gtgtacctgc gcacgccctt ctcggccggc 2880

aacgccacca cctaa 2895

<210> 61

<211> 1755

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 61

atgcggcgcg cggcgatgta ccacgaggga cctcctccct cttatgagag cgtggtgggc 60

gcggcggcgg cctctccctt tgcgtcgcag ctggagccgc cgtacgtgcc tccgcggtac 120

ctgcggccta cggggggaag aaacagcatc cgttactcgg agctggcgcc cctgtacgac 180

accacccggg tgtacctggt ggacaacaag tcggcggacg tggcctccct gaactaccag 240

aacgaccaca gcaatttttt gaccacggtc atccagaaca atgactacac cccgagcgag 300

gccagcaccc agaccatcaa tctggatgac cggtcgcact ggggcggcga cctgaaaacc 360

atcctgcaca ccaacatgcc caacgtgaac gagttcatgt tcaccaataa gttcaaggcg 420

cgggtgatgg tgtcgcgttc gcacaccaag gacgaccggg tggagctgaa gtacgagtgg 480

gtagagttcg agctgcccga gggcaactac tcggagacca tgaccataga cctgatgaac 540

aacgcgatcg tggagcacta tctgaaagtg ggcaggcaga acggggtcct ggagagcgac 600

atcggggtca agttcgacac caggaacttc cgcctggggc tggacccggt caccgggctg 660

gtcatgcccg gggtctacac caacgaggcc ttccaccccg acatcatcct gctgcccggc 720

tgcggggtgg acttcaccta cagccgcctg agcaacctgc tgggcatccg caagcggcag 780

cccttccagg agggctttag gatcacctac gaggacctgg aggggggcaa catccccgcg 840

ctcctggatg tggaggccta ccaggatagc ttgaaggaag aagaggcggg agagggcagc 900

ggcggcggcg gcggcgccgg tcaggaggag ggcggggcct cctctgaggc ctctgcggac 960

gccgccgctg ccgccgaggc ggaggcggcc gaccccgcga tggtggtaga ggaagagaag 1020

gatatgaatg acgaggcggt gcgcggcgac acctttgcca cccgggggga ggagaagaaa 1080

gcggaggccg aggccgcggc agaggaggcg gcagcggcgg cggcggcggc agtagaggcg 1140

gcggccgagg cggagaagcc ccccaaggag cccgtgatta aggccctgac cgaagatagc 1200

aagaagcgca gttacaacgt gctcaaggac agcaccaaca ccgcgtaccg cagctggtac 1260

ctggcctaca actacggcga cccggcgacg ggggtgcgct cctggaccct gctgtgtacg 1320

ccggacgtga cctgcggctc ggagcaggtg tactggtcgc tgcccgacat gatgcaagac 1380

cccgtgacct tccgctccac gcggcaggtc agcaacttcc cggtggtggg cgccgagctg 1440

ctgcccgtgc actccaagag cttctacaac gaccaggccg tctactccca gctcatccgc 1500

cagttcacct ctctgaccca cgtgttcaat cgctttcctg agaaccagat tctggcgcgc 1560

ccgcccgccc ccaccatcac caccgtcagt gaaaacgttc ctgctctcac agatcacggg 1620

acgctaccgc tgcgcaacag catcggagga gtccagcgag tgaccgtaac tgacgccaga 1680

cgccgcacct gtccctacgt ttacaaggcc ctgggcatag tctcgccgcg cgtcctttcc 1740

agccgcactt tttaa 1755

<210> 62

<211> 37776

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 62

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag gtgggcggag 60

cggggcgggg cggggaggag cggcggcgcg gggcgggccg ggaggtgtgg cggaagttga 120

gtttgtaagt gtggcggatg tgacttgcta gcgccggatg tggtaaaagt gacgtttttg 180

gagtgcgaca acgcccacgg gaagtgacat ttttcccgcg gtttttaccg gatgtcgtag 240

tgaatttggg cgttaccaag taagatttgg ccattttcgc gggaaaactg aaatggggaa 300

gtgaaatctg attaatttcg cgttagtcat accgcgtaat atttgccgag ggccgaggga 360

ctttgaccga ttacgtggag gaatcgccca ggtgtttttt gaggtgaatt tccgcgttcc 420

gggtcaaagt ctccgtttta ttattatagt cagctgacgc ggagtgtatt tatacccgct 480

gatctcgtca agaggccact cttgagtgcc agcgagtaga gttttctcct ctgccgctcc 540

gctccgctct gacaccgggg gaaaaatgag acatttcacc tacgatggcg gtgtgcttac 600

cggccagctg gctgcctcgg tcctggacgc cctgattgag gacgtattgg ccgacaatta 660

tcctcctcca gctcattttg agccacctac tcttcacgaa ctgtatgatt tggacgtggt 720

ggcacctagc gacccgaacg agcaggcggt ttccagtttt tttcctgact ctatgctgtt 780

ggccagccag gagggggtcg agctcgagac ccctcctcca atcgccgttt ctcctgagcc 840

tccgaccctg accaggcagc ccgatcgccg tgttggacct gcgactatgc cccatctgct 900

gcccgaggtg atcgatctca cctgtaacga gtctggtttt ccacccagcg aggatgagga 960

cgaagagggt gagcagtttg tgttagattc tgtggaggaa cccgggcgcg gttgcagatc 1020

ttgtcaatac catcggaaaa atacaggaga cccccaaatt atgtgttccc tgtgttatat 1080

gaagacgacc tgtatgttta tttacagtaa gtttgtgatt ggtgggtcgg tgggctgtag 1140

tgtgggtagg tggtctgtgg tttttttttt ttttaatatc agcttgggct aaaaaactgc 1200

tatggtaatt tttttaaggt ccggtgtctg aacctgagca ggaagctgaa ccggagcctg 1260

agagtcgccc caggagaagg cctgcaattc taactagacc gagtgcacct gtagcgaggg 1320

acctcagcag tgcagagacc accgattccg gtccttcctc atcccctcca gagattcatc 1380

ccgtggtgcc tttgtgtccc ctcaagcccg ttgccgtgag agttagtggg cggagggccg 1440

ccgtggagag cattgaggac ttgcttaatg agacacagga acctttggac ttgagctgta 1500

aacgccctag gcaataaacc tgcttacctg gactgaatga gttgacgcct atgtttgctt 1560

ttgaatgact taatgtgtat ataataaaga gtgagataat gtttaattgc atggtgtgtt 1620

tgattggggc ggggtttgtt gggtatataa gcttccctgg gctaaacttg gttacacttg 1680

acctcatgga ggcctgggag tgtttagaga gctttgccga agtgcgtgcc ttgctggaag 1740

agagctctaa taatacctct gggtggtgga ggtatttttg gggctctccc caggctaagt 1800

tagtttgtag aatcaaggag gattacaagt gggaatttga acagcttttg aaatcctgtg 1860

gtgagctctt ggattctttg aatctgggcc accaggctct tttccaggac aagatcatca 1920

ggactttgga tttttccaca ccggggcgca ttgctgccgg ggttgctttt ctagcttttt 1980

tgaaggataa atggagcgaa gagacccact tgagttcggg atacgtcctg gattttctgg 2040

ccatacaact gtggagagca tggatcaggc acaagaacag aatgcaactg ttgtcttccg 2100

tccgtccgtt gctgattcag ccggaggagc agcagaccgg gccggaggac cgggctcgtc 2160

tggaaccaga agagagggcg ccggagagga gcgcgtggaa cctgggagcc ggcctgaacg 2220

gccatccaca tcgggagtga atgttggaca ggtggcggat ctctttccag aactgcgacg 2280

aatcttaact atcagggagg atggacaatt tgttaagggg cttaagaggg agcggggggc 2340

ttctgaacat aacgaggagg ccagtaattt agcttttagt ctgatgacca gacaccgtcc 2400

cgagtgcatt acttttcagc agattaagga taattgtgcc aatgagttag atctgctggg 2460

tcagaagtac agcatagagc agttgaccac ttactggctg cagccgggtg atgatctgga 2520

ggaagctatt agggtgtatg ccaaggtggc cctgaggccc gattgcaagt acaagctcaa 2580

ggggctggtg aatatcagga attgttgcta catttctggg aacggggcgg aggtggagat 2640

agagaccgat gacagggtgg cctttaggtg cagcatgatg aatatgtggc ctggggtgct 2700

gggcatggac ggggtggtga ttatgaatgt gaggttcacg gggcccaatt ttaatggcac 2760

ggtgttcctg ggcaacacca acttggtgct gcacggggtg agcttctatg gctttaacaa 2820

cacctgtgtg gaggcctgga ccgatgtgaa ggtccgtggc tgtgccttct acggatgttg 2880

gaaggcggta gtgtgtcgcc ccaagagcag gagttccatt aaaaaatgct tgtttgagag 2940

gtgcaccctg ggggtgctgg cggagggcaa ctgtcgggtg cgccacaatg tggcctcaga 3000

atgcggttgc ttcatgctag tcaagagcgt ggcggtcatc aagcataaca tggtgtgcgg 3060

caacagcgag gacaaggcct cgcagatgct gacctgctcg gatggcaact gccacttact 3120

gaagaccgta catataacca gccacagccg caaggcctgg cccgtgttcg agcacaacgt 3180

gttgacccgc tgctctttgc atctgggcaa caggaggggt gtgttcctgc cctatcaatg 3240

caacttgagc cacaccaaga tcttgctaga gcccgaaagc atgtccaagg tgaacctgaa 3300

cggggtgttt gacatgaccc tgaagatatg gaaggtgctg aggtacgacg agaccaggtc 3360

tcgatgcagg ccctgcgagt gcgggggcaa gcatatgagg aaccagcctg tgatgctgga 3420

tgtgaccgag gagctgaggc ctgaccactt ggttctggcc tgcaccaggg ccgagtttgg 3480

ttctagcgat gaagacacag actgaggtgg gtgagtgggc gtggtctggg ggtgggaagc 3540

aatatataag ttgggggtct tagggtctct gtgtctgttt tgcagaggga ccgccggcgc 3600

catgagcggg agcagtagca gcaacgcctt ggatggcagc atcgtgagcc cttatttgac 3660

gacgcgcatg ccccactggg ccggggtgcg tcagaatgtg atgggctcca gcatcgacgg 3720

acgacccgtg ctgcccgcaa attccgccac gctgacctac gcgaccgtcg cggggacccc 3780

gttggacgcc accgccgccg ccgccgccac cgccgccgcc tcggccgtgc gcagcctggc 3840

cacggacttt gcattcttgg gacccttggc caccggggcg gccgcccgtg ccgccgttcg 3900

cgatgacaag ctgaccgccc tgctggcgca gttggatgcg cttacccggg aactgggtga 3960

cctttcgcag caggtcgtgg ccctgcgcca gcaggtctcc gccctgcagg ctagcgggaa 4020

tgcttctcct gcaaatgccg tttaagataa ataaaaccag actctgtttg gattaaagaa 4080

aagtagcaag tgcattgctc tctttatttc ataattttcc gcgcgcgata ggcccgagtc 4140

cagcgttctc ggtcgttgag ggtgcggtgt atcttctcca ggacgtggta gaggtggctc 4200

tggacgttga gatacatggg catgagcccg tcccgggggt ggaggtagca ccactgcaga 4260

gcttcatgct ccggggtggt gttgtagatg atccagtcgt agcaggagcg ctgggcatgg 4320

tgcctaaaaa tgtccttaag cagcaggccg atggccaggg ggaggccctt ggtgtaagtg 4380

tttacaaaac ggttgagttg ggaagggtgc atgcggggtg agatgatgtg catcttagat 4440

tgtattttta gattggcgat gtttcctccc agatcccttc tgggattcat gttgtggagg 4500

accaccagca cagtatatcc ggtgcacttg ggaaatttgt catgcagctt agagggaaat 4560

gcgtggaaga acttggagac gcccttgtgg cctcccagat tctccatgca ttcgtccatg 4620

atgatggcaa tgggcccgcg ggaggcggcc tgggcaaaga tgtttctggg gtcactgaca 4680

tcgtagttgt gttccagggt gagatcgtca taggccattt ttataaagcg cgggcggagg 4740

gtgcccgact gggggatgat ggttccctcg ggccccgggg cgtagttgcc ttcgcagatc 4800

tgcatttccc aggccttaat ctctgagggg ggaatcatat ccacttgcgg ggcgatgaag 4860

aaaacggttt ccggagccgg ggagattaac tgggatgaga gcaggtttct cagcagctgt 4920

gactttccac agccggtggg gccataaata acacctataa ccggctgcag ctggtagttg 4980

agcgagctgc agctgccgtc gtcccggagg aggggggcca cctcattgag catgtcccgg 5040

acgcgcttgt tctcctcgac caggtccgcc agaaggcgct cgccgcccag ggacagcagc 5100

tcttgcaagg aagcaaagtt tttcagcggc ttgaggccgt ccgccgtggg catgtttttc 5160

agggtctggc cgagcagctc caggcggtcc cagagctcgg tgacgtgctc tacggcatct 5220

ctatccagca tatctcctcg tttcgcgggt tggggcggct ttcgctgtag ggcaccaggc 5280

gatggtcgtc cagcgcggcc agagtcatgt ccttccatgg gcgcagggtc ctcgtcaggg 5340

tggtctgggt cacggtgaag gggtgcgccc cgggctgggc gctggccagg gtgcgcttga 5400

gactggtcct gctggtgctg aagcgctgcc ggtcttcgcc ctgcgcgtcg gccaggtagc 5460

atttgaccat ggtgtcgtag tccagcccct ccgcggcgtg tcccttggcg cgcagcttgc 5520

ccttggaggt ggcgccgcac gcggggcact gcaggctctt gagcgcgtag agcttggggg 5580

cgaggaagac cgattcgggg gagtaggcgt ccgcgccgca ggccccgcac acggtctcgc 5640

actccaccag ccaggtgagc tcggggcgct cggggtcaaa aaccaggttt cccccatgct 5700

ttttgatgcg tttcttacct cgggtctcca tgaggcggtg tccccgctcg gtgacgaaga 5760

ggctgtccgt gtctccgtag accgacttga ggggtctgtc ctccaggggg gtccctcggt 5820

cctcttcgta gagaaactcg gaccactctg agacgaaggc ccgcgtccag gccaggacga 5880

aggaggccag gtgggagggg tagcggtcgt tgtccactag ggggtccacc ttctccaagg 5940

tgtgaagaca catgtcgccc tcctcggcgt ccaggaaggt gattggcttg taggtgtagg 6000

ccacgtgacc cggggttccg gacggggggg tataaaaggg ggtgggggcg cgctcgtcct 6060

cactctcttc cgcatcgctg tctgcgaggg ccagctgctg gggtgagtat tccctctcga 6120

aggcgggcat gacctcagcg ctgaggctgt cagtttctaa aaacgaggag gatttgatgt 6180

tcacctgtcc cgagctgatg cctttgaggg tgcccgcgtc catctggtca gaaaacacga 6240

tctttttatt gtccagcttg gtggcgaacg acccgtagag ggcgttggag agcagcttgg 6300

cgatggagcg cagggtctga ttcttgtccc ggtcggcgcg ctccttggcc gcgatgttga 6360

gctgcacgta ctcgcgcgcg acgcagcgcc actcggggaa gacggtggtg cgctcgtcgg 6420

gcaccaggcg cacgcgccag ccgcggttgt gcagggtgac gaggtccacg ctggtggcga 6480

cctcgccgcg caggcgctcg ttggtccagc agaggcgccc gcccttgcgc gagcagaagg 6540

ggggcagggg gtcgagttgg gtttcgtccg gggggtccgc gtccaccgtg aagaccccgg 6600

ggcgcaggcg cgcgtcgaag tagtcgatct tgcatccttg caagtccagc gcctgctgcc 6660

agtcgcgggc ggcgagcgcg cgctcgtagg ggttgagcgg cgggccccag ggcatggggt 6720

gggtgagcgc ggaggcgtac atgccgcaga tgtcatagac gtagaggggc tcccggagga 6780

tgcccaggta ggtggggtag cagcggccgc cgcggatgct ggcgcgcacg tagtcgtaga 6840

gctcgtgcga gggggcgagg aggtcggggc ccaggttggt gcgggcgggg cgctccgcgc 6900

ggaagacgat ctgcctgaag atggcatgcg agttggaaga gatggtgggg cgctggaaga 6960

cgttgaagct ggcgtcctgc aggccgacgg cgtcgcgcac gaaggaggcg taggactcgc 7020

gcagcttgtg caccagctcg gcggtgacct gcacgtcgag cgcgcagtag tcgagggtct 7080

cgcggatgat gtcatactta gcctgcccct tctttttcca cagctcgcgg ttgaggacga 7140

actcttcgcg gtctttccag tactcttgga tcgggaaacc gtccggctcc gaacggtaag 7200

agcccagcat gtagaactgg ttgacggcct ggtaggcgca gcagcccttc tccacgggca 7260

gggcgtaggc ctgcgcggcc ttgcggagcg aggtgtgggt cagggcgaag gtgtccctga 7320

ccatgacctt gaggtactgg tgtttgaagt cggagtcgtc gcagccgccc cgctcccaga 7380

gcgagaagtc ggtgcgcttt ttggagcggg ggttgggcag cgcgaaggtg acatcgttgt 7440

agaggatctt gcccgcgcga ggcatgaagt tgcgggtgat gcggaagggc cccggcactt 7500

ccgagcggtt gttgatgacc tgggcggcga gcacgatctc gtcgaagccg ttgatgttgt 7560

ggcccacgat gtagagttcc aggaagcggg gccggccctt gacgctgggc agcttcttta 7620

gctcttcgta ggtgagctcc tcgggcgagg cgaggccgtg ctcggccagg gcccagtccg 7680

ccaggtgcgg gttgtccgcg aggaaggacc gccagaggtc gcgggccagg agggtctgca 7740

ggcggtccct gaaggtcctg aactggcggc ctacggccat cttttcgggg gtgacgcagt 7800

agaaggtgag ggggtcttgc tgccaggggt cccagtcgag ctccagggcg aggtcgcgcg 7860

cggcggcgac caggcgctcg tcgcccccga atttcatgac cagcatgaag ggcacgagct 7920

gctttccgaa ggcgcccatc caagtgtagg tctctacatc gtaggtgaca aagagacgtt 7980

ccgtgcgagg atgcgagccg atcgggaaga actggatctc ccgccaccag ttggaggagt 8040

ggctgttgat gtggtgaaag tagaagtccc gtcggcgggc cgagcactcg tgctggcttt 8100

tgtaaaagcg agcgcagtac tggcagcgct gcacgggctg tacctcttgc acgagatgca 8160

cctgccgacc gcggacgagg aagctgagtg ggaatctgag ccccccgcat ggctcgcggc 8220

ctggctggtg ctcttctact ttggatgcgt ggccgtcacc gtctggctcc tcgaggggtg 8280

ttacggtgga gcggatcacc acgccgcgcg agccgcaggt ccagatatcg gcgcgcggcg 8340

gtcggagttt gatgacgaca tcgcgcagct gggagctgtc catggtctgg agctcccgcg 8400

gcggcggcag gtcagccggg agttcttgca ggtttacctc gcagagacgg gccagggcgc 8460

ggggcaggtc caggtggtac ttgaattcga gaggcgtgtt ggtggcggcg tcgatggctt 8520

gcaggaggcc gcagccccgg ggcgcgacga cggtgccccg cggggcggtg aagctcccgc 8580

cgccgctcct gctgtcgccg ccggtggcgg ggcttagaag cggtgccgcg gtcgggcccc 8640

cggaggtagg gggggctccg gtcccgcggg caggggcggc agcggcacgt cggcgccgcg 8700

cgcgggcagg agctggtgct gcgcccggag gttgctggcg aaggcgacga cgcggcggtt 8760

gatctcctgg atctggcgcc tctgcgtgaa gacgacgggt ccggtgagct tgaacctgaa 8820

agagagttcg acagaatcaa tctcggtgtc attgaccgcg acctggcgca ggatctcctg 8880

cacgtcgccc gagttgtctt ggtaggcgat ctcggccatg aactgttcga tctcttcctc 8940

ctggaggtct ccgcgtccgg cgcgctccac ggtggccgcc aggtcgttgg agatgcgcgc 9000

catgagctgc gagaaggcgt tgagtccgcc ctcgttccag actcggctgt agaccacgcc 9060

gccctggtcg tcgcgggcgc gcatgaccac ctgcgcgagg ttgagttcca cgtggcgcgc 9120

aaagacggcg tagttgcgca ggcgctggaa gaggtagttg agggtggtgg cggtgtgctc 9180

ggccacgaag aagtacatga cccagcggcg caacgtggat tcgttgatgt cccccaaggc 9240

ctccagtcgc tccatggcct cgtagaagtc cacggcgaag ttgaaaaact gggagttgcg 9300

cgccgacacg gtcaactcct cctccagaag acggatgagc tcggcgacgg tgtcgcgcac 9360

ctcgcgctcg aaggctatgg gaatctcttc ctccgccagc atcaccacct cttcctcttc 9420

ttcctcctct ggcacttcca tgatggcttc ctcctcttcg gggggtggcg gcgggggagg 9480

gggcgctcgg cgccggcggc ggcgcaccgg gaggcggtcc acgaagcgct cgatcatctc 9540

cccgcggcgg cgacgcatgg tctcggtgac ggcgcggccg ttctctcggg gacgcagctg 9600

gaagacgccg ccggtcatct ggtgctgggg cgggtggccg tggggcagcg agaccgcgct 9660

gacgatgcat cttaacaatt gctgcgtagg tacgccgccg agggacctga gggagtccag 9720

atccaccgga tccgaaaacc tttcgaggaa ggcatctaac cagtcgcagt cgcaaggtag 9780

gctgagcacc gtggcgggcg gcggggggtg gggggagtgt ctggcggagg tgctgctgat 9840

gatgtaattg aagtaggcgg tcttgacacg gcggatggtc gacaggagca ccatatcttt 9900

gggcccggcc tgctggatgc ggaggcggtc ggccatgccc caggcttcgt tctggcatct 9960

gcgcaggtct ttgtagtagt cttgcatgag cctttccacc ggcacctctt ctccttcttc 10020

ttctgacatc tctgctgcat ctgcggccct ggggcgacgg cgcgcgcccc tgccccccat 10080

gcgcgtcacc ccgaaccccc tgagcggctg gagcagggcc aggtcggcga cgacgcgctc 10140

ggccaggatg gcctgctgga cctgcgtgag ggtggtttgg aagtcatcca agtccacgaa 10200

gcggtggtag gcgcccgtgt tgatggtgta ggtgcagttg gccatgacgg accagttgac 10260

ggtctggtgg cccggttgcg tcatctcggt gtacctgagg cgcgagtagg cgcgcgagtc 10320

gaagatgtag tcgttgcaag tccgcaccag gtactggtag cccaccagga agtgcggcgg 10380

cggctggcgg tagaggggcc agcggagggt ggcgggggct ccgggggcca ggtcttccag 10440

catgaggcgg tggtattcgt agatgtacct ggacatccag gtgatgcccg cggcggtggt 10500

ggaggcgcgc gggaagtcgc gcacccggtt ccagatgttg cgcagcggca gaaagtgctc 10560

catggtaggc gtgctctggc cggtcaggcg cgcgcagtcg ttgatactct agaccaggga 10620

aaacgaaagc cggtcagcgg gcactcttcc gtggtctggt ggataaattc gcaagggtat 10680

catggcggag ggcctcggtt cgagccccgg gcccgggccg gacggtccgc catgatccac 10740

gcggttaccg cccgcgtgtc gaacccaggt ggcgacgtca gacaacggtg gagtgttcct 10800

tttgggtttt ttttaatttt tctggccggg cgccgacgcc gccgcgtaag agactagagt 10860

gcaaaagcga aagcagtaag tggctcgctc cctgtagccc ggaggatcct tgctaagggt 10920

tgcgttgcgg cgaaccccgg ttcgagtctg gctctcgctg ggccgctcgg gtcggccgga 10980

accgcggcta aggcgggatt ggcctccccc tcattaaaga ccccgcttgc ggattcctcc 11040

ggacacaggg gacgagcccc tttttacttt tgcttttctc agatgcatcc ggtgctgcgg 11100

cagatgcgcc ccccgcccca gcagcagcag cagcaacatc agcaagagcg gcaccagcag 11160

cagcgggagt catgcagggc cccctcgccc acgctcggcg gtccggcgac ctcggcgtcc 11220

gcggccgtgt ctggagccgg cggcggtggg ctggcggacg acccggagga gcccccgcgg 11280

cgcagggcca gacagtacct ggacctggag gagggcgagg gcctggcgcg actgggggcg 11340

ccgtcccccg agcgccaccc gcgggtgcag ctgaagcgcg actcgcgcga ggcgtacgtg 11400

cctcggcaga acctgttcag agaccgcgcg ggcgaggagc ccgaggagat gcgggaccgc 11460

aggttcgccg cggggcggga gctgcggcag gggctgaacc gggagcggct gctgcgcgag 11520

gaggactttg agcccgacgc gcggacgggg atcagccccg cgcgcgcgca cgtggcggcc 11580

gccgacctgg tgacggcgta cgagcagacg gtgaaccagg agatcaactt ccaaaaaagc 11640

ttcaacaacc acgtgcgcac gctggtggcg cgcgaggagg tgaccatcgg cctgatgcac 11700

ctgtgggact ttgtgagcgc gctggagcag aaccccaaca gcaagcctct gacggcgcag 11760

ctgttcctga tagtgcagca cagcagggac aacgaggcgt tcagggacgc gctgctgaac 11820

atcaccgagc ccgagggtcg gtggctcctg gacctgatta acatcttgca gagcatagtg 11880

gtgcaggagc gcagcctgag cctggccgac aaggtggcgg ccatcaatta ctcgatgctc 11940

agtctgggca agttttacgc gcgcaagatc taccagacgc cgtacgtgcc catagacaag 12000

gaggtgaaga tcgacggctt ctacatgcgc atggcgctga aggtgctgac cctgagcgac 12060

gacctgggcg tgtaccgcaa cgagcgcatc cacaaggccg tgagcgtgag ccggcggcgc 12120

gagctgagcg accgcgagct gatgcacagc ctgcagcggg cgctggcggg ggccggcagc 12180

ggcgacaggg aggccgagtc ctacttcgag gcgggggcgg acctgcgctg ggtgcccagc 12240

cggagggccc tggaggccgc gggggcccgc cgcgaggact atgcagacga ggaggaggag 12300

gatgacgagg agtacgagct agaggagggc gagtacctgg actaaaccgc aggtggtgtt 12360

tttggtagat gcaagacccg aacgtggtgg acccggcgct gcgggcggct ctgcagagcc 12420

agccgtccgg ccttaactct acagacgact ggcgacaggt catggaccgc atcatgtcgc 12480

tgacggcgcg caatccggac gcgttccggc agcagccgca ggccaacagg ctctccgcca 12540

tcttggaggc ggtggtgcct gcgcgcgcga accccacgca cgagaaggtg ctggccatag 12600

tgaacgcgct cgccgagaac agggccatcc gcccggacga ggccgggctg gtgtacgacg 12660

cgctgctgca gcgcgtggcc cgctacaaca gcggcaacgt gcagaccaac ctggaccggc 12720

tggtggggga cgtgcgcgag gcggtggcgc agcgggagcg cgcggagcgg cagggaaacc 12780

tgggctccat ggtggcgctg aacgccttcc tgagcacgca gccggccaac gtgccgcggg 12840

ggcaggagga ctacaccaac tttgtgagcg cgctgcggct gatggtgacc gagacccccc 12900

agagcgaggt gtaccagtcg gggccggact actttttcca gaccagcaga cagggcctgc 12960

agacggtgaa cctgagccag gctttcaaga acctgcgggg gctgtggggc gtgaaggcgc 13020

ccaccgggga ccgggcgacg gtgtccagcc tgctgacgcc caactcgcgc ctgctgctgc 13080

tgctgatcgc gccgttcacg gacagcggca gcgtgtcccg ggagacctac ctcgggcacc 13140

tgctgacgct gtaccgcgag gccatcgggc agacccaggt ggacgagcac accttccagg 13200

agatcaccag cgtgagccgc gcgctggggc aggaggacac gggcagcctg gaggcgaccc 13260

tgaactacct gctgaccaac cggcggcaga agatcccctc gctgcatagt ttgaccaccg 13320

aggaggagcg catcctgcgc tacgtgcagc agagcgtgag cctgaacctg atgcgcgacg 13380

gggtgacgcc cagcgtggcg ctggacatga ccgcgcgcaa catggaaccg ggcatgtacg 13440

ccgcgcatcg gccttacatc aaccgcctga tggactactt gcatcgcgcg gcggccgtga 13500

accccgagta cttcaccaac gccatcctga acccgcactg gctcccgccg cccgggttct 13560

acagcggggg cttcgaggtc cccgaggcca acgacggctt cctgtgggac gacatggacg 13620

acagcgtgtt ctccccgcgg ccgcaggcgc tggcggaggc gtcgctgctc cgcctcccca 13680

agaaagaaga gagccgccgg cccagcagcg cggcggcctc tctgtccgag ctgggggcgg 13740

cggccgcgcg gcccgggtcc ctggggggca gcccctttcc cagtctggtg gggtctctgc 13800

agagcgggcg caccacccgg ccccggctgc tgggcgagga cgagtacctg aacaactccc 13860

tgatgcagcc ggtgcgggag aaaaacctgc cccccgcctt ccccaacaac gggatagaga 13920

gcctggtaga caagatgagc agatggaaga cctatgcgca ggagcacagg gactcgcccg 13980

tgctccgtcc gcccacgcgg cgccagcgcc acgaccggca gcgggggctg gtatgggatg 14040

acgaggactc cgcggacgat agcagcgtgc tggacctggg ggggagcggc ggtaacccgt 14100

tcgcgcacct gcgcccccgc ctggggagga tgtttcaata agaaaaatca agcatgatgc 14160

aaggtttttt aagcggataa ataaaaaact caccaaggcc atggcgaccg agcgttgttg 14220

gtttcttgtt gtgttccctt agtatgcggc gcgcggcgat gtaccacgag ggacctcctc 14280

cctcttatga gagcgtggtg ggcgcggcgg cggcctctcc ctttgcgtcg cagctggagc 14340

cgccgtacgt gcctccgcgg tacctgcggc ctacgggggg aagaaacagc atccgttact 14400

cggagctggc gcccctgtac gacaccaccc gggtgtacct ggtggacaac aagtcggcgg 14460

acgtggcctc cctgaactac cagaacgacc acagcaattt tttgaccacg gtcatccaga 14520

acaatgacta caccccgagc gaggccagca cccagaccat caatctggat gaccggtcgc 14580

actggggcgg cgacctgaaa accatcctgc acaccaacat gcccaacgtg aacgagttca 14640

tgttcaccaa taagttcaag gcgcgggtga tggtgtcgcg ttcgcacacc aaggacgacc 14700

gggtggagct gaagtacgag tgggtagagt tcgagctgcc cgagggcaac tactcggaga 14760

ccatgaccat agacctgatg aacaacgcga tcgtggagca ctatctgaaa gtgggcaggc 14820

agaacggggt cctggagagc gacatcgggg tcaagttcga caccaggaac ttccgcctgg 14880

ggctggaccc ggtcaccggg ctggtcatgc ccggggtcta caccaacgag gccttccacc 14940

ccgacatcat cctgctgccc ggctgcgggg tggacttcac ctacagccgc ctgagcaacc 15000

tgctgggcat ccgcaagcgg cagcccttcc aggagggctt taggatcacc tacgaggacc 15060

tggagggggg caacatcccc gcgctcctgg atgtggaggc ctaccagaat agcttgaagg 15120

aagaagaggc gggagagggc agcggcggcg gcggcgccgg tcaggaggag ggcggggcct 15180

cctctgaggc ctctgcggac gcagctgccg ccgaggcgga ggaggcggcc gaccccgcga 15240

tggtggtaga ggaagagaag gatatgaatg acgaggcggt gcgcggcgac acctttgcca 15300

cccgggggga ggagaagaaa gcggaggccg aggccgcggc agaggaggcg gcagcagcgg 15360

cggcggcagt agaggcggcg gccgaggcgg agaagccccc caaggagccc gtgattaagc 15420

ccctgaccga agatagcaag aagcgcagtt acaacgtgct caaggacagc accaacaccg 15480

agtaccgcag ctggtacctg gcctacaact acggcgaccc ggcgacgggg gtgcgctcct 15540

ggaccctgct gtgtacgccg gacgtgacct gcggctcgga gcaggtgtac tggtcgctgc 15600

ccgacatgat gcaagacccc gtgaccttcc gctccacgcg gcaggtcagc aactttccgg 15660

tggtgggcgc cgagctgctg cccgtgcact ccaagagctt ctacaacgac caggccgtct 15720

actcccagct catccgccag ttcacctctc tgacccacgt gttcaatcgc tttcctgaga 15780

accagattct ggcgcgcccg cccgccccca ccatcaccac cgtcagtgaa aacgttcctg 15840

ctctcacaga tcacgggacg ctaccgctgc gcaacagcat cggaggagtc cagcgagtga 15900

ccgtaactga cgccagacgc cgcacctgtc cctacgttta caaggccctg ggcatagtct 15960

cgccgcgcgt cctttccagc cgcacttttt aagcatgtcc atcctcatct cgcccagcaa 16020

taacaccggc tggggcctgc tgcgcgcgcc cagcaagatg ttcggagggg cgaggaagcg 16080

ctccgaccag caccccgtgc gcgtgcgcgg gcactaccgc gccccctggg gcgcgcacaa 16140

acgcgggcgc accggcaccg cggggcgcac caccgtggac gaagccatcg actcggtggt 16200

ggagcaggcg cgcaactaca cgcccgcggt ctccaccgtg gacgcggcta tcgagagcgt 16260

ggtgcgaggc gcgcggcggt acgccaaggc gaagagccgc cggaggcgcg tggcccgccg 16320

ccaccgccgc cgacccggga gcgccgccaa gcgcgccgcc gccgccttgc ttcgccgggc 16380

cagacgcacg ggccgccgcg ccgccatgag ggccgcgcgc cgcctggccg ccggcatcac 16440

caccgtggcc ccccgcgcca gaagacgcgc ggccgctgcc gccgctgcgg ccatcagcga 16500

cctggccacc aggcgccggg gcaacgtgta ctgggtgcgc gactcggtga gcggcacgcg 16560

cgtgcccgtg cgcttccgcc ccccgcggac ttgagaggag aggacaggaa aaaagcatca 16620

acaacaacac cactgagtct cctgctgttg tgtgtatccc agcggcgcgc gcgcacacgg 16680

cgacatgtcc aagcgcaaaa tcaaagaaga gatgctccag gtcgtcgcgc cggagatcta 16740

tgggcccccg aagaaggaag agcaggattt caagccccgc aagataaagc gggtcaaaaa 16800

gaaaaagaaa gatgacgatg atggcgaggt ggagtttctg cgcgccacgg cgcccaggcg 16860

cccgctgcag tggaagggtc ggcgcgtaaa gcgcgttctg cgccccggca ccgcggtggt 16920

cttcacgccc ggcgagcgct ccacccgcac tttcaagcgc gtctatgacg aggtgtacgg 16980

cgacgaagac ctgctggagc aggccaacga tcgctccgga gagtttgctt acgggaagcg 17040

gcaccgggcg atggagaagg acgaggtgct ggcgctgccg ctggaccggg gcaaccccac 17100

ccccagcctg aagcccgtga ccttgcagca ggtgctgccg agcagcgcgc cctccgagat 17160

gaagcggggc ctgaagcgcg agggcggcga cctggcgccc accgtgcagc tgatggtgcc 17220

caagcggcag aggctggagg acgtgctgga gaaaatgaaa gtagaccccg gcctgcagcc 17280

ggacatcagg gtccgcccca tcaagcaggt ggcgccgggc ctcggcgtgc agaccgtgga 17340

cgtggtcatc cccaccggcg cctcctcttc cagcgccgcc gccgccacta gcaccgcgga 17400

catggagacg cagactagct ccgccctcgc cgcccccgcg gccgccgccg ccgccgccac 17460

ctcctcggcg gaggtacaga cggacccctg gatgccgccg ccggcggccg ccccctcgcg 17520

cgcacgccgc gggcgcagga agtacggtgc cgccagcgcg ctcatgcccg agtacgcctt 17580

gcatccttcc atcgcgccca cccccggcta ccgaggctac agctaccgcc cgcgaagagc 17640

caagggctcc acccgccgca gccgccgcgc cgccacctct acccgccgcc gcagtcgccg 17700

ccgccgccgc cggcagcccg cgctggctcc gatctccgtg aggagagtgg cgcgcaacgg 17760

ggacaccttg gtgctgccca gggcgcgcta ccaccccagc atcgtttaaa agcctgttgt 17820

ggttcttgca gatatggccc tcacttgccg cctccgtttc ccggtgccgg gataccgagg 17880

aagatcgcgc cgtagaaggg gtatggccgg acgcggcctg agcggaggca gccgccgtgc 17940

gcaccggcgg cgacgcgcca ccagccgacg catgcgcggc ggggtgctgc ctctgctgat 18000

ccccctgatc gccgcggcga tcggcgccgt gcccgggatc gcctccgtgg ccttgcaggc 18060

gtcccagagg cgttgacaca gacttcttgc aagcttgcaa aatatggaaa aaatcccccc 18120

aataaaaaag tctagactct cacgctcgct tggtcctgtg actattttgt agaaaaaaga 18180

tggaagacat caactttgcg tcgctggccc cgcgtcacgg ctcgcgcccg ttcctgggac 18240

actggaacga tatcggcacc agcaacatga gcggtggcgc cttcagttgg ggctctctgt 18300

ggagcggcat taaaaatatc ggttctgccg ttaagaatta cggcaccaag gcctggaaca 18360

gcagcacggg ccagatgttg agagacaagt tgaaagagca gaacttccag cagaaggtgg 18420

tggagggcct ggcctccggc atcaacgggg tggtggacct ggccaatcag gccgtgcaaa 18480

ataagatcaa cagcaaactg gacccccggc cgccggtgga agagctgccg ccggcgctgg 18540

agacggtgtc ccccgatggg cggggcgaaa agcgcccgcg gcccgacagg gaagagacca 18600

ctctggtcac gcacaccgat gagccgcccc cctacgagga agccctgaag caaggcttgc 18660

ccaccactcg gcccatcgcg cccatggcca ccggggtggt gggccgccac acccccgcca 18720

cgctggacct gcctcctcct cctgtttctt cttcggccgc cgatgcgcag cagcagaagg 18780

cggcgctgcc cggtccgccc gcggccgccc cccgtcccac cgccagtcga gcgcccctgc 18840

gtcgcgcggc cagcggcccc cgcggggtcg cgaggcacag cagcggcaac tggcagaaca 18900

cgctgaacag catcgtgggt ctgggggtgc agtccgtgaa gcgccgccga tgctactgaa 18960

tagcttagct aacggtgttg tatgtgtgta tgcgtcctat gtcaccgcca gaggagctgc 19020

tgagtcgccg ccgttcgcgc gcccaccgcc actaccaccg ccggtactac tccagcgccc 19080

ctcaagatgg cgaccccatc gatgatgccg cagtggtcgt acatgcacat ctcgggccag 19140

gacgcctcgg agtacctgag ccccgggctg gtgcagttcg cccgcgccac cgacagctac 19200

ttcagcctga gtaacaagtt taggaacccc acggtggcgc ccacgcacga tgtgaccacc 19260

gaccggtccc agcgcctgac gctgcggttc atccccgtgg accgcgagga caccgcgtac 19320

tcttacaagg cgcggttcac cctggccgtg ggcgacaacc gcgtgctgga catggcctcc 19380

acctactttg acatccgcgg cgtgctggac aggggcccca cctttaagcc ctactccggc 19440

actgcctaca actccctggc ccccaagggc gcccccaacc cctgtgagtg ggatgaagcc 19500

gttactgctg ttgacattaa cctggatgag ctcggcgaag atgaagacga cgccgaaggg 19560

gaagcagaac agcaaaaaac tcatgtattt ggtcaagcgc cctactcagg acaaaacatt 19620

acgaaggagg gcatacaaat tggggtagat accaccagcc aagcccaaac acctttatac 19680

gctgacaaaa cattccaacc cgaacctcag gttggagaat cccaatggaa tgagacagaa 19740

atcaattatg gagcgggacg agtgctaaaa aagaccaccc tcatgaaacc atgctatggg 19800

tcatatgcaa gacctactaa tgaaaacggc ggtcagggca tactgctgga gaaagagggt 19860

ggtaaaccag aaagtcaagt tgaaatgcaa tttttttcta ctactcaggc cgccgcggct 19920

ggtaattcag ataatcttac tccaaaagtt gttttgtata gcgaggatgt tcacctggaa 19980

acgccagata cacacatttc atatatgccc actagcaacg aagccaattc aagagaactg 20040

ttgggacaac aagctatgcc caacagaccc aactacattg ccttcagaga caactttatt 20100

ggccttatgt attacaacag cactggcaac atgggagtgc tggcaggtca ggcctcacag 20160

ttgaatgcag tggtggactt gcaagacaga aacacagaac tgtcctacca gctcttgctt 20220

gattccatgg gagacagaac cagatacttt tccatgtgga atcaggcggt ggacagttat 20280

gatccagatg ttagaattat tgaaaatcat ggaactgaag atgagctgcc caactattgt 20340

ttccccctgg gcggcataat taacaccgaa actttaacta aagtgaaacc taagactgga 20400

caagacgctc agtgggaaaa agatactgag ttttcagaga aaaatgaaat aagggtggga 20460

aacaacttcg ccatggagat taacctcaat gccaacctgt ggaggaattt cctgtactcc 20520

aacgtggccc tgtacctgcc agacaaactt aagtacactc cagccaacgt gcagatttcc 20580

agcaactcca actcctacga ctacatgaac aagcgagtgg tggccccggg gctggtggac 20640

tgctacatca acctgggcgc gcgctggtcc ctggactaca tggacaacgt caaccccttc 20700

aaccaccacc gcaatgcggg cctgcgctac cgctccatgc ttctgggcaa cgggcgctac 20760

gtgcccttcc acatccaggt gccccagaag ttctttgcca tcaagaacct cctcctcctg 20820

ccgggctcct acacctacga gtggaacttc aggaaggatg tcaacatggt cctccagagc 20880

tctctgggta acgacctcag ggtcgacggg gccagcatca agttcgagag catctgcctc 20940

tacgccacct tcttccccat ggcccacaac acggcctcca cgctcgaggc catgctcagg 21000

aacgacacca acgaccagtc cttcaacgac tacctctccg ccgccaacat gctctacccc 21060

atccccgcca acgccaccaa cgtccccatc tccatcccct cgcgcaactg ggcggccttc 21120

cgcggctggg ccttcactcg cctcaagacc aaggagaccc cctccctggg ctcgggtttc 21180

gacccctact acacctactc gggctccata ccctacctgg acggaacctt ctacctcaac 21240

cacaccttca agaaggtctc ggtcaccttc gactcctcgg tcagctggcc gggcaacgac 21300

cgcctgctca cccccaacga gttcgagatc aagcgctcgg tcgacgggga gggctacaac 21360

gtggcccagt gcaacatgac caaggactgg ttcctcatcc agatgctggc caactacaac 21420

atcggctatc agggcttcta catcccagag agctacaagg acaggatgta ctccttcttt 21480

aggaacttcc agcccatgag ccggcaggtg gtggacgaaa ccaagtacaa ggactaccag 21540

caggtgggca tcatccacca gcacaacaac tcgggcttcg tgggctacct cgcccccacc 21600

atgcgcgagg gacaggccta ccccgccaac ttcccctacc cgctcattgg caagaccgcg 21660

gtcgacagcg tcacccagaa aaagttcctc tgcgaccgca ccctctggcg catccccttc 21720

tccagcaact tcatgtccat gggtgcgctc acggacctgg gccagaacct gctctatgcc 21780

aactccgccc acgcgctcga catgaccttc gaggtcgacc ccatggacga gcccaccctt 21840

ctctatgttc tgttcgaagt ctttgacgtg gtccgggtcc accagccgca ccgcggcgtc 21900

atcgagaccg tgtacctgcg cacgcccttc tcggccggca acgccaccac ctaaagaagc 21960

aagccgccac cgccaccacc tgcatgtcgt cgggttccac cgagcaggag ctcaaggcca 22020

tcgtcagaga cctgggatgc gggccctatt ttttgggcac cttcgacaaa cgcttcccgg 22080

gcttcgtcgc cccgcacaag ctggcctgcg ccatcgtcaa cacggccggc cgcgagaccg 22140

ggggcgtgca ctggctggcc ttcgcctgga acccgcgctc caaaacatgc tacctctttg 22200

accccttcgg attctcggac cagcggctca agcagatcta ccagttcgag tacgagggcc 22260

tgctgcgccg cagcgccatc gcctcctcgc ccgaccgctg cgtcaccctc gagaagtcca 22320

cccagaccgt gcaggggccc gactcggccg cctgcggtct cttctgctgc atgttcctgc 22380

atgcctttgt gcgctggccc cagagtccca tggaccgcaa ccccaccatg aacttgctga 22440

cggggatccc caactccatg ctccagagcc cccaggccgc gcccaccctg cgccgcaatc 22500

aggagcgact ctacagcttc ctggagcgcc actcgcccta cttccgccgc cacagcgcgc 22560

agatcagggg ggccacctct ttctgccgca tgcaagagat gcaagggaaa atgcaatgat 22620

gtacacagac actttttctt ttctcaataa atggcaactt tatttataca tgctctctct 22680

ctcgggtatt catttcccca ccacccacca cccgccgccg ccgtaaccat ctgctgctgg 22740

cttttttaaa aatcgaaagg gttctgccgg gaatcgccgt gcgccacggg cagggacacg 22800

ttgcggaact ggtagcgggt gccccacttg aactcgggca ccaccatgcg gggcaagtcg 22860

gggaagttgt cggcccacag gccgcgggtc agcaccagcg cgttcatcag gtcgggcgcc 22920

gagatcttga agtcgcagtt ggggccgccg ccctgcgcgc gcgagttgcg gtacaccggg 22980

ttgcaacact ggaacaccag cagcgccgga taattcacgc tggccagcac gctccggtcg 23040

gagatcagct cggcgtccag gtcctccgcg ttgctcagcg cgaacggggt cagcttgggc 23100

acctgccgcc ccaggaaggg agcgtgtccc ggcttggaat tgcagtcgca gcgcagcggg 23160

atcagcaggt gcccgcggcc ggactcggcg ttggggtaca gcgcgcgcat gaaggcctcc 23220

atctggcgga aggccatctg ggccttggcg ccctccgaga aaaacatgcc gcaggacttg 23280

cccgagaact ggttcgcggg gcagctcgcg tcgtgcaggc agcagcgcgc gtcggtgttg 23340

gcgatctgca ccacgttgcg cccccaccgg ttcttcacga tcttggcctt ggaagcctgc 23400

tccttcagcg cgcgctgccc gttctcgctg gtcacatcca tctcgatcac gtgctccttg 23460

ttcaccatgc tgctgccgtg cagacacttc agctcgccct ccacctcggt gcagcggtgc 23520

tgccacagcg cgcagcccgt gggctcgaaa tgcttgtagg tcacctccgc gtaggactgc 23580

aggtaggcct gcaggaagcg ccccatcatg gtcacgaagg tcttgttgct gctgaaggtc 23640

agctgcagcc cgcggtgctc ctcgttcagc caggccttgc acacggccgc cagcgcctcc 23700

acctggtcgg gcagcatctt gaagttcagc ttcagctcat tctccacatg gtacttgtcc 23760

atcagcgcgc gcgcagcctc catgcccttc tcccaggccg acaccagcgg caggctcaag 23820

gggttcacca ccgtcgcagt cgccgccgcg ctttcgcttt ccgctccgct gttctcttct 23880

tcctcctcct cctcttcttc ctcgccgccc gcgcgcagcc cccgcaccac ggggtcgtct 23940

tcctgcaggc gccgcaccga gcgcttgccg ctcctgccct gcttgatgcg cacgggcggg 24000

ttgctgaagc ctaccatcac cagcgcggcc tcttcttgct cgtcctcgct gtccactatg 24060

acctcggggg agggcgacct cagtaccgtg gcgcgctgcc tcttcttttt cctgggggcg 24120

tttgcaagct ccgcggccgc ggccgccgcc gaggtcgaag gccgagggct gggcgtgcgc 24180

ggcaccagcg cgtcctgcga gccgtcctcg tcctcggact cgaggcggca gcgagcccgc 24240

ttcttcgggg gcgcgcgggg cggcggcggc gggggcggcg gcgacggaga cggggacgag 24300

acatcgtcca gggtgggagg acggcgggcc gcgccgcgtc cgcgctcggg ggtggtttcg 24360

cgctggtcct cttcccgact ggccatctcc cactgctcct tctcctatag gcagaaagag 24420

atcatggagt ctctcatgca agtcgagaag gaggaggaca gcctaaccac caccgccccc 24480

tctgagccct ccgccgccgc cgccgcggac gacgcgccca ccaccgccgc cgccaccacc 24540

accattacca ccctacccgg cgacgcagcc ccgatcgaga aggaagtgtt gatcgagcag 24600

gacccgggtt ttgtgagcga agaggaggat gaggaggatg aaaaggagaa ggataccgcc 24660

gcctcagtgc caaaagagga taaaaagcaa gaccaggacg acgcagagac agatgaggca 24720

gcagtcgggc ggggggacga gaggcatgat gatgatgacg gctacctaga cgtgggagac 24780

gacgtgctgc ttaagcacct gcaccgccag tgcgtcatcg tctgcgacgc gctgcaggag 24840

cgctgcgaag tgcccctgga cgtggcggag gtcagccgcg cctacgagcg gcacctcttc 24900

gcgccacacg tgccccccaa gcgccgggag aacggcacct gcgagcccaa cccgcgcctc 24960

aacttctacc cggtcttcgc ggtacccgag gtgctggcca cctaccacat cttcttccaa 25020

aactgcaaga tccccctctc ctgccgcgcc aaccgcaccc gcgccgacaa gacgctggcc 25080

ctgcggcagg gcgcccacat acctgatatc gcctctctgg aggaggtgcc caagatcttc 25140

gagggtctcg gtcgcgacga gaaacgggcg gcgaacgctc tgcaaggaga cagcgaaaac 25200

gagagtcact cgggggtgct ggtggagctc gagggcgaca acgcgcgcct ggccgtgctc 25260

aagcgcagca tcgaagtcac ccacttcgcc tacccggcgc tcaacctgcc ccccaaggtc 25320

atgagtgtgg tcatgagcga gctcatcatg cgccgcgccc agcccctgga cgcggatgca 25380

aacttgcaag agccctccga ggaaggcctg cccgcggtca gcgacgagca gctggcgcgc 25440

tggctggaga cccgcgaccc cgcccagctg gaggagcggc gcaagctcat gatggccgcg 25500

gtgctcgtca ccgtggagct cgagtgtctg cagcgcttct tcggggaccc cgagatgcag 25560

cgcaagctcg aggagaccct gcactacacc ttccgccagg gctacgtgcg ccaggcctgc 25620

aagatctcca acgtggagct ctgcaacctg gtctcctacc tgggcatcct gcacgagaac 25680

cgcctcgggc agaacgtcct gcactccacc ctcaaagggg aggcgcgccg cgactacgtc 25740

cgcgactgcg tctacctctt cctctgctac acgtggcaga cagccatggg ggtctggcag 25800

cagtgcctgg aggagcgcaa cctcaaggag ctggagaagc tcctccggcg cgccctcagg 25860

gacctctgga cgggcttcaa cgagcgctcg gtggccgccg cgctggcgga catcatcttc 25920

cccgagcgcc tgctcaaaac cctgcagcag ggcctgcccg acttcaccag ccagagcatg 25980

ctgcagaact tcaggacctt catcctggag cgctcgggca tcctgccggc cacctgctgc 26040

gcgctgccca gcgacttcgt gcccatcagg tacagggagt gcccgccgcc gctctggggc 26100

cactgctacc tcttccagct ggccaactac ctcgcctacc actcggatct catggaagac 26160

gtgagcggcg agggcctgct cgagtgccac tgccgctgca acctgtgcac gccccaccgc 26220

tctctagtct gcaacccgca gctgctcagc gagagtcaga ttatcggtac ctttgagctg 26280

cagggtccct cgcccgacga aaagtccgcg gctccggggt tgaaactcac tccggggctg 26340

tggacttccg cctacctacg caaatttgta cctgaagact accacgccca cgagatcagg 26400

ttttacgaag accaatcccg cccgcccaag gcggagctca ccgcctgcgt cattacccag 26460

ggccacatcc tgggccaatt gcaagccatc aacaaagccc gccaagagtt cttgctgaaa 26520

aagggtcggg gggtgtacct ggacccccag tccggcgagg agctaaaccc gctacccccg 26580

ccgccgcccc agcagcggga ccttgcttcc caggatggca cccagaaaga agcagccgcc 26640

gccgccgcca gcatacatgc ttctggagga agaggaggac tgggacagtc aggcagagga 26700

ggtttcggac gaggacgagg aggaggagat gatggaagac tgggaggagg acagcctaga 26760

cgaggaagct tcagaggccg aagaggtggc agacgcaaca ccatcaccct cggccgcagc 26820

cccctcgccg gcgcccccga aatcctccga ccccagcagc agcgctataa cctccgctcc 26880

tccggcgccg gcgcccaccc gcagcagacc caaccgtaga tgggacacta caggaaccgg 26940

ggtcggtaag tccaagtgcc ccccagcgcc gcccccgcaa caggagcaac agcagcagca 27000

gcggcgacag ggctaccgct cgtggcgcgg acacaaaaac gccatagtcg cctgcttgca 27060

agactgcggg ggcaacatct ccttcgcccg ccgcttcctg ctcttccacc acggggtggc 27120

ttttccccgc aatgtcctgc attactaccg tcatctctac agcccctact gcggcggcag 27180

cggcgaccca gagggagcgg cggcagcagc agcgccagcc acagcggcga ccacctagga 27240

agacctccgc gggcaagacg gcgggagccg ggagacccgc ggcggcggcg gtagcggcgg 27300

cggcgggcgc actgcgcctc tcgcccaacg aacccctctc gacccgggag ctcagacaca 27360

ggatcttccc cactctgtat gctatcttcc agcagagcag aggccaggaa caggagctga 27420

aaataaaaaa cagatctctg cgctccctca cccgcagctg tctgtatcac aaaagcgaag 27480

atcagcttcg gcgcacgctg gaggacgcgg aggcactctt cagcaaatac tgcgcgctga 27540

ctcttaagga ctagccgcgc gcccttctcg aatttaggcg ggagaaagac tacgtcatcg 27600

ccgaccgccg cccagcccac ccagccgaca tgagcaaaga gattcccacg ccctacatgt 27660

ggagctacca gccgcagatg ggactcgcgg cgggagcggc ccaagactac tccacccgca 27720

tgaactacat gagcgcgggg ccccacatga tctcacgggt taatgggatc cgcgcccagc 27780

gaaaccaaat actgctggaa caggcggcca taaccgccac accccgtcat gacctcaatc 27840

cccgaaattg gcccgccgcc ctcgtgtacc aggaaacccc ctctgccacc accgtggtac 27900

ttccgcgtga cacccaggcc gaagtccaga tgactaactc aggggcgcag ctcgcgggcg 27960

gctttcgtca cggggtgcgg ccgcaccggc cgggtatatt acacctggcg atcagaggcc 28020

gaggtattca gctcaacgac gagtcggtga gctcttcgct cggtctccgt ccggacggaa 28080

ccttccagat cgccggatca ggtcgctcct cattcacgcc tcgccaggcg tatctgactc 28140

tgcagacctc ctcctcggag cctcgctccg gcggcatcgg caccctccag ttcgtggagg 28200

agttcgtgcc ctcggtctac ttcaacccct tctcgggacc tcccggacgc taccccgacc 28260

agttcatccc gaactttgac gcggtgaagg actcggcgga cggctacgac tgaatgtcaa 28320

gtgctgaggc agagagcgtt cgcctgaaac acctccagca ctgccgccgc ttcgcctgct 28380

tcgcccgcag ctccggtgag ttctgctact ttcagctgcc cgaggagcat accgaggggc 28440

cggcgcacgg cgtccgccta accacccagg gcgaggttac ctgtaccctt atccgggagt 28500

ttaccctccg tcccctgcta gtggagcggg agcggggttc ttgtgtcata actatcgcct 28560

gcaactgccc taaccctgga ttacatcaag atctttgttg tcacctgtgc gctgagtata 28620

ataaacgctg agatcagact ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtc 28680

ttcacccacc ccgagcagcc ccaggcgaac ctcacctgcg gcctgcgtcg gagggccaag 28740

aagtacctca cctggtactt caacggcacc ccctttgtgg tttacaacag cttcgaccag 28800

gacggagttg ccttgagaga cgacctttcc ggtctcagct actccattca caagaacacc 28860

accctccacc tcttccctcc ctacctgccg ggaacctacg agtgcgtcac cggccgctgc 28920

acccacctcc tccgcctgat cgtaaaccag acctttccgg gaacacacct cttccccaga 28980

acaggaggtg agctcaggaa accccctggg gcccagggcg gagacttacc ttcgaccctt 29040

gtggggttag gattttttat cgccgggttg ctggctctcc tgatcaaagc ttccttcaga 29100

tttgttctct ccctttactt ttatgaacag ctcaacttct aataacacta ccttttctca 29160

ggaatcgggt agtgacttct cttctgaaat cgggctgggt gtgctgctta ctctgttgat 29220

ttttttcctt atcatactta gccttctgtg cctcaggctc gccgcctgct gcgcacatat 29280

ctacatctac agccggttgc ttaactgctg gggtcgccat ccaagatgaa cggggctcag 29340

gtgctatgtc tgctggccct ggtggcctgc agtgccgccc tcaattttga ggaacccgct 29400

tgcaatgtga ctttcaagcc tgagggcgca cattgcacca ctctggttaa atgtgtgacc 29460

tctcatgaaa aactgctcat cgcctacaaa aacaaaacag gcgagttcgc ggtctatagt 29520

gtgtggcaac ccggagacca taataactac tcagtcaccg tcttcgaggg tgcggagtct 29580

aagaaattcg attacacctt tcccttcgag gagatgtgtg atgcggtcat gtacctgtcc 29640

aaacagcaca agctgtggcc ccccaccccc gaggcgtgtg tggaaaacac tgggtctttc 29700

tgctgtctct ctctggcaat cactgtgctt gctctaatct gcacgctgct atacatgaga 29760

ttcaggcaga ggcgaatctt tatcgatgag aaaaaaatgc cttgatcgct aacaccggct 29820

ttctgtctgc agaatgaaag caatcacctc cctactaatc agcaccaccc tccttgcgat 29880

tgcccatggg ttgacacgaa tcgaagtgcc agtggggtcc aatgtcacca tggtgggccc 29940

cgccggcaat tcctccctga tgtgggaaaa atatgtccgt aatcaatggg atcattactg 30000

ctctaatcga atctgtatca agcccagagc catctgcgac gggcaaaatc taactttgat 30060

tgatgtgcaa atgacggatg ctgggtacta ttacgggcag cggggagaaa tgattaatta 30120

ctggcgaccc cacaaggact acatgctgca tgtagtcaag gcagtcccca ctactaccac 30180

ccccaccact accactccca ctactaccac ccccactact accactagca ctgctactac 30240

cgctgcccgc aaagctatta cccgcaaaag caccatgctt agcaccaagc cccattctca 30300

ctcccacgcc ggcgggccca ccggtgcggc ctcagaaacc accgagcttt gcttctgcca 30360

atgcactaac gccagcgccc acgaactgtt cgacctggag aatgaggacg atgaccagct 30420

gagctccgct tgcccggtcc cgctgcccgc agagccggtc gccctgaagc agctcggtga 30480

tccatttaat gactctcctg tttatccctc tcccgaatac ccgcccgact ctaccttcca 30540

catcacgggc accaacgacc ccaacctctc cttctacctg atgctgctgc tttgtatctc 30600

tgtggtatct tccgcgctca tgttactggg catgttctgc tgcctcatct gccgcagaaa 30660

gagaaagtct cgctctcagg gccaaccact gatgcccttc ccctaccccc cagattttgc 30720

agataacaag atatgagcac gctgctgaca ctaaccgctt tactcgcctg cgctctaacc 30780

cttgtcgctt gcgaatccag ataccacaat gtcacagttg tgacaggaga aaatgttaca 30840

ttcaactcca cggccgacac ccagtggtcg tggagcggcc acggtagcta tgtatacatc 30900

tgcaatagct ccacctcccc tagcatgtcc tctcccaagt accactgcaa tgccagcctg 30960

ttcaccctca tcaacgcctc cacctcggac aatggactct atgtaggcta tgtgacaccc 31020

ggtgggcggg gaaagaccca cgcctacaac ctgcaagttc gccacccctc caccaccgcc 31080

accacctctg ccgcccctac ccgcagcagc agcagcatca gcagcagcag cagcagcagc 31140

agattcctga ctttaatcct agccagctca acaaccaccg ccaccgctga gaccacccac 31200

agctccgcgc ccgaaaccac ccacacccac cacccagaga cgaccgcggc ctccagtgac 31260

cagatgtcgg ccaacatcac cgcctcgggt cttgaacttg cttcaacccc caccccaaaa 31320

ccagtggatg cagccgacgt ctccgccctc gtcaatgact gggcggggct gggaatgtgg 31380

tggttcgcca taggcatgat ggcgctctgc ctgcttctgc tctggctcat ctgctgcctc 31440

aaccgcaggc gggccagacc catctataga cccatcattg ttctcaaccc cgctgatgat 31500

gggatccata gattggatgg tctgaaaaac ctacttttct cttttacagt atgataaatt 31560

gagacatgcc tcgcattttc atgtacttga cacttctccc actttttctg gggtgttcta 31620

cgctggccgc cgtctctcac ctcgaggtag actgcctcac acccttcact gtctacctga 31680

tttacggatt ggtcaccctc actctcatct gcagcctaat cacagtagtc atcgccttca 31740

tccagtgcat tgactacatc tgtgtgcgcc tcgcatacct gagacaccac ccgcagtacc 31800

gagacaggaa cattgcccaa ctcctaagac tgctctaatc atgcataaga ctgtgatctg 31860

cctcctcatc ctcctctccc tgcccgctct cgtctcatgc cagcccacca caaaacctcc 31920

acgaaaaaga catgcctcct gtcgcttgag ccaactgtgg aatattccca aatgctacaa 31980

tgaaaagagc gagctttccg aagcctggct atatgcggtc atgtgtgtcc ttgtcttctg 32040

cagcacaatc tttgccctca tgatctaccc ccactttgat ttgggatgga atgcggtcga 32100

tgccatgaat taccctacct ttcccgcgcc cgatatgatt ccactccgac aggttgtggt 32160

gcccgtcgcc ctcaatcaac gccccccatc ccctacaccc actgaggtca gctactttaa 32220

tctaacaggc ggagatgact gacactctag atctagaaat ggacggcatc ggcaccgagc 32280

agcgtctcct acagaggcgc aagcaggcgg ctgaacaaga gcgcctcaat caggagctcc 32340

gagatctcat taacctgcac cagtgcaaaa aaggcatctt ttgcctggtc aagcaggccg 32400

atgtcaccta cgagaaaacc ggtaacagcc accgcctcag ctacaagctg cccacccaac 32460

gccagaagtt ggtgctcatg gtgggtcaga atcccatcac cgtcacccag cactcggtgg 32520

agaccgaggg gtgtctgcac tccccctgtc agggtccgga agacctctgc accctggtaa 32580

agaccctgtg tggtcttaga gatttaatcc cctttaacta atcaaacact ggaatcaata 32640

aaaagaatca cttactttaa atcagtcagc aggtctctgt ccactttatt cagcagcacc 32700

tccttcccct cctcccaact ctggtactcc aaacgcctcc tggcggcaaa cttcctccac 32760

accctgaagg gaatgtcaga ttcttgctcc tgtccctccg cacccactat cttcatgttg 32820

ttgcagatga agcgcgccaa aacgtctgac gagaccttca accccgtgta cccctatgac 32880

acggaaaacg ggcctccctc cgtccctttc ctcacccctc ccttcgtgtc ccccgacgga 32940

tttcaagaaa gccccccagg ggtcctgtct ctgcgcctgt cagagcccct ggtcacttcc 33000

cacggcatgc ttgccctgaa aatgggaaat ggcctctccc tggatgacgc cggcaacctc 33060

acctctcaag atgtcaccac cgtcacccct cccctcaaaa aaaccaagac caacctcagc 33120

ctccagacct cagcccccct gaccgttagc tctgggtccc tcaccgtcgc ggccgccgct 33180

ccactggcgg tggccggcac ctctctcacc atgcaatctc aggccccctt gacagtgcaa 33240

gatgcaaaac tcggcctggc cacccaggga cccctgaccg tgtctgaagg caaactcacc 33300

ttgcagacat cggctccact gacggccgct gacagcagca ctctcactgt tagtgccaca 33360

cctcccctca gcacaagcaa tggtagtttg agcattgaca tgcaggcccc gatttatacc 33420

accaatggaa aactggcact taacattggt gctcccctgc atgtggtaga caccctaaat 33480

gcactaactg tagtaactgg ccagggtctt accataaatg gaagagccct gcaaactaga 33540

gtcacgggtg ccctcagtta tgacacagaa ggcaacatcc aactgcaagc cggagggggt 33600

atgcgcattg acaataatgg ccaacttatc cttaatgtag cttatccatt tgatgctcaa 33660

aacaacctca gccttagact tggccaaggt cccctaattg ttaactctgc ccacaacttg 33720

gatcttaacc ttaacagagg cctttactta tttacatctg gaaacacgaa aaaactggaa 33780

gttaacataa aaacagccaa aggtctattt tacgatggca ccgctatagc aatcaatgca 33840

ggtgacgggc tacagtttgg gtctggttca gatacaaatc cattgcaaac taaacttgga 33900

ttggggctgg aatatgactc caacaaagct ataatcacta aacttggaac tggcctaagc 33960

tttgacaaca caggtgccat cacagtaggc aacaaaaatg atgacaagct taccttgtgg 34020

accacaccag acccctcccc aaactgcaga attaattcag aaaaagatgc taaactcaca 34080

ctagttttga ctaaatgcgg cagccaggtg ttagccagcg tttctgtttt atctgtaaaa 34140

ggcagccttg cccccatcag cggcacagta actagcgccc agattgtttt aagatttgat 34200

gaaaacggag ttttattgag caattcttct cttgaccccc aatactggaa ctatagaaaa 34260

ggcgattcta cagaaggcac tgcatatact aatgctgtgg gatttatgcc caacctcaca 34320

gcatacccta aaacacagag ccagactgct aaaagcaaca ttgtaagtca agtttacttg 34380

aatggggaca aaacaaaacc catgacccta accatcaccc tcaatggaac taatgaaaca 34440

ggggatgcta cagtaagcac atactccatg tcattttcat ggaactggaa tggaagtaat 34500

tacattaatg acaccttcca aaccaactcc tttaccttct cctacatcgc ccaagaataa 34560

aaaagcatga cgctttgttc tctgattcag tgtgtttctt ttattttttt ttcaattaca 34620

acagaatcat tcaagtcatt ctccatttag cttaatagac ccagtagtgc aaagccccat 34680

actagcttat ttcagacagt ataaattaaa ccataccttt tgatttcaat attaaaaaaa 34740

tcatcacagg atcctagtcg tcaggccgcc ccctccctgc caagacacag aatacacaat 34800

cctctccccc cggctggctt taaacaacac catctggttg gtgacagaca ggttcttcgg 34860

ggttatattc cacacggtct cctggcgggc caggcgctcg tcggtgatgc tgataaactc 34920

tcccggcagc tcgctcaagt tcacgtcgct gtccagcggc tgaacctcat gctgacgcgg 34980

taactgcgcg accggctgct gaacaaacgg aggccgcgcc tacaaggggg tagagtcata 35040

atcctccgtc aggatagggc ggttatgcag cagcagcgag cgaatcatct gctgccgccg 35100

ccgctccgtc cggcaggaaa acaacatccc ggtggtctcc tccgctataa tccgcaccgc 35160

ccgcagcata agcctcctcg ttctccgcgc gcagcaccgc accctgatct cgctcaggtt 35220

ggcgcagtag gtacagcaca tcaccacgat gttattcatg atcccacagt gcaaggcgct 35280

gtatccaaag ctcatgcccg ggaccaccgc ccccacgtga ccgtcgtacc agaagcgcag 35340

gtaaatcaag tgacgacccc tcatgaacgt gctggacata aacatcacct ccttgggcat 35400

gttgtaattc accacctccc ggtaccagat gaatctctga ttgaacacgg ccccttccac 35460

caccatcctg aaccaagagg ctaggacctg cccaccggct atgcactgca gggaacccgg 35520

gttggaacaa tgacaatgca gactccaggg ctcgtaaccg tggatcatcc ggctgctgaa 35580

gacatcgatg ttggcgcaac acagacacac gtgcatacac ttcctcatga ttagcagctc 35640

ctccctcgtc aggatcatat cccaagggat aacccattct tgaatcaacg taaagcccac 35700

agagcaggga aggcctcgca cataactcac gttgtgcatg gtcagcgtgt tgcattccgg 35760

aaacagcgga tgatcctcca gtatcgaggc gcgggtctcg ttctcacagg gaggtaaagg 35820

ggccctgctg tacggactgt ggcgggacga ccgagatcgt gttgagcgta acgtcatgga 35880

aaagggaacg ccggacgtgg tcatacttct tgaagcagaa ccaggctcgc gcgtgacaga 35940

cctccttgcg tctacggtct cgccgcttag ctcgctccgt gtgatagttg tagtacagcc 36000

actctctcaa agcgtcgagg cgacacctgg cgtcaggatg tatgtagact ccgtcttgca 36060

ccgcggccct gataatatcc accaccgtag aataagccac accaagccaa gcaatacact 36120

cgctttgcga gcggcagaca ggaggagcgg ggagagacgg aaggaccatc ataaaatttt 36180

aaagaatatt ttccaatatt tcgaaatcaa gatctaccaa atggcagcgc tcccctccac 36240

tggcgcggtc aaactctacg gccaaagaac agataacggc atttttaaga tgttcccgga 36300

cggcgtctaa aagacaaacc gctctcaagt cgacataaat tataagccaa aagccatcgg 36360

gttcaagatc cactatggac gcgccggcgg cgtccaccaa acccaaataa ttttcttctc 36420

tccagcgctg caaaatccca gtaagcaact ccctgatatt aagatgaacc atgccaaaaa 36480

tctgttcaag agcgccctcc accttcattc tcaagcagcg catcatgatt gcaaaaattc 36540

aggttcctca gacacctgta tgagattcaa aacgggaata ttaacaaaaa ttcctctgtc 36600

gcgcagatcc cttcgcaggg caagctgaac ataatcagac aggtctgaac gaaccagcga 36660

ggccaaatcc ccgccaggaa ccagatccag agaccctatg ctgattatga cgcgcatact 36720

cggggctatg ctaaccagcg tagcgccgat gtaggcgtgc tgcatgggcg gcgaaataaa 36780

atgcaaggtg ctggttaaaa aatcaggcaa agcctcgcgc aaaaaagcta agacatcata 36840

atcatgctca tgcaggtagt tgcaggtaag ctcaggaacc aaaacggaat aacacacgat 36900

tttcctctca aacatgactt ccaggtgact gcataagaaa aaaattataa ataataaata 36960

ttaattaaat aaattaaaca ttggaagcct gtctcacaac aggaaaaacc actctgatca 37020

acataagacg ggccacgggc atgcccgcgt gaccataaaa aaatcggtct ccgtgattac 37080

aaagcaccac agatagctcc ccggtcatgt cgggggtcat catgtgagac tgtgtataca 37140

cgtccgggct gttgacatcg gtcaaagaaa gaaatcgagc tacatagccc ggaggaatca 37200

acacccgcac gcggaggtac agcaaaacgg tccccatagg aggaatcaca aaattagtag 37260

gagaaaaaaa aacataaaca ccagaaaaac cctcttgccg aggcaaaaca gcgccctccc 37320

gttccaaaac aacataaagc gcttccacag gagcagccat gacaaagacc cgagtcttac 37380

caggaaaatt ttaaaaaaga ttcctcaacg cagcaccagc accaacacct gtcagtgtaa 37440

aatgccaagc gccgagcgag tatatatagg aataaaaagt gacgtaaacg gttaaagtcc 37500

agaaaacgcc cagaaaaacc gcacgcgaac ctacgccccg aaacgaaagc caaaaaacag 37560

tgaacacgcc ctttcggcgt caacttccgg tttcccacgg tacgtcactt ccgcatataa 37620

gaaaactacg ctacccaaca tgcaagaagc cacgccccaa aaaacgtcac acctcccggc 37680

ccgccccgcg ccgccgctcc tccccgcccc gccccgctcc gcccacctca ttatcatatt 37740

ggcttcaatc caaaataagg tatattattg atgatg 37776

<210> 63

<211> 37713

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 63

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag gtgggcggag 60

cggggcgggg cggggaggag cggcggcgcg gggcgggccg ggaggtgtgg cggaagttga 120

gtttgtaagt gtggcggatg tgacttgcta gcgccggatg tggtaaaagt gacgtttttg 180

gagtgcgaca acgcccacgg gaagtgacat ttttcccgcg gtttttaccg gatgtcgtag 240

tgaatttggg cgttaccaag taagatttgg ccattttcgc gggaaaactg aaatggggaa 300

gtgaaatctg attaatttcg cgttagtcat accgcgtaat atttgccgag ggccgaggga 360

ctttgaccga ttacgtggag gaatcgccca ggtgtttttg aggtgaattt ccgcgttccg 420

ggtcaaagtc tccgttttat tattatagtc agctgacgcg gagtgtattt atacccgctg 480

atctcgtcaa gaggccactc ttgagtgcca gcgagtagag ttttctcctc tgccgctccg 540

ctccgctctg acaccggggg aaaaaaatga gacatttcac ctacgatggc ggtgtgctta 600

ccggccagct ggctgcctcg gtcctggacg ccctgattga ggacgtattg gccgacaatt 660

atcctcctcc agctcatttt gagccaccta ctcttcacga actgtatgat ttggacgtgg 720

tggcacctag cgacccgaac gagcaggcgg tttccagttt ttttcctgac tctatgctgt 780

tggccagcca ggagggggtc gagctcgaga cccctcctcc aatcgccgtt tctcctgagc 840

ctccgaccct gaccaggcag cccgatcgcc gtgttggacc tgcgactatg ccccatctgc 900

tgcccgaggt gatcgatctc acctgtaacg agtctggttt tccacccagc gaggatgagg 960

acgaagaggg tgagcagttt gtgttagatt ctgtggagga acccgggcgc ggttgcagat 1020

cttgtcaata ccatcggaaa aatacaggag acccccaaat tatgtgttcc ctgtgttata 1080

tgaagacgac ctgtatgttt atttacagta agtttgtgat tggtgggtcg gtgggctgta 1140

gtgtgggtaa gtggtctgtg gttttttttt tttaatatca gcttgggcta aaaaactgct 1200

atggtaattt ttttaaggtc cggtgtctga acctgagcag gaagctgaac cggagcctga 1260

gagtcgcccc aggagaaggc ctgcaattct aactagaccg agtgcacctg tagcgaggga 1320

cctcagcagt gcagagacca ccgattctgg tccttcctca tcccctccag agattcatcc 1380

cgtggtgcct ttgtgtcccc tcaagcccgt tgccgtgaga gttagtgggc ggagggccgc 1440

cgtggagagc attgaggact tgcttaatga gacacaggaa cctttggact tgagctgtaa 1500

acgccctagg caataaacct gcttacctgg actgaatgag ttgacgccta tgtttgcttt 1560

tgaatgactt aatgtgtata taataaagag tgagataatg tttaattgca tggtgtgttt 1620

gattggggcg gggtttgttg ggtatataag cttccctggg ctaaacttgg ttacacttga 1680

cctcatggag gcctgggagt gtttagagag ctttgccgaa gtgcgtgcct tgctggaaga 1740

gagctctaat aatacctctg ggtggtggag gtatttttgg ggctctcccc aggctaagtt 1800

agtttgtaga atcaaggagg attacaagtg ggaatttgaa cagcttttga aatcctgtgg 1860

tgagctcttg gattctttga atctgggcca ccaggctctt ttccaggaca agatcatcag 1920

gactttggat ttttccacac cggggcgcat tgctgccggg gttgcttttc tagctttttt 1980

gaaggataaa tggagcgaag agacccactt gagttcggga tacgtcctgg attttctggc 2040

catacaactg tggagagcat ggatcaggca caagaacaga atgcaactgt tgtcttccgt 2100

ccgtccgttg ctgattcagc cggaggagca gcagaccggg ccggaggacc gggctcgtct 2160

ggaaccagaa gagagggcac cggagaggag cgcgtggaac ctgggagccg gcctgaacgg 2220

ccatccacat cgggagtgaa tgttggacag gtggcggatc tctttccaga actgcgacga 2280

atcttaacta tcagggagga tggacaattt gttaaggggc ttaagaggga gcggggggct 2340

tctgaacata acgaggaggc cagtaattta gcttttagtc tgatgaccag acaccgtccc 2400

gagtgcatta cttttcagca gattaaggat aattgtgcca atgagttaga tctgctgggt 2460

cagaagtaca gcatagagca gttgaccact tactggctgc agccgggtga tgatctggag 2520

gaagctatta gggtgtatgc caaggtggcc ctgaggcccg attgcaagta caagctcaag 2580

gggctggtga atatcaggaa ttgttgctac atttctggga acggggcgga ggtggagata 2640

gagaccgatg acagggtggc ctttaggtgt agcatgatga atatgtggcc tggggtgctg 2700

ggcatggacg gggtggtgat tatgaatgtg aggttcacgg ggcccaattt taatggcacg 2760

gtgttcctgg gcaacaccaa cttggtgctg cacggggtga gcttctatgg ctttaacaac 2820

acctgtgtgg aggcctggac cgatgtgaag gtccgtggct gtgccttcta cggatgttgg 2880

aaggcggtag tgtgtcgccc caagagcagg agttccatta aaaaatgctt gtttgagagg 2940

tgcaccctgg gggtgctggc ggagggcaac tgtcgggtgc gccacaatgt ggcctcagaa 3000

tgcggttgct tcatgctagt caagagcgtg gcggtcatca agcataacat ggtgtgcggc 3060

aacagcgagg acaaggcctc gcagatgctg acctgctcgg atggcaactg ccacttactg 3120

aagaccgtac atataaccag ccacagccgc aaggcctggc ccgtgttcga gcacaacgtg 3180

ttgacccgct gctctttgca tctgggcaac aggaggggtg tgttcctgcc ctatcaatgc 3240

aacttgagcc acaccaagat cttgctagag cccgaaagca tgtccaaggt gaacctgaac 3300

ggggtgtttg acatgaccct gaagatatgg aaggtgctga ggtacgacga gaccaggtct 3360

cgatgcaggc cctgcgagtg cgggggcaag catatgagga accagcctgt gatgctggat 3420

gtgaccgagg agctgaggcc tgaccacttg gttctggcct gcaccagggc cgagtttggt 3480

tctagcgatg aagacacaga ctgaggtggg tgagtgggcg tggtctgggg gtgggaagca 3540

atatataagt tgggggtctt agggtctctg tgtctgtttt gcagagggac cgccggcgcc 3600

atgagcggga gcagtagcag caacgccttg gatggcagca tcgtgagccc ttatttgacg 3660

acgcgcatgc cccactgggc cggggtgcgt cagaatgtga tgggctccag catcgacgga 3720

cgacccgtgc tgcccgcaaa ttccgccacg ctgacctacg cgaccgtcgc ggggaccccg 3780

ttggacgcca ccgccgccgc cgccgccacc gccgccgcct cggccgtgcg cagcctggcc 3840

acggactttg cattcttggg acccttggcc accggggcgg ccgcccgtgc cgccgttcgc 3900

gatgacaagc tgaccgccct gctggcgcag ttggatgcgc ttacccggga actgggtgac 3960

ctttcgcagc aggtcgtggc cctgcgccag caggtctccg ccctgcaggc tagcgggaat 4020

gcttctcctg caaatgccgt ttaagataaa taaaaccaga ctctgtttgg attaaagaaa 4080

agtagcaagt gcattgctct ctttatttca taattttccg cgcgcgatag gcccgagtcc 4140

agcgttctcg gtcgttgagg gtgcggtgta tcttctccag gacgtggtag aggtggctct 4200

ggacgttgag atacatgggc atgagcccgt cccgggggtg gaggtagcac cactgcagag 4260

cttcatgctc cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcatggt 4320

gcctaaaaat gtccttaagc agcaggccga tggccagggg gaggcccttg gtgtaagtgt 4380

ttacaaaacg gttgagttgg gaagggtgca tgcggggtga gatgatgtgc atcttagatt 4440

gtatttttag attggcgatg tttcctccca gatcccttct gggattcatg ttgtggagga 4500

ccaccagcac agtatatccg gtgcacttgg gaaatttgtc atgcagctta gagggaaatg 4560

cgtggaagaa cttggagacg cccttgtggc ctcccagatt ctccatgcat tcgtccatga 4620

tgatggcaat gggcccgcgg gaggcggcct gggcaaagat gtttctgggg tcactgacat 4680

cgtagttgtg ttccagggtg agatcgtcat aggccatttt tataaagcgc gggcggaggg 4740

tgcccgactg ggggatgatg gttccctcgg gccccggggc gtagttgcct tcgcagatct 4800

gcatttccca ggccttaatc tctgaggggg gaatcatatc cacttgcggg gcgatgaaga 4860

aaacggtttc cggagccggg gagattaact gggatgagag caggtttctc agcagctgtg 4920

actttccaca gccggtgggt ccataaataa cacctataac cggctgcagc tggtagttga 4980

gcgagctgca gctgccgtcg tcccggagga ggggggccac ctcattgagc atgtcccgga 5040

cgcgcttgtt ctcctcgacc aggtccgcca gaaggcgctc gccgcccagg gacagcagct 5100

cttgcaagga agcaaagttt ttcagcggtt tgaggccgtc cgccgtgggc atgtttttca 5160

gggtctggcc gagcagctcc aggcggtccc agagctcggt gacgtgctct acggcatctc 5220

tatccagcat atctcctcgt ttcgcgggtt ggggcggctt tcgctgtagg gcaccaggcg 5280

atggtcgtcc agcgcggcca gagtcatgtc cttccatggg cgcagggtcc tcgtcagggt 5340

ggtctgggtc acggtgaagg ggtgcgcccc gggctgggcg ctggccaggg tgcgcttgag 5400

actggtcctg ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca 5460

tttgaccatg gtgtcgtagt ccagcccctc cgcggcgtgt cccttggcgc gcagcttgcc 5520

cttggaggtg gcgccgcacg cggggcactg caggctcttg agcgcgtaga gcttgggggc 5580

gaggaagacc gattcggggg agtaggcgtc cgcgccgcag gccccgcaca cggtctcgca 5640

ctccaccagc caggtgagct cggggcgctc ggggtcaaaa accaggtttc ccccatgctt 5700

tttgatgcgt ttcttacctc gggtctccat gaggcggtgt ccccgttcgg tgacgaagag 5760

gctgtccgtg tctccgtaga ccgacttgag gggtctgtcc tccagggggg tccctcggtc 5820

ctcttcgtag agaaactcgg accactctga gacaaaggcc cgcgtccagg ccaggacgaa 5880

ggaggccagg tgggaggggt accggtcgtt gtccactagg gggtccacct tctccaaggt 5940

gtgaagacac atgtcgccct cctcggcgtc caggaaggtg attggcttgt aggtgtaggc 6000

cacgtgaccc ggggttccgg acgggggggt ataaaagggg gtgggggcgc gctcgtcctc 6060

actctcttcc gcatcgctgt ctgcgagggc cagctgctgg ggtgagtatt ccctctcgaa 6120

ggcgggcatg acctcagcgc tgaggctgtc agtttctaaa aacgaggagg atttgatgtt 6180

cacctgtccc gagctgatgc ctttgagggt gcccgcgtcc atctggtcag aaaacacgat 6240

ctttttattg tccagcttgg tggcgaacga cccgtagagg gcgttggaga gcagcttggc 6300

gatggagcgc agggtctgat tcttgtcccg gtcggcgcgc tccttggccg cgatgttgag 6360

ctgcacgtac tcgcgcgcga cgcagcgcca ctcggggaag acggtggtgc gctcgtcggg 6420

caccaggcgc acgcgccagc cgcggttgtg cagggtgacg aggtccacgc tggtggcgac 6480

ctcgccgcgc aggcgctcgt tggtccagca gaggcgcccg cccttgcgcg agcagaaggg 6540

gggcaggggg tcgagttggg tttcgtccgg ggggtccgcg tccaccgtga agaccccggg 6600

gcgcaggcgc gcgtcgaagt agtcgatctt gcatccttgc aagtccagcg cccgctgcca 6660

gtcgcgggcg gcgagcgcgc gctcgtaggg gttgagcggc gggccccagg gcatggggtg 6720

ggtgagcgcg gaggcgtaca tgccgcagat gtcatagacg tagaggggct cccggaggat 6780

gcccaggtag gtggggtagc agcggccgcc gcggatgctg gcgcgcacgt agtcgtagag 6840

ctcgtgcgag ggggcgagga ggtcggggcc caggttggtg cgggcggggc gctccgcgcg 6900

gaagacgatc tgcctgaaga tggcatgcga gttggaagag atggtggggc gctggaagac 6960

gttgaagctg gcgtcctgca ggccgacggc gtcgcgcacg aaggaggcgt aggactcgcg 7020

cagcttgtgc accagctcgg cggtgacctg cacgtcgagc gcgcagtagt cgagggtctc 7080

gcggatgatg tcatacttag cctgcccctt ctttttccac agctcgcggt tgaggacgaa 7140

ctcttcgcgg tctttccagt actcttggat cgggaaaccg tccggctccg aacggtaaga 7200

gcccagcatg tagaactggt tgacggcctg gtaggcgcag cagcccttct ccacgggcag 7260

ggcgtaggcc tgcgcggcct tgcggagcga ggtgtgggtc agggcgaagg tgtccctgac 7320

catgaccttg aggtactggt gtttgaagtc ggagtcgtcg cagccgcccc gctcccagag 7380

cgagaagtcg gtgcgctttt tggagcgggg gttgggcagc gcgaaggtga catcgttgta 7440

gaggatcttg cccgcgcgag gcatgaagtt gcgggtgatg cggaagggcc ccggcacttc 7500

cgagcggttg ttgatgacct gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg 7560

gcccacgatg tagagttcca ggaagcgggg ccggcccttg acgctgggca gcttctttag 7620

ctcttcgtag gtgagctcct cgggcgaggc gaggccgtgc tcggccaggg cccagtccgc 7680

caggtgcggg ttgtccgcga ggaaggaccg ccagaggtcg cgggccagga gggtctgcag 7740

gcggtccctg aaggtcctga actggcggcc tacggccatc ttttcggggg tgacgcagta 7800

gaaggtgagg gggtcttgct gccaggggtc ccagtcgagc tccagggcga ggtcgcgcgc 7860

ggcggcgacc aggcgctcgt cgcccccgaa tttcatgacc agcatgaagg gcacgagctg 7920

ctttccgaag gcgcccatcc aagtgtaggt ctctacatcg taggtgacaa agagacgttc 7980

cgtgcgagga tgcgagccga tcgggaagaa ctggatctcc cgccaccagt tggaggagtg 8040

gctgttgatg tggtgaaagt agaagtcccg tcggcgggcc gagcactcgt gctggctttt 8100

gtaaaagcga gcgcagtact ggcagcgctg cacgggctgt acctcttgca cgagatgcac 8160

ctgccgaccg cggacgagga agctgagtgg gaatctgagc cccccgcatg gctcgcggcc 8220

tggctggtgc tcttctactt tggatgcgtg gccgtcaccg tctggctcct cgaggggtgt 8280

tacggtggag cggatcacca cgccgcgcga gccgcaggtc cagatatcgg cgcgcggcgg 8340

tcggagtttg atgacgacat cgcgcagctg ggagctgtcc atggtctgga gctcccgcgg 8400

cggcggcagg tcagccggga gttcttgcag gtttacctcg cagagacggg ccagggcgcg 8460

gggcaggtcc aggtggtact tgaattcgag aggcgtgttg gtggcggcgt cgatggcttg 8520

cagtatgccg cagccccggg gcgcgacgac ggtgccccgc ggggcggtga agctcccgcc 8580

gccgctcctg ctgtcgccgc cggtggcggg gcttagaagc ggtgccgcgg tcgggccccc 8640

ggaggtaggg ggggctccgg tcccgcgggc aggggcggca gcggcacgtc ggcgccgcgc 8700

gcgggcagga gctggtgctg cgcccggagg ttgctggcga aggcgacgac gcggcggttg 8760

atctcctgga tctggcgcct ctgcgtgaag acgacgggtc cggtgagctt gaacctgaaa 8820

gagagttcga cagaatcaat ctcggtgtca ttgaccgcga cctggcgcag gatctcctgc 8880

acgtcgcccg agttgtcttg gtaggcgatc tcggccatga actgttcaat ctcttcctcc 8940

tggaggtctc cgcgtccggc gcgctccacg gtggccgcca ggtcgttgga gatgcgcgcc 9000

atgagctgcg agaaggcgtt gagtccgccc tcgttccaca ctcggctgta gaccacgccg 9060

ccctggtcgt cgcgggcgcg catgaccacc tgcgcgaggt tgagttccac gtggcgcgca 9120

aagacggcgt agttgcgcag gcgctggaag aggtagttga gggtggtggc ggtgtgctcg 9180

gccacaaaga agtacatgac ccagcggcgc aacgtggatt cgttgatgtc ccccaaggcc 9240

tccagtcgct ccatggcctc gtagaagtcc acggcgaagt tgaaaaactg ggagttgcgc 9300

gccgacacgg tcaactcctc ctccagaaga cggatgagct cggcgacggt gtcgcgcacc 9360

tcgcgctcga aggctatggg aatctcttcc tccgccagca tcaccacctc ttcctcttct 9420

tcctcctctg gcacttccat gatggcttcc tcctcttcgg ggggtggcgg cgggggaggg 9480

ggcgctcggc gccggcggcg gcgcaccggg aggcggtcca cgaagcgctc gatcatctcc 9540

ccgcggcggc gacgcatggt ctcggtgacg gcgcggccgt tctctcgggg acgcagctgg 9600

aagacgccgc cggtcatctg gtgctggggc gggtggccgt ggggcagcga gaccgcgctg 9660

acgatgcatc ttaacaattg ctgcgtaggt acgccgccga gggacctgag ggagtccaga 9720

tccaccggat ccgaaaacct ttcgaggaag gcatctaacc agtcgcagtc gcaaggtagg 9780

ctgagcaccg tggcgggcgg cggggggtgg ggggagtgtc tggcggaggt gctgctgatg 9840

atgtaattga agtaggcggt cttgacacgg cggatggtcg acaggagcac catgtctttg 9900

ggcccggcct gctggatgcg gaggcggtcg gccatgcccc aggcttcgtt ctggcatctg 9960

cgcaggtctt tgtagtagtc ttgcatgagc ctttccaccg gcacctcttc tccttcttct 10020

tctgacatct ctgctgcatc tgcggccctg gggcgacggc gcgcgcccct gccccccatg 10080

cgcgtcaccc cgaaccccct gagcggctgg agcagggcca ggtcggcgac gacgcgctcg 10140

gccaggatgg cctgctggac ctgcgtgagg gtggtttgga agtcatccaa gtccacgaag 10200

cggtggtagg cgcccgtgtt gatggtgtag gtgcagttgg ccatgacgga ccagttgacg 10260

gtctggtggc ccggttgcgt catctcggtg tacctgaggc gcgagtaggc gcgcgagtcg 10320

aagatgtagt cgttgcaagt ccgcaccagg tactggtagc ccaccaggaa gtgcggcggc 10380

ggctggcggt agaggggcca gcggagggtg gcgggggctc cgggggccag gtcttccagc 10440

atgaggcggt ggtattcgta gatgtacctg gacatccagg tgatgcccgc ggcggtggtg 10500

gaggcgcgcg ggaagtcgcg cacccggttc cagatgttgc gcagcggcag aaagtgctcc 10560

atggtaggcg tgctctggcc ggtcaggcgc gcgcagtcgt tgatactcta gaccagggaa 10620

aacgaaagcc ggtcagcggg cactcttccg tggtctggtg gataaattcg caagggtatc 10680

atggcggagg gcctcggttc gagccccggg cccgggccgg acggtccgcc atgatccacg 10740

cggttaccgc ccgcgtgtcg aacccaggtg gcgacgtcag acaacggtgg agtgttcctt 10800

ttgggttttt ttccaaattt ttctggccgg gcgccgacgc cgccgcgtaa gagactagag 10860

tgcaaaagcg aaagcagtaa gtggctcgct ccctgtagcc cggaggatcc ttgctaaggg 10920

ttgcgttgcg gcgaaccccg gttcgagtct ggctctcgct gggccgctcg ggtcggccgg 10980

aaccgcggct aaggcgggat tggcctcccc ctcattaaag accccgcttg cggattcctc 11040

cggacacagg ggacgagccc ctttttactt ttgcttttct cagatgcatc cggtgctgcg 11100

gcagatgcgc cccccgcccc agcagcagca gcagcaacat cagcaagagc ggcaccagca 11160

gcagcgggag tcatgcaggg ccccctcgcc cacgctcggc ggtccggcga cctcggcgtc 11220

cgcggccgtg tctggagccg gcggcggtgg gctggcggac gacccggagg agcccccgcg 11280

gcgcagggcc agacagtacc tggacctgga ggagggcgag ggcctggcgc gactgggggc 11340

gccgtccccc gagcgccacc cgcgggtgca gctgaagcgc gactcgcgcg aggcgtacgt 11400

gcctcggcag aacctgttca gagaccgcgc gggcgaggag cccgaggaga tgcgggaccg 11460

caggttcgcc gcggggcggg agctgcggca ggggctgaac cgggagcggc tgctgcgcga 11520

ggaggacttt gagcccgacg cgcggacggg gatcagcccc gcgcgcgcgc acgtggcggc 11580

cgccgacctg gtgacggcgt acgagcagac ggtgaaccag gagatcaact tccaaaaaag 11640

cttcaacaac cacgtgcgca cgctggtggc gcgcgaggag gtgaccatcg gcctgatgca 11700

cctgtgggac tttgtgagcg cgctggagca gaaccccaac agcaagcctc tgacggcgca 11760

gctgttcctg atagtgcagc acagcaggga caacgaggcg ttcagggacg cgctgctgaa 11820

catcaccgag cccgagggtc ggtggctgct ggacctgatt aacatcttgc agagcatagt 11880

ggtgcaggag cgcagcctga gcctggccga caaggtggcg gccatcaatt actcgatgct 11940

cagtctgggc aagttttacg cgcgcaagat ctaccagacg ccgtacgtgc ccatagacaa 12000

ggaggtgaag atcgacggct tctacatgcg catggcgctg aaggtgctga ccctgagcga 12060

cgacctgggc gtgtaccgca acgagcgcat ccacaaggcc gtgagcgtga gccggcggcg 12120

cgagctgagc gaccgcgagc tgatgcacag cctgcagcgg gcgctggcgg gggccggcag 12180

cggcgacagg gaggccgagt cctacttcga ggcgggggcg gacctgcgct gggtgcccag 12240

ccggagggcc ctggaggccg cgggggcccg ccgcgaggac tatgcagacg aggaggagga 12300

ggatgacgag gagtacgagc tagaggaggg cgagtacctg gactaaaccg caggtggtgt 12360

ttttggtaga tgcaagaccc gaacgtggtg gacccggcgc tgcgggcggc tctgcagagc 12420

cagccgtccg gccttaactc tacagacgac tggcgacagg tcatggaccg catcatgtcg 12480

ctgacggcgc gcaatccgga cgcgttccgg cagcagccgc aggccaacag gctctccgcc 12540

atcttggagg cggtggtgcc tgcgcgcgcg aaccccacgc acgagaaggt gctggccata 12600

gtgaacgcgc tggccgagaa cagggccatc cgcccggacg aggccgggct ggtgtacgac 12660

gcgctgctgc agcgcgtggc ccgctacaac agcggcaacg tgcagaccaa cctggaccgg 12720

ctggtggggg acgtgcgcga ggcggtggcg cagcgggagc gcgcggagcg gcagggaaac 12780

ctgggctcca tggtggcgct gaacgccttc ctgagcacgc agccggccaa cgtgccgcgg 12840

gggcaggagg actacaccaa ctttgtgagc gcgctgcggc tgatggtgac cgagaccccc 12900

cagagcgagg tgtaccagtc ggggccggac tactttttcc agaccagcag acagggcctg 12960

cagacggtga acctgagcca ggctttcaag aacctgcggg ggctgtgggg cgtgaaggcg 13020

cccaccgggg accgggcgac ggtgtccagc ctgctgacgc ccaactcgcg cctgctgctg 13080

ctgctgatcg cgccgttcac ggacagcggc agcgtgtccc gggagaccta cctcgggcac 13140

ctgctgacgc tgtaccgcga ggccatcggg cagacccagg tggacgagca caccttccag 13200

gagatcacca gcgtgagccg cgcgctgggg caggaggaca cgggcagcct ggaggcgacc 13260

ctgaactacc tgctgaccaa ccggcggcag aagatcccct cgctgcatag tttgaccacc 13320

gaggaggagc gcatcctgcg ctacgtgcag cagagcgtga gcctgaacct gatgcgcgac 13380

ggggtgacgc ccagcgtggc gctggacatg accgcgcgca acatggaacc gggcatgtac 13440

gccgcgcatc ggccttacat caaccgcctg atggactact tgcatcgcgc ggcggccgtg 13500

aaccccgagt acttcaccaa cgccatcctg aacccgcact ggctcccgcc gcccgggttc 13560

tacagcgggg gcttcgaggt ccccgaggcc aacgacggct tcctgtggga cgacatggac 13620

gacagcgtgt tctccccgcg gccgcaggcg ctggcggagg cgtcgctgct ccgcctcccc 13680

aagaaagaag agagccgccg gcccagcagc gcggcggcct ctctgtccga gctgggggcg 13740

gcggccgcgc ggcccgggtc cctggggggc agcccctttc ccagtctggt ggggtctctg 13800

cagagcgggc gcaccacccg gccccggctg ctgggcgagg acgagtacct gaacaactcc 13860

ctgatgcagc cggtgcggga gaaaaacctg ccccccgcct tccccaacaa cgggatagag 13920

agcctggtag acaagatgag cagatggaag acctatgcgc aggagcacag ggactcgccc 13980

gtgctccgtc cgcccacgcg gcgccagcgc cacgaccggc agcgggggct ggtatgggat 14040

gacgaggact ccgcggacga tagcagcgtg ctggacctgg gggggagcgg cggtaacccg 14100

ttcgcgcacc tgcgcccccg cctggggagg atgtttcaat aagaaaaatc aagcatgatg 14160

caaggttttt taagcggata aataaaaaac tcaccaaggc catggcgacc gagcgttgtt 14220

ggtttcttgt tgtgttccct tagtatgcgg cgcgcggcga tgtaccacga gggacctcct 14280

ccctcttatg agagcgtggt gggcgcggcg gcggcctctc cctttgcgtc gcagctggag 14340

ccgccgtacg tgcctccgcg gtacctgcgg cctacggggg gaagaaacag catccgttac 14400

tcggagctgg cgcccctgta cgacaccacc cgggtgtacc tggtggacaa caagtcggcg 14460

gacgtggcct ccctgaacta ccagaacgac cacagcaatt ttttgaccac ggtcatccag 14520

aacaatgact acaccccgag cgaggccagc acccagacca tcaatctgga tgaccggtcg 14580

cactggggcg gcgacctgaa aaccatcctg cacaccaaca tgcccaacgt gaacgagttc 14640

atgttcacca ataagttcaa ggcgcgggtg atggtgtcgc gttcgcacac caaggacgac 14700

cgggtggagc tgaagtacga gtgggtagag ttcgagctgc ccgagggcaa ctactcggag 14760

accatgacca tagacctgat gaacaacgcg atcgtggagc actatctgaa agtgggcagg 14820

cagaacgggg tcctggagag cgacatcggg gtcaagttcg acaccaggaa cttccgcctg 14880

gggctggacc cggtcaccgg gctggtcatg cccggggtct acaccaacga ggccttccac 14940

cccgacatca tcctgctgcc cggctgcggg gtggacttca cctacagccg cctgagcaac 15000

ctgctgggca tccgcaagcg gcagcccttc caggagggct ttaggatcac ctacgaggac 15060

ctggaggggg gcaacatccc cgcgctcctg gatgtggagg cctaccagga tagcttgaag 15120

gaagaagagg cgggagaggg cagcggcggc ggcggcggcg ccggtcagga ggagggcggg 15180

gcctcctctg aggcctctgc ggacgccgcc gctgccgccg aggcggaggc ggccgacccc 15240

gcgatggtgg tagaggaaga gaaggatatg aatgacgagg cggtgcgcgg cgacaccttt 15300

gccacccggg gggaggagaa gaaagcggag gccgaggccg cggcagagga ggcggcagcg 15360

gcggcggcgg cggcagtaga ggcggcggcc gaggcggaga agccccccaa ggagcccgtg 15420

attaaggccc tgaccgaaga tagcaagaag cgcagttaca acgtgctcaa ggacagcacc 15480

aacaccgcgt accgcagctg gtacctggcc tacaactacg gcgacccggc gacgggggtg 15540

cgctcctgga ccctgctgtg tacgccggac gtgacctgcg gctcggagca ggtgtactgg 15600

tcgctgcccg acatgatgca agaccccgtg accttccgct ccacgcggca ggtcagcaac 15660

ttcccggtgg tgggcgccga gctgctgccc gtgcactcca agagcttcta caacgaccag 15720

gccgtctact cccagctcat ccgccagttc acctctctga cccacgtgtt caatcgcttt 15780

cctgagaacc agattctggc gcgcccgccc gcccccacca tcaccaccgt cagtgaaaac 15840

gttcctgctc tcacagatca cgggacgcta ccgctgcgca acagcatcgg aggagtccag 15900

cgagtgaccg taactgacgc cagacgccgc acctgtccct acgtttacaa ggccctgggc 15960

atagtctcgc cgcgcgtcct ttccagccgc actttttaag catgtccatc ctcatctcgc 16020

ccagcaataa caccggctgg ggcctgctgc gcgcgcccag caagatgttt ggaggggcga 16080

ggaagcgctc cgaccagcac cccgtgcgcg tgcgcgggca ctaccgcgcc ccctggggcg 16140

cgcacaaacg cgggcgcacc ggcaccgcgg ggcgcaccac cgtggacgaa gccatcgact 16200

cggtggtgga gcaggcgcgc aactacacgc ccgcggtctc caccgtggac gcggctatcg 16260

agagcgtggt gcgaggcgcg cggcggtacg ccaaggcgaa gagccgccgg aggcgcgtgg 16320

cccgccgcca ccgccgtcga cccggaagcg ccgccaagcg cgccgccgcc gccttgcttc 16380

gtcgggccag acgcacgggc cgccgcgccg ccatgagggc cgcgcgccgc ctggccgccg 16440

gcatcaccac cgtggccccc cgcgccagaa gacgcgcggc cgctgccgcc gccgcggcca 16500

tcagcgacct ggccaccagg cgccggggca acgtgtactg ggtgcgcgac tcggtgagcg 16560

gcacgcgcgt gcccgtgcgc ttccgccccc cgcggacttg agaggagagg acaggaaaaa 16620

agcatcaaca acaccaccac tgagtctcct gctgttgtgt gtatcccagc ggcgcgcgcg 16680

cacacggcga catgtccaag cgcaaaatca aagaagagat gctccaggtc gtcgcgccgg 16740

aaatctatgg gcccccgaag aaggaagagc aggatttcaa gccccgcaag ataaagcggg 16800

tcaaaaagaa aaagaaagat gacgatgatg gcgaggtgga gtttctgcgc gccacggcgc 16860

ccaggcgccc gctgcagtgg aagggtcggc gcgtaaagcg cgttctgcgc cccggcaccg 16920

cggtggtctt cacgcccggc gagcgctcca cccgcacttt caagcgcgtc tatgacgagg 16980

tgtacggcga cgaagacctg ctggagcagg ccaacgatcg ctccggagag tttgcttacg 17040

ggaagcggca ccgggcgatg gagaaggacg aggtgctggc gctgccgctg gaccggggca 17100

accccacccc cagcctgaag cccgtgaccc tgcagcaggt gctgccggcc agcgcgccct 17160

ccgagatgaa gcggggcctg aagcgcgagg gcggcgacct ggcgcccacc gtgcagctga 17220

tggtgcccaa gcggcagagg ctggaggacg tgctggagaa aatgaaagta gaccccggcc 17280

tgcagccgga catcagggtc cgccccatca agcaggtggc gccgggcctc ggcgtgcaga 17340

ccgtggacgt ggtcatcccc accggcgcct cctcttccag cgccgccgcc gccactagca 17400

ccgcggacat ggagacgcag actagctccg ccctcgccgc ccccgcggcc gccgccgccg 17460

ccacctcctc ggcggaggta cagacggacc cctggatgcc gccgccggcg gccgccccct 17520

cgcgcgcacg ccgcgggcgc aggaagtacg gcgccgccag cgcgctcatg cccgagtacg 17580

ccttgcatcc ttccatcgcg cccacccccg gctaccgagg ctacagctac cgcccgcgaa 17640

gagccaaggg ctccacccgc cgcagccgcc gcgccgccac ctctacccgc cgccgcagtc 17700

gccgccgccg ccggcagccc gcgctggctc cgatctccgt gaggagagtg gcgcgcaacg 17760

gggacacctt ggtgctgccc agggcgcgct accaccccag catcgtttaa aagcctgttg 17820

tggttcttgc agatatggcc ctcacttgcc gcctccgttt cccggtgccg ggataccgag 17880

gaagatcgcg ccgtagaagg ggtatggccg gacgcggcct gagcggaggc agccgccgtg 17940

cgcaccggcg gcgacgcgcc accagccgac gcatgcgcgg cggggtgctg cctctgctga 18000

tccccctgat cgccgcggcg atcggcgccg tgcccgggat cgcctccgtg gccttgcagg 18060

cgtcccagag gcgttgacac agacttcttg caagcttgca aaaatatgga aaaaatcccc 18120

ccaataaaaa agtctagact ctcacgctcg cttggtcctg tgactatttt gtagaaaaaa 18180

agatggaaga catcaacttt gcgtcgctgg ccccgcgtca cggctcgcgc ccgttcctgg 18240

gacactggaa cgatatcggc accagcaaca tgagcggtgg cgccttcagt tggggctctc 18300

tgtggagcgg cattaaaaat atcggttctg ccgttaagaa ttacggctcc aaggcctgga 18360

acagcagcac gggccagatg ttgagagaca agttgaaaga gcagaacttc cagcagaagg 18420

tggtggaggg cctggcctcc ggcatcaacg gggtggtgga cctggccaat caggccgtgc 18480

aaaataagat caacagcaga ctggaccccc ggccgccggt ggaagagctg ccgccggcgc 18540

tggagacggt gtcccccgat gggcggggcg aaaagcgccc gcggcccgac agggaagaga 18600

ccactctggt cacgcacacc gatgagccgc ccccctacga ggaagctctg aagcaaggct 18660

tgcccaccac tcggcccatc gcgcccatgg ccaccggggt ggtgggccgc cacacccccg 18720

ccaggctgga cctgcctcct cctcctgttt cttcttcggc cgccgatgcg cagcagcaga 18780

aggcggcgct gcccggtccg cccgcggccg ccccccgtcc caccgccagt cgagcgcccc 18840

tgcgtcgcgc ggccagcggc ccccgcgggg tcgcgaggca cagcagcggc aactggcaga 18900

acacgctgaa cagcatcgtg ggtctggggg tgcagtccgt gaagcgccgc cgatgctact 18960

gaatagctta gctaacggtg ttgtatgtgt gtatgcgtcc tatgtcaccg ccagaggagc 19020

tgctgagtcg ccgccgttcg cgcgcccacc gccactacca ccgccggtac cactccagcg 19080

cccctcaaga tggcgacccc atcgatgatg ccgcagtggt cgtacatgca catctcgggc 19140

caggacgcct cggagtacct gagccccggg ctggtgcagt tcgcccgcgc caccgacagc 19200

tacttcagcc tgagtaacaa gtttaggaac cccacggtgg cgcccacgca cgatgtgacc 19260

accgaccggt cccagcgcct gacgctgcgg ttcatccccg tggaccgcga ggacaccgcg 19320

tactcttaca aggcgcggtt caccctggcc gtgggcgaca accgcgtgct ggacatggcc 19380

tccacctact ttgacatccg cggcgtgctg gacaggggcc ccaccttcaa gccctactcc 19440

ggcaccgcct acaactccct ggcccccaag ggcgccccca actcctgcga gtgggagcaa 19500

gaggagactc agacagctga agaggcacaa gacgaagaag aagatgaagc tgaagctgag 19560

gaggaaatgc ctcaggaaga gcaagcacct gtcaaaaaga ctcatgtata tgctcaggct 19620

cccctttctg gcgaaaaaat tactaaagac ggtctgcaga taggaacgga cgctacagct 19680

accgaacaaa aacctattta tgcagatccc acattccagc cagaacccca aattggtgaa 19740

tctcagtgga atgaggcaga tgcttcagtt gccggcggta gagtgctgaa gaaaactact 19800

cccatgaaac cctgttatgg ttcctatgcc aggcccacaa atgccaatgg aggtcagggt 19860

gtattggtgg agaaagacgg tggaaagatg gaaagccaag tagatatgca attcttttcg 19920

acttctgaaa acgcccgtaa cgaggctaac aacattcagc ccaaattggt gctgtacagc 19980

gaggatgtgc atatggagac cccagacaca cacatttctt acaagcctgc aaaaagcgat 20040

gataattcga aagtcatgct gggtcagcag tccatgccca acaggccaaa ttacatcggc 20100

ttcagagaca actttatcgg gctcatgtat tacaacagca ctggcaacat gggggtgctg 20160

gcaggtcagg cctcacagtt gaatgcggtg gtggacttgc aagacagaaa cacagaactg 20220

tcctaccagc tcttgcttga ttccatggga gacagaacca gatacttttc catgtggaat 20280

caggcggtgg acagttatga tccagatgtc agaattattg aaaatcatgg aactgaagat 20340

gagctgccca actattgttt ccctctggga ggcatagggg taactgacac ttaccaggcc 20400

attaagacta atggcaatgg caacggcggg ggcaatacca cttggaccaa ggatgaaact 20460

tttgcagacc gcaacgagat aggggtggga aacaatttcg ccatggagat caacctcagt 20520

gccaacctgt ggaggaactt cctctactcc aacgtggccc tgtacctgcc agacaagctt 20580

aagtacaacc cctccaacgt ggaaatctct gacaacccca acacctacga ctacatgaac 20640

aagcgagtgg tggccccggg gctggtggac tgctacatca acctgggcgc gcgctggtcc 20700

ctggactaca tggacaacgt caaccccttc aaccaccacc gcaacgcggg cctgcgctac 20760

cgctccatgc ttctgggcaa cgggcgctac gtgcccttcc acatccaggt gccccagaag 20820

ttctttgcca tcaagaacct cctcctcctg ccgggctcct acacctacga gtggaacttc 20880

aggaaggatg tcaacatggt cctccagagc tctctgggta acgacctcag ggtcgacggg 20940

gccagcatca agttcgagag catctgcctc tacgccacct tcttccccat ggcccacaac 21000

acggcctcca cgctcgaggc catgctcagg aacgacacca acgaccagtc cttcaacgac 21060

tacctctccg ccgccaacat gctctacccc atccccgcca acgccaccaa cgttcccatc 21120

tccatcccct cgcgcaactg ggcggccttc cgcggctggg ccttcacccg cctcaagacc 21180

aaggagaccc cctccctggg ctcgggtttc gacccctact acacctactc gggctccata 21240

ccctacctgg acggaacctt ctacctcaac cacactttca agaaggtctc ggtcaccttc 21300

gactcctcgg tcagctggcc gggcaacgat cgcctgctca cccccaacga gttcgagatc 21360

aagcgctcgg tcgacgggga gggctacaac gtggcccagt gcaacatgac caaggactgg 21420

ttcctcatcc aaatgctggc caactacaac atcggctatc agggcttcta catcccagag 21480

agctacaagg acaggatgta ctccttcttt aggaacttcc agcccatgag ccggcaggtg 21540

gtggacgaaa ccaagtacaa ggactaccag caggtgggca tcatccacca gcacaacaac 21600

tcgggcttcg tgggctacct cgcccccacc atgcgcgagg gacaggccta ccccgccaac 21660

ttcccctacc cgctcattgg caagaccgcg gtcgacagcg tcacccagaa aaagttcctc 21720

tgcgaccgca ccctctggcg catccccttc tccagcaact tcatgtccat gggtgcgctc 21780

acggacctgg gccagaacct gctctatgcc aactccgccc acgcgctcga catgaccttc 21840

gaggtcgacc ccatggacga gcccaccctt ctctatgttc tgttcgaagt ctttgacgtg 21900

gtccgggtcc accagccgca ccgcggcgtc atcgagaccg tgtacctgcg cacgcccttc 21960

tcggccggca acgccaccac ctaaagaagc aagccgccac cgccaccacc tgcatgtcgt 22020

cgggttccac cgagcaggag ctcaaggcca tcgtcagaga cctgggatgc gggccctatt 22080

ttttgggcac cttcgacaaa cgcttcccgg gcttcgtcgc cccgcacaag ctggcctgcg 22140

ccatcgtcaa cacggccggc cgcgagaccg ggggcgtgca ctggctggcc ttcgcctgga 22200

acccgcgctc caaaacatgc tacctctttg accccttcgg attctcggac cagcggctca 22260

agcagatcta ccagttcgag tacgagggcc tgctgcgccg cagcgccatc gcctcctcgc 22320

ccgaccgctg cgtcaccctc gagaagtcca cccagaccgt gcaggggccc gactcggccg 22380

cctgcggtct cttctgctgc atgttcctgc atgcctttgt gcactggccc cagagtccca 22440

tggaccgcaa ccccaccatg aacttgctga cggggatccc caactccatg ctccagagcc 22500

cccaggtcgc gcccaccctg cgccgcaacc aggagcggct ctacagcttc ctggaacgcc 22560

actcgcccta cttccgccgc cacagcgcgc agatcagggg ggccacctct ttctgccgca 22620

tgcaagagat gcaagggaaa atgcaatgat gtacacagac actttttctt ttctcaataa 22680

atggcaactt tatttataca tgctctctct cgggtattca tttccccacc acccaccacc 22740

cgccgccgcc gtaaccatct gctgctggct tttttttttt tttttaaaaa tcgaaagggt 22800

tctgccggga atcgccgtgc gccacgggca gggacacgtt gcggaactgg tagcgggtgc 22860

cccacttgaa ctcgggcacc accatgcggg gcaagtcggg gaagttgtcg gcccacaggc 22920

tgcgggtcag caccagcgcg ttcattaggt cgggcgccga gatcttgaag tcgcagttgg 22980

ggccgccgcc ctgcgcgcgc gagttgcggt acaccgggtt gcaacactgg aacaccagca 23040

gcgccggata attcacactg gccagcacgc tccggtcgga gatcagctcg gcgtccaggt 23100

cctccgcgtt gctcagcgcg aacggggtca gcttgggcac ctgccgcccc aggaagggag 23160

cgtgccccgg cttcgagttg cagtcgcagc gcagcgggat cagcaggtgc ccgcggccgg 23220

actcggcgtt ggggtacagc gcgcgcatga aggcctccat ctggcggaag gccatctggg 23280

ccttggcgcc ctccgagaag aacatgccgc aggacttgcc cgagaactgg ttcgcggggc 23340

agctagcgtc gtgcaggcag cagcgcgcgt cggtgttggc gatctgcacc acgttgcgcc 23400

cccaccggtt cttcacgatt ttggccttgg aagcctgctc cttcagcgcg cgctgcccgt 23460

tctcgctggt cacatccatc tcgatcacgt gctccttgtt caccatgctg ctgccgtgca 23520

gacacttcag ctcgccctcc acctcggtgc agcggtgctg ccatagcgcg cagcccgtgg 23580

gctcgaaatg cttgtaggtc acctccgcgt aggactgcag gtaggcctgc aggaagcgcc 23640

ccatcatggt cacgaaggtc ttgttgctgc tgaaggtcag ctgcagcccg cggtgctcct 23700

cgttcagcca ggccttgcac acggccgcca gcgcctccac ctggtcgggc agcatcttga 23760

agttcagctt cagctcattc tccacatggt acttgtccat cagcgcgcgc gcagcctcca 23820

tgcccttctc ccaggccgac accagcggca ggctcaaggg gttcaccacc gtcgcagccg 23880

ccgctgcgct ttcgctttcc gctccgctgt tctcttcttc ctcctcctct tcttcctcgc 23940

cgcccgcgcg cagcccccgc accacggggt cgtcttcctg caggcgccgc accgagcgct 24000

tgccgctcct gccctgcttg atacgcacgg gcgggttgct gaagcctacc atcaccagcg 24060

cggcctcttc ttgctcgtcc tcgctgtcca ctatgacctc gggggagggc gacctcagaa 24120

ccgtggcgcg ctgcctcttc tttttcctgg gggcgtttgc cagctccgcg gccgcggccg 24180

ccgccgaggt cgaaggccga gggctgggcg tgcgcggcac cagcgcgtcc tgcgagccgt 24240

cctcgtcctc ggactcgagg cggcagcgag cccgcttctt cgggggcgcg cggggcggcg 24300

gcggcggggg cggcggcgac ggagacgggg acgagacatc gtccagggtg ggaggacggc 24360

gggccgcgcc gcgtccgcgc tcgggggtgg tttcgcgctg gtcctcttcc cgactggcca 24420

tctcccactg ctccttctcc tataggcaga aagagatcat ggagtctctc atgcaagtcg 24480

agaaggagga ggacagccta accaccaccg ccccctctga gccctccgcc gccgccgcgg 24540

acgacgcgcc caccaccacc gccgccgcca ccaccaccat taccacccta cccggcgacg 24600

cagccccgat cgagaaggaa gtgttgatcg agcaggaccc gggttttgtg agcgaagagg 24660

aggatgagga ggatgaaaag gagaaggata ccgccgcctc agtgccaaaa gaggataaaa 24720

agcaagacca ggacgacgca gagacagatg aggcagcagt cgggcggggg gacggaaggc 24780

atgatgatga tgacggctac ctagacgtgg gagacgacgt gctgcttaag cacctgcacc 24840

gccagtgcgt catcgtctgc gacgcgctgc aggagcgctg cgaagtgccc ctggacgtgg 24900

cggaggtcag ccgcgcctac gagcggcacc tcttcgcgcc acacgtgccc cccaagcgcc 24960

gggagaacgg cacctgcgag cccaacccgc gcctcaactt ctacccggtc ttcgcggtac 25020

ccgaggtgct ggccacctac cacatcttct tccaaaactg caagatcccc ctctcctgcc 25080

gcgccaaccg cacccgcgcc gacaagacgc tggccctgcg gcagggcgcc cacatacctg 25140

atatcgcctc tctggaggag gtgcccaaga tcttcgaggg tctcggtcgc gacgagaaac 25200

gggcggcgaa cgctctgcaa ggagacagcg aaaacgagag tcactcgggg gtgctggtgg 25260

agctcgaggg cgacaacgcg cgcctggccg tgctcaagcg cagcatcgaa gtcacccact 25320

tcgcctaccc ggcgctcaac ctgcccccca aggtcatgag tgtggtcatg agtgagctca 25380

tcatgcgccg cgcccagccc ctggacgcgg atgcaaactt gcaagagccc tccgaggaag 25440

gcctgcccgc ggtcagcgac gagcagctgg cgcgctggct ggagacccgc gaccccgccc 25500

agctggagga gcggcgcaag ctcatgatgg ccgcggtgct cgtcaccgtg gagctcgagt 25560

gtctgcagcg cttcttcggg gaccccgaga tgcagcgcaa gctcgaggag accctgcact 25620

acaccttccg ccagggctac gtgcgccagg cctgcaagat ctccaacgtg gagctctgca 25680

acctggtctc ctacctgggc atcctgcacg agaaccgcct cgggcagaac gtcctgcact 25740

ccaccctcaa aggggaggcg cgccgcgact acgtccgcga ctgcgtctac ctcttcctct 25800

gctacacgtg gcagacggcc atgggggtct ggcagcagtg cctggaggag cgcaacctca 25860

aggagctgga gaagctcctc cggcgcgccc tcagggacct ctggacgggc ttcaacgagc 25920

gctcggtggc cgccgcgctg gcggacatca tcttccccga gcgcctgctc aaaaccctgc 25980

agcagggcct gcccgacttc accagccaga gcatgctgca gaacttcagg accttcatcc 26040

tggagcgctc gggcatcctg ccggccacct gctgcgcgct gcccagcgac ttcgtgccca 26100

tcaggtacag ggagtgcccg ccgccgctct ggggccactg ctacctcttc cagctggcca 26160

actacctcgc ctaccactcg gatctcatgg aagacgtgag cggcgagggc ctgctcgagt 26220

gccactgccg ctgcaacctg tgcacgcccc accgctctct agtctgcaat ccgcagctgc 26280

tcagcgagag tcagattatc ggtaccttcg agctgcaggg tccctcgccc gacgaaaagt 26340

ccgcggctcc ggggttgaaa ctcactccgg ggctgtggac ttccgcctac ctacgcaaat 26400

ttgtacctga agactaccac gcccacgaga tcaggtttta cgaagaccaa tcccgcccgc 26460

ccaaggcgga gctcaccgcc tgcgtcatta cccagggcca catcctgggc caattgcaag 26520

ccatcaacaa agcccgccaa gagttcttgc tgaaaaaggg tcggggggtg tacctggacc 26580

cccagtccgg cgaggagcta aacccgctac ccccgccgcc gccccagcag cgggaccttg 26640

cttcccagga tggcacccag aaagaagcag ccgccgccgc cgccagcata catgcttctg 26700

gaggaagagg aggactggga cagtcaggca gaggaggttt cggacgagga cgaggaggag 26760

gagatgatgg aagactggga ggaggacagc ctagacgagg aagcttcaga ggccgaagag 26820

gtggcagacg caacaccatc accctcggcc gcagccccct cgccggcgcc cccgaaatcc 26880

tccgacccca gcagcagcgc tataacctcc gctcctccgg cgccggcgcc cacccgcagc 26940

agacccaacc gtagatggga cactacagga accggggtcg gtaagtccaa gtgcccccca 27000

gcgccgcccc cgcaacagga gcaacagcag cagcagcggc gacagggcta ccgctcgtgg 27060

cgcggacaca agaacgccat agtcgcctgc ttgcaagact gcgggggcaa catctccttc 27120

gcccgccgct tcctgctctt ccaccacggg gtggcttttc cccgcaatgt cctgcattac 27180

taccgtcatc tctacagccc ctactgcggc ggcagcggcg acccagaggg agcggcggca 27240

gcagcagcgc cagccacagc ggcgaccacc taggaagacc tccgcgggca agacggcggg 27300

agccgggaga cccgcggcgg cggcggtagc ggcggcggcg ggcgcactgc gcctctcgcc 27360

caacgaaccc ctctcgaccc gggagctcag acacaggatc ttccccactc tgtatgctat 27420

cttccagcag agcagaggcc aggaacagga gctcaaaata aaaaacagat ctctgcgctc 27480

cctcacccgc agctgtctgt atcacaaaag cgaagatcag cttcggcgca cgctggagga 27540

cgcggaggca ctcttcagca aatactgcgc gctgactctt aaggactagc cgcgcgccct 27600

tctcgaattt aggcgggaga aagactacgt catcgccgac cgccgcccag cccacccagc 27660

cgacatgagc aaagagattc ccacgcccta catgtggagc taccagccgc agatgggact 27720

cgcggcggga gcggcccaag actactccac ccgcatgaac tacatgagcg cggggcccca 27780

catgatctca cgggttaatg ggatccgcgc ccagcgaaac caaatactgc tggaacaggc 27840

ggccataacc gccacacccc gtcatgacct caatccccga aattggcccg ccgccctcgt 27900

gtaccaggaa accccctctg ccaccaccgt ggtacttccg cgtgacaccc aggccgaagt 27960

ccagatgact aactcagggg cgcagctcgc gggcggcttt cgtcacgggg tgcggccgca 28020

ccggccgggt atattacacc tggcgatcag aggccgaggt attcagctca acgacgagtc 28080

ggtgagctct tcgctcggtc tccgtccgga cggaaccttc cagatcgccg gatcaggtcg 28140

ctcctcattc acgcctcgcc aggcgtatct gactctgcag acctcctcct cggagcctcg 28200

ctccggcggc atcggcaccc tccagttcgt ggaggagttc gtgccctcgg tctacttcaa 28260

ccccttctcg ggacctcccg gacgctaccc cgaccagttc atcccgaact ttgacgcggt 28320

gaaggactcg gcggacggct acgactgaat gtcaagtgct gaggcagaga gcgttcgcct 28380

gaaacacctc cagcactgcc gccgcttcgc ctgctttgcc cgcagctccg gtgagttctg 28440

ctactttcag ctgcccgagg agcataccga agggccggcg cacggcgtcc gcctaaccac 28500

ccagggcgag gttacctgta cccttatccg ggagtttacc ctccgtcccc tgctagtgga 28560

gcgggagcgg ggttcttgtg tcataactat cgcctgcaac tgccctaacc ctggattaca 28620

tcaagatctt tgttgtcacc tgtgcgctga gtataataaa cgctgagatc agactctact 28680

ggggctcctg tcgccatcct gtgaacgcca ccgtcttcac ccaccccgag cagccccagg 28740

cgaacctcac ctgcggcctg cgtcggaggg ccaagaagta cctcacctgg tacttcaacg 28800

gcaccccctt tgtggtttac aacagcttcg accaggacgg agttgccttg agagacgacc 28860

tttccggtct cagctactcc attcacaaga acaccaccct ccacctcttc cctccctacc 28920

tgccgggaac ctacgagtgc gtcaccggcc gctgcaccca cctcctccgc ctgatcgtaa 28980

accagacctt tccgggaaca cacctcttcc ccagaacagg aggtgagctc aggaaacccc 29040

ctggggccca gggcggagac ttaccttcga cccttgtggg gttaggattt tttatcgccg 29100

ggttgctggc tctcctgatc aaagcttcct tcagatttgt tctctccctt tacttttatg 29160

aacagctcaa cttctaataa cgctaccttt tctcaggaat cgagtagtaa cttctcttcc 29220

gaaatcgggc tgggtgtgct gcttactctg ttgatttttt tccttatcat acttagcctt 29280

ctgtgcctca ggctcgccgc ctgctgcgca catatctaca tctacagccg gttgcttaac 29340

tgctggggtc gccatccaag atgaacgggg ctcaggtgct atgtctgctg gccctggtgg 29400

cctgcagtgc cgccgtcaat tttgaggaac ccgcttgcaa tgtgactttc aagcctgagg 29460

gcgcacattg caccactctg gttaaatgtg tgacctctca tgaaaaactg ctcatcgcct 29520

acaaaaacaa aacaggccag atcgcagtct atagcgagtg gctacccgga gaccataata 29580

actactcagt caccgtcttc gagggtgcgg agtctaagaa attcgattac acctttccct 29640

tcgaggagat gtgtgatgcg gtcatgtacc tgtccaaaca gtacaagctg tggcccccca 29700

cccccaaggc gtgtgtggaa aacactgggt ctttctgctg tctctctctg gcaatcactg 29760

tgcttgctct aatctgcacg ctgctataca tgagattcag gcagaggcga atctttatcg 29820

atgagaaaaa aatgccttga tcgctaacac cggctttctg tctgcagaat gaaagcaatc 29880

acctccctac taatcagcac caccctcctt gcgattgccc atgggttgac acgaatcgaa 29940

gtgccagtgg ggtccaatgt caccatggtg ggccccgccg gcaattcctc cctgatgtgg 30000

gaaaaatatg tccgtaatca atgggatcat tactgctcta atcgaatctg tatcaagccc 30060

agagccacct gcgacgggca aaatctaact ttgattgatg tgcaaatgac ggatgctggg 30120

tactattacg ggcagcgggg agaaatgatt aattactggc gaccccacaa ggactacatg 30180

ctgcatgtag tcaaggcagt cccaactact accaccccca ccactaccac tcccactacc 30240

accaccccca ccactaccac tagcactgct actaccgctg cccgcaaagc tattacccgc 30300

aaaagcacca tgcttagcac caagccccat tctcactccc acgccggcgg gcccaccggt 30360

gcggcctcag aaaccaccga gctttgcttc tgccaatgca ctaacgccag cgcccacgaa 30420

ctgttcgacc tggagaatga ggacgatgac cagctgagct ccgcttgccc ggtcccgctg 30480

cccgcagagc cggtcgccct gaagcagctc ggtgatccat ttaatgactc tcctgtttat 30540

ccctctcccg aataccctcc cgactctacc ttccacatca cgggcaccaa agaccccaac 30600

ctctccttct acctgatgct gctgctctgt atctctgtgg tatcttccgc gctcatgtta 30660

ctgggcatgt tctgctgcct catctgccgc agaaaaagaa agtctcgctc tcagggccaa 30720

ccactgatgc ccttccccta ccccccagat tttgcagata acaagatatg agcacgctgc 30780

tgacactaac cgctttactc gcctgcgctc taacccttgt cgcttgcgaa tccagatacc 30840

acaatgtcac agttgtgaca ggagaaaatg ttacattcaa ctccacggcc gacacccagt 30900

ggtcgtggag tggccacggt agctatgtat acatctgcaa tagctccacc tcccctagca 30960

tgtcctctcc caagtaccac tgcaatgaca gcctgttcac cctcatcaac gcctccacct 31020

cggacaatgg actctatgta ggctatgtga cacccggtgg gcagggaaag acccacgcct 31080

acaacctgca agttcgccac ccctccacca ccgccaccac ctctgccgcc cctacccgca 31140

gcagcagcag cagcagcagc agcagcagca gcagcagcag cagattcctg actttaatcc 31200

tagccagctc aacaaccacc gccaccgctg agaccaccca cagctccgcg cccgaaacca 31260

cccacaccca ccacccagag acgaccgcgg cctccagcga ccagatgtcg gccaacatca 31320

ccgcctcggg tcttgaactt gcttcaaccc ccaccccaaa accagtggat gcagccgacg 31380

tctccgccct cgtcaatgac tgggcggggc tgggaatgtg gtggttcgcc ataggcatga 31440

tggcgctctg cctgcttctg ctctggctca tctgctgcct caaccgcagg cgggccagac 31500

ccatctatag acccatcatt gttctcaacc ccgctgatga tgggatccat agattggatg 31560

gtctgaaaaa cctacttttc tcttttacag tatgataaat tgagacatgc ctcgcatttt 31620

catgtacttg acacttctcc cactttttct ggggtgttct acgctggccg ccgtctctca 31680

cctcgaggta gactgcctca cacccttcac tgtctacctg atttacggat tggtcaccct 31740

cactctcatc tgcagcctaa tcacagtagt catcgccttc atccagtgca ttgactacat 31800

ctgtgtgcgc ctcgcatacc tgagacacca cccgcagtac cgagacagga acattgccca 31860

actcctaaga ctgctctaat catgcataag actgtgatct gcctcctcat cctcctctcc 31920

ctgcccgctc tcgtctcatg ccagcccacc acaaaacctc cacgaaaaag acatgcctcc 31980

tgtcgcttga gccaactgtg gaatattccc aaatgctaca atgaaaagag cgagctttcc 32040

gaagcctggc tatatgcggt catgtgtgtc cttgtcttct gcagcacaat ctttgccctc 32100

atgatctacc cccactttga tttgggatgg aatgcggtcg atgccatgaa ttaccctacc 32160

tttcccgcgc ccgatatgat tccactccga caggttgtgg tgcccgtcgc cctcaatcaa 32220

cgccccccat cccctacacc cactgaggtc agctacttta atctaacagg cggagatgac 32280

tgacactcta gatctagaaa tggacggcat cggcaccgag cagcgtctcc tacagaggcg 32340

caagcaggcg gctgaacaag agcgcctcaa tcaggagctc cgagatctca ttaacctgca 32400

ccagtgcaaa aaaggcatct tttgcctggt caagcaggcc gatgtcacct acgagaaaac 32460

cggtaacagc caccgcctca gctacaagct gcccacccaa cgccagaagt tggtgctcat 32520

ggtgggtcag aatcccatca ccgtcaccca gcactcggtg gagaccgagg ggtgtctgca 32580

ctccccctgt cagggtccgg aagacctctg caccctggta aagaccctgt gtggtcttag 32640

agatttaatc ccctttaact aatcaaacac tggaatcaat aaaaagaatc acttacttta 32700

aatcagtcag caggtctctg tccactttat tcagcagcac ctccttcccc tcctcccaac 32760

tctggtactc caaacgcctc ctggcggcaa acttcctcca caccctgaag ggaatgtcag 32820

attcttgctc ctgtccctcc gcacccacta tcttcatgtt gttgcagatg aagcgcgcca 32880

aaacgtctga cgagaccttc aaccccgtgt acccctatga cacggaaaac gggcctccct 32940

ccgttccttt cctcacccct cccttcgtgt cccccgacgg atttcaagaa agccccccag 33000

gggtcctgtc tctgcgcctg tcagagcccc tggtcacttc ccacggcatg cttgccctga 33060

aaatgggaaa tggcctctcc ctggatgacg ccggcaacct cacctctcaa gatgtcacca 33120

ccgtcacccc tcccctcaaa aaaaccaaga ccaacctcag cctccagacc tcagcccccc 33180

tgaccgttag ctctgggtcc ctcaccgtcg cggccgccgc tccactggcg gtggccggca 33240

cctctctcac catgcaatct caggccccct tgacggtgca agatgcaaaa ctgggtctgg 33300

ccacccaggg acccctgacc gtgtctgaag gcaaactcac cttgcagaca tcggctccac 33360

tgacggccgc cgacagcagc actctcactg ttggcaccac accgccaatc agtgtgagca 33420

gtggaagtct aggcttagat atggaagacc ccatgtatac tcacgatgga aaactgggaa 33480

tcagaattgg tggcccactg caagtagtag acagcttgca cacactcact gtagttactg 33540

gaaacggaat aactgtagct aacaatgccc ttcaaactaa agttgcgggt gccctgggtt 33600

atgactcatc tggcaatcta gaattgcgag ccgcaggggg tatgcgaatt aacacagggg 33660

gtcaactcat tcttgatgtg gcttatccat ttgatgctca gaacaatctc agccttagac 33720

tcggccaggg acctttatat gtgaacacca atcacaacct agatttaaat tgcaacagag 33780

gtctgaccac aaccaccagc agtaacacaa ccaaacttga aactaaaatc gattcgggct 33840

tagactataa cgccaatggg gctatcattg ctaaacttgg cactgggtta acctttgaca 33900

acacaggtgc cataactgtg ggaaacactg gggatgacaa actcactctg tggactaccc 33960

cagatccctc tcctaactgc agaattcacg cagacaaaga ctgcaagttt actctagtcc 34020

tgactaagtg tggaagtcaa attctggcct ccgtcgccgc cctggcggtg tctggaaacc 34080

tatcatcaat gacaggcact gtctccagcg ttaccatctt tctcagattc gatcagaatg 34140

gagttcttat ggaaaattcc tcgctagaca aggagtactg gaacttcaga aatggtaatt 34200

ccaccaatgc caccccctac accaatgcgg ttgggttcat gcccaacctc agcgcctacc 34260

ccaaaaccca gagtcaaact gcaaaaaaca acattgtaag tgaggtttac ttacatgggg 34320

acaaatctaa acccatgatc cttaccatta cccttaatgg cacaaatgaa tccagtgaaa 34380

ctagtcaggt gagtcactac tccatgtcat ttacatggtc ctgggacagt gggaaatatg 34440

ccaccgaaac ctttgccacc aactctttta ccttctccta cattgctgaa caataaagaa 34500

gcataacgct gctgttcatt tgtaatcaag tgttactttt ttatttttca attacaacag 34560

aatcattcaa gtcattctcc atttagctta atagacccca gtagtgcaaa gccccatact 34620

agcttatttc agacagtata aattaaacca taccttttga tttcaacatt aaaaaaatca 34680

tcacaggatc ctagtcgtca ggccgccccc tcccttccaa gacacagaat acacaatcct 34740

ctccccccgg ctagctttaa acaacaccat ctgattggtg acagacaggt tcttcggggt 34800

tatattccac acggtctcct ggcgggccag gcgctcgtcg gtgatgctga taaactctcc 34860

cggcagctcg ctcaagttca cgtcgctgtc cagcggctga acctcatgct gacgcggtaa 34920

ctgcgcgacc ggctgctgaa caaacggagg ccgcgcctac aagggggtag agtcataatc 34980

ctccgtcagg atagggcggt tatgcagcag cagcgagcga atcatctgct gccgccgccg 35040

ctccgtccgg caggaaaaca acatcccggt ggtctcctcc gctataatcc gcaccgcccg 35100

cagcataagc ctcctcgttc tccgcgcgca gcaccgcacc ctgatctcgc tcaggttggc 35160

gcagtaggta cagcacatca ccacgatgtt attcatgatc ccacagtgca aggcgctgta 35220

tccaaagctc atgcccggga ccaccgcccc cacgtgaccg tcgtaccaga agcgcaggta 35280

aatcaagtgc cgacccctca tgaacgtgct ggacataaac atcacctcct tgggcatgtt 35340

gtaattcacc acctcccggt accagatgaa tctctgattg aacacggccc cttccaccac 35400

catcctgaac caagaggcta ggacctgccc accggctatg cactgcaggg aacccgggtt 35460

agaacaatga caatgcagac tccagggctc gtaaccgtgg atcatccggc tgctgaagac 35520

atcgatgttg gcgcaacaca gacacacgtg catacacttc ctcatgatta gcagctcctc 35580

cctcgtcagg atcatatccc aagggataac ccattcttga atcaacgtaa agcccacaga 35640

gcagggaagg cctcgcacat aactcacgtt gtgcatggtt agcgtgttgc attccggaaa 35700

cagcggatga tcctccagta tcgaggcgcg ggtctcgttc tcacagggag gtaaaggggc 35760

cctgctgtac ggactgtggc gggacgaccg agatcgtgtt gagcgtaacg tcatggaaaa 35820

gggaacgccg gacgtggtca tacttcttga agcagaacca ggctcgcgcg tgacagacct 35880

ccttgcgtct acggtctcgc cgcttagctc gctccgtgtg atagttgtag tacagccact 35940

ctctcaaagc gtcgaggcga cacctggcgt caggatgtat gtagactccg tcttgcaccg 36000

cggccctgat aatatccacc accgtagaat aagccacacc aagccaagca atacactcgc 36060

tttgcgagcg gcagacagga ggagcgggga gagacggaag gaccatcata aaattttaaa 36120

gaatattttc caatacttcg aaatcaagat ctaccaaatg gcaacgctcc cctccactgg 36180

cgcggtcaaa ctctacggcc aaagaacaga taacggcatt tttaagatgt tcccggacgg 36240

cgtctaaaag acaaaccgct ctcaagtcga cataaattat aagccaaaag ccatcgggat 36300

ccatatccac tatggacgcg ccggcggcgt ccaccaaacc caaataattt tcttctctcc 36360

agcgcagcaa aatcccagta agcaactccc tgatattaag atgaaccatg ccaaaaatct 36420

gttcaagagc gccctccacc ttcattctca agcagcgcat catgattgca aaaattcagg 36480

ttcctcagac acctgtatga gattcaaaac gggaatatta acaaaaattc ctctgtcgcg 36540

cagatccctt cgcagggcaa gctgaacata atcagacagg tctgaacgaa ccagcgaggc 36600

caaatccccg ccaggaacca gatccagaga ccctatgctg attatgacgc gcatactcgg 36660

ggctatgcta accagcgtag cgccgatgta ggcgtgctgc atgggcggcg aaataaaatg 36720

caaggtgctg gttaaaaaat caggcaaagc ctcgcgcaaa aaagctaaga catcataatc 36780

atgctcatgc aggtagttgc aggtaagctc aggaaccaaa acggaataac acacgatttt 36840

cctctcaaac atgacttcca ggtgactgca taagaaaaaa attataaata ataaatatta 36900

attaaataaa ttaaacattg gaagcctgtc tcacaacagg aaaaaccact ctgatcaaca 36960

taagacgggc cacgggcatg cccgcgtgac cataaaaaaa tcggtctccg tgattacaaa 37020

gcaccacaga tagctccccg gtcatgtcgg gggtcatcat gtgagactgt gtatacacgt 37080

ccgggctgtt gacatcggtc aaagaaagaa atcgagctac atagcccgga ggaatcaaca 37140

cccgcacgcg gaggtacagc aaaacggtcc ccataggagg aatcacaaaa ttagtaggag 37200

aaaaaaaaac ataaacacca gaaaaaccct cttgccgagg caaaacagcg ccctcccgtt 37260

ccaaaacaac ataaagcgct tccacaggag cagccatgac aaagacccga gtcttaccag 37320

gaaaatttta aaaaagattc ctcaacgcag caccagcacc aacacctgtc agtgtaaaat 37380

gccaagcgcc gagcgagtat atataggaat aaaaagtgac gtaaacggtt aaagtccaga 37440

aaacgcccag aaaaaccgca cgcgaaccta cgccccgaaa cgaaagccaa aaaacagtga 37500

acacgccctt tcggcgtcaa cttccgcttt cccacggtac gtcacttccg catatagtaa 37560

aactacgcta cccaacatgc aagaagccac gccccaaaaa acgtcacacc tcccggcccg 37620

ccccgcgccg ccgctcctcc ccgccccgcc ccgctccgcc cacctcatta tcatattggc 37680

ttcaatccaa aataaggtat attattgatg atg 37713

<210> 64

<211> 882

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 64

atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60

cggcgcactc cgtacagtag ggatcgtcta cctccttttg agacagaaac ccgcgctacc 120

atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180

tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240

tgggatatgg ttctaacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300

ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360

gctctccact gtcattgttc cagtcccggt tccctgcagt gtatagccgg cgggcaggtt 420

ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480

taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540

atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600

gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660

gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720

aggacaaggc gccttatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780

ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840

caccgcccta tcctgatgca cgattatgac tctaccccca tg 882

<210> 65

<211> 36571

<212> DNA

<213> 腺病毒科 - 哺乳动物腺病毒

<400> 65

catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg agctgtttga 60

atttggggat gcggggcgct gattggctgc gggagcggcg accgttaggg gcggggcggg 120

tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180

gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240

ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300

aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360

ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420

ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta 480

tttaaacctg cgctcactag tcaagaggcc actcttgagt gccagcgagt agagttttct 540

cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacttgaga gacctgcccg 600

gtaatgtttt cctggctact gggaacgaga ttctggaatt ggtggtggac gccatgatgg 660

gtgacgaccc tcccgagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg 720

atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta 780

gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctttggctca gacagcgatt 840

cttctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg 900

aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg 960

aggaggcgat tcgagctgca gcgaaccagg gagtgaaagc tgcgggcgaa agctttagcc 1020

tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata 1080

ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt 1140

acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt 1200

atttatgtat atgtttttta tgtgtaggtc ccgtctctga cgcagatgag acccccactt 1260

cagagtgcat ttcatcaccc ccagaaattg gcgaggaacc gcccgaagat attattcata 1320

gaccagttgc agtgagagtc accgggcgga gagcagctgt ggagagtttg gatgacttgc 1380

tacagggtgg ggatgaacct ttggacttgt gtacccggaa acgccccagg cactaagtgc 1440

cacacatgtg tgtttactta aggtgatgtc agtatttata gggtgtggag tgcaataaaa 1500

tccgtgttga ctttaagtgc gtggtttatg actcaggggt ggggactgtg ggtatataag 1560

caggtgcaga cctgtgtggt cagttcagag caggactcat ggagatctgg acggtcttgg 1620

aagactttca ccagactaga cagctgctag agaactcatc ggagggagtc tcttacctgt 1680

ggagattctg cttcggtggg cctctagcta agctagtcta tagggccaag caggattata 1740

aggatcaatt tgaggatatt ttgagagagt gtcctggtat ttttgactct ctcaacttgg 1800

gccatcagtc tcactttaac cagagtattc tgagagccct tgacttttcc actcctggca 1860

gaactaccgc cgcggtagcc ttttttgcct ttatccttga caaatggagt caagaaaccc 1920

atttcagcag ggattaccgt ctggactgct tagcagtagc tttgtggaga acatggaggt 1980

gccagcgcct gaatgcaatc tccggctact tgccagtaca gccggtagac acgctgagga 2040

tcctgagtct ccagtcaccc caggaacacc aacgccgcca gcagccgcag caggagcagc 2100

agcaagagga ggaccgagaa gagaacccga gagccggtct ggaccctccg gtggcggagg 2160

aggaggagta gctgacttgt ttcccgagct gcgccgggtg ctgactaggt cttccagtgg 2220

acgggagagg gggattaagc gggagaggca tgaggagact agtcacagaa ctgaactgac 2280

tgtcagtctg atgagccgca ggcgcccaga atcggtgtgg tggcatgagg tgcagtcgca 2340

ggggatagat gaggtctcgg tgatgcatga gaaatattcc ctagaacaag tcaagacttg 2400

ttggttggag cctgaggatg attgggaggt agccatcagg aattatgcca agctagctct 2460

gaagccagac aagaagtaca agattaccaa actgattaat atcagaaatt cctgctacat 2520

ttcagggaat ggggccgagg tggagatcag tacccaggag agggtggcct tcagatgctg 2580

catgatgaat atgtacccgg gggtggtggg catggaggga gtcaccttta tgaacgcgag 2640

gttcaggggc gatgggtata atggggtggt ctttatggcc aacaccaagc tgacagtgca 2700

cggatgctcc ttctttggct tcaataacat gtgcatcgag gcctggggca gtgtttcagt 2760

gaggggatgc agtttttcag ccaactggat gggggtcgtg ggcagaacca agagcaaggt 2820

gtcagtgaag aaatgcctgt tcgagaggtg ccacctgggg gtgatgagcg agggcgaagc 2880

caaagtcaaa cactgcgcct ctactgagac gggctgcttt gtgctgatca agggcaatgc 2940

ccaagtcaag cataacatga tctgtggggc ctcggatgag cgcggctacc agatgctgac 3000

ctgcgccggt gggaacagcc atatgctggc caccgtgcat gtgacctcgc acccccgcaa 3060

gacatggccc gagttcgagc acaacgtcat gacccgctgc aatgtgcacc tgggctcccg 3120

ccgaggcatg ttcatgccct accagtgcaa catgcaattt gtgaaggtgc tgctggagcc 3180

cgatgccatg tccagagtga gcctgacggg ggtgtttgac atgaatgtgg agatgtggaa 3240

aattctgaga tatgatgaat ccaagaccag gtgccgggcc tgcgaatgcg gaggcaagca 3300

cgccaggctt cagcccgtgt gtgtggaggt gacggaggac ctgcgacccg atcatttggt 3360

gttgtcctgc aacgggacgg agttcggctc cagcggggaa gaatctgact agagtgagta 3420

gtgtttgggg gaggtggagg gcctggatga ggggcagaat gactaaaatc tgtgtttttc 3480

tgcgcagcag catgagcgga agcgcctcct ttgagggagg ggtattcagc ccttatctga 3540

cggggcgtct cccctcctgg gcgggagtgc gtcagaatgt gatgggatcc acggtggacg 3600

gccggcccgt gcagcccgcg aactcttcaa ccctgaccta cgcgaccctg agctcctcgt 3660

ccgtggacgc agctgccgcc gcagctgctg cttccgccgc cagcgccgtg cgcggaatgg 3720

ccctgggcgc cggctactac agctctctgg tggccaactc gagttccacc aataatcccg 3780

ccagcctgaa cgaggagaag ctgctgctgc tgatggccca gctcgaggcc ctgacccagc 3840

gcctgggcga gctgacccag caggttgctc agctgcaggc ggagacgcgg gccgcggttg 3900

ccacggtgaa aaccaaataa aaaatgaatc aataaataaa cggagacggt tgttgatttt 3960

aacacagagt cttgaatctt tatttgattt ttcgcgcgcg gtaggccctg gaccaccggt 4020

ctcgatcatt gagcacccgg tggatctttt ccaggacccg gtagaggtgg gcttggatgt 4080

tgaggtacat gggcatgagc ccgtcccggg ggtggaggta gctccattgc agggcctcgt 4140

gctcgggggt ggtgttgtaa atcacccagt catagcaggg gcgcagggcg tggtgctgca 4200

cgatgtcctt gaggaggaga ctgatggcca cgggcagccc cttggtgtag gtgttgacga 4260

acctgttgag ctgggaggga tgcatgcggg gggagatgag atgcatcttg gcctggatct 4320

tgagattggc gatgttcccg cccagatccc gccgggggtt catgttgtgc aggaccacca 4380

gcacggtgta tccggtgcac ttggggaatt tgtcatgcaa cttggaaggg aaggcgtgaa 4440

agaatttgga gacgcccttg tggccgccca ggttttccat gcactcatcc atgatgatgg 4500

cgatgggccc gtgggcggcg gcctgggcaa agacgtttcg ggggtcggac acatcgtagt 4560

tgtggtcctg ggtgagctcg tcataggcca ttttaatgaa tttggggcgg agggtgcccg 4620

actgggggac gaaggtgccc tcgatcccgg gggcgtagtt gccctcgcag atctgcatct 4680

cccaggcctt gagctcggag ggggggatca tgtccacctg cggggcgatg aaaaaaacgg 4740

tttccggggc gggggagatg agctgcgccg aaagcaggtt ccggagcagc tgggacttgc 4800

cgcagccggt ggggccgtag atgaccccga tgaccggctg caggtggtag ttgagggaga 4860

gacagctgcc gtcctcgcgg aggagggggg ccacctcgtt catcatctcg cgcacatgca 4920

tgttctcgcg cacgagttcc gccaggaggc gctcgccccc cagcgagagg agctcttgca 4980

gcgaggcgaa gtttttcagc ggcttgagcc cgtcggccat gggcattttg gagagggtct 5040

gttgcaagag ttccagacgg tcccagagct cggtgatgtg ctctagggca tctcgatcca 5100

gcagacctcc tcgtttcgcg ggttggggcg actgcgggag tagggcacca ggcgatgggc 5160

gtccagcgag gccagggtcc ggtccttcca gggtcgcagg gtccgcgtca gcgtggtctc 5220

cgtcacggtg aaggggtgcg cgccgggctg ggcgcttgcg agggtgcgct tcaggctcat 5280

ccggctggtc gagaaccgct cccggtcggc gccctgtgcg tcggccaggt agcaattgag 5340

catgagttcg tagttgagcg cctcggccgc gtggcccttg gcgcggagct tacctttgga 5400

agtgtgtccg cagacgggac agaggaggga cttgagggcg tagagcttgg gggcgaggaa 5460

gacggactcg ggggcgtagg cgtccgcgcc gcagctggcg cagacggtct cgcactccac 5520

gagccaggtg aggtcggggc ggtcggggtc aaaaacgagg tttcctccgt gctttttgat 5580

gcgtttctta cctctggtct ccatgagctc gtgtccccgc tgggtgacaa agaggctgtc 5640

cgtgtccccg tagaccgact ttatgggccg gtcctcgagc ggggtgccgc ggtcctcgtc 5700

gtagaggaac cccgcccact ccgagacgaa ggcccgggtc caggccagca cgaaggaggc 5760

cacgtgggag gggtagcggt cgttgtccac cagcgggtcc accttctcca gggtatgcaa 5820

gcacatgtcc ccctcgtcca catccaggaa ggtgattggc ttgtaagtgt aggccacgtg 5880

accgggggtc ccggccgggg gggtataaaa gggggcgggc ccctgctcgt cctcactgtc 5940

ttccggatcg ctgtccagga gcgccagctg ttggggtagg tattccctct cgaaggcggg 6000

catgacctcg gcactcaggt tgtcagtttc tagaaacgag gaggatttga tattgacggt 6060

gccgttggag acgcctttca tgagcccctc gtccatctgg tcagaaaaga cgatcttttt 6120

gttgtcgagc ttggtggcga aggagccgta gagggcgttg gagagcagct tggcgatgga 6180

gcgcatggtc tggttctttt ccttgtcggc gcgctccttg gcggcgatgt tgagctgcac 6240

gtactcgcgc gccacgcact tccattcggg gaagacggtg gtgagctcgt cgggcacgat 6300

tctgacccgc cagccgcggt tgtgcagggt gatgaggtcc acgctggtgg ccacctcgcc 6360

gcgcaggggc tcgttggtcc agcagaggcg cccgcccttg cgcgagcaga aggggggcag 6420

cgggtccagc atgagctcgt cgggggggtc ggcgtccacg gtgaagatgc cgggcaggag 6480

ctcggggtcg aagtagctga tgcaggtgcc cagatcgtcc agcgccgctt gccagtcgcg 6540

cacggccagc gcgcgctcgt aggggctgag gggcgtgccc cagggcatgg ggtgcgtgag 6600

cgcggaggcg tacatgccgc agatgtcgta gacgtagagg ggctcctcga ggacgccgat 6660

gtaggtgggg tagcagcgcc ccccgcggat gctggcgcgc acgtagtcgt acagctcgtg 6720

cgagggcgcg aggagccccg tgccgaggtt ggagcgttgc ggcttttcgg cgcggtagac 6780

gatctggcgg aagatggcgt gggagttgga ggagatggtg ggcctctgga agatgttgaa 6840

gtgggcgtgg ggcaggccga ccgagtccct gatgaagtgg gcgtaggagt cctgcagctt 6900

ggcgacgagc tcggcggtga cgaggacgtc cagggcgcag tagtcgaggg tctcttggat 6960

gatgtcgtac ttgagctggc ccttctgctt ccacagctcg cggttgagaa ggaactcttc 7020

gcggtccttc cagtactctt cgagggggaa cccgtcctga tcggcacggt aagagcccac 7080

catgtagaac tggttgacgg ccttgtaggc gcagcagccc ttctccacgg ggagggcgta 7140

agcttgcgcg gccttgcgca gggaggtgtg ggtgagggcg aaggtgtcgc gcaccatgac 7200

tttgaggaac tggtgcttga agtcgaggtc gtcgcagccg ccctgctccc agagttggaa 7260

gtccgtgcgc ttcttgtagg cggggttggg caaagcgaaa gtaacatcgt tgaagaggat 7320

cttgcccgcg cggggcatga agttgcgagt gatgcggaaa ggctggggca cctcggcccg 7380

gttgttgatg acctgggcgg cgaggacgat ctcgtcgaag ccgttgatgt tgtgcccgac 7440

gatgtagagt tccacgaatc gcgggcagcc cttgacgtgg ggcagcttct tgagctcgtc 7500

gtaggtgagc tcggcggggt cgctgagccc gtgctgctcg agggcccagt cggcgacgtg 7560

ggggttggcg ctgaggaagg aagtccagag atccacggcc agggcggtct gcaagcggtc 7620

ccggtactga cggaactgct ggcccacggc cattttttcg ggggtgacgc agtagaaggt 7680

gcgggggtcg ccgtgccagc ggtcccactt gagttggagg gcgaggtcgt gggcgagctc 7740

gacgagcggc gggtccccgg agagtttcat gaccagcatg aaggggacga gctgcttgcc 7800

gaaggacccc atccaggtgt aggtttccac atcgtaggtg aggaagagcc tttcggtgcg 7860

aggatgcgag ccgatgggga agaactggat ctcctgccac cagttggagg aatggctgtt 7920

gatgtgatgg aagtagaaat gccgacggcg cgccgagcac tcgtgcttgt gtttatacaa 7980

gcgtccgcag tgctcgcaac gctgcacggg atgcacgtgc tgcacgagct gtacctgggt 8040

tcctttgacg aggaatttca gtgggcagtg gagcgctggc ggctgcatct ggtgctgtac 8100

tacgtcctgg ccatcggcgt ggccatcgtc tgcctcgatg gtggtcatgc tgacgagccc 8160

gcgcgggagg caggtccaga cctcggctcg gacgggtcgg agagcgagga cgagggcgcg 8220

caggccggag ctgtccaggg tcctgagacg ctgcggagtc aggtcagtgg gcagcggcgg 8280

cgcgcggttg acttgcagga gcttttccag ggcgcgcggg aggtccagat ggtacttgat 8340

ctccacggcg ccgttggtgg cgacgtccac ggcttgcagg gtcccgtgcc cctggggcgc 8400

caccaccgtg ccccgtttct tcttgggcgg cggcggctcc atgcttagaa gcggcggcga 8460

ggacgcgcgc cgggcggcag gggcggctcg gggcccggag gcaggggcgg caggggcacg 8520

tcggcgccgc gcgcgggcag gttctggtac tgcgcccgga gaagactggc gtgagcgacg 8580

acgcgacggt tgacgtcctg gatctgacgc ctctgggtga aggccacggg acccgtgagt 8640

ttgaacctga aagagagttc gacagaatca atttcggtat cgttgacggc ggcctgccgc 8700

aggatctctt gcacgtcgcc cgagttgtcc tggtaggcga tctcggtcat gaactgctcg 8760

atctcctcct cctgaaggtc tccgcggccg gcgcgctcga cggtggccgc gaggtcgttg 8820

gagatgcggc ccatgagctg cgagaaggcg ttcatgccgg cctcgttcca gacgcggctg 8880

tagaccacgg ctccgttggg gtcgcgcgcg cgcatgacca cctgggcgag gttaagctcg 8940

acgtggcgcg tgaagaccgc gtagttgcag aggcgctggt agaggtagtt gagcgtggtg 9000

gcgatgtgct cggtgacgaa gaagtacatg atccagcggc ggagcggcat ctcgctgacg 9060

tcgcccaggg cttccaagcg ctccatggtc tcgtagaagt ccacggcgaa gttgaaaaac 9120

tgggagttgc gcgccgagac ggtcaactcc tcctccagaa gacggatgag ctcggcgatg 9180

gtggcgcgca cctcgcgctc gaaggccccg gggggctcct cttcttccat ctcctcctcc 9240

tcttcctcct ccactaacat ctcttctact tcctcctcag gaggcggcgg cgggggaggg 9300

gccctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat ggtctccccg 9360

cgccggcgac gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg cagcgtgaag 9420

acgccgccgc gcatctccag gtggccgccg ggggggtctc cgttgggcag ggagagggcg 9480

ctgacgatgc atcttatcaa ttggcccgta gggactccgc gcaaggacct gagcgtctcg 9540

agatccacgg gatccgaaaa ccgctgaacg aaggcttcga gccagtcgca gtcgcaaggt 9600

aggctgagcc cggtttcttg ttcttcgggt atttggtcgg gaggcgggcg ggcgatgctg 9660

ctggtgatga agttgaagta ggcggtcctg agacggcgga tggtggcgag gagcaccagg 9720

tccttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc gtggtcctga 9780

cacctggcga ggtccttgta gtagtcctgc atgagccgct ctacgggcac gtcctcctcg 9840

cccgcgcggc cgtgcatgcg cgtgagcccg aacccgcgct gcggctggac gagcgccagg 9900

tcggcgacga cgcgctcggc gaggatggcc tgctggatct gggtgagggt ggtctggaag 9960

tcgtcgaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga gcagttggcc 10020

atgacggacc agttgacggt ctggtggccg gggcgcacga gctcgtggta cttgaggcgc 10080

gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcacgaggta ctggtatccg 10140

acgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc gggggcgccg 10200

ggcgcgaggt cctcgagcat gaggcggtgg tagccgtaga tgtacctgga catccaggtg 10260

atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca gatgttgcgc 10320

agcggcagga agtagttcat ggtggccgcg gtctggcccg tgaggcgcgc gcagtcgtgg 10380

atgctctaga catacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440

gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500

ccgcagctaa cgtggtactg gcactcccgt ctcgacccaa gcctgctaac gaaacctcca 10560

ggatacggag gcgggtcgtt ttttggcctt ggtcgctggt catgaaaaac tagtaagcgc 10620

ggaaagcggc cgcccgcgat ggctcgctgc cgtagtctgg agaaagaatc gccagggttg 10680

cgttgcggtg tgccccggtt cgagcctcag cgctcggtgc cggccggatt ccgcggctaa 10740

cgtgggcgtg gctgccccgt cgtttccaag accccttagc cagccgactt ctccagttac 10800

ggagcgagcc cctctttttc ttgtgttttt gccagatgca tcccgtactg cggcagatgc 10860

gcccccaccc tccaccacaa ccgcccctac cgcagcagca gcaacagccg gcgcttctgc 10920

ccccgcccca gcagcagcag ccagccacta ccgcggcggc cgccgtgagc ggagccggcg 10980

ttcagtatga cctggccttg gaagagggcg aggggctggc gcggctgggg gcgtcgtcgc 11040

cggagcggca cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc 11100

agaacctgtt cagagacagg agcggcgagg agcccgagga gatgcgcgcc tcccgcttcc 11160

acgcggggcg ggagctgcgg cgcggcctgg accgaaagcg ggtgctgagg gacgaggatt 11220

tcgaggcgga cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc 11280

tggtcacggc gtacgagcag accgtgaagg aggagagcaa ctttcaaaaa tccttcaaca 11340

accacgtgcg cacgctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg 11400

acctgctgga ggccatcgtg cagaacccca cgagcaagcc gctgacggcg cagctgtttc 11460

tggtggtgca gcacagtcgg gacaacgaga cgttcaggga ggcgctgctg aatatcaccg 11520

agcccgaggg ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg 11580

agcgcgggct gccgctgtcc gagaagctgg cggccatcaa cttctcggtg ctgagcctgg 11640

gcaagtacta cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga 11700

agatcgacgg gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg 11760

gggtgtaccg caacgacagg atgcaccgcg cggtgagcgc cagccgccgg cgcgagctga 11820

gcgaccagga gctgatgcac agcctgcagc gggccctgac cggggccggg accgaggggg 11880

agagctactt tgacatgggc gcggacctgc gctggcagcc cagccgccgg gccttggaag 11940

ctgccggcgg cgtgccctac gtggaggagg tggacgatga ggaggaggag ggcgagtacc 12000

tggaagactg atggcgcgac cgtatttttg ctagatgcag caacagccac cgccgcctcc 12060

tgatcccgcg atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga 12120

ttggacccag gccatgcaac gcatcatggc gctgacgacc cgcaatcccg aagcctttag 12180

acagcagcct caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc 12240

gaaccccacg cacgagaagg tgctggccat cgtgaacgcg ctggtggaga acaaggccat 12300

ccgcggcgac gaggccgggc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa 12360

cagcaccaac gtgcagacga acctggaccg catggtgacc gacgtgcgcg aggcggtgtc 12420

gcagcgcgag cggttccacc gcgagtcgaa cctgggctcc atggtggcgc tgaacgcctt 12480

cctgagcacg cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag 12540

cgcgctgcgg ctgatggtgg ccgaggtgcc ccagagcgag gtgtaccagt cggggccgga 12600

ctacttcttc cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa 12660

gaacttgcag ggactgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag 12720

cctgctgacg ccgaactcgc gcctgctgct gctgctggtg gcgcccttca cggacagcgg 12780

cagcgtgagc cgcgactcgt acctgggcta cctgcttaac ctgtaccgcg aggccatcgg 12840

gcaggcgcac gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgcgctggg 12900

ccaggaggac ccgggcaacc tggaggccac cctgaacttc ctgctgacca accggtcgca 12960

gaagatcccg ccccagtacg cgctgagcac cgaggaggag cgcatcctgc gctacgtgca 13020

gcagagcgtg gggctgttcc tgatgcagga gggggccacg cccagcgccg cgctcgacat 13080

gaccgcgcgc aacatggagc ccagcatgta cgcccgcaac cgcccgttca tcaataagct 13140

gatggactac ttgcatcggg cggccgccat gaactcggac tactttacca acgccatctt 13200

gaacccgcac tggctcccgc cgcccgggtt ctacacgggc gagtacgaca tgcccgaccc 13260

caacgacggg ttcctgtggg atgacgtgga cagcagcgtg ttctcgccgc gtcccaccac 13320

caccgtgtgg aagaaagagg gcggggaccg gcggccgtcc tcggcgctgt ccggtcgcgc 13380

gggtgctgcc gcggcggtgc ccgaggccgc cagccccttt ccgagcctgc ccttttcgct 13440

gaacagcgtg cgcagcagcg agctgggtcg gctgacgcgg ccgcgcctgc tgggcgagga 13500

ggagtacctg aacgactcct tgttgaggcc cgagcgcgaa aagaacttcc ccaataacgg 13560

gatagagagc ctggtggaca agatgagccg ctggaagacg tacgcgcacg agcacaggga 13620

cgagccccga gctagcagcg caggcacccg tagacgccag cggcacgaca ggcagcgggg 13680

tctggtgtgg gacgatgagg attccgccga cgacagcagc gtgttggact tgggtgggag 13740

tggtggtggt aacccgttcg ctcacttgcg cccccgtatc gggcgcctga tgtaagaatc 13800

tgaaaaataa aaaacggtac tcaccaaggc catggcgacc agcgtgcgtt cttctctgtt 13860

gtttgtagta gtatgatgag gcgcgtgtac ccggagggtc ctcctccctc gtacgagagc 13920

gtgatgcagc aggcggtggc ggcggcgatg cagcccccgc tggaggcgcc ttacgtgccc 13980

ccgcggtacc tggcgcctac ggaggggcgg aacagcattc gttactcgga gctggcaccc 14040

ttgtacgata ccacccggtt gtacctggtg gacaacaagt cggcggacat cgcctcgctg 14100

aactaccaga acgaccacag caacttcctg accaccgtgg tgcagaacaa cgatttcacc 14160

cccacggagg ccagcaccca gaccatcaac tttgacgagc gctcgcggtg gggcggccag 14220

ctgaaaacca tcatgcacac caacatgccc aacgtgaacg agttcatgta cagcaacaag 14280

ttcaaggcgc gggtgatggt ctcgcgcaag acccccaacg gggtcacagt aacagatggt 14340

agtcaggacg agctgaccta cgagtgggtg gagtttgagc tgcccgaggg caacttctcg 14400

gtgaccatga ccatcgatct gatgaacaac gccatcatcg acaactactt ggcggtgggg 14460

cggcagaacg gggtgctgga gagcgacatc ggcgtgaagt tcgacacgcg caacttccgg 14520

ctgggctggg accccgtgac cgagctggtg atgccgggcg tgtacaccaa cgaggccttc 14580

caccccgaca tcgtcctgct gcccggctgc ggcgtggact tcaccgagag ccgcctcagc 14640

aacctgctgg gcatccgcaa gcggcagccc ttccaggagg gcttccagat cctgtacgag 14700

gacctggagg ggggcaacat ccccgcgctc ttggatgtcg aagcctacga gaaaagcaag 14760

gaggatagca ccgccgtggc taccgccgcg actgtggcag atgccactgt caccaggggc 14820

gatacattcg ccacccaggc ggaggaagca gccgccctag cggcgaccga tgatagtgaa 14880

agtaagatag ttatcaagcc ggtggagaag gacagcaagg acaggagcta caacgttcta 14940

tcggatggaa agaacaccgc ctaccgcagc tggtacctgg cctacaacta cggcgacccc 15000

gagaagggcg tgcgctcctg gacgctgctc accacctcgg acgtcacctg cggcgtggag 15060

caagtctact ggtcgctgcc cgacatgatg caagacccgg tcaccttccg ctccacgcgt 15120

caagttagca actacccggt ggtgggcgcc gagctcctgc ccgtctactc caagagcttc 15180

ttcaacgagc aggccgtcta ctcgcagcag ctgcgcgcct tcacctcgct cacgcacgtc 15240

ttcaaccgct tccccgagaa ccagatcctc gtccgcccgc ccgcgcccac cattaccacc 15300

gtcagtgaaa acgttcctgc tctcacagat cacgggaccc tgccgctgcg cagcagtatc 15360

cggggagtcc agcgcgtgac cgtcactgac gccagacgcc gcacctgccc ctacgtctac 15420

aaggccctgg gcgtagtcgc gccgcgcgtc ctctcgagcc gcaccttcta aaaaatgtcc 15480

attctcatct cgcccagtaa taacaccggt tggggcctgc gcgcgcccag caagatgtac 15540

ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg tgcgcgggca cttccgcgct 15600

ccctggggcg ccctcaaggg tcgcgtgcgc tcgcgcacca ccgtcgacga cgtgatcgac 15660

caggtggtgg ccgacgcgcg caactacacg cccgccgccg cgcccgcctc caccgtggac 15720

gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg cccgcgccaa gagccggcgg 15780

cggcgcatcg cccggcggca ccggagcacc cccgccatgc gcgcggcgcg agccttgctg 15840

cgcagggcca ggcgcacggg acgcagggcc atgctcaggg cggccagacg cgcggcctcc 15900

ggcagcagca gcgccggcag gacccgcaga cgcgcggcca cggcggcggc ggcggccatc 15960

gccagcatgt cccgcccgcg gcgcggcaac gtgtactggg tgcgcgacgc cgccaccggt 16020

gtgcgcgtgc ccgtgcgcac ccgcccccct cgcacttgaa gatgctgact tcgcgatgtt 16080

gatgtgtccc agcggcgagg aggatgtcca agcgcaaata caaggaagag atgctccagg 16140

tcatcgcgcc tgagatctac ggccccgcgg cggcggtgaa ggaggaaaga aagccccgca 16200

aactgaagcg ggtcaaaaag gacaaaaagg aggaggaaga tgtggacgga ctggtggagt 16260

ttgtgcgcga gttcgccccc cggcggcgcg tgcagtggcg cgggcggaaa gtgaaaccgg 16320

tgctgcggcc cggcaccacg gtggtcttca cgcccggcga gcgttccggc tccgcctcca 16380

agcgctccta cgacgaggtg tacggggacg aggacatcct cgagcaggcg gccgagcgtc 16440

tgggcgagtt tgcttacggc aagcgcagcc gccccgcgcc cttgaaagag gaggcggtgt 16500

ccatcccgct ggaccacggc aaccccacgc cgagcctgaa gccggtgacc ctgcagcagg 16560

tgctgccgag cgcggcgccg cgccggggct tcaagcgcga gggcggcgag gatctgtacc 16620

cgaccatgca gctgatggtg cccaagcgcc agaagctgga ggacgtgctg gagcacatga 16680

aggtggaccc cgaggtgcag cccgaggtca aggtgcggcc catcaagcag gtggccccgg 16740

gcctgggcgt gcagaccgtg gacatcaaga tccccacgga gcccatggaa acgcagaccg 16800

agcccgtgaa gcccagcacc agcaccatgg aggtgcagac ggatccctgg atgccggcgc 16860

cggcttccac caccactcgc cgaagacgca agtacggcgc ggccagcctg ctgatgccca 16920

actacgcgct gcatccttcc atcatcccca cgccgggcta ccgcggcacg cgcttctacc 16980

gcggctacag cagccgccgc aagaccacca cccgccgccg ccgtcgccgc acccgccgca 17040

gcaccaccgc gacttccgcc gccgccttgg tgcggagagt gtaccgcagc gggcgtgagc 17100

ctctgaccct gccgcgcgcg cgctaccacc cgagcatcgc catttaactc tgccgtcgcc 17160

tccttgcaga tatggccctc acatgccgcc tccgcgtccc cattacgggc taccgaggaa 17220

gaaagccgcg ccgtagaagg ctgacgggga acgggctgcg tcgccatcac caccggcggc 17280

ggcgcgccat cagcaagcgg ttggggggag gcttcctgcc cgcgctgatc cccatcatcg 17340

ccgcggcgat cggggcgatc cccggcatag cttccgtggc ggtgcaggcc tctcagcgcc 17400

actgagacac agcttggaaa atttgtaata aaaaaatgga ctgacgctcc tggtcctgtg 17460

atgtgtgttt ttagatggaa gacatcaatt tttcgtccct ggcaccgcga cacggcacgc 17520

ggccgtttat gggcacctgg agcgacatcg gcaacagcca actgaacggg ggcgccttca 17580

attggagcag tctctggagc gggcttaaga atttcgggtc cacgctcaaa acctatggca 17640

acaaggcgtg gaacagcagc acagggcagg cgctgaggga aaagctgaaa gagcagaact 17700

tccagcagaa ggtggtcgat ggcctggcct cgggcatcaa cggggtggtg gacctggcca 17760

accaggccgt gcagaaacag atcaacagcc gcctggacgc ggtcccgccc gcggggtccg 17820

tggagatgcc ccaggtggag gaggagctgc ctcccctgga caagcgcggc gacaagcgac 17880

cgcgtcccga cgcggaggag acgctgctga cgcacacgga cgagccgccc ccgtacgagg 17940

aggcggtgaa actgggtctg cccaccacgc ggcccgtggc gcctctggcc accggggtgc 18000

tgaaacccag cagcagcagc agccagcccg cgaccctgga cttgcctcca cctcgcccct 18060

ccacagtggc taagcccctg ccgccggtgg ccgtcgcgtc gcgcgccccc cgaggccgcc 18120

cccaggcgaa ctggcagagc actctgaaca gcatcgtggg tctgggagtg cagagtgtga 18180

agcgccgccg ctgctattaa aagacactgt agcgcttaac ttgcttgtct gtgtgtatat 18240

gtatgtccgc cgaccagaag gaggaggaag aggcgcgtcg ccgagttgca agatggccac 18300

cccatcgatg ctgccccagt gggcgtacat gcacatcgcc ggacaggacg cttcggagta 18360

cctgagtccg ggtctggtgc agttcgcccg cgccacagac acctacttca gtctggggaa 18420

caagtttagg aaccccacgg tggcacccac gcacgatgtg accaccgacc gcagccagcg 18480

gctgacgctg cgcttcgtgc ccgtggaccg cgaggacaac acctactcgt acaaagtgcg 18540

ctacacgctg gccgtgggcg acaaccgcgt gctggacatg gccagcacct actttgacat 18600

ccgcggcgtg ctggatcggg gccccagctt caaaccctac tccggcaccg cctacaacag 18660

cctggctccc aagggagcgc ccaacacctc acagtggata accaaagaca atggaactga 18720

taagacatac agttttggaa atgctccagt cagaggattg gacattacag aagagggtct 18780

ccaaatagga accgatgagt cagggggtga aagcaagaaa atttttgcag acaaaaccta 18840

tcagcctgaa cctcagcttg gagatgagga atggcatgat actattggag ctgaagacaa 18900

gtatggaggc agagcgctta aacctgccac caacatgaaa ccctgctatg ggtctttcgc 18960

caagccaact aatgctaagg gaggtcaggc taaaagcaga accaaggacg atggcactac 19020

tgagcctgat attgacatgg ccttctttga cgatcgcagt cagcaagcta gtttcagtcc 19080

agaacttgtt ttgtatactg agaatgtcga tctggacacc ccggataccc acattattta 19140

caaacctggc actgatgaaa caagttcttc tttcaacttg ggtcagcagt ccatgcccaa 19200

cagacccaac tacattggct tcagagacaa ctttatcggg ctcatgtact acaacagcac 19260

tggcaatatg ggtgtactgg ccggtcaggc ctcccagctg aatgctgtgg tggacttgca 19320

ggacagaaac actgaactgt cctaccagct cttgcttgac tctctgggtg acagaaccag 19380

gtatttcagt atgtggaatc aggcggtgga cagctatgac cccgatgtgc gcattattga 19440

aaatcacggt gtggaggatg aactccccaa ctattgcttc cctttgaatg gtgtgggctt 19500

tacagataca ttccagggaa ttaaggttaa aactacaaat aacggaacag caaatgctac 19560

agagtgggaa tctgatacct ctgtcaataa tgctaatgag attgccaagg gcaatccttt 19620

cgccatggag atcaacatcc aggccaacct gtggcggaac ttcctctacg cgaacgtggc 19680

gctgtacctg cccgactcct acaagtacac gccggccaac atcacgctgc ccaccaacac 19740

caacacctac gattacatga acggccgcgt ggtggcgccc tcgctggtgg acgcctacat 19800

caacatcggg gcgcgctggt cgctggaccc catggacaac gtcaacccct tcaaccacca 19860

ccgcaacgcg ggcctgcgct accgctccat gctcctgggc aacgggcgct acgtgccctt 19920

ccacatccag gtgccccaaa agtttttcgc catcaagagc ctcctgctcc tgcccgggtc 19980

ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga gctccctcgg 20040

caacgacctg cgcacggacg gggcctccat cgccttcacc agcatcaacc tctacgccac 20100

cttcttcccc atggcgcaca acaccgcctc cacgctcgag gccatgctgc gcaacgacac 20160

caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc ccatcccggc 20220

caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct tccgcggatg 20280

gtccttcacg cgcctcaaga cccgcgagac gccctcgctc ggctccgggt tcgaccccta 20340

cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca accacacctt 20400

caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg accgcctcct 20460

gacgcccaac gagttcgaaa tcaagcgcac cgtcgacgga gaggggtaca acgtggccca 20520

gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca acatcggcta 20580

ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct tccgcaactt 20640

ccagcccatg agccgccagg tcgtggacga ggtcaactac aaggactacc aggccgtcac 20700

cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca ccatgcgcca 20760

gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg ccgtcgccag 20820

cgtcacccag aaaaagttcc tctgcgaccg ggtcatgtgg cgcatcccct tctccagcaa 20880

cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctacg ccaactccgc 20940

ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc ttctctatgt 21000

tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg tcatcgaggc 21060

cgtctacctg cgcacgccct tctcggccgg caacgccacc acctaagcct cttgcttctt 21120

gcaagatgac ggcctgtggc tccggcgagc aggagctcag ggccatcctc cgcgacctgg 21180

gctgcgggcc ctacttcctg ggcaccttcg acaagcgctt cccgggattc atggccccgc 21240

acaagctggc ctgcgccatc gtcaacacgg ccggccgcga gaccgggggc gagcactggc 21300

tggccttcgc ctggaacccg cgcacccaca cctgctacct cttcgacccc ttcgggttct 21360

cggacgagcg cctcaagcag atctaccagt tcgagtacga gggcctgctg cgccgcagcg 21420

ccctggccac cgaggaccgc tgcgtcaccc tggaaaagtc cacccagacc gtgcagggtc 21480

cgcgctcggc cgcctgcggg ctcttctgct gcatgttcct gcacgccttc gtgcactggc 21540

ccgaccgccc catggacaag aaccccacca tgaacttgct gacgggggtg cccaacggca 21600

tgctccagtc gccccaggtg gaacccaccc tgcgccgcaa ccaggaggcg ctctaccgct 21660

tcctcaacgc ccactccgcc tactttcgct cccaccgcgc gcgcatcgag aaggccaccg 21720

ccttcgaccg catgaatcaa gacatgtaaa ctgtgtgtat gtgaatgctt tattcataat 21780

aaacagcaca tgtttatgcc accttctctg aggctctgac tttatttaga aatcgaaggg 21840

gttctgccgg ctctcggcgt gccccgcggg cagggatacg ttgcggaact ggtacttggg 21900

cagccacttg aactcgggga tcagcagctt cggcacgggg aggtcgggga acgagtcgct 21960

ccacagcttg cgcgtgagtt gcagggcgcc cagcaggtcg ggcgcggata tcttgaaatc 22020

acagttggga cccgcgttct gcgcgcgaga gttgcggtac acggggttgc agcactggaa 22080

caccatcagg gccgggtgct tcacgctcgc cagcaccgtc gcgtcggtga tgccctccac 22140

gtccagatcc tcggcgttgg ccatcccgaa gggggtcatc ttgcaggtct gccgccccat 22200

gctgggcacg cagccgggct tgtggttgca atcgcagtgc agggggatca gcatcatctg 22260

ggcctgctcg gagctcatgc ccgggtacat ggccttcatg aaagcctcca gctggcggaa 22320

ggcctgctgc gccttgccgc cctcggtgaa gaagaccccg caggacttgc tagagaactg 22380

gttggtggcg cagccggcgt cgtgcacgca gcagcgcgcg tcgttgttgg ccagctgcac 22440

cacgctgcgc ccccagcggt tctgggtgat cttggcccgg tcggggttct ccttcagcgc 22500

gcgctgcccg ttctcgctcg ccacatccat ctcgatcgtg tgctccttct ggatcatcac 22560

ggtcccgtgc aggcaccgca gcttgccctc ggcttcggtg catccgtgca gccacagcgc 22620

gcagccggtg cactcccagt tcttgtgggc gatctgggag tgcgagtgca cgaagccctg 22680

caggaagcgg cccatcatcg cggtcagggt cttgttgctg gtgaaggtca gcgggatgcc 22740

gcggtgctcc tcgttcacat acaggtggca gatgcggcgg tacacctcgc cctgctcggg 22800

catcagctgg aaggcggact tcaggtcgct ctccacgcgg taccgctcca tcagcagcgt 22860

catgacttcc atgcccttct cccaggccga aacgatcggc aggctcaggg ggttcttcac 22920

cgttgtcatc ttagtcgccg ccgccgaggt cagggggtcg ttctcgtcca gggtctcaaa 22980

cactcgcttg ccgtccttct cggtgatgcg cacgggggga aagctgaagc ccacggccgc 23040

cagctcctcc tcggcctgcc tttcgtcctc gctgtcctgg ctgatgtctt gcaaaggcac 23100

atgcttggtc ttgcggggtt tctttttggg cggcagaggc ggcggcggag acgtgctggg 23160

cgagcgcgag ttctcgctca ccacgactat ttcttcttct tggccgtcgt ccgagaccac 23220

gcggcggtag gcatgcctct tctggggcag aggcggaggc gacgggctct cgcggttcgg 23280

cgggcggctg gcagagcccc ttccgcgttc gggggtgcgc tcctggcggc gctgctctga 23340

ctgacttcct ccgcggccgg ccattgtgtt ctcctaggga gcaagcatgg agactcagcc 23400

atcgtcgcca acatcgccat ctgcccccgc cgccgccgac gagaaccagc agcagcagaa 23460

tgaaagctta accgccccgc cgcccagccc cacctccgac gccgcggccc cagacatgca 23520

agagatggag gaatccatcg agattgacct gggctacgtg acgcccgcgg agcacgagga 23580

ggagctggca gcgcgctttt cagccccgga agagaaccac caagagcagc cagagcagga 23640

agcagagagc gagcagagcc aggctgggct cgagcatggc gactacctga gcggggcaga 23700

ggacgtgctc atcaagcatc tggcccgcca atgcatcatc gtcaaggatg cgctgctcga 23760

ccgcgccgag gtgcccctca gcgtggcgga gctcagccgc gcctacgagc gcaacctctt 23820

ctcgccgcgc gtgcccccca agcgccagcc caacggcacc tgcgagccca acccgcgcct 23880

caacttctac ccggtcttcg cggtgcccga ggccctggcc acctaccacc tctttttcaa 23940

gaaccaaagg atccccgtct cctgccgcgc caaccgcacc cgcgccgacg ccctgctcaa 24000

cctgggcccc ggcgcccgcc tacctgatat cgcctccttg gaagaggttc ccaagatctt 24060

cgagggtctg ggcagcgacg agactcgggc cgcgaacgct ctgcaaggaa gcggagagga 24120

gcatgagcac cacagcgccc tggtggagtt ggaaggcgac aacgcgcgcc tggcggtcct 24180

caagcgcacg gtcgagctga cccacttcgc ctacccggcg ctcaacctgc cccccaaggt 24240

catgagcgcc gtcatggacc aggtgctcat caagcgcgcc tcgcccctct cggaggagga 24300

gatgcaggac cccgagagct cggacgaggg caagcccgtg gtcagcgacg agcagctggc 24360

gcgctggctg ggagcgagta gcacccccca gagcctggaa gagcggcgca agctcatgat 24420

ggccgtggtc ctggtgaccg tggagctgga gtgtctgcgc cgcttcttcg ccgacgcgga 24480

gaccctgcgc aaggtcgagg agaacctgca ctacctcttc aggcacgggt tcgtgcgcca 24540

ggcctgcaag atctccaacg tggagctgac caacctggtc tcctacatgg gcatcctgca 24600

cgagaaccgc ctggggcaga acgtgctgca caccaccctg cgcggggagg cccgccgcga 24660

ctacatccgc gactgcgtct acctgtacct ctgccacacc tggcagacgg gcatgggcgt 24720

gtggcagcag tgcctggagg agcagaacct gaaagagctc tgcaagctcc tgcagaagaa 24780

cctgaaggcc ctgtggaccg ggttcgacga gcgcaccacc gcctcggacc tggccgacct 24840

catcttcccc gagcgcctgc ggctgacgct gcgcaacggg ctgcccgact ttatgagcca 24900

aagcatgttg caaaactttc gctctttcat cctcgaacgc tccgggatcc tgcccgccac 24960

ctgctccgcg ctgccctcgg acttcgtgcc gctgaccttc cgcgagtgcc ccccgccgct 25020

ctggagccac tgctacctgc tgcgtctggc caactacctg gcctaccact cggacgtgat 25080

cgaggacgtc agcggcgagg gtctgctcga gtgccactgc cgctgcaacc tctgcacgcc 25140

gcaccgctcc ctggcctgca acccccagct gctgagcgag acccagatca tcggcacctt 25200

cgagttgcaa ggccccggcg aggagggcaa ggggggtctg aaactcaccc cggggctgtg 25260

gacctcggcc tacttgcgca agttcgtgcc cgaggactac catcccttcg agatcaggtt 25320

ctacgaggac caatcccagc cgcccaaggc cgagctgtcg gcctgcgtca tcacccaggg 25380

ggccatcctg gcccaattgc aagccatcca gaaatcccgc caagaatttc tgctgaaaaa 25440

gggccacggg gtctacttgg acccccagac cggagaggag ctcaacccca gcttccccca 25500

ggatgcccag aggaagcagc aagaagctga aagtggagct gccgctgccg ccggaggatt 25560

tggaggaaga ctgggagagc agtcaggcag aggaggagga gatggaagac tgggacagca 25620

ctcaggcaga ggaggacagc ctgcaagaca gtctggaaga cgaggtggag gaggaggcag 25680

aggaagaagc agccgccgcc agaccgtcgt cctcggcgga gaaagcaagc agcacggata 25740

ccatctccgc tccgggtcgg ggtctcggcg gccgggccca cagtaggtgg gacgagaccg 25800

ggcgcttccc gaaccccacc acccagaccg gtaagaagga gcggcaggga tacaagtcct 25860

ggcgggggca caaaaacgcc atcgtctcct gcttgcaagc ctgcgggggc aacatctcct 25920

tcacccggcg ctacctgctc ttccaccgcg gggtgaactt cccccgcaac atcttgcatt 25980

actaccgtca cctccacagc ccctactact gtttccaaga agaggcagaa acccagcagc 26040

agcagaaaac cagcagcagc tagaaaatcc acagcggcgg cggcggcagg tggactgagg 26100

atcgcggcga acgagccggc gcagacccgg gagctgagga accggatctt tcccaccctc 26160

tatgccatct tccagcagag tcgggggcag gagcaggaac tgaaagtcaa gaaccgttct 26220

ctgcgctcgc tcacccgcag ttgtctgtat cacaagagcg aagaccaact tcagcgcact 26280

ctcgaggacg ccgaggctct cttcaacaag tactgcgcgc tcactcttaa agagtagccc 26340

gcgcccgccc acacacggaa aaaggcggga attacgtcac cacctgcgcc cttcgcccga 26400

ccatcatcat gagcaaagag attcccacgc cttacatgtg gagctaccag ccccagatgg 26460

gcctggccgc cggcgccgcc caggactact ccacccgcat gaactggctc agtgccgggc 26520

ccgcgatgat ctcacgggtg aatgacatcc gcgcccgccg aaaccagata ctcctagaac 26580

agtcagcgat caccgccacg ccccgccatc accttaatcc gcgtaattgg cccgccgccc 26640

tggtgtacca ggaaattccc cagcccacga ccgtactact tccgcgagac gcccaggccg 26700

aagtccagct gactaactca ggtgtccagc tggccggcgg cgccgccctg tgtcgtcacc 26760

gccccgctca gggtataaag cggctggtga tccgaggcag aggcacacag ctcaacgacg 26820

aggtggtgag ctcttcgctg ggtctgcgac ctgacggagt cttccaactc gccggatcgg 26880

ggagatcttc cttcacgcct cgtcaggccg tcctgacttt ggagagttcg tcctcgcagc 26940

cccgctcggg tggcatcggc actctccagt tcgtggagga gttcactccc tcggtctact 27000

tcaacccctt ctccggctcc cccggccact acccggacga gttcatcccg aacttcgacg 27060

ccatcagcga gtcggtggac ggctacgatt gaatgtccca tggtggcgcg gctgacctag 27120

ctcggcttcg acacctggac cactgccgcc gcttccgctg cttcgctcgg gatctcgccg 27180

agtttgccta ctttgagctg cccgaggagc accctcaggg cccggcccac ggagtgcgga 27240

tcatcgtcga agggggcctc gactcccacc tgcttcggat cttcagccag cgtccgatcc 27300

tggtcgagcg cgagcaagga cagacccgtc tgaccctgta ctgcatctgc aaccaccccg 27360

gcctgcatga aagtctttgt tgtctgctgt gtactgagta taataaaagc tgagatcagc 27420

gactactccg gacttccgtg tgttcctgaa tccatcaacc agtccctgtt cttcaccggg 27480

aacgagaccg agctccagct ccagtgtaag ccccacaaga agtacctcac ctggctgttc 27540

cagggctccc cgatcgccgt tgtcaaccac tgcgacaacg acggagtcct gctgagcggc 27600

cctgccaacc ttactttttc cacccgcaga agcaagctcc agctcttcca acccttcctc 27660

cccgggacct atcagtgcgt ctcgggaccc tgccatcaca ccttccacct gatcccgaat 27720

accacagcgt cgctccccgc tactaacaac caaactaccc accaacgcca ccgtcgcgac 27780

ctttcctctg aatctaatac cactaccgga ggtgagctcc gaggtcgacc aacctctggg 27840

atttactacg gcccctggga ggtggtgggg ttaatagcgc taggcctagt tgtgggtggg 27900

cttttggctc tctgctacct atacctccct tgctgttcgt acttagtggt gctgtgttgc 27960

tggtttaaga aatggggcag atcaccctag tgagctgcgg tgtgctggtg gcggtggtgc 28020

tttcgattgt gggactgggc ggcgcggctg tagtgaagga gaaggccgat ccctgcttgc 28080

atttcaatcc cgacaaatgc cagctgagtt ttcagcccga tggcaatcgg tgcgcggtgc 28140

tgatcaagtg cggatgggaa tgcgagaacg tgagaatcga gtacaataac aagactcgga 28200

acaatactct cgcgtccgtg tggcagcccg gggaccccga gtggtacacc gtctctgtcc 28260

ccggtgctga cggctccccg cgcaccgtga ataatacttt catttttgcg cacatgtgcg 28320

acacggtcat gtggatgagc aagcagtacg atatgtggcc ccccacgaag gagaacatcg 28380

tggtcttctc catcgcttac agcctgtgca cggtgctaat caccgctatc gtgtgcctga 28440

gcattcacat gctcatcgct attcgcccca gaaataatgc cgaaaaagag aaacagccat 28500

aacacgtttt ttcacacacc ttgtttttac agacaatgcg tctgttaaat tttttaaaca 28560

ttgtgctcag tattgcttat gcctctggct atgcaaacat acagaaaacc ctctatgtag 28620

gatctgatga tacactagag ggtacccaat cacaagctag ggtttcatgg tatttttata 28680

aaagctcaga taatcctatt actctttgca aaggtgatca ggggcggaca acaaagccgc 28740

ctatcacatt tagctgtacc agaacaaatc tcacgctttt ctcaattaca aaacaatatg 28800

ctggtattta ttacagtaca aactttcata gtgggcaaga taaatattat actgttaagg 28860

tagaaaatcc taccactcct agaactacca ccaccaccac caccaccacc actactgcga 28920

agcccactaa acctaaaact accaagaaaa ccactgtgaa aactacaact agaaccacca 28980

caactacaga aaccaccacc agcacaacac ttgctgcaac tacacacaca cacactgagc 29040

taaccttaca gaccactaat gatttgatag ccctgttgca aaagggggat aacagcacca 29100

cttccaatga ggagataccc aaatccatga ttggcattat tgttgctgta gtggtgtgca 29160

tgttgatcat cgccttgtgc atggtgtact atgccttctg ctacagaaag cacagactga 29220

acgacaagct ggaacactta ctaagtgttg aattttaatt ttttagaacc atgaagatcc 29280

taggcctttt agttttttct atcattacct ctgctctatg caattctgac aatgaggacg 29340

ttactgtcgt tgtcggatca aattatacac tgaaaggtcc agcgaagggt atgctttcgt 29400

ggtattgctg gtttggaact gacactgatc aaactgagct ttgcaatgca atgaaaggtc 29460

aaataccaac ctcaaaaatt aaacataaat gcaatggtac tgacttagta ctactcaata 29520

tcacgaaatc atatgctggc agctattcat gccctggaga tgatgctgag aacatgattt 29580

tttacaaagt aactgttgtt gatcccacta ctccaccacc caccaccaca actactcaca 29640

ccacacacac agaacaaaca ccagaggcag cagaagcaga gttggccttc caggttcacg 29700

gagattcctt tgctgtcaat acccctacac ccgatcatcg gtgtccgggg ctgctagtca 29760

gcggcattgt cggtgtgctt tcgggattag cagtcataat catctgcatg ttcatttttg 29820

cttgctgcta tagaaggctt taccgacaaa aatcagaccc actgctgaac ctctatgttt 29880

aattttttcc agagccatga aggcagttag cgctctagtt ttttgttctt tgattggcat 29940

tgttttttgc aatcctatta ctagagttag ctttattaaa gatgtgaatg ttactgaggg 30000

gggcaatgtg acactggtag gtgtagaggg tgctaaaaac accacctgga caaaatacca 30060

ccttgggtgg aaagatattt gcaattggag tgtcactgtg tacacatgtg agggagttaa 30120

tcttaccatt gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgttag 30180

tgtgaccagt gatgggtatt ttacccaaca tacttttatc tatgacgtta aagtcatacc 30240

actgcctacg cctagcccac ctagcaccac tacacaaaca acccacacta cacagacaac 30300

cacatacagt acatcaaatc agcctaccac cactacagca gcagaggttg ccagctcgtc 30360

tggagttcaa gtggcatttt tgttgttgcc cccatctagc agtcccactg ctattaccaa 30420

tgagcagact actgcatttt tgtccactgt cgagagccac accacagcta cctccagtgc 30480

cttctctagc accgccaatc tctcctcgct ttcctctaca ccaatcagtc ccgctactac 30540

tactaccccc gctattcttc ccactcccct gaagcaaaca gacggcggca tgcaatggca 30600

gatcaccctg ctcattgtga tcgggttggt catcctagcc gtgttgctct actacatctt 30660

ctgccgccgc attcccaacg cgcaccgcaa gccggtctac aagcccatca ttgtcgggca 30720

gccggagccg cttcaggtgg aagggggtct aaggaatctt ctcttctctt ttacagtatg 30780

gtgattgaac tatgattcct agacaattct tgatcactat tcttatctgc ctcctccaag 30840

tctgtgccac cctcgctctg gtggccaacg ccagtccaga ctgtattggg cccttcgcct 30900

cctacgtgct ctttgccttc atcacctgca tctgctgctg tagcatagtc tgcctgctta 30960

tcaccttctt ccagttcatt gactggatct ttgtgcgcat cgcctacctg cgccaccacc 31020

cccagtaccg cgaccagcga gtggcgcagc tgctcaggct cctctgataa gcatgcgggc 31080

tctgctactt ctcgcgcttc tgctgttagt gctcccccgt cccgttgacc cccggccccc 31140

cactcagtcc cccgaggagg tccgcaaatg caaattccaa gaaccctgga aattcctcaa 31200

atgctaccgc caaaaatcag acatgcatcc cagctggatc atgatcattg ggatcgtgaa 31260

cattctggcc tgcaccctca tctcctttgt gatttacccc tgctttgact ttggttggaa 31320

ctcgccagag gcgctctatc tcccgcctga acctgacaca ccaccacagc aacctcaggc 31380

acacgcacta ccaccaccac agcctaggcc acaatacatg cccatattag actatgaggc 31440

cgagccacag cgacccatgc tccccgctat tagttacttc aatctaaccg gcggagatga 31500

ctgacccact ggccaacaac aacgtcaacg accttctcct ggacatggac ggccgcgcct 31560

cggagcagcg actcgcccaa cttcgcattc gccagcagca ggagagagcc gtcaaggagc 31620

tgcaggacgg catagccatc caccagtgca agaaaggcat cttctgcctg gtgaaacagg 31680

ccaagatctc ctacgaggtc acccagaccg accatcgcct ctcctacgag ctcctgcagc 31740

agcgccagaa gttcacctgc ctggtcggag tcaaccccat cgtcatcacc cagcagtcgg 31800

gcgataccaa ggggtgcatc cactgctcct gcgactcccc cgactgcgtc cacactctga 31860

tcaagaccct ctgcggcctc cgcgacctcc tccccatgaa ctaatcaccc acttatccag 31920

tgaaataaaa aaataatcat ttgatttgaa ataaagatac aatcatattg atgatttgag 31980

tttaacaaaa ataaagaatc acttacttga aatctgatac caggtctctg tccatatttt 32040

ctgccaacac cacctcactc ccctcttccc agctctggta ctgcaggccc cggcgggctg 32100

caaacttcct ccacacgctg aaggggatgt caaattcctc ctgcccctca atcttcattt 32160

tatcttctat cagatgtcca aaaagcgcgt ccgggtggat gatgacttcg accccgtcta 32220

cccctacgat gcagacaacg caccgaccgt gcccttcatc aaccccccct tcgtctcttc 32280

agatggattc caagagaagc ccctgggggt gttgtccctg cgactggccg accccgtcac 32340

caccaagaac ggggaaatca ccctcaagct gggagagggg gtggacctcg actcctcggg 32400

aaaactcatc tccaacacgg ccaccaaggc cgctgcccct ctcagttttt ccaacaacac 32460

catttccctt aacatggatc acccctttta cactaaagat ggaaaattag ccttacaagt 32520

ttctccacca ttaaatatac tgagaacaag cattctaaac acactagctt taggttttgg 32580

atcaggttta ggactccgtg gctctgcctt ggcagtacag ttagtctctc cacttacatt 32640

tgatactgat ggaaacataa agcttacctt agacagaggt ttgcatgtta caacaggaga 32700

tgcaattgaa agcaacataa gctgggctaa aggtttaaaa tttgaagatg gagccatagc 32760

aaccaacatt ggaaatgggt tagagtttgg aagcagtagt acagaaacag gtgtcgatga 32820

tgcttaccca atccaagtta aacttggatc tggccttagc tttgacagta caggagccat 32880

aatggctggt aacaaagaag acgataaact cactttgtgg acaacacctg atccatcacc 32940

aaactgtcaa atactcgcag aaaatgatgc aaaactaaca ctttgcttga ctaaatgtgg 33000

tagtcaaata ctggccactg tgtcagtctt agttgtagga agtggaaacc taaaccccat 33060

tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt gatgcaaacg gtgttctttt 33120

aacagaacat tctacactaa aaaaatactg ggggtatagg cagggagata gcatagatgg 33180

cactccatat gtcaatgctg taggattcat gcccaattta aaagcttatc caaagtcaca 33240

aagttctact actaaaaata atatagtagg gcaagtatac atgaatggag atgtttcaaa 33300

acctatgctt ctcactataa ccctcaatgg tactgatgac agcaacagta catattcaat 33360

gtcattttca tacacctgga ctaatggaag ctatgttgga gcaacatttg gagctaactc 33420

ttataccttc tcctacatcg cccaagaatg aatactgtat cccaccctgc atgcccaacc 33480

ctcccccacc tctgtctata tggaaaactc tgaaacacaa aataaaataa agttcaagtg 33540

ttttattgat tcaacagttt tacaggattc gagcagttat ttttcctcca ccctcccagg 33600

acatggaata caccaccctc tccccccgca cagccttgaa catctgaatg ccattggtga 33660

tggacatgct tttggtctcc acgttccaca cagtttcaga gcgagccagt ctcgggtcgg 33720

tcagggagat gaaaccctcc gggcactccc gcatctgcac ctcacagctc aacagctgag 33780

gattgtcctc ggtggtcggg atcacggtta tctggaagaa gcagaagagc ggcggtggga 33840

atcatagtcc gcgaacggga tcggccggtg gtgtcgcatc aggccccgca gcagtcgctg 33900

ccgccgccgc tccgtcaagc tgctgctcag ggggtccggg tccagggact ccctcagcat 33960

gatgcccacg gccctcagca tcagtcgtct ggtgcggcgg gcgcagcagc gcatgcggat 34020

ctcgctcagg tcgctgcagt acgtgcaaca caggaccacc aggttgttca acagtccata 34080

gttcaacacg ctccagccga aactcatcgc gggaaggatg ctacccacgt ggccgtcgta 34140

ccagatcctc aggtaaatca agtggcgccc cctccagaac acgctgccca tgtacatgat 34200

ctccttgggc atgtggcggt tcaccacctc ccggtaccac atcaccctct ggttgaacat 34260

gcagccccgg atgatcctgc ggaaccacag ggccagcacc gccccgcccg ccatgcagcg 34320

aagagacccc gggtcccggc aatggcaatg gaggacccac cgctcgtacc cgtggatcat 34380

ctgggagctg aacaagtcta tgttggcaca gcacaggcac acgctcatgc atctcttcag 34440

cactctcagc tcctcggggg tcaaaaccat atcccagggc acgggaaact cttgcaggac 34500

agcgaagccc gcagaacagg gcaatcctcg cacataactt acattgtgca tggacagggt 34560

atcgcaatca ggcagcaccg ggtgatcctc caccagagaa gcgcgggtct cggtctcctc 34620

acagcgtggt aagggggccg gccgatacgg gtgatggcgg gacgcggctg atcgtgttcg 34680

cgaccgtgtc atgatgcagt tgctttcgga cattttcgta cttgctgaag cagaacctgg 34740

tccgggcgct gcacaccgat cgccggcggc ggtctcggcg cttggaacgc tcggtgttga 34800

agttgtaaaa cagccactct ctcagaccgt gcagcagatc tagggcctca ggagtgatga 34860

agatcccatc atgcctgatg gctctgatca catcgaccac cgtggaatgg gccagaccca 34920

gccagatgat gcaattttgt tgggtttcgg tgacggcggg ggagggaaga acaggaagaa 34980

ccatgattaa cttttaatcc aaacggtctc ggagcacttc aaaatgaagg tcgcggagat 35040

ggcacctctc gcccccgctg tgttggtgga aaataacagc caggtcaaag gtgatacggt 35100

tctcgagatg ttccacggtg gcttccagca aagcctccac gcgcacatcc agaaacaaga 35160

caatagcgaa agcgggaggg ttctctaatt cctcaatcat catgttacac tcctgcacca 35220

tccccagata attttcattt ttccagcctt gaatgattcg aactagttcc tgaggtaaat 35280

ccaagccagc catgataaag agctcgcgca gagcgccctc caccggcatt cttaagcaca 35340

ccctcataat tccaagatat tctgctcctg gttcacctgc agcagattga caagcgggat 35400

atcaaaatct ctgccgcgat ccctgagctc ctccctcagc aataactgta agtactcttt 35460

catatcctct ccgaaatttt tagccatagg acccccagga ataagagaag ggcaagccac 35520

attacagata aaccgaagtc ccccccagtg agcattgcca aatgtaagat tgaaataagc 35580

atgctggcta gacccggtga tatcttccag ataactggac agaaaatcgg gcaagcaatt 35640

tttaagaaaa tcaacaaaag aaaaatcttc caggtgcacg tttagggcct cgggaacaac 35700

gatggagtaa gtgcaagggg tgcgttccag catggttagt tagctgatct gtaaaaaaac 35760

aaaaaataaa acattaaacc atgctagcct ggcgaacagg tgggtaaatc gttctctcca 35820

gcaccaggca ggccacgggg tctccggcgc gaccctcgta aaaattgtcg ctatgattga 35880

aaaccatcac agagagacgt tcccggtggc cggcgtgaat gattcgagaa gaagcataca 35940

cccccggaac attggagtcc gtgagtgaaa aaaagcggcc gaggaagcaa tgaggcacta 36000

caacgctcac tctcaagtcc agcaaagcga tgccatgcgg atgaagcaca aaattttcag 36060

gtgcgtaaaa aatgtaatta ctcccctcct gcacaggcag cgaagctccc gatccctcca 36120

gatacacata caaagcctca gcgtccatag cttaccgagc ggcagcagca gcggcacaca 36180

acaggcgcaa gagtcagaga aaagactgag ctctaacctg tccgcccgct ctctgctcaa 36240

tatatagccc cagatctaca ctgacgtaaa ggccaaagtc taaaaatacc cgccaaataa 36300

tcacacacgc ccagcacacg cccagaaacc ggtgacacac tcaaaaaaat acgcgcactt 36360

cctcaaacgc ccaaactgcc gtcatttccg ggttcccacg ctacgtcatc aaaacacgac 36420

tttcaaattc cgtcgaccgt taaaaacgtc acccgccccg cccctaacgg tcgccgctcc 36480

cgcagccaat cagcgccccg catccccaaa ttcaaacagc tcatttgcat attaacgcgc 36540

accaaaagtt tgaggtatat tattgatgat g 36571

Claims

1.一种分离的多核苷酸，其编码腺病毒纤维蛋白或其功能性衍生物，并且所述多核苷酸选自：

2.一种分离的多核苷酸，其编码腺病毒六邻体蛋白或其功能性衍生物，并且所述多核苷酸选自：

3.一种分离的多核苷酸，其编码腺病毒五邻体蛋白或其功能性衍生物，并且所述多核苷酸选自：

4.一种多核苷酸，其包含至少一种根据权利要求1、2和3中任一项的分离的多核苷酸。

5.根据权利要求1-4中任一项的分离的多核苷酸，其中所述多核苷酸包含以下至少一项：

（a）腺病毒5’-端，优选腺病毒5’反向末端重复，

（b）腺病毒E1a区或其选自13S、12S和9S区的片段，

（c）腺病毒E1b区或其选自小T、大T和IX区的片段，

（d）腺病毒E2b区或其选自小pTP、聚合酶和IVa2区的片段，

（e）腺病毒L1区或其片段，所述片段编码选自28.1 kD蛋白、聚合酶、agnoprotein、52/55 kDa蛋白和IIIa蛋白的腺病毒蛋白质；

（f）腺病毒L2区或其片段，所述片段编码选自根据权利要求3的五邻体蛋白、VII、V和Mu蛋白的腺病毒蛋白质，

（g）腺病毒L3区或其片段，所述片段编码选自VI蛋白、根据权利要求2的六邻体蛋白和内切蛋白酶的腺病毒蛋白质，

（h）腺病毒E2a区，

（i）腺病毒L4区或其片段，所述片段编码选自100 kD蛋白、33 kD同源物和蛋白质VIII的腺病毒蛋白质，

（j）腺病毒E3区或其选自E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8和E3 ORF9的片段，

（k）腺病毒L5区或其片段，所述片段编码根据权利要求1的纤维蛋白，

（l）腺病毒E4区或其选自E4 ORF7、E4 ORF6、E4 ORF5、E4 ORF4、E4 ORF3、E4 ORF2和E4 ORF1的片段，和/或

（m）腺病毒3’-端，优选腺病毒3’反向末端重复。

6.根据权利要求4的分离的多核苷酸，其中所述多核苷酸由下述多核苷酸组成或包含下述多核苷酸：其在全长上与基本上由SEQ ID NO: 13、62、63或65中的任一个组成的序列或由SEQ ID NO: 13、62、63或65中的任一个组成但缺乏SEQ ID NO: 13、62、63或65的基因组区域E1A、E1B、E2A、E2B、E3和/或E4的序列至少90%同一。

7.一种由根据权利要求1-3中任一项的分离的多核苷酸编码的分离的腺病毒衣壳多肽，或其功能性衍生物。

8.一种载体，其包含根据权利要求1-6中任一项的分离的多核苷酸。

9.根据权利要求8的载体，其中所述载体不包含选自E1A、E1B、E2A、E2B、E3和E4的基因组区域中的基因，和/或包含选自E1A、E1B、E2A、E2B、E3和E4的基因组区域的至少一个基因，其中所述至少一个基因包含使所述至少一个基因无功能的缺失和/或突变。

10.一种重组腺病毒，优选不能复制的腺病毒，其包含根据权利要求1-6中任一项的分离的多核苷酸和/或至少一种根据权利要求7的分离的腺病毒衣壳多肽。

11.权利要求10的重组腺病毒，其中所述重组腺病毒包含用于递送至靶细胞的分子。

12.根据权利要求10或11的重组腺病毒，其中所述腺病毒在人受试者中具有低于5%的血清阳性率和优选在人受试者中无血清阳性率。

13.根据权利要求10-12中任一项的重组腺病毒，其中所述腺病毒能够感染哺乳动物细胞。

14.根据权利要求11-13中任一项的重组腺病毒，其中所述用于递送至靶细胞的分子是编码抗原蛋白或其片段的多核苷酸。

15.权利要求10-14中任一项的重组腺病毒，其中所述腺病毒是已被保藏的腺病毒并具有选自08110601 (ChAd83)、 08110602 (ChAd73)、08110603 (ChAd55)、08110604 (ChAd147)和08110605 (ChAd146)的保藏号。

16.一种组合物，其包含佐剂和以下（i）至（iv）中至少一项：

（i）一种或多种根据权利要求7的分离的腺病毒衣壳多肽，

（ii）根据权利要求1-6中任一项的分离的多核苷酸，

（iii）根据权利要求8-9中任一项的载体，

（iv）根据权利要求10-15中任一项的重组腺病毒，

和任选地，药学上可接受的赋形剂。

17.根据权利要求16的组合物，其中所述佐剂是受体的激动剂，所述受体选自I型细胞因子受体、II型细胞因子受体、TNF受体、担当转录因子的维生素D受体、以及Toll样受体1(TLR1)、TLR-2、TLR 3、TLR4、TLR5、TLR-6、TLR7和TLR9。

18.根据权利要求17的组合物，其中所述佐剂是Toll样受体4或9激动剂。

19.一种细胞，其包含以下至少一项：

（i）一种或多种根据权利要求7的分离的腺病毒衣壳多肽，

（ii）根据权利要求1-6中任一项的分离的多核苷酸，

（iii）根据权利要求8-9中任一项的载体，

（iv）根据权利要求10-15中任一项的重组腺病毒。

20.根据权利要求18的细胞，其中所述细胞是表达至少一种选自E1a、E1b、E2a、E2b、E4、L1、L2、L3、L4和 L5的腺病毒基因的宿主细胞。

21.根据权利要求7的分离的腺病毒衣壳多肽、根据权利要求1-6中任一项的分离的多核苷酸、根据权利要求8-9中任一项的载体、根据权利要求10-15中任一项的重组腺病毒和/或根据权利要求18的组合物用于疾病的治疗或预防的用途。

22.根据权利要求21的用途，其中所述治疗或预防是接种。

23.根据权利要求21的用途，其中所述治疗是基因治疗。