CN101213204A - 丙型肝炎病毒核酸疫苗 - Google Patents

丙型肝炎病毒核酸疫苗 Download PDF

Info

Publication number
CN101213204A
CN101213204A CNA2006800216989A CN200680021698A CN101213204A CN 101213204 A CN101213204 A CN 101213204A CN A2006800216989 A CNA2006800216989 A CN A2006800216989A CN 200680021698 A CN200680021698 A CN 200680021698A CN 101213204 A CN101213204 A CN 101213204A
Authority
CN
China
Prior art keywords
leu
ala
thr
ser
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800216989A
Other languages
English (en)
Other versions
CN101213204B (zh
Inventor
A·拉姆
S·科洛卡
A·富尔戈里
A·尼科西亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MSD Italia SRL
Original Assignee
Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Istituto di Ricerche di Biologia Molecolare P Angeletti SpA filed Critical Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Publication of CN101213204A publication Critical patent/CN101213204A/zh
Application granted granted Critical
Publication of CN101213204B publication Critical patent/CN101213204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/29Hepatitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5258Virus-like particles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Communicable Diseases (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明描述了可以用作HCV核酸疫苗、疫苗组分或用于产生HCV疫苗的核酸构建体。所述的构建体包括:(1)编码含有基于第一种HCV毒株的NS3-4A区和基于第二种毒株的NS3-NS4A-NS4B-NS5A或NS3-NS4A-NS4B-NS5A-NS5B区的嵌合HCV多肽的构建体;和(2)编码HCV多肽的基于黑猩猩的腺病毒载体。

Description

丙型肝炎病毒核酸疫苗
相关申请
本申请要求2005年6月17日提交的美国临时申请号60/691,523,和2005年7月15日提交的美国临时申请号60/699,514的优先权,将它们都引入本文作为参考。
发明背景
不承认本申请中引用的参考文献是所要求保护的本发明的现有技术。
约3%的世界人口感染丙型肝炎病毒(HCV)。(Wasley et al.Semin.Liver Dis.20,1-16,2000.)接触HCV在少数病例中引起明显的急性病,而在多数情况下,该病毒建立慢性感染,导致肝脏炎症和缓慢发展为肝衰竭和肝硬化。(Iwarson,FEMS Microbiol.Rev.14,201-204,1994.)此外,流行病学调查表明HCV在肝细胞癌的发病机理中起重要作用(Kew,FEMS Microbiol.Rev.14,211-220,1994,Alter,Blood 85,1681-1695,1995.)。
在1992年实现HCV的常规血液筛查之前,通过不经意地接触受污染的血液、血液制品或者移植器官而导致多数感染。在进行HCV的血液筛查的那些区域,主要通过静脉内药物使用感染HCV。较不常见的传播方法包括围产期接触、血液透析和与感染HCV的人的性接触。(Alteret al.N.Engl.J.Med.341(8),556-562,1999,Alter,J.Hepatol.31 Suppl.88-91,1999,Wasley et al.Semin.Liver.Dis.201,1-16,2000.)
HCV基因组由编码约3000个氨基酸的前体多蛋白的约9.5kb的单链RNA组成。(Choo et al.Science  244,362-364,1989,Choo et al.Science 244,359-362,1989,Takamizawa et al.J.Virol.65,1105-1113,1991.)HCV多蛋白含有以下顺序的病毒蛋白质:C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B。
例如,Cho et al.Vaccine 17:1136-1144,1999;Paliard et al.国际公布号WO 01/30812;Coit et al.国际公布号WO 01/38360;和Emini etal.国际公布号WO 03/031588提及了HCV核酸序列的用途,所述核酸序列提供一种或多种HCV非结构抗原以产生CMI应答。
发明概述
本发明描述了核酸构建体,其可以用作HCV核酸疫苗、疫苗组分或者用于生产HCV疫苗。所述的构建体包括:(1)编码嵌合HCV多肽的构建体,所述多肽含有基于第一种HCV毒株的NS3-4A区和基于第二种毒株的NS3-NS4A-NS4B-NS5A或NS3-NS4A-NS4B-NS5A-NS5B区;和(2)编码HCV多肽的基于黑猩猩的腺病毒载体。
从而,本发明的第一方面描述了包含编码HCV嵌合多肽的核苷酸序列的核酸。所述多肽包含HCV NS3-4a区和HCV NS3-NS4A-NS4B-NS5A区,HCV NS3-4a区包含与第一种HCV毒株的HCV NS3-4a基本上相似的氨基酸序列,HCV NS3-NS4A-NS4B-NS5A区包含与第二种HCV毒株的HCV NS3-NS4A-NS4B-NS5A基本上相似的氨基酸序列,其中所述两个区中存在的NS3-4A序列具有不同的序列。第一个区位于第二个区的氨基或者羧基侧。
关于氨基酸序列,对“基本上相似的序列”的引用指出与参考序列至少约70%的同一性。与参考序列的百分比同一性(也称作百分比同一的)可如下确定:将所述多肽区与对应的参考区比较以得到相同氨基酸的最大数目并确定对应的区域中相同氨基酸的数目。将该数目除以参考区域中氨基酸总数然后乘以100并四舍五入到最接近的整数。例如,HCVNS3-4A,NS3-NS4A-NS4B-NS5A和NS3-NS4A-NS4B-NS5A-NS5B的区域可以是不同的HCV毒株中存在的相应的HCV区域。
第一个和第二个区域中存在的不同的NS3-4A序列通过一个或多个氨基酸差异来反映。每个氨基酸差异独立地为添加、替代或者缺失。
在优选实施方案中,核酸是能够在人细胞中表达编码的HCV多肽的表达载体。人细胞内的表达具有治疗应用,用以主动治疗HCV感染和预防性治疗HCV感染。
表达载体含有编码多肽以及用于正确转录和加工的调节元件的核苷酸序列。可以存在的调节元件包括与编码所述多肽的核苷酸序列天然结合的那些元件和不与所述核苷酸序列天然结合的外源调节元件。外源调节元件如外源启动子可以用于在特定宿主,如人细胞中表达。
优选的表达载体是具有一个或多个缺失区域的重组腺病毒基因组。重组腺病毒基因组可以含有与一种或多种腺病毒血清型基本上相似的不同区域。对缺失区域的引用表示缺失全部或者部分所述区域。
本发明的另一方面描述了重组腺病毒,其包含:
a)编码HCV多肽的表达盒,其中HCV多肽包含HCV NS3-NS4A-NS4B-NS5A;和
b)含有E1缺失、E3缺失和任选含有E4缺失的重组腺病毒基因组;条件是该腺病毒基因组编码如下至少一种:(i)具有与SEQ IDNO:3或9基本相似的氨基酸序列的尾丝区;(ii)具有与SEQ IDNO:5或11基本相似的氨基酸序列的六邻体区;和(iii)具有与SEQ ID NO:7基本相似的氨基酸序列的五邻体区。
所述表达盒位于E1或者E3缺失。如果表达盒的全部或者部位位于对应于E1或者E3缺失的区域的位置中,那么认为该表达盒位于E1或者E3缺失中。
对HCV多肽或者氨基酸序列的引用包括天然存在的HCV序列、天然存在的序列的衍生物,其基本上类似于天然存在的序列或者所指出的序列,和嵌合HCV多肽。嵌合HCV多肽包括如上本发明第一方面所述的那些。
本发明的另一方面描述了重组腺病毒颗粒。所述颗粒由本文描述的重组腺病毒基因组编码并且包装该基因组的拷贝。
本发明的另一方面描述了制备重组腺病毒颗粒的方法,其包括步骤:(a)使用E1补充细胞表达重组腺病毒基因组来产生颗粒;和(b)基本上纯化该颗粒。对基本上纯化该颗粒的引用表示除去产生所述颗粒的全部或者多数细胞和细胞碎片。
本发明的另一方面描述了药物组合物,其包含治疗有效量的编码HCV多肽的核酸和可药用载体。
本发明的另一方面描述了治疗患者的方法,其包括对患者施用治疗有效量的编码HCV多肽的核酸的步骤。
对“治疗”的引用包括治疗HCV感染的患者或者预防性治疗患者以减小主动HCV感染的可能性或者严重性。“患者”指能够被HCV感染的哺乳动物。患者可以被或不被HCV感染。患者的实例是人和黑猩猩。
对于HCV感染的患者,有效量足以实现一种或多种下面的效果:减小HCV复制的能力,减小HCV负荷,增加病毒清除,和增强一种或多种HCV特异性CMI应答。
对于不被HCV感染的患者,有效量足以实现下面的一种或多种:增加产生对HCV感染的HCV特异性CMI应答的一种或多种组分的能力,减小对HCV感染的易感性,和减小感染性病毒建立持久感染而发生慢性疾病的能力。
对开放式术语如“包含”的引用允许额外的成分或者步骤。有时短语如“一种或多种”与或者不与开放式术语一起使用以强调额外的成分或者步骤的可能性。
除非明确指出,对术语如“一个”或“一种”的引用不限于一个。例如,“一个细胞”不排除“多个细胞”。有时,使用诸如一个或多个的短语来强调可能存在多个。
从本文提供的额外描述,包括不同的实施例,本发明的其他特点和优点是显而易见的。所提供的实施例阐明可用于实施本发明的不同的组分和方法。实施例不限制所要求保护的发明。基于本公开,技术人员可以鉴定和使用可用于实施本发明的其他组分和方法。
附图简述
图1提供了SEQ ID NO:1的氨基酸序列。氨基酸1-686提供了NS3-NS4A区,其基于HCV 3a。氨基酸687-690提供了HCV 3a NS4B区的前4个氨基酸并且提供了HCV 3a NS3-NS4A区的切割连接点。氨基酸691-2675提供了基于HCV 1b的NS3-NS4A-NS4B-NS5A-NS5B区。NS3-NS4A区和NS3-NS4A-NS4B-NS5A-NS5B还含有初始甲硫氨酸的加入。
图2A-2C提供了SEQ ID NO:2的核酸序列。
核苷酸318-10182提供了表达盒,其含有:
HCMV启动子:nt 318-905
Int A:nt 1040-1865
Kozaq序列:nt 1885-1890
HCV Met-NS3-NS4A(基于3a,优化的):nt 1891-3948
HCV NS4B的前4个氨基酸(基于3a):nt 3949-3960
HCV Met-NS3-5B(基于1b,Bk毒株,优化的):nt 3961-9915
TAAA终止子:nt 9916-9919
BGH:nt 9956-10179。
图3提供了met-NS3-5B序列(SEQ ID NO:16)。
图4A-4J提供了ChAd3尾丝(图4A,SEQ ID NO:3),ChAd3六邻体(图4B,SEQ ID NO:5),ChAd3五邻体(图4C,SEQ ID NO:7),ChAd63尾丝(图4D,SEQ ID NO:9),ChAd63六邻体(图4E,SEQ IDNO:11)的氨基酸序列;和ChAd3尾丝(图4F,SEQ ID NO:4),ChAd3六邻体(图4G,SEQ ID NO:6),ChAd3五邻体(图4H,SEQ ID NO:8),ChAd63尾丝(图4I,SEQ ID NO:10),和ChAd63六邻体(图4J,SEQ ID NO:12)的编码核酸。
图5A-5H提供了ChAd3ΔE1,3,4,Ad5E4orf6,NSmut-35,890bp(ChAd3NSmut,SEQ ID NO:13)的核酸序列。野生型基因组的缺失坐标为:E1缺失从nt 461到nt 3541(3080bp),E3缺失从nt 28644到nt32633(3989bp),E4缺失从nt 34634到nt 37349(2715bp)。不同的区域如下:
ChAd3左ITR+包装信号:nt 1-460
HCMV启动子:nt 467-1257
Kozak共有序列:nt 1263-1268
HCV NS3-5B(BK毒株):nt 1269-7223
TAA终止子:nt 7224-7226
BGH多聚A:nt 7234-7452
ChAd3骨架:nt 7468-35890
Ad5E4orf6:nt 34601-35482。
图6A-6H提供了野生型ChAd3的核酸序列(SEQ ID NO:14)。
图7A-7H提供了野生型ChAd6的核酸序列(SEQ ID NO:15)。
图8提供了ChAd3NSmut(SEQ ID NO:13)和MRKAd6NSmut感染的HeLa细胞中HCV NS蛋白质表达的比较。
图9提供了ChAd3NSmut(SEQ ID NO:13)和MRKAd6NSmut诱导C57/B6小鼠中细胞介导的免疫的能力的比较。
图10A-10H提供了ChAd63ΔE1,3,4,Ad5E4orf6,NSmut的核酸序列(SEQ ID NO:17)。野生型基因组的缺失坐标是:E1缺失从nt 455到nt3421(2967bp),E3缺失从nt 27207到nt 31778(4582bp),E4缺失从nt33825到nt 36215(2390bp)。不同的区域如下:
ChAd63左ITR+包装信号:nt 1-454
HCMV启动子:nt 458-1248
Kozak共有序列:nt 1254-1259
HCV NS3-5B(BK毒株):nt 1260-7214
TAA终止子:nt 7215-7217
BGH多聚A:nt 7227-7447
ChAd63主链:nt 7458-34658
Ad5E4orf6:nt 33316-34197。
图11图解了通过IFN-γELISPOT测量的免疫应答的时间过程,表达为在任何给定时间点对不同的HCV NS肽库观察到的应答的和。
图12图解了pV1JnsNSOPTmut 3a-1b的不同组分。
图13图解了编码嵌合HCV多肽的pV1JnsNSOPTmut 3a-1b表达盒的遗传结构。不同的核苷酸区域为:
-人CMV启动子:318-905;
-内含子A:1040-1865;
-Kozaq序列:1885-1894;
-HCV MetNS3-NS4A(基因型3a):1891-3960;
-HCV MetNS3-NS5BOPTmut(基因型1b):3961-9915;
-TAAA终止子:9916-9919;和
-BGH多聚A:9965-10182
图14显示了用嵌合质粒(pV1Jns-NSOPTmut 3a-1b)或用pV1Jns-NSOPTmut免疫的动物(CD1小鼠)中,反应于来自HCV 1b和3a的NS3蛋白质而分泌IFN-γ的细胞数目(表示为每一百万个脾细胞中形成斑点的细胞)。
发明详述
本发明包括编码HCV嵌合多肽的核酸,其提供基于不同的HCV毒株的HCV非结构蛋白,和黑猩猩腺病毒载体用于表达HCV多肽的用途。所述核酸的用途包括用作疫苗组分以向细胞中导入HCV多肽,其提供用于产生抗HCV的CMI应答的宽范围的抗原,和用作生产此类疫苗组分的中间体。
由于主要组织相容性复合体(MHC)I类和II类表达的广泛的分布,适应性细胞免疫应答可以发挥识别身体各处HCV感染的细胞中的病毒抗原,诱导免疫学记忆,和保持免疫学记忆的功能。这些功能规因于抗原特异性CD4+T辅助(Th)和CD8+细胞毒性T细胞(CTL)。
当通过它们的特异T细胞受体激活时,HCV特异性Th细胞完成多种免疫调节功能,它们的多数由Th1和Th2细胞因子介导。HCV特异性Th细胞帮助B细胞的激活和分化和病毒特异性细胞毒性T细胞的诱导和刺激。Th细胞与CTL一起还可以分泌抑制多种病毒的复制和基因表达的IFN-γ和TNF-α。此外,主要的效应细胞Th细胞和CTL可以诱导病毒感染的细胞的细胞凋亡和裂解。
反应于专职抗原呈递细胞(pAPCs)加工的抗原而产生HCV特异性CTL。抗原可以在pAPCs中合成或者导入pAPCs。通过向细胞中导入编码抗原的表达盒,可以在pAPCs细胞中发生抗原合成。
核酸疫苗施用的优选途径是肌内途径。肌内施用似乎导致向体细胞和pAPCs中导入和表达核酸。在体细胞中产生的HCV抗原可以转移到pAPCs中用于在MHCI类分子背景中的呈递。(Donnelly et al.Annu.Rev.Immunol.15:617-648,1997.)
pAPCs将较长的抗原加工成蛋白酶体复合体中较小的肽抗原。该抗原被易位到内质网/高尔基复合体分泌途径用于与MHC I类蛋白质结合。CD8+T淋巴细胞通过T细胞受体(TCR)和CD8细胞表面蛋白识别与I类MHC结合的抗原。
基于黑猩猩腺病毒作为用于导入HCV抗原的载体的用途提供了人腺病毒载体的备选方案。基于黑猩猩腺病毒的载体当与多种免疫策略结合使用时尤其有用,其中被治疗的患者已经产生了针对最初使用的腺病毒载体的免疫应答。重复暴露于相同类型的基于腺病毒的载体可以由于针对腺病毒蛋白质的免疫应答而导致降低的有效性。一些最初的暴露可以是腺病毒感染的结果,可能补充使用腺病毒治疗HCV之外的疾病。
基于本文提供的教导,可以产生足够强的免疫应答以在患者中实现有益效果。所提供的教导包括关于HCV序列选择、载体选择、载体产生、组合治疗和施用的信息。
I.嵌合序列
提供具有不同的NS3-4A序列的区域的HCV嵌合多肽可以用作疫苗组分来提供靶定不同HCV毒株的抗原。HCV的主要特征是它的基因组的异质性。(Pawlotsky,Clin.Liver Dis,7:45-66,2003,Simmonds,J.General.Virol,85:3173-3188,2004.)此外,通常的易错的依赖RNA的RNA聚合酶和缺少RNA病毒通常的校正活性以及宿主导致的突变,是造成宿主中的HCV循环作为称作准种的复杂病毒群体的原因。(Blight etal.Science 290:1972-1974,2000.)
嵌合构建体的不同区域中存在的不同的NS3-4A序列通过一个或多个氨基酸差异反映。每个氨基酸差异独立地是添加、替代或缺失。在不同实施方案中,第一个和第二个区域的NS3-4A区域相差至少约5%,至少10%,至少15%,或者有至少1、5、10、15、20或25个氨基酸改变。除了NS3-4A序列外,NS3-4A区域可以含有额外的氨基酸,如氨基末端甲硫氨酸和/或导入的切割位点。
可以从100减去序列同一性,确定百分比差异。例如,85%序列同一性提供了15%的差异。
基于天然存在的HCV分离物的多种实例,可以容易地产生嵌合多肽中存在的第一个区域和第二个多肽区域。可以将HCV分离物分类成下面的六个主要基因型,其包含一个或多个亚型:HCV-1/(1a,1b,1c)、HCV-2/(2a,2b,2c)、HCV-3/(3a,3b,10a)、HCV-4/(4a),HCV-5/(5a)和HCV-6/(6a,6b,7b,8b,9a,11a)。(Simmonds,J.Gen.Virol.693-712,2001.)特定的HCV序列如HCV-BK、HCV-J、HCV-N和HCV-H已经保存在GenBank并在多种出版物中描述。(例如,Chamberlain et al.J.Gen.Virol.1341-1347,1997.)
优选地,第一个和第二个区域都在体内被HCV蛋白酶加工以提供对应于存在于HCV嵌合多肽中的各个蛋白质的蛋白质。各HCV蛋白质可以被细胞进一步加工。
在涉及第一个区域的不同实施方案中,所述区域为或者含有氨基酸序列,该氨基酸序列基本上类似于如下序列中存在的NS3-NS4A区:SEQID NO:1的氨基酸1-686;HCV 1a(检索号M62321);HCV 2a(检索号D00944;HCV 3a(检索号:D28917);HCV 4a(检索号:Y 11604);HCV 5a(检索号:Y13184)或HCV 6a(检索号:D84264)。
在涉及第二个区域的不同实施方案中,该区域为或者含有NS3-NS4A-NS4B-NS5A或NS3-NS4A-NS4B-NS5A-NS5B*序列,其基本上类似于如下序列中存在的对应的区域:SEQ ID NO:1的氨基酸686-2675、氨基酸691-2675或氨基酸692-2675;HCV 1a(检索号M62321);HCV 2a(检索号D00944;HCV 3a(检索号:D28917);HCV 4a(检索号:Y11604);HCV 5a(检索号:Y13184)或HCV 6a(检索号:D84264)。对“NS5B*”的引用指无活性的NS5B。
优选地,第二个区域含有与来自第一个区域的蛋白酶活性相容的氨基酸切割位点。可以基于已知的切割序列加入切割位点。
关于氨基酸序列对“基本上相似的序列”的引用指出与参考序列至少约70%的同一性。与参考序列的百分比同一性(也称作百分比同一的)可如下确定:将所述多肽区与对应的参考区比较以得到相同氨基酸的最大数目并确定对应的区域中相同氨基酸的数目。将该数目除以参考区域中氨基酸总数然后乘以100并四舍五入到最接近的整数。
在不同实施方案中,基本上相似的序列具有至少75%、至少80%、至少85%、至少90%、至少95%的同一性;或者相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸改变。每个改变独立地为插入、替代或者添加。
可以产生对天然存在的HCV序列的修饰以得到不同的基本上相似的序列。天然存在的氨基酸中的差异是由于不同的氨基酸侧链(R基团)。R基团影响氨基酸的不同的性质,如物理大小、电荷和疏水性。可以将氨基酸分成如下的不同组:中性且疏水的(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、色氨酸、苯丙氨酸和甲硫氨酸);中性且极性的(甘氨酸、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、天冬酰胺和谷氨酰胺);碱性的(赖氨酸、精氨酸和组氨酸);和酸性的(天冬氨酸和谷氨酸)。
通常,在替代不同的氨基酸以保持活性中,优选交换具有相似性质的氨基酸。替代特定组中的不同氨基酸,如缬氨酸替代亮氨酸、精氨酸替代赖氨酸和天冬酰胺替代谷氨酰胺是不引起多肽三级结构的改变的良好候选者。
氨基酸修饰优选保持或者加入T细胞抗原区域。可以对天然存在的HCV多肽序列进行不同的修饰以产生能够引起宽范围的T细胞应答的多肽。影响多肽引起宽T细胞应答的能力的因素包括保留或者引入HCV特异性T细胞抗原区和在不同的HCV分离物中不同的T细胞抗原区的优势。
例如,通过经验性实验可以鉴定HCV T细胞抗原。鉴定T细胞抗原的一种方法涉及从较长的多肽产生一系列重叠的短肽,然后从来自受感染的患者的T细胞群体筛选阳性克隆。通过特定的肽活化/激发阳性克隆。诸如IFNγ-ELISPOT、IFNγ-细胞内染色和成批CTL测定法的技术可以用于测量肽活性。可以认为这样鉴定的肽代表各自病原体的T细胞表位。
HCV多肽自身加工和产生CMI应答的能力可以用本文描述的或者本领域公知的技术测定。(见例如,Emini et al.国际公布号WO03/031588.)此类技术包括使用IFNγ-ELISPOT、IFNγ-细胞内染色和成批CTL测定法测量HCV特异性CMI应答。
可以在NS5B中进行小的修饰以通过靶定复制所必需的基序而产生无活性的聚合酶。NS5B活性关键的基序和可以做出以产生无活性的NS5B的修饰的实例由Lohmann etal.Journal of Virology 71:8416-8426,1997,Kolykhalov et al.Journal of Virology 74:2046-2051,2000,和Emini et al.国际公布号WO 03/031588描述。
当对嵌合HCV产生修饰时,需要考虑的额外因素包括保持自身加工的能力和保持T细胞抗原。所述多肽自身加工的能力很大程度上由功能蛋白酶活性决定。通过考虑NS3蛋白酶、作为NS3的辅因子的NS4A和HCV多肽中存在的蛋白酶识别位点,可以得到保持蛋白酶活性的修饰。
II.嵌合NS3 1 -NS4A 1 -NS3 2 -NS4A 2 -NS4B 2 -NS5A 2 -NS5B * 2
优选的嵌合HCV多肽是NS31-NS4A1-NS32-NS4A2-NS4B2-NS5A2-NS5B* 2,其中下标1和2表示与不同的HCV毒株中的对应区域基本上相似的区域序列,“NS5B*”表示酶学上无活性的NS5B。NS31-NS4A1和NS32-NS4A2相差至少一个氨基酸。在不同的实施方案中,NS31-NS4A1和NS32-NS4A2相差至少约5%,至少约10%,至少约15%;或者有至少1、5、10、15、20或25个氨基酸改变。
优选地,NS31-NS4A1-NS32-NS4A2-NS4B2-NS5A2-NS5B2 *多肽为第一个和第二个区域提供了足够的体内蛋白酶活性以各自产生一种或多种各自的HCV肽。在优选实施方案中,所述多肽可以产生作为单个肽的NS31,NS4A1、NS32、NS4A2、NS4B2、NS5A2和NS5B2 *
可以如上文第I部分中所述提供不同的NS31-NS4A1和NS32-NS4A2-NS4B2-NS5A2-NS5B2 *区域。在不同的实施方案中,NS31-NS4A1区域为或者含有与SEQ ID NO:1的氨基酸1-686,或氨基酸2-686基本上相似的序列;NS32-NS4A2-NS4B2-NS5A2-NS5B2 *为或者含有与SEQ IDNO:1的氨基酸687-2675、691-2675或692-2675基本上相似的序列;或者NS31-NS4A1-NS32-NS4A2-NS4B2-NS5A2-NS5B2 *作为整体与SEQ IDNO:1基本上相似。在不同的实施方案中,每个区域与SEQ ID NO:1中对应的区域至少75%,至少80%,至少85%,至少90%,至少95%基本上相似;或者相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸改变。
III.基因表达盒
编码多肽的基因表达盒含有多肽表达所需的元件。对“多肽”的引用可以是嵌合多肽。
III.A.编码的多肽序列
本文描述的HCV多肽编码的序列可以用于不同的载体中。特定的实例包括如上文第I和II部分中描述的嵌合多肽序列,和HCV多肽序列Met-NS3-NS4A-NS4B-NS5A-NS5B*,如与SEQ ID NO:16基本上相似的序列(见Emini et al.国际公布号WO 03/031588)。与SEQ ID NO:16基本上相似的序列例如可以与下文第V部分中描述的黑猩猩载体结合使用。
在不同实施方案中,SEQ ID NO:16基本上相似的序列与SEQ IDNO:16的序列同一性为至少75%、至少80%、至少85%、至少90%、至少95%;或者相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸改变。
III.B.编码的多肽序列
基因表达盒中存在的调节元件一般包括:(a)在转录上偶联到编码所述多肽的核苷酸序列的启动子,(b)功能上偶联到所述核苷酸序列的5’核糖体结合位点,(c)连接到所述核苷酸序列的3’末端的终止子,和(d)功能上偶联到所述核苷酸序列的3’多聚腺苷酸化信号。还可以存在可用于增强或调节基因表达或者多肽加工的额外的调节元件。
启动子是被RNA聚合酶识别并介导下游区域转录的遗传元件。优选的启动子是提供增强水平的转录的强启动子。强启动子的实例是立即早期人巨细胞病毒启动子(CMV),和具有内含子A的CMV。(Chapmanet al,Nucl.Acids Res.19:3979-3986,1991.)启动子的其他实例包括天然存在的启动子,如EF1α启动子、鼠CMV启动子、劳斯肉瘤病毒启动子,和SV40早期/晚期启动子和β-肌动蛋白启动子,和人工启动子,如合成的肌肉特异性启动子和嵌合的肌肉特异性/CMV启动子(Li et al.Nat.Biotechnol.17:241-245,1999,Hagstrom et al.Blood95:2536-2542,2000)。
核糖体结合位点位于起始密码子处或者附近。核糖体结合位点的实例包括CCACCAUGG、CCGCCAUGG和ACCAUGG,其中AUG是起始密码子(Kozak,Cell 44:283-292,1986.)。核糖体结合位点的另一实例由SEQ ID NO:18提供。
多聚腺苷酸化信号负责切割转录的RNA和向RNA加入多聚(A)尾。高等真核生物中的多聚腺苷酸化信号含有来自多聚腺苷酸化加入位点的约11-30个核苷酸的AAUAAA序列。AAUAAA序列参与信号传递RNA切割。(Lewin,Genes IV,Oxford University Press,NY,1990.)多聚(A)尾对于mRNA加工是重要的。
可以用作基因表达盒的部分的多聚腺苷酸化信号包括最小兔β-珠蛋白多聚腺苷酸化信号和牛生长激素多聚腺苷酸化(BGH)信号。(Xuet al.Gene 272:149-156,2001,Post et al.U.S.Patent No.5,122,458.)额外的实例包括合成的多聚腺苷酸化信号(SPA)和SV40多聚腺苷酸化信号。SPA序列由SEQ ID NO:19提供。
对“转录上偶联的”的引用表示启动子处于这样的位置,其使得结合在该启动子处的RNA聚合酶可以引起核苷酸序列的转录。转录上偶联不需要被转录的序列与启动子相邻。
对“功能上偶联的”的引用表示介导对核苷酸序列的作用的能力。功能上偶联不需要偶联的序列相互相邻。功能上偶联到核苷酸序列的3’多聚腺苷酸化信号促进所转录的RNA的切割和多聚腺苷酸化。功能上偶联到核苷酸序列的5’核糖体结合位点方便核糖体结合。
可用于增强或调节基因表达或者可能存在的多肽加工的额外的调节元件的实例包括增强子、前导序列和操纵子。增强子区增强转录。增强子区的实例包括CMV增强子和SV40增强子。(Hitt et al.Methods inMolecular Genetics 7:13-30,1995,Xu,et al.Gene 272:149-156,2001.)增强子区可以与启动子结合。
前导序列是多肽上的氨基酸区域,其将该多肽导向蛋白酶体。编码前导序列的核酸在结构基因的5’并且沿着该结构基因转录。前导序列的实例是tPA。
操纵子序列可以用于调节基因表达。例如,Tet操纵基因序列可以用于抑制基因表达。
IV.编码核酸序列
编码核酸序列提供了编码特定氨基酸序列的密码子。用特定氨基酸序列和遗传密码的已知的简并性开始,可以得到许多不同的编码核酸序列。因为几乎所有氨基酸都由核苷酸三联体或者“密码子”的不同组合编码,所以产生遗传密码的简并性。
特定密码子向特定氨基酸的翻译是本领域中公知的(见,例如,Lewin GENES IV,p.119,Oxford University Press,1990)。氨基酸由如下的密码子编码:
A=Ala=丙氨酸:密码子GCA,GCC,GCG,GCU
C=Cys=半胱氨酸:密码子UGC,UGU
D=Asp=天冬氨酸:密码子GAC,GAU
E=Glu=谷氨酸:密码子GAA,GAG
F=Phe=苯丙氨酸:密码子UUC,UUU
G=Gly=甘氨酸:密码子GGA,GGC,GGG,GGU
H=His=组氨酸:密码子CAC,CAU
I=Ile=异亮氨酸:密码子AUA,AUC,AUU
K=Lys=赖氨酸:密码子AAA,AAG
L=Leu=亮氨酸:密码子UUA,UUG,CUA,CUC,CUG,CUU
M=Met=甲硫氨酸:密码子AUG
N=Asn=天冬酰胺:密码子AAC,AAU
P=Pro=脯氨酸:密码子CCA,CCC,CCG,CCU
Q=Gln=谷氨酰胺:密码子CAA,CAG
R=Arg=精氨酸:密码子AGA,AGG,CGA,CGC,CGG,CGU
S=Ser=丝氨酸:密码子AGC,AGU,UCA,UCC,UCG,UCU
T=Thr=苏氨酸:密码子ACA,ACC,ACG,ACU
V=Val=缬氨酸:密码子GUA,GUC,GUG,GUU
W=Trp=色氨酸:密码子UGG
Y=Tyr=酪氨酸:密码子UAC,UAU
SEQ ID NO:13的核苷酸1269-7223提供了NS3-NS4A-NS4B-NS5A-NS5B*序列的实例。与SEQ ID NO:13的核苷酸1269-7223基本上相似的序列可以用作疫苗组分的部分。(Emini et al.国际公布号WO03/031588.)例如,此类基本上相似的序列可以用作基于ChA3或ChA63的腺病毒载体的部分。
关于核苷酸序列,对“基本上相似的序列”的引用表示与参考序列至少约70%的同一性。与参考序列的百分比同一性(也称作百分比同一的)可如下确定:将所述核苷酸区与对应的参考区比较以得到最大同一性并确定对应的区域中相同核苷酸的数目。将该数目除以参考区域中核苷酸总数然后乘以100并四舍五入到最接近的整数。
可以优化核酸序列以增强在宿主中的表达。将考虑的因素包括C:G含量、优选的密码子、抑制性二级结构的避免。这些因素可以以不同的方式组合以试图得到在特定宿主中具有增强的表达的核酸序列。(见,例如,Donnelly et al.国际公布号WO 97/47358.)
HCV编码核酸的优化也在Emini et al.国际公布号WO 03/031588中描述。WO 03/031588提供了编码NS3-NS4A-NS4B-NS5A-NS5B*的不同的优化序列的实例。
NS31-NS4A1-NS32-NS4A2-NS4B2-NS5A2-NS5B2 *的密码子优化的序列的实例由SEQ ID NO:2的核苷酸1891-9915提供。核苷酸1891-1893提供了NS31-NS4A1区的甲硫氨酸密码子。核苷酸3949-3960提供了NS32-NS4A2区,其前四个氨基酸基于HCV 3a,接着是甲硫氨酸。
在本发明的不同的实施方案中,NS31-NS4A1-NS32-NS4A2-NS4B2-NS5A2-NS5B2 *编码区与SEQ ID NO:2的核苷酸1891-9915或1894-9915基本上相似。在不同的实施方案中,该核苷酸序列与SEQ ID NO:2的核苷酸1891-9915或1894-9915具有至少80%、至少85%、至少90%、至少95%同一性;或者相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或1-50个核苷酸。
V.核酸载体
编码HCV多肽的核酸可以用作治疗载体或者用于产生治疗载体。用于产生治疗载体的载体包括穿梭载体和腺病毒基因组质粒。
治疗载体用于向细胞中导入并在其中表达HCV多肽。合适的载体可以递送核酸到靶细胞,而不引起不可接受的副作用。用编码HCV多肽的基因表达盒实现了细胞表达。
可以用于治疗应用的载体的实例包括第一代和第二代腺病毒载体、依赖辅助病毒的腺病毒载体、腺伴随病毒载体、逆转录病毒载体、α病毒载体、委内瑞拉马脑炎病毒载体,和质粒载体。(Hitt,et al.Advances in Pharmacology 40:137-206,1997,Johnston et al.美国专利号6,156,588,Johnston et al.国际公布号WO 95/32733,Emini et al.国际公布号WO 03/031588)
V.A.腺病毒载体
腺病毒载体使用重组腺病毒基因组在靶细胞中表达目的蛋白质或者多肽。野生型腺病毒具有双链线性基因组,在两端具有反向末端重复。在病毒复制期间,基因组包装在病毒壳体内部形成病毒体。病毒通过病毒附着接着内化进入它的靶细胞。(Hitt et al.Advances inPharmacology 40:137-206,1997)
腺病毒基因组提供了腺病毒复制和加工所需的不同的元件。腺病毒基因组的每个末端含有反向末端重复(ITR),其是病毒复制必需的。该病毒还编码加工产生感染性病毒体所需的一些结构蛋白质必需的蛋白酶活性。
可以基于宿主细胞转导后病毒基因的表达顺序描述腺病毒基因组的结构。根据转录发生在DNA复制开始之前或之后,将病毒基因称作早期(E)或者晚期(L)基因。在转录早期,表达E1、E2、E3和E4基因,为宿主细胞的病毒复制做准备。通过缺失病毒基因组的必需的早期区域1(E1),可以使得病毒成为复制缺陷的。(Brody et al,Ann.N.Y.Acad.Sci.716:90-101,1994.)
在晚期,晚期基因的表达被打开,该基因编码病毒颗粒的结构组分。所有晚期基因都处于单个启动子的控制下,并且编码蛋白质,包括五邻体(L2)、六邻体(L3)、100kDa支架蛋白(L4),和尾丝蛋白(L5),其形成新的颗粒,腺病毒DNA可以包裹在所述颗粒中。最后,野生型腺病毒复制过程可以引起细胞裂解。
腺病毒载体可以基于不同的腺病毒血清型,如在人或者动物中发现的那些。动物腺病毒的实例包括牛、猪、黑猩猩、鼠、犬和鸟(CELO)。人腺病毒包括B、C、D或者E组血清型,如2(“Ad2”)、4(“Ad4”)、5(“Ad5”)、6(“Ad6”)、24(“Ad24”)、26(“Ad26”)、34(“Ad34”)和35(“Ad35”)型。腺病毒载体可以含有来自一种腺病毒或者来自两种或多种不同的腺病毒的区域。
在不同的实施方案中,腺病毒载体是基于Ad5、Ad6、ChAd3、ChAd63或其组合。Ad5由Chroboczek,et al.J.Virology 186:280-285,1992描述。基于Ad5和Ad6的载体在Emini et al.国际公布号WO 03/031588中描述。ChAd3的全长核酸序列在图6A-6H中提供。ChAd63的全长核酸序列在图7A-7H中提供。
在本发明的一个实施方案中,腺病毒载体含有一种或多种表面暴露的黑猩猩ChAd3或ChAd63结构蛋白。表面暴露的蛋白包括尾丝、六邻体和五邻体。包括此类蛋白质的腺病毒载体与人腺病毒蛋白质相反,当患者以前接触人腺病毒时,较少可能受到免疫应答的影响。
在不同的实施方案中,重组腺病毒载体基因组编码如下至少一种:
a)尾丝区,其具有与SEQ ID NO:3或9基本上相似的氨基酸序列;
b)六邻体区,其具有与SEQ ID NO:5或11基本上相似的氨基酸序列;
c)五邻体区,其具有与SEQ ID NO:7基本上相似的氨基酸序列。
在额外不同的实施方案中,序列相似性为至少80%、至少85%、至少90%、至少95%;或者序列相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸改变。
V.A.1第一代腺病毒载体
第一代腺病毒载体含有重组腺病毒基因组,其具有E1缺失、任选的E3缺失、任选的E4缺失和表达盒。缺失的程度和组合足够大以使得病毒不能复制和容纳编码目的产物的基因表达盒。通过E1缺失使得病毒不能复制。
从Ad5的约碱基对342开始直到约碱基对3523,或者其他腺病毒的对应区域,可以得到E1缺失。优选地,缺失的区域涉及除去从Ad5的约碱基对450到约碱基对3511,或者其他腺病毒的对应区域。从约碱基对341开始的较大的E1区域缺失除去了促进病毒包装的元件。
从Ad5的约碱基对27865到约碱基对30995,或者其他腺病毒的对应区域,可以得到E3缺失。优选地,缺失的区域涉及除去从Ad5的约碱基对28134到约碱基对30817,或者其他腺病毒的对应区域。
从ChAd3的约碱基对34634开始到约碱基对37349或者其他腺病毒的对应区域,可以得到E4缺失。E4缺失将应该保留天然的E4orf6,或者可以插入来自不同腺病毒的E4orf6。Bett et al.国际公布号WO2004/018627阐明了异源E4orf6的用途。
E1、E3和E4缺失的组合应该足够大以便含有基因表达盒的重组基因组的总的大小不超过野生型腺病毒基因组的约105%。例如,随着重组腺病毒Ad5基因组的大小增加到高于约105%,基因组变得不稳定。(Bett et al.Journal of Virology 67:5911-5921,1993.)
优选地,含有基因表达盒的重组腺病毒基因组的大小为野生型腺病毒基因组大小的约85%到约105%。在不同的实施方案中,含有表达盒的重组腺病毒基因组的大小为野生型基因组大小的约100%到约105.2%,和约100%。
可以在具有E1和E3缺失的Ad5或Ad6基因组中插入约7,500kb。没有任何缺失的Ad5基因组为35,935个碱基对,Ad6基因组为35,759个碱基对。
ChAd3和ChAd63载体与Ad5相比具有更大的基因组大小和存在可以缺失的更大的E3区域,所以插入核酸的能力更大。ChAd3基因组为37,741个碱基对,ChAd63基因组为36,643个碱基对。
在携带E1、E3缺失和Ad5E4orf6对E4的替代的ChAd3和ChAd63腺病毒载体中可以插入约高达10,800bp。用Ad5E4orf6替代E4既是缺失又是替代,因为替代的Ad5E4orf6小于所缺失的。这些载体的10,800bp的插入片段达到了野生型基因组大小的105%的极限。
通过提供反式E1基因产物可以进行第一代腺病毒载体的复制。可以反式提供E1产物,例如,通过使用用腺病毒E1区转化的细胞系。用腺病毒E1区转化的细胞和细胞系的实例是HEK 293细胞、911细胞、PERC.6TM细胞和转染的原代人aminocytes细胞。(Graham et al.Journalof Virology 36:59-72,1977,Schiedner et al.Human Gene Therapy11:2105-2116,2000,Fallaux et al.Human Gene Therapy 9:1909-1917,1998,Bout et al.美国专利号6,033,908.)
用Ad5E4orf6顺式替代黑猩猩腺病毒天然E4区将促进在Ad5补充细胞系中增殖的不同血清型的黑猩猩腺病毒载体的生长和/或增加产量。293和PER.C6细胞中的Ad5E1序列不完全补充属于C组样黑猩猩腺病毒的人腺病毒外的血清型的复制。
应该将表达盒插入到重组腺病毒基因组中对应于缺失的E1区或者缺失的E3区的区域中。表达盒可以具有平行的或反平行的方向。在平行方向,所插入基因的转录方向与缺失的E1或E3基因为相同方向。在反平行方向,相反链作为转录模板并且转录方向为相反的方向。
在本发明的实施方案中,腺病毒载体含有E4缺失和序列的插入,该序列与SEQ ID NO:13的核苷酸34601-35482提供的Ad5E4orf6序列基本上相似。在不同的实施方案中,序列同一性为至少75%、至少80%、至少85%、至少90%、至少95%;或者与SEQ ID NO:13的核苷酸34601-35482相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或1-50个核苷酸。
在本发明的一个实施方案中,腺病毒载体骨架与SEQ ID NO:13的核苷酸1-460和7468-35890,或者与SEQ ID NO:17的核苷酸1-454和7458-34658有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的核苷酸序列同一性;或者与SEQ ID NO:13的核苷酸1-460和7468-35890,或者与SEQ ID NO:17的核苷酸1-454和7458-34658相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或1-50个核苷酸。
在另一实施方案中,含有表达盒的腺病毒载体与SEQ ID NO:13或17具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的核苷酸序列同一性;或者与SEQ ID NO:13或17相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或1-50个核苷酸。
V.A.2第二代腺病毒载体
第二代腺病毒载体含有比第一代载体更少的腺病毒基因组并且可以与补充细胞系和/或提供腺病毒蛋白质的辅助载体结合使用。第二代腺病毒载体一般在不同的参考文献如Russell,Journal of General Virology81:2573-2604,2000;Hitt et al.1997,Human Ad vectors for Gene Transfer,Advances in Pharmacology,Vol.40 Academic Press,Catalucci et al.Journal of Virology 79:6400-6409,2005中描述。第二代腺病毒载体可以基于不同类型的腺病毒,包括人和黑猩猩腺病毒。
V.B.DNA质粒载体
DNA疫苗质粒载体含有基因表达盒以及促进复制和优选促进载体选择的元件。优选的元件提供了在非哺乳动物细胞中的复制和选择标记。治疗载体应该不含有提供在人细胞中复制或者整合到人核酸中的元件。
选择标记促进含有该标记的核酸的选择。优选的选择标记是赋予抗生素抗性的那些选择标记。抗生素选择基因的实例包括编码对氨苄青霉素、新霉素和卡那霉素抗性的核酸。
合适的DNA疫苗载体可以用含有细菌复制起点和选择标记的质粒开始。提供较高产率的细菌复制起点的实例包括ColE1质粒来源的细菌复制起点。(Donnelly et al.Annu.Rev.Immunol.15:617-648,1997)
细菌复制起点和选择标记的存在允许在细菌菌株如大肠杆菌(E.coli)中产生DNA载体。选择标记用于消除不含有该DNA载体的细菌。
SEQ ID NO:2提供了含有编码HCV多肽的表达盒的质粒载体的实例。在本发明的一个实施方案中,质粒载体与SEQ ID NO:2有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的核苷酸序列相似性;或者与SEQ ID NO:2相差0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或1-50个核苷酸。
VI.载体产生
使用重组核酸技术,如涉及使用限制酶、核酸连接和同源重组的技术,可以产生载体。重组核酸技术是本领域公知的。(Ausubel,CurrentProtocols in Molecular Biology,John Wiley,1987-1998,和Sambrook etal.Molecular Clonmg,ALaboratory Manual,第二版,Cold Spring HarborLaboratory Press,1989.)
中间载体用于得到治疗载体或者将表达盒或者其部分从一个载体转移到另一个载体。中间载体的实例包括腺病毒基因组质粒和穿梭载体。
在中间载体中有用的元件包括复制起点、选择标记、同源重组区,和方便的限制酶位点。方便的限制酶位点可以用于促进核酸序列的克隆或释放。
同源重组区提供了与另一核酸分子中的靶区域同源的核酸序列区。同源区在插入靶区域的核酸序列的侧翼。在不同实施方案中,同源区长为约150到600个核苷酸,或者长为约100到500个核苷酸。
本发明的一个实施方案描述了穿梭载体,其含有HCV多肽表达盒、选择标记、细菌复制起点、第一个腺病毒同源区和第二个腺病毒同源区,这些同源区靶定表达盒以插入或者替代E1区。第一个和第二个同源区在表达盒侧翼。第一个同源区含有与野生型腺病毒区的至少右端(3’端)的约碱基对4-450基本上同源的至少约100个碱基对。第二个同源区含有与Ad5的至少左端(5’端)的约碱基对3511-5792或者另一种腺病毒的对应区域基本上同源的至少约100个碱基对。
“基本上同源的”表示具有足够程度的同源性以与靶区域特异重组。在不同实施方案中,基本上同源的指至少85%、至少95%,或者100%序列同一性。
一种产生腺病毒载体的方法是通过产生含有表达盒的前腺病毒基因组质粒。前腺病毒质粒含有在所希望的补充细胞系中复制所需的所有腺病毒序列。然后用限制酶消化前腺病毒质粒以释放病毒的ITR’s并转染到补充细胞系用于病毒拯救。ITR’s必须从质粒序列释放以允许发生复制。腺病毒载体拯救导致产生含有所述表达盒的腺病毒载体。(见,例如,Emini et al.国际公布号WO 03/031588.)
VI.A.腺病毒基因组质粒
腺病毒基因组质粒含有较长长度质粒(其可以是粘粒)内的腺病毒载体序列。较长长度质粒可以含有额外的元件,如促进在真核或者细菌细胞中生长和选择的那些元件,这取决于用于产生和保持质粒的方法。腺病毒基因组质粒优选具有插入E1或者E3缺失区的基因表达盒。
产生腺病毒基因组质粒的技术包括涉及使用穿梭载体和同源重组的那些技术,和涉及向腺病毒粘粒中插入基因表达盒的那些技术。(Hittet al.Methods in Molecular Genetics 7:13-30,1995,Danthinne et al.GeneTherapy 7:1707-1714,2000.)
本发明的一个实施方案描述了制备腺病毒的方法,其涉及用于产生腺病毒基因组质粒的同源重组步骤和腺病毒拯救步骤。同源重组步骤涉及使用含有侧翼为同源区的HCV多肽表达盒的穿梭载体。腺病毒同源重组区将表达盒靶定E1或者E3缺失的区域。
VI.B.腺病毒载体拯救
使用本领域中公知或者本文描述的技术,可以从重组的腺病毒基因组质粒拯救腺病毒载体。本领域中公知的用于腺病毒拯救的技术实例由Hitt et al.Methods in Molecular Genetics 7:13-30,1995,和Danthinne etal.Gene Therapy 7:1707-1714,2000提供。
拯救腺病毒载体的方法的实例涉及加强腺病毒复制。例如,通过在单独的质粒上提供腺病毒功能如E2蛋白(聚合酶,末端前蛋白和DNA结合蛋白)以及E4orf6,可以进行加强腺病毒复制。(Emini et al.国际公布号WO 03/031588.)
VII.HCV组合治疗
HCV核酸疫苗可以单独使用以治疗患者,可以与其他HCV治疗剂结合使用,并且可以与靶定其他类型疾病的治疗剂一起使用。额外的治疗剂包括治疗HCV和在HCV感染的人中具有高流行率的疾病的治疗剂。靶定其他类型疾病的治疗剂包括针对HIV和HBV的疫苗。
用于治疗HCV的额外的治疗剂包括疫苗和非疫苗治疗剂。(Zein,Expert Opin.Investig.Drugs10:1457-1469,2001.)额外的HCV疫苗的实例包括设计用来引起针对HCV核心、E1、E2或p7区的免疫应答的疫苗。疫苗组分的实例包括天然存在的HCV多肽、HCV模拟表位多肽或者编码此类多肽的核酸。
描述产生一般的模拟表位和描述不同的HCV模拟表位的参考文献在Felici et al.美国专利号5,994,083和Nicosia et al.国际申请号WO99/60132中提供。HCV模拟表位可以与天然存在的HCV抗原融合。
当前批准的抗HCV剂是α干扰素和α干扰素与病毒唑组合。不同形式的α干扰素,如重组干扰素和聚乙二醇化的干扰素可以用于治疗HCV感染。(De Francesco et al.Antiviral Research58:1-16,2003,Walkeret al.Antiviral Chemistry & Chemotherapy 14:1-21,2003.)
多种不同的抗HCV剂处于不同阶段的临床开发中。正被开发的不同的抗HCV剂包括针对不同的HCV靶标的治疗剂。不同的HCV靶标的实例包括HCV聚合酶和HCV NS3-NS4A蛋白酶。(De Francesco et al.Antiviral Research 58:1-16,2003,Walker et al.Antiviral Chemistry &Chemotherapy 14:1-21,2003.)
VIII.药物施用
使用本文提供的教导以及本领域公知的技术,可以配制并对患者施用HCV疫苗。关于药物施用的一般教导在例如Modern Vaccinology,Ed.Kurstak,Plenum Med.Co.1994;Remington′s Pharmaceutical Sciences 18thEdition,Ed.Gennaro,Mack Publishing,1990;和Modern Pharmaceutics2nd Edition,Eds.Banker and Rhodes,Marcel Dekker,Inc.1990中提供,将它们都引入本文作为参考。
可以通过不同的途径施用HCV疫苗,如通过静脉内、腹膜内、皮下、肌内、皮内、通过皮肤压迹,或者经鼻。优选的途径是肌内。
用不同的技术,如通过用或不用一次或多次电脉冲注射,可以进行肌内施用。电介导的转移可以通过刺激体液和细胞免疫应答帮助遗传免疫。
使用不同的技术,如用针头或者无针头的注射系统,可以进行疫苗注射。无针头注射系统的实例是喷射注射装置。(Donnelly et al.国际公布号WO 99/52463.)
通过核酸注射后递送合适的电脉冲,可以进行电介导的转移或者基因电转移(GET)。(见Mathiesen,国际公布号WO 98/43702and Eminiet al.国际公布号WO 03/031588.)
VIII.A.药物载体
可药用载体方便疫苗的保存和向受试者的施用。可药用载体的实例在本文描述。额外的可药用载体是本领域公知的。
可药用载体可以含有不同的组分,如缓冲剂、生理盐水或者磷酸缓冲盐水、蔗糖、盐或者聚山梨酸酯。可药用载体的实例是:2.5-10mM TRIS缓冲剂;25-100mM NaCl;2.5-10%蔗糖;0.01-2mM MgCl2;和0.001%-0.01%吐温80(植物来源的)。载体的特定实例含有5mM TRIS,75mM NaCl,5%蔗糖,1mM MgCl2,0.005%吐温80,pH 8.0。
VIII.B.给药方案
考虑具体疫苗和诸如患者的年龄、体重、性别和医学状况;施用途径;所希望的效果和给药次数的因素,可以确定合适的给药方案。特定疫苗的功效取决于不同因素,如特定疫苗产生多肽的能力,所述多肽在细胞中被表达和加工并且在MHC I和I类复合体背景下被呈递。
施用于患者的HCV多肽编码核酸可以是不同类型的载体如腺病毒载体和DNA质粒疫苗的部分。在涉及施用DNA质粒的不同实施方案中,对患者施用约0.1到10mg质粒,和对患者施用约1到5mg质粒。在涉及施用病毒载体、优选腺病毒载体的不同实施方案中,对患者施用约105到1011个病毒颗粒,和对患者施用约107到1010个病毒颗粒。
病毒载体疫苗和DNA质粒疫苗可以单独施用,或者可以是激发和加强施用方案的部分。混合方式的激发和加强接种涉及用DNA疫苗激发和用病毒载体疫苗加强,或者用病毒载体疫苗激发并用DNA载体加强。
可以使用多次激发,例如约2-4次或更多次。激发和加强之间的时间长度可以通常从约4个月到1年变动,但是可以使用其他时间范围。在人具有现有的抗腺病毒免疫应答的情况下,优选使用用DNA疫苗激发的方案。
在本发明的一个实施方案中,用DNA疫苗进行直接初次接种到肌肉组织中。初次接种后,用腺病毒载体或者DNA疫苗进行加强。
物质如白介素-12、GM-CSF、B7-1、B7-2、IP 10和Mig-1可以共同施用以加强免疫应答。所述物质可以作为蛋白质或者通过使用核酸载体共同施用。
VIII.C.异源激发-加强
异源激发-加强是混合的方式,其涉及使用一种类型的病毒载体进行激发和另一种类型的病毒载体用于加强。异源激发-加强可以涉及相关的载体,如基于不同腺病毒血清型的载体和关系更远的病毒,如来自不同动物和痘病毒的腺病毒。使用痘病毒和腺病毒载体保护小鼠免受疟疾由Gilbert et al.Vaccine 20:1039-1045,2002说明。表达HCV多肽的黑猩猩腺病毒载体提供了可以用于异源激发加强的载体。
激发和加强之间的时间长度通常从约四个月到一年变动,但是可以使用其他时间过程。最小的时间过程应该足够允许免疫静止。在一个实施方案中,该静止为至少6个月。激发可以涉及用一种类型的载体多次激发,如2-4次激发。
痘病毒载体中存在的表达盒应该含有目的痘病毒或者另一痘病毒成员天然的或者衍生的启动子。用于构建和使用不同类型的基于痘病毒的载体是本领域中公知的,所述载体包括基于痘苗病毒、经修饰的痘苗病毒、鸟痘病毒、浣熊痘病毒、修饰的痘苗病毒Ankara、金丝雀痘病毒(如ALVAC)、禽痘病毒、牛痘病毒和NYVAC的载体。(Moss,CurrentTopics in Microbiology and Immunology 158:25-38,1982;Earl et al.InCurrent Protocols in Molecular Biology,Ausubel et al.eds.New York:Greene Publishing Associates & Wiley Interscience;1991:16.16.1-16.16.7;Child et al.Virology 174(2):625-9,1990;Tartaglia et al.Virology188:217-232,1992;U.S.Patent Nos.4,603,112,4,722,848,4,769,330,5,110,587,5,174,993,5,185,146,5,266,313,5,505,941,5,863,542,和5,942,235.)
VIII.D.佐剂
可以用佐剂配制HCV疫苗。佐剂是帮助免疫原产生免疫应答的物质。佐剂可以通过不同的机理发挥功能,如增加生物或者免疫半寿期、提供免疫调节剂,或者诱导产生免疫调节细胞因子。不同的佐剂可以组合使用。
可以用佐剂配制HCV疫苗。佐剂的实例是明矾、AlPO4、铝胶(alhydrogel)、脂类-A和其衍生物或者变体。弗氏不完全佐剂、中性脂质体、含有疫苗和细胞因子的脂质体、非离子嵌段共聚物、趋化因子和免疫调节剂。
含有聚氧乙烯(POE)和聚氧丙烯(POP)的非离子嵌段聚合物,如POE-POP-POE嵌段共聚物可以用作佐剂。(Newman et al.CriticalReviews in Therapeutic Drug Carrier Systems 15:89-142,1998.)使用非离子嵌段共聚物组合阴离子表面活性剂,可以增强核酸的免疫应答。
不同类型的化合物可以用作免疫调节剂,如细胞因子、激素、脂类衍生物和小分子。免疫调节剂的实例包括抗-CTLA-4、抗-CD137、抗-CD40、抗-CD28、抗-CD4、抗CD25、抗PD1、抗-PD-L1、抗-PD-L2、FOXP3-阻断剂、Flt-3配体、咪喹莫特、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、沙格司亭、Toll样受体(TLR)-7激动剂,和TLR-9激动剂。
佐剂制剂的特定实例是含有CRL-1005(CytRx ResearchLaboratories)、DNA和苯扎氯铵(BAK)的佐剂制剂。可以如Emini et al.国际公布号WO 03/031588中所述制备CRL-1005制剂。
VIII.E.疫苗保存
使用不同类型的缓冲剂可以保存疫苗。例如,可以使用如Emini etal.国际公布号WO 03/031588中描述的缓冲剂A105。
通过除去或者螯合微量金属离子可以增强DNA的保存。诸如琥珀酸或者苹果酸的试剂和螯合剂可以用于增强DNA疫苗稳定性。非还原性自由基清除剂,如乙醇或者甘油的引入也可以用于防止DNA质粒受到自由基产生的破坏。此外,可以控制制剂中的缓冲剂类型、pH、盐浓度、曝光量、以及用于准备小瓶的消毒过程的类型,以优化DNA疫苗的稳定性。
IX.实施例
在下文提供实施例用于进一步阐明本发明的不同特征。这些实施例还阐明用于实施本发明的方法。这些实施例不限制要求保护的发明。
实施例1:ChAd63和ChAd3基因组序列的注解
用ChAd63和ChAd3对用“人腺病毒C”组(HAdV-C;分类学编号:129951)的所有蛋白质序列建立的本地数据库进行blast程序。通过检索特定的分类学编号,从NCBI服务器下载蛋白质序列。使用blastx程序进行blast检索。在比对中显示的序列数目设置为1000并且关闭滤器。然后用MSPcrunch分析Blast结果,MSPcrunch是用于大规模序列相似性分析的BLAST增强工具。
通过查看ATG和STOP密码子的位置和必要时查看剪接位点的位置,手工验证两个基因组序列上的每个所得CDS注解。用blastp将所有产物对以前建立的腺病毒蛋白质数据库检索以验证通过同源性对此类产物的预测。根据MSPcrunch结果和手工修正用VNTI注解ChAd63和ChAd3的普通的基因组序列。在表1和2中提供了ChAd3和ChAd63的基因产物。
表1ChAd3基因产物
  CDS   产物   CDS边界(NCBI形式)   链
  CDS1   E1A 25.5K   589..991,1243..1544   正向的
  CDS2   E1A 30.8K   589..1129,1243..1544   正向的
  CDS3   E1B 22K   1716..2279   正向的
  CDS4   E1B 57K   2021..3544   正向的
  CDS5   IX   3640..4104   正向的
  CDS6   IVa2   4163..5499,5778..5790   互补的
  CDS7   Pol   5269..8865,14228..14236   互补的
  CDS8   pTP   8664..10667,14228..14236   互补的
  CDS9   48K产物   11120..12379   正向的
  CDS10   pIIIa   12403..14181   正向的
  CDS11   III   14273..16054   正向的
  CDS12   pVII   16069..16665   正向的
  CDS13   V   16738..17853   正向的
  CDS14   pX   17878..18123   正向的
  CDS15   pVI   18219..18974   正向的
  CDS16   外显子   19086..21968   正向的
表1ChAd3基因产物
  CDS   产物   CDS边界(NCBI形式)   链
  CDS17   蛋白酶   21998..22627   正向的
  CDS18   DBP   22743..24395   互补的
  CDS19   92K产物   24445..26940   正向的
  CDS20   22K产物   26630..27229   正向的
  CDS21   33K产物   26630..26966,27169..27551   正向的
  CDS22   pVIII   27626..28309   正向的
  CDS23   E312K   28310..28627   正向的
  CDS24   E3CR1-α0   29125..29325   正向的
  CDS25   E3gp18K   29328..29819   正向的
  CDS26   E333K   29848..30738   正向的
  CDS27   E3A11K   31293..31589   正向的
  CDS28   E3RIDα   31601..31873   正向的
  CDS29   E3RIDβ   31876..32274   正向的
  CDS30   E315K   32267..32653   正向的
  CDS31   U外显子   32684..32848   互补的
  CDS32   尾丝   32859..34490   正向的
  CDS33   E4ORF6/7   34698..34973,35685..35858   互补的
  CDS34   E4ORF6   34974..35858   互补的
  CDS35   E4ORF4   35758..36123   互补的
  CDS36   E4ORF3   36139..36486   互补的
  CDS37   E4ORF2   36483..36875   互补的
  CDS38   E4ORF1   36928..37314   互补的
表2ChAd63基因产物
  CDS   产物   CDS边界(GenBank形式)   链
  CDS1   E1A 24.6K   576..1050,1229..1437   正向的
  CDS2   E1A 28.3K   576..1143,1229..1437   正向的
  CDS3   E1B 22.6K   1601..2179   正向的
  CDS4   E1B 9.9K   1906..2186,3322..3340   正向的
  CDS5   E1B 18.4K   1906..2216,3204..3420   正向的
  CDS6   E1B 55.7K   1906..3420   正向的
  CDS7   IX   3505..3933   正向的
  CDS8   IVa2   3993..5326,5605..5617   互补的
  CDS9   Pol   5096..8455   互补的
  CDS10   21.1K产物   7877..8461   正向的
  CDS11   pTP 72.5K   8458..10347   互补的
  CDS12   44.3K产物   10845..12020   正向的
  CDS13   65.5K产物   12044..13810   正向的
  CDS14   pIII   13889..15511   正向的
  CDS15   pVII   15515..16099   正向的
  CDS16   pV   16144..17181   正向的
  CDS17   8.5K产物   17204..17437   正向的
  CDS 18   pVI   17509..18237   正向的
  CDS19   外显子   18329..21154   正向的
  CDS20   23.6K产物   21179..21802   正向的
  CDS21   E2A   21882..23417   互补的
  CDS22   88.5K产物   23443..25842   正向的
  CDS23   24.9K产物   25556..25886,2605626399   正向的
  CDS24   pVIII   26471..27154   正向的
  CDS25   E312.1K   27155..27475   正向的
  CDS26   E323K   27429..27503,27692..28055   正向的
  CDS27   E319.6K   28037..28570   正向的
表2ChAd63基因产物
  CDS   产物   CDS边界(GenBank形式)   链
  CDS28   E322.3K   29332..29946   正向的
  CDS29   E332.5K   29961..30857   正向的
  CDS30   E326.7K   28600..29319   正向的
  CDS31   E310.5K   30865..31140   正向的
  CDS32   E316.4K   31146..31577   正向的
  CDS33   E315.2K   31570..31977   正向的
  CDS34   Fiber   32254..33531   正向的
  CDS35   E415.7K   33638..33889,34621..34791   互补的
  CDS36   E434.9K   33886..34791   互补的
  CDS37   E413.9K   34697..35062   互补的
  CDS38   E413.6K   35072..35425   互补的
  CDS39   E414.6K   35422..35811   互补的
  CDS40   E413.8K   35851..36225   互补的
实施例2:ChAd3载体构建
ChAd3ΔE1,E3,E4,E4Ad5orf6载体的构建包括下面的步骤:
I. C亚组穿梭载体的构建
将ChAd3病毒基因组完全测序(SEQ ID NO:14)并将信息用于构建穿梭载体以促进通过整个基因组的同源重组克隆。简言之,用于克隆C亚组黑猩猩腺病毒3的穿梭载体(在本文中称作pChAd3EGFP)如下构建:将含有pIX编码区的ChAd3DNA片段(nt 3542-4105)通过PCR用引物SEQ ID NOs:20和21扩增,用Sgfl-AscI消化,然后克隆到pARSCV32-3中并用SgfI-AscI消化,产生pARS-ChAd3D。将ChAd3右端(nt 37320-37441)通过PCR用引物SEQ ID NOs:22和23扩增,用XbaI和Bam HI消化,然后连接到用XbaI和BamHI限制性酶切的pARS-ChAd3D中,产生pARS-ChAd3RD。将ChAd3病毒DNA左端(nt 1-460)通过PCR用SEQ ID NOs:24和25的引物扩增,用EcoRI和SgfI消化,然后将克隆的pARS-ChAd3RD用EcoRI和SgfI消化,产生pARS-ChAd3RLD。还将病毒DNA盒设计成含有位于两个ITR’s末端的限制酶位点(PmeI),从而该消化将从质粒DNA释放病毒DNA。
II.ΔE1ChAd3载体的构建
通过在大肠杆菌菌株BJ5183中同源重组构建ChAd3载体。用ChAd3纯化的病毒DNA和用BstEII和Bst1107I消化的pChAd3EGFP穿梭载体共转化BJ5183细胞。存在于线性化的pChAd3EGFP和病毒基因组DNA末端中的pIX基因、右ITR DNA序列之间的同源重组允许它插入到质粒载体中,同时缺失E1区,其被EGFP表达盒替代。如Emini etal.国际公布号WO 03/031588中所述,构建基于人巨细胞病毒(HCMV)启动子和牛生长激素多聚腺苷酸化信号(Bgh polyA)的HCV NS区表达盒并将其在大肠杆菌菌株BJ5183中利用HCMV和Bgh多聚A DNA序列之间的同源性,通过同源重组插入到ChAd3ΔE1 EGFP载体中。
III.E3区缺失
为了诱导ChAd3载体骨架中完整E3区的缺失,通过PCR扩增E3基因侧翼的两个DNA区域,得到两种DNA片段。486bp片段跨越nt28159到nt 28644(pVIII基因的3’,E3区上游)和474bpDNA片段,其含有尾丝基因的3’末端(bp 32633到bp 33106,E3区下游)。将EcoRI限制性位点引入第一种DNA片段的3’末端和第二种片段的5’末端。用EcoRI消化两种PCR片段并通过体外连接结合。然后用pVIII正向寡核苷酸和尾丝反向寡核苷酸进一步扩增所得的DNA片段(988bp)。
将含有连接在一起的E3区的3’和5’DNA侧翼区的988bp DNA片段与用HpaI线性化的pChAd3ΔE1/EGFP(在ChAd3野生型中E3区内32384bp处切割)通过共转化BJ5183细胞而进行重组,从而引入E3缺失。最终的重组产物是pChAd3ΔE1,E3/EGFP前腺病毒质粒。
IV.缺失E4区和插入Ad5E4orf6
为了用Ad5E4orf6替代ChAd3E4区,将Ad5E4orf6导入穿梭质粒中,该质粒含有来自ChAd3基因组的右端的最后393bp(bp 37349到bp37741)。随后,将来自尾丝3’末端并且包括E4多聚A的144bp的DNA片段(从ChAd3map的bp 34491到bp 34634)导入下游Ad5E4orf6,产生质粒pARSChAd3Ad5E4orf6-2。
最后,将来自pARSChAd3Ad5E4orf6-2的在边界含有尾丝3’末端/E4多聚A和ChAd3右端的DNA片段通过共转化大肠杆菌菌株BJ5183而通过同源重组导入用PacI限制酶(PacI位点,ChAd3wt的nt 36924)线性化的pChAd3ΔE1,E3/EGFP中,从而产生pChAd3ΔE1,3,4Ad5orf6EGFP。
按照该策略,将整个ChAd3E4编码区缺失并用推定的E4TATA信号下游62bp的克隆的Ad5E4orf6基因替代,该基因处于ChAd3E4启动子控制下。
实施例3:ChAd63载体构建
如下构建类似于ChAd3ΔE1,E3,E4,E4Ad5orf6载体的ChAd63载体。
I.E亚组穿梭载体的构建
将ChAd63病毒基因组完全测序并将信息用于构建穿梭载体以方便通过完整基因组的同源重组来克隆。简言之,如下述构建用于克隆E亚组黑猩猩腺病毒63的穿梭载体(下文中称作pARSChAd63EGFP)。
将ChAd63右端(nt 36216-36643)用SEQ ID NOs:26和27的引物通过PCR扩增,用XbaI和BamHI消化然后连接到用XbaI和BamHI限制性酶切的pARSChAd3-RLD中,产生pARS-ChAd63R。将含有pIX编码区的ChAd63DNA片段(nt 3422-3814)用SEQ ID NOs:28和29的引物通过PCR扩增,用SgfI-AscI消化,然后克隆到用SgfI-AscI消化的pARS-ChAd63R中,产生pARS-ChAd63RD。将ChAd63病毒DNA左端(nt 1-455)用SEQ ID NOs:30和31的引物通过PCR扩增,用EcoRI和EcoRV消化,然后克隆到用EcoRI和EcoRV消化的pARS-ChAd63RD中,从而产生pARS-ChAd63RLD。使用SEQ ID NOs:32和33的引物通过PCR扩增HCMV-EGFP-bgh多聚A盒,用EcoRV消化,然后克隆到用EcoRV消化的pARS-ChAd63RLD中,产生pARS-ChAd63RLD-EGFP。还将病毒DNA盒设计成含有位于两个ITR的末端的限制酶位点(PmeI),使得该消化将从质粒DNA释放病毒DNA。
II.构建ΔE1ChAd63载体
通过在大肠杆菌菌株BJ5183中通过同源重组构建ChAd63载体。用ChAd63纯化的病毒DNA和用AscI消化的pARS-ChAd63RLD-EGFP共转化BJ5183细胞。存在于线性化的pARS-ChAd63RLD-EGFP和病毒基因组DNA末端的pIX基因、右ITR DNA序列之间的同源重组允许它插入在质粒载体中,同时缺失E1区,其被EGFP表达盒替代。
III.E3区缺失和ChAd63NSmut载体构建
为了缺失ChAd63载体骨架中的完整E3区,通过PCR扩增E3基因侧翼的两个DNA区,得到两种DNA片段。567bp片段跨越nt 26665到nt 27207(pVIII基因的3’,E3区上游),563bp DNA片段含有尾丝基因的3’末端(bp 31788到bp 32326,E3区下游)。将PacI限制性位点导入第一种DNA片段的3’末端和第二种片段的5’末端。用PacI消化两种PCR片段并通过体外连接结合。所得的DNA片段(1112bp)用pVIII正向和尾丝反向寡核苷酸进一步扩增。
含有连接在一起的E3区侧翼的3’和5’DNA的1112bp DNA片段与用HpaI线性化的pChAd63ΔE1/EGFP(在ChAd63野生型中E3区内的30168bp处切割)通过共转化BJ5183细胞而进行重组,从而引入E3缺失。最终的重组产物是pChAd63ΔE1,E3/EGFP前腺病毒质粒。
如Emini et al.国际公布号WO 03/031588中所述,构建基于人巨细胞病毒(HCMV)启动子和牛生长激素多聚腺苷酸化信号(Bgh多聚A)的HCV NS表达盒,并通过在大肠杆菌菌株BJ5183中利用HCMV和Bgh多聚A DNA序列之间的同源性,通过同源重组插入到pChAd63ΔE1,E3/EGFP载体中,从而产生ChAd63NSmut。
IV.缺失E4区和插入Ad5 E4orf6
为了用Ad5E4orf6替代ChAd63E4区,将Ad5E4orf6导入pARS-ChAd63RLD-EGFP中来源于ChAd63基因组右端的428bp(bp 36216到bp 36643)的下游。随后,将来自尾丝3’末端并且包括E4多聚A的200bp DNA片段(从ChAd63图的bp 33624到bp 33823)导入下游Ad5E4orf6中,产生质粒pARSChAd63Ad5E4orf6-2。最后,将来自pARSChAd63Ad5E4orf6-2的、在边界含有尾丝3’末端/E4多聚A和ChAd63左端的DNA片段通过共转化大肠杆菌菌株BJ5183,通过同源重组导入用PmeI限制酶消化(从质粒DNA释放病毒DNA)的pChAd63ΔE1,E3/EGFP中,从而产生pChAd63ΔE1,3,4Ad5orf6EGFP。
按照该策略,缺失了整个ChAd63E4编码区并用推定的E4TATA信号下游131bp的克隆的Ad5E4orf6基因替代,该基因处于ChAd63E4启动子控制下。
实施例4:ChAd3NSmut (SEQ ID NO:13)表达
使用Catalucci et al.Journal of Virology 79:6400-6409,2005中描述的技术对ChAd3NSmut测试HCV蛋白质表达。用ChAd3NSmut和MRKAd6NSmut感染HeLa细胞。Emini et al.国际公布号WO 03/031588描述了MRKAd6NSmut。通过抗-NS5A单克隆抗体用免疫印迹分析细胞提取物。如图8中所示,ChAd3NSmut类似于基于人Ad6的载体(MRKAd6NSmut)表达HCV蛋白质。
实施例5:ChAd3NSmut(SEQ ID NO:13)稳定性
使用Catalucci et al.Journal fo Virology 79:6400-6409,2000描述的技术检查ChAd3NSmut的遗传稳定性。对从5个独立的克隆(在第10代)克隆提取的病毒DNA进行限制酶分析。引入Pre ChAd3NSmut质粒作为阳性对照。ChAd3NSmut在PerC.6细胞中的传代是遗传上稳定的。
实施例6:小鼠中ChAd3NSmut(SEQ ID NO:13)和ChAd63NSmut (SEQ ID NO:17)诱导的CMI
用Emini et al.国际公布号WO 03/031588中描述的技术在C57/B6小鼠中测定ChAd3NSmut和ChAd63NSmut诱导细胞介导的免疫的能力。图9提供了ChAd3NSmut(SEQ ID NO:13)、ChAd63NSmut(SEQ IDNO:17)和MRKAd6NSmut在C57/B6小鼠中诱导细胞介导的免疫的能力的比较。图9显示了注射后3周进行的IFN-γELIspot实验(用H2Kb限制的肽,在NS3蛋白酶中作图)(数据以平均值显示;N=5)。通过ChAd3NSmut以108和109的剂量在小鼠中引起了CMI,并且ChAd63NSmut与MRKAd6NSmut相当。
实施例7:猕猴中ChAd3NSmut和ChAd63NSmut诱导的CMI
使用Emini et al.国际公布号WO 03/031588和Cirillo et al.国际公布号WO 2005/071093中描述的技术,通过免疫猕猴,在非人灵长类动物中证实了ChAd3NSmut(SEQ ID NO:13)和ChAd63NSmut(SEQ IDNO:17)诱导CMI的能力。在用异源激发/加强方案免疫的一组三只猴中评估载体,所述方案基于顺序注射三种不同的非交叉反应性载体。这三只动物通过在第0和4周用1010vp/猴的剂量两次注射ChAd3NSmut进行激发,接着在第22周注射MRKAd6NSmut和在第42周注射ChAd63NSmut。通过IFN-γELISPOT测量的免疫应答的时间过程在图11中报告,表示为在任何给定时间点对不同的HCV NS肽库观察到的应答的总和。结果表明通过ChAd3NS注射在所有动物中得到了有效的激发并且通过MRKAd6NSmut和ChAd63NSmut施用可以强烈加强CMI。
实施例8:构建编码嵌合HCV多肽(SEQ ID NO:1)的质粒DNA
通过在BJ5183大肠杆菌菌株中同源重组得到了在本文中称作pV1JnsNSOPTmut 3a-1b的质粒,该质粒编码含有基于HCV 3a的NS3-4A区和基于HCV 1b的NS3-NS4A-NS4B-NS5A-NS5B区的嵌合HCV多肽(图12和13)。
合成产生了质粒,其编码来自HCV 3a的完全密码子优化的NS3-4a,其具有最佳的翻译起始(Kozak)序列和与成熟NS3序列的第一个氨基酸融合的甲硫氨酸起始密码子。NS3-4a编码序列侧翼是两个重组区,用于插入在pV1JnsNSOPTmut接受质粒中(Emini et al.国际公布号WO03/031588),该接受质粒与内含子A序列和NS3(HCV 1b)编码序列的开始处同源。在新的NS3-4a序列的两端引入HindIII限制酶位点用于插入片段从亲本质粒的切除。
通过HpaI独特位点消化使pV1JnsOPTmut质粒线性化。将线性化的pV1JnsOPTmut质粒和HindIII消化的NS3-4a(3a)插入片段共转染在BJ5183细菌菌株中,产生pV1JnsNSOPTmut 3a-1b。图13中显示的所得pV1JnsNSOPTmut 3a-1b的遗传结构通过限制酶和DNA序列分析证实。
实施例9:编码嵌合HCV多肽的质粒DNA在小鼠中诱导CMI
在小鼠中测试编码嵌合HCV多肽的质粒DNA诱导对不同的HCV基因型的细胞介导的免疫的能力。该嵌合多肽(SEQ ID NO:1)含有基于HCV 3a的NS3-4A区和基于HCV 1b的NS3-NS4A-NS4B-NS5A-NS5B区(pV1Jns-NSOPTmut 3a-1b)。
用50μg DNA肌内注射三种不同品系的小鼠(两种近交系:Balb/c,C57B1/6和一种远交系:CD1)接着进行电脉冲。每只动物接受两剂嵌合质粒(pV1Jns-NSOPTmut 3a-1b)或者pV1Jns-NSOPTmut质粒(Emini etal.国际公布号WO 03/031588),其编码基于HCV 1b的NS3-NS4A-NS4B-NS5A-NS5B区。使用Emini et al.国际公布号WO 03/031588中描述的技术测量对来自HCV 1b和3a的病毒蛋白质特异的CMI。图14显示了在CD1小鼠(远交品系)中,反应于来自HCV 1b和3a的NS3蛋白质而分泌IFN-γ的T细胞的数目(表示为每1百万个脾细胞中形成斑点的细胞)。用两种质粒得到了类似的对1bNS3蛋白质的特异T细胞应答,而嵌合构建体诱导了对3a NS3蛋白质的更高的应答(通过斯氏T检验,p=0.04)。使用两种构建体,在两种近交系小鼠(Balb/c和C57Bl/6)中反应于来自HCV 1b和3a的NS3蛋白质而诱导的CMI是相似的。
其他实施方案在下面的权利要求中。尽管已经显示和描述了一些实施方案,但是可以做出多种修改而不背离本发明的精神和范围。
序列表
<110>Istituto di Ricerche di Biologia Molecolare P.Angeletti S.p.A.
<120>丙型肝炎病毒核酸疫苗
<130>ITR0103Y
<150>60/699,514
<151>2005-07-15
<150>60/691,523
<151>2005-06-17
<160>33
<170>FastSEQ for Windows版本4.0
<210>1
<211>2675
<212>PRT
<213>人工序列
<220>
<223>嵌合HCV多肽
<400>1
Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly
 1               5                  10                  15
Thr Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Val Val Ala Gly
            20                  25                  30
Glu Val Gln Val Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Thr Thr
        35                  40                  45
Val Gly Gly Val Met Trp Thr Val Tyr His Gly Ala Gly Ser Arg Thr
    50                  55                  60
Leu Ala Gly Val Lys His Pro Ala Leu Gln Met Tyr Thr Asn Val Asp
65                  70                  75                  80
Gln Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Lys Ser Leu Glu
                85                  90                  95
Pro Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg Asp Ala
            100                 105                 110
Asp Val Ile Pro Ala Arg Arg Arg Gly Asp Ser Thr Ala Ser Leu Leu
        115                 120                 125
Ser Pro Arg Pro Leu Ala Arg Leu Lys Gly Ser Ser Gly Gly Pro Val
    130                 135                 140
Met Cys Pro Ser Gly His Val Ala Gly Ile Phe Arg Ala Ala Val Cys
145                 150                 155                 160
Thr Arg Gly Val Ala Lys Ala Leu Gln Phe Ile Pro Val Glu Thr Leu
                165                 170                 175
Ser Thr Gln Ala Arg Ser Pro Ser Phe Ser Asp Asn Ser Thr Pro Pro
            180                 185                 190
Ala Val Pro Gln Ser Tyr Gln Val Gly Tyr Leu His Ala Pro Thr Gly
        195                 200                 205
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Val Ala Gln Gly Tyr
    210                 215                 220
Asn Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225                 230                 235                 240
Ser Phe Met Ser Arg Ala Tyr Gly Ile Asp Pro Asn Ile Arg Thr Gly
                245                 250                 255
Asn Arg Thr Val Thr Thr Gly Ala Lys Leu Thr Tyr Ser Thr Tyr Gly
            260                 265                 270
Lys Phe Leu Ala Gly Gly Gly Cys Ser Gly Gly Ala Tyr Asp Val Ile
        275                 280                 285
Ile Cys Asp Asp Cys His Ala Gln Asp Ala Thr Ser Ile Leu Gly Ile
    290                 295                 300
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Val Arg Leu Thr Val
305                 310                 315                 320
Leu Ala Thr Ala Thr Pro Pro Gly Ser Ile Thr Val Pro His Ser Asn
                325                 330                 335
Ile Glu Glu Val Ala Leu Gly Ser Glu Gly Glu Ile Pro Phe Tyr Gly
            340                 345                 350
Lys Ala Ile Pro Ile Ala Cys Ile Lys Gly Gly Arg His Leu Ile Phe
        355                 360                 365
Cys His Ser Lys Lys Lys Cys Asp Lys Met Ala Ser Lys Leu Arg Gly
    370                 375                 380
Met Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385                 390                 395                 400
Ile Pro Thr Thr Gly Asp Val Val Val Cys Ala Thr Asp Ala Leu Met
                405                 410                 415
Thr Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Val Ala
            420                 425                 430
Val Glu Gln Tyr Val Asp Phe Ser Leu Asp Pro Thr Phe Ser Ile Glu
        435                 440                 445
Thr Cys Thr Ala Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
    450                 455                 460
Arg Thr Gly Arg Gly Arg Leu Gly Thr Tyr Arg Tyr Val Thr Pro Gly
465                 470                 475                 480
Glu Arg Pro Ser Gly Met Phe Asp Ser Val Val Leu Cys Glu Cys Tyr
                485                 490                 495
Asp Ala Gly Cys Ser Trp Tyr Asp Leu Gln Pro Ala Glu Thr Thr Val
            500                 505                 510
Arg Leu Arg Ala Tyr Leu Ser Thr Pro Gly Leu Pro Val Cys Gln Asp
        515                 520                 525
His Leu Asp Leu Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
    530                 535                 540
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Leu Asn Phe Ser Tyr
545                 550                 555                 560
Leu Thr Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
                565                 570                 575
Pro Ser Trp Asp Glu Thr Trp Lys Cys Leu Val Arg Leu Lys Pro Thr
            580                 585                 590
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Pro Val Gln Asn
        595                 600                 605
Glu Ile Cys Leu Thr His Pro Ile Thr Lys Tyr Val Met Ala Cys Met
    610                 615                 620
Ser Ala Asp Leu Glu Val Thr Thr Ser Thr Trp Val Leu Leu Gly Gly
625                 630                 635                 640
Val Leu Ala Ala Val Ala Ala Tyr Cys Leu Ser Val Gly Cys Val Val
                645                 650                 655
Ile Val Gly His Ile Glu Leu Gly Gly Lys Pro Ala Leu Val Pro Asp
            660                 665                 670
Lys Glu Val Leu Tyr Gln Gln Tyr Asp Glu Met Glu Glu Cys Ser Gln
        675                 680                 685
Ala Arg Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu
    690                 695                 700
Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val
705                 710                 715                 720
Glu Gly Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala
                725                 730                 735
Thr Cys Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser
            740                 745                 750
Lys Thr Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn
        755                 760                 765
Val Asp Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser
    770                 775                 780
Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
785                 790                 795                 800
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser
                805                 810                 815
Leu Leu Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly
            820                 825                 830
Pro Leu Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala
        835                 840                 845
Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu
    850                 855                 860
Ser Met Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser
865                 870                 875                 880
Pro Pro Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro
                885                 890                 895
Thr Gly Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln
            900                 905                 910
Gly Tyr Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly
        915                 920                 925
Phe Gly Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg
    930                 935                 940
Thr Gly Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr
945                 950                 955                 960
Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp
                965                 970                 975
Ile Ile Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu
            980                 985                 990
Gly Ile Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu
        995                 1000                1005
Val Val Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His
    1010                1015                1020
Pro Asn Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe
1025                1030                1035                1040
Tyr Gly Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu
                1045                1050                1055
Ile Phe Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu
            1060                1065                1070
Ser Gly Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val
        1075                1080                1085
Ser Val Ile Pro Thr Ile Gly Asp Val Va1 Val Val Ala Thr Asp Ala
    1090                1095                1100
Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn
1105                1110                1115                1120
Thr Cys Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr
                1125                1130                1135
Ile Glu Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg
            1140                1145                1150
Arg Gly Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr
        1155                1160                1165
Pro Gly Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu
    1170                1175                1180
Cys Tyr Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr
1185                1190                1195                1200
Ser Val Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys
                1205                1210                1215
Gln Asp His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His
            1220                1225                1230
Ile Asp Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe
        1235                1240                1245
Pro Tyr Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala
    1250                1255                1260
Pro Pro Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys
1265                1270                1275                1280
Pro Thr Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val
                1285                1290                1295
Gln Asn Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala
            1300                1305                1310
Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val
        1315                1320                1325
Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser
    1330                1335                1340
Val Val Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val
1345                1350                1355                1360
Pro Asp Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys
                1365                1370                1375
Ala Ser His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln
            1380                1385                1390
Phe Lys Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala
        1395                1400                1405
Glu Ala Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr
    1410                1415                1420
Phe Trp Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu
1425                1430                1435                1440
Ala Gly Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met
                1445                1450                1455
Ala Phe Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu
            1460                1465                1470
Leu Phe Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro
        1475                1480                1485
Ser Ala Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val
    1490                1495                1500
Gly Ser Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr
1505                1510                1515                1520
Gly Ala Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly
                1525                1530                1535
Glu Met Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu
            1540                1545                1550
Ser Pro Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg
        1555                1560                1565
Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu
    1570                1575                1580
Ile Ala Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val
1585                1590                1595                1600
Pro Glu Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu
                1605                1610                1615
Thr Ile Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp
            1620                1625                1630
Cys Ser Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp
        1635                1640                1645
Ile Cys Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu
    1650                1655                1660
Leu Pro Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr
1665                1670                1675                1680
Lys Gly Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys
                1685                1690                1695
Gly Ala Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val
            1700                1705                1710
Gly Pro Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn
        1715                1720                1725
Ala Tyr Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser
    1730                1735                1740
Arg Ala Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg
1745                1750                1755                1760
Val Gly Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys
                1765                1770                1775
Cys Pro Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly
            1780                1785                1790
Val Arg Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu
        1795                1800                1805
Glu Val Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln
    1810                1815                1820
Leu Pro Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu
1825                1830                1835                1840
Thr Asp Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala
                1845                1850                1855
Arg Gly Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser
            1860                1865                1870
Ala Pro Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp
        1875                1880                1885
Ala Asp Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly
    1890                1895                1900
Asn Ile Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser
1905                1910                1915                1920
Phe Asp Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro
                1925                1930                1935
Ala Glu Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile
            1940                1945                1950
Trp Ala Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp
        1955                1960                1965
Pro Asp Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile
    1970                1975                1980
Lys Ala Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu
1985                1990                1995                2000
Thr Glu Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr
                2005                2010                2015
Phe Gly Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala
            2020                2025                2030
Leu Pro Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu
        2035                2040                2045
Ser Tyr Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp
    2050                2055                2060
Leu Ser Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp
2065                2070                2075                2080
Val Val Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr
                2085                2090                2095
Pro Cys Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn
            2100                2105                2110
Ser Leu Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser
        2115                2120                2125
Ala Gly Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu
    2130                2135                2140
Asp Asp His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser
2145                2150                2155                2160
Thr Val Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr
                2165                2170                2175
Pro Pro His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val
            2180                2185                2190
Arg Asn Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys
        2195                2200                2205
Asp Leu Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala
    2210                2215                2220
Lys Asn Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro
2225                2230                2235                2240
Ala Arg Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys
                2245                2250                2255
Met Ala Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly
            2260                2265                2270
Ser Ser Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu
        2275                2280                2285
Val Asn Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp
    2290                2295                2300
Thr Arg Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu
2305                2310                2315                2320
Glu Ser Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala
                2325                2330                2335
Ile Lys Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn
            2340                2345                2350
Ser Lys Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val
        2355                2360                2365
Leu Thr Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser
    2370                2375                2380
Ala Ala Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn
2385                2390                2395                2400
Ala Ala Gly Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp
                2405                2410                2415
Ala Ala Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala
            2420                2425                2430
Pro Pro Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr
        2435                2440                2445
Ser Cys Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg
    2450                2455                2460
Val Tyr Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala
2465                2470                2475                2480
Trp Glu Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile
                2485                2490                2495
Ile Met Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His
            2500                2505                2510
Phe Phe Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp
        2515                2520                2525
Cys Gln Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro
     2530                2535                2540
Gln Ile Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser
2545                2550                2555                2560
Tyr Ser Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu
                2565                2570                2575
Gly Val Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg
            2580                2585                2590
Ala Arg Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr
        2595                2600                2605
Leu Phe Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro
    2610                2615                2620
Ala Ala Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser
2625                2630                2635                2640
Gly Gly Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe
                2645                2650                2655
Met Leu Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu
            2660                2665                2670
Pro Asn Arg
        2675
<210>2
<211>12939
<212>DNA
<213>人工序列
<220>
<223>含有编码嵌合HCV多肽的表达盒的质粒
<400>2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcagattgg 240
ctattggcca ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg 300
tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac 360
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 420
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 480
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 540
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 600
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 660
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 720
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 780
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 840
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 900
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca 960
tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg gaacgcggat 1020
tccccgtgcc aagagtgacg taagtaccgc ctatagactc tataggcaca cccctttggc 1080
tcttatgcat gctatactgt ttttggcttg gggcctatac acccccgctt ccttatgcta 1140
taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc 1200
tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactatctc 1260
tattggctat atgccaatac tctgtccttc agagactgac acggactctg tatttttaca 1320
ggatggggtc ccatttatta tttacaaatt cacatataca acaacgccgt cccccgtgcc 1380
cgcagttttt attaaacata gcgtgggatc tccacgcgaa tctcgggtac gtgttccgga 1440
catgggctct tctccggtag cggcggagct tccacatccg agccctggtc ccatgcctcc 1500
agcggctcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac 1560
agcacaatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct 1620
gaaaatgagc gtggagattg ggctcgcacg gctgacgcag atggaagact taaggcagcg 1680
gcagaagaag atgcaggcag ctgagttgtt gtattctgat aagagtcaga ggtaactccc 1740
gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg 1800
cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc 1860
tgcagtcacc gtccttagaa ttccgccacc atggccccta tcaccgccta tgcccagcag 1920
acaagaggcc tgctgggcac catcgtgaca agcctgaccg gcagagacaa gaatgtggtg 1980
gccggcgaag tgcaggtgct gagcaccgcc acccagacat ttctgggcac cacagtgggc 2040
ggcgtgatgt ggacagtgta ccacggagcc ggctctagaa cactggccgg cgtgaagcac 2100
cctgccctgc agatgtatac caacgtggat caggatcttg tggggtggcc tgcccctcct 2160
ggcgccaagt ctctggagcc ttgtacctgc ggcagcgccg atctgtacct ggtgaccagg 2220
gacgccgatg tgatccccgc cagaagaaga ggcgatagca ccgccagcct gctgtctccg 2280
cggccgctgg ccagactgaa gggaagcagc ggcggacctg tgatgtgtcc tagcggccac 2340
gtggccggca tctttagagc cgccgtgtgt acaagaggcg tggccaaggc cctgcagttt 2400
atccctgtgg agaccctgag cacccaggcc agaagcccta gcttcagcga caacagcacc 2460
cctcctgccg tgcctcagag ctaccaagtg ggctacctgc acgcccctac aggctctggc 2520
aagtccacca aagtgcctgc cgcctatgtg gcccagggct acaatgtgct ggtgctgaac 2580
ccttctgtgg ccgccacact gggctttggc agcttcatga gcagggccta cggcatcgac 2640
cccaatatcc ggaccggcaa cagaaccgtg acaaccggcg ccaagctgac ctacagcacc 2700
tacggcaagt tcctggccgg aggaggatgt agcggcggag cctacgacgt gatcatctgc 2760
gacgattgcc acgcccagga tgccacaagc atcctgggca tcgggaccgt gctggatcag 2820
gccgaaacag ccggagtgag actgacagtg ctggccacag ccacacctcc tggcagcatc 2880
acagtgcccc acagcaatat cgaagaagtg gccctgggca gcgagggcga gatccctttt 2940
tacgggaagg ccatccctat cgcctgtatc aagggcggca ggcacctgat cttctgccac 3000
agcaagaaaa agtgtgacaa gatggccagc aagctgagag gcatgggcct gaatgccgtg 3060
gcctactaca gaggcctgga cgtgtctgtg atccctacca ccggcgatgt ggtggtgtgt 3120
gccaccgatg ccctgatgac cggcttcacc ggcgatttcg acagcgtgat cgattgcaac 3180
gtggccgtgg agcagtacgt ggacttcagc ctggacccta cattcagcat cgagacctgc 3240
acagctcctc aggatgccgt gtcccggtct cagagaagag gcagaaccgg cagaggcaga 3300
ctgggcacct acagatacgt gacccctggc gagagaccta gcggcatgtt tgacagcgtg 3360
gtgctgtgcg agtgttacga tgccggctgc tcctggtacg atctgcagcc tgccgagacc 3420
actgtgaggc tgagagccta cctgtctacc cctggcctgc ctgtgtgtca ggatcacctg 3480
gacctgtggg agagcgtgtt taccggcctg acacacatcg acgcccactt tctgagccag 3540
acaaaacagg ccggcctgaa cttcagctac ctgaccgcct accaggccac agtgtgtgct 3600
agagcccagg cccctcctcc tagctgggat gagacctgga agtgccttgt gagactgaag 3660
ccaaccctgc acggacctac cccactgctg tatagactgg gccccgtgca gaacgagatc 3720
tgcctgaccc accctatcac caagtacgtg atggcctgca tgagcgctga tctggaagtg 3780
accacctcca cttgggtgct gctggggggc gtgctagccg ccgtggccgc ctattgtctg 3840
tctgtgggct gcgtggtgat tgtgggccac atcgagctgg gaggaaagcc tgccctggtg 3900
cccgataagg aagtgctcta ccagcagtac gacgagatgg aggagtgtag ccaggctaga 3960
atggccccca tcaccgccta cagccagcag acccgcggcc tgctgggctg catcatcacc 4020
agcctgaccg gccgcgacaa gaaccaggtg gagggcgagg tgcaggtggt gagcaccgcc 4080
acccagagct tcctggccac ctgcgtgaac ggcgtgtgct ggaccgtgta ccacggcgcc 4140
ggcagcaaga ccctggccgg ccccaagggc cccatcaccc agatgtacac caacgtggac 4200
caggacctgg tgggctggca ggcccccccc ggcgcccgca gcctgacccc ctgcacctgc 4260
ggcagcagcg acctgtacct ggtgacccgc cacgccgacg tgatccccgt gcgccgccgc 4320
ggcgacagcc gcggcagcct gctgagcccc cgccccgtga gctacctgaa gggcagcagc 4380
ggcggccccc tgctgtgccc cagcggccac gccgtgggca tcttccgcgc cgccgtgtgc 4440
acccgcggcg tggccaaggc cgtggacttc gtgcccgtgg agagcatgga gaccaccatg 4500
cgcagccccg tgttcaccga caacagcagc ccccccgccg tgccccagag cttccaggtg 4560
gcccacctgc acgcccccac cggcagcggc aagagcacca aggtgcccgc cgcctacgcc 4620
gcccagggct acaaggtgct ggtgctgaac cccagcgtgg ccgccaccct gggcttcggc 4680
gcctacatga gcaaggccca cggcatcgac cccaacatcc gcaccggcgt gcgcaccatc 4740
accaccggcg cccccgtgac ctacagcacc tacggcaagt tcctggccga cggcggctgc 4800
agcggcggcg cctacgacat catcatctgc gacgagtgcc acagcaccga cagcaccacc 4860
atcctgggca tcggcaccgt gctggaccag gccgagaccg ccggcgcccg cctggtggtg 4920
ctggccaccg ccaccccccc cggcagcgtg accgtgcccc accccaacat cgaggaggtg 4980
gccctgagca acaccggcga gatccccttc tacggcaagg ccatccccat cgaggccatc 5040
cgcggcggcc gccacctgat cttctgccac agcaagaaga agtgcgacga gctggccgcc 5100
aagctgagcg gcctgggcat caacgccgtg gcctactacc gcggcctgga cgtgagcgtg 5160
atccccacca tcggcgacgt ggtggtggtg gccaccgacg ccctgatgac cggctacacc 5220
ggcgacttcg acagcgtgat cgactgcaac acctgcgtga cccagaccgt ggacttcagc 5280
ctggacccca ccttcaccat cgagaccacc accgtgcccc aggacgccgt gagccgcagc 5340
cagcgccgcg gccgcaccgg ccgcggccgc cgcggcatct accgcttcgt gacccccggc 5400
gagcgcccca gcggcatgtt cgacagcagc gtgctgtgcg agtgctacga cgccggctgc 5460
gcctggtacg agctgacccc cgccgagacc agcgtgcgcc tgcgcgccta cctgaacacc 5520
cccggcctgc ccgtgtgcca ggaccacctg gagttctggg agagcgtgtt caccggcctg 5580
acccacatcg acgcccactt cctgagccag accaagcagg ccggcgacaa cttcccctac 5640
ctggtggcct accaggccac cgtgtgcgcc cgcgcccagg cccccccccc cagctgggac 5700
cagatgtgga agtgcctgat ccgcctgaag cccaccctgc acggccccac ccccctgctg 5760
taccgcctgg gcgccgtgca gaacgaggtg accctgaccc accccatcac caagtacatc 5820
atggcctgca tgagcgccga cctggaggtg gtgaccagca cctgggtgct ggtgggcggc 5880
gtgctggccg ccctggccgc ctactgcctg accaccggca gcgtggtgat cgtgggccgc 5940
atcatcctga gcggccgccc cgccatcgtg cccgaccgcg agttcctgta ccaggagttc 6000
gacgagatgg aggagtgcgc cagccacctg ccctacatcg agcagggcat gcagctggcc 6060
gagcagttca agcagaaggc cctgggcctg ctgcagaccg ccaccaagca ggccgaggcc 6120
gccgcccccg tggtggagag caagtggcgc gccctggaga ccttctgggc caagcacatg 6180
tggaacttca tcagcggcat ccagtacctg gccggcctga gcaccctgcc cggcaacccc 6240
gccatcgcca gcctgatggc cttcaccgcc agcatcacca gccccctgac cacccagagc 6300
accctgctgt tcaacatcct gggcggctgg gtggccgccc agctggcccc ccccagcgcc 6360
gccagcgcct tcgtgggcgc cggcatcgcc ggcgccgccg tgggcagcat cggcctgggc 6420
aaggtgctgg tggacatcct ggccggctac ggcgccggcg tggccggcgc cctggtggcc 6480
ttcaaggtga tgagcggcga gatgcccagc accgaggacc tggtgaacct gctgcccgcc 6540
atcctgagcc ccggcgccct ggtggtgggc gtggtgtgcg ccgccatcct gcgccgccac 6600
gtgggccccg gcgagggcgc cgtgcagtgg atgaaccgcc tgatcgcctt cgccagccgc 6660
ggcaaccacg tgagccccac ccactacgtg cccgagagcg acgccgccgc ccgcgtgacc 6720
cagatcctga gcagcctgac catcacccag ctgctgaagc gcctgcacca gtggatcaac 6780
gaggactgca gcaccccctg cagcggcagc tggctgcgcg acgtgtggga ctggatctgc 6840
accgtgctga ccgacttcaa gacctggctg cagagcaagc tgctgcccca gctgcccggc 6900
gtgcccttct tcagctgcca gcgcggctac aagggcgtgt ggcgcggcga cggcatcatg 6960
cagaccacct gcccctgcgg cgcccagatc accggccacg tgaagaacgg cagcatgcgc 7020
atcgtgggcc ccaagacctg cagcaacacc tggcacggca ccttccccat caacgcctac 7080
accaccggcc cctgcacccc cagccccgcc cccaactaca gccgcgccct gtggcgcgtg 7140
gccgccgagg agtacgtgga ggtgacccgc gtgggcgact tccactacgt gaccggcatg 7200
accaccgaca acgtgaagtg cccctgccag gtgcccgccc ccgagttctt caccgaggtg 7260
gacggcgtgc gcctgcaccg ctacgccccc gcctgccgcc ccctgctgcg cgaggaggtg 7320
accttccagg tgggcctgaa ccagtacctg gtgggcagcc agctgccctg cgagcccgag 7380
cccgacgtgg ccgtgctgac cagcatgctg accgacccca gccacatcac cgccgagacc 7440
gccaagcgcc gcctggcccg cggcagcccc cccagcctgg ccagcagcag cgccagccag 7500
ctgagcgccc ccagcctgaa ggccacctgc accacccacc acgtgagccc cgacgccgac 7560
ctgatcgagg ccaacctgct gtggcgccag gagatgggcg gcaacatcac ccgcgtggag 7620
agcgagaaca aggtggtggt gctggacagc ttcgaccccc tgcgcgccga ggaggacgag 7680
cgcgaggtga gcgtgcccgc cgagatcctg cgcaagagca agaagttccc cgccgccatg 7740
cccatctggg cccgccccga ctacaacccc cccctgctgg agagctggaa ggaccccgac 7800
tacgtgcccc ccgtggtgca cggctgcccc ctgcccccca tcaaggcccc ccccatcccc 7860
cccccccgcc gcaagcgcac cgtggtgctg accgagagca gcgtgagcag cgccctggcc 7920
gagctggcca ccaagacctt cggcagcagc gagagcagcg ccgtggacag cggcaccgcc 7980
accgccctgc ccgaccaggc cagcgacgac ggcgacaagg gcagcgacgt ggagagctac 8040
agcagcatgc cccccctgga gggcgagccc ggcgaccccg acctgagcga cggcagctgg 8100
agcaccgtga gcgaggaggc cagcgaggac gtggtgtgct gcagcatgag ctacacctgg 8160
accggcgccc tgatcacccc ctgcgccgcc gaggagagca agctgcccat caacgccctg 8220
agcaacagcc tgctgcgcca ccacaacatg gtgtacgcca ccaccagccg cagcgccggc 8280
ctgcgccaga agaaggtgac cttcgaccgc ctgcaggtgc tggacgacca ctaccgcgac 8340
gtgctgaagg agatgaaggc caaggccagc accgtgaagg ccaagctgct gagcgtggag 8400
gaggcctgca agctgacccc cccccacagc gccaagagca agttcggcta cggcgccaag 8460
gacgtgcgca acctgagcag caaggccgtg aaccacatcc acagcgtgtg gaaggacctg 8520
ctggaggaca ccgtgacccc catcgacacc accatcatgg ccaagaacga ggtgttctgc 8580
gtgcagcccg agaagggcgg ccgcaagccc gcccgcctga tcgtgttccc cgacctgggc 8640
gtgcgcgtgt gcgagaagat ggccctgtac gacgtggtga gcaccctgcc ccaggtggtg 8700
atgggcagca gctacggctt ccagtacagc cccggccagc gcgtggagtt cctggtgaac 8760
acctggaaga gcaagaagaa ccccatgggc ttcagctacg acacccgctg cttcgacagc 8820
accgtgaccg agaacgacat ccgcgtggag gagagcatct accagtgctg cgacctggcc 8880
cccgaggccc gccaggccat caagagcctg accgagcgcc tgtacatcgg cggccccctg 8940
accaacagca agggccagaa ctgcggctac cgccgctgcc gcgccagcgg cgtgctgacc 9000
accagctgcg gcaacaccct gacctgctac ctgaaggcca gcgccgcctg ccgcgccgcc 9060
aagctgcagg actgcaccat gctggtgaac gccgccggcc tggtggtgat ctgcgagagc 9120
gccggcaccc aggaggacgc cgccagcctg cgcgtgttca ccgaggccat gacccgctac 9180
agcgcccccc ccggcgaccc cccccagccc gagtacgacc tggagctgat caccagctgc 9240
agcagcaacg tgagcgtggc ccacgacgcc agcggcaagc gcgtgtacta cctgacccgc 9300
gaccccacca cccccctggc ccgcgccgcc tgggagaccg cccgccacac ccccgtgaac 9360
agctggctgg gcaacatcat catgtacgcc cccaccctgt gggcccgcat gatcctgatg 9420
acccacttct tcagcatcct gctggcccag gagcagctgg agaaggccct ggactgccag 9480
atctacggcg cctgctacag catcgagccc ctggacctgc cccagatcat cgagcgcctg 9540
cacggcctga gcgccttcag cctgcacagc tacagccccg gcgagatcaa ccgcgtggcc 9600
agctgcctgc gcaagctggg cgtgcccccc ctgcgcgtgt ggcgccaccg cgcccgcagc 9660
gtgcgcgccc gcctgctgag ccagggcggc cgcgccgcca cctgcggcaa gtacctgttc 9720
aactgggccg tgaagaccaa gctgaagctg acccccatcc ccgccgccag ccagctggac 9780
ctgagcggct ggttcgtggc cggctacagc ggcggcgaca tctaccacag cctgagccgc 9840
gcccgccccc gctggttcat gctgtgcctg ctgctgctga gcgtgggcgt gggcatctac 9900
ctgctgccca accgctaaat ttaaatgttt aaacgtcgac agcggccgcg atctgctgtg 9960
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 10020
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 10080
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 10140
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgcagcggc caggtgctga 10200
agaattgacc cggttcctcc tgggccagaa agaagcaggc acatcccctt ctctgtgaca 10260
caccctgtcc acgcccctgg ttcttagttc cagccccact cataggacac tcatagctca 10320
ggagggctcc gccttcaat cccacccgcta aagtacttgg agcggtctct ccctccctca 10380
tcagcccacc aaaccaaacc tagcctccaa gagtgggaag aaattaaagc aagataggct 10440
attaagtgca gagggagaga aaatgcctcc aacatgtgag gaagtaatga gagaaatcat 10500
agaatttctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 10560
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 10620
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 10680
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 10740
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 10800
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 10860
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 10920
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 10980
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 11040
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 11100
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 11160
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 11220
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 11280
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 11340
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 11400
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 11460
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 11520
gggggggggg ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc ataccaggcc 11580
tgaatcgccc catcatccag ccagaaagtg agggagccac ggttgatgag agctttgttg 11640
taggtggacc agttggtgat tttgaacttt tgctttgcca cggaacggtc tgcgttgtcg 11700
ggaagatgcg tgatctgatc cttcaactca gcaaaagttc gatttattca acaaagccgc 11760
cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt 11820
agaaaaactc atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac 11880
catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 11940
ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 12000
ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 12060
aatccggtga gaatggcaaa agcttatgca tttctttcca gacttgttca acaggccagc 12120
cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 12180
cctgagcgag acgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgaat 12240
gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 12300
cttctaatac ctggaatgct gttttcccgg ggatcgcagt ggtgagtaac catgcatcat 12360
caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc agccagttta 12420
gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 12480
actctggcgc atcgggcttc ccatacaatc gatagattgt cgcacctgat tgcccgacat 12540
tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 12600
tcgagcaaga cgtttcccgt tgaatatggc tcataacacc ccttgtatta ctgtttatgt 12660
aagcagacag ttttattgtt catgatgata tatttttatc ttgtgcaatg taacatcaga 12720
gattttgaga cacaacgtgg ctttcccccc ccccccatta ttgaagcatt tatcagggtt 12780
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 12840
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 12900
taacctataa aaataggcgt atcacgaggc cctttcgtc                        12939
<210>3
<211>543
<212>PRT
<213>ChAd3
<400>3
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
 1               5                  10                  15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
            20                  25                  30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
        35                  40                  45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
    50                  55                  60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65                  70                  75                  80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
                85                  90                  95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
            100                 105                 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
        115                 120                 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
    130                 135                 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145                 150                 155                 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
                165                 170                 175
Ser Ala Thr Pro Pro Ile Asn Val Ser Ser Gly Ser Leu Gly Leu Asp
            180                 185                 190
Met Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
        195                 200                 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
    210                 215                 220
Thr Gly Asn Gly Leu Thr Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225                 230                 235                 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
                245                 250                 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asn Val
            260                 265                 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
        275                 280                 285
Gly Pro Leu Tyr Ile Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
    290                 295                 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305                 310                 315                 320
Lys Ile Ser Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
                325                 330                 335
Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala Leu Thr Val
            340                 345                 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
        355                 360                 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
    370                 375                 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385                 390                 395                 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ala Ser Val
                405                 410                 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
            420                 425                 430
Ser Leu Asp Arg Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
        435                 440                 445
Ala Ala Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
    450                 455                 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465                 470                 475                 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr Leu Thr Ile Thr
                485                 490                 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
            500                 505                 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
        515                 520                 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
    530                 535                 540
<210>4
<211>1683
<212>DNA
<213>ChAd3
<400>4
atgtcagatt cttgctcctg tccctccgca cccactatct tcatgttgtt gcagatgaag 60
cgcaccaaaa cgtctgacga gagcttcaac cccgtgtacc cctatgacac ggaaagcggc 120
cctccctccg tccctttcct cacccctccc ttcgtgtctc ccgatggatt ccaagaaagc 180
ccccccgggg tcctgtctct gaacctggcc gagcccctgg tcacttccca cggcatgctc 240
gccctgaaaa tgggaagtgg cctctccctg gacgacgctg gcaacctcac ctctcaagat 300
atcaccaccg ctagccctcc cctcaaaaaa accaagacca acctcagcct agaaacctca 360
tcccccctaa ctgtaagcac ctcaggcgcc ctcaccgtag cagccgccgc tcccctggca 420
gtggccggca cctccctcac catgcaatca gaggcccccc tgacagtaca ggatgcaaaa 480
ctcaccctgg ccaccaaagg ccccctgacc gtgtctgaag gcaaactggc cttgcaaaca 540
tcggccccgc tgacggccgc tgacagcagc accctcaccg ttagcgccac accaccaatt 600
aatgtaagca gtggaagttt aggcttagac atggaagacc ctatgtatac tcacgatgga 660
aaactgggaa taagaattgg gggtccacta agagtagtag acagcttgca cacactcact 720
gtagttaccg gaaatggact aactgtagat aacaatgccc tccaaactag agttacgggc 780
gccctaggtt atgacacatc aggaaatcta caattgagag ctgcaggagg tatgcgaatt 840
gatgcaaatg gccaacttat ccttaatgtg gcatacccat ttgatgctca gaacaatctc 900
agccttagac ttggtcaggg acccctgtat ataaacacag accacaacct ggatttgaat 960
tgcaacagag gtctaaccac aactaccacc aacaacacaa aaaaacttga gactaaaatt 1020
agctcaggct tagactatga caccaatggt gctgtcatta ttaaacttgg cactggtcta 1080
agcttcgaca acacaggcgc cctaactgtg ggaaacactg gtgatgataa actgactctg 1140
tggacgaccc cagacccatc tccaaattgc agaattcact cagacaaaga ctgcaagttt 1200
actctagtcc taactaagtg tggaagccaa atcctggcct ctgtcgccgc cctagcggta 1260
tcaggaaatc tggcttcgat aacaggcacc gttgccagcg ttaccatctt tctcagattt 1320
gatcagaatg gagtgcttat ggaaaactcc tcgctagaca ggcagtactg gaacttcaga 1380
aatggcaact caactaacgc tgccccctac accaatgcag ttgggttcat gccaaacctc 1440
gcagcatacc ccaaaacgca aagccagact gctaaaaaca acattgtaag tcaggtttac 1500
ttgaatggag acaaatccaa acccatgacc cttaccatca ccctcaatgg aactaatgaa 1560
tccagtgaaa ctagccaggt gagtcactac tccatgtcat ttacatgggc ttgggaaagt 1620
gggcaatatg ccactgaaac ctttgccacc aactccttca ccttttctta cattgctgaa 1680
caa                                                               1683
<210>5
<211>960
<212>PRT
<213>ChAd3
<400>5
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
 1               5                  10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Glu Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65                  70                  75                  80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Glu Glu Thr Gln Ala Val Glu
    130                 135                 140
Glu Ala Ala Glu Glu Glu Glu Glu Asp Ala Asp Gly Gln Ala Glu Glu
145                 150                 155                 160
Glu Gln Ala Ala Thr Lys Lys Thr His Val Tyr Ala Gln Ala Pro Leu
                165                 170                 175
Ser Gly Glu Lys Ile Ser Lys Asp Gly Leu Gln Ile Gly Thr Asp Ala
            180                 185                 190
Thr Ala Thr Glu Gln Lys Pro Ile Tyr Ala Asp Pro Thr Phe Gln Pro
        195                 200                 205
Glu Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp Ala Thr Val
    210                 215                 220
Ala Gly Gly Arg Val Leu Lys Lys Ser Thr Pro Met Lys Pro Cys Tyr
225                 230                 235                 240
Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln Gly Val Leu
                245                 250                 255
Thr Ala Asn Ala Gln Gly Gln Leu Glu Ser Gln Val Glu Met Gln Phe
260265270
Phe Ser Thr Ser Glu Asn Ala Arg Asn Glu Ala Asn Asn Ile Gln Pro
        275                 280                 285
Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr Pro Asp Thr
    290                 295                 300
His Leu Ser Tyr Lys Pro Ala Lys Ser Asp Asp Asn Ser Lys Ile Met
305                 310                 315                 320
Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg
                325                 330                 335
Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly
            340                 345                 350
Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln
        355                 360                 365
Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Met Gly
    370                 375                 380
Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr
385                 390                 395                 400
Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu Asp Glu Leu
                405                 410                 415
Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Val Thr Asp Thr Tyr
            420                 425                 430
Gln Ala Val Lys Thr Asn Asn Gly Asn Asn Gly Gly Gln Val Thr Trp
        435                 440                 445
Thr Lys Asp Glu Thr Phe Ala Asp Arg Asn Glu Ile Gly Val Gly Asn
    450                 455                 460
Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu Trp Arg Asn Phe
465                 470                 475                 480
Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys Leu Lys Tyr Asn
                485                 490                 495
Pro Ser Asn Val Asp Ile Ser Asp Asn Pro Asn Thr Tyr Asp Tyr Met
            500                 505                 510
Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys Tyr Ile Asn Leu
        515                 520                 525
Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val Asn Pro Phe Asn
    530                 535                 540
His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn
545                 550                 555                 560
Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala
                565                 570                 575
Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn
            580                 585                 590
Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp
        595                 600                 605
Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser Ile Cys Leu Tyr
    610                 615                 620
Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala
625                 630                 635                 640
Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser
                645                 650                 655
Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro
            660                 665                 670
Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ala Phe
        675                 680                 685
Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp
    690                 695                 700
Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe
705                 710                 715                 720
Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr Phe Asp Ser Ser
                725                 730                 735
Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu
            740                 745                 750
Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn
        755                 760                 765
Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile
    770                 775                 780
Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys Asp Arg Met Tyr
785                 790                 795                 800
Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Gln
                805                 810                 815
Thr Lys Tyr Lys Asp Tyr Gln Glu Val Gly Ile Ile His Gln His Asn
            820                 825                 830
Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Glu Gly Gln
        835                 840                 845
Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly Lys Thr Ala Val
    850                 855                 860
Asp Ser Ile Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Leu Trp Arg
865                 870                 875                 880
Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Ser Asp Leu
                885                 890                 895
Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr
            900                 905                 910
Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Val Leu Phe
        915                 920                 925
Glu Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile
    930                 935                 940
Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
945                 950                 955                 960
<210>6
<211>2880
<212>DNA
<213>ChAd3
<400>6
atggcgaccc catcgatgat gccgcagtgg tcgtacatgc acatctcggg ccaggacgcc 60
tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccaccgagag ctacttcagc 120
ctgagtaaca agtttaggaa ccccacggtg gcgcccacgc acgatgtgac caccgaccgg 180
tctcagcgcc tgacgctgcg gttcattccc gtggaccgcg aggacaccgc gtactcgtac 240
aaggcgcggt tcaccctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacctac 300
tttgacatcc gcggggtgct ggaccggggt cccactttca agccctactc tggcaccgcc 360
tacaactccc tggcccccaa gggcgctccc aactcctgcg agtgggagca agaggaaact 420
caggcagttg aagaagcagc agaagaggaa gaagaagatg ctgacggtca agctgaggaa 480
gagcaagcag ctaccaaaaa gactcatgta tatgctcagg ctcccctttc tggcgaaaaa 540
attagtaaag atggtctgca aataggaacg gacgctacag ctacagaaca aaaacctatt 600
tatgcagacc ctacattcca gcccgaaccc caaatcgggg agtcccagtg gaatgaggca 660
gatgctacag tcgccggcgg tagagtgcta aagaaatcta ctcccatgaa accatgctat 720
ggttcctatg caagacccac aaatgctaat ggaggtcagg gtgtactaac ggcaaatgcc 780
cagggacagc tagaatctca ggttgaaatg caattctttt caacttctga aaacgcccgt 840
aacgaggcta acaacattca gcccaaattg gtgctgtata gtgaggatgt gcacatggag 900
accccggata cgcacctttc ttacaagccc gcaaaaagcg atgacaattc aaaaatcatg 960
ctgggtcagc agtccatgcc caacagacct aattacatcg gcttcagaga caactttatc 1020
ggcctcatgt attacaatag cactggcaac atgggagtgc ttgcaggtca ggcctctcag 1080
ttgaatgcag tggtggactt gcaagacaga aacacagaac tgtcctacca gctcttgctt 1140
gattccatgg gtgacagaac cagatacttt tccatgtgga atcaggcagt ggacagttat 1200
gacccagatg ttagaattat tgaaaatcat ggaactgaag acgagctccc caactattgt 1260
ttccctctgg gtggcatagg ggtaactgac acttaccagg ctgttaaaac caacaatggc 1320
aataacgggg gccaggtgac ttggacaaaa gatgaaactt ttgcagatcg caatgaaata 1380
ggggtgggaa acaatttcgc tatggagatc aacctcagtg ccaacctgtg gagaaacttc 1440
ctgtactcca acgtggcgct gtacctacca gacaagctta agtacaaccc ctccaatgtg 1500
gacatctctg acaaccccaa cacctacgat tacatgaaca agcgagtggt ggccccgggg 1560
ctggtggact gctacatcaa cctgggcgcg cgctggtcgc tggactacat ggacaacgtc 1620
aaccccttca accaccaccg caatgcgggc ctgcgctacc gctccatgct cctgggcaac 1680
gggcgctacg tgcccttcca catccaggtg ccccagaagt tctttgccat caagaacctc 1740
ctcctcctgc cgggctccta cacctacgag tggaacttca ggaaggatgt caacatggtc 1800
ctccagagct ctctgggtaa cgatctcagg gtggacgggg ccagcatcaa gttcgagagc 1860
atctgcctct acgccacctt cttccccatg gcccacaaca cggcctccac gctcgaggcc 1920
atgctcagga acgacaccaa cgaccagtcc ttcaatgact acctttccgc cgccaacatg 1980
ctctacccca tacccgccaa cgccaccaac gtccccatct ccatcccctc gcgcaactgg 2040
gcggccttcc gcggctgggc cttcacccgc ctcaagacca aggagacccc ctccctgggc 2100
tcgggattcg acccctacta cacctactcg ggctctattc cctacctgga cggcaccttc 2160
tacctcaacc acactttcaa gaaggtctcg gtcaccttcg actcctcggt cagctggccg 2220
ggcaacgacc gtctgctcac ccccaacgag ttcgagatca agcgctcggt cgacggggaa 2280
ggctacaacg tggcccagtg caacatgacc aaggactggt tcctggtcca gatgctggcc 2340
aactacaaca tcggctacca gggcttctac atcccagaga gctacaagga caggatgtac 2400
tccttcttca ggaacttcca gcccatgagc cggcaggtgg tggaccagac caagtacaag 2460
gactaccagg aggtgggcat catccaccag cacaacaact cgggcttcgt gggctacctc 2520
gcccccacca tgcgcgaggg acaggcctac cccgccaact tcccctaccc gctcataggc 2580
aagaccgcgg tcgacagcat cacccagaaa aagttcctct gcgaccgcac cctctggcgc 2640
atccccttct ccagcaactt catgtccatg ggtgcgctct cggacctggg ccagaacttg 2700
ctctacgcca actccgccca cgccctcgac atgaccttcg aggtcgaccc catggacgag 2760
cccacccttc tctatgttct gttcgaagtc tttgacgtgg tccgggtcca ccagccgcac 2820
cgcggcgtca tcgagaccgt gtacctgcgt acgcccttct cggccggcaa cgccaccacc 2880
<210>7
<211>593
<212>PRT
<213>ChAd3
<400>7
Met Arg Arg Ala Ala Met Tyr Gln Glu Gly Pro Pro Pro Ser Tyr Glu
 1               5                  10                  15
Ser Val Val Gly Ala Ala Ala Ala Ala Pro Ser Ser Pro Phe Ala Ser
            20                  25                  30
Gln Leu Leu Glu Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr
        35                  40                  45
Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe Asp
    50                  55                  60
Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser
65                  70                  75                  80
Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln
                85                  90                  95
Asn Asn Asp Tyr Ser Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu
            100                 105                 110
Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr
        115                 120                 125
Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala
    130                 135                 140
Arg Val Met Val Ser Arg Ser His Thr Lys Glu Asp Arg Val Glu Leu
145                 150                 155                 160
Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu
                165                 170                 175
Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu
            180                 185                 190
Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys
        195                 200                 205
Phe Asp Thr Arg Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu
    210                 215                 220
Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile
225                 230                 235                 240
Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn
                245                 250                 255
Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile
            260                 265                 270
Thr Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val
        275                 280                 285
Glu Ala Tyr Gln Asp Ser Leu Lys Glu Asn Glu Ala Gly Gln Glu Asp
    290                 295                 300
Thr Thr Pro Ala Ala Ser Ala Ala Ala Glu Gln Gly Glu Asp Ala Ala
305                 310                 315                 320
Asp Thr Ala Ala Ala Asp Gly Ala Glu Ala Asp Pro Ala Met Val Val
                325                 330                 335
Glu Ala Pro Glu Gln Glu Glu Asp Met Asn Asp Ser Ala Val Arg Gly
            340                 345                 350
Asp Thr Phe Val Thr Arg Gly Glu Glu Lys Gln Ala Glu Ala Glu Ala
        355                 360                 365
Ala Ala Glu Glu Lys Gln Leu Ala Ala Ala Ala Ala Ala Ala Ala Leu
    370                 375                 380
Ala Ala Ala Glu Ala Glu Ser Glu Gly Thr Lys Pro Ala Lys Glu Pro
385                 390                 395                 400
Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys Arg Ser Tyr Asn Leu
                405                 410                 415
Leu Lys Asp Ser Thr Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr
            420                 425                 430
Asn Tyr Gly Asp Pro Ser Thr Gly Val Arg Ser Trp Thr Leu Leu Cys
        435                 440                 445
Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro
    450                 455                 460
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
465                 470                 475                 480
Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys Ser
                485                 490                 495
Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr
            500                 505                 510
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala
        515                 520                 525
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
    530                 535                 540
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val
545                 550                 555                 560
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
                565                 570                 575
Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr
            580                 585                 590
Phe
<210>8
<211>1779
<212>DNA
<213>ChAd3
<400>8
atgcggcgcg cggcgatgta ccaggaggga cctcctccct cttacgagag cgtggtgggc 60
gcggcggcgg cggcgccctc ttctcccttt gcgtcgcagc tgctggagcc gccgtacgtg 120
cctccgcgct acctgcggcc tacggggggg agaaacagca tccgttactc ggagctggcg 180
cccctgttcg acaccacccg ggtgtacctg gtggacaaca agtcggcgga cgtggcctcc 240
ctgaactacc agaacgacca cagcaatttt ttgaccacgg tcatccagaa caatgactac 300
agcccgagcg aggccagcac ccagaccatc aatctggatg accggtcgca ctggggcggc 360
gacctgaaaa ccatcctgca caccaacatg cccaacgtga acgagttcat gttcaccaat 420
aagttcaagg cgcgggtgat ggtgtcgcgc tcgcacacca aggaagaccg ggtggagctg 480
aagtacgagt gggtggagtt cgagctgcca gagggcaact actccgagac catgaccatt 540
gacctgatga acaacgcgat cgtggagcac tatctgaaag tgggcaggca aaacggggtc 600
ctggagagcg acatcggggt caagttcgac accaggaact tccgcctggg gctggacccc 660
gtgaccgggc tggttatgcc cggggtgtac accaacgagg ccttccatcc cgacatcatc 720
ctgctgcccg gctgcggggt ggacttcact tacagccgcc tgagcaacct cctgggcatc 780
cgcaagcggc agcccttcca ggagggcttc aggatcacct acgaggacct ggaggggggc 840
aacatccccg cgctcctcga tgtggaggcc taccaggata gcttgaagga aaatgaggcg 900
ggacaggagg ataccacccc cgccgcctcc gccgccgccg agcagggcga ggatgctgct 960
gacaccgcgg ccgcggacgg ggcagaggcc gaccccgcta tggtggtgga ggctcccgag 1020
caggaggagg atatgaatga cagtgcggtg cgcggagaca ccttcgtcac ccggggggag 1080
gaaaagcaag cggaggccga ggccgcggcc gaggaaaagc aactggcggc agcagcggcg 1140
gcggcggcgt tggccgcggc ggaggctgag tctgagggga ccaagcccgc caaggagccc 1200
gtgattaagc ccctgaccga agatagcaag aagcgcagtt acaacctgct caaggacagc 1260
accaacaccg cgtaccgcag ctggtacctg gcctacaact acggcgaccc gtcgacgggg 1320
gtgcgctcct ggaccctgct gtgcacgccg gacgtgacct gcggctcgga gcaggtgtac 1380
tggtcgctgc ccgacatgat gcaagacccc gtgaccttcc gctccacgcg gcaggtcagc 1440
aacttcccgg tggtgggcgc cgagctgctg cccgtgcact ccaagagctt ctacaacgac 1500
caggccgtct actcccagct catccgccag ttcacctctc tgacccacgt gttcaatcgc 1560
tttcctgaga accagattct ggcgcgcccg cccgccccca ccatcaccac cgtcagtgaa 1620
aacgttcctg ctctcacaga tcacgggacg ctaccgctgc gcaacagcat cggaggagtc 1680
cagcgagtga ccgttactga cgccagacgc cgcacctgcc cctacgttta caaggccttg 1740
ggcatagtct cgccgcgcgt cctttccagc cgcactttt                        1779
<210>9
<211>425
<212>PRT
<213>ChAd63
<400>9
Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr
 1               5                  10                  15
Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro
            20                  25                  30
Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser
        35                  40                  45
Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu
    50                  55                  60
Lys Leu Gly Glu Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser
65                  70                  75                  80
Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr
                85                  90                  95
Ile Ser Leu Asn Met Asp His Pro Phe Tyr Thr Lys Asp Gly Lys Leu
            100                 105                 110
Ser Leu Gln Val Ser Pro Pro Leu Asn Ile Leu Arg Thr Ser Ile Leu
        115                 120                 125
Asn Thr Leu Ala Leu Gly Phe Gly Ser Gly Leu Gly Leu Arg Gly Ser
    130                 135                 140
Ala Leu Ala Val Gln Leu Val Ser Pro Leu Thr Phe Asp Thr Asp Gly
145                 150                 155                 160
Asn Ile Lys Leu Thr Leu Asp Arg Gly Leu His Val Thr Thr Gly Asp
                165                 170                 175
Ala Ile Glu Ser Asn Ile Ser Trp Ala Lys Gly Leu Lys Phe Glu Asp
            180                 185                 190
Gly Ala Ile Ala Thr Asn Ile Gly Asn Gly Leu Glu Phe Gly Ser Ser
        195                 200                 205
Ser Thr Glu Thr Gly Val Asp Asp Ala Tyr Pro Ile Gln Val Lys Leu
    210                 215                 220
Gly Ser Gly Leu Ser Phe Asp Ser Thr Gly Ala Ile Met Ala Gly Asn
225                 230                 235                 240
Lys Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro
                245                 250                 255
Asn Cys Gln Ile Leu Ala Glu Asn Asp Ala Lys Leu Thr Leu Cys Leu
            260                 265                 270
Thr Lys Cys Gly Ser Gln Ile Leu Ala Thr Val Ser Val Leu Val Val
        275                 280                 285
Gly Ser Gly Asn Leu Asn Pro Ile Thr Gly Thr Val Ser Ser Ala Gln
    290                 295                 300
Val Phe Leu Arg Phe Asp Ala Asn Gly Val Leu Leu Thr Glu His Ser
305                 310                 315                 320
Thr Leu Lys Lys Tyr Trp Gly Tyr Arg Gln Gly Asp Ser Ile Asp Gly
                325                 330                 335
Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Lys Ala Tyr
            340                 345                 350
Pro Lys Ser Gln Ser Ser Thr Thr Lys Asn Asn Ile Val Gly Gln Val
        355                 360                 365
Tyr Met Asn Gly Asp Val Ser Lys Pro Met Leu Leu Thr Ile Thr Leu
    370                 375                 380
Asn Gly Thr Asp Asp Ser Asn Ser Thr Tyr Ser Met Ser Phe Ser Tyr
385                 390                 395                 400
Thr Trp Thr Asn Gly Ser Tyr Val Gly Ala Thr Phe Gly Ala Asn Ser
                405                 410                 415
Tyr Thr Phe Ser Tyr Ile Ala Gln Glu
            420                 425
<210>10
<211>1278
<212>DNA
<213>ChAd63
<400>10
atgtccaaaa agcgcgtccg ggtggatgat gacttcgacc ccgtctaccc ctacgatgca 60
gacaacgcac cgaccgtgcc cttcatcaac ccccccttcg tctcttcaga tggattccaa 120
gagaagcccc tgggggtgct gtccctgcga ctggccgacc ccgtcaccac caagaacggg 180
gaaatcaccc tcaagctggg agagggggtg gacctcgact cctcgggaaa actcatctcc 240
aacacggcca ccaaggccgc cgcccctctc agtttttcca acaacaccat ttcccttaac 300
atggatcacc ccttttacac taaagatgga aaattatcct tacaagtttc tccaccatta 360
aatatactga gaacaagcat tctaaacaca ctagctttag gttttggatc aggtttagga 420
ctccgtggct ctgccttggc agtacagtta gtctctccac ttacatttga tactgatgga 480
aacataaagc ttaccttaga cagaggtttg catgttacaa caggagatgc aattgaaagc 540
aacataagct gggctaaagg tttaaaattt gaagatggag ccatagcaac caacattgga 600
aatgggttag agtttggaag cagtagtaca gaaacaggtg ttgatgatgc ttacccaatc 660
caagttaaac ttggatctgg ccttagcttt gacagtacag gagccataat ggctggtaac 720
aaagaagacg ataaactcac tttgtggaca acacctgatc catcgccaaa ctgtcaaata 780
ctcgcagaaa atgatgcaaa actaacactt tgcttgacta aatgtggtag tcaaatactg 840
gccactgtgt cagtcttagt tgtaggaagt ggaaacctaa accccattac tggcaccgta 900
agcagtgctc aggtgtttct acgttttgat gcaaacggtg ttcttttaac agaacattct 960
acactaaaaa aatactgggg gtataggcag ggagatagca tagatggcac tccatatacc 1020
aatgctgtag gattcatgcc caatttaaaa gcttatccaa agtcacaaag ttctactact 1080
aaaaataata tagtagggca agtatacatg aatggagatg tttcaaaacc tatgcttctc 1140
actataaccc tcaatggtac tgatgacagc aacagtacat attcaatgtc attttcatac 1200
acctggacta atggaagcta tgttggagca acatttgggg ctaactctta taccttctca 1260
tacatcgccc aagaatga                                               1278
<210>11
<211>941
<212>PRT
<213>ChAd63
<400>11
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
 1               5                  10                  15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
            20                  25                  30
Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro
        35                  40                  45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
    50                  55                  60
Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65                  70                  75                  80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
                85                  90                  95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
            100                 105                 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
        115                 120                 125
Ala Pro Asn Thr Ser Gln Trp Lys Asp Ser Asp Ser Lys Met His Thr
    130                 135                 140
Phe Gly Val Ala Ala Met Pro Gly Val Val Gly Lys Lys Ile Glu Ala
145                 150                 155                 160
Asp Gly Leu Pro Ile Gly Ile Asp Ser Ser Ser Gly Thr Asp Thr Ile
                165                 170                 175
Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln Val Gly Ser Asp
            180                 185                 190
Ser Trp Val Asp Thr Asn Gly Ala Glu Glu Lys Tyr Gly Gly Arg Ala
        195                 200                 205
Leu Lys Asp Thr Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala Arg
    210                 215                 220
Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Ile Lys Asp Ser Glu Thr
225                 230                 235                 240
Ala Ser Thr Thr Pro Asn Tyr Asp lle Asp Leu Ala Phe Phe Asp Ser
                245                 250                 255
Lys Asn Ile Ala Ala Asn Tyr Asp Pro Asp Ile Val Met Tyr Thr Glu
            260                 265                 270
Asn Val Glu Leu Gln Thr Pro Asp Thr His Ile Val Phe Lys Pro Gly
        275                 280                 285
Thr Ser Asp Glu Ser Ser Glu Ala Asn Leu Gly Gln Gln Ala Met Pro
    290                 295                 300
Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met
305                 310                 315                 320
Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser
                325                 330                 335
Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser
            340                 345                 350
Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser
        355                 360                 365
Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile
    370                 375                 380
Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu
385                 390                 395                 400
Asn Gly Val Gly Phe Thr Asp Thr Tyr Gln Gly Val Lys Val Lys Thr
                405                 410                 415
Asp Thr Ala Ala Thr Gly Thr Asn Gly Thr Gln Trp Asp Lys Asp Asp
            420                 425                 430
Thr Thr Val Ser Thr Ala Asn Glu Ile His Ser Gly Asn Pro Phe Ala
        435                 440                 445
Met Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr Ala
    450                 455                 460
Asn Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn
465                 470                 475                 480
Ile Thr Leu Pro Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg
                485                 490                 495
Val Val Ala Pro Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala Arg
            500                 505                 510
Trp Ser Leu Asp Pro Met Asp Asn Val Asn Pro Phe Asn His His Arg
        515                 520                 525
Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr
    530                 535                 540
Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys Ser
545                 550                 555                 560
Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys
                565                 570                 575
Asp Val Asn Met Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Thr
            580                 585                 590
Asp Gly Ala Ser Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe
        595                 600                 605
Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg
    610                 615                 620
Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn
625                 630                 635                 640
Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile
                645                 650                 655
Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu
            660                 665                 670
Lys Thr Arg Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe
        675                 680                 685
Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn
    690                 695                 700
His Thr Phe Lys Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser Trp
705                 710                 715                 720
Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys Arg
                725                 730                 735
Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys
            740                 745                 750
Asp Trp Phe Leu Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr Gln
        755                 760                 765
Gly Phe Tyr Val Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe
    770                 775                 780
Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr
785                 790                 795                 800
Lys Asp Tyr Gln Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser Gly
                805                 810                 815
Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro
            820                 825                 830
Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser Val
        835                 840                 845
Thr Gln Lys Lys Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro Phe
    850                 855                 860
Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn
865                 870                 875                 880
Met Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu Val
                885                 890                 895
Asp Pro Met Asp Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val Phe
            900                 905                 910
Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Ala Val
        915                 920                 925
Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
    930                 935                 940
<210>12
<211>2877
<212>DNA
<213>ChAd63
<400>12
atgtatgtcc gccgaccaga aggaggaaga ggcgcgtcgc cgagttgcaa gatggccacc 60
ccatcgatgc tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac 120
ctgagtccgg gtctggtgca gttcgcccgc gccacagaca cctacttcag tctggggaac 180
aagtttagga accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg 240
ctgacgctgc gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc 300
tacacgctgg ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc 360
cgcggcgtgc tggatcgggg ccccagcttc aaaccctact ccggcaccgc ctacaacagc 420
ctagctccca agggagcgcc caacacctca cagtggaagg attccgacag caaaatgcat 480
acttttggag ttgctgccat gcccggtgtt gttggtaaaa aaatagaagc cgatggtctg 540
cctattggaa tagattcatc ctctggaact gacaccataa tttatgctga taaaactttc 600
caaccagagc cacaggttgg aagtgacagt tgggtcgaca ccaatggtgc agaggaaaaa 660
tatggaggta gagctcttaa ggacactaca aacatgaagc cctgctacgg ttcttttgcc 720
aggcctacca acaaagaagg tggacaggct aacataaaag attctgaaac tgccagcact 780
actcctaact atgatataga tttggcattc tttgacagca aaaatattgc agctaactac 840
gatccagata ttgtaatgta cacagaaaat gttgagttgc aaactccaga tactcatatt 900
gtgtttaagc caggaacttc agatgaaagt tcagaagcca atttgggcca gcaggccatg 960
cccaacagac ccaactacat cgggttcaga gacaacttta tcgggctcat gtactacaac 1020
agcactggca atatgggtgt actggctggt caggcctccc agctaaatgc tgtggtggac 1080
ttgcaggaca gaaacaccga actgtcctac cagctcttgc ttgactctct gggtgacaga 1140
accaggtatt tcagtatgtg gaatcaggcg gtggacagct atgaccccga tgtgcgcatt 1200
attgaaaatc acggtgtgga ggatgaactc cccaattatt gcttcccttt gaatggtgta 1260
ggctttacag atacttacca gggtgttaaa gttaagacag atacagccgc tactggtacc 1320
aatggaacgc agtgggacaa agatgatacc acagtcagca ctgccaatga gatccactca 1380
ggcaatcctt tcgccatgga gatcaacatc caggccaacc tgtggcggaa cttcctctac 1440
gcgaacgtgg cgctgtacct gcccgactcc tacaagtaca cgccggccaa catcacgctg 1500
ccgaccaaca ccaacaccta cgattacatg aacggccgcg tggtggcgcc ctcgctggtg 1560
gacgcctaca tcaacatcgg ggcgcgctgg tcgctggacc ccatggacaa cgtcaacccc 1620
ttcaaccacc accgcaacgc gggcctgcgc taccgctcca tgctcctggg caacgggcgc 1680
tacgtgccct tccacatcca ggtgccccaa aagtttttcg ccatcaagag cctcctgctc 1740
ctgcccgggt cctacaccta cgagtggaac ttccgcaagg acgtcaacat gatcctgcag 1800
agctccctcg gcaacgacct gcgcacggac ggggcctcca tcgccttcac cagcatcaac 1860
ctctacgcca ccttcttccc catggcgcac aacaccgcct ccacgctcga ggccatgctg 1920cgcaacgaca
ccaacgacca gtccttcaac gactacctct cggcggccaa catgctctac            1980
cccatcccgg ccaacgccac caacgtgccc atctccatcc cctcgcgcaa ctgggccgcc 2040
ttccgcggat ggtccttcac gcgcctcaag acccgcgaga cgccctcgct cggctccggg 2100
ttcgacccct acttcgtcta ctcgggctcc atcccctacc tcgacggcac cttctacctc 2160
aaccacacct tcaagaaggt ctccatcacc ttcgactcct ccgtcagctg gcccggcaac 2220
gaccgcctcc tgacgcccaa cgagttcgaa atcaagcgca ccgtcgacgg agagggatac 2280
aacgtggccc agtgcaacat gaccaaggac tggttcctgg tccagatgct ggcccactac 2340
aacatcggct accagggctt ctacgtgccc gagggctaca aggaccgcat gtactccttc 2400
ttccgcaact tccagcccat gagccgccag gtcgtggacg aggtcaacta caaggactac 2460
caggccgtca ccctggccta ccagcacaac aactcgggct tcgtcggcta cctcgcgccc 2520
accatgcgcc agggccagcc ctaccccgcc aactacccct acccgctcat cggcaagagc 2580
gccgtcgcca gcgtcaccca gaaaaagttc ctctgcgacc gggtcatgtg gcgcatcccc 2640
ttctccagca acttcatgtc catgggcgcg ctcaccgacc tcggccagaa catgctctac 2700
gccaactccg cccacgcgct agacatgaat ttcgaagtcg accccatgga tgagtccacc 2760
cttctctatg ttgtcttcga agtcttcgac gtcgtccgag tgcaccagcc ccaccgcggc 2820
gtcatcgagg ccgtctacct gcgcacgccc ttctcggccg gcaacgccac cacctaa    2877
<210>13
<211>35890
<212>DNA
<213>人工序列
<220>
<223>ChAd3delta E1,3,4,Ad5E4orf6,NSmut
<400>13
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cgaggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctccgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca 1140
gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc 1200
cagcctccgc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca agagtgagat 1260
ctgccaccat ggcgcccatc acggcctact cccaacagac gcggggccta cttggttgca 1320
tcatcactag ccttacaggc cgggacaaga accaggtcga gggagaggtt caggtggttt 1380
ccaccgcaac acaatccttc ctggcgacct gcgtcaacgg cgtgtgttgg accgtttacc 1440
atggtgctgg ctcaaagacc ttagccggcc caaaggggcc aatcacccag atgtacacta 1500
atgtggacca ggacctcgtc ggctggcagg cgccccccgg ggcgcgttcc ttgacaccat 1560
gcacctgtgg cagctcagac ctttacttgg tcacgagaca tgctgacgtc attccggtgc 1620
gccggcgggg cgacagtagg gggagcctgc tctcccccag gcctgtctcc tacttgaagg 1680
gctcttcggg tggtccactg ctctgccctt cggggcacgc tgtgggcatc ttccgggctg 1740
ccgtatgcac ccggggggtt gcgaaggcgg tggactttgt gcccgtagag tccatggaaa 1800
ctactatgcg gtctccggtc ttcacggaca actcatcccc cccggccgta ccgcagtcat 1860
ttcaagtggc ccacctacac gctcccactg gcagcggcaa gagtactaaa gtgccggctg 1920
catatgcagc ccaagggtac aaggtgctcg tcctcaatcc gtccgttgcc gctaccttag 1980
ggtttggggc gtatatgtct aaggcacacg gtattgaccc caacatcaga actggggtaa 2040
ggaccattac cacaggcgcc cccgtcacat actctaccta tggcaagttt cttgccgatg 2100
gtggttgctc tgggggcgct tatgacatca taatatgtga tgagtgccat tcaactgact 2160
cgactacaat cttgggcatc ggcacagtcc tggaccaagc ggagacggct ggagcgcggc 2220
ttgtcgtgct cgccaccgct acgcctccgg gatcggtcac cgtgccacac ccaaacatcg 2280
aggaggtggc cttgtctaat actggagaga tccccttcta tggcaaagcc atccccattg 2340
aagccatcag ggggggaagg catctcattt tctgtcattc caagaagaag tgcgacgagc 2400
tcgccgcaaa gctgtcaggc ctcggaatca acgctgtggc gtattaccgg gggctcgatg 2460
tgtccgtcat accaactatc ggagacgtcg ttgtcgtggc aacagacgct ctgatgacgg 2520
gctatacggg cgactttgac tcagtgatcg actgtaacac atgtgtcacc cagacagtcg 2580
acttcagctt ggatcccacc ttcaccattg agacgacgac cgtgcctcaa gacgcagtgt 2640
cgcgctcgca gcggcggggt aggactggca ggggtaggag aggcatctac aggtttgtga 2700
ctccgggaga acggccctcg ggcatgttcg attcctcggt cctgtgtgag tgctatgacg 2760
cgggctgtgc ttggtacgag ctcacccccg ccgagacctc ggttaggttg cgggcctacc 2820
tgaacacacc agggttgccc gtttgccagg accacctgga gttctgggag agtgtcttca 2880
caggcctcac ccacatagat gcacacttct tgtcccagac caagcaggca ggagacaact 2940
tcccctacct ggtagcatac caagccacgg tgtgcgccag ggctcaggcc ccacctccat 3000
catgggatca aatgtggaag tgtctcatac ggctgaaacc tacgctgcac gggccaacac 3060
ccttgctgta caggctggga gccgtccaaa atgaggtcac cctcacccac cccataacca 3120
aatacatcat ggcatgcatg tcggctgacc tggaggtcgt cactagcacc tgggtgctgg 3180
tgggcggagt ccttgcagct ctggccgcgt attgcctgac aacaggcagt gtggtcattg 3240
tgggtaggat tatcttgtcc gggaggccgg ctattgttcc cgacagggag tttctctacc 3300
aggagttcga tgaaatggaa gagtgcgcct cgcacctccc ttacatcgag cagggaatgc 3360
agctcgccga gcaattcaag cagaaagcgc tcgggttact gcaaacagcc accaaacaag 3420
cggaggctgc tgctcccgtg gtggagtcca agtggcgagc ccttgagaca ttctgggcga 3480
agcacatgtg gaatttcatc agcgggatac agtacttagc aggcttatcc actctgcctg 3540
ggaaccccgc aatagcatca ttgatggcat tcacagcctc tatcaccagc ccgctcacca 3600
cccaaagtac cctcctgttt aacatcttgg gggggtgggt ggctgcccaa ctcgcccccc 3660
ccagcgccgc ttcggctttc gtgggcgccg gcatcgccgg tgcggctgtt ggcagcatag 3720
gccttgggaa ggtgcttgtg gacattctgg cgggttatgg agcaggagtg gccggcgcgc 3780
tcgtggcctt caaggtcatg agcggcgaga tgccctccac cgaggacctg gtcaatctac 3840
ttcctgccat cctctctcct ggcgccctgg tcgtcggggt cgtgtgtgca gcaatactgc 3900
gtcgacacgt gggtccggga gagggggctg tgcagtggat gaaccggctg atagcgttcg 3960
cctcgcgggg taatcatgtt tcccccacgc actatgtgcc tgagagcgac gccgcagcgc 4020
gtgttactca gatcctctcc agccttacca tcactcagct gctgaaaagg ctccaccagt 4080
ggattaatga agactgctcc acaccgtgtt ccggctcgtg gctaagggat gtttgggact 4140
ggatatgcac ggtgttgact gacttcaaga cctggctcca gtccaagctc ctgccgcagc 4200
taccgggagt cccttttttc tcgtgccaac gcgggtacaa gggagtctgg cggggagacg 4260
gcatcatgca aaccacctgc ccatgtggag cacagatcac cggacatgtc aaaaacggtt 4320
ccatgaggat cgtcgggcct aagacctgca gcaacacgtg gcatggaaca ttccccatca 4380
acgcatacac cacgggcccc tgcacaccct ctccagcgcc aaactattct agggcgctgt 4440
ggcgggtggc cgctgaggag tacgtggagg tcacgcgggt gggggatttc cactacgtga 4500
cgggcatgac cactgacaac gtaaagtgcc catgccaggt tccggctcct gaattcttca 4560
cggaggtgga cggagtgcgg ttgcacaggt acgctccggc gtgcaggcct ctcctacggg 4620
aggaggttac attccaggtc gggctcaacc aatacctggt tgggtcacag ctaccatgcg 4680
agcccgaacc ggatgtagca gtgctcactt ccatgctcac cgacccctcc cacatcacag 4740
cagaaacggc taagcgtagg ttggccaggg ggtctccccc ctccttggcc agctcttcag 4800
ctagccagtt gtctgcgcct tccttgaagg cgacatgcac tacccaccat gtctctccgg 4860
acgctgacct catcgaggcc aacctcctgt ggcggcagga gatgggcggg aacatcaccc 4920
gcgtggagtc ggagaacaag gtggtagtcc tggactcttt cgacccgctt cgagcggagg 4980
aggatgagag ggaagtatcc gttccggcgg agatcctgcg gaaatccaag aagttccccg 5040
cagcgatgcc catctgggcg cgcccggatt acaaccctcc actgttagag tcctggaagg 5100
acccggacta cgtccctccg gtggtgcacg ggtgcccgtt gccacctatc aaggcccctc 5160
caataccacc tccacggaga aagaggacgg ttgtcctaac agagtcctcc gtgtcttctg 5220
ccttagcgga gctcgctact aagaccttcg gcagctccga atcatcggcc gtcgacagcg 5280
gcacggcgac cgcccttcct gaccaggcct ccgacgacgg tgacaaagga tccgacgttg 5340
agtcgtactc ctccatgccc ccccttgagg gggaaccggg ggaccccgat ctcagtgacg 5400
ggtcttggtc taccgtgagc gaggaagcta gtgaggatgt cgtctgctgc tcaatgtcct 5460
acacatggac aggcgccttg atcacgccat gcgctgcgga ggaaagcaag ctgcccatca 5520
acgcgttgag caactctttg ctgcgccacc ataacatggt ttatgccaca acatctcgca 5580
gcgcaggcct gcggcagaag aaggtcacct ttgacagact gcaagtcctg gacgaccact 5640
accgggacgt gctcaaggag atgaaggcga aggcgtccac agttaaggct aaactcctat 5700
ccgtagagga agcctgcaag ctgacgcccc cacattcggc caaatccaag tttggctatg 5760
gggcaaagga cgtccggaac ctatccagca aggccgttaa ccacatccac tccgtgtgga 5820
aggacttgct ggaagacact gtgacaccaa ttgacaccac catcatggca aaaaatgagg 5880
ttttctgtgt ccaaccagag aaaggaggcc gtaagccagc ccgccttatc gtattcccag 5940
atctgggagt ccgtgtatgc gagaagatgg ccctctatga tgtggtctcc acccttcctc 6000
aggtcgtgat gggctcctca tacggattcc agtactctcc tgggcagcga gtcgagttcc 6060
tggtgaatac ctggaaatca aagaaaaacc ccatgggctt ttcatatgac actcgctgtt 6120
tcgactcaac ggtcaccgag aacgacatcc gtgttgagga gtcaatttac caatgttgtg 6180
acttggcccc cgaagccaga caggccataa aatcgctcac agagcggctt tatatcgggg 6240
gtcctctgac taattcaaaa gggcagaact gcggttatcg ccggtgccgc gcgagcggcg 6300
tgctgacgac tagctgcggt aacaccctca catgttactt gaaggcctct gcagcctgtc 6360
gagctgcgaa gctccaggac tgcacgatgc tcgtgaacgc cgccggcctt gtcgttatct 6420
gtgaaagcgc gggaacccaa gaggacgcgg cgagcctacg agtcttcacg gaggctatga 6480
ctaggtactc tgcccccccc ggggacccgc cccaaccaga atacgacttg gagctgataa 6540
catcatgttc ctccaatgtg tcggtcgccc acgatgcatc aggcaaaagg gtgtactacc 6600
tcacccgtga tcccaccacc cccctcgcac gggctgcgtg ggaaacagct agacacactc 6660
cagttaactc ctggctaggc aacattatca tgtatgcgcc cactttgtgg gcaaggatga 6720
ttctgatgac tcacttcttc tccatccttc tagcacagga gcaacttgaa aaagccctgg 6780
actgccagat ctacggggcc tgttactcca ttgagccact tgacctacct cagatcattg 6840
aacgactcca tggccttagc gcattttcac tccatagtta ctctccaggt gagatcaata 6900
gggtggcttc atgcctcagg aaacttgggg taccaccctt gcgagtctgg agacatcggg 6960
ccaggagcgt ccgcgctagg ctactgtccc agggggggag ggccgccact tgtggcaagt 7020
acctcttcaa ctgggcagtg aagaccaaac tcaaactcac tccaatcccg gctgcgtccc 7080
agctggactt gtccggctgg ttcgttgctg gttacagcgg gggagacata tatcacagcc 7140
tgtctcgtgc ccgaccccgc tggttcatgc tgtgcctact cctactttct gtaggggtag 7200
gcatctacct gctccccaac cgataaatct agagctgtgc cttctagttg ccagccatct 7260
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 7320
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 7380
ggtggggtgg ggcagcacag caagggggag gattgggaag acaatagcag gcatgctggg 7440
gatgcggtgg gcgatatcag cgatcgctga ggtgggtgag tgggcgtggc ctggggtggt 7500
catgaaaata tataagttgg gggtcttagg gtctctttat ttgtgttgca gagaccgccg 7560
gagccatgag cgggagcagc agcagcagca gtagcagcag cgccttggat ggcagcatcg 7620
tgagccctta tttgacgacg cggatgcccc actgggccgg ggtgcgtcag aatgtgatgg 7680
gctccagcat cgacggccga cccgtcctgc ccgcaaattc cgccacgctg acctatgcga 7740
ccgtcgcggg gacgccgttg gacgccaccg ccgccgccgc cgccaccgca gccgcctcgg 7800
ccgtgcgcag cctggccacg gactttgcat tcctgggacc actggcgaca ggggctactt 7860
ctcgggccgc tgctgccgcc gttcgcgatg acaagctgac cgccctgctg gcgcagttgg 7920
atgcgcttac tcgggaactg ggtgaccttt ctcagcaggt catggccctg cgccagcagg 7980
tctcctccct gcaagctggc gggaatgctt ctcccacaaa tgccgtttaa gataaataaa 8040
accagactct gtttggatta aagaaaagta gcaagtgcat tgctctcttt atttcataat 8100
tttccgcgcg cgataggccc tagaccagcg ttctcggtcg ttgagggtgc ggtgtatctt 8160
ctccaggacg tggtagaggt ggctctggac gttgagatac atgggcatga gcccgtcccg 8220
ggggtggagg tagcaccact gcagagcttc atgctccggg gtggtgttgt agatgatcca 8280
gtcgtagcag gagcgctggg catggtgcct aaaaatgtcc ttcagcagca ggccgatggc 8340
cagggggagg cccttggtgt aagtgtttac aaaacggtta agttgggaag ggtgcattcg 8400
gggagagatg atgtgcatct tggactgtat ttttagattg gcgatgtttc cgcccagatc 8460
ccttctggga ttcatgttgt gcaggaccac cagtacagtg tatccggtgc acttggggaa 8520
tttgtcatgc agcttagagg gaaaagcgtg gaagaacttg gagacgccct tgtggcctcc 8580
cagattttcc atgcattcgt ccatgatgat ggcaatgggc ccgcgggagg cagcttgggc 8640
aaagatattt ctggggtcgc tgacgtcgta gttgtgttcc agggtgaggt cgtcataggc 8700
catttttaca aagcgcgggc ggagggtgcc cgactggggg atgatggtcc cctctggccc 8760
tggggcgtag ttgccctcgc agatctgcat ttcccaggcc ttaatctcgg aggggggaat 8820
catatccacc tgcggggcga tgaagaaaac ggtttccgga gccggggaga ttaactggga 8880
tgagagcagg tttctaagca gctgtgattt tccacaaccg gtgggcccat aaataacacc 8940
tataaccggt tgcagctggt agtttagaga gctgcagctg ccgtcgtccc ggaggagggg 9000
ggccacctcg ttgagcatgt ccctgacgcg catgttctcc ccgaccagat ccgccagaag 9060
gcgctcgccg cccagggaca gcagctcttg caaggaagca aagtttttca gcggcttgag 9120
gccgtccgcc gtgggcatgt ttttcagggt ctggctcagc agctccaggc ggtcccagag 9180
ctcggtgacg tgctctacgg catctctatc cagcatatct cctcgtttcg cgggttgggg 9240
cgactttcgc tgtagggcac caagcggtgg tcgtccagcg gggccaaagt catgtccttc 9300
catgggcgca gggtcctcgt cagggtggtc tgggtcacgg tgaaggggtg cgctccgggc 9360
tgagcgcttg ccaaggtgcg cttgaggctg gttctgctgg tgctgaagcg ctgccggtct 9420
tcgccctgcg cgtcggccag gtagcatttg accatggtgt catagtccag cccctccgcg 9480
gcgtgtccct tggcgcgcag cttgcccttg gaggtggcgc cgcacgaggg gcagagcagg 9540
ctcttgagcg cgtagagctt gggggcgagg aagaccgatt cgggggagta ggcgtccgcg 9600
ccgcagaccc cgcacacggt ctcgcactcc accagccagg tgagctcggg gcgcgccggg 9660
tcaaaaacca ggtttccccc atgctttttg atgcgtttct tacctcgggt ctccatgagg 9720
tggtgtcccc gctcggtgac gaagaggctg tccgtgtctc cgtagaccga cttgaggggt 9780
cttttctcca ggggggtccc tcggtcttcc tcgtagagga actcggacca ctctgagacg 9840
aaggcccgcg tccaggccag gacgaaggag gctatgtggg aggggtagcg gtcgttgtcc 9900
actagggggt ccaccttctc caaggtgtga agacacatgt cgccttcctc ggcgtccagg 9960
aaggtgattg gcttgtaggt gtaggccacg tgaccggggg ttcctgacgg gggggtataa 10020
aagggggtgg gggcgcgctc gtcgtcactc tcttccgcat cgctgtctgc gagggccagc 10080
tgctggggtg agtattccct ctcgaaggcg ggcatgacct ccgcgctgag gttgtcagtt 10140
tccaaaaacg aggaggattt gatgttcacc tgtcccgagg tgataccttt gagggtaccc 10200
gcgtccatct ggtcagaaaa cacgatcttt ttattgtcca gcttggtggc gaacgacccg 10260
tagagggcgt tggagagcag cttggcgatg gagcgcaggg tctggttctt gtccctgtcg 10320
gcgcgctcct tggccgcgat gttgagctgc acgtactcgc gcgcgacgca gcgccactcg 10380
gggaagacgg tggtgcgctc gtcgggcacc aggcgcacgc gccagccgcg gttgtgcagg 10440
gtgaccaggt ccacgctggt ggcgacctcg ccgcgcaggc gctcgttggt ccagcagaga 10500
cggccgccct tgcgcgagca gaaggggggc agggggtcga gctgggtctc gtccgggggg 10560
tccgcgtcca cggtgaaaac cccggggcgc aggcgcgcgt cgaagtagtc tatcttgcaa 10620
ccttgcatgt ccagcgcctg ctgccagtcg cgggcggcga gcgcgcgctc gtaggggttg 10680
agcggcgggc cccagggcat ggggtgggtg agtgcggagg cgtacatgcc gcagatgtca 10740
tagacgtaga ggggctcccg caggaccccg atgtaggtgg ggtagcagcg gccgccgcgg 10800
atgctggcgc gcacgtagtc atacagctcg tgcgaggggg cgaggaggtc ggggcccagg 10860
ttggtgcggg cggggcgctc cgcgcggaag acgatctgcc tgaagatggc atgcgagttg 10920
gaagagatgg tggggcgctg gaagacgttg aagctggcgt cctgcaggcc gacggcgtcg 10980
cgcacgaagg aggcgtagga gtcgcgcagc ttgtgtacca gctcggcggt gacctgcacg 11040
tcgagcgcgc agtagtcgag ggtctcgcgg atgatgtcat atttagcctg ccccttcttt 11100
ttccacagct cgcggttgag gacaaactct tcgcggtctt tccagtactc ttggatcggg 11160
aaaccgtccg gttccgaacg gtaagagcct agcatgtaga actggttgac ggcctggtag 11220
gcgcagcagc ccttctccac ggggagggcg taggcctgcg cggccttgcg gagcgaggtg 11280
tgggtcaggg cgaaggtgtc cctgaccatg actttgaggt actggtgctt gaagtcggag 11340
tcgtcgcagc cgccccgctc ccagagcgag aagtcggtgc gcttcttgga gcgggggttg 11400
ggcagagcga aggtgacatc gttgaagagg attttgcccg cgcggggcat gaagttgcgg 11460
gtgatgcgga agggccccgg cacttcagag cggttgttga tgacctgggc ggcgagcacg 11520
atctcgtcga agccgttgat gttgtggccc acgatgtaga gttccaggaa gcggggccgg 11580
ccctttacgg tgggcagctt ctttagctct tcgtaggtga gctcctcggg cgaggcgagg 11640
ccgtgctcgg ccagggccca gtccgcgagg tgcgggttgt ctctgaggaa ggactcccag 11700
aggtcgcggg ccaggagggt ctgcaggcgg tccctgaagg tcctgaactg gcggcccacg 11760
gccatttttt cgggggtgat gcagtagaag gtgagggggt cttgctgcca gcggtcccag 11820
tcgagctgca gggcgaggtc gcgcgcggcg gtgaccaggc gctcgtcgcc cccgaatttc 11880
atgaccagca tgaagggcac gagctgcttt ccgaaggccc ccatccaagt gtaggtctct 11940
acatcgtagg tgacaaagag gcgctccgtg cgaggatgcg agccgatcgg gaagaactgg 12000
atctcccgcc accagttgga ggagtggctg ttgatgtggt ggaagtagaa gtcccgtcgc 12060
cgggccgaac actcgtgctg gcttttgtaa aagcgagcgc agtactggca gcgctgcacg 12120
ggctgtacct cctgcacgag atgcaccttt cgcccgcgca cgaggaagcc gaggggaaat 12180
ctgagccccc cgcctggctc gcggcatggc tggtgctctt ctactttgga tgcgtgtccg 12240
tctccgtctg gctcctcgag gggtgttacg gtggagcgga ccaccacgcc gcgcgagccg 12300
caggtccaga tatcggcgcg cggcggtcgg agtttgatga cgacatcgcg cagctgggag 12360
ctgtccatgg tctggagctc ccgcggcggc ggcaggtcag ccgggagttc ttgcaggttc 12420
acctcgcaga gtcgggccag ggcgcggggc aggtctaggt ggtacctgat ctctaggggc 12480
gtgttggtgg cggcgtcgat ggcttgcagg agcccgcatc cccggggggc gacgacggtg 12540
ccccgcgggg tggtggtggt ggtggtggtg gtggtggtgg cggtgcagct cagaagcggt 12600
gccgcgggcg ggcccccgga ggtagggggg gctccggtcc cgccggcagg ggcggcagcg 12660
gcacgtcggc gtggagcgcg ggcaggagtt ggtgctgtgc ccggaggttg ctggcgaagg 12720
cgacgacgcg gcggttgatc tcctggatct ggcgcctctg cgtgaagacg acgggcccgg 12780
tgagcttgaa cctgaaagag agttcgacag aatcaatctc ggtgtcattg accgcggcct 12840
ggcgcaggat ctcctgcacg tctcccgagt tgtcttggta ggcgatctcg gccatgaact 12900
gctcgatctc ttcctcctgg aggtctccgc gtccggcgcg ttccacggtg gccgccaggt 12960
cgttggagat gcgccccatg agctgcgaga aggcgttgag tccgccctcg ttccagactc 13020
ggctgtagac cacgcccccc tggtcatcgc gggcgcgcat gaccacctgc gcgaggttga 13080
gctccacgtg ccgcgcgaag acggcgtagt tgcgcagacg ctggaagagg tagttgaggg 13140
tggtggcggt gtgctcggcc acgaagaagt tcatgaccca gcggcgcaac gtggattcgt 13200
tgatgtcccc caaggcctcc agccgttcca tggcctcgta gaagtccacg gcgaagttga 13260
aaaactggga gttgcgcgcc gacacggtca actcctcctc cagaagacgg atgagctcgg 13320
cgacggtgtc gcgcacctcg cgctcgaagg ctatggggat ctcttcctcc gctagcatca 13380
ccacctcctc ctcttcctcc tcttctggca cttccatgat ggcttcctcc tcttcggggg 13440
gcggcggcgg cggcggtggg ggagggggcg ctctgcgccg gcggcggcgc accgggaggc 13500
ggtccacgaa gcgcgcgatc atctccccgc ggcggcggcg catggtctcg gtgacggcgc 13560
ggccgttctc ccgggggcgc agttggaaga cgccgccgga catctggtgc tggggcgggt 13620
ggccgtgagg cagcgaaacg gcgctgacga tgcatctcaa caattgctgc gtaggtacgc 13680
cgccgaggga cctgagggag tccatatcca ccggatccga aaacctttcg aggaaggcgt 13740
ctaaccagtc gcagtcgcaa ggtaggctga gcaccgtggc gggcggcggg gggtgggggg 13800
agtgtctggc ggaggtgctg ctgatgatgt aattgaagta ggcggacttg acacggcgga 13860
tggtcgacag gagcaccatg tccttgggtc cggcctgctg gatgcggagg cggtcggcta 13920
tgccccaggc ttcgttctgg catcggcgca ggtccttgta gtagtcttgc atgagccttt 13980
ccaccggcac ctcttctcct tcctcttctg cttcttccat gtctgcttcg gccctggggc 14040
ggcgccgcgc ccccctgccc cccatgcgcg tgaccccgaa ccccctgagc ggttggagca 14100
gggccaggtc ggcgacgacg cgctcggcca ggatggcctg ctgcacctgc gtgagggtgg 14160
tttggaagtc atccaagtcc acgaagcggt ggtaggcgcc cgtgttgatg gtgtaggtgc 14220
agttggccat gacggaccag ttgacggtct ggtggcccgg ttgcgacatc tcggtgtacc 14280
tgagtcgcga gtaggcgcgg gagtcgaaga cgtagtcgtt gcaagtccgc accaggtact 14340
ggtagcccac caggaagtgc ggcggcggct ggcggtagag gggccagcgc agggtggcgg 14400
gggctccggg ggccaggtct tccagcatga ggcggtggta ggcgtagatg tacctggaca 14460
tccaggtgat acccgcggcg gtggtggagg cgcgcgggaa gtcgcgcacc cggttccaga 14520
tgttgcgcag gggcagaaag tgctccatgg taggcgtgct ctgtccagtc agacgcgcgc 14580
agtcgttgat actctagacc agggaaaacg aaagccggtc agcgggcact cttccgtggt 14640
ctggtgaata gatcgcaagg gtatcatggc ggagggcctc ggttcgagcc ccgggtccgg 14700
gccggacggt ccgccatgat ccacgcggtt accgcccgcg tgtcgaaccc aggtgtgcga 14760
cgtcagacaa cggtggagtg ttccttttgg cgtttttctg gccgggcgcc ggcgtcgcgt 14820
aagagactaa gccgcgaaag cgaaagcagt aagtggctcg ctccccgtag ccggagggat 14880
ccttgctaag ggttgcgttg cggcgaaccc cggttcgaat cccgtactcg ggccggccgg 14940
acccgcggct aaggtgttgg attggcctcc ccctcgtata aagaccccgc ttgcggattg 15000
actccggaca cggggacgag ccccttttat ttttgctttc cccagatgca tccggtgctg 15060
cggcagatgc gccccccgcc ccagcagcag caacaacacc agcaagagcg gcagcaacag 15120
cagcgggagt catgcagggc cccctcaccc accctcggcg ggccggccac ctcggcgtcc 15180
gcggccgtgt ctggcgcctg cggcggcggc ggggggccgg ctgacgaccc cgaggagccc 15240
ccgcggcgca gggccagaca ctacctggac ctggaggagg gcgagggcct ggcgcggctg 15300
ggggcgccgt ctcccgagcg ccacccgcgg gtgcagctga agcgcgactc gcgcgaggcg 15360
tacgtgcctc ggcagaacct gttcagggac cgcgcgggcg aggagcccga ggagatgcgg 15420
gacaggaggt tcagcgcagg gcgggagctg cggcaggggc tgaaccgcga gcggctgctg 15480
cgcgaggagg actttgagcc cgacgcgcgg acggggatca gccccgcgcg cgcgcacgtg 15540
gcggccgccg acctggtgac ggcgtacgag cagacggtga accaggagat caacttccaa 15600
aagagtttca acaaccacgt gcgcacgctg gtggcgcgcg aggaggtgac catcgggctg 15660
atgcacctgt gggactttgt aagcgcgctg gtgcagaacc ccaacagcaa gcctctgacg 15720
gcgcagctgt tcctgatagt gcagcacagc agggacaacg aggcgtttag ggacgcgctg 15780
ctgaacatca ccgagcccga gggtcggtgg ctgctggacc tgattaacat cctgcagagc 15840
atagtggtgc aggagcgcag cctgagcctg gccgacaagg tggcggccat caactactcg 15900
atgctgagcc tgggcaagtt ttacgcgcgc aagatctacc agacgccgta cgtgcccata 15960
gacaaggagg tgaagatcga cggtttttac atgcgcatgg cgctgaaggt gctcaccctg 16020
agcgacgacc tgggcgtgta ccgcaacgag cgcatccaca aggccgtgag cgtgagccgg 16080
cggcgcgagc tgagcgaccg cgagctgatg cacagcctgc agcgggcgct ggcgggcgcc 16140ggcagcggcg
acagggaggc ggagtcctac ttcgatgcgg gggcggacct gcgctgggcg            16200
cccagccggc gggccctgga ggccgcgggg gtccgcgagg actatgacga ggacggcgag 16260
gaggatgagg agtacgagct agaggagggc gagtacctgg actaaaccgc gggtggtgtt 16320
tccggtagat gcaagacccg aacgtggtgg acccggcgct gcgggcggct ctgcagagcc 16380
agccgtccgg ccttaactcc tcagacgact ggcgacaggt catggaccgc atcatgtcgc 16440
tgacggcgcg taacccggac gcgttccggc agcagccgca ggccaacagg ctctccgcca 16500
tcctggaggc ggtggtgcct gcgcgctcga accccacgca cgagaaggtg ctggccatag 16560
tgaacgcgct ggccgagaac agggccatcc gcccggacga ggccgggctg gtgtacgacg 16620
cgctgctgca gcgcgtggcc cgctacaaca gcggcaacgt gcagaccaac ctggaccggc 16680
tggtggggga cgtgcgcgag gcggtggcgc agcgcgagcg cgcggatcgg cagggcaacc 16740
tgggctccat ggtggcgctg aatgccttcc tgagcacgca gccggccaac gtgccgcggg 16800
ggcaggaaga ctacaccaac tttgtgagcg cgctgcggct gatggtgacc gagacccccc 16860
agagcgaggt gtaccagtcg ggcccggact acttcttcca gaccagcaga cagggcctgc 16920
agacggtgaa cctgagccag gctttcaaga acctgcgggg gctgtggggc gtgaaggcgc 16980
ccaccggcga ccgggcgacg gtgtccagcc tgctgacgcc caactcgcgc ctgctgctgc 17040
tgctgatcgc gccgttcacg gacagcggca gcgtgtcccg ggacacctac ctggggcacc 17100
tgctgaccct gtaccgcgag gccatcgggc aggcgcaggt ggacgagcac accttccagg 17160
agatcaccag cgtgagccgc gcgctggggc aggaggacac gagcagcctg gaggcgactc 17220
tgaactacct gctgaccaac cggcggcaga agattccctc gctgcacagc ctgacctccg 17280
aggaggagcg catcttgcgc tacgtgcagc agagcgtgag cctgaacctg atgcgcgacg 17340
gggtgacgcc cagcgtggcg ctggacatga ccgcgcgcaa catggaaccg ggcatgtacg 17400
ccgcgcaccg gccttacatc aaccgcctga tggactacct gcatcgcgcg gcggccgtga 17460
accccgagta ctttaccaac gccatcctga acccgcactg gctcccgccg cccgggttct 17520
acagcggggg cttcgaggtc ccggaggcca acgatggctt cctgtgggac gacatggacg 17580
acagcgtgtt ctccccgcgg ccgcaggcgc tggcggaagc gtccctgctg cgtcccaaga 17640
aggaggagga ggaggcgagt cgccgccgcg gcagcagcgg cgtggcttct ctgtccgagc 17700
tgggggcggc agccgccgcg cgccccgggt ccctgggcgg cagccccttt ccgagcctgg 17760
tggggtctct gcacagcgag cgcaccaccc gccctcggct gctgggcgag gacgagtacc 17820
tgaataactc cctgctgcag ccggtgcggg agaaaaacct gccccccgcc ttccccaaca 17880
acgggataga gagcctggtg gacaagatga gcagatggaa gacctatgcg caggagcaca 17940
gggacgcgcc cgcgctccgg ccgcccacgc ggcgccagcg ccacgaccgg cagcgggggc 18000
tggtgtggga tgacgaggac tccgcggacg atagcagcgt gctggacctg ggagggagcg 18060
gcaacccgtt cgcgcacctg cgcccccgcc tggggaggat gttttaaaaa aaaaaaaagc 18120
aagaagcatg atgcaaaatt aaataaaact caccaaggcc atggcgaccg agcgttggtt 18180
tcttgtgttc ccttcagtat gcggcgcgcg gcgatgtacc aggagggacc tcctccctct 18240
tacgagagcg tggtgggcgc ggcggcggcg gcgccctctt ctccctttgc gtcgcagctg 18300
ctggagccgc cgtacgtgcc tccgcgctac ctgcggccta cgggggggag aaacagcatc 18360
cgttactcgg agctggcgcc cctgttcgac accacccggg tgtacctggt ggacaacaag 18420
tcggcggacg tggcctccct gaactaccag aacgaccaca gcaatttttt gaccacggtc 18480
atccagaaca atgactacag cccgagcgag gccagcaccc agaccatcaa tctggatgac 18540
cggtcgcact ggggcggcga cctgaaaacc atcctgcaca ccaacatgcc caacgtgaac 18600
gagttcatgt tcaccaataa gttcaaggcg cgggtgatgg tgtcgcgctc gcacaccaag 18660
gaagaccggg tggagctgaa gtacgagtgg gtggagttcg agctgccaga gggcaactac 18720
tccgagacca tgaccattga cctgatgaac aacgcgatcg tggagcacta tctgaaagtg 18780
ggcaggcaaa acggggtcct ggagagcgac atcggggtca agttcgacac caggaacttc 18840
cgcctggggc tggaccccgt gaccgggctg gttatgcccg gggtgtacac caacgaggcc 18900
ttccatcccg acatcatcct gctgcccggc tgcggggtgg acttcactta cagccgcctg 18960
agcaacctcc tgggcatccg caagcggcag cccttccagg agggcttcag gatcacctac 19020
gaggacctgg aggggggcaa catccccgcg ctcctcgatg tggaggccta ccaggatagc 19080
ttgaaggaaa atgaggcggg acaggaggat accacccccg ccgcctccgc cgccgccgag 19140
cagggcgagg atgctgctga caccgcggcc gcggacgggg cagaggccga ccccgctatg 19200
gtggtggagg ctcccgagca ggaggaggat atgaatgaca gtgcggtgcg cggagacacc 19260
ttcgtcaccc ggggggagga aaagcaagcg gaggccgagg ccgcggccga ggaaaagcaa 19320
ctggcggcag cagcggcggc ggcggcgttg gccgcggcgg aggctgagtc tgaggggacc 19380
aagcccgcca aggagcccgt gattaagccc ctgaccgaag atagcaagaa gcgcagttac 19440
aacctgctca aggacagcac caacaccgcg taccgcagct ggtacctggc ctacaactac 19500
ggcgacccgt cgacgggggt gcgctcctgg accctgctgt gcacgccgga cgtgacctgc 19560
ggctcggagc aggtgtactg gtcgctgccc gacatgatgc aagaccccgt gaccttccgc 19620
tccacgcggc aggtcagcaa cttcccggtg gtgggcgccg agctgctgcc cgtgcactcc 19680
aagagcttct acaacgacca ggccgtctac tcccagctca tccgccagtt cacctctctg 19740
acccacgtgt tcaatcgctt tcctgagaac cagattctgg cgcgcccgcc cgcccccacc 19800
atcaccaccg tcagtgaaaa cgttcctgct ctcacagatc acgggacgct accgctgcgc 19860
aacagcatcg gaggagtcca gcgagtgacc gttactgacg ccagacgccg cacctgcccc 19920
tacgtttaca aggccttggg catagtctcg ccgcgcgtcc tttccagccg cactttttga 19980
gcaacaccac catcatgtcc atcctgatct cacccagcaa taactccggc tggggactgc 20040
tgcgcgcgcc cagcaagatg ttcggagggg cgaggaagcg ttccgagcag caccccgtgc 20100
gcgtgcgcgg gcacttccgc gccccctggg gagcgcacaa acgcggccgc gcggggcgca 20160
ccaccgtgga cgacgccatc gactcggtgg tggagcaggc gcgcaactac aggcccgcgg 20220
tctctaccgt ggacgcggcc atccagaccg tggtgcgggg cgcgcggcgg tacgccaagc 20280
tgaagagccg ccggaagcgc gtggcccgcc gccaccgccg ccgacccggg gccgccgcca 20340
aacgcgccgc cgcggccctg cttcgccggg ccaagcgcac gggccgccgc gccgccatga 20400
gggccgcgcg ccgcttggcc gccggcatca ccgccgccac catggccccc cgtacccgaa 20460
gacgcgcggc cgccgccgcc gccgccgcca tcagtgacat ggccagcagg cgccggggca 20520
acgtgtactg ggtgcgcgac tcggtgaccg gcacgcgcgt gcccgtgcgc ttccgccccc 20580
cgcggacttg agatgatgtg aaaaaacaac actgagtctc ctgctgttgt gtgtatccca 20640
gcggcggcgg cgcgcgcagc gtcatgtcca agcgcaaaat caaagaagag atgctccagg 20700
tcgtcgcgcc ggagatctat gggcccccga agaaggaaga gcaggattcg aagccccgca 20760
agataaagcg ggtcaaaaag aaaaagaaag atgatgacga tgccgatggg gaggtggagt 20820
tcctgcgcgc cacggcgccc aggcgcccgg tgcagtggaa gggccggcgc gtaaagcgcg 20880
tcctgcgccc cggcaccgcg gtggtcttca cgcccggcga gcgctccacc cggactttca 20940
agcgcgtcta tgacgaggtg tacggcgacg aagacctgct ggagcaggcc aacgagcgct 21000
tcggagagtt tgcttacggg aagcgtcagc gggcgctggg gaaggaggac ctgctggcgc 21060
tgccgctgga ccagggcaac cccaccccca gtctgaagcc cgtgaccctg cagcaggtgc 21120
tgccgagcag cgcaccctcc gaggcgaagc ggggtctgaa gcgcgagggc ggcgacctgg 21180
cgcccaccgt gcagctcatg gtgcccaagc ggcagaggct ggaggatgtg ctggagaaaa 21240
tgaaagtaga ccccggtctg cagccggaca tcagggtccg tcccatcaag caggtggcgc 21300
cgggcctcgg cgtgcagacc gtggacgtgg tcatccccac cggcaactcc cccgccgcca 21360
ccaccactac cgctgcctcc acggacatgg agacacagac cgatcccgcc gcagccgcag 21420
ccgccgccgc agccgcgacc tcctcggcgg aggtgcagac ggacccctgg ctgccgccgg 21480
cgatgtcagc tccccgcgcg cgccgcggac gcagaaagta cggcgccgcc aacgcgctcc 21540
tgcccgagta cgccttgcat ccttccatcg cgcccacccc cggctaccga ggctatacct 21600
accgcccgcg aagagccaag ggttccaccc gccgtccccg ccgacgcgcc gccgccacca 21660
cccgccgccg ccgccgcaga cgccagcccg cactggctcc agtctccgtg aggagagtgg 21720
cgcgcgacgg acacaccctg gtgctgccca gggcgcgcta ccaccccagc atcgtttaaa 21780
agcctgttgt ggttcttgca gatatggccc tcacttgccg cctccgtttc ccggtgccgg 21840
gataccgagg aggaagatcg cgccgcagga ggggtctggc cggccgcggc ctgagcggag 21900
gcagccgccg cgcgcaccgg cggcgacgcg ccaccagccg acgcatgcgc ggcggggtgc 21960
tgcccctgtt aatccccctg atcgccgcgg cgatcggcgc cgtgcccggg atcgcctccg 22020
tggccttgca agcgtcccag aggcattgac agacttgcaa acttgcaaat atggaaaaaa 22080
aaaaaaaacc ccaataaaaa gtctagactc tcacgctcgc ttggtcctgt gactattttg 22140
tagaatggaa gacatcaact ttgcgtcgct ggccccgcgt cacggctcgc gcccgttcct 22200
gggacactgg aacgatatcg gcaccagcaa catgagcggt ggcgccttca gttggggctc 22260
tctgtggagc ggcattaaaa gtatcgggtc tgccgttaaa aattacggct cccgggcctg 22320
gaacagcagc acgggccaga tgttgagaga caagttgaaa gagcagaact tccagcagaa 22380
ggtggtggag ggcctggcct ccggcatcaa cggggtggtg gacctggcca accaggccgt 22440
gcagaataaa atcaacagca gactggaccc ccggccgccg gtggaggagg tgccgccggc 22500
gctggagacg gtgtcccccg atgggcgtgg cgagaagcgc ccgcggcccg atagggaaga 22560
gaccactctg gtcacgcaga ccgatgagcc gcccccgtat gaggaggccc taaagcaagg 22620
tctgcccacc acgcggccca tcgcgcccat ggccaccggg gtggtgggcc gccacacccc 22680
cgccacgctg gacttgcctc cgcccgccga tgtgccgcag cagcagaagg cggcacagcc 22740
gggcccgccc gcgaccgcct cccgttcctc cgccggtcct ctgcgccgcg cggccagcgg 22800
cccccgcggg ggggtcgcga ggcacggcaa ctggcagagc acgctgaaca gcatcgtggg 22860
tctgggggtg cggtccgtga agcgccgccg atgctactga atagcttagc taacgtgttg 22920
tatgtgtgta tgcgccctat gtcgccgcca gaggagctgc tgagtcgccg ccgttcgcgc 22980
gcccaccacc accgccactc cgcccctcaa gatggcgacc ccatcgatga tgccgcagtg 23040
gtcgtacatg cacatctcgg gccaggacgc ctcggagtac ctgagccccg ggctggtgca 23100
gttcgcccgc gccaccgaga gctacttcag cctgagtaac aagtttagga accccacggt 23160
ggcgcccacg cacgatgtga ccaccgaccg gtctcagcgc ctgacgctgc ggttcattcc 23220
cgtggaccgc gaggacaccg cgtactcgta caaggcgcgg ttcaccctgg ccgtgggcga 23280
caaccgcgtg ctggacatgg cctccaccta ctttgacatc cgcggggtgc tggaccgggg 23340
tcccactttc aagccctact ctggcaccgc ctacaactcc ctggccccca agggcgctcc 23400
caactcctgc gagtgggagc aagaggaaac tcaggcagtt gaagaagcag cagaagagga 23460
agaagaagat gctgacggtc aagctgagga agagcaagca gctaccaaaa agactcatgt 23520
atatgctcag gctccccttt ctggcgaaaa aattagtaaa gatggtctgc aaataggaac 23580
ggacgctaca gctacagaac aaaaacctat ttatgcagac cctacattcc agcccgaacc 23640
ccaaatcggg gagtcccagt ggaatgaggc agatgctaca gtcgccggcg gtagagtgct 23700
aaagaaatct actcccatga aaccatgcta tggttcctat gcaagaccca caaatgctaa 23760
tggaggtcag ggtgtactaa cggcaaatgc ccagggacag ctagaatctc aggttgaaat 23820
gcaattcttt tcaacttctg aaaacgcccg taacgaggct aacaacattc agcccaaatt 23880
ggtgctgtat agtgaggatg tgcacatgga gaccccggat acgcaccttt cttacaagcc 23940
cgcaaaaagc gatgacaatt caaaaatcat gctgggtcag cagtccatgc ccaacagacc 24000
taattacatc ggcttcagag acaactttat cggcctcatg tattacaata gcactggcaa 24060
catgggagtg cttgcaggtc aggcctctca gttgaatgca gtggtggact tgcaagacag 24120
aaacacagaa ctgtcctacc agctcttgct tgattccatg ggtgacagaa ccagatactt 24180
ttccatgtgg aatcaggcag tggacagtta tgacccagat gttagaatta ttgaaaatca 24240
tggaactgaa gacgagctcc ccaactattg tttccctctg ggtggcatag gggtaactga 24300
cacttaccag gctgttaaaa ccaacaatgg caataacggg ggccaggtga cttggacaaa 24360
agatgaaact tttgcagatc gcaatgaaat aggggtggga aacaatttcg ctatggagat 24420
caacctcagt gccaacctgt ggagaaactt cctgtactcc aacgtggcgc tgtacctacc 24480
agacaagctt aagtacaacc cctccaatgt ggacatctct gacaacccca acacctacga 24540
ttacatgaac aagcgagtgg tggccccggg gctggtggac tgctacatca acctgggcgc 24600
gcgctggtcg ctggactaca tggacaacgt caaccccttc aaccaccacc gcaatgcggg 24660
cctgcgctac cgctccatgc tcctgggcaa cgggcgctac gtgcccttcc acatccaggt 24720
gccccagaag ttctttgcca tcaagaacct cctcctcctg ccgggctcct acacctacga 24780
gtggaacttc aggaaggatg tcaacatggt cctccagagc tctctgggta acgatctcag 24840
ggtggacggg gccagcatca agttcgagag catctgcctc tacgccacct tcttccccat 24900
ggcccacaac acggcctcca cgctcgaggc catgctcagg aacgacacca acgaccagtc 24960
cttcaatgac tacctttccg ccgccaacat gctctacccc atacccgcca acgccaccaa 25020
cgtccccatc tccatcccct cgcgcaactg ggcggccttc cgcggctggg ccttcacccg 25080
cctcaagacc aaggagaccc cctccctggg ctcgggattc gacccctact acacctactc 25140
gggctctatt ccctacctgg acggcacctt ctacctcaac cacactttca agaaggtctc 25200
ggtcaccttc gactcctcgg tcagctggcc gggcaacgac cgtctgctca cccccaacga 25260
gttcgagatc aagcgctcgg tcgacgggga aggctacaac gtggcccagt gcaacatgac 25320
caaggactgg ttcctggtcc agatgctggc caactacaac atcggctacc agggcttcta 25380
catcccagag agctacaagg acaggatgta ctccttcttc aggaacttcc agcccatgag 25440
ccggcaggtg gtggaccaga ccaagtacaa ggactaccag gaggtgggca tcatccacca 25500
gcacaacaac tcgggcttcg tgggctacct cgcccccacc atgcgcgagg gacaggccta 25560
ccccgccaac ttcccctacc cgctcatagg caagaccgcg gtcgacagca tcacccagaa 25620
aaagttcctc tgcgaccgca ccctctggcg catccccttc tccagcaact tcatgtccat 25680
gggtgcgctc tcggacctgg gccagaactt gctctacgcc aactccgccc acgccctcga 25740
catgaccttc gaggtcgacc ccatggacga gcccaccctt ctctatgttc tgttcgaagt 25800
ctttgacgtg gtccgggtcc accagccgca ccgcggcgtc atcgagaccg tgtacctgcg 25860
tacgcccttc tcggccggca acgccaccac ctaaagaagc aagccgcagt catcgccgcc 25920
tgcatgccgt cgggttccac cgagcaagag ctcagggcca tcgtcagaga cctgggatgc 25980
gggccctatt ttttgggcacct tcgacaag cgcttccctg gctttgtctc cccacacaag 26040
ctggcctgcg ccatcgtcaa cacggccggc cgcgagaccg ggggcgtgca ctggctggcc 26100
tttgcctgga acccgcgctc caaaacatgc ttcctctttg accccttcgg cttttcggac 26160
cagcggctca agcaaatcta cgagttcgag tacgagggct tgctgcgtcg cagcgccatc 26220
gcctcctcgc ccgaccgctg cgtcaccctc gaaaagtcca cccagaccgt gcaggggccc 26280
gactcggccg cctgcggtct cttctgctgc atgtttctgc acgcctttgt gcactggcct 26340
cagagtccca tggaccgcaa ccccaccatg aacttgctga cgggggtgcc caactccatg 26400
ctccaaagcc cccaggtcga gcccaccctg cgccgcaacc aggagcagct ctacagcttc 26460
ctggagcgcc actcgcccta cttccgccgc cacagcgcac agatcaggag ggccacctcc 26520
ttctgccact tgcaagagat gcaagaaggg taataacgat gtacacactt ttttctcaat 26580
aaatggcatt ttttttttat ttatacaagc tctctggggt attcatttcc caccaccacc 26640
acccgccgtt gtcgccatct ggctctattt agaaatcgaa agggttctgc cgggagtcgc 26700
cgtgcgccac gggcagggac acgttgcgat actggtagcg ggtgccccac ttgaactcgg 26760
gcaccaccag gcgaggcagc tcggggaagt tttcgctcca caggctgcgg gtcagcacca 26820
gcgcgttcat caggtcgggc gccgagatct tgaagtcgca gttggggccg ccgccctgcg 26880
cgcgcgagtt gcggtacacc gggttgcagc actggaacac caacagcgcc gggtgcttca 26940
cgctggccag cacgctgcgg tcggagatca gctcggcgtc caggtcctcc gcgttgctca 27000
gcgcgaacgg ggtcatcttg ggcacttgcc gccccaggaa gggcgcgtgc cccggtttcg 27060
agttgcagtc gcagcgcagc gggatcagca ggtgcccgtg cccggactcg gcgttggggt 27120
acagcgcgcg catgaaggcc tgcatctggc ggaaggccat ctgggccttg gcgccctccg 27180
agaagaacat gccgcaggac ttgcccgaga actggtttgc ggggcagctg gcgtcgtgca 27240
ggcagcagcg cgcgtcggtg ttggcgatct gcaccacgtt gcgcccccac cggttcttca 27300
cgatcttggc cttggacgat tgctccttca gcgcgcgctg cccgttctcg ctggtcacat 27360
ccatctcgat cacatgttcc ttgttcacca tgctgctgcc gtgcagacac ttcagctcgc 27420
cctccgtctc ggtgcagcgg tgctgccaca gcgcgcagcc cgtgggctcg aaagacttgt 27480
aggtcacctc cgcgaaggac tgcaggtacc cctgcaaaaa gcggcccatc atggtcacga 27540
aggtcttgtt gctgctgaag gtcagctgca gcccgcggtg ctcctcgttc agccaggtct 27600
tgcacacggc cgccagcgcc tccacctggt cgggcagcat cttgaagttc accttcagct 27660
cattctccac gtggtacttg tccatcagcg tgcgcgccgc ctccatgccc ttctcccagg 27720
ccgacaccag cggcaggctc acggggttct tcaccatcac cgtggccgcc gcctccgccg 27780
cgctttcgct ttccgccccg ctgttctctt cctcttcctc ctcttcctcg ccgccgccca 27840
ctcgcagccc ccgcaccacg gggtcgtctt cctgcaggcg ctgcaccttg cgcttgccgt 27900
tgcgcccctg cttgatgcgc acgggcgggt tgctgaagcc caccatcacc agcgcggcct 27960
cttcttgctc gtcctcgctg tccagaatga cctccgggga gggggggttg gtcatcctca 28020
gtaccgaggc acgcttcttt ttcttcctgg gggcgttcgc cagctccgcg gctgcggccg 28080
ctgccgaggt cgaaggccga gggctgggcg tgcgcggcac cagcgcgtct tgcgagccgt 28140
cctcgtcctc ctcggactcg agacggaggc gggcccgctt cttcgggggc gcgcggggcg 28200
gcggaggcgg cggcggcgac ggagacgggg acgagacatc gtccagggtg ggtggacggc 28260
gggccgcgcc gcgtccgcgc tcgggggtgg tttcgcgctg gtcctcttcc cgactggcca 28320
tctcccactg ctccttctcc tataggcaga aagagatcat ggagtctctc atgcgagtcg 28380
agaaggagga ggacagccta accgccccct ctgagccctc caccaccgcc gccaccaccg 28440
ccaatgccgc cgcggacgac gcgcccaccg agaccaccgc cagtaccacc ctccccagcg 28500
acgcaccccc gctcgagaat gaagtgctga tcgagcagga cccgggtttt gtgagcggag 28560
aggaggatga ggtggatgag aaggagaagg aggaggtcgc cgcctcagtg ccaaaagagg 28620
ataaaaagca agaccaggac gacgcagata aggatgagac agcagtcggg cgggggaacg 28680
gaagccatga tgctgatgac ggctacctag acgtgggaga cgacgtgctg cttaagcacc 28740
tgcaccgcca gtgcgtcatc gtctgcgacg cgctgcagga gcgctgcgaa gtgcccctgg 28800
acgtggcgga ggtcagccgc gcctacgagc ggcacctctt cgcgccgcac gtgcccccca 28860
agcgccggga gaacggcacc tgcgagccca acccgcgtct caacttctac ccggtcttcg 28920
cggtacccga ggtgctggcc acctaccaca tcttcttcca aaactgcaag atccccctct 28980
cctgccgcgc taaccgcacc cgcgccgaca aaaccctgac cctgcggcag ggcgcccaca 29040
tacctgatat tgcctctctg gaggaagtgc ccaagatctt cgagggtctc ggtcgcgacg 29100
agaaacgggc ggcgaacgct ctgcacggag acagcgaaaa cgagagtcac tcgggggtgc 29160
tggtggagct cgagggcgac aacgcgcgcc tggccgtact caagcgcagc atagaggtca 29220
cccactttgc ctacccggcg ctcaacctgc cccccaaggt catgagtgtg gtcatgggcg 29280
agctcatcat gcgccgcgct cagcccctgg ccgcggatgc aaacttgcaa gagtcctccg 29340
aggaaggcct gcccgcggtc agcgacgagc agctagcgcg ctggctggag acccgcgacc 29400
ccgcgcagct ggaggagcgg cgcaagctca tgatggccgc ggtgctggtc accgtggagc 29460
tcgagtgtct gcagcgcttc ttcgcggacc ccgagatgca gcgcaagctc gaggagaccc 29520
tgcactacac cttccgccag ggctacgtgc gccaggcctg caagatctcc aacgtggagc 29580
tctgcaacct ggtctcctac ctgggcatcc tgcacgagaa ccgcctcggg cagaacgtcc 29640
tgcactccac cctcaaaggg gaggcgcgcc gcgactacat ccgcgactgc gcctacctct 29700
tcctctgcta cacctggcag acggccatgg gggtctggca gcagtgcctg gaggagcgca 29760
acctcaagga gctggaaaag ctactcaagc gcaccctcag ggacctctgg acgggcttca 29820
acgagcgctc ggtggccgcc gcgctggcgg acatcatctt ccccgagcgc ctgctcaaga 29880
ccctgcagca gggcctgccc gacttcacca gccagagcat gctgcagaac tttaggactt 29940
tcatcctgga gcgctcgggc atcctgcctg ccacttgctg cgcgctgccc agcgacttcg 30000
tgcccatcaa gtacagggag tgcccgccgc cgctctgggg ccactgctac ctcttccagc 30060
tggccaacta cctcgcctac cactcggacc tcatggaaga cgtgagcggc gagggcctgc 30120
tcgagtgcca ctgccgctgc aacctctgca cgccccaccg ctctctagtc tgcaacccgc 30180
agctgctcag cgagagtcag attatcggta ccttcgagct gcagggtccc tcgcctgacg 30240
agaagtccgc ggctccgggg ctgaaactca ctccggggct gtggacttcc gcctacctac 30300
gcaaatttgt acctgaggac taccacgccc acgagatcag gttctacgaa gaccaatccc 30360
gcccgcccaa ggcggagctc accgcctgcg tcatcaccca ggggcacatc ctgggccaat 30420
tgcaagccat caacaaagcc cgccgagagt tcttgctgaa aaagggtcgg ggggtgtacc 30480
tggaccccca gtccggcgag gagctaaacc cgctaccccc gccgccgccc cagcagcggg 30540
accttgcttc ccaggatggc acccagaaag aagcagcagc cgccgccgcc gcagccatac 30600
atgcttctgg aggaagagga ggaggactgg gacagtcagg cagaggaggt ttcggacgag 30660
gagcaggagg agatgatgga agactgggag gaggacagca gcctagacga ggaagcttca 30720
gaggccgaag aggtggcaga cgcaacacca tcaccctcgg tcgcagcccc ctcgccgggg 30780
cccctgaaat cctccgaacc cagcaccagc gctataacct ccgctcctcc ggcgccggcg 30840
ccacccgccc gcagacccaa ccgtagatgg gacaccacag gaaccggggt cggtaagtcc 30900
aagtgcccgc cgccgccacc gcagcagcag cagcagcgcc agggctaccg ctcgtggcgc 30960
gggcacaaga acgccatagt cgcctgcttg caagactgcg ggggcaacat ctctttcgcc 31020
cggcgcttcc tgctattcca ccacggggtc gcctttcccc gcaatgtcct gcattactac 31080
cgtcatctct acagccccta ctgcagcggc gacccagagg cggcagcggc agccacagcg 31140
gcgaccacca cctaggaaga tatcctccgc gggcaagaca gcggcagcag cggccaggag 31200
acccgcggca gcagcggcgg gagcggtggg cgcactgcgc ctctcgccca acgaacccct 31260
ctcgacccgg gagctcagac acaggatctt ccccactttg tatgccatct tccaacagag 31320
cagaggccag gagcaggagc tgaaaataaa aaacagatct ctgcgctccc tcacccgcag 31380
ctgtctgtat cacaaaagcg aagatcagct tcggcgcacg ctggaggacg cggaggcact 31440
cttcagcaaa tactgcgcgc tcactcttaa agactagctc cgcgcccttc tcgaatttag 31500gcgggagaaa
actacgtcat cgccggccgc cgcccagccc gcccagccga gatgagcaaa            31560
gagattccca cgccatacat gtggagctac cagccgcaga tgggactcgc ggcgggagcg 31620
gcccaggact actccacccg catgaactac atgagcgcgg gaccccacat gatctcacag 31680
gtcaacggga tccgcgccca gcgaaaccaa atactgctgg aacaggcggc catcaccgcc 31740
acgccccgcc ataatctcaa cccccgaaat tggcccgccg ccctcgtgta ccaggaaacc 31800
ccctccgcca ccaccgtact acttccgcgt gacgcccagg ccgaagtcca gatgactaac 31860
tcaggggcgc agctcgcggg cggctttcgt cacggggcgc ggccgctccg accaggtata 31920
agacacctga tgatcagagg ccgaggtatc cagctcaacg acgagtcggt gagctcttcg 31980
ctcggtctcc gtccggacgg aactttccag ctcgccggat ccggccgctc ttcgttcacg 32040
ccccgccagg cgtacctgac tctgcagacc tcgtcctcgg agccccgctc cggaggcatc 32100
ggaaccctcc agttcgtgga ggagttcgtg ccctcggtct acttcaaccc cttctcggga 32160
cctcccggac gctaccccga ccagttcatt ccgaactttg acgcggtgaa ggactcggcg 32220
gacggctacg actgaatgtc aggtgccgag gcagagcagc ttcgcctgag acacctcgag 32280
cactgccgcc gccacaagtg cttcgcccgc ggttccggtg agttctgcta ctttcagcta 32340
cccgaggagc ataccgaggg gccggcgcac ggcgtccgcc tgaccaccca gggcgaggtt 32400
acctgttccc tcatccggga gttcaccctc cgtcccctgc tagtggagcg ggagcggggt 32460
ccctgtgtcc taactatcgc ctgcaactgc cctaaccctg gattacatca agatctttgc 32520
tgtcatctct gtgctgagtt taataaacgc tgagatcaga atctactggg aattcgattt 32580
agtccccttt aactaatcaa acactggaat caataaaaag aatcacttac ttaaaatcag 32640
acagcaggtc tctgtccagt ttattcagca gcacctcctt cccctcctcc caactctggt 32700
actccaaacg ccttctggcg gcaaacttcc tccacaccct gaagggaatg tcagattctt 32760
gctcctgtcc ctccgcaccc actatcttca tgttgttgca gatgaagcgc accaaaacgt 32820
ctgacgagag cttcaacccc gtgtacccct atgacacgga aagcggccct ccctccgtcc 32880
ctttcctcac ccctcccttc gtgtctcccg atggattcca agaaagcccc cccggggtcc 32940
tgtctctgaa cctggccgag cccctggtca cttcccacgg catgctcgcc ctgaaaatgg 33000
gaagtggcct ctccctggac gacgctggca acctcacctc tcaagatatc accaccgcta 33060
gccctcccct caaaaaaacc aagaccaacc tcagcctaga aacctcatcc cccctaactg 33120
taagcacctc aggcgccctc accgtagcag ccgccgctcc cctggcagtg gccggcacct 33180
ccctcaccat gcaatcagag gcccccctga cagtacagga tgcaaaactc accctggcca 33240
ccaaaggccc cctgaccgtg tctgaaggca aactggcctt gcaaacatcg gccccgctga 33300
cggccgctga cagcagcacc ctcaccgtta gcgccacacc accaattaat gtaagcagtg 33360
gaagtttagg cttagacatg gaagacccta tgtatactca cgatggaaaa ctgggaataa 33420
gaattggggg tccactaaga gtagtagaca gcttgcacac actcactgta gttaccggaa 33480
atggactaac tgtagataac aatgccctcc aaactagagt tacgggcgcc ctaggttatg 33540
acacatcagg aaatctacaa ttgagagctg caggaggtat gcgaattgat gcaaatggcc 33600
aacttatcct taatgtggca tacccatttg atgctcagaa caatctcagc cttagacttg 33660
gtcagggacc cctgtatata aacacagacc acaacctgga tttgaattgc aacagaggtc 33720
taaccacaac taccaccaac aacacaaaaa aacttgagac taaaattagc tcaggcttag 33780
actatgacac caatggtgct gtcattatta aacttggcac tggtctaagc ttcgacaaca 33840
caggcgccct aactgtggga aacactggtg atgataaact gactctgtgg acgaccccag 33900
acccatctcc aaattgcaga attcactcag acaaagactg caagtttact ctagtcctaa 33960
ctaagtgtgg aagccaaatc ctggcctctg tcgccgccct agcggtatca ggaaatctgg 34020
cttcgataac aggcaccgtt gccagcgtta ccatctttct cagatttgat cagaatggag 34080
tgcttatgga aaactcctcg ctagacaggc agtactggaa cttcagaaat ggcaactcaa 34140
ctaacgctgc cccctacacc aatgcagttg ggttcatgcc aaacctcgca gcatacccca 34200
aaacgcaaag ccagactgct aaaaacaaca ttgtaagtca ggtttacttg aatggagaca 34260
aatccaaacc catgaccctt accatcaccc tcaatggaac taatgaatcc agtgaaacta 34320
gccaggtgag tcactactcc atgtcattta catgggcttg ggaaagtggg caatatgcca 34380
ctgaaacctt tgccaccaac tccttcacct tttcttacat tgctgaacaa taaaaagcat 34440
gacactgatg ttcatttctg attcttattt tattattttc aaacacaaca aaatcattca 34500
agtcattctt ccatcttagc ttaatagaca cagtagctta atagacccag tagtgcaaag 34560
ccccattcta gcttataact agtggagaag tactcgccta catgggggta gagtcataat 34620
cgtgcatcag gatagggcgg tggtgctgca gcagcgcgcg aataaactgc tgccgccgcc 34680
gctccgtcct gcaggaatac aacatggcag tggtctcctc agcgatgatt cgcaccgccc 34740
gcagcataag gcgccttgtc ctccgggcac agcagcgcac cctgatctca cttaaatcag 34800
cacagtaact gcagcacagc accacaatat tgttcaaaat cccacagtgc aaggcgctgt 34860
atccaaagct catggcgggg accacagaac ccacgtggcc atcataccac aagcgcaggt 34920
agattaagtg gcgacccctc ataaacacgc tggacataaa cattacctct tttggcatgt 34980
tgtaattcac cacctcccgg taccatataa acctctgatt aaacatggcg ccatccacca 35040
ccatcctaaa ccagctggcc aaaacctgcc cgccggctat acactgcagg gaaccgggac 35100
tggaacaatg acagtggaga gcccaggact cgtaaccatg gatcatcatg ctcgtcatga 35160
tatcaatgtt ggcacaacac aggcacacgt gcatacactt cctcaggatt acaagctcct 35220
cccgcgttag aaccatatcc cagggaacaa cccattcctg aatcagcgta aatcccacac 35280
tgcagggaag acctcgcacg taactcacgt tgtgcattgt caaagtgtta cattcgggca 35340
gcagcggatg atcctccagt atggtagcgc gggtttctgt ctcaaaagga ggtagacgat 35400
ccctactgta cggagtgcgc cgagacaacc gagatcgtgt tggtcgtagt gtcatgccaa 35460
atggaacgcc ggacgtagtc atatttcctg aagtcttaga tctctcaacg cagcaccagc 35520
accaacactt cgcagtgtaa aaggccaagt gccgagagag tatatatagg aataaaaagt 35580
gacgtaaacg ggcaaagtcc aaaaaacgcc cagaaaaacc gcacgcgaac ctacgccccg 35640
aaacgaaagc caaaaaacac tagacactcc cttccggcgt caacttccgc tttcccacgc 35700
tacgtcactt gccccagtca aacaaactac atatcccgaa cttccaagtc gccacgccca 35760
aaacaccgcc tacacctccc cgcccgccgg cccgccccca aacccgcctc ccgccccgcg 35820
ccccgccccg cgccgcccat ctcattatca tattggcttc aatccaaaat aaggtatatt 35880
attgatgatg                                                        35890
<210>14
<211>37741
<212>DNA
<213>ChAd3
<400>14
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cgaggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctccgtttt attattatag tcagctgacg cggagtgtat 480
ttataccctc tgatctcgtc aagaggccac tcttgagtgc cagcgagtag agttttctcc 540
tctgccgctc tccgctccgc tccgctcggc tctgacaccg gggaaaaaat gagacatttc 600
acctacgatg gcggtgtgct caccggccag ctggctgctg aggtcctgga caccctgatc 660
gaggaggtat tggccgataa ttatcctccc tcgactcctt ttgagccacc tacacttcac 720
gaactatacg atctggatgt ggtggggccc agcgatccga acgagcaggc ggtttccagt 780
ttttttccag agtccatgtt gttggccagc caggaggggg tcgaacttga gacccctcct 840
ccgatcgtgg attcccccga tccgccgcag ctgactaggc agcccgagcg ctgtgcggga 900
cctgagacta tgccccagct gctacctgag gtgatcgatc tcacctgtaa tgagtctggt 960
tttccaccca gcgaggatga ggacgaagag ggtgagcagt ttgtgttaga ttctgtggaa 1020
caacccgggc gaggatgcag gtcttgtcaa tatcaccgga aaaacacagg agactcccag 1080
attatgtgtt ctctgtgtta tatgaagatg acctgtatgt ttatttacag taagtttatc 1140
atcggtgggc aggtgggcta tagtgtgggt ggtggtcttt ggggggtttt ttaatatatg 1200
tcaggggtta tgctgaagac ttttttattg tgatttttaa aggtccagtg tctgagcccg 1260
agcaagaacc tgaaccggag cctgagcctt ctcgccccag gagaaagcct gtaatcttaa 1320
ctagacccag cgcaccggta gcgagaggcc tcagcagcgc ggagaccacc gactccggtg 1380
cttcctcatc acccccggag attcaccccc tggtgcccct atgtcccgtt aagcccgttg 1440
ccgtgagagt cagtgggcgg cggtctgctg tggagtgcat tgaggacttg ctttttgatt 1500
cacaggaacc tttggacttg agcttgaaac gccccaggca ttaaacctgg tcacctggac 1560
tgaatgagtt gacgcctatg tttgcttttg aatgacttaa tgtgtataga taataaagag 1620
tgagataatg ttttaattgc atggtgtgtt taacttgggc ggagtctgct gggtatataa 1680
gcttccctgg gctaaacttg gttacacttg acctcatgga ggcctgggag tgtttggaga 1740
actttgccgg agttcgtgcc ttgctggacg agagctctaa caatacctct tggtggtgga 1800
ggtatttgtg gggctctccc cagggcaagt tagtttgtag aatcaaggag gattacaagt 1860gggaatttga
agagcttttg aaatcctgtg gtgagctatt ggattctttg aatctaggcc            1920
accaggctct cttccaggag aaggtcatca ggactttgga tttttccaca ccggggcgca 1980
ttgcagccgc ggttgctttt ctagcttttt tgaaggatag atggagcgaa gagacccact 2040
tgagttcggg ctacgtcctg gattttctgg ccatgcaact gtggagagca tggatcagac 2100
acaagaacag gctgcaactg ttgtcttccg tccgcccgtt gctgattccg gcggaggagc 2160
aacaggccgg gtcagaggac cgggcccgtc gggatccgga ggagagggca ccgaggccgg 2220
gcgagaggag cgcgctgaac ctgggaaccg ggctgagcgg ccatccacat cgggagtgaa 2280
tgtcgggcag gtggtggatc tttttccaga actgcggcgg attttgacta ttagggagga 2340
tgggcaattt gttaagggtc ttaagaggga gaggggggct tctgagcata acgaggaggc 2400
cagtaattta gcttttagct tgatgaccag acaccgtcca gagtgcatca cttttcagca 2460
gattaaggac aattgtgcca atgagttgga tctgttgggt cagaagtata gcatagagca 2520
gctgaccact tactggctgc agccgggtga tgatctggag gaagctatta gggtgtatgc 2580
taaggtggcc ctgcggcccg attgcaagta caagctcaag gggctggtga atatcaggaa 2640
ttgttgctac atttctggca acggggcgga ggtggagata gagaccgaag acagggtggc 2700
tttcagatgc agcatgatga atatgtggcc gggggtgctg ggcatggacg gggtggtgat 2760
tatgaatgtg aggttcacgg ggcccaactt taacggcacg gtgtttttgg ggaacaccaa 2820
cctggtcctg cacggggtga gcttctatgg gtttaacaac acctgtgtgg aggcctggac 2880
cgatgtgaag gtccgcggtt gcgcctttta tggatgttgg aaggccatag tgagccgccc 2940
taagagcagg agttccatta agaaatgctt gtttgagagg tgcaccttgg ggatcctggc 3000
cgagggcaac tgcagggtgc gccacaatgt ggcctccgag tgcggttgct tcatgctagt 3060
caagagcgtg gcggtaatca agcataatat ggtgtgcggc aacagcgagg acaaggcctc 3120
acagatgctg acctgcacgg atggcaactg ccacttgctg aagaccatcc atgtaaccag 3180
ccacagccgg aaggcctggc ccgtgttcga gcacaacttg ctgacccgct gctccttgca 3240
tctgggcaac aggcgggggg tgttcctgcc ctatcaatgc aactttagtc acaccaagat 3300
cttgctagag cccgagagca tgtccaaggt gaacttgaac ggggtgtttg acatgaccat 3360
gaagatctgg aaggtgctga ggtacgacga gaccaggtcc cggtgcagac cctgcgagtg 3420
cgggggcaag catatgagga accagcccgt gatgctggat gtgaccgagg agctgaggac 3480
agaccacttg gttctggcct gcaccagggc cgagtttggt tctagcgatg aagacacaga 3540
ttgaggtggg tgagtgggcg tggcctgggg tggtcatgaa aatatataag ttgggggtct 3600
tagggtctct ttatttgtgt tgcagagacc gccggagcca tgagcgggag cagcagcagc 3660
agcagtagca gcagcgcctt ggatggcagc atcgtgagcc cttatttgac gacgcggatg 3720
ccccactggg ccggggtgcg tcagaatgtg atgggctcca gcatcgacgg ccgacccgtc 3780ctgcccgcaa
attccgccac gctgacctat gcgaccgtcg cggggacgcc gttggacgcc            3840
accgccgccg ccgccgccac cgcagccgcc tcggccgtgc gcagcctggc cacggacttt 3900
gcattcctgg gaccactggc gacaggggct acttctcggg ccgctgctgc cgccgttcgc 3960
gatgacaagc tgaccgccct gctggcgcag ttggatgcgc ttactcggga actgggtgac 4020
ctttctcagc aggtcatggc cctgcgccag caggtctcct ccctgcaagc tggcgggaat 4080
gcttctccca caaatgccgt ttaagataaa taaaaccaga ctctgtttgg attaaagaaa 4140
agtagcaagt gcattgctct ctttatttca taattttccg cgcgcgatag gccctagacc 4200
agcgttctcg gtcgttgagg gtgcggtgta tcttctccag gacgtggtag aggtggctct 4260
ggacgttgag atacatgggc atgagcccgt cccgggggtg gaggtagcac cactgcagag 4320
cttcatgctc cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcatggt 4380
gcctaaaaat gtccttcagc agcaggccga tggccagggg gaggcccttg gtgtaagtgt 4440
ttacaaaacg gttaagttgg gaagggtgca ttcggggaga gatgatgtgc atcttggact 4500
gtatttttag attggcgatg tttccgccca gatcccttct gggattcatg ttgtgcagga 4560
ccaccagtac agtgtatccg gtgcacttgg ggaatttgtc atgcagctta gagggaaaag 4620
cgtggaagaa cttggagacg cccttgtggc ctcccagatt ttccatgcat tcgtccatga 4680
tgatggcaat gggcccgcgg gaggcagctt gggcaaagat atttctgggg tcgctgacgt 4740
cgtagttgtg ttccagggtg aggtcgtcat aggccatttt tacaaagcgc gggcggaggg 4800
tgcccgactg ggggatgatg gtcccctctg gccctggggc gtagttgccc tcgcagatct 4860
gcatttccca ggccttaatc tcggaggggg gaatcatatc cacctgcggg gcgatgaaga 4920
aaacggtttc cggagccggg gagattaact gggatgagag caggtttcta agcagctgtg 4980
attttccaca accggtgggc ccataaataa cacctataac cggttgcagc tggtagttta 5040
gagagctgca gctgccgtcg tcccggagga ggggggccac ctcgttgagc atgtccctga 5100
cgcgcatgtt ctccccgacc agatccgcca gaaggcgctc gccgcccagg gacagcagct 5160
cttgcaagga agcaaagttt ttcagcggct tgaggccgtc cgccgtgggc atgtttttca 5220
gggtctggct cagcagctcc aggcggtccc agagctcggt gacgtgctct acggcatctc 5280
tatccagcat atctcctcgt ttcgcgggtt ggggcgactt tcgctgtagg gcaccaagcg 5340
gtggtcgtcc agcggggcca aagtcatgtc cttccatggg cgcagggtcc tcgtcagggt 5400
ggtctgggtc acggtgaagg ggtgcgctcc gggctgagcg cttgccaagg tgcgcttgag 5460
gctggttctg ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca 5520
tttgaccatg gtgtcatagt ccagcccctc cgcggcgtgt cccttggcgc gcagcttgcc 5580
cttggaggtg gcgccgcacg aggggcagag caggctcttg agcgcgtaga gcttgggggc 5640
gaggaagacc gattcggggg agtaggcgtc cgcgccgcag accccgcaca cggtctcgca 5700ctccaccagc
caggtgagct cggggcgcgc cgggtcaaaa accaggtttc ccccatgctt            5760
tttgatgcgt ttcttacctc gggtctccat gaggtggtgt ccccgctcgg tgacgaagag 5820
gctgtccgtg tctccgtaga ccgacttgag gggtcttttc tccagggggg tccctcggtc 5880
ttcctcgtag aggaactcgg accactctga gacgaaggcc cgcgtccagg ccaggacgaa 5940
ggaggctatg tgggaggggt agcggtcgtt gtccactagg gggtccacct tctccaaggt 6000
gtgaagacac atgtcgcctt cctcggcgtc caggaaggtg attggcttgt aggtgtaggc 6060
cacgtgaccg ggggttcctg acgggggggt ataaaagggg gtgggggcgc gctcgtcgtc 6120
actctcttcc gcatcgctgt ctgcgagggc cagctgctgg ggtgagtatt ccctctcgaa 6180
ggcgggcatg acctccgcgc tgaggttgtc agtttccaaa aacgaggagg atttgatgtt 6240
cacctgtccc gaggtgatac ctttgagggt acccgcgtcc atctggtcag aaaacacgat 6300
ctttttattg tccagcttgg tggcgaacga cccgtagagg gcgttggaga gcagcttggc 6360
gatggagcgc agggtctggt tcttgtccct gtcggcgcgc tccttggccg cgatgttgag 6420
ctgcacgtac tcgcgcgcga cgcagcgcca ctcggggaag acggtggtgc gctcgtcggg 6480
caccaggcgc acgcgccagc cgcggttgtg cagggtgacc aggtccacgc tggtggcgac 6540
ctcgccgcgc aggcgctcgt tggtccagca gagacggccg cccttgcgcg agcagaaggg 6600
gggcaggggg tcgagctggg tctcgtccgg ggggtccgcg tccacggtga aaaccccggg 6660
gcgcaggcgc gcgtcgaagt agtctatctt gcaaccttgc atgtccagcg cctgctgcca 6720
gtcgcgggcg gcgagcgcgc gctcgtaggg gttgagcggc gggccccagg gcatggggtg 6780
ggtgagtgcg gaggcgtaca tgccgcagat gtcatagacg tagaggggct cccgcaggac 6840
cccgatgtag gtggggtagc agcggccgcc gcggatgctg gcgcgcacgt agtcatacag 6900
ctcgtgcgag ggggcgagga ggtcggggcc caggttggtg cgggcggggc gctccgcgcg 6960
gaagacgatc tgcctgaaga tggcatgcga gttggaagag atggtggggc gctggaagac 7020
gttgaagctg gcgtcctgca ggccgacggc gtcgcgcacg aaggaggcgt aggagtcgcg 7080
cagcttgtgt accagctcgg cggtgacctg cacgtcgagc gcgcagtagt cgagggtctc 7140
gcggatgatg tcatatttag cctgcccctt ctttttccac agctcgcggt tgaggacaaa 7200
ctcttcgcgg tctttccagt actcttggat cgggaaaccg tccggttccg aacggtaaga 7260
gcctagcatg tagaactggt tgacggcctg gtaggcgcag cagcccttct ccacggggag 7320
ggcgtaggcc tgcgcggcct tgcggagcga ggtgtgggtc agggcgaagg tgtccctgac 7380
catgactttg aggtactggt gcttgaagtc ggagtcgtcg cagccgcccc gctcccagag 7440
cgagaagtcg gtgcgcttct tggagcgggg gttgggcaga gcgaaggtga catcgttgaa 7500
gaggattttg cccgcgcggg gcatgaagtt gcgggtgatg cggaagggcc ccggcacttc 7560
agagcggttg ttgatgacct gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg 7620gcccacgatg
tagagttcca ggaagcgggg ccggcccttt acggtgggca gcttctttag            7680
ctcttcgtag gtgagctcct cgggcgaggc gaggccgtgc tcggccaggg cccagtccgc 7740
gaggtgcggg ttgtctctga ggaaggactc ccagaggtcg cgggccagga gggtctgcag 7800
gcggtccctg aaggtcctga actggcggcc cacggccatt ttttcggggg tgatgcagta 7860
gaaggtgagg gggtcttgct gccagcggtc ccagtcgagc tgcagggcga ggtcgcgcgc 7920
ggcggtgacc aggcgctcgt cgcccccgaa tttcatgacc agcatgaagg gcacgagctg 7980
ctttccgaag gcccccatcc aagtgtaggt ctctacatcg taggtgacaa agaggcgctc 8040
cgtgcgagga tgcgagccga tcgggaagaa ctggatctcc cgccaccagt tggaggagtg 8100
gctgttgatg tggtggaagt agaagtcccg tcgccgggcc gaacactcgt gctggctttt 8160
gtaaaagcga gcgcagtact ggcagcgctg cacgggctgt acctcctgca cgagatgcac 8220
ctttcgcccg cgcacgagga agccgagggg aaatctgagc cccccgcctg gctcgcggca 8280
tggctggtgc tcttctactt tggatgcgtg tccgtctccg tctggctcct cgaggggtgt 8340
tacggtggag cggaccacca cgccgcgcga gccgcaggtc cagatatcgg cgcgcggcgg 8400
tcggagtttg atgacgacat cgcgcagctg ggagctgtcc atggtctgga gctcccgcgg 8460
cggcggcagg tcagccggga gttcttgcag gttcacctcg cagagtcggg ccagggcgcg 8520
gggcaggtct aggtggtacc tgatctctag gggcgtgttg gtggcggcgt cgatggcttg 8580
caggagcccg catccccggg gggcgacgac ggtgccccgc ggggtggtgg tggtggtggt 8640
ggtggtggtg gtggcggtgc agctcagaag cggtgccgcg ggcgggcccc cggaggtagg 8700
gggggctccg gtcccgccgg caggggcggc agcggcacgt cggcgtggag cgcgggcagg 8760
agttggtgct gtgcccggag gttgctggcg aaggcgacga cgcggcggtt gatctcctgg 8820
atctggcgcc tctgcgtgaa gacgacgggc ccggtgagct tgaacctgaa agagagttcg 8880
acagaatcaa tctcggtgtc attgaccgcg gcctggcgca ggatctcctg cacgtctccc 8940
gagttgtctt ggtaggcgat ctcggccatg aactgctcga tctcttcctc ctggaggtct 9000
ccgcgtccgg cgcgttccac ggtggccgcc aggtcgttgg agatgcgccc catgagctgc 9060
gagaaggcgt tgagtccgcc ctcgttccag actcggctgt agaccacgcc cccctggtca 9120
tcgcgggcgc gcatgaccac ctgcgcgagg ttgagctcca cgtgccgcgc gaagacggcg 9180
tagttgcgca gacgctggaa gaggtagttg agggtggtgg cggtgtgctc ggccacgaag 9240
aagttcatga cccagcggcg caacgtggat tcgttgatgt cccccaaggc ctccagccgt 9300
tccatggcct cgtagaagtc cacggcgaag ttgaaaaact gggagttgcg cgccgacacg 9360
gtcaactcct cctccagaag acggatgagc tcggcgacgg tgtcgcgcac ctcgcgctcg 9420
aaggctatgg ggatctcttc ctccgctagc atcaccacct cctcctcttc ctcctcttct 9480
ggcacttcca tgatggcttc ctcctcttcg gggggcggcg gcggcggcgg tgggggaggg 9540ggcgctctgc
gccggcggcg gcgcaccggg aggcggtcca cgaagcgcgc gatcatctcc            9600
ccgcggcggc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg gcgcagttgg 9660
aagacgccgc cggacatctg gtgctggggc gggtggccgt gaggcagcga aacggcgctg 9720
acgatgcatc tcaacaattg ctgcgtaggt acgccgccga gggacctgag ggagtccata 9780
tccaccggat ccgaaaacct ttcgaggaag gcgtctaacc agtcgcagtc gcaaggtagg 9840
ctgagcaccg tggcgggcgg cggggggtgg ggggagtgtc tggcggaggt gctgctgatg 9900
atgtaattga agtaggcgga cttgacacgg cggatggtcg acaggagcac catgtccttg 9960
ggtccggcct gctggatgcg gaggcggtcg gctatgcccc aggcttcgtt ctggcatcgg 10020
cgcaggtcct tgtagtagtc ttgcatgagc ctttccaccg gcacctcttc tccttcctct 10080
tctgcttctt ccatgtctgc ttcggccctg gggcggcgcc gcgcccccct gccccccatg 10140
cgcgtgaccc cgaaccccct gagcggttgg agcagggcca ggtcggcgac gacgcgctcg 10200
gccaggatgg cctgctgcac ctgcgtgagg gtggtttgga agtcatccaa gtccacgaag 10260
cggtggtagg cgcccgtgtt gatggtgtag gtgcagttgg ccatgacgga ccagttgacg 10320
gtctggtggc ccggttgcga catctcggtg tacctgagtc gcgagtaggc gcgggagtcg 10380
aagacgtagt cgttgcaagt ccgcaccagg tactggtagc ccaccaggaa gtgcggcggc 10440
ggctggcggt agaggggcca gcgcagggtg gcgggggctc cgggggccag gtcttccagc 10500
atgaggcggt ggtaggcgta gatgtacctg gacatccagg tgatacccgc ggcggtggtg 10560
gaggcgcgcg ggaagtcgcg cacccggttc cagatgttgc gcaggggcag aaagtgctcc 10620
atggtaggcg tgctctgtcc agtcagacgc gcgcagtcgt tgatactcta gaccagggaa 10680
aacgaaagcc ggtcagcggg cactcttccg tggtctggtg aatagatcgc aagggtatca 10740
tggcggaggg cctcggttcg agccccgggt ccgggccgga cggtccgcca tgatccacgc 10800
ggttaccgcc cgcgtgtcga acccaggtgt gcgacgtcag acaacggtgg agtgttcctt 10860
ttggcgtttt tctggccggg cgccggcgtc gcgtaagaga ctaagccgcg aaagcgaaag 10920
cagtaagtgg ctcgctcccc gtagccggag ggatccttgc taagggttgc gttgcggcga 10980
accccggttc gaatcccgta ctcgggccgg ccggacccgc ggctaaggtg ttggattggc 11040
ctccccctcg tataaagacc ccgcttgcgg attgactccg gacacgggga cgagcccctt 11100
ttatttttgc tttccccaga tgcatccggt gctgcggcag atgcgccccc cgccccagca 11160
gcagcaacaa caccagcaag agcggcagca acagcagcgg gagtcatgca gggccccctc 11220
acccaccctc ggcgggccgg ccacctcggc gtccgcggcc gtgtctggcg cctgcggcgg 11280
cggcgggggg ccggctgacg accccgagga gcccccgcgg cgcagggcca gacactacct 11340
ggacctggag gagggcgagg gcctggcgcg gctgggggcg ccgtctcccg agcgccaccc 11400
gcgggtgcag ctgaagcgcg actcgcgcga ggcgtacgtg cctcggcaga acctgttcag 11460
ggaccgcgcg ggcgaggagc ccgaggagat gcgggacagg aggttcagcg cagggcggga 11520
gctgcggcag gggctgaacc gcgagcggct gctgcgcgag gaggactttg agcccgacgc 11580
gcggacgggg atcagccccg cgcgcgcgca cgtggcggcc gccgacctgg tgacggcgta 11640
cgagcagacg gtgaaccagg agatcaactt ccaaaagagt ttcaacaacc acgtgcgcac 11700
gctggtggcg cgcgaggagg tgaccatcgg gctgatgcac ctgtgggact ttgtaagcgc 11760
gctggtgcag aaccccaaca gcaagcctct gacggcgcag ctgttcctga tagtgcagca 11820
cagcagggac aacgaggcgt ttagggacgc gctgctgaac atcaccgagc ccgagggtcg 11880
gtggctgctg gacctgatta acatcctgca gagcatagtg gtgcaggagc gcagcctgag 11940
cctggccgac aaggtggcgg ccatcaacta ctcgatgctg agcctgggca agttttacgc 12000
gcgcaagatc taccagacgc cgtacgtgcc catagacaag gaggtgaaga tcgacggttt 12060
ttacatgcgc atggcgctga aggtgctcac cctgagcgac gacctgggcg tgtaccgcaa 12120
cgagcgcatc cacaaggccg tgagcgtgag ccggcggcgc gagctgagcg accgcgagct 12180
gatgcacagc ctgcagcggg cgctggcggg cgccggcagc ggcgacaggg aggcggagtc 12240
ctacttcgat gcgggggcgg acctgcgctg ggcgcccagc cggcgggccc tggaggccgc 12300
gggggtccgc gaggactatg acgaggacgg cgaggaggat gaggagtacg agctagagga 12360
gggcgagtac ctggactaaa ccgcgggtgg tgtttccggt agatgcaaga cccgaacgtg 12420
gtggacccgg cgctgcgggc ggctctgcag agccagccgt ccggccttaa ctcctcagac 12480
gactggcgac aggtcatgga ccgcatcatg tcgctgacgg cgcgtaaccc ggacgcgttc 12540
cggcagcagc cgcaggccaa caggctctcc gccatcctgg aggcggtggt gcctgcgcgc 12600
tcgaacccca cgcacgagaa ggtgctggcc atagtgaacg cgctggccga gaacagggcc 12660
atccgcccgg acgaggccgg gctggtgtac gacgcgctgc tgcagcgcgt ggcccgctac 12720
aacagcggca acgtgcagac caacctggac cggctggtgg gggacgtgcg cgaggcggtg 12780
gcgcagcgcg agcgcgcgga tcggcagggc aacctgggct ccatggtggc gctgaatgcc 12840
ttcctgagca cgcagccggc caacgtgccg cgggggcagg aagactacac caactttgtg 12900
agcgcgctgc ggctgatggt gaccgagacc ccccagagcg aggtgtacca gtcgggcccg 12960
gactacttct tccagaccag cagacagggc ctgcagacgg tgaacctgag ccaggctttc 13020
aagaacctgc gggggctgtg gggcgtgaag gcgcccaccg gcgaccgggc gacggtgtcc 13080
agcctgctga cgcccaactc gcgcctgctg ctgctgctga tcgcgccgtt cacggacagc 13140
ggcagcgtgt cccgggacac ctacctgggg cacctgctga ccctgtaccg cgaggccatc 13200
gggcaggcgc aggtggacga gcacaccttc caggagatca ccagcgtgag ccgcgcgctg 13260
gggcaggagg acacgagcag cctggaggcg actctgaact acctgctgac caaccggcgg 13320
cagaagattc cctcgctgca cagcctgacc tccgaggagg agcgcatctt gcgctacgtg 13380
cagcagagcg tgagcctgaa cctgatgcgc gacggggtga cgcccagcgt ggcgctggac 13440
atgaccgcgc gcaacatgga accgggcatg tacgccgcgc accggcctta catcaaccgc 13500
ctgatggact acctgcatcg cgcggcggcc gtgaaccccg agtactttac caacgccatc 13560
ctgaacccgc actggctccc gccgcccggg ttctacagcg ggggcttcga ggtcccggag 13620
gccaacgatg gcttcctgtg ggacgacatg gacgacagcg tgttctcccc gcggccgcag 13680
gcgctggcgg aagcgtccct gctgcgtccc aagaaggagg aggaggaggc gagtcgccgc 13740
cgcggcagca gcggcgtggc ttctctgtcc gagctggggg cggcagccgc cgcgcgcccc 13800
gggtccctgg gcggcagccc ctttccgagc ctggtggggt ctctgcacag cgagcgcacc 13860
acccgccctc ggctgctggg cgaggacgag tacctgaata actccctgct gcagccggtg 13920
cgggagaaaa acctgccccc cgccttcccc aacaacggga tagagagcct ggtggacaag 13980
atgagcagat ggaagaccta tgcgcaggag cacagggacg cgcccgcgct ccggccgccc 14040
acgcggcgcc agcgccacga ccggcagcgg gggctggtgt gggatgacga ggactccgcg 14100
gacgatagca gcgtgctgga cctgggaggg agcggcaacc cgttcgcgca cctgcgcccc 14160
cgcctgggga ggatgtttta aaaaaaaaaa aagcaagaag catgatgcaa aattaaataa 14220
aactcaccaa ggccatggcg accgagcgtt ggtttcttgt  gttcccttca gtatgcggcg 14280
cgcggcgatg taccaggagg gacctcctcc ctcttacgag agcgtggtgg gcgcggcggc 14340
ggcggcgccc tcttctccct ttgcgtcgca gctgctggag ccgccgtacg tgcctccgcg 14400
ctacctgcgg cctacggggg ggagaaacag catccgttac tcggagctgg cgcccctgtt 14460
cgacaccacc cgggtgtacc tggtggacaa caagtcggcg gacgtggcct ccctgaacta 14520
ccagaacgac cacagcaatt ttttgaccac ggtcatccag aacaatgact acagcccgag 14580
cgaggccagc acccagacca tcaatctgga tgaccggtcg cactggggcg gcgacctgaa 14640
aaccatcctg cacaccaaca tgcccaacgt gaacgagttc atgttcacca ataagttcaa 14700
ggcgcgggtg atggtgtcgc gctcgcacac caaggaagac cgggtggagc tgaagtacga 14760
gtgggtggag ttcgagctgc cagagggcaa ctactccgag accatgacca ttgacctgat 14820
gaacaacgcg atcgtggagc actatctgaa agtgggcagg caaaacgggg tcctggagag 14880
cgacatcggg gtcaagttcg acaccaggaa cttccgcctg gggctggacc ccgtgaccgg 14940
gctggttatg cccggggtgt acaccaacga ggccttccat cccgacatca tcctgctgcc 15000
cggctgcggg gtggacttca cttacagccg cctgagcaac ctcctgggca tccgcaagcg 15060
gcagcccttc caggagggct tcaggatcac ctacgaggac ctggaggggg gcaacatccc 15120
cgcgctcctc gatgtggagg cctaccagga tagcttgaag gaaaatgagg cgggacagga 15180
ggataccacc cccgccgcct ccgccgccgc cgagcagggc gaggatgctg ctgacaccgc 15240
ggccgcggac ggggcagagg ccgaccccgc tatggtggtg gaggctcccg agcaggagga 15300
ggatatgaat gacagtgcgg tgcgcggaga caccttcgtc acccgggggg aggaaaagca 15360
agcggaggcc gaggccgcgg ccgaggaaaa gcaactggcg gcagcagcgg cggcggcggc 15420
gttggccgcg gcggaggctg agtctgaggg gaccaagccc gccaaggagc ccgtgattaa 15480
gcccctgacc gaagatagca agaagcgcag ttacaacctg ctcaaggaca gcaccaacac 15540
cgcgtaccgc agctggtacc tggcctacaa ctacggcgac ccgtcgacgg gggtgcgctc 15600
ctggaccctg ctgtgcacgc cggacgtgac ctgcggctcg gagcaggtgt actggtcgct 15660
gcccgacatg atgcaagacc ccgtgacctt ccgctccacg cggcaggtca gcaacttccc 15720
ggtggtgggc gccgagctgc tgcccgtgca ctccaagagc ttctacaacg accaggccgt 15780
ctactcccag ctcatccgcc agttcacctc tctgacccac gtgttcaatc gctttcctga 15840
gaaccagatt ctggcgcgcc cgcccgcccc caccatcacc accgtcagtg aaaacgttcc 15900
tgctctcaca gatcacggga cgctaccgct gcgcaacagc atcggaggag tccagcgagt 15960
gaccgttact gacgccagac gccgcacctg cccctacgtt tacaaggcct tgggcatagt 16020
ctcgccgcgc gtcctttcca gccgcacttt ttgagcaaca ccaccatcat gtccatcctg 16080
atctcaccca gcaataactc cggctgggga ctgctgcgcg cgcccagcaa gatgttcgga 16140
ggggcgagga agcgttccga gcagcacccc gtgcgcgtgc gcgggcactt ccgcgccccc 16200
tggggagcgc acaaacgcgg ccgcgcgggg cgcaccaccg tggacgacgc catcgactcg 16260
gtggtggagc aggcgcgcaa ctacaggccc gcggtctcta ccgtggacgc ggccatccag 16320
accgtggtgc ggggcgcgcg gcggtacgcc aagctgaaga gccgccggaa gcgcgtggcc 16380
cgccgccacc gccgccgacc cggggccgcc gccaaacgcg ccgccgcggc cctgcttcgc 16440
cgggccaagc gcacgggccg ccgcgccgcc atgagggccg cgcgccgctt ggccgccggc 16500
atcaccgccg ccaccatggc cccccgtacc cgaagacgcg cggccgccgc cgccgccgcc 16560
gccatcagtg acatggccag caggcgccgg ggcaacgtgt actgggtgcg cgactcggtg 16620
accggcacgc gcgtgcccgt gcgcttccgc cccccgcgga cttgagatga tgtgaaaaaa 16680
caacactgag tctcctgctg ttgtgtgtat cccagcggcg gcggcgcgcg cagcgtcatg 16740
tccaagcgca aaatcaaaga agagatgctc caggtcgtcg cgccggagat ctatgggccc 16800
ccgaagaagg aagagcagga ttcgaagccc cgcaagataa agcgggtcaa aaagaaaaag 16860
aaagatgatg acgatgccga tggggaggtg gagttcctgc gcgccacggc gcccaggcgc 16920
ccggtgcagt ggaagggccg gcgcgtaaag cgcgtcctgc gccccggcac cgcggtggtc 16980
ttcacgcccg gcgagcgctc cacccggact ttcaagcgcg tctatgacga ggtgtacggc 17040
gacgaagacc tgctggagca ggccaacgag cgcttcggag agtttgctta cgggaagcgt 17100
cagcgggcgc tggggaagga ggacctgctg gcgctgccgc tggaccaggg caaccccacc 17160
cccagtctga agcccgtgac cctgcagcag gtgctgccga gcagcgcacc ctccgaggcg 17220
aagcggggtc tgaagcgcga gggcggcgac ctggcgccca ccgtgcagct catggtgccc 17280
aagcggcaga ggctggagga tgtgctggag aaaatgaaag tagaccccgg tctgcagccg 17340
gacatcaggg tccgtcccat caagcaggtg gcgccgggcc tcggcgtgca gaccgtggac 17400
gtggtcatcc ccaccggcaa ctcccccgcc gccaccacca ctaccgctgc ctccacggac 17460
atggagacac agaccgatcc cgccgcagcc gcagccgccg ccgcagccgc gacctcctcg 17520
gcggaggtgc agacggaccc ctggctgccg ccggcgatgt cagctccccg cgcgcgccgc 17580
ggacgcagaa agtacggcgc cgccaacgcg ctcctgcccg agtacgcctt gcatccttcc 17640
atcgcgccca cccccggcta ccgaggctat acctaccgcc cgcgaagagc caagggttcc 17700
acccgccgtc cccgccgacg cgccgccgcc accacccgcc gccgccgccg cagacgccag 17760
cccgcactgg ctccagtctc cgtgaggaga gtggcgcgcg acggacacac cctggtgctg 17820
cccagggcgc gctaccaccc cagcatcgtt taaaagcctg ttgtggttct tgcagatatg 17880
gccctcactt gccgcctccg tttcccggtg ccgggatacc gaggaggaag atcgcgccgc 17940
aggaggggtc tggccggccg cggcctgagc ggaggcagcc gccgcgcgca ccggcggcga 18000
cgcgccacca gccgacgcat gcgcggcggg gtgctgcccc tgttaatccc cctgatcgcc 18060
gcggcgatcg gcgccgtgcc cgggatcgcc tccgtggcct tgcaagcgtc ccagaggcat 18120
tgacagactt gcaaacttgc aaatatggaa aaaaaaaaaa aaccccaata aaaagtctag 18180
actctcacgc tcgcttggtc ctgtgactat tttgtagaat ggaagacatc aactttgcgt 18240
cgctggcccc gcgtcacggc tcgcgcccgt tcctgggaca ctggaacgat atcggcacca 18300
gcaacatgag cggtggcgcc ttcagttggg gctctctgtg gagcggcatt aaaagtatcg 18360
ggtctgccgt taaaaattac ggctcccggg cctggaacag cagcacgggc cagatgttga 18420
gagacaagtt gaaagagcag aacttccagc agaaggtggt ggagggcctg gcctccggca 18480
tcaacggggt ggtggacctg gccaaccagg ccgtgcagaa taaaatcaac agcagactgg 18540
acccccggcc gccggtggag gaggtgccgc cggcgctgga gacggtgtcc cccgatgggc 18600
gtggcgagaa gcgcccgcgg cccgataggg aagagaccac tctggtcacg cagaccgatg 18660
agccgccccc gtatgaggag gccctaaagc aaggtctgcc caccacgcgg cccatcgcgc 18720
ccatggccac cggggtggtg ggccgccaca cccccgccac gctggacttg cctccgcccg 18780
ccgatgtgcc gcagcagcag aaggcggcac agccgggccc gcccgcgacc gcctcccgtt 18840
cctccgccgg tcctctgcgc cgcgcggcca gcggcccccg cgggggggtc gcgaggcacg 18900
gcaactggca gagcacgctg aacagcatcg tgggtctggg ggtgcggtcc gtgaagcgcc 18960
gccgatgcta ctgaatagct tagctaacgt gttgtatgtg tgtatgcgcc ctatgtcgcc 19020
gccagaggag ctgctgagtc gccgccgttc gcgcgcccac caccaccgcc actccgcccc 19080
tcaagatggc gaccccatcg atgatgccgc agtggtcgta catgcacatc tcgggccagg 19140
acgcctcgga gtacctgagc cccgggctgg tgcagttcgc ccgcgccacc gagagctact 19200
tcagcctgag taacaagttt aggaacccca cggtggcgcc cacgcacgat gtgaccaccg 19260
accggtctca gcgcctgacg ctgcggttca ttcccgtgga ccgcgaggac accgcgtact 19320
cgtacaaggc gcggttcacc ctggccgtgg gcgacaaccg cgtgctggac atggcctcca 19380
cctactttga catccgcggg gtgctggacc ggggtcccac tttcaagccc tactctggca 19440
ccgcctacaa ctccctggcc cccaagggcg ctcccaactc ctgcgagtgg gagcaagagg 19500
aaactcaggc agttgaagaa gcagcagaag aggaagaaga agatgctgac ggtcaagctg 19560
aggaagagca agcagctacc aaaaagactc atgtatatgc tcaggctccc ctttctggcg 19620
aaaaaattag taaagatggt ctgcaaatag gaacggacgc tacagctaca gaacaaaaac 19680
ctatttatgc agaccctaca ttccagcccg aaccccaaat cggggagtcc cagtggaatg 19740
aggcagatgc tacagtcgcc ggcggtagag tgctaaagaa atctactccc atgaaaccat 19800
gctatggttc ctatgcaaga cccacaaatg ctaatggagg tcagggtgta ctaacggcaa 19860
atgcccaggg acagctagaa tctcaggttg aaatgcaatt cttttcaact tctgaaaacg 19920
cccgtaacga ggctaacaac attcagccca aattggtgct gtatagtgag gatgtgcaca 19980
tggagacccc ggatacgcac ctttcttaca agcccgcaaa aagcgatgac aattcaaaaa 20040
tcatgctggg tcagcagtcc atgcccaaca gacctaatta catcggcttc agagacaact 20100
ttatcggcct catgtattac aatagcactg gcaacatggg agtgcttgca ggtcaggcct 20160
ctcagttgaa tgcagtggtg gacttgcaag acagaaacac agaactgtcc taccagctct 20220
tgcttgattc catgggtgac agaaccagat acttttccat gtggaatcag gcagtggaca 20280
gttatgaccc agatgttaga attattgaaa atcatggaac tgaagacgag ctccccaact 20340
attgtttccc tctgggtggc ataggggtaa ctgacactta ccaggctgtt aaaaccaaca 20400
atggcaataa cgggggccag gtgacttgga caaaagatga aacttttgca gatcgcaatg 20460
aaataggggt gggaaacaat ttcgctatgg agatcaacct cagtgccaac ctgtggagaa 20520
acttcctgta ctccaacgtg gcgctgtacc taccagacaa gcttaagtac aacccctcca 20580
atgtggacat ctctgacaac cccaacacct acgattacat gaacaagcga gtggtggccc 20640
cggggctggt ggactgctac atcaacctgg gcgcgcgctg gtcgctggac tacatggaca 20700
acgtcaaccc cttcaaccac caccgcaatg cgggcctgcg ctaccgctcc atgctcctgg 20760
gcaacgggcg ctacgtgccc ttccacatcc aggtgcccca gaagttcttt gccatcaaga 20820
acctcctcct cctgccgggc tcctacacct acgagtggaa cttcaggaag gatgtcaaca 20880
tggtcctcca gagctctctg ggtaacgatc tcagggtgga cggggccagc atcaagttcg 20940
agagcatctg cctctacgcc accttcttcc ccatggccca caacacggcc tccacgctcg 21000
aggccatgct caggaacgac accaacgacc agtccttcaa tgactacctt tccgccgcca 21060
acatgctcta ccccataccc gccaacgcca ccaacgtccc catctccatc ccctcgcgca 21120
actgggcggc cttccgcggc tgggccttca cccgcctcaa gaccaaggag accccctccc 21180
tgggctcggg attcgacccc tactacacct actcgggctc tattccctac ctggacggca 21240
ccttctacct caaccacact ttcaagaagg tctcggtcac cttcgactcc tcggtcagct 21300
ggccgggcaa cgaccgtctg ctcaccccca acgagttcga gatcaagcgc tcggtcgacg 21360
gggaaggcta caacgtggcc cagtgcaaca tgaccaagga ctggttcctg gtccagatgc 21420
tggccaacta caacatcggc taccagggct tctacatccc agagagctac aaggacagga 21480
tgtactcctt cttcaggaac ttccagccca tgagccggca ggtggtggac cagaccaagt 21540
acaaggacta ccaggaggtg ggcatcatcc accagcacaa caactcgggc ttcgtgggct 21600
acctcgcccc caccatgcgc gagggacagg cctaccccgc caacttcccc tacccgctca 21660
taggcaagac cgcggtcgac agcatcaccc agaaaaagtt cctctgcgac cgcaccctct 21720
ggcgcatccc cttctccagc aacttcatgt ccatgggtgc gctctcggac ctgggccaga 21780
acttgctcta cgccaactcc gcccacgccc tcgacatgac cttcgaggtc gaccccatgg 21840
acgagcccac ccttctctat gttctgttcg aagtctttga cgtggtccgg gtccaccagc 21900
cgcaccgcgg cgtcatcgag accgtgtacc tgcgtacgcc cttctcggcc ggcaacgcca 21960ccacctaaag
aagcaagccg cagtcatcgc cgcctgcatg ccgtcgggtt ccaccgagca            22020
agagctcagg gccatcgtca gagacctggg atgcgggccc tattttttgg gcaccttcga 22080
caagcgcttc cctggctttg tctccccaca caagctggcc tgcgccatcg tcaacacggc 22140
cggccgcgag accgggggcg tgcactggct ggcctttgcc tggaacccgc gctccaaaac 22200
atgcttcctc tttgacccct tcggcttttc ggaccagcgg ctcaagcaaa tctacgagtt 22260
cgagtacgag ggcttgctgc gtcgcagcgc catcgcctcc tcgcccgacc gctgcgtcac 22320
cctcgaaaag tccacccaga ccgtgcaggg gcccgactcg gccgcctgcg gtctcttctg 22380
ctgcatgttt ctgcacgcct ttgtgcactg gcctcagagt cccatggacc gcaaccccac 22440
catgaacttg ctgacggggg tgcccaactc catgctccaa agcccccagg tcgagcccac 22500
cctgcgccgc aaccaggagc agctctacag cttcctggag cgccactcgc cctacttccg 22560
ccgccacagc gcacagatca ggagggccac ctccttctgc cacttgcaag agatgcaaga 22620
agggtaataa cgatgtacac acttttttct caataaatgg catttttttt ttatttatac 22680
aagctctctg gggtattcat ttcccaccac caccacccgc cgttgtcgcc atctggctct 22740
atttagaaat cgaaagggtt ctgccgggag tcgccgtgcg ccacgggcag ggacacgttg 22800
cgatactggt agcgggtgcc ccacttgaac tcgggcacca ccaggcgagg cagctcgggg 22860
aagttttcgc tccacaggct gcgggtcagc accagcgcgt tcatcaggtc gggcgccgag 22920
atcttgaagt cgcagttggg gccgccgccc tgcgcgcgcg agttgcggta caccgggttg 22980
cagcactgga acaccaacag cgccgggtgc ttcacgctgg ccagcacgct gcggtcggag 23040
atcagctcgg cgtccaggtc ctccgcgttg ctcagcgcga acggggtcat cttgggcact 23100
tgccgcccca ggaagggcgc gtgccccggt ttcgagttgc agtcgcagcg cagcgggatc 23160
agcaggtgcc cgtgcccgga ctcggcgttg gggtacagcg cgcgcatgaa ggcctgcatc 23220
tggcggaagg ccatctgggc cttggcgccc tccgagaaga acatgccgca ggacttgccc 23280
gagaactggt ttgcggggca gctggcgtcg tgcaggcagc agcgcgcgtc ggtgttggcg 23340
atctgcacca cgttgcgccc ccaccggttc ttcacgatct tggccttgga cgattgctcc 23400
ttcagcgcgc gctgcccgtt ctcgctggtc acatccatct cgatcacatg ttccttgttc 23460
accatgctgc tgccgtgcag acacttcagc tcgccctccg tctcggtgca gcggtgctgc 23520
cacagcgcgc agcccgtggg ctcgaaagac ttgtaggtca cctccgcgaa ggactgcagg 23580
tacccctgca aaaagcggcc catcatggtc acgaaggtct tgttgctgct gaaggtcagc 23640
tgcagcccgc ggtgctcctc gttcagccag gtcttgcaca cggccgccag cgcctccacc 23700
tggtcgggca gcatcttgaa gttcaccttc agctcattct ccacgtggta cttgtccatc 23760
agcgtgcgcg ccgcctccat gcccttctcc caggccgaca ccagcggcag gctcacgggg 23820
ttcttcacca tcaccgtggc cgccgcctcc gccgcgcttt cgctttccgc cccgctgttc 23880
tcttcctctt cctcctcttc ctcgccgccg cccactcgca gcccccgcac cacggggtcg 23940
tcttcctgca ggcgctgcac cttgcgcttg ccgttgcgcc cctgcttgat gcgcacgggc 24000
gggttgctga agcccaccat caccagcgcg gcctcttctt gctcgtcctc gctgtccaga 24060
atgacctccg gggagggggg gttggtcatc ctcagtaccg aggcacgctt ctttttcttc 24120
ctgggggcgt tcgccagctc cgcggctgcg gccgctgccg aggtcgaagg ccgagggctg 24180
ggcgtgcgcg gcaccagcgc gtcttgcgag ccgtcctcgt cctcctcgga ctcgagacgg 24240
aggcgggccc gcttcttcgg gggcgcgcgg ggcggcggag gcggcggcgg cgacggagac 24300
ggggacgaga catcgtccag ggtgggtgga cggcgggccg cgccgcgtcc gcgctcgggg 24360
gtggtttcgc gctggtcctc ttcccgactg gccatctccc actgctcctt ctcctatagg 24420
cagaaagaga tcatggagtc tctcatgcga gtcgagaagg aggaggacag cctaaccgcc 24480
ccctctgagc cctccaccac cgccgccacc accgccaatg ccgccgcgga cgacgcgccc 24540
accgagacca ccgccagtac caccctcccc agcgacgcac ccccgctcga gaatgaagtg 24600
ctgatcgagc aggacccggg ttttgtgagc ggagaggagg atgaggtgga tgagaaggag 24660
aaggaggagg tcgccgcctc agtgccaaaa gaggataaaa agcaagacca ggacgacgca 24720
gataaggatg agacagcagt cgggcggggg aacggaagcc atgatgctga tgacggctac 24780
ctagacgtgg gagacgacgt gctgcttaag cacctgcacc gccagtgcgt catcgtctgc 24840
gacgcgctgc aggagcgctg cgaagtgccc ctggacgtgg cggaggtcag ccgcgcctac 24900
gagcggcacc tcttcgcgcc gcacgtgccc cccaagcgcc gggagaacgg cacctgcgag 24960
cccaacccgc gtctcaactt ctacccggtc ttcgcggtac ccgaggtgct ggccacctac 25020
cacatcttct tccaaaactg caagatcccc ctctcctgcc gcgctaaccg cacccgcgcc 25080
gacaaaaccc tgaccctgcg gcagggcgcc cacatacctg atattgcctc tctggaggaa 25140
gtgcccaaga tcttcgaggg tctcggtcgc gacgagaaac gggcggcgaa cgctctgcac 25200
ggagacagcg aaaacgagag tcactcgggg gtgctggtgg agctcgaggg cgacaacgcg 25260
cgcctggccg tactcaagcg cagcatagag gtcacccact ttgcctaccc ggcgctcaac 25320
ctgcccccca aggtcatgag tgtggtcatg ggcgagctca tcatgcgccg cgctcagccc 25380
ctggccgcgg atgcaaactt gcaagagtcc tccgaggaag gcctgcccgc ggtcagcgac 25440
gagcagctag cgcgctggct ggagacccgc gaccccgcgc agctggagga gcggcgcaag 25500
ctcatgatgg ccgcggtgct ggtcaccgtg gagctcgagt gtctgcagcg cttcttcgcg 25560
gaccccgaga tgcagcgcaa gctcgaggag accctgcact acaccttccg ccagggctac 25620
gtgcgccagg cctgcaagat ctccaacgtg gagctctgca acctggtctc ctacctgggc 25680
atcctgcacg agaaccgcct cgggcagaac gtcctgcact ccaccctcaa aggggaggcg 25740
cgccgcgact acatccgcga ctgcgcctac ctcttcctct gctacacctg gcagacggcc 25800
atgggggtct ggcagcagtg cctggaggag cgcaacctca aggagctgga aaagctactc 25860
aagcgcaccc tcagggacct ctggacgggc ttcaacgagc gctcggtggc cgccgcgctg 25920
gcggacatca tcttccccga gcgcctgctc aagaccctgc agcagggcct gcccgacttc 25980
accagccaga gcatgctgca gaactttagg actttcatcc tggagcgctc gggcatcctg 26040
cctgccactt gctgcgcgct gcccagcgac ttcgtgccca tcaagtacag ggagtgcccg 26100
ccgccgctct ggggccactg ctacctcttc cagctggcca actacctcgc ctaccactcg 26160
gacctcatgg aagacgtgag cggcgagggc ctgctcgagt gccactgccg ctgcaacctc 26220
tgcacgcccc accgctctct agtctgcaac ccgcagctgc tcagcgagag tcagattatc 26280
ggtaccttcg agctgcaggg tccctcgcct gacgagaagt ccgcggctcc ggggctgaaa 26340
ctcactccgg ggctgtggac ttccgcctac ctacgcaaat ttgtacctga ggactaccac 26400
gcccacgaga tcaggttcta cgaagaccaa tcccgcccgc ccaaggcgga gctcaccgcc 26460
tgcgtcatca cccaggggca catcctgggc caattgcaag ccatcaacaa agcccgccga 26520
gagttcttgc tgaaaaaggg tcggggggtg tacctggacc cccagtccgg cgaggagcta 26580
aacccgctac ccccgccgcc gccccagcag cgggaccttg cttcccagga tggcacccag 26640
aaagaagcag cagccgccgc cgccgcagcc atacatgctt ctggaggaag aggaggagga 26700
ctgggacagt caggcagagg aggtttcgga cgaggagcag gaggagatga tggaagactg 26760
ggaggaggac agcagcctag acgaggaagc ttcagaggcc gaagaggtgg cagacgcaac 26820
accatcaccc tcggtcgcag ccccctcgcc ggggcccctg aaatcctccg aacccagcac 26880
cagcgctata acctccgctc ctccggcgcc ggcgccaccc gcccgcagac ccaaccgtag 26940
atgggacacc acaggaaccg gggtcggtaa gtccaagtgc ccgccgccgc caccgcagca 27000
gcagcagcag cgccagggct accgctcgtg gcgcgggcac aagaacgcca tagtcgcctg 27060
cttgcaagac tgcgggggca acatctcttt cgcccggcgc ttcctgctat tccaccacgg 27120
ggtcgccttt ccccgcaatg tcctgcatta ctaccgtcat ctctacagcc cctactgcag 27180
cggcgaccca gaggcggcag cggcagccac agcggcgacc accacctagg aagatatcct 27240
ccgcgggcaa gacagcggca gcagcggcca ggagacccgc ggcagcagcg gcgggagcgg 27300
tgggcgcact gcgcctctcg cccaacgaac ccctctcgac ccgggagctc agacacagga 27360
tcttccccac tttgtatgcc atcttccaac agagcagagg ccaggagcag gagctgaaaa 27420
taaaaaacag atctctgcgc tccctcaccc gcagctgtct gtatcacaaa agcgaagatc 27480
agcttcggcg cacgctggag gacgcggagg cactcttcag caaatactgc gcgctcactc 27540
ttaaagacta gctccgcgcc cttctcgaat ttaggcggga gaaaactacg tcatcgccgg 27600
ccgccgccca gcccgcccag ccgagatgag caaagagatt cccacgccat acatgtggag 27660
ctaccagccg cagatgggac tcgcggcggg agcggcccag gactactcca cccgcatgaa 27720
ctacatgagc gcgggacccc acatgatctc acaggtcaac gggatccgcg cccagcgaaa 27780
ccaaatactg ctggaacagg cggccatcac cgccacgccc cgccataatc tcaacccccg 27840
aaattggccc gccgccctcg tgtaccagga aaccccctcc gccaccaccg tactacttcc 27900
gcgtgacgcc caggccgaag tccagatgac taactcaggg gcgcagctcg cgggcggctt 27960
tcgtcacggg gcgcggccgc tccgaccagg tataagacac ctgatgatca gaggccgagg 28020
tatccagctc aacgacgagt cggtgagctc ttcgctcggt ctccgtccgg acggaacttt 28080
ccagctcgcc ggatccggcc gctcttcgtt cacgccccgc caggcgtacc tgactctgca 28140
gacctcgtcc tcggagcccc gctccggagg catcggaacc ctccagttcg tggaggagtt 28200
cgtgccctcg gtctacttca accccttctc gggacctccc ggacgctacc ccgaccagtt 28260
cattccgaac tttgacgcgg tgaaggactc ggcggacggc tacgactgaa tgtcaggtgc 28320
cgaggcagag cagcttcgcc tgagacacct cgagcactgc cgccgccaca agtgcttcgc 28380
ccgcggttcc ggtgagttct gctactttca gctacccgag gagcataccg aggggccggc 28440
gcacggcgtc cgcctgacca cccagggcga ggttacctgt tccctcatcc gggagttcac 28500
cctccgtccc ctgctagtgg agcgggagcg gggtccctgt gtcctaacta tcgcctgcaa 28560
ctgccctaac cctggattac atcaagatct ttgctgtcat ctctgtgctg agtttaataa 28620
acgctgagat cagaatctac tggggctcct gtcgccatcc tgtgaacgcc accgtcttca 28680
cccaccccga ccaggcccag gcgaacctca cctgcggtct gcatcggagg gccaagaagt 28740
acctcacctg gtacttcaac ggcaccccct ttgtggttta caacagcttc gacggggacg 28800
gagtctccct gaaagaccag ctctccggtc tcagctactc catccacaag aacaccaccc 28860
tccaactctt ccctccctac ctgccgggaa cctacgagtg cgtcaccggc cgctgcaccc 28920
acctcacccg cctgatcgta aaccagagct ttccgggaac agataactcc ctcttcccca 28980
gaacaggagg tgagctcagg aaactccccg gggaccaggg cggagacgta ccttcgaccc 29040
ttgtggggtt aggatttttt attaccgggt tgctggctct tttaatcaaa gcttccttga 29100
gatttgttct ttccttctac gtgtatgaac acctcagcct ccaataactc taccctttct 29160
tcggaatcag gtgacttctc tgaaatcggg cttggtgtgc tgcttactct gttgattttt 29220
ttccttatca tactcagcct tctgtgcctc aggctcgccg cctgctgcgc acacatctat 29280
atctactgct ggttgctcaa gtgcaggggt cgccacccaa gatgaacagg tacatggtcc 29340
tatcgatcct aggcctgctg gccctggcgg cctgcagcgc cgccaaaaaa gagattacct 29400
ttgaggagcc cgcttgcaat gtaactttca agcccgaggg tgaccaatgc accaccctcg 29460
tcaaatgcgt taccaatcat gagaggctgc gcatcgacta caaaaacaaa actggccagt 29520
ttgcggtcta tagtgtgttt acgcccggag acccctctaa ctactctgtc accgtcttcc 29580
agggcggaca gtctaagata ttcaattaca ctttcccttt ttatgagtta tgcgatgcgg 29640
tcatgtacat gtcaaaacag tacaacctgt ggcctccctc tccccaggcg tgtgtggaaa 29700
atactgggtc ttactgctgt atggctttgg caatcactac gctcgctcta atctgcacgg 29760
tgctatacat aaaattcagg cagaggcgaa tctttatcga tgaaaagaaa atgccttgat 29820
cgctaacacc ggctttctat ctgcagaatg aatgcaatca cctccctact aatcaccacc 29880
accctccttg cgattgccca tgggttgaca cgaatcgaag tgccagtggg gtccaatgtc 29940
accatggtgg gccccgccgg caattccacc ctcatgtggg aaaaatttgt ccgcaatcaa 30000
tgggttcatt tctgctctaa ccgaatcagt atcaagccca gagccatctg cgatgggcaa 30060
aatctaactc tgatcaatgt gcaaatgatg gatgctgggt actattacgg gcagcgggga 30120
gaaatcatta attactggcg accccacaag gactacatgc tgcatgtagt cgaggcactt 30180
cccactacca cccccactac cacctctccc accaccacta ccaccactac tactactact 30240
actaccacta ccgctgcccg ccatacccgc aaaagcacca tgattagcac aaagccccct 30300
cgtgctcact cccacgccgg cgggcccatc ggtgcgacct cagaaaccac cgagctttgc 30360
ttctgccaat gcactaacgc cagcgctcat gaactgttcg acctggagaa tgaggatgcc 30420
cagcagagct ccgcttgcct gacccaggag gctgtggagc ccgttgccct gaagcagatc 30480
ggtgattcaa taattgactc ttcttctttt gccactcccg aataccctcc cgattctact 30540
ttccacatca cgggtaccaa agaccctaac ctctctttct acctgatgct gctgctctgt 30600
atctctgtgg tctcttccgc gctgatgtta ctggggatgt tctgctgcct gatctgccgc 30660
agaaagagaa aagctcgctc tcagggccaa ccactgatgc ccttccccta ccccccggat 30720
tttgcagata acaagatatg agctcgctgc tgacactaac cgctttacta gcctgcgctc 30780
taacccttgt cgcttgcgac tcgagattcc acaatgtcac agctgtggca ggagaaaatg 30840
ttactttcaa ctccacggcc gatacccagt ggtcgtggag tggctcaggt agctacttaa 30900
ctatctgcaa tagctccact tcccccagca tatccccaac caagtaccaa tgcaatgcca 30960
gcctgttcac cctcatcaac gcttccaccc tggacaatgg actctatgta ggctatgtac 31020
cctttggtgg gcaaggaaag acccacgctt acaacctgga agttcgccag cccagaacca 31080
ctacccaagc ttctcccacc accaccacca ccaccaccac caccatcacc agcagcagca 31140
gcagccacag cagcagcagc agattattga ctttggtttt ggccagctca tctgccgcta 31200
cccaggccat ctacagctct gtgcccgaaa ccactcagat ccaccgccca gaaacgacca 31260
ccgccaccac cctacacacc tccagcgatc agatgccgac caacatcacc cccttggctc 31320
ttcaaatggg acttacaagc cccactccaa aaccagtgga tgcggccgag gtctccgccc 31380
tcgtcaatga ctgggcgggg ctgggaatgt ggtggttcgc cataggcatg atggcgctct 31440
gcctgcttct gctctggctc atctgctgcc tccaccgcag gcgagccaga ccccccatct 31500
atagacccat cattgtcctg aaccccgata atgatgggat ccatagattg gatggcctga 31560
aaaacctact tttttctttt acagtatgat aaattgagac atgcctcgca ttttcttgta 31620
catgttcctt ctcccacctt ttctggggtg ttctacgctg gccgctgtgt ctcacctgga 31680
ggtagactgc ctctcaccct tcactgtcta cctgctttac ggattggtca ccctcactct 31740
catctgcagc ctaatcacag taatcatcgc cttcatccag tgcattgatt acatctgtgt 31800
gcgcctcgca tacttcagac accacccgca gtaccgagac aggaacattg cccaacttct 31860
aagactgctc taatcatgca taagactgtg atctgccttc tgatcctctg catcctgccc 31920
accctcacct cctgccagta caccacaaaa tctccgcgca aaagacatgc ctcctgccgc 31980
ttcacccaac tgtggaatat acccaaatgc tacaacgaaa agagcgagct ctccgaagct 32040
tggctgtatg gggtcatctg tgtcttagtt ttctgcagca ctgtctttgc cctcatgatc 32100
tacccctact ttgatttggg atggaacgcg atcgatgcca tgaattaccc cacctttccc 32160
gcacccgaga taattccact gcgacaagtt gtacccgttg tcgttaatca acgcccccca 32220
tcccctacgc ccactgaaat cagctacttt aacctaacag gcggagatga ctgacgccct 32280
agatctagaa atggacggca tcagtaccga gcagcgtctc ctagagaggc gcaggcaggc 32340
ggctgagcaa gagcgcctca atcaggagct ccgagatctc gttaacctgc accagtgcaa 32400
aagaggcatc ttttgtctgg taaagcaggc caaagtcacc tacgagaaga ccggcaacag 32460
ccaccgcctc agttacaaat tgcccaccca gcgccagaag ctggtgctca tggtgggtga 32520
gaatcccatc accgtcaccc agcactcggt agagaccgag gggtgtctgc actctccctg 32580
tcggggtcca gaagacctct gcaccctggt aaagaccctg tgcggtctca gagatttagt 32640
cccctttaac taatcaaaca ctggaatcaa taaaaagaat cacttactta aaatcagaca 32700
gcaggtctct gtccagttta ttcagcagca cctccttccc ctcctcccaa ctctggtact 32760
ccaaacgcct tctggcggca aacttcctcc acaccctgaa gggaatgtca gattcttgct 32820
cctgtccctc cgcacccact atcttcatgt tgttgcagat gaagcgcacc aaaacgtctg 32880
acgagagctt caaccccgtg tacccctatg acacggaaag cggccctccc tccgtccctt 32940
tcctcacccc tcccttcgtg tctcccgatg gattccaaga aagccccccc ggggtcctgt 33000
ctctgaacct ggccgagccc ctggtcactt cccacggcat gctcgccctg aaaatgggaa 33060
gtggcctctc cctggacgac gctggcaacc tcacctctca agatatcacc accgctagcc 33120
ctcccctcaa aaaaaccaag accaacctca gcctagaaac ctcatccccc ctaactgtaa 33180
gcacctcagg cgccctcacc gtagcagccg ccgctcccct ggcagtggcc ggcacctccc 33240
tcaccatgca atcagaggcc cccctgacag tacaggatgc aaaactcacc ctggccacca 33300
aaggccccct gaccgtgtct gaaggcaaac tggccttgca aacatcggcc ccgctgacgg 33360
ccgctgacag cagcaccctc accgttagcg ccacaccacc aattaatgta agcagtggaa 33420
gtttaggctt agacatggaa gaccctatgt atactcacga tggaaaactg ggaataagaa 33480
ttgggggtcc actaagagta gtagacagct tgcacacact cactgtagtt accggaaatg 33540
gactaactgt agataacaat gccctccaaa ctagagttac gggcgcccta ggttatgaca 33600
catcaggaaa tctacaattg agagctgcag gaggtatgcg aattgatgca aatggccaac 33660
ttatccttaa tgtggcatac ccatttgatg ctcagaacaa tctcagcctt agacttggtc 33720
agggacccct gtatataaac acagaccaca acctggattt gaattgcaac agaggtctaa 33780
ccacaactac caccaacaac acaaaaaaac ttgagactaa aattagctca ggcttagact 33840
atgacaccaa tggtgctgtc attattaaac ttggcactgg tctaagcttc gacaacacag 33900
gcgccctaac tgtgggaaac actggtgatg ataaactgac tctgtggacg accccagacc 33960
catctccaaa ttgcagaatt cactcagaca aagactgcaa gtttactcta gtcctaacta 34020
agtgtggaag ccaaatcctg gcctctgtcg ccgccctagc ggtatcagga aatctggctt 34080
cgataacagg caccgttgcc agcgttacca tctttctcag atttgatcag aatggagtgc 34140
ttatggaaaa ctcctcgcta gacaggcagt actggaactt cagaaatggc aactcaacta 34200
acgctgcccc ctacaccaat gcagttgggt tcatgccaaa cctcgcagca taccccaaaa 34260
cgcaaagcca gactgctaaa aacaacattg taagtcaggt ttacttgaat ggagacaaat 34320
ccaaacccat gacccttacc atcaccctca atggaactaa tgaatccagt gaaactagcc 34380
aggtgagtca ctactccatg tcatttacat gggcttggga aagtgggcaa tatgccactg 34440
aaacctttgc caccaactcc ttcacctttt cttacattgc tgaacaataa aaagcatgac 34500
actgatgttc atttctgatt cttattttat tattttcaaa cacaacaaaa tcattcaagt 34560
cattcttcca tcttagctta atagacacag tagcttaata gacccagtag tgcaaagccc 34620
cattctagct tatagatcag acagtgataa ttaaccacca ccaccaccat accttttgat 34680
tcaggaaatc atgatcatca caggatccta gtcttcaggc cgccccctcc ctcccaagac 34740
acagaataca cagtcctctc cccccgactg gctttaaata acaccatctg gttggtcaca 34800
gacatgttct taggggttat attccacacg gtctcctgcc gcgccaggcg ctcgtcggtg 34860
atgttgataa actctcccgg cagctcgctc aagttcacgt cgctgtccag cggctgaacc 34920
tccggctgac gcgataactg tgcgaccggc tgctggacaa acggaggccg cgcctacaag 34980
ggggtagagt cataatcctc ggtcaggata gggcggtgat gcagcagcag cgagcgaaac 35040
atctgctgcc gccgccgctc cgtccggcag gaaaacaaca agccggtggt ctcctccgcg 35100
ataatccgca ccgcccgcag catcagcttc ctcgttctcc gcgcgcagca cctcaccctg 35160
atctcgctca agtcggcgca gtaggtacag cacagcacca cgatgttatt catgatccca 35220
cagtgcaggg cgctgtatcc aaagctcatg ccgggaacca ccgcccccac gtggccatcg 35280
taccacaagc gcacgtaaat taagtgtcga cccctcatga acgtgctgga cacaaacatt 35340
acttccttgg gcatgttgta attcaccacc tcccggtacc agataaacct ctggttaaac 35400
agggcacctt ccaccaccat cctgaaccaa gaggccagaa cctgcccacc ggctatgcac 35460
tgcagggaac ccgggttgga acaatgacaa tgcagactcc aaggctcgta accgtggatc 35520
atccggctgc tgaaggcatc gatgttggca caacacagac acacgtgcat gcactttctc 35580
atgattagca gctcttccct cgtcaggatc atatcccaag gaataaccca ttcttgaatc 35640
aacgtaaaac ccacacagca gggaaggcct cgcacataac tcacgttgtg catggtcagc 35700
gtgttgcatt ctggaaacag cggatgatcc tccagtatcg aggcgcgggt ctccttctca 35760
cagggaggta aagggtccct gctgtacgga ctgcgccggg acgaccgaga tcgtgttgag 35820
cgtagtgtca tggaaaaggg aacgccggac gtggtcatac ttcttgaagc agaaccaggt 35880
tcgcgcgtgg caggcctcct tgcgtctgcg gtctcgccgt ctagctcgct ccgtgtgata 35940
gttgtagtac agccactccc gcagagcgtc gaggcgcacc ctggcttccg gatctatgta 36000
gactccgtct tgcaccgcgg ccctgataat atccaccacc gtagaataag caacacccag 36060
ccaagcaata cactcgctct gcgagcggca gacaggagga gcgggcagag atgggagaac 36120
catgataaaa aacttttttt aaagaatatt ttccaattct tcgaaagtaa gatctatcaa 36180
gtggcagcgc tcccctccac tggcgcggtc aaactctacg gccaaagcac agacaacggc 36240
atttctaaga tgttccttaa tggcgtccaa aagacacacc gctctcaagt tgcagtaaac 36300
tatgaatgaa aacccatccg gctgattttc caatatagac gcgccggcgg cgtccaccaa 36360
acccagataa ttttcttctc tccagcggtt tagaatctgt ctaagcaaat cccttatatc 36420
aagtccggcc atgccaaaaa tctgctcaag agcgccctcc accttcatga ccaagcagcg 36480
catcatgatt gcaaaaattc aggttcttca gagacctgta taagattcaa aatgggaaca 36540
ttaacaaaaa ttcctctgtc gcgcagatcc cttcgcaggg caagctgaac ataatcagac 36600
aggtctgaac ggaccagtga ggccaaatcc ccaccaggaa ccagatccag agaccctata 36660
ctgattatga cgcgcatact cggggctatg ctgaccagcg tagcgccgat gtaggcgtgc 36720
tgcatgggcg gcgagataaa atgcaaagtg ctggttaaaa aatcaggcaa agcctcgcgc 36780
aaaaaagcta acacatcata atcatgctca tgcaggtagt tgcaggtaag ctcaggaacc 36840
aaaacggaat aacacacgat tttcctctca aacatgactt cgcggatact gcgtaaaaca 36900
aaaattataa ataaaaaatt aattaactta aacattggaa gcctgtctca caacaggaaa 36960
aaccacttta atcaacataa gacgggccac gggcatgccg gcatagccgt aaaaaaattg 37020
gtccccgtga ttaacaagta ccacagacag ctccccggtc atgtcggggg tcatcatgtg 37080
agactctgta tacacgtctg gattgtgaac atcagacaaa caaagaaatc gagccacgta 37140
gcccggaggt ataatcaccc gcaggcggag gtacagcaaa acgaccccca taggaggaat 37200
cacaaaatta gtaggagaaa aaaatacata aacaccagaa aaaccctgtt gctgaggcaa 37260
aatagcgccc tcccgatcca aaacaacata aagcgcttcc acaggagcag ccataacaaa 37320gacccgagtc
ttaccagtaa aagaaaaaag atctctcaac gcagcaccag caccaacact            37380
tcgcagtgta aaaggccaag tgccgagaga gtatatatag gaataaaaag tgacgtaaac 37440
gggcaaagtc caaaaaacgc ccagaaaaac cgcacgcgaa cctacgcccc gaaacgaaag 37500
ccaaaaaaca ctagacactc ccttccggcg tcaacttccg ctttcccacg ctacgtcact 37560
tgccccagtc aaacaaacta catatcccga acttccaagt cgccacgccc aaaacaccgc 37620
ctacacctcc ccgcccgccg gcccgccccc aaacccgcct cccgccccgc gccccgcctc 37680
gcgccgccca tctcattatc atattggctt caatccaaaa taaggtatat tattgatgat 37740
g                                                                 37741
<210>15
<211>36643
<212>DNA
<213>ChAd63
<400>15
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtgtttga 60
atttggggat gcggggcgct gattggctga gagacgggcg accgttaggg gcggggcggg 120
tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300
aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag 360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta 480
tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct 540
cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg 600
gtaatgtttt cctggctact gggaacgaga ttctggaact ggtggtggac gccatgatgg 660
gtgacgaccc tcccgagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg 720
atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta 780
gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt 840
cctctcttca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg 900
aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg 960
aggaggcgat tcgagctgca gcgagcgagg gagtgaaagt tgcgggcgag agctttagcc 1020
tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata 1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt 1140
acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt 1200
atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact 1260
tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat 1320
agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg 1380
ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg 1440
ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa 1500
aatatgtgtt gactttaagt gcgtggttta tgactcaggg gtggggactg tgggtatata 1560
agcaggtgca gacctgtgtg gtcagttcag agcaggactc atggagatct ggacggtctt 1620
ggaagacttt caccagacta gacagctgct agagaactca tcggcggaag tctcttacct 1680
gtggagattc tgcttcggtg ggcctctagc taagctagtc tatagggcca agcaggatta 1740
taaggatcaa tttgaggata ttttgagaga gtgtcctggt atttttgact ctctcaactt 1800
gggccatcag tctcacttta accagagtat tctgagagcc cttgactttt ccactcctgg 1860
cagaactacc gccgcggtag ccttttttgc ctttatcctt gacaaatgga gtcaagaaac 1920
ccatttcagc agggattacc gtctggactg cttagcagta gctttgtgga gaacatggag 1980
gtgccagcgc ctgaatgcaa tctccggcta cttgccagta cagccggtag acacgctgag 2040
gatcctgagt ctccagtcac cccaggaaca ccaacgccgc cagcagccgc agcaggagca 2100
gcagcaagag gaggaggagg accgagaaga gaacctgaga gccggtctgg accctccggt 2160
ggcggaggag gaggagtagc tgacttgttt cccgagctgc gccgggtgct gactaggtct 2220
tccagtggac gggagagggg gattaagcgg gagaggcatg aggagactag ccacagaact 2280
gaactgactg tcagtctgat gagccgcagg cgcccagaat cggtgtggtg gcatgaggtg 2340
cagtcgcagg ggatagatga ggtctcagtg atgcatgaga aatattccct agaacaagtc 2400
aagacttgtt ggttggagcc tgaggatgat tgggaggtag ccatcaggaa ttatgccaag 2460
ctggctctga agccagacaa gaagtacaag attaccaaac tgattaatat cagaaattcc 2520
tgctacattt cagggaatgg ggccgaggtg gagatcagta cccaggagag ggcggccttc 2580
agatgttgta tgatgaatat gtacccgggg gtggtgggca tggagggagt cacctttatg 2640
aacacgaggt tcaggggtga tgggtataat ggggtggtct ttatggccaa caccaagttg 2700
acagtgcacg gatgctcctt ctttggcttc aataacatgt gcatcgaggc ctggggcagt 2760
gtttcagtga ggggatgcag cttttcagcc aactggatgg gggtcgtggg cagaaccaag 2820
agcgtggttt cagtgaagaa atgcctgttt gagaggtgcc acctgggggt gatgagcgag 2880
ggcgaagcca aagtcaaaca ctgcgcctct accgagacgg gctgctttgt gctgatcaag 2940
ggcaatgcca aagtcaagca taacatgatc tgtggggcct cggatgagcg cggctaccag 3000
atgctgacct gcgccggtgg gaacagccat atgctggcca ccgtgcatgt ggcctcgcac 3060
ccccgcaaga catggcccga gttcgagcac aacgtcatga cccgctgcaa tgtgcacctg 3120
gggtcccgcc gaggcatgtt catgccctac cagtgcaaca tgcaatttgt gaaggtgctg 3180
ctggagcccg atgccatgtc cagagtgagc ctgacggggg tgtttgacat gaatgtggag 3240
ctgtggaaaa ttctgagata tgatgaatcc aagaccaggt gccgggcctg cgaatgcgga 3300
ggcaagcacg ccaggcttca gcccgtgtgt gtggaggtga cggaggacct gcgacccgat 3360
catttggtgt tgtcctgcaa cgggacggag ttcggctcca gcggggaaga atctgactag 3420
agtgagtagt gtttgggggt gggtgggagc ctgcatgatg ggcagaatga ctaaaatctg 3480
tgtttttctg tgtgttgcag cagcatgagc ggaagcgcct cctttgaggg aggggtattc 3540
agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa tgtgatggga 3600
tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac ctacgcgacc 3660
ctgagctcct cgtccgtgga cgcagctgcc gccgcagctg ctgcttccgc cgccagcgcc 3720
gtgcgcggaa tggccctggg cgccggctac tacagctctc tggtggccaa ctcgagttcc 3780
accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc ccagctcgag 3840
gccctgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca ggcggagacg 3900
cgggccgcgg ttgccacggt gaaaaccaaa taaaaaatga atcaataaat aaacggagac 3960
ggttgttgat tttaacacag agtcttgaat ctttatttga tttttcgcgc gcggtaggcc 4020
ctggaccacc ggtctcgatc attgagcacc cggtggatct tttccaggac ccggtagagg 4080
tgggcttgga tgttgaggta catgggcatg agcccgtccc gggggtggag gtagctccat 4140
tgcagggcct cgtgctcggg ggtggtgttg taaatcaccc agtcatagca ggggcgcagg 4200
gcgtggtgct gcacgatgtc tttgaggagg agactgatgg ccacgggcag ccccttggtg 4260
taggtgttga cgaacctatt gagctgggag ggatgcatgc ggggggagat gagatgcatc 4320
ttggcctgga tcttgagatt ggcgatgttc ccgcccagat cccgccgggg gttcatgttg 4380
tgcaggacca ccagcacggt gtatccggtg cacttgggga atttgtcatg caacttggaa 4440
gggaaggcgt gaaagaattt ggagacgccc ttgtgaccgc ccaggttttc catgcactca 4500
tccatgatga tggcgatggg cccgtgggcg gcggcctggg caaagacgtt tcgggggtcg 4560
gacacatcgt agttgtggtc ctgggtgagc tcgtcatagg ccattttaat gaatttgggg 4620
cggagggtac ccgactgggg gacaaaggtg ccctcgatcc cgggggcgta gttcccctcg 4680
cagatctgca tctcccaggc cttgagctcg gaggggggga tcatgtccac ctgcggggcg 4740
atgaaaaaaa cggtttccgg ggcgggggag atgagctgcg ccgaaagcag gttccggagc 4800
agctgggact tgccgcagcc ggtggggccg tagatgaccc cgatgaccgg ctgcaggtgg 4860
tagttgaggg agagacagct gccgtcctcg cggaggaggg gggccacctc gttcatcatc 4920
tcgcgcacat gcatgttctc gcgcacgagt tccgccagga ggcgctcgcc ccccagcgag 4980
aggagctctt gcagcgaggc gaagtttttc agcggcttga gcccgtcggc catgggcatt 5040
ttggagaggg tctgttgcaa gagttccaga cggtcccaga gctcggtgat gtgctctagg 5100
gcatctcgat ccagcagacc tcctcgtttc gcgggttggg gcgactgcgg gagtagggca 5160
ccaggcgatg ggcgtccagc gaggccaggg tccggtcctt ccagggtcgc agggtccgcg 5220
tcagcgtggt ctccgtcacg gtgaaggggt gcgcgccggg ctgggcgctt gcgagggtgc 5280
gcttcaggct catccggctg gtcgagaacc gctcccggtc ggcgccctgc gcgtcggcca 5340
ggtagcaatt gagcatgagt tcgtagttga gcgcctcggc cgcgtggccc ttggcgcgga 5400
gcttaccttt ggaagtgtgt ccgcagacgg gacagaggag ggacttgagg gcgtagagct 5460
tgggggcgag gaagacggac tcgggggcgt aggcgtccgc gccgcagctg gcgcagacgg 5520
tctcgcactc cacgagccag gtgaggtcgg ggcggtcggg gtcaaaaacg aggtttcctc 5580
cgtgcttttt gatgcgtttc ttacctctgg tctccatgag ctcgtgtccc cgctgggtga 5640
caaagaggct gtccgtgtcc ccgtagaccg actttatggg ccggtcctcg agcggggtgc 5700
cgcggtcctc gtcgtagagg aaccccgccc actccgagac gaaggcccgg gtccaggcca 5760
gcacgaagga ggccacgtgg gaggggtagc ggtcgttgtc caccagcggg tccaccttct 5820
ccagggtatg caagcacatg tccccctcgt ccacatccag gaaggtgatt ggcttgtaag 5880
tgtaggccac gtgaccgggg gtcccggccg ggggggtata aaagggggcg ggcccctgct 5940
cgtcctcact gtcttccgga tcgctgtcca ggagcgccag ctgttggggt aggtattccc 6000
tctcgaaggc gggcatgacc tcggcactca ggttgtcagt ttctagaaac gaggaggatt 6060
tgatattgac ggtgccgttg gagacgcctt tcatgagccc ctcgtccatc tggtcagaaa 6120
agacgatctt tttgttgtcg agcttggtgg cgaaggagcc gtagagggcg ttggagagca 6180
gcttggcgat ggagcgcatg gtctggttct tttccttgtc ggcgcgctcc ttggcggcga 6240
tgttgagctg cacgtactcg cgcgccacgc acttccattc ggggaagacg gtggtgagct 6300
cgtcgggcac gattctgacc cgccagccgc ggttgtgcag ggtgatgagg tccacgctgg 6360
tggccacctc gccgcgcagg ggctcgttgg tccagcagag gcgcccgccc ttgcgcgagc 6420
agaagggggg cagcgggtcc agcatgagct cgtcgggggg gtcggcgtcc acggtgaaga 6480
tgccgggcag gagctcgggg tcgaagtagc tgatgcaggt gcccagatcg tccagacttg 6540
cttgccagtc gcgcacggcc agcgcgcgct cgtaggggct gaggggcgtg ccccagggca 6600
tggggtgcgt gagcgcggag gcgtacatgc cgcagatgtc gtagacgtag aggggctcct 6660
ggaggacgcc gatgtaggtg gggtagcagc gccccccgcg gatgctggcg cgcacgtagt 6720
cgtacagctc gtgcgagggc gcgaggagcc ccgtgccgag attggagcgc tgcggctttt 6780
cggcgcggta gacgatctgg cggaagatgg cgtgggagtt ggaggagatg gtgggcctct 6840
ggaagatgtt gaagtgggca tggggcagtc cgaccgagtc cctgatgaag tgggcgtagg 6900
agtcctgcag cttggcgacg agctcggcgg tgacgaggac gtccagggcg cagtagtcga 6960
gggtctcttg gatgatgtcg tacttgagct ggcccttctg cttccacagc tcgcggttga 7020
gaaggaactc ttcgcggtcc ttccagtact cttcgagggg gaacccgtcc tgatcggcac 7080
ggtaagagcc caccatgtag aactggttga cggccttgta ggcgcagcag cccttctcca 7140
cggggagggc gtaagcttgc gcggccttgc gcagggaggt gtgggtgagg gcgaaggtgt 7200
cgcgcaccat gactttgagg aactggtgct tgaagtcgag gtcgtcgcag ccgccctgct 7260
cccagagctg gaagtccgtg cgcttcttgt aggcggggtt gggcaaagcg aaagtaacat 7320
cgttgaagag gatcttgccc gcgcggggca tgaagttgcg agtgatgcgg aaaggctggg 7380
gcacctcggc ccggttgttg atgacctggg cggcgaggac gatctcgtcg aagccgttga 7440
tgttgtgccc gacgatgtag agttccacga atcgcgggcg gcccttgacg tggggcagct 7500
tcttgagctc gtcgtaggtg agctcggcgg ggtcgctgag cccgtgctgc tcgagggccc 7560
agtcggcgac gtgggggttg gcgctgagga aggaagtcca gagatccacg gccagggcgg 7620
tctgcaagcg gtcccggtac tgacggaact gctggcccac ggccattttt tcgggggtga 7680
cgcagtagaa ggtgcggggg tcgccgtgcc agcggtccca cttgagctgg agggcgaggt 7740
cgtgggcgag ctcgacgagc ggcgggtccc cggagagttt catgaccagc atgaagggga 7800
cgagctgctt gccgaaggac cccatccagg tgtaggtttc cacatcgtag gtgaggaaga 7860
gcctttcggt gcgaggatgc gagccgatgg ggaagaactg gatctcctgc caccagttgg 7920
aggaatggct gttgatgtga tggaagtaga aatgccgacg gcgcgccgag cactcgtgct 7980
tgtgtttata caagcgtccg cagtgctcgc aacgctgcac gggatgcacg tgctgcacga 8040
gctgtacctg ggttcctttg acgaggaatt tcagtgggca gtggagcgct ggcggctgca 8100
tctggtgctg tactacgtcc tggccatcgg cgtggccatc gtctgcctcg atggtggtca 8160
tgctgacgag cccgcgcggg aggcaggtcc agacctcggc tcggacgggt cggagagcga 8220
ggacgagggc gcgcaggccg gagctgtcca gggtcctgag acgctgcgga gtcaggtcag 8280
tgggcagcgg cggcgcgcgg ttgacttgca ggagcttttc cagggcgcgc gggaggtcca 8340
gatggtactt gatctccacg gcgccgttgg tggcgacgtc cacggcttgc agggtcccgt 8400
gcccctgggg cgccaccacc gtgccccgtt tcttcttggg cggcggcggc tccatgctta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg caggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcctgaag gtctccgcgg ccggcgcgct cgacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc cggcctcgtt 8880
ccagacgcgg ctgtagacca cggctccgtc ggggtcgcgc gcgcgcatga ccacctgggc 8940
gaggttgagc tcgacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaagtac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gggcttccaa gcgctccatg gcctcgtaga agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc ccggggggct cctcttccat 9240
ttcctcctct tcctcctcca ctaacatctc ttctacttcc tcctcaggag gcggcggcgg 9300
gggaggggcc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctccccgcgc cggcgacgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccgccgggg gggtctccgt tgggcaggga 9480
gagggcgctg acgatgcatc ttatcaattg acccgtaggg actccgcgca aggacctgag 9540
cgtctcgaga tccacgggat ccgaaaaccg ctgaacgaag gcttcgagcc agtcgcagtc 9600
gcaaggtagg ctgagcccgg tttcttgttc ttcgggtatt tggtcgggag gcgggcgggc 9660
gatgctgctg gtgatgaagt tgaagtaggc ggtcctgaga cggcggatgg tggcgaggag 9720
caccaggtcc ttgggcccgg cttgctggat gcgcagacgg tcggccatgc cccaggcgtg 9780
gtcctgacac ctggcgaggt ccttgtagta gtcctgcatg agccgctcca cgggcacctc 9840
ctcctcgccc gcgcggccgt gcatgcgcgt gagcccgaac ccgcgctgcg gctggacgag 9900
cgccaggtcg gcgacgacgc gctcggcgag gatggcctgc tggatctggg tgagggtggt 9960
ctggaagtcg tcgaagtcga cgaagcggtg gtaggctccg gtgttgatgg tgtaggagca 10020
gttggccatg acggaccagt tgacggtctg gtggccgggg cgcacgagct cgtggtactt 10080
gaggcgcgag taggcgcgcg tgtcgaagat gtagtcgttg caggtgcgca cgaggtactg 10140
gtatccgacg aggaagtgcg gcggcggctg gcggtagagc ggccatcgct cggtggcggg 10200
ggcgccgggc gcgaggtcct cgagcatgag gcggtggtag ccgtagatgt acctggacat 10260
ccaggtgatg ccggcggcgg tggtggaggc gcgcgggaac tcgcggacgc ggttccagat 10320
gttgcgcagc ggcaggaagt agttcatggt ggccgcggtc tggcccgtga ggcgcgcgca 10380
gtcgtggatg ctctagacat acgggcaaaa acgaaagcgg tcagcggctc gactccgtgg 10440
cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc cggttcgaat ctcgaatcag 10500
gctggagccg cagctaacgt ggtactggca ctcccgtctc gacccaagcc tgctaacgaa 10560
acctccagga tacggaggcg ggtcgttttt tggccttggt cgctggtcat gaaaaactag 10620
taagcgcgga aagcggccgc ccgcgatggc tcgctgccgt agtctggaga aagaatcgcc 10680
agggttgcgt tgcggtgtgc cccggttcga gcctcagcgc tcggcgccgg ccggattccg 10740
cggctaacgt gggcgtggct gccccgtcgt ttccaagacc ccttagccag ccgacttctc 10800
cagttacgga gcgagcccct ctttttttct tgtgtttttg ccagatgcat cccgtactgc 10860
ggcagatgcg cccccaccct ccaccacaac cgcccctacc gcagcagcag caacagccgg 10920
cgcttctgcc cccgccccag cagcagcagc cagccactac cgcggcggcc gccgtgagcg 10980gagccggcgt
tcagtatgac ctggccttgg aagagggcga ggggctggcg cggctggggg            11040
cgtcgtcgcc ggagcggcac ccgcgcgtgc agatgaaaag ggacgctcgc gaggcctacg 11100
tgcccaagca gaacctgttc agagacagga gcggcgagga gcccgaggag atgcgcgcct 11160
cccgcttcca cgcggggcgg gagctgcggc gcggcctgga ccgaaagcgg gtgctgaggg 11220
acgaggattt cgaggcggac gagctgacgg ggatcagccc cgcgcgcgcg cacgtggccg 11280
cggccaacct ggtcacggcg tacgagcaga ccgtgaagga ggagagcaac ttccaaaaat 11340
ccttcaacaa ccacgtgcgc acgctgatcg cgcgcgagga ggtgaccctg ggcctgatgc 11400
acctgtggga cctgctggag gccatcgtgc agaaccccac gagcaagccg ctgacggcgc 11460
agctgtttct ggtggtgcag cacagtcggg acaacgagac gttcagggag gcgctgctga 11520
atatcaccga gcccgagggc cgctggctcc tggacctggt gaacattctg cagagcatcg 11580
tggtgcagga gcgcgggctg ccgctgtccg agaagctggc ggccatcaac ttctcggtgc 11640
tgagcctggg caagtactac gctaggaaga tctacaagac cccgtacgtg cccatagaca 11700
aggaggtgaa gatcgatggg ttttacatgc gcatgaccct gaaagtgctg accctgagcg 11760
acgatctggg ggtgtaccgc aacgacagga tgcaccgcgc ggtgagcgcc agccgccggc 11820
gcgagctgag cgaccaggag ctgatgcaca gcctgcagcg ggccctgacc ggggccggga 11880
ccgaggggga gagctacttt gacatgggcg cggacctgcg ctggcagccc agccgccggg 11940
ccttggaagc tgccggcggc gtgccctacg tggaggaggt ggacgatgag gaggaggagg 12000
gcgagtacct ggaagactga tggcgcgacc gtatttttgc tagatgcagc aacagccacc 12060
gccgccgcct cctgatcccg cgatgcgggc ggcgctgcag agccagccgt ccggcattaa 12120
ctcctcggac gattggaccc aggccatgca acgcatcatg gcgctgacga cccgcaatcc 12180
cgaagccttt agacagcagc ctcaggccaa ccggctctcg gccatcctgg aggccgtggt 12240
gccctcgcgc tcgaacccca cgcacgagaa ggtgctggcc atcgtgaacg cgctggtgga 12300
gaacaaggcc atccgcggcg acgaggccgg gctggtgtac aacgcgctgc tggagcgcgt 12360
ggcccgctac aacagcacca acgtgcagac gaacctggac cgcatggtga ccgacgtgcg 12420
cgaggcggtg tcgcagcgcg agcggttcca ccgcgagtcg aacctgggct ccatggtggc 12480
gctgaacgcc ttcctgagca cgcagcccgc caacgtgccc cggggccagg aggactacac 12540
caacttcatc agcgcgctgc ggctgatggt ggccgaggtg ccccagagcg aggtgtacca 12600
gtcggggccg gactacttct tccagaccag tcgccagggc ttgcagaccg tgaacctgag 12660
ccaggctttc aagaacttgc agggactgtg gggcgtgcag gccccggtcg gggaccgcgc 12720
gacggtgtcg agcctgctga cgccgaactc gcgcctgctg ctgctgctgg tggcgccctt 12780
cacggacagc ggcagcgtga gccgcgactc gtacctgggc tacctgctta acctgtaccg 12840
cgaggccatc gggcaggcgc acgtggacga gcagacctac caggagatca cccacgtgag 12900
ccgcgcgctg ggccaggagg acccgggcaa cctggaggcc accctgaact tcctgctgac 12960
caaccggtcg cagaagatcc cgccccagta cgcgctgagc accgaggagg agcgcatcct 13020
gcgctacgtg cagcagagcg tggggctgtt cttgatgcag gagggggcca cgcccagcgc 13080
cgcgctcgac atgaccgcgc gcaacatgga gcccagcatg tacgcccgca accgcccgtt 13140
catcaataag ctgatggact acttgcatcg ggcggccgcc atgaactcgg actactttac 13200
caacgccatc ttgaacccgc actggctccc gccgcccggg ttctacacgg gcgagtacga 13260
catgcccgac cccaacgacg ggttcctgtg ggacgacgtg gacagcagcg tgttctcgcc 13320
gcggcccacc accaccaccg tgtggaagaa agagggcggg gaccggcggc cgtcctcggc 13380
gctgtccggt cgcgcgggtg ctgccgcggc ggtgcccgag gctgccagcc ccttcccgag 13440
cctgcccttt tcgctgaaca gcgtgcgcag cagcgagctg ggtcggctga cgcggccgcg 13500
cctgctgggc gaggaggagt acctgaacga ctccttgttg aagcccgagc gcgagaagaa 13560
cttccccaat aacgggatag agagcctggt ggacaagatg agccgctgga agacgtacgc 13620
gcacgagcac agggacgagc cccgagctag cagcgcaggc acccgtagac gccagcggca 13680
cgacaggcag cggggactgg tgtgggacga tgaggattcc gccgacgaca gcagcgtgtt 13740
ggacttgggt gggagtggtg gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg 13800
cctgatgtaa gaatctgaaa aaataaaaga cggtactcac caaggccatg gcgaccagcg 13860
tgcgttcttc tctgttgttt gtagtagtat gatgaggcgc gtgtacccgg agggtcctcc 13920
tccctcgtac gagagcgtga tgcagcaggc ggtggcggcg gcgatgcagc ccccgctgga 13980
ggcgccttac gtgcccccgc ggtacctggc gcctacggag gggcggaaca gcattcgtta 14040
ctcggagctg gcacccttgt acgataccac ccggttgtac ctggtggaca acaagtcggc 14100
ggacatcgcc tcgctgaact accagaacga ccacagcaac ttcctgacca ccgtggtgca 14160
gaacaacgat ttcaccccca cggaggccag cacccagacc atcaactttg acgagcgctc 14220
gcggtggggc ggccagctga aaaccatcat gcacaccaac atgcccaacg tgaacgagtt 14280
catgtacagc aacaagttca aggcgcgggt gatggtctcg cgcaagaccc ccaacggggt 14340
cacggtaggg gatgattatg atggtagtca ggacgagctg acctacgagt gggtggagtt 14400
tgagctgccc gagggcaact tctcggtgac catgaccatc gatctgatga acaacgccat 14460
catcgacaac tacttggcgg tggggcggca gaacggggtg ctggagagcg acatcggcgt 14520
gaagttcgac acgcgcaact tccggctggg ctgggacccc gtgaccgagc tggtgatgcc 14580
gggcgtgtac accaacgagg ccttccaccc cgacatcgtc ctgctgcccg gctgcggcgt 14640
ggacttcacc gagagccgcc tcagcaacct gctgggcatc cgcaagcggc agcccttcca 14700
ggagggcttc cagatcctgt acgaggacct ggaggggggc aacatccccg cgctcttgga 14760
tgtcgaagcc tatgaagaaa gtaaggaaaa agcagaggct gaggcaacta cagccgtggc 14820
taccgccgcg actgtggcag atgccactgt caccaggggc gatacattcg ccacccaggc 14880
ggaggaagca gccgccctag cggcgaccga tgatagtgaa agtaagatag tcatcaagcc 14940
ggtggagaag gacagcaaga acaggagcta caacgttcta ccggatggaa agaacaccgc 15000
ctaccgcagc tggtacctgg cctacaacta cggcgacccc gagaagggcg tgcgctcctg 15060
gacgctgctc accacctcgg acgtcacctg cggcgtggag caagtctact ggtcgctgcc 15120
cgacatgatg caagacccgg tcaccttccg ctccacgcga caagttagca actacccggt 15180
ggtgggcgcc gagctcctgc ccgtctactc caagagcttc ttcaacgagc aggccgtcta 15240
ctcgcagcag ctgcgtgcct tcacctcgct cacgcacgtc ttcaaccgct tccccgagaa 15300
ccagatcctc gtccgcccgc ccgcgcccac cattaccacc gtcagtgaaa acgttcctgc 15360
tctcacagat cacgggaccc tgccgctgcg cagcagtatc cggggagtcc agcgcgtgac 15420
cgtcactgac gccagacgcc gcacctgccc ctacgtctac aaggccctgg gcgtagtcgc 15480
gccgcgcgtc ctctcgagcc gcaccttcta aaaaatgtcc attctcatct cgcccagtaa 15540
taacaccggt tggggcctgc gcgcgcccag caagatgtac ggaggcgctc gccaacgctc 15600
cacgcaacac cccgtgcgcg tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg 15660
ccgcgtgcgc tcgcgcacca ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg 15720
caactacacg cccgccgccg cgcccgcctc caccgtggac gccgtcatcg acagcgtggt 15780
ggccgacgcg cgccggtacg cccgcgccaa gagccggcgg cggcgcatcg cccggcggca 15840
ccggagcacc cccgccatgc gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg 15900
acgcagggcc atgctcaggg cggccagacg cgcggcctcc ggcagcagca gcgccggcag 15960
gacccgcaga cgcgcggcca cggcggcggc ggcggccatc gccagcatgt cccgcccgcg 16020
gcgcggcaac gtgtactggg tgcgcgacgc cgccaccggt gtgcgcgtgc ccgtgcgcac 16080
ccgcccccct cgcacttgaa gatgctgact tcgcgatgtt gatgtgtccc agcggcgagg 16140
aggatgtcca agcgcaaata caaggaagag atgctccagg tcatcgcgcc tgagatctac 16200
ggccccgcgg cggcggtgaa ggaggaaaga aagccccgca aactgaagcg ggtcaaaaag 16260
gacaaaaagg aggaggaaga tgacggactg gtggagtttg tgcgcgagtt cgccccccgg 16320
cggcgcgtgc agtggcgcgg gcggaaagtg aaaccggtgc tgcggcccgg caccacggtg 16380
gtcttcacgc ccggcgagcg ttccggctcc gcctccaagc gctcctacga cgaggtgtac 16440
ggggacgagg acatcctcga gcaggcggtc gagcgtctgg gcgagtttgc ttacggcaag 16500
cgcagccgcc ccgcgccctt gaaagaggag gcggtgtcca tcccgctgga ccacggcaac 16560
cccacgccga gcctgaagcc ggtgaccctg cagcaggtgc tgccgagcgc ggcgccgcgc 16620
cggggcttca agcgcgaggg cggcgaggat ctgtacccga ccatgcagct gatggtgccc 16680
aagcgccaga agctggagga cgtgctggag cacatgaagg tggaccccga ggtgcagccc 16740
gaggtcaagg tgcggcccat caagcaggtg gccccgggcc tgggcgtgca gaccgtggac 16800
atcaagatcc ccacggagcc catggaaacg cagaccgagc ccgtgaagcc cagcaccagc 16860
accatggagg tgcagacgga tccctggatg ccagcggctt ccaccaccac cactcgccga 16920
agacgcaagt acggcgcggc cagcctgctg atgcccaact acgcgctgca tccttccatc 16980
atccccacgc cgggctaccg cggcacgcgc ttctaccgcg gctacaccag cagccgccgc 17040
cgcaagacca ccacccgccg ccgtcgtcgc agccgccgca gcagcaccgc gacttccgcc 17100
ttggtgcgga gagtgtatcg cagcgggcgc gagcctctga ccctgccgcg cgcgcgctac 17160
cacccgagca tcgccattta actaccgcct cctacttgca gatatggccc tcacatgccg 17220
cctccgcgtc cccattacgg gctaccgagg aagaaagccg cgccgtagaa ggctgacggg 17280
gaacgggctg cgtcgccatc accaccggcg gcggcgcgcc atcagcaagc ggttgggggg 17340
aggcttcctg cccgcgctga tccccatcat cgccgcggcg atcggggcga tccccggcat 17400
agcttccgtg gcggtgcagg cctctcagcg ccactgagac acaaaaaagc atggatttgt 17460
aataaaaaaa tggactgacg ctcctggtcc tgtgatgtgt gtttttagat ggaagacatc 17520
aatttttcgt ccctggcacc gcgacacggc acgcggccgt ttatgggcac ctggagcgac 17580
atcggcaaca gccaactgaa cgggggcgcc ttcaattgga gcagtctctg gagcgggctt 17640
aagaatttcg ggtccacgct caaaacctat ggcaacaagg cgtggaacag cagcacaggg 17700
caggcgctga gggaaaagct gaaagagcag aacttccagc agaaggtggt cgatggcctg 17760
gcctcgggca tcaacggggt ggtggacctg gccaaccagg ccgtgcagaa acagatcaac 17820
agccgcctgg acgcggtccc gcccgcgggg tccgtggaga tgccccaggt ggaggaggag 17880
ctgcctcccc tggacaagcg cggcgacaag cgaccgcgtc ccgacgcgga ggagacgctg 17940
ctgacgcaca cggacgagcc gcccccgtac gaggaggcgg tgaaactggg tctgcccacc 18000
acgcggcccg tggcgcctct ggccaccggg gtgctgaaac ccagcagcag cagccagccc 18060
gcgaccctgg acttgcctcc gcctgcttcc cgcccctcca cagtggctaa gcccctgccg 18120
ccggtggccg tcgcgtcgcg cgccccccga ggccgccccc aggcgaactg gcagagcact 18180
ctgaacagca tcgtgggtct gggagtgcag agtgtgaagc gccgccgctg ctattaaaag 18240
acactgtagc gcttaacttg cttgtctgtg tgtgtatatg tatgtccgcc gaccagaagg 18300
aggaagaggc gcgtcgccga gttgcaagat ggccacccca tcgatgctgc cccagtgggc 18360
gtacatgcac atcgccggac aggacgcttc ggagtacctg agtccgggtc tggtgcagtt 18420
cgcccgcgcc acagacacct acttcagtct ggggaacaag tttaggaacc ccacggtggc 18480
gcccacgcac gatgtgacca ccgaccgcag ccagcggctg acgctgcgct tcgtgcccgt 18540
ggaccgcgag gacaacacct actcgtacaa agtgcgctac acgctggccg tgggcgacaa 18600
ccgcgtgctg gacatggcca gcacctactt tgacatccgc ggcgtgctgg atcggggccc 18660
cagcttcaaa ccctactccg gcaccgccta caacagccta gctcccaagg gagcgcccaa 18720
cacctcacag tggaaggatt ccgacagcaa aatgcatact tttggagttg ctgccatgcc 18780
cggtgttgtt ggtaaaaaaa tagaagccga tggtctgcct attggaatag attcatcctc 18840
tggaactgac accataattt atgctgataa aactttccaa ccagagccac aggttggaag 18900
tgacagttgg gtcgacacca atggtgcaga ggaaaaatat ggaggtagag ctcttaagga 18960
cactacaaac atgaagccct gctacggttc ttttgccagg cctaccaaca aagaaggtgg 19020
acaggctaac ataaaagatt ctgaaactgc cagcactact cctaactatg atatagattt 19080
ggcattcttt gacagcaaaa atattgcagc taactacgat ccagatattg taatgtacac 19140
agaaaatgtt gagttgcaaa ctccagatac tcatattgtg tttaagccag gaacttcaga 19200
tgaaagttca gaagccaatt tgggccagca ggccatgccc aacagaccca actacatcgg 19260
gttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata tgggtgtact 19320
ggctggtcag gcctcccagc taaatgctgt ggtggacttg caggacagaa acaccgaact 19380
gtcctaccag ctcttgcttg actctctggg tgacagaacc aggtatttca gtatgtggaa 19440
tcaggcggtg gacagctatg accccgatgt gcgcattatt gaaaatcacg gtgtggagga 19500
tgaactcccc aattattgct tccctttgaa tggtgtaggc tttacagata cttaccaggg 19560
tgttaaagtt aagacagata cagccgctac tggtaccaat ggaacgcagt gggacaaaga 19620
tgataccaca gtcagcactg ccaatgagat ccactcaggc aatcctttcg ccatggagat 19680
caacatccag gccaacctgt ggcggaactt cctctacgcg aacgtggcgc tgtacctgcc 19740
cgactcctac aagtacacgc cggccaacat cacgctgccg accaacacca acacctacga 19800
ttacatgaac ggccgcgtgg tggcgccctc gctggtggac gcctacatca acatcggggc 19860
gcgctggtcg ctggacccca tggacaacgt caaccccttc aaccaccacc gcaacgcggg 19920
cctgcgctac cgctccatgc tcctgggcaa cgggcgctac gtgcccttcc acatccaggt 19980
gccccaaaag tttttcgcca tcaagagcct cctgctcctg cccgggtcct acacctacga 20040
gtggaacttc cgcaaggacg tcaacatgat cctgcagagc tccctcggca acgacctgcg 20100
cacggacggg gcctccatcg ccttcaccag catcaacctc tacgccacct tcttccccat 20160
ggcgcacaac accgcctcca cgctcgaggc catgctgcgc aacgacacca acgaccagtc 20220
cttcaacgac tacctctcgg cggccaacat gctctacccc atcccggcca acgccaccaa 20280
cgtgcccatc tccatcccct cgcgcaactg ggccgccttc cgcggatggt ccttcacgcg 20340
cctcaagacc cgcgagacgc cctcgctcgg ctccgggttc gacccctact tcgtctactc 20400
gggctccatc ccctacctcg acggcacctt ctacctcaac cacaccttca agaaggtctc 20460
catcaccttc gactcctccg tcagctggcc cggcaacgac cgcctcctga cgcccaacga 20520
gttcgaaatc aagcgcaccg tcgacggaga gggatacaac gtggcccagt gcaacatgac 20580
caaggactgg ttcctggtcc agatgctggc ccactacaac atcggctacc agggcttcta 20640
cgtgcccgag ggctacaagg accgcatgta ctccttcttc cgcaacttcc agcccatgag 20700
ccgccaggtc gtggacgagg tcaactacaa ggactaccag gccgtcaccc tggcctacca 20760
gcacaacaac tcgggcttcg tcggctacct cgcgcccacc atgcgccagg gccagcccta 20820
ccccgccaac tacccctacc cgctcatcgg caagagcgcc gtcgccagcg tcacccagaa 20880
aaagttcctc tgcgaccggg tcatgtggcg catccccttc tccagcaact tcatgtccat 20940
gggcgcgctc accgacctcg gccagaacat gctctacgcc aactccgccc acgcgctaga 21000
catgaatttc gaagtcgacc ccatggatga gtccaccctt ctctatgttg tcttcgaagt 21060
cttcgacgtc gtccgagtgc accagcccca ccgcggcgtc atcgaggccg tctacctgcg 21120
cacgcccttc tcggccggca acgccaccac ctaaagcccc gctcttgctt cttgcaagat 21180
gacggcctgt ggctccggcg agcaggagct cagggccatc ctccgcgacc tgggctgcgg 21240
gccctgcttc ctgggcacct tcgacaagcg cttcccggga ttcatggccc cgcacaagct 21300
ggcctgcgcc atcgtcaaca cggccggccg cgagaccggg ggcgagcact ggctggcctt 21360
cgcctggaac ccgcgctccc acacctgcta cctcttcgac cccttcgggt tctcggacga 21420
gcgcctcaag cagatctacc agttcgagta cgagggcctg ctgcgccgca gcgccctggc 21480
caccgaggac cgctgcatca ccctggaaaa gtccacccag accgtgcagg gtccgcgctc 21540
ggccgcctgc gggctcttct gctgcatgtt cctgcacgcc ttcgtgcact ggcccgaccg 21600
ccccatggac aagaacccca ccatgaactt gctgacgggg gtgcccaacg gcatgctcca 21660
gtcgccccag gtggaaccca ccctgcgccg caaccaggag gcgctctacc gcttcctcaa 21720
cgcccactcc gcctactttc gctcccaccg cgcgcgcatc gagaaggcca ccgccttcga 21780
ccgcatgaat caagacatgt aaactgtgtg tatgtgaatg ctttattcat cataataaac 21840
agcacatgtt tatgccacct tctctgaggc tctgacttta tttagaaatc gaaggggttc 21900
tgccggctct cggcgtgccc cgcgggcagg gatacgttgc ggaactggta cttgggcagc 21960
cacttgaact cggggatcag cagcttcggc acggggaggt cggggaacga gtcgctccac 22020
agcttgcgcg tgagttgcag ggcgcccagc aggtcgggcg cggagatctt gaaatcgcag 22080
ttgggacccg cgttctgcgc gcgagagttg cggtacacgg ggttgcagca ctggaacacc 22140
atcagggccg ggtgcttcac gctcgccagc accgtcgcgt cggtgatgcc ctccacgtcc 22200
agatcctcgg cgttggccat cccgaagggg gtcatcttgc aggtctgccg ccccatgctg 22260
ggcacgcagc cgggcttgtg gttgcaatcg cagtgcaggg ggatcagcat catctgagcc 22320
tgctcggagc tcatgcccgg gtacatggcc ttcatgaaag cctccagctg gcggaaggcc 22380
tgctgcgcct tgccgccctc ggtgaagaag accccacagg acttgctaga gaactggttg 22440
gtggcgcagc ccgcgtcgtg cacgcagcag cgcgcgtcgt tgttggccag ctgcaccacg 22500
ctgcgccccc agcggttctg ggtgatcttg gcccggtcgg ggttctcctt cagcgcgcgc 22560
tgcccgttct cgctcgccac atccatctcg atcgtgtgct ccttctggat catcacggtc 22620
ccgtgcaggc accgcagctt gccctcggcc tcggtgcacc cgtgcagcca cagcgcgcag 22680
ccggtgcact cccagttctt gtgggcgatc tgggagtgcg agtgcacgaa gccctgcagg 22740
aagcggccca tcatcgtggt cagggtcttg ttgctggtga aggtcagcgg gatgccgcgg 22800
tgctcctcgt tcacatacag gtggcagatg cggcggtaca cctcgccctg ctcgggcatc 22860
agctggaagg cggacttcag gtcgctctcc acgcggtacc gctccatcag cagcgtcatc 22920
acttccatgc ccttctccca ggccgaaacg atcggcaggc tcagggggtt cttcaccgtc 22980
atcttagtcg ccgccgccga agtcaggggg tcgttctcgt ccagggtctc aaacactcgc 23040
ttgccgtcct tctcggtgat gcgcacgggg ggaaagctga agcccacggc cgccagctcc 23100
tcctcggcct gcctttcgtc ctcgctgtcc tggctgatgt cttgcaaagg cacatgcttg 23160
gtcttgcggg gtttcttttt gggcggcaga ggcggcggcg gagacgtgct gggcgagcgc 23220
gagttctcgc tcaccacgac tatttcttct tcttggccgt cgtccgagac cacgcggcgg 23280
taggcatgcc tcttctgggg cagaggcgga ggcgacgggc tctcgcggtt cggcgggcgg 23340
ctggcagagc cccttccgcg ttcgggggtg cgctcctggc ggcgctgctc tgactgactt 23400
cctccgcggc cggccattgt gttctcctag ggagcaacaa gcatggagac tcagccatcg 23460
tcgccaacat cgccatctgc ccccgccgcc gacgagaacc agcagcagca gaatgaaagc 23520
ttaaccgccc cgccgcccag ccccacctcc gacgccgccg cggccccaga catgcaagag 23580
atggaggaat ccatcgagat tgacctgggc tacgtgacgc ccgcggagca cgaggaggag 23640
ctggcagcgc gcttttcagc cccggaagag aaccaccaag agcagccaga gcaggaagca 23700
gagagcgagc agcagcaggc tgggctcgag catggcgact acctgagcgg ggcagaggac 23760
gtgctcatca agcatctggc ccgccaaagc atcatcgtca aggacgcgct gctcgaccgc 23820
gccgaggtgc ccctcagcgt ggcggagctc agccgcgcct acgagcgcaa cctcttctcg 23880
ccgcgcgtgc cccccaagcg ccagcccaac ggcacctgcg agcccaaccc gcgcctcaac 23940
ttctacccgg tcttcgcggt gcccgaggcc ctggccacct accacctctt tttcaagaac 24000
caaaggatcc ccgtctcctg ccgcgccaac cgcacccgcg ccgacgccct gctcaacctg 24060
ggtcccggcg cccgcctacc tgatatcacc tccttggaag aggttcccaa gatcttcgag 24120
ggtctgggca gcgacgagac tcgggccgcg aacgctctgc aaggaagcgg agaggagcat 24180
gagcaccaca gcgccctggt ggagttggaa ggcgacaacg cgcgcctggc ggtgctcaag 24240
cgcacggtcg agctgaccca cttcgcctac ccggcgctca acctgccccc caaggtcatg 24300
agcgccgtca tggaccaggt gctcatcaag cgcgcctcgc ccctctcaga ggaggagatg 24360
caggaccccg agagctcgga cgagggcaag cccgtggtca gcgacgagca gctggcgcgc 24420
tggctgggag cgagcagcac cccccagagc ctggaagagc ggcgcaagct catgatggcc 24480
gtggtcctgg tgaccgtgga gctggagtgt ctgcgccgct tcttcgccga cgcggagacc 24540
ctgcgcaagg tcgaggagaa cctgcactac ctcttcaggc acgggttcgt gcgccaggcc 24600
tgcaagatct ccaacgtgga gctgaccaac ctggtctcct acatgggcat cctgcacgag 24660
aaccgcctgg ggcagaacgt gctgcacacc accctgcgcg gggaggcccg ccgcgactac 24720
atccgcgact gcgtctacct gtacctctgc cacacctggc agacgggcat gggcgtgtgg 24780
cagcagtgcc tggaggagca gaacctgaaa gagctctgca agctcctgca gaagaacctc 24840
aaggccctgt ggaccgggtt cgacgagcgc accaccgcct cggacctggc cgacctcatc 24900
ttccccgagc gcctgcggct gacgctgcgc aacgggctgc ccgactttat gagccaaagc 24960
atgttgcaaa actttcgctc tttcatcctc gaacgctccg ggatcctgcc cgccacctgc 25020
tccgcactgc cctcggactt cgtgccgctg accttccgcg agtgcccccc gccgctctgg 25080
agccactgct acttgctgcg cctggccaac tacctggcct accactcgga cgtgatcgag 25140
gacgtcagca gcgagggtct gctcgagtgc cactgccgct gcaacctctg cacgccgcac 25200
cgctccttgg cctgcaaccc ccagctgctg agcgagaccc agatcatcgg caccttcgag 25260
ttgcaaggcc ccggcgaggg caaggggggt ctcaaactca ccccggggct gtggacctcg 25320
gcctacttgc gcaagttcgt gcccgaggac taccatccct tcgagatcag gttctacgag 25380
gaccaatccc agccgcccaa ggccgagctg tcggcctgcg tcatcaccca gggggccatc 25440
ctggcccaat tgcaagccat ccagaaatcc cgccaagaat ttctgctgaa aaagggccac 25500
ggggtctact tggaccccca gaccggagag gagctcaacc ccagcttccc ccaggatgcc 25560
ccgaggaagc agcaagaagc tgaaagtgga gctgccgctg ccgccggagg atttggagga 25620
agactgggag agcagtcagg cagaggagat ggaagactgg gacagcactc aggcagagga 25680
ggacagcctg caagacagtc tggaggagga agacgaggtg gaggaggagg cagaggaaga 25740
agcagccgcc gccagaccgt cgtcctcggc ggaggagaaa gcaagcagca cggataccat 25800
ctccgctccg ggtcggggtc gcggcggccg ggcccacagt agatgggacg agaccgggcg 25860
cttcccgaac cccaccaccc agaccggtaa gaaggagcgg cagggataca agtcctggcg 25920
ggggcacaaa aacgccatcg tctcctgctt gcaagcctgc gggggcaaca tctccttcac 25980
ccggcgctac ctgctcttcc accgcggggt gaacttcccc cgcaacatct tgcattacta 26040
ccgtcacctc cacagcccct actactgttt ccaagaagag gcagaaaccc agcagcagca 26100
gcagaaaacc agcggcagca gcagcagcta gaaaatccac agcggcggca ggtggactga 26160
ggatcgcggc gaacgagccg gcgcagaccc gggagctgag gaaccggatc tttcccaccc 26220
tctatgccat cttccagcag agtcgggggc aggagcagga actgaaagtc aagaaccgtt 26280
ctctgcgctc gctcacccgc agttgtctgt atcacaagag cgaagaccaa cttcagcgca 26340ctctcgagga
cgccgaggct ctcttcaaca agtactgcgc gctcactctt aaagagtagc            26400
ccgcgcccgc ccacacacgg aaaaaggcgg gaattacgtc accacctgcg cccttcgccc 26460
gaccatcatc atgagcaaag agattcccac gccttacatg tggagctacc agccccagat 26520
gggcctggcc gccggcgccg cccaggacta ctccacccgc atgaactggc tcagtgccgg 26580
gcccgcgatg atctcacggg tgaatgacat ccgcgcccac cgaaaccaga tactcctaga 26640
acagtcagcg atcaccgcca cgccccgcca tcaccttaat ccgcgtaatt ggcccgccgc 26700
cctggtgtac caggaaattc cccagcccac gaccgtacta cttccgcgag acgcccaggc 26760
cgaagtccag ctgactaact caggtgtcca gctggccggc ggcgccgccc tgtgtcgtca 26820
ccgccccgct cagggtataa agcggctggt gatccgaggc agaggcacac agctcaacga 26880
cgaggtggtg agctcttcgc tgggtctgcg acctgacgga gtcttccaac tcgccggatc 26940
ggggagatct tccttcacgc ctcgtcaggc cgtcctgact ttggagagtt cgtcctcgca 27000
gccccgctcg ggcggcatcg gcactctcca gttcgtggag gagttcactc cctcggtcta 27060
cttcaacccc ttctccggct cccccggcca ctacccggac gagttcatcc cgaacttcga 27120
cgccatcagc gagtcggtgg acggctacga ttgaatgtcc catggtggcg cggctgacct 27180
agctcggctt cgacacctgg accactgccg ccgcttccgc tgcttcgctc gggatctcgc 27240
cgagtttgcc tactttgagc tgcccgagga gcaccctcag ggcccggccc acggagtgcg 27300
gatcgtcgtc gaagggggcc tcgactccca cctgcttcgg attttcagcc agcgtccgat 27360
cctggtcgag cgcgagcaag gacagaccct tctgaccctg tactgcatct gcaaccaccc 27420
cggcctgcat gaaagtcttt gttgtctgct gtgtactgag tataataaaa gctgagatca 27480
gcgactactc cggactcgat tgtggtgttc ctgctatcaa ccggtccctg ttcttcaccg 27540
ggaacgagac cgagctccag ctccagtgta agccccacaa gaagtatctc acctggctgt 27600
tccagggctc tccgatcgcc gttgtcaacc actgcgacaa cgacggagtc ctgctgagcg 27660
gccctgccaa ccttactttt tccacccgca gaagcaagct ccagctcttc caacccttcc 27720
tccccgggac ctatcagtgc gtctcgggac cctgccatca caccttccac ctgatcccga 27780
ataccacagc gccgctcccc gctactaaca accaaactac ccaccaacgc caccgtcgcg 27840
acctttctga atctaatact accacccaca ccggaggtga gctccgaggt cgaccaacct 27900
ctgggattta ctacggcccc tgggaggtgg tagggttaat agcgctaggc ctagttgcgg 27960
gtgggctttt ggctctctgc tacctatacc tcccttgctg ttcgtactta gtggtgctgt 28020
gttgctggtt taagaaatgg ggaagatcac cctagtgagc tgcggtgtgc tggtggcggt 28080
ggtgctttcg attgtgggac tgggcggcgc ggctgtagtg aaggaggaga aggccgatcc 28140
ctgcttgcat ttcaatcccg acaaatgcca gctgagtttt cagcccgatg gcaatcggtg 28200
cacggtgctg atcaagtgcg gatgggaatg cgagaacgtg agaatcgagt acaataacaa 28260
gactcggaac aatactctcg cgtccgtgtg gcagcccggg gaccccgagt ggtacaccgt 28320
ctctgtcccc ggtgctgacg gctccccgcg caccgtgaac aatactttca tttttgcgca 28380
catgtgcgac acggtcatgt ggatgagcaa gcagtacgat atgtggcccc ccacgaagga 28440
gaacatcgtg gtcttctcca tcgcttacag cctgtgcacg gcgctaatca ccgctatcgt 28500
gtgcctgagc attcacatgc tcatcgctat tcgccccaga aataatgccg aaaaagagaa 28560
acagccataa cacgtttttt cacacacctt tttcagacca tggcctctgt tactgcccta 28620
actatttttt tgggccttgt gggtactagc agcacttttc agcatataaa caaaactgtt 28680
tatgctggtt ctaattctgt attacctggg catcaatcac accagaaagt ttcatggtac 28740
tggtatgata aaagtaacac gccagtcaca ctctgcaagg gtcatcaaac acccataaac 28800
cgtagtggaa ttttttttaa atgtaatcat aataatatta cactactttc aattacaaag 28860
cactattctg gtacttacta tggaaccaat tttaacataa aacaggacac ttactatagt 28920
gtcacagtat tggatccaac tactcctaga acaactacaa aacccacaac tactaagagg 28980
cacactaaac ctaaaactac caagaaaacc actgtcaaaa ctacaacaac taggaccacc 29040
acaactacag aggctaccac cagcacaaca cttgctgcca ctacacacac acacactgag 29100
ctaaccttac agaccactaa tgatttgatc gccctgttgc aaaaggggga taacagcacc 29160
acttccaatg aggagatacc cagatccatg attggcatta ttgttgctgt agtggtgtgc 29220
atgttgatca tcgccttgtg catggtgtac tatgccttct gctacagaaa gcacagactg 29280
aacgacaagc tggaacactt actaagtgtt gaattttaat tttttagaac catgaagatc 29340
ctaggccttt ttagtttttc tatcattacc tctactcttt gtgaatcagt ggataaagat 29400
gttactatta ccactggttc taattataca ctgaaagggc caccctcagg tatgctttcg 29460
tggtattgct attttggaac tgacactgat caaactgaat tatgcaattt tcaaaaaggc 29520
aaaacctcaa actctaaaat ctctaattat caatgcaatg gcactgatct gatactactc 29580
aatgtcacga aagcatatgg tggcagttat tcttgccctg gacaaaacac tgaggatatg 29640
attttttaca aagtggaagt ggttgatccc actactccac cgcccaccac cacaactact 29700
cacaccacac acacagaaca aacaccagag gcagcagaag cagagttggc cttccaggtt 29760
cacggagatt cctttgctgt caatacccct acacccgatc agcggtgtcc ggggctgctc 29820
gtcagcggca ttgtcggtgt gctttcggga ttagcagtca taatcatctg catgttcatt 29880
tttgcttgct gctatagaag gctttaccga caaaaatcag acccactgct gaacctctat 29940
gtttaatttt ttccagagcc atgaaggcag ttagcgctct agttttttgt tctttgattg 30000
gcattgtttt tagtgctggg tttttgaaaa atcttaccat ttatgaaggt gagaatgcca 30060
ctctagtggg catcagtggt caaaatgtca gctggctaaa ataccatcta gatgggtgga 30120
aagacatttg cgattggaat gtcactgtgt atacatgtaa tggagttaac ctcaccatta 30180
ctaatgccac ccaagatcag aatggtaggt ttaagggcca gagtttcact agaaataatg 30240
ggtatgaatc ccataacatg tttatctatg acgtcactgt catcagaaat gagactgcca 30300
ccaccacaca gatgcccact acacacagtt ctaccactac taccatgcaa accacacaga 30360
caaccacttt ttatacatca actcagcata tgaccaccac tacagcagca aagccaagta 30420
gtgcagcgcc tcagccccag gctttggctt tgatagctgc acaacctagt acaactacta 30480
ggaccaatga gcagactact gattttttgt ccactgtcga gagccacacc acagctacct 30540
ccagtgcctt ctctagcacc gccaatctct cctcgctttc ctctacacca atcagtcccg 30600
ctactactac tcctagcccc gctcctcttc ccactcccct gaagcaaact gaggacagcg 30660
gcatgcaatg gcagatcacc ctgctcattg tgatcgggtt ggtcattctg gccgtgttgc 30720
tctactacat cttctgccgc cgcattccca acgcgcaccg caagccggtc tacaagccca 30780
tcgttgacgg gcaaccggag ccgcttcagg tggaaggggg tctaaggaat cttctcttct 30840
cttttacagt atggtgattg aactatgatt cctagacaat tcttgatcac tattcttatc 30900
tgcctcctcc aagtctgtgc caccctcgct ctggtggcca acgccagtcc agactgtatt 30960
gggcccttcg cctcctacgt gctctttgcc ttcgtcacct gcatctgctg ctgtagcata 31020
gtctgcctgc ttatcacctt cttccagttc attgactgga tctttgtgcg catcgcctac 31080
ctgcgccacc acccccagta ccgcgaccag cgagtggcgc ggctgctcag gctcctctga 31140
taagcatgcg ggctctgcta cttctcgcgc ttctgctgtt agtgctcccc cgtcccgtca 31200
acccccggtc ccccactcag tcccccgagg aggtccgcaa atgcaaattc caagaaccct 31260
ggaaattcct caaatgctac cgccaaaaat cagacatgca tcccagctgg atcatgatca 31320
ttgggatcgt gaacattctg gcctgcaccc tcatctcctt tgtgatttac ccctgctttg 31380
actttggttg gaactcgcca gaggcgctct atctcccgcc tgaacctgac acaccaccac 31440
agcaacctca ggcacacgca ctaccaccac cacagcctag gccacaatac atgcccatat 31500
tagactatga ggccgagcca cagcgaccca tgctccccgc tattagttac ttcaatctaa 31560
ccggcggaga tgactgaccc actggccaac aacaacgtca acgaccttct cctggacatg 31620
gacggccgcg cctcggagca gcgactcgcc caacttcgca ttcgccagca gcaggagaga 31680
gccgtcaagg agctgcagga cggcatagcc atccaccagt gcaagaaagg catcttctgc 31740
ctggtgaaac aggccaagat ctcctacgag gtcacccaga ccgaccatcg cctctcctac 31800
gagctcctgc agcagcgcca gaagttcacc tgcctggtcg gagtcaaccc catcgtcatc 31860
acccagcagt cgggcgatac caaggggtgc atccactgct cctgcgactc ccccgactgc 31920
gtccacactc tgatcaagac cctctgcggc ctccgcgacc tcctccccat gaactaatca 31980
cccccttatc cagtgaaata aagatcatat tgatgatgat tttacagaaa taaagataca 32040
atcatattga tgatttgagt ttaataaaaa ataaagaatc acttacttga aatctgatac 32100
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32160
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32220
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32280
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32340
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gctgtccctg 32400
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32460
gtggacctcg actcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32520
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32580
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32640
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32700
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32760
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32820
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32880
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32940
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 33000
acaacacctg atccatcgcc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 33060
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33120
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33180
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33240
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33300
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33360
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33420
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33480
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33540
cccaccctgc atgccaaccc ttcccacccc actctgtgga aaaaactctg aaacacaaaa 33600
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33660
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33720
tctgaacgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33780
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33840
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33900
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33960
gccccgcagc agtcgctgtc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 34020
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 34080
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca ggaccaccag 34140
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34200
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggcgccccc tccagaacac 34260
gctgcccatg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34320
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34380
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34440
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcacac 34500
gctcatgcat ctcttcagca ctctcagctc ctcgggggtc aaaaccatat cccagggcac 34560
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34620
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagggaagc 34680
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34740
cgcggctgat cgtgctcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34800
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tcccggcgct 34860
tggaacgctc ggtgttgaag ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34920
gggcctcagg agtgatgaaa atcccatcat gcctgatagc tctgatcaca tcgaccaccg 34980
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggta acggcggggg 35040
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agcacttcaa 35100
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35160
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35220
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35280
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35340
ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35400
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35460
cagattgaca agcggaatat caaactctct gccgcgatcc ctaagctcct ccctcagcaa 35520
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac cgccaggaat 35580
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35640
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35700
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtgcacgtt 35760
tagagcctcg ggaacaacga tggagtaaat gcaagcggtg cgttccagca tggttagtta 35820
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35880
gtaaatcgtt ctttccagca ccaggcaggc cacggggtct ccggcacgac cctcgtaaaa 35940
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 36000
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 36060
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36120
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36180
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36240
agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 36300
gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 36360
cccgccaaat agtcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 36420
atacgcgcac ttcctcaaac gcccaaactg ccgtcatttc cgggttccca cgctacgtca 36480
tcaaaacacg actttcaaat tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac 36540
ggtcgcccgt ctctcagcca atcagcgccc cgcatcccca aattcaaaca cctcatttgc 36600
atattaacgc gcaccaaaag tttgaggtat attattgatg atg                   36643
<210>16
<211>1985
<212>PRT
<213>人工序列
<220>
<223>met-NS3-NS5B
<400>16
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly
 1               5                  10                  15
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
            20                  25                  30
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys
        35                  40                  45
Val Ash Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr
    50                  55                  60
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp
65                  70                  75                  80
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr
                85                  90                  95
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
            100                 105                 110
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
        115                 120                 125
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
    130                 135                 140
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145                 150                 155                 160
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met
                165                 170                 175
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
            180                 185                 190
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
        195                 200                 205
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
    210                 215                 220
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225                 230                 235                 240
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
                245                 250                 255
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly
            260                 265                 270
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
        275                 280                 285
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile
    290                 295                 300
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305                 310                 315                 320
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
                325                 330                 335
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly
            340                 345                 350
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe
        355                 360                 365
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly
    370                 375                 380
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385                 390                 395                 400
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
                405                 410                 415
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
            420                 425                 430
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
        435                 440                 445
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
    450                 455                 460
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly
465                 470                 475                 480
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
                485                 490                 495
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val
            500                 505                 510
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
        515                 520                 525
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
    530                 535                 540
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr
545                 550                 555                 560
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
                565                 570                 575
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
            580                 585                 590
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
        595                 600                 605
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met
    610                 615                 620
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625                 630                 635                 640
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val
                645                 650                 655
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp
            660                 665                 670
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser
        675                 680                 685
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys
    690                 695                 700
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala
705                 710                 715                 720
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp
                725                 730                 735
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
            740                 745                 750
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe
        755                 760                 765
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe
    770                 775                 780
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala
785                 790                 795                 800
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser
                805                 810                 815
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
            820                 825                 830
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met
        835                 840                 845
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro
    850                 855                 860
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His
865                 870                 875                 880
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
                885                 890                 895
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu
            900                 905                 9l0
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile
        915                 920                 925
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser
    930                 935                 940
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys
945                 950                 955                 960
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro
                965                 970                 975
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly
            980                 985                 990
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala
        995                 1000                1005
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro
    1010                1015                1020
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr
1025                1030                1035                1040
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala
                1045                1050                1055
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly
            1060                1065                1070
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro
        1075                1080                1085
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg
    1090                1095                1100
Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val
1105                1110                1115                1120
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro
                1125                1130                1135
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp
            1140                1145                1150
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly
        1155                1160                1165
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro
    1170                1175                1180
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp
1185                1190                1195                1200
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile
                1205                1210                1215
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp
            1220                1225                1230
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu
        1235                1240                1245
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala
    1250                1255                1260
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp
1265                1270                1275                1280
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala
                1285                1290                1295
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu
            1300                1305                1310
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly
        1315                1320                1325
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro
    1330                1335                1340
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr
1345                1350                1355                1360
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser
                1365                1370                1375
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val
            1380                1385                1390
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys
        1395                1400                1405
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu
    1410                1415                1420
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly
1425                1430                1435                1440
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp
                1445                1450                1455
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val
            1460                1465                1470
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro
        1475                1480                1485
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn
    1490                1495                1500
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu
1505                1510                1515                1520
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn
                1525                1530                1535
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg
            1540                1545                1550
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala
        1555                1560                1565
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser
    1570                1575                1580
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn
1585                1590                1595                1600
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg
                1605                1610                1615
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser
            1620                1625                1630
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys
        1635                1640                1645
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys
    1650                1655                1660
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr
1665                1670                1675                1680
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala
                1685                1690                1695
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Ala Ala
            1700                1705                1710
Gly Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala
        1715                1720                1725
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro
    1730                1735                1740
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys
1745                1750                1755                1760
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr
                1765                1770                1775
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu
            1780                1785                1790
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met
        1795                1800                1805
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe
    1810                1815                1820
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln
1825                1830                1835                1840
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile
                1845                1850                1855
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser
            1860                1865                1870
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val
        1875                1880                1885
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg
    1890                1895                1900
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe
1905                1910                1915                1920
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala
                1925                1930                1935
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly
            1940                1945                1950
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu
        1955                1960                1965
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn
    1970                1975                1980
Arg
1985
<210>17
<211>34658
<212>DNA
<213>人工序列
<220>
<223>ChAd63delta E1,3,4,Ad5E4orf6,NSmut
<400>17
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtgtttga 60
atttggggat gcggggcgct gattggctga gagacgggcg accgttaggg gcggggcggg 120
tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300
aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag 360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgatccc attgcatacg ttgtatccat 480
atcataatat gtacatttat attggctcat gtccaacatt accgccatgt tgacattgat 540
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 600
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 660
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 720
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 780
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 840
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 900
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 960
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 1020
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 1080
ggcgtgtacg gtgggaggtc tatataagca gagctcgttt agtgaaccgt cagatcgcct 1140
ggagacgcca tccacgctgt tttgacctcc atagaagaca ccgggaccga tccagcctcc 1200
gcggccggga acggtgcatt ggaacgcgga ttccccgtgc caagagtgag atctgccacc 1260
atggcgccca tcacggccta ctcccaacag acgcggggcc tacttggttg catcatcact 1320
agccttacag gccgggacaa gaaccaggtc gagggagagg ttcaggtggt ttccaccgca 1380
acacaatcct tcctggcgac ctgcgtcaac ggcgtgtgtt ggaccgttta ccatggtgct 1440
ggctcaaaga ccttagccgg cccaaagggg ccaatcaccc agatgtacac taatgtggac 1500
caggacctcg tcggctggca ggcgcccccc ggggcgcgtt ccttgacacc atgcacctgt 1560
ggcagctcag acctttactt ggtcacgaga catgctgacg tcattccggt gcgccggcgg 1620
ggcgacagta gggggagcct gctctccccc aggcctgtct cctacttgaa gggctcttcg 1680
ggtggtccac tgctctgccc ttcggggcac gctgtgggca tcttccgggc tgccgtatgc 1740
acccgggggg ttgcgaaggc ggtggacttt gtgcccgtag agtccatgga aactactatg 1800
cggtctccgg tcttcacgga caactcatcc cccccggccg taccgcagtc atttcaagtg 1860
gcccacctac acgctcccac tggcagcggc aagagtacta aagtgccggc tgcatatgca 1920
gcccaagggt acaaggtgct cgtcctcaat ccgtccgttg ccgctacctt agggtttggg 1980
gcgtatatgt ctaaggcaca cggtattgac cccaacatca gaactggggt aaggaccatt 2040
accacaggcg cccccgtcac atactctacc tatggcaagt ttcttgccga tggtggttgc 2100
tctgggggcg cttatgacat cataatatgt gatgagtgcc attcaactga ctcgactaca 2160
atcttgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg gcttgtcgtg 2220
ctcgccaccg ctacgcctcc gggatcggtc accgtgccac acccaaacat cgaggaggtg 2280
gccttgtcta atactggaga gatccccttc tatggcaaag ccatccccat tgaagccatc 2340
agggggggaa ggcatctcat tttctgtcat tccaagaaga agtgcgacga gctcgccgca 2400
aagctgtcag gcctcggaat caacgctgtg gcgtattacc gggggctcga tgtgtccgtc 2460
ataccaacta tcggagacgt cgttgtcgtg gcaacagacg ctctgatgac gggctatacg 2520
ggcgactttg actcagtgat cgactgtaac acatgtgtca cccagacagt cgacttcagc 2580
ttggatccca ccttcaccat tgagacgacg accgtgcctc aagacgcagt gtcgcgctcg 2640
cagcggcggg gtaggactgg caggggtagg agaggcatct acaggtttgt gactccggga 2700
gaacggccct cgggcatgtt cgattcctcg gtcctgtgtg agtgctatga cgcgggctgt 2760
gcttggtacg agctcacccc cgccgagacc tcggttaggt tgcgggccta cctgaacaca 2820
ccagggttgc ccgtttgcca ggaccacctg gagttctggg agagtgtctt cacaggcctc 2880
acccacatag atgcacactt cttgtcccag accaagcagg caggagacaa cttcccctac 2940
ctggtagcat accaagccac ggtgtgcgcc agggctcagg ccccacctcc atcatgggat 3000
caaatgtggaagtgtctcat acggctgaaa cctacgctgc acgggccaac acccttgctg  3060
tacaggctgg gagccgtcca aaatgaggtc accctcaccc accccataac caaatacatc 3120
atggcatgca tgtcggctga cctggaggtc gtcactagca cctgggtgct ggtgggcgga 3180
gtccttgcag ctctggccgc gtattgcctg acaacaggca gtgtggtcat tgtgggtagg 3240
attatcttgt ccgggaggcc ggctattgtt cccgacaggg agtttctcta ccaggagttc 3300
gatgaaatgg aagagtgcgc ctcgcacctc ccttacatcg agcagggaat gcagctcgcc 3360
gagcaattca agcagaaagc gctcgggtta ctgcaaacag ccaccaaaca agcggaggct 3420
gctgctcccg tggtggagtc caagtggcga gcccttgaga cattctgggc gaagcacatg 3480
tggaatttca tcagcgggat acagtactta gcaggcttat ccactctgcc tgggaacccc 3540
gcaatagcat cattgatggc attcacagcc tctatcacca gcccgctcac cacccaaagt 3600
accctcctgt ttaacatctt gggggggtgg gtggctgccc aactcgcccc ccccagcgcc 3660
gcttcggctt tcgtgggcgc cggcatcgcc ggtgcggctg ttggcagcat aggccttggg 3720
aaggtgcttg tggacattct ggcgggttat ggagcaggag tggccggcgc gctcgtggcc 3780
ttcaaggtca tgagcggcga gatgccctcc accgaggacc tggtcaatct acttcctgcc 3840
atcctctctc ctggcgccct ggtcgtcggg gtcgtgtgtg cagcaatact gcgtcgacac 3900
gtgggtccgg gagagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcctcgcgg 3960
ggtaatcatg tttcccccac gcactatgtg cctgagagcg acgccgcagc gcgtgttact 4020
cagatcctct ccagccttac catcactcag ctgctgaaaa ggctccacca gtggattaat 4080
gaagactgct ccacaccgtg ttccggctcg tggctaaggg atgtttggga ctggatatgc 4140
acggtgttga ctgacttcaa gacctggctc cagtccaagc tcctgccgca gctaccggga 4200
gtcccttttt tctcgtgcca acgcgggtac aagggagtct ggcggggaga cggcatcatg 4260
caaaccacct gcccatgtgg agcacagatc accggacatg tcaaaaacgg ttccatgagg 4320
atcgtcgggc ctaagacctg cagcaacacg tggcatggaa cattccccat caacgcatac 4380
accacgggcc cctgcacacc ctctccagcg ccaaactatt ctagggcgct gtggcgggtg 4440
gccgctgagg agtacgtgga ggtcacgcgg gtgggggatt tccactacgt gacgggcatg 4500
accactgaca acgtaaagtg cccatgccag gttccggctc ctgaattctt cacggaggtg 4560
gacggagtgc ggttgcacag gtacgctccg gcgtgcaggc ctctcctacg ggaggaggtt 4620
acattccagg tcgggctcaa ccaatacctg gttgggtcac agctaccatg cgagcccgaa 4680
ccggatgtag cagtgctcac ttccatgctc accgacccct cccacatcac agcagaaacg 4740
gctaagcgta ggttggccag ggggtctccc ccctccttgg ccagctcttc agctagccag 4800
ttgtctgcgc cttccttgaa ggcgacatgc actacccacc atgtctctcc ggacgctgac 4860
ctcatcgagg ccaacctcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 4920
tcggagaaca aggtggtagt cctggactct ttcgacccgc ttcgagcgga ggaggatgag 4980
agggaagtat ccgttccggc ggagatcctg cggaaatcca agaagttccc cgcagcgatg 5040
cccatctggg cgcgcccgga ttacaaccct ccactgttag agtcctggaa ggacccggac 5100
tacgtccctc cggtggtgca cgggtgcccg ttgccaccta tcaaggcccc tccaatacca 5160
cctccacgga gaaagaggac ggttgtccta acagagtcct ccgtgtcttc tgccttagcg 5220
gagctcgcta ctaagacctt cggcagctcc gaatcatcgg ccgtcgacag cggcacggcg 5280
accgcccttc ctgaccaggc ctccgacgac ggtgacaaag gatccgacgt tgagtcgtac 5340
tcctccatgc ccccccttga gggggaaccg ggggaccccg atctcagtga cgggtcttgg 5400
tctaccgtga gcgaggaagc tagtgaggat gtcgtctgct gctcaatgtc ctacacatgg 5460
acaggcgcct tgatcacgcc atgcgctgcg gaggaaagca agctgcccat caacgcgttg 5520
agcaactctt tgctgcgcca ccataacatg gtttatgcca caacatctcg cagcgcaggc 5580
ctgcggcaga agaaggtcac ctttgacaga ctgcaagtcc tggacgacca ctaccgggac 5640
gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaactcct atccgtagag 5700
gaagcctgca agctgacgcc cccacattcg gccaaatcca agtttggcta tggggcaaag 5760
gacgtccgga acctatccag caaggccgtt aaccacatcc actccgtgtg gaaggacttg 5820
ctggaagaca ctgtgacacc aattgacacc accatcatgg caaaaaatga ggttttctgt 5880
gtccaaccag agaaaggagg ccgtaagcca gcccgcctta tcgtattccc agatctggga 5940
gtccgtgtat gcgagaagat ggccctctat gatgtggtct ccacccttcc tcaggtcgtg 6000
atgggctcct catacggatt ccagtactct cctgggcagc gagtcgagtt cctggtgaat 6060
acctggaaat caaagaaaaa ccccatgggc ttttcatatg acactcgctg tttcgactca 6120
acggtcaccg agaacgacat ccgtgttgag gagtcaattt accaatgttg tgacttggcc 6180
cccgaagcca gacaggccat aaaatcgctc acagagcggc tttatatcgg gggtcctctg 6240
actaattcaa aagggcagaa ctgcggttat cgccggtgcc gcgcgagcgg cgtgctgacg 6300
actagctgcg gtaacaccct cacatgttac ttgaaggcct ctgcagcctg tcgagctgcg 6360
aagctccagg actgcacgat gctcgtgaac gccgccggcc ttgtcgttat ctgtgaaagc 6420
gcgggaaccc aagaggacgc ggcgagccta cgagtcttca cggaggctat gactaggtac 6480
tctgcccccc ccggggaccc gccccaacca gaatacgact tggagctgat aacatcatgt 6540
tcctccaatg tgtcggtcgc ccacgatgca tcaggcaaaa gggtgtacta cctcacccgt 6600
gatcccacca cccccctcgc acgggctgcg tgggaaacag ctagacacac tccagttaac 6660
tcctggctag gcaacattat catgtatgcg cccactttgt gggcaaggat gattctgatg 6720
actcacttct tctccatcct tctagcacag gagcaacttg aaaaagccct ggactgccag 6780
atctacgggg cctgttactc cattgagcca cttgacctac ctcagatcat tgaacgactc 6840
catggcctta gcgcattttc actccatagt tactctccag gtgagatcaa tagggtggct 6900
tcatgcctca ggaaacttgg ggtaccaccc ttgcgagtct ggagacatcg ggccaggagc 6960
gtccgcgcta ggctactgtc ccaggggggg agggccgcca cttgtggcaa gtacctcttc 7020
aactgggcag tgaagaccaa actcaaactc actccaatcc cggctgcgtc ccagctggac 7080
ttgtccggct ggttcgttgc tggttacagc gggggagaca tatatcacag cctgtctcgt 7140
gcccgacccc gctggttcat gctgtgccta ctcctacttt ctgtaggggt aggcatctac 7200
ctgctcccca accgataaat ctagagctgt gccttctagt tgccagccat ctgttgtttg 7260
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7320
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7380
ggggcagcac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 7440
gggctctaga tgtagcgatc gcgtgagtag tgtttggggg tgggtgggag cctgcatgat 7500
gggcagaatg actaaaatct gtgtttttct gtgtgttgca gcagcatgag cggaagcgcc 7560
tcctttgagg gaggggtatt cagcccttat ctgacggggc gtctcccctc ctgggcggga 7620
gtgcgtcaga atgtgatggg atccacggtg gacggccggc ccgtgcagcc cgcgaactct 7680
tcaaccctga cctacgcgac cctgagctcc tcgtccgtgg acgcagctgc cgccgcagct 7740
gctgcttccg ccgccagcgc cgtgcgcgga atggccctgg gcgccggcta ctacagctct 7800
ctggtggcca actcgagttc caccaataat cccgccagcc tgaacgagga gaagctgttg 7860
ctgctgatgg cccagctcga ggccctgacc cagcgcctgg gcgagctgac ccagcaggtg 7920
gctcagctgc aggcggagac gcgggccgcg gttgccacgg tgaaaaccaa ataaaaaatg 7980
aatcaataaa taaacggaga cggttgttga ttttaacaca gagtcttgaa tctttatttg 8040
atttttcgcg cgcggtaggc cctggaccac cggtctcgat cattgagcac ccggtggatc 8100
ttttccagga cccggtagag gtgggcttgg atgttgaggt acatgggcat gagcccgtcc 8160
cgggggtgga ggtagctcca ttgcagggcc tcgtgctcgg gggtggtgtt gtaaatcacc 8220
cagtcatagc aggggcgcag ggcgtggtgc tgcacgatgt ctttgaggag gagactgatg 8280
gccacgggca gccccttggt gtaggtgttg acgaacctat tgagctggga gggatgcatg 8340
cggggggaga tgagatgcat cttggcctgg atcttgagat tggcgatgtt cccgcccaga 8400
tcccgccggg ggttcatgtt gtgcaggacc accagcacgg tgtatccggt gcacttgggg 8460
aatttgtcat gcaacttgga agggaaggcg tgaaagaatt tggagacgcc cttgtgaccg 8520
cccaggtttt ccatgcactc atccatgatg atggcgatgg gcccgtgggc ggcggcctgg 8580
gcaaagacgt ttcgggggtc ggacacatcg tagttgtggt cctgggtgag ctcgtcatag 8640
gccattttaa tgaatttggg gcggagggta cccgactggg ggacaaaggt gccctcgatc 8700
ccgggggcgt agttcccctc gcagatctgc atctcccagg ccttgagctc ggaggggggg 8760
atcatgtcca cctgcggggc gatgaaaaaa acggtttccg gggcggggga gatgagctgc 8820
gccgaaagca ggttccggag cagctgggac ttgccgcagc cggtggggcc gtagatgacc 8880
ccgatgaccg gctgcaggtg gtagttgagg gagagacagc tgccgtcctc gcggaggagg 8940
ggggccacct cgttcatcat ctcgcgcaca tgcatgttct cgcgcacgag ttccgccagg 9000
aggcgctcgc cccccagcga gaggagctct tgcagcgagg cgaagttttt cagcggcttg 9060
agcccgtcgg ccatgggcat tttggagagg gtctgttgca agagttccag acggtcccag 9120
agctcggtga tgtgctctag ggcatctcga tccagcagac ctcctcgttt cgcgggttgg 9180
ggcgactgcg ggagtagggc accaggcgat gggcgtccag cgaggccagg gtccggtcct 9240
tccagggtcg cagggtccgc gtcagcgtgg tctccgtcac ggtgaagggg tgcgcgccgg 9300
gctgggcgct tgcgagggtg cgcttcaggc tcatccggct ggtcgagaac cgctcccggt 9360
cggcgccctg cgcgtcggcc aggtagcaat tgagcatgag ttcgtagttg agcgcctcgg 9420
ccgcgtggcc cttggcgcgg agcttacctt tggaagtgtg tccgcagacg ggacagagga 9480
gggacttgag ggcgtagagc ttgggggcga ggaagacgga ctcgggggcg taggcgtccg 9540
cgccgcagct ggcgcagacg gtctcgcact ccacgagcca ggtgaggtcg gggcggtcgg 9600
ggtcaaaaac gaggtttcct ccgtgctttt tgatgcgttt cttacctctg gtctccatga 9660
gctcgtgtcc ccgctgggtg acaaagaggc tgtccgtgtc cccgtagacc gactttatgg 9720
gccggtcctc gagcggggtg ccgcggtcct cgtcgtagag gaaccccgcc cactccgaga 9780
cgaaggcccg ggtccaggcc agcacgaagg aggccacgtg ggaggggtag cggtcgttgt 9840
ccaccagcgg gtccaccttc tccagggtat gcaagcacat gtccccctcg tccacatcca 9900
ggaaggtgat tggcttgtaa gtgtaggcca cgtgaccggg ggtcccggcc gggggggtat 9960
aaaagggggc gggcccctgc tcgtcctcac tgtcttccgg atcgctgtcc aggagcgcca 10020
gctgttgggg taggtattcc ctctcgaagg cgggcatgac ctcggcactc aggttgtcag 10080
tttctagaaa cgaggaggat ttgatattga cggtgccgtt ggagacgcct ttcatgagcc 10140
cctcgtccat ctggtcagaa aagacgatct ttttgttgtc gagcttggtg gcgaaggagc 10200
cgtagagggc gttggagagc agcttggcga tggagcgcat ggtctggttc ttttccttgt 10260
cggcgcgctc cttggcggcg atgttgagct gcacgtactc gcgcgccacg cacttccatt 10320
cggggaagac ggtggtgagc tcgtcgggca cgattctgac ccgccagccg cggttgtgca 10380
gggtgatgag gtccacgctg gtggccacct cgccgcgcag gggctcgttg gtccagcaga 10440
ggcgcccgcc cttgcgcgag cagaaggggg gcagcgggtc cagcatgagc tcgtcggggg 10500
ggtcggcgtc cacggtgaag atgccgggca ggagctcggg gtcgaagtag ctgatgcagg 10560
tgcccagatc gtccagactt gcttgccagt cgcgcacggc cagcgcgcgc tcgtaggggc 10620
tgaggggcgt gccccagggc atggggtgcg tgagcgcgga ggcgtacatg ccgcagatgt 10680
cgtagacgta gaggggctcc tggaggacgc cgatgtaggt ggggtagcag cgccccccgc 10740
ggatgctggc gcgcacgtag tcgtacagct cgtgcgaggg cgcgaggagc cccgtgccga 10800
gattggagcg ctgcggcttt tcggcgcggt agacgatctg gcggaagatg gcgtgggagt 10860
tggaggagat ggtgggcctc tggaagatgt tgaagtgggc atggggcagt ccgaccgagt 10920
ccctgatgaa gtgggcgtag gagtcctgca gcttggcgac gagctcggcg gtgacgagga 10980
cgtccagggc gcagtagtcg agggtctctt ggatgatgtc gtacttgagc tggcccttct 11040
gcttccacag ctcgcggttg agaaggaact cttcgcggtc cttccagtac tcttcgaggg 11100
ggaacccgtc ctgatcggca cggtaagagc ccaccatgta gaactggttg acggccttgt 11160
aggcgcagca gcccttctcc acggggaggg cgtaagcttg cgcggccttg cgcagggagg 11220
tgtgggtgag ggcgaaggtg tcgcgcacca tgactttgag gaactggtgc ttgaagtcga 11280
ggtcgtcgca gccgccctgc tcccagagct ggaagtccgt gcgcttcttg taggcggggt 11340
tgggcaaagc gaaagtaaca tcgttgaaga ggatcttgcc cgcgcggggc atgaagttgc 11400
gagtgatgcg gaaaggctgg ggcacctcgg cccggttgtt gatgacctgg gcggcgagga 11460
cgatctcgtc gaagccgttg atgttgtgcc cgacgatgta gagttccacg aatcgcgggc 11520
ggcccttgac gtggggcagc ttcttgagct cgtcgtaggt gagctcggcg gggtcgctga 11580
gcccgtgctg ctcgagggcc cagtcggcga cgtgggggtt ggcgctgagg aaggaagtcc 11640
agagatccac ggccagggcg gtctgcaagc ggtcccggta ctgacggaac tgctggccca 11700
cggccatttt ttcgggggtg acgcagtaga aggtgcgggg gtcgccgtgc cagcggtccc 11760
acttgagctg gagggcgagg tcgtgggcga gctcgacgag cggcgggtcc ccggagagtt 11820
tcatgaccag catgaagggg acgagctgct tgccgaagga ccccatccag gtgtaggttt 11880
ccacatcgta ggtgaggaag agcctttcgg tgcgaggatg cgagccgatg gggaagaact 11940
ggatctcctg ccaccagttg gaggaatggc tgttgatgtg atggaagtag aaatgccgac 12000
ggcgcgccga gcactcgtgc ttgtgtttat acaagcgtcc gcagtgctcg caacgctgca 12060
cgggatgcac gtgctgcacg agctgtacct gggttccttt gacgaggaat ttcagtgggc 12120
agtggagcgc tggcggctgc atctggtgct gtactacgtc ctggccatcg gcgtggccat 12180
cgtctgcctc gatggtggtc atgctgacga gcccgcgcgg gaggcaggtc cagacctcgg 12240
ctcggacggg tcggagagcg aggacgaggg cgcgcaggcc ggagctgtcc agggtcctga 12300
gacgctgcgg agtcaggtca gtgggcagcg gcggcgcgcg gttgacttgc aggagctttt 12360
ccagggcgcg cgggaggtcc agatggtact tgatctccac ggcgccgttg gtggcgacgt 12420
ccacggcttg cagggtcccg tgcccctggg gcgccaccac cgtgccccgt ttcttcttgg 12480
gcggcggcgg ctccatgctt agaagcggcg gcgaggacgc gcgccgggcg gcaggggcgg 12540
ctcggggccc ggaggcaggg gcggcagggg cacgtcggcg ccgcgcgcgg gcaggttctg 12600
gtactgcgcc cggagaagac tggcgtgagc gacgacgcga cggttgacgt cctggatctg 12660
acgcctctgg gtgaaggcca cgggacccgt gagtttgaac ctgaaagaga gttcgacaga 12720
atcaatctcg gtatcgttga cggcggcctg ccgcaggatc tcttgcacgt cgcccgagtt 12780
gtcctggtag gcgatctcgg tcatgaactg ctcgatctcc tcctcctgaa ggtctccgcg 12840
gccggcgcgc tcgacggtgg ccgcgaggtc gttggagatg cggcccatga gctgcgagaa 12900
ggcgttcatg ccggcctcgt tccagacgcg gctgtagacc acggctccgt cggggtcgcg 12960
cgcgcgcatg accacctggg cgaggttgag ctcgacgtgg cgcgtgaaga ccgcgtagtt 13020
gcagaggcgc tggtagaggt agttgagcgt ggtggcgatg tgctcggtga cgaagaagta 13080
catgatccag cggcggagcg gcatctcgct gacgtcgccc agggcttcca agcgctccat 13140
ggcctcgtag aagtccacgg cgaagttgaa aaactgggag ttgcgcgccg agacggtcaa 13200
ctcctcctcc agaagacgga tgagctcggc gatggtggcg cgcacctcgc gctcgaaggc 13260
cccggggggc tcctcttcca tttcctcctc ttcctcctcc actaacatct cttctacttc 13320
ctcctcagga ggcggcggcg ggggaggggc cctgcgtcgc cggcggcgca cgggcagacg 13380
gtcgatgaag cgctcgatgg tctccccgcg ccggcgacgc atggtctcgg tgacggcgcg 13440
cccgtcctcg cggggccgca gcgtgaagac gccgccgcgc atctccaggt ggccgccggg 13500
ggggtctccg ttgggcaggg agagggcgct gacgatgcat cttatcaatt gacccgtagg 13560
gactccgcgc aaggacctga gcgtctcgag atccacggga tccgaaaacc gctgaacgaa 13620
ggcttcgagc cagtcgcagt cgcaaggtag gctgagcccg gtttcttgtt cttcgggtat 13680
ttggtcggga ggcgggcggg cgatgctgct ggtgatgaag ttgaagtagg cggtcctgag 13740
acggcggatg gtggcgagga gcaccaggtc cttgggcccg gcttgctgga tgcgcagacg 13800
gtcggccatg ccccaggcgt ggtcctgaca cctggcgagg tccttgtagt agtcctgcat 13860
gagccgctcc acgggcacct cctcctcgcc cgcgcggccg tgcatgcgcg tgagcccgaa 13920
cccgcgctgc ggctggacga gcgccaggtc ggcgacgacg cgctcggcga ggatggcctg 13980
ctggatctgg gtgagggtgg tctggaagtc gtcgaagtcg acgaagcggt ggtaggctcc 14040
ggtgttgatg gtgtaggagc agttggccat gacggaccag ttgacggtct ggtggccggg 14100
gcgcacgagc tcgtggtact tgaggcgcga gtaggcgcgc gtgtcgaaga tgtagtcgtt 14160
gcaggtgcgc acgaggtact ggtatccgac gaggaagtgc ggcggcggct ggcggtagag 14220
cggccatcgc tcggtggcgg gggcgccggg cgcgaggtcc tcgagcatga ggcggtggta 14280
gccgtagatg tacctggaca tccaggtgat gccggcggcg gtggtggagg cgcgcgggaa 14340
ctcgcggacg cggttccaga tgttgcgcag cggcaggaag tagttcatgg tggccgcggt 14400
ctggcccgtg aggcgcgcgc agtcgtggat gctctagaca tacgggcaaa aacgaaagcg 14460
gtcagcggct cgactccgtg gcctggaggc taagcgaacg ggttgggctg cgcgtgtacc 14520
ccggttcgaa tctcgaatca ggctggagcc gcagctaacg tggtactggc actcccgtct 14580
cgacccaagc ctgctaacga aacctccagg atacggaggc gggtcgtttt ttggccttgg 14640
tcgctggtca tgaaaaacta gtaagcgcgg aaagcggccg cccgcgatgg ctcgctgccg 14700
tagtctggag aaagaatcgc cagggttgcg ttgcggtgtg ccccggttcg agcctcagcg 14760
ctcggcgccg gccggattcc gcggctaacg tgggcgtggc tgccccgtcg tttccaagac 14820
cccttagcca gccgacttct ccagttacgg agcgagcccc tctttttttc ttgtgttttt 14880
gccagatgca tcccgtactg cggcagatgc gcccccaccc tccaccacaa ccgcccctac 14940
cgcagcagca gcaacagccg gcgcttctgc ccccgcccca gcagcagcag ccagccacta 15000
ccgcggcggc cgccgtgagc ggagccggcg ttcagtatga cctggccttg gaagagggcg 15060
aggggctggc gcggctgggg gcgtcgtcgc cggagcggca cccgcgcgtg cagatgaaaa 15120
gggacgctcg cgaggcctac gtgcccaagc agaacctgtt cagagacagg agcggcgagg 15180
agcccgagga gatgcgcgcc tcccgcttcc acgcggggcg ggagctgcgg cgcggcctgg 15240
accgaaagcg ggtgctgagg gacgaggatt tcgaggcgga cgagctgacg gggatcagcc 15300
ccgcgcgcgc gcacgtggcc gcggccaacc tggtcacggc gtacgagcag accgtgaagg 15360
aggagagcaa cttccaaaaa tccttcaaca accacgtgcg cacgctgatc gcgcgcgagg 15420
aggtgaccct gggcctgatg cacctgtggg acctgctgga ggccatcgtg cagaacccca 15480
cgagcaagcc gctgacggcg cagctgtttc tggtggtgca gcacagtcgg gacaacgaga 15540
cgttcaggga ggcgctgctg aatatcaccg agcccgaggg ccgctggctc ctggacctgg 15600
tgaacattct gcagagcatc gtggtgcagg agcgcgggct gccgctgtcc gagaagctgg 15660
cggccatcaa cttctcggtg ctgagcctgg gcaagtacta cgctaggaag atctacaaga 15720
ccccgtacgt gcccatagac aaggaggtga agatcgatgg gttttacatg cgcatgaccc 15780
tgaaagtgct gaccctgagc gacgatctgg gggtgtaccg caacgacagg atgcaccgcg 15840
cggtgagcgc cagccgccgg cgcgagctga gcgaccagga gctgatgcac agcctgcagc 15900
gggccctgac cggggccggg accgaggggg agagctactt tgacatgggc gcggacctgc 15960
gctggcagcc cagccgccgg gccttggaag ctgccggcgg cgtgccctac gtggaggagg 16020
tggacgatga ggaggaggag ggcgagtacc tggaagactg atggcgcgac cgtatttttg 16080
ctagatgcag caacagccac cgccgccgcc tcctgatccc gcgatgcggg cggcgctgca 16140
gagccagccg tccggcatta actcctcgga cgattggacc caggccatgc aacgcatcat 16200
ggcgctgacg acccgcaatc ccgaagcctt tagacagcag cctcaggcca accggctctc 16260
ggccatcctg gaggccgtgg tgccctcgcg ctcgaacccc acgcacgaga aggtgctggc 16320
catcgtgaac gcgctggtgg agaacaaggc catccgcggc gacgaggccg ggctggtgta 16380
caacgcgctg ctggagcgcg tggcccgcta caacagcacc aacgtgcaga cgaacctgga 16440
ccgcatggtg accgacgtgc gcgaggcggt gtcgcagcgc gagcggttcc accgcgagtc 16500
gaacctgggc tccatggtgg cgctgaacgc cttcctgagc acgcagcccg ccaacgtgcc 16560
ccggggccag gaggactaca ccaacttcat cagcgcgctg cggctgatgg tggccgaggt 16620
gccccagagc gaggtgtacc agtcggggcc ggactacttc ttccagacca gtcgccaggg 16680
cttgcagacc gtgaacctga gccaggcttt caagaacttg cagggactgt ggggcgtgca 16740
ggccccggtc ggggaccgcg cgacggtgtc gagcctgctg acgccgaact cgcgcctgct 16800
gctgctgctg gtggcgccct tcacggacag cggcagcgtg agccgcgact cgtacctggg 16860
ctacctgctt aacctgtacc gcgaggccat cgggcaggcg cacgtggacg agcagaccta 16920
ccaggagatc acccacgtga gccgcgcgct gggccaggag gacccgggca acctggaggc 16980
caccctgaac ttcctgctga ccaaccggtc gcagaagatc ccgccccagt acgcgctgag 17040
caccgaggag gagcgcatcc tgcgctacgt gcagcagagc gtggggctgt tcttgatgca 17100
ggagggggcc acgcccagcg ccgcgctcga catgaccgcg cgcaacatgg agcccagcat 17160
gtacgcccgc aaccgcccgt tcatcaataa gctgatggac tacttgcatc gggcggccgc 17220
catgaactcg gactacttta ccaacgccat cttgaacccg cactggctcc cgccgcccgg 17280
gttctacacg ggcgagtacg acatgcccga ccccaacgac gggttcctgt gggacgacgt 17340
ggacagcagc gtgttctcgc cgcggcccac caccaccacc gtgtggaaga aagagggcgg 17400
ggaccggcgg ccgtcctcgg cgctgtccgg tcgcgcgggt gctgccgcgg cggtgcccga 17460
ggctgccagc cccttcccga gcctgccctt ttcgctgaac agcgtgcgca gcagcgagct 17520
gggtcggctg acgcggccgc gcctgctggg cgaggaggag tacctgaacg actccttgtt 17580
gaagcccgag cgcgagaaga acttccccaa taacgggata gagagcctgg tggacaagat 17640
gagccgctgg aagacgtacg cgcacgagca cagggacgag ccccgagcta gcagcgcagg 17700
cacccgtaga cgccagcggc acgacaggca gcggggactg gtgtgggacg atgaggattc 17760
cgccgacgac agcagcgtgt tggacttggg tgggagtggt ggtggtaacc cgttcgctca 17820
cctgcgcccc cgtatcgggc gcctgatgta agaatctgaa aaaataaaag acggtactca 17880
ccaaggccat ggcgaccagc gtgcgttctt ctctgttgtt tgtagtagta tgatgaggcg 17940
cgtgtacccg gagggtcctc ctccctcgta cgagagcgtg atgcagcagg cggtggcggc 18000
ggcgatgcag cccccgctgg aggcgcctta cgtgcccccg cggtacctgg cgcctacgga 18060
ggggcggaac agcattcgtt actcggagct ggcacccttg tacgatacca cccggttgta 18120
cctggtggac aacaagtcgg cggacatcgc ctcgctgaac taccagaacg accacagcaa 18180
cttcctgacc accgtggtgc agaacaacga tttcaccccc acggaggcca gcacccagac 18240
catcaacttt gacgagcgct cgcggtgggg cggccagctg aaaaccatca tgcacaccaa 18300
catgcccaac gtgaacgagt tcatgtacag caacaagttc aaggcgcggg tgatggtctc 18360
gcgcaagacc cccaacgggg tcacggtagg ggatgattat gatggtagtc aggacgagct 18420
gacctacgag tgggtggagt ttgagctgcc cgagggcaac ttctcggtga ccatgaccat 18480
cgatctgatg aacaacgcca tcatcgacaa ctacttggcg gtggggcggc agaacggggt 18540
gctggagagc gacatcggcg tgaagttcga cacgcgcaac ttccggctgg gctgggaccc 18600
cgtgaccgag ctggtgatgc cgggcgtgta caccaacgag gccttccacc ccgacatcgt 18660
cctgctgccc ggctgcggcg tggacttcac cgagagccgc ctcagcaacc tgctgggcat 18720
ccgcaagcgg cagcccttcc aggagggctt ccagatcctg tacgaggacc tggagggggg 18780
caacatcccc gcgctcttgg atgtcgaagc ctatgaagaa agtaaggaaa aagcagaggc 18840
tgaggcaact acagccgtgg ctaccgccgc gactgtggca gatgccactg tcaccagggg 18900
cgatacattc gccacccagg cggaggaagc agccgcccta gcggcgaccg atgatagtga 18960
aagtaagata gtcatcaagc cggtggagaa ggacagcaag aacaggagct acaacgttct 19020
accggatgga aagaacaccg cctaccgcag ctggtacctg gcctacaact acggcgaccc 19080
cgagaagggc gtgcgctcct ggacgctgct caccacctcg gacgtcacct gcggcgtgga 19140
gcaagtctac tggtcgctgc ccgacatgat gcaagacccg gtcaccttcc gctccacgcg 19200
acaagttagc aactacccgg tggtgggcgc cgagctcctg cccgtctact ccaagagctt 19260
cttcaacgag caggccgtct actcgcagca gctgcgtgcc ttcacctcgc tcacgcacgt 19320
cttcaaccgc ttccccgaga accagatcct cgtccgcccg cccgcgccca ccattaccac 19380
cgtcagtgaa aacgttcctg ctctcacaga tcacgggacc ctgccgctgc gcagcagtat 19440
ccggggagtc cagcgcgtga ccgtcactga cgccagacgc cgcacctgcc cctacgtcta 19500
caaggccctg ggcgtagtcg cgccgcgcgt cctctcgagc cgcaccttct aaaaaatgtc 19560
cattctcatc tcgcccagta ataacaccgg ttggggcctg cgcgcgccca gcaagatgta 19620
cggaggcgct cgccaacgct ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc 19680
tccctggggc gccctcaagg gccgcgtgcg ctcgcgcacc accgtcgacg acgtgatcga 19740
ccaggtggtg gccgacgcgc gcaactacac gcccgccgcc gcgcccgcct ccaccgtgga 19800
cgccgtcatc gacagcgtgg tggccgacgc gcgccggtac gcccgcgcca agagccggcg 19860
gcggcgcatc gcccggcggc accggagcac ccccgccatg cgcgcggcgc gagccttgct 19920
gcgcagggcc aggcgcacgg gacgcagggc catgctcagg gcggccagac gcgcggcctc 19980
cggcagcagc agcgccggca ggacccgcag acgcgcggcc acggcggcgg cggcggccat 20040
cgccagcatg tcccgcccgc ggcgcggcaa cgtgtactgg gtgcgcgacg ccgccaccgg 20100
tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgctgac ttcgcgatgt 20160
tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat acaaggaaga gatgctccag 20220
gtcatcgcgc ctgagatcta cggccccgcg gcggcggtga aggaggaaag aaagccccgc 20280
aaactgaagc gggtcaaaaa ggacaaaaag gaggaggaag atgacggact ggtggagttt 20340
gtgcgcgagt tcgccccccg gcggcgcgtg cagtggcgcg ggcggaaagt gaaaccggtg 20400
ctgcggcccg gcaccacggt ggtcttcacg cccggcgagc gttccggctc cgcctccaag 20460cgctcctacg
acgaggtgta cggggacgag gacatcctcg agcaggcggt cgagcgtctg 20520
ggcgagtttg cttacggcaa gcgcagccgc cccgcgccct tgaaagagga ggcggtgtcc 20580
atcccgctgg accacggcaa ccccacgccg agcctgaagc cggtgaccct gcagcaggtg 20640
ctgccgagcg cggcgccgcg ccggggcttc aagcgcgagg gcggcgagga tctgtacccg 20700
accatgcagc tgatggtgcc caagcgccag aagctggagg acgtgctgga gcacatgaag 20760
gtggaccccg aggtgcagcc cgaggtcaag gtgcggccca tcaagcaggt ggccccgggc 20820
ctgggcgtgc agaccgtgga catcaagatc cccacggagc ccatggaaac gcagaccgag 20880
cccgtgaagc ccagcaccag caccatggag gtgcagacgg atccctggat gccagcggct 20940
tccaccacca ccactcgccg aagacgcaag tacggcgcgg ccagcctgct gatgcccaac 21000
tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg cttctaccgc 21060
ggctacacca gcagccgccg ccgcaagacc accacccgcc gccgtcgtcg cagccgccgc 21120
agcagcaccg cgacttccgc cttggtgcgg agagtgtatc gcagcgggcg cgagcctctg 21180
accctgccgc gcgcgcgcta ccacccgagc atcgccattt aactaccgcc tcctacttgc 21240
agatatggcc ctcacatgcc gcctccgcgt ccccattacg ggctaccgag gaagaaagcc 21300
gcgccgtaga aggctgacgg ggaacgggct gcgtcgccat caccaccggc ggcggcgcgc 21360
catcagcaag cggttggggg gaggcttcct gcccgcgctg atccccatca tcgccgcggc 21420
gatcggggcg atccccggca tagcttccgt ggcggtgcag gcctctcagc gccactgaga 21480
cacaaaaaag catggatttg taataaaaaa atggactgac gctcctggtc ctgtgatgtg 21540
tgtttttaga tggaagacat caatttttcg tccctggcac cgcgacacgg cacgcggccg 21600
tttatgggca cctggagcga catcggcaac agccaactga acgggggcgc cttcaattgg 21660
agcagtctct ggagcgggct taagaatttc gggtccacgc tcaaaaccta tggcaacaag 21720
gcgtggaaca gcagcacagg gcaggcgctg agggaaaagc tgaaagagca gaacttccag 21780
cagaaggtgg tcgatggcct ggcctcgggc atcaacgggg tggtggacct ggccaaccag 21840
gccgtgcaga aacagatcaa cagccgcctg gacgcggtcc cgcccgcggg gtccgtggag 21900
atgccccagg tggaggagga gctgcctccc ctggacaagc gcggcgacaa gcgaccgcgt 21960
cccgacgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta cgaggaggcg 22020
gtgaaactgg gtctgcccac cacgcggccc gtggcgcctc tggccaccgg ggtgctgaaa 22080
cccagcagca gcagccagcc cgcgaccctg gacttgcctc cgcctgcttc ccgcccctcc 22140
acagtggcta agcccctgcc gccggtggcc gtcgcgtcgc gcgccccccg aggccgcccc 22200
caggcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca gagtgtgaag 22260
cgccgccgct gctattaaaa gacactgtag cgcttaactt gcttgtctgt gtgtgtatat 22320
gtatgtccgc cgaccagaag gaggaagagg cgcgtcgccg agttgcaaga tggccacccc 22380
atcgatgctg ccccagtggg cgtacatgca catcgccgga caggacgctt cggagtacct 22440
gagtccgggt ctggtgcagt tcgcccgcgc cacagacacc tacttcagtc tggggaacaa 22500
gtttaggaac cccacggtgg cgcccacgca cgatgtgacc accgaccgca gccagcggct 22560
gacgctgcgc ttcgtgcccg tggaccgcga ggacaacacc tactcgtaca aagtgcgcta 22620
cacgctggcc gtgggcgaca accgcgtgct ggacatggcc agcacctact ttgacatccg 22680
cggcgtgctg gatcggggcc ccagcttcaa accctactcc ggcaccgcct acaacagcct 22740
agctcccaag ggagcgccca acacctcaca gtggaaggat tccgacagca aaatgcatac 22800
ttttggagtt gctgccatgc ccggtgttgt tggtaaaaaa atagaagccg atggtctgcc 22860
tattggaata gattcatcct ctggaactga caccataatt tatgctgata aaactttcca 22920
accagagcca caggttggaa gtgacagttg ggtcgacacc aatggtgcag aggaaaaata 22980
tggaggtaga gctcttaagg acactacaaa catgaagccc tgctacggtt cttttgccag 23040
gcctaccaac aaagaaggtg gacaggctaa cataaaagat tctgaaactg ccagcactac 23100
tcctaactat gatatagatt tggcattctt tgacagcaaa aatattgcag ctaactacga 23160
tccagatatt gtaatgtaca cagaaaatgt tgagttgcaa actccagata ctcatattgt 23220
gtttaagcca ggaacttcag atgaaagttc agaagccaat ttgggccagc aggccatgcc 23280
caacagaccc aactacatcg ggttcagaga caactttatc gggctcatgt actacaacag 23340
cactggcaat atgggtgtac tggctggtca ggcctcccag ctaaatgctg tggtggactt 23400
gcaggacaga aacaccgaac tgtcctacca gctcttgctt gactctctgg gtgacagaac 23460
caggtatttc agtatgtgga atcaggcggt ggacagctat gaccccgatg tgcgcattat 23520
tgaaaatcac ggtgtggagg atgaactccc caattattgc ttccctttga atggtgtagg 23580
ctttacagat acttaccagg gtgttaaagt taagacagat acagccgcta ctggtaccaa 23640
tggaacgcag tgggacaaag atgataccac agtcagcact gccaatgaga tccactcagg 23700
caatcctttc gccatggaga tcaacatcca ggccaacctg tggcggaact tcctctacgc 23760
gaacgtggcg ctgtacctgc ccgactccta caagtacacg ccggccaaca tcacgctgcc 23820
gaccaacacc aacacctacg attacatgaa cggccgcgtg gtggcgccct cgctggtgga 23880
cgcctacatc aacatcgggg cgcgctggtc gctggacccc atggacaacg tcaacccctt 23940
caaccaccac cgcaacgcgg gcctgcgcta ccgctccatg ctcctgggca acgggcgcta 24000
cgtgcccttc cacatccagg tgccccaaaa gtttttcgcc atcaagagcc tcctgctcct 24060
gcccgggtcc tacacctacg agtggaactt ccgcaaggac gtcaacatga tcctgcagag 24120
ctccctcggc aacgacctgc gcacggacgg ggcctccatc gccttcacca gcatcaacct 24180
ctacgccacc ttcttcccca tggcgcacaa caccgcctcc acgctcgagg ccatgctgcg 24240
caacgacacc aacgaccagt ccttcaacga ctacctctcg gcggccaaca tgctctaccc 24300
catcccggcc aacgccacca acgtgcccat ctccatcccc tcgcgcaact gggccgcctt 24360
ccgcggatgg tccttcacgc gcctcaagac ccgcgagacg ccctcgctcg gctccgggtt 24420
cgacccctac ttcgtctact cgggctccat cccctacctc gacggcacct tctacctcaa 24480
ccacaccttc aagaaggtct ccatcacctt cgactcctcc gtcagctggc ccggcaacga 24540
ccgcctcctg acgcccaacg agttcgaaat caagcgcacc gtcgacggag agggatacaa 24600
cgtggcccag tgcaacatga ccaaggactg gttcctggtc cagatgctgg cccactacaa 24660
catcggctac cagggcttct acgtgcccga gggctacaag gaccgcatgt actccttctt 24720
ccgcaacttc cagcccatga gccgccaggt cgtggacgag gtcaactaca aggactacca 24780
ggccgtcacc ctggcctacc agcacaacaa ctcgggcttc gtcggctacc tcgcgcccac 24840
catgcgccag ggccagccct accccgccaa ctacccctac ccgctcatcg gcaagagcgc 24900
cgtcgccagc gtcacccaga aaaagttcct ctgcgaccgg gtcatgtggc gcatcccctt 24960
ctccagcaac ttcatgtcca tgggcgcgct caccgacctc ggccagaaca tgctctacgc 25020
caactccgcc cacgcgctag acatgaattt cgaagtcgac cccatggatg agtccaccct 25080
tctctatgtt gtcttcgaag tcttcgacgt cgtccgagtg caccagcccc accgcggcgt 25140
catcgaggcc gtctacctgc gcacgccctt ctcggccggc aacgccacca cctaaagccc 25200
cgctcttgct tcttgcaaga tgacggcctg tggctccggc gagcaggagc tcagggccat 25260
cctccgcgac ctgggctgcg ggccctgctt cctgggcacc ttcgacaagc gcttcccggg 25320
attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 25380
gggcgagcac tggctggcct tcgcctggaa cccgcgctcc cacacctgct acctcttcga 25440
ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 25500
gctgcgccgc agcgccctgg ccaccgagga ccgctgcatc accctggaaa agtccaccca 25560
gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 25620
cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 25680
ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 25740
ggcgctctac cgcttcctca acgcccactc cgcctacttt cgctcccacc gcgcgcgcat 25800
cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaactgtgt gtatgtgaat 25860
gctttattca tcataataaa cagcacatgt ttatgccacc ttctctgagg ctctgacttt 25920
atttagaaat cgaaggggtt ctgccggctc tcggcgtgcc ccgcgggcag ggatacgttg 25980
cggaactggt acttgggcag ccacttgaac tcggggatca gcagcttcgg cacggggagg 26040
tcggggaacg agtcgctcca cagcttgcgc gtgagttgca gggcgcccag caggtcgggc 26100
gcggagatct tgaaatcgca gttgggaccc gcgttctgcg cgcgagagtt gcggtacacg 26160
gggttgcagc actggaacac catcagggcc gggtgcttca cgctcgccag caccgtcgcg 26220
tcggtgatgc cctccacgtc cagatcctcg gcgttggcca tcccgaaggg ggtcatcttg 26280
caggtctgcc gccccatgct gggcacgcag ccgggcttgt ggttgcaatc gcagtgcagg 26340
gggatcagca tcatctgagc ctgctcggag ctcatgcccg ggtacatggc cttcatgaaa 26400
gcctccagct ggcggaaggc ctgctgcgcc ttgccgccct cggtgaagaa gaccccacag 26460
gacttgctag agaactggtt ggtggcgcag cccgcgtcgt gcacgcagca gcgcgcgtcg 26520
ttgttggcca gctgcaccac gctgcgcccc cagcggttct gggtgatctt ggcccggtcg 26580
gggttctcct tcagcgcgcg ctgcccgttc tcgctcgcca catccatctc gatcgtgtgc 26640
tccttctgga tcatcacggt cccgtgcagg caccgcagct tgccctcggc ctcggtgcac 26700
ccgtgcagcc acagcgcgca gccggtgcac tcccagttct tgtgggcgat ctgggagtgc 26760
gagtgcacga agccctgcag gaagcggccc atcatcgtgg tcagggtctt gttgctggtg 26820
aaggtcagcg ggatgccgcg gtgctcctcg ttcacataca ggtggcagat gcggcggtac 26880
acctcgccct gctcgggcat cagctggaag gcggacttca ggtcgctctc cacgcggtac 26940
cgctccatca gcagcgtcat cacttccatg cccttctccc aggccgaaac gatcggcagg 27000
ctcagggggt tcttcaccgt catcttagtc gccgccgccg aagtcagggg gtcgttctcg 27060
tccagggtct caaacactcg cttgccgtcc ttctcggtga tgcgcacggg gggaaagctg 27120
aagcccacgg ccgccagctc ctcctcggcc tgcctttcgt cctcgctgtc ctggctgatg 27180
tcttgcaaag gcacatgctt ggtcttgcgg ggtttctttt tgggcggcag aggcggcggc 27240
ggagacgtgc tgggcgagcg cgagttctcg ctcaccacga ctatttcttc ttcttggccg 27300
tcgtccgaga ccacgcggcg gtaggcatgc ctcttctggg gcagaggcgg aggcgacggg 27360
ctctcgcggt tcggcgggcg gctggcagag ccccttccgc gttcgggggt gcgctcctgg 27420
cggcgctgct ctgactgact tcctccgcgg ccggccattg tgttctccta gggagcaaca 27480
agcatggaga ctcagccatc gtcgccaaca tcgccatctg cccccgccgc cgacgagaac 27540
cagcagcagc agaatgaaag cttaaccgcc ccgccgccca gccccacctc cgacgccgcc 27600
gcggccccag acatgcaaga gatggaggaa tccatcgaga ttgacctggg ctacgtgacg 27660
cccgcggagc acgaggagga gctggcagcg cgcttttcag ccccggaaga gaaccaccaa 27720
gagcagccag agcaggaagc agagagcgag cagcagcagg ctgggctcga gcatggcgac 27780
tacctgagcg gggcagagga cgtgctcatc aagcatctgg cccgccaaag catcatcgtc 27840
aaggacgcgc tgctcgaccg cgccgaggtg cccctcagcg tggcggagct cagccgcgcc 27900
tacgagcgca acctcttctc gccgcgcgtg ccccccaagc gccagcccaa cggcacctgc 27960
gagcccaacc cgcgcctcaa cttctacccg gtcttcgcgg tgcccgaggc cctggccacc 28020
taccacctct ttttcaagaa ccaaaggatc cccgtctcct gccgcgccaa ccgcacccgc 28080
gccgacgccc tgctcaacct gggtcccggc gcccgcctac ctgatatcac ctccttggaa 28140
gaggttccca agatcttcga gggtctgggc agcgacgaga ctcgggccgc gaacgctctg 28200
caaggaagcg gagaggagca tgagcaccac agcgccctgg tggagttgga aggcgacaac 28260
gcgcgcctgg cggtgctcaa gcgcacggtc gagctgaccc acttcgccta cccggcgctc 28320
aacctgcccc ccaaggtcat gagcgccgtc atggaccagg tgctcatcaa gcgcgcctcg 28380
cccctctcag aggaggagat gcaggacccc gagagctcgg acgagggcaa gcccgtggtc 28440
agcgacgagc agctggcgcg ctggctggga gcgagcagca ccccccagag cctggaagag 28500
cggcgcaagc tcatgatggc cgtggtcctg gtgaccgtgg agctggagtg tctgcgccgc 28560
ttcttcgccg acgcggagac cctgcgcaag gtcgaggaga acctgcacta cctcttcagg 28620
cacgggttcg tgcgccaggc ctgcaagatc tccaacgtgg agctgaccaa cctggtctcc 28680
tacatgggca tcctgcacga gaaccgcctg gggcagaacg tgctgcacac caccctgcgc 28740
ggggaggccc gccgcgacta catccgcgac tgcgtctacc tgtacctctg ccacacctgg 28800
cagacgggca tgggcgtgtg gcagcagtgc ctggaggagc agaacctgaa agagctctgc 28860
aagctcctgc agaagaacct caaggccctg tggaccgggt tcgacgagcg caccaccgcc 28920
tcggacctgg ccgacctcat cttccccgag cgcctgcggc tgacgctgcg caacgggctg 28980
cccgacttta tgagccaaag catgttgcaa aactttcgct ctttcatcct cgaacgctcc 29040
gggatcctgc ccgccacctg ctccgcactg ccctcggact tcgtgccgct gaccttccgc 29100
gagtgccccc cgccgctctg gagccactgc tacttgctgc gcctggccaa ctacctggcc 29160
taccactcgg acgtgatcga ggacgtcagc agcgagggtc tgctcgagtg ccactgccgc 29220
tgcaacctct gcacgccgca ccgctccttg gcctgcaacc cccagctgct gagcgagacc 29280
cagatcatcg gcaccttcga gttgcaaggc cccggcgagg gcaagggggg tctcaaactc 29340
accccggggc tgtggacctc ggcctacttg cgcaagttcg tgcccgagga ctaccatccc 29400
ttcgagatca ggttctacga ggaccaatcc cagccgccca aggccgagct gtcggcctgc 29460
gtcatcaccc agggggccat cctggcccaa ttgcaagcca tccagaaatc ccgccaagaa 29520
tttctgctga aaaagggcca cggggtctac ttggaccccc agaccggaga ggagctcaac 29580
cccagcttcc cccaggatgc cccgaggaag cagcaagaag ctgaaagtgg agctgccgct 29640
gccgccggag gatttggagg aagactggga gagcagtcag gcagaggaga tggaagactg 29700
ggacagcact caggcagagg aggacagcct gcaagacagt ctggaggagg aagacgaggt 29760
ggaggaggag gcagaggaag aagcagccgc cgccagaccg tcgtcctcgg cggaggagaa 29820
agcaagcagc acggatacca tctccgctcc gggtcggggt cgcggcggcc gggcccacag 29880
tagatgggac gagaccgggc gcttcccgaa ccccaccacc cagaccggta agaaggagcg 29940
gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct tgcaagcctg 30000
cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg tgaacttccc 30060
ccgcaacatc ttgcattact accgtcacct ccacagcccc tactactgtt tccaagaaga 30120
ggcagaaacc cagcagcagc agcagaaaac cagcggcagc agcagcagct agaaaatcca 30180
cagcggcggc aggtggactg aggatcgcgg cgaacgagcc ggcgcagacc cgggagctga 30240
ggaaccggat ctttcccacc ctctatgcca tcttccagca gagtcggggg caggagcagg 30300
aactgaaagt caagaaccgt tctctgcgct cgctcacccg cagttgtctg tatcacaaga 30360
gcgaagacca acttcagcgc actctcgagg acgccgaggc tctcttcaac aagtactgcg 30420
cgctcactct taaagagtag cccgcgcccg cccacacacg gaaaaaggcg ggaattacgt 30480
caccacctgc gcccttcgcc cgaccatcat catgagcaaa gagattccca cgccttacat 30540
gtggagctac cagccccaga tgggcctggc cgccggcgcc gcccaggact actccacccg 30600
catgaactgg ctcagtgccg ggcccgcgat gatctcacgg gtgaatgaca tccgcgccca 30660
ccgaaaccag atactcctag aacagtcagc gatcaccgcc acgccccgcc atcaccttaa 30720
tccgcgtaat tggcccgccg ccctggtgta ccaggaaatt ccccagccca cgaccgtact 30780
acttccgcga gacgcccagg ccgaagtcca gctgactaac tcaggtgtcc agctggccgg 30840
cggcgccgcc ctgtgtcgtc accgccccgc tcagggtata aagcggctgg tgatccgagg 30900
cagaggcaca cagctcaacg acgaggtggt gagctcttcg ctgggtctgc gacctgacgg 30960
agtcttccaa ctcgccggat cggggagatc ttccttcacg cctcgtcagg ccgtcctgac 31020
tttggagagt tcgtcctcgc agccccgctc gggcggcatc ggcactctcc agttcgtgga 31080
ggagttcact ccctcggtct acttcaaccc cttctccggc tcccccggcc actacccgga 31140
cgagttcatc ccgaacttcg acgccatcag cgagtcggtg gacggctacg attgaatgtc 31200
ccatggtggc gcggctgacc tagctcggct tcgacacctg gaccactgtt aattaatcgc 31260
ctctcctacg agctcctgca gcagcgccag aagttcacct gcctggtcgg agtcaacccc 31320
atcgtcatca cccagcagtc gggcgatacc aaggggtgca tccactgctc ctgcgactcc 31380
cccgactgcg tccacactct gatcaagacc ctctgcggcc tccgcgacct cctccccatg 31440
aactaatcac ccccttatcc agtgaaataa agatcatatt gatgatgatt ttacagaaat 31500
aaagatacaa tcatattgat gatttgagtt taataaaaaa taaagaatca cttacttgaa 31560
atctgatacc aggtctctgt ccatgttttc tgccaacacc acttcactcc cctcttccca 31620
gctctggtac tgcaggcccc ggcgggctgc aaacttcctc cacacgctga aggggatgtc 31680
aaattcctcc tgtccctcaa tcttcatttt atcttctatc agatgtccaa aaagcgcgtc 31740
cgggtggatg atgacttcga ccccgtctac ccctacgatg cagacaacgc accgaccgtg 31800
cccttcatca accccccctt cgtctcttca gatggattcc aagagaagcc cctgggggtg 31860
ctgtccctgc gactggccga ccccgtcacc accaagaacg gggaaatcac cctcaagctg 31920
ggagaggggg tggacctcga ctcctcggga aaactcatct ccaacacggc caccaaggcc 31980
gccgcccctc tcagtttttc caacaacacc atttccctta acatggatca ccccttttac 32040
actaaagatg gaaaattatc cttacaagtt tctccaccat taaatatact gagaacaagc 32100
attctaaaca cactagcttt aggttttgga tcaggtttag gactccgtgg ctctgccttg 32160
gcagtacagt tagtctctcc acttacattt gatactgatg gaaacataaa gcttacctta 32220
gacagaggtt tgcatgttac aacaggagat gcaattgaaa gcaacataag ctgggctaaa 32280
ggtttaaaat ttgaagatgg agccatagca accaacattg gaaatgggtt agagtttgga 32340
agcagtagta cagaaacagg tgttgatgat gcttacccaa tccaagttaa acttggatct 32400
ggccttagct ttgacagtac aggagccata atggctggta acaaagaaga cgataaactc 32460
actttgtgga caacacctga tccatcgcca aactgtcaaa tactcgcaga aaatgatgca 32520
aaactaacac tttgcttgac taaatgtggt agtcaaatac tggccactgt gtcagtctta 32580
gttgtaggaa gtggaaacct aaaccccatt actggcaccg taagcagtgc tcaggtgttt 32640
ctacgttttg atgcaaacgg tgttctttta acagaacatt ctacactaaa aaaatactgg 32700
gggtataggc agggagatag catagatggc actccatata ccaatgctgt aggattcatg 32760
cccaatttaa aagcttatcc aaagtcacaa agttctacta ctaaaaataa tatagtaggg 32820
caagtataca tgaatggaga tgtttcaaaa cctatgcttc tcactataac cctcaatggt 32880
actgatgaca gcaacagtac atattcaatg tcattttcat acacctggac taatggaagc 32940
tatgttggag caacatttgg ggctaactct tataccttct catacatcgc ccaagaatga 33000
acactgtatc ccaccctgca tgccaaccct tcccacccca ctctgtggaa aaaactctga 33060
aacacaaaat aaaataaagt tcaagtgttt tattgattca acagttttac aggattcgag 33120
cagttatttt tcctccaccc tcccaggaca tggaatacac caccctctcc ccccgcacag 33180
ccttgaacat ctgaacgcca ttggtgatgg acatgctttt ggtctccacg ttccacacag 33240
tttcagagcg agccagtctc gggtcggtca gggagatgaa accctccggg cacaattggg 33300
agaagtactc gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 33360
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 33420
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg 33480
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 33540
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 33600
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 33660
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 33720
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 33780
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca 33840
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 33900
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg 33960
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 34020
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 34080
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga 34140
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt 34200
tcctgaagtc ttggcgcgcc aaagtctaga cagcgtccat agcttaccga gcagcagcag 34260
cagcacacaa caggcgcaag agtcagagaa aggctgagct ctaacctgtc cacccgctct 34320
ctgctcaata tatagcccag atctacactg acgtaaaggc caaagtctaa aaatacccgc 34380
caaatagtca cacacgccca gcacacgccc agaaaccggt gacacactca aaaaaatacg 34440
cgcacttcct caaacgccca aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 34500
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 34560
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 34620
aacgcgcacc aaaagtttga ggtatattat tgatgatg                         34658
<210>18
<211>10
<212>DNA
<213>人工序列
<220>
<223>核糖体结合位点
<400>18
gccaccaugg    10
<210>19
<211>49
<212>DNA
<213>人工序列
<220>
<223>合成的多聚腺苷酸化信号
<400>19
aauaaaagau cuuuauuuuc auuagaucug uguguugguu uuuugugug              49
<210>20
<211>33
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>20
tattctgcga tcgctgaggt gggtgagtgg gcg                               33
<210>21
<211>31
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>21
taggcgcgcc cttaaacggc atttgtggga g                                 31
<210>22
<211>27
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>22
cgtctagaag acccgagtct taccagt                                       27
<210>23
<211>39
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>23
cgggatccgt ttaaaccatc atcaataata taccttatt                          39
<210>24
<211>37
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>24
atggaattcg tttaaaccat catcaataat atacctt                            37
<210>25
<211>45
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>25
atgacgcgat cgctgatatc ctataataat aaaacgcaga ctttg                   45
<210>26
<211>27
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>26
cgtctagaca gcgtccatag cttaccg                                       27
<210>27
<211>40
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>27
cgggatccgt ttaaaccatc atcaataata tacctcaaac                         40
<210>28
<211>32
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>28
atgcgcgatc gcgtgagtag tgtttggggg tg              32
<210>29
<211>32
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>29
taggcgcgcc gcttctcctc gttcaggctg gc              32
<210>30
<211>41
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>30
atggaattcg tttaaaccat catcaataat atacctcaaa c    41
<210>31
<211>32
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>31
tcaagatatc cgtaaaaaca ccggactttg ac              32
<210>32
<211>32
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>32
tgatatccca ttgcatacgt tgtatccata tc              32
<210>33
<211>25
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>33
tgatatctag agcccaccgc atccc                                  25

Claims (50)

1.包含编码HCV多肽的核苷酸序列的核酸,所述HCV多肽包含第一个HCV区和第二个HCV区,其中
所述第一个HCV区包含与来自第一种HCV毒株的HCV NS3-4A基本上相似的HCV NS3-4A氨基酸序列,和
所述第二个HCV区包含与来自第二种HCV毒株的HCV NS3-NS4A-NS4B-NS5A基本上相似的HCV NS3-NS4A-NS4B-NS5A氨基酸序列,
其中所述第一个区HCV NS3-4A氨基酸序列与所述第二个区HCVNS3-4A氨基酸序列不同,
条件是所述第一个区位于所述第二个区的氨基或者羧基侧。
2.权利要求1的核酸,其中所述第一个区HCV NS3-4A氨基酸序列与来自所述第一种HCV毒株的HCV NS3-4A有至少85%的序列同一性,所述第二个区HCV NS3-NS4A-NS4B-NS5A氨基酸与来自所述第二种毒株的HCV NS3-NS4A-NS4B-NS5A有至少85%的序列同一性,条件是所述第一个区HCV NS3-4A氨基酸序列与所述第二个区HCV NS3-4A氨基酸序列相差至少5%。
3.权利要求2的核酸,其中所述第二个HCV区还包含HCVNS5B,从而所述第二个区提供了NS3-NS4A-NS4B-NS5A-NS5B,条件是所述第二个区具有足够的蛋白酶活性以自身加工而在体内产生所述NS5B并且所述NS5B蛋白质是酶学上无活性的。
4.权利要求3的核酸,其中所述第一个区在所述第二个区的氨基侧并且所述第一个区提供了足够的蛋白酶活性以自身加工产生HCVNS3。
5.权利要求4的核酸,其中所述HCV多肽与SEQ ID NO:1基本上相似。
6.权利要求5的核酸,其中所述HCV多肽由SEQ ID NO:1组成。
7.权利要求5的核酸,其中所述核苷酸序列与SEQ ID NO:2的碱基1891-9915基本上相似。
8.权利要求1-7任一项的核酸,其中所述核酸包含编码所述核苷酸序列的表达盒。
9.权利要求8的核酸,其中所述核酸是穿梭载体,其还包含选择标记、复制起点、所述表达盒侧翼的第一个腺病毒同源区和第二个腺病毒同源区,其中所述第一个同源区具有与野生型腺病毒区的至少右端基本上同源的至少约100个碱基对,并且所述第二个同源区具有与野生型腺病毒区的至少左端基本上同源的至少约100个碱基对。
10.权利要求8的核酸,其中所述核酸是腺病毒基因组质粒,其包含选择标记、复制起点和含有E1缺失、E3缺失和任选的E4缺失的重组腺病毒载体基因组,条件是所述表达盒位于E1或者E3缺失。
11.权利要求10的核酸,其中所述重组腺病毒载体基因组编码下面的至少一种:
a)具有与SEQ ID NO:3或9基本上相似的氨基酸序列的尾丝区;
b)具有与SEQ ID NO:5或11基本上相似的氨基酸序列的六邻体区;和
c)具有与SEQ ID NO:7基本上相似的氨基酸序列的五邻体区。
12.权利要求8的核酸,其中所述核酸是表达载体。
13.权利要求12的核酸,其中所述表达载体是质粒。
14.权利要求13的核酸,其中所述质粒还包含原核生物复制起点和选择标记。
15.权利要求14的核酸,其中所述核酸与SEQ ID NO:2的核酸基本上相似。
16.权利要求15的核酸,其中所述核酸由SEQ ID NO:2组成。
17.权利要求12的核酸,其中所述表达载体是重组腺病毒载体,其中所述腺病毒载体包含重组腺病毒基因组。
18.权利要求17的核酸,其中所述重组腺病毒基因组含有E1缺失、E3缺失,和任选的E4缺失,并且所述表达盒位于E1或者E3缺失。
19.权利要求18的核酸,其中所述重组腺病毒载体基因组编码下面的至少一种:
a)具有与SEQ ID NO:3或9基本上相似的氨基酸序列的尾丝区;
b)具有与SEQ ID NO:5或11基本上相似的氨基酸序列的六邻体区;和
c)具有与SEQ ID NO:7基本上相似的氨基酸序列的五邻体区。
20.权利要求19的核酸,其中所述腺病毒基因组与SEQ ID NO:14或15中对应的区域基本上相似。
21.重组腺病毒载体,其包含:
a)编码HCV多肽的表达盒,其中所述HCV多肽包含HCV NS3-NS4A-NS5A;和
b)含有E1缺失、E3缺失和任选的E4缺失的腺病毒基因组,条件是所述基因组编码下面的至少一种:
i)具有与SEQ ID NO:3或9基本上相似的氨基酸序列的尾丝区;
ii)具有与SEQ ID NO:5或11基本上相似的氨基酸序列的六邻体区;和
iii)具有与SEQ ID NO:7基本上相似的氨基酸序列的五邻体区,
其中所述表达盒位于E1或E3缺失。
22.权利要求21的载体,其中
所述HCV多肽包含HCV NS3-NS4A-NS5A-NS5B并且在体内产生足够的活性以自身加工而产生NS5B蛋白质,并且所述NS5B蛋白质是酶学上无活性的;和
所述腺病毒基因组含有E4缺失和与SEQ ID NO:13的核苷酸34601-35482基本上相似的Ad5 E4orf6序列的插入。
23.权利要求21的载体,其中所述载体与SEQ ID NO:13或17基本上相似。
24.权利要求23的载体,其中所述载体由SEQ ID NO:13或17的核酸序列组成。
25.包含权利要求17的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
26.包含权利要求18的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
27.包含权利要求19的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
28.包含权利要求22的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
29.包含权利要求23的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
30.包含权利要求24的重组腺病毒基因组的重组腺病毒颗粒,其中所述颗粒由所述重组腺病毒基因组编码。
31.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求17的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
32.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求18的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
33.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求19的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
34.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求22的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
35.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求23的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
36.制备重组腺病毒颗粒的方法,其包括步骤:
a)使用E1补充细胞表达权利要求24的重组腺病毒基因组产生所述颗粒;和
b)基本上纯化所述颗粒。
37.药物制剂,其包含治疗有效量的权利要求12的核酸和可药用载体。
38.药物制剂,其包含治疗有效量的权利要求14的核酸和可药用载体。
39.药物制剂,其包含治疗有效量的权利要求15的核酸和可药用载体。
40.药物制剂,其包含治疗有效量的权利要求17的核酸和可药用载体。
41.药物制剂,其包含治疗有效量的权利要求18的核酸和可药用载体。
42.药物制剂,其包含治疗有效量的权利要求19的核酸和可药用载体。
43.药物制剂,其包含治疗有效量的权利要求21-24任一项的重组腺病毒载体和可药用载体。
44.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求12的核酸的步骤。
45.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求14的核酸的步骤。
46.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求15的核酸的步骤。
47.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求17的核酸的步骤。
48.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求18的核酸的步骤。
49.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求19的核酸的步骤。
50.治疗患者的方法,其包括对所述患者施用治疗有效量的权利要求21-24任一项的核酸的步骤。
CN2006800216989A 2005-06-17 2006-06-13 丙型肝炎病毒核酸疫苗 Active CN101213204B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US69152305P 2005-06-17 2005-06-17
US60/691,523 2005-06-17
US69951405P 2005-07-15 2005-07-15
US60/699,514 2005-07-15
PCT/EP2006/005697 WO2006133911A2 (en) 2005-06-17 2006-06-13 Hepatitis c virus nucleic acid vaccine

Publications (2)

Publication Number Publication Date
CN101213204A true CN101213204A (zh) 2008-07-02
CN101213204B CN101213204B (zh) 2013-06-19

Family

ID=37074602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800216989A Active CN101213204B (zh) 2005-06-17 2006-06-13 丙型肝炎病毒核酸疫苗

Country Status (9)

Country Link
US (1) US9056090B2 (zh)
EP (2) EP1893636A2 (zh)
JP (1) JP5475279B2 (zh)
CN (1) CN101213204B (zh)
AU (1) AU2006257323B2 (zh)
CA (1) CA2610919C (zh)
ES (1) ES2948791T3 (zh)
HK (1) HK1123055A1 (zh)
WO (1) WO2006133911A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103889460A (zh) * 2011-10-24 2014-06-25 宾夕法尼亚大学理事会 改进的hcv疫苗及其使用方法
CN108025058A (zh) * 2015-06-12 2018-05-11 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
CN108367061A (zh) * 2015-07-27 2018-08-03 葛兰素史密丝克莱恩生物有限公司 用于诱导免疫应答的新方法
CN110300597A (zh) * 2016-12-09 2019-10-01 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
CN116802280A (zh) * 2021-01-21 2023-09-22 希力德株式会社 不包括有复制能力的腺病毒的新型腺病毒载体及其用途

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006257323B2 (en) 2005-06-17 2011-12-22 Msd Italia S.R.L. Hepatitis C virus nucleic acid vaccine
WO2009079834A1 (fr) * 2007-12-18 2009-07-02 Peking University People's Hospital Vaccin anti-vhc et procédés de préparation et utilisations de celui-ci
EP2250255A2 (en) 2008-03-04 2010-11-17 The Trustees of the University of Pennsylvania Simian adenoviruses sadv-36,-42.1, -42.2, and -44 and uses thereof
JP5753090B2 (ja) * 2008-10-29 2015-07-22 ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア 改良型hcvワクチンおよびその使用方法
CA3108979A1 (en) * 2009-02-02 2010-08-05 Glaxosmithkline Biologicals Sa Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
US9526777B2 (en) 2010-04-16 2016-12-27 The United States Of America As Represented By The Department Of Health And Human Services Methods for the induction of ebola virus-specific immune responses comprising administering a replication-defective chimpanzee adenovirus vector expressing the ebola virus glycoprotein
BR112014028684A2 (pt) 2012-05-18 2017-07-25 Univ Pennsylvania subfamília e adenovírus de símio a1302, a1320, a1331 e a1337 e usos dos mesmos
AU2014236207B2 (en) 2013-03-14 2019-05-23 Salk Institute For Biological Studies Oncolytic adenovirus compositions
JP7054527B2 (ja) 2016-02-23 2022-04-14 ソーク インスティテュート フォー バイオロジカル スタディーズ アデノウイルスの複製動態を測定するための高スループットアッセイ
KR20220163505A (ko) 2016-02-23 2022-12-09 솔크 인스티튜트 포 바이올로지칼 스터디즈 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현
WO2017197055A1 (en) 2016-05-10 2017-11-16 C4 Therapeutics, Inc. Heterocyclic degronimers for target protein degradation
CN109641874A (zh) 2016-05-10 2019-04-16 C4医药公司 用于靶蛋白降解的c3-碳连接的戊二酰亚胺降解决定子体
EP3454862A4 (en) 2016-05-10 2020-02-12 C4 Therapeutics, Inc. SPIROCYCLIC DEGRONIMERS FOR TARGET PROTEIN REDUCTION
EP3532082A4 (en) 2016-12-12 2020-08-26 Salk Institute for Biological Studies SYNTHETIC ADENOVIRUS TUMOR TARGETING AND THEIR USES

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5110587A (en) 1981-12-24 1992-05-05 Health Research, Incorporated Immunogenic composition comprising synthetically modified vaccinia virus
US5174993A (en) 1981-12-24 1992-12-29 Health Research Inc. Recombinant avipox virus and immunological use thereof
US5833975A (en) 1989-03-08 1998-11-10 Virogenetics Corporation Canarypox virus expressing cytokine and/or tumor-associated antigen DNA sequence
US5505941A (en) 1981-12-24 1996-04-09 Health Research, Inc. Recombinant avipox virus and method to induce an immune response
US4722848A (en) 1982-12-08 1988-02-02 Health Research, Incorporated Method for immunizing animals with synthetically modified vaccinia virus
US4769330A (en) 1981-12-24 1988-09-06 Health Research, Incorporated Modified vaccinia virus and methods for making and using the same
US4603112A (en) 1981-12-24 1986-07-29 Health Research, Incorporated Modified vaccinia virus
DE3584341D1 (de) 1984-08-24 1991-11-14 Upjohn Co Rekombinante dna-verbindungen und expression von polypeptiden wie tpa.
US5266313A (en) 1987-02-03 1993-11-30 The United States Of America As Represented By The Department Of Health And Human Services Raccoon poxvirus as a gene expression and vaccine vector for genes of rabies virus and other organisms
CA1341245C (en) 1988-01-12 2001-06-05 F. Hoffmann-La Roche Ag Recombinant vaccinia virus mva
US5863542A (en) 1991-03-07 1999-01-26 Virogenetics Corporation Recombinant attenuated ALVAC canaryopox virus containing heterologous HIV or SIV inserts
IT1270939B (it) 1993-05-11 1997-05-26 Angeletti P Ist Richerche Bio Procedimento per la preparazione di immunogeni e reagenti diagnostici,e immunogeni e reagenti diagnostici cosi' ottenibili.
US5989245A (en) 1994-03-21 1999-11-23 Prescott; Marvin A. Method and apparatus for therapeutic laser treatment
US5505947A (en) 1994-05-27 1996-04-09 The University Of North Carolina At Chapel Hill Attenuating mutations in Venezuelan Equine Encephalitis virus
ES2333425T5 (es) 1995-06-15 2012-08-28 Crucell Holland B.V. Sistemas de empaquetado para adenovirus recombinante humano destinados a terapia génica
WO1997044469A2 (en) * 1996-05-24 1997-11-27 Chiron Corporation Multiple epitope fusion protein
US6514731B1 (en) 1996-05-24 2003-02-04 Chiron Corporation Methods for the preparation of hepatitis C virus multiple copy epitope fusion antigens
EP1009763A4 (en) 1996-06-11 2002-08-07 Merck & Co Inc SYNTHETIC GENES OF HEPATITIS C
FR2761689B1 (fr) * 1997-04-02 1999-06-25 Transgene Sa Fibre adenovirale modifiee et adenovirus cibles
EA002087B1 (ru) 1997-04-03 2001-12-24 Электрофект Ас Способ введения фармацевтических препаратов и нуклеиновых кислот в скелетную мышцу
CN1246922A (zh) 1997-12-09 2000-03-08 松下电器产业株式会社 旋光度测定装置和尿检查方法
CA2328180A1 (en) 1998-04-14 1999-10-21 Merck & Co., Inc. Needleless administration of polynucleotide formulations
GB9810756D0 (en) 1998-05-19 1998-07-15 Angeletti P Ist Richerche Bio Mimotopes of hypervariable region 1 of the e2 glycoprotein of hcv and uses thereof
US6156588A (en) 1998-06-23 2000-12-05 Vlsi Technology, Inc. Method of forming anti-fuse structure
EP1232267B1 (en) 1999-10-27 2013-03-20 Novartis Vaccines and Diagnostics, Inc. Activation of hcv-specific t cells
AU2574601A (en) 1999-11-24 2001-06-04 Chiron Corporation Novel hcv non-structural polypeptide
ATE530672T1 (de) 2001-06-22 2011-11-15 Univ Pennsylvania Rekombinante adenoviren mit affen-adenovirus proteinen und verwendung davon.
US7598362B2 (en) * 2001-10-11 2009-10-06 Merck & Co., Inc. Hepatitis C virus vaccine
AU2003268145A1 (en) 2002-08-22 2004-03-11 Merck And Co., Inc. Methods for propagating adenovirus and virus produced thereby
WO2004099422A2 (en) * 2003-03-28 2004-11-18 The Scripps Research Institute Adenovirus particles with enhanced infectivity of dendritic cells and particles with decreased infectivity of hepatocytes
TWI291500B (en) 2003-05-07 2007-12-21 Univ Southern California Method of electrochemically fabricating multilayer structures having improved interlayer adhesion
DE602005017743D1 (de) * 2004-01-23 2009-12-31 Angeletti P Ist Richerche Bio Impfstoffträger für schimpansen-adenovirus
AU2006257323B2 (en) 2005-06-17 2011-12-22 Msd Italia S.R.L. Hepatitis C virus nucleic acid vaccine

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103889460A (zh) * 2011-10-24 2014-06-25 宾夕法尼亚大学理事会 改进的hcv疫苗及其使用方法
CN103889460B (zh) * 2011-10-24 2016-06-15 宾夕法尼亚大学理事会 改进的hcv疫苗及其使用方法
CN108025058A (zh) * 2015-06-12 2018-05-11 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
CN108025058B (zh) * 2015-06-12 2022-12-16 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
CN108367061A (zh) * 2015-07-27 2018-08-03 葛兰素史密丝克莱恩生物有限公司 用于诱导免疫应答的新方法
CN110300597A (zh) * 2016-12-09 2019-10-01 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
CN116802280A (zh) * 2021-01-21 2023-09-22 希力德株式会社 不包括有复制能力的腺病毒的新型腺病毒载体及其用途

Also Published As

Publication number Publication date
HK1123055A1 (en) 2009-06-05
AU2006257323A1 (en) 2006-12-21
ES2948791T3 (es) 2023-09-19
US20090035277A1 (en) 2009-02-05
JP5475279B2 (ja) 2014-04-16
EP2570423B1 (en) 2023-05-03
WO2006133911A2 (en) 2006-12-21
US9056090B2 (en) 2015-06-16
CA2610919C (en) 2013-09-10
EP2570423A1 (en) 2013-03-20
CA2610919A1 (en) 2006-12-21
AU2006257323B2 (en) 2011-12-22
JP2008543295A (ja) 2008-12-04
EP1893636A2 (en) 2008-03-05
CN101213204B (zh) 2013-06-19
WO2006133911A3 (en) 2007-04-12

Similar Documents

Publication Publication Date Title
CN101213204A (zh) 丙型肝炎病毒核酸疫苗
AU2019271972B2 (en) Adenovirus polynucleotides and polypeptides
KR102205908B1 (ko) 아데노바이러스 벡터
ES2627288T3 (es) Portadores de vacuna de adenovirus de chimpancé
KR101761425B1 (ko) 시미안 아데노바이러스 핵산- 및 아미노산-서열, 이를 포함하는 벡터 및 이의 용도
RU2762854C2 (ru) Последовательности нуклеиновых кислот и аминокислотные последовательности аденовирусов человекообразных обезьян, исключая человека, содержащие их векторы, и их применения
AU2011332025B2 (en) Subfamily E simian adenoviruses A1321, A1325, A1295, A1309 and A1322 and uses thereof
DK2753355T3 (en) ONCOLYTIC HERP SIMPLEX VIRUSES AND THERAPEUTIC APPLICATIONS THEREOF
CN1833027B (zh) 产生嵌合腺病毒的方法及这种嵌合腺病毒的用途
AU2018203259A2 (en) Recombinant HCMV and RhCMV vectors and uses thereof
KR20180034589A (ko) 면역 반응을 유도하기 위한 신규한 방법
KR101668163B1 (ko) Cmv용 백신으로서의 조건부 복제 시토메갈로바이러스
KR20150014505A (ko) 아과 e 원숭이 아데노바이러스 a1302, a1320, a1331 및 a1337 및 이것들의 사용
JP2024073576A (ja) 改変アデノウイルス
KR20170063801A (ko) 종양 살상 바이러스 및 이의 사용방법
CN107574154A (zh) 猴(大猩猩)腺病毒或腺病毒载体及其使用方法
KR20210065205A (ko) 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현
JP2023145678A (ja) エプスタインバールウイルス抗原構築物
CN113897388B (zh) 一种新型黑猩猩腺病毒载体及其构建方法和应用
KR20200083510A (ko) 아데노바이러스 및 이의 용도
US20040106194A1 (en) Methods for propagating adenovirus and virus produced thereby
CN116940589A (zh) 重组sars-cov-2疫苗
CN114761030A (zh) 具有诱导的抗肿瘤免疫的溶瘤病毒疗法
NL2023464B1 (en) Oncolytic Non-human adenoviruses and uses thereof
CN113088538A (zh) 一种基于黑猩猩ChAd3型腺病毒的表达载体及其构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1123055

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1123055

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: MSD ITALY S. P. A.

Free format text: FORMER OWNER: ANGELETTI P. IST RICHERCHE BIO.

Effective date: 20140709

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140709

Address after: Rome Italy

Patentee after: MSD Italy S. p. A.

Address before: Italy Pomezia

Patentee before: Angeletti P. Ist Richerche Bio.