CN1582337A - 丙型肝炎病毒疫苗 - Google Patents

丙型肝炎病毒疫苗 Download PDF

Info

Publication number
CN1582337A
CN1582337A CNA028246659A CN02824665A CN1582337A CN 1582337 A CN1582337 A CN 1582337A CN A028246659 A CNA028246659 A CN A028246659A CN 02824665 A CN02824665 A CN 02824665A CN 1582337 A CN1582337 A CN 1582337A
Authority
CN
China
Prior art keywords
base pair
equivalent
district
nucleic acid
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028246659A
Other languages
English (en)
Other versions
CN1582337B (zh
Inventor
E·A·埃米尼
D·C·卡斯罗
A·J·贝特
J·W·施弗
A·尼科西亚
A·拉姆
A·卢扎戈
R·科尔特斯
S·科罗卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MSD Italia SRL
Merck Sharp and Dohme BV
Original Assignee
Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Merck and Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Istituto di Ricerche di Biologia Molecolare P Angeletti SpA, Merck and Co Inc filed Critical Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Publication of CN1582337A publication Critical patent/CN1582337A/zh
Application granted granted Critical
Publication of CN1582337B publication Critical patent/CN1582337B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/108Plasmid DNA episomal vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • C12N2810/60Vectors comprising as targeting moiety peptide derived from defined protein from viruses
    • C12N2810/6009Vectors comprising as targeting moiety peptide derived from defined protein from viruses dsDNA viruses
    • C12N2810/6018Adenoviridae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
    • C12N2830/003Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor tet inducible
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Communicable Diseases (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及Ad6载体和编码含有失活的NS5BRNA-依赖型RNA聚合酶区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。所述核酸特别适合用作提供多种抗原的腺病毒载体或DNA质粒疫苗的成分,用于产生针对HCV的HCV特异性细胞介导的免疫(CMI)反应。

Description

丙型肝炎病毒疫苗
相关申请
本申请要求申请日为2002年3月13日的美国临时申请流水号60/363,774和申请日为2001年10月11日的美国临时申请流水号60/328,655的优先权,以上两份申请分别被收作本文参考。
发明背景
在本申请中所引用的参考文献并非承认是本发明的现有技术。
世界人口的大约3%受到了丙肝病毒(HCV)的感染(Wasley等,Semin.Liver Dis.20,1-16,2000)。接触HCV导致明显的急性疾病的只占很小的百分比,而在大多数情况下所述病毒会形成慢性感染,导致肝脏炎症并且缓慢发展成肝脏衰竭和硬化(Iwarson,FEMSMicrobiol.Rev.14,201-204,1994)。另外,流行病学调查表明,HCV在肝细胞癌的发病方面起着重要作用(Kew,FEMS Microbiol.Rev.14,211-220,1994,Alter,Blood 85,1681-1695,1995)。
在1992年对HCV进行常规血液筛查之前,大部分感染是通过意外接触受感染的血液、血液制品或移植器官而感染的。在进行HCV血液筛查的地方,HCV主要是通过直接透过皮肤接触受感染的血液,即静脉内用药而感染的。较少见的传播方法包括围产期接触,血液透析,以及与HCV感染患者的性接触(Alter等,N.Engl.J.Med.341(8),556-562,1999,Alter,J.Hepatol.31 Suppl.88-91,1999.Semin.Liver.Dis.201,1-16,2000)。
HCV基因组由大约9.5kb的单链RNA组成,它编码具有大约3000个氨基酸的前体多蛋白(Choo等,Science 244,362-364,1989,Choo等,Science 244,359-362,1989,Takamizawa等,J.Virol.65,1105-1113,1991)。所述HCV多蛋白包括以下顺序的病毒蛋白:C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B。
各个病毒蛋白是通过HCV多蛋白的蛋白水解而产生的。宿主细胞蛋白酶能释放推测的结构蛋白C,E1,E2,和p7,并且在810号氨基酸上产生NS2的N-末端(Mizushima等,J.Virol.68,2731-2734,1994,Hijikata等,P.N.A.S.USA 90,10773-10777,1993)。
推测非结构蛋白NS3,NS4A,NS4B,NS5A和NS5B形成了病毒复制机制,并且是从所述多蛋白中释放出来的。与NS2和NS3的N-末端相关的锌-依赖型蛋白酶负责NS2和NS3之间的裂解(Grakoui等,J.Virol.67,1385-1395,1993,Hijikata等,P.N.A.S.USA 90,10773-10777,1993)。位于NS3的N-末端结构域中的一种特殊的丝氨酸蛋白酶,负责在NS3/NS4A,NS4A/NS4B,NS4B/NS5A和NS5A/NS5B接合处的蛋白水解裂解(Bartenschlager等,J.Virol.67,3835-3844,1993,Grakoui等,Proc.Natl.Acad.Sci.USA 90,10583-10587,1993,Tomei等,J.Virol.67,4017-4026,1993)。NS4A提供了NS3活性的辅因子(Failla等,J.Virol.68,3753-3760,1994,De Francesco等,美国专利号5,739,002)。
NS5A是能产生干扰素抗性的高度磷酸化的蛋白(De Francesco等,Semin.Liver Dis.,20(1),69-83,2000,Pawlotsky,ViralHepat.Suppl.1,47-48,1999)。
NS5B提供了一种RNA-依赖型RNA聚合酶(De Francesco等,国际公开号WO 96/37619,Behrens等,EMBO 15,12-22,1996,Lohmann等,Virology 249,108-118,1998)。
发明概述
本发明涉及Ad6载体和编码含有失活的NS5B RNA-依赖型RNA聚合酶区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。所述核酸特别适合用作提供多种抗原的腺病毒载体或DNA质粒疫苗的成分,用于产生针对HCV的HCV特异性细胞介导的免疫(CMI)反应。
HCV特异性CMI反应表示能识别HCV抗原的细胞毒性T淋巴细胞和T辅助细胞的产生。CMI反应还可以包括非HCV特异性免疫作用。
优选的核酸编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,它基本上与SEQ.ID.NO.1相似,并且具有足够的蛋白酶活性,以便对它自身进行加工,产生基本上相似于存在于SEQ.ID.NO.1中的NS5B区的至少一种多肽。所产生的相当于NS5B区的多肽是无酶促活性的。更优选的是,所述HCV多肽具有足够的蛋白酶活性,以便产生基本上相似于存在于SEQ.ID.NO.1中的NS3,NS4A,NS4B,NS5A,和NS5B区的多肽。
所提到的“基本上相似的序列”表示与参考序列的同一性至少为大约65%。因此,举例来说,具有基本上相似于SEQ.ID.NO.1的氨基酸序列的多肽,与SEQ.ID.NO.1具有至少大约65%的总体氨基酸同一性。
相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽,与SEQ.ID.NO.1上的相应的区具有至少大约65%的氨基酸序列同一性。所述相应的多肽在本文中又被称为NS3,NS4A,NS4B,NS5A和NS5B多肽。
因此,本发明的第一方面披露了包括编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列的核酸。所编码的多肽具有足够的蛋白酶活性,以便对它自身进行加工,产生无酶促活性的NS5B多肽。
在一种优选实施方案中,所述核酸是能够在需要的人细胞中表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的表达载体。在人细胞内的表达具有治疗作用,可以有效治疗HCV感染,并且预防性治疗HCV感染。
表达载体包括编码一种多肽的核苷酸序列以及进行正确转录和加工的调节元件。可以存在的调节元件包括与编码所述多肽的核苷酸天然相关的调节元件,以及不是与所述核苷酸序列天然相关的外源调节元件。诸如外源激发子的外源调节元件可用于在特定宿主中表达,如在人细胞中表达。可用于功能性表达的调节元件的例子包括激发子,终止子,核糖体结合位点和聚腺苷酸化信号。
本发明的另一方面,披露了包括能够在人细胞中表达基本相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒的核酸。所述多肽能够对它自身进行加工,以便产生无酶促活性的NS5B蛋白。所述基因表达盒至少包括以下部分:
a)与编码多肽的核苷酸序列转录性偶联的激发子;
b)与所述核苷酸序列功能性偶联的5′核糖体结合位点;
c)与所述核苷酸序列的3′末端连接的终止子;和
d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。
所提到的“转录性偶联”表示所述激发子的定位使得可以通过结合在所述激发子上的RNA聚合酶使核苷酸序列转录。转录性偶联并不要求被转录的序列靠近所述激发子。
所提到的“功能性偶联”表示介导一种对所述核苷酸序列的作用的能力。功能性偶联并不需要所偶联的序列彼此接近。与所述核苷酸序列功能性偶联的聚腺苷酸化信号有利于转录的RNA的裂解和聚腺苷酸化。与所述核苷酸序列功能性偶联的5’核糖体结合位点有利于核糖体结合。
在优选实施方案中,所述核酸是适合用于治疗HCV的治疗性用途或用作生产治疗载体的中间物的DNA质粒载体或腺病毒载体。治疗HCV,包括主动治疗HCV感染和预防性治疗HCV感染。
本发明的另一方面披露了包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体,所述腺病毒载体是通过以下方法生产的,该方法包括(a)同源重组和(b)腺病毒载体回收(rescue)。所述同源重组步骤中产生了一种腺病毒基因组质粒。所述腺病毒载体回收步骤产生了来自所述腺病毒基因组质粒的腺病毒载体。
本文所披露的腺病毒基因组质粒包括一种重组腺病毒基因组,它具有一个在E1区上的缺失,和任选在E3区上的缺失,以及插入所述缺失区之一中的基因表达盒。所述重组腺病毒基因组是由基本上相似于一种或多种腺病毒血清型的区域组成的。
本发明的另一方面披露了包括SEQ.ID.NO.4的核酸序列的腺病毒载体或它的衍生物,其中,所述衍生物的存在于SEQ.ID.NO.4上的HCV多蛋白编码序列被SEQ.ID.NO.3,SEQ.ID.NO.10或SEQ.ID.NO.11中任一个的HCV多蛋白编码序列所取代。
本发明的另一方面披露了一种包括含有编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的序列的核酸的培养的重组细胞。所述重组细胞具有多种用途,如用于通过载体构建方法复制编码所述多肽的核酸。
本发明的另一方面披露了一种制备包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体的方法。该方法包括以下步骤:(a)生产包括重组腺病毒基因组的腺病毒基因组质粒,它在E1和E3区具有缺失,并且具有插入所述缺失区之一中的基因表达盒,和(b)从所述腺病毒基因组质粒中回收腺病毒载体。
本发明的另一方面披露了包括用于表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体和可以药用载体的药物组合物。所述载体适合给患者施用,并且在患者体内表达多肽。
“患者”表示能够感染HCV的哺乳动物。患者可能感染了或没有感染HCV。患者的例子有人和黑猩猩。
本发明的另一方面披露了一种治疗患者的方法,包括给所述患者施用有效量的表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体的步骤。所述载体适合给患者施用,并且在患者体内表达多肽。
进行治疗的患者可能有或没有感染HCV。对于感染了HCV的患者来说,有效量足以获得以下作用中的一种或多种:减弱HCV复制的能力,减少HCV负荷,提高对病毒的清除,并且增强一种或多种HCV特异性CMI反应。对于没有感染HCV的患者来说,有效量是足以获得下列一种或多种效果的用量:增强产生针对HCV感染的HCV特异性CMI反应的一种或多种成分的能力,降低了对HCV感染的易感性,和减弱了传染性病毒建立导致慢性疾病的持久感染的能力。
本发明的另一方面涉及包括Ad6区和一个不存在于Ad6中的区的重组核酸。所提到的“重组”核酸表示存在两个或两个以上不是天然彼此相关的核酸区。所述Ad6重组核酸优选包括Ad6区和编码与Ad6异源的多肽的基因表达盒。
通过本文所提供的包括不同实施例的其他说明,可以理解本发明的其他特征和优点。所提供的实施例说明了用于实施本发明的不同成分和方法。这些实施例不构成对本发明的限定。根据本发明的说明,技术人员能够确定和采用可用于实施本发明的其他成分和方法。
附图的简要说明
图1A和1B表示SEQ.ID.NO.1。
图2A,2B,2C和2D表示SEQ.ID.NO.2。SEQ.ID.NO.2提供了编码SEQ.ID.NO.1的核苷酸序列,同时提供了优化的内部核糖体进入位点和TAAA终止序列。1-6号核苷酸提供了优化的内部核糖体进入位点。7-5961号核苷酸编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,5137-5145号位置上的核苷酸提供了1711-1713号氨基酸位置上的AlaAlaGly序列,它使得NS5B失活。5962-5965号核苷酸提供了TAAA终止序列。
图3A,3B,3C和3D表示SEQ.ID.NO.3。SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。7-5961号核苷酸编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽。
图4A-4M表示MRKAd6-NSmut(SEQ.ID.NO.4)。SEQ.ID.NO.4是包括一个表达盒的腺病毒载体,其中,SEQ.ID.NO.1的多肽是由SEQ.ID.NO.2编码的。碱基对1-450相当于Ad5的碱基对1-450;碱基对462-1252相当于人CMV激发子;碱基对1258-1267相当于Kozak序列;碱基对1264-7222相当于NS基因;碱基对7231-7451相当于BGH聚腺苷酸化信号;碱基对7469-9506相当于Ad5碱基对3511-5548;碱基对9507-32121相当于Ad6碱基对5542-28156;碱基对32122-35117相当于Ad6碱基对30789-33784;碱基对35118-37089相当于Ad5碱基对33967-35935。
图5A-5O表示SEQ.ID.NOs.5和6。SEQ.ID.NO.5编码具有有活性的RNA依赖型RNA聚合酶的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽。SEQ.ID.NO.6提供了所述多肽的氨基酸序列。
图6A-6C提供了pV1JnsA的核酸序列(SEQ.ID.NO.7)。
图7A-7N提供了Ad6基因组的核酸序列(SEQ.ID.NO.8)。
图8A-8K提供了Ad5基因组的核酸序列(SEQ.ID.NO.9)。
图9表示Ad6基因组的不同的区。线性(35759bp)ds DNA基因组用双平行线表示,并且被划分成100个作图单位。转录单位是以相对它们在基因组上的位置和方向形式示出的。早期基因(E1A,E1B,E2A/B,E3和E4)是通过灰色箭头表示的,通过黑色箭头表示的晚期基因(LI-L5),是通过对由主要晚期激发子(MLP)产生的转录物的可变剪接而产生的,并且它们都包括位于5′末端的三联前导序列(1,2,3)。E1区位于大约1.0-11.5的作图单位,E2区位于75.0-11.5的作图单位,E2位于76.1-86.7的作图单位,E4区位于99.5-91.2的作图单位。所述主要晚期转录单位位于16.0和91.2作图单位之间。
图10表示回收含有Ad6和Ad5区的pAdE1-E3+的同源重组。
图11表示回收包括Ad6区的pAdE1-E3+的同源重组。
图12表示来自用表达不同的HCV NS盒的质粒DNA转染的293细胞的全细胞提取物的Western印迹。用特异性抗体检测成熟的NS3和NS5A产物。″pV1Jns-NS″表示pV1JnsA质粒,其中,Met-NS3-NS4A-NS4B-NS5A-NS5B多肽是由SEQ.ID.NO.5编码的,并且SEQ.ID.NO.5被插入SEQ.ID.NO.7的1881-1912号碱基之间。″pV1Jns-NSmut″表示pV1JnsA质粒,其中,SEQ.ID.NO.2被插入SEQ.ID.NO.7的1882-1925号碱基之间。″pV1Jns-NSOPTmut″表示pV1JnsA质粒,其中SEQ.ID.NO.3被插入SEQ.ID.NO.7的1881-1905号碱基之间。
图13A和13B表示通过IFNγ ELIspot显示的在C57black6小鼠(A)和BalbC小鼠(B)体内诱导的T细胞反应,包括用基因电转移装置(GET)分别注射25微克和50微克的编码不同HCV NS盒的质粒DNA。
图14表示在感染HeLa细胞之后,来自不同腺病毒载体的蛋白表达。MRKAdS-NSmut是基于Ad5序列的腺病毒载体(SEQ.ID.NO.9),其中,Ad5基因组具有碱基对451-3510的E1缺失,碱基对28134-30817的E3缺失,并且具有插入450-3511号位置之间的SEQ.ID.NO.4的碱基对451-7468所提供的NS3-NS4A-NS4B-NS5A-NS5B表达盒。Ad5-NS是基于Ad5主链的腺病毒载体,具有碱基对342-3523的E1缺失,和碱基对28134-30817的E3缺失,并且包括编码来自SEQ.ID.NO.5的NS3-NS4A-NS4B-NS5A-NS5B的表达盒。″MRKAd6-NSOPTmut″表示具有修饰过的SEQ.ID.NO.4序列的腺病毒载体,其中,SEQ.ID.NO.4的碱基对1258-7222被SEQ.ID.NO.3所取代。
图15表示由IFNγ ELIspot显示的通过两次注射109vp含有不同HCV非结构基因盒的腺病毒载体,在C57black6小鼠体内诱导的T细胞反应。
图16A-16D表示由IFNγ ELIspot显示的通过一次或两次注射1010vp(A)或1011vp(B)含有不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的T细胞反应。
图17A和17B表示由IFNγ ELIspot显示的通过两次注射1010vp(A)或1011vp(B)编码不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的CD8+T细胞反应。
图18A-18F表示由大量CTL分析显示的通过两次注射1011vp的Ad5-NS(A),MRKAdS-NSmut(B),或MRKAd6-NSmut(C)在猕猴体内诱导的T细胞反应。
图19表示质粒pE2。
图20A-D表示部分密码子优化序列NSsuboptmut(SEQ.ID.NO.10)。Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的编码序列是从7-5961号碱基。
本发明的详细说明
本发明涉及Ad6载体和编码含有失活的NS5B区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。提供失活的NS5B区,提供了NS5B抗原,同时降低了由活性病毒RNA聚合酶导致的不利副作用的可能性。所述核酸的用途包括用作疫苗成分,以便将HCV多肽导入细胞,它能提供用于产生针对HCV的CMI反应的多种抗原,并且用作用于生产所述疫苗成分的中间产物。
适应性细胞免疫反应,由于主要组织相容性复合物(MHC)I型和II型表达的普遍分布,起着能够在整体身体内的HCV感染的细胞中识别病毒抗原的作用,以便诱导免疫学记忆,并且保持免疫学记忆。上述功能是由抗原特异性CD4+T辅助细胞(Th)和CD8+细胞毒性T细胞(CTL)提供的。
在通过它们的特异性T细胞受体激活之后,HCV特异性Th细胞实现了多种免疫调控功能,其中大部分功能是通过Th1和Th2细胞因子介导的。HCV特异性Th细胞有助于B细胞的激活和分化,并且有助于病毒特异性细胞毒性T细胞的诱导和刺激。Th细胞与CTL一起还能分泌能抑制若干病毒的复制和基因表达的IFN-γ和TNF-α。另外,Th细胞和CTL即主要效应细胞,可以诱导病毒感染过的细胞的程序凋亡和裂解。
HCV特异性CTL是由专门的抗原呈递细胞(pAPCs)加工的抗原产生的。抗原可以是在pAPCs内合成的或者是导入的。PAPC中的抗原合成,可以通过将编码序列所述抗原的表达盒导入所述细胞而完成。
施用核酸疫苗的一种优选途径是肌内途径。肌内施用似乎会导致将核酸导入体细胞和pAPCs,并且在那里表达。在所述体细胞中产生的HCV抗原可以转移到pAPCs,以便在I类MHC分子中呈递(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。
PAPCs在蛋白酶体复合物中将较长的抗原加工成较小的肽抗原。所述抗原被转运到内质网/高尔基复合体分泌途径中,以便与I类MHC蛋白结合。CD8+T淋巴细胞通过T细胞受体(TCR)和CD8细胞表面蛋白识别与I类MHC结合的抗原。
用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸作为疫苗成分,可以从一种单一载体生产多种能够产生CMI反应的抗原。所述多肽应当能够对它自身进行充分加工,以便产生至少一个相当于NS5B的区。优选的核酸编码基本上相似于SEQ.ID.NO.1的氨基酸序列,它具有足够的蛋白酶活性,以便对它自身进行加工,产生基本上相似于存在于SEQ.ID.NO.1上的NS3,NS4A,NS4B,NS5A和NS5B的各个HCV多肽。
基本上相似于SEQ.ID.NO.1的多肽,具有足够的蛋白酶活性,在细胞中对它自身进行加工,给所述细胞提供存在于若干不同HCV菌株中的T细胞表位。蛋白酶活性是由NS3和NS3/NS4A蛋白提供的,在合适的裂解位点上消化Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,以便释放相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽。Met-NS3-NS4A-NS4B-NS5A-NS5B的自我加工,产生了接近天然存在的HCV多肽的多肽。
根据本文所提供的指导,可以产生足够强的免疫反应,以便在患者体内获得有益作用。所提供的指导包括与HCV序列选择,载体选择,载体生产,组合治疗和施用相关的信息。
I.HCV序列
可以将多种不同的核酸序列用作疫苗成分,以便给细胞提供HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,或作为生产疫苗成分的中间物。用于获得合适核酸序列的起点,优选是被修饰而产生失活的NS5B的天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽。
在以下文献中披露了利用HCV核酸序列提供HCV非结构抗原,以便产生CMI反应:Cho等,Vaccine 17:1136-1144,1999,Paliard等,国际公开号WO01/30812(并不被认为是本发明的现有技术),和Coit等,国际公开号WO01/38360(并不被认为是本发明的现有技术)。例如,所述文献没有披露对它自身进行加工以便产生失活的NS5B的多肽,特别是没有披露HCV序列与本文所采用的递送载体的组合。
对HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽序列的修饰,可以通过改变其编码核酸而产生。可以进行改变,以便产生缺失,插入和取代。
可以在NS5B上进行小的修饰,以便通过导向于复制所必需的基序产生失活的聚合酶。NS5B活性所必需的基序的例子,以及为了生产失活的NS5B而可以进行的修饰披露于以下文献中:Lohmann等,Journal of Virology 71:8416-8426,1997,和Kolykhalov等,Journal of Virology 74:2046-2051,2000。
在产生对HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的修饰时需要考虑的其他因素,包括保持自身加工的能力和保持T细胞抗原。HCV多肽进行自身加工的能力,在很大程度上是通过功能性NS3蛋白酶确定的。能保持NS3活性蛋白酶活性的修饰,可以通过NS3蛋白,用作NS3的辅因子的NS4A,和存在于NS3-NS4A-NS4B-NS5A-NS5B多肽中的NS3蛋白酶识别位点而获得。
可以对天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽序列进行不同的修饰,以便产生能够诱导多种T细胞反应的多肽。影响一种多肽诱导多种T细胞反应的能力的因素,包括HCV特异性T细胞抗原区的保存或导入,以及不同T细胞抗原区在不同HCV分离物中的优势。
天然存在的HCV分离物的多种例子为本领域所熟知。HCV分离物可以划分成以下六种包括一种或多种亚型的主要基因型:HCV-1/(1a,1b,1c),HCV-2/(2a,2b,2c),HCV-3/(3a,3b,10a),HCV-4/(4a),HCV-5/(5a)和HCV-6/(6a,6b,7b,8b,9a,11a)(Simmonds,J.Gen.Virol.,693-712,2001)。诸如HCV-BK,HCV-J,HCV-N,HCV-H的特定HCV序列的例子,业已在GenBank保藏,并且在多个文献中披露(例如,参见Chamberlain等,J.Gen.Virol.,1341-1347,1997)。
例如,HCV T细胞抗原可以通过经验性实验鉴定。鉴定T细胞抗原的一种方法包括用较大长度的多肽产生一系列重叠的短肽,然后从受感染的患者中筛选T细胞群体的阳性克隆。阳性克隆是通过特定肽激活/激发的。可以将诸如IFNγ-ELISPOT,IFNγ-细胞内染色和大量(bulk)CTL分析的技术用于测定肽活性。由此鉴定的肽可以视为代表了各病原体的T细胞表位。
例如,通过生产包括来自两种或两种以上天然存在的序列的区域的杂合NS3-NS4A-NS4B-NS5A-NS5B多肽,可以将来自不同HCV分离物的HCV T细胞抗原区导入一种单一序列。所述杂合体可以包括其他修饰,所述修饰优选不会减弱所述多肽产生HCV CMI反应的能力。
可以用本文所披露的或为本领域所熟知的技术,确定修饰过的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽对它自身进行加工,并且产生CMI反应的能力。所述技术包括使用IFNγ-ELISPOT,IFNγ-细胞内染色和大量CTL分析,测定HCV特异性CMI反应。
A.Met-NS3-NS4A-NS4B-NS5A-NS5B序列
SEQ.ID.NO.1提供了优选的Met-NS3-NS4A-NS4B-NS5A-NS5B序列。SEQ.ID.NO.1包括大量的HCV特异性T细胞抗原,这些抗原存在于若干不同的HCV分离物中。SEQ.ID.NO.1与HCV BK菌株核苷酸序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B部分相似。
在SEQ.ID.NO.1中,对于I类MHC分子识别来说,重要的锚定位点是保守的或代表HCV多蛋白的NS3-NS4A-NS4B-NS5A-NS5B部分上的20种已知T细胞表位中的18种的保守性取代。就其余两种已知的T细胞表位而言,一种在SEQ.ID.NO.1上具有一个非保守性锚定取代,该取代仍然能被不同的HLA超类型识别,而一种表位具有一个不是保守的锚定残基。HCV T-细胞表位披露于以下文献中:Chisari等,Curr.Top.Microbiol Immunol.,242:299-325,2000,和Lechner等J.Exp.Med.9:1499-1512,2000。
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列和SEQ.ID.NO.1之间的差别包括在5’末端引入一个甲硫氨酸,以及修饰过的NS5B活性位点残基在SEQ.ID.NO.1上的存在。所述修饰将GlyAspAsp换成了AlaAlaGly(1711-1713号残基),以便使NS5B失活。
所编码的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,优选具有基本上相似于SEQ.ID.NO.1的氨基酸序列。在不同的实施方案中,所编码的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,与SEQ.ID.NO.1的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或与SEQ.ID.NO.1具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的差别。
Met-NS3-NS4A-NS4B-NS5A-NS5B多肽和SEQ.ID.NO.1之间的氨基酸差别,是通过确定两种序列不同的氨基酸修饰的最低数量计算的。氨基酸修饰可以是缺失,添加,取代或它们的任意组合。
氨基酸序列同一性,是通过本领域众所周知的方法确定的,所述方法将一种多肽的氨基酸序列与第二种多肽的氨基酸序列进行比较,并且产生一种序列比对。氨基酸同一性是通过所述比对计算的,包括统计具有相同氨基酸的比对的残基对的数量。
用于确定序列同一性的方法包括披露于以下文献中的方法:Schuler,G.D.in Bioinformatics:A Practical Guide to theAnalysis of Genes and Proteins,Baxevanis,A.D.和Ouelette,B.F.F.,eds.,John Wiley & Sons,Inc,2001;Yona,等,in Bioinformatics:Sequence,structure and databanks,Higgins,D.and Taylor,W.eds,Oxford University Press,2000;and Bioinformatics:Sequence and Genome Analysis,Mount,D.W.,ed.,Cold Spring Harbor Laboratory Press,2001。确定氨基酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics ComputerGroup(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,Methods in Enzymology183:63-98,1990,R.F.Doolittle,ed)。
在本发明的一种实施方案中,两种多肽之间的序列同一性是通过使用GAP程序确定的(Wisconsin Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman,等,J.Mol.Biol.48:443-453,1970)。GAP考虑了两种序列之间的所有可能的比对和空位位置,并且产生一种将匹配的残基数量最大化以及将空位的数量和大小最小化的总体比对。利用一种评分距阵确定符号匹配值。另外,为了限制向所述比对中插入空位,需要空位产生罚分和空位延伸罚分。利用GAP进行多肽比较的默认程序参数是BLOSUM62(Henikoff等,Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)氨基酸评分距阵(MATrix=blosum62.cmp),空位产生参数(GAP权重=8),而空位延伸参数(LENgth权重=2)。
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,除了在它们的整个长度上基本上相似于SEQ.ID.NO.1之外,还能产生基本上相似于存在于SEQ.ID.NO.1上的相应的区域的各个NS3,NS4A,NS4B,NS5A和NS5B区,SEQ.ID.NO.1上的相应的区是以如下形式提供的:Met-NS3的1-632号氨基酸;NS4A的633-686号氨基酸;NS4B的687-947号氨基酸;NS5A的948-1394号氨基酸和NS5B的1395-1985号氨基酸。
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B区与SEQ.ID.NO.1上的相应区域的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的氨基酸差别。
SEQ.ID.NO.1的氨基酸修饰,优选保持了所有的或大部分的T细胞抗原区。天然存在的氨基酸差别,是由于不同的氨基酸侧链(R基团)产生的。R基团能影响氨基酸的不同的性质,如物理尺寸,电荷,和疏水性。可以将氨基酸划分成以下不同类型:中性和疏水性(丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,色氨酸,苯丙氨酸,和甲硫氨酸);中性和极性(甘氨酸,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,天冬酰胺,和谷氨酰胺);碱性(赖氨酸,精氨酸,和组氨酸);和酸性(天冬氨酸和谷氨酸)。
一般,在取代不同的氨基酸时,优选用具有相似性质的氨基酸取代。在特定类型内部取代不同的氨基酸,如用缬氨酸取代亮氨酸,用精氨酸取代赖氨酸,和用天冬酰胺取代谷氨酰胺是不会导致多肽三级结构改变的很好的候选取代。
基于特定的氨基酸序列和已知的遗传密码的间并性,可以获得大量不同的编码核酸序列。遗传密码的间并性是由于几乎所有氨基酸都是由核苷酸三联体或″密码子″的不同组合编码的。特定密码子翻译成特定氨基酸为本领域所熟知(例如,参见Lewin GENESIV,p.119,Oxford University Press,1990)。氨基酸是由以下密码子编码的:
A=Ala=丙氨酸:密码子GCA,GCC,GCG,GCU
C=Cys=半胱氨酸:密码子UGC,UGU
D=Asp=天冬氨酸:密码子GAC,GAU
E=Glu=谷氨酸:密码子GAA,GAG
F=Phe=苯丙氨酸:密码子UUC,UUU
G=Gly=甘氨酸:密码子GGA,GGC,GGG,GGU
H=His=组氨酸:密码子CAC,CAU
I=Ile=异亮氨酸:密码子AUA,AUC,AUU
K=Lys=赖氨酸:密码子AAA,AAG
L=Leu=亮氨酸:密码子UUA,UUG,CUA,CUC,CUG,CUU
M=Met=甲硫氨酸:密码子AUG
N=Asn=天冬酰胺:密码子AAC,AAU
P=Pro=脯氨酸:密码子CCA,CCC,CCG,CCU
Q=Gln=谷氨酰胺:密码子CAA,CAG
R=Arg=精氨酸:密码子AGA,AGG,CGA,CGC,CGG,CGU
S=Ser=丝氨酸:密码子AGC,AGU,UCA,UCC,UCG,UCU
T=Thr=苏氨酸:密码子ACA,ACC,ACG,ACU
V=Val=缬氨酸:密码子GUA,GUC,GUG,GUU
W=Trp=色氨酸:密码子UGG
Y=Tyr=酪氨酸:密码子UAC,UAU。
可以优化核酸序列,以便增强在宿主中的表达。要考虑的因素包括C:G含量,优选的密码子,以及避免抑制性二级结构。所述因素能够以不同的方式组合,以便获得在特定宿主中具有增强了的表达的核酸序列(例如,参见Donnelly等,国际公开号WO 97/47358)。
特定序列在特定宿主中具有增强了的表达的能力涉及某些经验实验。所述实验包括测定保护性核酸序列的表达,以及,如果必要的话,改变所述序列。
B.编码核苷酸序列
SEQ.ID.NOs.2和3提供了编码Met-NS3-NS4A-NS4B-NS5A-NS5B序列的核苷酸序列的两种例子。SEQ.ID.NO.2的编码序列,与天然存在的HCV-BK序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B区相似(核苷酸序列同一性为99.4%),SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。SEQ.ID.NOs.2和3具有78.3%的核苷酸序列同一性。
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸(GenBank保藏号M58335)和SEQ.ID.NO.2之间的差别,包括SEQ.ID.NO.2具有一个核糖体结合位点,一个ATG甲硫氨酸密码子,一个编码修饰过的NS5B催化结构域的区,一种TAAA终止信号和另外30个核苷酸的差别。编码AlaAlaGly(1711-1713号残基)的修饰过的催化结构域取代了GlyAspAsp,以便使NS5B失活。
编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,优选基本上相似于SEQ.ID.NO.2的编码区。在不同实施方案中,编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,与SEQ.ID.NO.2编码区的核苷酸序列的同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。
编码Met-NS3-NS4A-NS4B-NS5A-NS5B的序列和SEQ.ID.NO.2编码区之间的核苷酸差别,是通过确定两种序列差别的核苷酸修饰的最低数量计算的。核苷酸修饰可以是缺失,添加,取代或它们的任意组合。
核苷酸序列同一性,是通过本领域熟知的方法确定的,该方法比较了一种序列的核苷酸序列和另一种序列的核苷酸序列,以便产生一种序列比对。序列同一性是根据所述比对,通过统计具有相同核苷酸的比对位置的数量确定的。
用于确定两种多核苷酸之间的核苷酸序列同一性的方法,包括披露于以下文献中的方法:Schuler,in Bioinformatics:A PracticalGuide to the Analysis of Genes and Proteins,Baxevanis,A.D.和Ouelette,B.F.F.,eds.,John Wiley & Sons,Inc,2001;Yona等,.in Bioinformatics:Sequence,structure anddatabanks,Higgins,D.和Taylor,W.eds,Oxford UniversityPress,2000;and Bioinformatics:Sequence and GenomeAnalysis,Mount,D.W.,ed.,Cold Spring Harbor LaboratoryPress,2001。确定核苷酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics Computer Group(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,W.R.,Methods in Enzymology 183:63-98,1990,R.F.Doolittle,ed)。
在本发明的一种实施方案中,两种多核苷酸之间的序列同一性,是通过采用GAP确定的(Wiscons in Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman等,J.Mol.Biol.48:443-453,1970)。GAP考虑了两种序列之间所有可能的比对和空位位置,并且产生了使匹配的残基数量最大化,并且使空位的数量和大小最小化的总体比对。用一种评分距阵确定符号匹配值。另外,需要用空位产生罚分和空位延伸罚分来限制将空位插入所述比对中。采用GAP的多核苷酸比较的默认程序参数是nwsgapdna.cmp评分距阵(MATrix=nwsgapdna.cmp),空位产生参数(GAP权重=50)和空位延伸参数(LENgth权重=3)。
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列,除了在其整个长度上基本上相似之外,产生了基本上相似于存在于SEQ.ID.NO.2中的相应区域的各个NS3,NS4A,NS4B,NS5A和NS5B区。SEQ.ID.NO.2上的相应的编码区是以如下形式提供的:Met-NS3的7-1902号核苷酸;NS4A的1903-2064号核苷酸;NS4B 2065-2847号核苷酸;NS5A的2848-4188号核苷酸;NS5B的4189-5661号核苷酸。
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B编码区与SEQ.ID.NO.2上的相应的区域上的核苷酸序列同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。
C.基因表达盒
基因表达盒包括多肽表达所需要的元件。所提到的“多肽”没有提供大小限制,并且包括蛋白。存在于基因表达盒中的调节元件通常包括:(a)与编码所述多肽的核苷酸序列转录性偶联的激发子,(b)与所述核苷酸序列功能性偶联的5′核糖体结合位点,(c)与所述核苷酸序列的3′末端连接的终止子,和(d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。还可以存在用于增强或调控基因表达或多肽加工的其他调节元件。
激发子是由RNA聚合酶识别,并且介导下游区域转录的遗传元件。优选的激发子是强激发子,它能提供较高水平的转录。强激发子的例子包括立即早期人巨细胞病毒激发子(CMV),和具有内含子A的CMV(Chapman等,Nucl.Acids Res.19:3979-3986,1991)。激发子的其他例子包括天然存在的激发子,如EF1α激发子,鼠CMV激发子,Rous肉瘤病毒激发子,和SV40早期/晚期激发子和β-肌动蛋白激发子;以及人工激发子,如合成的肌肉特异性激发子和嵌合型肌肉-特异性/CMV激发子(Li等,Nat.Biotechnol.17:241-245,1999,Hagstrom等,Blood 95:2536-2542,2000)。
所述核糖体结合位点位于起始密码子上或靠近起始密码子。优选的核糖体结合位点的例子包括CCACCAUGG,CCGCCAUGG,和ACCAUGG,其中AUG是起始密码子(Kozak,Cell 44:283-292,1986)。核糖体结合位点的另一种例子是GCCACCAUGG(SEQ.ID.NO.12)。
聚腺苷酸化信号负责裂解转录的RNA,并且在所述RNA上添加poly(A)尾。高等真核生物中的聚腺苷酸化信号包括AAUAAA序列,距离聚腺苷酸化添加位点大约11-30个核苷酸。AAUAAA序列参与RNA裂解的信号传递(Lewin,Genes IV,Oxford University Press,NY,1990)。poly(A)尾对于mRNA加工来说是重要的。
可以用作基因表达盒的一部分的聚腺苷酸化信号,包括最小兔β-珠蛋白聚腺苷酸化信号和牛生长激素聚腺苷酸化(BGH)(Xu等,Gene272:149-156,2001,Post等,美国专利U.S.5,122,458)。其他例子包括合成的聚腺苷酸化信号(SPA)和SV40聚腺苷酸化信号。所述SPA序列如下:AAUAAAAGAUCUUUAUUUUCAUUAGAUCUGUGUGUUGGUUUUUUGUGUG(SEQ.ID.NO.13)。
可以存在的用于增强或调控基因表达或多肽加工的其他调节元件的例子,包括增强子,前导序列和操纵子。增强子区能增强转录。增强子区的例子包括CMV增强子和SV40增强子(Hitt等,Methods inMolecular Genetics 7:13-30,1995,Xu,等,Gene 272:149-156,2001)。增强子区可以与激发子结合。
前导序列是多肽上的氨基酸区,它能引导所述多肽进入蛋白酶体。编码序列所述前导序列的核酸是结构基因的5′末端,并且是随所述结构基因一起转录的。前导序列的例子是tPA。
可以用操纵子序列调控基因表达。例如,可以利用Tet操纵子序列抑制基因表达。
II.治疗性载体
可以用适合治疗性施用的载体将编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸导入患者体内。合适的载体能够将核酸递送到靶细胞中,而又不会导致不可接受的副作用。
细胞表达是利用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒实现的。所述基因表达盒包括用于在靶细胞内产生并且加工足够数量的核酸,以便获得有利效果的调节元件。
可用于治疗性用途的载体的例子包括第一和第二代腺病毒载体,辅助依赖型腺病毒载体,腺伴随病毒载体,逆转录病毒载体,α病毒载体,Venezuelan马脑炎病毒载体,和质粒载体(Hitt等,Advancesin Pharmacology 40:137-206,1997,Johnston等,美国专利号6,156,588,和Johnston等,国际公开号WO 95/32733)。用于将Met-NS3-NS4A-NS4B-NS5A-NS5B多肽导入对象体内的优选载体,是第一代腺病毒载体和质粒DNA载体。
A.第一代腺病毒载体
用于表达基因表达盒的第一代腺病毒载体,包括E1和任选的E3缺失重组腺病毒基因组内的表达盒。E1区上的缺失足够大,以便去除腺病毒复制所必需的元件。
用于表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的第一代腺病毒载体,包括E1和E3缺失的重组腺病毒基因组。E1区的缺失足够大,以便去除腺病毒复制所必需的元件。E1和E3区缺失的组合足够大,以便能容纳编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒。
所述腺病毒具有双链线性基因组,在两端具有反向末端重复。在病毒复制期间,将所述基因组包装在病毒衣壳内,以便形成毒粒。所述病毒通过病毒附着以及随后的内化,进入它的靶细胞(Hitt等,Advances in Pharmacology 40:137-206,1997)。
腺病毒载体可以基于不同的腺病毒血清型,如出现在人或动物体内的血清型。动物腺病毒的例子包括牛,猪,黑猩猩,鼠,犬和禽(CELO)腺病毒。优选的腺病毒载体是基于人血清型的,更优选基于B,C或D型血清型。人腺病毒B,C,D或E血清型的例子包括2型(″Ad2″),4型(″Ad4″),5型(″Ad5″),6型(″Ad6″),24型(″Ad24″),26型(″Ad26″),34型(″Ad34″)和35型(″Ad35″)。腺病毒载体可以包括来自单一腺病毒或来自两种或两种以上腺病毒的区域。
在不同的实施方案中,腺病毒是基于Ad5,Ad6,或它们的组合的。Ad5披露于以下文献中:Chroboczek等,J.Virology 186:280-285,1992。Ad6披露于图7A-7N中。包括Ad5区的基于Ad6的载体披露于下面所提供的实施例部分。
腺病毒载体不一定完全去掉了它们的E1和E3区。相反,去掉了足够数量的E1区,使得在缺乏E1蛋白的条件下,不能复制的载体是以反式形式提供的;并且E1缺失和E1或E3缺失的组合大到足够容纳一个基因表达盒。
E1缺失可以从Ad5的大约碱基对342开始一直进行到大约碱基对3523,或相当于来自其他腺病毒的区域。所缺失的区域包括去掉从Ad5的大约碱基对450到大约碱基对3511的区域,或来自其他腺病毒的相应区域。始于大约碱基对341的较大的E1区缺失,去掉了有利于病毒包装的元件。
E3缺失能够从Ad5的大约27865号碱基对到大约30995号碱基对,从或者其他腺病毒载体的相应的区域获得。所述缺失区优选包括去掉了从Ad5的大约28134号碱基对到大约30817号碱基对的区域,或其他腺病毒载体的相应的区域。
E1区以及任选的E3区的缺失的组合应当足够大,以便包括所述基因表达盒的重组基因组的总体大小,不超过野生型腺病毒基因组的大约105%。例如,当重组腺病毒Ad5基因组的大小增加超过大约105%时,所述基因组会变得不稳定(Bett等,Journal of Virology 67:5911-5921,1993)。
包括所述基因表达盒的重组腺病毒基因组的大小优选为野生型腺病毒基因组的大约85%-大约105%。在不同实施方案中,包括所述表达盒的重组腺病毒基因组的大小为野生型基因组大小的大约100%-大约105.2%,或大约100%。
可以将大约7,500kb插入具有E1和E3缺失的腺病毒基因组中。在没有任何缺失的情况下,Ad5基因组为35,935个碱基对,而Ad6基因组为35,759个碱基对。
第一代腺病毒载体的复制可以通过提供反式E1基因产物而实现。E1基因产物能够以反式形式提供,例如,通过使用业已用腺病毒E1区转化过的细胞系。用腺病毒E1区转化过的细胞和细胞系的例子有HEK293细胞,911细胞,PERC.6TM细胞和转染过的原代人aminocytes细胞(Graham等,Journal of Virology 36:59-72,1977,Schiedner等,Human Gene Therapy 11:2105-2116,2000,Fallaux等,HumanGene Therapy 9:1909-1917,1998,Bout等,美国专利号6,033,908)。
应当将Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒插入重组腺病毒基因组的相当于缺失的E1区或缺失的E3区的区域。所述表达盒可以具有平行的或反向平行的取向。在平行取向中,所述插入基因的转录方向与缺失的E1或E3基因的方向相同。在反向平行取向的转录中,将相反的链用作模板,而转录方向是沿相反方向进行的。
在本发明的一种实施方案中,所述腺病毒载体具有插入到E1缺失区的基因表达盒。该载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548的第二腺病毒区或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在本发明的另一种实施方案中,所述腺病毒载体具有插入到E3缺失区的表达盒。该载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在涉及腺病毒区的优选的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四,和第五区;(2)相当于Ad6的第一,第二,第三,第四,和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于Ad5的第五区。
B.DNA质粒载体
DNA疫苗质粒载体包括一个基因表达盒和有利于复制并且优选有利于载体选择的元件。优选的元件提供了用于在非哺乳动物细胞中复制的元件和选择标记。所述载体应当不包括提供在人细胞中复制的元件或用于整合到人核酸中的元件。
有利于核酸选择的选择标记包括所述标记。优选的选择标记是能产生抗生素抗性的标记。抗生素选择基因的例子,包括编码氨苄青霉素,新霉素,和卡那霉素抗性的核酸。
可以用含有细菌复制起点和选择标记的质粒起始生产合适的DNA疫苗载体。能提供较高产量的细菌复制起点的例子,包括ColE1质粒-衍生的细菌复制起点(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。
细菌复制起点和选择标记的存在,使得能够在诸如大肠杆菌的细菌菌株中生产DNA载体。利用选择标记排除不包括DNA载体的细菌。
III.AD6重组核酸
Ad6重组核酸包括基本上相似于存在于SEQ.ID.NO.8中的Ad6区的Ad6区,和不存在于Ad6核酸中的区域。包括Ad6区的重组核酸具有不同的用途,如用于生产不同的Ad6区,作为生产基于Ad6的载体的中间物,以及用作递送重组基因的载体。
如图9所示,Ad6的基因组组构与Ad5的基因组组构非常相似。Ad5和Ad6之间的同源性大约为98%。
在不同实施方案中,Ad6重组核酸包括基本上相似于E1A,E1B,E2B,E2A,E3,E4,L1,L2,L3,或L4的核苷酸区,或它们的任意组合。与Ad6区基本上相似的核酸区具有至少65%,至少75%,至少85%,至少95%,至少99%或100%的核苷酸序列同一性;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的核苷酸差别。在上文的I.B.节中披露了用于确定基本上相似的核酸序列的技术和实施方案。
重组Ad6核酸优选包括编码不存在于Ad6中的多肽的表达盒。表达盒的例子包括编码HCV区的表达盒,和编码其他类型多肽的表达盒。
可以采用不同量的Ad6生产不同类型的腺病毒载体,如第一代和第二代腺病毒载体。正如在上文的II.A.节中所指出的,第一代腺病毒载体是E1缺陷型的,并且在提供反式E1时能够复制。
第二代腺病毒载体包括比第一代载体少的腺病毒基因组,并且可用于与互补的细胞系和/或补充腺病毒蛋白的辅助载体连接。在不同的参考文献中,披露了第二代腺病毒载体,如Russell,Journal ofGeneral Virology 81:2573-2604,2000;Hitt等,1997,HumanAd vectors  for Gene Transfer,Advances in Pharmacology,Vol40 Academic Press。
在本发明的实施方案中,Ad6重组核酸是E1缺陷型腺病毒载体,它能够在补充反式E1时复制。可以将表达盒插入缺失的E1区和/或缺失的E3区。
具有在缺失的E1区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对28134到大约碱基对30817或从相当于Ad6的大约碱基对28157到大约碱基对30788的任选存在的第四个区;
f)从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第五腺病毒区,其中,如果存在第四区,所述第五区与所述第四区连接,或如果不存在所述第四区,所述第五区与第三区连接;和
g)与所述第五区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第六腺病毒区;
其中,存在至少一个Ad6区。
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。
具有在缺失的E3区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的相当于从Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;
其中,存在至少一个Ad6区。
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。
IV.载体生产
可以用重组核酸技术生产载体,如包括使用限制酶,核酸连接,和同源重组的技术。重组核酸技术为本领域所熟知(Ausubel,CurrentProtocols in Molecular Biology,John Wiley,1987-1998,和Sambrook等,Molecular Cloning,A Laboratory Manual,2′dEdition,Cold Spring Harbor Laboratory Press,1989)。
利用中间载体驱动治疗性载体,或将表达盒或它的一部分从一种载体转移到另一种载体。中间载体的例子包括腺病毒基因组质粒和穿梭载体。
中间载体上的有用元件包括复制起点,选择标记,同源重组区,和常见的限制位点。可以利用常见的限制位点促进核酸序列的克隆或释放。
同源重组区提供了与另一种核酸分子上的目标区同源的核酸序列区。该同源区位于要插入所述目标区的核酸序列侧翼。在不同实施方案中,同源区的长度优选为大约150-600个核苷酸,或长度为大约100-500个核苷酸。
本发明的一种实施方案披露了包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒,选择标记,细菌复制起点,导向于要插入或取代E1区的表达盒的第一腺病毒同源区和第二腺病毒同源区的穿梭载体。所述第一和第二同源区位于所述表达盒侧翼。第一同源区包括至少大约100个碱基对,它们基本上与野生型腺病毒区的大约碱基对4-450的至少右侧末端(3′末端)同源。第二同源区包括至少大约100个碱基对,它们基本上与Ad5的大约碱基到3511-5792的至少左侧末端(5’末端)或来自另一种腺病毒的相应区同源。
所提到的“基本上同源”表示与目标区特异性重组的足够的同源性程度。在不同实施方案中,基本上同源表示至少85%,至少95%或100%的序列同一性。序列同一性可以按照上文I.B.节中所披露的方法进行。
生产腺病毒载体的一种方法是通过产生包括一个表达盒的腺病毒基因组质粒。前腺病毒质粒包括在需要的互补细胞系中复制所需要的所有腺病毒序列。然后用限制酶消化所述前腺病毒质粒,以便释放病毒ITR′s,并且转染到所述互补细胞系中,进行病毒回收。ITR′s必须从质粒序列上释放,以便能够进行复制。腺病毒载体回收导致了含有所述表达盒的腺病毒载体的产生。
A.腺病毒基因组质粒
腺病毒基因组质粒包括存在于较大长度质粒(它可以是粘粒)上的腺病毒载体序列。所述较大长度的质粒可以包括其他元件,如根据生产和保持所述质粒所采用的方法,有助于真核细胞或细菌细胞生长和选择的元件。用于生产腺病毒基因组质粒的技术,包括与使用穿梭载体和同源重组相关的技术,和与将基因表达盒插入腺病毒粘粒相关的技术(Hitt等,Methods in Molecular Genetics 7:13-30,1995,Danthinne等,Gene Therapy 7:1707-1714,2000)。
腺病毒基因组质粒优选具有插入E1或E3缺失区的基因表达盒。在本发明的一种实施方案中,所述腺病毒基因组质粒包括插入E1缺失区的基因表达盒,复制起点,选择标记,和重组腺病毒区,该腺病毒区由以下成分组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;和
g)相当于存在于Ad5或Ad6中的E3区的全部或一部分的任选存在的E3区,根据需要的腺病毒载体的总体大小,可以提供较小的插入片段。
在本发明的另一实施方案中,所述重组腺病毒基因组质粒具有插入到E3缺失区的基因表达盒。所述载体包括复制起点,选择标记,和以下部分:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒结合的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在不同实施方案中,存在相关的腺病毒区:
(1)相当于Ad5的第一,第二,第三,第四和第五区;
(2)相当于Ad6的第一,第二,第三,第四和第五区;和
(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区和相当于Ad5的第五区。
本发明的一种实施方案披露了一种制备腺病毒载体的方法,包括生产腺病毒基因组质粒的同源重组步骤和腺病毒回收步骤。所述同源重组步骤包括使用其侧翼为腺病毒同源区的包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的穿梭载体。所述腺病毒同源区将表达盒导向于E1或E3缺失区。
在本发明的一种实施方案中,涉及生产腺病毒基因组质粒,将基因表达盒插入载体,包括:从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。所述腺病毒基因组质粒应当包括复制起点和选择标记,并且可以包括Ad5或Ad6的E3区的全部或一部分。
在涉及腺病毒区的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四和第五区;(2)相当于Ad6的第一,第二,第三,第四和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于Ad5的第五区。
B.腺病毒载体回收
可以用本领域已知的或本文所披露的技术,从重组腺病毒基因组质粒中回收腺病毒载体。用于回收腺病毒的技术的例子为本领域所熟知,并且披露于以下文献中:Hitt等,Methods in Molecular Genetics7:13-30,1995,和Danthinne等,Gene Therapy 7:1707-1714,2000。
回收本文所披露的腺病毒载体的优选方法,包括加强腺病毒复制。例如,加强腺病毒复制可以通过在独立的载体上补充腺病毒功能,如E2蛋白(聚合酶,前末端蛋白和DNA结合蛋白)以及E4或f6进行。下面的实施例10披露了加强腺病毒复制,以便回收包括密码子优化的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体。
V.部分优化的HCV编码序列
HCV多蛋白编码核酸的部分优化提供了优化用于在人体内表达的较少量的密码子而不是全面优化。总体目标是提供由于密码子优化而产生的增强表达的优点,同时有利于生产包括具有优化密码子的HCV多蛋白编码核酸的腺病毒载体。
HCV多蛋白编码序列的完全优化,提供了每一种氨基酸的最常见的人密码子。完全优化可以用本领域所熟知的密码子频率表进行,并且使用诸如BACKTRANSLATE的程序(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc.)。
部分优化可以对所存在的完整HCV多蛋白编码序列(例如,NS3-NS5B)进行,或对存在的一个或多个局部区域进行。在不同实施方案中,所存在的完整HCV编码多肽的GC含量不超过至少大约65%;并且一个或多个局部区域的GC含量不超过大约70%。
局部区域是存在于HCV编码核酸中的区域,并且其大小可以改变。例如,局部区域的长度可以为大约60,大约70,大约80,大约90或大约100个核苷酸。
部分优化可以通过首先构建要根据天然存在的序列部分优化的HCV编码多蛋白序列而实现。另外,可以将优化的HCV编码序列用作比较的基础,以便产生部分优化的序列。
VI.HCV组合治疗
可以使用HCV Met-NS3-NS4A-NS4B-NS5A-NS5B疫苗本身来治疗患者,可以与其他HCV治疗剂组合使用,并且可以与针对其他类型疾病的试剂一起使用。其他治疗剂包括治疗HCV和具有高的HCV感染倾向人体内的疾病的其他治疗剂。针对其他类型疾病的试剂包括针对HIV和HBV的疫苗。
用于治疗HCV的其他治疗剂,包括疫苗和非疫苗制剂(Zein,Expert Opin.Investig.Drugs 10:1457-1469,2001)。其他HCV疫苗的例子包括为了诱导针对HCV核心抗原和HCV E1,E2或p7区的免疫反应而设计的疫苗。疫苗成分可以是天然存在的HCV多肽,HCV模拟表位(mimotope)多肽或编码序列所述多肽的核酸。
HCV模拟表位多肽包括HCV表位,但是具有与天然存在的HCV抗原不同的序列。HCV模拟表位可以与天然存在的HCV抗原融合。在以下文献中,提供了披露用于生产模拟表位的一般性技术的参考文献,并且披露了不同的HCV模拟表位:Felici等,美国专利号5,994,083和Nicosia等,国际申请号WO 99/60132。
VII.药物施用
可以采用本文所提供的说明以及本领域所熟知的技术,制备并且给患者施用HCV疫苗。例如,一般性药物施用的指南披露于以下文献中:Modern Vaccinology,Ed.Kurstak,Plenum Med.Co.1994;Remington′s Pharmaceutical Sciences 18th Edition,Ed.Gennaro,Mack Publishing,1990;和Modern Pharmaceutics 2″dEdition,Eds.Banker和Rhodes,Marcel Dekker,Inc.,1990,其中的每一份文献都被收作本文参考。
HCV疫苗可以通过不同途径施用,如静脉内,腹膜内,皮下,肌内,真皮内,通过皮肤的按压或鼻内途径。优选的途径是肌内途径。
肌内施用可以使用不同的技术进行,例如通过使用或不用一个或多个电脉冲注射。电介导的转移,可能有利于通过刺激体液和细胞免疫反应进行遗传学免疫。
疫苗注射可以用不同的技术进行,如通过采用针头注射系统或无针头注射系统。无针头注射系统的例子是喷射注射装置(Donnelly等,国际公开号WO 99/52463)。
A.电介导的转移
电介导的转移或基因电-转移(GET),可以通过在核酸注射之后输送合适的电脉冲进行(参见Mathiesen,国际公开号WO 98/43702)。质粒注射和电穿孔可以用不锈钢针头进行。针头是成对的,三联的或更复杂的形式的。在一种设计中,将所述针头焊接在印刷电路板上,所述电路板是机械支持物,并且通过合适的电缆将针头与电场发生器连接在一起。
以电脉冲形式提供电刺激。脉冲可以具有不同的形式(矩形,正弦,三角形,指数衰减)和不同的极性(具有阳性或阴性极性的单极,双极)。脉冲可以以稳定的电压或稳定的电流形式输送。
可以利用不同形式的电治疗,将包括HCV的核酸疫苗和其他核酸疫苗导入患者体内。可行的电治疗方式包括以下方案:
治疗1:每隔1秒钟输送10串1000个矩形双极脉冲,脉冲长度为0.2毫秒/相,频率为1000Hz,稳定电压模式,45伏/相,浮动电流。
治疗2:每隔1秒钟输送2串100个矩形双极脉冲,脉冲长度为2毫秒/相,频率为100Hz,稳定电流模式,100毫安/相,浮动电压。
治疗3:2串双极脉冲,脉冲长度为大约2毫秒/相,总长度为大约3秒钟,其中,穿过组织的实际电流固定在大约50毫安。
电脉冲是通过电场发生器输送的。合适的发生器可以包括3个独立的硬件部件,它们组装于一个共同的底盘,并且通过便携式PC运行驱动程序驱动。所述软件同时管理基础功能和辅助功能。该装置的部件包括:(1)通过微处理器驱动的信号发生器,(2)电放大器和(3)数字示波器。
所述信号发生器,在特定范围内在软件控制下输送具有任意频率和形状的信号。所述相同的软件具有用于要输送的波形的相互作用编辑器,所述发生器涉及一种数字控制的电流限制装置(控制最大电流输出的安全装置)。所述电力放大器可以将所产生的信号放大到+/-150V。所述示波器是数字化的,并且能够对由所述放大器输送的电压和电流进行取样。
B.药用载体
可以药用的载体有利于疫苗的保存和给对象施用。在本文中披露了可以药用的载体的例子。其他可以药用的载体为本领域所熟知。
可以药用的载体可以包括不同的成分,如缓冲液,普通盐水或磷酸缓冲的盐水,蔗糖,盐和聚山梨酸酯。可以药用的载体的例子如下:2.5-10mM TRIS缓冲液,优选大约5mM TRIS缓冲液;25-100mM NaCl,优选大约75mM NaCl;2.5-10%蔗糖,优选大约5%蔗糖;0.01-2mMMgCl2;和0.001%-0.01%聚山梨醇酯80(来自植物的)。PH优选为大约7.0-9.0,更优选大约8.0。载体的一种具体例子包括5mM TRIS,75mM NaCl,5%蔗糖,1mM MgCl2,0.005%聚山梨醇酯80,pH8.0。
C.用药方案
可以根据特定疫苗效力和诸如患者年龄,体重,性别和医学状况等因素;施用途径;需要的效果;以及用药次数,确定合适的用药方案。特定疫苗的效力取决于不同因素,如特定疫苗产生多肽的能力,所述多肽是在细胞中表达和加工的,并且以I类和II类MHC复合物的形式出现。
给患者施用的HCV编码核酸可以是包括病毒载体在内的不同类型载体的一部分,如腺病毒载体,和DNA质粒疫苗。在涉及施用DNA质粒的不同实施方案中,给患者施用大约0.1-10mg质粒,以及给患者施用大约1-5mg质粒。在涉及施用病毒载体,优选腺病毒载体的不同实施方案中,给患者施用大约105-1011病毒颗粒,以及给患者施用大约107-1010病毒颗粒。
病毒载体疫苗和DNA质粒疫苗可以单独施用,或者可以作为激发和加强施用方案的一部分。激发和加强接种的一种混合形式,包括用DNA激发和用病毒载体疫苗加强,或用病毒载体疫苗激发和用DNA疫苗加强。
可以使用多次激发,例如大约2-4次或更多次。激发和加强之间的时间长度,通常从大约4个月到1年,不过,可以采用其他时间方案。采用DNA疫苗的激发方案,可优选用于患有以前存在的腺病毒免疫反应的患者的场合。
在本发明的一种实施方案中,将1×107-1×1012腺病毒载体颗粒,优选大约1×1010-1×1011腺病毒载体颗粒直接施用于肌肉组织中。在初次接种之后,用腺病毒载体或DNA疫苗进行加强。
在本发明的另一种实施方案中,初次的接是通过直接进入肌肉组织中的DNA疫苗进行的。在初次免疫之后,用腺病毒载体或DNA疫苗进行加强。
可以同时施用诸如白介素-12,GM-CSF,B7-1,B7-2,IP10,Mig-1的试剂,以便加强免疫反应。所述试剂可以作为蛋白施用,或者通过使用核酸载体施用。
D.异源激发-加强
异源激发-加强是一种混合形式,它包括使用一种类型的病毒载体进行激发,而用另一种类型的病毒载体进行加强。所述异源激发-加强可包括相关的载体,如基于不同腺病毒血清型的载体,以及关系更远的病毒,如腺病毒和痘病毒。在以下文献中披露了利用痘病毒和腺病毒载体防止小鼠出现疟疾:Gilbert等,Vaccine 20:1039-1045,2002。
涉及激发和加强的不同实施方案,包括表达所需抗原的以下类型的载体,如Met-NS3-NS4A-NS4B-NS5A-NS5B:Ad5载体,随后是Ad6载体;Ad6载体,随后是Ad5载体;Ad5载体,随后是痘病毒载体;痘病毒载体,随后是Ad5载体;Ad6载体,随后是痘病毒载体;和痘病毒载体,随后是Ad6载体。
激发和加强之间的时间长度,通常为大约4个月到1年,不过,可以使用其他时间方案。最低时间方案应当足够允许免疫学休息。在一种实施方案中,这种休息是为期至少6个月的时间。激发可能包括用一种类型的载体多次激发,如激发2-4次。
存在于水痘病毒载体中的表达盒,应当包括一个激发子,该激发子是天然的,或源于感兴趣的痘病毒或其他痘病毒成员。构建和使用不同类型的痘病毒型载体的不同方法,包括基于痘苗病毒,修饰过的痘苗病毒,禽痘病毒,浣熊痘病毒,修饰过的痘苗病毒Ankara,金丝雀痘病毒(如ALVAC),禽痘病毒,牛痘病毒,和NYVAC的载体是本领域所熟知的(Moss,Current Topics in Microbiology andImmunology 158:25-38,1982;Earl等,In Current Protocolsin Molecular Biology,Ausubel等eds.,New York:GreenePublishing Associates & Wiley Interscience;1991:16.16.1-16.16.7,Child等,Virology 174(2):625-9,1990;Tartaglia等,Virology 188:217-232,1992;美国专利号4,603,112,4,722,848,4,769,330,5,110,587,5,174,993,5,185,146,5,266,313,5,505,941,5,863,542,和5,942,235)。
E.佐剂
HCV疫苗可以与佐剂一起配制。对于DNA质粒疫苗来说,佐剂是特别有用的。佐剂的例子包括明矾,AlPO4,alhydrogel,脂质-A及其衍生物或变体,弗氏不完全佐剂,中性脂质体,含有疫苗和细胞因子的脂质体,非离子型嵌段共聚物和趋化因子。
含有聚环氧乙烷(POE)和聚环氧丙烷(POP)的非离子型嵌段聚合物,如POE-POP-POE嵌段共聚物可以用作佐剂(Newman等,CriticalReviews in Therapeutic Drug Carrier Systems 15:89-142,1998)。可以用与阴离子型表面活性剂组合的非离子型嵌段共聚物增强核酸的免疫反应。
佐剂制剂的一种具体例子是含有CRL-1005(CytRx ResearchLaboratories),DNA,和benzylalkonium chloride(BAK)的制剂。该制剂可以通过使用正位移移液管将纯的聚合物添加到溶解在PBS中的质粒DNA的冷却(<5℃)溶液中而制备。然后对该溶液进行涡旋搅拌,以便使所述聚合物溶解。在所述聚合物完全溶解之后,在低于所述聚合物的絮凝点(大约6-7℃)的温度下获得了透明溶液。然后通过缓慢添加溶解在PBS中的BAK的稀释溶液,将大约4mM BAK添加到溶解在PBS中的DNA/CRL-1005溶液中。在添加聚合物和BAK之前,最初DNA浓度为大约6mg/mL,而最终DNA浓度为大约5mg/mL。在添加BAK之后,对该制剂进行充分涡旋搅拌,然后使它的温度提高到高于絮凝点大约2℃。冷却和混合同时使它的温度提高到高于絮凝点大约2℃,重复进行若干次,直到该制剂的粒度为大约200-500nm,该粒度是通过动态光学散射测定的。然后将该溶液保存在冰上一直到该溶液透明,然后放在-70℃下保存。在使用之前,让该溶液在室温下解冻。
F.疫苗保存
可以利用不同类型的缓冲液保存腺病毒载体和DNA疫苗。例如,可以用下面的实施例9中所披露的缓冲液A105保存载体。
通过清除或螯合微量金属离子,可以改善对DNA的保存。可以将琥珀酸或苹果酸的试剂和螯合剂用于改善DNA疫苗的稳定性。螯合剂的例子包括多种磷酸配体和EDTA。添加诸如乙醇或甘油的非还原性自由基清除剂还可以防止因为自由基的产生对DNA质粒的破坏。另外,在所述制剂中可以控制缓冲液的类型,pH,盐浓度,光照,以及消毒方法的类型,以便优化所述DNA疫苗的稳定性。
VII.实施例
提供下面的实施例是为了进一步说明本发明的不同特征。这些实施例还说明了可用于实施本发明的方法。这些实施例没有限定要求保护的本发明。
实施例1:Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒
根据1b亚型HCV BK菌株构建了编码HCV NS3-NS4A-NS4B-NS5A-NS5B的不同的基因表达盒。所编码的序列具有下列任一种序列:(1)活性NS5B序列(″NS″),(2)失活的NS5B序列(″NSmut″),(3)具有失活的NS5B序列的密码子优化序列(″NSOPTmut″)。所述表达盒还包括CMV激发子/增强子和BGH聚腺苷酸化信号。
NS核苷酸序列(SEQ.ID.NO.5)与HCV BK菌株GenBank保藏号M58335相比,在5952个核苷酸中有30个核苷酸不同。NS氨基酸序列(SEQ.ID.NO.6)与相应的1b基因型HCV BK菌株在1984个氨基酸中有7个氨基酸不同。为了能够起始翻译,在NS序列的5′末端存在一个ATG密码子。在NS序列的3′末端存在一个TGA终止序列。
NSmut核苷酸序列(SEQ.ID.NO.2,图2)与NS序列相似。NSmut和NS之间的差别包括NSmut具有改变了的NS5B催化位点;在5′末端具有一个最佳核糖体结合位点;以及在3′末端具有一个TAAA终止序列。NS5B上的改变包括5138-5146号碱基,这些碱基编码1711-1713号氨基酸。所述改变导致了氨基酸GlyAspAsp改变成AlaAlaGly,并且产生了失活形式的NS5B RNA-依赖型RNA-聚合酶NS5B。
NSOPTmut序列(SEQ.ID.NO.3,图3)是根据由NSmut编码的氨基酸序列设计的。使用GCG(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc)BACKTRANSLATE程序将NSmut氨基酸序列反向翻译成核苷酸序列。为了制备NSOPTmut核苷酸序列,其中的每一种氨基酸是由相应的最常见的人密码子编码的,该程序是这样进行的:选择最可能的氨基酸序列的产生作参数,并且规定在GCG软件包内可获得的高度表达的人基因(human-high.cod)的密码子频率表作为翻译方案。
实施例2:制备具有NS,NSmut或NSOPTmut序列的pV1Jns质粒
含有NS,NSmut或NSOPTmut序列的pV1Jns质粒是通过以下方法制备和表征的:
具有NS序列的pV1Jns质粒
将来自HCV BK型菌株的编码区Met-NS3-NS4A-NS4B-NS5A和编码区Met-NS3-NS4A-NS4B-NS5A-NS5B(Tomei等,J.Virol.67:4017-4026,1993)克隆到pcDNA3质粒(Invitrogen)上,分别制备pcD3-5a和pcD3-5b载体。用HindIII消化PcD3-5A,用Klenow填充片段补平末端,随后用XbaI消化,以便产生相当于Met-NS3-NS4A-NS4B-NS5A的编码区的片段。将该片段克隆到pV1Jns-poly上,用BglII消化,用Klenow填充片段补平末端,随后用XbaI消化,制备pV1JnsNS3-5A。
pV1Jns-poly是pV1JnsA质粒的衍生物(Montgomery等,DNA andCell Biol.12:777-783,1993),通过将含有XbaI,PmeI,PacI的识别位点的多接头插入独特的BglII和NotI限制位点进行修饰。具有NS序列的pV1Jns质粒(pV1JnsNS3-5B)是通过以下方法获得的:同源重组到细菌菌株BJ5183中,用通过XbaI和NotI消化线性化的pV1JNS3-5A和含有大约200bp的NS5A,NS5B编码序列和大约60bp的BGH聚腺苷酸化信号共转化。所得到的质粒被称为pV1Jns-NS。
pV1Jns-NS可以归纳如下:
碱基                   pV1JnsA的1-1881号碱基
一个额外的             AGCTT
随后是                 Met-NS3-NS5B序列(SEQ.ID.NO.5)
然后是                 wt TGA终止子
一个额外的             TCTAGAGCGTTTAAACCCTTAATTAAGG(SEQ.ID.NO.14)
碱基                   pV1JnsA的1912-4909号碱基
具有NSmut序列的pV1Jns质粒
通过添加完整Kozak序列修饰V1JnsNS3-5A质粒的5′末端的NS3编码序列。该质粒(V1JNS3-5Akozak)是通过重组到细菌菌株BJ5183中,用通过A/HI消化线性化的V1JNS3-5A和包括内含子A的近端部分,限制位点BglII,完整的Kozak翻译起始序列和NS3编码序列的一部分的PCR片段共转化获得的。
通过用XbaI消化使所得到的质粒(V1JNS3-5Akozak)线性化,并且与包括大约200bp的NS5A,NS5B突变序列,强翻译终止序列TAAA和大约60bp的BGH聚腺苷酸化信号的PCR片段一起共转化到细菌菌株BJ5183中。所述PCR片段是通过组装两个22bp的重叠片段获得,其中,通过用于扩增它们的寡核苷酸引入了突变。所得到的质粒被称pV1Jns-NSmut。
pV1Jns-NSmut可以归纳如下:
碱基                     pV1JnsA的1-1882号碱基
随后是                   kozak Met-NS3-NS5B(mut)TAAA序列(SEQ.ID.NO.2)
一个额外的               TCTAGA
碱基                     pV1JnsA的1925-4909号碱基
具有NSOPTmut序列的pVIJns质粒
通过位于该基因5’和3’末端的BamHI和SalI限制位点消化人密码子优化的合成基因(NSOPTmut),它具有突变的NS5B,以便破坏酶促活性,完整的Kozak翻译起始序列和强翻译终止序列。然后将该基因克隆到存在于V1JnsA质粒的多接头上的BglII和SalI限制位点上,以便产生V1Jns-NSOPTmut。
pV1Jns-NSOPTmut可以归纳如下:
碱基                     pV1JnsA的1-1881号碱基
一个额外的               C
然后是                   kozak Met-NS3-NS5B(optmut)TAAA序列(SEQ.ID.NO.3)
一个额外的               TTTAAATGTTTAAAC(SEQ.ID.NO.15)
碱基                     pV1JnsA的1905-4909号碱基
质粒表征
通过转染在补充了L-谷氨酰胺(最终浓度4mM)的10%FCS/DMEM中生长的SEK293细胞,测试HCV NS蛋白的表达。在转染之前24小时,将细胞铺平板到直径35毫米的6个孔中,以便在转染的当天到达90%-95%的铺满度。使用LIPOFECTAMINE 2000试剂,用40纳克质粒DNA(事先确定为非饱和DNA用量)和100纳克含有Rous肉瘤病毒激发子控制的荧光素酶报导基因的pRSV-Luc质粒共转染。在37℃下,将细胞保持在CO2培养箱中48小时。
用1%Triton/TEN缓冲液制备细胞提取物。将所述提取物的荧光素酶活性标准化,并且在10%SDS聚丙烯酰胺凝胶上对系列稀释液进行电泳。将蛋白转移到硝酸纤维素上,并且用针对NS3,NS5A和NS5B的抗体分析,以便评估表达强度和正确的蛋白水解裂解。用模拟转染的细胞作为阴性对照。在图12中示出了来自测试pV1JnsNS,pV1JnsNSmut和pV1JnsNSOPTmut的典型实验的结果。
实施例3:用质粒DNA载体对小鼠进行免疫
将DNA质粒pV1Jns-NS,pV1Jns-NSmut和pV1JnsNSOPTmut注射到不同的小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。两个不同的株(Balb/C和C57Black6,N=9-10)用25或50μg的DNA进行肌内注射,随后进行电脉冲。每一只动物每隔3周接受2个剂量。
在两次用药之后,通过对细菌表达的NS3蛋白酶结构域进行ELISA,测定在C57BIack6小鼠体内诱导的针对NS3蛋白的体液免疫反应。在用所有三种载体免疫的动物体内检测到对测试抗原特异的抗体,几何平均效价(GMT)在94000-133000范围内(表1-3)。
表1:pV1jns-NS
  GMT
小鼠   1   2  3   4   5   6   7   8   9
效价   105466   891980  78799   39496   543542   182139   32351   95028   67800   94553
表2:pV1jns-NSmut
  GMT
小鼠   11   12   13   14   15   16   17   18   19   20
效价   202981   55670   130786   49748   17672   174958   44304   37337   78182   193695   75083
表3:pV1jns-NSOPTmut
  GMT
小鼠   21   22   23   24   25   26   27   28   29   30
效价   310349   43645   63496   82174   630778   297259   66861   146735   173506   77732   133165
在以3周的间隔2次肌内注射25μg质粒DNA免疫的C57BIack6小鼠体内检测到T细胞反应。进行定量ELIspot分析,以便测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过用包括针对C57BIack6小鼠的CD8+表位的二十聚体肽(pep1480)进行相同的测定,分析特异性CD8+反应。
用标准ELIspot分析,检测以抗原特异性形式分泌IFNγ的细胞。通过相同的ELIspot测定分析,以三周的间隔用50μg质粒DNA进行2次肌内注射免疫的C57BIack6小鼠体内的T细胞反应,测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽具有10个残基的重叠,包括NS3-NS5B序列。
用免疫过的小鼠制备脾细胞,并且重悬浮在R10培养基中(RPMI1640,补充了10%FCS,2mM L-谷氨酰胺,50U/ml-50μg/ml青霉素/链霉素,10mM Hepes,50μM 2-巯基乙醇)。用纯化的大鼠抗小鼠INFγ抗体(PharMingen,Cat.No.18181D,PharmiMingen,10975Torreyana Road,San Diego,California 92121-1111 USA)对Multiscreen 96-孔过滤平板(Millipore,Cat.No.MAIPS4510,Millipore Corporation,80 Ashby Road Bedford,MA)进行包被。在培养过夜之后,用PBS1X/0.005%Tween洗涤平板,并且用250μl/孔的R10培养基封闭。
用免疫过的小鼠制备脾细胞,并且在存在或不存在10μM肽的条件下,以2.5×105/孔或5×105/孔的密度将它培养24小时。在充分洗涤(PBS1X/0.005%Tween)之后,添加生物素化的大鼠抗小鼠IFNγ抗体(PharMingen,Cat.No.18112D,PharMingen,10975 TorreyanaRoad,San Diego,California 92121-1111 USA),并且在4℃下培养过夜。为了显影,添加链亲和素-AKP(PharMingen,Cat.No.13043E,PharMingen,10975 Torreyana Road,San Diego,California92121-1111 USA)和1-StepTMNBT-BCIP显影溶液(Pierce,Cat.No.34042,Pierce,P.O.Box 117,Rockford,IL 61105 USA)。
利用包括HCV BK菌株NS3-NS5B的完整序列的二十聚体重叠肽的合并物显示HCV-特异性IFNγ-分泌T细胞。同样,将包括针对C57Black6小鼠的CD8+表位的单一的二十聚体肽用于检测CD8反应。在图13A和13B中示出了来自通过两次注射25或50μg质粒载体pV1Jns-NS,pV1Jns-NSmut和pV1Jns-NSOPTmut免疫的C57Black6和Balb/C小鼠(N=9-10)组的代表性数据。
实施例4:猕猴的免疫
通过肌内注射溶解在7.5mg/ml CRL1005,洁尔灭0.6mM中的5mg质粒pV1Jns-NSOPTmut对猕猴(N=3)进行免疫。在0和4周在每只动物的三角肌注射两剂。
通过IFN-γELISPOT在不同的时间点测定CMI。该分析测定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。
特定肽或肽合并物的使用可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析和干扰素-γ细胞内染色分析中的抗原呈递。制备基于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5A,NS5B),以便用于在所述分析中测定在HCV DNA和腺病毒载体免疫的猕猴和HCV-感染的人体内的免疫反应。各个的肽是重叠的20-聚体,错开10个氨基酸。可以将肽的大的合并物用于检测对HCV蛋白的总体反应,而将较小的合并物和各个肽用于确定一种反应的表位特异性。
IFNγELISPOT
IFNγ-ELISPOT分析能提供HCV特异性T淋巴细胞反应的定量测定。对PBMC进行系列稀释,并且放入用抗猕猴IFN-γ抗体(MD-1 U-Cytech)包被的微量滴定板的孔中。用HCV肽合并物将它们培养20小时,导致了前体细胞和IFN-γ分泌的再刺激。洗掉所述细胞,留下与细胞附着的浓集区上的抗体包被的孔结合的分泌的IFN。用生物素化的抗猕猴IFN抗体(detector Ab U-Cytech),随后用碱性磷酸酶偶联的链亲和素(Pharmingen 13043E)检测捕获的IFN。添加不溶性碱性磷酸酶底物,导致了在所述孔中细胞所在的位置出现暗斑,为分泌IFN-γ的每一个T细胞留下一个斑点。
每个孔的斑点的数量与抗原特异性T细胞的前体频率直接相关。在该分析中选择干扰素γ作为观察的细胞因子(使用物种特异性抗γ干扰素单克隆抗体),因为它是最常见的,并且是由激活的T淋巴细胞合成和分泌的最丰富的细胞因子之一。对于该分析来说,在存在和不存在(培养基对照)肽抗原的情况下,测定样品的每一百万PBMCs中成斑细胞(SFC)的数量。在表4中示出了在施用两种物质之后来自猕猴的PBMC的数据。
表4
          PV1J-NSOPTmut
合并物     21G     99C161     99C166
F(NS3p)     8     10     170
G(NS3h)     7     592     229
H(NS4)     3     14     16
I(NS5a)     5     71     36
L(NS5b)     14     23     11
M(NS5b)     3     35     8
DMSO     2     4     5
来自通过两次注射5mg DNA/剂免疫的猕猴的PBMC的INFγELISPOT,存在于质粒pV1Jns-NSOPTmut的OPTIVAX/BAK中。数据是以SFC7 106 PBMC形式表达的。
实施例5:Ad6前-腺病毒质粒的构建
Ad6前-腺病毒质粒是通过以下方法获得的:
构建pAd6 E1-E3+前-腺病毒质粒
利用Ad5和Ad6之间的广泛序列同一性(大约98%)或仅包括Ad6区,构建可用于制备第一代Ad6载体的基于Ad6的前-腺病毒质粒。利用同源重组将wt Ad6序列克隆到细菌质粒中。
在图10中示出了用于以含有Ad5和Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad5 ITR盒的第二种DNA片段共转化BJ5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad5基因组的右侧末端(碱基对33798-35935)和左侧末端(碱基对1-341和碱基对3525-5767)序列。ITR盒包括来自Ad5 342-3524的E1序列的缺失。ITR盒中的Ad5序列提供了与纯化的Ad5病毒DNA同源的区,其中,在该区可以发生重组。
通过限制分析,筛选潜在克隆,并且选择一个克隆作为pAd6E1-E3+。然后对该克隆进行全面测序。pAd6E1-E3+包括从碱基对1-341和碱基对3525-5548的Ad5序列,Ad6碱基对5542-33784,Ad5碱基对33967-35935(对于Ad5和Ad6来说,碱基编号是相对wt序列而言的)。pAd6E1-E3+包括所有Ad6毒粒结构蛋白的编码序列,构成了它的野生型特异性。
在图11中示出了用于以含有Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad6 ITR盒的第二种DNA片段共转化BJ5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad6基因组的右侧末端(碱基对35460-35759)和左侧末端(碱基对1-450和碱基对3508-3807)序列。这三种片段是通过PCR产生的,并且随后克隆到NEB193中,产生了pNEBAd6-3(ITR盒)。ITR盒包括Ad5的451-3507的E1序列的缺失。ITR盒中的Ad6序列提供了与纯化的Ad6病毒DNA同源的区,其中,可以发生重组。
pAd6 E1-E3-前-腺病毒质粒的构建
用含有Ad5区的pAd6E1-E3+作起点,构建了含有Ad5区,并且在E3区有缺失的Ad6型载体。将含有E3区(Ad6碱基对25871-31192)的pAd6E1-E3+的5322bp的亚片段亚克隆到pABS.3上,产生pABSAd6E3。然后在该质粒上产生3个E3缺失,产生了三种新的质粒pABSAd6E3(1.8Kb)(缺失了Ad6的碱基对28602-30440),pABSAd6E3(2.3Kb)(缺失了Ad6的碱基对28157-30437)和pABSAd6E3(2.6Kb)(缺失了Ad6的碱基对28157-30788)。然后利用细菌重组将3个E3缺失取代返回到pAd6E1-E3+中,产生Ad6基因组质粒pAd6E1-E3-1.8Kb,pAd6E1-E3-2.3Kb和pAd6E1-E3-2.6Kb。
实施例6:制备具有NS序列的Ad5基因组质粒
通过XmnI和NruI限制位点消化含有编码区NS3-NS4A-NS4B-NS5A的pcDNA3质粒(Invitrogen),并且将含有CMV激发子,NS3-NS4ANS4B-NS5A编码序列和牛生长激素(BGH)聚腺苷酸化信号的DNA片段克隆到穿梭载体pDelE1Spa的独将的EcorV限制位点上,产生了Sva3-5A载体。
用XmnI和EcorI消化(部分消化)含有编码区NS3-NS4A-NS4B-NS5A-NS5B的pcDNA3质粒,并且将含有部分NS5A,NS5B基因和BGH聚腺苷酸化信号的DNA片段克隆到Sva3-5A载体上,用EcorI和BglII消化,用Klenow补平末端,产生了Sva3-5B载体。
最后通过SspI和Bst1107I限制位点消化Sva3-5B载体,并且将含有其侧翼为腺病毒序列的表达盒(CMV激发子,NS3-NS4A-NS4B-NS5A-NS5B编码序列和BGH聚腺苷酸化信号)的DNA片段与Ad5HVO(E1-,E3-)ClaI线性化的基因组质粒一起共转化到细菌菌株BJ5183中,产生pAd5HVONS。pAd5HVO包括Ad5碱基对1-341,碱基对3525-28133和碱基对30818-35935。
实施例7:制备具有Nsmut序列的腺病毒基因组质粒
在Ad5或Ad6背景中,制备含有NS-mut序列的腺病毒基因组质粒。Ad6背景包括Ad5区的1-450,3511-5548和33967-35935号碱基。
用BglII和XbaI限制酶消化pV1JNS3-5Akozak,并且将含有Kozak序列和编码NS3-NS4A-NS4B-NS5A的序列的DNA片段克隆到BglII和XbaI消化过的polypMRKpdelE1穿梭载体中。所得到的载体被命名为shNS3-5Akozak。
PolypMRKpdelE1是RkpdelE1(Pac/pIX/pack450)+CMVmin+BGHpA(str)的衍生物。通过在CMV激发子下游的独特BglII限制位点上插入包括BglII,PmeI,SwaI,XbaI,SalI识别位点的多接头进行过修饰。MRKpdelE1(Pac/pIX/pack450)+CMVmin+BGHpA(str)包括Ad5序列的碱基对1-5792,具有E1序列的碱基对451-3510的缺失。将人CMV激发子和BGH聚腺苷酸化信号以E1平行取向插入E1缺失区,通过一个独特的BglII位点分隔它们。
通过组装PCR并且通过同源重组插入shNS3-Sakozak载体,获得了NS5B片段,该片段发生了突变以便破坏了酶促活性,并且在3’末端具有强的翻译终止序列,产生了polypMRKpdelE1NSmut。在polypMRKpdelE1NSmut中,NS-mut编码序列受CMV激发子的控制,并且BGH聚腺苷酸化信号存在于下游。
通过用PadI和Bst1107I限制酶切除所述基因表达盒和包括可以进行同源重组的腺病毒序列的侧翼区,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6Kb ClaI线性化的基因组质粒共同转化细菌菌株BJ5183,以便分别产生pAd5HVONSmut和pAd6E1-,E3-Nsmut。
pAd6E1-E3-2.6Kb包括Ad5碱基对1-341和碱基对3525-5548,Ad6碱基对5542-28157和碱基对30788-33784,和Ad5碱基对33967-35935(对于Ad5和Ad6来说,碱基对编号是相对wt序列而言)。在这两种质粒上,病毒ITR′s是通过包括细菌复制起点和氨苄青霉素抗性基因的质粒序列连接的。
实施例8:具有NSOPTmut的腺病毒基因组质粒的制备
用BamHl和SalI限制酶消化由克隆到pCRBlunt载体(Invitrogen)上的SEQ.ID.NO.3提供的人密码子优化的合成基因(NSOPTmut),并且克隆到存在于穿梭载体pMRKpdelE1上的BglII和SalI限制位点上。所得到的克隆(polypMRKpdelE1NSOPTmut)用PacI和Bst1107I限制酶消化,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6KbClaI线性化的基因组质粒一起共同转化到细菌菌株BJ5183中,分别产生pAd5HVONSOPTmut和pAd6E1-,E3-NSOPTmut。
实施例9:腺病毒载体的回收和扩增
在Per.6细胞中回收腺病毒载体。Per.C6是在补充了L-谷氨酰胺(最终浓度为4mM),青霉素/链霉素(最终浓度为100IU/ml)和10mMMgCl2的10%FCS/DMEM中生长的。在感染之后,将细胞保持在补充了5%马血清(HS)的相同培养基中。为了进行病毒回收,将2.5×106Per.C6铺平板到直径为6cm的Petri培养皿中。
在铺平板24小时之后,通过磷酸钙方法,用10μg的PacI线性化的腺病毒DNA转染细胞。将所述DNA沉淀留在细胞上4小时时间。去掉所述培养基,并且添加5%HS/DMEM。
将细胞保持在CO2培养箱中,直到出现细胞致病作用(1周)。回收细胞和上清液,并且进行3次冷冻/解冻循环(液氮/37℃的水浴)。在-4℃下,以3000rpm的速度对裂解物进行离心20分钟,并且以每个培养皿1毫升的用量,使用所回收的上清液(相当于包括仅在细胞上传代1次的病毒的细胞裂解液;P1),以便感染在直径10厘米的Petri培养皿中达到80%-90%铺满度的Per.C6。培养感染的细胞,直到出现细胞致病作用,回收细胞和上清液,并且按上述方法制备裂解液(P2)。
将P2裂解液(4ml)用于感染2×15cm的Petri培养皿。将从该感染中回收的裂解液(P3),以等份样品形式在-80℃下保存,作为病毒的原种,以便用作大规模病毒制备的原材料。在这种情况下,1ml的原种就足以感染直径为2×15cm的Petri培养皿,并且将所得到的裂解液(P4)用于感染要进行大规模感染的Petri培养皿。
进一步的扩增是用P4裂解液进行的,该裂解液用不含FCS的培养基稀释,并且用于以每个培养皿10ml的用量感染30×15cm的Petri培养皿(Per.C6达到80%-90%的铺满度)。在CO2培养箱中培养细胞1小时,每隔20分钟进行轻微混合。在每个培养皿中添加12ml 5% HS/DMEM,并且培养细胞直到出现细胞病理效应(大约48小时)。
收集细胞和上清液,并且在4℃下以2K rpm的速度离心20分钟。将沉淀重新悬浮在15ml 0.1M Tris,pH=8.0中。通过3次冷冻/解冻循环裂解细胞(液氮/37℃的水浴)。添加150μl的2MMgCl2和75μl的DNAse(溶解在10ml的20mM Tris-HCl pH=7.4中的10mg牛胰腺脱氧核糖核酸酶I,50mM NaCl,1mM二硫苏糖醇,0.1mg/ml牛血清白蛋白,50%甘油),在37℃的水浴中培养1小时之后(每隔15分钟涡旋搅拌1次),在4℃下以4K rpm的速度对裂解液进行15分钟的离心。所回收的上清液可以加样到CsCl梯度上。CsCl梯度是按以下方法在SW40超透明试管中制备的:
0.5ml的1.5d CsCl
3ml的1.35d CsCl
3ml的1.25d CsCl,在每个试管中加样5ml的病毒上清液。
如果必要的话,在所述试管上面放置0.1M tris-Cl,pH=8.0。用转子SW40,在10℃下以35K rpm将试管离心1小时。用注射器收集病毒带(位于1.25/1.35的界面上)。
将所述病毒转移到新的SW40超透明试管中,并且将1.35dCsCl添加在试管的顶部。用转子SW40,在10℃下以35K rpm将试管离心24小时,然后以尽可能小的体积收集病毒,并且用缓冲液A105(5mMTris,5%蔗糖,75mM NaCl,1mM MgCl2,0.005%聚山梨醇酯80,pH=8.0)充分透析。在透析之后,以10%的最终浓度添加甘油,并且在-80℃下,以等分样品的形式保存病毒。
实施例10:改善了的腺病毒载体回收
发现具有HCV NSOPTmut转基因的第一代Ad5和Ad6载体难以回收。回收过程的一个可能的障碍可能是因为质粒DNA不能有效复制,它是腺病毒复制机制的一种亚最佳模板。与DNA的5’末端连接的末端蛋白的缺乏(通常存在于病毒DNA中),与插入所述载体的E1区中的转基因的极高G-C含量相关,可能导致质粒衍生的腺病毒复制速度的显著降低。
为了建立回收Ad载体的更有效的和可再现的方法,采用了包括受tet-诱导型激发子控制的所有E2蛋白(聚合酶,前末端蛋白和DNA结合蛋白),以及E4 orf6的表达载体(pE2;图19)。PE2的转染与PerC6和293中的正常前腺病毒质粒的组合,导致了Ad DNA复制的显著增强,并且导致了完整感染性腺病毒颗粒的更有效的产生。
质粒构建
pE2是基于克隆载体pBII(CLONTECH)的,具有两个附加元件,以便能够进行附加型复制,并且在细胞培养物中选择:(1)EBV-OriP(EBV[nt]7421-8042)区,当EBNA-1表达时,使得质粒能够与细胞周期同步复制,和(2)潮霉素-B磷酸转移酶(HPH)-抗性基因,使得能够阳性选择转化过的细胞。按以下方法构建了腺病毒基因E2a和b以及E4-Orf6的两个转录单位,并且在pE2中进行组装。
Ad5-聚合酶ClaI/Sphl片段和Ad5-pTPAcc65/EcoRV片段是从pVac-Pol和pVac-pTP获得的(Stunnemberg等,NAR16:2431-2444,1988)。用Klenow补平这两个片段,并且克隆到pBI的SalI(补平的)和EcoRV位点上,分别获得了pBI-Pol/pTP。
通过将它克隆到pJC13-1的BamHI位点上,首先将来自pCEP4(Invitrogen)的EBV-OriP元件插入β-珠蛋白绝缘体二聚体中(Chung等,Cell74(3):505-14,1993)。然后将来自pJC13-OriP的HS4-OriP片段克隆到pSAlmv(一种含有tk-Hygro-B抗性基因表达盒和Ad5复制起点的质粒)内部,通过PCR由pFG140获得了首尾连接排列的ITR′s(Graham,EMBO J.3:2917-2922,1984),用以下引物:5′-TCGAATCGATACGCGAACCTACGC-3′(SEQ.ID.NO.16)和5′-TCGACGTGTCGACTTCGAAGCGCACACCAAAAACGTC-3′(SEQ.ID.NO.17),因此产生了pMVHS40rip。然后将来自pMVHS40rip的包括绝缘的OriP,Ad5 ITR连接和tk-HygroB盒的DNA片段插入pBI-Pol/pTP载体限制的AseI/AatII,产生了pBI-Pol/pTPHS4。
为了构建能表达Ad5-Orf6和Ad5-DBP的第二种转录单位,首先将通过PCR获得的E4orf6(Ad 5[nt]33193-34077)插入pBI载体,产生了pBI-Orf6。然后,将DBP编码DNA序列(Ad5[nt]22443-24032)插入pBI-Orf6,获得了第二种双向Tet-调节的表达载体(pBI-DBPB4orf6)。用BGH和SV40polyA取代存在于pBI中的原始polyA信号。
然后通过插入包括Adeno5-ITRs的DNA片段,修饰pBI-DBP/E4orf6,它们是以首尾连接形式排列的,还包括从质粒pSA-1mv中获得的潮霉素B抗性基因。然后将新的质粒pBIDBP/E4orf6shuttle用作供体质粒,以便用大肠杆菌菌株BJ5183进行同源重组,将第二种tet-调节的转录单位插入pBI-Pol/pTPHS4中,获得pE2。
细胞系,转染和病毒扩增
在补充了10%胎牛血清(FBS),10mM MgCl2,青霉素(100U/ml),链霉素(100ug/ml)和2mM谷氨酰胺的Dulbecco′s改良的Eagle′s培养基(DMEM)中培养PerC6细胞。
所有瞬时转染都是按照生产商披露的方法用Lipofectamine2000(Invitrogen)进行的。用PacI消化过的3.5μg的Ad5/6NSOPTmut前-腺病毒质粒自身或与5μg pE2加1μg pUHD52.1组合转染生长在6cm平板上的铺满度为90%的PERC.6TM。pUHD52.1是反向tet反式激活蛋白2(rtTA2)的表达载体(Urlinger等,Proc.Natl.Acad.Sci.U.S.A.97(14):7963-7968,2000)。在转染时,细胞是在存在1μg/ml多西环素的条件下培养的,以便激活pE2表达。在转染之后7天收获细胞,并且通过3次冷冻/解冻循环获得细胞裂解液。将2ml细胞裂解液用于感染第二个6cm培养皿的PerC6。培养感染的细胞,直到出现完整的CPE,然后收获。按上述方法让病毒顺序传代5次,然后在氯化铯梯度上纯化。纯化病毒的DNA结构是通过内切核酸酶消化和琼脂糖凝胶电泳分析控制的,并且与原始前腺病毒质粒限制图谱进行比较。
实施例11:HCV多蛋白编码核酸的部分优化
进行HCV多蛋白编码核酸的部分优化,以便促进包括用于在人宿主中表达的优化密码子的腺病毒载体的产生。总体目标是提供由于密码子优化而产生的增强的表达,同时促进编码HCV多蛋白的腺病毒载体的产生。
在生产编码HCV多蛋白的具有在人宿主中表达的优化密码子的腺病毒载体时,遇到了若干种难题。发现包括优化序列(SEQ.ID.NO.3)的腺病毒载体,比包括非优化序列(SEQ.ID.NO.2)的腺病毒载体更难以合成和回收。
生产包括SEQ.ID.NO.3腺病毒载体的难题是由于高的GC含量。特别有问题的区域是在NSOPTmut(SEQ.ID.NO.3)的大约3900号位置。
设计了另一种版本的优化HCV编码核酸序列,以便有利于它在腺病毒载体上的应用。与NSOPTmut相比,将所述另一种版本设计成具有较低的总体GC含量,以便减轻/避免连续的G或C的潜在的有问题的基序的出现,同时保持高水平的密码子优化,以便能够改善所编码的多蛋白和各个裂解产物的表达。
用于制备亚最佳密码子优化序列的起点是NSOPTmut核苷酸序列的编码区(SEQ.ID.NO.3的7-5961号碱基)。密码子使用频率的值(将每一种氨基酸标准化为总共1.0)是从在Wisconsin PackageVersion 10.3中提供件human_high.Cod中获得的(AccelrysInc.,a wholly owned subsidiary of Pharmacopeia,Inc)。
为了降低局部和总体GC含量,人工制备了确定每一种氨基酸的优选密码子取代的表格。对于每一种氨基酸来说,所述密码子1)与最常见的密码子相比,具有更低的GC含量,和2)选择出现较高的密码子使用频率(如在human_high.Cod中所定义的)作为取代密码子。例如,对于Arg来说,最高频率的密码子是CGC。在编码Arg的其他五种替代密码子(CGG,AGG,AGA,CGT,CGA)中,有三个(AGG,CGT,CGA)将GC含量降低了1个碱基,有1个(AGA)降低了2个碱基,并且有一个(CGG)降低了0个碱基。由于在human high.Cod中所列举的AGA密码子具有较低的使用频率(0.1),因此,取代CGC的密码子选择为具有0.18的相对频率的AGG。采用相似的标准,以便建立其他氨基酸的密码子取代,得到表5所示的清单。在以下优化方法中采用的参数是评经验确定的,以便所得到的序列保持显著改善了的密码子使用(对于每一种氨基酸而言),并且降低GC含量(总体上和连续G和/或C的局部片段形式)。
部分优化的HCV编码序列的两种例子是由SEQ.ID.NO.10和SEQ.ID.NO.11提供的。SEQ.ID.NO.10提供了整体上部分优化的HCV编码序列。SEQ.ID.NO.11提供了密码子使用完全优化的HCV编码序列,只有部分优化的区域例外。
密码子优化是通过以下方法进行的:
步骤1)使用3个密码子的滑动窗口(9个碱基),每一次循环后使所述窗口移动一个密码子,分析输入的完全优化的NSOPTmut序列的编码区。无论何时在所述窗口中检测到含有5个或5个以上连续C和/或G的片段,都采用以下取代规则:用N表示以前进行的密码子取代的数量。如果N是奇数的话,使用在表5中规定的密码子取代所述窗口中的中间密码子,如果N是偶数的话,使用在诸如human_high.cod.密码子优化表中规定的密码子取代窗口中的第三个末端密码子。如果在第二或第三个密码子存在Leu或Val,不进行任何取代,以便不导入具有很低相对密码子使用频率的Leu或Val密码子(例如,参见human_high.Cod)。在随后的循环中,对包括以前循环的取代的序列进行移动窗口分析。
根据经验发现所述3个密码子窗口中的中间和末端密码子的其他取代,提供了更令人满意的优化密码子使用的总体保持,同时还降低了GC含量(在该方法之后根据最终序列判断)。不过,一般来说,正确的取代方法取决于由接受分析的核苷酸序列所编码的氨基酸序列,并且必须凭经验确定。
步骤2)然后使用长度为21个密码子(63个碱基)的滑动窗口,对包括在步骤1)中进行的所有密码子取代的序列进行其他分析:根据可判断的参数,确定该窗口中总体GC含量。如果所述窗口中GC含量高于70%的话,就进行以下密码子取代方法:在所述窗口中,用表5中所提供的密码子取代氨基酸Asn,Asp,Cys,Glu,His,Ile,Lys,Phe,Tyr的密码子。对这一组氨基酸的取代的限制受到了以下事实的驱动:a)所述取代密码子仍然具有可接受的在human_high.Cod中的高的使用频率,和b)取代密码子的CUTG中的平均总体人密码子使用几乎与最常见的密码子一样高。在以下循环中,对包括前面循环的取代的序列进行移动窗口的分析。
通过GC含量总体上的降低和各个氨基酸的高密码子优化的保持之间的折中,凭经验确定70%的阈值。与步骤1)一样,确切的取代方法(氨基酸和GC含量阈值的选择),同样取决于由接受分析的核苷酸序列所编码的氨基酸序列,并且必须凭经验确定。
步骤3)然后人工编辑通过步骤1)和2)产生的序列,并且按照以下标准改变其他密码子:人工检查在具有21个密码子的窗口上GC含量仍然高于70%的区域,并且按照表5中提供的方案再次取代少数密码子。
进行随后的步骤,以便提供有用的限制位点,去掉互补链上的可能的开放读框,添加同源重组区,添加Kozac信号,并且添加一个终止子。这些步骤的编号为4-7。
步骤4)检查步骤3)中所产生的序列的某些限制位点(BglII,PmeI和XbaI)的缺乏和仅有一个StuI位点的存在,以便可以进行随后的使用一小类显著酶的克隆策略。通过取代作为相应识别位点的一部分的密码子,从所述序列中去掉两个位点(一个BglII位点,以及一个StuI位点)。
步骤5)然后相应修饰通过步骤1)-4)制备的序列,以便随后产生修饰过的NSOPTmut序列(通过同源重组)。在通过步骤1)-4)获得的序列中,包括3556-3755号碱基的片段和包括4456-4656号碱基的片段被来自NSOPTmut的相应的片段所取代。包括SEQ.ID.NO.10的3556-4656号碱基的片段可用于通过同源重组取代NSOPTmut上的有问题的区域(3900号位置附近),由此产生了具有SEQ.ID.NO.11的序列的NSOPTmut的变体。
步骤6)分析在步骤1)-5)产生的序列,发现了一个潜在的、几乎跨越互补链上的完整片段的开放读框。从所述有义链上去掉所有密码子CTA和TTA(Leu)和TCA(Ser),能够有效除去所述互补链上的一个读框中的所有终止密码子。尽管转录该互补链开放读框,以及随后翻译成蛋白的可能性非常小,为了排除对有义链上的编码的序列的转录和随后翻译的潜在的干扰,大约每隔500个碱基,将编码Ser的TCA密码子导入所述有义链。在步骤5)中导入的片段中没有引入变化,以便可以进行同源重组。编码Ser的TCA密码子优于编码Leu的CTA和TTA密码子,因为与human_high.Cod中的CTA(0.02)和TTA(0.03)相比,TCA具有更高的相对频率(0.05)。另外,来自CUTG的平均人密码子使用,倾向于TCA(对于CTA和TTA来说为0.14和0.07)。
步骤7)在最后一个步骤中,将GCCACC添加到该序列的5’末端,以便产生一个优化的内部核糖体进入位点(Kozak信号),并且在3’末端添加一个TAAA终止信号。为了保持NSsuboptmut的翻译特性的激发,所述编码区的前8个密码子保持与NSOPTmut序列相同。再次检查所得到的序列上BglII,PmeI和XbaI识别位点的缺乏,和仅有一个StuI位点的存在。
与NSOPTmut(70.3%)相比,NSsuboptmut序列(SEQ.ID.NO.10)具有总体上较低的GC含量(63.5%),并且保持密码子使用优化的良好优化水平。NSsuboptmut与NSmut的核苷酸序列同一性为77.2%。
表5:在步骤1)和步骤2)期间进行的密码子取代的定义
氨基酸   最常见的密码子   相对频率 GC含量的降低(碱基)   取代密码子   相对频率
                其中的取代密码子将密码子GC含量降低1个碱基的氨基酸
Ala GCC 0.51 1 GCT 0.17
Arg CGC 0.37 1 AGG 0.18
Asn AAC 0.78 1 AAT     0.22
Asp GAC 0.75 1 GAT 0.25
Cys TGC 0.68 1 TGT 0.32
Glu GAG 0.75 1 GAA 0.25
Gln CAG 0.88 1 CAA 0.12
Gly GGC 0.50 1 GGA 0.14
His CAC 0.79 1 CAT 0.21
Ile ATC 0.77 1 ATT 0.18
Lys AAG 0.82 1 AAA 0.18
Phe TTC 0.80 1 TTT 0.20
Pro CCC 0.48 1 CCT 0.19
Ser AGC 0.34 1 TCT 0.13
Thr ACC 0.51 1 ACA 0.14
Tyr TAC 0.74 1 TAT 0.26
                                     没有替代密码子的氨基酸
Met ATG 1.00 0 ATG 1.00
Trp TGG 1.00 0 TGG 1.00
其中的取代密码子具有极低相对频率的氨基酸。在取代方法中,将这些氨基酸排除在外
Leu CTG 0.58 1 TTG 0.06
Val GTG 0.64 1 GTT 0.07
实施例12:病毒表征
通过以下方法表征腺病毒载体:(a)测定物理学颗粒/ml;(b)进行TaqMan PCR分析;和(c)在感染HeLa细胞之后检查蛋白表达。
a)物理颗粒测定
以1/10和1/100的比例用0.1%SDS PBS稀释氯化铯纯化的病毒。作为对照,使用缓冲液A105。在55℃下将所述稀释液培养10分钟,在对所述试管进行短时间离心之后,测定260nm下的O.D.。按以下方法计算病毒颗粒的数量:1OD 260nm=1.1×1012物理颗粒/ml。以上结果通常在5×1011和1×1012物理颗粒/ml范围内。
b)TaqMan PCR分析
将TaqMan PCR分析用于进行腺病毒载体基因组定量(Q-PCR颗粒/ml)。用ABI Prism 7700-序列检测仪进行TaqMan PCR分析。该反应是在50μl的最终体积中,在存在寡核苷酸(最终浓度200nM)和对腺病毒主链特异的探针(最终浓度200μM)的条件下进行的。用0.1%SDS PBS以1/10的比例稀释所述病毒,并且在55℃下培养10分钟。在对所述试管进行简单离心之后,制备系列的1/10稀释液(用水稀释)。将10μl的10-3,10-5和10-7稀释液用作PCR测定的模板。
根据在相同实验中产生的标准曲线,计算存在于每一种样品中的颗粒的数量。典型的结果为1×1012至3×1012Q-PCR颗粒/ml。
c)HCV非结构蛋白的表达
通过感染HeLa细胞检测HCV NS蛋白的表达。在感染前一天,以1.5×106细胞/皿(直径10cm的Petri培养皿)的密度将细胞铺平板。将相当于m.o.i.50,250和1250pp/细胞的不同数量的氯化铯纯化的病毒稀释在培养基(无FCS)中,达到5ml的最终体积。将稀释过的病毒添加到所述细胞上,并且在37℃下,在CO2培养箱中培养1小时(每隔20分钟进行轻柔混合)。添加5ml 5%HS-DMEM,并且在37℃下将所述细胞培养48小时。
用1%Triton/TEN缓冲液制备细胞提取物。在10%SDS-丙烯酰胺凝胶上对提取物进行电泳,吸印到硝酸纤维素膜上,并且用针对NS3,NS5a和NS5b的抗体分析,以便检查正确的多蛋白裂解。将模拟感染的细胞用作阴性对照。在图14中示出了来自测试Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut的典型实验的结果。
实施例13:用编码不同NS盒的腺病毒载体对小鼠进行免疫
将腺病毒载体Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut注射到C57Black6小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。用109pp的CsCl纯化的病毒肌内注射各组动物(n=9-10)。每只动物以三周的间隔接受两剂。
通过在用药之后对细菌表达的NS3蛋白酶结构域进行ELISA分析,测定在用药之后来自C57Black6免疫小鼠的两种血清中针对NS3蛋白的体液免疫反应。检测的对测试抗原特异的抗体的几何平均效价(GMT)为100-46000(表6,7,8和9)。
表6:Ad5-NS
  GMT
小鼠编号     1     2     3     4     5     6     7     8     9     10
效价     50     253     50     50     50     2257     504     50     50     50   108
表7:Ad5-Nsmut
  GMT
小鼠编号   11   12   13   14   15   16   17   18   19   20
效价   3162   78850   87241   6796   12134   3340   18473   13093   76167   49593   23645
表8:MRKAd5-Nsmut
  GMT
小鼠编号   21   22  23   24   25   26   27   28   29   30
效价   125626   39751  40187   65834   60619   69933   21555   49348   29290   26859   46461
表9:MRKAd6-NSmut
  GMT
小鼠编号   31   32   33   34   35   36   37
效价   25430   3657   893   175   10442   49540   173   2785
通过定量ELISPOT测定分析TC57Black6小鼠体内的T细胞反应,其中测定对20聚体的五种合并物(从F到L+M命名)的反应的IFN-γ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过相同的测定,使用包括C57Black6小鼠的CD8+表位(pep1480)的20聚体肽,分析在C57Black6小鼠体内诱导的特异性CD8+反应。通过标准ELIspot测定,检测以抗原特异性方式分泌IFNγ的细胞。
按上面实施例3所示方法生产并且处理脾细胞和肽。在图15中示出了来自通过两次注射109载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut的病毒颗粒免疫的C57Black6小鼠组(N=9-10)的代表性数据。
例14:用腺病毒载体对猕猴进行免疫
通过肌内注射氯化铯纯化的Ad5-NS,MRKAd5-NSmut,MRKAd6-Nsmut或MRKAd6-NSOPTmut病毒,对猕猴(N=3-4)进行免疫。在第0和第4周,每只动物在三角肌处接受两剂1011或1010vp。
在不同的时间点通过以下方法测定CMI:a)IFN-γELISPOT(参见上文的实施例3),b)IFN-γICS,和c)大量CTL分析。以上分析方法确定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。
特定肽或肽合并物的使用,可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析,和干扰素-γ细胞内染色分析中的抗原呈递。制备基于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5a,NS5b),以便在所述分析中用于测定HCV DNA和腺病毒载体免疫的猕猴,以及HCV感染的人体内的免疫反应。所述各个肽是重叠的20聚体,错开10个氨基酸。可以将大的肽合并物用于检测对HCV蛋白的总体反应,同时,可以将较小的合并物和各个肽用于确定一种反应的表位特异性。
IFN-γ1CS
对于IFN-γICS来说,用肽合并抗原刺激存在于1ml R10(补充了10%FCS的RPMI培养基)中的2×106PBMC。每一种肽的最终浓度为2μg/ml。在37℃下,在CO2培养箱中将细胞培养1小时,然后以10μg/ml的最终浓度添加Brefeldin A,以便抑制可溶性细胞因子的分泌。在37℃下将细胞再培养14-16小时。
在存在以下共刺激抗体的条件下进行刺激:CD28和CD49d(抗人CD28 BD340975和抗人CD49d BD340976)。在培养之后,用表面抗原的荧光染料偶联的抗体对细胞进行染色:抗-CD3,抗-CD4,抗-CD8(CD3-APC Biosource APS0301,CD4-PE BD345769,CD8-PerCPBD345774)。
为了检测细胞内细胞因子,用FACS透化缓冲液2(BD340973),2x最终浓度处理细胞。一旦固定和透化,用抗人IFN-γ,IFN-γFITC(Biosource AHC4338)的抗体培养细胞。
将细胞重新悬浮在用PBS制备的1%甲醛中,并且在24小时之内,在FACS上分析。在装有两种激光的FACSCalibur仪器(BectonDickinson)上进行四色FACS分析。通过门控与CD3,CD8阳性细胞群偶联的正向与侧向散射中的淋巴细胞群获得数据。获得了所述门的至少30,000个事件。阳性细胞是以106淋巴细胞中IFN-γ表达细胞的数量形式表达的。
在图16A-16D,17A和17B中,报导了在一次或两次注射1010或1011vp不同腺病毒载体之后从免疫过的猴获得的IFN-γELISPOT和IFN-γICS数据。
大量CTL分析
T淋巴细胞的区分效应物功能,是这种细胞群体的亚型直接裂解具有合适的MHC-相关抗原肽的细胞的能力。这种细胞毒性活性最常见的是与CD8+T淋巴细胞相关。
在体外用能表达HCV抗原的重组疫苗病毒感染PBMC样品大约14天,以便提供记忆T细胞的抗原再刺激和扩增。测试了针对用肽抗原合并物处理过的自体B细胞系的细胞毒性。
所述培养物的裂解功能,是以在用CTL效应细胞培养4小时期间,由靶细胞释放的铬导致的特异性裂解的百分比形式测定的。测定特异性细胞毒性,并且与不相关的抗原或赋形剂处理过的B细胞系进行比较。这种分析是半定量的,并且是确定CTL反应是否是由疫苗引起的优选方式。在图18A-18F中示出了在两次注射1011vp/剂和腺病毒载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut之后,来自免疫过的猴的数据。
其他实施方案在以下权利要求范围内。尽管业已示出了和说明了若干种实施方案,在不超出本发明构思和范围的前提下,可以进行各种改进。
                               序列表
                               序列表
<110>Merck & Co.Inc.,和Istituto Di Ricerche Di Biologia Molecolare P.
     Angeletti S.P.A.
<120>丙型肝炎病毒疫苗
<130>ITR0015Y PCT
<150>60/363,774
<151>2002-03-13
<150>60/328,655
<151>2001-10-11
<160>17
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1985
<212>PRT
<213>人工序列
<220>
<223>Met-NS3-NS4A-NS4B-NS5A-NS5B多肽
<400>1
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly
1               5                 10                  15
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
            20                  25                  30
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys
        35                  40                  45
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr
    50                  55                  60
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp
65                  70                  75                  80
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr
                85                  90                  95
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
            100                 105                 110
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
        115                 120                 125
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
    130                 135                 140
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145                 150                 155                 160
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met
                165                 170                 175
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
            180                 185                 190
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
        195                 200                 205
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
    210                 215                 220
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225                 230                 235                 240
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
                245                 250                 255
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly
            260                 265                 270
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
        275                 280                 285
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile
    290                 295                 300
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305                 310                 315                 320
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
                325                 330                 335
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly
            340                 345                 350
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe
        355                 360                 365
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly
    370                 375                 380
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385                 390                 395                 400
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
                405                 410                 415
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
            420                 425                 430
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
        435                 440                 445
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
    450                 455                 460
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly
465                 470                 475                 480
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
                485                 490                 495
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val
            500                 505                 510
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
        515                 520                 525
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
    530                 535                 540
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr
545                 550                 555                 560
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
                565                 570                 575
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
            580                 585                 590
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
        595                 600                 605
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met
    610                 615                 620
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625                 630                 635                 640
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val
                645                 650                 655
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp
            660                 665                 670
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser
        675                 680                 685
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys
    690                 695                 700
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala
705                 710                 715                 720
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp
                725                 730                 735
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
            740                 745                 750
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe
        755                 760                 765
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe
    770                 775                 780
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala
785                 790                 795                 800
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser
                805                 810                 815
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
            820                 825                 830
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met
        835                 840                 845
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro
    850                 855                 860
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His
865                 870                 875                 880
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
                885                 890                 895
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu
            900                 905                 910
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile
        915                 920                 925
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser
    930                 935                 940
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys
945                 950                 955                 960
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro
                965                 970                 975
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly
            980                 985                 990
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala
        995                 1000                1005
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro
    1010                1015                1020
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr
1025                1030                1035                1040
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala
                1045                1050                1055
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly
            1060                1065                1070
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro
        1075                1080                1085
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg
    1090                1095                1100
Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val
1105                1110                1115                1120
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro
                1125                1130                1135
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp
            1140                1145                1150
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly
        1155                1160                1165
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro
    1170                1175                1180
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp
1185                1190                1195                1200
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile
                1205                1210                1215
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp
            1220                1225                1230
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu
        1235                1240                1245
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala
    1250                1255                1260
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp
1265                1270                1275                1280
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala
                1285                1290                1295
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu
            1300                1305                1310
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly
        1315                1320                1325
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro
    1330                1335                1340
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr
1345                1350                1355                1360
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser
                1365                1370                1375
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val
            1380                1385                1390
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys
        1395                1400                1405
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu
    1410                1415                1420
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly
1425                1430                1435                1440
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp
                1445                1450                1455
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val
            1460                1465                1470
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro
        1475                1480                1485
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn
    1490                1495                1500
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu
1505                1510                1515                1520
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn
                1525                1530                1535
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg
            1540                1545                1550
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala
       1555                1560                1565
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser
    1570                1575                1580
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn
1585                1590                1595                1600
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg
                1605                1610                1615
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser
            1620                1625                1630
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys
        1635                1640                1645
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys
    1650                1655                1660
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr
1665                1670                1675                1680
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala
                1685                1690                1695
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Ala Ala
            1700                1705                1710
Gly Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala
        1715                1720                1725
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro
    1730                1735                1740
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys
1745                1750                1755                1760
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr
                1765                1770                1775
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu
            1780                1785                1790
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met
        1795                1800                1805
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe
    1810                1815                1820
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln
1825                1830                1835                1840
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile
                1845                1850                1855
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser
            1860                1865                1870
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val
        1875                1880                1885
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg
    1890                1895                1900
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe
1905                1910                1915                1920
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala
                1925                1930                1935
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly
            1940                1945                1950
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu
        1955                1960                1965
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn
    1970                1975                1980
Arg
1985
<210>2
<211>5965
<212>DNA
<213>人工序列
<220>
<223>编码SEQ.ID.N0.1的未优化的cDNA序列
<400>2
gccaccatgg cgcccatcac ggcctactcc caacagacgc ggggcctact tggttgcatc      60
atcactagcc ttacaggccg ggacaagaac caggtcgagg gagaggttca ggtggtttcc     120
accgcaacac aatccttcct ggcgacctgc gtcaacggcg tgtgttggac cgtttaccat     180
ggtgctggct caaagacctt agccggccca aaggggccaa tcacccagat gtacactaat     240
gtggaccagg acctcgtcgg ctggcaggcg ccccccgggg cgcgttcctt gacaccatgc     300
acctgtggca gctcagacct ttacttggtc acgagacatg ctgacgtcat tccggtgcgc     360
cggcggggcg acagtagggg gagcctgctc tcccccaggc ctgtctccta cttgaagggc     420
tcttcgggtg gtccactgct ctgcccttcg gggcacgctg tgggcatctt ccgggctgcc     480
gtatgcaccc ggggggttgc gaaggcggtg gactttgtgc ccgtagagtc catggaaact     540
actatgcggt ctccggtctt cacggacaac tcatcccccc cggccgtacc gcagtcattt     600
caagtggccc acctacacgc tcccactggc agcggcaaga gtactaaagt gccggctgca     660
tatgcagccc aagggtacaa ggtgctcgtc ctcaatccgt ccgttgccgc taccttaggg     720
tttggggcgt atatgtctaa ggcacacggt attgacccca acatcagaac tggggtaagg     780
accattacca caggcgcccc cgtcacatac tctacctatg gcaagtttct tgccgatggt     840
ggttgctctg ggggcgctta tgacatcata atatgtgatg agtgccattc aactgactcg     900
actacaatct tgggcatcgg cacagtcctg gaccaagcgg agacggctgg agcgcggctt     960
gtcgtgctcg ccaccgctac gcctccggga tcggtcaccg tgccacaccc aaacatcgag    1020
gaggtggccc tgtctaatac tggagagatc cccttctatg gcaaagccat ccccattgaa    1080
gccatcaggg ggggaaggca tctcattttc tgtcattcca agaagaagtg cgacgagctc    1140
gccgcaaagc tgtcaggcct cggaatcaac gctgtggcgt attaccgggg gctcgatgtg    1200
tccgtcatac caactatcgg agacgtcgtt gtcgtggcaa cagacgctct gatgacgggc    1260
tatacgggcg actttgactc agtgatcgac tgtaacacat gtgtcaccca gacagtcgac    1320
ttcagcttgg atcccacctt caccattgag acgacgaccg tgcctcaaga cgcagtgtcg    1380
cgctcgcagc ggcggggtag gactggcagg ggtaggagag gcatctacag gtttgtgact    1440
ccgggagaac ggccctcggg catgttcgat tcctcggtcc tgtgtgagtg ctatgacgcg    1500
ggctgtgctt ggtacgagct cacccccgcc gagacctcgg ttaggttgcg ggcctacctg    1560
aacacaccag ggttgcccgt ttgccaggac cacctggagt tctgggagag tgtcttcaca    1620
ggcctcaccc acatagatgc acacttcttg tcccagacca agcaggcagg agacaacttc    1680
ccctacctgg tagcatacca agccacggtg tgcgccaggg ctcaggcccc acctccatca    1740
tgggatcaaa tgtggaagtg tctcatacgg ctgaaaccta cgctgcacgg gccaacaccc    1800
ttgctgtaca ggctgggagc cgtccaaaat gaggtcaccc tcacccaccc cataaccaaa    1860
tacatcatgg catgcatgtc ggctgacctg gaggtcgtca ctagcacctg ggtgctggtg    1920
ggcggagtcc ttgcagctct ggccgcgtat tgcctgacaa caggcagtgt ggtcattgtg    1980
ggtaggatta tcttgtccgg gaggccggct attgttcccg acagggagtt tctctaccag    2040
gagttcgatg aaatggaaga gtgcgcctcg cacctccctt acatcgagca gggaatgcag    2100
ctcgccgagc aattcaagca gaaagcgctc gggttactgc aaacagccac caaacaagcg    2160
gaggctgctg ctcccgtggt ggagtccaag tggcgagccc ttgagacatt ctgggcgaag    2220
cacatgtgga atttcatcag cgggatacag tacttagcag gcttatccac tctgcctggg    2280
aaccccgcaa tagcatcatt gatggcattc acagcctcta tcaccagccc gctcaccacc    2340
caaagtaccc tcctgtttaa catcttgggg gggtgggtgg ctgcccaact cgcccccccc    2400
agcgccgctt cggctttcgt gggcgccggc atcgccggtg cggctgttgg cagcataggc    2460
cttgggaagg tgcttgtgga cattctggcg ggttatggag caggagtggc cggcgcgctc    2520
gtggccttca aggtcatgag cggcgagatg ccctccaccg aggacctggt caatctactt    2580
cctgccatcc tctctcctgg cgccctggtc gtcggggtcg tgtgtgcagc aatactgcgt    2640
cgacacgtgg gtccgggaga gggggctgtg cagtggatga accggctgat agcgttcgcc    2700
tcgcggggta atcatgtttc ccccacgcac tatgtgcctg agagcgacgc cgcagcgcgt    2760
gttactcaga tcctctccag ccttaccatc actcagctgc tgaaaaggct ccaccagtgg    2820
attaatgaag actgctccac accgtgttcc ggctcgtggc taagggatgt ttgggactgg    2880
atatgcacgg tgttgactga cttcaagacc tggctccagt ccaagctcct gccgcagcta    2940
ccgggagtcc cttttttctc gtgccaacgc gggtacaagg gagtctggcg gggagacggc    3000
atcatgcaaa ccacctgccc atgtggagca cagatcaccg gacatgtcaa aaacggttcc    3060
atgaggatcg tcgggcctaa gacctgcagc aacacgtggc atggaacatt ccccatcaac    3120
gcatacacca cgggcccctg cacaccctct ccagcgccaa actattctag ggcgctgtgg    3180
cgggtggccg ctgaggagta cgtggaggtc acgcgggtgg gggatttcca ctacgtgacg    3240
ggcatgacca ctgacaacgt aaagtgccca tgccaggttc cggctcctga attcttcacg    3300
gaggtggacg gagtgcggtt gcacaggtac gctccggcgt gcaggcctct cctacgggag    3360
gaggttacat tccaggtcgg gctcaaccaa tacctggttg ggtcacagct accatgcgag    3420
cccgaaccgg atgtagcagt gctcacttcc atgctcaccg acccctccca catcacagca    3480
gaaacggcta agcgtaggtt ggccaggggg tctcccccct ccttggccag ctcttcagct    3540
agccagttgt ctgcgccttc cttgaaggcg acatgcacta cccaccatgt ctctccggac    3600
gctgacctca tcgaggccaa cctcctgtgg cggcaggaga tgggcgggaa catcacccgc    3660
gtggagtcgg agaacaaggt ggtagtcctg gactctttcg acccgcttcg agcggaggag    3720
gatgagaggg aagtatccgt tccggcggag atcctgcgga aatccaagaa gttccccgca    3780
gcgatgccca tctgggcgcg cccggattac aaccctccac tgttagagtc ctggaaggac    3840
ccggactacg tccctccggt ggtgcacggg tgcccgttgc cacctatcaa ggcccctcca    3900
ataccacctc cacggagaaa gaggacggtt gtcctaacag agtcctccgt gtcttctgcc    3960
ttagcggagc tcgctactaa gaccttcggc agctccgaat catcggccgt cgacagcggc    4020
acggcgaccg cccttcctga ccaggcctcc gacgacggtg acaaaggatc cgacgttgag    4080
tcgtactcct ccatgccccc ccttgagggg gaaccggggg accccgatct cagtgacggg    4140
tcttggtcta ccgtgagcga ggaagctagt gaggatgtcg tctgctgctc aatgtcctac    4200
acatggacag gcgccttgat cacgccatgc gctgcggagg aaagcaagct gcccatcaac    4260
gcgttgagca actctttgct gcgccaccat aacatggttt atgccacaac atctcgcagc    4320
gcaggcctgc ggcagaagaa ggtcaccttt gacagactgc aagtcctgga cgaccactac    4380
cgggacgtgc tcaaggagat gaaggcgaag gcgtccacag ttaaggctaa actcctatcc    4440
gtagaggaag cctgcaagct gacgccccca cattcggcca aatccaagtt tggctatggg    4500
gcaaaggacg tccggaacct atccagcaag gccgttaacc acatccactc cgtgtggaag    4560
gacttgctgg aagacactgt gacaccaatt gacaccacca tcatggcaaa aaatgaggtt    4620
ttctgtgtcc aaccagagaa aggaggccgt aagccagccc gccttatcgt attcccagat    4680
ctgggagtcc gtgtatgcga gaagatggcc ctctatgatg tggtctccac ccttcctcag    4740
gtcgtgatgg gctcctcata cggattccag tactctcctg ggcagcgagt cgagttcctg    4800
gtgaatacct ggaaatcaaa gaaaaacccc atgggctttt catatgacac tcgctgtttc    4860
gactcaacgg tcaccgagaa cgacatccgt gttgaggagt caatttacca atgttgtgac    4920
ttggcccccg aagccagaca ggccataaaa tcgctcacag agcggcttta tatcgggggt    4980
cctctgacta attcaaaagg gcagaactgc ggttatcgcc ggtgccgcgc gagcggcgtg    5040
ctgacgacta gctgcggtaa caccctcaca tgttacttga aggcctctgc agcctgtcga    5100
gctgcgaagc tccaggactg cacgatgctc gtgaacgccg ccggccttgt cgttatctgt    5160
gaaagcgcgg gaacccaaga ggacgcggcg agcctacgag tcttcacgga ggctatgact    5220
aggtactctg ccccccccgg ggacccgccc caaccagaat acgacttgga gctgataaca    5280
tcatgttcct ccaatgtgtc ggtcgcccac gatgcatcag gcaaaagggt gtactacctc    5340
acccgtgatc ccaccacccc cctcgcacgg gctgcgtggg aaacagctag acacactcca    5400
gttaactcct ggctaggcaa cattatcatg tatgcgccca ctttgtgggc aaggatgatt    5460
ctgatgactc acttcttctc catccttcta gcacaggagc aacttgaaaa agccctggac    5520
tgccagatct acggggcctg ttactccatt gagccacttg acctacctca gatcattgaa    5580
cgactccatg gccttagcgc attttcactc catagttact ctccaggtga gatcaatagg    5640
gtggcttcat gcctcaggaa acttggggta ccacccttgc gagtctggag acatcgggcc    5700
aggagcgtcc gcgctaggct actgtcccag ggggggaggg ccgccacttg tggcaagtac    5760
ctcttcaact gggcagtgaa gaccaaactc aaactcactc caatcccggc tgcgtcccag    5820
ctggacttgt ccggctggtt cgttgctggt tacagcgggg gagacatata tcacagcctg    5880
tctcgtgccc gaccccgctg gttcatgctg tgcctactcc tactttctgt aggggtaggc    5940
atctacctgc tccccaaccg ataaa                                          5965
<210>3
<211>5965
<212>DNA
<213>人工序列
<220>
<223>编码SEQ ID N0:1的优化的cDNA
<400>3
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc      60
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc     120
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac     180
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac     240
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc     300
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc     360
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc     420
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc     480
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc     540
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc     600
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc     660
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc     720
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc     780
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc     840
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc     900
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg     960
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag    1020
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag    1080
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg    1140
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg    1200
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc    1260
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc    1380
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc    1440
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc    1500
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg    1560
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc    1620
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc    1680
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc    1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc    1800
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg    1920
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg    1980
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag    2040
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag    2100
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc    2160
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag    2220
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc    2280
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc    2340
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc    2400
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc    2460
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg    2520
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg    2580
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc    2640
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc    2700
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc    2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg    2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg    2940
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc    3000
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc    3060
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg    3180
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc    3240
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc    3300
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag    3360
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc    3480
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc    3540
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgcc    3780
gccatgccca tctgggcccg ccccgactac aacccccccc tgctggagag ctggaaggac    3840
cccgactacg tgccccccgt ggtgcacggc tgccccctgc cccccatcaa ggcccccccc    3900
atcccccccc cccgccgcaa gcgcaccgtg gtgctgaccg agagcagcgt gagcagcgcc    3960
ctggccgagc tggccaccaa gaccttcggc agcagcgaga gcagcgccgt ggacagcggc    4020
accgccaccg ccctgcccga ccaggccagc gacgacggcg acaagggcag cgacgtggag    4080
agctacagca gcatgccccc cctggagggc gagcccggcg accccgacct gagcgacggc    4140
agctggagca ccgtgagcga ggaggccagc gaggacgtgg tgtgctgcag catgagctac    4200
acctggaccg gcgccctgat caccccctgc gccgccgagg agagcaagct gcccatcaac    4260
gccctgagca acagcctgct gcgccaccac aacatggtgt acgccaccac cagccgcagc    4320
gccggcctgc gccagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380
cgcgacgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac    4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag    4740
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg    4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc    4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac    4920
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc    4980
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg    5040
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc    5100
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc    5160
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc    5220
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc    5280
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg    5340
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc    5400
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc    5460
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac    5520
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag    5580
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc    5640
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc    5700
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac    5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag    5820
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg    5880
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc    5940
atctacctgc tgcccaaccg ctaaa                                          5965
<210>4
<211>37090
<212>DNA
<213>人工序列
<220>
<223>MRKAd6-NSmut核酸
<400>4
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt     60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt    120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg    180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag    240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga    300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg    360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc    420
cgggtcaaag ttggcgtttt attattatag gcggccgcga tccattgcat acgttgtatc    480
catatcataa tatgtacatt tatattggct catgtccaac attaccgcca tgttgacatt    540
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata    600
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc    660
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc    720
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt    780
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt     840
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca     900
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg     960
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc    1020
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg    1080
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg    1140
cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc    1200
tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt gagatctgcc    1260
accatggcgc ccatcacggc ctactcccaa cagacgcggg gcctacttgg ttgcatcatc    1320
actagcctta caggccggga caagaaccag gtcgagggag aggttcaggt ggtttccacc    1380
gcaacacaat ccttcctggc gacctgcgtc aacggcgtgt gttggaccgt ttaccatggt    1440
gctggctcaa agaccttagc cggcccaaag gggccaatca cccagatgta cactaatgtg    1500
gaccaggacc tcgtcggctg gcaggcgccc cccggggcgc gttccttgac accatgcacc    1560
tgtggcagct cagaccttta cttggtcacg agacatgctg acgtcattcc ggtgcgccgg    1620
cggggcgaca gtagggggag cctgctctcc cccaggcctg tctcctactt gaagggctct    1680
tcgggtggtc cactgctctg cccttcgggg cacgctgtgg gcatcttccg ggctgccgta    1740
tgcacccggg gggttgcgaa ggcggtggac tttgtgcccg tagagtccat ggaaactact    1800
atgcggtctc cggtcttcac ggacaactca tcccccccgg ccgtaccgca gtcatttcaa    1860
gtggcccacc tacacgctcc cactggcagc ggcaagagta ctaaagtgcc ggctgcatat    1920
gcagcccaag ggtacaaggt gctcgtcctc aatccgtccg ttgccgctac cttagggttt    1980
ggggcgtata tgtctaaggc acacggtatt gaccccaaca tcagaactgg ggtaaggacc    2040
attaccacag gcgcccccgt cacatactct acctatggca agtttcttgc cgatggtggt    2100
tgctctgggg gcgcttatga catcataata tgtgatgagt gccattcaac tgactcgact    2160
acaatcttgg gcatcggcac agtcctggac caagcggaga cggctggagc gcggcttgtc    2220
gtgctcgcca ccgctacgcc tccgggatcg gtcaccgtgc cacacccaaa catcgaggag    2280
gtggccctgt ctaatactgg agagatcccc ttctatggca aagccatccc cattgaagcc    2340
atcagggggg gaaggcatct cattttctgt cattccaaga agaagtgcga cgagctcgcc    2400
gcaaagctgt caggcctcgg aatcaacgct gtggcgtatt accgggggct cgatgtgtcc    2460
gtcataccaa ctatcggaga cgtcgttgtc gtggcaacag acgctctgat gacgggctat    2520
acgggcgact ttgactcagt gatcgactgt aacacatgtg tcacccagac agtcgacttc    2580
agcttggatc ccaccttcac cattgagacg acgaccgtgc ctcaagacgc agtgtcgcgc    2640
tcgcagcggc ggggtaggac tggcaggggt aggagaggca tctacaggtt tgtgactccg    2700
ggagaacggc cctcgggcat gttcgattcc tcggtcctgt gtgagtgcta tgacgcgggc    2760
tgtgcttggt acgagctcac ccccgccgag acctcggtta ggttgcgggc ctacctgaac    2820
acaccagggt tgcccgtttg ccaggaccac ctggagttct gggagagtgt cttcacaggc    2880
ctcacccaca tagatgcaca cttcttgtcc cagaccaagc aggcaggaga caacttcccc    2940
tacctggtag cataccaagc cacggtgtgc gccagggctc aggccccacc tccatcatgg    3000
gatcaaatgt ggaagtgtct catacggctg aaacctacgc tgcacgggcc aacacccttg    3060
ctgtacaggc tgggagccgt ccaaaatgag gtcaccctca cccaccccat aaccaaatac    3120
atcatggcat gcatgtcggc tgacctggag gtcgtcacta gcacctgggt gctggtgggc    3180
ggagtccttg cagctctggc cgcgtattgc ctgacaacag gcagtgtggt cattgtgggt    3240
aggattatct tgtccgggag gccggctatt gttcccgaca gggagtttct ctaccaggag    3300
ttcgatgaaa tggaagagtg cgcctcgcac ctcccttaca tcgagcaggg aatgcagctc    3360
gccgagcaat tcaagcagaa agcgctcggg ttactgcaaa cagccaccaa acaagcggag    3420
gctgctgctc ccgtggtgga gtccaagtgg cgagcccttg agacattctg ggcgaagcac    3480
atgtggaatt tcatcagcgg gatacagtac ttagcaggct tatccactct gcctgggaac    3540
cccgcaatag catcattgat ggcattcaca gcctctatca ccagcccgct caccacccaa    3600
agtaccctcc tgtttaacat cttggggggg tgggtggctg cccaactcgc cccccccagc    3660
gccgcttcgg ctttcgtggg cgccggcatc gccggtgcgg ctgttggcag cataggcctt    3720
gggaaggtgc ttgtggacat tctggcgggt tatggagcag gagtggccgg cgcgctcgtg    3780
gccttcaagg tcatgagcgg cgagatgccc tccaccgagg acctggtcaa tctacttcct    3840
gccatcctct ctcctggcgc cctggtcgtc ggggtcgtgt gtgcagcaat actgcgtcga    3900
cacgtgggtc cgggagaggg ggctgtgcag tggatgaacc ggctgatagc gttcgcctcg    3960
cggggtaatc atgtttcccc cacgcactat gtgcctgaga gcgacgccgc agcgcgtgtt    4020
actcagatcc tctccagcct taccatcact cagctgctga aaaggctcca ccagtggatt    4080
aatgaagact gctccacacc gtgttccggc tcgtggctaa gggatgtttg ggactggata    4140
tgcacggtgt tgactgactt caagacctgg ctccagtcca agctcctgcc gcagctaccg    4200
ggagtccctt ttttctcgtg ccaacgcggg tacaagggag tctggcgggg agacggcatc    4260
atgcaaacca cctgcccatg tggagcacag atcaccggac atgtcaaaaa cggttccatg    4320
aggatcgtcg ggcctaagac ctgcagcaac acgtggcatg gaacattccc catcaacgca    4380
tacaccacgg gcccctgcac accctctcca gcgccaaact attctagggc gctgtggcgg    4440
gtggccgctg aggagtacgt ggaggtcacg cgggtggggg atttccacta cgtgacgggc    4500
atgaccactg acaacgtaaa gtgcccatgc caggttccgg ctcctgaatt cttcacggag    4560
gtggacggag tgcggttgca caggtacgct ccggcgtgca ggcctctcct acgggaggag    4620
gttacattcc aggtcgggct caaccaatac ctggttgggt cacagctacc atgcgagccc    4680
gaaccggatg tagcagtgct cacttccatg ctcaccgacc cctcccacat cacagcagaa    4740
acggctaagc gtaggttggc cagggggtct cccccctcct tggccagctc ttcagctagc    4800
cagttgtctg cgccttcctt gaaggcgaca tgcactaccc accatgtctc tccggacgct    4860
gacctcatcg aggccaacct cctgtggcgg caggagatgg gcgggaacat cacccgcgtg    4920
gagtcggaga acaaggtggt agtcctggac tctttcgacc cgcttcgagc ggaggaggat    4980
gagagggaag tatccgttcc ggcggagatc ctgcggaaat ccaagaagtt ccccgcagcg    5040
atgcccatct gggcgcgccc ggattacaac cctccactgt tagagtcctg gaaggacccg    5100
gactacgtcc ctccggtggt gcacgggtgc ccgttgccac ctatcaaggc ccctccaata    5160
ccacctccac ggagaaagag gacggttgtc ctaacagagt cctccgtgtc ttctgcctta    5220
gcggagctcg ctactaagac cttcggcagc tccgaatcat cggccgtcga cagcggcacg    5280
gcgaccgccc ttcctgacca ggcctccgac gacggtgaca aaggatccga cgttgagtcg    5340
tactcctcca tgccccccct tgagggggaa ccgggggacc ccgatctcag tgacgggtct    5400
tggtctaccg tgagcgagga agctagtgag gatgtcgtct gctgctcaat gtcctacaca    5460
tggacaggcg ccttgatcac gccatgcgct gcggaggaaa gcaagctgcc catcaacgcg    5520
ttgagcaact ctttgctgcg ccaccataac atggtttatg ccacaacatc tcgcagcgca    5580
ggcctgcggc agaagaaggt cacctttgac agactgcaag tcctggacga ccactaccgg    5640
gacgtgctca aggagatgaa ggcgaaggcg tccacagtta aggctaaact cctatccgta    5700
gaggaagcct gcaagctgac gcccccacat tcggccaaat ccaagtttgg ctatggggca    5760
aaggacgtcc ggaacctatc cagcaaggcc gttaaccaca tccactccgt gtggaaggac    5820
ttgctggaag acactgtgac accaattgac accaccatca tggcaaaaaa tgaggttttc    5880
tgtgtccaac cagagaaagg aggccgtaag ccagcccgcc ttatcgtatt cccagatctg    5940
ggagtccgtg tatgcgagaa gatggccctc tatgatgtgg tctccaccct tcctcaggtc    6000
gtgatgggct cctcatacgg attccagtac tctcctgggc agcgagtcga gttcctggtg    6060
aatacctgga aatcaaagaa aaaccccatg ggcttttcat atgacactcg ctgtttcgac    6120
tcaacggtca ccgagaacga catccgtgtt gaggagtcaa tttaccaatg ttgtgacttg    6180
gcccccgaag ccagacaggc cataaaatcg ctcacagagc ggctttatat cgggggtcct    6240
ctgactaatt caaaagggca gaactgcggt tatcgccggt gccgcgcgag cggcgtgctg    6300
acgactagct gcggtaacac cctcacatgt tacttgaagg cctctgcagc ctgtcgagct    6360
gcgaagctcc aggactgcac gatgctcgtg aacgccgccg gccttgtcgt tatctgtgaa    6420
agcgcgggaa cccaagagga cgcggcgagc ctacgagtct tcacggaggc tatgactagg    6480
tactctgccc cccccgggga cccgccccaa ccagaatacg acttggagct gataacatca    6540
tgttcctcca atgtgtcggt cgcccacgat gcatcaggca aaagggtgta ctacctcacc    6600
cgtgatccca ccacccccct cgcacgggct gcgtgggaaa cagctagaca cactccagtt    6660
aactcctggc taggcaacat tatcatgtat gcgcccactt tgtgggcaag gatgattctg    6720
atgactcact tcttctccat ccttctagca caggagcaac ttgaaaaagc cctggactgc    6780
cagatctacg gggcctgtta ctccattgag ccacttgacc tacctcagat cattgaacga    6840
ctccatggcc ttagcgcatt ttcactccat agttactctc caggtgagat caatagggtg    6900
gcttcatgcc tcaggaaact tggggtacca cccttgcgag tctggagaca tcgggccagg    6960
agcgtccgcg ctaggctact gtcccagggg gggagggccg ccacttgtgg caagtacctc    7020
ttcaactggg cagtgaagac caaactcaaa ctcactccaa tcccggctgc gtcccagctg    7080
gacttgtccg gctggttcgt tgctggttac agcgggggag acatatatca cagcctgtct    7140
cgtgcccgac cccgctggtt catgctgtgc ctactcctac tttctgtagg ggtaggcatc    7200
tacctgctcc ccaaccggta aatctagagc tgtgccttct agttgccagc catctgttgt    7260
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta    7320
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg    7380
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc    7440
ggtgggctct atggccgatc ggcgcgccgt actgaaatgt gtgggcgtgg cttaagggtg    7500
ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc agcagccgcc    7560
gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt gacaacgcgc    7620
atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga tggtcgcccc    7680
gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac gccgttggag    7740
actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat tgtgactgac    7800
tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc ccgcgatgac    7860
aagttgacgg ctcttttggc acaattggat tctttgaccc gggaacttaa tgtcgtttct    7920
cagcagctgt tggatctgcg ccagcaggtt tctgccctga aggcttcctc ccctcccaat    7980
gcggtttaaa acataaataa aaaaccagac tctgtttgga tttggatcaa gcaagtgtct    8040
tgctgtcttt atttaggggt tttgcgcgcg cggtaggccc gggaccagcg gtctcggtcg    8100
ttgagggtcc tgtgtatttt ttccaggacg tggtaaaggt gactctggat gttcagatac    8160
atgggcataa gcccgtctct ggggtggagg tagcaccact gcagagcttc atgctgcggg    8220
gtggtgttgt agatgatcca gtcgtagcag gagcgctggg cgtggtgcct aaaaatgtct    8280
ttcagtagca agctgattgc caggggcagg cccttggtgt aagtgtttac aaagcggtta    8340
agctgggatg ggtgcatacg tggggatatg agatgcatct tggactgtat ttttaggttg    8400
gctatgttcc cagccatatc cctccgggga ttcatgttgt gcagaaccac cagcacagtg    8460
tatccggtgc acttgggaaa tttgtcatgt agcttagaag gaaatgcgtg gaagaacttg    8520
gagacgccct tgtgacctcc aagattttcc atgcattcgt ccataatgat ggcaatgggc    8580
ccacgggcgg cggcctgggc gaagatattt ctgggatcac taacgtcata gttgtgttcc    8640
aggatgagat cgtcataggc catttttaca aagcgcgggc ggagggtgcc agactgcggt    8700
ataatggttc catccggccc aggggcgtag ttaccctcac agatttgcat ttcccacgct    8760
ttgagttcag atggggggat catgtctacc tgcggggcga tgaagaaaac ggtttccggg    8820
gtaggggaga tcagctggga agaaagcagg ttcctgagca gctgcgactt accgcagccg    8880
gtgggcccgt aaatcacacc tattaccggc tgcaactggt agttaagaga gctgcagctg    8940
ccgtcatccc tgagcagggg ggccacttcg ttaagcatgt ccctgactcg catgttttcc    9000
ctgaccaaat ccgccagaag gcgctcgccg cccagcgata gcagttcttg caaggaagca    9060
aagtttttca acggtttgag accgtccgcc gtaggcatgc ttttgagcgt ttgaccaagc    9120
agttccaggc ggtcccacag ctcggtcacc tgctctacgg catctcgatc cagcatatct    9180
cctcgtttcg cgggttgggg cggctttcgc tgtacggcag tagtcggtgc tcgtccagac    9240
gggccagggt catgtctttc cacgggcgca gggtcctcgt cagcgtagtc tgggtcacgg    9300
tgaaggggtg cgctccgggc tgcgcgctgg ccagggtgcg cttgaggctg gtcctgctgg    9360
tgctgaagcg ctgccggtct tcgccctgcg cgtcggccag gtagcatttg accatggtgt    9420
catagtccag cccctccgcg gcgtggccct tggcgcgcag cttgcccttg gaggaggcgc     9480
cgcacgaggg gcagtgcaga cttttgaggg cgtagagctt gggcgcgaga aataccgatt     9540
ccggggagta ggcatccgcg ccgcaggccc cgcagacggt ctcgcattcc acgagccagg     9600
tgagctctgg ccgttcgggg tcaaaaacca ggtttccccc atgctttttg atgcgtttct     9660
tacctctggt ttccatgagc cggtgtccac gctcggtgac gaaaaggctg tccgtgtccc     9720
cgtatacaga cttgagaggc ctgtcctcga gcggtgttcc gcggtcctcc tcgtatagaa     9780
actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag gctaagtggg     9840
aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga agacacatgt     9900
cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg tgaccgggtg     9960
ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc tcttccgcat    10020
cgctgtctgc gagggccagc tgttggggtg agtactccct ctcaaaagcg ggcatgactt    10080
ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg    10140
tgatgccttt gagggtggcc gcgtccatct ggtcagaaaa gacaatcttt ttgttgtcaa    10200
gcttggtggc aaacgacccg tagagggcgt tggacagcaa cttggcgatg gagcgcaggg    10260
tttggttttt gtcgcgatcg gcgcgctcct tggccgcgat gtttagctgc acgtattcgc    10320
gcgcaacgca ccgccattcg ggaaagacgg tggtgcgctc gtcgggcact aggtgcacgc    10380
gccaaccgcg gttgtgcagg gtgacaaggt caacgctggt ggctacctct ccgcgtaggc    10440
gctcgttggt ccagcagagg cggccgccct tgcgcgagca gaatggcggt agtgggtcta    10500
gctgcgtctc gtccgggggg tctgcgtcca cggtaaagac cccgggcagc aggcgcgcgt    10560
cgaagtagtc tatcttgcat ccttgcaagt ctagcgcctg ctgccatgcg cgggcggcaa    10620
gcgcgcgctc gtatgggttg agtgggggac cccatggcat ggggtgggtg agcgcggagg    10680
cgtacatgcc gcaaatgtcg taaacgtaga ggggctctct gagtattcca agatatgtag    10740
ggtagcatct tccaccgcgg atgctggcgc gcacgtaatc gtatagttcg tgcgagggag    10800
cgaggaggtc gggaccgagg ttgctacggg cgggctgctc tgctcggaag actatctgcc    10860
tgaagatggc atgtgagttg gatgatatgg ttggacgctg gaagacgttg aagctggcgt    10920
ctgtgagacc taccgcgtca cgcacgaagg aggcgtagga gtcgcgcagc ttgttgacca    10980
gctcggcggt gacctgcacg tctagggcgc agtagtccag ggtttccttg atgatgtcat    11040
acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt    11100
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtaagagcct agcatgtaga    11160
actggttgac ggcctggtag gcgcagcatc ccttttctac gggtagcgcg tatgcctgcg    11220
cggccttccg gagcgaggtg tgggtgagcg caaaggtgtc cctaaccatg actttgaggt    11280
actggtattt gaagtcagtg tcgtcgcatc cgccctgctc ccagagcaaa aagtccgtgc    11340
gctttttgga acgcgggttt ggcagggcga aggtgacatc gttgaagagt atctttcccg    11400
cgcgaggcat aaagttgcgt gtgatgcgga agggtcccgg cacctcggaa cggttgttaa    11460
ttacctgggc ggcgagcacg atctcgtcaa agccgttgat gttgtggccc acaatgtaaa    11520
gttccaagaa gcgcgggatg cccttgatgg aaggcaattt tttaagttcc tcgtaggtga    11580
gctcttcagg ggagctgagc ccgtgctctg aaagggccca gtctgcaaga tgagggttgg    11640
aagcgacgaa tgagctccac aggtcacggg ccattagcat ttgcaggtgg tcgcgaaagg    11700
tcctaaactg gcgacctatg gccatttttt ctggggtgat gcagtagaag gtaagcgggt    11760
cttgttccca gcggtcccat ccaaggtccg cggctaggtc tcgcgcggcg gtcactagag    11820
gctcatctcc gccgaacttc atgaccagca tgaagggcac gagctgcttc ccaaaggccc    11880
ccatccaagt ataggtctct acatcgtagg tgacaaagag acgctcggtg cgaggatgcg    11940
agccgatcgg gaagaactgg atctcccgcc accagttgga ggagtggctg ttgatgtggt    12000
gaaagtagaa gtccctgcga cgggccgaac actcgtgctg gcttttgtaa aaacgtgcgc    12060
agtactggca gcggtgcacg ggctgtacat cctgcacgag gttgacctga cgaccgcgca    12120
caaggaagca gagtgggaat ttgagcccct cgcctggcgg gtttggctgg tggtcttcta    12180
cttcggctgc ttgtccttga ccgtctggct gctcgagggg agttacggtg gatcggacca    12240
ccacgccgcg cgagcccaaa gtccagatgt ccgcgcgcgg cggtcggagc ttgatgacaa    12300
catcgcgcag atgggagctg tccatggtct ggagctcccg cggcgtcagg tcaggcggga    12360
gctcctgcag gtttacctcg catagccggg tcagggcgcg ggctaggtcc aggtgatacc    12420
tgatttccag gggctggttg gtggcggcgt cgatggcttg caagaggccg catccccgcg    12480
gcgcgactac ggtaccgcgc ggcgggcggt gggccgcggg ggtgtccttg gatgatgcat    12540
ctaaaagcgg tgacgcgggc gggcccccgg aggtaggggg ggctcgggac ccgccgggag    12600
agggggcagg ggcacgtcgg cgccgcgcgc gggcaggagc tggtgctgcg cgcggaggtt    12660
gctggcgaac gcgacgacgc ggcggttgat ctcctgaatc tggcgcctct gcgtgaagac    12720
gacgggcccg gtgagcttga acctgaaaga gagttcgaca gaatcaattt cggtgtcgtt    12780
gacggcggcc tggcgcaaaa tctcctgcac gtctcctgag ttgtcttgat aggcgatctc    12840
ggccatgaac tgctcgatct cttcctcctg gagatctccg cgtccggctc gctccacggt    12900
ggcggcgagg tcgttggaga tgcgggccat gagctgcgag aaggcgttga ggcctccctc    12960
gttccagacg cggctgtaga ccacgccccc ttcggcatcg cgggcgcgca tgaccacctg    13020
cgcgagattg agctccacgt gccgggcgaa gacggcgtag tttcgcaggc gctgaaagag    13080
gtagttgagg gtggtggcgg tgtgttctgc cacgaagaag tacataaccc agcgccgcaa    13140
cgtggattcg ttgatatccc ccaaggcctc aaggcgctcc atggcctcgt agaagtccac    13200
ggcgaagttg aaaaactggg agttgcgcgc cgacacggtt aactcctcct ccagaagacg    13260
gatgagctcg gcgacagtgt cgcgcacctc gcgctcaaag gctacagggg cctcttcttc    13320
ttcttcaatc tcctcttcca taagggcctc cccttcttct tcttctggcg gcggtggggg    13380
aggggggaca cggcggcgac gacggcgcac cgggaggcgg tcgacaaagc gctcgatcat    13440
ctccccgcgg cgacggcgca tggtctcggt gacggcgcgg ccgttctcgc gggggcgcag    13500
ttggaagacg ccgcccgtca tgtcccggtt atgggttggc ggggggctgc cgtgcggcag    13560
ggatacggcg ctaacgatgc atctcaacaa ttgttgtgta ggtactccgc caccgaggga    13620
cctgagcgag tccgcatcga ccggatcgga aaacctctcg agaaaggcgt ctaaccagtc    13680
acagtcgcaa ggtaggctga gcaccgtggc gggcggcagc gggcggcggt cggggttgtt    13740
tctggcggag gtgctgctga tgatgtaatt aaagtaggcg gtcttgagac ggcggatggt    13800
cgacagaagc accatgtcct tgggtccggc ctgctgaatg cgcaggcggt cggccatgcc    13860
ccaggcttcg ttttgacatc ggcgcaggtc tttgtagtag tcttgcatga gcctttctac    13920
cggcacttct tcttctcctt cctcttgtcc tgcatctctt gcatctatcg ctgcggcggc    13980
ggcggagttt ggccgtaggt ggcgccctct tcctcccatg cgtgtgaccc cgaagcccct    14040
catcggctga agcagggcca ggtcggcgac aacgcgctcg gctaatatgg cctgctgcac    14100
ctgcgtgagg gtagactgga agtcgtccat gtccacaaag cggtggtatg cgcccgtgtt    14160
gatggtgtaa gtgcagttgg ccataacgga ccagttaacg gtctggtgac ccggctgcga    14220
gagctcggtg tacctgagac gcgagtaagc ccttgagtca aagacgtagt cgttgcaagt    14280
ccgcaccagg tactggtatc ccaccaaaaa gtgcggcggc ggctggcggt agaggggcca    14340
gcgtagggtg gccggggctc cgggggcgag gtcttccaac ataaggcgat gatatccgta    14400
gatgtacctg gacatccagg tgatgccggc ggcggtggtg gaggcgcgcg gaaagtcacg    14460
gacgcggttc cagatgttgc gcagcggcaa aaagtgctcc atggtcggga cgctctggcc    14520
ggtcaggcgc gcgcagtcgt tgacgctcta gaccgtgcaa aaggagagcc tgtaagcggg    14580
cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg accggggttc    14640
gaaccccgga tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt gtcgaaccca    14700
ggtgtgcgac gtcagacaac gggggagcgc tccttttggc ttccttccag gcgcggcgga    14760
tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt aagcggttag gctggaaagc    14820
gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg gttgagtcgc    14880
gggacccccg gttcgagtct cgggccggcc ggactgcggc gaacgggggt ttgcctcccc    14940
gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc ttttttgctt    15000
ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc ggcaagagca    15060
agagcagcgg cagacatgca gggcaccctc cccttctcct accgcgtcag gaggggcaac    15120
atccgcggct gacgcggcgg cagatggtga ttacgaaccc ccgcggcgcc ggacccggca    15180
ctacttggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct ctcctgagcg    15240
acacccaagg gtgcagctga agcgtgacac gcgcgaggcg tacgtgccgc ggcagaacct    15300
gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt tccatgcagg    15360
gcgcgagttg cggcatggcc tgaaccgcga gcggttgctg cgcgaggagg actttgagcc    15420
cgacgcgcgg accgggatta gtcccgcgcg cgcacacgtg gcggccgccg acctggtaac    15480
cgcgtacgag cagacggtga accaggagat taactttcaa aaaagcttta acaaccacgt    15540
gcgcacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt gggactttgt    15600
aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt tccttatagt    15660
gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag tagagcccga    15720
gggccgctgg ctgctcgatt tgataaacat tctgcagagc atagtggtgc aggagcgcag    15780
cttgagcctg gctgacaagg tggccgccat taactattcc atgctcagtc tgggcaagtt    15840
ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg taaagatcga    15900
ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc tgggcgttta    15960
tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc tcagcgaccg    16020
cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg atagagaggc    16080
cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac gcgccctgga    16140
ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca acgtcggcgg    16200
cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt actaagcggt    16260
gatgtttctg atcagatgat gcaagacgca acggacccgg cggtgcgggc ggcgctgcag    16320
agccagccgt ccggccttaa ctccacggac gactggcgcc aggtcatgga ccgcatcatg    16380
tcgctgactg cgcgcaaccc tgacgcgttc cggcagcagc cgcaggccaa ccggctctcc    16440
gcaattctgg aagcggtggt cccggcgcgc gcaaacccca cgcacgagaa ggtgctggcg    16500
atcgtaaacg cgctggccga aaacagggcc atccggcccg atgaggccgg cctggtctac    16560
gacgcgctgc ttcagcgcgt ggctcgttac aacagcagca acgtgcagac caacctggac    16620
cggctggtgg gggatgtgcg cgaggccgtg gcgcagcgtg agcgcgcgca gcagcagggc    16680
aacctgggct ccatggttgc actaaacgcc ttcctgagta cacagcccgc caacgtgccg    16740
cggggacagg aggactacac caactttgtg agcgcactgc ggctaatggt gactgagaca    16800
ccgcaaagtg aggtgtatca gtccgggcca gactattttt tccagaccag tagacaaggc    16860
ctgcagaccg taaacctgag ccaggctttc aagaacttgc aggggctgtg gggggtgcgg    16920
gctcccacag gcgaccgcgc gaccgtgtct agcttgctga cgcccaactc gcgcctgttg    16980
ctgctgctaa tagcgccctt cacggacagt ggcagcgtgt cccgggacac atacctaggt    17040
cacttgctga cactgtaccg cgaggccata ggtcaggcgc atgtggacga gcatactttc    17100
caggagatta caagtgttag ccgcgcgctg gggcaggagg acacgggcag cctggaggca    17160
accctgaact acctgctgac caaccggcgg caaaaaatcc cctcgttgca cagtttaaac    17220
agcgaggagg agcgcatttt gcgctatgtg cagcagagcg tgagccttaa cctgatgcgc    17280
gacggggtaa cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga accgggcatg    17340
tatgcctcaa accggccgtt tatcaatcgc ctaatggact acttgcatcg cgcggccgcc    17400
gtgaaccccg agtatttcac caatgccatc ttgaacccgc actggctacc gccccctggt    17460
ttctacaccg ggggattcga ggtgcccgag ggtaacgatg gattcctctg ggacgacata    17520
gacgacagcg tgttttcccc gcaaccgcag accctgctag agttgcaaca acgcgagcag    17580
gcagaggcgg cgctgcgaaa ggaaagcttc cgcaggccaa gcagcttgtc cgatctaggc    17640
gctgcggccc cgcggtcaga tgctagtagc ccatttccaa gcttgatagg gtctcttacc    17700
agcactcgca ccacccgccc gcgcctgctg ggcgaggagg agtacctaaa caactcgctg    17760
ctgcagccgc agcgcgaaaa gaacctgcct ccggcgtttc ccaacaacgg gatagagagc    17820
ctagtggaca agatgagtag atggaagacg tatgcgcagg agcacaggga tgtgcccggc    17880
ccgcgcccgc ccacccgtcg tcaaaggcac gaccgtcagc ggggtctggt gtgggaggac    17940
gatgactcgg cagacgacag cagcgtcttg gatttgggag ggagtggcaa cccgtttgca    18000
caccttcgcc ccaggctggg gagaatgttt taaaaaaaag catgatgcaa aataaaaaac    18060
tcaccaaggc catggcaccg agcgttggtt ttcttgtatt ccccttagta tgcggcgcgc    18120
ggcgatgtat gaggaaggtc ctcctccctc ctacgagagc gtggtgagcg cggcgccagt    18180
ggcggcggcg ctgggttcac ccttcgatgc tcccctggac ccgccgttcg tgcctccgcg    18240
gtacctgcgg cctaccgggg ggagaaacag catccgttac tctgagttgg cacccctatt    18300
cgacaccacc cgtgtgtacc ttgtggacaa caagtcaacg gatgtggcat ccctgaacta    18360
ccagaacgac cacagcaact ttctaaccac ggtcattcaa aacaatgact acagcccggg    18420
ggaggcaagc acacagacca tcaatcttga cgaccggtcg cactggggcg gcgacctgaa    18480
aaccatcctg cataccaaca tgccaaatgt gaacgagttc atgtttacca ataagtttaa    18540
ggcgcgggtg atggtgtcgc gctcgcttac taaggacaaa caggtggagc tgaaatacga    18600
gtgggtggag ttcacgctgc ccgagggcaa ctactccgag accatgacca tagaccttat    18660
gaacaacgcg atcgtggagc actacttgaa agtgggcagg cagaacgggg ttctggaaag    18720
cgacatcggg gtaaagtttg acacccgcaa cttcagactg gggtttgacc cagtcactgg    18780
tcttgtcatg cctggggtat atacaaacga agccttccat ccagacatca ttttgctgcc    18840
aggatgcggg gtggacttca cccacagccg cctgagcaac ttgttgggca tccgcaagcg    18900
gcaacccttc caggagggct ttaggatcac ctacgatgac ctggagggtg gtaacattcc    18960
cgcactgttg gatgtggacg cctaccaggc aagcttgaaa gatgacaccg aacagggcgg    19020
gggtggcgca ggcggcggca acaacagtgg cagcggcgcg gaagagaact ccaacgcggc    19080
agctgcggca atgcagccgg tggaggacat gaacgatcat gccattcgcg gcgacacctt    19140
tgccacacgg gcggaggaga agcgcgctga ggccgaggca gcggccgaag ctgccgcccc    19200
cgctgcggag gctgcacaac ccgaggtcga gaagcctcag aagaaaccgg tgattaaacc    19260
cctgacagag gacagcaaga aacgcagtta caacctaata agcaatgaca gcaccttcac    19320
ccagtaccgc agctggtacc ttgcatacaa ctacggcgac cctcaggccg ggatccgctc    19380
atggaccctg ctttgcactc ctgacgtaac ctgcggctcg gagcaggtat actggtcgtt    19440
gcccgacatg atgcaagacc ccgtgacctt ccgctccacg cgccagatca gcaactttcc    19500
ggtggtgggc gccgagctgt tgcccgtgca ctccaagagc ttctacaacg accaggccgt    19560
ctactcccag ctcatccgcc agtttacctc tctgacccac gtgttcaatc gctttcccga    19620
gaaccagatt ttggcgcgcc cgccagcccc caccatcacc accgtcagtg aaaacgttcc    19680
tgctctcaca gatcacggga cgctaccgct gcgcaacagc atcggaggag tccagcgagt    19740
gaccattact gacgccagac gccgcacctg cccctacgtt tacaaggccc tgggcatagt    19800
ctcgccgcgc gtcctatcga gccgcacttt ttgagcaagc atgtccatcc ttatatcgcc    19860
cagcaataac acaggctggg gcctgcgctt cccaagcaag atgtttggcg gggccaagaa    19920
gcgctccgac caacacccag tgcgcgtgcg cgggcactac cgcgcgccct ggggcgcgca    19980
caaacgcggc cgcactgggc gcaccaccgt cgatgacgcc atcgacgcgg tggtggagga    20040
ggcgcgcaac tacacgccca cgccgccgcc agtgtccacc gtggacgcgg ccattcagac    20100
cgtggtgcgc ggagcccggc gctacgctaa aatgaagaga cggcggaggc gcgtagcacg    20160
tcgccaccgc cgccgacccg gcactgccgc ccaacgcgcg gcggcggccc tgcttaaccg    20220
cgcacgtcgc accggccgac gggcggccat gcgagccgct cgaaggctgg ccgcgggtat    20280
tgtcactgtg ccccccaggt ccaggcgacg agcggccgcc gcagcagccg cggccattag    20340
tgctatgact cagggtcgca ggggcaacgt gtactgggtg cgcgactcgg ttagcggcct    20400
gcgcgtgccc gtgcgcaccc gccccccgcg caactagatt gcaataaaaa actacttaga    20460
ctcgtactgt tgtatgtatc cagcggcggc ggcgcgcatc gaagctatgt ccaagcgcaa    20520
aatcaaagaa gagatgctcc aggtcatcgc gccggagatc tatggccccc cgaagaagga    20580
agagcaggat tacaagcccc gaaagctaaa gcgggtcaaa aagaaaaaga aagatgatga    20640
tgatgatgaa cttgacgacg aggtggaact gttgcacgcg accgcgccca ggcgacgggt    20700
acagtggaaa ggtcgacgcg taagacgtgt tttgcgaccc ggcaccaccg tagtctttac    20760
gcccggtgag cgctccaccc gcacctacaa gcgcgtgtat gatgaggtgt acggcgacga    20820
ggacctgctt gagcaggcca acgagcgcct cggggagttt gcctacggaa agcggcataa    20880
ggacatgctg gcgttgccgc tggacgaggg caacccaaca cctagcctaa agcccgtgac    20940
actgcagcag gtgctgcccg cgcttgcacc gtccgaagaa aagcgcggcc taaagcgcga    21000
gtctggtgac ttggcaccca ccgtgcagct gatggtaccc aagcgtcagc gactggaaga    21060
tgtcttggaa aaaatgaccg tggagcctgg gctggagccc gaggtccgcg tgcggccaat    21120
caagcaggtg gcaccgggac tgggcgtgca gaccgtggac gttcagatac ccaccaccag    21180
tagcactagt attgccactg ccacagaggg catggagaca caaacgtccc cggttgcctc    21240
ggcggtggca gatgccgcgg tgcaggcggc cgctgcggcc gcgtccaaga cctctacgga    21300
ggtgcaaacg gacccgtgga tgtttcgtgt ttcagccccc cggcgtccgc gccgttcaag    21360
gaagtacggc gccgccagcg cgctactgcc cgaatatgcc ctacatcctt ccatcgcgcc    21420
tacccccggc tatcgtggct acacctaccg ccccagaaga cgagcaacta cccgacgccg    21480
aaccaccact ggaacccgcc gccgccgtcg ccgtcgccag cccgtgctgg ccccgatttc    21540
cgtgcgcagg gtggctcgcg aaggaggcag gaccctggtg ctgccaacag cgcgctacca    21600
ccccagcatc gtttaaaagc cggtctttgt ggttcttgca gatatggccc tcacctgccg    21660
cctccgtttc ccggtgccgg gattccgagg aagaatgcac cgtaggaggg gcatggccgg    21720
ccacggcctg acgggcggca tgcgtcgtgc gcaccaccgg cggcggcgcg cgtcgcaccg    21780
tcgcatgcgc ggcggtatcc tgcccctcct tattccactg atcgccgcgg cgattggcgc    21840
cgtgcccgga attgcatccg tggccttgca ggcgcagaga cactgattaa aaacaagtta    21900
catgtggaaa aatcaaaata aaagtctgga ctctcacgct cgcttggtcc tgtaactatt    21960
ttgtagaatg gaagacatca actttgcgtc actggccccg cgacacggct cgcgcccgtt    22020
catgggaaac tggcaagata tcggcaccag caatatgagc ggtggcgcct tcagctgggg    22080
ctcgctgtgg agcggcatta aaaatttcgg ttccgccgtt aagaactatg gcagcaaagc    22140
ctggaacagc agcacaggcc agatgctgag ggacaagttg aaagagcaaa atttccaaca    22200
aaaggtggta gatggcctgg cctctggcat tagcggggtg gtggacctgg ccaaccaggc    22260
agtgcaaaat aagattaaca gtaagcttga tccccgccct cccgtagagg agcctccacc    22320
ggccgtggag acagtgtctc cagaggggcg tggcgaaaag cgtccgcgac ccgacaggga    22380
agaaactctg gtgacgcaaa tagacgagcc tccctcgtac gaggaggcac taaagcaagg    22440
cctgcccacc acccgtccca tcgcgcccat ggctaccgga gtgctgggcc agcacacacc    22500
cgtaacgctg gacctgcctc cccccgccga cacccagcag aaacctgtgc tgccaggccc    22560
gtccgccgtt gttgtaaccc gtcctagccg cgcgtccctg cgccgcgccg ccagcggtcc    22620
gcgatcgttg cggcccgtag ccagtggcaa ctggcaaagc acactgaaca gcatcgtggg    22680
tttgggggtg caatccctga agcgccgacg atgcttctga tagctaacgt gtcgtatgtg    22740
tgtcatgtat gcgtccatgt cgccgccaga ggagctgctg agccgccgcg cgcccgcttt    22800
ccaagatggc taccccttcg atgatgccgc agtggtctta catgcacatc tcgggccagg    22860
acgcctcgga gtacctgagc cccgggctgg tgcagttcgc ccgcgccacc gagacgtact    22920
tcagcctgaa taacaagttt agaaacccca cggtggcgcc tacgcacgac gtgaccacag    22980
accggtctca gcgtttgacg ctgcggttca tccccgtgga ccgcgaggat actgcgtact    23040
cgtacaaggc gcggttcacc ctagctgtgg gtgataaccg tgtgctagac atggcttcca    23100
cgtactttga catccgcggc gtgctggaca ggggccctac ttttaagccc tactctggca    23160
ctgcctacaa cgcactggcc cccaagggtg cccccaactc gtgcgagtgg gaacaaaatg    23220
aaactgcaca agtggatgct caagaacttg acgaagagga gaatgaagcc aatgaagctc    23280
aggcgcgaga acaggaacaa gctaagaaaa cccatgtata tgcccaggct ccactgtccg    23340
gaataaaaat aactaaagaa ggtctacaaa taggaactgc cgacgccaca gtagcaggtg    23400
ccggcaaaga aattttcgca gacaaaactt ttcaacctga accacaagta ggagaatctc    23460
aatggaacga agcggatgcc acagcagctg gtggaagggt tcttaaaaag acaactccca    23520
tgaaaccctg ctatggctca tacgctagac ccaccaattc caacggcgga cagggcgtta    23580
tggttgaaca aaatggtaaa ttggaaagtc aagtcgaaat gcaatttttt tccacatcca    23640
caaatgccac aaatgaagtt aacaatatac aaccaacagt tgtattgtac agcgaagatg    23700
taaacatgga aactccagat actcatcttt cttataaacc taaaatgggg gataaaaatg    23760
ccaaagtcat gcttggacaa caagcaatgc caaacagacc aaattacatt gcttttagag    23820
acaattttat tggtctcatg tattacaaca gcacaggtaa catgggtgtc cttgctggtc    23880
aggcatcgca gttgaacgct gttgtagatt tgcaagacag aaacacagag ctgtcctacc    23940
agcttttgct tgattcaatt ggcgacagaa caagatactt ttcaatgtgg aatcaagctg    24000
ttgacagcta tgatccagat gtcagaatta ttgagaacca tggaactgag gatgagttgc    24060
caaattattg ctttcctctt ggtggaattg ggattactga cacttttcaa gctgttaaaa    24120
caactgctgc taacggggac caaggcaata ctacctggca aaaagattca acatttgcag    24180
aacgcaatga aataggggtg ggaaataact ttgccatgga aattaacctg aatgccaacc    24240
tatggagaaa tttcctttac tccaatattg cgctgtacct gccagacaag ctaaaataca    24300
accccaccaa tgtggaaata tctgacaacc ccaacaccta cgactacatg aacaagcgag    24360
tggtggctcc tgggcttgta gactgctaca ttaaccttgg ggcgcgctgg tctctggact    24420
acatggacaa cgttaatccc tttaaccacc accgcaatgc gggcctgcgt taccgctcca    24480
tgttgttggg aaacggccgc tacgtgccct ttcacattca ggtgccccaa aagttttttg    24540
ccattaaaaa cctcctcctc ctgccaggct catacacata tgaatggaac ttcaggaagg    24600
atgttaacat ggttctgcag agctctctgg gaaacgacct tagagttgac ggggctagca    24660
ttaagtttga cagcatttgt ctttacgcca ccttcttccc catggcccac aacacggcct    24720
ccacgctgga agccatgctc agaaatgaca ccaacgacca gtcctttaat gactaccttt    24780
ccgccgccaa catgctatat cccatacccg ccaacgccac caacgtgccc atctccatcc    24840
catcgcgcaa ctgggcagca tttcgcggtt gggccttcac acgcttgaag acaaaggaaa    24900
ccccttccct gggatcaggc tacgaccctt actacaccta ctctggctcc ataccatacc    24960
ttgacggaac cttctatctt aatcacacct ttaagaaggt ggccattact tttgactctt    25020
ctgttagctg gccgggcaac gaccgcctgc ttactcccaa tgagtttgag attaagcgct    25080
cagttgacgg ggagggctat aacgtagctc agtgcaacat gacaaaggac tggttcctag    25140
tgcagatgtt ggccaactac aatattggct accagggctt ctacattcca gaaagctaca    25200
aagaccgcat gtactcgttc ttcagaaact tccagcccat gagccggcaa gtggtggacg    25260
atactaaata caaagattat cagcaggttg gaattatcca ccagcataac aactcaggct    25320
tcgtaggcta cctcgctccc accatgcgcg agggacaagc ttaccccgct aatgttccct    25380
acccactaat aggcaaaacc gcggttgata gtattaccca gaaaaagttt ctttgcgacc    25440
gcaccctgtg gcgcatcccc ttctccagta actttatgtc catgggtgcg ctcacagacc    25500
tgggccaaaa ccttctctac gcaaactccg cccacgcgct agacatgacc tttgaggtgg    25560
atcccatgga cgagcccacc cttctttatg ttttgtttga agtctttgac gtggtccgtg    25620
tgcaccagcc gcaccgcggc gtcatcgaga ccgtgtacct gcgcacgccc ttctcggccg    25680
gcaacgccac aacataaaga agcaagcaac atcaacaaca gctgccgcca tgggctccag    25740
tgagcaggaa ctgaaagcca ttgtcaaaga tcttggttgt gggccatatt ttttgggcac    25800
ctatgacaag cgcttcccag gctttgtttc cccacacaag ctcgcctgcg ccatagttaa    25860
cacggccggt cgcgagactg ggggcgtaca ctggatggcc tttgcctgga acccgcgctc    25920
aaaaacatgc tacctctttg agccctttgg cttttctgac caacgtctca agcaggttta    25980
ccagtttgag tacgagtcac tcctgcgccg tagcgccatt gcctcttccc ccgaccgctg    26040
tataacgctg gaaaagtcca cccaaagcgt gcaggggccc aactcggccg cctgtggcct    26100
attctgctgc atgtttctcc acgcctttgc caactggccc caaactccca tggatcacaa    26160
ccccaccatg aaccttatta ccggggtacc caactccatg cttaacagtc cccaggtaca    26220
gcccaccctg cgccgcaacc aggaacagct ctacagcttc ctggagcgcc actcgcccta    26280
cttccgcagc cacagtgcgc aaattaggag cgccacttct ttttgtcact tgaaaaacat    26340
gtaaaaataa tgtactagga gacactttca ataaaggcaa atgtttttat ttgtacactc    26400
tcgggtgatt atttaccccc acccttgccg tctgcgccgt ttaaaaatca aaggggttct    26460
gccgcgcatc gctatgcgcc actggcaggg acacgttgcg atactggtgt ttagtgctcc    26520
acttaaactc aggcacaacc atccgcggca gctcggtgaa gttttcactc cacaggctgc    26580
gcaccatcac caacgcgttt agcaggtcgg gcgccgatat cttgaagtcg cagttggggc    26640
ctccgccctg cgcgcgcgag ttgcgataca cagggttaca gcactggaac actatcagcg    26700
ccgggtggtg cacgctggcc agcacgctct tgtcggagat cagatccgcg tccaggtcct    26760
ccgcgttgct cagggcgaac ggagtcaact ttggtagctg ccttcccaaa aagggtgcat    26820
gcccaggctt tgagttgcac tcgcaccgta gtggcatcag aaggtgaccg tgcccagtct    26880
gggcgttagg atacagcgcc tgcatgaaag ccttgatctg cttaaaagcc acctgagcct    26940
ttgcgccttc agagaagaac atgccgcaag acttgccgga aaactgattg gccggacagg    27000
ccgcgtcatg cacgcagcac cttgcgtcgg tgttggagat ctgcaccaca tttcggcccc    27060
accggttctt cacgatcttg gccttgctag actgctcctt cagcgcgcgc tgcccgtttt    27120
cgctcgtcac atccatttca atcacgtgct ccttatttat cataatgctc ccgtgtagac    27180
acttaagctc gccttcgatc tcagcgcagc ggtgcagcca caacgcgcag cccgtgggct    27240
cgtggtgctt gtaggttacc tctgcaaacg actgcaggta cgcctgcagg aatcgcccca    27300
tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg caacccgcgg tgctcctcgt    27360
ttagccaggt cttgcatacg gccgccagag cttccacttg gtcaggcagt agcttgaagt    27420
ttgcctttag atcgttatcc acgtggtact tgtccatcaa cgcgcgcgca gcctccatgc    27480
ccttctccca cgcagacacg atcggcaggc tcagcgggtt tatcaccgtg ctttcacttt    27540
ccgcttcact ggactcttcc ttttcctctt gcatccgcat accccgcgcc actgggtcgt    27600
cttcattcag ccgccgcacc gtgcgcttac ctcccttgcc gtgcttgatt agcaccggtg    27660
ggttgctgaa acccaccatt tgtagcgcca catcttctct ttcttcctcg ctgtccacga    27720
tcacctctgg ggatggcggg cgctcgggct tgggagaggg gcgcttcttt ttctttttgg    27780
acgcaatggc caaatccgcc gtcgaggtcg atggccgcgg gctgggtgtg cgcggcacca    27840
gcgcatcttg tgacgagtct tcttcgtcct cggactcgag acgccgcctc agccgctttt    27900
ttgggggcgc gcggggaggc ggcggcgacg gcgacgggga cgagacgtcc tccatggttg    27960
gtggacgtcg cgccgcaccg cgtccgcgct cgggggtggt ttcgcgctgc tcctcttccc    28020
gactggccat ttccttctcc tataggcaga aaaagatcat ggagtcagtc gagaaggagg    28080
acagcctaac cgcccccttt gagttcgcca ccaccgcctc caccgatgcc gccaacgcgc    28140
ctaccacctt ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt atcgagcagg    28200
acccaggttt tgtaagcgaa gacgacgaag atcgctcagt accaacagag gataaaaagc    28260
aagaccagga cgacgcagag gcaaacgagg aacaagtcgg gcggggggac caaaggcatg    28320
gcgactacct agatgtggga gacgacgtgc tgttgaagca tctgcagcgc cagtgcgcca    28380
ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg gatgtcagcc    28440
ttgcctacga acgccacctg ttctcaccgc gcgtaccccc caaacgccaa gaaaacggca    28500
catgcgagcc caacccgcgc ctcaacttct accccgtatt tgccgtgcca gaggtgcttg    28560
ccacctatca catctttttc caaaactgca agatacccct atcctgccgt gccaaccgca    28620
gccgagcgga caagcagctg gccttgcggc agggcgctgt catacctgat atcgcctcgc    28680
tcgacgaagt gccaaaaatc tttgagggtc ttggacgcga cgagaagcgc gcggcaaacg    28740
ctctgcaaca agaaaacagc gaaaatgaaa gtcactgtgg agtgctggtg gaacttgagg    28800
gtgacaacgc gcgcctagcc gtgctgaaac gcagcatcga ggtcacccac tttgcctacc    28860
cggcacttaa cctacccccc aaggttatga gcacagtcat gagcgagctg atcgtgcgcc    28920
gtgcacgacc cctggagagg gatgcaaact tgcaagaaca aaccgaggag ggcctacccg    28980
cagttggcga tgagcagctg gcgcgctggc ttgagacgcg cgagcctgcc gacttggagg    29040
agcgacgcaa gctaatgatg gccgcagtgc ttgttaccgt ggagcttgag tgcatgcagc    29100
ggttctttgc tgacccggag atgcagcgca agctagagga aacgttgcac tacacctttc    29160
gccagggcta cgtgcgccag gcctgcaaaa tttccaacgt ggagctctgc aacctggtct    29220
cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa cgtgcttcat tccacgctca    29280
agggcgaggc gcgccgcgac tacgtccgcg actgcgttta cttatttctg tgctacacct    29340
ggcaaacggc catgggcgtg tggcagcagt gcctggagga gcgcaacctg aaggagctgc    29400
agaagctgct aaagcaaaac ttgaaggacc tatggacggc cttcaacgag cgctccgtgg    29460
ccgcgcacct ggcggacatt atcttccccg aacgcctgct taaaaccctg caacagggtc    29520
tgccagactt caccagtcaa agcatgttgc aaaactttag gaactttatc ctagagcgtt    29580
caggaattct gcccgccacc tgctgtgcgc ttcctagcga ctttgtgccc attaagtacc    29640
gtgaatgccc tccgccgctt tggggtcact gctaccttct gcagctagcc aactaccttg    29700
cctaccactc cgacatcatg gaagacgtga gcggtgacgg cctactggag tgtcactgtc    29760
gctgcaacct atgcaccccg caccgctccc tggtctgcaa ttcacaactg cttagcgaaa    29820
gtcaaattat cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag tccgcggctc    29880
cggggttgaa actcactccg gggctgtgga cgtcggctta ccttcgcaaa tttgtacctg    29940
aggactacca cgcccacgag attaggttct acgaagacca atcccgcccg ccaaatgcgg    30000
agcttaccgc ctgcgtcatt acccagggcc acatccttgg ccaattgcaa gccattaaca    30060
aagcccgcca agagtttctg ctacgaaagg gacggggggt ttacttggac ccccagtccg    30120
gcgaggagct caacccaatc cccccgccgc cgcagcccta tcagcagccg cgggcccttg    30180
cttcccagga tggcacccaa aaagaagctg cagctgccgc cgccgccacc cacggacgag    30240
gaggaatact gggacagtca ggcagaggag gttttggacg aggaggagga gatgatggaa    30300
gactgggaca gcctagacga ggaagcttcc gaggccgaag aggtgtcaga cgaaacaccg    30360
tcaccctcgg tcgcattccc ctcgccggcg ccccagaaat cggcaaccgt tcccagcatt    30420
gctacaacct ccgctcctca ggcgccgccg gcactgcccg ttcgccgacc caaccgtaga    30480
tgggacacca ctggaaccag ggccggtaag tctaagcagc cgccgccgtt agcccaagag    30540
caacaacagc gccaaggcta ccgctcgtgg cgcgtgcaca agaacgccat agttgcttgc    30600
ttgcaagact gtgggggcaa catctccttc gcccgccgct ttcttctcta ccatcacggc    30660
gtggccttcc cccgtaacat cctgcattac taccgtcatc tctacagccc ctactgcacc    30720
ggcggcagcg gcagcaacag cagcggccac gcagaagcaa aggcgaccgg atagcaagac    30780
tctgacaaag cccaagaaat ccacagcggc ggcagcagca ggaggaggag cactgcgtct    30840
ggcgcccaac gaacccgtat cgacccgcga gcttagaaac aggatttttc ccactctgta    30900
tgctatattt caacagagca ggggccaaga acaagagctg aaaataaaaa acaggtctct    30960
gcgctccctc acccgcagct gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct    31020
ggaagacgcg gaggctctct tcagcaaata ctgcgcgctg actcttaagg actagtttcg    31080
cgccctttct caaatttaag cgcgaaaact acgtcatctc cagcggccac acccggcgcc    31140
agcacctgtc gtcagcgcca ttatgagcaa ggaaattccc acgccctaca tgtggagtta    31200
ccagccacaa atgggacttg cggctggagc tgcccaagac tactcaaccc gaataaacta    31260
catgagcgcg ggaccccaca tgatatcccg ggtcaacgga atccgcgccc accgaaaccg    31320
aattctcctc gaacaggcgg ctattaccac cacacctcgt aataacctta atccccgtag    31380
ttggcccgct gccctggtgt accaggaaag tcccgctccc accactgtgg tacttcccag    31440
agacgcccag gccgaagttc agatgactaa ctcaggggcg cagcttgcgg gcggctttcg    31500
tcacagggtg cggtcgcccg ggcagggtat aactcacctg aaaatcagag ggcgaggtat    31560
tcagctcaac gacgagtcgg tgagctcctc tcttggtctc cgtccggacg ggacatttca    31620
gatcggcggc gctggccgct cttcatttac gccccgtcag gcgatcctaa ctctgcagac    31680
ctcgtcctcg gagccgcgct ccggaggcat tggaactcta caatttattg aggagttcgt    31740
gccttcggtt tacttcaacc ccttttctgg acctcccggc cactacccgg accagtttat    31800
tcccaacttt gacgcggtaa aagactcggc ggacggctac gactgaatga ccagtggaga    31860
ggcagagcaa ctgcgcctga cacacctcga ccactgccgc cgccacaagt gctttgcccg    31920
cggctccggt gagttttgtt actttgaatt gcccgaagag catatcgagg gcccggcgca    31980
cggcgtccgg ctcaccaccc aggtagagct tacacgtagc ctgattcggg agtttaccaa    32040
gcgccccctg ctagtggagc gggagcgggg tccctgtgtt ctgaccgtgg tttgcaactg    32100
tcctaaccct ggattacatc aagatcttat tccattcaac taacaataaa cacacaataa    32160
attacttact taaaatcagt cagcaaatct ttgtccagct tattcagcat cacctccttt    32220
ccctcctccc aactctggta tttcagcagc cttttagctg cgaactttct ccaaagtcta    32280
aatgggatgt caaattcctc atgttcttgt ccctccgcac ccactatctt catattgttg    32340
cagatgaaac gcgccagacc gtctgaagac accttcaacc ctgtgtaccc atatgacacg    32400
gaaaccggcc ctccaactgt gcctttcctt acccctccct ttgtgtcgcc aaatgggttc    32460
caagaaagtc cccccggagt gctttctttg cgtctttcag aacctttggt tacctcacac    32520
ggcatgcttg cgctaaaaat gggcagcggc ctgtccctgg atcaggcagg caaccttaca    32580
tcaaatacaa tcactgtttc tcaaccgcta aaaaaaacaa agtccaatat aactttggaa    32640
acatccgcgc cccttacagt cagctcaggc gccctaacca tggccacaac ttcgcctttg    32700
gtggtctctg acaacactct taccatgcaa tcacaagcac cgctaaccgt gcaagactca    32760
aaacttagca ttgctaccaa agagccactt acagtgttag atggaaaact ggccctgcag    32820
acatcagccc ccctctctgc cactgataac aacgccctca ctatcactgc ctcacctcct    32880
cttactactg caaatggtag tctggctgtt accatggaaa acccacttta caacaacaat    32940
ggaaaacttg ggctcaaaat tggcggtcct ttgcaagtgg ccaccgactc acatgcacta    33000
acactaggta ctggtcaggg ggttgcagtt cataacaatt tgctacatac aaaagttaca    33060
ggcgcaatag ggtttgatac atctggcaac atggaactta aaactggaga tggcctctat    33120
gtggatagcg ccggtcctaa ccaaaaacta catattaatc taaataccac aaaaggcctt    33180
gcttttgaca acaccgcaat aacaattaac gctggaaaag ggttggaatt tgaaacagac    33240
tcctcaaacg gaaatcccat aaaaacaaaa attggatcag gcatacaata taataccaat    33300
ggagctatgg ttgcaaaact tggaacaggc ctcagttttg acagctccgg agccataaca    33360
atgggcagca taaacaatga cagacttact ctttggacaa caccagaccc atccccaaat    33420
tgcagaattg cttcagataa agactgcaag ctaactctgg cgctaacaaa atgtggcagt    33480
caaattttgg gcactgtttc agctttggca gtatcaggta atatggcctc catcaatgga    33540
actctaagca gtgtaaactt ggttcttaga tttgatgaca acggagtgct tatgtcaaat    33600
tcatcactgg acaaacagta ttggaacttt agaaacgggg actccactaa cggtcaacca    33660
tacacttatg ctgttgggtt tatgccaaac ctaaaagctt acccaaaaac tcaaagtaaa    33720
actgcaaaaa gtaatattgt tagccaggtg tatcttaatg gtgacaagtc taaaccattg    33780
cattttacta ttacgctaaa tggaacagat gaaaccaacc aagtaagcaa atactcaata    33840
tcattcagtt ggtcctggaa cagtggacaa tacactaatg acaaatttgc caccaattcc    33900
tataccttct cctacattgc ccaggaataa agaatcgtga acctgttgca tgttatgttt    33960
caacgtgttt atttttcaat tgcagaaaat ttcaagtcat ttttcattca gtagtatagc    34020
cccaccacca catagcttat actaatcacc gtaccttaat caaactcaca gaaccctagt    34080
attcaacctg ccacctccct cccaacacac agagtacaca gtcctttctc cccggctggc    34140
cttaaacagc atcatatcat gggtaacaga catattctta ggtgttatat tccacacggt    34200
ctcctgtcga gccaaacgct catcagtgat gttaataaac tccccgggca gctcgcttaa    34260
gttcatgtcg ctgtccagct gctgagccac aggctgctgt ccaacttgcg gttgctcaac    34320
gggcggcgaa ggagaagtcc acgcctacat gggggtagag tcataatcgt gcatcaggat    34380
agggcggtgg tgctgcagca gcgcgcgaat aaactgctgc cgccgccgct ccgtcctgca    34440
ggaatacaac atggcagtgg tctcctcagc gatgattcgc accgcccgca gcataaggcg    34500
ccttgtcctc cgggcacagc agcgcaccct gatctcactt aagtcagcac agtaactgca    34560
gcacagtacc acaatattgt ttaaaatccc acagtgcaag gcgctgtatc caaagctcat    34620
ggcggggacc acagaaccca cgtggccatc ataccacaag cgcaggtaga ttaagtggcg    34680
acccctcata aacacgctgg acataaacat tacctctttt ggcatgttgt aattcaccac    34740
ctcccggtac catataaacc tctgattaaa catggcgcca tccaccacca tcctaaacca    34800
gctggccaaa acctgcccgc cggctatgca ctgcagggaa ccgggactgg aacaatgaca    34860
gtggagagcc caggactcgt aaccatggat catcatgctc gtcatgatat caatgttggc    34920
acaacacagg cacacgtgca tacacttcct caggattaca agctcctccc gcgtcagaac    34980
catatcccag ggaacaaccc attcctgaat cagcgtaaat cccacactgc agggaagacc    35040
tcgcacgtaa ctcacgttgt gcattgtcaa agtgttacat tcgggcagca gcggatgatc    35100
ctccagtatg gtagcgcggg tttctgtctc aaaaggaggt agacgatccc tactgtacgg    35160
agtgcgccga gacaaccgag atcgtgttgg tcgtagtgtc atgccaaatg gaacgccgga    35220
cgtagtcata tttcctgaag caaaaccagg tgcgggcgtg acaaacagat ctgcgtctcc    35280
ggtctcgccg cttagatcgc tctgtgtagt agttgtagta tatccactct ctcaaagcat    35340
ccaggcgccc cctggcttcg ggttctatgt aaactccttc atgcgccgct gccctgataa    35400
catccaccac cgcagaataa gccacaccca gccaacctac acattcgttc tgcgagtcac    35460
acacgggagg agcgggaaga gctggaagaa ccatgttttt ttttttattc caaaagatta    35520
tccaaaacct caaaatgaag atctattaag tgaacgcgct cccctccggt ggcgtggtca    35580
aactctacag ccaaagaaca gataatggca tttgtaagat gttgcacaat ggcttccaaa    35640
aggcaaacgg ccctcacgtc caagtggacg taaaggctaa acccttcagg gtgaatctcc    35700
tctataaaca ttccagcacc ttcaaccatg cccaaataat tctcatctcg ccaccttctc    35760
aatatatctc taagcaaatc ccgaatatta agtccggcca ttgtaaaaat ctgctccaga    35820
gcgccctcca ccttcagcct caagcagcga atcatgattg caaaaattca ggttcctcac    35880
agacctgtat aagattcaaa agcggaacat taacaaaaat accgcgatcc cgtaggtccc    35940
ttcgcagggc cagctgaaca taatcgtgca ggtctgcacg gaccagcgcg gccacttccc    36000
cgccaggaac catgacaaaa gaacccacac tgattatgac acgcatactc ggagctatgc    36060
taaccagcgt agccccgatg taagcttgtt gcatgggcgg cgatataaaa tgcaaggtgc    36120
tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag cacatcgtag tcatgctcat    36180
gcagataaag gcaggtaagc tccggaacca ccacagaaaa agacaccatt tttctctcaa    36240
acatgtctgc gggtttctgc ataaacacaa aataaaataa caaaaaaaca tttaaacatt    36300
agaagcctgt cttacaacag gaaaaacaac ccttataagc ataagacgga ctacggccat    36360
gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa agcaccaccg acagctcctc    36420
ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca tcaggttgat tcacatcggt    36480
cagtgctaaa aagcgaccga aatagcccgg gggaatacat acccgcaggc gtagagacaa    36540
cattacagcc cccataggag gtataacaaa attaatagga gagaaaaaca cataaacacc    36600
tgaaaaaccc tcctgcctag gcaaaatagc accctcccgc tccagaacaa catacagcgc    36660
ttccacagcg gcagccataa cagtcagcct taccagtaaa aaagaaaacc tattaaaaaa    36720
acaccactcg acacggcacc agctcaatca gtcacagtgt aaaaaagggc caagtgcaga    36780
gcgagtatat ataggactaa aaaatgacgt aacggttaaa gtccacaaaa aacacccaga    36840
aaaccgcacg cgaacctacg cccagaaacg aaagccaaaa aacccacaac ttcctcaaat    36900
cgtcacttcc gttttcccac gttacgtcac ttcccatttt aagaaaacta caattcccaa    36960
cacatacaag ttactccgcc ctaaaaccta cgtcacccgc cccgttccca cgccccgcgc    37020
cacgtcacaa actccacccc ctcattatca tattggcttc aatccaaaat aaggtatatt    37080
attgatgatg                                                           37090
<210>5
<211>5955
<212>DNA
<213>人工序列
<220>
<223>NS cDNA序列
<221>CDS
<222>(1)...(5955)
<400>5
atg gcg ccc atc acg gcc tac tcc caa cag acg cgg ggc cta ctt ggt    48
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly
 1               5                   10                  15
tgc atc atc act agc ctt aca ggc cgg gac aag aac cag gtc gag gga     96
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
             20                  25                  30
gag gtt cag gtg gtt tcc acc gca aca caa tcc ttc ctg gcg acc tgc    144
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys
         35                  40                  45
gtc aac ggc gtg tgt tgg acc gtt tac cat ggt gct ggc tca aag acc    192
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr
     50                  55                  60
tta gcc ggc cca aag ggg cca atc acc cag atg tac act aat gtg gac    240
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp
 65                  70                  75                  80
cag gac ctc gtc ggc tgg cag gcg ccc ccc ggg gcg cgt tcc ttg aca    288
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr
                 85                  90                  95
cca tgc acc tgt ggc agc tca gac ctt tac ttg gtc acg aga cat gct    336
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
            100                 105                 110
gac gtc att ccg gtg cgc cgg cgg ggc gac agt agg ggg agc ctg ctc    384
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
        115                 120                 125
tcc ccc agg cct gtc tcc tac ttg aag ggc tct tcg ggt ggt cca ctg    432
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
    130                 135                 140
ctc tgc cct tcg ggg cac gct gtg ggc atc ttc cgg gct gcc gta tgc    480
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145                 150                 155                 160
acc cgg ggg gtt gcg aag gcg gtg gac ttt gtg ccc gta gag tcc atg    528
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met
                165                 170                 175
gaa act act atg cgg tct ccg gtc ttc acg gac aac tca tcc ccc ccg    576
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
            180                 185                 190
gcc gta ccg cag tca ttt caa gtg gcc cac cta cac gct ccc act ggc    624
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
        195                 200                 205
agc ggc aag agt act aaa gtg ccg gct gca tat gca gcc caa ggg tac     672
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
    210                 215                 220
aag gtg ctc gtc ctc aat ccg tcc gtt gcc gct acc tta ggg ttt ggg     720
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225                 230                 235                 240
gcg tat atg tct aag gca cac ggt att gac ccc aac atc aga act ggg     768
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
                245                 250                 255
gta agg acc att acc aca ggc gcc ccc gtc aca tac tct acc tat ggc     816
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly
            260                 265                 270
aag ttt ctt gcc gat ggt ggt tgc tct ggg ggc gct tat gac atc ata     864
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
        275                 280                 285
ata tgt gat gag tgc cat tca act gac tcg act aca atc ttg ggc atc     912
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile
    290                 295                 300
ggc aca gtc ctg gac caa gcg gag acg gct gga gcg cgg ctt gtc gtg     960
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305                 310                 315                 320
ctc gcc acc gct acg cct ccg gga tcg gtc acc gtg cca cac cca aac    1008
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
                325                 330                 335
atc gag gag gtg gcc ctg tct aat act gga gag atc ccc ttc tat ggc    1056
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly
            340                 345                 350
aaa gcc atc ccc att gaa gcc atc agg ggg gga agg cat ctc att ttc    1104
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe
        355                 360                 365
tgt cat tcc aag aag aag tgc gac gag ctc gcc gca aag ctg tca ggc    1152
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly
    370                 375                 380
ctc gga atc aac gct gtg gcg tat tac cgg ggg ctc gat gtg tcc gtc    1200
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385                 390                 395                 400
ata cca act atc gga gac gtc gtt gtc gtg gca aca gac gct ctg atg    1248
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
                405                 410                 415
acg ggc tat acg ggc gac ttt gac tca gtg atc gac tgt aac aca tgt    1296
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
            420                 425                 430
gtc acc cag aca gtc gac ttc agc ttg gat ccc acc ttc acc att gag    1344
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
        435                 440                 445
acg acg acc gtg cct caa gac gca gtg tcg cgc tcg cag cgg cgg ggt    1392
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
    450                 455                 460
agg act ggc agg ggt agg aga ggc atc tac agg ttt gtg act ccg gga    1440
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly
465                 470                 475                 480
gaa cgg ccc tcg ggc atg ttc gat tcc tcg gtc ctg tgt gag tgc tat    1488
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
                485                 490                 495
gac gcg ggc tgt gct tgg tac gag ctc acc ccc gcc gag acc tcg gtt    1536
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val
            500                 505                 510
agg ttg cgg gcc tac ctg aac aca cca ggg ttg ccc gtt tgc cag gac    1584
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
        515                 520                 525
cac ctg gag ttc tgg gag agt gtc ttc aca ggc ctc acc cac ata gat    1632
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
    530                 535                 540
gca cac ttc ttg tcc cag acc aag cag gca gga gac aac ttc ccc tac    1680
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr
545                 550                 555                 560
ctg gta gca tac caa gcc acg gtg tgc gcc agg gct cag gcc cca cct    1728
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
                565                 570                 575
cca tca tgg gat caa atg tgg aag tgt ctc ata cgg ctg aaa cct acg    1776
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
            580                 585                 590
ctg cac ggg cca aca ccc ttg ctg tac agg ctg gga gcc gtc caa aat    1824
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
        595                 600                 605
gag gtc acc ctc acc cac ccc ata acc aaa tac atc atg gca tgc atg    1872
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met
    610                 615                 620
tcg gct gac ctg gag gtc gtc act agc acc tgg gtg ctg gtg ggc gga    1920
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625                 630                 635                 640
gtc ctt gca gct ctg gcc gcg tat tgc ctg aca aca ggc agt gtg gtc    1968
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val
                645                 650                 655
att gtg ggt agg att atc ttg tcc ggg agg ccg gct att gtt ccc gac    2016
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp
            660                 665                 670
agg gag ttt ctc tac cag gag ttc gat gaa atg gaa gag tgc gcc tcg    2064
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser
        675                 680                 685
cac ctc cct tac atc gag cag gga atg cag ctc gcc gag caa ttc aag    2112
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys
    690                 695                 700
cag aaa gcg ctc ggg tta ctg caa aca gcc acc aaa caa gcg gag gct    2160
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala
705                 710                 715                 720
gct gct ccc gtg gtg gag tcc aag tgg cga gcc ctt gag aca ttc tgg    2208
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp
                725                 730                 735
gcg aag cac atg tgg aat ttc atc agc ggg ata cag tac tta gca ggc    2256
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
            740                 745                 750
tta tcc act ctg cct ggg aac ccc gca ata gca tca ttg atg gca ttc    2304
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe
        755                 760                 765
aca gcc tct atc acc agc ccg ctc acc acc caa agt acc ctc ctg ttt    2352
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe
    770                 775                 780
aac atc ttg ggg ggg tgg gtg gct gcc caa ctc gcc ccc ccc agc gcc    2400
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala
785                 790                 795                 800
gct tcg gct ttc gtg ggc gcc ggc atc gcc ggt gcg gct gtt ggc agc    2448
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser
                805                 810                 815
ata ggc ctt ggg aag gtg ctt gtg gac att ctg gcg ggt tat gga gca    2496
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
            820                 825                 830
gga gtg gcc ggc gcg ctc gtg gcc ttc aag gtc atg agc ggc gag atg    2544
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met
        835                 840                 845
ccc tcc acc gag gac ctg gtc aat cta ctt cct gcc atc ctc tct cct    2592
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro
    850                 855                 860
ggc gcc ctg gtc gtc ggg gtc gtg tgt gca gca ata ctg cgt cga cac    2640
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His
865                 870                 875                 880
gtg ggt ccg gga gag ggg gct gtg cag tgg atg aac cgg ctg ata gcg    2688
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
                885                 890                 895
ttc gcc tcg cgg ggt aat cat gtt tcc ccc acg cac tat gtg cct gag    2736
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu
            900                 905                 910
agc gac gcc gca gcg cgt gtt act cag atc ctc tcc agc ctt acc atc    2784
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile
        915                 920                 925
act cag ctg ctg aaa agg ctc cac cag tgg att aat gaa gac tgc tcc    2832
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser
    930                 935                 940
aca ccg tgt tcc ggc tcg tgg cta agg gat gtt tgg gac tgg ata tgc    2880
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys
945                 950                 955                 960
acg gtg ttg act gac ttc aag acc tgg ctc cag tcc aag ctc ctg ccg    2928
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro
                965                 970                 975
cag cta ccg gga gtc cct ttt ttc tcg tgc caa cgc ggg tac aag gga    2976
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly
            980                 985                 990
gtc tgg cgg gga gac ggc atc atg caa acc acc tgc cca tgt gga gca    3024
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala
         995                1000                1005
cag atc acc gga cat gtc aaa aac ggt tcc atg agg atc gtc ggg cct    3072
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro
    1010                1015                1020
aag acc tgc agc aac acg tgg cat gga aca ttc ccc atc aac gca tac    3120
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr
1025                1030                1035                1040
acc acg ggc ccc tgc aca ccc tct cca gcg cca aac tat tct agg gcg    3168
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala
                1045                1050                1055
ctg tgg cgg gtg gcc gct gag gag tac gtg gag gtc acg cgg gtg ggg    3216
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly
            1060                1065                1070
gat ttc cac tac gtg acg ggc atg acc act gac aac gta aag tgc cca    3264
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro
        1075                1080                1085
tgc cag gtt ccg gct cct gaa ttc ttc acg gag gtg gac gga gtg cgg    3312
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg
    1090                1095                1100
ttg cac agg tac gct ccg gcg tgc agg cct ctc cta cgg gag gag gtt    3360
Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val
1105                1110                1115                1120
aca ttc cag gtc ggg ctc aac caa tac ctg gtt ggg tca cag cta cca    3408
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro
                1125                1130                1135
tgc gag ccc gaa ccg gat gta gca gtg ctc act tcc atg ctc acc gac    3456
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp
            1140                1145                1150
ccc tcc cac atc aca gca gaa acg gct aag cgt agg ttg gcc agg ggg    3504
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly
        1155                1160                1165
tct ccc ccc tcc ttg gcc agc tct tca gct agc cag ttg tct gcg cct    3552
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro
    1170                1175                1180
tcc ttg aag gcg aca tgc act acc cac cat gtc tct ccg gac gct gac    3600
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp
1185                1190                1195                1200
ctc atc gag gcc aac ctc ctg tgg cgg cag gag atg ggc ggg aac atc    3648
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile
                1205                1210                1215
acc cgc gtg gag tcg gag aac aag gtg gta gtc ctg gac tct ttc gac    3696
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp
            1220                1225                1230
ccg ctt cga gcg gag gag gat gag agg gaa gta tcc gtt ccg gcg gag    3744
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu
        1235                1240                1245
atc ctg cgg aaa tcc aag aag ttc ccc gca gcg atg ccc atc tgg gcg    3792
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala
    1250                1255                1260
cgc ccg gat tac aac cct cca ctg tta gag tcc tgg aag gac ccg gac    3840
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp
1265                1270                1275                1280
tac gtc cct ccg gtg gtg cac ggg tgc ccg ttg cca cct atc aag gcc    3888
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala
                1285                1290                1295
cct cca ata cca cct cca cgg aga aag agg acg gtt gtc cta aca gag    3936
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu
            1300                1305                1310
tcc tcc gtg tct tct gcc tta gcg gag ctc gct act aag acc ttc ggc    3984
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly
        1315                1320                1325
agc tcc gaa tca tcg gcc gtc gac agc ggc acg gcg acc gcc ctt cct    4032
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro
    1330                1335                1340
gac cag gcc tcc gac gac ggt gac aaa gga tcc gac gtt gag tcg tac    4080
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr
1345                1350                1355                1360
tcc tcc atg ccc ccc ctt gag ggg gaa ccg ggg gac ccc gat ctc agt    4128
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser
                1365                1370                1375
gac ggg tct tgg tct acc gtg agc gag gaa gct agt gag gat gtc gtc    4176
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val
            1380                1385                1390
tgc tgc tca atg tcc tac aca tgg aca ggc gcc ttg atc acg cca tgc    4224
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys
        1395                1400                1405
gct gcg gag gaa agc aag ctg ccc atc aac gcg ttg agc aac tct ttg    4272
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu
    1410                1415                1420
ctg cgc cac cat aac atg gtt tat gcc aca aca tct cgc agc gca ggc    4320
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly
1425                1430                1435                1440
ctg cgg cag aag aag gtc acc ttt gac aga ctg caa gtc ctg gac gac    4368
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp
                1445                1450                1455
cac tac cgg gac gtg ctc aag gag atg aag gcg aag gcg tcc aca gtt    4416
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val
            1460                1465                1470
aag gct aaa ctc cta tcc gta gag gaa gcc tgc aag ctg acg ccc cca    4464
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro
        1475                1480                1485
cat tcg gcc aaa tcc aag ttt ggc tat ggg gca aag gac gtc cgg aac    4512
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn
    1490                1495                1500
cta tcc agc aag gcc gtt aac cac atc cac tcc gtg tgg aag gac ttg    4560
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu
1505                1510                1515                1520
ctg gaa gac act gtg aca cca att gac acc acc atc atg gca aaa aat    4608
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn
                1525                1530                1535
gag gtt ttc tgt gtc caa cca gag aaa gga ggc cgt aag cca gcc cgc    4656
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg
            1540                1545                1550
ctt atc gta ttc cca gat ctg gga gtc cgt gta tgc gag aag atg gcc    4704
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala
        1555                1560                1565
ctc tat gat gtg gtc tcc acc ctt cct cag gtc gtg atg ggc tcc tca    4752
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser
    1570                1575                1580
tac gga ttc cag tac tct cct ggg cag cga gtc gag ttc ctg gtg aat    4800
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn
1585                1590                1595                1600
acc tgg aaa tca aag aaa aac ccc atg ggc ttt tca tat gac act cgc    4848
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg
                1605                1610                1615
tgt ttc gac tca acg gtc acc gag aac gac atc cgt gtt gag gag tca    4896
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser
            1620                1625                1630
att tac caa tgt tgt gac ttg gcc ccc gaa gcc aga cag gcc ata aaa    4944
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys
        1635                1640                1645
tcg ctc aca gag cgg ctt tat atc ggg ggt cct ctg act aat tca aaa    4992
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys
    1650                1655                1660
ggg cag aac tgc ggt tat cgc cgg tgc cgc gcg agc ggc gtg ctg acg    5040
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr
1665                1670                1675                1680
act agc tgc ggt aac acc ctc aca tgt tac ttg aag gcc tct gca gcc    5088
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala
                1685                1690                1695
tgt cga gct gcg aag ctc cag gac tgc acg atg ctc gtg aac gga gac    5136
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp
            1700                1705                1710
gac ctt gtc gtt atc tgt gaa agc gcg gga acc caa gag gac gcg gcg    5184
Asp Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala
        1715                1720                1725
agc cta cga gtc ttc acg gag gct atg act agg tac tct gcc ccc ccc    5232
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro
    1730                1735                1740
ggg gac ccg ccc caa cca gaa tac gac ttg gag ctg ata aca tca tgt    5280
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys
1745                1750                1755                1760
tcc tcc aat gtg tcg gtc gcc cac gat gca tca ggc aaa agg gtg tac    5328
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr
                1765                1770                1775
tac ctc acc cgt gat ccc acc acc ccc ctc gca cgg gct gcg tgg gaa    5376
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu
            1780                1785                1790
aca gct aga cac act cca gtt aac tcc tgg cta ggc aac att atc atg    5424
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met
        1795                1800                1805
tat gcg ccc act ttg tgg gca agg atg att ctg atg act cac ttc ttc    5472
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe
    1810                1815                1820
tcc atc ctt cta gca cag gag caa ctt gaa aaa gcc ctg gac tgc cag    5520
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln
1825                1830                1835                1840
atc tac ggg gcc tgt tac tcc att gag cca ctt gac cta cct cag atc    5568
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile
                1845                1850                1855
att gaa cga ctc cat ggc ctt agc gca ttt tca ctc cat agt tac tct    5616
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser
            1860                1865                1870
cca ggt gag atc aat agg gtg gct tca tgc ctc agg aaa ctt ggg gta    5664
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val
        1875                1880                1885
cca ccc ttg cga gtc tgg aga cat cgg gcc agg agc gtc cgc gct agg    5712
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg
    1890                1895                1900
cta ctg tcc cag ggg ggg agg gcc gcc act tgt ggc aag tac ctc ttc    5760
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe
1905                1910                1915                1920
aac tgg gca gtg aag acc aaa ctc aaa ctc act cca atc ccg gct gcg    5808
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala
                1925                1930                1935
tcc cag ctg gac ttg tcc ggc tgg ttc gtt gct ggt tac agc ggg gga    5856
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly
            1940                1945                1950
gac ata tat cac agc ctg tct cgt gcc cga ccc cgc tgg ttc atg ctg    5904
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu
        1955                1960                1965
tgc cta ctc cta ctt tct gta ggg gta ggc atc tac ctg ctc ccc aac    5952
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn
    1970                1975                1980
cga                                                                5955
Arg
1985
<210>6
<211>1984
<212>PRT
<213>人工序列
<220>
<223>NS序列
<400>6
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
1               5                  10                  15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
            20                  25                  30
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
        35                  40                  45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
    50                  55                  60
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
65                  70                  75                  80
Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr Pro
                85                  90                  95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
            100                 105                 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
        115                 120                 125
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
    130                 135                 140
Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145                 150                 155                 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu
                165                 170                 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
            180                 185                 190
Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
        195                 200                 205
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
    210                 215                 220
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
225                 230                 235                 240
Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly Val
                245                 250                 255
Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly Lys
            260                 265                 270
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
        275                 280                 285
Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile Gly
    290                 295                 300
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
305                 310                 315                 320
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn Ile
                325                 330                 335
Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys
            340                 345                 350
Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe Cys
        355                 360                 365
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly Leu
    370                 375                 380
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385                 390                 395                 400
Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
                405                 410                 415
Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
            420                 425                 430
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
        435                 440                 445
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg
    450                 455                 460
Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu
465                 470                 475                 480
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
                485                 490                 495
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val Arg
            500                 505                 510
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
        515                 520                 525
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala
    530                 535                 540
His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu
545                 550                 555                 560
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
                565                 570                 575
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
            580                 585                 590
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
        595                 600                 605
Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met Ser
    610                 615                 620
Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val
625                 630                 635                 640
Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val Ile
                645                 650                 655
Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp Arg
            660                 665                 670
Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser His
        675                 680                 685
Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys Gln
    690                 695                 700
Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala Ala
705                 710                 715                 720
Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp Ala
                725                 730                 735
Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly Leu
            740                 745                 750
Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe Thr
        755                 760                 765
Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe Asn
    770                 775                 780
Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala Ala
785                 790                 795                 800
Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser Ile
                805                 810                 815
Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala Gly
            820                 825                 830
Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met Pro
        835                 840                 845
Ser Thr Glu Asp Leu Val Asn Leu Leu Pro AlaIle Leu Ser Pro Gly
    850                 855                 860
Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His Val
865                 870                 875                 880
Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala Phe
                885                 890                 895
Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu Ser
            900                 905                 910
Asp Ala Ala Ala Arg Val Thr GlnIle Leu Ser Ser Leu Thr Ile Thr
        915                 920                 925
Gln Leu Leu Lys Arg Leu His Gln TrpIle Asn Glu Asp Cys Ser Thr
    930                 935                 940
Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys Thr
945                 950                 955                 960
Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro Gln
                965                 970                 975
Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly Val
            980                 985                 990
Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala Gln
        995                 1000                1005
Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro Lys
    1010                1015                1020
Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr Thr
1025                1030                1035                1040
Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala Leu
                1045                1050                1055
Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly Asp
            1060                1065                1070
Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro Cys
        1075                1080                1085
Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg Leu
    1090                1095                1100
His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val Thr
1105                1110                1115                1120
Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro Cys
                1125                1130                1135
Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp Pro
            1140                1145                1150
Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly Ser
        1155                1160                1165
Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser
    1170                1175                1180
Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp Leu
1185                1190                1195                1200
Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile Thr
                1205                1210                1215
Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp Pro
            1220                1225                1230
Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu Ile
        1235                1240                1245
Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala Arg
    1250                1255                1260
Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp Tyr
1265                1270                1275                1280
Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala Pro
                1285                1290                1295
Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu Ser
            1300                1305                1310
Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly Ser
        1315                1320                1325
Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro Asp
    1330                1335                1340
Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr Ser
1345                1350                1355                1360
Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp
                1365                1370                1375
Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val Cys
            1380                1385                1390
Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys Ala
        1395                1400                1405
Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu Leu
    1410                1415                1420
Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly Leu
1425                1430                1435                1440
Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp His
                1445                1450                1455
Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val Lys
            1460                1465                1470
Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro His
        1475                1480                1485
Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn Leu
    1490                1495                1500
Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu Leu
1505                1510                1515                1520
Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu
                1525                1530                1535
Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu
            1540                1545                1550
Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu
        1555                1560                1565
Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser Tyr
    1570                1575                1580
Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn Thr
1585                1590                1595                1600
Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys
                1605                1610                1615
Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser Ile
            1620                1625                1630
Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys Ser
        1635                1640                1645
Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly
    1650                1655                1660
Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr
1665                1670                1675                1680
Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala Cys
                1685                1690                1695
Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp Asp
            1700                1705                1710
Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala Ser
        1715                1720                1725
Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly
    1730                1735                1740
Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser
1745                1750                1755                1760
Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr Tyr
                1765                1770                1775
Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr
            1780                1785                1790
Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met Tyr
        1795                1800                1805
Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe Ser
    1810                1815                1820
Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln Ile
1825                1830                1835                1840
Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile Ile
                1845                1850                1855
Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro
            1860                1865                1870
Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val Pro
        1875                1880                1885
Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu
    1890                1895                1900
Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe Asn
1905                1910                1915                1920
Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala Ser
                1925                1930                1935
Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly Asp
            1940                1945                1950
Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu Cys
        1955                1960                1965
Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Ash Arg
    1970                1975                1980
<210>7
<211>4909
<212>DNA
<213>人工序列
<220>
<223>pV1J核酸
<400>7
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca     60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc     180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcagattgg     240
ctattggcca ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg     300
tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac     360
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg     420
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc     480
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac     540
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa     600
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac     660
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta     720
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga     780
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa     840
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag     900
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca     960
tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg gaacgcggat    1020
tccccgtgcc aagagtgacg taagtaccgc ctatagactc tataggcaca cccctttggc    1080
tcttatgcat gctatactgt ttttggcttg gggcctatac acccccgctt ccttatgcta    1140
taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc    1200
tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactatctc    1260
tattggctat atgccaatac tctgtccttc agagactgac acggactctg tatttttaca    1320
ggatggggtc ccatttatta tttacaaatt cacatataca acaacgccgt cccccgtgcc    1380
cgcagttttt attaaacata gcgtgggatc tccacgcgaa tctcgggtac gtgttccgga    1440
catgggctct tctccggtag cggcggagct tccacatccg agccctggtc ccatgcctcc    1500
agcggctcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac    1560
agcacaatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct    1620
gaaaatgagc gtggagattg ggctcgcacg gctgacgcag atggaagact taaggcagcg    1680
gcagaagaag atgcaggcag ctgagttgtt gtattctgat aagagtcaga ggtaactccc    1740
gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg    1800
cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc    1860
tgcagtcacc gtccttagat ctaggtacca gatatcagaa ttcagtcgac agcggccgcg    1920
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt    1980
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca    2040
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga    2100
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgctgcggc    2160
caggtgctga agaattgacc cggttcctcc tgggccagaa agaagcaggc acatcccctt    2220
ctctgtgaca caccctgtcc acgcccctgg ttcttagttc cagccccact cataggacac    2280
tcatagctca ggagggctcc gccttcaatc ccacccgcta aagtacttgg agcggtctct    2340
ccctccctca tcagcccacc aaaccaaacc tagcctccaa gagtgggaag aaattaaagc    2400
aagataggct attaagtgca gagggagaga aaatgcctcc aacatgtgag gaagtaatga    2460
gagaaatcat agaatttctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    2520
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    2580
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    2640
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg    2700
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc    2760
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc    2820
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc    2880
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg    2940
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc    3000
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga    3060
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc    3120
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac    3180
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg    3240
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc    3300
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa    3360
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta    3420
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt    3480
tgcctgactc gggggggggg ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc    3540
ataccaggcc tgaatcgccc catcatccag ccagaaagtg agggagccac ggttgatgag    3600
agctttgttg taggtggacc agttggtgat tttgaacttt tgctttgcca cggaacggtc    3660
tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca gcaaaagttc gatttattca    3720
acaaagccgc cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc    3780
aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt catatcagga    3840
ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg    3900
cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca    3960
atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga    4020
gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca gacttgttca    4080
acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt    4140
cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca attacaaaca    4200
ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa    4260
tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt ggtgagtaac    4320
catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc    4380
agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt    4440
ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt cgcacctgat    4500
tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt    4560
aatcgcggcc tcgagcaaga cgtttcccgt tgaatatggc tcataacacc ccttgtatta    4620
ctgtttatgt aagcagacag ttttattgtt catgatgata tatttttatc ttgtgcaatg    4680
taacatcaga gattttgaga cacaacgtgg ctttcccccc ccccccatta ttgaagcatt    4740
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa    4800
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt    4860
atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc                4909
<210>8
<211>35935
<212>DNA
<213>腺病毒血清型6
<400>8
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt      60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt     120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg     180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag     240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga     300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg     360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc     420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg     480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc     540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga     600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc     660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc     720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt     780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca     840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa     900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga     960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg    1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg    1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga    1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa    1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag    1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga    1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt    1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt    1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag    1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga    1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt    1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg    1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat    1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg    1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg    1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac    1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct    1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg    2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac    2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag    2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga    2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga    2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg    2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc    2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc    2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt    2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga    2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg    2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg    2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg    2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta    2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct    2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg    2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct    3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat    3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc    3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata    3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc    3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc    3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc    3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc    3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt    3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg    3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg    3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc    3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc    3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg    3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg    3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg    3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt    3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca    4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt    4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt    4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat    4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg    4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt    4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt    4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt    4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag    4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact    4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg    4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt    4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg    4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg    4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg    4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc    4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc    4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt    5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag    5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa    5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat    5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag    5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac    5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct    5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt    5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc    5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga    5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca    5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt    5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc    5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag    5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg    5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat    5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg    6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc    6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac    6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc    6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc    6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag    6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc    6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac    6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag    6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc    6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc    6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc    6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga    6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt    6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg    6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg    6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc    6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac    7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc    7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc    7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta    7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg    7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag    7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt    7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc    7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt    7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta    7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt    7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt    7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa    7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg    7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag    7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc    7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg    7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg    8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc    8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg    8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc    8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac    8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac    8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg    8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata    8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg    8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc    8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg    8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg    8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag    8760
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg    8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc    8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg    8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc    9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc    9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag    9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc    9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc     9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga     9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct     9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg     9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc     9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc     9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc     9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg     9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag     9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg     9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg     9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg     9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct     9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg    10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc    10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc    10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg    10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc    10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa    10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc    10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg    10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg    10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg    10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg    10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt    10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc    10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg    10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa    10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc    10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc    10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc    11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag    11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg    11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg    11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag    11280
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac    11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca    11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag    11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta    11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac    11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt    11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata    11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc    11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc    11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag    11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc    11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt    12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac    12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag    12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg    12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc    12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg    12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc    12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca    12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct    12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg    12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct    12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg    12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg    12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc    12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga    12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag    12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc    12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt    13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag    13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt    13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg    13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa    13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc    13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca    13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg    13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg    13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca    13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc    13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag    13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta    13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc    13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga    13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag    13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg    13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg    14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata    14100
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg    14160
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc    14220
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc    14280
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc    14340
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct    14400
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag    14460
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga    14520
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa    14580
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa    14640
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga    14700
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct    14760
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt    14820
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt    14880
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg    14940
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa    15000
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca    15060
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa    15120
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga    15180
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc    15240
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct    15300
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca    15360
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg    15420
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc    15480
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt    15540
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta    15600
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa    15660
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc    15720
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac    15780
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc    15840
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag    15900
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg    15960
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa    16020
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc    16080
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt    16140
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg    16200
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc    16260
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt    16320
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc    16380
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg    16440
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc    16500
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat    16560
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga    16620
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga    16680
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg    16740
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg    16800
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct    16860
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat    16920
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca    16980
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg    17040
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt    17100
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca    17160
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac    17220
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt    17280
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca    17340
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta    17400
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc    17460
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac    17520
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg    17580
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag    17640
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg    17700
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg    17760
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat    17820
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc    17880
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg    17940
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta    18000
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg    18060
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc    18120
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga    18180
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg    18240
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc    18300
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg    18360
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa    18420
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc    18480
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa    18540
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg    18600
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat    18660
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg    18720
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc    18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa    18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc    18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag    18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg    19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta    19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta    19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc    19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac    19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca    19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac    19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt    19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc    19500
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc    19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag    19620
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt    19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat    19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat    19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa    19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga    19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag    19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat    20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt    20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga    20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat    20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta    20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac    20340
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct    20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa    20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat    20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac    20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga    20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt    20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga    20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc    20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt    20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac    20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa    21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc    21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa    21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg    21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc    21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct    21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca    21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac    21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat    21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc    21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt    21600
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta    21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca    21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt    21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac    21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg    21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct    21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc    22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg    22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg    22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc    22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc    22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact    22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc    22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc    22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg    22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg    22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat    22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg    22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag    22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc    22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc    22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc    22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg    22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag    23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc    23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt    23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc    23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg    23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc    23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact    23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc    23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg    23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc    23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg    23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct    23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa    23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc    23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg    23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg    23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg    24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc    24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc    24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag    24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca    24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc    24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag    24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc    24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc    24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta    24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc    24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct    24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc    24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct    24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc    24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc    24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa    24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg    25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc    25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag    25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac    25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa    25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt    25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag    25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg    25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg    25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt    25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc    25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt    25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac    25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc    25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg    25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct    25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac    25980
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt    26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg    26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc    26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct    26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga    26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt    26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca    26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact    26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa    26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg    26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg    26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg    26700
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca    26760
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg    26820
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg    26880
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag    26940
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc    27000
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat    27060
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac    27120
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca    27180
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag    27240
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc    27300
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca    27360
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa    27420
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta    27480
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta    27540
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct    27600
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca    27660
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca    27720
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg    27780
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg    27840
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg    27900
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat    27960
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc    28020
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg    28080
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt    28140
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat    28200
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct    28260
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt    28320
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc    28380
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa    28440
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag    28500
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag    28560
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg    28620
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg    28680
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt    28740
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg    28800
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact    28860
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc    28920
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt    28980
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac    29040
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac    29100
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta    29160
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt    29220
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt    29280
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat    29340
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt    29400
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca    29460
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct    29520
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat    29580
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg    29640
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg    29700
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct    29760
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg    29820
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc    29880
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca    29940
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc    30000
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat    30060
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc    30120
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag    30180
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat    30240
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa    30300
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca    30360
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac    30420
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg    30480
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc    30540
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt    30600
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct    30660
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca    30720
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg    30780
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat    30840
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta    30900
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca    30960
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc    31020
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc    31080
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt    31140
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa    31200
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac    31260
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc    31320
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact    31380
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc    31440
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca    31500
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt    31560
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa    31620
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta    31680
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact    31740
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt    31800
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt    31860
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata    31920
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca    31980
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct    32040
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac    32100
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg    32160
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac    32220
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta    32280
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt    32340
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa    32400
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg    32460
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac    32520
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa    32580
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc    32640
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca    32700
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac    32760
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat    32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca    32880
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc    32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat    33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc    33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct    33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg    33180
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg    33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat    33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg    33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac    33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac    33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa    33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca    33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac    33660
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca    33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca    33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg    33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact    33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt    33960
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga    34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt    34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct    34140
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc    34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg    34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag    34320
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca    34380
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc    34440
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc    34500
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt    34560
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta    34620
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc    34680
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa    34740
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca    34800
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct    34860
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag    34920
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa    34980
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg    35040
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg    35100
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc    35160
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac    35220
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg    35280
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag    35340
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc    35400
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc    35460
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag    35520
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg    35580
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg    35640
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac    35700
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt    35760
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact    35820
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc    35880
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg         35935
<210>9
<211>35935
<212>DNA
<213>腺病毒血清型5
<400>9
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt      60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt     120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg     180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag     240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga     300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg     360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc     420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg     480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc     540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga     600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc     660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc     720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt     780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca     840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa     900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga     960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg    1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg    1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga    1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa    1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag    1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga    1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt    1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt    1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag    1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga    1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt    1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg    1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat    1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg    1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg    1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac    1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct    1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg    2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac    2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag    2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga    2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga    2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg    2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc    2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc    2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt    2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga    2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg    2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg    2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg    2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta    2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct    2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg    2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct    3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat    3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc    3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata    3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc    3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc    3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc    3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc    3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt    3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg    3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg    3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc    3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc    3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg    3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg    3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg    3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt    3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca    4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt    4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt    4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat    4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg    4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt    4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt    4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt    4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag    4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact    4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg    4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt    4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg    4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg    4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg    4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc    4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc    4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt    5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag    5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa    5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat    5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag    5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac    5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct    5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt    5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc    5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga    5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca    5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt    5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc    5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag    5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg    5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat    5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg    6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc    6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac    6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc    6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc    6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag    6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc    6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac    6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag    6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc    6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc    6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc    6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga    6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt    6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg    6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg    6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc    6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac    7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc    7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc    7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta    7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg    7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag     7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt     7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc     7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt     7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta     7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt     7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt     7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa     7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg     7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag     7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc     7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg     7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg     8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc     8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg     8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc     8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac     8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac     8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg     8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata     8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg     8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc     8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg     8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg     8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag     8760
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg     8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc     8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg     8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc     9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc     9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag     9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc     9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc     9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga     9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct     9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg     9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc     9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc     9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc     9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg     9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag     9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg     9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg     9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg     9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct     9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg    10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc    10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc    10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg    10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc    10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa    10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc    10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg    10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg    10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg    10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg    10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt    10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc    10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg    10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa    10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc    10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc    10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc    11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag    11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg    11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg    11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag    11280
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac    11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca    11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag    11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta    11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac    11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt    11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata    11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc    11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc    11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag    11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc    11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt    12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac    12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag    12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg    12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc    12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg    12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc    12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca    12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct    12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg    12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct    12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg    12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg    12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc    12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga    12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag    12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc    12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt    13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag    13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt    13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg    13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa    13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc    13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca    13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg    13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg    13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca    13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc    13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag    13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta    13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc    13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga    13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag    13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg    13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg    14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata    14100
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg    14160
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc    14220
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc    14280
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc    14340
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct    14400
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag    14460
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga    14520
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa    14580
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa    14640
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga    14700
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct    14760
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt    14820
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt    14880
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg    14940
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa    15000
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca    15060
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa    15120
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga    15180
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc    15240
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct    15300
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca    15360
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg    15420
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc    15480
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt    15540
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta    15600
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa    15660
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc    15720
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac    15780
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc    15840
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag    15900
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg    15960
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa    16020
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc    16080
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt    16140
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg    16200
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc    16260
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt    16320
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc    16380
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg    16440
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc    16500
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat    16560
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga    16620
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga    16680
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg    16740
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg    16800
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct    16860
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat    16920
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca    16980
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg    17040
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt    17100
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca    17160
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac    17220
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt    17280
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca    17340
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta    17400
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc    17460
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac    17520
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg    17580
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag    17640
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg    17700
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg    17760
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat    17820
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc    17880
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg    17940
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta    18000
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg    18060
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc    18120
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga    18180
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg    18240
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc    18300
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg    18360
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa    18420
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc    18480
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa    18540
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg    18600
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat    18660
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg    18720
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc    18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa    18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc    18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag    18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg    19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta    19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta    19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc    19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac    19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca    19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac    19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt    19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc    19500
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc    19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag    19620
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt    19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat    19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat    19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa    19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga    19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag    19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat    20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt    20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga    20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat    20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta    20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac    20340
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct    20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa    20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat    20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac    20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga    20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt    20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga    20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc    20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt    20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac    20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa    21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc    21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa    21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg    21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc    21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct    21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca    21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac    21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat    21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc    21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt    21600
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta    21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca    21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt    21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac    21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg    21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct    21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc    22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg    22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg    22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc    22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc    22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact    22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc    22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc    22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg    22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg    22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat    22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg    22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag    22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc    22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc    22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc    22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg    22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag    23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc    23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt    23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc    23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg    23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc    23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact    23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc    23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg    23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc    23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg    23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct    23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa    23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc    23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg    23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg    23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg    24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc    24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc    24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag    24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca    24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc    24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag    24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc    24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc    24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta    24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc    24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct    24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc    24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct    24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc    24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc    24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa    24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg    25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc    25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag    25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac    25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa    25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt    25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag    25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg    25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg    25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt    25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc    25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt    25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac    25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc    25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg    25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct    25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac    25980
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt    26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg    26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc    26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct    26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga    26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt    26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca    26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact    26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa    26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg    26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg    26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg    26700
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca    26760
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg    26820
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg    26880
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag    26940
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc    27000
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat    27060
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac    27120
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca    27180
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag    27240
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc    27300
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca    27360
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa    27420
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta    27480
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta    27540
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct    27600
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca    27660
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca    27720
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg    27780
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg    27840
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg    27900
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat    27960
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc    28020
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg    28080
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt    28140
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat    28200
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct    28260
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt    28320
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc    28380
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa    28440
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag    28500
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag    28560
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg    28620
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg    28680
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt    28740
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg    28800
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact    28860
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc    28920
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt    28980
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac    29040
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac    29100
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta    29160
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt    29220
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt    29280
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat    29340
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt    29400
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca    29460
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct    29520
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat    29580
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg    29640
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg    29700
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct    29760
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg    29820
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc    29880
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca    29940
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc    30000
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat    30060
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc    30120
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag    30180
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat    30240
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa    30300
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca    30360
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac    30420
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg    30480
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc    30540
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt    30600
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct    30660
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca    30720
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg    30780
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat    30840
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta    30900
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca    30960
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc    31020
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc    31080
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt    31140
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa    31200
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac    31260
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc    31320
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact    31380
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc    31440
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca    31500
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt    31560
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa    31620
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta    31680
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact    31740
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt    31800
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt    31860
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata    31920
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca    31980
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct    32040
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac    32100
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg    32160
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac    32220
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta    32280
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt    32340
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa    32400
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg    32460
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac    32520
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa    32580
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc    32640
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca    32700
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac    32760
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat    32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca    32880
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc    32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat    33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc    33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct    33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg    33180
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg    33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat    33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg    33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac    33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac    33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa    33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca    33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac    33660
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca    33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca    33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg    33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact    33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt    33960
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga    34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt    34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct    34140
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc    34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg    34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag    34320
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca    34380
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc    34440
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc    34500
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt    34560
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta    34620
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc    34680
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa    34740
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca    34800
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct    34860
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag    34920
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa    34980
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg    35040
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg    35100
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc    35160
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac    35220
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg    35280
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag    35340
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc    35400
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc    35460
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag    35520
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg    35580
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg    35640
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac    35700
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt    35760
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact    35820
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc    35880
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg         35935
<210>10
<211>5965
<212>DNA
<213>人工序列
<220>
<223>NSsuboptmut
<400>10
gccaccatgg cccccatcac cgcctacagc cagcagacca ggggcctgct gggctgcatc      60
atcaccagcc tgaccggacg cgacaagaac caggtggagg gagaggtgca ggtggtgagc     120
accgctaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac     180
ggagccggaa gcaagaccct ggccggaccc aagggcccta tcacccagat gtacaccaat     240
gtggatcagg atctggtggg ctggcaggcc cctcccggag ccaggagcct gacaccctgt     300
acctgtggaa gcagcgacct gtacctggtg acacgccacg ccgatgtgat ccccgtgagg     360
cgcaggggcg attctcgcgg aagcctgctg agccctaggc ccgtgagcta cctgaagggc     420
agcagcggag gacccctgct gtgtccttct ggccatgccg tgggcatttt tcgcgctgcc     480
gtgtgtacca ggggcgtggc caaagccgtg gattttgtgc ccgtggaaag catggagacc     540
accatgcgca gccctgtgtt caccgacaac agctctcccc ctgccgtgcc ccaatcattc     600
caggtggctc acctgcacgc ccctaccgga tctggcaaga gcaccaaggt gcccgctgcc     660
tacgccgctc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc taccctgggc     720
ttcggcgctt acatgagcaa ggcccatggc atcgacccca acatccgcac aggcgtgcgc     780
accatcacca ccggagctcc cgtgacctac agcacctacg gcaagttcct ggccgatgga     840
ggctgcagcg gaggagccta cgacatcatc atctgcgacg agtgccacag caccgacagc     900
accaccatcc tgggcattgg caccgtgctg gatcaggccg aaacagctgg agccaggctg     960
gtggtgctgg ccacagctac ccctcctggc agcgtgaccg tgccccatcc caatatcgag    1020
gaggtggccc tgagcaacac aggcgagatc cccttctacg gcaaggccat ccccatcgag    1080
gccatccgcg gaggcaggca cctgatcttc tgccacagca agaagaagtg cgacgagctg    1140
gctgccaagc tgagcggact gggcatcaac gccgtggcct actacagggg cctggacgtg    1200
tcagtgatcc ccaccatcgg cgatgtggtg gtggtggcca ccgacgccct gatgacaggc    1260
tacaccggag acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320
ttcagcctgg accccacctt caccatcgaa accaccaccg tgcctcagga tgctgtgagc    1380
aggagccaga ggcgcggacg caccggaagg ggcaggcgcg gaatttatcg ctttgtgacc    1440
cctggcgaaa ggccctctgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgct    1500
ggctgcgctt ggtacgagct gacacccgct gaaaccagcg tgcgcctgcg cgcttatctg    1560
aatacccctg gcctgcccgt gtgtcaggac cacctggagt tctgggagag cgtgttcaca    1620
ggactgaccc acatcgacgc ccatttcctg agccagacca agcaggctgg cgacaacttc    1680
ccctatctgg tggcctatca ggccaccgtg tgtgctaggg cccaagctcc acctccttca    1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccctacccct    1800
ctgctgtacc gcctgggagc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860
tacatcatgg cctgcatgag cgctgatctg gaagtggtga ccagcacctg ggtgctggtg    1920
ggaggcgtgc tggccgctct ggctgcctac tgcctgacca ccggaagcgt ggtgatcgtg    1980
ggacgcatca tcctgagcgg aaggcccgct atcgtgcccg atcgcgagtt cctgtaccag    2040
gagttcgacg agatggagga gtgtgccagc cacctgccct acatcgagca gggcatgcag    2100
ctggccgaac agttcaagca gaaggccctg ggcctgctgc agacagccac caaacaggcc    2160
gaagctgccg ctcccgtggt ggaaagcaag tggagggccc tggagacctt ctgggctaag    2220
cacatgtgga acttcatctc tggcatccag tacctggccg gactgagcac cctgcctggc    2280
aaccccgcta tcgccagcct gatggccttc accgctagca tcacctctcc cctgaccacc    2340
cagagcaccc tgctgttcaa cattctgggc ggatgggtgg ccgctcagct ggcccctcct    2400
tcagctgctt ctgcctttgt gggcgctggc attgccggag ccgctgtggg cagcattggc    2460
ctgggcaaag tgctggtgga tattctggct ggctatggcg ctggcgtggc cggagccctg    2520
gtggccttca aggtgatgag cggagagatg cccagcaccg aggacctggt gaacctgctg    2580
cctgccattc tgagccctgg agccctggtg gtgggcgtgg tgtgtgctgc cattctgagg    2640
cgccatgtgg gacccggaga gggcgctgtg cagtggatga accgcctgat cgccttcgcc    2700
tctcgcggaa accacgtgag ccctacccac tacgtgcctg agagcgacgc cgctgccagg    2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820
atcaacgagg actgcagcac accctgcagc ggaagctggc tgagggacgt gtgggactgg    2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccaactg    2940
cctggcgtgc ccttcttctc atgccagcgc ggatacaagg gcgtgtggag gggcgatggc    3000
atcatgcaga ccacctgtcc ctgcggagcc cagatcacag gccacgtgaa gaacggcagc    3060
atgcgcatcg tgggccctaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120
gcctacacca ccggaccctg cacacccagc cctgctccca actacagcag ggccctgtgg    3180
agggtggctg ccgaggagta cgtggaggtg accagggtgg gagacttcca ctacgtgacc    3240
ggaatgacca ccgacaacgt gaagtgtccc tgtcaggtgc ccgctcccga attttttacc    3300
gaagtggatg gcgtgcgcct gcatcgctat gcccctgcct gtaggcccct gctgcgcgaa    3360
gaagtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420
cctgagcccg atgtggccgt gctgaccagc atgctgaccg accccagcca catcacagcc    3480
gaaaccgcta aaaggcgcct ggccaggggc tctcctccaa gcctggcctc aagcagcgct    3540
agccagctgt ctgctcccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct    3780
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac    3840
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct    3900
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct    3960
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga    4020
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag    4080
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc    4140
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac    4200
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac    4260
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct    4320
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgctc gcctgatcgt gttccccgat    4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgcctcag    4740
gtggtgatgg gctcaagcta cggcttccag tacagccctg gccagcgcgt ggagttcctg    4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac acgctgcttc    4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac    4920
ctggcccctg aggccaggca ggccatcaag agcctgaccg agcgcctgta catcggaggc    4980
cctctgacca acagcaaggg acagaactgc ggatacaggc gctgtagggc ctctggcgtg    5040
ctgaccacca gctgtggcaa caccctgacc tgctacctga aggccagcgc tgcctgtcgc    5100
gctgccaagc tgcaggactg caccatgctg gtgaacgccg ctggcctggt ggtgatttgt    5160
gaaagcgctg gcacccagga agatgctgcc agcctgcgcg tgttcaccga ggccatgacc    5220
aggtactctg cccctcccgg agacccccct cagcccgaat acgacctgga gctgatcacc    5280
agctgctcaa gcaacgtgag cgtggctcac gacgccagcg gaaagcgcgt gtactacctg    5340
acacgcgatc ccaccacccc tctggctcgc gctgcctggg aaaccgctcg ccatacaccc    5400
gtgaacagct ggctgggcaa catcatcatg tacgccccta ccctgtgggc tcgcatgatc    5460
ctgatgaccc acttcttcag catcctgctg gctcaggagc agctggagaa ggccctggac    5520
tgccagattt acggcgcttg ctacagcatc gagcccctgg acctgcccca aatcatcgag    5580
cgcctgcacg gcctgtctgc cttcagcctg cacagctaca gccctggcga aattaatcgc    5640
gtggccagct gtctgcgcaa actgggcgtg cctcctctgc gcgtgtggag gcatagggct    5700
aggagcgtga gggctaggct gctgagccag ggaggcaggg ccgctacctg tggaaagtac    5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ctatccctgc cgctagccag    5820
ctggacctga gcggatggtt cgtggctggc tacagcggag gcgacatcta ccacagcctg    5880
tctcgcgctc gccctcgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc    5940
atctacctgc tgcccaaccg ctaaa                                          5965
<210>11
<211>5965
<212>DNA
<213>人工序列
<220>
<223>嵌合NSsuboptmut
<400>11
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc      60
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc     120
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac     180
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac     240
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc     300
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc     360
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc     420
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc     480
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc     540
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc     600
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc     660
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc     720
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc     780
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc     840
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc     900
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg     960
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag    1020
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag    1080
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg    1140
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg    1200
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc    1260
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc    1380
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc    1440
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc    1500
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg    1560
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc    1620
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc    1680
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc    1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc    1800
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg    1920
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg    1980
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag    2040
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag    2100
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc    2160
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag    2220
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc    2280
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc    2340
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc    2400
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc    2460
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg    2520
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg    2580
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc    2640
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc    2700
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc    2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg    2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg    2940
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc    3000
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc    3060
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg    3180
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc    3240
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc    3300
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag    3360
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc    3480
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc    3540
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct    3780
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac    3840
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct    3900
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct    3960
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga    4020
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag    4080
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc    4140
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac    4200
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac    4260
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct    4320
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac    4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag    4740
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg    4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc    4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac    4920
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc    4980
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg    5040
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc    5100
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc    5160
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc    5220
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc    5280
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg    5340
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc    5400
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc    5460
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac    5520
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag    5580
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc    5640
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc    5700
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac    5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag    5820
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg    5880
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc    5940
atctacctgc tgcccaaccg ctaaa                                          5965
<210>12
<211>10
<212>RNA
<213>人工序列
<220>
<223>核糖体结合位点
<400>12
gccaccaugg                                                          10
<210>13
<211>49
<212>RNA
<213>人工序列
<220>
<223>合成的聚腺苷酸化信号
<400>13
aauaaaagau cuuuauuuuc auuagaucug uguguugguu uuuugugug                  49
<210>14
<211>28
<212>DNA
<213>人工序列
<220>
<223>pVIJns-NS中存在的其它核苷酸
<400>14
tctagagcgt ttaaaccctt aattaagg                                         28
<210>15
<211>15
<212>DNA
<213>人工序列
<220>
<223>Additional nucleotides present in pV1Jns-NSOPTmut
<400>15
tttaaatgtt taaac                                                       15
<210>16
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>16
tcgaatcgat acgcgaacct acgc                                             24
<210>17
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>17
tcgacgtgtc gacttcgaag cgcacaccaa aaacgtc                               37

Claims (59)

1.一种核酸,包括编码基本上相似于SEQ ID NO:1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸序列,前提是所述多肽具有足够的蛋白酶活性对它自身进行加工,以便产生NS 5B蛋白,并且所述NS5B蛋白是无酶促活性的。
2.如权利要求1的核酸,其中,所述核苷酸序列基本上相似于SEQID NO:2的编码序列。
3.如权利要求1的核酸,其中,所述核酸序列编码SEQ ID NO:1的多肽。
4.如权利要求3的核酸,其中,所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11的编码序列。
5.如权利要求3的核酸,其中,所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3的编码序列。
6.如权利要求1-5中任意一项的核酸,其中,所述核酸是能够在人细胞中由所述核苷酸序列表达所述多肽的表达载体。
7.一种核酸,包括能够在人细胞中表达相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒,前提是所述多肽能够对它自身进行加工,以便产生无酶促活性的NS5B蛋白,所述基因表达盒包括:
a)与编码所述多肽的核苷酸序列转录性偶联的激发子;
b)与所述核苷酸序列功能性偶联的5′核糖体结合位点;
c)与所述核苷酸序列的3′末端连接的终止子;和
d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。
8.如权利要求7的核酸,其中,所述核苷酸序列基本上相似于SEQID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11。
9.如权利要求8的核酸,其中,所述核酸是一种穿梭载体,它还包括选择标记,复制起点,位于所述表达盒侧翼的第一腺病毒同源区,和第二腺病毒同源区,其中,所述第一同源区具有至少大约100个碱基对基本上与野生型腺病毒从大约碱基对1-425的区域的右侧末端同源,而所述第二同源区具有至少大约100个碱基对基本上与Ad5的从大约碱基对3511-5792的野生型腺病毒区或另一种腺病毒的相应区的至少左侧末端同源。
10.如权利要求9的核酸,其中,所述核苷酸序列编码SEQ ID NO:1的多肽。
11.如权利要求9的核酸,其中,所述核苷酸序列是SEQ ID NO:2。
12.如权利要求9的核酸,其中,所述核酸序列是SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11。
13.如权利要求8的核酸,其中,所述核酸是适合给人施用的质粒,并且还包括原核复制起点和编码一种选择标记的基因。
14.如权利要求13的核酸,其中,所述核苷酸序列编码SEQ ID NO:1的多肽。
15.如权利要求14的核酸,其中,所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11的编码序列。
16.如权利要求14的核酸,其中,所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3的编码序列。
17.如权利要求14的核酸,其中,所述激发子是人立即早期巨细胞激发子(内含子A),所述5’核糖体结合位点包括SEQ ID NO:12,并且所述3’聚腺苷酸化是牛生长激素(BGH)聚腺苷酸化信号。
18.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它包括选择标记,复制起点,和包括E1缺失,E3缺失,和所述表达盒的重组腺病毒载体基因组。
19.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它包括选择标记,复制起点,和
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548的第二腺病毒区或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
20.如权利要求19的核酸,其中,所述第一区相当于Ad5,所述第二区相当于Ad5,所述第三区相当于Ad5,所述第四区相当于Ad5,并且所述第五区相当于Ad5。
21.如权利要求20的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸是BGH聚腺苷酸化信号。
22.如权利要求21的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ IDNO:10或SEQ ID NO:11。
23.如权利要求19的核酸,其中,所述第一区相当于Ad5或Ad6,所述第二区相当于Ad5或Ad6,所述第三区相当于Ad6,所述第四区相当于Ad5,并且所述第五区相当于Ad5或Ad6。
24.如权利要求23的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸化是BGH聚腺苷酸化信号。
25.如权利要求24的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ IDNO:10或SEQ ID NO:11。
26.如权利要求24的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3。
27.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它包括复制起点,选择标记,和
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对3 3966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
28.如权利要求27的核酸,其中,所述第一区相当于Ad5,所述第二区相当于Ad5,所述第三区相当于Ad5,所述第四区相当于Ad5,所述第五区相当于Ad5。
29.如权利要求28的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸化是BGH聚腺苷酸化信号。
30.如权利要求27的核酸,其中,所述第一区相当于Ad5或Ad6,所述第二区相当于Ad5或Ad6,所述第三区相当于Ad6,所述第四区相当于Ad6,所述第五区相当于Ad5或Ad6。
31.如权利要求30的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸化是BGH聚腺苷酸化信号。
32.如权利要求8的核酸,其中,所述核酸是包括基本上相似于SEQ ID NO:4或它的衍生物的核苷酸序列的腺病毒载体,其中,所述衍生物具有存在于SEQ ID NO:4中的HCV多蛋白编码序列,该序列被SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11的HCV多蛋白编码序列所取代。
33.如权利要求8的核酸,其中,所述核酸是具有包括E1缺失,E3缺失,和所述表达盒的腺病毒载体基因组的腺病毒载体。
34.如权利要求8的核酸,其中,所述核酸是腺病毒载体,它包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述第一区连妆的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
35.如权利要求34的核酸,其中,所述第一区相当于Ad5,所述第二区相当于Ad5,所述第三区相当于Ad5,所述第四区相当于Ad5,所述第五区相当于Ad5。
36.如权利要求35的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸化是BGH聚腺苷酸化信号。
37.如权利要求36的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ IDNO:10或SEQ ID NO:11。
38.如权利要求34的核酸,其中,所述第一区相当于Ad5或Ad6,所述第二区相当于Ad5或Ad6,所述第三区相当于Ad6,所述第四区相当于Ad6,所述第五区相当于Ad5或Ad6。
39.如权利要求37的核酸,其中,所述激发子是人立即早期巨细胞病毒激发子,所述5′核糖体结合位点包括SEQ ID NO:12,并且所述3′聚腺苷酸化是BGH聚腺苷酸化信号。
40.如权利要求39的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ IDNO:10或SEQ ID NO:11。
41.如权利要求39的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3。
42.如权利要求8的核酸,其中,所述核酸是腺病毒载体,它包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
43.如权利要求42的核酸,其中,所述第一区相当于Ad5,所述第二区相当于Ad5,所述第三区相当于Ad5,所述第四区相当于Ad5,所述第五区相当于Ad5。
44.如权利要求42的核酸,其中,所述第一区相当于Ad5或Ad6,所述第二区相当于Ad5或Ad6,所述第三区相当于Ad6,所述第四区相当于Ad6,所述第五区相当于Ad5或Ad6。
45.一种包括SEQ ID NO:4或它的衍生物的核酸序列的腺病毒载体,其中,所述衍生物具有存在于SEQ ID NO:4中的HCV多蛋白编码序列,该序列被SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11的HCV多蛋白编码序列所取代。
46.通过一种方法生产的腺病毒载体,该方法包括以下步骤:
a)通过权利要求9的穿梭载体和一种核酸之间的同源重组,生产腺病毒基因组质粒,所述核酸包括以下成分:
从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;和
b)从所述腺病毒质粒中回收所述腺病毒载体。
47.一种培养的重组细胞,包括权利要求6的核酸。
48.一种培养的重组细胞,包括权利要求9-46中任意一项的核酸。
49.一种生产腺病毒载体方法,该方法包括以下步骤:
a)通过权利要求9的核酸和一种核酸之间的同源重组,生产腺病毒基因组质粒,所述核酸包括以下成分:
从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548的第二腺病毒区或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;和
b)从所述重组腺病毒质粒中回收所述重组腺病毒载体。
50.一种药物组合物,包括权利要求13-17,32-46中任意一项的核酸,以及可以药用的载体。
51.一种治疗患者的方法,包括给所述患者施用有效量的如权利要求13-17和32-46中任意一项的核酸的步骤。
52.如权利要求51的方法,其中,所述患者是人。
53.如权利要求52的方法,其中,所述患者没有感染HCV。
54.如权利要求52的方法,其中,所述患者感染了HCV。
55.一种重组核酸,包括一个或多个Ad6区和一个不存在于Ad6中的区,其中,至少一个Ad6区选自:E1A,E1B,E2B,E2A,E4,L1,L2,L4和L5。
56.如权利要求55的重组核酸,其中,所述不存在于Ad6中的区是编码不存在于Ad6中的多肽的表达盒。
57.如权利要求56的重组核酸,其中,所述重组核酸是至少缺乏E1的腺病毒载体,在补充反式E1时该载体能够复制。
58.如权利要求57的重组核酸,其中,所述载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或相当于Ad6的从大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对28134到大约碱基对30817或从相当于Ad6的大约碱基对28157到大约碱基对30788的任选存在的第四区;
f)从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第五腺病毒区,其中,如果存在第四区,所述第五区与所述第四区连接,或如果不存在所述第四区,所述第五区与第三区连接;和
g)与所述第五区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第六腺病毒区;
其前提是,所述第二,第三,和第五区中的至少一个来自Ad6。
59.如权利要求57的重组核酸,其中,所述载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;
其前提是,所述第二,第三,和第四区中的至少一个来自Ad6。
CN028246659A 2001-10-11 2002-10-10 丙型肝炎病毒疫苗 Expired - Lifetime CN1582337B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US32865501P 2001-10-11 2001-10-11
US60/328,655 2001-10-11
US36377402P 2002-03-13 2002-03-13
US60/363,774 2002-03-13
PCT/US2002/032512 WO2003031588A2 (en) 2001-10-11 2002-10-10 Hepatitis c virus vaccine

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN200910251298.2A Division CN101988071B (zh) 2001-10-11 2002-10-10 丙型肝炎病毒疫苗
CN2006100778047A Division CN1880457B (zh) 2001-10-11 2002-10-10 Ad6重组核酸

Publications (2)

Publication Number Publication Date
CN1582337A true CN1582337A (zh) 2005-02-16
CN1582337B CN1582337B (zh) 2011-12-14

Family

ID=42828995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN028246659A Expired - Lifetime CN1582337B (zh) 2001-10-11 2002-10-10 丙型肝炎病毒疫苗

Country Status (9)

Country Link
US (3) US7598362B2 (zh)
EP (1) EP1436397B1 (zh)
JP (1) JP4475561B2 (zh)
CN (1) CN1582337B (zh)
AT (1) ATE467680T1 (zh)
AU (1) AU2002337840B2 (zh)
CA (1) CA2461380C (zh)
DK (1) DK1436397T3 (zh)
WO (1) WO2003031588A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1887350B (zh) * 2005-06-28 2010-10-06 深圳市源兴生物医药科技有限公司 一种重组疫苗及其用途
CN102645534A (zh) * 2012-04-26 2012-08-22 杭州市萧山区第一人民医院 基于量子点编码微球芯片检测丙型肝炎病毒的方法
CN108277230A (zh) * 2018-02-07 2018-07-13 华中科技大学 一种融合dna及其制备的疫苗

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1236801A (en) 1999-10-27 2001-05-08 Chiron Corporation Activation of hcv-specific t cells
US6680059B2 (en) 2000-08-29 2004-01-20 Tripep Ab Vaccines containing ribavirin and methods of use thereof
ATE375804T1 (de) 2000-08-17 2007-11-15 Tripep Ab Ribavirin-enthaltende vakzine
US6858590B2 (en) 2000-08-17 2005-02-22 Tripep Ab Vaccines containing ribavirin and methods of use thereof
US7022830B2 (en) * 2000-08-17 2006-04-04 Tripep Ab Hepatitis C virus codon optimized non-structural NS3/4A fusion gene
US7598362B2 (en) * 2001-10-11 2009-10-06 Merck & Co., Inc. Hepatitis C virus vaccine
ES2344253T3 (es) * 2001-10-11 2010-08-23 MERCK SHARP &amp; DOHME CORP. Vacuna contra el virus de la hepatitis c.
EP1809753A1 (en) * 2004-11-02 2007-07-25 Istituto di Richerche di Biologia Molecolare P. Angeletti S.p.A. Adenoviral amplicon and producer cells for the production of replication-defective adenoviral vectors, methods of preparation and use thereof
WO2006086188A2 (en) * 2005-01-31 2006-08-17 The Johns Hopkins University Use of consensus sequence as vaccine antigen to enhance recognition of virulent viral variants
US7951531B2 (en) * 2005-02-17 2011-05-31 University Of Iowa Research Foundation Flavivirus NS5A proteins for the treatment of HIV
DE102005015005A1 (de) * 2005-04-01 2006-10-05 Qiagen Gmbh Verfahren zur Behandlung einer Biomoleküle enthaltenden Probe
CA2618429A1 (en) 2005-05-25 2007-03-22 Tripep Ab A hepatitis c virus non-structural ns3/4a fusion gene
CA2610919C (en) * 2005-06-17 2013-09-10 Istituto Di Ricerche Di Biologia Molecolare P. Angeletti S.P.A. Hepatitis c virus nucleic acid vaccine
CN104984352A (zh) * 2005-11-21 2015-10-21 圣诺菲·帕斯图尔有限公司 重组病毒的稳定制剂
RU2473691C2 (ru) * 2006-10-12 2013-01-27 Институто Ди Ричерке Ди Биолоджиа Молеколаре П.Анджелетти Спа Слитый белок теломеразной обратной транскриптазы, кодирующие его нуклеотиды и их применение
EP2117574A4 (en) 2007-01-24 2010-06-16 Merck Sharp & Dohme POLYPEPTIDES FOR INDUCING PROTECTIVE IMMUNE RESPONSE AGAINST STAPHYLOCOCCUS EPIDERMIDIS
EP2185195A2 (en) 2007-08-16 2010-05-19 Tripep Ab Immunogen platform
US20100310605A1 (en) * 2007-12-18 2010-12-09 Peking University People's Hospital anti-hcv vaccine and preparation methods and uses thereof
EP2313503A4 (en) * 2008-08-01 2014-01-08 Merck Sharp & Dohme Variant HCMV-PP65, IE1 and IE2 polynucleotides, and uses thereof
WO2010050939A1 (en) * 2008-10-29 2010-05-06 The Trustees Of The University Of Pennsylvania Improved hcv vaccines and methods for using the same
US8921536B2 (en) 2008-10-29 2014-12-30 The Trustees Of The University Of Pennsylvania HCV vaccines and methods for using the same
AU2009319946A1 (en) 2008-11-26 2010-06-03 Merck Sharp & Dohme Corp. Polypeptides for inducing a protective immune response against Staphylococcus aureus
US20110229508A1 (en) 2008-11-26 2011-09-22 Merck Sharp & Dohme Corp. Polypeptides for inducing a protective immune response against staphylococcus aureus
RU2604815C2 (ru) 2009-02-02 2016-12-10 ГлаксоСмитКлайн Байолоджикалз с.а. Нуклеинокислотные и аминокислотные последовательности аденовируса обезьян, векторы, содержащие указанные последовательности, и их применение
WO2014139587A1 (en) 2013-03-15 2014-09-18 Okairòs Ag Improved poxviral vaccines
WO2017025782A1 (en) 2014-09-17 2017-02-16 Glaxosmithkline Biologicals Sa Improved poxviral vaccines
US20180000926A1 (en) * 2015-01-15 2018-01-04 Babita Agrawal Methods of inducing an immune response to hepatitis c virus

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3584341D1 (de) 1984-08-24 1991-11-14 Upjohn Co Rekombinante dna-verbindungen und expression von polypeptiden wie tpa.
US5585362A (en) * 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US5747339A (en) 1990-06-25 1998-05-05 Research Foundation For Microbial Diseases Of Osaka Non-A, non-B hepatitis virus genomic CDNA and antigen polypeptide
EP0933426A1 (en) * 1990-06-25 1999-08-04 The Research Foundation for Microbial Diseases of Osaka University Non-a, non-b hepatitis virus genomic cdna fragments and antigen polypeptides
IT1270939B (it) 1993-05-11 1997-05-26 Angeletti P Ist Richerche Bio Procedimento per la preparazione di immunogeni e reagenti diagnostici,e immunogeni e reagenti diagnostici cosi' ottenibili.
US6140087A (en) * 1993-06-24 2000-10-31 Advec, Inc. Adenovirus vectors for gene therapy
IT1272179B (it) 1994-02-23 1997-06-16 Angeletti P Ist Richerche Bio Metodologia per riprodurre in vitro l'attivita' proteolitica della proteasi ns3 del virus hcv.
CA2117668C (en) * 1994-03-09 2005-08-09 Izumu Saito Recombinant adenovirus and process for producing the same
US5505947A (en) 1994-05-27 1996-04-09 The University Of North Carolina At Chapel Hill Attenuating mutations in Venezuelan Equine Encephalitis virus
US6127525A (en) * 1995-02-21 2000-10-03 Cornell Research Foundation, Inc. Chimeric adenoviral coat protein and methods of using same
US5792462A (en) 1995-05-23 1998-08-11 University Of North Carolina At Chapel Hill Alphavirus RNA replicon systems
IT1278077B1 (it) 1995-05-25 1997-11-17 Angeletti P Ist Richerche Bio Metodologia per riprodurre in vitro le attivita' di rna polimerasi rna-dipendente e di nucleotidiltransferasi terminale codificate dal
IL122614A0 (en) 1995-06-15 1998-08-16 Introgene Bv Packaging systems for human recombinant adenovirus to be used in gene therapy
US6127116A (en) * 1995-08-29 2000-10-03 Washington University Functional DNA clone for hepatitis C virus (HCV) and uses thereof
AU717542B2 (en) 1996-06-11 2000-03-30 Merck & Co., Inc. Synthetic hepatitis C genes
US7049428B1 (en) * 1998-03-04 2006-05-23 Washington University HCV variants
EA002087B1 (ru) 1997-04-03 2001-12-24 Электрофект Ас Способ введения фармацевтических препаратов и нуклеиновых кислот в скелетную мышцу
NZ500656A (en) 1997-05-12 2001-11-30 Tno Vector containing a nucleic acid insertion expressing a hybrid polypeptide with a protease inhibitor domain and a receptor binding domain
US6221646B1 (en) * 1997-07-31 2001-04-24 Chiron Corporation Materials and methods for simplified AAV production
KR20060057653A (ko) 1998-01-30 2006-05-26 더 제너럴 하스피탈 코포레이션 C형 간염 바이러스의 비구조 단백질을 이용한 유전자면역법
AU3489499A (en) 1998-04-14 1999-11-01 Merck & Co., Inc. Needleless administration of polynucleotide formulations
WO1999057296A1 (en) 1998-05-01 1999-11-11 Genzyme Corporation Partially deleted adenoviral vectors
GB9810756D0 (en) 1998-05-19 1998-07-15 Angeletti P Ist Richerche Bio Mimotopes of hypervariable region 1 of the e2 glycoprotein of hcv and uses thereof
US6156588A (en) 1998-06-23 2000-12-05 Vlsi Technology, Inc. Method of forming anti-fuse structure
AU5685799A (en) 1998-08-24 2000-03-14 Genzyme Corporation Cationic complexes of polymer-modified adenovirus
EP1141357A1 (en) 1999-01-14 2001-10-10 Novartis AG Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use
WO2001002607A1 (en) 1999-07-06 2001-01-11 Merck & Co., Inc. Adenovirus carrying gag gene hiv vaccine
US6627190B2 (en) * 1999-07-12 2003-09-30 Saint Louis University Recombinant adenovirus vectors that are replication-competent in tert-expressing cells
US6511832B1 (en) * 1999-10-06 2003-01-28 Texas A&M University System In vitro synthesis of capped and polyadenylated mRNAs using baculovirus RNA polymerase
AU1236801A (en) 1999-10-27 2001-05-08 Chiron Corporation Activation of hcv-specific t cells
CN1425027A (zh) 1999-11-24 2003-06-18 希龙公司 新颖的hcv非结构多肽
DK1233782T3 (da) 1999-12-01 2009-02-09 Novartis Vaccines & Diagnostic Fremkaldelse af HCV-specifikke antistoffer
US6544780B1 (en) * 2000-06-02 2003-04-08 Genphar, Inc. Adenovirus vector with multiple expression cassettes
AU9456201A (en) 2000-09-15 2002-03-26 Merck & Co Inc Enhanced first generation adenovirus vaccines expressing codon optimized hiv1-gag, pol, nef and modifications
US7598362B2 (en) * 2001-10-11 2009-10-06 Merck & Co., Inc. Hepatitis C virus vaccine

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1887350B (zh) * 2005-06-28 2010-10-06 深圳市源兴生物医药科技有限公司 一种重组疫苗及其用途
CN102645534A (zh) * 2012-04-26 2012-08-22 杭州市萧山区第一人民医院 基于量子点编码微球芯片检测丙型肝炎病毒的方法
CN108277230A (zh) * 2018-02-07 2018-07-13 华中科技大学 一种融合dna及其制备的疫苗

Also Published As

Publication number Publication date
US8530234B2 (en) 2013-09-10
JP2005505286A (ja) 2005-02-24
EP1436397A2 (en) 2004-07-14
CA2461380A1 (en) 2003-04-17
WO2003031588A3 (en) 2003-10-30
US8142794B2 (en) 2012-03-27
US20100129901A1 (en) 2010-05-27
CN1582337B (zh) 2011-12-14
US20040247615A1 (en) 2004-12-09
AU2002337840B2 (en) 2007-08-09
EP1436397B1 (en) 2010-05-12
CA2461380C (en) 2011-03-22
US20090233992A1 (en) 2009-09-17
US7598362B2 (en) 2009-10-06
JP4475561B2 (ja) 2010-06-09
EP1436397A4 (en) 2005-02-16
ATE467680T1 (de) 2010-05-15
WO2003031588A2 (en) 2003-04-17
DK1436397T3 (da) 2010-08-09

Similar Documents

Publication Publication Date Title
CA2461380C (en) Hepatitis c virus vaccine
US6733993B2 (en) Enhanced first generation adenovirus vaccines expressing codon optimized HIV1-gag, pol, nef and modifications
CN1993462A (zh) 腺病毒载体组合物
KR102471633B1 (ko) 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현
AU2002337840A1 (en) Hepatitis C virus vaccine
CN112805387A (zh) 用于制备病毒载体的组合物和方法
CN1913919A (zh) 基于hif多进化枝的env的hiv疫苗
KR20190128634A (ko) 다중 트랜스진 재조합 아데노바이러스
CN106459930B (zh) 表达reic基因的条件复制型腺病毒
AU2016333996A1 (en) Synthetic adenoviruses with tropism to damaged tissue for use in promoting wound repair and tissue regeneration
CN1972958B (zh) 应用腺病毒载体诱导免疫应答的方法
AU2003262790A1 (en) Adenovirus serotype 24 vectors, nucleic acids and virus produced thereby
US20040101957A1 (en) Enhanced first generation adenovirus vaccines expressing codon optimized hiv1-gag, pol.nef and modifications
CN116348136A (zh) 新型冠状病毒重组刺突蛋白、编码该重组刺突蛋白的多核苷酸、包含多核苷酸的载体以及包含载体的用于预防或治疗冠状病毒感染的疫苗
JP2006521089A (ja) アデノウイルス血清型34ベクター、核酸及びそれにより生産されるウイルス
CN1880457B (zh) Ad6重组核酸
RU2821989C1 (ru) Новый аденовирусный вектор, не включающий компетентный по репликации аденовирус, и его применение
CA2718802C (en) Recombinant nucleic acids comprising regions of ad6
AU2007231692B2 (en) Hepatitis C virus vaccine
KR20220106072A (ko) 복제가능 아데노바이러스를 포함하지 않는 신규 아데노바이러스 벡터 및 이의 용도

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20050216

CI01 Publication of corrected invention patent application

Correction item: Rejection of patent application

Correct: If the announcement is rejected, the announcement shall be cancelled

False: Rejection of patent application

Number: 32

Volume: 26

ERR Gazette correction

Free format text: CORRECT: PATENT APPLICATION DISMISSAL AFTER ANNOUNCEMENT; FROM: PATENT APPLICATION DISMISSAL AFTER ANNOUNCEMENT TO: ERROR OF REJECTED ANNOUNCEMENT, REJECTION AFTER ANNOUNCEMENT

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SCHERING CORP (US)

Free format text: FORMER OWNER: MSD CORP.

Effective date: 20131028

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee

Owner name: MSD CORP.

Free format text: FORMER NAME: SCHERING CORP (US)

CP01 Change in the name or title of a patent holder

Address after: New jersey, USA

Patentee after: MERCK SHARP & DOHME Corp.

Patentee after: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

Address before: New jersey, USA

Patentee before: SCHERING Corp.

Patentee before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

TR01 Transfer of patent right

Effective date of registration: 20131028

Address after: New jersey, USA

Patentee after: SCHERING Corp.

Patentee after: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

Address before: New jersey, USA

Patentee before: MERCK SHARP & DOHME Corp.

Patentee before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

ASS Succession or assignment of patent right

Owner name: MSD ITALY S. P. A.

Free format text: FORMER OWNER: ISTITUTO DI RICERCHE DI BIOLOGYIA MOLECOLARE P.ANGELETTI S.P.A

Effective date: 20140618

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140618

Address after: New jersey, USA

Patentee after: MERCK SHARP & DOHME Corp.

Patentee after: MSD Italia S.R.L.

Address before: New jersey, USA

Patentee before: MERCK SHARP & DOHME Corp.

Patentee before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

TR01 Transfer of patent right

Effective date of registration: 20220908

Address after: new jersey

Patentee after: MERCK SHARP & DOHME B.V.

Patentee after: MSD Italia S.R.L.

Address before: new jersey

Patentee before: MERCK SHARP & DOHME Corp.

Patentee before: MSD Italia S.R.L.

TR01 Transfer of patent right
CX01 Expiry of patent term

Granted publication date: 20111214

CX01 Expiry of patent term