CN112088015A - 人乳头瘤病毒疫苗及其用途 - Google Patents

人乳头瘤病毒疫苗及其用途 Download PDF

Info

Publication number
CN112088015A
CN112088015A CN201980030588.6A CN201980030588A CN112088015A CN 112088015 A CN112088015 A CN 112088015A CN 201980030588 A CN201980030588 A CN 201980030588A CN 112088015 A CN112088015 A CN 112088015A
Authority
CN
China
Prior art keywords
peptide
hpv
amino acid
seq
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980030588.6A
Other languages
English (en)
Inventor
D·E·布拉夫
C·G·柏林格
R·雅拉加达
V·库雷拉
P·普拉巴卡兰
S·美特诺
K-F·丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Placigen Co ltd
Original Assignee
Peggy Therapeutics Inc
Placigen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peggy Therapeutics Inc, Placigen Co Ltd filed Critical Peggy Therapeutics Inc
Publication of CN112088015A publication Critical patent/CN112088015A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/29Hepatitis virus
    • A61K39/292Serum hepatitis virus, hepatitis B virus, e.g. Australia antigen
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/02Hepadnaviridae, e.g. hepatitis B virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/861Adenoviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/33Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20031Uses of virus other than therapeutic or vaccine, e.g. disinfectant
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Communicable Diseases (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文提供了工程改造的人乳头瘤病毒(HPV)分子疫苗构建体。疫苗构建体还可包括配体诱导型工程改造基因开关系统,用于调节宿主细胞中异源基因如细胞因子的表达。

Description

人乳头瘤病毒疫苗及其用途
关于序列表
随本申请提交的电子提交的序列表(名称:2584_156PC01_SeqListing_ST25;大小:444,182;创建日期:2019年3月5日)的内容通过引用其全部内容纳入本文。
技术领域
本公开涉及通过使用生物信息学和蛋白质工程学中的先进原理设计的改进的广谱HPV分子疫苗。
背景技术
在全球范围内,目前数千万人感染有人乳头瘤病毒(HPV),并且每年又有数百万新感染的人。已经确定HPV是子宫颈癌和其它癌症如头颈癌的前兆。每年有成千上万的女性患上宫颈癌。目前,向建议的年龄组接种疫苗可以预防HPV所致疾病;然而,迫切需要具有广泛覆盖(针对多种HPV毒株)并具有针对HPV相关癌症的功能性的HPV疫苗。
本公开涉及通过使用生物信息学和蛋白质工程学中的先进原理设计的改进的广谱HPV分子疫苗。这些新型HPV疫苗可以用作针对HPV相关疾病的治疗性疫苗。
通过引用纳入
本说明书中提到的所有发表物、专利和专利申请通过引用纳入本文,就好像将各篇单独的发表物、专利或专利申请专门和单独地通过引用纳入本文那样。
发明概述
本文提供了一种非天然产生的多核苷酸,其编码包含一个或多个免疫应答诱导人乳头瘤病毒(HPV)多肽中至少一个的多肽。
在一些实施方式中,所述非天然产生的多核苷酸编码包含两个或更多个HPV多肽的多肽。在一些实施方式中,所述两个或更多个HPV多肽包含一个或多个HPV-16免疫应答诱导多肽序列。在一些实施方式中,所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个。在一些实施方式中,所述HPV-16肽包含E5肽,并且所述E5肽具有SEQ ID NO:47中所示的序列。在一些实施方式中,所述HPV-16肽包含E6肽,并且所述E6肽具有SEQ ID NO:45中所示的序列。在一些实施方式中,所述HPV-16肽包含E7肽,并且所述E7肽具有SEQ ID NO:46中所示的序列。在一些实施方式中,所述一个或多个HPV肽包含HPV-18肽。在一些实施方式中,所述HPV-18肽包含E5肽、E6肽或E7肽中的至少一个。在一些实施方式中,所述HPV-18肽包含E5肽,并且所述E5肽具有SEQ ID NO:50中所示的序列。在一些实施方式中,所述HPV-18肽包含E6肽,并且所述E6肽具有SEQ ID NO:48中所示的序列。在一些实施方式中,所述HPV-18肽包含E7肽,并且所述E7肽具有SEQ ID NO:49中所示的序列。在一些实施方式中,所述多肽具有SEQID NO:51中所示的序列。在一些实施方式中,所述一个或多个HPV肽中的至少一个与激动剂肽连接。在一些实施方式中,所述激动剂肽具有序列,所述序列包含表2中所示的激动剂肽序列。在一些实施方式中,所述多肽具有SEQ ID NO:53中所示的序列。
本文提供了包含本文所提供的多核苷酸中任一个的多核苷酸,其还包含编码基因开关系统的一个或多个多核苷酸,用于诱导型控制异源基因表达,其中所述异源基因表达由所述基因开关系统调节;并且,其中所述异源基因包含本文所述多核苷酸中的任一个。在一些实施方式中,所述基因开关系统是基于蜕皮激素受体的(基于EcR的)基因开关系统。在一些实施方式中,所述一个或多个HPV多肽,用于疫苗。
本文提供了载体,其包含本文所提供的多核苷酸中的任一个。在一些实施方式中,所述载体是腺病毒载体。在一些实施方式中,所述腺病毒载体是大猩猩腺病毒载体。
本文提供了一种调节细胞中异源基因表达的方法,所述方法包括:将包含(i)抑制型或诱导型基因开关和(ii)异源性免疫应答诱导基因的一个或多个多核苷酸引入所述细胞,其中所述异源性免疫应答诱导基因的表达由所述基因开关调节,其中所述异源性免疫应答诱导基因编码一个或多个HPV多肽中的至少一个;和将所述细胞暴露于足以抑制或诱导所述异源性免疫应答诱导基因表达的量的化合物。
在一些实施方式中,在调节本文所述细胞中异源基因表达的方法中,所述靶细胞是哺乳动物细胞。在一些实施方式中,所述基因开关包括衍生自蜕皮激素受体(EcR)、遍在受体(ubiquitous receptor)、孤儿受体1、NER-1,类固醇激素核受体1、类视黄醇X受体相互作用蛋白15、肝X受体β、类固醇激素受体样蛋白、肝X受体、肝X受体α、法尼醇(farnesoid)X受体、受体相互作用蛋白14和金合欢醇(Famesol)受体中至少一种的配体结合结构域。
本文提供了E6肽,其中,相较于野生型E6肽,所述E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个。在一些实施方式中,所述E6肽包含所述E18A氨基酸取代且包含所述L50G、E148A、T149A、Q150A和L151A氨基酸取代。在一些实施方式中,所述E6肽具有SEQ ID NO:45中所示的序列。在一些实施方式中,所述E6肽与激动剂肽融合。在一些实施方式中,所述激动剂肽与所述E6肽的C端和N端中的至少一个融合。在一些实施方式中,所述野生型E6肽来自HPV-16。
本文提供了E6肽,其中相较于野生型E6肽,所述E6肽包含缺失,其中所述缺失包括所述野生型E6肽的C末端。在一些实施方式中,所述缺失包括所述野生型E6肽氨基酸121至所述野生型E6肽C末端的氨基酸。在一些实施方式中,相较于所述野生型E6肽,所述E6肽包含E18A和L50G取代中的至少一个。在一些实施方式中,所述野生型E6肽来自HPV-18。在一些实施方式中,所述E6肽具有SEQ ID NO:48中所示的序列。
本文提供了E7肽,其中相较于野生型E7肽,所述E7肽包含缺失,其中所述缺失包括所述野生型E7肽的N末端。在一些实施方式中,所述缺失包括所述野生型E7肽的氨基酸1-39。在一些实施方式中,相较于所述野生型E7肽,所述E7肽包含E55A和L74R取代中的至少一个。在一些实施方式中,所述野生型E7肽来自HPV-18。在一些实施方式中,所述E7肽具有SEQID NO:49中所示的序列。
本文提供了E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸41-57。在一些实施方式中,所述E5肽具有SEQ ID NO:47中所示的序列。在一些实施方式中,所述野生型E5肽来自HPV-16。
本文提供了E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸27-40或氨基酸54-57中的至少一个。在一些实施方式中,所述E5肽具有SEQ ID NO:50中所示的序列。在一些实施方式中,所述野生型E5肽来自HPV-18。
本文提供了包含本文所述E5、E6和E7中任何一个的多肽构建体。
本文提供了一种多肽构建体,其中所述多肽构建体包含HPV-16E6肽,其中相较于野生型HPV-16E6肽,所述HPV-16E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个。在一些实施方式中,所述HPV-16E6肽包含所述E18A氨基酸取代且包含所述L50G、E148A、T149A、Q150A和L151A氨基酸取代。在一些实施方式中,所述HPV-16E6肽具有SEQ ID NO:45中所示的序列。在一些实施方式中,所述多肽构建体还包含HPV-16E6肽,其中相较于野生型HPV-16E7肽,所述HPV-16E7肽包含H2P、C24G、E46A和L67R氨基酸取代中的至少一个。在一些实施方式中,所述HPV-16E7肽包含所述H2P、C24G、E46A和L67R氨基酸取代。在一些实施方式中,所述HPV-16E7肽具有SEQ ID NO:46中所示的序列。在一些实施方式中,所述多肽构建体还包含HPV-16E5肽。在一些实施方式中,相较于野生型HPV-16E5肽,所述HPV-16E5肽包含一个或多个氨基酸的缺失。在一些实施方式中,所述缺失包括所述野生型HPV-16E5肽的氨基酸41-57。在一些实施方式中,所述HPV-16E5肽具有SEQID NO:47中所示的序列。
在一些实施方式中,所述多肽构建体包含HPV-16E6肽,其中相较于野生型HPV-16E6肽,所述HPV-16E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个,还包含HPV-18E6肽。在一些实施方式中,相较于野生型HPV-18E6肽,所述HPV-18E6肽包含E18A和L50G取代。在一些实施方式中,相对于所述野生型HPV-18E6肽,所述HPV-18E6肽包含至少一个C末端氨基酸的缺失。在一些实施方式中,所述缺失包括所述野生型HPV-18E6肽的氨基酸121至所述野生型HPV-18E6肽的C末端的氨基酸。在一些实施方式中,所述HPV-18E6肽具有SEQ ID NO:48中所示的序列。在一些实施方式中,所述多肽构建体还包含HPV-18E7肽。在一些实施方式中,相较于野生型HPV-18E7肽,所述HPV-18E7肽包含E55A和L74R取代。在一些实施方式中,所述HPV-18E7肽包含所述HPV-18E7肽N末端的至少一个氨基酸的缺失。在一些实施方式中,所述缺失包括所述野生型HPV-18E7肽的氨基酸1-40。在一些实施方式中,所述HPV-18E7肽具有SEQ ID NO:49中所示的序列。在一些实施方式中,所述多肽构建体还包含HPV-18E5肽。在一些实施方式中,相较于野生型HPV-18E5肽,所述HPV-18E5肽包含至少一个氨基酸的缺失。在一些实施方式中,所述缺失包括所述野生型HPV-18E5肽的氨基酸27-40或54-57。在一些实施方式中,所述HPV-18E5肽具有SEQ IDNO:50中所示的序列。在一些实施方式中,所述多肽构建体具有SEQ ID NO:51中所示的序列。在一些实施方式中,所述多肽构建体还包含至少一个激动剂肽。在一些实施方式中,所述至少一个激动剂肽具有序列,所述序列包含表2中所示的激动剂肽序列。在一些实施方式中,所述多肽构建体具有SEQ ID NO:53中所示的序列。
本文提供了多肽构建体,其包含锚蛋白样重复序列结构域和HPV肽。在一些实施方式中,所述锚蛋白样重复序列蛋白是人锚蛋白样重复序列蛋白。在一些实施方式中,所述HPV肽通过接头与所述锚蛋白样重复序列蛋白连接。在一些实施方式中,所述HPV肽包含HPV-16肽或HPV-18肽中的至少一个。在一些实施方式中,所述HPV肽包含HPV-16肽,并且所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个。在一些实施方式中,所述HPV肽包含HPV-18肽,并且所述HPV-18肽包含E6肽或E7肽中的至少一个。在一些实施方式中,所述HPV肽包含表2中所示的HPV-16E5序列、HPV-16E6序列、HPV-16E7序列、HPV-18E6序列或HPV-18E7序列。在一些实施方式中,所述多肽构建体具有SEQ ID NO:52中所示的序列。在一些实施方式中,所述多肽构建体还包含至少一个激动剂肽。在一些实施方式中,所述多肽构建体包含三个激动剂肽。在一些实施方式中,所述多肽构建体具有SEQ ID NO:54中所示的序列。
本文提供了一种多肽构建体,其中,所述多肽构建体包含表2中所示的至少两个HPV氨基酸序列,其中所述至少两个HPV氨基酸序列通过肽接头接合,其中所述肽接头是KK接头。在一些实施方式中,所述至少两个HPV氨基酸序列包含表2中所示HPV-16肽或HPV-18肽中的至少一个。在一些实施方式中,所述至少两个HPV氨基酸序列包括HPV-16肽,并且其中所述HPV-16肽包含表2中所示HPV-16E5肽、HPV-16E6肽或HPV-16E7肽中的至少一个。在一些实施方式中,所述至少两个HPV氨基酸序列包括HPV-18肽,并且所述HPV-18肽包含表2中所示HPV-18E6肽或HPV-18E7肽中的至少一个。在一些实施方式中,所述至少两个HPV氨基酸序列包含表2中所示的各个氨基酸序列。在一些实施方式中,所述各个氨基酸序列通过所述KK接头与所述各个氨基酸序列中的另一个接合。在一些实施方式中,所述多肽构建体具有SEQ ID NO:55中所示的序列。在一些实施方式中,本文所述的多肽构建体中的任一个用于疫苗。
本文提供了编码本文所述多肽构建体中任一个的多核苷酸。本文还提供了包含所述多核苷酸的载体。在一些实施方式中,所述载体是腺病毒载体。在一些实施方式中,所述腺病毒载体是大猩猩腺病毒载体。
本文提供了载体,其中所述载体包含编码至少一个HPV肽的多核苷酸,其中所述载体是腺病毒载体。
本文提供了载体,其中所述载体包含编码至少一个HPV肽的多核苷酸,其中所述载体是腺病毒载体,其中所述腺病毒载体是大猩猩腺病毒载体。
在一些实施方式中,本文所述的多肽构建体中的任一个用于疫苗。本文还提供了编码本文所述多肽构建体中任一个的多核苷酸。本文还提供了包含所述多核苷酸的载体。在一些实施方式中,所述载体是腺病毒载体。在一些实施方式中,所述腺病毒载体是大猩猩腺病毒载体。
附图简要说明
所附权利要求书中具体说明了本公开的特征。可参考下述说明了示例性实施方式的详述更好地理解本公开的特征和优点,这些详述列出利用本公开原理的说明性情况:
图1是HPV基因组的示意图。HPV基因组包括7个早期基因(E1至E7)和两个晚期基因(L1和L2),并且各个基因都有特定的功能。E5、E6和E7基因与癌症的发展有关
图2是实施设计HPV疫苗抗原的示意性总体工作流程。
图3是用于HPV设计1和HPV设计3的HPV16和HPV18抗原设计的示意图。使用共有序列信息来选择用于设计的HPV16/HPV18参照序列,其包括所有主要变体。显示了包含具有结构域边界和突变信息的不同E6、E7和E5蛋白组分的疫苗组合物。这些不同的结构域包含由IEDB预测(关于MHC-I结合)推导的大部分普遍的肽。HPV设计3与HPV设计1类似,增加了增强子激动剂肽。
图4A和图4B分别显示了HPV设计2和HPV设计4的同源模型。同源模型用于评估总体结构特征并将HPV设计与天然锚蛋白重复进行比较。HPV设计以相同的取向显示,并因肽的重组而提出了不同的结构构象(但保持了相同的整体折叠)。
图5A显示了使用蛋白质比对(protein blast)映射到HPV设计4(查询)的HPV设计5(对象)。使用netMHC鉴定强和弱结合剂。图5B显示了基于映射位置提取的HPV设计4和5的密度图。在预测的强/弱结合肽中观察到相似的模式。HPV设计4和5匹配的区域上的结合亲和力预测是相似的。
图6是这样的示意图,其显示为RNA qPCR相对表达实验生成的短和长引物和探针组。针对各HPV抗原设计来设计特异性引物。
图7A显示了NetMHC 4.0抗原性预测。针对肽位置绘制预测的强结合肽指数和弱结合肽指数。图7B显示了NetMHC 4.0抗原性预测密度图。采用一阶/二阶微分以识别峰。图7C显示了与共有序列比对的氨基酸序列,从而确定HPV亚型间的覆盖。
图8显示了HPV设计1(MOD-1755822)和HPV设计3(MOD-1755825)的比较。
图9A显示了与来自UP P03126的野生型HPV16 E6进行的HPV16 E6序列比对。图9B显示了与来自UP P03129的野生型HPV16 E7进行的HPV16 E7序列比对。图9C显示了与来自UP P06927的野生型HPV16 E5进行的HPV16 E5序列比对。
图10A显示了与来自UP P06463的野生型HPV18E6进行的HPV18 E6序列比对。图10B显示了与来自UP P06788的野生型HPV18E7进行的HPV18 E7序列比对。图10C显示了与来自UP P06792的野生型HPV18E5进行的HPV18E5序列比对。
图11显示了通过激活NK细胞和T细胞,IL-12促进免疫应答的概述。
图12显示了多种不同IL-12配体诱导型基因开关载体系统的各种结构组件。
发明详述
下述描述和示例详细阐释了本公开的实施方式。
应当理解的是,本公开并不限于本文所述的特定实施方式,并且因为可以变化。本领域技术人员将认识到的是,将存在包括在本公开范围内的变化和修改。
所有术语旨在以如本领域技术人员所理解来理解。除非另外定义,否则,本文中所使用的所有技术和科学术语都具有本公开所属领域普通技术人员通常所理解的含义。
本文所用章节标题仅用于组织目的,而不应理解为限制所述客体。
虽然可以在单个实施方式的上下文中描述的本公开的各特征,但是特征也可以单独地或以任何合适的组合提供。反之,虽然本公开为了清楚起见可以在单独的实施方式的上下文中描述,但是本公开也可以在单个实施方式中实现。
下述定义是本领域的补充并且针对当前申请,并且不应归因于任何相关或不相关的情况,例如,任何共同拥有的专利或申请。虽然也可采用与本文所述相似或等同的任何方法和材料实施或测试本公开,但下面描述了优选的方法和材料。因此,本文所用术语的目的仅仅是描述特定实施方式,而不是用于限制。
定义
在本申请中,除非具体说明,单数的使用包括复数。必须要指出的是,除非具体说明,说明书中所用的单数形式“一个”、“一种”和“该”包括复数含义。
在该申请中,除非另有说明,使用“或”表示“和/或”。本文所用术语“和/或”和“其任意组合”以及其语法等同形式可以互换使用。这些术语可以表示任何组合都是可以特别考虑的。仅出于说明性的目的,下述短语“A、B和/或C”或“A、B、C或其任意组合”可以表示“单独为A;单独为B;单独为C;A和B;B和C;A和C;和A、B和C”。术语“或”可以结合地使用或分离地使用,除非上下文明确地指出结合使用。
此外,使用术语“包括”以及其它形式,如“包括”、“含有”或“包含”不是限制性的。
说明书中述及“一些实施方式”、“一实施方式”、“一个实施方式”或“其它实施方式”指结合实施方式所描述特定特征、结构或特性包括在至少一些实施方式中,但不一定是本公开的所有实施方式中。
本说明书和权利要求中所用词语“包含”(以及包括的任何形式,例如“包括”和“含有”),“具有”(以及具有的任何形式,例如“含有”和“拥有”),“包括”(以及任何形式的包括,例如“包含”和“含有”)或“含有”(以及任何形式的含有,例如“含”和“包含”)是封闭式或开放式的,并且不排除其它未引用的要素或方法步骤。可以预期的是,本说明书中所讨论的任何实施方式可以相对于本公开的任何方法或组合物实施,反之亦然。此外,本公开的组合物可以用于实现本公开的方法。
如本文所使用的,涉及参照数值及其语法等同形式的术语“约”可以包括数值本身以及该数值正负10%的数值范围。
术语“约”或“大约”表示就某特定数值而言在本领域普遍技术人员能够确定的可接受的误差范围内,这将部分取决于该数值的测量或确定方式,即,测量体系的极限。例如,根据本领域的实践,“约”可以表示在1个或大于1个标准偏差之内。或者,“约”可以表示给定值上至20%、上至10%、上至5%或上至1%的范围。在另一示例中,“大约10”的数量包括10以及9-11的任何数量。在另一个示例中,涉及参照数值的术语“约”还可以包括该值正负10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的范围。或者,特别是相对于生物系统或过程,术语“约”可以描述在数值的数量级内,优选在5倍以内,更优选在2倍以内。在本申请和权利要求中描述了特定值的情况下,除非另有说明,应该假定术语“约”表示所述特定值在可接受的误差范围内。
本文所用术语“分离的”及其语法等同形式指核酸从其天然环境的移出。本文所用术语“纯化的”及其语法等同形式指纯度已经增加的分子或组合物,无论其是从自然界中移出的(包括基因组DNA和mRNA)还是在实验室条件下合成的(包括cDNA)和/或扩增的,其中“纯度”是相对术语而非“绝对纯度”。然而,应该理解的是,核酸和蛋白质可以与稀释剂或佐剂一起配制,并且出于实践目的仍是分离的。例如,当用于引入细胞时,核酸通常与可接受的运载体或稀释剂混合。本文所用术语“基本上纯化的”及其语法等同形式指这样的核酸序列、多肽、蛋白质或其它化合物,其基本上不含,即不含超过约50%,不含超过约70%,不含超过约90%的,与该核酸、多肽、蛋白质或其它化合物天然相关联的多核苷酸、蛋白质、多肽和其它分子。
本文所用“多核苷酸”、“寡核苷酸”、“多核苷酸构建体”、“基因”、“基因构建体”、“异源基因”及其语法等同形式指任何长度的核苷酸或核酸的聚合形式,可以是核糖核苷酸或脱氧核糖核苷酸。该术语仅指分子的一级结构。因此,该术语包括双链和单链DNA,三链DNA以及双链和单链RNA。例如,其还包括通过甲基化和/或通过加帽修饰的和未修饰形式的多核苷酸。该术语还旨在包括这样的分子,其包括非天然产生的或合成的核苷酸以及核苷酸类似物。本文公开或设想的核酸序列和载体可以通过例如转染、转化或转导引入细胞。
本文所用“转染”、“转化”或“转导”指通过使用物理或化学方法将一个或多个外源多核苷酸引入宿主细胞中。本领域已知许多转染技术并且包括例如,磷酸钙DNA共沉淀(参见例如,Murray E.J.(编著),《分子生物学方法》(Methods in Molecular Biology),第7卷,基因转移和表达方案(Gene Transfer and Expression Protocols),胡马纳出版社(Humana Press)(1991));DEAE-葡聚糖;电穿孔;阳离子脂质体介导的转染;钨颗粒促进的微粒轰击(Johnston,Nature,346:776-777(1990));和磷酸锶DNA共沉淀(Brash等,Mol.Cell Biol.,7:2031-2034(1987))。感染性颗粒在合适的包装细胞中生长后,可以将噬菌体或病毒载体引入宿主细胞,它们中的许多是可商购的。
本文所用“多肽”、“肽”、“多肽构建体”和“肽构建体”及其语法等同形式指氨基酸残基的聚合物。“成熟蛋白质”是全长的蛋白质,并且其任选地包括在给定细胞环境中特别针对该蛋白质进行的糖基化或其它修饰。本文公开的多肽和蛋白质(包括其功能部分和功能性变体)可以包含代替一个或多个天然产生的氨基酸的合成氨基酸。这样的合成氨基酸是本领域已知的,并且包括,例如,氨基环己烷羧酸,正亮氨酸,α-氨基正癸酸,高丝氨酸,S-乙酰氨基甲基-半胱氨酸,反式-3-和反式-4-羟基苯丙氨酸,4-氨基苯丙氨酸,4-硝基苯丙氨酸,4-氯苯丙氨酸,4-羧基苯丙氨酸,β-苯基丝氨酸,β-羟基苯丙氨酸,苯基甘氨酸,α-萘基丙氨酸,环己基丙氨酸,环己基甘氨酸,二氢吲哚-2-羧酸,1,2,3,4-四氢异喹啉-3-羧酸,氨基马来酸,氨基马来酸单酰胺,N'-苄基-N'-甲基-赖氨酸,N',N'-二苄基-赖氨酸,6-羟基赖氨酸,鸟氨酸,α-氨基环戊烷羧酸,α-氨基环己烷羧酸,α-氨基环庚烷羧酸,α-(2-氨基-2-降冰片烷)-羧酸,α,γ-二氨基丁酸,α,β-二氨基丙酸,高苯丙氨酸和α-叔丁基甘氨酸。本公开还考虑了工程改造的细胞中本文所述的多肽的表达可以与多肽构建体的一个或多个氨基酸的翻译后修饰相关。翻译后修饰的非限制性实例包括:磷酸化,酰化,包括乙酰化和甲酰化,糖基化,包括N-连接和O-连接,酰胺化,羟基化,烷基化,包括甲基化和乙基化,泛素化,添加吡咯烷酮羧酸,形成二硫键,硫酸化,豆蔻酰化,棕榈酰化,异戊二烯化,法尼基化(farnesylation),香叶基化(geranylation),糖基磷脂酰肌醇化(glypiation),脂酰化(lipoylation)和碘化。
当核酸和/或核酸序列经天然或人工方式衍生自共同的祖先核酸或核酸序列时,它们是“同源的”。当蛋白质和/或蛋白质序列的编码DNA经天然或人工方式衍生自共同的祖先核酸或核酸序列时,它们是“同源的”。同源分子可以被称为同源物。例如,本文所述的任何天然产生的蛋白质都可以通过任何可用的诱变方法进行修饰。当表达时,该诱变的核酸编码与原始核酸编码的蛋白质同源的多肽。通常由两个或更多个核酸或蛋白质(或其序列)之间的序列相同性推断同源性。可以用于建立同源性的序列之间相同性的精确百分比随所讨论的核酸和蛋白质的不同而变化,但常规地采用低至25%的序列相同性来建立同源性。更高水平的序列相同性,例如,30%、40%、50%、60%、70%、80%、90%、95%或99%或更高,也可用于建立同源性。用于确定序列相同性百分比的方法(例如,使用默认参数的BLASTP和BLASTN)在本文中描述并且通常是可用的。
在多肽的两个核酸序列或氨基酸序列的上下文中,本文所用术语“相同的”及其语法等同形式或“序列相同性”指在特定的比较窗上比较最大对应时两个序列中相同的残基。本文所用“比较窗”指至少约20个连续位置、通常约50-约200个更通常约100-约150个的区段,其中在两条序列任选地对齐后,序列可以与相同数量连续位置的参照序列进行比较。比对序列用于比较的方法是本领域熟知的。用于比较的最佳序列比对可以通过Smith和Waterman,Adv.Appl.Math.,2:482(1981)的局部同源性算法进行;通过Needleman和Wunsch,J.Mol.Biol.,48:443(1970)的比对算法;通过Pearson和Lipman,Proc.Nat.Acad.Sci U.S.A.,85:2444(1988)的相似性搜索法;通过计算机执行这些算法(包括但不限于,加利福尼亚州山景城的智慧遗传公司(Intelligenetics)的PC/Gene程序中的CLUSTAL,美国威斯康星州麦迪逊的科学路575号遗传学计算集团(Genetics ComputerGroup,GCG)的斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA);CLUSTAL成熟详述于Higgins和Sharp,Gene,73:237-244(1988)以及Higgins和Sharp,CABIOS,5:151-153(1989);Corpet等,Nucleic Acids Res.,16:10881-10890(1988);Huang等,ComputerApplications in the Biosciences,8:155-165(1992);和Pearson等,Methods inMolecular Biology,24:307-331(1994)。比对通常通过检查和手动比对来进行。在一类实施方式中,本文的多肽与参比多肽或其片段具有至少80%、85%、90%、98%、99%或100%的相同性,例如,通过使用默认参数的BLASTP(或CLUSTAL,任何其它可用的比对软件)测量。相似地,也可以参照起始核酸来描述核酸,例如,它们可以与参照核酸或其片段具有50%、60%、70%、75%、80%、85%、90%、98%、99%或100%的相同性,例如,通过使用默认参数的BLASTN(或CLUSTAL或任何其它可用的比对软件)测量。当一个分子被认为与较大分子具有一定百分比的序列相同性时,这意味着当两个分子是最佳比对时,较小分子中所述百分比的残基根据两个分子最佳比对的顺序在较大分子中找到匹配残基。
术语“基本上相同”以及其语法等同形式应用于核酸或氨基酸序列表示相较于参照序列,使用标准参数的上述程序,例如,BLAST,核酸或氨基酸序列包含具有至少90%或更多,至少95%,至少有98%和至少99%序列相同性的序列。例如,BLASTN程序(用于核苷酸序列)使用默认值如下:字长(W)为11,期望值(E)为10,M=5,N=-4和比较两条链。就氨基酸序列而言,BLASTP程序使用如下默认值:字长(W)为3,期望值(E)为10和BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1992))。序列相同性百分比通过在比较窗口中对比两种最佳比对序列而测定,其中比较窗口中多核苷酸序列的部分与参考序列(不含添加或缺失)相比可包含添加或缺失(即缺口)以最佳比对所述两种序列。该百分比可如下计算:通过测定两种序列中出现相同核酸碱基或氨基酸残基的位置数产生匹配位置数,将该匹配位置数除以比较窗口中位置的总数,得到的结果乘以100产生序列相同性百分比。在实施方式中,基本的相同性存在于长度为至少约50个残基的序列区域上,在至少约100个残基的区域上,并且在实施方式中,该序列在至少约150个残基上基本相同。在实施方式中,序列在编码区的整个长度上基本相同。
“表达载体”或“载体”是各自作为在细胞内多核苷酸复制的自主单位发挥作用的任何遗传元件,例如,质粒、染色体、病毒、转座子。(即能够在其自身的控制下复制)或通过插入宿主细胞染色体而使其具有复制能力,其已连接另一个多核苷酸区段,从而实现了连接的区段的复制和/或表达。合适的载体包括但不限于质粒、转座子、噬菌体和粘粒。载体可以包含多核苷酸序列,其对于实现载体的有效连接或将载体插入期望宿主细胞并实现连接区段的表达而言是必需的。这些序列根据宿主生物体而不同;它们包括实现转录的启动子序列,增加转录的增强子序列,核糖体结合位点序列和转录和翻译终止序列。或者,表达载体能够直接表达其中编码的核酸序列产物,而无需连接或整合载体到宿主细胞DNA序列中。在一些实施方式中,载体是“附加型表达载体”或“附加体”,其能够在宿主细胞中复制,并且在适当的选择压力存在下作为DNA的染色体外区段在宿主细胞内持续存在(参见例如,Conese等,Gene Therapy,11:1735-1742(2004))。代表性的市售可得附加型表达载体包括但不限于,利用EB核抗原1(EBNA1)和EB病毒(EBV)复制起点(oriP)的附加体质粒。来自英杰公司(Invitrogen,加利福尼亚州卡尔斯巴德)的载体pREP4、pCEP4、pREP7和pcDNA3.1和Stratagene(司查塔基公司,加利福尼亚州拉霍亚)的pBK-CMV代表了使用T抗原和SV40复制起点代替EBNA1和oriP的附加型载体的非限制性实例。载体还可以包含选择性标志物基因。
本文所用术语“腺病毒”指这样的腺病毒,其保留了参与腺病毒生命周期的能力并且尚未通过例如破坏(例如,超声处理)、变性(例如,使用热或溶剂)或交联(例如,通过福尔马林交联)而被完全失活。“腺病毒生命周期”包括(1)病毒结合和进入细胞,(2)腺病毒基因组的转录和腺病毒蛋白的翻译,(3)腺病毒基因组的复制和(4)病毒颗粒组装(参见例如,《费氏病毒学》(Fields Virology),第5版,Knipe等.编著.),利平科特·威廉姆斯和威尔金斯出版集团(Lippincott Williams and Wilkins),宾夕法尼亚州费城(2006))。本文所用术语“腺病毒载体”指其中腺病毒基因组已经操纵以容纳相对于腺病毒基因组而言非天然的核酸序列的腺病毒。通常,通过向腺病毒的腺病毒基因组中引入一个或多个突变(例如,缺失、插入或取代)来生成腺病毒载体,从而适应非天然核酸序列的插入,例如,用于基因转移到腺病毒中。
本文所用术语“选择性标志物基因”指这样的核酸序列,其允许表达核酸序列的细胞在有相应选择试剂存在的情况下被特异性地选择或针对其选择。本领域已知合适的选择性标志物基因并且述于,例如,国际专利申请公开号WO1992/08796和WO 1994/28143;Wigler等,Proc.Natl.Acad.Sci.USA,77:3567(1980);O’Hare等,Proc.Natl.Acad.Sci.USA,78:1527(1981);Mulligan和Berg,Proc.Natl.Acad.Sci.USA,78:2072(1981);Colberre-Garapin等,J.Mol.Biol.,150:1(1981);Santerre等,Gene,30:147(1984);Kent等,Science,237:901-903(1987);Wigler等,Cell,11:223(1977);Szybalska和Szybalski,Proc.Natl.Acad.Sci.USA,48:2026(1962);Lowy等,Cell,22:817(1980);和美国专利号5,122,464和5,770,359。
本文所用术语“编码序列”指编码蛋白质的多核苷酸的区段。该区域或序列的起始密码子接近5'端并且终止密码子接近3'端。编码序列还可以称为开放阅读框。
本文所用术语“操作性连接”指DNA区段与另一DNA区段的物理和/或功能性连接,从而允许区段以其希望的方式起作用。当编码基因产物的DNA序列与调节序列(例如启动子、增强子和/或沉默子)连接时,其以能够直接或间接地调节DNA序列转录的方式操作性连接调节序列。例如,当DNA序列在相对于转录起始位点正确的阅读框中连接于相对于启动子转录起始位点下游的启动子时,DNA序列与启动子操作性连接,并允许转录延伸通过DNA序列进行。当增强子或沉默子分别以增加或减少DNA序列转录的方式连接DNA序列时,增强子或沉默子操作性连接编码基因产物的DNA序列。增强子和沉默子可以位于DNA序列的编码区的上游、下游或其内部。如果信号序列表达为参与多肽分泌的前蛋白,那么该信号序列的DNA与编码多肽的DNA操作性连接。DNA序列与调控序列的连接通常这样实现:通过在合适的限制位点连接或通过使用本领域技术人员已知的限制性内切核酸酶插入序列的衔接子或接头连接。
本文所用术语“诱导”及其语法等同形式指相对于一些基础转录水平,通过转录调节子所引起的核酸序列转录、启动子活性和/或表达增加。
术语“转录调节子”指起这样作用的生化成分:在某些环境条件下(例如,抑制物或核抑制蛋白)阻止或抑制启动子驱动的DNA序列的转录,或者在某些环境条件下(例如,诱导剂或增强子)允许或刺激启动子驱动的DNA序列的转录。
本文所用术语“增强子”指这样的DNA序列,其增加例如与其操作性连接的核酸序列的转录。增强子可以位于距核酸序列编码区数千碱基的位置,并且可以介导调节因子的结合、DNA甲基化的模式或DNA结构的变化。本领域已知来自多种不同来源的多种增强子,并且其可以作为克隆的多核苷酸或在克隆的多核苷酸中(来自例如保藏机构如ATCC以及其它商业或个体来源)。包含启动子(如常用的CMV启动子)的多种多核苷酸还包含增强子序列。增强子可位于编码序列的上游、内部或下游。术语“Ig增强子”指源自映射于免疫球蛋白(Ig)基因座内的增强子区域的增强子元件(这类增强子包括,例如,重链(μ)5'增强子,轻链(κ)5'增强子,κ和μ固有增强子和3′增强子(通常参见,Paul W.E.(编著),《免疫学基础》(Fundamental Immunology),第3版,Raven出版社(Raven Press),纽约(1993),第353-363页;和美国专利号5,885,827)。
术语“启动子”指多启动编码序列转录的核苷酸区域。启动子位于基因转录起始位点附近,位于DNA在同一条链的上游(朝向正义链的5'区域)。一些启动子是组成型的,因为它们在细胞中的所有情况中都是有活性的,而其它经调节成为响应特定刺激而变得有活性,例如,诱导型启动子。本文所用术语“启动子活性”及其语法等同形式指与其活性被测量的启动子操作性连接的核苷酸序列的表达程度。启动子活性可以通过确定产生的RNA转录本的量来直接测量,例如通过Northern印迹分析,或者通过确定由连接的核酸序列如与启动子连接的报告核酸序列所编码的产物的量来间接测量。
本文所用“诱导型启动子”指通过存在或不存在转录调节剂(例如生物或非生物因子)而被诱导成具有活性的启动子。诱导型启动子是有用的,因为与其操作性连接的基因的表达可以在生物体发育的特定阶段或在特定组织中被打开或关闭。诱导型启动子的非限制性实例包括,醇调节型启动子,四环素调节型启动子,类固醇调节型启动子,金属调节型启动子,发病原调节型启动子,温度调节型启动子和光调节型启动子。诱导型启动子可以是基因开关或遗传开关的部分。诱导型启动子可以是基因开关配体诱导型启动子。在一些情况中,诱导型启动子可以是基于小分子配体诱导的两个多肽蜕皮激素受体的基因开关。在一些情况中,基因开关可以选自基于蜕皮激素的受体的组件,如述于但不限于下述内容中的任意系统:国际专利申请WO 2001/070816;WO 2002/029075;WO 2002/066613;WO 2002/066614;WO 2002/066612;WO 2002/066615;WO 2003/027266;WO 2003/027289;WO 2005/108617;WO 2009/045370;WO 2009/048560;WO 2010/042189;WO 2010/042189;WO 2011/119773;和WO 2012/122025;和美国专利号7,091,038;7,776,587;7,807,417;8,202,718;8,105,825;8,168,426;7,531,326;8,236,556;8,598,409;8,715,959;7,601,508;7,829,676;7,919,269;8,030,067;7,563,879;8,021,878;8,497,093;7,935,510;8,076,454;9,402,919;9,493,540;9,249,207;和9,492,482,其各自内容通过引用其全部内容纳入)。
术语“基因开关”或“遗传开关”指与启动子结合的反应元件的组合,例如基于EcR的系统,其在一个或多个配体存在的情况下调节纳入了反应元件和启动子的基因的表达。严格调节的诱导型基因表达系统或基因开关能够用于多种应用,如基因疗法,细胞中蛋白质的大规模生产,基于细胞的高通量筛选试验,功能基因组学和转基因植物和动物性状的调节。这类诱导型基因表达系统可包括配体诱导型异源基因表达系统。
“睡美人(SB)转座子系统”指用于将DNA序列引入脊椎动物染色体的合成DNA转座子系统。该系统的一些示例性实施方式述于例如美国专利号6,489,458、8,227,432、9,228,180和WO/2016/145146中。该睡美人转座子系统由睡美人(Sleeping Beauty,SB)转座酶和SB转座子组成。在实施方式中,睡美人转座子系统可以包括SB11转座子系统,SB100X转座子系统或SB110转座子系统。
“转座子”或“转座因子”(TE)是一种载体DNA序列,其可以改变其在基因组中的位置,有时会产生或逆转突变并改变细胞的基因组大小。转座通常导致TE的复制。I型TE在两个阶段中复制:首先它们由DNA转录为RNA,然后将产生的RNA反转录成DNA。然后将复制的DNA插入基因组的新位置。逆转录步骤由逆转录酶催化,所述逆转录酶可以由TE自身编码。逆转录转座子的特征类似于逆转录病毒,如HIV。II型TE的剪切和粘贴转座机制不涉及RNA中间体。转座由几种转座酶催化。一些转座酶非特异性地结合DNA中的任何靶位点,然而另一些转座酶结合特定的DNA序列靶标。转座酶在靶位点进行交错切开,产生单链5'或3'DNA突出端(粘性末端)。该步骤切出DNA转座子,然后将其连接到新的靶位点中;该过程涉及填平缺口的DNA聚合酶以及封闭糖-磷酸骨架的DNA连接酶的活性。这导致靶位点的复制。鉴定DNA转座子的插入位点可以通过短直接重复,所述短直接重复可以通过靶DNA中的交错切口产生并通过DNA聚合酶填平,以及一系列反向重复鉴定,所述反向重复对通过转座酶的TE切除十分重要。如果剪切和粘贴TE的转座发生在细胞周期的S期期间供体位点已经复制但靶位点尚未复制时,那么它们可以被复制。在I型或II型TE中,转座可以分为自发性的或非自发性的。自发性TE可以通过其自身移动,而非自发性转座需要存在另一个TE来移动。这通常是因为非自发性TE缺少转座酶(对于II型)或逆转录酶(对于I型)。
“转座酶”指这样的酶,其通过剪切和粘贴机制或复制转座机制来结合转座子末端并催化转座子运动到基因组的另一部分。
本文所用“T细胞”或“T淋巴细胞”是在细胞介导的免疫中起中心作用的淋巴细胞的类型。通过在细胞表面是否存在T细胞受体(TCR),可以将它们与其它淋巴细胞如B细胞和自然杀伤细胞(NK细胞)相区分。
“T辅助细胞”(TH细胞)在免疫过程中协助其它白细胞,包括使B细胞成熟为浆细胞和记忆B细胞,和激活细胞毒性T细胞和巨噬细胞。这些细胞也被称为CD4+T细胞,因为它们在其表面表达CD4糖蛋白。当辅助T细胞被MHC II型分子呈递肽抗原时,它们被激活,所述MHC II型分子在抗原呈递细胞(APC)的表面表达。一旦被激活,它们就会迅速分裂并分泌称为细胞因子的小蛋白,它们将调节或协助主动免疫反应。这些细胞可以分化为几种亚型之一,包括TH1、TH2、TH3、TH9、TH17、TH22或TFH(T滤泡辅助细胞),它们分泌不同的细胞因子以促进不同类型的免疫反应。来自APC的信号转导引导T细胞成为特定的亚型。
“细胞毒性T细胞”(TC细胞或CTL)或“细胞毒性T淋巴细胞”破坏了病毒感染的细胞和肿瘤细胞,并且也与移植排斥反应有关。这些细胞也称为CD8+T细胞,因为它们在其表面表达CD8糖蛋白。这些细胞通过结合与存在于所有有核细胞表面的MHC I型分子相关的抗原来识别其靶标。通过IL-10、腺苷和由调节性T细胞分泌的其它分子,可以使CD8+细胞失活至无变应性状态,这将预防自身免疫疾病。
“记忆T细胞”是抗原特异性T细胞的子集,其在感染消失后会长期存在。在重新暴露于它们的同源抗原后,它们会快速扩增成大量的效应T细胞,因此为免疫系统提供了针对既往感染的记忆。记忆T细胞包括三种亚型:中央记忆T细胞(TCM细胞)和两种效应记忆T细胞(TEM细胞和TEMRA细胞)。记忆细胞可以是CD4+或CD8+。记忆T细胞通常表达细胞表面蛋白CD45RO、CD45RA和/或CCR7。
“调节T细胞”(Treg细胞)以前称为抑制T细胞,其在维持免疫耐受中发挥作用。它们的主要作用是在免疫反应接近结束时关闭T细胞介导的免疫并抑制逃避胸腺中负选择过程的自身反应性T细胞。
“自然杀伤T细胞”(NKT细胞-不要与先天免疫系统的自然杀伤细胞相混淆)将后天免疫系统与先天免疫系统联系在一起。不同于识别通过主要组织相容性复合物(MHC)分子呈递的肽抗原的常规T细胞,NKT细胞识别通过称为CD1d的分子呈递的糖脂抗原。一旦激活,这些细胞就可以进行归因于T辅助细胞(TH)和细胞毒性T(TC)细胞的功能(即,细胞因子产生和细胞溶解/细胞杀伤分子的释放)。他们还能够识别并消除一些肿瘤细胞和感染有疱疹病毒的细胞。
“过继T细胞转移”指分离和离体扩增肿瘤特异性T细胞以获得比仅通过疫苗接种或患者的自然肿瘤反应可获得的T细胞数量更多的T细胞。然后将肿瘤特异性T细胞输注到癌症患者体内,试图经由可以攻击和杀伤癌症的T细胞使其免疫系统能够覆盖剩余的肿瘤。用于癌症治疗的过继T细胞疗法存在多种形式:培养肿瘤浸润的淋巴细胞或TIL,分离和扩增一个特定T细胞或克隆,和甚至使用经过工程改造以有效识别和攻击肿瘤的T细胞。
本文所用“抗体”指单克隆或多克隆抗体。本文所用术语“单克隆抗体”指由B细胞的单个克隆产生并结合相同表位的抗体。相反,“多克隆抗体”指由不同的B细胞产生并结合相同抗原的不同表位的抗体群。完整抗体通常由四个多肽组成:重(H)链多肽的两个相同拷贝和轻(L)链多肽的两个相同拷贝。各重链包含一个N末端可变(VH)区和三个C末端恒定(CH1、CH2和CH3)区,且各轻链包含一个N末端可变(VL)区和一个C末端恒定(CL)区。每对轻链和重链的可变区形成抗体的抗原结合位点。VH和VL区具有相似的整体结构,并且各区域包括四个框架区,其序列相对保守。框架区通过3个互补决定区(CDR)连接。这三个称为CDR1、CDR2和CDR3的CDR形成抗体的“高变区”,负责抗原结合。
例如,“抗体样分子”可以是Ig超家族成员的蛋白质,其能够选择性结合伴侣。MHC分子和T细胞受体就是这类分子。在一个实施方式中,抗体样分子是TCR。在一实施方式中,已经修饰TCR已以增加其MHC结合亲和力。
术语“抗体的片段”、“抗体片段”、“抗体的功能片段”、“抗原结合部分”或其语法等同形式在本文中可互换使用,表示保留特异性结合抗原的能力的抗体的一个或多个片段或部分(通常参见,Holliger等,Nat.Biotech.,23(9):1126-1129(2005))。例如,抗体片段理想地包含一个或多个CDR、可变区(或其部分)、恒定区(或其部分)或其组合。抗体片段的非限制性实例包括:(i)Fab片段,其是由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,其是包含通过二硫键在茎部区域连接的两个Fab片段的二价片段;(iii)Fv片段,其由抗体单臂的VL和VH结构域组成;(iv)单链Fv(scFv),其是由通过合成接头连接的Fv片段的两个结构域(即,VL和VH)组成的单价分子,所述合成接头使两个结构域能够合成为单一多肽链(参见例如,Bird等,Science,242:423-426(1988);Huston等,Proc.Natl.Acad.Sci.USA,85:5879-5883(1988);和Osbourn等,Nat.Biotechnol.,16:778(1998))和(v)双抗体,其是多肽链的二聚体,其中各多肽链包含通过肽接头与VL连接的VH,所述肽接头太短以至于无法在相同多肽链上的VH和VL之间配对,从而驱动不同VH-VL多肽链上互补结构域之间的配对,以产生具有两个功能性抗原结合位点的二聚体分子。抗体片段为本领域所知且在例如美国专利8,603,950中更详细的描述。
“抗原识别部分”或“抗原识别结构域”指与抗原特异性结合的分子或分子的部分。在一实施方式中,抗原识别部分是抗体、抗体样分子或其片段,而抗原是肿瘤抗原。
术语“保守氨基酸取代”或“保守突变”指通过具有共同性质的另一氨基酸取代一个氨基酸。定义各个氨基酸之间共同特性的功能方法是分析同源生物体的相应蛋白质之间氨基酸变化的归一化频率(Schulz,G.E.和Schirmer,R.H.,《蛋白质结构原理》(Principlesof Protein Structure),施普林格出版社(Springer-Verlag),纽约(1979)。根据这样的分析,可以定义多组氨基酸,其中一组中的氨基酸彼此优先交换,并且因此在其对整个蛋白质结构的影响中彼此最相似(Schulz,G.E.和Schirmer,R.H.,同上)。保守突变的示例包括上述亚组内氨基酸的氨基酸取代,例如,赖氨酸取代精氨酸,反之亦然,从而可以保持正电荷;谷氨酸取代天冬氨酸,反之亦然,从而可以保持负电荷;苏氨酸取代丝氨酸,从而可以保持游离的-OH;和谷氨酰胺取代天冬酰胺,从而可以保持游离的–NH2。或者或另外地,功能性变体可以包含具有至少一个非保守氨基酸取代的参比蛋白的氨基酸序列。
术语“非保守突变”涉及不同组之间的氨基酸取代,例如,赖氨酸取代色氨酸,或苯丙氨酸取代丝氨酸等。在这样的情况下,优选的是非保守氨基酸取代不干扰或抑制功能性变体的生物活性。非保守氨基酸取代可以增强功能性变体的生物活性,从而相较于同源亲本蛋白质使功能性变体的生物活性增加。
术语“锚蛋白”指衔接子蛋白的家族,其介导整合膜蛋白与基于血影蛋白肌动蛋白的膜细胞骨架的连接。锚蛋白具有血影蛋白β亚基和完整膜蛋白至少12个家族的结合位点。需要这种连接来维持质膜的完整性并将特定的离子通道、离子交换剂和离子转运蛋白锚定在质膜中。锚蛋白包含四个功能结构域:包含24个串联锚蛋白重复的N末端结构域,与血影蛋白结合的中央结构域,与涉及凋亡的蛋白质结合的死亡结构域,和在不同锚蛋白之间高度可变的C末端调节结构域。24个串联锚蛋白重复负责识别多种膜蛋白。这24个重复包含3个结构上不同的结合位点,范围包括重复1-14。这些结合位点彼此是拟独立的,并且可以组合使用。位点用于结合膜蛋白的相互作用是非特异性的并且包括:氢键、疏水相互作用和静电相互作用。这些非特异性相互作用给予锚蛋白识别大范围蛋白质的特性,因为该序列不必须的保守的,仅仅是氨基酸的性质。拟独立表示如果不使用结合位点,那么其不会对整体结合产生很大影响。这两种性质联合产生了锚蛋白可以识别的大量蛋白质。锚蛋白在哺乳动物中的通过三个基因(ANK1、ANK2和ANK3)编码。各基因通过交替剪接依次产生多种蛋白质。
本文所用术语“增殖性疾病”指这样的一种统一概念,其中细胞的过度增殖和/或细胞基质的更新显著地促进了包括癌症在内的疾病的发病机理。
本文所用“患者”或“对象”指诊断患有或疑似患有或发展出增殖性疾病如癌症的哺乳动物对象。在一些实施方式中,术语“患者”指发展出增殖性疾病如癌症的可能性高于平均水平的哺乳动物对象。示例性的患者可以是可以受益于本文公开的疗法的人、猿、狗、猪、牛、猫、马、山羊、绵羊、啮齿动物和其它哺乳动物。示例性的人患者可以是雄性或雌性。“有此需要的患者”或“有此需要的对象”在本文中指诊断为或疑似患有疾病或病症的患者,例如但不限于,人乳头瘤病毒(HPV)感染。
“给予/给药”在本文中是指向患者或对象提供一种或多种本文所述的组合物。作为示例而非限制,可以通过静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹膜内(i.p.)注射或肌内(i.m.)注射进行组合物给药,例如,注射。可以采用一种或多种这样的途径。例如,胃肠外给药可以通过推注或随时间逐渐灌注进行。或者,又或者同时地,给药可以通过口服途径进行。另外,也可通过手术放置大丸剂或细胞团块,或放置医疗装置来给药。在一实施方式中,本公开的组合物可以包含表达本文所述核酸序列的工程改造的细胞或宿主细胞,或包含本文所述至少一种核酸序列的载体,以有效治疗或预防增殖性疾病的量。药物组合物可以包含本文所述的靶细胞群,并组合一种或多种药学上或生理上可接受的运载体、稀释剂或赋形剂。这样的组合物可以包括缓冲液,如中性缓冲盐水、磷酸盐缓冲盐水等;糖类,如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸,如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);和防腐剂。
本文所用术语“治疗”、“处理”或其语法等同形式指获得所需药理和/或生理作用。在实施方式中,作用是治疗性的,即所述作用部分或完全治愈疾病和/或归因于所述疾病的不良症状。至此,本发明的方法包括给予治疗有效量的组合物,所述组合物包含表达本发明的核酸序列的宿主细胞,或包含本发明的核酸序列的载体。
术语“治疗有效量”、“治疗量”、“免疫有效量”、“抗肿瘤有效量”、“肿瘤抑制有效量”或其语法等同形式指实现所需治疗结果在剂量上或所需时间段内有效的量。治疗有效量可以根据个体的疾病状态、年龄、性别和体重等因素以及本文所述组合物在一个或多个对象中引起所需响应的能力变化。考虑到个体在年龄、体重、肿瘤大小、感染或转移的程度和患者(对象)状态中的不同,可由医生确定待给予的本公开的组合物的精确量。
或者,向患者或对象给予本文所述一种或多种组合物的药理和/或生理作用可以是“预防性的”,即该作用完全或部分预防疾病或其症状。“预防有效量”指在剂量上和所需时间段内有效实现所需预防结果(例如,预防疾病发作)的量。
HPV分子疫苗
人乳头瘤病毒(Human papillomavirus,HPV)是由200多种相关病毒组成的组。该大组中的各HPV病毒都有一个编号,称为其HPV类型(或血清型)。HPV是一种小型非包膜脱氧核糖核酸(DNA)病毒,其感染皮肤或粘膜细胞。环状双链病毒基因组的长度约为8kb。基因组编码了负责病毒复制的7个早期蛋白质(E1-E7)和两个迟生蛋白(L1和L2),它们是病毒结构蛋白。如图1所示,各基因具有特定功能。在超过200多种已知HPV类型中的至少有13种可以引起子宫颈癌并与其它肛殖癌和头颈癌相关联。两种最常见的“高危”血清型(HPV-16和HPV-18)引起所有子宫颈癌中的大约70%。在HPV-16和HPV-18中,两种主要的癌蛋白E6和E7由与HPV相关的肿瘤组成性表达,并且对于诱导和维持HPV感染细胞中的细胞转化至关重要。最近的证据还表明,E5蛋白也影响病毒转化。HPV类型16、18、31、33、35、39、45、51、52、56、58、59、68、73和82被认为是致癌的。已知两种“低风险”HPV 6和11会引起生殖器疣,这是外生殖器的一种常见良性疾病,导致显著的发病率。HPV是高度可传播的,在发生性行为后不久便达到高峰,并且大多数人一生中都会感染。
由病毒样颗粒组成的预防性疫苗仅诱导对衣壳结构的免疫,而不诱导负责细胞转化的非结构蛋白的免疫。在动物模型中进行的最初HPV研究表明,接种物种特异性乳头瘤病毒诱导免疫应答,从而赋予针对同源病毒攻击的保护作用。然而,天然乳头瘤病毒不是疫苗开发的良好基底,因为它们不易在组织培养中生长。后续研究开始于由异源表达系统如酵母或杆状病毒载体中结构蛋白的表达产生病毒颗粒。结果表明单独表达L1导致产生病毒样颗粒(VLP),其在形态上类似于真实的HPV病毒体,但是不包含病毒DNA。这些VLP是在异源细胞基底中表达时通过L1蛋白的自组装产生的。在动物研究中,证明VLP可以同源病毒的抵抗高剂量实验性感染。HPV VLP在小鼠或兔中具有高度免疫原性,并且所得抗体在假病毒颗粒中和试验中测试时已经显示出中和作用和类型限制。用变性的颗粒进行免疫不会导致产生中和抗体,也不会免受实验性病毒攻击,这表明中和表位是构象依赖性的。
本文提供了包含制备HPV重组疫苗的方法的组合物、试剂盒和系统。本公开中的HPV重组疫苗(例如,HPV设计1-5)是通过对E5、E6和E7进行蛋白质工程改造而工程改造的。这些疫苗在不同的HPV-16和HPV-18分离株之间具有更高蛋白水平的序列共有性。此外,它们包括基因修饰的突变,以避免致癌活性,改善其表达并触发更广泛的免疫反应。本文还提供了包含E5、E6和E7蛋白质免疫原性表位的多表位重组抗原。除当前的HPV疫苗设计外,还包括先前证明激活HPV特异性T细胞的某些增强子激动剂肽。在一些实施方式中,激动剂肽包含表2中所示的一个或多个肽序列。
各HPV疫苗抗原设计的灵感来自于发明人选择的生物信息学分析和计算机蛋白质工程改造方法的组合使用(例如,基于共有序列、抗原性预测和T细胞表位映射选择的抗原性序列,旨在诱导MHC-I结合和在T细胞活化后的细胞因子产生)。本公开的HPV疫苗设计的总体工作流程如图2所示,并在实施例2中进一步详述。
许多HPV病毒株上天然产生的序列变异为有效、广谱HPV疫苗的开发提供了重要的障碍。作为该问题的解决方案,本疫苗设计方法利用先进的生物信息学和蛋白质工程改造方法来选择和设计具有T细胞表位的广泛覆盖、新型突变和增强子激动剂肽的抗原序列。借鉴能够扩大具有CTL特异性表位的抗原区域的覆盖以及计算机模拟预测结果可及的信息,设计的HPV疫苗抗原旨在诱导稳健的HPV-16和HPV-18特异性应答并为处于HPV衍生癌症风险中的人们提供治疗益处。
本公开提供了构建在多重缺失的大猩猩腺载体(GC46)中的5个HPV抗原设计(HPV设计1-5)。实施例1-3详述了各HPV抗原设计的详细方法。对于RNA qPCR相对表达试验,5’-TGCCAAGAGTGACGTGTCCA-3’(SEQ ID NO:110)用作剪接引物,而5’-CCCAGGTCCAACTGCAGCCGG-3’(SEQ ID NO:111)用作剪接探针。针对各种抗原设计的特异性引物用作反向引物(图6)。
递送系统
大猩猩腺病毒穿梭载体
本公开的某些方面涉及包含编码多肽的多核苷酸的载体,所述多肽包含本文所述的一个或多个免疫应答诱导HPV多肽。在某些实施方式中,载体是病毒载体。在特定实施方式中,载体是腺病毒载体。腺病毒通常与人的良性病理相关联,并且人们已经广泛地研究了分离自多种物种(包括人)的腺病毒基因组。腺病毒是中等大小(90-100nm)的非包膜二十面体病毒,其包含约36kb的双链DNA。腺病毒衣壳介导病毒感染细胞早期阶段的关键相互作用,并且是在腺病毒生命周期结束时包装腺病毒基因组所必需的。衣壳包含252个壳粒,其包含240个六邻体,12个五邻体基(base)蛋白和12个纤维(Ginsberg等,Virology,28:782-83(1966))。六邻体包含三个相同的蛋白质,即多肽II(Roberts等,Science,232:1148-51(1986))。五邻体基包含五个相同的蛋白质,而纤维包含三个相同的蛋白质。蛋白质IIIa、VI和IX存在于腺病毒包被中并据信可以稳定病毒衣壳(Stewart等,Cell,67:145-54(1991),和Stewart等,EMBO J.,12(7):2589-99(1993))。除pIX外,衣壳蛋白的表达取决于腺病毒聚合酶蛋白。因此,只有存在并表达聚合酶蛋白基因时,腺病毒颗粒的主要成分才由基因组表达。
腺病毒的几个特征使其成为用于将遗传物质转移到细胞用于治疗应用(即“基因治疗”)或用作疫苗应用的抗原递送系统的理想载剂。例如,腺病毒可以高效价(例如,约1013颗粒单位(pu))产生,并且可以将遗传物质转移到非复制和复制细胞。可以操作腺病毒基因组以携带大量外源DNA(最多约8kb),并且腺病毒衣壳可以增强转移更长的序列(Curiel等,Hum.Gene Ther.,3:147-154(1992))。此外,腺病毒通常不整合到宿主细胞染色体中,而是以线性附加体维持,从而使重组腺病毒干扰正常细胞功能的可能性降至最低。
在一些实施方式中,本文所述的腺病毒分离自大猩猩。在东部大猩猩(Gorillaberingei)和西部大猩猩(Gorilla gorilla)两个物种中存在4个公认的大猩猩亚种。西部大猩猩物种包括西部低地大猩猩(Gorilla gorilla gorilla)和克罗斯河大猩猩(Gorillagorilla diehli)亚种。东部大猩猩物种包括山地大猩猩(Gorilla beringei beringei)和东部低地大猩猩(Gorilla beringei graueri)亚种(参见例如,Wilson和Reeder编著,《世界哺乳动物物种》(Mammalian Species of the World),第3版,约翰霍普金斯大学出版社(Johns Hopkins University Press),马里兰州巴尔的摩市(2005))。在一些实施方式中,本公开的腺病毒分离自山地大猩猩(Gorilla beringei beringei)。
国际专利申请公开号WO 2013/052832;WO 2013/052811;和WO 2013052799中描述了各种大猩猩腺病毒或腺病毒载体,其各自通过引用其全部内容纳入本文。
已经分析了几种这类腺病毒的基因组,并且已经确定该腺病毒可以具有核酸序列,例如SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25的核酸序列,其各自包含多个子序列,所述子序列用于独特地限定腺病毒,即核酸序列SEQ IDNO:1-10,和氨基酸序列SEQ ID NO:11-20。SEQ ID NO:6-10分别编码氨基酸序列SEQ IDNO:16-20。SEQ ID NO:1-5分别是核酸序列SEQ ID NO:6-10的子集。SEQ ID NO:11-15分别是氨基酸序列SEQ ID NO:16-20的子集。
可以以与先前已知的腺病毒相同的方式修饰腺病毒以用作腺病毒载体,例如,基因递送载体。腺病毒和腺病毒载体可以具有复制能力,具有条件复制型能力或复制缺陷型。
具有复制能力的腺病毒或腺病毒载体可以在典型的宿主细胞(即,通常能够被腺病毒感染的细胞)中复制。相较于野生型腺病毒,具有复制能力的腺病毒或腺病毒载体在不抑制宿主细胞中病毒复制的腺病毒基因组中可以具有一个或多个突变(例如,一个或多个缺失、插入和/或取代)。例如,腺病毒或腺病毒载体可以具有称为E3区的腺病毒早期区域的部分或全部缺失,所述E3区对于腺病毒或腺病毒基因组的增殖不是必需的。
条件复制型腺病毒或腺病毒载体是经工程改造以在预定条件下复制的腺病毒或腺病毒载体。例如,复制必需的基因功能,例如,由腺病毒早期区域编码的基因功能,可以操作性连接诱导型,抑制型或组织特异型转录控制序列,例如,启动子。在这类实施方式中,复制需要存在或不存在与转录控制序列相互作用的特定因子。条件复制型腺病毒载体在美国专利5,998,205中进一步描述。
复制缺陷型腺病毒或腺病毒载体是这样的腺病毒或腺病毒载体,由于例如一个或多个复制必需基因功能或区域中的缺陷,其需要补足复制所需的一个或多个腺病毒基因组区域或基因功能,从而使腺病毒或腺病毒载体不在常规的宿主细胞中复制,特别是待被腺病毒或腺病毒载体感染的人中的那些。
本文所用基因功能或基因组区域中的缺陷被定义为腺病毒基因组足够遗传物质的破坏(例如,缺失),所述破坏(例如,缺失)足以消除或削弱核酸序列被整体或部分破坏(例如,缺失)的基因的功能(例如,使基因产物的功能降低至少约2倍、5倍、10倍、20倍、30倍或50倍)。复制必需基因功能的破坏通常不需要使整个基因区域缺失。然而,为了在腺病毒基因组中为一个或多个转基因提供足够的空间,可能需要去除一个或多个基因区域的大部分。虽然优选缺失遗传物质,但是通过添加或取代来使遗传物质突变也适用于破坏基因功能。复制必需基因功能是腺病毒复制(例如,增殖)所需的那些基因功能,并且由例如腺病毒早期区域(例如,E1、E2和E4区域)、晚期区域(例如,L1、L2、L3、L4和L5区)、涉及病毒包装的基因(例如,IVa2基因)和病毒相关RNA(例如,VA-RNA-1和/或VA-RNA-2)所编码。
无论腺病毒或腺病毒载体是是具有复制能力的还是复制缺陷型的,腺病毒或腺病毒载体都保留了腺病毒基因组的至少部分。腺病毒或腺病毒载体可以包含腺病毒基因组的任何部分,包括蛋白质编码区和非蛋白质编码区。理想地,腺病毒或腺病毒载体包含编码腺病毒蛋白的至少一种核酸序列。腺病毒或腺病毒载体可以包含编码任何合适腺病毒蛋白的核酸序列,例如,由早期区域基因(即E1A、E1B、E2A、E2B、E3和/或E4区域)中任一种编码的蛋白质,或由晚期区域基因中任一种编码的蛋白质,它们编码病毒结构蛋白(即L1、L2、L3、L4和L5区域)。
理想地是,腺病毒或腺病毒载体包含编码pIX蛋白、DNA聚合酶蛋白、五邻体(penton)蛋白、六邻体蛋白和/或纤维蛋白中的一种或多种核酸序列。腺病毒或腺病毒载体可以包含编码腺病毒蛋白全长氨基酸序列的全长核酸序列。或者,腺病毒或腺病毒载体可以包含编码腺病毒蛋白的全长氨基酸序列的部分的全长核酸序列的部分。
核酸序列的“部分”包含至少10个核苷酸(例如,约10-约5000个核苷酸)。优选地,核酸序列的“部分”包含10或更多个(例如,15或更多个,20或更多个,25或更多个,30或更多个,35或更多个,40或更多个,45或更多个,50或更多个或100或更多个)核苷酸,但少于5,000个(例如,4900或更少个,4000或更少个,3000或更少个,2000或更少个,1000或更少个,800或更少个,500或更少个,300或更少个或100或更少个)核苷酸。优选地,部分核酸序列是约10-约3500个核苷酸(例如,约10、20、30、50、100、300、500、700、1000、1500、2000、2500或3000个核苷酸),约10-约1000个核苷酸(例如,约25、55、125、325、525、725或925个核苷酸),或约10-约500个核苷酸(例如,约15、30、40、50、60、70、80,90、150、175、250、275、350、375、450、475、480、490、495或499个核苷酸),或上述任意两个值定义的范围。更优选地,核酸序列的“部分”包含不超过约3200个核苷酸(例如,约10-约3200个核苷酸,约10-约3000个核苷酸或约30-约500个核苷酸,或由上述任意两个值定义的范围)。
氨基酸序列的“部分”包含至少3个氨基酸(例如,约3-约1200个氨基酸)。优选地,氨基酸序列的“部分”包含3或更多个(例如,5或更多个,10或更多个,15或更多个,20或更多个,25或更多个,30或更多个,40或更多个或50或更多个)氨基酸,但少于1,200个(例如,1,000或更少个,800或更少个,700或更少个,600或更少个,500或更少个,400或更少个,300或更少个,200或更少个或100或更少个)氨基酸。优选地,部分氨基酸序列是约3-约500个氨基酸(例如,约10、100、200、300、400或500个氨基酸),约3-约300个氨基酸(例如,约20、50、75、95、150、175或200个氨基酸),或约3-约100个氨基酸(例如,约15、25、35、40、45、60、65、70、80、85、90、95或99个氨基酸),或上述任意两个值定义的范围。更优选地,氨基酸序列的“部分”包含不超过约500个氨基酸(例如,约3-约400个氨基酸,约10-约250个氨基酸或约50-约100个氨基酸,或上述任意两个值定义的范围)。
腺病毒pIX蛋白存在于腺病毒衣壳中,已经证明能够增强六邻体(hexon)九聚体(nonamer)相互作用,并且对于包装全长基因组十分重要(参见例如,Boulanger等,J.Gen.Virol.,44:783-800(1979);Horwitz M.S.,“腺病毒及其复制(Adenoviridae andtheir replication)”刊载于Virology,第2版本,B.N.Fields等(编著),雷文出版社股份有限公司(Raven Press,Ltd.),纽约,第1679-1721页(1990),Ghosh-Choudhury等,EMBO J.,6:1733-1739(1987),和van Oostrum等,J.Virol.,56:439-448(1985))。除了其对腺病毒结构的影响,还已经证明pIX显示出转录特性,如刺激腺病毒主要晚期启动子(MLP)活性(参见例如,Lutz等,J.Virol.,71(7):5102-5109(1997))。编码全部或部分腺病毒pIX蛋白的核酸序列包括例如SEQ ID NO:6和SEQ ID NO:1。包含全长pIX蛋白或其部分的氨基酸序列包括例如SEQ ID NO:16和SEQ ID NO:11。
腺病毒DNA聚合酶蛋白对于病毒DNA的体外和体内复制都是十分重要的。聚合酶以伴随末端蛋白(TP)的前体(pTP)的复合物形式共纯化(co-purify),其共价连接至腺病毒DNA的5'端(Field等,J.Biol.Chem.,259:9487-9495(1984))。腺病毒DNA聚合酶和pTP由E2区编码。除了pIX以外,聚合酶蛋白为所有结构蛋白的表达所需。若没有聚合酶蛋白的基因序列,则不会产生聚合酶蛋白。结果,病毒基因组不被复制,主要晚期启动子不被激活并且衣壳蛋白不被表达。编码全部或部分腺病毒DNA聚合酶蛋白的核酸序列包括,例如,SEQ IDNO:7和SEQ ID NO:2。包含全长腺病毒DNA聚合酶或其部分的氨基酸序列包括例如,SEQ IDNO:17和SEQ ID NO:12。
腺病毒六邻体蛋白是腺病毒衣壳中最大和最丰富的蛋白质。六邻体蛋白对于病毒衣壳组装,确定衣壳的二十面体对称性(其反过来定义对衣壳体积和DNA包装大小的限制)以及衣壳完整性至关重要。另外,六邻体是修饰的主要靶标以减少腺病毒载体的中和(参见例如,Gall等,J.Virol.,72:10260-264(1998)和Rux等,J.Virol.,77(17):9553-9566(2003))。腺病毒各种血清型共有六邻体蛋白的主要结构特征,但腺病毒不同血清型的六邻体蛋白的大小和免疫学性质不同(Jornvall等,J.Biol.Chem.,256(12):6181-6186(1981))。比较15个腺病毒六邻体蛋白发现,六邻体的主要抗原性和血清型特异性区域似乎在环1和环2中(即,分别为LI或l1和LII或l2),其中实在腺病毒不同血清型之间长度和序列发生变化的7个独立的高变区(HVR1-HVR7)(Crawford-Miksza等,J.Virol.,70(3):1836-1844(1996))。编码全部或部分腺病毒六邻体蛋白的核酸序列包括例如SEQ ID NO:9和SEQID NO:4。包含全长腺病毒六邻体蛋白或其部分的氨基酸序列包括例如,SEQ ID NO:19和SEQ ID NO:14。
腺病毒纤维蛋白是腺病毒多肽IV的同三聚体,其具有三个结构域:尾、杆(shaft)和结(knob)。(Devaux等,J.Molec.Biol.,215:567-88(1990),Yeh等,Virus Res.,33:179-98(1991))。纤维蛋白介导与细胞表面上的受体的初级(primary)病毒结合,其通过所述结结构域与杆结构域发生(Henry等,J.Virol.,68(8):5239-46(1994))。三聚化的氨基酸序列位于节中,这似乎是纤维的氨基末端(尾部)五邻体基(penton base)结合所必须的(Novelli等,Virology,185:365-76(1991))。除了识别细胞受体并结合五邻体基,纤维还导致血清型相同性。来自不同腺病毒血清型的纤维蛋白差异很大(参见例如,Green等,EMBOJ.,2:1357-65(1983),Chroboczek等,Virology,186:280-85(1992),和Signas等,J.Virol.,53:672-78(1985))。因此,纤维蛋白具有对于腺病毒生命周期而言关键的多种功能。编码全部或部分腺病毒纤维蛋白的核酸序列包括例如SEQ ID NO:10和SEQ ID NO:5。包含全长腺病毒纤维蛋白或其部分的氨基酸序列包括例如,SEQ ID NO:20和SEQ ID NO:15。
五邻体基蛋白位于二十面体衣壳的顶点并包含五个相同的单体。五邻体基蛋白提供了用于桥接二十面体衣壳多个面上六邻体蛋白的结构,并提供了用于将纤维蛋白纳入衣壳的基本接合处(interface)。五邻体基的各单体包含RGD三肽基序(Neumann等,Gene,69:153-157(1988))。RGD三肽介导与αv整联蛋白的结合,并且在五邻体基RGD序列中具有点突变的腺病毒感染细胞的能力受到限制(Bai等,J.Virol.,67:5198-5205(1993))。因此,五邻体基蛋白对于衣壳的结构以及对于病毒-细胞相互作用的最大效率而言是必不可少的。编码全部或部分腺病毒五邻体基蛋白的核酸序列包括,例如,SEQ ID NO:8和SEQ ID NO:3。。包含全长腺病毒五邻体基蛋白或其部分的氨基酸序列包括例如,SEQ ID NO:18和SEQ IDNO:13。
本文所述核酸或氨基酸序列的“相同性”可以通过将感兴趣的核酸或氨基酸序列与参照核酸或氨基酸序列进行比较来确定。对参考序列中已经改变和/或修饰(例如,通过点突变、插入或缺失)从而产生感兴趣的序列的核苷酸或氨基酸残基的数量进行计数。从感兴趣序列的总长度中减去这类改变的总数,并且将该差值除以感兴趣序列的长度并表示为百分比。用于获得两个或更多个序列之间的最佳比对和计算相同性的多种数学算法是已知的,并且纳入了多种可用的软件程序中。这类程序的示例包括CLUSTAL-W、T-Coffee和ALIGN(用于比对核酸和氨基酸序列),BLAST程序(例如,BLAST 2.1、BL2SEQ及其更高版本)和FASTA程序(例如,FASTA3x、FASTM和SSEARCH)(用于序列比对和序列相似性搜索)。序列比对算法还公开于,例如,Altschul等,J.Molecular Biol.,215(3):403-410(1990),Beigert等,Proc.Natl.Acad.Sci.USA,106(10):3770-3775(2009),Durbin等编著,《生物序列分析:蛋白质和核酸的概率模型》(Biological Sequence Analysis:Probabilistic Models ofProteins and Nucleic Acids),剑桥大学出版社(Cambridge University Press),英国剑桥(2009),Soding,《生物信息学》(Bioinformatics),21(7):951-960(2005),Altschul等,Nucleic Acids Res.,25(17):3389-3402(1997),和Gusfield,《有关串、树和序列的算法》(Algorithms on Strings,Trees and Sequences),剑桥大学出版社,英国剑桥(1997))。
腺病毒或腺病毒载体可以单独或以任何组合包含1、2、3、4或全部5个上述序列。在该方面中,腺病毒或腺病毒载体可以包含上述序列中任意2个的任何组合,上述序列中的任意3个的任何组合,上述序列的任意4个的任何组合或上述序列的所有5个。
如本文所讨论,腺病毒或腺病毒载体可以是具有复制能力的,条件复制型的或复制缺陷型的。优选地,腺病毒或腺病毒载体是复制缺陷型的,从而使复制缺陷型腺病毒或腺病毒载体需要补足一个或多个腺病毒基因组区域中的至少一个复制必需基因功能,用于增殖(例如,以形成腺病毒载体颗粒)。
复制缺陷型腺病毒或腺病毒载体可以任何合适的方式修饰,以在用于增殖的腺病毒基因组的一个或多个区域中导致一个或多个复制必需基因功能的缺陷。补足腺病毒基因组一个或多个区域的一个或多个复制必需基因功能的缺陷指使用外源手段提供缺陷的复制必需基因功能。这类补足可以任何合适的方式来实现,例如,通过使用编码被破坏的复制必需基因功能的补偿性细胞和/或外源DNA(例如,辅助腺病毒)。
腺病毒或腺病毒载体可以仅在腺病毒基因组的早期区域(即E1-E4区域)、仅在腺病毒基因组的晚期区域(即L1-L5区域)、腺病毒基因组的早期和晚期区域或所有腺病毒基因(即,高容量腺载体(HC-Ad))缺少一个或多个复制必需基因功能。参见,Morsy等,Proc.Natl.Acad.Sci.USA,95:965-976(1998);Chen等,Proc.Natl.Acad.Sci.USA,94:1645-1650(1997);和Kochanek等,Hum.Gene Ther.,10:2451-2459(1999)。复制缺陷型腺病毒载体的示例公开于美国专利号5,837,511;5,851,806;5,994,106;6,127,175;6,482,616;和7,195,896,和国际专利申请公开号WO 1994/028152、WO 1995/002697、WO 1995/016772、WO 1995/034671、WO 1996/022378、WO 1997/012986、WO 1997/021826和WO 2003/022311中。
腺病毒基因组的早期区域包括E1、E2、E3和E4区域。E1区域包含E1A和E1B子区域,并且E1区域中复制必需基因功能的一个或多个缺陷可以包括E1A和E1B子区域任一或两者中复制必需基因功能的一个或多个缺陷,从而需要补足腺病毒基因组的E1A子区域和/或E1B子区域,用于腺病毒或腺病毒载体增殖(例如,形成腺病毒载体颗粒)。E2区域包含E2A和E2B子区域,并且E2区域中复制必需基因功能的一个或多个缺陷可以包括E2A和E2B子区域任一或两者中复制必需基因功能的一个或多个缺陷,从而需要补足腺病毒基因组的E2A子区域和/或E2B子区域,用于腺病毒或腺病毒载体增殖(例如,形成腺病毒载体颗粒)。
E3区不包含任何复制必需基因功能,从而使得E3区的部分或完全缺失不需要补足E3区的任何基因功能用于腺病毒或腺病毒载体增殖(例如,以形成腺病毒载体颗粒)。在本公开的上下文中,E3区域定义为这样的区域,其从编码与来自人腺病毒5的E3区域的12.5K蛋白具有高度同源性的蛋白质(NCB1参照序列AP_000218)的开放阅读框开始到编码与来自人腺病毒5的E3区域的14.7K蛋白具有高度同源性的蛋白质(NCB1参照序列AP_000224.1)的开放阅读框结束。E3区域可以全部或部分缺失,也可以全部或部分保留。可以定制缺失的大小,从而保留其基因组与最佳基因组包装大小紧密匹配的腺病毒或腺病毒载体。较大的缺失将适应较大的异源核酸序列在腺病毒或腺病毒基因组中的插入。在本公开的一个实施方式中,保留了位于E3区域中的L4聚腺苷酸化信号序列。
E4区域包括多个开放阅读框(ORF)。其中除了ORF6(和在一些情况中为ORF3)以外的E4区域的所有开放阅读框缺失的腺病毒或腺病毒载体不需补足E4区域的任何基因功能用于使腺病毒或腺病毒载体增殖(例如,以形成腺病毒载体颗粒)。相反,如下的腺病毒或腺病毒载体需要补足E4区(具体地,补足E4区域的ORF6和/或ORF3)用于使该腺病毒或腺病毒载体增殖,所述腺病毒或腺病毒载体存在E4区域ORF6(和在一些情况中为ORF3)的破坏或缺失(例如,基于E4区域的ORF6和/或ORF3的复制必需基因功能中存在缺陷),存在或不存在天然E4启动子、聚腺苷酸化序列和/或右侧反向末端重复序列(ITR)或E4区域其它开放阅读框中任一个的破坏或缺失。腺病毒基因组的晚期区域包括L1、L2、L3、L4和L5区域。如国际专利申请公开号WO 2000/000628中所讨论,腺病毒或腺病毒载体还可以在主要晚期启动子(MLP)中具有突变,如果需要,其可以使腺病毒或腺病毒载体成为复制缺陷型的。
理想地,包含复制必需基因功能的一个或多个缺陷的腺病毒基因组的一个或多个区域是腺病毒基因组的一个或多个早期区域,即,E1、E2和/或E4区域,任选地,存在部分或全部E3缺失。
相较于野生型腺病毒,复制缺陷型腺病毒或腺病毒载体在腺病毒基因组中还可以具有不抑制宿主细胞中病毒复制的一个或多个突变(例如,一个或多个缺失、插入和/或取代)。因此,除了复制必需基因功能中的一个或多个缺陷外,腺病毒或腺病毒载体在非复制必需的其它方面可能是有缺陷的。例如,腺病毒或腺病毒载体可以具有称为E3区的腺病毒早期区域的部分或全部缺失,所述E3区对于腺病毒或腺病毒基因组的增殖不是必需的。
在一个实施方式中,腺病毒或腺病毒载体是复制缺陷型的,并且至多需要补足腺病毒基因组的E1区域或E4区域,用于增殖(例如,形成腺病毒载体颗粒)。因此,复制缺陷型腺病毒或腺病毒载体需要补足腺病毒基因组E1A子区域和/或E1B区域(称为E1缺陷型腺病毒载体)或腺病毒基因组E4区域(称为E4缺陷型腺病毒载体)的至少一个复制必需基因功能,用于增殖(例如,形成腺病毒载体颗粒)。腺病毒或腺病毒载体可以在腺病毒基因组E1区的至少一个复制必需基因功能(理想地是所有复制必需基因功能)和腺病毒基因组非必需E3区的至少一个基因功能中存在缺陷(称为E1/E3缺陷型腺病毒载体)。腺病毒或腺病毒载体可以在腺病毒基因组E4区的至少一个复制必需基因功能(理想地是所有复制必需基因功能)和腺病毒基因组非必需E3区的至少一个基因功能中存在缺陷(称为E3/E4缺陷型腺病毒载体)。
在一个实施方式中,腺病毒或腺病毒载体是复制缺陷型的,并且至多需要补足腺病毒基因组的E2区域,优选E2A子区域,用于增殖(例如,形成腺病毒载体颗粒)。因此,复制缺陷型腺病毒或腺病毒载体需要补足腺病毒基因组E2A子区域的至少一个复制必需基因功能(称为E2A缺陷型腺病毒载体),用于增殖(例如,形成腺病毒载体颗粒)。腺病毒或腺病毒载体可以在腺病毒基因组E2A区的至少一个复制必需基因功能(理想地是所有复制必需基因功能)和腺病毒基因组非必需E3区的至少一个基因功能中存在缺陷(称为E2A/E3缺陷型腺病毒载体)。
在一个实施方式中,腺病毒或腺病毒载体是复制缺陷型的,并且至多需要补足腺病毒基因组的E1和E4区域,用于增殖(例如,形成腺病毒载体颗粒)。因此,复制缺陷型腺病毒或腺病毒载体需要补足腺病毒基因组E1和E4区域两者的至少一个复制必需基因功能(称为E1/E4缺陷型腺病毒载体),用于增殖(例如,形成腺病毒载体颗粒)。腺病毒或腺病毒载体可以在腺病毒基因组E1区的至少一个复制必需基因功能(理想地是所有复制必需基因功能)、腺病毒E4区域的至少一个复制必需基因功能和腺病毒基因组非必需E3区的至少一个基因功能中存在缺陷(称为E1/E3/E4缺陷型腺病毒载体)。优选地,腺病毒或腺病毒载体需要至多补足腺病毒基因组的E1区域用于增殖,并且不需要补足腺病毒基因组的其它任何缺陷用于增殖。更优选地,腺病毒或腺病毒载体需要至多补足腺病毒基因组的E1和E4区域用于增殖,并且不需要补足腺病毒基因组的其它任何缺陷用于增殖。
当腺病毒基因组的多个复制必需基因功能中存在缺陷时(例如,E1/E4缺陷型腺病毒载体),腺病毒或腺病毒载体可以包含间隔子序列,以在补偿性细胞系中提供病毒生长,类似于由在单一复制必需基因功能中存在缺陷的腺病毒或腺病毒载体(例如,E1缺陷型腺病毒载体)所实现的病毒生长。间隔子序列可以包含具有所需长度的任何核苷酸序列,如长度为这样的序列:至少约15个碱基对(例如,约15个核苷酸-约12,000个核苷酸),优选约100个核苷酸-约10,000个核苷酸,更优选约500个核苷酸-约8,000个核苷酸,甚至更优选约1,500个核苷酸-约6,000个核苷酸,并且最优选约2,000-约3,000个核苷酸,或由前述值中任意两个所限定的范围。间隔子序列相对于腺病毒基因组可以是编码的或非编码的和天然的或非天然的,但是不能将复制必需功能恢复到缺陷型区域。间隔子还可以包含表达盒。更优选地,间隔子包含相对于腺病毒或腺病毒载体而言非天然的聚腺苷酸化序列和/或基因。在例如美国专利号5,851,806和国际专利申请公开号WO 1997/021826中进一步描述了在腺病毒载体中使用间隔子。
通过去除全部或部分腺病毒基因组,例如,腺病毒基因组的E1、E3和E4区域,所得腺病毒或腺病毒载体能够接受外源性核酸序列的插入,同时保留包装到腺病毒衣壳中的能力。可以将外源性核酸序列插入腺病毒基因组中的任何位置,只要该位置中的插入允许形成腺病毒或腺病毒载体颗粒。外源性核酸序列优选位于腺病毒基因组的E1区域、E3区域或E4区域。
本公开的复制缺陷型腺病毒或腺病毒载体可以在这样的补偿性细胞系中产生:所述补偿性细胞系以适当的水平提供复制缺陷型腺病毒或腺病毒载体中不存在但病毒增殖所需的基因功能,从而生成高效价的病毒载体储液。这类补偿性细胞系是已知的并且包括但不限于293细胞(述于例如,Graham等,J.Gen.Virol.,36:59-72(1977)),PER.C6细胞(述于例如国际专利申请公开号WO 1997/000326,和美国专利号5,994,128和6,033,908),和293-ORF6细胞(述于例如,国际专利申请公开号WO 95/34671和Brough等,J.Virol.,71:9206-9213(1997))。产生本公开复制缺陷型腺病毒或腺病毒载体的其它合适补偿性细胞系包括这样的补偿性细胞,所述补偿性细胞已经产生以使编码其表达抑制宿主细胞中病毒生长的转基因的腺病毒载体增殖(参见例如美国专利申请公开号2008/0233650)。美国专利号6,677,156和6,682,929和国际专利申请公开号WO 2003/020879中描述了其它合适的补偿性细胞。在一些情况下,细胞基因组不需要包含核酸序列,其基因产物补足复制缺陷型腺病毒载体的所有缺陷。复制缺陷型腺病毒载体中缺乏的一个或多个复制必需基因功能可以通过辅助病毒提供,例如,腺病毒载体以反式提供复制缺陷型腺病毒或腺病毒复制所需的一个或多个基本基因功能。或者,本发明的腺病毒或腺病毒载体可以包含非天然复制必需基因,其补足本发明的复制缺陷型腺病毒或腺病毒载体中缺乏的一个或多个复制必需基因功能。例如,可以对E1/E4缺陷型腺病毒载体进行工程改造,以使其包含编码E4 ORF 6的核酸序列,其获自或衍生自不同腺病毒(例如,与本发明的腺病毒或腺病毒载体不同血清型的腺病毒,或与本发明的腺病毒或腺病毒载体不同种类的腺病毒)。
腺病毒或腺病毒载体可以进一步包含转基因。术语“转基因”在本文中定义为与适当调控元件(例如,启动子)操作性连接的非天然核酸序列,从而使非天然核酸序列可以表达以产生蛋白质(例如,肽或多肽)。调节元件(例如,启动子)对于腺病毒或腺病毒载体可以是天然的或非天然的。
“非天然”核酸序列是任何核酸序列(例如,DNA、RNA或cDNA序列),其不是腺病毒在天然产生位置中天然产生的核酸序列。因此,非天然核酸序列可以天然存在于腺病毒中,但是位于腺病毒基因组内的非天然位置和/或操作性连接非天然启动子。术语“非天然核酸序列”、“异源性核酸序列”和“外源性核酸序列”是同义的并且可以在本公开的上下文中互换使用。非天然核酸序列优选是DNA,并且优选编码蛋白质(即,编码一种或多种蛋白质的一个或多个核酸序列)。
非天然核酸序列可以编码治疗性蛋白质,其可以用于预防性或治疗性治疗哺乳动物疾病。合适的治疗性蛋白质的示例包括:细胞因子、毒素、肿瘤抑制蛋白、生长因子、激素、受体、分裂素、免疫球蛋白、神经肽、神经递质和酶。或者,非天然核酸序列可以编码病原体(例如,细菌或病毒)的抗原,并且腺病毒或腺病毒载体可以用作疫苗。
基于病毒的递送系统
本公开还提供了递送系统,如基于病毒的系统,其中插入了本文所述的核酸。代表性的病毒表达载体包括但不限于,腺相关病毒载体,基于腺病毒的载体,基于慢病毒的载体,逆转录病毒载体和基于疱疹病毒的载体。在一实施方式中,病毒载体是慢病毒载体。源自逆转录病毒如慢病毒的载体是实现长期基因转移的合适工具,因为其允许转基因的长期、稳定整合及其在子细胞中的增殖。慢病毒载体相比衍生自癌逆转录病毒如鼠白血病病毒的载体具有更多的优势,因为它们可以转导非增殖细胞如肝细胞。它们还具有低免疫原性的额外优势。在另一实施方式中,病毒载体是腺相关病毒载体。在另一实施方式中,病毒载体是逆转录病毒载体。通常,并且在实施方式中,合适的载体含有在至少一个生物体中起作用的复制起点,启动子序列,方便的限制性内切核酸酶位点和一个或多个选择性标志物。
其它合适的载体包括整合表达载体,其可以随机整合到宿主细胞的DNA中,或者可以包括重组位点,以实现表达载体和宿主细胞的染色体之间的特异性重组。这类整合表达载体可以利用宿主细胞染色体的内源性表达控制序列以实现所需蛋白质的表达。以位点特异性方式整合的载体的示例包括,例如,来自英杰公司(Invitrogen)(加利福尼亚州卡尔斯巴德)的flp-in系统的组分(例如,pcDNATM5/FRT)或cre-lox系统,如可以存在于司查塔基公司(Stratagene)(加利福尼亚州拉由拉市)的pExchange-6核心载体。随机整合到宿主细胞染色体中的载体的示例包括,例如,来自英杰公司(加利福尼亚州卡尔斯巴德)的pcDNA3.1(当在不存在T抗原的情况下引入),和普洛麦格公司(Promega)(威斯康星州麦迪逊)的pCI或pFN10A(ACT)FLEXITM。其它启动子元件,例如增强子,调控转录启动的频率。通常,这些位于起始位点上游30-110bp的区域中,虽然最近已经证明几种启动子在起始位点的下游也含有功能元件。启动子元件之间的间隙通常是柔性的,使得当元件翻转或相对于彼此移动时保留启动子功能。在胸苷激酶(tk)启动子中,在活性开始减弱之前,启动子元件之间的间距可增加到50bp。取决于启动子,单个元件似乎可协同或单独发挥作用以激活转录。
合适的启动子的一个示例是即刻早期巨细胞病毒(CMV)启动子序列。该启动子序列是强组成型启动子序列,其能够驱动与其操作性连接的任何多核苷酸序列的高水平表达。
然而,也可以使用其它组成型启动子序列,包括但不限于,猿猴病毒40(SV40)早期启动子,小鼠乳腺肿瘤病毒(MMTV),人免疫缺陷病毒(HIV)长末端重复序列(LTR)启动子,MoMuLV启动子,禽白血病病毒启动子,EB病毒立即早期启动子,鲁斯氏肉瘤病毒启动子,以及人基因启动子,诸如但不限于,肌动蛋白启动子,肌球蛋白启动子,血红蛋白启动子和肌酸激酶启动子。此外,本公开不应当被限制于使用组成型启动子。还考虑了诱导型启动子作为本公开的部分。诱导型启动子的使用提供了一种分子开关,其能够在需要与其操作性连接的多核苷酸序列表达时开启这样的表达,或者在不需要表达时关闭这样的表达。诱导型启动子的示例包括但不限于,金属硫蛋白启动子,糖皮质激素启动子,孕酮启动子和四环素启动子。
报告基因可以用于鉴定潜在转染的细胞和用于评估调节序列的功能。通常,报告基因是这样的基因,其在受体生物体或组织中不存在或不表达并且编码多肽,所述多肽的表达通过一些易于检测的性质例如酶活性予以显示。在将DNA引入受体细胞后的合适时间测定报告基因的表达。合适的报告基因可以包括这样的基因,其编码荧光素酶,β-半乳糖苷酶,氯霉素乙酰转移酶,分泌型碱性磷酸酶或绿色荧光蛋白基因(例如,Ui-Tei等,FEBSLetters 479:79-82(2000))。合适的表达系统是众所周知的,并且可以使用已知技术制备或通过商购获得。通常,将显示最高水平报告基因表达的具有最小5'侧接区域的构建体鉴定为启动子这类启动子区域可与报告基因连接并用于评估试剂调节启动子驱动的转录的能力。
将基因引入细胞和表达基因的方法是本领域已知的。在表达载体的情况下,可以通过本领域的任何方法将载体容易地引入宿主细胞,例如,哺乳动物、细菌、酵母或昆虫细胞。例如,可以通过物理、化学或生物学手段将表达载体转移到宿主细胞中。
用于将多核苷酸引入宿主细胞的物理方法包括磷酸钙沉淀、脂质转染、粒子轰击、显微注射、电穿孔等。产生包含载体和/或外源核酸的细胞的方法为本领域所熟知。参见例如,Sambrook等(《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),冷泉港出版社(Cold Spring Harbor Laboratory),纽约(2001))。在实施方式中,将多核苷酸引入宿主细胞的方法是磷酸钙转染或聚乙烯亚胺(PEI)转染。
用于将感兴趣的多核苷酸引入宿主细胞的生物学方法包括使用DNA和RNA载体。病毒载体,尤其是逆转录病毒载体,已经成为用于基因插入哺乳动物例如人细胞中最广泛使用的方法。其它病毒载体可以源自慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺相关病毒等。参见例如,美国专利号5,350,674和5,585,362。
基于非病毒的递送系统
用于将多核苷酸导入宿主细胞的化学方法包括胶体分散系统,例如大分子复合物,纳米胶囊,微球,珠和基于脂质的系统,包括水包油乳剂,胶束,混合胶束和脂质体。用作体外和体内递送载剂的示例性胶体系统是脂质体(例如,人造膜囊泡)。
考虑使用脂质制剂将核酸引入宿主细胞(体外、离体或体内)。在另一方面中,核酸可以与脂质连接。与脂质相关的核酸可以被包封在脂质体的水性内部,散布在脂质体的脂质双层内,经由与脂质体和寡核苷酸相关的连接分子与脂质体接合,包埋在脂质体中,与脂质体复合,分散于含有脂质的溶液中,与脂质混合,与脂质组合,其作为脂质中的悬浮液包含,包含胶束或与之复合,或以其它方式与脂质关联。脂质、脂质/DNA或脂质/表达载体相关组合物不限于溶液中的任何特定结构。例如,它们可以以双层结构、胶束或“塌陷”结构存在。它们也可以简单地散布在溶液中,有可能形成大小或形状不均匀的聚集体。脂质是脂肪物质,其可以是天然或合成脂质。例如,脂质包括天然存在于胞质中的脂肪滴以及包含长链脂族烃及其衍生物的一类化合物,如脂肪酸、醇、胺、氨基醇和醛。
适合使用的脂质可以从商业来源获得。例如,二肉豆蔻基磷脂酰胆碱(“DMPC”)可以获自密苏里州圣路易斯的西格玛公司(Sigma,St.Louis,Mo.);磷酸二十六烷基酯(“DCP”)可以获自从K&K实验室(纽约州普莱恩维尤);胆固醇(“Choi)可以获自卡巴开-贝林公司(Calbiochem-Behring);肉豆蔻基磷脂酰甘油(“DMPG”)和其它脂质可以获自阿凡提极性脂质制品有限公司(Avanti Polar Lipids,Inc.)(阿拉巴马州的伯明翰)。在氯仿或氯仿/甲醇脂质储液可以储存在约-20℃。氯仿用作唯一的溶剂,因为它比甲醇更容易蒸发。”脂质体“是通用术语,包括通过产生封闭的脂质双分子层或聚集体形成的各种单层和多层脂质载体。脂质体可以表征为具有囊泡结构,该囊泡结构具有磷脂双层膜和内部水性介质。多层脂质体具有水性介质隔开的多重脂质层。当磷脂悬浮在过量水溶液中时其自动形成。脂质组分在形成闭合结构之前经历自我重排,并且在脂质双层之间捕获水和溶解的溶质(Ghosh等,Glycobiology 5:505-10(1991))。然而,也包括在溶液中具有与正常囊泡结构不同结构的组合物。例如,脂质可以采取胶束结构或仅作为脂质分子的不均匀聚集体存在。还考虑了脂质体(lipofectamine)-核酸复合物。
在一些实施方式中,也可以使用基于非病毒的递送系统,如“睡美人(SB)转座子系统”将编码多肽的多核苷酸引入细胞,所述SB转座子系统是指用于将DNA序列导入脊椎动物染色体的合成DNA转座子系统。该系统的一些示例性实施方式述于例如美国专利号6,489,458和8,227,432。睡美人转座子系统由睡美人(SB)转座酶和SB转座子组成。在实施方式中,睡美人转座子系统可包括SB11转座子系统、SB100X转座子系统或SB110转座子系统。
DNA转座子以简单的切割+粘贴方式从一个DNA位点易位至另一个DNA位点。转座是一个精确的过程,其中从一个DNA分子切下一个确定的DNA区段并移动到相同或不同DNA分子或基因组中的另一个位点。与其它Tc1/mariner型转座酶一样,SB转座酶将转座子插入受体DNA序列中的TA二核苷酸碱基对。插入位点可以在同一DNA分子的其它地方,或在另一个DNA分子(或染色体)中。在哺乳动物基因组中,包括人类,大约有2亿个TA位点。TA插入位点在转座子整合过程中重复。TA序列的这种重复是转座的标志,并用于确定一些实验中的机制。转座酶可以在转座子内编码,或转座酶可以由另一来源诸如DNA或mRNA来源提供,在这种情况中,转座子成为非自主元件。非自主转座子作为遗传工具是最有用的,因为插入后它们不能独立继续切除和重新插入。设想将SB转座子用作非病毒载体,用于将基因引入脊椎动物的基因组并用于基因疗法。
无论用于将外源核酸引入宿主细胞中还是以其它方式将细胞暴露于本公开的抑制剂的方法,为了证实重组DNA序列在宿主细胞中的存在,可以进行多种试验。这类试验包括,例如,本领域技术人员熟知的分子试验,如Southern和Northern印迹,RT-PCR和PCR;“生物化学”试验,诸如检测特定肽的存在或不存在,例如,通过免疫学手段(ELISA和Western印迹)或通过本文所述试验鉴定落入本公开范围内的试剂。
在实施方式中,使用SB11转座子系统、SB100X转座子系统、SB110转座子系统,piggyBac转座子系统(参见例如,Wilson等,“人细胞中PiggyBac转座子介导的基因转移(PiggyBac Transposon-mediated Gene Transfer in Human Cells),”MolecularTherapy 15:139-145(2007),通过引用其全部内容纳入本文)和/或piggyBat转座子系统(参见例如,Mitra等,“来自蝙蝠小棕蝠(Myotis lucifugus)的piggyBat功能性表征揭示了活性哺乳动物DNA转座子(Functional characterization of piggyBac from the batMyotis lucifugus unveils an active mammalian DNA transposon),”Proc.Natl.Acad.Sci USA 110:234-239(2013)),本文所述经修饰的效应物细胞和其它遗传元件递送至细胞。其它转座酶或转座子系统提供于下述中:美国专利号6,489,458;6,613,752,7,148,203;7,985,739;8,227,432;9,228,180;美国专利公开号2011/0117072;Mates等,Nat Genet,41(6):753-61(2009).doi:10.1038/ng.343.电子出版2009年5月3日,Gene Ther.,18(9):849-56(2011).doi:10.1038/gt.2011.40.电子出版2011年5月31日和在Ivics等,Cell,91(4):501-10,(1997)中,其各通过引用其全部内容纳入本文。
其它合适的非病毒系统可以包括整合表达载体,其可以随机整合到宿主细胞的DNA中,或者可以包括重组位点,以实现表达载体和宿主细胞的染色体之间的特异性重组。将转基因靶向整合到预定的遗传基因座中是许多应用的理想目标。首先,将位点特异性重组酶的第一重组位点插入基因组位点,随机地或以预定位置。随后,用携带感兴趣的基因或DNA和第二个重组位点的质粒以及重组酶的来源(表达质粒、RNA、蛋白质或表达病毒的重组酶)转染细胞。第一和第二重组位点之间的重组导致质粒DNA的整合。
这类整合表达载体可以利用宿主细胞染色体的内源性表达控制序列以实现所需蛋白质的表达。在一些实施方式中,通过在供体多核苷酸上存在这样的序列来促进靶向整合,所述序列与侧接整合位点的序列同源。例如,可以按照常规转染技术,例如用于通过同源重组产生基因敲除或敲入的技术来实现使用本文所述供体多核苷酸的靶向整合。在其它实施方式中,这样促进靶向整合:通过在供体多核苷酸上存在与侧接整合位点的序列同源的序列,和通过在位点特异性重组酶存在的情况下与供体多核苷酸接触。通过位点特异性重组酶或简单地述及重组酶意指在相容的重组位点之间催化保守位点特异性重组的多肽。本文所用位点特异性重组酶包括天然多肽以及保留活性的衍生物、变体和/或片段,以及编码保留活性的重组酶的天然多核苷酸、衍生物、变体和/或片段。
本文还提供了用于在宿主细胞中整合异源基因的系统,所述系统包括一个或多个基因表达盒。在一些情况中,系统包括第一基因表达盒,其包含编码第一多肽构建体的第一多核苷酸。在其它情况中,系统可以包括第二基因表达盒,其包含编码第二多肽构建体的第二多核苷酸。在其它情况中,系统可以包括第三表达盒。在一个实施方式中,基因表达盒之一可以包括编码下述一种或多种的基因开关多核苷酸:(i)反式激活结构域;(ii)核受体配体接合结构域;(iii)DNA结合结构域;和(iv)蜕皮激素受体结合结构域。在另一实施方式中,系统还包括重组连接位点;和丝氨酸重组酶;从而在所述宿主细胞与至少所述第一基于表达盒接触后,在所述丝氨酸重组酶存在的情况下,使所述异源基因整合到所述宿主细胞中。
在一些情况中,细胞还包括配体;从而在接触所述宿主细胞后,在所述配体存在的情况下,使所述异源基因在所述宿主细胞中表达。在一个情况中,细胞还包括重组连接位点。在一些情况中,一个重组连接位点是噬菌体基因组重组连接位点(attP)或细菌基因组重组连接位点(attB)。在一个情况中,宿主细胞是真核细胞。在另一情况中,宿主细胞是人细胞。在一些情况中,宿主细胞是T细胞或NK细胞。
启动子
“启动子”指启动编码序列转录的多核苷酸区域。启动子位于基因的转录起始位点附近,位于DNA的同一链和上游(朝向有义链的5'区域)。一些启动子是组成型的,因为它们在细胞中的所有情况中都具有活性,而其它启动子经调节响应特定刺激而变得有具有活性,例如,诱导型启动子。然而,其它启动子是组织特异型启动子或激活的启动子,包括但不限于,T细胞特异性启动子。
本文所用术语“启动子活性”以及其语法等同形式指其活性经测量的操作性连接启动子的核苷酸序列的表达程度。启动子活性可以通过确定产生的RNA转录本的量来直接测量,例如通过Northern印迹分析或通过由连接的核酸序列编码的产物的量间接测量,如连接启动子的报告物核酸序列。
如本文所用“诱导型启动子”指通过转录调节子(例如生物或非生物因子)的存在或不存在而诱导活性的启动子。诱导型启动子是有用的,因为与其操作性连接的基因的表达可以在生物体的某些发育阶段或特定组织中打开或关闭。诱导型启动子的示例是醇调节的启动子,四环素调节的启动子,类固醇调节的启动子,金属调节的启动子,发病机制调节的启动子,温度调节的启动子和光调节的启动子。在一个实施方式中,诱导型启动子是遗传开关的一部分。诱导型启动子可以是基因开关配体诱导型启动子。在一些情况中,诱导型启动子可以是基于小分子配体-诱导的两个多肽蜕皮激素受体的基因开关,例如
Figure BDA0002762906700000411
基因开关。在一些情况中,基因开关可以选自基于蜕皮激素的受体组分,如以下中描述的任何系统(但不限于)中所述:PCT/US2001/009050(WO 2001/070816);美国专利号7,091,038;7,776,587;7,807,417;8,202,718;PCT/US2001/030608(WO 2002/029075);美国专利号8,105,825;8,168,426;PCT/1J52002/005235(WO 2002/066613);美国专利申请号10/468,200(美国公开号20120167239);PCT/US2002/005706(WO 2002/066614);美国专利号7,531,326;8,236,556;8,598,409;PCT/U52002/005090(WO 2002/066612);美国专利号8,715,959(美国专利公开号20060100416);PCT/US2002/005234(WO2003/027266);美国专利号7,601,508;7,829,676;7,919,269;8,030,067;PCT/U52002/005708(WO 2002/066615);美国专利申请号10/468,192(美国专利公开号20110212528);PCT/US2002/005026(WO 2003/027289);美国专利号7,563,879;8,021,878;8,497,093;PCT/US2005/015089(WO 2005/108617);美国专利号7,935,510;8,076,454;PCT/U52008/011270(WO 2009/045370);美国专利申请号12/241,018(美国专利公开号20090136465);PCT/US2008/011563(WO 2009/048560);美国专利申请号12/247,738(美国专利公开号20090123441);PCT/US2009/005510(WO 2010/042189);美国专利申请号13/123,129(美国专利公开号20110268766);PCT/US2011/029682(WO 2011/119773);美国专利申请号13/636,473(美国专利公开号20130195800);PCT/US2012/027515(WO 2012/122025);和美国专利号9,402,919,其各自通过引用其全部内容纳入本文。
本文提供了这样的方法,其包括给予对象至少一种非病毒载体,所述非病毒载体包含:编码本文所述多肽序列的多核苷酸,所述多肽序列包含至少两个功能蛋白或其部分;至少一个启动子;和至少一个工程改造重组位点;其中所述至少一个启动子驱动所述至少两个功能蛋白的表达。在一些情况中,至少一个启动子可以是组成型的。在一些情况中,至少一个启动子可以是组织特异型的。在一些情况中,至少一个启动子可以是诱导型的。在一些情况中,诱导型启动子是基于小分子配体-诱导的两个多肽蜕皮激素受体的基因开关。在其它情况中,可以利用这样的启动子组合,其中,至少一个启动子可以是诱导型的,并且至少一个启动子可以是激活特异性的。
诱导型启动子利用配体对所述至少两个基因的表达进行剂量调节的控制。在某些情况中,配体可以选自下组:蜕化类固醇,9-顺-类视黄醇,类视黄醇的合成类似物,N,N’-二酰基肼,噁二唑啉(oxadiazoline),二苯甲酰基烷基氰肼,N-烷基-N,N’-二芳酰基肼,N-酰基-N-烷基羰基肼,N-芳酰基-N-烷基-N'-芳酰基肼,氨酮(arnidoketone),3,5-二叔丁基-4-羟基-N-异丁基-苯甲酰胺,8-O-乙酰基哈巴苷,氧固醇,22(R)羟胆固醇,24(S)羟胆固醇,25-环氧胆固醇,T0901317,5-α-6-α-环氧胆固醇-3-硫酸(ECHS),7-酮胆固醇-3-硫酸,麝子油醇(framesol),胆汁酸,1,1-二膦酸,保幼激素III,RG-115819(3,5-二甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N'-(2-甲基-3甲氧基-苯甲酰基)-酰肼-),RG-115932((R)-3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N'-(2-乙基1-3-甲氧基-苯甲酰基)-酰肼)和RG-115830(3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N'-(2-乙基-3-甲氧基-苯甲酰)-酰肼)。
在一些实施方式中,启动子是诱导型启动子。在一些实施方式中,启动子是非诱导型启动子。在一些情况中,启动子可以是组织特异型的。本文中“组织特异型”是指基因在组织或细胞类型的子集中的受控表达。在一些情况中,可以在空间上调节组织特异性启动子,从而使该启动子仅在生物体的某些组织或细胞类型中驱动表达。在一些情况中,可以在时间上调节组织特异性启动子,从而使启动子在整个时间(包括生物体发育期间)不同地驱动细胞类型或组织中的表达。在一些情况中,组织特异性启动子在空间和时间上受到调节。在某些实施方式中,组织特异性启动子在某些细胞类型中该细胞类型的特定时间或阶段被组成型地或间歇性地激活。例如,组织特异性启动子可以是这样的启动子,其在特定细胞如T细胞或NK细胞激活时被激活。可以多种方式激活T细胞,例如,当通过MHC II型分子呈递肽抗原时。
在一个情况中,至少一个启动子是工程改造的启动子或其变体。本文所述启动子可以纳入来自IL-2的最小启动子序列和下述一个或多个:活化的T-细胞的核因子(NFAT)反应元件;NFIL2D反应元件,NFkB/TCF反应元件,NF_AT/NFIL2B反应元件或NFIL2A/OCT反应元件。反应元件的示例述于Mattila等,EMBO J.9(13):4425-33(1990),通过引用其全部内容纳入本文。
在一些实施方式中,至少一个启动子包含IL-2核心启动子(SEQ ID NO:26)。在一个实施方式中,至少一个启动子包含IL-2最小启动子(SEQ ID NO:27)。在另一实施方式中,至少一个启动子包含IL-2增强子和启动子变体(SEQ ID NO:26-28)。在另一实施方式中,至少一个启动子包含NF-κB结合位点(SEQ ID NO:30-32)。在一些实施方式中,至少一个启动子包含(NF-κB)1-IL2启动子变体(SEQ ID NO:30)。在一些实施方式中,至少一个启动子包含(NF-κB)3-IL2启动子变体(SEQ ID NO:31)。在一些实施方式中,至少一个启动子包含(NF-κB)6-IL2启动子变体(SEQ ID NO:32)。在一些实施方式中,至少一个启动子包含IX激活的T细胞的核因子(NFAT)反应元件-IL2启动子变体(SEQ ID NO:33)。在另一实施方式中,至少一个启动子包含3X NFAT反应元件(SEQ ID NO:34-35)。在另一实施方式中,至少一个启动子包含6X NFAT反应元件-IL2启动子变体(SEQ ID NO:36-39)。在一些实施方式中,至少一个启动子包含人EF1A1启动子变体(SEQ ID NO:40-41)。在一些实施方式中,至少一个启动子包含人EF1A1启动子和增强子(SEQ ID NO:42)。在一些实施方式中,至少一个启动子包含人UBC启动子(SEQ ID NO:43)。在一些实施方式中,至少一个启动子包含6位点GAL4-4诱导型近端因子结合元件(PFB)。在一些实施方式中,至少一个启动子包含合成最小启动子1(诱导型启动子)(SEQ ID NO:44)。
将基因开关用于本文所述IL-12表达的配体诱导控制可以通过例如允许调节表达和改善治疗指数来改善IL-12的安全性。然而,使用基因开关进行IL-12的配体剂量依赖性表达的条件是存在或不存在激活剂配体(例如,veledimex)。在某些实施方式中,考虑了用于诱导IL-12表达的其它条件控制。提供了受控于T细胞激活的特异性启动子的基因开关组件。这导致基因开关组件的条件型表达(例如,T细胞激活),这是在基因开关控制下veledimex控制的转基因表达所必需的。在一些实施方式中,当存在veledimex并且T细胞被激活时,这导致肿瘤特异性T细胞优先表达细胞因子例如IL-12或IL-15。这可以导致基因开关控制的转基因表达的局部水平升高。
例如,基因开关组分的T细胞活化特异性表达可以通过启动子控制,所述启动子包含一个或多个活化的T细胞的核因子(NFAT)反应元件。NFAT转录因子是效应T细胞状态的关键调节剂。NFAT是逐渐导致耗尽的早期转录检查点。NFAT在TCR刺激后在T细胞中被快速激活,并与通过适当共刺激信号转导诱导的AP-1形成蛋白质复合物,并调节效应基因和T细胞功能。一个或多个NFAT反应元件可以与其它最小启动子序列(例如,IL2最小启动子)融合,以响应T细胞激活而驱动转基因表达。
激活特异性启动子的其它示例包括但不限于,白介素2(IL2)启动子和程序性死亡(PD)-1(CD279)启动子。通过将其它核因子如促炎性信号转导途径的NF-κB的结合位点与最小启动子序列(例如IL2)融合,还可以在免疫细胞激活后条件型表达基因开关组件。
在某些实施方式中,启动子可以是下述一种或多种:IL-2核心启动子,IL-2最小启动子,IL-2增强子和启动子变体,(NF-κB)1-IL2启动子变体,(NF-κB)3-IL2启动子变体,(NF-κB)6-IL2启动子变体,1X NFAT反应元件-IL2启动子变体,3X NFAT反应元件-IL2启动子变体,6X NFAT反应元件-IL2启动子变体,人EEF1A1启动子变体,人EEF1A1启动子和增强子,人UBC启动子和合成最小启动子1。在某些实施方式中,启动子核苷酸可以包含SEQ ID NO:26-44。
基因开关
本文提供了基因开关多肽,编码配体-诱导型基因开关多肽的多核苷酸,和纳入这些多肽和/或多核苷酸的方法和系统。在某些方面,本公开涉及多核苷酸,其包含编码诱导型控制异源基因表达的基因开关系统的一个或多个多核苷酸,其中所述异源基因表达由所述基因开关系统调节;和其中所述异源基因包含这样的多肽的多核苷酸,所述多肽包含本文所公开的一个或多个免疫应答诱导人乳头瘤病毒(HPV)多肽。
术语“基因开关”指与启动子相关联的反应元件的组合,例如基于EcR的系统,其在一个或多个配体存在的情况下调节纳入了反应元件和启动子的基因的表达。严格调节的诱导型基因表达系统或基因开关能够用于多种应用,如基因疗法,细胞中蛋白质的大规模生产,基于细胞的高通量筛选试验,功能基因组学和转基因植物和动物性状的调节。这类诱导型基因表达系统可包括配体诱导型异源基因表达系统。
基于EcR的基因开关的早期形式使用果蝇(Drosophila melanogaster)EcR(DmEcR)和小家鼠(Mus musculus)RXR(MmRXR)多肽,并显示这些受体在类固醇——百日青蜕皮酮A(ponasteroneA)存在的情况下反式激活哺乳动物细胞系和转基因小鼠中的报告基因(Christopherson等,Proc.Natl.Acad.Sci.USA 89(14):6314-18(1992);No等,Proc.Natl.Acad.Sci.USA 93(8):3346-51(1996))。而后,Suhr等(Proc.Natl.Acad.Sci.USA 95(14):7999-8004(1998))显示非类固醇蜕皮激素激动剂——虫酰肼(tebufenozide)在不存在外源性异二聚体伴侣的情况下通过家蚕(Bombyx mori)EcR(BmEcR)诱导哺乳动物细胞中报告基因的高水平反式激活。
国际专利申请号PCT/US97/05330(WO 97/38117)和PCT/US99/08381(WO99/58155)公开了用于调节外源基因表达的方法,其中包含外源基因和蜕皮激素反应元件的DNA构建体通过包含蜕皮激素受体的第二DNA构建体激活,所述蜕皮激素受体这是在存在其配体的情况下,并且任选地在存在能够作为沉默伴侣的启动子的情况下,能够结合蜕皮激素反应元件以诱导基因表达。在该实施例中,蜕皮激素受体分离自果蝇。通常,这类系统需要存在沉默伴侣,优选类视黄醇X受体(RXR),从而提供最佳的激活。在哺乳动物细胞中,昆虫蜕皮激素受体(EcR)能够与哺乳动物类视黄醇X受体(RXR)异二聚化,从而可以以配体依赖性方式调节靶基因或异源基因的表达。国际专利申请号PCT/US98/14215(WO 99/02683)公开了分离自家蚕的蜕皮激素受体在哺乳动物系统中具有功能性,不需要外源二聚体伴侣。
美国专利号6,265,173公开了受体的类固醇/甲状腺超家族的各成员可以与果蝇超气门受体(ultraspiracle receptor,USP)或包含至少USP二聚化结构域的片段结合,用于基因表达系统。美国专利号5,880,333公开了用于植物的果蝇EcR和超气门(USP)异二聚体系统,其中反式激活结构域和DNA结合结构域位于两个不同的杂合蛋白上。在这些情况的各种情况中,将反式激活结构域和DNA结合结构域(如国际专利申请号PCT/US98/1421中的天然EcR或国际专利申请号PCT/US97/05330中经修饰的EcR)纳入单个分子,其它异二聚体伴侣(USP或RXR)以其天然状态使用。
国际专利申请号PCT/US01/0905公开了基于蜕皮激素受体的诱导型基因表达系统,其中通过将反式激活结构域和DNA结合结构域放置在两种不同的蛋白质上而使其彼此分离,导致在不存在配体的情况下使背景活性大大降低,并且在存在配体的情况中使活性比背景显著提高。相较于申请号PCT/US97/05330和PCT/US98/14215中所公开的两个系统,该双杂合系统是显著改进的诱导型基因表达调节系统。据信该双杂合系统利用一对相互作用的蛋白质将转录激活结构域带入相对于DNA结合结构域更有利的位置的能力,从而在DNA结合结构域结合基因上的DNA结合位点时,使反式激活结构域更有效地激活启动子(参见,例如,美国专利号5,283,173)。该双杂合基因表达系统包括两个基因表达盒;第一个编码融合核受体多肽的DNA接合结构域,第二个编码融合至另一不同核受体多肽的反式激活结构域。在配体存在的情况下,据信诱导了构象变化,其促进了第一多肽与第二多肽的相互作用,从而导致DNA结合结构域和反式激活结构域的二聚化。因为DNA结合和反式激活结构域位于两个不同的分子,所以在没有配体的情况下背景活性显著降低。
另一个令人惊讶的发现是,当与类固醇配体例如百日青蜕皮酮A(“PonA”)或米乐甾酮A(Muristerone A,“MurA”)相比时,该双杂合系统的某些修饰还可以提供对非类固醇配体例如二酰基肼的敏感性。也就是,当与类固醇相比时,非类固醇配体以较低的配体浓度提供较高的转录活性。此外,双杂合系统避免了由于RXR的过表达而引起的一些副作用所述RXR的过表达可能在将未修饰的RXR用作开关伴侣(switching partner)时发生。在优选双杂合系统中,消除RXR或EcR的天然DNA结合结构域和反式激活结构域,并因此使得这些杂合分子与细胞中存在的其它类固醇激素受体相互作用的机会较小,从而减少副作用。
蜕皮激素受体(EcR)是核受体超家族的成员,并且分为亚家族1H组(在本文中称为“H组核受体”)。各组的成员在E(配体结合)结构域中共有40-60%的氨基酸相同性(Laudet等,核受体亚家族的统一命名系统(A Unified Nomenclature System for the NuclearReceptor Subfamily),1999;Cell 97:161-163)。除了蜕皮激素受体外,该核受体亚家族1H组的其它成员包括:遍在受体(UR)、孤儿受体1(OR-1)、类固醇激素核受体1(NER-1)、RXR相互作用蛋白-15(RIP-15)、肝x受体β(LXRβ)、类固醇激素受体样蛋白(RLD-1)、肝x受体(LXR)、肝x受体α(LXRα)、法尼醇x受体(FXR)、受体相互作用蛋白14(RIP-14)和金合欢醇受体(HRR-1)。
在一些情况中,诱导型启动子可以是基于小分子配体-诱导的两个多肽蜕皮激素受体的基因开关,例如英创松集团公司(Intrexon Corporation)的
Figure BDA0002762906700000471
基因开关。在一些情况中,基因开关可以选自基于蜕皮激素的受体组分,如以下中描述的任何系统(但不限于)中所述:PCT/US2001/009050(WO 2001/070816);美国专利号7,091,038;7,776,587;7,807,417;8,202,718;PCT/US2001/030608(WO 2002/029075);美国专利号8,105,825;8,168,426;PCT/1J52002/005235(WO 2002/066613);美国专利申请号10/468,200(美国公开号20120167239);PCT/US2002/005706(WO 2002/066614);美国专利号7,531,326;8,236,556;8,598,409;PCT/U52002/005090(WO 2002/066612);美国专利号8,715,959(美国专利公开号20060100416);PCT/US2002/005234(WO 2003/027266);美国专利号7,601,508;7,829,676;7,919,269;8,030,067;PCT/U52002/005708(WO 2002/066615);美国专利申请号10/468,192(美国专利公开号20110212528);PCT/US2002/005026(WO 2003/027289);美国专利号7,563,879;8,021,878;8,497,093;PCT/US2005/015089(WO 2005/108617);美国专利号7,935,510;8,076,454;PCT/U52008/011270(WO 2009/045370);美国专利申请号12/241,018(美国专利公开号20090136465);PCT/US2008/011563(WO 2009/048560);美国专利申请号12/247,738(美国专利公开号20090123441);PCT/US2009/005510(WO 2010/042189);美国专利申请号13/123,129(美国专利公开号20110268766);PCT/US2011/029682(WO 2011/119773);美国专利申请号13/636,473(美国专利公开号20130195800);PCT/US2012/027515(WO 2012/122025);和美国专利号9,402,919,其各自通过引用其全部内容纳入。
提供了用于调节宿主细胞中异源基因和白介素表达的系统,其包括表达本文公开的基因开关多肽的多核苷酸。
在一些实施方式中是用于调节宿主细胞中异源基因和细胞因子表达的系统,其包括第一基因表达盒,其包含编码第一多肽的第一多核苷酸;第二基因表达盒,其包含编码第二多肽的第二多核苷酸;和配体;其中所述第一和第二多肽包含下述一个或多个:(i)反式激活结构域;(ii)DNA结合结构域;和(iii)配体结合结构域;(iv)所述异源基因;和(vi)所述细胞因子,从而在所述配体存在的情况下将所述宿主细胞与所述第一基因表达盒和所述第二基因表达盒接触后,所述异源基因和所述细胞因子在所述宿主细胞中表达。在一些情况中,异源基因包含本文所述的抗原结合多肽。在一些情况中,细胞因子包含至少一个趋化因子、干扰素、白介素、淋巴因子、肿瘤坏死因子或其变体或组合。在一些情况中,细胞因子是白介素。在一些情况中,白介素是IL12、IL2、IL15、IL21及其功能性变体和片段中的至少一种。在一些实施方式中,细胞因子可以是膜结合的或分泌的。在其它实施方式中,细胞因子可以是胞内的。白介素可以包含膜结合的IL-15(mbIL-15)或IL-15和IL-15Rα的融合体。在一些实施方式中,mbIL-15是膜结合的嵌合IL-15,其可以与本文所述经修饰的效应细胞共表达。在一些实施方式中,mbIL-15包括全长IL-15(例如,天然IL-15多肽)或其片段或变体,在框内与全长IL-15Rα及其功能性片段或变体融合。在一些情况中,IL-15通过接头间接地连接于IL-15Rα。在一些情况中,mbIL-15述于Hurton等,“栓系的IL-15增强了抗肿瘤活性并促进肿瘤特异性T细胞中的干细胞记忆亚群(Tethered IL-15augments antitumoractivity and promotes a stem-cell memory subset in tumor-specific T cells),”Proc.Natl.Acad.Sci.USA 113(48):E7788-E7797(2016)。在另一方面中,白介素可以包括IL-12。在一些实施方式中,IL-12是单链IL-12(scIL-12)、蛋白酶敏感型IL-12,不稳定IL-12、膜结合IL-12、插入型IL-12。在一些情况中,IL-12变体如WO2015/095249、WO2016/048903、WO2017/062953中所述,全部通过引用其全部内容纳入。
本文提供了编码基因开关多肽的多核苷酸,其中所述基因开关多肽包含:a)第一基因开关多肽,其包含与核受体配体结合结构域融合的DNA接合结构域,和b)第二基因开关多肽,其包含与核受体配体结合结构域融合的反式激活结构域,其中第一基因开关多肽和第二基因开关多肽通过接头连接。在一些情况中,接头可以是本文所述的接头,例如GSG接头,弗林链(furinlink),2A接头,如F/T2A,T2A,p2A,GSG-p2A,其变体和衍生物在其它情况中,接头可以是IRES。
在一些情况中,DNA接合结构域(DBD)包含本文所述的DBD,例如,GAL4(GAL4DBD)、LexA DBD、转录因子DBD、类固醇/甲状腺激素核受体超家族成员DBD、细菌LacZ DBD和酵母DBD中的至少一个。反式激活结构域可以包含本文所述的反式激活结构域,例如VP16反式激活结构域、p53反式激活结构域和B42酸性活化剂反式激活结构域之一。核受体配体结合结构域可以包括下述中的至少一个:蜕皮激素受体(EcR)、遍在受体、孤儿受体1、NER-1、类固醇激素核受体1、类视黄醇X受体相互作用蛋白15,肝X受体β,类固醇激素受体样蛋白,肝X受体,肝X受体α,法尼醇X受体,受体相互作用蛋白14和金合欢醇受体。
在某些情况中,相较于配体诱导型基因开关,通过多肽接头或核糖体跳跃序列接合的基因开关多肽显示出改善的剂量依赖性配体诱导型基因表达控制,其中,基因开关多肽通过非编码序列如IRES接合。在一些情况中,相较于其中基因开关多肽被IRES分隔的基因开关,通过2A接头接合的基因开关多肽可显示改善的剂量依赖性配体诱导型异源基因表达控制。
在一些实施方式中,基因开关包含VP16反式激活结构域。在一个实施方式中,基因开关包括下述中的至少一个:蜕皮激素受体(EcR)、遍在受体、孤儿受体1、NER-1、类固醇激素核受体1、类视黄醇X受体相互作用蛋白15,肝X受体β,类固醇激素受体样蛋白,肝X受体,肝X受体α,法尼醇X受体,受体相互作用蛋白14和金合欢醇受体。在另一实施方式中,基因开关的DNA接合结构域(DBD)包含下述中的至少一个:GAL4(GAL4DBD)、LexA DBD、转录因子DBD、类固醇/甲状腺激素核受体超家族成员DBD、细菌LacZ DBD和酵母DBD。在又一情况中,基因开关还包括下述中的至少一个:超气门蛋白(USP)、类视黄醇受体X(RXR)、其功能片段和变体,其中所述功能片段和变体能够结合EcR。
本文所述的多肽和多核苷酸可以在工程改造的细胞中表达。在本文中,工程改造的细胞是修饰自其天然或内源性状态的细胞。工程改造的细胞的示例是本文所述的细胞,其已经修饰(例如,通过将多核苷酸转染到细胞中)以编码,例如,基因开关多肽、感兴趣的基因(GOI),细胞标签,异源基因和任何本文所述的其它多肽和多核苷酸中的任一种。
配体
在一些实施方式中,用于诱导型基因开关调控的配体可以选自但不限于下述任一个:N-[(1R)-1-(1,1-二甲基乙基)丁基]-N'-(2-乙基-3-甲氧基苯甲酰基)-3,5-二甲基苯甲酰肼(也称为,veledimex),(2S,3R,5R,9R,10R,13R,14S,17R)-17-[(2S,3R)-3,6-二羟基-6-甲基庚-2-基]-2,3,14-三羟基-10,13-二甲基-2,3,4,5,9,11,12,15,16,17-十氢-1H-环戊[a]菲-6-酮;N'-(3,5-二甲基苯甲酰基)-N'-[(3R)-2,2-二甲基-3-己基]-2-乙基-3-甲氧基苯甲酰肼;5-甲基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(3,5-二甲基-苯甲酰基)-N′-(1-乙基-2,2-二甲基-丙基)-酰肼;5-甲基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(3,5-二甲氧基-4-甲基-苯甲酰基)-N′-(1-乙基-2,2-二甲基-丙基)-酰肼;5-甲基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(1-叔丁基-丁基)-N′-(3,5-二甲基-苯甲酰基)-酰肼;5-甲基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(1-叔丁基-丁基)-N′-(3,5-二甲氧基-4-甲基-苯甲酰基)-酰肼;5-乙基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(3,5-二甲基-苯甲酰基)-N′-(1-乙基-2,2-二甲基-丙基)-酰肼;5-乙基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(3,5-二甲氧基-4-甲基-苯甲酰基)-N′-(1-乙基-2,2-二甲基-丙基)-酰肼;5-乙基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(1-叔丁基-丁基)-N′-(3,5-二甲基-苯甲酰基)-酰肼;5-乙基-2,3-二氢-苯并[1,4]二噁英-6-羧酸N′-(1-叔丁基-丁基)-N′-(3,5-二甲氧基-4-甲基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼;3,5-二甲氧基-4-甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼;3,5-二甲氧基-4-甲基-苯甲酸N-(1-叔丁基-丁基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N′-(2-乙基-3-甲氧基-苯甲酰基)-酰肼;3,5-二甲氧基-4-甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N′-(2-乙基-3-甲氧基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N′-(2-乙基-3-甲氧基-苯甲酰基)-酰肼;3,5-二甲氧基-4-甲基-苯甲酸N-(1-叔丁基-丁基)-N′-(2-乙基-3-甲氧基-苯甲酰基)-酰肼;2-甲氧基-烟酸N-(1-叔丁基-戊基)-N′-(4-乙基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(2,2-二甲基-1-苯基-丙基)-N′-(4-乙基-苯甲酰基)-酰肼;3,5-二甲基-苯甲酸N-(1-叔丁基-戊基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼;和3,5-二甲氧基-4-甲基-苯甲酸N-(1-叔丁基-戊基)-N′-(3-甲氧基-2-甲基-苯甲酰基)-酰肼。
在一些情况中,用于基于蜕皮激素受体诱导型基因开关的剂量调节控制的配体可以选自下述中任一个但不限于:蜕化类固醇,如蜕皮激素,20-羟基蜕皮激素,百日青蜕皮酮A,米乐甾酮A等,9-顺式-视黄酸,视黄酸的合成类似物,N,N'-二酰基肼,如美国专利号6,013,836;5,117,057;5,530,028;和5,378,726以及美国专利公开号2005/0209283和2006/0020146中所公开的那些;噁二唑啉(oxadiazoline),如美国专利公开号2004/0171651中所述;二苯甲酰基烷基氰肼,如欧洲专利申请号461,809中所公开的那些;N-烷基-N,N'-二芳酰基肼,如美国专利号5,225,443中所公开的那些;N-酰基-N-烷基羰基肼,如欧洲专利申请号234,994中所公开的那些;N-芳酰基-N-烷基-N'-芳酰基肼,如美国专利号4,985,461中所述所公开的那些;氨酮(arnidoketone),如美国专利公开号2004/0049037中所述的那些;其各自通过引用纳入本文,并且其它物质包括:3,5-二叔丁基-4-羟基-N-异丁基-苯甲酰胺,8-O-乙酰基哈巴苷,氧固醇,22(R)羟胆固醇,24(S)羟胆固醇,25-环氧胆固醇,T0901317,5-α-6-α-环氧胆固醇-3-硫酸(ECHS),7-酮胆固醇-3-硫酸,麝子油醇(framesol),胆汁酸,1,1-二膦酸酯,保幼激素III等。能够用于本公开的二酰基肼的示例包括:RG-115819(3,5-二甲基-苯甲酸N-(1-乙基-2,2-二甲基-丙基)-N'-(2-甲基-3甲氧基-苯甲酰基)-酰肼-),RG-115932((R)-3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N'-(2-乙基1-3-甲氧基-苯甲酰基)-酰肼)和RG-115830(3,5-二甲基-苯甲酸N-(1-叔丁基-丁基)-N'-(2-乙基-3-甲氧基-苯甲酰)-酰肼)。参见例如,美国专利申请序列号12/155,111和PCT国际申请号PCT/US2008/006757,两者内容通过引用其全部内容纳入本文。
细胞因子
在某些实施方式中,本文提供的HPV疫苗抗原可以与其它细胞因子共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。本文提供了编码基因开关多肽和细胞因子或其变体或衍生物的多核苷酸,以及纳入了它们的方法和系统。细胞因子是涉及细胞信号转导约5-20kDa的一类小蛋白质。在一些情况中,细胞因子包括趋化因子、干扰素、白介素、集落刺激因子或肿瘤坏死因子。在一些实施方式中,趋化因子起引导细胞迁移的化学引诱物的作用,并且分类为四个亚家族:CXC、CC、CX3C和XC。示例性的趋化因子包括来自下述的趋化因子:CC亚家族:CCL1、CCL2(MCP-1)、CCL3、CCL4、CCL5(RANTES)、CCL6、CCL7、CCL8、CCL9(或CCL10)、CCL11、CCL12、CCL13、CCL14、CCL15、CCL16、CCL17、CCL18、CCL19、CCL20、CCL21、CCL22、CCL23、CCL24、CCL25、CCL26、CCL27和CCL28;CXC亚家族:CXCL1、CXCL2、CXCL3、CXCL4、CXCL5、CXCL6、CXCL7、CXCL8、CXCL9、CXCL10、CXCL11、CXCL12、CXCL13、CXCL14、CXCL15、CXCL16和CXCL17;XC亚家族:XCL1和XCL2;和CX3C亚家族:CX3CL1。
在某些实施方式中,本文提供的HPV疫苗抗原可以与其它干扰素共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。干扰素(IFN)包括I型干扰素(例如,IFN-α、IFN-β、IFN-ε、IFN-κ和IFN-ω),II型干扰素(例如,IFN-γ)和III型干扰素。在一些实施方式中,将IFN-α进一步分类为约13个亚型,其包括:IFNA1、IFNA2、IFNA4、IFNA5、IFNA6、IFNA7、IFNA8、IFNA10、IFNA13、IFNA14、IFNA16、IFNA17和IFNA21。
在某些实施方式中,本文提供的HPV疫苗抗原可以与其它白介素共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。白介素表达自白细胞或白血细胞,它们促进T和B淋巴细胞和造血细胞的发育和分化。示例性的白介素包括:IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8(CXCL8)、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、IL-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-35和IL-36。在一些实施方式中,白介素是IL-2、IL-12、IL-15、IL-21或IL-15和IL-15α的融合体。
在一些方面中,白介素可以包括IL-12。在一些实施方式中,IL-12是单链IL-12(scIL-12)、蛋白酶敏感型IL-12,不稳定IL-12、膜结合IL-12、插入型IL-12。在一些情况中,IL-12变体如WO2015/095249、WO2016/048903、WO2017/062953中所述,全部通过引用其全部内容纳入。
在一些实施方式中,白介素包括mbIL-15。在一些实施方式中,mbIL-15是膜结合的嵌合IL-15,其可以与本文所述经修饰的效应细胞共表达。在一些实施方式中,mbIL-15包括全长IL-15(例如,天然IL-15多肽)或其片段或变体,在框内与全长IL-15Rα及其功能性片段或变体融合。在一些情况中,IL-15通过接头间接地连接于IL-15Rα。在一些情况中,mbIL-15述于Hurton等,“栓系的IL-15增强了抗肿瘤活性并促进肿瘤特异性T细胞中的干细胞记忆亚群(Tethered IL-15augments antitumor activity and promotes a stem-cellmemory subset in tumor-specific T cells),”PNAS 2016。
在某些实施方式中,本文提供的HPV疫苗抗原可以与肿瘤坏死因子共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。肿瘤坏死因子(TNF)是调节凋亡的一组细胞因子。在一些情况中,TNF家族内存在大约19个成员,包括但不限于,TNFα、淋巴毒素α(LT-α)、淋巴毒素β(LT-β)、T细胞抗原gp39(CD40L)、CD27L、CD30L、FASL、4-1BBL、OX40L和TNF相关的凋亡诱导配体(TRAIL)。
在某些实施方式中,本文提供的HPV疫苗抗原可以与集落刺激因子共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。集落刺激因子(CSF)是分泌的糖蛋白,其与造血干细胞表面上的受体蛋白相互作用,随后调节细胞增殖和分化成特定种类的血细胞。在一些情况中,CSF包括:巨噬细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子(GM-CSF),粒细胞集落刺激因子(G-CSF)或普美加泊亭(promegapoietin)。
在一些实施方式中,细胞因子是膜结合的细胞因子,其与本文所述的嵌合抗原受体共表达。在一些实施方式中,本文描述的一种或多种方法进一步包括给予细胞因子。在一些情况中,细胞因子包括趋化因子、干扰素、白介素、集落刺激因子或肿瘤坏死因子。在一些情况中,本文所述一种或多种方法还包括给予选自下述的细胞因子:趋化因子、干扰素、白介素、集落刺激因子或肿瘤坏死因子。在一些情况中,本文所述一种或多种方法还包括给予选自下述的细胞因子:IL2、IL7、IL12、IL15、IL-15和IL-15Rα的融合体、IL21、IFNγ或TNF-α。
白介素-12
在特定实施方式中,本文提供的HPV疫苗抗原可以与白介素-12共递送和/或共表达(例如,作为同一HPV抗原递送载体的部分或经由单独的载体)。白细胞介素12(IL-12)是由树突细胞、巨噬细胞、嗜中性粒细胞和人B淋巴母细胞(NC-37)响应抗原刺激天然产生的白细胞介素。IL-12由一束四个α螺旋组成。它是由两个独立的基因IL-12A(p35)和IL-12B(p40)编码的异二聚体细胞因子。蛋白质合成后,形成了活性异二聚体(称为p70)和p40的同二聚体。IL-12是免疫系统的主要调节剂。IL-12通过激活NK细胞和T细胞促进免疫应答(图11)。
本文提供了包含制备HPV重组疫苗的方法的组合物、试剂盒和系统。本公开提供了构建在多重缺失的大猩猩腺载体(GC46)中的HPV抗原设计(HPV设计1-5)(SEQ ID NO:61-63)。本文还提供了编码基因开关多肽和IL-12或其变体或衍生物的多核苷酸,以及纳入它们的方法和系统(图12)。
接头
还公开了包含接头的构建体,以促进本文所述的多核苷酸和多肽的表达和功能。在一些实施方式中,多核苷酸接头可以在本文所述的多核苷酸中使用。多核苷酸接头可以是包含所需限制位点的DNA的双链区段,可以将其添加以产生与包含本文所述多核苷酸的载体相容的末端结构。在一些情况中,多核苷酸接头可以用于修饰包含本文所述多核苷酸的载体。例如,包含多核苷酸接头的载体修饰可以是多克隆位点的改变或多组氨酸尾的添加。多核苷酸接头也可以用于适应钝端插入DNA的末端,用于克隆到用具有限制性末端的限制性酶切割的载体中。多核苷酸接头的使用可以比钝端连接到载体中更有效,并且可以提供从载体释放插入物到下游应用中的方法。在某些情况中,插入物可以是编码能够用于治疗应用的多肽的多核苷酸序列。在一些情况中,接头可以是可切割接头。
多核苷酸接头可以是寡聚物。多核苷酸接头可以是DNA双链、单链或其组合。在一些情况中,接头可以是RNA。在一些情况中,可以通过T4连接酶将多核苷酸接头连接到包含本文所述的多核苷酸的载体中。为了促进连接,可以将过量的多核苷酸接头添加到包含插入物和载体的组合物中。在一些情况中,在将接头倒入前预处理插入物和载体。例如,用甲基化酶预处理可以防止插入物DNA不必要的切割。
在某些实施方式中,由本文所述多核苷酸编码的两个或更多个多肽可以通过编码间插接头多肽的间插序列分开。本文中术语“间插接头多肽”与术语“肽接头”不同,所述“间插接头多肽”指将由多核苷酸编码的两个或更多个多肽分开的氨基酸序列,所述“肽接头”指氨基酸序列(任选地包含在本文所公开的多肽构建物中的氨基酸序列)将跨膜结构域与细胞表面多肽(例如,包含天然多肽截短的变体)来粘结。在某些情况中,间插接头是易切割间插接头(cleavage-susceptible intervening linker)多肽。在一些实施方式中,接头是可切割接头或核糖体跳跃接头。在一些实施方式中,可切割接头或核糖体跳跃接头序列选自下组:2A、GSG-2A、GSG接头、SGSG接头、弗林链变体及其衍生物。在一些实施方式中,2A接头是p2A接头、T2A接头、F2A接头或E2A接头。在一些实施方式中,感兴趣多肽表达为通过易切割间插接头多肽连接的融合蛋白。在某些实施方式中,一个或多个易切割间插接头多肽可以是下述一个或多个:F/T2A、T2A、p2A、2A、GSG-p2A、GSG接头和弗林链变体。如2017年5月18日公布的PCT/US2016/061668(WO2017083750)中所公开的接头(多核苷酸和多肽序列)通过引用纳入本文。在某些实施方式中,接头多肽包括下表中公开的那些:
表1.接头氨基酸序列和多核苷酸序列
Figure BDA0002762906700000551
Figure BDA0002762906700000561
Figure BDA0002762906700000571
在一些实施方式中,间插接头多肽包含这样的氨基酸序列,所述氨基酸序列与瘭疽(Whitlow)接头(SEQ ID NO:64)、GSG接头(SEQ ID NO:66)、SGSG接头(SEQ ID NO:67)、(G4S)3接头(SEQ ID NO:68)、弗林蛋白酶切割位点/弗林链1(SEQ ID NO:69)、Fmdv接头(SEQ ID NO:70)、脉扁刺蛾(Thosea asigna)病毒2A区域(T2A)(SEQ ID NO:71)、弗林蛋白酶-GSG-T2A(SEQ ID NO:72)、弗林蛋白酶-SGSG-T2A(SEQ ID NO:73)、猪捷申病毒(Porcineteschovirus)-1 2A区域(P2A)(SEQ ID NO:74)、GSG-P2A(SEQ ID NO:75)、马鼻炎(Equinerhinitis)A病毒2A区域(E2A)(SEQ ID NO:76)或口蹄病病毒2A区域(F2A)(SEQ ID NO:78)(表1)的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、99%、99.5%或100%相同性。在一些情况中,间插接头多肽包含与接头的氨基酸序列(SEQ ID NO:65、79、80)具有至少70%、75%、80%、85%、90%、95%、99%、99.5%或100%相同性的氨基酸序列。2A元件可以比IRES短,具有5-100个碱基对。在某些情况中,2A序列的长度可以为5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或100个核苷酸。2A连接的基因可以在一个单一开放阅读框中表达,而“自切割”可以在2A多肽C末端的最后两个氨基酸GP之间共翻译,产生等量的共表达的蛋白质。
病毒性2A序列可以是约20个氨基酸。在一些情况中,病毒2A序列可以包含共有基序Asp-Val/Ile-Glu-X-Asn-Pro-Gly-Pro。共有基序序列可以共翻译方式起作用。例如,可以防止甘氨酸和脯氨酸残基之间正常肽键的形成,这可以导致核糖体跳跃和新生多肽的切割。该作用可以产生等摩尔水平的多个基因。
2A肽可以允许在单一开放阅读框中将多个蛋白质翻译成多肽,随后可通过核糖体跳跃机制将其切割成单个多肽(Funston等,J.Gen.Virol.89(Pt 2):389-96(2008))。在一些实施方式中,2A序列可包括:F/T2A、T2A、p2A、2A、T2A、E2A、F2A和BmCPV2A,BmIFV2A及其任何组合。
在一些情况中,载体可包含IRES序列和2A接头序列。在其它情况中,可通过2A肽之前的间隔序列(GSG)促进与2A肽连接的多个基因的表达。在一些情况中,构建体可以组合间隔子、接头、衔接子、启动子或其组合。例如,接头可以具有用不同的2A肽的间隔子(SGSG或GSG或瘭疽接头)和弗林蛋白酶接头(RAKR)切割位点。间隔子可以是I-Ceui。在一些情况中,接头可以经工程改造。例如,可以将接头设计为包括化学特性如疏水性。在一些情况中,至少两个接头序列可以产生相同的蛋白质。在其它情况中,可以在载体中使用多个接头。例如,感兴趣的基因可以通过至少两个接头分开。
在某些实施方式中,由本文所述多核苷酸编码的两个或更多个多肽可以通过编码接头多肽的间插序列分开。在某些情况中,接头是易切割接头。在一些实施方式中,感兴趣多肽表达为通过易切割接头多肽连接的融合蛋白。在某些实施方式中,一个或多个易切割接头多肽可以是下述一个或多个:弗林链、fmdv、p2a、GSG-p2a和/或fp2a,如下所述。在一些情况中,接头是APVKQGSG(SEQ ID NO:96)。
在某些情况中,接头多肽可包含氨基酸序列“RAKR”(SEQ ID NO:86)。在某些情况中,弗林蛋白酶接头多肽可由多核苷酸序列多核苷酸序列编码,所述多核苷酸序列包含“CGTGCAAAGCGT”(SEQ ID NO:69)或“AGAGCTAAGAGG”(SEQ ID NO:112)。
在一些实施方式中,接头可以用于本文所述的多核苷酸中。接头可以是柔性接头、刚性接头、体内可切割接头或其任何组合在一些情况中,接头可以将功能结构域连接在一起(如在柔性和刚性接头中)或体内释放游离的功能结构域,如体内可切割接头。
接头可以改善生物活性,增加表达产量,并实现所需药代动力学概况。接头还可以包含腙、肽、二硫化物或硫醚(thioesther)。
在一些情况中,本文所述的接头序列可以包括柔性接头。当连接的结构域需要一定程度的移动或相互作用时,可以应用柔性接头。柔性接头可以由小、非极性(例如,Gly)或极性(例如,Ser或Thr)氨基酸组成。柔性接头可以具有主要由Gly和Ser残基组成的序列(“GS”接头)。柔性接头的实例可以具有序列(Gly-Gly-Gly-Gly-Ser)n(SEQ ID NO:85)。通过调节拷贝数“n”,可以优化该示例性GS接头的长度,以实现功能结构域的适当分离,或维持必要的域间相互作用。除了GS接头,其它柔性接头也可用于重组融合蛋白。在一些情况中,柔性接头也可以富含小或极性氨基酸,如Gly和Ser,但可以包含其它氨基酸,如Thr和Ala,以保持柔韧性。在其它情况中,极性氨基酸(如Lys和Glu)可用于提高溶解度。
本文所述的接头序列中包括的柔性接头可以富含小或极性氨基酸如Gly和Ser,以提供良好的柔性和溶解度。当融合蛋白结构域需要某些运动或相互作用时,柔性接头可以是合适的选择。此外,虽然柔性接头不能具有刚性结构,但是它们可以用作被动接头(passive linker)以保持功能结构域之间的距离。可以调节柔性接头的长度以允许适当折叠或实现融合蛋白的最佳生物学活性。
在一些情况中,本文所述的接头可进一步包括刚性接头。可以利用刚性接头以维持多肽结构域之间的固定距离。刚性接头的示例可以是:形成α螺旋的接头,富含Pro的序列,(XP)n,X-Pro骨架,A(EAAAK)nA(n=2-5)等。在一些情况中,通过采用α-螺旋结构或包含多个Pro残基,刚性接头可显示相对较硬的结构。
在一些情况中,本文所述的接头可以是可切割的。在其它情况中,接头是不可切割的。不可切割的接头可以将功能结构域共价连接在一起,从而在整个体内过程或离体过程中充当一个分子。接头也可以在体内可切割的。可以引入可切割接头以在体内释放游离的功能结构域。可切割的接头可通过还原剂、蛋白酶等的存在而被切割。例如,可以利用二硫键的还原来产生可切割接头。在二硫键连接的情况中,通过与硫醇如谷胱甘肽的二硫键交换而发生的切割事件可能产生切割。在其它情况中,重组融合蛋白中接头的体内切割还可以通过蛋白酶进行,其在病理条件下(例如,癌症或炎症)可以在特定细胞或组织中体内表达,或者受限于某些细胞区室中。在一些情况中,可切割接头可以允许靶向切割。例如,多种蛋白酶的特异性可以在受限的区室中提供较慢的接头裂解。可切割接头还可以包含腙、肽、二硫化物或硫醚(thioesther)。例如,腙可以赋予血清稳定性。在其它情况中,腙可允许在酸性区室中切割。酸性区室的pH可以上至7。接头还可以包括硫醚。硫醚可以是不可还原的。可以设计硫醚,用于胞内蛋白水解降解。
在某些实施方式中,fmdv接头多肽包含这样的序列,其可以与SEQ ID NO:87具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。在某些实施方式中,fmdv接头多肽是单一载体中编码的一个或多个接头,其连接两个或更多个融合蛋白。在某些情况中,fmdv接头多肽可以由多核苷酸开放阅读框(ORF)核酸序列编码。在一些情况中,编码fmdv的ORF包含SEQ ID NO:70的序列或由其组成。在某些实施方式中,编码fmdv的多核苷酸与SEQ ID NO:70具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。
在某些情况中,接头多肽可以是“p2a”接头。在某些实施方式中,p2a多肽可以包含这样的序列,其可以与SEQ ID NO:91具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。在某些实施方式中,p2a接头多肽可以是单一载体中编码的一个或多个接头,其连接两个或更多个融合蛋白。在一些情况中,p2a接头多肽可以由多核苷酸开放阅读框(ORF)核酸序列编码。在某些情况中,编码p2a的ORF包含SEQ ID NO:74的序列或由其组成。在某些情况中,编码p2a的多核苷酸可以是SEQID NO:74或者可以是与SEQ ID NO:74具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。
在一些情况中,接头多肽可以是“GSG-p2a接头”。在某些实施方式中,GSG-p2a接头多肽可以包含这样的序列,其可以与SEQ ID NO:92具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。在某些实施方式中,GSG-p2a接头多肽可以是单一载体中编码的一个或多个接头,其连接两个或更多个融合蛋白。在一些情况中,GSG-p2a接头多肽可以由多核苷酸开放阅读框(ORF)核酸序列编码。编码GSG p2a的ORF包含SEQ ID NO:75的序列。在一些情况中,编码GSG-p2a的多核苷酸可以是SEQ ID NO:75或者可以是与SEQ ID NO:75具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。
接头多肽可以是本文提供的“fp2a”接头。在某些实施方式中,fp2a接头多肽可以包含这样的序列,其可以与SEQ ID NO:95具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。在某些去扛中,fp2a接头多肽可以是单一载体中编码的一个或多个接头,其连接两个或更多个融合蛋白。在一些情况中,fp2a接头多肽可以由多核苷酸开放阅读框(ORF)核酸序列编码。在某些实施方式中,编码fp2a接头的多核苷酸可以是SEQ ID NO:78或者可以是与SEQ ID NO:78具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。
在一些情况中,接头可以经工程改造。例如,可以将接头设计为包括化学特性如疏水性。在一些情况中,至少两个接头序列可以产生相同的蛋白质。序列可以是SEQ ID NO:82、96或97的多肽序列,或者可以是与SEQ ID NO:82、96或97具有至少约45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,97%,98%,99%或100%的相同性。在其它情况中,可以在载体中使用多个接头。例如,感兴趣的基因以及本文所述一个或多个基因开关多肽序列可以通过至少两个接头分开。在一些情况中,基因可以被2、3、4、5、6、7、8、9或多达10个接头分开。
接头可以是工程改造的接头。设计接头的方法可以是计算方法。在一些情况中,计算方法可以包括图形技术。计算方法可以用于由源自数据库的三维肽结构文库搜索合适的肽。例如,布鲁克海文(Brookhaven)蛋白质数据库(PDB)可以用于跨越接头选定氨基酸之间空间的距离。
在一些实施方式中是编码包含弗林蛋白酶多肽和2A多肽的多肽构建体的多核苷酸,其中所述弗林蛋白酶多肽和2A多肽通过包含至少三个疏水氨基酸的多肽接头连接。在一些情况中,至少三个疏水氨基酸选自下述列表:甘氨酸(Gly)(G)、丙氨酸(Ala)(A)、缬氨酸(Val)(V)、亮氨酸(Leu)(L)、异亮氨酸(Ile)(I)、脯氨酸(Pro)(P)、苯丙氨酸(Phe)(F)、甲硫氨酸(Met)(M)、色氨酸(Trp)(W)。在一些情况中,多肽接头也可以包括一个或多个GS接头序列,例如(GS)n、(SG)n、(GSG)n和(SGSG)n,其中n可以是从0到15的任何数字。
提供了获得改善的多肽构建体表达的方法,其包括:提供编码所述多肽构建体的多核苷酸,所述多肽构建体包含第一功能多肽和第二功能多肽,其中所述第一功能多肽和第二功能多肽通过接头多肽连接,所述接头多肽包含与序列APVKQ具有至少60%相同性的序列;和在宿主细胞中表达所述多核苷酸,其中相较于不包含接头多肽的相应多肽构建体,所述接头包含与序列APVKQ具有至少60%相同性的序列的接头多肽,所述表达导致多肽构建体表达改善。
IRES元件
本文还公开了包含IRES元件的构建体,以促进本文所述的多核苷酸和多肽的表达和功能。本文所用术语“内部核糖体进入位点(IRES)”可以旨在表示内部核糖体进入位点。在包含IRES序列的载体中,第一基因可以通过帽依赖性核糖体扫描机制以其自身的5'-UTR而被翻译,然而后续基因的翻译可以帽非依赖性方式通过将核糖体直接募集到IRES来完成。在没有结合5'加帽末端的情况下,IRES序列可以允许真核核糖体结合并开始翻译。IRES序列可以允许由一个转录本表达多个基因(Mountford和Smith,Trends Genet.11(5):179-84(1995))。
本文所用术语“CAP”或“帽”指修饰的核苷酸,通常与真核mRNA的5'端以3'-5'连接的7-甲基鸟苷(7meG-ppp-G),其在由该mRNA表达蛋白质的过程中作为正常翻译起始途径中的必需元件。
在某些情况中,IRES区域可以源自病毒,如小核糖核酸病毒,脑心肌炎病毒,丙型肝炎病毒IRES序列。在其它情况中,IRES序列可以源自脑心肌炎病毒。本文所用术语“EMCV”或“脑心肌炎病毒”指小核糖核酸病毒科(Picornaviridae)脑心肌炎病毒种的任何成员分离株或菌株。示例是:EMCV-R(吕克特(Rueckert))菌株病毒,哥伦比亚-SK(Columbia-SK)病毒。在一些情况中,可以使用细胞IRES元件,如真核起始因子4G,免疫球蛋白重链结合蛋白,c-myc原癌基因,血管内皮生长因子,成纤维细胞生长因子1IRES或其任何组合或修饰。在一些情况中,与病毒IRES相比时,细胞IRES的基因表达可以增加。
病毒、细胞或其组合的IRES序列可用于载体。IRES可以来自脑心肌炎(EMCV)或脊髓灰质炎病毒(PV)。在一些情况中,IRES元件选自下组:脊髓灰质炎病毒(PV),脑脊髓炎病毒(EMCV),口蹄疾病病毒(FMDV),猪捷申病毒1(PTV-1),爱知病毒(Aichivirus,AiV),塞内卡谷病毒(Seneca Valley virus,SVV),丙型肝炎病毒(HCV),经典猪瘟病毒(CSFV),人免疫缺陷病毒2(HIV-2),人类免疫缺陷病毒1(HIV-1),莫洛尼鼠白血病病毒(MoMLV),猫免疫缺陷病毒(FIV),小鼠乳腺肿瘤病毒(MMTV),人巨细胞病毒潜伏(pUL138),EB病毒(EBNA-1),疱疹病毒马立克氏病(MDV RLORF9),SV40多顺反子19S(SV40 19S),禾谷缢管蚜病毒(Rhopalosiphum padi virus,RhPV),蟋蟀麻痹病毒(Cricket paralysis virus,CrPV),斜外翻小核糖核酸样病毒(Ectropis obliqua picorna-like virus,EoPV),大豆尺蠖病毒(Plautia stali intestine virus,PSIV),吸血猎蝽病毒(TrV),蜜蜂麻痹双顺反病毒(IAPV,KBV),黑醋栗逆转病毒(BRV),天竺葵花断裂病毒(PFBV),芙蓉枯黄环斑病毒(Hibiscus chlorotic ringspot virus,HCRSV),十字花科植物感染烟草花叶病毒(CrTMV),马铃薯卷叶病毒(PLRV),烟草蚀刻病毒(TEV),贾第鞭毛虫病毒(GLV),利什曼原虫RNA病毒1(LRV-1)及其组合或修饰。在一些情况中,IRES选自下组:Apaf-1,XIAP,HIAP2/c-IAP1,DAP5,Bcl-2,c-myc,CAT-1,INR,分化LEF-1,PDGF2,HIF-1a,VEGF,FGF2,BiP,BAG-1,CIRP,p53,SHMT1,PITSLREp58,CDK1,Rpr,hid,hsp70,grim,skl,触角足突变,dFoxO,dInR,Adh-Adhr,HSP101,ADH,URE-2,GPR1,NCE102,YMR181a,MSN1,BOI1,FLO8,GIC1,和其任意组合或修饰。当在两个开放阅读框(ORF)之间包含一个IRES元件时,可以通过IRES元件下游的第一个ORF中的经典5'-m7GpppN帽依赖性机制和第二个ORF中的帽不依赖性机制发生翻译的启动。
在一些情况中,基因可以通过内部核糖体进入位点(IRES)连接。IRES可以允许同时表达多个基因。例如,IRES序列可以允许由单一mRNA转录物产生多个蛋白质。核糖体可以5'-帽非依赖性方式结合IRES并启动翻译。
在一些情况中,IRES序列可以是或可以是约500个碱基对。IRES序列可以是300个碱基对-1000个碱基对。例如,IRES可以是300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个碱基对。
在一些情况中,可以减少包含IRES序列的载体内的下游基因的表达。例如,相比IRES序列之前的基因,可以减少IRES序列之后的基因的表达。相对于之前的基因,表达的减少可以是1%-99%的减少。
调节表达的方法
在一个实施方式中,提供了调节工程改造的细胞中异源基因表达的方法。提供了编码用于配体诱导控制异源基因表达、抗原结合多肽和异源基因的基因开关多肽的多核苷酸。在一些情况中,多核苷酸在如图1-图16中任一所示的一个或多个基因表达盒中。在另一情况中,将多核苷酸经由病毒或非病毒载体纳入工程改造的细胞中。病毒载体可以包括慢病毒载体、逆转录病毒载体或腺病毒载体。非病毒载体可包括睡美人转座子。在另一情况中,将多核苷酸经由重组酶或基因编辑技术纳入工程改造的细胞中。重组酶的示例是本文所述的丝氨酸重组酶。基因编辑技术的示例可以包括CRISPR或Argonaute系统。在本文中,“CRISPR系统”的“CRISPR基因编辑系统”指任何RNA引导的Cas蛋白介导的过程,用于将DNA序列的变化靶向基因组的特定区域。在本文中,“Argonaute基因编辑系统”指任何单链DNA引导的Argonaute内切核酸酶介导的过程,用于将DNA序列的变化靶向基因组的特定区域。
药物组合物和剂量
本公开提供了包含本文所述腺病毒或腺病毒载体和运其载体(例如,药学上可接受的运载体)的组合物。组合物理想地是生理学上可接受的(例如,药学上可接受的)组合物,其包含运载体,优选生理学上(例如,药学上)可接受的运载体,和腺病毒或腺病毒载体。在本公开的上下文中可以使用任何合适的运载体,并且这类运载体在本领域中是众所周知的。运载体的选择将部分地由组合物的特定用途(例如,给予动物)和用于给予组合物的特定方法来确定。理想地,在复制缺陷型腺病毒载体的上下文中,药物组合物优选不含具有复制能力的腺病毒。任选地,药物组合物可以是无菌的。
合适的组合物包括水性和非水性等渗无菌溶液,其可以包含抗氧化剂,缓冲剂和抑菌剂,以及可以包括悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂的水性和非水性无菌悬浮液。组合物可以存在于单位剂量或多剂量封装容器如安瓿和药瓶中,并可以在冷冻干燥(冻干)条件下保存,临用前只需要加入无菌液体运载体(例如,水)即可。可由无菌粉末、颗粒剂和片剂制备临时溶液剂和混悬剂。优选地,运载体是缓冲盐溶液。更优选地,腺病毒或腺病毒载体是配制成用于保护腺病毒或腺病毒载体在给药前不受损害的组合物的部分。例如,可以配制组合物,以减少装置如玻璃器皿、注射器或针头上腺病毒或腺病毒载体的损失,所述装置用于制备、储存或施用腺病毒或腺病毒载体。可以配制组合物以降低腺病毒或腺病毒载体的光敏感性和/或温度敏感性。为此,组合物优选包含药学上可接受的液体运载体,例如上述那些,和选自下组的稳定剂:聚山梨酯80,L-精氨酸,聚乙烯吡咯烷酮,海藻糖及其组合。这类组合物的使用将延长腺病毒或腺病毒载体的保存期限,并促进其给予。包含腺病毒或含腺病毒载体的组合物的制剂进一步描述于例如美国专利号6,225,289、美国专利号6,514,943和国际专利申请公开号WO 2000/034444中。
还可以配制组合物以增强转导效率。此外,本领域技术人员将理解的是,腺病毒或腺病毒载体可以与其它治疗性或生物活性剂存在于组合物中。例如,控制炎症的因子,如布洛芬或类固醇,可以是组合物的部分,以减少与腺病毒或腺病毒载体体内给药有关的肿胀和炎症。如果使用腺病毒或腺病毒载体将编码抗原的核酸序列递送给宿主,那么可以给予免疫系统刺激剂或佐剂,例如,白介素、脂多糖或双链RNA,以增强或修饰针对抗原的任何免疫应答。可以存在抗生素,即杀微生物剂和杀真菌剂,以治疗现有感染和/或降低未来感染的风险,如与基因转移操作相关的感染。
在一些实施方式中,本文公开了包含本文所公开的多核苷酸或多肽的组合物,用于对于对象中。在一些情况中,是经修饰的效应细胞组合物,其编码本文所公开的多核苷酸或多肽,并且任选地,包含细胞因子和/或其它治疗剂。在一些情况中,本文还包括编码基因开关多肽的载体,用于调节嵌合抗原受体的表达以修饰效应细胞。
在一些情况中,使用一种或多种生理学上可接受的运载体,包括有助于将活性物质处理成可以药学上使用的制剂的赋形剂和佐剂,以常规方式配制经修饰的效应细胞或编码基因开关多肽和嵌合抗原受体的载体的药物组合物。适当的制剂取决于所选的给药途径。本文所述药物组合物的总结存在于,例如,《雷明顿:药物科学与实践》(Remington:TheScience and Practice of Pharmacy),第19版(宾夕法尼亚州伊斯顿:马克出版公司(MackPublishing Company),1995);Hoover,John E.,《雷明顿药物科学》(Remington’sPharmaceutical Sciences),马克出版公司.,宾夕法尼亚州伊斯顿1975;Liberman,H.A.和Lachman,L.,编著,《药物剂型和药物递送系统》(Pharmaceutical Dosage Forms),马塞尔·德克尔出版公司(Marcel Decker),纽约州纽约市,1980;和《药物剂型和药物递送系统》(Pharmaceutical Dosage Forms and Drug Delivery Systems),第17版(利平科特·威廉姆斯和威尔金斯出版集团(Lippincott Williams and Wilkins)1999)。
任选地,药物组合物以常规方式制造,例如,仅为举例说明,通过常规的混合、溶解、制粒、糖衣丸制备、悬浮、乳化、包囊、包埋或压制方法。
在某些实施方式中,组合物可以包含一种或多种PH调节剂或缓冲剂,包括酸,如乙酸,硼酸,柠檬酸,乳酸,磷酸和盐酸;碱,如氢氧化钠,磷酸钠,硼酸钠,柠檬酸钠,乙酸钠,乳酸钠和tris-羟甲基甲胺;和缓冲剂,如柠檬酸盐/右旋糖,碳酸氢钠和氯化铵。以维持组合物的pH在可接受的范围内所需的量包含这样的酸、碱和缓冲剂。
在其它实施方式中,组合物还可以包含使组合物的渗透压在可接受范围内的量的一种或多种盐。这样的盐包括含钠,钾或铵阳离子和氯,柠檬酸根,抗坏血酸根,硼酸根,磷酸根,碳酸氢根,硫酸根,硫代硫酸根或亚硫酸氢根阴离子的盐;合适的盐包括氯化钠,氯化钾,硫代硫酸钠,亚硫酸氢钠和硫酸铵。
本文所述的药物组合物通过任何合适的给药途径给予,包括但不限于口服,肠胃外(例如,静脉内,皮下,肌内,脑内,脑室内,关节内,腹膜内或颅内),鼻内,颊,舌下或直肠给药途径。在一些情况中,将药物组合物配制成用于肠胃外(例如,静脉内,皮下,肌内,脑内,脑室内,关节内,腹膜内或颅内)给药。
本文所述的药物组合物配制成任何合适的剂型,包括但不限于,水性口服分散液,液体,凝胶,糖浆,酏剂,浆液,悬浮液等,以供待治疗的个体口服摄取,固体口服剂型,气雾剂,控释制剂,速溶制剂,泡腾剂制剂,冻干制剂,片剂,散剂,丸剂,糖衣药丸,胶囊,延迟释放制剂,延长释放制剂,搏动释放制剂,多颗粒制剂和混合的即释和控释制剂。在一些实施方式中,药物组合物配制成胶囊。在一些实施方式中,药物组合物配制成溶液(例如,用于IV给药)。在一些情况中,药物组合物配制成输注液。在一些情况中,药物组合物配制成注射剂。
任选地,本文所述药物固体剂型包括本文所述的化合物和一种或多种药学上可接受的添加剂,如相容性运载体,粘合剂,填充剂,悬浮剂,调味剂,甜味剂,崩解剂,分散剂,表面活性剂,润滑剂,着色剂,稀释剂,增溶剂,增湿剂,增塑剂,稳定剂,渗透促进剂,润湿剂,消泡剂,抗氧化剂,防腐剂或其一种或多种组合。
在其它方面中,使用标准包衣方法,如在《雷明顿药物科学》(Remington'sPharmaceutical Sciences),第20版(2000)中描述的那些,在组合物周围提供膜包衣。在一些实施方式中,将组合物配制成颗粒(例如,用于通过胶囊给药),并且将一些或全部颗粒包衣。在一些实施方式中,将组合物配制成颗粒(例如,用于通过胶囊给药),并且将一些或全部颗粒微囊化。在一些实施方式中,将组合物配制成颗粒(例如,用于通过胶囊给药),并且一些或全部颗粒未被微囊化且未被包衣。
在某些实施方式中,本文所提供的组合物还可以包含一种或多种防腐剂以抑制微生物活性。合适的防腐剂包括含汞物质,如硼酸苯汞(merfen)和硫柳汞;稳定的二氧化氯;和季铵化合物,如苯扎氯铵,十六烷基三甲基溴化铵和氯化十六烷基吡啶。
“消泡剂”减少了加工过程中的起泡,起泡会导致水分散体凝结、成品薄膜中的气泡、或通常损害加工。示例性的消泡剂包括硅乳剂或倍半油酸山梨坦(sorbitansesquoleate)。
“抗氧化剂”包括,例如,丁基化羟基甲苯(BHT),抗坏血酸钠,抗坏血酸,偏亚硫酸氢钠和生育酚。在某些实施方式中,抗氧化剂在需要时增强化学稳定性。
本文所述的制剂可受益于抗氧化剂,金属螯合剂,含硫醇的化合物和其它一般稳定剂。这种稳定剂的实例包括但不限于:(a)约0.5%至约2%w/v甘油,(b)约0.1%至约1%w/v甲硫氨酸,(c)约0.1%至约2%w/v硫代甘油,(d)约1mM至约10mM EDTA,(e)约0.01%至约2%w/v抗坏血酸,(f)0.003%至约0.02%w/v聚山梨醇酯80,(g)0.001%至约0.05%w/v聚山梨醇酯20,(h)精氨酸,(i)肝素,(j)硫酸右旋糖酐,(k)环糊精,(l)戊聚糖多硫酸酯和其它类肝素,(m)二价阳离子如镁和锌;或(n)其组合。
“粘合剂“赋予粘性并包括例如海藻酸及其盐;纤维素衍生物,如羧甲基纤维素,甲基纤维素(例如,
Figure BDA0002762906700000671
),羟丙基甲基纤维素,羟乙基纤维素,羟丙基纤维素(例如,
Figure BDA0002762906700000681
),乙基纤维素(例如,
Figure BDA0002762906700000682
)和微晶纤维素(例如,
Figure BDA0002762906700000683
);微晶右旋糖;直链淀粉;镁铝硅酸盐;多糖酸;膨润土;明胶;聚乙烯吡咯烷酮/乙酸乙烯酯共聚物;交聚维酮;聚维酮;淀粉;预胶化淀粉;黄蓍胶,糊精,糖,如蔗糖(例如,
Figure BDA0002762906700000684
),葡萄糖,右旋糖,糖蜜,甘露醇,山梨糖醇,木糖醇(例如,
Figure BDA0002762906700000685
)和乳糖;天然或合成树胶,如阿拉伯树胶,黄蓍胶,茄替胶,等足类动物外壳(isapol husk)粘液,聚乙烯吡咯烷酮(例如,
Figure BDA0002762906700000686
CL、
Figure BDA0002762906700000687
CL、
Figure BDA0002762906700000688
XL-10),落叶松阿拉伯半乳聚糖,
Figure BDA0002762906700000689
聚乙二醇,蜡,海藻酸钠等。
“运载体”或“运载体物质”包括药剂学中任何常用的赋形剂,并且应基于与本文公开的化合物(如依鲁替尼和抗癌剂的化合物)的相容性以及所需剂量形式的释放特性来选择。示例性的运载体物体包括,例如,粘合剂、悬浮剂、崩解剂、填充剂、表面活性剂、增溶剂、稳定剂、润滑剂、湿润剂、稀释剂等。“药学上相容的载体材料”可以包括但不限于,阿拉伯胶,明胶,胶体二氧化硅,甘油磷酸钙,乳酸钙,麦芽糖糊精,甘油,硅酸镁,聚乙烯吡咯烷酮(PVP),胆固醇,胆固醇酯,酪蛋白酸钠,大豆卵磷脂,牛磺胆酸,磷脂酰胆碱,氯化钠,磷酸三钙,磷酸二钾,纤维素和纤维素偶联物,硬脂酰乳酸钠糖,角叉菜胶,甘油单酯,甘油二酯,预胶化淀粉等。参见例如,《雷明顿:药物科学与实践》(Remington:The Science andPractice of Pharmacy),第19版(宾夕法尼亚州伊斯顿:马克出版公司(Mack PublishingCompany),1995);Hoover,John E.,《雷明顿药物科学》(Remington’s PharmaceuticalSciences),马克出版公司,宾夕法尼亚州伊斯顿1975;Liberman,H.A.和Lachman,L.,编著,《药物剂型和药物递送系统》(Pharmaceutical Dosage Forms),马塞尔·德克尔出版公司(Marcel Decker),纽约州纽约市,1980;和《药物剂型和药物递送系统》(PharmaceuticalDosage Forms and Drug Delivery Systems),第17版(利平科特·威廉姆斯和威尔金斯出版集团(Lippincott Williams and Wilkins)1999)。
“分散剂”和/或“粘度调节剂”包括通过液体介质或造粒方法或混合方法来控制药物扩散和均匀性的物质。在一些实施方式中,这些试剂还促进涂层或侵蚀基质的有效性。示例性的扩散促进剂/分散剂包括例如,亲水聚合物,电解质,
Figure BDA00027629067000006810
60或80,PEG,聚乙烯吡咯烷酮(PVP;商品名为
Figure BDA00027629067000006811
)和基于碳水化合物的分散剂,例如羟丙基纤维素(例如,瓾PC,HPC-SL和HPC-L),羟丙基甲基纤维素(例如,HPMC K100,HPMC K4M,HPMC K15M和HPMCK100M),羧甲基纤维素钠,甲基纤维素,羟乙基纤维素,羟丙基纤维素,羟丙基甲基纤维素邻苯二甲酸酯,乙酸羟丙基甲基纤维素硬脂酸酯(HPMCAS),非结晶纤维素,硅酸铝镁,三乙醇胺,聚乙烯醇(PVA),乙烯基吡咯烷酮/乙酸乙烯酯共聚物(S630),4-(1,1,3,3-四甲基丁基)-苯酚聚合物与乙烯氧化物和甲醛(也称为泰洛沙泊(tyloxapol)),泊洛沙姆(poloxamer)(例如,
Figure BDA0002762906700000691
Figure BDA0002762906700000692
它们是环氧乙烷和环氧丙烷的嵌段共聚物);和泊洛沙胺(畃oloxamine)(例如Tetronic
Figure BDA0002762906700000693
也称为Poloxamine
Figure BDA0002762906700000694
其是源自顺式加成环氧乙烷和环氧乙烷到乙二胺的四官能嵌段共聚物(新泽西州帕西波尼的巴斯夫公司(BASF Corporation,Parsippany,NJ)),聚乙烯吡咯烷酮K12,聚乙烯吡咯烷酮K17,聚乙烯吡咯烷酮K25,或聚乙烯吡咯烷酮K30,聚乙烯吡咯烷酮/乙酸乙烯酯共聚物(S-630),聚乙二醇,例如,聚乙二醇可具有约300至约6000,或约3350至约4000,或约7000至约5400的分子量,羧甲基纤维素钠,甲基纤维素,聚山梨醇酯-80,海藻酸钠,树胶,例如,黄蓍胶和阿拉伯树胶,瓜尔胶,黄原胶,包括黄原胶,糖,纤维素,例如羧甲基纤维素钠,甲基纤维素,羧甲基纤维素钠,聚山梨醇酯-80,海藻酸钠,聚乙氧基化山梨醇酐单月桂酸酯,聚乙氧基化山梨醇酐单月桂酸酯,聚维酮,卡波姆(carbomer),聚乙烯醇(PVA),藻酸盐,壳聚糖及其组合。增塑剂如纤维素或三乙基纤维素也可用作分散剂。增塑剂如纤维素或三乙基纤维素也可以用作分散剂。在脂质体分散和自乳化分散中特别有用的分散剂是二肉豆蔻酰基磷脂酰胆碱,鸡蛋中的天然磷脂酰胆碱,鸡蛋中的天然磷脂酰甘油,胆固醇和肉豆蔻酸异丙酯。
一种或多种腐蚀促进剂与一种或多种扩散促进剂的组合也可以用于本发明的组合物中。
术语“稀释剂”指用于在递送前稀释感兴趣化合物的化合物。稀释剂还可以用于稳定化合物,因为它们可以提供更稳定的环境。将溶解于缓冲溶液中的盐(其也可以提供pH控制或维持)用作本领域的稀释剂,包括但不限于磷酸盐缓冲盐水溶液。在某些实施方式中,稀释剂增加了组合物的体积以促进压缩或产生足够的体积,用于胶囊填充的均匀混合。这些化合物包括例如,乳糖,淀粉,甘露醇,山梨糖醇,右旋糖,微晶纤维素,如
Figure BDA0002762906700000695
磷酸氢钙,二水磷酸二钙;磷酸三钙,磷酸钙;无水乳糖,喷雾干燥的乳糖;预胶化淀粉,可压缩的糖,如Di-
Figure BDA0002762906700000701
(Amstar);甘露醇,羟丙基甲基纤维素,乙酸羟丙基甲基纤维素硬脂酸酯,基于蔗糖的稀释剂,糖粉(confectioner’s sugar);一元硫酸钙一水合物,硫酸钙二水合物;乳酸钙三水合物,葡聚糖;水解的谷物固体,直链淀粉;粉状纤维素,碳酸钙;甘氨酸,高岭土;甘露醇,氯化钠;肌醇,膨润土等。
“填充剂”包括化合物,如乳糖,碳酸钙,磷酸钙,磷酸氢钙,硫酸钙,微晶纤维素,纤维素粉末,右旋糖,葡聚糖,右旋糖酐,淀粉,预胶化淀粉,蔗糖,木糖醇,乳糖醇,甘露醇,山梨糖醇,氯化钠,聚乙二醇等。
“润滑剂”和“助流剂”是防止、减少或抑制材料粘附或摩擦的化合物。示例性的润滑剂包括,例如,硬脂酸,氢氧化钙,滑石,硬脂酰富马酸钠,碳氢化合物,如矿物油,或氢化的植物油,如氢化的大豆油(
Figure BDA0002762906700000702
),高级脂肪酸及其碱金属和碱土金属盐,如铝,钙,镁,锌,硬脂酸,硬脂酸钠,甘油,滑石,蜡,
Figure BDA0002762906700000703
硼酸,苯甲酸钠,乙酸钠,氯化钠,亮氨酸,聚乙二醇(例如,PEG-4000)或甲氧基聚乙二醇,如CarbowaxTM,油酸钠,苯甲酸钠,山嵛酸甘油酯,聚乙二醇,十二烷基硫酸镁或钠,胶体二氧化硅,如SyloidTM,Cab-O-
Figure BDA0002762906700000704
淀粉,如玉米淀粉,硅油,表面活性剂等。
“增塑剂”是用于软化微胶囊化物质或薄膜涂层以使其不易碎的化合物。合适的增塑剂包括,例如,聚乙二醇,如PEG 300,PEG 400,PEG 600,PEG1450,PEG 3350和PEG 800,硬脂酸,丙二醇,油酸,三乙基纤维素和三乙酸甘油酯。在一些实施方式中,增塑剂还可以充当分散剂或湿润剂。
“增溶剂”包括化合物例如三乙酸甘油酯,柠檬酸三乙酯,油酸乙酯,辛酸乙酯,十二烷基硫酸钠,二十二碳四烯酸钠(sodium doccusate),维生素E TPGS,二甲基乙酰胺,N-甲基吡咯烷酮,N-羟乙基吡咯烷酮,聚乙烯吡咯烷酮,羟丙基甲基纤维素,羟丙基环糊精,乙醇,正丁醇,异丙醇,胆固醇,胆汁盐,聚乙二醇200-600,四氢呋喃聚乙二醇醚(glycofurol),还氧二元醇(transcutol),丙二醇和二甲基异山梨醇等。
“稳定剂”包括诸如任何抗氧化剂、缓冲剂、酸、防腐剂等的化合物。
“悬浮剂”包括化合物例如聚乙烯吡咯烷酮,例如,聚乙烯吡咯烷酮K12,聚乙烯吡咯烷酮K17,聚乙烯吡咯烷酮K25,或聚乙烯吡咯烷酮K30,乙烯基吡咯烷酮/乙酸乙烯酯共聚物(S630),聚乙二醇,例如,聚乙二醇可具有约300至约6000,或约3350至约4000,或约7000至约5400的分子量,羧甲基纤维素钠,甲基纤维素,羟丙基甲基纤维素,乙酸羟甲基纤维素硬脂酸酯,聚山梨醇酯-80,羟乙基纤维素,海藻酸钠,树胶,例如黄蓍胶和树胶阿拉伯胶,瓜尔胶,黄原胶,包括黄原胶,糖,纤维素,例如羧甲基纤维素钠,甲基纤维素,羧甲基纤维素钠,羟丙基甲基纤维素,羟乙基纤维素,聚山梨醇酯-80,海藻酸钠,聚乙氧基化山梨醇酐单月桂酸酯,聚乙氧基化山梨醇酐单月桂酸酯,聚维酮等。
“表面活性剂”包括化合物例如如十二烷基硫酸钠,多库酯钠,吐温60或80,三乙酸甘油酯,维生素E TPGS,山梨醇酐单月桂酸酯,聚氧乙烯山梨醇酐单月桂酸酯,聚山梨醇酯,泊咯沙姆(polaxomer),胆汁盐,单硬脂酸甘油酯,环氧乙烷和环氧丙烷的共聚物,例如,
Figure BDA0002762906700000711
(巴斯夫公司)等。其它表面活性剂包括聚氧乙烯脂肪酸甘油酯和植物油,例如,聚氧乙烯(60)氢化蓖麻油;和聚氧乙烯烷基醚和烷基苯基醚,例如辛基苯酚10,辛苯聚醇40。在一些实施方式中,可以包含表面活性剂以增强物理稳定性或用于其它目的。
“粘度增强剂”包括,例如,甲基纤维素,黄原胶,羧甲基纤维素,羟丙基纤维素,羟丙基甲基纤维素,羟丙基甲基纤维素硬脂酸酯,羟丙基甲基纤维素邻苯二甲酸酯,卡波姆,聚乙烯醇,海藻酸盐,阿拉伯胶,壳聚糖及其组合。
“润湿剂”包括这样的化合物,如油酸,单硬脂酸甘油酯,单油酸山梨聚糖酯,单月桂酸山梨聚糖酯,油酸三乙醇胺,聚氧乙烯山梨醇酐单月桂酸酯,聚氧乙烯山梨醇酐单月桂酸酯,多库酯钠,油酸钠,十二烷基硫酸钠,二十二碳五烯酸钠,三醋精,吐温80,维生素ETPGS,铵盐等。
试剂盒/制品
在某些实施方式中,本文公开了药盒和制品用于本文所述的一种或多种方法。这类药盒包括运载体、包装或容器,其经分隔可容纳一个或多个容器例如小瓶、管等,每个容器包含一种用于本文所述方法的单独元素。合适的容器包括例如瓶、小瓶、注射器和试管。在一个实施方式中,容器可由各种材料如玻璃或塑料制成。
本文提供的制品含有包装材料。药用包装材料的示例包括但不限于泡罩包装、瓶、管、包、容器、瓶和任何适用于所需制剂和期望的给药和治疗方式的包装材料。
药盒一般包含列出组分和/或使用说明的标签,以及带有使用说明的包装插页。一般装有一套说明书。
在一些实施方式中,标签在容器上或与容器相关联。在一实施方式中,当形成标签的字母、数字或其它字符是模塑或蚀刻到容器本身中时,标签在容器上;当容器存在容纳该容器的接收容器或载体中时,标签与该容器附在一起,例如作为包装插页。在一个实施方式中,标签用于指示将用于特定治疗应用的内容物。标签还指示内容物的使用说明,如本文所述的方法。
实施例
提供这些实施例仅用于说明目的,而不是限制本文所提供的权利要求的范围。
实施例1
HPV疫苗设计的抗原性生物信息学工作流程
生成共识序列下载E5、E6和E7的样本序列(针对HPV16、HPV 17、HPV31、HPV33和HPV45,这些是确定为具有较高癌症易感性的血清型),转换为FASTQ文件,并导入R统计程序。使用biostrings程序包(readAAStringSet函数)将单个AA序列读入R。使用msa R软件包中的ClustalW算法进行多个序列比对。对于各子组/子类型,使用msaPrettyPrint函数生成共识序列并将其输出到PDF/FASTQ文件。
预测结合亲和力
将NetMHC4.0应用于各共有序列以预测针对所有主要MHC-1等位基因(HLA-A0101、HLA-A0201、HLA-A0301、HLA-A2402、HLA-A2601、HLA-B0702、HLA-B0801、HLA-B2705、HLA-B3901、HLA-B4001、HLA-B5801和HLA-B1501)的结合亲和力。NetMHC4.0使用人工神经网络来预测肽序列的结合亲和力。对HPV16、HPV18、HPV31、HPV33和HPV45进行这类分析。阈值被任意设置为0.5%(强结合剂)和2%(弱结合剂)等级。将预测结合亲和力大于99.5%的肽归类为强结合剂,并将预测结合亲和力大于98%的肽归类为弱结合剂。提取肽序列内各AA的位置,并用于产生密度曲线(图7A和图7B)。使用这些密度曲线计算一阶和二阶微分,以确定强结合剂和弱结合剂的峰(图7C)。最后,将这些位置的并集用于提取可能引起应答的AA序列。
预测HPV16、HPV18、HPV31、HPV33和HPV45中的结合亲和力
先前的研究表明,HPV株16、18、31、33和45是宫颈癌的前兆。为了鉴定在这些菌株中具有广泛覆盖的候选肽,在各菌株内预测了结合亲和力。提取具有强/弱结合亲和力预测结果的序列。使用蛋白质序列比对(protein blast),将这些序列与所有五个菌株中的共有序列进行比对。针对所有五个血清型绘制比对并评估覆盖。
实施例2
HPV抗原设计
HPV株上天然存在的序列变异可能会阻碍有效HPV疫苗的开发。为了解决这个问题,本公开疫苗设计方法利用生物信息学和蛋白质工程改造方法来选择和设计这样的抗原,其对T细胞表位、新型突变和增强子激动剂肽具有更广泛覆盖率。利用具有CTL特异性表位的抗原区域覆盖率扩大的现有信息以及计算机模拟预测结果,设计的HPV疫苗抗原可以诱导稳健的HPV-16和HPV-18特异性反应并可能有利于处于患HPV衍生癌症高风险的患者。
新的HPV疫苗包括下述工程改造的蛋白质、肽和/或修饰:
1)截短的E5区域,其与HPV16和HPV18的E6和E7结构域融合;
2)新设计的点突变,其可以潜在地消除与已知PTPN13结合突变体的p53结合(Weiking等,Cancer Gene Ther.19(10):667-74(2012).doi:10.1038/cgt.2012.55.电子出版于2012年8月24日);
3)在C末端HPV18E6非免疫原性区域中的新型截短和p53结合敲除突变体的应用;
4)在N末端的HPV18E7非免疫原性区域的新型截短和纳入pRb,Mi2B突变体(Weiking等,2012);和/或
5)激动剂肽,来自Tsang等,Vaccine 35(19):2605-2611(2017)doi:10.1016/j.vaccine.2017.03.025.电子出版于2017年4月4日,于新设计的HPV疫苗构建体中。
HPV设计1
将共有序列信息用于选择针对包括所有主要变体的设计的HPV16/18参照序列。包含具有结构域边界和突变信息的不同的E6、E7和E5蛋白组分的疫苗组合物示于图3。E6的参照序列是获自人乳头瘤病毒(Human Papillomavirus)T细胞抗原数据库(Dana-Farber癌症研究所癌症疫苗中心的生物信息学核心(Bioinformatics Core at Cancer VaccineCenter,Dana-Farber Cancer Institute))。E5和E7的参照序列获自乳头瘤病毒知识(PaVE)数据库。
HPV16和HPV18 E5的设计受到计算机模拟预测(IEDB和netMHC)的启发,并且HPV16的设计还包括Chen等,J Virol.78(3):1333-43(2004)的发现;然而,HPV18的设计包括N末端残基(1-26)和C末端残基(41-53、58-71)(参见图4A和4B)。
为了防止致癌性,将HPV16和HPV18的失活突变引入E6和E7肽序列中(Weiking等,2012Oct;19(10):667-74.doi:10.1038/cgt.2012.55.电子出版于2012年8月24日)。对于HPV16E6,这些突变是E18A,L50G和从148-151的丙氨酸替代(从ETQL到AAAA)。对于HPV16E7,包括四个突变(H2P,C24G,E46A和L67R)(Weiking等,2012)。对于HPV18E6,包括两个突变(E18A和L52G)。对于HPV18E6,仅预测到N末端部分包含MHC-1结合表位(IEBD和netMHC分析),因此,将这些设计中从氨基酸121开始的残基移除。为了进一步消除其与p53蛋白的相互作用,E6中包含了另一个突变(Martinez-Zapien等,Nature 529(7587):541-45(2016))。对于HPV18 E7,包括两个突变(E55A和L74R)(Weiking等,2012),并且移除了从(1-40)的残基,因为HPV-18E7在C末端区域包含了大多数预测的MHC-1结合表位(IEDB和netMHC预测)。
HPV设计2
为了设计重组多表位蛋白作为HPV疫苗抗原,选择了总共32个关键免疫原性肽,如表2所示。这些肽包括来自E6(HPV-16/-18)、E7(HPV-16/-18)和E5(HPV16)基因的CTL特异性肽。这些CTL表位中的大多数在过多种免疫试验中报告,免疫蛋白质组学,并包括在IEDB资源和netMHC预测中。这种抗原设计的新颖之处在于将CTL肽移接到人锚蛋白重复蛋白支架上,从而可能产生带有T细胞表位和/或蛋白酶体切割位点的新蛋白质。
选择人锚蛋白样重复序列(“ALR”)蛋白(PDB码1QYM)作为在其上随机组装CTL肽的支架,这使得能够在肽之间嵌入不同类型的蛋白质接头序列。ALR蛋白通常具有高表达和高稳定性;ALR蛋白为HPV肽提供支架并且可能产生新型CTL。谨慎地通过随机改组肽段来防止E6和E7致癌蛋白的任何重新形成。
将同源模型(图4A)用于评估总体结构特征并将设计针对天然锚蛋白重复序列进行比较。该模型表明,锚蛋白支架上的移接的CTL肽应保持其三级结构。预期的是连接这些肽的支架氨基酸可以用作“接头”,并有可能产生新的CTL表位和/或激动剂肽表位。
表2.来自E5(HPV16)、E6(HPV16和HPV18)和E7(HPV16和HPV18)的肽以及用于组装多表位疫苗构建体的激动剂肽
Figure BDA0002762906700000751
Figure BDA0002762906700000761
HPV设计3
设计3与设计1相似,其增加了增强子激动剂肽(图3)。总体而言,设计1和3包含来自各E5、E6和E7的所有必需序列(图4A和4B)。这些是由发明人选择的组合所启发,所述组合使用计算机表位预测分析的指导以及有关T细胞活化后MHC-1结合和细胞因子产生的可用信息。
对于HPV16,该设计包括:(1)来自Tsang等,Vaccine 35(19):2605-2611(2017)doi:10.1016/j.vaccine.2017.03.025.电子出版于2017年4月4日的肽——三种肽表现出更好的MHC-1结合并引发更稳健的细胞毒性T细胞淋巴细胞(CTL)反应,包括E6中突变(L19V和Q91L/L99V)和E7中突变(T86V);(3)与E6失活的N和C末端融合的两个增强子肽;和(4)与E7失活的C末端融合的一个增强子肽。
对于HPV18,该设计包括:(1)具有与模拟增强子激动剂肽相同突变的三个肽,所述模拟增强子激动剂肽与在E6中包含突变(L21V和L101V)的HPV16的肽(Tsang等,2017)相似;和(2)与E6的N和C末端区域融合的两个潜在的模拟增强子激动剂,以及与E7的C末端区域融合的另一个激动剂模拟物。因为HPV18在E6(Q91L)和E7(T95V)中天然地具有上述突变,所以无需其它修饰。
HPV设计4
该设计基于设计2,采用相同的锚蛋白重复方法。然而,设计4包含了来自Tsang等,2017的肽中其它的3个独特的激动剂肽,总共35个关键免疫原性肽(表2)。将移接到支架上的肽的顺序再次随机化,从而不同于设计2并且有可能产生不同的CTL表位。生成了设计4的同源模型(图4B)。发现该设计的同源性与设计2相似,但是表明局部结构变化。
HPV设计5
该设计是多表位疫苗,通过选择表2中所示所有35个关键免疫原性肽来设计。其用带电荷的二肽KK残基组装。该设计的优点包括在“KK”残基处切割的潜力和用在CTL表位添加的“K”残基进行随机修饰。
实施例3
评估HPV疫苗构建体的预测结合亲和力
对各设计的结合亲和力进行了生物信息学预测。将整个序列加载到NetMHC中,将其用于评估抗原性和针对各种HPV基因型的覆盖程度。应当注意的是,设计4和5使用相同的35个肽。主要区别在于设计4肽被移接到锚蛋白上,而设计5肽通过“KK”接头连接(图5A)。最终,两个设计的匹配区域上的结合亲和力预测是相似的(图5B)。HPV设计彼此之间进行比较(表3和表4)并与图8、图9A-9C和图10A-10C中所示参照序列进行比较。
表3.HPV16设计元件(HPV设计1和3)
Figure BDA0002762906700000771
表4.HPV18设计元件(HPV设计1和3)
Figure BDA0002762906700000781
以上具体实施方式的描述完全揭示了本发明的一般性质,通过应用本领域技术范围内的知识,他人无需过多实验即能很容易地在不背离本发明总体理念的前提下就各种应用改良和/或修改这些具体实施方式。因此,基于本文所列出的教导和指南,应理解为这些修改和改良落入所公开实施方式的等同形式的含义和范围内。应当理解的是,本文中的词组或术语是出于描述而非限制的目的,因此本说明书的术语或词组将由本领域技术人员根据教导和指导来解释。
本领域技术人员通过考虑说明书及本文所公开的发明的实践可以显而易见地想到本发明的其它的实施方式。本说明书和实施例应旨在作为示例性的,本发明真正范围和精神由所附权利要求书来指示。
本申请要求2018年3月6日提交的美国临时专利申请号62/639,354的权益,其公开内容通过引用全文纳入本文。
实施方式
E1.一种非天然产生的多核苷酸,其编码包含一个或多个免疫应答诱导人乳头瘤病毒(HPV)多肽的多肽。
E2.如E1所述的多核苷酸,其中,所述非天然产生的多核苷酸编码包含两个或更多个HPV多肽的多肽。
E3.如E2所述的多核苷酸,其中,所述两个或更多个HPV多肽包含一个或多个HPV-16免疫应答诱导多肽序列。
E4.如E3所述的多核苷酸,其中,所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个。
E5.如E3或E4所述的多核苷酸,其中,所述HPV-16肽包含E5肽,并且所述E5肽具有SEQ ID NO:47中所示的序列。
E6.如E3-E5中任一项所述的多核苷酸,其中,所述HPV-16肽包含E6肽,并且所述E6肽具有SEQ ID NO:45中所示的序列。
E7.如E3-E6中任一项所述的多核苷酸,其中,所述HPV-16肽包含E7肽,并且所述E7肽具有SEQ ID NO:46中所示的序列。
E8.如E1-E7中任一项所述的多核苷酸,其中,所述一个或多个HPV肽包括HPV-18肽。
E9.如E8所述的多核苷酸,其中,所述HPV-18肽包含E5肽、E6肽或E7肽中的至少一个。
E10.如E8或9所述的多核苷酸,其中,所述HPV-18肽包含E5肽,并且所述E5肽具有SEQ ID NO:50中所示的序列。
E11.如E8-E10中任一项所述的多核苷酸,其中,所述HPV-18肽包含E6肽,并且所述E6肽具有SEQ ID NO:48中所示的序列。
E12.如E8-E10中任一项所述的多核苷酸,其中,所述HPV-18肽包含E7肽,并且所述E7肽具有SEQ ID NO:49中所示的序列。
E13.如E1-E12中任一项所述的多核苷酸,其中,所述多肽具有SEQ ID NO:51中所示的序列。
E14.如E1-E13中任一项所述的多核苷酸,其中,所述一个或多个HPV多肽中的至少一个与激动剂肽连接。
E15.如E14所述的多核苷酸,其中,所述激动剂肽具有序列,所述序列包含表2中所示的激动剂肽序列。
E16.如E14或E15所述的多核苷酸,其中,所述多肽具有SEQ ID NO:53中所示的序列。
E17.一种包含E1-E16中任一项所述的多核苷酸的多核苷酸,其还包含编码基因开关系统的一个或多个多核苷酸,用于诱导型控制异源基因表达,其中所述异源基因表达由所述基因开关系统调节;并且,其中所述异源基因包含E1-E16中任一项所述的多核苷酸。
E18.如E17所述的多核苷酸,其中,所述基因开关系统是基于蜕皮激素受体的(基于EcR的)基因开关系统。
E19.如E1-E18中任一项所述的多核苷酸,其中,所述一个或多个HPV多肽用于疫苗。
E20.一种包含E1-E19中任一项所述多核苷酸的载体。
E21.如E20所述的载体,其中,所述载体是腺病毒载体。
E22.如E21所述的载体,其中,所述腺病毒载体是大猩猩腺病毒载体。
E23.一种调节细胞中异源基因表达的方法,所述方法包括:将包含(i)抑制型或诱导型基因开关和(ii)异源性免疫应答诱导基因的一个或多个多核苷酸引入所述细胞,其中所述异源性免疫应答诱导基因的表达由所述基因开关调节,其中所述异源性免疫应答诱导基因编码一个或多个HPV多肽;和将所述细胞暴露于足以抑制或诱导所述异源性免疫应答诱导基因表达的量的化合物。
E24.如E23所述的方法,其中,所述靶细胞是哺乳动物细胞。
E25.如E23或E24所述的方法,其中,所述基因开关包含衍生自以下之中至少一种的配体结合结构域:蜕皮激素受体(EcR)、遍在受体、孤儿受体1、NER-1,类固醇激素核受体1、视黄酸X受体相互作用蛋白15、肝脏X受体β、类固醇激素受体样蛋白、肝脏X受体、肝脏X受体α、法尼醇X受体、受体相互作用蛋白14和金合欢醇受体。
E26.一种E6肽,其中,相较于野生型E6肽,所述E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个。
E27.如E26所述的E6肽,其中,所述E6肽包含所述E18A氨基酸取代且包含所述L50G、E148A、T149A、Q150A和L151A氨基酸取代。
E28.如E26所述的E6肽,其中,所述E6肽具有SEQ ID NO:45中所示的序列。
E29.如E26-E28中任一项所述的肽,其中,所述E6肽与激动剂肽融合。
E30.如E29所述的E6肽,其中,所述激动剂肽与所述E6肽的C端和N端中的至少一个融合。
E31.如E26-E30中任一项所述的E6肽,其中,所述野生型E6肽来自HPV-16。
E32.一种E6肽,其中相较于野生型E6肽,所述E6肽包含缺失,其中所述缺失包括所述野生型E6肽的C末端。
E33.如E32所述的E6肽,其中,所述缺失包括所述野生型E6肽的氨基酸121至所述野生型E6肽的C末端的氨基酸。
E34.如E32或E33所述的E6肽,其中,相较于所述野生型E6肽,所述E6肽包含E18A和L50G取代中的至少一个。
E35.如E32-E34中任一项所述的E6肽,其中,所述野生型E6肽来自HPV-18。
E36.如E32-E35中任一项所述的E6肽,其中,所述E6肽具有SEQ ID NO:48中所示的序列。
E37.一种E7肽,其中相较于野生型E7肽,所述E7肽包含缺失,其中所述缺失包括所述野生型E7肽的N末端。
E38.如E37所述的E7肽,其中,所述缺失包括所述野生型E7肽的氨基酸1-39。
E39.如E37或E38所述的E7肽,其中,相较于所述野生型E7肽,所述E7肽包含E55A和L74R取代中的至少一个。
E40.如E37-E39中任一项所述的E7肽,其中,所述野生型E7肽来自HPV-18。
E41.如E37-E40中任一项所述的E7肽,其中,所述E7肽具有SEQ ID NO:49中所示的序列。
E42.一种E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸41-57。
E43.如E42所述的E5肽,其中,所述E5肽具有SEQ ID NO:47中所示的序列。
E44.如E42或E43所述的E5肽,其中,所述野生型E5肽来自HPV-16。
E45.一种E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸27-40或氨基酸54-57中的至少一个。
E46.如E45所述的E5肽,其中,所述E5肽具有SEQ ID NO:50中所示的序列。
E47.如E45或E46所述的E5肽,其中,所述野生型E5肽来自HPV-18。
E48.一种包含E26-E47中任一项所述的肽的多肽构建体。
E49.一种多肽构建体,其中所述多肽构建体包含HPV-16E6肽,其中相较于野生型HPV-16E6肽,所述HPV-16E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个。
E50.如E49所述的多肽构建体,其中,所述HPV-16E6肽包含所述E18A氨基酸取代且包含所述L50G、E148A、T149A、Q150A和L151A氨基酸取代。
E51.如E49或E50所述的多肽构建体,其中,所述HPV-16E6肽具有SEQ ID NO:45中所示的序列。
E52.如E49-E51中任一项所述的多肽构建体,其中,所述多肽构建体还包含HPV-16E7肽,其中相较于野生型HPV-16E7肽,所述HPV-16E7肽包含H2P、C24G、E46A和L67R氨基酸取代中的至少一个。
E53.如E52所述的多肽构建体,其中,所述HPV-16E7肽包含所述H2P、C24G、E46A和L67R氨基酸取代。
E54.如E53所述的多肽构建体,其中,所述HPV-16E7肽具有SEQ ID NO:46中所示的序列。
E55.如E49-E54中任一项所述的多肽构建体,其中,所述多肽构建体还包含HPV-16E5肽。
E56.如E55所述的多肽,其中,相较于野生型HPV-16E5肽,所述HPV-16E5肽包含一个或多个氨基酸的缺失。
E57.如E56所述的多肽构建体,其中,所述缺失包括所述野生型HPV-16E5肽的氨基酸41-57。
E58.如E55-E57中任一项所述的多肽构建体,其中,所述HPV-16E5肽具有SEQ IDNO:47中所示的序列。
E59.如E49-E58中任一项所述的多肽构建体,其中,所述多肽还包含HPV-18E6肽。
E60.如E59所述的多肽构建体,其中,相较于野生型HPV-18E6肽,所述HPV-18E6肽包含E18A和L50G取代。
E61.如E59或E60所述的多肽构建体,其中,相对于所述野生型HPV-18E6肽,所述HPV-18E6肽包含至少一个C末端氨基酸的缺失。
E62.如E61所述的多肽构建体,其中,所述缺失包括所述野生型HPV-18E6肽的氨基酸121至所述野生型HPV-18E6肽的C末端的氨基酸。
E63.如E59-E62中任一项所述的多肽构建体,其中,所述HPV-18E6肽具有SEQ IDNO:48中所示的序列。
E64.如E49-E63中任一项所述的多肽构建体,其中,所述多肽构建体还包含HPV-18E7肽。
E65.如E64所述的多肽构建体,其中,相较于野生型HPV-18E7肽,所述HPV-18E7肽包含E55A和L74R取代。
E66.如E64或E65所述的多肽构建体,其中,所述HPV-18E7肽包含所述HPV-18E7肽N末端的至少一个氨基酸的缺失。
E67.如E66所述的多肽构建体,其中,所述缺失包括所述野生型HPV-18E7肽的氨基酸1-40。
E68.如E64-E67中任一项所述的多肽构建体,其中,所述HPV-18E7肽具有SEQ IDNO:49中所示的序列。
E69.如E59-E68中任一项所述的多肽构建体,其中,所述多肽构建体还包含HPV-18E5肽。
E70.如E69所述的多肽,其中,相较于野生型HPV-18E5肽,所述HPV-18E5肽包含至少一个氨基酸的缺失。
E71.如E70所述的多肽构建体,其中,所述缺失包括所述野生型HPV-18E5肽的氨基酸27-40或54-57。
E72.如E69-E71中任一项所述的多肽构建体,其中,所述HPV-18E5肽具有SEQ IDNO:50中所示的序列。
E73.如E59-E72中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:51中所示的序列。
E74.如E59-73中任一项所述的多肽构建体,其中,所述多肽构建体还包含至少一个激动剂肽。
E75.如E74所述的多肽构建体,其中,所述至少一个激动剂肽具有序列,所述序列包含表2中所示的激动剂肽序列。
E76.如E74或E75所述的多肽构建体,其中,所述多肽具有SEQ ID NO:53中所示的序列。
E77.包含锚蛋白样重复序列结构域和HPV肽的多肽构建体。
E78.如E77所述的多肽构建体,其中,所述锚蛋白样重复序列蛋白是人锚蛋白样重复序列蛋白。
E79.如E77或E78所述的多肽构建体,其中,所述HPV肽通过接头与所述锚蛋白样重复序列蛋白连接。
E80.如E77-E79中任一项所述的多肽构建体,其中,所述HPV肽包含HPV-16肽或HPV-18肽中的至少一个。
E81.如E77-E80中任一项所述的多肽构建体,其中,所述HPV肽包含HPV-16肽,并且所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个。
E82.如E77-E81中任一项所述的多肽构建体,其中,所述HPV肽包含HPV-18肽,并且所述HPV-18肽包含E6肽或E7肽中的至少一个。
E83.如E77-E82中任一项所述的多肽构建体,其中,所述HPV肽包含表2中所示的HPV-16E5序列、HPV-16E6序列、HPV-16E7序列、HPV-18E6序列或HPV-18E7序列。
E84.如E77-E83中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:52中所示的序列。
E85.如E77-E84中任一项所述的多肽构建体,其中,所述多肽构建体还包含至少一个激动剂肽。
E86.如E85所述的多肽构建体,其中,所述多肽构建体包含3个激动剂肽。
E87.如E86所述的多肽构建体,其中,所述多肽构建体具有SEQ ID NO:54中所示的序列。
E88.一种多肽构建体,其中,所述多肽构建体包含表2中所示的至少两个HPV氨基酸序列,其中所述至少两个HPV氨基酸序列通过肽接头接合,其中所述肽接头是KK接头。
E89.如E88所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包含表2中所示HPV-16肽或HPV-18肽中的至少一个。
E90.如E88或E89所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包括HPV-16肽,并且其中所述HPV-16肽包含表2中所示HPV-16E5肽、HPV-16E6肽或HPV-16E7肽中的至少一个。
E91.如E88-E90中任一项所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包括HPV-18肽,并且所述HPV-18肽包含表2中所示HPV-18E6肽或HPV-18E7肽中的至少一个。
E92.如E88-E91中任一项所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包含表2中所示的各个氨基酸序列。
E93.如E92所述的多肽构建体,其中,所述各个氨基酸序列通过所述KK接头与所述各个氨基酸序列中的另一个接合。
E94.如E88-E93中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:55中所示的序列。
E95.如E48-E94中任一项所述的多肽构建体,用于疫苗。
E96.一种编码E58-E95中任一项所述多肽构建体的多核苷酸。
E97.一种包含E96所述的多核苷酸的载体。
E98.如E97所述的载体,其中,所述载体是腺病毒载体。
E99.如E98所述的载体,其中,所述腺病毒载体是大猩猩腺病毒载体。
E100.一种载体,其中所述载体包含编码至少一个HPV肽的多核苷酸,其中所述载体是腺病毒载体。
E101.一种载体,其中所述载体包含编码至少一个HPV肽的多核苷酸,其中所述载体是腺病毒载体,其中所述腺病毒载体是大猩猩腺病毒载体。
本文提供了本文所提供的实施方式中包括的某些序列的代表性参考列表(表5)。
表5.多核苷酸/氨基酸序列
Figure BDA0002762906700000851
Figure BDA0002762906700000861
Figure BDA0002762906700000871
Figure BDA0002762906700000881
序列表
<110> 英创松集团公司(INTREXON CORPORATION)
普莱西根股份有限公司(PRECIGEN, INC.)
D·布拉夫(BROUGH, DOUGLAS)
C·柏林格(BOLINGER, CHERYL)
R·雅拉加达(YARLAGADDA, RAMYA)
V·库雷拉(KURELLA, VINODHBABU)
P·普拉巴卡兰(PRABAKARAN, PONRAJ)
S·美特诺(METENOU, SIMON)
K-F·丁(DING, KUAN-FU)
<120> 人乳头瘤病毒疫苗及其用途
<130> 2584.156PC01
<150> US 62/639,354
<151> 2018-03-06
<160> 147
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒pIX片段核苷酸
<400> 1
agctctttgg tggcgagcgg cgcggcctct 30
<210> 2
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒DNA聚合酶片段核苷酸
<400> 2
aacatcaata cctcaaagtc atggtcaggg acactttcgc cctcacccac acctccctcc 60
gcaaggcggc gcaggcctac gcgctgcccg tggagaaggg ctgttgcccc taccaggccg 120
tcaaccagtt ctacatgcta ggctcttacc gttcggacac ggacgggttt cccctccaag 180
agtactggaa agaccgcgaa gagttcgtcc tcaaccgcga gctgtggaaa aagaaggggg 240
aggataagta tgacatcatc cgcgagaccc tcgactactg cgcgctcgac gtccaggtca 300
ccgccgagct ggtgcacaag ctgcgcgagt cctacgcctc cttcgtcagg gactcggtgg 360
gcttgcaaga agcaagcttc aacgtcttcc agcggcccac catctcctcc aactcccatg 420
ccatcttcag gcagatcgc 439
<210> 3
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒五邻体基蛋白片段核苷酸
<400> 3
actgaggctg cggctaaggc tgaggtcgaa gcca 34
<210> 4
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒六邻体蛋白片段核苷酸
<400> 4
ataggtgtgg atgccacaca ggcgggagat aaccctatat atgct 45
<210> 5
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒纤维蛋白片段核苷酸
<400> 5
gtagcaggcc ccctagctgt ggccaatggc 30
<210> 6
<211> 399
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒pIX核苷酸
<400> 6
atgagcgaca ccggcaacag ctttgatgga agcatcttta gcccctatct gacagtgcgc 60
atgcctcact gggctggagt gcgtcagaat gtgatgggtt ccaacgtgga tggacgcccc 120
gttctgcctt caaattcgtc tacaatggcc tacgcgaccg tgggaggaac tccgctggac 180
gccgcgacct ccgccgccgc ctccgccgcc gccgcgaccg cgcgcagcat ggctacggac 240
ctttacagct ctttggtggc gagcggcgcg gcctctcgcg cgtctgctcg ggatgagaaa 300
ctgaccgctc tgctgcttaa actggaagac ttgacccggg agctgggtca actgacccag 360
caggtctcca gcttgcgtga gagcagcctt gcctccccc 399
<210> 7
<211> 3168
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒DNA聚合酶核苷酸
<400> 7
atggacagct ccaatgtgcg cgatgtcgtc atcaaactcc gcccgccgag cgccgagatc 60
tggacctgcg gctctcgcgg cgtggtggtc tgctccacca tcgccctcca ggagacagat 120
gctggcggcc agacaaccaa agtagaagac caccagccac acgggacccc aggcggggga 180
cttagattcc cgctgcgctt cctcgtcaga ggtcgccagg ttcacctcgt gcaagatata 240
caacccgtgc agcgctgcca gtactgcggt cgcttttaca aaagccagca cgagtgctcg 300
gcccgcagac gggacttcta ctttcaccac atcaacagcc aatcctccaa ctggtggcgg 360
gagatccagt tcttcccgat cggctctcat cctcgcacgg agcgcctctt tgtcacctac 420
gatgtagaga cctacacttg gatgggagcc tttggcaagc agctcgtgcc cttcatgctg 480
gtcatgaaac tggggggcga cgaggctctg gtcgccgccg cgcgcgacct cgcccgagag 540
ctcagatggg acccctggga gaaagacccc ctcaccttct actgcatcac ccccgaaaag 600
atggccgtgg ggcgacagtt cagaaccttc cgcgaccgcc tgcagaccct catggcccgc 660
gacctctggc gatccttcct ggcggccaac cctcacttgc aagactgggc cctggaggag 720
cacggcctgg aatcgcccga ggagctcacc tacgaggaac tcaaaaagct cccctccatc 780
aagggccagc cccgcttttt ggagctctac atcgtgggcc acaacataaa cggctttgac 840
gagatcgtcc tggccgccca ggtcatcaac aaccgctcct cggtcccagg gccctttcgc 900
atcaccagaa acttcatgcc tcgagcgggg aagatcctct tcaatgacct caccttctcc 960
ctgcccaacc cgcgctccaa aaagcgcacg gactacaccc tgtgggaaca gggcggctgc 1020
gatgacacag acttcaaaca tcaatacctc aaagtcatgg tcagggacac tttcgccctc 1080
acccacacct ccctccgcaa ggcggcgcag gcctacgcgc tgcccgtgga gaagggctgt 1140
tgcccctacc aggccgtcaa ccagttctac atgctaggct cttaccgttc ggacacggac 1200
gggtttcccc tccaagagta ctggaaagac cgcgaagagt tcgtcctcaa ccgcgagctg 1260
tggaaaaaga agggggagga taagtatgac atcatccgcg agaccctcga ctactgcgcg 1320
ctcgacgtcc aggtcaccgc cgagctggtg cacaagctgc gcgagtccta cgcctccttc 1380
gtcagggact cggtgggctt gcaagaagca agcttcaacg tcttccagcg gcccaccatc 1440
tcctccaact cccatgccat cttcaggcag atcgccttcc gcgccgagcg cccccagcgc 1500
accaacctcg ggcccaacat gctggccccc tcccacgagc tctatgacta cgtgcgcgcc 1560
agcatccgcg gggggcgctg ctaccccacc tacctcggca tcctcaggga acccctgtac 1620
gtgtatgaca tctgcggcat gtacgcctcc gcgctcaccc accccatgcc ctggggcccg 1680
cccctcaacc cctacgagcg cgcgctcgcc gcccgcgaat ggcagcgggc tctggacatg 1740
caagcttgca agatcgacta ctttgacccg cgcttgctcc ccggggtctt caccatcgac 1800
gcggaccccc caaacgagga ccagctggac cccctacccc ccttctgctc gcgcaagggc 1860
ggccgcctct gctggaccaa cgagcgcctg cgcggcgagg tcgccaccag cgtcgacatg 1920
gtcaccctgc acaaccgagg ctggagggtg cgcctaatcc cagacgagcg caccaccgtc 1980
ttccccgagt ggaagtgcgt ggcccgcgag tacgtgcaac tcaacatcgc ggccaaggag 2040
cgagccgacc gcgacaaaaa ccagaccctg cgctccatcg ccaagctgct ctccaacgcc 2100
ctctacgggt cgttcgccac caagcttgac aacaaaaaaa tagtgttttc tgaccagatg 2160
gacccaggta ccctcaaagg tatcacctcc ggacaggtga acatcaaatc ctcctcattt 2220
ttagaaactg acaacctgag cgctgaggtc atgcccgcct tcgagaggga atacttaccc 2280
cagcagctgg ccctcgcaga cagcgatgcg gaagagagtg aagatgaaag ggcgcccacc 2340
cccttttata cccccccgtc gggaaccccc ggtcacgtgt cctacaccta caagccaatc 2400
acttttctgg acgcggagga gggggacatg tgcctgcaca ccctggagaa ggtggacccg 2460
ctagtggaca acgaccgcta cccctcccac gtggcctcct tcgtcctggc ctggacgcgg 2520
gccttcgtct cagagtggtc agagtttctc tacgaggagg acagaggcac tccgctggaa 2580
gacaggcccc tgaagtcggt ctacggggac acggacagcc tcttcgtcac cgagaaggga 2640
caccgcctca tggagagccg aggtaagaaa cgcatcaaaa agcatggggg caacctggtt 2700
tttgaccctg accgcccgga gctcacttgg ctggtggaat gcgagacggt ctgcgcttcc 2760
tgcggcgcgg acgcctactc cccagagtcc gtgtttctcg ctcccaagct ctacgccctg 2820
aagagcctgc agtgcccctc gtgcggcgcc acctccaagg gaaagctccg cgccaagggg 2880
cacgccgccg agggtctcga ctacgagacc atggtcaaat gctacctggc cgacgcgcag 2940
ggcgaagagc ggcagcgatt cagcaccagc agaaccagcc tcaagcgcac cctggccagc 3000
gcccaacccg gagcgcaccc cttcaccgtg acccagacca ccctgacgag gaccctgcgc 3060
ccatggaagg acatgactct ggccccgctg gacgcccatc ggctggtgcc ctacagcgaa 3120
agccgcccca acccgcgaaa cgaggagatc tgctggatcg agatgccg 3168
<210> 8
<211> 1974
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒五邻体基蛋白核苷酸
<400> 8
atgcggcgcg cggcgatgtt cgaggagggg cctcccccct cttacgagag cgcgatgggg 60
atttctcctg cggcgcccct gcagcctccc tacgtgcctc ctcggtacct gcaacctaca 120
ggggggagaa atagcatctg ttactctgag ctgcagcccc tgtacgatac caccagactg 180
tacctggtgg acaacaagtc cgcggacgtg gcctccctga actaccagaa cgaccacagc 240
gattttttga ccacggtgat ccaaaacaac gacttcaccc caaccgaggc cagcacccag 300
accataaacc tggataacag gtcgaactgg ggcggcgacc tgaagaccat cttgcacacc 360
aacatgccca acgtgaacga gttcatgttc accaactctt ttaaggcgcg ggtgatggtg 420
gcgcgcgagc agggggaggc gaagtacgag tgggtggact tcacgctgcc cgagggcaac 480
tactcagaga ccatgactct cgacctgatg aacaatgcga tcgtggaaca ctatctgaaa 540
gtgggcaggc agaacggggt gaaggaaagc gatatcgggg tcaagtttga caccagaaac 600
ttccgtctgg gctgggaccc cgtgaccggg ctggtcatgc cgggggtcta caccaacgag 660
gcctttcatc ccgacatagt gcttctgccc ggctgtgggg tggacttcac ccagagccgg 720
ctgagcaacc tgctgggcat tcgcaagcgg cagcctttcc aggagggttt caagatcacc 780
tatgaggatc tgaagggggg caacattccc gcgctccttg atctggacgc ctacgaggag 840
agcttgaaac ccgaggagag cgctggcgac agcggcgaga gtggcgagga gcaagccggc 900
ggcggtggcg gcgcgtcggt agaaaacgaa agtacgcccg cagtggcggc ggacgctgcg 960
gaggtcgagc cggaggccat gcagcaggac gcagaggagg gcgcacagga gggcgcgcag 1020
aaggacatga acgatgggga gatcagggga gacacattcg ccacccgggg cgaagaaaaa 1080
gaggcagagg cggcggcggc ggcgacggcg gaggccgaaa ccgaggttga ggcagaggca 1140
gagcccgaga ccgaagttat ggaagacatg aatgatggag aacgtagggg cgacacgttc 1200
gccacccggg gcgaagagaa ggcggcggag gcagaagccg cggctgagga ggcggctgcg 1260
gctgcggcca agactgaggc tgcggctaag gctgaggtcg aagccaatgt tgcggttgag 1320
gctcaggctg aggaggaggc ggcggctgaa gcagttaagg aaaaggccca ggcagagcag 1380
gaagagaaaa aacctgtcat tcaacctcta aaagaagata gcaaaaagcg cagttacaac 1440
gtcatcgagg gcagcacctt tacccagtac cgcagctggt acctggcgta caactacggc 1500
gacccggtca agggggtgcg ctcgtggacc ctgctctgca cgccggacgt cacctgcggc 1560
tccgagcaga tgtactggtc gctgccgaac atgatgcaag acccggtgac cttccgctcc 1620
acgcggcagg ttagcaactt cccggtggtg ggcgccgaac tgctgcccgt gcactccaag 1680
agtttttaca acgagcaggc cgtctactcc cagctgatcc gccaggccac ctctctgacc 1740
cacgtgttca atcgctttcc cgagaaccag attttggcgc gcccgccggc ccccaccatc 1800
accaccgtga gtgaaaacgt tcctgccctc acagatcacg ggacgctacc gctgcgcaac 1860
agcatctcag gagtccagcg agtgaccatt actgacgcca gacgccggac ctgcccctac 1920
gtttacaagg ccttgggcat agtctcgccg cgcgtcctct ccagtcgcac tttt 1974
<210> 9
<211> 2877
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒六邻体蛋白核苷酸
<400> 9
atggcgaccc catcgatgat gcctcagtgg tcgtacatgc acatctcggg ccaggacgct 60
tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccacagacac ctacttcaac 120
atgagtaaca agttcaggaa ccccactgtg gcgcccaccc acgatgtgac cacggaccgg 180
tcgcagcgcc tgacgctgcg gttcatcccc gtggatcggg aggacaccgc ctactcttac 240
aaggcgcggt tcacgctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacttac 300
tttgacatca ggggggtgct ggacaggggc cccaccttca agccctactc gggtactgcc 360
tacaactccc tggcccccaa gggcgctccc aattcttgcg agtgggaaca agatgaacca 420
gctcaggcag caatagctga agatgaagaa gaacttgaag aagaacaagc tcaggacgaa 480
caggcgccca ctaagaaaac ccatgtatac gcccaggcac ctctttctgg tgaaaaaatt 540
actaaggatg gtttgcaaat aggtgtggat gccacacagg cgggagataa ccctatatat 600
gctgataaaa cattccaacc cgaacctcag ataggtgagt ctcagtggaa cgaggctgat 660
gccacagtag caggaggcag agtcttaaaa aagaccaccc ctatgagacc ttgctatgga 720
tcctatgcca aacctactaa tgccaatggc ggtcaaggga tcatggtggc caatgatcag 780
ggagcgcttg aatctaaagt tgagatgcaa tttttctcca ccacaacgtc tcttaatgta 840
agggaaggtg aaaacaatct tcagccaaaa gtagtgctat acagcgaaga tgttaacttg 900
gaatcccctg acactcattt gtcttacaaa cctaaaaagg atgacaccaa ctctaaaatc 960
atgttgggtc agcaagccat gcccaacaga cccaacctca ttgcttttag ggacaacttt 1020
attggactta tgtactacaa cagcacaggc aacatgggag tgctggcagg acaggcctcc 1080
cagctaaacg ctgtggtaga cttgcaagac agaaacacag agctgtcata ccaactgatg 1140
cttgattcca ttggagacag atcaagatac ttttccatgt ggaaccaggc agtggacagc 1200
tatgacccag atgtcagaat cattgaaaac catggggttg aagatgagct gcccaactat 1260
tgctttcccc tgggcggtat tggaattaca gacacatacc agtgcataaa accaaccgca 1320
gctgctaata acactacatg gtctaaggat gaagaattta gtgatcgcaa tgaaataggg 1380
gtgggaaaca acttcgccat ggagatcaac atccaggcca acctctggag gaacttcctc 1440
tatgcgaacg tggggctcta cctgccagac aagctcaagt acaaccccac caacgtggac 1500
atctctgaca accccaacac ctatgactac atgaacaagc gtgtggtggc tcccggcctg 1560
gtggactgct ttgtcaatgt gggagccagg tggtccctgg actacatgga caacgtcaac 1620
cccttcaacc accaccgcaa tgcgggtctg cgctaccgct ccatgatcct gggcaacggg 1680
cgctacgtgc ccttccacat tcaggtgccc cagaagttct ttgccatcaa gaacctcctc 1740
ctcctgccgg gctcctacac ttacgagtgg aacttcagga aggatgtcaa catggtcctg 1800
cagagctctc tgggcaatga ccttagggtg gacggggcca gcatcaagtt tgacagcgtc 1860
accctctatg ctaccttctt ccccatggct cacaacaccg cctccacgct cgaggccatg 1920
ctgaggaacg acaccaacga ccagtccttc aatgactacc tctctggggc caacatgctc 1980
taccccatcc ccgccaaggc caccaacgtg cccatctcca ttccctctcg caactgggcc 2040
gccttcagag gctgggcctt tacccgcctt aagaccaagg aaaccccctc cctgggctcg 2100
ggttttgacc cctactttgt ctactcggga tccatcccct acctggatgg caccttctac 2160
ctcaaccaca cttttaagaa gatatccatc atgtatgact cctccgtcag ctggccgggc 2220
aatgaccgcc tgctcacccc caatgagttc gaggtcaagc gcgccgtgga cggcgagggc 2280
tacaacgtgg cccagtgcaa catgaccaag gactggttcc tggtgcagat gctggccaac 2340
tacaacatag gctaccaggg cttctacatc ccagagagct acaaggacag gatgtactcc 2400
ttcttcagaa atttccaacc catgagcagg caggtggtgg acgagaccaa atacaaggac 2460
tatcaggcca ttggcatcac tcaccagcac aacaactcgg gattcgtggg ctacctggct 2520
cccaccatgc gcgaggggca ggcctacccc gccaacttcc cctacccgtt gataggcaaa 2580
accgcggtcg acagcgtcac ccagaaaaag ttcctctgcg accgcaccct ctggcgcatc 2640
cccttctcta gcaacttcat gtccatgggt gcgctcacgg acctgggcca gaacctgctc 2700
tatgccaact ccgcccatgc gctggacatg acttttgagg tggaccccat ggacgagccc 2760
acccttctct atattgtgtt tgaagtgttc gacgtggtca gagtgcacca gccgcaccgc 2820
ggtgtcatcg agaccgtgta cctgcgcacg cccttctcgg ccggcaacgc caccacc 2877
<210> 10
<211> 1749
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒纤维蛋白核苷酸
<400> 10
atgaaacgcg cgagatcgtc tgacgagacc ttcaaccccg tgtaccccta cgataccgag 60
atcgctccga cttctgtccc tttccttacc cctccctttg tgtcatccgc aggaatgcaa 120
gaaaatccag ctggggtgct gtccctgcac ttgtcagagc cccttaccac ccacaatggg 180
gccctgactc taaaaatggg gggcggcctg accctggaca aggaagggaa tctcacttcc 240
caaaacatca ccagtgtcga tccccctctc aaaaaaagca agaacaacat cagccttcag 300
accgccgcac ccctcgccgt cagctccggg gccctaacac tttttgccac tcccccccta 360
gcggtcagtg gtgacaacct tactgtgcag tctcaggccc ctctcacttt ggaagactca 420
aaactaactc tggccaccaa aggaccccta actgtgtccg aaggcaaact tgtcctagaa 480
acagaggctc ccctgcatgc aagtgacagc agcagcctgg gccttagcgt tacggcccca 540
cttagcatta acaatgacag cctaggacta gatctgcagg cacccattgt ctctcaaaat 600
ggaaaactgg ctctaaatgt agcaggcccc ctagctgtgg ccaatggcat taatgctttg 660
acagtaggca caggcaaagg tattggtcta aatgaaacca gcactcactt gcaagcaaag 720
ttggtcgccc ccctaggctt tgataccaat ggcaacatta agctaagcgt tgcaggaggc 780
atgagactaa ataatgacac acttatacta gatgtaaact acccatttga agctcaaggc 840
caactaagtc taagagtggg ccagggtccg ctgtatgtag attctagcag ccataacctg 900
accattagat gccttagagg attatacata acatcgtcta ataaccaaac cggtctagag 960
gccaacataa aactaacaaa aggccttgtc tatgatggaa atgccatagc agtcaatgtt 1020
ggtcaaggat tgcaatacag cactactgcc acatcggaag gtgtgtatcc tatacagtct 1080
aagataggtt tgggaatgga atatgatacc aacggagcca tgatgacaaa actaggctct 1140
ggactaagct ttgacaattc aggagccatt gtagtgggaa acaaaaatga tgacaggctt 1200
actctgtgga ctacaccaga cccatctcct aactgtagaa tttattctga aaaagatact 1260
aaactaacct tggtgctgac taagtgtggc agccaaatcc taggcacagt atctgccctt 1320
gctgtcagag gcagccttgc gcccatcact aatgcatcca gcatagtcca aatatttcta 1380
agatttgatg aaaatggact attgatgagc aactcatcgc tagacggtga ttactggaat 1440
tacagaaatg gggactccac taatagcaca ccatatacaa atgcagtagg ctttatgcct 1500
aatctagcag cctatcctaa aggtcaggct acagctgcaa aaagcagtat tgtaagccag 1560
gtatacatgg atggtgacac tactaaacct ataacactaa aaataaactt caatggcatt 1620
gatgaaacaa cagaaaatac ccctgttagt aaatattcca tgacattctc atggagctgg 1680
cccaccgcaa gctacatagg ccacactttt gcaacaaact cttttacttt ctcctacatc 1740
gcccaagaa 1749
<210> 11
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒pIX蛋白片段
<400> 11
Ser Ser Leu Val Ala Ser Gly Ala Ala Ser
1 5 10
<210> 12
<211> 147
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒DNA聚合酶片段
<400> 12
Lys His Gln Tyr Leu Lys Val Met Val Arg Asp Thr Phe Ala Leu Thr
1 5 10 15
His Thr Ser Leu Arg Lys Ala Ala Gln Ala Tyr Ala Leu Pro Val Glu
20 25 30
Lys Gly Cys Cys Pro Tyr Gln Ala Val Asn Gln Phe Tyr Met Leu Gly
35 40 45
Ser Tyr Arg Ser Asp Thr Asp Gly Phe Pro Leu Gln Glu Tyr Trp Lys
50 55 60
Asp Arg Glu Glu Phe Val Leu Asn Arg Glu Leu Trp Lys Lys Lys Gly
65 70 75 80
Glu Asp Lys Tyr Asp Ile Ile Arg Glu Thr Leu Asp Tyr Cys Ala Leu
85 90 95
Asp Val Gln Val Thr Ala Glu Leu Val His Lys Leu Arg Glu Ser Tyr
100 105 110
Ala Ser Phe Val Arg Asp Ser Val Gly Leu Gln Glu Ala Ser Phe Asn
115 120 125
Val Phe Gln Arg Pro Thr Ile Ser Ser Asn Ser His Ala Ile Phe Arg
130 135 140
Gln Ile Ala
145
<210> 13
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒五邻体基蛋白片段
<400> 13
Lys Thr Glu Ala Ala Ala Lys Ala Glu Val Glu Ala Asn Val Ala
1 5 10 15
<210> 14
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒六邻体蛋白片段
<400> 14
Ile Gly Val Asp Ala Thr Gln Ala Gly Asp Asn Pro Ile Tyr Ala
1 5 10 15
<210> 15
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒纤维蛋白片段
<400> 15
Leu Asn Val Ala Gly Pro Leu Ala Val Ala Asn Gly Ile Asn Ala
1 5 10 15
<210> 16
<211> 133
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒pIX氨基酸
<400> 16
Met Ser Asp Thr Gly Asn Ser Phe Asp Gly Ser Ile Phe Ser Pro Tyr
1 5 10 15
Leu Thr Val Arg Met Pro His Trp Ala Gly Val Arg Gln Asn Val Met
20 25 30
Gly Ser Asn Val Asp Gly Arg Pro Val Leu Pro Ser Asn Ser Ser Thr
35 40 45
Met Ala Tyr Ala Thr Val Gly Gly Thr Pro Leu Asp Ala Ala Thr Ser
50 55 60
Ala Ala Ala Ser Ala Ala Ala Ala Thr Ala Arg Ser Met Ala Thr Asp
65 70 75 80
Leu Tyr Ser Ser Leu Val Ala Ser Gly Ala Ala Ser Arg Ala Ser Ala
85 90 95
Arg Asp Glu Lys Leu Thr Ala Leu Leu Leu Lys Leu Glu Asp Leu Thr
100 105 110
Arg Glu Leu Gly Gln Leu Thr Gln Gln Val Ser Ser Leu Arg Glu Ser
115 120 125
Ser Leu Ala Ser Pro
130
<210> 17
<211> 1056
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒DNA聚合酶氨基酸
<400> 17
Met Asp Ser Ser Asn Val Arg Asp Val Val Ile Lys Leu Arg Pro Pro
1 5 10 15
Ser Ala Glu Ile Trp Thr Cys Gly Ser Arg Gly Val Val Val Cys Ser
20 25 30
Thr Ile Ala Leu Gln Glu Thr Asp Ala Gly Gly Gln Thr Thr Lys Val
35 40 45
Glu Asp His Gln Pro His Gly Thr Pro Gly Gly Gly Leu Arg Phe Pro
50 55 60
Leu Arg Phe Leu Val Arg Gly Arg Gln Val His Leu Val Gln Asp Ile
65 70 75 80
Gln Pro Val Gln Arg Cys Gln Tyr Cys Gly Arg Phe Tyr Lys Ser Gln
85 90 95
His Glu Cys Ser Ala Arg Arg Arg Asp Phe Tyr Phe His His Ile Asn
100 105 110
Ser Gln Ser Ser Asn Trp Trp Arg Glu Ile Gln Phe Phe Pro Ile Gly
115 120 125
Ser His Pro Arg Thr Glu Arg Leu Phe Val Thr Tyr Asp Val Glu Thr
130 135 140
Tyr Thr Trp Met Gly Ala Phe Gly Lys Gln Leu Val Pro Phe Met Leu
145 150 155 160
Val Met Lys Leu Gly Gly Asp Glu Ala Leu Val Ala Ala Ala Arg Asp
165 170 175
Leu Ala Arg Glu Leu Arg Trp Asp Pro Trp Glu Lys Asp Pro Leu Thr
180 185 190
Phe Tyr Cys Ile Thr Pro Glu Lys Met Ala Val Gly Arg Gln Phe Arg
195 200 205
Thr Phe Arg Asp Arg Leu Gln Thr Leu Met Ala Arg Asp Leu Trp Arg
210 215 220
Ser Phe Leu Ala Ala Asn Pro His Leu Gln Asp Trp Ala Leu Glu Glu
225 230 235 240
His Gly Leu Glu Ser Pro Glu Glu Leu Thr Tyr Glu Glu Leu Lys Lys
245 250 255
Leu Pro Ser Ile Lys Gly Gln Pro Arg Phe Leu Glu Leu Tyr Ile Val
260 265 270
Gly His Asn Ile Asn Gly Phe Asp Glu Ile Val Leu Ala Ala Gln Val
275 280 285
Ile Asn Asn Arg Ser Ser Val Pro Gly Pro Phe Arg Ile Thr Arg Asn
290 295 300
Phe Met Pro Arg Ala Gly Lys Ile Leu Phe Asn Asp Leu Thr Phe Ser
305 310 315 320
Leu Pro Asn Pro Arg Ser Lys Lys Arg Thr Asp Tyr Thr Leu Trp Glu
325 330 335
Gln Gly Gly Cys Asp Asp Thr Asp Phe Lys His Gln Tyr Leu Lys Val
340 345 350
Met Val Arg Asp Thr Phe Ala Leu Thr His Thr Ser Leu Arg Lys Ala
355 360 365
Ala Gln Ala Tyr Ala Leu Pro Val Glu Lys Gly Cys Cys Pro Tyr Gln
370 375 380
Ala Val Asn Gln Phe Tyr Met Leu Gly Ser Tyr Arg Ser Asp Thr Asp
385 390 395 400
Gly Phe Pro Leu Gln Glu Tyr Trp Lys Asp Arg Glu Glu Phe Val Leu
405 410 415
Asn Arg Glu Leu Trp Lys Lys Lys Gly Glu Asp Lys Tyr Asp Ile Ile
420 425 430
Arg Glu Thr Leu Asp Tyr Cys Ala Leu Asp Val Gln Val Thr Ala Glu
435 440 445
Leu Val His Lys Leu Arg Glu Ser Tyr Ala Ser Phe Val Arg Asp Ser
450 455 460
Val Gly Leu Gln Glu Ala Ser Phe Asn Val Phe Gln Arg Pro Thr Ile
465 470 475 480
Ser Ser Asn Ser His Ala Ile Phe Arg Gln Ile Ala Phe Arg Ala Glu
485 490 495
Arg Pro Gln Arg Thr Asn Leu Gly Pro Asn Met Leu Ala Pro Ser His
500 505 510
Glu Leu Tyr Asp Tyr Val Arg Ala Ser Ile Arg Gly Gly Arg Cys Tyr
515 520 525
Pro Thr Tyr Leu Gly Ile Leu Arg Glu Pro Leu Tyr Val Tyr Asp Ile
530 535 540
Cys Gly Met Tyr Ala Ser Ala Leu Thr His Pro Met Pro Trp Gly Pro
545 550 555 560
Pro Leu Asn Pro Tyr Glu Arg Ala Leu Ala Ala Arg Glu Trp Gln Arg
565 570 575
Ala Leu Asp Met Gln Ala Cys Lys Ile Asp Tyr Phe Asp Pro Arg Leu
580 585 590
Leu Pro Gly Val Phe Thr Ile Asp Ala Asp Pro Pro Asn Glu Asp Gln
595 600 605
Leu Asp Pro Leu Pro Pro Phe Cys Ser Arg Lys Gly Gly Arg Leu Cys
610 615 620
Trp Thr Asn Glu Arg Leu Arg Gly Glu Val Ala Thr Ser Val Asp Met
625 630 635 640
Val Thr Leu His Asn Arg Gly Trp Arg Val Arg Leu Ile Pro Asp Glu
645 650 655
Arg Thr Thr Val Phe Pro Glu Trp Lys Cys Val Ala Arg Glu Tyr Val
660 665 670
Gln Leu Asn Ile Ala Ala Lys Glu Arg Ala Asp Arg Asp Lys Asn Gln
675 680 685
Thr Leu Arg Ser Ile Ala Lys Leu Leu Ser Asn Ala Leu Tyr Gly Ser
690 695 700
Phe Ala Thr Lys Leu Asp Asn Lys Lys Ile Val Phe Ser Asp Gln Met
705 710 715 720
Asp Pro Gly Thr Leu Lys Gly Ile Thr Ser Gly Gln Val Asn Ile Lys
725 730 735
Ser Ser Ser Phe Leu Glu Thr Asp Asn Leu Ser Ala Glu Val Met Pro
740 745 750
Ala Phe Glu Arg Glu Tyr Leu Pro Gln Gln Leu Ala Leu Ala Asp Ser
755 760 765
Asp Ala Glu Glu Ser Glu Asp Glu Arg Ala Pro Thr Pro Phe Tyr Thr
770 775 780
Pro Pro Ser Gly Thr Pro Gly His Val Ser Tyr Thr Tyr Lys Pro Ile
785 790 795 800
Thr Phe Leu Asp Ala Glu Glu Gly Asp Met Cys Leu His Thr Leu Glu
805 810 815
Lys Val Asp Pro Leu Val Asp Asn Asp Arg Tyr Pro Ser His Val Ala
820 825 830
Ser Phe Val Leu Ala Trp Thr Arg Ala Phe Val Ser Glu Trp Ser Glu
835 840 845
Phe Leu Tyr Glu Glu Asp Arg Gly Thr Pro Leu Glu Asp Arg Pro Leu
850 855 860
Lys Ser Val Tyr Gly Asp Thr Asp Ser Leu Phe Val Thr Glu Lys Gly
865 870 875 880
His Arg Leu Met Glu Ser Arg Gly Lys Lys Arg Ile Lys Lys His Gly
885 890 895
Gly Asn Leu Val Phe Asp Pro Asp Arg Pro Glu Leu Thr Trp Leu Val
900 905 910
Glu Cys Glu Thr Val Cys Ala Ser Cys Gly Ala Asp Ala Tyr Ser Pro
915 920 925
Glu Ser Val Phe Leu Ala Pro Lys Leu Tyr Ala Leu Lys Ser Leu Gln
930 935 940
Cys Pro Ser Cys Gly Ala Thr Ser Lys Gly Lys Leu Arg Ala Lys Gly
945 950 955 960
His Ala Ala Glu Gly Leu Asp Tyr Glu Thr Met Val Lys Cys Tyr Leu
965 970 975
Ala Asp Ala Gln Gly Glu Glu Arg Gln Arg Phe Ser Thr Ser Arg Thr
980 985 990
Ser Leu Lys Arg Thr Leu Ala Ser Ala Gln Pro Gly Ala His Pro Phe
995 1000 1005
Thr Val Thr Gln Thr Thr Leu Thr Arg Thr Leu Arg Pro Trp Lys
1010 1015 1020
Asp Met Thr Leu Ala Pro Leu Asp Ala His Arg Leu Val Pro Tyr
1025 1030 1035
Ser Glu Ser Arg Pro Asn Pro Arg Asn Glu Glu Ile Cys Trp Ile
1040 1045 1050
Glu Met Pro
1055
<210> 18
<211> 658
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒五邻体基蛋白
<400> 18
Met Arg Arg Ala Ala Met Phe Glu Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15
Ser Ala Met Gly Ile Ser Pro Ala Ala Pro Leu Gln Pro Pro Tyr Val
20 25 30
Pro Pro Arg Tyr Leu Gln Pro Thr Gly Gly Arg Asn Ser Ile Cys Tyr
35 40 45
Ser Glu Leu Gln Pro Leu Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp
50 55 60
Asn Lys Ser Ala Asp Val Ala Ser Leu Asn Tyr Gln Asn Asp His Ser
65 70 75 80
Asp Phe Leu Thr Thr Val Ile Gln Asn Asn Asp Phe Thr Pro Thr Glu
85 90 95
Ala Ser Thr Gln Thr Ile Asn Leu Asp Asn Arg Ser Asn Trp Gly Gly
100 105 110
Asp Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Phe
115 120 125
Met Phe Thr Asn Ser Phe Lys Ala Arg Val Met Val Ala Arg Glu Gln
130 135 140
Gly Glu Ala Lys Tyr Glu Trp Val Asp Phe Thr Leu Pro Glu Gly Asn
145 150 155 160
Tyr Ser Glu Thr Met Thr Leu Asp Leu Met Asn Asn Ala Ile Val Glu
165 170 175
His Tyr Leu Lys Val Gly Arg Gln Asn Gly Val Lys Glu Ser Asp Ile
180 185 190
Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val
195 200 205
Thr Gly Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro
210 215 220
Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Gln Ser Arg
225 230 235 240
Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly
245 250 255
Phe Lys Ile Thr Tyr Glu Asp Leu Lys Gly Gly Asn Ile Pro Ala Leu
260 265 270
Leu Asp Leu Asp Ala Tyr Glu Glu Ser Leu Lys Pro Glu Glu Ser Ala
275 280 285
Gly Asp Ser Gly Glu Ser Gly Glu Glu Gln Ala Gly Gly Gly Gly Gly
290 295 300
Ala Ser Val Glu Asn Glu Ser Thr Pro Ala Val Ala Ala Asp Ala Ala
305 310 315 320
Glu Val Glu Pro Glu Ala Met Gln Gln Asp Ala Glu Glu Gly Ala Gln
325 330 335
Glu Gly Ala Gln Lys Asp Met Asn Asp Gly Glu Ile Arg Gly Asp Thr
340 345 350
Phe Ala Thr Arg Gly Glu Glu Lys Glu Ala Glu Ala Ala Ala Ala Ala
355 360 365
Thr Ala Glu Ala Glu Thr Glu Val Glu Ala Glu Ala Glu Pro Glu Thr
370 375 380
Glu Val Met Glu Asp Met Asn Asp Gly Glu Arg Arg Gly Asp Thr Phe
385 390 395 400
Ala Thr Arg Gly Glu Glu Lys Ala Ala Glu Ala Glu Ala Ala Ala Glu
405 410 415
Glu Ala Ala Ala Ala Ala Ala Lys Thr Glu Ala Ala Ala Lys Ala Glu
420 425 430
Val Glu Ala Asn Val Ala Val Glu Ala Gln Ala Glu Glu Glu Ala Ala
435 440 445
Ala Glu Ala Val Lys Glu Lys Ala Gln Ala Glu Gln Glu Glu Lys Lys
450 455 460
Pro Val Ile Gln Pro Leu Lys Glu Asp Ser Lys Lys Arg Ser Tyr Asn
465 470 475 480
Val Ile Glu Gly Ser Thr Phe Thr Gln Tyr Arg Ser Trp Tyr Leu Ala
485 490 495
Tyr Asn Tyr Gly Asp Pro Val Lys Gly Val Arg Ser Trp Thr Leu Leu
500 505 510
Cys Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Met Tyr Trp Ser Leu
515 520 525
Pro Asn Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val
530 535 540
Ser Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys
545 550 555 560
Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ala
565 570 575
Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu
580 585 590
Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro
595 600 605
Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Ser Gly
610 615 620
Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr
625 630 635 640
Val Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg
645 650 655
Thr Phe
<210> 19
<211> 959
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒六邻体蛋白
<400> 19
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Met Ser Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65 70 75 80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Asp Glu Pro Ala Gln Ala Ala
130 135 140
Ile Ala Glu Asp Glu Glu Glu Leu Glu Glu Glu Gln Ala Gln Asp Glu
145 150 155 160
Gln Ala Pro Thr Lys Lys Thr His Val Tyr Ala Gln Ala Pro Leu Ser
165 170 175
Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly Val Asp Ala Thr
180 185 190
Gln Ala Gly Asp Asn Pro Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu
195 200 205
Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp Ala Thr Val Ala
210 215 220
Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Arg Pro Cys Tyr Gly
225 230 235 240
Ser Tyr Ala Lys Pro Thr Asn Ala Asn Gly Gly Gln Gly Ile Met Val
245 250 255
Ala Asn Asp Gln Gly Ala Leu Glu Ser Lys Val Glu Met Gln Phe Phe
260 265 270
Ser Thr Thr Thr Ser Leu Asn Val Arg Glu Gly Glu Asn Asn Leu Gln
275 280 285
Pro Lys Val Val Leu Tyr Ser Glu Asp Val Asn Leu Glu Ser Pro Asp
290 295 300
Thr His Leu Ser Tyr Lys Pro Lys Lys Asp Asp Thr Asn Ser Lys Ile
305 310 315 320
Met Leu Gly Gln Gln Ala Met Pro Asn Arg Pro Asn Leu Ile Ala Phe
325 330 335
Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met
340 345 350
Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu
355 360 365
Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met Leu Asp Ser Ile
370 375 380
Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser
385 390 395 400
Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu
405 410 415
Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Ile Thr Asp Thr
420 425 430
Tyr Gln Cys Ile Lys Pro Thr Ala Ala Ala Asn Asn Thr Thr Trp Ser
435 440 445
Lys Asp Glu Glu Phe Ser Asp Arg Asn Glu Ile Gly Val Gly Asn Asn
450 455 460
Phe Ala Met Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu
465 470 475 480
Tyr Ala Asn Val Gly Leu Tyr Leu Pro Asp Lys Leu Lys Tyr Asn Pro
485 490 495
Thr Asn Val Asp Ile Ser Asp Asn Pro Asn Thr Tyr Asp Tyr Met Asn
500 505 510
Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys Phe Val Asn Val Gly
515 520 525
Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val Asn Pro Phe Asn His
530 535 540
His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Ile Leu Gly Asn Gly
545 550 555 560
Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile
565 570 575
Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe
580 585 590
Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp Leu
595 600 605
Arg Val Asp Gly Ala Ser Ile Lys Phe Asp Ser Val Thr Leu Tyr Ala
610 615 620
Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met
625 630 635 640
Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Gly
645 650 655
Ala Asn Met Leu Tyr Pro Ile Pro Ala Lys Ala Thr Asn Val Pro Ile
660 665 670
Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ala Phe Thr
675 680 685
Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro
690 695 700
Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr
705 710 715 720
Leu Asn His Thr Phe Lys Lys Ile Ser Ile Met Tyr Asp Ser Ser Val
725 730 735
Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Val
740 745 750
Lys Arg Ala Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met
755 760 765
Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile Gly
770 775 780
Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys Asp Arg Met Tyr Ser
785 790 795 800
Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Thr
805 810 815
Lys Tyr Lys Asp Tyr Gln Ala Ile Gly Ile Thr His Gln His Asn Asn
820 825 830
Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Glu Gly Gln Ala
835 840 845
Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly Lys Thr Ala Val Asp
850 855 860
Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Leu Trp Arg Ile
865 870 875 880
Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly
885 890 895
Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr Phe
900 905 910
Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Ile Val Phe Glu
915 920 925
Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu
930 935 940
Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
945 950 955
<210> 20
<211> 583
<212> PRT
<213> 人工序列
<220>
<223> 腺病毒纤维蛋白
<400> 20
Met Lys Arg Ala Arg Ser Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ile Ala Pro Thr Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Ser Ala Gly Met Gln Glu Asn Pro Ala Gly Val Leu Ser
35 40 45
Leu His Leu Ser Glu Pro Leu Thr Thr His Asn Gly Ala Leu Thr Leu
50 55 60
Lys Met Gly Gly Gly Leu Thr Leu Asp Lys Glu Gly Asn Leu Thr Ser
65 70 75 80
Gln Asn Ile Thr Ser Val Asp Pro Pro Leu Lys Lys Ser Lys Asn Asn
85 90 95
Ile Ser Leu Gln Thr Ala Ala Pro Leu Ala Val Ser Ser Gly Ala Leu
100 105 110
Thr Leu Phe Ala Thr Pro Pro Leu Ala Val Ser Gly Asp Asn Leu Thr
115 120 125
Val Gln Ser Gln Ala Pro Leu Thr Leu Glu Asp Ser Lys Leu Thr Leu
130 135 140
Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Val Leu Glu
145 150 155 160
Thr Glu Ala Pro Leu His Ala Ser Asp Ser Ser Ser Leu Gly Leu Ser
165 170 175
Val Thr Ala Pro Leu Ser Ile Asn Asn Asp Ser Leu Gly Leu Asp Leu
180 185 190
Gln Ala Pro Ile Val Ser Gln Asn Gly Lys Leu Ala Leu Asn Val Ala
195 200 205
Gly Pro Leu Ala Val Ala Asn Gly Ile Asn Ala Leu Thr Val Gly Thr
210 215 220
Gly Lys Gly Ile Gly Leu Asn Glu Thr Ser Thr His Leu Gln Ala Lys
225 230 235 240
Leu Val Ala Pro Leu Gly Phe Asp Thr Asn Gly Asn Ile Lys Leu Ser
245 250 255
Val Ala Gly Gly Met Arg Leu Asn Asn Asp Thr Leu Ile Leu Asp Val
260 265 270
Asn Tyr Pro Phe Glu Ala Gln Gly Gln Leu Ser Leu Arg Val Gly Gln
275 280 285
Gly Pro Leu Tyr Val Asp Ser Ser Ser His Asn Leu Thr Ile Arg Cys
290 295 300
Leu Arg Gly Leu Tyr Ile Thr Ser Ser Asn Asn Gln Thr Gly Leu Glu
305 310 315 320
Ala Asn Ile Lys Leu Thr Lys Gly Leu Val Tyr Asp Gly Asn Ala Ile
325 330 335
Ala Val Asn Val Gly Gln Gly Leu Gln Tyr Ser Thr Thr Ala Thr Ser
340 345 350
Glu Gly Val Tyr Pro Ile Gln Ser Lys Ile Gly Leu Gly Met Glu Tyr
355 360 365
Asp Thr Asn Gly Ala Met Met Thr Lys Leu Gly Ser Gly Leu Ser Phe
370 375 380
Asp Asn Ser Gly Ala Ile Val Val Gly Asn Lys Asn Asp Asp Arg Leu
385 390 395 400
Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser
405 410 415
Glu Lys Asp Thr Lys Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln
420 425 430
Ile Leu Gly Thr Val Ser Ala Leu Ala Val Arg Gly Ser Leu Ala Pro
435 440 445
Ile Thr Asn Ala Ser Ser Ile Val Gln Ile Phe Leu Arg Phe Asp Glu
450 455 460
Asn Gly Leu Leu Met Ser Asn Ser Ser Leu Asp Gly Asp Tyr Trp Asn
465 470 475 480
Tyr Arg Asn Gly Asp Ser Thr Asn Ser Thr Pro Tyr Thr Asn Ala Val
485 490 495
Gly Phe Met Pro Asn Leu Ala Ala Tyr Pro Lys Gly Gln Ala Thr Ala
500 505 510
Ala Lys Ser Ser Ile Val Ser Gln Val Tyr Met Asp Gly Asp Thr Thr
515 520 525
Lys Pro Ile Thr Leu Lys Ile Asn Phe Asn Gly Ile Asp Glu Thr Thr
530 535 540
Glu Asn Thr Pro Val Ser Lys Tyr Ser Met Thr Phe Ser Trp Ser Trp
545 550 555 560
Pro Thr Ala Ser Tyr Ile Gly His Thr Phe Ala Thr Asn Ser Phe Thr
565 570 575
Phe Ser Tyr Ile Ala Gln Glu
580
<210> 21
<211> 32728
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒载体核苷酸序列
<400> 21
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagcgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgttttt attgtcaccg tcatttgacg cggagggtat ttaaacccgc 480
tgcgctcctc aagaggccac tcttgagtgc cagcgagaag agttttctcc tctgctccgc 540
ttcggtgatc gaaaaatgag acacatagcc tgcactccgg gtcttttgtc cggtcgggcg 600
gcggccgagc ttttggacgc tttgatcaat gatgtcctaa gcgatgattt tccgtctact 660
acccacttta gcccacctac tcttcacgaa ctgtacgatc tggatgtact ggtggatgtg 720
aacgatccca acgaggaggc ggtttctgcg ttttttcccg agtctgcgct gttggccgct 780
caggagggat ttgacctaca cactccgccg cctattttag agtctccgct gccggagccc 840
agtggtatac cttatatgcc tgaactgctt cccgaagtgg tagacctgac ctgccacgag 900
cctggctttc cgcccagcga cgatgagggt gagccttttg ttttagactt tgctgagata 960
cctgggcacg gttgcaggtc ttgtgcatat catcagaggg ttaccggaga ccccgaggtt 1020
aagtgttcgc tgtgctatat gaggatgacc tcttccttta tctacagtaa gtttttgtct 1080
aggtgggctt ttgggtaggt gggttttgtg tcagaacagg tgtaaacgtt gcttgtgttt 1140
tttgtacctg taggtccggt gtccgagcca gacccggagc ccgaccgcga tcccgagccg 1200
gatcccgagc ctcctcgcag gacaaggaaa ctaccttcca ttctgtgcaa gtctcagaca 1260
cctgtaagga ccagcgaggc agacagcacc gactctggca cttctacctc tccccctgaa 1320
attcacccag tggttcctct gggtatacat aaacctgttg ctgttaaagt ttgcgggcga 1380
cgccctgcag tacagtgcat tgaggacttg cttcacgatc ccgaggaacc tttggacttg 1440
agccttaaac gccctaggca ataaacccca cctaagtaat aaaccccacc taagtaataa 1500
accctgccgc ccttggttat tgagatgacg cccaatgttt gcttttgaat gacttcatgt 1560
gtgtaataaa agtgagtgtg atcataggtc tcttgtttgt ctgggcgggg cttaagggta 1620
tataagtctc ttggggctaa acttggttac acttgacccc aatggaggcg tgggggtgct 1680
tggaggagtt tgcggacgtg cgccgtttgc tggacgagag ctctagcaat acctatacta 1740
tttggaggta tctgtggggc tctactcagg ccaagttggt ttccagaatt aagcaggatt 1800
acaagtgcga ttttgaagag ctttttagtt cctgcggtga gcttttgcaa tccttgaatc 1860
tgggccatca ggctattttc caggaaaagg ttctctcgac tttggatttt tccactcccg 1920
ggcgcaccgc cgcttgtgtg gcttttgtgt cttttgtgca agataaatgg agcgaggaga 1980
cccacctgag tcacggctac gtactggatt tcatggcgat ggctctttgg agggctcaca 2040
acaaatggaa gattcagaag gaactgtacg gttccgccct acgtcgtcca cttctgtcgc 2100
gacaggggct gaggtttccc gaccatcggc agcatcagaa tctggaagac gagtcggagg 2160
agcgagcgga ggagaagatc agcttgagag ccggcctgga ccctcctcag gaggaatgaa 2220
tctcccgcag gtggttgacc tgtttccaga actgagacgg gtcctgacta tcagggagga 2280
tggtcagttt gtgaagaagt ttaagaggga tcggggtgag ggagatgatg aggcggctag 2340
caatttagct tttagtctga tgactcgcca ccgaccggaa tgtattacct atcagcagat 2400
taaggagagt tgtgccaacg agctggatct tttgggtcag aagtatagca tagaacagct 2460
taccacttac tggcttcagc ctggggatga ttgggaagag gcgatcaggg tgtatgcaaa 2520
ggtggccctg cggcccgatt gcaagtataa gattactaag ttggttaata ttagaaactg 2580
ctgctatatt tctgggaacg gggccgaagt ggagatagat actcaggaca gggtggcttt 2640
taggtgttgc atgataaaca tgtggcccgg gatactgggg atggatgggg tggtattcat 2700
gaatgtgagg tttacgggcc ccaactttaa tggcacggtg ttcatgggca acaccaactt 2760
gctcctgcat ggtgcgagtt tctatgggtt taataacacc tgtatagagg cctggaccga 2820
tgtaaaggtt cgaggttgtt ccttttatag ctgttggaag gcggtggtgt gtcgccctaa 2880
aagcaggggt tctgtgaaaa aatgcttgtt tgaaaggtgc accttaggca tcctctctga 2940
gggcaactcc agggtgcgcc ataatgtggc ttcgaactgc ggttgcttca tgcaagtgaa 3000
gggggtgagc gttatcaagc ataactcggt gtgtggaaac tgcgaggatc gcgcctccca 3060
gatgctgacc tgctttgatg gcaactgtca cctgttgaag accattcata taagcagcca 3120
ccccagaaag gcctggcccg tgtttgagca taacatcttg acccgctgct ccttgcatct 3180
gggggtcagg aggggtatgt tcctgcctta ccagtgtaac tttagccaca ctaaaatcct 3240
gctggaaccc gagtgcatga ccaaggtcag cctgaatggt gtgtttgatg tgactctgaa 3300
aatctggaag gtgctgaggt atgatgagac caggaccagg tgccgaccct gcgagtgcgg 3360
cggcaagcac atgagaaatc agcctgtgat gttggatgtg accgaggagc ttaggcctga 3420
ccatctggtg ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg 3480
aggtgggtaa ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg 3540
tctctctgtt ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg 3600
gaagcatctt tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga 3660
atgtgatggg ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg 3720
cctacgcgac cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg 3780
ccgccgcgac cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg 3840
cggcctctcg cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag 3900
acttgacccg ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc 3960
ttgcctcccc ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt 4020
gtatgttctt tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt 4080
tagggtgcgg tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat 4140
gggcatgagt ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt 4200
ggtgttgtat atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt 4260
aagcaagagg cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag 4320
ttgggagggg tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc 4380
tatgttccca cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata 4440
tccagtgcac ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga 4500
gacgcccttg tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc 4560
gtgggaagct gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag 4620
ggtgaggtca tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat 4680
gatggtaccc tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt 4740
catttcagag ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc 4800
aggggagatt aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt 4860
gggcccatat atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc 4920
gtcctcccgg agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct 4980
gaccaattcc gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa 5040
atttttcagc ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag 5100
ttccagcctg tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc 5160
tcgtttcgcg ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg 5220
gccagagtca tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg 5280
aaggggtgcg ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg 5340
ctgaatcgct gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg 5400
tagtcgagac cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg 5460
cacgaggggc actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct 5520
ggggagtagg cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg 5580
agctccgggc ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta 5640
cctcggctct ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg 5700
tagaccgact tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac 5760
tctgaccact ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag 5820
gggtagcggt cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc 5880
ccctcctccg cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt 5940
cccgacgggg gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg 6000
ctgtctgcga gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca 6060
gcgctcaggt tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg 6120
atacctttga gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc 6180
ttggtggcga acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc 6240
tggtttttgt cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg 6300
gccacgcact tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc 6360
cagcctcggt tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc 6420
tcgttggtcc agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc 6480
tggtcctcgt ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca 6540
aagtagtcga tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc 6600
gcgcgctcgt aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg 6660
tacatgccgc agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg 6720
tagcagcgcc ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc 6780
agcatgttgg gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg 6840
aagatggcat gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct 6900
tgcaagccca ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc 6960
tcggcggtga cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac 7020
ttatcctccc ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc 7080
cagtactctt ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac 7140
tggttgacgg cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc 7200
gccttgcgga gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat 7260
tgatgtttga agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc 7320
tttttggagc gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct 7380
cgaggcatga agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg 7440
acctgggcgg ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc 7500
tccaaaaagc ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc 7560
tcctcgggcg attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc 7620
gccaggaagg atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt 7680
ctgaactgtc gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct 7740
ttctcccagg ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc 7800
tcgtcgcccc ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc 7860
atccaagtgt aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag 7920
ccgatcggga agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga 7980
aagtagaagt cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag 8040
tactggcagc gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg 8100
aggaagcgca gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct 8160
actttggttg tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc 8220
acgccgcgag agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca 8280
tcgcgcacat tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt 8340
tcctggaggt tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg 8400
atttcaaggg gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg 8460
gccacgatgg ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc 8520
ggtgacgcgg gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca 8580
ggggcacgtc ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt 8640
gcgcgacgac gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc 8700
ccgtgacctt gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg 8760
cctggcgcag gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga 8820
actgctcgat ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca 8880
ggtcgttgga gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga 8940
cccggctgta gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt 9000
tgagctccac gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca 9060
gggtggtggc ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt 9120
cattgatgtc ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt 9180
tgaaaaactg ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct 9240
cggcgacagt gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca 9300
cctcttcttc catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg 9360
gcgggggagg ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga 9420
tcatctcccc ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc 9480
gcagctcgaa gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga 9540
cggcgctgac tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg 9600
agtccagatc caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc 9660
aaggtaggct gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc 9720
tgctgatgat gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca 9780
tgtctttggg tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct 9840
gacaccggcg caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc 9900
cttcctcttc tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc 9960
ccctgagcgg ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct 10020
gcacctgagt gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg 10080
tgttgatggt gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct 10140
gcgagagctc cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc 10200
aagtccgcac cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg 10260
gccagcgctg ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc 10320
cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt 10380
cgcggacccg gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct 10440
ggccggtgag gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta 10500
cagggctttc gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg 10560
ttcgagacca agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc 10620
gtctcgaccc aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc 10680
caagcgcccg tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc 10740
ttccgtagtc tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc 10800
ctatggcggc ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc 10860
aggaccccgc cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt 10920
tagatgcatc ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa 10980
cagcaggcat gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc 11040
gtgtcgggcg cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag 11100
tatctggact tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc 11160
cacccgcggg tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg 11220
tttcgcgacc gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg 11280
cgcgagctgc ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc 11340
gacacgcaga cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc 11400
gcctacgagc agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg 11460
cgcacgctgg tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg 11520
gaggcgatcg tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg 11580
cagcacagca gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag 11640
gggcgctggc tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc 11700
ctgagcctgg ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc 11760
tacgcccgca agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac 11820
agcttctaca tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac 11880
cgcaacgagc gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc 11940
gagctgatgc acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc 12000
gagtcctact tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag 12060
gcggcggggg cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag 12120
ctagaggagg gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca 12180
agatccgaac gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat 12240
taactcctct gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa 12300
ccccgaggct ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt 12360
agtgcccgcg cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc 12420
ggagagcagg gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg 12480
ggtggcgcgg tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt 12540
gcgcgaggcc gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt 12600
ggcgctaaac gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta 12660
caccaacttt ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta 12720
ccagtcgggg cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct 12780
gagccaggct ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg 12840
ggctacggtg tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 12900
cttcacggac agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta 12960
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt 13020
gagccacgcg ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct 13080
gaccaacagg cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat 13140
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag 13200
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc 13260
gtttatcaac cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt 13320
cactaatgcc attctgaatc cccactggat gccccctccg ggtttctaca acggggactt 13380
tgaggtgccc gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc 13440
acccaacccg ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc 13500
gaggagtctg gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg 13560
gggcagtagc cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc 13620
ccgcttgcta ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa 13680
gaacgctcag cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc 13740
cagatggaag acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt 13800
gccgccccct aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc 13860
cgaggacgat gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa 13920
ccccttttcg cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaataaa 13980
actcaccaag gccatggcga cgagcgttgg ttttttgttc ccttccttag tatgcggcgc 14040
gcggcgatgt tcgaggaggg gcctcccccc tcttacgaga gcgcgatggg gatttctcct 14100
gcggcgcccc tgcagcctcc ctacgtgcct cctcggtacc tgcaacctac aggggggaga 14160
aatagcatct gttactctga gctgcagccc ctgtacgata ccaccagact gtacctggtg 14220
gacaacaagt ccgcggacgt ggcctccctg aactaccaga acgaccacag cgattttttg 14280
accacggtga tccaaaacaa cgacttcacc ccaaccgagg ccagcaccca gaccataaac 14340
ctggataaca ggtcgaactg gggcggcgac ctgaagacca tcttgcacac caacatgccc 14400
aacgtgaacg agttcatgtt caccaactct tttaaggcgc gggtgatggt ggcgcgcgag 14460
cagggggagg cgaagtacga gtgggtggac ttcacgctgc ccgagggcaa ctactcagag 14520
accatgactc tcgacctgat gaacaatgcg atcgtggaac actatctgaa agtgggcagg 14580
cagaacgggg tgaaggaaag cgatatcggg gtcaagtttg acaccagaaa cttccgtctg 14640
ggctgggacc ccgtgaccgg gctggtcatg ccgggggtct acaccaacga ggcctttcat 14700
cccgacatag tgcttctgcc cggctgtggg gtggacttca cccagagccg gctgagcaac 14760
ctgctgggca ttcgcaagcg gcagcctttc caggagggtt tcaagatcac ctatgaggat 14820
ctgaaggggg gcaacattcc cgcgctcctt gatctggacg cctacgagga gagcttgaaa 14880
cccgaggaga gcgctggcga cagcggcgag agtggcgagg agcaagccgg cggcggtggc 14940
ggcgcgtcgg tagaaaacga aagtacgccc gcagtggcgg cggacgctgc ggaggtcgag 15000
ccggaggcca tgcagcagga cgcagaggag ggcgcacagg agggcgcgca gaaggacatg 15060
aacgatgggg agatcagggg agacacattc gccacccggg gcgaagaaaa agaggcagag 15120
gcggcggcgg cggcgacggc ggaggccgaa accgaggttg aggcagaggc agagcccgag 15180
accgaagtta tggaagacat gaatgatgga gaacgtaggg gcgacacgtt cgccacccgg 15240
ggcgaagaga aggcggcgga ggcagaagcc gcggctgagg aggcggctgc ggctgcggcc 15300
aagactgagg ctgcggctaa ggctgaggtc gaagccaatg ttgcggttga ggctcaggct 15360
gaggaggagg cggcggctga agcagttaag gaaaaggccc aggcagagca ggaagagaaa 15420
aaacctgtca ttcaacctct aaaagaagat agcaaaaagc gcagttacaa cgtcatcgag 15480
ggcagcacct ttacccagta ccgcagctgg tacctggcgt acaactacgg cgacccggtc 15540
aagggggtgc gctcgtggac cctgctctgc acgccggacg tcacctgcgg ctccgagcag 15600
atgtactggt cgctgccgaa catgatgcaa gacccggtga ccttccgctc cacgcggcag 15660
gttagcaact tcccggtggt gggcgccgaa ctgctgcccg tgcactccaa gagtttttac 15720
aacgagcagg ccgtctactc ccagctgatc cgccaggcca cctctctgac ccacgtgttc 15780
aatcgctttc ccgagaacca gattttggcg cgcccgccgg cccccaccat caccaccgtg 15840
agtgaaaacg ttcctgccct cacagatcac gggacgctac cgctgcgcaa cagcatctca 15900
ggagtccagc gagtgaccat tactgacgcc agacgccgga cctgccccta cgtttacaag 15960
gccttgggca tagtctcgcc gcgcgtcctc tccagtcgca ctttttaaaa cacatctacc 16020
cacacgttcc aaaatcatgt ccgtactcat ctcacccagc aacaacaccg gctgggggct 16080
gcgcgcgccc agcaagatgt ttggaggggc gaggaagcgc tccgaccagc accctgtgcg 16140
cgtgcgcggc cactaccgcg cgccctgggg agcgcacaag cgcgggcgca cagggcgcac 16200
cactgtggac gacgtcattg actccgtagt ggagcaagcg cgccactaca cacccggcgc 16260
gccgaccgcc cccgccgtgt ccaccgtgga ccaggcgatc gaaagcgtgg tacagggcgc 16320
gcggcactat gccaacctta aaagtcgccg ccgccgcgtg gcccgccgcc atcgccggag 16380
accccgggcc accgccgccg cgcgccttac taaggctctg ctcaggcgcg ccaggcgaac 16440
tggccaccgg gccgccatga gggccgcacg gcgggctgcc gctgccgcaa gcgtcgtggc 16500
cccgcgggca cgaaggcgcg cggccgctgc cgccgccgcc gccatttcca gcttggcctc 16560
gacgcggcgc ggtaacatat actgggtgcg cgactcggta accggcacgc gggtacccgt 16620
gcgctttcgc cccccgcgga attagcacaa gacaacatac acactgagtc tcctgctgtt 16680
gtgtatccca gcggcgaccg tcagcagcgg cgacatgtcc aagcgcaaaa ttaaagaaga 16740
gatgctccag gtcatcgcgc cggagatcta tgggcccccg aagaaggagg aggatgatta 16800
caagccccgc aagctaaagc gggtcaaaaa gaaaaagaaa gatgatgatg acgaggcggt 16860
ggagtttgtc cgccgcatgg cacccaggcg ccccgtgcag tggaagggcc ggcgcgtgca 16920
gcgcgttttg cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacgcgcac 16980
tttcaagcgg gtgtacgatg aggtgtacgg cgacgaggac ctgttggagc aggccaacca 17040
gcgctttggg gagtttgcat atgggaaacg gccccgcgag agtctaaaag aggacctgct 17100
ggcgctaccg ctggacgagg gcaatcccac cccgagtctg aagccggtaa ccctgcaaca 17160
ggtgctgcct ttgagcgcgc ccagcgagca taagcgaggg ttgaagcgcg aaggcgggga 17220
cctggcgccc accgtgcagt tgatggtgcc caagcggcag aagctggagg acgtgctgga 17280
gaaaatgaaa gtagagcccg ggatccagcc cgagatcaag gtccgcccca tcaagcaggt 17340
ggcgcccggc gtgggagtcc agaccgtgga cgttaggatt cccacggagg agatggaaac 17400
ccaaaccgcc actccctctt cggcggccag cgccaccacc ggcaccgctt cggtagaggt 17460
gcagacggac ccctggctac ccgccaccgc tgttgccgcc gccgcccccc gttcgcgcgg 17520
gcgcaagaga aattatccag cggccagcgc gctcatgccc cagtacgcac tgcatccatc 17580
catcgtgccc acccccggct accgcgggta ctcgtaccgc ccgcgcagat cagccggcac 17640
tcgcggccgc cgccgccgtg cgaccacaac cagccgccgc cgtcgccgcc gccgccagcc 17700
agtgctgacc cccgtgtctg taaggaaggt ggctcgctcg gggagcacgc tggtggtgcc 17760
cagagcgcgc taccacccca gcatcgttta aagccggtct ctgtatggtt cttgcagata 17820
tggccctcac ttgtcgcctc cgcttcccgg tgccgggata ccgaggaaga actcaccgcc 17880
gcagaggcat ggcgggcagc ggtctccgcg gcggccgtcg ccatcgccgg cgcgcaaaaa 17940
gcaggcgcat gcgcggcggt gtgctgcctc tgctaatccc gctaatcgcc gcggcgatcg 18000
gtgccgtacc cgggatcgcc tccgtggccc tgcaggcgtc ccagaaacgt tgactcttgc 18060
aaccttgcaa gcttgcattt tttggaggaa aaataaaaaa aagtctagac tctcacgctc 18120
gcttggtcct gtgactattt tgtagaaaaa aagatggaag acatcaactt tgcgtcgctg 18180
gccccgcgtc acggctcgcg cccgttcatg ggagactgga cagatatcgg caccagcaat 18240
atgagcggtg gcgccttcag ctggggcagt ctgtggagcg gccttaaaaa ttttggttcc 18300
accattaaga actatggcaa caaagcgtgg aacagcagca cgggccagat gctgagagac 18360
aagttgaaag agcagaactt ccaggagaag gtggcgcagg gcctggcctc tggcatcagc 18420
ggggtggtgg acatagctaa ccaggccgtg cagaaaaaga taaacagtca tctggacccc 18480
cgtcctcagg tggaggaaat gcctccagcg atggagacgg tgtctcccga gggcaaaggc 18540
gaaaagcgcc cgcggcccga cagagaagag accctggtgt cacacaccga ggagccgccc 18600
tcttacgagg aggcagtcaa ggccggcctg cccaccactc gccccatagc ccccatggcc 18660
accggtgtgg tgggccacag gcaacacact cccgcaacac tagatctgcc cccgccgtcc 18720
gagccgccgc gccagccaaa ggcggcgacg gtgcccgctc cctccacttc cgccgccaac 18780
agagtgcccc tgcgccgcgc cgcgagcggc ccccgggcct cgcgagttag cggcaactgg 18840
cagagcacac tgaacagcat cgtgggcctg ggagtgagga gtgtgaagcg ccgccgttgc 18900
tactgaatga gcaagctagc taacgtgttg tatgtgtgta tgcgtcctat gtcgccgcca 18960
gaggagctgt tgagccgccg gcgccgtctg cactccagcg aatttcaaga tggcgacccc 19020
atcgatgatg cctcagtggt cgtacatgca catctcgggc caggacgctt cggagtacct 19080
gagccccggg ctggtgcagt tcgcccgcgc cacagacacc tacttcaaca tgagtaacaa 19140
gttcaggaac cccactgtgg cgcccaccca cgatgtgacc acggaccggt cgcagcgcct 19200
gacgctgcgg ttcatccccg tggatcggga ggacaccgcc tactcttaca aggcgcggtt 19260
cacgctggcc gtgggcgaca accgcgtgct ggacatggcc tccacttact ttgacatcag 19320
gggggtgctg gacaggggcc ccaccttcaa gccctactcg ggtactgcct acaactccct 19380
ggcccccaag ggcgctccca attcttgcga gtgggaacaa gatgaaccag ctcaggcagc 19440
aatagctgaa gatgaagaag aacttgaaga agaacaagct caggacgaac aggcgcccac 19500
taagaaaacc catgtatacg cccaggcacc tctttctggt gaaaaaatta ctaaggatgg 19560
tttgcaaata ggtgtggatg ccacacaggc gggagataac cctatatatg ctgataaaac 19620
attccaaccc gaacctcaga taggtgagtc tcagtggaac gaggctgatg ccacagtagc 19680
aggaggcaga gtcttaaaaa agaccacccc tatgagacct tgctatggat cctatgccaa 19740
acctactaat gccaatggcg gtcaagggat catggtggcc aatgatcagg gagcgcttga 19800
atctaaagtt gagatgcaat ttttctccac cacaacgtct cttaatgtaa gggaaggtga 19860
aaacaatctt cagccaaaag tagtgctata cagcgaagat gttaacttgg aatcccctga 19920
cactcatttg tcttacaaac ctaaaaagga tgacaccaac tctaaaatca tgttgggtca 19980
gcaagccatg cccaacagac ccaacctcat tgcttttagg gacaacttta ttggacttat 20040
gtactacaac agcacaggca acatgggagt gctggcagga caggcctccc agctaaacgc 20100
tgtggtagac ttgcaagaca gaaacacaga gctgtcatac caactgatgc ttgattccat 20160
tggagacaga tcaagatact tttccatgtg gaaccaggca gtggacagct atgacccaga 20220
tgtcagaatc attgaaaacc atggggttga agatgagctg cccaactatt gctttcccct 20280
gggcggtatt ggaattacag acacatacca gtgcataaaa ccaaccgcag ctgctaataa 20340
cactacatgg tctaaggatg aagaatttag tgatcgcaat gaaatagggg tgggaaacaa 20400
cttcgccatg gagatcaaca tccaggccaa cctctggagg aacttcctct atgcgaacgt 20460
ggggctctac ctgccagaca agctcaagta caaccccacc aacgtggaca tctctgacaa 20520
ccccaacacc tatgactaca tgaacaagcg tgtggtggct cccggcctgg tggactgctt 20580
tgtcaatgtg ggagccaggt ggtccctgga ctacatggac aacgtcaacc ccttcaacca 20640
ccaccgcaat gcgggtctgc gctaccgctc catgatcctg ggcaacgggc gctacgtgcc 20700
cttccacatt caggtgcccc agaagttctt tgccatcaag aacctcctcc tcctgccggg 20760
ctcctacact tacgagtgga acttcaggaa ggatgtcaac atggtcctgc agagctctct 20820
gggcaatgac cttagggtgg acggggccag catcaagttt gacagcgtca ccctctatgc 20880
taccttcttc cccatggctc acaacaccgc ctccacgctc gaggccatgc tgaggaacga 20940
caccaacgac cagtccttca atgactacct ctctggggcc aacatgctct accccatccc 21000
cgccaaggcc accaacgtgc ccatctccat tccctctcgc aactgggccg ccttcagagg 21060
ctgggccttt acccgcctta agaccaagga aaccccctcc ctgggctcgg gttttgaccc 21120
ctactttgtc tactcgggat ccatccccta cctggatggc accttctacc tcaaccacac 21180
ttttaagaag atatccatca tgtatgactc ctccgtcagc tggccgggca atgaccgcct 21240
gctcaccccc aatgagttcg aggtcaagcg cgccgtggac ggcgagggct acaacgtggc 21300
ccagtgcaac atgaccaagg actggttcct ggtgcagatg ctggccaact acaacatagg 21360
ctaccagggc ttctacatcc cagagagcta caaggacagg atgtactcct tcttcagaaa 21420
tttccaaccc atgagcaggc aggtggtgga cgagaccaaa tacaaggact atcaggccat 21480
tggcatcact caccagcaca acaactcggg attcgtgggc tacctggctc ccaccatgcg 21540
cgaggggcag gcctaccccg ccaacttccc ctacccgttg ataggcaaaa ccgcggtcga 21600
cagcgtcacc cagaaaaagt tcctctgcga ccgcaccctc tggcgcatcc ccttctctag 21660
caacttcatg tccatgggtg cgctcacgga cctgggccag aacctgctct atgccaactc 21720
cgcccatgcg ctggacatga cttttgaggt ggaccccatg gacgagccca cccttctcta 21780
tattgtgttt gaagtgttcg acgtggtcag agtgcaccag ccgcaccgcg gtgtcatcga 21840
gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc accacctaag gagacagcgc 21900
cgccgcctgc atgacgggtt ccaccgagca agagctcagg gccatcgcca gagacctggg 21960
atgcggaccc tattttttgg gcacctatga caaacgcttc ccgggcttca tctcccgaga 22020
caagctcgcc tgcgccatcg tcaacacggc cgcgcgcgag accgggggcg tgcactggct 22080
ggcctttggc tgggacccgc gctccaaaac ctgctacctc ttcgacccct ttggcttctc 22140
cgatcagcgc ctcagacaga tctatgagtt tgagtacgag gggctgctgc gccgcagcgc 22200
gcttgcctcc tcgcccgacc gctgcatcac ccttgagaag tccaccgaga ccgtgcaggg 22260
gccccactcg gccgcctgcg gtctcttctg ctgcatgttt ttgcacgcct ttgtgcgctg 22320
gccccagagt cccatggatc gcaaccccac catgaacttg ctcaagggag tgcccaacgc 22380
catgctccag agcccccagg tccagcccac cctgcgccac aaccaggaac agctctaccg 22440
cttcctggag cgccactccc cctacttccg cagtcacagc gcgcacatcc ggggggccac 22500
ctctttctgc cacttgcaag aaaacatgca agacggaaaa tgatgtacag ctcgcttttt 22560
aataaatgta aagactgtgc actttattta tacacgggct ctttctggtt atttattcaa 22620
caccgccgtc gccatctaga aatcgaaagg gttctgccgc gcgtcgccgt gcgccacggg 22680
cagagacacg ttgcgatact ggaagcggct cgcccactta aactcgggca ccaccatgcg 22740
gggcagtggt tcctcgggga agttctcgcc ccacagggtg cgggtcagct gcagcgcgct 22800
caggaggtcg ggagccgaga tcttgaagtc gcagttgggg ccggaaccct gcgcgcgcga 22860
gttgcggtac acggggttgc agcactggaa caccagcagg gccggattat gcacgctggc 22920
cagcaggctc tcgtcgctga tcatgtcgct gtccagatcc tccgcgttgc tcagggcgaa 22980
cggggtcatc ttgcagacct gcctgcccag gaaaggcggc agcccgggct tgccgttgca 23040
gtcgcagcgc aggggcatca gcaggtgccc gcggcccgac tgcgcctgcg ggtacagcgc 23100
gcgcatgaag gcttcgatct gcctgaaagc cacctgcgtc ttggctccct ccgaaaagaa 23160
catcccacag gacttgctgg agaactggtt cgcgggacag ctggcatcgt gcaggcagca 23220
gcgcgcgtcg gtgttggcga tctgcaccac gttgcgaccc caccggttct tcactatctt 23280
ggccttggaa gcctgctcct tcagcgcgcg ctggccgttc tcgctggtca catccatctc 23340
tatcacctgc tccttgttga tcatgtttgt accgtgcaga cacttcaggt cgccctccgt 23400
ctgggtgcag cggtgctccc acagcgcgca accggtgggc tcccaatttt tgtgggtcac 23460
ccccgcgtag gcctgcaggt aggcctgcaa gaagcgcccc atcatggcca caaaggtctt 23520
ctggctcgta aaggtcagct gcaggccgcg atgctcttcg ttcagccagg tcttgcagat 23580
ggcggccagc gcctcggtct gctcgggcag catcctaaaa tttgtcttca ggtcgttatc 23640
cacgtggtac ttgtccatca tggcgcgcgc cgcctccatg cccttctccc aggcggacac 23700
catgggcagg cttagggggt ttatcacttc caccggcgag gacaccgtac tttcgatttc 23760
ttcttcctcc ccctcttccc ggcgcgcgcc cacgctgctg cgcgctctca ccgcctgcac 23820
caaggggtcg tcttcaggca agcgccgcac cgagcgcttg ccgcccttga cctgcttaat 23880
cagcaccggc gggttgctga agcccaccat ggtcagcgcc gcctgctctt cttcgtcttc 23940
gctgtctacc actatctctg gggaagggct tctccgctct gcggcggcgc gcttcttttt 24000
tttcttggga gcggccgtga tggagtccgc cacggcgacg gaggtcgagg gcgtggggct 24060
gggggtgcgc ggtaccaggg cctcgtcgcc ctcggactct tcctctgact ccaggcggcg 24120
gcggagtcgc ttctttgggg gcgcgcgcgt cagcggcggc ggagacgggg acggggacgg 24180
ggacgggacg ccctccacag ggggtggtct tcgcgcagac ccgcggccgc gctcgggggt 24240
cttctcgagc tggtcttggt cccgactggc cattgtatcc tcctcctcct aggcagagag 24300
acataaggag tctatcatgc aagtcgagaa ggaggagagc ttaaccaccc cctctgagac 24360
cgccgatgcg cccgccgtcg ccgtcgcccc cgctgccgcc gacgcgcccg ccacaccgag 24420
cgacaccccc gcggaccccc ccgccgacgc acccctgttc gaggaagcgg ccgtggagca 24480
ggacccgggc tttgtctcgg cagaggagga tttgcgagag gaggaggata aggagaagaa 24540
gccctcagtg ccaaaagatg ataaagagca agacgagcac gacgcagatg cacaccaggg 24600
tgaagtcggg cggggggacg gagggcatga cggcgccgac tacctagacg aagggaacga 24660
cgtgctcttg aagcacctgc atcgtcagtg cgccattgtt tgcgacgctc tgcaggagcg 24720
cagcgaagtg cccctcagcg tggcggaggt cagccacgcc tacgagctca gcctcttctc 24780
cccccgggtg cccccccgcc gccgcgaaaa cggcacatgc gagcccaacc cgcgcctcaa 24840
cttctacccc gcctttgtgg tacccgaggt cctggccacc tatcacatct tctttcaaaa 24900
ttgcaagatc cccctctcgt gccgcgccaa ccgtagccgc gccgataaga tgctggccct 24960
gcgccagggc gaccacatac ctgatatcgc cgctttggaa gatgtaccaa agatcttcga 25020
gggtctgggt cgcaacgaga agcgggcagc aaactctctg caacaggaaa acagcgaaaa 25080
tgagagtcac accggggtac tggtggagct cgagggcgac aacgcccgcc tggcggtggt 25140
caagcgcagc atcgaggtca cccactttgc ctaccccgcg ctaaacctgc cccccaaagt 25200
catgaacgcg gccatggacg ggctgatcat gcgccgcggc cggcccctcg ctccagatgc 25260
aaacttgcat gaggagaccg aggacggcca gcccgtggtc agcgacgagc agctggcgcg 25320
ctggctggag accgcggacc ccgccgaact ggaggagcgg cgcaagatga tgatggccgt 25380
ggtgctggtc accgtagagc tggagtgtct gcagcgcttc ttcggcgacc ccgagatgca 25440
gagaaaggtc gaggagaccc tgcactacac cttccgccag ggctacgtgc gccaggcttg 25500
caagatctcc aacgtggagc tcagcaacct ggtgtcctac ctgggcatct tgcatgagaa 25560
ccgcctcggg cagagcgtgc tgcactccac cctgcgcggg gaggcgcgcc gcgactacgt 25620
gcgcgactgc gtttacctct tcctctgcta cacctggcag acggccatgg gggtctggca 25680
gcagtgcctg gaggagcgca acctcaagga gctggagaag ctcctgcagc gcgcgctcaa 25740
agatctctgg acgggctaca acgagcgctc ggtggccgcc gcgctggccg acctcatctt 25800
ccccgagcgc ctgctcaaaa ccctccagca ggggctgccc gacttcacca gccaaagcat 25860
gttgcaaaac ttcaggaact ttatcctgga gcgttctggc atcctacccg ccacctgctg 25920
cgccctgccc agcgactttg tccccctcgt gtaccgcgag tgccccccgc cgctgtgggg 25980
tcactgctac ctgttccaac tggccaacta cctgtcctac cacgcggacc tcatggagga 26040
ctccagcggc gaggggctca tggagtgcca ctgccgctgc aacctctgca cgccccaccg 26100
ctccctggtc tgcaacaccc aactgctcag cgagagtcag attatcggta ccttcgagct 26160
acagggtccg tcctcctcag acgagaagtc cgcggctccg gggctaaaac tcactccggg 26220
gctgtggact tccgcctacc tgcgcaaatt tgtacctgaa gactaccacg cccacgagat 26280
caggttttac gaagaccaat cccgcccgcc caaggcggag ctgaccgcct gcgtcatcac 26340
ccagggcgag atcctaggcc aattgcaagc catccaaaaa gcccgccaag actttttgct 26400
gaagaagggt cggggggtgt atctggaccc ccagtcgggt gaggagctca acccggttcc 26460
cccgctgccg ccgccgcggg accttgcttc ccaggataag catcgccatg gctcccagaa 26520
agaagcagca gcggccgcca ctgccgccac cccacatgct ggaggaagag gaggaatact 26580
gggacagtca ggcagaggag gtttcggacg aggaggagcc ggagacggag atggaagagt 26640
gggaggagga cagcttagac gaggaggctt ccgaagccga agaggcagac gcaacaccgt 26700
caccctcggc cgcagccccc tcgcaggcgc ccccgaagtc cgctcccagc atcagcagca 26760
acagcagcgc tataacctcc gctcctccac cgccgcgacc cacggccgac cgcagaccca 26820
accgtagatg ggacaccacc ggaaccgggg ccggtaagtc ctccgggaga ggcaagcaag 26880
cgcagcgcca aggctaccgc tcgtggcgcg ctcacaagaa cgccatagtc gcttgcttgc 26940
aagactgcgg ggggaacatc tccttcgccc gccgcttcct gctcttccac cacggtgtgg 27000
ccttcccccg taacgtcctg cattactacc gtcatctcta cagcccctac tgcggcggca 27060
gtgagccaga gacggtcggc ggcggcggcg gcgcccgttt cggcgcctag gaagacccag 27120
ggcaagactt cagccaagaa actcgcggcg gccgcggcga acgcggtcgc gggggccctg 27180
cgcctgacgg tgaacgaacc cctgtcgacc cgcgaactga ggaaccgaat cttccccact 27240
ctctatgcca tcttccagca gagcagaggg caggatcagg aactgaaagt aaaaaacagg 27300
tctctgcgct ccctcacccg cagctgtctg tatcacaaga gcgaagacca gcttcggcgc 27360
acgctggagg acgctgaggc actcttcagc aaatactgcg cgctcactct taaggactag 27420
ctccgcgccc ttctcgaatt taggcgggaa cgcctacgtc atcgcagcgc cgccgtcatg 27480
agcaaggaca ttcccacgcc atacatgtgg agctatcagc cgcagatggg actcgcggcg 27540
ggcgcctccc aagactactc cacccgcatg aactggctca gtgccggccc acacatgatc 27600
tcacaggtta atgatatccg cacccatcga aaccaaatat tggtggagca ggcggcaatt 27660
accaccacgc cccgcaataa tcccaacccc agggagtggc ccgcgtccct ggtgtatcag 27720
gaaattcccg gccccaccac cgtactactt ccgcgtgatt cccaggccga agtccaaatg 27780
actaactcag gggcacagct cgcgggcggc tgtcgtcaca gggtgcggcc tcctcgccag 27840
ggtataactc acctggagat ccgaggcaga ggtattcagc tcaacgacga gtcggtgagc 27900
tcctcgctcg gtctcagacc tgacgggacc ttccagatag ccggagccgg ccgatcttcc 27960
ttcacgcccc gccaggcgta cctgactctg caaagctcgt cctcggcgcc gcgctcgggc 28020
ggcatcggga ctctccagtt cgtgcaggag tttgtgccct cggtctactt caaccccttc 28080
tcgggctctc ccggtcgcta cccggaccag ttcatctcga actttgacgc cgcgagggac 28140
tcggtggacg gctacgactg aatgtcgggt ggacccggtg cagagcaact tcgcctgaag 28200
cacctcgacc actgccgccg ccctcagtgc tttgcccgct gtcagaccgg tgagttccag 28260
tacttttccc tgcccgactc gcacccggac ggcccggcgc acggggtgcg ctttttcatc 28320
ccgagtcagg tgcgctctac cctaatcagg gagtttaccg cccgtcccct actggcggag 28380
ttggaaaagg ggccttctat cctaaccatt gcctgcatct gctctaaccc tggattgcac 28440
caagatcttt gctgtcattt gtgtgctgag tataataaag gctgagatca gaatctactc 28500
gggctcctgt cgccatcctg tcaacgccac cgtccaagcc cggcccgatc agcccgaggt 28560
gaacctcacc tgcggtctgc accggcgcct gaggaaatac ctagcttggt actacaacag 28620
cactcccttt gtggtttaca acagctttga ccaggacggg gtctcactga gggataacct 28680
ctcgaacctg agctactcca tcaggaagaa cagcaccctc gagctacttc ctccttacct 28740
gcccgggact taccagtgtg tcaccggtcc ctgcacccac acccacctgt tgatcgtaaa 28800
cgactctctt ccgagaacag acctcaataa ctcctcttcg cagttcccca gaacaggagg 28860
tgagctcagg aaaccccggg taaagaaggg tggacgagag ttaacacttg tggggtttct 28920
ggtgtatgtg acgctggtgg tggctctttt gattaaggct tttccttcca tgtctgaact 28980
ctccctcttc ttttatgaac aactcgacta gtgctaacgg gaccctaccc aacgaatcgg 29040
gattgaatat cggtaaccag gttgcagttt cacttttgat taccttcata gtcctcttcc 29100
tgctagtgct gtcgcttctg tgcctgcgga tcgggggctg ctgcatccac gtttatatct 29160
ggtgctggct gtttagaagg ttcggagacc atcgcaggta gaataaacat gctgctgctt 29220
accctctttg tcctggcgct ggccgccagc tgccaagcct tttccgaggc tgactttata 29280
gagccccagt gtaatgtgac ttttaaagcc catgcacagc gttgtcatac tataatcaaa 29340
tgtgccaccg aacacgatga ataccttatc cagtataaag ataaatcaca caaagtggca 29400
cttgttgaca tctggaaacc cgaagaccct ttggaataca atgtgaccgt tttccagggt 29460
gacctcttca aaatttacaa ttacactttc ccatttgacc agatgtgtga ctttgtcatg 29520
tacatggaaa agcagcacaa gctgtggcct ccgactcccc agggctgtgt ggaaaatcca 29580
ggctctttct gcatgatctc tctctgtgta actgtgctgg cactaatact cacgcttttg 29640
tatatcagat ttaaatcaag gcaaagcttc attgatgaaa agaaaatgcc ttaatcgctt 29700
tcacgcttga ttgctaacac cgggttttta tccgcagaat gattggaatc accctactaa 29760
tcacctccct ccttgcgatt gcccatgggt tggaacgaat cgaagtccct gtgggggcca 29820
atgttaccct ggtggggcct gtcggcaatg ctacattaat gtgggaaaaa tatactaaaa 29880
atcaatgggt ctcttactgc actaacaaaa atagccacaa gcccagagcc atctgcgatg 29940
ggcaaaatct aaccttgatt gatgttcaat tgctggatgc gggctactat tatgggcagc 30000
tgggtacaat gattaattac tggagacccc acagagatta catgctccac gtagtaaagg 30060
gtccccttag cagcccaccc actaccacct ctactacccc cactaccacc actactccca 30120
ccaccagcac tgccgcccag cctcctcata gcagaacaac cacttttatc aattccaagt 30180
cccactcccc ccacattgcc ggcgggccct ccgcctcaga ctccgaaacc accgagatct 30240
gcttctgcaa atgctctgac gccattgccc aggatttgga agatcacgag gaagatgagc 30300
atgacttcgc agatgcatgc caggcatcag agccagaagc gctgccggtg gccctcaaac 30360
agtatgcaga cccccacacc acccccgacc ttcctccacc ttcccagaag ccaagtttcc 30420
tgggggaaaa tgaaactctg cctctctcca tactcgctct gacatctgtt gctatgttga 30480
ccgctctgct ggtgcttcta tgctctatat gctacctgat ctgctgcaga aagaaaaaat 30540
ctcacggcca tgctcaccag cccctcatgc acttccctta ccctccagag ctgggcgacc 30600
acaaacttta agtctgcagt aactatctgc ccatcccttg tcagtcgaca gcgatgagcc 30660
ccactaatct aacggcctct ggacttacaa catcgtctct taatgagacc accgctcctc 30720
aagacctgta cgatggtgtc tccgcgctgg ttaaccagtg ggatcacctg ggcatatggt 30780
ggctcctcat aggagcagtg accctgtgcc taatcctggt ctggatcatc tgctgcatca 30840
aaagcagaag acccaggcgg cggcccatct acaggccctt tgtcatcaca cctgaagatg 30900
atgatgacac cacttccagg ctgcagaggc taaagcagct actcttctct tttacagcat 30960
ggtaaattga atcatgcctc gcattttcat ctacttgtct ctccttccac tttttctggg 31020
ctcttctaca ttggccgctg tgtcccacat cgaggtagac tgcctcacgc ccttcacagt 31080
ctacctgctt ttcggctttg tcatctgcac ctttgtctgc agcgttatca ctgtagtgat 31140
ctgcttcata cagtgcatcg actacgtctg cgtgcgggtg gcttacttta gacaccaccc 31200
ccagtatcgc aacagggaca tagcggctct cctaagactt gtttaaaatc atggccaaat 31260
taactgtgat tggtcttctg atcatctgct gcgtcctagc cgcgattggg actcaagctc 31320
ctaccaccac cagcgctccc agaaagagac atgtatcctg cagcttcaag cgtccctgga 31380
atatacccca atgctttact gatgaacctg aaatctcttt ggcttggtac ttcagcgtca 31440
ccgcccttct tatcttctgc agtacggtta ttgcccttgc catctaccct tcccttgacc 31500
tgggctggaa tgctgtcaac tctatggaat atcccacctt cccagaacca gacctgccag 31560
acctggttgt tctaaacgcg tttcctcctc ctgctcccgt tcaaaatcag tttcgccctc 31620
cgtcccccac gcccactgag gtcagctact ttaatctaac aggcggagat gactgaaaac 31680
ctagacctag aaatggacgg tctctgcagc gagcaacgca cactagagag gcgccggcaa 31740
aaagagctcg agcgtcttaa acaagagctc caagacgcgg tggccataca ccagtgcaaa 31800
aaaggtgtct tctgtctggt aaaacaggcc acgctcacct atgaaaaaac aggtgacacc 31860
caccgcctag gatacaagct gcccacacag cgccaaaagt tcgccctcat gataggcgaa 31920
caacccatca ccgtgaccca gcactccgtg gagacagaag gctgcataca tgctccctgt 31980
aggggcgctg actgcctcta caccttgatc aaaaccctct gcggtctcag agaccttatc 32040
cctttcaatt aatcataact gtaatcaata aaaaatcact tacttgaaat ctgatagcaa 32100
gcctctgtcc aattttttca gcaacacttc cttcccctcc tcccaactct ggtactctag 32160
gcgcctccta gctgcaaact tcctccacag tctgaaggga atgtcagatt cctcctcctg 32220
tccctccgca cccacgatct tcatgttgtt gcagatgaaa cgcgcgagat cgtctgacga 32280
gaccttcaac cccgtgtacc cctacgatac cgagatcgct ccgacttctg tccctttcct 32340
tacccctccc tttgtgtcat ccgcaggaat gcaagaaaat ccagctgggg tgctgtccct 32400
gcacttgtca gagcccctta ccacccacaa tggggccctg actctaaaaa tggggggcgg 32460
cctgaccctg gacaaggaag ggaatctcac ttcccaaaac atcaccagtg tcgatccccc 32520
tctcaaaaaa agcaagaaca acatcagcct tcagaccgcc gcacccctcg ccgtcagctc 32580
cggggcccta acactttttg ccactccccc cctagcggtc agtggtgaca accttactgt 32640
gcagtctcag gcccctctca ctttggaaga ctcaaaacta actctggcca ccaaaggacc 32700
cctaactgtg tccgaaggca aacttgtc 32728
<210> 22
<211> 32728
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒载体核苷酸序列
<400> 22
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagcgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgttttt attgtcaccg tcatttgacg cggagggtat ttaaacccgc 480
tgcgctcctc aagaggccac tcttgagtgc cagcgagaag agttttctcc tctgctccgc 540
ttcggtgatc gaaaaatgag acacatagcc tgcactccgg gtcttttgtc cggtcgggcg 600
gcggccgagc ttttggacgc tttgatcaat gatgtcctaa gcgatgattt tccgtctact 660
acccacttta gcccacctac tcttcacgaa ctgtacgatc tggatgtact ggtggatgtg 720
aacgatccca acgaggaggc ggtttctgcg ttttttcccg agtctgcgct gttggccgct 780
caggagggat ttgacctaca cactccgccg cctattttag agtctccgct gccggagccc 840
agtggtatac cttatatgcc tgaactgctt cccgaagtgg tagacctgac ctgccacgag 900
cctggctttc cgcccagcga cgatgagggt gagccttttg ttttagactt tgctgagata 960
cctgggcacg gttgcaggtc ttgtgcatat catcagaggg ttaccggaga ccccgaggtt 1020
aagtgttcgc tgtgctatat gaggatgacc tcttccttta tctacagtaa gtttttgtct 1080
aggtgggctt ttgggtaggt gggttttgtg tcagaacagg tgtaaacgtt gcttgtgttt 1140
tttgtacctg taggtccggt gtccgagcca gacccggagc ccgaccgcga tcccgagccg 1200
gatcccgagc ctcctcgcag gacaaggaaa ctaccttcca ttctgtgcaa gtctcagaca 1260
cctgtaagga ccagcgaggc agacagcacc gactctggca cttctacctc tccccctgaa 1320
attcacccag tggttcctct gggtatacat aaacctgttg ctgttaaagt ttgcgggcga 1380
cgccctgcag tacagtgcat tgaggacttg cttcacgatc ccgaggaacc tttggacttg 1440
agccttaaac gccctaggca ataaacccca cctaagtaat aaaccccacc taagtaataa 1500
accctgccgc ccttggttat tgagatgacg cccaatgttt gcttttgaat gacttcatgt 1560
gtgtaataaa agtgagtgtg atcataggtc tcttgtttgt ctgggcgggg cttaagggta 1620
tataagtctc ttggggctaa acttggttac acttgacccc aatggaggcg tgggggtgct 1680
tggaggagtt tgcggacgtg cgccgtttgc tggacgagag ctctagcaat acctatacta 1740
tttggaggta tctgtggggc tctactcagg ccaagttggt ttccagaatt aagcaggatt 1800
acaagtgcga ttttgaagag ctttttagtt cctgcggtga gcttttgcaa tccttgaatc 1860
tgggccatca ggctattttc caggaaaagg ttctctcgac tttggatttt tccactcccg 1920
ggcgcaccgc cgcttgtgtg gcttttgtgt cttttgtgca agataaatgg agcgaggaga 1980
cccacctgag tcacggctac gtactggatt tcatggcgat ggctctttgg agggctcaca 2040
acaaatggaa gattcagaag gaactgtacg gttccgccct acgtcgtcca cttctgtcgc 2100
gacaggggct gaggtttccc gaccatcggc agcatcagaa tctggaagac gagtcggagg 2160
agcgagcgga ggagaagatc agcttgagag ccggcctgga ccctcctcag gaggaatgaa 2220
tctcccgcag gtggttgacc tgtttccaga actgagacgg gtcctgacta tcagggagga 2280
tggtcagttt gtgaagaagt ttaagaggga tcggggtgag ggagatgatg aggcggctag 2340
caatttagct tttagtctga tgactcgcca ccgaccggaa tgtattacct atcagcagat 2400
taaggagagt tgtgccaacg agctggatct tttgggtcag aagtatagca tagaacagct 2460
taccacttac tggcttcagc ctggggatga ttgggaagag gcgatcaggg tgtatgcaaa 2520
ggtggccctg cggcccgatt gcaagtataa gattactaag ttggttaata ttagaaactg 2580
ctgctatatt tctgggaacg gggccgaagt ggagatagat actcaggaca gggtggcttt 2640
taggtgttgc atgataaaca tgtggcccgg gatactgggg atggatgggg tggtattcat 2700
gaatgtgagg tttacgggcc ccaactttaa tggcacggtg ttcatgggca acaccaactt 2760
gctcctgcat ggtgcgagtt tctatgggtt taataacacc tgtatagagg cctggaccga 2820
tgtaaaggtt cgaggttgtt ccttttatag ctgttggaag gcggtggtgt gtcgccctaa 2880
aagcaggggt tctgtgaaaa aatgcttgtt tgaaaggtgc accttaggca tcctctctga 2940
gggcaactcc agggtgcgcc ataatgtggc ttcgaactgc ggttgcttca tgcaagtgaa 3000
gggggtgagc gttatcaagc ataactcggt gtgtggaaac tgcgaggatc gcgcctccca 3060
gatgctgacc tgctttgatg gcaactgtca cctgttgaag accattcata taagcagcca 3120
ccccagaaag gcctggcccg tgtttgagca taacatcttg acccgctgct ccttgcatct 3180
gggggtcagg aggggtatgt tcctgcctta ccagtgtaac tttagccaca ctaaaatcct 3240
gctggaaccc gagtgcatga ccaaggtcag cctgaatggt gtgtttgatg tgactctgaa 3300
aatctggaag gtgctgaggt atgatgagac caggaccagg tgccgaccct gcgagtgcgg 3360
cggcaagcac atgagaaatc agcctgtgat gttggatgtg accgaggagc ttaggcctga 3420
ccatctggtg ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg 3480
aggtgggtaa ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg 3540
tctctctgtt ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg 3600
gaagcatctt tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga 3660
atgtgatggg ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg 3720
cctacgcgac cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg 3780
ccgccgcgac cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg 3840
cggcctctcg cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag 3900
acttgacccg ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc 3960
ttgcctcccc ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt 4020
gtatgttctt tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt 4080
tagggtgcgg tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat 4140
gggcatgagt ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt 4200
ggtgttgtat atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt 4260
aagcaagagg cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag 4320
ttgggagggg tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc 4380
tatgttccca cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata 4440
tccagtgcac ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga 4500
gacgcccttg tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc 4560
gtgggaagct gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag 4620
ggtgaggtca tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat 4680
gatggtaccc tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt 4740
catttcagag ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc 4800
aggggagatt aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt 4860
gggcccatat atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc 4920
gtcctcccgg agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct 4980
gaccaattcc gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa 5040
atttttcagc ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag 5100
ttccagcctg tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc 5160
tcgtttcgcg ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg 5220
gccagagtca tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg 5280
aaggggtgcg ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg 5340
ctgaatcgct gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg 5400
tagtcgagac cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg 5460
cacgaggggc actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct 5520
ggggagtagg cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg 5580
agctccgggc ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta 5640
cctcggctct ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg 5700
tagaccgact tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac 5760
tctgaccact ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag 5820
gggtagcggt cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc 5880
ccctcctccg cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt 5940
cccgacgggg gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg 6000
ctgtctgcga gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca 6060
gcgctcaggt tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg 6120
atacctttga gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc 6180
ttggtggcga acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc 6240
tggtttttgt cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg 6300
gccacgcact tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc 6360
cagcctcggt tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc 6420
tcgttggtcc agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc 6480
tggtcctcgt ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca 6540
aagtagtcga tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc 6600
gcgcgctcgt aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg 6660
tacatgccgc agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg 6720
tagcagcgcc ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc 6780
agcatgttgg gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg 6840
aagatggcat gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct 6900
tgcaagccca ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc 6960
tcggcggtga cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac 7020
ttatcctccc ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc 7080
cagtactctt ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac 7140
tggttgacgg cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc 7200
gccttgcgga gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat 7260
tgatgtttga agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc 7320
tttttggagc gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct 7380
cgaggcatga agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg 7440
acctgggcgg ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc 7500
tccaaaaagc ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc 7560
tcctcgggcg attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc 7620
gccaggaagg atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt 7680
ctgaactgtc gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct 7740
ttctcccagg ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc 7800
tcgtcgcccc ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc 7860
atccaagtgt aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag 7920
ccgatcggga agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga 7980
aagtagaagt cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag 8040
tactggcagc gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg 8100
aggaagcgca gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct 8160
actttggttg tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc 8220
acgccgcgag agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca 8280
tcgcgcacat tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt 8340
tcctggaggt tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg 8400
atttcaaggg gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg 8460
gccacgatgg ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc 8520
ggtgacgcgg gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca 8580
ggggcacgtc ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt 8640
gcgcgacgac gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc 8700
ccgtgacctt gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg 8760
cctggcgcag gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga 8820
actgctcgat ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca 8880
ggtcgttgga gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga 8940
cccggctgta gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt 9000
tgagctccac gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca 9060
gggtggtggc ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt 9120
cattgatgtc ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt 9180
tgaaaaactg ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct 9240
cggcgacagt gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca 9300
cctcttcttc catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg 9360
gcgggggagg ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga 9420
tcatctcccc ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc 9480
gcagctcgaa gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga 9540
cggcgctgac tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg 9600
agtccagatc caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc 9660
aaggtaggct gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc 9720
tgctgatgat gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca 9780
tgtctttggg tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct 9840
gacaccggcg caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc 9900
cttcctcttc tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc 9960
ccctgagcgg ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct 10020
gcacctgagt gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg 10080
tgttgatggt gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct 10140
gcgagagctc cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc 10200
aagtccgcac cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg 10260
gccagcgctg ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc 10320
cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt 10380
cgcggacccg gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct 10440
ggccggtgag gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta 10500
cagggctttc gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg 10560
ttcgagacca agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc 10620
gtctcgaccc aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc 10680
caagcgcccg tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc 10740
ttccgtagtc tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc 10800
ctatggcggc ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc 10860
aggaccccgc cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt 10920
tagatgcatc ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa 10980
cagcaggcat gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc 11040
gtgtcgggcg cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag 11100
tatctggact tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc 11160
cacccgcggg tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg 11220
tttcgcgacc gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg 11280
cgcgagctgc ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc 11340
gacacgcaga cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc 11400
gcctacgagc agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg 11460
cgcacgctgg tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg 11520
gaggcgatcg tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg 11580
cagcacagca gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag 11640
gggcgctggc tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc 11700
ctgagcctgg ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc 11760
tacgcccgca agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac 11820
agcttctaca tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac 11880
cgcaacgagc gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc 11940
gagctgatgc acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc 12000
gagtcctact tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag 12060
gcggcggggg cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag 12120
ctagaggagg gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca 12180
agatccgaac gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat 12240
taactcctct gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa 12300
ccccgaggct ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt 12360
agtgcccgcg cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc 12420
ggagagcagg gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg 12480
ggtggcgcgg tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt 12540
gcgcgaggcc gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt 12600
ggcgctaaac gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta 12660
caccaacttt ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta 12720
ccagtcgggg cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct 12780
gagccaggct ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg 12840
ggctacggtg tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 12900
cttcacggac agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta 12960
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt 13020
gagccacgcg ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct 13080
gaccaacagg cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat 13140
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag 13200
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc 13260
gtttatcaac cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt 13320
cactaatgcc attctgaatc cccactggat gccccctccg ggtttctaca acggggactt 13380
tgaggtgccc gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc 13440
acccaacccg ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc 13500
gaggagtctg gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg 13560
gggcagtagc cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc 13620
ccgcttgcta ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa 13680
gaacgctcag cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc 13740
cagatggaag acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt 13800
gccgccccct aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc 13860
cgaggacgat gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa 13920
ccccttttcg cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaaataa 13980
aactcaccaa ggccatggcg acgagcgttg gttttttgtt cccttcctta gtatgcggcg 14040
cgcggcgatg ttcgaggagg ggcctccccc ctcttacgag agcgcgatgg ggatttctcc 14100
tgcggcgccc ctgcagcctc cctacgtgcc tcctcggtac ctgcaaccta caggggggag 14160
aaatagcatc tgttactctg agctgcagcc cctgtacgat accaccagac tgtacctggt 14220
ggacaacaag tccgcggacg tggcctccct gaactaccag aacgaccaca gcgatttttt 14280
gaccacggtg atccaaaaca acgacttcac cccaaccgag gccagcaccc agaccataaa 14340
cctggataac aggtcgaact ggggcggcga cctgaagacc atcttgcaca ccaacatgcc 14400
caacgtgaac gagttcatgt tcaccaactc ttttaaggcg cgggtgatgg tggcgcgcga 14460
gcagggggag gcgaagtacg agtgggtgga cttcacgctg cccgagggca actactcaga 14520
gaccatgact ctcgacctga tgaacaatgc gatcgtggaa cactatctga aagtgggcag 14580
gcagaacggg gtgaaggaaa gcgatatcgg ggtcaagttt gacaccagaa acttccgtct 14640
gggctgggac cccgtgaccg ggctggtcat gccgggggtc tacaccaacg aggcctttca 14700
tcccgacata gtgcttctgc ccggctgtgg ggtggacttc acccagagcc ggctgagcaa 14760
cctgctgggc attcgcaagc ggcagccttt ccaggagggt ttcaagatca cctatgagga 14820
tctgaagggg ggcaacattc ccgcgctcct tgatctggac gcctacgagg agagcttgaa 14880
acccgaggag agcgctggcg acagcggcga gagtggcgag gagcaagccg gcggcggtgg 14940
cggcgcgtcg gtagaaaacg aaagtacgcc cgcagtggcg gcggacgctg cggaggtcga 15000
gccggaggcc atgcagcagg acgcagagga gggcgcacag gagggcgcgc agaaggacat 15060
gaacgatggg gagatcaggg gagacacatt cgccacccgg ggcgaagaaa aagaggcaga 15120
ggcggcggcg gcggcgacgg cggaggccga aaccgaggtt gaggcagagg cagagcccga 15180
gaccgaagtt atggaagaca tgaatgatgg agaacgtagg ggcgacacgt tcgccacccg 15240
gggcgaagag aaggcggcgg aggcagaagc cgcggctgag gaggcggctg cggctgcggc 15300
caagactgag gctgcggcta aggctgaggt cgaagccaat gttgcggttg aggctcaggc 15360
tgaggaggag gcggcggctg aagcagttaa ggaaaaggcc caggcagagc aggaagagaa 15420
aaaacctgtc attcaacctc taaaagaaga tagcaaaaag cgcagttaca acgtcatcga 15480
gggcagcacc tttacccagt accgcagctg gtacctggcg tacaactacg gcgacccggt 15540
caagggggtg cgctcgtgga ccctgctctg cacgccggac gtcacctgcg gctccgagca 15600
gatgtactgg tcgctgccga acatgatgca agacccggtg accttccgct ccacgcggca 15660
ggttagcaac ttcccggtgg tgggcgccga actgctgccc gtgcactcca agagttttta 15720
caacgagcag gccgtctact cccagctgat ccgccaggcc acctctctga cccacgtgtt 15780
caatcgcttt cccgagaacc agattttggc gcgcccgccg gcccccacca tcaccaccgt 15840
gagtgaaaac gttcctgccc tcacagatca cgggacgcta ccgctgcgca acagcatctc 15900
aggagtccag cgagtgacca ttactgacgc cagacgccgg acctgcccct acgtttacaa 15960
ggccttgggc atagtctcgc cgcgcgtcct ctccagtcgc actttttaaa acacatctac 16020
ccacacgttc caaaatcatg tccgtactca tctcacccag caacaacacc ggctgggggc 16080
tgcgcgcgcc cagcaagatg tttggagggg cgaggaagcg ctccgaccag caccctgtgc 16140
gcgtgcgcgg ccactaccgc gcgccctggg gagcgcacaa gcgcgggcgc acagggcgca 16200
ccactgtgga cgacgtcatt gactccgtag tggagcaagc gcgccactac acacccggcg 16260
cgccgaccgc ccccgccgtg tccaccgtgg accaggcgat cgaaagcgtg gtacagggcg 16320
cgcggcacta tgccaacctt aaaagtcgcc gccgccgcgt ggcccgccgc catcgccgga 16380
gaccccgggc caccgccgcc gcgcgcctta ctaaggctct gctcaggcgc gccaggcgaa 16440
ctggccaccg ggccgccatg agggccgcac ggcgggctgc cgctgccgca agcgtcgtgg 16500
ccccgcgggc acgaaggcgc gcggccgctg ccgccgccgc cgccatttcc agcttggcct 16560
cgacgcggcg cggtaacata tactgggtgc gcgactcggt aaccggcacg cgggtacccg 16620
tgcgctttcg ccccccgcgg aattagcaca agacaacata cacactgagt ctcctgctgt 16680
tgtgtatccc agcggcgacc gtcagcagcg gcgacatgtc caagcgcaaa attaaagaag 16740
agatgctcca ggtcatcgcg ccggagatct atgggccccc gaagaaggag gaggatgatt 16800
acaagccccg caagctaaag cgggtcaaaa agaaaaagaa agatgatgat gacgaggcgg 16860
tggagtttgt ccgccgcatg gcacccaggc gccccgtgca gtggaagggc cggcgcgtgc 16920
agcgcgtttt gcgccccggc accgcggtgg tcttcacgcc cggcgagcgc tccacgcgca 16980
ctttcaagcg ggtgtacgat gaggtgtacg gcgacgagga cctgttggag caggccaacc 17040
agcgctttgg ggagtttgca tatgggaaac ggccccgcga gagtctaaaa gaggacctgc 17100
tggcgctacc gctggacgag ggcaatccca ccccgagtct gaagccggta accctgcaac 17160
aggtgctgcc tttgagcgcg cccagcgagc ataagcgagg gttgaagcgc gaaggcgggg 17220
acctggcgcc caccgtgcag ttgatggtgc ccaagcggca gaagctggag gacgtgctgg 17280
agaaaatgaa agtagagccc gggatccagc ccgagatcaa ggtccgcccc atcaagcagg 17340
tggcgcccgg cgtgggagtc cagaccgtgg acgttaggat tcccacggag gagatggaaa 17400
cccaaaccgc cactccctct tcggcggcca gcgccaccac cggcaccgct tcggtagagg 17460
tgcagacgga cccctggcta cccgccaccg ctgttgccgc cgccgccccc cgttcgcgcg 17520
ggcgcaagag aaattatcca gcggccagcg cgctcatgcc ccagtacgca ctgcatccat 17580
ccatcgtgcc cacccccggc taccgcgggt actcgtaccg cccgcgcaga tcagccggca 17640
ctcgcggccg ccgccgccgt gcgaccacaa ccagccgccg ccgtcgccgc cgccgccagc 17700
cagtgctgac ccccgtgtct gtaaggaagg tggctcgctc ggggagcacg ctggtggtgc 17760
ccagagcgcg ctaccacccc agcatcgttt aaagccggtc tctgtatggt tcttgcagat 17820
atggccctca cttgtcgcct ccgcttcccg gtgccgggat accgaggaag aactcaccgc 17880
cgcagaggca tggcgggcag cggtctccgc ggcggccgtc gccatcgccg gcgcgcaaaa 17940
agcaggcgca tgcgcggcgg tgtgctgcct ctgctaatcc cgctaatcgc cgcggcgatc 18000
ggtgccgtac ccgggatcgc ctccgtggcc ctgcaggcgt cccagaaacg ttgactcttg 18060
caaccttgca agcttgcatt ttttggagga aaaaataaaa aaaaagtcta gactctcacg 18120
ctcgcttggt cctgtgacta ttttgtagaa aaaaagatgg aagacatcaa ctttgcgtcg 18180
ctggccccgc gtcacggctc gcgcccgttc atgggagact ggacagatat cggcaccagc 18240
aatatgagcg gtggcgcctt cagctggggc agtctgtgga gcggccttaa aaattttggt 18300
tccaccatta agaactatgg caacaaagcg tggaacagca gcacgggcca gatgctgaga 18360
gacaagttga aagagcagaa cttccaggag aaggtggcgc agggcctggc ctctggcatc 18420
agcggggtgg tggacatagc taaccaggcc gtgcagaaaa agataaacag tcatctggac 18480
ccccgtcctc aggtggagga aatgcctcca gcgatggaga cggtgtctcc cgagggcaaa 18540
ggcgaaaagc gcccgcggcc cgacagagaa gagaccctgg tgtcacacac cgaggagccg 18600
ccctcttacg aggaggcagt caaggccggc ctgcccacca ctcgccccat agcccccatg 18660
gccaccggtg tggtgggcca caggcaacac actcccgcaa cactagatct gcccccgccg 18720
tccgagccgc cgcgccagcc aaaggcggcg acggtgcccg ctccctccac ttccgccgcc 18780
aacagagtgc ccctgcgccg cgccgcgagc ggcccccggg cctcgcgagt tagcggcaac 18840
tggcagagca cactgaacag catcgtgggc ctgggagtga ggagtgtgaa gcgccgccgt 18900
tgctactgaa tgagcaagct agctaacgtg ttgtatgtgt gtatgcgtcc tatgtcgccg 18960
ccagaggagc tgttgagccg ccggcgccgt ctgcactcca gcgaatttca agatggcgac 19020
cccatcgatg atgcctcagt ggtcgtacat gcacatctcg ggccaggacg cttcggagta 19080
cctgagcccc gggctggtgc agttcgcccg cgccacagac acctacttca acatgagtaa 19140
caagttcagg aaccccactg tggcgcccac ccacgatgtg accacggacc ggtcgcagcg 19200
cctgacgctg cggttcatcc ccgtggatcg ggaggacacc gcctactctt acaaggcgcg 19260
gttcacgctg gccgtgggcg acaaccgcgt gctggacatg gcctccactt actttgacat 19320
caggggggtg ctggacaggg gccccacctt caagccctac tcgggtactg cctacaactc 19380
cctggccccc aagggcgctc ccaattcttg cgagtgggaa caagatgaac cagctcaggc 19440
agcaatagct gaagatgaag aagaacttga agaagaacaa gctcaggacg aacaggcgcc 19500
cactaagaaa acccatgtat acgcccaggc acctctttct ggtgaaaaaa ttactaagga 19560
tggtttgcaa ataggtgtgg atgccacaca ggcgggagat aaccctatat atgctgataa 19620
aacattccaa cccgaacctc agataggtga gtctcagtgg aacgaggctg atgccacagt 19680
agcaggaggc agagtcttaa aaaagaccac ccctatgaga ccttgctatg gatcctatgc 19740
caaacctact aatgccaatg gcggtcaagg gatcatggtg gccaatgatc agggagcgct 19800
tgaatctaaa gttgagatgc aatttttctc caccacaacg tctcttaatg taagggaagg 19860
tgaaaacaat cttcagccaa aagtagtgct atacagcgaa gatgttaact tggaatcccc 19920
tgacactcat ttgtcttaca aacctaaaaa ggatgacacc aactctaaaa tcatgttggg 19980
tcagcaagcc atgcccaaca gacccaacct cattgctttt agggacaact ttattggact 20040
tatgtactac aacagcacag gcaacatggg agtgctggca ggacaggcct cccagctaaa 20100
cgctgtggta gacttgcaag acagaaacac agagctgtca taccaactga tgcttgattc 20160
cattggagac agatcaagat acttttccat gtggaaccag gcagtggaca gctatgaccc 20220
agatgtcaga atcattgaaa accatggggt tgaagatgag ctgcccaact attgctttcc 20280
cctgggcggt attggaatta cagacacata ccagtgcata aaaccaaccg cagctgctaa 20340
taacactaca tggtctaagg atgaagaatt tagtgatcgc aatgaaatag gggtgggaaa 20400
caacttcgcc atggagatca acatccaggc caacctctgg aggaacttcc tctatgcgaa 20460
cgtggggctc tacctgccag acaagctcaa gtacaacccc accaacgtgg acatctctga 20520
caaccccaac acctatgact acatgaacaa gcgtgtggtg gctcccggcc tggtggactg 20580
ctttgtcaat gtgggagcca ggtggtccct ggactacatg gacaacgtca accccttcaa 20640
ccaccaccgc aatgcgggtc tgcgctaccg ctccatgatc ctgggcaacg ggcgctacgt 20700
gcccttccac attcaggtgc cccagaagtt ctttgccatc aagaacctcc tcctcctgcc 20760
gggctcctac acttacgagt ggaacttcag gaaggatgtc aacatggtcc tgcagagctc 20820
tctgggcaat gaccttaggg tggacggggc cagcatcaag tttgacagcg tcaccctcta 20880
tgctaccttc ttccccatgg ctcacaacac cgcctccacg ctcgaggcca tgctgaggaa 20940
cgacaccaac gaccagtcct tcaatgacta cctctctggg gccaacatgc tctaccccat 21000
ccccgccaag gccaccaacg tgcccatctc cattccctct cgcaactggg ccgccttcag 21060
aggctgggcc tttacccgcc ttaagaccaa ggaaaccccc tccctgggct cgggttttga 21120
cccctacttt gtctactcgg gatccatccc ctacctggat ggcaccttct acctcaacca 21180
cacttttaag aagatatcca tcatgtatga ctcctccgtc agctggccgg gcaatgaccg 21240
cctgctcacc cccaatgagt tcgaggtcaa gcgcgccgtg gacggcgagg gctacaacgt 21300
ggcccagtgc aacatgacca aggactggtt cctggtgcag atgctggcca actacaacat 21360
aggctaccag ggcttctaca tcccagagag ctacaaggac aggatgtact ccttcttcag 21420
aaatttccaa cccatgagca ggcaggtggt ggacgagacc aaatacaagg actatcaggc 21480
cattggcatc actcaccagc acaacaactc gggattcgtg ggctacctgg ctcccaccat 21540
gcgcgagggg caggcctacc ccgccaactt cccctacccg ttgataggca aaaccgcggt 21600
cgacagcgtc acccagaaaa agttcctctg cgaccgcacc ctctggcgca tccccttctc 21660
tagcaacttc atgtccatgg gtgcgctcac ggacctgggc cagaacctgc tctatgccaa 21720
ctccgcccat gcgctggaca tgacttttga ggtggacccc atggacgagc ccacccttct 21780
ctatattgtg tttgaagtgt tcgacgtggt cagagtgcac cagccgcacc gcggtgtcat 21840
cgagaccgtg tacctgcgca cgcccttctc ggccggcaac gccaccacct aaggagacag 21900
cgccgccgcc tgcatgacgg gttccaccga gcaagagctc agggccatcg ccagagacct 21960
gggatgcgga ccctattttt tgggcaccta tgacaaacgc ttcccgggct tcatctcccg 22020
agacaagctc gcctgcgcca tcgtcaacac ggccgcgcgc gagaccgggg gcgtgcactg 22080
gctggccttt ggctgggacc cgcgctccaa aacctgctac ctcttcgacc cctttggctt 22140
ctccgatcag cgcctcagac agatctatga gtttgagtac gaggggctgc tgcgccgcag 22200
cgcgcttgcc tcctcgcccg accgctgcat cacccttgag aagtccaccg agaccgtgca 22260
ggggccccac tcggccgcct gcggtctctt ctgctgcatg tttttgcacg cctttgtgcg 22320
ctggccccag agtcccatgg atcgcaaccc caccatgaac ttgctcaagg gagtgcccaa 22380
cgccatgctc cagagccccc aggtccagcc caccctgcgc cacaaccagg aacagctcta 22440
ccgcttcctg gagcgccact ccccctactt ccgcagtcac agcgcgcaca tccggggggc 22500
cacctctttc tgccacttgc aagaaaacat gcaagacgga aaatgatgta cagctcgctt 22560
tttaataaat gtaaagactg tgcactttat ttatacacgg gctctttctg gttatttatt 22620
caacaccgcc gtcgccatct agaaatcgaa agggttctgc cgcgcgtcgc cgtgcgccac 22680
gggcagagac acgttgcgat actggaagcg gctcgcccac ttaaactcgg gcaccaccat 22740
gcggggcagt ggttcctcgg ggaagttctc gccccacagg gtgcgggtca gctgcagcgc 22800
gctcaggagg tcgggagccg agatcttgaa gtcgcagttg gggccggaac cctgcgcgcg 22860
cgagttgcgg tacacggggt tgcagcactg gaacaccagc agggccggat tatgcacgct 22920
ggccagcagg ctctcgtcgc tgatcatgtc gctgtccaga tcctccgcgt tgctcagggc 22980
gaacggggtc atcttgcaga cctgcctgcc caggaaaggc ggcagcccgg gcttgccgtt 23040
gcagtcgcag cgcaggggca tcagcaggtg cccgcggccc gactgcgcct gcgggtacag 23100
cgcgcgcatg aaggcttcga tctgcctgaa agccacctgc gtcttggctc cctccgaaaa 23160
gaacatccca caggacttgc tggagaactg gttcgcggga cagctggcat cgtgcaggca 23220
gcagcgcgcg tcggtgttgg cgatctgcac cacgttgcga ccccaccggt tcttcactat 23280
cttggccttg gaagcctgct ccttcagcgc gcgctggccg ttctcgctgg tcacatccat 23340
ctctatcacc tgctccttgt tgatcatgtt tgtaccgtgc agacacttca ggtcgccctc 23400
cgtctgggtg cagcggtgct cccacagcgc gcaaccggtg ggctcccaat ttttgtgggt 23460
cacccccgcg taggcctgca ggtaggcctg caagaagcgc cccatcatgg ccacaaaggt 23520
cttctggctc gtaaaggtca gctgcaggcc gcgatgctct tcgttcagcc aggtcttgca 23580
gatggcggcc agcgcctcgg tctgctcggg cagcatccta aaatttgtct tcaggtcgtt 23640
atccacgtgg tacttgtcca tcatggcgcg cgccgcctcc atgcccttct cccaggcgga 23700
caccatgggc aggcttaggg ggtttatcac ttccaccggc gaggacaccg tactttcgat 23760
ttcttcttcc tccccctctt cccggcgcgc gcccacgctg ctgcgcgctc tcaccgcctg 23820
caccaagggg tcgtcttcag gcaagcgccg caccgagcgc ttgccgccct tgacctgctt 23880
aatcagcacc ggcgggttgc tgaagcccac catggtcagc gccgcctgct cttcttcgtc 23940
ttcgctgtct accactatct ctggggaagg gcttctccgc tctgcggcgg cgcgcttctt 24000
ttttttcttg ggagcggccg tgatggagtc cgccacggcg acggaggtcg agggcgtggg 24060
gctgggggtg cgcggtacca gggcctcgtc gccctcggac tcttcctctg actccaggcg 24120
gcggcggagt cgcttctttg ggggcgcgcg cgtcagcggc ggcggagacg gggacgggga 24180
cggggacggg acgccctcca cagggggtgg tcttcgcgca gacccgcggc cgcgctcggg 24240
ggtcttctcg agctggtctt ggtcccgact ggccattgta tcctcctcct cctaggcaga 24300
gagacataag gagtctatca tgcaagtcga gaaggaggag agcttaacca ccccctctga 24360
gaccgccgat gcgcccgccg tcgccgtcgc ccccgctgcc gccgacgcgc ccgccacacc 24420
gagcgacacc cccgcggacc cccccgccga cgcacccctg ttcgaggaag cggccgtgga 24480
gcaggacccg ggctttgtct cggcagagga ggatttgcga gaggaggagg ataaggagaa 24540
gaagccctca gtgccaaaag atgataaaga gcaagacgag cacgacgcag atgcacacca 24600
gggtgaagtc gggcgggggg acggagggca tgacggcgcc gactacctag acgaagggaa 24660
cgacgtgctc ttgaagcacc tgcatcgtca gtgcgccatt gtttgcgacg ctctgcagga 24720
gcgcagcgaa gtgcccctca gcgtggcgga ggtcagccac gcctacgagc tcagcctctt 24780
ctccccccgg gtgccccccc gccgccgcga aaacggcaca tgcgagccca acccgcgcct 24840
caacttctac cccgcctttg tggtacccga ggtcctggcc acctatcaca tcttctttca 24900
aaattgcaag atccccctct cgtgccgcgc caaccgtagc cgcgccgata agatgctggc 24960
cctgcgccag ggcgaccaca tacctgatat cgccgctttg gaagatgtac caaagatctt 25020
cgagggtctg ggtcgcaacg agaagcgggc agcaaactct ctgcaacagg aaaacagcga 25080
aaatgagagt cacaccgggg tactggtgga gctcgagggc gacaacgccc gcctggcggt 25140
ggtcaagcgc agcatcgagg tcacccactt tgcctacccc gcgctaaacc tgccccccaa 25200
agtcatgaac gcggccatgg acgggctgat catgcgccgc ggccggcccc tcgctccaga 25260
tgcaaacttg catgaggaga ccgaggacgg ccagcccgtg gtcagcgacg agcagctggc 25320
gcgctggctg gagaccgcgg accccgccga actggaggag cggcgcaaga tgatgatggc 25380
cgtggtgctg gtcaccgtag agctggagtg tctgcagcgc ttcttcggcg accccgagat 25440
gcagagaaag gtcgaggaga ccctgcacta caccttccgc cagggctacg tgcgccaggc 25500
ttgcaagatc tccaacgtgg agctcagcaa cctggtgtcc tacctgggca tcttgcatga 25560
gaaccgcctc gggcagagcg tgctgcactc caccctgcgc ggggaggcgc gccgcgacta 25620
cgtgcgcgac tgcgtttacc tcttcctctg ctacacctgg cagacggcca tgggggtctg 25680
gcagcagtgc ctggaggagc gcaacctcaa ggagctggag aagctcctgc agcgcgcgct 25740
caaagatctc tggacgggct acaacgagcg ctcggtggcc gccgcgctgg ccgacctcat 25800
cttccccgag cgcctgctca aaaccctcca gcaggggctg cccgacttca ccagccaaag 25860
catgttgcaa aacttcagga actttatcct ggagcgttct ggcatcctac ccgccacctg 25920
ctgcgccctg cccagcgact ttgtccccct cgtgtaccgc gagtgccccc cgccgctgtg 25980
gggtcactgc tacctgttcc aactggccaa ctacctgtcc taccacgcgg acctcatgga 26040
ggactccagc ggcgaggggc tcatggagtg ccactgccgc tgcaacctct gcacgcccca 26100
ccgctccctg gtctgcaaca cccaactgct cagcgagagt cagattatcg gtaccttcga 26160
gctacagggt ccgtcctcct cagacgagaa gtccgcggct ccggggctaa aactcactcc 26220
ggggctgtgg acttccgcct acctgcgcaa atttgtacct gaagactacc acgcccacga 26280
gatcaggttt tacgaagacc aatcccgccc gcccaaggcg gagctgaccg cctgcgtcat 26340
cacccagggc gagatcctag gccaattgca agccatccaa aaagcccgcc aagacttttt 26400
gctgaagaag ggtcgggggg tgtatctgga cccccagtcg ggtgaggagc tcaacccggt 26460
tcccccgctg ccgccgccgc gggaccttgc ttcccaggat aagcatcgcc atggctccca 26520
gaaagaagca gcagcggccg ccactgccgc caccccacat gctggaggaa gaggaggaat 26580
actgggacag tcaggcagag gaggtttcgg acgaggagga gccggagacg gagatggaag 26640
agtgggagga ggacagctta gacgaggagg cttccgaagc cgaagaggca gacgcaacac 26700
cgtcaccctc ggccgcagcc ccctcgcagg cgcccccgaa gtccgctccc agcatcagca 26760
gcaacagcag cgctataacc tccgctcctc caccgccgcg acccacggcc gaccgcagac 26820
ccaaccgtag atgggacacc accggaaccg gggccggtaa gtcctccggg agaggcaagc 26880
aagcgcagcg ccaaggctac cgctcgtggc gcgctcacaa gaacgccata gtcgcttgct 26940
tgcaagactg cggggggaac atctccttcg cccgccgctt cctgctcttc caccacggtg 27000
tggccttccc ccgtaacgtc ctgcattact accgtcatct ctacagcccc tactgcggcg 27060
gcagtgagcc agagacggtc ggcggcggcg gcggcgcccg tttcggcgcc taggaagacc 27120
cagggcaaga cttcagccaa gaaactcgcg gcggccgcgg cgaacgcggt cgcgggggcc 27180
ctgcgcctga cggtgaacga acccctgtcg acccgcgaac tgaggaaccg aatcttcccc 27240
actctctatg ccatcttcca gcagagcaga gggcaggatc aggaactgaa agtaaaaaac 27300
aggtctctgc gctccctcac ccgcagctgt ctgtatcaca agagcgaaga ccagcttcgg 27360
cgcacgctgg aggacgctga ggcactcttc agcaaatact gcgcgctcac tcttaaggac 27420
tagctccgcg cccttctcga atttaggcgg gaacgcctac gtcatcgcag cgccgccgtc 27480
atgagcaagg acattcccac gccatacatg tggagctatc agccgcagat gggactcgcg 27540
gcgggcgcct cccaagacta ctccacccgc atgaactggc tcagtgccgg cccacacatg 27600
atctcacagg ttaatgatat ccgcacccat cgaaaccaaa tattggtgga gcaggcggca 27660
attaccacca cgccccgcaa taatcccaac cccagggagt ggcccgcgtc cctggtgtat 27720
caggaaattc ccggccccac caccgtacta cttccgcgtg attcccaggc cgaagtccaa 27780
atgactaact caggggcaca gctcgcgggc ggctgtcgtc acagggtgcg gcctcctcgc 27840
cagggtataa ctcacctgga gatccgaggc agaggtattc agctcaacga cgagtcggtg 27900
agctcctcgc tcggtctcag acctgacggg accttccaga tagccggagc cggccgatct 27960
tccttcacgc cccgccaggc gtacctgact ctgcaaagct cgtcctcggc gccgcgctcg 28020
ggcggcatcg ggactctcca gttcgtgcag gagtttgtgc cctcggtcta cttcaacccc 28080
ttctcgggct ctcccggtcg ctacccggac cagttcatct cgaactttga cgccgcgagg 28140
gactcggtgg acggctacga ctgaatgtcg ggtggacccg gtgcagagca acttcgcctg 28200
aagcacctcg accactgccg ccgccctcag tgctttgccc gctgtcagac cggtgagttc 28260
cagtactttt ccctgcccga ctcgcacccg gacggcccgg cgcacggggt gcgctttttc 28320
atcccgagtc aggtgcgctc taccctaatc agggagttta ccgcccgtcc cctactggcg 28380
gagttggaaa aggggccttc tatcctaacc attgcctgca tctgctctaa ccctggattg 28440
caccaagatc tttgctgtca tttgtgtgct gagtataata aaggctgaga tcagaatcta 28500
ctcgggctcc tgtcgccatc ctgtcaacgc caccgtccaa gcccggcccg atcagcccga 28560
ggtgaacctc acctgcggtc tgcaccggcg cctgaggaaa tacctagctt ggtactacaa 28620
cagcactccc tttgtggttt acaacagctt tgaccaggac ggggtctcac tgagggataa 28680
cctctcgaac ctgagctact ccatcaggaa gaacagcacc ctcgagctac ttcctcctta 28740
cctgcccggg acttaccagt gtgtcaccgg tccctgcacc cacacccacc tgttgatcgt 28800
aaacgactct cttccgagaa cagacctcaa taactcctct tcgcagttcc ccagaacagg 28860
aggtgagctc aggaaacccc gggtaaagaa gggtggacga gagttaacac ttgtggggtt 28920
tctggtgtat gtgacgctgg tggtggctct tttgattaag gcttttcctt ccatgtctga 28980
actctccctc ttcttttatg aacaactcga ctagtgctaa cgggacccta cccaacgaat 29040
cgggattgaa tatcggtaac caggttgcag tttcactttt gattaccttc atagtcctct 29100
tcctgctagt gctgtcgctt ctgtgcctgc ggatcggggg ctgctgcatc cacgtttata 29160
tctggtgctg gctgtttaga aggttcggag accatcgcag gtagaataaa catgctgctg 29220
cttaccctct ttgtcctggc gctggccgcc agctgccaag ccttttccga ggctgacttt 29280
atagagcccc agtgtaatgt gacttttaaa gcccatgcac agcgttgtca tactataatc 29340
aaatgtgcca ccgaacacga tgaatacctt atccagtata aagataaatc acacaaagtg 29400
gcacttgttg acatctggaa acccgaagac cctttggaat acaatgtgac cgttttccag 29460
ggtgacctct tcaaaattta caattacact ttcccatttg accagatgtg tgactttgtc 29520
atgtacatgg aaaagcagca caagctgtgg cctccgactc cccagggctg tgtggaaaat 29580
ccaggctctt tctgcatgat ctctctctgt gtaactgtgc tggcactaat actcacgctt 29640
ttgtatatca gatttaaatc aaggcaaagc ttcattgatg aaaagaaaat gccttaatcg 29700
ctttcacgct tgattgctaa caccgggttt ttatccgcag aatgattgga atcaccctac 29760
taatcacctc cctccttgcg attgcccatg ggttggaacg aatcgaagtc cctgtggggg 29820
ccaatgttac cctggtgggg cctgtcggca atgctacatt aatgtgggaa aaatatacta 29880
aaaatcaatg ggtctcttac tgcactaaca aaaatagcca caagcccaga gccatctgcg 29940
atgggcaaaa tctaaccttg attgatgttc aattgctgga tgcgggctac tattatgggc 30000
agctgggtac aatgattaat tactggagac cccacagaga ttacatgctc cacgtagtaa 30060
agggtcccct tagcagccca cccactacca cctctactac ccccactacc accactactc 30120
ccaccaccag cactgccgcc cagcctcctc atagcagaac aaccactttt atcaattcca 30180
agtcccactc cccccacatt gccggcgggc cctccgcctc agactccgaa accaccgaga 30240
tctgcttctg caaatgctct gacgccattg cccaggattt ggaagatcac gaggaagatg 30300
agcatgactt cgcagatgca tgccaggcat cagagccaga agcgctgccg gtggccctca 30360
aacagtatgc agacccccac accacccccg accttcctcc accttcccag aagccaagtt 30420
tcctggggga aaatgaaact ctgcctctct ccatactcgc tctgacatct gttgctatgt 30480
tgaccgctct gctggtgctt ctatgctcta tatgctacct gatctgctgc agaaagaaaa 30540
aatctcacgg ccatgctcac cagcccctca tgcacttccc ttaccctcca gagctgggcg 30600
accacaaact ttaagtctgc agtaactatc tgcccatccc ttgtcagtcg acagcgatga 30660
gccccactaa tctaacggcc tctggactta caacatcgtc tcttaatgag accaccgctc 30720
ctcaagacct gtacgatggt gtctccgcgc tggttaacca gtgggatcac ctgggcatat 30780
ggtggctcct cataggagca gtgaccctgt gcctaatcct ggtctggatc atctgctgca 30840
tcaaaagcag aagacccagg cggcggccca tctacaggcc ctttgtcatc acacctgaag 30900
atgatgatga caccacttcc aggctgcaga ggctaaagca gctactcttc tcttttacag 30960
catggtaaat tgaatcatgc ctcgcatttt catctacttg tctctccttc cactttttct 31020
gggctcttct acattggccg ctgtgtccca catcgaggta gactgcctca cgcccttcac 31080
agtctacctg cttttcggct ttgtcatctg cacctttgtc tgcagcgtta tcactgtagt 31140
gatctgcttc atacagtgca tcgactacgt ctgcgtgcgg gtggcttact ttagacacca 31200
cccccagtat cgcaacaggg acatagcggc tctcctaaga cttgtttaaa atcatggcca 31260
aattaactgt gattggtctt ctgatcatct gctgcgtcct agccgcgatt gggactcaag 31320
ctcctaccac caccagcgct cccagaaaga gacatgtatc ctgcagcttc aagcgtccct 31380
ggaatatacc ccaatgcttt actgatgaac ctgaaatctc tttggcttgg tacttcagcg 31440
tcaccgccct tcttatcttc tgcagtacgg ttattgccct tgccatctac ccttcccttg 31500
acctgggctg gaatgctgtc aactctatgg aatatcccac cttcccagaa ccagacctgc 31560
cagacctggt tgttctaaac gcgtttcctc ctcctgctcc cgttcaaaat cagtttcgcc 31620
ctccgtcccc cacgcccact gaggtcagct actttaatct aacaggcgga gatgactgaa 31680
aacctagacc tagaaatgga cggtctctgc agcgagcaac gcacactaga gaggcgccgg 31740
caaaaagagc tcgagcgtct taaacaagag ctccaagacg cggtggccat acaccagtgc 31800
aaaaaaggtg tcttctgtct ggtaaaacag gccacgctca cctatgaaaa aacaggtgac 31860
acccaccgcc taggatacaa gctgcccaca cagcgccaaa agttcgccct catgataggc 31920
gaacaaccca tcaccgtgac ccagcactcc gtggagacag aaggctgcat acatgctccc 31980
tgtaggggcg ctgactgcct ctacaccttg atcaaaaccc tctgcggtct cagagacctt 32040
atccctttca attaatcata actgtaatca ataaaaaatc acttacttga aatctgatag 32100
caagcctctg tccaattttt tcagcaacac ttccttcccc tcctcccaac tctggtactc 32160
taggcgcctc ctagctgcaa acttcctcca cagtctgaag ggaatgtcag attcctcctc 32220
ctgtccctcc gcacccacga tcttcatgtt gttgcagatg aaacgcgcga gatcgtctga 32280
cgagaccttc aaccccgtgt acccctacga taccgagatc gctccgactt ctgtcccttt 32340
ccttacccct ccctttgtgt catccgcagg aatgcaagaa aatccagctg gggtgctgtc 32400
cctgcacttg tcagagcccc ttaccaccca caatggggcc ctgactctaa aaatgggggg 32460
cggcctgacc ctggacaagg aagggaatct cacttcccaa aacatcacca gtgtcgatcc 32520
ccctctcaaa aaaagcaaga acaacatcag ccttcagacc gccgcacccc tcgccgtcag 32580
ctccggggcc ctaacacttt ttgccactcc ccccctagcg gtcagtggtg acaaccttac 32640
tgtgcagtct caggcccctc tcactttgga agactcaaaa ctaactctgg ccaccaaagg 32700
acccctaact gtgtccgaag gcaaactt 32728
<210> 23
<211> 32728
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒载体核苷酸序列
<400> 23
ataatatacc ttattttgga ttgtggccaa tatgataatg aggtgggcgg ggagaggcgg 60
ggcgggtgac gtaggacgcg cgagtagggt tgggaggtgt ggcggaagtg tggcatttgc 120
aagtgggagg agctcacatg caagcttccg tcgcggaaaa tgtgacgttt ttgatgagcg 180
ccgcctacct ccggaagtgc caattttcgc gcgcttttca ccggatatcg tagtaatttt 240
gggcgggacc atgtaagatt tggccatttt cgcgcgaaaa gtgaaacggg gaagtgaaaa 300
ctgaataata gggcgttagt catagcgcgt aatatttacc gagggccgag ggactttgac 360
cgattacgtg gaggactcgc ccaggtgttt tttacgtgaa tttccgcgtt ccgggtcaaa 420
gtctccgttt ttattgtcac cgtcatttga cgcggagggt atttaaaccc gctgcgctcc 480
tcaagaggcc actcttgagt gccagcgaga agagttttct cctctgctcc gcttcggtga 540
tcgaaaaatg agacacatag cctgcactcc gggtcttttg tccggtcggg cggcggccga 600
gcttttggac gctttgatca atgatgtcct aagcgatgat tttccgtcta ctacccactt 660
tagcccacct actcttcacg aactgtacga tctggatgta ctggtggatg tgaacgatcc 720
caacgaggag gcggtttctg cgttttttcc cgagtctgcg ctgttggccg ctcaggaggg 780
atttgaccta cacactccgc cgcctatttt agagtctccg ctgccggagc ccagtggtat 840
accttatatg cctgaactgc ttcccgaagt ggtagacctg acctgccacg agcctggctt 900
tccgcccagc gacgatgagg gtgagccttt tgttttagac tttgctgaga tacctgggca 960
cggttgcagg tcttgtgcat atcatcagag ggttaccgga gaccccgagg ttaagtgttc 1020
gctgtgctat atgaggatga cctcttcctt tatctacagt aagtttttgt ctaggtgggc 1080
ttttgggtag gtgggttttg tgtcagaaca ggtgtaaacg ttgcttgtgt tttttgtacc 1140
tgtaggtccg gtgtccgagc cagacccgga gcccgaccgc gatcccgagc cggatcccga 1200
gcctcctcgc aggacaagga aactaccttc cattctgtgc aagtctcaga cacctgtaag 1260
gaccagcgag gcagacagca ccgactctgg cacttctacc tctccccctg aaattcaccc 1320
agtggttcct ctgggtatac ataaacctgt tgctgttaaa gtttgcgggc gacgccctgc 1380
agtacagtgc attgaggact tgcttcacga tcccgaggaa cctttggact tgagccttaa 1440
acgccctagg caataaaccc cacctaagta ataaacccca cctaagtaat aaaccctgcc 1500
gcccttggtt attgagatga cgcccaatgt ttgcttttga atgacttcat gtgtgtaata 1560
aaagtgagtg tgatcatagg tctcttgttt gtctgggcgg ggcttaaggg tatataagtc 1620
tcttggggct aaacttggtt acacttgacc ccaatggagg cgtgggggtg cttggaggag 1680
tttgcggacg tgcgccgttt gctggacgag agctctagca atacctatac tatttggagg 1740
tatctgtggg gctctactca ggccaagttg gtttccagaa ttaagcagga ttacaagtgc 1800
gattttgaag agctttttag ttcctgcggt gagcttttgc aatccttgaa tctgggccat 1860
caggctattt tccaggaaaa ggttctctcg actttggatt tttccactcc cgggcgcacc 1920
gccgcttgtg tggcttttgt gtcttttgtg caagataaat ggagcgagga gacccacctg 1980
agtcacggct acgtactgga tttcatggcg atggctcttt ggagggctca caacaaatgg 2040
aagattcaga aggaactgta cggttccgcc ctacgtcgtc cacttctgtc gcgacagggg 2100
ctgaggtttc ccgaccatcg gcagcatcag aatctggaag acgagtcgga ggagcgagcg 2160
gaggagaaga tcagcttgag agccggcctg gaccctcctc aggaggaatg aatctcccgc 2220
aggtggttga cctgtttcca gaactgagac gggtcctgac tatcagggag gatggtcagt 2280
ttgtgaagaa gtttaagagg gatcggggtg agggagatga tgaggcggct agcaatttag 2340
cttttagtct gatgactcgc caccgaccgg aatgtattac ctatcagcag attaaggaga 2400
gttgtgccaa cgagctggat cttttgggtc agaagtatag catagaacag cttaccactt 2460
actggcttca gcctggggat gattgggaag aggcgatcag ggtgtatgca aaggtggccc 2520
tgcggcccga ttgcaagtat aagattacta agttggttaa tattagaaac tgctgctata 2580
tttctgggaa cggggccgaa gtggagatag atactcagga cagggtggct tttaggtgtt 2640
gcatgataaa catgtggccc gggatactgg ggatggatgg ggtggtattc atgaatgtga 2700
ggtttacggg ccccaacttt aatggcacgg tgttcatggg caacaccaac ttgctcctgc 2760
atggtgcgag tttctatggg tttaataaca cctgtataga ggcctggacc gatgtaaagg 2820
ttcgaggttg ttccttttat agctgttgga aggcggtggt gtgtcgccct aaaagcaggg 2880
gttctgtgaa aaaatgcttg tttgaaaggt gcaccttagg catcctctct gagggcaact 2940
ccagggtgcg ccataatgtg gcttcgaact gcggttgctt catgcaagtg aagggggtga 3000
gcgttatcaa gcataactcg gtgtgtggaa actgcgagga tcgcgcctcc cagatgctga 3060
cctgctttga tggcaactgt cacctgttga agaccattca tataagcagc caccccagaa 3120
aggcctggcc cgtgtttgag cataacatct tgacccgctg ctccttgcat ctgggggtca 3180
ggaggggtat gttcctgcct taccagtgta actttagcca cactaaaatc ctgctggaac 3240
ccgagtgcat gaccaaggtc agcctgaatg gtgtgtttga tgtgactctg aaaatctgga 3300
aggtgctgag gtatgatgag accaggacca ggtgccgacc ctgcgagtgc ggcggcaagc 3360
acatgagaaa tcagcctgtg atgttggatg tgaccgagga gcttaggcct gaccatctgg 3420
tgctggcctg caccagggcc gagtttgggt ctagcgatga ggataccgat tgaggtgggt 3480
aaggtgggcg tggctagaag ggtggggcgt gtataaattg ggggtctaag ggtctctctg 3540
ttttgtcttg caacagccgc cgccatgagc gacaccggca acagctttga tggaagcatc 3600
tttagcccct atctgacagt gcgcatgcct cactgggctg gagtgcgtca gaatgtgatg 3660
ggttccaacg tggatggacg ccccgttctg ccttcaaatt cgtctacaat ggcctacgcg 3720
accgtgggag gaactccgct ggacgccgcg acctccgccg ccgcctccgc cgccgccgcg 3780
accgcgcgca gcatggctac ggacctttac agctctttgg tggcgagcgg cgcggcctct 3840
cgcgcgtctg ctcgggatga gaaactgacc gctctgctgc ttaaactgga agacttgacc 3900
cgggagctgg gtcaactgac ccagcaggtc tccagcttgc gtgagagcag ccttgcctcc 3960
ccctaatggc ccataatata aataaaagcc agtctgtttg gattaagcaa gtgtatgttc 4020
tttatttaac tctccgcgcg cggtaagccc gggaccagcg gtctcggtcg tttagggtgc 4080
ggtggattct ttccaacacg tggtacaggt ggctctggat gtttagatac atgggcatga 4140
gtccatccct ggggtggagg tagcaccact gcagagcttc gtgctcgggg gtggtgttgt 4200
atatgatcca gtcgtagcag gagcgctggg cgtggtgctg aaaaatgtcc ttaagcaaga 4260
ggcttatagc tagggggagg cccttggtgt aagtgtttac aaatctgctc agttgggagg 4320
ggtgcatccg gggggatata atgtgcatct tggactggat ttttaggttg gctatgttcc 4380
cacccagatc ccttctggga ttcatgttgt gcaggaccac cagcacggta tatccagtgc 4440
acttgggaaa tttatcgtgg agcttagacg ggaatgcatg gaagaacttg gagacgccct 4500
tgtggcctcc cagattttcc atacattcgt ccatgatgat ggcaatgggc ccgtgggaag 4560
ctgcctgagc aaaaatgttt ctgggatcgc tcacatcgta gttatgttcc agggtgaggt 4620
catcatagga catctttacg aatcgggggc ggagggtccc ggactggggg atgatggtac 4680
cctcgggccc cggggcgtag ttcccctcac agatctgcat ctcccaggct ttcatttcag 4740
agggagggat catatccacc tgcggagcga tgaaaaacac agtttctggc gcaggggaga 4800
ttaactggga tgagagcagg tttctgagca gctgtgactt tccacagccg gtgggcccat 4860
atatcacgcc tatcaccggc tgcagctggt agttaagaga gctgcagctg ccgtcctccc 4920
ggagcagggg ggccacctcg ttcagcatat ccctgacgtg gatgttctcc ctgaccaatt 4980
ccgccagaag gcgctcgccg cccagcgaaa gcagctcttg caaggaagca aaatttttca 5040
gcggttttag gccgtcggcc gtgggcatgt ttttcagcgt ctgggtcagc agttccagcc 5100
tgtcccacag ctcggtgatg tgctctacgg catctcgatc cagcagatct cctcgtttcg 5160
cgggttgggg cggctttcgc tgtagggcac cagccgatgg gcgtccagcg gggccagagt 5220
catgtccttc catgggcgca gggtcctcgt cagggtggtc tgggtcacgg tgaaggggtg 5280
cgctccgggt tgggcgctgg ccagggtgcg cttgaggctg gttctgctgg tgctgaatcg 5340
ctgccgctct tcgccctgcg cgtcggccag gtagcatttg accatggtct cgtagtcgag 5400
accctcggcg gcgtgcccct tggcgcggag ctttcccttg gaggtggcgc cgcacgaggg 5460
gcactgcagg ctcttcaggg cgtagagctt gggagcgaga aacacggact ctggggagta 5520
ggcgtccgcg ccgcaggaag cgcagaccgt ctcgcattcc accagccaag tgagctccgg 5580
gcggtcaggg tcaaaaacca ggttgccccc atgctttttg atgcgtttct tacctcggct 5640
ctccatgagg cggtgtccct tctcggtgac gaagaggctg tccgtgtccc cgtagaccga 5700
cttcaggggc ctgtcttcca gcggagtgcc tctgtcctcc tcgtagagaa actctgacca 5760
ctctgagacg aaggcccgcg tccaggccag gacgaaggag gccacgtggg aggggtagcg 5820
gtcgttgtcc actagcgggt ccaccttctc cagggtgtgc aggcacatgt ccccctcctc 5880
cgcgtccaga aaagtgattg gcttgtaggt gtaggacacg tgaccggggg ttcccgacgg 5940
gggggtataa aagggggtgg gcgccctttc atcttcactc tcttccgcat cgctgtctgc 6000
gagggccagc tgctggggta agtattccct ctcgaaggcg ggcatgacct cagcgctcag 6060
gttgtcagtt tctaaaaatg aggaggattt gatgttcacc tgtccggagg tgataccttt 6120
gagggtacct gggtccatct ggtcagaaaa cactattttt ttgttgtcaa gcttggtggc 6180
gaacgacccg tagagggcgt tggagagcag cttggcgatg gagcgcaggg tctggttttt 6240
gtcgcggtcg gctcgctcct tggccgcgat gttgagttgc acgtactcgc gggccacgca 6300
cttccactcg gggaagacgg tggtgcgctc gtctgggatt aggcgcaccc tccagcctcg 6360
gttgtgcagg gtgaccatgt cgacgctggt ggcgacctcg ccgcgcaggc gctcgttggt 6420
ccagcagagg cggccgccct tgcgcgagca gaaggggggt agggggtcca gctggtcctc 6480
gtttgggggg tccgcgtcga tggtgaagac cccggggagc aagcgcgggt caaagtagtc 6540
gatcttgcaa gcttgcatgt ccagagcccg ctgccattcg cgggcggcga gcgcgcgctc 6600
gtaggggttg aggggcgggc cccagggcat ggggtgggtg agcgcggagg cgtacatgcc 6660
gcagatgtca tacacgtaca ggggttccct gaggatgccg aggtaggtgg ggtagcagcg 6720
ccccccgcgg atgctggcgc gcacgtagtc atagagctcg tgggaggggg ccagcatgtt 6780
gggcccgagg ttggtgcgct gggggcgctc ggcgcggaag gcgatctgcc tgaagatggc 6840
atgggagttg gaggagatgg tgggccgctg gaagacgttg aagcttgctt cttgcaagcc 6900
caccgagtcc ctgacgaagg aggcgtagga ctcgcgcagc ttgtgcacca gctcggcggt 6960
gacctggacg tcgagcgcgc agtagtcgag ggtctcgcgg atgatgtcat acttatcctc 7020
ccccttcttt ttccacagct cgcggttgag gacgaactct tcgcggtctt tccagtactc 7080
ttggagggga aacccgtccg tgtccgaacg gtaagagcct agcatgtaga actggttgac 7140
ggcctggtag gggcaacagc ccttctccac gggcagcgcg taggcctgcg ccgccttgcg 7200
gagggaggtg tgggtgaggg cgaaagtgtc cctgaccatg actttgaggt attgatgttt 7260
gaagtctgtg tcatcgcagc cgccctgttc ccacagggtg tagtccgtgc gctttttgga 7320
gcgcgggttg ggcagggaga aggtgaggtc attgaagagg atcttccccg ctcgaggcat 7380
gaagtttctg gtgatgcgaa agggccctgg gaccgaggag cggttgttga tgacctgggc 7440
ggccaggacg atctcgtcaa agccgtttat gttgtggccc acgatgtaga gctccaaaaa 7500
gcggggctgg cccttgatgg aggggagctt tttgagttcc tcgtaggtga gctcctcggg 7560
cgattccagg ccgtgctcct ccagggccca gtcttgcaag tgagggttgg ccgccaggaa 7620
ggatcgccag aggtcgcggg ccatgagggt ctgcaggcgg tcgcggaagg ttctgaactg 7680
tcgccccacg gccatctttt cgggggtgat gcagtagaag gtgagggggt ctttctccca 7740
ggggtcccat ctgagctctc gggcgaggtc gcgcgcggcg gcgaccagag cctcgtcgcc 7800
ccccagtttc atgaccagca tgaagggcac gagctgcttg ccaaaggctc ccatccaagt 7860
gtaggtctct acatcgtagg tgacaaagag gcgctccgtg cgaggatgag agccgatcgg 7920
gaagaactgg atctcccgcc accagttgga ggattggctg ttgatgtggt gaaagtagaa 7980
gtcccgtctg cgggccgagc actcgtgctg gcttttgtaa aagcgaccgc agtactggca 8040
gcgctgcacg ggttgtatat cttgcacgag gtgaacctgg cgacctctga cgaggaagcg 8100
cagcgggaat ctaagtcccc cgcctggggt cccgtgtggc tggtggtctt ctactttggt 8160
tgtctggccg ccagcatctg tctcctggag ggcgatggtg gagcagacca ccacgccgcg 8220
agagccgcag gtccagatct cggcgctcgg cgggcggagt ttgatgacga catcgcgcac 8280
attggagctg tccatggtct ccagctcccg cggcggcagg tcagctggga gttcctggag 8340
gttcacctcg cagagacggg tcaaggcgcg ggcagtgttg agatggtatc tgatttcaag 8400
gggcgtgttg gcggcggagt cgatggcttg caggaggccg cagccccggg gggccacgat 8460
ggttccccgc ggggcgcgag gggaggcgga agctgggggt gtgttcagaa gcggtgacgc 8520
gggcgggccc ccggaggtag ggggggttcc ggccccacag gcatgggcgg caggggcacg 8580
tcttcgccgc gcgcgggcag gggctggtgc tggctccgaa gagcgcttgc gtgcgcgacg 8640
acgcgacggt tggtgtcctg tatctgacgc ctctgagtga agaccacggg tcccgtgacc 8700
ttgaacctga aagagagttc gacagaatca atctcggcat cgttgacagc ggcctggcgc 8760
aggatctcct gcacgtcgcc cgagttgtcc tggtaggcga tctctgccat gaactgctcg 8820
atctcttctt cctggagatc tcctcgtccg gcgcgctcca cggtggccgc caggtcgttg 8880
gagatgcgac ccatgagctg tgagaaggcg ttgagcccgc cctcgttcca gacccggctg 8940
tagaccacgc ccccctcggc gtcgcgagcg cgcatgacca cctgggccag gttgagctcc 9000
acgtgtcgcg tgaagacggc gtagttgcgc aggcgctgga aaaggtagtt cagggtggtg 9060
gcggtgtgct cggcgacgaa gaagtacatg acccagcgcc gcaacgtgga ttcattgatg 9120
tcccccaagg cctccaggcg ctccatggcc tcgtagaagt ccacggcgaa gttgaaaaac 9180
tgggagttgc gagcggacac ggtcaactcc tcctccagaa gacggatgag ctcggcgaca 9240
gtgttgcgca cctcgcgctc gaaggccacg gggggcgctt cttcctcttc cacctcttct 9300
tccatgatcg cttcttcttc ttcctcagcc gggacgggag ggggcggcgg cggcggggga 9360
ggggcgcggc ggcggcggcg gcgcaccggg aggcggtcga tgaagcgctc gatcatctcc 9420
ccccgcatgc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg gcgcagctcg 9480
aagacgccgc ctctcatctc gccgcggggc gagcggccgt gaggtagcga gacggcgctg 9540
actatgcatc ttaacaattg ctgtgtaggt acaccgccga gggacctgat tgagtccaga 9600
tccaccggat ccgaaaacct ttggaggaaa gcgtctatcc agtcgcagtc gcaaggtagg 9660
ctgagcaccg tggcgggcgg gggcgggtct ggagagttcc tggcggagat gctgctgatg 9720
atgtaattaa agtaggcggt cttgagaagg cggatggtgg acaggagcac catgtctttg 9780
ggtccggcct gttggatgcg gaggcggtcg gccatgcccc aggcctcgtt ctgacaccgg 9840
cgcaggtctt tgtagtagtc ttgcatgagt ctttccaccg gcacctcttc tccttcctct 9900
tctccatctc gccggtggtt tctcgcgccg cccatgcgcg tgaccccaaa gcccctgagc 9960
ggctgcagca gggccaggtc ggcgaccacg cgctcggcca agatggcctg ctgcacctga 10020
gtgagggtcc tctcgaagtc atccatgtcc acgaagcggt ggtaggcgcc cgtgttgatg 10080
gtgtaggtgc agttggccat gacggaccag ttgacggtct ggtgtcccgg ctgcgagagc 10140
tccgtgtacc gcaggcgcga gaaggcgcgg gaatcgaaca cgtagtcgtt gcaagtccgc 10200
accagatact ggtagcccac caggaagtgc ggcggaggtt ggcgatagag gggccagcgc 10260
tgggtggcgg gggcgccggg cgccaggtct tccagcatga ggcggtggta tccgtagatg 10320
tacctggaca tccaggtgat gccggcggcg gtggtggtgg cgcgcgcgta gtcgcggacc 10380
cggttccaga tgtttcgcag gggcgagaag tgttccatgg tcggcacgct ctggccggtg 10440
aggcgcgcgc agtcgttgac gctctataca cacacaaaaa cgaaagcgtt tacagggctt 10500
tcgttctgta gcctggagga aagtaaatgg gttgggttgc ggtgtgcccc ggttcgagac 10560
caagctgagc tcggccggct gaagccgcag ctaacgtggt attggcagtc ccgtctcgac 10620
ccaggccctg tatcctccag gatacggtcg agagcccttt tgctttcttg gccaagcgcc 10680
cgtggcgcga tctgggatag atggtcgcga tgagaggaca aaagcggctc gcttccgtag 10740
tctggagaaa caatcgccag ggttgcgttg cggcgtaccc cggttcgagc ccctatggcg 10800
gcttgaatcg gccggaaccg cggctaacga gggccgtggc agccccgtcc tcaggacccc 10860
gccagccgac ttctccagtt acgggagcga gccccttttg ttttttattt tttagatgca 10920
tcccgtgctg cggcagatgc gcccctcgcc ccggcccgat cagcagcagc aacagcaggc 10980
atgcagaccc ccctctcccc tttccgcccc ggtcaccacg gccgcggcgg ccgtgtcggg 11040
cgcggggggc gcgctggagt cagatgagcc accgcggcgg cgacctaggc agtatctgga 11100
cttggaagag ggcgagggac tggcgcggct gggggcgaac tctccagagc gccacccgcg 11160
ggtgcagttg aaaagggacg cgcgcgaggc gtacctgccg cggcagaacc tgtttcgcga 11220
ccgcgggggc gaggagcccg aggagatgcg agactgcagg ttccaagcgg ggcgcgagct 11280
gcggcgcggg ctggacagac agcgcctgct gcgcgaggag gactttgagc ccgacacgca 11340
gacgggcatc agccccgcgc gcgcgcacgt agccgcggcc gacctggtga ccgcctacga 11400
gcagacggta aaccaggagc gcaacttcca aaagagcttc aacaaccacg tgcgcacgct 11460
ggtggcgcgc gaggaggtga ccctgggtct catgcatctg tgggacctgg tggaggcgat 11520
cgtgcagaac cccagcagca agcccctgac cgcgcagctg ttcctggtgg tgcagcacag 11580
cagggacaac gaggccttca gggaggcgct gctgaacatc accgagccgg aggggcgctg 11640
gctcctggac ctgataaaca tcctgcagag catagtggtg caggagcgca gcctgagcct 11700
ggccgagaag gtggcggcca tcaactactc tatgctgagc ctgggcaagt tctacgcccg 11760
caagatctac aagaccccct acgtgcccat agacaaggag gtgaagatag acagcttcta 11820
catgcgcatg gcgctgaagg tgctgaccct gagcgacgac ctgggagtgt accgcaacga 11880
gcgcatccac aaggccgtga gcgccagccg gcggcgcgag ctgagcgacc gcgagctgat 11940
gcacagtctg cagcgcgcgc tgaccggcgc gggcgagggc gacagggagg tcgagtccta 12000
cttcgacatg ggggccgacc tgcactggca gccgagccgc cgcgccctgg aggcggcggg 12060
ggcgtacggc ggccccctgg cggccgatga ccaggaagag gaggactatg agctagagga 12120
gggcgagtac ctggaggact gacctggctg gtggtgtttt ggtatagatg caagatccga 12180
acgtggcgga cccggcggtc cgggcggcgc tgcaaagcca gccgtccggc attaactcct 12240
ctgacgactg ggccgcggcc atgggtcgca tcatggccct gaccgcgcgc aaccccgagg 12300
ctttcaggca gcagcctcag gccaaccggc tggcggccat cttggaagcg gtagtgcccg 12360
cgcgctccaa ccccacccac gagaaggtgc tggccatagt caacgcgctg gcggagagca 12420
gggccatccg cgcggacgag gccggactgg tgtacgatgc gctgctgcag cgggtggcgc 12480
ggtacaacag cggcaacgtg cagaccaacc tggaccgcct ggtgacggac gtgcgcgagg 12540
ccgtggcgca gcgcgagcgc ttgcatcagg acggtaacct gggctcgctg gtggcgctaa 12600
acgccttcct cagcacccag ccggccaacg taccgcgggg gcaggaggac tacaccaact 12660
ttttgagcgc gctgcggctg atggtgaccg aggtccctca gagcgaggtg taccagtcgg 12720
ggcccgacta cttcttccag accagcagac agggcttgca aaccgtgaac ctgagccagg 12780
ctttcaagaa cctgcggggg ctgtggggag tgaaggcgcc caccggcgac cgggctacgg 12840
tgtccagcct gctaaccccc aactcgcgcc tgctgctgct gctgatcgcg cccttcacgg 12900
acagcgggag cgtctcgcgg gagacctatc tgggccacct gctgacgctg taccgcgagg 12960
ccatcgggca ggcgcaggtg gacgagcaca ccttccaaga gatcaccagc gtgagccacg 13020
cgctggggca ggaggacacg ggcagcctgc aggcgaccct gaactacctg ctgaccaaca 13080
ggcggcagaa gattcccacg ctgcacagcc tgacccagga ggaggagcgc atcttgcgct 13140
acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg cgtgacgccc agcgtggcgc 13200
tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc ctcccaccgg ccgtttatca 13260
accgcctgat ggactacttg catcgggcgg cggccgtgaa ccccgagtac ttcactaatg 13320
ccattctgaa tccccactgg atgccccctc cgggtttcta caacggggac tttgaggtgc 13380
ccgaggtcaa cgacgggttc ctctgggatg acatggatga cagtgtgttc tcacccaacc 13440
cgctgcgcgc cgcgtctctg cgattgaagg agggctctga cagggaagga ccgaggagtc 13500
tggcctcctc cctggctctg ggagcggtgg gcgccacggg cgcggcggcg cggggcagta 13560
gccccttccc cagcctggca gactctctga acagcgggcg ggtgagcagg ccccgcttgc 13620
taggcgagga ggagtatctg aacaactccc tgctgcagcc cgcgagggac aagaacgctc 13680
agcggcagca gtttcccaac aatgggatag agagcctggt ggacaagatg tccagatgga 13740
agacgtatgc gcaggagtac aaggagtggg aggaccgcca gccgcggccc ttgccgcccc 13800
ctaggcagcg ctggcagcgg cgcgcgtcca accgccgctg gaggcagggg cccgaggacg 13860
atgatgactc tgcagatgac agcagcgtgt tggacctggg cgggagcggg aacccctttt 13920
cgcacctgcg cccacgcctg ggcaagatgt tttaaaagaa aaaaaaaata aaactcacca 13980
aggccatggc gacgagcgtt ggttttttgt tcccttcctt agtatgcggc gcgcggcgat 14040
gttcgaggag gggcctcccc cctcttacga gagcgcgatg gggatttctc ctgcggcgcc 14100
cctgcagcct ccctacgtgc ctcctcggta cctgcaacct acagggggga gaaatagcat 14160
ctgttactct gagctgcagc ccctgtacga taccaccaga ctgtacctgg tggacaacaa 14220
gtccgcggac gtggcctccc tgaactacca gaacgaccac agcgattttt tgaccacggt 14280
gatccaaaac aacgacttca ccccaaccga ggccagcacc cagaccataa acctggataa 14340
caggtcgaac tggggcggcg acctgaagac catcttgcac accaacatgc ccaacgtgaa 14400
cgagttcatg ttcaccaact cttttaaggc gcgggtgatg gtggcgcgcg agcaggggga 14460
ggcgaagtac gagtgggtgg acttcacgct gcccgagggc aactactcag agaccatgac 14520
tctcgacctg atgaacaatg cgatcgtgga acactatctg aaagtgggca ggcagaacgg 14580
ggtgaaggaa agcgatatcg gggtcaagtt tgacaccaga aacttccgtc tgggctggga 14640
ccccgtgacc gggctggtca tgccgggggt ctacaccaac gaggcctttc atcccgacat 14700
agtgcttctg cccggctgtg gggtggactt cacccagagc cggctgagca acctgctggg 14760
cattcgcaag cggcagcctt tccaggaggg tttcaagatc acctatgagg atctgaaggg 14820
gggcaacatt cccgcgctcc ttgatctgga cgcctacgag gagagcttga aacccgagga 14880
gagcgctggc gacagcggcg agagtggcga ggagcaagcc ggcggcggtg gcggcgcgtc 14940
ggtagaaaac gaaagtacgc ccgcagtggc ggcggacgct gcggaggtcg agccggaggc 15000
catgcagcag gacgcagagg agggcgcaca ggagggcgcg cagaaggaca tgaacgatgg 15060
ggagatcagg ggagacacat tcgccacccg gggcgaagaa aaagaggcag aggcggcggc 15120
ggcggcgacg gcggaggccg aaaccgaggt tgaggcagag gcagagcccg agaccgaagt 15180
tatggaagac atgaatgatg gagaacgtag gggcgacacg ttcgccaccc ggggcgaaga 15240
gaaggcggcg gaggcagaag ccgcggctga ggaggcggct gcggctgcgg ccaagactga 15300
ggctgcggct aaggctgagg tcgaagccaa tgttgcggtt gaggctcagg ctgaggagga 15360
ggcggcggct gaagcagtta aggaaaaggc ccaggcagag caggaagaga aaaaacctgt 15420
cattcaacct ctaaaagaag atagcaaaaa gcgcagttac aacgtcatcg agggcagcac 15480
ctttacccag taccgcagct ggtacctggc gtacaactac ggcgacccgg tcaagggggt 15540
gcgctcgtgg accctgctct gcacgccgga cgtcacctgc ggctccgagc agatgtactg 15600
gtcgctgccg aacatgatgc aagacccggt gaccttccgc tccacgcggc aggttagcaa 15660
cttcccggtg gtgggcgccg aactgctgcc cgtgcactcc aagagttttt acaacgagca 15720
ggccgtctac tcccagctga tccgccaggc cacctctctg acccacgtgt tcaatcgctt 15780
tcccgagaac cagattttgg cgcgcccgcc ggcccccacc atcaccaccg tgagtgaaaa 15840
cgttcctgcc ctcacagatc acgggacgct accgctgcgc aacagcatct caggagtcca 15900
gcgagtgacc attactgacg ccagacgccg gacctgcccc tacgtttaca aggccttggg 15960
catagtctcg ccgcgcgtcc tctccagtcg cactttttaa aacacatcta cccacacgtt 16020
ccaaaatcat gtccgtactc atctcaccca gcaacaacac cggctggggg ctgcgcgcgc 16080
ccagcaagat gtttggaggg gcgaggaagc gctccgacca gcaccctgtg cgcgtgcgcg 16140
gccactaccg cgcgccctgg ggagcgcaca agcgcgggcg cacagggcgc accactgtgg 16200
acgacgtcat tgactccgta gtggagcaag cgcgccacta cacacccggc gcgccgaccg 16260
cccccgccgt gtccaccgtg gaccaggcga tcgaaagcgt ggtacagggc gcgcggcact 16320
atgccaacct taaaagtcgc cgccgccgcg tggcccgccg ccatcgccgg agaccccggg 16380
ccaccgccgc cgcgcgcctt actaaggctc tgctcaggcg cgccaggcga actggccacc 16440
gggccgccat gagggccgca cggcgggctg ccgctgccgc aagcgtcgtg gccccgcggg 16500
cacgaaggcg cgcggccgct gccgccgccg ccgccatttc cagcttggcc tcgacgcggc 16560
gcggtaacat atactgggtg cgcgactcgg taaccggcac gcgggtaccc gtgcgctttc 16620
gccccccgcg gaattagcac aagacaacat acacactgag tctcctgctg ttgtgtatcc 16680
cagcggcgac cgtcagcagc ggcgacatgt ccaagcgcaa aattaaagaa gagatgctcc 16740
aggtcatcgc gccggagatc tatgggcccc cgaagaagga ggaggatgat tacaagcccc 16800
gcaagctaaa gcgggtcaaa aagaaaaaga aagatgatga tgacgaggcg gtggagtttg 16860
tccgccgcat ggcacccagg cgccccgtgc agtggaaggg ccggcgcgtg cagcgcgttt 16920
tgcgccccgg caccgcggtg gtcttcacgc ccggcgagcg ctccacgcgc actttcaagc 16980
gggtgtacga tgaggtgtac ggcgacgagg acctgttgga gcaggccaac cagcgctttg 17040
gggagtttgc atatgggaaa cggccccgcg agagtctaaa agaggacctg ctggcgctac 17100
cgctggacga gggcaatccc accccgagtc tgaagccggt aaccctgcaa caggtgctgc 17160
ctttgagcgc gcccagcgag cataagcgag ggttgaagcg cgaaggcggg gacctggcgc 17220
ccaccgtgca gttgatggtg cccaagcggc agaagctgga ggacgtgctg gagaaaatga 17280
aagtagagcc cgggatccag cccgagatca aggtccgccc catcaagcag gtggcgcccg 17340
gcgtgggagt ccagaccgtg gacgttagga ttcccacgga ggagatggaa acccaaaccg 17400
ccactccctc ttcggcggcc agcgccacca ccggcaccgc ttcggtagag gtgcagacgg 17460
acccctggct acccgccacc gctgttgccg ccgccgcccc ccgttcgcgc gggcgcaaga 17520
gaaattatcc agcggccagc gcgctcatgc cccagtacgc actgcatcca tccatcgtgc 17580
ccacccccgg ctaccgcggg tactcgtacc gcccgcgcag atcagccggc actcgcggcc 17640
gccgccgccg tgcgaccaca accagccgcc gccgtcgccg ccgccgccag ccagtgctga 17700
cccccgtgtc tgtaaggaag gtggctcgct cggggagcac gctggtggtg cccagagcgc 17760
gctaccaccc cagcatcgtt taaagccggt ctctgtatgg ttcttgcaga tatggccctc 17820
acttgtcgcc tccgcttccc ggtgccggga taccgaggaa gaactcaccg ccgcagaggc 17880
atggcgggca gcggtctccg cggcggccgt cgccatcgcc ggcgcgcaaa aagcaggcgc 17940
atgcgcggcg gtgtgctgcc tctgctaatc ccgctaatcg ccgcggcgat cggtgccgta 18000
cccgggatcg cctccgtggc cctgcaggcg tcccagaaac gttgactctt gcaaccttgc 18060
aagcttgcat tttttggagg aaaaataaaa aaaagtctag actctcacgc tcgcttggtc 18120
ctgtgactat tttgtagaaa aaaagatgga agacatcaac tttgcgtcgc tggccccgcg 18180
tcacggctcg cgcccgttca tgggagactg gacagatatc ggcaccagca atatgagcgg 18240
tggcgccttc agctggggca gtctgtggag cggccttaaa aattttggtt ccaccattaa 18300
gaactatggc aacaaagcgt ggaacagcag cacgggccag atgctgagag acaagttgaa 18360
agagcagaac ttccaggaga aggtggcgca gggcctggcc tctggcatca gcggggtggt 18420
ggacatagct aaccaggccg tgcagaaaaa gataaacagt catctggacc cccgtcctca 18480
ggtggaggaa atgcctccag cgatggagac ggtgtctccc gagggcaaag gcgaaaagcg 18540
cccgcggccc gacagagaag agaccctggt gtcacacacc gaggagccgc cctcttacga 18600
ggaggcagtc aaggccggcc tgcccaccac tcgccccata gcccccatgg ccaccggtgt 18660
ggtgggccac aggcaacaca ctcccgcaac actagatctg cccccgccgt ccgagccgcc 18720
gcgccagcca aaggcggcga cggtgcccgc tccctccact tccgccgcca acagagtgcc 18780
cctgcgccgc gccgcgagcg gcccccgggc ctcgcgagtt agcggcaact ggcagagcac 18840
actgaacagc atcgtgggcc tgggagtgag gagtgtgaag cgccgccgtt gctactgaat 18900
gagcaagcta gctaacgtgt tgtatgtgtg tatgcgtcct atgtcgccgc cagaggagct 18960
gttgagccgc cggcgccgtc tgcactccag cgaatttcaa gatggcgacc ccatcgatga 19020
tgcctcagtg gtcgtacatg cacatctcgg gccaggacgc ttcggagtac ctgagccccg 19080
ggctggtgca gttcgcccgc gccacagaca cctacttcaa catgagtaac aagttcagga 19140
accccactgt ggcgcccacc cacgatgtga ccacggaccg gtcgcagcgc ctgacgctgc 19200
ggttcatccc cgtggatcgg gaggacaccg cctactctta caaggcgcgg ttcacgctgg 19260
ccgtgggcga caaccgcgtg ctggacatgg cctccactta ctttgacatc aggggggtgc 19320
tggacagggg ccccaccttc aagccctact cgggtactgc ctacaactcc ctggccccca 19380
agggcgctcc caattcttgc gagtgggaac aagatgaacc agctcaggca gcaatagctg 19440
aagatgaaga agaacttgaa gaagaacaag ctcaggacga acaggcgccc actaagaaaa 19500
cccatgtata cgcccaggca cctctttctg gtgaaaaaat tactaaggat ggtttgcaaa 19560
taggtgtgga tgccacacag gcgggagata accctatata tgctgataaa acattccaac 19620
ccgaacctca gataggtgag tctcagtgga acgaggctga tgccacagta gcaggaggca 19680
gagtcttaaa aaagaccacc cctatgagac cttgctatgg atcctatgcc aaacctacta 19740
atgccaatgg cggtcaaggg atcatggtgg ccaatgatca gggagcgctt gaatctaaag 19800
ttgagatgca atttttctcc accacaacgt ctcttaatgt aagggaaggt gaaaacaatc 19860
ttcagccaaa agtagtgcta tacagcgaag atgttaactt ggaatcccct gacactcatt 19920
tgtcttacaa acctaaaaag gatgacacca actctaaaat catgttgggt cagcaagcca 19980
tgcccaacag acccaacctc attgctttta gggacaactt tattggactt atgtactaca 20040
acagcacagg caacatggga gtgctggcag gacaggcctc ccagctaaac gctgtggtag 20100
acttgcaaga cagaaacaca gagctgtcat accaactgat gcttgattcc attggagaca 20160
gatcaagata cttttccatg tggaaccagg cagtggacag ctatgaccca gatgtcagaa 20220
tcattgaaaa ccatggggtt gaagatgagc tgcccaacta ttgctttccc ctgggcggta 20280
ttggaattac agacacatac cagtgcataa aaccaaccgc agctgctaat aacactacat 20340
ggtctaagga tgaagaattt agtgatcgca atgaaatagg ggtgggaaac aacttcgcca 20400
tggagatcaa catccaggcc aacctctgga ggaacttcct ctatgcgaac gtggggctct 20460
acctgccaga caagctcaag tacaacccca ccaacgtgga catctctgac aaccccaaca 20520
cctatgacta catgaacaag cgtgtggtgg ctcccggcct ggtggactgc tttgtcaatg 20580
tgggagccag gtggtccctg gactacatgg acaacgtcaa ccccttcaac caccaccgca 20640
atgcgggtct gcgctaccgc tccatgatcc tgggcaacgg gcgctacgtg cccttccaca 20700
ttcaggtgcc ccagaagttc tttgccatca agaacctcct cctcctgccg ggctcctaca 20760
cttacgagtg gaacttcagg aaggatgtca acatggtcct gcagagctct ctgggcaatg 20820
accttagggt ggacggggcc agcatcaagt ttgacagcgt caccctctat gctaccttct 20880
tccccatggc tcacaacacc gcctccacgc tcgaggccat gctgaggaac gacaccaacg 20940
accagtcctt caatgactac ctctctgggg ccaacatgct ctaccccatc cccgccaagg 21000
ccaccaacgt gcccatctcc attccctctc gcaactgggc cgccttcaga ggctgggcct 21060
ttacccgcct taagaccaag gaaaccccct ccctgggctc gggttttgac ccctactttg 21120
tctactcggg atccatcccc tacctggatg gcaccttcta cctcaaccac acttttaaga 21180
agatatccat catgtatgac tcctccgtca gctggccggg caatgaccgc ctgctcaccc 21240
ccaatgagtt cgaggtcaag cgcgccgtgg acggcgaggg ctacaacgtg gcccagtgca 21300
acatgaccaa ggactggttc ctggtgcaga tgctggccaa ctacaacata ggctaccagg 21360
gcttctacat cccagagagc tacaaggaca ggatgtactc cttcttcaga aatttccaac 21420
ccatgagcag gcaggtggtg gacgagacca aatacaagga ctatcaggcc attggcatca 21480
ctcaccagca caacaactcg ggattcgtgg gctacctggc tcccaccatg cgcgaggggc 21540
aggcctaccc cgccaacttc ccctacccgt tgataggcaa aaccgcggtc gacagcgtca 21600
cccagaaaaa gttcctctgc gaccgcaccc tctggcgcat ccccttctct agcaacttca 21660
tgtccatggg tgcgctcacg gacctgggcc agaacctgct ctatgccaac tccgcccatg 21720
cgctggacat gacttttgag gtggacccca tggacgagcc cacccttctc tatattgtgt 21780
ttgaagtgtt cgacgtggtc agagtgcacc agccgcaccg cggtgtcatc gagaccgtgt 21840
acctgcgcac gcccttctcg gccggcaacg ccaccaccta aggagacagc gccgccgcct 21900
gcatgacggg ttccaccgag caagagctca gggccatcgc cagagacctg ggatgcggac 21960
cctatttttt gggcacctat gacaaacgct tcccgggctt catctcccga gacaagctcg 22020
cctgcgccat cgtcaacacg gccgcgcgcg agaccggggg cgtgcactgg ctggcctttg 22080
gctgggaccc gcgctccaaa acctgctacc tcttcgaccc ctttggcttc tccgatcagc 22140
gcctcagaca gatctatgag tttgagtacg aggggctgct gcgccgcagc gcgcttgcct 22200
cctcgcccga ccgctgcatc acccttgaga agtccaccga gaccgtgcag gggccccact 22260
cggccgcctg cggtctcttc tgctgcatgt ttttgcacgc ctttgtgcgc tggccccaga 22320
gtcccatgga tcgcaacccc accatgaact tgctcaaggg agtgcccaac gccatgctcc 22380
agagccccca ggtccagccc accctgcgcc acaaccagga acagctctac cgcttcctgg 22440
agcgccactc cccctacttc cgcagtcaca gcgcgcacat ccggggggcc acctctttct 22500
gccacttgca agaaaacatg caagacggaa aatgatgtac agctcgcttt ttaataaatg 22560
taaagactgt gcactttatt tatacacggg ctctttctgg ttatttattc aacaccgccg 22620
tcgccatcta gaaatcgaaa gggttctgcc gcgcgtcgcc gtgcgccacg ggcagagaca 22680
cgttgcgata ctggaagcgg ctcgcccact taaactcggg caccaccatg cggggcagtg 22740
gttcctcggg gaagttctcg ccccacaggg tgcgggtcag ctgcagcgcg ctcaggaggt 22800
cgggagccga gatcttgaag tcgcagttgg ggccggaacc ctgcgcgcgc gagttgcggt 22860
acacggggtt gcagcactgg aacaccagca gggccggatt atgcacgctg gccagcaggc 22920
tctcgtcgct gatcatgtcg ctgtccagat cctccgcgtt gctcagggcg aacggggtca 22980
tcttgcagac ctgcctgccc aggaaaggcg gcagcccggg cttgccgttg cagtcgcagc 23040
gcaggggcat cagcaggtgc ccgcggcccg actgcgcctg cgggtacagc gcgcgcatga 23100
aggcttcgat ctgcctgaaa gccacctgcg tcttggctcc ctccgaaaag aacatcccac 23160
aggacttgct ggagaactgg ttcgcgggac agctggcatc gtgcaggcag cagcgcgcgt 23220
cggtgttggc gatctgcacc acgttgcgac cccaccggtt cttcactatc ttggccttgg 23280
aagcctgctc cttcagcgcg cgctggccgt tctcgctggt cacatccatc tctatcacct 23340
gctccttgtt gatcatgttt gtaccgtgca gacacttcag gtcgccctcc gtctgggtgc 23400
agcggtgctc ccacagcgcg caaccggtgg gctcccaatt tttgtgggtc acccccgcgt 23460
aggcctgcag gtaggcctgc aagaagcgcc ccatcatggc cacaaaggtc ttctggctcg 23520
taaaggtcag ctgcaggccg cgatgctctt cgttcagcca ggtcttgcag atggcggcca 23580
gcgcctcggt ctgctcgggc agcatcctaa aatttgtctt caggtcgtta tccacgtggt 23640
acttgtccat catggcgcgc gccgcctcca tgcccttctc ccaggcggac accatgggca 23700
ggcttagggg gtttatcact tccaccggcg aggacaccgt actttcgatt tcttcttcct 23760
ccccctcttc ccggcgcgcg cccacgctgc tgcgcgctct caccgcctgc accaaggggt 23820
cgtcttcagg caagcgccgc accgagcgct tgccgccctt gacctgctta atcagcaccg 23880
gcgggttgct gaagcccacc atggtcagcg ccgcctgctc ttcttcgtct tcgctgtcta 23940
ccactatctc tggggaaggg cttctccgct ctgcggcggc gcgcttcttt tttttcttgg 24000
gagcggccgt gatggagtcc gccacggcga cggaggtcga gggcgtgggg ctgggggtgc 24060
gcggtaccag ggcctcgtcg ccctcggact cttcctctga ctccaggcgg cggcggagtc 24120
gcttctttgg gggcgcgcgc gtcagcggcg gcggagacgg ggacggggac ggggacggga 24180
cgccctccac agggggtggt cttcgcgcag acccgcggcc gcgctcgggg gtcttctcga 24240
gctggtcttg gtcccgactg gccattgtat cctcctcctc ctaggcagag agacataagg 24300
agtctatcat gcaagtcgag aaggaggaga gcttaaccac cccctctgag accgccgatg 24360
cgcccgccgt cgccgtcgcc cccgctgccg ccgacgcgcc cgccacaccg agcgacaccc 24420
ccgcggaccc ccccgccgac gcacccctgt tcgaggaagc ggccgtggag caggacccgg 24480
gctttgtctc ggcagaggag gatttgcgag aggaggagga taaggagaag aagccctcag 24540
tgccaaaaga tgataaagag caagacgagc acgacgcaga tgcacaccag ggtgaagtcg 24600
ggcgggggga cggagggcat gacggcgccg actacctaga cgaagggaac gacgtgctct 24660
tgaagcacct gcatcgtcag tgcgccattg tttgcgacgc tctgcaggag cgcagcgaag 24720
tgcccctcag cgtggcggag gtcagccacg cctacgagct cagcctcttc tccccccggg 24780
tgcccccccg ccgccgcgaa aacggcacat gcgagcccaa cccgcgcctc aacttctacc 24840
ccgcctttgt ggtacccgag gtcctggcca cctatcacat cttctttcaa aattgcaaga 24900
tccccctctc gtgccgcgcc aaccgtagcc gcgccgataa gatgctggcc ctgcgccagg 24960
gcgaccacat acctgatatc gccgctttgg aagatgtacc aaagatcttc gagggtctgg 25020
gtcgcaacga gaagcgggca gcaaactctc tgcaacagga aaacagcgaa aatgagagtc 25080
acaccggggt actggtggag ctcgagggcg acaacgcccg cctggcggtg gtcaagcgca 25140
gcatcgaggt cacccacttt gcctaccccg cgctaaacct gccccccaaa gtcatgaacg 25200
cggccatgga cgggctgatc atgcgccgcg gccggcccct cgctccagat gcaaacttgc 25260
atgaggagac cgaggacggc cagcccgtgg tcagcgacga gcagctggcg cgctggctgg 25320
agaccgcgga ccccgccgaa ctggaggagc ggcgcaagat gatgatggcc gtggtgctgg 25380
tcaccgtaga gctggagtgt ctgcagcgct tcttcggcga ccccgagatg cagagaaagg 25440
tcgaggagac cctgcactac accttccgcc agggctacgt gcgccaggct tgcaagatct 25500
ccaacgtgga gctcagcaac ctggtgtcct acctgggcat cttgcatgag aaccgcctcg 25560
ggcagagcgt gctgcactcc accctgcgcg gggaggcgcg ccgcgactac gtgcgcgact 25620
gcgtttacct cttcctctgc tacacctggc agacggccat gggggtctgg cagcagtgcc 25680
tggaggagcg caacctcaag gagctggaga agctcctgca gcgcgcgctc aaagatctct 25740
ggacgggcta caacgagcgc tcggtggccg ccgcgctggc cgacctcatc ttccccgagc 25800
gcctgctcaa aaccctccag caggggctgc ccgacttcac cagccaaagc atgttgcaaa 25860
acttcaggaa ctttatcctg gagcgttctg gcatcctacc cgccacctgc tgcgccctgc 25920
ccagcgactt tgtccccctc gtgtaccgcg agtgcccccc gccgctgtgg ggtcactgct 25980
acctgttcca actggccaac tacctgtcct accacgcgga cctcatggag gactccagcg 26040
gcgaggggct catggagtgc cactgccgct gcaacctctg cacgccccac cgctccctgg 26100
tctgcaacac ccaactgctc agcgagagtc agattatcgg taccttcgag ctacagggtc 26160
cgtcctcctc agacgagaag tccgcggctc cggggctaaa actcactccg gggctgtgga 26220
cttccgccta cctgcgcaaa tttgtacctg aagactacca cgcccacgag atcaggtttt 26280
acgaagacca atcccgcccg cccaaggcgg agctgaccgc ctgcgtcatc acccagggcg 26340
agatcctagg ccaattgcaa gccatccaaa aagcccgcca agactttttg ctgaagaagg 26400
gtcggggggt gtatctggac ccccagtcgg gtgaggagct caacccggtt cccccgctgc 26460
cgccgccgcg ggaccttgct tcccaggata agcatcgcca tggctcccag aaagaagcag 26520
cagcggccgc cactgccgcc accccacatg ctggaggaag aggaggaata ctgggacagt 26580
caggcagagg aggtttcgga cgaggaggag ccggagacgg agatggaaga gtgggaggag 26640
gacagcttag acgaggaggc ttccgaagcc gaagaggcag acgcaacacc gtcaccctcg 26700
gccgcagccc cctcgcaggc gcccccgaag tccgctccca gcatcagcag caacagcagc 26760
gctataacct ccgctcctcc accgccgcga cccacggccg accgcagacc caaccgtaga 26820
tgggacacca ccggaaccgg ggccggtaag tcctccggga gaggcaagca agcgcagcgc 26880
caaggctacc gctcgtggcg cgctcacaag aacgccatag tcgcttgctt gcaagactgc 26940
ggggggaaca tctccttcgc ccgccgcttc ctgctcttcc accacggtgt ggccttcccc 27000
cgtaacgtcc tgcattacta ccgtcatctc tacagcccct actgcggcgg cagtgagcca 27060
gagacggtcg gcggcggcgg cggcgcccgt ttcggcgcct aggaagaccc agggcaagac 27120
ttcagccaag aaactcgcgg cggccgcggc gaacgcggtc gcgggggccc tgcgcctgac 27180
ggtgaacgaa cccctgtcga cccgcgaact gaggaaccga atcttcccca ctctctatgc 27240
catcttccag cagagcagag ggcaggatca ggaactgaaa gtaaaaaaca ggtctctgcg 27300
ctccctcacc cgcagctgtc tgtatcacaa gagcgaagac cagcttcggc gcacgctgga 27360
ggacgctgag gcactcttca gcaaatactg cgcgctcact cttaaggact agctccgcgc 27420
ccttctcgaa tttaggcggg aacgcctacg tcatcgcagc gccgccgtca tgagcaagga 27480
cattcccacg ccatacatgt ggagctatca gccgcagatg ggactcgcgg cgggcgcctc 27540
ccaagactac tccacccgca tgaactggct cagtgccggc ccacacatga tctcacaggt 27600
taatgatatc cgcacccatc gaaaccaaat attggtggag caggcggcaa ttaccaccac 27660
gccccgcaat aatcccaacc ccagggagtg gcccgcgtcc ctggtgtatc aggaaattcc 27720
cggccccacc accgtactac ttccgcgtga ttcccaggcc gaagtccaaa tgactaactc 27780
aggggcacag ctcgcgggcg gctgtcgtca cagggtgcgg cctcctcgcc agggtataac 27840
tcacctggag atccgaggca gaggtattca gctcaacgac gagtcggtga gctcctcgct 27900
cggtctcaga cctgacggga ccttccagat agccggagcc ggccgatctt ccttcacgcc 27960
ccgccaggcg tacctgactc tgcaaagctc gtcctcggcg ccgcgctcgg gcggcatcgg 28020
gactctccag ttcgtgcagg agtttgtgcc ctcggtctac ttcaacccct tctcgggctc 28080
tcccggtcgc tacccggacc agttcatctc gaactttgac gccgcgaggg actcggtgga 28140
cggctacgac tgaatgtcgg gtggacccgg tgcagagcaa cttcgcctga agcacctcga 28200
ccactgccgc cgccctcagt gctttgcccg ctgtcagacc ggtgagttcc agtacttttc 28260
cctgcccgac tcgcacccgg acggcccggc gcacggggtg cgctttttca tcccgagtca 28320
ggtgcgctct accctaatca gggagtttac cgcccgtccc ctactggcgg agttggaaaa 28380
ggggccttct atcctaacca ttgcctgcat ctgctctaac cctggattgc accaagatct 28440
ttgctgtcat ttgtgtgctg agtataataa aggctgagat cagaatctac tcgggctcct 28500
gtcgccatcc tgtcaacgcc accgtccaag cccggcccga tcagcccgag gtgaacctca 28560
cctgcggtct gcaccggcgc ctgaggaaat acctagcttg gtactacaac agcactccct 28620
ttgtggttta caacagcttt gaccaggacg gggtctcact gagggataac ctctcgaacc 28680
tgagctactc catcaggaag aacagcaccc tcgagctact tcctccttac ctgcccggga 28740
cttaccagtg tgtcaccggt ccctgcaccc acacccacct gttgatcgta aacgactctc 28800
ttccgagaac agacctcaat aactcctctt cgcagttccc cagaacagga ggtgagctca 28860
ggaaaccccg ggtaaagaag ggtggacgag agttaacact tgtggggttt ctggtgtatg 28920
tgacgctggt ggtggctctt ttgattaagg cttttccttc catgtctgaa ctctccctct 28980
tcttttatga acaactcgac tagtgctaac gggaccctac ccaacgaatc gggattgaat 29040
atcggtaacc aggttgcagt ttcacttttg attaccttca tagtcctctt cctgctagtg 29100
ctgtcgcttc tgtgcctgcg gatcgggggc tgctgcatcc acgtttatat ctggtgctgg 29160
ctgtttagaa ggttcggaga ccatcgcagg tagaataaac atgctgctgc ttaccctctt 29220
tgtcctggcg ctggccgcca gctgccaagc cttttccgag gctgacttta tagagcccca 29280
gtgtaatgtg acttttaaag cccatgcaca gcgttgtcat actataatca aatgtgccac 29340
cgaacacgat gaatacctta tccagtataa agataaatca cacaaagtgg cacttgttga 29400
catctggaaa cccgaagacc ctttggaata caatgtgacc gttttccagg gtgacctctt 29460
caaaatttac aattacactt tcccatttga ccagatgtgt gactttgtca tgtacatgga 29520
aaagcagcac aagctgtggc ctccgactcc ccagggctgt gtggaaaatc caggctcttt 29580
ctgcatgatc tctctctgtg taactgtgct ggcactaata ctcacgcttt tgtatatcag 29640
atttaaatca aggcaaagct tcattgatga aaagaaaatg ccttaatcgc tttcacgctt 29700
gattgctaac accgggtttt tatccgcaga atgattggaa tcaccctact aatcacctcc 29760
ctccttgcga ttgcccatgg gttggaacga atcgaagtcc ctgtgggggc caatgttacc 29820
ctggtggggc ctgtcggcaa tgctacatta atgtgggaaa aatatactaa aaatcaatgg 29880
gtctcttact gcactaacaa aaatagccac aagcccagag ccatctgcga tgggcaaaat 29940
ctaaccttga ttgatgttca attgctggat gcgggctact attatgggca gctgggtaca 30000
atgattaatt actggagacc ccacagagat tacatgctcc acgtagtaaa gggtcccctt 30060
agcagcccac ccactaccac ctctactacc cccactacca ccactactcc caccaccagc 30120
actgccgccc agcctcctca tagcagaaca accactttta tcaattccaa gtcccactcc 30180
ccccacattg ccggcgggcc ctccgcctca gactccgaaa ccaccgagat ctgcttctgc 30240
aaatgctctg acgccattgc ccaggatttg gaagatcacg aggaagatga gcatgacttc 30300
gcagatgcat gccaggcatc agagccagaa gcgctgccgg tggccctcaa acagtatgca 30360
gacccccaca ccacccccga ccttcctcca ccttcccaga agccaagttt cctgggggaa 30420
aatgaaactc tgcctctctc catactcgct ctgacatctg ttgctatgtt gaccgctctg 30480
ctggtgcttc tatgctctat atgctacctg atctgctgca gaaagaaaaa atctcacggc 30540
catgctcacc agcccctcat gcacttccct taccctccag agctgggcga ccacaaactt 30600
taagtctgca gtaactatct gcccatccct tgtcagtcga cagcgatgag ccccactaat 30660
ctaacggcct ctggacttac aacatcgtct cttaatgaga ccaccgctcc tcaagacctg 30720
tacgatggtg tctccgcgct ggttaaccag tgggatcacc tgggcatatg gtggctcctc 30780
ataggagcag tgaccctgtg cctaatcctg gtctggatca tctgctgcat caaaagcaga 30840
agacccaggc ggcggcccat ctacaggccc tttgtcatca cacctgaaga tgatgatgac 30900
accacttcca ggctgcagag gctaaagcag ctactcttct cttttacagc atggtaaatt 30960
gaatcatgcc tcgcattttc atctacttgt ctctccttcc actttttctg ggctcttcta 31020
cattggccgc tgtgtcccac atcgaggtag actgcctcac gcccttcaca gtctacctgc 31080
ttttcggctt tgtcatctgc acctttgtct gcagcgttat cactgtagtg atctgcttca 31140
tacagtgcat cgactacgtc tgcgtgcggg tggcttactt tagacaccac ccccagtatc 31200
gcaacaggga catagcggct ctcctaagac ttgtttaaaa tcatggccaa attaactgtg 31260
attggtcttc tgatcatctg ctgcgtccta gccgcgattg ggactcaagc tcctaccacc 31320
accagcgctc ccagaaagag acatgtatcc tgcagcttca agcgtccctg gaatataccc 31380
caatgcttta ctgatgaacc tgaaatctct ttggcttggt acttcagcgt caccgccctt 31440
cttatcttct gcagtacggt tattgccctt gccatctacc cttcccttga cctgggctgg 31500
aatgctgtca actctatgga atatcccacc ttcccagaac cagacctgcc agacctggtt 31560
gttctaaacg cgtttcctcc tcctgctccc gttcaaaatc agtttcgccc tccgtccccc 31620
acgcccactg aggtcagcta ctttaatcta acaggcggag atgactgaaa acctagacct 31680
agaaatggac ggtctctgca gcgagcaacg cacactagag aggcgccggc aaaaagagct 31740
cgagcgtctt aaacaagagc tccaagacgc ggtggccata caccagtgca aaaaaggtgt 31800
cttctgtctg gtaaaacagg ccacgctcac ctatgaaaaa acaggtgaca cccaccgcct 31860
aggatacaag ctgcccacac agcgccaaaa gttcgccctc atgataggcg aacaacccat 31920
caccgtgacc cagcactccg tggagacaga aggctgcata catgctccct gtaggggcgc 31980
tgactgcctc tacaccttga tcaaaaccct ctgcggtctc agagacctta tccctttcaa 32040
ttaatcataa ctgtaatcaa taaaaaatca cttacttgaa atctgatagc aagcctctgt 32100
ccaatttttt cagcaacact tccttcccct cctcccaact ctggtactct aggcgcctcc 32160
tagctgcaaa cttcctccac agtctgaagg gaatgtcaga ttcctcctcc tgtccctccg 32220
cacccacgat cttcatgttg ttgcagatga aacgcgcgag atcgtctgac gagaccttca 32280
accccgtgta cccctacgat accgagatcg ctccgacttc tgtccctttc cttacccctc 32340
cctttgtgtc atccgcagga atgcaagaaa atccagctgg ggtgctgtcc ctgcacttgt 32400
cagagcccct taccacccac aatggggccc tgactctaaa aatggggggc ggcctgaccc 32460
tggacaagga agggaatctc acttcccaaa acatcaccag tgtcgatccc cctctcaaaa 32520
aaagcaagaa caacatcagc cttcagaccg ccgcacccct cgccgtcagc tccggggccc 32580
taacactttt tgccactccc cccctagcgg tcagtggtga caaccttact gtgcagtctc 32640
aggcccctct cactttggaa gactcaaaac taactctggc caccaaagga cccctaactg 32700
tgtccgaagg caaacttgtc ctagaaac 32728
<210> 24
<211> 32728
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒载体核苷酸序列
<400> 24
ataatatacc ttattttgga ttgtggccaa tatgataatg aggtgggcgg ggagaggcgg 60
ggcgggtgac gtaggacgcg cgagtagggt tgggaggtgt ggcggaagtg tggcatttgc 120
aagtgggagg agctcacatg caagcttccg tcgcggaaaa tgtgacgttt ttgatgagcg 180
ccgcctacct ccggaagtgc caattttcgc gcgcttttca ccggatatcg tagtaatttt 240
gggcgggacc atgtaagatt tggccatttt cgcgcgaaaa gtgaaacggg gaagtgaaaa 300
ctgaataata gggcgttagt catagcgcgt aatatttacc gagggccgag ggactttgac 360
cgattacgtg gaggactcgc ccaggtgttt tttacgtgaa tttccgcgtt ccgggtcaaa 420
gtctccgttt ttattgtcac cgtcatttga cgcggagggt atttaaaccc gctgcgctcc 480
tcaagaggcc actcttgagt gccagcgaga agagttttct cctctgctcc gcttcggtga 540
tcgaaaaatg agacacatag cctgcactcc gggtcttttg tccggtcggg cggcggccga 600
gcttttggac gctttgatca atgatgtcct aagcgatgat tttccgtcta ctacccactt 660
tagcccacct actcttcacg aactgtacga tctggatgta ctggtggatg tgaacgatcc 720
caacgaggag gcggtttctg cgttttttcc cgagtctgcg ctgttggccg ctcaggaggg 780
atttgaccta cacactccgc cgcctatttt agagtctccg ctgccggagc ccagtggtat 840
accttatatg cctgaactgc ttcccgaagt ggtagacctg acctgccacg agcctggctt 900
tccgcccagc gacgatgagg gtgagccttt tgttttagac tttgctgaga tacctgggca 960
cggttgcagg tcttgtgcat atcatcagag ggttaccgga gaccccgagg ttaagtgttc 1020
gctgtgctat atgaggatga cctcttcctt tatctacagt aagtttttgt ctaggtgggc 1080
ttttgggtag gtgggttttg tgtcagaaca ggtgtaaacg ttgcttgtgt tttttgtacc 1140
tgtaggtccg gtgtccgagc cagacccgga gcccgaccgc gatcccgagc cggatcccga 1200
gcctcctcgc aggacaagga aactaccttc cattctgtgc aagtctcaga cacctgtaag 1260
gaccagcgag gcagacagca ccgactctgg cacttctacc tctccccctg aaattcaccc 1320
agtggttcct ctgggtatac ataaacctgt tgctgttaaa gtttgcgggc gacgccctgc 1380
agtacagtgc attgaggact tgcttcacga tcccgaggaa cctttggact tgagccttaa 1440
acgccctagg caataaaccc cacctaagta ataaacccca cctaagtaat aaaccctgcc 1500
gcccttggtt attgagatga cgcccaatgt ttgcttttga atgacttcat gtgtgtaata 1560
aaagtgagtg tgatcatagg tctcttgttt gtctgggcgg ggcttaaggg tatataagtc 1620
tcttggggct aaacttggtt acacttgacc ccaatggagg cgtgggggtg cttggaggag 1680
tttgcggacg tgcgccgttt gctggacgag agctctagca atacctatac tatttggagg 1740
tatctgtggg gctctactca ggccaagttg gtttccagaa ttaagcagga ttacaagtgc 1800
gattttgaag agctttttag ttcctgcggt gagcttttgc aatccttgaa tctgggccat 1860
caggctattt tccaggaaaa ggttctctcg actttggatt tttccactcc cgggcgcacc 1920
gccgcttgtg tggcttttgt gtcttttgtg caagataaat ggagcgagga gacccacctg 1980
agtcacggct acgtactgga tttcatggcg atggctcttt ggagggctca caacaaatgg 2040
aagattcaga aggaactgta cggttccgcc ctacgtcgtc cacttctgtc gcgacagggg 2100
ctgaggtttc ccgaccatcg gcagcatcag aatctggaag acgagtcgga ggagcgagcg 2160
gaggagaaga tcagcttgag agccggcctg gaccctcctc aggaggaatg aatctcccgc 2220
aggtggttga cctgtttcca gaactgagac gggtcctgac tatcagggag gatggtcagt 2280
ttgtgaagaa gtttaagagg gatcggggtg agggagatga tgaggcggct agcaatttag 2340
cttttagtct gatgactcgc caccgaccgg aatgtattac ctatcagcag attaaggaga 2400
gttgtgccaa cgagctggat cttttgggtc agaagtatag catagaacag cttaccactt 2460
actggcttca gcctggggat gattgggaag aggcgatcag ggtgtatgca aaggtggccc 2520
tgcggcccga ttgcaagtat aagattacta agttggttaa tattagaaac tgctgctata 2580
tttctgggaa cggggccgaa gtggagatag atactcagga cagggtggct tttaggtgtt 2640
gcatgataaa catgtggccc gggatactgg ggatggatgg ggtggtattc atgaatgtga 2700
ggtttacggg ccccaacttt aatggcacgg tgttcatggg caacaccaac ttgctcctgc 2760
atggtgcgag tttctatggg tttaataaca cctgtataga ggcctggacc gatgtaaagg 2820
ttcgaggttg ttccttttat agctgttgga aggcggtggt gtgtcgccct aaaagcaggg 2880
gttctgtgaa aaaatgcttg tttgaaaggt gcaccttagg catcctctct gagggcaact 2940
ccagggtgcg ccataatgtg gcttcgaact gcggttgctt catgcaagtg aagggggtga 3000
gcgttatcaa gcataactcg gtgtgtggaa actgcgagga tcgcgcctcc cagatgctga 3060
cctgctttga tggcaactgt cacctgttga agaccattca tataagcagc caccccagaa 3120
aggcctggcc cgtgtttgag cataacatct tgacccgctg ctccttgcat ctgggggtca 3180
ggaggggtat gttcctgcct taccagtgta actttagcca cactaaaatc ctgctggaac 3240
ccgagtgcat gaccaaggtc agcctgaatg gtgtgtttga tgtgactctg aaaatctgga 3300
aggtgctgag gtatgatgag accaggacca ggtgccgacc ctgcgagtgc ggcggcaagc 3360
acatgagaaa tcagcctgtg atgttggatg tgaccgagga gcttaggcct gaccatctgg 3420
tgctggcctg caccagggcc gagtttgggt ctagcgatga ggataccgat tgaggtgggt 3480
aaggtgggcg tggctagaag ggtggggcgt gtataaattg ggggtctaag ggtctctctg 3540
ttttgtcttg caacagccgc cgccatgagc gacaccggca acagctttga tggaagcatc 3600
tttagcccct atctgacagt gcgcatgcct cactgggctg gagtgcgtca gaatgtgatg 3660
ggttccaacg tggatggacg ccccgttctg ccttcaaatt cgtctacaat ggcctacgcg 3720
accgtgggag gaactccgct ggacgccgcg acctccgccg ccgcctccgc cgccgccgcg 3780
accgcgcgca gcatggctac ggacctttac agctctttgg tggcgagcgg cgcggcctct 3840
cgcgcgtctg ctcgggatga gaaactgacc gctctgctgc ttaaactgga agacttgacc 3900
cgggagctgg gtcaactgac ccagcaggtc tccagcttgc gtgagagcag ccttgcctcc 3960
ccctaatggc ccataatata aataaaagcc agtctgtttg gattaagcaa gtgtatgttc 4020
tttatttaac tctccgcgcg cggtaagccc gggaccagcg gtctcggtcg tttagggtgc 4080
ggtggattct ttccaacacg tggtacaggt ggctctggat gtttagatac atgggcatga 4140
gtccatccct ggggtggagg tagcaccact gcagagcttc gtgctcgggg gtggtgttgt 4200
atatgatcca gtcgtagcag gagcgctggg cgtggtgctg aaaaatgtcc ttaagcaaga 4260
ggcttatagc tagggggagg cccttggtgt aagtgtttac aaatctgctc agttgggagg 4320
ggtgcatccg gggggatata atgtgcatct tggactggat ttttaggttg gctatgttcc 4380
cacccagatc ccttctggga ttcatgttgt gcaggaccac cagcacggta tatccagtgc 4440
acttgggaaa tttatcgtgg agcttagacg ggaatgcatg gaagaacttg gagacgccct 4500
tgtggcctcc cagattttcc atacattcgt ccatgatgat ggcaatgggc ccgtgggaag 4560
ctgcctgagc aaaaatgttt ctgggatcgc tcacatcgta gttatgttcc agggtgaggt 4620
catcatagga catctttacg aatcgggggc ggagggtccc ggactggggg atgatggtac 4680
cctcgggccc cggggcgtag ttcccctcac agatctgcat ctcccaggct ttcatttcag 4740
agggagggat catatccacc tgcggagcga tgaaaaacac agtttctggc gcaggggaga 4800
ttaactggga tgagagcagg tttctgagca gctgtgactt tccacagccg gtgggcccat 4860
atatcacgcc tatcaccggc tgcagctggt agttaagaga gctgcagctg ccgtcctccc 4920
ggagcagggg ggccacctcg ttcagcatat ccctgacgtg gatgttctcc ctgaccaatt 4980
ccgccagaag gcgctcgccg cccagcgaaa gcagctcttg caaggaagca aaatttttca 5040
gcggttttag gccgtcggcc gtgggcatgt ttttcagcgt ctgggtcagc agttccagcc 5100
tgtcccacag ctcggtgatg tgctctacgg catctcgatc cagcagatct cctcgtttcg 5160
cgggttgggg cggctttcgc tgtagggcac cagccgatgg gcgtccagcg gggccagagt 5220
catgtccttc catgggcgca gggtcctcgt cagggtggtc tgggtcacgg tgaaggggtg 5280
cgctccgggt tgggcgctgg ccagggtgcg cttgaggctg gttctgctgg tgctgaatcg 5340
ctgccgctct tcgccctgcg cgtcggccag gtagcatttg accatggtct cgtagtcgag 5400
accctcggcg gcgtgcccct tggcgcggag ctttcccttg gaggtggcgc cgcacgaggg 5460
gcactgcagg ctcttcaggg cgtagagctt gggagcgaga aacacggact ctggggagta 5520
ggcgtccgcg ccgcaggaag cgcagaccgt ctcgcattcc accagccaag tgagctccgg 5580
gcggtcaggg tcaaaaacca ggttgccccc atgctttttg atgcgtttct tacctcggct 5640
ctccatgagg cggtgtccct tctcggtgac gaagaggctg tccgtgtccc cgtagaccga 5700
cttcaggggc ctgtcttcca gcggagtgcc tctgtcctcc tcgtagagaa actctgacca 5760
ctctgagacg aaggcccgcg tccaggccag gacgaaggag gccacgtggg aggggtagcg 5820
gtcgttgtcc actagcgggt ccaccttctc cagggtgtgc aggcacatgt ccccctcctc 5880
cgcgtccaga aaagtgattg gcttgtaggt gtaggacacg tgaccggggg ttcccgacgg 5940
gggggtataa aagggggtgg gcgccctttc atcttcactc tcttccgcat cgctgtctgc 6000
gagggccagc tgctggggta agtattccct ctcgaaggcg ggcatgacct cagcgctcag 6060
gttgtcagtt tctaaaaatg aggaggattt gatgttcacc tgtccggagg tgataccttt 6120
gagggtacct gggtccatct ggtcagaaaa cactattttt ttgttgtcaa gcttggtggc 6180
gaacgacccg tagagggcgt tggagagcag cttggcgatg gagcgcaggg tctggttttt 6240
gtcgcggtcg gctcgctcct tggccgcgat gttgagttgc acgtactcgc gggccacgca 6300
cttccactcg gggaagacgg tggtgcgctc gtctgggatt aggcgcaccc tccagcctcg 6360
gttgtgcagg gtgaccatgt cgacgctggt ggcgacctcg ccgcgcaggc gctcgttggt 6420
ccagcagagg cggccgccct tgcgcgagca gaaggggggt agggggtcca gctggtcctc 6480
gtttgggggg tccgcgtcga tggtgaagac cccggggagc aagcgcgggt caaagtagtc 6540
gatcttgcaa gcttgcatgt ccagagcccg ctgccattcg cgggcggcga gcgcgcgctc 6600
gtaggggttg aggggcgggc cccagggcat ggggtgggtg agcgcggagg cgtacatgcc 6660
gcagatgtca tacacgtaca ggggttccct gaggatgccg aggtaggtgg ggtagcagcg 6720
ccccccgcgg atgctggcgc gcacgtagtc atagagctcg tgggaggggg ccagcatgtt 6780
gggcccgagg ttggtgcgct gggggcgctc ggcgcggaag gcgatctgcc tgaagatggc 6840
atgggagttg gaggagatgg tgggccgctg gaagacgttg aagcttgctt cttgcaagcc 6900
caccgagtcc ctgacgaagg aggcgtagga ctcgcgcagc ttgtgcacca gctcggcggt 6960
gacctggacg tcgagcgcgc agtagtcgag ggtctcgcgg atgatgtcat acttatcctc 7020
ccccttcttt ttccacagct cgcggttgag gacgaactct tcgcggtctt tccagtactc 7080
ttggagggga aacccgtccg tgtccgaacg gtaagagcct agcatgtaga actggttgac 7140
ggcctggtag gggcaacagc ccttctccac gggcagcgcg taggcctgcg ccgccttgcg 7200
gagggaggtg tgggtgaggg cgaaagtgtc cctgaccatg actttgaggt attgatgttt 7260
gaagtctgtg tcatcgcagc cgccctgttc ccacagggtg tagtccgtgc gctttttgga 7320
gcgcgggttg ggcagggaga aggtgaggtc attgaagagg atcttccccg ctcgaggcat 7380
gaagtttctg gtgatgcgaa agggccctgg gaccgaggag cggttgttga tgacctgggc 7440
ggccaggacg atctcgtcaa agccgtttat gttgtggccc acgatgtaga gctccaaaaa 7500
gcggggctgg cccttgatgg aggggagctt tttgagttcc tcgtaggtga gctcctcggg 7560
cgattccagg ccgtgctcct ccagggccca gtcttgcaag tgagggttgg ccgccaggaa 7620
ggatcgccag aggtcgcggg ccatgagggt ctgcaggcgg tcgcggaagg ttctgaactg 7680
tcgccccacg gccatctttt cgggggtgat gcagtagaag gtgagggggt ctttctccca 7740
ggggtcccat ctgagctctc gggcgaggtc gcgcgcggcg gcgaccagag cctcgtcgcc 7800
ccccagtttc atgaccagca tgaagggcac gagctgcttg ccaaaggctc ccatccaagt 7860
gtaggtctct acatcgtagg tgacaaagag gcgctccgtg cgaggatgag agccgatcgg 7920
gaagaactgg atctcccgcc accagttgga ggattggctg ttgatgtggt gaaagtagaa 7980
gtcccgtctg cgggccgagc actcgtgctg gcttttgtaa aagcgaccgc agtactggca 8040
gcgctgcacg ggttgtatat cttgcacgag gtgaacctgg cgacctctga cgaggaagcg 8100
cagcgggaat ctaagtcccc cgcctggggt cccgtgtggc tggtggtctt ctactttggt 8160
tgtctggccg ccagcatctg tctcctggag ggcgatggtg gagcagacca ccacgccgcg 8220
agagccgcag gtccagatct cggcgctcgg cgggcggagt ttgatgacga catcgcgcac 8280
attggagctg tccatggtct ccagctcccg cggcggcagg tcagctggga gttcctggag 8340
gttcacctcg cagagacggg tcaaggcgcg ggcagtgttg agatggtatc tgatttcaag 8400
gggcgtgttg gcggcggagt cgatggcttg caggaggccg cagccccggg gggccacgat 8460
ggttccccgc ggggcgcgag gggaggcgga agctgggggt gtgttcagaa gcggtgacgc 8520
gggcgggccc ccggaggtag ggggggttcc ggccccacag gcatgggcgg caggggcacg 8580
tcttcgccgc gcgcgggcag gggctggtgc tggctccgaa gagcgcttgc gtgcgcgacg 8640
acgcgacggt tggtgtcctg tatctgacgc ctctgagtga agaccacggg tcccgtgacc 8700
ttgaacctga aagagagttc gacagaatca atctcggcat cgttgacagc ggcctggcgc 8760
aggatctcct gcacgtcgcc cgagttgtcc tggtaggcga tctctgccat gaactgctcg 8820
atctcttctt cctggagatc tcctcgtccg gcgcgctcca cggtggccgc caggtcgttg 8880
gagatgcgac ccatgagctg tgagaaggcg ttgagcccgc cctcgttcca gacccggctg 8940
tagaccacgc ccccctcggc gtcgcgagcg cgcatgacca cctgggccag gttgagctcc 9000
acgtgtcgcg tgaagacggc gtagttgcgc aggcgctgga aaaggtagtt cagggtggtg 9060
gcggtgtgct cggcgacgaa gaagtacatg acccagcgcc gcaacgtgga ttcattgatg 9120
tcccccaagg cctccaggcg ctccatggcc tcgtagaagt ccacggcgaa gttgaaaaac 9180
tgggagttgc gagcggacac ggtcaactcc tcctccagaa gacggatgag ctcggcgaca 9240
gtgttgcgca cctcgcgctc gaaggccacg gggggcgctt cttcctcttc cacctcttct 9300
tccatgatcg cttcttcttc ttcctcagcc gggacgggag ggggcggcgg cggcggggga 9360
ggggcgcggc ggcggcggcg gcgcaccggg aggcggtcga tgaagcgctc gatcatctcc 9420
ccccgcatgc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg gcgcagctcg 9480
aagacgccgc ctctcatctc gccgcggggc gagcggccgt gaggtagcga gacggcgctg 9540
actatgcatc ttaacaattg ctgtgtaggt acaccgccga gggacctgat tgagtccaga 9600
tccaccggat ccgaaaacct ttggaggaaa gcgtctatcc agtcgcagtc gcaaggtagg 9660
ctgagcaccg tggcgggcgg gggcgggtct ggagagttcc tggcggagat gctgctgatg 9720
atgtaattaa agtaggcggt cttgagaagg cggatggtgg acaggagcac catgtctttg 9780
ggtccggcct gttggatgcg gaggcggtcg gccatgcccc aggcctcgtt ctgacaccgg 9840
cgcaggtctt tgtagtagtc ttgcatgagt ctttccaccg gcacctcttc tccttcctct 9900
tctccatctc gccggtggtt tctcgcgccg cccatgcgcg tgaccccaaa gcccctgagc 9960
ggctgcagca gggccaggtc ggcgaccacg cgctcggcca agatggcctg ctgcacctga 10020
gtgagggtcc tctcgaagtc atccatgtcc acgaagcggt ggtaggcgcc cgtgttgatg 10080
gtgtaggtgc agttggccat gacggaccag ttgacggtct ggtgtcccgg ctgcgagagc 10140
tccgtgtacc gcaggcgcga gaaggcgcgg gaatcgaaca cgtagtcgtt gcaagtccgc 10200
accagatact ggtagcccac caggaagtgc ggcggaggtt ggcgatagag gggccagcgc 10260
tgggtggcgg gggcgccggg cgccaggtct tccagcatga ggcggtggta tccgtagatg 10320
tacctggaca tccaggtgat gccggcggcg gtggtggtgg cgcgcgcgta gtcgcggacc 10380
cggttccaga tgtttcgcag gggcgagaag tgttccatgg tcggcacgct ctggccggtg 10440
aggcgcgcgc agtcgttgac gctctataca cacacaaaaa cgaaagcgtt tacagggctt 10500
tcgttctgta gcctggagga aagtaaatgg gttgggttgc ggtgtgcccc ggttcgagac 10560
caagctgagc tcggccggct gaagccgcag ctaacgtggt attggcagtc ccgtctcgac 10620
ccaggccctg tatcctccag gatacggtcg agagcccttt tgctttcttg gccaagcgcc 10680
cgtggcgcga tctgggatag atggtcgcga tgagaggaca aaagcggctc gcttccgtag 10740
tctggagaaa caatcgccag ggttgcgttg cggcgtaccc cggttcgagc ccctatggcg 10800
gcttgaatcg gccggaaccg cggctaacga gggccgtggc agccccgtcc tcaggacccc 10860
gccagccgac ttctccagtt acgggagcga gccccttttg ttttttattt tttagatgca 10920
tcccgtgctg cggcagatgc gcccctcgcc ccggcccgat cagcagcagc aacagcaggc 10980
atgcagaccc ccctctcccc tttccgcccc ggtcaccacg gccgcggcgg ccgtgtcggg 11040
cgcggggggc gcgctggagt cagatgagcc accgcggcgg cgacctaggc agtatctgga 11100
cttggaagag ggcgagggac tggcgcggct gggggcgaac tctccagagc gccacccgcg 11160
ggtgcagttg aaaagggacg cgcgcgaggc gtacctgccg cggcagaacc tgtttcgcga 11220
ccgcgggggc gaggagcccg aggagatgcg agactgcagg ttccaagcgg ggcgcgagct 11280
gcggcgcggg ctggacagac agcgcctgct gcgcgaggag gactttgagc ccgacacgca 11340
gacgggcatc agccccgcgc gcgcgcacgt agccgcggcc gacctggtga ccgcctacga 11400
gcagacggta aaccaggagc gcaacttcca aaagagcttc aacaaccacg tgcgcacgct 11460
ggtggcgcgc gaggaggtga ccctgggtct catgcatctg tgggacctgg tggaggcgat 11520
cgtgcagaac cccagcagca agcccctgac cgcgcagctg ttcctggtgg tgcagcacag 11580
cagggacaac gaggccttca gggaggcgct gctgaacatc accgagccgg aggggcgctg 11640
gctcctggac ctgataaaca tcctgcagag catagtggtg caggagcgca gcctgagcct 11700
ggccgagaag gtggcggcca tcaactactc tatgctgagc ctgggcaagt tctacgcccg 11760
caagatctac aagaccccct acgtgcccat agacaaggag gtgaagatag acagcttcta 11820
catgcgcatg gcgctgaagg tgctgaccct gagcgacgac ctgggagtgt accgcaacga 11880
gcgcatccac aaggccgtga gcgccagccg gcggcgcgag ctgagcgacc gcgagctgat 11940
gcacagtctg cagcgcgcgc tgaccggcgc gggcgagggc gacagggagg tcgagtccta 12000
cttcgacatg ggggccgacc tgcactggca gccgagccgc cgcgccctgg aggcggcggg 12060
ggcgtacggc ggccccctgg cggccgatga ccaggaagag gaggactatg agctagagga 12120
gggcgagtac ctggaggact gacctggctg gtggtgtttt ggtatagatg caagatccga 12180
acgtggcgga cccggcggtc cgggcggcgc tgcaaagcca gccgtccggc attaactcct 12240
ctgacgactg ggccgcggcc atgggtcgca tcatggccct gaccgcgcgc aaccccgagg 12300
ctttcaggca gcagcctcag gccaaccggc tggcggccat cttggaagcg gtagtgcccg 12360
cgcgctccaa ccccacccac gagaaggtgc tggccatagt caacgcgctg gcggagagca 12420
gggccatccg cgcggacgag gccggactgg tgtacgatgc gctgctgcag cgggtggcgc 12480
ggtacaacag cggcaacgtg cagaccaacc tggaccgcct ggtgacggac gtgcgcgagg 12540
ccgtggcgca gcgcgagcgc ttgcatcagg acggtaacct gggctcgctg gtggcgctaa 12600
acgccttcct cagcacccag ccggccaacg taccgcgggg gcaggaggac tacaccaact 12660
ttttgagcgc gctgcggctg atggtgaccg aggtccctca gagcgaggtg taccagtcgg 12720
ggcccgacta cttcttccag accagcagac agggcttgca aaccgtgaac ctgagccagg 12780
ctttcaagaa cctgcggggg ctgtggggag tgaaggcgcc caccggcgac cgggctacgg 12840
tgtccagcct gctaaccccc aactcgcgcc tgctgctgct gctgatcgcg cccttcacgg 12900
acagcgggag cgtctcgcgg gagacctatc tgggccacct gctgacgctg taccgcgagg 12960
ccatcgggca ggcgcaggtg gacgagcaca ccttccaaga gatcaccagc gtgagccacg 13020
cgctggggca ggaggacacg ggcagcctgc aggcgaccct gaactacctg ctgaccaaca 13080
ggcggcagaa gattcccacg ctgcacagcc tgacccagga ggaggagcgc atcttgcgct 13140
acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg cgtgacgccc agcgtggcgc 13200
tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc ctcccaccgg ccgtttatca 13260
accgcctgat ggactacttg catcgggcgg cggccgtgaa ccccgagtac ttcactaatg 13320
ccattctgaa tccccactgg atgccccctc cgggtttcta caacggggac tttgaggtgc 13380
ccgaggtcaa cgacgggttc ctctgggatg acatggatga cagtgtgttc tcacccaacc 13440
cgctgcgcgc cgcgtctctg cgattgaagg agggctctga cagggaagga ccgaggagtc 13500
tggcctcctc cctggctctg ggagcggtgg gcgccacggg cgcggcggcg cggggcagta 13560
gccccttccc cagcctggca gactctctga acagcgggcg ggtgagcagg ccccgcttgc 13620
taggcgagga ggagtatctg aacaactccc tgctgcagcc cgcgagggac aagaacgctc 13680
agcggcagca gtttcccaac aatgggatag agagcctggt ggacaagatg tccagatgga 13740
agacgtatgc gcaggagtac aaggagtggg aggaccgcca gccgcggccc ttgccgcccc 13800
ctaggcagcg ctggcagcgg cgcgcgtcca accgccgctg gaggcagggg cccgaggacg 13860
atgatgactc tgcagatgac agcagcgtgt tggacctggg cgggagcggg aacccctttt 13920
cgcacctgcg cccacgcctg ggcaagatgt tttaaaagaa aaaaaaaaat aaaactcacc 13980
aaggccatgg cgacgagcgt tggttttttg ttcccttcct tagtatgcgg cgcgcggcga 14040
tgttcgagga ggggcctccc ccctcttacg agagcgcgat ggggatttct cctgcggcgc 14100
ccctgcagcc tccctacgtg cctcctcggt acctgcaacc tacagggggg agaaatagca 14160
tctgttactc tgagctgcag cccctgtacg ataccaccag actgtacctg gtggacaaca 14220
agtccgcgga cgtggcctcc ctgaactacc agaacgacca cagcgatttt ttgaccacgg 14280
tgatccaaaa caacgacttc accccaaccg aggccagcac ccagaccata aacctggata 14340
acaggtcgaa ctggggcggc gacctgaaga ccatcttgca caccaacatg cccaacgtga 14400
acgagttcat gttcaccaac tcttttaagg cgcgggtgat ggtggcgcgc gagcaggggg 14460
aggcgaagta cgagtgggtg gacttcacgc tgcccgaggg caactactca gagaccatga 14520
ctctcgacct gatgaacaat gcgatcgtgg aacactatct gaaagtgggc aggcagaacg 14580
gggtgaagga aagcgatatc ggggtcaagt ttgacaccag aaacttccgt ctgggctggg 14640
accccgtgac cgggctggtc atgccggggg tctacaccaa cgaggccttt catcccgaca 14700
tagtgcttct gcccggctgt ggggtggact tcacccagag ccggctgagc aacctgctgg 14760
gcattcgcaa gcggcagcct ttccaggagg gtttcaagat cacctatgag gatctgaagg 14820
ggggcaacat tcccgcgctc cttgatctgg acgcctacga ggagagcttg aaacccgagg 14880
agagcgctgg cgacagcggc gagagtggcg aggagcaagc cggcggcggt ggcggcgcgt 14940
cggtagaaaa cgaaagtacg cccgcagtgg cggcggacgc tgcggaggtc gagccggagg 15000
ccatgcagca ggacgcagag gagggcgcac aggagggcgc gcagaaggac atgaacgatg 15060
gggagatcag gggagacaca ttcgccaccc ggggcgaaga aaaagaggca gaggcggcgg 15120
cggcggcgac ggcggaggcc gaaaccgagg ttgaggcaga ggcagagccc gagaccgaag 15180
ttatggaaga catgaatgat ggagaacgta ggggcgacac gttcgccacc cggggcgaag 15240
agaaggcggc ggaggcagaa gccgcggctg aggaggcggc tgcggctgcg gccaagactg 15300
aggctgcggc taaggctgag gtcgaagcca atgttgcggt tgaggctcag gctgaggagg 15360
aggcggcggc tgaagcagtt aaggaaaagg cccaggcaga gcaggaagag aaaaaacctg 15420
tcattcaacc tctaaaagaa gatagcaaaa agcgcagtta caacgtcatc gagggcagca 15480
cctttaccca gtaccgcagc tggtacctgg cgtacaacta cggcgacccg gtcaaggggg 15540
tgcgctcgtg gaccctgctc tgcacgccgg acgtcacctg cggctccgag cagatgtact 15600
ggtcgctgcc gaacatgatg caagacccgg tgaccttccg ctccacgcgg caggttagca 15660
acttcccggt ggtgggcgcc gaactgctgc ccgtgcactc caagagtttt tacaacgagc 15720
aggccgtcta ctcccagctg atccgccagg ccacctctct gacccacgtg ttcaatcgct 15780
ttcccgagaa ccagattttg gcgcgcccgc cggcccccac catcaccacc gtgagtgaaa 15840
acgttcctgc cctcacagat cacgggacgc taccgctgcg caacagcatc tcaggagtcc 15900
agcgagtgac cattactgac gccagacgcc ggacctgccc ctacgtttac aaggccttgg 15960
gcatagtctc gccgcgcgtc ctctccagtc gcacttttta aaacacatct acccacacgt 16020
tccaaaatca tgtccgtact catctcaccc agcaacaaca ccggctgggg gctgcgcgcg 16080
cccagcaaga tgtttggagg ggcgaggaag cgctccgacc agcaccctgt gcgcgtgcgc 16140
ggccactacc gcgcgccctg gggagcgcac aagcgcgggc gcacagggcg caccactgtg 16200
gacgacgtca ttgactccgt agtggagcaa gcgcgccact acacacccgg cgcgccgacc 16260
gcccccgccg tgtccaccgt ggaccaggcg atcgaaagcg tggtacaggg cgcgcggcac 16320
tatgccaacc ttaaaagtcg ccgccgccgc gtggcccgcc gccatcgccg gagaccccgg 16380
gccaccgccg ccgcgcgcct tactaaggct ctgctcaggc gcgccaggcg aactggccac 16440
cgggccgcca tgagggccgc acggcgggct gccgctgccg caagcgtcgt ggccccgcgg 16500
gcacgaaggc gcgcggccgc tgccgccgcc gccgccattt ccagcttggc ctcgacgcgg 16560
cgcggtaaca tatactgggt gcgcgactcg gtaaccggca cgcgggtacc cgtgcgcttt 16620
cgccccccgc ggaattagca caagacaaca tacacactga gtctcctgct gttgtgtatc 16680
ccagcggcga ccgtcagcag cggcgacatg tccaagcgca aaattaaaga agagatgctc 16740
caggtcatcg cgccggagat ctatgggccc ccgaagaagg aggaggatga ttacaagccc 16800
cgcaagctaa agcgggtcaa aaagaaaaag aaagatgatg atgacgaggc ggtggagttt 16860
gtccgccgca tggcacccag gcgccccgtg cagtggaagg gccggcgcgt gcagcgcgtt 16920
ttgcgccccg gcaccgcggt ggtcttcacg cccggcgagc gctccacgcg cactttcaag 16980
cgggtgtacg atgaggtgta cggcgacgag gacctgttgg agcaggccaa ccagcgcttt 17040
ggggagtttg catatgggaa acggccccgc gagagtctaa aagaggacct gctggcgcta 17100
ccgctggacg agggcaatcc caccccgagt ctgaagccgg taaccctgca acaggtgctg 17160
cctttgagcg cgcccagcga gcataagcga gggttgaagc gcgaaggcgg ggacctggcg 17220
cccaccgtgc agttgatggt gcccaagcgg cagaagctgg aggacgtgct ggagaaaatg 17280
aaagtagagc ccgggatcca gcccgagatc aaggtccgcc ccatcaagca ggtggcgccc 17340
ggcgtgggag tccagaccgt ggacgttagg attcccacgg aggagatgga aacccaaacc 17400
gccactccct cttcggcggc cagcgccacc accggcaccg cttcggtaga ggtgcagacg 17460
gacccctggc tacccgccac cgctgttgcc gccgccgccc cccgttcgcg cgggcgcaag 17520
agaaattatc cagcggccag cgcgctcatg ccccagtacg cactgcatcc atccatcgtg 17580
cccacccccg gctaccgcgg gtactcgtac cgcccgcgca gatcagccgg cactcgcggc 17640
cgccgccgcc gtgcgaccac aaccagccgc cgccgtcgcc gccgccgcca gccagtgctg 17700
acccccgtgt ctgtaaggaa ggtggctcgc tcggggagca cgctggtggt gcccagagcg 17760
cgctaccacc ccagcatcgt ttaaagccgg tctctgtatg gttcttgcag atatggccct 17820
cacttgtcgc ctccgcttcc cggtgccggg ataccgagga agaactcacc gccgcagagg 17880
catggcgggc agcggtctcc gcggcggccg tcgccatcgc cggcgcgcaa aaagcaggcg 17940
catgcgcggc ggtgtgctgc ctctgctaat cccgctaatc gccgcggcga tcggtgccgt 18000
acccgggatc gcctccgtgg ccctgcaggc gtcccagaaa cgttgactct tgcaaccttg 18060
caagcttgca ttttttggag gaaaaaataa aaaaaaagtc tagactctca cgctcgcttg 18120
gtcctgtgac tattttgtag aaaaaaagat ggaagacatc aactttgcgt cgctggcccc 18180
gcgtcacggc tcgcgcccgt tcatgggaga ctggacagat atcggcacca gcaatatgag 18240
cggtggcgcc ttcagctggg gcagtctgtg gagcggcctt aaaaattttg gttccaccat 18300
taagaactat ggcaacaaag cgtggaacag cagcacgggc cagatgctga gagacaagtt 18360
gaaagagcag aacttccagg agaaggtggc gcagggcctg gcctctggca tcagcggggt 18420
ggtggacata gctaaccagg ccgtgcagaa aaagataaac agtcatctgg acccccgtcc 18480
tcaggtggag gaaatgcctc cagcgatgga gacggtgtct cccgagggca aaggcgaaaa 18540
gcgcccgcgg cccgacagag aagagaccct ggtgtcacac accgaggagc cgccctctta 18600
cgaggaggca gtcaaggccg gcctgcccac cactcgcccc atagccccca tggccaccgg 18660
tgtggtgggc cacaggcaac acactcccgc aacactagat ctgcccccgc cgtccgagcc 18720
gccgcgccag ccaaaggcgg cgacggtgcc cgctccctcc acttccgccg ccaacagagt 18780
gcccctgcgc cgcgccgcga gcggcccccg ggcctcgcga gttagcggca actggcagag 18840
cacactgaac agcatcgtgg gcctgggagt gaggagtgtg aagcgccgcc gttgctactg 18900
aatgagcaag ctagctaacg tgttgtatgt gtgtatgcgt cctatgtcgc cgccagagga 18960
gctgttgagc cgccggcgcc gtctgcactc cagcgaattt caagatggcg accccatcga 19020
tgatgcctca gtggtcgtac atgcacatct cgggccagga cgcttcggag tacctgagcc 19080
ccgggctggt gcagttcgcc cgcgccacag acacctactt caacatgagt aacaagttca 19140
ggaaccccac tgtggcgccc acccacgatg tgaccacgga ccggtcgcag cgcctgacgc 19200
tgcggttcat ccccgtggat cgggaggaca ccgcctactc ttacaaggcg cggttcacgc 19260
tggccgtggg cgacaaccgc gtgctggaca tggcctccac ttactttgac atcagggggg 19320
tgctggacag gggccccacc ttcaagccct actcgggtac tgcctacaac tccctggccc 19380
ccaagggcgc tcccaattct tgcgagtggg aacaagatga accagctcag gcagcaatag 19440
ctgaagatga agaagaactt gaagaagaac aagctcagga cgaacaggcg cccactaaga 19500
aaacccatgt atacgcccag gcacctcttt ctggtgaaaa aattactaag gatggtttgc 19560
aaataggtgt ggatgccaca caggcgggag ataaccctat atatgctgat aaaacattcc 19620
aacccgaacc tcagataggt gagtctcagt ggaacgaggc tgatgccaca gtagcaggag 19680
gcagagtctt aaaaaagacc acccctatga gaccttgcta tggatcctat gccaaaccta 19740
ctaatgccaa tggcggtcaa gggatcatgg tggccaatga tcagggagcg cttgaatcta 19800
aagttgagat gcaatttttc tccaccacaa cgtctcttaa tgtaagggaa ggtgaaaaca 19860
atcttcagcc aaaagtagtg ctatacagcg aagatgttaa cttggaatcc cctgacactc 19920
atttgtctta caaacctaaa aaggatgaca ccaactctaa aatcatgttg ggtcagcaag 19980
ccatgcccaa cagacccaac ctcattgctt ttagggacaa ctttattgga cttatgtact 20040
acaacagcac aggcaacatg ggagtgctgg caggacaggc ctcccagcta aacgctgtgg 20100
tagacttgca agacagaaac acagagctgt cataccaact gatgcttgat tccattggag 20160
acagatcaag atacttttcc atgtggaacc aggcagtgga cagctatgac ccagatgtca 20220
gaatcattga aaaccatggg gttgaagatg agctgcccaa ctattgcttt cccctgggcg 20280
gtattggaat tacagacaca taccagtgca taaaaccaac cgcagctgct aataacacta 20340
catggtctaa ggatgaagaa tttagtgatc gcaatgaaat aggggtggga aacaacttcg 20400
ccatggagat caacatccag gccaacctct ggaggaactt cctctatgcg aacgtggggc 20460
tctacctgcc agacaagctc aagtacaacc ccaccaacgt ggacatctct gacaacccca 20520
acacctatga ctacatgaac aagcgtgtgg tggctcccgg cctggtggac tgctttgtca 20580
atgtgggagc caggtggtcc ctggactaca tggacaacgt caaccccttc aaccaccacc 20640
gcaatgcggg tctgcgctac cgctccatga tcctgggcaa cgggcgctac gtgcccttcc 20700
acattcaggt gccccagaag ttctttgcca tcaagaacct cctcctcctg ccgggctcct 20760
acacttacga gtggaacttc aggaaggatg tcaacatggt cctgcagagc tctctgggca 20820
atgaccttag ggtggacggg gccagcatca agtttgacag cgtcaccctc tatgctacct 20880
tcttccccat ggctcacaac accgcctcca cgctcgaggc catgctgagg aacgacacca 20940
acgaccagtc cttcaatgac tacctctctg gggccaacat gctctacccc atccccgcca 21000
aggccaccaa cgtgcccatc tccattccct ctcgcaactg ggccgccttc agaggctggg 21060
cctttacccg ccttaagacc aaggaaaccc cctccctggg ctcgggtttt gacccctact 21120
ttgtctactc gggatccatc ccctacctgg atggcacctt ctacctcaac cacactttta 21180
agaagatatc catcatgtat gactcctccg tcagctggcc gggcaatgac cgcctgctca 21240
cccccaatga gttcgaggtc aagcgcgccg tggacggcga gggctacaac gtggcccagt 21300
gcaacatgac caaggactgg ttcctggtgc agatgctggc caactacaac ataggctacc 21360
agggcttcta catcccagag agctacaagg acaggatgta ctccttcttc agaaatttcc 21420
aacccatgag caggcaggtg gtggacgaga ccaaatacaa ggactatcag gccattggca 21480
tcactcacca gcacaacaac tcgggattcg tgggctacct ggctcccacc atgcgcgagg 21540
ggcaggccta ccccgccaac ttcccctacc cgttgatagg caaaaccgcg gtcgacagcg 21600
tcacccagaa aaagttcctc tgcgaccgca ccctctggcg catccccttc tctagcaact 21660
tcatgtccat gggtgcgctc acggacctgg gccagaacct gctctatgcc aactccgccc 21720
atgcgctgga catgactttt gaggtggacc ccatggacga gcccaccctt ctctatattg 21780
tgtttgaagt gttcgacgtg gtcagagtgc accagccgca ccgcggtgtc atcgagaccg 21840
tgtacctgcg cacgcccttc tcggccggca acgccaccac ctaaggagac agcgccgccg 21900
cctgcatgac gggttccacc gagcaagagc tcagggccat cgccagagac ctgggatgcg 21960
gaccctattt tttgggcacc tatgacaaac gcttcccggg cttcatctcc cgagacaagc 22020
tcgcctgcgc catcgtcaac acggccgcgc gcgagaccgg gggcgtgcac tggctggcct 22080
ttggctggga cccgcgctcc aaaacctgct acctcttcga cccctttggc ttctccgatc 22140
agcgcctcag acagatctat gagtttgagt acgaggggct gctgcgccgc agcgcgcttg 22200
cctcctcgcc cgaccgctgc atcacccttg agaagtccac cgagaccgtg caggggcccc 22260
actcggccgc ctgcggtctc ttctgctgca tgtttttgca cgcctttgtg cgctggcccc 22320
agagtcccat ggatcgcaac cccaccatga acttgctcaa gggagtgccc aacgccatgc 22380
tccagagccc ccaggtccag cccaccctgc gccacaacca ggaacagctc taccgcttcc 22440
tggagcgcca ctccccctac ttccgcagtc acagcgcgca catccggggg gccacctctt 22500
tctgccactt gcaagaaaac atgcaagacg gaaaatgatg tacagctcgc tttttaataa 22560
atgtaaagac tgtgcacttt atttatacac gggctctttc tggttattta ttcaacaccg 22620
ccgtcgccat ctagaaatcg aaagggttct gccgcgcgtc gccgtgcgcc acgggcagag 22680
acacgttgcg atactggaag cggctcgccc acttaaactc gggcaccacc atgcggggca 22740
gtggttcctc ggggaagttc tcgccccaca gggtgcgggt cagctgcagc gcgctcagga 22800
ggtcgggagc cgagatcttg aagtcgcagt tggggccgga accctgcgcg cgcgagttgc 22860
ggtacacggg gttgcagcac tggaacacca gcagggccgg attatgcacg ctggccagca 22920
ggctctcgtc gctgatcatg tcgctgtcca gatcctccgc gttgctcagg gcgaacgggg 22980
tcatcttgca gacctgcctg cccaggaaag gcggcagccc gggcttgccg ttgcagtcgc 23040
agcgcagggg catcagcagg tgcccgcggc ccgactgcgc ctgcgggtac agcgcgcgca 23100
tgaaggcttc gatctgcctg aaagccacct gcgtcttggc tccctccgaa aagaacatcc 23160
cacaggactt gctggagaac tggttcgcgg gacagctggc atcgtgcagg cagcagcgcg 23220
cgtcggtgtt ggcgatctgc accacgttgc gaccccaccg gttcttcact atcttggcct 23280
tggaagcctg ctccttcagc gcgcgctggc cgttctcgct ggtcacatcc atctctatca 23340
cctgctcctt gttgatcatg tttgtaccgt gcagacactt caggtcgccc tccgtctggg 23400
tgcagcggtg ctcccacagc gcgcaaccgg tgggctccca atttttgtgg gtcacccccg 23460
cgtaggcctg caggtaggcc tgcaagaagc gccccatcat ggccacaaag gtcttctggc 23520
tcgtaaaggt cagctgcagg ccgcgatgct cttcgttcag ccaggtcttg cagatggcgg 23580
ccagcgcctc ggtctgctcg ggcagcatcc taaaatttgt cttcaggtcg ttatccacgt 23640
ggtacttgtc catcatggcg cgcgccgcct ccatgccctt ctcccaggcg gacaccatgg 23700
gcaggcttag ggggtttatc acttccaccg gcgaggacac cgtactttcg atttcttctt 23760
cctccccctc ttcccggcgc gcgcccacgc tgctgcgcgc tctcaccgcc tgcaccaagg 23820
ggtcgtcttc aggcaagcgc cgcaccgagc gcttgccgcc cttgacctgc ttaatcagca 23880
ccggcgggtt gctgaagccc accatggtca gcgccgcctg ctcttcttcg tcttcgctgt 23940
ctaccactat ctctggggaa gggcttctcc gctctgcggc ggcgcgcttc ttttttttct 24000
tgggagcggc cgtgatggag tccgccacgg cgacggaggt cgagggcgtg gggctggggg 24060
tgcgcggtac cagggcctcg tcgccctcgg actcttcctc tgactccagg cggcggcgga 24120
gtcgcttctt tgggggcgcg cgcgtcagcg gcggcggaga cggggacggg gacggggacg 24180
ggacgccctc cacagggggt ggtcttcgcg cagacccgcg gccgcgctcg ggggtcttct 24240
cgagctggtc ttggtcccga ctggccattg tatcctcctc ctcctaggca gagagacata 24300
aggagtctat catgcaagtc gagaaggagg agagcttaac caccccctct gagaccgccg 24360
atgcgcccgc cgtcgccgtc gcccccgctg ccgccgacgc gcccgccaca ccgagcgaca 24420
cccccgcgga cccccccgcc gacgcacccc tgttcgagga agcggccgtg gagcaggacc 24480
cgggctttgt ctcggcagag gaggatttgc gagaggagga ggataaggag aagaagccct 24540
cagtgccaaa agatgataaa gagcaagacg agcacgacgc agatgcacac cagggtgaag 24600
tcgggcgggg ggacggaggg catgacggcg ccgactacct agacgaaggg aacgacgtgc 24660
tcttgaagca cctgcatcgt cagtgcgcca ttgtttgcga cgctctgcag gagcgcagcg 24720
aagtgcccct cagcgtggcg gaggtcagcc acgcctacga gctcagcctc ttctcccccc 24780
gggtgccccc ccgccgccgc gaaaacggca catgcgagcc caacccgcgc ctcaacttct 24840
accccgcctt tgtggtaccc gaggtcctgg ccacctatca catcttcttt caaaattgca 24900
agatccccct ctcgtgccgc gccaaccgta gccgcgccga taagatgctg gccctgcgcc 24960
agggcgacca catacctgat atcgccgctt tggaagatgt accaaagatc ttcgagggtc 25020
tgggtcgcaa cgagaagcgg gcagcaaact ctctgcaaca ggaaaacagc gaaaatgaga 25080
gtcacaccgg ggtactggtg gagctcgagg gcgacaacgc ccgcctggcg gtggtcaagc 25140
gcagcatcga ggtcacccac tttgcctacc ccgcgctaaa cctgcccccc aaagtcatga 25200
acgcggccat ggacgggctg atcatgcgcc gcggccggcc cctcgctcca gatgcaaact 25260
tgcatgagga gaccgaggac ggccagcccg tggtcagcga cgagcagctg gcgcgctggc 25320
tggagaccgc ggaccccgcc gaactggagg agcggcgcaa gatgatgatg gccgtggtgc 25380
tggtcaccgt agagctggag tgtctgcagc gcttcttcgg cgaccccgag atgcagagaa 25440
aggtcgagga gaccctgcac tacaccttcc gccagggcta cgtgcgccag gcttgcaaga 25500
tctccaacgt ggagctcagc aacctggtgt cctacctggg catcttgcat gagaaccgcc 25560
tcgggcagag cgtgctgcac tccaccctgc gcggggaggc gcgccgcgac tacgtgcgcg 25620
actgcgttta cctcttcctc tgctacacct ggcagacggc catgggggtc tggcagcagt 25680
gcctggagga gcgcaacctc aaggagctgg agaagctcct gcagcgcgcg ctcaaagatc 25740
tctggacggg ctacaacgag cgctcggtgg ccgccgcgct ggccgacctc atcttccccg 25800
agcgcctgct caaaaccctc cagcaggggc tgcccgactt caccagccaa agcatgttgc 25860
aaaacttcag gaactttatc ctggagcgtt ctggcatcct acccgccacc tgctgcgccc 25920
tgcccagcga ctttgtcccc ctcgtgtacc gcgagtgccc cccgccgctg tggggtcact 25980
gctacctgtt ccaactggcc aactacctgt cctaccacgc ggacctcatg gaggactcca 26040
gcggcgaggg gctcatggag tgccactgcc gctgcaacct ctgcacgccc caccgctccc 26100
tggtctgcaa cacccaactg ctcagcgaga gtcagattat cggtaccttc gagctacagg 26160
gtccgtcctc ctcagacgag aagtccgcgg ctccggggct aaaactcact ccggggctgt 26220
ggacttccgc ctacctgcgc aaatttgtac ctgaagacta ccacgcccac gagatcaggt 26280
tttacgaaga ccaatcccgc ccgcccaagg cggagctgac cgcctgcgtc atcacccagg 26340
gcgagatcct aggccaattg caagccatcc aaaaagcccg ccaagacttt ttgctgaaga 26400
agggtcgggg ggtgtatctg gacccccagt cgggtgagga gctcaacccg gttcccccgc 26460
tgccgccgcc gcgggacctt gcttcccagg ataagcatcg ccatggctcc cagaaagaag 26520
cagcagcggc cgccactgcc gccaccccac atgctggagg aagaggagga atactgggac 26580
agtcaggcag aggaggtttc ggacgaggag gagccggaga cggagatgga agagtgggag 26640
gaggacagct tagacgagga ggcttccgaa gccgaagagg cagacgcaac accgtcaccc 26700
tcggccgcag ccccctcgca ggcgcccccg aagtccgctc ccagcatcag cagcaacagc 26760
agcgctataa cctccgctcc tccaccgccg cgacccacgg ccgaccgcag acccaaccgt 26820
agatgggaca ccaccggaac cggggccggt aagtcctccg ggagaggcaa gcaagcgcag 26880
cgccaaggct accgctcgtg gcgcgctcac aagaacgcca tagtcgcttg cttgcaagac 26940
tgcgggggga acatctcctt cgcccgccgc ttcctgctct tccaccacgg tgtggccttc 27000
ccccgtaacg tcctgcatta ctaccgtcat ctctacagcc cctactgcgg cggcagtgag 27060
ccagagacgg tcggcggcgg cggcggcgcc cgtttcggcg cctaggaaga cccagggcaa 27120
gacttcagcc aagaaactcg cggcggccgc ggcgaacgcg gtcgcggggg ccctgcgcct 27180
gacggtgaac gaacccctgt cgacccgcga actgaggaac cgaatcttcc ccactctcta 27240
tgccatcttc cagcagagca gagggcagga tcaggaactg aaagtaaaaa acaggtctct 27300
gcgctccctc acccgcagct gtctgtatca caagagcgaa gaccagcttc ggcgcacgct 27360
ggaggacgct gaggcactct tcagcaaata ctgcgcgctc actcttaagg actagctccg 27420
cgcccttctc gaatttaggc gggaacgcct acgtcatcgc agcgccgccg tcatgagcaa 27480
ggacattccc acgccataca tgtggagcta tcagccgcag atgggactcg cggcgggcgc 27540
ctcccaagac tactccaccc gcatgaactg gctcagtgcc ggcccacaca tgatctcaca 27600
ggttaatgat atccgcaccc atcgaaacca aatattggtg gagcaggcgg caattaccac 27660
cacgccccgc aataatccca accccaggga gtggcccgcg tccctggtgt atcaggaaat 27720
tcccggcccc accaccgtac tacttccgcg tgattcccag gccgaagtcc aaatgactaa 27780
ctcaggggca cagctcgcgg gcggctgtcg tcacagggtg cggcctcctc gccagggtat 27840
aactcacctg gagatccgag gcagaggtat tcagctcaac gacgagtcgg tgagctcctc 27900
gctcggtctc agacctgacg ggaccttcca gatagccgga gccggccgat cttccttcac 27960
gccccgccag gcgtacctga ctctgcaaag ctcgtcctcg gcgccgcgct cgggcggcat 28020
cgggactctc cagttcgtgc aggagtttgt gccctcggtc tacttcaacc ccttctcggg 28080
ctctcccggt cgctacccgg accagttcat ctcgaacttt gacgccgcga gggactcggt 28140
ggacggctac gactgaatgt cgggtggacc cggtgcagag caacttcgcc tgaagcacct 28200
cgaccactgc cgccgccctc agtgctttgc ccgctgtcag accggtgagt tccagtactt 28260
ttccctgccc gactcgcacc cggacggccc ggcgcacggg gtgcgctttt tcatcccgag 28320
tcaggtgcgc tctaccctaa tcagggagtt taccgcccgt cccctactgg cggagttgga 28380
aaaggggcct tctatcctaa ccattgcctg catctgctct aaccctggat tgcaccaaga 28440
tctttgctgt catttgtgtg ctgagtataa taaaggctga gatcagaatc tactcgggct 28500
cctgtcgcca tcctgtcaac gccaccgtcc aagcccggcc cgatcagccc gaggtgaacc 28560
tcacctgcgg tctgcaccgg cgcctgagga aatacctagc ttggtactac aacagcactc 28620
cctttgtggt ttacaacagc tttgaccagg acggggtctc actgagggat aacctctcga 28680
acctgagcta ctccatcagg aagaacagca ccctcgagct acttcctcct tacctgcccg 28740
ggacttacca gtgtgtcacc ggtccctgca cccacaccca cctgttgatc gtaaacgact 28800
ctcttccgag aacagacctc aataactcct cttcgcagtt ccccagaaca ggaggtgagc 28860
tcaggaaacc ccgggtaaag aagggtggac gagagttaac acttgtgggg tttctggtgt 28920
atgtgacgct ggtggtggct cttttgatta aggcttttcc ttccatgtct gaactctccc 28980
tcttctttta tgaacaactc gactagtgct aacgggaccc tacccaacga atcgggattg 29040
aatatcggta accaggttgc agtttcactt ttgattacct tcatagtcct cttcctgcta 29100
gtgctgtcgc ttctgtgcct gcggatcggg ggctgctgca tccacgttta tatctggtgc 29160
tggctgttta gaaggttcgg agaccatcgc aggtagaata aacatgctgc tgcttaccct 29220
ctttgtcctg gcgctggccg ccagctgcca agccttttcc gaggctgact ttatagagcc 29280
ccagtgtaat gtgactttta aagcccatgc acagcgttgt catactataa tcaaatgtgc 29340
caccgaacac gatgaatacc ttatccagta taaagataaa tcacacaaag tggcacttgt 29400
tgacatctgg aaacccgaag accctttgga atacaatgtg accgttttcc agggtgacct 29460
cttcaaaatt tacaattaca ctttcccatt tgaccagatg tgtgactttg tcatgtacat 29520
ggaaaagcag cacaagctgt ggcctccgac tccccagggc tgtgtggaaa atccaggctc 29580
tttctgcatg atctctctct gtgtaactgt gctggcacta atactcacgc ttttgtatat 29640
cagatttaaa tcaaggcaaa gcttcattga tgaaaagaaa atgccttaat cgctttcacg 29700
cttgattgct aacaccgggt ttttatccgc agaatgattg gaatcaccct actaatcacc 29760
tccctccttg cgattgccca tgggttggaa cgaatcgaag tccctgtggg ggccaatgtt 29820
accctggtgg ggcctgtcgg caatgctaca ttaatgtggg aaaaatatac taaaaatcaa 29880
tgggtctctt actgcactaa caaaaatagc cacaagccca gagccatctg cgatgggcaa 29940
aatctaacct tgattgatgt tcaattgctg gatgcgggct actattatgg gcagctgggt 30000
acaatgatta attactggag accccacaga gattacatgc tccacgtagt aaagggtccc 30060
cttagcagcc cacccactac cacctctact acccccacta ccaccactac tcccaccacc 30120
agcactgccg cccagcctcc tcatagcaga acaaccactt ttatcaattc caagtcccac 30180
tccccccaca ttgccggcgg gccctccgcc tcagactccg aaaccaccga gatctgcttc 30240
tgcaaatgct ctgacgccat tgcccaggat ttggaagatc acgaggaaga tgagcatgac 30300
ttcgcagatg catgccaggc atcagagcca gaagcgctgc cggtggccct caaacagtat 30360
gcagaccccc acaccacccc cgaccttcct ccaccttccc agaagccaag tttcctgggg 30420
gaaaatgaaa ctctgcctct ctccatactc gctctgacat ctgttgctat gttgaccgct 30480
ctgctggtgc ttctatgctc tatatgctac ctgatctgct gcagaaagaa aaaatctcac 30540
ggccatgctc accagcccct catgcacttc ccttaccctc cagagctggg cgaccacaaa 30600
ctttaagtct gcagtaacta tctgcccatc ccttgtcagt cgacagcgat gagccccact 30660
aatctaacgg cctctggact tacaacatcg tctcttaatg agaccaccgc tcctcaagac 30720
ctgtacgatg gtgtctccgc gctggttaac cagtgggatc acctgggcat atggtggctc 30780
ctcataggag cagtgaccct gtgcctaatc ctggtctgga tcatctgctg catcaaaagc 30840
agaagaccca ggcggcggcc catctacagg ccctttgtca tcacacctga agatgatgat 30900
gacaccactt ccaggctgca gaggctaaag cagctactct tctcttttac agcatggtaa 30960
attgaatcat gcctcgcatt ttcatctact tgtctctcct tccacttttt ctgggctctt 31020
ctacattggc cgctgtgtcc cacatcgagg tagactgcct cacgcccttc acagtctacc 31080
tgcttttcgg ctttgtcatc tgcacctttg tctgcagcgt tatcactgta gtgatctgct 31140
tcatacagtg catcgactac gtctgcgtgc gggtggctta ctttagacac cacccccagt 31200
atcgcaacag ggacatagcg gctctcctaa gacttgttta aaatcatggc caaattaact 31260
gtgattggtc ttctgatcat ctgctgcgtc ctagccgcga ttgggactca agctcctacc 31320
accaccagcg ctcccagaaa gagacatgta tcctgcagct tcaagcgtcc ctggaatata 31380
ccccaatgct ttactgatga acctgaaatc tctttggctt ggtacttcag cgtcaccgcc 31440
cttcttatct tctgcagtac ggttattgcc cttgccatct acccttccct tgacctgggc 31500
tggaatgctg tcaactctat ggaatatccc accttcccag aaccagacct gccagacctg 31560
gttgttctaa acgcgtttcc tcctcctgct cccgttcaaa atcagtttcg ccctccgtcc 31620
cccacgccca ctgaggtcag ctactttaat ctaacaggcg gagatgactg aaaacctaga 31680
cctagaaatg gacggtctct gcagcgagca acgcacacta gagaggcgcc ggcaaaaaga 31740
gctcgagcgt cttaaacaag agctccaaga cgcggtggcc atacaccagt gcaaaaaagg 31800
tgtcttctgt ctggtaaaac aggccacgct cacctatgaa aaaacaggtg acacccaccg 31860
cctaggatac aagctgccca cacagcgcca aaagttcgcc ctcatgatag gcgaacaacc 31920
catcaccgtg acccagcact ccgtggagac agaaggctgc atacatgctc cctgtagggg 31980
cgctgactgc ctctacacct tgatcaaaac cctctgcggt ctcagagacc ttatcccttt 32040
caattaatca taactgtaat caataaaaaa tcacttactt gaaatctgat agcaagcctc 32100
tgtccaattt tttcagcaac acttccttcc cctcctccca actctggtac tctaggcgcc 32160
tcctagctgc aaacttcctc cacagtctga agggaatgtc agattcctcc tcctgtccct 32220
ccgcacccac gatcttcatg ttgttgcaga tgaaacgcgc gagatcgtct gacgagacct 32280
tcaaccccgt gtacccctac gataccgaga tcgctccgac ttctgtccct ttccttaccc 32340
ctccctttgt gtcatccgca ggaatgcaag aaaatccagc tggggtgctg tccctgcact 32400
tgtcagagcc ccttaccacc cacaatgggg ccctgactct aaaaatgggg ggcggcctga 32460
ccctggacaa ggaagggaat ctcacttccc aaaacatcac cagtgtcgat ccccctctca 32520
aaaaaagcaa gaacaacatc agccttcaga ccgccgcacc cctcgccgtc agctccgggg 32580
ccctaacact ttttgccact ccccccctag cggtcagtgg tgacaacctt actgtgcagt 32640
ctcaggcccc tctcactttg gaagactcaa aactaactct ggccaccaaa ggacccctaa 32700
ctgtgtccga aggcaaactt gtcctaga 32728
<210> 25
<211> 32728
<212> DNA
<213> 人工序列
<220>
<223> 腺病毒载体核苷酸序列
<400> 25
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagtgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgtttta ttgtcaccgt catttgacgc ttaggcctga ccatctggtg 480
ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg aggtgggtaa 540
ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg tctctctgtt 600
ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg gaagcatctt 660
tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga atgtgatggg 720
ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg cctacgcgac 780
cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg ccgccgcgac 840
cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg cggcctctcg 900
cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag acttgacccg 960
ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc ttgcctcccc 1020
ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt gtatgttctt 1080
tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt tagggtgcgg 1140
tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat gggcatgagt 1200
ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt ggtgttgtat 1260
atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt aagcaagagg 1320
cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag ttgggagggg 1380
tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc tatgttccca 1440
cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata tccagtgcac 1500
ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga gacgcccttg 1560
tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc gtgggaagct 1620
gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag ggtgaggtca 1680
tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat gatggtaccc 1740
tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt catttcagag 1800
ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc aggggagatt 1860
aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt gggcccatat 1920
atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc gtcctcccgg 1980
agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct gaccaattcc 2040
gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa atttttcagc 2100
ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag ttccagcctg 2160
tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc tcgtttcgcg 2220
ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg gccagagtca 2280
tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg aaggggtgcg 2340
ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg ctgaatcgct 2400
gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg tagtcgagac 2460
cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg cacgaggggc 2520
actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct ggggagtagg 2580
cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg agctccgggc 2640
ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta cctcggctct 2700
ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg tagaccgact 2760
tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac tctgaccact 2820
ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag gggtagcggt 2880
cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc ccctcctccg 2940
cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt cccgacgggg 3000
gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg ctgtctgcga 3060
gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca gcgctcaggt 3120
tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg atacctttga 3180
gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc ttggtggcga 3240
acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc tggtttttgt 3300
cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg gccacgcact 3360
tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc cagcctcggt 3420
tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc tcgttggtcc 3480
agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc tggtcctcgt 3540
ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca aagtagtcga 3600
tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc gcgcgctcgt 3660
aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg tacatgccgc 3720
agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg tagcagcgcc 3780
ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc agcatgttgg 3840
gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg aagatggcat 3900
gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct tgcaagccca 3960
ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc tcggcggtga 4020
cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac ttatcctccc 4080
ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc cagtactctt 4140
ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac tggttgacgg 4200
cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc gccttgcgga 4260
gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat tgatgtttga 4320
agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc tttttggagc 4380
gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct cgaggcatga 4440
agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg acctgggcgg 4500
ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc tccaaaaagc 4560
ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc tcctcgggcg 4620
attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc gccaggaagg 4680
atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt ctgaactgtc 4740
gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct ttctcccagg 4800
ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc tcgtcgcccc 4860
ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc atccaagtgt 4920
aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag ccgatcggga 4980
agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga aagtagaagt 5040
cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag tactggcagc 5100
gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg aggaagcgca 5160
gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct actttggttg 5220
tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc acgccgcgag 5280
agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca tcgcgcacat 5340
tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt tcctggaggt 5400
tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg atttcaaggg 5460
gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg gccacgatgg 5520
ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc ggtgacgcgg 5580
gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca ggggcacgtc 5640
ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt gcgcgacgac 5700
gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc ccgtgacctt 5760
gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg cctggcgcag 5820
gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga actgctcgat 5880
ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca ggtcgttgga 5940
gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga cccggctgta 6000
gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt tgagctccac 6060
gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca gggtggtggc 6120
ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt cattgatgtc 6180
ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt tgaaaaactg 6240
ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct cggcgacagt 6300
gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca cctcttcttc 6360
catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg gcgggggagg 6420
ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga tcatctcccc 6480
ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc gcagctcgaa 6540
gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga cggcgctgac 6600
tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg agtccagatc 6660
caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc aaggtaggct 6720
gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc tgctgatgat 6780
gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca tgtctttggg 6840
tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct gacaccggcg 6900
caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc cttcctcttc 6960
tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc ccctgagcgg 7020
ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct gcacctgagt 7080
gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg tgttgatggt 7140
gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct gcgagagctc 7200
cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc aagtccgcac 7260
cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg gccagcgctg 7320
ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc cgtagatgta 7380
cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt cgcggacccg 7440
gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct ggccggtgag 7500
gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta cagggctttc 7560
gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg ttcgagacca 7620
agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc gtctcgaccc 7680
aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc caagcgcccg 7740
tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc ttccgtagtc 7800
tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc ctatggcggc 7860
ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc aggaccccgc 7920
cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt tagatgcatc 7980
ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa cagcaggcat 8040
gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc gtgtcgggcg 8100
cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag tatctggact 8160
tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc cacccgcggg 8220
tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg tttcgcgacc 8280
gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg cgcgagctgc 8340
ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc gacacgcaga 8400
cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc gcctacgagc 8460
agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg cgcacgctgg 8520
tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg gaggcgatcg 8580
tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg cagcacagca 8640
gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag gggcgctggc 8700
tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc ctgagcctgg 8760
ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc tacgcccgca 8820
agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac agcttctaca 8880
tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac cgcaacgagc 8940
gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc gagctgatgc 9000
acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc gagtcctact 9060
tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag gcggcggggg 9120
cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag ctagaggagg 9180
gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca agatccgaac 9240
gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat taactcctct 9300
gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa ccccgaggct 9360
ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt agtgcccgcg 9420
cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc ggagagcagg 9480
gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg ggtggcgcgg 9540
tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt gcgcgaggcc 9600
gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt ggcgctaaac 9660
gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta caccaacttt 9720
ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta ccagtcgggg 9780
cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct gagccaggct 9840
ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg ggctacggtg 9900
tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc cttcacggac 9960
agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta ccgcgaggcc 10020
atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt gagccacgcg 10080
ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct gaccaacagg 10140
cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat cttgcgctac 10200
gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag cgtggcgctg 10260
gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc gtttatcaac 10320
cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt cactaatgcc 10380
attctgaatc cccactggat gccccctccg ggtttctaca acggggactt tgaggtgccc 10440
gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc acccaacccg 10500
ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc gaggagtctg 10560
gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg gggcagtagc 10620
cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc ccgcttgcta 10680
ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa gaacgctcag 10740
cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc cagatggaag 10800
acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt gccgccccct 10860
aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc cgaggacgat 10920
gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa ccccttttcg 10980
cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaataaa actcaccaag 11040
gccatggcga cgagcgttgg ttttttgttc ccttccttag tatgcggcgc gcggcgatgt 11100
tcgaggaggg gcctcccccc tcttacgaga gcgcgatggg gatttctcct gcggcgcccc 11160
tgcagcctcc ctacgtgcct cctcggtacc tgcaacctac aggggggaga aatagcatct 11220
gttactctga gctgcagccc ctgtacgata ccaccagact gtacctggtg gacaacaagt 11280
ccgcggacgt ggcctccctg aactaccaga acgaccacag cgattttttg accacggtga 11340
tccaaaacaa cgacttcacc ccaaccgagg ccagcaccca gaccataaac ctggataaca 11400
ggtcgaactg gggcggcgac ctgaagacca tcttgcacac caacatgccc aacgtgaacg 11460
agttcatgtt caccaactct tttaaggcgc gggtgatggt ggcgcgcgag cagggggagg 11520
cgaagtacga gtgggtggac ttcacgctgc ccgagggcaa ctactcagag accatgactc 11580
tcgacctgat gaacaatgcg atcgtggaac actatctgaa agtgggcagg cagaacgggg 11640
tgaaggaaag cgatatcggg gtcaagtttg acaccagaaa cttccgtctg ggctgggacc 11700
ccgtgaccgg gctggtcatg ccgggggtct acaccaacga ggcctttcat cccgacatag 11760
tgcttctgcc cggctgtggg gtggacttca cccagagccg gctgagcaac ctgctgggca 11820
ttcgcaagcg gcagcctttc caggagggtt tcaagatcac ctatgaggat ctgaaggggg 11880
gcaacattcc cgcgctcctt gatctggacg cctacgagga gagcttgaaa cccgaggaga 11940
gcgctggcga cagcggcgag agtggcgagg agcaagccgg cggcggtggc ggcgcgtcgg 12000
tagaaaacga aagtacgccc gcagtggcgg cggacgctgc ggaggtcgag ccggaggcca 12060
tgcagcagga cgcagaggag ggcgcacagg agggcgcgca gaaggacatg aacgatgggg 12120
agatcagggg agacacattc gccacccggg gcgaagaaaa agaggcagag gcggcggcgg 12180
cggcgacggc ggaggccgaa accgaggttg aggcagaggc agagcccgag accgaagtta 12240
tggaagacat gaatgatgga gaacgtaggg gcgacacgtt cgccacccgg ggcgaagaga 12300
aggcggcgga ggcagaagcc gcggctgagg aggcggctgc ggctgcggcc aagactgagg 12360
ctgcggctaa ggctgaggtc gaagccaatg ttgcggttga ggctcaggct gaggaggagg 12420
cggcggctga agcagttaag gaaaaggccc aggcagagca ggaagagaaa aaacctgtca 12480
ttcaacctct aaaagaagat agcaaaaagc gcagttacaa cgtcatcgag ggcagcacct 12540
ttacccagta ccgcagctgg tacctggcgt acaactacgg cgacccggtc aagggggtgc 12600
gctcgtggac cctgctctgc acgccggacg tcacctgcgg ctccgagcag atgtactggt 12660
cgctgccgaa catgatgcaa gacccggtga ccttccgctc cacgcggcag gttagcaact 12720
tcccggtggt gggcgccgaa ctgctgcccg tgcactccaa gagtttttac aacgagcagg 12780
ccgtctactc ccagctgatc cgccaggcca cctctctgac ccacgtgttc aatcgctttc 12840
ccgagaacca gattttggcg cgcccgccgg cccccaccat caccaccgtg agtgaaaacg 12900
ttcctgccct cacagatcac gggacgctac cgctgcgcaa cagcatctca ggagtccagc 12960
gagtgaccat tactgacgcc agacgccgga cctgccccta cgtttacaag gccttgggca 13020
tagtctcgcc gcgcgtcctc tccagtcgca ctttttaaaa cacatctacc cacacgttcc 13080
aaaatcatgt ccgtactcat ctcacccagc aacaacaccg gctgggggct gcgcgcgccc 13140
agcaagatgt ttggaggggc gaggaagcgc tccgaccagc accctgtgcg cgtgcgcggc 13200
cactaccgcg cgccctgggg agcgcacaag cgcgggcgca cagggcgcac cactgtggac 13260
gacgtcattg actccgtagt ggagcaagcg cgccactaca cacccggcgc gccgaccgcc 13320
cccgccgtgt ccaccgtgga ccaggcgatc gaaagcgtgg tacagggcgc gcggcactat 13380
gccaacctta aaagtcgccg ccgccgcgtg gcccgccgcc atcgccggag accccgggcc 13440
accgccgccg cgcgccttac taaggctctg ctcaggcgcg ccaggcgaac tggccaccgg 13500
gccgccatga gggccgcacg gcgggctgcc gctgccgcaa gcgtcgtggc cccgcgggca 13560
cgaaggcgcg cggccgctgc cgccgccgcc gccatttcca gcttggcctc gacgcggcgc 13620
ggtaacatat actgggtgcg cgactcggta accggcacgc gggtacccgt gcgctttcgc 13680
cccccgcgga attagcacaa gacaacatac acactgagtc tcctgctgtt gtgtatccca 13740
gcggcgaccg tcagcagcgg cgacatgtcc aagcgcaaaa ttaaagaaga gatgctccag 13800
gtcatcgcgc cggagatcta tgggcccccg aagaaggagg aggatgatta caagccccgc 13860
aagctaaagc gggtcaaaaa gaaaaagaaa gatgatgatg acgaggcggt ggagtttgtc 13920
cgccgcatgg cacccaggcg ccccgtgcag tggaagggcc ggcgcgtgca gcgcgttttg 13980
cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacgcgcac tttcaagcgg 14040
gtgtacgatg aggtgtacgg cgacgaggac ctgttggagc aggccaacca gcgctttggg 14100
gagtttgcat atgggaaacg gccccgcgag agtctaaaag aggacctgct ggcgctaccg 14160
ctggacgagg gcaatcccac cccgagtctg aagccggtaa ccctgcaaca ggtgctgcct 14220
ttgagcgcgc ccagcgagca taagcgaggg ttgaagcgcg aaggcgggga cctggcgccc 14280
accgtgcagt tgatggtgcc caagcggcag aagctggagg acgtgctgga gaaaatgaaa 14340
gtagagcccg ggatccagcc cgagatcaag gtccgcccca tcaagcaggt ggcgcccggc 14400
gtgggagtcc agaccgtgga cgttaggatt cccacggagg agatggaaac ccaaaccgcc 14460
actccctctt cggcggccag cgccaccacc ggcaccgctt cggtagaggt gcagacggac 14520
ccctggctac ccgccaccgc tgttgccgcc gccgcccccc gttcgcgcgg gcgcaagaga 14580
aattatccag cggccagcgc gctcatgccc cagtacgcac tgcatccatc catcgtgccc 14640
acccccggct accgcgggta ctcgtaccgc ccgcgcagat cagccggcac tcgcggccgc 14700
cgccgccgtg cgaccacaac cagccgccgc cgtcgccgcc gccgccagcc agtgctgacc 14760
cccgtgtctg taaggaaggt ggctcgctcg gggagcacgc tggtggtgcc cagagcgcgc 14820
taccacccca gcatcgttta aagccggtct ctgtatggtt cttgcagata tggccctcac 14880
ttgtcgcctc cgcttcccgg tgccgggata ccgaggaaga actcaccgcc gcagaggcat 14940
ggcgggcagc ggtctccgcg gcggccgtcg ccatcgccgg cgcgcaaaaa gcaggcgcat 15000
gcgcggcggt gtgctgcctc tgctaatccc gctaatcgcc gcggcgatcg gtgccgtacc 15060
cgggatcgcc tccgtggccc tgcaggcgtc ccagaaacgt tgactcttgc aaccttgcaa 15120
gcttgcattt tttggaggaa aaataaaaaa aagtctagac tctcacgctc gcttggtcct 15180
gtgactattt tgtagaaaaa aagatggaag acatcaactt tgcgtcgctg gccccgcgtc 15240
acggctcgcg cccgttcatg ggagactgga cagatatcgg caccagcaat atgagcggtg 15300
gcgccttcag ctggggcagt ctgtggagcg gccttaaaaa ttttggttcc accattaaga 15360
actatggcaa caaagcgtgg aacagcagca cgggccagat gctgagagac aagttgaaag 15420
agcagaactt ccaggagaag gtggcgcagg gcctggcctc tggcatcagc ggggtggtgg 15480
acatagctaa ccaggccgtg cagaaaaaga taaacagtca tctggacccc cgtcctcagg 15540
tggaggaaat gcctccagcg atggagacgg tgtctcccga gggcaaaggc gaaaagcgcc 15600
cgcggcccga cagagaagag accctggtgt cacacaccga ggagccgccc tcttacgagg 15660
aggcagtcaa ggccggcctg cccaccactc gccccatagc ccccatggcc accggtgtgg 15720
tgggccacag gcaacacact cccgcaacac tagatctgcc cccgccgtcc gagccgccgc 15780
gccagccaaa ggcggcgacg gtgcccgctc cctccacttc cgccgccaac agagtgcccc 15840
tgcgccgcgc cgcgagcggc ccccgggcct cgcgagttag cggcaactgg cagagcacac 15900
tgaacagcat cgtgggcctg ggagtgagga gtgtgaagcg ccgccgttgc tactgaatga 15960
gcaagctagc taacgtgttg tatgtgtgta tgcgtcctat gtcgccgcca gaggagctgt 16020
tgagccgccg gcgccgtctg cactccagcg aatttcaaga tggcgacccc atcgatgatg 16080
cctcagtggt cgtacatgca catctcgggc caggacgctt cggagtacct gagccccggg 16140
ctggtgcagt tcgcccgcgc cacagacacc tacttcaaca tgagtaacaa gttcaggaac 16200
cccactgtgg cgcccaccca cgatgtgacc acggaccggt cgcagcgcct gacgctgcgg 16260
ttcatccccg tggatcggga ggacaccgcc tactcttaca aggcgcggtt cacgctggcc 16320
gtgggcgaca accgcgtgct ggacatggcc tccacttact ttgacatcag gggggtgctg 16380
gacaggggcc ccaccttcaa gccctactcg ggtactgcct acaactccct ggcccccaag 16440
ggcgctccca attcttgcga gtgggaacaa gatgaaccag ctcaggcagc aatagctgaa 16500
gatgaagaag aacttgaaga agaacaagct caggacgaac aggcgcccac taagaaaacc 16560
catgtatacg cccaggcacc tctttctggt gaaaaaatta ctaaggatgg tttgcaaata 16620
ggtgtggatg ccacacaggc gggagataac cctatatatg ctgataaaac attccaaccc 16680
gaacctcaga taggtgagtc tcagtggaac gaggctgatg ccacagtagc aggaggcaga 16740
gtcttaaaaa agaccacccc tatgagacct tgctatggat cctatgccaa acctactaat 16800
gccaatggcg gtcaagggat catggtggcc aatgatcagg gagcgcttga atctaaagtt 16860
gagatgcaat ttttctccac cacaacgtct cttaatgtaa gggaaggtga aaacaatctt 16920
cagccaaaag tagtgctata cagcgaagat gttaacttgg aatcccctga cactcatttg 16980
tcttacaaac ctaaaaagga tgacaccaac tctaaaatca tgttgggtca gcaagccatg 17040
cccaacagac ccaacctcat tgcttttagg gacaacttta ttggacttat gtactacaac 17100
agcacaggca acatgggagt gctggcagga caggcctccc agctaaacgc tgtggtagac 17160
ttgcaagaca gaaacacaga gctgtcatac caactgatgc ttgattccat tggagacaga 17220
tcaagatact tttccatgtg gaaccaggca gtggacagct atgacccaga tgtcagaatc 17280
attgaaaacc atggggttga agatgagctg cccaactatt gctttcccct gggcggtatt 17340
ggaattacag acacatacca gtgcataaaa ccaaccgcag ctgctaataa cactacatgg 17400
tctaaggatg aagaatttag tgatcgcaat gaaatagggg tgggaaacaa cttcgccatg 17460
gagatcaaca tccaggccaa cctctggagg aacttcctct atgcgaacgt ggggctctac 17520
ctgccagaca agctcaagta caaccccacc aacgtggaca tctctgacaa ccccaacacc 17580
tatgactaca tgaacaagcg tgtggtggct cccggcctgg tggactgctt tgtcaatgtg 17640
ggagccaggt ggtccctgga ctacatggac aacgtcaacc ccttcaacca ccaccgcaat 17700
gcgggtctgc gctaccgctc catgatcctg ggcaacgggc gctacgtgcc cttccacatt 17760
caggtgcccc agaagttctt tgccatcaag aacctcctcc tcctgccggg ctcctacact 17820
tacgagtgga acttcaggaa ggatgtcaac atggtcctgc agagctctct gggcaatgac 17880
cttagggtgg acggggccag catcaagttt gacagcgtca ccctctatgc taccttcttc 17940
cccatggctc acaacaccgc ctccacgctc gaggccatgc tgaggaacga caccaacgac 18000
cagtccttca atgactacct ctctggggcc aacatgctct accccatccc cgccaaggcc 18060
accaacgtgc ccatctccat tccctctcgc aactgggccg ccttcagagg ctgggccttt 18120
acccgcctta agaccaagga aaccccctcc ctgggctcgg gttttgaccc ctactttgtc 18180
tactcgggat ccatccccta cctggatggc accttctacc tcaaccacac ttttaagaag 18240
atatccatca tgtatgactc ctccgtcagc tggccgggca atgaccgcct gctcaccccc 18300
aatgagttcg aggtcaagcg cgccgtggac ggcgagggct acaacgtggc ccagtgcaac 18360
atgaccaagg actggttcct ggtgcagatg ctggccaact acaacatagg ctaccagggc 18420
ttctacatcc cagagagcta caaggacagg atgtactcct tcttcagaaa tttccaaccc 18480
atgagcaggc aggtggtgga cgagaccaaa tacaaggact atcaggccat tggcatcact 18540
caccagcaca acaactcggg attcgtgggc tacctggctc ccaccatgcg cgaggggcag 18600
gcctaccccg ccaacttccc ctacccgttg ataggcaaaa ccgcggtcga cagcgtcacc 18660
cagaaaaagt tcctctgcga ccgcaccctc tggcgcatcc ccttctctag caacttcatg 18720
tccatgggtg cgctcacgga cctgggccag aacctgctct atgccaactc cgcccatgcg 18780
ctggacatga cttttgaggt ggaccccatg gacgagccca cccttctcta tattgtgttt 18840
gaagtgttcg acgtggtcag agtgcaccag ccgcaccgcg gtgtcatcga gaccgtgtac 18900
ctgcgcacgc ccttctcggc cggcaacgcc accacctaag gagacagcgc cgccgcctgc 18960
atgacgggtt ccaccgagca agagctcagg gccatcgcca gagacctggg atgcggaccc 19020
tattttttgg gcacctatga caaacgcttc ccgggcttca tctcccgaga caagctcgcc 19080
tgcgccatcg tcaacacggc cgcgcgcgag accgggggcg tgcactggct ggcctttggc 19140
tgggacccgc gctccaaaac ctgctacctc ttcgacccct ttggcttctc cgatcagcgc 19200
ctcagacaga tctatgagtt tgagtacgag gggctgctgc gccgcagcgc gcttgcctcc 19260
tcgcccgacc gctgcatcac ccttgagaag tccaccgaga ccgtgcaggg gccccactcg 19320
gccgcctgcg gtctcttctg ctgcatgttt ttgcacgcct ttgtgcgctg gccccagagt 19380
cccatggatc gcaaccccac catgaacttg ctcaagggag tgcccaacgc catgctccag 19440
agcccccagg tccagcccac cctgcgccac aaccaggaac agctctaccg cttcctggag 19500
cgccactccc cctacttccg cagtcacagc gcgcacatcc ggggggccac ctctttctgc 19560
cacttgcaag aaaacatgca agacggaaaa tgatgtacag ctcgcttttt aataaatgta 19620
aagactgtgc actttattta tacacgggct ctttctggtt atttattcaa caccgccgtc 19680
gccatctaga aatcgaaagg gttctgccgc gcgtcgccgt gcgccacggg cagagacacg 19740
ttgcgatact ggaagcggct cgcccactta aactcgggca ccaccatgcg gggcagtggt 19800
tcctcgggga agttctcgcc ccacagggtg cgggtcagct gcagcgcgct caggaggtcg 19860
ggagccgaga tcttgaagtc gcagttgggg ccggaaccct gcgcgcgcga gttgcggtac 19920
acggggttgc agcactggaa caccagcagg gccggattat gcacgctggc cagcaggctc 19980
tcgtcgctga tcatgtcgct gtccagatcc tccgcgttgc tcagggcgaa cggggtcatc 20040
ttgcagacct gcctgcccag gaaaggcggc agcccgggct tgccgttgca gtcgcagcgc 20100
aggggcatca gcaggtgccc gcggcccgac tgcgcctgcg ggtacagcgc gcgcatgaag 20160
gcttcgatct gcctgaaagc cacctgcgtc ttggctccct ccgaaaagaa catcccacag 20220
gacttgctgg agaactggtt cgcgggacag ctggcatcgt gcaggcagca gcgcgcgtcg 20280
gtgttggcga tctgcaccac gttgcgaccc caccggttct tcactatctt ggccttggaa 20340
gcctgctcct tcagcgcgcg ctggccgttc tcgctggtca catccatctc tatcacctgc 20400
tccttgttga tcatgtttgt accgtgcaga cacttcaggt cgccctccgt ctgggtgcag 20460
cggtgctccc acagcgcgca accggtgggc tcccaatttt tgtgggtcac ccccgcgtag 20520
gcctgcaggt aggcctgcaa gaagcgcccc atcatggcca caaaggtctt ctggctcgta 20580
aaggtcagct gcaggccgcg atgctcttcg ttcagccagg tcttgcagat ggcggccagc 20640
gcctcggtct gctcgggcag catcctaaaa tttgtcttca ggtcgttatc cacgtggtac 20700
ttgtccatca tggcgcgcgc cgcctccatg cccttctccc aggcggacac catgggcagg 20760
cttagggggt ttatcacttc caccggcgag gacaccgtac tttcgatttc ttcttcctcc 20820
ccctcttccc ggcgcgcgcc cacgctgctg cgcgctctca ccgcctgcac caaggggtcg 20880
tcttcaggca agcgccgcac cgagcgcttg ccgcccttga cctgcttaat cagcaccggc 20940
gggttgctga agcccaccat ggtcagcgcc gcctgctctt cttcgtcttc gctgtctacc 21000
actatctctg gggaagggct tctccgctct gcggcggcgc gcttcttttt tttcttggga 21060
gcggccgtga tggagtccgc cacggcgacg gaggtcgagg gcgtggggct gggggtgcgc 21120
ggtaccaggg cctcgtcgcc ctcggactct tcctctgact ccaggcggcg gcggagtcgc 21180
ttctttgggg gcgcgcgcgt cagcggcggc ggagacgggg acggggacgg ggacgggacg 21240
ccctccacag ggggtggtct tcgcgcagac ccgcggccgc gctcgggggt cttctcgagc 21300
tggtcttggt cccgactggc cattgtatcc tcctcctcct aggcagagag acataaggag 21360
tctatcatgc aagtcgagaa ggaggagagc ttaaccaccc cctctgagac cgccgatgcg 21420
cccgccgtcg ccgtcgcccc cgctgccgcc gacgcgcccg ccacaccgag cgacaccccc 21480
gcggaccccc ccgccgacgc acccctgttc gaggaagcgg ccgtggagca ggacccgggc 21540
tttgtctcgg cagaggagga tttgcgagag gaggaggata aggagaagaa gccctcagtg 21600
ccaaaagatg ataaagagca agacgagcac gacgcagatg cacaccaggg tgaagtcggg 21660
cggggggacg gagggcatga cggcgccgac tacctagacg aagggaacga cgtgctcttg 21720
aagcacctgc atcgtcagtg cgccattgtt tgcgacgctc tgcaggagcg cagcgaagtg 21780
cccctcagcg tggcggaggt cagccacgcc tacgagctca gcctcttctc cccccgggtg 21840
cccccccgcc gccgcgaaaa cggcacatgc gagcccaacc cgcgcctcaa cttctacccc 21900
gcctttgtgg tacccgaggt cctggccacc tatcacatct tctttcaaaa ttgcaagatc 21960
cccctctcgt gccgcgccaa ccgtagccgc gccgataaga tgctggccct gcgccagggc 22020
gaccacatac ctgatatcgc cgctttggaa gatgtaccaa agatcttcga gggtctgggt 22080
cgcaacgaga agcgggcagc aaactctctg caacaggaaa acagcgaaaa tgagagtcac 22140
accggggtac tggtggagct cgagggcgac aacgcccgcc tggcggtggt caagcgcagc 22200
atcgaggtca cccactttgc ctaccccgcg ctaaacctgc cccccaaagt catgaacgcg 22260
gccatggacg ggctgatcat gcgccgcggc cggcccctcg ctccagatgc aaacttgcat 22320
gaggagaccg aggacggcca gcccgtggtc agcgacgagc agctggcgcg ctggctggag 22380
accgcggacc ccgccgaact ggaggagcgg cgcaagatga tgatggccgt ggtgctggtc 22440
accgtagagc tggagtgtct gcagcgcttc ttcggcgacc ccgagatgca gagaaaggtc 22500
gaggagaccc tgcactacac cttccgccag ggctacgtgc gccaggcttg caagatctcc 22560
aacgtggagc tcagcaacct ggtgtcctac ctgggcatct tgcatgagaa ccgcctcggg 22620
cagagcgtgc tgcactccac cctgcgcggg gaggcgcgcc gcgactacgt gcgcgactgc 22680
gtttacctct tcctctgcta cacctggcag acggccatgg gggtctggca gcagtgcctg 22740
gaggagcgca acctcaagga gctggagaag ctcctgcagc gcgcgctcaa agatctctgg 22800
acgggctaca acgagcgctc ggtggccgcc gcgctggccg acctcatctt ccccgagcgc 22860
ctgctcaaaa ccctccagca ggggctgccc gacttcacca gccaaagcat gttgcaaaac 22920
ttcaggaact ttatcctgga gcgttctggc atcctacccg ccacctgctg cgccctgccc 22980
agcgactttg tccccctcgt gtaccgcgag tgccccccgc cgctgtgggg tcactgctac 23040
ctgttccaac tggccaacta cctgtcctac cacgcggacc tcatggagga ctccagcggc 23100
gaggggctca tggagtgcca ctgccgctgc aacctctgca cgccccaccg ctccctggtc 23160
tgcaacaccc aactgctcag cgagagtcag attatcggta ccttcgagct acagggtccg 23220
tcctcctcag acgagaagtc cgcggctccg gggctaaaac tcactccggg gctgtggact 23280
tccgcctacc tgcgcaaatt tgtacctgaa gactaccacg cccacgagat caggttttac 23340
gaagaccaat cccgcccgcc caaggcggag ctgaccgcct gcgtcatcac ccagggcgag 23400
atcctaggcc aattgcaagc catccaaaaa gcccgccaag actttttgct gaagaagggt 23460
cggggggtgt atctggaccc ccagtcgggt gaggagctca acccggttcc cccgctgccg 23520
ccgccgcggg accttgcttc ccaggataag catcgccatg gctcccagaa agaagcagca 23580
gcggccgcca ctgccgccac cccacatgct ggaggaagag gaggaatact gggacagtca 23640
ggcagaggag gtttcggacg aggaggagcc ggagacggag atggaagagt gggaggagga 23700
cagcttagac gaggaggctt ccgaagccga agaggcagac gcaacaccgt caccctcggc 23760
cgcagccccc tcgcaggcgc ccccgaagtc cgctcccagc atcagcagca acagcagcgc 23820
tataacctcc gctcctccac cgccgcgacc cacggccgac cgcagaccca accgtagatg 23880
ggacaccacc ggaaccgggg ccggtaagtc ctccgggaga ggcaagcaag cgcagcgcca 23940
aggctaccgc tcgtggcgcg ctcacaagaa cgccatagtc gcttgcttgc aagactgcgg 24000
ggggaacatc tccttcgccc gccgcttcct gctcttccac cacggtgtgg ccttcccccg 24060
taacgtcctg cattactacc gtcatctcta cagcccctac tgcggcggca gtgagccaga 24120
gacggtcggc ggcggcggcg gcgcccgttt cggcgcctag gaagacccag ggcaagactt 24180
cagccaagaa actcgcggcg gccgcggcga acgcggtcgc gggggccctg cgcctgacgg 24240
tgaacgaacc cctgtcgacc cgcgaactga ggaaccgaat cttccccact ctctatgcca 24300
tcttccagca gagcagaggg caggatcagg aactgaaagt aaaaaacagg tctctgcgct 24360
ccctcacccg cagctgtctg tatcacaaga gcgaagacca gcttcggcgc acgctggagg 24420
acgctgaggc actcttcagc aaatactgcg cgctcactct taaggactag ctccgcgccc 24480
ttctcgaatt taggcgggaa cgcctacgtc atcgcagcgc cgccgtcatg agcaaggaca 24540
ttcccacgcc atacatgtgg agctatcagc cgcagatggg actcgcggcg ggcgcctccc 24600
aagactactc cacccgcatg aactggctca gtgccggccc acacatgatc tcacaggtta 24660
atgatatccg cacccatcga aaccaaatat tggtggagca ggcggcaatt accaccacgc 24720
cccgcaataa tcccaacccc agggagtggc ccgcgtccct ggtgtatcag gaaattcccg 24780
gccccaccac cgtactactt ccgcgtgatt cccaggccga agtccaaatg actaactcag 24840
gggcacagct cgcgggcggc tgtcgtcaca gggtgcggcc tcctcgccag ggtataactc 24900
acctggagat ccgaggcaga ggtattcagc tcaacgacga gtcggtgagc tcctcgctcg 24960
gtctcagacc tgacgggacc ttccagatag ccggagccgg ccgatcttcc ttcacgcccc 25020
gccaggcgta cctgactctg caaagctcgt cctcggcgcc gcgctcgggc ggcatcggga 25080
ctctccagtt cgtgcaggag tttgtgccct cggtctactt caaccccttc tcgggctctc 25140
ccggtcgcta cccggaccag ttcatctcga actttgacgc cgcgagggac tcggtggacg 25200
gctacgactg aatgtcgggt ggacccggtg cagagcaact tcgcctgaag cacctcgacc 25260
actgccgccg ccctcagtgc tttgcccgct gtcagaccgg tgagttccag tacttttccc 25320
tgcccgactc gcacccggac ggcccggcgc acggggtgcg ctttttcatc ccgagtcagg 25380
tgcgctctac cctaatcagg gagtttaccg cccgtcccct actggcggag ttggaaaagg 25440
ggccttctat cctaaccatt gcctgcatct gctctaaccc tggattgcac caagatcttt 25500
gctgtcattt gtgtgctgag tataataaag gctgagatca gaatctactc gggctcctgt 25560
cgccatcctg tcaacgccac cgtccaagcc cggcccgatc agcccgaggt gaacctcacc 25620
tgcggtctgc accggcgcct gaggaaatac ctagcttggt actacaacag cactcccttt 25680
gtggtttaca acagctttga ccaggacggg gtctcactga gggataacct ctcgaacctg 25740
agctactcca tcaggaagaa cagcaccctc gagctacttc ctccttacct gcccgggact 25800
taccagtgtg tcaccggtcc ctgcacccac acccacctgt tgatcgtaaa cgactctctt 25860
ccgagaacag acctcaataa ctcctcttcg cagttcccca gaacaggagg tgagctcagg 25920
aaaccccggg taaagaaggg tggacgagag ttaacacttg tggggtttct ggtgtatgtg 25980
acgctggtgg tggctctttt gattaaggct tttccttcca tgtctgaact ctccctcttc 26040
ttttatgaac aactcgacta gtgctaacgg gaccctaccc aacgaatcgg gattgaatat 26100
cggtaaccag gttgcagttt cacttttgat taccttcata gtcctcttcc tgctagtgct 26160
gtcgcttctg tgcctgcgga tcgggggctg ctgcatccac gtttatatct ggtgctggct 26220
gtttagaagg ttcggagacc atcgcaggta gaataaacat gctgctgctt accctctttg 26280
tcctggcgct ggccgccagc tgccaagcct tttccgaggc tgactttata gagccccagt 26340
gtaatgtgac ttttaaagcc catgcacagc gttgtcatac tataatcaaa tgtgccaccg 26400
aacacgatga ataccttatc cagtataaag ataaatcaca caaagtggca cttgttgaca 26460
tctggaaacc cgaagaccct ttggaataca atgtgaccgt tttccagggt gacctcttca 26520
aaatttacaa ttacactttc ccatttgacc agatgtgtga ctttgtcatg tacatggaaa 26580
agcagcacaa gctgtggcct ccgactcccc agggctgtgt ggaaaatcca ggctctttct 26640
gcatgatctc tctctgtgta actgtgctgg cactaatact cacgcttttg tatatcagat 26700
ttaaatcaag gcaaagcttc attgatgaaa agaaaatgcc ttaatcgctt tcacgcttga 26760
ttgctaacac cgggttttta tccgcagaat gattggaatc accctactaa tcacctccct 26820
ccttgcgatt gcccatgggt tggaacgaat cgaagtccct gtgggggcca atgttaccct 26880
ggtggggcct gtcggcaatg ctacattaat gtgggaaaaa tatactaaaa atcaatgggt 26940
ctcttactgc actaacaaaa atagccacaa gcccagagcc atctgcgatg ggcaaaatct 27000
aaccttgatt gatgttcaat tgctggatgc gggctactat tatgggcagc tgggtacaat 27060
gattaattac tggagacccc acagagatta catgctccac gtagtaaagg gtccccttag 27120
cagcccaccc actaccacct ctactacccc cactaccacc actactccca ccaccagcac 27180
tgccgcccag cctcctcata gcagaacaac cacttttatc aattccaagt cccactcccc 27240
ccacattgcc ggcgggccct ccgcctcaga ctccgaaacc accgagatct gcttctgcaa 27300
atgctctgac gccattgccc aggatttgga agatcacgag gaagatgagc atgacttcgc 27360
agatgcatgc caggcatcag agccagaagc gctgccggtg gccctcaaac agtatgcaga 27420
cccccacacc acccccgacc ttcctccacc ttcccagaag ccaagtttcc tgggggaaaa 27480
tgaaactctg cctctctcca tactcgctct gacatctgtt gctatgttga ccgctctgct 27540
ggtgcttcta tgctctatat gctacctgat ctgctgcaga aagaaaaaat ctcacggcca 27600
tgctcaccag cccctcatgc acttccctta ccctccagag ctgggcgacc acaaacttta 27660
agtctgcagt aactatctgc ccatcccttg tcagtcgaca gcgatgagcc ccactaatct 27720
aacggcctct ggacttacaa catcgtctct taatgagacc accgctcctc aagacctgta 27780
cgatggtgtc tccgcgctgg ttaaccagtg ggatcacctg ggcatatggt ggctcctcat 27840
aggagcagtg accctgtgcc taatcctggt ctggatcatc tgctgcatca aaagcagaag 27900
acccaggcgg cggcccatct acaggccctt tgtcatcaca cctgaagatg atgatgacac 27960
cacttccagg ctgcagaggc taaagcagct actcttctct tttacagcat ggtaaattga 28020
atcatgcctc gcattttcat ctacttgtct ctccttccac tttttctggg ctcttctaca 28080
ttggccgctg tgtcccacat cgaggtagac tgcctcacgc ccttcacagt ctacctgctt 28140
ttcggctttg tcatctgcac ctttgtctgc agcgttatca ctgtagtgat ctgcttcata 28200
cagtgcatcg actacgtctg cgtgcgggtg gcttacttta gacaccaccc ccagtatcgc 28260
aacagggaca tagcggctct cctaagactt gtttaaaatc atggccaaat taactgtgat 28320
tggtcttctg atcatctgct gcgtcctagc cgcgattggg actcaagctc ctaccaccac 28380
cagcgctccc agaaagagac atgtatcctg cagcttcaag cgtccctgga atatacccca 28440
atgctttact gatgaacctg aaatctcttt ggcttggtac ttcagcgtca ccgcccttct 28500
tatcttctgc agtacggtta ttgcccttgc catctaccct tcccttgacc tgggctggaa 28560
tgctgtcaac tctatggaat atcccacctt cccagaacca gacctgccag acctggttgt 28620
tctaaacgcg tttcctcctc ctgctcccgt tcaaaatcag tttcgccctc cgtcccccac 28680
gcccactgag gtcagctact ttaatctaac aggcggagat gactgaaaac ctagacctag 28740
aaatggacgg tctctgcagc gagcaacgca cactagagag gcgccggcaa aaagagctcg 28800
agcgtcttaa acaagagctc caagacgcgg tggccataca ccagtgcaaa aaaggtgtct 28860
tctgtctggt aaaacaggcc acgctcacct atgaaaaaac aggtgacacc caccgcctag 28920
gatacaagct gcccacacag cgccaaaagt tcgccctcat gataggcgaa caacccatca 28980
ccgtgaccca gcactccgtg gagacagaag gctgcataca tgctccctgt aggggcgctg 29040
actgcctcta caccttgatc aaaaccctct gcggtctcag agaccttatc cctttcaatt 29100
aatcataact gtaatcaata aaaaatcact tacttgaaat ctgatagcaa gcctctgtcc 29160
aattttttca gcaacacttc cttcccctcc tcccaactct ggtactctag gcgcctccta 29220
gctgcaaact tcctccacag tctgaaggga atgtcagatt cctcctcctg tccctccgca 29280
cccacgatct tcatgttgtt gcagatgaaa cgcgcgagat cgtctgacga gaccttcaac 29340
cccgtgtacc cctacgatac cgagatcgct ccgacttctg tccctttcct tacccctccc 29400
tttgtgtcat ccgcaggaat gcaagaaaat ccagctgggg tgctgtccct gcacttgtca 29460
gagcccctta ccacccacaa tggggccctg actctaaaaa tggggggcgg cctgaccctg 29520
gacaaggaag ggaatctcac ttcccaaaac atcaccagtg tcgatccccc tctcaaaaaa 29580
agcaagaaca acatcagcct tcagaccgcc gcacccctcg ccgtcagctc cggggcccta 29640
acactttttg ccactccccc cctagcggtc agtggtgaca accttactgt gcagtctcag 29700
gcccctctca ctttggaaga ctcaaaacta actctggcca ccaaaggacc cctaactgtg 29760
tccgaaggca aacttgtcct agaaacagag gctcccctgc atgcaagtga cagcagcagc 29820
ctgggcctta gcgttacggc cccacttagc attaacaatg acagcctagg actagatctg 29880
caggcaccca ttgtctctca aaatggaaaa ctggctctaa atgtagcagg ccccctagct 29940
gtggccaatg gcattaatgc tttgacagta ggcacaggca aaggtattgg tctaaatgaa 30000
accagcactc acttgcaagc aaagttggtc gcccccctag gctttgatac caatggcaac 30060
attaagctaa gcgttgcagg aggcatgaga ctaaataatg acacacttat actagatgta 30120
aactacccat ttgaagctca aggccaacta agtctaagag tgggccaggg tccgctgtat 30180
gtagattcta gcagccataa cctgaccatt agatgcctta gaggattata cataacatcg 30240
tctaataacc aaaccggtct agaggccaac ataaaactaa caaaaggcct tgtctatgat 30300
ggaaatgcca tagcagtcaa tgttggtcaa ggattgcaat acagcactac tgccacatcg 30360
gaaggtgtgt atcctataca gtctaagata ggtttgggaa tggaatatga taccaacgga 30420
gccatgatga caaaactagg ctctggacta agctttgaca attcaggagc cattgtagtg 30480
ggaaacaaaa atgatgacag gcttactctg tggactacac cagacccatc tcctaactgt 30540
agaatttatt ctgaaaaaga tactaaacta accttggtgc tgactaagtg tggcagccaa 30600
atcctaggca cagtatctgc ccttgctgtc agaggcagcc ttgcgcccat cactaatgca 30660
tccagcatag tccaaatatt tctaagattt gatgaaaatg gactattgat gagcaactca 30720
tcgctagacg gtgattactg gaattacaga aatggggact ccactaatag cacaccatat 30780
acaaatgcag taggctttat gcctaatcta gcagcctatc ctaaaggtca ggctacagct 30840
gcaaaaagca gtattgtaag ccaggtatac atggatggtg acactactaa acctataaca 30900
ctaaaaataa acttcaatgg cattgatgaa acaacagaaa atacccctgt tagtaaatat 30960
tccatgacat tctcatggag ctggcccacc gcaagctaca taggccacac ttttgcaaca 31020
aactctttta ctttctccta catcgcccaa gaataaagaa agcacagaga tgcttgtttt 31080
gatttcaaaa ttgtgtgctt ttatttattt tcagcttaca gtatttccag tagtcattcg 31140
aataaagctt aatcaaactg catgagaacc cttccacata gcttaaatta gcaccagtgc 31200
aaatggagaa aagcctcgag gtcgttgcgc ggccgggatc ggtgatcacc gatccagaca 31260
tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct 31320
ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac 31380
aagttcccgg atcgcgatcc ggcccgaggc tgtagccgac gatggtgcgc caggagagtt 31440
gttgattcat tgtttgcctc cctgctgcgg tttttcaccg aagttcatgc cagtccagcg 31500
tttttgcagc agaaaagccg ccgacttcgg tttgcggtcg cgagtgaaga tccctttctt 31560
gttaccgcca acgcgcaata tgccttgcga ggtcgcaaaa tcggcgaaat tccatacctg 31620
ttcaccgacg acggcgctga cgcgatcaaa gacgcggtga tacatatcca gccatgcaca 31680
ctgatactct tcactccaca tgtcggtgta cattgagtgc agcccggcta acgtatccac 31740
gccgtattcg gtgatgataa tcggctgatg cagtttctcc tgccaggcca gaagttcttt 31800
ttccagtacc ttctctgccg tttccaaatc gccgctttgg acataccatc cgtaataacg 31860
gttcaggcac agcacatcaa agagatcgct gatggtatcg gtgtgagcgt cgcagaacat 31920
tacattgacg caggtgatcg gacgcgtcgg gtcgagttta cgcgttgctt ccgccagtgg 31980
cgcgaaatat tcccgtgcac cttgcggacg ggtatccggt tcgttggcaa tactccacat 32040
caccacgctt gggtggtttt tgtcacgcgc tatcagctct ttaatcgcct gtaagtgcgc 32100
ttgctgagtt tccccgttga ctgcctcttc gctgtacagt tctttcggct tgttgcccgc 32160
ttcgaaacca atgcctaaag agaggttaaa gccgacagca gcagtttcat caatcaccac 32220
gatgccatgt tcatctgccc agtcgagcat ctcttcagcg taagggtaat gcgaggtacg 32280
gtaggagttg gccccaatcc agtccattaa tgcgtggtcg tgcaccatca gcacgttatc 32340
gaatcctttg ccacgcaagt ccgcatcttc atgacgacca aagccagtaa agtagaacgg 32400
tttgtggtta atcaggaact gttcgccctt cactgccact gaccggatgc cgacgcgaag 32460
cgggtagata tcacactctg tctggctttt ggctgtgacg cacagttcat agagataacc 32520
ttcacccggt tgccagaggt gcggattcac cacttgcaaa gtcccgctag tgccttgtcc 32580
agttgcaacc acctgttgat ccgcatcacg cagttcaacg ctgacatcac cattggccac 32640
cacctgccag tcaacagacg cgtggttaca gtcttgcgcg acatgcgtca ccacggtgat 32700
atcgtccacc caggtgttcg gcgtggtg 32728
<210> 26
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> IL-2核心启动子
<400> 26
acattttgac acccccataa tatttttcca gaattaacag tataaattgc atctcttgtt 60
caagagttcc ctatcactct ctttaatcac tactcacagt aacctcaact cctg 114
<210> 27
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> IL-2最小启动子
<400> 27
tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac tcctg 55
<210> 28
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> IL-2增强子和启动子变体
<400> 28
tgatatcttt tctgagttac ttttgtatcc ccaccccctt aaagaaagga ggaaaaactg 60
tttcatacag aaggcgttaa ttgcatgaat tagagctatc acctaagtgt gggctaatgt 120
aacaaagagg gatttcacct acatccattc agtcagtctt tgggggttta aagaaattcc 180
aaagagtcat cagaagagga aaaatgaagg taatgttttt tcagactggt aaagtctttg 240
aaaatatgtg taatatgtaa aacattttga cacccccata atatttttcc agaattaaca 300
gtataaattg catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag 360
taacctcaac tcctgccaca 380
<210> 29
<211> 373
<212> DNA
<213> 人工序列
<220>
<223> L-2增强子和启动子变体
<400> 29
ttttctgagt tacttttgta tccccacccc cttaaagaaa ggaggaaaaa ctgtttcata 60
cagaaggcgt taattgcatg aattagagct atcacctaag tgtgggctaa tgtaacaaag 120
agggatttca cctacatcca ttcagtcagt ctttgggggt ttaaagaaat tccaaagagt 180
catcagaaga ggaaaaatga aggtaatgtt ttttcagact ggtaaagtct ttgaaaatat 240
gtgtaatatg taaaacattt tgacaccccc ataatatttt tccagaatta acagtataaa 300
ttgcatctct tgttcaagag ttccctatca ctctctttaa tcactactca cagtaacctc 360
aactcctgcc aca 373
<210> 30
<211> 161
<212> DNA
<213> 人工序列
<220>
<223> (NF-?B)1-IL2启动子变体
<400> 30
aattggtccc atcgaagagg gatttcacct acataattgg tcccgggaca ttttgacacc 60
cccataatat ttttccagaa ttaacagtat aaattgcatc tcttgttcaa gagttcccta 120
tcactctctt taatcactac tcacagtaac ctcaactcct g 161
<210> 31
<211> 201
<212> DNA
<213> 人工序列
<220>
<223> (NF-?B)3-IL2启动子变体
<400> 31
aattggtccc atcgaagagg gatttcacct acataagagg gatttcacct acataagagg 60
gatttcacct acataattgg tcccgggaca ttttgacacc cccataatat ttttccagaa 120
ttaacagtat aaattgcatc tcttgttcaa gagttcccta tcactctctt taatcactac 180
tcacagtaac ctcaactcct g 201
<210> 32
<211> 268
<212> DNA
<213> 人工序列
<220>
<223> (NF-?B)6-IL2启动子变体
<400> 32
aattggtccc atcgaagagg gatttcacct acataagagg gatttcacct acataagagg 60
gatttcacct acataattgg taagagggat ttcacctaca taagagggat ttcacctaca 120
taagagggat ttcacctaca taattggtcc cgggacattt tgacaccccc ataatatttt 180
tccagaatta acagtataaa ttgcatctct tgttcaagag ttccctatca ctctctttaa 240
tcactactca cagtaacctc aactcctg 268
<210> 33
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 1X NFAT反应元件-IL2启动子变体
<400> 33
aattggtccc atcgaattag gaggaaaaac tgtttcatac agaaggcgtc aattggtccc 60
gggacatttt gacaccccca taatattttt ccagaattaa cagtataaat tgcatctctt 120
gttcaagagt tccctatcac tctctttaat cactactcac agtaacctca actcctg 177
<210> 34
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> 3X NFAT反应元件-IL2启动子变体
<400> 34
tgatatcaat tggtcccatc gaattaggag gaaaaactgt ttcatacaga aggcgtcaat 60
taggaggaaa aactgtttca tacagaaggc gtcaattagg aggaaaaact gtttcataca 120
gaaggcgtca attggtcccg ggacattttg acacccccat aatatttttc cagaattaac 180
agtataaatt gcatctcttg ttcaagagtt ccctatcact ctctttaatc actactcaca 240
gtaacctcaa ctcctg 256
<210> 35
<211> 249
<212> DNA
<213> 人工序列
<220>
<223> 3X NFAT反应元件-IL2启动子变体
<400> 35
aattggtccc atcgaattag gaggaaaaac tgtttcatac agaaggcgtc aattaggagg 60
aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa actgtttcat acagaaggcg 120
tcaattggtc ccgggacatt ttgacacccc cataatattt ttccagaatt aacagtataa 180
attgcatctc ttgttcaaga gttccctatc actctcttta atcactactc acagtaacct 240
caactcctg 249
<210> 36
<211> 358
<212> DNA
<213> 人工序列
<220>
<223> 6X NFAT反应元件-IL2启动子变体
<400> 36
gaattaggag gaaaaactgt ttcatacaga aggcgtcaat taggaggaaa aactgtttca 60
tacagaaggc gtcaattagg aggaaaaact gtttcataca gaaggcgtca attggtccca 120
tcgaattagg aggaaaaact gtttcataca gaaggcgtca attaggagga aaaactgttt 180
catacagaag gcgtcaatta ggaggaaaaa ctgtttcata cagaaggcgt caattggtcc 240
cgggacattt tgacaccccc ataatatttt tccagaatta acagtataaa ttgcatctct 300
tgttcaagag ttccctatca ctctccttaa tcactactca cagtaacctc aactcctg 358
<210> 37
<211> 374
<212> DNA
<213> 人工序列
<220>
<223> 6X NFAT反应元件-IL2启动子变体
<400> 37
tgatatcgaa ttaggaggaa aaactgtttc atacagaagg cgtcaattag gaggaaaaac 60
tgtttcatac agaaggcgtc aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt 120
ggtcccatcg aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa 180
actgtttcat acagaaggcg tcaattagga ggaaaaactg tttcatacag aaggcgtcaa 240
ttggtcccgg gacattttga cacccccata atatttttcc agaattaaca gtataaattg 300
catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac 360
tcctgaattc catg 374
<210> 38
<211> 358
<212> DNA
<213> 人工序列
<220>
<223> 6X NFAT反应元件-IL2启动子变体
<400> 38
gaattaggag gaaaaactgt ttcatacaga aggcgtcaat taggaggaaa aactgtttca 60
tacagaaggc gtcaattagg aggaaaaact gtttcataca gaaggcgtca attggtccca 120
tcgaattagg aggaaaaact gtttcataca gaaggcgtca attaggagga aaaactgttt 180
catacagaag gcgtcaatta ggaggaaaaa ctgtttcata cagaaggcgt caattggtcc 240
cgggacattt tgacaccccc ataatatttt tccagaatta acagtataaa ttgcatctct 300
tgttcaagag ttccctatca ctctctttaa tcactactca cagtaacctc aactcctg 358
<210> 39
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> 6X NFAT反应元件-IL2启动子变体
<400> 39
tgatatcgaa ttaggaggaa aaactgtttc atacagaagg cgtcaattag gaggaaaaac 60
tgtttcatac agaaggcgtc aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt 120
ggtcccatcg aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa 180
actgtttcat acagaaggcg tcaattagga ggaaaaactg tttcatacag aaggcgtcaa 240
ttggtcccgg gacattttga cacccccata atatttttcc agaattaaca gtataaattg 300
catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac 360
tcctg 365
<210> 40
<211> 244
<212> DNA
<213> 人工序列
<220>
<223> 人EEF1A1启动子变体
<400> 40
gagcgtgcgt gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc cacagtcccc 60
gagaagttgg ggggaggggg tcggcgattg aaccggtgcc tagagaaggt ggcgcggggt 120
aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc 180
gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac 240
acag 244
<210> 41
<211> 236
<212> DNA
<213> 人工序列
<220>
<223> 人EEF1A1启动子变体
<400> 41
gcgtgaggct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag 60
ttggggggag gggtcggcaa ttgaaccggt gcctagagaa ggtggcgcgg ggtaaactgg 120
gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata 180
agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacaca 236
<210> 42
<211> 1266
<212> DNA
<213> 人工序列
<220>
<223> 人EEF1A1启动子和增强子
<400> 42
gagctttgca aagatggata aagttttaaa cagagaggaa tctttgcagc taatggacct 60
tctaggtctt gaaaggagtg ggaattggct ccggtgcccg tcagtgggca gagcgcacat 120
cgcccacagt ccccgagaag ttggggggag gggtcggcaa ttgaaccggt gcctagagaa 180
ggtggcgcgg ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg 240
gtgggggaga accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt 300
ttgccgccag aacacaggta agtgccgtgt gtggttcccg cgggcctggc ctctttacgg 360
gttatggccc ttgcgtgcct tgaattactt ccacctggct gcagtacgtg attcttgatc 420
ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt 480
cgcctcgtgc ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt 540
ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat 600
gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caagatctgc 660
acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca 720
catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc 780
aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg 840
cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc 900
ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac 960
ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt 1020
accgggcgcc gtccaggcac ctcgattagt tctcgagctt ttggagtacg tcgtctttag 1080
gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag 1140
ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt gagtttggat 1200
cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt 1260
cgtgag 1266
<210> 43
<211> 571
<212> DNA
<213> 人工序列
<220>
<223> 人UBC启动子
<400> 43
ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60
ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120
cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180
gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240
aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300
gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360
cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420
gggtacgtgc gctcggggtt ggcgagtgtg ttttgtgaag ttttttaggc accttttgaa 480
atgtaatcat ttgggtcaat atgtaatttt cagtgttaga ctagtaaatt gtccgctaaa 540
ttctggccgt ttttggcttt tttgttagac g 571
<210> 44
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 合成的最小启动子 1
<400> 44
aggtctatat aagcagagct cgtttagtga accctcattc tggagacgga tcccgagccg 60
agtgttttga cctccataga a 81
<210> 45
<211> 151
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV16 E6氨基酸
<400> 45
Met Phe Gln Asp Pro Gln Glu Arg Pro Arg Lys Leu Pro Gln Leu Cys
1 5 10 15
Thr Ala Leu Gln Thr Thr Ile His Asp Ile Ile Leu Glu Cys Val Tyr
20 25 30
Cys Lys Gln Gln Leu Leu Arg Arg Glu Val Tyr Asp Phe Ala Phe Arg
35 40 45
Asp Gly Cys Ile Val Tyr Arg Asp Gly Asn Pro Tyr Ala Val Cys Asp
50 55 60
Lys Cys Leu Lys Phe Tyr Ser Lys Ile Ser Glu Tyr Arg His Tyr Cys
65 70 75 80
Tyr Ser Leu Tyr Gly Thr Thr Leu Glu Gln Gln Tyr Asn Lys Pro Leu
85 90 95
Cys Asp Leu Leu Ile Arg Cys Ile Asn Cys Gln Lys Pro Leu Cys Pro
100 105 110
Glu Glu Lys Gln Arg His Leu Asp Lys Lys Gln Arg Phe His Asn Ile
115 120 125
Arg Gly Arg Trp Thr Gly Arg Cys Met Ser Cys Cys Arg Ser Ser Arg
130 135 140
Thr Arg Arg Ala Ala Ala Ala
145 150
<210> 46
<211> 98
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV16 E7氨基酸
<400> 46
Met Pro Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln
1 5 10 15
Pro Glu Thr Thr Asp Leu Tyr Gly Tyr Glu Gln Leu Asn Asp Ser Ser
20 25 30
Glu Glu Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Ala Pro Asp
35 40 45
Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr
50 55 60
Leu Arg Arg Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu
65 70 75 80
Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln
85 90 95
Lys Pro
<210> 47
<211> 58
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV16 E5氨基酸
<400> 47
Met Thr Asn Leu Asp Thr Ala Ser Thr Thr Leu Leu Ala Cys Phe Leu
1 5 10 15
Leu Cys Phe Cys Val Leu Leu Cys Val Cys Leu Leu Ile Arg Pro Leu
20 25 30
Leu Leu Ser Val Ser Thr Tyr Thr Arg Cys Phe Ile Val Tyr Ile Ile
35 40 45
Phe Val Tyr Ile Pro Leu Phe Leu Ile His
50 55
<210> 48
<211> 120
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV18 E6氨基酸
<400> 48
Met Ala Arg Phe Glu Asp Pro Thr Arg Arg Pro Tyr Lys Leu Pro Asp
1 5 10 15
Leu Cys Thr Ala Leu Asn Thr Ser Leu Gln Asp Ile Glu Ile Thr Cys
20 25 30
Val Tyr Cys Lys Thr Val Leu Glu Leu Thr Glu Val Phe Glu Phe Ala
35 40 45
Phe Lys Asp Gly Phe Val Val Tyr Arg Asp Ser Ile Pro His Ala Ala
50 55 60
Cys His Lys Cys Ile Asp Phe Tyr Ser Arg Ile Arg Glu Leu Arg His
65 70 75 80
Tyr Ser Asp Ser Val Tyr Gly Asp Thr Leu Glu Lys Leu Thr Asn Thr
85 90 95
Gly Leu Tyr Asn Leu Leu Ile Arg Cys Leu Arg Cys Gln Lys Pro Leu
100 105 110
Asn Pro Ala Glu Lys Leu Arg His
115 120
<210> 49
<211> 66
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV18 E7氨基酸
<400> 49
Glu Ile Asp Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Ala
1 5 10 15
Pro Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg
20 25 30
Ile Glu Arg Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln
35 40 45
Gln Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser
50 55 60
Gln Gln
65
<210> 50
<211> 53
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1 HPV18 E5氨基酸
<400> 50
Met Leu Ser Leu Ile Phe Leu Phe Cys Phe Cys Val Cys Met Tyr Val
1 5 10 15
Cys Cys His Val Pro Leu Leu Pro Ser Val Val Val Ile Thr Ser Pro
20 25 30
Ala Thr Ala Phe Thr Val Tyr Leu Leu Pro Met Leu Leu Leu His Ile
35 40 45
His Ala Ile Leu Ser
50
<210> 51
<211> 547
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计1氨基酸
<400> 51
Met Met Phe Gln Asp Pro Gln Glu Arg Pro Arg Lys Leu Pro Gln Leu
1 5 10 15
Cys Thr Ala Leu Gln Thr Thr Ile His Asp Ile Ile Leu Glu Cys Val
20 25 30
Tyr Cys Lys Gln Gln Leu Leu Arg Arg Glu Val Tyr Asp Phe Ala Phe
35 40 45
Arg Asp Gly Cys Ile Val Tyr Arg Asp Gly Asn Pro Tyr Ala Val Cys
50 55 60
Asp Lys Cys Leu Lys Phe Tyr Ser Lys Ile Ser Glu Tyr Arg His Tyr
65 70 75 80
Cys Tyr Ser Leu Tyr Gly Thr Thr Leu Glu Gln Gln Tyr Asn Lys Pro
85 90 95
Leu Cys Asp Leu Leu Ile Arg Cys Ile Asn Cys Gln Lys Pro Leu Cys
100 105 110
Pro Glu Glu Lys Gln Arg His Leu Asp Lys Lys Gln Arg Phe His Asn
115 120 125
Ile Arg Gly Arg Trp Thr Gly Arg Cys Met Ser Cys Cys Arg Ser Ser
130 135 140
Arg Thr Arg Arg Ala Ala Ala Ala Met Pro Gly Asp Thr Pro Thr Leu
145 150 155 160
His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Gly
165 170 175
Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Glu Asp Glu Ile Asp Gly
180 185 190
Pro Ala Gly Gln Ala Ala Pro Asp Arg Ala His Tyr Asn Ile Val Thr
195 200 205
Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Arg Cys Val Gln Ser Thr
210 215 220
His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly
225 230 235 240
Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Met Thr Asn Leu Asp Thr
245 250 255
Ala Ser Thr Thr Leu Leu Ala Cys Phe Leu Leu Cys Phe Cys Val Leu
260 265 270
Leu Cys Val Cys Leu Leu Ile Arg Pro Leu Leu Leu Ser Val Ser Thr
275 280 285
Tyr Thr Arg Cys Phe Ile Val Tyr Ile Ile Phe Val Tyr Ile Pro Leu
290 295 300
Phe Leu Ile His Met Ala Arg Phe Glu Asp Pro Thr Arg Arg Pro Tyr
305 310 315 320
Lys Leu Pro Asp Leu Cys Thr Ala Leu Asn Thr Ser Leu Gln Asp Ile
325 330 335
Glu Ile Thr Cys Val Tyr Cys Lys Thr Val Leu Glu Leu Thr Glu Val
340 345 350
Phe Glu Phe Ala Phe Lys Asp Gly Phe Val Val Tyr Arg Asp Ser Ile
355 360 365
Pro His Ala Ala Cys His Lys Cys Ile Asp Phe Tyr Ser Arg Ile Arg
370 375 380
Glu Leu Arg His Tyr Ser Asp Ser Val Tyr Gly Asp Thr Leu Glu Lys
385 390 395 400
Leu Thr Asn Thr Gly Leu Tyr Asn Leu Leu Ile Arg Cys Leu Arg Cys
405 410 415
Gln Lys Pro Leu Asn Pro Ala Glu Lys Leu Arg His Glu Ile Asp Gly
420 425 430
Val Asn His Gln His Leu Pro Ala Arg Arg Ala Ala Pro Gln Arg His
435 440 445
Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu Arg Val
450 455 460
Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu
465 470 475 480
Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln Met Leu
485 490 495
Ser Leu Ile Phe Leu Phe Cys Phe Cys Val Cys Met Tyr Val Cys Cys
500 505 510
His Val Pro Leu Leu Pro Ser Val Val Val Ile Thr Ser Pro Ala Thr
515 520 525
Ala Phe Thr Val Tyr Leu Leu Pro Met Leu Leu Leu His Ile His Ala
530 535 540
Ile Leu Ser
545
<210> 52
<211> 563
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计2氨基酸
<400> 52
Met Gln Thr Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg
1 5 10 15
Tyr Ser Arg Ser Asp His Leu Asp Lys Lys Gln Arg Phe His Asn Ile
20 25 30
Ala Asp Ala Arg Trp Thr Gly Arg Cys Met Ser Cys Cys Asp Asn Met
35 40 45
Thr Thr Leu Glu Gln Gln Tyr Asn Lys Pro Leu Cys Asp Leu Leu Pro
50 55 60
Leu His Ala Ala Val Ser Ala Asp Ile Ser Glu Tyr Arg His Tyr Cys
65 70 75 80
Tyr Arg Asn Arg Ala Thr Asp Leu Val Tyr Asp Phe Ala Phe Arg Asp
85 90 95
Leu Met His Asp Thr Ile His Asp Ile Ile Leu Glu Cys Val Pro Leu
100 105 110
Ile Leu Ala Ala Arg Leu Ala Val Lys Leu Pro Gln Leu Cys Thr Glu
115 120 125
Leu Ser His Ala Asp Val Phe Ala Phe Arg Asp Leu Cys Ile Val Tyr
130 135 140
Asp Asp Leu Leu Cys Ile Val Tyr Arg Asp Gly Asn Pro Tyr Ala Val
145 150 155 160
Cys Asp Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Leu Cys Val
165 170 175
Gln Ser Thr His Val Asp Ile Gly Ala Asn Lys Arg Thr Leu Glu Asp
180 185 190
Leu Leu Met Gly Thr Asn Asn Arg Thr Leu Gly Ile Val Cys Pro Ile
195 200 205
Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Leu Leu Met Gly
210 215 220
Thr Leu Gly Ile Val Ala Asn Arg Thr Leu His Glu Tyr Met Leu Asp
225 230 235 240
Leu Asp His Met Ala His Tyr Asn Ile Val Thr Phe Cys Cys Pro Arg
245 250 255
Asp Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Ile Val Arg Leu Leu
260 265 270
Asp Leu Glu Val Ser Gln Thr Ser Lys Leu Thr Arg Gln Thr Asp Arg
275 280 285
Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg Tyr Ser Arg Ser Asp
290 295 300
Cys Asp Ser Thr Leu Arg Leu Cys Val Ala Asp Ala Lys Leu Thr Asn
305 310 315 320
Thr Gly Leu Tyr Asn Leu Asp Asn Met Lys Cys Ile Asp Phe Tyr Ser
325 330 335
Arg Ile Pro Leu His Ala Ala Val Ser Ala Asp Phe Ala Phe Lys Asp
340 345 350
Leu Phe Val Val Arg Asn Arg Ala Thr Asp Leu Asn Leu Leu Ile Arg
355 360 365
Cys Leu Arg Cys Met His Asp Lys Leu Pro Asp Leu Cys Thr Glu Leu
370 375 380
Pro Leu Ile Leu Ala Ala Arg Leu Ala Val Glu Leu Thr Glu Val Phe
385 390 395 400
Glu Phe Ala Ser His Ala Asp Val Ser Leu Gln Asp Ile Glu Ile Thr
405 410 415
Cys Val Asp Asp Leu Lys Thr Val Leu Glu Leu Thr Glu Val Leu His
420 425 430
Trp Ala Ala Ala Val Asn Asn Val Asp Asp Leu Arg Ala Phe Gln Gln
435 440 445
Leu Phe Leu Asn Thr Leu Ser Gly Ala Asn Lys Phe Gln Gln Leu Phe
450 455 460
Leu Asn Thr Leu Asn Asn Arg Gln Leu Phe Leu Asn Thr Leu Ser Phe
465 470 475 480
Val Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Leu Phe Leu
485 490 495
Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Ala Asn Arg Thr
500 505 510
Leu Gln Asp Ile Val Leu His Leu Asp His Met Ser Glu Glu Glu Asn
515 520 525
Asp Glu Ile Asp Gly Val Asn His Gln His Leu Pro Ala Arg Arg Pro
530 535 540
Arg Asp Tyr Ile Ile Phe Val Tyr Ile Pro Leu Ile Val Arg Leu Leu
545 550 555 560
Asp Leu Glu
<210> 53
<211> 605
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计3氨基酸
<400> 53
Met Lys Leu Pro Gln Leu Cys Thr Glu Val Met Phe Gln Asp Pro Gln
1 5 10 15
Glu Arg Pro Arg Lys Leu Pro Gln Leu Cys Thr Ala Leu Gln Thr Thr
20 25 30
Ile His Asp Ile Ile Leu Glu Cys Val Tyr Cys Lys Gln Gln Leu Leu
35 40 45
Arg Arg Glu Val Tyr Asp Phe Ala Phe Arg Asp Gly Cys Ile Val Tyr
50 55 60
Arg Asp Gly Asn Pro Tyr Ala Val Cys Asp Lys Cys Leu Lys Phe Tyr
65 70 75 80
Ser Lys Ile Ser Glu Tyr Arg His Tyr Cys Tyr Ser Leu Tyr Gly Thr
85 90 95
Thr Leu Glu Gln Gln Tyr Asn Lys Pro Leu Cys Asp Leu Leu Ile Arg
100 105 110
Cys Ile Asn Cys Gln Lys Pro Leu Cys Pro Glu Glu Lys Gln Arg His
115 120 125
Leu Asp Lys Lys Gln Arg Phe His Asn Ile Arg Gly Arg Trp Thr Gly
130 135 140
Arg Cys Met Ser Cys Cys Arg Ser Ser Arg Thr Arg Arg Ala Ala Ala
145 150 155 160
Ala Gln Leu Tyr Asn Lys Pro Leu Cys Asp Val Met Pro Gly Asp Thr
165 170 175
Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp
180 185 190
Leu Tyr Gly Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Glu Asp Glu
195 200 205
Ile Asp Gly Pro Ala Gly Gln Ala Ala Pro Asp Arg Ala His Tyr Asn
210 215 220
Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Arg Cys Val
225 230 235 240
Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly
245 250 255
Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Arg Thr Leu
260 265 270
Glu Asp Leu Leu Met Gly Val Met Thr Asn Leu Asp Thr Ala Ser Thr
275 280 285
Thr Leu Leu Ala Cys Phe Leu Leu Cys Phe Cys Val Leu Leu Cys Val
290 295 300
Cys Leu Leu Ile Arg Pro Leu Leu Leu Ser Val Ser Thr Tyr Thr Arg
305 310 315 320
Cys Phe Ile Val Tyr Ile Ile Phe Val Tyr Ile Pro Leu Phe Leu Ile
325 330 335
His Lys Leu Pro Asp Leu Cys Thr Glu Val Met Ala Arg Phe Glu Asp
340 345 350
Pro Thr Arg Arg Pro Tyr Lys Leu Pro Asp Leu Cys Thr Ala Leu Asn
355 360 365
Thr Ser Leu Gln Asp Ile Glu Ile Thr Cys Val Tyr Cys Lys Thr Val
370 375 380
Leu Glu Leu Thr Glu Val Phe Glu Phe Ala Phe Lys Asp Gly Phe Val
385 390 395 400
Val Tyr Arg Asp Ser Ile Pro His Ala Ala Cys His Lys Cys Ile Asp
405 410 415
Phe Tyr Ser Arg Ile Arg Glu Leu Arg His Tyr Ser Asp Ser Val Tyr
420 425 430
Gly Asp Thr Leu Glu Lys Leu Thr Asn Thr Gly Leu Tyr Asn Leu Leu
435 440 445
Ile Arg Cys Leu Arg Cys Gln Lys Pro Leu Asn Pro Ala Glu Lys Leu
450 455 460
Arg His Lys Leu Thr Asn Thr Gly Leu Tyr Asn Val Glu Ile Asp Gly
465 470 475 480
Val Asn His Gln His Leu Pro Ala Arg Arg Ala Ala Pro Gln Arg His
485 490 495
Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu Arg Val
500 505 510
Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu
515 520 525
Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln Arg Ala
530 535 540
Phe Gln Gln Leu Phe Leu Asn Val Met Leu Ser Leu Ile Phe Leu Phe
545 550 555 560
Cys Phe Cys Val Cys Met Tyr Val Cys Cys His Val Pro Leu Leu Pro
565 570 575
Ser Val Val Val Ile Thr Ser Pro Ala Thr Ala Phe Thr Val Tyr Leu
580 585 590
Leu Pro Met Leu Leu Leu His Ile His Ala Ile Leu Ser
595 600 605
<210> 54
<211> 572
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计4氨基酸
<400> 54
Met Gln Thr Asp Arg Glu Leu Thr Glu Val Phe Glu Phe Ala Ala Arg
1 5 10 15
Tyr Ser Arg Ser Asp Tyr Ile Ile Phe Val Tyr Ile Pro Leu Ala Asp
20 25 30
Ala Lys Leu Pro Gln Leu Cys Thr Glu Val Asp Asn Met Leu Leu Met
35 40 45
Gly Thr Leu Gly Ile Val Pro Leu His Ala Ala Val Ser Ala Asp Thr
50 55 60
Leu His Glu Tyr Met Leu Asp Leu Arg Asn Arg Ala Thr Asp Leu Ser
65 70 75 80
Glu Glu Glu Asn Asp Glu Ile Asp Gly Val Asn His Gln His Leu Pro
85 90 95
Ala Arg Arg Met His Asp Asn Leu Leu Ile Arg Cys Leu Arg Cys Pro
100 105 110
Leu Ile Leu Ala Ala Arg Leu Ala Val Leu Phe Leu Asn Thr Leu Ser
115 120 125
Phe Val Cys Pro Trp Cys Ala Ser Ser His Ala Asp Val Lys Cys Ile
130 135 140
Asp Phe Tyr Ser Arg Ile Asp Asp Leu Lys Leu Pro Asp Leu Cys Thr
145 150 155 160
Glu Leu Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Gln Leu Phe
165 170 175
Leu Asn Thr Leu Ser Phe Val Gly Ala Asn Lys Phe Gln Gln Leu Phe
180 185 190
Leu Asn Thr Leu Asn Asn Arg Val Tyr Asp Phe Ala Phe Arg Asp Leu
195 200 205
Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Lys Leu Thr Asn
210 215 220
Thr Gly Leu Tyr Asn Leu Ala Asn Arg Leu Cys Ile Val Tyr Arg Asp
225 230 235 240
Gly Asn Pro Tyr Ala Val Cys Asp Asp His Met Tyr Met Leu Asp Leu
245 250 255
Gln Pro Glu Thr Thr Pro Arg Asp Phe Ala Phe Arg Asp Leu Cys Ile
260 265 270
Val Tyr Ile Val Arg Leu Leu Asp Leu Glu Val Ser Gln Thr Ser Lys
275 280 285
Leu Thr Arg Gln Thr Asp Arg Thr Leu Gly Ile Val Cys Pro Ile Ala
290 295 300
Ala Arg Tyr Ser Arg Ser Asp Arg Thr Leu Glu Asp Leu Leu Met Gly
305 310 315 320
Val Ala Asp Ala Thr Ile His Asp Ile Ile Leu Glu Cys Val Asp Asn
325 330 335
Met His Leu Asp Lys Lys Gln Arg Phe His Asn Ile Pro Leu His Ala
340 345 350
Ala Val Ser Ala Asp Thr Thr Leu Glu Gln Gln Tyr Asn Lys Pro Leu
355 360 365
Cys Asp Leu Leu Arg Asn Arg Ala Thr Asp Leu Cys Asp Ser Thr Leu
370 375 380
Arg Leu Cys Val Met His Asp Arg Trp Thr Gly Arg Cys Met Ser Cys
385 390 395 400
Cys Pro Leu Ile Leu Ala Ala Arg Leu Ala Val Ser Leu Gln Asp Ile
405 410 415
Glu Ile Thr Cys Val Ser His Ala Asp Val Leu Cys Val Gln Ser Thr
420 425 430
His Val Asp Ile Asp Asp Leu Ala His Tyr Asn Ile Val Thr Phe Cys
435 440 445
Cys Leu His Trp Ala Ala Ala Val Asn Asn Val Asp Asp Leu Arg Ala
450 455 460
Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Gly Ala Asn Lys Ile Ser
465 470 475 480
Glu Tyr Arg His Tyr Cys Tyr Asn Asn Arg Lys Leu Pro Gln Leu Cys
485 490 495
Thr Glu Leu Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Lys
500 505 510
Thr Val Leu Glu Leu Thr Glu Val Ala Asn Arg Arg Thr Leu Glu Asp
515 520 525
Leu Leu Met Gly Thr Asp His Met Phe Ala Phe Lys Asp Leu Phe Val
530 535 540
Val Pro Arg Asp Gln Leu Tyr Asn Lys Pro Leu Cys Asp Val Ile Val
545 550 555 560
Arg Thr Leu Gln Asp Ile Val Leu His Leu Leu Glu
565 570
<210> 55
<211> 436
<212> PRT
<213> 人工序列
<220>
<223> HPV抗原设计5氨基酸
<400> 55
Met Lys Lys Glu Leu Thr Glu Val Phe Glu Phe Ala Lys Lys Tyr Ile
1 5 10 15
Ile Phe Val Tyr Ile Pro Leu Lys Lys Lys Leu Pro Gln Leu Cys Thr
20 25 30
Glu Val Lys Lys Leu Leu Met Gly Thr Leu Gly Ile Val Lys Lys Thr
35 40 45
Leu His Glu Tyr Met Leu Asp Leu Lys Lys Ser Glu Glu Glu Asn Asp
50 55 60
Glu Ile Asp Gly Val Asn His Gln His Leu Pro Ala Arg Arg Lys Lys
65 70 75 80
Asn Leu Leu Ile Arg Cys Leu Arg Cys Lys Lys Leu Phe Leu Asn Thr
85 90 95
Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Lys Lys Lys Cys Ile Asp
100 105 110
Phe Tyr Ser Arg Ile Lys Lys Lys Leu Pro Asp Leu Cys Thr Glu Leu
115 120 125
Lys Lys Gln Leu Phe Leu Asn Thr Leu Ser Phe Val Lys Lys Phe Gln
130 135 140
Gln Leu Phe Leu Asn Thr Leu Lys Lys Val Tyr Asp Phe Ala Phe Arg
145 150 155 160
Asp Leu Lys Lys Lys Leu Thr Asn Thr Gly Leu Tyr Asn Leu Lys Lys
165 170 175
Leu Cys Ile Val Tyr Arg Asp Gly Asn Pro Tyr Ala Val Cys Asp Lys
180 185 190
Lys Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Lys Lys Phe Ala Phe
195 200 205
Arg Asp Leu Cys Ile Val Tyr Lys Lys Thr Leu Gly Ile Val Cys Pro
210 215 220
Ile Lys Lys Arg Thr Leu Glu Asp Leu Leu Met Gly Val Lys Lys Thr
225 230 235 240
Ile His Asp Ile Ile Leu Glu Cys Val Lys Lys His Leu Asp Lys Lys
245 250 255
Gln Arg Phe His Asn Ile Lys Lys Thr Thr Leu Glu Gln Gln Tyr Asn
260 265 270
Lys Pro Leu Cys Asp Leu Leu Lys Lys Cys Asp Ser Thr Leu Arg Leu
275 280 285
Cys Val Lys Lys Arg Trp Thr Gly Arg Cys Met Ser Cys Cys Lys Lys
290 295 300
Ser Leu Gln Asp Ile Glu Ile Thr Cys Val Lys Lys Leu Cys Val Gln
305 310 315 320
Ser Thr His Val Asp Ile Lys Lys Ala His Tyr Asn Ile Val Thr Phe
325 330 335
Cys Cys Lys Lys Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn
340 345 350
Thr Leu Ser Lys Lys Ile Ser Glu Tyr Arg His Tyr Cys Tyr Lys Lys
355 360 365
Lys Leu Pro Gln Leu Cys Thr Glu Leu Lys Lys Lys Thr Val Leu Glu
370 375 380
Leu Thr Glu Val Lys Lys Arg Thr Leu Glu Asp Leu Leu Met Gly Thr
385 390 395 400
Lys Lys Phe Ala Phe Lys Asp Leu Phe Val Val Lys Lys Gln Leu Tyr
405 410 415
Asn Lys Pro Leu Cys Asp Val Lys Lys Thr Leu Gln Asp Ile Val Leu
420 425 430
His Leu Lys Lys
435
<210> 56
<211> 6380
<212> DNA
<213> 人工序列
<220>
<223> 大猩猩腺病毒穿梭质粒的HPV抗原设计1完整核苷酸序列
<400> 56
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc 2280
tcatcccgag cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc 2340
gtagccatgc tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc 2400
agcggagttc ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg 2460
cgtccatcca cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc 2520
actgtcagat aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg 2580
gcggctgttg caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc 2640
cttctagcca cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc 2700
ggccctggtg caggccagca ccagatggtc aggcctctag ttattaatag taatcaatta 2760
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 2820
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 2880
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 2940
ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca 3000
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta 3060
cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt 3120
acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg 3180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca 3240
actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 3300
gagctctccc tatcagtgat agagatctcc ctatcagtga tagagatcgt cgacgagctc 3360
gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 3420
gacaccggga ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc 3480
gtgccaagag tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttcac 3540
ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac atccactttg 3600
cctttctctc cacaggtgtc cactcccagg tccaactgca gccggatccg gtaccgccac 3660
catgatgttc caggatcctc aagaacggcc tcggaaacta cctcagctgt gtacagcctt 3720
acagacaaca atacatgata taatcctgga gtgcgtctac tgtaaacagc aactgttgcg 3780
tcgcgaggtc tatgatttcg ccttcaggga tggttgtatt gtatacagag acggcaatcc 3840
gtatgcagtg tgtgataagt gtctcaagtt ctatagcaaa atcagtgaat accggcacta 3900
ttgctatagc ctgtatggaa ctacactaga gcagcagtat aacaagccac tctgtgacct 3960
gctaattaga tgtatcaact gccagaagcc tctgtgcccc gaagagaagc agcggcacct 4020
tgacaagaag cagcggtttc ataatatcag agggaggtgg accgggcggt gtatgtcctg 4080
ctgccgcagc agcaggaccc gtcgggccgc ggcggcaatg ccaggggaca cgcccacact 4140
ccacgagtac atgctcgacc ttcagccgga aaccaccgat ctctacggct atgaacagtt 4200
gaacgacagc tccgaagagg aagatgagat cgacggccca gcaggacagg cggcccctga 4260
cagagcacac tacaatattg ttaccttctg ctgcaagtgc gacagcacgc tgcgccgatg 4320
cgtacaatct acgcatgtgg acattaggac ccttgaggat ctgcttatgg ggacactcgg 4380
aattgtttgt cccatatgca gtcagaaacc tatgaccaac ctagacaccg cgagcacgac 4440
tcttctggct tgcttcctgc tatgtttttg cgtgctgctt tgtgtttgcc tactcattcg 4500
gcccctgctg ctgtctgtga gcacgtacac gaggtgcttc attgtctata ttatcttcgt 4560
ttacataccg ctgttcctga ttcacatggc aagatttgaa gatcccacgc ggcggccata 4620
caaactccct gatctctgca cggcactgaa cacttcgttg caggacatag aaatcacttg 4680
cgtgtactgc aagactgtgc tagagctgac cgaggtgttt gagtttgcct tcaaggacgg 4740
ttttgtggtg tatcgggata gcatccccca tgccgcctgc cataaatgta ttgatttcta 4800
ttcgagaatt agagaactca ggcattattc cgactccgta tacggcgaca ccctagaaaa 4860
actgaccaac accggcttgt ataacctcct catccgctgc ctccgatgcc agaagccact 4920
taacccagcc gagaaattac gccacgagat cgacggggtc aaccatcagc acctgccggc 4980
cagacgagcc gcccctcagc gccataccat gctgtgcatg tgttgcaagt gcgaagccag 5040
gatcgaaagg gtggtggaat ctagcgctga cgacttaagg gcattccaac aactctttct 5100
taacaccctg agcttcgtgt gtccttggtg tgcttcccaa cagatgctta gtctgatttt 5160
tctgttttgc ttttgcgtgt gtatgtatgt ctgctgccac gtgcctctcc taccatctgt 5220
agtggtgatt acatcccccg cgactgcctt caccgtgtac ctgttgccaa tgctcctcct 5280
tcacatacac gccatcctga gctaagcggc cgctctcgag tctagctagt ctagactagc 5340
tagaaagatc cgggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 5400
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 5460
tcatcaatgt atcttatcat gtctggatcg gtgatcaccg atcccgatct gtcaaatgac 5520
ggtgacaata aaacggagac tttgacccgg aacgcggaaa ttcacgtaaa aaacacctgg 5580
gcgagtcctc cacgtaatcg gtcaaagtcc ctcggccctc ggtaaatatt acgcactatg 5640
actaacgccc tattattcag ttttcacttc cccgtttcac ttttcgcgcg aaaatggcca 5700
aatcttacat ggtcccgccc aaaattacta cgatatccgg tgaaaagcgc gcgaaaattg 5760
gcacttccgg aggtaggcgg cgctcatcaa aaacgtcaca ttttccgcga cggaagcttg 5820
catgtgagct cctcccactt gcaaatgcca cacttccgcc acacctccca accctactcg 5880
cgcgtcctac gtcacccgcc ccgcctctcc ccgcccacct cattatcata ttggccacaa 5940
tccaaaataa ggtatattat tgatgatggt ttaaacgccc aattcactgg ccgtcgtttt 6000
acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 6060
ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 6120
gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg 6180
tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 6240
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 6300
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 6360
gtcatcaccg aaacgcgcga 6380
<210> 57
<211> 6428
<212> DNA
<213> 人工序列
<220>
<223> 大猩猩腺病毒穿梭质粒的HPV抗原设计2完整核苷酸序列
<400> 57
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc 2280
tcatcccgag cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc 2340
gtagccatgc tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc 2400
agcggagttc ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg 2460
cgtccatcca cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc 2520
actgtcagat aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg 2580
gcggctgttg caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc 2640
cttctagcca cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc 2700
ggccctggtg caggccagca ccagatggtc aggcctctag ttattaatag taatcaatta 2760
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 2820
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 2880
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 2940
ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca 3000
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta 3060
cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt 3120
acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg 3180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca 3240
actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 3300
gagctctccc tatcagtgat agagatctcc ctatcagtga tagagatcgt cgacgagctc 3360
gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 3420
gacaccggga ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc 3480
gtgccaagag tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttcac 3540
ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac atccactttg 3600
cctttctctc cacaggtgtc cactcccagg tccaactgca gccggatccg gtaccgccac 3660
catgcagact gatagaaccg gcgaaaccgc tctacacctt gccgcccgtt atagtcgaag 3720
cgaccacctc gataagaaac agcgattcca caacatcgca gacgcaagat ggaccgggcg 3780
gtgtatgtcc tgctgtgaca atatgacaac actggaacag cagtataaca agcccctgtg 3840
tgacctgttg cccctgcacg ccgccgtgtc agccgacata tccgagtatc ggcattactg 3900
ctaccggaac cgtgccaccg acctcgtgta cgactttgca tttagagacc tgatgcacga 3960
taccatccat gacatcatcc tggaatgtgt cccactgatc ctggctgctc ggcttgcagt 4020
gaagctaccc cagctatgca ctgagctatc acacgcagac gtgttcgcct tcagggatct 4080
gtgcattgtt tacgatgacc tgttgtgtat tgtgtacaga gatggcaacc cttatgcagt 4140
gtgtgacgcc ctgcattggg ctgccgccgt gaataatgtc ctttgtgtcc agagcaccca 4200
cgtcgatata ggcgctaata agcggacact ggaggacctg ttgatgggga ctaataatag 4260
aaccctggga atcgtgtgcc ccattccatt attcctggcc gcccgcgagg gatcttatga 4320
actcctgatg ggcacactag gcatcgtggc caataggaca ttgcacgagt atatgctaga 4380
cttagaccac atggctcact ataacattgt cacattttgt tgcccccgcg attacatgct 4440
tgatttacag cccgaaacaa ccatcgtgag actgctcgat ctggaggtat ctcagacaag 4500
taagctcaca agacaaacag acagaaccgg cgagactgct ttgcatctgg ctgcacgata 4560
ttccaggtcc gactgtgata gcaccctgcg gttatgtgtg gcagacgcaa aacttaccaa 4620
taccggccta tataacctcg acaacatgaa gtgcatcgac ttctacagca gaatccccct 4680
ccatgccgcc gtgagcgccg attttgcctt caaggacctg ttcgtggtga gaaaccgagc 4740
caccgacctg aacctgttga ttcggtgttt acgctgtatg cacgacaagc tgcccgattt 4800
gtgtactgag ctgcctctca ttctggccgc acggctcgca gttgaactaa ccgaagtgtt 4860
cgagttcgcc tcccacgccg acgtgtccct acaggacatc gagatcacat gcgtagacga 4920
tctgaaaacc gttctcgaac tcacagaagt gcttcattgg gccgccgcag tcaacaacgt 4980
ggacgatctc cgggcattcc agcaactgtt cctgaataca ctgtctggcg ctaacaagtt 5040
tcagcagtta tttttgaaca cacttaataa ccgccagcta ttcttgaata ccctgtcatt 5100
cgtgccgctg ttcttggctg cgcgcgaggg gtcctacgag ctgtttctga atacgctctc 5160
cttcgtgtgt ccctggtgcg cctccgctaa taggaccctg caagacatcg tacttcacct 5220
ggatcacatg tcagaggagg agaacgatga gatcgacggt gtcaaccacc agcacctccc 5280
cgcccggagg ccccgagatt acatcatttt tgtatatatt cccttaatcg taagattact 5340
cgacctggag taagcggccg ctctcgagtc tagctagtct agactagcta gaaagatccg 5400
ggaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 5460
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 5520
cttatcatgt ctggatcggt gatcaccgat cccgatctgt caaatgacgg tgacaataaa 5580
acggagactt tgacccggaa cgcggaaatt cacgtaaaaa acacctgggc gagtcctcca 5640
cgtaatcggt caaagtccct cggccctcgg taaatattac gcactatgac taacgcccta 5700
ttattcagtt ttcacttccc cgtttcactt ttcgcgcgaa aatggccaaa tcttacatgg 5760
tcccgcccaa aattactacg atatccggtg aaaagcgcgc gaaaattggc acttccggag 5820
gtaggcggcg ctcatcaaaa acgtcacatt ttccgcgacg gaagcttgca tgtgagctcc 5880
tcccacttgc aaatgccaca cttccgccac acctcccaac cctactcgcg cgtcctacgt 5940
cacccgcccc gcctctcccc gcccacctca ttatcatatt ggccacaatc caaaataagg 6000
tatattattg atgatggttt aaacgcccaa ttcactggcc gtcgttttac aacgtcgtga 6060
ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 6120
ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 6180
tggcgaatgg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 6240
catatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca 6300
cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag 6360
acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa 6420
acgcgcga 6428
<210> 58
<211> 6554
<212> DNA
<213> 人工序列
<220>
<223> 大猩猩腺病毒穿梭质粒的HPV抗原设计3完整核苷酸序列
<400> 58
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc 2280
tcatcccgag cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc 2340
gtagccatgc tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc 2400
agcggagttc ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg 2460
cgtccatcca cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc 2520
actgtcagat aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg 2580
gcggctgttg caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc 2640
cttctagcca cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc 2700
ggccctggtg caggccagca ccagatggtc aggcctctag ttattaatag taatcaatta 2760
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 2820
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 2880
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 2940
ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca 3000
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta 3060
cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt 3120
acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg 3180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca 3240
actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 3300
gagctctccc tatcagtgat agagatctcc ctatcagtga tagagatcgt cgacgagctc 3360
gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 3420
gacaccggga ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc 3480
gtgccaagag tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttcac 3540
ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac atccactttg 3600
cctttctctc cacaggtgtc cactcccagg tccaactgca gccggatccg gtaccgccac 3660
catgaagcta ccgcagctct gtacagaagt gatgttccag gatcctcaag aacggcctcg 3720
gaaactacct cagctgtgta cagccttaca gacaacaata catgatataa tcctggagtg 3780
cgtctactgt aaacagcaac tgttgcgtcg cgaggtctat gatttcgcct tcagggatgg 3840
ttgtattgta tacagagacg gcaatccgta tgcagtgtgt gataagtgtc tcaagttcta 3900
tagcaaaatc agtgaatacc ggcactattg ctatagcctg tatggaacta cactagagca 3960
gcagtataac aagccactct gtgacctgct aattagatgt atcaactgcc agaagcctct 4020
gtgccccgaa gagaagcagc ggcaccttga caagaagcag cggtttcata atatcagagg 4080
gaggtggacc gggcggtgta tgtcctgctg ccgcagcagc aggacccgtc gggccgcggc 4140
ggcacagctg tacaacaaac cactgtgtga cgtgatgcca ggggacacgc ccacactcca 4200
cgagtacatg ctcgaccttc agccggaaac caccgatctc tacggctatg aacagttgaa 4260
cgacagctcc gaagaggaag atgagatcga cggcccagca ggacaggcgg cccctgacag 4320
agcacactac aatattgtta ccttctgctg caagtgcgac agcacgctgc gccgatgcgt 4380
acaatctacg catgtggaca ttaggaccct tgaggatctg cttatgggga cactcggaat 4440
tgtttgtccc atatgcagtc agaaacctcg gacactggaa gatttgctca tgggcgttat 4500
gaccaaccta gacaccgcga gcacgactct tctggcttgc ttcctgctat gtttttgcgt 4560
gctgctttgt gtttgcctac tcattcggcc cctgctgctg tctgtgagca cgtacacgag 4620
gtgcttcatt gtctatatta tcttcgttta cataccgctg ttcctgattc acaagctgcc 4680
cgatttgtgc acagaggtga tggcaagatt tgaagatccc acgcggcggc catacaaact 4740
ccctgatctc tgcacggcac tgaacacttc gttgcaggac atagaaatca cttgcgtgta 4800
ctgcaagact gtgctagagc tgaccgaggt gtttgagttt gccttcaagg acggttttgt 4860
ggtgtatcgg gatagcatcc cccatgccgc ctgccataaa tgtattgatt tctattcgag 4920
aattagagaa ctcaggcatt attccgactc cgtatacggc gacaccctag aaaaactgac 4980
caacaccggc ttgtataacc tcctcatccg ctgcctccga tgccagaagc cacttaaccc 5040
agccgagaaa ttacgccaca agctgacgaa caccggtttg tacaatgtgg agatcgacgg 5100
ggtcaaccat cagcacctgc cggccagacg agccgcccct cagcgccata ccatgctgtg 5160
catgtgttgc aagtgcgaag ccaggatcga aagggtggtg gaatctagcg ctgacgactt 5220
aagggcattc caacaactct ttcttaacac cctgagcttc gtgtgtcctt ggtgtgcttc 5280
ccaacagcgc gccttccaac aattgttcct caatgtaatg cttagtctga tttttctgtt 5340
ttgcttttgc gtgtgtatgt atgtctgctg ccacgtgcct ctcctaccat ctgtagtggt 5400
gattacatcc cccgcgactg ccttcaccgt gtacctgttg ccaatgctcc tccttcacat 5460
acacgccatc ctgagctaag cggccgctct cgagtctagc tagtctagac tagctagaaa 5520
gatccgggaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 5580
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 5640
atgtatctta tcatgtctgg atcggtgatc accgatcccg atctgtcaaa tgacggtgac 5700
aataaaacgg agactttgac ccggaacgcg gaaattcacg taaaaaacac ctgggcgagt 5760
cctccacgta atcggtcaaa gtccctcggc cctcggtaaa tattacgcac tatgactaac 5820
gccctattat tcagttttca cttccccgtt tcacttttcg cgcgaaaatg gccaaatctt 5880
acatggtccc gcccaaaatt actacgatat ccggtgaaaa gcgcgcgaaa attggcactt 5940
ccggaggtag gcggcgctca tcaaaaacgt cacattttcc gcgacggaag cttgcatgtg 6000
agctcctccc acttgcaaat gccacacttc cgccacacct cccaacccta ctcgcgcgtc 6060
ctacgtcacc cgccccgcct ctccccgccc acctcattat catattggcc acaatccaaa 6120
ataaggtata ttattgatga tggtttaaac gcccaattca ctggccgtcg ttttacaacg 6180
tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt 6240
cgccagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag 6300
cctgaatggc gaatggcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 6360
acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 6420
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 6480
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 6540
accgaaacgc gcga 6554
<210> 59
<211> 6455
<212> DNA
<213> 人工序列
<220>
<223> 大猩猩腺病毒穿梭质粒的HPV抗原设计4完整核苷酸序列
<400> 59
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc 2280
tcatcccgag cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc 2340
gtagccatgc tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc 2400
agcggagttc ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg 2460
cgtccatcca cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc 2520
actgtcagat aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg 2580
gcggctgttg caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc 2640
cttctagcca cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc 2700
ggccctggtg caggccagca ccagatggtc aggcctctag ttattaatag taatcaatta 2760
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 2820
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 2880
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 2940
ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca 3000
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta 3060
cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt 3120
acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg 3180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca 3240
actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 3300
gagctctccc tatcagtgat agagatctcc ctatcagtga tagagatcgt cgacgagctc 3360
gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 3420
gacaccggga ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc 3480
gtgccaagag tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttcac 3540
ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac atccactttg 3600
cctttctctc cacaggtgtc cactcccagg tccaactgca gccggatccg gtaccgccac 3660
catgcaaacc gacagagagc ttaccgaggt tttcgagttt gcagcccggt actcccggag 3720
cgactacatt atttttgtct atatccctct cgcagacgca aagctgcctc aactgtgtac 3780
agaggttgat aatatgctac tgatgggcac tctcggcatc gtgccgctcc acgccgccgt 3840
gagcgccgac accctgcatg aatacatgct ggacctgaga aatcgggcaa ccgacttatc 3900
cgaggaggag aacgacgaaa ttgatggagt taatcaccag cacctaccag caagacgaat 3960
gcacgacaac ctactgatta gatgcttgag gtgtcccctt attttggcag ccagactcgc 4020
cgttctgttc ctgaacaccc tgagctttgt atgcccctgg tgtgccagct cgcacgcaga 4080
cgtgaaatgt attgacttct attccagaat cgacgaccta aaactgcctg atctctgtac 4140
agagcttgcg ttgcactggg cagccgccgt gaacaacgtg cagttgtttc tgaacacctt 4200
atccttcgtg ggcgctaaca aattccagca acttttcttg aacaccctaa acaacagagt 4260
ttatgacttt gctttcagag acctccccct gttccttgct gccagagagg gatcatacga 4320
gaaactgaca aatacgggcc tctacaattt ggccaacaga ctgtgcatcg tgtacagaga 4380
tggcaatccc tacgccgttt gcgacgacca catgtacatg ctcgacctcc agccggagac 4440
aactcccaga gacttcgctt ttcgggacct gtgtatcgtg tatattgtaa gactcctgga 4500
cctggaagtg agccaaacaa gtaagctaac cagacaaaca gacagaacac ttgggatcgt 4560
gtgtcctatt gcagcccggt atagtaggtc agaccggact ctggaggacc tgttaatggg 4620
ggtggcggac gcaacaatcc acgacattat cttggagtgt gttgacaata tgcacctgga 4680
caagaaacag agattccaca acatacccct gcacgcagcc gtcagcgcgg atactactct 4740
ggagcagcaa tataacaagc ccctgtgcga cctcctgcgg aatcgggcaa ctgatctctg 4800
tgacagtacc cttcgtttgt gcgttatgca cgacaggtgg actgggagat gtatgtcttg 4860
ctgtcctctc attctggccg caagactggc cgttagtctg caagacatcg agatcacctg 4920
tgtcagtcac gccgatgtgc tatgcgtgca gagcacccac gttgatattg atgacctagc 4980
acactacaac atcgttactt tttgctgtct acactgggcc gcagccgtga ataacgtgga 5040
cgacctacgc gctttccaac aactgttcct taacaccctg agcggcgcaa acaagatcag 5100
cgagtaccgc cactactgtt ataataaccg gaagctgcca cagctatgca cagagttgcc 5160
actgttcctg gcagcaagag agggatctta tgaaaagacc gtgctggagc tgacagaggt 5220
ggctaatcgc cgcacactgg aggacctgtt gatgggaacc gatcacatgt tcgcctttaa 5280
ggaccttttc gttgttccca gagaccagct ttacaacaaa cctctatgcg acgtaatagt 5340
gaggaccttg caggatattg tgctccatct gctggaataa gcggccgctc tcgagtctag 5400
ctagtctaga ctagctagaa agatccggga acttgtttat tgcagcttat aatggttaca 5460
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 5520
gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcggtgat caccgatccc 5580
gatctgtcaa atgacggtga caataaaacg gagactttga cccggaacgc ggaaattcac 5640
gtaaaaaaca cctgggcgag tcctccacgt aatcggtcaa agtccctcgg ccctcggtaa 5700
atattacgca ctatgactaa cgccctatta ttcagttttc acttccccgt ttcacttttc 5760
gcgcgaaaat ggccaaatct tacatggtcc cgcccaaaat tactacgata tccggtgaaa 5820
agcgcgcgaa aattggcact tccggaggta ggcggcgctc atcaaaaacg tcacattttc 5880
cgcgacggaa gcttgcatgt gagctcctcc cacttgcaaa tgccacactt ccgccacacc 5940
tcccaaccct actcgcgcgt cctacgtcac ccgccccgcc tctccccgcc cacctcatta 6000
tcatattggc cacaatccaa aataaggtat attattgatg atggtttaaa cgcccaattc 6060
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 6120
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 6180
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 6240
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 6300
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 6360
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 6420
tcagaggttt tcaccgtcat caccgaaacg cgcga 6455
<210> 60
<211> 6047
<212> DNA
<213> 人工序列
<220>
<223> 大猩猩腺病毒穿梭质粒的HPV抗原设计5完整核苷酸序列
<400> 60
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc 2280
tcatcccgag cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc 2340
gtagccatgc tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc 2400
agcggagttc ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg 2460
cgtccatcca cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc 2520
actgtcagat aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg 2580
gcggctgttg caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc 2640
cttctagcca cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc 2700
ggccctggtg caggccagca ccagatggtc aggcctctag ttattaatag taatcaatta 2760
cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 2820
gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 2880
ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 2940
ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca 3000
atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta 3060
cttggcagta catctacgta ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt 3120
acatcaatgg gcgtggatag cggtttgact cacggggatt tccaagtctc caccccattg 3180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca 3240
actccgcccc attgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 3300
gagctctccc tatcagtgat agagatctcc ctatcagtga tagagatcgt cgacgagctc 3360
gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 3420
gacaccggga ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc 3480
gtgccaagag tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttcac 3540
ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac atccactttg 3600
cctttctctc cacaggtgtc cactcccagg tccaactgca gccggatccg gtaccgccac 3660
catgaagaaa gaattgaccg aagtatttga atttgccaag aagtacatca tctttgttta 3720
catacccctg aagaagaaat taccccagct gtgtacagag gtgaagaagt tattgatggg 3780
aacactcgga attgtgaaaa agaccctgca cgaatatatg ctagatttga agaagtctga 3840
ggaggagaac gacgagatcg acggggtgaa ccaccagcac ctccccgcca ggagaaagaa 3900
gaatcttctc atacggtgtc tgcggtgcaa aaagctgttc ctgaacaccc tgtcgttcgt 3960
atgtccctgg tgcgcttcca agaagaagtg catcgacttt tactctcgga tcaagaagaa 4020
gctgcccgat ctgtgtactg agctgaagaa gcaactgttc ctgaacacgc tgtcgtttgt 4080
gaagaagttt cagcagctgt tcctgaacac tctaaagaag gtgtacgatt ttgctttcag 4140
agacctgaaa aagaagttga caaatacggg gctgtataat ctgaagaaac tctgtatcgt 4200
ttacagggac ggtaaccctt acgctgtgtg tgacaaaaag tacatgctag acctccagcc 4260
cgaaacgacc aagaagttcg cgttcagaga cctgtgtatc gtctacaaga aaacactagg 4320
catcgtgtgt cccattaaga aacggactct tgaggaccta ttgatgggtg tgaaaaagac 4380
aattcatgac attatcttgg agtgtgtgaa gaaacatctc gataagaaac aaagattcca 4440
taacatcaaa aagacaaccc tggaacagca gtataacaag cctctttgcg atctgctaaa 4500
gaaatgtgac tccaccttga ggctgtgcgt aaagaagcga tggaccggaa gatgtatgtc 4560
ttgttgtaaa aagagtctcc aagatattga gattacttgc gtgaaaaagt tgtgcgttca 4620
gagtacacat gttgatatta agaaagccca ttataatatc gtgacatttt gctgtaagaa 4680
ggatgacctg agagcttttc agcagctgtt tctgaataca ctgagcaaga agatcagcga 4740
gtaccgacac tattgttaca agaaaaagct gccccagctg tgtaccgaat tgaagaagaa 4800
aaccgtccta gagcttaccg aagtgaagaa gcgtaccctg gaggacctgt taatgggcac 4860
gaagaagttt gcattcaagg acctgtttgt cgtgaaaaag cagctgtaca ataagcccct 4920
gtgcgacgtt aaaaagacac tccaagacat cgtcttacac ctgaaaaagt aagcggccgc 4980
tctcgagtct agctagtcta gactagctag aaagatccgg gaacttgttt attgcagctt 5040
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 5100
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatcggtg 5160
atcaccgatc ccgatctgtc aaatgacggt gacaataaaa cggagacttt gacccggaac 5220
gcggaaattc acgtaaaaaa cacctgggcg agtcctccac gtaatcggtc aaagtccctc 5280
ggccctcggt aaatattacg cactatgact aacgccctat tattcagttt tcacttcccc 5340
gtttcacttt tcgcgcgaaa atggccaaat cttacatggt cccgcccaaa attactacga 5400
tatccggtga aaagcgcgcg aaaattggca cttccggagg taggcggcgc tcatcaaaaa 5460
cgtcacattt tccgcgacgg aagcttgcat gtgagctcct cccacttgca aatgccacac 5520
ttccgccaca cctcccaacc ctactcgcgc gtcctacgtc acccgccccg cctctccccg 5580
cccacctcat tatcatattg gccacaatcc aaaataaggt atattattga tgatggttta 5640
aacgcccaat tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 5700
ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 5760
ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg 5820
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 5880
aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 5940
gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 6000
gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcga 6047
<210> 61
<211> 10410
<212> DNA
<213> 人工序列
<220>
<223> GCAd-RTS-IL12设计1
<400> 61
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gccgcaataa aatatcttta ttttcattac 2640
atctgtgtgt tggttttttg tgtgaatcga tagtactaac atacgctctc catcaaaaca 2700
aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag tgcaagtgca ggtgccagaa 2760
catttctcta tcgataatgc aggtcggagt actgtcctcc gagcggagta ctgtcctccg 2820
agcggagtac tgtcctccga gcggagtact gtcctccgag cggagtactg tcctccgagc 2880
ggagtactgt cctccgagcg gagactcttc gaaggaagag gggcggggtc gatcgacccc 2940
gcccctcttc cttcgaagga agaggggcgg ggtcgaagac ctagagggta tataatgggt 3000
gccttagctg gtgtgtgagc tcatcttcct gtagatcacg cgtgccacca tgggtcacca 3060
gcagttggtc atctcttggt tttccctggt ttttctggca tctcccctcg tggccatatg 3120
ggaactgaag aaagatgttt atgtcgtaga attggattgg tatccggatg cccctggaga 3180
aatggtggtc ctcacctgtg acacccctga agaagatggt atcacctgga ccttggacca 3240
gagcagtgag gtcttaggct ctggcaaaac cctgaccatc caagtcaaag agtttggaga 3300
tgctggccag tacacctgtc acaaaggagg cgaggttcta agccattcgc tcctgctgct 3360
tcacaaaaag gaagatggaa tttggtccac tgatatttta aaggaccaga aagaacccaa 3420
aaataagacc tttctaagat gcgaggccaa gaattattct ggacgtttca cctgctggtg 3480
gctgacgaca atcagtactg atttgacatt cagtgtcaaa agcagcagag gctcttctga 3540
cccccaaggg gtgacgtgcg gagctgctac actctctgca gagagagtca gaggggacaa 3600
caaggagtat gagtactcag tggagtgcca ggaggacagt gcctgcccag ctgctgagga 3660
gagtctgccc attgaggtca tggtggatgc cgttcacaag ctcaagtatg aaaactacac 3720
cagcagcttc ttcatcaggg acatcatcaa acctgaccca cccaagaact tgcagctgaa 3780
gccattaaag aattctcggc aggtggaggt cagctgggag taccctgaca cctggagtac 3840
tccacattcc tacttctccc tgacattctg cgttcaggtc cagggcaaga gcaagagaga 3900
aaagaaagat agagtcttca cggacaagac ctcagccacg gtcatctgcc gcaaaaatgc 3960
cagcattagc gtgcgggccc aggaccgcta ctatagctca tcttggagcg aatgggcatc 4020
tgtgccctgc agttaggttg ggcgagctcg aattcattga tcccccgggc tgcaggaatt 4080
cgatatcaag ctcgggatcc gaattccgcc cccccccccc ccccccccct aacgttactg 4140
gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 4200
tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 4260
ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 4320
cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 4380
ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 4440
ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 4500
aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 4560
gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 4620
aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa acacgatgat 4680
aatatggcca caaccatggg tccagcgcgc agcctcctcc ttgtggctac cctggtcctc 4740
ctggaccacc tcagtttggc cagaaacctc cccgtggcca ctccagaccc aggaatgttc 4800
ccatgccttc accactccca aaacctgctg agggccgtca gcaacatgct ccagaaggcc 4860
agacaaactc tagaatttta cccttgcact tctgaagaga ttgatcatga agatatcaca 4920
aaagataaaa ccagcacagt ggaggcctgt ttaccattgg aattaaccaa gaatgagagt 4980
tgcctaaatt ccagagagac ctctttcata actaatggga gttgcctggc ctccagaaag 5040
acctctttta tgatggccct gtgccttagt agtatttatg aagacttgaa gatgtaccag 5100
gtggagttca agaccatgaa tgcaaagctt ctgatggatc ctaagaggca gatctttcta 5160
gatcaaaaca tgctggcagt tattgatgag ctgatgcagg ccctgaattt caacagtgag 5220
actgtgccac aaaaatcctc ccttgaagaa ccggattttt ataaaactaa aatcaagctc 5280
tgcatacttc ttcatgcttt cagaattcgg gcagtgacta ttgatagagt gatgagctat 5340
ctgaatgctt cctaacgtac gtcgacatcg agaacttgtt tattgcagct tataatggtt 5400
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 5460
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgggcgcgc cggcctccgc 5520
gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct gccacgtcag 5580
acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca gcggcccgct 5640
gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta ggacgggact 5700
tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag gaaaagtagt 5760
cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga tgattatata 5820
aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg tcgcggttct 5880
tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc tgggtacgtg 5940
cgctcggggt tggcgagtgt gttttgtgaa gttttttagg caccttttga aatgtaatca 6000
tttgggtcaa tatgtaattt tcagtgttag actagtaaat tgtccgctaa attctggccg 6060
tttttggctt ttttgttaga cgagctagcg ccgccaccat gggccctaaa aagaagcgta 6120
aagtcgcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac ggcgaggacg 6180
tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg ggggacgggg 6240
attccccggg tccgggattt accccccacg actccgcccc ctacggcgct ctggatatgg 6300
ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag tacggtgggg 6360
aattcgagat gcctgtggac aggatcctgg aggcagagct tgctgtggaa cagaagagtg 6420
accagggcgt tgagggtcct gggggaaccg ggggtagcgg cagcagccca aatgaccctg 6480
tgactaacat ctgtcaggca gctgacaaac agctattcac gcttgttgag tgggcgaaga 6540
ggatcccaca cttttcctcc ttgcctctgg atgatcaggt catattgctg cgggcaggct 6600
ggaatgaact cctcattgcc tccttttcac accgatccat tgatgttcga gatggcatcc 6660
tccttgccac aggtcttcac gtgcaccgca actcagccca ttcagcagga gtaggagcca 6720
tctttgatcg ggtgctgaca gagctagtgt ccaaaatgcg tgacatgagg atggacaaga 6780
cagagcttgg ctgcctgagg gcaatcattc tgtttaatcc agaggtgagg ggtttgaaat 6840
ccgcccagga agttgaactt ctacgtgaaa aagtatatgc cgctttggaa gaatatacta 6900
gaacaacaca tcccgatgaa ccaggaagat ttgcaaaact tttgcttcgt ctgccttctt 6960
tacgttccat aggccttaag tgtttggagc atttgttttt ctttcgcctt attggagatg 7020
ttccaattga tacgttcctg atggagatgc ttgaatcacc ttctgattca taatctagcc 7080
tagcccccct ctccctcccc cccccctaac gttactggcc gaagccgctt ggaataaggc 7140
cggtgtgcgt ttgtctatat gttattttcc accatattgc cgtcttttgg caatgtgagg 7200
gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc ccctctcgcc 7260
aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga agcttcttga 7320
agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc tggcgacagg 7380
tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc acaaccccag 7440
tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc aagcgtattc 7500
aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga tctggggcct 7560
cggtgcacat gctttacatg tgtttagtcg aggttaaaaa acgtctaggc cccccgaacc 7620
acggggacgt ggttttcctt tgaaaaacac gatctctagg cgccaccatg aagctactgt 7680
cttctatcga acaagcatgc gatatttgcc gacttaaaaa gctcaagtgc tccaaagaaa 7740
aaccgaagtg cgccaagtgt ctgaagaaca actgggagtg tcgctactct cccaaaacca 7800
aaaggtctcc gctgactagg gcacatctga cagaagtgga atcaaggcta gaaagactgg 7860
aacagctatt tctactgatt tttcctcgag aagaccttga catgattttg aaaatggatt 7920
ctttacagga tataaaagca ttgttaacag gattatttgt acaagataat gtgaataaag 7980
atgccgtcac agatagattg gcttcagtgg agactgatat gcctctaaca ttgagacagc 8040
atagaataag tgcgacatca tcatcggaag agagtagtaa caaaggtcaa agacagttga 8100
ctgtatcgcc ggaattcccg gggatccggc ctgagtgcgt agtacccgag actcagtgcg 8160
ccatgaagcg gaaagagaag aaagcacaga aggagaagga caaactgcct gtcagcacga 8220
cgacggtgga cgaccacatg ccgcccatta tgcagtgtga acctccacct cctgaagcag 8280
caaggattca cgaagtggtc ccaaggtttc tctccgacaa gctgttggtg acaaaccggc 8340
agaaaaacat cccccagttg acagccaacc agcagttcct tatcgccagg ctcatctggt 8400
accaggacgg gtacgagcag ccttctgatg aagatttgaa gaggattacg cagacgtggc 8460
agcaagcgga cgatgaaaac gaagagtcgg acactccctt ccgccagatc acagagatga 8520
ctatcctcac ggtccaactt atcgtggagt tcgcgaaggg attgccaggg ttcgccaaga 8580
tctcgcagcc tgatcaaatt acgctgctta aggcttgctc aagtgaggta atgatgctcc 8640
gagtcgcgcg acgatacgat gcggcctcag acagtattct gttcgcgaac aaccaagcgt 8700
acactcgcga caactaccgc aaggctggca tggccgaggt catcgaggat ctactgcact 8760
tctgccggtg catgtactct atggcgttgg acaacatcca ttacgcgctg ctcacggctg 8820
tcgtcatctt ttctgaccgg ccagggttgg agcagccgca actggtggaa gagatccagc 8880
ggtactacct gaatacgctc cgcatctata tcctgaacca gctgagcggg tcggcgcgtt 8940
cgtccgtcat atacggcaag atcctctcaa tcctctctga gctacgcacg ctcggcatgc 9000
aaaactccaa catgtgcatc tccctcaagc tcaagaacag aaagctgccg cctttcctcg 9060
aggagatctg ggatgtggcg gacatgtcgc acacccaacc gccgcctatc ctcgagtccc 9120
ccacgaatct ctaggcggcc tctagagcgg ccgccaccgc ggggagatcc agacatgata 9180
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 9240
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 9300
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 9360
taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatcaccg gtcaaatgac 9420
ggtgacaata aaacggagac tttgacccgg aacgcggaaa ttcacgtaaa aaacacctgg 9480
gcgagtcctc cacgtaatcg gtcaaagtcc ctcggccctc ggtaaatatt acgcactatg 9540
actaacgccc tattattcag ttttcacttc cccgtttcac ttttcgcgcg aaaatggcca 9600
aatcttacat ggtcccgccc aaaattacta cgatatccgg tgaaaagcgc gcgaaaattg 9660
gcacttccgg aggtaggcgg cgctcatcaa aaacgtcaca ttttccgcga cggaagcttg 9720
catgtgagct cctcccactt gcaaatgcca cacttccgcc acacctccca accctactcg 9780
cgcgtcctac gtcacccgcc ccgcctctcc ccgcccacct cattatcata ttggccacaa 9840
tccaaaataa ggtatattat tgatgatggt ttaaacgccc aattcactgg ccgtcgtttt 9900
acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 9960
ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 10020
gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg 10080
tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 10140
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 10200
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 10260
gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 10320
tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 10380
aacccctatt tgtttatttt tctaaataca 10410
<210> 62
<211> 10040
<212> DNA
<213> 人工序列
<220>
<223> GCAd-RTS-IL12设计2
<400> 62
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gtacgtagcc gcaataaaat atctttattt 2640
tcattacatc tgtgtgttgg ttttttgtgt gaatccatag tactaacata cgctctccat 2700
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtccaggt 2760
gccagaacat ttctctatcc ataatgcagg ggtaccggaa ggaagagggg cggggtcgat 2820
cgaccccgcc cctcttcctt cgaaggaaga ggggcggggt ccaattgcgg agtactgtcc 2880
tccgagcgga gtactgtcct ccgagcggag tactgtcctc cgagcggagt actgtcctcc 2940
gagcggagta ctgtcctccg agcggagtac tgtcctccga gcggagagtc cccggggacc 3000
tagagggtat ataatgggtg ccttagctgg tgtgtgacct catcttcctg tacgcccctg 3060
caggagatca cgcgtgccac catgggtcac cagcagttgg tcatctcttg gttttccctg 3120
gtttttctgg catctcccct cgtggccata tgggaactga agaaagatgt ttatgtcgta 3180
gaattggatt ggtatccgga tgcccctgga gaaatggtgg tcctcacctg tgacacccct 3240
gaagaagatg gtatcacctg gaccttggac cagagcagtg aggtcttagg ctctggcaaa 3300
accctgacca tccaagtcaa agagtttgga gatgctggcc agtacacctg tcacaaagga 3360
ggcgaggttc taagccattc gctcctgctg cttcacaaaa aggaagatgg aatttggtcc 3420
actgatattt taaaggacca gaaagaaccc aaaaataaga cctttctaag atgcgaggcc 3480
aagaattatt ctggacgttt cacctgctgg tggctgacga caatcagtac tgatttgaca 3540
ttcagtgtca aaagcagcag aggctcttct gacccccaag gggtgacgtg cggagctgct 3600
acactctctg cagagagagt cagaggggac aacaaggagt atgagtactc agtggagtgc 3660
caggaggaca gtgcctgccc agctgctgag gagagtctgc ccattgaggt catggtggat 3720
gccgttcaca agctcaagta tgaaaactac accagcagct tcttcatcag ggacatcatc 3780
aaacctgacc cacccaagaa cttgcagctg aagccattaa agaattctcg gcaggtggag 3840
gtcagctggg agtaccctga cacctggagt actccacatt cctacttctc cctgacattc 3900
tgcgttcagg tccagggcaa gagcaagaga gaaaagaaag atagagtctt cacggacaag 3960
acctcagcca cggtcatctg ccgcaaaaat gccagcatta gcgtgcgggc ccaggaccgc 4020
tactatagct catcttggag cgaatgggca tctgtgccct gcagtctcga gggcggcgga 4080
gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccctaggatg 4140
ggtccagcgc gcagcctcct ccttgtggct accctggtcc tcctggacca cctcagtttg 4200
gccagaaacc tccccgtggc cactccagac ccaggaatgt tcccatgcct tcaccactcc 4260
caaaacctgc tgagggccgt cagcaacatg ctccagaagg ccagacaaac tctagaattt 4320
tacccttgca cttctgaaga gattgatcat gaagatatca caaaagataa aaccagcaca 4380
gtggaggcct gtttaccatt ggaattaacc aagaatgaga gttgcctaaa ttccagagag 4440
acctctttca taactaatgg gagttgcctg gcctccagaa agacctcttt tatgatggcc 4500
ctgtgcctta gtagtattta tgaagacttg aagatgtacc aggtggagtt caagaccatg 4560
aatgcaaagc ttctgatgga tcctaagagg cagatctttc tagatcaaaa catgctggca 4620
gttattgatg agctgatgca ggccctgaat ttcaacagtg agactgtgcc acaaaaatcc 4680
tcccttgaag aaccggattt ttataaaact aaaatcaagc tctgcatact tcttcatgct 4740
ttcagaattc gggcagtgac tattgataga gtgatgagct atctgaatgc ttcctaaatc 4800
gatttattta tcggcataaa taattttttt gaagaagtaa tactattttt cttttttttt 4860
gtaaataaat gggttaaggg atgtaacatt gtttgttgtt tggtgggggt tggggcctcc 4920
gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 4980
agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga cagcggcccg 5040
ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 5100
cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 5160
gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 5220
taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 5280
cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg gctgggtacg 5340
tgcgctcggg gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat 5400
catttgggtc aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc 5460
cgtttttggc ttttttgtta gacgagctag cgccgccacc atgggcccta aaaagaagcg 5520
taaagtcgcc cccccgaccg atgtcagcct gggggacgag ctccacttag acggcgagga 5580
cgtggcgatg gcgcatgccg acgcgctaga cgatttcgat ctggacatgt tgggggacgg 5640
ggattccccg ggtccgggat ttacccccca cgactccgcc ccctacggcg ctctggatat 5700
ggccgacttc gagtttgagc agatgtttac cgatgccctt ggaattgacg agtacggtgg 5760
ggaattcgag atgcctgtgg acaggatcct ggaggcagag cttgctgtgg aacagaagag 5820
tgaccagggc gttgagggtc ctgggggaac cgggggtagc ggcagcagcc caaatgaccc 5880
tgtgactaac atctgtcagg cagctgacaa acagctattc acgcttgttg agtgggcgaa 5940
gaggatccca cacttttcct ccttgcctct ggatgatcag gtcatattgc tgcgggcagg 6000
ctggaatgaa ctcctcattg cctccttttc acaccgatcc attgatgttc gagatggcat 6060
cctccttgcc acaggtcttc acgtgcaccg caactcagcc cattcagcag gagtaggagc 6120
catctttgat cgggtgctga cagagctagt gtccaaaatg cgtgacatga ggatggacaa 6180
gacagagctt ggctgcctga gggcaatcat tctgtttaat ccagaggtga ggggtttgaa 6240
atccgcccag gaagttgaac ttctacgtga aaaagtatat gccgctttgg aagaatatac 6300
tagaacaaca catcccgatg aaccaggaag atttgcaaaa cttttgcttc gtctgccttc 6360
tttacgttcc ataggcctta agtgtttgga gcatttgttt ttctttcgcc ttattggaga 6420
tgttccaatt gatacgttcc tgatggagat gcttgaatca ccttctgatt cataatctag 6480
cctagccccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 6540
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 6600
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 6660
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 6720
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 6780
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 6840
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 6900
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 6960
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 7020
ccacggggac gtggttttcc tttgaaaaac acgatctcta ggcgccacca tgaagctact 7080
gtcttctatc gaacaagcat gcgatatttg ccgacttaaa aagctcaagt gctccaaaga 7140
aaaaccgaag tgcgccaagt gtctgaagaa caactgggag tgtcgctact ctcccaaaac 7200
caaaaggtct ccgctgacta gggcacatct gacagaagtg gaatcaaggc tagaaagact 7260
ggaacagcta tttctactga tttttcctcg agaagacctt gacatgattt tgaaaatgga 7320
ttctttacag gatataaaag cattgttaac aggattattt gtacaagata atgtgaataa 7380
agatgccgtc acagatagat tggcttcagt ggagactgat atgcctctaa cattgagaca 7440
gcatagaata agtgcgacat catcatcgga agagagtagt aacaaaggtc aaagacagtt 7500
gactgtatcg ccggaattcc cggggatccg gcctgagtgc gtagtacccg agactcagtg 7560
cgccatgaag cggaaagaga agaaagcaca gaaggagaag gacaaactgc ctgtcagcac 7620
gacgacggtg gacgaccaca tgccgcccat tatgcagtgt gaacctccac ctcctgaagc 7680
agcaaggatt cacgaagtgg tcccaaggtt tctctccgac aagctgttgg tgacaaaccg 7740
gcagaaaaac atcccccagt tgacagccaa ccagcagttc cttatcgcca ggctcatctg 7800
gtaccaggac gggtacgagc agccttctga tgaagatttg aagaggatta cgcagacgtg 7860
gcagcaagcg gacgatgaaa acgaagagtc ggacactccc ttccgccaga tcacagagat 7920
gactatcctc acggtccaac ttatcgtgga gttcgcgaag ggattgccag ggttcgccaa 7980
gatctcgcag cctgatcaaa ttacgctgct taaggcttgc tcaagtgagg taatgatgct 8040
ccgagtcgcg cgacgatacg atgcggcctc agacagtatt ctgttcgcga acaaccaagc 8100
gtacactcgc gacaactacc gcaaggctgg catggccgag gtcatcgagg atctactgca 8160
cttctgccgg tgcatgtact ctatggcgtt ggacaacatc cattacgcgc tgctcacggc 8220
tgtcgtcatc ttttctgacc ggccagggtt ggagcagccg caactggtgg aagagatcca 8280
gcggtactac ctgaatacgc tccgcatcta tatcctgaac cagctgagcg ggtcggcgcg 8340
ttcgtccgtc atatacggca agatcctctc aatcctctct gagctacgca cgctcggcat 8400
gcaaaactcc aacatgtgca tctccctcaa gctcaagaac agaaagctgc cgcctttcct 8460
cgaggagatc tgggatgtgg cggacatgtc gcacacccaa ccgccgccta tcctcgagtc 8520
ccccacgaat ctctaaatcg attacgctcc tctactcttt gagacatcac tggcctataa 8580
taaatgggtt aatttatgta acaaaattgc cttggcttgt taactttatt agacattctg 8640
atgtttgcat tgtgtaaata ctgttgtatt ggaaaagcgt gccaagatgg attattgtaa 8700
ttcagtgtct tttttagtag cgtcacgtgc caaacactgt tagtcacaga gggcatgaga 8760
cagcctgtgc tggaacagct cagttcatag ggctatggag atggggagaa aggggcgctt 8820
ctgtcagaga caagctgtgg tctgggaagg ccttagcact aaaagcacca caatgagaag 8880
caaccgccag aagcagggcc cgcaggcctt tgttccagct gcaaagagaa aggaaaaagt 8940
ggggaataag agttggggct gcggaggggg tggggagcat tgtgcaggtt ccgtacttga 9000
acagaaagca gggaccaaca caaggaaggg cgcgccaccg gtcaaatgac ggtgacaata 9060
aaacggagac tttgacccgg aacgcggaaa ttcacgtaaa aaacacctgg gcgagtcctc 9120
cacgtaatcg gtcaaagtcc ctcggccctc ggtaaatatt acgcactatg actaacgccc 9180
tattattcag ttttcacttc cccgtttcac ttttcgcgcg aaaatggcca aatcttacat 9240
ggtcccgccc aaaattacta cgatatccgg tgaaaagcgc gcgaaaattg gcacttccgg 9300
aggtaggcgg cgctcatcaa aaacgtcaca ttttccgcga cggaagcttg catgtgagct 9360
cctcccactt gcaaatgcca cacttccgcc acacctccca accctactcg cgcgtcctac 9420
gtcacccgcc ccgcctctcc ccgcccacct cattatcata ttggccacaa tccaaaataa 9480
ggtatattat tgatgatggt ttaaacgccc aattcactgg ccgtcgtttt acaacgtcgt 9540
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 9600
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 9660
aatggcgaat ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 9720
cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga 9780
cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac 9840
agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg 9900
aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 9960
ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 10020
tgtttatttt tctaaataca 10040
<210> 63
<211> 9949
<212> DNA
<213> 人工序列
<220>
<223> GCAd-RTS-IL12设计3
<400> 63
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gtacgtagcc gcaataaaat atctttattt 2640
tcattacatc tgtgtgttgg ttttttgtgt gaatccatag tactaacata cgctctccat 2700
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtccaggt 2760
gccagaacat ttctctatcc ataatgcagg ggtaccggaa ggaagagggg cggggtcgat 2820
cgaccccgcc cctcttcctt cgaaggaaga ggggcggggt ccaattgcgg agtactgtcc 2880
tccgagcgga gtactgtcct ccgagcggag tactgtcctc cgagcggagt actgtcctcc 2940
gagcggagta ctgtcctccg agcggagtac tgtcctccga gcggagagtc cccggggacc 3000
tagagggtat ataatgggtg ccttagctgg tgtgtgacct catcttcctg tacgcccctg 3060
caggcagccg ctaaatccaa ggtaaggtca gaagagctag cgccaccatg tgtcaccagc 3120
agttggtcat ctcttggttc agcctggttt ttctggcatc tcccctcgtg gccatctggg 3180
aactgaagaa agatgtttat gtcgtagaat tggattggta tcccgacgcc cctggagaaa 3240
tggtggtcct gacatgtgac acccctgaag aagatggtat cacctggacc ttggaccaga 3300
gcagtgaggt cttaggctct ggcaagaccc tgaccatcca agtcaaagag tttggagatg 3360
ctggccagta cacctgtcac aaaggaggcg aggttctaag ccattcgctc ctgctgcttc 3420
acaaaaagga agatggaatt tggtccactg acattctgaa ggaccagaaa gaacccaaga 3480
ataagacctt tctaagatgc gaggccaaga attattctgg acgtttcacc tgctggtggc 3540
tgacgacaat cagtactgat ttgacattca gtgtcaaaag cagcagaggc tcttctgacc 3600
cccaaggggt gacgtgcgga gctgctacac tcagcgccga gagagtcaga ggggacaaca 3660
aggagtatga gtactcagtg gagtgccagg aggacagtgc ctgcccagct gctgaggaga 3720
gtctgcccat tgaggtcatg gtggatgccg ttcacaagct caagtatgaa aactacacca 3780
gcagcttctt catcagggac atcatcaaac ctgacccacc caagaacttg cagctgaagc 3840
ccctgaagaa cagcagacag gtggaggtca gctgggagta ccctgacacc tggagtactc 3900
cacattccta cttctccctg acattctgcg ttcaggtcca gggcaagagc aagagagaaa 3960
agaaagatag agtcttcacg gacaagacct cagccacggt catctgccgc aaaaatgcca 4020
gcattagcgt gcgggcccag gaccgctact atagctcatc ttggagcgaa tgggcatctg 4080
tgccctgctc cggtggcggt ggcggcggat ctagaaacct ccccgtggcc actccagacc 4140
caggaatgtt cccatgcctt caccacagcc agaacctgct gagggccgtc agcaacatgc 4200
tccagaaggc cagacaaact ctagaatttt acccttgcac ttctgaagag attgatcatg 4260
aagatatcac aaaagataaa accagcacag tggaggcctg tttaccattg gaattaacca 4320
agaatgagag ttgcctaaat tccagagaga cctctttcat aactaatggg agttgcctgg 4380
cctccagaaa gacctctttt atgatggccc tgtgccttag tagtatttat gaagacttga 4440
agatgtacca ggtggagttc aagaccatga atgcaaagct gctgatggac cccaagaggc 4500
agatctttct agatcaaaac atgctggcag ttattgatga gctgatgcag gccctgaatt 4560
tcaacagtga gactgtgcca caaaaatcct cccttgaaga accggatttt tataaaacta 4620
aaatcaagct ctgcatactt cttcatgctt tcagaatcag agcagtgact attgatagag 4680
tgatgagcta tctgaatgct tcctaaatcg atttatttat cggcataaat aatttttttg 4740
aagaagtaat actatttttc tttttttttg taaataaatg ggttaaggga tgtaacattg 4800
tttgttgttt ggtgggggtt ggggcctccg cgccgggttt tggcgcctcc cgcgggcgcc 4860
cccctcctca cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg tcctgatcct 4920
tccgcccgga cgctcaggac agcggcccgc tgctcataag actcggcctt agaaccccag 4980
tatcagcaga aggacatttt aggacgggac ttgggtgact ctagggcact ggttttcttt 5040
ccagagagcg gaacaggcga ggaaaagtag tcccttctcg gcgattctgc ggagggatct 5100
ccgtggggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc acagctagtt 5160
ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg 5220
gtgagtagcg ggctgctggg ctgggtacgt gcgctcgggg ttggcgagtg tgttttgtga 5280
agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 5340
gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgagctagc 5400
gccgccacca tgggccctaa aaagaagcgt aaagtcgccc ccccgaccga tgtcagcctg 5460
ggggacgagc tccacttaga cggcgaggac gtggcgatgg cgcatgccga cgcgctagac 5520
gatttcgatc tggacatgtt gggggacggg gattccccgg gtccgggatt taccccccac 5580
gactccgccc cctacggcgc tctggatatg gccgacttcg agtttgagca gatgtttacc 5640
gatgcccttg gaattgacga gtacggtggg gaattcgaga tgcctgtgga caggatcctg 5700
gaggcagagc ttgctgtgga acagaagagt gaccagggcg ttgagggtcc tgggggaacc 5760
gggggtagcg gcagcagccc aaatgaccct gtgactaaca tctgtcaggc agctgacaaa 5820
cagctattca cgcttgttga gtgggcgaag aggatcccac acttttcctc cttgcctctg 5880
gatgatcagg tcatattgct gcgggcaggc tggaatgaac tcctcattgc ctccttttca 5940
caccgatcca ttgatgttcg agatggcatc ctccttgcca caggtcttca cgtgcaccgc 6000
aactcagccc attcagcagg agtaggagcc atctttgatc gggtgctgac agagctagtg 6060
tccaaaatgc gtgacatgag gatggacaag acagagcttg gctgcctgag ggcaatcatt 6120
ctgtttaatc cagaggtgag gggtttgaaa tccgcccagg aagttgaact tctacgtgaa 6180
aaagtatatg ccgctttgga agaatatact agaacaacac atcccgatga accaggaaga 6240
tttgcaaaac ttttgcttcg tctgccttct ttacgttcca taggccttaa gtgtttggag 6300
catttgtttt tctttcgcct tattggagat gttccaattg atacgttcct gatggagatg 6360
cttgaatcac cttctgattc ataatctagc ctagcccccc tctccctccc ccccccctaa 6420
cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 6480
caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 6540
gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 6600
gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 6660
caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 6720
agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 6780
aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 6840
accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 6900
gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 6960
cgatctctag gcgccaccat gaagctactg tcttctatcg aacaagcatg cgatatttgc 7020
cgacttaaaa agctcaagtg ctccaaagaa aaaccgaagt gcgccaagtg tctgaagaac 7080
aactgggagt gtcgctactc tcccaaaacc aaaaggtctc cgctgactag ggcacatctg 7140
acagaagtgg aatcaaggct agaaagactg gaacagctat ttctactgat ttttcctcga 7200
gaagaccttg acatgatttt gaaaatggat tctttacagg atataaaagc attgttaaca 7260
ggattatttg tacaagataa tgtgaataaa gatgccgtca cagatagatt ggcttcagtg 7320
gagactgata tgcctctaac attgagacag catagaataa gtgcgacatc atcatcggaa 7380
gagagtagta acaaaggtca aagacagttg actgtatcgc cggaattccc ggggatccgg 7440
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 7500
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 7560
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 7620
ctctccgaca agctgttggt gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 7680
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 7740
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtcg 7800
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 7860
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 7920
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 7980
gacagtattc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 8040
atggccgagg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 8100
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 8160
gagcagccgc aactggtgga agagatccag cggtactacc tgaatacgct ccgcatctat 8220
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 8280
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 8340
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 8400
cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctaaatcga ttacgctcct 8460
ctactctttg agacatcact ggcctataat aaatgggtta atttatgtaa caaaattgcc 8520
ttggcttgtt aactttatta gacattctga tgtttgcatt gtgtaaatac tgttgtattg 8580
gaaaagcgtg ccaagatgga ttattgtaat tcagtgtctt ttttagtagc gtcacgtgcc 8640
aaacactgtt agtcacagag ggcatgagac agcctgtgct ggaacagctc agttcatagg 8700
gctatggaga tggggagaaa ggggcgcttc tgtcagagac aagctgtggt ctgggaaggc 8760
cttagcacta aaagcaccac aatgagaagc aaccgccaga agcagggccc gcaggccttt 8820
gttccagctg caaagagaaa ggaaaaagtg gggaataaga gttggggctg cggagggggt 8880
ggggagcatt gtgcaggttc cgtacttgaa cagaaagcag ggaccaacac aaggaagggc 8940
gcgccaccgg tcaaatgacg gtgacaataa aacggagact ttgacccgga acgcggaaat 9000
tcacgtaaaa aacacctggg cgagtcctcc acgtaatcgg tcaaagtccc tcggccctcg 9060
gtaaatatta cgcactatga ctaacgccct attattcagt tttcacttcc ccgtttcact 9120
tttcgcgcga aaatggccaa atcttacatg gtcccgccca aaattactac gatatccggt 9180
gaaaagcgcg cgaaaattgg cacttccgga ggtaggcggc gctcatcaaa aacgtcacat 9240
tttccgcgac ggaagcttgc atgtgagctc ctcccacttg caaatgccac acttccgcca 9300
cacctcccaa ccctactcgc gcgtcctacg tcacccgccc cgcctctccc cgcccacctc 9360
attatcatat tggccacaat ccaaaataag gtatattatt gatgatggtt taaacgccca 9420
attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 9480
atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 9540
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcctgatg cggtattttc 9600
tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct 9660
ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 9720
gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 9780
tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 9840
gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 9900
ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaataca 9949
<210> 64
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 瘭疽(Whitlow)接头
<400> 64
ggcagcacct ccggcagcgg caagcctggc agcggcgagg gcagcaccaa gggc 54
<210> 65
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 接头
<400> 65
tctggcggag gatctggagg aggcggatct ggaggaggag gcagtggagg cggaggatct 60
ggcggaggat ctctgcag 78
<210> 66
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> GSG接头
<400> 66
ggaagcgga 9
<210> 67
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> SGSG接头
<400> 67
agtggcagcg gc 12
<210> 68
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> (G4S)3接头
<400> 68
ggtggcggtg gctcgggcgg tggtgggtcg ggtggcggcg gatct 45
<210> 69
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 弗林蛋白酶切割位点/弗林链1
<400> 69
cgtgcaaagc gt 12
<210> 70
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> Fmdv
<400> 70
agagccaaga gggcaccggt gaaacagact ttgaattttg accttctgaa gttggcagga 60
gacgttgagt ccaaccctgg gccc 84
<210> 71
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 明脉扁刺蛾(Thosea asigna)病毒2A区域(T2A)
<400> 71
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg acct 54
<210> 72
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 弗林蛋白酶-GSG-T2A
<400> 72
agagctaaga ggggaagcgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag 60
gagaatcctg gacct 75
<210> 73
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 弗林蛋白酶-SGSG-T2A
<400> 73
agggccaaga ggagtggcag cggcgagggc agaggaagtc ttctaacatg cggtgacgtg 60
gaggagaatc ccggccct 78
<210> 74
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 猪捷申病毒(Porcine teschovirus)-1 2A区域(P2A)
<400> 74
gcaacgaact tctctctcct aaaacaggct ggtgatgtgg aggagaatcc tggtcca 57
<210> 75
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> GSG-P2A
<400> 75
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 76
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 马鼻炎(Equine rhinitis)A病毒2A区域(E2A))
<400> 76
cagtgtacta attatgctct cttgaaattg gctggagatg ttgagagcaa ccctggacct 60
<210> 77
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 口蹄病病毒2A区域(F2A)
<400> 77
gtcaaacaga ccctaaactt tgatctgcta aaactggccg gggatgtgga aagtaatccc 60
ggcccc 66
<210> 78
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> FP2A
<400> 78
cgtgcaaagc gtgcaccggt gaaacaggga agcggagcta ctaacttcag cctgctgaag 60
caggctggag acgtggagga gaaccctgga cct 93
<210> 79
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 接头-GSG
<400> 79
gcaccggtga aacagggaag cgga 24
<210> 80
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 接头
<400> 80
gcaccggtga aacag 15
<210> 81
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 瘭疽(Whitlow)接头氨基酸序列
<400> 81
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
1 5 10 15
Lys Gly
<210> 82
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 接头氨基酸序列
<400> 82
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Ser Leu Gln
20 25
<210> 83
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> GSG接头氨基酸序列
<400> 83
Gly Ser Gly
1
<210> 84
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> SGSG 接头氨基酸序列
<400> 84
Ser Gly Ser Gly
1
<210> 85
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> (G4S) 3接头氨基酸序列
<400> 85
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 86
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头多肽组件
<400> 86
Arg Ala Lys Arg
1
<210> 87
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> Fmdv氨基酸序列
<400> 87
Arg Ala Lys Arg Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu
1 5 10 15
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 88
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 弗林蛋白酶-GSG-T2A氨基酸序列
<400> 88
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 89
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 弗林蛋白酶-SGSG-T2A氨基酸序列
<400> 89
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 90
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 弗林蛋白酶-SGSG-T2A
<400> 90
Arg Ala Lys Arg Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
1 5 10 15
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 91
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 猪捷申病毒(Porcine teschovirus)-1 2A区域(P2A)
<400> 91
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 92
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> GSG-P2A氨基酸序列
<400> 92
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 93
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 马鼻炎(Equine rhinitis)A病毒2A区域(E2A)氨基酸序列
<400> 93
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 94
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 口蹄病病毒2A区域(F2A)氨基酸序列
<400> 94
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 95
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> FP2A氨基酸序列
<400> 95
Arg Ala Lys Arg Ala Pro Val Lys Gln Gly Ser Gly Ala Thr Asn Phe
1 5 10 15
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25 30
<210> 96
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 接头-GSG氨基酸
<400> 96
Ala Pro Val Lys Gln Gly Ser Gly
1 5
<210> 97
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 接头氨基酸
<400> 97
Ala Pro Val Lys Gln
1 5
<210> 98
<211> 154
<212> PRT
<213> 人工序列
<220>
<223> HBV设计1的HBV HBx结构域
<400> 98
Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu
1 5 10 15
Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly
20 25 30
Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro Pro Ala Val Pro Thr Asp
35 40 45
His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser
50 55 60
Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu
65 70 75 80
Thr Thr Val Asn Ala His Gln Phe Leu Pro Lys Val Leu His Lys Arg
85 90 95
Thr Leu Gly Leu Ser Ala Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe
100 105 110
Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Leu Arg
115 120 125
Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala
130 135 140
Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
145 150
<210> 99
<211> 454
<212> PRT
<213> 人工序列
<220>
<223> HBV设计1的HBV Pol结构域
<400> 99
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
1 5 10 15
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
20 25 30
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
35 40 45
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
50 55 60
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
65 70 75 80
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
85 90 95
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
100 105 110
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
115 120 125
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
130 135 140
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
145 150 155 160
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
165 170 175
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
180 185 190
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
195 200 205
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
210 215 220
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
225 230 235 240
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
245 250 255
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
260 265 270
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
275 280 285
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
290 295 300
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
305 310 315 320
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
325 330 335
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
340 345 350
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
355 360 365
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
370 375 380
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
385 390 395 400
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
405 410 415
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
420 425 430
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
435 440 445
Val Ala Trp Arg Pro Pro
450
<210> 100
<211> 226
<212> PRT
<213> 人工序列
<220>
<223> HBV结构域1的HBV表面(Env1)结构域
<400> 100
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile
225
<210> 101
<211> 180
<212> PRT
<213> 人工序列
<220>
<223> HBV设计1的HBV核心结构域
<400> 101
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met Asp Ile
20 25 30
Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser Phe Leu
35 40 45
Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Thr
50 55 60
Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr Pro His
65 70 75 80
His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu Met Asn
85 90 95
Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser Arg Asp
100 105 110
Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln
115 120 125
Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp Leu Val
130 135 140
Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala
145 150 155 160
Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr
165 170 175
Val Val Arg Gln
180
<210> 102
<211> 226
<212> PRT
<213> 人工序列
<220>
<223> SHB(Env)结构域
<400> 102
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile
225
<210> 103
<211> 180
<212> PRT
<213> 人工序列
<220>
<223> HBeAg结构域
<400> 103
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met Asp Ile
20 25 30
Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser Phe Leu
35 40 45
Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Thr
50 55 60
Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr Pro His
65 70 75 80
His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu Met Asn
85 90 95
Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser Arg Asp
100 105 110
Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln
115 120 125
Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp Leu Val
130 135 140
Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala
145 150 155 160
Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr
165 170 175
Val Val Arg Gln
180
<210> 104
<211> 154
<212> PRT
<213> 人工序列
<220>
<223> HBx结构域
<400> 104
Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu
1 5 10 15
Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly
20 25 30
Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro Pro Ala Val Pro Thr Asp
35 40 45
His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser
50 55 60
Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu
65 70 75 80
Thr Thr Val Asn Ala His Gln Phe Leu Pro Lys Val Leu His Lys Arg
85 90 95
Thr Leu Gly Leu Ser Ala Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe
100 105 110
Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Leu Arg
115 120 125
Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala
130 135 140
Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
145 150
<210> 105
<211> 454
<212> PRT
<213> 人工序列
<220>
<223> Pol结构域
<400> 105
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
1 5 10 15
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
20 25 30
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
35 40 45
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
50 55 60
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
65 70 75 80
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
85 90 95
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
100 105 110
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
115 120 125
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
130 135 140
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
145 150 155 160
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
165 170 175
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
180 185 190
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
195 200 205
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
210 215 220
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
225 230 235 240
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
245 250 255
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
260 265 270
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
275 280 285
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
290 295 300
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
305 310 315 320
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
325 330 335
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
340 345 350
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
355 360 365
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
370 375 380
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
385 390 395 400
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
405 410 415
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
420 425 430
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
435 440 445
Val Ala Trp Arg Pro Pro
450
<210> 106
<211> 1014
<212> PRT
<213> 人工序列
<220>
<223> HBV设计1
<400> 106
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys
225 230 235 240
Pro Thr Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met
245 250 255
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
260 265 270
Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr
275 280 285
Ala Thr Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr
290 295 300
Pro His His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu
305 310 315 320
Met Asn Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser
325 330 335
Arg Asp Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe
340 345 350
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp
355 360 365
Leu Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
370 375 380
Pro Ala Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
385 390 395 400
Thr Thr Val Val Arg Gln Met Ala Ala Arg Leu Cys Cys Gln Leu Asp
405 410 415
Pro Ala Arg Asp Val Leu Cys Leu Arg Pro Val Gly Ala Glu Ser Arg
420 425 430
Gly Arg Pro Phe Ser Gly Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro
435 440 445
Pro Ala Val Pro Thr Asp His Gly Ala His Leu Ser Leu Arg Gly Leu
450 455 460
Pro Val Cys Ala Phe Ser Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr
465 470 475 480
Ser Ala Arg Arg Met Glu Thr Thr Val Asn Ala His Gln Phe Leu Pro
485 490 495
Lys Val Leu His Lys Arg Thr Leu Gly Leu Ser Ala Met Ser Thr Thr
500 505 510
Asp Leu Glu Ala Tyr Phe Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu
515 520 525
Leu Gly Glu Glu Leu Arg Leu Lys Val Phe Val Leu Gly Gly Cys Arg
530 535 540
His Lys Leu Val Cys Ala Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
545 550 555 560
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
565 570 575
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
580 585 590
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
595 600 605
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
610 615 620
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
625 630 635 640
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
645 650 655
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
660 665 670
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
675 680 685
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
690 695 700
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
705 710 715 720
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
725 730 735
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
740 745 750
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
755 760 765
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
770 775 780
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
785 790 795 800
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
805 810 815
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
820 825 830
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
835 840 845
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
850 855 860
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
865 870 875 880
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
885 890 895
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
900 905 910
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
915 920 925
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
930 935 940
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
945 950 955 960
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
965 970 975
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
980 985 990
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
995 1000 1005
Val Ala Trp Arg Pro Pro
1010
<210> 107
<211> 1021
<212> PRT
<213> 人工序列
<220>
<223> HBV设计2
<400> 107
Ser Val Glu Leu Leu Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val
1 5 10 15
Arg Asp Leu Leu Asp Thr Ala Thr Ala Leu Tyr Arg Asp Ala Leu Glu
20 25 30
Ser Pro Glu His Cys Thr Pro His His Thr Ala Leu Arg His Val Cys
35 40 45
Leu Cys Trp Gly Asp Leu Met Asn Leu Ala Thr Trp Val Gly Thr Asn
50 55 60
Leu Glu Asp Gln Ala Ser Arg Asp Leu Val Val Ser Tyr Val Asn Thr
65 70 75 80
Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp Phe His Ile Ser Cys
85 90 95
Leu Thr Phe Gly Arg Asp Leu Val Leu Glu Tyr Leu Val Ser Phe Gly
100 105 110
Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro Ser Asn Ala Pro Ile
115 120 125
Leu Ser Thr Leu Pro Glu Thr Thr Val Val Arg Gln Arg Gly Arg Thr
130 135 140
Ile Val Leu His Lys Arg Thr Leu Gly Leu Met Gly Gln Asn Leu Ser
145 150 155 160
Thr Ser Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala
165 170 175
Phe Arg Ala Asn Thr Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys
180 185 190
Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Leu
195 200 205
Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala
210 215 220
Gln Gly Ile Met Gln Thr Leu Pro Ala Asn Pro Pro Pro Ala Ser Thr
225 230 235 240
Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Leu Pro Lys Val Leu
245 250 255
His Lys Arg Thr Leu Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu
260 265 270
Leu Leu Leu Asp Asn Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg
275 280 285
Leu Ala Asp Glu Asp Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu
290 295 300
Gly Asn Leu Asn Val Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe
305 310 315 320
Thr Gly Leu Tyr Ser Ser Ser Val Pro Val Phe Asn Pro His Trp Lys
325 330 335
Thr Pro Ser Phe Pro Asn Ile His Leu His Gln Asp Ile Ile Lys Lys
340 345 350
Cys Glu Gln Phe Val Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu
355 360 365
Lys Leu Ile Met Pro Ala Arg Phe Tyr Pro Asn Phe Thr Lys Tyr Leu
370 375 380
Pro Leu Asp Lys Gly Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn
385 390 395 400
His Tyr Phe His Thr Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly
405 410 415
Ile Leu Tyr Lys Arg Val Ser Thr His Ser Ala Ser Phe Cys Gly Ser
420 425 430
Pro Tyr Ser Trp Glu Gln Glu Leu Gln His Gly Ala Glu Ser Phe His
435 440 445
Gln Gln Ser Ser Gly Ile Leu Ser Arg Pro Ser Val Gly Ser Ser Leu
450 455 460
Gln Ser Lys His Gln Gln Ser Arg Leu Gly Leu Gln Ser Gln Gln Gly
465 470 475 480
His Leu Ala Arg Arg Gln Gln Gly Arg Ser Trp Ser Ile Arg Thr Arg
485 490 495
Val His Pro Thr Ala Arg Arg Pro Ser Gly Val Glu Pro Ser Gly Ser
500 505 510
Gly His Asn Ala Asn Leu Ala Ser Lys Ser Ala Ser Cys Leu Tyr Gln
515 520 525
Ser Thr Val Arg Thr Ala Ala Tyr Pro Ala Val Ser Thr Ser Glu Asn
530 535 540
His Ser Ser Ser Gly His Ala Val Glu Leu His Asn Leu Pro Pro Asn
545 550 555 560
Ser Ala Arg Ser Gln Ser Glu Arg Pro Val Ser Pro Cys Trp Trp Leu
565 570 575
Gln Phe Arg Asn Ser Lys Pro Cys Ser Asp Tyr Cys Leu Ser His Ile
580 585 590
Val Asn Leu Leu Glu Asp Trp Gly Pro Cys His Lys Arg Thr Leu Gly
595 600 605
Leu Ser Ala Met Ser Pro Pro Leu Arg Thr Thr His Pro Gln Ala Met
610 615 620
Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg Val
625 630 635 640
Arg Gly Leu Tyr Leu Pro Ala Gly Gly Ser Ser Ser Gly Thr Val Asn
645 650 655
Pro Val Pro Thr Thr Ala Ser Pro Thr Leu Ser Thr Ser Ser Arg Ile
660 665 670
Gly Asp Pro Ala Leu Asn Gln Phe Leu Pro Lys Val Leu His Lys Arg
675 680 685
Ser Arg Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn
690 695 700
Leu Gln Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser
705 710 715 720
Leu Asp Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala
725 730 735
Met Pro His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala
740 745 750
Arg Leu Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu
755 760 765
Gln Asn Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu
770 775 780
Leu Leu Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro
785 790 795 800
Ile Ile Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro
805 810 815
Phe Leu Leu Ala Gln Phe Thr Ser Ala Ile Thr Val Asn Ala His Gln
820 825 830
Phe Leu Pro Lys Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro
835 840 845
Thr Ser Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg
850 855 860
Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu
865 870 875 880
Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile
885 890 895
Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr
900 905 910
Pro Ala Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro
915 920 925
Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe
930 935 940
Gly Lys Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser
945 950 955 960
Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val
965 970 975
Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr
980 985 990
Asn Thr Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu
995 1000 1005
Trp Val Tyr Ile Leu Ser Ala Met Ser Thr Thr Asp Leu
1010 1015 1020
<210> 108
<211> 532
<212> PRT
<213> 人工序列
<220>
<223> HBV设计3
<400> 108
Met Gln Thr Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg
1 5 10 15
Tyr Ser Arg Ser Asp Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Ala
20 25 30
Asp Ala Gly Val Trp Ile Arg Thr Pro Pro Ala Asp Asn Met Glu Tyr
35 40 45
Leu Val Ser Phe Gly Val Trp Pro Leu His Ala Ala Val Ser Ala Asp
50 55 60
Cys Trp Gly Glu Leu Met Thr Leu Arg Asn Arg Ala Thr Asp Leu Gly
65 70 75 80
Gly Pro Asn Leu Asp Asn Ile Leu Met His Asp Ile Leu Arg Ser Phe
85 90 95
Ile Pro Leu Leu Pro Leu Ile Leu Ala Ala Arg Leu Ala Val Ser Thr
100 105 110
Leu Pro Glu Thr Thr Val Val Arg Arg Ser His Ala Asp Val Phe Leu
115 120 125
Gly Gly Pro Pro Val Cys Leu Asp Asp Leu Phe Leu Leu Thr Arg Ile
130 135 140
Leu Thr Ile Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Leu Thr
145 150 155 160
Phe Gly Arg Glu Thr Val Leu Glu Tyr Gly Ala Asn Lys Trp Leu Ser
165 170 175
Leu Leu Val Pro Phe Val Asn Asn Arg Phe Leu Lys Gln Gln Tyr Met
180 185 190
Asn Leu Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Asp Leu
195 200 205
Leu Asp Thr Ala Ser Ala Leu Tyr Ala Asn Arg Phe Leu Ser Lys Gln
210 215 220
Tyr Met Asp Leu Asp His Met Thr Val Ser Thr Lys Leu Cys Lys Ile
225 230 235 240
Pro Arg Asp Leu Trp Phe His Ile Ser Cys Leu Thr Phe Ile Val Arg
245 250 255
Leu Leu Asp Leu Glu Val Ser Gln Thr Ser Lys Leu Thr Arg Gln Thr
260 265 270
Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg Tyr Ser Arg
275 280 285
Ser Asp Leu Thr Thr Val Pro Ala Ala Ser Leu Leu Ala Ala Asp Ala
290 295 300
Gly Leu Ser Arg Tyr Val Ala Arg Leu Asp Asn Met Lys Leu His Leu
305 310 315 320
Tyr Ser His Pro Ile Pro Leu His Ala Ala Val Ser Ala Asp Gly Leu
325 330 335
Ser Pro Thr Val Trp Leu Ser Val Arg Asn Arg Ala Thr Asp Leu Phe
340 345 350
Leu Leu Ser Leu Gly Ile His Leu Met His Asp Ser Leu Tyr Ala Asp
355 360 365
Ser Pro Ser Val Pro Leu Ile Leu Ala Ala Arg Leu Ala Val His Lys
370 375 380
Arg Thr Leu Gly Leu Ser Ala Met Ser His Ala Asp Val Thr Leu Cys
385 390 395 400
Ile Pro His Val Ala Val Asp Asp Leu Leu Leu Leu Lys Ala Thr Leu
405 410 415
Cys Ile Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Gln Phe Leu
420 425 430
Pro Lys Val Leu His Lys Arg Gly Ala Asn Lys Ala Leu Met Pro Leu
435 440 445
Tyr Ala Cys Ile Asn Asn Arg Thr Val Asn Ala His Gln Phe Leu Pro
450 455 460
Lys Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Leu Pro Lys
465 470 475 480
Val Leu His Lys Arg Thr Leu Ala Asn Arg Val Leu His Lys Arg Thr
485 490 495
Leu Gly Leu Asp His Met Leu Ser Ala Met Ser Thr Thr Asp Leu Pro
500 505 510
Arg Asp Leu Leu Val Pro Phe Val Gln Trp Phe Val Ile Val Arg Leu
515 520 525
Leu Asp Leu Glu
530
<210> 109
<211> 368
<212> PRT
<213> 人工序列
<220>
<223> HBV设计4
<400> 109
Lys Lys Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Lys Lys Cys Trp
1 5 10 15
Gly Glu Leu Met Thr Leu Lys Lys Gly Val Trp Ile Arg Thr Pro Pro
20 25 30
Ala Lys Lys Ser Thr Leu Pro Glu Thr Thr Val Val Arg Arg Lys Lys
35 40 45
Leu Thr Phe Gly Arg Glu Thr Val Leu Glu Tyr Lys Lys Asp Leu Leu
50 55 60
Asp Thr Ala Ser Ala Leu Tyr Lys Lys Leu Trp Phe His Ile Ser Cys
65 70 75 80
Leu Thr Phe Lys Lys Glu Tyr Leu Val Ser Phe Gly Val Trp Lys Lys
85 90 95
Gly Gly Pro Asn Leu Asp Asn Ile Leu Lys Lys Leu Thr Thr Val Pro
100 105 110
Ala Ala Ser Leu Leu Ala Lys Lys Ile Leu Arg Ser Phe Ile Pro Leu
115 120 125
Leu Lys Lys Phe Leu Gly Gly Pro Pro Val Cys Leu Lys Lys Phe Leu
130 135 140
Leu Thr Arg Ile Leu Thr Ile Lys Lys Trp Leu Ser Leu Leu Val Pro
145 150 155 160
Phe Val Lys Lys Gly Leu Ser Pro Thr Val Trp Leu Ser Val Lys Lys
165 170 175
Leu Leu Val Pro Phe Val Gln Trp Phe Val Lys Lys Phe Leu Lys Gln
180 185 190
Gln Tyr Met Asn Leu Lys Lys Phe Leu Ser Lys Gln Tyr Met Asp Leu
195 200 205
Lys Lys Thr Val Ser Thr Lys Leu Cys Lys Ile Lys Lys Gly Leu Ser
210 215 220
Arg Tyr Val Ala Arg Leu Lys Lys Lys Leu His Leu Tyr Ser His Pro
225 230 235 240
Ile Lys Lys Phe Leu Leu Ser Leu Gly Ile His Leu Lys Lys Ser Leu
245 250 255
Tyr Ala Asp Ser Pro Ser Val Lys Lys Ala Leu Met Pro Leu Tyr Ala
260 265 270
Cys Ile Lys Lys Leu Leu Leu Lys Ala Thr Leu Cys Ile Lys Lys Thr
275 280 285
Leu Cys Ile Pro His Val Ala Val Lys Lys Val Leu His Lys Arg Thr
290 295 300
Leu Gly Leu Lys Lys Leu Pro Lys Val Leu His Lys Arg Thr Leu Lys
305 310 315 320
Lys His Lys Arg Thr Leu Gly Leu Ser Ala Met Lys Lys Gln Phe Leu
325 330 335
Pro Lys Val Leu His Lys Arg Lys Lys Thr Val Asn Ala His Gln Phe
340 345 350
Leu Pro Lys Lys Lys Leu Ser Ala Met Ser Thr Thr Asp Leu Lys Lys
355 360 365
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 剪接引物
<400> 110
tgccaagagt gacgtgtcca 20
<210> 111
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 剪接探针
<400> 111
cccaggtcca actgcagccg g 21
<210> 112
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 弗林蛋白酶接头多肽
<400> 112
agagctaaga gg 12
<210> 113
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 113
His Leu Asp Lys Lys Gln Arg Phe His Asn Ile
1 5 10
<210> 114
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 114
Arg Trp Thr Gly Arg Cys Met Ser Cys Cys
1 5 10
<210> 115
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 115
Thr Thr Leu Glu Gln Gln Tyr Asn Lys Pro Leu Cys Asp Leu Leu
1 5 10 15
<210> 116
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 116
Ile Ser Glu Tyr Arg His Tyr Cys Tyr
1 5
<210> 117
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 117
Val Tyr Asp Phe Ala Phe Arg Asp Leu
1 5
<210> 118
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 118
Thr Ile His Asp Ile Ile Leu Glu Cys Val
1 5 10
<210> 119
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 119
Lys Leu Pro Gln Leu Cys Thr Glu Leu
1 5
<210> 120
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 120
Phe Ala Phe Arg Asp Leu Cys Ile Val Tyr
1 5 10
<210> 121
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E6
<400> 121
Leu Cys Ile Val Tyr Arg Asp Gly Asn Pro Tyr Ala Val Cys Asp
1 5 10 15
<210> 122
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 122
Leu Cys Val Gln Ser Thr His Val Asp Ile
1 5 10
<210> 123
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 123
Arg Thr Leu Glu Asp Leu Leu Met Gly Thr
1 5 10
<210> 124
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 124
Thr Leu Gly Ile Val Cys Pro Ile
1 5
<210> 125
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 125
Leu Leu Met Gly Thr Leu Gly Ile Val
1 5
<210> 126
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 126
Thr Leu His Glu Tyr Met Leu Asp Leu
1 5
<210> 127
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 127
Ala His Tyr Asn Ile Val Thr Phe Cys Cys
1 5 10
<210> 128
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 128
Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr
1 5 10
<210> 129
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E7
<400> 129
Cys Asp Ser Thr Leu Arg Leu Cys Val
1 5
<210> 130
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 130
Tyr Ile Ile Phe Val Tyr Ile Pro Leu
1 5
<210> 131
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 131
Lys Leu Thr Asn Thr Gly Leu Tyr Asn Leu
1 5 10
<210> 132
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 132
Lys Cys Ile Asp Phe Tyr Ser Arg Ile
1 5
<210> 133
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 133
Phe Ala Phe Lys Asp Leu Phe Val Val
1 5
<210> 134
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 134
Asn Leu Leu Ile Arg Cys Leu Arg Cys
1 5
<210> 135
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 135
Lys Leu Pro Asp Leu Cys Thr Glu Leu
1 5
<210> 136
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 136
Glu Leu Thr Glu Val Phe Glu Phe Ala
1 5
<210> 137
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 137
Ser Leu Gln Asp Ile Glu Ile Thr Cys Val
1 5 10
<210> 138
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV16-E5
<400> 138
Lys Thr Val Leu Glu Leu Thr Glu Val
1 5
<210> 139
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 139
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser
1 5 10 15
<210> 140
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 140
Phe Gln Gln Leu Phe Leu Asn Thr Leu
1 5
<210> 141
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 141
Gln Leu Phe Leu Asn Thr Leu Ser Phe Val
1 5 10
<210> 142
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 142
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser
1 5 10 15
<210> 143
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 143
Thr Leu Gln Asp Ile Val Leu His Leu
1 5
<210> 144
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> HPV18-E7
<400> 144
Ser Glu Glu Glu Asn Asp Glu Ile Asp Gly Val Asn His Gln His Leu
1 5 10 15
Pro Ala Arg Arg
20
<210> 145
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 激动剂肽
<400> 145
Lys Leu Pro Gln Leu Cys Thr Glu Val
1 5
<210> 146
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 激动剂肽
<400> 146
Gln Leu Tyr Asn Lys Pro Leu Cys Asp Val
1 5 10
<210> 147
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 激动剂肽
<400> 147
Arg Thr Leu Glu Asp Leu Leu Met Gly Val
1 5 10

Claims (50)

1.一种非天然产生的多核苷酸,其编码包含一个或多个免疫应答诱导人乳头瘤病毒(HPV)多肽的多肽。
2.如权利要求1所述的多核苷酸,其中,所述非天然产生的多核苷酸编码包含两个或更多个HPV多肽的多肽。
3.如权利要求2所述的多核苷酸,其中,所述两个或更多个HPV多肽包含:
(i).至少一个HPV-16肽;
(ii).至少一个HPV-18肽;或
(iii).(i)和(ii)两者。
4.如权利要求3所述的多核苷酸,其中:
(i).所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个;
(ii).所述HPV-18肽包含E5肽、E6肽或E7肽中的至少一个;或
(iii).(i)和(ii)两者。
5.如权利要求3或4所述的多核苷酸,其中:
(i).所述HPV-16肽包含E5肽,并且所述E5肽具有SEQ ID NO:47中所示的序列;
(ii).所述HPV-16肽包含E6肽,并且所述E6肽具有SEQ ID NO:45中所示的序列;
(iii).所述HPV-16肽包含E7肽,并且所述E7肽具有SEQ ID NO:46中所示的序列;
(iv).所述HPV-18肽包含E5肽,并且所述E5肽具有SEQ ID NO:50中所示的序列;
(v).所述HPV-18肽包含E6肽,并且所述E6肽具有SEQ ID NO:48中所示的序列;
(vi).所述HPV-18肽包含E7肽,并且所述E7肽具有SEQ ID NO:49中所示的序列;或
(vii).其任意组合。
6.如权利要求1-5中任一项所述的多核苷酸,其中,所述多肽具有SEQ ID NO:51中所示的序列。
7.如权利要求1-6中任一项所述的多核苷酸,其中,所述一个或多个HPV多肽中的至少一个与激动剂肽连接。
8.如权利要求7所述的多核苷酸,其中,所述激动剂肽具有包含表2中所示激动剂肽序列的序列。
9.如权利要求7或8所述的多核苷酸,其中,所述多肽具有SEQ ID NO:53中所示的序列。
10.一种包含权利要求1-9中任一项所述的多核苷酸的多核苷酸,其还包含编码基因开关系统的一个或多个多核苷酸,用于诱导型控制异源基因表达,其中所述异源基因表达由所述基因开关系统调节;并且,其中所述异源基因包含权利要求1-9中任一项所述的多核苷酸。
11.如权利要求10所述的多核苷酸,其中,所述基因开关系统是基于蜕皮激素受体的(基于EcR的)基因开关系统。
12.一种调节细胞中异源基因表达的方法,所述方法包括:
(a).将一个或多个多核苷酸引入所述细胞,所述多核苷酸包含:
(i).抑制型或诱导型基因开关,和
(ii).异源性免疫应答诱导基因,其中所述异源性免疫应答诱导基因的表达由所述基因开关调节,其中所述所述异源性免疫应答诱导基因编码一个或多个HPV多肽中的至少一个;和
(b).将所述细胞暴露于足以抑制或诱导所述异源性免疫应答诱导基因表达的量的化合物。
13.如权利要求12所述的方法,其中,所述基因开关包括衍生自以下之中至少一种的配体结合结构域:蜕皮激素受体(EcR)、遍在受体、孤儿受体1、NER-1,类固醇激素核受体1、类视黄醇X受体相互作用蛋白15、肝X受体β、类固醇激素受体样蛋白、肝X受体、肝X受体α、法尼醇X受体、受体相互作用蛋白14和金合欢醇受体。
14.一种包含E6肽的多肽,其中,相较于野生型E6肽,所述E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个。
15.如权利要求14所述的多肽,其中,所述E6肽具有SEQ ID NO:45中所示的序列。
16.如权利要求13-15中任一项所述的多肽,其中,所述E6肽与激动剂肽融合。
17.如权利要求16所述的多肽,其中,所述激动剂肽与所述E6肽的C端和N端中的至少一个融合。
18.如权利要求13-17中任一项所述的E6肽,其中,所述野生型E6肽来自HPV-16。
19.一种多肽,其包含:
(i).E6肽,其中相较于野生型E6肽,所述E6肽包含缺失,其中所述缺失包括所述野生型E6肽的C末端;
(ii).E7肽,其中相较于野生型E7肽,所述E7肽包含缺失,其中所述缺失包括所述野生型E7肽的N末端;
(iii).E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸41-57;或
(iv).E5肽,其中相较于野生型E5肽,所述E5肽包含缺失,其中所述缺失包括所述野生型E5肽的氨基酸27-40或氨基酸54-57中的至少一个。
20.如权利要求19所述的多肽,其中:
(i).所述E6肽的所述缺失包括从所述野生型E6肽氨基酸121至所述野生型E6肽C末端的氨基酸;或
(ii).所述E7肽的所述缺失包括所述野生型E7肽的氨基酸1-39。
21.如权利要求19或20所述的多肽,其中:
(i).相较于所述野生型E6肽,所述E6肽包含E18A和L50G取代中的至少一个;或
(ii).相较于所述野生型E7肽,所述E7肽包含E55A和L74R取代中的至少一个。
22.如权利要求19-21中任一项所述的多肽,其中,
(i).所述野生型E6肽来自HPV-18;
(ii).所述野生型E7肽来自HPV-18;或
(iii).所述野生型E5肽来自HPV-16或HPV-18。
23.如权利要求19-22中任一项所述的多肽,其中,
(i).所述E6肽具有SEQ ID NO:48中所示的序列;
(ii).所述E7肽具有SEQ ID NO:49中所示的序列;或
(iii).所述E5肽具有SEQ ID NO:47或SEQ ID NO:50中所示的序列。
24.一种多肽构建体,其中所述多肽构建体包含HPV-16 E6肽,其中相较于野生型HPV-16 E6肽,所述HPV-16 E6肽包含E18A氨基酸取代且包含L50G、E148A、T149A、Q150A和L151A氨基酸取代中的至少一个;和
(i).HPV-16 E7肽,其中相较于野生型HPV-16 E7肽,所述HPV-16 E7肽包含H2P、C24G、E46A和L67R氨基酸取代中的至少一个;
(ii).HPV-16 E5肽;
(iii).HPV-18 E6肽;
(iv).HPV-18 E7肽;
(v).HPV-18 E5肽;或
(vi).(i)-(v)的任意组合。
25.如权利要求24所述的多肽构建体,其中:
(i).所述HPV-16 E7肽包含所述H2P、C24G、E46A和L67R氨基酸取代;
(ii).相较于野生型HPV-16 E5肽,所述HPV-16 E5肽包含一个或多个氨基酸的缺失;
(iii).所述HPV-18 E6肽包含(a)相较于野生型HPV-18 E6肽的E18A和L50G取代,(b)相对于所述野生型HPV-18 E6肽的至少一个C末端氨基酸的缺失,或(a)和(b)两者;
(iv).所述HPV-18 E7肽包含(a)相较于野生型HPV-18 E7肽的E55A和L74G取代,(b)所述HPV-18 E7肽N末端的至少一个氨基酸的缺失,或(a)和(b)两者;
(v).相较于野生型HPV-18 E5肽,所述HPV-18 E5肽包含至少一个氨基酸的缺失;或
(vi).(i)-(v)的任意组合。
26.如权利要求25所述的多肽构建体,其中:
(i).所述HPV-16 E5肽的所述缺失包括所述野生型HPV-16 E5肽的氨基酸41-57;
(ii).所述HPV-18 E6肽的所述缺失包括从所述野生型HPV-18 E6肽的氨基酸121至所述野生型HPV-18 E6肽的所述C末端的氨基酸;
(iii).所述HPV-18 E7肽的所述缺失包括所述野生型HPV-18 E7肽的氨基酸1-40;
(iv).所述HPV-18 E5肽的所述缺失包括所述野生型HPV-18 E5肽的氨基酸27-40或54-57;或
(v).(i)-(iv)的任意组合。
27.如权利要求24-26中任一项所述的多肽构建体,其中,
(i).所述HPV-16 E6肽具有SEQ ID NO:45中所示的序列;
(ii).所述HPV-16 E7肽具有SEQ ID NO:46中所示的序列;
(iii).所述HPV-16 E5肽具有SEQ ID NO:47中所示的序列;
(iv).所述HPV-18 E6肽具有SEQ ID NO:48中所示的序列;
(v).所述HPV-18 E7肽具有SEQ ID NO:49中所示的序列;
(vi).所述HPV-18 E5肽具有SEQ ID NO:50中所示的序列;或
(vii).(i)-(vi)的任意组合。
28.如权利要求24-27中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:51中所示的序列。
29.如权利要求24-28中任一项所述的多肽构建体,其中,所述多肽构建体还包含至少一个激动剂肽。
30.如权利要求29所述的多肽构建体,其中,所述至少一个激动剂肽具有包含表2中所示激动剂肽序列的序列。
31.如权利要求29或30所述的多肽构建体,其中,所述多肽具有SEQ ID NO:53中所示的序列。
32.包含锚蛋白样重复序列结构域和HPV肽的多肽构建体。
33.如权利要求32所述的多肽构建体,其中,所述锚蛋白样重复序列蛋白是人锚蛋白样重复序列蛋白。
34.如权利要求32或33所述的多肽构建体,其中,所述HPV肽通过接头与所述锚蛋白样重复序列蛋白连接。
35.如权利要求32-34中任一项所述的多肽构建体,其中,所述HPV肽包含HPV-16肽或HPV-18肽中的至少一个。
36.如权利要求32-35中任一项所述的多肽构建体,其中:
(i).所述HPV肽包含HPV-16肽,并且所述HPV-16肽包含E5肽、E6肽或E7肽中的至少一个;或
(ii).所述HPV肽包含HPV-18肽,并且所述HPV-18肽包含E6肽或E7肽中的至少一个。
37.如权利要求32-36中任一项所述的多肽构建体,其中,所述HPV肽包含表2中所示的HPV-16 E5序列、HPV-16 E6序列、HPV-16E7序列、HPV-18 E6序列或HPV-18 E7序列。
38.如权利要求32-37中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:52中所示的序列。
39.如权利要求32-38中任一项所述的多肽构建体,其中,所述多肽构建体还包含至少一个激动剂肽。
40.如权利要求39所述的多肽构建体,其中,所述多肽构建体具有SEQ ID NO:54中所示的序列。
41.一种多肽构建体,其中,所述多肽构建体包含表2中所示的至少两个HPV氨基酸序列,其中所述至少两个HPV氨基酸序列通过肽接头接合,其中所述肽接头是KK接头。
42.如权利要求41所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包含表2中所示HPV-16肽或HPV-18肽中的至少一个。
43.如权利要求41或42所述的多肽构建体,其中,所述至少两个HPV氨基酸序列包含:
(i).HPV-16肽,其中所述HPV-16肽包含表2中所示HPV-16 E5肽、HPV-16 E6肽或HPV-16E7肽中的至少一个;
(ii).HPV-18肽,其中所述HPV-18肽包含表2所示HPV-18 E6肽或HPV-18 E7肽中的至少一个;
(iii).表2中所示的各个氨基酸序列;或
(iv).(i)-(iii)的任意组合。
44.如权利要求43所述的多肽构建体,其中,所述各个氨基酸序列通过所述KK接头与所述各个氨基酸序列中的另一个接合。
45.如权利要求41-44中任一项所述的多肽构建体,其中,所述多肽构建体具有SEQ IDNO:55中所示的序列。
46.一种编码权利要求14-45中任一项所述多肽构建体的多核苷酸。
47.一种包含权利要求1-11和46中任一项所述多核苷酸的载体。
48.如权利要求47所述的载体,其中,所述载体是腺病毒载体。
49.如权利要求48所述的载体,其中,所述腺病毒载体是大猩猩腺病毒载体。
50.权利要求1-11和46中任一项所述的多核苷酸、权利要求14-45中任一项所述的多肽构建体或权利要求47-49中任一项所述的载体,其用于疫苗。
CN201980030588.6A 2018-03-06 2019-03-06 人乳头瘤病毒疫苗及其用途 Pending CN112088015A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862639354P 2018-03-06 2018-03-06
US62/639,354 2018-03-06
PCT/US2019/020933 WO2019173465A1 (en) 2018-03-06 2019-03-06 Human papillomavirus vaccines and uses of the same

Publications (1)

Publication Number Publication Date
CN112088015A true CN112088015A (zh) 2020-12-15

Family

ID=78414121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980030588.6A Pending CN112088015A (zh) 2018-03-06 2019-03-06 人乳头瘤病毒疫苗及其用途

Country Status (10)

Country Link
US (1) US20210024586A1 (zh)
EP (1) EP3762022A4 (zh)
JP (2) JP2021514667A (zh)
KR (1) KR20200130339A (zh)
CN (1) CN112088015A (zh)
AU (1) AU2019231654A1 (zh)
CA (1) CA3092937A1 (zh)
IL (1) IL277129A (zh)
SG (1) SG11202008539YA (zh)
WO (1) WO2019173465A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021511054A (ja) * 2018-01-24 2021-05-06 ザ カウンシル オブ ザ クイーンズランド インスティテュート オブ メディカル リサーチ Hpv免疫療法
CA3092935A1 (en) 2018-03-06 2019-09-12 Precigen, Inc. Hepatitis b vaccines and uses of the same
CA3197920A1 (en) * 2020-11-25 2022-06-02 Douglas E. Brough Human papilloma virus vaccines and uses of the same for hpv associated diseases

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017096432A1 (en) * 2015-12-09 2017-06-15 Admedus Vaccines Pty Ltd Immunomodulating composition for treatment
WO2017210649A1 (en) * 2016-06-03 2017-12-07 Etubics Corporation Compositions and methods for the treatment of human papillomavirus (hpv)-associated diseases

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPN443995A0 (en) * 1995-07-27 1995-08-17 Csl Limited Papillomavirus polyprotein
US6001622A (en) * 1995-12-21 1999-12-14 Sunnybrook Health Science Centre Integrin-linked kinase and its use
ATE503492T1 (de) * 2002-12-20 2011-04-15 Glaxosmithkline Biolog Sa Verwendung von hpv16 und hpv18 vlps als vakzine gegen eine oder mehrere onkogene hpv des typus 31,33, 35, 39, 45, 51, 52, 56, 58, 59, 66, 68
CA2868867A1 (en) * 2005-03-25 2006-09-28 National Research Council Of Canada Method of isolation of soluble polypeptides
GB0710538D0 (en) * 2007-06-01 2007-07-11 Glaxo Group Ltd Vaccine
TWI688395B (zh) * 2010-03-23 2020-03-21 英翠克頌公司 條件性表現治療性蛋白質之載體、包含該載體之宿主細胞及彼等之用途
US9492526B2 (en) * 2012-01-24 2016-11-15 Sanford Health Polynucleotides for treating oncogenic viral polypeptide positive tumors
EP3193905B1 (en) * 2014-08-15 2024-04-03 Genexine, Inc. Compositions for use in treating cervical cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017096432A1 (en) * 2015-12-09 2017-06-15 Admedus Vaccines Pty Ltd Immunomodulating composition for treatment
WO2017210649A1 (en) * 2016-06-03 2017-12-07 Etubics Corporation Compositions and methods for the treatment of human papillomavirus (hpv)-associated diseases

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARCELO NAZÁRIO CORDEIRO等: "Anti-tumor effects of genetic vaccines against HPV major oncogenes", 《HUMAN VACCINES & IMMUNOTHERAPEUTICS》, vol. 11, no. 1, pages 45 - 52, XP055885121, DOI: 10.4161/hv.34303 *

Also Published As

Publication number Publication date
CA3092937A1 (en) 2019-09-12
SG11202008539YA (en) 2020-10-29
EP3762022A4 (en) 2022-06-15
JP2021514667A (ja) 2021-06-17
WO2019173465A1 (en) 2019-09-12
AU2019231654A1 (en) 2020-10-01
EP3762022A1 (en) 2021-01-13
IL277129A (en) 2020-10-29
US20210024586A1 (en) 2021-01-28
JP2023138959A (ja) 2023-10-03
KR20200130339A (ko) 2020-11-18

Similar Documents

Publication Publication Date Title
KR101761425B1 (ko) 시미안 아데노바이러스 핵산- 및 아미노산-서열, 이를 포함하는 벡터 및 이의 용도
KR102535670B1 (ko) 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드
KR101614362B1 (ko) 유인원 아과 b 아데노바이러스 sadv-28,27,-29,-32,-33, 및 -35 및 그것의 사용
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
KR101449587B1 (ko) 장기 지속형 약물 제형
CA3041673A1 (en) Engineered artificial antigen presenting cells for tumor infiltrating lymphocyte expansion
KR20190092471A (ko) 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드
KR20220004959A (ko) 종양, 종양-상주 면역 세포, 및 종양 미세환경을 콜로니화하기 위해 조작된 면역자극성 박테리아
KR20160102024A (ko) 아데노바이러스 및 상응하는 플라스미드의 제조 방법
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
KR20220113943A (ko) 면역자극성 박테리아 전달 플랫폼 및 치료 제품의 전달을 위한 이의 용도
CN112088015A (zh) 人乳头瘤病毒疫苗及其用途
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
KR20220016137A (ko) 변형된 아데노바이러스
KR101591887B1 (ko) 장기 지속형 약물 제형
CN116887820A (zh) 腺病毒载体以及关于使用腺病毒载体的方法
WO2021236325A1 (en) Covid-19 vaccine using non-integrating lentiviral vectors
KR20230046313A (ko) 다중에피토프 백신 카세트
KR20230014694A (ko) 항원-코딩 카세트
CN112135622A (zh) 乙型肝炎疫苗及其用途
AU766670B2 (en) Porcine adenovirus type 3 genome
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
TW202302857A (zh) 多臂黏液瘤(myxoma)病毒
CN116323955A (zh) 通过crispr/cas介导的体内末端解析拯救重组腺病毒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221226

Address after: Maryland, USA

Applicant after: Placigen Co.,Ltd.

Address before: Virginia

Applicant before: Placigen Co.,Ltd.

Applicant before: Peggy therapeutics Inc.