CN109069668A - 用于眼病的基因疗法 - Google Patents

用于眼病的基因疗法 Download PDF

Info

Publication number
CN109069668A
CN109069668A CN201680081801.2A CN201680081801A CN109069668A CN 109069668 A CN109069668 A CN 109069668A CN 201680081801 A CN201680081801 A CN 201680081801A CN 109069668 A CN109069668 A CN 109069668A
Authority
CN
China
Prior art keywords
leu
ser
glu
val
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680081801.2A
Other languages
English (en)
Other versions
CN109069668B (zh
Inventor
J.班尼特
J.班尼切利
J.孙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Publication of CN109069668A publication Critical patent/CN109069668A/zh
Application granted granted Critical
Publication of CN109069668B publication Critical patent/CN109069668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0048Eye, e.g. artificial tears
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2300/00Mixtures or combinations of active ingredients, wherein at least one active ingredient is fully defined in groups A61K31/00 - A61K41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/022Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from an adenovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/04Uses of viruses as vector in vivo
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/002Vectors comprising a special translation-regulating system controllable or inducible
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/007Vectors comprising a special translation-regulating system cell or tissue specific

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了在受试者中治疗眼病的组合物和方法。在一方面,提供了腺相关病毒载体,其包括包含编码CNGA3的序列的核酸分子。在另一方面,提供了腺相关病毒载体,其包括包含编码CNGB3的序列的核酸分子。在另一方面,提供了腺相关病毒载体,其包括包含编码REP‑1的序列的核酸分子。在所需实施方案中,该受试者是人、猫、狗、绵羊或非人类灵长类。

Description

用于眼病的基因疗法
以电子形式提交的材料的参考并入
申请人经此引用并入随此以电子形式提交的序列表材料。该文件标记为“16-7660PCT_Seq_Listing_ST25.txt”。
发明背景
无脉络膜症(CHM)是一种X连锁遗传性视网膜疾病,其特征在于光感受器、视网膜色素上皮细胞(RPE)和脉络膜毛细血管层的变性。症状在生命的第一或第二个十年中发展,症状为夜晚视觉不佳(夜盲症)和周边视觉进行性丧失。随着疾病的进展,视野压缩。这以中央视觉(视敏度)丧失告终,并且早在生命的第四个十年就会失明。已经发现在CHM基因中超过140个突变会导致无脉络膜症。突变可能导致异常小的、非功能性和/或不稳定的Rab护航蛋白-1(REP-1)蛋白的产生、该蛋白功能的降低或REP-1蛋白产生的丧失。缺乏正常的REP-1破坏了Rab蛋白辅助细胞内运输的能力。蛋白和细胞器在细胞中的不动性导致细胞功能不良和过早死亡。
无脉络膜症基因(CHM)编码Rab护航蛋白-1(REP-1),一种参与膜运输调节的653个氨基酸的蛋白。由于CHM基因座在X-染色体上,无脉络膜症通常仅在男性中确诊。尽管该疾病的女性携带者通常是无症状的,视网膜检查常常显示视网膜和RPE的斑块变性,且女性个体可能受到影响,这取决于正常X染色体的X失活程度(莱昂化作用)。Coussa,RG,Traboulsi,EI(2012)Choroideremia:a review ofgeneral findings and pathogenesis,Ophthalmic Genet 33(2):57-65,其经此引用并入本文。还参见Vasireddy等人,AAV-mediated gene therapy for choroideremia:preclinical studies in personalizedmodels.PLoS One.2013年5月7日;8(5):e61396,其经此引用并入本文。
全色盲是一组异质的常染色体隐性遗传的视网膜疾病,其特征在于早发性视敏度减退、受损或完全的色盲、眼震、畏光(photoaversion)和视锥光感受器功能丧失。大约80%的全色盲患者显示出在视锥光感受器的cGMP控制阳离子通道环核苷酸门控制型通道(CNG)的α或β亚基(A3和B3)中的突变。与人疾病同源,Cnga3缺陷小鼠显示出视锥特异功能的丧失,导致受影响的视锥光感受器的功能失常和变性。
因此,需要可用于在人受试者中表达CNGA3或CNGB3的组合物。
发明内容
无脉络膜症(CHM)是一种X连锁视网膜变性,其在生命的第一或第二个十年中有症状,导致夜盲症和周边视觉丧失。当大多数患者为失明时,疾病进展至中期。CHM是基因增强疗法的有利目标,因为该疾病是由于视网膜细胞健康所需的蛋白——Rab护航蛋白1(REP1),其由CHM基因编码——的功能丧失。该CHM cDNA可以包装在重组体腺相关病毒(rAAV)中,其在人基因疗法研究中具有已经建立的追踪记录。此外,存在敏感和定量试验来记录REP1活性,包括其异戊二烯化(prenylate)Rab蛋白如Rab27和纠正REP-1缺陷细胞中缺乏异戊二烯化导致的Rab27定位与运输中的缺陷的能力。
在一方面,提供了编码Rab护航蛋白-1(REP-1)的密码子优化的cDNA序列。在一个实施方案中,该密码子优化的cDNA序列是SEQ ID NO:3的变体。在另一实施方案中,该密码子优化的cDNA序列是SEQ ID NO:1。在另一实施方案中,该cDNA序列经密码子优化以便在人内表达。
在另一方面,表达盒包括编码REP-1的密码子优化的核酸序列。在一个实施方案中,该表达盒包括SEQ ID NO:1的cDNA序列。在又一实施方案中,该REP-1编码序列位于5’和3’AAV ITR序列之间。在一个实施方案中,该载体基因组包括5'ITR与3'ITR之间(且包括5'ITR和3'ITR)的所有核酸序列。
在另一实施方案中,提供了腺相关病毒(AAV)载体。该AAV载体包括AAV衣壳和包含AAV反向末端重复序列的核酸序列与编码人Rab护航蛋白-1(REP-1)的核酸序列,以及引导REP-1在宿主细胞中的表达的表达控制序列。在一个实施方案中,该REP-1序列编码全长REP-1蛋白。在一个实施方案中,该REP-1序列是SEQ ID NO:2的蛋白序列。
在一方面,提供了编码环核苷酸门控制型通道α3(CNGA3)的密码子优化的cDNA序列。在一个实施方案中,该密码子优化的cDNA序列是SEQ ID NO:13或SEQ ID NO:15的变体。在另一实施方案中,该密码子优化的cDNA序列是SEQ ID NO:9或SEQ ID NO:11。在另一实施方案中,该cDNA序列经密码子优化以便在人内表达。
在另一方面,表达盒包括编码环核苷酸门控制型通道α3(CNGA3)的密码子优化的核酸序列。在一个实施方案中,该表达盒包括SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13或SEQ ID NO:15的cDNA序列。在又一实施方案中,该CNGA3编码序列位于5’和3’AAV ITR序列之间。
在另一方面,表达盒包括编码环核苷酸门控制型通道α3(CNGB3)的密码子优化的核酸序列。在一个实施方案中,该表达盒包括SEQ ID NO:19或SEQ ID NO:21或SEQ ID NO:23的cDNA序列。在又一实施方案中,该CNGB3编码序列位于5’和3’AAV ITR序列之间。
在另一实施方案中,提供了腺相关病毒(AAV)载体。该AAV载体包括AAV衣壳和包含AAV反向末端重复序列的核酸序列与编码人CNGA3的核酸序列,以及引导CNGA3在宿主细胞中的表达的表达控制序列。在一个实施方案中,该CNGA3序列编码全长CNGA3蛋白。在一个实施方案中,该CNGA3序列是SEQ ID NO:10、SEQ ID NO:12或SEQ ID NO:14的蛋白序列。
在另一实施方案中,提供了腺相关病毒(AAV)载体。该AAV载体包括AAV衣壳和包含AAV反向末端重复序列的核酸序列与编码人CNGB3的核酸序列,以及引导CNGB3在宿主细胞中的表达的表达控制序列。在一个实施方案中,该CNGB3序列编码全长CNGB3蛋白。在一个实施方案中,该CNGB3序列是SEQ ID NO:20的蛋白序列。
在另一方面,提供了腺相关病毒(AAV)载体,其包含AAV8衣壳和表达盒,其中所述表达盒包含编码REP-1的核酸序列、反向末端重复序列和引导REP-1在宿主细胞中的表达的表达控制序列。
在又一方面,提供了腺相关病毒(AAV)载体,其包含AAV8衣壳和表达盒,其中所述表达盒包含编码CNGA3的核酸序列、反向末端重复序列和引导CNGA3在宿主细胞中的表达的表达控制序列。
在又一方面,提供了腺相关病毒(AAV)载体,其包含AAV8衣壳和表达盒,其中所述表达盒包含编码CNGB3的核酸序列、反向末端重复序列和引导CNGB3在宿主细胞中的表达的表达控制序列。
在另一方面,提供了腺相关病毒(AAV)载体,其包含AAV2衣壳和表达盒,其中所述表达盒包含编码REP-1的核酸序列、反向末端重复序列和引导REP-1在宿主细胞中的表达的表达控制序列。
在又一方面,提供了腺相关病毒(AAV)载体,其包含AAV2衣壳和表达盒,其中所述表达盒包含编码CNGA3的核酸序列、反向末端重复序列和引导CNGA3在宿主细胞中的表达的表达控制序列。
在又一方面,提供了腺相关病毒(AAV)载体,其包含AAV2衣壳和表达盒,其中所述表达盒包含编码CNGB3的核酸序列、反向末端重复序列和引导CNGB3在宿主细胞中的表达的表达控制序列。
在另一方面,提供了药物组合物,其包括药学上可接受载剂、稀释剂、赋形剂和/或佐剂以及至少一种本文中所述的病毒载体。
在再一方面,药物组合物包含药学上可接受载剂、稀释剂、赋形剂和/或佐剂以及本文中具体描述的核酸序列、质粒、载体或病毒载体,如rAAV。
在另一方面,提供了治疗无脉络膜症的方法。在一个实施方案中,该方法包括向需要其的受试者施用包括如本文中所述的编码REP-1的AAV载体的组合物。
在另一方面,提供了治疗全色盲的方法。在一个实施方案中,该方法包括向需要其的受试者施用包括如本文中所述的编码CNGA3的AAV载体的组合物。
在另一方面,提供了治疗全色盲的方法。在一个实施方案中,该方法包括向需要其的受试者施用包括如本文中所述的编码CNGB3的AAV载体的组合物。
在又一方面,提供了用于产生AAV载体的质粒。在一个实施方案中,该质粒包括编码本文中所述的REP-1的密码子优化的cDNA序列。在另一实施方案中,该质粒包括编码本文中所述的CNGA3的密码子优化的cDNA序列。在另一实施方案中,该质粒包括编码CNGB3的密码子优化的cDNA序列,其是与SEQ ID NO:19或SEQ ID NO:21共享至少70%同一性的序列。在一个实施方案中,该质粒是模块化的。
在另一方面,提供了生成rAAV病毒的方法。该方法包括在足够的病毒序列的存在下培养携带本文中所述质粒的包装细胞,以便能够将基因表达盒病毒基因组包装到感染性AAV包膜或衣壳中。在另一方面,提供了根据该方法生产的重组AAV。
本发明的其它方面和优点将由以下发明详述显而易见。
附图概述
图1A和图1B是显示在转染培养的84-31HEK细胞之后REP-1蛋白体外表达的凝胶。各凝胶的第一泳道显示如本文中所述的密码子优化的REP-1的表达,由质粒p944表达。第二泳道显示天然REP-1从质粒p742的表达。第三泳道显示REP-1通过未被质粒转染的84-31细胞的内源性表达。最后的泳道为空白。该凝胶表明,如本文中所述的密码子优化的REP-1序列导致比天然REP-1序列更高的蛋白表达水平,并且来自外源转染质粒的表达水平比内源性REP-1表达高许多倍。
图2是SEQ ID NO:1的天然REP-1编码序列vs.SEQ ID NO:3的密码子优化的REP-1编码序列的比对。
图3是SEQ ID NO:13的天然CNGA3编码序列vs.SEQ ID NO:9的密码子优化的CNGA3编码序列的比对。
图4是CNGB3天然ORF(SEQ ID NO:19)vs.CNGB3修饰的ORF(SEQ ID NO:21)vs.具有修饰末端的CNGB3修饰的ORF(SEQ ID NO:23)的比对。点突变被突出显示。
图5是本文中所述p584的质粒图谱。p584的序列显示在SEQ ID NO:7中。
图6是本文中所述AAV.hCHMco.版本2a的质粒图谱。版本2a的序列显示在SEQ IDNO:25中。
图7是本文中所述AAV.hCHMco.版本2b的质粒图谱。版本2b的序列显示在SEQ IDNO:26中。
图8是本文中所述AAV.hCHMco.版本3a的质粒图谱。版本3a的序列显示在SEQ IDNO:27中。
图9是本文中所述AAV.hCHMco.版本3b的质粒图谱。版本3b的序列显示在SEQ IDNO:28中。
图10是本文中所述AAV.hCHM.版本1的质粒图谱。版本1的序列显示在SEQ ID NO:29中。
图11是λ插入物对AAV产物杂质的影响的示意图。所有a版本(含有λ)载体具有来自qPCR测试的大大减少的Kan+信号。
图12A是显示在以5E9(高剂量)载体基因组拷贝注射有AAV8.2b的CD-1小鼠的眼组织中~75-80kDa的蛋白质的人抗-REP-1抗体检测的蛋白质印迹。以5E8(低剂量)注射有AAV8.2b的动物在~75-80kDa处显示出非常微弱的蛋白质带。图12B是用抗-REP-1抗体检测的AAV8.3b注射的CD1小鼠(2只小鼠/组)的眼组织的蛋白质印迹分析,其表明在注射有低剂量AAV8.3b的一只眼中和在注射有高剂量AAV8.3b的两只眼中存在~75-80kDa的蛋白质。在未注射的小鼠的眼组织中,未检测到REP-1表达。
发明详述
本文中描述的方法与组合物涉及用于向哺乳动物受试者递送编码REP-1的优化CHM以便治疗眼病(主要是致盲性疾病如无脉络膜症)的组合物和方法。此外,本文中描述的方法与组合物涉及向哺乳动物受试者递送优化的CNGA3或CNGB3以便治疗眼病(主要是致盲性疾病如全色盲)的组合物和方法。在一个实施方案中,此类组合物涉及REP-1、CNGA3或CNGB3编码序列的密码子优化。据信这些特征提高了产品的疗效,并提高了安全性,因为使用了较低剂量的试剂。可以预期,与可使用内源性序列产生的水平相比,转基因盒的这种优化在理论上可最大化实验蛋白的生产水平。但是,还包含在本文中的是包含天然REP1、CNGA3和CNGB3编码序列(分别如SEQ ID NO:3,SEQ ID NO:13和SEQ ID NO:19中所示)的组合物。要理解的是当对或者REP-1、CNGA3或者CNGB3描述实施方案时,类似的实施方案意在对另一实施方案进行描述。
本文中使用的技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义,并且参考公开文本,其为本领域技术人员提供了本申请中所用的许多术语的一般指南。提供本说明书中包含的定义是为了清楚地描述本文中的组分和组合物,而不是为了限制所要求保护的发明。
无脉络膜症基因(CHM)编码Rab护航蛋白-1(REP-1)——被认为参与膜运输的653个氨基酸的蛋白。在涉及该编码序列时,本文中所用的术语“REP-1”和“CHM”可互换使用。由于CHM基因座在X-染色体上,无脉络膜症通常仅在男性中确诊。尽管该疾病的女性携带者通常是无症状的,视网膜检查常常显示视网膜和RPE的斑块变性,且女性个体可能受到影响,这取决于正常X染色体的X失活程度(莱昂化作用)。参见Coussa,上文引用。编码人REP-1的天然氨基酸序列以GenBank登录号P24386报道,并在本文中在SEQ ID NO:2中再现。CHM的该天然人核酸序列在本文中再现在SEQ ID NO:3处(登录号NM_000390.2)。
环核苷酸门控制型(CNG)离子通道是构为视网膜和嗅感受器中信号转导的基础的关键中介物。CNGA3和CNGB3(编码视锥CNG通道的两种结构相关亚基)中的遗传缺陷已知导致全色盲。CNGA3是一种694个氨基酸的蛋白。CNGB是一种809个氨基酸的蛋白。
全色盲是一组异质的先天性的常染色体隐性视网膜疾病,其表现为早发性视锥光感受器功能障碍、严重减低的视敏度、受损或完全的色盲以及畏光。编码人CNGA3的天然核酸序列以GenBank登录号XM_011210554.1报道,并在SEQ ID NO:13中再现。编码人CNGA3的天然核酸序列以GenBank登录号XM_011210554.1报道,并在SEQ ID NO:13中再现。人CNGA3X1变体的天然核酸序列(其包括附加的外显子)以GenBank登录号NM_001298.2报道,并在SEQ ID NO:15中再现。编码人CNGB3的天然核酸序列在SEQ ID NO:19中再现。
在本发明的某些实施方案中,受试者患有“眼病”,本发明的组分、组合物和方法设计用于治疗该眼病。如本文中所用,本文中所用术语“受试者”是指哺乳动物,包括人、兽医或农场动物、家畜或宠物、以及通常用于临床研究的动物。在一个实施方案中,这些方法和组合物的受试者是人。再其它合适的受试者包括而不限于小鼠、大鼠、犬、猫、猪、牛、绵羊、非人灵长类等等。本文中所用的术语“受试者”可以与“患者”互换使用。
本文中所用的“眼病”包括视锥-视杆营养不良和视网膜疾病,包括但不限于斯达加特病(常染色体显性或常染色体隐性)、视网膜色素变性和模式营养不良(patterndystrophy)。在一个实施方案中,该受试者患有全色盲。在另一实施方案中,该受试者患有无脉络膜症或X连锁遗传性视网膜变性。此类眼病的临床症状包括但不限于降低的周边视觉、降低的中央(阅读)视觉、降低的夜间视觉、色觉丧失、视敏度降低、降低的光感受器功能、色素变化以及最终失明。
本文中所用的术语“治疗”定义为包括向受试者施用一种或多种本文中描述的化合物或组合物以改善眼病的一种或多种症状。“治疗”可以由此包括减少眼病的发作或进展、预防疾病、减轻疾病症状的严重程度或延缓其进展(包括失明的进展)、消除疾病症状、延缓疾病发作或监控疾病的进展或疗法在给定受试者中的疗效中的一种或多种。
用于描述核酸序列或蛋白的术语“外源”是指该核酸或蛋白并未天然存在于其在染色体或宿主细胞中存在的位置。外源核酸序列还是指源自和插入到相同宿主细胞或受试者的序列,但是其以非天然状态存在,例如不同的拷贝数或在不同调节元件的控制下。
用于描述核酸序列或蛋白的术语“异源”是指该核酸或蛋白源自与宿主细胞或在其中表达的受试者不同的生物体或相同生物体的不同物种。术语“异源”当用于质粒、表达盒或载体中的蛋白或核酸时表示该蛋白或该核酸与另一序列或子序列一起存在,所述相关蛋白或核酸在自然界中未发现彼此处于相同的关系。
在核酸序列的情况下,术语“百分比(%)同一性”、“序列同一性”、“百分比序列同一性”或“百分比同一”是指在两个序列中的碱基,其在比对以便对应时是相同的。通过在待比较的序列上比较在最佳条件下比对的两个序列来确定百分比同一性。序列同一性比较的长度可以在全长的REP-1、CNGA3或CNGB3编码序列上,或至少大约100至150个核苷酸的片段,或按需。但是,在较小片段(例如具有至少大约9个核苷酸,通常至少大约20至24个核苷酸、至少大约28至32个核苷酸、至少大约36或更多个核苷酸)中的同一性也可以是期望的。多序列比对程序也可用于核酸序列。此类程序的实例包括“Clustal X”、“CAP SequenceAssembly”、“BLAST”、“MAP”和“MEME”,其可以通过互联网上的Web服务器来访问。此类程序的其它来源是本领域技术人员已知的。或者,还使用Vector NTI应用程序。还存在许多可用于测量核苷酸序列同一性的本领域已知的算法,包括在上述程序中包含的那些。作为另一实例,可以使用FastaTM(GCG版本6.1中的一个程序)来比较多核苷酸序列。常见的序列分析软件(更具体为BLAST)或由公共数据库提供的分析工具也可以使用。
术语“分离的”是指将该材料从其原始环境(例如如果天然存在的话为自然环境)中移除。例如,存在于活动物中的天然存在的多核苷酸或多肽不是分离的,但是从天然系统中的一些或全部共存材料中分离的相同的多核苷酸或多肽是分离的,即使随后将其重新引入天然系统中也如此。此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,并且仍然是分离的,在于此类载体或组合物并非其自然环境的一部分。
“工程化”是指将编码本文中所述的REP-1或CNGA3或CNGB3蛋白的核酸序列组装并置入任何合适的遗传元件中,例如裸DNA、噬菌体、转座子、粘粒、游离基因等等,其将在其上携带的REP-1或CNGA3或CNGB3序列转移至宿主细胞,例如用于产生非病毒递送系统(例如RNA基系统、裸DNA等等)或用于在包装宿主细胞中产生病毒载体和/或用于递送至受试者内的宿主细胞。在一个实施方案中,该遗传元件是质粒。用于制造此类工程化构建体的方法是核酸操作领域技术人员已知的,并包括基因工程、重组工程和合成技术。参见例如Green和Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,ColdSpring Harbor,NY(2012)。
本文中所用的术语“转基因”是指外源或工程化的蛋白编码核酸序列,其在本说明书中描述的表达盒、rAAV基因组、重组质粒或生产质粒、载体或宿主细胞中在启动子或表达控制序列的控制下。在某些实施方案中,该转基因是人CHM(REP-1)序列,编码功能性REP-1蛋白。在一些实施方案中,该转基因是密码子优化的核酸CHM(REP-1),编码SEQ ID NO:2中所述的REP-1氨基酸序列。在某些实施方案中,该转基因被SEQ ID NO:1中所示序列编码。在某些实施方案中,该REP-1转基因被SEQ ID NO:5中所示序列编码。SEQ ID NO:5包括修饰的末端,其包括用于克隆到质粒(如本文中描述的生产质粒)中的限制位点。
在某些实施方案中,该转基因是人CNGA3序列,编码功能性CNGA3蛋白。在某些实施方案中,该转基因是编码序列SEQ ID NO:10的密码子优化的CNGA3。在某些实施方案中,该转基因被SEQ ID NO:9中所示序列编码。在一个实施方案中,该转基因包括修饰末端,如SEQID NO:16、SEQ IDNO 17或SEQ ID NO:18中显示的修饰末端,其包括用于克隆到质粒(如本文中所述的质粒)中的限制位点。在某些实施方案中,该转基因是编码序列SEQ ID NO:12的密码子优化的CNGA3。在某些实施方案中,该转基因被SEQ ID NO:11中所示序列编码。在某些实施方案中,该转基因被CNGA3的天然编码序列(其显示在SEQ ID NO:13中)编码。
在某些实施方案中,该转基因是人CNGB3序列,编码功能性CNGB3蛋白。在某些实施方案中,该转基因是编码作为与SEQ ID NO:19或21共享至少70%同一性的序列的序列的密码子优化的CNGB3。在某些实施方案中,该转基因被SEQ ID NO:23中所示序列编码。SEQ IDNO:23包括修饰末端,其包括用于克隆到质粒(如本文中所述的生产质粒)中的限制位点。SEQ ID NO:23的核苷酸13至2448提供了用于CNGB3的ORF。在某些实施方案中,该转基因是编码序列SEQ ID NO:20的密码子优化的CNGB3。在某些实施方案中,该转基因被SEQ ID NO:19中所示序列编码。在某些实施方案中,该转基因被SEQ ID NO:21中所示序列编码。在某些实施方案中,该转基因包括用于克隆到质粒(如本文中所述的质粒)中的修饰末端。SEQ IDNO:21是新型cDNA序列,其中已经对天然编码序列进行了某些沉默突变。如本文中所述,本发明预期了对天然序列的进一步修饰。
在一个实施方案中,编码REP-1、CNGA或CNGB的核酸序列进一步包含编码与之共价连接的标签多肽的核酸。该标签多肽可以选自已知的“表位标签”,包括但不限于myc标签多肽、谷胱甘肽-S-转移酶标签多肽、绿色荧光蛋白标签多肽、myc-丙酮酸激酶标签多肽、His6标签多肽、流感病毒血凝素标签多肽、flag标签多肽和麦芽糖结合蛋白标签多肽。
本文中所用的“载体”是外源或异源或工程化的核酸转基因可以插入其中的核酸分子,其可以随后引入适当的宿主细胞中。载体优选具有一个或多个复制起点,以及一个或多个该重组DNA可以插入其中的位点。载体常常具有方便的手段,由此可以从不具有载体的那些细胞中选出具有载体的细胞,例如它们编码抗性基因。常见的载体包括质粒、病毒基因组和(主要在酵母和细菌中)“人工染色体”。在本文中描述了某些质粒。
“病毒载体”定义为含有外源或异源CHM(REP-1)或CNGA3或CNGB3核酸转基因的复制缺陷型病毒。在一个实施方案中,本文中所述的表达盒可以工程化到质粒上,该质粒用于药物递送或用于生产病毒载体。合适的病毒载体优选是复制缺陷型的,并尤其选自靶向眼细胞的那些。病毒载体可以包括适于基因疗法的任何病毒,包括但不限于腺病毒;疱疹病毒;慢病毒;反转录病毒;细小病毒等等。但是,为了便于理解,腺相关病毒在本文中作为示例性病毒载体被提及。
“复制缺陷型病毒”或“病毒载体”是指合成或重组病毒颗粒,其中含有相关基因的表达盒包装在病毒衣壳或包膜中,其中也包装在该病毒衣壳或包膜中的任何病毒基因组序列是复制缺陷型的;即它们不能产生子代病毒粒体,但保留了感染靶细胞的能力。在一个实施方案中,病毒载体的基因组不包括编码复制所需酶的基因(该基因组可以被工程化为“无内容”——仅含有相关转基因,其侧接扩增和包装该人工基因组所需的信号),但是这些基因可能在生产过程中供应。因此,认为用于基因疗法是安全的,因为除了在复制所需的病毒酶的存在下之外,不会发生子代病毒粒体的复制和感染。
在又一实施方案中,该表达盒(包括本文中所述那些的任一种)用于生成重组AAV基因组。
本文中所用的术语“宿主细胞”可以是指包装细胞系,其中由生产质粒产生重组AAV。或者,术语“宿主细胞”可以是指其中需要表达该转基因的任何靶细胞。由此,“宿主细胞”是指含有已经通过任何手段(例如电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、转染、脂质体递送、膜融合技术、高速DNA包被的丸粒、病毒感染和原生质体融合)引入该细胞的外源或异源DNA的原核或真核细胞。
在本文中的某些实施方案中,术语“宿主细胞”是指用于体外评估本文中描述的组合物的各种哺乳动物物种的眼细胞的培养物。在本文中的其它实施方案中,术语“宿主细胞”是指用于产生和包装该病毒载体或重组病毒的细胞。在其它实施方案中,术语“宿主细胞”意在指在体内治疗眼病的受试者的眼细胞。
本文中所用的术语“眼细胞”是指在眼中或与眼功能相关的任何细胞。该术语可以是指光感受器细胞(包括视杆光感受器、视锥光感受器和光敏神经节细胞)、视网膜色素上皮细胞(RPE细胞)、Mueller细胞、脉络膜细胞、双极细胞、水平细胞和无长突细胞的任一种。在一个实施方案中,该眼细胞是光感受器细胞。在另一实施方案中,该眼细胞是RPE细胞。
根据本领域技术人员熟悉的标准命名惯例,“质粒”在本文中通常由小写字母p表示,其前面和/或后面是大写字母和/或数字。根据本发明可以使用的许多质粒和其它克隆与表达载体是本领域技术人员熟知和易于获得的。此外,技术人员可以容易地构建适用于本发明的任何数量的其它质粒。在本发明中的此类质粒以及其它载体的性质、构建和用途将由本公开对本领域技术人员显而易见。
本文中所用的术语“转录控制序列”或“表达控制序列”是指DNA序列,如起始序列、增强子序列和启动子序列,其诱导、抑制或以其它方式控制编码它们可操作地与其连接的核酸序列的蛋白的转录。
本文中所用的术语“可操作地连接”或“可操作地关联”是指与编码REP-1或CNGA3的核酸序列邻接的表达控制序列和/或以反式或在一定距离处起作用以控制其转录或表达的表达控制序列两者。
本文中所用的术语“AAV”或“AAV血清型”是指数十种天然存在且可用的腺相关病毒,以及人工AAV。在从人或非人灵长类(NHP)中分离或工程化且充分表征的AAV中,人AAV2是第一个作为基因转移载体开发的AAV;其已经广泛用于在不同靶组织和动物模型中的有效基因转移试验。除非另行规定,本文中描述的AAV衣壳、ITR和其它所选AAV组件可以容易地选自任何AAV,包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV8bp、AAV7M8和AAVAnc80、任何已知或提及的AAV的变体或尚待发现的AAV或其变体或混合物。参见例如WO 2005/033321,其经此引用并入本文。在另一实施方案中,该AAV衣壳是AAV8bp衣壳,其优先靶向双极细胞。参见WO 2014/024282,其经此引用并入本文。在另一实施方案中,该AAV衣壳是AAV7m8衣壳,其已经显示优先递送至外视网膜。参见Dalkara等人,In Vivo–Directed Evolution of a New Adeno-Associated Virus for TherapeuticOuter Retinal Gene Delivery from the Vitreous,Sci Transl Med 5,189ra76(2013),其经此引用并入本文。在一个实施方案中,该AAV衣壳是AAV8衣壳。在另一实施方案中,该AAV衣壳是AAV9衣壳。在另一实施方案中,该AAV衣壳是AAV5衣壳。在另一实施方案中,该AAV衣壳是AAV2衣壳。
如本文中所用,涉及AAV,术语变体是指源自已知AAV序列的任何AAV序列,包括在氨基酸或核酸序列上共享至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或更大的序列同一性的那些。在另一实施方案中,该AAV衣壳包括与任何所述或已知AAV衣壳序列相比可包括至最多大约10%变异的变体。也就是说,该AAV衣壳与本文中提供的和/或本领域中已知的AAV衣壳共享大约90%的同一性至大约99.9%的同一性、大约95%至大约99%的同一性、或大约97%至大约98%的同一性。在一个实施方案中,该AAV衣壳与AAV衣壳共享至少95%的同一性。当确定AAV衣壳的百分比同一性时,可以对任何可变蛋白(例如vp1、vp2或vp3)作比较。在一个实施方案中,该AAV衣壳与AAV8vp3共享至少95%的同一性。在另一实施方案中,使用自身互补型AAV。
使用本领域技术人员可用的技术,ITR或其它AAV组件可以从AAV容易地分离或工程化。此类AAV可以从学术、商业或公共来源(例如American Type Culture Collection,Manassas,VA)分离、工程化或获得。或者,该AAV序列可以经由合成或其它合适的手段通过参考公开的序列(例如可以在文献或数据库如GenBank、PubMed等等中获得)进行工程化。AAV病毒可以通过常规分子生物学技术来工程化,使得能够优化这些颗粒以便细胞特异性递送核酸序列、最小化免疫原性、调节稳定性和颗粒寿命、有效降解、准确递送至细胞核等等。
本文中所用的“人工AAV”意指但不限于具有非天然存在的衣壳蛋白的AAV。此类人工衣壳可以通过任何合适的技术使用所选AAV序列(例如vp1衣壳蛋白的片段)结合异源序列来生成,该异源序列可以获自不同的所选AAV、相同AAV的非邻接部分、非AAV病毒来源或非病毒来源。人工AAV可以是但不限于假型AAV、嵌合AAV衣壳、重组AAV衣壳或“人源化”AAV衣壳。其中一种AAV的衣壳用异源衣壳蛋白代替的假型载体可用于本发明。在一个实施方案中,AAV2/5和AAV2/8是示例性的假型载体。
“自身互补型AAV”是指具有其中重组AAV核酸序列所携带的编码区被设计为形成分子内双链DNA模板的表达盒的质粒或载体。在感染时而不是等待第二链的细胞介导合成,该scAAV的两个互补半部将缔合以形成准备即时复制和转录的双链DNA(dsDNA)单元。参见例如D M McCarty等人,“Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently ofDNA synthesis”,Gene Therapy(2001年8月),第8卷,第16期,第1248-1254页。自身互补型AAV描述在例如美国专利号6,596,535;7,125,717和7,456,683中,其各自经此引用全文并入本文。
该方法中所用的“施用”是指将组合物递送至以眼病为特征的目标所选细胞。在一个实施方案中,该方法包括通过视网膜下注射至RPE、光感受器细胞或其它眼细胞来递送该组合物。在另一实施方案中,采用玻璃体内注射至眼细胞。在另一种方法中,可以采用经由睑静脉注射至眼细胞。在给出本公开的情况下,可以由本领域技术人员选择其它施用方法。“施用”或“施用途径”是在使用或不使用药物载剂或赋形剂的情况下向受试者递送本文中描述的组合物。如果需要的话,施用途径可以组合。在一些实施方案中,该施用定期重复。本文中描述的药物组合物设计为通过任何合适的途径或不同途径的组合递送至需要其的受试者。直接递送至眼(任选经由眼递送、视网膜下注射、视网膜内注射、玻璃体内、局部)或经由全身途径递送,例如动脉内、眼内、静脉内、肌肉内、皮下、皮内和其它亲本施用途径。本文中描述的核酸分子和/或载体可以以单一组合物或多种组合物递送。任选地,可以递送两种或多种不同的AAV或多种病毒[参见例如WO202011/126808和WO 2013/049493]。在另一实施方案中,多种病毒可以含有不同的复制缺陷型病毒(例如AAV和腺病毒),单独或与蛋白组合。
本文中描述的某些组合物是分离的或合成或重组工程化的核酸序列,其提供编码REP-1或CNGA3或CNGB3的新型密码子优化的序列。在一个实施方案中,提供了编码人REP-1的分离或工程化的密码子优化的核酸序列。在一个实施方案中,该密码子优化的序列是SEQID NO:1。在另一实施方案中,该密码子优化的序列包括用于克隆的N端和C端限制位点。在一个实施方案中,如在SEQ ID NO:5中公开的序列,除了Kozak共有序列之外,该REP-1编码序列还包括N端NotI限制位点和C端BamHI限制位点。此外,该密码子优化的序列在一些实施方案中包括一个或多个附加的限制位点以允许添加标记,如表位标签。当与天然核酸序列比对时,该密码子优化的REP-1可以具有至少50%、或至少60%、或至少70%、或至少80%、或至少90%的百分比同一性,包括任何这些范围之间的任何整数。在一个实施方案中,该密码子优化的REP-1具有至少51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99%的与天然序列的百分比同一性。在一个实施方案中,当与天然核酸序列SEQ ID NO:3比对时,显示了密码子优化的REP-1(SEQ ID NO:1)具有仅74%的百分比序列同一性(参见图2)。
在另一实施方案中,提供了编码人CNGA3的分离或工程化的密码子优化的核酸序列。在一个实施方案中,该密码子优化的序列是SEQ ID NO:9。在一个实施方案中,该密码子优化的序列是显示在SEQ ID NO:11中的CNGA3变体。在另一实施方案中,该密码子优化的序列包括用于克隆的N端和C端限制位点。在一个实施方案中,除了Kozak共有序列之外,该CNGA3编码序列还包括N端NotI限制位点和C端BglII限制位点。包括此类修饰的CNGA3序列的实例可以在SEQ ID NO:16、SEQ ID NO:17和SEQ ID NO:18中找到。此外,该密码子优化的序列在一些实施方案中包括一个或多个附加的限制位点以允许添加标记,如表位标签。当与天然核酸序列比对时,该密码子优化的CNGA3可以具有至少50%、或至少60%、或至少70%、或至少80%、或至少90%的百分比同一性,包括任何这些范围之间的任何整数。在一个实施方案中,该密码子优化的CNGA3具有至少51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99%的与天然序列的百分比同一性。在一个实施方案中,当与天然核酸序列SEQ ID NO:13比对时,显示了密码子优化的CNGA3(SEQ ID NO:9)具有仅80%的百分比序列同一性(参见图3)。
在另一实施方案中,提供了编码人CNGB3的分离或工程化的密码子优化的核酸序列。在一个实施方案中,该密码子优化的序列是与SEQ ID NO:19或SEQ ID NO 21共享至少70%的同一性的序列。在另一实施方案中,该密码子优化的序列包括用于克隆的N端和C端限制位点,例如显示在SEQ ID NO:23中。此外,该密码子优化的序列在一些实施方案中包括一个或多个附加的限制位点以允许添加标记,如表位标签。当与天然核酸序列(如SEQ IDNO:19中所显示)比对时,该密码子优化的CNGB3可以具有至少50%、或至少60%、或至少70%、或至少80%、或至少90%的百分比同一性,包括任何这些范围之间的任何整数。在一个实施方案中,该密码子优化的CNGB3具有至少51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99%的与天然序列的百分比同一性。
在一个实施方案中,本文中描述的编码REP-1或CNGA3构建体的优化核酸序列工程化为任何合适的遗传元件,例如裸DNA、噬菌体、转座子、粘粒、RNA分子(例如mRNA)、游离基因等等,其将其上携带的REP-1或CNGA3序列转移至宿主细胞,例如用于产生携带DNA或RNA的纳米颗粒、在包装宿主细胞中的病毒载体和/或用于递送至受试者体内的宿主细胞。在一个实施方案中,该遗传元件是质粒。
所选遗传元件可以通过任何合适的方法来递送,包括转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的丸粒、病毒感染和原生质体融合。用于制造此类构建体的方法是核酸操作领域技术人员已知的,并包括基因工程、重组工程和合成技术。参见例如Green和Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NY(2012)。
提供了多种表达盒,其使用SEQ ID Nos.1或5以表达REP-1蛋白。在一个实施方案中,含有此类表达盒的质粒的实例显示在SEQ ID NO.25中。在一个实施方案中,含有此类表达盒的质粒的实例显示在SEQ ID NO.26中。在一个实施方案中,含有此类表达盒的质粒的实例显示在SEQ ID NO.27中。在一个实施方案中,含有此类表达盒的质粒的实例显示在SEQID NO.28中。本文中所用的“载体基因组”是包装在5’和3’ITRs之间的核酸序列,包括ITRs本身。在一些实施方案中,术语“载体基因组”与“表达盒”可互换使用。由此,在一个实施方案中,该载体基因组包括5’ITR、CMV增强子、鸡β肌动蛋白启动子、CBA外显子1和内含子、Kozak序列、密码子优化的CHM、bGH poly A和3’ITR。在一个实施方案中,该载体基因组包含SEQ ID NO:25的nt 1至4233。在另一实施方案中,该载体基因组包含SEQ ID NO:26的nt 1至4233。在另一实施方案中,该载体基因组包含SEQ ID NO:27的nt 1至4233。在另一实施方案中,该载体基因组包含SEQ ID NO:28的nt 1至4233。
在另一实施方案中,提供了多种表达盒,其使用SEQ ID Nos.9、11或13以表达CNGA3蛋白。在另一实施方案中,提供了多种表达盒,其使用SEQ ID Nos.19、21或23以表达CNGAB蛋白。本文中所用的“表达盒”是指核酸分子,其包含用于优化REP-1或CNGA3或CNGB3蛋白的编码序列、启动子,并可以为此包括其它调控序列,该盒可以工程化到遗传元件或质粒中,和/或包装到病毒载体(例如病毒颗粒)的衣壳中。在一个实施方案中,表达盒包含编码REP-1的密码子优化的核酸序列。在一个实施方案中,该盒提供与引导在宿主细胞中编码REP-1的密码子优化的核酸序列表达的表达控制序列可操作地关联的密码子优化的REP-1。
在另一实施方案中,表达盒包含编码CNGA3的密码子优化的核酸序列。在一个实施方案中,该盒提供与引导在宿主细胞中编码CNGA3的密码子优化的核酸序列表达的表达控制序列可操作地关联的密码子优化的CNGA3。
在另一实施方案中,表达盒包含编码CNGB3的密码子优化的核酸序列。在一个实施方案中,该盒提供与引导在宿主细胞中编码CNGB3的密码子优化的核酸序列表达的表达控制序列可操作地关联的密码子优化的CNGB3。
在另一实施方案中,提供了用于AAV载体的表达盒。在该实施方案中,该AAV表达盒包括至少一个AAV反向末端重复(ITR)序列。在另一实施方案中,该表达盒包含5’ITR序列和3’ITR序列。在一个实施方案中,该5’和3’ITRs侧接编码REP-1或CNGA3或CNGB3的密码子优化的核酸序列,任选具有附加序列,其引导在宿主细胞中编码REP-1或CNGA3或CNGB3的密码子优化的核酸序列的表达。由此,如本文中所述,AAV表达盒意味着描述如上所述的表达盒,在其5’末端处侧接5’AAV反向末端重复序列(ITR),且在其3’末端处侧接3’AAV ITR。由此,该rAAV基因组含有将该表达盒包装到AAV病毒颗粒中所需的最小序列,即AAV 5’和3’ITRs。该AAV ITRs可以获自如本文中所述的任何AAV的ITR序列。这些ITRs可以具有与所得重组AAV中所用衣壳相同的AAV来源,或具有不同的AAV来源(以生产AAV假型)。在一个实施方案中,来自AAV2或其删除版本(ΔITR)的ITR序列为方便而使用并用于加速调节批准。但是,可以选择来自其它AAV来源的ITRs。各rAAV基因组可以随后引入生产质粒。在一个实施方案中,该生产质粒是本文中描述的或如WO2012/158757(其经此引用并入本文)中所述的生产质粒。各种质粒在本领域中已知用于生产rAAV载体,并可用于本文。该生产质粒在表达AAV帽和/或rep蛋白的宿主细胞中培养。在该宿主细胞中,各rAAV基因组被拯救并包装到衣壳蛋白或包膜蛋白中以形成感染性病毒颗粒。
一种类型的生产质粒是显示在SEQ ID NO:7中的生产质粒,其被称为p584。该质粒在实施例中用于生成该rAAV-REP-1载体。此类质粒是含有5’AAV ITR序列;所选启动子;polyA序列;和3’ITR的质粒;此外,其还含有填充序列如λ。在一个实施方案中,非编码λ填充区域包括在该载体主链中。编码REP-1、CNGA3或CNGB2的核酸序列插入到所选启动子与polyA序列或类似的质粒之间的位置。包括REP-1编码序列的p584的一个实例可以在SEQ IDNO:8中找到。在另一实施方案中,将该生产质粒修饰以优化载体质粒生产效率。此类修饰包括添加其它中性序列或删除部分或整个λ填充序列以调节载体质粒的超螺旋水平。在本文中考虑了此类修饰。在其它实施方案中,在该质粒中包括终止子和其它序列。
在又一实施方案中,提供了重组腺相关病毒(AAV)载体用于递送REP-1、CNGA3和CNGB3构建体以及本文中描述的优化序列。腺相关病毒(AAV)病毒载体是用于递送至靶细胞的具有核酸序列包装至其中的AAV蛋白衣壳的AAV Dnase抗性颗粒。AAV衣壳由60个衣壳(帽)蛋白亚基VP1、VP2和VP3组成,其根据所选AAV以大约1:1:10至1:1:20的比以二十面体对称排列。可以选择AAV作为如上文所确定的AAV病毒载体的衣壳来源。参见例如美国公开专利申请号2007-0036760-A1;美国公开专利申请号2009-0197338-A1;EP1310571。还参见WO 2003/042397(AAV7和其它猿猴AAV)、美国专利7790449和美国专利7282199(AAV8)、WO2005/033321和US 7,906,111(AAV9)、以及WO 2006/110689和WO 2003/042397(rh.10)。这些文献还描述了可以选择用于生成AAV的其它AAV,并经此引用并入。在一些实施方案中,用于该病毒载体的AAV帽可以通过前述AAV衣壳或其编码核酸之一的诱变(即通过插入、缺失或取代)来产生。在一些实施方案中,该AAV衣壳是嵌合的,包含来自两种或三种或四种或更多种前述AAV衣壳蛋白的结构域。在一些实施方案中,该AAV衣壳是来自两种或三种不同的AAV或重组AAV的Vpl、Vp2和Vp3单体的嵌合体。在一些实施方案中,rAAV组合物包含超过一种的前述帽。
在另一实施方案中,该AAV衣壳包括与任何所述或已知的AAV衣壳序列相比可包括至最多大约10%变异的变体。也就是说,该AAV衣壳与本文中提供的和/或本领域中已知的AAV衣壳共享大约90%的同一性至大约99.9%的同一性、大约95%至大约99%的同一性或大约97%至大约98%的同一性。在一个实施方案中,该AAV衣壳与AAV衣壳共享至少95%的同一性。当确定AAV衣壳的百分比同一性时,可以对任何可变蛋白质(例如vp1、vp2或vp3)作比较。在一个实施方案中,该AAV衣壳与AAV8vp3共享至少95%的同一性。在另一实施方案中,使用自身互补型AAV。在一个实施方案中,合意的是使用对所需靶细胞(例如光感受器、RPE或其它眼细胞)显示向性的AAV衣壳。在一个实施方案中,该AAV衣壳是酪氨酸衣壳突变体,其中某些表面暴露的酪氨酸残基被苯丙氨酸(F)取代。此类AAV变体例如描述在Mowat等人,Tyrosine capsid-mutant AAV vectors for gene delivery to the canine retinafrom a subretinal or intravitreal approach,Gene Therapy 21,96-105(2014年1月),其经此引用并入本文。
为了将表达盒或rAAV基因组或生产质粒包装到病毒粒体中,该ITR是在与该转基因相同的构建体中以顺式所需的唯一AAV组件。在一个实施方案中,从该AAV基因组中除去用于复制(rep)和/或衣壳(cap)的编码序列,并以反式或通过包装细胞系提供该编码序列以生成该AAV载体。例如,如上所述,假型AAV可以含有来自与该AAV衣壳来源不同的来源的ITR。附加地或替代地,可以使用嵌合AAV衣壳。还可以选择其它AAV组件。此类AAV序列的来源在本文中进行了描述,并还可以从学术、商业或公共来源(例如American Type CultureCollection,Manassas,VA)分离或工程化获得。或者,该AAV序列可以经由合成或其它合适的手段通过参考公开的序列(例如可以在文献或数据库中获得,如等等)来获得。
生成和分离适于递送至受试者的AAV病毒载体的方法在本领域中是已知的。参见例如美国专利7790449;美国专利7282199;WO 2003/042397;WO2005/033321;WO 2006/110689和US 7588772B2。在一种系统中,用编码侧接ITRs的转基因的构建体和编码rep与cap的构建体瞬时转染生产细胞系。在第二系统中,用编码侧接ITRs的转基因的构建体瞬时转染稳定提供rep和cap的包装细胞系。在各自这些系统中,AAV病毒粒体响应于感染辅助腺病毒或疱疹病毒而产生,需要从污染病毒中分离rAAVs。近来,开发了不需要用辅助病毒感染以回收AAV的系统,由该系统以反式还提供了所需辅助功能(即腺病毒E1、E2a、VA和E4或疱疹病毒UL5、UL8、UL52和UL29以及疱疹病毒聚合酶)。在这些较新的系统中,辅助功能可以通过用编码所需辅助功能的构建体瞬时转染该细胞来提供,或者该细胞可以被工程化以稳定含有编码该辅助功能的基因,其表达可以以转录水平或转录后水平来控制。
在又一种系统中,通过用基于杆状病毒的载体感染将侧接ITRs的转基因和rep/cap基因引入到昆虫细胞中。对于这些生产系统的概述,通常参见例如Zhang等人,2009,“Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production”,Human Gene Therapy 20:922-929,其各自的内容经此引用全文并入本文。制造和使用这些和其它AAV生产系统的方法还描述在下列美国专利中,其各自的内容经此引用全文并入本文:5,139,941;5,741,683;6,057,152;6,204,059;6,268,213;6,491,907;6,660,514;6,951,753;7,094,604;7,172,893;7,201,898;7,229,823和7,439,065。
通常参见例如Grieger&Samulski,2005,“Adeno-associated virus as a genetherapy vector:Vector development,production and clinical applications”,Adv.Biochem.Engin/Biotechnol.99:119-145;Buning等人,2008,“Recent developmentsin adeno-associatedvirus vector technology”,J.Gene Med.10:717-733;以及下文引用的参考文献,其各自经此引用全文并入本文。
用于构建本发明任何实施方案的方法是核酸操作领域技术人员已知的,并包括基因工程、重组工程和合成技术。参见例如Green和Sambrook等人,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NY(2012)。类似地,生成rAAV病毒粒体的方法是熟知的,并且选择合适的方法不会限制本发明。参见例如K.Fisher等人,(1993)J.Virol.,70:520-532和美国专利号5,478,745。
该rAAV载体包含AAV衣壳和含有编码REP-1或CNGA3或CNGB3的序列(如上所述)的AAV表达盒。在某些实施方案中,该rAAV表达盒包含AAV反向末端重复序列和编码REP-1或CNGA3或CNGB3的密码子优化的核酸序列,以及引导编码蛋白在宿主细胞中的表达的表达控制序列。该rAAV表达盒在其它实施方案中进一步包含内含子、Kozak序列、polyA和转录后调节元件的一种或多种。用于递送至眼的药物组合物的此类rAAV载体可以使用来自上述许多已知AAV的任一种的衣壳。
如本文中所述,该表达盒与载体的其它常规组件包括可以使用本领域中已知的技术(例如密码子优化)对特定物种进行优化的其它组件。本文中描述的盒、载体、质粒和病毒或其它组合物的组件包括作为该表达控制序列的一部分的启动子序列。在另一实施方案中,该启动子是细胞特异性的。术语“细胞特异性”是指对该重组载体选择的特定启动子可以引导优化的REP-1或CNGA3或CNGB3转基因在特定的眼细胞类型中的表达。在一个实施方案中,该启动子对该转基因在光感受器细胞中的表达是特异性的。在另一实施方案中,该启动子对在视杆细胞和视锥细胞中的表达是特异性的。在另一实施方案中,该启动子对在视杆细胞中的表达是特异性的。在另一实施方案中,该启动子对在视锥细胞中的表达是特异性的。在一个实施方案中,该光感受器特异性启动子是人视紫红质激酶启动子。该视紫红质激酶启动子已经显示在视杆细胞和视锥细胞两者中均是活性的。参见例如Sun等人,GeneTherapy with a Promoter Targeting Both Rods and Cones Rescues RetinalDegeneration Causedby AIPL1Mutations,Gene Ther.2010年1月;17(1):117–131,其经此引用全文并入本文。在一个实施方案中,修饰该启动子以添加一个或多个限制位点以促进克隆。
在另一实施方案中,该启动子是人视紫红质启动子。在一个实施方案中,修饰该启动子以包括在末端的限制以便克隆。参见例如Nathans and Hogness,Isolation andnucleotide sequence of the gene encoding human rhodopsin,PNAS,81:4851-5(1984年8月),其经此引用全文并入本文。在另一实施方案中,该启动子是人视紫红质启动子的一部分或片段。在另一实施方案中,该启动子是人视紫红质启动子的变体。
其它示例性的启动子包括人G蛋白偶联受体蛋白激酶1(GRK1)启动子(GenBank登录号AY327580)。在另一实施方案中,该启动子是GRK1启动子的292nt片段(位置1793-2087)(参见Beltran等人,Gene Therapy 201017:1162-74,其经此引用全文并入本文)。在另一优选实施方案中,该启动子是人光感受器间视黄醇类结合蛋白近端(IRBP)启动子。在一个实施方案中,该启动子是该hIRBP启动子的235nt片段。在一个实施方案中,该启动子是RPGR近端启动子(Shu等人,IOVS,2012年5月,其经此引用全文并入本文)。可用于本发明的其它启动子包括但不限于视杆视蛋白启动子、红绿色视蛋白启动子、蓝色视蛋白启动子、cGMP-β-磷酸二酯酶启动子(Qgueta等人,IOVS,Invest Ophthalmol Vis Sci.2000年12月;41(13):4059-63)、小鼠视蛋白启动子(Beltran等人,2010,上文引用)、视紫红质启动子(Mussolino等人,Gene Ther,2011年7月,18(7):637-45);视锥转录蛋白的α亚基(Morrissey等人,BMCDev,Biol,2011年1月,11:3);β磷酸二酯酶(PDE)启动子;色素性视网膜炎(RP1)启动子(Nicord等人,J.Gene Med,2007年12月,9(12):1015-23);NXNL2/NXNL1启动子(Lambard等人,PloS One,2010年10月,5(10):e13025),RPE65启动子;视网膜变性慢/外周蛋白2(Rds/perph2)启动子(Cai等人,Exp Eye Res.2010年8月;91(2):186-94);和VMD2启动子(Kachi等人,Human Gene Therapy,2009(20:31-9))。这些文献各自经此引用全文并入本文。在另一实施方案中,该启动子选自人EF1α启动子、视紫红质启动子、视紫红质激酶、光感受器间视黄醇类结合蛋白(IRBP)、视锥视蛋白启动子(红绿色、蓝色)、含有红绿色视锥基因座控制区的视锥视蛋白上游序列、视锥转录和转录因子启动子(神经视网膜亮氨酸拉链(Nrl)和光感受器特异性核受体Nr2e3,bZIP)。
在另一实施方案中,该启动子是遍在型或组成型启动子。合适的启动子的实例是具有巨细胞病毒(CMV)增强子元件的杂合鸡β-肌动蛋白(CBA)启动子。在另一实施方案中,该启动子是CB7启动子。其它合适的启动子包括人β-肌动蛋白启动子、人延伸因子-1α启动子、巨细胞病毒(CMV)启动子、猿猴病毒40启动子和单纯疱疹病毒的胸苷激酶启动子。参见例如Damdindorj等人,(2014年8月)A Comparative Analysis of ConstitutivePromoters Located in Adeno-Associated Viral Vectors.PloS ONE 9(8):e106472。再其它合适的启动子包括病毒启动子、组成型启动子、可调型启动子[参见例如WO 2011/126808和WO2013/04943]。或者响应生理信号(cues)的启动子可用于本文中描述的表达盒、rAAV基因组、载体、质粒和病毒。在一个实施方案中,由于AAV载体的尺寸限制,该启动子具有小尺寸,1000bp以下。在另一实施方案中,该启动子400bp以下。可以由本领域技术人员选择其它启动子。在一个实施方案中,该REP-1构建体包含遍在型启动子。在另一实施方案中,该CNGA3构建体包含光感受器特异性启动子。在一个实施方案中,该REP-1构建体包括具有CMV增强子元件的CBA启动子。
在另一实施方案中,该启动子是诱导型启动子。该诱导型启动子可以选自已知的启动子,包括雷帕霉素/雷帕霉素类似物(rapalog)启动子、蜕皮激素启动子、雌激素响应启动子和四环素响应启动子或异二聚体阻遏开关。参见Sochor等人,An AutogenouslyRegulated Expression System for Gene Therapeutic OcularApplications.Scientific Reports,2015年11月24日;5:17105和Daber R,Lewis M.,Anovel molecular switch.J Mol Biol.2009年8月28日;391(4):661-70,Epub 2009年6月21日,其均经此引用全文并入本文。
在其它实施方案中,本文中描述的盒、载体、质粒和病毒构建体含有其它适当的转录起始、终止、增强子序列、有效的RNA处理信号如剪接和聚腺苷酸化(polyA)信号;TATA序列;稳定细胞质mRNA的序列;增强翻译效率的序列(即Kozak共有序列);内含子;增强蛋白稳定性的序列;以及在需要时增强编码产物分泌的序列。该表达盒或载体可以不含有任何本文中描述的元件,可以含有任何本文中描述的元件的一种或多种。合适的polyA序列的实例包括例如SV40、牛生长激素(bGH)和TKpolyA。合适的增强子的实例尤其包括例如CMV增强子、RSV增强子、α甲胎蛋白增强子、TTR最小启动子/增强子、LSP(TH结合球蛋白启动子/α1-微球蛋白/尿抑胰酶素增强子)。在一个实施方案中,在该转基因编码序列上游包括Kozak序列以增强从正确的起始密码子的翻译。在另一实施方案中,CBA外显子1和内含子包括在该表达盒中。在一个实施方案中,该转基因置于杂合鸡β-肌动蛋白(CBA)启动子的控制下。该启动子由巨细胞病毒(CMV)即时早期增强子、近端鸡β肌动蛋白启动子和侧接内含子1序列的CBA外显子1组成。
在一个实施方案中,该表达盒含有5’ITR、CBA启动子、CMV增强子、CBA外显子1和内含子、kozak序列、人密码子优化的CHM序列(SEQ ID NO:1)、bGH poly A和3’ITR。
在再其它方面,这些核酸序列、载体、表达盒和rAAV病毒载体可用于药物组合物,其还包含药学上可接受载剂、缓冲剂、稀释剂和/或佐剂等等。此类药物组合物经由通过此类重组工程化的AAV或人工AAV的递送用于在该眼细胞中表达优化的REP-1或CNGA3或CNGB3。
为了制备含有该核酸序列、载体、表达盒和rAAV病毒载体的这些药物组合物,该序列或载体或病毒载体优选通过常规方法评估污染并随后配制成适于施用于眼的药物组合物。此类制剂涉及使用药学和/或生理学上可接受的媒介物或载剂,特别是适于施用于眼的媒介物或载剂,例如缓冲盐水或其它缓冲剂,例如HEPES以便将pH保持在适当的生理水平,以及任选的其它药用剂、药物剂、稳定剂、缓冲剂、载剂、佐剂、稀释剂等等。对注射而言,该载剂通常为液体。示例性的生理学上可接受的载剂包括无菌、无热原的水和无菌、无热原的磷酸盐缓冲盐水。在经此引用并入本文的美国专利公开号7,629,322中提供了多种此类已知载剂。在一个实施方案中,该载剂是等渗氯化钠溶液。在另一实施方案中,该载剂是平衡的盐溶液。在一个实施方案中,该载剂包括吐温。如果要长期储存病毒的话,其可能在甘油或吐温20的存在下冷冻。
在一个示例性的具体实施方案中,该载剂或赋形剂的组成含有180mM NaCl、10mMNaPi、pH7.3以及0.0001%-0.01%Pluronic F68(PF68)。该缓冲剂的盐水组分的确切组成为160mM至180mM NaCl。任选地,使用不同的pH缓冲剂(可能是HEPES、碳酸氢钠、TRIS)代替具体描述的缓冲剂。或者,可以使用含有0.9%NaCl的缓冲剂。
任选地,本发明的组合物除了rAAV和/或变体与载剂之外可以含有其它常规药物成分,如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯类、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包括明胶和白蛋白。
含有至少一种如本文中所述的复制缺陷型rAAV病毒的药物组合物可以与生理学上可接受的载剂、稀释剂、赋形剂和/或佐剂一起配制,用于基因转移和基因治疗应用。在AAV病毒载体的情况下,基因组拷贝(“GC”)、载体基因组(“VG”)或病毒颗粒的定量可以用作制剂或悬浮液中所含剂量的量度。本领域中已知的任何方法可用于确定本发明的复制缺陷型病毒组合物的基因组拷贝(GC)数量。进行AAV GC数量滴定的一种方法如下:首先用Dnase处理纯化的AAV载体样品以便从生产过程中消除未衣壳化的AAV基因组DNA或污染质粒DNA。随后对Dnase抗性颗粒施以热处理以便从衣壳中释放该基因组。释放的基因组随后通过实时PCR使用靶向病毒基因组的特定区域(通常为polyA信号)的引物/探针组来进行定量。在另一方法中,如S.K.McLaughlin等人,1988J.Virol.,62:1963中所述测量携带编码优化REP-1或CNGA3转基因的核酸序列的重组腺相关病毒的有效剂量,其经此引用全文并入本文。
本文中所用的术语“剂量”可指在治疗期间递送至受试者的总剂量或在单个单元(或多个单元或分割剂量)施用中递送的量。药物病毒组合物可以以剂量单位配制以含有一定量的如本文中所述的携带编码REP-1或CNGA3或CNGB3的密码子优化的核酸序列的复制缺陷型病毒,其范围为大约1.0×109GC至大约1.0×1015GC,包括该范围内的所有整数或分数量。在一个实施方案中,该组合物配制为含有每剂量至少1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109或9×109GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010或9×1010GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011或9×1011GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012或9×1012GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1013、2×1013、3×1013、4×1013、5×1013、6×1013、7×1013、8×1013或9×1013GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1014、2×1014、3×1014、4×1014、5×1014、6×1014、7×1014、8×1014或9×1014GC,包括该范围内的所有整数或分数量。在另一实施方案中,该组合物配制为含有每剂量至少1×1015、2×1015、3×1015、4×1015、5×1015、6×1015、7×1015、8×1015或9×1015GC,包括该范围内的所有整数或分数量。在一个实施方案中,对于人应用而言,该剂量可以在每剂量1×1010至大约1×1012GC的范围内,包括该范围内的所有整数或分数量。所有剂量可以通过任何已知方法测量,包括如例如M.Lock等人,Hum Gene Ther Methods.2014年4月;25(2):115-25.Doi:10.1089/hgtb.2013.131中所述通过oqPCR或数字液滴PCR(ddPCR)来测量,其经此引用并入本文。
这些上述剂量可以在各种体积的载剂、赋形剂或缓冲剂制剂中施用,所述体积在大约25至大约1000微升的范围内,包括该范围内的所有数字,取决于待处理的区域的尺寸、所用病毒滴度、施用的途径和该方法的所需效果。在一个实施方案中,载剂、赋形剂或缓冲剂的体积为至少大约25μL。在一个实施方案中,该体积为大约50μL。在另一实施方案中,该体积为大约75μL。在另一实施方案中,该体积为大约100μL。在另一实施方案中,该体积为大约125μL。在另一实施方案中,该体积为大约150μL。在另一实施方案中,该体积为大约175μL。在又一实施方案中,该体积为大约200μL。在另一实施方案中,该体积为大约225μL。在又一实施方案中,该体积为大约250μL。在又一实施方案中,该体积为大约275μL。在又一实施方案中,该体积为大约300μL。在又一实施方案中,该体积为大约325μL。在另一实施方案中,该体积为大约350μL。在另一实施方案中,该体积为大约375μL。在另一实施方案中,该体积为大约400μL。在另一实施方案中,该体积为大约450μL。在另一实施方案中,该体积为大约500μL。在另一实施方案中,该体积为大约550μL。在另一实施方案中,该体积为大约600μL。在另一实施方案中,该体积为大约650μL。在另一实施方案中,该体积为大约700μL。在另一实施方案中,该体积在大约700和1000μL之间。
在一个实施方案中,对小型动物对象,如小鼠,可以以大约1μL至大约3μL的体积,以至少1×109至大约至少1×1011GC的剂量递送该病毒构建体。对于眼尺寸与人眼大致相同的较大兽医受试者,上文描述的较大的人用剂量和体积是可用的。参见例如Diehl等人,J.Applied Toxicology,21:15-23(2001),讨论了向各种兽医动物施用物质的良好实践。该文献经此引用并入本文。
合意的是使用最低有效浓度的病毒或其它递送媒介物以降低非期望效果的风险,如毒性、视网膜发育异常和脱离。考虑治疗的受试者(优选人)的身体状况、该受试者的年龄、特定的眼病和疾病发展的程度(如果是进行性的),主治医师可以选择这些范围内的其它剂量。
本文中描述的又一方面是用于治疗、延缓或停止具有或处于发展无脉络膜症的风险的哺乳动物受试者中的失明进展的方法。在一个实施方案中,携带REP-1密码子优化的序列的rAAV,优选悬浮在生理相容性载剂、稀释剂、赋形剂和/或佐剂中,可以施用于期望的受试者,包括人受试者。该方法包括向需要其的受试者施用核酸序列、表达盒、rAAV基因组、质粒、载体或rAAV载体或含有其的组合物中的任何。在一个实施方案中,该组合物在视网膜下递送。在另一实施方案中,该组合物在玻璃体内递送。在又一实施方案中,该组合物使用适于治疗眼病的施用途径的组合来递送,并还可包括经由睑静脉或其它静脉内或常规施用途径来施用。
本文中描述的再一方面是用于治疗、延缓或停止具有或处于发展全色盲的风险的哺乳动物受试者中的失明进展的方法。在一个实施方案中,携带CNGA3或CNGB3天然的、修饰的或密码子优化的序列的rAAV,优选悬浮在生理相容性载剂、稀释剂、赋形剂和/或佐剂中,可以施用于期望的受试者,包括人受试者。该方法包括向需要其的受试者施用核酸序列、表达盒、rAAV基因组、质粒、载体或rAAV载体或含有其的组合物中的任何。在一个实施方案中,该组合物在视网膜下递送。在另一实施方案中,该组合物在玻璃体内递送。在又一实施方案中,该组合物使用适于治疗眼病的施用途径的组合来递送,并还可包括经由睑静脉或其它静脉内或常规施用途径来施用。
为了用于这些方法,各剂量的体积和病毒滴度是单独确定的,如本文中进一步描述的那样,并可以与相同或对侧眼中进行的其它治疗相同或不同。剂量、施用和方案可以由主治医师在给出本说明书的教导的情况下确定。在一个实施方案中,该组合物以选自上文列举的那些的单个剂量在单个受影响的眼中施用。在另一实施方案中,该组合物以选自上文列举的那些的单个剂量在两只受影响的眼中同时或顺序施用。顺序施用可能意味着由一只眼到另一只眼的施用的时间间隔为数分钟、数小时、数天、数周或数个月的区间。在另一实施方案中,该方法包括向眼施用该组合物两个或更多剂量(例如分割剂量)。在另一实施方案中,在同一只眼的不同部分进行多次注射。在另一实施方案中,在以后的时间点进行包括所选表达盒(例如含有CHM的盒)的rAAV的第二次施用。此类时间点可以是首次施用后的数周、数月或数年。此类第二次施用在一个实施方案中用具有不同于来自首次施用的rAAV的衣壳的rAAV来进行。在另一实施方案中,来自首次和第二次施用的rAAV具有相同的衣壳。
在又一实施方案中,本文中描述的组合物可以以单种组合物或多种组合物递送。任选地,可以递送两种或多种不同的AAV,或多种病毒[参见例如WO2011/126808和WO 2013/049493]。在另一实施方案中,多种病毒可以含有不同的复制缺陷型病毒(例如AAV和腺病毒)。
在本发明的某些实施方案中,合意的是进行非侵入性视网膜成像和功能研究以确定要作为治疗目标的视杆与视锥光感受器的区域。在这些实施方案中,采用临床诊断测试来确定一次或多次视网膜下注射的精确位置。这些测试可以包括视网膜电描记术(ERG)、视野检查法、视网膜层的地形作图以及通过共焦激光扫描检眼镜检查法(cSLO)和光学相干断层照相(OCT)测量该层的厚度、经由自适应光学(AO)对视锥细胞密度进行地形作图、功能性眼检查等等,取决于治疗的受试者的物种、其身体状况和健康以及剂量。鉴于成像与功能研究,在本发明的一些实施方案中在相同的眼中进行一次或多次注射以靶向受影响的眼的不同区域。各次注射的体积和病毒滴度是单独确定的,如本文中进一步描述的那样,并可以与相同或对侧眼中进行的其它注射相同或不同。在另一实施方案中,进行单次、更大体积的注射以治疗整个眼。在一个实施方案中,选择该rAAV组合物的体积和浓度,以便仅影响受损眼细胞区域。在另一实施方案中,rAAV组合物的体积和/或浓度是更大的量,以达到眼的更大部分,包括未受损的光感受器。
在本文中描述的方法的一个实施方案中,本文中所述的组合物的一次性眼内递送,例如优化的REP-1盒的AAV递送,可用于在处于发展无脉络膜症风险下的受试者中预防视觉丧失和失明。在本文中描述的方法的另一实施方案中,本文中所述的组合物的一次性眼内递送,例如优化的CNGA3或CNGB3盒的AAV递送,可用于在处于发展全色盲风险下的受试者中预防视觉丧失和失明。
由此,在一个实施方案中,该组合物在疾病发作之前施用。在另一实施方案中,该组合物在视觉受损或丧失开始之前施用。在另一实施方案中,该组合物在在视觉受损或丧失开始之后施用。在又一实施方案中,当与未患病的眼相比,视杆细胞和/或视锥细胞或光感受器的少于90%起作用或保持时施用该组合物。
在另一实施方案中,该方法包括进行附加的研究,例如功能和成像研究以确定治疗的功效。对动物检查而言,此类测试包括经由以下方法进行的视网膜和视觉功能评估:查看视杆和视锥光感受器功能的视网膜电图(ERG)、视动眼震、瞳孔测量法、水迷宫测试、明暗偏好、光学相干断层照相(为了测量视网膜各个层的厚度)、组织学(视网膜厚度、外核层细胞核行数、记录转基因表达的免疫荧光、视锥光感受器计数、用花生凝集素将视网膜切片染色——其识别视锥光感受器鞘)。
特别是对于人受试者,在施用一定剂量的本说明书中描述的组合物之后,使用检查视杆和视锥光感受器功能的视网膜电图(ERGs)、瞳孔测量法视敏度、对比敏感度彩色视觉测试、视野测试(Humphrey视野/Goldmann视野)、视野移动测试(超越障碍训练)和阅读速度测试来测试该受试者的治疗功效。受试者在用本文中描述的药物组合物治疗后所受到的其它可用治疗后疗效测试是功能性磁共振成像(fMRI)、全视野光敏感度测试、包括光学相干断层照相的视网膜结构研究、眼底照相术、眼底自发荧光、自适应光学激光扫描检眼镜检查法、移动测试、阅读速度和准确度测试、微视野检查法和/或检眼镜检查法。这些和其它功效测试描述在经此引用并入的美国专利号8,147,823;共同未决的国际专利申请公开WO2014/011210或WO 2014/124282中。
在又一实施方案中,与另一种疗法或二级疗法结合进行上述方法的任一种。在又一实施方案中,治疗这些眼病的方法包括用本文中详细描述的组合物治疗该受试者,并结合另一种疗法如抗生素治疗、疼痛的姑息治疗等等。该附加疗法可以是任何现在已知的或还未知的疗法,其有助于预防、阻止或改善这些突变或缺陷或与之相关的任何效应。二级疗法可以在施用上述组合物之前、同时或之后施用。在一个实施方案中,二级疗法包括用于保持视网膜细胞健康的非特异性方法,如施用神经营养因子、抗氧化剂、抗凋亡剂。通过注射蛋白、重组DNA、重组病毒载体、干细胞、胚胎组织或基因修饰细胞来实现非特异性方法。后者可以包括包封的基因修饰细胞。
在一个实施方案中,生成重组rAAV的方法包括获得含有如上所述的AAV表达盒的质粒并在足够的病毒序列的存在下培养携带该质粒的包装细胞以便能够将AAV病毒基因组包装到感染性AAV包膜或衣壳中。在上文中描述了生成rAAV载体的特定方法,并可用于生成能够递送上文和下文实施例中描述的在该表达盒与基因组中的密码子优化的REP-1或CNGA3或CNGB3的rAAV载体。
在又一实施方案中,提供了包含任何本文中描述的表达盒的载体。如上所述,此类载体可以是多种来源的质粒,并可以在某些实施方案中用于生成本文中进一步描述的重组复制缺陷型病毒。
在另一实施方案中,该载体是包含表达盒的质粒,其中该表达盒包含AAV反向末端重复序列和编码REP-1的密码子优化的核酸序列,以及引导编码蛋白在宿主细胞中的表达的表达控制序列。
在另一实施方案中,该载体是包含表达盒的质粒,其中该表达盒包含AAV反向末端重复序列和编码CNGA3的密码子优化的核酸序列,以及引导编码蛋白在宿主细胞中的表达的表达控制序列。
在另一实施方案中,该载体是包含AAV表达盒的质粒,其中该表达盒包含AAV反向末端重复序列和编码CNGB3的密码子优化的核酸序列,以及引导编码蛋白在宿主细胞中的表达的表达控制序列。
要注意的是,术语“一个”或“一种”是指一个(种)或多个(种)。由此,术语“一个”(或“一种”)、“一种或多种”和“至少一种”在本文中可互换使用。
词语“包含”应解释为包含性的而非排他性的。词语“组成”及其变体应解释为排他性的而非包含性的。虽然使用“包含”的语言呈现了说明书中的各种实施方案,但是在其它情况下,相关实施方案也意在用“由……组成”或“基本由……组成”的语言来解释和描述。
本文中所用的术语“大约”是指与给定的参考值相差10%,除非另行规定。
本文中所用的术语“调节”或其变体是指组合物抑制生物途径的一种或多种组分的能力。
除非在本说明书中另行定义,本文中使用的技术和科学术语具有与本领域普通技术人员通常理解的相同的含义,并且通过参考公开文本,其向本领域技术人员提供了对许多本申请中使用的术语的一般指引。
下面的实施例仅仅是说明性的,而非意在限制本发明。
实施例1-多能干细胞分化成RPE
无脉络膜症缺乏相关小鼠模型并且没有犬模型,因此在该疾病的人视网膜细胞模型中测试转导和表达。由于不可能从活的患者中获得视网膜细胞,由诱导多能干细胞生成RPE。使用全文经此引用并入本文的Buchholz等人,Rapid and Efficient DirectedDifferentiation of Human Pluripotent Stem Cells Into Retinal PigmentedEpithelium,Stem Cells Translational Medicine,2013;2:384–393描述的方案将多能干细胞定向为RPE。也参见Cereso等人,Proof of concept for AAV2/5-mediated genetherapy in iPSC-derived retinal pigment epithelium of a choroideremiapatient,Molecular Therapy—Methods&Clinical Development(2014)1,14011,其全文经此引用并入本文。生产RPE的其它方法是本领域中已知的。
简言之,将人诱导多能干细胞系保存在Dulbecco’s Modified Eagle’s Medium中:含有2mMGlutaMAX-I、20%敲除(knockout)血清替代物、0.1mM Modified Eagle’sMedium非必需氨基酸(MEM NEAA)、0.1mMβ-巯基乙醇和4ng/ml bFGF的Nutrient MixtureF-12(DMEM/F12),在丝裂霉素C–处理或辐射过的小鼠胚胎成纤维细胞饲养层上。
多能干细胞在含有1X B27、1X N2和1X NEAA(Invitrogen)的DMEM/F12中直接传代到Matrigel(BD Biosciences)上。从第0至2天,将50ng/ml Noggin、10ng/ml Dkk1、10ng/mlIGF1和10mM烟酰胺添加到基础培养基中。从第2至4天,将10ng/ml Noggin、10ng/ml Dkk1、10ng/ml IGF1、5ng/ml bFGF和10mM烟酰胺添加到基础培养基中。从第4至6天,将10ng/mlDkk1、10ng/ml IGF1和100ng/ml Activin A(R&D Systems)添加到基础培养基中。从第6至14天,将100ng/ml Activin A、10μM SU5402(EMD Millipore,Darmstadt,德国)和1mM VIP添加到基础培养基中。在仅基础培养基(DMEM/F12、B27、N2和NEAA)中进行对照实验。
通过刮掉具有非RPE形态的细胞,机械富集细胞。随后,使用TrypLE Express(Invitrogen)在37℃下消化剩余RPE 5分钟。细胞经过30-μm单细胞过滤器并接种到Matrigel涂覆的组织培养塑料Transwell膜或CC2处理过的分室载玻片(chamberedslides)上。富集的细胞在含1%胎牛血清(FBS)、GlutaMAX和丙酮酸钠的高DMEM葡萄糖中培养30天。
实施例2-用AAV-REP-1转导的细胞
简言之,通过HEK293细胞的瞬时转染生产包含REP-1密码子优化的序列的AAV2/8CMV.CBA-REP-1病毒载体,并使用聚乙二醇从上清液中沉淀病毒颗粒。参见例如Guo等人,Rapid and simplified purification of recombinant adeno-associated virus,JVirol Methods.2012年8月;183(2):139–146,其经此引用并入本文。通过双CsCl离心提纯载体,透析并通过斑点印迹检测法滴定。
对于异戊二烯化实验,将RPE接种在24孔板中,并在汇合时估计1.2×106个细胞。细胞用每细胞100,000vg转导并在转导后4周进行异戊二烯化检测。一式三份进行实验。
实施例3-异戊二烯化
如上文引用的Vasireddy等人,PloS One.2013年5月7日;8(5):e61396中所述使用[3H]-牻牛儿基牻牛儿基焦磷酸(GGPP)(Perkin Elmer,Boston,MA,USA)作为异戊二烯基给体在重组Rab牻牛儿基牻牛儿基转移酶和RAB27存在下进行体外异戊二烯化检测。通过闪烁计数测量放射性标记的异戊二烯基并入RAB27蛋白中。为了一致性,将对照值标准化至100并用作基准值。所有实验一式三份进行,并使用双尾非配对student’s t试验评估实验组和对照组之间的异戊二烯化的统计比较。
简言之,在转导后48小时,用冷PBS洗涤转导的REP细胞。收集细胞团块并用冷PBS充分洗涤。细胞在冰上使用RIPA+蛋白酶抑制剂裂解30分钟。在一备选方案中,超声处理细胞。通过在4℃下将裂解液在75,000-100 000g下离心1-2小时,收集胞质级分。
如下准备用于异戊二烯化反应的原液。
用于异戊二烯化的最终反应体积为25μL
Rab GGTase a 0.075ul
Rab Ggtaseb 0.085ul
[<sup>3</sup>H]-牻牛儿基牻牛儿基焦磷酸(GGPP) 5.68ul
NP40 0.15ul
DTT 2.5ul
HEPES 1.25ul
MgCl2 1.25ul
Rab27a 3.12ul
胞质成分(细胞裂解液) 10.89ul
该反应混合物在37℃下培养30分钟。通过添加9:1乙醇/HCL使该反应停止并培养30分钟。通过真空过滤将蛋白收集在玻璃纤维滤纸(Whatman纸)上(0.1ml)。过滤器用冷磷酸盐缓冲剂小心洗涤3次以除去未结合的材料。将该膜小心干燥。将过滤器置于5毫升闪烁混合液(scintillation cocktail)中并进行闪烁计数。也参见Tolmachova等人,CHM/REP1cDNA delivery by lentiviral vectors provides functional expression of thetransgene in the retinal pigment epithelium of choroideremia mice,The Journalof Gene Medicine,2012;14-158-68,其全文经此引用并入本文。
对CNGA3或CNGB3概念验证的检测法可以包括使用自发突变动物模型(例如Cnga3-/-小鼠或Awassi绵羊)。该小鼠模型可以用“全视锥(all-cone)”光感受器小鼠Nrl-/-小鼠繁育,以获得双敲除。后一(Cnga3-/-Nrl-/-)小鼠可能加快疗效鉴定。可以通过瞳孔测量法、视敏度和对比度测量(例如使用视动研究)、视网膜电图和视觉行为测量疗效。最终,组织学将记录该转基因的表达,在其它测量上具有改进的结果。组织学方法还将用于记录该干预对视锥光感受器(视锥光感受器总数、密度、位置等)的任何影响。
类似于如上文论述的无脉络膜症,用于CNGA3-或CNGB3-相关全色盲的基因增强疗法的概念验证检测可包括使用诱导多能干细胞(iPSC)模型。由归因于CNGA3或CNGB3突变的全色盲患者生成的iPSC模型将体外分化成视网膜前体和/或光感受器细胞。使用重组AAV将野生型CNGA3(或CNGB3)cDNA递送到这些细胞并将分析细胞的生物起源和由这些亚基构成的相关(环核苷酸门控制型,CNG)通道的功能保存。通过膜片上的电生理学评估通道功能。该通道的修复应该补救(rescue)cGMP活化电流。另外的研究可测试在将野生型CNG cDNA递送到生理配体之前和之后通道功能的敏感度。
实施例4:AAV.密码子优化的人CHM的体外表达
这一研究的目标是评估在使用编码84-31和COS-7细胞系中的密码子优化的CHM基因(SEQ ID NO:1)的一系列下一代AAV 2和AAV8载体的基因递送后AAV介导的CHM表达的能力。
为使CHM的表达最大化,生产密码子优化的CHM序列(SEQ ID NO:1)。合成密码子优化的质粒并用于生成所有下一代CHM转基因表达盒。为克服非功能性AAV基因组污染的潜在问题,在该载体主链中包括λ填充片段区。填充片段的并入不仅增加质粒的长度,还降低在包装AAV的同时质粒DNA主链污染的可能性。作为独立研究进行在载体主链中并入填充片段区以消除质粒DNA杂质的影响。使用两种重组AAV前病毒质粒(高和低拷贝)主链以生成不同的构建体。基于pUC载体原点设计高拷贝质粒。基于p15A原点设计低拷贝质粒。为了进一步增强从正确的起始密码子的翻译,并入在起始密码子上游的Kozak序列。
已经为当前研究工程化总共四种质粒,且这些描述在下列实施例中(表1)。此外,也生成目前用于临床试验的携带CHM天然序列的质粒(版本1)。版本2a、2b、3a和3b和版本1各自的质粒图谱分别显示在图6-10中。
表1:质粒特征
在COS-7和84-31细胞系中测试这些构建体的体外表达。下一代CHM构建体的工程化特征描绘在表1中。
通过将密码子优化的人CHM cDNA(hCHM)(SEQ ID NO:1)克隆到该转基因盒中生成重组AAV前病毒高和低拷贝质粒。使该转基因处于杂合鸡β肌动蛋白(CBA)启动子的控制下。该启动子由巨细胞病毒(CMV)即时早期增强子、近端鸡β肌动蛋白启动子和侧接内含子1序列的CBA外显子1构成。该前病毒高和低拷贝数质粒还含有AAV反向末端重复和PolyA序列。用于当前研究的下一代质粒主链含有接着卡那霉素细菌选择基因的λ噬菌体片段填充片段。另一些质粒缺少该填充片段但含有卡那霉素选择基因。高拷贝数载体类似于pUC质粒的载体(~300份拷贝/细菌细胞)。低拷贝数质粒(~10份拷贝/细菌细胞)具有p15A的原点。为了增强从正确的起始密码子的翻译,所有下一代构建体含有在起始密码子ATG上游的KOZAK共有序列。生成的质粒是使用可特异性靶向启动子+增强子扩展序列或密码子优化的CHM序列的引物验证的序列。所有五种构建体的质粒图谱和序列显示在图6-10中。使用用磷酸钙的标准一式三份转染生成下列AAV载体(关于载体鉴定,见表2)。生成载体的AAV2和AAV8血清型以确保结果独立于血清型。
表2:生成的AAV2和AAV8载体和病毒原液浓度的概要
该84-31细胞系是293HEK细胞系(人胚肾细胞)的亚克隆并组成性表达腺病毒E4蛋白以增强AAV病毒的转导。COS-7细胞是源自猴肾组织的成纤维细胞样细胞系。84-31细胞和COS-7细胞都分开植板在6孔细胞培养板中并用10种受试制品之一(AAV2或AAV8)在五种不同的感染复数(MOI)下转导。在36-48小时后,收获细胞,裂解并且蛋白样品准备用于SDS-PAGE,接着蛋白质印迹分析以检测外源CHM的表达。
84-31和COS-7细胞都在供有5%CO2的环境中在37℃下在具有10%胎牛血清和1%青霉素/链霉素的高葡萄糖Dulbecco’s改良Eagle培养基(DMEM)中培养。在转导前一天(前18-24小时),将细胞以3E5的密度接种在6孔细胞培养皿中的每孔2毫升细胞培养基中。接种后的细胞在供有5%CO2的环境中在37℃下培养。COS-7和84-31细胞的孔都用下列AAV载体在各种感染复数(MOI)下感染(表3和表4)。在阴性对照细胞(未转导细胞)中不加入病毒。简言之,除去组织培养基并向6孔培养皿的各孔中加入新鲜的2毫升培养基等分试样。然后测量预定量的AAV载体(直接来自原液)并添加到各孔中(表3和表4)。对于1E4的MOI,将1μL的各自病毒原液用细胞培养基稀释至10μL。由这一溶液将预定体积的病毒添加到各自的孔中(表3和4)。细胞在37℃下在5%CO2下用AAV病毒培养36-48小时直至收获。在收获前在显微镜下观察细胞以查验异常。
表3:四种下一代AAV2和AAV8hCHM载体在COS-7细胞中的感染剂量
表4:四种下一代AAV2和AAV8hCHM载体在84-31细胞中的感染率
首先,COS7和84-31细胞系都使用以测试CHM的体外表达是否独立于细胞系。一旦确立独立性,所有后续实验仅在84-31细胞中进行,其已表现出用AAV的优异转导效率。84-31细胞的孔用下列AAV载体在各种MOI下感染(见表3和4)。
蛋白质印迹分析:1.制备细胞裂解液。在感染后36-48小时在充分PBS洗涤后收获AAV转导细胞以及未处理的对照细胞。细胞然后在冰上使用含蛋白酶抑制剂的RIPA缓冲剂裂解。通过在13,000rpm下离心10分钟,使细胞裂解液澄清(cleared)。2.蛋白的量化和制备。使用ThermoFisher Micro BCATM蛋白检测试剂盒根据制造商的说明进行细胞裂解液的蛋白质量化。通过取在562nm的OD读数测定蛋白浓度。为了评估CHM的体外表达,将40-60ug的测得蛋白加载在4-12%Bis-Tris凝胶上。3.SDS-PAGE和印迹SDS-PAGE和蛋白质印迹分析根据已知方案进行。简言之,将蛋白凝胶转移到硝化纤维素膜上,在乳中封闭并用一级抗体培养。使用Antihuman REP-12F1抗体(2F1,1∶1000稀释)和下列之一:抗-GAPDH抗体(1:1000稀释)、抗肌动蛋白抗体(1:1000稀释)或抗-微管蛋白抗体(1:5000稀释)作为用于各印迹的一级抗体。在洗涤该印迹后,使用在1∶5000浓度下的HRP共轭抗小鼠IgG抗体和/或抗兔IgG抗体作为二级抗体。根据制造商的说明使用ECL试剂通过化学发光显影印迹。对照:1.加载对照:下列之一:使用抗肌动蛋白抗体、抗微管蛋白抗体或抗-GAPDH抗体作为加载对照以在各孔的凝胶中显示相等的蛋白载量。抗微管蛋白抗体检测~51kDa的蛋白。抗肌动蛋白抗体检测~42kDa的蛋白,且抗-GAPDH抗体检测~39kDa的蛋白。根据它们的可得性,用抗微管蛋白抗体或抗肌动蛋白抗体或抗-GAPDH抗体探测初始印迹。在初始实验后,为了一致性,使用抗-GAPDH抗体作为加载对照。2.阳性对照:在AAV2.V2a转导COS-7细胞中建立hREP-1蛋白的生产后,使用AAV2.V2a-Cos-7细胞裂解液作为稍后的蛋白质印迹实验中的阳性对照。3.阴性对照:使用未处理的细胞作为阴性对照。在各种细胞系中的REP-1蛋白生产的蛋白质印迹结果的分析概括在表5中。
表5
单克隆人REP-1-特异性抗体在用下一代AAV2.copt.CHM/AAV8.copt.CHM转导的细胞中检测到单个~75-80kDahREP-1蛋白。在未处理的对照细胞的细胞裂解液中没有观察到75-80kDa条带。用抗肌动蛋白/抗微管蛋白/抗-GAPDH抗体探测印迹在蛋白质印迹的所有泳道中(包括未处理的对照中)显示相等密度的条带。抗肌动蛋白抗体检测在~42kDa的蛋白分子量条带,抗微管蛋白抗体检测在~51kDa的蛋白,且抗-GAPDH抗体检测在~39kDa的蛋白。所有抗体仅检测预期分子量大小的特异性条带。在任何印迹中没有观察到非特异性条带。使用预染色的分子量标记比较相关蛋白的分子量。
简言之,在用AAV2.V2a、AAV2.V2b、AAV2.hCHM.V3a和AAV2.hCHM.V3b转导的COS-7和84-31细胞中观察到预期大小的REP-1蛋白。未处理的对照没有显露存在预期大小的人REP-1蛋白。用抗肌动蛋白抗体标记印迹在凝胶的所有泳道中检测到相等强度的在~42kDa的蛋白条带。使用预染色的蛋白梯比较REP-1和肌动蛋白的分子量。没有显示数据。
结果表明含有下一代质粒的AAV2和AAV8血清型载体能够有效转导84-31和COS-7细胞。在下一代质粒中的CHM表达在可检测范围内,并表现出剂量依赖性趋势。用下一代hCHM病毒转导细胞导致产生预测大小的REP-1蛋白。
实施例5:AAV.密码子优化的人CHM与AAV天然人CHM的体外蛋白表达的比较
这一研究的目的是通过在84-31细胞系基研究模型中测量REP-1蛋白水平而描述含有各种版本的含CHM的转基因盒的AAV载体(血清型2和8)的转导效率。
质粒和载体:在AAV2或AAV8中比较总共5种转基因质粒:版本1(之前用于正在进行的临床试验)和四种下一代版本(V2a、V2b、V3a和V3b)。质粒如实施例4中所述工程化,且其特征显示在表1中。上表2显示生成的AAV2和AAV8载体和病毒原液浓度的概要。
研究设计(例如处理组)
1.在中试实验中,COS-7和84-31细胞用AAV2.hCHM.版本1、版本2a和版本2b转导。进行蛋白质印迹以比较这两种细胞系中的转导效率水平。
2.用10种受试制品之一(在AAV2或AAV8背景中的版本1、2a、2b、3a和3b)在3E5的MOI下转导植板在6孔板中的84-31细胞。在36-48小时后,收获细胞并裂解。将裂解液加载在SDS-PAGE上,并施以进一步蛋白质印迹分析。在所有构建体版本中比较REP-1蛋白水平。对于各AAV2.CHM或AAV8.CHM实验布置两个单独的板,单独分析。
受试材料施用
3.4.1细胞培养
83-41细胞和COS-7两者在供有5%CO2的环境中在37℃下在具有10%胎牛血清和1%青霉素/链霉素的高葡萄糖Dulbecco’s改良Eagle培养基(DMEM)中培养。
3.4.2细胞的转导准备:
在转导前一天(前18-24小时),将83-41和COS-7细胞以3E5的密度接种在6孔细胞培养皿中的每孔2毫升细胞培养基中。接种后的细胞在供有5%CO2的环境中在37℃下培养。
3.4.3转导:
84-31细胞和Cos-7的孔都用如下所述的AAV载体在3E5的MOI下感染(关于中试实验参见表6,和关于第二组实验参见表7)。在阴性(未转导细胞)对照中不加入病毒。简言之,首先除去组织培养基并在6孔细胞培养皿的各孔中用2毫升新鲜培养基/孔代替。然后测量预定量的AAV载体(关于用于转导的载体体积,参见表2)(来自原液)并直接添加到各孔中。细胞在37℃下在5%CO2下用AAV病毒培养36-48小时直至收获。在收获前在显微镜下观察细胞以查验任何异常。如实施例4中所述进行蛋白质印迹分析。
表6:中试实验:AAV2.hCHM.V1、2a、2b在84-31和COS-7细胞中的感染剂量
表7:AAV.hCHM下一代载体和V1(AAV2和AAV8)在84-31细胞中的感染剂量
结果:天然hCHM(AAV2.hCHM.V1)vs密码子优化的CHM AAV2a和2b载体在84-31和COS-7细胞中的表达的比较
在这一实验中,84-31和COS-7细胞用无载体(未处理的对照)、AAV2.hCHM.版本1、AAV2.hCHM.版本2a或Aav2.hCHM.版本2b转导。使用抗人REP-1抗体的蛋白质印迹分析表明在所有AAV2(V1、V2a、V2b)转导样品中和在这两种细胞系中都可检测到在~75-80kDa的REP-1蛋白水平(未显示数据)。在84-31细胞系中可见略微更好的蛋白表达(表8)。抗-REP1抗体在未处理的细胞中检测到可忽略不计的量的REP-1蛋白。用GAPDH抗体标记印迹在所有细胞裂解液(包括未处理的细胞)中检测到在~39kDa的条带。
使用ImageJ软件的印迹的光密度评估(蛋白水平的量化)证实在将值标准化至内源性GAPDH蛋白的表达后,84-31和COS-7细胞中的转导效率类似。(结果见表8)。基于此,人源性84-31细胞系用于进一步实验。
总之,AAV2.V1、AAV2.V2a和Aav2.V2b在84-31和COS-7细胞两者中都以类似转导效率诱导REP-1蛋白的产生。
表8:蛋白质印迹的光密度评估
天然CHM vs密码子优化的CHM AAV2载体在84-31细胞中的表达的比较:使用抗人REP-1抗体,用AAV2.hCHM.V2a、V3a、V2b、V3b和V1转导的84-31细胞的蛋白质印迹分析在所有条件下检测到在~75-80kDa的条带(未显示数据)。抗-REP1抗体在未处理的细胞中检测到可忽略不计的量的REP-1蛋白。用GAPDH抗体标记印迹在所有细胞裂解液(包括未处理的细胞)中检测到在~39kDa的条带。使用ImageJ软件的印迹的光密度评估(表达水平的量化)证实在将值标准化至内源性GAPDH蛋白的产生后,与AAV2.hCHM.V1相比,AAV2.hCHM.V2a、3a、2b和3b表达的提高。结果见表9和10。
表9:对于PLATE 1在用AAV2.hCHM.V1、Va、V2b、V3a或V3b转导后84-31细胞中的REP-1蛋白的值(未显示蛋白质印迹)
表10:对于PLATE 2在用AAV2.hCHM.V1、V2a、V2b、V3a或V3b转导后84-31细胞中的REP-1蛋白的值(未显示蛋白质印迹)
天然CHM vs在AAV8.V1、V2a、V3a、V2b、V3b载体中的密码子优化的CHM在84-31细胞中的表达的比较:用AAV8.V1、AAV8.V2a、AAV8.V3a、AAV8.2b、AAV8.3b转导的84-31细胞用抗人REP-1抗体的蛋白质印迹分析在所有转导细胞中检测到在~75-80kDa的条带(未显示数据)。抗-REP1抗体在未处理的细胞中检测到可忽略不计的量的REP-1蛋白。用GAPDH抗体标记印迹在所有细胞裂解液(包括未处理的细胞)中检测到在~39kDa的条带。使用ImageJ软件的印迹的光密度评估证实与AAV8.V1相比更高的AAV8.hCHM.V2a;3a;2b;3b表达。在将CHM值首先标准化至各自的内源性GAPDH蛋白的表达,和然后标准化至版本1的平均表达水平后获得值。结果见表11和表12。
表11:在用AAV8hCHM版本1、2a、2b、3a和3b-PLATE 1转导后84-31细胞中的REP-1蛋白表达的值(未显示蛋白质印迹)
表12:在用AAV8hCHM版本1、2a、2b、3a和3b-PLATE 2转导后84-31细胞中的REP-1蛋白表达的值(未显示蛋白质印迹)
结论:对比表达研究证实携带下一代AAV.hCHM.版本2a、2b、3a和3b的AAV载体的施加在84-31细胞中在AAV2和AAV8血清型载体中都诱导与版本1(当前用于临床试验)相比提高的REP-1蛋白生产。
实施例6:通过qPCR滴度分析评估λ填充片段对AAV载体生产的影响
在上表2中所示的所有8种AAV载体上进行单次qPCR(定量聚合酶链反应)运行,以评估λ填充片段序列对DNA杂质量的影响。使用线性化AAV质粒标准品生成分析标准品。在用于量化适当包装的AAV基因组的CMV/CBA启动子区或用于反向包装的卡那霉素抗性(KanR)编码区上设计引物-探针组。标准品和载体样品在两组中运行,一组使用CMV/CBA引物-探针组,且另一组使用KanR组。由各标准曲线测定载体样品值(每毫升的病毒基因组拷贝)。通过对照含CMV/CBA的序列比较各载体批中的含KanR的杂质的相对量评估填充片段序列的影响。
试剂:
含转基因的病毒载体滴度:
参考:CMV-CBA启动子
引物:CMV-F:CCC ACT TGG CAG TAC ATC AA
CMV-R:GCC AAG TAG GAA AGT CCC ATA A
FAM-探针:/56-FAM/CA TAA TGC C/ZEN/A GGC GGG CCA TTT AC/3IABkFQ/
含杂质的病毒载体滴度:
参考:卡那霉素抗性基因
引物:
KAN-F:GAT GGT CGG AAG TGG CAT AA
KAN-R:TGC GCC AGA GTT GTT TCT
FAM-探针:/56-FAM/CC GTC AGC C/ZEN/A GTT TAG TCT GAC CA/3IABkFQ/
稀释试剂:稀释剂Q(在无核酸酶的水中0.001%PF-68):用无菌水1000倍稀释1%PF-68溶液.稀释剂S:稀释剂Q+2ng/μL鲑鱼精DNA(Agilent technologies Cat#201190)
ABI TaqManTM Universal Master Mix(Applied Biosystems4304437/4326708)
Qiagen PCR Product Purification Kit(Qiagen 28104)
·ABI QuantStudio 6Flex System
样品制备
通过合并下列成分制备Dnase消化溶液:Dnase缓冲剂(10X)5μL,无核酸酶的H2O30μL,Dnase I(Invitrogen,18068-015)5μL
混合10微升的各AAV载体样品并在环境温度下培养10分钟。通过加入50微升的SDS/EDTA/NaCl溶液(0.2%SDS/5mM EDTA/0.2M NaCl)灭活该消化混合物并在95℃下培养10分钟。各AAV载体样品在稀释剂S中稀释10-100,000倍以供qPCR分析。
qPCR标准品制备
通过用XhoI消化质粒p1008(无填充片段的低拷贝转基因质粒)和用Qiagen PCR提纯试剂盒提纯,制备参考标准DNA(线性化)。纯化材料在琼脂糖凝胶上分析以证实身份,并通过Nanodrop量化。由原液浓度使用下列等式(equivalence)测定DNA拷贝数:1bp=1.096E-21g。根据下表制备qPCR标准品:
表13
PCR反应设置
提取的DNA样品在单次qPCR运行中一式三份(3个孔)分析。该运行包括一式三份的参考DNA标准品,每孔103至108份范围内的拷贝。无模板对照(NTC)被包括作为阴性对照。用CMV/CBA和KanR引物/探针组分析各AAV载体制品。类似地,为了量化各组,也用CMV/CBA和KanR引物/探针组分析标准品。
表14:PCR反应设置
PCR反应序列如下设置:50℃2分钟1个循环;95℃10分钟1个循环;95℃15秒40个循环;60℃1分钟40个循环
运行性能.制备标准品并以每孔103至108份DNA拷贝运行。该检测的下限设定为1000份拷贝,因为检测敏感度不是这一实验的重要因素。对于该运行使用标准拷贝数和标准品的CT(阈值循环)值生成标准曲线。使用ABI软件进行标准品的线性回归(未显示数据)。标准曲线拟合具有0.998或更大的相关系数(R2值),表明可靠拟合模型。该标准曲线的斜率为-3.5。使用斜率计算扩增反应的效率,并且在-3.2至-3.6之间的值代表在90%至110%之间的扩增效率。这两个标准反应都以92.6~93.8%效率运行。一式三份的孔的精度在2~10%的范围内,表明复制品之间良好的一致性。无模板对照(NTC)产生在该检测的下限以下的不可量化扩增。
表15:标准曲线拟合概要
报道分子 斜率 Y-截距 R 效率(%)
FAM CMV -3.513 41.396 0.998 92.597
FAM KAN -3.481 39.968 1.000 91.761
结果:
样品值测定:由各匹配标准曲线(CMV/CBA或KanR)使用CT值内插样品值(AAV基因组和反向包装拷贝数)。对初始稀释和/或消化稀释校正内插DNA拷贝数。施加附加校正因子2以计入双链DNA标准品和样品中的单链DNA之间的差异。
8种AAV载体的分析结果概括在下表中,在含转基因的AAV浓度(CMV/CBA)和含KanR的杂质浓度之间定量比较。结果的分析证实将λ填充片段插入转基因质粒有效使得在AAV生成过程中的质粒主链DNA(即KanR)包装发生率降低~7-20倍(图11)。
表16:作为百分比表示的卡那霉素vs CMV/CBA的qPCR扩增
实施例6:通过蛋白质印迹法测定下一代AAV8载体在iPS细胞中的体外表达
这一研究的目标是评估在使用携带诱导多能细胞系(iPSC)中的密码子优化的REP-1编码基因的一系列下一代AAV 2和AAV8载体基因递送后AAV介导的CHM表达的能力。
诱导多能干细胞(iPS)技术在几个概念验证和基因疗法研究(包括眼病)中已成功用作测试基因疗法载体的平台。这些患者特异性的iPS细胞提供有价值的体外模型系统以研究疾病发病机理和建立测试不可提供相关动物模型的基因疗法的概念验证的模型。作为测试我们的无脉络膜症(CHM)的AAV介导的基因增强疗法的预备步骤,我们由在编码Rab护航蛋白1(REP-1)的致病基因CHM中包含突变的人患者生成iPS细胞(见实施例1)(方法描述在NCP.003中)。生成的iPS细胞用于评估我们的下一代AAV.密码子优化.CHM构建体的体外表达。
质粒和载体如实施例4中所述。诱导多能干细胞(iPS)是在实验室中由体细胞、外周血单核细胞(重编程回多能状态)生成的干细胞。血细胞的重编程能够发展用于治疗应用的个性化体外细胞模型。在这一报道中,使用来自受CHM影响的个体的iPS细胞通过蛋白质印迹分析测试REP-1蛋白的体外产生。下表(表17)描述研究的iPS细胞的细节和它们各自的CHM致病突变。
表17:由带有CHM突变的患者生成的iPS细胞的综述
*iPS细胞系鉴定试验正在进行
研究设计(例如处理组)
1.植板在12孔细胞培养板上的iPS细胞用AAV2.hCHM版本1、版本2a;版本2b;版本3a;版本3b(AAV2.V1;V2a;V2b;V3a;V3b)在1E5或3E5的MOI下感染。在24小时转导后,将1毫升iPS细胞培养基添加到孔中。转导36-48小时,收获细胞,裂解并加工以供SDS-PAGE,接着是蛋白质印迹分析。在用所有构建体版本转导的细胞中评估REP-1蛋白的产生并与未处理的对照比较。
2.作为中试实验,植板在12孔细胞培养板上的三种不同的iPS细胞系用AAV8.hCHM版本1和AAV8.hCHM版本2a(AAV8.V1;AAV8.V2a)在1E6的MOI下转导。iPS细胞系源自在REP1基因中具有不相关突变的三位受CHM影响的个体并为此植板在分开的板中。在36-48小时后,收获细胞并裂解并施以蛋白质印迹分析,与未处理的细胞裂解液比较。
受试材料施用
3.4.1细胞培养
培养来自CHM患者的iPS细胞。简言之,iPS细胞在供有5%CO2和5%O2的环境中在37℃下在iPS细胞培养基中在小鼠胚胎成纤维细胞(MEF,饲养细胞)上培养。
3.4.2准备用于转导的细胞
在接种细胞前一天,如参考NCP.003(NCP.003:Culturing of培养来自CHM患者和对照的iPS细胞)中所述用Matrigel涂布12孔皿。在用各自的AAV2或AAV8病毒载体转导iPS细胞之前,将在MEF上培养的细胞接种在无MEF的Matrigel上(无饲养细胞培养)。细胞以4.5+E5至6+E5的密度接种在12孔细胞培养皿的各孔中的1毫升iPS细胞培养基中。接种的细胞在供有5%CO2,5%O2的环境中在37℃下培养。
3.4.3转导
为了用病毒载体感染iPS细胞,细胞生长至大约50-60%汇合(这在无饲养细胞的条件下可花费2-4天)。一旦实现50-60%汇合,分离12孔的一个孔并进行细胞计数以测定每孔的细胞总数。然后用下列AAV载体在预定MOI下感染iPS细胞的孔(见表18和19)。在转导前,除去来自板的旧iPS细胞培养基并在各孔中加入新鲜的1毫升iPS细胞培养基。将来自原液的预定体积病毒直接添加到各孔中。关于感染细胞总数、MOI和用于感染的病毒体积的信息见表18和表19。细胞然后在供有5%CO2,5%O2的环境中在37℃下培养18-24小时。在转导18-24小时后,在显微镜下观察细胞是否有任何异常或细胞死亡。此时,将另外1毫升新鲜iPS细胞培养基添加到含有感染和未感染细胞的各孔中并在供有5%CO2,5%O2的环境中在37℃下进一步培养另外18-24小时。在收获前在显微镜下观察细胞以评估任何细胞死亡或异常外观。
表18:下一代AAV2.hCHMV2a、2B、3a、3b载体和AAV2.hCHM.V1载体在CHM患者源性iPS细胞中的感染细节和MOI
表19:AAV8.V2a和AAV8.V1载体在源自3位不同CHM患者的三种iPS细胞系中的感染剂量
如本文所述进行结果测量方法-蛋白质印迹分析。
结果
5.1在JB588iPS细胞系中的AAV2-hCHM V1、V2a、V2b、V3a、V3b表达:单克隆人REP-1-特异性抗体在转导JB 588iPS细胞中检测到单个~75-80kDa hREP-1蛋白(未显示数据)。在未处理的对照的情况下没有观察到条带,证实存在疾病(未显示数据)。在所有载体中都观察到在3E5的MOI下REP-1蛋白条带的强度与IE5的MOI相比更强。重组AAV2.hCHM病毒介导的hCHM基因递送(递送到iPS细胞)导致REP-1蛋白的剂量依赖性产生。用GAPDH抗体探测印迹显示在所有裂解液中相等密度的条带。GAPDH检测在~39kDa的蛋白。REP-1和GAPDH抗体都仅检测预期分子量的特异性条带。在印迹中没有观察到非特异性条带。
在iPS细胞中的AAV8–hCHM.V1、V2a表达:单克隆人REP-1-特异性抗体在转导JB527、JB500和JB588患者源性iPS细胞中检测到单个~75-80kDa REP-1蛋白(未显示数据)。在未处理的对照的情况下没有观察到蛋白条带(未显示数据)。用GAPDH抗体探测印迹显示在所有细胞裂解液,包括来自未处理的细胞的细胞裂解液中相等密度的条带。抗-GAPDH抗体检测特异性~39kDa蛋白条带。REP-1和GAPDH抗体都仅检测预期分子量大小的特异性条带。在印迹中没有观察到可检测的非特异性蛋白条带。
结论
当前报道中给出的初步结果揭示下列观察结果:蛋白质印迹分析证实在三种患者源性iPSC(JB588、JB500、JB527)的每一个中都存在CHM(缺乏REP-1蛋白)。体外表达研究证实用AAV2.hCHM.版本2a、2b、3a、3b和AAV2.hCHM版本1(当前临床试验候选物)感染来自CHM患者的iPS细胞在所有受试MOI下都诱导REP-1蛋白的产生。用AAV8.hCHM.版本2a和AAV8.hCHM版本1在1E6的MOI下感染iPS细胞导致在所有三种CHM iPS细胞系中都产生REP1蛋白。在用AAV8.hCHM.V2a感染的iPSC中REP1生产水平比用AAV8.hCHM.V1高。
实施例7:AAV8密码子优化的人CHM vs.AAV天然人CHM的体内表达的比较
用于多种视网膜疾病的基因疗法依赖于适当的靶细胞的有效转导,其对无脉络膜症是视网膜色素上皮细胞(RPE)和光感受器细胞。该研究报道集中于天然CHM序列基构建体(版本1)和四种包装到野生型小鼠中的AAV8主链中的下一代转基因盒所诱导的体内表达的比较。为了改善向光感受器细胞的基因转移,这里对AAV8血清型进行了评估。
我们的试验设计为回答以下问题:a.将如何比较这些载体的光感受器的体内转导:特别地,与版本1相比,在视网膜下注射相应受试制品后,下一代AAV8.CHM将如何有效地转导光感受器。b.剂量反应:下一代AAV8.CHM和AAV8.CHM-版本1载体在基因表达的剂量反应方面将不同。
试验细节:
质粒和载体如实施例4中所述。小鼠(动物):野生型,CD1小鼠用于测试通过REP-1蛋白的生产来评估的CHM的体内表达。CD1小鼠品系是一种远交瑞士小鼠品系,我们在家里维持这一群落。该研究的细节在CAROT研究方案PCPR02.01中描述。
3.3研究设计(例如治疗组)
3.3.1畜牧业:将重约20-30克的雄性和雌性小鼠(~3-4个月大)注射所述受试制品。根据宾夕法尼亚州大学的ULAR法规,将动物饲养在宾夕法尼亚州大学的约翰摩根大学实验动物资源(John Morgan University Laboratory Animal Resources)(ULAR)设施中。将小鼠维持在12小时光照/12小时黑暗循环下。随意提供食物和水。用耳标号识别所有动物。
3.4受试材料施用:由CAROT Vector Core提供的受试制品制剂用于剂量施用。将受试材料储存在-60至-80℃下。在给药之前将受试材料在冰上解冻。对于眼内注射,如制剂表20中所述,用磷酸盐缓冲的盐水将受试制品稀释至目标浓度。制备总计60微升的主混合物。
表20:用于受试制品的视网膜下注射的剂量制剂表
视网膜下注射之前准备注射记录:
在视网膜下注射受试制品之前,使用以下信息维持注射记录:
·笼子编号/小鼠编号
·研究标识
·品系
·出生日期
·注射日期
·调查员/注射者的名字
·注入的眼(左或右)
·注射材料(载体/血清型)
·剂量和体积
·施用途径(ROA)
视网膜下注射:由外科医生通过视网膜下注射进行注射。简而言之,动物在注射前麻醉。使用Hamilton 33G注射器进行受试制品的视网膜下注射。表21中描述了受试制品和注射的细节。从制备的注射主混合物中,每次注射施用1.5微升的体积。每只动物用5E8vg/眼注射一只眼,用5E9vg/眼注射对侧眼。
表21:视网膜下注射方案和注射剂量
结果测量方法
动物牺牲:a.在用受试制品注射动物后,对任何注射后相关异常观察所有动物48小时。B.注射后21-35天,采用检眼镜观察动物的眼异常。C.注射后90-120天,将动物处死并收集眼组织用于通过SDS-PAGE评估外源REP-1蛋白的生产,随后进行蛋白质印迹分析。
眼组织的收集:在使用锋利的手术刀片从眼中移除晶状体后收集用于蛋白质印迹分析的眼组织。将眼(没有晶状体)收集在适当标记的冷冻管中。
蛋白质印迹分析
简而言之:1.制备组织裂解液
a.通过处死动物,在注射的21-35天后收集注射有2种不同剂量的下一代AAV8.CHM和AAV8.V1的动物眼组织以及未注射的对照动物组织。
b.然后使用含有蛋白酶抑制剂的RIPA缓冲剂在冰上裂解组织。
c.通过在13,000rpm下离心10分钟使组织裂解液澄清。
2.蛋白的定量和制备
a.使用ThermoFisher Micro BCATM蛋白分析试剂盒按照制造商的说明书进行细胞裂解液的蛋白定量。
b.通过在562nm处进行OD读数来确定蛋白浓度。
c.为了评估CHM的体内表达,将20-40ug之间的测得的蛋白加载到4-12%Bis-Tris凝胶上。
3.SDS-PAGE和蛋白质印迹
将蛋白凝胶转移到硝基纤维素膜上,在乳中封闭并用一级抗体培养。抗人REP-12F1抗体(2F1,1:1000稀释)和/或抗-GAPDH抗体(1:1000稀释)用作一级抗体。在洗涤该印迹后,1:5000浓度下的HRP缀合的抗小鼠IgG抗体和/或抗兔IgG抗体用作二级抗体。根据制造商的说明书,使用ECL试剂通过化学发光来显影该印迹。
4.对照
a)上样对照:抗GAPDH抗体用作上样对照以证实在凝胶的各个孔中蛋白的相等加载。抗GAPDH抗体检测~39kDa的蛋白。
b)阳性对照:AAV2.V2a转导的COS-7细胞裂解物用作阳性对照。
c)阴性对照:未经注射的动物的眼组织用作阴性对照。
样品值确定
使用Image J软件量化蛋白质印迹分析。简而言之,本报道中提出的光密度评估首先归一化至相应样品的GAPDH蛋白的内源性表达水平。随后将表达水平再次归一化至未注射对照的平均REP-1表达水平。
显示REP-1蛋白的表达的光密度评估和倍数变化计算的细节呈现为表22和23。
简要说明:
1.在表22和23中,第2列显示REP-1蛋白的原始值,和第3列显示GAPDH蛋白的原始值。
2.各样品的GAPDH值首先归一化至AAV8.V1的动物-1的GAPDH值,并在表22中的第4列中显示。
3.各样品的值也归一化至AAV8.V1的动物-2的GAPDH值,并在表22中的第5列中显示。
4.然后将REP-1值(第2列)归一化为归一化至动物1的GAPDH(第4列)或归一化至预先归一化至动物2(第5列)的GAPDH。这些分别表示在第6列和第7列中。
5.归一化的REP-1值随后转化为倍数变化。
6.相应的REP-1值归一化至AAV8.V1注射组的动物1或动物2中的REP-1的表达并表示为倍数变化(第8和9列)
7.第10列表示REP-1蛋白表达中的平均倍数变化。
结果
比较使用天然CHM AAV8.V1的CHM表达vs.密码子优化的CHM载体:AAV8.V2a、V2b、V3a和V3b。用各AAV8载体的两种不同剂量注射野生型CD1小鼠:5E9vg/眼的高剂量和5E8vg/眼的低剂量。以下结果描述了用高和低剂量的AAV8.V1、AAV8.V2a和AAV8.V3a注射后REP1蛋白的水平。
在注射高剂量(5E9vg/眼)病毒载体的动物中比较AAV8.V1vs.AAV8.V2a和AAV8.V3a(具有填充片段的载体)的表达。使用人抗REP-1抗体的蛋白质印迹分析在各个用下一代AAV8.V2a或V3a或原始AAV8.版本1处理的动物的眼组织(注射低和高剂量)中均检测到~75-80kDa hREP-1蛋白条带。在未注射的对照小鼠的情况下观察到非常微弱(最小)的条带。与用版本1转导的组织相比,在用下一代载体(AAV8V.2a和AAV8.V3a)转导的组织中观察到增加强度的条带。抗GAPDH抗体在蛋白质印迹的所有泳道中(包括未注射的对照)均显示相同密度的~39kDa的条带。预染色的蛋白标记用于比较相关蛋白的分子量。使用ImageJ软件对印迹的光密度评估(表达水平的量化)表明,在注射有下一代AAV8.高和低剂量构建体(V2a或V3a)之一的动物中REP-1的生产增加。(值参见表22)
表22:用高剂量(5E9vg)AAV8V1、V2a和V2b处理的量化的REP-1蛋白生产结果
未处理动物的REP-1表达值可忽略不计,参见以下值:
表23:用低剂量(5E8vg)AAV8V1、V2a和V2b处理的量化的REP-1蛋白生产结果
未处理动物的REP-1表达值可忽略不计,参见以下值:
在注射有低剂量(5E8vg/眼)病毒载体的动物中AAV8.V1vs.AAV8.V2a和AAV8.V3a的表达的比较
人抗REP-1抗体,以5E8的剂量注射下一代AAV8.V2a、V3a和AAV8.版本1的动物的眼组织的蛋白质印迹分析在注射小鼠的组织中检测到~75-80kDa的hREP-1蛋白条带。在未注射的对照小鼠的眼组织裂解液中均观察到微弱(最小)的REP-1条带。与用版本1转导的裂解液相比,在用下一代载体转导的组织裂解液中观察到强度增加的条带。在所有细胞裂解液中,抗GAPDH抗体在~39kDa处检测到相等强度的蛋白条带。该数据表明,与注射AAV8.V3a或AAV8.V1后产生的水平相比,通过AAV8递送下一代V2a CHM导致鲁棒水平的REP-1蛋白。
使用ImageJ软件的印迹的光密度评估(表达水平的量化)进一步证明,与版本1相比,注射下一代AAV8.CHM构建体(尤其是V2a)的动物中REP-1的生产增加。值参见表23。
AAV8.V2b在CD1小鼠中的表达
同时进行了本研究和通过qPCR滴定分析了λ填充片段对AAV载体生产的影响的评估。如研究方案PCPR.02中所述,我们进行了用于体内表达研究的所有动物注射,并且收获了所有样品。在完成了对λ填充片段元件的qPCR研究后(如上所述),我们决定仅进行蛋白质印迹实验以测试没有填充片段的AAV载体如AAV8.2b和AAV8.3b的表达,并将它们排除在进一步分析之外(例如与版本1的比较)。
人抗-REP-1抗体在以5E9(高剂量)载体基因组拷贝注射AAV8.2b的CD-1小鼠的眼组织中检测到~75-80kDa的蛋白(图12A)。以5E8(低剂量)注射AAV8.2b的动物在~75-80kDa处显示非常微弱的蛋白条带(图12A)。来自未注射的对照动物的眼组织裂解液未显示REP-1蛋白的存在。抗GAPDH抗体在所有眼组织裂解液中(包括未注射的对照)检测到~39kDa的蛋白。该数据可以确定AAV8.2b的最小剂量。
AAV8.V3b在CD1小鼠中的表达
我们用抗REP-1抗体对注射了AAV8.3b的CD1小鼠(2小鼠/组)的眼组织进行了蛋白质印迹分析,结果显示在注射有低剂量的一只眼中存在~75-80kDa的蛋白,和在注射有高剂量的AAV8.3b的两只眼中均显示存在~75-80kDa的蛋白。在未注射的小鼠的眼组织中没有检测到REP-1表达(图12B)。产生的REP-1水平在注射AAV8.3b的动物中是剂量依赖性的。与低剂量注射眼(5E8载体基因组)相比,用高剂量AAV8.3b(5E9载体基因组)注射诱导了更高量的REP-1。抗GAPDH抗体在所有注射和未注射的动物的眼组织裂解液中均检测到~39kDa的蛋白。
这些结果揭示了以下观察结果:
1)下一代载体AAV8.版本2a、2b、3a和3b能够有效地转导眼组织。2)对于所有下一代载体,可以检测到该转基因(密码子优化的CHM)的表达。3)转基因(密码子优化的CHM)的表达是剂量依赖性的。4)与CD-1小鼠的眼组织中的AAV8.版本1相比,AAV8.版本2a和AAV8.版本2b诱导增加的REP-1蛋白生产。5)注射相同剂量的眼之间转基因蛋白的确切生产水平存在变化,反映了手术递送过程的可变性。但是,在低(5E8)和高(5E9)剂量之间的水平差异大。6)在小鼠中视网膜下体内施用高剂量(5E9vg)载体后,AAV8.CHM.V2a和AAV8.V3a导致了比AAV8.V1高得多的REP-1蛋白生产水平。
本说明书中引用的所有出版物,包括2015年12月14日提交的临时专利申请号62/266,789,均经此引用全文并入本文。类似地,本文中引用的和出现在所附序列表中的SEQID No经此引用并入本文。虽然已经参考特定实施方案描述了本发明,要理解的是,可以在不脱离本发明的精神的情况下进行修改。这些修改意在落入所附权利要求的范围。
序列表自由文本
序列表
&lt;110&gt; 宾夕法尼亚州大学信托人
&lt;120&gt; 用于无脉络膜症和全色盲的基因疗法的AAV-REP-1
&lt;130&gt; UPN-16-7660
&lt;150&gt; US 62/266,789
&lt;151&gt; 2015-12-14
&lt;160&gt; 29
&lt;170&gt; PatentIn version 3.5
&lt;210&gt; 1
&lt;211&gt; 1962
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 密码子优化的序列
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(1962)
&lt;400&gt; 1
atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg att gga acc 48
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg tcc ggt cgg 96
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg aat tgg gcc 144
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag tat cag gag 192
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac cag atc ctg 240
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag acc atc cag 288
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat gag gac gtg 336
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg acc tcc gct 384
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc gag gat gaa 432
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag act ccg agc 480
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa gtg acc ggc 528
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
gaa aag gag aac cat tgc gac gac aag act tgt gtc cca tcc act tcc 576
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac acc acc gaa 624
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
cag ccc aag aag aac aga atc acg tac agc cag atc atc aag gag ggg 672
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac agc cgc ggt 720
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga tac gcc gag 768
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga aga gtg gaa 816
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag caa ctt acc 864
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc tgc atg gag 912
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa att act ttc 960
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg cag tac att 1008
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc tcg acc atc 1056
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg ggg cgc tac 1104
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga gag ctg cct 1152
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc tac tgt ctc 1200
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc agg aag tgc 1248
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
aaa gcc att att gac cag ttc gga caa cgg atc att tcc gag cac ttt 1296
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct cgg gtc cag 1344
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
tat cga cag att tcc agg gcg gtg ctc att act gac cgg agc gtc ctc 1392
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
aag acc gat agc gac cag cag atc tcc atc ctg acc gtg ccg gcg gaa 1440
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc tca tcc acc 1488
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg tgc acc tca 1536
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa aag ctg ttc 1584
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg gag aag ccc 1632
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc tcc gat atc 1680
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac gtc tgc tcc 1728
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag cag gcg gaa 1776
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc ccg ccc ccc 1824
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
cca aac ccc gag gat atc atc ttg gac gga gac agc ctg cag cca gaa 1872
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa acc ttc aag 1920
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa tga 1962
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
&lt;210&gt; 2
&lt;211&gt; 653
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 2
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
&lt;210&gt; 3
&lt;211&gt; 1962
&lt;212&gt; DNA
&lt;213&gt; 人
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(1962)
&lt;400&gt; 3
atg gcg gat act ctc cct tcg gag ttt gat gtg atc gta ata ggg acg 48
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
ggt ttg cct gaa tcc atc att gca gct gca tgt tca aga agt ggc cgg 96
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
aga gtt ctg cat gtt gat tca aga agc tac tat gga gga aac tgg gcc 144
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
agt ttt agc ttt tca gga cta ttg tcc tgg cta aag gaa tac cag gaa 192
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
aac agt gac att gta agt gac agt cca gtg tgg caa gac cag atc ctt 240
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
gaa aat gaa gaa gcc att gct ctt agc agg aag gac aaa act att caa 288
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
cat gtg gaa gta ttt tgt tat gcc agt cag gat ttg cat gaa gat gtc 336
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
gaa gaa gct ggt gca ctg cag aaa aat cat gct ctt gtg aca tct gca 384
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
aac tcc aca gaa gct gca gat tct gcc ttc ctg cct acg gag gat gag 432
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
tca tta agc act atg agc tgt gaa atg ctc aca gaa caa act cca agc 480
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
agc gat cca gag aat gcg cta gaa gta aat ggt gct gaa gtg aca ggg 528
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
gaa aaa gaa aac cat tgt gat gat aaa act tgt gtg cca tca act tca 576
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
gca gaa gac atg agt gaa aat gtg cct ata gca gaa gat acc aca gag 624
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
caa cca aag aaa aac aga att act tac tca caa att att aaa gaa ggc 672
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
agg aga ttt aat att gat tta gta tca aag ctg ctg tat tct cga gga 720
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
tta cta att gat ctt cta atc aaa tct aat gtt agt cga tat gca gag 768
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
ttt aaa aat att acc agg att ctt gca ttt cga gaa gga cga gtg gaa 816
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
cag gtt ccg tgt tcc aga gca gat gtc ttt aat agc aaa caa ctt act 864
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
atg gta gaa aag cga atg cta atg aaa ttt ctt aca ttt tgt atg gaa 912
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
tat gag aaa tat cct gat gaa tat aaa gga tat gaa gag atc aca ttt 960
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
tat gaa tat tta aag act caa aaa tta acc ccc aac ctc caa tat att 1008
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
gtc atg cat tca att gca atg aca tca gag aca gcc agc agc acc ata 1056
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
gat ggt ctc aaa gct acc aaa aac ttt ctt cac tgt ctt ggg cgg tat 1104
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
ggc aac act cca ttt ttg ttt cct tta tat ggc caa gga gaa ctc ccc 1152
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
cag tgt ttc tgc agg atg tgt gct gtg ttt ggt gga att tat tgt ctt 1200
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
cgc cat tca gta cag tgc ctt gta gtg gac aaa gaa tcc aga aaa tgt 1248
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
aaa gca att ata gat cag ttt ggt cag aga ata atc tct gag cat ttc 1296
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
ctc gtg gag gac agt tac ttt cct gag aac atg tgc tca cgt gtg caa 1344
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
tac agg cag atc tcc agg gca gtg ctg att aca gat aga tct gtc cta 1392
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
aaa aca gat tca gat caa cag att tcc att ttg aca gtg cca gca gag 1440
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
gaa cca gga act ttt gct gtt cgg gtc att gag tta tgt tct tca acg 1488
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
atg aca tgc atg aaa ggc acc tat ttg gtt cat ttg act tgc aca tct 1536
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
tct aaa aca gca aga gaa gat tta gaa tca gtt gtg cag aaa ttg ttt 1584
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
gtt cca tat act gaa atg gag ata gaa aat gaa caa gta gaa aag cca 1632
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
aga att ctg tgg gct ctt tac ttc aat atg aga gat tcg tca gac atc 1680
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
agc agg agc tgt tat aat gat tta cca tcc aac gtt tat gtc tgc tct 1728
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
ggc cca gat tgt ggt tta gga aat gat aat gca gtc aaa cag gct gaa 1776
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
aca ctt ttc cag gaa atc tgc ccc aat gaa gat ttc tgt ccc cct cca 1824
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
cca aat cct gaa gac att atc ctt gat gga gac agt tta cag cca gag 1872
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
gct tca gaa tcc agt gcc ata cca gag gct aac tcg gag act ttc aag 1920
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
gaa agc aca aac ctt gga aac cta gag gag tcc tct gaa taa 1962
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
&lt;210&gt; 4
&lt;211&gt; 653
&lt;212&gt; PRT
&lt;213&gt; 人
&lt;400&gt; 4
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
&lt;210&gt; 5
&lt;211&gt; 1985
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的质粒
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(8)
&lt;223&gt; 用于亚克隆到前病毒质粒中的NotI限制位点
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (4)..(16)
&lt;223&gt; Kozak共有序列
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (13)..(1971)
&lt;223&gt; 密码子优化的开放阅读框 (ORF)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1972)..(1977)
&lt;223&gt; 具有嵌入式终止密码子/待添加位点的BclI限制位点
任选的表位标签
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1980)..(1985)
&lt;223&gt; 用于亚克隆到前病毒质粒中的BamHI限制位点
&lt;400&gt; 5
gcggccgcca cc atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg 51
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val
1 5 10
att gga acc gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg 99
Ile Gly Thr Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg
15 20 25
tcc ggt cgg cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg 147
Ser Gly Arg Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly
30 35 40 45
aat tgg gcc tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag 195
Asn Trp Ala Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu
50 55 60
tat cag gag aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac 243
Tyr Gln Glu Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp
65 70 75
cag atc ctg gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag 291
Gln Ile Leu Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys
80 85 90
acc atc cag cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat 339
Thr Ile Gln His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His
95 100 105
gag gac gtg gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg 387
Glu Asp Val Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val
110 115 120 125
acc tcc gct aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc 435
Thr Ser Ala Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr
130 135 140
gag gat gaa tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag 483
Glu Asp Glu Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln
145 150 155
act ccg agc tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa 531
Thr Pro Ser Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu
160 165 170
gtg acc ggc gaa aag gag aac cat tgc gac gac aag act tgt gtc cca 579
Val Thr Gly Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro
175 180 185
tcc act tcc gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac 627
Ser Thr Ser Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp
190 195 200 205
acc acc gaa cag ccc aag aag aac aga atc acg tac agc cag atc atc 675
Thr Thr Glu Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile
210 215 220
aag gag ggg cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac 723
Lys Glu Gly Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr
225 230 235
agc cgc ggt ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga 771
Ser Arg Gly Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg
240 245 250
tac gcc gag ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga 819
Tyr Ala Glu Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly
255 260 265
aga gtg gaa caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag 867
Arg Val Glu Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys
270 275 280 285
caa ctt acc atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc 915
Gln Leu Thr Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe
290 295 300
tgc atg gag tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa 963
Cys Met Glu Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu
305 310 315
att act ttc tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg 1011
Ile Thr Phe Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu
320 325 330
cag tac att gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc 1059
Gln Tyr Ile Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser
335 340 345
tcg acc atc gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg 1107
Ser Thr Ile Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu
350 355 360 365
ggg cgc tac ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga 1155
Gly Arg Tyr Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly
370 375 380
gag ctg cct cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc 1203
Glu Leu Pro Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile
385 390 395
tac tgt ctc cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc 1251
Tyr Cys Leu Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser
400 405 410
agg aag tgc aaa gcc att att gac cag ttc gga caa cgg atc att tcc 1299
Arg Lys Cys Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser
415 420 425
gag cac ttt ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct 1347
Glu His Phe Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser
430 435 440 445
cgg gtc cag tat cga cag att tcc agg gcg gtg ctc att act gac cgg 1395
Arg Val Gln Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg
450 455 460
agc gtc ctc aag acc gat agc gac cag cag atc tcc atc ctg acc gtg 1443
Ser Val Leu Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val
465 470 475
ccg gcg gaa gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc 1491
Pro Ala Glu Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys
480 485 490
tca tcc acc atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg 1539
Ser Ser Thr Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr
495 500 505
tgc acc tca tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa 1587
Cys Thr Ser Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln
510 515 520 525
aag ctg ttc gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg 1635
Lys Leu Phe Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val
530 535 540
gag aag ccc cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc 1683
Glu Lys Pro Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser
545 550 555
tcc gat atc tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac 1731
Ser Asp Ile Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr
560 565 570
gtc tgc tcc ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag 1779
Val Cys Ser Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys
575 580 585
cag gcg gaa aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc 1827
Gln Ala Glu Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys
590 595 600 605
ccg ccc ccc cca aac ccc gag gat atc atc ttg gac gga gac agc ctg 1875
Pro Pro Pro Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu
610 615 620
cag cca gaa gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa 1923
Gln Pro Glu Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu
625 630 635
acc ttc aag gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa 1971
Thr Phe Lys Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
640 645 650
tgatcatagg atcc 1985
&lt;210&gt; 6
&lt;211&gt; 653
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 6
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
&lt;210&gt; 7
&lt;211&gt; 9187
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的质粒
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(145)
&lt;223&gt; 5' ITR
&lt;220&gt;
&lt;221&gt; 启动子
&lt;222&gt; (169)..(1786)
&lt;223&gt; CMV.CBA启动子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1787)..(1794)
&lt;223&gt; Not I克隆位点, 在1789处切割
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1805)..(1810)
&lt;223&gt; BamHI克隆位点, 在1806处切割
&lt;220&gt;
&lt;221&gt; polyA_信号
&lt;222&gt; (1850)..(2052)
&lt;223&gt; BGH PolyA
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2109)..(2252)
&lt;223&gt; 3' ITR
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2571)..(6624)
&lt;223&gt; λ填充片段
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (7314)..(8126)
&lt;223&gt; 卡那霉素抗性(互补)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8485)..(9128)
&lt;223&gt; 复制起点(互补)
&lt;400&gt; 7
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480
cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540
tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720
gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740
tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgcatagta 1800
ctgcggatcc tgcagatctc gagccgaatt cctgcagccc gggggatcag cctcgactgt 1860
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1920
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 1980
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2040
agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac 2100
cagctggggc tcgagatcca ctagggccgc aggaacccct agtgatggag ttggccactc 2160
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2220
gctttgcccg ggcggcctca gtgagcgagc gacctgcagg ggcagcttga aggaaatact 2280
aaggcaaagg tactgcaagt gctcgcaaca ttcgcttatg cggattattg ccgtagtgcc 2340
gcgacgccgg gggcaagatg cagagattgc catggtacag gccgtgcggt tgatattgcc 2400
aaaacagagc tgtgggggag agttgtcgag aaagagtgcg gaagatgcaa aggcgtcggc 2460
tattcaagga tgccagcaag cgcagcatat cgcgctgtga cgatgctaat cccaaacctt 2520
acccaaccca cctggtcacg cactgttaag ccgctgtatg acgctctggt ggtgcaatgc 2580
cacaaagaag agtcaatcgc agacaacatt ttgaatgcgg tcacacgtta gcagcatgat 2640
tgccacggat ggcaacatat taacggcatg atattgactt attgaataaa attgggtaaa 2700
tttgactcaa cgatgggtta attcgctcgt tgtggtagtg agatgaaaag aggcggcgct 2760
tactaccgat tccgcctagt tggtcacttc gacgtatcgt ctggaactcc aaccatcgca 2820
ggcagagagg tctgcaaaat gcaatcccga aacagttcgc aggtaatagt tagagcctgc 2880
ataacggttt cgggattttt tatatctgca caacaggtaa gagcattgag tcgataatcg 2940
tgaagagtcg gcgagcctgg ttagccagtg ctctttccgt tgtgctgaat taagcgaata 3000
ccggaagcag aaccggatca ccaaatgcgt acaggcgtca tcgccgccca gcaacagcac 3060
aacccaaact gagccgtagc cactgtctgt cctgaattca ttagtaatag ttacgctgcg 3120
gccttttaca catgaccttc gtgaaagcgg gtggcaggag gtcgcgctaa caacctcctg 3180
ccgttttgcc cgtgcatatc ggtcacgaac aaatctgatt actaaacaca gtagcctgga 3240
tttgttctat cagtaatcga ccttattcct aattaaatag agcaaatccc cttattgggg 3300
gtaagacatg aagatgccag aaaaacatga cctgttggcc gccattctcg cggcaaagga 3360
acaaggcatc ggggcaatcc ttgcgtttgc aatggcgtac cttcgcggca gatataatgg 3420
cggtgcgttt acaaaaacag taatcgacgc aacgatgtgc gccattatcg cctggttcat 3480
tcgtgacctt ctcgacttcg ccggactaag tagcaatctc gcttatataa cgagcgtgtt 3540
tatcggctac atcggtactg actcgattgg ttcgcttatc aaacgcttcg ctgctaaaaa 3600
agccggagta gaagatggta gaaatcaata atcaacgtaa ggcgttcctc gatatgctgg 3660
cgtggtcgga gggaactgat aacggacgtc agaaaaccag aaatcatggt tatgacgtca 3720
ttgtaggcgg agagctattt actgattact ccgatcaccc tcgcaaactt gtcacgctaa 3780
acccaaaact caaatcaaca ggcgccggac gctaccagct tctttcccgt tggtgggatg 3840
cctaccgcaa gcagcttggc ctgaaagact tctctccgaa aagtcaggac gctgtggcat 3900
tgcagcagat taaggagcgt ggcgctttac ctatgattga tcgtggtgat atccgtcagg 3960
caatcgaccg ttgcagcaat atctgggctt cactgccggg cgctggttat ggtcagttcg 4020
agcataaggc tgacagcctg attgcaaaat tcaaagaagc gggcggaacg gtcagagaga 4080
ttgatgtatg agcagagtca ccgcgattat ctccgctctg gttatctgca tcatcgtctg 4140
cctgtcatgg gctgttaatc attaccgtga taacgccatt acctacaaag cccagcgcga 4200
caaaaatgcc agagaactga agctggcgaa cgcggcaatt actgacatgc agatgcgtca 4260
gcgtgatgtt gctgcgctcg atgcaaaata cacgaaggag ttagctgatg ctaaagctga 4320
aaatgatgct ctgcgtgatg atgttgccgc tggtcgtcgt cggttgcaca tcaaagcagt 4380
ctgtcagtca gtgcgtgaag ccaccaccgc ctccggcgtg gataatgcag cctccccccg 4440
actggcagac accgctgaac gggattattt caccctcaga gagaggctga tcactatgca 4500
aaaacaactg gaaggaaccc agaagtatat taatgagcag tgcagataga gttgcccata 4560
tcgatgggca actcatgcaa ttattgtgag caatacacac gcgcttccag cggagtataa 4620
atgcctaaag taataaaacc gagcaatcca tttacgaatg tttgctgggt ttctgtttta 4680
acaacatttt ctgcgccgcc acaaattttg gctgcatcga cagttttctt ctgcccaatt 4740
ccagaaacga agaaatgatg ggtgatggtt tcctttggtg ctactgctgc cggtttgttt 4800
tgaacagtaa acgtctgttg agcacatcct gtaataagca gggccagcgc agtagcgagt 4860
agcatttttt tcatggtgtt attcccgatg ctttttgaag ttcgcagaat cgtatgtgta 4920
gaaaattaaa caaaccctaa acaatgagtt gaaatttcat attgttaata tttattaatg 4980
tatgtcaggt gcgatgaatc gtcattgtat tcccggatta actatgtcca cagccctgac 5040
ggggaacttc tctgcgggag tgtccgggaa taattaaaac gatgcacaca gggtttagcg 5100
cgtacacgta ttgcattatg ccaacgcccc ggtgctgaca cggaagaaac cggacgttat 5160
gatttagcgt ggaaagattt gtgtagtgtt ctgaatgctc tcagtaaata gtaatgaatt 5220
atcaaaggta tagtaatatc ttttatgttc atggatattt gtaacccatc ggaaaactcc 5280
tgctttagca agattttccc tgtattgctg aaatgtgatt tctcttgatt tcaacctatc 5340
ataggacgtt tctataagat gcgtgtttct tgagaattta acatttacaa cctttttaag 5400
tccttttatt aacacggtgt tatcgttttc taacacgatg tgaatattat ctgtggctag 5460
atagtaaata taatgtgaga cgttgtgacg ttttagttca gaataaaaca attcacagtc 5520
taaatctttt cgcacttgat cgaatatttc tttaaaaatg gcaacctgag ccattggtaa 5580
aaccttccat gtgatacgag ggcgcgtagt ttgcattatc gtttttatcg tttcaatctg 5640
gtctgacctc cttgtgtttt gttgatgatt tatgtcaaat attaggaatg ttttcactta 5700
atagtattgg ttgcgtaaca aagtgcggtc ctgctggcat tctggaggga aatacaaccg 5760
acagatgtat gtaaggccaa cgtgctcaaa tcttcataca gaaagatttg aagtaatatt 5820
ttaaccgcta gatgaagagc aagcgcatgg agcgacaaaa tgaataaaga acaatctgct 5880
gatgatccct ccgtggatct gattcgtgta aaaaatatgc ttaatagcac catttctatg 5940
agttaccctg atgttgtaat tgcatgtata gaacataagg tgtctctgga agcattcaga 6000
gcaattgagg cagcgttggt gaagcacgat aataatatga aggattattc cctggtggtt 6060
gactgatcac cataactgct aatcattcaa actatttagt ctgtgacaga gccaacacgc 6120
agtctgtcac tgtcaggaaa gtggtaaaac tgcaactcaa ttactgcaat gccctcgtaa 6180
ttaagtgaat ttacaatatc gtcctgttcg gagggaagaa cgcgggatgt tcattcttca 6240
tcacttttaa ttgatgtata tgctctcttt tctgacgtta gtctccgacg gcaggcttca 6300
atgacccagg ctgagaaatt cccggaccct ttttgctcaa gagcgatgtt aatttgttca 6360
atcatttggt taggaaagcg gatgttgcgg gttgttgttc tgcgggttct gttcttcgtt 6420
gacatgaggt tgccccgtat tcagtgtcgc tgatttgtat tgtctgaagt tgtttttacg 6480
ttaagttgat gcagatcaat taatacgata cctgcgtcat aattgattat ttgacgtggt 6540
ttgatggcct ccacgcacgt tgtgatatgt agatgataat cattatcact ttacgggtcc 6600
tttccggtga tccgacaggt tacggcctga tgcggtattt tctccttacg catctgtgcg 6660
gtatttcaca ccgcatacgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag 6720
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 6780
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 6840
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 6900
aaaacttgat ttgggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 6960
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 7020
actcaaccct atctcgggct attcttttga tttagacctg caggcatgca agcttactgg 7080
ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 7140
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 7200
cccaacagtt gcgcagcctg aatggcgaat gcgatttatt caacaaagcc gccgtcccgt 7260
caagtcagcg taatgctctg ccagtgttac aaccaattaa ccaattctga ttagaaaaac 7320
tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt 7380
tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca 7440
agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc 7500
ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt 7560
gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc 7620
tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg 7680
agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg 7740
cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat 7800
acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta 7860
cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc 7920
atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc 7980
gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga 8040
gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg cttcgagcaa 8100
gacgtttccc gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac 8160
agttttattg ttcatgatga tatattttta tcttgtgcaa tgtaacatca gagattttga 8220
gacacaacgt ggctttgttg aataaatcga acttttgctg agttgaagga tcagatcacg 8280
catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat caccaactgg 8340
tccacctaca acaaagctct catcaaccgt ggctccctca ctttctggct ggatgatggg 8400
gcgattcagg cctggtatga gtcagcaaca ccttcttcac gaggcagacc tctcgacgga 8460
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 8520
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 8580
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 8640
ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta 8700
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 8760
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 8820
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 8880
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 8940
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 9000
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 9060
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 9120
cggttcctgg ccttttgctg gccttttgct cacatgtcct gcaggcagct gcgcgccagc 9180
tgcgcgc 9187
&lt;210&gt; 8
&lt;211&gt; 11148
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的质粒
&lt;400&gt; 8
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480
cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540
tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720
gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740
tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgccaccat 1800
ggctgatacc ctgccctctg aattcgacgt gattgtgatt ggaaccggac tccctgaatc 1860
gatcatcgcc gcggcctgtt cccggtccgg tcggcgcgtg ctgcacgtcg attcgagaag 1920
ctactacgga gggaattggg cctcattctc cttctccgga ctgctctcct ggctgaagga 1980
gtatcaggag aactccgaca ttgtctccga ctcacctgtg tggcaggacc agatcctgga 2040
aaacgaggaa gcaatagccc tgagccggaa ggacaagacc atccagcacg tggaggtgtt 2100
ctgttatgcc tcccaagacc tccatgagga cgtggaagag gctggagcgt tgcagaagaa 2160
tcatgccctc gtgacctccg ctaactccac cgaggcagcc gacagcgcct tcctgccgac 2220
cgaggatgaa tccctgtcaa ctatgtcgtg cgaaatgctg accgaacaga ctccgagctc 2280
cgaccccgaa aacgccctgg aagtgaacgg agcggaagtg accggcgaaa aggagaacca 2340
ttgcgacgac aagacttgtg tcccatccac ttccgcggag gacatgtccg agaatgtgcc 2400
tatcgccgag gacaccaccg aacagcccaa gaagaacaga atcacgtaca gccagatcat 2460
caaggagggg cggaggttta acatcgatct ggtgtcgaag ctgctgtaca gccgcggtct 2520
gctgatcgat ctgctcatta agtcgaacgt gtcgagatac gccgagttca agaacatcac 2580
aaggattctc gccttccggg aaggaagagt ggaacaagtg ccgtgctccc gggccgacgt 2640
gttcaactca aagcaactta ccatggtgga aaagcgcatg ctgatgaaat tcctgacctt 2700
ctgcatggag tacgaaaagt accctgatga gtacaagggt tacgaagaaa ttactttcta 2760
cgagtacctc aagacccaga agctgacccc gaatctgcag tacattgtga tgcactcaat 2820
cgcaatgacc tccgaaaccg cctcctcgac catcgacggg ctcaaggcca ccaagaactt 2880
cctgcactgt ttggggcgct acggcaacac tccgttcctc ttcccgctgt acggccaggg 2940
agagctgcct cagtgtttct gccggatgtg cgccgtgttc ggcggaatct actgtctccg 3000
ccactcggtc cagtgcctgg tggtggacaa ggaatccagg aagtgcaaag ccattattga 3060
ccagttcgga caacggatca tttccgagca ctttcttgtg gaggactcat acttcccgga 3120
gaacatgtgc tctcgggtcc agtatcgaca gatttccagg gcggtgctca ttactgaccg 3180
gagcgtcctc aagaccgata gcgaccagca gatctccatc ctgaccgtgc cggcggaaga 3240
acccggcact tttgccgtgc gcgtgatcga gctttgctca tccaccatga cttgcatgaa 3300
aggcacttac ctggtgcacc tgacgtgcac ctcatcgaaa accgctagag aggacctgga 3360
atccgtcgtc caaaagctgt tcgtgcctta caccgagatg gaaattgaaa acgaacaagt 3420
ggagaagccc cgcatccttt gggccctgta ctttaacatg cgcgattcct ccgatatctc 3480
gcggtcctgc tataacgact tgccttcgaa cgtctacgtc tgctccgggc cagactgcgg 3540
tcttggcaac gacaatgccg tgaagcaggc ggaaacactg ttccaagaga tctgccctaa 3600
cgaggatttt tgcccgcccc ccccaaaccc cgaggatatc atcttggacg gagacagcct 3660
gcagccagaa gcatccgagt ccagcgccat cccggaggcc aacagcgaaa ccttcaagga 3720
gagcactaac ctgggcaacc tggaagagtc cagcgaatga tcataggatc ctgcagatct 3780
cgagccgaat tcctgcagcc cgggggatca gcctcgactg tgccttctag ttgccagcca 3840
tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3900
ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3960
gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4020
ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctcgagatcc 4080
actagggccg caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4140
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4200
agtgagcgag cgacctgcag gggcagcttg aaggaaatac taaggcaaag gtactgcaag 4260
tgctcgcaac attcgcttat gcggattatt gccgtagtgc cgcgacgccg ggggcaagat 4320
gcagagattg ccatggtaca ggccgtgcgg ttgatattgc caaaacagag ctgtggggga 4380
gagttgtcga gaaagagtgc ggaagatgca aaggcgtcgg ctattcaagg atgccagcaa 4440
gcgcagcata tcgcgctgtg acgatgctaa tcccaaacct tacccaaccc acctggtcac 4500
gcactgttaa gccgctgtat gacgctctgg tggtgcaatg ccacaaagaa gagtcaatcg 4560
cagacaacat tttgaatgcg gtcacacgtt agcagcatga ttgccacgga tggcaacata 4620
ttaacggcat gatattgact tattgaataa aattgggtaa atttgactca acgatgggtt 4680
aattcgctcg ttgtggtagt gagatgaaaa gaggcggcgc ttactaccga ttccgcctag 4740
ttggtcactt cgacgtatcg tctggaactc caaccatcgc aggcagagag gtctgcaaaa 4800
tgcaatcccg aaacagttcg caggtaatag ttagagcctg cataacggtt tcgggatttt 4860
ttatatctgc acaacaggta agagcattga gtcgataatc gtgaagagtc ggcgagcctg 4920
gttagccagt gctctttccg ttgtgctgaa ttaagcgaat accggaagca gaaccggatc 4980
accaaatgcg tacaggcgtc atcgccgccc agcaacagca caacccaaac tgagccgtag 5040
ccactgtctg tcctgaattc attagtaata gttacgctgc ggccttttac acatgacctt 5100
cgtgaaagcg ggtggcagga ggtcgcgcta acaacctcct gccgttttgc ccgtgcatat 5160
cggtcacgaa caaatctgat tactaaacac agtagcctgg atttgttcta tcagtaatcg 5220
accttattcc taattaaata gagcaaatcc ccttattggg ggtaagacat gaagatgcca 5280
gaaaaacatg acctgttggc cgccattctc gcggcaaagg aacaaggcat cggggcaatc 5340
cttgcgtttg caatggcgta ccttcgcggc agatataatg gcggtgcgtt tacaaaaaca 5400
gtaatcgacg caacgatgtg cgccattatc gcctggttca ttcgtgacct tctcgacttc 5460
gccggactaa gtagcaatct cgcttatata acgagcgtgt ttatcggcta catcggtact 5520
gactcgattg gttcgcttat caaacgcttc gctgctaaaa aagccggagt agaagatggt 5580
agaaatcaat aatcaacgta aggcgttcct cgatatgctg gcgtggtcgg agggaactga 5640
taacggacgt cagaaaacca gaaatcatgg ttatgacgtc attgtaggcg gagagctatt 5700
tactgattac tccgatcacc ctcgcaaact tgtcacgcta aacccaaaac tcaaatcaac 5760
aggcgccgga cgctaccagc ttctttcccg ttggtgggat gcctaccgca agcagcttgg 5820
cctgaaagac ttctctccga aaagtcagga cgctgtggca ttgcagcaga ttaaggagcg 5880
tggcgcttta cctatgattg atcgtggtga tatccgtcag gcaatcgacc gttgcagcaa 5940
tatctgggct tcactgccgg gcgctggtta tggtcagttc gagcataagg ctgacagcct 6000
gattgcaaaa ttcaaagaag cgggcggaac ggtcagagag attgatgtat gagcagagtc 6060
accgcgatta tctccgctct ggttatctgc atcatcgtct gcctgtcatg ggctgttaat 6120
cattaccgtg ataacgccat tacctacaaa gcccagcgcg acaaaaatgc cagagaactg 6180
aagctggcga acgcggcaat tactgacatg cagatgcgtc agcgtgatgt tgctgcgctc 6240
gatgcaaaat acacgaagga gttagctgat gctaaagctg aaaatgatgc tctgcgtgat 6300
gatgttgccg ctggtcgtcg tcggttgcac atcaaagcag tctgtcagtc agtgcgtgaa 6360
gccaccaccg cctccggcgt ggataatgca gcctcccccc gactggcaga caccgctgaa 6420
cgggattatt tcaccctcag agagaggctg atcactatgc aaaaacaact ggaaggaacc 6480
cagaagtata ttaatgagca gtgcagatag agttgcccat atcgatgggc aactcatgca 6540
attattgtga gcaatacaca cgcgcttcca gcggagtata aatgcctaaa gtaataaaac 6600
cgagcaatcc atttacgaat gtttgctggg tttctgtttt aacaacattt tctgcgccgc 6660
cacaaatttt ggctgcatcg acagttttct tctgcccaat tccagaaacg aagaaatgat 6720
gggtgatggt ttcctttggt gctactgctg ccggtttgtt ttgaacagta aacgtctgtt 6780
gagcacatcc tgtaataagc agggccagcg cagtagcgag tagcattttt ttcatggtgt 6840
tattcccgat gctttttgaa gttcgcagaa tcgtatgtgt agaaaattaa acaaacccta 6900
aacaatgagt tgaaatttca tattgttaat atttattaat gtatgtcagg tgcgatgaat 6960
cgtcattgta ttcccggatt aactatgtcc acagccctga cggggaactt ctctgcggga 7020
gtgtccggga ataattaaaa cgatgcacac agggtttagc gcgtacacgt attgcattat 7080
gccaacgccc cggtgctgac acggaagaaa ccggacgtta tgatttagcg tggaaagatt 7140
tgtgtagtgt tctgaatgct ctcagtaaat agtaatgaat tatcaaaggt atagtaatat 7200
cttttatgtt catggatatt tgtaacccat cggaaaactc ctgctttagc aagattttcc 7260
ctgtattgct gaaatgtgat ttctcttgat ttcaacctat cataggacgt ttctataaga 7320
tgcgtgtttc ttgagaattt aacatttaca acctttttaa gtccttttat taacacggtg 7380
ttatcgtttt ctaacacgat gtgaatatta tctgtggcta gatagtaaat ataatgtgag 7440
acgttgtgac gttttagttc agaataaaac aattcacagt ctaaatcttt tcgcacttga 7500
tcgaatattt ctttaaaaat ggcaacctga gccattggta aaaccttcca tgtgatacga 7560
gggcgcgtag tttgcattat cgtttttatc gtttcaatct ggtctgacct ccttgtgttt 7620
tgttgatgat ttatgtcaaa tattaggaat gttttcactt aatagtattg gttgcgtaac 7680
aaagtgcggt cctgctggca ttctggaggg aaatacaacc gacagatgta tgtaaggcca 7740
acgtgctcaa atcttcatac agaaagattt gaagtaatat tttaaccgct agatgaagag 7800
caagcgcatg gagcgacaaa atgaataaag aacaatctgc tgatgatccc tccgtggatc 7860
tgattcgtgt aaaaaatatg cttaatagca ccatttctat gagttaccct gatgttgtaa 7920
ttgcatgtat agaacataag gtgtctctgg aagcattcag agcaattgag gcagcgttgg 7980
tgaagcacga taataatatg aaggattatt ccctggtggt tgactgatca ccataactgc 8040
taatcattca aactatttag tctgtgacag agccaacacg cagtctgtca ctgtcaggaa 8100
agtggtaaaa ctgcaactca attactgcaa tgccctcgta attaagtgaa tttacaatat 8160
cgtcctgttc ggagggaaga acgcgggatg ttcattcttc atcactttta attgatgtat 8220
atgctctctt ttctgacgtt agtctccgac ggcaggcttc aatgacccag gctgagaaat 8280
tcccggaccc tttttgctca agagcgatgt taatttgttc aatcatttgg ttaggaaagc 8340
ggatgttgcg ggttgttgtt ctgcgggttc tgttcttcgt tgacatgagg ttgccccgta 8400
ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac gttaagttga tgcagatcaa 8460
ttaatacgat acctgcgtca taattgatta tttgacgtgg tttgatggcc tccacgcacg 8520
ttgtgatatg tagatgataa tcattatcac tttacgggtc ctttccggtg atccgacagg 8580
ttacggcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 8640
tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8700
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8760
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8820
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 8880
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 8940
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 9000
tattcttttg atttagacct gcaggcatgc aagcttactg gccgtcgttt tacaacgtcg 9060
tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 9120
cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 9180
gaatggcgaa tgcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 9240
gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 9300
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 9360
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 9420
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 9480
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 9540
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 9600
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 9660
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 9720
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 9780
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 9840
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 9900
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 9960
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 10020
aatcagcatc catgttggaa tttaatcgcg gcttcgagca agacgtttcc cgttgaatat 10080
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgatg 10140
atatattttt atcttgtgca atgtaacatc agagattttg agacacaacg tggctttgtt 10200
gaataaatcg aacttttgct gagttgaagg atcagatcac gcatcttccc gacaacgcag 10260
accgttccgt ggcaaagcaa aagttcaaaa tcaccaactg gtccacctac aacaaagctc 10320
tcatcaaccg tggctccctc actttctggc tggatgatgg ggcgattcag gcctggtatg 10380
agtcagcaac accttcttca cgaggcagac ctctcgacgg atcgttccac tgagcgtcag 10440
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 10500
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 10560
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 10620
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 10680
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 10740
tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 10800
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 10860
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 10920
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 10980
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 11040
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 11100
ggccttttgc tcacatgtcc tgcaggcagc tgcgcgccag ctgcgcgc 11148
&lt;210&gt; 9
&lt;211&gt; 2085
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 密码子优化的序列
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2085)
&lt;223&gt; 密码子优化的ORF
&lt;400&gt; 9
atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc act gga cag ggt att gcc cgg ctg agc aga ctg atc ttc ctg ctt 240
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
cgc cgc tgg gcg gcc aga cac gtg cac cat cag gac cag gga cct gat 288
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
agc ttc ccc gac cgc ttt agg gga gcc gag ctg aaa gaa gtg tca agc 336
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
cag gag tca aac gcg cag gcc aac gtc ggc agc caa gag cct gca gac 384
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
cgg gga cgc tcg gca tgg ccg ctc gca aag tgc aac act aac act tcc 432
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
aac aac acc gaa gag gaa aag aaa acc aag aag aag gat gca att gtg 480
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
gtg gac cct tcc tcc aac ctg tac tac cgc tgg ttg acc gcc atc gcc 528
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
ctc ccg gtc ttt tac aat tgg tat ctc ctt atc tgc cgg gcc tgc ttc 576
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
gac gaa ctg caa tca gag tac ctg atg ctg tgg ctg gtg ctg gac tat 624
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
agc gcc gat gtg ctc tac gtc ctg gat gtg ctc gtg cgc gcc cgg acc 672
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
gga ttc ttg gaa caa ggc ctg atg gtg tcc gac acg aat aga ctg tgg 720
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
cag cac tat aag acc aca acc cag ttc aag ctt gac gtg ctc agc ctt 768
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
gtg ccg act gac ctg gcc tac ctg aaa gtc gga act aac tac ccg gaa 816
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
gtc aga ttc aac cga ctc ctg aag ttc agc agg ctg ttc gag ttc ttt 864
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
gac cgc acc gag act cgg acc aac tac cct aac atg ttc cgg atc gga 912
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
aat ctg gtg ctc tac ata ctg att atc atc cat tgg aac gcc tgt atc 960
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
tat ttc gcc att tcg aag ttc atc ggt ttc gga acc gat tcc tgg gtg 1008
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
tac ccc aac atc tcg atc ccc gaa cac ggt cgc ctg tcc cgg aag tac 1056
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
atc tac tcc ctg tac tgg tcc act ctg act ctg acc acg atc ggg gaa 1104
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
acc cct cca ccc gtg aag gac gaa gag tac ctg ttc gtg gtg gtg gac 1152
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
ttc ctg gtc gga gtg ttg att ttc gcc acc att gtg gga aac gtg ggc 1200
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
tcc atg atc tcc aac atg aac gcg tcg aga gct gag ttc caa gcc aag 1248
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
atc gac tcc att aag cag tac atg cag ttc aga aag gtc acc aag gac 1296
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
ctg gaa acc agg gtc atc cgc tgg ttc gac tac ctg tgg gcc aac aaa 1344
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
aag act gtg gac gaa aag gaa gtg ctg aag tcg ctg ccg gat aag ctg 1392
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
aag gcc gaa atc gcc att aac gtg cac ctt gac acc ctg aag aaa gtc 1440
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
cgg atc ttc caa gac tgt gaa gcc ggc ctc ctg gtg gag ctc gtg ctc 1488
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
aag ctg cgg ccc acc gtg ttc agc ccg gga gat tac att tgc aag aag 1536
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
ggc gat atc ggc aaa gag atg tac atc atc aac gag gga aag ctg gcc 1584
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
gtg gtc gcg gac gac ggc gtg acc cag ttc gtg gtg ctg tcc gac gga 1632
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
tcc tac ttc ggt gaa atc tca atc ctc aac atc aag ggg tcc aag tcc 1680
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
ggc aac cgg aga act gcc aac att cgc tcc atc gga tac agc gac ctg 1728
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
ttt tgc ctg tcc aag gat gac ctg atg gag gct ctg act gag tac cct 1776
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
gaa gcg aag aag gct ttg gag gaa aag ggg cgg cag att ctg atg aag 1824
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
gac aat ttg atc gac gag gag ctc gca cgg gcc ggc gcc gac ccc aag 1872
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
gat ctc gaa gag aag gtc gaa cag ctg ggt tct tcg ctt gat acc ctg 1920
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
caa acc cga ttc gcg cgg ctg ctc gcc gag tac aac gcg acc cag atg 1968
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
aag atg aag cag aga ctg tca cag ttg gaa tcc caa gtc aag ggc gga 2016
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
ggc gac aag ccg ctg gcg gac ggg gaa gtg ccc ggg gac gcc acc aag 2064
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
act gag gac aag cag cag tga 2085
Thr Glu Asp Lys Gln Gln
690
&lt;210&gt; 10
&lt;211&gt; 694
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 10
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
Thr Glu Asp Lys Gln Gln
690
&lt;210&gt; 11
&lt;211&gt; 2250
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 密码子优化的序列
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2250)
&lt;223&gt; 密码子优化的ORF
&lt;400&gt; 11
atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc act gga cag ggt att gcc cgg ttc ggg cgg att cag aag aag tcc 240
Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser
65 70 75 80
cag ccg gag aag gtc gtg cgg gct gcc agc agg ggc agg cca ctc att 288
Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile
85 90 95
ggt tgg aca cag tgg tgc gct gag gat ggt gga gat gaa tcg gaa atg 336
Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met
100 105 110
gca ctg gcc ggc tct ccc gga tgc agc tcg ggc ccc caa ggg aga ctg 384
Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu
115 120 125
agc aga ctg atc ttc ctg ctt cgc cgc tgg gcg gcc aga cac gtg cac 432
Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His
130 135 140
cat cag gac cag gga cct gat agc ttc ccc gac cgc ttt agg gga gcc 480
His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala
145 150 155 160
gag ctg aaa gaa gtg tca agc cag gag tca aac gcg cag gcc aac gtc 528
Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val
165 170 175
ggc agc caa gag cct gca gac cgg gga cgc tcg gca tgg ccg ctc gca 576
Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala
180 185 190
aag tgc aac act aac act tcc aac aac acc gaa gag gaa aag aaa acc 624
Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr
195 200 205
aag aag aag gat gca att gtg gtg gac cct tcc tcc aac ctg tac tac 672
Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr
210 215 220
cgc tgg ttg acc gcc atc gcc ctc ccg gtc ttt tac aat tgg tat ctc 720
Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu
225 230 235 240
ctt atc tgc cgg gcc tgc ttc gac gaa ctg caa tca gag tac ctg atg 768
Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met
245 250 255
ctg tgg ctg gtg ctg gac tat agc gcc gat gtg ctc tac gtc ctg gat 816
Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp
260 265 270
gtg ctc gtg cgc gcc cgg acc gga ttc ttg gaa caa ggc ctg atg gtg 864
Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val
275 280 285
tcc gac acg aat aga ctg tgg cag cac tat aag acc aca acc cag ttc 912
Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe
290 295 300
aag ctt gac gtg ctc agc ctt gtg ccg act gac ctg gcc tac ctg aaa 960
Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys
305 310 315 320
gtc gga act aac tac ccg gaa gtc aga ttc aac cga ctc ctg aag ttc 1008
Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe
325 330 335
agc agg ctg ttc gag ttc ttt gac cgc acc gag act cgg acc aac tac 1056
Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr
340 345 350
cct aac atg ttc cgg atc gga aat ctg gtg ctc tac ata ctg att atc 1104
Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile
355 360 365
atc cat tgg aac gcc tgt atc tat ttc gcc att tcg aag ttc atc ggt 1152
Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly
370 375 380
ttc gga acc gat tcc tgg gtg tac ccc aac atc tcg atc ccc gaa cac 1200
Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His
385 390 395 400
ggt cgc ctg tcc cgg aag tac atc tac tcc ctg tac tgg tcc act ctg 1248
Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu
405 410 415
act ctg acc acg atc ggg gaa acc cct cca ccc gtg aag gac gaa gag 1296
Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu
420 425 430
tac ctg ttc gtg gtg gtg gac ttc ctg gtc gga gtg ttg att ttc gcc 1344
Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala
435 440 445
acc att gtg gga aac gtg ggc tcc atg atc tcc aac atg aac gcg tcg 1392
Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser
450 455 460
aga gct gag ttc caa gcc aag atc gac tcc att aag cag tac atg cag 1440
Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln
465 470 475 480
ttc aga aag gtc acc aag gac ctg gaa acc agg gtc atc cgc tgg ttc 1488
Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe
485 490 495
gac tac ctg tgg gcc aac aaa aag act gtg gac gaa aag gaa gtg ctg 1536
Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu
500 505 510
aag tcg ctg ccg gat aag ctg aag gcc gaa atc gcc att aac gtg cac 1584
Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His
515 520 525
ctt gac acc ctg aag aaa gtc cgg atc ttc caa gac tgt gaa gcc ggc 1632
Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly
530 535 540
ctc ctg gtg gag ctc gtg ctc aag ctg cgg ccc acc gtg ttc agc ccg 1680
Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro
545 550 555 560
gga gat tac att tgc aag aag ggc gat atc ggc aaa gag atg tac atc 1728
Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile
565 570 575
atc aac gag gga aag ctg gcc gtg gtc gcg gac gac ggc gtg acc cag 1776
Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln
580 585 590
ttc gtg gtg ctg tcc gac gga tcc tac ttc ggt gaa atc tca atc ctc 1824
Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu
595 600 605
aac atc aag ggg tcc aag tcc ggc aac cgg aga act gcc aac att cgc 1872
Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg
610 615 620
tcc atc gga tac agc gac ctg ttt tgc ctg tcc aag gat gac ctg atg 1920
Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met
625 630 635 640
gag gct ctg act gag tac cct gaa gcg aag aag gct ttg gag gaa aag 1968
Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys
645 650 655
ggg cgg cag att ctg atg aag gac aat ttg atc gac gag gag ctc gca 2016
Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala
660 665 670
cgg gcc ggc gcc gac ccc aag gat ctc gaa gag aag gtc gaa cag ctg 2064
Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu
675 680 685
ggt tct tcg ctt gat acc ctg caa acc cga ttc gcg cgg ctg ctc gcc 2112
Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala
690 695 700
gag tac aac gcg acc cag atg aag atg aag cag aga ctg tca cag ttg 2160
Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu
705 710 715 720
gaa tcc caa gtc aag ggc gga ggc gac aag ccg ctg gcg gac ggg gaa 2208
Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu
725 730 735
gtg ccc ggg gac gcc acc aag act gag gac aag cag cag tga 2250
Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln
740 745
&lt;210&gt; 12
&lt;211&gt; 749
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 12
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser
65 70 75 80
Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile
85 90 95
Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met
100 105 110
Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu
115 120 125
Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His
130 135 140
His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala
145 150 155 160
Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val
165 170 175
Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala
180 185 190
Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr
195 200 205
Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr
210 215 220
Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu
225 230 235 240
Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met
245 250 255
Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp
260 265 270
Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val
275 280 285
Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe
290 295 300
Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys
305 310 315 320
Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe
325 330 335
Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr
340 345 350
Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile
355 360 365
Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly
370 375 380
Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His
385 390 395 400
Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu
405 410 415
Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu
420 425 430
Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala
435 440 445
Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser
450 455 460
Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln
465 470 475 480
Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe
485 490 495
Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu
500 505 510
Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His
515 520 525
Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly
530 535 540
Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro
545 550 555 560
Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile
565 570 575
Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln
580 585 590
Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu
595 600 605
Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg
610 615 620
Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met
625 630 635 640
Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys
645 650 655
Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala
660 665 670
Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu
675 680 685
Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala
690 695 700
Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu
705 710 715 720
Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu
725 730 735
Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln
740 745
&lt;210&gt; 13
&lt;211&gt; 2085
&lt;212&gt; DNA
&lt;213&gt; 人
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2085)
&lt;223&gt; 天然开放阅读框 (ORF)
&lt;400&gt; 13
atg gcc aag atc aac acc caa tac tcc cac ccc tcc agg acc cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aag gta aag acc tca gac cgg gat ctc aat cgc gct gaa aat ggc ctc 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
agc aga gcc cac tcg tca agt gag gag aca tcg tca gtg ctg cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggg atc gcc atg gag acc aga gga ctg gct gac tcc ggg cag ggc tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc acc ggc cag ggg atc gcc agg ctg tcg cgc ctc atc ttc ttg ctg 240
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
cgc agg tgg gct gcc agg cat gtg cac cac cag gac cag gga ccg gac 288
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
tct ttt cct gat cgt ttc cgt gga gcc gag ctt aag gag gtg tcc agc 336
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
caa gaa agc aat gcc cag gca aat gtg ggc agc cag gag cca gca gac 384
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
aga ggg aga agc gcc tgg ccc ctg gcc aaa tgc aac act aac acc agc 432
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
aac aac acg gag gag gag aag aag acg aaa aag aag gat gcg atc gtg 480
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
gtg gac ccg tcc agc aac ctg tac tac cgc tgg ctg acc gcc atc gcc 528
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
ctg cct gtc ttc tat aac tgg tat ctg ctt att tgc agg gcc tgt ttc 576
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
gat gag ctg cag tcc gag tac ctg atg ctg tgg ctg gtc ctg gac tac 624
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
tcg gca gat gtc ctg tat gtc ttg gat gtg ctt gta cga gct cgg aca 672
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
ggt ttt ctt gag caa ggc tta atg gtc agt gat acc aac agg ctg tgg 720
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
cag cat tac aag acg acc acg cag ttc aag ctg gat gtg ttg tcc ctg 768
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
gtc ccc acc gac ctg gct tac tta aag gtg ggc aca aac tac cca gaa 816
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
gtg agg ttc aac cgc cta ctg aag ttt tcc cgg ctc ttt gaa ttc ttt 864
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
gac cgc aca gag aca agg acc aac tac ccc aat atg ttc agg att ggg 912
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
aac ttg gtc ttg tac att ctc atc atc atc cac tgg aat gcc tgc atc 960
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
tac ttt gcc att tcc aag ttc att ggt ttt ggg aca gac tcc tgg gtc 1008
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
tac cca aac atc tca atc cca gag cat ggg cgc ctc tcc agg aag tac 1056
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
att tac agt ctc tac tgg tcc acc ttg acc ctt acc acc att ggt gag 1104
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
acc cca ccc ccc gtg aaa gat gag gag tat ctc ttt gtg gtc gta gac 1152
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
ttc ttg gtg ggt gtt ctg att ttt gcc acc att gtg ggc aat gtg ggc 1200
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
tcc atg atc tcg aat atg aat gcc tca cgg gca gag ttc cag gcc aag 1248
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
att gat tcc atc aag cag tac atg cag ttc cgc aag gtc acc aag gac 1296
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
ttg gag acg cgg gtt atc cgg tgg ttt gac tac ctg tgg gcc aac aag 1344
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
aag acg gtg gat gag aag gag gtg ctc aag agc ctc cca gac aag ctg 1392
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
aag gct gag atc gcc atc aac gtg cac ctg gac acg ctg aag aag gtt 1440
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
cgc atc ttc cag gac tgt gag gca ggg ctg ctg gtg gag ctg gtg ctg 1488
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
aag ctg cga ccc act gtg ttc agc cct ggg gat tat atc tgc aag aag 1536
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
gga gat att ggg aag gag atg tac atc atc aac gag ggc aag ctg gcc 1584
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
gtg gtg gct gat gat ggg gtc acc cag ttc gtg gtc ctc agc gat ggc 1632
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
agc tac ttc ggg gag atc agc att ctg aac atc aag ggg agc aag tcg 1680
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
ggg aac cgc agg acg gcc aac atc cgc agc att ggc tac tca gac ctg 1728
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
ttc tgc ctc tca aag gac gat ctc atg gag gcc ctc acc gag tac ccc 1776
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
gaa gcc aag aag gcc ctg gag gag aaa gga cgg cag atc ctg atg aaa 1824
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
gac aac ctg atc gat gag gag ctg gcc agg gcg ggc gcg gac ccc aag 1872
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
gac ctt gag gag aaa gtg gag cag ctg ggg tcc tcc ctg gac acc ctg 1920
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
cag acc agg ttt gca cgc ctc ctg gct gag tac aac gcc acc cag atg 1968
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
aag atg aag cag cgt ctc agc caa ctg gaa agc cag gtg aag ggt ggt 2016
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
ggg gac aag ccc ctg gct gat ggg gaa gtt ccc ggg gat gct aca aaa 2064
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
aca gag gac aaa caa cag tga 2085
Thr Glu Asp Lys Gln Gln
690
&lt;210&gt; 14
&lt;211&gt; 694
&lt;212&gt; PRT
&lt;213&gt; 人
&lt;400&gt; 14
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
Thr Glu Asp Lys Gln Gln
690
&lt;210&gt; 15
&lt;211&gt; 2085
&lt;212&gt; DNA
&lt;213&gt; 人
&lt;400&gt; 15
atggccaaga tcaacaccca atactcccac ccctccagga cccacctcaa ggtaaagacc 60
tcagaccgag atctcaatcg cgctgaaaat ggcctcagca gagcccactc gtcaagtgag 120
gagacatcgt cagtgctgca gccggggatc gccatggaga ccagaggact ggctgactcc 180
gggcagggct ccttcaccgg ccaggggatc gccaggctgt cgcgcctcat cttcttgctg 240
cgcaggtggg ctgccaggca tgtgcaccac caggaccagg gaccggactc ttttcctgat 300
cgtttccgtg gagccgagct taaggaggtg tccagccaag aaagcaatgc ccaggcaaat 360
gtgggcagcc aggagccagc agacagaggg agaagcgcct ggcccctggc caaatgcaac 420
actaacacca gcaacaacac ggaggaggag aagaagacga aaaagaagga tgcgatcgtg 480
gtggacccgt ccagcaacct gtactaccgc tggctgaccg ccatcgccct gcctgtcttc 540
tataactggt atctgcttat ttgcagggcc tgtttcgatg agctgcagtc cgagtacctg 600
atgctgtggc tggtcctgga ctactcggca gatgtcctgt atgtcttgga tgtgcttgta 660
cgagctcgga caggttttct cgagcaaggc ttaatggtca gtgataccaa caggctgtgg 720
cagcattaca agacgaccac gcagttcaag ctggatgtgt tgtccctggt ccccaccgac 780
ctggcttact taaaggtggg cacaaactac ccagaagtga ggttcaaccg cctactgaag 840
ttttcccggc tctttgaatt ctttgaccgc acagagacaa ggaccaacta ccccaatatg 900
ttcaggattg ggaacttggt cttgtacatt ctcatcatca tccactggaa tgcctgcatc 960
tactttgcca tttccaagtt cattggtttt gggacagact cctgggtcta cccaaacatc 1020
tcaatcccag agcatgggcg cctctccagg aagtacattt acagtctcta ctggtccacc 1080
ttgaccctta ccaccattgg tgagacccca ccccccgtga aagatgagga gtatctcttt 1140
gtggtcgtag acttcttggt gggtgttctg atttttgcca ccattgtggg caatgtgggc 1200
tccatgatct cgaatatgaa tgcctcacgg gcagagttcc aggccaagat tgattccatc 1260
aagcagtaca tgcagttccg caaggtcacc aaggacttgg agacgcgggt tatccggtgg 1320
tttgactacc tgtgggccaa caagaagacg gtggatgaga aggaggtgct caagagcctc 1380
ccagacaagc tgaaggctga gatcgccatc aacgtgcacc tggacacgct gaagaaggtt 1440
cgcatcttcc aggactgtga ggcagggctg ctggtggagc tggtgctgaa gctgcgaccc 1500
actgtgttca gccctgggga ttatatctgc aagaagggag atattgggaa ggagatgtac 1560
atcatcaacg agggcaagct ggccgtggtg gctgatgatg gggtcaccca gttcgtggtc 1620
ctcagcgatg gcagctactt cggggagatc agcattctga acatcaaggg gagcaagtcg 1680
ggaaccgca ggacggccaa catccgcagc attggctact cagacctgtt ctgcctctca 1740
aaggacgatc tcatggaggc cctcaccgag taccccgaag ccaagaaggc cctggaggag 1800
aaaggacggc agatcctgat gaaagacaac ctgatcgatg aggagctggc cagggcgggc 1860
gcggacccca aggaccttga ggagaaagtg gagcagctgg ggtcctccct ggacaccctg 1920
cagaccaggt ttgcacgcct cctggctgag tacaacgcca cccagatgaa gatgaagcag 1980
cgtctcagcc aactggaaag ccaggtgaag ggtggtgggg acaagcccct ggctgatggg 2040
gaagttcccg gggatgctac aaaaacagag gacaaacaac agtga 2085
&lt;210&gt; 16
&lt;211&gt; 2107
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;400&gt; 16
gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60
aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120
tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180
ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggct gagcagactg 240
atcttcctgc ttcgccgctg ggcggccaga cacgtgcacc atcaggacca gggacctgat 300
agcttccccg accgctttag gggagccgag ctgaaagaag tgtcaagcca ggagtcaaac 360
gcgcaggcca acgtcggcag ccaagagcct gcagaccggg gacgctcggc atggccgctc 420
gcaaagtgca acactaacac ttccaacaac accgaagagg aaaagaaaac caagaagaag 480
gatgcaattg tggtggaccc ttcctccaac ctgtactacc gctggttgac cgccatcgcc 540
ctcccggtct tttacaattg gtatctcctt atctgccggg cctgcttcga cgaactgcaa 600
tcagagtacc tgatgctgtg gctggtgctg gactatagcg ccgatgtgct ctacgtcctg 660
gatgtgctcg tgcgcgcccg gaccggattc ttggaacaag gcctgatggt gtccgacacg 720
aatagactgt ggcagcacta taagaccaca acccagttca agcttgacgt gctcagcctt 780
gtgccgactg acctggccta cctgaaagtc ggaactaact acccggaagt cagattcaac 840
cgactcctga agttcagcag gctgttcgag ttctttgacc gcaccgagac tcggaccaac 900
taccctaaca tgttccggat cggaaatctg gtgctctaca tactgattat catccattgg 960
aacgcctgta tctatttcgc catttcgaag ttcatcggtt tcggaaccga ttcctgggtg 1020
taccccaaca tctcgatccc cgaacacggt cgcctgtccc ggaagtacat ctactccctg 1080
tactggtcca ctctgactct gaccacgatc ggggaaaccc ctccacccgt gaaggacgaa 1140
gagtacctgt tcgtggtggt ggacttcctg gtcggagtgt tgattttcgc caccattgtg 1200
ggaaacgtgg gctccatgat ctccaacatg aacgcgtcga gagctgagtt ccaagccaag 1260
atcgactcca ttaagcagta catgcagttc agaaaggtca ccaaggacct ggaaaccagg 1320
gtcatccgct ggttcgacta cctgtgggcc aacaaaaaga ctgtggacga aaaggaagtg 1380
ctgaagtcgc tgccggataa gctgaaggcc gaaatcgcca ttaacgtgca ccttgacacc 1440
ctgaagaaag tccggatctt ccaagactgt gaagccggcc tcctggtgga gctcgtgctc 1500
aagctgcggc ccaccgtgtt cagcccggga gattacattt gcaagaaggg cgatatcggc 1560
aaagagatgt acatcatcaa cgagggaaag ctggccgtgg tcgcggacga cggcgtgacc 1620
cagttcgtgg tgctgtccga cggatcctac ttcggtgaaa tctcaatcct caacatcaag 1680
gggtccaagt ccggcaaccg gagaactgcc aacattcgct ccatcggata cagcgacctg 1740
ttttgcctgt ccaaggatga cctgatggag gctctgactg agtaccctga agcgaagaag 1800
gctttggagg aaaaggggcg gcagattctg atgaaggaca atttgatcga cgaggagctc 1860
gcacgggccg gcgccgaccc caaggatctc gaagagaagg tcgaacagct gggttcttcg 1920
cttgataccc tgcaaacccg attcgcgcgg ctgctcgccg agtacaacgc gacccagatg 1980
aagatgaagc agagactgtc acagttggaa tcccaagtca agggcggagg cgacaagccg 2040
ctggcggacg gggaagtgcc cggggacgcc accaagactg aggacaagca gcagtgatca 2100
tagatct 2107
&lt;210&gt; 17
&lt;211&gt; 2272
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;400&gt; 17
gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60
aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120
tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180
ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggtt cgggcggatt 240
cagaagaagt cccagccgga gaaggtcgtg cgggctgcca gcaggggcag gccactcatt 300
ggttggacac agtggtgcgc tgaggatggt ggagatgaat cggaaatggc actggccggc 360
tctcccggat gcagctcggg cccccaaggg agactgagca gactgatctt cctgcttcgc 420
cgctgggcgg ccagacacgt gcaccatcag gaccagggac ctgatagctt ccccgaccgc 480
tttaggggag ccgagctgaa agaagtgtca agccaggagt caaacgcgca ggccaacgtc 540
ggcagccaag agcctgcaga ccggggacgc tcggcatggc cgctcgcaaa gtgcaacact 600
aacacttcca acaacaccga agaggaaaag aaaaccaaga agaaggatgc aattgtggtg 660
gacccttcct ccaacctgta ctaccgctgg ttgaccgcca tcgccctccc ggtcttttac 720
aattggtatc tccttatctg ccgggcctgc ttcgacgaac tgcaatcaga gtacctgatg 780
ctgtggctgg tgctggacta tagcgccgat gtgctctacg tcctggatgt gctcgtgcgc 840
gcccggaccg gattcttgga acaaggcctg atggtgtccg acacgaatag actgtggcag 900
cactataaga ccacaaccca gttcaagctt gacgtgctca gccttgtgcc gactgacctg 960
gcctacctga aagtcggaac taactacccg gaagtcagat tcaaccgact cctgaagttc 1020
agcaggctgt tcgagttctt tgaccgcacc gagactcgga ccaactaccc taacatgttc 1080
cggatcggaa atctggtgct ctacatactg attatcatcc attggaacgc ctgtatctat 1140
ttcgccattt cgaagttcat cggtttcgga accgattcct gggtgtaccc caacatctcg 1200
atccccgaac acggtcgcct gtcccggaag tacatctact ccctgtactg gtccactctg 1260
actctgacca cgatcgggga aacccctcca cccgtgaagg acgaagagta cctgttcgtg 1320
gtggtggact tcctggtcgg agtgttgatt ttcgccacca ttgtgggaaa cgtgggctcc 1380
atgatctcca acatgaacgc gtcgagagct gagttccaag ccaagatcga ctccattaag 1440
cagtacatgc agttcagaaa ggtcaccaag gacctggaaa ccagggtcat ccgctggttc 1500
gactacctgt gggccaacaa aaagactgtg gacgaaaagg aagtgctgaa gtcgctgccg 1560
gataagctga aggccgaaat cgccattaac gtgcaccttg acaccctgaa gaaagtccgg 1620
atcttccaag actgtgaagc cggcctcctg gtggagctcg tgctcaagct gcggcccacc 1680
gtgttcagcc cgggagatta catttgcaag aagggcgata tcggcaaaga gatgtacatc 1740
atcaacgagg gaaagctggc cgtggtcgcg gacgacggcg tgacccagtt cgtggtgctg 1800
tccgacggat cctacttcgg tgaaatctca atcctcaaca tcaaggggtc caagtccggc 1860
aaccggagaa ctgccaacat tcgctccatc ggatacagcg acctgttttg cctgtccaag 1920
gatgacctga tggaggctct gactgagtac cctgaagcga agaaggcttt ggaggaaaag 1980
gggcggcaga ttctgatgaa ggacaatttg atcgacgagg agctcgcacg ggccggcgcc 2040
gaccccaagg atctcgaaga gaaggtcgaa cagctgggtt cttcgcttga taccctgcaa 2100
acccgattcg cgcggctgct cgccgagtac aacgcgaccc agatgaagat gaagcagaga 2160
ctgtcacagt tggaatccca agtcaagggc ggaggcgaca agccgctggc ggacggggaa 2220
gtgcccgggg acgccaccaa gactgaggac aagcagcagt gatcatagat ct 2272
&lt;210&gt; 18
&lt;211&gt; 2107
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;400&gt; 18
gcggccgcca ccatggccaa gatcaacacc caatactccc acccctccag gacccacctc 60
aaggtaaaga cctcagaccg ggatctcaat cgcgctgaaa atggcctcag cagagcccac 120
tcgtcaagtg aggagacatc gtcagtgctg cagccgggga tcgccatgga gaccagagga 180
ctggctgact ccgggcaggg ctccttcacc ggccagggga tcgccaggct gtcgcgcctc 240
atcttcttgc tgcgcaggtg ggctgccagg catgtgcacc accaggacca gggaccggac 300
tcttttcctg atcgtttccg tggagccgag cttaaggagg tgtccagcca agaaagcaat 360
gcccaggcaa atgtgggcag ccaggagcca gcagacagag ggagaagcgc ctggcccctg 420
gccaaatgca acactaacac cagcaacaac acggaggagg agaagaagac gaaaaagaag 480
gatgcgatcg tggtggaccc gtccagcaac ctgtactacc gctggctgac cgccatcgcc 540
ctgcctgtct tctataactg gtatctgctt atttgcaggg cctgtttcga tgagctgcag 600
tccgagtacc tgatgctgtg gctggtcctg gactactcgg cagatgtcct gtatgtcttg 660
gatgtgcttg tacgagctcg gacaggtttt cttgagcaag gcttaatggt cagtgatacc 720
aacaggctgt ggcagcatta caagacgacc acgcagttca agctggatgt gttgtccctg 780
gtccccaccg acctggctta cttaaaggtg ggcacaaact acccagaagt gaggttcaac 840
cgcctactga agttttcccg gctctttgaa ttctttgacc gcacagagac aaggaccaac 900
taccccaata tgttcaggat tgggaacttg gtcttgtaca ttctcatcat catccactgg 960
aatgcctgca tctactttgc catttccaag ttcattggtt ttgggacaga ctcctgggtc 1020
tacccaaaca tctcaatccc agagcatggg cgcctctcca ggaagtacat ttacagtctc 1080
tactggtcca ccttgaccct taccaccatt ggtgagaccc caccccccgt gaaagatgag 1140
gagtatctct ttgtggtcgt agacttcttg gtgggtgttc tgatttttgc caccattgtg 1200
ggcaatgtgg gctccatgat ctcgaatatg aatgcctcac gggcagagtt ccaggccaag 1260
attgattcca tcaagcagta catgcagttc cgcaaggtca ccaaggactt ggagacgcgg 1320
gttatccggt ggtttgacta cctgtgggcc aacaagaaga cggtggatga gaaggaggtg 1380
ctcaagagcc tcccagacaa gctgaaggct gagatcgcca tcaacgtgca cctggacacg 1440
ctgaagaagg ttcgcatctt ccaggactgt gaggcagggc tgctggtgga gctggtgctg 1500
aagctgcgac ccactgtgtt cagccctggg gattatatct gcaagaaggg agatattggg 1560
aaggagatgt acatcatcaa cgagggcaag ctggccgtgg tggctgatga tggggtcacc 1620
cagttcgtgg tcctcagcga tggcagctac ttcggggaga tcagcattct gaacatcaag 1680
gggagcaagt cggggaaccg caggacggcc aacatccgca gcattggcta ctcagacctg 1740
ttctgcctct caaaggacga tctcatggag gccctcaccg agtaccccga agccaagaag 1800
gccctggagg agaaaggacg gcagatcctg atgaaagaca acctgatcga tgaggagctg 1860
gccagggcgg gcgcggaccc caaggacctt gaggagaaag tggagcagct ggggtcctcc 1920
ctggacaccc tgcagaccag gtttgcacgc ctcctggctg agtacaacgc cacccagatg 1980
aagatgaagc agcgtctcag ccaactggaa agccaggtga agggtggtgg ggacaagccc 2040
ctggctgatg gggaagttcc cggggatgct acaaaaacag aggacaaaca acagtgatca 2100
tagatct 2107
&lt;210&gt; 19
&lt;211&gt; 2430
&lt;212&gt; DNA
&lt;213&gt; 人
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2430)
&lt;400&gt; 19
atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
agc cca caa aac aaa ccg cct gca gct cct gtt ata aat gag tat gcc 384
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
gac atc ata tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
gat gtg aac ttc agc atc atc agc aaa gtc gac ttg ttc aag ggt tgt 1584
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
caa gaa att cta gtg cat tat cca gat tct gaa agg atc ctc atg aag 1920
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
att gaa gtc aaa gaa aag gct aag caa taa 2430
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
&lt;210&gt; 20
&lt;211&gt; 809
&lt;212&gt; PRT
&lt;213&gt; 人
&lt;400&gt; 20
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
&lt;210&gt; 21
&lt;211&gt; 2430
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (1)..(2430)
&lt;400&gt; 21
atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
agc cca caa aac aaa ccg cca gca gct cct gtt ata aat gag tat gcc 384
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
gac atc atc tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc aag ggt tgt 1584
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
caa gaa att cta gtg cat tat cca gat tct gaa aga atc ctc atg aag 1920
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
att gaa gtc aaa gaa aag gct aag caa tga 2430
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
&lt;210&gt; 22
&lt;211&gt; 809
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 22
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
&lt;210&gt; 23
&lt;211&gt; 2454
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(12)
&lt;223&gt; 具有NotI位点和Kozak的修饰末端
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(8)
&lt;223&gt; 用于亚克隆的NotI位点
&lt;220&gt;
&lt;221&gt; CDS
&lt;222&gt; (13)..(2448)
&lt;223&gt; 具有沉默突变的ORF (终止密码子和限制位点
BamHI, PstI, SalI和NdeI)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2440)..(2442)
&lt;223&gt; 修饰的终止密码子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2440)..(2445)
&lt;223&gt; 促进添加表位标签的BclI位点
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2446)..(2448)
&lt;223&gt; 附加终止密码子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (2449)..(2454)
&lt;223&gt; 用于亚克隆的PstI位点
&lt;400&gt; 23
gcggccgcca cc atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct 51
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro
1 5 10
ata gga gag aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa 99
Ile Gly Glu Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu
15 20 25
ggc tct cac cca agt aat cag tct cag caa acc aca gca cag gaa gaa 147
Gly Ser His Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu
30 35 40 45
aac aaa ggt gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg 195
Asn Lys Gly Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr
50 55 60
tct gaa gag cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat 243
Ser Glu Glu Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn
65 70 75
tcc tct gga gat ctg acc aca aac cct gac cct caa aat gca gca gaa 291
Ser Ser Gly Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu
80 85 90
cca act gga aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa 339
Pro Thr Gly Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu
95 100 105
ggt cca aac agc cca caa aac aaa ccg cca gca gct cct gtt ata aat 387
Gly Pro Asn Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn
110 115 120 125
gag tat gcc gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa 435
Glu Tyr Ala Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln
130 135 140
aga aca gcc ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca 483
Arg Thr Ala Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser
145 150 155
ccc gaa gcc agc cca caa act gca aag ccc acg gct gta cca cca gta 531
Pro Glu Ala Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val
160 165 170
aaa gaa agc gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg 579
Lys Glu Ser Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp
175 180 185
ttc aaa gtc aaa aag atg cct tta aca gag tac tta aag cga att aaa 627
Phe Lys Val Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys
190 195 200 205
ctt cca aac agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg 675
Leu Pro Asn Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp
210 215 220
ctc ttg ctt gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca 723
Leu Leu Leu Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro
225 230 235
ctg cgc ctc gtc ttc cca tat caa acc gca gac aac ata cac tac tgg 771
Leu Arg Leu Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp
240 245 250
ctt att gcg gac atc atc tgt gat atc atc tac ctt tat gat atg cta 819
Leu Ile Ala Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu
255 260 265
ttt atc cag ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg 867
Phe Ile Gln Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val
270 275 280 285
gat tca aat gag cta agg aaa cac tac agg act tct aca aaa ttt cag 915
Asp Ser Asn Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln
290 295 300
ttg gat gtc gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt 963
Leu Asp Val Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe
305 310 315
ggg ttt aat cca atg ttt aga gca aat agg atg tta aag tac act tca 1011
Gly Phe Asn Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser
320 325 330
ttt ttt gaa ttt aat cat cac cta gag tct ata atg gac aaa gca tat 1059
Phe Phe Glu Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr
335 340 345
atc tac aga gtt att cga aca act gga tac ttg ctg ttt att ctg cac 1107
Ile Tyr Arg Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His
350 355 360 365
att aat gcc tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc 1155
Ile Asn Ala Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly
370 375 380
act act aga tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt 1203
Thr Thr Arg Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys
385 390 395
tat tat tgg gca gtt cga act tta att acc att ggt ggc ctt cca gaa 1251
Tyr Tyr Trp Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu
400 405 410
cca caa act tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct 1299
Pro Gln Thr Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser
415 420 425
gga gtt ttt gtg ttc tcc agt tta att ggt cag atg aga gat gtg att 1347
Gly Val Phe Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile
430 435 440 445
gga gca gct aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac 1395
Gly Ala Ala Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp
450 455 460
acc att gcc tac atg aac aat tac tcc att cct aaa ctt gtg caa aag 1443
Thr Ile Ala Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys
465 470 475
cga gtt cgg act tgg tat gaa tat aca tgg gac tct caa aga atg cta 1491
Arg Val Arg Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu
480 485 490
gat gag tct gat ttg ctt aag acc cta cca act acg gtc cag tta gcc 1539
Asp Glu Ser Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala
495 500 505
ctc gcc att gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc 1587
Leu Ala Ile Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe
510 515 520 525
aag ggt tgt gat aca cag atg att tat gac atg ttg cta aga ttg aaa 1635
Lys Gly Cys Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys
530 535 540
tcc gtt ctc tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att 1683
Ser Val Leu Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile
545 550 555
ggc aag gaa atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga 1731
Gly Lys Glu Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly
560 565 570
ggc cct gat ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg 1779
Gly Pro Asp Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val
575 580 585
ttt gga gaa atc agc ctt cta gca gca gga gga gga aac cgt cga act 1827
Phe Gly Glu Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr
590 595 600 605
gcc aat gtg gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa 1875
Ala Asn Val Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys
610 615 620
aag acc ctc caa gaa att cta gtg cat tat cca gat tct gaa aga atc 1923
Lys Thr Leu Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile
625 630 635
ctc atg aag aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca 1971
Leu Met Lys Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala
640 645 650
gaa gca acc cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa 2019
Glu Ala Thr Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys
655 660 665
gaa gag aca ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa 2067
Glu Glu Thr Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys
670 675 680 685
gca agt ctt gca aga cta ctc aaa ttg aag cga gag caa gca gct cag 2115
Ala Ser Leu Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln
690 695 700
aag aaa gaa aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa 2163
Lys Lys Glu Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu
705 710 715
gat aaa caa aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa 2211
Asp Lys Gln Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys
720 725 730
gga aaa gaa aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag 2259
Gly Lys Glu Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys
735 740 745
cca ctg gac aga cct gaa tgt aca gca agt cct att gca gtg gag gaa 2307
Pro Leu Asp Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu
750 755 760 765
gaa ccc cac tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt 2355
Glu Pro His Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg
770 775 780
caa tca ctc att atc agc atg gct cct tct gct gag ggc gga gaa gag 2403
Gln Ser Leu Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu
785 790 795
gtt ctt act att gaa gtc aaa gaa aag gct aag caa tga tca taa 2448
Val Leu Thr Ile Glu Val Lys Glu Lys Ala Lys Gln Ser
800 805 810
ctgcag 2454
&lt;210&gt; 24
&lt;211&gt; 809
&lt;212&gt; PRT
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 合成构建体
&lt;400&gt; 24
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
&lt;210&gt; 25
&lt;211&gt; 11714
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(130)
&lt;223&gt; 5' ITR
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (241)..(544)
&lt;223&gt; CMV增强子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (546)..(823)
&lt;223&gt; 鸡β肌动蛋白启动子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (824)..(1795)
&lt;223&gt; CBA外显子1和内含子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1859)..(1864)
&lt;223&gt; kozak
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1865)..(3826)
&lt;223&gt; 人密码子优化的CHM (REP-1)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (3847)..(4054)
&lt;223&gt; bGH poly(A) 信号
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (4104)..(4233)
&lt;223&gt; 3' ITR
&lt;400&gt; 25
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620
aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740
aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860
gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920
tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980
tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040
tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160
gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400
taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420
cgattcatta atgcaggcgc ctgttgattt gagttttggg tttagcgtga caagtttgcg 6480
agggtgatcg gagtaatcag taaatagctc tccgcctaca atgacgtcat aaccatgatt 6540
tctggttttc tgacgtccgt tatcagttcc ctccgaccac gccagcatat cgaggaacgc 6600
cttacgttga ttattgattt ctaccatctt ctactccggc ttttttagca gcgaagcgtt 6660
tgataagcga accaatcgag tcagtaccga tgtagccgat aaacacgctc gttatataag 6720
cgagattgct acttagtccg gcgaagtcga gaaggtcacg aatgaaccag gcgataatgg 6780
cgcacatcgt tgcgtcgatt actgtttttg taaacgcacc gccattatat ctgccgcgaa 6840
ggtacgccat tgcaaacgca aggattgccc cgatgccttg ttcctttgcc gcgagaatgg 6900
cggccaacag gtcatgtttt tctggcatct tcatgtctta cccccaataa ggggatttgc 6960
tctatttaat taggaataag gtcgattact gatagaacaa atccaggcta ctgtgtttag 7020
taatcagatt tgttcgtgac cgatatgcac gggcaaaacg gcaggaggtt gttagcgcga 7080
cctcctgcca cccgctttca cgaaggtcat gtgtaaaagg ccgcagcgta actattacta 7140
atgaattcag gacagacagt ggctacggct cagtttgggt tgtgctgttg ctgggcggcg 7200
atgacgcctg tacgcatttg gtgatccggt tctgcttccg gtattcgctt aattcagcac 7260
aacggaaaga gcactggcta accaggctcg ccgactcttc acgattatcg actcaatgct 7320
cttacctgtt gtgcagatat aaaaaatccc gaaaccgtta tgcaggctct aactattacc 7380
tgcgaactgt ttcgggattg cattttgcag acctctctgc ctgcgatggt tggagttcca 7440
gacgatacgt cgaagtgacc aactaggcgg aatcggtagt aagcgccgcc tcttttcatc 7500
tcactaccac aacgagcgaa ttaacccatc gttgagtcaa atttacccaa ttttattcaa 7560
taagtcaata tcatgccgtt aatatgttgc catccgtggc aatcatgctg ctaacgtgtg 7620
accgcattca aaatgttgtc tgcgattgac tcttctttgt ggcattgcac caccagagcg 7680
tcatacagcg gcttaacagt gcgtgaccag gtgggttggg taaggtttgg gattagcatc 7740
gtcacagcgc gatatgctgc gcttgctggc atccttgaat agccgacgcc tttgcatctt 7800
ccgcactctt tctcgacaac tctcccccac agctctgttt tggcaatatc aaccgcacgg 7860
cctgtaccat ggcaatctct gcatcttgcc cccggcgtcg cggcactacg gcaataatcc 7920
gcataagcga atgttgcgag cacttgcagt acctttgcct tagtatttcc ttcaagcttt 7980
gccacaccac ggtatttccc cgataccttg tgtgcaaatt gcatcagata gttgatagcc 8040
ttttgtttgt cgttctggct gagttcgtgc ttaccgcaga atgcagccat accgaatccg 8100
gcttgtgatt gcgccatccc catagcagcc atcacatcag taccggaaag agagtcagaa 8160
gccgtggccc gtggtgagtc gctcatcatc gggctttttg gcgaatgaaa tttagctacg 8220
ctttcgagtc tcatgcgcct tctccctgta cctgaatcaa tgttaggttt ccgcagaaca 8280
ctgcgccggt atcgatatac atttggttgg caaacttgag tggtttcact gctggcgtat 8340
gaccaaagat gaacgtgtcc gcgcctttga tttctttcac gatcccgttt tgtgagttgc 8400
tgattcgttc gcggttccag attacctgct gatgatcaac tggctttcca aactcgtatt 8460
cgtcaaaggg ataatcggcg tggcagataa catatttttt atctttgctc accagttcga 8520
tgattaacgg aagttcatct gctttatggg caagagcttt agccagaatt tctttgtcgt 8580
aatcgagatt aaagaaccag ccaccgccat taagcagcca gtgattaacg tttccacgct 8640
ctgataagcc atcaatcatc atttgctcat ggtttccacg tacagctctg aaccagggga 8700
atgtgattaa ttccaggcat tcaacgttct ctgcaccacg atcaaccaaa tcgcccaccg 8760
agataagcag gtcttttttg ttgtcgaatc caatcgtatc cagtttgttc atcaggttcg 8820
tgtagcatcc gtgcagatcg ccaactaccc aaatatttcg gtatttgctg ccatcaattt 8880
tttcgtaata gcgcatctct ttcactccat ccgcgatgaa ccatgagaac gtcgttgacg 8940
atggcgtgca ttttcccgtc tttatcatca acgtattttc tgaccgtacc gcgactacat 9000
ttcagtctgc gtgctacttc tgtctgattt ccgtatgctt caacgagcat gtctggaatg 9060
gtttttactg agaacgtcat gcggcctcac ttctgctatt tcgcaggtct ttgagtttct 9120
gttggtactc tgccttgatc gccttgcact cttcgatagt ccagcgatgg cggttatggt 9180
ttgattcgat ttcgtctact gcttcctgcc cgatgcggct aatcagttcg acgcgatacg 9240
gaacgagatt tccgcttttg tgctggttgc acaccacgca ttgcttgtga atattgcgtt 9300
cattaaatcg gagttgaggt gccgcagcag ttgtccggta atgtccggca tcccactgag 9360
cagacgtgag cgttccgcac gagatacatg gtaagtcgcg gtctctttct ctgatgaagg 9420
cgtttacggc ttgttgggct tgtttaatcc agtaactgcg gggctttaag gcgagttttc 9480
gaatcttaag tttatctttc tgtttctgct cctctcgtcg tcgtttcttc tctgctgctt 9540
tttccgcttt ttcgcgttct ttacttcgtc gttcgagtgc tatcttggtt ccacactctg 9600
gagagcacca ccactgatta gcgaatgcag ggtgaaacca ttcccggcat tcatcgtttt 9660
tacatcgtct tcgcgctggt ttagccatca tcttcttcct cgtgcatcga gctattcgga 9720
tcgctcatca gttctgcgca gcagtgctca cacacgtgaa cttccagcac atgcagcttc 9780
tgaccgcagt tagcgcacgt taaagctcgc tcgacgcttt cttgttcgta acttcgattt 9840
tggtcaatca ccttgttttc ctcgcacgac gtcttagcca ccggatatcc cacaggtgag 9900
ccgtgtagtt gaaggttttt acgtcagatt cttttgggat tggcttgggt ttatttctgg 9960
tgcgtttcgt tggaaggtat ttgcagtttt cgcagattat gtcggtgata cttcgtcgct 10020
gtctcgccac acgtcctcct tttcctgcgg tagtggtaac acccctgttg gtgttctttc 10080
acaccggaga caccatcgat tccagtaagg ttgatttggt cggaagcggt tatcttcttt 10140
gcattcaccg caccgataac atcgcatcat gcagcttccc tcccgaagtc gaaatcaagc 10200
tgccctccaa atatttcgca tgactcagaa caagagccgg tatcgaatct tttagctcgt 10260
accatgtcct gatacagggc ttgataatca ttttctgaat acattttcgc gataccgtcc 10320
agcgacattc ttcctcggta cataatctcc tttggcgttt cccgatgtcc gtcacgcaca 10380
tgggatcccg tgatgacctc attaaaaaca cgctgcaatc cctcctcatc tttgcaggca 10440
agtccgattt tttgcgttga ttttttaatg cagaatatgc agttaccgag atgttccggt 10500
atttgcaaat cgaatggttg ttgcttccac catgcgagga tatcttcctt ctcaaagtct 10560
gacagttcag caagatatct gattccaggc tttggcttta gccgcttcgg ttcatcagct 10620
ctgatgccaa tccacgtggt gtaattccct cgcccgaaat ggtcatcaca gtatttggtg 10680
aagggaacga gttttaatct gtcagtgcag aacgcgccgc cgacgtatgg agtgccatat 10740
ttctttacca tatcgataaa tggcttcaga acaggcattc gcgtctgaat atcctttggt 10800
tcccataccg tataaccatt tggctgtcca agctccgggt tgatatcaac ctgcaatacg 10860
gtgagcggta tatcccagaa cttcacaact tccctgacaa accgatatgt cattggatgt 10920
tcacaacctg tatccatgaa aacgtaatgc acgtctttac ctgcccgtcg cttttgctcc 10980
attagccaga gcaaatatgc tgacgtcctg ccaccggaga aactaacgac atttatcatg 11040
cagccctgtc tccccatctc gctttccact ccagagccag tctcgcttcg tctgaccact 11100
taacgccacg ctctgtaccg aatgcctgta taagctctaa tagctccgca aattcgccta 11160
cacgcatcct gctggttgac tggcctatta ccacaaagcc attcccggca aggttaggaa 11220
caacatcctg ctgctttaat gctgcggtaa acacacactt ccagctttct gcatccagcc 11280
agcgaccatg ccattcaacc tgacgagaga cgtcacctaa gcaggcccat agcttcctgt 11340
tttggtctaa gctgcggttg cgttcctgaa tggttactac gattggtttg gttgggtctg 11400
gaaggatttg ctgtactgcg tgaatagcgt tttgctgatg tgctggagat cgaatttcaa 11460
aggttagttt tttcatgact tccctctccc ccaaataaaa aggctggcac gacaggtttc 11520
ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg 11580
caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat 11640
aacaatttca cacaggaaac agctatgacc atgattacgc caagctgtcg actctagagg 11700
atcccctaat aagg 11714
&lt;210&gt; 26
&lt;211&gt; 6647
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(130)
&lt;223&gt; 5' ITR
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (241)..(544)
&lt;223&gt; CMV增强子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (546)..(823)
&lt;223&gt; 鸡β肌动蛋白启动子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (824)..(1795)
&lt;223&gt; CBA外显子1和内含子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1859)..(1864)
&lt;223&gt; Kozak
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1865)..(3826)
&lt;223&gt; 人密码子优化的CHM (REM-1)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (3847)..(4054)
&lt;223&gt; bGH poly(A) 信号
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (4104)..(4233)
&lt;223&gt; 3' ITR
&lt;400&gt; 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620
aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740
aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860
gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920
tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980
tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040
tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160
gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400
taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 6480
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 6540
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 6600
accatgatta cgccaagctg tcgactctag aggatcccct aataagg 6647
&lt;210&gt; 27
&lt;211&gt; 11971
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(130)
&lt;223&gt; 5' ITR
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (241)..(544)
&lt;223&gt; CMV增强子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (546)..(823)
&lt;223&gt; 鸡β肌动蛋白启动子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (824)..(1795)
&lt;223&gt; CBA外显子1和内含子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1859)..(1864)
&lt;223&gt; kozak
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1865)..(3826)
&lt;223&gt; 人密码子优化的CHM (REP-1)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (3847)..(4054)
&lt;223&gt; bGH poly(A) 信号
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (4104)..(4233)
&lt;223&gt; 3' ITR
&lt;400&gt; 27
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260
agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320
cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380
tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440
ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500
cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560
ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620
caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680
aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740
aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800
gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860
agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920
gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160
ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220
taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280
ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400
cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460
taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520
ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580
ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640
ctccttttta tttgggggag agggaagtca tgaaaaaact aacctttgaa attcgatctc 5700
cagcacatca gcaaaacgct attcacgcag tacagcaaat ccttccagac ccaaccaaac 5760
caatcgtagt aaccattcag gaacgcaacc gcagcttaga ccaaaacagg aagctatggg 5820
cctgcttagg tgacgtctct cgtcaggttg aatggcatgg tcgctggctg gatgcagaaa 5880
gctggaagtg tgtgtttacc gcagcattaa agcagcagga tgttgttcct aaccttgccg 5940
ggaatggctt tgtggtaata ggccagtcaa ccagcaggat gcgtgtaggc gaatttgcgg 6000
agctattaga gcttatacag gcattcggta cagagcgtgg cgttaagtgg tcagacgaag 6060
cgagactggc tctggagtgg aaagcgagat ggggagacag ggctgcatga taaatgtcgt 6120
tagtttctcc ggtggcagga cgtcagcata tttgctctgg ctaatggagc aaaagcgacg 6180
ggcaggtaaa gacgtgcatt acgttttcat ggatacaggt tgtgaacatc caatgacata 6240
tcggtttgtc agggaagttg tgaagttctg ggatataccg ctcaccgtat tgcaggttga 6300
tatcaacccg gagcttggac agccaaatgg ttatacggta tgggaaccaa aggatattca 6360
gacgcgaatg cctgttctga agccatttat cgatatggta aagaaatatg gcactccata 6420
cgtcggcggc gcgttctgca ctgacagatt aaaactcgtt cccttcacca aatactgtga 6480
tgaccatttc gggcgaggga attacaccac gtggattggc atcagagctg atgaaccgaa 6540
gcggctaaag ccaaagcctg gaatcagata tcttgctgaa ctgtcagact ttgagaagga 6600
agatatcctc gcatggtgga agcaacaacc attcgatttg caaataccgg aacatctcgg 6660
taactgcata ttctgcatta aaaaatcaac gcaaaaaatc ggacttgcct gcaaagatga 6720
ggagggattg cagcgtgttt ttaatgaggt catcacggga tcccatgtgc gtgacggaca 6780
tcgggaaacg ccaaaggaga ttatgtaccg aggaagaatg tcgctggacg gtatcgcgaa 6840
aatgtattca gaaaatgatt atcaagccct gtatcaggac atggtacgag ctaaaagatt 6900
cgataccggc tcttgttctg agtcatgcga aatatttgga gggcagcttg atttcgactt 6960
cgggagggaa gctgcatgat gcgatgttat cggtgcggtg aatgcaaaga agataaccgc 7020
ttccgaccaa atcaacctta ctggaatcga tggtgtctcc ggtgtgaaag aacaccaaca 7080
ggggtgttac cactaccgca ggaaaaggag gacgtgtggc gagacagcga cgaagtatca 7140
ccgacataat ctgcgaaaac tgcaaatacc ttccaacgaa acgcaccaga aataaaccca 7200
agccaatccc aaaagaatct gacgtaaaaa ccttcaacta cacggctcac ctgtgggata 7260
tccggtggct aagacgtcgt gcgaggaaaa caaggtgatt gaccaaaatc gaagttacga 7320
acaagaaagc gtcgagcgag ctttaacgtg cgctaactgc ggtcagaagc tgcatgtgct 7380
ggaagttcac gtgtgtgagc actgctgcgc agaactgatg agcgatccga atagctcgat 7440
gcacgaggaa gaagatgatg gctaaaccag cgcgaagacg atgtaaaaac gatgaatgcc 7500
gggaatggtt tcaccctgca ttcgctaatc agtggtggtg ctctccagag tgtggaacca 7560
agatagcact cgaacgacga agtaaagaac gcgaaaaagc ggaaaaagca gcagagaaga 7620
aacgacgacg agaggagcag aaacagaaag ataaacttaa gattcgaaaa ctcgccttaa 7680
agccccgcag ttactggatt aaacaagccc aacaagccgt aaacgccttc atcagagaaa 7740
gagaccgcga cttaccatgt atctcgtgcg gaacgctcac gtctgctcag tgggatgccg 7800
gacattaccg gacaactgct gcggcacctc aactccgatt taatgaacgc aatattcaca 7860
agcaatgcgt ggtgtgcaac cagcacaaaa gcggaaatct cgttccgtat cgcgtcgaac 7920
tgattagccg catcgggcag gaagcagtag acgaaatcga atcaaaccat aaccgccatc 7980
gctggactat cgaagagtgc aaggcgatca aggcagagta ccaacagaaa ctcaaagacc 8040
tgcgaaatag cagaagtgag gccgcatgac gttctcagta aaaaccattc cagacatgct 8100
cgttgaagca tacggaaatc agacagaagt agcacgcaga ctgaaatgta gtcgcggtac 8160
ggtcagaaaa tacgttgatg ataaagacgg gaaaatgcac gccatcgtca acgacgttct 8220
catggttcat cgcggatgga gtgaaagaga tgcgctatta cgaaaaaatt gatggcagca 8280
aataccgaaa tatttgggta gttggcgatc tgcacggatg ctacacgaac ctgatgaaca 8340
aactggatac gattggattc gacaacaaaa aagacctgct tatctcggtg ggcgatttgg 8400
ttgatcgtgg tgcagagaac gttgaatgcc tggaattaat cacattcccc tggttcagag 8460
ctgtacgtgg aaaccatgag caaatgatga ttgatggctt atcagagcgt ggaaacgtta 8520
atcactggct gcttaatggc ggtggctggt tctttaatct cgattacgac aaagaaattc 8580
tggctaaagc tcttgcccat aaagcagatg aacttccgtt aatcatcgaa ctggtgagca 8640
aagataaaaa atatgttatc tgccacgccg attatccctt tgacgaatac gagtttggaa 8700
agccagttga tcatcagcag gtaatctgga accgcgaacg aatcagcaac tcacaaaacg 8760
ggatcgtgaa agaaatcaaa ggcgcggaca cgttcatctt tggtcatacg ccagcagtga 8820
aaccactcaa gtttgccaac caaatgtata tcgataccgg cgcagtgttc tgcggaaacc 8880
taacattgat tcaggtacag ggagaaggcg catgagactc gaaagcgtag ctaaatttca 8940
ttcgccaaaa agcccgatga tgagcgactc accacgggcc acggcttctg actctctttc 9000
cggtactgat gtgatggctg ctatggggat ggcgcaatca caagccggat tcggtatggc 9060
tgcattctgc ggtaagcacg aactcagcca gaacgacaaa caaaaggcta tcaactatct 9120
gatgcaattt gcacacaagg tatcggggaa ataccgtggt gtggcaaagc ttgaaggaaa 9180
tactaaggca aaggtactgc aagtgctcgc aacattcgct tatgcggatt attgccgtag 9240
tgccgcgacg ccgggggcaa gatgcagaga ttgccatggt acaggccgtg cggttgatat 9300
tgccaaaaca gagctgtggg ggagagttgt cgagaaagag tgcggaagat gcaaaggcgt 9360
cggctattca aggatgccag caagcgcagc atatcgcgct gtgacgatgc taatcccaaa 9420
ccttacccaa cccacctggt cacgcactgt taagccgctg tatgacgctc tggtggtgca 9480
atgccacaaa gaagagtcaa tcgcagacaa cattttgaat gcggtcacac gttagcagca 9540
tgattgccac ggatggcaac atattaacgg catgatattg acttattgaa taaaattggg 9600
taaatttgac tcaacgatgg gttaattcgc tcgttgtggt agtgagatga aaagaggcgg 9660
cgcttactac cgattccgcc tagttggtca cttcgacgta tcgtctggaa ctccaaccat 9720
cgcaggcaga gaggtctgca aaatgcaatc ccgaaacagt tcgcaggtaa tagttagagc 9780
ctgcataacg gtttcgggat tttttatatc tgcacaacag gtaagagcat tgagtcgata 9840
atcgtgaaga gtcggcgagc ctggttagcc agtgctcttt ccgttgtgct gaattaagcg 9900
aataccggaa gcagaaccgg atcaccaaat gcgtacaggc gtcatcgccg cccagcaaca 9960
gcacaaccca aactgagccg tagccactgt ctgtcctgaa ttcattagta atagttacgc 10020
tgcggccttt tacacatgac cttcgtgaaa gcgggtggca ggaggtcgcg ctaacaacct 10080
cctgccgttt tgcccgtgca tatcggtcac gaacaaatct gattactaaa cacagtagcc 10140
tggatttgtt ctatcagtaa tcgaccttat tcctaattaa atagagcaaa tccccttatt 10200
gggggtaaga catgaagatg ccagaaaaac atgacctgtt ggccgccatt ctcgcggcaa 10260
aggaacaagg catcggggca atccttgcgt ttgcaatggc gtaccttcgc ggcagatata 10320
atggcggtgc gtttacaaaa acagtaatcg acgcaacgat gtgcgccatt atcgcctggt 10380
tcattcgtga ccttctcgac ttcgccggac taagtagcaa tctcgcttat ataacgagcg 10440
tgtttatcgg ctacatcggt actgactcga ttggttcgct tatcaaacgc ttcgctgcta 10500
aaaaagccgg agtagaagat ggtagaaatc aataatcaac gtaaggcgtt cctcgatatg 10560
ctggcgtggt cggagggaac tgataacgga cgtcagaaaa ccagaaatca tggttatgac 10620
gtcattgtag gcggagagct atttactgat tactccgatc accctcgcaa acttgtcacg 10680
ctaaacccaa aactcaaatc aacaggcgca gcttttagaa aaactcatcg agcatcaaat 10740
gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 10800
gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 10860
ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 10920
ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 10980
tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 11040
tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 11100
cgctgttaaa aggacaatta caaacaggaa tcgagtgcaa ccggcgcagg aacactgcca 11160
gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aacgctgttt 11220
ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 11280
tggtcggaag tggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 11340
cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 11400
acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 11460
ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 11520
tcatattctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 11580
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt acaaccaatt 11640
aaccaattct gaacattatc gcgagcccat ttatacctga atatggctca taacacccct 11700
tgtttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 11760
aaacgccgta gcgccgatgg tagtgtgggg actccccatg cgagagtagg gaactgccag 11820
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgcccgg gctaattagg 11880
gggtgtcgcc cttattcgac tctataggga agttcctatt ctctagaaag tataggaact 11940
tctgaagggg ggtcgatcga cttaattaag g 11971
&lt;210&gt; 28
&lt;211&gt; 6900
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1)..(130)
&lt;223&gt; 5' ITR
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (241)..(544)
&lt;223&gt; CMV增强子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (546)..(823)
&lt;223&gt; 鸡β肌动蛋白启动子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (824)..(1795)
&lt;223&gt; CBA外显子1和内含子
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1859)..(1864)
&lt;223&gt; kozak
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (1865)..(3826)
&lt;223&gt; 人密码子优化的CHM (REP-1)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (3847)..(4054)
&lt;223&gt; bGH poly(A) 信号
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (4104)..(4233)
&lt;223&gt; 3' ITR
&lt;400&gt; 28
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260
agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320
cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380
tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440
ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500
cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560
ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620
caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680
aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740
aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800
gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860
agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920
gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160
ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220
taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280
ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400
cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460
taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520
ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580
ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640
cttttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 5700
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 5760
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 5820
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 5880
gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 5940
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6000
ttgcgcctga gcgaggcgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 6060
cgagtgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 6120
atattcttct aatacctgga acgctgtttt tccggggatc gcagtggtga gtaaccatgc 6180
atcatcagga gtacggataa aatgcttgat ggtcggaagt ggcataaatt ccgtcagcca 6240
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 6300
aaacaactct ggcgcatcgg gcttcccata caagcgatag attgtcgcac ctgattgccc 6360
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 6420
cggcctcgac gtttcccgtt gaatatggct catattcttc ctttttcaat attattgaag 6480
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 6540
acaaataggg gtcagtgtta caaccaatta accaattctg aacattatcg cgagcccatt 6600
tatacctgaa tatggctcat aacacccctt gtttgcctgg cggcagtagc gcggtggtcc 6660
cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt agtgtgggga 6720
ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc tcagtcgaaa 6780
gactgggcct ttcgcccggg ctaattaggg ggtgtcgccc ttattcgact ctatagggaa 6840
gttcctattc tctagaaagt ataggaactt ctgaaggggg gtcgatcgac ttaattaagg 6900
&lt;210&gt; 29
&lt;211&gt; 12074
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 构建的序列
&lt;400&gt; 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
atggcggata ctctcccttc ggagtttgat gtgatcgtaa tagggacggg tttgcctgaa 1920
tccatcattg cagctgcatg ttcaagaagt ggccggagag ttctgcatgt tgattcaaga 1980
agctactatg gaggaaactg ggccagtttt agcttttcag gactattgtc ctggctaaag 2040
gaataccagg aaaacagtga cattgtaagt gacagtccag tgtggcaaga ccagatcctt 2100
gaaaatgaag aagccattgc tcttagcagg aaggacaaaa ctattcaaca tgtggaagta 2160
ttttgttatg ccagtcagga tttgcatgaa gatgtcgaag aagctggtgc actgcagaaa 2220
aatcatgctc ttgtgacatc tgcaaactcc acagaagctg cagattctgc cttcctgcct 2280
acggaggatg agtcattaag cactatgagc tgtgaaatgc tcacagaaca aactccaagc 2340
agcgatccag agaatgcgct agaagtaaat ggtgctgaag tgacagggga aaaagaaaac 2400
cattgtgatg ataaaacttg tgtgccatca acttcagcag aagacatgag tgaaaatgtg 2460
cctatagcag aagataccac agagcaacca aagaaaaaca gaattactta ctcacaaatt 2520
attaaagaag gcaggagatt taatattgat ttagtatcaa agctgctgta ttctcgagga 2580
ttactaattg atcttctaat caaatctaat gttagtcgat atgcagagtt taaaaatatt 2640
accaggattc ttgcatttcg agaaggacga gtggaacagg ttccgtgttc cagagcagat 2700
gtctttaata gcaaacaact tactatggta gaaaagcgaa tgctaatgaa atttcttaca 2760
ttttgtatgg aatatgagaa atatcctgat gaatataaag gatatgaaga gatcacattt 2820
tatgaatatt taaagactca aaaattaacc cccaacctcc aatatattgt catgcattca 2880
attgcaatga catcagagac agccagcagc accatagatg gtctcaaagc taccaaaaac 2940
tttcttcact gtcttgggcg gtatggcaac actccatttt tgtttccttt atatggccaa 3000
ggagaactcc cccagtgttt ctgcaggatg tgtgctgtgt ttggtggaat ttattgtctt 3060
cgccattcag tacagtgcct tgtagtggac aaagaatcca gaaaatgtaa agcaattata 3120
gatcagtttg gtcagagaat aatctctgag catttcctcg tggaggacag ttactttcct 3180
gagaacatgt gctcacgtgt gcaatacagg cagatctcca gggcagtgct gattacagat 3240
agatctgtcc taaaaacaga ttcagatcaa cagatttcca ttttgacagt gccagcagag 3300
gaaccaggaa cttttgctgt tcgggtcatt gagttatgtt cttcaacgat gacatgcatg 3360
aaaggcacct atttggttca tttgacttgc acatcttcta aaacagcaag agaagattta 3420
gaatcagttg tgcagaaatt gtttgttcca tatactgaaa tggagataga aaatgaacaa 3480
gtagaaaagc caagaattct gtgggctctt tacttcaata tgagagattc gtcagacatc 3540
agcaggagct gttataatga tttaccatcc aacgtttatg tctgctctgg cccagattgt 3600
ggtttaggaa atgataatgc agtcaaacag gctgaaacac ttttccagga aatctgcccc 3660
aatgaagatt tctgtccccc tccaccaaat cctgaagaca ttatccttga tggagacagt 3720
ttacagccag aggcttcaga atccagtgcc ataccagagg ctaactcgga gactttcaag 3780
gaaagcacaa accttggaaa cctagaggag tcctctgaat aaggatctgc ctcgactgtg 3840
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 3900
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 3960
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 4020
gacaatagca ggcatgctgg ggactcgagt tctacgtaga taagtagcat ggcgggttaa 4080
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4140
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4200
cagtgagcga gcgagcgcgc agccttaatt aacctaagga aaatgaagtg aagttcctat 4260
actttctaga gaataggaac ttctatagtg agtcgaataa gggcgacaca aaatttattc 4320
taaatgcata ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt 4380
gacatgtata attttgatat caaaaactga ttttcccttt attattttcg agatttattt 4440
tcttaattct ctttaacaaa ctagaaatat tgtatataca aaaaatcata aataatagat 4500
gaatagttta attataggtg ttcatcaatc gaaaaagcaa cgtatcttat ttaaagtgcg 4560
ttgctttttt ctcatttata aggttaaata attctcatat atcaagcaaa gtgacaggcg 4620
cccttaaata ttctgacaaa tgctctttcc ctaaactccc cccataaaaa aacccgccga 4680
agcgggtttt tacgttattt gcggattaac gattactcgt tatcagaacc gcccaggggg 4740
cccgagctta acctttttat ttgggggaga gggaagtcat gaaaaaacta acctttgaaa 4800
ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc cttccagacc 4860
caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac caaaacagga 4920
agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt cgctggctgg 4980
atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat gttgttccta 5040
accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg cgtgtaggcg 5100
aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc gttaagtggt 5160
cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg gctgcatgat 5220
aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc taatggagca 5280
aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt gtgaacatcc 5340
aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc tcaccgtatt 5400
gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat gggaaccaaa 5460
ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa agaaatatgg 5520
cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc ccttcaccaa 5580
atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca tcagagctga 5640
tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac tgtcagactt 5700
tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc aaataccgga 5760
acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg gacttgcctg 5820
caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat cccatgtgcg 5880
tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt cgctggacgg 5940
tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca tggtacgagc 6000
taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag ggcagcttga 6060
tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga atgcaaagaa 6120
gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg gtgtgaaaga 6180
acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg agacagcgac 6240
gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa cgcaccagaa 6300
ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac acggctcacc 6360
tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg accaaaatcg 6420
aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg gtcagaagct 6480
gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga gcgatccgaa 6540
tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga tgtaaaaacg 6600
atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc tctccagagt 6660
gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg gaaaaagcag 6720
cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag attcgaaaac 6780
tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta aacgccttca 6840
tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg tctgctcagt 6900
gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt aatgaacgca 6960
atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc gttccgtatc 7020
gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa tcaaaccata 7080
accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac caacagaaac 7140
tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa aaaccattcc 7200
agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac tgaaatgtag 7260
tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg ccatcgtcaa 7320
cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac gaaaaaattg 7380
atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc tacacgaacc 7440
tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt atctcggtgg 7500
gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc acattcccct 7560
ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta tcagagcgtg 7620
gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc gattacgaca 7680
aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta atcatcgaac 7740
tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt gacgaatacg 7800
agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga atcagcaact 7860
cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt ggtcatacgc 7920
cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc gcagtgttct 7980
gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg aaagcgtagc 8040
taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca cggcttctga 8100
ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac aagccggatt 8160
cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac aaaaggctat 8220
caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg tggcaaagct 8280
tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt atgcggatta 8340
ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta caggccgtgc 8400
ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt gcggaagatg 8460
caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg tgacgatgct 8520
aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt atgacgctct 8580
ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg cggtcacacg 8640
ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga cttattgaat 8700
aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta gtgagatgaa 8760
aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat cgtctggaac 8820
tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt cgcaggtaat 8880
agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg taagagcatt 8940
gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc cgttgtgctg 9000
aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg tcatcgccgc 9060
ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat tcattagtaa 9120
tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag gaggtcgcgc 9180
taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg attactaaac 9240
acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa tagagcaaat 9300
ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg gccgccattc 9360
tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg taccttcgcg 9420
gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg tgcgccatta 9480
tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat ctcgcttata 9540
taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt atcaaacgct 9600
tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg taaggcgttc 9660
ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac cagaaatcat 9720
ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca ccctcgcaaa 9780
cttgtcacgc taaacccaaa actcaaatca acaggcgctt aagactggcc gtcgttttac 9840
aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt 9900
ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc 9960
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 10020
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 10080
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 10140
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 10200
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 10260
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 10320
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 10380
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 10440
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 10500
ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt 10560
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10620
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10680
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10740
aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 10800
agtcagcgta atgctctgct tttagaaaaa ctcatcgagc atcaaatgaa actgcaattt 10860
attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga 10920
aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac 10980
tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga 11040
gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagtttat gcatttcttt 11100
ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa 11160
accgttattc attcgtgatt gcgcctgagc gaggcgaaat acgcgatcgc tgttaaaagg 11220
acaattacaa acaggaatcg agtgcaaccg gcgcaggaac actgccagcg catcaacaat 11280
attttcacct gaatcaggat attcttctaa tacctggaac gctgtttttc cggggatcgc 11340
agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagtgg 11400
cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct 11460
acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca agcgatagat 11520
tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc 11580
catgttggaa tttaatcgcg gcctcgacgt ttcccgttga atatggctca tattcttcct 11640
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 11700
atgtatttag aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa 11760
cattatcgcg agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg 11820
gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg 11880
ccgatggtag tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa 11940
cgaaaggctc agtcgaaaga ctgggccttt cgcccgggct aattaggggg tgtcgccctt 12000
attcgactct atagtgaagt tcctattctc tagaaagtat aggaacttct gaagtggggt 12060
cgacttaatt aagg 12074

Claims (59)

1.编码Rab护航蛋白-1(REP-1)的密码子优化的cDNA序列。
2.包含权利要求1的cDNA序列的表达盒。
3.权利要求2的表达盒,包含SEQ ID NO: 1。
4.腺相关病毒(AAV)载体,包含AAV衣壳和含有AAV反向末端重复序列的核酸序列和编码人Rab护航蛋白-1(REP-1)的核酸序列,以及引导REP-1在宿主细胞中的表达的表达控制序列。
5.权利要求4的病毒载体,其中该REP-1序列编码全长REP-1蛋白。
6.权利要求4或5的病毒载体,其中该REP-1序列编码SEQ ID NO: 2的蛋白序列。
7.权利要求4-6中任一项的病毒载体,其中该REP-1序列包含SEQ ID NO: 3的核酸序列或其变体。
8.权利要求7的病毒载体,其中所述变体是SEQ ID NO: 3的密码子优化的变体,优化以便在人内表达。
9.权利要求8的病毒载体,其中密码子优化的变体是SEQ ID NO: 1。
10.编码环核苷酸门控制型通道α3(CNGA3)的密码子优化的cDNA序列。
11.包含权利要求10的cDNA序列的表达盒。
12.权利要求11的表达盒 ,包含SEQ ID NO: 9或11。
13.腺相关病毒(AAV)载体,包含AAV衣壳和含有AAV反向末端重复序列的核酸序列和编码人环核苷酸门控制型通道α3(CNGA3)的核酸序列,以及引导CNGA3在宿主细胞中的表达的表达控制序列。
14.权利要求13的病毒载体,其中该CNGA3序列编码全长蛋白。
15.权利要求13或14的病毒载体,其中该CNGA3序列编码SEQ ID NO: 10的蛋白序列。
16.权利要求13-15中任一项的病毒载体,其中该CNGA3序列包含SEQ ID NO: 13的核酸序列或其变体。
17.权利要求16的病毒载体,其中该变体是SEQ ID NO: 13的密码子优化的变体,优化以便在人内表达。
18.权利要求17的病毒载体,其中密码子优化的变体是SEQ ID NO: 9或SEQ ID NO:11。
19.权利要求4至9或13至18中任一项的病毒载体,其中该表达控制序列包含启动子。
20.权利要求19的病毒载体,其中该启动子是视紫红质启动子。
21.权利要求19的病毒载体,其中该启动子是视紫红质激酶启动子。
22.权利要求19的病毒载体,其中该启动子是眼细胞特异性启动子。
23.权利要求19的病毒载体,其中该启动子选自人EF1α启动子、代谢型谷氨酸受体6(mGluR6)启动子、视紫红质启动子、视锥视蛋白启动子和转录因子启动子(神经视网膜亮氨酸拉链(Nrl)和光感受器特异性核受体Nr2e3, bZIP)。
24.根据权利要求19所述的AAV,其中该启动子是诱导型启动子、组成型启动子或组织特异性启动子。
25.根据权利要求24所述的AAV,其中该启动子是诱导型启动子,其选自雷帕霉素/雷帕霉素类似物启动子、蜕皮激素启动子、雌激素响应启动子和四环素响应启动子或异二聚体阻遏开关。
26.权利要求4至9或13至25中任一项的病毒载体,进一步包含内含子、Kozak序列、polyA和转录后调节元件中的一种或多种。
27.权利要求4至9或13至26中任一项的病毒载体,其中该载体是具有选自AAV2、AAV5、AAV8、AAV9、AAV8bp、AAV7m8及其变体的衣壳的rAAV。
28.权利要求4至9或13至27中任一项的病毒载体,其中该ITR序列来自不同于供应该衣壳蛋白的AAV。
29.权利要求4至9或13至28中任一项的病毒载体,其中该ITR序列来自AAV2。
30.包含AAV8衣壳和重组(rAAV)基因组的腺相关病毒(AAV)载体,其中所述rAAV基因组包含编码REP-1的核酸序列、反向末端重复序列和引导REP-1在宿主细胞中的表达的表达控制序列。
31.包含AAV8衣壳和表达盒的腺相关病毒(AAV)载体,其中所述表达盒包含编码CNGA3的核酸序列、反向末端重复序列和引导CNGA3在宿主细胞中的表达的表达控制序列。
32.药物组合物,包含药学上可接受载剂和至少一种根据权利要求4至9或13至31中任一项所述的病毒载体。
33.治疗无脉络膜症的方法,所述方法包括向需要其的受试者施用权利要求32的组合物。
34.治疗全色盲的方法,所述方法包括向需要其的受试者施用权利要求32的组合物。
35.根据权利要求33或34所述的方法,其中所述组合物视网膜下施用。
36.根据权利要求33或34所述的方法,其中所述组合物玻璃体内、静脉内或脉络膜施用。
37.根据权利要求33至36中任一项所述的方法,其中所述受试者是哺乳动物。
38.根据权利要求37所述的方法,其中所述受试者是人。
39.根据权利要求33至38中任一项所述的方法,其中所述组合物与另一疗法结合施用。
40.根据权利要求33至39中任一项所述的方法,其中所述组合物以大约109至大约1013载体基因组(VG)的剂量施用。
41.根据权利要求33至40中任一项所述的方法,其中所述组合物以大约100 µL至大约500 µL的体积施用。
42.根据权利要求33至41中任一项所述的方法,其中所述组合物施用超过一次。
43.用于生产AAV载体的质粒,所述质粒包含SEQ ID NO: 1或SEQ ID NO: 9或SEQ IDNO: 25或SEQ ID NO: 26或SEQ ID NO: 27或SEQ ID NO: 28或与之共享至少80%的同一性的序列。
44.生成rAAV病毒的方法,包括在足够的病毒序列的存在下培养携带权利要求43的质粒的包装细胞,以允许将所述基因表达盒病毒基因组包装到感染性AAV包膜或衣壳中。
45.根据权利要求44的方法生产的重组AAV。
46.病毒载体,包含含有SEQ ID NO: 25、SEQ ID NO: 26、SEQ ID NO: 27或SEQ ID NO:28的nt 1至4233的载体基因组。
47.包含载体基因组的病毒载体,所述载体基因组包含5' ITR、CMV增强子、鸡β肌动蛋白启动子、CBA外显子1和内含子、Kozak序列、密码子优化的CHM、bGH poly A和3' ITR。
48.用于治疗无脉络膜症的方法的组合物,所述组合物包含权利要求4至9、13至32或46至47中任一项的病毒载体。
49.用于治疗全色盲的方法的组合物,所述组合物包含权利要求4至9、13至32或46至47中任一项的病毒载体。
50.根据权利要求48或49所述的组合物,所述组合物视网膜下施用。
51.根据权利要求48或49所述的组合物,所述组合物玻璃体内、静脉内或脉络膜施用。
52.根据权利要求48至51中任一项所述的组合物,其中所述受试者是哺乳动物。
53.根据权利要求52所述的组合物,其中所述受试者是人。
54.根据权利要求48至53中任一项所述的组合物,所述组合物与另一疗法结合施用。
55.根据权利要求48至54中任一项所述的组合物,所述组合物以大约109至大约1013载体基因组(VG)的剂量施用。
56.根据权利要求48至55中任一项所述的组合物,所述组合物以大约100 µL至大约500µL的体积施用。
57.根据权利要求48至56中任一项所述的组合物,所述组合物施用超过一次。
58.权利要求4至9、13至32或46至47中任一项的病毒载体在用于治疗无脉络膜症的药物的制造中的用途。
59.权利要求4至9、13至32或46至47中任一项的病毒载体在用于治疗全色盲的药物的制造中的用途。
CN201680081801.2A 2015-12-14 2016-12-13 用于眼病的基因疗法 Active CN109069668B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562266789P 2015-12-14 2015-12-14
US62/266789 2015-12-14
PCT/US2016/066402 WO2017106202A2 (en) 2015-12-14 2016-12-13 Gene therapy for ocular disorders

Publications (2)

Publication Number Publication Date
CN109069668A true CN109069668A (zh) 2018-12-21
CN109069668B CN109069668B (zh) 2023-04-18

Family

ID=58455636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680081801.2A Active CN109069668B (zh) 2015-12-14 2016-12-13 用于眼病的基因疗法

Country Status (13)

Country Link
US (2) US11090392B2 (zh)
EP (2) EP3795180A1 (zh)
JP (2) JP7057281B2 (zh)
KR (1) KR20180099719A (zh)
CN (1) CN109069668B (zh)
AU (1) AU2016370487C1 (zh)
BR (1) BR112018011838A2 (zh)
CA (1) CA3008264A1 (zh)
ES (1) ES2826384T3 (zh)
HK (1) HK1258518A1 (zh)
MX (2) MX2018007230A (zh)
RU (1) RU2762747C2 (zh)
WO (1) WO2017106202A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889859A (zh) * 2019-11-11 2020-03-17 珠海上工医信科技有限公司 一种用于眼底图像血管分割的u型网络

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3795180A1 (en) * 2015-12-14 2021-03-24 The Trustees Of The University Of Pennsylvania Gene therapy for ocular disorders
US9877990B2 (en) * 2016-04-08 2018-01-30 Krystal Biotech, Inc. Compositions and methods for the treatment of wounds, disorders, and diseases of the skin
KR102621134B1 (ko) * 2016-07-26 2024-01-04 코넬 유니버시티 알데히드 데히드로게나제 결핍의 치료를 위한 유전자 요법
JP2020527335A (ja) * 2017-06-14 2020-09-10 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 眼疾患のための遺伝子療法
BR112023015303A2 (pt) 2021-02-01 2023-11-14 Regenxbio Inc Método para tratar doença cln2 devido a deficiência de tpp1 em um sujeito
KR20230160829A (ko) 2021-02-26 2023-11-24 로직바이오 테라퓨틱스, 인크. 재조합 aav 벡터의 제조 및 사용
EP4314028A1 (en) 2021-04-02 2024-02-07 Krystal Biotech, Inc. Viral vectors for cancer therapy
WO2023014892A1 (en) * 2021-08-04 2023-02-09 Alpine Biotherapeutics Corporation Sustainable ocular cell-mediated intraocular delivery of cellular therapeutics for treatment of ocular diseases or disorders

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011034947A2 (en) * 2009-09-15 2011-03-24 University Of Washington Reagents and methods for modulating cone photoreceptor activity
WO2012114090A1 (en) * 2011-02-22 2012-08-30 Isis Innovation Limited Aav -vectors for use in gene therapy of choroideremia
US20130317091A1 (en) * 2011-01-07 2013-11-28 Guo-jie Ye Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
WO2015092440A1 (en) * 2013-12-20 2015-06-25 Oxford Biomedica (Uk) Limited Viral vector production system
WO2015160893A1 (en) * 2014-04-15 2015-10-22 Applied Genetic Technologies Corporation Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US6268213B1 (en) 1992-06-03 2001-07-31 Richard Jude Samulski Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy
US5869305A (en) 1992-12-04 1999-02-09 The University Of Pittsburgh Recombinant viral vector system
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US6204059B1 (en) 1994-06-30 2001-03-20 University Of Pittsburgh AAV capsid vehicles for molecular transfer
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US5741683A (en) 1995-06-07 1998-04-21 The Research Foundation Of State University Of New York In vitro packaging of adeno-associated virus DNA
US6548286B1 (en) 1997-04-14 2003-04-15 Cell Genesys, Inc. Methods for increasing the efficiency of recombinant AAV product
EP1080218A1 (en) 1998-05-27 2001-03-07 University of Florida Method of preparing recombinant adeno-associated virus compositions by using an iodixanol gradient
AU780231B2 (en) 1998-11-10 2005-03-10 University Of North Carolina At Chapel Hill, The Virus vectors and methods of making and administering the same
ES2478635T3 (es) 1999-08-09 2014-07-22 Targeted Genetics Corporation Incremento de la expresión de una secuencia de nucleótidos heteróloga monocatenaria de vectores virales recombinantes diseñando la secuencia de modo que forma pares de bases intracatenarios
ATE438414T1 (de) 2000-06-01 2009-08-15 Univ North Carolina Verfahren und zusammensetzungen zur kontrollierter abgabe von rekombinant parvovirus vektoren
WO2002057454A2 (en) 2001-01-19 2002-07-25 Incyte Genomics, Inc. Receptors and membrane-associated proteins
CA2442670A1 (en) 2001-04-13 2002-10-24 The Trustees Of The University Of Pennsylvania Method of treating or retarding the development of blindness
ES2258601T3 (es) 2001-11-13 2006-09-01 The Trustees Of The University Of Pennsylvania Un metodo para la identificacion de las secuencias desconocidas del virus adeno-asociado (vaa) y un kit para el metodo.
EP3517134B1 (en) 2001-12-17 2024-01-17 The Trustees of the University of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same and uses therefor
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
EP1486567A1 (en) 2003-06-11 2004-12-15 Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts Improved adeno-associated virus (AAV) vector for gene therapy
CN1856576B (zh) 2003-09-30 2011-05-04 宾夕法尼亚州立大学托管会 腺伴随病毒(aav)进化支、序列、含有这些序列的载体及它们的应用
EP2359865B1 (en) 2005-04-07 2013-10-02 The Trustees of The University of Pennsylvania Method of increasing the function of an AAV vector
WO2006132118A1 (ja) 2005-06-09 2006-12-14 Matsushita Electric Industrial Co., Ltd. 振幅誤差補償装置及び直交度誤差補償装置
EP2007795B1 (en) 2006-03-30 2016-11-16 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid proteins
WO2010005533A2 (en) 2008-06-30 2010-01-14 The Johns Hopkins University Compositions and methods for the treatment of ocular oxidative stress and retinitis pigmentosa
US20110305772A1 (en) 2009-02-26 2011-12-15 The Johns Hopkins University Compositions and methods for ex vivo hepatic nucleic acid delivery
RU2444977C2 (ru) * 2009-08-03 2012-03-20 Федеральное государственное учреждение "МОСКОВСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ГЛАЗНЫХ БОЛЕЗНЕЙ ИМЕНИ ГЕЛЬМГОЛЬЦА ФЕДЕРАЛЬНОГО АГЕНТСТВА ПО ВЫСОКОТЕХНОЛОГИЧНОЙ МЕДИЦИНСКОЙ ПОМОЩИ" Способ диагностики ахроматопсии
AU2011238708B2 (en) 2010-03-29 2016-02-11 The Trustees Of The University Of Pennsylvania Pharmacologically Induced Transgene Ablation system
US9315825B2 (en) 2010-03-29 2016-04-19 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
WO2012158757A1 (en) 2011-05-16 2012-11-22 The Trustees Of The University Of Pennsylvania Proviral plasmids for production of recombinant adeno-associated virus
FR2977562B1 (fr) 2011-07-06 2016-12-23 Gaztransport Et Technigaz Cuve etanche et thermiquement isolante integree dans une structure porteuse
WO2013063601A1 (en) * 2011-10-28 2013-05-02 University Of Florida Research Foundation, Inc. Chimeric promoter for cone photoreceptor targeted gene therapy
US20140314740A1 (en) 2011-12-09 2014-10-23 The Johns Hopkins University Compositions and methods for the prevention or treatment of diabetic complications
CA2868398A1 (en) 2012-04-02 2013-10-10 Moderna Therapeutics, Inc. Modified polynucleotides for the production of cosmetic proteins and peptides
AU2013287281B2 (en) 2012-07-11 2018-04-26 The Trustees Of The University Of Pennsylvania AAV-mediated gene therapy for RPGR x-linked retinal degeneration
CA2881081C (en) 2012-08-08 2017-04-18 Nihon Parkerizing Co., Ltd. Metal surface treatment liquid, surface treatment method for metal base, and metal base obtained thereby
DK2954051T3 (da) 2013-02-08 2019-07-08 Univ Pennsylvania Modificeret kapsid til genoverførsel til behandling af nethinden
US10494645B2 (en) 2013-04-18 2019-12-03 Fondazione Telethon Effective delivery of large genes by dual AAV vectors
CN105764531A (zh) 2013-05-16 2016-07-13 应用遗传科技公司 用于治疗色盲和其它疾病的启动子、表达盒、载体、药盒和方法
US10000741B2 (en) 2014-03-17 2018-06-19 Adverum Biotechnologies, Inc. Compositions and methods for enhanced gene expression in cone cells
US20160206704A1 (en) * 2015-01-16 2016-07-21 Isis Innovation Limited Method
EP3795180A1 (en) * 2015-12-14 2021-03-24 The Trustees Of The University Of Pennsylvania Gene therapy for ocular disorders

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011034947A2 (en) * 2009-09-15 2011-03-24 University Of Washington Reagents and methods for modulating cone photoreceptor activity
US20130317091A1 (en) * 2011-01-07 2013-11-28 Guo-jie Ye Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
CN103608455A (zh) * 2011-01-07 2014-02-26 应用遗传科技公司 用于治疗色盲和其它疾病的启动子、表达盒、载体、药盒和方法
WO2012114090A1 (en) * 2011-02-22 2012-08-30 Isis Innovation Limited Aav -vectors for use in gene therapy of choroideremia
WO2015092440A1 (en) * 2013-12-20 2015-06-25 Oxford Biomedica (Uk) Limited Viral vector production system
WO2015160893A1 (en) * 2014-04-15 2015-10-22 Applied Genetic Technologies Corporation Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALUN R. BARNARD等: "Gene Therapy for Choroideremia Using an Adeno-Associated Viral (AAV) Vector", 《COLD SPRING HARB PERSPECT MED》 *
TANYA TOLMACHOVA等: "Functional expression of Rab escort protein 1 following AAV2-mediated gene delivery in the retina of choroideremia mice and human cells ex vivo", 《J MOL MED》 *
TOSHI NAGATA等: "Codon Optimization Effect on Translational Efficiency of DNA Vaccine in Mammalian Cells: Analysis of Plasmid DNA Encoding a CTL Epitope Derived from Microorganisms", 《BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS》 *
VIDYULLATHA VASIREDDY等: "AAV-Mediated Gene Therapy for Choroideremia: Preclinical Studies in Personalized Models", 《PLOS ONE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889859A (zh) * 2019-11-11 2020-03-17 珠海上工医信科技有限公司 一种用于眼底图像血管分割的u型网络

Also Published As

Publication number Publication date
EP3795180A1 (en) 2021-03-24
EP3389724B1 (en) 2020-07-01
US11090392B2 (en) 2021-08-17
KR20180099719A (ko) 2018-09-05
WO2017106202A2 (en) 2017-06-22
JP7057281B2 (ja) 2022-04-19
BR112018011838A2 (pt) 2018-12-04
EP3389724A2 (en) 2018-10-24
MX2022010959A (es) 2022-10-07
RU2018125468A (ru) 2020-01-16
WO2017106202A3 (en) 2017-08-31
RU2018125468A3 (zh) 2020-10-22
CA3008264A1 (en) 2017-06-22
AU2016370487A1 (en) 2018-07-05
ES2826384T3 (es) 2021-05-18
MX2018007230A (es) 2018-11-09
CN109069668B (zh) 2023-04-18
RU2762747C2 (ru) 2021-12-22
US20210330816A1 (en) 2021-10-28
US20200061209A1 (en) 2020-02-27
AU2016370487B2 (en) 2021-08-05
JP2022088656A (ja) 2022-06-14
AU2016370487C1 (en) 2022-03-03
HK1258518A1 (zh) 2019-11-15
JP2019502378A (ja) 2019-01-31

Similar Documents

Publication Publication Date Title
CN109069668B (zh) 用于眼病的基因疗法
AU2018211212B2 (en) Treatment of amd using AAV sFlt-1
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
KR101470472B1 (ko) 장기 지속형 약물 제형
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
CN107466325A (zh) 多重载体系统及其应用
KR0153005B1 (ko) 제조합 마레크병 바이러스
PT1984512T (pt) Sistema de expressão génica utilizando excisão-união em insetos
KR101591887B1 (ko) 장기 지속형 약물 제형
CN114230677B (zh) 含有猪瘟E2和圆环病毒的Cap的重组蛋白及其制备方法和应用
US20220193262A1 (en) High efficiency gene delivery system
KR102545070B1 (ko) 안구 장애에 대한 유전자 치료
CA2502664A1 (en) Sirna mediated gene silencing in transgenic animals
CN112203697A (zh) 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途
KR20210049131A (ko) 재조합 인간 II형 미토콘드리아 다이네인-유사 GTPase의 유전자 서열 및 이의 용도
CN111500635B (zh) 一种包含携带核酸分子的载体的试剂盒
WO2002038613A2 (en) Modified recombinase
CN113106124B (zh) 表达cyp4v2的aav载体及其用途
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
CN116801912A (zh) 表达载体组合物
CN117304307A (zh) 一种治疗新生血管相关眼底疾病的aav药物
CN117642432A (zh) 用于诱导免疫耐受的合成蛋白
CN114854791A (zh) 一种新型CRISPR-Cas9系统载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant