CN113897396A - 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用 - Google Patents

一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用 Download PDF

Info

Publication number
CN113897396A
CN113897396A CN202111105263.5A CN202111105263A CN113897396A CN 113897396 A CN113897396 A CN 113897396A CN 202111105263 A CN202111105263 A CN 202111105263A CN 113897396 A CN113897396 A CN 113897396A
Authority
CN
China
Prior art keywords
expression cassette
intron
gene
aav
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111105263.5A
Other languages
English (en)
Other versions
CN113897396B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinfan Biomedical Technology Wuhan Co ltd
Original Assignee
Wuhan Brainvta Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Brainvta Science And Technology Co ltd filed Critical Wuhan Brainvta Science And Technology Co ltd
Priority to CN202111105263.5A priority Critical patent/CN113897396B/zh
Priority to PCT/CN2021/120828 priority patent/WO2023039936A1/zh
Priority to JP2023504515A priority patent/JP2023544947A/ja
Priority to EP21952111.9A priority patent/EP4180522A4/en
Priority to AU2021456512A priority patent/AU2021456512A1/en
Publication of CN113897396A publication Critical patent/CN113897396A/zh
Application granted granted Critical
Publication of CN113897396B publication Critical patent/CN113897396B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0601Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14111Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
    • C12N2710/14141Use of virus, viral particle or viral elements as a vector
    • C12N2710/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/103Plasmid DNA for invertebrates
    • C12N2800/105Plasmid DNA for invertebrates for insects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/50Vectors comprising a special translation-regulating system utilisation of non-ATG initiation codon
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明属于基因工程技术领域,公开了一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用,该表达盒包含从5’至3’的、可操作连接的:能够在昆虫细胞中驱动转录的启动子;人工构建序列;仅缺少第一个翻译起始密码子的重叠开放阅读框;其中,人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的内含子,内含子中包含ATG,或者内含子位于ATG中任意相邻两个核苷酸之间。本发明包含该表达盒的重组腺相关病毒载体利用设计的内含子序列,通过内含子剪接作用,调控VP1、VP2和VP3蛋白相对表达,以及Rep78和Rep52蛋白的相对表达,可在昆虫细胞中大规模生产具有高包装率和感染性的rAAV。

Description

一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表 达盒及其应用
技术领域
本发明属于基因工程技术领域,更具体地,涉及一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用。
背景技术
腺相关病毒(adeno-associated virus,AAV),也称腺伴随病毒,属于微小病毒科依赖病毒属,是目前发现的一类结构最简单的单链DNA缺陷型病毒,需要辅助病毒(通常为腺病毒)参与复制。重组腺相关病毒(rAAV)由于具有宿主范围广、免疫原性低、安全性高、可介导外源基因在动物体内长期稳定表达等特点,是目前基因治疗领域最具应用前景的载体之一。随着第一种重组腺相关病毒(rAAV)介导的基因治疗药物的批准,对大规模AAV载体制造技术的需求不断增加(Yla-Herttuala S.,2012,Mol Ther,20:1831-1832)。
目前,生产rAAV的体系主要有两大类:一种是利用哺乳动物细胞(如293细胞、COS细胞、HeLa细胞、KB细胞等)的常规生产体系;另一种是利用昆虫细胞的生产体系。在哺乳动物细胞生产体系中,单个细胞的rAAV颗粒产量低,并且培养中极可能存在污染的风险,这限制了rAAV在哺乳动物细胞中的大规模生产及应用。重组腺相关病毒基因组中cap基因编码病毒VP衣壳蛋白,包括三种结构蛋白,分别为VP1、VP2和VP3,来自野生型病毒的AAV中VP1、VP2和VP3的化学计量比约为1:1:10,这样的化学计量比对于重组AAV的获得是很重要的。在哺乳动物细胞培养系统中,取得了三种AAV衣壳蛋白(VP1、VP2和VP3)的约为1:1:10的化学计量比,这依赖于哺乳动物细胞内含子两个剪接受体序列的交替使用以及对于VP2次优起始密码子ACG的使用。然而,由于哺乳动物细胞和昆虫细胞中内含子剪接机制的差异,在哺乳动物细胞中出现的表达策略不会在昆虫细胞中复制,从而导致野生型AAV在昆虫细胞中无法包装成合适的衣壳。
为了克服上述问题,Urabe等人开发出了昆虫细胞生产体系,将VP1的起始密码子AUG替换为次优起始密码子ACG,构建一个单一的多顺反子mRNA,该多顺反子mRNA不需要剪接即可表达所有三种AAV2的VP蛋白(Urabe等,2002,Hum Gene Ther,13:1935-1943)。然而AAV的血清型众多且与日俱增,Urabe等人的改造方法并不适用于所有血清型,例如Urabe等人使用ACG作为VP1衣壳蛋白起始密码子的杆状病毒系统中产生的AAV5颗粒具有不佳的感染性。在中国专利CN106544325A提供的方法中使用不同的次优起始密码子CTG加强VP1的表达,尽管这种设计提高了AAV5颗粒的感染性,但这种方法在调节VP1/VP2/VP3相对含量方面缺乏灵活性;同时,该方法似乎也缺乏血清型特异性序列调整所必须的灵活性。在中国专利CN101522903A提供的方法中通过将包含有polh启动子序列的人工内含子插入到VP1的开放阅读框中,利用两个启动子分别表达VP1和VP2/VP3,该设计虽然也能实现VP1/VP2/VP3在同一阅读框中表达,但该方法同样不能有效调节VP1/VP2/VP3相对量,且在不同血清型中VP1/VP2/VP3的相对表达量差异较大,导致生产效率较低。
在AAV昆虫细胞生产体系中,Urabe等人构建了Rep78和Rep52两个独立的表达盒,并插入在同一个杆状病毒载体中。由于Rep78的低表达有利于AAV的包装,Rep52使用了Polh启动子,Rep78则使用了相对Polh启动子启动活性较弱的△IE1启动子(Urabe等,2002,HumGene Ther,13:1935-1943)。然而,有研究发现,Urabe等人开发的AAV Rep蛋白表达方法存在杆状病毒载体传代不稳定的问题,为了解决这一问题,中国专利CN 103849629 A公开了一种昆虫细胞中产生AAV的方法,将AAV Rep78蛋白的翻译起始密码子替换成ACG,该方法虽然能实现在同一阅读框的Rep78和Rep52蛋白的表达,但缺乏对Rep78和Rep52蛋白相对表达的调控作用。
因此,开发能够在昆虫细胞中稳定和大规模地生产重组腺相关病毒的手段和方法是非常必要的。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用。本发明利用内含子选择性剪接调控作用,在转录后加工过程中对VP1蛋白编码序列的翻译起始密码子AUG选择性的保留、缺失或形成,在昆虫细胞中实现cap基因重叠开放阅读框中VP蛋白(VP1/VP2/VP3)按照正确的化学计量表达;同样地,利用内含子选择性剪接调控作用,在转录后加工过程中对Rep78蛋白编码序列的翻译起始密码子AUG选择性的保留、缺失或形成,在昆虫细胞中实现rep基因重叠开放阅读框中Rep蛋白(Rep78/Rep52)以合适的比例表达;旨在解决昆虫细胞中稳定和大规模生产具有较高包装率和感染活性的各种血清型的重组腺相关病毒的问题。
为实现上述目的,本发明提供了一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒,其包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的内含子,所述内含子中包含翻译起始密码子ATG,或者所述内含子位于ATG中的任意相邻两个核苷酸之间;
在转录后加工过程中,通过内含子的选择性剪接作用,使得所述人工构建序列中的翻译起始密码子AUG保留或缺失,或者在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
优选地,所述人工构建序列包含从5’至3’的、可操作连接的:
所述内含子的5’部分;
翻译起始密码子ATG;
所述内含子的3’部分;
编码2A自剪切多肽的核苷酸序列。
优选地,所述2A自剪切多肽为T2A肽、P2A肽、E2A肽或F2A肽。
优选地,所述人工构建序列包含从5’至3’的、可操作连接的:
第一内含子的5’部分;
翻译起始密码子ATG;
第二内含子的5’部分;
所述内含子的3’部分;
其中,所述第二内含子的5’部分内部有终止密码子,所述终止密码子与所述翻译起始密码子ATG之间的核苷酸数为3的倍数。
优选地,所述内含子的5’端核苷酸为GTNN,所述内含子的3’端核苷酸为NNAG,其中N为A、T、C、G四种核苷酸中的任意一种。
优选地,所述包含重叠开放阅读框的基因为AAV的cap基因或AAV的rep基因。
优选地,所述启动子为polh启动子或p10启动子。
优选地,所述包含重叠开放阅读框的基因为AAV的cap基因,所述启动子为p10启动子。
优选地,所述包含重叠开放阅读框的基因为AAV的rep基因,所述启动子为polh启动子。
按照本发明的另一方面,提供了一种核酸分子,其包含第一表达盒,所述第一表达盒为上述表达盒。
优选地,所述核酸分子还包含第二表达盒,所述第二表达盒为上述表达盒,且所述第二表达盒表达的基因与所述第一表达盒表达的基因不同。
优选地,所述第二表达盒相对于所述第一表达盒为反义方向。
优选地,所述第二表达盒相对于所述第一表达盒为正义方向。
优选地,所述核酸分子还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列。
优选地,所述外源基因为报告基因,所述报告基因为氯霉素乙酰转移酶编码基因、β-半乳糖苷酶编码基因、β-葡萄糖醛酸酶编码基因、海肾荧光素酶编码基因、碱性磷酸酶编码基因、萤火虫荧光素酶编码基因、绿色荧光蛋白编码基因和红色荧光蛋白编码基因中的至少一种。
优选地,所述外源基因为编码药物多肽的基因,所述药物多肽为脂蛋白酯酶、载脂蛋白、细胞因子、白细胞介素和干扰素中的至少一种。
按照本发明的另一方面,提供了一种载体,其包含上述表达盒。
优选地,所述载体为昆虫细胞相容性载体。
优选地,所述载体为质粒和病毒中的至少一种。
按照本发明的另一方面,提供了上述载体在昆虫细胞中制备重组腺相关病毒的应用。
按照本发明的另一方面,提供了上述载体在体外制备AAV衣壳中的应用,所述包含重叠开放阅读框的基因为AAV的cap基因。
按照本发明的另一方面,提供了一种昆虫细胞,其包含上述表达盒。
优选地,所述表达盒被整合至所述昆虫细胞的基因组中。
优选地,所述昆虫细胞为草地贪夜蛾细胞、粉纹夜蛾细胞、果蝇细胞或蚊子细胞。
按照本发明的另一方面,提供了一种细胞培养物,其包含上述昆虫细胞和培养基。
优选地,所述培养基中包含AAV基因组。
按照本发明的另一方面,提供了一种重组腺相关病毒粒子,其是在能产生重组腺相关病毒粒子的条件下培养上述昆虫细胞,然后回收制得的。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
(1)本发明表达盒可用于在昆虫细胞中表达由包含重叠开放阅读框的基因编码的多种多肽,例如重组腺相关病毒的VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52),不需要改变野生型AAV中VP1蛋白编码序列或Rep78蛋白编码序列的原始起始密码子ATG,通过人工设计内含子序列,调控VP蛋白(VP1、VP2、VP3)或Rep蛋白(Rep78、Rep52)以合适比例表达,实现在昆虫细胞中稳定和大规模生产重组腺相关病毒;本发明不同于中国专利CN 101522903A中在VP1蛋白开放阅读框中的翻译起始密码子下游插入昆虫细胞内含子,并在该内含子中插入启动子,利用四个启动子(两个p10和两个polh启动子)分别转录翻译VP1、VP2/VP3、Rep78和Rep52蛋白;本发明提供的内含子选择性剪接调控策略,是利用内含子的剪接作用,对转录后的mRNA进行选择性剪接,获得合适比例的两种或多种mRNA,分别翻译成VP1、VP2/VP3、Rep78和Rep52蛋白,本发明提供的方法能更有效控制VP1、VP2和VP3蛋白的化学计量比例以及Rep78/Rep52的相对表达。
(2)本发明利用内含子选择性剪接策略,实现在昆虫细胞中生产重组腺相关病毒,并且适用于各种AAV血清型,使得制备rAAV的灵活性更强,应用范围更广。
(3)本发明将AAV的cap基因、rep基因和带有外源基因的ITR核心表达元件构建在同一重组杆状病毒载体中,用该载体转染昆虫宿主细胞,可以稳定、高产量生产重组AAV病毒粒子;并且通过调整cap基因表达盒中的内含子序列,可以调节VP1与VP2/VP3的相对表达量,获得不同VP1并入量的病毒粒子,从而调控rAAV病毒的感染活性以期达到不同需求。
附图说明
图1为本发明野生型AAV中cap基因和rep基因表达调控示意图。
图2为本发明实施例1中cap基因表达盒I表达调控示意图,其中,内容A为cap基因表达盒I DNA链示意图;内容B为在转录后加工过程中包含有第一个起始密码子AUG的内含子未发生剪接时VP1蛋白翻译表达的示意图;内容C为在转录后加工过程中包含有第一个起始密码子AUG的内含子发生剪接后VP2、VP3蛋白翻译表达的示意图。
图3为本发明实施例3中cap基因表达盒II表达调控示意图,其中,内容A为cap基因表达盒II DNA链示意图;内容B为在转录后加工过程中第一内含子和第二内含子均未发生剪接时VP蛋白翻译提前终止的示意图;内容C为在转录后加工过程中第二内含子发生剪接后VP1蛋白翻译表达的示意图;内容D为在转录后加工过程中第一内含子发生剪接后VP2、VP3蛋白翻译表达的示意图。
图4为本发明实施例5中cap基因表达盒III表达调控示意图,其中,内容A为cap基因表达盒III DNA链示意图;内容B为在转录后加工过程中内含子没有被剪除时VP2、VP3蛋白翻译表达的示意图;内容C为在转录后加工过程中内含子被剪除后VP1蛋白翻译表达的示意图。
图5为本发明实施例2中rep基因表达盒I表达调控示意图,其中,内容A为rep基因表达盒I DNA链示意图;内容B为在转录后加工过程中包含有第一个起始密码子AUG的内含子未发生剪接时Rep78蛋白翻译表达的示意图;内容C为在转录后加工过程中包含有第一个起始密码子AUG的内含子发生剪接后Rep52蛋白翻译表达的示意图;
图6为本发明实施例4中rep基因表达盒II表达调控示意图,其中,内容A为rep基因表达盒II DNA链示意图;内容B为在转录后加工过程中第一内含子和第二内含子均未发生剪接时VP蛋白翻译提前终止的示意图;内容C为在转录后加工过程中第二内含子发生剪接后Rep78蛋白翻译表达的示意图;内容D为在转录后加工过程中第一内含子发生剪接后Rep52蛋白翻译表达的示意图;
图7为本发明实施例6中rep基因表达盒III表达调控示意图,其中,内容A为rep基因表达盒III DNA链示意图;内容B为在转录后加工过程中内含子没有发生剪接时Rep52蛋白翻译表达的示意图;内容C为在转录后加工过程中内含子发生剪接后Rep78蛋白翻译表达的示意图。
图8为本发明实施例7中包含有cap基因表达盒I的重组杆状病毒载体Ac1、Ac2、Ac3、Ac4以及对比例制备的重组杆状病毒载体Ac0表达VP蛋白的Western Blot检测图。
图9为本发明实施例7中包含有rep基因表达盒I的重组杆状病毒载体Ac5表达Rep蛋白的Western Blot检测图。
图10为本发明实施例7中包含有cap基因表达盒II的重组杆状病毒载体Ac6、Ac7以及对比例制备的重组杆状病毒载体Ac0表达VP蛋白的Western Blot检测图。
图11为本发明实施例7中包含有rep基因表达盒II的重组杆状病毒载体Ac8表达Rep蛋白的Western Blot检测图。
图12为本发明实施例7中包含有cap基因表达盒III的重组杆状病毒载体Ac9、Ac10以及对比例制备的重组杆状病毒载体Ac0表达VP蛋白的Western Blot检测图。
图13为本发明实施例7中包含有rep基因表达盒III的重组杆状病毒载体Ac11表达Rep蛋白的Western Blot检测图。
图14A、14B和14C为本发明实施例10中重组AAV杆粒CRI-0、CRI-1、CRI-2、CRI-3、CRI-4、CRI-5、CRI-6、CRI-7和CRI-8转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE的银染检测图,显示了三种衣壳蛋白VP1/VP2/VP3。
图15为本发明实施例10中重组AAV杆粒CRI-0、CRI-1、CRI-2、CRI-3、CRI-4、CRI-5、CRI-6、CRI-7和CRI-8转染宿主细胞后,纯化的重组AAV病毒粒子感染293T细胞的效果图。
图16A、16B和16C为本发明实施例11中重组AAV杆粒CRI-9、CRI-10、CRI-11、CRI-12、CRI-13、CRI-14、CRI-15、CRI-16和CRI-17转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE的银染检测图,显示了三种衣壳蛋白VP1/VP2/VP3。
图17为本发明实施例11中重组AAV杆粒CRI-9、CRI-10、CRI-11、CRI-12、CRI-13、CRI-14、CRI-15、CRI-16和CRI-17转染宿主细胞后,纯化的重组AAV病毒粒子感染293T细胞的效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
术语解释
正如本文所用的,术语“可操作连接”是指多核苷酸(或多肽)序列以功能性关系的连接。当两段核苷酸序列置于功能性关系时,这两段核苷酸序列是“可操作连接”的。例如,转录调控序列(例如启动子)如果影响某基因编码序列的转录,则其与该基因编码序列可操作连接。
术语“表达盒”是指包含引入宿主细胞时可操作连接的编码序列和调控序列的核酸构建体,分别导致RNA或多肽的转录和/或翻译。表达盒应理解为包括允许转录开始的启动子、目的基因开放阅读框和转录终止子。通常,启动子序列置于目的基因上游,与目的基因的距离与表达控制相容。
术语“开放阅读框”(Open Reading Frame,ORF)是结构基因的正常核苷酸序列,具有编码蛋白质或多肽的潜能,从起始密码子开始,结束于终止密码子,其间不存在使翻译中断的终止密码子。在一条mRNA链上,核糖体从起始密码子开始翻译,沿着mRNA序列合成多肽链并不断延伸,遇到终止密码子时,多肽链的延伸反应终止。
术语“载体”是指设计用于转运、转移和/或存储遗传物质,以及表达遗传物质和/或将遗传物质整合到宿主细胞染色体DNA中的核酸分子,例如质粒载体、粘粒载体、人工染色体、噬菌体载体和其他病毒载体。载体通常由至少三个基本单元组成,即复制源、选择标记和多克隆位点。
术语“内含子”又称间隔顺序,指一个基因或mRNA分子中无编码作用的片段,是真核生物细胞DNA中的间插序列。内含子序列被转录在mRNA前体中,经过剪接被去除,最终不存在于成熟mRNA分子中。根据剪接过程为自发还是要经过剪接体的加工,将内含子分为自剪接内含子和剪接体内含子。自剪接内含子是一种特殊的内含子,是一种核酶,可以通过自身作用被切除,来离开mRNA。本发明涉及的内含子是剪接体内含子,这类内含子的剪除要有剪接体的帮助,内含子序列两端有剪接供体序列和剪接受体序列,是切断和重接位点处两旁的序列。剪接体是由核小RNA(small nuclearRNA,snRNA)和蛋白质因子动态组成的核糖核蛋白复合体,剪接体识别mRNA前体的剪接位点并催化剪接反应,将内含子完全剪除,上下游RNA序列再重新连接。
术语“AAV血清型”:自AAV被发现以来,目前已经从腺病毒、人或灵长类动物和一些哺乳动物分离出超过100种AAV血清型或突变体,其中被应用的主要是AAV1-9。不同血清型的rAAV载体主要区别为衣壳蛋白的不同。不同的AAV血清型在感染效率和组织特异性方面存在一定的差异。
所有已知腺相关病毒血清型的基因组结构非常相似,AAV是单链DNA病毒,基因组结构简单,全长约4.7kb,如图1所示,其基因组中包含rep基因表达盒、cap基因表达盒和位于基因组两端的AAV反向末端重复序列(inverted terminal repeats,ITR)。ITR是基因组两端的125个核苷酸的回文结构,能形成一个自我互补的倒T型发卡结构,是DNA复制起始和包装重组AAV基因组为感染性的病毒颗粒所需的顺式作用元件。AAV作为缺陷型病毒,在没有辅助病毒的存在下不能够独立复制,因此AAV只能定点整合在宿主细胞染色体中,呈潜伏状态。在辅助病毒存在的情况下,rep基因表达量增加可以将整合在宿主细胞染色体中的AAV基因组拯救出来,大量复制得到AAV DNA,单链的rAAV基因组在VP衣壳蛋白的作用下被包装成具有感染性的病毒粒子。Cap基因编码结构性的VP衣壳蛋白,其包含3个重叠开放阅读框,分别编码VP1、VP2、VP3三种类型的亚基,VP1、VP2和VP3含有不同的起始密码子,共用一个终止密码子,VP1和VP2共享VP3序列。VP1的N端具有一个保守的磷脂酶A2序列,该序列与病毒从体内逃逸有关,并对其感染性至关重要;VP2蛋白对于组装或者感染并非比不可少;VP3蛋白的核心由保守的β-桶基序组成,决定了不同血清型AAV与宿主细胞作用受体的差异。野生型AAV中三种蛋白的正确比例为3:3:54,约为1:1:10。Rep基因编码Rep78、Rep68、Rep52和Rep40四个重叠的多功能蛋白,Rep78和Rep68蛋白参与AAV的复制及整合,可以和ITR中的特定序列结合;Rep52和Rep40蛋白具有解旋酶和ATP酶的活性,在参与单链基因组的复制同时也参与病毒的装配。无论是在哺乳动物细胞中,还是在昆虫细胞中,编码Rep78和Rep52蛋白的未剪接的mRNA足以满足制备rAAV的需求。
本发明提到的核酸分子可以是DNA分子,也可以是RNA分子。本领域技术人员已知,RNA序列与DNA序列基本相似或具有一定程度的序列同一性,DNA序列中的胸腺嘧啶(T)可被认为等同于RNA序列中的尿嘧啶(U)。
本发明提到的内含子可以是天然内含子,也可以是经过人工改造的内含子,且其在昆虫细胞内具有剪接活性,但其来源不局限于昆虫细胞。
本发明提供的一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的内含子,所述内含子中包含翻译起始密码子ATG,或者所述内含子位于ATG中的任意相邻两个核苷酸之间;
在转录后加工过程中,通过内含子的选择性剪接作用,使得所述人工构建序列中的翻译起始密码子AUG保留或缺失,或者在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
一些实施例中,利用内含子选择性剪接作用,包含有内含子的表达盒可用于昆虫细胞中AAV VP衣壳蛋白的正确表达或Rep蛋白的优势表达,其中,cap基因中的重叠开放阅读框编码AAV衣壳蛋白VP1、VP2和VP3;rep基因中的重叠开放阅读框编码Rep78和Rep52蛋白。
一些实施例中,利用内含子选择性剪接作用,包含有内含子的表达盒可用于昆虫细胞中表达多种猿猴病毒40(SV40)的VP衣壳蛋白。SV40是具有5.2kb共价闭环的环状基因组的双链DNA病毒,其同样包含三种衣壳蛋白VP1、VP2和VP3,VP3蛋白是VP2蛋白的截短形式,VP3和VP2共用终止密码子,VP1编码序列的5’部分与VP2、VP3编码序列的3’部分重叠,但不具有相同的开放阅读框。在哺乳细胞中,这些VP蛋白的表达受到内含子剪接机制的调控。本发明表达盒用于在昆虫细胞中表达SV40衣壳蛋白时,该表达盒中仅缺少第一个翻译起始密码子的ORF为仅缺少VP2蛋白翻译起始密码子ATG的VP蛋白编码序列,VP2、VP3蛋白的相对表达调控可利用本发明内含子剪接策略实现。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的cap基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少VP1蛋白翻译起始密码子ATG的VP蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
内含子的5’部分;
翻译起始密码子ATG;
内含子的3’部分;
编码2A自剪切多肽的核苷酸序列。
本发明对野生型AAV VP1蛋白编码序列自身N端的内含子剪接位点进行突变,使得昆虫细胞中的剪接体无法识别该剪接位点,起始密码子ATG上游的内含子的5’部分(剪接供体序列或剪接受体序列)和ATG下游的内含子的3’部分(剪接受体序列或剪接供体序列)形成完整内含子剪接位点,如图2所示,在转录后加工过程中,若昆虫细胞中的剪接体识别该内含子剪接位点并催化剪接反应,则去除mRNA最前端AUG-起始位点,核糖体从5’至3’识别VP2蛋白的起始密码子时,VP2蛋白得以翻译表达,由于VP2起始密码子是次优密码子ACG,会造成核糖体扫描泄露,于是VP3蛋白得以翻译表达;若内含子剪接位点没有被识别,AUG-起始位点没有被去除,则mRNA从第一个AUG处翻译,VP1蛋白表达。通过内含子具有一定概率的剪接作用,控制衣壳蛋白VP1、VP2和VP3的相对表达量。但是,当VP1蛋白翻译表达时,从mRNA第一个AUG起始密码子到VP1蛋白N端序列之间的一段额外序列(即内含子序列的一部分)也会被翻译,而影响VP1蛋白的正常表达,因此,本发明提供的表达盒中引入了2A自剪切多肽(2Aself-cleaving peptides)的编码序列。
2A自剪切多肽是一类长18-22个氨基酸残基的肽片段,能诱导细胞内含有2A肽的重组蛋白自我剪切。这种肽都有一段的序列模体,经常会在最后甘氨酸(G)和脯氨酸(P)连接处导致核糖体无法连接,从而造成“剪切”的效果,使得2A自剪切多肽C端与VP1蛋白N端断开,以得到正常的VP1蛋白。根据不同病毒来源,目前共有四种常用的2A肽:T2A、P2A、E2A和F2A,其氨基酸序列分别如SEQ ID No.36至SEQ ID No.39所示,以上四种2A肽都可以应用于本发明技术方案中,本发明的实施例以T2A为例。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的cap基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少VP1蛋白翻译起始密码子ATG的VP蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
第一内含子的5’部分;
翻译起始密码子ATG;
第二内含子的5’部分;
内含子的3’部分;
其中,所述第二内含子的5’部分内部有终止密码子,该终止密码子可以是TAA、TAG或TGA,终止密码子与所述翻译起始密码子ATG之间的核苷酸数为3的倍数。
本发明对野生型AAV VP1蛋白编码序列自身N端的内含子剪接位点进行突变,使得昆虫细胞中的剪接体无法识别该剪接位点,起始密码子ATG上游的第一内含子的5’部分和ATG下游的内含子的3’部分形成完整的第一内含子剪接位点,ATG下游的第二内含子的5’部分和内含子的3’部分形成完整的第二内含子剪接位点,如图3所示,在转录后加工过程中,若昆虫细胞中的剪接体识别第一内含子剪接位点并催化剪接反应,则去除mRNA最前端AUG-起始位点,核糖体从5’至3’识别VP2蛋白的起始密码子时,VP2蛋白得以翻译表达,由于VP2起始密码子是次优密码子ACG,会造成核糖体扫描泄露,于是VP3蛋白得以翻译表达;若昆虫细胞中的剪接体识别第二内含子剪接位点并催化剪接反应,AUG-起始位点没有被去除,则mRNA从第一个AUG处翻译,VP1蛋白表达;若昆虫细胞中的剪接体既没有剪接第一内含子剪接位点,又没有剪接第二内含子剪接位点,mRNA从第一个AUG开始翻译,到第二内含子的5’部分内部的终止密码子即终止,翻译提前终止,不翻译VP1、VP2和VP3蛋白。通过不同内含子不同概率的剪接作用,控制衣壳蛋白VP1、VP2和VP3的相对表达量。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的cap基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少VP1蛋白翻译起始密码子ATG的VP蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
腺嘌呤核苷酸(A),所述内含子,胸腺嘧啶核苷酸(T)和鸟嘌呤核苷酸(G);
或者腺嘌呤核苷酸(A),胸腺嘧啶核苷酸(T),所述内含子和鸟嘌呤核苷酸(G)。
本发明对野生型AAV VP1蛋白编码序列自身N端的内含子剪接位点进行突变,使得昆虫细胞中的剪接体无法识别该剪接位点,如图4所示(图中以内含子插入ATG的AT之间为例),在转录后加工过程中,若昆虫细胞中的剪接体识别VP1蛋白翻译起始密码子AUG中插入的内含子剪接位点并催化剪接反应,内含子发生剪切,则形成完整的AUG翻译起始位点,mRNA从第一个AUG处翻译,VP1蛋白表达;若内含子剪接位点没有被识别,内含子没有发生剪切,则不能形成完整的AUG翻译起始位点,核糖体从5’至3’识别VP2蛋白的起始密码子时,VP2蛋白得以翻译表达,由于VP2起始密码子是次优密码子ACG,会造成核糖体扫描泄露,于是VP3蛋白得以翻译表达。通过内含子具有一定概率的剪接作用,控制衣壳蛋白VP1、VP2和VP3的相对表达量。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的rep基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少Rep78蛋白翻译起始密码子ATG的Rep蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
内含子的5’部分;
翻译起始密码子ATG;
内含子的3’部分;
编码2A自剪切多肽的核苷酸序列。
本发明对野生型AAV Rep78蛋白编码序列中Rep52蛋白翻译起始密码子上游的可能的一个或多个翻译起始位点进行突变,使得昆虫细胞中的核糖体无法识别这些位点,翻译起始密码子ATG上游的内含子的5’部分和ATG下游的内含子的3’部分形成完整内含子剪接位点,如图5所示,在转录后加工过程中,若昆虫细胞中的剪接体识别该内含子剪接位点并催化剪接反应,则去除mRNA最前端AUG-起始位点,核糖体从5’至3’识别Rep52蛋白的起始密码子,Rep52蛋白得以翻译表达;若内含子剪接位点没有被识别,AUG-起始位点没有被去除,则mRNA从第一个AUG处翻译,由于2A自剪切多肽具有自剪切功能,从2A自剪切多肽的C端断裂释放出Rep78蛋白。通过内含子具有一定概率的剪接作用,控制Rep78蛋白和Rep52蛋白的相对表达量。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的rep基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少Rep78蛋白翻译起始密码子ATG的Rep蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
第一内含子的5’部分;
翻译起始密码子ATG;
第二内含子的5’部分;
内含子的3’部分;
其中,所述第二内含子的5’部分内部有终止密码子,该终止密码子可以是TAA、TAG或TGA,终止密码子与所述翻译起始密码子ATG之间的核苷酸数为3的倍数。
本发明对野生型AAV Rep78蛋白编码序列中Rep52蛋白翻译起始密码子上游的可能的一个或多个翻译起始位点进行突变,使得昆虫细胞中的核糖体无法识别这些位点,翻译起始密码子ATG上游的第一内含子的5’部分和ATG下游的内含子的3’部分形成完整的第一内含子剪接位点,ATG下游的第二内含子的5’部分和内含子的3’部分形成完整的第二内含子剪接位点,如图6所示,在转录后加工过程中,若昆虫细胞中的剪接体识别第一内含子剪接位点并催化剪接反应,则去除mRNA最前端AUG-起始位点,核糖体从5’至3’识别Rep52蛋白的起始密码子时,Rep52蛋白得以翻译表达;若昆虫细胞中的剪接体识别第二内含子剪接位点并催化剪接反应,AUG-起始位点没有被去除,则mRNA从第一个AUG处翻译,Rep78蛋白表达;若昆虫细胞中的剪接体既没有剪接第一内含子剪接位点,又没有剪接第二内含子剪接位点,mRNA从第一个AUG开始翻译,到第二内含子的5’部分内部的终止密码子即终止,翻译提前终止,不翻译Rep78和Rep52蛋白。通过不同内含子不同概率的剪接作用,控制Rep78蛋白和Rep52蛋白的相对表达量。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的rep基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少Rep78蛋白翻译起始密码子ATG的Rep蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:
腺嘌呤核苷酸(A),所述内含子,胸腺嘧啶核苷酸(T)和鸟嘌呤核苷酸(G);
或者腺嘌呤核苷酸(A),胸腺嘧啶核苷酸(T),所述内含子和鸟嘌呤核苷酸(G)。
本发明对野生型AAV Rep78蛋白编码序列中Rep52蛋白翻译起始密码子上游的可能的一个或多个翻译起始位点进行突变,使得昆虫细胞中的核糖体无法识别这些位点,如图7所示(图中以内含子插入ATG的AT之间为例),在转录后加工过程中,若昆虫细胞中的剪接体识别Rep78蛋白翻译起始密码子AUG中插入的内含子剪接位点并催化剪接反应,内含子发生剪切,则形成完整的AUG翻译起始位点,mRNA从第一个AUG处翻译,Rep78蛋白表达;若内含子剪接位点没有被识别,内含子没有发生剪切,则不能形成完整的AUG翻译起始位点,核糖体从5’至3’识别Rep52蛋白的起始密码子,Rep52蛋白得以翻译表达。通过内含子具有一定概率的剪接作用,控制Rep78蛋白和Rep52蛋白的相对表达量。
一些实施例中,优选地,所述内含子的5’端核苷酸为GTNN,所述内含子的3’端核苷酸为NNAG,其中N代表A、T、C、G四种核苷酸中的任意一种。更具体地,所述第一内含子的5’端和第二内含子的5’端核苷酸均为GTNN,所述内含子的3’端核苷酸为NNAG,这样可调控VP1、VP2和VP3蛋白以更接近化学计量比进行翻译表达,有利于包装成合适的衣壳;同样地,使得Rep78蛋白翻译表达量较Rep52蛋白的低,有利于较高的载体产量。
一些实施例中,所述内含子的核苷酸序列为SEQ ID No.2、SEQ ID No.3、SEQ IDNo.4、SEQ ID No.5、SEQ ID No.15、SEQ ID No.16、SEQ ID No.20或SEQ ID No.21所示的序列。本领域技术人员可知的,所述内含子序列的变化形式可用于本发明技术方案。在某些结构中,可使用与本发明内含子核苷酸序列具有相似性的序列,例如,其5’端具有与序列GTAAGTATCG至少40%或50%或60%或70%或80%或90%同一性的序列,或者其5’端具有与序列GTAAGTATTC至少40%或50%或60%或70%或80%或90%同一性的序列;或者其3’端具有与序列CCTTTTCCTTTTTTTTTCAG至少40%或50%或60%或70%或80%或90%同一性的序列,或者其3’端具有与序列AAACATTATTTATTTTGCAG至少40%或50%或60%或70%或80%或90%同一性的序列,或者其3’端具有与序列CATTTTGGATATTGTTTCAG至少40%或50%或60%或70%或80%或90%同一性的序列。
一些实施例中,cap基因编码的VP衣壳蛋白可以是任意AAV血清型的衣壳蛋白,例如AAV血清2型、AAV血清5型、AAV血清8型、AAV血清9型等等,本发明涉及的内含子序列及剪接策略适用于现有的多种AAV血清型的VP衣壳蛋白的正确表达。
一些实施例中,能够在昆虫细胞中驱动cap基因和rep基因转录的启动子可以为polh启动子或p10启动子。优选地,cap基因表达盒采用p10启动子,rep基因表达盒采用polh启动子。
本发明还提供一种核酸分子,包含上述cap基因表达盒和/或rep基因表达盒。核酸可以包含以串联即以相同极性或以反义方向排列的表达盒,因此,cap基因表达盒可以相对于rep基因表达盒为反义方向,也可以相对于rep基因表达盒为正义方向。
本发明还提供一种重组腺相关病毒载体,优选为昆虫细胞相容的载体,其包含cap基因表达盒和rep基因表达盒,该cap基因表达盒优选本发明构建的表达盒,rep基因表达盒优选本发明构建的基因表达盒。应当理解的是,该rAAV载体还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列,ITR作用于AAV的复制包装及定点整合,帮助载体在宿主细胞中形成稳定的环状多聚体和类染色质结构,从而能在宿主细胞中长期稳定存在,外源基因也能持续稳定表达。所述外源基因可以为至少一个编码感兴趣的基因(Gene ofInterest,GOI)产物的核苷酸序列,所述感兴趣的基因产物可以是治疗性基因产物,具体可以是多肽、RNA分子(siRNA)或其他基因产物,例如但不限于脂蛋白酯酶、载脂蛋白、细胞因子、白细胞介素或干扰素;也可以是评估载体转化和表达的报告蛋白,例如但不限于荧光蛋白(绿色荧光蛋白GFP、红色荧光蛋白RFP)、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡萄糖醛酸酶、海肾荧光素酶、萤火虫荧光素酶或碱性磷酸酶。
另一方面,本发明还提供上述重组腺相关病毒载体在昆虫细胞中制备重组腺相关病毒的应用,将该载体导入昆虫细胞中可以实现VP1、VP2、VP3蛋白按照正确的化学计量比1:1:10表达,从而包装产生重组腺相关病毒,其包装率高,且已知的大部分AAV血清型(例如AAV2、AAV5、AAV8和AAV9)均具有较佳的感染性;同时,Rep78和Rep52蛋白的表达量控制在合理范围内,从而能够在昆虫细胞中稳定、大量生产AAV载体。并且,包含cap基因表达盒的重组腺相关病毒载体可用于在体外制备AAV衣壳。
另一方面,本发明还提供一种昆虫细胞,该昆虫细胞包含AAV的cap基因和/或rep基因的表达盒,还可以包含外源基因的表达盒。这些表达盒中的至少一种可整合至宿主昆虫细胞的基因组中稳定表达,也可以是昆虫细胞中瞬时携带含这些表达盒的核酸。
一些实施例中,所述昆虫细胞可以为任意昆虫细胞,例如但不限于草地贪夜蛾细胞(Spodoptera frugiperda cell)、粉纹夜蛾细胞、果蝇细胞或蚊子细胞,优选为草地贪夜蛾细胞sf9。
另一方面,本发明还提供一种细胞培养物,其包含上述昆虫细胞和培养基。
一些实施例中,所述培养基中包含AAV基因组。
另一方面,本发明还提供一种重组腺相关病毒粒子,其是在能产生重组腺相关病毒粒子的条件下培养上述昆虫细胞,然后回收制得的。
以下结合具体实施例,对上述技术方案详细说明。
实施例1构建包含AAV血清9型cap基因表达盒I的重组杆状病毒载体
(1)构建cap基因表达盒I:参见图2,该cap基因表达盒I从5’至3’依次包括p10启动子、内含子、编码T2A肽的核苷酸序列和仅缺少VP1蛋白翻译起始密码子ATG的编码AAV血清9型VP蛋白的核苷酸序列。p10启动子的核苷酸序列如SEQ ID No.1所示;在cap基因表达盒I中,本实施例具体提供了4种内含子,其核苷酸序列分别如SEQ ID No.2至SEQ ID No.5所示,这些内含子中均包含翻译起始密码子ATG;编码T2A肽的核苷酸序列如SEQ ID No.6所示;编码AAV血清9型VP蛋白的核苷酸序列如SEQ ID No.7所示,其氨基端存在至少一个核苷酸的突变,用来消除编码序列内可能存在的剪切位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来分别获得构建物9K-1、9K-2、9K-3和9K-4,其核苷酸序列分别如SEQID No.8至SEQ ID No.11所示。
(2)构建重组杆状病毒载体:将上述构建物9K-1克隆到pFastBac载体上,制备转移质粒;将上述质粒分别转化DH10Bac菌株中,通过Tn7转座,获得重组杆状病毒载体Ac1。同样地,制备得到含有9K-2的重组杆状病毒载体Ac2,含有9K-3的重组杆状病毒载体Ac3,以及含有9K-4的重组杆状病毒载体Ac4。
实施例2构建包含AAV血清2型rep基因表达盒I的重组杆状病毒载体
(1)构建rep基因表达盒I:参见图5,该rep基因表达盒I从5’至3’依次包括polh启动子、内含子、编码T2A肽的核苷酸序列和仅缺少Rep78蛋白翻译起始密码子ATG的编码AAV血清2型Rep蛋白的核苷酸序列。polh启动子的核苷酸序列如SEQ ID No.12所示;本实施例rep基因表达盒中内含子的核苷酸序列如SEQ ID No.5所示,该内含子中包含翻译起始密码子ATG;编码T2A肽的核苷酸序列如SEQ ID No.6所示;编码AAV血清2型Rep蛋白的核苷酸序列如SEQ ID No.13所示,其在Rep78翻译起始密码子与Rep52翻译起始密码子之间存在多个核苷酸的突变,用来消除这段区域内可能存在的翻译起始位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来获得构建物2R-1,其核苷酸序列如SEQ ID No.14所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有2R-1的重组杆状病毒载体Ac5。
实施例3构建包含AAV血清9型cap基因表达盒II的重组杆状病毒载体
(1)构建cap基因表达盒II:参见图3,该cap基因表达盒II从5’至3’依次包括p10启动子、人工构建序列和仅缺少VP1蛋白翻译起始密码子ATG的编码AAV血清9型VP蛋白的核苷酸序列。p10启动子的核苷酸序列如SEQ ID No.1所示;在cap基因表达盒II中,本实施例具体提供了2种人工构建序列,其核苷酸序列分别如SEQ ID No.15和SEQ ID No.16所示,这些人工构建序列中均包含翻译起始密码子ATG,且包含两个内含子剪接位点;编码AAV血清9型VP蛋白的核苷酸序列如SEQ ID No.7所示,其氨基端存在至少一个核苷酸的突变,用来消除编码序列内可能存在的剪切位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来分别获得构建物9K-5和9K-6,其核苷酸序列分别如SEQ ID No.17和SEQ ID No.18所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),分别制备得到含有9K-5的重组杆状病毒载体Ac6和含有9K-6的重组杆状病毒载体Ac7。
实施例4构建包含AAV血清2型rep基因表达盒II的重组杆状病毒载体
(1)构建rep基因表达盒II:参见图6,该rep基因表达盒II从5’至3’依次包括polh启动子、人工构建序列和仅缺少Rep78蛋白翻译起始密码子ATG的编码AAV血清2型Rep蛋白的核苷酸序列。polh启动子的核苷酸序列如SEQ ID No.12所示;本实施例rep基因表达盒II中人工构建序列的核苷酸序列如SEQ ID No.16所示,该人工构建序列中包含翻译起始密码子ATG,且包含两个内含子剪接位点;编码AAV血清2型Rep蛋白的核苷酸序列如SEQ IDNo.13所示,其在Rep78翻译起始密码子与Rep52翻译起始密码子之间存在多个核苷酸的突变,用来消除这段区域内可能存在的翻译起始位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来获得构建物2R-2,其核苷酸序列如SEQ ID No.19所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有2R-2的重组杆状病毒载体Ac8。
实施例5构建包含AAV血清9型cap基因表达盒III的重组杆状病毒载体
(1)构建cap基因表达盒III:参见图4,该cap基因表达盒III从5’至3’依次包括p10启动子、腺嘌呤核苷酸(A)、内含子、胸腺嘧啶核苷酸(T)、鸟嘌呤核苷酸(G)和仅缺少VP1蛋白翻译起始密码子ATG的编码AAV血清9型VP蛋白的核苷酸序列。p10启动子的核苷酸序列如SEQ ID No.1所示;在cap基因表达盒III中,本实施例具体提供了2种内含子,其核苷酸序列分别如SEQ ID No.20和SEQ ID No.21所示;编码AAV血清9型VP蛋白的核苷酸序列如SEQ IDNo.7所示,其氨基端存在至少一个核苷酸的突变,用来消除编码序列内可能存在的剪切位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来分别获得构建物9K-7和9K-8,其核苷酸序列分别如SEQ ID No.22和SEQ ID No.23所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),分别制备得到含有9K-7的重组杆状病毒载体Ac9和含有9K-8的重组杆状病毒载体Ac10。
实施例6构建包含AAV血清2型rep基因表达盒III的重组杆状病毒载体
(1)构建rep基因表达盒III:参见图7,该rep基因表达盒III从5’至3’依次包括polh启动子、A、内含子、TG和仅缺少Rep78蛋白翻译起始密码子ATG的编码AAV血清2型Rep蛋白的核苷酸序列。polh启动子的核苷酸序列如SEQ ID No.12所示;本实施例rep基因表达盒III中内含子的核苷酸序列如SEQ ID No.21所示;编码AAV血清2型Rep蛋白的核苷酸序列如SEQ ID No.13所示,其在Rep78翻译起始密码子与Rep52翻译起始密码子之间存在多个核苷酸的突变,用来消除这段区域内可能存在的翻译起始位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来获得构建物2R-3,其核苷酸序列如SEQ ID No.24所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有2R-3的重组杆状病毒载体Ac11。
对比例构建重组杆状病毒载体Ac0及rep基因表达盒
(1)构建cap基因表达盒:本对比例参照Urabe等人(Urabe等,2002,Hum GeneTher,13:1935-1943)的方法构建cap基因表达盒,该cap基因表达盒的启动子采用p10启动子,表达盒中的cap基因编码AAV血清9型VP蛋白,并将编码序列中VP1的翻译起始密码子ATG突变成次优密码子ACG。该cap基因表达盒编号为9K-0,其核苷酸序列如SEQ ID No.25所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有9K-0的重组杆状病毒载体Ac0。
(3)构建rep基因表达盒:参照中国专利CN103849629A的方法构建rep基因表达盒,该rep基因表达盒的启动子采用polh启动子,表达盒中的rep基因编码AAV血清2型Rep蛋白,并将AAV Rep78蛋白的原始翻译起始密码子ATG替换成ACG。该rep基因表达盒编号为2R-0。
实施例7检测VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)表达情况
将实施例1-6及对比例制备的重组杆状病毒载体Ac0、Ac1、Ac2、Ac3、Ac4、Ac5、Ac6、Ac7、Ac8、Ac9、Ac10和Ac11分别转染宿主细胞系培养获得重组杆状病毒,检测VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)表达情况,具体操作步骤如下:
抽提上述重组杆状病毒载体DNA转染Sf9昆虫细胞,制备重组杆状病毒BEV。转染后的Sf9昆虫细胞成功产生BEV,大量复制增殖的BEV进一步感染导致Sf9细胞发生明显的细胞病变效应(cytopathic effect,CPE)。收集发生CPE的Sf9细胞培养上清液,其中含有大量BEV,即为第0代BEV(P0),同时收集含有大量rAAV的Sf9细胞。将制备得到的BEV-P0以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72小时后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,分别收集培养上清和细胞沉淀,上清液标记为第1代BEV-P1。继续扩大培养,将制备得到的BEV-P1以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72小时后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,收集细胞沉淀进行Western Blot检验VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)的表达情况。
图8为包含有cap基因表达盒I的重组杆状病毒载体Ac1、Ac2、Ac3、Ac4以及对照重组杆状病毒载体Ac0的VP蛋白(VP1、VP2和VP3)Western Blot检测图。由图看出,以上重组杆状病毒载体都能以相对合适的比例产生VP1、VP2和VP3;Ac4相较于Ac1-Ac3有着更高的VP1产生,而VP1的高并入往往会导致更高的感染活性,更高VP1产生的原因在于Ac4中所含内含子相较于其它载体有着更低的剪接活性。
图9为包含有rep基因表达盒I的重组杆状病毒载体Ac5的Rep蛋白(Rep78和Rep52)Western Blot检测图。由图看出,重组杆状病毒载体Ac5能够产生Rep78和Rep52蛋白,且Rep78蛋白的表达量低于Rep52蛋白。
图10为包含有cap基因表达盒II的重组杆状病毒载体Ac6、Ac7以及对照重组杆状病毒载体Ac0的VP蛋白(VP1、VP2和VP3)Western Blot检测图。由图看出,Ac0、Ac6和Ac7均能以相对合适的比例产生VP1、VP2和VP3;Ac7相较于Ac6有着更高的VP1产生,而VP1的高并入往往导致更高的感染活性,更高VP1产生的原因在于Ac7中所含第二内含子剪接供体与内含子剪接受体的选择性剪接活性更高。
图11为包含有rep基因表达盒II的重组杆状病毒载体Ac8的Rep蛋白(Rep78和Rep52)Western Blot检测图。由图看出,重组杆状病毒载体Ac8能够产生Rep78和Rep52蛋白。
图12为包含有cap基因表达盒III的重组杆状病毒载体Ac9、Ac10以及对照重组杆粒Ac0的VP蛋白(VP1、VP2和VP3)Western Blot检测图。由图看出,Ac0和Ac9、Ac10均能以相对合适的比例产生VP1、VP2和VP3;Ac10相较于Ac9有着更高的VP1产生,而VP1的高并入往往会导致更高的感染活性,更高VP1产生的原因在于Ac10中所含内含子的剪接活性相较于Ac9更高。
图13为包含有rep基因表达盒III的重组杆状病毒载体Ac11的Rep蛋白(Rep78和Rep52)Western Blot检测图。由图看出,重组杆状病毒载体Ac11能够产生合适的Rep78和Rep52蛋白。
实施例8用于在昆虫细胞中生产AAV病毒的重组AAV杆粒的构建
本实施例构建用于在昆虫细胞中生产AAV病毒的重组AAV杆粒的方法参照本公司此前申请专利CN112553257A中的实施例1,包括如下步骤:
(1)构建包含AAV必需功能元件cap和rep基因表达盒的同源重组载体;然后通过Red同源重组在大肠杆菌中将该同源重组载体中的必需功能元件插入到杆状病毒基因组中必需基因Ac135(116492...117391)的C端,获得包含有cap和rep基因表达盒的重组杆状病毒载体,编号为Bac-Cap-Rep。
(2)构建包含ITR核心元件(ITR-GOI)的穿梭载体。ITR核心元件编号为I-G-1,其核苷酸序列如SEQ ID No.26所示。本实施例中ITR核心元件中的GOI采用了红色荧光蛋白mcherry基因表达盒,即由miniEf1a启动子控制mcherry表达,便于检测rAAV的活性,将ITR和红色荧光蛋白表达盒构建到穿梭载体pFastDual上。
(3)用上述步骤(2)中构建的穿梭载体转化含有Bac-Cap-Rep重组杆粒的感受态细胞,利用Tn7重组将ITR-GOI插入到Bac-Cap-Rep重组杆粒中的Tn7位点上,最终得到包含生产rAAV所必需的功能蛋白组分和ITR核心元件的重组杆状病毒基因组的重组杆粒,编号为Bac-Cap-Rep-ITR-GOI。
本实施例构建的9种不同重组AAV杆粒均包含cap基因表达盒、rep基因表达盒和ITR核心元件,具体如表1所示。
表1实施例8中构建的9种不同重组AAV杆粒的组成元件列表
Figure BDA0003270177920000151
实施例9AAV重组杆状病毒的制备
将实施例8中制备的重组AAV杆粒CRI-0、CRI-1、CRI-2、CRI-3、CRI-4、CRI-5、CRI-6、CRI-7和CRI-8分别转染宿主细胞系培养获得AAV重组杆状病毒,
抽提上述重组杆粒DNA转染Sf9昆虫细胞,制备重组杆状病毒BEV和rAAV。转染后的Sf9昆虫细胞成功产生BEV,大量复制增殖的BEV进一步感染导致Sf9细胞发生明显的细胞病变效应(CPE)。收集发生CPE的Sf9细胞培养上清液,其中含有大量BEV,即为第0代BEV(P0),同时收集含有大量rAAV的Sf9细胞。将制备得到的BEV-P0以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72小时后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,分别收集培养上清和细胞沉淀,上清液标记为第1代BEV-P1,细胞则标记为用BEV-P0包装的rAAV。
实施例10重组AAV病毒粒子的纯化及其包装率、病毒滴度的检测
按照实施例9的操作继续扩大培养,直至用BEV-P2的种毒按照感染复数(MOI=1)感染悬浮培养的Sf9细胞进行rAAV的包装,包装体积为300mL-400mL。感染3天后监测细胞活性,活性低于50%,分别离心收获细胞沉淀和上清,将收获的细胞沉淀和上清分别纯化,细胞反复冻融3次裂解,5000rpm离心10min收集上清,在上清中加入核酸酶(Benzonase)37℃水浴处理60min,处理后5000rpm离心10min。收集的细胞裂解液和收集的上清液PEG沉淀,重悬后用碘克沙醇密度梯度离心分离纯化(方法参见Aslanidi等,2009,Proc.NatlAcad.Sci.USA,206:5059-5064)。最终纯化的成品病毒用80μL-190μL PBS重悬,取10μL纯化出的成品病毒跑SDS-PAGE胶,银染。
图14A、14B、14C提供了重组AAV杆粒CRI-0、CRI-1、CRI-2、CRI-3、CRI-4、CRI-5、CRI-6、CRI-7和CRI-8转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE银染检测。由结果看出,本发明构建的重组AAV杆粒通过内含子剪接调控作用,均能在昆虫细胞中实现VP1、VP2和VP3蛋白以相对合适比例的表达,从而包装出病毒粒子。其中CRI-4、CRI-6和CRI-7的病毒颗粒分别相对于CRI-3、CRI-5和CRI-8有着更高的VP1蛋白并入量,导致这一现象的原因是其VP1蛋白的表达量相对较高。内含子的剪接效率决定着VP1蛋白的相对表达量,我们通过调整内含子的序列,改变内含子的剪接效率,从而能获得不同VP1并入量的病毒颗粒。
本实施例还采用Q-PCR检测收获的rAAV病毒的包装率,rAAV包装率的检测使用靶向ITR序列的一对引物(Q-ITR-F:GGAACCCCTAGTGATGGAGTT和Q-ITR-R:CGGCCTCAGTGAGCGA)。rAAV感染滴度的检测采用本公司此前申请专利CN112280801A中的检测方法进行,具体操作方法参见该专利中利用质粒辅助进行rAAV感染滴度检测的方法,检测结果如表2。
表2利用9种不同重组AAV杆粒生产的rAAV病毒粒子的包装率和感染滴度检测结果表
重组AAV杆粒编号 细胞包装率(VG/cell) 病毒感染滴度(VG/mL)
CRI-0 3.62E+05 5.26E+07
CRI-1 2.66E+05 1.58E+08
CRI-2 5.46E+05 2.02E+08
CRI-3 7.44E+05 6.10E+07
CRI-4 5.30E+05 8.28E+07
CRI-5 7.02E+05 4.21E+07
CRI-6 2.28E+05 1.92E+08
CRI-7 3.82E+05 2.85E+08
CRI-8 5.69E+05 7.34E+07
结合表2和图15可以看出,利用本发明制备的重组AAV杆粒CRI-1至CRI-8转染昆虫细胞均能包装出重组杆状病毒,包装率和病毒感染滴度较高,且其与包含对照cap基因表达盒的重组AAV杆粒CRI-0生产的病毒粒子相当,或高于对照CRI-0。CRI-4、CRI-6和CRI-7分别相对于CRI-3、CRI-5和CRI-8有着相对更高的病毒感染滴度,而它们的VP1并入量也相对更高。
实施例11不同AAV血清型中内含子调控作用的验证
为了验证以上内含子调控方式能在不同AAV血清型中起作用。参照实施例1中的方法分别构建了AAV血清2型的cap基因表达盒2K-1、AAV血清5型的cap基因表达盒5K-1和AAV血清8型的cap基因表达盒8K-1;参照实施例3中的方法分别构建了AAV血清2型的cap基因表达盒2K-2、AAV血清5型的cap基因表达盒5K-2和AAV血清8型的cap基因表达盒8K-2;参照实施例5中的方法分别构建了AAV血清2型的cap基因表达盒2K-3、AAV血清5型的cap基因表达盒5K-3和AAV血清8型的cap基因表达盒8K-3。上述构建物2K-1、2K-2、2K-3、5K-1、5K-2、5K-3、8K-1、8K-2和8K-3的核苷酸序列分别如SEQ ID No.27至SEQ ID No.35所示。本实施例rep基因表达盒仍采用的是AAV血清2型,因为AAV血清2型的Rep蛋白适应于各种血清型rAAV的制备。
参照实施例8,本实施例构建了9种不同重组AAV杆粒,它们均包含cap基因表达盒、rep基因表达盒和ITR核心元件,具体如表3所示。
表3实施例11中构建的9种不同重组AAV杆粒的组成元件列表
Figure BDA0003270177920000171
参照实施例9和实施例10,本实施例将上述重组AAV杆粒转染宿主细胞,纯化获得的重组AAV病毒粒子进行SDS-PAGE银染检测,实验结果如图16A、16B和16C。并对不同血清型的重组AAV杆粒产生的rAAV的细胞包装率和病毒感染滴度进行了检测,检测结果如表4。
表4利用实施例11中9种不同重组AAV杆粒生产的rAAV病毒粒子的包装率和感染滴度检测结果表
Figure BDA0003270177920000172
Figure BDA0003270177920000181
结合表4和图17的结果表明,本发明通过内含子剪接作用调控昆虫细胞中VP1、VP2和VP3蛋白以相对合适比例的表达,适用于各种AAV血清型,均能大规模生产rAAV病毒粒子。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 武汉枢密脑科学技术有限公司
<120> 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 110
<212> DNA
<213> AcMNPV
<220>
<223> Promoter p10
<400> 1
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc 110
<210> 2
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 2
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
cagataaata tgccggattt atcgtgttcg ccattagggc agtatattct cattcttcct 120
tttccttttt ttttcag 137
<210> 3
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 3
gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca aattcaggta 60
tggcccatta cggcagtata aattcgttca ttttggatat tgtttcag 108
<210> 4
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 4
gtatcgataa ctttgttttc tttcacatct acaacgccga cgccgccatg gccatcgtgt 60
tcgccattag ggcagtatat tctcattctt ccttttcctt tttttttcag 110
<210> 5
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 5
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
cagataaata tgccggatgg taattttatt actgtttggt ccataaacac ttgtttacca 120
tttccttttt tacaagtttt aatatgttct gcatatataa aacattatgt attttgcag 179
<210> 6
<211> 54
<212> DNA
<213> Thosea asigna virus
<220>
<223> Self-cleaving peptides T2A
<400> 6
gaagggcggg gaagcctcct aacctgcggt gacgttgagg aaaatccggg tcca 54
<210> 7
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap ORF
<400> 7
atggctgccg acggttatct acccgattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 8
<211> 2566
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 8
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatttatcgt gttcgccatt 240
agggcagtat attctcattc ttccttttcc tttttttttc aggttcacct tcaacggctc 300
gggagaaggg cggggaagcc tcctaacctg cggtgacgtt gaggaaaatc cgggtccagc 360
tgccgacggt tatctacccg attggctcga ggacaacctt agtgaaggaa ttcgcgagtg 420
gtgggctttg aaacctggag cccctcaacc caaggcaaat caacaacatc aagacaacgc 480
tcgaggtctt gtgcttccgg gttacaaata ccttggaccc ggcaacggac tcgacaaggg 540
ggagccggtc aacgcagcag acgcggcggc cctcgagcac gacaaggcct acgaccagca 600
gctcaaggcc ggagacaacc cgtacctcaa gtacaaccac gccgacgccg agttccagga 660
gcggctcaaa gaagatacgt cttttggggg caacctcggg cgagcagtct tccaggccaa 720
aaagaggctt cttgaacctc ttggtctggt tgaggaagcg gctaagacgg ctcctggaaa 780
gaagaggcct gtagagcagt ctcctcagga accggactcc tccgcgggta ttggcaaatc 840
gggtgcacag cccgctaaaa agagactcaa tttcggtcag actggcgaca cagagtcagt 900
cccagaccct caaccaatcg gagaacctcc cgcagccccc tcaggtgtgg gatctcttac 960
aatggcttca ggtggtggcg caccagtggc agacaataac gaaggtgccg atggagtggg 1020
tagttcctcg ggaaattggc attgcgattc ccaatggctg ggggacagag tcatcaccac 1080
cagcacccga acctgggccc tgcccaccta caacaatcac ctctacaagc aaatctccaa 1140
cagcacatct ggaggatctt caaatgacaa cgcctacttc ggctacagca ccccctgggg 1200
gtattttgac ttcaacagat tccactgcca cttctcacca cgtgactggc agcgactcat 1260
caacaacaac tggggattcc ggcctaagcg actcaacttc aagctcttca acattcaggt 1320
caaagaggtt acggacaaca atggagtcaa gaccatcgcc aataacctta ccagcacggt 1380
ccaggtcttc acggactcag actatcagct cccgtacgtg ctcgggtcgg ctcacgaggg 1440
ctgcctcccg ccgttcccag cggacgtttt catgattcct cagtacgggt atctgacgct 1500
taatgatgga agccaggccg tgggtcgttc gtccttttac tgcctggaat atttcccgtc 1560
gcaaatgcta agaacgggta acaacttcca gttcagctac gagtttgaga acgtaccttt 1620
ccatagcagc tacgctcaca gccaaagcct ggaccgacta atgaatccac tcatcgacca 1680
atacttgtac tatctctcaa agactattaa cggttctgga cagaatcaac aaacgctaaa 1740
attcagtgtg gccggaccca gcaacatggc tgtccaggga agaaactaca tacctggacc 1800
cagctaccga caacaacgtg tctcaaccac tgtgactcaa aacaacaaca gcgaatttgc 1860
ttggcctgga gcttcttctt gggctctcaa tggacgtaat agcttgatga atcctggacc 1920
tgctatggcc agccacaaag aaggagagga ccgtttcttt cctttgtctg gatctttaat 1980
ttttggcaaa caaggaactg gaagagacaa cgtggatgcg gacaaagtca tgataaccaa 2040
cgaagaagaa attaaaacta ctaacccggt agcaacggag tcctatggac aagtggccac 2100
aaaccaccag agtgcccaag cacaggcgca gaccggctgg gttcaaaacc aaggaatact 2160
tccgggtatg gtttggcagg acagagatgt gtacctgcaa ggacccattt gggccaaaat 2220
tcctcacacg gacggcaact ttcacccttc tccgctgatg ggagggtttg gaatgaagca 2280
cccgcctcct cagatcctca tcaaaaacac acctgtacct gcggatcctc caacggcctt 2340
caacaaggac aagctgaact ctttcatcac ccagtattct actggccaag tcagcgtgga 2400
gatcgagtgg gagctgcaga aggaaaacag caagcgctgg aacccggaga tccagtacac 2460
ttccaactat tacaagtcta ataatgttga atttgctgtt aatactgaag gtgtatatag 2520
tgaaccccgc cccattggca ccagatacct gactcgtaat ctgtaa 2566
<210> 9
<211> 2529
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 9
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggcagc aggtaagtat cgataacttt gttttctttc acatttacaa 180
ctccgacata caaattcagg tatggcccat tacggcagta taaattcgtt cattttggat 240
attgtttcag ttgcaagtgg ctcgggagaa gggcggggaa gcctcctaac ctgcggtgac 300
gttgaggaaa atccgggtcc agctgccgac ggttatcttc ccgattggct cgaggacaac 360
cttagtgaag gaattcgcga gtggtgggct ttgaaacctg gagcccctca acccaaggca 420
aatcaacaac atcaagacaa cgctcgaggt cttgtgcttc cgggttacaa ataccttgga 480
cccggcaacg gactcgacaa gggggagccg gtcaacgcag cagacgcggc ggccctcgag 540
cacgacaagg cctacgacca gcagctcaag gccggagaca acccgtacct caagtacaac 600
cacgccgacg ccgagttcca ggagcggctc aaagaagata cgtcttttgg gggcaacctc 660
gggcgagcag tcttccaggc caaaaagagg cttcttgaac ctcttggtct ggttgaggaa 720
gcggctaaga cggctcctgg aaagaagagg cctgtagagc agtctcctca ggaaccggac 780
tcctccgcgg gtattggcaa atcgggtgca cagcccgcta aaaagagact caatttcggt 840
cagactggcg acacagagtc agtcccagac cctcaaccaa tcggagaacc tcccgcagcc 900
ccctcaggtg tgggatctct tacaatggct tcaggtggtg gcgcaccagt ggcagacaat 960
aacgaaggtg ccgatggagt gggtagttcc tcgggaaatt ggcattgcga ttcccaatgg 1020
ctgggggaca gagtcatcac caccagcacc cgaacctggg ccctgcccac ctacaacaat 1080
cacctctaca agcaaatctc caacagcaca tctggaggat cttcaaatga caacgcctac 1140
ttcggctaca gcaccccctg ggggtatttt gacttcaaca gattccactg ccacttctca 1200
ccacgtgact ggcagcgact catcaacaac aactggggat tccggcctaa gcgactcaac 1260
ttcaagctct tcaacattca ggtcaaagag gttacggaca acaatggagt caagaccatc 1320
gccaataacc ttaccagcac ggtccaggtc ttcacggact cagactatca gctcccgtac 1380
gtgctcgggt cggctcacga gggctgcctc ccgccgttcc cagcggacgt tttcatgatt 1440
cctcagtacg ggtatctgac gcttaatgat ggaagccagg ccgtgggtcg ttcgtccttt 1500
tactgcctgg aatatttccc gtcgcaaatg ctaagaacgg gtaacaactt ccagttcagc 1560
tacgagtttg agaacgtacc tttccatagc agctacgctc acagccaaag cctggaccga 1620
ctaatgaatc cactcatcga ccaatacttg tactatctct caaagactat taacggttct 1680
ggacagaatc aacaaacgct aaaattcagt gtggccggac ccagcaacat ggctgtccag 1740
ggaagaaact acatacctgg acccagctac cgacaacaac gtgtctcaac cactgtgact 1800
caaaacaaca acagcgaatt tgcttggcct ggagcttctt cttgggctct caatggacgt 1860
aatagcttga tgaatcctgg acctgctatg gccagccaca aagaaggaga ggaccgtttc 1920
tttcctttgt ctggatcttt aatttttggc aaacaaggaa ctggaagaga caacgtggat 1980
gcggacaaag tcatgataac caacgaagaa gaaattaaaa ctactaaccc ggtagcaacg 2040
gagtcctatg gacaagtggc cacaaaccac cagagtgccc aagcacaggc gcagaccggc 2100
tgggttcaaa accaaggaat acttccgggt atggtttggc aggacagaga tgtgtacctg 2160
caaggaccca tttgggccaa aattcctcac acggacggca actttcaccc ttctccgctg 2220
atgggagggt ttggaatgaa gcacccgcct cctcagatcc tcatcaaaaa cacacctgta 2280
cctgcggatc ctccaacggc cttcaacaag gacaagctga actctttcat cacccagtat 2340
tctactggcc aagtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaagcgc 2400
tggaacccgg agatccagta cacttccaac tattacaagt ctaataatgt tgaatttgct 2460
gttaatactg aaggtgtata tagtgaaccc cgccccattg gcaccagata cctgactcgt 2520
aatctgtaa 2529
<210> 10
<211> 2527
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 10
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggcagg taagtatcga taactttgtt ttctttcaca tctacaacgc 180
cgacgccgcc atggccatcg tgttcgccat tagggcagta tattctcatt cttccttttc 240
cttttttttt caggttggct cgggagaagg gcggggaagc ctcctaacct gcggtgacgt 300
tgaggaaaat ccgggtccag ctgccgacgg ttatctaccc gattggctcg aggacaacct 360
tagtgaagga attcgcgagt ggtgggcttt gaaacctgga gcccctcaac ccaaggcaaa 420
tcaacaacat caagacaacg ctcgaggtct tgtgcttccg ggttacaaat accttggacc 480
cggcaacgga ctcgacaagg gggagccggt caacgcagca gacgcggcgg ccctcgagca 540
cgacaaggcc tacgaccagc agctcaaggc cggagacaac ccgtacctca agtacaacca 600
cgccgacgcc gagttccagg agcggctcaa agaagatacg tcttttgggg gcaacctcgg 660
gcgagcagtc ttccaggcca aaaagaggct tcttgaacct cttggtctgg ttgaggaagc 720
ggctaagacg gctcctggaa agaagaggcc tgtagagcag tctcctcagg aaccggactc 780
ctccgcgggt attggcaaat cgggtgcaca gcccgctaaa aagagactca atttcggtca 840
gactggcgac acagagtcag tcccagaccc tcaaccaatc ggagaacctc ccgcagcccc 900
ctcaggtgtg ggatctctta caatggcttc aggtggtggc gcaccagtgg cagacaataa 960
cgaaggtgcc gatggagtgg gtagttcctc gggaaattgg cattgcgatt cccaatggct 1020
gggggacaga gtcatcacca ccagcacccg aacctgggcc ctgcccacct acaacaatca 1080
cctctacaag caaatctcca acagcacatc tggaggatct tcaaatgaca acgcctactt 1140
cggctacagc accccctggg ggtattttga cttcaacaga ttccactgcc acttctcacc 1200
acgtgactgg cagcgactca tcaacaacaa ctggggattc cggcctaagc gactcaactt 1260
caagctcttc aacattcagg tcaaagaggt tacggacaac aatggagtca agaccatcgc 1320
caataacctt accagcacgg tccaggtctt cacggactca gactatcagc tcccgtacgt 1380
gctcgggtcg gctcacgagg gctgcctccc gccgttccca gcggacgttt tcatgattcc 1440
tcagtacggg tatctgacgc ttaatgatgg aagccaggcc gtgggtcgtt cgtcctttta 1500
ctgcctggaa tatttcccgt cgcaaatgct aagaacgggt aacaacttcc agttcagcta 1560
cgagtttgag aacgtacctt tccatagcag ctacgctcac agccaaagcc tggaccgact 1620
aatgaatcca ctcatcgacc aatacttgta ctatctctca aagactatta acggttctgg 1680
acagaatcaa caaacgctaa aattcagtgt ggccggaccc agcaacatgg ctgtccaggg 1740
aagaaactac atacctggac ccagctaccg acaacaacgt gtctcaacca ctgtgactca 1800
aaacaacaac agcgaatttg cttggcctgg agcttcttct tgggctctca atggacgtaa 1860
tagcttgatg aatcctggac ctgctatggc cagccacaaa gaaggagagg accgtttctt 1920
tcctttgtct ggatctttaa tttttggcaa acaaggaact ggaagagaca acgtggatgc 1980
ggacaaagtc atgataacca acgaagaaga aattaaaact actaacccgg tagcaacgga 2040
gtcctatgga caagtggcca caaaccacca gagtgcccaa gcacaggcgc agaccggctg 2100
ggttcaaaac caaggaatac ttccgggtat ggtttggcag gacagagatg tgtacctgca 2160
aggacccatt tgggccaaaa ttcctcacac ggacggcaac tttcaccctt ctccgctgat 2220
gggagggttt ggaatgaagc acccgcctcc tcagatcctc atcaaaaaca cacctgtacc 2280
tgcggatcct ccaacggcct tcaacaagga caagctgaac tctttcatca cccagtattc 2340
tactggccaa gtcagcgtgg agatcgagtg ggagctgcag aaggaaaaca gcaagcgctg 2400
gaacccggag atccagtaca cttccaacta ttacaagtct aataatgttg aatttgctgt 2460
taatactgaa ggtgtatata gtgaaccccg ccccattggc accagatacc tgactcgtaa 2520
tctgtaa 2527
<210> 11
<211> 2605
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 11
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatggtaatt ttattactgt 240
ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat gttctgcata 300
tataaaacat tatgtatttt gcagcacctt caacggctcg ggagaagggc ggggaagcct 360
cctaacctgc ggtgacgttg aggaaaatcc gggtccagct gccgacggtt atctacccga 420
ttggctcgag gacaacctta gtgaaggaat tcgcgagtgg tgggctttga aacctggagc 480
ccctcaaccc aaggcaaatc aacaacatca agacaacgct cgaggtcttg tgcttccggg 540
ttacaaatac cttggacccg gcaacggact cgacaagggg gagccggtca acgcagcaga 600
cgcggcggcc ctcgagcacg acaaggccta cgaccagcag ctcaaggccg gagacaaccc 660
gtacctcaag tacaaccacg ccgacgccga gttccaggag cggctcaaag aagatacgtc 720
ttttgggggc aacctcgggc gagcagtctt ccaggccaaa aagaggcttc ttgaacctct 780
tggtctggtt gaggaagcgg ctaagacggc tcctggaaag aagaggcctg tagagcagtc 840
tcctcaggaa ccggactcct ccgcgggtat tggcaaatcg ggtgcacagc ccgctaaaaa 900
gagactcaat ttcggtcaga ctggcgacac agagtcagtc ccagaccctc aaccaatcgg 960
agaacctccc gcagccccct caggtgtggg atctcttaca atggcttcag gtggtggcgc 1020
accagtggca gacaataacg aaggtgccga tggagtgggt agttcctcgg gaaattggca 1080
ttgcgattcc caatggctgg gggacagagt catcaccacc agcacccgaa cctgggccct 1140
gcccacctac aacaatcacc tctacaagca aatctccaac agcacatctg gaggatcttc 1200
aaatgacaac gcctacttcg gctacagcac cccctggggg tattttgact tcaacagatt 1260
ccactgccac ttctcaccac gtgactggca gcgactcatc aacaacaact ggggattccg 1320
gcctaagcga ctcaacttca agctcttcaa cattcaggtc aaagaggtta cggacaacaa 1380
tggagtcaag accatcgcca ataaccttac cagcacggtc caggtcttca cggactcaga 1440
ctatcagctc ccgtacgtgc tcgggtcggc tcacgagggc tgcctcccgc cgttcccagc 1500
ggacgttttc atgattcctc agtacgggta tctgacgctt aatgatggaa gccaggccgt 1560
gggtcgttcg tccttttact gcctggaata tttcccgtcg caaatgctaa gaacgggtaa 1620
caacttccag ttcagctacg agtttgagaa cgtacctttc catagcagct acgctcacag 1680
ccaaagcctg gaccgactaa tgaatccact catcgaccaa tacttgtact atctctcaaa 1740
gactattaac ggttctggac agaatcaaca aacgctaaaa ttcagtgtgg ccggacccag 1800
caacatggct gtccagggaa gaaactacat acctggaccc agctaccgac aacaacgtgt 1860
ctcaaccact gtgactcaaa acaacaacag cgaatttgct tggcctggag cttcttcttg 1920
ggctctcaat ggacgtaata gcttgatgaa tcctggacct gctatggcca gccacaaaga 1980
aggagaggac cgtttctttc ctttgtctgg atctttaatt tttggcaaac aaggaactgg 2040
aagagacaac gtggatgcgg acaaagtcat gataaccaac gaagaagaaa ttaaaactac 2100
taacccggta gcaacggagt cctatggaca agtggccaca aaccaccaga gtgcccaagc 2160
acaggcgcag accggctggg ttcaaaacca aggaatactt ccgggtatgg tttggcagga 2220
cagagatgtg tacctgcaag gacccatttg ggccaaaatt cctcacacgg acggcaactt 2280
tcacccttct ccgctgatgg gagggtttgg aatgaagcac ccgcctcctc agatcctcat 2340
caaaaacaca cctgtacctg cggatcctcc aacggccttc aacaaggaca agctgaactc 2400
tttcatcacc cagtattcta ctggccaagt cagcgtggag atcgagtggg agctgcagaa 2460
ggaaaacagc aagcgctgga acccggagat ccagtacact tccaactatt acaagtctaa 2520
taatgttgaa tttgctgtta atactgaagg tgtatatagt gaaccccgcc ccattggcac 2580
cagatacctg actcgtaatc tgtaa 2605
<210> 12
<211> 92
<212> DNA
<213> AcMNPV
<220>
<223> Promoter polh
<400> 12
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa at 92
<210> 13
<211> 1863
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep ORF
<400> 13
atggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgggca tctgcccggc 60
atttctgaca gctttgtgaa ctgggtggcc gagaaggagt gggagttgcc gccagattct 120
gacttggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa gctgcagcgc 180
gactttctga cggagtggcg ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa 240
tttgagaagg gagagagcta cttccactta cacgtgctcg tggaaaccac cggggtgaaa 300
tccttagttt tgggacgttt cctgagtcag attcgcgaaa aactgattca gagaatttac 360
cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagaccag aaacggcgcc 420
ggaggcggga acaaggtggt ggacgagtgc tacatcccca attacttgct ccccaaaacc 480
cagcctgagc tccagtgggc gtggactaat ttagaacagt atttaagcgc ctgtttgaat 540
ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca gacgcaggag 600
cagaacaaag agaatcagaa tcccaattct gacgcgccgg tgatcagatc aaaaacttca 660
gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc ggagaagcag 720
tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc 780
caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa aaccgccccc 840
gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat ttataaaatt 900
ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg atgggccacg 960
aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac cgggaagacc 1020
aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat 1080
gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga ggaggggaag 1140
atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg 1200
gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt cacctccaac 1260
accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca gcagccgttg 1320
caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt tgggaaggtc 1380
accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt tgaggtggag 1440
catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag tgacgcagat 1500
ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa 1560
gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat 1620
ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa tatctgcttc 1680
actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca acccgtttct 1740
gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg aaaggtgcca 1800
gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat ctttgaacaa 1860
taa 1863
<210> 14
<211> 2255
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep gene expression cassette
<400> 14
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcgg atcctaggac aaggtaagta tgcattgtaa atgtgatatt atgtgtatta 180
ttatacctac ctaatttgca gtgcagataa atatgccgga tggtaatttt attactgttt 240
ggtccataaa cacttgttta ccatttcctt ttttacaagt tttaatatgt tctgcatata 300
taaaacatta tgtattttgc agcaccttca acggctcggg agaagggcgg ggaagcctcc 360
taacctgcgg tgacgttgag gaaaatccgg gtccagggtt ttacgagatt gtgattaagg 420
tccccagcga ccttgacggg catctgcccg gcatttctga cagctttgtg aactgggtgg 480
ccgagaagga gtgggagttg ccgccagatt ctgacttgga tctgaatctg attgagcagg 540
cacccctgac cgtggccgag aagctgcagc gcgactttct gacggagtgg cgccgtgtga 600
gtaaggcccc ggaggccctt ttctttgtgc aatttgagaa gggagagagc tacttccact 660
tacacgtgct cgtggaaacc accggggtga aatccttagt tttgggacgt ttcctgagtc 720
agattcgcga aaaactgatt cagagaattt accgcgggat cgagccgact ttgccaaact 780
ggttcgcggt cacaaagacc agaaacggcg ccggaggcgg gaacaaggtg gtggacgagt 840
gctacatccc caattacttg ctccccaaaa cccagcctga gctccagtgg gcgtggacta 900
atttagaaca gtatttaagc gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc 960
agcatctgac gcacgtgtcg cagacgcagg agcagaacaa agagaatcag aatcccaatt 1020
ctgacgcgcc ggtgatcaga tcaaaaactt cagccaggta catggagctg gtcgggtggc 1080
tcgtggacaa ggggattacc tcggagaagc agtggatcca ggaggaccag gcctcataca 1140
tctccttcaa tgcggcctcc aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg 1200
gaaagattat gagcctgact aaaaccgccc ccgactacct ggtgggccag cagcccgtgg 1260
aggacatttc cagcaatcgg atttataaaa ttttggaact aaacgggtac gatccccaat 1320
atgcggcttc cgtctttctg ggatgggcca cgaaaaagtt cggcaagagg aacaccatct 1380
ggctgtttgg gcctgcaact accgggaaga ccaacatcgc ggaggccata gcccacactg 1440
tgcccttcta cgggtgcgta aactggacca atgagaactt tcccttcaac gactgtgtcg 1500
acaagatggt gatctggtgg gaggagggga agatgaccgc caaggtcgtg gagtcggcca 1560
aagccattct cggaggaagc aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga 1620
tagacccgac tcccgtgatc gtcacctcca acaccaacat gtgcgccgtg attgacggga 1680
actcaacgac cttcgaacac cagcagccgt tgcaagaccg gatgttcaaa tttgaactca 1740
cccgccgtct ggatcatgac tttgggaagg tcaccaagca ggaagtcaaa gactttttcc 1800
ggtgggcaaa ggatcacgtg gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag 1860
ccaagaaaag acccgccccc agtgacgcag atataagtga gcccaaacgg gtgcgcgagt 1920
cagttgcgca gccatcgacg tcagacgcgg aagcttcgat caactacgca gacaggtacc 1980
aaaacaaatg ttctcgtcac gtgggcatga atctgatgct gtttccctgc agacaatgcg 2040
agagaatgaa tcagaattca aatatctgct tcactcacgg acagaaagac tgtttagagt 2100
gctttcccgt gtcagaatct caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt 2160
gctacattca tcatatcatg ggaaaggtgc cagacgcttg cactgcctgc gatctggtca 2220
atgtggattt ggatgactgc atctttgaac aataa 2255
<210> 15
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 15
gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca aatgccgcca 60
tggtaagtat tcattgtaaa tctgatatta tttgtattat tatacctacc taatttgcag 120
tgcagggtaa ttttattact gtttggtcca taaacacttg tttaccattt ccttttttac 180
aagttttaat attttctgca tatataaaac attatttatt ttgcag 226
<210> 16
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 16
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
caggccgcca tggtaagtat cgataacttt gttttctttc acatttacaa ctccgacata 120
caaattgtaa ttttattact gtttggtcca taaacacttg tttaccattt ccttttttac 180
aagttttaat attttctgca tatataaaac attatttatt ttgcag 226
<210> 17
<211> 2605
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 17
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatggtaatt ttattactgt 240
ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat gttctgcata 300
tataaaacat tatgtatttt gcagcacctt caacggctcg ggagaagggc ggggaagcct 360
cctaacctgc ggtgacgttg aggaaaatcc gggtccagct gccgacggtt atctacccga 420
ttggctcgag gacaacctta gtgaaggaat tcgcgagtgg tgggctttga aacctggagc 480
ccctcaaccc aaggcaaatc aacaacatca agacaacgct cgaggtcttg tgcttccggg 540
ttacaaatac cttggacccg gcaacggact cgacaagggg gagccggtca acgcagcaga 600
cgcggcggcc ctcgagcacg acaaggccta cgaccagcag ctcaaggccg gagacaaccc 660
gtacctcaag tacaaccacg ccgacgccga gttccaggag cggctcaaag aagatacgtc 720
ttttgggggc aacctcgggc gagcagtctt ccaggccaaa aagaggcttc ttgaacctct 780
tggtctggtt gaggaagcgg ctaagacggc tcctggaaag aagaggcctg tagagcagtc 840
tcctcaggaa ccggactcct ccgcgggtat tggcaaatcg ggtgcacagc ccgctaaaaa 900
gagactcaat ttcggtcaga ctggcgacac agagtcagtc ccagaccctc aaccaatcgg 960
agaacctccc gcagccccct caggtgtggg atctcttaca atggcttcag gtggtggcgc 1020
accagtggca gacaataacg aaggtgccga tggagtgggt agttcctcgg gaaattggca 1080
ttgcgattcc caatggctgg gggacagagt catcaccacc agcacccgaa cctgggccct 1140
gcccacctac aacaatcacc tctacaagca aatctccaac agcacatctg gaggatcttc 1200
aaatgacaac gcctacttcg gctacagcac cccctggggg tattttgact tcaacagatt 1260
ccactgccac ttctcaccac gtgactggca gcgactcatc aacaacaact ggggattccg 1320
gcctaagcga ctcaacttca agctcttcaa cattcaggtc aaagaggtta cggacaacaa 1380
tggagtcaag accatcgcca ataaccttac cagcacggtc caggtcttca cggactcaga 1440
ctatcagctc ccgtacgtgc tcgggtcggc tcacgagggc tgcctcccgc cgttcccagc 1500
ggacgttttc atgattcctc agtacgggta tctgacgctt aatgatggaa gccaggccgt 1560
gggtcgttcg tccttttact gcctggaata tttcccgtcg caaatgctaa gaacgggtaa 1620
caacttccag ttcagctacg agtttgagaa cgtacctttc catagcagct acgctcacag 1680
ccaaagcctg gaccgactaa tgaatccact catcgaccaa tacttgtact atctctcaaa 1740
gactattaac ggttctggac agaatcaaca aacgctaaaa ttcagtgtgg ccggacccag 1800
caacatggct gtccagggaa gaaactacat acctggaccc agctaccgac aacaacgtgt 1860
ctcaaccact gtgactcaaa acaacaacag cgaatttgct tggcctggag cttcttcttg 1920
ggctctcaat ggacgtaata gcttgatgaa tcctggacct gctatggcca gccacaaaga 1980
aggagaggac cgtttctttc ctttgtctgg atctttaatt tttggcaaac aaggaactgg 2040
aagagacaac gtggatgcgg acaaagtcat gataaccaac gaagaagaaa ttaaaactac 2100
taacccggta gcaacggagt cctatggaca agtggccaca aaccaccaga gtgcccaagc 2160
acaggcgcag accggctggg ttcaaaacca aggaatactt ccgggtatgg tttggcagga 2220
cagagatgtg tacctgcaag gacccatttg ggccaaaatt cctcacacgg acggcaactt 2280
tcacccttct ccgctgatgg gagggtttgg aatgaagcac ccgcctcctc agatcctcat 2340
caaaaacaca cctgtacctg cggatcctcc aacggccttc aacaaggaca agctgaactc 2400
tttcatcacc cagtattcta ctggccaagt cagcgtggag atcgagtggg agctgcagaa 2460
ggaaaacagc aagcgctgga acccggagat ccagtacact tccaactatt acaagtctaa 2520
taatgttgaa tttgctgtta atactgaagg tgtatatagt gaaccccgcc ccattggcac 2580
cagatacctg actcgtaatc tgtaa 2605
<210> 18
<211> 2499
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 18
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagc taaaggtatt tctttgactc taaaaacctt gacgactgtt 180
tcgccttgaa caaactaaat gaacccttta tgcaaacagc tgcccgtggg ctcgggagaa 240
gggcggggaa gcctcctaac ctgcggtgac gttgaggaaa atccgggtcc agctgccgac 300
ggttatctac ccgattggct cgaggacaac cttagtgaag gaattcgcga gtggtgggct 360
ttgaaacctg gagcccctca acccaaggca aatcaacaac atcaagacaa cgctcgaggt 420
cttgtgcttc cgggttacaa ataccttgga cccggcaacg gactcgacaa gggggagccg 480
gtcaacgcag cagacgcggc ggccctcgag cacgacaagg cctacgacca gcagctcaag 540
gccggagaca acccgtacct caagtacaac cacgccgacg ccgagttcca ggagcggctc 600
aaagaagata cgtcttttgg gggcaacctc gggcgagcag tcttccaggc caaaaagagg 660
cttcttgaac ctcttggtct ggttgaggaa gcggctaaga cggctcctgg aaagaagagg 720
cctgtagagc agtctcctca ggaaccggac tcctccgcgg gtattggcaa atcgggtgca 780
cagcccgcta aaaagagact caatttcggt cagactggcg acacagagtc agtcccagac 840
cctcaaccaa tcggagaacc tcccgcagcc ccctcaggtg tgggatctct tacaatggct 900
tcaggtggtg gcgcaccagt ggcagacaat aacgaaggtg ccgatggagt gggtagttcc 960
tcgggaaatt ggcattgcga ttcccaatgg ctgggggaca gagtcatcac caccagcacc 1020
cgaacctggg ccctgcccac ctacaacaat cacctctaca agcaaatctc caacagcaca 1080
tctggaggat cttcaaatga caacgcctac ttcggctaca gcaccccctg ggggtatttt 1140
gacttcaaca gattccactg ccacttctca ccacgtgact ggcagcgact catcaacaac 1200
aactggggat tccggcctaa gcgactcaac ttcaagctct tcaacattca ggtcaaagag 1260
gttacggaca acaatggagt caagaccatc gccaataacc ttaccagcac ggtccaggtc 1320
ttcacggact cagactatca gctcccgtac gtgctcgggt cggctcacga gggctgcctc 1380
ccgccgttcc cagcggacgt tttcatgatt cctcagtacg ggtatctgac gcttaatgat 1440
ggaagccagg ccgtgggtcg ttcgtccttt tactgcctgg aatatttccc gtcgcaaatg 1500
ctaagaacgg gtaacaactt ccagttcagc tacgagtttg agaacgtacc tttccatagc 1560
agctacgctc acagccaaag cctggaccga ctaatgaatc cactcatcga ccaatacttg 1620
tactatctct caaagactat taacggttct ggacagaatc aacaaacgct aaaattcagt 1680
gtggccggac ccagcaacat ggctgtccag ggaagaaact acatacctgg acccagctac 1740
cgacaacaac gtgtctcaac cactgtgact caaaacaaca acagcgaatt tgcttggcct 1800
ggagcttctt cttgggctct caatggacgt aatagcttga tgaatcctgg acctgctatg 1860
gccagccaca aagaaggaga ggaccgtttc tttcctttgt ctggatcttt aatttttggc 1920
aaacaaggaa ctggaagaga caacgtggat gcggacaaag tcatgataac caacgaagaa 1980
gaaattaaaa ctactaaccc ggtagcaacg gagtcctatg gacaagtggc cacaaaccac 2040
cagagtgccc aagcacaggc gcagaccggc tgggttcaaa accaaggaat acttccgggt 2100
atggtttggc aggacagaga tgtgtacctg caaggaccca tttgggccaa aattcctcac 2160
acggacggca actttcaccc ttctccgctg atgggagggt ttggaatgaa gcacccgcct 2220
cctcagatcc tcatcaaaaa cacacctgta cctgcggatc ctccaacggc cttcaacaag 2280
gacaagctga actctttcat cacccagtat tctactggcc aagtcagcgt ggagatcgag 2340
tgggagctgc agaaggaaaa cagcaagcgc tggaacccgg agatccagta cacttccaac 2400
tattacaagt ctaataatgt tgaatttgct gttaatactg aaggtgtata tagtgaaccc 2460
cgccccattg gcaccagata cctgactcgt aatctgtaa 2499
<210> 19
<211> 2224
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep gene expression cassette
<400> 19
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcgg atccggacaa ggtaagtatt cattgtaaat ctgatattat ttgtattatt 180
atacctacct aatttgcagt gcaggccgcc atggtaagta tcgataactt tgttttcttt 240
cacatttaca actccgacat acaaattgta attttattac tgtttggtcc ataaacactt 300
gtttaccatt tcctttttta caagttttaa tattttctgc atatataaaa cattatttat 360
tttgcagggg ttttacgaga ttgtgattaa ggtccccagc gaccttgacg ggcatctgcc 420
cggcatttct gacagctttg tgaactgggt ggccgagaag gagtgggagt tgccgccaga 480
ttctgacttg gatctgaatc tgattgagca ggcacccctg accgtggccg agaagctgca 540
gcgcgacttt ctgacggagt ggcgccgtgt gagtaaggcc ccggaggccc ttttctttgt 600
gcaatttgag aagggagaga gctacttcca cttacacgtg ctcgtggaaa ccaccggggt 660
gaaatcctta gttttgggac gtttcctgag tcagattcgc gaaaaactga ttcagagaat 720
ttaccgcggg atcgagccga ctttgccaaa ctggttcgcg gtcacaaaga ccagaaacgg 780
cgccggaggc gggaacaagg tggtggacga gtgctacatc cccaattact tgctccccaa 840
aacccagcct gagctccagt gggcgtggac taatttagaa cagtatttaa gcgcctgttt 900
gaatctcacg gagcgtaaac ggttggtggc gcagcatctg acgcacgtgt cgcagacgca 960
ggagcagaac aaagagaatc agaatcccaa ttctgacgcg ccggtgatca gatcaaaaac 1020
ttcagccagg tacatggagc tggtcgggtg gctcgtggac aaggggatta cctcggagaa 1080
gcagtggatc caggaggacc aggcctcata catctccttc aatgcggcct ccaactcgcg 1140
gtcccaaatc aaggctgcct tggacaatgc gggaaagatt atgagcctga ctaaaaccgc 1200
ccccgactac ctggtgggcc agcagcccgt ggaggacatt tccagcaatc ggatttataa 1260
aattttggaa ctaaacgggt acgatcccca atatgcggct tccgtctttc tgggatgggc 1320
cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt gggcctgcaa ctaccgggaa 1380
gaccaacatc gcggaggcca tagcccacac tgtgcccttc tacgggtgcg taaactggac 1440
caatgagaac tttcccttca acgactgtgt cgacaagatg gtgatctggt gggaggaggg 1500
gaagatgacc gccaaggtcg tggagtcggc caaagccatt ctcggaggaa gcaaggtgcg 1560
cgtggaccag aaatgcaagt cctcggccca gatagacccg actcccgtga tcgtcacctc 1620
caacaccaac atgtgcgccg tgattgacgg gaactcaacg accttcgaac accagcagcc 1680
gttgcaagac cggatgttca aatttgaact cacccgccgt ctggatcatg actttgggaa 1740
ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg tggttgaggt 1800
ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc ccagtgacgc 1860
agatataagt gagcccaaac gggtgcgcga gtcagttgcg cagccatcga cgtcagacgc 1920
ggaagcttcg atcaactacg cagacaggta ccaaaacaaa tgttctcgtc acgtgggcat 1980
gaatctgatg ctgtttccct gcagacaatg cgagagaatg aatcagaatt caaatatctg 2040
cttcactcac ggacagaaag actgtttaga gtgctttccc gtgtcagaat ctcaacccgt 2100
ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt catcatatca tgggaaaggt 2160
gccagacgct tgcactgcct gcgatctggt caatgtggat ttggatgact gcatctttga 2220
acaa 2224
<210> 20
<211> 98
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 20
gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca aatcccatta 60
cggcagtata aattcgttca ttttggatat tgtttcag 98
<210> 21
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron
<400> 21
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
cagcccatta cggcagtata aattcgttca ttttggatat tgtttcag 108
<210> 22
<211> 2451
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 22
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtcag gtagtaagta tcgataactt tgttttcttt cacatttaca 180
actccgacat acaaatccca ttacggcagt ataaattcgt tcattttgga tattgtttca 240
gtggctgccg acggttatct acccgattgg ctcgaggaca accttagtga aggaattcgc 300
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 360
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 420
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 480
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 540
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 600
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 660
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 720
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 780
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 840
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 900
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 960
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 1020
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 1080
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 1140
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 1200
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1260
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1320
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1380
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1440
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1500
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1560
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1620
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1680
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1740
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1800
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1860
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1920
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1980
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 2040
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 2100
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 2160
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 2220
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2280
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2340
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2400
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2451
<210> 23
<211> 2461
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 23
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccggggccg ccagtaagta ttcattgtaa atctgatatt atttgtatta 180
ttatacctac ctaatttgca gtgcagccca ttacggcagt ataaattcgt tcattttgga 240
tattgtttca gtggctgccg acggttatct acccgattgg ctcgaggaca accttagtga 300
aggaattcgc gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca 360
acatcaagac aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa 420
cggactcgac aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa 480
ggcctacgac cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga 540
cgccgagttc caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc 600
agtcttccag gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa 660
gacggctcct ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc 720
gggtattggc aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg 780
cgacacagag tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg 840
tgtgggatct cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg 900
tgccgatgga gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga 960
cagagtcatc accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta 1020
caagcaaatc tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta 1080
cagcaccccc tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga 1140
ctggcagcga ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct 1200
cttcaacatt caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa 1260
ccttaccagc acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg 1320
gtcggctcac gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta 1380
cgggtatctg acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct 1440
ggaatatttc ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt 1500
tgagaacgta cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa 1560
tccactcatc gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa 1620
tcaacaaacg ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa 1680
ctacatacct ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa 1740
caacagcgaa tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt 1800
gatgaatcct ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt 1860
gtctggatct ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa 1920
agtcatgata accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta 1980
tggacaagtg gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca 2040
aaaccaagga atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc 2100
catttgggcc aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg 2160
gtttggaatg aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga 2220
tcctccaacg gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg 2280
ccaagtcagc gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc 2340
ggagatccag tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac 2400
tgaaggtgta tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta 2460
a 2461
<210> 24
<211> 2111
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep gene expression cassette
<400> 24
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcgg atcctcaggt agtaagtatt cattgtaaat ctgatattat ttgtattatt 180
atacctacct aatttgcagt gcagcccatt acggcagtat aaattcgttc attttggata 240
ttgtttcagt ggggttttac gagattgtga ttaaggtccc cagcgacctt gacgggcatc 300
tgcccggcat ttctgacagc tttgtgaact gggtggccga gaaggagtgg gagttgccgc 360
cagattctga cttggatctg aatctgattg agcaggcacc cctgaccgtg gccgagaagc 420
tgcagcgcga ctttctgacg gagtggcgcc gtgtgagtaa ggccccggag gcccttttct 480
ttgtgcaatt tgagaaggga gagagctact tccacttaca cgtgctcgtg gaaaccaccg 540
gggtgaaatc cttagttttg ggacgtttcc tgagtcagat tcgcgaaaaa ctgattcaga 600
gaatttaccg cgggatcgag ccgactttgc caaactggtt cgcggtcaca aagaccagaa 660
acggcgccgg aggcgggaac aaggtggtgg acgagtgcta catccccaat tacttgctcc 720
ccaaaaccca gcctgagctc cagtgggcgt ggactaattt agaacagtat ttaagcgcct 780
gtttgaatct cacggagcgt aaacggttgg tggcgcagca tctgacgcac gtgtcgcaga 840
cgcaggagca gaacaaagag aatcagaatc ccaattctga cgcgccggtg atcagatcaa 900
aaacttcagc caggtacatg gagctggtcg ggtggctcgt ggacaagggg attacctcgg 960
agaagcagtg gatccaggag gaccaggcct catacatctc cttcaatgcg gcctccaact 1020
cgcggtccca aatcaaggct gccttggaca atgcgggaaa gattatgagc ctgactaaaa 1080
ccgcccccga ctacctggtg ggccagcagc ccgtggagga catttccagc aatcggattt 1140
ataaaatttt ggaactaaac gggtacgatc cccaatatgc ggcttccgtc tttctgggat 1200
gggccacgaa aaagttcggc aagaggaaca ccatctggct gtttgggcct gcaactaccg 1260
ggaagaccaa catcgcggag gccatagccc acactgtgcc cttctacggg tgcgtaaact 1320
ggaccaatga gaactttccc ttcaacgact gtgtcgacaa gatggtgatc tggtgggagg 1380
aggggaagat gaccgccaag gtcgtggagt cggccaaagc cattctcgga ggaagcaagg 1440
tgcgcgtgga ccagaaatgc aagtcctcgg cccagataga cccgactccc gtgatcgtca 1500
cctccaacac caacatgtgc gccgtgattg acgggaactc aacgaccttc gaacaccagc 1560
agccgttgca agaccggatg ttcaaatttg aactcacccg ccgtctggat catgactttg 1620
ggaaggtcac caagcaggaa gtcaaagact ttttccggtg ggcaaaggat cacgtggttg 1680
aggtggagca tgaattctac gtcaaaaagg gtggagccaa gaaaagaccc gcccccagtg 1740
acgcagatat aagtgagccc aaacgggtgc gcgagtcagt tgcgcagcca tcgacgtcag 1800
acgcggaagc ttcgatcaac tacgcagaca ggtaccaaaa caaatgttct cgtcacgtgg 1860
gcatgaatct gatgctgttt ccctgcagac aatgcgagag aatgaatcag aattcaaata 1920
tctgcttcac tcacggacag aaagactgtt tagagtgctt tcccgtgtca gaatctcaac 1980
ccgtttctgt cgtcaaaaag gcgtatcaga aactgtgcta cattcatcat atcatgggaa 2040
aggtgccaga cgcttgcact gcctgcgatc tggtcaatgt ggatttggat gactgcatct 2100
ttgaacaata a 2111
<210> 25
<211> 2048
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 25
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg ggctaagacg gctgccgacg gttatctacc cgattggctc 180
gaggacaacc ttagtgaagg aattcgcgag tggtgggctt tgaaacctgg agcccctcaa 240
cccaaggcaa atcaacaaca tcaagacaac gctcgaggtc ttgtgcttcc gggttacaaa 300
taccttggac ccggcaacgg actcgacaag ggggagccgg tcaacgcagc agacgcggcg 360
gccctcgagc acgacaaggc ctacgaccag cagctcaagg ccggagacaa cccgtacctc 420
aagtacaacc acgccgacgc cgagttccag gagcggctca aagaagatac gtcttttggg 480
ggcaacctcg ggcgagcagt cttccaggcc aaaaagaggc ttcttgaacc tcttggtctg 540
gttgaggaag cggctaagac ggctcctgga aagaagaggc ctgtagagca gtctcctcag 600
gaaccggact cctccgcggg tattggcaaa tcgggtgcac agcccgctaa aaagagactc 660
aatttcggtc agactggcga cacagagtca gtcccagacc ctcaaccaat cggagaacct 720
cccgcagccc cctcaggtgt gggatctctt acaatggctt caggtggtgg cgcaccagtg 780
gcagacaata acgaaggtgc cgatggagtg ggtagttcct cgggaaattg gcattgcgat 840
tcccaatggc tgggggacag agtcatcacc accagcaccc gaacctgggc cctgcccacc 900
tacaacaatc acctctacaa gcaaatctcc aacagcacat ctggaggatc ttcaaatgac 960
aacgcctact tcggctacag caccccctgg gggtattttg acttcaacag attccactgc 1020
cacttctcac cacgtgactg gcagcgactc atcaacaaca actggggatt ccggcctaag 1080
cgactcaact tcaagctctt caacattcag gtcaaagagg ttacggacaa caatggagtc 1140
aagaccatcg ccaataacct taccagcacg gtccaggtct tcacggactc agactatcag 1200
ctcccgtacg tgctcgggtc ggctcacgag ggctgcctcc cgccgttccc agcggacgtt 1260
ttcatgattc ctcagtacgg gtatctgacg cttaatgatg gaagccaggc cgtgggtcgt 1320
tcgtcctttt actgcctgga atatttcccg tcgcaaatgc taagaacggg taacaacttc 1380
cagttcagct acgagtttga gaacgtacct ttccatagca gctacgctca cagccaaagc 1440
ctggaccgac taatgaatcc actcatcgac caatacttgt actatctctc aaagactatt 1500
aacggttctg gacagaatca acaaacgcta aaattcagtg tggccggacc cagcaacatg 1560
gctgtccagg gaagaaacta catacctgga cccagctacc gacaacaacg tgtctcaacc 1620
actgtgactc aaaacaacaa cagcgaattt gcttggcctg gagcttcttc ttgggctctc 1680
aatggacgta atagcttgat gaatcctgga cctgctatgg ccagccacaa agaaggagag 1740
gaccgtttct ttcctttgtc tggatcttta atttttggca aacaaggaac tggaagagac 1800
aacgtggatg cggacaaagt catgataacc aacgaagaag aaattaaaac tactaacccg 1860
gtagcaacgg agtcctatgg acaagtggcc acaaaccacc agagtgccca agcacaggcg 1920
cagaccggct gggttcaaaa ccaaggaata cttccgggta tggtttggca ggacagagat 1980
gtgtacctgc aaggacccat ttgggccaaa attcctcaca cggacggcaa ctttcaccct 2040
tctccgct 2048
<210> 26
<211> 4814
<212> DNA
<213> Artificial Sequence
<220>
<223> ITR -GOI
<400> 26
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgccgccc gtcagtgggc agagcgcaca 180
tcgcccacag tccccgagaa gttgggggga ggggtcggca attgaaccgg tgcctagaga 240
aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag 300
ggtgggggag aaccgtatat aagtgcagta gtcgccgtga acgttctttt tcgcaacggg 360
tttgccgcca gaacacgcgt aagggatccg ccaccatggt gagcaagggc gaggaggata 420
acatggccat catcaaggag ttcatgcgct tcaaggtgca catggagggc tccgtgaacg 480
gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc acccagaccg 540
ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc ctgggacatc ctgtcccctc 600
agttcatgta cggctccaag gcctacgtga agcaccccgc cgacatcccc gactacttga 660
agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag gacggcggcg 720
tggtgaccgt gacccaggac tcctccctgc aggacggcga gttcatctac aaggtgaagc 780
tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc atgggctggg 840
aggcctcctc cgagcggatg taccccgagg acggcgccct gaagggcgag atcaagcaga 900
ggctgaagct gaaggacggc ggccactacg acgctgaggt caagaccacc tacaaggcca 960
agaagcccgt gcagctgccc ggcgcctaca acgtcaacat caagttggac atcacctccc 1020
acaacgagga ctacaccatc gtggaacagt acgaacgcgc cgagggccgc cactccaccg 1080
gcggcatgga cgagctgtac aagtaagaat tcgatatcaa gcttatcgat aatcaacctc 1140
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1200
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1260
ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 1320
tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 1380
ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 1440
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1500
acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 1560
ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 1620
accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 1680
ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgataccga gcgctgctcg 1740
agagatctac gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt 1800
tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga 1860
ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt 1920
tgggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc 1980
acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc 2040
tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg 2100
gtagagacgg ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat 2160
ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc 2220
tgtccttctg attttgtagg taaccacgtg cggaccgagc ggccgcagga acccctagtg 2280
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 2340
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 2400
ctgcaggcct gcaggcagct gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc 2460
gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga 2520
gtggccaact ccatcactag gggttcctgc ggccgcacgc gccgcccgtc agtgggcaga 2580
gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc 2640
ctagagaagg tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt 2700
tcccgagggt gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg 2760
caacgggttt gccgccagaa cacgcgtaag ggatccgcca ccatggtgag caagggcgag 2820
gaggataaca tggccatcat caaggagttc atgcgcttca aggtgcacat ggagggctcc 2880
gtgaacggcc acgagttcga gatcgagggc gagggcgagg gccgccccta cgagggcacc 2940
cagaccgcca agctgaaggt gaccaagggt ggccccctgc ccttcgcctg ggacatcctg 3000
tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc accccgccga catccccgac 3060
tacttgaagc tgtccttccc cgagggcttc aagtgggagc gcgtgatgaa cttcgaggac 3120
ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg acggcgagtt catctacaag 3180
gtgaagctgc gcggcaccaa cttcccctcc gacggccccg taatgcagaa gaagaccatg 3240
ggctgggagg cctcctccga gcggatgtac cccgaggacg gcgccctgaa gggcgagatc 3300
aagcagaggc tgaagctgaa ggacggcggc cactacgacg ctgaggtcaa gaccacctac 3360
aaggccaaga agcccgtgca gctgcccggc gcctacaacg tcaacatcaa gttggacatc 3420
acctcccaca acgaggacta caccatcgtg gaacagtacg aacgcgccga gggccgccac 3480
tccaccggcg gcatggacga gctgtacaag taagaattcg atatcaagct tatcgataat 3540
caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 3600
tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 3660
gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 3720
cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 3780
tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 3840
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 3900
ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc 3960
tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 4020
ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc 4080
cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg ataccgagcg 4140
ctgctcgaga gatctacggg tggcatccct gtgacccctc cccagtgcct ctcctggccc 4200
tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt tgcatcattt 4260
tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta tggagcaagg 4320
ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca agctggagtg 4380
cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg attctcctgc 4440
ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc taatttttgt 4500
ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac tcctaatctc 4560
aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga accactgctc 4620
ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg accgagcggc cgcaggaacc 4680
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 4740
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 4800
cagctgcctg cagg 4814
<210> 27
<211> 2602
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 27
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatggtaatt ttattactgt 240
ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat gttctgcata 300
tataaaacat tatgtatttt gcagcacctt caacggctcg ggagaagggc ggggaagcct 360
cctaacctgc ggtgacgttg aggaaaatcc gggtccagct gccgacggtt atctacccga 420
ttggctcgag gacactctct ctgaaggaat aagacagtgg tggaagctca aacctggccc 480
accaccacca aagcccgcag agcggcataa ggacgacagc aggggtcttg tgcttcctgg 540
gtacaagtac ctcggaccct tcaacggact cgacaaggga gagccggtca acgaggcaga 600
cgccgcggcc ctcgagcacg acaaagccta cgaccggcag ctcgacagcg gagacaaccc 660
gtacctcaag tacaaccacg ccgacgcgga gtttcaggag cgccttaaag aagatacgtc 720
ttttgggggc aacctcggac gagcagtctt ccaggcgaaa aagagggttc ttgaacctct 780
gggcctggtt gaggaacctg ttaagacggc tccgggaaaa aagaggccgg tagagcactc 840
tcctgtggag ccagactcct cctcgggaac cggaaaggcg ggccagcagc ctgcaagaaa 900
aagattgaat tttggtcaga ctggagacgc agactcagta cctgaccccc agcctctcgg 960
acagccacca gcagccccct ctggtctggg aactaatacg atggctacag gcagtggcgc 1020
accaatggca gacaataacg agggcgccga cggagtgggt aattcctcgg gaaattggca 1080
ttgcgattcc acatggatgg gcgacagagt catcaccacc agcacccgaa cctgggccct 1140
gcccacctac aacaaccacc tctacaaaca aatttccagc caatcaggag cctcgaacga 1200
caatcactac tttggctaca gcaccccttg ggggtatttt gacttcaaca gattccactg 1260
ccacttttca ccacgtgact ggcaaagact catcaacaac aactggggat tccgacccaa 1320
gagactcaac ttcaagctct ttaacattca agtcaaagag gtcacgcaga atgacggtac 1380
gacgacgatt gccaataacc ttaccagcac ggttcaggtg tttactgact cggagtacca 1440
gctcccgtac gtcctcggct cggcgcatca aggatgcctc ccgccgttcc cagcagacgt 1500
cttcatggtg ccacagtatg gatacctcac cctgaacaac gggagtcagg cagtaggacg 1560
ctcttcattt tactgcctgg agtactttcc ttctcagatg ctgcgtaccg gaaacaactt 1620
taccttcagc tacacttttg aggacgttcc tttccacagc agctacgctc acagccagag 1680
tctggaccgt ctcatgaatc ctctcatcga ccagtacctg tattacttga gcagaacaaa 1740
cactccaagt ggaaccacca cgcagtcaag gcttcagttt tctcaggccg gagcgagtga 1800
cattcgggac cagtctagga actggcttcc tggaccctgt taccgccagc agcgagtatc 1860
aaagacatct gcggataaca acaacagtga atactcgtgg actggagcta ccaagtacca 1920
cctcaatggc agagactctc tggtgaatcc gggcccggcc atggcaagcc acaaggacga 1980
tgaagaaaag ttttttcctc agagcggggt tctcatcttt gggaagcaag gctcagagaa 2040
aacaaatgtg gacattgaaa aggtcatgat tacagacgaa gaggaaatca ggacaaccaa 2100
tcccgtggct acggagcagt atggttctgt atctaccaac ctccagagag gcaacagaca 2160
agcagctacc gcagatgtca acacacaagg cgttcttcca ggcatggtct ggcaggacag 2220
agatgtgtac cttcaggggc ccatctgggc aaagattcca cacacggacg gacattttca 2280
cccctctccc ctcatgggtg gattcggact taaacaccct cctccacaga ttctcatcaa 2340
gaacaccccg gtacctgcga atccttcgac caccttcagt gcggcaaagt ttgcttcctt 2400
catcacacag tactccacgg gacaggtcag cgtggagatc gagtgggagc tgcagaagga 2460
aaacagcaaa cgctggaatc ccgaaattca gtacacttcc aactacaaca agtctgttaa 2520
tgtggacttt actgtggaca ctaatggcgt gtattcagag cctcgcccca ttggcaccag 2580
atacctgact cgtaatctgt aa 2602
<210> 28
<211> 2574
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 28
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggggac aaggtaagta ttcattgtaa atctgatatt atttgtatta 180
ttatacctac ctaatttgca gtgcaggccg ccatggtaag tatcgataac tttgttttct 240
ttcacattta caactccgac atacaaattg taattttatt actgtttggt ccataaacac 300
ttgtttacca tttccttttt tacaagtttt aatattttct gcatatataa aacattattt 360
attttgcagg ctgccgacgg ttatctaccc gattggctcg aggacactct ctctgaagga 420
ataagacagt ggtggaagct caaacctggc ccaccaccac caaagcccgc agagcggcat 480
aaggacgaca gcaggggtct tgtgcttcct gggtacaagt acctcggacc cttcaacgga 540
ctcgacaagg gagagccggt caacgaggca gacgccgcgg ccctcgagca cgacaaagcc 600
tacgaccggc agctcgacag cggagacaac ccgtacctca agtacaacca cgccgacgcg 660
gagtttcagg agcgccttaa agaagatacg tcttttgggg gcaacctcgg acgagcagtc 720
ttccaggcga aaaagagggt tcttgaacct ctgggcctgg ttgaggaacc tgttaagacg 780
gctccgggaa aaaagaggcc ggtagagcac tctcctgtgg agccagactc ctcctcggga 840
accggaaagg cgggccagca gcctgcaaga aaaagattga attttggtca gactggagac 900
gcagactcag tacctgaccc ccagcctctc ggacagccac cagcagcccc ctctggtctg 960
ggaactaata cgatggctac aggcagtggc gcaccaatgg cagacaataa cgagggcgcc 1020
gacggagtgg gtaattcctc gggaaattgg cattgcgatt ccacatggat gggcgacaga 1080
gtcatcacca ccagcacccg aacctgggcc ctgcccacct acaacaacca cctctacaaa 1140
caaatttcca gccaatcagg agcctcgaac gacaatcact actttggcta cagcacccct 1200
tgggggtatt ttgacttcaa cagattccac tgccactttt caccacgtga ctggcaaaga 1260
ctcatcaaca acaactgggg attccgaccc aagagactca acttcaagct ctttaacatt 1320
caagtcaaag aggtcacgca gaatgacggt acgacgacga ttgccaataa ccttaccagc 1380
acggttcagg tgtttactga ctcggagtac cagctcccgt acgtcctcgg ctcggcgcat 1440
caaggatgcc tcccgccgtt cccagcagac gtcttcatgg tgccacagta tggatacctc 1500
accctgaaca acgggagtca ggcagtagga cgctcttcat tttactgcct ggagtacttt 1560
ccttctcaga tgctgcgtac cggaaacaac tttaccttca gctacacttt tgaggacgtt 1620
cctttccaca gcagctacgc tcacagccag agtctggacc gtctcatgaa tcctctcatc 1680
gaccagtacc tgtattactt gagcagaaca aacactccaa gtggaaccac cacgcagtca 1740
aggcttcagt tttctcaggc cggagcgagt gacattcggg accagtctag gaactggctt 1800
cctggaccct gttaccgcca gcagcgagta tcaaagacat ctgcggataa caacaacagt 1860
gaatactcgt ggactggagc taccaagtac cacctcaatg gcagagactc tctggtgaat 1920
ccgggcccgg ccatggcaag ccacaaggac gatgaagaaa agttttttcc tcagagcggg 1980
gttctcatct ttgggaagca aggctcagag aaaacaaatg tggacattga aaaggtcatg 2040
attacagacg aagaggaaat caggacaacc aatcccgtgg ctacggagca gtatggttct 2100
gtatctacca acctccagag aggcaacaga caagcagcta ccgcagatgt caacacacaa 2160
ggcgttcttc caggcatggt ctggcaggac agagatgtgt accttcaggg gcccatctgg 2220
gcaaagattc cacacacgga cggacatttt cacccctctc ccctcatggg tggattcgga 2280
cttaaacacc ctcctccaca gattctcatc aagaacaccc cggtacctgc gaatccttcg 2340
accaccttca gtgcggcaaa gtttgcttcc ttcatcacac agtactccac gggacaggtc 2400
agcgtggaga tcgagtggga gctgcagaag gaaaacagca aacgctggaa tcccgaaatt 2460
cagtacactt ccaactacaa caagtctgtt aatgtggact ttactgtgga cactaatggc 2520
gtgtattcag agcctcgccc cattggcacc agatacctga ctcgtaatct gtaa 2574
<210> 29
<211> 2448
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 29
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtcag gtagtaagta tcgataactt tgttttcttt cacatttaca 180
actccgacat acaaatccca ttacggcagt ataaattcgt tcattttgga tattgtttca 240
gtggctgccg acggttatct acccgattgg ctcgaggaca ctctctctga aggaataaga 300
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 360
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 420
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 480
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 540
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 600
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 660
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 720
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 780
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 840
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 900
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 960
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 1020
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 1080
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 1140
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 1200
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1260
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1320
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1380
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1440
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1500
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1560
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1620
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1680
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1740
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1800
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1860
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1920
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1980
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 2040
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 2100
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 2160
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 2220
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2280
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2340
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2400
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2448
<210> 30
<211> 2569
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 30
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatggtaatt ttattactgt 240
ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat gttctgcata 300
tataaaacat tatgtatttt gcagcacctt caacggctcg ggagaagggc ggggaagcct 360
cctaacctgc ggtgacgttg aggaaaatcc gggtccatct tttgttgatc acccacccga 420
ttggttggaa gaagttggtg aaggtcttcg cgagtttttg ggccttgaag cgggcccacc 480
gaaaccaaaa cccaatcagc agcatcaaga tcaagcccgt ggtcttgtgc tgcctggtta 540
taactatctc ggacccggaa acggtctcga tcgaggagag cctgtcaaca gggcagacga 600
ggtcgcgcga gagcacgaca tctcgtacaa cgagcagctt gaggcgggag acaaccccta 660
cctcaagtac aaccacgcgg acgccgagtt tcaggagaag ctcgccgacg acacatcctt 720
cgggggaaac ctcggaaagg cagtctttca ggccaagaaa agggttctcg aaccttttgg 780
cctggttgaa gagggtgcta agacggcccc taccggaaag cggatagacg accactttcc 840
aaaaagaaag aaggctcgga ccgaagagga ctccaagcct tccacctcgt cagacgccga 900
agctggaccc agcggatccc agcagctgca aatcccagcc caaccagcct caagtttggg 960
agctgataca atgtctgcgg gaggtggcgg cccattgggc gacaataacc aaggtgccga 1020
tggagtgggc aatgcctcgg gagattggca ttgcgattcc acgtggatgg gggacagagt 1080
cgtcaccaag tccacccgaa cctgggtgct gcccagctac aacaaccacc agtaccgaga 1140
gatcaaaagc ggctccgtcg acggaagcaa cgccaacgcc tactttggat acagcacccc 1200
ctgggggtac tttgacttta accgcttcca cagccactgg agcccccgag actggcaaag 1260
actcatcaac aactactggg gcttcagacc ccggtccctc agagtcaaaa tcttcaacat 1320
tcaagtcaaa gaggtcacgg tgcaggactc caccaccacc atcgccaaca acctcacctc 1380
caccgtccaa gtgtttacgg acgacgacta ccagctgccc tacgtcgtcg gcaacgggac 1440
cgagggatgc ctgccggcct tccctccgca ggtctttacg ctgccgcagt acggttacgc 1500
gacgctgaac cgcgacaaca cagaaaatcc caccgagagg agcagcttct tctgcctaga 1560
gtactttccc agcaagatgc tgagaacggg caacaacttt gagtttacct acaactttga 1620
ggaggtgccc ttccactcca gcttcgctcc cagtcagaac ctcttcaagc tggccaaccc 1680
gctggtggac cagtacttgt accgcttcgt gagcacaaat aacactggcg gagtccagtt 1740
caacaagaac ctggccggga gatacgccaa cacctacaaa aactggttcc cggggcccat 1800
gggccgaacc cagggctgga acctgggctc cggggtcaac cgcgccagtg tcagcgcctt 1860
cgccacgacc aataggatgg agctcgaggg cgcgagttac caggtgcccc cgcagccgaa 1920
cggcatgacc aacaacctcc agggcagcaa cacctatgcc ctggagaaca ctatgatctt 1980
caacagccag ccggcgaacc cgggcaccac cgccacgtac ctcgagggca acatgctcat 2040
caccagcgag agcgagacgc agccggtgaa ccgcgtggcg tacaacgtcg gcgggcagat 2100
ggccaccaac aaccagagct ccaccactgc ccccgcgacc ggcacgtaca acctccagga 2160
aatcgtgccc ggcagcgtgt ggatggagag ggacgtgtac ctccaaggac ccatctgggc 2220
caagatccca gagacggggg cgcactttca cccctctccg gccatgggcg gattcggact 2280
caaacaccca ccgcccatga tgctcatcaa gaacacgcct gtgcccggaa atatcaccag 2340
cttctcggac gtgcccgtca gcagcttcat cacccagtac agcaccgggc aggtcaccgt 2400
ggagatggag tgggagctca agaaggaaaa ctccaagagg tggaacccag agatccagta 2460
cacaaacaac tacaacgacc cccagtttgt ggactttgcc ccggacagca ccggggaata 2520
cagaagcacc agacctatcg gaacccgata ccttacccga cccctttaa 2569
<210> 31
<211> 2541
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 31
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggggac aaggtaagta ttcattgtaa atctgatatt atttgtatta 180
ttatacctac ctaatttgca gtgcaggccg ccatggtaag tatcgataac tttgttttct 240
ttcacattta caactccgac atacaaattg taattttatt actgtttggt ccataaacac 300
ttgtttacca tttccttttt tacaagtttt aatattttct gcatatataa aacattattt 360
attttgcagt cttttgttga tcacccaccc gattggttgg aagaagttgg tgaaggtctt 420
cgcgagtttt tgggccttga agcgggccca ccgaaaccaa aacccaatca gcagcatcaa 480
gatcaagccc gtggtcttgt gctgcctggt tataactatc tcggacccgg aaacggtctc 540
gatcgaggag agcctgtcaa cagggcagac gaggtcgcgc gagagcacga catctcgtac 600
aacgagcagc ttgaggcggg agacaacccc tacctcaagt acaaccacgc ggacgccgag 660
tttcaggaga agctcgccga cgacacatcc ttcgggggaa acctcggaaa ggcagtcttt 720
caggccaaga aaagggttct cgaacctttt ggcctggttg aagagggtgc taagacggcc 780
cctaccggaa agcggataga cgaccacttt ccaaaaagaa agaaggctcg gaccgaagag 840
gactccaagc cttccacctc gtcagacgcc gaagctggac ccagcggatc ccagcagctg 900
caaatcccag cccaaccagc ctcaagtttg ggagctgata caatgtctgc gggaggtggc 960
ggcccattgg gcgacaataa ccaaggtgcc gatggagtgg gcaatgcctc gggagattgg 1020
cattgcgatt ccacgtggat gggggacaga gtcgtcacca agtccacccg aacctgggtg 1080
ctgcccagct acaacaacca ccagtaccga gagatcaaaa gcggctccgt cgacggaagc 1140
aacgccaacg cctactttgg atacagcacc ccctgggggt actttgactt taaccgcttc 1200
cacagccact ggagcccccg agactggcaa agactcatca acaactactg gggcttcaga 1260
ccccggtccc tcagagtcaa aatcttcaac attcaagtca aagaggtcac ggtgcaggac 1320
tccaccacca ccatcgccaa caacctcacc tccaccgtcc aagtgtttac ggacgacgac 1380
taccagctgc cctacgtcgt cggcaacggg accgagggat gcctgccggc cttccctccg 1440
caggtcttta cgctgccgca gtacggttac gcgacgctga accgcgacaa cacagaaaat 1500
cccaccgaga ggagcagctt cttctgccta gagtactttc ccagcaagat gctgagaacg 1560
ggcaacaact ttgagtttac ctacaacttt gaggaggtgc ccttccactc cagcttcgct 1620
cccagtcaga acctcttcaa gctggccaac ccgctggtgg accagtactt gtaccgcttc 1680
gtgagcacaa ataacactgg cggagtccag ttcaacaaga acctggccgg gagatacgcc 1740
aacacctaca aaaactggtt cccggggccc atgggccgaa cccagggctg gaacctgggc 1800
tccggggtca accgcgccag tgtcagcgcc ttcgccacga ccaataggat ggagctcgag 1860
ggcgcgagtt accaggtgcc cccgcagccg aacggcatga ccaacaacct ccagggcagc 1920
aacacctatg ccctggagaa cactatgatc ttcaacagcc agccggcgaa cccgggcacc 1980
accgccacgt acctcgaggg caacatgctc atcaccagcg agagcgagac gcagccggtg 2040
aaccgcgtgg cgtacaacgt cggcgggcag atggccacca acaaccagag ctccaccact 2100
gcccccgcga ccggcacgta caacctccag gaaatcgtgc ccggcagcgt gtggatggag 2160
agggacgtgt acctccaagg acccatctgg gccaagatcc cagagacggg ggcgcacttt 2220
cacccctctc cggccatggg cggattcgga ctcaaacacc caccgcccat gatgctcatc 2280
aagaacacgc ctgtgcccgg aaatatcacc agcttctcgg acgtgcccgt cagcagcttc 2340
atcacccagt acagcaccgg gcaggtcacc gtggagatgg agtgggagct caagaaggaa 2400
aactccaaga ggtggaaccc agagatccag tacacaaaca actacaacga cccccagttt 2460
gtggactttg ccccggacag caccggggaa tacagaagca ccagacctat cggaacccga 2520
taccttaccc gaccccttta a 2541
<210> 32
<211> 2415
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 32
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtcag gtagtaagta tcgataactt tgttttcttt cacatttaca 180
actccgacat acaaatccca ttacggcagt ataaattcgt tcattttgga tattgtttca 240
gtgtcttttg ttgatcaccc acccgattgg ttggaagaag ttggtgaagg tcttcgcgag 300
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 360
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 420
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 480
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 540
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 600
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 660
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 720
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 780
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 840
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 900
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 960
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 1020
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 1080
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 1140
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 1200
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1260
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1320
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1380
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1440
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1500
cagaacctct tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1560
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1620
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1680
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1740
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1800
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1860
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1920
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1980
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 2040
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 2100
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 2160
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 2220
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2280
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2340
tttgccccgg acagcaccgg ggaatacaga agcaccagac ctatcggaac ccgatacctt 2400
acccgacccc tttaa 2415
<210> 33
<211> 2611
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 33
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtagg acaaggtaag tattcattgt aaatctgata ttatttgtat 180
tattatacct acctaatttg cagtgcagat aaatatgccg gatggtaatt ttattactgt 240
ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat gttctgcata 300
tataaaacat tatgtatttt gcagcacctt caacggctcg ggagaagggc ggggaagcct 360
cctaacctgc ggtgacgttg aggaaaatcc gggtccagct gccgacggtt atctacccga 420
ttggctcgag gacaacctct ctgagggcat tcgcgagtgg tgggcgctga aacctggagc 480
cccgaagccc aaagccaacc agcaaaagca ggacgacggc cggggtctgg tgcttcctgg 540
ctacaagtac ctcggaccct tcaacggact cgacaagggg gagcccgtca acgcggcgga 600
cgcagcggcc ctcgagcacg acaaggccta cgaccagcag ctgcaggcgg gtgacaatcc 660
gtacctgcgg tataaccacg ccgacgccga gtttcaggag cgtctgcaag aagatacgtc 720
ttttgggggc aacctcgggc gagcagtctt ccaggccaag aagcgggttc tcgaacctct 780
cggtctggtt gaggaaggcg ctaagacggc tcctggaaag aagagaccgg tagagccatc 840
accccagcgt tctccagact cctctacggg catcggcaag aaaggccaac agcccgccag 900
aaaaagactc aattttggtc agactggcga ctcagagtca gttccagacc ctcaacctct 960
cggagaacct ccagcagcgc cctctggtgt gggacctaat acaatggctg caggcggtgg 1020
cgcaccaatg gcagacaata acgaaggcgc cgacggagtg ggtagttcct cgggaaattg 1080
gcattgcgat tccacatggc tgggcgacag agtcatcacc accagcaccc gaacctgggc 1140
cctgcccacc tacaacaacc acctctacaa gcaaatctcc aacgggacat cgggaggagc 1200
caccaacgac aacacctact tcggctacag caccccctgg gggtattttg actttaacag 1260
attccactgc cacttttcac cacgtgactg gcagcgactc atcaacaaca actggggatt 1320
ccggcccaag agactcagct tcaagctctt caacatccag gtcaaggagg tcacgcagaa 1380
tgaaggcacc aagaccatcg ccaataacct caccagcacc atccaggtgt ttacggactc 1440
ggagtaccag ctgccgtacg ttctcggctc tgcccaccag ggctgcctgc ctccgttccc 1500
ggcggacgtg ttcatgattc cccagtacgg ctacctaaca ctcaacaacg gtagtcaggc 1560
cgtgggacgc tcctccttct actgcctgga atactttcct tcgcagatgc tgagaaccgg 1620
caacaacttc cagtttactt acaccttcga ggacgtgcct ttccacagca gctacgccca 1680
cagccagagc ttggaccggc tgatgaatcc tctgattgac cagtacctgt actacttgtc 1740
tcggactcaa acaacaggag gcacggcaaa tacgcagact ctgggcttca gccaaggtgg 1800
gcctaataca atggccaatc aggcaaagaa ctggctgcca ggaccctgtt accgccaaca 1860
acgcgtctca acgacaaccg ggcaaaacaa caatagcaac tttgcctgga ctgctgggac 1920
caaataccat ctgaatggaa gaaattcatt ggctaatcct ggcatcgcta tggcaacaca 1980
caaagacgac gaggagcgtt tttttcccag taacgggatc ctgatttttg gcaaacaaaa 2040
tgctgccaga gacaatgcgg attacagcga tgtcatgctc accagcgagg aagaaatcaa 2100
aaccactaac cctgtggcta cagaggaata cggtatcgtg gcagataact tgcagcagca 2160
aaacacggct cctcaaattg gaactgtcaa cagccagggg gccttacccg gtatggtctg 2220
gcagaaccgg gacgtgtacc tgcagggtcc catctgggcc aagattcctc acacggacgg 2280
caacttccac ccgtctccgc tgatgggcgg ctttggcctg aaacatcctc cgcctcagat 2340
cctgatcaag aacacgcctg tacctgcgga tcctccgacc accttcaacc agtcaaagct 2400
gaactctttc atcacgcaat acagcaccgg acaggtcagc gtggaaattg aatgggagct 2460
gcagaaggaa aacagcaagc gctggaaccc cgagatccag tacacctcca actactacaa 2520
atctacaagt gtggactttg ctgttaatac agaaggcgtg tactctgaac cccgccccat 2580
tggcacccgt tacctcaccc gtaatctgta a 2611
<210> 34
<211> 2583
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 34
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggggac aaggtaagta ttcattgtaa atctgatatt atttgtatta 180
ttatacctac ctaatttgca gtgcaggccg ccatggtaag tatcgataac tttgttttct 240
ttcacattta caactccgac atacaaattg taattttatt actgtttggt ccataaacac 300
ttgtttacca tttccttttt tacaagtttt aatattttct gcatatataa aacattattt 360
attttgcagg ctgccgacgg ttatctaccc gattggctcg aggacaacct ctctgagggc 420
attcgcgagt ggtgggcgct gaaacctgga gccccgaagc ccaaagccaa ccagcaaaag 480
caggacgacg gccggggtct ggtgcttcct ggctacaagt acctcggacc cttcaacgga 540
ctcgacaagg gggagcccgt caacgcggcg gacgcagcgg ccctcgagca cgacaaggcc 600
tacgaccagc agctgcaggc gggtgacaat ccgtacctgc ggtataacca cgccgacgcc 660
gagtttcagg agcgtctgca agaagatacg tcttttgggg gcaacctcgg gcgagcagtc 720
ttccaggcca agaagcgggt tctcgaacct ctcggtctgg ttgaggaagg cgctaagacg 780
gctcctggaa agaagagacc ggtagagcca tcaccccagc gttctccaga ctcctctacg 840
ggcatcggca agaaaggcca acagcccgcc agaaaaagac tcaattttgg tcagactggc 900
gactcagagt cagttccaga ccctcaacct ctcggagaac ctccagcagc gccctctggt 960
gtgggaccta atacaatggc tgcaggcggt ggcgcaccaa tggcagacaa taacgaaggc 1020
gccgacggag tgggtagttc ctcgggaaat tggcattgcg attccacatg gctgggcgac 1080
agagtcatca ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac 1140
aagcaaatct ccaacgggac atcgggagga gccaccaacg acaacaccta cttcggctac 1200
agcaccccct gggggtattt tgactttaac agattccact gccacttttc accacgtgac 1260
tggcagcgac tcatcaacaa caactgggga ttccggccca agagactcag cttcaagctc 1320
ttcaacatcc aggtcaagga ggtcacgcag aatgaaggca ccaagaccat cgccaataac 1380
ctcaccagca ccatccaggt gtttacggac tcggagtacc agctgccgta cgttctcggc 1440
tctgcccacc agggctgcct gcctccgttc ccggcggacg tgttcatgat tccccagtac 1500
ggctacctaa cactcaacaa cggtagtcag gccgtgggac gctcctcctt ctactgcctg 1560
gaatactttc cttcgcagat gctgagaacc ggcaacaact tccagtttac ttacaccttc 1620
gaggacgtgc ctttccacag cagctacgcc cacagccaga gcttggaccg gctgatgaat 1680
cctctgattg accagtacct gtactacttg tctcggactc aaacaacagg aggcacggca 1740
aatacgcaga ctctgggctt cagccaaggt gggcctaata caatggccaa tcaggcaaag 1800
aactggctgc caggaccctg ttaccgccaa caacgcgtct caacgacaac cgggcaaaac 1860
aacaatagca actttgcctg gactgctggg accaaatacc atctgaatgg aagaaattca 1920
ttggctaatc ctggcatcgc tatggcaaca cacaaagacg acgaggagcg tttttttccc 1980
agtaacggga tcctgatttt tggcaaacaa aatgctgcca gagacaatgc ggattacagc 2040
gatgtcatgc tcaccagcga ggaagaaatc aaaaccacta accctgtggc tacagaggaa 2100
tacggtatcg tggcagataa cttgcagcag caaaacacgg ctcctcaaat tggaactgtc 2160
aacagccagg gggccttacc cggtatggtc tggcagaacc gggacgtgta cctgcagggt 2220
cccatctggg ccaagattcc tcacacggac ggcaacttcc acccgtctcc gctgatgggc 2280
ggctttggcc tgaaacatcc tccgcctcag atcctgatca agaacacgcc tgtacctgcg 2340
gatcctccga ccaccttcaa ccagtcaaag ctgaactctt tcatcacgca atacagcacc 2400
ggacaggtca gcgtggaaat tgaatgggag ctgcagaagg aaaacagcaa gcgctggaac 2460
cccgagatcc agtacacctc caactactac aaatctacaa gtgtggactt tgctgttaat 2520
acagaaggcg tgtactctga accccgcccc attggcaccc gttacctcac ccgtaatctg 2580
taa 2583
<210> 35
<211> 2457
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 35
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca cccgggtcag gtagtaagta tcgataactt tgttttcttt cacatttaca 180
actccgacat acaaatccca ttacggcagt ataaattcgt tcattttgga tattgtttca 240
gtggctgccg acggttatct acccgattgg ctcgaggaca acctctctga gggcattcgc 300
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 360
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 420
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 480
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 540
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 600
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 660
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 720
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 780
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 840
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 900
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 960
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 1020
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 1080
ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 1140
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 1200
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1260
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1320
caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1380
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1440
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1500
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1560
attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1620
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1680
ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1740
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1800
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1860
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1920
atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1980
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 2040
cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 2100
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 2160
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 2220
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2280
gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2340
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2400
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2457
<210> 36
<211> 18
<212> PRT
<213> Thosea asigna virus
<220>
<223> Self-cleaving peptides T2A
<400> 36
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 37
<211> 19
<212> PRT
<213> Porcine teschovirus
<220>
<223> Self-cleaving peptides P2A
<400> 37
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 38
<211> 20
<212> PRT
<213> Equine rhinitis A virus
<220>
<223> Self-cleaving peptides E2A
<400> 38
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 39
<211> 22
<212> PRT
<213> Foot-and-mouth disease virus
<220>
<223> Self-cleaving peptides F2A
<400> 39
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20

Claims (27)

1.一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒,其特征在于,包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的内含子,所述内含子中包含翻译起始密码子ATG,或者所述内含子位于ATG中的任意相邻两个核苷酸之间;
在转录后加工过程中,通过内含子的选择性剪接作用,使得所述人工构建序列中的翻译起始密码子AUG保留或缺失,或者在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
2.根据权利要求1所述的表达盒,其特征在于:所述人工构建序列包含从5’至3’的、可操作连接的:
所述内含子的5’部分;
翻译起始密码子ATG;
所述内含子的3’部分;
编码2A自剪切多肽的核苷酸序列。
3.根据权利要求2所述的表达盒,其特征在于:所述2A自剪切多肽为T2A肽、P2A肽、E2A肽或F2A肽。
4.根据权利要求1所述的表达盒,其特征在于:所述人工构建序列包含从5’至3’的、可操作连接的:
第一内含子的5’部分;
翻译起始密码子ATG;
第二内含子的5’部分;
所述内含子的3’部分;
其中,所述第二内含子的5’部分内部有终止密码子,所述终止密码子与所述翻译起始密码子ATG之间的核苷酸数为3的倍数。
5.根据权利要求1所述的表达盒,其特征在于:所述内含子的5’端核苷酸为GTNN,所述内含子的3’端核苷酸为NNAG,其中N为A、T、C、G四种核苷酸中的任意一种。
6.根据权利要求1所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因或AAV的rep基因。
7.根据权利要求1所述的表达盒,其特征在于:所述启动子为polh启动子或p10启动子。
8.根据权利要求7所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因,所述启动子为p10启动子。
9.根据权利要求7所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的rep基因,所述启动子为polh启动子。
10.一种核酸分子,其特征在于:包含第一表达盒,所述第一表达盒为权利要求1-9任一所述的表达盒。
11.根据权利要求10所述的核酸分子,其特征在于:还包含第二表达盒,所述第二表达盒为权利要求1-9任一所述的表达盒,且所述第二表达盒表达的基因与所述第一表达盒表达的基因不同。
12.根据权利要求11所述的核酸分子,其特征在于:所述第二表达盒相对于所述第一表达盒为反义方向。
13.根据权利要求11所述的核酸分子,其特征在于:所述第二表达盒相对于所述第一表达盒为正义方向。
14.根据权利要求10所述的核酸分子,其特征在于:还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列。
15.根据权利要求14所述的核酸分子,其特征在于:所述外源基因为报告基因,所述报告基因为氯霉素乙酰转移酶编码基因、β-半乳糖苷酶编码基因、β-葡萄糖醛酸酶编码基因、海肾荧光素酶编码基因、碱性磷酸酶编码基因、萤火虫荧光素酶编码基因、绿色荧光蛋白编码基因和红色荧光蛋白编码基因中的至少一种。
16.根据权利要求14所述的核酸分子,其特征在于:所述外源基因为编码药物多肽的基因,所述药物多肽为脂蛋白酯酶、载脂蛋白、细胞因子、白细胞介素和干扰素中的至少一种。
17.一种载体,其特征在于:包含权利要求1-9任一所述的表达盒。
18.根据权利要求17所述的载体,其特征在于:所述载体为昆虫细胞相容性载体。
19.根据权利要求17所述的载体,其特征在于:所述载体为质粒和病毒中的至少一种。
20.权利要求17所述的载体在昆虫细胞中制备重组腺相关病毒的应用。
21.权利要求17所述的载体在体外制备AAV衣壳中的应用,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因。
22.一种昆虫细胞,其特征在于:包含权利要求1-9任一所述的表达盒。
23.根据权利要求22所述的昆虫细胞,其特征在于:所述表达盒被整合至所述昆虫细胞的基因组中。
24.根据权利要求22所述的昆虫细胞,其特征在于:所述昆虫细胞为草地贪夜蛾细胞、粉纹夜蛾细胞、果蝇细胞或蚊子细胞。
25.一种细胞培养物,其特征在于:包含权利要求22所述的昆虫细胞和培养基。
26.根据权利要求25所述的细胞培养物,其特征在于:所述培养基中包含AAV基因组。
27.一种重组腺相关病毒粒子,其特征在于:是在能产生重组腺相关病毒粒子的条件下培养权利要求22所述的昆虫细胞,然后回收制得的。
CN202111105263.5A 2021-09-18 2021-09-18 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用 Active CN113897396B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202111105263.5A CN113897396B (zh) 2021-09-18 2021-09-18 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
PCT/CN2021/120828 WO2023039936A1 (zh) 2021-09-18 2021-09-27 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
JP2023504515A JP2023544947A (ja) 2021-09-18 2021-09-27 昆虫細胞内で重複オープンリーディングフレームを含む遺伝子を発現するための発現カセット及びその使用
EP21952111.9A EP4180522A4 (en) 2021-09-18 2021-09-27 EXPRESSION CASSETTE FOR EXPRESSING A GENE CONTAINING AN OVERLAPPING OPEN READING FRAME IN AN INSECT CELL, AND USE THEREOF
AU2021456512A AU2021456512A1 (en) 2021-09-18 2021-09-27 Expression cassette for expressing gene comprising overlapping open reading frames in insect cell and application thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111105263.5A CN113897396B (zh) 2021-09-18 2021-09-18 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用

Publications (2)

Publication Number Publication Date
CN113897396A true CN113897396A (zh) 2022-01-07
CN113897396B CN113897396B (zh) 2022-08-30

Family

ID=79028994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111105263.5A Active CN113897396B (zh) 2021-09-18 2021-09-18 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用

Country Status (5)

Country Link
EP (1) EP4180522A4 (zh)
JP (1) JP2023544947A (zh)
CN (1) CN113897396B (zh)
AU (1) AU2021456512A1 (zh)
WO (1) WO2023039936A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116622742A (zh) * 2022-09-27 2023-08-22 睿征医药科技(武汉)有限公司 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
CN117070518A (zh) * 2023-08-03 2023-11-17 劲帆生物医药科技(武汉)有限公司 一种用于表达包含重叠开放阅读框的基因的表达盒及应用
CN117265008A (zh) * 2023-09-11 2023-12-22 劲帆生物医药科技(武汉)有限公司 一种用于生产重组细小病毒的组合物及应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113166731A (zh) * 2018-10-05 2021-07-23 沃雅戈治疗公司 编码aav生产蛋白的工程化核酸构建体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007213444B2 (en) * 2006-02-10 2013-08-29 Oxitec Limited Gene expression system using alternative splicing in insects
US8580511B2 (en) * 2006-06-19 2013-11-12 The Regents Of The University Of California Two-color fluorescent reporter for alternative pre-mRNA splicing
KR101589259B1 (ko) 2006-06-21 2016-02-01 유니큐어 아이피 비.브이. 곤충세포 내 aav의 생산에 유용한 aav-rep78의 번역을 위한 변형된 개시 코돈을 갖는 벡터
CN101522903B (zh) 2006-08-24 2013-07-31 威洛克有限公司 具有重叠开放阅读框的基因在昆虫细胞中的表达及其方法和组合物
ES2929031T3 (es) * 2008-02-19 2022-11-24 Uniqure Ip Bv Optimización de la expresión de las proteínas rep y cap parvovirales en células de insecto
CN106544325B (zh) 2015-09-23 2018-09-07 中国科学院武汉物理与数学研究所 一种重组杆状病毒及其应用
EP3655538A1 (en) * 2017-07-20 2020-05-27 uniQure IP B.V. Improved aav capsid production in insect cells
TW202134440A (zh) * 2019-12-04 2021-09-16 美商聖加莫治療股份有限公司 用於生產重組aav之新穎組合物及方法
CN112280801A (zh) 2020-10-30 2021-01-29 武汉枢密脑科学技术有限公司 一种利用质粒辅助进行rAAV感染滴度检测的方法及试剂盒
CN112553257B (zh) 2020-12-03 2022-02-11 武汉枢密脑科学技术有限公司 一种重组腺相关病毒的制备方法、系统及重组杆粒

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113166731A (zh) * 2018-10-05 2021-07-23 沃雅戈治疗公司 编码aav生产蛋白的工程化核酸构建体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAIFENG CHEN: "Intron Splicing–mediated Expression of AAV Rep and Cap Genes and Production of AAV Vectors in Insect Cells", 《MOLECULAR THERAPY》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116622742A (zh) * 2022-09-27 2023-08-22 睿征医药科技(武汉)有限公司 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
WO2024067153A1 (zh) * 2022-09-27 2024-04-04 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
CN117070518A (zh) * 2023-08-03 2023-11-17 劲帆生物医药科技(武汉)有限公司 一种用于表达包含重叠开放阅读框的基因的表达盒及应用
CN117265008A (zh) * 2023-09-11 2023-12-22 劲帆生物医药科技(武汉)有限公司 一种用于生产重组细小病毒的组合物及应用

Also Published As

Publication number Publication date
CN113897396B (zh) 2022-08-30
AU2021456512A1 (en) 2023-04-06
EP4180522A4 (en) 2024-05-01
WO2023039936A1 (zh) 2023-03-23
EP4180522A1 (en) 2023-05-17
JP2023544947A (ja) 2023-10-26
EP4180522A9 (en) 2023-07-19

Similar Documents

Publication Publication Date Title
Mietzsch et al. OneBac: platform for scalable and high-titer production of adeno-associated virus serotype 1–12 vectors for gene therapy
CN113897396B (zh) 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
AU2022203073A1 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases
CN106884014B (zh) 腺相关病毒反向末端重复序列突变体及其应用
TWI802584B (zh) 具有經修飾之磷脂酶區域的腺相關病毒(aav)
US20230159953A1 (en) Closed-ended, linear, duplex adenoassociated virus dna, and uses thereof
CN114150021B (zh) 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
KR20200130337A (ko) Aav 키메라
US20220186255A1 (en) Methods for the manufacture of recombinant viral vectors
CN115997006A (zh) 用于产生aav的双双功能载体
CN117070518A (zh) 一种用于表达包含重叠开放阅读框的基因的表达盒及应用
CN116622742A (zh) 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
CN114736928B (zh) 一种杆状病毒载体及其在昆虫细胞中制备rAAV的应用
WO2024002344A1 (zh) 精准重组腺相关病毒载体及其用途
EP4198135A1 (en) Nucleic acid construct for increasing adeno-associated virus yield, and construction method therefor
CN117551698A (zh) 一种优化的含有重叠开放阅读框的表达盒及应用
US20220242917A1 (en) Compositions and methods for producing adeno-associated viral vectors
WO2024068990A1 (en) A chimeric helper nucleic acid molecule comprising helper elements from three distinct helper viruses
CA3222723A1 (en) Aav manufacturing methods
CN115851837A (zh) 一种提高杆状病毒系统生产腺相关病毒的方法及应用
TW202417619A (zh) 生產重組 aav 顆粒之方法
CN114736929A (zh) 一种用于昆虫细胞中产生重组杆状病毒的组合物、方法及应用
CN116670292A (zh) 具有低水平va-rna的生产者细胞

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220428

Address after: 430223 311-22, experimental building of NMR spectrometer industrial base, No. 128, Guanggu seventh Road, Donghu New Technology Development Zone, Wuhan, Hubei Province (Wuhan area of free trade zone)

Applicant after: Jinfan biomedical technology (Wuhan) Co.,Ltd.

Address before: No.128, Guanggu 7th Road, Donghu hi tech Development Zone, Wuhan, Hubei 430223

Applicant before: WUHAN BRAINVTA SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant