CN114150021A - 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 - Google Patents

一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 Download PDF

Info

Publication number
CN114150021A
CN114150021A CN202111425804.2A CN202111425804A CN114150021A CN 114150021 A CN114150021 A CN 114150021A CN 202111425804 A CN202111425804 A CN 202111425804A CN 114150021 A CN114150021 A CN 114150021A
Authority
CN
China
Prior art keywords
intron
expression cassette
gene
aav
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111425804.2A
Other languages
English (en)
Other versions
CN114150021B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinfan Biomedical Technology Wuhan Co ltd
Original Assignee
Wuhan Brainvta Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Brainvta Science And Technology Co ltd filed Critical Wuhan Brainvta Science And Technology Co ltd
Priority to CN202111425804.2A priority Critical patent/CN114150021B/zh
Priority to EP21952112.7A priority patent/EP4209594A1/en
Priority to JP2022576350A priority patent/JP2024500194A/ja
Priority to PCT/CN2021/135642 priority patent/WO2023092643A1/zh
Priority to AU2021456513A priority patent/AU2021456513A1/en
Priority to US18/016,684 priority patent/US20230383310A1/en
Publication of CN114150021A publication Critical patent/CN114150021A/zh
Application granted granted Critical
Publication of CN114150021B publication Critical patent/CN114150021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14044Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14111Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
    • C12N2710/14141Use of virus, viral particle or viral elements as a vector
    • C12N2710/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14111Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
    • C12N2710/14141Use of virus, viral particle or viral elements as a vector
    • C12N2710/14144Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于基因工程领域,公开一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用,该表达盒包含从5’至3’的、可操作连接的:能够在昆虫细胞中驱动转录的启动子;人工构建序列;仅缺少第一个翻译起始密码子的重叠开放阅读框;其中,人工构建序列包含在昆虫细胞中有剪接活性的第一内含子和第二内含子,第一内含子和第二内含子共用5’部分或3’部分,人工构建序列中不含翻译起始密码子;在转录后加工过程中,通过第一内含子和第二内含子的选择性剪接作用,能够形成翻译起始密码子AUG。本发明利用内含子选择性剪接作用,调控不同衣壳蛋白以及不同Rep蛋白的相对表达,可在昆虫细胞中大规模生产具有高包装率和感染性的rAAV。

Description

一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中 的应用
技术领域
本发明属于基因工程技术领域,更具体地,涉及一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用。
背景技术
目前已发现哺乳动物基因组中存在包含部分重叠或完全重叠的开放阅读框(OpenReading Frame,ORF)的基因,而重叠开放阅读框在病毒基因组中尤为常见,包含重叠开放阅读框的重叠基因的表达调控相比非重叠基因复杂很多,往往要借助内含子或多个启动子来进行调控。
腺相关病毒(adeno-associated virus,AAV),也称腺伴随病毒,属于微小病毒科依赖病毒属,是目前发现的一类结构最简单的单链DNA缺陷型病毒,需要辅助病毒(通常为腺病毒)参与复制。重组腺相关病毒(rAAV)由于具有宿主范围广、免疫原性低、安全性高、可介导外源基因在动物体内长期稳定表达等特点,是目前基因治疗领域最具应用前景的载体之一。随着第一种重组腺相关病毒(rAAV)介导的基因治疗药物的批准,对大规模AAV载体制造技术的需求不断增加(Yla-Herttuala S.,2012,Mol Ther,20:1831-1832)。
腺相关病毒基因组中cap基因编码病毒VP衣壳蛋白,其包含3个重叠的开放阅读框,分别编码VP1、VP2、VP3三种类型的亚基来自野生型病毒的AAV中VP1、VP2和VP3的化学计量比约为1:1:10;rep基因编码Rep78、Rep68、Rep52和Rep40四个重叠的多功能蛋白,主要参与AAV的复制。在哺乳动物细胞中,可依赖内含子两个剪接受体序列的交替使用以及对于VP2次优起始密码子ACG的使用,调控三种AAV衣壳蛋白的正常化学计量比表达,从而包装得到正常的重组腺相关病毒。然而,由于哺乳动物细胞和昆虫细胞中内含子剪接机制的差异,在哺乳动物细胞中出现的表达策略不会在昆虫细胞中复制,从而导致野生型AAV在昆虫细胞中无法包装成合适的衣壳。
为了克服上述问题,Urabe等人开发出了昆虫细胞生产体系,将VP1的起始密码子AUG替换为次优起始密码子ACG,构建一个单一的多顺反子mRNA,该多顺反子mRNA不需要剪接即可表达所有三种AAV2的VP蛋白(Urabe等,2002,Hum Gene Ther,13:1935-1943)。然而AAV的血清型众多且与日俱增,Urabe等人的改造方法并不适用于所有血清型,例如Urabe等人使用ACG作为VP1衣壳蛋白起始密码子的杆状病毒系统中产生的AAV5颗粒具有不佳的感染性。在中国专利CN106544325A提供的方法中使用不同的次优起始密码子CTG加强VP1的表达,尽管这种设计提高了AAV5颗粒的感染性,但这种方法在调节VP1/VP2/VP3相对含量方面缺乏灵活性;同时,该方法似乎也缺乏血清型特异性序列调整所必须的灵活性。在中国专利CN101522903A提供的方法中通过将包含有polh启动子序列的人工内含子插入到VP1的开放阅读框中,利用两个启动子分别表达VP1和VP2/VP3,该设计虽然也能实现VP1/VP2/VP3在同一阅读框中表达,但该方法同样不能有效调节VP1/VP2/VP3相对量,且在不同血清型中VP1/VP2/VP3的相对表达量差异较大,导致生产效率较低。
在AAV昆虫细胞生产体系中,Urabe等人构建了Rep78和Rep52两个独立的表达盒,并插入在同一个杆状病毒载体中。由于Rep78的低表达有利于AAV的包装,Rep52使用了Polh启动子,Rep78则使用了相对Polh启动子启动活性较弱的△IE1启动子(Urabe等,2002,HumGene Ther,13:1935-1943)。然而,有研究发现,Urabe等人开发的AAV Rep蛋白表达方法存在杆状病毒载体传代不稳定的问题,为了解决这一问题,中国专利CN 103849629 A公开了一种昆虫细胞中产生AAV的方法,将AAVRep78蛋白的翻译起始密码子替换成ACG,该方法虽然能实现在同一阅读框的Rep78和Rep52蛋白的表达,但缺乏对Rep78和Rep52蛋白相对表达的调控作用。
因此,开发能够在昆虫细胞中稳定和大规模地生产重组腺相关病毒的手段和方法是非常必要的。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用,能够实现在昆虫细胞中稳定和大规模生产具有较高包装率和感染活性的重组腺相关病毒,且适用于各种血清型。
为实现上述目的,本发明提供了一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒,其包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的第一内含子和第二内含子,所述第一内含子和所述第二内含子共用5’部分或3’部分,所述人工构建序列中不含翻译起始密码子;
在转录后加工过程中,通过所述第一内含子和所述第二内含子的选择性剪接作用,能够在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
优选地,所述第一内含子或所述第二内含子位于ATG中的任意相邻两个核苷酸之间。
优选地,所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸(A)、所述第二内含子的5’部分、共用3’部分、胸腺嘧啶核苷酸(T)和鸟嘌呤核苷酸(G);
或者所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸(A)、胸腺嘧啶核苷酸(T)、所述第二内含子的5’部分、共用3’部分和鸟嘌呤核苷酸(G)。
优选地,所述第一内含子和所述第二内含子的5’端核苷酸均为GTNN,所述第一内含子和所述第二内含子的3’端核苷酸均为NNAG,其中N为A、T、C、G四种核苷酸中的任意一种。
优选地,所述包含重叠开放阅读框的基因为AAV的cap基因或AAV的rep基因。
优选地,所述启动子为polh启动子或p10启动子。
优选地,所述包含重叠开放阅读框的基因为AAV的cap基因,所述启动子为p10启动子。
优选地,所述包含重叠开放阅读框的基因为AAV的rep基因,所述启动子为polh启动子。
按照本发明的另一方面,提供了一种核酸分子,其包含第一表达盒,所述第一表达盒为上述表达盒。
优选地,所述核酸分子还包含第二表达盒,所述第二表达盒为上述表达盒,且所述第二表达盒表达的基因与所述第一表达盒表达的基因不同。
优选地,所述第二表达盒相对于所述第一表达盒为反义方向。
优选地,所述第二表达盒相对于所述第一表达盒为正义方向。
优选地,所述核酸分子还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列。
优选地,所述外源基因为报告基因,所述报告基因为氯霉素乙酰转移酶编码基因、β-半乳糖苷酶编码基因、β-葡萄糖醛酸酶编码基因、海肾荧光素酶编码基因、碱性磷酸酶编码基因、萤火虫荧光素酶编码基因、绿色荧光蛋白编码基因和红色荧光蛋白编码基因中的至少一种。
优选地,所述外源基因为编码药物多肽的基因或编码用于制备兽用或人用疫苗的抗原蛋白的基因。
按照本发明的另一方面,提供了一种载体,其包含上述表达盒。
优选地,所述载体为昆虫细胞相容性载体。
优选地,所述载体为质粒和病毒中的至少一种。
按照本发明的另一方面,提供了上述载体在昆虫细胞中制备重组腺相关病毒的应用。
按照本发明的另一方面,提供了上述载体在体外制备AAV衣壳中的应用,所述包含重叠开放阅读框的基因为AAV的cap基因。
按照本发明的另一方面,提供了一种昆虫细胞,其包含上述表达盒。
优选地,所述表达盒被整合至所述昆虫细胞的基因组中。
优选地,所述昆虫细胞为草地贪夜蛾细胞、粉纹夜蛾细胞、果蝇细胞或蚊子细胞。
按照本发明的另一方面,提供了一种细胞培养物,其包含上述昆虫细胞和培养基。
优选地,所述培养基中包含AAV基因组。
按照本发明的另一方面,提供了一种重组腺相关病毒粒子,其是在能产生重组腺相关病毒粒子的条件下培养上述昆虫细胞,然后回收制得的。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
(1)本发明表达盒可用于在昆虫细胞中表达由包含重叠开放阅读框的基因编码的多种多肽,例如重组腺相关病毒的VP蛋白(VP1、VP2、VP3)或Rep蛋白(Rep78、Rep52),本发明不需要改变野生型AAV中VP1蛋白编码序列或Rep78蛋白编码序列的原始翻译起始密码子ATG,通过在一个启动子下游、起始密码子ATG附近插入两个内含子,利用这两个内含子的剪接作用,对转录后的mRNA进行选择性剪接,获得合适比例的两种或多种mRNA,分别翻译成VP1、VP2/VP3蛋白或Rep78、Rep52蛋白。
(2)本发明利用两个内含子的选择性剪接作用实现对重叠基因表达的调控策略,相比使用次优密码子的方法,能更有效控制VP1、VP2和VP3蛋白的化学计量比例以及Rep78/Rep52的相对表达,实现在昆虫细胞中稳定和大规模生产重组腺相关病毒。
(3)本发明利用内含子选择性剪接策略,实现在昆虫细胞中生产重组腺相关病毒,并且适用于各种AAV血清型,使得制备rAAV的灵活性更强,应用范围更广。
(4)本发明将AAV的cap基因、rep基因和带有外源基因的ITR核心表达元件构建在同一重组杆状病毒载体中,用该载体转染昆虫宿主细胞,可以稳定、高产量生产重组AAV病毒粒子。
附图说明
图1为本发明野生型AAV中cap基因和rep基因表达调控示意图。
图2为本发明实施例1中cap基因表达盒表达调控示意图,其中,内容A为cap基因表达盒DNA链示意图;内容B为在转录后加工过程中第一内含子和第二内含子均未发生剪接时VP2、VP3蛋白翻译表达的示意图;内容C为在转录后加工过程中第二内含子发生剪接后VP1蛋白翻译表达的示意图;内容D为转录后加工过程中第一内含子发生剪接后VP2、VP3蛋白翻译表达的示意图。
图3为本发明实施例2中rep基因表达盒表达调控示意图,其中,内容A为rep基因表达盒DNA链示意图;内容B为在转录后加工过程中第一内含子和第二内含子均未发生剪接时Rep52蛋白翻译表达的示意图;内容C为在转录后加工过程中第二内含子发生剪接后Rep78蛋白翻译表达的示意图;内容D为在转录后加工过程中第一内含子发生剪接后Rep52蛋白翻译表达的示意图。
图4为本发明实施例3中包含有cap基因表达盒的重组杆状病毒载体Ac1以及对比例制备的重组杆状病毒载体Ac0表达VP蛋白的WesternBlot检测图。
图5为本发明实施例3中包含有rep基因表达盒的重组杆状病毒载体Ac2表达Rep蛋白的WesternBlot检测图。
图6为本发明实施例6中重组AAV杆粒CRI-0和CRI-1转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE的银染检测图,显示了三种衣壳蛋白VP1/VP2/VP3。
图7为本发明实施例6中重组AAV杆粒CRI-0和CRI-1转染宿主细胞后,纯化的重组AAV病毒粒子感染293T细胞的效果图。
图8为本发明实施例7中重组AAV杆粒CRI-2(A)、CRI-3(B)和CRI-4(C)转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE的银染检测图,显示了三种衣壳蛋白VP1/VP2/VP3。
图9为本发明实施例7中重组AAV杆粒CRI-2、CRI-3和CRI-4转染宿主细胞后,纯化的重组AAV病毒粒子感染293T细胞的效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
术语解释
正如本文所用的,术语“可操作连接”是指多核苷酸(或多肽)序列以功能性关系的连接。当两段核苷酸序列置于功能性关系时,这两段核苷酸序列是“可操作连接”的。例如,转录调控序列(例如启动子)如果影响某基因编码序列的转录,则其与该基因编码序列可操作连接。
术语“表达盒”是指包含引入宿主细胞时可操作连接的编码序列和调控序列的核酸构建体,分别导致RNA或多肽的转录和/或翻译。表达盒应理解为包括允许转录开始的启动子、目的基因开放阅读框和转录终止子。通常,启动子序列置于目的基因上游,与目的基因的距离与表达控制相容。
术语“开放阅读框”(Open Reading Frame,ORF)是结构基因的正常核苷酸序列,具有编码蛋白质或多肽的潜能,从起始密码子开始,结束于终止密码子,其间不存在使翻译中断的终止密码子。在一条mRNA链上,核糖体从起始密码子开始翻译,沿着mRNA序列合成多肽链并不断延伸,遇到终止密码子时,多肽链的延伸反应终止。
术语“载体”是指设计用于转运、转移和/或存储遗传物质,以及表达遗传物质和/或将遗传物质整合到宿主细胞染色体DNA中的核酸分子,例如质粒载体、粘粒载体、人工染色体、噬菌体载体和其他病毒载体。载体通常由至少三个基本单元组成,即复制源、选择标记和多克隆位点。
术语“内含子”又称间隔顺序,指一个基因或mRNA分子中无编码作用的片段,是真核生物细胞DNA中的间插序列。内含子序列被转录在mRNA前体中,经过剪接被去除,最终不存在于成熟mRNA分子中。根据剪接过程为自发还是要经过剪接体的加工,将内含子分为自剪接内含子和剪接体内含子。自剪接内含子是一种特殊的内含子,是一种核酶,可以通过自身作用被切除,来离开mRNA。本发明涉及的内含子是剪接体内含子,这类内含子的剪除要有剪接体的帮助,内含子序列两端有剪接供体序列和剪接受体序列,是切断和重接位点处两旁的序列。剪接体是由核小RNA(small nuclearRNA,snRNA)和蛋白质因子动态组成的核糖核蛋白复合体,剪接体识别mRNA前体的剪接位点并催化剪接反应,将内含子完全剪除,上下游RNA序列再重新连接。
术语“AAV血清型”:自AAV被发现以来,目前已经从腺病毒、人或灵长类动物和一些哺乳动物分离出超过100种AAV血清型或突变体,其中被应用的主要是AAV1-9。不同血清型的rAAV载体主要区别为衣壳蛋白的不同。不同的AAV血清型在感染效率和组织特异性方面存在一定的差异。
所有已知腺相关病毒血清型的基因组结构非常相似,AAV是单链DNA病毒,基因组结构简单,全长约4.7kb,如图1所示,其基因组中包含rep基因表达盒、cap基因表达盒和位于基因组两端的AAV反向末端重复序列(inverted terminal repeats,ITR)。ITR是基因组两端的125个核苷酸的回文结构,能形成一个自我互补的倒T型发卡结构,是DNA复制起始和包装重组AAV基因组为感染性的病毒颗粒所需的顺式作用元件。AAV作为缺陷型病毒,在没有辅助病毒的存在下不能够独立复制,因此AAV只能定点整合在宿主细胞染色体中,呈潜伏状态。在辅助病毒存在的情况下,rep基因表达量增加可以将整合在宿主细胞染色体中的AAV基因组拯救出来,大量复制得到AAVDNA,单链的rAAV基因组在VP衣壳蛋白的作用下被包装成具有感染性的病毒粒子。Cap基因编码结构性的VP衣壳蛋白,其包含3个重叠的开放阅读框,分别编码VP1、VP2、VP3三种类型的亚基,VP1、VP2和VP3含有不同的起始密码子,共用一个终止密码子,VP1和VP2共享VP3序列。VP1的N端具有一个保守的磷脂酶A2序列,该序列与病毒从体内逃逸有关,并对其感染性至关重要;VP2蛋白对于组装或者感染并非比不可少;VP3蛋白的核心由保守的β-桶基序组成,决定了不同血清型AAV与宿主细胞作用受体的差异。野生型AAV中三种蛋白的正确比例为3:3:54,约为1:1:10。Rep基因编码Rep78、Rep68、Rep52和Rep40四个重叠的多功能蛋白,Rep78和Rep68蛋白参与AAV的复制及整合,可以和ITR中的特定序列结合;Rep52和Rep40蛋白具有解旋酶和ATP酶的活性,在参与单链基因组的复制同时也参与病毒的装配。无论是在哺乳动物细胞中,还是在昆虫细胞中,编码Rep78和Rep52蛋白的未剪接的mRNA足以满足制备rAAV的需求。
本发明提到的核酸分子可以是DNA分子,也可以是RNA分子。本领域技术人员已知,RNA序列与DNA序列基本相似或具有一定程度的序列同一性,DNA序列中的胸腺嘧啶(T)可被认为等同于RNA序列中的尿嘧啶(U)。
本发明提到的内含子可以是天然内含子,也可以是经过人工改造的内含子,且其在昆虫细胞内具有剪接活性,但其来源不局限于昆虫细胞。
本发明提供的一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的第一内含子和第二内含子,所述第一内含子和所述第二内含子共用5’部分或3’部分,所述人工构建序列中不含翻译起始密码子;
在转录后加工过程中,通过所述第一内含子和所述第二内含子的选择性剪接作用,能够在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
一些实施例中,所述第一内含子或所述第二内含子位于ATG中的任意相邻两个核苷酸之间。第一内含子和第二内含子的排布顺序没有特殊限定,以第一内含子位于第二内含子上游为例:当第一内含子位于ATG中的任意相邻两个核苷酸之间、第二内含子中不和第一内含子共用的部分(3’部分)位于该ATG中G的下游时,在转录后加工过程中,通过第一内含子的剪接作用,能够在重叠开放阅读框的上游形成翻译起始密码子AUG;当第二内含子位于ATG中的任意相邻两个核苷酸之间、第一内含子中不和第二内含子共用的部分(5’部分)位于该ATG中A的上游时,在转录后加工过程中,通过第二内含子的剪接作用,能够在重叠开放阅读框的上游形成翻译起始密码子AUG。
一些实施例中,利用内含子选择性剪接作用,包含有两个内含子的表达盒可用于昆虫细胞中AAVVP衣壳蛋白的正确表达或Rep蛋白的优势表达,其中,cap基因中的重叠开放阅读框编码AAV衣壳蛋白VP1、VP2和VP3;rep基因中的重叠开放阅读框编码Rep78和Rep52蛋白。
一些实施例中,利用内含子选择性剪接作用,包含有两个内含子的表达盒可用于昆虫细胞中表达多种猿猴病毒40(SV40)的VP衣壳蛋白。SV40是具有5.2kb共价闭环的环状基因组的双链DNA病毒,其同样包含三种衣壳蛋白VP1、VP2和VP3,VP3蛋白是VP2蛋白的截短形式,VP3和VP2共用终止密码子,VP1编码序列的5’部分与VP2、VP3编码序列的3’部分重叠,但不具有相同的开放阅读框。在哺乳细胞中,这些VP蛋白的表达受到内含子剪接机制的调控。本发明表达盒用于在昆虫细胞中表达SV40衣壳蛋白时,该表达盒中仅缺少第一个翻译起始密码子的ORF为仅缺少VP2蛋白翻译起始密码子ATG的VP蛋白编码序列,VP2、VP3蛋白的相对表达调控可利用本发明内含子剪接策略实现。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的cap基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少VP1蛋白翻译起始密码子ATG的VP蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸(A)、所述第二内含子的5’部分、共用3’部分、胸腺嘧啶核苷酸(T)和鸟嘌呤核苷酸(G);或者所述第一内含子的5’部分、腺嘌呤核苷酸、胸腺嘧啶核苷酸、所述第二内含子的5’部分、共用3’部分和鸟嘌呤核苷酸。
本发明对野生型AAVVP1蛋白编码序列自身N端的内含子剪接位点进行突变,使得昆虫细胞中的剪接体无法识别该剪接位点,第一内含子的5’部分和共用3’部分形成完整的第一内含子剪接位点,第二内含子的5’部分和共用3’部分形成完整的第二内含子剪接位点,如图2所示,在转录后加工过程中,若昆虫细胞中的剪接体识别第一内含子剪接位点并催化剪接反应,则在mRNA最前端不能形成完整的AUG-起始位点,核糖体从5’至3’识别VP2蛋白的起始密码子时,VP2蛋白得以翻译表达,由于VP2起始密码子是次优密码子ACG,会造成核糖体扫描泄露,于是VP3蛋白得以翻译表达;若昆虫细胞中的剪接体识别第二内含子剪接位点并催化剪接反应,剪接后形成完整的AUG-起始位点,则mRNA从第一个AUG处翻译,VP1蛋白表达;若昆虫细胞中的剪接体既没有剪接第一内含子剪接位点,又没有剪接第二内含子剪接位点,VP1蛋白编码序列5’端没有起始密码子,VP2、VP3蛋白翻译表达。通过不同内含子不同概率的剪接作用,控制衣壳蛋白VP1、VP2和VP3的相对表达量。
一些实施例中,所述包含重叠开放阅读框的基因为AAV的rep基因,所述仅缺少第一个翻译起始密码子的重叠开放阅读框为仅缺少Rep78蛋白翻译起始密码子ATG的Rep蛋白编码序列,所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸、所述第二内含子的5’部分、共用3’部分、胸腺嘧啶核苷酸和鸟嘌呤核苷酸;或者所述第一内含子的5’部分、腺嘌呤核苷酸、胸腺嘧啶核苷酸、所述第二内含子的5’部分、共用3’部分和鸟嘌呤核苷酸。
本发明对野生型AAVRep78蛋白编码序列中Rep52蛋白翻译起始密码子上游的可能的一个或多个翻译起始位点进行突变,使得昆虫细胞中的核糖体无法识别这些位点,第一内含子的5’部分和共用3’部分形成完整的第一内含子剪接位点,第二内含子的5’部分和共用3’部分形成完整的第二内含子剪接位点,如图3所示,在转录后加工过程中,若昆虫细胞中的剪接体识别第一内含子剪接位点并催化剪接反应,则在mRNA最前端不能形成完整的AUG-起始位点,核糖体从5’至3’识别Rep52蛋白的起始密码子时,Rep52蛋白得以翻译表达;若昆虫细胞中的剪接体识别第二内含子剪接位点并催化剪接反应,剪接后形成完整的AUG-起始位点,则mRNA从第一个AUG处翻译,Rep78蛋白表达;若昆虫细胞中的剪接体既没有剪接第一内含子剪接位点,又没有剪接第二内含子剪接位点,Rep78蛋白编码序列5’端没有起始密码子,Rep52蛋白翻译表达。通过不同内含子不同概率的剪接作用,控制Rep78蛋白和Rep52蛋白的相对表达量。
一些实施例中,优选地,所述第一内含子和所述第二内含子的5’端核苷酸均为GTNN,所述第一内含子和所述第二内含子的3’端核苷酸均为NNAG,其中N代表A、T、C、G四种核苷酸中的任意一种。这样可调控VP1、VP2和VP3蛋白以更接近化学计量比进行翻译表达,有利于包装成合适的衣壳;同样地,使得Rep78蛋白翻译表达量较Rep52蛋白的低,有利于较高的载体产量。
一些实施例中,所述人工构建序列的核苷酸序列为SEQ ID No.2所示的序列。本领域技术人员可知的,其中内含子序列的变化形式可用于本发明技术方案。在某些结构中,可使用与本发明内含子核苷酸序列具有相似性的序列,例如,第一内含子5’部分的5’端具有与序列GTAAGTATTC至少40%或50%或60%或70%或80%或90%同一性的序列,第二内含子5’部分的5’端具有与序列GTAAGTATCG至少40%或50%或60%或70%或80%或90%同一性的序列,第一内含子和第二内含子共用的3’部分的3’端具有与序列AAACATTATTTATTTTGCAG至少40%或50%或60%或70%或80%或90%同一性的序列。
一些实施例中,cap基因编码的VP衣壳蛋白可以是任意AAV血清型的衣壳蛋白,例如AAV血清2型、AAV血清5型、AAV血清8型、AAV血清9型等等,本发明涉及的内含子序列及剪接策略适用于现有的多种AAV血清型的VP衣壳蛋白的正确表达。
一些实施例中,能够在昆虫细胞中驱动cap基因和rep基因转录的启动子可以为polh启动子或p10启动子。优选地,cap基因表达盒采用p10启动子,rep基因表达盒采用polh启动子。
本发明还提供一种核酸分子,包含上述cap基因表达盒和/或rep基因表达盒。核酸可以包含以串联即以相同极性或以反义方向排列的表达盒,因此,cap基因表达盒可以相对于rep基因表达盒为反义方向,也可以相对于rep基因表达盒为正义方向。
本发明还提供一种重组杆状病毒载体,优选为昆虫细胞相容的载体,其包含cap基因表达盒和rep基因表达盒,该cap基因表达盒优选本发明构建的表达盒,rep基因表达盒优选本发明构建的基因表达盒。应当理解的是,该rAAV载体还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列,ITR作用于AAV的复制包装及定点整合,帮助载体在宿主细胞中形成稳定的环状多聚体和类染色质结构,从而能在宿主细胞中长期稳定存在,外源基因也能持续稳定表达。所述外源基因可以为至少一个编码感兴趣的基因(Gene ofInterest,GOI)产物的核苷酸序列,所述感兴趣的基因产物可以是治疗性基因产物,具体可以是多肽、RNA分子(siRNA)或其他基因产物,例如但不限于脂蛋白酯酶、载脂蛋白、细胞因子、白细胞介素或干扰素;也可以是用于制备兽用或人用疫苗的抗原蛋白,例如乙肝表面抗原、狂犬病毒糖蛋白、口蹄疫病毒衣壳蛋白等;还可以是评估载体转化和表达的报告蛋白,例如但不限于荧光蛋白(绿色荧光蛋白GFP、红色荧光蛋白RFP)、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡萄糖醛酸酶、海肾荧光素酶、萤火虫荧光素酶或碱性磷酸酶。
另一方面,本发明还提供上述重组杆状病毒载体在昆虫细胞中制备重组腺相关病毒的应用,将该载体导入昆虫细胞中可以实现VP1、VP2、VP3蛋白按照正确的化学计量比1:1:10表达,从而包装产生重组腺相关病毒,其包装率高,且已知的大部分AAV血清型(例如AAV2、AAV5、AAV8和AAV9)均具有较佳的感染性;同时,Rep78和Rep52蛋白的表达量控制在合理范围内,从而能够在昆虫细胞中稳定、大量生产AAV载体。并且,包含cap基因表达盒的重组杆状病毒载体可用于在体外制备AAV衣壳。
另一方面,本发明还提供一种昆虫细胞,该昆虫细胞包含AAV的cap基因和/或rep基因的表达盒,还可以包含外源基因的表达盒。这些表达盒中的至少一种可整合至宿主昆虫细胞的基因组中稳定表达,也可以是昆虫细胞中瞬时携带含这些表达盒的核酸。
一些实施例中,所述昆虫细胞可以为任意昆虫细胞,例如但不限于草地贪夜蛾细胞(Spodoptera frugiperda cell)、粉纹夜蛾细胞、果蝇细胞或蚊子细胞,优选为草地贪夜蛾细胞sf9。
另一方面,本发明还提供一种细胞培养物,其包含上述昆虫细胞和培养基。
一些实施例中,所述培养基中包含AAV基因组。
另一方面,本发明还提供一种重组腺相关病毒粒子,其是在能产生重组腺相关病毒粒子的条件下培养上述昆虫细胞,然后回收制得的。
以下结合具体实施例,对上述技术方案详细说明。
实施例1构建包含AAV血清9型cap基因表达盒的重组杆状病毒载体
(1)构建cap基因表达盒:参见图2,该cap基因表达盒从5’至3’依次包括p10启动子、人工构建序列和仅缺少VP1蛋白翻译起始密码子ATG的编码AAV血清9型VP蛋白的核苷酸序列。p10启动子的核苷酸序列如SEQ ID No.1所示;本实施例cap基因表达盒中人工构建序列的核苷酸序列如SEQ ID No.2所示,其包含两个内含子剪接位点,其中,第一内含子的核苷酸序列如SEQ ID No.3所示,第二内含子的核苷酸序列如SEQ ID No.4所示;编码AAV血清9型VP蛋白的核苷酸序列如SEQ ID No.5所示,其氨基端存在至少一个核苷酸的突变,用来消除编码序列内可能存在的剪切位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来分别获得构建物9K-1,其核苷酸序列如SEQ ID No.6所示。
(2)构建重组杆状病毒载体:将上述构建物9K-1克隆到pFastBac载体上,制备转移质粒;将上述质粒转化DH10Bac菌株中,通过Tn7转座,获得重组杆状病毒载体Ac1。
实施例2构建包含AAV血清2型rep基因表达盒的重组杆状病毒载体
(1)构建rep基因表达盒:参见图3,该rep基因表达盒从5’至3’依次包括polh启动子、人工构建序列和仅缺少Rep78蛋白翻译起始密码子ATG的编码AAV血清2型Rep蛋白的核苷酸序列。polh启动子的核苷酸序列如SEQ ID No.7所示;本实施例rep基因表达盒中人工构建序列的核苷酸序列如SEQ ID No.2所示,其包含两个内含子剪接位点,其中,第一内含子的核苷酸序列如SEQ ID No.3所示,第二内含子的核苷酸序列如SEQ ID No.4所示;编码AAV血清2型Rep蛋白的核苷酸序列如SEQ ID No.8所示,其在Rep78翻译起始密码子与Rep52翻译起始密码子之间存在多个核苷酸的突变,用来消除这段区域内可能存在的翻译起始位点。将上述序列通过人工直接合成或重叠延伸PCR扩增连接起来获得构建物2R-1,其核苷酸序列如SEQ ID No.9所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有2R-1的重组杆状病毒载体Ac2。
对比例构建重组杆状病毒载体Ac0及rep基因表达盒2R-0
(1)构建cap基因表达盒:本对比例参照Urabe等人(Urabe等,2002,Hum GeneTher,13:1935-1943)的方法构建cap基因表达盒,该cap基因表达盒的启动子采用p10启动子,表达盒中的cap基因编码AAV血清9型VP蛋白,并将编码序列中VP1的翻译起始密码子ATG突变成次优密码子ACG。该cap基因表达盒编号为9K-0,其核苷酸序列如SEQ ID No.10所示。
(2)构建重组杆状病毒载体:同实施例1步骤(2),制备得到含有9K-0的重组杆状病毒载体Ac0。
(3)构建rep基因表达盒:参照中国专利CN103849629A的方法构建rep基因表达盒,该rep基因表达盒的启动子采用polh启动子,表达盒中的rep基因编码AAV血清2型Rep蛋白,并将AAV Rep78蛋白的原始翻译起始密码子ATG替换成ACG。该rep基因表达盒编号为2R-0。
实施例3检测VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)表达情况
将实施例1、实施例2及对比例制备的重组杆状病毒载体Ac1、Ac2和Ac0分别转染宿主细胞系培养获得重组杆状病毒,分别检测VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)表达情况,具体操作步骤如下:
抽提上述重组杆状病毒载体DNA转染Sf9昆虫细胞,制备重组杆状病毒BEV。转染后的Sf9昆虫细胞成功产生BEV,大量复制增殖的BEV进一步感染导致Sf9细胞发生明显的细胞病变效应(cytopathic effect,CPE)。收集发生CPE的Sf9细胞培养上清液,其中含有大量BEV,即为第0代BEV(P0),同时收集含有大量rAAV的Sf9细胞。将制备得到的BEV-P0以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72h后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,分别收集培养上清和细胞沉淀,上清液标记为第1代BEV-P1。继续扩大培养,将制备得到的BEV-P1以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72h后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,收集细胞沉淀进行Western Blot检验VP蛋白(VP1、VP2、VP3)和Rep蛋白(Rep78、Rep52)的表达情况。
图4为包含有cap基因表达盒的重组杆状病毒载体Ac1以及对照重组杆状病毒载体Ac0的VP蛋白(VP1、VP2和VP3)Western Blot检测图。由图看出,以上重组杆状病毒载体都能以相对合适的比例产生VP1、VP2和VP3。
图5为包含有rep基因表达盒的重组杆状病毒载体Ac2的Rep蛋白(Rep78和Rep52)Western Blot检测图。由图看出,重组杆状病毒载体Ac2能够产生Rep78和Rep52蛋白,且Rep78蛋白的表达量低于Rep52蛋白。
实施例4用于在昆虫细胞中生产AAV病毒的重组AAV杆粒的构建
本实施例构建用于在昆虫细胞中生产AAV病毒的重组AAV杆粒的方法参照本公司此前申请专利CN112553257A中的实施例1,包括如下步骤:
(1)构建包含AAV必需功能元件cap和rep基因表达盒的同源重组载体;然后通过Red同源重组在大肠杆菌中将该同源重组载体中的必需功能元件插入到杆状病毒基因组中必需基因Ac135(116492...117391)的C端,获得包含有cap和rep基因表达盒的重组杆状病毒载体,编号为Bac-Cap-Rep。
(2)构建包含ITR核心元件(ITR-GOI)的穿梭载体。ITR核心元件编号为I-G-1,其核苷酸序列如SEQ ID No.11所示。本实施例中ITR核心元件中的GOI采用了红色荧光蛋白mcherry基因表达盒,即由miniEf1a启动子控制mcherry表达,便于检测rAAV的活性,将ITR和红色荧光蛋白表达盒构建到穿梭载体pFastDual上。
(3)用上述步骤(2)中构建的穿梭载体转化含有Bac-Cap-Rep重组杆粒的感受态细胞,利用Tn7重组将ITR-GOI插入到Bac-Cap-Rep重组杆粒中的Tn7位点上,最终得到包含生产rAAV所必需的功能蛋白组分和ITR核心元件的重组杆状病毒基因组的重组杆粒,编号为Bac-Cap-Rep-ITR-GOI。
本实施例构建的2种不同重组AAV杆粒均包含cap基因表达盒、rep基因表达盒和ITR核心元件,具体如表1所示。
表1实施例4中构建的2种不同重组AAV杆粒的组成元件列表
Figure BDA0003378370800000111
实施例5AAV重组杆状病毒的制备
将实施例4中制备的重组AAV杆粒CRI-0和CRI-1分别转染宿主细胞系培养获得AAV重组杆状病毒,
抽提上述重组杆粒DNA转染Sf9昆虫细胞,制备重组杆状病毒BEV和rAAV。转染后的Sf9昆虫细胞成功产生BEV,大量复制增殖的BEV进一步感染导致Sf9细胞发生明显的细胞病变效应(CPE)。收集发生CPE的Sf9细胞培养上清液,其中含有大量BEV,即为第0代BEV(P0),同时收集含有大量rAAV的Sf9细胞。将制备得到的BEV-P0以感染复数(MOI=1)感染悬浮培养的Sf9细胞,感染72h后,细胞活性下降至50%以下,将细胞培养液1000g离心5min,分别收集培养上清和细胞沉淀,上清液标记为第1代BEV-P1,细胞则标记为用BEV-P0包装的rAAV。
实施例6重组AAV病毒粒子的纯化及其包装率、病毒滴度的检测
按照实施例5的操作继续扩大培养,直至用BEV-P2的种毒按照感染复数(MOI=1)感染悬浮培养的Sf9细胞进行rAAV的包装,包装体积为300mL-400mL。感染3天后监测细胞活性,活性低于50%,分别离心收获细胞沉淀和上清,将收获的细胞沉淀和上清分别纯化,细胞反复冻融3次裂解,5000rpm离心10min收集上清,在上清中加入核酸酶(Benzonase)37℃水浴处理60min,处理后5000rpm离心10min。收集的细胞裂解液和收集的上清液PEG沉淀,重悬后用碘克沙醇密度梯度离心分离纯化(方法参见Aslanidi等,2009,Proc.NatlAcad.Sci.USA,206:5059-5064)。最终纯化的成品病毒用80μL-190μL PBS重悬,取10μL纯化出的成品病毒跑SDS-PAGE胶,银染。
图6提供了重组AAV杆粒CRI-0和CRI-1转染宿主细胞后,纯化的重组AAV病毒粒子进行SDS-PAGE银染的检测图。由结果看出,本发明构建的重组AAV杆粒通过内含子剪接调控作用,能在昆虫细胞中实现VP1、VP2和VP3蛋白以相对合适比例的表达,从而包装出病毒粒子。
本实施例还采用Q-PCR检测收获的rAAV病毒的包装率,rAAV包装率的检测使用靶向ITR序列的一对引物(Q-ITR-F:GGAACCCCTAGTGATGGAGTT和Q-ITR-R:CGGCCTCAGTGAGCGA)。rAAV感染滴度的检测采用本公司此前申请专利CN112280801A中的检测方法进行,具体操作方法参见该专利中利用质粒辅助进行rAAV感染滴度检测的方法,检测结果如表2。
表2利用2种不同重组AAV杆粒生产的rAAV病毒粒子的包装率和感染滴度检测结果表
重组AAV杆粒编号 细胞包装率(VG/cell) 病毒感染滴度(VG/mL)
CRI-0 4.75E+05 4.31E+08
CRI-1 7.86E+05 5.37E+08
结合表2和图7可以看出,利用本发明制备的重组AAV杆粒CRI-1转染昆虫细胞能包装出重组杆状病毒,包装率和病毒感染滴度较高。
实施例7不同AAV血清型中内含子调控作用的验证
为了验证以上内含子调控方式能在不同AAV血清型中起作用。参照实施例1中的方法分别构建了AAV血清2型的cap基因表达盒2K-1、AAV血清5型的cap基因表达盒5K-1和AAV血清8型的cap基因表达盒8K-1。上述构建物2K-1、5K-1、和8K-1的核苷酸序列分别如SEQ IDNo.12至SEQ ID No.14所示。本实施例rep基因表达盒仍采用的是AAV血清2型,因为AAV血清2型的Rep蛋白适应于各种血清型rAAV的制备。
参照实施例4,本实施例构建了3种不同重组AAV杆粒,它们均包含cap基因表达盒、rep基因表达盒和ITR核心元件,具体如表3所示。
表3实施例7中构建的3种不同重组AAV杆粒的组成元件列表
Figure BDA0003378370800000121
参照实施例5和实施例6,本实施例将上述重组AAV杆粒转染宿主细胞,纯化获得的重组AAV病毒粒子进行SDS-PAGE银染检测,实验结果如图8。并对不同血清型的重组AAV杆粒产生的rAAV的细胞包装率和病毒感染滴度进行了检测,检测结果如表4。
表4利用实施例7中3种不同重组AAV杆粒生产的rAAV病毒粒子的包装率和感染滴度检测结果表
重组AAV杆粒编号 细胞包装率(VG/cell) 病毒感染滴度(VG/mL)
CRI-2 3.59E+05 3.89E+08
CRI-3 3.88E+05 7.46E+08
CRI-4 2.59E+05 9.28E+08
结合表4和图9的结果表明,本发明通过内含子剪接作用调控昆虫细胞中VP1、VP2和VP3蛋白以相对合适比例的表达,适用于各种AAV血清型,均能大规模生产rAAV病毒粒子。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 武汉枢密脑科学技术有限公司
<120> 一种表达盒、载体及其在昆虫细胞中制备重组腺相关病毒的应用
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 110
<212> DNA
<213> AcMNPV
<220>
<223> Promoter p10
<400> 1
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc 110
<210> 2
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron1+Intron2
<400> 2
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
caggccgcca gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca 120
aattgtaatt ttattactgt ttggtccata aacacttgtt taccatttcc ttttttacaa 180
gttttaatat tttctgcata tataaaacat tatttatttt gcagtg 226
<210> 3
<211> 224
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron1
<400> 3
gtaagtattc attgtaaatc tgatattatt tgtattatta tacctaccta atttgcagtg 60
caggccgcca gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca 120
aattgtaatt ttattactgt ttggtccata aacacttgtt taccatttcc ttttttacaa 180
gttttaatat tttctgcata tataaaacat tatttatttt gcag 224
<210> 4
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> Intron2
<400> 4
gtaagtatcg ataactttgt tttctttcac atttacaact ccgacataca aattgtaatt 60
ttattactgt ttggtccata aacacttgtt taccatttcc ttttttacaa gttttaatat 120
tttctgcata tataaaacat tatttatttt gcag 154
<210> 5
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap ORF
<400> 5
atggctgccg acggttatct acccgattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 6
<211> 2582
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 6
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg gggacaaggt aagtattcat tgtaaatctg atattatttg 180
tattattata cctacctaat ttgcagtgca ggccgccagt aagtatcgat aactttgttt 240
tctttcacat ttacaactcc gacatacaaa ttgtaatttt attactgttt ggtccataaa 300
cacttgttta ccatttcctt ttttacaagt tttaatattt tctgcatata taaaacatta 360
tttattttgc agtggctgcc gacggttatc tacccgattg gctcgaggac aaccttagtg 420
aaggaattcg cgagtggtgg gctttgaaac ctggagcccc tcaacccaag gcaaatcaac 480
aacatcaaga caacgctcga ggtcttgtgc ttccgggtta caaatacctt ggacccggca 540
acggactcga caagggggag ccggtcaacg cagcagacgc ggcggccctc gagcacgaca 600
aggcctacga ccagcagctc aaggccggag acaacccgta cctcaagtac aaccacgccg 660
acgccgagtt ccaggagcgg ctcaaagaag atacgtcttt tgggggcaac ctcgggcgag 720
cagtcttcca ggccaaaaag aggcttcttg aacctcttgg tctggttgag gaagcggcta 780
agacggctcc tggaaagaag aggcctgtag agcagtctcc tcaggaaccg gactcctccg 840
cgggtattgg caaatcgggt gcacagcccg ctaaaaagag actcaatttc ggtcagactg 900
gcgacacaga gtcagtccca gaccctcaac caatcggaga acctcccgca gccccctcag 960
gtgtgggatc tcttacaatg gcttcaggtg gtggcgcacc agtggcagac aataacgaag 1020
gtgccgatgg agtgggtagt tcctcgggaa attggcattg cgattcccaa tggctggggg 1080
acagagtcat caccaccagc acccgaacct gggccctgcc cacctacaac aatcacctct 1140
acaagcaaat ctccaacagc acatctggag gatcttcaaa tgacaacgcc tacttcggct 1200
acagcacccc ctgggggtat tttgacttca acagattcca ctgccacttc tcaccacgtg 1260
actggcagcg actcatcaac aacaactggg gattccggcc taagcgactc aacttcaagc 1320
tcttcaacat tcaggtcaaa gaggttacgg acaacaatgg agtcaagacc atcgccaata 1380
accttaccag cacggtccag gtcttcacgg actcagacta tcagctcccg tacgtgctcg 1440
ggtcggctca cgagggctgc ctcccgccgt tcccagcgga cgttttcatg attcctcagt 1500
acgggtatct gacgcttaat gatggaagcc aggccgtggg tcgttcgtcc ttttactgcc 1560
tggaatattt cccgtcgcaa atgctaagaa cgggtaacaa cttccagttc agctacgagt 1620
ttgagaacgt acctttccat agcagctacg ctcacagcca aagcctggac cgactaatga 1680
atccactcat cgaccaatac ttgtactatc tctcaaagac tattaacggt tctggacaga 1740
atcaacaaac gctaaaattc agtgtggccg gacccagcaa catggctgtc cagggaagaa 1800
actacatacc tggacccagc taccgacaac aacgtgtctc aaccactgtg actcaaaaca 1860
acaacagcga atttgcttgg cctggagctt cttcttgggc tctcaatgga cgtaatagct 1920
tgatgaatcc tggacctgct atggccagcc acaaagaagg agaggaccgt ttctttcctt 1980
tgtctggatc tttaattttt ggcaaacaag gaactggaag agacaacgtg gatgcggaca 2040
aagtcatgat aaccaacgaa gaagaaatta aaactactaa cccggtagca acggagtcct 2100
atggacaagt ggccacaaac caccagagtg cccaagcaca ggcgcagacc ggctgggttc 2160
aaaaccaagg aatacttccg ggtatggttt ggcaggacag agatgtgtac ctgcaaggac 2220
ccatttgggc caaaattcct cacacggacg gcaactttca cccttctccg ctgatgggag 2280
ggtttggaat gaagcacccg cctcctcaga tcctcatcaa aaacacacct gtacctgcgg 2340
atcctccaac ggccttcaac aaggacaagc tgaactcttt catcacccag tattctactg 2400
gccaagtcag cgtggagatc gagtgggagc tgcagaagga aaacagcaag cgctggaacc 2460
cggagatcca gtacacttcc aactattaca agtctaataa tgttgaattt gctgttaata 2520
ctgaaggtgt atatagtgaa ccccgcccca ttggcaccag atacctgact cgtaatctgt 2580
aa 2582
<210> 7
<211> 92
<212> DNA
<213> AcMNPV
<220>
<223> Promoter polh
<400> 7
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa at 92
<210> 8
<211> 1863
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep ORF
<400> 8
atggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgggca tctgcccggc 60
atttctgaca gctttgtgaa ctgggtggcc gagaaggagt gggagttgcc gccagattct 120
gacttggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa gctgcagcgc 180
gactttctga cggagtggcg ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa 240
tttgagaagg gagagagcta cttccactta cacgtgctcg tggaaaccac cggggtgaaa 300
tccttagttt tgggacgttt cctgagtcag attcgcgaaa aactgattca gagaatttac 360
cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagaccag aaacggcgcc 420
ggaggcggga acaaggtggt ggacgagtgc tacatcccca attacttgct ccccaaaacc 480
cagcctgagc tccagtgggc gtggactaat ttagaacagt atttaagcgc ctgtttgaat 540
ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca gacgcaggag 600
cagaacaaag agaatcagaa tcccaattct gacgcgccgg tgatcagatc aaaaacttca 660
gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc ggagaagcag 720
tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc 780
caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa aaccgccccc 840
gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat ttataaaatt 900
ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg atgggccacg 960
aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac cgggaagacc 1020
aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat 1080
gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga ggaggggaag 1140
atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg 1200
gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt cacctccaac 1260
accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca gcagccgttg 1320
caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt tgggaaggtc 1380
accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt tgaggtggag 1440
catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag tgacgcagat 1500
ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa 1560
gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat 1620
ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa tatctgcttc 1680
actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca acccgtttct 1740
gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg aaaggtgcca 1800
gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat ctttgaacaa 1860
taa 1863
<210> 9
<211> 2220
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep gene expression cassette
<400> 9
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcgg atccgtaagt attcattgta aatctgatat tatttgtatt attataccta 180
cctaatttgc agtgcaggcc gccagtaagt atcgataact ttgttttctt tcacatttac 240
aactccgaca tacaaattgt aattttatta ctgtttggtc cataaacact tgtttaccat 300
ttcctttttt acaagtttta atattttctg catatataaa acattattta ttttgcagtg 360
gggttttacg agattgtgat taaggtcccc agcgaccttg acgggcatct gcccggcatt 420
tctgacagct ttgtgaactg ggtggccgag aaggagtggg agttgccgcc agattctgac 480
ttggatctga atctgattga gcaggcaccc ctgaccgtgg ccgagaagct gcagcgcgac 540
tttctgacgg agtggcgccg tgtgagtaag gccccggagg cccttttctt tgtgcaattt 600
gagaagggag agagctactt ccacttacac gtgctcgtgg aaaccaccgg ggtgaaatcc 660
ttagttttgg gacgtttcct gagtcagatt cgcgaaaaac tgattcagag aatttaccgc 720
gggatcgagc cgactttgcc aaactggttc gcggtcacaa agaccagaaa cggcgccgga 780
ggcgggaaca aggtggtgga cgagtgctac atccccaatt acttgctccc caaaacccag 840
cctgagctcc agtgggcgtg gactaattta gaacagtatt taagcgcctg tttgaatctc 900
acggagcgta aacggttggt ggcgcagcat ctgacgcacg tgtcgcagac gcaggagcag 960
aacaaagaga atcagaatcc caattctgac gcgccggtga tcagatcaaa aacttcagcc 1020
aggtacatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 1080
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 1140
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 1200
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 1260
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 1320
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 1380
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 1440
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 1500
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 1560
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 1620
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 1680
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 1740
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 1800
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 1860
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 1920
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 1980
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 2040
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 2100
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 2160
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 2220
<210> 10
<211> 2358
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 10
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg ggctaagacg gctgccgacg gttatctacc cgattggctc 180
gaggacaacc ttagtgaagg aattcgcgag tggtgggctt tgaaacctgg agcccctcaa 240
cccaaggcaa atcaacaaca tcaagacaac gctcgaggtc ttgtgcttcc gggttacaaa 300
taccttggac ccggcaacgg actcgacaag ggggagccgg tcaacgcagc agacgcggcg 360
gccctcgagc acgacaaggc ctacgaccag cagctcaagg ccggagacaa cccgtacctc 420
aagtacaacc acgccgacgc cgagttccag gagcggctca aagaagatac gtcttttggg 480
ggcaacctcg ggcgagcagt cttccaggcc aaaaagaggc ttcttgaacc tcttggtctg 540
gttgaggaag cggctaagac ggctcctgga aagaagaggc ctgtagagca gtctcctcag 600
gaaccggact cctccgcggg tattggcaaa tcgggtgcac agcccgctaa aaagagactc 660
aatttcggtc agactggcga cacagagtca gtcccagacc ctcaaccaat cggagaacct 720
cccgcagccc cctcaggtgt gggatctctt acaatggctt caggtggtgg cgcaccagtg 780
gcagacaata acgaaggtgc cgatggagtg ggtagttcct cgggaaattg gcattgcgat 840
tcccaatggc tgggggacag agtcatcacc accagcaccc gaacctgggc cctgcccacc 900
tacaacaatc acctctacaa gcaaatctcc aacagcacat ctggaggatc ttcaaatgac 960
aacgcctact tcggctacag caccccctgg gggtattttg acttcaacag attccactgc 1020
cacttctcac cacgtgactg gcagcgactc atcaacaaca actggggatt ccggcctaag 1080
cgactcaact tcaagctctt caacattcag gtcaaagagg ttacggacaa caatggagtc 1140
aagaccatcg ccaataacct taccagcacg gtccaggtct tcacggactc agactatcag 1200
ctcccgtacg tgctcgggtc ggctcacgag ggctgcctcc cgccgttccc agcggacgtt 1260
ttcatgattc ctcagtacgg gtatctgacg cttaatgatg gaagccaggc cgtgggtcgt 1320
tcgtcctttt actgcctgga atatttcccg tcgcaaatgc taagaacggg taacaacttc 1380
cagttcagct acgagtttga gaacgtacct ttccatagca gctacgctca cagccaaagc 1440
ctggaccgac taatgaatcc actcatcgac caatacttgt actatctctc aaagactatt 1500
aacggttctg gacagaatca acaaacgcta aaattcagtg tggccggacc cagcaacatg 1560
gctgtccagg gaagaaacta catacctgga cccagctacc gacaacaacg tgtctcaacc 1620
actgtgactc aaaacaacaa cagcgaattt gcttggcctg gagcttcttc ttgggctctc 1680
aatggacgta atagcttgat gaatcctgga cctgctatgg ccagccacaa agaaggagag 1740
gaccgtttct ttcctttgtc tggatcttta atttttggca aacaaggaac tggaagagac 1800
aacgtggatg cggacaaagt catgataacc aacgaagaag aaattaaaac tactaacccg 1860
gtagcaacgg agtcctatgg acaagtggcc acaaaccacc agagtgccca agcacaggcg 1920
cagaccggct gggttcaaaa ccaaggaata cttccgggta tggtttggca ggacagagat 1980
gtgtacctgc aaggacccat ttgggccaaa attcctcaca cggacggcaa ctttcaccct 2040
tctccgctga tgggagggtt tggaatgaag cacccgcctc ctcagatcct catcaaaaac 2100
acacctgtac ctgcggatcc tccaacggcc ttcaacaagg acaagctgaa ctctttcatc 2160
acccagtatt ctactggcca agtcagcgtg gagatcgagt gggagctgca gaaggaaaac 2220
agcaagcgct ggaacccgga gatccagtac acttccaact attacaagtc taataatgtt 2280
gaatttgctg ttaatactga aggtgtatat agtgaacccc gccccattgg caccagatac 2340
ctgactcgta atctgtaa 2358
<210> 11
<211> 4814
<212> DNA
<213> Artificial Sequence
<220>
<223> ITR -GOI
<400> 11
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgccgccc gtcagtgggc agagcgcaca 180
tcgcccacag tccccgagaa gttgggggga ggggtcggca attgaaccgg tgcctagaga 240
aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag 300
ggtgggggag aaccgtatat aagtgcagta gtcgccgtga acgttctttt tcgcaacggg 360
tttgccgcca gaacacgcgt aagggatccg ccaccatggt gagcaagggc gaggaggata 420
acatggccat catcaaggag ttcatgcgct tcaaggtgca catggagggc tccgtgaacg 480
gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc acccagaccg 540
ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc ctgggacatc ctgtcccctc 600
agttcatgta cggctccaag gcctacgtga agcaccccgc cgacatcccc gactacttga 660
agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag gacggcggcg 720
tggtgaccgt gacccaggac tcctccctgc aggacggcga gttcatctac aaggtgaagc 780
tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc atgggctggg 840
aggcctcctc cgagcggatg taccccgagg acggcgccct gaagggcgag atcaagcaga 900
ggctgaagct gaaggacggc ggccactacg acgctgaggt caagaccacc tacaaggcca 960
agaagcccgt gcagctgccc ggcgcctaca acgtcaacat caagttggac atcacctccc 1020
acaacgagga ctacaccatc gtggaacagt acgaacgcgc cgagggccgc cactccaccg 1080
gcggcatgga cgagctgtac aagtaagaat tcgatatcaa gcttatcgat aatcaacctc 1140
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 1200
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 1260
ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 1320
tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 1380
ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 1440
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 1500
acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 1560
ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 1620
accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 1680
ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgataccga gcgctgctcg 1740
agagatctac gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt 1800
tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga 1860
ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt 1920
tgggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc 1980
acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc 2040
tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg 2100
gtagagacgg ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat 2160
ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc 2220
tgtccttctg attttgtagg taaccacgtg cggaccgagc ggccgcagga acccctagtg 2280
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 2340
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 2400
ctgcaggcct gcaggcagct gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc 2460
gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga 2520
gtggccaact ccatcactag gggttcctgc ggccgcacgc gccgcccgtc agtgggcaga 2580
gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gaaccggtgc 2640
ctagagaagg tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt 2700
tcccgagggt gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg 2760
caacgggttt gccgccagaa cacgcgtaag ggatccgcca ccatggtgag caagggcgag 2820
gaggataaca tggccatcat caaggagttc atgcgcttca aggtgcacat ggagggctcc 2880
gtgaacggcc acgagttcga gatcgagggc gagggcgagg gccgccccta cgagggcacc 2940
cagaccgcca agctgaaggt gaccaagggt ggccccctgc ccttcgcctg ggacatcctg 3000
tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc accccgccga catccccgac 3060
tacttgaagc tgtccttccc cgagggcttc aagtgggagc gcgtgatgaa cttcgaggac 3120
ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg acggcgagtt catctacaag 3180
gtgaagctgc gcggcaccaa cttcccctcc gacggccccg taatgcagaa gaagaccatg 3240
ggctgggagg cctcctccga gcggatgtac cccgaggacg gcgccctgaa gggcgagatc 3300
aagcagaggc tgaagctgaa ggacggcggc cactacgacg ctgaggtcaa gaccacctac 3360
aaggccaaga agcccgtgca gctgcccggc gcctacaacg tcaacatcaa gttggacatc 3420
acctcccaca acgaggacta caccatcgtg gaacagtacg aacgcgccga gggccgccac 3480
tccaccggcg gcatggacga gctgtacaag taagaattcg atatcaagct tatcgataat 3540
caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 3600
tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 3660
gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 3720
cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 3780
tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 3840
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 3900
ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc 3960
tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 4020
ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc 4080
cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg ataccgagcg 4140
ctgctcgaga gatctacggg tggcatccct gtgacccctc cccagtgcct ctcctggccc 4200
tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt tgcatcattt 4260
tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta tggagcaagg 4320
ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca agctggagtg 4380
cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg attctcctgc 4440
ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc taatttttgt 4500
ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac tcctaatctc 4560
aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga accactgctc 4620
ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg accgagcggc cgcaggaacc 4680
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 4740
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 4800
cagctgcctg cagg 4814
<210> 12
<211> 2579
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 12
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg gggacaaggt aagtattcat tgtaaatctg atattatttg 180
tattattata cctacctaat ttgcagtgca ggccgccagt aagtatcgat aactttgttt 240
tctttcacat ttacaactcc gacatacaaa ttgtaatttt attactgttt ggtccataaa 300
cacttgttta ccatttcctt ttttacaagt tttaatattt tctgcatata taaaacatta 360
tttattttgc agtggctgcc gacggttatc tacccgattg gctcgaggac actctctctg 420
aaggaataag acagtggtgg aagctcaaac ctggcccacc accaccaaag cccgcagagc 480
ggcataagga cgacagcagg ggtcttgtgc ttcctgggta caagtacctc ggacccttca 540
acggactcga caagggagag ccggtcaacg aggcagacgc cgcggccctc gagcacgaca 600
aagcctacga ccggcagctc gacagcggag acaacccgta cctcaagtac aaccacgccg 660
acgcggagtt tcaggagcgc cttaaagaag atacgtcttt tgggggcaac ctcggacgag 720
cagtcttcca ggcgaaaaag agggttcttg aacctctggg cctggttgag gaacctgtta 780
agacggctcc gggaaaaaag aggccggtag agcactctcc tgtggagcca gactcctcct 840
cgggaaccgg aaaggcgggc cagcagcctg caagaaaaag attgaatttt ggtcagactg 900
gagacgcaga ctcagtacct gacccccagc ctctcggaca gccaccagca gccccctctg 960
gtctgggaac taatacgatg gctacaggca gtggcgcacc aatggcagac aataacgagg 1020
gcgccgacgg agtgggtaat tcctcgggaa attggcattg cgattccaca tggatgggcg 1080
acagagtcat caccaccagc acccgaacct gggccctgcc cacctacaac aaccacctct 1140
acaaacaaat ttccagccaa tcaggagcct cgaacgacaa tcactacttt ggctacagca 1200
ccccttgggg gtattttgac ttcaacagat tccactgcca cttttcacca cgtgactggc 1260
aaagactcat caacaacaac tggggattcc gacccaagag actcaacttc aagctcttta 1320
acattcaagt caaagaggtc acgcagaatg acggtacgac gacgattgcc aataacctta 1380
ccagcacggt tcaggtgttt actgactcgg agtaccagct cccgtacgtc ctcggctcgg 1440
cgcatcaagg atgcctcccg ccgttcccag cagacgtctt catggtgcca cagtatggat 1500
acctcaccct gaacaacggg agtcaggcag taggacgctc ttcattttac tgcctggagt 1560
actttccttc tcagatgctg cgtaccggaa acaactttac cttcagctac acttttgagg 1620
acgttccttt ccacagcagc tacgctcaca gccagagtct ggaccgtctc atgaatcctc 1680
tcatcgacca gtacctgtat tacttgagca gaacaaacac tccaagtgga accaccacgc 1740
agtcaaggct tcagttttct caggccggag cgagtgacat tcgggaccag tctaggaact 1800
ggcttcctgg accctgttac cgccagcagc gagtatcaaa gacatctgcg gataacaaca 1860
acagtgaata ctcgtggact ggagctacca agtaccacct caatggcaga gactctctgg 1920
tgaatccggg cccggccatg gcaagccaca aggacgatga agaaaagttt tttcctcaga 1980
gcggggttct catctttggg aagcaaggct cagagaaaac aaatgtggac attgaaaagg 2040
tcatgattac agacgaagag gaaatcagga caaccaatcc cgtggctacg gagcagtatg 2100
gttctgtatc taccaacctc cagagaggca acagacaagc agctaccgca gatgtcaaca 2160
cacaaggcgt tcttccaggc atggtctggc aggacagaga tgtgtacctt caggggccca 2220
tctgggcaaa gattccacac acggacggac attttcaccc ctctcccctc atgggtggat 2280
tcggacttaa acaccctcct ccacagattc tcatcaagaa caccccggta cctgcgaatc 2340
cttcgaccac cttcagtgcg gcaaagtttg cttccttcat cacacagtac tccacgggac 2400
aggtcagcgt ggagatcgag tgggagctgc agaaggaaaa cagcaaacgc tggaatcccg 2460
aaattcagta cacttccaac tacaacaagt ctgttaatgt ggactttact gtggacacta 2520
atggcgtgta ttcagagcct cgccccattg gcaccagata cctgactcgt aatctgtaa 2579
<210> 13
<211> 2546
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 13
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg gggacaaggt aagtattcat tgtaaatctg atattatttg 180
tattattata cctacctaat ttgcagtgca ggccgccagt aagtatcgat aactttgttt 240
tctttcacat ttacaactcc gacatacaaa ttgtaatttt attactgttt ggtccataaa 300
cacttgttta ccatttcctt ttttacaagt tttaatattt tctgcatata taaaacatta 360
tttattttgc agtgtctttt gttgatcacc cacccgattg gttggaagaa gttggtgaag 420
gtcttcgcga gtttttgggc cttgaagcgg gcccaccgaa accaaaaccc aatcagcagc 480
atcaagatca agcccgtggt cttgtgctgc ctggttataa ctatctcgga cccggaaacg 540
gtctcgatcg aggagagcct gtcaacaggg cagacgaggt cgcgcgagag cacgacatct 600
cgtacaacga gcagcttgag gcgggagaca acccctacct caagtacaac cacgcggacg 660
ccgagtttca ggagaagctc gccgacgaca catccttcgg gggaaacctc ggaaaggcag 720
tctttcaggc caagaaaagg gttctcgaac cttttggcct ggttgaagag ggtgctaaga 780
cggcccctac cggaaagcgg atagacgacc actttccaaa aagaaagaag gctcggaccg 840
aagaggactc caagccttcc acctcgtcag acgccgaagc tggacccagc ggatcccagc 900
agctgcaaat cccagcccaa ccagcctcaa gtttgggagc tgatacaatg tctgcgggag 960
gtggcggccc attgggcgac aataaccaag gtgccgatgg agtgggcaat gcctcgggag 1020
attggcattg cgattccacg tggatggggg acagagtcgt caccaagtcc acccgaacct 1080
gggtgctgcc cagctacaac aaccaccagt accgagagat caaaagcggc tccgtcgacg 1140
gaagcaacgc caacgcctac tttggataca gcaccccctg ggggtacttt gactttaacc 1200
gcttccacag ccactggagc ccccgagact ggcaaagact catcaacaac tactggggct 1260
tcagaccccg gtccctcaga gtcaaaatct tcaacattca agtcaaagag gtcacggtgc 1320
aggactccac caccaccatc gccaacaacc tcacctccac cgtccaagtg tttacggacg 1380
acgactacca gctgccctac gtcgtcggca acgggaccga gggatgcctg ccggccttcc 1440
ctccgcaggt ctttacgctg ccgcagtacg gttacgcgac gctgaaccgc gacaacacag 1500
aaaatcccac cgagaggagc agcttcttct gcctagagta ctttcccagc aagatgctga 1560
gaacgggcaa caactttgag tttacctaca actttgagga ggtgcccttc cactccagct 1620
tcgctcccag tcagaacctc ttcaagctgg ccaacccgct ggtggaccag tacttgtacc 1680
gcttcgtgag cacaaataac actggcggag tccagttcaa caagaacctg gccgggagat 1740
acgccaacac ctacaaaaac tggttcccgg ggcccatggg ccgaacccag ggctggaacc 1800
tgggctccgg ggtcaaccgc gccagtgtca gcgccttcgc cacgaccaat aggatggagc 1860
tcgagggcgc gagttaccag gtgcccccgc agccgaacgg catgaccaac aacctccagg 1920
gcagcaacac ctatgccctg gagaacacta tgatcttcaa cagccagccg gcgaacccgg 1980
gcaccaccgc cacgtacctc gagggcaaca tgctcatcac cagcgagagc gagacgcagc 2040
cggtgaaccg cgtggcgtac aacgtcggcg ggcagatggc caccaacaac cagagctcca 2100
ccactgcccc cgcgaccggc acgtacaacc tccaggaaat cgtgcccggc agcgtgtgga 2160
tggagaggga cgtgtacctc caaggaccca tctgggccaa gatcccagag acgggggcgc 2220
actttcaccc ctctccggcc atgggcggat tcggactcaa acacccaccg cccatgatgc 2280
tcatcaagaa cacgcctgtg cccggaaata tcaccagctt ctcggacgtg cccgtcagca 2340
gcttcatcac ccagtacagc accgggcagg tcaccgtgga gatggagtgg gagctcaaga 2400
aggaaaactc caagaggtgg aacccagaga tccagtacac aaacaactac aacgaccccc 2460
agtttgtgga ctttgccccg gacagcaccg gggaatacag aagcaccaga cctatcggaa 2520
cccgatacct tacccgaccc ctttaa 2546
<210> 14
<211> 2588
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap gene expression cassette
<400> 14
atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa ttattatcaa 60
atcatttgta tattaattaa aatactatac tgtaaattac attttattta caatcactcg 120
acgaagactt gatcacccgg gggacaaggt aagtattcat tgtaaatctg atattatttg 180
tattattata cctacctaat ttgcagtgca ggccgccagt aagtatcgat aactttgttt 240
tctttcacat ttacaactcc gacatacaaa ttgtaatttt attactgttt ggtccataaa 300
cacttgttta ccatttcctt ttttacaagt tttaatattt tctgcatata taaaacatta 360
tttattttgc agtggctgcc gacggttatc tacccgattg gctcgaggac aacctctctg 420
agggcattcg cgagtggtgg gcgctgaaac ctggagcccc gaagcccaaa gccaaccagc 480
aaaagcagga cgacggccgg ggtctggtgc ttcctggcta caagtacctc ggacccttca 540
acggactcga caagggggag cccgtcaacg cggcggacgc agcggccctc gagcacgaca 600
aggcctacga ccagcagctg caggcgggtg acaatccgta cctgcggtat aaccacgccg 660
acgccgagtt tcaggagcgt ctgcaagaag atacgtcttt tgggggcaac ctcgggcgag 720
cagtcttcca ggccaagaag cgggttctcg aacctctcgg tctggttgag gaaggcgcta 780
agacggctcc tggaaagaag agaccggtag agccatcacc ccagcgttct ccagactcct 840
ctacgggcat cggcaagaaa ggccaacagc ccgccagaaa aagactcaat tttggtcaga 900
ctggcgactc agagtcagtt ccagaccctc aacctctcgg agaacctcca gcagcgccct 960
ctggtgtggg acctaataca atggctgcag gcggtggcgc accaatggca gacaataacg 1020
aaggcgccga cggagtgggt agttcctcgg gaaattggca ttgcgattcc acatggctgg 1080
gcgacagagt catcaccacc agcacccgaa cctgggccct gcccacctac aacaaccacc 1140
tctacaagca aatctccaac gggacatcgg gaggagccac caacgacaac acctacttcg 1200
gctacagcac cccctggggg tattttgact ttaacagatt ccactgccac ttttcaccac 1260
gtgactggca gcgactcatc aacaacaact ggggattccg gcccaagaga ctcagcttca 1320
agctcttcaa catccaggtc aaggaggtca cgcagaatga aggcaccaag accatcgcca 1380
ataacctcac cagcaccatc caggtgttta cggactcgga gtaccagctg ccgtacgttc 1440
tcggctctgc ccaccagggc tgcctgcctc cgttcccggc ggacgtgttc atgattcccc 1500
agtacggcta cctaacactc aacaacggta gtcaggccgt gggacgctcc tccttctact 1560
gcctggaata ctttccttcg cagatgctga gaaccggcaa caacttccag tttacttaca 1620
ccttcgagga cgtgcctttc cacagcagct acgcccacag ccagagcttg gaccggctga 1680
tgaatcctct gattgaccag tacctgtact acttgtctcg gactcaaaca acaggaggca 1740
cggcaaatac gcagactctg ggcttcagcc aaggtgggcc taatacaatg gccaatcagg 1800
caaagaactg gctgccagga ccctgttacc gccaacaacg cgtctcaacg acaaccgggc 1860
aaaacaacaa tagcaacttt gcctggactg ctgggaccaa ataccatctg aatggaagaa 1920
attcattggc taatcctggc atcgctatgg caacacacaa agacgacgag gagcgttttt 1980
ttcccagtaa cgggatcctg atttttggca aacaaaatgc tgccagagac aatgcggatt 2040
acagcgatgt catgctcacc agcgaggaag aaatcaaaac cactaaccct gtggctacag 2100
aggaatacgg tatcgtggca gataacttgc agcagcaaaa cacggctcct caaattggaa 2160
ctgtcaacag ccagggggcc ttacccggta tggtctggca gaaccgggac gtgtacctgc 2220
agggtcccat ctgggccaag attcctcaca cggacggcaa cttccacccg tctccgctga 2280
tgggcggctt tggcctgaaa catcctccgc ctcagatcct gatcaagaac acgcctgtac 2340
ctgcggatcc tccgaccacc ttcaaccagt caaagctgaa ctctttcatc acgcaataca 2400
gcaccggaca ggtcagcgtg gaaattgaat gggagctgca gaaggaaaac agcaagcgct 2460
ggaaccccga gatccagtac acctccaact actacaaatc tacaagtgtg gactttgctg 2520
ttaatacaga aggcgtgtac tctgaacccc gccccattgg cacccgttac ctcacccgta 2580
atctgtaa 2588

Claims (26)

1.一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒,其特征在于,包含从5’至3’的、可操作连接的:
能够在昆虫细胞中驱动转录的启动子;
人工构建序列;
仅缺少第一个翻译起始密码子的重叠开放阅读框;
其中,所述人工构建序列包含在昆虫细胞中有剪接活性的天然的或经过人工改造的第一内含子和第二内含子,所述第一内含子和所述第二内含子共用5’部分或3’部分,所述人工构建序列中不含翻译起始密码子;
在转录后加工过程中,通过所述第一内含子和所述第二内含子的选择性剪接作用,能够在所述人工构建序列中形成翻译起始密码子AUG,从而实现调控所述重叠开放阅读框中不同蛋白编码基因的翻译表达。
2.根据权利要求1所述的表达盒,其特征在于:所述第一内含子或所述第二内含子位于ATG中的任意相邻两个核苷酸之间。
3.根据权利要求2所述的表达盒,其特征在于,所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸、所述第二内含子的5’部分、共用3’部分、胸腺嘧啶核苷酸和鸟嘌呤核苷酸;
或者所述人工构建序列包含从5’至3’的、可操作连接的:所述第一内含子的5’部分、腺嘌呤核苷酸、胸腺嘧啶核苷酸、所述第二内含子的5’部分、共用3’部分和鸟嘌呤核苷酸。
4.根据权利要求1所述的表达盒,其特征在于:所述第一内含子和所述第二内含子的5’端核苷酸均为GTNN,所述第一内含子和所述第二内含子的3’端核苷酸为NNAG,其中N为A、T、C、G四种核苷酸中的任意一种。
5.根据权利要求1所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因或AAV的rep基因。
6.根据权利要求1所述的表达盒,其特征在于:所述启动子为polh启动子或p10启动子。
7.根据权利要求6所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因,所述启动子为p10启动子。
8.根据权利要求6所述的表达盒,其特征在于:所述包含重叠开放阅读框的基因为AAV的rep基因,所述启动子为polh启动子。
9.一种核酸分子,其特征在于:包含第一表达盒,所述第一表达盒为权利要求1-8任一所述的表达盒。
10.根据权利要求9所述的核酸分子,其特征在于:还包含第二表达盒,所述第二表达盒为权利要求1-8任一所述的表达盒,且所述第二表达盒表达的基因与所述第一表达盒表达的基因不同。
11.根据权利要求10所述的核酸分子,其特征在于:所述第二表达盒相对于所述第一表达盒为反义方向。
12.根据权利要求10所述的核酸分子,其特征在于:所述第二表达盒相对于所述第一表达盒为正义方向。
13.根据权利要求9所述的核酸分子,其特征在于:还包含外源基因及位于所述外源基因两端的AAV反向末端重复序列。
14.根据权利要求13所述的核酸分子,其特征在于:所述外源基因为报告基因,所述报告基因为氯霉素乙酰转移酶编码基因、β-半乳糖苷酶编码基因、β-葡萄糖醛酸酶编码基因、海肾荧光素酶编码基因、碱性磷酸酶编码基因、萤火虫荧光素酶编码基因、绿色荧光蛋白编码基因和红色荧光蛋白编码基因中的至少一种。
15.根据权利要求13所述的核酸分子,其特征在于:所述外源基因为编码药物多肽的基因或编码用于制备兽用或人用疫苗的抗原蛋白的基因。
16.一种载体,其特征在于:包含权利要求1-8任一所述的表达盒。
17.根据权利要求16所述的载体,其特征在于:所述载体为昆虫细胞相容性载体。
18.根据权利要求16所述的载体,其特征在于:所述载体为质粒和病毒中的至少一种。
19.权利要求16所述的载体在昆虫细胞中制备重组腺相关病毒的应用。
20.权利要求16所述的载体在体外制备AAV衣壳中的应用,其特征在于:所述包含重叠开放阅读框的基因为AAV的cap基因。
21.一种昆虫细胞,其特征在于:包含权利要求1-8任一所述的表达盒。
22.根据权利要求21所述的昆虫细胞,其特征在于:所述表达盒被整合至所述昆虫细胞的基因组中。
23.根据权利要求21所述的昆虫细胞,其特征在于:所述昆虫细胞为草地贪夜蛾细胞、粉纹夜蛾细胞、果蝇细胞或蚊子细胞。
24.一种细胞培养物,其特征在于:包含权利要求21所述的昆虫细胞和培养基。
25.根据权利要求24所述的细胞培养物,其特征在于:所述培养基中包含AAV基因组。
26.一种重组腺相关病毒粒子,其特征在于:是在能产生重组腺相关病毒粒子的条件下培养权利要求21所述的昆虫细胞,然后回收制得的。
CN202111425804.2A 2021-11-26 2021-11-26 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 Active CN114150021B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN202111425804.2A CN114150021B (zh) 2021-11-26 2021-11-26 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
EP21952112.7A EP4209594A1 (en) 2021-11-26 2021-12-06 Expression cassette of gene containing overlapped open reading frame and application of expression cassette in insect cells
JP2022576350A JP2024500194A (ja) 2021-11-26 2021-12-06 重複オープンリーディングフレームを含む遺伝子の発現カセット、及び昆虫細胞におけるこの発現カセット使用
PCT/CN2021/135642 WO2023092643A1 (zh) 2021-11-26 2021-12-06 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
AU2021456513A AU2021456513A1 (en) 2021-11-26 2021-12-06 Expression cassette of gene comprising overlapping open reading frames and application thereof in insect cell
US18/016,684 US20230383310A1 (en) 2021-11-26 2021-12-06 Expression cassette of gene comprising overlapping open reading frames and application thereof in insect cell

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111425804.2A CN114150021B (zh) 2021-11-26 2021-11-26 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用

Publications (2)

Publication Number Publication Date
CN114150021A true CN114150021A (zh) 2022-03-08
CN114150021B CN114150021B (zh) 2022-10-28

Family

ID=80457841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111425804.2A Active CN114150021B (zh) 2021-11-26 2021-11-26 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用

Country Status (6)

Country Link
US (1) US20230383310A1 (zh)
EP (1) EP4209594A1 (zh)
JP (1) JP2024500194A (zh)
CN (1) CN114150021B (zh)
AU (1) AU2021456513A1 (zh)
WO (1) WO2023092643A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117070518A (zh) * 2023-08-03 2023-11-17 劲帆生物医药科技(武汉)有限公司 一种用于表达包含重叠开放阅读框的基因的表达盒及应用
WO2024067153A1 (zh) * 2022-09-27 2024-04-04 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1961071A (zh) * 2004-03-15 2007-05-09 比奥根艾迪克Ma公司 使用可选剪接在真核细胞中表达多肽多聚体的方法和构建物
CN101213203A (zh) * 2005-04-29 2008-07-02 教堂山北卡罗莱纳州大学 在转录后水平调节核酸表达的方法和组合物
CN101421408A (zh) * 2006-02-10 2009-04-29 奥西泰克有限公司 昆虫中利用可变剪接的基因表达系统
US20090203071A1 (en) * 2006-08-24 2009-08-13 Virovek, Inc. Expression in insect cells of genes with overlapping open reading frames, methods and compositions therefor
CN111183225A (zh) * 2017-07-20 2020-05-19 优尼科Ip有限公司 在昆虫细胞中改进的aav衣壳产生
WO2021087007A1 (en) * 2019-10-28 2021-05-06 University Of Florida Research Foundation, Incorporated Gene therapy vectors

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8580511B2 (en) * 2006-06-19 2013-11-12 The Regents Of The University Of California Two-color fluorescent reporter for alternative pre-mRNA splicing
CN101506369B (zh) 2006-06-21 2014-02-12 尤尼克尔生物制药股份有限公司 具有经修饰的用于在昆虫细胞中产生aav的aav-rep78翻译起始密码子的载体
CN106544325B (zh) 2015-09-23 2018-09-07 中国科学院武汉物理与数学研究所 一种重组杆状病毒及其应用
JP2022553205A (ja) * 2019-10-17 2022-12-22 ザ ジョンズ ホプキンズ ユニヴァーシティー 選択的スプライシングを使用して遺伝子療法の特異性を制御するための組成物および方法
CN112280801A (zh) 2020-10-30 2021-01-29 武汉枢密脑科学技术有限公司 一种利用质粒辅助进行rAAV感染滴度检测的方法及试剂盒
CN112553257B (zh) 2020-12-03 2022-02-11 武汉枢密脑科学技术有限公司 一种重组腺相关病毒的制备方法、系统及重组杆粒

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1961071A (zh) * 2004-03-15 2007-05-09 比奥根艾迪克Ma公司 使用可选剪接在真核细胞中表达多肽多聚体的方法和构建物
CN101213203A (zh) * 2005-04-29 2008-07-02 教堂山北卡罗莱纳州大学 在转录后水平调节核酸表达的方法和组合物
CN101421408A (zh) * 2006-02-10 2009-04-29 奥西泰克有限公司 昆虫中利用可变剪接的基因表达系统
US20090203071A1 (en) * 2006-08-24 2009-08-13 Virovek, Inc. Expression in insect cells of genes with overlapping open reading frames, methods and compositions therefor
CN101522903A (zh) * 2006-08-24 2009-09-02 威洛克有限公司 具有重叠开放阅读框的基因在昆虫细胞中的表达及其方法和组合物
CN111183225A (zh) * 2017-07-20 2020-05-19 优尼科Ip有限公司 在昆虫细胞中改进的aav衣壳产生
WO2021087007A1 (en) * 2019-10-28 2021-05-06 University Of Florida Research Foundation, Incorporated Gene therapy vectors

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAIFENG CHEN: "Intron Splicing–mediated Expression of AAV Rep and Cap Genes and Production of AAV Vectors in Insect Cells", 《MOLECULAR THERAPY》 *
HAIFENG CHEN: "Manufacturing of Adeno-Associated Viruses, for Example: AAV2", 《METHODS IN MOLECULAR BIOLOGY》 *
逄洪波等: "可变剪切在动植物中的研究进展", 《基因组学与应用生物学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024067153A1 (zh) * 2022-09-27 2024-04-04 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
CN117070518A (zh) * 2023-08-03 2023-11-17 劲帆生物医药科技(武汉)有限公司 一种用于表达包含重叠开放阅读框的基因的表达盒及应用

Also Published As

Publication number Publication date
CN114150021B (zh) 2022-10-28
US20230383310A1 (en) 2023-11-30
EP4209594A1 (en) 2023-07-12
WO2023092643A1 (zh) 2023-06-01
AU2021456513A1 (en) 2023-06-15
JP2024500194A (ja) 2024-01-05

Similar Documents

Publication Publication Date Title
Mietzsch et al. OneBac: platform for scalable and high-titer production of adeno-associated virus serotype 1–12 vectors for gene therapy
Grieger et al. Adeno-associated virus as a gene therapy vector: vector development, production and clinical applications
ES2385679T3 (es) Expresión de células de insecto de genes con marcos de lectura abiertos superpuestos, métodos y composiciones de éstos
CN113897396B (zh) 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
CN106884014B (zh) 腺相关病毒反向末端重复序列突变体及其应用
CN114150021B (zh) 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
US20230159953A1 (en) Closed-ended, linear, duplex adenoassociated virus dna, and uses thereof
JP2023171525A (ja) Aavキメラ
WO2024067153A1 (zh) 一种用于在昆虫细胞中产生rAAV的核酸、VP1衣壳蛋白突变体及应用
CN117070518A (zh) 一种用于表达包含重叠开放阅读框的基因的表达盒及应用
US20210292373A1 (en) Aav vp1u chimeras
US20070275449A1 (en) Method for Large-Scale Production, Isolation, Purification and the Uses of Multi-Type Recombinant Adeno-Associated Virus Vectors
CN114736928B (zh) 一种杆状病毒载体及其在昆虫细胞中制备rAAV的应用
CN114736929B (zh) 一种用于昆虫细胞中产生重组杆状病毒的组合物、方法及应用
EP4198135A1 (en) Nucleic acid construct for increasing adeno-associated virus yield, and construction method therefor
WO2024002344A1 (zh) 精准重组腺相关病毒载体及其用途
CN115851837A (zh) 一种提高杆状病毒系统生产腺相关病毒的方法及应用
CN117551698A (zh) 一种优化的含有重叠开放阅读框的表达盒及应用
AU2022292164A1 (en) Aav manufacturing methods
JP2023002483A (ja) 昆虫細胞におけるアデノ随伴ウイルスベクターの産生
US20220242917A1 (en) Compositions and methods for producing adeno-associated viral vectors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220513

Address after: 430223 311-22, experimental building of NMR spectrometer industrial base, No. 128, Guanggu seventh Road, Donghu New Technology Development Zone, Wuhan, Hubei Province (Wuhan area of free trade zone)

Applicant after: Jinfan biomedical technology (Wuhan) Co.,Ltd.

Address before: 430223 Zhongke Kaiwu Industrial Park, 128 Guanggu 7th Road, Donghu hi tech Development Zone, Wuhan City, Hubei Province

Applicant before: WUHAN BRAINVTA SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant