CN111183225A - 在昆虫细胞中改进的aav衣壳产生 - Google Patents

在昆虫细胞中改进的aav衣壳产生 Download PDF

Info

Publication number
CN111183225A
CN111183225A CN201880058315.8A CN201880058315A CN111183225A CN 111183225 A CN111183225 A CN 111183225A CN 201880058315 A CN201880058315 A CN 201880058315A CN 111183225 A CN111183225 A CN 111183225A
Authority
CN
China
Prior art keywords
sequence
aav
nucleic acid
acid construct
parvoviral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880058315.8A
Other languages
English (en)
Other versions
CN111183225B (zh
Inventor
D·J·F·杜普莱西斯
O·特布雷克
S·M·博斯马
H·P·A·彼得里
J·卢贝尔斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uniqure IP BV
Original Assignee
Uniqure IP BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uniqure IP BV filed Critical Uniqure IP BV
Publication of CN111183225A publication Critical patent/CN111183225A/zh
Application granted granted Critical
Publication of CN111183225B publication Critical patent/CN111183225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0601Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14044Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14051Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明涉及在昆虫细胞中腺相关病毒载体的产生。昆虫细胞因此包括编码腺相关病毒(AAV)衣壳蛋白的第一核苷酸序列,其中用于翻译AAV VP1衣壳蛋白的起始密码子是AUG。VP1开放阅读框的上游设置选择性框外起始密码子,如此使得VP1蛋白的翻译起始被调整,即减少,以允许以良好化学计量比产生VP1:VP2:VP3,得到具有高效价的AAV。

Description

在昆虫细胞中改进的AAV衣壳产生
技术领域
本发明涉及在昆虫细胞中腺相关病毒的产生以及涉及提供了改进的感染性的腺相关病毒。本发明还涉及关于腺相关病毒载体文库的手段和方法。
发明背景
腺相关病毒(AAV)可以被认为是最有希望用于人类基因疗法的病毒载体之一。AAV具有有效率地感染分裂人类细胞及非分裂人类细胞的能力,AAV病毒基因组整合到宿主细胞基因组中的单个染色体位点,并且最重要的是,即使AAV存在于许多人类中,其从未与任何疾病相关。鉴于这些优点,重组腺相关病毒(rAAV)正在对于B型血友病、恶性黑色素瘤、囊性纤维化和其他疾病的基因疗法临床试验中进行评估。在欧洲的大量临床试验和基因疗法药物的批准,如Alipogene tiparvovec(
Figure BDA0002404147760000011
uniQure),有望使AAV成为临床实践的主要内容。
通常,对于重组AAV的产生系统主要有两类。一方面,有在哺乳动物细胞类型(如293细胞、COS细胞、HeLa细胞、KB细胞)中的常规产生系统,并且另一方面有使用昆虫细胞的产生系统。
哺乳动物产生系统存在几个缺点,所述缺点可以包括每个细胞生成的rAAV颗粒数量有限(104的数量级的颗粒,(在Clark,2002,Kidney Int.61(Suppl.1):9–15中回顾)和繁琐的大规模制作。对于临床研究,可以需要超过1015的rAAV颗粒。为了产生这一数量的rAAV颗粒,将需要用大约1011个培养的人类293细胞来转染和培养,相当于5000个175-cm2培养瓶的细胞,这意味着转染多达1011个293细胞。因此,使用哺乳动物细胞培养系统大规模产生rAAV以获得用于临床试验的材料已经证明是有问题的,在大的商业规模下的产生可能更不可行。此外,一直有的风险是,在哺乳动物细胞培养中产生的用于临床用途的载体将被哺乳动物宿主细胞中存在的不期望的、可能致病的物质污染。
为了克服哺乳动物产生系统的这些问题,已经使用昆虫细胞开发了AAV产生系统(Urabeetal.,2002,Hum.Gene Ther.13:1935–1943;US 20030148506及US 20040197895)。来自野生型病毒的AAV野生型衣壳由约60种衣壳蛋白组成,即化学计量比约为1:1:10的VP1、VP2和VP3。不受理论的限制,认为化学计量比对于重组AAV获得好的效价(即好的转导)是重要的。在野生型病毒中,即在哺乳动物细胞中,取得了三种AAV衣壳蛋白(VP1、VP2和VP3)的约为1:1:10的化学计量比,这依赖于两个剪接受体位点的交替使用和对于VP2的ACG起始密码子较少最优利用的组合。然而,为了在昆虫细胞中产生AAV,有必要进行修饰,因为在哺乳动物细胞中出现的表达策略不会在昆虫细胞中复制。为了在昆虫细胞中获得衣壳蛋白改进的产生,Urabe等(2002,supra)使用了转录成单个多顺反子信使的构建体,所述单个多顺反子信使能够表达所有三种VP蛋白而不需要剪接,并且其中第一个翻译起始密码子被密码子ACG所取代。WO2007/046703公开了通过进一步优化昆虫细胞中AAV衣壳蛋白的比,进一步改进杆状病毒(baculovirus)产生的rAAV载体的感染性。
Urabe等(J.Virol.,2006,80(4):1874-1885)报道了使用ACG作为VP1衣壳蛋白的起始密码子在杆状病毒系统中产生的AAV5颗粒具有差的转导效率或效价,并且与具有从ACG起始密码子表达VP1的AAV2相反,将AAV5 VP1编码序列中的+4位突变为G残基没有提高感染性。Urabe等构建了嵌合AAV2/5VP1蛋白,其中AAV5 VP1的至少49个氨基酸的N端部分被AAV2 VP1的相应部分所取代,这改进了病毒体的转导性质。
在又一方法中,通过在AAV衣壳编码序列中在次优(非ATG)翻译起始密码子和编码氨基酸残基(其对应于野生型衣壳氨基酸序列第2位的氨基酸残基)的密码子之间插入一个或多个氨基酸残基,提高了AAV衣壳蛋白的表达(Lubelski等人,WO2015137802)。
尽管改进了用于制作用于医学治疗中的AAV基因疗法载体的衣壳的基于昆虫细胞的产生,仍需要进一步改进AAV衣壳产生,并且提供新方法以选择用于在昆虫细胞中表达的改进的AAV衣壳构建体。
发明内容
发明简述
本发明者惊奇地发现,AAV衣壳可以在昆虫细胞中由表达构建体有效率地产生,该表达构建体编码来自重叠阅读框的VP1、VP2和VP3蛋白的转录本,其中VP1是从AUG起始密码子翻译的。含有ATG起始密码子的现有技术的构建体不产生像野生型AAV中观察到的约1:1:10的VP1:VP2:VP3比,并且因此,不受理论的限制,不会产生有效价的AAV。本发明中鉴定的表达构建体允许在昆虫细胞中有效率的产生大量用于医学治疗的高效价AAV基因疗法载体。如果关于效价和数量相对于从选择性(alternative)起始密码子(如CTG或GTG)产生的AAV基因疗法载体没有改进,这样的载体至少是相似的(见图4)。
因此,本发明的构建体含有在VP1 ATG起始密码子5’的额外框外起始密码子,所述额外框外起始密码子明显导致在VP1起始密码子翻译起始的减少,这允许翻译足量的VP1、VP2和VP3。不受理论的限制,这样的构建体可以允许VP1、VP2和VP3氨基酸序列的表达,因为它们是在野生型病毒中发现的。
如示例所示,通过使用用于昆虫细胞的AAV衣壳表达构建体文库来鉴定这样的构建体。选择构建体,其首先需要在昆虫细胞中高度有效率的产生AAV衣壳,并且其次需要在选定的靶细胞上具有高度感染性。因此,本发明者还提供了高度有效率的选择方法,以提供具有改进的性质(例如改进的产生和/或改进的感染性)的AAV衣壳表达构建体。
因此,在第一方面,在本发明提供了包括表达控制序列的核酸构建体,所述表达控制序列用于在昆虫细胞中表达包括开放阅读框的核苷酸序列,其中所述开放阅读框序列编码:
i)腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3;和
ii)用于VP1的AUG翻译起始密码子;
其中所述核苷酸序列包括在开放阅读框上游的选择性起始密码子,所述选择性起始密码子是在开放阅读框的框外。换句话说,所述选择性起始密码子优选是起始密码子上游的3N+1或3N+2个核苷酸。
在另一方面,本发明提供了一种提供用于在昆虫细胞中的产生的编码细小病毒的衣壳蛋白的核酸构建体的方法,所述核酸构建体具有一种或多种改进的性质,所述方法包括:
a)提供多个核酸构建体,每个构建体包括:
可操作地连接于表达控制序列的编码细小病毒的衣壳蛋白的核苷酸序列和在所述可操作地连接于表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列的侧翼的至少一个细小病毒的反向末端重复(ITR)序列;
b)将所述多个核酸构建体转移到能表达细小病毒的Rep蛋白的昆虫细胞中;
c)将所述昆虫细胞置于允许表达细小病毒的衣壳蛋白和细小病毒的rep蛋白的条件下,使得所述核酸构建体可以被包装在细小病毒的衣壳中以提供细小病毒的病毒体;
d)从所述昆虫细胞和/或昆虫细胞上清液回收细小病毒的病毒体;
e)使所述细小病毒的病毒体与靶细胞接触,以允许所述靶细胞的感染;
f)从所述靶细胞回收所述核酸构建体。
附图说明
图1:文库生成和选择过程的示意图。(a)首先,提供DNA文库。在这一特定示例中,表达构建体的文库具有用于AAV5 VP1的多种起始密码子(XXX),并且在选择的位置具有随机核苷酸(N)(SEQ ID NO:71),这样的构建体的示例被列出(1是SEQ ID NO:1;2是SEQ IDNO:63;n是SEQ ID NO:65);(b)将DNA文库转移至载体构建体中,所述载体构建体具有有启动子(P)的表达盒,用于表达AAV5 VP1、VP2和VP3的衣壳蛋白(Cap(VP123)),所述表达盒侧翼为两个AAV反向末端重复(ITR),以允许AAV衣壳中的衣壳化。还提供了对于Rep 52和Rep78的表达盒;(c)所述Cap和Rep构建体随后转移到昆虫细胞,在这一例子中为Sf9细胞。所述转移可以通过杆状病毒载体,其允许感染复数的控制;(d)因此,在昆虫细胞中,表达的Rep52和Rep78蛋白复制并衣壳化含有衣壳表达盒的AAV载体基因组。正如所述,当使用杆状病毒载体时,感染复数可以得到很好的控制,并且对于Cap构建体,优选地保持远低于1,以平均每个Sf9细胞只有一个文库成员,以避免交叉包装。只有有效地产生衣壳的Cap表达盒将衣壳化载体基因组;(e)接着,针对感染性测试含有载体基因组的衣壳,即有效率的将载体基因组转移到靶细胞。具有载体基因组的载体颗粒可以例如是非感染性的,而具有载体基因组和VP1:VP2:VP3比约为1:1:10的载体颗粒具有高度感染性。在这一示例中,使用也能够复制AAV载体基因组的HeLaRC32细胞系。随后可以从靶细胞中鉴定载体基因组。例如,可以确定载体基因组序列或含有(a)中所示变化的序列的其部分。可选的,可以确定标识符序列,以鉴定已经历成功感染靶细胞的(a)中的文库成员。
因此,结合的步骤(c)和(e)允许选择允许在昆虫细胞中的有效率的产生并在靶细胞中产生感染性病毒体的衣壳表达构建体。在群体中占优势的选择的表达构建体可以是特别合适的候选物。随后可以使用选择的候选表达构建体(无侧翼ITR),例如在杆状病毒载体中或插入细胞系中,以产生AAV基因疗法载体。
图2:在这些图中,显示了在选择过程的每个阶段具有特定起始密码子(x轴)的文库成员的百分比(y轴);A)这幅图显示了质粒DNA文库的起始密码子的分布,所述质粒DNA文库由侧翼具有AAV ITR的表达盒制成。盛行率(prevalence)在约4%至约8%之间变化;B)这幅图显示了杆状病毒文库的起始密码子的分布,所述杆状病毒文库由侧翼具有AAV ITR的插入的表达盒制成。盛行率在约4%至约9%之间变化,应该注意这一文库的分布性质与质粒文库非常相似;C)这幅图显示了AAV文库中所含起始密码子的分布,所述AAV文库由图2B)的杆状病毒文库制成。注意的是,起始密码子的分布与杆状病毒文库非常相似,范围为约4%至9%,有一个例外,即ATG起始密码子的盛行率远低于0.5%;D)这幅图显示了AAV载体基因组中含有的起始密码子在图2C)的AAV文库所感染细胞中的分布。注意的是,目前起始密码子的分布非常不同。CTG和GTG是最普遍的起始密码子,其盛行率约为50%。在AAV文库中代表得很少的起始密码子ATG,现在其盛行率约为8%,而其余起始密码子的盛行率在约1%至3%之间。E)这幅图结合了图2A)-D)的各自的图。注意的是,对于AAV文库的ATG密码子的低点和对于细胞文库的CTG、GTG和ATG的峰点。
图3.随后将选择的序列(ATG1、ATG2等)克隆至杆状病毒载体中,用于表达AAV5衣壳。随后通过SDS-PAGE分析杆状病毒载体的克隆,以评估VP1:VP2:VP3的比。CTG1不会产生良好的克隆,而CTG2和GTG2产生显示如上所示的化学计量比的良好的克隆(Lubelski等,WO2015137802)。TAG克隆产生低滴度,以及TGA克隆似乎不产生VP1。令人惊讶的是,ATG1和ATG2产生了具有与CTG2相似化学计量比的良好克隆。
图4.AAV效价测定。在Huh7细胞(A)和HeLa细胞(B)中测试了携带在CMV启动子控制下的SEAP报告基因的不同AAV载体的相对效价。用不同的感染复数(106、105、104基因组拷贝数的AAV(gc)/细胞)感染细胞,并确定SEAP报告基因的表达。ATG1构建体得到最大效价的载体,而ATG2、CTG2和GTG2具有相似的性质,而因为不含有或几乎不含有任何VP1蛋白,TGA具有明显较小的效价。GTG1 AAV载体产生了低滴度的gc/ml,并且因此不允许以MOI为106的感染。
图5.用于有效率的AAV衣壳蛋白表达的ATG序列背景示意图。A)上面的框从左到右显示对于VP1的开放阅读框中的密码子。具有VP1起始密码子的框含有“ATG”。下面的框是具有对于VP1的开放阅读框的框外。ATG密码子的上游是选择性起始密码子(起始),并且其下游也是终止密码子(终止)。B)所示为选自文库中优势序列的序列(SEQ ID NO:1)。在框外重叠阅读框(OOF)中,ATG起始密码子被发现在对于Cap的框内阅读框的上游。在源自野生型AAV5序列的序列中,OOF具有TGA下游终止密码子,当从OOF起始密码子翻译时,这将导致6个氨基酸的短肽MHHGK(SEQ ID NO:72);C)所示为从另一个上游起始密码子的又一框外重叠阅读框的序列。上面的情况具有框外CTG起始密码子(SEQ ID NO:2),其中在源自AAV5序列的序列进一步下游具有终止密码子(参见i.a.SEQ ID NO:70)。这将导致终止于TAG终止密码子的约158个氨基酸的较大蛋白序列的翻译。下面的情况为在起始密码子刚刚下游的突变序列中也具有终止密码子的CTG起始密码子,当从OOF(SEQ ID NO:9)翻译时,将导致4个氨基酸的短肽MEIW(SEQ ID NO:73);D)如图5A-C所示来自构建体的VP1、VP2和VP3衣壳蛋白表达的示意图。DNA含有具有启动子(P)和对于衣壳蛋白(Cap(VP123))的开放阅读框的表达盒。箭头指示了转录起始。转录导致这样的mRNA,从该mRNA首先可以翻译OOF蛋白,并随后翻译VP1、VP2和VP3衣壳蛋白。OOF序列与VP1翻译起始重叠。
图6.用于AAV文库制备的多种载体载具结构的示意图。图6A:所示为实施例中使用的结构,其中表达AAV衣壳蛋白(灰框)的表达盒包含在AAV ITR之间和杆状病毒基因组内。从其中产生的AAV含有具有侧翼于表达盒的ITR的载体基因组。图6B:所示为这样的结构,其中载体载具(例如杆状病毒)含有对于细小病毒衣壳蛋白的表达盒,且其中在载体基因组ITR序列之间放置了序列标识符(ID)。从其中产生的AAV含有具有侧翼于序列标记符的ITR的载体基因组。通过鉴别序列标识符,例如通过测序,因为Cap序列和ID是连接的,可以确定相应的cap序列,因为ID和Cap序列在某个基因组中是相关联的,例如通过对包含这两个序列的杆状病毒载体进行测序,或者因为杆状病毒载体是这样的方式构建的,标识符序列和Cap表达序列的组合是预先已知的。图6C的构建体也可以包括细小病毒载体基因组内的报告基因。
定义
正如本文所用的,术语“可操作地连接”是指多核苷酸(或多肽)元件以功能性关系的连接。当使核酸与另一核酸序列置于功能性关系时,核酸是“可操作地连接的”。例如,转录调控序列如果影响编码序列的转录,则可操作地连接至该编码序列。可操作地连接是指被连接的DNA序列通常是连续的,并且在需要结合两个蛋白编码区时,是连续的并在阅读框内。
“表达控制序列”是指调控与其可操作连接的核苷酸序列的表达的核酸序列。当表达控制序列控制和调节核苷酸序列的转录和/或翻译时,表达控制序列“可操作地连接”至所述核苷酸序列。因此,表达控制序列可以包括启动子、增强子、内部核糖体进入位点(IRES)、转录终止子、蛋白编码基因前面的起始密码子、内含子的剪接信号和终止密码子。术语“表达控制序列”旨在包括(至少)这样的序列,其存在被设计为来影响表达,并且还可以包括额外的优势组分。例如,前导序列和融合伴侣序列是表达控制序列。术语还可以包括核酸序列的设计,如此使得从序列中去除框内和框外不期望的潜在的起始密码子。其还可以包括核酸序列的设计,如此使得去除不期望的潜在的剪接位点。其包括引导添加聚腺苷酸尾巴的序列或者聚腺苷酸化序列(pA),即在mRNA的3'端的一串腺嘌呤残基,该序列称为polyA序列。其也可以设计为增强mRNA的稳定性。影响转录和翻译稳定性的表达控制序列(例如启动子),以及影响翻译的序列(例如Kozak序列),在昆虫细胞中是已知的。表达控制序列可以具有这样的性质,以调控与其可操作地连接的核苷酸序列,如此使得达到较低的表达水平或较高的表达水平。
如本文所用的,术语“启动子”或“转录调控序列”是指作用为控制一个或多个编码序列的转录的核酸片段,并且位于相对于编码序列的转录起始位点的转录方向的上游,并且结构上通过以下的存在来鉴定:DNA依赖性RNA聚合酶的结合位点、转录起始位点和任何其他DNA序列,包括但不限于转录因子结合位点、阻遏和激活蛋白结合位点,以及直接或间接调控从启动子的转录的量的本领域技术人员已知的核苷酸的任何其他序列。“组成型”启动子是在大多数生理和发育条件下在大多数组织中有活性的启动子。“诱导型”启动子是由生理或发育调控的启动子,例如通过化学诱导剂的应用。“组织特异性”启动子仅在特定类型的组织或细胞中有活性。
术语以“大体上相同”,“大体上相同性”或“基本上相似”或“基本相似性”是指两个肽序列或两个核苷酸序列,当最佳比对时,如通过使用默认参数的程序GAP或BESTFIT,共享本文其他部分定义的至少一定百分比的序列相同性。GAP使用Needleman和Wunsch全局比对算法,使两个序列在其整个长度上对齐,最大化匹配数量和最小化缺口数量。通常,使用GAP默认参数,其中缺口生成罚分=50(核苷酸)/8(蛋白质),以及缺口延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵为nwsgapdna,以及对于蛋白,默认评分矩阵为Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。清楚的是,当RNA序列据说与DNA序列基本相似或具有一定程度的序列相同性时,DNA序列中的胸腺嘧啶(T)认为与RNA序列中的尿嘧啶(U)等同。使用计算机程序(如GCG Wisconsin Package,版本10.3,从AccelrysInc.,9685Scranton Road,San Diego,CA92121-3752,USA可获得或Windows开源软件Emboss(当前版本2.7.1-07)),可以确定序列比对和序列相同性百分比评分。可选地,可以通过检索例如FASTA、BLAST等数据库确定相似性或相同性百分比。
本发明的编码细小病毒Rep蛋白或Cap蛋白的核苷酸序列也可以通过以下定义:在适度杂交杂交条件下,或优选在严格杂交条件下,它们与它们的各自核苷酸序列杂交的能力。严格杂交条件在本文定义为这样的条件下的杂交,其允许核酸序列的至少约25个核苷酸,优选约50个核苷酸、75个核苷酸或100个核苷酸,和最优选约200个或更多个核苷酸,在约65℃温度下,在包含约1M盐的溶液(优选6x SSC)或具有相当离子强度的任何其他溶液中,以及在65℃下,在包含约0.1M盐或更少的溶液(优选0.2x SSC)或具有相当离子强度的任何其他溶液中洗涤。优选地,所述杂交是过夜进行的,即至少10小时,并优选至少更换洗涤液2次来进行洗涤至少1小时。这些条件将通常允许具有约90%或更高序列相同性的序列的特异性杂交。
适度条件在本文定义为这样的条件下的杂交,其允许核酸序列的至少约50个核苷酸,优选约200个核苷酸或更多个核苷酸,在约45℃温度下,在包含约1M盐的溶液(优选6xSSC)或具有相当离子强度的任何其他溶液中,以及在室温下,在包含约1M盐的溶液(优选6xSSC)或具有相当离子强度的任何其他溶液中洗涤。优选地,所述杂交是过夜进行的,即至少10小时,并优选至少更换洗涤液2次来进行洗涤至少1小时。这些条件将通常允许具有高达50%序列相同性的序列的特异性杂交。本领域技术人员将能够修改这些杂交条件,以便特异地鉴定具有在50%至90%之间变化的相同性的序列。
发明详述
本发明涉及一种动物细小病毒,特别是依赖病毒(dependovirus),如感染性人类或猿猴AAV及其组分(例如,动物细小病毒基因组)用作用于在哺乳动物细胞中引入和/或表达核酸的载体的用途。特别地,本发明涉及当在昆虫细胞中产生时该细小病毒载体的感染性的改进。
细小病毒科的病毒是小的DNA动物病毒。细小病毒科可以分成两个亚科:感染脊椎动物的细小病毒亚科(Parvovirinae)和感染昆虫的浓病毒亚科(Densovirinae)。细小病毒亚科的成员在本文被称为细小病毒,并包括依赖病毒属。从其属的名称可以推断,依赖病毒的成员的独特在于它们通常需要与辅助病毒如腺病毒或疱疹病毒共同感染用于在细胞培养物中的产毒型感染。依赖病毒属包括AAV,其通常感染人类(例如血清型1、2、3A、3B、4、5、6、7、8、9、10、11、12、13)或灵长类(如血清型1和4),以及感染其他温血动物的相关病毒(例如牛、犬、马和羊腺相关病毒)。有关细小病毒和细小病毒科其他成员的更多信息描述于Kennethi I.Berns,"Parvoviridae:The Viruses and Their Replication,"Chapter69in Fields Virology(第三版,1996)。为了方便起见,通过参考AAV,在本文中进一步解释和描述本发明。然而理解的是,本发明不限于AAV,也可同样适用于其他细小病毒。
所有已知AAV血清型的基因组结构非常相似。AAV的基因组是线状、单链DNA分子,其长度上小于约5000个核苷酸(nt)。反向末端重复(ITR)在非结构性复制(Rep)蛋白和结构性(VP)蛋白的独特编码核苷酸序列的侧翼。VP蛋白(VP1、-2和-3)形成衣壳。末端145nt是自互补的并且被组织使得可以形成能量稳定的分子内双链体,所述分子内双链体形成T形发夹。这些发夹结构作为病毒DNA复制的起点起作用,担任细胞DNA聚合酶复合物的引物。wtAAV感染哺乳动物细胞后,分别从P5启动子和P19启动子表达Rep基因(即Rep78和Rep52),且两种Rep蛋白均具有病毒基因组的复制中的功能。Rep ORF中的剪接事件导致实际四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而,已经表明,在哺乳动物细胞中,编码Rep78和Rep52蛋白的未剪接的mRNA足以用于AAV载体的产生。同样在昆虫细胞中,Rep78和Rep52蛋白足以用于AAV载体的产生。三种衣壳蛋白VP1、VP2和VP3自p40启动子从单个VP阅读框表达。对于衣壳蛋白的产生,哺乳动物细胞中wtAAV的感染依赖于两个剪接受体位点的选择性使用和VP2的ACG起始密码子的次优利用的组合。
在昆虫细胞中,具有编码VP1(具有AUG起始密码子)、VP2和VP3蛋白的AAV开放阅读框的转录本(即mRNA)的表达,通常不以约1:1:10的比且以导致有效价的AAV的量产生VP1、VP2和VP3衣壳蛋白。本文定义的效价是AAV载体将其载体基因组转移到靶细胞并允许转基因有效率的表达的能力。目前,本发明者惊奇地发现,AAV衣壳可以在昆虫细胞中从表达构建体高度有效率地产生,所述表达构建体编码VP1、VP2和VP3蛋白的转录本,其中VP1是从AUG起始密码子翻译的。
本发明中鉴定的表达构建体允许在昆虫细胞中有效率的产生大量用于医学治疗的高效价AAV基因疗法载体。如果关于从选择性起始密码子(如CTG或GTG)产生的AAV基因疗法载体的效价没有改进,这样的载体至少是相似的(图4)。理解的是,关于核酸序列,可以将其列为DNA序列(列为A、T、C和G)或RNA序列(列为A、U、C和G)。理解的是,表达构建体通常可以指DNA序列,而表达的核苷酸序列是指RNA序列,即从表达构建体转录或表达的mRNA。
本发明的构建体在VP1起始密码子的5’编码额外的框外起始密码子,这显然导致在VP1起始密码子处翻译起始的减少,这允许进一步翻译足量的VP2和VP3两者。不受理论的限制,这样的框外5’起始密码子导致干扰在VP1 AUG起始密码子的转录起始,并允许与发生在野生型AAV中相似的假渗漏核糖体扫描。不受理论的限制,从这些选择性起始密码子合成短肽(例如,VP2编码序列之前的框外阅读框的翻译终止)可以允许核糖体继续扫描VP1 AUG起始密码子下游或使其重新起始,这允许从相同转录本翻译VP2和VP3。
与现有技术产生的AAV衣壳相比,这样的构建体提供至少相似的(如果没有改进)在昆虫细胞中具有良好效价的AAV衣壳的产生。有利的是,当用于生成针对昆虫细胞的表达构建体时,这样的构建体可以允许如在野生型病毒中发现的未经修饰的VP1、VP2和VP3核苷酸序列。根据本发明的构建体可以允许VP1、VP2和VP3衣壳蛋白的氨基酸序列与野生型病毒中发现的衣壳蛋白大体上相同或与其相同。因此,该表达策略一般适用于任何细小病毒或AAV载体构建体,并且可以不需要进一步裁剪5’序列或AAV衣壳开放阅读框的序列。
因此,在本发明的第一方面,提供包含表达控制序列的核酸构建体,所述表达控制序列用于在昆虫细胞中表达包括开放阅读框的核苷酸序列,其中所述开放阅读框序列编码:
i)腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3;和
ii)用于VP1的ATG翻译起始密码子;
所述核苷酸序列在开放阅读框上游包括选择性起始密码子,所述选择性起始密码子是在开放阅读框的框外。
理解的是,根据本发明的核苷酸序列的表达与表达的mRNA相关。因此,选择性起始密码子将包括在mRNA中,即其包括在编码衣壳蛋白的开放阅读框5’的序列中,和其在核酸构建体的转录起始位点的3’。因此,所述选择性阅读框是包括在表达的mRNA中的VP1 AUG密码子的5’。理解的是,根据本发明的开放阅读框理解为单个开放阅读框,即编码衣壳蛋白VP1、VP2和VP3的序列是重叠的。换句话说,VP2和VP3蛋白由与VP1序列相同的序列编码。这样的开放阅读框可以是连续的开放阅读框,但也可以是不连续的,例如含有内含子序列。优选地,VP1、VP2和VP3翻译自的所述开放阅读框是连续的单个开放阅读框,其中在昆虫中没有衣壳蛋白可以翻译自的其他转录本被转录(例如,当一个转录本编码VP1,且另一个转录本编码VP2时,且仍然有另一个转录本编码VP3)。
优选地,所述框外起始密码子选自由以下组成的组:CUG、ACG、AUG、UUG、CUC和CUU。更优选地,选择性起始密码子选自AUG或CUG。最优选地,所述选择性起始密码子为AUG。正如实施例部分所示,具有最普遍的AUG起始密码子的序列主要含有框外起始密码子。上游框外起始密码子主要是相对强的密码子,如UUG、CUG、GUG、AUG和ACG。也观察到弱起始密码子,如CUC和CUU。最普遍和最优选的是AUG作为框外选择性起始密码子。
选择性起始密码子可以是选择性开放阅读框的起始。因此,选择性起始密码子被理解为包括这样的密码子,核糖体可以从该密码子起始翻译。有时当起始密码子例如接近mRNA的5’戴帽端时,这样的序列可能不被允许作为起始密码子起作用。理解的是,由于遗传密码,其中三元体(triplet)编码氨基酸,核酸序列可以根据在何处翻译起始和终止翻译成三种不同的氨基酸序列。框外选择性起始密码子在VP1 AUG起始密码子的上游,且优选地,选择性起始密码子后的遗传密码是这样的,其使得发生翻译终止,如此使得核糖体不会启动或被阻碍启动从VP1 AUG起始密码子的翻译。同样,不受理论的限制,VP1 AUG起始密码子上游的框外选择性起始密码子允许从mRNA的翻译的起始。优选地,选择性开放阅读框终止于VP1 AUG起始密码子的下游。例如,当VP1 AUG起始密码子将以A紧随其后时,AUGA序列中的UGA三元体编码终止密码子。因此,优选地,从选择性起始密码子上游开始的选择性开放阅读框涵盖VP1 AUG起始密码子。
因此,在根据本发明的又一实施方案中,提供了核酸构建体,其用于在昆虫细胞中表达包括开放阅读框的核苷酸序列,其中所述开放阅读框序列编码腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3和对于VP1的AUG翻译起始密码子,其中所述核苷酸序列包括以选择性起始密码子起始的选择性开放阅读框,其中所述选择性开放阅读框涵盖所述对于VP1的AUG翻译起始密码子。
选择性开放阅读框优选在VP1 AUG起始密码子5’的最多100、90、80、70、60、50、40、30、20或10个核苷酸处起始并在其后终止。选择性开放阅读框从VP1 AUG起始密码子5’处起始并在其后最多500、400、300、200、150、100、90、80、70、60、50、40、30、20或10个核苷酸终止。选择性开放阅读框可以在VP1 AUG起始密码子5’的最多50个核苷酸处起始并在其后最多500个核苷酸处终止。选择性开放阅读框可以在VP1 AUG起始密码子5’的最多40个核苷酸处起始并在其后最多200个核苷酸处终止。选择性开放阅读框也可以在VP1 AUG起始密码子5’的最多30个核苷酸处起始并在其后最多50个核苷酸处终止。选择性开放阅读框可以在VP1 AUG起始密码子的最多10个核苷酸处起始并在其后最多20个核苷酸处终止。在一个选择性实施方案中,所述选择性开放阅读框在VP3的起始密码子之前终止,优选在VP2的起始密码子之前终止。例如,实施例中所示的这样的选择性开放阅读框,在4个核苷酸上游处起始并在其后14个核苷酸处终止,或在8个核苷酸上游处起始并在其后4个或更多个核苷酸处终止。
优选地,这样的选择性开放阅读框可以包括在编码腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3的DNA序列中,所述DNA序列包括在VP1 ATG起始密码子序列上游的序列,所述序列由SEQ ID NO:70的DNA序列的第105-155位核苷酸编码。在ATG起始密码子上游的所述序列转录成RNA。这样的选择性开放阅读框也可以包括在编码腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3的DNA序列中,所述DNA序列包括在VP1 ATG起始密码子序列上游的序列,所述序列由SEQ ID NO:70的DNA序列的第1-155位核苷酸编码。所述上游序列编码在ATG VP1起始密码子上游的多角体蛋白启动子和5’前导序列(105-155)。
因此,优选地,如上所述的本发明的选择性开放阅读框在昆虫细胞中被翻译成肽。在一个实施方案中,所述肽具有至少4个氨基酸、至少5个氨基酸、至少6个氨基酸的长度。在一个实施方案中,翻译的氨基酸序列包括SEQ ID NO:72或SEQ ID NO:73或由SEQ ID NO:72或SEQ ID NO:73组成。在另一个实施方案中,所述肽具有最多200、150、100、50、40、30、20或10个氨基酸的长度。在又一个实施方案中,根据本发明的编码所述选择性开放阅读框的核酸构建体被翻译成长度范围为2至200个氨基酸、2至100个氨基酸、2至50个氨基酸或优选为2至10个氨基酸的肽。因此,如本文所述根据本发明的核酸构建体编码肽,所述核酸构建体包括在所述选择性起始密码子之后的所述选择性开放阅读框。肽的长度可以取决于VP1起始密码子后的序列,即编码VP1的序列,其可以例如衍生自衍生自自然界的AAV序列,或衍生自合成的或人工的AAV衣壳序列(例如密码子优化的或具有改进的性质的突变变体)。因此,长度取决于终止密码子(TGA、TAA、TAG)在框外阅读框中何处发生,所述框外阅读框从VP1ATG起始密码子上游的选择性起始密码子起始。起始密码子下游的序列可以被突变以引入终止密码子,所述终止密码子在框外上游起始密码子的框内。这样,肽的长度可以有目的地选择。因此,可以引入框外终止密码子,所述框外终止密码子对于VP1编码序列不引入氨基酸序列中的改变,换句话说,是VP1阅读框中的沉默突变。所引入的阅读框外终止密码子可以由阅读框中三个连续核酸中的一个、两个或三个点突变来引入。也可以在VP1编码序列内插入三元体序列(即TGA、TAA或TAG),这可以导致对于编码序列的长度插入一个氨基酸,并可以导致VP1编码序列的额外的氨基酸变化(即VP1编码序列的一个三元体通过插入框外终止密码子变为两个三元体)。
在另一个实施方案中,提供了包括表达控制序列的核酸构建体,所述表达控制序列用于在昆虫细胞中表达包括开放阅读框的核苷酸序列,其中所述开放阅读框序列编码:
i)腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3;和
ii)用于VP1的AUG翻译起始密码子;
其中所述核苷酸序列直接包括在VP1 AUG上游的第1-8位核苷酸处的核苷酸序列,所述核苷酸序列选自由SEQ ID NO.32-62组成的组。理解的是,SEQ ID NO.32-62是指RNA序列,因此核酸构建体将具有编码所述RNA序列的相应DNA序列,例如SEQ ID NO 1-31所列出。优选地,所述核苷酸序列直接包括在VP1 AUG下游的G核苷酸。更优选地,根据本发明的核酸构建体包括选自由编码VP1起始密码子的SEQ ID NO.1-31组成的组的序列,其中所述VP1起始密码子对应于所述SEQ ID NO 1-31的第9-11位。最优选的是衍生自SEQ ID NO.1和SEQID NO.32的序列,即优选其第1-8位核苷酸,其具有优选与VP1 ATG直接相邻的G,更优选编码SEQ ID NO.1的整个序列。
在又一个实施方案中,提供了根据本发明的核酸构建体,其中VP1的开放阅读框的第二密码子编码选自由以下组成的组的氨基酸残基:丙氨酸、甘氨酸、缬氨酸、天冬氨酸和谷氨酸。该第二氨基酸残基可以衍生自起始密码子和衍生自例如野生型AAV VP1序列的第二密码子之间的插入的密码子,或VP1核苷酸序列的第二密码子可以是突变的密码子(例如,通过将紧随VP1 ATG密码子之后的核酸突变为G)。最优选地,VP1的第二密码子编码缬氨酸。更优选地,第二密码子选自由GUA、GUC、GUU、GUG组成的组,优选地,第二密码子是GUA。开放阅读框任选地包括进一步编码在第二密码子之后的额外的氨基酸残基的一个或多个密码子,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个额外的氨基酸的密码子,但优选小于60、50、40、35、30、25、20、19、18、17、16、15或14个额外的氨基酸残基的密码子。正如将容易理解的,编码额外的氨基酸残基的密码子在衣壳蛋白的开放阅读框的框内。
因此,在一个实施方案中,提供了包括在VP1的第2位具有缬氨酸的VP1衣壳蛋白的AAV载体,其通过修饰例如野生型VP1衣壳蛋白序列的第2位或通过在野生型VP1衣壳蛋白序列的第1位和2位之间插入缬氨酸密码子,或者因为在自然界中发现的或被选择的VP1衣壳蛋白已经在第2位包括缬氨酸。这样的衣壳,优选在昆虫细胞中产生的,可以如本文所述在医学治疗中特别有用。
在一个实施方案中,如果将开放阅读框与野生型衣壳蛋白比较,编码衣壳蛋白的开放阅读框进一步包括编码一个或多个氨基酸残基的密码子,所述编码一个或多个氨基酸残基的密码子插入在VP1的ATG翻译起始密码子与编码在相应的野生型衣壳蛋白中紧邻起始密码子的3'端的氨基酸残基的密码子之间。例如,与相应的野生型衣壳蛋白相比,开放阅读框包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个额外的氨基酸残基的密码子。优选地,与相应的野生型衣壳蛋白相比,开放阅读框包括小于60、50、40、35、30、25、20、19、18、17、16、15或14个额外的氨基酸残基的密码子。正如将容易理解的,编码额外的氨基酸残基的密码子在衣壳蛋白的开放阅读框的框内。与相应的野生型衣壳蛋白相比,这些编码额外的氨基酸残基的密码子中,第一密码子,即紧邻的次优翻译起始密码子的3’端的密码子,编码了选自由以下组成的组的氨基酸残基:丙氨酸、甘氨酸、缬氨酸、天冬氨酸和谷氨酸。因此,如果翻译起始密码子和编码对应于野生型序列的第2残基的氨基酸残基的密码子之间仅有一个额外的密码子,该额外的密码子编码选自由以下组成的组的氨基酸残基:丙氨酸、甘氨酸、缬氨酸、天冬氨酸和谷氨酸。如果翻译起始密码子和编码野生型序列的第2氨基酸残基的密码子之间有一个以上额外的密码子,然后紧随在翻译起始密码子之后的密码子编码选自由以下组成的组的氨基酸残基:丙氨酸、甘氨酸、缬氨酸、天冬氨酸和谷氨酸。优选地,紧随在次优翻译起始密码子后面(即在其3’端)的额外的氨基酸残基是缬氨酸。换句话说,在本发明的优选实施方案中,紧随在次优翻译起始密码子之后的密码子编码缬氨酸。
步骤a)中编码AAV衣壳蛋白的序列可以是自然界中发现的衣壳序列,如AAV1-AAV13,其核苷酸和氨基酸序列在Lubelski等,WO2015137802中作为SEQ ID NO:13-38列出,在此通过引用整体并入本文。因此,根据本发明的核酸构建体可以包括由Lubelski等人,WO2015137802中公开的AAV衣壳蛋白的完整开放阅读框。可选地,序列可以是人造的,例如,序列可以是杂合形式的,或可以是密码子优化的,例如通过AcmNPv或Spodopterafrugiperda的密码子使用来密码子优化的。例如,衣壳序列可以由AAV1的VP2和VP3序列组成,而VP1序列的其余部分是AAV5的。优选的衣壳蛋白是AAV5,优选如在SEQ ID NO:22或AAV8中提供,优选如在Lubelski等WO2015137802中列出的SEQ ID NO:28中提供。因此,在一个优选实施方案中,AAV衣壳蛋白是根据本发明已经修饰的AAV血清型5或AAV血清型8的衣壳蛋白。更优选地,AAV衣壳蛋白是根据本发明已经修饰的AAV血清型5的衣壳蛋白。理解的是,衣壳蛋白的精确分子量以及翻译起始密码子的精确位置可以在不同细小病毒之间不同。然而,本领域技术人员将知道如何从AAV-5以外的其他细小病毒中鉴定核苷酸序列中的相应位置。可选地,编码AAV衣壳蛋白的序列是人造序列,例如定向进化实验的结果。这可以包括通过DNA改组、易错PCR、生物信息学合理设计、位点饱和诱变来生成衣壳文库。得到的衣壳是基于现有的血清型,但含有多种改进这样的衣壳的特征的氨基酸或核苷酸变化。得到的衣壳可以是现有血清型的多种部分的组合,“改组的衣壳”或包含完全新的变化,即一个或多个氨基酸或核苷酸的添加、缺失或取代,被安排在组中或遍布在基因或蛋白的整个长度上。参见例如Schaffer and Maheshri;Proceedings of the 26th AnnualInternational Conference of the IEEE EMBS San Francisco,CA,USA;September 1-5,2004,pages 3520-3523;Asuri et al.(2012)Molecular Therapy 20(2):329-3389;Lisowski et al.(2014)Nature 506(7488):382-386,通过引用并入本文。
在本发明的优选实施方案中,编码VP3衣壳蛋白的开放阅读框以非规范(non-canonical)翻译起始密码子起始,所述非规范翻译起始密码子选自由以下组成的组:ACG、ATT、ATA、AGA、AGG、AAA、CTG、CTT、CTC、CTA、CGA、CGC、TTG、TAG和GTG。优选地,非规范翻译起始密码子选自由以下组成的组:GTG、CTG、ACG、TTG,更优选地,非规范翻译起始密码子是CTG。
本发明的用于表达AAV衣壳蛋白的核苷酸序列优选进一步包括编码AAV VP1衣壳蛋白的核苷酸序列的至少一个修饰,所述至少一个修饰选自VP1开放阅读框的第12位核苷酸的G、第21位核苷酸的A和第24位核苷酸的C,其中核苷酸位置对应于野生型核苷酸序列的核苷酸位置。“潜在的/可能的错误起始位点”或“潜在的/可能的错误翻译起始密码子”在本文理解为是指位于衣壳蛋白的编码序列中的框内ATG密码子。对于其他血清型的VP1编码序列内翻译的可能的错误起始位点的消除,以及昆虫细胞中可能识别的推定剪接位点的消除,将被本领域技术人员充分理解。例如,重组AAV5不需要第12位核苷酸的修饰,因为核苷酸T没有造成假的ATG密码子。通过应用如Sambrook和Russell(2001)在“MolecularCloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,New York“中所述的众所周知的基因工程技术,实现野生型AAV序列的多种修饰用于在昆虫细胞中适当表达。本领域技术人员已知VP编码区域的多种进一步修饰,所述修饰可以增加VP和病毒体的产量或具有其他期望的效果,如改变病毒体的趋向性或降低病毒体的抗原性。这些修饰在本发明的范围内。
优选地,编码AAV衣壳蛋白的本发明的核苷酸序列可操作地连接至用于在昆虫细胞中的表达的表达控制序列。因此,在第二方面,本发明涉及包括根据本发明的核酸分子的核酸构建体,其中编码腺相关病毒(AAV)衣壳蛋白的开放阅读框的核苷酸序列可操作地连接至用于在昆虫细胞中表达的表达控制序列。这些表达控制序列将至少包括在昆虫细胞中具有活性的启动子。本领域技术人员已知的用于在昆虫宿主细胞中表达外来基因的技术可以用于实施本发明。分子工程方法和多肽在昆虫细胞中表达的方法描述在例如Summersand Smith.1986.A Manual of Methods for Baculovirus Vectors and Insect CultureProcedures,Texas Agricultural Experimental Station Bull.No.7555,CollegeStation,Tex.;Luckow.1991.In Prokop et al.,Cloning and Expression ofHeterologous Genes in Insect Cells with Baculovirus Vectors'Recombinant DNATechnology and Applications,97-152;King,L.A.and R.D.Possee,1992,Thebaculovirus expression system,Chapman and Hall,United Kingdom;O'Reilly,D.R.,L.K.Miller,V.A.Luckow,1992,Baculovirus Expression Vectors:A LaboratoryManual,New York;W.H.Freeman and Richardson,C.D.,1995,Baculovirus ExpressionProtocols,Methods in Molecular Biology,volume 39;US4,745,051;US2003148506;和WO 03/074714。用于转录编码AAV衣壳蛋白的本发明的核苷酸序列的特别合适的启动子是,例如,多面体启动子(polH),这类polH启动子提供在SEQ ID NO:70中(或如SEQ ID NO:53所列出,和其缩短版本SEQ ID NO:54,在Lubelski等的WO2015137802中)。然而,现有技术中已知在昆虫细胞中具有活性的其他启动子以及根据本发明可以选择的其他启动子,如多角体蛋白(polH)启动子、p10启动子、p35启动子、4xHsp27 EcRE+minimal Hsp70启动子、deltaE1启动子、E1启动子或IE-1启动子以及上述参考文献中描述的其他启动子。
优选地,用于在昆虫细胞中表达AAV衣壳蛋白的核酸构建体是昆虫细胞相容性载体。“昆虫细胞相容性载体”或“载体”理解为能够对昆虫或昆虫细胞进行产生性转化或转染的核酸分子。示范性生物载体包括质粒、线性核酸分子和重组病毒。可以采用任何载体,只要其是昆虫细胞相容性的。载体可以整合到昆虫细胞基因组中,但载体在昆虫细胞中的存在不需要是永久性的,并且也包括瞬时游离型载体。载体可以通过任何已知手段引入,例如通过化学处理细胞、电穿孔或感染。在一个优选实施方案中,载体是杆状病毒、病毒载体或质粒。在一个更优选的实施方案中,载体是杆状病毒,即构建体是杆状病毒载体。以上引用的关于昆虫细胞的分子工程参考文献中描述了杆状病毒载体及其使用的方法。
在第三方面,本发明涉及包括上述发明的核酸构建体的昆虫细胞。允许AAV的复制以及可在培养物中维持的任何昆虫细胞可按照本发明使用。例如,所用细胞系可以来自草地贪夜蛾(Spodoptera frugiperda)、果蝇细胞系或蚊子细胞系,例如衍生自白纹伊蚊(Aedes albopictus)的细胞系。优选的昆虫细胞或细胞系是来自对杆状病毒感染敏感的昆虫物种的细胞,其包括例如来自Invitrogen的expresSF+
Figure BDA0002404147760000141
、Drosophila Schneider 2(S2)细胞、Se301、SeIZD2109、SeUCR1、Sf9、Sf900+、Sf21、BTI-TN-5B1-4、MG-1、Tn368、HzAm1、Ha2302、Hz2E5和High Five。
根据本发明的优选的昆虫细胞进一步包括:(a)包括至少一个AAV反向末端重复(ITR)核苷酸序列的第二核苷酸序列;(b)包括可操作地连接至用于在昆虫细胞中表达的表达控制序列的Rep52或Rep40编码序列的第三核苷酸序列;和(c)包括可操作地连接至用于在昆虫细胞中表达的表达控制序列的Rep78或Rep68编码序列的第四核苷酸序列。
在本发明的上下文中,“至少一个AAV ITR核苷酸序列”被理解为指回文序列,其包括大部分互补的、对称排列的序列,也称为“A”、“B”和“C”区。ITR作用为复制原点,在复制中具有“顺式”角色的位点,即是对于反式作用复制蛋白(例如,Rep78或Rep68)的识别位点,其识别回文和回文内部的特异性序列。ITR序列的对称性的一个例外是ITR的“D”区。它是独特的(在一个ITR内没有互补)。单链DNA的切口发生在A区和D区的结合处。其是新的DNA合成起始的区域。D区通常位于回文的一侧,且为核酸复制步骤提供方向性。在哺乳动物细胞中复制的AAV通常具有两个ITR序列。然而,可能对ITR工程化,使得结合位点在A区的两条链上,并且D区对称地在回文的每一侧都有一个。在双链环状DNA模板(例如质粒)上,Rep78辅助的或Rep68辅助的核酸复制然后在双向进行,且单个ITR足以用于环状载体的AAV复制。因此,一个ITR核苷酸序列可以用于本发明的上下文。然而,优选地使用两个或另一偶数的规律ITR。最优选地,使用两个ITR序列。鉴于病毒载体的安全性,希望可以构建这样的病毒载体,其在初始引入细胞中后不能进一步增殖。可以如US2003148506中所述通过使用具有嵌合ITR的rAAV来提供这样的用于限制在受体中不期望的载体增殖的安全机制。在一个优选实施方案中,编码细小病毒VP1、VP2和VP3衣壳蛋白的核苷酸序列包括至少一个编码免疫逃逸重复的序列的框内插入,正如WO2009/154452所述。这导致所谓自身互补或单体双链体细小病毒的病毒体的形成。在一个优选实施方案中,编码细小病毒VP1、VP2和VP3衣壳蛋白的序列包括单体双链体或自身互补基因组。为了制备单体双链体AAV载体,AAV Rep蛋白和AAV衣壳蛋白在根据本发明的昆虫细胞中并且在包括至少一个AAV ITR的载体基因组存在下表达,其中相对于Rep78和/或Rep68蛋白表达,Rep52和/或Rep40蛋白表达是增加的。单体双链AAV载体,也可以通过在昆虫细胞中在侧翼为至少一个AAV ITR的载体基因组构建体存在下表达AAV Rep蛋白和AAVCap蛋白来制备,其中相对于Rep52和/或Rep40的解旋酶/衣壳化活性,Rep78和/或Rep60的切口活性是降低的,正如例如WO2011/122950中所述。
本发明中不限制所用载体或核酸构建体的数量。例如,可以采用一个、两个、三个、四个、五个、六个或多个载体,以在根据本发明的昆虫细胞中产生AAV。如果采用六个载体,一个载体编码AAV VP1,另一个载体编码AAV VP2,又一个载体编码AAV VP3,仍然再有另一个载体编码Rep52或Rep40,而Rep78或Rep68由另一个载体编码,以及最后的载体包括至少一个AAV ITR。可以采用额外的载体来表达例如Rep52和Rep40,以及Rep78和Rep68。如果使用少于六个载体,载体可以包括至少一个AAV ITR和VP1、VP2、VP3、Rep52/Rep40和Rep78/Rep68编码序列的多种组合。优选地,使用两个载体或三个载体,其中更优选的是如上所述的两个载体。如果使用两个载体,优选地,昆虫细胞包括:(a)用于表达如上所定义的AAV衣壳蛋白的第一核酸构建体,该构建体进一步包括如上(b)和(c)中所定义的第三和第四核苷酸序列,所述第三核苷酸序列包括可操作地连接至用于在昆虫细胞中表达的至少一个表达控制序列的Rep52或Rep40编码序列,和所述第四核苷酸序列包括可操作地连接至用于在昆虫细胞中表达的至少一个表达控制序列的Rep78或Rep68编码序列;和(b)包括如上(a)中所定义的第二核苷酸序列的第二核酸构建体,其包括至少一个AAV ITR核苷酸序列。如果使用三个载体,优选地,使用对于两个载体所使用的相同的配置,除了使用分开的载体用于表达衣壳蛋白和用于表达Rep52、Rep40 Rep78和Rep68蛋白。每个载体上的序列可以是相对于彼此的任何顺序。例如,如果一个载体包括ITR和包括编码VP衣壳蛋白的核苷酸序列的ORF,VPORF可以位于载体上使得ITR序列之间的DNA复制时,VP ORF是复制的或不复制的。又例如,Rep编码序列和/或包括编码VP衣壳蛋白的核苷酸序列的ORF可以以任何顺序在载体上。理解的是,第二、第三和进一步的核酸构建体优选是昆虫细胞相容性载体,优选是如上所述的杆状病毒载体。可选地,在本发明的昆虫细胞中,第一核苷酸序列、第二核苷酸序列、第三核苷酸序列和第四核苷酸序列和任选的进一步的核苷酸序列的一个或多个可以稳定地整合到昆虫细胞的基因组中。本领域普通技术人员知道如何将核苷酸序列稳定地引入昆虫基因组中,以及如何鉴定在基因组中具有这样的核苷酸序列的细胞。通过例如使用包括与昆虫基因组的区域高度同源的核苷酸序列的载体,可以有助于并入到基因组中。使用特异性序列,如转座子,是另一种将核苷酸序列引入基因组中的方式。
因此,在一个优选实施方案中,根据本发明的昆虫细胞包括:(a)根据本发明的第一核酸构建体,其中所述第一核酸构建体进一步包括如上所定义的第三和第四核苷酸序列;和(b)包括如上所定义的第二核苷酸序列的第二核酸构建体,其中所述第二核酸构建体优选是昆虫细胞相容性载体,更优选是杆状病毒载体。
在本发明的一个优选实施方案中,存在于本发明的昆虫细胞中的第二核苷酸序列,即包括至少一个AAV ITR的序列,进一步包括至少一个编码感兴趣的基因产物(优选用于哺乳动物细胞中的表达)的核苷酸序列,其中优选地所述至少一个编码感兴趣的基因产物的核苷酸序列被并入到昆虫细胞中产生的AAV的基因组中。优选地,至少一个编码感兴趣的基因产物的核苷酸序列是用于在哺乳动物细胞中表达的序列。优选地,所述第二核苷酸序列包括两个AAV ITR核苷酸序列,并且其中所述至少一个编码感兴趣的基因产物的核苷酸序列位于两个AAV ITR核苷酸序列之间。优选地,如果编码感兴趣的基因产物(用于哺乳动物细胞中的表达)的核苷酸序列位于两个规律的ITR之间,或者位于用两个D区工程化的ITR的一侧,所述编码感兴趣的基因产物(用于哺乳动物细胞中的表达)的核苷酸序列将并入到昆虫细胞中产生的AAV基因组中。因此,在一个优选实施方案中,本发明提供根据本发明的昆虫细胞,其中所述第二核苷酸序列包括两个AAV ITR核苷酸序列,并且其中所述至少一个编码感兴趣的基因产物的核苷酸序列位于两个AAV ITR核苷酸序列之间。
通常,感兴趣的基因产物,包括ITR,长度为5000个核苷酸(nt)或更少。在另一个实施方案中,使用本发明所述的AAV载体可以在体外或体内表达超大DNA,即长度超过5000nt。超大DNA在这里被理解为超过最大AAV包装限制为5kbp的DNA。因此,能够产生通常由比5.0kb更大的基因组编码的重组蛋白的AAV载体的生成也是可行的。例如,本发明者已经在昆虫细胞中生成含有部分、单向包装的hFVIII片段的rAAV5载体。涵盖至少5.6kb的载体基因组的总大小,包装成含FVIII片段的AAV5颗粒的两个群体。这些变体AAV5-FVIII载体显示出驱动活性FVIII的表达和分泌。这在体外实验中被证实,其中包含编码因子VIII的感兴趣的基因产物的AAV载体在感染Huh7细胞后导致活性FVIII蛋白的产生。同样,小鼠中尾静脉递送rAAV.FVIII导致产生活性FVIII蛋白。衣壳化产物的分子分析明确表明,5.6kbp的FVIII表达盒没有整体衣壳化在AAV颗粒中。不希望受到任何理论的束缚,我们假设衣壳化的分子的+和–DNA链显示5’端的缺少。这与先前报告的按照“头部完全原则(head-fullprincipia)”操作的限度为4.7-4,9kbp的单向(从3'端起始)包装机制一致,(参见例如Wuet al.[2010]Molecular Therapy 18(1):80-86;Dong et al.[2010]Molecular Therapy18(1):87-92;Kapranov et al.[2012]Human Gene Therapy 23:46-55;并且特别是Lai etal.[2010]Molecular Therapy18(1):75-79。虽然整个5.6kb载体基因组的只有大约5kb被衣壳化,所述载体是有效价的,并引起活性FVIII的表达。我们已经显示,基于+和–DNA链的部分互补随后第二条链的合成,用于产生FVIII的正确模板在靶细胞中组装。
因此,本文如上所定义的第二核苷酸序列可以包括编码至少一个用于在哺乳动物细胞中表达的“感兴趣的基因产物”的核苷酸序列,其位置使其将被并入到在昆虫细胞中复制的AAV基因组中。只要构建体保持在AAV病毒体的包装容量内,任何核苷酸序列可以被并入用于之后在用根据本发明产生的AAV转染的哺乳动物细胞中表达。核苷酸序列可以例如编码蛋白,其可以表达RNAi物质,即能够进行RNA干扰的RNA分子,如shRNA(短发夹RNA)或siRNA(短干扰RNA)。“siRNA”是指小的干扰RNA,其是在哺乳动物细胞中无毒性的短长度双链RNA(Elbashir et al.,2001,Nature 411:494-98;Caplen et al.,2001,Proc.Natl.Acad.Sci.USA 98:9742-47)。在一个优选实施方案中,第二核苷酸序列可以包括两个核苷酸序列并且每个编码一个用于在哺乳动物细胞中表达的感兴趣的基因产物。将编码感兴趣的产物的两个核苷酸序列的每个位于使其并入到在昆虫细胞中复制的rAAV基因组中。
用于哺乳动物细胞中表达的感兴趣的产物可以是治疗性基因产物。治疗性基因产物可以是多肽、或RNA分子(siRNA)或其他基因产物,当在靶细胞中表达时,提供期望的治疗效果,例如消除不期望的活性,例如消除感染的细胞,或遗传缺陷的互补,例如,引起酶活性中的缺陷。治疗性多肽基因产品的示例包括CFTR、因子IX、脂蛋白脂酶(LPL,优选LPLS447X;见WO 01/00220)、载脂蛋白A1、尿苷二磷酸葡萄糖醛酸转移酶(UGT)、色素性视网膜炎GTP酶调节性相互作用蛋白(RP-GRIP)、细胞因子或白细胞介素如IL-10、肌营养不良蛋白、PBGD、NaGLU、Treg167、Treg289、EPO、IGF、IFN、GDNF、FOXP3、因子VIII、VEGF、AGXT和胰岛素。可选地或额外地作为第二基因产物,本文如上所定义的第二核苷酸序列可以包括编码作为评估细胞转化和表达的标记蛋白的多肽的核苷酸序列。用于该目的的合适标记蛋白例如是荧光蛋白GFP、和可选择标记基因HSV胸苷激酶(用于在HAT培养基上选择)、细菌潮霉素B磷酸转移酶(用于在潮霉素B上选择)、Tn5氨基糖苷磷酸转移酶(用于在G418上选择)和二氢叶酸还原酶(DHFR)(用于在甲氨蝶呤上选择)、CD20、低亲和力神经生长因子基因。在文献Sambrook and Russel(2001)"Molecular Cloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York中提供获得这些标记基因的来源和使用其的方法。此外,本文如上所定义的第二个核苷酸序列可以包括编码这样的多肽的核苷酸序列,所述多肽可以作为允许用本发明的rAAV转导的细胞来治愈对象的故障安全机制,如果认为有必要。这样的核苷酸序列,通常称为自杀基因,编码能够将前体药物转变为能够杀死其中表达该蛋白的转基因细胞的毒性物质的蛋白。这样的自杀基因的合适示例包括例如大肠杆菌胞嘧啶脱氨酶基因,或来自单纯疱疹病毒(Herpes Simplex Virus)、巨细胞病毒(Cytomegalovirus)和水痘带状疱疹病毒(Varicella-Zoster virus)的胸苷激酶基因的一个,在这种情况下,更昔洛韦可以用作前体药物,以杀死对象中的转基因细胞(例如,参见Clair et al.,1987,Antimicrob.AgentsChemother.31:844-849)。
在另一个实施方案中,感兴趣的基因产物可以是AAV蛋白。特别地,Rep蛋白,如Rep78或Rep68,或其功能片段。编码Rep78和/或Rep68的核苷酸序列,如果存在于本发明的rAAV基因组上并且在用本发明的rAAV转导的哺乳动物细胞中表达,允许rAAV整合到转导的哺乳动物细胞的基因组中。Rep78和/或Rep68在rAAV转导的或感染的哺乳动物细胞中的表达可以通过允许由rAAV在细胞中引入的任何其他感兴趣的基因产物的长期或永久表达,为rAAV的某些用途提供优势。
在本发明的rAAV载体中,至少一个编码用于在哺乳动物细胞中表达的感兴趣的基因产物的核苷酸序列,优选地可操作地连接至至少一个哺乳动物细胞相容性表达控制序列(例如启动子)。许多这样的启动子在本领域是已知的(见Sambrook and Russel,2001,supra)。可以使用在许多细胞类型中广泛表达的组成型启动子,如CMV启动子。然而,更优选的将是诱导型、组织特异性、细胞类型特异性或细胞周期特异性的启动子。例如,对于肝脏特异性表达,启动子可以选自α1-抗胰蛋白酶启动子、甲状腺激素结合球蛋白启动子、白蛋白启动子、LPS(甲状腺素结合球蛋白)启动子、HCR-apocII杂合启动子、HCR-hAAT杂合启动子和载脂蛋白E启动子、LP1、HLP、最小TTR启动子、FVIII启动子、hyperon增强子、ealb-hAAT。其他示例包括用于肿瘤选择性表达,和特别是神经细胞肿瘤选择性表达的E2F启动子(Parr et al.,1997,Nat.Med.3:1145-9),或用在单核血细胞中的IL-2启动子(Hagenbaughet al.,1997,J Exp Med;185:2101-10)。
AAV能够感染许多哺乳动物细胞。参见例如Tratschin et al.,Mol.Cell Biol.,5(11):3251-3260(1985)和Grimm et al.,Hum.Gene Ther.,10(15):2445-2450(1999)。然而,人类滑膜成纤维细胞的AAV转导比在相似的鼠细胞中显著更有效率(Jenningsetal.,ArthritisRes,3:1(2001)),并且AAV的细胞嗜性(tropicity)在血清型间不同。参见例如Davidson et al.,Proc.Natl.Acad.Sci.USA,97(7):3428-3432(2000)(讨论AAV2、AAV4和AAV5在哺乳动物CNS细胞嗜性和转导效率方面的差异)。
正如所述,在本发明中可以用于在昆虫细胞中产生AAV的AAV序列可以衍生在任何AAV血清型的基因组。通常,AAV血清型在氨基酸和核酸水平具有显著同源性的基因组序列,提供相同的遗传功能组,产生基本在物理上和功能上等同的病毒体,并通过几乎相同的机制复制和组装。对于多种AAV血清型的基因组序列和基因组相似性的概述,参见例如GenBank Accession number U89790;GenBank Accession number J01901;GenBankAccession number AF043303;GenBank Accession number AF085716;Chlorini等(1997,J.Vir.71:6823-33);Srivastava等(1983,J.Vir.45:555-64);Chlorini等(1999,J.Vir.73:1309-1319);Rutledge等(1998,J.Vir.72:309-319);和Wu等(2000,J.Vir.74:8635-47)。人类或猿猴腺相关病毒(AAV)血清型是用于本发明上下文的AAV核苷酸序列的优选来源,更优选通常感染人类(例如,血清型1、2、3A、3B、4、5、6、7、8、9、10、11、12和13)或灵长类(例如,血清型1和4)的AAV血清型。
优选地,用于本发明上下文中的AAV ITR序列衍生自AAV1、AAV2、AAV5和/或AAV4。同样,优选地,Rep52、Rep40、Rep78和/或Rep68编码序列衍生自AAV1、AAV2和/或AAV4。用于本发明上下文中的编码VP1、VP2和VP3衣壳蛋白的序列可以取自任何已知的42种血清型,更优选地取自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9或新开发的AAV样颗粒,其是通过例如衣壳改组技术和AAV衣壳文库获得的。在一个优选实施方案中,编码VP1、VP2和VP3衣壳蛋白的序列来自AAV5或AAV8,更优选来自AAV5。
在大多数血清型中,AAV Rep和ITR序列是特别保守的。多种AAV血清型的Rep78蛋白例如有超过89%的相同性,以及AAV2、AAV3A、AAV3B和AAV6之间基因组水平的总核苷酸序列相同性在82%左右(Bantel-Schaal et al.,1999,J.Virol.,73(2):939-947)。此外,已知许多AAV血清型的Rep序列和ITR在哺乳动物细胞中产生AAV颗粒方面有效率地交叉补充(即功能上替代)来自其他血清型的相应序列。US2003148506报道AAV Rep和ITR序列在昆虫细胞中也有效率地交叉补充其他AAV Rep和ITR序列。
已知AAV VP蛋白决定AAV病毒体的细胞嗜性。VP蛋白编码序列在不同AAV血清型中的保守性显著低于Rep蛋白和基因。Rep和ITR序列交叉补充其他血清型的相应序列的能力,允许产生包括血清型(如AAV3)的衣壳蛋白和另一种AAV血清型(如AAV2)的Rep和/或ITR序列的假型AAV颗粒。这样的假型AAV颗粒是本发明的一部分。
正如所述,修饰的“AAV”序列也可以用于本发明的上下文,例如,用于在昆虫细胞中产生rAAV载体。这样的修饰序列例如包括与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9 ITR、Rep或VP具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%,或更多的核苷酸和/或氨基酸序列相同性的序列(例如,具有约75-99%核苷酸序列相同性的序列)可以用于替代野生型AAV ITR、Rep或VP序列。
尽管在许多方面与其他AAV血清型相似,AAV5与其他人类和猿猴AAV血清型的差异比其他已知的人类和猿猴血清型更大。鉴于此,AAV5的产生可以不同于昆虫细胞中其他血清型的产生。当采用本发明的方法产生rAAV5时,优选包括以下的一个或多个载体,在多于一个载体的情况下为共同包括:包括AAV5 ITR的核苷酸序列、包括AAV5 Rep52和/或Rep40编码序列的核苷酸序列,以及包括AAV5 Rep78和/或Rep68编码序列的核苷酸序列。这样的ITR和Rep序列可以如期望地被修饰,以在昆虫细胞中获得rAAV5或假型rAAV5载体的有效率的产生。例如,可以修饰Rep序列的起始密码子。
在一个优选实施方案中,第一核苷酸序列、第二核苷酸序列、第三核苷酸序列和任选的第四核苷酸序列稳定地整合在昆虫细胞的基因组中。
根据本发明的优选AAV是一种病毒体,该病毒体在其基因组中包括至少一个编码感兴趣的基因产物的核苷酸序列,其中所述至少一个核苷酸序列优选不是天然AAV核苷酸序列,并且其中所述AAV病毒体包括这样的VP1衣壳蛋白,所述VP1衣壳蛋白包括在氨基酸第1位的蛋氨酸和第2位的缬氨酸。甚至更优选的是可以从上述所定义的昆虫细胞中,在例如下文所定义的方法中,获得的AAV病毒体。
本发明的AAV病毒体的优点是其改进的感染性。不希望受到任何理论的束缚,似乎随着衣壳中VP1蛋白的量相对于衣壳中VP2和/或VP3的量的增加结合VP1第2位的缬氨酸,感染性增加。AAV病毒体的感染性在本文中理解为指包括在病毒体中的转基因的转导效率,这可以从转基因的表达率和从转基因表达的产物的量或活性推断得到。
优选地,本发明的AAV病毒体包括编码选自由以下组成的组的多肽基因产物的感兴趣的基因产物:CFTR、因子IX、脂蛋白脂酶(LPL,优选LPL S447X;见WO 01/00220)、载脂蛋白A1、尿苷二磷酸葡萄糖醛酸转移酶(UGT)、色素性视网膜炎GTP酶调节性相互作用蛋白(RP-GRIP)、细胞因子或白细胞介素如IL-10、肌营养不良蛋白、PBGD、NaGLU、Treg167、Treg289、EPO、IGF、IFN、GDNF、FOXP3、因子VIII、VEGF、AGXT和胰岛素。更优选地,感兴趣的基因产物编码因子IX或因子VIII蛋白。
另一方面,本发明因此涉及一种用于在昆虫细胞中产生AAV的方法。优选地,所述方法包括以下步骤:(a)在使得AAV产生的条件下培养上述本文所定义的昆虫细胞;和任选地,(b)回收所述AAV。培养中昆虫细胞的生长条件以及培养中昆虫细胞中异源产物的产生在本领域中是众所周知的,并在例如在上面引用的有关昆虫细胞分子工程化的参考文献中有描述。
优选地,所述方法进一步包括使用抗AAV抗体(优选固定化的抗体)亲和纯化AAV的步骤。抗AAV抗体优选是单克隆抗体。特别适合的抗体是单链骆驼科抗体或其片段,例如,可得自骆驼或美洲驼(参见例如Muyldermans,2001,Biotechnol.74:277-302)。用于亲和纯化AAV的抗体优选是特异性结合AAV衣壳蛋白上表位的抗体,其中所述表位优选是存在于超过一种AAV血清型的衣壳蛋白上的表位。例如,所述抗体可以基于与AAV2衣壳的特异性结合来产生或选择,但是同时也可以基于与AAV1、AAV3和AAV5衣壳的特异性结合。
在本发明的另一方面,提供了一种用于提供编码细小病毒衣壳蛋白的核酸构建体的方法,所述核酸构建体具有一种或多种改进的性质,该方法包括:
a)提供多个核酸构建体,每个构建体包括:
可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列,和在所述可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列的侧翼的至少一个细小病毒反向末端重复(ITR)序列;
b)将多个核酸构建体转移到能表达细小病毒Rep蛋白的昆虫细胞中;
c)将所述昆虫细胞置于允许表达细小病毒衣壳蛋白和细小病毒rep蛋白的条件下,使得所述核酸构建体可以被包装在细小病毒衣壳中以提供细小病毒病毒体;
d)从所述昆虫细胞和/或昆虫细胞上清液回收细小病毒病毒体;
e)使所述细小病毒病毒体与靶细胞接触,以允许感染所述靶细胞;
f)从所述靶细胞回收或鉴别所述核酸构建体。
如实施例部分和上文所述,该方法特别适用于首先选择就以下而言在昆虫细胞中具有高度功能性的核酸构建体:所述构建体能够产生大量含有载体基因组的衣壳,而且还能够生成含有构建体的衣壳,所述衣壳能够高度有效的将其DNA转移并随后表达到靶细胞中。
理解的是,对于多个核酸构建体,是指对于表达控制序列和/或编码衣壳蛋白的氨基酸序列的核酸序列和/或衣壳蛋白的氨基酸序列和/或ITR序列有变化的构建体。因此,可以考虑其中的任何变化。对于任何性质的改进,这些可以与参考序列相关,所述参考序列例如用于在昆虫细胞中产生AAV衣壳的现有技术的野生型序列或核酸构建体。可以考虑任何可以需要改进的性质,其与可以在多个核酸构建体中改变的序列相关。这样的性质可以包括但不限于例如改进的效价、改进的产量、改进的靶细胞选择性。
创造分子多样性或突变是本发明的方法中的第一步。通过在寻求改进的参考序列中引入随机点突变,例如通过易错(EP)PCR,多个编码突变序列的核酸(即突变核酸的文库)。正如所述,所述随机突变可以包括在非编码序列和/或编码序列中。可以引入的突变的频率可以通过改变模板和PCR循环的量,以及所用诱变引物来改变。理解的是,当参考设为多个时,这涉及100个或更多,优选1000个或更多,10000个或更多,100000个或更多,或10000000个或更多不同的序列,这取决于在多个核酸构建体中待引入的变异。理解的是,术语“文库”或“多个”在本文可以就它们指大量不同的序列而言具有相同的含义,所述大量不同的序列可以例如是相关的,即具有大体的序列相同性。文库的每个成员,即每个不同的序列,可以在文库中代表超过1次。例如,当文库含有1000个独特的序列时,该文库可以总共含有1000000个序列。这意味着每个文库成员平均在文库中存在1000份拷贝。
诱变可以以本领域技术人员已知的任何方式进行。例如,这样的诱变可以是随机的,尽管这样的诱变可以是定向的(即,例如,靶向核酸构建体内的特异性序列/结构)。可以进行随机诱变以取得低突变率,例如,以提供编码具有1、2、3、4、5、6、7、8、9或10个或更多个氨基酸变化的Cap蛋白的序列(与在其上进行诱变的起始序列相比)。
可以用于进行随机诱变的技术包括大肠杆菌XL1red、UV辐照、化学方法(例如脱氨,烷化或碱基类似物诱变剂)或PCR方法(例如DNA改组,定点随机诱变或易错PCR)。
易错PCR是对标准PCR方案的修改,旨在改变和增强聚合酶的自然错误率。可以使用Taq聚合酶,因为其天然的高错误率,其错误偏向于AT至GC的变化。然而,也可能使用替代形式的聚合酶,其偏向允许突变类型的变化增加(即更多的GC至AT变化)。
与基础的PCR反应相比,易错PCR反应通常含有较高浓度的MgCl2,以稳定非互补对。也可以添加MgCl2以增加错误率。调整突变率的其他方式包括改变反应中核苷酸的比例,或包括核苷酸类似物,如8-oxo-GTP或dITP。也可以通过增加/减少循环次数来改变有效倍增数或通过改变起始模板浓度来调整突变率。
在任何情况下,无论以何种方式引入突变,随后将得到的多个序列克隆到核酸构建体中以获得多个核酸构建体。所述核酸构建体包含一个或多个细小病毒或AAV ITR,其在可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列的侧翼(通常侧翼为两个AAV ITR)。在启动子(如CMV和杆状病毒p10启动子)的控制下,所述核酸构建体还可以包含,例如在ITR之间,任选的报告基因表达盒(如绿色荧光蛋白(GFP)表达盒)。随后可以将多个构建体引入目的载体中,例如杆状病毒载体,以获得杆状病毒的文库。这可以通过使用常见的生物分子技术(如同源重组)和也可以通过使用商业上可得到的系统(如Bac-to-Bac)来容易地实现。文库中的每个杆状病毒含有单个核酸构建体,其中所述单个核酸构建体具有预期的序列变异。当生成杆状病毒文库时,优选地保持文库的复杂度(即与核酸文库相比,杆状病毒文库中独特序列的量保持大致相同)。因此,优选地,将上述方法的步骤a)中所定义的核酸构建体包含在杆状病毒载体中。
随后,将多个构建体转移到昆虫细胞中。优选地,使用多个杆状病毒。这是因为用杆状病毒,感染复数可以很好地被控制。因此,当使用杆状病毒文库时,感染复数优选保持在1以下,优选在0.5以下,更优选在0.1以下。例如,moi为0.5时,大多数昆虫细胞将具有单个杆状病毒/细胞,然而,这些细胞中的明显一部分将具有有两个来自文库的杆状病毒/细胞,并且大多数细胞不会被感染。每个细胞的杆状病毒数量由泊松分布支配。降低moi甚至进一步减少具有超过1个杆状病毒的细胞数量。然而,根据本发明,可以不必需知道感染复数。例如,如实施例部分所示,也可以使用多种杆状病毒的系列稀释,并可以选择提供最佳AAV载体文库产生(例如,最高滴度和/或最小交叉包装)的稀释物。
向其提供多种构建体的所述昆虫细胞也能够表达细小病毒Rep蛋白。例如,含有Rep表达构建体的额外的杆状病毒可以用于将Rep表达构建体转移到细胞中。优选地,使用相对较高的感染复数,如此使得Rep不是限制因素,即当一个细胞被提供多个构建体的一个时,该细胞也将具有Rep表达构建体的机会很大。可选地,也可以使用含有Rep表达构建体的稳定细胞系,其可以组成性表达Rep蛋白,或者当多个构建体的一个转移到细胞时可以诱导型表达Rep。在任何情况下,将所述能够表达细小病毒Rep蛋白并且被提供根据本发明的多个构建体中的一个(或多个)的昆虫细胞随后置于允许细小病毒衣壳蛋白和细小病毒Rep蛋白的表达的条件,使得核酸构建体可以被包装到细小病毒衣壳中以提供细小病毒病毒体。通常这涉及培养细胞一段时间,当例如使用杆状病毒系统时。优选地,当使用杆状病毒载体系统时,选择不允许杆状病毒传播到这样的程度的条件,所述程度使许多(如果不是大多数)细胞将含有构建体文库的几个成员。优选地,选择这样的条件使得大多数含有来自文库的构建体的细胞将包含单个构建体,并将仅产生由所述构建体编码的细小病毒衣壳,其也含有所述单个构建体。当将选择这样的条件时,在该条件中超过一个构建体将包含在昆虫细胞中,其中构建体的一个产生有感染性或有效价的AAV,效价很低或没有感染性的构建体将被交叉包装,这使得难以确定所有包装的构建体的哪个构建体能够产生有效价的AAV。换句话说,具有低的交叉包装允许更严格和更有效的选择。
接下来,从昆虫细胞和/或昆虫细胞上清液回收细小病毒病毒体。许多用于回收细小病毒病毒体的方法是可获得的,并且包括如实施例部分所述的方法。此外,也可以使用传统方法,如密度(阶梯)梯度离心(碘克沙醇,CsCl)和/或切向流过滤。当例如在衣壳序列中引入可以影响亲和层析的变异时,这样的传统方法可以是有用的。尽管如此,也可以考虑包括特异性的亲和色谱步骤,作为基于此可以选择构建体的特征之一。因此,改进的特异性亲和色谱特征也可以是可以预期的要改进的特征之一。尽管如此,在昆虫细胞中的有效率的产生和感染性或效价仍然是需要保持和/或可以改进的特征。
在另一个实施方案中,提供了通过上述方法产生的细小病毒病毒体文库。在又一个实施方案中,提供了包含各种细小病毒载体的细小病毒文库,所述细小病毒载体文库包括细小病毒载体衣壳,其中每个细小病毒衣壳含有包含用于表达细小病毒衣壳蛋白的表达盒的细小病毒载体基因组。优选地,所述包含各种细小病毒载体的细小病毒载体文库包含细小病毒载体衣壳,其中每个细小病毒衣壳含有包含用于在昆虫细胞中表达细小病毒衣壳蛋白的表达盒的细小病毒载体基因组。更优选地,所述包含各种细小病毒载体的细小病毒载体文库包含细小病毒载体衣壳,其中大体上每个细小病毒衣壳含在文库中,细小病毒衣壳含有包含用于在昆虫细胞中表达细小病毒衣壳蛋白(在其中衣壳化的)的表达盒的细小病毒载体基因组。可选地,如上所述,载体基因组可以不一定含有表达盒,但也可以含有序列标识符,通过所述序列标识符可以鉴定载体基因组在其中衣壳化的细小病毒氨基酸序列(和/或编码其的表达盒)(见图6)。换句话说,所述文库含有大体上的细小病毒衣壳,其可以含有载体基因组在其内衣壳化的任何序列,只要从载体基因组内含有的序列中可以鉴定出其含有在其中的相应细小病毒衣壳(即其氨基酸序列)。
可以考虑的特异性标识符序列(见图6B)的长度优选至少为10、11、12、13、14、15、16、17、18、19或20个核苷酸。可以考虑的特异性标识符序列的长度最多可以为50、60、70、80或90个核苷酸。当标识符序列至少为15个核苷酸,约10e9个可能的独特组合是可能的。具有较长的序列标识符可以允许更多冗余和更可靠的鉴定。理解的是,序列标识符可以是先验地耦合至特异性衣壳序列的。因此,在这种情况下,当序列标识符被测序或检测时,可以通过参考表格鉴定相应的衣壳表达盒。可选地,可以通过捕获和/或测序载体载具基因组(如杆状病毒基因组)来使用序列标识符,如此使得可以确定与序列标识符缔合的衣壳表达盒序列或其部分。这样的分析和/或序列确定可以在之后进行。使用高通量测序技术从复杂文库鉴定序列的用于序列确定的这样的手段和方法在本领域是众所周知的。
根据上述本发明的文库或如上述产生的文库可以作为粗裂解物或纯化的产物来提供。特别地,这样的文库可以优选地从含有载体基因组并编码细小病毒衣壳蛋白的病毒载体产生。用于生成文库的优选的载体可以是这样的杆状病毒载体,其含有在昆虫细胞中具有活性的用于所述细小病毒衣壳蛋白的表达盒。可选地,可以很容易地设想,可以考虑任何供选择的合适的病毒载体文库和细胞系,例如可以使用基于腺病毒、HSV、慢病毒载体的系统来代替杆状病毒,其中用于衣壳蛋白的表达盒适合(或因而被选择)在哺乳动物细胞中表达,所述哺乳动物细胞例如HeLa细胞、293细胞、CHO细胞、A549、293T、COS。可以考虑的这样的供选择的载体载具和合适的细胞系在本领域中是众所周知的,正如例如在NancySmith Templeton编写的第4版的Gene and Cell Therapy–Therapeutic Mechanisms andstrategies,2015,CRC Press中描述。因此,在可选的实施方案中,代替使用杆状病毒载体和昆虫细胞,可以很容易地使用本文所述的手段和方法用于哺乳动物细胞,与合适的哺乳动物病毒载具相结合。在任何情况中,由于根据本发明提供的细小病毒载体文库(如AAV载体文库)是使用允许控制每个生产者细胞的拷贝数的载体载具来生成的,与不允许这种控制的质粒产生的文库相比,载体文库的质量得到显著改进。
接下来,回收细小病毒病毒体,或将其不同地分开,提供细小病毒载体文库,所述细小病毒载体文库可以是粗裂解物或纯化的产物,随后将其细小病毒病毒体与选定的靶细胞接触,以允许细小病毒感染靶细胞。可以选择合适的靶细胞,其可以是基因疗法正在针对其开发的合适的靶细胞,如肝细胞、肾细胞、神经元。合适的靶细胞可以是细胞系,例如HeLa细胞、HEK293细胞或HuH细胞,也可以是原代细胞。甚至可以设想,这包括递送至合适的动物模型,例如大鼠、小鼠、猴,并且也可以包括多种递送途径,例如静脉内或肌肉内注射,并且随后的靶细胞是这样的动物模型中选择的候选器官。在任何情况下,可以选择任何细胞类型,并以任何方式(即体内或体外)使细小病毒病毒体与其接触,以允许感染,即将衣壳病毒体内含有的核酸构建体转移至细胞。理解的是,细胞也可以与腺病毒共同感染来辅助转导过程,例如来诱导转导。当例如报告基因构建体含有在核酸构建体中,并且希望选择的细胞不仅允许DNA的有效率的转移,而且还允许细胞内的有效率的运输,以将核酸构建体递送至细胞核时,那可以是有帮助的(见图6)。由于不受理论的限制,当衣壳序列被突变和/或VP1、VP2和VP3的化学计量比被改变,这可以导致内部运输受阻。例如,缺乏VP1的衣壳可以感染细胞,但不会进入细胞核。含有核酸构建体的衣壳然后保留在核内体中,并被靶向通过蛋白酶体的蛋白水解。因此,基于选择过程的目的,即为了实现将核酸构建体有效率的递送至细胞核以允许从核酸构建体的表达,包括选择步骤可以是感兴趣的。这可以是例如通过报告基因或任何其他感兴趣的基因。这也可以是HeLa RC32细胞等,其中实现载体基因组的有效率的递送的病毒体被扩增。
最后,当细胞已被允许感染靶细胞时,优选允许有效率的转导,从靶细胞回收核酸构建体。可以从全细胞群回收核酸构建体。也可以从细胞群的子集中回收核酸构建体,例如显示报告子转基因表达并因此有效转导靶细胞的子集。也可以从全细胞群但特别是从来自全细胞的细胞核回收核酸构建体。通过该方式,可以选择预期善于转导靶细胞的核酸构建体(以及还有随附的其编码的衣壳)。接下来可以对回收的核酸构建体进行测序以鉴定核酸构建体。正如所述,核酸构建体可以含有标识符序列来鉴定构建体。还理解的是,当例如杆状病毒载体系统和昆虫细胞已用于细小病毒载体文库生成,且细小病毒载体基因组含有用于含有在其中的细小病毒衣壳的表达盒时,所述表达盒或其部分可以被视为标识符序列。当所述表达盒具有昆虫细胞启动子以及不是在哺乳动物细胞中有活性的启动子时,所述表达盒当引入哺乳动物细胞中时可以不产生AAV衣壳。特别地,可以对在其中引入变异的核酸构建体的部分(或相应的标识符序列)进行测序,例如在PCR反应后,其中小部分被简单扩增。也可以对整个核酸构建体或整个衣壳编码序列进行测序。理解的是,测序包括高通量测序或本领域已知的任何其他合适的序列方法。
特别感兴趣的可以是鉴定改进的序列。当选择条件使其为高度限制性时,所有回收的核酸构建体及其序列为改进的核酸构建体。因此,核酸构建体的回收包括改进的核酸构建体的选择。尽管如此,通过将回收的序列的群体与例如初始构建的文库中含有的序列的群体进行比较,可以确认或鉴定衍生自回收的核酸构建体的改进的序列。当与初始群体相比,在回收的群体中高度占优势的回收的序列表明是期望的改进的核酸构建体。因此,除了核酸构建体的回收,额外的步骤可以包括从文库鉴定对应于改进的核酸构建体的核酸构建体。这样的鉴定可以包括与来自例如初始文库、含核酸构建体的杆状病毒文库、含在细小病毒衣壳中的核酸构建体群体的一个或多个的群体序列比较。
一旦提供或鉴定具有为其选择的改进的性质的核酸构建体,接下来的步骤是步骤g),以生成用于产生基因疗法载体的核酸构建体,所述核酸构建体包括如步骤f)中回收的可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列。用于产生基因疗法载体的核酸构建体不具有侧翼为细小病毒ITR序列的细小病毒衣壳蛋白的表达构建体。因此,用于产生基因疗法载体的核酸构建体优选含有用于细小病毒衣壳蛋白的表达构建体,并且可以任选地进一步含有细小病毒成分,例如如基因疗法构建体,即侧翼为细小病毒ITR的治疗性基因,和/或Rep表达构建体,所有构建体被构建得用于与昆虫细胞产生相容。因此,优选地,所述生成的核酸构建体包括在杆状病毒载体或昆虫细胞中。由于AAV病毒载体是基因疗法的良好候选物,特别是所述细小病毒衣壳蛋白、细小病毒Rep蛋白和/或ITR核苷酸序列优选衍生自腺相关病毒。理解的是,用于生成用于产生基因疗法载体的核酸构建体的回收的核酸构建体可以是实际的物理核酸,例如,通过从回收的核酸构建体切下感兴趣的序列来获得。可选地,可以通过PCR反应来扩增感兴趣的序列,例如细小病毒衣壳表达盒或其部分,并随后使用。同样,可以确定序列,并且可以从头(例如通过DNA合成器)生成感兴趣的序列。
由于整个选择过程是为了鉴定改进的构建体,所述改进的构建体用于医学治疗中所用的基因疗法载体的基于昆虫细胞的制造,在又一个实施方案中,提供了用于产生细小病毒载体的方法,所述方法包括如上所述的步骤a)–g),其中昆虫细胞被提供有:
-所述生成的核酸构建体,其用于产生基因疗法载体
-包括至少一个反向末端重复(ITR)核苷酸序列的含有核苷酸序列的核酸构建体;和
-能够在昆虫细胞中表达细小病毒Rep蛋白的编码细小病毒Rep蛋白的核酸构建体;
其中昆虫细胞在使得产生细小病毒载体的条件下培养;和任选地,(b)回收产生的细小病毒载体。优选地,所述细小病毒载体是AAV载体。因此,如上所述的用于产生具有在VP1 ATG密码子之前具有框外起始密码子的VP1、VP2和VP3表达构建体的AAV载体的任何方法,同样适用于任何已鉴定的改进的构建体和生成的核酸构建体,用于产生基因疗法载体。
在本文及其权利要求中,动词“包括”及其变形以其非限制性含义使用,意指跟随该词的条目包括在内,但是没有明确提到的条目也并未排除在外。另外,以不定冠词“a”或“an”提到的元件并不排除存在超过一个元件的可能性,除非上下文清楚地要求有且只有一个该元件。因而不定冠词“a”或“an”通常意指“至少一个”。
在本说明书中引用的所有专利和参考文献均以其整体援引并入本文。
以下实施例仅用于说明目的,并不旨在以任何方式限制本发明的范围。
实施例
1.引言
杆状病毒表达系统(BEVS)中AAV衣壳的表达需要对表达盒的修饰,以促进单个mRNA转录本来造成三种病毒衣壳蛋白以正确的比例产生。Urabe等(2002;supra)完成的工作表明改变起始密码子结合去除一个内含子剪接位点,造成所有三种VP蛋白在昆虫细胞中的表达。进一步的工作表明,CTG和GTG可以用作BEVS系统中用于AAV产生的有效率的起始密码子。伴随地,第二位的丙氨酸,例如,通过将其引入AAV5衣壳序列,造成具有天然VP1与VP3衣壳蛋白比的AAV5衣壳。
然而,在合理的设计过程中,由于产生重组杆状病毒的劳动强度大的工作,有限的构建体和组合子集是可能的。因此,结合AAV5衣壳内的随机背景序列,使用文库方法设计来设计一系列选择性起始密码子(共17个),以确定是否仍有空间从BEVS系统中选择在AAV衣壳的质量和产量中的改进(方法概述见图1)。下文描述的结果和方法不限于AAV5,同样还可以应用于其他血清型和其他细小病毒,并且同样也可以用于选择细小病毒基因疗法载体的其他特征的改进。
材料和方法
构建体设计和质粒文库
在文献中发现了以下跨越不同真核生物和原核生物的选择性推定起始密码子,并用作用于AAV5 VP1产生的可能起始密码子:ATT、ATG、ATA、AGA、AGG、AAA、CTG、CTT、CTC、CTA、CGA、CGC、TTG、TGA、TAA、TAG和GTG。构建体具有以下背景设计:NNN NNN NNN GNN NNN(SEQID NO:71)。其中NNN表示插入任何上述用于VP1的起始密码子,而N表示随机均匀分布的A、T、C或G。起始密码子后第一个三元体中的“G”是固定的。这一文库的理论复杂度计算为7.1x107(411x17),即可生成的独特序列的最大数量。在GeneArt(ThermoFisher)合成了起始密码子文库,并且将具有AAV5编码衣壳序列和基因表达序列的全序列克隆到含ITR的质粒中,使得产生的AAV衣壳将衣壳编码基因在自身内衣壳化作为转基因。在GeneArt生成了质粒文库,其中对来自文库的100个单菌落进行Sanger测序,以确认文库内的复杂度和多样性。
杆状病毒文库
为了开发BEVS系统的功能,并从而针对其与BEVS系统相容性筛选新设计,我们从上述提供的质粒文库中生成重组杆状病毒文库。文库的理论多样性为7.1x107。在标准重组方案中,我们使用1μg的供体质粒(8.12x1010质粒分子)和1μg的Bsu36I消化的BacAMT5杆状病毒骨架(7.34x109分子)。在重组效率为100%的情况下,则限制因素是代表理论文库复杂度103倍以上的杆状病毒骨架。在SF9细胞中扩增合并的P0文库,其中预期杆状病毒扩增约1000倍,得到代表完整复杂文库的P1文库。
AAV文库的生成
对于AAV文库的生成,以100万个细胞/ml接种SF9细胞。MOI(感染复数)计算如下:MOI=0.7x病毒体积x滴度/细胞密度x细胞体积。我们确定了杆状病毒文库的P1传代的滴度约为2x1011gc/ml。杆状病毒的平均TCID50值估计比基因组拷贝滴度约低2个对数值。造成了估计的TCID50值为2x109/ml。对于P1杆状病毒文库,使用计算的感染滴度2x109生成第一个AAV文库(MOI为0.5)。通过以100万个细胞/ml接种3L的昆虫细胞,我们对于衣壳/转基因有0.5的MOI。换句话说,每个细胞少于一个感染性颗粒。由于衣壳也是转基因,(并因此对于衣壳)盒将在每个细胞被复制酶扩增约1000倍。与三重感染相比,这种双重感染在泊松分布方面也在统计学上更有效率。使用5、25和50的估计的MOI生成另外三个AAV文库。发现MOI为0.5生成的AAV文库在选择方法中表现最佳。
AAV的纯化和定量
在Akta Explorer上,通过5mLAVB琼脂糖柱(亲和层析)从3L CLB中纯化AAV文库的材料。分离DNA,并使用扩增AAV载体基因组序列的引物对每个级分进行qPCR。由此,我们合并级分用于HeLa RC32细胞上的改良的TCID50测定,以对文库中的新突变体施加选择性压力。见下文。其他三种AAV产生(MOI分别为5、25和50)以类似方式分离。从所有分离的AAV文库中分离DNA用于下一代测序(NGS)。
对AAV文库的选择性压力
HeLa RC32细胞上改良的TCID50测定(Tessier J,et al.J.Virol.75(1):375-383,2001)用于选择显示有最高效价的AAV变体。HeLa RC32细胞含有整合到基因组的AAV2复制酶和衣壳基因。用AAV转导后,转基因被复制酶扩增,并包装在也在HeLa细胞内生成的AAV衣壳中。该细胞系的优点原则上是复制酶充当进入细胞核的任何AAV DNA的扩增器。通过对AAV进行有限的系列稀释和感染HeLa细胞,我们可选择性仅扩增那些成功完成到达细胞核的AAV。换句话说,选择含有/编码良好比例的VP1:VP2:VP3的AAV衣壳和构建体。用于转导HeLa细胞的系列稀释为:6400gc/细胞,3200gc/细胞,1600gc/细胞,800gc/细胞,400gc/细胞,和200gc/细胞。
AAV DNA的分离
转导两天后,将HeLa细胞裂解并进行DNA分离以回收AAV载体基因组,其中到达细胞核的载体基因组在HeLa细胞中扩增。在提交给下一代测序(NGS)之前,使用用于衣壳文库的通用引物组,对分离的DNA进行终点PCR。
多种文库的NGS测序
对来自质粒文库的分离的DNA、杆状病毒文库的P1传代、AAV文库的产生以及从每个AAV文库转导的合并的稀释物分离的DNA进行NGS测序。将为每个测序反应制备的DNA发送至BaseClear进行扩增和条码技术。
结果
从0.5MOI感染生成AAV文库。产生AAV文库后,该文库用于感染HeLa RC32细胞。对质粒文库、杆状病毒文库、AAV文库和感染的HeLa RC32进行处理和分析,用于下一代基因测序,以确定其复杂度。在每个步骤鉴定独特的序列,并且还确定每个独特的序列的拷贝数,确定序列总数,并确定并绘制对于每个起始密码子的相对百分比(见图2A-E)。生成的杆状病毒文库代表质粒文库的复杂度的估计的74%。质粒文库与杆状病毒文库之间有关起始密码子的盛行率方面没有引人注目的观察结果(参见图2A和2B),这是预期的,因为未对其施加选择压力。然而,当使用ATG作为起始密码子时,该序列在AAV衣壳中发现的最少(参见例如图2C)。在此,ATG代表小于0.5%的总文库。该低百分比是预期的,因为用于VP1的强起始密码子主要生成VP1蛋白,而几乎没有或没有VP2和VP3蛋白产生,其中VP3通常是生成衣壳所必需的。对于其余的,在质粒文库、杆状病毒文库和AAV衣壳文库之间,关于密码子使用的关于百分比方面没有得到引人注目的观察结果,因为它们均在正常变化范围内(范围为约4-5%至约8-9%)。最后,AAV文库通常代表杆状病毒文库的复杂度的大约96%,表明从杆状病毒文库生成AAV的复杂度的全面转移。最后,当HeLa RC32细胞被AAV文库以有限系列稀释感染时,我们发现CTG和GTG是杆状病毒表达系统中产生有效价AAV病毒衣壳颗粒的两个最丰富的起始密码子。CTG和GTG共同组成所有成功转导和感染细胞的序列(即转移至细胞核的载体基因组DNA以允许被HeLa RC32细胞扩增)的几乎50%。引人注目的是,尽管只有紧跟在起始密码子后面的密码子被限制在G,主要是起始密码子后面的密码子被发现编码丙氨酸(未显示),证实编码Ala的三元体可以优选作为昆虫细胞中用于VP1表达的第二个密码子,由于氨基酸序列和/或由于DNA/RNA序列。引人注目的是,从细胞中回收的序列表明AAV文库复杂度只有5%的回收。这表明选择压力是显著的。
有趣的是,从HeLa RC32细胞分离的DNA中,ATG作为起始密码子是第三高代表的起始密码子,约占完整文库的8%。这与AAV文库中仅代表0.5%成对比。具有VP1起始密码子的前三十个序列在下面的表1中列出,占该群体大部分的最普遍的序列列在顶部(SEQ IDNO.1)。当用作VP1起始密码子序列背景的取代序列时,每个序列本身允许AAV衣壳的有效率的产生。虽然每个序列本身可以有一些允许有效率的产生AAV衣壳的固有性质,此外,基本特征可以从下面列出的序列鉴定,其可以描述了一些控制从ATG起始密码子有效率的产生有效价的AAV的一般规则(即参见图5)。这可以包括但不一定限于VP1起始密码子之前的(框外)起始密码子和/或紧跟在ATG密码子之后的GT序列,导致优选在VP1衣壳的第2位的缬氨酸。对于30个克隆中的大多数,观察到可以充当翻译起始位点(ATG、CTG、ACG、TTG和GTG)的上游框外起始密码子。这样的框外起始密码子当翻译时预期导致在VP1起始密码子后的具有终止密码子的短肽。同样,可以鉴定框外CTT或CTC非规范起始密码子。虽然CTT和CTC不视作强的非规范起始密码子,我们观察到从HeLa细胞中分离出明确含有这两个起始密码子的多种多样的衣壳。不受理论的限制,这表明在VP1 ATG之前的一个框外起始密码子可以充当对于核糖体的诱饵翻译起始背景,从而干扰VP1翻译,并允许假渗漏核糖体扫描,就像可以用野生型AAV观察到的。更具体地,从这些选择性起始密码子合成(短)肽可以允许核糖体继续扫描mRNA转录本或使其重新开始。这种延迟和渗漏的起始可以允许从一个多顺反子mRNA转录本翻译VP2和VP3。此外,这可以论证为类似于当CTG、GTG、TTG和ACG作为非规范起始密码子被引入时发生的情况(授权的欧洲专利号1945779B1;授权的美国专利号8163543;Urabe et al 2002;supra),从而允许核糖体在非规范VP1起始密码子处有规律地不启动翻译,这允许从其各自的起始密码子在单个mRNA转录本中充分起始VP2和VP3的翻译。
Figure BDA0002404147760000291
Figure BDA0002404147760000301
表1来自从HeLa RC32细胞回收的含有ATG的克隆的前30个序列。
为了证实文库的选择过程生成有用的新克隆,针对重组至稳定的杆状病毒克隆中来分别选择各个对于ATG、CTG、GTG的两个代表性起始密码子构建体和对于TAG、TGA的一个代表性构建体(表1)。这些构建体用来确定病毒衣壳亚单位的比率和效价。此外,我们希望证实,具有ATG起始密码子的构建体生成高产量和效价的AAV。
Figure BDA0002404147760000311
表2用于杆状病毒生成的独特的起始密码子及其背景序列。
选择独特的起始密码子序列背景(有下划线的VP1起始密码子),并克隆为AAV5表达构建体序列中的取代(SEQ ID NO:70和74,其中SEQ ID NO:74对应于nts.148-167)。SEQID NO:31是从MOI 5文库中选择并鉴定的优势克隆。对于每个候选物生成了几种克隆和分析VP衣壳表达(图3)。具有其相对背景的起始密码子在生成具有良好化学计量比的AAV衣壳中具有不同程度的成功。值得注意的是,大多数情况下每个构建体测试三个克隆,以确定杆状病毒克隆是否稳定。在这方面,ATG1有一个稳定的产生者(图3中对于ATG1的第二道)。对于ATG2,有充足的稳定产生者,所有都具有良好化学计量比。未能产生CTG1构建体,而CTG2产生的衣壳化学计量比与国际专利申请WO2015/137802中描述的相似(数据未示出)。类似地,GTG2也表现出良好的化学计量比,而TAG(终止密码子)产生的量非常低,且TGA(终止密码子)导致产生VP1较少的衣壳。因此,令人惊讶的是证实了,我们能够生成有效率的AAV衣壳构建体,即AAV5,其中ATG被利用为显示出良好化学计量比的起始密码子。
选择对于每个起始密码子构建体的稳定克隆,并用于产生携带在CMV启动子控制下的SEAP报告基因的AAV。所有AAV构建体产生的滴度(gc/ml)在相似的范围内。滴定后,我们以三种不同的MOI转导Huh7和HeLa细胞,并确定48小时后的SEAP活性(图5A和5B)。引人注目的是,与CTG和GTG相比,具有ATG起始密码子的两个构建体产生的衣壳效价相似或有所改进,而缺乏VP1(TGA)的衣壳如预期的没有高于背景的可辨别的SEAP活性。表1中鉴定的占优势的独特的克隆在第2位编码缬氨酸,该事实提供了缬氨酸可以改进效价的支持性证据。这些结果与从图3的观察结果一致,其中这些衣壳显示的VP1:VP2:VP3化学计量比与CTG和GTG构建体非常相似。
序列表
<110> 优尼科IP有限公司
<120> 在昆虫细胞中改进的AAV衣壳产生
<130> P6064534PCT
<150> EP 17182429.5
<151> 2017-07-20
<160> 74
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 1
<400> 1
ctcgatgcat ggtaagcttt 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 2
<400> 2
ctgaatacat ggtcaccttt 20
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 3
<400> 3
ctaacttaat ggtagcattt 20
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 4
<400> 4
ctcaatggat ggttagtttt 20
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 5
<400> 5
ctcgacgtat ggtcacattt 20
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 6
<400> 6
ctccctgaat ggcattgttt 20
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 7
<400> 7
ctagcacgat ggcgtcattt 20
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 8
<400> 8
ctgaccgcat ggcgacgttt 20
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 9
<400> 9
ctggagatat ggtgagtttt 20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 10
<400> 10
cttgttttat ggtaagtttt 20
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 11
<400> 11
ctcagttgat ggtcagcttt 20
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 12
<400> 12
ctacttgtat ggtagctttt 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 13
<400> 13
ctcgatgcat ggcaagcttt 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 14
<400> 14
ctgttagaat ggcgacgttt 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 15
<400> 15
ctcgaccaat gggaacgttt 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 16
<400> 16
ctggcgtcat ggggtcgttt 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 17
<400> 17
ctcgatgcat ggtaagctct 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 18
<400> 18
ctcgatgcat ggtgagcttt 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 19
<400> 19
ctcgatgcat ggtaagcctt 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 20
<400> 20
ctcctcggat ggcgtcattt 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 21
<400> 21
cttgggcgat ggtttcattt 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 22
<400> 22
ctaattgaat ggcggagttt 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 23
<400> 23
ctcgatgcat ggtaggcttt 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 24
<400> 24
ctcgatgcat ggtaagcttc 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 25
<400> 25
ctttgcttat ggtaaatttt 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 26
<400> 26
ctcgacgcat ggtaagcttt 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 27
<400> 27
ctcacttgat ggcttaattt 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 28
<400> 28
ctcagggaat gggattcttt 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 29
<400> 29
cttattctat ggtaagtttt 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence 30
<400> 30
ctcggtgcat ggtaagcttt 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence ATG2
<400> 31
ctcgatgcat ggtaagcttt 20
<210> 32
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 1
<400> 32
cucgaugcau gguaagcuuu 20
<210> 33
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 2
<400> 33
cugaauacau ggucaccuuu 20
<210> 34
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 3
<400> 34
cuaacuuaau gguagcauuu 20
<210> 35
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 4
<400> 35
cucaauggau gguuaguuuu 20
<210> 36
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 5
<400> 36
cucgacguau ggucacauuu 20
<210> 37
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 6
<400> 37
cucccugaau ggcauuguuu 20
<210> 38
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 7
<400> 38
cuagcacgau ggcgucauuu 20
<210> 39
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 8
<400> 39
cugaccgcau ggcgacguuu 20
<210> 40
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 9
<400> 40
cuggagauau ggugaguuuu 20
<210> 41
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 10
<400> 41
cuuguuuuau gguaaguuuu 20
<210> 42
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 11
<400> 42
cucaguugau ggucagcuuu 20
<210> 43
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 12
<400> 43
cuacuuguau gguagcuuuu 20
<210> 44
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 13
<400> 44
cucgaugcau ggcaagcuuu 20
<210> 45
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 14
<400> 45
cuguuagaau ggcgacguuu 20
<210> 46
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 15
<400> 46
cucgaccaau gggaacguuu 20
<210> 47
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 16
<400> 47
cuggcgucau ggggucguuu 20
<210> 48
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 17
<400> 48
cucgaugcau gguaagcucu 20
<210> 49
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 18
<400> 49
cucgaugcau ggugagcuuu 20
<210> 50
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 19
<400> 50
cucgaugcau gguaagccuu 20
<210> 51
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 20
<400> 51
cuccucggau ggcgucauuu 20
<210> 52
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 21
<400> 52
cuugggcgau gguuucauuu 20
<210> 53
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 22
<400> 53
cuaauugaau ggcggaguuu 20
<210> 54
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 23
<400> 54
cucgaugcau gguaggcuuu 20
<210> 55
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 24
<400> 55
cucgaugcau gguaagcuuc 20
<210> 56
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 25
<400> 56
cuuugcuuau gguaaauuuu 20
<210> 57
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 26
<400> 57
cucgacgcau gguaagcuuu 20
<210> 58
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 27
<400> 58
cucacuugau ggcuuaauuu 20
<210> 59
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 28
<400> 59
cucagggaau gggauucuuu 20
<210> 60
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 29
<400> 60
cuuauucuau gguaaguuuu 20
<210> 61
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence 30
<400> 61
cucggugcau gguaagcuuu 20
<210> 62
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA sequence derived from ATG containing sequence ATG2
<400> 62
cugucgucau ggugucguuu 20
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CTG1
<400> 63
ctcgtgccct ggcttcgttt 20
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CTG2
<400> 64
cttgatgtct ggccactttt 20
<210> 65
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CTG1
<400> 65
cttccactgt ggcctccttt 20
<210> 66
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CTG2
<400> 66
cttccgccgt ggcgtcgttt 20
<210> 67
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TAG1
<400> 67
ctgcccccta ggaccgtttt 20
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TGA1
<400> 68
cttcaccctg agcgcaattt 20
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Construct
<220>
<221> misc_feature
<222> (3)..(8)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (13)..(17)
<223> n is a, c, g, or t
<400> 69
ctnnnnnnat ggnnnnnttt 20
<210> 70
<211> 2622
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV5 expression construct sequence
<220>
<221> promoter
<222> (1)..(155)
<223> Polyhedrin Promoter
<220>
<221> misc_feature
<222> (105)..(112)
<223> Transcriptional start
<220>
<221> misc_feature
<222> (105)..(2622)
<223> mRNA transcript
<220>
<221> misc_feature
<222> (156)..(158)
<223> Translational startcodon VP1
<220>
<221> misc_feature
<222> (156)..(2333)
<223> CDS ORF: AAV5 Capsid
<220>
<221> polyA_signal
<222> (2382)..(2622)
<223> poly A
<400> 70
tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60
gatatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt 120
ttcgtaacag ttttgtaata aaaaaaccta taaatatggt ctcttttgtt gatcacccac 180
ccgattggtt ggaagaagtt ggtgaaggtc ttcgcgagtt tttgggcctt gaagcgggcc 240
caccgaaacc aaaacccaat cagcagcatc aagatcaagc ccgtggtctt gtgctgcctg 300
gttataacta tctcggaccc ggaaacggtc tcgatcgagg agagcctgtc aacagggcag 360
acgaggtcgc gcgagagcac gacatctcgt acaacgagca gcttgaggcg ggagacaacc 420
cctacctcaa gtacaaccac gcggacgccg agtttcagga gaagctcgcc gacgacacat 480
ccttcggggg aaacctcgga aaggcagtct ttcaggccaa gaaaagggtt ctcgaacctt 540
ttggcctggt tgaagagggt gctaagacgg cccctaccgg aaagcggata gacgaccact 600
ttccaaaaag aaagaaggct cggaccgaag aggactccaa gccttccacc tcgtcagacg 660
ccgaagctgg acccagcgga tcccagcagc tgcaaatccc agcccaacca gcctcaagtt 720
tgggagctga tacaatgtct gcgggaggtg gcggcccatt gggcgacaat aaccaaggtg 780
ccgatggagt gggcaatgcc tcgggagatt ggcattgcga ttccacgtgg atgggggaca 840
gagtcgtcac caagtccacc cgaacctggg tgctgcccag ctacaacaac caccagtacc 900
gagagatcaa aagcggctcc gtcgacggaa gcaacgccaa cgcctacttt ggatacagca 960
ccccctgggg gtactttgac tttaaccgct tccacagcca ctggagcccc cgagactggc 1020
aaagactcat caacaactac tggggcttca gaccccggtc cctcagagtc aaaatcttca 1080
acattcaagt caaagaggtc acggtgcagg actccaccac caccatcgcc aacaacctca 1140
cctccaccgt ccaagtgttt acggacgacg actaccagct gccctacgtc gtcggcaacg 1200
ggaccgaggg atgcctgccg gccttccctc cgcaggtctt tacgctgccg cagtacggtt 1260
acgcgacgct gaaccgcgac aacacagaaa atcccaccga gaggagcagc ttcttctgcc 1320
tagagtactt tcccagcaag atgctgagaa cgggcaacaa ctttgagttt acctacaact 1380
ttgaggaggt gcccttccac tccagcttcg ctcccagtca gaacctgttc aagctggcca 1440
acccgctggt ggaccagtac ttgtaccgct tcgtgagcac aaataacact ggcggagtcc 1500
agttcaacaa gaacctggcc gggagatacg ccaacaccta caaaaactgg ttcccggggc 1560
ccatgggccg aacccagggc tggaacctgg gctccggggt caaccgcgcc agtgtcagcg 1620
ccttcgccac gaccaatagg atggagctcg agggcgcgag ttaccaggtg cccccgcagc 1680
cgaacggcat gaccaacaac ctccagggca gcaacaccta tgccctggag aacactatga 1740
tcttcaacag ccagccggcg aacccgggca ccaccgccac gtacctcgag ggcaacatgc 1800
tcatcaccag cgagagcgag acgcagccgg tgaaccgcgt ggcgtacaac gtcggcgggc 1860
agatggccac caacaaccag agctccacca ctgcccccgc gaccggcacg tacaacctcc 1920
aggaaatcgt gcccggcagc gtgtggatgg agagggacgt gtacctccaa ggacccatct 1980
gggccaagat cccagagacg ggggcgcact ttcacccctc tccggccatg ggcggattcg 2040
gactcaaaca cccaccgccc atgatgctca tcaagaacac gcctgtgccc ggaaatatca 2100
ccagcttctc ggacgtgccc gtcagcagct tcatcaccca gtacagcacc gggcaggtca 2160
ccgtggagat ggagtgggag ctcaagaagg aaaactccaa gaggtggaac ccagagatcc 2220
agtacacaaa caactacaac gacccccagt ttgtggactt tgccccggac agcaccgggg 2280
aatacagaac caccagacct atcggaaccc gataccttac ccgacccctt taatctagag 2340
cctgcagtct cgacaagcta gcttgtcgag aagtactaga ggatcataat cagccatacc 2400
acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct gaacctgaaa 2460
cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 2520
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 2580
ggtttgtcca aactcatcaa tgtatcttat catgtctgga tc 2622
<210> 71
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Construct
<220>
<221> misc_feature
<222> (3)..(11)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(9)
<223> N is part of a start codon and can be any of a, c, t, or g
<220>
<221> misc_feature
<222> (10)..(10)
<223> N is part of a start codon and can be any of t, g, or a
<220>
<221> misc_feature
<222> (11)..(11)
<223> N is part of a start codon and can be any of a, c, t, or g
<220>
<221> misc_feature
<222> (13)..(17)
<223> n is a, c, g, or t
<400> 71
ctnnnnnnnn ngnnnnnttt 20
<210> 72
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence 1
<400> 72
Met His His Gly Lys Leu
1 5
<210> 73
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence 2
<400> 73
Met Glu Ile Trp
1
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG containing sequence derived from SEQ ID NO:70
<400> 74
ctataaatat ggtctctttt 20

Claims (16)

1.包括表达控制序列的核酸构建体,所述表达控制序列用于在昆虫细胞中表达包括开放阅读框的核苷酸序列,其中所述开放阅读框序列编码:
i)腺相关病毒(AAV)衣壳蛋白VP1、VP2和VP3;和
ii)用于VP1的ATG翻译起始密码子;
所述核苷酸序列包括在所述开放阅读框上游的选择性起始密码子,所述选择性起始密码子在所述开放阅读框的框外。
2.根据权利要求1的核酸构建体,其中所述选择性起始密码子选自由以下组成的组:CTG、ATG、ACG、TTG、GTG、CTC和CTT。
3.根据权利要求1或权利要求2的核酸构建体,其中所述核苷酸序列包括以所述选择性起始密码子起始的选择性开放阅读框,其涵盖所述用于VP1的ATG翻译起始密码子。
4.根据权利要求3的核酸构建体,其中所述选择性起始密码子后的所述选择性开放阅读框编码最多20个氨基酸的肽。
5.根据权利要求1至4任一项的核酸构建体,其中邻近所述开放阅读框并包括所述选择性起始密码子的核苷酸序列为SEQ ID NO.1的核苷酸残基1-8。
6.根据权利要求5的核酸构建体,其中包括用于VP1的ATG翻译起始密码子的所述开放阅读框具有SEQ ID NO:1的核苷酸序列,其中第9-11位的残基代表所述用于VP1的ATG翻译起始密码子。
7.根据权利要求1至6任一项的核酸构建体,其中所述开放阅读框的所述第二密码子编码选自由丙氨酸、甘氨酸、缬氨酸、天冬氨酸和谷氨酸组成的组的氨基酸残基。
8.根据权利要求1至7任一项的核酸构建体,其中所述AAV衣壳蛋白是AAV血清型衣壳蛋白。
9.根据权利要求1至8任一项的核酸构建体,其中所述核酸构建体包括选自由以下组成的组的启动子:多面体启动子、p10启动子、4xHsp27 EcRE+最小Hsp70启动子、deltaE1启动子和E1启动子。
10.根据权利要求1至9任一项的核酸构建体,其中所述核酸构建体是杆状病毒载体。
11.包括根据权利要求1-10任一项的核酸构建体的昆虫细胞。
12.根据权利要求11的昆虫细胞,其中所述昆虫细胞进一步包括:
(a)包括至少一个AAV反向末端重复(ITR)核苷酸序列的第二核苷酸序列;
(b)包括Rep78或Rep68编码序列的第三核苷酸序列,所述Rep78或Rep68编码序列可操作地连接至用于在昆虫细胞中表达的表达控制序列。
(c)任选的,包括Rep52或Rep40编码序列的第四核苷酸序列,所述Rep52或Rep40编码序列可操作地连接至用于在昆虫细胞中表达的表达控制序列。
13.用于在昆虫细胞中产生AAV的方法,所述方法包括以下步骤:(a)在使得产生AAV的条件下培养权利要求11或权利要求12中所定义的昆虫细胞;和任选地,(b)回收所述AAV。
14.用于提供编码细小病毒衣壳蛋白的核酸构建体的方法,所述核酸构建体具有一种或多种改进的性质,所述方法包括:
a)提供多个核酸构建体,每个构建体包括:
可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列和至少一个细小病毒反向末端重复(ITR)序列,所述至少一个细小病毒反向末端重复序列侧翼于所述可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列;
b)将所述多个核酸构建体转移到能表达细小病毒Rep蛋白的昆虫细胞中;
c)将所述昆虫细胞置于允许表达细小病毒衣壳蛋白和细小病毒rep蛋白的条件下,使得所述核酸构建体可以被包装在细小病毒衣壳中以提供细小病毒病毒体;
d)从所述昆虫细胞和/或昆虫细胞上清液回收细小病毒病毒体。
e)使所述细小病毒病毒体与靶细胞接触,以允许感染所述靶细胞;
f)从所述靶细胞回收所述核酸构建体。
15.根据权利要求14的方法,其中步骤a)中所定义的所述核酸构建体包含在杆状病毒载体中。
16.根据权利要求14或权利要求15的方法,进一步包括步骤g):生成用于产生基因治疗载体的核酸构建体,所述核酸构建体包括步骤f)中回收的可操作地连接至表达控制序列的编码细小病毒衣壳蛋白的核苷酸序列。
CN201880058315.8A 2017-07-20 2018-07-20 在昆虫细胞中改进的aav衣壳产生 Active CN111183225B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17182429.5 2017-07-20
EP17182429 2017-07-20
PCT/EP2018/069704 WO2019016349A1 (en) 2017-07-20 2018-07-20 PRODUCTION OF ENHANCED VAA CAPSIDS IN INSECT CELLS

Publications (2)

Publication Number Publication Date
CN111183225A true CN111183225A (zh) 2020-05-19
CN111183225B CN111183225B (zh) 2023-11-17

Family

ID=59383509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880058315.8A Active CN111183225B (zh) 2017-07-20 2018-07-20 在昆虫细胞中改进的aav衣壳产生

Country Status (11)

Country Link
US (2) US11667931B2 (zh)
EP (1) EP3655538A1 (zh)
JP (2) JP2020532286A (zh)
KR (1) KR20200045466A (zh)
CN (1) CN111183225B (zh)
AU (1) AU2018303230A1 (zh)
CA (1) CA3069369A1 (zh)
EA (1) EA202090332A1 (zh)
MX (1) MX2020000663A (zh)
WO (1) WO2019016349A1 (zh)
ZA (1) ZA202000273B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150021A (zh) * 2021-11-26 2022-03-08 武汉枢密脑科学技术有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
CN114981442A (zh) * 2019-12-04 2022-08-30 桑格摩生物治疗股份有限公司 用于生产重组aav的新颖组合物及方法
WO2023039936A1 (zh) * 2021-09-18 2023-03-23 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220025841A (ko) * 2019-06-26 2022-03-03 바이로베크 인코포레이티드 바큘로바이러스 발현 시스템
WO2021198508A1 (en) 2020-04-02 2021-10-07 Uniqure Biopharma B.V. Dual bifunctional vectors for aav production
KR20220161297A (ko) 2020-04-02 2022-12-06 유니큐어 바이오파마 비.브이. 신규 세포주
MX2022016466A (es) * 2020-06-25 2023-06-15 Ferring Ventures Sa Vectores de virus adeno-asociados mejorados para terapia genica.
WO2022188797A1 (en) 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
WO2022207899A1 (en) 2021-04-02 2022-10-06 Uniqure Biopharma B.V. Methods for producing single insect cell clones
EP4347798A2 (en) 2021-06-02 2024-04-10 uniQure biopharma B.V. Insect cell production of parvoviral vectors with modified capsid proteins
CA3219847A1 (en) 2021-06-02 2022-12-08 Sander Jan Hendrik Van Deventer Adeno-associated virus vectors modified to bind high-density lipoprotein
WO2022268811A1 (en) 2021-06-21 2022-12-29 Uniqure Biopharma B.V. Improved lysis procedures
WO2023283962A1 (en) 2021-07-16 2023-01-19 Huigene Therapeutics Co., Ltd. Modified aav capsid for gene therapy and methods thereof
WO2023025920A1 (en) 2021-08-26 2023-03-02 Uniqure Biopharma B.V. Insect cell-produced high potency aav vectors with cns-tropism
WO2023198662A1 (en) 2022-04-12 2023-10-19 Uniqure Biopharma B.V. Novel systems for nucleic acid regulation
WO2023198663A1 (en) 2022-04-12 2023-10-19 Uniqure Biopharma B.V. Nucleic acid regulation of snca
WO2023198702A1 (en) 2022-04-12 2023-10-19 Uniqure Biopharma B.V. Nucleic acid regulation of c9orf72
WO2023198745A1 (en) 2022-04-12 2023-10-19 Uniqure Biopharma B.V. Nucleic acid regulation of apoe

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030148506A1 (en) * 2001-11-09 2003-08-07 The Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
WO2007046703A2 (en) * 2005-10-20 2007-04-26 Amsterdam Molecular Therapeutics B.V. Improved aav vectors produced in insect cells
WO2007148971A2 (en) * 2006-06-21 2007-12-27 Amsterdam Molecular Therapeutics B.V. Vectors with modified initiation codon for the translation of aav-rep78 useful for production of aav in insect cells
CN101405033A (zh) * 2006-01-20 2009-04-08 北卡罗来纳大学教堂山分校 增强感染性细小病毒载体在昆虫细胞中的生产
WO2015137802A1 (en) * 2014-03-10 2015-09-17 Uniqure Ip B.V. Further improved aav vectors produced in insect cells

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4745051A (en) 1983-05-27 1988-05-17 The Texas A&M University System Method for producing a recombinant baculovirus expression vector
ES2311464T3 (es) 1999-06-24 2009-02-16 The University Of British Columbia Terapia con variante de lipoproteina lipasa (lpl).
WO2003042361A2 (en) 2001-11-09 2003-05-22 Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
WO2003074714A1 (en) 2002-03-05 2003-09-12 Stichting Voor De Technische Wetenschappen Baculovirus expression system
US20110171262A1 (en) 2008-06-17 2011-07-14 Andrew Christian Bakker Parvoviral capsid with incorporated gly-ala repeat region
WO2011122950A1 (en) 2010-04-01 2011-10-06 Amsterdam Molecular Therapeutics (Amt) Ip B.V. Monomeric duplex aav vectors

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030148506A1 (en) * 2001-11-09 2003-08-07 The Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
WO2007046703A2 (en) * 2005-10-20 2007-04-26 Amsterdam Molecular Therapeutics B.V. Improved aav vectors produced in insect cells
CN101405033A (zh) * 2006-01-20 2009-04-08 北卡罗来纳大学教堂山分校 增强感染性细小病毒载体在昆虫细胞中的生产
WO2007148971A2 (en) * 2006-06-21 2007-12-27 Amsterdam Molecular Therapeutics B.V. Vectors with modified initiation codon for the translation of aav-rep78 useful for production of aav in insect cells
WO2015137802A1 (en) * 2014-03-10 2015-09-17 Uniqure Ip B.V. Further improved aav vectors produced in insect cells
CN106459984A (zh) * 2014-03-10 2017-02-22 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAIFENG CHEN: "Adeno-associated virus vectors for human gene therapy" *
HAIFENG CHEN: "Intron Splicing–mediated Expression of AAV Rep and Cap Genes and Production of AAV Vectors in Insect Cells" *
JOSHUA P. FERREIRA等: "Tuning gene expression with synthetic upstream open reading frames" *
王启钊等: "腺相关病毒的衣壳装配和DNA衣壳化机制" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114981442A (zh) * 2019-12-04 2022-08-30 桑格摩生物治疗股份有限公司 用于生产重组aav的新颖组合物及方法
WO2023039936A1 (zh) * 2021-09-18 2023-03-23 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
CN114150021A (zh) * 2021-11-26 2022-03-08 武汉枢密脑科学技术有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
WO2023092643A1 (zh) * 2021-11-26 2023-06-01 劲帆生物医药科技(武汉)有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用

Also Published As

Publication number Publication date
WO2019016349A1 (en) 2019-01-24
EA202090332A1 (ru) 2020-04-29
AU2018303230A1 (en) 2020-01-30
EP3655538A1 (en) 2020-05-27
MX2020000663A (es) 2020-07-29
JP2020532286A (ja) 2020-11-12
CA3069369A1 (en) 2019-01-24
JP2023093577A (ja) 2023-07-04
CN111183225B (zh) 2023-11-17
KR20200045466A (ko) 2020-05-04
ZA202000273B (en) 2021-02-24
US20240093231A1 (en) 2024-03-21
US11667931B2 (en) 2023-06-06
US20200248206A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
CN111183225B (zh) 在昆虫细胞中改进的aav衣壳产生
US20210222198A1 (en) Further improved aav vectors produced in insect cells
US10865423B2 (en) Vectors with modified initiation codon for the translation of AAV-REP78 useful for production of AAV
US8163543B2 (en) AAV vectors produced in insect cells
JP5634262B2 (ja) 差次的コドンバイアスを有する反復コード配列を含むバキュロウイルスベクター
EA042960B1 (ru) Молекула нуклеиновой кислоты, конструкция нуклеиновой кислоты, клетка насекомого и способ получения aav в клетке насекомого

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant