CN116348607A - 用于同时基因活化的核酸构建体 - Google Patents

用于同时基因活化的核酸构建体 Download PDF

Info

Publication number
CN116348607A
CN116348607A CN202180069016.6A CN202180069016A CN116348607A CN 116348607 A CN116348607 A CN 116348607A CN 202180069016 A CN202180069016 A CN 202180069016A CN 116348607 A CN116348607 A CN 116348607A
Authority
CN
China
Prior art keywords
sequence
promoter
recombinase
open reading
reading frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180069016.6A
Other languages
English (en)
Inventor
S·奥斯兰德
U·格普费特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN116348607A publication Critical patent/CN116348607A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10351Methods of production or purification of viral material
    • C12N2710/10352Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/507Recombinase

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文报道了新DNA构建体及其使用方法。本发明在DNA分子的编码链和模板链上使用非生产性/无活性启动子和基因的特意排列,通过与位点特异性重组酶的相互作用,所述启动子和基因被转变成其活性形式。更详细地,根据本发明所述的DNA元件对于所含有的第一基因和第二基因的表达不具有功能。通过对于所述第一基因和第二基因的表达不具有功能,根据本发明所述的DNA元件可以整合到细胞的基因组中,而没有所包含的结构基因在整合之后已经直接表达的风险。仅当识别所述DNA元件的重组识别序列并对其具有功能的重组酶被活化或导入所述细胞中时,所述基因才表达。由此,在本发明的经基因整合的DNA元件中,介于第一突变重组酶识别序列与第二突变重组酶识别序列之间的重组酶介导的盒反转(RMCI)被启动。所述RMCI引起位于两个突变重组酶识别序列之间的根据本发明所述的DNA元件的部分的反转。由此第一启动子变成可操作地连接至所述第一基因,并且第二启动子变成可操作地连接至所述第二基因。仅在此之后,所述第一基因和所述第二基因才被转录,并且各自编码的蛋白质被表达。因此,根据本发明所述的DNA元件特别地用于同时活化细胞内的两个基因。

Description

用于同时基因活化的核酸构建体
本文报道了新DNA构建体及其使用方法。借助根据本发明的新DNA构建体,可使用位点特异性重组酶技术同时活化至少两种基因的转录。本发明在DNA分子的编码链和模板链上使用启动子和基因元件的特意无活性排列,通过与位点特异性重组酶的相互作用将该启动子和基因元件转变成其活性形式。本文还报道了具有交换的启动子和并入的LoxP位点的新VA RNA元件。
背景技术
基因治疗广义上是指治疗性施用基因材料以修饰活细胞的基因表达,从而改变其生物学特性。经过数十年的研究,基因治疗已进入市场,并预期将变得越来越重要。一般来说,基因疗法可分为体内或离体方法。
目前,大多数体内疗法依赖于使用重组腺相关病毒(rAAV)载体进行DNA递送。AAV是一种小的、天然存在的、非致病性小病毒,其由无包膜的二十面体衣壳组成。其包含大约4.7kb的单链DNA基因组。野生型AAV载体的基因组携带两种基因rep和cap,其侧翼是反向末端重复序列(ITR)。ITR对于顺式病毒复制和包装是必需的。rep基因编码四种不同的蛋白质,其表达由两个可选择的启动子P5和P19来驱动。此外,通过选择性剪接产生不同的形式。Rep蛋白具有多重功能,诸如,例如,DNA结合、核酸内切酶和解旋酶活性。其在基因调控、位点特异性整合、切除、复制和包装中发挥作用。cap基因编码三个衣壳蛋白和一个组装活化蛋白。通过使用选择性剪接和选择性起始密码子用法来实现这些蛋白质的差异表达,并且由位于rep基因的编码区的单一启动子P40驱动表达。
在被工程化的治疗性rAAV载体中,病毒基因被转基因表达盒替换,该表达盒的侧翼仍接病毒ITR,但在所选启动子的控制下编码目的基因。与野生型病毒不同,被工程化的rAAV载体不会被位点特异性整合在宿主基因组中,主要在转导细胞核中维持游离基因组。
AAV本身不具有复制能力,但需要辅助基因的功能。这些在自然界中由共感染的辅助病毒所提供,诸如,例如,腺病毒或单纯疱疹病毒。例如,已知五个腺病毒基因,即E1A、E1B、E2A、E4和VA对AAV复制是必要的。与其他编码蛋白质的辅助基因相比,VA是一种小RNA基因。
为生产rAAV载体,将携带ITR侧翼的转基因的DNA导入至包装宿主细胞系,其也包含rep和cap基因以及所需的辅助基因。有许多方法可将这三组DNA元件导入至细胞中以及许多方法将其组合到不同DNA质粒上(参见,例如,Robert,M.A.等人,Biotechnol.J.12(2017)1600193)。
已广泛地使用两种一般生产方法。在三重转染方法中,将携带E2A、E4和VA的腺病毒辅助质粒(pHELPER)、包含rep/cap的质粒与包含rAAV-转基因的质粒瞬时地共转染已表达腺病毒E1A和E1B的HEK293细胞。或者,可将rep/cap和病毒辅助基因组合在一个更大的质粒上(双转染方法)。第二种方法包括用两个杆状病毒感染昆虫细胞(Sf9),一个携带rAAV基因组而另一个携带rep和cap。在该系统中,杆状病毒质粒本身提供辅助功能。同样地,单纯疱疹病毒与HEK293细胞或BHK细胞合并使用。最近Mietzsch等人(Hum.Gene Ther.25(2014)212-222;Hum.Gene Ther.Methods 28(2017)15-22)将rep和cap稳定地整合到被工程化的Sf9细胞的基因组中。对于这些细胞,携带rAAV转基因的单杆状病毒足以产生rAAV载体。Clark等人(Hum.Gene Ther.6(1995)1329-1341)产生具有整合至其基因组中的rep/cap基因和rAAV转基因HeLa细胞系。通过用野生型腺病毒转染细胞诱导rAAV载体的产生,并产生rAAV载体和腺病毒的混合原液。
目前为止,还没有对将辅助基因稳定地整合到其基因组中的哺乳动物细胞系进行过描述。rep以及病毒辅助基因的表达对细胞是有毒性的且需要充分控制(参见,例如,Qiao,C.等人,J.Virol.76(2002)1904-1913)。
对于rep基因,此种控制是通过将内含子导入至rep基因来实现,该内含子含有侧翼为LoxP位点的多聚腺苷酸化位点。在重组腺病毒的帮助下导入cre重组酶后,去除多聚腺苷酸化位点并剪接掉内含子(参见,例如,Yuan,Z.等人,Hum.Gene Ther.22(2011)613-624;Qiao,C.等人,如上所述)。
Podhajska,A.J.等人(Gene 40(1985)163-168)报道了具有三个新特性的基因表达质粒的原型:(i)其“关闭(OFF)阶段”在所有常见宿主中都是绝对的,因为表达启动子远离所研究的基因并被强大终止子所阻断;(ii)“开启(ON)阶段”是通过启动子的快速且有效反向来实现的;(iii)只需短热脉冲或暴露于其他诱导剂来启动该两阶段过程。
WO 97/9441(EP 0 850 313 B1)报道了一种生产重组腺相关病毒(AAV)的方法,所述方法包括以下步骤:(1)培养包含细胞的组合物,该细胞已被以下瞬时地转染:(a)包含编码AAV rep和cap蛋白的核酸的AAV辅助质粒;(b)包含必要腺病毒辅助基因的腺病毒辅助质粒,存在于该质粒中的必要腺病毒辅助基因选自由E1A、E1B、E2A、E4、E4ORF6、E4ORF6/7、VARNA及其组合组成的组;和(c)包含第一和第二AAV反向末端重复序列(ITR)的AAV质粒,其中所述第一和第二AAV ITR位于编码目的多肽的DNA的侧翼,所述DNA可操作地连接至启动子DNA;在没有腺病毒颗粒的情况下;以及(2)纯化由此产生的重组AAV。
JP 10-33175A报道了一种基因序列,其中将侧翼为两个重组酶识别序列的填充序列插入至腺相关病毒的基因组序列中,其中基因序列的特征在于重组酶识别序列的插入位点处于启动子P5和rep78/68基因的翻译起始密码子之间,并且填充序列含有与启动子P5和rep78/68基因的方向相同的至少一个可检测基因标记和polyA信号。
WO 98/24918(EP 0 942 999 B1;US 6,303,302 B1)报道了一种基因捕获构建体,其含有第一报告基因,其经活化后可活化第二报告基因,其中第一报告基因编码重组酶,第二报告基因编码蛋白质因子且第二报告基因经活化从而重组酶删除位于第二报告基因之前的DNA片段并且以这种方式将第二报告基因置于由启动子控制下的下游。
WO 98/27207报道了一种包含重组酶可活化的腺相关病毒(AAV)包装盒的多核苷酸,该盒自上游到下游包含以下列出的相对顺序的组分:(i)第一位点特异性重组(ssr)位点;(ii)ssr间插序列;以及(iii)第二位点特异性重组(ssr)位点;其中盒包含启动子以及选自由AAV rep基因和AAV cap基因组成的组的AAV包装基因,其中启动子位于ssr间插序列内或位于第一ssr位点的上游,并且AAV包装基因位于第二ssr位点的下游或位于ssr间插序列内,并且其中启动子可活化地连接至AAV包装基因。
WO 98/10086(US 6,274,354 B1)报道了有效生产重组AAV的方法。在一个方面,将三种质粒导入至宿主细胞。第一质粒引导Cre重组酶的表达,第二质粒含有启动子、侧翼为LoxP位点和rep/cap的间隔序列,并且第三质粒包含含有侧翼为AAV ITR的转基因和调控序列的小基因。在另一个方面,宿主细胞稳定地或诱导性地表达Cre重组酶,并且将携带系统的其他元件的两个质粒导入至宿主细胞中。
WO 98/27217(EP 0 953 647 B1)报道了一种使用重组酶及其识别序列调控病毒结构蛋白基因表达的DNA构建体,其中启动子、重组酶识别序列、抗药基因、polyA添加信号、重组酶识别序列、病毒结构蛋白基因和polyA添加信号以该顺序排列。
WO 2001/36615(EP 1 230 354 B1)报道了包含至少一种核酸的永久性羊水细胞系,该核酸使腺病毒E1A和E1B区的基因产物进行表达。
WO 2001/66774报道了一种控制目的基因表达的系统,其包含第一DNA序列,该序列包含与启动子功能相关连接的目的基因;以及包含第二基因的第二DNA序列,该基因编码对靶DNA序列具有特异性重组的活性的多肽,并且所述靶DNA序列中的两个位于所述两种DNA序列中的一者的侧翼,其特征在于,所述第二DNA序列位于所述启动子与所述目的基因之间。
Silver,D.P.和Livingstone,D.M.报道,在缺乏外源LoxP位点的培养细胞中,Cre重组酶的持续表达导致生长下降、细胞病变效应和染色体畸变。一种结合负反馈回路以限制Cre重组酶表达的持续时间和强度的自切除反转录病毒载体避免了可测量的毒性,并保留了切除侧翼为LoxP位点的靶序列的能力(Mol.Cell 8(2001)233-243)。
Siegel,R.W.等人概述,假设Cre/LoxP系统对解释基因功能的重要性日益增加,则更精细的活化或去活化基因的方案以及允许可选择标记被回收以供随后再次使用将需要不相容LoxP位点的组的可利用性。将多个不相容LoxP位点整合至基因组的定义位置允许通过简单地在靶向载体上指定对应的LoxP位点,随后Cre重组酶介导将转基因构建体导入至不同的染色体位置(FEBS Lett.499(2001)147-153)。
WO 2002/8409(EP 1 309 709 A2,US 7,972,857)报道了一种在哺乳动物细胞中获得目的DNA的位点特异性置换的方法,该方法包括a)提供包含受体构建体的哺乳动物细胞,其中该受体构建体包含待替换的受体多核苷酸,该受体多核苷酸侧翼为不可逆重组位点(IRS)的两个或更多个拷贝;b)将供体构建体导入至细胞,该供体构建体包含供体多核苷酸以替换受体多核苷酸,供体多核苷酸侧翼为两个或多个互补的不可逆重组位点(CIRS);以及c)使受体构建体及供体构建体与不可逆重组酶多肽接触;其中不可逆重组酶催化IRS与CIRS之间的重组以及将受体多核苷酸替换成供体多核苷酸,从而形成替换构建体。
WO 2002/40685(US 7,449,179 B2)报道了一种制备基因捕获文库的方法,以及用于条件性基因失活的基因靶向细胞。提供具有突变元件盒和基因捕获盒的质粒,每个盒都具有位点特异性重组序列。突变元件盒包含第一位点特异性重组序列和包含突变序列的DNA,该突变序列包含连接至第一标记基因的剪接受体序列,该第一标记基因连接至多聚腺苷酸化序列和第二位点特异性重组序列。基因捕获盒包含第一位点特异性重组序列和包含第一基因捕获元件的DNA,该第一基因捕获元件包含可操作地连接至第二标记基因的启动子,该第二标记基因可操作地连接至剪接供体序列,以及包含连接至独特基因的启动子的第二基因捕获盒,该独特基因序列不存在于所选宿主细胞的基因组中。
WO 2002/88353(EP 1 383 891 B1)报道了一种分离的DNA分子,该分子包含至少一个序列A,其侧翼至少有位点特异性重组酶靶向序列(SSRTS)L1;和至少一个序列B,其侧翼至少有位点特异性重组酶靶向序列(SSRTS)L2,该序列A和B为相反方向的转录和翻译序列,该SSRTS L1和SSRTS L2无法相互重组,并且其中序列L1为处于相反方向,序列L2为处于相反方向,该DNA分子中SSRTS序列的顺序为5'-L1-L2-L1-L2-3',并且该SSRTS L1的重组酶特异性与该SSRTS L2的重组酶特异性相同。
Mlynarova,L.等人报道,在大肠杆菌中,当存在Cre重组酶时,重组配偶体中的一者存在于非lox DNA的反向重复序列的更大范围内,则Lox511和Lox2272位点相对于LoxP变得高度混交(Gene 296(2002)129-137)。
Langer,S.J.等人报道,使用具有互补突变臂(Lox66和Lox71)的LoxP位点允许有效的反式重组,生成野生型LoxP位点和具有双突变臂的缺陷位点(Nucl.Acids Res.30(2002)3067-3077)。由于双重突变的LoxP位点不再是重组酶的有效底物,因此插入较有利并且反应向一个方向驱动。
Tronche,F.等人报道了在小鼠中使用位点特异性重组酶(FEBS Lett 529(2002)116-121)。他们概述在小鼠中,Cre-LoxP系统最初用于开启特定细胞群中的基因表达。产生两种不同的转基因小鼠品系。第一种品系携带静默转基因,其与启动子之间以“终止盒”隔开。终止盒阻止转基因的转录,因其包含强大多聚腺苷酸化信号和/或剪接供体序列,或其破坏静默基因的ORF。第二种品系携带转基因,其以细胞类型特异性(即组织特异性)方式驱动Cre重组酶的表达。在每个表达Cre重组酶的细胞中,将切除终止盒,而使所需的转基因仅在这些细胞中表达。根据Tronche等人,必须使插入LoxP位点不会干扰基因的正常表达。理想情况下,其应被放置在内含子或非转录区内,避免破坏调控区。然而,在一些情况下,LoxP位点被插入到经转录但未翻译的区而没有负面影响。Tronche等人进一步概述了在表达高量的Cre重组酶的细胞中,观察到细胞增殖减少和细胞凋亡增加。这与在细胞周期的G2/M期中,积累表达Cre重组酶的细胞、染色体重排和微核的出现有关。这些畸变可能是由于Cre重组酶对存在于基因组中的隐蔽靶位点的作用。
WO 2003/84977报道了一种基因表达控制方法,其使用位于内含子内的转录终止序列。通过加入反式作用因子可以破坏转录终止序列。例如,在“双剪接开关”中,转录终止序列侧翼为重组位点,并且可被重组酶切除。Cre/LoxP重组系统可用于此目的。
Thomson,J.G.等人报道,Cre/LoxP系统中的插入反应较难控制,因为切除事件在动力学上较有利。将50个突变LoxP位点组合与天然LoxP位点进行比较,显示Cre重组酶结合域内部6bp的突变严重地抑制重组,然而外部8bp的突变更耐受(Genesis 36(2003)162-167)。
WO 2004/29219报道了用于在细胞和生物体中控制shRNA构建体的时间和空间表达的载体和方法。这种载体可以为反转录病毒载体,例如慢病毒载体。在优选实施例中,shRNA的表达由RNA聚合酶III启动子调控;已知此类启动子产生有效静默。虽然基本上可使用任何polIII启动子,但理想的实例包括人U6 snRNA启动子、小鼠U6 snRNA启动子、人和小鼠H1 RNA启动子和人tRNA-val启动子。
Mizukami,H.等人报道了使用用于腺相关病毒载体生产的突变型和野生型LoxP序列和改良的包装系统对rep和cap表达的单独控制。他们通过使用两个独立的质粒,开发出Rep和Cap蛋白的诱导表达系统,一个质粒具有突变,另一个质粒具有野生型LoxP序列,Cre重组酶可同时诱导两种不同蛋白质的表达(Mol.Biotechnol.27(2004)1-14)。为实现重组,将表达Cre重组酶的腺病毒质粒应用于培养物。为控制rep和cap表达,填充序列侧翼为两个LoxP(野生型或突变型)序列。在Cre重组酶存在下,去除填充序列并且表达cap和rep基因。
Chatterjee,P.K.等人报道,体内获得的结果与先前报道结果之间的差异可能与可用于重组的瞬时相较于组成型表达的Cre重组酶蛋白有关。LoxP位点似混交着随着Cre重组酶蛋白的量及持久性而增加(Nucl.Acids Res.32(2004)5668-5676)。
Ventura,A.等人报道了来自转基因的Cre-lox调控的条件性RNA干扰(Proc.Natl.Acad.Sci.USA 101(2004)10380-10385)。作者已生成两种用于条件性的Cre-lox调控的RNA干扰的慢病毒载体。一种载体允许条件性活化,而另一种允许短发夹RNA(shRNA)表达的条件性失活。前者基于一种通过包括LoxP位点与TATA盒之间的杂合体以修改小鼠U6启动子的策略。
US 2006/110390报道了腺病毒表达载体AdCMV-Ku70和AdCMV-Ku80,其是基于Cre重组酶依赖性荧光素酶表达质粒,由相反方向的突变LoxP位点Lox71和Lox66组成的AdCUL,其侧翼为巨细胞病毒立即早期启动子(CMV)的下游的反义萤火虫荧光素酶报告基因。Lox71与Lox66之间的Cre重组酶介导的重组将夹接的盒反转成有义方向,使荧光素酶基因表达。
US 2006/143737(US 7,267,979 B2)报道了一种用于重组酶反转或切除产生双链靶标序列RNA的构建体,从而发挥触发内源基因静默机制的作用。
WO 2006/99615报道了应用Cre重组酶和具有不相容间隔子的半突变LoxP位点,将经修饰的靶向基因单方向地交换到腺病毒载体的纤维区中。
Missirlis,P.I.等人(BMC Genomics 7(2006)A13)报道了在Cre重组酶介导的重组中,LoxP间隔区的高通量筛选识别序列及混交特征。他们概述,假设间隔子和反向重复序列突变体已成功地一起使用,则如果可鉴别出足够数量的非混交LE/RE间隔子突变体,有可能将大量DNA片段导入至给定的靶分子、染色体或基因组中。然而,经由反向重复序列的序列化RMCE或插入重组一直受到目前为止所鉴别出的少量稳定、非混交LoxP位点的限制。
WO 2015/068411报道了一种AAV-LoxP质粒,其包含编码靶蛋白的核苷酸序列,该序列位于与启动子的方向相反的Lox71与LoxJTZ17之间,该启动子通常不表达目的蛋白质。
WO 2011/100250报道了一种用于在真核细胞内体内基因调控的靶向质粒,其中靶向质粒在基因组中的特定基因座导入LoxP-FRT-Neo STOP-FRT-tetO-LoxP盒。
Kawabe,Y.等人报道了一种使用重组中国仓鼠卵巢(CHO)细胞用于生产抗体的基因整合系统(Cytotechnol.64(2012)267-279)。侧翼为野生型和突变LoxP位点的交换盒被整合到CHO细胞的染色体中,以建立受体创始细胞。然后,制备供体质粒,该供体质粒包括侧翼为一对相容的LoxP位点的标记-抗体表达盒,并且也包含在选择标记的表达盒与抗体的表达盒之间的内部未配对的LoxP位点。将供体质粒和Cre重组酶表达质粒共转染到创始CHO细胞中,以在CHO基因组中产生RMCE,使抗体基因产生位点特异性整合,恢复原始野生型LoxP位点并且产生不再参与RMCE的无活性的双突变LoxP位点。重复RMCE程序以增加整合基因的拷贝数,从而在每个步骤中切除并且去除存在于细胞中的选择标记的表达盒。
Niesner,B.和Maheshri,N.报道,通过在目的基因前面插入侧翼为反向LoxP位点的启动子,可通过Cre重组酶介导的启动子翻转随机地改变表达。此类似旋转木马的过程,不断地翻转启动子的方向。该过程的终止通过Cre重组酶表达的终止来实现。然而,虽然Cre重组酶是高效的,但多次反转事件可能会导致不可逆地丧失夹接启动子或与其他基因组区域的重组所造成的大规模重排(Biotechnol.Bioeng.110(2013)2677-2686)。
WO 2013/014294报道了通过同源重组将第一基因替换成选择标记(例如氯霉素乙酰转移酶抗生素标记),由此标记可由于存在于标记两端的LoxP位点而被去除。在使用的设置中,使用两种经修饰的LoxP位点(Lox66和Lox71),每个都具有不同的突变。经Cre重组酶重组后,留下Lox72位点(Lambert,J.M.等人,Appl.Environ.Microbiol.73(2007)1126-1135),其现具有两个突变而非一个,且无法再被Cre重组酶识别。
US 2013/58871报道了通过使用两个以头对头位置定向的突变LoxP位点(Lox66和Lox71)产生Cre重组酶介导的可转换反转质粒。当存在Cre重组酶时,侧翼为两个突变LoxP位点的基因经反向形成一个LoxP及一个双突变LoxP位点。因为双突变的LoxP位点对Cre重组酶的亲和力非常低,因此有利的一步反转几乎是不可逆的,允许基因根据需要稳定地切换成“开”和“关”。在不存在Cre重组酶的情况下,通过消除包含伪TATA盒和夹接基因两侧的起始密码子的序列,使表达的泄漏最小化。
WO 2015/38958报道了一种cap-in-cis rAAV基因组,其中使用泛素C启动子片段以驱动mCherry报告基因的表达,然后是合成的polyA序列;由rep调控序列所控制的AAV衣壳基因,接着为侧翼为Lox71和Lox66的SV40晚期polyA信号;Lox66位点相对于Lox71位点为反向的;在这种构型中,Cre重组酶介导侧翼为突变LoxP位点的序列反转;反转后,产生出不相容的双突变Lox72和LoxP位点,降低反转回原始状态的效率。
WO 2015/68411报道了一种病毒AAV-LoxP-WGA,编码靶蛋白的核苷酸序列,该核苷酸序列与启动子的方向相反。该构建体通常不表达目的蛋白质。当编码位于位点特异性重组酶识别序列之间的目的蛋白质的核苷酸序列在方向上经反转时,表达靶蛋白。
Arguello,T.和Moraes,C.T.报道,通过远端LoxP位点的不对称间隔子的突变,Cre重组酶活性在体内受到抑制,但在离体时不受抑制。
WO 2016/57800报道了TGG或DRG启动子,其可操作地连接至Cre重组酶和LOX-终止-LOX可诱导RNA聚合酶III启动子,其可操作地连接至抑制性RNA。在体内,作者发现在远端(3')LoxP位点中,中央间隔子位置4的单T到C突变完全地抑制两种条件性小鼠模型中的重组反应。
WO 2017/100671报道了从经转导的靶细胞中,以Cre重组酶依赖性方式回收AAV衣壳序列。在rAAV-Cap-in-cis-lox rAAV基因组中,侧翼为Lox71和Lox66位点的多聚腺苷酸化(pA)序列通过Cre重组酶反向。
WO 2017/189683报道了包含基因干扰盒的基因构建体和使用其以评估基因表达的时间和顺序的方法。
WO 2018/96356报道了一种在包含靶基因的细胞中产生条件性基因剔除的等位基因的方法,该方法包括:将人工内含子序列导入至靶基因的外显子中,该人工内含子序列包括:剪接供体序列;第一核酸酶或重组酶位点;分支点序列;第二核酸酶或重组酶位点;剪接受体序列;和位于第一核酸酶或重组酶位点的5'或其内的终止密码子,其中为使导入的内含子失活,该方法包括在细胞中导入或活化重组酶或核酸酶,从而切除或破坏分支点并废除人工内含子序列的剪接。
WO 2018/229276报道了一种条件性敲入盒,其为一种双链DNA分子,其包含序列A、序列B、第一对RTS1和RTS1’以及第二对RTS2和RTS2'的重组酶靶位点(RTS),其中(i)第一对的RTS和第二对的RTS无法重组在一起,并且(ii)RTS1和RTS1'方向相反,以及(iii)RTS2和RTS2'方向相反,以及(iv)序列A和B和RTS,自5'到3'的顺序如下:RTS1、序列A、RTS2、序列B、RTS1'和RTS2',以及(v)序列A和B各自包含至少一个编码序列并且该编码序列位于不同的DNA链上,以及(vi)由序列A所编码的氨基酸序列与由序列B所编码的氨基酸序列具有至少90%的序列一致性,并且(vii)序列A的编码链与序列B的非编码链无法杂交。
WO 2019/46069报道了通过在cap基因侧翼接一对LoxP位点并开发出细胞类型特异性的Cre重组酶表达,选择性回收AAV cap基因。将表达Cre重组酶细胞经AAV感染,接着合成第二链AAV基因组使得夹接cap反向。突变的LoxP位点Lox66和Lox71用于驱动Cre重组酶介导的重组平衡往单向反转。LoxP位点最初插入cap的3'UTR,其中其侧翼为短填充序列,该短填充序列含有用于Cre重组酶依赖性回收的靶序列。
Fischer,K.B.等人报道了来自重组酶依赖性AAV载体的脱靶表达来源和交叉不敏感ATG-out载体的缓解(Proc.Natl.Acad.Sci.USA 116(2019)27001-27010)。重组酶依赖性腺相关病毒(AAV)允许靶向特定区域并且表达不同的转基因,而无需相对繁琐的转基因小鼠品系生产方法。虽然已使用了使用lox-STOP-lox和FRT-STOP-FRT系统的重组酶依赖性AAV设计,但双反向开放阅读框(ORF)(DIO)和翻转/切除(FLEX)构建体在设计上实际相同,由于其大小有限且在使用强大启动子时具有较少的泄漏性质,因此获得最广泛的使用。简言之,DIO和FLEX设计使用两对正交识别位点,以重迭的反平行方向围绕所需的转基因,即相对于表达盒的其余部分,为反向并因此在转录上受到抑制。当暴露于适当的重组酶时,转基因ORF经恢复并与启动子和3'-非翻译区(UTR)有义锁定,从而驱动表达。在有时称为“ATG-out”或“分割转基因”的反向ORF中,Kozak序列和转基因的起始密码子位于第一组重组酶识别位点之外,只有在重组后才能重建转基因ORF。通过独立地破坏自发反转和转基因ORF,作者表示须破坏两者才能完全消除泄漏。此外,虽然只能在高度敏感的系统中检测到完整ORF的泄漏表达,但自发性反转可驱动低但可检测的荧光蛋白表达量。最后,作者表示,在AAV中使用同源性降低的突变重组酶识别位点,利用ATG-out转基因设计(作者称其为CIAO(交叉不敏感ATG-out)),大量地减少重组酶表达报告小鼠的小鼠脑中的泄漏表达。
瞬时转染方法需要大量的质粒DNA,其需通过大规模发酵和DNA纯化来生产。更重要地,DNA与转染试剂的复合的可扩展性有其限度。电穿孔的可扩展性亦有其限度。此外,细胞的瞬时转染的再现性较差。
依赖单纯疱疹病毒或腺病毒转导的系统具有内在风险,即rAAV制剂被具有复制能力的辅助病毒污染。
基于杆状病毒的系统具有三个主要缺点:首先,由于杆状病毒基因组的大小在100kb的范围内,因此需要应用繁琐的技术来生成并制备重组病毒DNA。其次,在实际生产活动之前需准备高度浓缩的重组病毒原液。最后,源自基于杆状病毒的系统的rAAV易受到衣壳成分改变和效力降低的影响。因此,需额外尝试以调整不同衣壳蛋白的表达比率(Kondratov,O.等人,Mol.Ther.25(2017)2661-2675)。
Ojala,D.S.等人报道,计算机所设计的SCHEMA AAV文库的体内选择产生一种用于感染SVZ中成人神经干细胞的新变体(Mol.Thera.26(2018)304-319。
WO 2020/78953报道了一种腺相关病毒(AAV)载体生产细胞,其包含编码AAV rep和cap基因、辅助病毒基因和AAV载体的DNA基因组的核酸序列;AAV rep基因包含内含子,该内含子包含转录终止序列,其具有位于转录终止序列上游的第一重组位点,以及位于转录终止序列下游的第二重组位点;并且所有核酸序列皆一起整合至位于AAV载体生产细胞基因组内的单一基因座上。该发明也关于生产AAV载体生产细胞系的方法。
WO 2018/150271报道了一种哺乳动物细胞,其包含至少四种不同的重组靶位点(RTS)、包含E1A、E1B或其组合的腺病毒(Ad)基因,以及可操作地连接至Ad基因的启动子,其中RTS、Ad基因及启动子经染色体整合;使用该细胞产生重组腺相关病毒(rAAV)生产宿主细胞的方法;和使用AAV生产宿主细胞以生产、包装以及纯化rAAV的方法。
Mingqi,X.等人报道了哺乳动物设计细胞-工程原理和生物医学应用(Biotechnol.J.10(2015)1005-1018)。
因此,需要功能基因组学工具,通过该工具可增加基因组序列中可选择性地解决的转基因DNA片段的数量。
发明内容
本文报道了新脱氧核糖核酸及其使用方法。根据本发明的新脱氧核糖核酸可用于通过位点特异性重组酶技术同时活化至少两个开放阅读框/基因的表达。本发明在脱氧核糖核酸(DNA)分子的编码链((+)链,正向链)和模板链((-)链,负向链)上使用启动子和开放阅读框/基因元件的特意无活性排列,其需经转录活化,即允许编码序列的转录的启动子与该编码序列的可操作连接,通过与位点特异性重组酶的相互作用而反转。
本发明的另一个方面为一种用于rAAV颗粒生产的重组酶可活化的包装细胞系,其中rep/cap基因以及腺病毒辅助基因(稳定地)整合到基因组中,并且其中它们中的至少一个(在一个优选实施例中,它们中的至少两个)包含在根据本发明的脱氧核糖核酸中,并且因此可通过与位点特异性重组酶的相互作用而被转录活化。在某些实施例中,一种或多种腺病毒辅助基因的转录活化通过重组酶介导的开放阅读框/基因反转(RMCI)来实现。例如,在其活化后,腺病毒辅助蛋白E1A活化来自自体P5启动子的rep基因的转录,自体P5启动子进而活化cap基因的转录。在某些实施例中,在根据本发明的脱氧核糖核酸中,在腺病毒E1A蛋白组成型表达的细胞中(例如在HEK细胞中),使用重组酶介导的开放阅读框/基因反转活化rep/cap基因转录,或使用异源启动子驱动rep和/或cap基因转录。在某个实施例中,重组酶为Cre重组酶形式噬菌体P1。
在某些实施例中,Cre重组酶表达由少量Cre重组酶编码核酸的瞬时转染而诱导。已发现仅仅用通常用于瞬时病毒生产的质粒DNA量的10%即可实现有效重组。如果使用编码Cre重组酶的mRNA,则甚至更少量的核酸即足够。在某些实施例中,Cre重组酶编码核酸整合到包装细胞系的基因组中,且可操作地连接至可诱导启动子,诸如,例如,Tet可诱导启动子。在一个优选实施例中,包含ITR和转基因的rAAV基因组也被整合到包装细胞系的基因组中。从而将包装细胞系转变为rAAV载体和颗粒生产细胞系。同样地,在某些实施例中,rAAV基因组瞬时地导入。
重组后,生产细胞系的细胞在基因上是一致的,并以正确的化学计量表达rAAV复制和包装所需的所有基因(与此相反,在三重或双重转染方法中,一些细胞可接受次优剂量的一个或其他质粒/基因)。因此,不受此理论的束缚,与瞬时包装或生产细胞相比,稳定的rAAV载体/颗粒包装或生产细胞系可实现更高的产品质量。此外,以Cre重组酶编码核酸而非辅助病毒转染以诱导rAAV载体或颗粒产生可提供所产生的rAAV载体/颗粒的改良安全性。
本发明的另一方面为一种新腺病毒VA RNA基因。根据本发明的腺病毒VA RNA基因允许通过反转进行Cre重组酶介导的基因活化。在根据本发明的腺病毒VA RNA中,腺病毒VARNA基因可由具有精确转录起始位点和导入到腺病毒VA RNA的非编码(即调控)元件中的LoxP位点的任何启动子来驱动。
本发明的另一方面为新LoxP位点(间隔序列)AGTTTATA(SEQ ID NO:01(顺方向);SEQ ID NO:02(反方向))。该间隔序列在本文中称为Lx。其可与任何已知的左重复序列及右重复序列组合。
在某些实施例中,Lx间隔序列与突变的左反向重复序列和野生型右反向重复序列组合。该Cre重组酶识别序列表示为Lx-LE,并且在顺方向上具有SEQ ID NO:03的序列,以及在反方向上具有SEQ ID NO:04的序列。
在某些实施例中,Lx间隔序列与突变的右反向重复序列和野生型左反向重复序列组合。该Cre重组酶识别序列表示为Lx-RE,并且在顺方向上具有SEQ ID NO:05的序列,以及在反方向上具有SEQ ID NO:06的序列。
本发明的技术原理是通过将DNA反转与可操作连接至调控元件(诸如,例如,启动子)的伴随物组合来转录活化开放阅读框或基因。
本发明的一个独立方面为一种双链DNA元件,其包含(正向)编码链和(负向)模板链,
其特征在于,
该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,
-第一重组酶识别序列,其在一个反向重复序列中包含突变(即在左反向重复序列中或右反向重复序列中包含突变),并且另一个反向重复序列为非突变/野生型反向重复序列,
-第二启动子,其相对于该编码链(方向)为反向(按顺序),
-第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序),
-第一开放阅读框,其相对于该编码链(方向)为反向(按顺序),并且可操作地连接至该第一多聚腺苷酸化信号和/或转录终止元件,
-第二重组酶识别序列,其在作为该第一重组酶识别序列的相应另一个反向重复序列中包含突变,并且其相对于该第一重组酶识别序列处于反向/互逆方向,
-第二开放阅读框,
-第二多聚腺苷酸化信号和/或转录终止元件,其可操作地连接至该第二开放阅读框。
本发明的一个独立方面为一种双链DNA元件,其5'-至3'-方向,即按以下顺序包含:
-以5'-至3'-方向/正方向的第一启动子,
-第一重组酶识别序列,其在一个反向重复序列中包含突变,即在左反向重复序列中或右反向重复序列中包含突变,
-以3'-至5'-方向/负方向的第二启动子,
-以3'-至5'-方向/负方向的第一多聚腺苷酸化信号和/或转录终止元件,
-以3'-至5'-方向/负方向的第一开放阅读框,并且其可操作地连接至该第一多聚腺苷酸化信号和/或转录终止元件,
-第二重组酶识别序列,其在作为该第一重组酶识别序列的相应另一个反向重复序列中包含突变,并且相对于该第一重组酶识别序列处于互逆/反向方向,
-以5'-至3'-方向/正方向的第二开放阅读框,
-第二多聚腺苷酸化信号和/或转录终止元件,其可操作地连接至该第二开放阅读框。
在某些从属实施例中,将该双链DNA元件与对该第一重组酶识别序列和第二重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第二重组酶识别序列之间的序列的反转,随后该第一启动子可操作地连接至该第一开放阅读框,并且该第二启动子可操作地连接至该第二开放阅读框,以及
-在该第一重组酶识别序列与第二重组酶识别序列之间的DNA序列的重组酶介导的反转后,在该第一启动子与该第一开放阅读框之间或在该第二启动子与该第二开放阅读框之间产生(第三)重组酶识别序列,其((第三)重组酶识别序列)不再对该重组酶具有功能。
本发明的一个独立方面为一种双链腺病毒VA RNA元件,其以5'-至3'-方向,即按以下顺序包含:
-以5'-至3'-方向/正方向的启动子,
-第一重组酶识别序列,其在一个反向重复序列中包含突变,即在左反向重复序列中或右反向重复序列中包含突变,
-以3'-至5'-方向/负方向的腺病毒VA RNA基因,
-第二重组酶识别序列,其在作为该第一重组酶识别序列的相应另一个反向重复序列中包含突变,并且相对于该第一重组酶识别序列处于互逆/反向方向。
在某些从属实施例中,将双链VA DNA元件与对第一重组酶识别序列和第二重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第二重组酶识别序列之间的序列的反转,随后该启动子可操作地连接至该VA RNA基因,以及
-在该第一重组酶识别序列与第二重组酶识别序列之间的DNA序列的重组酶介导的反转后,在该启动子与该VA RNA基因之间或在该VA RNA基因的下游产生(第三)重组酶识别序列,其((第三)重组酶识别序列)不再对该重组酶具有功能。
本发明的一个独立方面为一种(双链)DNA(分子),其包含:
-根据本发明的第一双链DNA元件,
-根据本发明的第二双链DNA元件,
-任选地,根据本发明的第三双链DNA元件或根据本发明的腺病毒VA RNA元件,和
-rep或/和cap开放阅读框(元件)。
在某些从属实施例中,
1)
-在该第一双链DNA元件中,该第一开放阅读框为E1A开放阅读框,并且该第二开放阅读框为E1B开放阅读框,或反之亦然;并且
-在该第二双链DNA元件中,该第一开放阅读框为E2A开放阅读框,并且该第二开放阅读框为E4开放阅读框或E4orf6(开放阅读框),或反之亦然,
2)
-在该第一双链DNA元件中,该第一开放阅读框为E2A开放阅读框,并且该第二开放阅读框为E4开放阅读框或E4orf6(开放阅读框),或反之亦然;并且
-在该第二双链DNA元件中,该第一开放阅读框为E1A开放阅读框,并且该第二开放阅读框为E1B开放阅读框,或反之亦然。
本发明的一个独立方面为一种哺乳动物或昆虫细胞,其包含至少一种根据本发明的双链DNA元件或分子或其(序列)反向形式。
本发明的一个独立方面为一种生产重组腺相关病毒(rAAV)载体或颗粒的方法,该方法包括以下步骤:
-培养/繁殖根据本发明的细胞(在适合细胞分裂的条件下),
-通过根据本发明的重组酶介导的开放阅读框反转来活化rAAV载体或颗粒的产生(通过将重组酶作为蛋白质或作为mRNA或作为DNA导入至根据本发明的细胞中,由此重组酶对根据本发明的DNA元件或分子中的重组酶识别序列具有功能),
-任选地培养在前一步骤中获得的rAAV载体或颗粒生产活化细胞(在适合生产rAAV载体或颗粒的条件下),
-自细胞或/及培养基中回收rAAV载体或颗粒。
因此,本发明的一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含:
a)E1A开放阅读框和E1B开放阅读框;和
b)E2A开放阅读框和E4或E4orf6开放阅读框;
其特征在于a)或b)的第一开放阅读框和第二开放阅读框包含于双链DNA元件,该双链DNA元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向,即按以下顺序包含:
-第一启动子(在正方向上),
-第一重组酶识别序列,其在一个反向重复序列中包含突变,
-第二启动子,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上),
-任选地第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上)并且其是可操作地连接至该第一开放阅读框,
-(a)或b)的)第一开放阅读框,其相对于该编码链方向为反向(按顺序)(即在反向/负方向上),
-第二重组酶识别序列,其在相应的其他反向重复序列中包含突变,并且相对于该第一重组酶识别序列是在互逆/反向方向上,
-a)的第二开放阅读框,如果该第一开放阅读框来自a);或b)的第二开放阅读框,如果该第一开放阅读框来自b)(在正方向上),
-任选地第二多聚腺苷酸化信号和/或转录终止元件(在正方向上并且可操作地连接至该第二开放阅读框)。
因此,本发明的一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含:
a)E1A开放阅读框和E1B开放阅读框;和
b)E2A开放阅读框和E4或E4orf6开放阅读框;
其特征在于a)的该第一开放阅读框和该第二开放阅读框以及b)的该第一开放阅读框和该第二开放阅读框各自包含在双链DNA元件中(即DNA分子包含两个该DNA元件),每个双链DNA元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向,即按以下顺序包含:
-第一启动子(在正方向上),
-第一重组酶识别序列,其在一个反向重复序列中包含突变,
-第二启动子,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上),
-任选地第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上)并且其是可操作地连接至该第一开放阅读框,
-(a)或b)的)第一开放阅读框,其相对于该编码链方向为反向(按顺序)(即在反向/负方向上),
-第二重组酶识别序列,其在相应的其他反向重复序列中包含突变,并且相对于该第一重组酶识别序列是在互逆/反向方向上,
-a)的第二开放阅读框,如果该第一开放阅读框来自a);或b)的第二开放阅读框,如果该第一开放阅读框来自b)(在正方向上),
-任选地第二多聚腺苷酸化信号和/或转录终止元件(在正方向上并且可操作地连接至该第二开放阅读框)。
因此,本发明的一个方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含(至少一种)双链DNA元件,该元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向,即按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在一个反向重复序列中包含突变,
-rep和cap开放阅读框,其包括用于表达Rep和Cap蛋白的其他启动子,其相对于该编码链(方向)为反向(按顺序)(即在反方向上),
-第二重组酶识别序列,其在相应的其他反向重复序列中包含突变,并且相对于该第一重组酶识别序列是在互逆/反向方向上,
-多聚腺苷酸化信号,在一个优选实施例中为该rep和cap开放阅读框的自体多聚腺苷酸化信号。
在某些从属实施例中,将该(双链)DNA(分子)与对该第一重组酶识别序列和第二重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第二重组酶识别序列之间的序列的反转,随后该第一启动子可操作地连接至该rep和cap开放阅读框,以及
-在该第一重组酶识别序列与第二重组酶识别序列之间的DNA序列的重组酶介导的反转后,在该第一启动子与该rep和cap开放阅读框之间或在该rep和cap开放阅读框与该多聚腺苷酸化信号之间产生(第三)重组酶识别序列,其中该第一开放阅读框和该第二开放阅读框不再对该重组酶具有功能。
本发明的另一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含双链DNA元件,该元件包含(正向)编码链和(负向)的模板链,
其中该编码链以5'-至3'-方向,即按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在一个反向重复序列中包含突变,
-第二启动子,其相对于该编码链(在反向方向上)为反向,在一个优选实施例中,为腺相关病毒启动子P19或其功能片段或其变体,
-任选地第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上)并且其是可操作地连接至该Rep78或Rep68编码序列,
-编码序列,其仅编码Rep78蛋白或仅编码Rep68蛋白,但不能同时编码两者,
(i)任选地使内部P40启动子失活,和/或
(ii)Rep52/40的起始密码子经突变成非起始密码子,和/或
(iii)去除剪接供体和受体位点,
并且其相对于编码链是反向的(在反向方向上),
-第二重组酶识别序列,其在作为该第一重组酶识别序列的相应另一个反向重复序列中包含突变,并且相对于该第一重组酶识别序列处于互逆/反向方向,
-Rep52/Rep40和Cap开放阅读框,其包括共同的多聚腺苷酸化信号序列,即可操作地连接至该开放阅读框的多聚腺苷酸化信号。
本发明的另一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含双链DNA元件,该元件包含(正向)编码链和(负向)的模板链,
其中该编码链以5'-至3'-方向,即按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在一个反向重复序列中包含突变,
-第二启动子,其相对于该编码链(在反向方向上)为反向,在一个优选实施例中,为腺相关病毒启动子P19或其功能片段或其变体,
-任选地第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上)并且其是可操作地连接至该Rep78或Rep68编码序列,
-编码序列,其仅编码Rep78蛋白或仅编码Rep68蛋白,但不能同时编码两者,
(i)任选地使内部P40启动子失活,和/或
(ii)该Rep52/40开放阅读框的起始密码子经突变成非起始密码子,以及
(iii)去除剪接供体和受体位点,
并且其相对于编码链是反向的(在反向方向上),
-第二重组酶识别序列,其在作为该第一重组酶识别序列的相应另一个反向重复序列中包含突变,并且相对于该第一重组酶识别序列处于互逆/反向方向,
-Rep52开放阅读框,任选地去除其剪接供体和受体位点,或Rep40开放阅读框,其包括多聚腺苷酸化信号序列,即可操作地连接至该开放阅读框的多聚腺苷酸化信号,
-任选的第三启动子,cap开放阅读框和多聚腺苷酸化和/或终止序列,其中所有都是可操作地连接。
本发明的一个独立方面为一种腺病毒VA RNA基因,其可操作地连接至功能性启动子,其中已加入精确转录起始位点并且已将Cre重组酶识别序列工程化到腺病毒VA RNA基因中/内。
本发明的一个方面为一种分离的(哺乳动物或昆虫)细胞,其包含本发明的原始形式或(重组酶)反向形式的至少一种DNA元件或DNA(分子)或腺病毒VA RNA。
本发明的一个方面为一种产生/用于生产重组腺相关病毒(rAAV)载体或颗粒的方法,该方法包括:
-提供哺乳动物悬浮生长细胞,其包含:
-间隔在两个AAV ITR之间的转基因表达盒;
-编码腺病毒E1A、E1B、E2A、E4或E4orf6蛋白和腺病毒VA RNA的开放阅读框;
-编码腺相关Rep/Cap蛋白的开放阅读框;
-一对或多对的不同的不相容重组酶识别序列;
其中单独或组合地选自由E1A开放阅读框、E1B开放阅读框、E2A开放阅读框、E4开放阅读框、E4开放阅读框6、Rep78开放阅读框、Rep68开放阅读框、Rep52开放阅读框、Rep40开放阅读框、Rep/Cap开放阅读框和腺病毒VA RNA基因组成的组中的一者或多者各自在没有可操作地连接的启动子但包括可操作地连接的多聚腺苷酸化和/或在一对不相容重组酶识别序列之间的转录终止信号的情况下放置,其中一个重组酶识别序列包含在左反向重复序列中的突变,并且一个重组酶识别序列包含在右反向重复序列中的突变,其中启动子位于该第一重组酶识别序列的上游,并且相对于该启动子位于上游的该开放阅读框是在反方向上;
其中该重组酶识别序列被组织成允许产生可检测的重组酶依赖性变化(例如通过rAAV载体或颗粒生产),在某些实施例中,该一个或多个重组酶识别序列为Cre重组酶识别位点(即,该重组酶识别序列相较于彼此在互逆/反向方向上,并且该重组酶的作用使该重组酶识别序列之间的序列发生反转,伴随物可操作地连接至位于该反向序列的上游的启动子),在某些实施例中,该一个或多个重组酶识别序列为Flp识别位点(即,重组酶识别序列相对于彼此在互逆/反向方向是,并且该重组酶的作用使重组酶识别序列之间的序列反转以及伴随物可操作连接至位于该反向序列的上游的启动子);
-通过用重组酶表达质粒或重组酶mRNA转染细胞或通过活化该哺乳动物细胞内的条件性重组酶表达,诱导该哺乳动物细胞中重组酶的表达,由此该重组酶的表达造成重组酶介导的盒反转,从而生产rAAV载体或颗粒,并且其中该重组酶介导的盒反转为侧翼为重组酶识别序列的序列的反转;
-从该细胞或/和该培养基中分离该rAAV载体或颗粒,从而产生该rAAV载体或颗粒。
本发明的一个方面为一种在哺乳动物细胞中获得目的DNA的位点特异性置换的方法,该方法包括:
a)提供包含根据本发明的DNA元件的哺乳动物细胞;
b)将对a)的该DNA元件的重组酶识别序列具有功能的重组酶导入至细胞或在细胞中活化;
其中该重组酶催化重组酶识别序列之间的序列的反转,从而获得哺乳动物细胞中目的DNA的位点特异性置换。
在所有方面和实施例的某些实施例中,该第一重组酶识别序列在左反向重复序列中包含突变,并且该第二重组酶识别序列在右反向重复序列中包含突变。这种排列在重组酶介导的反转后,导致重组酶识别序列的上游(即位于5')在两种反向重复序列中包含突变,因此不具有功能,即无法被相应的重组酶所识别。重组酶识别序列的下游(即位于3')相较于两种反向重复序列为野生型,因此具有功能性,即可被相应的重组酶所识别。
在所有方面和实施例的某些实施例中,该第一重组酶识别序列在右反向重复序列中包含突变,并且该第二重组酶识别序列在左反向重复序列中包含突变。这种排列在重组酶介导的反转后,导致重组酶识别序列的下游(即位于3')在两种反向重复序列中包含突变,因此不具有功能,即无法被相应的重组酶所识别。重组酶识别序列的上游(即位于5')相较于两种反向重复序列为野生型,因此具有功能性,即可被相应的重组酶所识别。
在所有方面和实施例的某些实施例中,该第一启动子在正方向上和/或该第二开放阅读框在正方向上。
具体实施方式
本文报道了新DNA构建体及其使用方法。根据本发明的新DNA构建体可用于使用位点特异性、重组酶介导的盒反转(RMCI)同时转录活化至少两个开放阅读框或基因。本发明在双链DNA分子的编码链和模板链上使用启动子和开放阅读框的特意非生产性排列,通过与位点特异性重组酶的相互作用(即,反转)将其转变成其生产(即,可操作地连接)形式。
定义
用于实施本发明的有用方法和技术描述于例如Ausubel,F.M.(ed.),CurrentProtocols in Molecular Biology,Volumes I to III(1997);Glover,N.D.,and Hames,B.D.,ed.,DNA Cloning:A Practical Approach,Volumes I and II(1985),OxfordUniversity Press;Freshney,R.I.(ed.),Animal Cell Culture–a practical approach,IRL Press Limited(1986);Watson,J.D.,et al.,Recombinant DNA,Second Edition,CHSL Press(1992);Winnacker,E.L.,From Genes to Clones;N.Y.,VCH Publishers(1987);Celis,J.,ed.,Cell Biology,Second Edition,Academic Press(1998);Freshney,R.I.,Culture of Animal Cells:A Manual of Basic Technique,secondedition,Alan R.Liss,Inc.,N.Y.(1987)。
使用重组DNA技术能产生核酸衍生物。此类衍生物可例如在个别或数个核苷酸位置通过取代、改变、交换、缺失或插入来修饰。修饰或衍生化可例如通过定点诱变的方式进行。此类修饰可容易地由本领域技术人员进行(参见例如Sambrook,J.等人,MolecularCloning:A laboratory manual(1999)Cold Spring Harbor Laboratory Press,NewYork,USA;Hames,B.D.,and Higgins,S.G.,Nucleic acid hybridization–a practicalapproach(1985)IRL Press,Oxford,England)。
脱氧核糖核酸包含编码链和非编码链。本文所用的术语“5'”和“3'”是指编码链上的位置。
术语“3'侧翼序列”表示位于核苷酸序列3'端(下游;下方)处的序列。
术语“5'侧翼序列”表示位于核苷酸序列5'端(上游,上方)处的序列。
还必须注意,除非上下文另有明确规定,否则如本文中和所附权利要求书中所使用的,单数形式“一”、“一种”和“该”包括复数个提及物。因此,例如,提及“一个细胞”包括复数个此类细胞及其本领域技术人员已知的等效物,诸如此类。同样,术语“一”(或“一种”)、“一个或多个”和“至少一个”在本文中可互换使用。还应注意,术语“包含”、“包括”和“具有”可互换使用。
术语“AAV辅助功能”表示AAV衍生的编码序列(蛋白质),其可经表达以提供AAV基因产物和AAV颗粒,而AAV颗粒反过来以反式作用于生产性AAV复制和包装。因此,AAV辅助功能包括AAV开放阅读框(ORF),其包括rep和cap以及其他例如某些AAV血清型的AAP。rep基因表达产物已被证明具有许多功能,其中包括:识别、结合以及切口DNA复制的AAV起始点;DNA解旋酶活性;以及调节来自AAV(或其他异源性)启动子的转录。cap基因表达产物(衣壳)提供必要的包装功能。AAV辅助功能用于补充AAV载体基因组中缺失的反式AAV功能。
术语“约”表示其后接着的数值+/-20%的范围。在某些实施例中,术语“约”表示其后数值的+/-10%的范围。在某些实施例中,术语“约”表示其后数值的+/-5%的范围。
术语“包含”还包括术语“由……组成”。
术语“CAS蛋白”表示CRISPR相关蛋白,其具有核糖核酸酶活性并且可结合特定的RNA序列。
术语“CAS9”表示核酸内切酶Cas9。该酶结合RNA序列GUUUUAGAGCU(A/G)UG(C/U)UGUUUUG(crRNA重复序列)(SEQ ID NO:26)并在那里切割相关DNA。
术语“Cre重组酶”表示使用LoxP位点之间的类拓扑异构酶I机制来催化位点特异性重组的酪胺酸重组酶。该酶的分子量约为38kDa并且由343个氨基酸残基组成。其是整合酶家族的成员。示例性的Cre重组酶具有以下氨基酸序列:
Figure BDA0004166468400000251
Figure BDA0004166468400000261
/>
并且一种对应的Cre mRNA具有以下序列:
Figure BDA0004166468400000262
Figure BDA0004166468400000271
Figure BDA0004166468400000272
或其具有不同密码子用法的变体。
术语“CRISPR”是成簇的规律间隔短回文重复序列的缩写;以固定间隔分组成短回文重复序列。
术语“CRISPR/CAS”表示CRISPR相关系统。成簇的规律间隔短回文重复序列为含有多个短正向重复序列的基因座,并且提供对细菌和古细菌的获得性免疫。CRISPR系统依靠crRNA和tracrRNA对入侵的外来DNA进行序列特异性静默。存在三种类型的CRISPR/CAS系统:在第II型系统中,Cas9作为RNA引导的DNA核酸内切酶,在crRNA-tracrRNA靶识别时切割DNA。
术语“crRNA”表示由crRNA重复序列和crRNA间隔序列组成的RNA;具有特定的二级结构;crRNA与Cas9结合,从而诱导Cas9的构象改变,由此靶DNA可与crRNA间隔子(与靶DNA互补)结合;通过交换crRNA间隔序列,可改变靶DNA(以靶向DNA互补RNA序列);crRNA重复由20个核苷酸组成;与PAM基序相邻的12个核苷酸对结合特异性至关重要。
术语“供体质粒”表示含有供体序列的质粒。
术语“供体序列”表示包含5'侧翼序列-靶序列-3'侧翼序列的序列。
术语“DSB”表示双链断裂:ZFN、TALEN和CRISPR/Cas9作用的产物,双链断裂是DNA损伤的一种形式,当DNA两链都被切割时发生。
术语“空衣壳”和“空颗粒”是指AAV颗粒(即载体),其具有AAV蛋白壳但其全部或部分地缺乏编码蛋白质或被转录成侧翼为AAV ITR的目的转录物的核酸。因此,空衣壳不会将编码蛋白质的核酸或被转录成目的转录物的核酸转移到宿主细胞中。
术语“内源”表示在细胞内天然发生的;由细胞天然地产生;同样地“内源基因座/细胞内源基因座”是细胞中天然存在的基因座。
如本文所用,术语“外源”是指核苷酸序列并非源自特定细胞,而是通过DNA递送方法导入该细胞中,例如通过病毒载体的转染、电穿孔或转导方法。因此,外源核苷酸序列是人工序列,其中人造物可源自例如不同来源的子序列的组合(例如重组酶识别序列与SV40启动子和绿色荧光蛋白的编码序列的组合为一种人工核酸),或部分序列的缺失(例如仅编码膜结合受体或cDNA的细胞外域的序列)或核碱基的突变。术语“内源”是指源自细胞的核苷酸序列。“外源”核苷酸序列可具有在碱基组成上相同的“内源”对应物,但是其中序列(例如通过重组DNA技术)被导入细胞中而成为“外源”序列。
如本文所用,术语“侧翼”表示位于第二核苷酸序列的5'或3'末端或两端的第一核苷酸序列。侧翼核苷酸序列可与第二核苷酸序列相邻或相距给定的距离。除实际需要外,侧翼核苷酸序列的长度无具体限制。例如,侧翼序列可包含几个碱基对或几千个碱基对。术语“侧翼核苷酸序列”表示在待插入序列(=靶序列)之前或之后的核酸序列片段。
术语“基因座”表示基因在染色体上的位置,即基因在基因组中的位置,即基因位置。
术语“HR”表示同源重组:同源定向修复是DSB修复的模板依赖途径。通过提供含有同源性的供体模板和位点特异性核酸酶,HDR准确地将供体分子插入至靶基因座。这种方法能够插入单个或多个转基因,以及单个核苷酸取代。
“分离的”组合物是指已从其自然环境的一种或多种组分中分离出来的组合物。在一些实施例中,将组合物纯化至大于95%或99%的纯度,其是通过(例如)电泳(例如SDS-PAGE、等电位聚焦(IEF)、毛细管电泳、CE-SDS)或色谱(例如粒径筛析色谱或离子交换或反相HPLC)来测定的。对于例如抗体纯度的评估方法,参见,例如,Flatman,S.等人,J.Chrom.B848(2007)79-87。
“分离的”核酸是指已从其自然环境的一种或多种组分中分离出来的核酸分子。分离的核酸包括通常包含核酸分子的细胞中所含的核酸分子,但是核酸分子存在于染色体外或与自然染色体位置不同的染色体位置。
“分离的”多肽或抗体是指已从其自然环境的一种或多种组分中分离出来的多肽分子或抗体分子。
“整合位点”表示其中被/已被插入外源核苷酸序列的细胞基因组中的核酸序列。在某些实施例中,整合位点位于细胞基因组中两个相邻的核苷酸之间。在某些实施例中,整合位点包括一段核苷酸。在某些实施例中,整合位点位于哺乳动物细胞基因组的特定位点。在某些实施例中,整合位点在哺乳动物细胞的内源基因中。
术语“LoxP位点”表示长度为34bp的核苷酸序列,其由末端的两个回文13bp序列(反向重复序列)组成(分别为ATAACTTCGTATA(SEQ ID NO:14)和TATACGAAGTTAT(SEQ IDNO:15))和中央8bp核心(非对称)间隔序列组成。间隔序列决定LoxP位点的方向。根据两个LoxP位点彼此的相对方向和位置,介入的DNA被切除(LoxP位点朝向相同方向),或者被反向(LoxP位点朝向相反方向)。术语“夹接(floxed)”表示位于两个LoxP位点之间的DNA序列。如果有两个夹接序列(即基因组中的靶夹接序列和供体核酸中的夹接序列),则两个序列可相互交换。这称为“重组酶介导的盒交换”。
示例性的LoxP位点显示在下表:
Figure BDA0004166468400000291
Figure BDA0004166468400000301
术语“包含外源核苷酸序列的哺乳动物细胞”涵盖已被导入一种或多种外源核酸的细胞,包括此类细胞的子代。这些细胞可作为进一步基因修饰的起点。因此,术语“包含外源核苷酸序列的哺乳动物细胞”涵盖包含整合至该乳动物细胞基因组的基因座内单一位点处的外源核苷酸序列的细胞,其中该外源核苷酸序列包含位于至少一个第一选择标记的侧翼的至少第一重组识别位点和第二重组识别位点(这些重组识别位点不相同)。在某些实施例中,包含外源核苷酸序列的哺乳动物细胞为包含整合至该宿主细胞基因组的基因座内单一位点处的外源核苷酸序列的细胞,其中该外源核苷酸序列包含位于至少一个第一选择标记的侧翼的第一重组识别序列和第二重组识别位点,以及位于该第一重组识别序列和该第二重组识别序列之间的第三重组识别序列,且所有重组识别序列都不相同。
“包含外源核苷酸序列的哺乳动物细胞”与“重组细胞”都为“转染细胞”。此术语包括原代转染细胞和从其衍生的子代,而与继代次数无关。例如,子代在核酸含量上可与亲代细胞不完全相同,但可能含有突变。涵盖与原始转染的细胞具有相同功能或生物活性的突变子代。
术语“NHEJ”表示非同源末端连接。此为一种DSB修复途径,可将两个断裂的末端接合或连接在一起。NHEJ不使用同源模板进行修复,因此通常会导致在断裂位点导入小的插入和缺失,通常会造成剔除基因功能的框移。
如本文所用,术语“不相容”表示一种重组酶识别位点(例如第一LoxP位点),其不与另一重组酶识别位点(诸如,例如,第二LoxP位点)重组,且其不具有间隔区同源性。在某些实施例中,与另一个LoxP位点重组的不相容LoxP位点与该另一个LoxP位点不具有小于1%(在一个优选实施例中为0.5%或更少)的间隔子同源性。这意味着顺式连接的两个不相容LoxP位点在存在Cre重组酶的情况下是稳定的,即最多1%的位点交换,在一个优选实施例中为0.5%或更少的位点交换。
如本文所用,术语“核定位序列”表示包含带正电荷的氨基酸残基精氨酸或/和赖氨酸的多个拷贝的氨基酸序列。包含该序列的多肽被细胞识别并输入至细胞核中。示例性的核定位序列为PKKKRKV(SEQ ID NO:09;SV40大T抗原)、KR[PAATKKAGQA]KKKK(SEQ ID NO:10,SV40核质蛋白)、MSRRRKANPTKLSENAKKLAKEVEN(SEQ ID NO:11;秀丽隐杆线虫EGL-13)、PAAKRVKLD(SEQ ID NO:12,人c-myc)、KLKIKRPVK(SEQ ID NO:13,大肠杆菌末端利用物质蛋白)。本领域技术人员可容易地鉴别其他核定位序列。
“编码AAV包装蛋白的核酸”通常是指一种或多种核酸分子,其包括提供自AAV载体中缺失的AAV功能的核苷酸序列,其是用于产生转导潜能的重组AAV颗粒。编码AAV包装蛋白的核酸通常用于提供表达AAV rep和/或cap基因,以补充AAV复制所需的缺失的AAV功能;然而,核酸构建体缺乏AAV ITR,既无法复制也无法自行包装。编码AAV包装蛋白的核酸可以为质粒、噬菌体、转座子、粘粒、病毒或颗粒的形式。已描述了许多核酸构建体,诸如常用的质粒pAAV/Ad和pIM29+45,其编码rep和cap基因两者的表达产物。参见,例如,Samulski等人(1989)J.Virol。63:3822-3828;和McCarty等人(1991)J.Virol.65:2936-2945。已经描述了许多编码rep和/或cap基因表达产物的质粒(例如,US 5,139,941和US 6,376,237)。这些编码AAV包装蛋白的核酸中的任一种核酸都可包含根据本发明的DNA元件或核酸。
术语“编码辅助蛋白的核酸”通常是指一个或多个核酸分子,其包括编码提供腺病毒辅助功能的蛋白和/或RNA分子的核苷酸序列。可将具有编码辅助蛋白的核酸的质粒转染到合适的细胞中,其中该质粒然后能够支持在该细胞中产生AAV颗粒。这些编码辅助蛋白的核酸中的任一种核酸都可包含根据本发明的DNA元件或核酸。该术语明确排除传染性病毒颗粒,因其存在于自然界中,例如腺病毒、疱疹病毒或牛痘病毒颗粒。
如本文所用,术语“可操作地连接”是指两个或更多个组分的并置,其中组分处于使它们能够以其预期方式起作用的关系。例如,如果启动子和/或增强子起到调节编码序列/开放阅读框/基因的转录的作用,则该启动子和/或该增强子可操作地连接至该编码序列/开放阅读框/基因。在某些实施例中,“可操作地连接”的DNA序列是连续的。在某些实施例中,例如,当需要连接两个蛋白编码区(例如分泌前导子和多肽)时,序列是连续的并且在相同的阅读框中。在某些实施例中,可操作地连接的启动子位于编码序列/开放阅读框/基因的上游,并且可与其相邻。在某些实施例中,例如,关于调节编码序列/开放阅读框/基因的表达的增强子序列,虽然两种组分不相邻,但可以可操作地连接。如果增强子增加编码序列/开放阅读框/基因的转录,则该增强子可操作地连接至该编码序列/开放阅读框/基因。可操作地连接的增强子可位于编码序列/开放阅读框/基因的上游、内部或下游,并且可位于距该编码序列/开放阅读框/基因的启动子相当远的距离。
术语“包装蛋白”是指非AAV衍生的病毒和/或细胞功能,AAV依赖这些功能进行其复制。因此,该术语涵盖AAV复制所需的蛋白质和RNA,包括参与AAV基因转录的活化、阶段特异性AAV mRNA剪接、AAV DNA复制、Cap表达产物合成和AAV衣壳组装的部分。基于病毒的辅助功能可源自任何已知的辅助病毒,例如腺病毒、疱疹病毒(单纯疱疹病毒I型除外)和牛痘病毒。
如本文所用,“AAV包装蛋白”是指AAV衍生的序列,其反式作用于生产性AAV复制。因此,AAV包装蛋白由主要的AAV开放阅读框(ORF)、rep和cap进行编码。rep蛋白已被证明具有许多功能,其中包括:识别、结合以及切口DNA复制的AAV起始点;DNA解旋酶活性;以及调控来自AAV(或其他异源性)启动子的转录。cap(衣壳)蛋白提供必要的包装功能。本文所述的AAV包装蛋白用于补充AAV载体中缺失的反式AAV功能。
术语“PAM基序”表示前间区序列邻近基序;与前间区序列相邻的基序;序列NGG;在靶DNA中;靶DNA的切割发生在PAM之前的三个核苷酸。
“质粒”是一种核酸或多核苷酸形式,其通常具有用于表达(例如,转录、复制等)或繁殖(复制)质粒的附加元件。本文所用的质粒也可用于参考此类核酸或多核苷酸序列。因此,在所有方面中,本发明的组合物和方法适用于核酸、多核苷酸和质粒,例如用于生产产生病毒(例如,AAV)载体的细胞,以生产病毒(例如,AAV)颗粒,进而生产包含病毒(例如,AAV)颗粒等的细胞培养基。
如本文所用,术语“蛋白质化合物”表示包含至少一种多肽的异源多聚体分子,其已在哺乳动物细胞中以功能形式产生。示例性蛋白质化合物为腺相关病毒颗粒(AAV颗粒),其包含由衣壳多肽和单链DNA分子形成的衣壳,其为非多肽组分。
如本文所用,术语“重组细胞”表示最终基因修饰后的细胞,诸如,例如,表达目的多肽或生产rAAV颗粒,并可用于以任何规模生产该目的多肽或rAAV颗粒的细胞。例如,“包含外源核苷酸序列的哺乳动物细胞”已进行了重组酶介导的盒交换(RMCE),由此将用于目的多肽的编码序列导入宿主细胞的基因组中,即为“重组细胞”。尽管细胞仍能进行进一步的RMCE反应,但其并不欲进行。
“重组AAV载体”源自病毒(诸如AAV)的野生型基因组,通过使用分子生物学方法从病毒(例如AAV)中去除野生型基因组,将其以非天然核酸(例如转录成转录物或编码蛋白质的核酸)替代。通常,对于AAV,野生型AAV基因组的一个或两个反向末端重复(ITR)序列保留在重组AAV载体中。“重组”AAV载体与野生型病毒AAV基因组不同,因为病毒基因组的全部或部分已被相对于病毒基因组核酸的非天然(即异源)序列所替换。因此,将并入非天然序列的病毒载体(例如,AAV)定义为“重组”载体,其在AAV的情况下可称为“rAAV载体”。
重组载体(例如,AAV)序列可经包装(在本文中称为“颗粒”)以用于随后在离体、体外或体内感染细胞(转导)。当重组载体序列被封装或包装到AAV颗粒中时,该颗粒还可称为“rAAV”。此类颗粒包括封装或包装载体基因组的蛋白质。具体实例包括病毒包膜蛋白,在AAV的情况下,包括衣壳蛋白,诸如AAV VP1、VP2和VP3。
“重组识别位点”(RRS)是由重组酶识别的核苷酸序列,并且对于重组酶介导的重组事件是必要且充分的。RRS可用于定义核苷酸序列中发生重组事件的位置。
如本文所使用,术语“选择标记”表示一种基因,其允许携带该基因的细胞在对应的选择剂的存在下被特异性地选择或排除。例如,但并非限制性地,选择标记可允许以选择标记基因转化的宿主细胞在相应的选择剂存在下(选择性培养条件)被明确选择;未转化的宿主细胞将不能在选择性培养条件下生长或存活。选择标记可以为阳性、阴性或双功能选择标记。阳性选择标记可选择带有标记的细胞,而阴性选择标记则可以选择性排除带有标记的细胞。选择标记可导致药物抗性或补偿宿主细胞中的代谢或分解代谢缺陷。在原核细胞中,可使用导致对氨芐青霉素、四环素、卡那霉素或氯霉素抗性的基因。在真核细胞中用作选择标记的抗性基因包括但不限于氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418 APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷胺酰胺合成酶(GS)、天冬酰胺合成酶、色胺酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D)和编码对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、吉欧霉素(Zeocin)和霉酚酸的抗性的基因。更多标记基因描述于WO 92/08796和WO 94/28143中。
除了在对应的选择剂存在下促进选择外,选择标记另外可以为通常不存在于细胞中的分子,例如绿色荧光蛋白(GFP)、增强型GFP(eGFP)、合成GFP、黄色荧光蛋白(YFP)、增强型YFP(eYFP)、青色荧光蛋白(CFP)、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed-monomer、mOrange、mKO、mCitrine、Venus、YPet、Emerald、CyPet、mCFPm、Cerulean和T-Sapphire。表达此类分子的细胞可与不携带该基因的细胞区别,例如分别通过检测或不存在编码的多肽所发出的荧光。
如本文所用,术语“血清型”是基于不同血清学的AAV衣壳的区别。血清学独特性是根据抗体对一个AAV与另一个AAV之间缺乏交叉反应性来确定的。这种交叉反应性的差异通常是由于衣壳蛋白序列/抗原决定基的差异(例如,由于AAV血清型的VP1、VP2和/或VP3序列差异)。虽然包括衣壳变体的AAV变体可能在血清学上与参考AAV或其他AAV血清型没有差异,但与参考或其他AAV血清型相比,其有至少一个核苷酸或氨基酸残基不同。
在传统定义下,血清型代表目的病毒已针对所有现有的且特征化的血清型的特异性血清进行了中和活性测试,并且未发现中和目的病毒的抗体。随着发现更多天然病毒分离株和/或产生衣壳突变体,与目前现有的任何血清型可能存在或不存在血清学差异。因此,在新病毒(例如AAV)不具血清学差异的情况下,这种新病毒(例如AAV)为相应血清型的亚组或变体。在许多情况下,尚未对具有衣壳序列修饰的突变病毒进行中和活性的血清学测试以确定其是否属于根据传统血清型定义的另一种血清型。因此,为了方便以及避免重复,术语“血清型”泛指血清学上不同的病毒(例如AAV)以及血清学上不明显的病毒(例如AAV),其可以为在亚组内或给定血清型的变体。
术语“sgRNA”表示单一引导RNA;含有crRNA和tracerRNA的单一RNA链。
术语“TALEN”表示类转录活化因子效应物核酸酶。其为FokI切割域和源自TALE蛋白的DNA结合域的融合。TALE含有多个33-35个氨基酸重复域,每个域识别一个碱基对。与ZFN一样,TALEN诱导靶向DSB,活化DNA损伤反应途径来实现定制改变。
术语“tracrRNA”表示反式作用的CRISPR RNA;非编码RNA;与crRNA部分互补;形成RNA双链螺旋;促进crRNA加工;通过RNase III活化;结合靶DNA;核酸内切酶在结合位点附近作用切割;为通过CAS9活化RNA引导的切割所需的。
术语“转导”和“转染”是指将分子如核酸(病毒载体、质粒)导入至细胞中。当外源核酸已被导入至细胞膜内时,则细胞已被“转导”或“转染”。因此,“转导细胞”是“核酸”或“多核苷酸”已被导入其中的细胞,或其已导入外源核酸的子代。在特定实施例中,“转导”细胞(例如,在哺乳动物中,诸如细胞或组织或器官细胞)在并入外源分子例如核酸(例如转基因)后,具有基因变化。“转导”细胞可繁殖且转录导入的核酸和/或表达蛋白质。
在“转导”或“转染”细胞中,核酸(病毒载体、质粒)可以或可不整合到基因组核酸中。如果导入的核酸整合到受体细胞或生物体的核酸(基因组DNA)中,则其可在该细胞或生物体中稳定地维持,并进一步递送给受体细胞或生物体的子代细胞或生物体或由其遗传。最后,导入的核酸可存在于受体细胞或宿主生物体中的染色体外或仅瞬时地存在。有许多已知的技术,参见例如Graham等人,(1973)Virology,52:456;Sambrook等人,(1989)Molecular Cloning,a laboratory manual,Cold Spring Harbor Laboratories,NewYork;Davis等人,(1986)Basic Methods in Molecular Biology,Elsevier;和Chu等人,(1981)Gene13:197。此类技术可用于将一种或多种外源DNA部分导入到合适的宿主细胞。
如本文所用,术语“转基因”方便地指打算或已被导入到细胞或生物体的核酸。转基因包括任何核酸,例如被转录成转录物或其编码多肽或蛋白质的基因。
“载体”是指重组质粒序列的一部分,最终直接的或以单链或RNA的形式包装或封装,以形成病毒(例如AAV)颗粒。在重组质粒用于构建或制备重组病毒颗粒的情况下,病毒颗粒不包括未对应该重组质粒的载体序列的“质粒”部分。重组质粒的该非载体部分被称为“质粒骨架”,其对质粒的克隆和扩增很重要,其是繁殖和重组病毒生产所需的过程,但本身并不包装或封装到病毒(例如,AAV)颗粒中。因此,“载体”是指被病毒颗粒(例如,AAV)包装或封装的核酸。
术语“ZFN”表示锌指核酸酶。其为来自FokI限制内切核酸酶的非特异性DNA切割域与锌指蛋白的融合。ZFN二聚体诱导靶向DNA DSB,刺激DNA损伤反应途径。被设计的锌指结构域的结合特异性将ZFN引导到特定的基因组位点。
术语“ZF切口酶”表示锌指切口酶。这些ZFN在两个FokI切割域其中之一中包含失活突变。ZF切口酶仅使单链DNA断裂并且诱导HDR,而不会活化诱变NHEJ途径。
基因编辑方法
在过去的数十年里,已发展出能够在多种细胞类型和生物体中操纵几乎任何基因的方法。这种技术通常被称为“基因组编辑”。
核酸酶
进行基因组编辑的一种方法是基于使用被工程化的核酸酶。其由与非特异性DNA切割模块融合的序列特异性DNA结合域组成。这种嵌合核酸酶通过诱导靶向DNA双链断裂(DSB)来实现有效且精准的基因修饰,这些断裂刺激细胞DNA修复机制,包括易错非同源末端连接(NHEJ)和同源定向修复(HR)。这些方法的多功能性源自于定制化DNA结合域以识别几乎任何序列的能力。
因此,执行基因改变的能力在很大程度上取决于被设计的蛋白质的DNA结合特异性和亲和力(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
靶向核酸置换通过染色体核酸序列与外源供体核酸序列位点特异性核酸交换之间的同源重组而导入。进行定向基因改变通常称为“基因靶向”(参见,例如Carroll,D.,Genetics,188(2011)773-782)。
锌指核酸酶(ZFN)和类转录活化因子效应物核酸酶(TALEN)以及CRISPR/CAS代表用于靶向核酸替换的工具。成簇的规律间隔短回文重复序列(CRISPR)/基于CAS的RNA引导的DNA核酸内切酶依赖对DNA进行序列特异性修饰的crRNA和tracrRNA。存在三种类型的CRISPR/CAS系统。例如,在第II型系统中,CAS9作为RNA引导的DNA核酸内切酶,在crRNA-tracrRNA靶识别时切割DNA。
通过共同递送位点特异性核酸酶与带有基因座特异性同源臂的供体质粒,单一或多个转基因(即包含表达盒的外源核酸)可有效地整合到染色体靶基因座中。通过协调核酸酶介导的供体DNA裂解与染色体靶,已可经由NHEJ介导的接合将大型转基因(高达14kbps)导入至各种内源基因座中(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
如果提供双链DNA“供体模板”,则核酸酶诱导的DSB的HR可用于在断裂位点处或附近导入精确的核酸置换或插入高达7.6kbps。寡核苷酸可与ZFN一起使用,以导入精确的改变、小型插入和大型删除。ZFN已被用于导入NHEJ或HR介导的基因改变(Joung,J.K.和Sander,J.D.,Nat.Rev.Mol.Cell Biol.14(2013)49-55)。
通常,核酸酶编码基因通过质粒DNA、病毒载体或活体外转录的mRNA递送到细胞中。可通过电穿孔或基于阳离子脂质的试剂进行质粒DNA或mRNA的转染。整合酶缺陷型慢病毒载体(IDLV)可用于将核酸酶递送到抗转染细胞类型中。AAV还可用于递送核酸酶。
锌指核酸酶(ZFN)
锌指核酸酶将FokI内切核酸酶的非特异性切割结构域(N)与锌指蛋白(ZFP)结合,提供一种在基因组中导入位点特异性双链断裂(DSB)的一般方法。
锌指(ZF)基序的模块化结构和ZF域的模块化识别使其成为用于设计人工DNA结合蛋白的多功能性DNA识别基序。每个ZF基序由大约30个氨基酸组成并折叠成ββa结构,该结构通过由保守的Cys2His2残基螯合锌离子来稳定。ZF基序通过将a螺旋插入至DNA双螺旋的大沟中来结合DNA。每个指主要与DNA底物内的三联体结合。相对于每个ZF基序的a-螺旋起点的位置-1、+1、+2、+3、+4、+5和+6处的关键氨基酸残基负责与DNA位点的大部分序列特异性交互作用。可改变这些氨基酸,同时将剩余的氨基酸保持为共有骨架,以生成具有不同三联体序列特异性的ZF基序。通过串联连接数个这些ZF基序以形成ZFP,可实现与较长DNA序列的结合。被设计的ZFP提供一种强大技术,因其他功能如非特异性FokI切割域(N)、转录活化域(A)、转录抑制域(R)和甲基化酶(M)可分别与ZFP融合以形成ZFN,锌指转录活化因子(ZFA)、锌指转录抑制因子(ZFR)和锌指甲基化酶(ZFM)。
FokI限制性内切酶为一种细菌型IIS限制性核酸内切酶,其识别双链DNA中的非回文五脱氧核糖核苷酸5'-GGATG-3':5'-CATCC-3'(SEQ ID NO:27)并切割识别位点下游9/13nt。Durai等人建议可将FokI识别域与其他天然存在的DNA结合蛋白交换,该DNA结合蛋白识别较长的DNA序列或其他被设计的DNA结合基序以创建嵌合核酸酶(Durai,S.等人,Nucl.Acids Res.33(2005)5978-5990)。
FokI核酸酶起到二聚体的作用,因此必须针对每个靶位点设计两个锌指阵列。使用必要的异二聚体FokI结构域减少不需要的同二聚物种的形成,因此具有改良的特异性(Joung,J.K.和Sander,J.D.,Nat.Rev.Mol.Cell Biol.14(2013)49-55)。因此,ZFN靶位点由被FokI切割域识别的5至7bp间隔序列所隔开的两个锌指结合位点组成(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
类转录活化因子效应物核酸酶(TALEN)
将植物病原性黄单胞菌属(Xanthomonas spp.)的类转录活化因子(TAL)效应物与FokI核酸酶融合可得TALEN。其成对地结合并切割DNA。结合特异性由TAL效应物中多态性氨基酸重复序列的可定制阵列来决定。
TAL效应物(TALE)进入细胞核,结合至宿主基因启动子中的效应物特异性序列,并活化转录。其靶向特异性由串联的中心结构域来决定,串联的中心结构域为33-35个氨基酸重复序列,然后为20个氨基酸的单一截短重复序列。自然存在的识别位点之前有TAL效应物活性所需的T(Cermak,T.等人,Nucl.Acids Res.39(2011)e82)。
TALE特异性由被称为重复序列可变双残基(RVD)的两个高度变异氨基酸来决定。与锌指一样,模块化TALE重复序列是连接在一起,以识别连续的DNA序列(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
TAL效应物可与FokI核酸酶的催化结构域融合,以在活体内产生用于基因组编辑的靶向DNA双链断裂(DSB)。由于FokI裂解为二聚体,因此这些TAL效应物核酸酶(TALEN)成对地起作用,结合跨间隔子的相反的靶标,其中FokI结构域在间隔子上聚集在一起以产生断裂。几乎所有细胞中的DSB都通过两个高度保守的过程中的一者进行修复,即非同源末端连接(NHEJ)和同源重组(HR),其可用于基因插入或替换。
TALEN或TAL效应物构建体的组装涉及两个步骤:(i)将重复模块组装成1-10个重复序列的中间阵列以及(ii)将中间阵列连接到骨架中以制备最终构建体(Cermak,T.等人,Nucl.Acids Res.39(2011)e82)。
TALEN靶位点由具不同长度(12-20bp)的间隔序列所隔开的两个TALE结合位点组成(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
对于典型的异二聚体靶位点(即,通常出现在天然DNA序列中),将配对的TALEN构建体一起转染到靶细胞中。
使用合适的限制内切核酸酶将针对靶核酸的一对TALEN中的一者次克隆到哺乳动物表达质粒中。按照制造商的方案,使用LipofectAmine 2000(Invitrogen)通过转染将所得质粒导入至靶细胞。转染后72小时收集细胞(Cermak,T.等人,Nucl.Acids Res.39(2011)e82)。
成簇的规律间隔短回文重复序列(CRISPR)/CRISPR相关蛋白9(CRISPR/CAS9)
天然存在的CRISPR/CAS II型系统已发展成为针对真核细胞的强大基因编辑工具。特别是证明crRNA和tracrRNA可组合成单一引导RNA(sgRNA)为此发展铺路。Cas9在DNA中产生单一双链断裂。该方法利用在真核细胞中的DNA修复途径,提供两种进行基因改变的方法。第一种依赖于非同源末端连接(NHEJ),其连接切割端。在第二种方法中,同源定向修复(HDR)是用于使用与另一段与靶具有同源性的DNA来修复受损的等位基因。通过提供可通过重组插入的DNA元件,可实现任何类型的插入、缺失或序列改变(Rath,D.等人,Biochim.117(2015)119-128)。
在第II型CRISPR/CAS系统中,外来DNA的短片段(称为“间隔子”)被整合到CRISPR基因组基因座内,并且转录并加工成短CRISPR RNA(crRNA)。这些crRNA与反式活化的crRNA(tracrRNA)重组,并且通过CAS蛋白引导病原性DNA的序列特异性切割和静默。已显示,Cas9蛋白的靶识别需要crRNA内的“种子”序列和crRNA结合区上游的保守的含有二核苷酸的前间区序列邻近基序(PAM)序列。CRISPR/CAS系统已被证明可通过共同递送表达Cas9内切核酸酶和必要的crRNA组分的质粒来直接移至人细胞中(Gaj,T.等人,Trends Biotechnol.31(2013)397-405)。
重组细胞系生成
通常,对于有效且大规模生产目的蛋白质化合物(例如对于rAAV颗粒或治疗性多肽),需要稳定表达并且还分泌该蛋白质化合物(如果可能)的细胞。这种细胞被称为“重组细胞”或“重组生产细胞”。产生这种重组细胞的过程称为“细胞系开发”(CLD)。
在第一步骤中,用编码目的蛋白质化合物的所需核酸序列转染合适的宿主细胞。可能需要转染额外的辅助多肽。在第二步骤中,选择稳定表达目的蛋白质化合物的细胞。这可以例如基于共表达选择标记的来实现,该选择标记已与编码目的蛋白质化合物的核酸序列共转染,或者为蛋白质化合物本身的表达。
为表达编码序列(即开放阅读框),需要额外的调控元件,诸如启动子和多聚腺苷酸化信号(序列)。因此,开放阅读框可操作地连接至额外的转录调控元件。这可通过将其整合到所谓的表达盒中来实现。使表达盒在哺乳动物细胞中具有功能所需的最小调控元件为在该哺乳动物细胞中具有功能的启动子,其位于开放阅读框的上游(即5'),以及在该哺乳动物细胞中具有功能的多聚腺苷酸化信号序列,其位于开放阅读框的下游(即3')。此外,终止序列可能存在于多聚腺苷酸化信号(序列)的3'端。为实现表达,启动子、开放阅读框/编码区和多聚腺苷酸化信号序列须以可操作地连接的形式排列。
同样地,被转录成非蛋白质编码RNA的核酸称为“RNA基因”。对于RNA基因的表达,还需要额外的调控元件,诸如启动子和转录终止信号或多聚腺苷酸化信号(序列)。这些元件的性质和定位取决于旨在驱动RNA基因的表达的RNA聚合酶。因此,RNA基因通常也被整合到表达盒中。
如果目的蛋白质化合物是由不同(单体)多肽组成的异源多聚体多肽,则不仅需要单一表达盒,而且还需要每个不同多肽的一个表达盒,即开放阅读框/编码序列,以及RNA基因(如果存在)。这些表达盒至少在含有的开放阅读框/编码序列方面不同,但在启动子和/或多聚腺苷酸化信号序列方面也可能不同。
例如,如果目的蛋白质化合物为全长抗体(其是包含两个轻链拷贝和两个重链拷贝的异源多聚体多肽),则需要两种不同的表达盒,一种用于轻链而一种用于重链。例如,如果全长抗体为双特异性抗体(即,包含特异性结合至两种不同抗原的两种不同结合位点的抗体),则每条轻链和每条重链也彼此不同。因此,双特异性全长抗体由四种不同的多肽组成,因此需要包含编码四种不同多肽的四种不同开放阅读框的四种表达盒。
如果目的蛋白质化合物为AAV颗粒(它由不同的(单体)多肽和单链DNA分子组成,并且还需要其他辅助因子来生产和封装),则需要许多表达盒,其包含的开放阅读框/编码序列是不同的。在这种情况下,至少需要用于所需辅助功能以及VA RNA的每个转基因的表达盒,形成AAV载体的衣壳的不同多肽。因此,每个辅助E1A、E1B、E2A、E4orf6、VA RNA、rep和cap基因都需要单独的表达盒。
如前几段所述,目的蛋白质化合物越复杂或所需的额外辅助多肽和/或RNA的数量分别越多,则所需的不同表达盒的数量就越多。本质上随着表达盒的数量增加,整合到宿主细胞基因组中的核酸的大小也会增加。然而,可转移的核酸大小实际上有上限,其为约15kbps(千碱基对)的范围。超过这个限度,处理和加工效率将大幅降低。这个问题可通过使用两个或多个分开的核酸来解决。因此,不同的表达盒被分配给不同的核酸,由此每个核酸仅包含一些表达盒。
对于细胞系开发,可使用携带目的蛋白质化合物的表达盒的核酸的随机整合(RI)。通常,通过使用RI,核酸或其片段会随机整合到宿主细胞的基因组中。
或者,对于RI,靶向整合(TI)可用于CLD。在TI CLD中,一种或多种包含不同表达盒的核酸被导入至宿主细胞基因组中的预定基因座。
在TI中,同源重组或重组酶介导的盒交换反应(RMCE)可用于将包含对应表达盒的核酸(a)整合到TI宿主细胞基因组中的特定基因座中。
在某些实施例中,提供一种将单一脱氧核糖核酸靶向整合到(宿主)哺乳动物细胞的基因组中的方法(即一种用于产生重组哺乳动物细胞的方法),该细胞其后包含编码蛋白质化合物的核酸并且其后产生该蛋白质化合物,该方法包括以下步骤:
a)提供哺乳动物细胞,其包含整合在该哺乳动物细胞基因组的基因座内的给定(任选地单一)位点的外源核苷酸序列,其中该外源核苷酸序列包含位于至少一个第一选择标记侧翼的第一重组序列和第二重组序列,其中所有重组序列都不相同或/和不相容(即,其不会造成交叉交换反应);
b)将a)中提供的包含两种不同重组序列和一到八种表达盒的脱氧核糖核酸导入至该哺乳动物细胞,其中
该脱氧核糖核酸以5'-至3'-方向(按以下顺序)包含:
-第一重组序列,
-一到八个表达盒,其中一种表达盒编码一个第二选择标记,和
-第二重组序列,
其中该脱氧核糖核酸的该第一重组序列和该第二重组序列与整合的外源核苷酸序列上的该第一重组序列和该第二重组序列相匹配;
c)任选地在步骤b)中获得的该哺乳动物细胞中导入或活化对该第一重组序列和第二重组序列具有功能的重组酶(使处于该第一重组序列与第二重组序列之间的该外源核苷酸序列的部分与处于该第一重组序列与第二重组序列之间的该脱氧核糖核酸酸的部分进行交换,从而将后者整合到该哺乳动物细胞的基因组中);
d)任选地选择表达该第二选择标记并且产生由导入的脱氧核糖核酸所编码的该蛋白质化合物的细胞,
从而产生包含编码蛋白质化合物的核酸并且产生该蛋白质化合物的重组哺乳动物细胞。
在某些实施例中,提供一种将两种氧核糖核酸同时靶向整合到(宿主)哺乳动物细胞的基因组中的方法(即一种用于产生重组哺乳动物细胞的方法),该细胞包含编码蛋白质化合物的核酸并且其任选地表达该蛋白质化合物,该方法包括以下步骤:
a)提供哺乳动物细胞,其包含整合在该哺乳动物细胞基因组的基因座内的给定(任选地单一)位点的外源核苷酸序列,其中该外源核苷酸序列包含位于至少一个第一选择标记侧翼的第一重组序列和第二重组序列,以及位于该第一重组序列与该第二重组序列之间的第三重组序列,并且所有重组序列都不相同或/和不相容(即,其不会造成交叉交换反应);
b)将a)中提供的包含三种不同重组序列和一到八种表达盒的脱氧核糖核酸导入至该细胞,其中,
该第一脱氧核糖核酸以5'-至3'-方向(按以下顺序)包含:
-第一重组序列,
-一种或多种(在一个优选实施例中,多达四种)表达盒,
-编码一种第二选择标记的表达盒的5'-末端部分,和
-第三重组序列的第一拷贝,
并且
该第二脱氧核糖核酸以5'-至3'-方向(按以下顺序)包含:
-该第三重组序列的第二拷贝,
-编码该第二选择标记的表达盒的3'-末端部分,
-一种或多种(在一个优选实施例中,多达四种)表达盒,和
-第二重组序列,
其中该第一脱氧核糖核酸和第二脱氧核糖核酸的该第一重组序列至第三重组序列与整合的外源核苷酸序列上的该第一重组序列至第三重组序列相匹配,
其中编码该第二选择标记的表达盒的5'-末端部分和3'-末端部分一起形成该第二选择标记的功能性表达盒;
c)任选地在步骤b)中获得的该哺乳动物细胞中导入或活化对该第一重组序列、第二重组序列和第三重组序列具有功能的重组酶(使处于该第一重组序列与第三重组序列之间的该外源核苷酸序列的部分和处于该第三重组序列与第二重组序列之间的部分与处于该第一重组序列与第三重组序列以及该第三重组序列与第二重组序列之间的该脱氧核糖核酸酸的部分进行交换,从而将后者整合到该哺乳动物细胞的基因组中);
d)任选地选择表达该第二选择标记并且任选地产生由导入的脱氧核糖核酸所编码的该蛋白质产物的细胞,
从而产生包含编码该蛋白质化合物的核酸的重组哺乳动物细胞。
为增加选择压力,第一选择标记为负选择标记,例如在某些实施例中,为来自单纯疱疹病毒的胸苷激酶(使细胞对胸苷类似物敏感,例如5-碘-2'-氟-2'-脱氧-1-β-D-阿拉伯-呋喃糖尿嘧啶(FIAU)或更昔洛韦(ganciclovir))或来自白喉棒状杆菌的白喉毒素片段A(通过抑制蛋白质合成引起毒性;例如通过白喉毒素A片段基因的由磷酸甘油酸激酶启动子(PGK)驱动的表达)。在交换导入的脱氧核糖核酸的期间,去除负选择标记。这允许区分出正确的靶向整合和不正确的随机整合。
在所有方面和实施例的某些实施例中,每个表达盒以5'-至3'-方向包含启动子、开放阅读框/编码序列或RNA基因和多聚腺苷酸化信号序列和/或终止序列。在某些实施例中,开放阅读框编码多肽,并且表达盒包含具有或不具有额外的终止序列的多聚腺苷酸化信号序列。在某些实施例中,表达盒包含RNA基因,启动子为第2型Pol III启动子并且存在多聚腺苷酸化信号序列或polyU终止子。参见,例如,Song等人,Biochemical andBiophysical Research Communications 323(2004)573–578。在某些实施例中,表达盒包含RNA基因,启动子为第2型Pol III启动子和polyU终止序列。
在所有方面和实施例的某些实施例中,开放阅读框编码多肽,启动子为具有或不具有内含子A的人CMV启动子,多聚腺苷酸化信号序列为bGH(牛生长激素)polyA信号序列并且终止子为hGT(人胃泌素终止子)。
在所有方面和实施例的某些实施例中,启动子为具有内含子A的人CMV启动子,多聚腺苷酸化信号序列为bGH多聚腺苷酸化信号序列并且终止子为hGT,除了RNA基因的表达盒和选择标记的表达盒,其中对于选择标记,启动子为SV40启动子,并且多聚腺苷酸化信号序列为SV40多聚腺苷酸化信号序列,并且不存在终止子,并且其中对于RNA基因,启动子为野生型第2型聚合酶III启动子并且终止子为聚合酶II或III终止子。
在所有先前方面和实施例的某些实施例中,人CMV启动子具有SEQ ID NO:28的序列。在某些实施例中,人CMV启动子具有SEQ ID NO:29的序列。在某些实施例中,人CMV启动子具有SEQ ID NO:30的序列。
在所有先前方面和实施例的某些实施例中,bGH多聚腺苷酸化信号序列为SEQ IDNO:31。
在所有先前方面和实施例的某些实施例中,hGT具有SEQ ID NO:32的序列。
在所有先前方面和实施例的某些实施例中,SV40启动子具有SEQ ID NO:33的序列。
在所有先前方面和实施例的某些实施例中,SV40多聚腺苷酸化信号序列为SEQ IDNO:34。
须指出,本发明不涵盖包含腺病毒基因功能E1A和E1B的核酸序列和伴随的SV40大T抗原或艾司坦-巴尔病毒(EBV)核抗原1(EBNA-1)的核酸序列的永久性人细胞系。
同源重组
在某些实施例中,靶向整合由同源重组介导。
通过同源重组的靶向整合是本领域的成熟技术。例如,30多年以来,同源重组已被用于以位点特异性方式在鼠胚胎干细胞中导入特定的基因修饰(Doetschman,T.等人,Nature 330(1987)576-578;Thomas,K.R.和Capecchi,M.R.,Cell 51(1987)503-512;Thompson,S.等人,Cell 56(1989)313-321;Zijlstra,M.等人,Nature 342(1989)435-438;Bouabe,H.和Okkenhaug,K.,Meth.Mol.Biol.1064(2013)315-336)。
在使用同源重组进行靶向整合的情况下,重组序列为与外源核酸序列同源的序列,被称为“同源臂”。在这种情况下,导入宿主细胞的脱氧核糖核酸包含作为第一重组序列的与外源核酸序列(即安放位点)的5'(上游)序列同源的序列,和作为第二重组序列的与外源核酸序列的3'(下游)序列同源的序列。通常,靶向整合频率随着同源臂的长度及同基因性而增加。理想情况下,同源臂源自从对应宿主细胞所制备的基因组DNA。
核酸酶
在某些实施例中,靶向整合是通过位点特异性核酸酶介导的同源重组。
在某些实施例中,位点特异性核酸酶是选自锌指核酸酶(ZFN)、类转录活化因子效应物核酸酶(TALEN)和成簇的规律间隔短回文重复序列(CRISPR)/CRISPR相关蛋白9核酸酶(Cas9)系统。
核酸酶编码基因通过质粒DNA、病毒载体或活体外转录的mRNA递送到细胞中。可通过电穿孔或基于阳离子脂质的试剂进行质粒DNA或mRNA的转染。整合酶缺陷型慢病毒载体可用于将核酸酶递送到抗转染细胞类型中。AAV载体还可用于核酸酶递送。
重组酶
重组系统,如Cre/LoxP或Flp/FRT,可用于交换不同核酸分子之间的部分核酸序列,从核酸分子中切除核酸片段或反转在核酸分子内部的部分。使用单一开/关事件,重组酶作用的结果可是永久性的,其可持续一段给定但有限的时间,并且其可对特定的细胞类型或组织进行调整。
Flp重组酶
Flp/FRT位点特异性重组系统涉及通过重组酶翻转酶(Flp)对翻转酶识别靶(FRT)位点之间的序列进行重组。翻转酶源自酿酒酵母(Saccharomyces cerevisiae)。Flp的序列可例如自UniProt P03870获取。34bp FRT位点具有GAAGTTCCTATTCtctagaaaGAATAGGAACTTC(SEQ ID NO:36;中心间隔子为小写字母)的序列,其中Flp重组酶与位于8bp中央间隔序列的侧翼的GAAGTTCCTATTC(顺向SEQ ID NO:37;逆向SEQ ID NO:38)的反向13bp重复序列结合。
示例性FRT位点显示在下表中(参见Branda和Dymecki,Dev.Cell 6(2004)7-28):
名称 间隔序列 SEQ ID NO:
野生型 TCTAGAAA 39
F3 TTCAAATA 40
F5 TTCAAAAG 41
Cre重组酶
Cre/LoxP位点特异性重组体系已广泛用于许多生物学实验系统中。Cre重组酶是一种38kDa位点特异性DNA重组酶,其可识别34bp LoxP序列。Cre重组酶源自噬菌体P1,并且属于酪氨酸家族位点特异性重组酶。Cre重组酶可以介导LoxP序列之间的分子内和分子间重组。标准LoxP序列由侧翼为两个13bp的反向重复序列的8bp非回文间隔序列组成。Cre重组酶与13bp重复序列结合,从而介导8bp间隔序列内的重组。Cre-LoxP介导的重组高效发生,并且无需其他宿主因子。如果将两个LoxP序列以相同的方向置于同一核苷酸序列上,则Cre重组酶介导的重组将切除位于两个LoxP序列之间的-DNA序列,使其成为共价闭合环。如果将两个LoxP序列以彼此反向/互逆方向置于同一核苷酸序列上,则Cre重组酶介导的重组将反转位于两个LoxP序列之间的DNA序列的方向。如果两个LoxP序列位于两个不同DNA分子上,并且如果一个DNA分子是环状,则Cre重组酶介导的重组将导致环状DNA序列的整合。
Cre重组酶可用任何已知的方法导入细胞或在细胞内活化。例如,使用基于脂质粒的基因递送(WO 93/24640;Mannino和Gould-Fogerite,BioTechniques6(1988)682-691;US5,279,833;WO 91/06309;Feigner等人,Proc.Scil.Nat.USA 84(9871)7413-7414),或病毒载体,诸如乳头状瘤病毒、逆转录病毒和腺相关病毒载体(例如,Berns等,Ann.NYAcad.Sci.772(1995)95-104;Ali等人,Gene Ther.1(1994)367-384;Haddada等人,Curr.Top.Microbiol.Immunol.199(1995)297-306;Buchscher等人,J.Virol.66(1992)2731-2739;Johann等人,J.Virol.66(1992)1635-1640;Sommerfelt等人,Virol.176(1990)58-59;Wilson等人,J.Virol.63(1989)2374-2378;Miller等人,J.Virol.65(1991)2220-2224;WO 94/26877;Rosenburg和Fauci,Fundamental Immunology,Third Edition Paul(ed.)Raven Press,Ltd.,New York(1993)和其中的参考文献;West等人,Virology 160(1987)38-47;US 4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5(1994)793-801;Muzyczka,J.Clin.Invest.94(1994)1351;US 5,173,414;Tratschin等人,Mol.Cell.Biol.5(1985)3251-3260;Tratschin等人,Mol.Cell.Biol.4(1984)2072-2081;Hermonat和Muzyczka,Proc.Natl.Acad.Sci.USA 81(1984)6466-6470;Samulski等人,J.Virol.63(1989)3822-3828)。
例如,Li,X.等人已描述了一种表达Cre重组酶的血清型2的重组AAV载体(PLOSONE 7(2012)e50063)和Scammell,E.等人(J.Neurosci.23(2003)5762–5770)。使用这种rAAV-Cre可诱导靶LoxP位点的非常完整的重组。对于基于rAAV载体的递送,另见Muzyczka,Curr.Top.Microbiol.Immunol.158(1992)97-129;US 4,797,368;WO 91/18088;Samulski,Current Opinion in Genetic and Development 3(1993)74-80。
例如,可使用Cre重组酶表达质粒。
例如,可使用Cre重组酶编码mRNA。
许多功能性LoxP位点为已知的,诸如,例如,Lox511、Lox66、Lox11、Lox76、Lox75、Lox43、Lox44(参见,例如Hoess,R.等人,Nucl.Acids Res.14(1986)2287-2300;Albert,H.等人,Plant J.7(1995)649-659)。
例如,如果使用Cre重组酶,则要交换的序列由基因组中以及供体核酸中的两个LoxP位点的位置来定义。这些LoxP位点由Cre重组酶识别。无须其他要件,即无需ATP等。
Cre/LoxP系统在不同的细胞类型中运行,如哺乳动物、植物、细菌和酵母菌。
使用重组酶的靶向整合
在某些实施例中,通过重组酶介导的盒交换反应(RMCE)进行靶向整合。
RMCE为一种酶促过程,其中基因组中整合位点处的序列被交换成供体核酸。任何重组酶均可用于该过程,诸如Cre重组酶、Flp重组酶、Bxb1整合酶、pSR1重组酶或
Figure BDA0004166468400000491
整合酶。
一种特定的TI方法为双重组酶介导的盒交换(双RMCE)。
双RMCE是一种生产重组哺乳动物细胞的方法,该细胞包含编码目的蛋白质化合物的脱氧核糖核酸,通过重组酶介导将两种核酸序列导入至宿主细胞基因组的单一基因座。整合后,两个核酸序列彼此可操作地连接。
例如,但并非限制性地,整合的外源核苷酸序列(即TI安放位点)可包含两个重组识别位点(RRS),而(供体)核酸序列包含与整合的外源核苷酸序列上的RRS相匹配的两个RRS。这种单质粒RMCE策略允许通过在一对RRS之间的相应序列中并入适当数量的表达盒以导入多个开放阅读框。
例如,但并非限制性地,整合的外源核苷酸序列(即,TI安放点)可包含三个重组识别位点(RRS),例如第三RRS(“RRS3”)存在于第一RRS(“RRS1”)与第二RRS(“RRS2”)之间的排列方式,而第一(供体)核酸包含两个RRS,这两个RRS与整合的外源核苷酸序列上的第一RRS和第三RRS相匹配,并且第二(供体)核酸包含两个RRS,这两个RRS与整合的外源核苷酸序列上的第三RRS和第二RRS相匹配。这种双RMCE策略允许通过在每对RRS之间的相应序列中并入适当数量的表达盒以导入多种基因。
此外,双质粒RMCE中需要两个选择标记。一个选择标记表达盒被分割成两部分。第一(前)核酸可含有启动子,接着是翻译起始密码子和RRS3序列。第二(后)核酸对应地包含与选择标记编码序列的N端融合的RRS3序列,减去翻译起始密码子(例如ATG)。可能需要在RRS3位点与选择标记编码序列之间插入额外的核苷酸,以确保融合基因的框翻译,即,可操作的连接。只有当两个核酸(前和后)都被正确地插入时,才会组装选择标记的完整表达盒,因此使细胞对各自的选择剂产生抗性。
单一载体和双载体RMCE均通过使存在于供体DNA上的DNA序列与整合位点所在的哺乳动物细胞基因组上的DNA序列精确交换,允许将一个或多个供体DNA分子整合到哺乳动物细胞基因组的预定位点中。这些DNA序列的特征在于两个异源特异性RRS,位于i)至少一个选择标记或如在某些双质粒RMCE中的“分割选择标记”的侧翼;和/或ii)至少一个目的外源基因。
RMCE参与在靶基因组基因座内两个异源特异性RRS与供体DNA分子之间的重组酶催化的双重重组交换事件。双RMCE被设计成将来自前和后核酸的DNA序列拷贝导入哺乳动物细胞基因组的预定基因座。RMCE程序可用多个DNA序列重复。
在某些实施例中,靶向整合是通过双RMCE来实现的,其中两种不同的DNA序列都整合到适合TI的哺乳动物细胞的基因组的预定位点中,这两个不同的DNA序列各自包含至少一个表达盒,该表达盒编码目的蛋白化合物的一部分和/或至少一个选择标记或其部分,侧翼为两个异源特异性RRS。在某些实施例中,靶向整合是通过多重RMCE来实现的,其中来自多个核酸的DNA序列都整合到适合TI的哺乳动物细胞的基因组的预定位点中,该多个核酸编码各自包含至少一个表达盒,该表达盒编码目的蛋白化合物的一部分和/或至少一个选择标记或其部分,侧翼为两个异源特异性RRS。在某些实施例中,选择标记可被部分地在第一核酸(前)上编码,以及被部分地在第二核酸(后)上编码,从而只有通过双RMCE正确整合这两个核酸才能表达选择标记。
对于单RMCE和双RMCE,如上所述的将供体核酸靶向整合到受体/靶细胞基因组中的方法和将两种供体核酸同时靶向整合到受体/靶细胞基因组中的方法包括导入/活化重组酶的额外步骤。
因此,在某些实施例中,重组序列为重组识别序列,并且该方法进一步包括以下步骤:
c)导入或活化
i)或者同时地导入b)的脱氧核糖核酸;或者
ii)此后依序地
重组酶,
其中该重组酶识别第一脱氧核糖核酸和第二脱氧核糖核酸的重组识别序列;(并且任选地,其中一个或多个重组酶进行重组酶介导的盒交换)。
在某些实施例中,RRS选自由以下组成的组:LoxP序列、L3序列、2L序列、LoxFas序列、Lox511序列、Lox2272序列、Lox2372序列、Lox5171序列、Loxm2序列、Lox71序列、Lox66序列、FRT序列、F3序列、F5序列、Bxb1 attP序列、Bxb1 attB序列、
Figure BDA0004166468400000511
attP序列和/>
Figure BDA0004166468400000516
attB序列。如果必须存在多个RRS,则在选择不同RRS的情况下,每个序列的选择取决于另一个。
在某些实施例中,RRS可由Cre重组酶识别。在某些实施例中,RRS可由Flp重组酶识别。在某些实施例中,RRS可由Bxb1整合酶识别。在某些实施例中,RRS可由
Figure BDA0004166468400000512
整合酶识别。在某些实施例中,RRS可由pSR1重组酶识别。
在某些实施例中,当RRS为LoxP位点时,细胞需要Cre重组酶进行重组。
在某些实施例中,当RRS为FRT位点时,细胞需要Flp重组酶进行重组。
在某些实施例中,当RRS为Bxb1 attP位点或Bxb1 attB位点时,细胞需要Bxb1整合酶进行重组。
在某些实施例中,当RRS为
Figure BDA0004166468400000513
attP位点或/>
Figure BDA0004166468400000514
attB位点时,细胞需要/>
Figure BDA0004166468400000515
整合酶进行重组。
在某些实施例中,当RRS为鲁氏接合酵母(Zygosaccharomyces rouxii)的pSR1重组酶的识别位点时,细胞需要pSR1重组酶进行重组。
重组酶编码基因可以DNA、病毒载体或mRNA的形式递送到细胞中。可通过电穿孔或基于阳离子脂质的试剂进行DNA或mRNA的转染。整合酶缺陷型慢病毒载体可用于将重组酶递送到抗转染细胞类型中。AAV载体还可用于重组酶递送。重组酶蛋白还可通过非囊泡的方式导入。
在所有方面和实施例的某些实施例中,重组酶作为mRNA导入至细胞中。
在所有方面和实施例的某些实施例中,重组酶作为DNA导入至宿主细胞中。在某些实施例中,DNA为包含在表达盒中的重组酶编码序列。
在所有方面和实施例的某些实施例中,重组酶为Cre重组酶并且将Cre重组酶作为Cre重组酶编码mRNA导入至细胞中,该mRNA编码具有SEQ ID NO:07的氨基酸序列的多肽。
在所有方面和实施例的某些实施例中,Cre重组酶mRNA编码包含SEQ ID NO:07的氨基酸序列的多肽并且进一步在其N-或C-端或两者处包含核定位序列。在某些实施例中,Cre重组酶mRNA编码具有SEQ ID NO:07的氨基酸序列的多肽并且进一步在其N-或C-端或两者处彼此独立地包含一个到五个核定位序列。
在所有方面和实施例的某些实施例中,Cre重组酶编码mRNA包含SEQ ID NO:08的核苷酸序列或其具有不同密码子用法的变体。在所有方面和实施例的某些实施例中,Cre重组酶编码mRNA包含SEQ ID NO:08的核苷酸序列或其具有不同密码子用法的变体,并且进一步在其5'-或3'-端或两者处包含编码核定位序列的其他核酸。在所有方面和实施例的某些实施例中,Cre重组酶编码mRNA包含SEQ ID NO:08的核苷酸序列或其具有不同密码子用法的变体,并且进一步在其5'-或3'-端或两者处独立地包含一个到五个编码核定位序列的核酸。
在某些实施例中,LoxP序列为野生型LoxP序列。在某些实施例中,LoxP序列为突变型LoxP序列。已开发出突变型LoxP序列以提高Cre重组酶所介导的整合或置换的效率。在某些实施例中,突变型LoxP序列选自由以下组成的组:L3序列、2L序列、LoxFas序列、Lox511序列、Lox2272序列、Lox2372序列、Lox5171序列、Loxm2序列、Lox71序列和Lox66序列。例如,Lox71序列在左侧13bp重复序列中具有5bp的突变。Lox66序列在右侧13bp重复序列中具有5bp的突变。野生型和突变型LoxP序列都可介导Cre重组酶依赖性重组。
术语“匹配RRS”表示两个匹配RRS之间发生重组。在某些实施例中,两个匹配RRS相同。在某些实施例中,两个RRS都为野生型LoxP序列。在某些实施例中,两个RRS都为突变型LoxP序列。在某些实施例中,两个RRS都为野生型FRT序列。在某些实施例中,两个RRS都为突变型FRT序列。在某些实施例中,两个匹配RRS为不同序列,但是可通过相同的重组酶进行识别。在某些实施例中,第一匹配RRS为Lox71序列,并且第二匹配RRS为Lox66序列。在某些实施例中,第一匹配RRS为Bxb1 attP序列,并且第二匹配RRS为Bxb1 attB序列。在某些实施例中,第一匹配RRS为
Figure BDA0004166468400000531
attB序列,并且第二匹配RRS为/>
Figure BDA0004166468400000532
attB序列。
在所有方面和实施例的某些实施例中,双RMCE中的重组识别位点为L3、2L和LoxFas。在某些实施例中,L3包含作为间隔序列的SEQ ID NO:17的序列,2L包含作为间隔序列的SEQ ID NO:18的序列并且LoxFas包含作为间隔序列的SEQ ID NO:19的序列。在某些实施例中,第一重组识别位点为L3,第二重组识别位点为2L,并且第三重组识别位点为LoxFas。
在所有方面和实施例的某些实施例中,编码选择标记的表达盒部分地位于第三重组识别序列的5'并且部分地位于3',其中所述表达盒的位于5'的部分包含启动子和转录起始密码子,并且所述表达盒的位于3'的部分包含不具转录起始密码子的编码序列和polyA信号序列。
在所有方面和实施例的某些实施例中,编码选择标记的表达盒的位于5'的部分包含可操作地连接至翻译起始密码子的启动子序列,由此启动子序列的上游侧翼分别为第二、第三或第四表达盒(即位于其下游),表达盒和起始密码子的下游侧翼为第三重组识别序列(即位于其上游);并且编码选择标记的表达盒的位于3'的部分包含核酸,该核酸编码缺乏转录起始密码子的选择标记,其上游侧翼为第三重组识别序列并且下游侧翼为polyA信号序列,并且接下来分别为第三、第四或第五表达盒。
包含如本文所述的外源核酸(“安放位点”)并且适用于靶向整合的任何已知或未来的哺乳动物细胞均可用于本发明。
在所有方面和实施例的一个优选实施例中,包含整合在哺乳动物细胞基因组的基因座内的单一位点的外源核苷酸序列的哺乳动物细胞为仓鼠细胞或人细胞,在某些实施例中是CHO细胞。
适用于本发明的包含整合在其基因组的基因座内的单一位点的外源核苷酸序列的示例性哺乳动物细胞为CHO细胞或HEK293细胞,或具有安放位点(=整合在哺乳动物细胞基因组的基因座内的单一位点的外源性核苷酸序列)的Per.C6细胞,该安放位点包含三个用于Cre重组酶介导的盒交换的异源特异性LoxP位点。在某些实施例中,这种异源特异性LoxP位点为L3、LoxFas和2L(参见,例如Lanza等人,Biotechnol.J.7(2012)898-908;Wong等人,Nucleic Acids Res.33(2005)e147),其中L3和2L分别位于5'端和3'端的安放位点的侧翼,或反之亦然,而LoxFas位于L3与2L位点之间。在所有方面和实施例的某些实施例中,安放位点进一步包含双顺反子单元,该双顺反子单元经由IRES将选择标记的表达与绿色荧光蛋白(GFP)的表达连接起来,允许通过正选择稳定安放位点,以及在转染和Cre重组酶介导的重组(负选择)后选择不存在的位点。示例性的GFP具有SEQ ID NO:35的序列。
在前面的段落中所述的安放点的这种构型允许同时整合两个核酸,该两个核酸包含于不同的质粒,为具有L3和LoxFas位点的所谓的前核酸以及包含LoxFas和2L位点的后核酸。不同于安放位点中存在的选择标记基因的功能元件可分布在两个核酸之间:启动子和转录起始密码子位于前核酸上,而编码区和poly A信号位于后核酸上。只有所述两者核酸的正确的Cre重组酶介导的整合才能诱导针对相应选择剂的抗性。
一般而言,适合于TI的哺乳动物细胞是包含整合在其基因组的基因座内的外源核苷酸序列,其中该外源核苷酸序列包含位于至少一个第一选择标记的侧翼的第一重组识别位点和第二重组识别位点,以及位于该第一重组识别位点与该第二重组识别位点之间的第三重组识别位点,并且所有重组识别位点都不相同。该外源核苷酸序列称为“安放位点”。
本文所公开的主题使用适合于外源核苷酸序列的TI的哺乳动物细胞。在某些实施例中,适合于TI的哺乳宿主细胞包含整合在哺乳动物细胞的基因组中的整合位点的外源核苷酸序列。这种适合于TI的哺乳动物细胞还可称为“TI宿主细胞”。
在所有方面和实施例的某些实施例中,适合于TI的哺乳动物细胞为包含安放位点的仓鼠细胞、人细胞、大鼠细胞或小鼠细胞。在某些实施例中,适合于TI的哺乳动物细胞为包含对应安放位点的中国仓鼠卵巢(CHO)细胞、CHO K1细胞、CHO K1SV细胞、CHO DG44细胞、CHO DUKXB-11细胞、CHO K1S细胞、CHO K1M细胞、人细胞、HEK293细胞或Per.C6细胞。
在所有方面和实施例的某些实施例中,适合于TI的哺乳动物细胞包含整合的外源核苷酸序列,其中该外源核苷酸序列包含一个或多个重组识别位点(RRS)。在某些实施例中,外源核苷酸序列包含至少两个RRS。RRS可被重组酶识别,例如Cre重组酶、Flp重组酶、Bxb1整合酶或
Figure BDA0004166468400000551
整合酶。RRS可选自由以下组成的组:LoxP位点、L3位点、2L位点、LoxFas位点、Lox511位点、Lox2272位点、Lox2372位点、Lox5171位点、Loxm2位点、Lox71位点、Lox66位点、FRT位点、F3位点、F5位点、Bxb1 attP位点、Bxb1 attB位点、a/>
Figure BDA0004166468400000553
attP位点和/>
Figure BDA0004166468400000552
attB位点。
在所有方面和实施例的某些实施例中,选择标记彼此独立地选自由以下组成的组:氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418 APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰氨合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D)以及编码对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、吉欧霉素(Zeocin)和霉酚酸的抗性的基因。选择标记还可以为选自由以下组成的组的荧光蛋白:绿色荧光蛋白(GFP)、增强型GFP(eGFP)、合成GFP、黄色荧光蛋白(YFP)、增强型YFP(eYFP)、青色荧光蛋白(CFP)、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed-单体、mOrange、mKO、mCitrine、Venus、YPet、Emerald6、CyPet、mCFPm、Cerulean和T-Sapphire。
外源核苷酸序列为非源自特定细胞但可通过DNA递送方法(例如通过转染、转导、电穿孔或转化方法)导入所述细胞的核苷酸序列。在所有方面和实施例的某些实施例中,适合于TI的哺乳动物细胞包含整合在哺乳动物细胞基因组中更多整合位点的至少一种外源核苷酸序列。在某些实施例中,外源核苷酸序列整合在哺乳动物细胞的基因组的特定基因座中的整合位点。
在所有方面和实施例的某些实施例中,整合的外源核苷酸序列包含一个或多个重组识别位点(RRS),其中RRS可由重组酶进行识别。在某些实施例中,整合的外源核苷酸序列包含至少两个RRS。在某些实施例中,整合的外源核苷酸序列包含三个RRS,其中第三RRS位于第一RRS和第二RRS之间。在某些实施例中,第一RRS和第二RRS相同,并且第三RRS和第一或第二RRS不同。在某些实施例中,所有三个RRS都不同。在某些实施例中,RRS彼此独立地选自由以下组成的组:LoxP位点、L3位点、2L位点、LoxFas位点、Lox511位点、Lox2272位点、Lox2372位点、Lox5171位点、Loxm2位点、Lox71位点、Lox66位点、FRT位点、F3位点、F5位点、Bxb1 attP位点、Bxb1 attB位点、
Figure BDA0004166468400000561
attP位点和/>
Figure BDA0004166468400000562
attB位点。
在所有方面和实施例的某些实施例中,整合的外源核苷酸序列包含至少一个选择标记。在某些实施例中,整合的外源核苷酸序列包含第一RRS、第二RSS和第三RRS,以及至少一个选择标记。在某些实施例中,选择标记位于第一RRS与第二RRS之间。在某些实施例中,两个RRS位于至少一个选择标记的侧翼,即第一RRS位于选择标记的5'端(上游),并且第二RRS位于3'端(下游)。在某些实施例中,第一RRS与选择标记的5'端相邻,并且第二RRS与选择标记的3'端相邻。
在所有方面和实施例的某些实施例中,选择标记位于第一RRS与第二RRS之间,并且这两个侧翼RRS不同。在某些实施例中,第一侧翼RRS为L3序列,并且第二侧翼RRS为2L序列。在某些实施例中,L3序列位于选择标记的5'端,并且2L序列位于选择标记的3'端。
在所有方面和实施例的某些实施例中,第一侧翼RRS为具有野生型反向重复序列的LoxP序列,并且第二侧翼RRS为具有一个突变反向重复序列的LoxP序列。在某些实施例中,第一侧翼RRS为具有第一突变反向重复序列的LoxP序列,并且第二侧翼RRS为具有与第一突变反向重复序列相同或不同的第二突变反向重复的LoxP序列。在某些实施例中,第一侧翼RRS为具有野生型反向重复序列的LoxP序列,并且第三侧翼RRS为具有一个突变反向重复序列的LoxP序列。在某些实施例中,第二侧翼RRS为具有野生型反向重复序列的LoxP序列,并且第三RRS为具有一个突变反向重复序列的LoxP序列。在某些实施例中,第一侧翼RRS为具有第一突变反向重复序列的LoxP序列,并且第三RRS为具有第二突变反向重复序列的LoxP序列。在所有方面和实施例的某些实施例中,第二侧翼RRS为具有第一突变反向重复序列的LoxP序列,并且第三RRS为具有第二突变反向重复序列的LoxP序列。
在所有方面和实施例的某些实施例中,第一侧翼RRS为野生型FRT序列,并且第二侧翼RRS为突变型FRT序列。在所有方面和实施例的某些实施例中,第一侧翼RRS为第一野生型FRT序列,并且第二侧翼RRS为第二突变型FRT序列。
在所有方面和实施例的某些实施例中,第一侧翼RRS为Bxb1 attP序列,并且第二侧翼RRS为Bxb1 attB序列。
在所有方面和实施例的某些实施例中,第一侧翼RRS为
Figure BDA0004166468400000571
attP序列,并且第二侧翼RRS为/>
Figure BDA0004166468400000572
attB序列。
在所有方面和实施例的某些实施例中,整合的外源核苷酸序列包含第一选择标记和第二选择标记,其侧翼为两个RRS,其中第一选择标记与第二选择标记不同。在某些实施例中,两个选择标记均相互独立地选自由以下组成的组:谷氨酰氨合成酶选择标记、胸苷激酶选择标记、HYG选择标记和嘌呤霉素抗性选择标记。在某些实施例中,整合的外源核苷酸序列包含胸苷激酶选择标记和HYG选择标记。在某些实施例中,第一选择标记选自由以下组成的组:氨基糖苷磷酸转移酶(APH)(例如,潮霉素磷酸转移酶(HYG)、新霉素和G418 APH)、二氢叶酸还原酶(DHFR)、胸苷激酶(TK)、谷氨酰氨合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(吲哚)、组氨醇脱氢酶(组氨醇D)以及编码对嘌呤霉素、杀稻瘟菌素、博来霉素、腐草霉素、氯霉素、吉欧霉素(Zeocin)或霉酚酸的抗性的基因,并且第二选择标记选自由以下组成的组:GFP、eGFP、合成GFP、YFP、eYFP、CFP、mPlum、mCherry、tdTomato、mStrawberry、J-red、DsRed单体、mOrange、mKO、mCitrine、Venus、YPet、Emerald、CyPet、mCFPm、Cerulean和T-Sapphire荧光蛋白。在某些实施例中,第一选择标记为谷氨酰氨合成酶选择标记,并且第二选择标记为GFP荧光蛋白。在某些实施例中,位于两个选择标记的侧翼的两个RRS不同。
在某些实施例中,选择标记可操作地连接至启动子序列。在某些实施例中,选择标记可操作地连接至SV40启动子。在某些实施例中,选择标记可操作地连接至人巨细胞病毒(CMV)启动子。
不依赖于用于导入供体脱氧核糖核酸的方法,可基于导入的第二选择标记来选择出成功转染的细胞。
须指出,当根据本发明的DNA元件、DNA分子或VA RNA基因与重组酶介导的盒交换反应组合使用时,针对RMCE和RMCI使用不同的重组酶。
例如,Cre/LoxP系统用于重组酶介导的盒交换反应(RMCE),而Flp/FRT系统用于根据本发明的DNA元件、DNA分子或VA RNA中的重组酶介导的盒反转(RMCI)。同样地,Cre/FRT系统用于重组酶介导的盒交换反应(RMCE),而Cre/LoxP系统用于根据本发明的DNA元件、DNA分子或VA RNA中的重组酶介导的盒反转(RMCI)。
腺相关病毒载体
参见Berns and Bohensky,Advances in Virus Research,Academic Press.,32(1987)243-306大致回顾AAV和腺病毒或疱疹病毒辅助功能。在Srivastava等人,J.Virol.,45(1983)555-564中描述了AAV的基因组。在US 4,797,368中描述了针对构建重组AAV载体的设计考虑(还参见WO 93/24641)。描述AAV载体的其他参考文献为West等人,Virol.160(1987)38-47;Kotin,Hum.Gene Ther.5(1994)793-801;和Muzyczka,J.Clin.Invest.94(1994)1351。在US 5,173,414;Lebkowski等人,Mol.Cell.Biol.8(1988)3988-3996;Tratschin等人,Mol.Cell.Biol.5(1985)3251-3260;Tratschin等人,Mol.Cell.Biol.,4(1994)2072-2081;Hermonat和Muzyczka,Proc.Natl.Acad.Sci.USA 81(1984)6466-6470;Samulski等人,J.Virol.63(1989)3822-3828中,描述了重组AAV载体的构建。
腺相关病毒(AAV)是一种复制缺陷型细小病毒。其只能在细胞中复制,其中某些病毒功能由共同感染的辅助病毒提供,诸如腺病毒、疱疹病毒以及在某些情况下,诸如牛痘的痘病毒。尽管如此,AAV几乎可在任何人、猿类或啮齿动物细胞系中复制,条件是存在适当的辅助病毒功能。
在不存在辅助病毒基因的情况下,AAV会在其宿主细胞中建立潜伏期。其基因组整合到19号染色体[(Chr)19(q13.4)]中的特定位点,其称为腺相关病毒整合位点1(AAVS1)。对于特定的血清型(诸如AAV-2),已发现其他整合位点,诸如,例如,在染色体5[(Chr)5(p13.3)]上,称为AAVS2,以及在染色体3[(Chr)3(p24.3)]上,称为AAVS3。
AAV归类为不同的血清型。这些已基于参数进行分配,诸如红血球凝集、致肿瘤性和DNA序列同源性。目前为止,已识别出10多种不同的血清型和一百多种对应于不同AAV演化枝的序列。
衣壳蛋白的类型和对称性决定相应AAV的组织嗜性。例如,AAV-2、AAV-4和AAV-5对视网膜具有特异性,AAV-2、AAV-5、AAV-8、AAV-9和AAVrh-10对大脑具有特异性,AAV-1、AAV-2、AAV-6、AAV-8和AAV-9对心脏组织具有特异性,AAV-1、AAV-2、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9和AAV-10对肝脏具有特异性,AAV-1、AAV-2、AAV-5和AAV-9对肺具有特异性。
假型化(Pseudotyping)表示一种包括在各种血清型之间交叉包装AAV基因组的方法,即基因组用不同来源的衣壳蛋白来包装。
野生型AAV基因组的大小约为4.7kb。AAV基因组进一步包含名为rep和cap的两个重叠基因,其包含多个开放阅读框(参见,例如,Srivastava等人,J.Viral.,45(1983)555-564;Hermonat等人,J.Viral.51(1984)329-339;Tratschin等人,J.Virol.,51(1984)611-619)。Rep蛋白编码开放阅读框提供四种不同大小的蛋白,称为Rep78、Rep68、Rep52和Rep40。这些蛋白涉及AAV的复制、修复和整合。Cap蛋白编码开放阅读框提供四种蛋白质,称为VP1、VP2、VP3和AAP。VP1、VP2和VP3为AAV颗粒的蛋白质衣壳的一部分。组合的rep和cap开放阅读框在其5'端和3'端的侧翼为所谓的反向末端重复序列(ITR)。针对复制,除Rep和Cap蛋白外,AAV还需要基因E1A、E1B、E4orf6、E2A和VA的产物或另一种辅助病毒的对应因子。
例如,在血清型2(AAV-2)的AAV的情况下,ITR各自的长度为145个核苷酸,并且位于约4470个核苷酸的编码序列区的侧翼。在ITR的145个核苷酸中,有125个核苷酸具有回文序列并且可形成T形发夹结构。该种结构在病毒复制过程中具有引物的功能。其余20个未配对的核苷酸表示为D序列。
AAV基因组包含三个用于表达rep和cap基因的转录启动子P5、P19和P40(Laughlin等人,Proc.Natl.Acad.Sci.USA 76(1979)5567-5571)。
ITR序列必须与编码区以顺式存在。ITR提供具功能性复制起点(ori)、整合到靶细胞的基因组所需的信号以及自宿主细胞染色体或重组质粒的有效切除和修复。ITR进一步包含类复制起始元件,诸如Rep蛋白结合位点(RBS)和末端解离位点(TRS)。已发现ITR本身可具有AAV载体中转录启动子的功能(Flotte等人,J.Biol.Chem.268(1993)3781-3790;Flotte等人,Proc.Natl.Acad.Sci.USA 93(1993)10163-10167)。
对于分别复制和衣壳化病毒单链DNA基因组,需要rep和cap基因产物的反式组构。
rep基因座包含两个内部启动子,称为P5和P19。其包含四种蛋白质的开放阅读框。启动子P5可操作地连接至核酸序列,该核酸序列提供编码Rep蛋白Rep78(阻滞细胞周期的染色质切口酶)的未剪接的4.2kb mRNA以及编码Rep蛋白Rep68(位点特异性核酸内切酶)的未剪接的3.9kb mRNA。启动子P19可操作地连接至核酸序列,该核酸序列提供编码Rep蛋白Rep52的未剪接的mRNA以及编码Rep蛋白Rep40的经剪接的3.3kb mRNA(用于积累和包装的DNA解旋酶)。
两个较大的Rep蛋白Rep78和Rep68对于AAV双链DNA复制是必要的,而较小的Rep蛋白Rep52和Rep40似对子代、单链DNA积累是必要的(Chejanovsky&Carter,Virology 173(1989)120-128)。
较大的Rep蛋白Rep68和Rep78可特异性地结合至AAV ITR的发夹构型。其表现出确定的酶活性,其是解决AAV末端复制所需要的。表达Rep78或Rep68足以形成感染性颗粒(Holscher,C.等人,J.Virol.68(1994)7169-7177和69(1995)6880-6885)。
认为所有Rep蛋白(主要为Rep78和Rep68)都表现出调控活性,诸如AAV基因的诱导和抑制以及对细胞生长的抑制作用(Tratschin等人,Mol.Cell.Biol.6(1986)2884-2894;Labow等人,Mol.Cell.Biol.,7(1987)1320-1325;Khleif等人,Virology,181(1991)738-741)。
由于诱导DNA损伤,Rep78的重组过表达造成细胞生长减少的表型。由此宿主细胞在S期阻滞,由此促进病毒的潜伏感染(Berthet,C.等人,Proc.Natl.Acad.Sci.USA 102(2005)13634-13639)。
Tratschin等人报道,P5启动子受到Rep78或Rep68的负自动调控(Tratschin等人,Mol.Cell.Biol.6(1986)2884-2894)。由于表达Rep蛋白的毒性作用,在AAV稳定整合后,已报道某些细胞系仅有非常低的表达(参见,例如Mendelson等人,Virol.166(1988)154-165)。
cap基因座包含一个启动子,称为P40。启动子P40可操作地连接至提供2.6kb mRNA的核酸序列,该mRNA通过选择性剪接以及使用选择性起始密码子来编码Cap蛋白VP1(87kDa,未剪接的mRNA转录物)、VP2(72kDa,来自经剪接的mRNA转录物)和VP3(61kDa,来自选择性起始密码子)。VP1到VP3构成病毒衣壳的构建块。衣壳具有与细胞表面受体结合并允许病毒在细胞内运输的功能。VP3约占病毒颗粒蛋白总量的90%。尽管如此,所有三种蛋白质对于有效的衣壳生产都是必要的。
据报道,所有三种衣壳蛋白VP1到VP3的失活可防止积累单链子代AAV DNA。VP1氨基末端的突变(“Lip-阴性”或“Inf-阴性”)仍允许将单链DNA组装成病毒颗粒,由此大幅度降低感染效价。
AAP开放阅读框编码组装活化蛋白(AAP)。其大小约为22kDa,可将天然VP蛋白运输到核仁区进行衣壳组装。该开放阅读框位于VP3蛋白编码序列的上游。
在单独的AAV颗粒中,仅包含一个单链DNA分子。其可能为“正”链或“负”链。含有DNA分子的AAV病毒颗粒具有感染性。在经感染的细胞内,亲代感染单链被转变为双链,该双链随后被扩增。扩增产生出大量双链DNA分子,其中单链被置换并包装成衣壳。
腺相关病毒(AAV)载体可转导分裂细胞和休眠细胞。可假设使用AAV载体导入靶细胞的转基因将被长期表达。使用AAV载体的一个缺点是可导入细胞的转基因大小有限制。
Carter等人已经表明可删除整个rep和cap开放阅读框并用转基因替换(Carter,B.J.,"Handbook of Parvoviruses",由P.Tijssen,CRC Press,pp.155-168(1990))。进一步地,据报道,须维持ITR以保留复制、修复、包装以及将转基因整合到靶细胞的基因组中的功能。
当包含相应病毒辅助基因的细胞被AAV载体转导时,或者反之亦然,当包含整合的AAV前病毒的细胞被合适的辅助病毒转导时,AAV前病毒被活化并且再次进入裂解性感染周期(Clark,K.R.等人,Hum.Gene Ther.6(1995)1329-1341;Samulski,R.J.,Curr.Opin.Genet.Dev.3(1993)74-80)。
E1A为腺病毒DNA进入细胞核后所表达的第一个病毒辅助基因。E1A基因编码12S和13S蛋白,其是基于通过选择性剪接得到的相同的E1AmRNA。表达12S和13S蛋白导致其他病毒功能E1B、E2、E3和E4的活化。此外,表达12S和13S蛋白迫使细胞进入细胞周期的S期。如果只表达E1A衍生的蛋白质,则细胞将会死亡(细胞凋亡)。
E1B为第二个表达的病毒辅助基因。其由E1A衍生的蛋白质12S和13S活化。E1B基因衍生的mRNA可以两种不同的方式剪接,产生第一55kDa转录物和第二19kDa转录物。E1B55kDa蛋白参与调节细胞周期、防止在感染晚期的细胞mRNA的运输以及防止E1A诱导的细胞凋亡。E1B 19kDa蛋白参与防止E1A诱导的细胞凋亡。
E2基因编码不同的蛋白质。E2A转录物编码单链结合蛋白(SSBP),其是AAV复制所必要的。
E4基因还编码数种蛋白质。E4基因衍生的34kDa蛋白(E4orf6)与E1B55kDa蛋白一起阻止细胞mRNA在细胞质中的积累,还促进病毒RNA自细胞核运输到细胞质中。
通常,为生产重组AAV颗粒,将不同的互补质粒共转染到宿主细胞中。质粒中的一个质粒包含夹在两个顺式作用AAV ITR之间的转基因。子代重组基因组的复制和后续包装所需的缺少的AAV元件(即Rep和Cap蛋白的开放阅读框)反式包含在第二质粒中。过表达Rep蛋白造成对细胞生长的抑制作用(Li,J.等人,J.Virol.71(1997)5236-5243)。此外,AAV复制需要包含辅助病毒基因(即来自腺病毒的E1、E4orf6、E2A和VA)的第三质粒。
为减少所需质粒的数量,Rep、Cap和腺病毒辅助基因可组合在单一质粒上。
或者,宿主细胞可已稳定表达E1基因产物。这种细胞为HEK293细胞。标示为293的人胚胎肾克隆体是在1977年通过将腺病毒DNA整合到人胚胎肾细胞(HEK细胞)中而产生的(Graham,F.L.等人,J.Gen.Virol.36(1977)59-74)。HEK293细胞系包含腺病毒血清型5基因组的碱基对1至4344。这涵盖E1A和E1B基因以及腺病毒包装信号(Louis,N.等人,Virology233(1997)423-429)。
当使用HEK293细胞时,缺少的E2A、E4orf6和VA基因可通过与腺病毒共感染或通过与E2A、E4orf6和VA表达质粒共转染来导入(参加,例如Samulski,R.J.等人,J.Virol.63(1989)3822-3828;Allen,J.M.等人,J.Virol.71(1997)6816-6822;Tamayose,K.等人,Hum.Gene Ther.7(1996)507-513;Flotte,T.R.等人,Gene Ther.2(1995)29-37;Conway,J.E.等人,J.Virol.71(1997)8780-8789;Chiorini,J.A.等人,Hum.Gene Ther.6(1995)1531-1541;Ferrari,F.K.等人,J.Virol.70(1996)3227-3234;Salvetti,A.等人,Hum.GeneTher.9(1998)695-706;Xiao,X.等人,J.Virol.72(1998)2224-2232;Grimm,D.等人,Hum.Gene Ther.9(1998)2745-2760;Zhang,X.等人,Hum.Gene Ther.10(1999)2527-2537)。或者,可使用腺病毒/AAV或单纯疱疹病毒/AAV杂合载体(参见,例如Conway,J.E.等人,J.Virol.71(1997)8780-8789;Johnston,K.M.等人,Hum.Gene Ther.8(1997)359-370:Thrasher,A.J.等人,Gene Ther.2(1995)481-485;Fisher,J.K.等人,Hum.Gene Ther.7(1996)2079-2087;Johnston,K.M.等人,Hum.Gene Ther.8(1997)359-370)。
因此,其中整合并表达了rep基因的细胞系倾向缓慢生长或以非常低的水平表达Rep蛋白。
一个重大安全议题是复制潜能腺病毒(RCA)对rAAV颗粒制剂的污染。当整合到宿主细胞中的载体基因组和腺病毒DNA在病毒复制期间通过同源重组而重组时,会产生RCA(Lochmueller,H.等人,Hum.Gene Ther.5(1994)1485-1491;Hehir K.M.等人,J.Virol.70(1996)8459-8467)。因此,HEK 293细胞不适合生产用于药物应用的腺病毒载体。
为限制转基因对特定组织的活性(即限制整合位点),可将该转基因可操作地连接至可诱导或组织特异性启动子(参见,例如,Yang,Y.等人,Hum.Gene.6(1995)1203-1213)。
直至今日,rAAV颗粒生产的主要困难是rAAV载体的低效包装,导致效价低。包装一直很困难的数个原因包括:
-野生型AAV基因组(如果它们存在的话)的优选衣壳化;
-由于与rep基因产物相关联的抑制作用,难以产生足够的补充功能,诸如由野生型rep和cap基因所提供的功能;
-质粒构建体的共转染效率有限。
所有这些问题都是基于Rep蛋白的生物学特性。尤其是Rep蛋白的抑制(细胞抑制和细胞毒性)特性以及逆转培养细胞永生化表型的能力是问题所在。此外,当应用广泛使用的AAV P5启动子时,Rep蛋白会下调其自身的表达(参见,例如Tratschin等人,Mol.Cell.Biol.6(1986)2884-2894)。
根据本发明的示例性化合物和组合物
本文报道了新DNA构建体及其使用方法。根据本发明的新DNA构建体可用于使用位点特异性重组酶技术同时转录活化至少两个开放阅读框。本发明在双链DNA分子的编码链和模板链上使用启动子和开放阅读框的特意非生产性排列,其通过位点特异性重组酶的反转被转变成其生产形式。
本发明的技术概念的基本原理是通过结合的DNA反转和可操作连接至启动子来活化基因表达。
本发明的一个独立方面为一种双链DNA元件,其包含(正向)编码链和(负向)模板链,
其特征在于,
该编码链在正方向上按以下顺序(即以5'-至3'-方向)包含:
-在正方向上的第一启动子,
-在正方向上的第一重组酶识别序列,其在一个反向重复序列中包含突变,
-在负方向(即相对于该编码链的负方向)上的第二启动子,
-在负方向上的第一多聚腺苷酸化信号序列和/或转录终止子元件(即相对于该编码链的5'-至3'-方向为反向),
-在负方向上的第一开放阅读框,其可操作地连接至第一多聚腺苷酸化信号序列和/或转录终止子元件(即相对于该编码链的5'-到3'-方向为反向),
-第二重组酶识别序列,其在不同于该第一重组酶识别序列的相应其他反向重复序列中包含突变,并且处于负方向上(即与该第一重组酶识别序列为互逆方向,并且相对于该编码链的5'-至3'-方向为反向),
-在正方向上的第二开放阅读框,以及
-在正方向上的第二多聚腺苷酸化信号序列和/或转录终止子元件,其可操作地连接至该第二开放阅读框。
本发明的一个独立方面为一种双链DNA元件,其以5'-至3'-方向按以下顺序包含:
-以5'-至3'-方向(即正方向)的第一启动子,
-以5'-至3'-方向的第一重组酶识别序列,其在一个反向重复序列中包含突变,
-以3'-至5'-方向(即负方向)的第二启动子,
-以3'-至5'-方向的第一多聚腺苷酸化信号序列和/或转录终止子元件(即相对于该编码链的5'-至3'-方向为反向),
-以3'-至5'-方向的第一开放阅读框,其可操作地连接至该第一多聚腺苷酸化信号序列和/或转录终止子元件,
-第二重组酶识别序列,其包含不同于该第一重组酶识别序列的相应其他反向重复序列中的突变,并且处于3'-至5'-方向(即与该第一重组酶识别序列为互逆方向),
-以5'-至3'-方向的第二开放阅读框,以及
-以5'-至3'-方向的第二多聚腺苷酸化信号序列和/或转录终止子元件,其可操作地连接至该第二开放阅读框。
在所有方面和实施例的某些实施例中,将该双链DNA元件与对该第一重组酶识别序列和第二重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第二重组酶识别序列之间的序列的反转,随后该第一启动子可操作地连接至该第一开放阅读框,并且该第二启动子可操作地连接至该第二开放阅读框,以及
-重组后在该第一启动子与该第一开放阅读框之间或该第二启动子与该第二开放阅读框之间产生(第三)重组酶识别序列,其不再对该重组酶具有功能。
因此,根据本发明的DNA元件相对于所含有的第一开放阅读框和第二开放阅读框的转录不具有功能。通过相对于第一开放阅读框和第二开放阅读框的转录不具有功能,根据本发明的DNA元件可整合到细胞的基因组中,而没有所包含的开放阅读框在整合之后已被直接表达的风险。在导入至细胞后,仅在对DNA元件的重组识别序列具有功能的重组酶(即识别该识别序列)在细胞内被活化或被导入细胞时,开放阅读框才被转录。由此启动本发明的基因组整合的DNA元件中的第一重组酶识别序列与第二重组酶识别序列之间的重组酶介导的盒反转(RMCI)。RMCI导致位于两个反向重组酶识别序列之间的根据本发明的DNA元件的那个部分反转。从而该第一启动子变成可操作地连接至该第一开放阅读框,并且该第二启动子变成可操作地连接至该第二开放阅读框。仅此后,转录该第一开放阅读框和第二开放阅读框并且表达相应的编码的蛋白质。因此,根据本发明的DNA元件特别地用于同时活化细胞内的两个开放阅读框的转录。
图1的左侧部分示意性地描绘了根据本发明的具有无转录活性的开放阅读框的DNA元件。图1的右侧部分描绘了由RMCI所产生的具有可操作地连接的启动子和开放阅读框(即具有转录活性的开放阅读框)的反向DNA元件。
因此,本发明的一个独立方面为一种双链DNA元件,其以5'-至3'-方向按以下顺序包含:
-以5'-至3'-方向(即正方向)的第一启动子,
-以5'-至3'-方向的第一重组酶识别序列,其在反向重复序列两者中包含突变或在反向重复序列中没有突变,
-以5'-至3'-方向的第一开放阅读框,其可操作地连接至该第一启动子,
-以5'-至3'-方向的第一多聚腺苷酸化信号序列和/或转录终止子元件,其可操作地连接至该第一开放阅读框,
-以5'-至3'-方向的第二启动子,
-第二重组酶识别序列,其在反向重复序列两者中包含突变(如果该第一重组酶识别序列在该反向重复序列中没有突变),或其在反向重复序列中没有突变(如果该第一重组酶识别序列在反向重复序列两者中具有突变),
-以5'-至3'-方向的第二开放阅读框,其可操作地连接至该第二启动子,以及
-以5'-至3'-方向的第二多聚腺苷酸化信号序列和/或转录终止子元件,其可操作地连接至该第二开放阅读框。
重组酶识别序列保持在反转并由此活化的构建体中。由于交换反应为酶促反应,因此在酶仍然存在/具有活性或重新导入(因为重组酶识别序列(例如LoxP位点)在任何交换后仍保留其功能)的情况下,第二(即反向)反转反应是可能的。反向反转反应会使先前活化的开放阅读框的转录失活。重组酶介导的盒反转的可逆性取决于所采用的重组酶识别序列以及所使用的重组酶。
例如,由Cre重组酶所催化的RMCI反应是可逆反应。因此,在其基因组中包含活性Cre重组酶和LoxP位点的细胞倾向发生预期但也可能发生非预期的反转事件,因为重组酶识别序列在每次交换反应后仍保留功能。
因此,需控制重组酶系统的活性或/和作用位点和/或可逆性,以防止在初级的、预期的反转反应发生后发生次级的、非预期的反转反应。
因此,根据本发明的DNA元件包含单侧、突变的重组酶识别序列。因此,每个重组酶识别序列具有一个野生型反向重复和一个突变的反向重复。例如,第一重组酶识别序列具有突变的左反向重复序列(和右野生型重复序列)而第二重组酶识别序列具有突变的右反向重复序列(和左野生型重复序列)。在RMCI之后,经活化的生产性DNA包含一个具有两个野生型反向重复序列的重组酶识别序列和一个具有两个突变反向重复序列的重组酶识别序列。双突变的重组酶识别序列不再被重组酶识别,由此防止潜在的逆反应。基于这种特意设计,只可发生单次(即一次)RMCI,并且稳定地活化转录。
在所有方面和实施例的一个优选实施例中,重组酶为Cre重组酶并且重组酶识别序列为RE-LoxP位点和LE-LoxP位点。
在所有方面和实施例的一个优选实施例中,重组酶为Flp重组酶并且重组酶识别序列为RE-FRT和LE-FRT位点。
或者,可使用phiC31介导的RMCI。在此反转反应期间,重组位点未被保留。更详细地,与Cre或FLP系统相比,attP和attB位点重组以产生不相容的attL和attR位点,从而防止连续的交换反应。因此,其可通过在要反向的序列侧翼分别接反向attP和attB位点而用于一次性单向RMCI(参见,例如,Haecker,I.,et al.,Nat.Sci.Rep.7(2017)43883)。
在所有方面和实施例的一个优选实施例中,重组酶为phiC31-整合酶并且重组酶识别序列为attP和attB。根据本发明,将AttP和attB视为在根据本发明的重复序列中的一者中具有突变的重组酶识别序列,因为使用这些序列使得重组酶识别序列在RMCI之后不再具有功能。
为进一步增加根据本发明的DNA元件的有利效果,还可选择所用的启动子为可诱导/可活化的启动子。因此,只有通过进一步的特异性启动子活化,才能在重组酶介导的反转后开启开放阅读框的转录。这在一方面实现了对开放阅读框转录的改良控制,在另一方面实现了再次关闭转录的可能性。通过根据本发明的DNA元件和可诱导启动子的组合,可紧缩单独使用的可诱导启动子时的潜在泄漏。可诱导系统在本领域是已知的,诸如Tet-on/off系统。
本文所公开的主题不仅提供适合于生产具有多个开放阅读框的可诱导转录的重组哺乳动物细胞的基因构建体的方法,而且还提供稳定大规模生产相应蛋白质化合物的方法。同样地,可获得具有高产量的目的蛋白质化合物的重组稳定生产哺乳动物细胞。
根据本发明的方法可与任何位点特异性重组酶一起使用,诸如Cre重组酶、Flp重组酶(识别FRT-位点,诸如GAAGTTCCTATTC-TCTAGAAA-GTATAGGAACTTC(SEQ ID NO:36))、phiC31-整合酶和Dre重组酶(识别roxP位点,例如TAACTTTAAATA-ATGCCAAT-TATTTAAAGTTA(SEQ ID NO:42);Bessern,J.L.等人,Nat.Commun.10(2019)1937)或其被工程化的变体如Tre、Brec 1和VCre(识别LoxP变体,诸如LoxLTR(ACAACATCCTATT-ACACCCTA-TATGCCAACATGG(SEQ ID NO:43))和LoxBTR(AACCCACTGCTTA-AGCCTCAA-TAAAGCTTGCCTT(SEQ ID NO:44)),或LoxV(TCAATTTCTGAGA-ACTGTCAT-TCTCGGAAATTGA(SEQ ID NO:45);Sarkar,I.等人,Science 316(2007)1912–1915,Karpinski,J.等人,Nat.Biotechnol.34(2016)401-409,Bessern,J.L.等人,Nat.Commun.10(2019)1937)分别使用其各自的重组酶特异性LoxP位点、FRT位点、attB/attP位点和roxP位点。唯一之前提是使用的重组酶识别序列是不相容的,即,其只与第二相同的拷贝相互作用,并且与密切相关的序列无可检测的混交(promiscuity)。
下面以Cre/LoxP系统为例,说明根据本发明的方法,其中位点特异性重组酶为Cre重组酶,并且重组识别位点分别为LoxP位点。这样做是为了举例说明本发明的概念。本领域技术人员可立即地理解,以Cre/LoxP显示的发明概念同样可应用于如上所列的其他位点特异性重组酶系统,诸如Flp/FRT系统,或phiC31/att系统,或Dre/roxP系统。因此,在本文提供的示例和定义中,术语“Cre重组酶”可分别替换为“Flp重组酶”或“phiC31整合酶”或“Dre整合酶”,并且术语“LoxP位点”可分别代替术语“FRT位点”或“att位点”或“roxP位点”。
根据LoxP位点的方向和一致性/非一致性,重组酶会反转、切除或替换介入的DNA序列。因此,在第一种模式中,两个LoxP位点定向在相同方向上。这造成在与Cre重组酶相互作用时,介入的DNA序列被删除,留下分离的LoxP位点。在第二种模式中,两个LoxP位点以头对头的方向定向,即两个LoxP位点相对于彼此处于互逆/反向方向上。在这个方向上,与Cre重组酶的相互作用造成介入的DNA序列的反转,留下两个LoxP位点。在第二种模式的DNA序列反转期间,LoxP位点之间的编码链和模板链相互交换,即在与Cre重组酶相互作用之前的编码链在与Cre重组酶相互作用后变成模板链,并且反之亦然。这个过程被称为重组酶介导的盒反转(RMCI)。在第三种模式中,两个分子与Cre重组酶相互作用,这两个分子各自包含DNA序列,侧翼为方向相同的第一和第二LoxP位点,其中第一分子上的一个LoxP位点与第二分子上的一个LoxP位点相同,并且第一分子上的第二LoxP位点与第二分子上相应的另一个LoxP位点相同。这种相互作用使两个分子之间的LoxP位点之间的DNA序列交换。这个过程被称为重组酶介导的盒交换或短RMCE。
与野生型LoxP位点不相容的变体LoxP位点是本领域已知的。然而,这些不相容LoxP位点的数量是有限的。下表1a列出了一些与LoxP不相容并且无混交(即没有非特异性相互作用)的位点。
表1a:不相容LoxP位点。
Figure BDA0004166468400000701
与野生型FRT位点不相容的FRT位点是本领域已知的。然而,这些不相容FRT位点的数量是有限的。下表1b列出一些与FRT不相容并且无混交(即没有非特异性相互作用)的位点。
表1b:不相容FRT位点。
Figure BDA0004166468400000711
可轻易地发现单一特定不相容LoxP位点(参见上面的表1a)。如果必须在单一核酸中进行一个以上的基于Cre-lox的交换,则需要一个以上的不相容LoxP位点,即包含两个或多个不相容LoxP位点的集合。这代表该集合中的每个LoxP位点必须与包含在该集合中的所有其他LoxP位点不相容。如果要选择性活化一个以上的开放阅读框,则特别需要这种集合。
例如,Lee和Saito(Gene 216(1998)55-65)合成一整套的具有单一碱基取代的24种LoxP间隔子突变体以及具有双碱基取代的30种LoxP间隔子突变体。其中,已识别出两种LoxP间隔子突变体(即突变体Lox5171和Lox2272),其与相同突变体有效重组,但与其他突变体或野生型LoxP无法有效重组。
同样地,Langer,S.J.等人(Nucl.Acids Res.30(2002)3067-3077)进行基因筛选,其被设计以识别含有突变间隔子的新LoxP位点,该位点展示出与标准LoxP位点的增强的不相容性。自Langer等人的表1可看出,可识别出彼此不相容的LoxP集合。
表2:Langer等人的表1。
Figure BDA0004166468400000721
小写字母表示与1oxP间隔序列不同的核苷酸。
(SEQ ID NO:16、20、23、24、25、49)
Missirlis,P.I.等人(BMC Genomics7(2006)73,A13)在Cre重组酶介导的重组中进行LoxP间隔子的高通量筛选识别序列和混交特点。他们已识别出31种独特的新的自我重组序列,其中两个序列只有单一重组伙伴。
表3示例性不相容LoxP位点集合。
表3:不相容LoxP位点集合。
Figure BDA0004166468400000722
粗体核苷酸表示与Lee和Saito的相应出版物之间的序列差异。
Langer,S.J.等人报道使用具有互补突变反向重复序列(Lox66和Lox71)的LoxP位点允许高效的反式重组,从而产生野生型LoxP位点和具有突变的两个反向重复序列的缺陷位点。因为具有突变的两个反向重复序列的LoxP位点不再是重组酶的有效底物,因此反应是朝一个方向驱动的。
这些互补的突变反向重复序列在重复序列的一个末端含有被改变的碱基五联体(pentett)。在左反向重复序列的末端具有突变的突变体称为LE突变体。同样地,在右反向重复序列的末端具有突变的突变体称为RE突变体。LE突变体Lox71在左反向重复序列的5'端具有从野生型序列变为TACCG(SEQ ID NO:50)的5bp,而RE突变体Lox66具有变为CGGTA(SEQ ID NO:51)的五个3'端最多的碱基。在Lox71与位于顺式的反向Lox66位点发生重组酶反应之后,产生的LoxP位点仍位于顺式并且包围靶DNA序列,但产生的LoxP位点中的一个位点为双突变位点,即每个末端序列具有突变,该末端序列因此包含LE反向重复突变和RE反向重复突变。相应的其他产生的LoxP位点对应于野生型序列。这个双重突变的LoxP位点在Cre重组酶介导的重组中不再具有功能(参见,例如,Langer等人;Missirlis等人,同上)。
已知有不同的LoxP RE突变体和LE突变体序列。下表4a中列出了一些突变体序列。
表4a:LoxP RE突变体和LE突变体序列。
Figure BDA0004166468400000731
/>
Figure BDA0004166468400000741
*:在交换反应之后具最高稳定性;由Hoess等人(1982)定义的反方向定位间隔子。
例如,RE突变体和LE突变体序列Lox71和Lox66,或LoxJT15和LoxJTZ17可成对使用。
同样地,已知有不同的FRT RE突变体和LE突变体序列。下表4b中列出一些突变体序列。
表4b:FRT RE突变体和LE突变体序列。
Figure BDA0004166468400000742
通常,在任一链(例如LoxP、Lox511、Lox5171、Lox66或Lox71)上的序列中含有(功能性)起始密码子的重组位点不得以重组后该起始密码子位于待活化的基因的5'UTR的编码链上的方式放置。否则,起始密码子可能会抑制开放阅读框的翻译。在这种情况下,可将重组位点(立即地)放置在启动子的TATA元件的3'端,或处于TATA元件与转录起始位点之间,使得起始密码子不被转录(静默起始密码子)。
在所有方面和实施例的某些实施例中,只要所使用的重组酶识别位点是不相容的,则本发明的DNA元件被组合成二聚体、三聚体和阵列。这是组合使用根据本发明的不同DNA元件时的唯一要求。因此,当使用相同的重组酶时,可同时活化两个、四个、六个以及甚至更多个开放阅读框/基因的转录,或者当在根据本发明的每个DNA元件中使用不同重组酶的不相容重组酶识别位点时,甚至可依序活化。
在所有方面和实施例的某些实施例中,当组合根据本发明的两个或更多个DNA元件并且每个DNA元件对于RMCI需要不同的重组酶时,则实现两个、四个、六个以及甚至更多个开放阅读框/基因的依序活化。这可通过如前所述的两种不同位点特异性重组酶系统的组合来实现,诸如,例如,Cre/LoxP系统与Flp/FRT系统的组合,或Cre/LoxP系统与Dre/roxP系统的组合(参见,例如Chuang,K.等人,Genes Genom.Genet.6(2016)559-571),或Cre/LoxP系统与phiC31整合酶/att系统的组合,或Flp/FRT系统与phiC31整合酶/att系统的组合。
在所有方面和实施例的某些实施例中,可实现一个、两个、三个、四个、五个、六个以及甚至更多个开放阅读框/基因的依序活化,其中使用根据本发明的任一DNA元件(依序活化一个或两个开放阅读框),或者组合两个或多个根据本发明的DNA元件(依序活化两个、三个、四个或更多个开放阅读框的),其中在两个或多个DNA元件的情况下,每个DNA元件对于RMCI需要不同的重组酶,并且其中第一启动子或第二启动子为可诱导启动子(在依序活化两个开放阅读框的情况下),或者每个第二启动子为可诱导启动子(在依序活化两个或更多个开放阅读框的情况下)。
因此,在所有方面和实施例的某些实施例中,第一启动子或第二启动子为可诱导启动子。在某些实施例中,可诱导启动子是选自包含以下的可诱导启动子的组:四环素控制的启动子、cumate控制的启动子、FKBP12-mTOR控制的启动子、雷帕霉素控制的启动子、FKCsA控制的启动子、脱落酸控制的启动子、他莫昔芬控制的启动子和核糖开关控制的启动子(FKCsA=FK506和环孢菌素A的异源二聚体)。
参见,例如Kallunki,T.等人,Cells 8(2019)796回顾可诱导启动子。
在所有方面和实施例的某些实施例中,可实现一个、两个、三个、四个、五个、六个以及甚至更多个开放阅读框/基因的依序活化,其中使用根据本发明的任一DNA元件(依序活化一个或两个开放阅读框),或者组合两个或多个根据本发明的DNA元件(依序活化两个、三个、四个或更多个开放阅读框的),其中在两个或多个DNA元件的情况下,每个DNA元件对于RMCI需要不同的重组酶,并且其中第一启动子或第二启动子为阻抑型启动子(在依序活化两个开放阅读框的情况下),或者每个第二启动子为阻抑型启动子(在依序活化两个或更多个开放阅读框的情况下)。
因此,在所有方面和实施例的某些实施例中,第一启动子或第二启动子为阻抑型启动子。在某些实施例中,阻抑型启动子是选自包含以下的抑制性启动子的:四环素控制的启动子、GAL4/UAS控制的启动子和LexA/lexAop控制的启动子。
为实现更多的组合,可将组成型启动子、可诱导启动子和阻抑型启动子组合。例如,如果将四环素依赖性可诱导启动子和阻抑型启动子组合在一起,则通过加入四环素,一个启动子被静默,而另一个启动子被活化,从而允许转换不同开放阅读框的转录。
图2示出了根据本发明的两个DNA元件的组合。第一DNA元件包含:第一重组酶识别序列(RRS1),其在顺方向上的左反向重复序列中具有突变;在反方向上的第一开放阅读框(SG1),其可操作地连接至同样在反方向上的第一多聚腺苷酸化信号序列;第二重组酶识别序列(RRS2),其在逆方向上的右反向重复序列中具有突变,其与RRS1相容;以及在顺方向上的开放阅读框(SG2),其可操作地连接至第二多聚腺苷酸化信号序列。第二DNA元件包含:第三重组酶识别序列(RRS3),其在顺方向上的左反向重复序列中具有突变,其与RRS1和RRS2不相容;在反方向上的第三开放阅读框(SG3),其可操作地连接至第三多聚腺苷酸化信号序列;第四重组酶识别序列(RRS4),其在逆方向上的右反向重复序列中具有突变,其与RRS1和RRS2不相容但与RRS3相容;以及第四开放阅读框(SG4),其可操作地连接至第四多聚腺苷酸化信号序列。
如果所有RRS都被单一(即相同)的重组酶识别,则在与其孵育时会发生两个反转反应,即RRS1与RRS2之间的DNA片段以及RRS3与RRS4之间的DNA片段被反转。因此,所有四个开放阅读框变得可操作地连接至其各自的启动子并被转录。对应的交换反应如图3所示。例如,如果使用Cre重组酶,则可分别使用不相容的RRS对Lox71/Lox66和L3-LE/L3-RE。
如果RRS1和RRS2被第一重组酶识别并且RRS3和RRS4被第二重组酶识别,则在与第一重组酶孵育时只发生一个反转反应,即RRS1与RRS2之间的DNA片段被反转,而RRS3与RRS4之间的DNA片段保持不变。因此,只有两个开放阅读框变得可操作地连接至其各自的启动子并被转录。如果在第一重组酶之后将相应的第二重组酶导入相应的细胞,则RRS3与RRS4之间的DNA片段也被反转,相应的开放阅读框被活化。对应的交换反应如图4所示。例如,第一重组酶可以为Cre重组酶,并且RRS1/RRS2为LoxP位点,第二重组酶可以为phiC31-整合酶,并且RRS3/RRS4为attP和attB。
如果至少一个启动子为可诱导启动子,则在RMCI之后,与其可操作地连接的开放阅读框的转录需另外存在相应的诱导子,或者如果至少一个启动子为阻抑型启动子,则在RMCI后,通过加入相应的阻抑物可抑制与其可操作地连接的开放阅读框的转录。
重组AAV颗粒
为产生重组AAV颗粒,需在单一哺乳动物细胞中表达Rep和Cap蛋白、辅助蛋白E1A、E1B、E2A和E4orf6以及腺病毒VA RNA。尤其是,表达Rep蛋白对哺乳动物细胞的生长和存活率具有负面影响。可通过使用根据本发明的DNA元件来克服这些缺点。对示例性设计在下文进行了概述并且显示于图5、图6和图7中,其中将根据本发明的一个或两个DNA元件组合使用。可使用任何启动子(尤其是CMV IE启动子)表达辅助蛋白E1A、E1B、E2A和E4orf6,如Matsushita等人所示(Gene Ther.5(1998)938-945)。因此,在下文中可使用任何启动子。
E1A、E1B、E2A、E4orf6开放阅读框
因此,本发明的一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含:
a)E1A开放阅读框和E1B开放阅读框;以及
b)E2A开放阅读框和E4orf6开放阅读框;
其特征在于a)或b)的该第一开放阅读框和该第二开放阅读框包含于(根据本发明的)双链DNA元件,该双链DNA元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,
-第一重组酶识别序列,其在左反向重复序列中包含突变,
-第二启动子,其相对于该编码链为反向(在反方向上),
-第一多聚腺苷酸化信号序列和/或转录终止元件,其相对于该编码链为反向且其可操作地连接至该第一开放阅读框,
-a)或b)的第一开放阅读框,其相对于该编码链为反向(在反方向上),
-第二重组酶识别序列,其在右反向重复序列中包含突变,并且相对于该第一重组酶识别序列是在互逆方向上,
-a)的第二开放阅读框(如果第一开放阅读框来自a));或b)的第二开放阅读框(如果第一开放阅读框来自b)),
-第二多聚腺苷酸化信号序列和/或转录终止元件,其可操作地连接至该第二开放阅读框。
在所有方面和实施例的某些实施例中,相应的其他开放阅读框位于表达盒内,即,可操作地连接至启动子和多聚腺苷酸化信号序列和/或转录终止元件。
图9和10示出了上述a)在RMCI之前(图9)以及在RMCI之后(图10)的方案。
图11和12示出了在RMCI之前(图11)以及在RMCI之后(图12)的上述方面b)的方案。
根据本发明的DNA元件中重组识别位点的序列需要相对于彼此具有特定的方向。相对于第一重组识别位点,第一重组识别位点为在顺方向上,并且第二重组识别位点为在反向/反方向上。
例如,LoxP位点在编码链/正链/顺向链上的5'到3'方向上具有以下序列的情况下:
5'-ataacttcgtata-atgtatgc-tatacgaagttat-3'
通过将每个核苷酸替换成其互补碱基,并自原始序列的3'-端开始,获得待放置在编码链(即自5'-至3'-方向)的反向序列,其得到如下的反向编码链序列:
5'-ataacttcgtata-gcatacat-tatacgaagttat-3'。
同样地,可获得其他反向序列,这些其他反向序列与根据本发明的DNA元件结合。因此,根据本发明的示例性DNA元件在编码链上具有以下序列:
在正常方向上的第一启动子-
5'-ataacttcgtata-atgtatgc-tatacgaagttat-3'(在正常方向上的第一重组酶识别序列)-
在反方向上的第二启动子-
在反方向上的第一polyA/终止序列-
在反方向上的第一开放阅读框-
5'-ataacttcgtata-gcatacat-tatacgaagttat-3'(在反方向上的第二重组酶识别序列)-第二开放阅读框(正常方向)-
在正常方向上的第二polyA/终止序列。
此外,本发明的一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含:
a)E1A开放阅读框和E1B开放阅读框;以及
b)E2A开放阅读框和E4orf6开放阅读框;
其特征在于a)的第一开放阅读框和第二开放阅读框包含于(根据本发明的)双链DNA元件中,并且b)的第一开放阅读框和第二开放阅读框包含于(根据本发明的)双链DNA元件中(即DNA包含两个根据本发明的DNA元件),每个双链DNA元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,
-第一重组酶识别序列,其在左反向重复序列中包含突变,
-第二启动子,其相对于该编码链为反向(在反方向上),
-第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链为反向并且其是可操作地连接至该第一开放阅读框,
-a)或b)的第一开放阅读框,其相对于该编码链为反向(在反方向上),
-第二重组酶识别序列,其在右反向重复序列中包含突变,并且相对于该第一重组酶识别序列是在互逆方向上,
-a)的第二开放阅读框(如果第一开放阅读框来自a));或b)的第二开放阅读框(如果第一开放阅读框来自b)),以及
-第二多聚腺苷酸化信号和/或转录终止元件,其可操作地连接至该第二开放阅读框。
在每种情况下,将该双链DNA分子与对该第一重组酶识别序列和第二重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第二重组酶识别序列之间的序列的反转,随后该第一启动子可操作地连接至该第一开放阅读框,并且该第二启动子可操作地连接至该第二开放阅读框,以及
-重组后在该第一启动子与第一开放阅读框之间产生(第三)重组酶识别序列,其不再对该重组酶具有功能。
同样在上述两个方面中,该第一重组酶识别序列在右反向重复序列中可包含突变,并且该第二重组酶识别序列在左反向重复序列中可包含突变。这将导致重组后在该第二启动子与该第二开放阅读框之间产生重组酶识别序列,其不再对该重组酶具有功能。
可通过使用驱动重组酶基因表达的可诱导启动子或通过导入重组酶编码mRNA等来实现暂时表达重组酶(例如Cre重组酶)。Carter,Z.和Delneri,D(Yeast 27(2010)765-775)报道了示例性的可诱导Cre重组酶表达系统。其中,通过将转染体暴露于半乳糖(YPGal)数小时,在转染体中诱导表达Cre重组酶。
在所有方面和实施例的某些实施例中,E1A和E1B(开放阅读框)的编码序列是源自人腺病毒,诸如,举例而言,特别是人腺病毒血清型2或血清型5。人Ad5(腺病毒血清型5)的示例性序列可在GenBank条目X02996、AC_000008中找到,而人Ad2的示例性序列可在GenBank条目AC_000007中找到。在所有方面和实施例的某些实施例中,核苷酸505至3522包含编码人腺病毒血清型5的E1A和E1B的核酸序列。EP 1 230 354 B1中所报道的质粒pSTK146以及WO 2007/056994中所报道的质粒pGS119和pGS122也可作为E1A和E1B开放阅读框的来源。
Rep/Cap开放阅读框
通过结合DNA反转与可操作连接至启动子的基因活化原理还可用于条件性活化rep和cap开放阅读框。
除了P5启动子以外,驱动rep和cap开放阅读框表达的启动子位于Rep多肽编码序列内。因此,对于通过重组酶介导的序列反转以及伴随的可操作地连接至启动子以条件性活化rep和cap开放阅读框,不相容的重组酶识别序列中的一个序列必须位于P5启动子与rep开放阅读框之间,并且其他不相容的重组酶识别序列必须位于cap开放阅读框与多聚腺苷酸化信号之间。这示意性地在图7的左图中示出。
因此,本发明的另一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含(根据本发明的)双链DNA元件,该元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在左反向重复序列中包含突变,
-rep和cap开放阅读框,其包括用于表达Rep和Cap蛋白的其他启动子,该rep和cap开放阅读框相对于该编码链为反向(逆向),
-第二重组酶识别序列,其在右反向重复序列中包含突变,并且对于该第一重组酶识别序列是在反向/互逆方向上,
-多聚腺苷酸化信号。
本发明的另一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体或颗粒),其包含(根据本发明的)双链DNA元件,该元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在左反向重复序列中包含突变,
-第二启动子,其相对于该编码链(在反向方向上)为反向,在一个优选实施例中,为腺相关病毒启动子P19或其功能片段或其变体,
-第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链为反向,
-编码序列,其仅编码Rep78蛋白或仅编码Rep68蛋白,但不能同时编码两者,其中内部P40启动子为失活的,并且剪接供体和受体位点被去除,并且其相对于该编码链为反向(在反向方向上),
-第二重组酶识别序列,其在右反向重复序列中包含突变,并且对于该第一重组酶识别序列是在反向/互逆方向上,
-Rep52/Rep40和Cap基因包括一个共同的多聚腺苷酸化信号。
图13和14示出了在RMCI之前(图13)和在RMCI之后(图14)的上述方面的方案。另参见图7,中图。
本发明的另一个独立方面为一种(双链)DNA(分子)(用于生产重组腺相关病毒载体和颗粒),其包含(根据本发明的)双链DNA元件,该元件包含(正向)编码链和(负向)模板链,
其中该编码链以5'-至3'-方向按以下顺序包含:
-第一启动子,在一个优选实施例中,为腺相关病毒启动子P5或其功能片段或其变体,
-第一重组酶识别序列,其在左反向重复序列中包含突变,
-第二启动子,其相对于该编码链(在反向方向上)为反向,在一个优选实施例中,为腺相关病毒启动子P19或其功能片段或其变体,
-第一多聚腺苷酸化信号和/或转录终止元件,其相对于该编码链(方向)为反向(按顺序)(即在反向/负方向上)并且其是可操作地连接至该Rep78或Rep68编码序列,
-编码序列,其仅编码Rep78蛋白或仅编码Rep68蛋白,但不能同时编码两者,其中内部P40启动子为失活的,并且剪接供体和受体位点被去除,并且其相对于该编码链为反向(在反向方向上),
-第二重组酶识别序列,其在右反向重复序列中包含突变,并且其相对于该第一重组酶识别序列是在互逆/反方向上,
-Rep52开放阅读框,其包括多聚腺苷酸化信号序列,即可操作地连接至该开放阅读框的多聚腺苷酸化信号,以及
-任选的第三启动子,cap开放阅读框和多聚腺苷酸化和/或终止序列,其中它们都是可操作地连接。
另参见图7,右图。
在上述每个方面中,将双链DNA分子与分别对该第一重组酶识别序列和第二重组酶识别序列和/或该第三重组酶识别序列和第四重组酶识别序列具有功能的重组酶进行孵育引起:
-位于该第一重组酶识别序列与该第三重组酶识别序列之间以及位于该第二重组酶识别序列与该第四重组酶识别序列之间的序列的反转,随后该第一启动子/该第三启动子可操作地连接至该第一开放阅读框/该第三开放阅读框,并且该第二启动子/该第四启动子可操作地连接至该第二开放阅读框/该第四开放阅读框,以及
-重组后在该第一启动子/第三启动子与第一开放阅读框/第三开放阅读框之间产生重组酶识别序列,其不再对该重组酶具有功能。
同样在上述三个方面,该第一重组酶识别序列在右反向重复序列中可包含突变,并且该第二重组酶识别序列在左反向重复序列中可包含突变。这将导致重组后在该第二启动子与该第二开放阅读框之间产生重组酶识别序列,其不再对该重组酶具有功能。
可通过使用驱动重组酶基因表达的可诱导启动子或通过导入重组酶编码mRNA等来实现暂时表达重组酶(例如Cre重组酶)。Carter,Z.和Delneri,D(Yeast 27(2010)765-775)报道了示例性的可诱导Cre重组酶表达系统。其中,通过将转染体暴露于半乳糖(YPGal)数小时,在转染体中诱导表达Cre重组酶。
腺病毒VA RNA基因
通过结合DNA反转与可操作连接至启动子的基因活化原理还可用于条件性活化腺病毒VA RNA基因转录。
腺病毒VA RNA基因由第2型聚合酶III启动子驱动,该启动子包含两个基因内元件A盒和B盒。Snouwaert等人(Nucl.Acids Res.15(1987)8293-8303)识别出VA RNAI B盒的突变体,这些突变体完全消除启动子活性。这些突变不太可能影响VA RNAI与PKR的结合以及相关功能(Clark,K.R.等人,Hum.Gene Ther.6(1995)1329-1341)。
本发明的另一方面为一种新腺病毒VA RNA基因。根据本发明的腺病毒VA RNA基因允许通过反转进行Cre重组酶介导的基因活化。在根据本发明的腺病毒VA RNA中,腺病毒VARNA基因可由具有精确转录起始位点和导入到腺病毒VA RNA的非编码(即调控)元件中的LoxP位点的任何启动子来驱动。
本案发明人已发现TATA盒可整合到LoxP位点的8bp间隔子中,从而产生出被特定工程化的新LoxP位点。该新LoxP间隔序列AGTTTATA(SEQ ID NO:01)表示为Lx。这种新间隔序列可与任何已知的反向重复序列组合,例如SEQ ID NO:14和15(=SEQ ID NO:14+SEQ IDNO:01+SEQ ID NO:15)的野生型LoxP反向重复序列,以及包含SEQ ID NO:50和51(=SEQ IDNO:03和05)的LE突变体和RE突变体序列的反向重复序列,包含顺向和反向(inv)形式(=SEQ ID NO:14+SEQ ID NO:02+SEQ ID NO:15):
Lx ataacttcgtata–agtttata–tatacgaagttat
Lx(inv)ataacttcgtata–tataaact-tatacgaagttat
Lx-LE taccgttcgtata–agtttata-tatacgaagttat
Lx-RE ataacttcgtata–agtttata-tatacgaacggta
下面示出了LoxP位点(1)、根据本发明的Lx-LE位点(具有突变的左反向重复序列)(2)以及示例性TATA盒(3)的序列比对(加下划线的是TATA盒,间隔序列为粗体):
(1)
Figure BDA0004166468400000851
(2)
Figure BDA0004166468400000852
(3)TTTATATAT
可看出,根据本发明的Lx-LE位点的TATA盒未改变,包含突变左重复序列(LE)、野生型右重复序列和新Lx间隔序列。
因此,本发明的一个方面为SEQ ID NO:30(TACCGTTCGTATAAGTTTATATATACGAAGTTA T)的Cre重组酶识别序列Lx-LE。
因此,本发明的一个独立方面为LoxP位点AGTTTATA(SEQ ID NO:01顺方向;SEQ IDNO:02反方向)。
在所有方面和实施例的某些实施例中,将SEQ ID NO:01或SEQ ID NO:02的间隔序列与野生型左反向重复序列和野生型右反向重复序列组合。此Cre重组酶识别序列在顺方向上具有SEQ ID NO:14+SEQ ID NO:01+SEQ ID NO:15序列的直接组合,在反方向上具有SEQ ID NO:14+SEQ ID NO:02+SEQ ID NO:15序列的直接组合。
在所有方面和实施例的某些实施例中,将SEQ ID NO:01或SEQ ID NO:02的间隔序列与突变左反向重复序列和野生型右反向重复序列组合。该Cre重组酶识别序列表示为Lx-LE,并且在顺方向上具有SEQ ID NO:03的序列,以及在反方向上具有SEQ ID NO:04的序列。
在所有方面和实施例的某些实施例中,将SEQ ID NO:01或SEQ ID NO:02的间隔序列与突变右反向重复序列和野生型左反向重复序列组合。该Cre重组酶识别序列表示为Lx-RE,并且在顺方向上具有SEQ ID NO:05的序列,以及在反方向上具有SEQ ID NO:06的序列。
本发明的另一个独立方面为SEQ ID NO:03的Cre重组酶识别序列在转录腺病毒VARNA基因中的用途。
本发明的另一个独立方面为新腺病毒VA RNA基因。根据本发明的腺病毒VA RNA基因允许通过反转进行Cre重组酶介导的基因活化。在根据本发明的腺病毒VA RNA中,腺病毒VA RNA基因转录可由具有精确转录起始位点和导入到腺病毒VA RNA的非编码(即调控)元件中的LoxP位点的任何启动子来驱动。
本发明的这个方面如图16所示。
病毒相关RNA(VA RNA)为调控翻译的腺病毒(Ad)的非编码RNA。腺病毒基因组包含两个独立的拷贝:VAI(VA RNAI)和VAII(VA RNAII)。两者都由RNA聚合酶III转录(参见,例如Machitani,M.等人,J.Contr.Rel.154(2011)285-289)。
Ma,Y.和Mathews,M.B.使用系统发育方法研究腺病毒相关RNA的结构、功能和进化(J.Virol.70(1996)5083-5099)。他们基于47种已知人腺病毒血清型提供了其比对和共有VA RNA序列。所述公开在此通过引用整体并入本申请中。
VA RNA、VAI和VAII是由157-160个核苷酸(nt)组成。
根据血清型,腺病毒含有一个或两个VA RNA基因。认为VA RNAI起到主要的前病毒的作用,而VA RNAII可部分地弥补VA RNAI的缺失(Vachon,V.K.和Conn,G.L.,VirusRes.212(2016)39-52)。
虽然VA RNA是非必要的,但其通过克服细胞抗病毒机制在有效的病毒生长中仍扮演着重要角色。也就是说,虽然VA RNA对于病毒生长是非必要的,但在载体生成的起始步骤中,VA RNA缺失的腺病毒无法生长,其中每个细胞仅存在数个病毒基因组拷贝,可能是因为未充分地表达阻断细胞抗病毒机制的VA RNA以外的病毒基因(参见Maekawa,A.等人,Nature Sci.Rep.3(2013)1136)。
已针对腺病毒血清型2(Ad 2)VA RNAI以实验方法定义了组成RNA聚合酶III的内部控制区(或启动子)的A盒和B盒。这些盒都具有相当的保守性。所有VA RNA在相似位置都具有这两个盒。B盒同源性非常高。位于B盒上游34到40nt的A盒在一些VA RNA中的同源性稍低。一对相互互补的四核苷酸CCGG(SEQ ID NO:77)和(U/C)CCGG(SEQ ID NO:78)形成VARNA的顶茎的一部分,在VA RNA序列中相当保守。第一CCGG是固定的,该第一CCGG包括B盒的前两个碱基。除了一个VA RNA基因,所有VA RNA基因在5'半部分具有与tRNA转录起始元件(分别为RRYNNARYGG(SEQ ID NO:79)和GWTCRANNC(SEQ ID NO:80)的A盒和B盒共有序列)同源的序列。VA RNAII基因中的A盒同源性通常比VA RNAI基因中的A盒同源性弱,这与A盒对VA RNA转录的重要性不如B盒的发现一致。VA RNA编码序列的末端是一串侧翼为核苷酸C和G的T残基,其为典型的聚合酶III终止位点。胸苷的数量从最少4个到超过10个不等,并且在T富集串的两侧至少缺乏3个A残基的核苷酸(Ad 12和Ad18除外,其在非常长的T串的中间具有A残基)(Ma,Y.和Mathews,M.B.,J.Virol.70(1996)5083-5099)。
已发现VA RNAI和VA RNAII的B盒序列对于内部聚合酶III启动子的活性是必要的。
Maekawa,A.等人(Nature Sci.Rep.3(2013)1136)报道了缺乏病毒相关RNA基因的腺病毒载体的高效生产,该腺病毒载体干扰细胞RNAi机制,其中对组成型地表达以及高度表达翻转酶重组酶的HEK293细胞进行感染以通过FLP重组酶介导切除VA RNA基因座来获得VA RNA缺失的腺病毒。
SEQ ID NO:81示出了人腺病毒2VA RNAI(GenBank条目AC_000007的核苷酸10586-10810)序列;SEQ ID NO:82示出了G58T/G59T/C68A(连续残基编号)序列。SEQ ID NO:83示出了人腺病毒5VA RNAI(GenBank条目AC_000008的核苷酸10579-10820)序列;SEQ ID NO:84示出人腺病毒5VA RNAI和VA RNAII序列。
Hahn,S.(Nat.Struct.Mol.Biol.11(2004)394-403)和Revyakin,A.等人(Gen.Devel.26(2012)1691-1702)报道了RNA聚合酶II转录机制的结构和机制,而Nikitina,T.V.和Tishchenko,L.I.(Mol.Biol.39(2005)161-172)回顾了RNA聚合酶III转录机制。这些都概括如下。
转录,即DNA模板上的RNA合成,是由DNA依赖性RNA聚合酶来进行的(Pols,[EC2.7.7.6])。除RNA聚合酶之外,还涉及其他因子,称为一般转录因子(GTF)。这些一般转录因子对识别启动子序列、对调控因子的反应以及转录过程中聚合酶活性所需的构象变化是必要的。
核心启动子(指定非调控或基础转录所需的最小DNA序列)用于将Pol定位在称为前起始复合体(PIC)的状态中。在这种状态下,Pol和GTF都与启动子结合,但未处于开始转录的活性构象。
真核细胞包含三个Pol,分别表示为I、II和III,它们的不同之处在于子单元组合物。
由特定的Pol所转录的基因被相应地分配到I、II或III类。
Pol I转录前rRNA的基因。除了U6 snRNA以外,Pol II转录所有蛋白编码基因和snRNA基因。Pol III转录5S rRNA、tRNA、U6 snRNA、7SK RNA、7SL RNA的基因;Alu重复序列;某些病毒基因;以及未翻译的较小的稳定RNA的基因。
不同类的基因的不同之处在于启动子结构,该启动子结构决定参与形成PIC的基本(一般)转录因子和Pol。
RNA聚合酶II(Pol II)负责将基因信息从DNA流向真核细胞中的信使RNA(mRNA)。研究已识别出以下GTF:TFIIA、TFIIB、TFIID、TFIIE、TFIIF和TFIIH,这些GTF与Pol II一起在启动子位点组装到PIC中,并且以基础活性量引导转录起始。转录活性的进一步调节取决于DNA模板中的顺式控制元件,这些顺式控制元件被共活化子所辅助的序列特异性活化子/阻抑物所识别。
在Pol II核心启动子中所发现的序列元件包括TATA元件(TATA结合蛋白(TBP)结合位点)、BRE(TFIIB识别元件)、Inr(启动子元件)和DPE(下游启动子元件)。大多数启动子包含一个或多个这些元件,但没有一个元件对启动子功能是绝对必要的。启动子元件为转录机制子单元的结合位点,并且用于将转录机制不对称地定位在启动子上以引导单方向转录。
TBP的核心结构域由两个不完美的重复序列组成以形成分子,该分子与8bp TATA元件上的DNA结合。在含有TATA的启动子上,形成这种蛋白质-DNA复合体是组装转录机制的第一步。类TATA序列位于转录起始位点上游约30bp处。
RNA聚合酶III(Pol III)在所有真核Pol中具有最复杂的结构:该酶由17个子单元组成,子单位范围从~10kDa至~160kDa,并且总分子量为600-680kDa。
由Pol III所转录的III类基因包含三个结构不同的启动子,其大多具有基因内位置。Pol III机制的一般转录因子为TFIIIA、TFIIIB、TFIIIC和小核RNA活化蛋白复合物(SNAPc)。
在III类基因(1型、2型、3型)的不同启动子上组装PIC需一个或多个A盒、B盒和C盒;内部控制区(ICR);TATA盒;远程(DSE)和近端(PSE)序列元件。1型基因在位置+57处包含A盒以及在位置+90处包含C盒,这些位置是相对于+1处的转录起始点。2型基因包含A盒和B盒。3型基因在位置-250处包含DSE、在位置-60处包含PSE以及在位置-27处包含TATA框,这些位置是相对于+1的转录起始点。可存在A盒,但并非必需的。
Pol III在所有三种类型的启动子上的募集和转录起始都需要转录因子IIIB(TFIIIB)的作用,并且募集和转录起始受到高度调控。TFIIIB结合位点为TATA盒周围+/-8nt。此外,所有三种聚合酶都需要TBP(Han,Y.等人,Cell.Discover.4(2018)40)。
关于三种类型的Pol III基因,Oler,A.J.等人(Nat.Struct.Mol.Biol.17(2010)620-628)基于1)顺式调控元件的存在和位置以及2)对特定基本或辅助转录因子的要求,概述了将Pol III导向至靶基因所需的因子以及人的三种“类型”的Pol III基因。简言之,5SrRNA为唯一需要TFIIIA的1型基因。1型和2型基因都需要TFIIIC,TFIIIC为一种基本因子和靶向复合体,其识别2型基因内的A盒和B盒元件,但不识别1型基因。TFIIIB复合体包括识别TATA/启动子和启动Pol III所需的TBP。2型和3型基因利用TFIIIB的选择性组装:BRF1(TFIIIB相关因子1)用于2型基因,并且BRF2(TFIIIB相关因子2)用于3型基因。3型基因缺乏内A盒或内B盒,并且不依赖于TFIIIC,而是依赖于上游PSE和DSE以及特定因子(OCT1、SNAPc等)进行靶向。尤其,3型Pol III启动子的结构类似于Pol II基因,其利用上游调控元件而非基因内元件。
在某些实施例中,根据本发明的新腺病毒VA RNA基因以5'-至3'-方向按以下顺序包含:
-腺病毒VA RNAI的至少六个5'-端核苷酸,其包含转录起始位点(TSS)(以防止绕过随后的聚合酶III(poly III)终止子);
-功能性聚合酶III终止子(以防止从任选地存在的组成型活性上游启动子来转录反向互补VA RNA),
-反向形式的腺病毒VA RNAI序列(以3'-至5'-方向)。
在所有方面和实施例的某些实施例中,VA RNA基因进一步包含融合至其5'-端的聚合酶启动子。
在所有方面和实施例的某些实施例中,根据本发明的腺病毒VA RNA基因在其5'-端进一步包含直接(或通过核苷酸连接子)融合至SEQ ID NO:03的Cre重组位点。在某些实施例中,根据本发明的腺病毒VA RNA基因在其5'-端包含直接(或通过核苷酸连接子)融合至SEQ ID NO:03的Cre重组酶位点,并且在其3'-端包含直接(或通过核苷酸连接子)融合至SEQ ID NO:06的Cre重组酶位点。
在所有方面和实施例的某些实施例中,根据本发明的腺病毒VA RNA序列包含SEQID NO:62或SEQ ID NO:81或SEQ ID NO:83的全部或部分野生型序列:
Figure BDA0004166468400000901
在所有方面和实施例的某些实施例中,根据本发明的腺病毒VA RNA序列包含具有SEQ ID NO:62的突变G58T、G59T和C68A(序列编号)(全部或部分的野生型序列):
Figure BDA0004166468400000902
Figure BDA0004166468400000911
/>
图15示出了包含上述SEQ ID NO:62与SEQ ID NO:63序列的比对。
根据本发明的腺病毒VA RNA基因在5'-端与SEQ ID NO:03融合,并且在3'-端与SEQ ID NO:06融合,图16示出了在RMCI之前的腺病毒VA RNA基因,图17示出了RMCI之后的腺病毒VA RNA基因。
在某些实施例中,根据本发明的腺病毒VA RNA以5'-至3'-方向按以下顺序包含以下序列:
(1)taccgttcgt ataagtttat atatacgaag ttat(SEQ ID NO:03)
(1a)任选的填充序列ggacgaaaca cc(SEQ ID NO:68)
(2)gggcac(SEQ ID NO:64)
(3)tttttt(SEQ ID NO:65)
(4)aggagcgctc ccccgttgtc tgacgtcgca cacctgggtt cgacacgcgg gcggtaaccgcatggatcac ggcggacggc cggatccggt gttcgaacaa cggtcgtccg ccatgatacc cttgcgaatttatccaccag accacggaag agtgccc
(SEQ ID NO:66)
(5)taccgttcgt atatataaac ttatacgaag ttat(SEQ ID NO:06)
在某些实施例中,根据本发明的腺病毒VA RNA基因包含以下序列:
Figure BDA0004166468400000912
在某些实施例中,根据本发明的Lx-LE位点包含以下序列,该序列包括用于适当间隔的填充序列:
taccgttcgt ataagtttat atatacgaag ttatggacga aacacc
(SEQ ID NO:69)。
本发明的另一方面为包含根据本发明的腺病毒VA RNA的细胞,该腺病毒VA RNA为原始形式或反向形式。
包含根据本发明的DNA元件和DNA分子的示例性用途和方法
根据本发明的双链DNA元件或分子以及任何核酸可用于生产重组AAV载体以及包含其的重组AAV颗粒。
本领域已知用于产生rAAV颗粒的不同方法。例如,使用AAV质粒和AAV辅助序列进行转染并且与一种AAV辅助病毒(例如腺病毒、疱疹病毒或牛痘病毒)共感染,或使用重组AAV质粒、AAV辅助质粒和辅助功能质粒进行转染。在例如US 6,001,650、US 6,004,797、WO2017/096039和WO 2018/226887中描述了产生rAAV颗粒的非限制性方法。在生产重组rAAV颗粒(即在细胞培养系统中产生颗粒)后,可从宿主细胞和细胞培养上清液中获得rAAV颗粒并进行纯化。
本发明的方面为使用根据本发明的分子诸如核酸(例如,质粒)转导细胞并产生相应基因产物的方法。此外,当用序列(例如编码病毒包装蛋白和/或辅助蛋白的质粒)转导此类细胞时,可产生重组病毒颗粒,该颗粒包括编码目的蛋白质的核酸或包含被转录成目的转录物的序列,其中至少一个核酸包含根据本发明的DNA元件或核酸进而以高产率产生重组病毒颗粒。
本发明提供病毒(例如,AAV)颗粒生产平台,该平台包括通过使用根据本发明的核酸或DNA(元件)的特征,该特征与目前“工业标准”的病毒(例如,AAV)颗粒生产过程不同。
在讨论核酸(质粒)时,可根据提供以5'至3'方向的序列的习惯,描述本文中的特定多核苷酸的序列或结构。
更普遍地,用根据本发明的DNA元件或核酸转染或转导的此类细胞可称为“重组细胞”。这种细胞例如可以为酵母细胞、昆虫细胞或哺乳动物细胞,其已被作为编码包装蛋白(诸如AAV包装蛋白)的核酸(质粒)、编码辅助蛋白的核酸(质粒)、编码蛋白质或被转录成目的转录物的核酸(质粒)(即置于两个AAV ITR之间的转基因,或其他转移核酸(质粒))的受体,其中至少一种核酸包含根据本发明的DNA元件或分子。该术语包括已经转导或经转染的原始细胞的子代。应当理解,由于自然、偶然或特意的突变,单一亲代细胞的子代在形态学或基因组或总核酸互补方面不一定与原始亲代完全相同。
许多适用于维持细胞存活率或提供细胞生长和/或增殖的细胞生长培养基可商购获得或可容易地生产。此类培养基的实例包括无血清真核生长培养基,诸如用于维持存活率或提供哺乳动物(例如,人)细胞生长的培养基。非限制性实例包括Ham's F12或F12K培养基(Sigma-Aldrich)、FreeStyle(FS)F17培养基(Thermo-Fisher Scientific)、MEM、DMEM、RPMI-1640(Thermo-Fisher Scientific)及其混合物。这种培养基可加入维生素和/或微量矿物质和/或盐和/或氨基酸,例如哺乳动物(例如,人)细胞的必需氨基酸。
辅助蛋白质粒可以为质粒、噬菌体、转座子或粘粒的形式。特别是,已证明辅助功能不需要完全互补腺病毒基因。例如,已证明无法进行DNA复制以及晚期基因合成的腺病毒突变体允许AAV复制。Ito等人,J.Gen.Virol.9(1970)243;Ishibashi等人,Virology 45(1971)317。
已显示E2B和E3区内的突变体支持AAV复制,表明E2B和E3区可能不参与提供辅助功能。Carter等人,Virology 126(1983)505。然而,在E1区有缺陷或具有缺失的E4区的腺病毒无法支持AAV复制。因此,对于腺病毒辅助蛋白,AAV复制可能直接地或间接地需要E1A和E4区(参见,例如,Laughlin等人,J.Virol.41(1982)868;Janik等人,Proc.Natl.Acad.Sci.USA 78(1981)1925;Carter等人,Virology 126(1983)505)。其他经表征的腺病毒突变体包括:E1B(Laughlin等人,(1982),同上;Janik等人(1981),同上;Ostrove等人,Virology 104(1980)502);E2A(Handa等人,J.Gen.Virol.29(1975)239;Strauss等人,J.Virol.17(1976)140;Myers等人,J.Virol.35(1980)665;Jay等人,Proc.Natl.Acad.Sci.USA 78(1981)2927;Myers等人,J.Biol.Chem.256(1981)567);E2B(Carter,Adeno-Associated Virus Helper Functions,in I CRC Handbook ofParvoviruses(P.Tijssen ed.,1990));E3(Carter等人,(1983),同上);和E4(Carter等人,(1983),同上;Carter(1995))。
针对E1B中具有突变的腺病毒提供的辅助蛋白的研究报道称,生产AAV颗粒需要E1B 55kDa蛋白,但不需要E1B 19kDa。此外,WO 97/17458和Matshushita等人(GeneTherapy 5(1998)938-945)描述了编码各种腺病毒基因的辅助功能质粒。辅助质粒的实例包含腺病毒VA RNA编码区、腺病毒E4ORF6编码区、腺病毒E2A 72kDa编码区、腺病毒E1A编码区以及缺乏完整E1B 55kDa编码区的腺病毒E1B区(参见,例如,WO 01/83797)。
因此,本文提供了一种使用根据本发明的DNA元件或核酸或DNA生产重组AAV载体或包含该重组AAV载体的AAV颗粒的方法,该AAV载体包含编码蛋白质的核酸或被转录成目的转录物的核酸。
本发明的一个方面为一种生产重组AAV载体或包含该重组AAV载体的AAV颗粒的方法,该AAV载体包含编码蛋白质的核酸或被转录成目的转录物的核酸,该方法包括以下步骤:
(i)提供包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸的一个或多个质粒,其中至少一种核酸包含根据本发明的DNA元件或分子;
(ii)提供包含核酸的质粒,该核酸编码目的蛋白质或被转录成目的转录物;
(iii)将一个或多个哺乳动物或昆虫细胞与所提供的质粒接触;
(iv)进一步加入转染试剂,并任选地孵育质粒/转染试剂/细胞混合物;或提供物理方式(诸如电流)以将核酸导入至细胞;
(v)培养转染细胞并在培养过程中的某个时间点/培养时间诱导RMCI;
(vi)从培养细胞中收获培养细胞和/或培养基,以产生细胞和/或培养基收获物;以及
(vii)从细胞和/或培养基收获物中分离和/或纯化重组AAV载体或AAV颗粒,从而产生包含编码目的蛋白质或被转录成目的转录物的核酸的重组AAV载体或AAV颗粒。
本发明的一个方面为一种生产重组AAV载体或包含该重组AAV载体的AAV颗粒的方法,该AAV载体包含编码蛋白质的核酸或被转录成目的转录物的核酸,该方法包括以下步骤:
(i)提供包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸的一个或多个质粒,其中至少一种核酸包含根据本发明的DNA元件或分子;
(ii)提供包含核酸的质粒,该核酸编码目的蛋白质或被转录成目的转录物;
(iii)将一个或多个哺乳动物或昆虫细胞与(i)所提供的质粒接触;
(iv)进一步加入转染试剂,并任选地孵育质粒/转染试剂/细胞混合物;或提供物理方式(诸如电流)以将核酸导入至细胞;
(v)选择稳定转染的细胞;
(vi)将(v)中选择的细胞与(ii)所提供的质粒接触;
(vii)进一步加入转染试剂,并任选地孵育质粒/转染试剂/细胞混合物;或提供物理方式(例如,电流)将核酸导入至细胞;
(viii)培养(viii)的转染细胞并且在培养过程中的某个时间点/培养时间诱导RMCI;
(ix)从培养细胞中收获培养细胞和/或培养基,以产生细胞和/或培养基收获物;以及
(x)从细胞和/或培养基收获物中分离和/或纯化重组AAV载体或AAV颗粒,从而产生包含编码目的蛋白质或被转录成目的转录物的核酸的重组AAV载体或AAV颗粒。
本发明的一个方面为一种生产重组AAV载体或包含该重组AAV载体的AAV颗粒的方法,该AAV载体包含编码蛋白质的核酸或被转录成目的转录物的核酸,该方法包括以下步骤:
(i)提供包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸的哺乳动物或昆虫细胞,其中至少一种核酸包含根据本发明的DNA元件或分子;
(ii)提供包含核酸的质粒,该核酸编码目的蛋白质或被转录成目的转录物;
(iii)将(i)的细胞与(ii)所提供的质粒接触;
(iv)进一步加入转染试剂,并任选地孵育质粒/转染试剂/细胞混合物;或提供物理方式(诸如电流)以将核酸导入至细胞;
(v)选择稳定转染的细胞;
(vi)培养(v)的稳定转染细胞并且在培养过程中的某个时间点/培养时间诱导RMCI;
(vii)从培养细胞中收获培养细胞和/或培养基,以产生细胞和/或培养基收获物;以及
(viii)从细胞和/或培养基收获物中分离和/或纯化重组AAV载体或AAV颗粒,从而产生包含编码目的蛋白质或被转录成目的转录物的核酸的重组AAV载体或AAV颗粒。
可以多种方式将包含根据本发明的DNA元件或分子的核酸导入至细胞中。
本领域已报道将DNA转移到哺乳动物细胞中的多种方法。这些方法在根据本发明的方法中都是有用的。在所有方面和实施例的某些实施例中,使用电穿孔、核转染或显微注射进行核酸转移/转染。在所有方面和实施例的某些实施例中,使用无机物质(诸如,例如,磷酸钙/DNA共沉淀)、阳离子聚合物(诸如,例如,聚乙烯亚胺、DEAE-葡聚醣)或阳离子脂质(脂质体)进行核酸转移/转染。磷酸钙和聚乙烯亚胺为用于大规模核酸转移的最常用转染试剂(参见,例如Baldi等人,Biotechnol.Lett.29(2007)677-684),其中优选为聚乙烯亚胺。
在所有方面和实施例的某些实施例中,以组合物的形式提供包含根据本发明的DNA元件或分子的核酸,该组合物与聚乙烯亚胺((PEI)组合,任选地与细胞组合。在某些实施例中,组合物包括质粒/PEI混合物,其具有多种组分:(a)一个或多个包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸的质粒,其中至少一个核酸包含根据本发明的DNA元件或分子;(b)包含编码蛋白质或被转录成目的转录物的核酸的质粒;以及(c)聚乙烯亚胺(PEI)溶液。在某些实施例中,质粒的摩尔比范围为约1:0.01至约1:100,或摩尔比范围为约100:1至约1:0.01,并且组分(a)、(b)和(c)的混合物被任选地孵育了约10秒至约4小时的一段时间。
在所有方面和实施例的某些实施例中,组合物进一步包含细胞。在某些实施例中,细胞与组分(a)、(b)和/或(c)的质粒/PEI混合物接触。
在所有方面和实施例的某些实施例中,组合物任选地与细胞组合,该组合物进一步包含游离PEI。在某些实施例中,细胞与游离PEI接触。
在所有方面和实施例的某些实施例中,细胞与组分(a)、(b)和/或(c)的混合物接触了至少约4小时,或约4小时至约140小时,或约4小时至约96小时。在一个优选实施例中,细胞与组分(a)、(b)和/或(c)以及任选的游离PEI的混合物接触了至少约4小时。
除包含根据本发明的DNA元件或分子的核酸的外,组合物还可包含其他质粒。此类质粒和细胞可与游离PEI接触。在某些实施例中,质粒和/或细胞与游离PEI接触了至少约4小时,或约4小时至约140小时,或约4小时至约96小时。
本发明还提供了使用包含根据本发明的DNA元件或分子的核酸以产生转染细胞的方法。该方法包括:提供包含根据本发明的DNA元件或分子以及任选的一个或多个额外质粒的核酸的步骤;提供包含聚乙烯亚胺(PEI)的溶液;以及将该核酸以及任选的质粒与PEI溶液混合,以产生核酸/质粒/PEI混合物。在某些实施例中,将这种混合物孵育约10秒至约4小时范围内的一段时间。在这种方法中,将细胞接着与核酸/质粒/PEI混合物接触以产生核酸/质粒/PEI细胞培养物;然后加入游离PEI至产生的核酸/质粒/PEI细胞培养物中,以产生游离PEI/核酸/质粒/PEI细胞培养物;然后将产生的游离PEI/核酸/质粒/PEI细胞培养物培养至少约4小时,从而产生转染细胞。在某些实施例中,质粒包含编码蛋白质或被转录成目的转录物的核酸。
进一步提供了用于产生转染细胞(其产生重组AAV载体或AAV颗粒)的方法,该方法包括:提供一个或多个质粒,该质粒包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸,其中至少一种核酸包含根据本发明的DNA元件或分子;提供包含编码蛋白质或转录成目的转录物的核酸的质粒;提供包含聚乙烯亚胺(PEI)的溶液;将上述质粒与PEI溶液混合,其中质粒的摩尔比范围为约1:0.01至约1:100,或摩尔比范围为约100:1至约1:0.01,以产生质粒/PEI混合物(并且任选地将质粒/PEI混合物孵育约10秒至约4小时范围内的一段时间);将细胞与质粒/PEI混合物接触,以产生质粒/PEI细胞培养物;向产生的质粒/PEI细胞培养物中加入游离PEI以产生游离PEI/质粒/PEI细胞培养物;以及将游离PEI/质粒/PEI细胞培养物孵育至少约4小时,从而产生转染细胞,该转染细胞产生包含编码蛋白质或被转录成目的转录物的核酸的重组AAV载体或颗粒。
另外提供了用于产生包含编码蛋白质的核酸或被转录成目的转录物的重组AAV载体或AAV颗粒的方法,该方法包括:提供一个或多个包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸的质粒,其中至少一种核酸包含根据本发明的DNA元件或分子;提供包含编码目的蛋白质或转录成目的转录物的核酸的质粒;提供包含聚乙烯亚胺(PEI)的溶液;将上述质粒与PEI溶液混合,其中质粒的摩尔比范围为约1:0.01至约1:100,或摩尔比范围为约100:1至约1:0.01,以产生质粒/PEI混合物(并且任选地将质粒/PEI混合物孵育约10秒至约4小时范围内的一段时间);将细胞与所述产生的质粒/PEI混合物接触以产生质粒/PEI细胞培养物;向所述产生的质粒/PEI细胞培养物中加入游离PEI以产生游离PEI/质粒/PEI细胞培养物;将产生的质粒/PEI细胞培养物或游离PEI/质粒/PEI细胞培养物孵育至少约4小时以产生转染细胞;从所产生的转染细胞中收获所产生的转染细胞和/或培养基,以产生细胞和/或培养基收获物;以及从产生的细胞和/或培养基收获物中分离和/或纯化重组AAV载体或颗粒,从而产生包含编码蛋白质或被转录成目的转录物的核酸的重组AAV载体或颗粒。
使用根据本发明的DNA元件生产重组AAV载体或AAV颗粒的方法可包括一个或多个另外的步骤或特征。示例性步骤或特征包括但不限于收获所产生的培养细胞和/或从所产生的培养细胞收获培养基以产生细胞和/或培养基收获物的步骤。另外的示例性步骤或特征包括但不限于从细胞和/或培养基收获物中分离和/或纯化重组AAV载体或AAV颗粒,从而产生包含编码蛋白质或被转录成目的转录物的核酸的重组AAV载体或AAV颗粒。
在所有方面和实施例的某些实施例中,在不同时间点将PEI加入至质粒和/或细胞。在某些实施例中,在质粒/PEI混合物与细胞接触之前、同时或之后,将游离PEI加入至细胞。
在所有方面和实施例的某些实施例中,当细胞与质粒/PEI混合物接触和/或与游离PEI接触时,细胞具有特定密度和/或细胞生长阶段和/或存活率。在一个优选实施例中,当细胞与质粒/PEI混合物接触和/或与游离PEI接触时,细胞的密度范围为约1x10E5细胞/mL至约1x10E8细胞/mL。在某些实施例中,当细胞与质粒/PEI混合物或与游离PEI接触时,细胞的存活率为约60%或大于60%,或其中当细胞与质粒/PEI混合物接触时,细胞处于对数生长期,或当细胞与质粒/PEI混合物或与游离PEI接触时,细胞的存活率为约90%或大于90%,或者其中当细胞与质粒/PEI混合物或与游离PEI接触时,细胞处于对数生长期。
在所有方面和实施例的某些实施例中,所编码的AAV包装蛋白包括AAV rep和/或AAV cap。在所有方面和实施例的某些实施例中,这种AAV包装蛋白包括任何AAV血清型的AAV rep和/或AAV cap蛋白。
在所有方面和实施例的某些实施例中,所编码的辅助蛋白包括腺病毒E2和/或E4、VARNA蛋白和/或非AAV辅助蛋白。
在所有方面和实施例的某些实施例中,使用特定量或比例的核酸(质粒)。在某些实施例中,包含编码蛋白质或被转录成目的转录物的核酸的质粒以及包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸(其中至少一种核酸包含根据本发明的DNA元件或分子)的一个或多个质粒的总量是在每mL细胞约0.1μg至约15μg的范围内。在某些实施例中,包含编码蛋白质或被转录成目的转录物的核酸的质粒与包含编码AAV包装蛋白的核酸和/或编码辅助蛋白的核酸(其中至少一种核酸包含根据本发明的DNA元件或分子)的一个或多个质粒的摩尔比是在约1:5至约1:1的范围内,或在约1:1至约5:1的范围内。
质粒可包括不同或相同质粒上的核酸。在所有方面和实施例的某些实施例中,第一质粒包含编码AAV包装蛋白的核酸,并且第二质粒包含编码辅助蛋白的核酸。这种核酸中的至少一种核酸包含根据本发明的DNA元件或分子。
在所有方面和实施例的某些实施例中,包含编码蛋白质或被转录成目的转录物的核酸的质粒与包含编码AAV包装蛋白的核酸的第一质粒以及包含编码辅助蛋白的核酸的第二质粒在共转染中的摩尔比是在约1-5:1:1,或1:1-5:1,或1:1:1-5的范围内。
在所有方面和实施例的某些实施例中,细胞为真核细胞。在某些实施例中,真核细胞为哺乳动物细胞。在一个优选实施例中,细胞为HEK293细胞或CHO细胞。
可使用培养真核细胞的常用条件进行培养,即约37℃、95%湿度以及8体积%的CO2。可在含血清或无血清培养基中进行贴壁培养或悬浮培养。悬浮培养可在任何发酵容器中进行,例如在搅拌釜反应器、波反应器、振动容器或旋转容器或在所谓的滚瓶中进行。可分别以高通量形式和筛选进行转染,例如在96或384孔形式中进行。
根据本发明的方法包括任何血清型的AAV颗粒或其变体。在所有方面和实施例的某些实施例中,重组AAV颗粒包含以下中的任一者:AAV血清型1-12、AAV VP1、VP2和/或VP3衣壳蛋白,或经修饰的或变体AAV VP1、VP2和/或VP3衣壳蛋白,或野生型AAV VP1、VP2和/或VP3衣壳蛋白。在所有方面和实施例的某些实施例中,AAV颗粒包含AAV血清型或AAV假型,其中AAV假型包括不同于ITR血清型的AAV衣壳血清型。
提供或包括AAV载体或颗粒的根据本发明的方法还可包括其他元件。这种元件的实例包括但不限于:内含子、表达控制元件、一种或多种腺相关病毒(AAV)反向末端重复序列(ITR)和/或填充物/填充多核苷酸序列。这种元件可位于编码蛋白质或被转录成目的转录物的核酸内或侧翼,或表达控制元件可操作地连接至核酸,该核酸编码蛋白质或被转录成目的转录物,或AAV ITR可位于核酸的5'-或3'-末端的侧翼,该核酸编码蛋白质或被转录成目的转录物,或填充多核苷酸序列可位于核酸的5'-或3'-末端的侧翼,该核酸编码蛋白质或被转录成目的转录物。
表达控制元件包括组成型或可调控控制元件,例如组织特异性表达控制元件或启动子(例如提供在肝脏中的表达)。
ITR可以为以下任一者:AAV2或AAV6或AAV8或AAV9血清型,或其组合。AAV颗粒可包括与以下各项具有75%或更多序列一致性的任何VP1、VP2和/或VP3衣壳蛋白:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV10、AAV11、AAV-2i8或AAV rh74 VP1、VP2和/或VP3衣壳蛋白,或包含选自以下各项的任何经修饰的或变体VP1、VP2和/或VP3衣壳蛋白:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV10、AAV11、AAV-2i8和AAV-rh74 AAV血清型。
在产生如本文所述的重组病毒(例如,AAV)颗粒之后,如果需要,可使用各种常规方法从宿主细胞中纯化和/或分离病毒(例如,rAAV)颗粒。这些方法包括柱色谱、CsCl梯度等。例如,可使用多个柱纯化步骤,例如在阴离子交换柱、亲和性柱和/或阳离子交换柱上的纯化。(参见,例如WO 02/12455和US 2003/0207439)。可选择地或此外,可使用CsCl梯度步骤(参见,例如US 2012/0135515;和US 2013/0072548)。此外,如果使用感染性病毒来表达包装和/或辅助蛋白,则可使用各种方法使残留病毒失活。例如,可通过加热到约60℃的温度例如20分钟或更长时间来使腺病毒失活。这种处理有效地使辅助病毒失活,因为AAV是热稳定的,而辅助腺病毒是热不稳定的。
病毒载体(例如小病毒颗粒,其包括AAV血清型及其变体)提供一种将核酸以离体、体外以及体内递送到细胞中的方式,这些载体编码蛋白质而使细胞表达所编码的蛋白质。AAV是作为基因治疗载体的病毒,因其可穿透细胞并导入核酸/基因材料而使核酸/基因材料可在细胞中稳定地维持。此外,例如,这些病毒可将核酸/基因材料导入至特定位点。由于AAV与人的致病性疾病无关,因此AAV载体能够将异源多核苷酸序列(例如治疗蛋白质和药剂)递送至人类患者,而不会引起实质性的AAV发病机制或疾病。
可使用的病毒载体包括但不限于多种血清型(例如AAV-1至AAV-12,以及其他)的腺相关病毒(AAV)颗粒和杂合/嵌合AAV颗粒。
AAV颗粒可作为有助于有效递送基因的载体。这种颗粒具有许多适用于此类应用的期望特征,包括对分裂细胞和非分裂细胞的向性。早期临床经验还证实了这些载体并无持续的毒性,并且引起很小的免疫反应或检测不到免疫反应。已知AAV在体内以及体外通过受体介导的胞吞作用或胞吞转送作用感染各种细胞类型。这些载体系统已在人类中进行测试,这些载体靶向视网膜上皮、肝脏、骨骼肌、气管、大脑、关节和造血干细胞。
重组AAV颗粒通常不包括与发病机制相关的病毒基因。这种载体通常具有一个或多个全部或部分缺失的野生型AAV基因(例如rep和/或cap基因),但保留至少一个功能侧翼ITR序列,这是修复、复制及将重组载体包装成AAV颗粒所必需的。例如,仅包括载体的必要部分,例如分别为ITR和LTR元件。因此,AAV载体基因组包括复制和包装所需的顺式序列(例如,功能ITR序列)。
重组AAV载体及其方法以及用途包括任何病毒株或血清型。作为非限制性实例,重组AAV载体可基于任何AAV基因组,诸如,例如,AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV 2i8或AAV rh74。这种载体可基于相同或者彼此不同的病毒株或血清型(或亚群或变体)。作为非限制性实例,基于一种血清型基因组的重组AAV载体可与包装载体的一种或多种衣壳蛋白相同。此外,重组AAV载体基因组可基于与包装载体的一种或多种AAV衣壳蛋白不同的AAV(例如AAV2)血清型基因组。例如,AAV载体基因组可基于AAV2,而三种衣壳蛋白中的至少一种可以为例如AAV1、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8,或AAV rh74或其变体。AAV变体包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8和AAVrh74衣壳的变体和嵌合体。
在所有方面和实施例的某些实施例中,腺相关病毒(AAV)载体包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8和AAV rh74,及其变体(例如,衣壳变体,例如氨基酸插入、加入、取代和缺失),例如,如WO 2013/158879、WO2015/013313和US 2013/0059732(公开了LK01、LK02、LK03等)中所述。
AAV和AAV变体(例如衣壳变体)血清型(例如,VP1、VP2和/或VP3序列)可与其他AAV血清型不同或并未不同,其他AAV血清型包括例如AAV1-AAV12(例如,与任何AAV1-AAV12的血清型的VP1、VP2和/或VP3的序列不同)。
在所有方面和实施例的某些实施例中,与参考血清型相关的AAV颗粒具有多核苷酸、多肽或其子序列,该多核苷酸、多肽或其子序列包括或由以下组成:与一个或多个AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8或AAV rh74(例如,诸如ITR,或VP1、VP2和/或VP3序列)具有至少80%或更多(例如,85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等)一致性的序列。
本发明的组合物、方法以及用途包括AAV序列(多肽和核苷酸)及其子序列,该子序列展现出与参考AAV血清型(诸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8或AAV rh74)低于100%的序列一致性,但不同于已知的AAV基因或蛋白质(诸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8或AAV rh74、基因或蛋白质等)。在所有方面和实施例的某些实施例中,AAV多肽或其子序列包括或由以下组成:与任何参考AAV序列或其子序列(诸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8或AAV rh74(例如,VP1、VP2和/或VP3衣壳或ITR))具有至少75%或更多(例如80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等、高达100%)一致性的序列。在某些实施例中,AAV变体具有1个、2个、3个、4个、5个、5-10个、10-15个、15-20个或更多个氨基酸取代。
可使用本领域技术人员已知的重组技术来构建重组AAV颗粒(包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-2i8或AAV rh74,以及变体的、相关的、混合和嵌合序列),使该AAV颗粒包括侧翼为一个或多个功能性AAV ITR序列的一个或多个核酸序列(转基因)。
可将重组颗粒(例如,rAAV颗粒)并入医药组合物中。此种医药组合物尤其可用于在体内或离体向个体施用和递送。在某些实施例中,医药组合物含有药学上可接受的载体或赋形剂。这种赋形剂包括本身不诱导对接受该组合物的个体有害的免疫反应的任何药剂,并且其可在不产生过度毒性的情况下施用。
US 5,998,205、US 6,228,646、US 6,093,699、US 6,100,242、WO 94/17810和WO94/23744描述了用于产生腺病毒载体的方案,这些文献的全部内容通过引用并入本文。
尽管对人具有致病性,但rAAV载体生产和纯化系统的目标是实现以最大限度降低/控制生产相关杂质(诸如蛋白质、核酸和载体相关杂质,包括野生型/假野生型AAV物种(wtAAV)和AAV封装的残留DNA杂质)的产生的策略。
考虑到rAAV颗粒仅代表生物质的一小部分,rAAV颗粒需纯化到一定程度的纯度才能用作临床人基因治疗产品(参见,例如Smith P.H.等人,Mo.Therapy 7(2003)8348;Chadeuf G.等人,Mo.Therapy 12(2005)744;来自CHMP基因治疗专家小组会议报告,欧洲药品管理局EMEA/CHMP 2005,183989/2004)。
作为起始步骤,通常为收获产生rAAV颗粒的培养细胞,任选地与收获其中培养了产生rAAV颗粒的细胞(悬浮或贴壁)的细胞培养上清液(培养基)结合。可按原样、适当地或浓缩地使用收获的细胞以及任选的细胞培养上清液。此外,如果使用感染以表达辅助功能,则可使残留的辅助病毒失活。例如,可通过加热到约60℃的温度例如20分钟或更长时间来使腺病毒失活,这仅仅使辅助病毒失活,因为AAV是热稳定的,而辅助腺病毒是热不稳定的。
通过破坏细胞(例如通过化学或物理方式,诸如清洁剂、微流化和/或均质化)来裂解收获物的细胞和/或上清液,以释放rAAV颗粒。在细胞裂解过程中同时或随后在细胞裂解之后,加入核酸酶(例如benzonase)以降解污染DNA。通常,将所得裂解物澄清以去除细胞碎片(例如通过过滤或离心),以得到澄清的细胞裂解液。在一个特定的实例中,将裂解物用微米孔径的过滤器(诸如0.1-10.0μm孔径的过滤器,例如0.45μm和/或孔径0.2μm的过滤器)过滤,以产生澄清的裂解物。
裂解物(任选的澄清裂解物)含有AAV颗粒(包括rAAV载体和空衣壳)以及生产/方法相关杂质,诸如来自宿主细胞的可溶细胞组分,这些组分尤其可包括细胞蛋白质、脂质和/或核酸以及细胞培养基组分。然后对任选的澄清裂解物进行纯化步骤,以使用色谱法从杂质中纯化出AAV颗粒(包含rAAV载体)。在第一色谱步骤之前,可用合适的缓冲液稀释或浓缩澄清裂解物。
在细胞裂解、任选的澄清以及任选的稀释或浓缩之后,可使用多个后续和顺序色谱步骤来纯化rAAV颗粒。
第一色谱步骤可以为阳离子交换色谱或阴离子交换色谱。如果第一色谱步骤为阳离子交换色谱,则第二色谱步骤可以为阴离子交换色谱或尺寸排阻色谱(SEC)。因此,在所有方面和实施例的某些实施例中,经由阳离子交换色谱进行rAAV颗粒纯化,然后是经由阴离子交换色谱进行纯化。
或者,如果第一色谱步骤为阳离子交换色谱,则第二色谱步骤可以为尺寸排阻色谱(SEC)。因此,在所有方面和实施例的某些实施例中,经由阳离子交换色谱进行rAAV颗粒纯化,然后是经由尺寸排阻色谱(SEC)进行纯化。
或者,第一色谱步骤可以为亲和色谱。如果第一色谱步骤为亲和色谱,则第二色谱步骤可以为阴离子交换色谱。因此,在所有方面和实施例的某些实施例中,经由亲和色谱进行rAAV颗粒纯化,然后经由阴离子交换色谱进行纯化。
任选地,可将第三色谱法加入到前述色谱步骤中。通常,任选的第三色谱步骤是在阳离子交换、阴离子交换、尺寸排阻或亲和色谱之后。
因此,在所有方面和实施例的某些实施例中,经由亲和色谱进行rAAV颗粒纯化,然后经由阴离子交换色谱进行纯化,再然后经由尺寸排阻色谱(SEC)进行纯化。
此外,在所有方面和实施例的某些实施例中,经由阳离子交换色谱进行进一步rAAV颗粒纯化,然后通经由尺寸排阻色谱(SEC)进行纯化,再然后经由阴离子交换色谱进行纯化。
在所有方面和实施例的更进一步的实施例中,经由亲和色谱进行rAAV颗粒纯化,然后经由阴离子交换色谱进行纯化,再然后经由尺寸排阻色谱(SEC)进行纯化。
在所有方面和实施例的更进一步的实施例中,经由亲和色谱进行rAAV颗粒纯化,然后经由尺寸排阻色谱(SEC)进行纯化,然后经由阴离子交换色谱进行纯化。
阳离子交换色谱的作用是将AAV颗粒与存在于澄清裂解物和/或来自亲和或尺寸排阻色谱的柱洗脱液中的细胞以及其他组分分离。能够在较广的pH范围内结合rAAV颗粒的强大阳离子交换树脂的实例包括但不限于任何基于磺酸的树脂,如由磺酸盐官能团(包括经芳基和烷基取代的磺酸盐)的存在指示的树脂,诸如磺丙基或磺乙基树脂。代表性基质包括但不限于POROS HS、POROS HS 50、POROS XS、POROS SP和POROS S(可购自Thermo FisherScientific,Inc.,Waltham,MA,USA的强大阳离子交换剂)。其他实例包括Capto S、Capto SImpAct、Capto S ImpRes(可购自GE Healthcare,Marlborough,MA,USA的强大阳离子交换剂),以及可购自Aldrich Chemical Company(Milliwaukee,WI,USA)的商业
Figure BDA0004166468400001061
和/>
Figure BDA0004166468400001062
系列树脂。弱阳离子交换树脂包括但不限于任何基于羧酸的树脂。示例性阳离子交换树脂包括羧甲基(CM)、磷(基于磷酸官能团)、甲基磺酸(S)和磺丙基(SP)树脂。
阴离子交换色谱的作用是将AAV颗粒与存在于澄清裂解物和/或来自亲和或阳离子交换或尺寸排阻色谱的柱洗脱液中的蛋白质、细胞以及其他组分分离。阴离子交换色谱还可用于减少并由此控制洗脱液中空衣壳的量。例如,可用包含适当浓度(例如,约100-125mM,诸如110-115mM)的NaCl溶液洗涤其上结合了rAAV颗粒的阴离子交换柱,并且可在没有显著洗脱rAAV颗粒的流动中洗脱一部分空衣壳。随后,可使用包含更高浓度(例如,约130-300mM NaCl)的NaCl溶液洗脱与阴离子交换柱结合的rAAV颗粒,从而产生柱洗脱液,该柱洗脱液具有减少量或耗尽量的空衣壳以及成比例增加量的rAAV颗粒,该rAAV颗粒包含rAAV载体。
示例性阴离子交换树脂包括但不限于基于聚胺树脂以及其他树脂的阴离子交换树脂。强大的阴离子交换树脂的实例包括通常基于季铵化氮原子的阴离子交换树脂,包括但不限于季铵盐树脂,诸如三烷基芐基铵树脂。合适的交换色谱材料包括但不限于MACROPREP Q(可购自BioRad,Hercules,CA,USA的强大阴离子交换剂);UNOSPHERE Q(可购自BioRad,Hercules,CA,USA的强大阴离子交换剂);POROS 50HQ(可购自AppliedBiosystems,Foster City,CA,USA的强大阴离子交换剂);POROS XQ(可购自AppliedBiosystems,Foster City,CA,USA的强大阴离子交换剂);POROS SOD(可购自AppliedBiosystems,Foster City,CA,USA的弱阴离子交换剂);POROS 50PI(可购自AppliedBiosystems,Foster City,CA,USA的弱阴离子交换剂);Capto Q、Capto XQ、Capto QImpRes和SOURCE 30Q(可购自GE healthcare,Marlborough,MA,USA的强大阴离子交换剂);DEAE SEPHAROSE(可购自Amersham Biosciences,Piscataway,NJ,USA的弱阴离子交换剂);Q SEPHAROSE(可购自Amersham Biosciences,Piscataway,NJ,USA的强大阴离子交换剂)。另外的示例性阴离子交换树脂包括氨基乙基(AE)、二乙基氨基乙基(DEAE)、二乙基氨基丙基(DEPE)和季氨基乙基(QAE)。
用于纯化旨在用作治疗人类疾病的产品的重组AAV颗粒的制造方法应实现以下目的:1)一致的颗粒纯度、效力和安全性;2)制造方法的可扩展性;3)可接受的制造成本。
在WO 2019/006390中报道了纯化重组AAV颗粒的示例性方法。
下面概述了重组腺相关病毒颗粒(rAAV颗粒)的纯化和生产方法可扩展到大规模。例如,扩展到5升、10升、10-20升、20-50升、50-100升、100-200升或更多升体积的悬浮培养物。重组腺相关病毒颗粒的纯化和生产方法适用于各种AAV血清型/衣壳变体。
在所有方面和实施例的某些实施例中,纯化rAAV颗粒包括以下步骤:
(a)收获包含rAAV颗粒的细胞和/或细胞培养上清液以产生收获物;
(b)任选地浓缩步骤(a)中产生的收获物以产生浓缩收获物;
(c)裂解步骤(a)中产生的收获物或裂解步骤(b)中产生的浓缩收获物以产生裂解物;
(d)处理步骤(c)中产生的裂解物以减少裂解物中的污染核酸,从而产生核酸减少的裂解物;
(e)任选地过滤步骤(d)中产生的核酸减少的裂解物,以产生澄清裂解物,并且任选地稀释该澄清裂解物以产生稀释的澄清裂解物;
(f)对步骤(d)的核酸减少的裂解物、步骤(e)的澄清裂解物或步骤(e)中产生的稀释的澄清裂解物进行阳离子交换柱色谱,以产生包含rAAV颗粒的柱洗脱液,从而将rAAV颗粒与蛋白质杂质或其他的生产/方法相关杂质分离,并且任选地稀释柱洗脱液,以产生稀释柱洗脱液;
(g)对步骤(f)中产生的柱洗脱液或稀释柱洗脱液进行阴离子交换色谱,以产生包含rAAV颗粒的第二柱洗脱液,从而将rAAV颗粒与蛋白质杂质或生产/方法相关杂质分离,并且任选地浓缩该第二柱洗脱液,以产生浓缩的第二柱洗脱液;
(h)对步骤(g)中产生的第二柱洗脱液或浓缩第二柱洗脱液进行尺寸排阻色谱(SEC),以产生包含rAAV颗粒的第三柱洗脱液,从而将rAAV颗粒与蛋白质杂质或生产/方法相关杂质分离,并且任选地浓缩该第三柱洗脱液,以产生浓缩的第三柱洗脱液;以及
(i)过滤步骤(h)中产生的第三柱洗脱液或浓缩第三柱洗脱液,从而产生纯化的rAAV颗粒。
在某些实施例中,保持步骤(a)至(f)并且与以下步骤组合:
(g)对步骤(f)中产生的柱洗脱液或浓缩柱洗脱液进行尺寸排阻色谱(SEC),以产生包含rAAV颗粒的第二柱洗脱液,从而将rAAV颗粒与蛋白质杂质或其他的生产/方法相关杂质分离,并且任选地稀释该第二柱洗脱液,以产生浓缩的第二柱洗脱液;
(h)对步骤(g)中产生的第二柱洗脱液或稀释的第二柱洗脱液进行阴离子交换色谱,以产生包含rAAV颗粒的第三柱洗脱液,从而将rAAV颗粒与蛋白质杂质或生产/方法相关杂质分离,并且任选地稀释该第三柱洗脱液,以产生稀释的第三柱洗脱液;以及
(i)过滤步骤(h)中产生的第三柱洗脱液或浓缩第三柱洗脱液,从而产生纯化的rAAV颗粒。
在某些实施例中,保持步骤(a)至(g)并且与以下步骤组合:
(h)过滤步骤(g)中产生的第二柱洗脱液或浓缩的第二柱洗脱液,从而产生纯化rAAV颗粒。
在实施例中,保持步骤(a)至(e)并且与以下步骤组合:
(f)对步骤(d)中的核酸减少的裂解物或步骤(e)中产生的澄清裂解物或稀释的澄清裂解物进行AAV亲和力柱色谱,以产生包含rAAV颗粒的柱洗脱液,从而将rAAV颗粒与蛋白质杂质或其他的生产/方法相关杂质分离,并且任选地浓缩柱洗脱液,以产生浓缩的柱洗脱液;
(g)对步骤(f)中产生的柱洗脱液或浓缩柱洗脱液进行尺寸排阻色谱(SEC),以产生包含rAAV颗粒的第二柱洗脱液,从而将rAAV颗粒与蛋白质杂质或其他的生产/方法相关杂质分离,并且任选地稀释第二柱洗脱液,以产生稀释的第二柱洗脱液;
(h)任选地对步骤(g)中产生的第二柱洗脱液或稀释的第二柱洗脱液进行阴离子交换色谱,以产生包含rAAV颗粒的第三柱洗脱液,从而将rAAV颗粒与蛋白质杂质或其他的生产/方法相关杂质分离,并且任选地稀释该第三柱洗脱液,以产生稀释的第三柱洗脱液;以及
(i)过滤步骤(g)中产生的第二柱洗脱液或稀释的第二柱洗脱液,或过滤步骤(h)中产生的第三柱洗脱液或浓缩的第三柱洗脱液,从而产生纯化的rAAV颗粒。
在所有方面和实施例的某些实施例中,经由超滤/渗滤,诸如通过切向流过滤(TFF),进行步骤(b)和/或步骤(f)和/或步骤(g)和/或步骤(h)的浓缩。
在所有方面和实施例的某些实施例中,步骤(b)的浓缩将收获的细胞和细胞培养上清液的体积减少约2-20倍。
在所有方面和实施例的某些实施例中,步骤(f)和/或步骤(g)和/或步骤(h)的浓缩将柱洗脱液的体积减少约5-20倍。
在所有方面和实施例的某些实施例中,通过物理或化学方式进行步骤(a)中产生的收获物或步骤(b)中产生的浓缩收获物的裂解。物理方式的非限制性实例包括微流化和均质化。化学方式的非限制性实例包括清洁剂。清洁剂包括非离子清洁剂和离子清洁剂。非离子清洁剂的非限制性实例包括Triton X-100。清洁剂浓度的非限制性实例为约0.1%和1.0%(v/v)或(w/v)之间(包括端值)。
在所有方面和实施例的某些实施例中,步骤(d)包括用核酸酶处理从而减少污染核酸。核酸酶的非限制性实例包括benzonase。
在所有方面和实施例的某些实施例中,经由过滤器来过滤步骤(e)的澄清裂解物或稀释的澄清裂解物。过滤器的非限制性实例为孔径处于约0.1至10.0微米之间(包括端值)的过滤器。
在所有方面和实施例的某些实施例中,步骤(e)的稀释的澄清裂解物是使用缓冲磷酸盐、乙酸盐或Tris水溶液。溶液pH的非限制性实例为处于约pH4.0至pH 7.4之间(包括端值)。Tris溶液pH的非限制性实例为大于pH 7.5,诸如处于约pH 8.0和pH 9.0之间(包括端值)。
在所有方面和实施例的某些实施例中,步骤(f)的稀释柱洗脱液或步骤(g)的稀释的第二柱洗脱液是使用缓冲磷酸盐、乙酸盐或Tris水溶液。溶液pH的非限制性实例为处于约pH 4.0至pH 7.4之间(包括端值)。Tris溶液pH的非限制性实例为大于pH 7.5,诸如处于约pH 8.0和pH 9.0之间(包括端值)。
在所有方面和实施例的某些实施例中,将步骤(i)产生的rAAV颗粒与表面活性剂一起调配,以产生rAAV颗粒制剂。
在所有方面和实施例的某些实施例中,步骤(f)、(g)和/或(h)的阴离子交换柱色谱包含聚乙二醇(PEG)调节的柱色谱。
在所有方面和实施例的某些实施例中,在从柱洗脱rAAV颗粒之前,用PEG溶液洗涤步骤(g)和/或(h)的阴离子交换柱色谱。
在所有方面和实施例的某些实施例中,PEG的平均分子量在约1,000g/mol至80,000g/mol的范围内(包括端值)。
在所有方面和实施例的某些实施例中,PEG的浓度为约4%至约10%(w/v)(包括端值)。
在所有方面和实施例的某些实施例中,在从柱洗脱rAAV颗粒之前,用表面活性剂水溶液洗涤步骤(g)和/或(h)的阴离子交换柱。
在所有方面和实施例的某些实施例中,在从柱洗脱rAAV颗粒之前,用表面活性剂溶液洗涤步骤(f)的阳离子交换柱。
在所有方面和实施例的某些实施例中,PEG溶液和/或表面活性剂溶液包含水性Tris-HCl/NaCl缓冲液、水性磷酸盐/NaCl缓冲液或水性醋酸盐/NaCl缓冲液。
在所有方面和实施例的某些实施例中,缓冲液或溶液中的NaCl浓度处于约20-300mM NaCl之间(包括端值)或处于约50-250mM NaCl(包括端值)之间的范围内。
在所有方面和实施例的某些实施例中,表面活性剂包含阳离子表面活性剂或阴离子表面活性剂。
在所有方面和实施例的某些实施例中,表面活性剂包含十二碳链表面活性剂。
在所有方面和实施例的某些实施例中,表面活性剂包含十二烷基三甲基氯化铵(DTAC)或十二烷基肌氨酸钠(Sarkosyl)。
在所有方面和实施例的某些实施例中,用水性Tris-HCl/NaCl缓冲液从步骤(f)、(g)和/或(h)的阴离子交换柱洗脱出rAAV颗粒。
在所有方面和实施例的某些实施例中,Tris-HCl/NaCl缓冲液包含100-400mMNaCl(包括端值),任选地其pH是在约pH 7.5至约pH 9.0(包括端值)的范围内。
在所有方面和实施例的某些实施例中,用水性Tris-HCl/NaCl缓冲液洗涤步骤(g)和/或(h)的阴离子交换柱。
在所有方面和实施例的某些实施例中,水性Tris-HCl/NaCl缓冲液中的NaCl浓度是在约75-125mM的范围内(包括端值)。
在所有方面和实施例的某些实施例中,水性Tris-HCl/NaCl缓冲液的pH是pH 7.5至约pH 9.0(包括端值)。
在所有方面和实施例的某些实施例中,洗涤一次或多次步骤(f)、(g)和/或(h)的阴离子交换柱,以减少第二柱洗脱液或第三柱洗脱液中空衣壳的量。
在所有方面和实施例的某些实施例中,在rAAV颗粒洗脱之前和/或代替rAAV颗粒洗脱,阴离子交换柱的洗涤从柱中去除空衣壳,从而减少在第二柱洗脱液或第三柱洗脱液中空衣壳的量。
在所有方面和实施例的某些实施例中,在rAAV颗粒洗脱之前和/或代替rAAV颗粒洗脱,阴离子交换柱的洗涤从柱中去除总空衣壳的至少约50%,从而减少在第二柱洗脱液或第三柱洗脱液中空衣壳的量约50%。
在所有方面和实施例的某些实施例中,水性Tris-HCl/NaCl缓冲液中的NaCl浓度是在约110-120mM的范围内(包括端值)。
在所有方面和实施例的某些实施例中,洗脱的rAAV颗粒与空衣壳的比率和/或量由洗涤缓冲液来控制。
在所有方面和实施例的某些实施例中,在水性磷酸盐/NaCl缓冲液或水性乙酸盐/NaCl缓冲液中,从步骤(f)的阳离子交换柱洗脱出rAAV颗粒。缓冲液中的非限制性NaCl浓度在约125-500mM NaCl的范围内(包括端值)。缓冲液的pH的非限制性实例处于约pH 5.5至约pH 7.5之间(包括端值)。
在所有方面和实施例的某些实施例中,步骤(f)、(g)和/或(h)的阴离子交换柱包含季铵官能团,诸如季铵化聚乙烯亚胺。
在所有方面和实施例的某些实施例中,步骤(g)和/或(h)的尺寸排阻柱(SEC)的分离/分馏范围(分子量)是约10,000g/mol至约600,000g/mol(包括端值)。
在所有方面和实施例的某些实施例中,步骤(f)的阳离子交换柱包含磺酸或诸如磺丙基的官能团。
在所有方面和实施例的某些实施例中,AAV亲和柱包含结合至AAV衣壳蛋白的蛋白质或配体。蛋白质的非限制性实例包括结合至AAV衣壳蛋白的抗体。更具体的非限制性实例包括结合至AAV衣壳蛋白的单链大羊驼(骆驼科)抗体。
在所有方面和实施例的某些实施例中,方法排除氯化铯梯度超速离心的步骤。
在所有方面和实施例的某些实施例中,该方法从步骤(a)中产生的收获物或步骤(b)中产生的浓缩收获物中回收总的rAAV颗粒的大约50-90%。
在所有方面和实施例的某些实施例中,该方法生产的rAAV颗粒的纯度大于通过单一AAV亲和柱纯化生产或纯化的rAAV颗粒。
在所有方面和实施例的某些实施例中,实质上同时进行步骤(c)和(d)。
在所有方面和实施例的某些实施例中,在步骤(c)之后但在步骤(f)之前,将NaCl浓度调整至约100-400mM NaCl的范围内(包括端值)或至约140-300mM NaCl的范围内(包括端值)。
在所有方面和实施例的某些实施例中,rAAV颗粒源自选自由以下组成的组的AAV:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、Rh10和Rh74。
在所有方面和实施例的某些实施例中,rAAV颗粒包含与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、Rh10、Rh74或SEQ ID NO:75或SEQ ID NO:76衣壳序列具有70%或更高序列一致性的衣壳序列。
在所有方面和实施例的某些实施例中,rAAV颗粒包含与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、Rh10或Rh74ITR序列具有70%或更高序列一致性的ITR序列。
在所有方面和实施例的某些实施例中,细胞为悬浮生长或贴壁生长细胞。
在所有方面和实施例的某些实施例中,细胞为哺乳动物细胞。非限制实例包括HEK细胞,诸如HEK-293细胞和CHO细胞,诸如CHO-K1细胞。
用于确定含有转基因的rAAV颗粒的感染效价的方法是本领域已知的(参见,例如Zhen等人,Hum.Gene Ther.15(2004)709)。用于测定具有包装转基因的空衣壳和rAAV颗粒的方法是已知的(参见,例如Grimm等人,Gene Therapy 6(1999)1322-1330;Sommer等人,Malec.7(2003)122-128)。
为确定降解/变性衣壳的存在或数量,可对纯化的rAAV颗粒进行SDS-聚丙烯酰胺凝胶电泳,该凝胶电泳由能够分离三种衣壳蛋白的任何凝胶(例如梯度凝胶)组成,然后运行凝胶直到样品分离,并且将凝胶转印到尼龙膜或硝酸纤维素膜上。然后将抗AAV衣壳抗体作为结合至变性衣壳蛋白的初级抗体(参见,例如Wobus等人,J.Viral.74(2000)9281-9293)。结合至初级抗体的二级抗体包含检测初级抗体的方式。对初级抗体与二级抗体之间的结合进行半定量检测以确定衣壳的量。另一种方法是使用SEC柱的分析型HPLC或分析型超速离心机。
***
除了所描绘和要求保护的各种实施例之外,本文所公开的主题还涉及具有本文所公开和要求保护的特征的其他组合的其他实施例。因此,本文所呈现的特定特征可在所公开的主题范围内以其他方式彼此组合,使得所公开的主题包括本文所公开的特征的任何合适的组合。呈现本文所公开的主题的特定实施例的前述描述是为了说明和描述的目的。其并非旨在穷举或将本文所公开的主题限制为所公开的那些实施例。
本文提及的所有参考文献均通过引用并入本文。
***
提供以下实例、序列和附图以帮助理解本发明,其真正的范围在所附权利要求书中阐明。应当理解的是,在不脱离本发明的精神的前提下,可以对所提出的步骤进行修改。
附图说明
图1是根据本发明的DNA元件在RMCI之前(左图)与在RMCI之后(右图)的示意图。
图2示出了根据本发明的DNA的方案,该DNA包含根据本发明的两种DNA元件。
图3示出了根据本发明的DNA在RMCI之前(上图)与在RMCI之后(下图)的方案。
图4示出了根据本发明的DNA的依序转录活化的方案。
图5示出了根据本发明的DNA的示例性用途,该DNA用于同时转录活化四种开放阅读框E1A、E1B、E2A和E4(ORF6)。
图6示出了根据本发明的DNA元件的示例性用途,该DNA元件用于同时转录活化两种开放阅读框E2A和E4(ORF6)。
图7示出了根据本发明的DNA元件的示例性用途,该DNA元件用于同时转录活化两种开放阅读框rep和cap(左图)、rep78和rep52/40(中图),以及rep78和rep52(右图)。
图8示出了根据本发明的DNA元件的示例性用途,该DNA元件用于转录活化VA RNA基因的一个开放阅读框。
图9是根据本发明的DNA元件的示例性示意图,在RMCI之前,该DNA元件用于同时转录活化开放阅读框E1A和E1B。已显示用于克隆的限制位点。
图10示出了根据本发明的反向DNA元件的示例性示意图,在RMCI之后,该反向DNA元件具有转录活性开放阅读框E1A和E1B。已显示用于克隆的限制位点。
图11是根据本发明的DNA元件的示例性示意图,在RMCI之前,该DNA元件用于同时转录活化开放阅读框E2A和E4orf6。已显示用于克隆的限制位点。
图12示出了根据本发明的反向DNA元件的示例性示意图,在RMCI之后,该反向DNA元件具有转录活性开放阅读框E2A和E4orf6。已显示用于克隆的限制位点。
图13是根据本发明的DNA元件的示例性示意图,该DNA元件用于在RMCI之前同时转录活化开放阅读框Rep78和Rep52/40。已显示用于克隆的限制位点。
图14是根据本发明的反向DNA元件的示例性示意图,在RMCI之后,该反向DNA元件具有转录活性开放阅读框Rep78和Rep52/40。已显示用于克隆的限制位点。
图15示出了VA RNA与VA RNA G58T/G59T/C68A变体的比对。
图16示出了在RMCI之前,根据本发明的VA RNA。
图17示出了在RMCI之后,根据本发明的VA RNA。
图18是根据本发明的示例性、转录失活DNA元件的示意图,在RMCI之前,该DNA元件用于同时转录活化开放阅读框mCherry和EGFP。已显示用于克隆的限制位点。
图19是根据本发明图18的反向DNA元件的示意图,在RMCI之后,该反向DNA元件具有转录活性开放阅读框mCherry和EGFP。已显示用于克隆的限制位点。
图20示出了在瞬时转染HEK293T细胞中,RMCI的细胞计数分析。同时显示GFP和mCherry表达细胞的平均百分比级标准偏差(误差线)。每种条件都以三份生物样品进行测试。根据表5进行编号
实例
一般技术
1)重组DNA技术
使用如下所述的标准方法操作DNA:Sambrook等人,Molecular Cloning:ALaboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y,(1989)。根据制造商的说明书使用分子生物试剂。
2)DNA和蛋白质序列分析以及序列数据管理
使用EMBOSS(European Molecular Biology Open Software Suite)软件包、Invitrogen’s Vector NTI和Geneious prime进行序列的创建、定位、分析、批注和说明。
3)基因和寡核苷酸合成
由Geneart GmbH(Regensburg,Germany)的化学合成制备所需的基因片段。将合成的基因片段克隆到大肠杆菌质粒中用以繁殖/扩增。通过DNA测序证实亚克隆基因片段的DNA序列。或者,通过对化学合成的寡核苷酸进行重组或通过PCR,以组装短的合成DNA片段。由metabion GmbH(Planegg-Martinsried,Germany)制备相应的寡核苷酸。
4)试剂
如果没有另外说明,则所有商业化学品、抗体和试剂盒都按照制造商的方案使用。
5)TI宿主细胞系的培养
在湿度为85%并且具有5%的CO2的加湿培养箱中在37℃下培养TI CHO宿主细胞。其在含有300μg/ml的潮霉素B和4μg/ml的第二选择标记的专属的基于DMEM/F12的培养基中培养。每3或4天以0.3x10E6细胞/ml的浓度分样细胞,总体积为30ml。使用125ml无挡板锥形(Erlenmeyer)摇瓶进行培养。以150rpm用5cm的振荡幅度振荡细胞。用Cedex HiRes CellCounter(Roche)确定细胞计数。将细胞保持在培养物中直到其达到60日龄。
6)克隆
一般技术
使用R位点的克隆取决于目的基因(GOI)旁边的DNA序列,该序列等于位于后随片段中的序列。类似地,通过重迭相同序列并且随后由DNA连接酶封接组装DNA中的切口,则可组装片段。因此,有必要克隆单基因,特别是含有正确R位点的初步质粒。在成功克隆这些初步质粒之后,经由直接在R位点旁边切割的酶的限制消化,将侧翼为R位点的目的基因切掉。最后一步是在一个步骤中组装所有DNA片段。更详细地,5'-核酸外切酶去除重迭区(R-位点)的5'-端。之后,可进行R位点的重组,并且DNA聚合酶延伸3'端以填补序列中的缺口。最后,DNA连接酶封接核苷酸之间的切口。加入含有不同酶(如核酸外切酶、DNA聚合酶和连接酶)的组装主混合物,并且随后在50℃下孵育反应混合物,这样可将单个片段组装成一个质粒。之后,用质粒转染潜能大肠杆菌细胞。
对于一些质粒,使用经由限制性内切酶的克隆策略。通过选择合适的限制性内切酶,可将目的所需基因切下,然后通过连接将其插入至不同的质粒中。因此,优选使用并以巧妙的方式选择在多克隆位点(MCS)切割的酶,以便可在正确的阵列中进行片段的连接。如果质粒和片段之前用相同的限制性内切酶切割,则片段和质粒的粘性末端会完美地接合在一起,随后可通过DNA连接酶连接。连接后,用新生成的质粒转染潜能大肠杆菌细胞。
经由限制消化进行克隆
对于使用限制性内切酶消化质粒,将以下组分吸取至冰上:
表:限制消化反应混合物
Figure BDA0004166468400001171
如果在一次消化中使用更多酶,则每种酶使用1μl,并通过加入或多或少的PCR级水来调整体积。选择所有酶的先决条件是它们有资格与来自New England Biolabs的CutSmart缓冲液(100%活性)一起使用,并且具有相同的孵育温度(均为37℃)。
使用热混合器或热循环仪进行孵育,允许在恒温(37℃)下孵育样品。在孵育过程中,不搅动样品。孵育时间设置为60分钟。然后将样品直接与负载染料混合,并且加载到琼脂糖电泳凝胶上或储存在4℃/冰上以供进一步使用。
制备用于凝胶电泳的1%琼脂糖凝胶。因此,称重1.5g多用途琼脂糖到125锥形摇瓶中,并注入150ml TAE缓冲液。在微波炉中加热混合物直至琼脂糖完全溶解。将0.5μg/ml溴化乙锭加入至琼脂糖溶液中。然后将凝胶浇注至模具中。琼脂糖凝固后,将模具放入电泳室,并且用TAE缓冲液填入电泳室。然后装载样品。在第一槽中(从左边起算),加载合适的DNA分子量标记,接着加载样品。凝胶在<130V下运行约60分钟。电泳后,从电泳室中取出凝胶并且在UV成像仪中进行分析。
切割出目标条带并且转移到1.5ml微量离心管(Eppendorf)中。使用来自Qiagen的QIAquick Gel Extraction Kit并且根据制造商的说明,进行凝胶的纯化。将DNA片段在-20℃下储存以供进一步使用。
取决于插入片段和质粒片段的长度以及它们之间的相互关系,用于连接的片段以1:2、1:3或1:5的摩尔比吸取在一起以用于插入质粒。如果应插入质粒的片段很短,则使用1:5的比例。如果插入物较长,则使用相较于质粒的较少量。每次连接使用50ng的量的质粒,并且使用NEBioCalculator计算特定的插入量。使用来自NEB的T4 DNA ligation kit进行连接。下表呈现了连接混合物的实例。
表:连接反应混合物
Figure BDA0004166468400001181
自混合DNA和水开始,加入缓冲液,最后加入酶,所有组分都吸取到冰上。通过上下吸取来轻微地混合反应液,短暂微量离心,然后在室温下孵育10分钟。孵育后,在65℃下加热T4连接酶灭活10分钟。在冰上冷却样品。在最后一步,用2μl的连接质粒转化10-β潜能大肠杆菌细胞(见下面内容)。
转化10-β潜能大肠杆菌细胞
为了转化,将10-β潜能大肠杆菌细胞在冰上解冻。之后,将2μl的质粒DNA直接吸取至细胞悬浮液中。轻弹试管并置于冰上30分钟。此后,将细胞放入42℃的热块中并精确热休克30秒。紧接着,将细胞在冰上急冷2分钟。将950μl的NEB 10-β扩增培养基(outgrowthmedium)加入至细胞悬浮液中。将细胞在37℃下振荡孵育一小时。然后,将50-100μl吸取至预热(37℃)的LB-Amp琼脂板上,并以一次性抹刀涂抹。将琼脂板在37℃下孵育过夜。只有成功并入质粒并且携带安比西林抗性基因的细菌才能在这些琼脂板上生长。第二天挑取单一菌落,在LB-Amp培养基中培养,用于后续的质粒制备。
细菌培养
在LB培养基(Luria Bertani的缩写)中培养大肠杆菌,该培养基中掺有1ml/L的100mg/ml安比西林,使安比西林浓度为0.1mg/ml。对于不同的质粒制备量,以单一细菌菌落接种以下量。
表:大肠杆菌培养体积
数量质粒制备 体积LB-Amp培养基[ml] 孵育时间[h]
Mini-Prep 96孔(EpMotion) 1.5 23
Mini-Prep 15ml管 3.6 23
Maxi-Prep 200 16
对于Mini-Prep,96孔2ml深孔板的每孔注入1.5ml的LB-Amp培养基。挑取菌落并将牙签塞入培养基中。当挑取所有菌落后,用粘性透气膜将深孔板密封。将深孔板在37℃培养箱中以200rpm的振荡速率培养23小时。
对于Mini-Preps,在15ml试管(带有通风盖)中装入3.6ml LB-Amp培养基并且同样接种细菌菌落。在孵育期间,不将牙签移除而是留在管中。与96孔板一样,试管在37℃、200rpm下孵育23小时。
对于Maxi-Prep,将200ml的LB-Amp培养基装入高压灭菌的1L锥形烧瓶中,并接种1ml的大约为5小时龄的细菌日培养物。锥形瓶以纸塞密闭并且在37℃、200rpm下孵育16小时。
质粒制备
对于Mini-Prep,将50μl的细菌悬浮液转移到1ml深孔板中。之后,将细菌细胞在深孔板中以3000rpm、4℃离心5分钟。去除上清液,将带有细菌沉淀物的深孔板置于EpMotion中。约90分钟后完成运行,并且可从EpMotion中取出洗脱的质粒DNA以供进一步使用。
对于Mini-Prep,从培养箱中取出15ml试管,并且将3.6ml的细菌培养物分样至两个2ml微量离心管。在室温下,在台式微量离心机中以6,800xg将管离心3分钟。之后,根据制造商的说明书使用Qiagen QIAprep Spin Miniprep Kit进行Mini-Prep。用Nanodrop测量质粒DNA浓度。
根据制造商的说明书使用Macherey-Nagel
Figure BDA0004166468400001201
Xtra Maxi EF Kit进行Maxi-Prep。用Nanodrop测量DNA浓度。
乙醇沉淀
将一定体积的DNA溶液与2.5倍体积的100%乙醇混合。将混合物在-20℃下孵育10分钟。然后将DNA在14,000rpm、4℃下离心30分钟。小心地去除上清液并且用70%乙醇洗涤沉淀物。再次将管在14,000rpm、4℃下离心5分钟。通过吸取小心地去除上清液并且干燥沉淀物。当乙醇蒸发后,加入适量的无内毒素水。给予DNA时间在4℃下再溶于水中过夜。取一小部分等分样品并且用Nanodrop装置测量DNA浓度。
表达盒组成
对于开放阅读框的表达,使用包含以下功能元件的转录单元:
-来自包括内含子A的人巨细胞病毒的直接早期增强子和启动子,
-人重链免疫球蛋白5'-非翻译区(5'UTR),
-如果需要,则包含包括信号序列的相应开放阅读框的核酸,
-牛生长激素多聚腺苷酸化序列(BGH pA),以及
-任选地,人胃泌素终止子(hGT)。
除了包含要表达的所需基因的表达单元/表达盒外,基本/标准哺乳动物表达质粒还包含:
-来自质粒pUC18的复制起点,其允许该质粒在大肠杆菌中复制,以及
-β-内酰胺酶基因,其在大肠杆菌中赋予安比西林抗性。
细胞培养技术
使用如以下文献描述的标准细胞培养技术:Current Protocols in CellBiology(2000),Bonifacino,J.S.,Dasso,M.,Harford,J.B.,Lippincott-Schwartz,J.andYamada,K.M.(eds.),John Wiley&Sons,Inc。
HEK293系统中的瞬时转染
通过使用HEK293系统(Invitrogen)根据制造商的说明书用相应的质粒(参见下文的实例1至4)瞬时转染,以产生包含根据本发明的DNA元件的细胞。简言之,用相应质粒和293fectinTM或fectin(Invitrogen)的混合物转染在无血清FreeStyleTM293表达培养基(Invitrogen)中的摇瓶或搅拌发酵瓶中悬浮生长的HEK293细胞(Invitrogen)。对于2L摇瓶(Corning),将HEK293细胞以1*106细胞/mL的密度接种在600mL中,并且在120rpm、8% CO2下孵育。第二天,用约42mL的混合物转染约1.5*106细胞/mL的细胞密度的细胞,该混合物为A)20mL的Opti-MEM(Invitrogen)与600μg的总质粒DNA(1μg/mL)和B)20ml的Opti-MEM+1.2mL的293fectin或fectin(2μL/mL)。根据葡萄糖消耗量,在发酵过程中加入葡萄糖溶液。
SDS-PAGE
LDS样品缓冲液,四倍浓缩液(4x):4g甘油、0.682g TRIS碱、0.666gTRIS盐酸盐、0.8g LDS(十二烷基硫酸锂)、0.006g EDTA(乙二胺四酸)、0.75ml的1%重量百分比(w/w)Serva Blue G250水溶液、0.75ml的1%重量百分比(w/w)酚红溶液,加水使总体积为10毫升。
将培养液中的细胞裂解。此后将溶液离心以去除细胞碎片。将澄清上清液的等分样品与1/4体积(v/v)的4xLDS样品缓冲液以及1/10体积(v/v)的0.5M 1,4-二硫苏糖醇(DTT)混合。然后将样品在70℃下孵育10分钟,并且通过SDS-PAGE分离蛋白质。根据制造商的说明书,使用
Figure BDA0004166468400001211
预制凝胶系统(Invitrogen公司)。特别地,使用10%
Figure BDA0004166468400001212
Bis-TRIS预制凝胶(pH 6.4)和/>
Figure BDA0004166468400001221
MOPS电泳缓冲液。
蛋白质印迹法
转移缓冲液:39mM甘胺酸、48mM TRIS盐酸盐、0.04%重量百分比(w/w)的SDS和20%体积(v/v)的甲醇
在SDS-PAGE后,根据Burnette的“半干墨点法”(Burnette,W.N.,Anal.Biochem.112(1981)195-203)将分离的多肽电泳转移至硝酸纤维素滤膜(孔径:0.45μm)。
实例1
产生根据本发明的DNA构建体,该DNA构建体用于通过RMCI以Cre重组酶介导同时活化E2A和E4orf6开放阅读框
产生第一DNA片段,其中608bp的CMV直接早期启动子和增强子(SEQ ID NO:28)与人免疫球蛋白5'UTR组合。这两种元件与间断L3元件头对头融合,该间断L3元件具有突变的左反向重复序列(L3-LE;taccgttcgt ataaagtctc ctatacgaag ttat;SEQ ID NO:70)并且侧翼具有XbaI(5'-端)和KpnI(3'-端)限制位点。通过DNA合成产生相应的DNA片段,并且将其克隆到合适的穿梭质粒中。
同样地,产生并克隆第二DNA片段,该第二DNA片段在其编码链的5'-至3'-方向包含:HindIII限制位点、具有突变的右反向重复序列的L3位点(L3-RE;ataacttcgtataaagtctc ctatacgaac ggta;SEQ ID NO:71)、Kozak序列、编码腺病毒E2A蛋白的开放阅读框(GenBank登录号AC_000007)、牛生长激素多聚腺苷酸化信号序列(BGH poly A;SEQ IDNO:31)、人胃泌素转录终止序列(HGT;SEQ ID NO:32)和KpnI限制位点。
还生成并克隆第三片段,该第三片段在其编码链的5'-至3'-方向包含:MfeI限制位点、Kozak序列、编码腺病毒E4orf6蛋白的开放阅读框(GenBank登录号AC_000007)、BGHpoly A、HGT序列和HindIII限制位点。
使用相应的限制性内切酶从其穿梭质粒中切下三个片段。在四方向连接反应中,将切除的片段与携带MfeI和XbaI相容突出端和嘌呤霉素选择标记的质粒骨架结合,产生用于稳定转染哺乳动物细胞的质粒。
图11示出了DNA片段内元件的顺序和方向,该顺序和方向是由连接过程中粘性末端的相容性决定的。
实例2
产生根据本发明的DNA构建体,该DNA构建体用于通过RMCI以Cre重组酶介导同时活化E1A和E1B开放阅读框
将608bp CMV启动子和增强子元件的两个拷贝(但不包括TATA盒与转录起始位点之间的序列)与间断Lox71位点头对头融合。所得片段在5'端具有XbaI限制位点,在3'端具有KpnI限制位点。通过DNA合成产生出完整的DNA片段,并且其将其克隆到合适的穿梭质粒中。
同样,合成并克隆第二DNA片段,该第二DNA片段在其编码链的5'-至3'-方向包含:SacI限制位点、Lox66位点、在TATA盒与转录起始位点之间的具有突变/失活的SacI位点的CMV启动子片段、人免疫球蛋白重链5'UTR、Kozak序列、编码腺病毒E1A蛋白的开放阅读框(GenBank登录号AC_000008)、牛生长激素多聚腺苷酸化信号序列(BGH poly A)、人胃泌素转录终止序列(HGT)和KpnI限制位点。
还合成并克隆第三片段,该第三片段以5'-至3'-方向包括:SacI限制位点、在TATA盒与转录起始位点之间的CMV启动子片段、人免疫球蛋白重链5'-UTR、Kozak序列、编码腺病毒E1B 19kDa和E1B 55kDa蛋白的开放阅读框(GenBank登录号AC_000008)、牛生长激素多聚腺苷酸化信号序列(BGH poly A)、人胃泌素转录终止序列(HGT)和MfeI限制位点。
使用相应的限制性内切酶从其穿梭质粒中切下三个片段。在四方向连接反应中,将所述片段与携带MfeI和XbaI相容突出端和嘌呤霉素选择标记的质粒骨架结合,产生用于稳定转染哺乳动物细胞的质粒。
图9示出了DNA片段内元件的顺序和方向,该顺序和方向是由连接过程中粘性末端的相容性决定的。
实例3
产生根据本发明的DNA构建体,该DNA构建体用于通过RMCI以Cre重组酶介导同时活化Rep78和Rep52/40转录
将包括转录起始位点下游21bp的AAV2 P5启动子和包括转录起始位点下游103bp的AAV2 P19启动子与间断LoxFas位点头对头融合,该间断LoxFas位点具有突变的左反向重复序列(LoxFas-LE;taccgttcgt atataccttt ctaacgaag ttat;SEQ ID NO:72)。所得片段在5'端具有XbaI限制位点,在3'端具有KpnI限制位点。通过DNA合成产生出完整的DNA片段,并且将其克隆到合适的穿梭质粒中。
同样,产生并克隆第二DNA片段,该第二DNA片段以3'-至5'-方向(即相对于编码链为反向)包含:SalI限制位点、具有突变的右反向重复序列的LoxFas位点(LoxFas-RE;ataacttcgt atataccttt ctatacgaac ggta;SEQ ID NO:73)、来自Rep78/68 5'UTR的13bp序列、编码AAV2 Rep78蛋白的开放阅读框、牛生长激素多聚腺苷酸化信号(BGH poly A)、人胃泌素转录终止子(HGT)和KpnI限制位点。
还生成第三片段,该第三片段以5'-至3'-方向包含:SalI限制位点,从Rep52/40起始密码子上游13bp开始并在VP基因的终止密码子下游124bp结束的AAV2 Rep52/40-Cap基因,和Mfe限制位点。
使用相应的限制性内切酶从其穿梭质粒中切下三个片段。在四方向连接反应中,将片段与携带MfeI和XbaI相容突出端和嘌呤霉素选择标记的质粒骨架结合,产生用于稳定转染哺乳动物细胞的质粒。
图13示出了DNA片段内元件的顺序和方向,该顺序和方向是由连接过程中粘性末端的相容性决定的。
实例4
产生根据本发明的DNA构建体,该DNA构建体用于通过RMCI以Cre重组酶介导活化VA RNAI转录
化学合成DNA片段,其以5'-至3'-方向包含:SEQ ID NO:69的Lx-LE位点,该Lx-LE位点包含TATA信号(TTTATATAT;SEQ ID NO:74),该TATA信号整合至Cre重组位点,该Cre重组位点具有突变的左反向重复序列和与标准LoxP位点的高度歧异性以确保无混交(Lx-LE;taccgttcgt ataagtttat atatacgaag ttat;SEQ ID NO:03)(将TATA与转录起始位点之间的距离进行比对以反映一般距离)、来自Ad2 VA RNAI基因5'-端的一个短片段,紧随该片段之后为聚合酶III终止子(hexa-dT)、反方向的Ad2 VA RNAI基因(GenBank AC_000007)以及包含Lx位点的3'端序列,该Lx位点具有在反向上的右反向重复序列(Lx-RE反向;taccgttcgt atatataaac ttatacgaag ttat;SEQ ID NO:06)。
所述片段与携带嘌呤霉素选择标记的质粒骨架连接,产生出用于稳定转染哺乳动物细胞的质粒。
图16示出了该DNA片段中元件的顺序和方向。
实例5
用于RMCI的盒的稳定整合
将适合悬浮生长的CHO-K1细胞置于50mL的化学成分确定的培养基中,在37℃和5-7体积%的CO2下于一次性的通风的125mL摇瓶中繁殖。以140-180rpm/min的固定搅拌速度摇晃培养物,每3-4天用新鲜培养基稀释至2-3x 105/mL的密度。使用Cedex HiRes细胞计数器(Roche Innovates AG,Bielefeld,Germany)测定培养物的密度和存活率。
为稳定整合RMCI盒,将悬浮生长的CHO-K1细胞以4x 105细胞/mL的密度接种在新鲜的化学成分确定的培养基中。第二天,根据制造商的方案,使用Nucleofector Kit V(Lonza,Switzerland),用Nucleofector装置进行转染。用30μg的线性化质粒DNA转染3x107细胞。转染后,将细胞接种在不含选择剂的30ml新鲜的化学成分确定的培养基中。
转染两天后,将细胞接种到含有作为选择剂的1至10μg/mL嘌呤霉素的384孔板中,每孔接种300至500个细胞。三周后,通过使用NYONE Plate成像仪(SYNENTECH GmbH,Elmshorn,Germany)进行成像来识别细胞菌落。将菌落转移至96孔板,并且通过PCR分析RMCI盒的整合。将含有所有所需RMCI盒的细胞系在含有嘌呤霉素的化学成分确定的培养基中进一步扩增,并且在扩增后冷冻保存。
实例6
通过根据本发明Cre介导的盒反转(RMCI)进行基因活化和AAV生产通过Cre重组酶介导的RMCI进行基因活化
对于通过盒反转(Cre介导的RMCI)进行的Cre介导的基因活化,用Cre重组酶编码mRNA瞬时地转染细胞,这些细胞携带如在上述实例中的一个实例中所获得的腺病毒辅助基因和/或rep-cap基因的无活性RMCI盒。转染前一天,将细胞以4x 105cells/mL的密度接种至新鲜培养基中。第二天,根据制造商的方案,使用Nucleofector Kit V(Lonza,Switzerland),用Nucleofector装置进行转染。用总量为30μg的Cre重组酶编码mRNA转染3x107细胞。通过反向基因组DNA的PCR、预期mRNA的RT-PCR或预期基因产物的蛋白质印迹分析,证实基因活化成功。
产生rAAV载体生产细胞
对于重组AAV载体的生产,将包含5μg Cre重组酶编码mRNA的总量为30μg的核酸瞬时地转染3x 107细胞,这些细胞携带如在上述实例中的一个实例中所获得的腺病毒辅助基因和/或rep-cap基因的无活性RMCI盒。剩余的25μg核酸由质粒DNA组成,该质粒DNA提供重组AAV基因组(转基因,例如侧翼为AAV ITR的GFP基因)以及尚未整合到基因组中的辅助基因和/或rep/cap基因的表达盒。
或者,如实例5中所述,通过稳定整合到宿主细胞的基因组中来提供重组AAV基因组。
如果细胞的基因组已经包含所有必需的辅助基因、rep/cap和重组AAV基因组,则仅转染Cre重组酶编码mRNA即足够。
从细胞培养上清液或总细胞裂解物中收获AAV颗粒,并且通过ELISA、定量PCR和转导靶细胞对其进行分析。
实例7
产生根据本发明的DNA构建体,该DNA构建体用于通过RMCI以FRT重组酶介导同时活化mCherry和EGFP开放阅读框
产生第一DNA片段,其中52bp的最小CMV启动子(SEQ ID NO:85)在其转录方向上与以下元件按以下顺序组合:
-人免疫球蛋白5'UTR;
-具有突变的左反向重复序列的FRT元件(FRT-LE;GAAGTTCATATTCTCTAGAAAGTATAGGAACTTC;SEQ ID NO:60);
-SV40早期启动子的417bp片段,该片段包括反方向的转录起始(TS)区(SEQ IDNO:86);
-SEQ ID NO:32的人胃泌素转录终止序列(HGT),但为反方向;
-SEQ ID NO:31的牛生长激素多聚腺苷酸化信号序列(BGH poly A),但为反方向;
-编码mCherry荧光蛋白的开放阅读框(GenBank登录号QUW04963;SEQ ID NO:87),但为反方向;
-Kozak序列,但为反方向;
-具有突变的右反向重复序列(FRT-RE;GAAGTTCCTATTCTCTAGAAAGTATATGAACTTC,SEQ ID NO:61)的FRT位点,但为反方向;
-顺方向的Kozak序列;以及
-顺方向的编码增强型绿色荧光蛋白(EGFP;GenBank登录号AAB02572.1;SEQ IDNO:88;26bp)的开放阅读框的5'-部分。
通过DNA合成产生相应的DNA片段并且将其克隆到合适的穿梭质粒中,该DNA片段侧翼为SalI(在5'端)和SgrAI(在3'端)限制位点。
还生成并克隆第二片段,该第二片段在编码链的5'-至3'-方向按以下顺序包含:SalI限制位点、编码EGFP并且包含内部SgrAI限制位点的开放阅读框、BGH poly A信号序列、HGT序列和MfeI限制位点。
使用SalI和SgrAI限制性内切酶从其穿梭质粒中切下第一片段,并且将该第一片段插入携带第二片段的质粒的SalI与SgrAI位点之间,以产生最终质粒,该质粒适用于瞬时转染哺乳动物细胞。
图18示出了第一片段与第二片段的组合DNA中元件的顺序和方向。
实例8–比较实例
产生根据本发明的DNA构建体,该DNA构建体代表在通过RMCI以FRT重组酶介导同时活化mCherry和EGFP开放阅读框后所获得的DNA构型
产生第一DNA片段,其中52bp的最小CMV启动子(SEQ ID NO:85)在其转录方向上按以下顺序与以下组合:
-在顺方向上的人免疫球蛋白5'UTR;
-在顺方向上的FRT元件,该FRT元件具有突变的左反向重复序列和右反向重复序列(FRT-LE-RE;GAAGTTCATATTCTCTAGAAAGTATATGAACT TC;SEQ ID NO:89);
-在顺方向上的Kozak序列;
-在顺方向上的编码mCherry荧光蛋白的开放阅读框(GenBank登录号QUW04963;SEQ ID NO:87);
-在顺方向上的牛生长激素多聚腺苷酸化信号序列(BGH poly A;SEQ ID NO:31);
-在顺方向上的人胃泌素转录终止序列(HGT;SEQ ID NO:32);
-SV40早期启动子的417bp片段,该片段包括在顺方向上的转录起始(TS)区(SEQID NO:86);
-SEQ ID NO:36的FRT位点,但为反方向;
-顺方向的Kozak序列;以及
-顺方向的编码增强型绿色荧光蛋白(EGFP;GenBank登录号AAB02572.1;SEQ IDNO:88;26bp)的开放阅读框的5'-部分。
通过DNA合成产生相应的DNA片段并且将其克隆到合适的穿梭质粒中,该DNA片段侧翼为SalI(在5'端)和SgrAI(在3'端)限制位点。
使用SalI和SgrAI限制性内切酶从其穿梭质粒中切下第一片段,并且将该第一片段插入如实例7中所述的携带第二片段的质粒的SalI与SgrAI位点之间,以产生用于瞬时转染哺乳动物细胞的质粒。
图19示出了第一片段与第二片段的组合DNA中元件的顺序和方向。
实例9
通过根据本发明的FLP介导的盒反转(RMCI)同时活化两个荧光基因
转染
在37℃、90%相对湿度和5%CO2下,将HEK293T贴壁细胞培养于DMEM、高葡萄糖、GlutaMAXTM补充剂、补充有10%胎牛血清(Thermo FisherScientific)的丙酮酸培养基(Thermo Fisher Scientific)中。转染前二十四小时,将每孔10,000个细胞接种到96孔板的孔中。根据制造商的建议,使用DNA与PEI之比为1:2的PEI Max(Polyscience),用每孔100ng质粒DNA的混合物转染细胞。如下表5所示,每种实验条件重复测试三次。
表5:用于转染的质粒混合物的组成。针对每种实验条件(1到14),DNA的量以每孔ng表示。
Figure BDA0004166468400001291
为证实通过根据本发明的FLP重组酶介导的盒反转同时活化mCherry和EGFP基因,将80 ng无活性构建体mCherry_EGFP_pre rec(实例7,图18)与不同数量的编码FPL重组酶FLPo的质粒混合,FLPo为FLP重组酶的优化版本(参见例如Raymond.CS.和Soriano,P.,PLoSONE 2(2007)e162)。根据需要加入非编码质粒(模拟DNA),使转染混合物中的DNA总量保持在100ng。将相应条件应用于活性构建体mCherry_EGFP_post rec(实例8,图19),以测试mCherry和EGFP的表达是否受到共表达FLPo的影响。
将单独转染模拟DNA作为阴性对照,而将表达EGFP或mCherry的单一基因的质粒(EGFP_only和mCherry_only)作为阳性对照。将与模拟DNA结合的FLPo质粒转染以排除任何由单独的FLPo所直接诱导的荧光。
流式细胞术
瞬时转染两天后,通过流式细胞术测量细胞内EGFP和mCherry的表达,以检查FLP介导的盒反转是否成功。为此,通过胰蛋白酶介导的脱离,从96孔板中收获HEK293T细胞。通过在磷酸盐缓冲盐水中加入2%胎牛血清来终止反应。
用BD FACSCelestaTM Flow Cytometer(BD,Heidelberg,Germany)进行流式细胞术。在前向散射(FSC)对侧向散射(SSC)图中对活细胞进行闸控。为区分单细胞与细胞团,选择FSC-H对FASC-A图。记录每个样品的一万个事件。用经模拟转染的HEK293T细胞定义两种闸门,并且通过采用FlowJo v10.6.2软件(TreeStar,Olten,Switzerland)将这两种闸门应用于所有样品。在FITC通道中量化GFP的荧光(激发波长为488nm,检测波长为530nm)。在PE-CF594通道中测量mCherry(激发波长为561nm,检测波长为610nm)。
为正确识别荧光细胞群并调整激光,使用阳性对照样品和阴性对照样品。用EGFP_only质粒转染的细胞作为EGFP阳性对照,而经mCherry_only质粒转染的细胞作为mCherry阳性对照。用非编码质粒(模拟DNA)转染的细胞作为阴性对照。
图20示出了针对每种实验条件1到14(如上表5所示)的GFP和mCherry阳性细胞的平均百分比。相应的标准偏差表示为误差线。如所预期的,当用mCherry_EGFP_pre rec(条件7)单独转染细胞时,几乎没有检测到任何荧光细胞(<2%),即没有重组酶,而当用mCherry_EGFP_post rec转染细胞时,约60%的细胞为mCherry和EGFP阳性(条件8)。这表明mCherry和EGFP基因在没有重组酶的情况下,在重组前的构型是无活性的,而在重组后的构型是有活性的。
当用mCherry_EGFP_pre rec质粒一起共转染FLPo表达质粒时,EGFP和mCherry阳性细胞的百分比增加到约30%(条件9、10和11),指示成功的RMCI以及双基因活化。用mCherry_EGFP_post rec共转染FLPo表达质粒对表达EGFP和mCherry没有影响(条件8相对于条件12、13和14),表明在重组后的构型中抑制盒反转。单独转染FLPo表达质粒时未检测到荧光细胞。
序列表
<110> 豪夫迈·罗氏有限公司 (F. Hoffmann-La Roche AG)
<120> 用于同时基因活化的核酸构建体
<130> P36312
<150> EP20202009.5
<151> 2020-10-15
<160> 89
<170> PatentIn 版本 3.5
<210> 1
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Lx 位点间隔序列
<400> 1
agtttata 8
<210> 2
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Lx 位点反方向
<400> 2
tataaact 8
<210> 3
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lx-LE 突变体
<400> 3
taccgttcgt ataagtttat atatacgaag ttat 34
<210> 4
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lx-LE 突变体反方向
<400> 4
ataacttcgt atatataaac ttatacgaac ggta 34
<210> 5
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lx-RE 突变体
<400> 5
ataacttcgt ataagtttat atatacgaac ggta 34
<210> 6
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lx-RE 突变体反方向
<400> 6
taccgttcgt atatataaac ttatacgaag ttat 34
<210> 7
<211> 343
<212> PRT
<213> 噬菌体 P1
<400> 7
Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 8
<211> 1029
<212> RNA
<213> 噬菌体 P1
<400> 8
augagcaacc ugcugaccgu gcaccagaac cugcccgccc ugcccgugga cgccaccagc 60
gacgagguga ggaagaaccu gauggacaug uucagggaca ggcaggccuu cagcgagcac 120
accuggaaga ugcugcugag cgugugcagg agcugggccg ccuggugcaa gcugaacaac 180
aggaaguggu uccccgccga gcccgaggac gugagggacu accugcugua ccugcaggcc 240
aggggccugg ccgugaagac cauccagcag caccugggcc agcugaacau gcugcacagg 300
aggagcggcc ugcccaggcc cagcgacagc aacgccguga gccuggugau gaggaggauc 360
aggaaggaga acguggacgc cggcgagagg gccaagcagg cccuggccuu cgagaggacc 420
gacuucgacc aggugaggag ccugauggag aacagcgaca ggugccagga caucaggaac 480
cuggccuucc ugggcaucgc cuacaacacc cugcugagga ucgccgagau cgccaggauc 540
agggugaagg acaucagcag gaccgacggc ggcaggaugc ugauccacau cggcaggacc 600
aagacccugg ugagcaccgc cggcguggag aaggcccuga gccugggcgu gaccaagcug 660
guggagaggu ggaucagcgu gagcggcgug gccgacgacc ccaacaacua ccuguucugc 720
agggugagga agaacggcgu ggccgccccc agcgccacca gccagcugag caccagggcc 780
cuggagggca ucuucgaggc cacccacagg cugaucuacg gcgccaagga cgacagcggc 840
cagagguacc uggccuggag cggccacagc gccagggugg gcgccgccag ggacauggcc 900
agggccggcg ugagcauccc cgagaucaug caggccggcg gcuggaccaa cgugaacauc 960
gugaugaacu acaucaggaa ccuggacagc gagaccggcg ccauggugag gcugcuggag 1020
gacggcgac 1029
<210> 9
<211> 7
<212> PRT
<213> 猿猴病毒 40
<400> 9
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 10
<211> 16
<212> PRT
<213> 猿猴病毒 40
<400> 10
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 11
<211> 25
<212> PRT
<213> 秀丽隐杆线虫
<400> 11
Met Ser Arg Arg Arg Lys Ala Asn Pro Thr Lys Leu Ser Glu Asn Ala
1 5 10 15
Lys Lys Leu Ala Lys Glu Val Glu Asn
20 25
<210> 12
<211> 9
<212> PRT
<213> 智人
<400> 12
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 13
<211> 9
<212> PRT
<213> 大肠杆菌
<400> 13
Lys Leu Lys Ile Lys Arg Pro Val Lys
1 5
<210> 14
<211> 13
<212> DNA
<213> 噬菌体 P1
<400> 14
ataacttcgt ata 13
<210> 15
<211> 13
<212> DNA
<213> 噬菌体 P1
<400> 15
tatacgaagt tat 13
<210> 16
<211> 8
<212> DNA
<213> 噬菌体 P1
<400> 16
atgtatgc 8
<210> 17
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> L3 间隔序列
<400> 17
aagtctcc 8
<210> 18
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> L2 反向间隔序列
<400> 18
gcatacat 8
<210> 19
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> LoxFas 间隔序列
<400> 19
tacctttc 8
<210> 20
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Lox511 间隔序列
<400> 20
atgtatac 8
<210> 21
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Lox5171 间隔序列
<400> 21
atgtgtac 8
<210> 22
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Lox2272 间隔序列
<400> 22
aagtatcc 8
<210> 23
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Loxm2 间隔序列
<400> 23
agaaacca 8
<210> 24
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Loxm3 间隔序列
<400> 24
taatacca 8
<210> 25
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Loxm7 间隔序列
<400> 25
agatagaa 8
<210> 26
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> crRNA 重复序列
<220>
<221> misc_feature
<222> (11)..(11)
<223> a 或 g
<220>
<221> misc_feature
<222> (12)..(12)
<223> n 是 a、c、g 或 u
<220>
<221> misc_feature
<222> (14)..(14)
<223> c 或 u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n 是 a、c、g 或 u
<400> 26
guuuuagagc unugnuguuu ug 22
<210> 27
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> FokI motiv
<400> 27
ggatg 5
<210> 28
<211> 608
<212> DNA
<213> 人巨细胞病毒
<400> 28
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattagc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctccg tttagtgaac 600
gtcagatc 608
<210> 29
<211> 696
<212> DNA
<213> 人巨细胞病毒
<400> 29
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattagc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctccg tttagtgaac 600
gtcagatcta gctctgggag aggagcccag cactagaagt cggcggtgtt tccattcggt 660
gatcagcact gaacacagag gaagcttgcc gccacc 696
<210> 30
<211> 2125
<212> DNA
<213> 人巨细胞病毒
<400> 30
ctgcagtgaa taataaaatg tgtgtttgtc cgaaatacgc gttttgagat ttctgtcgcc 60
gactaaattc atgtcgcgcg atagtggtgt ttatcgccga tagagatggc gatattggaa 120
aaatcgatat ttgaaaatat ggcatattga aaatgtcgcc gatgtgagtt tctgtgtaac 180
tgatatcgcc atttttccaa aagtgatttt tgggcatacg cgatatctgg cgatagcgct 240
tatatcgttt acgggggatg gcgatagacg actttggtga cttgggcgat tctgtgtgtc 300
gcaaatatcg cagtttcgat ataggtgaca gacgatatga ggctatatcg ccgatagagg 360
cgacatcaag ctggcacatg gccaatgcat atcgatctat acattgaatc aatattggcc 420
attagccata ttattcattg gttatatagc ataaatcaat attggctatt ggccattgca 480
tacgttgtat ccatatcata atatgtacat ttatattggc tcatgtccaa cattaccgcc 540
atgttgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 600
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 660
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 720
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 780
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 840
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 900
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 960
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1020
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1080
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa 1140
ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 1200
ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc gtgccaagag 1260
tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttctt atgcatgcta 1320
tactgttttt ggcttggggt ctatacaccc ccgcttcctc atgttatagg tgatggtata 1380
gcttagccta taggtgtggg ttattgacca ttattgacca ctcccctatt ggtgacgata 1440
ctttccatta ctaatccata acatggctct ttgccacaac tctctttatt ggctatatgc 1500
caatacactg tccttcagag actgacacgg actctgtatt tttacaggat ggggtctcat 1560
ttattattta caaattcaca tatacaacac caccgtcccc agtgcccgca gtttttatta 1620
aacataacgt gggatctcca cgcgaatctc gggtacgtgt tccggacatg ggctcttctc 1680
cggtagcggc ggagcttcta catccgagcc ctgctcccat gcctccagcg actcatggtc 1740
gctcggcagc tccttgctcc taacagtgga ggccagactt aggcacagca cgatgcccac 1800
caccaccagt gtgccgcaca aggccgtggc ggtagggtat gtgtctgaaa atgagctcgg 1860
ggagcgggct tgcaccgctg acgcatttgg aagacttaag gcagcggcag aagaagatgc 1920
aggcagctga gttgttgtgt tctgataaga gtcagaggta actcccgttg cggtgctgtt 1980
aacggtggag ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca 2040
taatagctga cagactaaca gactgttcct ttccatgggt cttttctgca gtcaccgtcc 2100
ttgacacggt ttaaacgccg ccacc 2125
<210> 31
<211> 218
<212> DNA
<213> 牛
<400> 31
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 60
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 120
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 180
caatagcagg catgctgggg atgcggtggg ctctatgg 218
<210> 32
<211> 73
<212> DNA
<213> 智人
<400> 32
caggataata tatggtaggg ttcatagcca gagtaacctt tttttttaat ttttatttta 60
ttttattttt gag 73
<210> 33
<211> 288
<212> DNA
<213> 猿猴病毒 40
<400> 33
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 60
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 120
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 180
aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 240
gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcg 288
<210> 34
<211> 129
<212> DNA
<213> 猿猴病毒 40
<400> 34
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcacc attctagttg tggtttgtcc aaactcatca atgtatctta 120
tcatgtctg 129
<210> 35
<211> 798
<212> DNA
<213> 人工序列
<220>
<223> 绿色荧光蛋白编码核酸
<400> 35
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtcc 720
ggactcagat ctcgagctca agcttcgaat tctgcagtcg acggtaccgc gggcccggga 780
tccaccggat ctagatga 798
<210> 36
<211> 34
<212> DNA
<213> 酿酒酵母菌
<400> 36
gaagttccta ttctctagaa agtataggaa cttc 34
<210> 37
<211> 13
<212> DNA
<213> 酿酒酵母菌
<400> 37
gaagttccta ttc 13
<210> 38
<211> 13
<212> DNA
<213> 酿酒酵母菌
<400> 38
gaataggaac ttc 13
<210> 39
<211> 8
<212> DNA
<213> 酿酒酵母菌
<400> 39
tctagaaa 8
<210> 40
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> F3 位点间隔序列
<400> 40
ttcaaata 8
<210> 41
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> F5 位点间隔序列
<400> 41
ttcaaaag 8
<210> 42
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> roxP 位点
<400> 42
taactttaaa taatgccaat tatttaaagt ta 32
<210> 43
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxLTR 位点
<400> 43
acaacatcct attacaccct atatgccaac atgg 34
<210> 44
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxBTR 位点
<400> 44
aacccactgc ttaagcctca ataaagcttg cctt 34
<210> 45
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxV 位点
<400> 45
tcaatttctg agaactgtca ttctcggaaa ttga 34
<210> 46
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxFas 位点
<400> 46
acaacttcgt atataccttt ctatacgaag ttgt 34
<210> 47
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Missirlis-1 间隔序列
<400> 47
gtatagta 8
<210> 48
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Missirlis-2 间隔序列
<400> 48
ggctatag 8
<210> 49
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> Loxm11 间隔序列
<400> 49
tggtatcg 8
<210> 50
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> LE 反向重复突变序列
<400> 50
taccg 5
<210> 51
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> RE 反向重复突变序列
<400> 51
cggta 5
<210> 52
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lox71 位点
<400> 52
taccgttcgt atagcataca ttatacgaag ttat 34
<210> 53
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Lox66 位点
<400> 53
ataacttcgt atagcataca ttatacgaac ggta 34
<210> 54
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxJTZ17 位点
<400> 54
ataacttcgt atagcataca ttatagcaat ttat 34
<210> 55
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxKR1 位点
<400> 55
ataacttcgt atagcataca ttataccaac tgtt 34
<210> 56
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxKR2 位点
<400> 56
ataacttcgt atagcataca ttataccaac ttaa 34
<210> 57
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxKR3 位点
<400> 57
ataacttcgt atagcataca ttataccttg ttat 34
<210> 58
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxKR4 位点
<400> 58
ataacttcgt atagcataca ttattgcaag ttat 34
<210> 59
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> LoxJT15 位点
<400> 59
aattattcgt atagcataca ttatacgaag ttat 34
<210> 60
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> FRT LE 突变体
<400> 60
gaagttcata ttctctagaa agtataggaa cttc 34
<210> 61
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> FRT RE 突变体
<400> 61
gaagttccta ttctctagaa agtatatgaa cttc 34
<210> 62
<211> 201
<212> DNA
<213> 腺相关病毒 2
<400> 62
gggcactctt ccgtggtctg gtggataaat tcgcaagggt atcatggcgg acgaccgggg 60
ttcgaacccc ggatccggcc gtccgccgtg atccatgcgg ttaccgcccg cgtgtcgaac 120
ccaggtgtgc gacgtcagac aacgggggag cgctcctttt ggcttccttc caggcgcggc 180
ggctgctgcg ctagcttttt t 201
<210> 63
<211> 201
<212> DNA
<213> 腺相关病毒 2
<400> 63
gggcactctt ccgtggtctg gtggataaat tcgcaagggt atcatggcgg acgaccgttg 60
ttcgaacacc ggatccggcc gtccgccgtg atccatgcgg ttaccgcccg cgtgtcgaac 120
ccaggtgtgc gacgtcagac aacgggggag cgctcctttt ggcttccttc caggcgcggc 180
ggctgctgcg ctagcttttt t 201
<210> 64
<211> 6
<212> DNA
<213> 腺相关病毒 2
<400> 64
gggcac 6
<210> 65
<211> 6
<212> DNA
<213> 智人
<400> 65
tttttt 6
<210> 66
<211> 157
<212> DNA
<213> 腺相关病毒 2
<400> 66
aggagcgctc ccccgttgtc tgacgtcgca cacctgggtt cgacacgcgg gcggtaaccg 60
catggatcac ggcggacggc cggatccggt gttcgaacaa cggtcgtccg ccatgatacc 120
cttgcgaatt tatccaccag accacggaag agtgccc 157
<210> 67
<211> 313
<212> DNA
<213> 人工序列
<220>
<223> 具有 Lx-LE 和 Lx-RE 的 VA RNA 反向序列
<400> 67
taccgttcgt ataagtttat atatacgaag ttatggacga aacaccgggc acttttttca 60
gtggccaaaa aagctagcgc agcagccgcc gcgcctggaa ggaagccaaa aggagcgctc 120
ccccgttgtc tgacgtcgca cacctgggtt cgacacgcgg gcggtaaccg catggatcac 180
ggcggacggc cggatccggt gttcgaacaa cggtcgtccg ccatgatacc cttgcgaatt 240
tatccaccag accacggaag agtgcccggt gtttcgtcct accgttcgta tatataaact 300
tatacgaagt tat 313
<210> 68
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 填充序列
<400> 68
ggacgaaaca cc 12
<210> 69
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 具有填充序列的 Lx-LE 位点
<400> 69
taccgttcgt ataagtttat atatacgaag ttatggacga aacacc 46
<210> 70
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 具有突变的左反向重复序列的 L3 元件 (L3-LE)
<400> 70
taccgttcgt ataaagtctc ctatacgaag ttat 34
<210> 71
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 具有突变的右反向重复序列的 L3 元件 (L3-RE)
<400> 71
ataacttcgt ataaagtctc ctatacgaac ggta 34
<210> 72
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 具有突变的左反向重复序列的 L3 元件 (LoxFas-LE)
<400> 72
taccgttcgt atataccttt ctatacgaag ttat 34
<210> 73
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 具有突变的右反向重复序列的 L3 元件 (LoxFas-RE)
<400> 73
ataacttcgt atataccttt ctatacgaac ggta 34
<210> 74
<211> 9
<212> DNA
<213> 智人
<400> 74
tttatatat 9
<210> 75
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> VP1 衣壳
<400> 75
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 76
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> VP1 衣壳
<400> 76
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 77
<211> 4
<212> RNA
<213> 人 2 型腺病毒
<400> 77
ccgg 4
<210> 78
<211> 5
<212> RNA
<213> 人 2 型腺病毒
<400> 78
yccgg 5
<210> 79
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> VA RNA A 盒共有序列
<220>
<221> misc_feature
<222> (4)..(5)
<223> n 是 a、c、g 或 u
<400> 79
rrynnarygg 10
<210> 80
<211> 9
<212> RNA
<213> 人工序列
<220>
<223> VA RNA B 盒共有序列
<220>
<221> misc_feature
<222> (7)..(8)
<223> n 是 a、c、g 或 u
<400> 80
gwucrannc 9
<210> 81
<211> 225
<212> DNA
<213> 人 2 型腺病毒
<400> 81
cgtgcaaaag gagagcctgt aagcgggcac tcttccgtgg tctggtggat aaattcgcaa 60
gggtatcatg gcggacgacc ggggttcgaa ccccggatcc ggccgtccgc cgtgatccat 120
gcggttaccg cccgcgtgtc gaacccaggt gtgcgacgtc agacaacggg ggagcgctcc 180
ttttggcttc cttccaggcg cggcggctgc tgcgctagct ttttt 225
<210> 82
<211> 225
<212> DNA
<213> 人 2 型腺病毒
<400> 82
cgtgcaaaag gagagcctgt aagcgggcac tcttccgtgg tctggtggat aaattcgcaa 60
gggtatcatg gcggacgacc gttgttcgaa caccggatcc ggccgtccgc cgtgatccat 120
gcggttaccg cccgcgtgtc gaacccaggt gtgcgacgtc agacaacggg ggagcgctcc 180
ttttggcttc cttccaggcg cggcggctgc tgcgctagct ttttt 225
<210> 83
<211> 242
<212> DNA
<213> 人 5 型腺病毒
<400> 83
tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct 60
ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc 120
cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga 180
caacggggga gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt 240
tt 242
<210> 84
<211> 466
<212> DNA
<213> 人 5 型腺病毒
<400> 84
tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct 60
ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc 120
cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga 180
caacggggga gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt 240
ttggccactg gccgcgcgca gcgtaagcgg ttaggctgga aagcgaaagc attaagtggc 300
tcgctccctg tagccggagg gttattttcc aagggttgag tcgcgggacc cccggttcga 360
gtctcggacc ggccggactg cggcgaacgg gggtttgcct ccccgtcatg caagaccccg 420
cttgcaaatt cctccggaaa cagggacgag cccctttttt gctttt 466
<210> 85
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 52bp 最小 CMV 启动子
<400> 85
gtaggcgtgt acggtgggag gtctatataa gcagagctcc gtttagtgaa cg 52
<210> 86
<211> 417
<212> DNA
<213> 人工序列
<220>
<223> SV40 早期启动子的 417 bp 片段,包括转录起始 (TS) 区
<400> 86
atttcaggcc atggtgctgc aacctctgaa agaggaactt ggttaggttc cttctgaggc 60
ggaaagaacc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 120
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 180
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 240
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 300
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 360
ctattccaga agtagtgagg aggctttttt ggaggactag gcttttgcaa aaagcta 417
<210> 87
<211> 236
<212> PRT
<213> 人工序列
<220>
<223> mCherry
<400> 87
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 88
<211> 239
<212> PRT
<213> 人工序列
<220>
<223> EGFP
<400> 88
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 89
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> FRT-LE-RE
<400> 89
gaagttcata ttctctagaa agtatatgaa cttc 34

Claims (11)

1.一种双链DNA元件,其包含编码链和模板链,
其特征在于
编码链以5'-至3'-方向按以下顺序包含:
-第一启动子;
-第一重组酶识别序列,所述第一重组酶识别序列在左反向重复序列中包含突变;
-第二启动子,所述第二启动子相对于所述编码链为反向;
-第一多聚腺苷酸化信号序列和/或转录终止元件,所述第一多聚腺苷酸化信号序列和/或转录终止元件相对于所述编码链为反向;
-第一开放阅读框,所述第一开放阅读框相对于所述编码链为反向并且所述第一开放阅读框可操作地连接至所述第一多聚腺苷酸化信号序列和/或转录终止元件;
-第二重组酶识别序列,所述第二重组酶识别序列在右反向重复序列中包含突变并且相对于所述第一重组酶识别序列处于反向方向;
-第二开放阅读框;以及
-第二多聚腺苷酸化信号序列和/或转录终止元件,所述第二多聚腺苷酸化信号序列和/或转录终止元件可操作地连接至所述第二开放阅读框。
2.一种双链DNA元件,其包含编码链和模板链,其中所述编码链以5'-至3'-方向按以下顺序包含:
-第一启动子;
-第一重组酶识别序列,所述第一重组酶识别序列在左反向重复序列中包含突变;
-Rep/Cap开放阅读框,所述Rep/Cap开放阅读框包括用于表达Rep和Cap蛋白的其他启动子,所述Rep/Cap开放阅读框相对于所述编码链为反向;
-第二重组酶识别序列,所述第二重组酶识别序列在右反向重复序列中包含突变并且相对于所述第一重组酶识别序列处于反向方向;以及
-多聚腺苷酸化信号序列。
3.一种双链DNA元件,其包含编码链和模板链,
a)其中所述编码链以5'-至3'-方向按以下顺序包含:
-第一启动子;
-第一重组酶识别序列,所述第一重组酶识别序列在左反向重复序列中包含突变;
-第二启动子,所述第二启动子相对于所述编码链为反向;
-第一多聚腺苷酸化信号序列和/或转录终止元件,所述第一多聚腺苷酸化信号序列和/或转录终止元件相对于所述编码链为反向;
-编码序列,
所述编码序列仅编码Rep78蛋白或仅编码Rep68蛋白,但不编码两者,其中
(i)任选地使内部P40启动子失活,且/或
(ii)将Rep52/40的起始密码子突变成非起始密码子,且/或
(iii)移除剪接供体和受体位点,
所述编码序列相对于所述编码链为反向,并且
所述编码序列可操作地连接至所述第一多聚腺苷酸化信号序列和/或转录终止元件;
-第二重组酶识别序列,所述第二重组酶识别序列在右反向重复序列中包含突变并且所述第二重组酶识别序列相对于所述第一重组酶识别序列处于反向方向;以及
-Rep52/Rep40和Cap开放阅读框,所述Rep52/Rep40和Cap阅读框包括可操作地连接至所述开放阅读框的多聚腺苷酸化信号序列,
或者
b)其中所述编码链以5'-至3'-方向按以下顺序包含:
-第一启动子;
-第一重组酶识别序列,所述第一重组酶识别序列在所述左反向重复序列中包含突变;
-第二启动子,所述第二启动子相对于所述编码链为反向;
-第一多聚腺苷酸化信号序列和/或转录终止元件,所述第一多聚腺苷酸化信号序列和/或转录终止元件相对于所述编码链为反向;
-编码序列,
所述编码序列仅编码Rep78蛋白或仅编码Rep68蛋白,但不编码两者,其中
(i)任选地使内部启动子失活,且/或
(ii)将所述Rep52/40开放阅读框的所述起始密码子突变成非起始密码子,并且
(iii)移除剪接供体和受体位点,
所述编码序列相对于所述编码链为反向,并且
所述编码序列可操作地连接至所述第一多聚腺苷酸化信号序列和/或转录终止元件;
-第二重组酶识别序列,所述第二重组酶识别序列在所述右反向重复序列中包含突变并且所述第二重组酶识别序列相对于所述第一重组酶识别序列处于反向方向;以及
-所述Rep52开放阅读框,其中任选地移除剪接供体和受体位点,或所述Rep40开放阅读框,所述Rep40开放阅读框包括可操作地连接至所述开放阅读框的多聚腺苷酸化信号。
4.根据权利要求2至3中任一项所述的双链DNA元件,其中所述第一启动子为P5启动子。
5.根据权利要求3至4中任一项所述的双链DNA元件,其中所述第二启动子为P19启动子。
6.根据权利要求3至5中任一项所述的双链DNA元件,其中在c)中所述编码链在其3'-端进一步包含:
-第三启动子、cap开放阅读框以及多聚腺苷酸化信号序列和/或终止子序列,其中所有都可操作地连接。
7.一种双链DNA分子,其包含:
a)E1A开放阅读框和E1B开放阅读框;和/或
b)E2A开放阅读框和E4orf6开放阅读框;
其特征在于
a)或/和b)的第一开放阅读框和第二开放阅读框包含在双链DNA元件中,所述双链DNA元件包含编码链和模板链,
其中所述编码链以5'-至3'-方向按以下顺序包含:
-第一启动子;
-第一重组酶识别序列,所述第一重组酶识别序列在右反向重复序列中包含突变;
-第二启动子,所述第二启动子相对于所述编码链为反向;
-a)或b)的所述第一开放阅读框,所述第一开放阅读框相对于所述编码链为反向;
-第二重组酶识别序列,所述第二重组酶识别序列在左反向重复序列中包含突变并且相对于所述第一重组酶识别序列处于反向方向;以及
-a)或b)的所述第二开放阅读框。
8.一种双链DNA分子,其包含两个或更多个选自权利要求1至7的双链DNA元件或分子。
9.根据权利要求2所述的双链DNA元件或双链DNA,
其中所述双链DNA元件或分子与对所述第一重组酶识别序列和所述第二重组酶识别序列具有功能的重组酶的孵育引起
-介于所述第一重组酶识别序列与所述第二重组酶识别序列之间的序列的反转,此后所述第一启动子可操作地连接至所述第一开放阅读框,以及
-重组后在所述第一启动子与第一基因之间产生重组酶识别序列,所述重组酶识别序列不再对所述重组酶具有功能。
10.根据权利要求1和3至8中任一项所述的双链DNA元件或双链DNA,
其中所述双链DNA元件或分子与对所述第一重组酶识别序列和所述第二重组酶识别序列具有功能的重组酶的孵育引起
-介于所述第一重组酶识别序列与所述第二重组酶识别序列之间的序列的反转,此后所述第一启动子可操作地连接至所述第一开放阅读框,并且所述第二启动子可操作地连接至所述第二开放阅读框,以及
-重组后在所述第一启动子与第一基因之间产生重组酶识别序列,所述重组酶识别序列不再对所述重组酶具有功能。
11.一种哺乳动物细胞,其包含:
-一个或多个根据权利要求1所述的双链DNA元件,或
-至少一个根据权利要求2至6中任一项所述的双链DNA元件,或
-一个根据权利要求2至6中任一项所述的双链DNA分子和一个根据权利要求7所述双链DNA分子,或
-至少一个根据权利要求7所述的双链DNA分子,或
-一个或多个根据权利要求8所述的双链DNA。
CN202180069016.6A 2020-10-15 2021-10-13 用于同时基因活化的核酸构建体 Pending CN116348607A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20202009.5 2020-10-15
EP20202009 2020-10-15
PCT/EP2021/078268 WO2022079082A1 (en) 2020-10-15 2021-10-13 Nucleic acid constructs for simultaneous gene activation

Publications (1)

Publication Number Publication Date
CN116348607A true CN116348607A (zh) 2023-06-27

Family

ID=72964436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180069016.6A Pending CN116348607A (zh) 2020-10-15 2021-10-13 用于同时基因活化的核酸构建体

Country Status (12)

Country Link
US (1) US20220154223A1 (zh)
EP (1) EP4229204A1 (zh)
JP (1) JP2023546113A (zh)
KR (1) KR20230085170A (zh)
CN (1) CN116348607A (zh)
AR (1) AR123776A1 (zh)
AU (1) AU2021363098A1 (zh)
CA (1) CA3197726A1 (zh)
IL (1) IL302045A (zh)
MX (1) MX2023004178A (zh)
TW (1) TW202229558A (zh)
WO (1) WO2022079082A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024026302A2 (en) * 2022-07-26 2024-02-01 Asimov Inc. Compositions and methods for adeno-associated viral production

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US6093699A (en) 1987-07-09 2000-07-25 The University Of Manitoba Method for gene therapy involving suppression of an immune response
ATE157012T1 (de) 1989-11-03 1997-09-15 Univ Vanderbilt Verfahren zur in vivo-verabreichung von funktionsfähigen fremden genen
US5279833A (en) 1990-04-04 1994-01-18 Yale University Liposomal transfection of nucleic acids into animal cells
AU7906691A (en) 1990-05-23 1991-12-10 United States of America, as represented by the Secretary, U.S. Department of Commerce, The Adeno-associated virus (aav)-based eucaryotic vectors
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
JP3150340B2 (ja) 1990-11-13 2001-03-26 イムネクス コーポレイション 二機能選択可能融合遺伝子
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
WO1993024640A2 (en) 1992-06-04 1993-12-09 The Regents Of The University Of California Methods and compositions for in vivo gene therapy
WO1994017810A1 (en) 1993-02-12 1994-08-18 The Wistar Institute Of Anatomy And Biology Recombinant cytomegalovirus vaccine
CA2160583A1 (en) 1993-04-16 1994-10-27 Stanley A. Plotkin Recombinant cytomegalovirus vaccine
NZ267797A (en) 1993-05-17 1997-09-22 Univ California Retroviral vector comprising a ribozyme capable of cleaving a hiv nucleic acid capable
AU6953394A (en) 1993-05-21 1994-12-20 Targeted Genetics Corporation Bifunctional selectable fusion genes based on the cytosine deaminase (cd) gene
US5998205A (en) 1994-11-28 1999-12-07 Genetic Therapy, Inc. Vectors for tissue-specific replication
CN1136920C (zh) 1995-02-28 2004-02-04 加利福尼亚大学董事会 基因转移介导的血管形成疗法
US6001650A (en) 1995-08-03 1999-12-14 Avigen, Inc. High-efficiency wild-type-free AAV helper functions
EP1983057A3 (en) 1995-09-08 2009-01-07 Genzyme Corporation Improved AAV vectors for gene therapy
US6004797A (en) 1995-11-09 1999-12-21 Avigen, Inc. Adenovirus helper-free recombinant AAV Virion production
US6228646B1 (en) 1996-03-07 2001-05-08 The Regents Of The University Of California Helper-free, totally defective adenovirus for gene therapy
JPH1033175A (ja) 1996-07-24 1998-02-10 Hisamitsu Pharmaceut Co Inc 組換えアデノ随伴ウイルスベクターの製造方法
EP0950111A1 (en) 1996-09-06 1999-10-20 The Trustees Of The University Of Pennsylvania Methods using cre-lox for production of recombinant adeno-associated viruses
DE19650714A1 (de) 1996-12-06 1998-06-10 Melchner Harald Von Prof Dr Genfallen-Konstrukt zur Identifizierung und Isolierung von Genen
EP1484409B1 (en) 1996-12-16 2009-04-08 Eisai R&D Management Co., Ltd. DNA-construction comprising a drug-resistance gene and a foreign gene
WO1998027207A1 (en) 1996-12-18 1998-06-25 Targeted Genetics Corporation Recombinase-activatable aav packaging cassettes for use in the production of aav vectors
US6303302B1 (en) 1997-11-19 2001-10-16 The Whitehead Institute For Biomedical Research Regulation of fungal gene expression
DE19955558C2 (de) 1999-11-18 2003-03-20 Stefan Kochanek Permanente Amniozyten-Zelllinie, ihre Herstellung und Verwendung zur Herstellung von Gentransfervektoren
EP1134287A1 (en) 2000-03-08 2001-09-19 Universite De Geneve A system to control the expression of a given gene using another gene that encodes a polypeptide with recombinant activity
AU2001257611A1 (en) 2000-04-28 2001-11-12 Avigen, Inc. Polynucleotides for use in recombinant adeno-associated virus virion production
US6936747B2 (en) 2000-07-21 2005-08-30 The United States Of America As Represented By The Secretary Of Agriculture Methods for the replacement, translocation and stacking of DNA in eukaryotic genomes
US6593123B1 (en) 2000-08-07 2003-07-15 Avigen, Inc. Large-scale recombinant adeno-associated virus (rAAV) production and purification
AU2002219841A1 (en) 2000-11-16 2002-05-27 Cornell Research Foundation Inc. Vectors for conditional gene inactivation
US7074611B2 (en) 2001-04-27 2006-07-11 Gie-Cerbn, Centre Europeen De Recherche En Biologie Et En Medecine (Gie) Method for the stable inversion of DNA sequence by site-specific recombination and DNA vectors and transgenic cells thereof
US20030190746A1 (en) 2002-04-04 2003-10-09 Xiao Xiao Gene expression control system and its use in recombinant virus packaging cell lines
AU2003247696A1 (en) 2002-07-01 2004-01-19 E.I. Du Pont De Nemours And Company Method of controlling gene silencing using site-specific recombination
US20080226553A1 (en) 2002-09-27 2008-09-18 Cold Spring Harbor Laboratory Cell-Based Rna Interference and Related Methods and Compositions
US7261544B2 (en) 2003-05-21 2007-08-28 Genzyme Corporation Methods for producing preparations of recombinant AAV virions substantially free of empty capsids
US20060110390A1 (en) 2004-08-25 2006-05-25 Myogen, Inc. Inhibition of Ku as a treatment for cardiovascular diseases
WO2006099615A2 (en) 2005-03-16 2006-09-21 The Johns Hopkins University Adenoviral fiber exchange shuttle system
DE102005054628A1 (de) 2005-11-16 2007-05-24 Cevec Pharmaceuticals Gmbh Verfahren zur Herstellung von permanenten humanen Zelllinien
BR112012018899A2 (pt) 2010-01-28 2015-09-15 Philadelphia Children Hospital "método para purificar partículas de vetor de vírus adeno-associado."
US8852930B2 (en) 2010-02-09 2014-10-07 The Trustees Of Columbia University In The City Of New York In vivo gene regulation by the combination of knock-in-tetO sequence into the genome and tetracycline-controlled trans-suppressor (tTS) protein
EP2737071B1 (en) 2011-07-27 2017-03-15 Genethon Improved baculovirus expression systems
US20130058871A1 (en) 2011-07-28 2013-03-07 Howard Hughes Medical Institute Method and system for mapping synaptic connectivity using light microscopy
ES2857773T5 (es) 2011-08-24 2024-06-04 Univ Leland Stanford Junior Nuevas proteínas de la cápside de AAV para la transferencia de ácidos nucleicos
PL2839014T3 (pl) 2012-04-18 2021-08-23 The Children's Hospital Of Philadelphia Kompozycja i sposoby na wysoko wydajny transfer genu za pomocą kapsydu wariantów aav
ES2774966T3 (es) 2013-07-22 2020-07-23 Childrens Hospital Philadelphia Variantes de aav y composiciones, métodos y usos para la transferencia de genes a células, órganos y tejidos
EP3564379A1 (en) 2013-09-13 2019-11-06 California Institute of Technology Selective recovery
WO2015068411A1 (ja) 2013-11-05 2015-05-14 国立大学法人東北大学 遺伝子組み換え非ヒト動物
EP3204050A4 (en) 2014-10-09 2018-04-04 The Regents of The University of California Targeted disruption of a csf1-dap12 pathway member gene for the treatment of neuropathic pain
SG11201804400SA (en) 2015-12-01 2018-06-28 Spark Therapeutics Inc Scalable methods for producing recombinant adeno-associated viral (aav) vector in serum-free suspension cell culture system suitable for clinical use
EP3875593A1 (en) 2015-12-11 2021-09-08 California Institute of Technology Targeting peptides for directing adeno-associated viruses (aavs)
US10752904B2 (en) 2016-04-26 2020-08-25 Massachusetts Institute Of Technology Extensible recombinase cascades
WO2018096356A1 (en) 2016-11-28 2018-05-31 Horizon Discovery Limited Methods for conditional gene knock-out
WO2018150271A1 (en) 2017-02-17 2018-08-23 Lonza Ltd. Mammalian cells for producing adeno-associated viruses
CN110997912A (zh) 2017-06-07 2020-04-10 星火治疗有限公司 用于改进的细胞转染和/或rAAV载体生产的增强剂
WO2018229276A1 (en) 2017-06-16 2018-12-20 Universite De Strasbourg Methods to generate conditional knock-in models
CN111032176A (zh) 2017-06-30 2020-04-17 星火治疗有限公司 Aav载体柱纯化方法
CA3059995A1 (en) 2017-08-28 2019-03-07 The Regents Of The University Of California Adeno-associated virus capsid variants and methods of use thereof
GB201816919D0 (en) 2018-10-17 2018-11-28 Glaxosmithkline Ip Dev Ltd Adeno-associated viral vector producer cell lines

Also Published As

Publication number Publication date
US20220154223A1 (en) 2022-05-19
MX2023004178A (es) 2023-05-03
EP4229204A1 (en) 2023-08-23
TW202229558A (zh) 2022-08-01
AR123776A1 (es) 2023-01-11
JP2023546113A (ja) 2023-11-01
KR20230085170A (ko) 2023-06-13
AU2021363098A1 (en) 2023-05-18
WO2022079082A1 (en) 2022-04-21
CA3197726A1 (en) 2022-04-21
IL302045A (en) 2023-06-01

Similar Documents

Publication Publication Date Title
JP7463358B2 (ja) アデノ随伴ウイルスベクタープロデューサー細胞株
US9896665B2 (en) Proviral plasmids and production of recombinant adeno-associated virus
JP2023081975A (ja) アデノ随伴ウイルスベクターの産生方法
KR102499953B1 (ko) Aav 입자의 생산을 위한 벡터
JP2013529063A (ja) 薬理学的に誘導される導入遺伝子アブレーション系
CN116348607A (zh) 用于同时基因活化的核酸构建体
KR20240025645A (ko) 아데노-연관된 바이러스 패키징 시스템
KR20230085929A (ko) Va rna 전사를 위한 핵산 구조체
JP2022541915A (ja) 生物製造のための合成遺伝子要素
US12049638B2 (en) Synthetic genetic elements for biomanufacture
Wang et al. Large T antigen mediated target gene replication improves site-specific recombination efficiency
WO2023086889A1 (en) Methods of targeting mutant cells
WO2023220043A1 (en) Erythroparvovirus with a modified genome for gene therapy
Kligman Establishing a stable cell-line for producing Adeno-Associated Virus using CRISPR-Cas9
CN117716042A (zh) 腺相关病毒包装系统
WO2005062812A2 (en) A rAAV-BASED SYSTEM FOR SOMATIC CELL GENE DISRUPTION

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40091612

Country of ref document: HK