本发明专利申请是国际申请号为PCT/US2010/002205,国际申请日为2010年8月11日,进入中国国家阶段的申请号为“201080045005.6”,发明名称为“靶向修饰的纯合生物体”的发明专利申请的分案申请。
附图简要说明
图1显示对经ZFN-TI-修饰的玉蜀黍(Zea mays)IPK1染色质的非TI等位基因的序列分析。带下划线的碱基对显示用于基因组修饰的ZFN对的结合位点。“:”表示缺失的碱基。第一行显示野生型序列,而下面显示测序的非TI等位基因的多次序列读取。
图2描述用于将荧光蛋白(增强的黄色荧光蛋白(EYFP))引入鼠组蛋白H3.3B基因的3’非翻译区的方案。顶部线条显示H3.3B基因在鼠基因组11号染色体上的示意图,并显示基因序列上H3.3B-特异性ZFN的靶位点。第二线条描述包括H3.3B基因与EYFP相连的供体核苷酸(“靶向构建物”),其中EYFP已插入所述3’非翻译区的5’末端。底部线条描述供体核苷酸插入鼠基因组的H3.3B基因座。
图3显示FACS和Southern印迹分析的结果表明EYFP转基因杂合整合入鼠ES细胞。图3A显示在H3.3B基因座不含插入EYFP基因序列的ES细胞的FACS结果(上图),以及已接受H3.3B-EYFP插入的细胞的FACS结果。图3B显示用具有插入H3.3B-EYFP序列的细胞和野生型细胞的基因组DNA所得Southern印迹。
图4显示表明H3.3B-EYFP/杂合子中有NHEJ的19个无报道子等位基因的序列。带下划线的碱基对显示用于修饰的ZFN对的结合位点。“-”表示序列中缺失的碱基或间隔以与含插入的克隆对齐。
发明详述
本文描述纯合修饰的生物体,包括在靶基因座任一等位基因上都不含添加遗传材料的敲除(KO)生物体和包括感兴趣转基因的敲入生物体,但其中感兴趣转基因缺乏编码报道子如选择性标记的序列。还描述了产生这些带修饰生物体的方法。具体来说,所述生物体通常在两条等位基因上都有改变基因功能的修饰。这些生物体通过以下步骤产生:提供来自感兴趣生物的细胞,用核酸酶将外源报道序列(例如,筛选或选择性标记)通过靶向整合(TI)插入细胞内选定基因座的等位基因内,鉴定所述外源报道序列已插入选定基因座的等位基因内的细胞,筛选用于所述基因座第二等位基因修饰的单等位基因报道子-TI克隆以鉴定具有一条报道子TI等位基因的细胞,其另一等位基因被NHEJ修饰(报道子TI/NHEJ)或其另一等位基因包含无报道子标记转基因(报道子-TI/修饰克隆),使所述报道子-TI/修饰克隆发育至繁殖上成熟的生物体,杂交所述报道子-TI/修饰生物体,并鉴定是双等位基因敲除(NHEJ/NHEJ)或双等位基因非报道子标记物敲入(非报道子TI/非报道子标记物TI)生物体的杂交子代。
概述
除非另有说明,本方法的实施以及本文所述组合物的制备与应用采用本领域技术范围内的分子生物学、生物化学、染色质结构与分析、计算化学、细胞培养、重组DNA与相关领域的常规技术。这些技术在文献中已有充分描述。参见例如,Sambrook等,MOLECULAR CLONING:A LABORATORYMANUAL(《分子克隆:实验室手册》)第2版,冷泉港实验室出版社(Cold SpringHarbor Laboratory Press),1989以及第3版,2001;Ausubel等,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY(《新编分子生物学实验指南》),纽约约翰韦利父子公司(John Wiley&Sons,New York)1987及定期更新;METHODS IN ENZYMOLOGY(《酶学方法》)丛书,圣迭戈学术出版社(Academic Press,San Diego);Wolffe,CHROMATIN STRUCTURE ANDFUNCTION(《染色质结构与功能》),第3版,学术出版社,圣迭戈,1998;METHODS IN ENZYMOLOGY(《酶学方法》),第304卷,“Chromatin(染色质)”(P.M.Wassarman和A.P.Wolffe编),学术出版社,圣迭戈,1999;和METHODS IN MOLECULAR BIOLOGY(《分子生物学方法》),第119卷,“Chromatin Protocols(染色质方法)”(P.B.Becker编),托托瓦的休玛纳出版社(Humana Press,Totowa),1999。
定义
术语"核酸","多核苷酸"和"寡核苷酸"互换使用并指脱氧核糖核酸或核糖核甘酸聚合物,可以是直链或环状构型的,是单链或双链形式的。就本公开的目的而言,这些术语不构成对聚合物长度的限制。这些术语可涵盖天然核苷酸的已知类似物以及在碱基、糖和/或磷酸部分经过修饰的核苷酸(例如,硫代磷酸主链)。通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物与T碱基配对。
互换使用的术语“多肽”、“肽”和“蛋白质”指氨基酸残基的聚合物。该术语也适用于其中一个或多个氨基酸是相应的天然存在氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。
"结合"指大分子之间(例如蛋白与核酸之间)的序列特异性、非共价相互作用。只要相互作用作为整体为序列特异性,不要求结合相互作用的所有组分都是序列特异性(例如,与DNA主链中的磷酸残基接触)。这样的相互作用通常表征为解离常数(Kd)是10-6M-1或更低。“亲合力”指结合的强度:提高的结合亲合力与较低的Kd关联。
"结合蛋白"是能与另一分子非共价结合的蛋白质。例如,结合蛋白能结合DNA分子(DNA-结合蛋白),RNA分子(RNA-结合蛋白)和/或蛋白分子(蛋白-结合蛋白)。在蛋白-结合蛋白的情况中,其可与自身结合(形成同二聚体、同三聚体等)和/或其可与不同蛋白或多种蛋白的一个或多个分子结合。结合蛋白可具有超过一种结合活性。例如,锌指蛋白具有DNA结合,RNA结合和蛋白结合活性。
“TAL-效应子DNA结合域”是蛋白质或较大蛋白内的结构域,其以序列特异性方式通过一个或多个串联重复结构域与DNA相互作用。
"锌指DNA结合蛋白"(或结合域)是能以序列特异性方式通过一个或多个锌指结合DNA的蛋白质或较大蛋白质内的结构域,锌指是通过锌离子配位稳定其结构的结合域内氨基酸序列的区域。术语锌指DNA结合蛋白常简称为锌指蛋白或ZFP。
锌指结合域(例如,识别螺旋区)可经过"工程改造"以结合预定的核苷酸序列。锌指经工程改造的区域通常是识别螺旋,具体是编号-1到+6的α-螺旋区。本领域已知工程改造识别螺旋的主链序列。参见例如,Miller等,(2007)NatBiotechnol 25,778-785。工程改造锌指蛋白的方法的非限制性示例是设计和选择。设计的锌指蛋白是其设计/组成主要由合理基准所得的非天然存在的蛋白。用于设计的合理基准包括取代法则和计算机化算法的应用,计算机化算法用于加工储存已有ZFP设计与结合数据的数据库内的信息。参见例如,美国专利号6,140,081、6,453,242和6,534,261;也参见WO 98/53058、WO 98/53059、WO 98/53060、WO 02/016536和WO 03/016496。
"选定的"锌指蛋白是其生成主要由经验方法如噬菌体展示、相互作用陷阱或杂交体选择产生的天然情况下未发现的蛋白质。参见例如,美国专利号5,789,538、5,925,523、6,007,988、6,013,453、6,200,759和国际专利公开号WO 95/19431、WO 96/06166、WO 98/53057、WO 98/54311、WO 00/27878、WO 01/60970、WO 01/88197和WO 02/099084。
术语"序列"指任意长度的核苷酸序列,可以是DNA或RNA;可以是直链、环状或支链且可以是单链或双链。术语"供体序列"指插入基因组的核苷酸序列。供体序列可以是任意长度,例如长度为2-10,000个核苷酸(或其间或其上的任意整数值),优选长度为100-1,000个核苷酸(或其间的任意整数),更优选长度为200-500个核苷酸。
"同源,非相同序列"指与第二序列共有一定程度序列相同性的第一序列,但其序列与第二序列的序列并不相同。例如,含有突变基因的野生型序列的多核苷酸与所述突变基因的序列同源且非相同。在某些实施方式中,两个序列间的同源度足以允许利用正常的细胞机制在它们之间进行同源重组。两个同源非相同序列可以是任意长度,且其非同源的程度可低至单个核苷酸(例如,用于通过靶向同源重组校正基因组点突变)或高达10kb或更高(例如,用于将基因插入染色体中预定的异位位点)。不要求包含同源非相同序列的两个多核苷酸为相同长度。例如,可使用20-10,000个核苷酸或核苷酸对的外源多核苷酸(即,供体多核苷酸)。
本领域已知确定核酸和氨基酸序列相同性的技术。通常,此类技术包括确定某基因mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并将这些序列与第二核苷酸或氨基酸序列比较。也可以此方式确定并比较基因组序列。相同性通常分别指两条多核苷酸或多肽序列的核苷酸与核苷酸或氨基酸与氨基酸的确切对应性。可通过测定两条或多条序列(多核苷酸或氨基酸)的相同性百分数来比较这些序列。无论是核酸还是氨基酸序列,两条序列的相同性百分数是两条比对序列之间的确切匹配数目除以较短序列的长度并将结果乘以100。
或者,多核苷酸之间序列相似性的程度可以通过多核苷酸在允许同源区域间形成稳定双链体的条件下杂交,然后用单链特异性核酸酶消化并确定消化后片段的大小来测定。当按上述方法测定得到两条核酸或两个多核苷酸序列在所述分子的限定长度上显示至少约70%-75%,优选80%-82%,更优选85%-90%,更优选92%,更优选95%,且最优选98%的序列相同性时,所述序列彼此间基本同源。如本文所用,基本同源也指序列与指定的DNA或多肽序列显示完全的相同性。基本同源的DNA序列可在Southern杂交实验中鉴定,例如,以在对特定系统限定的严谨条件下。本领域技术人员能确定适当的杂交条件。参见例如,Sambrook等,同上;Nucleic Acid Hybridization:A Practical Approach(《核 酸杂交,实践方法》),B.D.Hames和S.J.Higgins编,(1985)牛津(Oxford);华盛顿特区;IRL出版社)。
"重组"指两个多核苷酸之间交换遗传信息的过程。就本公开的目的而言,"同源重组(HR)"指发生这种交换的特定形式,例如在修复细胞内双链断裂期间通过同源导向修复机制发生。该过程要求核苷酸序列同源性,利用"供体"分子模板修复"靶"分子(即,经历双链断裂的分子),该过程也称作"非交叉基因转化"或"短道基因转化",因为其导致遗传信息从供体向靶转移。不希望受限于任何特定理论,这种转移可以涉及断裂的靶与供体间形成的异双链体DNA的错配校正,和/或采用供体再合成将成为部分靶的遗传信息的"合成依赖性链退火",和/或相关过程。这些特定HR通常导致靶分子的序列改变使得供体多核苷酸的部分或全部序列被纳入靶多核苷酸。
在本公开所述方法中,本文所述的一种或多种靶向核酸酶在靶序列(例如,细胞染色质)中预定位点处产生双链断裂,而与断裂区的核苷酸序列有同源性的“供体”多核苷酸可引入细胞。已显示存在双链断裂(DSB)有助于供体序列的整合。供体序列可以物理整合,或者,供体多核苷酸用作通过同源重组修复断裂的模板,导致供体内核苷酸序列的全部或部分被引入细胞染色质。因此,细胞染色质中的第一序列可改变,并且在某些实施方式中,可转化成供体多核苷酸中存在的序列。因此,使用术语“替换”或“置换”可理解为代表一种核苷酸序列被另一种核苷酸序列替换(即,信息意义上序列的替换),而不一定要求一种多核苷酸被另一种多核苷酸物理或化学替换。在一些实施方式中,通过本文所述的靶向核酸酶引入两个DSB,导致两个DSB间的DNA缺失。在一些实施方式中,“供体”多核苷酸插入这两个DSB之间。
因此,在某些实施方式中,供体序列中与感兴趣区域序列同源的部分呈现与待替换的基因组序列有约80-99%(或其间任意整数)的序列相同性。在其它实施方式中,供体和基因组序列间的同源性超过99%,例如,供体与基因组序列的超过100个连续碱基对之间相差仅1个核苷酸时。在某些情况中,供体序列的非同源部分可包含不存在于感兴趣区域的序列,从而将新序列引入感兴趣区域。在这些情况中,非同源序列通常侧接有50-1,000碱基对(或其间的任意整数值)或超过1,000的任意数量碱基对的序列,该序列与感兴趣区域中的序列同源或相同。在其它实施方式中,供体序列与第一序列非同源,并通过非同源重组机制插入基因组。
本文所述的任意方法可用于通过能破坏感兴趣基因表达的供体序列的靶向整合来使细胞内的一种或多种靶序列部分或完全失活。还提供具有部分或完全失活基因的细胞系。
此外,本文所述的靶向整合方法也可用于整合一种或多种外源序列。例如,外源核酸序列可包含一种或多种基因或cDNA分子,或任意类型的编码或非编码序列,以及一种或多种控制元件(例如,启动子)。此外,外源核酸序列可产生一种或多种RNA分子(例如,小发夹RNA(shRNA),抑制性RNA(RNAi),微小RNA(miRNA)等)。
"切割"指DNA分子共价主链的断裂。切割可以由多种方法启动,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割都可行,且双链切割可以是两次不同的单链切割事件的结果。DNA切割可导致产生钝端或交错末端。在某些实施方式中,将融合多肽用于靶向双链DNA切割。
"切割半结构域"是能与第二多肽(两者相同或不同)形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”、“+和–切割半结构域”和“右和左切割半结构域”互换使用,指能二聚化的成对切割半结构域。
“工程改造的切割半结构域”是经修饰以与另一切割半结构域(如另一工程改造的切割半结构域)形成专性异二聚体的切割半结构域。还可参见美国专利公开号2005/0064474、20070218528和2008/0131962,其全文通过引用纳入本文。
"染色质"是包含细胞基因组的核蛋白结构。细胞染色质包含核酸和蛋白,核酸主要为DNA,蛋白包括组蛋白和非组蛋白染色体蛋白。真核细胞染色质主要以核小体形式存在,其中核小体核心包含约150碱基对的DNA与八聚体关联,所述八聚体包含组蛋白H2A、H2B、H3和H4各两份;以及在核小体核心之间延伸的接头DNA(长度根据生物体而各有不同)。组蛋白H1分子通常与接头DNA关联。就本公开的目的而言,术语“染色质”意在涵盖所有类型的细胞核蛋白,包括原核与真核的。细胞染色质包括染色体和附加体的染色质。
"染色体"是包含细胞的全部或部分基因组的染色质复合体。细胞的基因组通常以其核型为特征,核型是包含细胞基因组的全部染色体的集合。细胞的基因组可包含一个或多个染色体。
"附加体"是复制的核酸、核蛋白复合体或其它包含并非细胞染色体核型部分的核酸的结构。附加体的示例包括质粒和某些病毒基因组。
"靶位点"或"靶序列"是限定结合分子将结合的核酸部分的核酸序列,前提是存在结合的充分条件。例如,序列5’-GAATTC-3’是Eco RI限制性核酸内切酶的靶位点。
"外源"分子是通常不存在于细胞内的分子,但可通过一种或多种遗传、生化或其它方法引入细胞。“通常存在于细胞内”是针对细胞的具体发育阶段和环境条件而定。因此,例如,仅在肌肉的胚胎发育期间存在的分子对于成体肌肉细胞是外源分子。类似地,通过热激诱导的分子对于未热激细胞是外源分子。例如,外源分子可包含功能失常的内源分子的功能性形式或者正常功能的内源分子的功能失常形式。
外源分子可以是小分子或大分子等,小分子如由组合化学方法所产生,大分子如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物,或者是包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,可以是单链或双链,可以是直链、支链或环状;且可以是任意长度。核酸包括那些能形成双链体以及形成三链体的核酸。参见,例如美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰基转移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。
外源分子可以是与内源分子同一类型的分子,例如外源蛋白或核酸。例如,外源核酸可包含引入细胞内的感染性病毒基因组、质粒或附加体,或包含通常不存在于细胞内的染色体。本领域技术人员已知将外源分子引入细胞内的方法,包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电转导、直接注射、细胞融合、粒子轰击、硫酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。
相反,"内源"分子是通常存在于特定环境条件下特定发育阶段的特定细胞中的分子。例如,内源核酸可包含染色体,线粒体、叶绿体或其它细胞器的基因组,或天然产生的附加体核酸。其它内源分子可包括蛋白质,例如转录因子和酶。
"融合"分子是其中两个或多个亚单元分子相连(优选共价相连)的分子。所述亚单元分子可以是同一化学类型的分子,或可以是不同化学类型的分子。第一类融合分子的示例包括但不限于融合蛋白(例如,ZFP DNA结合域与切割结构域之间或TAL-效应子DNA结合域与切割结构域之间的融合体)和融合核酸(例如,编码前述融合蛋白的核酸)。第二类融合分子的示例包括但不限于:形成三链体的核酸与多肽之间的融合体,以及小沟结合子与核酸之间的融合体。
细胞内融合蛋白的表达可由融合蛋白递送入细胞造成或通过向细胞递送编码融合蛋白的多核苷酸而引起,其中所述多核苷酸被转录,转录物经翻译产生所述融合蛋白。细胞内蛋白的表达中也可包括反式剪接、多肽切割和多肽连接。向细胞递送多核苷酸和多肽的方法在本公开中另有描述。
就本公开的目的而言,"基因"包括编码基因产物(见前文)的DNA区域,以及调节基因产物生成的DNA区域,这类调节序列是否毗邻编码和/或转录序列在所不论。因此,基因包括但未必限于:启动子序列,终止子,翻译调节序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、隔离子、边界元件、复制起点、基质附着位点和基因座控制区。
"基因表达"指基因所含信息转化成基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA、shRNA、RNAi、miRNA或任何其它类型的RNA)或由mRNA翻译产生的蛋白。基因产物还包括经过修饰的RNA和经过修饰的蛋白,RNA修饰过程如加帽、聚腺苷酸化、甲基化和编辑,蛋白修饰过程如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化。
基因表达的"调节"指基因活性的改变。表达的调节可包括但不限于基因激活和基因阻遏。基因组编辑(例如,切割、改变、失活、供体整合、随机突变)可用来调节表达。基因失活指与不包括本文所述调节子的细胞相比,基因表达的任何减少。因此,基因失活可以是部分或完全的。
"感兴趣区域"是需要结合外源分子的细胞染色质的任意区域,例如,基因或者基因内或与之毗邻的非编码序列。结合可以是用于靶向DNA切割和/或靶向重组的目的。例如,感兴趣区域可存在于染色体、附加体、细胞器(例如,线粒体、叶绿体)基因组或感染性病毒基因组。感兴趣区域可以在基因的编码区内,在转录的非编码区如前导序列、尾随序列或内含子内,或在编码区上游或下游的非转录区内。感兴趣区域可以小到单个核苷酸对或大到长2,000个核苷酸对,或任意整数值的核苷酸对。
"真核"细胞包括但不限于:真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞)。
"植物"细胞包括但不限于单子叶的(单子叶植物)或双子叶的(双子叶植物)植物。单子叶植物的非限制性示例包括谷类植物如玉米、大米、大麦、燕麦、小麦、高粱、黑麦、甘蔗、菠萝、洋葱、香蕉和椰子。双子叶植物的非限制性示例包括烟草、番茄、向日葵、棉花、制糖甜菜、马铃薯、莴苣、瓜、大豆、油菜(菜籽)和苜蓿。植物细胞可以来自植物的任意部位和/或来自植物发育的任意阶段。
涉及两个或多个组件(例如序列元件)的并置,所述组件设置成组件都可正常发挥作用并允许组件中至少一种能介导施加于至少一种其它组件上的作用时,术语"操作性连接"和"操作性相连"互换使用。例如,若转录调节序列控制编码序列响应一种或多种转录调节因子存在或缺失时的转录水平,则所述转录调节序列如启动子与所述编码序列操作性连接。转录调节序列通常与编码序列顺式操作性连接,但不需要与其直接毗邻。例如,尽管并非毗连,但增强子仍是与编码序列操作性连接的转录调节序列。
对于融合多肽,术语"操作性连接"可指各组件在与其它组件的连接中所发挥的功能与其在未连接时的功能相同。例如,对于ZFP DNA结合域与切割结构域融合的融合多肽,若在融合多肽中ZFP DNA结合域部分能结合其靶位点和/或其结合位点,而切割结构域能切割靶位点附近的DNA,则ZFP DNA结合域与切割结构域操作性连接。
蛋白、多肽或核酸的"功能性片段"是序列与全长蛋白、多肽或核酸不相同但保留全长蛋白、多肽或核酸的相同功能的蛋白、多肽或核酸。功能片段可具有比相应的天然分子更多、更少或相同数量的残基,和/或可含有1个或多个氨基酸或核苷酸取代。本领域熟知测定核酸功能(例如,编码功能、与另一核酸杂交的能力)的方法。类似地,也熟知测定蛋白质功能的方法。例如,可测定多肽的DNA结合功能,例如通过滤膜结合、电泳迁移率改变或免疫沉淀试验。DNA切割可通过凝胶电泳分析。参见Ausubel等,同上。可测定蛋白与另一蛋白相互作用的能力,例如,通过共免疫沉淀、双杂交试验或互补分析,既可以是遗传的也可以是生化的。参见例如,Fields等,(1989)Nature 340:245-246;美国专利号5,585,245和PCT WO 98/44350。
"载体"能将基因序列转移至靶细胞。通常,"载体构建物"、"表达载体"和"基因转移载体"指能指导感兴趣基因表达并能将基因序列转移至靶细胞的核酸构建物。因此,该术语包括克隆和表达运载体以及整合载体。
"报道基因"或"报道序列"指产生蛋白产物的任何序列,该产物易于测得,优选常规试验中易测。本领域技术人员已知具体物种的合适报道基因,包括但不限于Mel1、氯霉素乙酰基转移酶(CAT)、发光蛋白如GFP、荧光素酶和/β-半乳糖苷酶。用于动物的合适报道基因还可编码能体内测定的标记物或酶如在体内用PET扫描测定的胸苷激酶,或通过整体发光成像进行体内测定的荧光素酶。选择性标记也可用作报道子的替代或补充。正选择标记是编码的产物使只有携带并表达所述基因的细胞才能在某些条件下存活和/或生长的那些多核苷酸。例如,表达新霉素抗性(Neor)基因的细胞对化合物G418有抗性,而不表达Neor的细胞被G418杀死。同样,植物细胞表达的除草剂耐受(抗性)基因(如,PAT(草胺膦乙酰转移酶)基因)赋予对于除草剂草胺膦的抗性。本领域技术人员已知正选择标记的其它示例,包括潮霉素抗性等。负选择标记是编码的产物使只有携带并表达所述基因的细胞才会在某些条件下被杀死的那些多核苷酸。例如,表达胸苷激酶(例如,单纯疱疹病毒胸苷激酶,HSV-TK)的细胞在加有更息洛韦(gancyclovir)时被杀死。本领域的技术人员已知其它负选择标记。不要求选择性标记是转基因,而且,报道子和选择性标记可以多种组合使用。
概要
本文所述是产生纯合修饰的,在所需基因座两条等位基因处包含敲除(KO)而不含外源序列如选择性标记的生物体和含转基因而不含编码报道子(例如,选择性标记)序列的生物体。所述生物体通常以两步产生。在第一步中,将一种或多种核酸酶(例如,ZFN)用于将异源、供体衍生的感兴趣序列靶向整合(TI)入细胞内所需基因座中。所述异源序列通常含有报道子(例如,选择性或筛选标记),使得能选择在感兴趣基因座的一条等位基因处含有报道子-TI的克隆。对于转基因的TI,将需要的转基因供体(缺乏报道子序列)与报道子供体共同引入。然后将报道子-TI选定的克隆在无报道子-TI等位基因处进行基因分型以鉴定无报道子-TI等位基因被NHEJ破坏的细胞,或鉴定在无报道子-TI等位基因处插入有无报道子标记转基因的细胞。
在第二步中,使如上所鉴定的报道子-TI/修饰克隆(例如,报道子-TI/NHEJ或报道子-TI/非报道子TI克隆)发育至繁殖上成熟,然后将这些报道子-TI/修饰杂合生物体彼此杂交或自体杂交。预期这些杂交的报道子-TI/修饰生物体子代中四分之一就所述修饰事件而言为纯合(NHEJ/NHEJ或非报道子TI/非报道子TI),从而提供不含任何插入报道子DNA的纯合修饰生物体。
核酸酶
本文所述的方法和组合物可广泛应用,并可包括任何感兴趣的核酸酶。核酸酶的非限制性示例包括大范围核酸酶、锌指核酸酶和TALEN。核酸酶可包含异源的DNA结合与切割结构域(例如,锌指核酸酶;具有异源切割结构域的大范围核酸酶DNA结合域或TALEN),或者替代地,可改变天然存在核酸酶的DNA结合域以结合选定的靶位点(例如,大范围核酸酶经工程改造以结合不同于关联结合位点)。
在某些实施方式中,核酸酶是大范围核酸酶(寻靶核酸内切酶)。天然存在的大范围核酸酶识别15-40碱基对的切割位点,通常分为四组:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族与HNH家族。示例性寻靶核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。已知它们的识别位点。还可参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)Nucleic AcidsRes.25:3379-3388;Dujon等(1989)Gene 82:115-118;Perler等(1994)NucleicAcids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble等(1996)J.Mol.Biol.263:163-180;Argast等(1998)J.Mol.Biol.280:345-353和NEB公司(New England Biolabs)产品目录。
来自天然存在的大范围核酸酶的DNA结合域,主要是来自LAGLIDADG家族的DNA结合结构域,已在植物、酵母、果蝇、哺乳动物细胞和小鼠中用于促进位点特异性基因组修饰,但该方法局限于修饰保留大范围核酸酶识别序列的同源基因(Monet等(1999),Biochem.Biophysics.Res.Common.255:88-93)或修饰预先经工程改造引入识别序列的基因组(Route等(1994),Mol.Cell.Biol.14:8096-106;Chilton等(2003),Plant Physiology.133:956-65;Puchta等(1996),Proc.Natl.Acad.Sci.USA 93:5055-60;Rong等(2002),Genes Dev.16:1568-81;Gouble等(2006),J.Gene Med.8(5):616-622)。因此,已尝试工程改造大范围核酸酶使其在医学或生物技术相关位点呈现新型结合特异性(Porteus等(2005),Nat.Biotechnol.23:967-73;Sussman等(2004),J.Mol.Biol.342:31-41;Epinat等(2003),Nucleic Acids Res.31:2952-62;Chevalier等(2002)Molec.Cell 10:895-905;Epinat等(2003)Nucleic Acids Res.31:2952-2962;Chames等(2005)Nucleic Acids Res33(20):e178;Arnould等(2006)J.Mol.Biol.355:443-458;Ashworth等(2006)Nature 441:656-659;Paques等(2007)Current Gene Therapy 7:49-66;美国专利公开号20070117128、20060206949、20060153826、20060078552和20040002092)。此外,天然存在或工程改造的来自大范围核酸酶的DNA结合域也已和来自异源核酸酶(如,FokI)的切割结构域操作性连接。
已知黄单胞菌属(Xanthomonas)的植物病原菌在重要作物中导致很多疾病。黄单胞菌属的病原性取决于保守的III型分泌(T3S)系统,该系统向植物细胞内注入超过25种不同的效应子蛋白。这些注入的蛋白质中,有模拟植物转录激活物并操纵植物转录组的转录活化样(TAL)效应子(参见Kay等(2007)Science318:648-651)。这些蛋白含有DNA结合域和转录活化结构域。最为充分鉴定的TAL效应子之一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonascampestris pv.vesicatoria)的AvrBs3(参见Bonas等(1989)Mol Gen Genet 218:127-136和WO2010079430)。TAL效应子含有串联重复的集中化结构域,各重复含有约34个氨基酸,它们是这些蛋白的DNA结合特异性的关键。此外,它们含有核定位序列和酸性转录活化结构域(综述参见Schornack S等(2006)JPlant Physiol 163(3):256-272)。此外,在致植物病细菌烟草青枯菌(Ralstoniasolanacearum)中,已发现烟草青枯菌生物变型(biovar)1菌株GMI1000和生物变型4菌株RS1000中称为brg11和hpx17的两个基因与黄单胞菌属(Xanthomonas)的AvrBs3家族同源(参见Heuer等(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此98.9%相同,但区别为hpx17重复结构域中的1,575bp缺失。但是,两种基因产物与黄单胞菌属的AvrBs3家族蛋白的序列相同性都低于40%。
这些TAL效应子的特异性取决于串联重复中发现的序列。重复序列包含约102bp,且重复区彼此间通常91-100%同源(Bonas,同上)。重复区的多态性通常位于12和13位,且看来在12和13位的高可变双残基的种类和TAL效应子靶序列中连续核苷酸的种类之间存在一一对应(参见Moscou和Bogdanove,(2009)Science 326:1501以及Boch等(2009)Science 326:1509-1512)。实验上已确定用于这些TAL效应子的DNA识别编码,12与13位的HD序列导致结合于胞嘧啶(C),NG结合T、NI结合A、C、G或T,NN结合A或G,而IG结合T。这些DNA结合重复区已装配在具有新重复区组合与数量的蛋白质中,产生能在植物细胞中与新序列相互作用并激活报道基因的表达的人工转录因子(Boch等,同上)。但是,这些DNA结合结构域未显示在所有细胞类型的靶向基因组编辑或靶向基因调节中具有普遍适用性。具体而言,Boch等显示仅在植物细胞中(即,在这些结构域经过进化以发挥作用的生物环境中)发挥作用而在内源基因座处未显示活性。此外,在哺乳动物细胞中未显示工程改造的TAL效应子与自然下未见于天然黄单胞菌属TAL效应子蛋白的任何外源功能性蛋白效应子结构域(核酸酶、转录因子、调节、酶促、重组酶、甲基化酶和/或报道子结构域)联合发挥作用。Christian等的近期出版物((2010)<Genetics epub10.1534/genetics.110.120717)中,将工程改造的TAL蛋白与FokI切割半结构域连接以产生TAL效应子结构域核酸酶融合体(TAL effector domain nucleasefusion,TALEN)且显示在酵母报道子试验中有活性,就该试验而言要求切割基于质粒的靶。
在其它实施方式中,所述核酸酶是锌指核酸酶(ZFN)。ZFN包含经工程改造以结合所选基因靶位点的锌指蛋白和切割结构域或切割半结构域。
锌指结合域可经工程改造以结合所选序列。参见例如,Beerli等,(2002)Nature Biotechnol.20:135-141;Pabo等,(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)Nature Biotechnol.19:656-660;Segal等,(2001)Curr.Opin.Biotechnol.12:632-637;Choo等,(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的锌指蛋白相比,经工程改造的锌指结合域可具有新的结合特异性。工程改造方法包括但不限于合理设计与多种选择。例如,合理设计包括利用包含三联体(或四联体)核苷酸序列和单独的锌指氨基酸序列的数据库,其中各三联体或四联体核苷酸序列与结合该特定三联体或四联体序列的锌指的一种或多种氨基酸序列相关联。参见例如,共有的美国专利6,453,242与6,534,261,其全文通过引用纳入本文。
示范性选择方法包括噬菌体展示和双杂交系统,公开于美国专利5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568;以及WO 98/37186、WO 98/53057、WO 00/27878、WO 01/88197和GB 2,338,237。此外,例如在共有的WO 02/077227中,已描述对锌指结合域的结合特异性的增强。
本领域技术人员已知靶位点的选择,ZFN以及融合蛋白(和编码融合蛋白的多核苷酸)的设计与构建方法,并在美国专利申请公开号20050064474和20060188987中有详述,这些专利申请通过引用全文纳入本文。
此外,如这些以及其它参考文献中所公开的,锌指结构域和/或多指的锌指蛋白可利用任何合适的接头序列连接在一起,包括例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列参见例如,美国专利号6,479,626、6,903,185和7,153,949。本文所述蛋白可包括该蛋白的单独锌指之间合适接头的任意组合。
核酸酶如ZFN、TALEN和/或大范围核酸酶也包括核酸酶(切割结构域、结构半结构域)。如上所述,切割结构域可以与DNA结合域是异源的,例如锌指DNA结合域和切割结构域来自某一核酸酶或大范围核酸酶DNA结合域或TAL效应子结构域且切割结构域来自另一核酸酶。异源切割结构域可获自任何核酸内切酶或核酸外切酶。可衍生出切割结构域的示范性核酸内切酶,包括但不限于限制性核酸内切酶和寻靶核酸内切酶。参见例如,马萨诸塞州贝弗利(Beverly,MA)的NEB公司的2002-2003产品目录;和Belfort等(1997)Nucleic Acids Res.25:3379-338。已知切割DNA的其它酶(例如,S1核酸酶、绿豆核酸酶、胰DNA酶I、微球菌核酸酶、酵母HO核酸内切酶;还参见Linn等编,Nucleases(《核酸酶》),冷泉港实验室出版社,1993)。可将一种或多种这些酶(或其功能性片段)用作切割结构域和切割半结构域的来源。
类似地,切割活性需要二聚化的切割半结构域可衍生自任何核酸酶或其部分,正如前文所述。通常,若融合蛋白包含切割半结构域,则切割需要两个融合蛋白。或者,可使用包含两个切割半结构域的单个蛋白。这两个切割半结构域可衍生自同一核酸内切酶(或其功能性片段),或各切割半结构域可衍生自不同的核酸内切酶(或其功能性片段)。此外,优选两种融合蛋白的靶位点相对彼此排列,从而这两种融合蛋白与其各自靶位点的结合将切割半结构域放置为能使切割半结构域形成功能性切割结构域(例如,通过二聚化)的彼此空间定位。因此,在某些实施方式中,这些靶位点的邻近边缘间隔有5-8个核苷酸或15-18个核苷酸。但是,两个靶位点间可间插有任意整数数量的核苷酸或核苷酸对(例如,2-50个核苷酸对或更多)。通常,切割位点位于靶位点之间。
限制性核酸内切酶(限制性酶)存在于许多物种,能序列特异性结合DNA(在识别位点处),并在结合位点处或其附近切割DNA。某些限制性酶(例如,IIS型)在从识别位点移除的位点处切割DNA并具有可分开的结合与切割结构域。例如,IIS型酶Fok I催化DNA的双链切割,切割在一条链上距其识别位点9个核苷酸,而在另一条链上距其识别位点13个核苷酸。参见例如,美国专利5,356,802、5,436,150和5,487,994;和Li等(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一种实施方式中,融合蛋白包含来自至少一种IIS型限制性酶的切割结构域(或切割半结构域)和一种或多种经或未经工程改造的锌指结合域。
Fok I是示例性IIS型限制性酶,其切割结构域可与结合域分离。该特定的酶为二聚体时有活性。Bitinaite等,(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,就本公开的目的而言,认为本公开融合蛋白所用Fok I酶的部分是切割半结构域。因此,对于利用锌指-Fok I融合体的靶向双链切割和/或靶向细胞序列置换,可使用各自含有某FokI切割半结构域的两种融合蛋白重建催化活性的切割结构域。或者,也可使用含有锌指结合域和两个Fok I切割半结构域的单一多肽分子。用锌指-Fok I融合体进行靶向切割和靶向序列改变的参数在本公开中另行提供。
切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如,二聚化)能力以形成功能性切割结构域的蛋白质任意部分。
通过引用全文纳入本文的国际公开WO 07/014275中描述了示例性IIS型限制性酶。其它限制性酶也含有可分离的结合与切割结构域,本公开也考虑到这些酶。例如,Roberts等,(2003)Nucleic Acids Res.31:418-420。
在某些实施方式中,切割结构域包含一种或多种经工程改造的切割半结构域(也称作二聚化结构域突变体),其同二聚作用降至最小或被防止,例如,如美国专利公开号20050064474和20060188987以及美国申请号11/805,850(2007年5月23日提交)中所述,所有公开通过引用全文纳入本文。在Fok I的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538位的氨基酸残基都是影响Fok I切割半结构域二聚化的靶标。
能形成专性异二聚体的示例性工程改造Fok I切割半结构域包括以下一对:第一切割半结构域包括Fok Id 490和538位氨基酸残基处的突变,和第二结构域包括486和499氨基酸残基处的突变。
因此,在一种实施方式中,490位的突变将Glu(E)替换为Lys(K);538位的突变将Iso(I)替换为Lys(K);486位的突变将Gln(Q)替换为Glu(E);而499位的突变将Iso(I)替换为Lys(K)。具体地,制备本文所述经工程改造的切割半结构域是通过在一个切割半结构域的490(E→K)和538(I→K)位突变来产生名为“E490K:I538K”的经工程改造切割半结构域,并通过另一切割半结构域的486(Q→E)和499(I→L)位突变来产生名为“Q486E:I499L”的经工程改造切割半结构域。本文所述的经工程改造切割半结构域是专性异二聚体突变体,其异常切割降至最低或被消除。参见例如美国专利公开号2008/0131962,其公开全文通过引用纳入本文用于所有目的。
本文所述的经工程改造切割半结构域是专性异二聚体突变体,其异常切割降至最低或被消除。参见例如,WO 07/139898的实施例1。在某些实施方式中,经工程改造的切割半结构域包括在486、499和496位(根据野生型FokI编号)的突变,例如突变将野生型486位的Gln(Q)残基替换为Glu(E)残基,野生型499位的Iso(I)残基替换为Leu(L)残基,以及野生型496位的Asn(N)残基替换为Asp(D)或Glu(E)残基(还分别称作“ELD”和“ELE”结构域)。在其它实施方式中,经工程改造的切割半结构域包括在490、538和537位(根据野生型FokI编号)的突变,例如突变将野生型490位的Glu(E)残基替换为Lys(K)残基,野生型538位的Iso(I)残基替换为Lys(K)残基,以及野生型537位的His(H)残基替换为Lys(K)或Arg(R)残基(还分别称作“KKK”和“KKR”结构域)。在其它实施方式中,经工程改造的切割半结构域包括在490和537位(根据野生型FokI编号)的突变,例如突变将野生型490位的Glu(E)残基替换为Lys(K)残基,野生型537位的His(H)残基替换为Lys(K)或Arg(R)残基(还分别称作“KIK”和“KIR”结构域)。(参见2010年2月8日提交的美国临时申请61/337,769)。
本文所述的经工程改造的切割半结构域可用任何适当方法制备,例如,如美国专利公开号20050064474和20080131962所述通过定点诱变野生型切割半结构域(Fok I)制备。
或者,核酸酶可利用称为“分裂-酶(split-enzyme)”的技术(参见例如,美国专利公开号20090068164)在核酸靶位点处体内组装。这类分裂酶的组件可在另外的表达构建物上表达,或者可以连接于单独的组件相互分开的某一开放读框中,例如,组件由自切割2A肽或IRES序列分开。组件可以是单独的锌指结合域或大范围核酸酶核酸结合域的结构域。
可在临用前根据活性筛选核酸酶(例如,ZFN),例如在基于酵母的染色体系统中,如WO 2009/042163和20090068164中所述。
表达载体
可将编码一种或多种核酸酶的核酸克隆入用于转化至原核或真核细胞的载体内。载体可以是原核载体,例如质粒,或穿梭质粒,昆虫载体,或真核载体,包括本文所述的植物载体。
不难利用本领域已知方法构建核酸酶表达构建物。参见例如,美国专利公开20030232410、20050208489、20050026157、20050064474、20060188987、20060063231、20080182332、2009011188和国际公开WO 07/014275。核酸酶的表达可以在组成型启动子或诱导型启动子的控制下,例如,半乳糖激酶启动子在棉子糖和/或半乳糖的存在下被活化(解除抑制)而在葡萄糖存在下被抑制。植物启动子的非限制性示例包括衍生自拟南芥(A.thaliana)泛素-3(ubi-3)(Callis等,1990,J.Biol.Chem.265-12486-12493);根癌农杆菌(A.tumifaciens)甘露碱合酶(Δmas)(Petolino等,美国专利号6,730,824);和/或木薯叶脉花叶病毒(CsVMV)(Verdaguer等,(1996)Plant Molecular Biology 31:1129-1139)的启动子序列。本领域熟知其它合适的细菌与真核启动子并已有描述,例如,Sambrook等,
Molecular Cloning,A Laboratory Manual(《分子克隆:实验室手册》)(第2版,1989;第3版,2001);Kriegler,Gene Transfer and Expression:A LaboratoryManual(《基因转移与表达:实验室手册》)(1990);以及Current Protocols inMolecular Biology(《新编分子生物学实验指南》)(Ausubel等,同上)。表达ZFP的细菌表达系统可获自大肠杆菌(E.coli)、芽孢杆菌属(Bacillus sp.)和沙门氏菌(Salmonella)(Palva等(1983)Gene 22:229-235)。
除启动子以外,表达载体一般还包含转录单元或表达盒,它们含有在原核或真核宿主细胞中表达所述核酸所必须的所有其它元件。因此,典型的表达盒含有操作性连接有例如编码核酸酶的核酸序列的启动子和例如转录物有效聚腺苷酸化、转录终止、核糖体结合位点或翻译终止等所需的信号。表达盒的其它元件可包括例如增强子、异源剪接信号和/或核定位信号(NLS)。
这类表达系统的试剂盒市售可得。哺乳动物细胞、酵母、植物和昆虫细胞的真核表达系统是本领域技术人员熟知的,并且市售可得。
可采用将外来核苷酸序列引入此类宿主细胞的任何熟知方法。这些方法包括使用磷酸钙转染、聚凝胺、原生质体融合、电穿孔、超声方法(如声致穿孔)、脂质体、显微注射、裸露DNA、质粒载体、病毒载体,附加型和整合型均可,和将克隆的基因组DNA、cDNA、合成DNA或其它外来遗传物质引入宿主细胞的任何其它熟知方法(参见如,Sambrook等,同上)。唯一必要的是,所用的具体遗传工程方法能将至少一种基因成功引入能表达所选蛋白的宿主细胞中。
DNA构建物可用多种常规技术引入需要的植物宿主(例如,引入其基因组)。这类技术的综述可参见,例如Weissbach和Weissbach,Methods for PlantMolecular Biology(《植物分子生物学方法》)(1988,学术出版社(Academic Press),纽约),VIII部分,第421-463页;以及Grierson和Corey,Plant Molecular Biology(《植物分子生物学》)(1988,第2版),布来基公司(Blackie),伦敦,第7-9章。
例如,可将DNA构建物利用如植物细胞原生质体的电穿孔和微注射等技术直接引入植物细胞的基因组DNA,或者可将DNA构建物利用生物射弹方法如DNA粒子轰击直接引入植物组织(参见例如,Klein等(1987)Nature327:70-73)。或者,DNA构建物可与合适的T-DNA侧接区域组合并引入常规的根癌农杆菌(Agrobacterium tumefaciens)宿主载体。科技文献中已详述了根癌农杆菌介导的转化技术,包括二元载体的卸装和使用。参见例如Horsch等(1984)Science 233:496-498和Fraley等(1983)Proc.Nat'l.Acad.Sci.USA 80:4803。
此外,基因转移可利用非农杆菌的细菌或病毒如根瘤菌属(Rhizobium sp.)NGR234,苜蓿中华根瘤菌(Sinorhizoboium meliloti)、百脉根根瘤菌(Mesorhizobium loti)、马铃薯病毒X、椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒完成,参见例如Chung等(2006)Trends Plant Sci.11(1):1-4。
当利用二元T DNA载体(Bevan(1984)Nuc.Acid Res.12:8711-8721)或共培养方法(Horsch等(1985)Science 227:1229-1231)使细胞被细菌感染时,根癌农杆菌宿主的毒力作用将引导构建物和相邻标记物插入植物细胞DNA中。通常,农杆菌转化系统用于工程改造双子叶植物(Bevan等(1982)Ann.Rev.Genet16:357-384;Rogers等(1986)Methods Enzymol.118:627-641)。农杆菌转化系统也可用于转化以及转移DNA至单子叶植物和植物细胞。参见美国专利号5,591,616;Hernalsteen等(1984)EMBO J 3:3039-3041;Hooykass-Van Slogteren等(1984)Nature 311:763-764;Grimsley等(1987)Nature 325:1677-179;Boulton等(1989)Plant Mol.Biol.12:31-40;和Gould等(1991)Plant Physiol.95:426-434。
替代的基因转移和转化方法包括但不限于:通过钙、聚乙二醇(PEG)或电穿孔介导的裸露DNA摄取进行原生质体转化(参见Paszkowski等(1984)EMBOJ 3:2717-2722;Potrykus等(1985)Molec.Gen.Genet.199:169-177;Fromm等(1985)Proc.Nat.Acad.Sci.USA 82:5824-5828;和Shimamoto(1989)Nature338:274-276)和植物组织的电穿孔(D'Halluin等(1992)Plant Cell 4:1495-1505)。植物细胞转化的其它方法包括微注射、碳化硅介导的DNA摄取(Kaeppler等(1990)Plant Cell Reporter 9:415-418)和微粒轰击(参见Klein等(1988)Proc.Nat.Acad.Sci.USA 85:4305-4309;和Gordon-Kamm等(1990)Plant Cell 2:603-618)。
有效量的给予通过常规用于引入核酸酶至最终接触待处理细胞的任何途径完成。核酸酶以任何适当方式给予,优选与药学上可接受的载体一同给予。合适的给予方法如调节剂可得且为本领域技术人员熟知,并且,尽管可利用超过一种途径给予特定组合物,某特定途径通常能提供比另一途径更直接和更有效的反应。
也可使用载体,并部分取决于需给予的特定组合物以及用来给予组合物的特定方法。因此,有多种合适的药物组合物制剂可用(参见例如,Remington’sPharmaceutical Sciences(《雷明顿药物科学》);第17版,1985)。
生物体
本发明可用于需要产生纯合修饰生物体的任何生物,包括但不限于真核生物如植物,动物(例如,哺乳动物如小鼠、大鼠、灵长类、家畜、兔等),鱼,等等。通常,利用来自生物的能如本文所述进行遗传修饰并能发育成繁殖上成熟生物体的分离细胞产生所述生物体。可使用真核(例如,酵母、植物、真菌、鱼和哺乳动物细胞如猫、犬、小鼠、牛和猪)细胞。也可使用来自含有本文所述的一种或多种纯合KO基因座或其它遗传修饰的生物体的细胞。
示例性哺乳动物细胞包括感兴趣生物的任何细胞或细胞系,例如卵母细胞、K562细胞、CHO(中国仓鼠卵巢)细胞、HEP-G2细胞、BaF-3细胞、Schneider细胞、COS细胞(表达SV40T抗原的猴肾细胞)、CV-1细胞、HuTu80细胞、NTERA2细胞、NB4细胞、HL-60细胞和HeLa细胞、293细胞(参见例如,Graham等,(1977)J.Gen.Virol.36:59)和骨髓瘤细胞如SP2或NS0(参见例如,Galfre和Milstein(1981)Meth.Enzymol.73(B):346)。外周血单核细胞(PBMC)或T细胞也可使用,胚胎或成体干细胞同样可用。例如,可用的干细胞包括胚胎干细胞(ES),诱导的多能干细胞(iPSC),间质干细胞、造血干细胞、肌肉干细胞、皮肤干细胞和神经元干细胞。
示例性靶植物和植物细胞包括但不限于那些单子叶和双子叶植物,例如作物包括谷类作物(例如,小麦、玉米、大米、小米、大麦),水果作物(例如,番茄、苹果、梨、草莓、橙),饲料作物(例如,苜蓿),根菜作物(例如,胡萝卜、马铃薯、甜菜、甘薯),叶菜作物(例如,莴苣、菠菜);开花植物(例如,矮牵牛花、玫瑰、菊),针叶树和松树(例如,松杉、云杉);用于植物修复的植物(例如,重金属积累植物);油料作物(例如,向日葵、油菜籽)和用于实验目的的植物(例如,拟南芥)。因此,本文公开的方法和组合物可用于各种植物,包括但不限于来自以下属的种:天门冬属(Asparagus)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、飞蓬属(Erigeron)、大豆属(Glycine)、棉(Gossypium)、大麦属
(Hordeum)、莴苣(Lactuca)、黑麦(Lolium)、番茄(Lycopersicon)、苹果(Malus)、木薯(Manihot)、烟草(Nicotiana)、诸葛菜属(Orychophragmus)、稻属(Oryza)、鳄梨(Persea)、菜豆属(Phaseolus)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、黑麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、小麦属(Triticum)、葡萄属(Vitis)、豇豆属(Vigna)和玉蜀黍属(Zea)。术语植物细胞包括分离的植物细胞以及全植株或全植株的部分如种子、胼胝体、叶、根等。本公开还涵盖上文所述植物的种子,其中所述种子具有所述转基因或基因构建物。本公开还涵盖上文所述转基因植物的子代、克隆、细胞系或细胞,其中所述子代、克隆、细胞系或细胞具有所述转基因或基因构建物。
靶向整合
产生本文所述纯合修饰生物体的第一步涉及核酸酶介导的供体(外源)报道子序列靶向整合在所需靶基因座处。具体地,所公开核酸酶可用来在细胞染色质的感兴趣区域(例如,在基因组内需要的或预定的位点处)切割DNA)。对于这种靶向DNA切割,核酸酶的DNA结合域(例如,锌指结合域)经工程改造成在预定切割位点或其附近结合靶位点,且含有该DNA结合域和切割结构域的融合蛋白在细胞中表达。融合蛋白的DNA结合域(例如,锌指部分)结合靶位点后,DNA在邻近靶位点处被切割结构域切割。
或者,各含有锌指结合域和切割半结构域的两种融合蛋白在细胞中表达,并结合于靶位点,所述靶位点以能重建功能性切割结构域且DNA在所述靶位点附近被切割的方式并置。在一种实施方式中,切割发生在两个锌指结合域的靶位点之间。所述锌指结合域之一或两者可以经过工程改造。
如本文所述的核酸酶靶向切割已显示导致切割位点处供体(外源)序列的靶向整合(通过同源定向修复)参见例如,美国专利公开号2007/0134796、2008/029580、2008/0182332、2009/0117617和2009/0111188。
因此,除本文所述核酸酶以外,选定基因组序列的靶向置换(整合)还需要引入置换(或供体)报道子序列。可以在融合蛋白表达之前、同时或之后将供体报道子序列引入细胞。供体报道子多核苷酸通常与基因组序列有充分的同源性以支持其和与之有同源性的基因组序列之间的同源重组(或同源定向修复)。显然,供体序列通常不同于其所替换的基因组序列。例如,相对基因组序列,供体多核苷酸的序列可含有一个或多个单碱基改变、插入、缺失、倒位或重排,前提是存在与染色体序列的充分同源性。
在某些实施方式中,还可实现所需转基因的引入。所需的转基因供体序列也应与基因组序列具有充分的同源性以支持其和与之有同源性的基因组序列之间的同源重组或同源定向修复。参见例如,美国申请号12/386,059。感兴趣的供体转基因通常含有编码感兴趣序列的序列。非限制性的示例包括基因调节序列(例如,启动子序列)、编码蛋白产物的序列(例如,参与生物表型修饰的蛋白或治疗用蛋白)或编码RNA产物如shRNA、RNAi等的序列。
供体报道子序列通常包括编码报道基因的序列,报道基因用于鉴定发生靶向整合的细胞。可用任何报道基因。在某些实施方式中,报道基因直接提供直接可检测信号,例如来自荧光蛋白如GFP(绿色荧光蛋白)的信号。荧光可用多种市售可得的荧光检测系统检测,包括例如,荧光活化细胞分选(FACS)系统。
报道基因也可以是催化生成可检测产物的酶(例如,蛋白酶、核酸酶、脂酶、磷酸酶、糖水解酶和酯酶)。编码酶的适当报道基因的非限制性示例包括,例如,MEL1,CAT(氯霉素乙酰基转移酶;Alton和Vapnek(1979)Nature 282:864869),荧光素酶,β-半乳糖苷酶,β-葡萄苷酸酶,β-乳胺酶,辣根过氧化物酶和碱性磷酸酶(例如,Toh等,(1980)Eur.J.Biochem.182:231238;和Hall等(1983)J.Mol.Appl.Gen.2:101)。
其它报道基因包括选择性标记(例如,正和/或负选择标记),包括但不限于抗生素抗性如氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性以及除草剂抗性如PAT基因。
供体多核苷酸(报道子和/或转基因)可以是DNA或RNA,单链或双链,且可以直链或环状形式引入细胞。若以直链形式引入,则供体序列的末端可用本领域技术人员已知方法加以保护(例如,免于核酸外切降解)。例如,在直链分子的3’末端添加一个或多个双脱氧核苷酸和/或在一端或两端连接自体互补寡核苷酸。参见例如,Chang等(1987)Proc.Natl.Acad.Sci.USA 84:4959-4963;Nehls等(1996)Science 272:886-889。保护外源多核苷酸免于降解的其它方法包括但不限于:添加末端氨基和使用经修饰的核苷酸间连接,例如,硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。多核苷酸可以作为载体分子的部分而引入细胞,载体分子还有其它序列如复制起点、启动子和编码抗生素或除草剂抗性的基因。此外,供体多核苷酸可以作为裸露核酸,与试剂如脂质体或泊洛沙姆(poloxamer)复合的核酸而引入,或者由病毒(例如,腺病毒,AAV,疱疹病毒,逆转录病毒,慢病毒)递送。
可用任何适当方式测试细胞的靶向整合,包括通过检验(测序或PCR)或选定基因座或通过选择和/或筛选经处理细胞中由供体DNA上存在的标记基因编码的特性。例如,可通过将经工程改造细胞在含有抑制量的抗生素或除草剂的基质上生长来进行选择,转化的基因构建物提供对该抗生素或除草剂的抗性。此外,转化的细胞还可通过对任何可见标记物基因(例如,荧光蛋白,β-葡糖苷酸酶,荧光素酶,B或C1基因)活性的筛选来鉴定,该标记基因可存在于重组核酸构建物上。本领域技术人员熟知这类选择和筛选方法。
也可用物理和生化方法鉴定含有供体序列插入靶基因座的细胞。这些方法包括但不限于:1)Southern分析或PCR扩增,用于检测和测定重组DNA插入物的结构;2)Northern印迹,S1RNA酶保护,引物延伸或逆转录酶-PCR扩增,用于检测和检验基因构建物的RNA转录物;3)酶促试验,用于检测酶或核酶活性,其中此类基因产物由基因构建物编码;4)蛋白质凝胶电泳分析,Western印迹技术,免疫沉淀或酶联免疫试验,其中基因构建物的产物是蛋白质。其它技术如原位杂交、酶染色和免疫染色也可用来检测重组构建物在特定植物器官和组织中的存在或表达。本领域技术人员熟知进行所有这些试验的方法。
用本文所述方法进行基因操作的效果可以通过例如分离自感兴趣组织的RNA(如mRNA)的northern印迹观察到。通常,若mRNA的量提高,则可认为相应的内源基因正以高于之前的速率表达。可采用测定基因和/或CYP74B活性的其它方法。可使用不同类型的酶促试验,取决于所用底物和检测反应产物或副产物增加或减少的方法。此外,(基因)和/或CYP74B蛋白表达的水平可进行免疫化学测定,即ELISA、RIA、EIA和本领域技术人员熟知的其它基于抗体的试验,例如电泳检测试验(用染色或western印迹)。
产生纯合修饰的生物体
然后,分析报道子供体序列插入靶基因座的细胞是否在非报道子-TI等位基因处存在修饰,例如NHEJ事件或插入缺乏报道子(选择性标记物)编码序列的转基因。这类报道子-TI/经修饰细胞可用技术人员已知的任何适当方法鉴定,包括测序、PCR分析等。
此后,将报道子-TI/经修饰突变体进行培养或另行处理使其产生在所需基因座具有报道子-TI/经修饰基因型的完整生物体。例如,可利用常规的原核注射或卵母细胞注射来产生报道子TI/经修饰动物。参见例如,美国专利申请号61/205,970显示ZFN修饰的大鼠卵母细胞的种系传递。
类似地,报道子-TI/经修饰植物细胞可培养至再生具有转化的基因型并因此具有所需表型的全植株。此类再生技术有赖于组织培养生长基质中某些植物激素的控制,通常有赖于和所需核苷酸序列一同引入的抗微生物剂和/或除草剂标记物。从培养的原生质体进行植物再生的内容描述于Evans等收录于Handbook of Plant Cell Culture(《植物细胞培养手册》)第124-176页的"Protoplasts Isolation and Culture(原生质体分离与培养)",麦克米兰出版公司(Macmillian Publishing Company),纽约,1983;和Binding,Regeneration of Plants,Plant Protoplasts(《植物的再生、植物原生质体》),第21-73页,CRC出版社,博卡拉顿,1985。也可从植物胼胝体、外植体、器官、花粉、胚胎或其部分获得再生。这些再生技术在Klee等(1987)Ann.Rev.of Plant Phys.38:467-486中有一般描述。本领域技术人员认识到,表达盒稳定整合入转基因植物中并证实为可操作后,可通过有性杂交将其引入其它植物。取决于待杂交物种,可使用任意数量的标准育种技术。另外,可在转基因生物的减数分裂后产生单倍体生物(例如,配子体)。有多种生物如藻类、真菌和一些植物能在其至少部分生活周期中以单倍体状态存活。
一旦报道子TI/经修饰杂合生物体达到繁殖成熟度,它们就可彼此杂交,或在一些情况中,可将孢子生长成单倍体。杂交所得子代中,约有25%应在靶基因座处为纯合经修饰/经修饰(NHEJ/NHEJ或非报道子TI/非报道子TI)。一半的单倍体后代将含有感兴趣的修饰。经修饰/经修饰生物体可利用上文所述的任何方法鉴定,包括但不限于测序、PCR分析等。这些生物体将具有所需的纯合基因修饰,但不包括任何插入的外源报道子序列(例如,标记物)。
试剂盒
还提供产生本文所述生物体的试剂盒。试剂盒通常含有编码一种或多种核酸酶的多核苷酸和/或本文所述的供体多核苷酸(例如,有选择性标记),以及对分析选定TI克隆在非报道子-TI等位基因处修饰的说明,和对于将报道子-TI/经修饰生物体彼此杂交以产生在打断的基因座处不含任何其中引入核酸酶和/或供体多核苷酸的供体DNA插入的纯合生物体的说明。试剂盒还可包含细胞、试剂、用于转化细胞的缓冲液、细胞培养基质和/或用于进行试验的缓冲液。通常,试剂盒还包含标签,其包括任意材料如说明书,与试剂盒的其它组件附连或另行伴装的包装单或宣传单。
应用
本文所述的纯合修饰生物体可用于目前所用含插入外源序列的KO生物体的任何应用中。此类生物体可用于生物与医学研究,生产医疗用药,实验药物和农业。
例如,已证实KO动物在分析基因产物的功能和产生人类疾病模型中很有用,从而允许进行药物发现。类似地,本文所述的KO植物可用于产生所需基因被破坏但不含可能损害天然作物的插入序列的作物。因此,从不含外源DNA的意义来讲,本文所述的KO植物可以是非转基因的GMO。或者,所述KO生物体可以在打断的基因座处不含插入序列但在另一基因座或多个基因座处包括转基因。
经常需要产生就某转基因而言纯合但缺乏外源报道子序列的植物或动物。因此,本文所述的方法和组合物提供了产生在两条等位基因中均已插入所需(非报道子)基因序列但所得植物子代不含有任何报道子序列的植物或动物。例如,可插入调节子序列以控制(抑制或活化)特定的感兴趣基因。类似地,可将转基因插入感兴趣基因座的所有等位基因中。当不需要靶基因的表达时,可插入所述转基因以敲除特定基因。
以下实施例涉及本公开中核酸酶包含锌指核酸酶(ZFN)的示例性实施方式。应当理解,这仅用于示范目的,可使用其它核酸酶,例如含工程改造的DNA结合域的寻靶核酸内切酶(大范围核酸酶)和/或天然存在或工程改造的寻靶核酸内切酶(大范围核酸酶)DNA结合结构域和异源切割结构域或TALEN的融合体。