CN110951779B

CN110951779B - 用于靶向修饰基因组的方法和组合物

Info

Publication number: CN110951779B
Application number: CN201911060314.XA
Authority: CN
Inventors: D·弗伦德维; W·奥尔巴克; K·V·莱; 久野淳子; D·M·瓦伦泽拉; G·D·扬科普洛斯
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2013-12-11
Filing date: 2014-10-15
Publication date: 2024-04-16
Anticipated expiration: 2034-10-15
Also published as: JP6517755B2; US10711280B2; NZ721985A; US20240052365A1; MX2016007654A; JP6174811B2; AU2017210669B2; KR101773782B1; RU2016126989A; IL245674B; SG10201700961TA; JP2019110925A; CN105980568B; BR112016013400A2; US20170067078A1; IL245674A0; WO2015088643A1; AU2019202160B2; US9546384B2; BR112016013400B1

Abstract

本发明提供使用如本文所述的包含各种内源或外源核酸序列的大靶向载体(LTVEC)修饰在真核细胞、哺乳动物细胞、人类细胞或非人类哺乳动物细胞中的目标基因组基因座的组合物和方法。另外的方法组合使用所述LTVEC和CRISPR/Cas系统。本发明还提供用于产生在其种系中包含一种或多种靶向基因修饰的基因修饰的非人类动物的组合物和方法。

Description

用于靶向修饰基因组的方法和组合物

分案申请说明

本申请是申请日为2014年10月15日、申请号为201480074803.X、发明名称为“用于靶向修饰基因组的方法和组合物”的发明专利申请的分案申请。

相关申请的交叉引用

本申请要求2013年12月11日提交的美国临时专利申请号61/914,768、2014年6月26日提交的美国临时专利申请号62/017,416、2014年7月25提交的美国临时专利申请号62/029,261、2014年9月19日提交的美国临时专利申请号62/052,906、2014年10月3日提交的美国临时专利申请号62/059,527和2014年10月15日提交的美国临时专利申请号62/064,384的权益，其各自的全部内容都出于所有目的以引用的方式并入本文中。

参考经由EFS WEB作为文本文件提交的序列表

序列表的正式文本经由EFS-Web作为具有名为453460SEQLIST.TXT在2014年10月15日产生且具有27.5千字节的大小的文件的ASCII格式的序列表电子提交，且与本说明书同时提交。在该ASCII格式文件中包含的序列表为本说明书的一部分且其全部内容以引用的方式并入本文中。

背景技术

虽然已经将大鼠视为可概括各种人类疾病的病变的重要动物模型系统，所述人类疾病包括但不限于心血管疾病(例如，高血压)、新陈代谢疾病(例如，肥胖、糖尿病)、神经病学疾病(例如，疼痛病变)和多种癌症，但是与小鼠相比较，大鼠在模仿人类疾病中的用途受限，这部分地归因于无法利用种系可传递的多潜能大鼠细胞，其可在例如一种或多种串行电穿孔的一系列体外基因修饰之后持续其多潜能性；且部分地归因于缺乏允许在多潜能大鼠细胞中引入或缺失大基因组DNA序列或用外源核酸序列替换大内源基因组DNA序列的有效靶向技术。

在本领域中需要允许在生物体的基因组中精确靶向改变的组合物和方法，其可开放或扩展靶发现的当前领域并更迅速且容易地证实治疗剂。

概述

提供经由靶向基因修饰来修饰在真核细胞中的目标基因组基因座的方法。这一方法包括：

(a)向所述真核细胞中引入：(i)包含侧接有5'同源臂和3'同源臂的第一核酸的大靶向载体(LTVEC)，其中所述LTVEC为至少10kb，(ii)包含操作性连接编码Cas蛋白的第二核酸的第一启动子的第一表达构建体，(iii)包含操作性连接编码包含杂化到靶序列的核苷酸序列的向导RNA(gRNA)和反式激活CRISPR RNA(tracrRNA)的第三核酸的第二启动子的第二表达构建体，其中所述第一启动子和所述第二启动子在所述真核细胞中具有活性；和(b)鉴定在目标基因组基因座处包括靶向基因修饰的修饰的真核细胞。

在一个实施方案中，所述靶向基因修饰为双等位基因基因修饰。

在一个实施方案中，所述LTVEC为至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb。在另一实施方案中，所述LTVEC为至少100kb、至少150kb或至少200kb。

在一个实施方案中，所述真核细胞为哺乳动物细胞。在一个实施方案中，所述哺乳动物细胞为成纤维细胞。

在一个实施方案中，所述真核细胞为多潜能细胞。在一个实施方案中，所述多潜能细胞为人类多潜能细胞。在一个实施方案中，所述人类多潜能细胞为人类胚胎干(ES)细胞或成人干细胞。在另一实施方案中，所述人类多潜能细胞为发育受限的人类祖细胞。在另一实施方案中，所述人类多潜能细胞为人类诱导的多潜能干(iPS)细胞。

在一个实施方案中，所述Cas蛋白为Cas9。

在一个实施方案中，所述靶序列由原间隔区邻近基序(PAM)序列侧接。在一个实施方案中，所述靶序列在3'端由原间隔区邻近基序(PAM)序列直接侧接。

在一些实施方案中，所述5'同源臂和所述3'同源臂的总和为约10kb-约150kb。在一些实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

所述方法进一步提供包括以下的靶向基因修饰：(a)用同源或直系同源的核酸序列替换内源核酸序列；(b)缺失内源核酸序列；(c)缺失内源核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)插入外源核酸序列；(e)插入外源核酸序列，所述外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(f)插入包含同源或直系同源的核酸序列的外源核酸序列；(g)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；(h)插入侧接有位点特异性重组酶靶序列的条件性等位基因；(i)插入操作性连接在多潜能细胞中具有活性的第三启动子的可选择的标记或报道基因；或(j)其组合。

在一个实施方案中，所述目标基因组基因座包含(i)与所述5'同源臂同源的5'靶序列；和(ii)与所述3'同源臂同源的3'靶序列。

在一些实施方案中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。在一些实施方案中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。

在一个实施方案中，所述目标基因组基因座包括干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座或所述Rag1基因座和所述Rag2基因座两者。

在一个实施方案中，所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

进一步提供一种用于修饰基因组的方法，其包括在包含至少10kb的核酸序列的大靶向载体(LTVEC)存在下将所述基因组暴露于Cas蛋白和CRISPR RNA，其中在暴露于所述Cas蛋白、所述CRISPR RNA和所述LTVEC之后，所述基因组被修饰以含有至少10kb的核酸序列。

在一些这样的方法中，所述LTVEC包含至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb的核酸序列。在一些这样的方法中，所述LTVEC包含至少100kb、至少150kb或至少200kb的核酸序列。

进一步提供一种用于修饰基因组的方法，其包括在大靶向载体(LTVEC)存在下使所述基因组与Cas蛋白、杂化到靶序列的CRISPR RNA，和tracrRNA接触，其中所述LTVEC为至少10kb且包含侧接有5'同源臂和3'同源臂的第一核酸，其中在所述LTVEC存在下与所述Cas蛋白、CRISPR RNA，和tracrRNA接触之后，所述基因组在目标基因组基因座处被修饰以含有所述第一核酸。所述靶序列可在所述目标基因组基因座处或在其附近。

在一些这样的方法中，所述基因组在真核细胞中，且将所述Cas蛋白、所述CRISPRRNA、所述tracrRNA和所述LTVEC引入所述真核细胞中。一些这样的方法进一步包括鉴定在所述目标基因组基因座处包括靶向基因修饰的修饰的真核细胞。

在一些这样的方法中，所述CRISPR RNA和所述tracrRNA以单一向导RNA(gRNA)的形式一起引入。在其它方法中，所述CRISPR RNA和所述tracrRNA单独地引入。

在一些这样的方法中，(a)所述Cas蛋白以蛋白质、编码所述Cas蛋白的信使RNA(mRNA)或编码所述Cas蛋白的DNA的形式引入所述真核细胞中；(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入所述真核细胞中；和(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入所述真核细胞中。

在一些方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；(b)编码所述CRISPR RNA的所述DNA呈包含操作性连接编码所述CRISPR RNA的第三核酸的第二启动子的第二表达构建体的形式；且(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第四核酸的第三启动子的第三表达构建体的形式，其中所述第一启动子、所述第二启动子和所述第三启动子在所述真核细胞中具有活性。任选地，所述第一表达构建体、所述第二表达构建体和/或所述第三表达构建体在单一核酸分子上。

在一些方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；且(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含所述CRISPR RNA和所述tracrRNA的gRNA的第三核酸的第二启动子的第二表达构建体的形式；其中所述第一启动子和所述第二启动子在所述真核细胞中具有活性。任选地，所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

在一些方法中，所述Cas蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入所述真核细胞中。

在一些方法中，所述靶向基因修饰同时包括在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述第一核酸。在一些方法中，所述缺失的内源核酸序列为约30kb-约110kb，且所述插入的第一核酸为约40kb-约140kb。在一些方法中，所述缺失的内源核酸序列为约38kb-约110kb，且所述插入的第一核酸为约43kb-约134kb。

在一些方法中，所述靶向基因修饰为双等位基因基因修饰。任选地，所述双等位基因基因修饰包括在两种同源染色体中在所述目标基因组基因座处内源核酸序列的缺失和所述第一核酸的插入。

在一些方法中，所述修饰的真核细胞为在所述目标基因组基因座下杂合的化合物。在一些方法中，所述修饰的真核细胞在所述目标基因组基因座处为半合的。任选地，在一种染色体中在所述目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和所述第一核酸的插入。任选地，所述靶向基因修饰包括：(1)在两种同源染色体中在所述目标基因组基因座处缺失内源核酸序列；和(2)在第一染色体中所述第一核酸插入所述目标基因组基因座中和在第二染色体中破坏所述目标基因组基因座。所述第一染色体可为所述两种同源染色体中的一种，且所述第二染色体可为另一同源染色体。

在一些方法中，所述LTVEC为至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb。任选地，所述LTVEC为至少100kb、至少150kb或至少200kb。

在一些方法中，所述第一核酸为至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb、至少200kb、至少250kb或至少300kb。在一些方法中，所述第一核酸为约40kb-约140kb。在一些方法中，所述第一核酸为约43kb-约134kb。

在一些方法中，所述真核细胞为哺乳动物细胞、成纤维细胞、多潜能细胞、非人类多潜能细胞、啮齿动物多潜能细胞、小鼠或大鼠胚胎干(ES)细胞、人类多潜能细胞、人类胚胎干(ES)细胞、人类成人干细胞、发育受限的人类祖细胞或人类诱导的多潜能干(iPS)细胞。

在一些方法中，所述Cas蛋白为Cas9。在一些方法中，所述靶序列由原间隔区邻近基序(PAM)序列直接侧接。

在一些方法中，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约150kb。任选地，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

在一些方法中，所述靶向基因修饰包括：(a)用同源或直系同源的核酸序列替换内源核酸序列；(b)缺失内源核酸序列；(c)缺失内源核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)插入外源核酸序列；(e)插入外源核酸序列，所述外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(f)插入包含同源或直系同源的核酸序列的外源核酸序列；(g)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；(h)插入侧接有位点特异性重组酶靶序列的条件性等位基因；(i)插入操作性连接在所述多潜能细胞中具有活性的第三启动子的可选择标记或报道基因；或(j)其组合。

在一些方法中，所述目标基因组基因座包含(i)与所述5'同源臂同源的5'靶序列；和(ii)与所述3'同源臂同源的3'靶序列。任选地，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。任选地，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。任选地，所述5'靶序列和所述3'靶序列相隔至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb或至少200kb。在一些方法中，所述5'靶序列和所述3'靶序列相隔约30kb-约110kb。在一些方法中，所述5'靶序列和所述3'靶序列相隔约38kb-约110kb。

在一些方法中，所述目标基因组基因座包括所述干扰白细胞素-2受体γ基因座、所述ApoE基因座、所述Rag1基因座、所述Rag2基因座或所述Rag1基因座和所述Rag2基因座两者。在其它方法中，所述目标基因组基因座包括Adamts5基因座、Trpa1基因座、Folh1基因座或Erbb4基因座。在其它方法中，所述目标基因组基因座包括Lrp5基因座。在又其它方法中，所述目标基因组基因座包括C5(Hc)基因座、Ror1基因座或Dpp4基因座。

进一步提供一种用于产生在目标基因组基因座处包括靶向基因修饰的F0代非人类动物的方法，所述方法包括：(a)在大靶向载体(LTVEC)存在下使在非人类ES细胞中的基因组与Cas蛋白、CRISPR RNA，和tracrRNA接触以形成修饰的非人类ES细胞，其中所述LTVEC为至少10kb且包含侧接有5'同源臂和3'同源臂的第一核酸；(b)鉴定在所述目标基因组基因座处具有所述靶向基因修饰的修饰的非人类ES细胞；(c)将所述修饰的非人类ES细胞引入非人类宿主胚胎中；和(d)在代孕母体中孕育所述非人类宿主胚胎，其中所述代孕母体产生在所述目标基因组基因座处包括所述靶向基因修饰的所述F0代非人类动物。

在一些这样的方法中，所述CRISPR RNA和所述tracrRNA以单一向导RNA(gRNA)的形式一起引入。在其它这样的方法中，所述CRISPR RNA和所述tracrRNA单独地引入。

在一些这样的方法中，(a)所述Cas蛋白以蛋白质、编码所述Cas蛋白的信使RNA(mRNA)或编码所述Cas蛋白的DNA的形式引入所述非人类ES细胞中；(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入所述非人类ES细胞中；且(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入所述非人类ES细胞中。

在一些这样的方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；(b)编码所述CRISPR RNA的所述DNA呈包含操作性连接编码所CRISPR RNA的第三核酸的第二启动子的第二表达构建体的形式；且(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第四核酸的第三启动子的第三表达构建体的形式，其中所述第一启动子、所述第二启动子和所述第三启动子在所述非人类ES细胞中具有活性。任选地，所述第一表达构建体、所述第二表达构建体和所述第三表达构建体在单一核酸分子上。

在一些这样的方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；且(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含所述CRISPR RNA和所述tracrRNA的gRNA的第三核酸的第二启动子的第二表达构建体的形式；其中所述第一启动子和所述第二启动子在所述非人类ES细胞中具有活性。任选地，所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

在一些这样的方法中，所述Cas蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入所述非人类ES细胞中。

在一些这样的方法中，所述靶向基因修饰同时包括在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述第一核酸。

在一些这样的方法中，所述靶向基因修饰为双等位基因基因修饰。任选地，所述双等位基因基因修饰包括在两种同源染色体中在所述目标基因组基因座处内源核酸序列的缺失和所述第一核酸的插入。

在一些这样的方法中，所述修饰的非人类ES细胞为在所述目标基因组基因座处杂合的化合物。在一些这样的方法中，所述修饰的非人类ES细胞在所述目标基因组基因座处为半合的。任选地，在一种染色体中在所述目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和所述第一核酸的插入。任选地，所述靶向基因修饰包括：(1)在两种同源染色体中在所述目标基因组基因座处缺失内源核酸序列；和(2)在第一染色体中所述第一核酸插入所述目标基因组基因座中和在第二染色体中破坏所述目标基因组基因座。所述第一染色体可为所述两种同源染色体中的一种，且所述第二染色体可为另一同源染色体。

在一些这样的方法中，所述Cas蛋白为Cas9。

进一步提供一种用于修饰在真核细胞、小鼠细胞或人类细胞中的目标基因组基因座处的基因组的方法，其包括使所述基因组与Cas蛋白、杂化到在所述目标基因组基因座处的靶序列的CRISPR RNA，和tracrRNA在大靶向载体(LTVEC)存在下接触，其中所述LTVEC为至少10kb且包含侧接有与在所述目标基因组基因座处的5'靶序列同源的5'同源臂和与在所述目标基因组基因座处的3'靶序列同源的3'同源臂的第一核酸，其中所述第一核酸为至少30kb和/或所述5'靶序列和所述3'靶序列相隔至少30kb，其中在所述LTVEC存在下与所述Cas蛋白、所述CRISPR RNA和所述tracrRNA接触之后，所述基因组被修饰以包含包括在所述目标基因组基因座处插入所述第一核酸的靶向基因修饰。

上述方法中的任一种可进一步包括将所述Cas蛋白、所述CRISPR RNA、所述tracrRNA和所述LTVEC引入所述真核细胞、所述小鼠细胞或所述人类细胞中。上述方法中的任一种可进一步包括鉴定在所述目标基因组基因座处包括所述靶向基因修饰的所述修饰的真核细胞、所述修饰的小鼠细胞或所述修饰的人类细胞。

在一些上述方法中，所述CRISPR RNA和所述tracrRNA以单一转录体的形式一起引入。在一些上述方法中，所述CRISPR RNA和所述tracrRNA单独地引入。

在一些上述方法中，(a)所述Cas蛋白以蛋白质、编码所述Cas蛋白的信使RNA(mRNA)或编码所述Cas蛋白的DNA的形式引入所述真核细胞、所述小鼠细胞或所述人类细胞中；(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入所述真核细胞、所述小鼠细胞或所述人类细胞中；且(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入所述真核细胞、所述小鼠细胞或所述人类细胞中。在一些上述方法中，所述Cas蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入所述真核细胞、所述小鼠细胞或所述人类细胞中。

在一些上述方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；(b)编码所述CRISPR RNA的所述DNA呈包含操作性连接编码所CRISPR RNA的第三核酸的第二启动子的第二表达构建体的形式；且(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第四核酸的第三启动子的第三表达构建体的形式；其中所述第一启动子、所述第二启动子和所述第三启动子在所述真核细胞、所述小鼠细胞或所述人类细胞中具有活性。在一些上述方法中，所述第一表达构建体、所述第二表达构建体和/或所述第三表达构建体在单一核酸分子上。

在一些上述方法中，(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；且(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含在单一转录体中的所述CRISPR RNA和所述tracrRNA的gRNA的第三核酸的第二启动子的第二表达构建体的形式；其中所述第一启动子和所述第二启动子在所述真核细胞、所述小鼠细胞或所述人类细胞中具有活性。在一些上述方法中，所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

在一些上述方法中，所述LTVEC为至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb。在一些上述方法中，所述LTVEC为至少100kb、至少150kb或至少200kb。

在一些上述方法中，所述第一核酸为至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb、至少200kb、至少250kb或至少300kb。在一些上述方法中，所述第一核酸为约40kb-约140kb。

在一些上述方法中，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约150kb。在一些上述方法中，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

在一些上述方法中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。在一些上述方法中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。在一些上述方法中，所述5'靶序列和所述3'靶序列相隔至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb或至少200kb。在一些上述方法中，所述5'靶序列和所述3'靶序列相隔约30kb-约110kb。

在一些上述方法中，所述真核细胞不是大鼠细胞。在一些上述方法中，所述真核细胞为多潜能细胞、非多潜能细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、仓鼠细胞、非人类多潜能细胞、人类多潜能细胞、啮齿动物多潜能细胞或成纤维细胞。在一些上述方法中，所述真核细胞为原代细胞或永生化细胞。在一些上述方法中，所述啮齿动物多潜能细胞为小鼠或大鼠胚胎干(ES)细胞。

在一些上述方法中，所述小鼠细胞或所述人类细胞为原代细胞或永生化细胞。在一些上述方法中，所述小鼠细胞或所述人类细胞为多潜能细胞。在一些上述方法中，所述小鼠多潜能细胞为小鼠胚胎干(ES)细胞。在一些上述方法中，所述人类多潜能细胞为人类胚胎干(ES)细胞、人类成人干细胞、发育受限的人类祖细胞或人类诱导的多潜能干(iPS)细胞。在一些上述方法中，所述人类iPS细胞维持在包含碱介质和补充液的培养基中，其中所述培养基包含：(a)白血病抑制因子(LIF)多肽；(b)肝糖合成酶激酶(GSK3)抑制剂；和(c)MEK抑制剂；其中所述培养基具有约175mOsm/kg-约280mOsm/kg的渗透压度。

在一些上述方法中，所述Cas蛋白为Cas9。在一些上述方法中，所述靶序列由原间隔区邻近基序(PAM)序列直接侧接。

在一些上述方法中，所述靶向基因修饰同时包括在单一步骤中在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述第一核酸。在一些上述方法中，所述缺失的内源核酸序列为约30kb-约110kb，且所述插入的第一核酸为约40kb-约140kb。

在一些上述方法中，所述靶向基因修饰为双等位基因基因修饰。在一些上述方法中，所述双等位基因基因修饰包括在两种同源染色体中在所述目标基因组基因座处内源核酸序列的缺失和所述第一核酸的插入。在一些上述方法中，所述修饰的真核细胞、所述修饰的小鼠细胞或所述修饰的人类细胞为在所述目标基因组基因座处杂合的化合物。在一些上述方法中，所述修饰的真核细胞、所述修饰的小鼠细胞或所述修饰的人类细胞在所述目标基因组基因座处为半合的。在一些上述方法中，在一种染色体中在目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和所述第一核酸的插入。在一些上述方法中，所述靶向基因修饰包括：(1)在第一同源染色体和第二同源染色体中在所述目标基因组基因座处缺失内源核酸序列；和(2)所述第一核酸插入在所述第一同源染色体中的目标基因组基因座中并破坏在所述第二同源染色体中的目标基因组基因座。

在一些上述方法中，所述靶向基因修饰包括：(a)用同源或直系同源的核酸序列替换内源核酸序列；(b)缺失内源核酸序列；(c)缺失内源核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)插入外源核酸序列；(e)插入外源核酸序列，所述外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(f)插入包含同源或直系同源的核酸序列的外源核酸序列；(g)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；(h)插入侧接有位点特异性重组酶靶序列的条件性等位基因；(i)插入操作性连接在所述多潜能细胞中具有活性的启动子的可选择标记或报道基因；或(j)其组合。

在一些上述方法中，所述目标基因组基因座包括干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座、所述Rag1基因座和所述Rag2基因座两者、Adamts5基因座、Trpa1基因座、Folh1基因座、Erbb4基因座、Lrp5基因座、C5(Hc)基因座、Ror1基因座或Dpp4基因座。在一些上述方法中，所述目标基因组基因座包含染色体外DNA。

还提供一种用于产生在目标基因组基因座处包括靶向基因修饰的F0代非人类动物或小鼠的方法，所述方法包括：(a)使用上述方法中的任一种修饰非人类或小鼠ES细胞；(b)鉴定在所述目标基因组基因座处包括所述靶向基因修饰的修饰的非人类或小鼠ES细胞；(c)将所述修饰的非人类或小鼠ES细胞引入非人类或小鼠宿主胚胎中；和(d)在代孕母体中孕育所述非人类或小鼠宿主胚胎，其中所述代孕母体产生在所述目标基因组基因座处包括所述靶向基因修饰的所述F0代非人类动物或小鼠。

附图说明

图1描绘大鼠ESC，其作为通常在培养皿中脱离并漂浮的紧实球形集落生长。

图2A至2D描绘由大鼠ESC表达的各种多潜能标记：A描绘Oct-4(绿色)；B描绘Sox-2(红色)；C描绘DAPI(蓝色)；D描绘由rESC表达的多潜能标记的重叠。

图3描绘大鼠ESC表达各亮度水平的碱性磷酸酶(多潜能标记)。

图4描绘株系DA.2B的核型分析，其为42X,Y。因为大鼠ESC常变成四倍体，所以进行核型分析；株系因此通过计数中期染色体散布来预先筛选，且随后对具有大部分正常计数的株系正式分析核型。

图5A-B提供示出ACI.G1大鼠ES细胞系的染色体数的分析的照片。

图6A-B提供示出DA.2B大鼠ES细胞系的染色体数的分析的照片。

图7A-B提供示出DA.2C大鼠ES细胞系的染色体数的分析的照片。

图8描绘图1的大鼠ESC的近视图。

图9描绘通过胚泡注射来产生嵌合体以及通过种系传递大鼠ESC基因组。使用亲本ACI.G1大鼠ESC通过胚泡注射产生嵌合体。高百分数嵌合体通常具有白化鼻部。

图10描绘由在图9中用星号(*)标记的ACI/SD嵌合体所生的F1白化刺豚鼠同窝幼仔。

图11提供大鼠ApoE基因座的示意图，并且用灰条指示锌指核酸酶(ZFN1和ZFN2)的切割位点。对应于5'同源臂和3'同源臂的基因组区(分别是5kb和5.4kb)通过暗灰色框来指示。ApoE基因的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线。外显子2和3包含编码区且显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。

图12描绘大鼠Rosa26基因座的靶向，如同在小鼠中一样，所述基因座以相同间隔位于Setd5基因与Thumpd3基因之间。版面A示出小鼠Rosa26基因座的结构。小鼠Rosa26转录体由2个或3个外显子组成。版面B描绘大鼠Rosa26基因座的结构；除与小鼠外显子1同源的外显子(Ex1a)之外，大鼠基因座还含有第二外显子1(Ex1b)；尚未在大鼠中鉴定出第三外显子。版面C描绘靶向大鼠Rosa26等位基因；使用来自DA rESC的基因组DNA通过PCR来克隆各自具有5kb的同源臂；靶向等位基因含有替换在大鼠Rosa26内含子中的117bp缺失的剪接接受体(SA)-lacZ-hUB-neo盒。

图13A描绘14周龄野生型大鼠的对照脑，其用X-gal染色。对照脑示出低水平的背景LacZ染色(背视图)。

图13B描绘rRosa26杂合大鼠(14周龄)的脑中的LacZ表达。lacZ报道基因在rRosa26杂合子的整个脑中遍在表达。

图13C描绘14周龄野生型大鼠的对照心脏和胸腺(插图)，其用X-gal处理。对照心脏和胸腺示出低水平的背景LacZ染色。

图13D描绘14周龄rRosa26杂合大鼠的心脏和胸腺(插图)中的LacZ表达。lacZ报道基因在rROSA26杂合子的整个心脏和胸腺中遍在表达。

图13E描绘14周龄野生型大鼠的对照肺，其用X-gal处理。对照肺示出低水平的背景LacZ染色。

图13F描绘在14周龄rRosa26杂合子大鼠的肺中的LacZ表达。lacZ报道基因在rRosa26杂合子的整个肺中遍在表达。

图13G和13H描绘在E12.5大鼠胚胎中的LacZ表达。与显示低水平的背景LacZ染色的野生型对照胚胎(H)形成对比，rRosa26杂合胚胎表现出LacZ报道基因在整个胚胎中遍在表达。

图13I和13J描绘在E14.5大鼠胚胎中的LacZ表达。与显示低水平的背景LacZ染色的野生型对照胚胎(J)形成对比，rRosa26杂合大鼠胚胎表现出LacZ报道基因在整个胚胎中遍在表达。

图14说明在包含选择盒(lacZ-neo盒)的靶向载体的电穿孔之后在大鼠ES细胞内部发生的同源或非同源重组事件。

图15说明基因组编辑核酸内切酶(例如，ZFN和TALEN)在靶基因组序列中引入双链断裂(DSB)以及激活在ES细胞中的非同源末端接合(NHEJ)所依的机理。

图16说明利用ZFN/TALEN来改进靶向载体的同源重组的效率的基因靶向技术。DSB代表双链断裂。

图17示出通过修饰的大鼠ApoE基因座的嵌合体产生和种系传递产生的ApoE-ZFN-AB5嵌合体。靶向修饰由锌指核酸酶辅助。

图18提供与靶向ZFN U和ZFN D的锌指核酸酶组合的IL2r-γ靶向事件的示意图。示出由ZFN U和ZFN D靶向的大鼠IL2r-γ基因座的区(SEQ ID NO:93)。ZFN切割位点在图中指出。

图19提供与靶向ZFN U和ZFN D或与gRNA(gRNA1、gRNA2、gRNA3、gRNA4)组合的锌指核酸酶组合的IL2r-γ靶向事件的示意图。示出由ZFN U和ZFN D或gRNA1-4靶向的大鼠IL2r-γ基因座的区且指出ZFN切割位点。

图20提供大鼠ApoE基因座和靶向质粒的示意图。上部示意图示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是5kb和5.4kb；暗灰色框)的基因组结构。ApoE基因的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线。外显子2和3包含编码区且显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。下部版面示出靶向质粒。5'同源臂和3'同源臂(分别是5kb和5.4kb)由暗灰色框指示。靶向载体包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒。自缺失性盒包含操作性连接Crei基因的小鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图21A提供使用锌指核酸酶和靶向载体来靶向在大鼠ES细胞中的ApoE基因座的示意图，所述靶向载体包含报道基因(LacZ)和自缺失性盒，所述自缺失性盒包含操作性连接Crei基因的小鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。图21B描绘纯合靶向的ApoE基因座。

图22提供大鼠ApoE基因座和大靶向载体(LTVEC)的示意图。上部版面示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是45kb和23kb；暗灰色框)的基因组组构。ApoE的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线，并且外显子2和3包含编码区并显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。下部版面示出用于修饰大鼠ApoE基因座的LTVEC。5'同源臂和3'同源臂(分别是45kb和23kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒包含操作性连接Crei基因的小鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图23提供大鼠ApoE基因座的示意图且用灰条指示连同大靶向载体(LTVEC)一起用于增强靶向载体与靶同源染色体区之间的同源重组的锌指核酸酶(ZFN1和ZFN2)的切割位点。

图24描绘已通过3.2kb缺失以及插入报道基因(eGFP)和自缺失性盒来破坏的大鼠IL2r-γ基因座，所述自缺失性盒包含药物选择盒(hUb-neo)和操作性连接小鼠Prm1启动子的Crei基因。

图25提供已通过3.2kb缺失以及插入报道基因(eGFP)和自缺失性盒来破坏的大鼠IL2r-γ基因座的另一绘图，所述自缺失性盒包含操作性连接小鼠Prm1启动子的Crei基因和药物选择盒(hUb-neo)。

图26提供大鼠Rag2基因座和用于修饰大鼠Rag2基因座的大靶向载体(LTVEC)的示意图。上部版面示出大鼠Rag2基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是48kb和84kb；暗灰色框)的基因组组构。Rag2包含通过点描灰色阴影来指示的单一外显子。下部版面为LTVEC。5'同源臂和3'同源臂(分别是48kb和84kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒含有操作性连接Crei基因的大鼠Prm1启动子和含有操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图27提供大鼠Rag1/Rag2基因座的基因组结构以及通过Rag2靶向(Rag2缺失)或Rag2/Rag1双重靶向(Rag2/Rag1缺失)缺失的基因组区。

图28提供大鼠Rag2基因座和Rag1基因座及用于修饰基因座的大靶向载体(LTVEC)的示意图。上部版面示出Rag1和Rag2基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是48kb和15kb；暗灰色框)的基因组组构。Rag2和Rag1各自包含由点描灰色阴影指示的单一外显子。下部版面为LTVEC。5'同源臂和3'同源臂(分别是48kb和15kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒包含操作性连接Crei基因的大鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图29示出对于在来自II2rg-/y嵌合大鼠(版面A-C)和WT DA大鼠(版面D-F)的外周血液单核细胞(PBMC)中的GFP表达和T细胞标记CD3(版面A和D)、B细胞标记B220(版面B和E)和NK细胞标记CD161a(版面C和F)的流式细胞分析。双重阳性细胞在象限R8中示出。图29示出II2rg-/y PBMC不表达成熟淋巴细胞标记。

图30示出GFP阳性淋巴细胞在三个II2rg-/y嵌合体中的2个中的外周血液中检测到。

图31提供大鼠Il2rg基因座和用于大鼠Il2rg基因座的完全人源化的靶向质粒的示意图。上部版面示出大鼠Il2rg基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是4.3kb和4.0kb；暗灰色框)的基因组组构。下部版面为靶向质粒。5'同源臂和3'同源臂(分别是4.3kb和4.0kb)由暗灰色框指示。靶向质粒包含人类IL-2rg基因组区和由loxP位点(空心箭头)侧接的缺失盒，所述缺失盒含有含有操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图32提供大鼠Il2rg基因座和用于大鼠Il2rg基因座的胞外结构域人源化的靶向质粒的示意图。上部版面示出大鼠Il2rg基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是4.3kb和4.0kb；暗灰色框)的基因组组构。下部版面为靶向质粒。5'同源臂和3'同源臂(分别是4.3kb和4.0kb)由暗灰色框指示。所述靶向质粒包含IL-2Rg基因组区的人类胞胞外结构域和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒含有操作性连接Crei基因的大鼠Prm1启动子和含有操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图33提供人类IL-2rg蛋白(SEQ ID NO:20；NP_000197.1)；大鼠IL-2rg蛋白(SEQID NO:21；NP_543165.1)；以及包含融合于大鼠IL-2rg蛋白的其余部分的IL-2rg的人类胞胞外结构域的嵌合IL-2rg蛋白(SEQ ID NO:22)的序列比对。在人类IL-2rg和大鼠IL-2rg之间的接合点通过垂直线标注。

图34提供小鼠Lrp5基因的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Lrp5基因座示于底部版面中。人源化的区为胞外域。箭头指示各gRNA(gA、gB、gB2、gC、gD、gE2、gE、gF)和ZFN(a-d)的靶位点。

图35描绘增加缺失尺寸的LTVEC靶向基因的％靶向效率(图35A)和具有增加尺寸的人类基因插入的LTVEC(图35B)。LTVEC单独使用(灰色方块或三角形)或与ZFN组合使用(黑格方块或三角形)。

图36提供小鼠Trpa1基因的整体编码区的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Trpa1基因座示于底部版面中。箭头指示各gRNA(gA、gA2、gB、gC、gD、gE2、gE、gF)的靶位点。

图37提供小鼠Folh1基因的胞外域(外显子2-终止密码子)的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Folh1基因座示于底部版面中。箭头指示各gRNA(gA、gA2、gB、gC、gD、gE、gE2、gF)的靶位点。

图38提供小鼠C5(Hc)基因的从外显子2到终止密码子的区的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠C5(Hc)基因座示于底部版面中。箭头指示各gRNA(gA、gB、gB2、gC、gD、gE2、gE、gF)的靶位点。

图39提供小鼠Adamts5基因的整体编码区的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Adamts5基因座示于底部版面中。箭头指示各gRNA(gA、gA2、gB、gC、gD、gE2、gE、gF)的靶位点。

图40提供小鼠Erbb4基因的外显子4-15的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Erbb4基因座示于底部版面中。箭头指示各gRNA(gA、gB、gB2、gC、gD、gE2、gE、gF)的靶位点。

图41提供小鼠Ror1基因的外显子2-7的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Ror1基因座示于底部版面中。箭头指示各gRNA(gA、gB、gC、gD、gE、gF)的靶位点。

图42提供小鼠Dpp4基因的从外显子2到终止密码子的区的CRISPR/Cas9辅助人源化的示意图；LTVEC示于顶部版面中且小鼠Dpp4基因座示于底部版面中。箭头指示各gRNA(gA、gB、gB2、gC、gD、gE2、gE、gF)的靶位点。

图43示出用X-gal染色的12周龄雌性大鼠脑。图43A-C示出来自野生型大鼠的脑，且图43D-F示出来自ApoE^+/-大鼠的脑。图43A和D示出背视图，图43B和E示出腹视图，且图43C和F示出近视图。

图44示出用X-gal染色的12周龄雌性大鼠心脏(A和C)和血管(B和D)的相应近视图。图44A和44B分别示出来自野生型大鼠的心脏和血管，且图44C和44D分别示出来自ApoE^+/-大鼠的心脏和血管。染色存在于心脏的心房和一些血管(例如，腔静脉)中。

图45示出用X-gal染色的12周龄雌性大鼠肝。图45A和45B示出来自野生型大鼠的肝，且图45C和45D示出来自ApoE^+/-大鼠的肝。图45B和45D为肝的近视图。

图46示出在6周、9周、12周和15周的纯合ApoE靶向大鼠、杂合ApoE靶向大鼠和野生型大鼠中胆固醇、LDL、HDL和三酸甘油酯水平的检测(分别地，图46A-D)。

图47示出大鼠ApoE基因座(上部版面)和靶向大鼠ApoE基因座的大靶向载体(LTVEC)(下部版面)的示意图。上部版面示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是45kb和23kb；暗灰色框)的基因组组构。ApoE的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线，并且外显子2和3包含编码区并显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。指示出ApoE gRNA2(SEQ ID NO:87)和ApoE gRNA3(SEQ ID NO:88)的靶位点。下部版面示出用于修饰大鼠ApoE基因座的LTVEC。5'同源臂和3'同源臂(分别是45kb和23kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒包含操作性连接Crei基因的小鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图48示出大鼠Rag2基因座(上部版面)和靶向大鼠Rag2基因座的大靶向载体(LTVEC)(下部版面)的示意图。上部版面示出大鼠Rag2基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是48kb和84kb；暗灰色框)的基因组组构。Rag2包含通过点描灰色阴影来指示的单一外显子。指示出Rag2 gRNA1(SEQ ID NO:89)和Rag2 gRNA4(SEQ ID NO:90)的靶位点。下部版面为LTVEC。5'同源臂和3'同源臂(分别是48kb和84kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒含有操作性连接Crei基因的大鼠Prm1启动子和含有操作性连接潮霉素抗性基因的人类泛素启动子的药物选择盒。

图49示出大鼠Il2rg基因座(上部版面)和用于大鼠Il2rg基因座的胞外域人源化的靶向质粒(下部版面)的示意图。上部版面示出大鼠Il2rg基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是4.3kb和4.0kb；暗灰色框)的基因组组构。指示出Il2rggRNA2(SEQ ID NO:91)和Il2rg gRNA4(SEQ ID NO:92)的靶位点。下部版面为靶向质粒。5'同源臂和3'同源臂(分别是4.3kb和4.0kb)由暗灰色框指示。所述靶向质粒包含IL-2Rg基因组区的人类胞胞外结构域和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒含有操作性连接Crei基因的大鼠Prm1启动子和含有操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图50示出大鼠Rag2和Rag1基因座和用于修饰在Il2rg靶向大鼠ES细胞(克隆Il2rg-CG12)中的基因座的大靶向载体(LTVEC)的示意图。上部版面示出Rag1和Rag2基因座和对应于5'同源臂和3'同源臂的同源基因组区(分别是48kb和15kb；暗灰色框)的基因组组构。Rag2和Rag1各自包含由无阴影的箭头指示的单一外显子。下部版面为LTVEC。5'同源臂和3'同源臂(分别是48kb和15kb)由暗灰色框指示。LTVEC包含报道基因(eGFP)和由内部核糖体进入位点(IRES)间隔且操作性连接肌动蛋白启动子的嘌呤霉素抗性基因。LTVEC进一步包含由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒包含操作性连接Crei基因的大鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。

图51描绘使用LTVEC和在人类iPS细胞中的向导RNA用包含小鼠Adam6a基因座和小鼠Adam6b基因座的核酸替换人类ADAM6基因座的一部分的示意图。向导RNA的靶位点由箭头指示。

图52A描绘由在2i培养基中培养8天的人类iPS细胞显示的形态。图52B描绘由在2i培养基中培养12天的人类iPS细胞显示的形态。

图53A-53D描绘在mTeSR^TM-hLIF培养基或低渗透压度VG2i培养基中培养6天的人类iPS细胞的形态。图53A和53B描绘在mTeSR^TM-hLIF培养基(图53A)或VG2i培养基(图53B)中培养6天的人类iPS细胞的形态。图53C和53D描绘在mTeSR^TM-hLIF培养基(图53C)或VG2i培养基(图53D)中在新生人类包皮成纤维细胞(NuFF)饲养细胞上培养6天的人类iPS细胞的形态。

图54A描绘已经对于碱性磷酸酶染色的在VG2i培养基中培养的重编程人类iPS细胞。图54B和54C描绘已经对于NANOG的表达免疫染色的在VG2i培养基中培养的重编程人类iPS细胞。

图55A-55C说明在VG2i培养基中培养的重编程人类iPS细胞的酶分解和传代培养。图55A描绘在缺乏ROCK抑制剂的情况下用胰蛋白酶进行酶分解之前在VG2i培养基中培养的重编程人类iPS细胞。图55B描绘在传代培养之后1天在VG2i培养基中培养的人类iPS细胞。图55C描绘在传代培养之后4天在VG2i培养基中培养的人类iPS细胞。

具体实施方式

提供组合物和方法以经由在原核细胞中的细菌同源重组(BHR)修饰大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠目标基因组基因座。还提供组合物和方法以使用大靶向载体(LTVEC)以及核酸内切酶基因修饰目标基因组基因座，例如大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物或小鼠目标基因组基因座。还提供组合物和方法以产生包括一种或多种靶向基因修饰的例如大鼠、小鼠、啮齿动物或非大鼠啮齿动物的基因修饰的非人类动物。还提供分离的人类和非人类全能或多潜能干细胞，尤其是大鼠胚胎干细胞，其能够在一种或多种体外连续基因修饰之后维持多潜能性且能够经由种系将所述靶向基因修饰传递到后代。

词汇表

本文使用的术语“胚胎干细胞”或“ES细胞”包括在引入胚胎中后能够促进发育胚胎的任何组织的源自胚胎的全能或多潜能细胞。本文使用的术语“多潜能细胞”包括具有发育成多于一种类型的分化细胞的能力的未分化细胞。术语“非多潜能细胞”包括不是多潜能细胞的细胞。

本文使用的术语“同源核酸”包括与已知参考序列相同或实质类似的核酸序列。在一个实施方案中，术语“同源核酸”用以表征具有与已知参考序列至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或甚至100％同一的氨基酸序列的序列。

本文使用的术语“直系同源核酸”包括在功能上与在另一物质中的已知参考序列等效的来自一种物质的核酸序列。

本文使用的术语“大靶向载体”或“LTVEC”包括源自克隆基因组DNA的片段的用于真核细胞的大靶向载体，其比由意图在真核细胞中执行同源基因靶向的其它方法通常使用的那些靶向载体大。LTVEC的实例包括但不限于细菌同源染色体(BAC)和酵母菌人造染色体(YAC)。

本文使用的术语“等位基因修饰”(MOA)包括在基因组中一种或多种基因或染色体基因座(loci)的一种等位基因的精确DNA序列的修饰。如本文所述的“等位基因修饰(MOA)”的实例包括但不限于缺失、取代或插入仅仅单一核苷酸或跨一种或多种目标基因或染色体基因座缺失上千个碱基以及在这两个末端之间的任何和所有可能的修饰。

本文使用的术语“重组位点”包括由位点特异性重组酶识别且可充当重组事件的底物的核苷酸序列。

“系列”基因修饰包括对细胞(例如，真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或中国仓鼠卵巢(CHO)细胞)独立地实施的两种或多种修饰。第一修饰可通过电穿孔或本领域已知的任何其它方法实现。随后，采用合适的第二核酸构建体对同一细胞基因组进行第二修饰。所述第二修饰可通过第二电穿孔或本领域已知的任何其它方法实现。在各种实施方案中，在同一细胞的第一基因修饰和第二基因修饰之后，可使用例如连续电穿孔或本领域已知的任何其它合适方法(连续地)实现第三基因修饰、第四基因修饰、第五基因修饰、第六基因修饰等连续基因修饰(一种基因修饰跟着另一基因修饰)。

本文使用的术语“位点特异性重组酶”包括可促进在“重组位点”之间的重组的一组酶，其中所述两个重组位点在单一核酸分子内或在单独的核酸分子上实体间隔开。“位点特异性重组酶”的实例包括但不限于Cre、Flp和Dre重组酶。

关于核酸序列的术语“种系”包括可传到子代的核酸序列。

短语“重链”或“免疫球蛋白重链”包括来自任何生物体的免疫球蛋白重链序列，包括免疫球蛋白重链恒定区序列。除非另有指明，否则重链可变结构域包括三个重链CDR和四个FR区。重链的片段包括CDR、CDR和FR及其组合。典型的重链具有在可变结构域(N-末端到C-末端)之后的C_H1结构域、铰链、C_H2结构域和C_H3结构域。重链的功能片段包括能够特异性识别能够自细胞表达并分泌且包含至少一个CDR的表位(例如，以微摩尔、纳摩尔或皮摩尔范围的K_D识别表位)的片段。重链可变结构域由可变区核苷酸序列编码，其通常包含源自在种系中存在的V_H、D_H和J_H片段的清单的V_H、D_H和J_H片段。各种生物体的V、D和J重链片段的序列、定位和命名可在IMGT数据库中见到，其可经由因特网在环球网(www)上在URL“imgt.org.”上访问。

短语“轻链”包括来自任何生物体的免疫球蛋白轻链序列，且除非另作说明，否则包括人类卡巴(κ)和拉姆达(λ)轻链和VpreB以及替代轻链。除非另作说明，否则轻链可变结构域通常包括三个轻链CDR和四个框架(FR)区。通常，全长轻链包括从氨基端点到羧基端点的包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的可变结构域和轻链恒定区氨基酸序列。轻链可变结构域由轻链可变区核苷酸序列编码，其通常包含源自在种系中存在的轻链V和J基因片段的清单的轻链V_L和轻链J_L基因片段。各种生物体的轻链V和J基因片段的序列、定位和命名可在IMGT数据库中见到，其可经由因特网在环球网(www)上在URL“imgt.org.”上访问。轻链包括例如不会选择性地结合由在其中呈现其的表位-结合蛋白选择性结合的第一表位或第二表位的那些轻链。轻链还包括结合并识别或帮助重链结合并识别由在其中呈现其的表位-结合蛋白选择性结合的一种或多种表位的那些轻链。

短语“操作性连接”包括其中组分以其预定方式操作性连接起作用的关系。在一种情况下，编码蛋白的核酸序列可操作性连接到调控序列(例如，启动子、增强子、沉默子序列等)以保持恰当的转录调控。在一种情况下，免疫球蛋白可变区(或V(D)J片段)的核酸序列可操作性连接到免疫球蛋白恒定区的核酸序列，以允许在序列之间恰当重组到免疫球蛋白重链或轻链序列。

1.包含核酸的靶基因座

提供各种方法和组合物，其允许在靶基因座处整合至少一种插入核酸。本文使用的“目标基因组基因座”包括希望整合插入核酸的在基因组内的DNA的任何片段或区。术语“目标基因组基因座”和“目标靶基因组基因座”可互换使用。目标基因组基因座对细胞可为天然的，或者可选地，可包含整合到细胞的基因组中的DNA的异源或外源片段。DNA的所述异源或外源片段可包括转基因、表达盒、编码选择制造体的多核苷酸或基因组DNA的异源或外源区。术语“基因座”在本文中定义为在基因组DNA内的DNA的片段。如本文所述的基因修饰可包括自目标基因座的一种或多种缺失、目标基因座的添加、目标基因座的替换和/或其任意组合。目标基因座可包括编码区或非编码调控区。

所述目标基因组基因座可进一步包含靶向整合系统的任何组分，所述组分包括例如识别位点、选择标记、先前整合的插入核酸、编码核酸酶试剂的多核苷酸、启动子等。可选地，所述目标基因组基因座可定位在所述细胞内的染色体外DNA内，例如酵母菌人造染色体(YAC)、细菌人造染色体(BAC)、人类人造染色体或在适当宿主细胞中包含的任何其它工程化的基因组区。在各种实施方案中，所述靶向基因座可包括来自原核生物、真核生物、非大鼠真核生物、酵母菌、细菌、非人类哺乳动物、非人类细胞、啮齿动物、非大鼠啮齿动物、人类、大鼠、小鼠、仓鼠、兔、猪、牛、鹿、绵羊、山羊、鸡、猫、狗、白鼬、灵长类动物(例如，狨猴、恒河猴)、驯化哺乳动物或农业哺乳动物或任何其它目标生物体或其组合的天然、异源或外源核酸序列。在一些实施方案中，所述目标基因组基因座包含来自人类、小鼠或其组合的核酸序列。

在特定的实施方案中，所述靶基因座例如来自真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞。

在特定的实施方案中，所述目标基因组基因座包括“大鼠核酸”的靶基因座。这一区域包含整合在细胞的基因组内的来自大鼠的核酸。所述靶基因座的非限制性实例包括编码在B细胞中表达的蛋白质的基因组基因座、表达在未成熟B细胞中的多肽的基因组基因座、表达在成熟B细胞中的多肽的基因组基因座、免疫球蛋白(Ig)基因座或包括例如T细胞受体α基因座的T细胞受体基因座。靶基因组基因座的另外实例包括Fcer1a基因座、Tlr4基因座、Prlr基因座、Notch4基因座、Accn2基因座、Adamts5基因座、Trpa1基因座、Folh1基因座、Lrp5基因座、IL2受体基因座，包括例如IL2受体γ(Il2rg)基因座、ApoE基因座、Rag1基因座、Rag2基因座、Rag1/Rag2基因座和Erbb4基因座。任何这样的靶基因座可来自大鼠或者可来自真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞或非人类哺乳动物细胞。

在一个实施方案中，所述靶基因座编码哺乳动物免疫球蛋白重链可变区氨基酸序列。在一个实施方案中，所述靶基因座编码大鼠免疫球蛋白重链可变区氨基酸序列。在一个实施方案中，所述靶基因座包含基因组DNA序列，所述基因组DNA序列包含操作性连接免疫球蛋白重链恒定区核酸序列的未重排的大鼠、小鼠或人类免疫球蛋白重链可变区核酸序列。在一个实施方案中，所述免疫球蛋白重链恒定区核酸序列为选自CH1、铰链、CH2、CH3及其组合的大鼠、小鼠或人类免疫球蛋白重链恒定区核酸序列。在一个实施方案中，所述重链恒定区核酸序列包含CH1-铰链-CH2-CH3。在一个实施方案中，所述靶基因座包含操作性连接免疫球蛋白重链恒定区核酸序列的未重排的大鼠、小鼠或人类免疫球蛋白重链可变区核酸序列。在一个实施方案中，所述免疫球蛋白重链恒定区核酸序列为选自CH1、铰链、CH2、CH3及其组合的大鼠、小鼠或人类免疫球蛋白重链恒定区核酸序列。在一个实施方案中，所述重链恒定区核酸序列包含CH1-铰链-CH2-CH3。

在一个实施方案中，所述靶基因座包含编码哺乳动物免疫球蛋白轻链可变区氨基酸序列的基因组DNA序列。在一个实施方案中，所述基因组DNA序列包含未重排的哺乳动物λ和/或κ轻链可变区核酸序列。

在一个实施方案中，所述基因组DNA序列包含重排的哺乳动物λ和/或κ轻链可变区核酸序列。在一个实施方案中，所述未重排的λ或κ轻链可变区核酸序列操作性连接选自λ轻链恒定区核酸序列和κ轻链恒定区核酸序列的哺乳动物免疫球蛋白轻链恒定区核酸序列。在一个实施方案中，所述哺乳动物免疫球蛋白轻链恒定区核酸序列为大鼠免疫球蛋白轻链恒定区核酸序列。在一个实施方案中，所述哺乳动物免疫球蛋白轻链恒定区核酸序列为小鼠免疫球蛋白轻链恒定区核酸序列。在一个实施方案中，所述哺乳动物免疫球蛋白轻链恒定区核酸序列为人类免疫球蛋白轻链恒定区核酸序列。

如在本文中所用，ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座包含基因组(即，哺乳动物基因组、人类基因组或非人类哺乳动物基因组)的相应区，这些基因或基因组合各自定位在这些相应区中。修饰ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座(即，哺乳动物、人类或非人类哺乳动物ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或合并的Rag2/Rag1基因座)中的任一个可包括对给定基因座的任何所要改变。修饰给定基因座(即，哺乳动物、人类或非人类哺乳动物基因座)的非限制性实例在本文中更详细地论述。

例如，在特定的实施方案中，修饰所述ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座(即，哺乳动物、人类或非人类哺乳动物ApoE基因座；哺乳动物、人类或非人类哺乳动物干扰白细胞素-2受体γ基因座；哺乳动物、人类或非人类哺乳动物Rag2基因座和/或Rag2/Rag1基因座)中的一种或多种，使得编码的ApoE蛋白或干扰白细胞素-2受体γ蛋白或Rag1蛋白或Rag2蛋白或Rag1和Rag2蛋白的组合的活性和/或水平减小。在其它实施方案中，所述ApoE蛋白、所述干扰白细胞素-2受体γ蛋白、所述Rag1蛋白或所述Rag2蛋白或所述Rag1蛋白和所述Rag2蛋白的组合的活性不存在。

“减小”意味着在目标基因座处编码的基因/蛋白的水平或活性的任何程度的减小。例如，活性减小可包括(1)当与适当的对照物相比较时给定蛋白(即，ApoE、干扰白细胞素-2受体γ、Rag2、Rag2或Rag1和Rag2的组合)的总水平或活性统计上显著减小，包括例如0.5％、1％、5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、120％或更大的水平或活性减小。测定ApoE、干扰白细胞素-2受体γ、Rag1和Rag2中的任一种的浓度和/或活性减小的方法在本领域中已知。

在其它实施方案中，哺乳动物、人类或非人类哺乳动物ApoE基因座，哺乳动物、人类或非人类哺乳动物干扰白细胞素-2受体γ基因座，哺乳动物、人类或非人类哺乳动物Rag2基因座，哺乳动物、人类或非人类哺乳动物Rag1基因座和/或哺乳动物、人类或非人类哺乳动物Rag2/Rag1基因座中的一种或多种包括如下修饰，其使得编码的ApoE多肽、干扰白细胞素-2受体γ多肽、Rag2多肽、Rag1多肽或Rag1多肽和Rag2多肽两者的活性和/或水平增加。“增加”意味着在目标基因座处编码的基因/多肽的水平或活性的任何程度的增加。例如，活性增加可包括(1)当与适当的对照物相比较时给定蛋白(即，ApoE、干扰白细胞素-2受体γ、Rag1、Rag2或Rag1和Rag2)的总水平或活性统计上显著增加，包括例如0.5％、1％、5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、120％或更大的水平或活性增加。测定ApoE、Rag1、Rag2和干扰白细胞素-2受体γ蛋白中的任一种的浓度和/或活性增加的方法在本领域中已知。

对哺乳动物、人类或非人类哺乳动物ApoE基因座，哺乳动物、人类或非人类哺乳动物干扰白细胞素-2受体γ基因座，哺乳动物、人类或非人类哺乳动物Rag2基因座，哺乳动物、人类或非人类哺乳动物Rag1基因座和/或哺乳动物、人类或非人类哺乳动物Rag2/Rag1基因座的基因修饰可包括在所述基因组基因座处缺失内源核酸序列、在所述基因组基因座处插入外源核酸或其组合。所述缺失和/或插入可在如在本文中的其它地方论述的给定基因座内的任何地方发生。

本文提供的其它实施方案包括通过用来自另一生物体的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应同源或直系同源部分替换ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分修饰哺乳动物、人类或非人类哺乳动物ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应同源或直系同源部分。

在其它实施方案中，哺乳动物、人类或非人类哺乳动物ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座中的一种或多种的修饰通过用跨其全长与被替换的ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分共有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的插入多核苷酸取代ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分进行。

给定插入的多核苷酸和/或基因座的相应缺失区可为编码区、内含子、外显子、未转译区、调控区、启动子或增强子或其任何组合或其任何部分。此外，例如给定插入的多核苷酸和/或基因座的相应缺失区可具有任何所要长度，包括例如10-100核苷酸长度、100-500核苷酸长度、500-1kb核苷酸长度、1kb-1.5kb核苷酸长度、1.5kb-2kb核苷酸长度、2kb-2.5kb核苷酸长度、2.5kb-3kb核苷酸长度、3kb-5kb核苷酸长度、5kb-8kb核苷酸长度、8kb-10kb核苷酸长度或更长。在其它情况下，所述插入或替换的尺寸为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb、约350kb-约400kb、约400kb-约800kb、约800kb-1Mb、约300kb-约400kb、约400kb-约500kb、约500kb-1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb、约2.5Mb-约2.8Mb、约2.8Mb-约3Mb。在其它实施方案中，给定插入的多核苷酸和/或基因座的相应缺失区为至少100、200、300、400、500、600、700、800或900个核苷酸或至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb或更长。在其它实施方案中，给定插入的多核苷酸和/或基因座的相应缺失区为至少10kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb、至少200kb、至少250kb或至少300kb或更长。

所述给定插入的多核苷酸可来自任何生物体，包括例如啮齿动物、非大鼠啮齿动物、大鼠、小鼠、仓鼠、哺乳动物、非人类哺乳动物、真核生物、非大鼠真核生物、人类、农业动物或家养动物。

如在本文中更详细地论述，提供各种方法以产生任何目标基因座的靶向修饰，包括例如在ApoE基因座、干扰白细胞素-2受体γ(Il2rg)基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座中的靶向修饰。进一步提供基因修饰的非人类动物、基因修饰的非人类哺乳动物、基因修饰的非大鼠真核生物、基因修饰的非多潜能细胞或基因修饰的多潜能细胞(例如，多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞或人类iPS细胞)，其包括在所述干扰白细胞素-2受体γ基因座处、在所述ApoE基因座处、在所述Rag2基因座处、在所述Rag1基因座处和/或在所述Rag2/Rag1基因座处的缺失、插入、替换和/或其任何组合。这样的基因修饰(包括引起靶基因座的活性的缺乏、减小、增加或调整的那些基因修饰)且还能够经由种系传递。在特定的实施方案中，所述基因修饰引起所要靶基因座的敲除。例如，这样的非人类动物在如本文中的其它部分中论述的多种实验系统中得到应用。

例如，ApoE(脱脂蛋白E)敲除提供研究包括但不限于斑块形成、转录改变(全基因组鸟枪测序(RNA-Seq)和离体功能的内皮功能的动物模型。ApoE为重要的运输分子和可运输例如胆固醇的脂质穿过血流。ApoE还可在神经系统中起作用，例如以从脑中廓清β-淀粉样蛋白。在ApoE中的修饰已经在包括例如动脉粥样硬化、高脂血症和阿茲海默氏病的各种病状中牵涉到。ApoE敲除动物显示出脂蛋白自血液的廓清受损并发展成动脉粥样硬化。因此，ApoE敲除动物提供研究例如内皮功能、斑块形成、转录改变(RNA-Seq)、高脂血症、动脉粥样硬化和阿茲海默氏病的病状和/或过程的模型。测量ApoE活性的测定在本领域中已知。例如，ApoE活性的减小可通过通过免疫测定法、例如通过ELISA或通过免疫印迹技术测定在从受试者中获得的血样中ApoE水平的减小来测量。然而，大型的大鼠促进所有这些测定并改进资料的质量。

RAG1(重组激活基因1)和RAG2(重组激活基因2)为具有VDJ重组活性的多亚基复合体的一部分且在淋巴细胞中的免疫球蛋白和T细胞受体基因的重排和重组中起重要作用的酶。RAG1和RAG2诱导双链DNA裂解以促进T细胞受体和B细胞受体(即，免疫球蛋白)基因的片段的重组和连接。敲除RAG1和/或RAG2造成在动物中B细胞和T细胞损失，引起严重的免疫缺陷。RAG1和/或RAG2敲除动物例如在异种移植(即，在大鼠中的人类细胞异种移植)、癌症、疫苗研发、自身免疫疾病、传染性疾病和移植物抗宿主疾病(GVHD)的研究中得到应用。测量RAG1和/或RAG2活性的各种测定在本领域中已知且包括例如测量组合效率或测定在受试者中B细胞和/或T细胞的存在与否。

IL-2受体(IL-2R)在某些免疫细胞的表面上表达且结合细胞因子干扰白细胞素-2(IL-2)。IL-2R为包含至少三个单独的亚基链的膜内在蛋白，所述亚基链包括α链(IL-2Ra、CD25)、β链(IL-2Rb、CD122)和γ链(IL2-Rg，CD132)。IL-2受体γ(也称作IL2r-γ或Il2Rg)链为包括例如用于IL-2、IL-4、IL-7、IL-9、IL-15和IL-21的受体的各种细胞因子受体共有的常见γ链。IL-2Rg包含在细胞的细胞外表面上的胞外域，其促进配体、跨膜域和细胞内结构域的结合，其可与各种分子相互作用以诱导细胞内信号转导途径。Il2rg基因在哺乳动物中的X染色体上见到且在人类的γ链基因中的某些突变可导致以明显T细胞缺陷为特征的人类X连接的严重联合免疫缺陷(XSCID)。另外，γ链胞胞外结构域可自跨膜受体脱落并作为可溶性γ链受体释放。可溶性γ链受体可在受试者的血液中检测到且可起到调控细胞因子信号的作用。

在一些实施方案中，所述非人类IL-2Rg链用人类IL2-Rg链替换，使得基因修饰的动物表达全人IL-2Rg链。在其它情况下，可能有用的是用人类IL-2Rg链的胞外域仅替换非人类IL-2Rg链的胞外域。在这些情况下，在非人类中表达的所得人源化IL-2Rg链包含人类胞外域，分子的剩余部分来自天然生物体。

可使用IL-2Rg的全长人源化，因为具有该修饰基因座的非人类哺乳动物将生成人类IL-2Rg。这将允许用对人类IL-2Rg具有特异性的抗体检测在非人类哺乳动物中的人类IL-2Rg。外人源化(即，用IL-2Rg的人类胞胞外结构域替换非人类哺乳动物的IL-2Rg的胞胞外结构域)将产生将结合IL2-Rg的人类配体的IL-2Rg多肽，但是因为细胞质域仍然来自非人类哺乳动物，所以外人源化形式的IL-2Rg也将与非人类哺乳动物信号机构(machinery)相互作用。

2.修饰靶基因座

A.靶向载体并插入核酸

i.插入核酸

本文使用的“插入核酸”包含希望在靶基因座处整合的DNA的片段。在一个实施方案中，所述插入核酸包含一种或多种目标多核苷酸。在其它实施方案中，所述插入核酸可包含一种或多种表达盒。给定的表达盒可包含目标多核苷酸、编码选择标记和/或报道基因的多核苷酸以及影响表达的各种调控组分。可包含在所述插入核酸内的目标多核苷酸、选择标记和报道基因的非限制性实例在本文中的其它地方详细地论述。

在特定的实施方案中，所述插入核酸可包含来自大鼠的核酸，其可包含基因组DNA的片段、cDNA、调控区或其任何部分或组合。在其它实施方案中，所述插入核酸可包括来自真核生物、非大鼠真核生物、哺乳动物、人类、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、人类、大鼠、小鼠、仓鼠、兔、猪、牛、鹿、绵羊、山羊、小鸡、猫、狗、白鼬、灵长类动物(例如，狨猴、恒河猴)、家养哺乳动物或农业哺乳动物或任何其它目标生物体的核酸。如在本文中更详细地概述，在各种方法和组合物中采用的插入核酸可引起目标靶基因座的“人源化”。

在一个实施方案中，所述插入核酸包含内源基因的至少一个外显子的敲入等位基因。在一个实施方案中，所述插入核酸包含整体内源基因的敲入等位基因(即，“基因互换敲入”)。

在一个实施方案中，所述插入核酸包含调控元件，包括例如启动子、增强子或转录阻遏子-结合元件。

在其它实施方案中，所述插入核酸包含条件性等位基因。在一个实施方案中，所述条件性等位基因为多官能等位基因，如在US 2011/0104799中所述，所述专利的全部内容以引用的方式并入本文中。在特定的实施方案中，所述条件性等位基因包含：(a)相对于靶基因的转录以有义取向的起动序列和以有义或反义取向的药物选择盒；(b)以反义取向的目标核苷酸序列(NSI)和倒转条件模块(conditional by inversion module)(COIN，其利用外显子-断裂内含子和可倒转的基因诱捕样模块；参见，例如US 2011/0104799，其全部内容以引用的方式并入本文中)；和(c)在暴露于第一重组酶后重组以形成条件性等位基因的可重组单元，所述条件性等位基因(i)缺乏起动序列和DSC，和(ii)含有以有义取向的NSI和以反义取向的COIN。

所述插入核酸为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

在一个实施方案中，所述插入核酸包含例如约1kb-约200kb、约2kb-约20kb或约0.5kb-约3Mb的真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞或非人类哺乳动物细胞基因组DNA序列的缺失。在一个实施方案中，所述基因组DNA序列的缺失程度大于5'同源臂和3'同源臂的总长度。在一个实施方案中，所述基因组DNA序列的缺失程度为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约50kb-约60kb、约60kb-约70kb、约70kb-约80kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约110kb-约120kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、约190kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb、约350kb-约400kb、约400kb-约800kb、约800kb-1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb、约2.5Mb-约2.8Mb、约2.8Mb-约3Mb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb。

在一个实施方案中，所述插入核酸包含插入同源或直系同源人类核酸序列或用其替换真核、非大鼠真核、哺乳动物、人类或非人类哺乳动物核酸序列。在一个实施方案中，所述插入核酸包含在包含相应DNA序列的内源基因座处插入同源或直系同源人类核酸序列或用其替换DNA序列。

在一个实施方案中，所述基因修饰为添加核酸序列。在一个实施方案中，所述添加的核苷酸序列为5kb-200kb。

在一个实施方案中，所述插入核酸包含在编码序列中的基因修饰。在一个实施方案中，所述基因修饰包括编码序列的缺失突变。在一个实施方案中，所述基因修饰包括两种内源编码序列的融合。

在一个实施方案中，所述插入核酸包含插入同源或直系同源人类核酸序列或用其替换真核、非大鼠真核、哺乳动物、人类或非人类哺乳动物核酸序列。在一个实施方案中，所述插入核酸包含在包含相应大鼠DNA序列的内源大鼠基因座处插入同源或直系同源人类核酸序列或用其替换大鼠DNA序列。

在一个实施方案中，所述基因修饰包括非蛋白编码序列的缺失，但不包括蛋白编码序列的缺失。在一个实施方案中，所述非蛋白编码序列的缺失包括调控元件的缺失。在一个实施方案中，所述基因修饰包括启动子的缺失。在一个实施方案中，所述基因修饰包括启动子或调控元件的添加。在一个实施方案中，所述基因修饰包括启动子或调控元件的替换。

在一个实施方案中，所述靶向载体的核酸序列可包含在整合到基因组中时将生成哺乳动物、人类或非人类哺乳动物ApoE基因座的区域的基因修饰的多核苷酸，其中在ApoE基因座处的基因修饰引起ApoE活性减小、ApoE活性增加或ApoE活性调整。在一个实施方案中，产生ApoE敲除(“无效等位基因)。

在一个实施方案中，所述靶向载体的核酸序列可包含在整合到基因组中时将生成哺乳动物、人类细胞或非人类哺乳动物干扰白细胞素-2受体基因座的区域的基因修饰的多核苷酸，其中在所述干扰白细胞素-2受体基因座处的基因修饰引起干扰白细胞素-2受体活性减小。在一个实施方案中，产生干扰白细胞素-2受体敲除(“无效等位基因”)。

在其它实施方案中，所述插入核酸引起用来自另一生物体的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应同源或直系同源部分替换哺乳动物、人类细胞或非人类哺乳动物ApoE基因座、干扰白细胞素-2受体γ基因座和/或Rag2基因座和/或Rag1基因座和/或Rag2/Rag1基因座的一部分。

在其它实施方案中，所述核酸序列包含跨其全长与被替换的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分共有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的多核苷酸。

给定插入的多核苷酸和/或哺乳动物、人类细胞或非人类哺乳动物基因座的相应替换区可为编码区、内含子、外显子、未转译区、调控区、启动子或增强子或其任何组合。此外，给定插入的多核苷酸和/或哺乳动物、人类细胞或非人类哺乳动物基因座的缺失区可具有任何所要长度，包括例如10-100核苷酸长度、100-500核苷酸长度、500-1kb核苷酸长度、1Kb-1.5kb核苷酸长度、1.5kb-2kb核苷酸长度、2kb-2.5kb核苷酸长度、2.5kb-3kb核苷酸长度、3kb-5kb核苷酸长度、5kb-8kb核苷酸长度、8kb-10kb核苷酸长度或更长。在其它情况下，所述插入或替换的尺寸为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb、约350kb-约400kb、约400kb-约800kb、约800kb-1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb、约2.5Mb-约2.8Mb、约2.8Mb-约3Mb。在其它实施方案中，给定插入的多核苷酸和/或哺乳动物、人类细胞或非人类哺乳动物基因座的缺失区为至少100、200、300、400、500、600、700、800或900个核苷酸或至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb或更长。

在一个实施方案中，所述启动子为组成性活性启动子。

在一个实施方案中，所述启动子为可诱导的启动子。在一个实施方案中，所述可诱导的启动子为化学调控启动子。在一个实施方案中，所述化学调控启动子为醇调控启动子。在一个实施方案中，所述醇调控启动子为乙醇脱氢酶(alcA)基因启动子。在一个实施方案中，所述化学调控启动子为四环素调控启动子。在一个实施方案中，所述四环素调控启动子为四环素反应启动子。在一个实施方案中，所述四环素调控启动子为四环素操纵子序列(tetO)。在一个实施方案中，所述四环素调控启动子为tet-On启动子。在一个实施方案中，所述四环素调控启动子为tet-Off启动子。在一个实施方案中，所述化学调控启动子为类固醇调控启动子。在一个实施方案中，所述类固醇调控启动子为大鼠糖皮质激素受体的启动子。在一个实施方案中，所述类固醇调控启动子为雌激素受体的启动子。在一个实施方案中，所述类固醇调控启动子为蜕皮激素受体的启动子。在一个实施方案中，所述化学调控启动子为金属调控启动子。在一个实施方案中，所述金属调控启动子为金属蛋白质启动子。在一个实施方案中，所述可诱导的启动子为物理调控启动子。在一个实施方案中，所述物理调控启动子为温度调控启动子。在一个实施方案中，所述温度调控启动子为热休克启动子。在一个实施方案中，所述物理调控启动子为光调控启动子。在一个实施方案中，所述光调控启动子为光可诱导的启动子。在一个实施方案中，所光调控启动子为光可阻遏的启动子。

在一个实施方案中，所述启动子为组织特异性启动子。在一个实施方案中，所述启动子为神经元特异性启动子。在一个实施方案中，所述启动子为神经胶质特异性启动子。在一个实施方案中，所述启动子为肌细胞特异性启动子。在一个实施方案中，所述启动子为心脏细胞特异性启动子。在一个实施方案中，所述启动子为肾细胞特异性启动子。在一个实施方案中，所述启动子为骨细胞特异性启动子。在一个实施方案中，所述启动子为内皮细胞特异性启动子。在一个实施方案中，所述启动子为免疫细胞特异性启动子。在一个实施方案中，所述免疫细胞启动子为B细胞启动子。在一个实施方案中，所述免疫细胞启动子为T细胞启动子。

在一个实施方案中，所述启动子为发育调控启动子。在一个实施方案中，所述发育调控启动子仅在胚胎发育阶段期间具有活性。在一个实施方案中，所述发育调控启动子仅在成人细胞中具有活性。

在特定的实施方案中，所述启动子可基于细胞类型选择。因此，各种启动子在真核细胞、非大鼠真核细胞、哺乳动物细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞中得到应用。

在一些实施方案中，所述插入核酸包括侧接有位点特异性重组靶序列的核酸。已经认识到，虽然整个插入核酸可由这样的位点特异性重组靶序列侧接，但是在所述插入核酸内的任何区或单个目标多核苷酸也可由这样的位点侧接。所述位点特异性重组酶可通过包括将重组酶多肽引入细胞中或通过将编码位点特异性重组酶的多核苷酸引入宿主细胞中的任何方法引入细胞中。编码位点特异性重组酶的多核苷酸可定位在插入核酸内或在单独的多核苷酸内。所述位点特异性重组酶可操作性连接在细胞中具有活性的启动子，包括例如可诱导的启动子、与细胞内源的启动子、与细胞异源的启动子、细胞特异性启动子、组织特异性启动子或发育阶段特异性启动子。可侧接插入核酸或在插入核酸中的任何目标多核苷酸的位点特异性重组靶序列可包括但不限于loxP、lox511、lox2272、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、attp、att、FRT、rox和其组合。

在一些实施方案中，所述位点特异性重组部位侧接在所述插入核酸内包含的编码选择标记和/或报道基因的多核苷酸。在这样的情况下，在靶基因座处整合插入核酸之后，可除去在位点特异性重组位点之间的序列。

在一个实施方案中，所述插入核酸包含编码选择标记的多核苷酸。所述选择标记可包含在选择盒中。这样的选择标记包括但不限于新霉素磷酸转移酶(neo^r)、潮霉素B磷酸转移酶(hyg^r)、嘌呤霉素-N-乙酰基转移酶(puro^r)、杀稻瘟菌素S脱氨酶(bsr^r)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)或单纯疱疹病毒胸苷激酶(HSV-k)或其组合。在一个实施方案中，编码所述选择标记的所述多核苷酸操作性连接在细胞、大鼠细胞、多潜能大鼠细胞、ES大鼠细胞、真核细胞、非大鼠真核细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、哺乳动物细胞、非人类哺乳动物细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞中具有活性的启动子。在将目标多核苷酸连续铺装到靶基因座中时，所述选择标记可包含用于核酸酶试剂的识别位点，如上概述。在一个实施方案中，编码所述选择标记的所述多核苷酸侧接有位点特异性重组靶序列。

所述插入核酸可进一步包含操作性连接启动子的报道基因，其中编码报道基因蛋白的所述报道基因选自或包含LacZ、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、增强的黄色荧光蛋白(eYFP)、Emerald、增强的绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶和/或其组合。这样的报道基因可操作性连接在细胞中具有活性的启动子。这样的启动子可为可诱导的启动子、与报道基因或细胞内源的启动子、与报道基因或细胞异源的启动子、细胞特异性启动子、组织特异性启动子或发育阶段特异性启动子。

在一个实施方案中，核酸插入物可包括包含编码在神经系统、骨骼系统、消化系统、循环系统、肌肉系统、呼吸系统、心血管系统、淋巴系统、内分泌系统、泌尿系统、生殖系统或其组合中表达的蛋白的基因组基因座的哺乳动物核酸。在一个实施方案中，所述哺乳动物核酸包含编码在骨髓或源自骨髓的细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述核酸包含编码在脾细胞中表达的蛋白质的基因组基因座。

在一个实施方案中，所述哺乳动物核酸包含编码在神经系统、骨骼系统、消化系统、循环系统、肌肉系统、呼吸系统、心血管系统、淋巴系统、内分泌系统、泌尿系统、生殖系统或其组合中表达的蛋白质的基因组基因座。在一个实施方案中，所述哺乳动物核酸包含编码在骨髓或源自骨髓的细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述核酸包含编码在脾细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述基因组基因座包含小鼠基因组DNA序列、大鼠基因组DNA序列、真核的基因组DNA序列、非大鼠真核基因组DNA序列、哺乳动物基因组DNA序列、人类基因组DNA序列或非人类DNA序列哺乳动物或其组合。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和大鼠基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠、小鼠和人类基因组DNA序列。

在一个实施方案中，所述基因组基因座包含小鼠基因组DNA序列、大鼠基因组DNA序列、仓鼠基因组DNA序列、人类基因组DNA序列、真核基因组DNA序列、非大鼠真核基因组DNA序列、哺乳动物基因组DNA序列或非人类DNA序列哺乳动物或其组合。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和大鼠基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠、小鼠和人类基因组DNA序列。

在一个实施方案中，所述基因修饰包含人类基因的至少一种人类疾病等位基因。在一个实施方案中，所述人类疾病为神经病。在一个实施方案中，所述人类疾病为心血管疾病。在一个实施方案中，所述人类疾病为肾病。在一个实施方案中，所述人类疾病为肌肉疾病。在一个实施方案中，所述人类疾病为血液病。在一个实施方案中，所述人类疾病为癌症。在一个实施方案中，所述人类疾病为免疫系统疾病。

在一个实施方案中，所述人类疾病等位基因为显性等位基因。在一个实施方案中，所述人类疾病等位基因为隐性等位基因。在一个实施方案中，所述人类疾病等位基因包括单一核苷酸多态性(SNP)等位基因。

在一个实施方案中，所述基因修饰生成具有改变的结合特性、改变的定位、改变的表达和/或改变的表达模式的突变体形式的蛋白质。

在一个实施方案中，所述插入核酸包含选择盒。在一个实施方案中，所述选择盒包含编码选择性标记的核酸序列，其中所述核酸序列操作性连接在大鼠ES细胞中具有活性的启动子。在一个实施方案中，所述选择性标记选自或包含潮霉素抗性基因或新霉素抗性基因。

在一个实施方案中，所述核酸包含编码在B细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述核酸包含编码在未成熟的B细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述核酸包含编码在成熟B细胞中表达的蛋白质的基因组基因座。

在一个实施方案中，所述插入核酸包含调控元件。在一个实施方案中，所述调控元件为启动子。在一个实施方案中，所述调控元件为增强子。在一个实施方案中，所述调控元件为转录阻遏子-结合元件。

在一个实施方案中，所述基因修饰包括非蛋白编码序列的缺失，但不包括蛋白编码序列的缺失。在一个实施方案中，所述非蛋白编码序列的缺失包括调控元件的缺失。在一个实施方案中，所述基因修饰包括调控元件的缺失。在一个实施方案中，所述基因修饰包括启动子或调控元件的添加。在一个实施方案中，所述基因修饰包括启动子或调控元件的替换。

ii.表达盒

本文提供包含在本文中提供的靶向基因组整合系统中采用的各种组分(即，核酸酶试剂、识别位点、插入核酸、目标多核苷酸、靶向载体、选择标记及其它组分中的任一种或任何组合)的多核苷酸或核酸分子。

术语“多核苷酸”、“多核苷酸序列”、“核苷酸序列”和“核苷酸片段”可在本文中互换使用。这些术语涵盖核苷酸序列等。多核苷酸可为任选含有合成、非天然或改变的核苷酸碱基的单链或双链的RNA或DNA的聚合物。以DNA的聚合物形式的多核苷酸可由cDNA、基因组DNA、合成DNA或其混合物的一种或多种片段构成。多核苷酸可包含脱氧核糖核苷酸和核糖核苷酸，其包括天然存在的分子和合成类似物两者或这些的任何组合。本文提供的多核苷酸还涵盖所有形式的序列，其包括但不限于单链形式、双链形式、发夹、茎和环结构等。

进一步提供包含靶向基因组整合系统的各种组分的重组多核苷酸。术语“重组多核苷酸”和“重组DNA”构建体可在本文中互换使用。重组构建体包含例如实际上并未一同发现的调控序列和编码序列的核酸序列的人造和异源组合。在其它实施方案中，重组构建体可包含源自不同来源的调控序列和编码序列，或源自相同来源但以与实际上发现所不同的方式配置的调控序列和编码序列。这一构建体可本身使用或可结合载体使用。如果使用载体，则载体的选择取决于如本领域的技术人员众所周知的用以转化宿主细胞的方法。例如，可使用质粒载体。还提供了用以成功转化、选择和繁殖包含本文提供的分离的核酸片段中的任一种的宿主细胞需要的基因元件。筛选可尤其通过DNA的Southern分析、mRNA表达的Northern分析、蛋白表达的免疫印迹分析或表型分析实现。

在特定的实施方案中，本文所述的靶向基因组整合系统的组分中的一种或多种可提供在表达盒中以便在原核细胞、真核细胞、非大鼠真核细胞、细菌、酵母菌细胞或哺乳动物细胞或其它生物体或目标细胞类型中表达。所述盒可以包括操作性连接本文提供的多核苷酸的5'调控序列和3'调控序列。“操作性连接”包括其中组分以其预定方式操作性连接起作用的关系。例如，在目标多核苷酸和调控序列(即，启动子)之间的操作性键为允许表达目标多核苷酸的功能连接。“操作性连接元件”可邻接或不邻接。当用以提到两种蛋白编码区的连接时，操作性连接是指编码区在同一阅读框中。在另一情况下，编码蛋白质的核酸序列可以操作性连接于调控序列(例如，启动子、增强子、沉默子序列等)以保持恰当的转录调控。在一种情况下，免疫球蛋白可变区(或V(D)J片段)的核酸序列可操作性连接到免疫球蛋白恒定区的核酸序列，以允许在序列之间恰当重组到免疫球蛋白重链或轻链序列。

所述盒可另外含有将共同引入生物体中的至少一种另外的目标多核苷酸。可选地，所述另外的目标多核苷酸可提供在多个表达盒上。这一表达盒提供有用于插入重组多核苷酸以处于调控区的转录调控下的多个限制位点和/或重组位点。所述表达盒可另外含有选择标记基因。

所述表达盒可包括在5'-3'转录方向上的，在哺乳动物细胞或目标宿主细胞中起作用的转录和转译起动区(即，启动子)、本文提供的重组多核苷酸，以及转录和转译终止区(即，终止区)。所述调控区(即，启动子、转录调控区和转译终止区)和/或本文提供的多核苷酸对于宿主细胞可为天然/类似的或彼此类似。可选地，所述调控区和/或本文提供的多核苷酸可与宿主细胞异源或彼此异源。例如，操作性连接异源多核苷酸的启动子来自与得到多核苷酸的物种不同的物种，或者如果来自相同/类似的物种，一者或两者自其原始形式和/或基因组基因座实质性修饰，或者启动子不是操作性连接的多核苷酸的天然启动子。可选地，本文提供的调控区和/或重组多核苷酸可以是完全合成的。

所述终止区关于转录起动区可为天然的，关于操作性连接的重组多核苷酸可为天然的，关于宿主细胞可为天然的，或者关于启动子、重组多核苷酸、宿主细胞或其任何组合，可源自另一来源(即，外来的或异源性)。

在制备表达盒的过程中，可操控各种DNA片段，从而提供以恰当取向的DNA序列。为此，可采用接头或连接子以接合DNA片段或者可涉及其它操控以提供适宜的限制位点、除去多余的DNA、除去限制位点等。为此目的，可涉及体外诱变、引物修复、限制、退火、再取代，例如转换和颠换。

多种启动子可用于本文提供的表达盒中。启动子可基于所要的结果来选择。应该认识到不同的应用可通过在表达盒中使用不同的启动子来增强，从而调整目标多核苷酸的表达的定时、定位和/或水平。如果需要，则这样的表达构建体还可含有启动子调控区(例如，赋予可诱导的、组成性的、环境或发育调控的或细胞或组织特异性/选择性的表达)、转录起动开始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或多聚腺苷酸化信号。

含有本文提供的多核苷酸的表达盒还可包含用于选择转化细胞的选择标记基因。利用可选择的标记基因来选择转化细胞或组织。

在适当的情况下，可优化在所述方法和组合物(即，目标多核苷酸、核酸酶试剂等)中采用的序列，以便增加在细胞中的表达。也就是说，所述基因可使用在给定目标细胞中优选的密码子合成以便改进表达，所述密码子包括例如哺乳动物优选的密码子、人类优选的密码子、啮齿动物优选的密码子、非大鼠啮齿动物优选的密码子、小鼠优选的密码子、大鼠优选的密码子、仓鼠优选的密码子等。

本文提供的各种方法和组合物可采用选择标记。各种选择标记可用于本文公开的方法和组合物中。所述选择标记可例如给予对例如G418、潮霉素、杀稻瘟菌素、新霉素或嘌呤霉素的抗生素的抵抗性。这样的选择标记包括新霉素磷酸转移酶(neo^r)、潮霉素B磷酸转移酶(hyg^r)、嘌呤霉素-N-乙酰基转移酶(puro^r)和杀稻瘟菌素S脱氨酶(bsr^r)。在其它实施方案中，所述选择标记操作性连接可诱导的启动子且所述选择标记的表达对于细胞具有毒性。这样的选择标记的非限制性实例包括黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)、次黄嘌呤-鸟嘌呤转磷酸核糖基酶(HGPRT)或单纯疱疹病毒胸苷激酶(HSV-TK)。编码所述选择标记的所述多核苷酸操作性连接在细胞中具有活性的启动子。

iii.靶向载体

采用靶向载体以将插入核酸引入大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸的靶基因座中。所述靶向载体包含所述插入核酸且进一步包含5'同源臂和3'同源臂，其侧接所述插入核酸。侧接所述插入核酸的同源臂对应于在大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸的靶基因座内的区域。为了便于提及，在靶基因组基因座内的相应同源基因组区在本文中称为“靶位点”。例如，靶向载体可包含由与第一靶位点和第二靶位点互补的第一同源臂和第二同源臂侧接的第一插入核酸。因而，所述靶向载体由此有助于经由在细胞的基因组内的同源臂和互补靶位点之间发生的同源重组事件将插入核酸整合到大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸的靶基因座中。

在一个实施方案中，所述大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸的靶基因座包含与5'同源臂互补的第一核酸序列和与3'同源臂互补的第二核酸序列。在一个实施方案中，所述第一核酸序列和所述第二核酸序列相隔至少5kb。在另一实施方案中，所述第一核酸序列和所述第二核酸序列相隔至少5kb，但小于200kb。在一个实施方案中，所述第一核酸序列和所述第二核酸序列相隔至少10kb。在一个实施方案中，所述第一核酸序列和所述第二核酸序列相隔至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb或至少200kb。在更进一步的实施方案中，所述第一核酸序列和所述第二核酸序列相隔至少5kb，但小于10kb；至少5kb，但小于3Mb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1.5Mb，但小于约2Mb；至少约1Mb，但小于约1.5Mb；至少约2Mb，但小于2.5Mb；至少约2.5Mb，但小于3Mb；或至少约2Mb，但小于约3Mb。

所述靶向载体的同源臂可具有足以促进与相应靶位点的同源重组事件的任何长度，包括例如至少5-10kb、5-15kb、10-20kb、20-30kb、30-40kb、40-50kb、50-60kb、60-70kb、70-80kb、80-90kb、90-100kb、100-110kb、110-120kb、120-130kb、130-140kb、140-150kb、150-160kb、160-170kb、170-180kb、180-190kb、190-200kb长或更长。如下文进一步详细概述，大靶向载体可采用更大长度的靶向臂。在一个特定的实施方案中，5'同源臂和3'同源臂的总和为至少10kb，或5'同源臂和3'同源臂的总和为至少约16kb-约100kb或约30kb-约100kb。在其它实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和的尺寸为约10kb-约150kb、约10kb-约100kb、约10kb-约75kb、约20kb-约150kb、约20kb-约100kb、约20kb-约75kb、约30kb-约150kb、约30kb-约100kb、约30kb-约75kb、约40kb-约150kb、约40kb-约100kb、约40kb-约75kb、约50kb-约150kb、约50kb-约100kb、或约50kb-约75kb、约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-约150kb。在一个实施方案中，所述缺失的尺寸与所述LTVEC的5'同源臂和3'同源臂的总和的尺寸相同或类似。

在一个实施方案中，所述目标基因组基因座包含(i)与所述5'同源臂同源的5'靶序列；和(ii)与所述3'同源臂同源的3'靶序列。在一个实施方案中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。在更进一步的实施方案中，所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少5kb，但小于3Mb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1.5Mb，但小于约2Mb；至少约1Mb，但小于约1.5Mb；至少约2Mb，但小于2.5Mb；至少约2.5Mb，但小于约3Mb；或至少约2Mb，但小于约3Mb。

当采用核酸酶试剂时，对应于靶向载体的5'同源臂和3'同源臂的同源基因组区“足够邻近于”核酸酶靶位点定位以促进在识别位点处切口或双链断裂后在同源基因组区和同源臂之间发生同源重组事件。例如，所述核酸酶靶位点可定位在对应于5'同源臂和3'同源臂的同源基因组区之间的任何地方。在特定的实施方案中，识别位点直接邻近于同源基因组区中的至少一个或两个。

如本文中所用，在两个区彼此共有足够水平的序列同一性时同源臂和靶位点(即，同源基因组区)彼此“互补”，从而充当用于同源重组反应的底物。“同源性”是指DNA序列与相应或“互补”序列相同或共有序列同一性。在给定靶位点和在靶向载体上发现的相应同源臂之间的序列同一性可为允许同源重组发生的任何程度的序列同一性。例如，靶向载体的同源臂(或其片段)与靶位点(或其片段)共有的序列同一性的量可为至少50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性，因此所述序列经历同源重组。此外，在同源臂和互补靶位点之间同源的互补区可具有足以促进在裂解的识别位点处同源重组的任何长度。例如，给定同源臂和/或互补靶位点可包含同源的互补区，所述互补区为至少5-10kb、5-15kb、10-20kb、20-30kb、30-40kb、40-50kb、50-60kb、60-70kb、70-80kb、80-90kb、90-100kb、100-110kb、110-120kb、120-130kb、130-140kb、140-150kb、150-160kb、160-170kb、170-180kb、180-190kb、190-200kb、200kb-300kb长或更长(例如，如在本文中的其它地方描述的LTVEC载体中所述)，因此同源臂与在细胞的基因组内的相应靶位点具有足以进行同源重组的同源性。为了便于提及，同源臂在本文中作为5'同源臂和3'同源臂提到。该术语涉及在靶向载体中同源臂与插入核酸的相对位置。

所述靶向载体的同源臂因此设计成与具有靶向基因座的靶位点互补。因此，所述同源臂可与对细胞为天然的基因座互补，或可选地，它们可与整合到细胞的基因组中的DNA的异源或外源片段的区互补，所述区包括但不限于转基因、表达盒或基因组DNA的异源或外源区。可选地，所述靶向载体的同源臂可与人类人造染色体的区或在适当宿主细胞中包含的任何其它工程化的基因组区互补。更进一步，所述靶向载体的同源臂可与BAC文库、粘粒文库或P1噬菌体文库的区互补或来源于BAC文库、粘粒文库或P1噬菌体文库。因此，在特定的实施方案中，所述靶向载体的同源臂与对给定细胞为天然、异源或外源的大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠基因组基因座互补。在其它实施方案中，所述同源臂与无法使用常规方法靶向的大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠基因组基因座互补，或者可在缺乏由核酸酶试剂诱导的切口或双链断裂的情况下仅不正确地靶向或仅以显著低的效率靶向。在一个实施方案中，所述同源臂来源于合成DNA。

在其它实施方案中，所述5'同源臂和所述3'同源臂与和靶向基因组相同的基因组互补。在一个实施方案中，所述同源臂来自相关基因组，例如，靶向基因组为第一株的大鼠基因组，且靶向臂来自第二株的大鼠基因组，其中第一株与第二株不同。在其它实施方案中，所述同源臂来自相同动物的基因组或来自相同株的基因组，例如靶向基因组为第一株的大鼠基因组，且靶向臂来自来自相同大鼠或来自相同株的大鼠基因组。

所述靶向载体(例如，大靶向载体)还可包含如在本文中的其它地方论述的选择盒或报道基因。所述选择盒可包含编码选择标记的核酸序列，其中所述核酸序列操作性连接到启动子。所述启动子可在目标原核细胞中具有活性和/或在目标真核细胞中具有活性。这样的启动子可为可诱导的启动子、与报道基因或细胞内源的启动子、与报道基因或细胞异源的启动子、细胞特异性启动子、组织特异性启动子或发育阶段特异性启动子。在一个实施方案中，所述选择标记选自或包括新霉素磷酸转移酶(neo^r)、潮霉素B磷酸转移酶(hyg^r)、嘌呤霉素-N-乙酰基转移酶(puro^r)、杀稻瘟菌素S脱氨酶(bsr^r)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)和/或其组合。所述靶向载体的选择标记可由5'同源臂和3'同源臂侧接或发现5'同源臂或3'同源臂。

在一个实施方案中，所述靶向载体(例如，大靶向载体)包含操作性连接启动子的报道基因，其中所述报道基因编码选自由以下蛋白组成的组或包括以下蛋白的报道基因蛋白：LacZ、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、增强的黄色荧光蛋白(EYFP)、Emerald、增强的绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶和/或其组合。这样的报道基因可操作性连接在细胞中具有活性的启动子。这样的启动子可为可诱导的启动子、与报道基因或细胞内源的启动子、与报道基因或细胞异源的启动子、细胞特异性启动子、组织特异性启动子或发育阶段特异性启动子。

在一个实施方案中，合并使用靶向载体(包括例如大靶向载体)与核酸酶试剂产生与仅使用靶向载体相比较增加的靶向效率。在一个实施方案中，当与在仅使用靶向载体时相比较时，在靶向载体结合核酸酶试剂使用时，靶向载体的靶向效率增加至少两倍、至少三倍或至少4倍。

当采用靶向载体时，载体设计可达到允许插入如本文所述的约5kb-约200kb的给定序列的程度。在一个实施方案中，所述插入为约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约50kb-约60kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约110kb-约120kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、或约190kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

当采用靶向载体时，载体设计可达到允许替换如本文所述的约5kb-约200kb或约5kb-约3.0Mb的给定序列的程度。在一个实施方案中，所述替换为约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约50kb-约60kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约110kb-约120kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、约190kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb。

在一个实施方案中，所述靶向载体包含位点特异性重组酶基因。在一个实施方案中，所述位点特异性重组酶基因编码Cre重组酶。在一个实施方案中，所述Cre重组酶基因为Crei，其中两种编码Cre重组酶的外显子被内含子隔开以防止其在原核细胞中表达。

在一个实施方案中，所述Cre重组酶基因进一步包含核定位信号以促进Cre(或任何重组酶或核酸酶试剂)定位到核中(例如，所述基因为NL-Cre基因)。在一个特定的实施方案中，所述Cre重组酶基因进一步包含核定位信号和内含子(例如，NL-Crei)。

在各种实施方案中，表达核酸酶试剂(包括上文论述的Cre或Crei重组酶)的合适启动子选自或包括Prm1、Blimp1、Gata6、Gata4、Igf2、Lhx2、Lhx5和/或Pax3。在一个特定的实施方案中，所述启动子为Gata6或Gata4启动子。各种启动子可来自任何生物体，包括例如啮齿动物如小鼠或大鼠、非大鼠啮齿动物、真核生物、非大鼠真核生物、非人类哺乳动物、哺乳动物、人类或仓鼠。在另一特定的实施方案中，所述启动子为Prm1启动子。在另一特定的实施方案中，所述启动子为大鼠Prm1启动子。在另一特定的实施方案中，所述启动子为小鼠Prm1启动子。在另一特定的实施方案中，所述启动子为Blimp1启动子或其片段，例如，Blimp1启动子的1kb或2kb片段。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其两者的全部内容都以引用的方式并入本文中。

iv.大靶向载体

本文使用的术语“大靶向载体”或“LTVEC”包括如下靶向载体，其包含对应于且来源于大于通常由意欲在细胞中执行同源靶向的其它方法使用的那些的核酸序列的同源臂和/或包含包含大于通常由意欲在细胞中执行同源重组靶向的其它方法使用的那些的核酸序列的插入核酸。例如，所述LTVEC使得可以修饰大基因座，所述大基因组由于其尺寸限制而无法由传统的基于质粒的靶向载体接纳。在特定的实施方案中，所述LTVEC的同源臂和/或插入核酸包含真核细胞或非大鼠真核细胞的基因组序列。所述LTVEC的尺寸太大而无法通过例如southern印迹和广范围(例如，1kb-5kb)PCR的常规测定筛选靶向事件。LTVEC的实例包括但不限于来源于细菌人造染色体(BAC)、人类人造染色体或酵母菌人造染色体(YAC)的载体。LTVEC的非限制性实例及其制造方法例如描述在美国专利号6,586,251、6,596,541、7,105,348和WO 2002/036789(PCT/US01/45375)和US 2013/0137101中，其各自以引用的方式并入本文中。

所述LTVEC可具有任何长度，包括但不限于约20kb-约400kb、约20kb-约30kb、约30kb-40kb、约40kb-约50kb、约50kb-约75kb、约75kb-约100kb、约100kb-125kb、约125kb-约150kb、约150kb-约175kb、约175kb-约200kb、约200kb-约225kb、约225kb-约250kb、约250kb-约275kb、或约275kb-约300kb、约200kb-约300kb、约300kb-约350kb、约350kb-约400kb、约350kb-约550kb。在一个实施方案中，所述LTVEC为约100kb。

在一些实施方案中，所述LTVEC为至少10kb、至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb或至少200kb。

在一些实施方案中，所述LTVEC包含至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb或至少200kb的核酸序列。

在一个实施方案中，所述LTVEC包含约5kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约0.5kb-约30kb、约0.5kb-约40kb、约30kb-约150kb、约0.5kb-约150kb、约30kb-约40kb、约40kb-约50kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、或约190kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb的插入核酸。

在一个实施方案中，所述LTVEC包含至少100kb、至少150kb或至少200kb的核酸序列。

当采用LTVEC时，载体设计可达到允许替换如本文所述的约5kb-约200kb或约5kb-约3Mb的给定序列的程度。在一个实施方案中，所述替换为约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约50kb-约60kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约110kb-约120kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、约190kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb。

在一个实施方案中，所述LTVEC的同源臂来源于BAC文库、粘粒文库或P1噬菌体文库。在其它实施方案中，所述同源臂来源于细胞的靶基因组基因座，且在一些情况下，LTVEC设计用来靶向其的靶基因组基因座无法使用常规方法靶向。在其它实施方案中，所述同源臂来源于合成DNA。

在一个实施方案中，在LTVEC中的5'同源臂和3'同源臂的总和为至少10kb。在其它实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、100kb-约120kb、约120kb-约140kb、约140kb-约160kb、约160kb-约180kb、约180kb-约200kb。在一个实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和为约30kb-约100kb。在其它实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和的尺寸为约10kb-约150kb、约10kb-约100kb、约10kb-约75kb、约20kb-约150kb、约20kb-约100kb、约20kb-约75kb、约30kb-约150kb、约30kb-约100kb、约30kb-约75kb、约40kb-约150kb、约40kb-约100kb、约40kb-约75kb、约50kb-约150kb、约50kb-约100kb、或约50kb-约75kb、约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-约150kb。在一个实施方案中，所述缺失的尺寸与所述LTVEC的5'同源臂和3'同源臂的总和的尺寸相同或类似。

在其它实施方案中，所述5'同源臂为约5kb-约100kb。在一个实施方案中，所述3'同源臂为约5kb-约100kb。在其它实施方案中，所述5'同源臂和所述3'同源臂的总和为约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约50kb-约60kb、约60kb-约70kb、约70kb-约80kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约110kb-约120kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、约190kb-约200kb、或约30kb-约100kb、约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-约150kb。

在一个实施方案中，所述LTVEC包含与由LTVEC同源臂侧接的大鼠核酸序列同源或直系同源的插入核酸。在一个实施方案中，所述插入核酸序列来自除大鼠以外的物种。在一个实施方案中，所述插入核酸序列来自真核生物。在一个实施方案中，与大鼠核酸序列同源或直系同源的插入核酸为哺乳动物核酸。在一个实施方案中，与大鼠核酸序列同源或直系同源的插入核酸为非人类哺乳动物核酸。在一个实施方案中，所述哺乳动物核酸为小鼠核酸。在一个实施方案中，所述哺乳动物核酸为人类核酸。在一个实施方案中，所述哺乳动物核酸为仓鼠核酸。在一个实施方案中，所述插入核酸序列为基因组DNA。在一个实施方案中，所述插入为如上所述的5kb-200kb。

在一个实施方案中，所述LTVEC包含选择盒或报道基因。可采用各种形式的选择盒和报道基因在本文中的其它地方论述。

如在本文中的其它地方描述，所述LTVEC还可与核酸酶试剂组合用于本文提供的方法中，所述核酸酶试剂促进在靶向载体和在多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞的大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸的靶基因座之间的同源重组。

在一个实施方案中，所述大靶向载体(LTVEC)包含位点特异性重组酶基因。在一个实施方案中，所述位点特异性重组酶基因编码Cre重组酶。在一个实施方案中，所述Cre重组酶基因为Crei，其中两种编码Cre重组酶的外显子被内含子隔开以防止其在原核细胞中表达。在一个实施方案中，所述Cre重组酶基因进一步包含核定位信号以促进Cre(或任何重组酶或核酸酶试剂)定位到核中(例如，所述基因为NL-Cre基因)。在一个特定的实施方案中，所述Cre重组酶基因进一步包含核定位信号和内含子(例如，NL-Crei)。

在一个实施方案中，所述LTVEC包含插入核酸，所述插入核酸可生成大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠ApoE基因座、Il2rg基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的区的缺失、添加、替换或其组合，如在本文中的其它部分详细论述。在特定的实施方案中，在ApoE基因座处的基因修饰引起ApoE活性、IL-2Rg活性、Rag2活性、Rag1活性和/或Rag2和Rag1活性减小、增加或调整。在一个实施方案中，产生ApoE敲除和Il2rg敲除、Rag2敲除、Rag1敲除、Rag2/Rag1敲除。如下论述，可采用核酸酶试剂以及任何LTVEC靶向系统以靶向任何目标基因组基因座。

在另一实施方案中，所述基因组在包含至少10kb的核酸序列的大靶向载体(LTVEC)存在下暴露于Cas蛋白和CRISPR RNA。在这样的情况下，在暴露于Cas蛋白、CRISPRRNA和LTVEC之后，修饰基因组以含有至少10kb的核酸序列。在特定的实施方案中，所述LTVEC包含至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb或至少200kb的核酸序列。

v.核酸酶试剂和核酸酶试剂的识别位点

如上文详细概述，核酸酶试剂可在本文公开的方法和组合物中利用以帮助修饰在原核细胞中或在多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞内的靶基因座。这一核酸酶试剂可促进在靶向载体和靶基因座之间的同源重组。在一个实施方案中，所述核酸酶试剂包括核酸内切酶试剂。

本文使用的术语“核酸酶试剂的识别位点”包含在那里因核酸酶试剂诱导切口或双链断裂的DNA序列。核酸酶试剂的识别位点对细胞可为内源(或天然)的或所述识别位点对细胞可为外源的。在特定的实施方案中，所述识别位点对细胞为外源的且由此并不天然存在于细胞的基因组中。在更进一步的实施方案中，所述识别位点对细胞为外源的且对于希望在靶基因组基因座处安置的目标多核苷酸为外源的。在其它实施方案中，所述外源或内源识别位点仅一次存在于宿主细胞的基因组中。在特定的实施方案中，鉴定仅一次存在于基因组内的内源或天然位点。随后可使用这一位点以设计将在内源识别位点处生成切口或双链断裂的核酸酶试剂。

所述识别位点的长度可改变且包括例如长至少4、6、8、10、12、14、16、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70个或更多个核苷酸的识别位点。在一个实施方案中，所述核酸酶试剂的各单体识别至少9个核苷酸的识别位点。在其它实施方案中，所述识别位点为长约9-约12个核苷酸、长约12-约15个核苷酸、长约15-约18个核苷酸或长约18-约21个核苷酸及这样的子范围的任何组合(例如，9-18个核苷酸)。所述识别位点可为回文的，即在一个链上的序列读出在相反方向上在互补链上的序列。应该认识到，给定核酸酶序列可结合所述识别位点且裂解所述结合位点，或可选地，所述核酸酶试剂可结合与所述结合位点不同的序列。此外，术语识别位点包含核酸酶试剂结合位点和切口/裂解位点两者，而不管切口/裂解位点是在核酸酶试剂结合位点内，还是超出核酸酶试剂结合位点。在另一变体中，由核酸酶试剂引起的裂解可在彼此直接相对的核酸位置处发生，以生成平滑末端切割或在其它情况下切口可错列以生成单链突出，也称作“粘性未端”，其可为5'突出或3'突出。

诱导切口或双链断裂到所要识别位点中的任何核酸酶试剂可用于本文公开的方法和组合物中。可采用天然存在或天然的核酸酶试剂，条件是核酸酶试剂在所要识别位点中诱导切口或双链断裂。可选地，可采用修饰或工程化的核酸酶试剂。“工程化核酸试剂”包括由其天然形式工程化(修饰或得到)以在所要识别位点中特定识别并诱导切口或双链断裂的核酸酶。因此，工程化核酸酶试剂可来源于天然、天然存在的核酸酶试剂或者其可人工地产生或合成。所述核酸酶试剂的修饰可为在蛋白质裂解试剂中的仅仅一个氨基酸或在核酸裂解试剂中的仅仅一个核苷酸。在一些实施方案中，所述工程化核酸酶在识别位点中诱导切口或双链断裂，其中所述识别位点不是将已经通过天然(未工程化或未修饰的)核酸酶试剂识别的序列。在识别位点或其它DNA中生成切口或双链断裂在本文中可称为“切割”或“裂解”识别位点或其它DNA。

还提供了例示性识别位点的活性变体和片段。这样的活性变体可包括与给定识别位点至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大的序列同一性，其中所述活性变体保持生物活性且因此能够由核酸酶试剂以序列特异性方式识别并裂解。测量由核酸酶试剂引起的识别位点双链断裂的测定在本领域中已知且通常测量核酸酶切割识别位点的能力。

所述核酸酶试剂的识别位点可安置在靶基因座或靠近靶基因座的任何地方。所述识别位点可定位在基因的编码区内或定位在调控区内，其影响基因的表达。因此，所述核酸酶试剂的识别位点可定位在内含子、外显子、启动子、增强子、调控区或任何非蛋白编码区中。

在一个实施方案中，所述核酸酶试剂为转录激活子样效应因子核酸酶(TALEN)。TAL效应因子核酸酶为可用以在原核或真核生物体的基因组中的特定靶序列处生成双链断裂的一类序列特异性核酸酶。TAL效应因子核酸酶通过将天然或工程化转录激活子样(TAL)效应因子或其功能部分融合到例如FokI的核酸内切酶的催化结构域中而产生。独特的模块化TAL效应因子DNA结合结构域允许以潜在的任何给定DNA识别特异性设计蛋白质。因此，TAL效应因子核酸酶的DNA结合结构域可工程化以识别特异性DNA靶位点，且因此用以在所要靶序列处生成双链断裂。参见WO 2010/079430；Morbitzer等人，(2010)PNAS 10.1073/pnas.1013133107；Scholze和Boch(2010)Virulence 1:428-432；Christian等人，Genetics(2010)186:757-761；Li等人，(2010)Nuc.Acids Res.(2010)doi:10.1093/nar/gkq704；和Miller等人，(2011)Nature Biotechnology 29:143-148，其全部以引用的方式并入本文中。

合适TAL核酸酶的实例及用于制备合适TAL核酸酶的方法例如公开在美国专利申请号2011/0239315 A1、2011/0269234 A1、2011/0145940 A1、2003/0232410 A1、2005/0208489 A1、2005/0026157 A1、2005/0064474 A1、2006/0188987 A1和2006/0063231 A1(其各自以引用的方式并入本文中)。在各种实施方案中，TAL效应因子核酸酶工程化以在例如目标基因组基因座中的靶核酸序列中或靠近所述靶核酸序列切割，其中所述靶核酸序列处于将由靶向载体修饰的序列处或靠近所述序列。适合供本文提供的各种方法和组合物使用的TAL核酸酶包括特定设计成在将通过如本文所述的靶向载体修饰的靶核酸序列处或所述靶核酸序列附近结合的那些TAL核酸酶。

在一个实施方案中，所述TALEN的各单体包含12-25个TAL重复序列，其中各TAL重复序列结合1bp亚基。在一个实施方案中，所述核酸酶试剂为包含操作性连接独立核酸酶的基于TAL重复序列的DNA结合结构域的嵌合蛋白。在一个实施方案中，所述独立核酸酶为FokI核酸内切酶。在一个实施方案中，所述核酸酶试剂包含第一基于TAL重复序列的DNA结合结构域和第二基于TAL重复序列的DNA结合结构域，其中所述第一基于TAL重复序列的DNA结合结构域和所述第二基于TAL重复序列的DNA结合结构域各自操作性连接FokI核酸酶，其中所述第一基于TAL重复序列的DNA结合结构域和所述第二基于TAL重复序列的DNA结合结构域识别由约6bp-约40bp裂解位点间隔的在靶DNA序列的各链中的两个邻接靶DNA序列，且其中所述FokI核酸酶二聚合并在靶序列处生成双链断裂。

在一个实施方案中，所述核酸酶试剂包含第一基于TAL重复序列的DNA结合结构域和第二基于TAL重复序列的DNA结合结构域，其中所述第一基于TAL重复序列的DNA结合结构域和所述第二基于TAL重复序列的DNA结合结构域各自操作性连接FokI核酸酶，其中所述第一基于TAL重复序列的DNA结合结构域和所述第二基于TAL重复序列的DNA结合结构域识别由5bp或6bp裂解位点间隔的在靶DNA序列的各链中的两个邻接靶DNA序列，且其中所述FokI核酸酶二聚合并生成双链断裂。

在本文公开的各种方法和组合物中采用的核酸酶试剂可进一步包含锌指核酸酶(ZFN)。在一个实施方案中，所述ZFN的各单体包含3个或更多个基于锌指的DNA结合结构域，其中各个基于锌指的DNA结合结构域结合3bp亚基。在其它实施方案中，所述ZFN为包含操作性连接独立核酸酶的基于锌指的DNA结合结构域的嵌合蛋白。在一个实施方案中，所述独立核酸内切酶为FokI核酸内切酶。在一个实施方案中，所述核酸酶试剂包含第一ZFN和第二ZFN，其中所述第一ZFN和所述第二ZFN各自操作性连接FokI核酸酶，其中所述第一ZFN和所述第二ZFN识别由约6bp-约40bp裂解位点或约5bp-约6bp裂解位点间隔的在靶DNA序列的各链中的两个邻接靶DNA序列，且其中所述FokI核酸酶二聚合并生成双链断裂。参见例如US20060246567；US20080182332；US20020081614；US20030021776；WO/2002/057308A2；US20130123484；US20100291048；和WO/2011/017293A2，其各自以引用的方式并入本文中。

在本文提供的方法的一个实施方案中，所述核酸酶试剂包含(a)包含融合到FokI核酸内切酶的基于锌指的DNA结合结构域的嵌合蛋白；或(b)包含融合到FokI核酸内切酶的转录激活子样效应因子核酸酶(TALEN)的嵌合蛋白。

在又一实施方案中，所述核酸酶试剂为大范围核酸酶。大范围核酸酶已经基于保守序列基序分成四个家族，所述家族为LAGLIDADG(SEQ ID NO:16)、GIY-YIG、H-N-H和His-Cys box家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HEase因其长识别位点和在其DNA底物中耐受一些序列多态性而值得注意。大范围核酸酶结构域、结构和功能是已知的，参见例如Guhan和Muniyappa(2003)Crit Rev Biochem Mol Biol 38:199-248；Lucas等人，(2001)Nucleic Acids Res 29:960-9；Jurica和Stoddard,(1999)Cell Mol LifeSci 55:1304-26；Stoddard,(2006)Q Rev Biophys 38:49-95；和Moure等人，(2002)NatStruct Biol 9:764。在一些实施例中，使用天然存在的变体和/或工程化衍生物大范围核酸酶。修饰动力学、辅助因子相互作用、表达、最优条件和/或识别位点特异性和筛选活性的方法是已知的，参见例如Epinat等人，(2003)Nucleic Acids Res 31:2952-62；Chevalier等人，(2002)Mol Cell 10:895-905；Gimble等人，(2003)Mol Biol 334:993-1008；Seligman等人，(2002)Nucleic Acids Res 30:3870-9；Sussman等人，(2004)J Mol Biol342:31-41；Rosen等人，(2006)Nucleic Acids Res 34:4791-800；Chames等人，(2005)Nucleic Acids Res 33:e178；Smith等人，(2006)Nucleic Acids Res 34:e149；Gruen等人，(2002)Nucleic Acids Res 30:e29；Chen和Zhao,(2005)Nucleic Acids Res 33:e154；WO2005105989；WO2003078619；WO2006097854；WO2006097853；WO2006097784；和WO2004031346。

任何大范围核酸酶都可在本文中使用，所述大范围核酸酶包括但不限于I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NcIIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII或其任何活性变体或片段。

在一个实施方案中，所述大范围核酸酶识别12-40个碱基对的双链DNA序列。在一个实施方案中，所述大范围核酸酶识别在基因组中的一个完美匹配的靶序列。在一个实施方案中，所述大范围核酸酶为归巢核酸酶。在一个实施方案中，所述归巢核酸酶为归巢核酸酶的LAGLIDADG(SEQ ID NO:16)家族。在一个实施方案中，归巢核酸酶的LAGLIDADG(SEQ IDNO:16)家族选自I-SceI、I-CreI和I-Dmol。

核酸酶试剂可进一步包含限制核酸内切酶，其包括I型、II型、III型和IV型核酸内切酶。I型和III型限制核酸内切酶识别特异性识别位点，但通常在与核酸酶结合位点变化的位置裂解，其可距裂解位点(识别位点)数百个碱基对。在II型系统中，限制活性与任何甲基酶活性无关，且裂解通常在结合位点内或结合位点附近的特异性位点处发生。大多数II型酶切割回文序列，然而，IIa型酶识别非回文识别位点且在识别位点之外裂解，IIb型酶用在识别位点之外的两个位点处切割序列两次，且II型酶识别不对称的识别位点且在一侧并在距识别位点约1-20个核苷酸的限定距离处裂解。IV型限制酶靶向甲基化DNA。限制酶例如在REBASE数据库(在rebase.neb.com处的网页；Roberts等人，(2003)Nucleic Acids Res31:418-20)；Roberts等人，(2003)Nucleic Acids Res 31:1805-12；和Belfort等人，(2002)在Mobile DNA II中，第761-783页，编者Craigie等人，(ASM Press,Washington,DC)中进一步描述并分类。

在各种方法和组合物中采用的核酸酶试剂还可包含CRISPR/Cas系统。这样的系统可采用例如Cas9核酸酶，其在一些情况下为对于其将表达的所要细胞类型而密码子优化的。这样的系统还可采用包含两种单独分子的向导RNA(gRNA)。例示性两分子gRNA包含crRNA-样(“CRISPR RNA”或“靶标-RNA”或“crRNA”或“crRNA重复序列”)分子和相应tracrRNA样(“反向作用CRISPR RNA”或“激活子-RNA”或“tracrRNA”或“支架”)分子。crRNA包含gRNA的DNA靶向片段(单链)和形成gRNA的蛋白结合片段的双链RNA(dsRNA)复体的一半的一段核苷酸两者。相应tracrRNA(激活子-RNA)包含形成gRNA的蛋白结合片段的dsRNA复体的另一半的一段核苷酸。因此，crRNA的一段核苷酸与tracrRNA的一段核苷酸互补并杂化以形成gRNA的蛋白结合结构域的dsRNA复体。因而，各crRNA可说成是具有相应的tracrRNA。所述crRNA另外提供单链DNA靶向片段。相应地，gRNA包含与杂化至靶序列的序列和tracrRNA。因此，crRNA和tracrRNA(作为相应的对)杂化以形成gRNA。如果用于在细胞内修饰，则可将给定crRNA或tracrRNA分子的确切序列和/或长度设计成对将在其中使用RNA分子的物种具有特异性。

编码三种元件(Cas9、tracrRNA和crRNA)的天然存在的基因通常在一种或多种操纵子中组织化。天然存在的CRISPR RNA根据Cas9系统和生物体而不同，但常常含有21-72个核苷酸长、由长度为21-46个核苷酸的两个定向重复序列(DR)侧接的靶向片段(参见例如，WO2014/131833)。在产脓链球菌的情况下，DR为36个核苷酸长且靶向片段30个核苷酸长。3'定位的DR与相应tracrRNA互补并杂化，其又结合Cas9蛋白。

可选地，所述系统进一步采用与密码子优化的Cas9一起起作用的融合crRNA-tracrRNA构建体(即，单一转录体)。该单RNA常称为向导RNA或gRNA。在gRNA内，crRNA部分鉴定为给定识别位点的‘靶序列’且tracrRNA常称为‘支架’。简要地讲，含有靶序列的短D NA片段插入向导RNA表达质粒中。所述gRNA表达质粒包含靶序列(在一些实施方案中，约20个核苷酸)、一种形式的tracrRNA序列(支架)以及在细胞中具有活性的合适启动子和在真核细胞中恰当加工的必需元件。许多系统依靠定制的互补oligos，这些oligos退火以形成双链DNA且随后克隆到gRNA表达质粒中。gRNA表达盒和Cas9表达盒随后引入细胞中。参见，例如Mali P等人，(2013)Science 2013年2月15日；339(6121):823-6；Jinek M等人，Science2012年8月17日；337(6096):816-21；Hwang WY等人，Nat Biotechnol 2013年3月；31(3):227-9；Jiang W等人，Nat Biotechnol 2013年3月；31(3):233-9；和Cong L等人，Science2013年2月15日；339(6121):819-23，其各自以引用的方式并入本文中。还参见，例如WO/2013/176772A1、WO/2014/065596A1、WO/2014/089290A1、WO/2014/093622A2、WO/2014/099750A2和WO/2013142578A1，其各自以引用的方式并入本文中。

在一些实施方案中，所述Cas9核酸酶可以蛋白质形式提供。在一些实施方案中，所述Cas9蛋白可以与gRNA的复合体的形式提供。在其它实施方案中，所述Cas9核酸酶可以编码蛋白质的核酸的形式提供。编码Cas9核酸酶的核酸可为RNA(例如，信使RNA(mRNA))或DNA。

在一些实施方案中，所述gRNA可以RNA的形式提供。在其它实施方案中，所述gRNA可以编码RNA的DNA的形式提供。在一些实施方案中，所述gRNA可分别以单独crRNA和tracrRNA分子或编码crRNA和tracrRNA的单独DNA分子的形式提供。

在一个实施方案中，所述修饰在细胞中的目标基因组基因座的方法进一步包括向所述细胞中引入：(a)包含操作性连接编码成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白的第一核酸序列的第一启动子的第一表达构建体；(b)包含操作性连接与向导RNA(gRNA)连接的基因组靶序列的第二启动子的第二表达构建体，其中所述基因组靶序列由原间隔区邻近基序侧接。任选地，所述基因组靶序列在3'端由原间隔区邻近基序(PAM)序列侧接。在一个实施方案中，所述细胞包括真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞。

在一个实施方案中，所述基因组靶序列包含的GNNNNNNNNNNNNNNNNNNNNGG核苷酸序列(GN_1-20 GG；SEQ ID NO:1)。在一个实施方案中，所述基因组靶序列包含SEQ ID NO:23，其中N为1-20个核苷酸长。在另一实施方案中，所述基因组靶序列包含14-20个核苷酸长的SEQ ID NO:1。

在一个实施方案中，所述gRNA包含编码成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)的第三核酸序列。在特定的实施方案中，所述Cas蛋白为Cas9。

在一些实施方案中，所述gRNA包含(a)核酸序列5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU AAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3'(SEQ ID NO:2)的嵌合RNA；或(b)核酸序列5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG-3'(SEQ ID NO:3)的嵌合RNA。

在另一实施方案中，所述crRNA包含5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3'(SEQ ID NO:4)；5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAG(SEQ ID NO:5)；或5'-GAGUCCGAGCAGAAGAAGAAGUUUUA-3'(SEQ ID NO:6)。

在又一实施方案中，所述tracrRNA包含5'-AAGGCUAGUCCG-3'(SEQ ID NO:7)或5'-AAGGCUAGUCCGU UAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU-3'(SEQ ID NO:8)。

在一个实施方案中，所述Cas蛋白为I型Cas蛋白。在一个实施方案中，所述Cas蛋白为II型Cas蛋白。在一个实施方案中，所述II型Cas蛋白为Cas9。在一个实施方案中，所述第一核酸序列编码人类密码子优化的Cas蛋白。

在某些实施方案中，所述Cas蛋白为可在靶位点处产生单链断裂(即，“切口”)而不会切割双链DNA(dsDNA)的两个链的“切口酶”。Cas9例如包含两个核酸酶结构域：RuvC样核酸酶结构域和HNH样核酸酶结构域，其负责相反DNA链的裂解。在这些结构域中的任一个中的突变可产生切口酶。产生切口酶的突变的实例可例如在WO/2013/176772A1和WO/2013/142578A1中见到，这些申请各自以引用的方式并入本文中。

在某些实施方案中，对在dsDNA的各个链上的靶位点具有特异性的两种单独Cas蛋白(例如，切口酶)可产生与在另一核酸上的突出序列或在同一核酸上的单独区互补的突出序列。通过使核酸与对于在dsDNA的两个链上的靶位点具有特异性的两种切口酶接触产生的突出可为5′或3′突出。例如，第一切口酶可在dsDNA的第一链上产生第一链断裂，而第二切口酶可在dsDNA的第二链上产生单链断裂，因此产生突出序列。可选择各切口酶产生单链断裂的靶位点，使得所产生的突出序列与在不同核酸分子上的突出序列互补。这两种不同核酸分子的互补突出可通过本文公开的方法退火。在一些实施方案中，所述切口酶在第一链上的靶位点与所述切口酶在第二链上的靶位点不同。

在一个实施方案中，所述第一核酸包含破坏在Cas蛋白中核酸酶活性位点的至少一个氨基酸残基的突变，其中突变体Cas蛋白仅在靶DNA区的一个链上产生断裂，且其中所述突变减小在靶DNA区中的非同源重组。

在一个实施方案中，编码Cas蛋白的第一核酸进一步包含核定位信号(NLS)。在一个实施方案中，所述核定位信号为SV40核定位信号。

在一个实施方案中，驱动基因组靶序列和向导RNA(gRNA)的表达的第二启动子为RNA聚合酶III启动子。在一个实施方案中，所述RNA聚合酶III启动子为人类U6启动子。在一个实施方案中，所述RNA聚合酶III启动子为大鼠U6聚合酶III启动子。在一个实施方案中，所述RNA聚合酶III启动子为小鼠U6聚合酶III启动子。

在一个实施方案中，编码crRNA和tracrRNA的核酸序列经由合成环路连接，其中在表达后crRNA和tracrRNA形成crRNA:tracrRNA复体。

如上所述的CRISPR/Cas系统可与具有以下细胞类型中的任一种的大靶向载体组合使用：真核细胞、非大鼠真核细胞、哺乳动物细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞。

在一个实施方案中，所述第一表达构建体和第二表达构建体自相同的质粒表达。

在一个实施方案中，所述第一表达构建体和所述第二表达构建体与LTVEC一起引入。在一个实施方案中，所述第一表达构建体和所述第二表达构建体与所述LTVEC经一段时间单独地引入。

在一个实施方案中，所述方法包括引入多个第二构建体和多个LTVEC以便多重编辑如本文所述的不同靶基因座。

还提供核酸酶试剂(即，工程化核酸酶试剂)的活性变体和片段。这样的活性变体可包括与天然核酸酶试剂至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大的序列同一性，其中所述活性变体保持在所要识别位点切割的能力且因此保持切口或双链断裂诱导活性。例如，本文所述的核酸酶试剂中的任一种可自天然核酸内切酶序列修饰并设计用来识别并诱导在未被天然核酸酶试剂识别的识别位点处的切口或双链断裂。因此，在一些实施方案中，所述工程化核酸酶具有诱导在与相应天然核酸酶试剂识别位点不同的识别位点处的切口或双链断裂的特异性。对于切口或双链断裂诱导活性的测定是已知的且通常测量核酸内切酶对含有识别位点的DNA底物的总体活性和特异性。

所述核酸酶试剂可通过本领域已知的任何方法引入细胞中。编码所述核酸酶试剂的多肽可直接引入细胞中。可选地，编码所述核酸酶试剂的多核苷酸可引入细胞中。当编码所述核酸酶试剂的多核苷酸引入细胞中时，所述核酸酶试剂可在细胞内短暂地、有条件地或组成性地表达。因此，编码所述核酸酶试剂的多核苷酸可包含在表达盒中且操作性连接条件性启动子、可诱导的启动子、组成性启动子或组织特异性启动子。这样的目标启动子在本文中的其它地方进一步详细地论述。可选地，所述核酸酶试剂作为编码或包含核酸酶试剂的mRNA引入细胞中。

在一个实施方案中，所述crRNA和所述tracrRNA作为单独的RNA转录体表达。

在特定的实施方案中，编码所述核酸酶试剂的多核苷酸稳定地整合到细胞的基因组中且操作性连接在细胞中具有活性的启动子。在其它实施方案中，编码所述核酸酶试剂的多核苷酸在包含插入核酸的相同靶向载体中，而在其它情况下，编码所述核酸酶试剂的多核苷酸在自包含插入核酸的靶向载体中分离的载体或质粒中。

当所述核酸酶试剂经由引入编码所述核酸酶试剂的多核苷酸而提供到细胞中时，与编码所述核酸酶试剂的天然存在的多核苷酸序列相比较，可修饰编码核酸酶试剂的这一多核苷酸以取代在目标细胞中具有较高使用频度的密码子。例如，与天然存在的多核苷酸序列相比较，可修饰编码所述核酸酶试剂的多核苷酸以取代在给定的目标原核或真核细胞中具有较高利用频度的密码子，所述原核或真核细胞包括细菌细胞、酵母菌细胞、人类细胞、非人类细胞、非大鼠真核细胞、哺乳动物细胞、啮齿动物细胞、非大鼠啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其它目标宿主细胞。

在一个实施方案中，所述核酸内切酶试剂与所述LTVEC一起引入。在一个实施方案中，所述核酸内切酶试剂与所述LTVEC经一段时间单独地引入。在一个实施方案中，所述核酸内切酶试剂在引入所述LTVEC之前引入。在一个实施方案中，所述核酸内切酶试剂在引入所述LTVEC之后引入大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠ES细胞中。

在一个实施方案中，所述核酸内切酶试剂为包含编码核酸内切酶的核酸序列的表达构建体，其中所述核酸序列操作性连接启动子。在一个实施方案中，所述启动子为组成性活性启动子。在一个实施方案中，所述启动子为可诱导的启动子。在一个实施方案中，所述启动子在多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞中具有活性。在一个实施方案中，所述核酸内切酶试剂为编码核酸内切酶的mRNA。

B.将目标多核苷酸整合到靶基因座中的方法

提供修饰目标靶基因座的方法。在一个实施方案中，靶向在多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞中的靶基因座以便基因修饰。这一方法包括：(a)将包含侧接有5'大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠同源臂和3'大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠同源臂的插入核酸的靶向载体引入多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞中；(b)鉴定在所述靶基因座处包括靶向基因修饰的基因修饰的多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞，其中所述靶向基因修饰能够经由种系传递。在特定的实施方案中，所述5'同源臂和所述3'同源臂的总和为至少10kb和/或采用大靶向载体。

在其它实施方案中，所述LTVEC的5'同源臂和3'同源臂的总和的尺寸为约10kb-约150kb、约10kb-约100kb、约10kb-约75kb、约20kb-约150kb、约20kb-约100kb、约20kb-约75kb、约30kb-约150kb、约30kb-约100kb、约30kb-约75kb、约40kb-约150kb、约40kb-约100kb、约40kb-约75kb、约50kb-约150kb、约50kb-约100kb、或约50kb-约75kb、约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-约150kb。在一个实施方案中，所述缺失的尺寸与所述LTVEC的5'同源臂和3'同源臂的总和的尺寸相同或类似。

例如大鼠细胞的多潜能细胞可为胚胎干细胞，例如大鼠胚胎干细胞。在一个特定的实施方案中，(a)大鼠ES细胞来源于DA株或ACI株；或(b)大鼠ES细胞的特征在于表达包括Oct-4、Sox-2、碱性磷酸酶或其组合的多潜能标记。在其它情况下，所采用的大鼠胚胎干细胞包括如在2014年2月20日提交的美国专利申请号14/185,103中所述的大鼠ES细胞，其全部内容以引用的方式并入本文中。

任何多潜能或非多潜能细胞可用于本文提供的方法中。例如，所述多潜能或非多潜能细胞可来自真核生物、非大鼠真核生物、非人类哺乳动物、哺乳动物、啮齿动物、非大鼠啮齿动物、大鼠、小鼠、人类或仓鼠。

如在本文中的其它地方描述，所述插入核酸可为任何核酸序列。在非限制性实施方案中，(a)所述插入核酸包含用同源或直系同源哺乳动物核酸序列替换内源大鼠、真核、非大鼠真核、哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸序列；(b)所述插入核酸包含缺失内源大鼠、真核、非大鼠真核、哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸序列；(c)所述插入核酸包含缺失内源大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠核酸序列，其中所述缺失为5kb-200kb或5kb-3Mb(如在本文中的其它地方详细论述)；(d)所述插入核酸包含添加外源核酸序列(包括例如如下外源核酸序列，其为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb)；(e)所述插入核酸包含包含同源或直系同源的核酸序列的外源核酸序列；(f)(a)的同源或直系同源的核酸序列，其中所述核酸序列为人类核酸序列；(g)所述插入核酸包含(a)的同源或直系同源的核酸序列，其中所述核酸序列为包含人类和大鼠核酸序列的嵌合核酸序列；(h)所述插入核酸包含(e)的外源核酸序列，其中所述插入核酸为约5kb-约200kb；(i)所述插入核酸包含侧接有位点特异性重组酶靶序列的条件性等位基因；(j)所述插入核酸包含操作性连接启动子的报道基因；(k)所述插入核酸包含一个或多个未重排的人类免疫球蛋白重链V_H基因片段、一个或多个未重排的人类免疫球蛋白重链D基因片段和一个或多个未重排的人类免疫球蛋白重链J_H基因片段，其操作性连接啮齿动物重链恒定区核酸序列；(l)所述插入核酸包含操作性连接啮齿动物重链恒定区核酸序列的重排的人类免疫球蛋白重链可变区核酸序列；(m)所述插入核酸包含一个或多个未重排的人类免疫球蛋白V_κ或V_λ基因片段和一个或多个未重排的人类免疫球蛋白J_κ或J_λ基因片段，它们操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列；(n)所述插入核酸包含操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列的重排人类免疫球蛋白λ或κ轻链可变区核酸序列；(o)(k)和/或(l)的哺乳动物重链恒定区核酸序列包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合；或(p)(m)和/或(n)的哺乳动物免疫球蛋白λ或κ轻链恒定区核酸包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。

在一个实施方案中，所述插入核酸包含一个或多个功能性人类V_H基因片段，所述功能性人类V_H基因片段包括V_H1-2、V_H1-3、V_H1-8、V_H1-18、V_H1-24、V_H1-45、V_H1-46、V_H1-58、V_H1-69、V_H2-5、V_H2-26、V_H2-70、V_H3-7、V_H3-9、V_H3-11、V_H3-13、V_H3-15、V_H3-16、V_H3-20、V_H3-21、V_H3-23、V_H3-30、V_H3-30-3、V_H 3-30-5、V_H3-33、V_H3-35、V_H3-38、V_H3-43、V_H3-48、V_H3-49、V_H3-53、V_H3-64、V_H3-66、V_H3-72、V_H3-73、V_H3-74、V_H4-4、V_H4-28、V_H4-30-1、V_H4-30-2、V_H4-30-4、V_H4-31、V_H4-34、V_H4-39、V_H4-59、V_H4-61、V_H5-51、V_H6-1、V_H7-4-1、V_H7-81或其组合。

在一个实施方案中，所述插入核酸包含一个或多个功能性人类D基因片段，所述功能性人类D基因片段包括D1-1、D1-7、D1-14、D1-20、D1-26、D2-2、D2-8、D2-15、D2-21、D3-3、D3-9、D3-10、D3-16、D3-22、D4-4、D4-11、D4-17、D4-23、D5-12、D5-5、D5-18、D5-24、D6-6、D6-13、D6-19、D6-25、D7-27或其组合。

在一个实施方案中，所述插入核酸包含一个或多个功能性JH基因片段，所述功能性J_H基因片段包括J_H1、J_H2、J_H3、J_H4、J_H5、J_H6或其组合。在一个实施方案中，所述插入核酸包含一个或多个人类Vκ基因片段，所述人类Vκ基因片段包括Vκ4-1、Vκ5-2、Vκ7-3、Vκ2-4、Vκ1-5、Vκ1-6、Vκ3-7、Vκ1-8、Vκ1-9、Vκ2-10、Vκ3-11、Vκ1-12、Vκ1-13、Vκ2-14、Vκ3-15、Vκ1-16、Vκ1-17、Vκ2-18、Vκ2-19、Vκ3-20、Vκ6-21、Vκ1-22、Vκ1-23、Vκ2-24、Vκ3-25、Vκ2-26、Vκ1-27、Vκ2-28、Vκ2-29、Vκ2-30、Vκ3-31、Vκ1-32、Vκ1-33、Vκ3-34、Vκ1-35、Vκ2-36、Vκ1-37、Vκ2-38、Vκ1-39、Vκ2-40或其组合。

在一个实施方案中，所述插入核酸包含一个或多个人类Vλ基因片段，所述人类Vλ基因片段包括Vλ3-1、Vλ4-3、Vλ2-8、Vλ3-9、Vλ3-10、Vλ2-11、Vλ3-12、Vλ2-14、Vλ3-16、Vλ2-18、Vλ3-19、Vλ3-21、Vλ3-22、Vλ2-23、Vλ3-25、Vλ3-27或其组合。

在一个实施方案中，所述插入核酸包含一个或多个人类Jκ基因片段，所述人类Jκ基因片段包括Jκ1、Jκ2、Jκ3、Jκ4、Jκ5或其组合。

在特定的实施方案中，在修饰在多潜能或非多潜能大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠细胞中的靶基因座后，所述基因修饰经由种系传递。

在一个实施方案中，所述插入核酸序列包含多核苷酸，所述多核苷酸在整合到基因组中时将生成大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠ApoE基因座的区的基因修饰，其中在ApoE基因座处的修饰引起ApoE活性减小、ApoE活性增加或ApoE活性调整。在一个实施方案中，产生ApoE敲除。

在一个实施方案中，所述插入核酸序列包含多核苷酸，所述多核苷酸在整合到基因组中时将生成大鼠、真核、非大鼠真核、哺乳动物、人类、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠干扰白细胞素-2受体γ基因座的区的基因修饰，其中在所述干扰白细胞素-2受体γ基因座处的基因修饰引起干扰白细胞素-2受体活性减小、干扰白细胞素-2受体γ活性增加或干扰白细胞素-2受体活性调整。在一个实施方案中，产生干扰白细胞素-2受体敲除。

在又一实施方案中，所述插入核酸序列包含多核苷酸，所述多核苷酸在整合到基因组中时将生成大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠Rag1基因座，大鼠、真核、非大鼠真核、非人类哺乳动物、哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠Rag2基因座和/或大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠Rag2/Rag1基因座的区的基因修饰，其中在大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠Rag1、Rag2和/或Rag2/Rag1基因座处的基因修饰引起Rag1、Rag2或Rag1和Rag2蛋白活性减小、Rag1、Rag2或Rag1和Rag2蛋白活性增加或Rag1、Rag2或Rag1和Rag2蛋白活性调整。在一个实施方案中，产生Rag1、Rag2或Rag2/Rag1敲除。

在其它实施方案中，所述插入核酸引起大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠ApoE基因座，干扰白细胞素-2受体γ基因座和/或Rag2基因座和/或Rag1基因座和/或Rag2/Rag1基因座的一部分用来自另一生物体的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应直系同源部分替换。

在其它实施方案中，所述插入核酸包含跨其全长与其替换的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分共有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的多核苷酸。

给定插入的多核苷酸和/或大鼠、真核、非大鼠真核、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠基因座的相应替换区可为编码区、内含子、外显子、未转译区、调控区、启动子或增强子或其任何组合。此外，给定插入的多核苷酸和/或大鼠、真核、非大鼠真核、哺乳动物、人类、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠基因座的替换区可具有任何所要长度，所述长度包括例如10-100个核苷酸长、100-500个核苷酸长、500-1kb核苷酸长、1kb-1.5kb核苷酸长、1.5kb-2kb核苷酸长、2kb-2.5kb核苷酸长、2.5kb-3kb核苷酸长、3kb-5kb核苷酸长、5kb-8kb核苷酸长、8kb-10kb核苷酸长或更长。在其它情况下，所述插入或替换的尺寸为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb、约350kb-约400kb、约400kb-约800kb、约800kb-1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb、约2.5Mb-约2.8Mb、约2.8Mb-约3Mb。在其它实施方案中，给定插入的多核苷酸和/或大鼠、真核、非大鼠真核、非人类哺乳动物、哺乳动物、人类、啮齿动物、非大鼠啮齿动物、小鼠或仓鼠基因座的替换区为至少100、200、300、400、500、600、700、800或900个核苷酸或至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb或更长。

i.经由细菌同源重组(BHR)修饰核酸的靶基因座的方法

提供经由在原核细胞中细菌同源重组(BHR)修饰真核、非大鼠真核、哺乳动物、人类或非人类哺乳动物核酸的靶基因座的方法和组合物。所述方法利用在原核细胞中细菌同源重组以基因修饰真核、非大鼠真核、哺乳动物、人类或非人类哺乳动物核酸的靶基因座以产生靶向载体中得到应用。包含基因修饰的靶基因座的这一靶向载体可引入真核细胞如真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞中。“同源重组”包括在同源性区内的交叉位点处交换在两个DNA分子之间的DNA片段。因此，“细菌同源重组”或“BHR”包括在细菌中发生的同源重组。

提供经由细菌同源重组(BHR)修饰来自真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞的核酸的靶基因座的方法。所述方法包括将包含侧接有5'同源臂和3'同源臂的插入核酸的靶向载体引入原核细胞中，其中所述原核细胞包含核酸的靶基因座且能够表达介导在所述靶基因座处的BHR的重组酶。这样的靶向载体可包括本文所述的大靶向载体中的任一种。

在一个实施方案中，所述方法包括向原核细胞中引入：(i)包含具有目标DNA序列的核酸的第一构建体；(ii)包含侧接有5'同源臂和3'同源臂的插入核酸的第二靶向构建体；和(iii)编码介导细菌同源重组的重组酶的第三构建体。在一个实施方案中，所述第一构建体、所述第二构建体和所述第三构建体经一段时间单独地引入原核细胞中。在一个实施方案中，所述原核细胞包含编码所述重组酶的核酸，且所述方法不需要引入第三构建体。在一个实施方案中，所述重组酶在可诱导的启动子的控制下表达。

在一个实施方案中，包含所述核酸的第一构建体来源于细菌人造染色体(BAC)或酵母菌人造染色体(YAC)。可选择在靶基因组基因座处包含插入核酸的原核细胞。该方法可如本文公开连续地重复以允许在原核细胞中的靶基因座处引入多个插入核酸。靶核酸基因座一旦“建造”在原核细胞中，包含修饰的靶基因座的靶向载体则可自所述原核细胞中分离并引入在真核细胞、非大鼠真核细胞、哺乳动物细胞、人类细胞、非人类哺乳动物细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类iPS细胞、人类细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞、成纤维细胞或CHO细胞内的靶基因组基因座中。

接受靶向载体的优选大鼠细胞描述在2014年2月20日提交的美国申请14/185,703中，其内容在本文中概述。这些大鼠细胞为能够在一种或多种体外靶向基因修饰之后维持其多潜能性且能够经由种系传递靶向基因修饰的多潜能大鼠细胞。

电穿孔的多潜能细胞例如以高密度涂铺以便选择包含靶向载体的抗药性细胞。药物选择过程移除大多数的涂铺细胞(约99％)，留下个别的集落，其各自为来源于单一细胞的克隆。在剩余细胞之中，大多数细胞(约80-100％)含有在基因组中的随机位置整合的靶向载体(包含药物选择盒)。因此，所述集落个别地拣选并基因分型以鉴定在恰当的基因组位置处藏有靶向载体的ES细胞(例如，使用如下所述的等位基因测定的修饰)。

可使用高通量定量测定，即等位基因修饰(MOA)测定，以进行基因分型。这一测定允许在基因修饰之后大规模筛选在亲本染色体中的一种或多种修饰的等位基因。所述MOA测定可经由包括但不限于例如实时PCR(qPCR)的定量PCR的各种分析技术进行。例如，所述实时PCR包括识别靶基因座的第一引物集和识别非靶向参考基因座的第二引物集。另外，所述引物集包括识别扩增序列的荧光探针。在一个实施方案中，所述定量测定经由Invader进行。在一个实施方案中，所述定量测定经由MMP进行。在一个实施方案中，所述定量测定经由分子信标进行。在一个实施方案中，所述定量测定经由Eclipse^TM探针技术进行。(参见，例如US2005/0144655，其以引用的方式并入本文中)。

包含靶向基因修饰的选择的多潜能细胞(即，非人类多潜能细胞、非人类ES细胞)随后可引入例如前桑葚胚阶段或胚泡阶段胚胎的宿主胚胎中并植入代孕母体的子宫中以产生建群非人类动物(F0动物)。接着，建群动物例如可与野生型动物配种以产生基因修饰杂合性F1子代。杂合F1动物交配可生成基因修饰纯合性子代。杂合F1动物交配可生成基因修饰纯合性子代。在一些实施方案中，本文所述的靶基因座的各种基因修饰可使用如在本文中的其它地方详细描述的大靶向载体(LTVEC)进行。例如，LTVEC可使用基因工程技术来源于细菌人造染色体(BAC)DNA(参见，例如美国专利号6,586,251和Valenzuela,D.M.等人，(2003),High-throughput engineering of themouse genome coupled with high-resolution expression analysis,NatureBiotechnology 21(6):652-659，其整体以引用的方式并入本文中)。

使用细菌同源重组(BHR)以产生大靶向载体(LTVEC)绕过了质粒在容纳大基因组DNA片段中的局限性以及随后将靶向修饰引入在多潜能或非多潜能细胞中的内源基因座中的低效率。一种或多种靶向基因修饰可在产生LTVEC的过程中执行。在原核细胞中生成的例示性LTVEC可包含载有具有一种或多种基因修饰的基因组序列的插入核酸或由与特异性基因组区互补的同源臂侧接的外源核酸(例如，大鼠核酸的同源物或直系同源物)。

还提供了包含本文所述的各种靶向载体的宿主原核细胞。这样的原核细胞包括但不限于细菌，例如大肠杆菌。在一个实施方案中，宿主原核细胞包含靶向载体，所述靶向载体包含侧接有5'同源臂和3'同源臂的插入核酸，其中所述插入核酸为约5kb-约200kb。

所述宿主原核细胞可进一步包含编码重组酶多肽的核酸或编码操作性连接可诱导的启动子的重组酶多肽的核酸。

进一步提供各种方法和组合物，其采用如本文所述的LTVEC以及原核细胞以生成靶向基因修饰。这样的组合物和方法在本文中的其它地方论述。

提供经由细菌同源重组(BHR)修饰核酸的靶基因座的方法，其包括向原核细胞中引入包含侧接有5'同源臂和3'同源臂的插入核酸的靶向载体，其中所述原核细胞包含对应于5'同源臂和3'同源臂的核酸且所述原核细胞能够表达介导在靶基因座处的BHR的重组酶。这样的靶向载体可包括本文所述的大靶向载体中的任一种。这样的方法可采用如在本文中详细论述的LTVEC并且进一步采用如在本文中的其它地方论述的CRISPR/Cas系统。

在一个实施方案中，所述CRISPR/Cas系统可通过在例如大肠杆菌的原核细胞中具有活性的启动子控制。

ii.修饰在多潜能细胞或非多潜能细胞中的目标靶基因座的方法。

进一步提供经由靶向基因修饰来修饰在多潜能细胞或非多潜能细胞中的目标靶基因座的方法，其包括：(a)向所述多潜能细胞或非多潜能细胞中引入包含侧接有5'同源臂和3'同源臂的插入核酸的靶向载体，其中所述5'同源臂和所述3'同源臂的总和为至少10kb；和(b)鉴定在所述目标靶基因座处具有靶向基因修饰的基因修饰的多潜能或非多潜能细胞。在一个实施方案中，所述5'同源臂和所述3'同源臂的总和为至少约16kb-约30kb。在特定的实施方案中所述靶向基因修饰能够经由种系传递。这样的靶向载体可包括本文所述的大靶向载体中的任一种。

各种细胞也可用于本文提供的修饰目标靶基因座的方法中。在特定的实施方案中，所述细胞为真核细胞、非大鼠真核细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类诱导的多潜能细胞(iPS)细胞、哺乳动物细胞、人类细胞、成纤维细胞、啮齿动物细胞、非大鼠啮齿动物细胞、小鼠细胞、仓鼠细胞或CHO细胞。

一方面，提供经由靶向基因修饰来修饰在多潜能细胞中的目标基因组基因座的方法，其包括：(a)提供能够在其基因组的至少一种靶向基因修饰之后维持其多潜能性且能够传递所述靶向修饰到F1代的种系的多潜能细胞；(b)将大靶向载体(LTVEC)引入所述多潜能细胞中，其中所述LTVEC包含侧接有5'同源臂和3'同源臂的插入核酸，其中所述5'同源臂和所述3'同源臂包含基因组DNA片段；和(c)鉴定包含所述靶向基因修饰的基因修饰的多潜能细胞。

可使用各种方法以鉴定具有在目标靶基因座处整合的插入核酸的细胞。在目标靶基因座处插入插入核酸引起“等位基因修饰”。术语“等位基因修饰”和检测修饰的等位基因的方法在本文中的其它地方进一步详细地论述。

一方面，提供经由核酸内切酶介导的基因靶向修饰在非多潜能细胞或多潜能细胞中的目标基因组基因座的方法，所述方法包括：(a)提供能够传递基因修饰的基因组到F1代的种系的分离的非多潜能细胞或分离的多潜能细胞；(b)向所述非多潜能细胞或所述多潜能细胞中引入核酸内切酶试剂；其中所述核酸内切酶试剂在位于所述目标基因组基因座中的靶DNA序列处生成切口或双链断裂，且其中在所述非多潜能细胞或所述多潜能细胞中的靶DNA序列处的切口或双链断裂诱导：(i)切口或双链断裂的非同源端接合(NHEJ)介导的DNA修复，其中所述NHEJ介导的DNA修复产生包含在靶DNA序列处核酸序列的插入或缺失的突变等位基因；或(ii)引起野生型核酸序列复原的同源重组介导的DNA修复；和(c)鉴定修饰的目标基因组基因座。

一方面，提供经由核酸酶试剂修饰在分离的胚胎干细胞(ES)中的目标基因组基因座的方法，其包括：(a)提供能够传递靶向基因修饰到F1代的种系的分离的ES细胞；(b)向所述ES细胞中引入：(i)包含侧接有5'同源臂和3'同源臂的插入核酸的大靶向载体(LTVEC)，其中所述插入为至少5kb的核酸序列；和(ii)核酸内切酶试剂，其中所述核酸内切酶试剂在位于所述目标基因组基因座中的靶DNA序列处生成切口或双链断裂，且其中所述靶序列在所述插入核酸中不存在；和(c)鉴定在所述胚胎干(ES)细胞中的靶向基因修饰。

一方面，提供经由RNA向导的基因组工程化修饰在非多潜能细胞或多潜能细胞中的目标基因组基因座的方法，所述方法包括：(a)提供能够传递基因修饰的基因组到F1代的种系的非多潜能细胞或多潜能细胞；(b)向所述非多潜能细胞或所述多潜能细胞中引入：(i)包含操作性连接编码成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白的第一核酸序列的第一启动子的第一表达构建体，(ii)包含操作性连接与向导RNA(gRNA)连接的基因组靶序列的第二启动子的第二表达构建体，其中所述基因组靶序列由原间隔区邻近基序(PAM)序列侧接。任选地，所述基因组靶序列在3'端由原间隔区邻近基序(PAM)序列侧接。在一个实施方案中，所述Cas蛋白和所述CRISPR RNA和/或tracrRNA并不一起天然存在(例如，Cas蛋白和CRISPR RNA并不一起天然存在)。在一个实施方案中，所述基因组靶序列包含GNNNNNNNNNNNNNNNNNNNNGG的核苷酸序列(GN_1-20GG；SEQ ID NO:1)。在一个实施方案中，所述基因组靶序列包含SEQ ID NO:1，其中N为14-20个核苷酸长。在一个实施方案中，所述gRNA包含编码成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)的第三核酸序列和编码反式激活CRISPR RNA(tracrRNA)的第四核酸序列。在一个实施方案中，在表达后，所述Cas蛋白形成包括crRNA和tracrRNA的CRISPR-Cas复合体，且所述CRISPR-Cas复合体在位于所述目标基因组基因座中的靶DNA序列处生成切口或双链断裂，且其中在所述非多潜能细胞或所述多潜能细胞中的靶DNA序列处的切口或双链断裂诱导：(i)通过所述CRISPR-Cas复合体产生的切口或双链断裂的非同源端接合(NHEJ)介导的DNA修复，其中所述NHEJ产生包含在所述靶DNA序列处核酸序列的插入或缺失的突变等位基因；或(ii)引起野生型核酸序列复原的同源重组介导的DNA修复；和(c)鉴定修饰的目标基因组基因座。

一方面，提供经由RNA向导的基因组工程化修饰在非多潜能细胞或多潜能细胞中的目标基因组基因座的方法，所述方法包括：向能够经由种系传递修饰的基因组的非多潜能细胞或多潜能细胞中引入：(i)成簇规律间隔短回文重复序列(CRISPR)-相关(Cas)蛋白或编码所述Cas蛋白的核酸；和(ii)gRNA或编码所述gRNA的DNA，其中所述gRNA包含杂化到基因组靶序列的核苷酸序列和反式激活CRISPR RNA(tracrRNA)；其中所述基因组靶序列由原间隔区邻近基序(PAM)序列侧接。

在一些实施方案中，所述Cas蛋白可作为分离的蛋白引入所述非多潜能细胞或所述多潜能细胞中。在一些实施方案中，所述Cas蛋白可进一步包含促进所述蛋白的细胞摄取的细胞穿透结构域。在其它实施方案中，所述Cas蛋白可作为编码所述Cas蛋白的信使RNA(mRNA)分子引入细胞中。在其它实施方案中，所述Cas蛋白可作为编码所述Cas蛋白的DNA分子引入细胞中。例如，编码所述Cas蛋白的DNA分子可提供于构建体中且操作性连接能够在所述非多潜能细胞或所述多潜能细胞中表达的启动子。在某些实施方案中，编码所述Cas蛋白的核酸为密码子优化以在所述非多潜能细胞或所述多潜能细胞中表达。

在一些实施方案中，所述gRNA可作为RNA分子引入所述非多潜能细胞或所述多潜能细胞中。例如，所述gRNA分子可体外转录。在其它实施方案中，所述gRNA可作为编码所述gRNA的DNA分子引入所述非多潜能细胞或所述多潜能细胞中。例如，编码所述gRNA的DNA分子可在构建体中且操作性连接能够在所述非多潜能细胞或所述多潜能细胞中表达所述gRNA的启动子。在其它实施方案中，所述gRNA可化学合成。

在一些实施方案中，所述gRNA可作为融合的crRNA-tracrRNA分子(即，单一转录体)引入所述非多潜能细胞或所述多潜能细胞中。在其它实施方案中，所述gRNA可作为单独的crRNA和tracrRNA分子(即，单独的转录体)引入所述非多潜能细胞或所述多潜能细胞中。在其它实施方案中，所述gRNA可作为分别编码crRNA和tracrRNA的单独的DNA分子引入所述非多潜能细胞或所述多潜能细胞中。例如，编码所述crRNA和tracrRNA的单独的DNA分子可在单独的构建体中且操作性连接能够在所述非多潜能细胞或所述多潜能细胞中表达的启动子。在上述实施方案中的任一个中，所述构建体的任何组合可在单独的核酸分子中或一起在单一核酸分子中。

在一些实施方案中，所述Cas蛋白和所述gRNA可同时或依次引入所述非多潜能细胞或所述多潜能细胞中。同样，所述gRNA的crRNA和tracrRNA可同时或依次引入所述非多潜能细胞或所述多潜能细胞中。Cas蛋白(或编码核酸)与gRNA(或编码DNA)的比率和/或crRNA与tracrRNA的比率可为大致化学计量的，因此它们可形成RNA-蛋白质复合体。

在某些实施方案中，所述Cas蛋白可以与gRNA的复合体的形式引入所述非多潜能细胞或所述多潜能细胞中。

在一个实施方案中，所述多潜能细胞为诱导的多潜能干细胞(iPS)。在一个实施方案中，所述多潜能细胞为发育受限的祖细胞。

在各种实施方案中，在选择标记内的识别位点中切口或双链断裂的存在增加在靶向载体(例如LTVEC)和目标靶基因座之间的重组的效率和/或频率。在一个实施方案中，所述重组为同源重组。在另一实施方案中，所述重组为通过非同源端接合插入。在各种实施方案中，在存在所述切口或双链断裂的情况下，在靶基因组基因座处靶向载体(例如，LTVEC)的靶向效率为在缺乏切口或双链断裂的情况下(例如，在目标基因组基因座处使用相同的靶向载体和相同的同源臂及相应靶位点，但在缺乏生成切口或双链断裂的加入的核酸酶试剂的情况下)的至少约2倍、至少约3倍、至少约4倍。

在一个实施方案中，在靶基因座处的靶向基因修饰为双等位基因。“双等位基因”是指基因的两个等位基因包含靶向基因修饰。所述靶向基因修饰可在各等位基因中相同或不同。例如，双等位基因修饰可由对在相应同源染色体上的相应等位基因产生的相同修饰或对在相应同源染色体上的相应等位基因产生的不同修饰产生。因此，双等位基因修饰可例如对于在目标基因组基因座处的特异性修饰产生纯合(即，在两种等位基因中的特异性修饰)、在目标基因组基因座处产生复合杂合(例如，在一个等位基因中的特异性修饰和另一基因的失活或破坏)或在目标基因组基因座处产生半合(例如，在一个等位基因中的特异性修饰和另一等位基因的损失)。在某些实施方案中，与仅使用靶向载体相比较，靶向载体(包括例如LTVEC)与核酸酶试剂的组合使用产生在细胞中的目标基因组基因座的双等位基因靶向基因修饰。与在仅使用靶向载体时相比较时，当靶向载体结合核酸酶剂使用时，双等位基因靶向效率增加至少两倍、至少三倍、至少四倍或更多。在其它实施方案中，所述双等位基因靶向效率为至少0.2％、0.3％、0.4％、0.5％、0.6％、0.7％、0.8％、0.9％、1％、2％、3％、4％或5％或更高。

在靶基因座处的双等位基因靶向基因修饰可产生纯合基因修饰的细胞。“纯合”是指靶基因座的两个等位基因(即，在两种同源染色体上的等位基因)已经以相同方式修饰。在某些实施方案中，靶向载体(包括例如LTVEC)与核酸酶试剂的组合使用产生在细胞中的目标基因组基因座的双等位基因纯合靶向基因修饰。在一个实施方案中，所述双等位基因基因修饰包括在两种同源染色体(即，一对第一同源染色体和第二同源染色体)中的目标基因组基因座处内源核酸序列的缺失和在两种同源染色体(即，一对第一同源染色体和第二同源染色体)中的目标基因组基因座处插入核酸的插入。在一些实施方案中，所述插入核酸替换在两种同源染色体中的目标基因组基因座处的内源核酸序列。在一个实施方案中，所述插入核酸与缺失的内源核酸序列同源或直系同源。

在一个实施方案中，在所述靶基因座处的靶向基因修饰产生半合基因修饰的细胞。“半合”是指仅存在靶基因座的一个等位基因(即，在两种同源染色体之一上的等位基因)或仅一个等位基因能够表达或功能化。在其它实施方案中，所述靶向基因修饰更一般而言产生复合杂合。复合杂合包括其中靶基因座的两个等位基因(即，在两种同源染色体上的等位基因)已经修饰、但它们是以不同方式修饰(例如，在一个等位基因中插入和另一等位基因失活或破坏)的情形。在某些实施方案中，靶向载体(包括例如LTVEC)与核酸酶试剂的组合使用产生在细胞中的目标基因组基因座的半合靶向基因修饰。在某些实施方案中，靶向载体(包括例如LTVEC)与核酸酶试剂是组合使用在细胞中的目标基因组基因座处产生引起复合杂合的靶向基因修饰。在一个实施方案中，在一种染色体中的目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和插入核酸的插入。在其它实施方案中，所述靶向基因修饰包括：(1)在两种同源染色体中的目标基因组基因座处缺失内源核酸序列；和(2)将插入核酸插入在第一染色体中的目标基因组基因座中和破坏在第二染色体中的目标基因组基因座。所述第一染色体可为这两种同源染色体中的第一种，且所述第二染色体可为这两种同源染色体中的第二种。在其它实施方案中，所述靶向修饰包括：(1)在目标基因组基因座处缺失内源核酸序列和将插入核酸插入在第一同源染色体中的目标基因组基因座中；和(2)破坏在第二同源染色体中的目标基因组基因座。内源核酸序列的破坏可例如在由核酸酶试剂产生的在目标基因组基因座处的双链断裂通过非同源端接合(NHEJ)介导的DNA修复而修复时产生，其产生包括在目标基因组基因座处核酸序列的插入或缺失的突变等位基因且由此造成目标基因组基因座的破坏。破坏的实例包括在目标基因组基因座处调控元件(例如，启动子或增强子)改变、错义突变、截断突变、零突变或小数量的核苷酸插入或缺失(例如，引起移码突变)。破坏的另一实例为无义突变。破坏可引起失活(即，功能损失)或等位基因损失。

纯合和半合的靶向基因修饰是有利的，因为当使用含有这些突变的基因修饰的细胞以产生如下论述的基因修饰的动物时，产生对于预定靶向基因修饰为非杂合(即，纯合或半合)的基因修饰的动物的方法更有效且不费时，因为需要较少的繁育步骤。出于相同的原因，引起复合杂合或半合的靶向基因修饰(例如，在一个等位基因中插入和另一等位基因失活、破坏或损失)可为有利的。

各种细胞类型也可用于上文描述的各种方法中的任一种中，以便经由核酸酶试剂修饰基因组基因座。在特定的实施方案中，所述细胞为真核细胞、非大鼠真核细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类诱导的多潜能细胞(iPS)细胞、哺乳动物细胞、人类细胞、成纤维细胞、啮齿动物细胞、非大鼠啮齿动物细胞、小鼠细胞、仓鼠细胞或CHO细胞。

提供组合物，其包含在干扰白细胞素-2受体γ基因座中或在ApoE基因座中具有靶向基因修饰的基因修饰的非人类动物。本文提供的各种方法和组合物允许这些修饰的基因座经由种系传递。

在特定的实施方案中，基因修饰的非人类动物或基因修饰的多潜能或非多潜能细胞包含在干扰白细胞素-2γ受体基因座中具有靶向基因修饰或在ApoE基因座中具有靶向基因修饰的基因组基因座，其中所述干扰白细胞素-2γ受体基因组基因座或所述ApoE基因座包含：(i)缺失所述干扰白细胞素-2γ受体基因座的至少一部分或所述ApoE基因座的至少一部分；(ii)异源核酸序列插入所述ApoE基因座中或插入所述干扰白细胞素-2γ受体基因座中；或(iii)其组合，其中所述基因修饰的基因组基因座能够经由种系传递。

进一步提供了允许产生这样的基因修饰的非人类动物和这样的基因修饰的多潜能细胞的方法。这样的方法包括经由靶向基因修饰修饰在多潜能细胞中的ApoE基因组基因座或干扰白细胞素-2γ受体基因座的方法。所述方法包括(a)向所述多潜能细胞中引入包含侧接有ApoE基因座的5'同源臂和ApoE基因座的3'同源臂的插入核酸的靶向载体，(b)鉴定在目标ApoE基因组基因座处包括靶向基因修饰的基因修饰的多潜能细胞，其中所述靶向基因修饰能够经由种系传递。

另外的方法包括(a)向所述多潜能细胞中引入包含侧接有所述干扰白细胞素-2受体γ基因座的5'同源臂和所述干扰白细胞素-2受体γ基因座的3'同源臂的插入核酸的靶向载体，(b)鉴定在所述干扰白细胞素-2受体γ基因座处包括靶向基因修饰的基因修饰的多潜能细胞，其中所述靶向基因修饰能够经由种系传递。

iii.在靶基因座处整合多个目标多核苷酸的方法

本文提供的各种方法和组合物允许靶向整合多个目标多核苷酸与给定的靶基因座。上文阐述的各种方法可依次重复以允许任何数目的插入核酸靶向整合到给定的靶基因座中。因此，提供各种方法以将至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个插入核酸插入靶基因座中。在特定的实施方案中，这样的连续铺装方法允许由真核细胞如非大鼠真核细胞、哺乳动物细胞(即，人类、非人类、啮齿动物、非大鼠啮齿动物、小鼠、猴、大鼠、仓鼠、家养哺乳动物或农业动物)的大基因组区重建成靶基因座。在这样的情况下，包括编码区和非编码区两者的基因组区的转移和重建允许通过至少部分地保留在天然基因组区内发现的编码区、非编码区和拷贝数变异来保持给定区的复杂性。因此，所述各种方法提供例如在任何真核细胞、任何非大鼠真核细胞、任何哺乳动物细胞或目标动物内、特别是在原核宿主细胞内或在非多潜能细胞、多潜能细胞或ES细胞内产生“杂合”或“外源”基因组区的方法。在一个非限制性实例中，产生在非人类动物(即，大鼠)内的“人源化”基因组区。本文提供在任何细胞内产生基因组区的方法。在特定的实施方案中，所述细胞为真核细胞、非大鼠真核细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类诱导的多潜能细胞(iPS)细胞、哺乳动物细胞、人类细胞、成纤维细胞、啮齿动物细胞、非大鼠啮齿动物细胞、小鼠细胞、仓鼠细胞或CHO细胞。

3.人源化基因组基因座

本文提供包含人源化基因组基因座的各种方法和组合物。本文使用的“人源化”基因组基因座是指包含至少一个人类核酸序列的非人类基因组的区。所述人源化基因组基因座可包含具有插入其中的人类DNA序列的来自任何生物体的DNA的区。在特定的实施方案中，所述生物体为真核生物、非大鼠真核生物、非人类哺乳动物、哺乳动物、人类、啮齿动物、非大鼠啮齿动物、大鼠、小鼠或仓鼠。例如，“人源化大鼠基因座”包含具有插入其中的人类DNA序列的大鼠DNA的区。

所述人类DNA序列可为天然存在的人类DNA序列或者其可自其天然形式修饰。在特定的实施方案中，所述人类DNA与天然人类序列共有至少85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性。如果人类序列不是天然人类序列，则与直系同源非人类序列相比，其与天然类似序列至少具有更大的序列同一性。此外，所述人类DNA序列可包含cDNA、人类基因组DNA的区、非编码调控区或人类DNA的编码、基因组或调控区的任何部分。插入非人类基因座中的人类DNA序列可包含如在本文中的其它地方描述的插入多核苷酸中的任一种。在特定的实施方案中，所述人类DNA序列与所述非人类靶基因座直系同源，而在其它情况下，所述人类DNA序列与所述非人类靶基因座同源。

在一个实施方案中，所述靶向基因修饰为插入同源或直系同源人类核酸序列或用其替换内源核酸序列。在一个实施方案中，所述靶向基因修饰包括在包含相应非人类核酸序列的内源基因座处插入同源或直系同源的人类核酸序列或用其替换内源核酸序列。

制造人源化基因座的方法包括向包含核酸的靶基因座中引入人类核酸序列。在一个实施方案中，提供制造人源化非人类动物的方法。这一方法包括：(a)用包含插入核酸的靶向载体修饰非人类多潜能细胞或非多潜能细胞的基因组以形成供体细胞，所述插入核酸包含人类核酸序列；(b)将所述供体细胞引入宿主胚胎中；和(c)在代孕母体中孕育所述宿主胚胎；其中所述代孕母体生成包含所述人类核酸序列的子代。在特定的实施方案中，所述人源化基因座能够经由种系传递。在另一实施方案中，所述靶向载体包括大靶向载体(LTVEC)且包含人类核酸序列的所述插入核酸为至少5kb。

在其它方法中，所述人源化基因组基因座通过经由细菌同源重组(BHR)修饰核酸的靶基因座制造。所述方法包括向原核细胞中引入包含侧接有5'同源臂和3'同源臂的插入核酸的靶向载体，其中所述插入核酸包含人类核酸序列，且其中所述原核细胞包含核酸且能够表达介导在靶基因座处的BHR的重组酶。

所述人源化基因组基因座可包含(a)插入同源或直系同源人类核酸序列；(b)用同源或直系同源人类核酸序列替换内源核酸序列；或(c)其组合。在特定的实施方案中，所述人源化基因组基因座能够经由种系传递。在其它实施方案中，所述人类直系同源序列替换在非人类基因座中见到的相应序列。

任何人类核酸序列都可用于本文提供的方法和组合物中。可用于所述方法和组合物中的人类核酸序列的非限制性实例在本文中的其它地方详细论述。

插入目标基因座中的人类核酸序列可为任何尺寸。在一个实施方案中，所述人类核酸序列可为约500个核苷酸-约200kb、约500个核苷酸-约5kb、约5kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb或约190kb-约200kb。在一个特定的实施方案中，所述人类核酸序列为至少5kb。

在一个实施方案中，提供基因组基因座，其中所述同源或直系同源人类核酸序列包含(a)一个或多个未重排的人类免疫球蛋白重链V_H基因片段、一个或多个未重排的人类免疫球蛋白重链D基因片段和一个或多个未重排的人类免疫球蛋白重链J_H基因片段，其操作性连接哺乳动物重链恒定区核酸序列；(b)操作性连接哺乳动物免疫球蛋白重链恒定区核酸序列的重排的人类免疫球蛋白重链可变区核酸序列；(c)一个或多个未重排的人类免疫球蛋白V_κ或V_λ基因片段和一个或多个未重排的人类免疫球蛋白J_κ或J_λ基因片段，其操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列；或(d)操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列的重排的人类免疫球蛋白λ或κ轻链可变区核酸序列。

在另一实施方案中，提供基因组基因座，其中(a)所述哺乳动物免疫球蛋白重链恒定区核酸序列为恒定区核酸序列、人类恒定区核酸序列或其组合；或(b)所述哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列为大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。

在一个特定的实施方案中，提供基因组基因座，其中所述免疫球蛋白重链恒定区核酸序列选自或包含CH1、铰链、CH2、CH3和/或其组合。

在一个实施方案中，所述基因组基因座包含一个或多个功能性人类V_H基因片段，所述功能性人类V_H基因片段包括V_H1-2、V_H1-3、V_H1-8、V_H1-18、V_H1-24、V_H1-45、V_H1-46、V_H1-58、V_H1-69、V_H2-5、V_H2-26、V_H2-70、V_H3-7、V_H3-9、V_H3-11、V_H3-13、V_H3-15、V_H3-16、V_H3-20、V_H3-21、V_H3-23、V_H3-30、V_H3-30-3、V_H 3-30-5、V_H3-33、V_H3-35、V_H3-38、V_H3-43、V_H3-48、V_H3-49、V_H3-53、V_H3-64、V_H3-66、V_H3-72、V_H3-73、V_H3-74、V_H4-4、V_H4-28、V_H4-30-1、V_H4-30-2、V_H4-30-4、V_H4-31、V_H4-34、V_H4-39、V_H4-59、V_H4-61、V_H5-51、V_H6-1、V_H7-4-1、V_H7-81或其组合。

在一个实施方案中，所述基因组基因座包含一个或多个功能性人类D基因片段，所述功能性人类D基因片段包括D1-1、D1-7、D1-14、D1-20、D1-26、D2-2、D2-8、D2-15、D2-21、D3-3、D3-9、D3-10、D3-16、D3-22、D4-4、D4-11、D4-17、D4-23、D5-12、D5-5、D5-18、D5-24、D6-6、D6-13、D6-19、D6-25、D7-27或其组合。

在一个实施方案中，所述基因组基因座包含一个或多个功能性J_H基因片段，所述功能性J_H基因片段包括J_H1、J_H2、J_H3、J_H4、J_H5、J_H6和/或其组合。在一个实施方案中，所述插入核酸包含一个或多个人类Vκ基因片段，所述人类Vκ基因片段包括Vκ4-1、Vκ5-2、Vκ7-3、Vκ2-4、Vκ1-5、Vκ1-6、Vκ3-7、Vκ1-8、Vκ1-9、Vκ2-10、Vκ3-11、Vκ1-12、Vκ1-13、Vκ2-14、Vκ3-15、Vκ1-16、Vκ1-17、Vκ2-18、Vκ2-19、Vκ3-20、Vκ6-21、Vκ1-22、Vκ1-23、Vκ2-24、Vκ3-25、Vκ2-26、Vκ1-27、Vκ2-28、Vκ2-29、Vκ2-30、Vκ3-31、Vκ1-32、Vκ1-33、Vκ3-34、Vκ1-35、Vκ2-36、Vκ1-37、Vκ2-38、Vκ1-39、Vκ2-40或其组合。

在一个实施方案中，所述基因组基因座包含一个或多个人类Vλ基因片段，所述人类Vλ基因片段包括Vλ3-1、Vλ4-3、Vλ2-8、Vλ3-9、Vλ3-10、Vλ2-11、Vλ3-12、Vλ2-14、Vλ3-16、Vλ2-18、Vλ3-19、Vλ3-21、Vλ3-22、Vλ2-23、Vλ3-25、Vλ3-27或其组合。

在一个实施方案中，所述基因组基因座包含一个或多个人类Jκ基因片段，所述人类Jκ基因片段包括Jκ1、Jκ2、Jκ3、Jκ4、Jκ5或其组合。

在又一实施方案中，提供包括人源化基因组基因座的基因组基因座，所述人源化基因组基因座包含人类干扰白细胞素-2受体(IL2R)核酸序列或其变体或片段。在特定的实施方案中，所述IL2R核酸序列包含干扰白细胞素-2受体α、干扰白细胞素-2受体β或干扰白细胞素-2受体γ核酸序列或其变体或片段。

在其它实施方案中，基因组基因座包括人源化基因组基因座，所述人源化基因组基因座包含替换非人类ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应同源或直系同源部分的人类ApoE基因座、人类干扰白细胞素-2受体γ基因座、人类Rag2基因座、人类Rag1基因座和/或人类Rag2/Rag1基因座的一部分。在一个实施方案中，IL-2Rg的非人类胞外结构域用人类IL-2Rg的胞外结构域替换，分子的其余部分来自非人类。

在另一实施方案中，提供基因修饰的非人类动物，其包含人源化基因组基因座。这样的基因修饰的非人类动物包含(a)插入同源或直系同源人类核酸序列；(b)在内源基因组基因座处用同源或直系同源人类核酸序列替换核酸序列；或(c)其组合，其中所述人源化基因组基因座能够经由种系传递。

还提供包含本文提供且如上所述的各种人源化基因组基因座中的任一种的包括非人类动物的基因修饰的动物。

4.目标多核苷酸

任何目标多核苷酸都可包含在各种插入核酸中且由此在靶基因座处整合。本文公开的方法提供整合到所述靶基因组基因座中的至少1、2、3、4、5、6个或更多个目标多核苷酸。

在所述插入核酸内的目标多核苷酸当在所述靶基因组基因座处整合时可将一种或多种基因修饰引入细胞中。所述基因修饰可包括缺失内源核酸序列和/或将外源或异源或直系同源多核苷酸添加到所述靶基因组基因座中。在一个实施方案中，所述基因修饰包括在所述靶基因组基因座处用目标外源多核苷酸替换内源核酸序列。因此，本文提供的方法允许基因修饰产生，所述基因修饰包括敲除、缺失、插入、替换(“敲入”)、点突变、结构域交换、外显子交换、内含子交换、调控序列交换、基因交换或其组合。这样的交换可在将第一、第二、第三、第四、第五、第六、第七或任何随后的插入核酸整合到靶基因组基因座中后发生。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可包括对其引入的细胞为天然的序列；对其引入的细胞可为异源的目标多核苷酸；对其引入的细胞可为外源的目标多核苷酸；对其引入的细胞可为直系同源的目标多核苷酸；或可来自与其引入的细胞不同的物种的目标多核苷酸。本文中关于在靶基因座处插入的序列使用的“天然”为序列对于具有所述靶基因座的细胞为天然的或对于靶基因座来源于其(即，来自大鼠)的细胞为天然的序列。在本文中关于序列使用的“异源”包括如下序列，其来源于外来物种或如果来源于相同物种，则在本质上不同或通过故意人类干预由其天然形式在组成和/或基因组基因座方面修饰。在本文中关于序列使用的“外源”为序列来源于外来物种。目标多核苷酸可来自任何目标生物体，所述目标生物体包括但不限于非人类、啮齿动物、非大鼠啮齿动物、仓鼠、小鼠、大鼠、人类、猴、农业哺乳动物或非农业哺乳动物。所述目标多核苷酸可进一步包含编码区、非编码区、调控区或基因组DNA。因此，随后插入核酸中的第一、第二、第三、第四、第五、第六、第七插入核酸和/或任一种可包含这样的序列。

在一个实施方案中，在所述插入核酸内和/或在所述靶基因座处整合的目标多核苷酸对于小鼠核酸序列、人类核酸、非人类核酸、真核核酸、非大鼠真核核酸、非人类哺乳动物核酸、哺乳动物核酸、啮齿动物核酸、非大鼠啮齿动物核酸、大鼠核酸、仓鼠核酸、猴核酸、农业哺乳动物核酸或非农业哺乳动物核酸为天然的。在更进一步的实施方案中，在所述靶基因座处整合的目标多核苷酸为基因组核酸的片段。在一个实施方案中，所述基因组核酸为小鼠基因组核酸、人类基因组核酸、非人类核酸、真核核酸、非大鼠真核核酸、非人类哺乳动物核酸、哺乳动物核酸、啮齿动物核酸、非大鼠啮齿动物核酸、大鼠核酸、仓鼠核酸、猴核酸、农业哺乳动物核酸或非农业哺乳动物核酸或其组合。

在一个实施方案中，如上所述，所述目标多核苷酸可为约500个核苷酸-约200kb。所述目标多核苷酸可为约500个核苷酸-约5kb、约5kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约30kb、约30kb-约40kb、约40kb-约50kb、约60kb-约70kb、约80kb-约90kb、约90kb-约100kb、约100kb-约110kb、约120kb-约130kb、约130kb-约140kb、约140kb-约150kb、约150kb-约160kb、约160kb-约170kb、约170kb-约180kb、约180kb-约190kb、或约190kb-约200kb、约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

在插入核酸内的和/或在靶基因组基因座处插入的目标多核苷酸可编码多肽，可编码miRNA，或者其可包含任何目标调控区或非编码区，包括例如调控序列、启动子序列、增强子序列、转录阻遏子-结合序列，或缺失非蛋白编码序列，但不包括缺失蛋白-编码序列。另外，在插入核酸内的和/或在靶基因组基因座处插入的目标多核苷酸可编码在神经系统、骨骼系统、消化系统、循环系统、肌肉系统、呼吸系统、心血管系统、淋巴系统、内分泌系统、泌尿系统、生殖系统或其组合中表达的蛋白质。在一个实施方案中，在插入核酸内的和/或在靶基因组基因座处插入的目标多核苷酸编码在骨髓或源自骨髓的细胞中表达的蛋白质。在一个实施方案中，在插入核酸内的和/或在靶基因座处整合的目标多核苷酸编码在脾细胞中表达的蛋白质。在更进一步的实施方案中，在插入核酸内的和/或在靶基因座处插入的目标多核苷酸编码在B细胞中表达的蛋白质，编码在未成熟的B细胞中表达的蛋白质或编码在成熟B细胞中表达的蛋白质。

在插入多核苷酸内的目标多核苷酸可包含ApoE基因座、Il2rg基因座、Rag1基因座、Rag2基因座和/或Rag2/Rag1基因座的一部分。这些给定基因座的所述部分在本文中的其它地方论述，照此可采用来自任何目标生物体的各种同源和直系同源区。

在一个实施方案中，在插入核酸内的和/或在靶基因座处插入的目标多核苷酸包含编码免疫球蛋白重链可变区氨基酸序列的基因组核酸序列。短语“重链”或“免疫球蛋白重链”在本文中的其它地方描述。

在一个实施方案中，在插入核酸内的和/或在靶基因座处整合的目标多核苷酸包含编码人类免疫球蛋白重链可变区氨基酸序列的基因组核酸序列。

在一个实施方案中，所述基因组核酸序列包含一个或多个未重排的人类免疫球蛋白重链V_H基因片段、一个或多个未重排的人类免疫球蛋白重链D基因片段和一个或多个未重排的人类免疫球蛋白重链J_H基因片段，其操作性连接哺乳动物重链恒定区核酸序列。在一个实施方案中，所述基因组核酸序列包含操作性连接哺乳动物重链恒定区核酸序列的重排的人类免疫球蛋白重链可变区核酸序列。在一个实施方案中，所述基因组核酸序列包含一个或多个未重排的人类免疫球蛋白V_κ或V_λ基因片段和一个或多个未重排的人类免疫球蛋白J_κ或J_λ基因片段，其操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列。在一个实施方案中，所述基因组核酸序列包含操作性连接哺乳动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列的重排的人类免疫球蛋白λ或κ轻链可变区核酸序列。在一个实施方案中，所述重链恒定区核酸序列包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。在一个实施方案中，所述免疫球蛋白λ或κ轻链恒定区核酸包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。

在一个实施方案中，所述免疫球蛋白重链恒定区核酸序列选自或包含CH1、铰链、CH2、CH3和/或其组合。在一个实施方案中，所述重链恒定区核酸序列包含CH1-铰链-CH2-CH3。

在一个实施方案中，在插入核酸内的和/或在靶基因座处整合的目标多核苷酸包含编码免疫球蛋白轻链可变区氨基酸序列的基因组核酸序列。短语“轻链”包括来自任何生物体的免疫球蛋白轻链序列且在本文中的其它地方描述。

在一个实施方案中，在插入核酸内的和/或在靶基因组基因座处整合的目标多核苷酸包含编码人类免疫球蛋白轻链可变区氨基酸序列的基因组核酸序列。

在一个实施方案中，所述基因组核酸序列包含一个或多个未重排的人类免疫球蛋白V_κ或V_λ基因片段和一个或多个未重排的人类免疫球蛋白J_κ或J_λ基因片段，其操作性连接啮齿动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列。在一个实施方案中，所述基因组核酸序列包含操作性连接啮齿动物免疫球蛋白λ或κ轻链轻链恒定区核酸序列的重排的人类免疫球蛋白λ或κ轻链可变区核酸序列。在一个实施方案中，所述轻链恒定区核酸序列包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。在一个实施方案中，所述免疫球蛋白λ或κ轻链恒定区核酸包含大鼠恒定区核酸序列、人类恒定区核酸序列或其组合。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可编码细胞外蛋白质或用于受体的配体。在特定的实施方案中，编码的配体为细胞因子。目标细胞因子包括选自或包括CCL、CXCL、CX3CL和/或XCL的趋化因子。所述细胞因子还可包括肿瘤坏死因子(TNF)。在其它实施方案中，所述细胞因子为白细胞介素(IL)。在一个实施方案中，所述白细胞介素选自或包括IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、IL-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35和/或IL-36。在一个实施方案中，所述白细胞介素为IL-2。在特定的实施方案中，在插入核酸内的和/或在靶基因组基因座处整合的这样的目标多核苷酸来自人类，且在更特定的实施方案中，其可包含人类基因组序列。

在插入核酸内的和/或在靶基因组基因座处整合的目标多核苷酸可编码脱脂蛋白E(ApoE)。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可编码胞浆蛋白或膜蛋白。在一个实施方案中，所述膜蛋白为受体，例如细胞因子受体、白细胞介素受体、白细胞介素2受体-α、干扰白细胞素-2受体β、干扰白细胞素-2受体γ或受体酪胺酸激酶。在其它情况下，在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可包含靶基因座的直系同源或同源区。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可包括编码包括T细胞受体α的T细胞受体的至少一个区的多核苷酸。在特定方法中，所述插入核酸中的每一种包含T细胞受体基因座(即，T细胞受体α基因座)的基因组区，因此在连续整合完成后，基因组T细胞受体基因座的一部分或整体已经在靶基因座处整合。这样的插入核酸可包含T细胞受体基因座(即，T细胞受体α基因座)的可变片段或接合片段中的至少一个或多个。在更进一步的实施方案中，编码T细胞受体的区的目标多核苷酸可来自例如编码突变体蛋白的真核生物、非大鼠真核生物、哺乳动物、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、小鼠、大鼠、人类、猴、仓鼠、农业哺乳动物或家养哺乳动物多核苷酸。

在其它实施方案中，在靶基因座处整合的目标多核苷酸编码核蛋白。在一个实施方案中，所述核蛋白为核受体。在特定的实施方案中，在插入核酸内的和/或在靶基因座处整合的这样的目标多核苷酸来自人类，且在更特定的实施方案中，其可包含人类基因组序列。

在插入核酸内的和/或在靶基因组基因座处整合的目标多核苷酸可包含在编码序列中的基因修饰。这样的基因修饰包括但不限于编码序列的缺失突变或两个编码序列的融合。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸可包含编码包括例如人类突变体蛋白的突变体蛋白的多核苷酸。在一个实施方案中，所述突变体蛋白的特征在于改变的结合特性、改变的定位、改变的表达和/或改变的表达模式。在一个实施方案中，在插入核酸内的和/或在靶基因座处整合的目标多核苷酸包含至少一种疾病等位基因，所述疾病等位基因包括例如神经病等位基因、心血管疾病等位基因、肾病等位基因、肌肉疾病等位基因、血液病等位基因、致癌基因的等位基因或免疫系统疾病等位基因。在这样的情况下，所述疾病等位基因可为显性等位基因或所述疾病等位基因为隐性等位基因。此外，所述疾病等位基因可包括单一核苷酸多态性(SNP)等位基因。编码突变体蛋白的目标多核苷酸可来自任何生物体，其包括但不限于编码突变体蛋白的真核生物、非大鼠真核生物、哺乳动物、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、小鼠、大鼠、人类、仓鼠、猴、农业哺乳动物或家养哺乳动物多核苷酸。

在一个实施方案中，所述基因修饰生成例如大鼠ApoE基因座的ApoE基因座的区的缺失、添加、替换或其组合，其中在所述ApoE基因座处的基因修饰引起ApoE活性减小。在一个实施方案中，产生ApoE敲除。

在一个实施方案中，所述基因修饰生成例如大鼠Rag1基因座的Rag1基因座的区的缺失、添加、替换或其组合，其中在所述Rag1基因座处的基因修饰引起Rag1活性减小。在一个实施方案中，产生Rag1敲除。在一个实施方案中，所述基因修饰生成例如大鼠Rag2基因座的Rag2基因座的区的缺失、添加、替换或其组合，其中在所述Rag2基因座处的基因修饰引起Rag2活性减小。在一个实施方案中，产生Rag2敲除。在一个实施方案中，所述基因修饰生成例如大鼠Rag1/Rag2基因座的Rag1/Rag2基因座的区的缺失、添加、替换或其组合，其中在所述Rag1/Rag2基因座处的基因修饰引起Rag1活性减小和Rag2活性减小。在一个实施方案中，产生Rag1/Rag2敲除。

在一个实施方案中，所述基因修饰生成例如大鼠干扰白细胞素-2受体γ基因座的干扰白细胞素-2受体γ基因座的区的缺失、添加、替换或其组合，其中在干扰白细胞素-2受体γ基因座处的基因修饰引起干扰白细胞素-2受体γ减小。在一个实施方案中，产生干扰白细胞素-2受体γ敲除。

如在本文中的其它地方论述，本文提供的其它实施方案包括例如大鼠ApoE基因座、大鼠干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座中的一种或多种经由用来自另一生物体的ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的相应直系同源部分替换大鼠ApoE基因座、干扰白细胞素-2受体γ基因座、Rag2基因座、Rag1基因座和/或Rag2/Rag1基因座的一部分修饰。

在一个实施方案中，产生多种基因修饰。在一个实施方案中，基因修饰生成例如大鼠干扰白细胞素-2受体γ基因座的干扰白细胞素-2受体γ基因座的区的缺失、添加、替换或其组合，其中在所述干扰白细胞素-2受体γ基因座处的基因修饰引起干扰白细胞素-2受体γ减小，且第二基因修饰生成大鼠Rag2基因座的区的缺失、添加、替换或其组合，其中在Rag2基因座处的基因修饰引起Rag2活性减小。在一个实施方案中，产生干扰白细胞素-2受体γ/Rag2敲除。这一大鼠具有SCID表型。

在一个实施方案中，所述哺乳动物核酸包含编码在神经系统、骨骼系统、消化系统、循环系统、肌肉系统、呼吸系统、心血管系统、淋巴系统、内分泌系统、泌尿系统、生殖系统或其组合中表达的蛋白质的基因组基因座。在一个实施方案中，所述哺乳动物核酸包含编码在骨髓或源自骨髓的细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述核酸包含编码在脾细胞中表达的蛋白质的基因组基因座。在一个实施方案中，所述基因组基因座包含小鼠基因组DNA序列、大鼠基因组DNA序列、人类基因组DNA序列或其组合。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和人类基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的小鼠和大鼠基因组DNA序列。在一个实施方案中，所述基因组基因座包含以任何顺序的大鼠、小鼠和人类基因组DNA序列。

在一个实施方案中，所述插入核酸包含在基因的编码序列中的基因修饰。在一个实施方案中，所述基因修饰包括在编码序列中的缺失突变。在一个实施方案中，所述基因修饰包括两种内源编码序列的融合。

在一个实施方案中，所述基因修饰包括非蛋白编码序列的缺失，但不包括蛋白编码序列的缺失。在一个实施方案中，所述非蛋白编码序列的缺失包括调控元件的缺失。在一个实施方案中，所述基因修饰包括启动子的添加。在一个实施方案中，所述基因修饰包括启动子或调控元件的替换。在一个实施方案中，所述调控元件为增强子。在一个实施方案中，所述调控元件为转录阻遏子-结合元件。

在一个实施方案中，所述基因修饰包括放置编码突变体人类蛋白的人类核酸序列。在一个实施方案中，所述基因修饰包含人类基因的至少一种人类疾病等位基因。在一个实施方案中，所述人类疾病为神经病。在一个实施方案中，所述人类疾病为心血管疾病。在一个实施方案中，所述人类疾病为肾病。在一个实施方案中，所述人类疾病为肌肉疾病。在一个实施方案中，所述人类疾病为血液病。在一个实施方案中，所述人类疾病为癌症。在一个实施方案中，所述人类疾病为免疫系统疾病。在一个实施方案中，所述人类疾病等位基因为显性等位基因。在一个实施方案中，所述人类疾病等位基因为隐性等位基因。在一个实施方案中，所述人类疾病等位基因包括单一核苷酸多态性(SNP)等位基因。

在插入核酸内的和/或在靶基因座处整合的目标多核苷酸还可包含包括例如启动子序列、增强子序列或转录阻遏子-结合序列的调控序列。在特定的实施方案中，在插入核酸内的和/或在靶基因组基因座处整合的目标多核苷酸包括具有非蛋白编码序列缺失、但不包含蛋白编码序列的缺失的多核苷酸。在一个实施方案中，所述非蛋白编码序列的缺失包括调控序列的缺失。在另一实施方案中，所述调控元件的缺失包括启动子序列的缺失。在一个实施方案中，所述调控元件的缺失包括增强子序列的缺失。这一目标多核苷酸可来自任何生物体，其包括但不限于编码突变体蛋白的真核生物、非大鼠真核生物、哺乳动物、非人类哺乳动物、啮齿动物、非大鼠啮齿动物、小鼠、大鼠、人类、猴、农业哺乳动物或家养哺乳动物多核苷酸。

5.引入序列并产生转基因动物的方法

如上概述，本文提供允许将一种或多种目标多核苷酸靶向整合到靶基因座中的方法和组合物。这样的系统采用多种组分，且为了便于提及，在本文中术语“靶向整合系统”在属类上包含整合事件中需要的所有组分(即，在非限制性实例中，各种核酸酶试剂、识别位点、插入DNA多核苷酸、靶向载体、靶基因组基因座和/或目标多核苷酸)。

本文提供的方法包括向细胞中引入包含靶向基因组整合系统的各种组分的一种或多种多核苷酸或多肽构建体。“引入”以使得序列进入细胞内部的方式而将序列呈递到细胞中(多肽或多核苷酸)。本文提供的方法并不取决于将靶向基因组整合系统的任何组分引入细胞中的特定方法，而只是使多核苷酸进入至少一个细胞的内部。将多核细胞引入各种细胞类型中的方法在本领域中已知且包括但不限于稳定的转染方法、瞬时的转染方法和病毒介导的方法。

来自任何生物体的任何细胞都可用于本文提供的方法中。在特定的实施方案中，所述细胞来自真核生物、非大鼠真核生物、哺乳动物、非人类哺乳动物、人类、啮齿动物、非大鼠啮齿动物、大鼠、小鼠或仓鼠。在特定的实施方案中，所述细胞为真核细胞、非大鼠真核细胞、多潜能细胞、非多潜能细胞、非人类多潜能细胞、非人类哺乳动物细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、人类诱导的多潜能细胞(iPS)细胞、哺乳动物细胞、人类细胞、成纤维细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞或CHO细胞。

在一些实施方案中，在所述方法和组合物中采用的细胞具有稳定地并入其基因座中的DNA构建体。“稳定地并入”或“稳定地引入”是指将多核苷酸引入细胞中，因此核苷酸序列整合到细胞的基因组中且能够由其子代遗传。可使用用于稳定地并入DNA构建体或靶向基因组整合系统的各种组分的任何方案。

可改变转染方案以及将多肽或多核苷酸序列引入细胞中的方案。非限制性转染方法包括基于化学的转染方法，其包括使用脂质体；纳米粒子；磷酸钙(Graham等人，(1973).Virology 52(2):456-67；Bacchetti等人，(1977)Proc Natl Acad Sci USA 74(4):1590-4；和Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman and Company.第96-97页)；树状体；或阳离子聚合物，例如DEAE-葡聚糖或聚乙烯亚胺。非化学方法包括电穿孔；声孔效应；和光学转染。基于颗粒的转染包括使用基因枪、磁铁辅助转染(Bertram,J.(2006)Current Pharmaceutical Biotechnology 7,277-28)。病毒方法也可用于转染。

在一个实施方案中，向细胞中引入一种或多种多核苷酸通过电穿孔、胞浆内注射、病毒感染、腺病毒、慢病毒、反转录病毒、转染、脂质介导的转染介导，或者经由Nucleofection^TM介导。

在一个实施方案中，向细胞中引入一种或多种多核苷酸进一步包括：引入包含操作性连接启动子的目标核酸序列的表达构建体。在一个实施方案中，所述启动子为组成性活性启动子。在一个实施方案中，所述启动子为可诱导的启动子。在一个实施方案中，所述启动子在例如胚胎干细胞的干细胞中具有活性。

在一个实施方案中，所述表达构建体与所述LTVEC一起引入。在一个实施方案中，所述表达构建体与所述LTVEC单独地经一段时间引入。

在一个实施方案中，向所述细胞中引入所述一种或多种多核苷酸可经一段时间执行多次。在一个实施方案中，向所述细胞中引入所述一种或多种多核苷酸可经一段时间执行至少两次，经一段时间执行至少三次，经一段时间执行至少四次，经一段时间执行至少五次，经一段时间执行至少六次，经一段时间执行至少七次，经一段时间执行至少八次，经一段时间执行至少九次，经一段时间执行至少十次，经一段时间执行至少十一次，经一段时间执行至少十二次，经一段时间执行至少十三次，经一段时间执行至少十四次，经一段时间执行至少十五次，经一段时间执行至少十六次，经一段时间执行至少十七次，经一段时间执行至少十八次，经一段时间执行至少十九次或经一段时间执行至少二十次。

在一个实施方案中，所述核酸酶试剂与靶向载体或大靶向载体(LTVEC)同时引入细胞中。可选地，所述核酸酶试剂经一段时间与靶向载体或LTVEC单独地引入。在一个实施方案中，所述核酸酶试剂在引入靶向载体或LTVEC之前引入，而在其它实施方案中，所述核酸酶试剂在引入靶向载体或LTVEC之后引入。

在一个实施方案中，筛选步骤包括用于测定亲本染色体的等位基因(MOA)的修饰的定量测定。在一个实施方案中，所述定量测定经由定量PCR进行。在一个实施方案中，所述定量PCR为实时PCR(qPCR)。在一个实施方案中，所述实时PCR包括识别靶基因座的第一引物集和识别非靶向参考基因座的第二引物集。在一个实施方案中，所述引物集包括识别扩增序列的荧光探针。在一个实施方案中，所述定量测定经由荧光介导的原位杂化(FISH)进行。在一个实施方案中，所述定量测定经由对比基因组杂化进行。在一个实施方案中，所述定量测定经由等温DNA扩增进行。在一个实施方案中，所述定量测定经由等温DNA扩增进行。在一个实施方案中，所述定量测定经由对一种或多种固定的探针定量杂化进行。在一个实施方案中，所述定量测定经由Invader进行。在一个实施方案中，所述定量测定经由MMP进行。在一个实施方案中，所述定量测定经由分子信标进行。在一个实施方案中，所述定量测定经由Eclipse^TM探针技术进行。(参见，例如US2005/0144655，其以引用的方式并入本文中)。

进一步提供用于制造人源化非人类动物的方法，其包括：(a)用包含插入核酸的靶向载体修饰多潜能细胞的基因组以形成供体细胞，所述插入核酸包含人类核酸序列；(b)将所述供体细胞引入宿主胚胎中；和(c)在代孕母体中孕育所述宿主胚胎，其中所述代孕母体生成包含所述人类核酸序列的子代。在一个实施方案中，所述供体细胞引入处于胚泡段或处于前桑椹胚阶段(即，4-细胞阶段或8-细胞阶段)的宿主胚胎中。此外，步骤(a)也可用至少5kb长的大靶向载体(LTVEC)和/或人类核酸序列执行。在更进一步的实施方案中，所述基因修饰能够经由种系传递。

基因修饰的非人类动物可采用本文公开的各种方法产生。这样的方法包括(1)采用本文公开的方法在多潜能细胞的靶基因座处整合一种或多种目标多核苷酸以产生在靶向基因组基因座中包含插入核酸的基因修饰的多潜能细胞；(2)选择在所述靶基因组基因座处具有所述一种或多种目标多核苷酸的基因修饰的多潜能细胞；(3)将所述基因修饰的多潜能细胞引入宿主胚胎中；和(4)将包含所述基因修饰的多潜能细胞的宿主胚胎植入代孕母体中。产生来自基因修饰的多潜能细胞的子代。在一个实施方案中，所述供体细胞引入处于胚泡段或处于前桑椹胚阶段(即，4-细胞阶段或8-细胞阶段)的宿主胚胎中。产生能够经由种系传递基因修饰的子代。所述多潜能细胞可为如在本文中的其它地方论述的ES细胞。

也可使用核移植技术以产生基因修饰的非人类动物。简要地讲，用于核移植的方法包括以下步骤：(1)使卵细胞去核；(2)分离供体细胞或核以与去核的卵细胞合并；(3)将所述细胞或核插入所述去核的卵细胞中以形成重构细胞；(4)将所述重构细胞植入动物的子宫中以形成胚胎；和(5)允许所述胚胎发育。在这样的方法中，卵细胞通常从死动物中找回，不过它们也可自活动物的输卵管和/或卵巢中分离。卵细胞可在去核之前在本领域的普通技术人员已知的多种培养基中成长。卵细胞的去核可以本领域的普通技术人员众所周知的许多方式执行。将供体细胞或核插入去核的卵细胞中以形成重构的细胞通常在融合之前在透明带下微量注射供体细胞进行。融合可通过跨接触/融合平面应用DC电脉冲(电融合)、通过将细胞暴露于促进融合的化学品如聚乙二醇或通过例如仙台病毒(Sendai virus)的灭活病毒诱导。重构细胞通常在核供体和受体卵细胞融合之前、期间和/或之后通过电力和/或非电力方法激活。激活方法包括电脉冲、化学诱导冲击、精液渗透、增加二价阳离子在卵细胞中的水平和降低细胞蛋白在卵细胞中的磷酸化(如通过激酶抑制剂)。激活的重构细胞或胚胎通常在本领域的普通技术人员众所周知的培养基中培养且随后移植到动物的子宫中。参见，例如US20080092249、WO/1999/005266A2、US20040177390、WO/2008/017234A1和美国专利7,612,250号，其各自以引用的方式并入本文中。

一方面，提供一种用于制造基因修饰的非人类动物的方法，其包括采用核酸内切酶介导的基因靶向修饰在多潜能细胞中的目标基因组基因座以在目标基因组基因座处引入修饰以形成修饰的多潜能细胞，在足以维持多潜能性的条件下维持所述修饰的多潜能细胞，采用所述修饰的多潜能细胞作为在宿主胚胎中的供体细胞，和在代孕母体中孕育包含所述修饰的多潜能细胞的宿主胚胎，其中所述宿主胚胎通过所述代孕母体孕育且生出基因修饰的子代。

在一个实施方案中，所述靶序列位于内含子中。在一个实施方案中，所述靶序列位于外显子中。在一个实施方案中，所述靶序列位于启动子中。在一个实施方案中，所述靶序列位于启动子调控区中。在一个实施方案中，所述靶序列位于增强子区中。

在一个实施方案中，引入步骤使用识别不同靶序列的多种核酸内切酶经一段时间执行多次。在一个实施方案中，步骤使用识别不同靶序列的多种核酸内切酶经一段时间执行至少两次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少三次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少四次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少五次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少六次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少七次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少八次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少九次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十一次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十二次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十三次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十四次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十五次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十六次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十七次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十八次，使用识别不同靶序列的多种核酸内切酶经一段时间执行至少十九次或使用识别不同靶序列的多种核酸内切酶经一段时间执行至少二十次。

在一个实施方案中，引入步骤通过电穿孔、胞浆内注射、腺病毒、慢病毒、反转录病毒、转染、脂质介导的转染介导，或者经由Nucleofection^TM介导。

在一个实施方案中，所述方法进一步包括将外源核酸引入所述基因修饰的多潜能细胞中。在一个实施方案中，所述外源核酸为转基因。在一个实施方案中，所述外源核酸引入内源基因座中。在一个实施方案中，所述外源核酸异位引入(例如，在与其内源基因座不同的基因座处)。

一方面，提供一种用于制造基因修饰的非人类动物的方法，其包括采用RNA向导基因组工程化修饰在多潜能细胞中的目标基因组基因座以在目标基因组基因座处引入修饰以形成修饰的多潜能细胞，在足以维持多潜能性的条件下维持所述修饰的多潜能细胞，采用所述修饰的多潜能细胞作为在宿主胚胎中的供体细胞，和在代孕母体中孕育包含所述修饰的多潜能细胞的宿主胚胎，其中所述宿主胚胎通过所述代孕母体孕育且生出基因修饰的子代。

在一个实施方案中，所述方法具有约2％-约80％的靶向率。

在一个实施方案中，所述方法包括共同引入包含不同基因组靶序列的多种第二表达构建体以便多重编辑不同的基因组基因座。在一个实施方案中，所述方法包括经一段时间引入包含不同基因组靶序列的多种第二表达构建体以便多重编辑不同的基因组基因座。

在一个实施方案中，引入步骤经一段时间执行多次。在一个实施方案中，引入步骤(b)经一段时间执行至少两次，经一段时间执行至少三次，经一段时间执行至少四次，经一段时间执行至少五次，经一段时间执行至少六次，经一段时间执行至少七次，经一段时间执行至少八次，经一段时间执行至少九次，经一段时间执行至少十次，经一段时间执行至少十一次，经一段时间执行至少十二次，经一段时间执行至少十三次，经一段时间执行至少十四次，经一段时间执行至少十五次，经一段时间执行至少十六次，经一段时间执行至少十七次，经一段时间执行至少十八次，经一段时间执行至少十九次、经一段时间执行至少二十次。

在一个实施方案中，所述方法进一步包括将外源核酸引入包含突变等位基因的多潜能细胞中。

在一个实施方案中，所述外源核酸为转基因。在一个实施方案中，所述外源核酸引入内源基因座中。在一个实施方案中，所述外源核酸异位放置(例如，在与其内源基因座不同的基因座处)。

一方面，提供一种用于制造人源化非人类动物的方法，其包括用包含包含至少5kb的人类序列的插入物的LTVEC修饰多潜能细胞的基因组，和采用所述多潜能细胞作为供体细胞，将所述供体细胞引入宿主胚胎中，和在代孕母体中孕育所述宿主胚胎，其中所述代孕母体生出包含人源化的子代。

提供用于制造在其种系中包含一种或多种如本文所述的基因修饰的基因修饰的非人类动物的其它方法，其包括：(a)采用本文所述的各种方法修饰在原核细胞中包含的靶基因座；(b)选择在所述靶基因座处包括基因修饰的修饰的原核细胞；(c)自所述修饰的原核细胞的基因组中分离基因修饰的靶向载体；(d)将所述基因修饰的靶向载体引入多潜能细胞中以产生在所述靶基因组基因座处包含插入核酸的基因修饰的多潜能细胞；(e)选择所述基因修饰的多潜能细胞；(f)将所述基因修饰的多潜能细胞引入处于前桑椹胚阶段的宿主胚胎中；和(g)将包含所述基因修饰的多潜能细胞的宿主胚胎植入代孕母体中，以产生来源于所述基因修饰的多潜能细胞的F0代。在这样的方法中，所述靶向载体可包括大靶向载体。所述多潜能细胞可为ES细胞。在其它方法中，分离步骤(c)还包括(c1)使所述基因修饰的靶向载体(即，基因修饰的LTVEC)线化。在更进一步的实施方案中，引入步骤(d)进一步包括(d1)将如本文所述的核酸酶试剂引入多潜能细胞中。在一个实施方案中，选择步骤(b)和/或(e)通过将如本文所述的可选择的试剂应用到所述原核细胞或所述多潜能细胞来进行。在一个实施方案中，选择步骤(b)和/或(e)经由如本文所述的等位基因修饰(MOA)测定进行。

提供经由在原核细胞中的细菌同源重组(BHR)修饰哺乳动物细胞的靶基因组基因座的另外方法且其包括：(a)提供包含包含核酸的靶基因座的原核细胞，(b)向所述原核细胞中引入包含侧接有5'同源臂和3'同源臂的插入核酸的靶向载体，其中所述插入核酸包含哺乳动物区(包括例如来自人类的DNA插入物)，和(c)选择在所述靶基因座处包含插入核酸的靶向原核细胞，其中所述原核细胞能够表达介导所述BHR的重组酶。步骤(a1)可包括提供包含包含核酸的靶基因座的原核细胞，所述核酸包含包含用于第一核酸酶试剂的第一识别位点的第一多核苷酸，且步骤(b1)可进一步包括在所述原核细胞中表达在所述第一识别位点处或其附近生成切口或双链断裂的核酸酶试剂。步骤(a)-(c)可如本文公开连续地重复以允许在原核细胞中的靶基因座处引入多个插入核酸。靶基因组基因座一旦用原核细胞“建造”，则包含修饰的靶基因座的靶向载体可自原核细胞分离并引入在多潜能细胞内的靶基因组基因座中。包含修饰的基因组基因座的多潜能细胞(即，ES细胞)因此可制造成基因修饰的非人类动物。

在一些实施方案中，本文所述的靶基因组基因座的各种基因修饰可通过使用来源于细菌人造染色体(BAC)DNA的LTVEC使用基因工程技术在细菌细胞中的一系列同源重组反应(BHR)进行(参见，例如美国专利号6,586,251和Valenzuela,D.M.等人，(2003),High-throughput engineering of the mouse genome coupled with high-resolution expression analysis,Nature Biotechnology 21(6):652-659，其整体以引用的方式并入本文中)。

在一些实施方案中，包含如本文所述的各种基因修饰的靶向ES细胞作为插入物ES细胞使用并经由方法引入来自相应生物体的前桑椹胚阶段胚胎如8-细胞阶段小鼠胚胎中(参见，例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1，其所有的整体内容都以引入的方式并入本文中)。孵育包含基因修饰的ES细胞的胚胎直至胚泡阶段，且随后将其植入代孕母体中以产生F0。载有基因修饰的基因组基因座的动物可经由如本文所述的等位基因修饰(MOA)测定鉴定。来源于基因修饰的ES细胞的所得F0代非人类动物与野生型非人类动物交叉以得到F1代后代。在与特异性引物和/或探针基因分型之后，对于基因修饰的基因组基因座杂合的F1非人类动物彼此交叉以生成对于基因修饰的基因组基因座纯合的动物。可选地，可使各自具有基因修饰的F0雌性非人类动物和F0雄性非人类动物交叉以得到对于基因修饰纯合的F1非人类动物。

一方面，提供例如基因修饰的大鼠基因组，其包含用来自另一生物体的同源或直系同源的核酸序列靶向修饰内源核酸序列。

在一个实施方案中，所述同源或直系同源的核酸序列具有约5kb-约200kb的长度。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约5kb-约10kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约10kb-约20kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约20kb-约30kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约30kb-约40kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约40kb-约50kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约50kb-约60kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约60kb-约70kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约70kb-约80kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约80kb-约90kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约90kb-约100kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约100kb-约110kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约110kb-约120kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约120kb-约130kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约140kb-约150kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约150kb-约160kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约160kb-约170kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约170kb-约180kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约180kb-约190kb。在一个实施方案中，所述同源或直系同源非大鼠核酸序列为约190kb-约200kb。可在插入核酸中采用的各种目标多核苷酸在本文中的其它地方描述。

提供靶向基因组修饰非人类动物的另外方法。这样的方法可包括(a)根据本文提供的各种方法中的任一种修饰在非人类多潜能细胞中的目标基因组基因座以便修饰目标基因组基因座，由此生成包含靶向基因组修饰的基因修饰的非人类多潜能细胞；(b)将步骤(a)的修饰的非人类多潜能细胞引入非人类宿主胚胎中；和(c)在代孕母体中孕育包含所述修饰的多潜能细胞的非人类宿主胚胎，其中所述代孕母体生成包含所述靶向基因组修饰的F0子代，且其中所述靶向基因组修饰能够经由种系传递。

在一些实施方案中，所述靶向基因组修饰同时包括在目标基因组基因座处缺失内源核酸序列和在目标基因组基因座处插入外源核酸(即，在单一步骤中缺失和插入)。在一些实施方案中，所述靶向基因组修饰包括双等位基因基因修饰。所述双等位基因基因修饰可包括在两种同源染色体(即，一对第一同源染色体和第二同源染色体)中的目标基因组基因座处缺失内源核酸序列和插入外源核酸。

在其它实施方案中，所述靶向基因组修饰产生在目标基因组基因座处复合杂合的修饰的多潜能细胞。在其它实施方案中，所述靶向基因组修饰产生在目标基因组基因座处半合的修饰的多潜能细胞。在一些实施方案中，在一种染色体中的目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和外源核酸的插入。例如，所述靶向基因修饰可包括：(1)在两种同源染色体中的目标基因组基因座处缺失内源核酸序列；和(2)外源核酸插入在第一染色体中的目标基因组基因座中和破坏在第二染色体中的目标基因组基因座。所述第一染色体可为这两种同源染色体中的第一种，且所述第二染色体可为这两种同源染色体中的第二种。

6.细胞

本文所述的各种方法和组合物采用在细胞中的基因组基因座靶向系统。在一个实施方案中，细胞是多潜能细胞。在一个实施方案中，所述细胞为非多潜能细胞。在一个实施方案中，所述多潜能细胞为非人类多潜能细胞。在一个实施方案中，所述非人类多潜能细胞为哺乳动物多潜能细胞。在一个实施方案中，所述多潜能细胞为人类诱导的多潜能干(iPS)细胞。

在其它实施方案中，所述细胞为真核细胞、非大鼠真核细胞、人类多潜能细胞、人类ES细胞、人类成人干细胞、发育受限的人类祖细胞、非人类哺乳动物细胞、哺乳动物细胞、人类细胞、成纤维细胞、啮齿动物细胞、非大鼠啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞或CHO细胞。

在一个实施方案中，真核细胞为原代细胞。原代细胞包括从生物体、器官或组织中直接分离的细胞或细胞的培养物。原代细胞包括既不转化也不永生的细胞。它们包括从生物体、器官或组织中获得的任何细胞，其先前并未在组织培养物中传代，或者先前已经在组织培养物中传代，但不能在组织培养物中无限期地传代。这样的细胞可通过常规方法分离且包括例如造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质细胞、黑素细胞、单核细胞(monocyte)、单核细胞(mononuclear cell)、脂肪细胞、前成脂肪细胞、神经元、胶质细胞、肝细胞、骨骼成肌细胞和平滑肌细胞。在一些实施方案中，原代细胞来源于结缔组织、肌肉组织、神经系统组织或上皮组织。

在另一实施方案中，真核细胞为永生化细胞。永生化细胞包括来自多细胞生物体的细胞，其由于突变或改变通常将不会无限期地繁殖，具有逃避的正常细胞衰老且代之以可保持经历分裂。这样的突变或改变可自然地发生或有意诱导地发生。永生化细胞的实例包括中国仓鼠卵巢(CHO)细胞、人类胚肾细胞(例如，HEK 293细胞)和小鼠胚胎成纤维细胞(例如，3T3细胞)。许多类型的永生化细胞在本领域中众所周知。

在一些实施方案中，永生化细胞来源于癌症细胞。在另一实施方案中，原代或永生化细胞为通常用于培养或用于表达重组基因或蛋白质的细胞。

在其它实施方案中，所述多潜能细胞能够在其基因组的至少一种靶向基因修饰之后维持其多潜能性且能够传递所述靶向修饰到F1代的种系。

在一个实施方案中，所述多潜能细胞为处于单细胞阶段的非人类受精卵。在一个实施方案中，所述非人类受精卵为哺乳动物受精卵。在一个实施方案中，所述哺乳动物受精卵为处于单细胞阶段的啮齿动物受精卵。在一个实施方案中，所述哺乳动物受精卵为处于单细胞阶段的大鼠或小鼠受精卵。

在本文公开的方法和组合物中采用的各种细胞还可包括原核细胞，例如包括大肠杆菌的细菌细胞。在特定的实施方案中，所述原核细胞为大肠杆菌的重组感受态株。在一个实施方案中，所述原核细胞包含编码重组酶的核酸，而在其它情况下，所述原核细胞不包含编码所述重组酶的所述核酸，且将编码所述重组酶的所述核酸引入所述原核细胞中。在一个实施方案中，编码所述重组酶的所述核酸包含DNA或mRNA。在一些实施方案中，编码所述重组酶的所述核酸为pABG。在一个实施方案中，所述重组酶在可诱导的启动子的控制下表达。在一个实施方案中，所述重组酶的表达通过阿拉伯糖控制。

A.制造并维持人类诱导的多潜能干细胞的低渗透压度培养基

提供细胞培养基以便在本发明的方法和组合物中使用。在一个实施方案中，所述培养基适合生成人类iPS细胞群。在另一实施方案中，所述培养基适合在培养物中维持人类iPS细胞。在一些实施方案中，所述人类iPS细胞为天然的或天然外观的。

本文提供的培养基包含至少一种基础培养基、补充物、白血病抑制因子(LIF)多肽、肝糖合成酶激酶3(GSK3)抑制剂和MEK抑制剂。

本发明的培养基为低渗透压度培养基。在一个实施例中，所述渗透压度为约175-280mOsm/kg。在另外的实施例中，所述培养基的渗透压度为约180-270mOsm/kg、约200-250mOsm/kg、约220-240mOsm/kg或约225-235mOsm。在一个特定的实施方案中，所述培养基的渗透压度为约233mOsm/kg。

为本发明提供的基础培养基为向其中加入补充物的低渗透压度基础培养基。本发明的基础培养基与通常用以在培养物中维持人类iPS细胞的基础培养基不同，其包括达尔伯克改良伊格尔培养基(DMEM)，以各种形式(例如，Invitrogen DMEM，目录号1 1971-025)和作为KO-DMEM^TM购得的低盐DMEM(Invitrogen目录号10829-018)。

本文提供的基础培养基为低渗透压度培养基，但其表现出不限于低渗透压度的特性。例如，在表A中示出的DMEM制剂可通过改变如本文提供的氯化钠和/或碳酸氢钠浓度而使其适合本发明的目的，将其产生与标准DMEM基础培养基或在表A中示出的低盐DMEM基础培养基(KO-DMEM)相比较不同的渗透压度。

表A：DMEM基础培养基制剂。

本发明的基础培养基可包含碱金属和卤素的盐，例如氯化钠(NaCl)。在所述基础培养基中NaCl的例示性浓度包括50±5mM或约3mg/mL。

在另一实施方案中，所述基础培养基表现出一定浓度的碳酸盐。所述碳酸盐可为钠盐。在这一实施例中，所述钠盐可为碳酸氢钠。在一个特定的实施方案中，碳酸氢钠在所述基础培养基中以约26±5mM或约2.2mg/mL的浓度存在。

在又一实施方案中，所述基础培养基为低渗透压度基础培养基。所述基础培养基的渗透压度可在约175-280mOsm/kg、约180-250mOsm/kg、约190-225mOsm/kg或约195-205mOsm/kg范围内。所述基础培养基的例示性渗透压度可为200、214、216或218mOsm/kg。在一特定的实施例中，所述基础培养基的渗透压度为200mOsm/kg。渗透压度可在细胞在不同浓度的CO₂中培养时测定。在一些实施例中，细胞在3％CO₂或5％CO₂下培养。

在一个优选的实施方案中，所述基础培养基包含以3.0mg/mL浓度的NaCl、以约2.2mg/mL浓度的碳酸氢钠，且具有200mOsm/kg的渗透压度。

用本发明的基础培养基配制的补充物适合制造、维持或富集本文公开的人类iPS细胞群。这样的补充物在本公开内容中指示为“补充物”或“+补充物”。术语“补充物”或短语“+补充物”包含加到在表A中描述的基础培养基的组分中的一种或多种添加元素。例如，补充物可包括而不限于培养基(Gibco)、补充物(Gibco；100X溶液)、培养基(Gibco)、补充物(Gibco；50X溶液)、L-谷氨酰胺、葡萄糖、2-巯基乙醇、白血病抑制因子(LIF)多肽、肝糖合成酶激酶3抑制剂、MEK抑制剂或其任何组合。

在一个特定的实施方案中，所述LIF多肽为人类LIF(hLIF)多肽。在一些实施例中，hLIF多肽在约1-1000单位/毫升、约20-800单位/毫升、约50-500单位/毫升、约75-250单位/毫升或约100单位/毫升的浓度下使用。

在另一特定的实施方案中，所述GSK3抑制剂包括CHIR99021。在一些实施例中，CHIR99021以约0.1-10μM、约1-5μM、约2-4μM或约3μM的浓度使用。

在另一特定的实施方案中，所述MEK抑制剂包括PD0325901。在一些实施例中，PD0325901以约0.1-5μM、约0.2-1μM、约0.3-0.7μM或约0.5μM的浓度使用。

例示性培养基包含约24.75％(v/v)的本文所述的低渗透压度基础培养基、约24.75％(v/v)的F-12培养基、约0.5％(v/v)的N2补充物、约49％(v/v)的NEUROBASAL培养基、约1％(v/v)的B-27补充物、约2mM的L-谷氨酰胺、约0.1mM的2-巯基乙醇、约100单位/毫升的hLIF、约3μM的CHIR99021和约0.5μM的PD0325901。

在另一特定的实施方案中，所述培养基可能包含或可能不含基本纤维母细胞生长因子(bFGF，也称作FGF2或FGF-β)。优选本发明的培养基不包含bFGF。

B.人类诱导的多潜能干细胞

本发明提供用于生成人类iPS细胞群的方法和组合物。进一步提供在培养物中维持人类iPS细胞的方法和组合物。还提供在培养物中生成或维持的人类iPS细胞。

术语“多潜能细胞”或“多潜能干细胞”包括具有发育成多于一种类型的分化细胞的能力的未分化细胞。这样的多潜能细胞可例如为哺乳动物胚胎干(ES细胞)细胞或哺乳动物诱导的多潜能干细胞(iPS细胞)。多潜能细胞的实例包括人类iPS细胞。

术语“胚胎干细胞”或“ES细胞”是指来源于胚泡的内细胞团的源自胚胎的全能或多潜能干细胞，其可在合适的条件下在体外培养物中维持。ES细胞能够分化成三种脊椎动物胚层如内胚层、外胚层或中胚层中的任一种的细胞。ES细胞的特征还在于其能够在合适的体外培养条件下无限期地繁殖。参见，例如Thomson等人，(Science(1998)，第282(5391)卷，第1145-1147页)。

术语“诱导的多潜能干细胞”或“iPS细胞”包括可直接来源于分化的成人细胞的多潜能干细胞。人类iPS细胞可通过将特定的重新编程因子集引入非多潜能细胞中而产生，所述重新编程因子可包括例如Oct3/4，Sox族转录因子(例如，Sox1、Sox2、Sox3、Sox15)；Myc族转录因子(例如，c-Myc、l-Myc、n-Myc)；Krüppel样族(KLF)转录因子(例如，KLF1、KLF2、KLF4、KLF5)和/或相关的转录因子，例如NANOG、LIN28和/或Glis1。人类iPS细胞也可例如通过使用miRNA或谱系特异性分子产生，所述miRNA为模拟转录因子的作用的小分子。人类iPS细胞的特征在于其能够分化成三种脊椎动物胚层如内胚层、外胚层或中胚层的任何细胞。人类iPS细胞的特征还在于其能够在合适的体外培养条件下无限期地繁殖。参见，例如Takahashi和Yamanaka(Cell(2006)，第126(4)卷，第663-676页)。

术语“天然”和“始发态”鉴定人类iPS细胞的不同多潜能性状态。术语“天然外观”鉴定表达表现出天然多潜能细胞的一种或多种特征的多潜能状态的细胞。天然外观人类iPS细胞也可称为“天然样”人类iPS细胞。在一些实施方案中，天然外观人类iPS细胞表现出天然人类iPS细胞的一种或多种形态特征，例如以紧实的圆顶形集落为特征的形态。在一些实施方案中，天然外观的人类iPS细胞表达本文所述的多潜能标记中的一种或多种。在一些实施方案中，天然或天然外观的人类iPS细胞为天然的人类iPS细胞。在其它实施方案中，天然或天然外观的人类iPS细胞为天然外观的iPS细胞。

天然或始发态iPS细胞的特征在本领域中描述。参见，例如Nichols和Smith(CellStem Cell(2009)，第4(6)卷，第487-492页)。天然的人类iPS细胞表现出与植入前胚胎的内细胞团的ES细胞类似的多潜能状态。这样的天然细胞对于谱系规范和定型而言不是始发态的。雌性天然iPS细胞以两种活性X染色体为特征。在培养中，天然人类iPS细胞的自更新取决于白血病抑制因子(LIF)及其它抑制剂。培养的天然人类iPS细胞显示以圆形圆顶形集落和缺乏顶面-底侧极性为特征的无性系形态。培养的天然细胞可进一步显示如在本文中的其它地方描述的一种或多种多潜能标记(maker)。在适当的条件下，天然人类iPS细胞在培养物中的倍增时间可为16-24小时。

始发态人类iPS细胞表达与植入后外胚层细胞类似的多潜能状态。这样的细胞对于谱系规范和定型而言是始发态的。雌性始发态iPS细胞以一种活性X染色体和一种非活性X染色体为特征。在培养中，始发态人类iPS细胞的自更新取决于成纤维细胞生长因子(FGF)和活化素。培养的始发态人类iPS细胞显示以上皮单层为特征的克隆形态且显示顶面-底侧极性。在适当的条件下，始发态人类iPS细胞在培养物中的倍增时间可为24小时或更久。

在一个实施方案中，人类iPS细胞可来源于转化以表达多潜能状态的非多潜能细胞。这样的转化细胞包括例如已经转化以表达诱导多潜能性的重新编程基因的细胞。多潜能状态可包括例如本文所述的多潜能标记中的一种或多种的表达。这样的细胞(例如，人类包皮成纤维细胞)可通过本领域已知的任何方法转化以表达重新编程基因或任何另外的目标基因。参见，例如Takahashi和Yamanaka(Cell(2006)，第126(4)卷，第663-676页)。例如，它们可使用一种或多种质粒慢病毒载体或逆转录病毒载体引入细胞中。在一些情况下，所述载体整合到基因组中且可在重新编程完成之后除去。在特定的实施方案中，所述非多潜能细胞使用包括Oct4、Sox2、Klf4、Myc或其组合的重新编程基因转化。在一些实施例中，所述转化的细胞包括始发态人类iPS细胞。

在一些实施方案中，在本文所述的低渗透压度培养基中培养的人类iPS细胞表达天然状态的一种或多种表型、基因表达谱或标记特征。在一个实施例中，所述人类iPS细胞表达其表达指示天然状态的一种或多种多潜能标记。这样的多潜能标记可包括碱性磷酸酶、NANOG、5T4、ABCG2、活化素RIB/ALK-4、活化素RIIB、E-钙粘蛋白、Cbx2、CD9、CD30/TNFRSF8、CD117/c-试剂盒、CDX2、CHD1、Cripto、DNMT3B、DPPA2、DPPA4、DPPA5/ESG1、EpCAM/TROP1、ERRβ/NR3B2、ESGP、F-盒蛋白15/FBXO15、FGF-4、FGF-5、FoxD3、GBX2、GCNF/NR6A1、GDF-3、Gi24/VISTA/B7-H5、整合素α6/CD49f、整合素α6β1、整合素α6β4、整合素β1/CD29、KLF4、KLF5、L1TD1、Lefty、Lefty-1、Lefty-A、LIN-28A、LIN-28B、LIN-41、cMaf、cMyc、Oct-3/4、Oct-4A、糖萼蛋白(Podocalyxin)、Rex-1/ZFP42、Smad2、Smad2/3、SOX2、SSEA-1、SSEA-3、SSEA-4、STAT3、Stella/Dppa3、SUZ12、TBX2、TBX3、TBX5、TERT、TEX19、TEX19.1、THAP11、TRA-1-60(R)、TROP-2、UTF1和/或ZIC3。在一个特定的实施例中，表达的多潜能标记为碱性磷酸酶、NANOG或两者。

在另一实施方案中，在本文所述的低渗透压度培养基中培养的人类iPS细胞显示指示天然状态的形态特征。例示性形态以在培养物中具有紧实圆顶形集落的细胞为特征。

在另一实施方案中，可将在本文所述的低渗透压度培养基中培养的人类iPS细胞机械地或酶促地分离成单细胞悬浮液、传代和/或传代培养。在一个实施例中，酶促分解可使用胰蛋白酶执行。当在本发明的低渗透压度培养基中培养时，人类iPS细胞可由于向单细胞悬浮液的分解增强而提供更大的转化效率。在用通常用以在培养物中维持人类iPS细胞的其它类型的培养基(例如，mTeSR^TM培养基或2i培养基)的情况下，人类iPS细胞的分解必须机械地或用例如不如胰蛋白酶苛刻的胶原酶的酶执行。因此，所述细胞不会有效地或完全地分解。相比之下，在用本发明的低渗透压度培养基的情况下，可使用胰蛋白酶来分解所述细胞，且增强的分解产生增加的转化效率。此外，与通常用以在培养物中维持人类iPS细胞的其它类型的培养基(例如，mTeSR^TM培养基或2i培养基)不同，用本发明的低渗透压度培养基(优选不包含bFGF的低渗透压度培养基)培养的人类iPS细胞的酶促分解可在缺乏通常对于这样的细胞的传代所必需的一种或多种抑制剂的情况下执行。可省略的例示性抑制剂为ρ相关的蛋白激酶(ROCK)抑制剂。ROCK抑制剂在传代人类iPS细胞以抑制前细胞凋亡途径的激活时通常是必需的。

在另一实施方案中，在本文所述的低渗透压度培养基中培养的传代培养的人类iPS细胞可在酶促分解和传代培养之后维持天然或天然外观状态。在一些实施例中，传代培养的人类iPS细胞可持续显示以紧实的圆顶形集落为特征的形态。传代培养的人类iPS细胞也可持续表达如本文所述一种或潜能标记。

C.制造和维持人类诱导的多潜能干细胞群的方法

提供在体外培养物中生成人类iPS细胞的方法和组合物。进一步提供在体外培养物中维持人类iPS细胞的方法和组合物。

术语“制造”包括在合适的条件下培养非多潜能细胞，使其转化以表达一种或多种如本文所述的重新编程因子，以诱导在细胞表型、基因表达或两者的变化，使得细胞显示天然或天然外观状态，即，表达天然人类iPS细胞的一种或多种特性。天然或天然外观状态可响应特定的培养条件如在如本文所述的低渗透压度培养基中培养而表达。在一些实施例中，表达天然或天然外观状态的细胞的比例为在培养物中至少约30％、40％、50％、60％、70％、80％、90％、95％和高达100％的细胞。

在一个实施方案中，所述方法富集用于天然或天然外观人类iPS细胞的体外培养物。在这一实施方案中，天然或天然外观的人类iPS细胞可在培养物中优先于不表达天然或天然外观状态的细胞繁殖。在另一实施方案中，天然或天然外观的人类iPS细胞可选自酶促分解并传代培养以生成富集的天然或天然外观人类iPS细胞群的培养物。

在一个实施方案中，转化以表达多潜能状态的非多潜能细胞在适合诱导表达天然或天然外观状态的本文提供的培养基中离体培养至少1、2、5、7、10、14、21或28天或足以诱导在培养物中表达天然或天然外观状态的任何时间。转化的细胞可在本发明培养基中培养至少1、2、3或4周。有时，将转化的细胞培养1-4周。天然或天然外观状态的表达可通过观察形态特征或多潜能标记的表达、天然或天然外观状态的特征来确定，这在本文中的其它地方描述。

在一个实施方案中，转化以表达多潜能状态的非多潜能细胞在本发明低渗透压度培养基中培养，直至它们表达天然或天然外观状态的特征。细胞随后可在本发明培养基中培养以维持天然或天然外观状态。在另一实施方案中，转化以表达多潜能状态的非多潜能细胞在本发明低渗透压度培养基中培养之前首先在高渗透压度培养基中培养。这样的高渗透压度培养基表现出高于本发明低渗透压度培养基的渗透压度且可包含bFGF。某一高渗透压度培养基包含牛血清蛋白、bFGF、转化生长因子β(TGFβ)、氯化锂、六氢吡啶羧酸和γ-氨基丁酸(GABA)中的一种或多种。高渗透压度培养基的实例包括mTeSR^TM培养基(StemcellTechnologies)。

在一些实施方案中，转化以表达多潜能状态的非多潜能细胞可首先在包含bFGF的高渗透压度培养基中培养，直至它们开始表达天然或天然外观状态的特征，此时将细胞在本发明的低渗透压度培养基中培养。在一个实施例中，细胞可在包含bFGF的高渗透压度培养基中培养至少1、2、5、10、30、60或90天的时间、1、2、4、8或12周的时间或者1天-3个月的时间。在包含bFGF的高渗透压度培养基中培养的例示性时间为2个月。

在其它实施方案中，转化以表达多潜能状态的非多潜能细胞可首先在包含bFGF的高渗透压度培养基中培养，直至它们开始显示以三维细胞团块为特征的形态，此时将细胞在本发明的低渗透压度培养基中培养。在这样的实施方案中，可将显示三维细胞团块的细胞选择、分解(例如，用胰蛋白酶)并转移到在本文所述的低渗透压度培养基的新培养物中。

术语“维持”包括保存本文所述的人类iPS细胞的特征或表型中的至少一种或多种。这样的特征可包括维持天然细胞的多潜能性、细胞形态性、基因表达谱和/或其它功能特征。术语“维持”还可涵盖细胞的繁殖和/或培养的天然细胞的数目增加。所述术语包括防止细胞转变成始发态或非多潜能状态的培养条件。所述术语进一步包括容许细胞保留多潜能和/或天然的培养条件，而所述细胞可能持续或可能不持续分裂且数目增加。

在一个实施方案中，人类iPS细胞在适合维持所述细胞处于天然或天然外观状态的本文提供的培养基中离体培养。在一个特定的实施例中，人类iPS细胞可在合适的培养基中培养1、2、5、7、10、14、21或28天的时间、或约2周、约3周、约4周或更久的时间，条件是培养的细胞维持处于天然或天然外观状态。细胞可培养至少1、2、3或4周。有时，将细胞培养1-4周。可将人类iPS细胞维持例如足以使细胞在培养物中的繁殖、细胞的基因修饰和/或细胞的传代培养的任何时间。

在另一实施方案中，转化以表达多潜能状态的人类iPS细胞或非多潜能细胞可在适合体外培养的底物或喂养细胞层上培养。在一个特定的实施例中，细胞在MATRIGEL^TM(BDBiosciences)上培养。在另一实施例中，细胞在新生的人类包皮成纤维细胞(NuFF)喂养细胞上培养。在另一实施例中，细胞在GELTREX^TM(Life Technologies)上培养。

在另一实施方案中，与转化以表达多潜能状态的始发态人类iPS细胞或非多潜能细胞相比较，在本发明的低渗透压度培养基中培养的人类iPS细胞的倍增时间减少。在一个特定的实施例中，本发明的人类iPS细胞的倍增时间为约16-24小时。

7.序列同一性

本文提供的方法和组合物采用靶向基因组整合系统的多种不同组分(即，核酸酶试剂、识别位点、插入核酸、目标多核苷酸、靶向载体、选择标记及其它组分)。在本说明书各处认定靶向基因组整合系统的一些组分可具有活性变体和片段。这样的组分包括例如核酸酶试剂(即，工程化核酸酶试剂)、核酸酶试剂识别位点、目标多核苷酸、靶位点和靶向载体的相应同源臂。这些组分中的每一种的生物活性在本文中的其它地方描述。

如本文在两种多核苷酸或多肽序列的上下文中使用的“序列同一性”或“同一性”指在特定比较窗上对齐以实现最大对应性时在这两种序列中相同的残基。当在关于蛋白质使用百分比序列同一性时，应该认识到并不相同的残基位置常常因保守氨基酸取代而不同，其中氨基酸残基用具有类似化学性质(例如，电荷或疏水性)的其它氨基酸残基取代且因此不改变分子的功能性质。当序列在保守取代上存在差别时，可向上调节百分比序列同一性以校正取代的保守特性。在这样的保守取代方面存在差别的序列被说成是具有“序列相似性”或“相似性”。本领域的技术人员众所周知进行该调节的方法。通常，这涉及将保守取代作为一部分而不作为完全错配来评分，由此使序列同一性百分数增加。因此，例如，若一个相同的氨基酸的分数给定为1且一个非保守取代的分数给定为零，则一个保守取代的分数给定为0-1。保守取代的分数例如如在程序PC/GENE(Intelligenetics，MountainView，California，USA)中所执行来计算。

本文使用的“序列同一性百分数”是指通过在比较窗上比较两个最佳对齐的序列确定的值，其中，与参考序列相比较，多核苷酸序列在比较窗中的部分可包含添加或缺失(即，间隙)，以便最佳对齐这两个序列。该百分数通过以下方式，即确定其中相同的核酸碱基或氨基酸残基在两个序列中出现的位置的数目以产生匹配位置的数目，将匹配位置的数目除以在比较窗口中的位置总数并且将结果乘以100以产生序列同一性百分数。

除非另作说明，否则本文提供的序列同一性/相似性值是指使用GAP版本10使用以下参数获得的值：核苷酸序列的％同一性和％相似性使用缺口权重(GAP Weight)50和长度权重3和nwsgapdna.cmp评分矩阵；氨基酸序列的％同一性或％相似性使用缺口权重8和长度权重2和BLOSUM62评分矩阵；或其任何等同程序。“等同程序”指任何序列比较程序，其为所讨论的任何两个序列产生这样的比对，当与由GAP版本10产生的对应比对相比较时，该比对具有相同的核苷酸或氨基酸残基匹配和相同的百分比序列同一性。

除非另外定义，否则在本文中使用的所有技术和科学术语均具有与本发明所属领域的一般技术人员通常理解的含义相同的含义。尽管在本发明的实践或试验中也可使用类似或等同于本文所描述的那些方法和材料的任何方法和材料，但是现在描述优选的方法和材料。为了公开并描述公布在引用时所涉及的方法和/或材料，在本文中提到的所有公布均以引用方式并入本文。

还应该注意到，除非上下文另外明确规定，否则如在本文中和在所附权利要求中所用，单数形式“一个/种”和“所述”包括复数个/种提及物。在本文中使用的所有技术和科学术语都具有相同的含义。

提供在本文中论述的公布仅仅是针对它们在本申请的提交日期之前的公开。在本文中绝不应解释为承认所描述的发明无权占先于在先发明的这类公布。此外，所提供的公布日期可不同于实际公布日期，其可能需要单独地证实。

所描述的发明可在不脱离其精神和必要特性的情况下以其它具体形式体现，且相应地可参考指示本发明的范围的所附权利要求，而不是上述说明书。

非限制性实施方案包括：

1.一种用于靶向修饰在多潜能大鼠细胞中的目标基因组基因座的方法，其包括：(a)将包含侧接有5'大鼠同源臂和3'大鼠同源臂的插入核酸的大靶向载体(LTVEC)引入所述多潜能大鼠细胞中，其中所述5'同源臂和所述3'同源臂的总和为至少10kb，但小于150kb；和(b)鉴定在所述目标基因组基因座处包括所述靶向基因修饰的基因修饰的多潜能大鼠细胞，其中所述靶向基因修饰能够经由种系传递。

2.实施方案1的方法，其中所述靶向基因修饰为双等位基因的。

3.实施方案1或2的方法，其中所述多潜能大鼠细胞为大鼠胚胎干(ES)细胞。

4.实施方案1、2或3的方法，其中所述多潜能大鼠细胞来源于DA株或ACI株。

5.实施方案1-4中任一项的方法，其中所述多潜能大鼠细胞的特征在于表达包括Dnmt3L、Eras、Err-β、Fbxo15、Fgf4、Gdf3、Klf4、Lef1、LIF受体、Lin28、Nanog、Oct4、Sox15、Sox2、Utf1的至少一种多潜能标记或其组合。

6.实施方案1-4中任一项的方法，其中所述多潜能大鼠细胞的特征在于以下特征中的一种或多种：

(a)缺乏包括c-Myc、Ecat1和/或Rexo1的一种或多种多潜能标记的表达；(b)缺乏包括Brachyury和/或Bmpr2的中胚层标记的表达；(c)缺乏包括Gata6、Sox17和/或Sox7的一种或多种内胚层标记的表达；或(d)缺乏包括Nestin和/或Pax6的一种或多种神经标记的表达。

7.实施方案1-6中任一项的方法，其中所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约30kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

8.实施方案1-6中任一项的方法，其中所述LTVEC的5'同源臂和3'同源臂的总和为约16kb-约150kb。

9.实施方案1-8中任一项的方法，其中所述靶向基因修饰包括：(a)用同源或直系同源的核酸序列替换内源大鼠核酸序列；(b)缺失内源大鼠核酸序列；(c)缺失内源大鼠核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(e)包含同源或直系同源的核酸序列的外源核酸序列；(f)包含人类核酸序列和大鼠核酸序列的嵌合核酸序列；(g)侧接有位点特异性重组酶靶序列的条件性等位基因；或(h)操作性连接在大鼠细胞中具有活性的启动子的报道基因。

10.实施方案1-9中任一项的方法，其中所述目标基因组基因座包含(i)与所述5'大鼠同源臂互补的第一核酸序列；和(ii)与所述3'大鼠同源臂互补的第二核酸序列。

11.实施方案10的方法，其中所述第一核酸序列和所述第二核酸序列相隔至少5kb，但小于3Mb。

12.实施方案10的方法，其中所述第一核酸序列和所述第二核酸序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。

13.实施方案1-12中任一项的方法，其中引入步骤(a)进一步包括引入编码促进在所述多潜能大鼠细胞中在所述靶向构建体和所述目标基因组基因座之间的同源重组的核酸酶试剂的第二核酸。

14.实施方案13的方法，其中所述核酸酶试剂包含(a)包含融合到FokI核酸内切酶的基于锌指的DNA结合结构域的嵌合蛋白；或(b)包含融合到FokI核酸内切酶的转录激活子样效应因子核酸酶(TALEN)的嵌合蛋白。

15.实施方案1-12中任一项的方法，其中引入步骤(a)进一步包括向所述多潜能大鼠细胞中引入：(i)包含操作性连接编码成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白的第一核酸序列的第一启动子的第一表达构建体，(ii)包含操作性连接与向导RNA(gRNA)连接的基因组靶序列的第二启动子的第二表达构建体，其中所述基因组靶序列在3'端由原间隔区邻近基序(PAM)序列直接侧接。

16.实施方案15的方法，其中所述目标基因组基因座包含SEQ ID NO:1的核苷酸序列。

17.实施方案15或16的方法，其中所述gRNA包含编码成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)的第三核酸序列。

18.实施方案15、16或17的方法，其中所述Cas蛋白为Cas9。

19.实施方案15、16、17或18的方法，其中所述gRNA包含：(a)SEQ ID NO:2的核酸序列的嵌合RNA；或(b)SEQ ID NO:3的核酸序列的嵌合RNA。

20.实施方案17的方法，其中所述crRNA包含SEQ ID NO:4；SEQ ID NO:5；或SEQ IDNO:6。

21.实施方案17的方法，其中所述tracrRNA包含SEQ ID NO:7或SEQ ID NO:8。

22.一种修饰的大鼠基因组基因座，其包括：(i)插入同源或直系同源人类核酸序列；(ii)用同源或直系同源人类核酸序列替换内源大鼠核酸序列；或(iii)其组合，其中所述修饰的大鼠基因组基因座能够经由种系传递。

23.实施方案22的修饰的大鼠基因组基因座，其中所述插入或替换的尺寸为约5kb-约400kb。

24.实施方案22的大鼠基因组基因座，其中所述插入或替换的尺寸为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

25.一种用于制造人源化大鼠的方法，其包括：(a)用包含人类核酸的靶向构建体靶向在多潜能大鼠细胞中的目标基因组基因座以形成基因修饰的多潜能大鼠细胞；(b)将所述基因修饰的多潜能大鼠细胞引入宿主大鼠胚胎中；和(c)在代孕母体中孕育所述宿主大鼠胚胎，其中所述代孕母体生成包含修饰的基因组基因座的大鼠子代，所述修饰的基因组基因座包括：(i)插入人类核酸序列；(ii)在所述目标基因组基因座处用同源或直系同源人类核酸序列替换所述大鼠核酸序列；(iii)包含人类核酸序列和大鼠核酸序列的嵌合核酸序列；或(iv)其组合，其中所述修饰的基因组基因座能够经由种系传递。

26.实施方案25的方法，其中所述靶向构建体为大靶向载体(LTVEC)，且所述LTVEC的5'同源臂和3'同源臂的总和为至少10kb，但小于150kb。

27.实施方案26的方法，其中所述靶向构建体的5'同源臂和3'同源臂的总和为约10kb-约30kb、约20kb-40kb、约40kb-约60kb、约60kb-约80kb、或约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

28.实施方案25、26或27的方法，其中所述人类核酸序列为至少5kb，但小于400kb。

29.实施方案25、26或27的方法，其中所述人类核酸序列为至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；至少150kb，但小于200kb；至少200kb，但小于250kb；至少250kb，但小于300kb；至少300kb，但小于350kb；或至少350kb，但小于400kb。

30.实施方案25-29中任一项的方法，其中所述多潜能大鼠细胞为大鼠胚胎干(ES)细胞。

31.实施方案25-30中任一项的方法，其中所述多潜能大鼠细胞来源于DA株或ACI株。

32.实施方案25-31中任一项的方法，其中所述多潜能大鼠细胞的特征在于表达包括Dnmt3L、Eras、Err-β、Fbxo15、Fgf4、Gdf3、Klf4、Lef1、LIF受体、Lin28、Nanog、Oct4、Sox15、Sox2、Utf1的至少一种多潜能标记或其组合。

33.实施方案25-31中任一项的方法，其中所述多潜能大鼠细胞的特征在于以下特点中的一种或多种：(a)缺乏包括c-Myc、Ecat1和/或Rexo1的一种或多种多潜能标记的表达；(b)缺乏包括Brachyury和/或Bmpr2的一种或多种中胚层标记的表达；(c)缺乏包括Gata6、Sox17和/或Sox7的一种或多种内胚层标记的表达；或(d)缺乏包括Nestin和/或Pax6的一种或多种神经标记的表达。

34.一种包含人源化基因组基因座的修饰的大鼠，其中所述人源化基因组基因座包含：(i)插入同源或直系同源人类核酸序列；(ii)在内源基因组基因座处用同源或直系同源人类核酸序列替换大鼠核酸序列；(iii)包含人类核酸序列和大鼠核酸序列的嵌合核酸序列；或(iv)其组合，其中所述人源化基因组基因座能够经由种系传递。

35.一种在其基因组基因座中包含靶向基因修饰的大鼠或大鼠细胞，其中所述基因组基因座为干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座或Rag2/Rag1基因座，其中所述靶向基因修饰包括：(a)在所述基因组基因座处缺失内源大鼠核酸序列；(b)插入同源核酸、直系同源核酸或包含人类核酸序列和大鼠核酸序列的嵌合核酸；或(c)其组合，其中所述靶向基因修饰可经由所述大鼠或自所述大鼠细胞繁殖的大鼠的种系传递。

36.实施方案35的大鼠或大鼠细胞，其中(a)在所述基因组基因座处所述内源大鼠核酸的缺失为至少约10kb；或(b)在所述基因组基因座处所述内源大鼠核酸的缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(c)在所述基因组基因座处所述外源核酸序列的插入为至少约5kb；或(d)在所述基因组基因座处所述外源核酸序列的插入为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

37.实施方案35或36的大鼠或大鼠细胞，其中(a)在所述干扰白细胞素-2受体γ基因座处的靶向基因修饰引起干扰白细胞素-2受体γ蛋白活性减小或缺乏；(b)在所述ApoE基因座处的靶向基因修饰引起ApoE蛋白活性减小或缺乏；(c)在所述Rag1基因座处的靶向基因修饰引起Rag1蛋白活性减小或缺乏；(d)在所述Rag2基因座处的靶向基因修饰引起Rag2蛋白活性减小或缺乏；或(e)在所述Rag2/Rag1基因座处的靶向基因修饰引起Rag2蛋白活性和Rag1活性减小或缺乏。

38.实施方案35、36或37的大鼠或大鼠细胞，其中所述干扰白细胞素-2受体γ基因座的靶向基因修饰包括：(a)缺失整体大鼠干扰白细胞素-2受体γ编码区或其部分；(b)用人类干扰白细胞素-2受体γ编码区或其部分替换所述整体大鼠干扰白细胞素-2受体γ编码区或其部分；(c)用人类干扰白细胞素-2受体γ的胞外结构域替换所述大鼠干扰白细胞素-2受体γ编码区的胞外结构域；或(d)所述干扰白细胞素-2受体γ基因座的至少3kb缺失。

39.实施方案35-37中任一项的大鼠或大鼠细胞，其中所述ApoE基因座的靶向基因修饰包括：(a)整体ApoE编码区或其部分的缺失；或(b)包含所述ApoE编码区的ApoE基因座的至少1.8kb缺失。

40.实施方案35-37中任一项的大鼠或大鼠细胞，其中所述Rag2基因座的靶向基因修饰包括：(a)整体Rag2编码区或其部分的缺失；或(b)包含所述Rag2编码区的Rag2基因座的至少5.7kb缺失。

41.实施方案35-37中任一项的大鼠或大鼠细胞，其中所述Rag2/Rag1基因座的靶向基因修饰包括：(a)所述整体Rag2编码区或其部分的缺失和所述整体Rag1编码区或其部分的缺失；或(b)包含所述Rag2编码区的Rag2/Rag1基因座的至少16kb缺失。

42.实施方案35-41中任一项的大鼠或大鼠细胞，其中所述靶向基因修饰包括在所述干扰白细胞素-2受体γ基因座、所述ApoE基因座、所述Rag1基因座、所述Rag2基因座或所述Rag2/Rag1基因座处插入包含选择性标记的表达盒。

43.实施方案42中任一项的大鼠或大鼠细胞，其中所述表达盒包含操作性连接在所述基因组基因座处的内源启动子和操作性连接选择性标记的人类泛素启动子的lacZ基因。

44.实施方案35-43中任一项的大鼠或大鼠细胞，其中在所述干扰白细胞素-2受体γ基因座、所述ApoE基因座、所述Rag1基因座、所述Rag2基因座或所述Rag2/Rag1基因座中的靶向基因修饰包括自缺失选择盒的插入。

45.实施方案44的大鼠或大鼠细胞，其中所述自缺失选择盒包含操作性连接在所述大鼠细胞中具有活性的启动子的选择性标记基因和操作性连接雄性生殖细胞特异性启动子的重组酶基因，其中所述自缺失盒由通过所述重组酶识别的重组识别位点侧接。

46.实施方案45的大鼠或大鼠细胞，其中(a)所述雄性生殖细胞特异性启动子为鱼精蛋白-1启动子；或(b)所述重组酶基因编码Cre，且所述重组识别位点为loxP位点。

47.实施方案35-46中任一项的大鼠或大鼠细胞，其中在所述基因组基因座处所述外源核酸序列的插入包含操作性连接内源干扰白细胞素-2受体γ启动子、内源ApoE启动子、内源Rag1启动子或内源Rag2启动子的报道基因核酸。

48.实施方案47的大鼠或大鼠细胞，其中所述报道基因核酸编码包含β-半乳糖苷酶、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、增强的黄色荧光蛋白(EYFP)、Emerald、增强的绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合的报道基因。

49.实施方案35-48中任一项的大鼠细胞，其中所述大鼠细胞为多潜能大鼠细胞或大鼠胚胎干(ES)细胞。

50.实施方案49的大鼠细胞，其中所述多潜能大鼠细胞或所述大鼠胚胎干(ES)细胞(a)来源于DA株或ACI株；(b)以表达包括Dnmt3L、Eras、Err-β、Fbxo15、Fgf4、Gdf3、Klf4、Lef1、LIF受体、Lin28、Nanog、Oct4、Sox15、Sox2、Utf1的至少一种多潜能标记或其组合为特征；或(c)以一种或多种以下特征为特征：(i)缺乏包括c-Myc、Ecat1和/或Rexo1的一种或多种多潜能标记的表达；(ii)缺乏包括Brachyury和/或Bmpr2的中胚层标记的表达；(iii)缺乏包括Gata6、Sox17和/或Sox7的一种或多种内胚层标记的表达；或(iv)缺乏包括Nestin和/或Pax6的一种或多种神经标记的表达。

51.一种用于修饰在多潜能大鼠细胞中在干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座或Rag2/Rag1基因座中的靶基因组基因座的方法，所述方法包括：(a)向所述多潜能大鼠细胞中引入包含侧接有与所述靶基因组基因座同源的5'大鼠同源臂和3'大鼠同源臂的插入核酸的靶向载体，(b)鉴定在所述靶基因组基因座处包括靶向基因修饰的基因修饰的多潜能大鼠细胞，其中所述靶向基因修饰能够经由自所述多潜能大鼠细胞繁殖的大鼠的种系传递。

52.实施方案51的方法，其中所述靶向载体为大靶向载体(LTVEC)，其中所述5'大鼠同源臂和所述3'大鼠同源臂的总和为至少约10kb，但小于约150kb。

53.实施方案51或52的方法，其中向所述多潜能大鼠细胞中引入所述靶向载体引起：(i)在所述靶基因组基因座处缺失内源大鼠核酸序列；(ii)在所述靶基因组基因座处插入外源核酸序列；或(iii)其组合。

54.实施方案53的方法，其中(a)在所述基因组基因座处所述内源大鼠核酸的缺失为至少约10kb；或(b)在所述基因组基因座处所述内源大鼠核酸的缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(c)在所述基因组基因座处所述外源核酸序列的插入为至少约5kb；或(d)在所述基因组基因座处所述外源核酸序列的插入为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb。

55.实施方案51-54中任一项的方法，其中(a)在所述干扰白细胞素-2受体γ基因座处的靶向基因修饰引起干扰白细胞素-2受体γ蛋白活性减小或缺乏；(b)在所述ApoE基因座处的靶向基因修饰引起ApoE蛋白活性减小或缺乏；(c)在所述Rag1基因座处的靶向基因修饰引起Rag1蛋白活性减小或缺乏；(d)在所述Rag2基因座处的靶向基因修饰引起Rag2蛋白活性减小或缺乏；或(e)在所述Rag2/Rag1基因座处的靶向基因修饰引起Rag2蛋白活性和Rag1蛋白活性减小或缺乏。

56.实施方案51-54中任一项的方法，其中所述干扰白细胞素-2受体γ基因座的靶向基因修饰包括(a)整体大鼠干扰白细胞素-2受体γ编码区或其部分的缺失；(b)用人类干扰白细胞素-2受体γ编码区或其部分替换所述整体大鼠干扰白细胞素-2受体γ编码区或其部分；(c)用人类干扰白细胞素-2受体γ的胞外结构域替换所述大鼠干扰白细胞素-2受体γ编码区的胞外结构域；或(d)包含所述干扰白细胞素-2受体γ编码区的所述干扰白细胞素-2受体γ基因座的至少3kb缺失。

57.实施方案51-55中任一项的方法，其中所述ApoE基因座的靶向基因修饰包括：(a)整体ApoE编码区或其部分的缺失；或(b)包含所述ApoE编码区的所述ApoE基因座的至少1.8kb缺失。

58.实施方案51-55中任一项的方法，其中所述Rag2基因座的靶向基因修饰包括：(a)整体Rag2编码区或其部分的缺失；或(b)包含所述Rag2编码区的所述Rag2基因座的至少5.7kb缺失。

59.实施方案51-55中任一项的方法，其中所述Rag1/Rag2基因座的靶向基因修饰包括：(a)所述整体Rag2编码区或其部分的缺失和所述整体Rag1编码区或其部分的缺失；或(b)包含所述Rag2和Rag1编码区的所述Rag2/Rag1基因座的至少16kb缺失。

60.实施方案51-59中任一项的方法，其中所述插入核酸包含包含编码选择性标记的多核苷酸的表达盒。

61.实施方案60的方法，其中所述表达盒包含操作性连接在所述基因组基因座处的内源启动子和操作性连接选择性标记基因的人类泛素启动子的lacZ基因。

62.实施方案51-60中任一项的方法，其中所述插入核酸包含自缺失选择盒。

63.实施方案62的方法，其中所述自缺失选择盒包含操作性连接在所述大鼠多潜能细胞中具有活性的启动子的选择性标记和编码操作性连接雄性生殖细胞特异性启动子的重组酶的多核苷酸，其中所述自缺失盒由通过所述重组酶识别的重组识别位点侧接。

64.实施方案63的方法，其中(a)所述雄性生殖细胞特异性启动子为鱼精蛋白-1启动子；或(b)所述重组酶基因编码Cre，且所述重组识别位点为loxP位点。

65.实施方案53的方法，其中在所述基因组基因座处所述外源核酸序列的插入包含操作性连接内源干扰白细胞素-2受体γ启动子、内源ApoE启动子、内源Rag1启动子或内源Rag2启动子的报道基因核酸序列。

66.实施方案65的方法，其中所述报道基因核酸序列编码包括β-半乳糖苷酶、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、增强的黄色荧光蛋白(EYFP)、Emerald、增强的绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合的报道基因。

67.实施方案51-66中任一项的方法，其中所述多潜能大鼠细胞为大鼠胚胎干(ES)细胞。

68.实施方案51-67中任一项的方法，其中所述多潜能大鼠细胞(a)来源于DA株或ACI株；或(b)以表达包含Oct-4、Sox-2、碱性磷酸酶或其组合的多潜能标记为特征；或(c)以一种或多种以下特征为特征：(i)缺乏包括c-Myc、Ecat1和/或Rexo1的一种或多种多潜能标记的表达；(ii)缺乏包括Brachyury和/或Bmpr2的中胚层标记的表达；(iii)缺乏包括Gata6、Sox17和/或Sox7的一种或多种内胚层标记的表达；或(iv)缺乏包括Nestin和/或Pax6的一种或多种神经标记的表达。

69.实施方案51-68中任一项的方法，进一步包括鉴定在所述靶基因组基因座处的靶向基因修饰，其中所述鉴定步骤采用用于评定在所述靶基因组基因座处的等位基因修饰(MOA)的定量测定。

70.实施方案51-69中任一项的方法，其中引入步骤(a)进一步包括引入编码促进在所述多潜能大鼠细胞中在所述靶向载体和所述靶基因组基因座之间的同源重组的核酸酶试剂的第二核酸。

71.实施方案70的方法，其中所述核酸酶试剂包含包含融合到FokI核酸内切酶的基于锌指的DNA结合结构域的嵌合蛋白。

72.实施方案71的方法，其中所述方法产生所述靶基因组基因座的双等位修饰。

73.实施方案51-70中任一项的方法，其中引入步骤(a)进一步包括向所述多潜能大鼠细胞中引入：(i)包含操作性连接编码成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白的第一核酸序列的第一启动子的第一表达构建体，(ii)包含操作性连接与向导RNA(gRNA)连接的基因组靶序列的第二启动子的第二表达构建体，其中所述基因组靶序列在3'端由原间隔区邻近基序(PAM)序列直接侧接。

74.实施方案73的方法，其中所述目标基因组基因座包含SEQ ID NO:1的核苷酸序列。

75.实施方案73或74的方法，其中所述gRNA包含编码成簇规律间隔短回文重复序列(CRISPR)RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)的第三核酸序列。

76.实施方案73的方法，其中所述Cas蛋白为Cas9。

77.实施方案73、74或75的方法，其中所述gRNA包含：(a)SEQ ID NO:2的核酸序列的嵌合RNA；或(b)SEQ ID NO:3的核酸序列的嵌合RNA。

78.实施方案75的方法，其中所述crRNA包含SEQ ID NO:4；SEQ ID NO:5；或SEQ IDNO:6。

79.实施方案75的方法，其中所述tracrRNA包含SEQ ID NO:7或SEQ ID NO:8。

80.实施方案35-50中任一项的大鼠或大鼠细胞，其中所述大鼠或大鼠细胞包含在所述干扰白细胞素-2受体γ基因座、所述ApoE基因座、所述Rag1基因座、所述Rag2基因座和/或所述Rag2/Rag1基因座处的靶向基因修饰。

81.实施方案80的大鼠或大鼠细胞，其中所述大鼠或大鼠细胞包含在所述干扰白细胞素-2受体γ基因座和所述Rag2/Rag1基因座处的靶向基因修饰。

另外的非限制性实施方案包括：

1.一种修饰在真核细胞中的目标基因组基因座的方法，其包括：(a)向所述真核细胞中引入：(i)包含侧接有5'同源臂和3'同源臂的第一核酸的大靶向载体(LTVEC)，其中所述LTVEC为至少10kb，(ii)包含操作性连接编码Cas蛋白的第二核酸的第一启动子的第一表达构建体，(iii)包含操作性连接编码包含杂化到靶序列的核苷酸序列的向导RNA(gRNA)和反式激活CRISPR RNA(tracrRNA)的第三核酸的第二启动子的第二表达构建体，其中所述第一启动子和所述第二启动子在所述真核细胞中具有活性；和(b)鉴定在所述目标基因组基因座处包括靶向基因修饰的修饰的真核细胞。

2.实施方案1的方法，其中所述靶向基因修饰为双等位基因基因修饰。

3.实施方案1的方法，其中所述LTVEC为至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb。

4.实施方案1的方法、其中所述LTVEC为至少100kb、至少150kb或至少200kb。

5.实施方案1的方法，其中所述真核细胞为哺乳动物细胞。

6.实施方案5的方法，其中所述哺乳动物细胞为成纤维细胞。

7.实施方案1的方法，其中所述真核细胞为多潜能细胞。

8.实施方案7的方法，其中所述多潜能细胞为人类多潜能细胞。

9.实施方案8的方法，其中所述人类多潜能细胞为人类胚胎干(ES)细胞或人类成人干细胞。

10.实施方案8的方法，其中所述人类多潜能细胞为发育受限的人类祖细胞。

11.实施方案8的方法，其中所述人类多潜能细胞为人类诱导的多潜能干(iPS)细胞。

12.实施方案1的方法，其中所述Cas蛋白为Cas9。

13.实施方案1的方法，其中所述靶序列在3'端由原间隔区邻近基序(PAM)序列直接侧接。

14.实施方案1的方法，其中所述5'同源臂和所述3'同源臂的总和为约10kb-约150kb。

15.实施方案1的方法，其中所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

16.实施方案1的方法，其中所述靶向基因修饰包括：(a)用同源或直系同源的核酸序列替换内源核酸序列；(b)缺失内源核酸序列；(c)缺失内源核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)插入外源核酸序列；(e)插入外源核酸序列，所述外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(f)插入包含同源或直系同源的核酸序列的外源核酸序列；(g)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；(h)插入侧接有位点特异性重组酶靶序列的条件性等位基因；(i)插入操作性连接在所述多潜能细胞中具有活性的第三启动子的可选择标记或报道基因；或(j)其组合。

17.实施方案1的方法，其中所述目标基因组基因座包含(i)与所述5'同源臂同源的5'靶序列；和(ii)与所述3'同源臂同源的3'靶序列。

18.实施方案17的方法，其中所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。

19.实施方案17的方法，其中所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。

20.实施方案1的方法，其中所述目标基因组基因座包括干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座或所述Rag1基因座和所述Rag2基因座两者。

21.实施方案1的方法，其中所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

22.一种用于修饰基因组的方法，其包括在包含至少10kb的核酸序列的大靶向载体(LTVEC)存在下将所述基因组暴露于Cas蛋白和CRISPR RNA，其中在暴露于所述Cas蛋白、所述CRISPR RNA和所述LTVEC之后，所述基因组被修饰以含有至少10kb核酸序列。

23.实施方案22的方法，其中所述LTVEC包含至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb的核酸序列。

24.实施方案22的方法，其中所述LTVEC包含至少100kb、至少150kb或至少200kb的核酸序列。

25.一种用于修饰基因组的方法，其包括在大靶向载体(LTVEC)存在下使所述基因组与Cas蛋白、杂化到靶序列的CRISPR RNA，和tracrRNA接触，其中所述LTVEC为至少10kb且包含侧接有5'同源臂和3'同源臂的第一核酸，其中在所述LTVEC存在下与所述Cas蛋白、CRISPR RNA，和tracrRNA接触之后，所述基因组在目标基因组基因座处修饰以含有所述第一核酸。

26.实施方案25的方法，其中所述基因组在真核细胞中，且将所述Cas蛋白、所述CRISPR RNA、所述tracrRNA和所述LTVEC引入所述真核细胞中。

27.实施方案26的方法，其进一步包括鉴定在所述目标基因组基因座处包括靶向基因修饰的修饰的真核细胞。

28.实施方案26或27的方法，其中所述CRISPR RNA和所述tracrRNA以单一向导RNA(gRNA)的形式一起引入。

29.实施方案26或27的方法，其中所述CRISPR RNA和所述tracrRNA单独地引入。

30.实施方案26-29中任一项的方法，其中：(a)所述Cas蛋白以蛋白质、编码所述Cas蛋白的信使RNA(mRNA)或编码所述Cas蛋白的DNA的形式引入所述真核细胞中；(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入所述真核细胞中；和(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入所述真核细胞中。

31.实施方案30的方法，其中所述Cas蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入所述真核细胞中。

32.实施方案30的方法，其中：(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；(b)编码所述CRISPRRNA的所述DNA呈包含操作性连接编码所CRISPR RNA的第三核酸的第二启动子的第二表达构建体的形式；且(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第四核酸的第三启动子的第三表达构建体的形式，其中所述第一启动子、所述第二启动子和所述第三启动子在所述真核细胞中具有活性。

33.实施方案32的方法，其中所述第一表达构建体、所述第二表达构建体和/或所述第三表达构建体在单一核酸分子上。

34.实施方案30的方法，其中：(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；且(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含所述CRISPR RNA和所述tracrRNA的gRNA的第三核酸的第二启动子的第二表达构建体的形式；其中所述第一启动子和所述第二启动子在所述真核细胞中具有活性。

35.实施方案34的方法，其中所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

36.实施方案27-35中任一项的方法，其中所述靶向基因修饰同时包括在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述第一核酸。

37.实施方案27-36中任一项方法，其中所述靶向基因修饰为双等位基因基因修饰。

38.实施方案37的方法，其中所述双等位基因基因修饰包括在两种同源染色体中的目标基因组基因座处缺失内源核酸序列和插入所述第一核酸。

39.实施方案27-36中任一项的方法，其中所述修饰的真核细胞在所述目标基因组基因座处为半合的。

40.实施方案39的方法，其中在一种染色体中在目标基因组基因座处的靶向基因修饰包括缺失内源核酸序列和插入所述第一核酸。

41.实施方案39的方法，其中所述靶向基因修饰包括：(1)在两种同源染色体中在目标基因组基因座处缺失内源核酸序列；和(2)在第一染色体中所述第一核酸插入所述目标基因组基因座中和在第二染色体中破坏所述目标基因组基因座。

42.实施方案25-41中任一项的方法，其中所述LTVEC为至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb或至少90kb。

43.实施方案25-42中任一项的方法，其中所述LTVEC为至少100kb、至少150kb或至少200kb。

44.实施方案25-43中任一项的方法，其中所述第一核酸为至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb、至少200kb、至少250kb或至少300kb。

45.实施方案26-44中任一项的方法，其中所述真核细胞为哺乳动物细胞。

46.实施方案45的方法，其中所述哺乳动物细胞为成纤维细胞。

47.实施方案26-43中任一项的方法，其中所述真核细胞为多潜能细胞。

48.实施方案47的方法，其中所述多潜能细胞为非人类多潜能细胞。

49.实施方案48的方法，其中所述非人类多潜能细胞为啮齿动物多潜能细胞。

50.实施方案49的方法，其中所述啮齿动物多潜能细胞为小鼠或大鼠胚胎干(ES)细胞。

51.实施方案47的方法，其中所述多潜能细胞为人类多潜能细胞。

52.实施方案51的方法，其中所述人类多潜能细胞为人类胚胎干(ES)细胞或人类成人干细胞。

53.实施方案51的方法，其中所述人类多潜能细胞为发育受限的人类祖细胞。

54.实施方案51的方法，其中所述人类多潜能细胞为人类诱导的多潜能干(iPS)细胞。

55.实施方案25-54中任一项的方法，其中所述Cas蛋白为Cas9。

56.实施方案25-55中任一项的方法，其中所述靶序列由原间隔区邻近基序(PAM)序列直接侧接。

57.实施方案25-56中任一项的方法，其中所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约150kb。

58.实施方案25-57中任一项的方法，其中所述LTVEC的5'同源臂和3'同源臂的总和为约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约120kb或约120kb-150kb。

59.实施方案27-58中任一项的方法，其中所述靶向基因修饰包括：(a)用同源或直系同源的核酸序列替换内源核酸序列；(b)缺失内源核酸序列；(c)缺失内源核酸序列，其中所述缺失为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、或约150kb-约200kb、约200kb-约300kb、约300kb-约400kb、约400kb-约500kb、约500kb-约1Mb、约1Mb-约1.5Mb、约1.5Mb-约2Mb、约2Mb-约2.5Mb或约2.5Mb-约3Mb；(d)插入外源核酸序列；(e)插入外源核酸序列，所述外源核酸序列为约5kb-约10kb、约10kb-约20kb、约20kb-约40kb、约40kb-约60kb、约60kb-约80kb、约80kb-约100kb、约100kb-约150kb、约150kb-约200kb、约200kb-约250kb、约250kb-约300kb、约300kb-约350kb或约350kb-约400kb；(f)插入包含同源或直系同源的核酸序列的外源核酸序列；(g)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；(h)插入侧接有位点特异性重组酶靶序列的条件性等位基因；(i)插入操作性连接在所述多潜能细胞中具有活性的第三启动子的可选择标记或报道基因；或(j)其组合。

60.实施方案25-59中任一项的方法，其中所述目标基因组基因座包含(i)与所述5'同源臂同源的5'靶序列；和(ii)与所述3'同源臂同源的3'靶序列。

61.实施方案60的方法，其中所述5'靶序列和所述3'靶序列相隔至少5kb，但小于3Mb。

62.实施方案60的方法，其中所述5'靶序列和所述3'靶序列相隔至少5kb，但小于10kb；至少10kb，但小于20kb；至少20kb，但小于40kb；至少40kb，但小于60kb；至少60kb，但小于80kb；至少约80kb，但小于100kb；至少100kb，但小于150kb；或至少150kb，但小于200kb；至少约200kb，但小于约300kb；至少约300kb，但小于约400kb；至少约400kb，但小于约500kb；至少约500kb，但小于约1Mb；至少约1Mb，但小于约1.5Mb；至少约1.5Mb，但小于约2Mb；至少约2Mb，但小于约2.5Mb；或至少约2.5Mb，但小于约3Mb。

63.实施方案60的方法，其中所述5'靶序列和所述3'靶序列相隔至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb或至少200kb。

64.实施方案25-63中任一项的方法，其中所述目标基因组基因座包括干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座或所述Rag1基因座和所述Rag2基因座两者。

65.实施方案25-63中任一项的方法，其中所述目标基因组基因座包括Adamts5基因座、Trpa1基因座、Folh1基因座或Erbb4基因座。

66.实施方案25-63中任一项的方法，其中所述目标基因组基因座包括Lrp5基因座。

67.一种用于产生在目标基因组基因座处包括靶向基因修饰的F0代非人类动物的方法，所述方法包括：(a)在大靶向载体(LTVEC)存在下使在非人类ES细胞中的基因组与Cas蛋白、CRISPR RNA，和tracrRNA接触以形成修饰的非人类ES细胞，其中所述LTVEC为至少10kb且包含侧接有5'同源臂和3'同源臂的第一核酸；(b)鉴定在所述目标基因组基因座含所述靶向基因修饰的修饰的非人类ES细胞；(c)将所述修饰的非人类ES细胞引入非人类宿主胚胎中；和(d)在代孕母体中孕育所述非人类宿主胚胎，其中所述代孕母体产生在所述目标基因组基因座处包括所述靶向基因修饰的所述F0代非人类动物。

68.实施方案67的方法，其中所述CRISPR RNA和所述tracrRNA以单一向导RNA(gRNA)的形式一起引入。

69.实施方案67的方法，其中所述CRISPR RNA和所述tracrRNA单独地引入。

70.实施方案67-69中任一项的方法，其中：(a)所述Cas蛋白以蛋白质、编码所述Cas蛋白的信使RNA(mRNA)或编码所述Cas蛋白的DNA的形式引入所述非人类ES细胞中；(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入所述非人类ES细胞中；且(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入所述非人类ES细胞中。

71.实施方案70的方法，其中所述Cas蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入所述非人类ES细胞中。

72.实施方案70的方法，其中：(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；(b)编码所述CRISPRRNA的所述DNA呈包含操作性连接编码所CRISPR RNA的第三核酸的第二启动子的第二表达构建体的形式；且(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第四核酸的第三启动子的第三表达构建体的形式，其中所述第一启动子、所述第二启动子和所述第三启动子在所述非人类ES细胞中具有活性。

73.实施方案72的方法，其中所述第一表达构建体、所述第二表达构建体和/或所述第三表达构建体在单一核酸分子上。

74.实施方案70的方法，其中：(a)编码所述Cas蛋白的所述DNA呈包含操作性连接编码所述Cas蛋白的第二核酸的第一启动子的第一表达构建体的形式；且(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含所述CRISPR RNA和所述tracrRNA的gRNA的第三核酸的第二启动子的第二表达构建体的形式；其中所述第一启动子和所述第二启动子在所述非人类ES细胞中具有活性。

75.实施方案74的方法，其中所述第一表达构建体和所述第二表达构建体在单一核酸分子上。

76.实施方案67-75中任一项的方法，其中所述靶向基因修饰同时包括在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述第一核酸。

77.实施方案67-76中任一项的方法，其中所述靶向基因修饰为双等位基因基因修饰。

78.实施方案77的方法，其中所述双等位基因基因修饰包括在两种同源染色体中的目标基因组基因座处内源核酸序列的缺失和所述第一核酸的插入。

79.实施方案67-76中任一项的方法，其中所述修饰的非人类ES细胞在所述目标基因组基因座处为半合的。

80.实施方案79的方法，其中在一种染色体中在目标基因组基因座处的靶向基因修饰包括内源核酸序列的缺失和所述第一核酸的插入。

81.实施方案79的方法，其中所述靶向基因修饰包括：(1)在两种同源染色体中在目标基因组位点处缺失内源核酸序列；和(2)在第一染色体中所述第一核酸插入所述目标基因组基因座中和在第二染色体中破坏所述目标基因组基因座。

82.实施方案67-81中任一项的方法，其中所述Cas蛋白为Cas9。

实施例

提出以下实施例以便向本领域的普通技术人员提供对如何进行和使用本发明的完全公开和描述，并不意欲限制本发明人看待其发明的范围，也不意欲表示以下实验是执行的全部或仅有的实验。已经进行尝试以确保关于所使用的数值(例如，量、温度等)的准确性，但应该考虑一些实验误差和偏差。除非另外指出，否则份数是重量份，分子量是重均分子量，温度是摄氏度并且压力是大气压或接近大气压。

实施例1.大鼠ES细胞衍生和表征

1.1.大鼠ES细胞表征

如在图1中所示，大鼠ESC生长成紧实的球形集落，其通常在培养皿中脱离并浮动(特写，图8)。大鼠ESC表达包括Oct-4(图2A)和Sox2(图2B)的多潜能标记，且表达高水平的碱性磷酸酶(图3)。株系DA.2B的核型为42X,Y(图4)。大鼠ESC常变成四倍体；因此，株系通过计数中期染色体散布来预筛选；随后正式分析具有大部分正常计数的株系的核型。

ACI胚泡从商业获得的超排卵雌性收集。DA胚泡自商业获得的冷冻的8-细胞胚胎培养。透明带用酸性台氏液(Acid Tyrode)移除；且将胚泡涂铺到有丝分裂失活的MEF上。生长晕使用标准方法挑选并扩增。所有胚泡使用2i培养基涂铺、培养并扩增(Li等人，(2008)Germline competent embryonic stem cells derived from rat blastocysts,Cell135:1299-1310；其整体通过引用的方式并入本文中)。

1.2.：大鼠产生

嵌合大鼠通过胚泡注射和传送大鼠ESC基因组来产生。通过使用亲本ACI.G1大鼠ESC进行胚泡微量注射产生的嵌合体示于图9中。由在图9中的星号(*)标记的ACI/SD嵌合体所生的F1白化刺豚鼠同窝幼仔示于图10中。

亲本大鼠ESC的种系传递。

三个整倍体大鼠ESC株系的多潜能性通过向白化SD胚泡中微量注射来评价。嵌合体通过指示大鼠ESC贡献的刺鼠毛色来鉴定(参见图10)。对于各株系，大多数嵌合体向F1后代传递rESC基因组(表2)。

1.3.：大鼠胚胎干细胞的衍生。

超排卵方案，大鼠

第0天：用妊娠母马血清注射：IP，20U(0.4ml)。

第1天：不采取行动

第2天：(46小时后)：注射hCG，IP，50U(1ml)。

-设置单一雌性交配。

第3天：检查栓塞。将雌性堵塞。这是第0.5天。

第6天(e3.5)：使雌性安乐死，并冲洗胚胎。

ES细胞衍生方案(超排卵)

第0天：

1)用CO₂使雌性大鼠安乐死。

2)用70％乙醇擦拭腹侧腹部；使用剪刀打开腹侧体壁以暴露内脏。

3)解剖出输卵管和子宫角，并将它们放置到含有温热N2B27培养基的组织培养皿中。洗出尽可能多的血液，并转移到具有N2B27的新培养皿中。

4)使用1ml注射器和钝27g针，使培养基冲洗经过子宫角和输卵管以使胚泡排出到培养基中。

5)用口吸移管收集胚泡，并且转移到含有KSOM+2i(1μΜ PD0325901、3μMCHIR99021)的胚胎培养皿中。KSOM为由Millipore生产的培养基。目录号为MR-106-D。

6)在37°下培养过夜；7.5％CO₂。

ES细胞衍生方案(冷冻胚胎)

第0天：

1)使冷冻的8细胞胚胎(商业上获得)解冻到M2培养基中。在室温下培养10分钟。

2)转移到KSOM+2i中并培养过夜。

ES细胞衍生方案(两者相同)

第1天：

1)将空腔化胚胎转移到2i培养基中并培养过夜。

2)在KSOM+2i中继续培养未空腔化的胚胎。

第2天：

1)转移所有剩余的胚胎到2i培养基中(无论它们是否已空腔化)。

2)培养过夜；在2i培养基中继续培养较早期的胚胎。

第3天：

1)用酸性台氏液转移胚胎30-60秒以移除透明带。

2)在2i培养基中洗涤胚胎3次以移除酸性台氏液。

3)将各胚胎沉积到96孔饲养板的单独孔中(所述孔含有单层有丝分裂失活的小鼠胚胎成纤维细胞(MEF))。

4)在2i培养基中培养过夜。

第4-5天：

1)监测涂铺的胚胎的生长晕(无定形未分化的细胞团)是否存在。当生长晕的大小是涂铺胚胎的约两倍时，所述生长晕即准备用于转移。

2)每天：用微量吸移管移除用过的培养基，并且用新鲜2i培养基替换。

3)转移生长晕到新饲养孔中：

a.移除用过的培养基并用PBS温和地洗涤孔。

b.移除PBS，并加入30μl 0.05％胰蛋白酶；孵育10分钟。

c.通过加入30μl 2i+10％FBS来终止胰蛋白酶反应。

d.用微量移液器温和地离散细胞，并转移孔的整个内含物到24孔饲养板的新孔中。这是第1代(P1)。

e.在2i培养基中培养过夜。

第5-8天：(时机取决于各株系扩增的快速程度)

1)每天更换培养基(2i培养基)并监测具有ESC形态的集落是否存在。

2)当集落出现时，继续培养直至集落扩增至约50％汇合。

3)如前将集落用胰蛋白酶处理并传代；涂铺在饲养器上，在6孔培养皿中，每个株系1个孔。这是第2代(P2)。

进行中的事务：

1)继续饲养并监测各株系，直至约50％汇合。

2)照常用胰蛋白酶处理细胞。

3)用2i+10％FBS终止胰蛋白酶；细胞通过离心(5'，在Beckman-Coulter台式离心机中1200rpm)粒化。

4)吸出上清液，且将细胞温和地再悬浮于400μl冷冻培养基(70％2i、20％FBS、10％DMSO)中。

5)将细胞分配到2个小瓶中并在-80°下冷冻。这是第3代(P3)。

6)对于长期储存，转移小瓶到液N₂储存库中。

2i培养基如下表3制备。

材料：妊娠母马的血清促性腺激素(PMSG)

人类妊娠尿绒毛膜促性腺激素(HCG)

雌性大鼠(5-12周龄)

雄性大鼠(12周至8月龄)，每笼一只

注射器/针头

动物室在6:00-18:00进行光照

程序：

第1天：8:00-10:00AM

用20IU PMSG(0.4ml)注射雌性，IP

丢弃未使用的PMSG。

第3天：8:00-10:00AM(在PMSG注射之后48小时)

用50IU HCG(1ml)注射雌性，IP

在交配笼中每个雄性放置一个雌性。

丢弃未使用的HCG。

第4天：8:00-10:00AM(在HCG注射之后24小时)

检查雌性的栓塞。

激素供应商

PMSG：Sigma#G-4877(1000IU)。在PBS中再悬浮到最终[]50IU/ml。以1ml等分试样在-20°下储存。

HCG：Sigma#CG-5(5000IU)。在PBS中再悬浮到最终[]50IU/ml。以1ml等分试样在-20°下储存。

1.4.：大鼠胚胎干细胞系的核型分析

分析本文产生的大鼠ES细胞系的核型，且结果概述在表4-7中。

表4

表5

表6

表7

1.5.：载体电穿孔到大鼠胚胎干细胞中

1.在电穿孔之前24-48小时使大鼠ES细胞传代。

2.在电穿孔之前24小时将培养基更换成RVG2i+ROCKi(10μM Y-27632)。

3.在胰蛋白酶处理之前30’更换培养基。

4.将待电穿孔的DNA等分。

5.使DNA在室温下温热>10分钟。

6.在62℃下加热DNA 5’。将DNA放置在冰上。

7.用胰蛋白酶处理细胞：

a.收集浮动集落。将板洗涤以收集尽可能多的浮动物。

b.使集落粒化：在750rpm下3’。

c.用5-10ml PBS洗涤粒料1次，并且再旋转/粒化。

d.吸出上清液；加入500λ胰蛋白酶、0.05％+1％鸡血清。

i.每个管不要汇集超过1个10cm板的集落。如果在胰蛋白酶处理期间有太多集落堆积到管的底部，那么它们将结块，并且大多数细胞将被损失。

e.在37°下4’。吸移集落数次以使结块最小。

f.重复步骤1-2次：在37°下4’。

g.用500λRVG2i+10％FBS终止胰蛋白酶。

8.使细胞粒化：在1200rpm下5’。

9.使细胞在10ml PBS中再悬浮。对两个20λ等分试样计数以测定总细胞数目。

10.使细胞粒化(5’/1200rpm)；计算总细胞数目和总再悬浮体积以获得正确的细胞浓度(靶数目/75μl EP缓冲液)。

11.在最小体积的EP缓冲液中再悬浮；测量总体积，并用EP缓冲液调整至靶体积。电穿孔缓冲液由Millipore销售。目录号是ES-003-D。参见Valenzuela等人，(2003)NatureBiotechnology 21:652-659，其通过引用的方式并入本文中。

12.将75λ细胞加到50λDNA中；将125λ细胞/DNA溶液转移到BTX 48孔比色皿的一个孔中。

a.用125λEP缓冲液填充在同一列中的空孔。

13.在BTX电穿孔仪中对比色皿施加脉冲一次：

a.设置：400V；Ω；100μF(设置可变化)

14.将比色皿放置在冰上15’以便恢复。

15.将细胞移除到5ml RVG2i+10μM ROCKi中。

16.添加到具有20ml RVG2i+10μM ROCKi的15cm板中。板具有2x neoR MEF(或其它MEF，视项目而定)。neoR可选择标记为Beck等人，(1982)Gene,19:327-36的或在美国专利号7,205,148或6,596,541中的新霉素磷酸转移酶(neo)基因，所述文献和专利各自以引用的方式并入本文中。

17.在37°下孵育。48小时后开始选择。

所使用的ROCK抑制剂为Y-27632。

1.6：选择在大鼠胚胎干细胞中的靶向基因修饰。

1.在电穿孔之前24-48小时使细胞传代。

2.在电穿孔之前24小时将培养基更换成RVG2i+ROCKi(10μM Y-27632)。

3.在胰蛋白酶处理之前30’更换培养基。

4.将待电穿孔的DNA等分。

5.使DNA在室温下温热>10分钟。

6.在62℃下加热DNA 5’。将DNA放置在冰上。

7.用胰蛋白酶处理细胞：

a.收集浮动集落。将板洗涤以收集尽可能多的浮动物。

b.使集落粒化：在750rpm下3’。

c.用5-10ml PBS洗涤粒料1次，并且再旋转/粒化。

d.吸出上清液；加入500λ胰蛋白酶、0.05％+1％鸡血清。

e.在37°下4’。吸移集落数次以使结块最小。

f.重复步骤1-2次：在37°下4’。

g.用500λRVG2i+10％FBS终止胰蛋白酶。

8.使细胞粒化：在1200rpm下5’。

11.在最小体积的EP缓冲液中再悬浮；测量总体积，并用EP缓冲液调整至靶体积。

a.用125λEP缓冲液填充在同一列中的空孔。

13.在BTX电穿孔仪中对比色皿施加脉冲一次：

a.设置：400V；100μF(设置可变化)。

14.将比色皿放置在冰上15’以便恢复。

15.将细胞移除到5ml RVG2i+10μM ROCKi中。

16.添加到具有20ml RVG2i+10μM ROCKi的15cm板中。板具有2x neoR MEF(或其它MEF，视项目而定)。

17.在37°下孵育。48小时后开始选择。

18.G418选择方案如下：

a.第2天(在EP之后第2天)：在2i培养基+75μg/ml G418中孵育细胞。

b.第3天：在无G418的2i培养基中孵育细胞。

c.第4天：在2i培养基+75μg/ml G418中孵育细胞。

d.第5天：在无G418的2i培养基中孵育细胞。

e.第6天：在2i培养基+75μg/ml G418中孵育细胞。

f.第7天：在无G418的2i培养基中孵育细胞。

g.第8天：在2i培养基+75μg/ml G418中孵育细胞。

h.第9天：在无G418的2i培养基中孵育细胞。

i.第10天：在2i培养基+75μg/ml G418中孵育细胞。

j.第11天：在无G418的2i培养基中孵育细胞。

k.第12天：挑选集落以进行扩增以便筛选。各集落在0.05％胰蛋白酶+1％鸡血清中离散10分钟，且随后涂铺到96孔饲养板的1个孔中。

19.在2i培养基中扩增集落3天。

20.以1:1使克隆传代至新96孔饲养板中。

21.在2i培养基中扩增克隆3天。

22.对于各克隆，在胰蛋白酶中离散集落。冷冻2/3的各克隆，并在-80°下储存；将剩余1/3涂铺到层粘蛋白板(用10μg/ml层粘蛋白涂布的96孔板)上。

23.当层粘蛋白板汇合时，传至筛选实验室以分析克隆的基因分型。

1.7.大鼠胚胎干细胞的分子标签

在表8中所列的基因在大鼠ES细胞中比相应基因在小鼠ES细胞中的表达低20倍。在表9中所列的基因在大鼠ES细胞中比相应基因在小鼠ES细胞中的表达水平高20倍。

如下产生在表8和9中的微阵列数据。在2i培养基中培养大鼠ES细胞(ACI.G2和DA.2B)和小鼠ES细胞(F1H4)3代直至汇合。在不存在饲养器的情况下在明胶涂布的板上培养F1H4细胞。F1H4小鼠ES细胞来源于129S6/SvEvTac和C57BL/6NTac杂合胚胎(参见，例如美国专利号7,294,754和Poueymirou,W.T.,Auerbach,W.,Frendewey,D.,Hickey,J.F.,Escaravage,J.M.,Esau,L.,Dore,A.T.,Stevens,S.,Adams,N.C.,Dominguez,M.G.,Gale,N.W.,Yancopoulos,G.D.,DeChiara,T.M.,Valenzuela,D.M.(2007)，其以引用的方式并入本文中)。

以下方案用于样品制备：1.5mL Eppendorf管用样品识别符标记。将在板上生长的细胞在37℃磷酸盐缓冲盐水(PBS)中冲洗。移除PBS且加入300ul使用刮削器以破坏在(Life Technology)中的细胞。将裂解的细胞收集于1.5mL Epperdorf管中的对于悬浮生长的细胞，在37℃PBS中冲洗细胞，并且收集在1.5mL管中。使细胞旋转减慢；移除PBS；并将300ul加到细胞中。细胞膜通过吸移来破坏。分选样品以用于以10-10⁵个细胞进行FACS，浓缩体积至小于100μL。加入4体积的RNA裂解缓冲液，并且通过吸移来混合。对于样品，将320μL RNA裂解缓冲液加到80μL样品中。将样品在-20℃下储存。

使用RNA-Seq以测量小鼠和大鼠基因的表达水平。通过Tophat来使测序读数定位到小鼠和大鼠参照基因组，并且计算小鼠和大鼠基因的RPKM(定位的每百万片段中外显子的每千碱基的片段数)。选择基于基因符号的同源性基因，且随后使用t检验来比较在小鼠与大鼠之间各基因的表达水平。miR-32处于大鼠ESC中最高表达的前10名，但不在小鼠ES细胞中表达。尽管不存在来自miR-632的比较数据，但基于它相较于在大鼠ESC中表达的其它基因的表达水平以及它们在胚胎发育方面的已知功能，选择miR-632作为大鼠ES细胞的标记。

表8.所列基因在大鼠ES细胞中比相应基因在小鼠ES细胞中的表达水平低20倍。

表9.所列基因在大鼠ES细胞中比相应基因在小鼠ES细胞中的表达水平高20倍。

表10.来自表9的基因亚组，其在大鼠ES细胞中比相应基因在小鼠ES细胞中的表达水平高20倍。

识别符	Entrez基因名称
		Ajap1	粘附蛋白接合相关蛋白
Cldn5	密封蛋白5
		Arhgef9	Cdc42鸟苷酸核苷酸交换因子9
Camk4	钙/钙调蛋白依赖性蛋白激酶IV
		Efna1	肝配蛋白-A1
Epha4	EPH受体A4
		Gjb5	间隙连接蛋白β5
Igfbpl1	胰岛素样生长因子结合蛋白样1
		Il1f8	白细胞介素36β
Il28ra	白细胞介素28受体α
		Lefty1	左-右决定因子1
Lifr	白血病抑制因子受体α
		Lpar2	溶血磷脂酸受体2
Ntm	神经元穿透素受体
		Ptpn18	非受体型蛋白酪氨酸磷酸酯酶18
Cdx2	尾型同源框2
		Fank1	III型纤连蛋白和锚蛋白重复结构域1
Foxe1	叉头框E1(甲状腺转录因子2)
		Hey2	与YRPW基序相关的毛状/分裂增强子2
Lef1	淋巴增强子结合因子1
		Sall3	Sal样3(果蝇)
Satb1	SATB同源框1

还已开发采用大鼠ES细胞的多潜能标记/基因的另一分子标签。表11提供基因清单和它们根据RNA剖析数据的表达分级。mRNA从大鼠ES细胞分离，并且相对于彼此比较各种标记的表达水平。术语“分级”是指个别基因的比较表达水平：分级越高(1是最高)，表达越高。例如，Oct4的分级为13是指在所有测定的基因中，其表达高于除12个基因之外的所有基因。在该实验中的本底为低于30的任何表达值；6107个基因具有30或更高的表达值。

表11.采用各种多潜能性、中胚层、内胚层、神经和滋养外胚层标记/基因的大鼠ES细胞分子标签。

实施例2：使在大鼠中的基因组基因座失活

2.1：使用核酸内切酶试剂使内源基因组基因座失活

为了在内源大鼠基因组基因座处引入突变等位基因，本文所述的大鼠ES细胞用表达ZFN1和ZFN2(或TALEN1和TALEN2)的表达载体(或mRNA)电穿孔。这些蛋白质在相对链上结合它们的相隔约6bp-约40bp的靶序列。在靶基因座内形成细胞试图通过非同源端接合(NHEJ)修复的双链断裂。在许多情况下，NHEJ导致产生常破坏基因功能(最常通过产生移码突变)的缺失。为了鉴定包含突变等位基因的阳性克隆，以低密度涂铺电穿孔的细胞，因为未进行药物选择。挑选出集落，并且在靶位点处进行测定以观察是否产生突变(例如使用上述等位基因修饰(MOA)测定)。随后将包含突变等位基因的所选择的ES细胞引入宿主大鼠胚胎(例如，前桑椹胚阶段或胚泡阶段的大鼠胚胎)中，并且植入代孕母体的子宫中以产生建群大鼠(F0大鼠)。接着，使建群大鼠与野生型大鼠配种以产生突变等位基因杂合性F1子代。杂合F1大鼠交配可产生突变等位基因纯合性子代。

2.2.：大鼠ESC靶向以使用锌指核酸酶使大鼠载脂蛋白E(ApoE)基因失活

锌指核酸酶使用序列特异性模块化DNA结合结构域以将核酸内切酶活性定向到在基因组中的独特靶序列。ZFN工程化成一对单体。各单体含有融合到3个或更多个锌指DNA结合结构域的来自FokI核酸内切酶的非特异性裂解结构域。各锌指结合3bp亚位点，且特异性通过两种单体的组合靶位点来实现。ZFN在DNA中产生双链断裂(DSB)，并且突变(插入或缺失)在非同源端接合(NHEJ)期间频繁地发生。图15说明例如ZFN和TALEN的编辑基因组的核酸内切酶在靶基因组序列中引入双链断裂并在细胞中激活NHEJ的机制。如果供体序列提供有ZFN，则DSB也通过同源重组激发同源性定向修复(HDR)。

这样的ZFN与本文所述的各种方法和组合物组合采用以改进靶向效率。如在实施例3.2(a)(i)中所述靶向大鼠载脂蛋白E(ApoE)基因座，例外的是也将表达ZFN1和ZFN2的表达载体引入大鼠ES细胞中。参见图11，其提供与rTZFN1P和rTZFN2P组合的ApoE靶向事件的示意图。如以下在实施例5中论述来确定靶向效率且结果示于表12中。为了筛选以便杂合靶向、纯合靶向和“混合”双重靶向(例如，复合杂合靶向)，使用特异性引物和探针来确定基因分型。令人惊讶地，靶向效率增长8-10倍。

表12.大鼠ApoE ZFN：改进的靶向效率。

构建具有自我缺失的药物选择盒和作为报道基因的lacZ基因的质粒靶向载体(参见图14，其说明可在包含选择盒的靶向载体电穿孔后发生的同源和非同源重组事件)。实现良好的靶向效率，并且产生高％嵌合体。也与靶向载体组合试验锌指核酸酶(ZFN)以考查它对改进靶向效率的影响(参见图16，其说明利用ZFN或TALEN改进靶向载体的同源重组的效率的基因靶向技术)。使靶向载体与切割ApoE基因座的2个ZFN对的表达载体共表达。用靶向载体与一组ZFN两者电穿孔的大鼠ESC克隆显示靶向效率比仅用靶向载体电穿孔的大鼠ESC克隆的靶向效率高8-10倍。此外，在我们的克隆中的约2％中检测到双等位基因纯合靶向。自这些靶向克隆中的两种获得高％嵌合体。

将ApoE靶向(在ZFN辅助下)大鼠ESC克隆微量注射到SD胚泡中，随后使用标准技术将其转移到假妊娠SD受体雌性中。嵌合体通过毛色来鉴定(参见图17，其示出ApoE-ZFN-AB5嵌合体(即，ApoE^-/-嵌合体)；使雄性F0嵌合体与SD雌性配种。对于是否存在靶向ApoE等位基因来对种系F1幼仔基因分型(表13)。自这些靶向克隆中的两种获得高％嵌合体。

表13.微量注射结果。

ApoE敲除大鼠提供研究各种类型的病症和疾病的手段。在人类中，载脂蛋白在乳糜微粒、HDL、LDL和VLDL中见到。ApoE对于富含甘油三酯的脂蛋白成分的正常分解代谢是必不可少的。APOE的缺陷导致众多疾病状态，包括例如家族性高胆固醇血症、高脂血症、β脂蛋白血症、家族性异常β脂蛋白血症、III型高脂蛋白血症(HLP III)、冠状动脉疾病风险。一种同种型(ApoE4)与迟发型家族性和偶发性阿尔茨海默氏病相关，可能也与MS相关。

在小鼠中，ApoE主要见于HDL中；转运胆固醇，如同在人类中一样。ApoE缺乏性小鼠(2种独立KO)具有5倍于正常的血浆胆固醇；截至3个月龄在它们的近端主动脉中产生富含泡沫细胞的沉积物(与人类综合征相当)。

在大鼠中敲除ApoE提供研究内皮功能(包括但不限于斑块形成)、转录改变(RNA-Seq)、离体功能的动物模型。此外，大鼠的身材较大将有助于所有这些测定，并且潜在地改进RNA-Seq数据的质量。

2.3.使用锌指核酸酶使大鼠干扰白细胞素-2受体γ(IL2r-γ)基因座失活

如在实施例3.3(a)中所述，靶向大鼠干扰白细胞素-2受体γ(IL2r-γ或Il2rg)基因座，例外之处在于还将表达ZFN U(ZFN上游)和ZFN D(ZFN下游)的表达载体引入大鼠ES细胞中。图18提供与ZFN U和ZFN D组合的IL2r-γ靶向事件的示意图。这些锌指结合的IL2r-γ基因座的序列在图18中在SEQ ID NO:93内指出。如以下在实施例3.3(a)中论述来确定靶向效率且结果示于表14中。简要地讲，纯合靶向克隆通过PCR证实。对于ZFN1成对：筛选192种突变克隆中的173种突变克隆(90％)，且对于ZFN2对，筛选192种克隆中的162种克隆(84％)。

表14.大鼠IL2r-γ基因座的靶向。

板	筛选的集落	靶向	效率
				7/18：仅载体	96	4	4.2％
7/18：载体+ZFN	96	3	3.1％

将IL2r-γ靶向(在ZFN辅助下)大鼠ESC克隆微量注射到SD胚泡中，随后使用标准技术将其转移到假妊娠SD受体雌性中。通过毛色来鉴定嵌合体；使雄性F0嵌合体与SD雌性配种。针对是否存在靶向IL2r-γ等位基因来对种系F1幼仔进行基因分型。

2.4.：使用CRISPR/Cas9使大鼠干扰白细胞素-2受体γ(IL2r-γ)失活

如在实施例3.3(a)中所述靶向大鼠IL2r-γ基因座，例外之处在于还将CRISPR/Cas9系统引入大鼠ES细胞中以有助于靶向效率。采用SBI:System Biosciences Cas9“SmartNuclease”全合一载体，并且Cas9表达由CAG、EF1a、PGK或CMV启动子驱动。使定制的gRNA接合到载体中，并通过H1启动子来表达。设计针对Il2rg的4种gRNA。通过gRNA1-4靶向的大鼠IL2r-γ基因座的区示于图19中。为了筛选以便靶向(例如，杂合靶向、纯合靶向和复合杂合靶向)，使用特异性引物和探针来确定基因分型。当采用各种向导RNA时的靶向结果示于表15中。“强”和“弱”是指集落具有靶向修饰的基于筛选的证据的力度。

表15.用向导RNA靶向大鼠Il2rg基因座

2.5.：使用CRISPR/Cas9使小鼠次黄嘌呤鸟嘌呤磷酸核糖基转移酶(Hprt)基因失活

小鼠Hprt基因座在小鼠ES细胞中仅使用LTVEC或与CRISPR/Cas9组合靶向。靶向32.9kb完整Hprt编码序列以便缺失和用pCAGG-Puro嘌呤霉素抗性选择盒替换，其也表达eGFP。缺失端点为起始密码子和终止密码子。所使用的向导RNA序列为5'-GACCCGCAGUCCCAGCGUCG-3'(SEQ ID NO:84)，其靶向小鼠Hprt基因的外显子1。预测的靶位点裂解位置为距缺失的5'端的22个碱基对。在ES细胞中观察到的Cas9/gRNA靶上裂解效率≥93％。概述示于表16中。与仅使用LTVEC相比，使用CRISPR/Cas9以帮助靶向完整32.9kbHprt基因座引起靶向增强5倍。

表16.Hprt基因的CRISPR辅助的缺失的概述

实施例3：大鼠基因组基因座的靶向修饰

3.1：大鼠ESC靶向：大鼠Rosa26基因座。

如在小鼠中一样，大鼠Rosa26基因座以相同间隔位于Setd5基因和Thumpd3基因之间。大鼠Rosa26基因座(图12，版面B)不同于小鼠Rosa26基因座(图12，版面A)。小鼠Rosa26转录体由2个或3个外显子组成。除与小鼠外显子1同源的外显子(Ex1a)之外，大鼠基因座还含有第二外显子1(Ex1b)。尚未在大鼠中鉴定出第三外显子。对大鼠Rosa26等位基因的靶向描绘在图12C中，其中使用来自DA大鼠ESC的基因组DNA，通过PCR来克隆各自5kb的同源臂。靶向等位基因含有替换在大鼠Rosa26内含子中的117bp缺失的SA(剪接接受体)-lacZ-hUb-neo盒。

确定在大鼠Rosa26基因座处的靶向效率(表17)。将线性化载体电穿孔到DA或ACI大鼠ESC中，并且转染的集落使用标准技术在2i培养基+G418中培养。挑选个别的集落，并且使用等位基因损失(LOA)测定加以筛选(Valenzuela,D.等人，(2003)High-throughputengineering of the mouse genome coupled with high-resolution expressionanalysis,Nature Biotech.21:652-660，通过引用的方式并入本文中)。

使用Rosa26-靶向大鼠ESC克隆的嵌合体产生和种系传递。将再次证实的Rosa26-靶向大鼠ESC克隆微量注射到SD胚泡中，随后使用标准技术将其转移到假妊娠SD受体雌性中。通过毛色来鉴定嵌合体；使雄性F0嵌合体与SD雌性配种。针对是否存在靶向Rosa26等位基因对种系(刺鼠)F1幼仔进行基因分型；22个刺鼠幼仔中的9个被基因分型为在Rosa26基因座处是杂合的(表18)。

为了证实在Rosa26基因座处的基因修饰的等位基因经由种系传递，lacZ表达通过在杂合Rosa26-靶向大鼠中的X-gal染色证实。来自14周龄杂合Rosa26-靶向大鼠的脑、心脏和胸腺及肺的X-gal染色示出lacZ的表达(分别地，图13B、13D和13F)，而周龄匹配的野生型对照物示出低水平的本底X-gal染色(分别地，图13A、13C和13E)。在E12.5和E14.5杂合Rosa26-靶向大鼠胚胎中的X-gal染色示出lacZ的遍在表达(分别地，图13G和13I)，而对照大鼠胚胎示出低水平的本底X-gal染色(分别地，图13H和13J)。

3.2.(a)(i)：大鼠载脂蛋白E(ApoE)基因座的靶向。

靶向大鼠载脂蛋白E(ApoE)基因座以破坏ApoE功能。ApoE基因座的靶向使用包含侧接有与ApoE基因座同源的5'同源臂和3'同源臂的lacZ-hUb-neo盒的靶向载体进行。图20描绘已经通过1.8kb缺失和lacZ-hUb-neo盒插入破坏的基因修饰的大鼠ApoE基因座，其进一步包括包含由鱼精蛋白启动子驱动的Crei基因的自缺失Cre盒。电穿孔条件如下：6ugDNA；2.05x 10⁶个细胞；400V；200uF：342V，593微秒；在2i+10uM ROCKi中涂铺15cm 2x密集neoR MEF上。

确定在ApoE基因座处的靶向效率且将其示于表19中。将线性化载体电穿孔到源于DA株的DA.2B大鼠ESC中，并且转染的集落使用标准技术培养。挑选个别的集落，并且使用等位基因损失(LOA)测定加以筛选。

执行使用ApoE-靶向大鼠ESC克隆的嵌合体产生和种系传递。将ApoE-靶向大鼠ESC克隆微量注射到SD胚泡中，随后使用标准技术将其转移到假妊娠SD受体雌性中。通过毛色来鉴定嵌合体；使雄性F0嵌合体与SD雌性配种。实现种系传递。对于是否存在靶向ApoE等位基因来对F1幼仔基因分型(表20)。

表20.微量注射结果

实施例	克隆	幼仔	嵌合体(％嵌合体)
				1	ApoE-AF5	4	3(90,90,90)
2	ApoE-BC4	5	0

由内源ApoE启动子驱动的LacZ表达通过在12周龄ApoE^+/-雌性大鼠中在脑、血管和肝中的X-gal染色证实(分别地，图43-45)。图43-45示出反映内源ApoE的表达模式的lacZ的表达模式。年龄匹配的野生型对照物示出低水平的本底X-gal染色。

进一步研究ApoE-缺失的大鼠的表型。执行纵向血清化学研究以每隔三周测量胆固醇、LDL、HDL和三酸甘油酯水平。图46A-D示出6周、9周、12周和15周龄的纯合靶向、杂合靶向和野生型大鼠中的血清胆固醇、LDL、HDL和三酸甘油酯水平。对由2只野生型大鼠、7只杂合大鼠和8只纯合大鼠组成的年龄匹配群执行眼睛放血(Eye bleed)。在雄性和雌性之间没有见到显著区别。纯合的ApoE-缺失大鼠示出升高的胆固醇和LDL水平及减小的HDL水平。与ApoE^-/-小鼠不同，在ApoE-缺失的大鼠中没有观察到三酸甘油酯的显著增加。

执行的其它表型的分析包括对于主动脉弓斑块形成的组织学/离体成像、对于主动脉弓斑块形成的体内成像和对于主动脉弓内皮的转录改变(全基因组鸟枪测序(RNA-Seq))。这些测定的时机取决于斑块形成的时间线。斑块可在ApoE^-/-小鼠中在24周检测。

ApoE的其它靶向数据也提供在表22中。

3.2.(a)(ii).用靶向载体靶向在大鼠中的ApoE

图20提供大鼠ApoE基因座和靶向质粒的示意图。图20的上部示意图示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是5kb和5.4kb；暗灰色框)的基因组结构。ApoE的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE的3个内含子指示为直线，且外显子2和3包含编码区并显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。

图20的下部示意图为靶向载体。5'同源臂和3'同源臂(分别是5kb和5.4kb)通过暗灰色框来指示。靶向载体包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒。自缺失性盒包含操作性连接小鼠Prm1启动子的Crei基因和包含操作性连接人类泛素启动子的新霉素抗性基因的选择盒。

Crei基因包含两个编码Cre重组酶的外显子，其由内含子(Crei)分隔以防止它在原核细胞中表达。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其详细地描述自缺失性盒并且以引用的方式整体并入本文中。通过采用Prm1启动子，自缺失性盒可在F0大鼠的雄性生殖细胞中被特异性缺失。将靶向载体电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集新霉素抗性MEF上。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在表44中所示，筛选384个集落，并获得23个靶向克隆。靶向效率为5.99％。如本文在实施例1中所述将3个克隆注射到胚泡中。获得3个产生嵌合体的克隆，并且所述克隆中的1个经由种系传递靶向修饰。

3.2.(a)(iii).与锌指核酸酶组合用靶向载体靶向大鼠中的ApoE

在实施例3.2(a)(ii)中采用的靶向载体与锌指核酸酶组合用于靶向大鼠ApoE基因座。表21提供大鼠ApoE基因座的基因组组构的概述。在表21中所示的位置取自大鼠基因组的参考序列(ENSMBL)的5.0构建版。ApoE在(-)链上的染色体1上。

表21.大鼠ApoE基因座以及锌指核酸酶结合位点和切割位点的位置的概述。

图11提供大鼠ApoE基因座的示意图，并且用灰条指示ZFN1和ZFN2的切割位点。ZFN1的切割位点在外显子3中，并且ZNF2的切割位点在内含子3中。两个ZFN位点的精确位置阐述在表21中。对应于5'同源臂和3'同源臂的基因组区(分别是5kb和5.4kb)通过暗灰色框来指示。ApoE的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线，并且外显子2和3包含编码区并显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。

所采用的靶向载体与实施例3.2(a)(ii)中以及示于图20中的靶向载体相同，且图21A提供使用锌指核酸酶和在图20中描绘的靶向载体靶向在大鼠ES细胞中的ApoE基因座的示意图。将ZFN作为两个表达质粒形式引入，每个质粒针对ZFN对的各一半。使用20ug针对ZFN1的质粒和20ug针对ZFN2的质粒。ZFN购自Sigma。各ZFN的表达由CMV启动子驱动。

将靶向载体电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uMROCKi中涂铺在15cm 2x密集neoR MEF上。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在表22和表44中所示，筛选384个集落并获得290个靶向克隆。靶向效率为75.52％。如本文在实施例1中所述将2个克隆注射到胚泡中。获得2个产生嵌合体的克隆，并且所述克隆中的一个经由种系传递靶向修饰。

此外，采用ZFN1和ZFN2，以效率2.08％产生8个双等位基因靶向克隆。

表22.ApoE基因座的靶向。

3.2.(b)(i)：使用大靶向载体(LTC)来靶向修饰大鼠载脂蛋白E(ApoE)基因座。

使用包含侧接有ApoE基因座的约45kb 5'同源臂和ApoE基因座的约23Kb 3'同源臂的lacZ-小鼠Prm1-Crei盒的大靶向载体(LTVEC)对ApoE基因座进行靶向。图22描绘大鼠ApoE基因座，其中ApoE基因座已通过1.83kb缺失以及插入lacZ基因和包含mPrm1-Crei盒和hUb-neo选择盒的自缺失性盒来破坏。在实施例3.2(a)(i)中采用的方法可用以将该载体引入大鼠ES细胞中。

实施例3.2.(b)(ii).用大靶向载体(LTVEC)靶向大鼠ApoE基因座

图22提供大鼠ApoE基因座和大靶向载体(LTVEC)的示意图。图22的上部示意图示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是45kb和23kb；暗灰色框)的基因组组构。ApoE的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE的3个内含子指示为直线，且外显子2和3包含编码区并显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。

图22的下部示意图为LTVEC。5'同源臂和3'同源臂(分别是45kb和23kb)通过暗灰色框来指示。靶向载体包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒，所述自缺失性盒包含操作性连接小鼠Prm1启动子的Crei基因和包含操作性连接人类泛素启动子的新霉素抗性基因的药物选择盒。Crei基因包含两个编码Cre重组酶的外显子，其由内含子(Crei)分隔以防止它在原核细胞中表达。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其详细地描述自缺失性盒并且以引用的方式整体并入本文中。通过采用Prm1启动子，自缺失性盒可在F0大鼠的雄性生殖细胞中被特异性缺失。

将LTVEC电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集neoR MEF上。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在表44中所示，筛选288个集落，并获得8个靶向克隆。靶向效率为2.78％。如本文在实施例2中所述将3个克隆注射到处于胚泡阶段的宿主胚胎中以产生嵌合大鼠(F0)。此外，产生一个双等位基因靶向克隆，从而提供0.35％的双等位基因效率。

3.2.(b)(iii).与锌指核酸酶组合用大靶向载体(LTVEC)靶向在大鼠中的ApoE

在实施例3.2.(b)(ii)中采用的LTVEC与锌指核酸酶组合用于靶向大鼠ApoE基因座。表21提供大鼠ApoE基因座的基因组组构的概述，并且所示位置取自大鼠基因组参照序列(ENSMBL)的5.0构建版。

图23提供大鼠ApoE基因座的示意图，并且用灰条指示ZFN1和ZFN2的切割位点。ZFN1的切割位点在外显子3中，并且ZNF2的切割位点在内含子3中。两个ZFN位点的精确位置阐述在表21中。5'同源臂和3'同源臂(分别是45kb和23kb)通过暗灰色框来指示。ApoE基因的外显子1是非编码的，并且显示为最靠近5'同源臂的空心框。ApoE基因的三个内含子指示为直线。外显子2和3包含编码区且显示为点描灰色框。外显子4含有编码序列和非编码序列两者，如通过点描灰色阴影和空心框所指示。

所采用的LTVEC与在实施例3.2(b)(ii)中且示于图22中的LTVEC相同。将ZFN作为两个表达质粒形式引入，每个质粒针对ZFN对的各一半。使用20ug针对ZFN1的质粒和20ug针对ZFN2的质粒。ZFN购自Sigma。各ZFN的表达由CMV启动子驱动。

如在表44中所示，筛选288个集落，并获得16个靶向克隆。靶向效率为5.56％。如本文在实施例2中所述将1个克隆注射到胚泡中。

此外，采用ZFN1和ZFN2以0.35％的效率产生一个双等位基因靶向克隆。

3.2.(b)(iv).与CRISPR/Cas9组合用大靶向载体(LTVEC)靶向在大鼠中的ApoE

在实施例3.2.(b)(ii)中采用的LTVEC与CRISPR/Cas9组合用于靶向大鼠ApoE基因座。表23示出其中仅使用ApoE LTVEC来靶向大鼠ApoE基因座或与CRISPR/Cas9核酸酶组合用以靶向大鼠ApoE基因座的实验的结果的比较。在各实验中，电穿孔的细胞以高密度涂铺且进行药物选择以发现抗药性的集落。挑选抗药性集落且使用如本文所述的等位基因修饰(MOA)测定针对靶向修饰加以筛选。具体地讲，4x 10⁶个细胞在400V的电压、100uF的电容和0的抗性下用2ug ApoE LTVEC电穿孔。在后一实验中，还将6ug Cas9表达质粒和3ug ApoEgRNA2或3ug ApoE gRNA3电穿孔。使用75ug/mL的G418进行选择。ApoE gRNA2具有GCAGGCCCTGAACCGCTTCTTGG的序列(SEQ ID NO:87)且靶向距大鼠ApoE外显子3的起始的区67bp 3'。ApoE gRNA3具有CCTGCGCTGGGTGCAGACGCTTT的序列(SEQ ID NO:88)且靶向大鼠ApoE外显子3的起始的区97bp 3'(参见图47)。如在表23中所示，当Cas9和gRNA中的任一种与ApoE LTVEC一起引入细胞中，靶向效率增加(从43％增加到53％或47％)。在与ApoEgRNA2或3组合用ApoE LTVEC靶向的5个集落中观察到双等位基因靶向，但在仅用ApoELTVEC的情况下没有观察到双等位基因靶向。

表23.在有和没有CRISPR/Cas9的情况下Rag2 LTVEC靶向的比较

3.3(a)：大鼠干扰白细胞素-2受体γ(IL2r-γ)基因座的靶向

靶向大鼠干扰白细胞素-2受体γ(IL2r-γ或Il2rg)基因座以破坏IL2r-γ功能。IL2r-γ对于通过IL-2、IL-4、IL-7、IL-9、IL-15、IL-21进行的信号传导起重要作用，并且在IL2r-γ中的突变与重度T、B和NK细胞发育缺陷相关。

使用包含侧接有与IL2r-γ基因座同源的5'同源臂和3'同源臂的eGFP-hUb-neo盒的靶向载体对IL2r-γ基因座进行靶向，如图24中所描绘。图25描绘大鼠IL2r-γ基因座的基因组结构，其中IL2r-γ基因座已通过3.2kb缺失来破坏。靶向的IL2r-γ基因座也包含eGFP基因和自缺失性盒，所述自缺失性盒含有操作性连接小鼠鱼精蛋白1启动子的Crei和包含操作性连接新霉素抗性基因的hUb启动子的药物选择盒。

测定在IL2r-γ基因座处的靶向效率且示于表24中。将线性化载体电穿孔到DA.2B大鼠ESC中，并且转染的集落使用标准技术培养。挑选个别的集落，并且使用等位基因损失(LOA)测定加以筛选。

执行使用IL2r-γ-靶向大鼠ESC克隆的嵌合体产生和种系传递。将IL2r-γ-靶向大鼠ESC克隆微量注射到SD胚泡中，接着使用标准技术将所述胚泡转移到假妊娠SD受体雌性中。通过毛色来鉴定嵌合体；使雄性F0嵌合体与SD雌性配种。针对是否存在靶向的IL2r-γ等位基因来对种系F1幼仔进行基因分型(表25)。在用克隆Il2rg-CG12的另一微量注射实验中，还通过毛色和基因分型证实种系传递。

表25.微量注射结果

实施例	克隆	幼仔	嵌合体(％嵌合体)
				1	Il2rg-AA1	5	2(90,70)
2	Il2rg-AA1	10	3(90,90,80)
				3	Il2rg-CG12	11	7(95,90,90,90,80,80,80)

进一步研究Il2rg^-/Y嵌合体#3的表型。外周血液单核细胞(PBMC)用识别若干淋巴谱系中的抗原的抗体染色。从2个嵌合体中检测到GFP阳性PBMC，如在图30中所示。此外，GFP+细胞对T细胞标记CD3为阴性的(图29A)，并且大部分对于B细胞标记B220和NK细胞标记CD161a为阴性的(分别地，图29B和29C)。将来自野生型大鼠的PBMC用作GFP表达的阴性对照。参见图29D-F。小双重阳性群体与在小鼠中公开的Il2rg敲除表型一致。这些数据从含有IL2受体γ-阳性细胞的嵌合大鼠获得，并且这可使表型分析复杂化。还可对来自骨髓和脾的细胞群体执行流式细胞分析以揭示淋巴细胞数目的相应减少。参见，Mashimo等人，(2010)PLoS One 5(1):e8870.

3.3(b)：大鼠干扰白细胞素-2受体γ(IL2r-γ)基因座的靶向修饰

靶向大鼠干扰白细胞素-2受体γ(IL2r-γ)基因座以破坏在大鼠中的IL2r-γ功能。图25示出大鼠Il2rg基因座的基因组结构(图25的上部版面)和引入基因座中的靶向载体(图25的下部版面)。eGFP被选作报道基因以使得可使用FACS考查遗传修饰的大鼠的免疫表型。自缺失性盒(hUb-Neo；Prm1-Cre)用于在F0大鼠的雄性生殖细胞中特异性缺失药物选择盒和Cre基因。另外，靶向载体设计成缺失大鼠Il2rg基因的整个编码区(约3.2kb)。

通过使用对大鼠Il2rg基因座具有特异性的引物进行PCR来证实在大鼠ESC中的缺失的尺寸。在将靶向克隆微量注射到处于胚泡阶段的宿主胚胎中，获得高百分数的嵌合体。已创建那些嵌合体用于配种。为了确定靶向是否如预期来起作用，在配种之前收集来自嵌合体的外周血液，并且经由FACS分析在外周血液中的免疫细胞的表型。如在图30中所示，在考查的3个嵌合体中的2个中的外周血液中检测到GFP阳性细胞，并且嵌合大鼠含有针对GFP(即，Il2rg KO细胞)是阳性的小于1％的T细胞、小于1％的B细胞和小于1％的NK细胞(图29A-C)。

3.4(a)(i).用大靶向载体(LTVEC)靶向在大鼠中的Rag2基因座

表26提供大鼠Rag2基因座的基因组组构的概述，并且所示位置取自大鼠基因组参照序列(ENSMBL)的5.0构建版。Rag2在(+)链上的染色体3上。

表26.大鼠Rag2基因座的基因组组构概述。

特征	起始	终止	长度	注释
					外显子1	97,851,317	97,851,448	132
外显子2	97,854,635	97,854,693	59
					外显子3	97,858,260	97,859,615	1,356	含有整体编码序列
ATG	97,856,286	97,856,288	3	起始密码子
					TGA	97,857,867	97,857,869	3	终止密码子


Rag2缺失	97,856,289	97,859,784	3,496

图26提供大鼠Rag2基因座和大靶向载体(LTVEC)的示意图。LTVEC为140kb且针对缺失靶向大鼠Rag2基因座的约5.7kb部分。图26的上部示意图示出大鼠ApoE基因座和对应于5'同源臂和3'同源臂的基因组区(分别是48kb和84kb；暗灰色框)的基因组组构。Rag2包含通过点描灰色阴影来指示的单一外显子。

图26的下部示意图为LTVEC。5'同源臂和3'同源臂(分别是48kb和84kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒。自缺失性盒包含操作性连接Crei基因的小鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。产生LTVEC的另一变型，其中新霉素抗性基因用潮霉素抗性基因替换，从而能够重新靶向Il2rg靶向的大鼠ES细胞。Crei基因包含两个编码Cre重组酶的外显子，其由内含子(Crei)分隔以防止它在原核细胞中表达。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其详细地描述自缺失性盒并且以引用的方式整体并入本文中。通过采用小鼠Prm1启动子，自缺失性盒可在F0大鼠的雄性生殖细胞中被特异性缺失。

将LTVEC电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集neoR MEF上。如在实施例1中所述来培养并维持转化的大鼠ES细胞。

如在本文中其它地方所述来筛选集落并获得靶向的克隆。随后如在本文中其它地方所述，将靶向的克隆注射到宿主胚胎中以产生F0大鼠。

3.4(a)(ii).用大靶向载体(LTVEC)和CRISPR/Cas9靶向在大鼠中的Rag2基因座

表27示出其中仅使用具有潮霉素抗性基因的Rag2 LTVEC的变型以靶向大鼠Rag2基因座(参见图48)或与CRISPR/Cas9核酸酶组合使用以靶向大鼠Rag2基因座的实验的结果的比较。在各实验中，电穿孔的细胞以高密度涂铺且进行药物选择以发现抗药性的集落。挑选抗药性集落且使用如本文所述的等位基因修饰(MOA)测定针对靶向修饰加以筛选。具体地讲，4x 10⁶个细胞在400V的电压、100uF的电容和0的抗性下用2ug Rag2 LTVEC电穿孔。在后一实验中，还将6ug Cas9表达质粒和3ug Rag2 gRNA1或3ug Rag2 gRNA4电穿孔。使用75ug/mL的G418进行选择。Rag2 gRNA1具有CCAGCTACTTGCTCGTACAA的序列(SEQ ID NO:89)并靶向大鼠Rag2起始密码子(ATG)的区219bp 3'。Rag2 gRNA4具有CCCCTCAGATTCACGTGCGT的序列(SEQ ID NO:90)且靶向大鼠Rag2终止密码子(TAG)的区12bp 3'(参见图48)。如在表27中所示，当Cas9和gRNA中的任一种与Rag2 LTVEC一起引入细胞中，靶向效率增加(从0增加到10％或38％)。在一个集落上观察到双等位基因靶向。

表27.在有和没有CRISPR/Cas9的情况下Rag2 LTVEC靶向的比较

3.4.(b)(i)：靶向在大鼠中的Rag1基因座和Rag2基因座

图27提供大鼠Rag1/Rag2基因座的基因组结构。CDS指示编码序列且灰色框代表外显子。Rag2在“+”链上，其中向右进行转录。Rag1在“-”链上，其中向左进行转录。Mbp＝百万碱基对。

表28提供大鼠Rag2基因座和Rag1基因座的基因组组构的概述，并且所示位置取自大鼠基因组参照序列(ENSMBL)的5.0构建版。Rag1在(-)链上的染色体3上。

表28.大鼠Rag1基因座的基因组组构概述。

图28提供大鼠Rag2基因座和Rag1基因座及大靶向载体(LTVEC)的示意图。LTVEC为约70kb且靶向包含缺失的Rag1和Rag2基因座的约16.6kb大鼠基因组基因座。图28的上部示意图示出Rag1和Rag2基因座和对应于5'同源臂和3'同源臂的基因组区(分别是48kb和15kb；暗灰色框)的基因组组构。Rag2和Rag1各自包含由点描灰色阴影指示的单一外显子。在图28中的下部示意图为LTVEC。5'同源臂和3'同源臂(分别是48kb和15kb)通过暗灰色框来指示。LTVEC包含报道基因(lacZ)和由loxP位点(空心箭头)侧接的自缺失性盒。自缺失性盒包含操作性连接Crei基因的大鼠Prm1启动子和包含操作性连接新霉素抗性基因的人类泛素启动子的药物选择盒。产生LTVEC的另一变型，其中新霉素抗性基因用潮霉素抗性基因替换，从而能够重新靶向Il2rg靶向的大鼠ES细胞。Crei基因包含两个编码Cre重组酶的外显子，其由内含子(Crei)分隔以防止它在原核细胞中表达。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其详细地描述自缺失性盒并且以引用的方式整体并入本文中。通过采用驱动Crei在雄性生殖细胞中特异性表达的大鼠Prm1启动子，自缺失性盒可从F0大鼠的雄性生殖细胞中缺失。

3.4.(b)(ii)：靶向在其中已经靶向Il2rg基因座的大鼠ES细胞中的Rag1和Rag2基因座

制备如在图50中的LTVEC以针对缺失靶向Rag1基因座和Rag2基因座。LTVEC的全长为72kb。将LTVEC电穿孔到如在实施例3.3中已经靶向Il2rg基因座缺失的大鼠ES细胞中。具体地讲，大鼠ES细胞来自克隆Il2rg-CG12，其种系传递在实施例3.3(a)中证实。如在实施例1中所述来培养并维持转化的大鼠ES细胞。如在本文中其它地方所述来筛选双重靶向克隆并获得靶向的克隆。Il2rg-CG12细胞以85％的效率再靶向，且Il2rg突变仍存在于靶向的克隆中。电穿孔如在本文中其它地方描述，且使用1.5ug/ml嘌呤霉素进行抗生素选择。随后如在本文中其它地方所述，将靶向的克隆注射到宿主胚胎中以产生F0大鼠。再靶向是有利的，因为其比用Il2rg靶向大鼠异种交配Rag1/Rag2-靶向大鼠快。

实施例4.人源化

4.1.大鼠基因组基因座的人源化

采用本文所述的大鼠ES细胞进行大鼠基因组基因座的人源化，所述细胞能够在一次或多次体外电穿孔之后持续它们的多潜能性，并且能够向后代传递靶向基因修饰。另外，为了规避质粒在容纳大基因组DNA片段方面的限制，以及为了克服向在大鼠ES细胞中的内源基因座中引入靶向基因修饰的低效率，通过利用细菌同源重组(BHR)以及采用大靶向载体(LTVEC)在例如大肠杆菌的细菌中进行一次或多次靶向基因修饰。本文所述的LTVEC例如包括内源大鼠基因组序列的具有一种或多种修饰的大片段，或包含侧接有与特定基因组区互补的大鼠同源臂的外源核酸(例如，同源或直系同源人类核酸)。

4.2.大鼠免疫球蛋白基因座的人源化

通过以下方式来进行内源大鼠免疫球蛋白重链基因座的人源化：移除一个或多个内源大鼠免疫球蛋白重链核酸序列(例如，一个或多个内源V_H基因区段、一个或多个人类D基因区段和一个或多个人类J_H基因区段)；以及向修饰的免疫球蛋白基因座中引入靶向载体，例如包含以下的大靶向载体(LTVEC)：(i)一个或多个未重排的人类可变区核酸序列(例如，一个或多个人类V_H基因区段、一个或多个人类D基因区段和一个或多个人类J_H基因区段)或一个或多个重排的人类可变区核酸序列(例如，一个或多个人类重排的V-D-J基因区段)；(ii)选择盒(例如，侧接有loxP位点的新霉素抗性基因)；和(iii)5'和3'大鼠同源臂。

简要地讲，通过用由大鼠同源臂侧接的选择盒靶向内源大鼠免疫球蛋白重链基因座来移除或失活在大鼠BAC克隆中的一个或多个内源大鼠免疫球蛋白重链可变区基因区段(即，一个或多个V_H基因区段、一个或多个人类D基因区段和一个或多个人类J_H基因区段)。更具体地讲，构建靶向载体以含有侧接有与靶大鼠基因组序列(例如，涵盖一个或多个大鼠V_H基因区段、一个或多个人类D基因区段和一个或多个人类J_H基因区段的上游和下游大鼠基因组DNA序列)互补的5'和3'大鼠同源臂的选择盒(例如，侧接有loxP位点的新霉素抗性基因)。

紧接着，选择含有涵盖大鼠免疫球蛋白重链基因座的大大鼠基因组DNA片段的细菌细胞，并且用编码操作性连接短暂可诱导的启动子的重组酶的质粒(例如，PABG)引入。随后将如上构造的靶向载体引入重组感受态细菌细胞中。在电穿孔之后，细菌细胞用诱导因子(例如，阿拉伯糖苷)处理以引发靶向载体与在BAC克隆中的靶大鼠基因组序列之间的同源重组。转化细胞以高密度涂铺，并且进行药物选择以发现抗药性的集落。挑选抗药性集落，并且针对靶向修饰加以筛选。

为了促进靶向基因修饰的鉴定，采用高通量定量测定，即，等位基因修饰(MOA)测定，其允许在基因修饰之后大规模筛选在亲本染色体中的一种或多种修饰等位基因。所述MOA测定可经由包括但不限于例如实时PCR(qPCR)的定量PCR的各种分析技术进行。例如，所述实时PCR包括识别靶基因座的第一引物集和识别非靶向参考基因座的第二引物集。另外，引物集可包括识别扩增序列的荧光探针。可选地，定量测定可经由多种分析技术来进行，所述技术包括但不限于荧光介导的原位杂化(FISH)、比较基因组杂化、等温DNA扩增、与固定的探针定量杂化、InvaderMMP 分子信标和Eclipse^TM探测技术。(参见，例如US2005/0144655，其以引用的方式并入本文中)。

接着用包含以下的大靶向载体(LTVEC)电穿孔包含修饰的大鼠BAC克隆(即，含有其中一个或多个内源重链可变区基因区段(V_H、D和/或J_H基因区段)已缺失或失活的大鼠基因组DNA序列的BAC克隆)的细菌细胞：(i)一个或多个未重排的人类可变区核酸序列(例如，一个或多个未重排的人类V_H基因区段、一个或多个人类D基因区段和一个或多个人类J_H基因区段)或一个或多个重排的人类可变区核酸序列(例如，一个或多个重排的人类V-D-J基因区段)。

如上所述进行在细菌细胞中同源重组的引发以及阳性克隆的选择。未重排或重排的人类免疫球蛋白重链可变区核酸序列在靶向内源免疫球蛋白重链基因座中时变成操作性连接内源大鼠免疫球蛋白重链恒定区核酸序列。可选地，内源大鼠重链恒定区基因座可例如通过从内源重链恒定区基因座缺失一个或多个大鼠重链恒定区基因区段(CH)来失活，并且可被人类重链恒定区核酸序列替换。

同样，通过以下方式进行内源大鼠免疫球蛋白κ或λ轻链基因座的人源化：移除一个或多个内源大鼠免疫球蛋白κ和/或λ轻链可变区核酸序列(例如，一个或多个内源大鼠V_κ基因片段和一个或多个内源大鼠J_κ基因片段)；以及用靶向载体如包含以下的大靶向载体(LTVEC)靶向修饰的免疫球蛋白轻链基因座：(i)一个或多个未重排的人类免疫球蛋白轻链可变区核酸序列(例如，一个或多个人类V_κ基因片段和一个或多个人类J_κ基因片段)或一个或多个重排的人类可变区核酸序列(例如，一个或多个人类重排的V_κ-J_κ基因片段)；(ii)选择盒(例如，侧接有loxP位点的新霉素抗性基因)；和(iii)5'和3'大鼠同源臂。

未重排或重排的人类免疫球蛋白轻链可变区核酸序列在靶向内源免疫球蛋白轻链基因座中时变成操作性连接内源大鼠免疫球蛋白轻链恒定区核酸序列。

在细菌细胞中这样产生的LTVEC包含例如含有人源化大鼠免疫球蛋白重链或轻链基因座的插入核酸，其中一个或多个内源大鼠重链或轻链可变区基因片段已被一个或多个人类重链或轻链可变区基因片段替换；以及与特定基因组靶序列互补的大鼠同源臂(例如，在5kb-150kb的范围内)。接着使上述包含基因修饰的LTVEC线性化，并且电穿孔到大鼠ES细胞中。电穿孔的大鼠ES细胞以高密度涂铺以选择包含靶向载体的抗药性ES细胞。药物选择过程移除大多数的涂铺细胞(约99％)，留下个别的集落，其各自为来源于单一细胞的克隆。在剩余细胞之中，大多数细胞(约80-100％)含有在基因组中的随机位置整合的靶向载体。因此，挑选集落并个别地基因分型以鉴定在正确基因组位置处包含靶向载体的大鼠ES细胞(例如，使用上述等位基因修饰(MOA)测定)。

为了增加靶向基因修饰的效率，大鼠ES细胞用表达ZFN1和ZFN2(或TALEN1和TALEN2)的表达载体(或mRNA)连同LTVEC一起电穿孔。靶向载体的同源臂位于ZFN靶位点外部，因此，靶向载体不被ZFN裂解。由ZFN产生的双链断裂刺激同源性定向修复(HDR)，其另外占据通常在哺乳动物细胞中发生的极小百分数的修复(相较于非同源末端接合；NHEJ)。

可选地，如本文所述的含有II型CRISPR相关核酸酶(例如，Cas9)、向导RNA(包括CRISPR-RNA(cr-RNA)和反式激活CRISPR RNA(tracrRNA))的表达载体可连同LTVEC一起引入细菌细胞中以增加在靶基因组基因座处同源重组的效率。电穿孔的细胞以高密度涂铺，并且进行药物选择以发现抗药性的集落。挑选抗药性集落且使用如本文所述的等位基因修饰(MOA)测定针对靶向修饰加以筛选。在这些程序之后，可实现靶向效率的改进。例如，改进的量可较小(例如，从10％改进到15％)或较大(例如，从10％改进到80％)。

随后将包含靶向基因修饰的所选择的ES细胞引入宿主大鼠胚胎(例如，前桑椹胚阶段或胚泡阶段的大鼠胚胎)中，并且植入代孕母体的子宫中以产生建群大鼠(F0大鼠)。随后，使建群大鼠与野生型大鼠配种以产生对于基因修饰杂合的F1子代。杂合F1大鼠的交配可产生对于基因修饰纯合的子代。

4.3(a).用人类IL2受体γ替换大鼠IL2rg

表29提供大鼠白细胞介素2受体γ基因座的基因组组构的概述，并且所示位置取自大鼠基因组参照序列(ENSMBL)的5.0构建版。Il2rg在(-)链上的染色体X上。

表29.大鼠Il2rg基因座的基因组组构的概述

在图25中的下部示意图为Il2rg 3.2kb缺失的靶向载体。靶向载体包含操作性连接内源启动子的报道基因(eGFP)和由loxP位点(空心箭头)侧接的自缺失性盒。自缺失性盒包含操作性连接小鼠Prm1启动子的Crei基因和包含操作性连接人类泛素启动子的新霉素抗性基因的选择盒。

Crei基因包含两个编码Cre重组酶的外显子，其由内含子(Crei)分隔以防止它在原核细胞中表达。参见，例如美国专利8,697,851和美国申请公布2013-0312129，其详细地描述自缺失性盒并且以引用的方式整体并入本文中。通过采用小鼠Prm1启动子，Cre表达盒和药物选择盒可在F0大鼠的雄性生殖细胞中特异性缺失。将靶向载体电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集新霉素抗性MEF上。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在图31中所示，构建质粒靶向载体以用全长人类白细胞介素2受体γ编码区替换全长大鼠白细胞介素2受体γ编码区。将靶向载体电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集新霉素抗性MEF上。具体地讲，4x10⁶个细胞在400V的电压、100uF的电容和0的抗性下用2ug Il2rg全长人源化载体电穿孔。使用75ug/mL的G418进行选择。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在表44中所示，筛选168个集落，并获得6个靶向克隆。靶向效率为3.57％。如在实施例1中所述将一个克隆注射到胚泡中，并且获得一个产生嵌合体的克隆。

如本文在实施例1中所述将克隆注射到胚泡中。获得产生F0嵌合大鼠的克隆。胚泡使用标准技术转移到假妊娠受体雌性，且获得嵌合F0大鼠。获得经由种系传递靶向修饰的F0大鼠。

4.3(b)(i).用人类IL2rg胞外结构域替换大鼠IL2rg胞外结构域

IL 2受体γ的全长人源化是有用的，因为具有该修饰的基因座的大鼠将产生人类Il2rg；并且这将允许用对人类Il2rg具有特异性的抗体检测在大鼠中的人类Il2rg。

外人源化(即，用Il2rg的人类胞外结构域替换Il2rg的大鼠胞外结构域)将产生将结合Il2rg的人类配体的Il2rg多肽，但因为细胞质结构域仍然是大鼠的，所以Il2rg的外人源化形式也将与大鼠信号传导机构相互作用。图33提供人类IL-2rg蛋白(SEQ ID NO:20；NP_000197.1)；大鼠IL-2rg蛋白(SEQ ID NO:21；NP_543165.1)；以及包含融合于大鼠IL-2rg蛋白的其余部分的IL-2rg的人类胞胞外结构域的嵌合IL-2rg蛋白(SEQ ID NO:22)的序列比对。在人类IL-2rg和大鼠IL-2rg之间的接合点通过垂直线标注。

表30提供大鼠白细胞介素2受体γ基因座的基因组组构的概述，并且所示位置取自大鼠基因组参照序列(ENSMBL)的5.0构建版。Il2rg在(-)链上的染色体X上。进一步标注的是Il2rg的胞外结构域的位置。

表30.大鼠Il2rg基因座的基因组组构的概述

构建质粒靶向载体以如图32中所示用人类胞外结构域替换白细胞介素2受体γ编码区的大鼠胞外结构域。将靶向载体电穿孔到在实施例1中获得的大鼠ES细胞中，并将细胞在2i+10uM ROCKi中涂铺在15cm 2x密集新霉素抗性MEF上。如在实施例1中所述来培养、选择并维持转化的大鼠ES细胞。

如在表44中所示，筛选192个集落，并获得13个靶向克隆。靶向效率为6.77％。

如本文所述在实施例1中所述将两个克隆注射到胚泡中，且获得两个产生F0大鼠的克隆。获得产生F0嵌合大鼠的克隆。获得经由种系传递靶向修饰的F0大鼠。

4.3(b)(ii).与CRISPR/Cas9组合使用质粒用人类IL2rg胞外结构域替换大鼠IL2rg胞外结构域

表31示出其中仅使用在图32中示出的Il2rg胞外结构域人源化载体的变型以靶向大鼠Il2rg基因座或与CRISPR/Cas9核酸酶组合使用以靶向大鼠Il2rg基因座的实验的结果的比较。在各实验中，电穿孔的细胞以高密度涂铺且进行药物选择以发现抗药性的集落。挑选抗药性集落且使用如本文所述的等位基因修饰(MOA)测定针对靶向修饰加以筛选。具体地讲，4x 10⁶个细胞在400V的电压、100uF的电容和0的抗性下用2ug Il2rg胞外结构域人源化载体电穿孔。在后一实验中，还将6ug Cas9表达质粒和3ug Il2rg gRNA2或3ug Il2rggRNA4电穿孔。使用75ug/mL的G418进行选择。Il2rg gRNA2具有GAAGCTCTTTCTATACAATCTGG的序列(SEQ ID NO:91)且靶向大鼠Il2rg外显子1的区190bp 3'。Il2rg gRNA4具有CCCCCGAAAGGAGGAGCCCTAGG的序列(SEQ ID NO:92)且靶向大鼠Il2rg终止密码子的区80bp5'(TGA)(参见图49)。

表31.在有和没有CRISPR/Cas9的情况下Il2rg胞外结构域人源化载体靶向的比较

4.4(a).具有同时人类基因替换的大非人类动物基因缺失的通过CRISPR/Cas9核酸内切酶实现的增强靶向

例如全人抗体的用于人类疾病病状的新近研发的药物对于在人类细胞和组织中的靶常具有高度特异性且并不识别在啮齿动物中的同源靶。该高水平的选择性使得药物在人类中首次使用之前不可能试验其在啮齿动物中的功效和作用机制。

该问题的一种非常有效的解决方案是产生基因修饰的小鼠或大鼠，其中编码药物靶的人类基因替换啮齿动物同源物。在啮齿动物中产生这一人源化等位基因的一种方法是首先在胚胎干(ES)细胞中缺失啮齿动物基因，且随后在第二基因修饰事件中在缺失的基因座处精确地插入人类基因。随后将ES细胞注射到啮齿动物胚胎中，并且植入代孕母体啮齿动物的子宫中，其接着生出携带人源化等位基因的基因修饰的幼仔。

产生人源化基因修饰的一种更有效的方法是使用同时定向啮齿动物基因的缺失和用其人类对应物替换的大靶向载体(LTVEC)。通过采用基因工程方法，当啮齿动物基因缺失和人类基因插入小于约20千碱基对(kb)时，这一单步骤人源化可在相对较高的效率下实现。要求大于100kb的缺失和替换的较大单步人源化可用LTVEC和例如基因工程方法的基因工程方法实现，但是由于有时与非常大的修饰冲突的较低靶向效率，成功常需要筛选或成百上千个ES细胞克隆来寻找携带所要基因修饰的克隆。

为了改进大人源化的效率，我们已经研发了组合LTVEC基因靶向与成簇规律间隔短回文重复序列RNA-向导Cas9核酸内切酶(CRISPR/Cas9)的方法。CRISPR/Cas9核酸酶为由结合CRISPR RNA的细菌Cas9 DNA核酸内切酶构成的核糖核蛋白酶，所述细菌Cas9 DNA核酸内切酶向导Cas9以通过在向导RNA和靶向DNA的一个链之间的沃森-克里克(Watson-Crick)碱基配对在特异性DNA序列处裂解。由于所述靶向机制的简单性，设计定向在几乎任何基因组基因座处的双链断裂的CRISPR/Cas9核酸内切酶是容易的。双链断裂通过非同源端接合(NHEJ)途径诱导细胞基因组修复，其易于出错且常在双链断裂的位点处产生缺失或插入。修复双链断裂的替代机制为同源性定向修复(HDR)，其中与断裂位点共有序列同一性或相似性的内源或外源段的DNA在细胞同源重组机构的作用下准确无误地修复断裂端。HDR可产生修复在断裂位点处的原始序列的完全修复，或者其可用以定向设计的修饰，例如在双链断裂的位点处序列的缺失、插入或替换。CRISPR/Cas9核酸酶可通过定向在预定基因修饰的位点处的精确双链裂解大大增强工程化HDR事件的速率。

为了实现啮齿动物基因的全部或部分的精确、单步缺失和用其人类同源物的全部或部分同时替换，我们通过电穿孔向啮齿动物ES细胞中引入三种核酸分子：(1)LTVEC；(2)编码Cas9核酸内切酶的质粒或mRNA；和(3)编码CRISPR单向导RNA(sgRNA)或sgRNA本身的质粒。LTVEC包含编码由设计成定向缺失啮齿动物基因并插入人类基因的HR事件的啮齿动物DNA的同源臂侧接的基因产物(蛋白或RNA)的人类基因的全部或部分。人源化LTVEC还携带定向赋予抗生素药物(例如，G418)抗性的酶(例如，新霉素磷酸转移酶)的表达的药物选择盒。吸收LTVEC并将其并入其基因组中的ES细胞能够在皮氏培养皿上在含有抗生素药物的生长培养基中生长并形成集落。因为我们引入与LTVEC分子相比多500-1,000倍的编码CRISPR/Cas9的核酸分子，但是大部分的含LTVEC的抗药性集落也至少短暂地含有CRISPR/Cas9组分。我们挑选抗药性集落并通过等位基因丢失方法对其加以筛选(Valenzuela,D.等人，(2003)High-throughput engineering of the mouse genome coupled with high-resolution expression analysis,Nature Biotech.21:652-660；Frendewey,D.等人，(2010)The loss-of-allele assay for ES cell screening and mouse genotyping,Methods Enzymol.476:295-307；其整体以引用的方式并入本文中)以鉴定具有正确靶向的人源化等位基因的克隆。

在一种特定的实验中，LTVEC设计用来产生小鼠Lrp5(低密度脂蛋白受体-相关蛋白5)基因的68kb缺失和用同源人类LRP5基因的91kb片段的同时替换(图34)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Lrp5基因的68kb序列的小鼠Lrp5基因座的部分的7kb和33kb基因组DNA的同源臂侧接的人类LRP5基因的91-kb片段。在单独的实验中，我们组合Lrp5人源化LTVEC与编码Cas9的质粒和编码8种sgRNA(gA、gB、gB2、gC、gD、gE2、gE、gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Lrp5基因的区内产生双链断裂。sgRNA设计用来避免在人类LRP5基因的插入部分中的任何序列的识别。

Lrp5基因的CRISPR/Cas9辅助的人源化的结果示于表32中。当仅将LTVEC引入ES细胞中时，我们发现1.0％的筛选出的抗药性克隆携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由8种试验的sgRNA中的7种(sgRNA-5'A、sgRNA-5'B、sgRNA-5'B2、sgRNA-C、sgRNA-D、sgRNA-3'E2和sgRNA-3'F；序列提供于表33中)向导的Cas9核酸内切酶以2.1-7.3％的效率产生正确靶向的单等位基因杂合突变，这代表着与未受帮助的LTVEC相比较单步人源化基因靶向增强2-9倍。除了单等位基因靶向之外，对于由sgRNA-5'B2引起的Cas9-向导裂解，我们检测到以1％的频率的双等位基因纯合人源化。纯合Lrp5人源化ES细胞可通过基因工程方法(Poueymirou,W.T.等人，(2007)F0generation mice fully derived from gene-targeted embryonic stem cellsallowing immediate phenotypic analyses,Nature Biotech.25:91-99，其整体以引用的方式并入本文中)直接转变成准备用于表型和药物功效研究的完全源自ES细胞的小鼠。

表32.Lrp5基因的CRISPR/Cas9辅助人源化的筛选结果。

表33.靶向小鼠Lrp5基因的六种sgRNA的向导部分的序列。

当与用锌指核酸酶(ZFN)执行的等价实验相比较时，通过CRISPR/Cas9核酸内切酶实现的大Lrp5人源化的增强靶向是显著的。我们获得设计用以在针对缺失靶向的小鼠Lrp5基因的区内的位点处生成双链断裂的四种ZFN(图34)。一种ZFN靶向在缺失的5'端附近的序列(a)，一种ZFN靶向在缺失中间的序列(b)且两种ZFN靶向在缺失的3'端附近的序列(c,d)。在单独的实验中，我们组合Lrp5人源化LTVEC与编码设计用来在针对缺失靶向的小鼠Lrp5基因的区内产生双链断裂的四种ZFN(a-d)中的一种的质粒。我们确定所有ZFN都具有活性且能够诱导在Lrp5基因中的NHEJ突变(数据没有示出)，但当与LTVEC组合时，HDR介导的基因靶向与仅LTVEC相比较没有增强。

当与一系列ZFN辅助的人源化实验相比较时，由CRISPR/Cas9核酸内切酶实现的大Lrp5人源化的增强的靶向效率也是显著的。在这些实验中，执行一系列ZFN辅助的人源化，其中小鼠靶基因缺失和人类基因插入通常具有增加的尺寸(表34；图35)。图35A描绘在增加的缺失尺寸下LTVEC靶向基因的％靶向效率。LTVEC单独使用(灰色方块)或与ZFN组合使用(黑色方块)。图35B描绘在增加尺寸的人类基因插入下LTVEC的％靶向效率。再次，LTVEC单独使用(灰色三角形)或与ZFN组合使用(黑色三角形)。如在表34和图35中所示，当小鼠靶基因缺失的尺寸大于24.7kb时和当人类基因插入的尺寸大于22.2kb时，ZFN介导DNA裂解以增强LTVEC靶向效率的能力消失(表34；图35A)。相比之下，CRISPR/Cas9能够增强Lrp5基因的LTVEC靶向效率，其涉及68.3kb的小鼠基因缺失和91.0kb的人类基因插入(表32；图34)。这指示，在其它核酸酶(例如，锌指核酸酶)不能增强LTVEC靶向效率的情形下，CRISPR/Cas9核酸内切酶能够增强LTVEC靶向效率。

表34.ZFN辅助人源化的概述

n.d.＝未测

n.a.＝不适用

()＝与没有ZFN的情况相比，在用ZFN的情况下靶向效率较低

对于其它小鼠基因的人源化，执行可比较的实验。在一个实验中，LTVEC设计用来产生小鼠Trpa1(瞬时受体电位阳离子通道亚族A成员1)基因的45kb缺失和用同源人类TRPA1基因的55kb片段的同时替换(图36)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Trpa1基因的45kb序列的小鼠Trpa1基因座的部分的41kb和58kb的基因组DNA的同源臂侧接的人类TRPA1基因的55kb片段。在单独的实验中，我们组合Trpa1人源化LTVEC与编码Cas9的质粒和编码8种sgRNA(gA、gA2、gB、gC、gD、gE、gE2和gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Trpa1基因的区内产生双链断裂。sgRNA设计用来避免在人类TRPA1基因的插入部分中的任何序列的识别。

Trpa1基因的CRISPR/Cas9辅助的人源化的结果示于表35中。当仅将LTVEC引入ES细胞中时，我们发现1.0％的筛选出的抗药性克隆携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由8种试验的sgRNA中的6种(A、A2、B、C、D和F；序列提供于表43中)向导的Cas9核酸内切酶以1.0-3.1％的效率产生正确靶向的单等位基因杂合突变或双等位基因复合杂合或纯合突变。对于由gRNA A和gRNA F实现的Cas9向导裂解，我们检测到以1.0％的频率的复合杂合突变。

表35.Trpa1基因的CRISPR/Cas9辅助人源化的筛选结果。

在另一实验中，LTVEC设计用来产生小鼠Folh1(谷氨酸羧肽酶2)基因的55kb缺失和用同源人类FOLH1基因的61kb片段的同时替换(图37)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Folh1基因的55kb序列的小鼠Folh1基因座的部分的22kb和46kb的基因组DNA的同源臂侧接的人类FOLH1基因的61kb片段。在单独的实验中，我们组合Folh1人源化LTVEC与编码Cas9的质粒和编码6种sgRNA(gA、gA2、gC、gD、gE和gE2)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Folh1基因的区内产生双链断裂。sgRNA设计用来避免在人类FOLH1基因的插入部分中的任何序列的识别。

Folh1基因的CRISPR/Cas9辅助的人源化的结果示于表36中。当仅将LTVEC引入ES细胞中时，我们发现96个筛选的抗药性克隆中一个也没有携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由6种试验的sgRNA中的3种(A、D和E2；序列提供于表43中)向导的Cas9核酸内切酶以1.0-3.1％的效率产生正确靶向的单等位基因杂合突变。

表36.Folh1基因的CRISPR/Cas9辅助人源化的筛选结果。

在另一实验中，LTVEC设计用来产生对于互补组分5(C5或Hc)的小鼠基因的76kb缺失和用同源人类C5基因的97kb片段的同时替换(图38)。LTVEC包含由含有来源于侧接意欲缺失的小鼠C5(Hc)基因的76kb序列的小鼠C5(Hc)基因座的部分的34.1kb和31.2kb的基因组DNA的同源臂侧接的人类C5基因的97kb片段。在单独的实验中，我们组合C5(Hc)人源化LTVEC与编码Cas9的质粒和编码6种sgRNA(gA、gB、gC、gD、gE和gE2)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠C5(Hc)基因的区内产生双链断裂。sgRNA设计用来避免在人类C5基因的插入部分中的任何序列的识别。

C5(Hc)基因的CRISPR/Cas9辅助的人源化的结果示于表37中。当仅将LTVEC引入ES细胞中时，我们发现1.0％的筛选出的抗药性克隆携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由所有6种试验的sgRNA(A、B、C、D、E和E2；序列提供于表43中)向导的Cas9核酸内切酶以4.2-16.7％的效率产生正确靶向的单等位基因杂合突变或双等位基因复合杂合或纯合突变。对于gRNA A和gRNA E实现的Cas9-向导的裂解，我们检测到分别以5.2％和4.2％的频率的复合杂合突变。

表37.C5(Hc)基因的CRISPR/Cas9辅助的人源化的筛选结果。

在另一实验中，LTVEC设计用来产生小鼠Adamts5(具有凝血栓蛋白基序5的去整合素和金属蛋白酶)基因的38kb缺失和用同源人类ADAMTS5基因的43kb片段的同时替换(图39)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Adamts5基因的38kb序列的小鼠Adamts5基因座的部分的22kb和46kb的基因组DNA的同源臂侧接的人类ADAMTS5基因的43kb片段。在单独的实验中，我们组合Adamts5人源化LTVEC与编码Cas9的质粒和编码8种sgRNA(gA、gA2、gB、gC、gD、gE、gE2和gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Adamts5基因的区内产生双链断裂。sgRNA设计用来避免在人类ADAMTS5基因的插入部分中的任何序列的识别。

Adamts5基因的CRISPR/Cas9辅助的人源化的结果示于表38中。当仅将LTVEC引入ES细胞中时，我们发现96个筛选的抗药性克隆中一个也没有携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由8种试验的sgRNA中的2种(B和F；序列提供于表43中)向导的Cas9核酸内切酶以1.0％的效率产生正确靶向的单等位基因杂合突变或双等位基因复合杂合突变。对于由gRNA E2实现的Cas9向导裂解，我们检测到以1.0％的频率的复合杂合突变。

表38.Adamts5基因的CRISPR/Cas9辅助人源化的筛选结果。

在另一实验中，LTVEC设计用来产生小鼠Erbb4(受体酪氨酸-蛋白激酶erbB-4)基因的102kb缺失和用同源人类ERBB4基因的127kb片段的同时替换(图40)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Erbb4基因的102kb序列的小鼠Erbb4基因座的部分的48kb和26kb的基因组DNA的同源臂侧接的人类ERBB4基因的127kb片段。在单独的实验中，我们组合Erbb4人源化LTVEC与编码Cas9的质粒和编码8种sgRNA(gA、gB、gB2、gC、gD、gE、gE2和gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Erbb4基因的区内产生双链断裂。sgRNA设计用来避免在人类ERBB4基因的插入部分中的任何序列的识别。

Erbb4基因的CRISPR/Cas9辅助的人源化的结果示于表39中。当仅将LTVEC引入ES细胞中时，我们发现96个筛选的抗药性克隆中一个也没有携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由8种试验的sgRNA中的一种(D；序列提供于表43中)向导的Cas9核酸内切酶以1.0％的效率产生正确靶向的单等位基因杂合突变或双等位基因复合杂合突变。对于由gRNA D实现的Cas9向导裂解，我们检测到以1％的频率的复合杂合突变。

表39.Erbb4基因的CRISPR/Cas9辅助人源化的筛选结果。

在另一实验中，LTVEC设计用来产生小鼠Ror1(酪氨酸-蛋白激酶跨膜受体ROR1)基因的110kb缺失和用同源人类ROR1基因的134kb片段的同时替换(图41)。LTVEC包含由含有来源于侧接意欲缺失的小鼠Ror1基因的110kb序列的小鼠Ror1基因座的部分的41.8kb和96.4kb的基因组DNA的同源臂侧接的人类ROR1基因的134kb片段。在单独的实验中，我们组合Ror1人源化LTVEC与编码Cas9的质粒和编码6种sgRNA(gA、gB、gC、gD、gE和gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Ror1基因的区内产生双链断裂。sgRNA设计用来避免在人类ROR1基因的插入部分中的任何序列的识别。

Ror1基因的CRISPR/Cas9辅助的人源化的结果示于表40中。当仅将LTVEC引入ES细胞中时，我们发现96个筛选的抗药性克隆中一个也没有携带正确靶向的单等位基因杂合人源化等位基因。I相比之下，组合LTVEC与由6种试验的sgRNA中的2种(D和F；序列提供于表43中)向导的Cas9核酸内切酶以1.0％的效率产生正确靶向的单等位基因杂合突变或双等位基因突变。对于由gRNA F实现的Cas9向导裂解，我们也检测到以1％的频率的复合杂合突变。

表40.Ror1基因的CRISPR/Cas9辅助人源化的筛选结果。

在另一实验中，LTVEC设计用来产生小鼠Dpp4(二肽基肽酶4)基因的79kb缺失和用同源人类DPP4基因的82kb片段的同时替换(图42)。LTVEC包含由各自含有来源于侧接意欲缺失的小鼠Dpp4基因的79kb序列的小鼠Dpp4基因座的部分的46kb的基因组DNA的5'同源臂和3'同源臂侧接的人类DPP4基因的82kb片段。在单独的实验中，我们组合Dpp4人源化LTVEC与编码Cas9的质粒和编码8种sgRNA(gA、gB、gB2、gC、gD、gE、gE2和gF)中的一种的第二质粒，设计用来在针对缺失靶向的小鼠Dpp4基因的区内产生双链断裂。sgRNA设计用来避免在人类DPP4基因的插入部分中的任何序列的识别。

Dpp4基因的CRISPR/Cas9辅助的人源化的结果示于表41中。当仅将LTVEC引入ES细胞中时，我们发现2.1％的筛选的抗药性克隆携带正确靶向的单等位基因杂合人源化等位基因。相比之下，组合LTVEC与由8种试验的sgRNA(A、B、B2、C、D、E、E2和F；序列提供于表43中)中的任一种向导的Cas9核酸内切酶以2.1-7.3％的效率产生正确靶向的单等位基因杂合突变。

表41.Dpp4基因的CRISPR/Cas9辅助人源化的筛选结果。

概述各种小鼠基因的CRISPR/Cas9辅助的人源化的结果的表提供于表42中。第一行指示靶向的基因基因座。第二行指示内源小鼠基因座的缺失尺寸(Del)和相应人类基因座的插入尺寸(Ins)。剩余行示出对于具有正确靶向的单等位基因杂合突变、双等位基因复合杂合突变或双等位基因纯合突变的各情况的集落数目(在96个集落之中)。“无gRNA”代表仅LTVEC，而其它行代表LTVEC加相应gRNA(由在缺失基因座内的相对位置指示)。

表42.小鼠基因的CRISPR/Cas9辅助人源化的概述。

表43.用于小鼠基因的CRISPR/Cas9辅助人源化的向导RNA序列

实施例5.大鼠基因组基因座的靶向修饰的概述

表44.用在实施例3和4中论述的各种载体类型和核酸酶试剂进行的大鼠靶向的概述

实施例6.产生、维持并靶向人类诱导的多潜能干细胞

6.1.人类iPS细胞的产生

该实施例描述由非多潜能人类细胞产生人类iPS细胞。使用RED和BLUE GeneIn^TM转染试剂(GlobalStem)将PiggyBac(System Biosciences)载体(PB-600A_CAGGS Bst XI(0.64μg/μL)和包含编码操作性连接CM7启动子的四种重新编程因子(hOct4、hSox2、hKLF-4、hMYC)的基因的PB-200(0.99μg/μL)引入初生儿人类包皮成纤维细胞中。转染的细胞在E7培养基中在NuFF1饲养细胞上孵育以允许载体并入和重新编程因子表达。E7培养基包含DMEM/F-12、NaHCO₃、L-抗坏血酸、胰岛素、转铁蛋白、硒和FGF-2。

嘌呤霉素选择在使用2μg/mL嘌呤霉素在E7培养基中转染之后10天开始。在第21天，选择集落并在mTeSR^TM培养基中培养，其包含DMEM/F-12、NaHCO₃、L-抗坏血酸、胰岛素、转铁蛋白、硒、FGF-2、TGF-β1、谷胱甘肽、L-谷氨酰胺、限定的脂质、硫胺素、痕量元素B和C、β-巯基乙醇、牛血清蛋白、六氢吡啶羧酸、氯化锂和GABA。在第29-57天，细胞在mTeSR^TM培养基中繁殖并传代直至在6孔板中达到约50％的汇合度。在第65-73天，使用mTeSR^TM培养基和Gentle Cell Dissociation Reagent(Stem Cell Technologies)继续繁殖并传代。在第76天，培养基变为低渗透压度VG2i培养基以便进一步繁殖、传代并维持包含天然或天然外观的hiPSC的细胞。

6.2.在人类iPS细胞中LTVEC靶向

该实施例描述在人类iPS细胞中使用LTVEC靶向。如在图51中所示，我们通过电穿孔到在VG2i培养基中繁殖的人类iPS细胞引入以下核酸分子：(1)LTVEC(0.67μg)；(2)编码Cas9核酸内切酶的质粒(5μg)；和(3)编码CRISPR单向导RNA(gRNA)的质粒(10μg)。在一组样品中，Cas9和gRNA排除在外。具体地讲，3x 10⁶个细胞在700V的电压、25uF的电容和400Ω的电阻下电穿孔。LTVEC包含包含由含有来源于侧接意欲缺失的人类ADAM6基因座的4.1kb序列的基因组区的34kb和105kb的基因组DNA的同源臂侧接的小鼠Adam6a和Adam6b基因的16.7kb核酸。LTVEC也携带定向赋予抗生素药物(潮霉素)抗性的酶的表达的药物选择盒。所使用的人类ADAM6 gRNA具有以下序列：GTATAGCCCTGTTACACATT(SEQ ID NO:94)。

吸收LTVEC并将其并入其基因组中的细胞能够在GELTREX^TM涂布的组织培养皿上在含有抗生素药物的生长培养基中生长并形成集落。因为我们引入与LTVEC分子相比多500-1,000倍的编码CRISPR/Cas9的核酸分子，但是大部分的含LTVEC的抗药性集落也至少短暂地含有CRISPR/Cas9组分。我们挑选抗药性集落并通过等位基因丢失方法加以筛选(Valenzuela等人，(2003)Nat.Biotech.21:652-660；Frendewey等人，(2010)MethodsEnzymol.476:295-307；其整体以引用的方式并入本文中)以鉴定具有正确靶向的等位基因的克隆。

ADAM6基因座的CRISPR/Cas9辅助的LTVEC靶向的结果示于表47中。

表47.CRISPR/Cas9辅助的LTVEC靶向

	靶向效率
		仅LTVEC	3.1％
LTVEC+CRISPR	7.3％

当仅将LTVEC引入人类iPS细胞中时，观察到3.1％的靶向效率。相比之下，组合LTVEC与由ADAM6 gRNA向导的Cas9产生7.3％的靶向效率。

6.3.低渗透压度培养基对人类iPS细胞形态的影响

该实施例描述盐浓度、离子强度和/或渗透压度对在培养中的人类iPS细胞的多潜能状态的影响。人类iPS细胞在表48中描述的培养基中或在mTeSR^TM-hLIF培养基中在MATRIGEL^TM或GELTREX^TM底物上培养。

表48.用于iPS细胞培养的培养基。

当所使用的基础培养基为DMEM时，该培养基被称为2i培养基。当所使用的基础培养基为VG-DMEM时，该低渗透压度培养基被称为VG2i培养基。VG2i培养基的渗透压度(233mOsm/kg)低于传统2i培养基的渗透压度(261mOsm/kg)。

如在图52中所示，在2i培养基中在MATRIGEL^TM上培养8天的时间(图52A)或12天的时间(图52B)的人类iPS细胞显示处于始发态的iPS细胞的形态特征，特别是在上皮单层中生长和顶面-底侧极性的外观。

mTeSR-hLIF培养基和VG2i培养基对于其对人类iPS细胞的形态和多潜能状态的影响进一步评价。在该研究中，人类iPS细胞在mTeSR^TM-hLIF培养基(图53A和53C)中或在VG2i培养基(图53B和53D)中在MATRIGEL^TM或NuFF饲养细胞上培养6天的时间。当在mTeSR^TM-hLIF培养基中在MATRIGEL^TM或NuFF饲养细胞上培养时，人类iPS细胞显示始发多潜能状态的形态特征，特别是在上皮单层中生长和顶面-底侧极性的外观。在mTeSR^TM-hLIF培养基中培养的一些细胞开始显示以三维结块为特征的形态。相反，当在VG2i培养基中在MATRIGEL^TM或NuFF饲养细胞上培养时，人类iPS细胞显示天然多潜能状态的形态特征，特别是在圆形圆顶形集落中生长且缺乏顶面-底侧极性。

6.4.低渗透压度培养基对多潜能标记在人类iPS细胞中的表达的影响

该实施例描述盐浓度、离子强度和/或渗透压度对多潜能标记在已经自始发状态重编程到天然状态的人类iPS细胞中的表达的影响。在MATRIGEL^TM底物上在VG2i培养基中培养24天之后，对于碱性磷酸酶或NANOG的表达，将重编程的天然人类iPS细胞染色。观察到重编程的细胞强烈地表达碱性磷酸酶(图54A)和NANOG(图54B和54C)两者，这指示天然多潜能状态。

6.5.低渗透压度培养基对人类iPS细胞的酶分解和传代培养的影响

在该实施例中，使用低渗透压度VG2i培养基重编程到天然状态的人类iPS细胞使用胰蛋白酶来酶分解以产生单一细胞悬浮液(图55A)。使细胞悬浮液传代到新的GELTREX^TM-涂覆板上以便在VG2i培养基中传代培养。在1天(图55B)和4天(图55C)之后观察到传代培养的细胞持续显示细胞处于天然多潜能状态的形态特征。特定地讲，细胞作为圆形顶形集落生长且并未表现出顶面-底侧极性。值得注意的是酶分解可在缺乏ROCK抑制剂的情况下执行，而ROCK抑制剂通常是防止前细胞凋亡途径激活所必需的。这提出前细胞凋亡途径在本文鉴定的条件下培养的天然人类iPS细胞中在酶分解和传代培养期间并未那样强烈地激活。

在说明书中提及的所有出版物和专利申请都指示本发明所属领域的技术人员的水平。所有出版物和专利申请都以引用的方式并入本文中，就如同特别地且单独地指示将各个别出版物或专利申请以引用的方式并入一般。除非另外自任何实施方案的上下文显而易见，否则本发明的方面、步骤或特征可与任何其它方面、步骤或特征组合使用。提及某一范围包括在所述范围内的任何整数、在所述范围内的任何子范围。提及多个范围包括所述范围的复合。

序列表

<110> D·弗伦德维

W·奥尔巴克

K·V·莱

久野淳子

D·M·瓦伦泽拉

G·D·扬科普洛斯

<120> 用于靶向修饰基因组的方法和组合物

<130> 057766/453460

<150> US 61/914,768

<151> 2013-12-11

<150> US 62/017,416

<151> 2014-06-26

<150> US 62/029,261

<151> 2014-07-25

<150> US 62/052,906

<151> 2014-09-19

<150> US 62/059,527

<151> 2014-10-03

<150> US 62/064,384

<151> 2014-10-15

<160> 94

<170> FastSEQ for Windows 4.0版

<210> 1

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 连接向导RNA(gRNA)的基因组靶序列

<220>

<221> misc_feature

<222> 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,

19, 20, 21

<223> n = A,T,C 或 G

<400> 1

gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 2

<211> 80

<212> RNA

<213> 人工序列

<220>

<223> 向导RNA (gRNA)

<400> 2

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 3

<211> 42

<212> RNA

<213> 人工序列

<220>

<223> 向导RNA (gRNA)

<400> 3

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cg 42

<210> 4

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> crRNA

<400> 4

guuuuagagc uagaaauagc aaguuaaaau 30

<210> 5

<211> 33

<212> RNA

<213> 人工序列

<220>

<223> crRNA

<400> 5

guuuuagagc uagaaauagc aaguuaaaau aag 33

<210> 6

<211> 26

<212> RNA

<213> 人工序列

<220>

<223> crRNA

<400> 6

gaguccgagc agaagaagaa guuuua 26

<210> 7

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> tracrRNA

<400> 7

aaggcuaguc cg 12

<210> 8

<211> 50

<212> RNA

<213> 人工序列

<220>

<223> tracrRNA

<400> 8

aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 50

<210> 9

<211> 203

<212> PRT

<213> 小家鼠

<400> 9

Met Lys Val Leu Ala Ala Gly Ile Val Pro Leu Leu Leu Leu Val Leu

1 5 10 15

His Trp Lys His Gly Ala Gly Ser Pro Leu Pro Ile Thr Pro Val Asn

20 25 30

Ala Thr Cys Ala Ile Arg His Pro Cys His Gly Asn Leu Met Asn Gln

35 40 45

Ile Lys Asn Gln Leu Ala Gln Leu Asn Gly Ser Ala Asn Ala Leu Phe

50 55 60

Ile Ser Tyr Tyr Thr Ala Gln Gly Glu Pro Phe Pro Asn Asn Val Glu

65 70 75 80

Lys Leu Cys Ala Pro Asn Met Thr Asp Phe Pro Ser Phe His Gly Asn

85 90 95

Gly Thr Glu Lys Thr Lys Leu Val Glu Leu Tyr Arg Met Val Ala Tyr

100 105 110

Leu Ser Ala Ser Leu Thr Asn Ile Thr Arg Asp Gln Lys Val Leu Asn

115 120 125

Pro Thr Ala Val Ser Leu Gln Val Lys Leu Asn Ala Thr Ile Asp Val

130 135 140

Met Arg Gly Leu Leu Ser Asn Val Leu Cys Arg Leu Cys Asn Lys Tyr

145 150 155 160

Arg Val Gly His Val Asp Val Pro Pro Val Pro Asp His Ser Asp Lys

165 170 175

Glu Ala Phe Gln Arg Lys Lys Leu Gly Cys Gln Leu Leu Gly Thr Tyr

180 185 190

Lys Gln Val Ile Ser Val Val Val Gln Ala Phe

195 200

<210> 10

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> ZFN1a结合位点

<400> 10

caggccctga accgc 15

<210> 11

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> ZFN1切割位点

<400> 11

ttctgg 6

<210> 12

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> ZFN1b结合位点

<400> 12

gattacctgc gctggg 16

<210> 13

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> ZF21a结合位点

<400> 13

ttcaccctcc gcacc 15

<210> 14

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> ZFN2切割位点

<400> 14

tgctgag 7

<210> 15

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> ZF21b结合位点

<400> 15

tatccagatc caggggtt 18

<210> 16

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 归巢核酸酶家族的保守结构域

<400> 16

Leu Ala Gly Leu Ile Asp Ala Asp Gly

1 5

<210> 17

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> ZFN1a结合位点

<400> 17

caggccctga accgc 15

<210> 18

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> ZFN1切割位点

<400> 18

ttctgg 6

<210> 19

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> ZFN1b结合位点

<400> 19

gattacctgc gctggg 16

<210> 20

<211> 369

<212> PRT

<213> 智人

<400> 20

Met Leu Lys Pro Ser Leu Pro Phe Thr Ser Leu Leu Phe Leu Gln Leu

1 5 10 15

Pro Leu Leu Gly Val Gly Leu Asn Thr Thr Ile Leu Thr Pro Asn Gly

20 25 30

Asn Glu Asp Thr Thr Ala Asp Phe Phe Leu Thr Thr Met Pro Thr Asp

35 40 45

Ser Leu Ser Val Ser Thr Leu Pro Leu Pro Glu Val Gln Cys Phe Val

50 55 60

Phe Asn Val Glu Tyr Met Asn Cys Thr Trp Asn Ser Ser Ser Glu Pro

65 70 75 80

Gln Pro Thr Asn Leu Thr Leu His Tyr Trp Tyr Lys Asn Ser Asp Asn

85 90 95

Asp Lys Val Gln Lys Cys Ser His Tyr Leu Phe Ser Glu Glu Ile Thr

100 105 110

Ser Gly Cys Gln Leu Gln Lys Lys Glu Ile His Leu Tyr Gln Thr Phe

115 120 125

Val Val Gln Leu Gln Asp Pro Arg Glu Pro Arg Arg Gln Ala Thr Gln

130 135 140

Met Leu Lys Leu Gln Asn Leu Val Ile Pro Trp Ala Pro Glu Asn Leu

145 150 155 160

Thr Leu His Lys Leu Ser Glu Ser Gln Leu Glu Leu Asn Trp Asn Asn

165 170 175

Arg Phe Leu Asn His Cys Leu Glu His Leu Val Gln Tyr Arg Thr Asp

180 185 190

Trp Asp His Ser Trp Thr Glu Gln Ser Val Asp Tyr Arg His Lys Phe

195 200 205

Ser Leu Pro Ser Val Asp Gly Gln Lys Arg Tyr Thr Phe Arg Val Arg

210 215 220

Ser Arg Phe Asn Pro Leu Cys Gly Ser Ala Gln His Trp Ser Glu Trp

225 230 235 240

Ser His Pro Ile His Trp Gly Ser Asn Thr Ser Lys Glu Asn Pro Phe

245 250 255

Leu Phe Ala Leu Glu Ala Val Val Ile Ser Val Gly Ser Met Gly Leu

260 265 270

Ile Ile Ser Leu Leu Cys Val Tyr Phe Trp Leu Glu Arg Thr Met Pro

275 280 285

Arg Ile Pro Thr Leu Lys Asn Leu Glu Asp Leu Val Thr Glu Tyr His

290 295 300

Gly Asn Phe Ser Ala Trp Ser Gly Val Ser Lys Gly Leu Ala Glu Ser

305 310 315 320

Leu Gln Pro Asp Tyr Ser Glu Arg Leu Cys Leu Val Ser Glu Ile Pro

325 330 335

Pro Lys Gly Gly Ala Leu Gly Glu Gly Pro Gly Ala Ser Pro Cys Asn

340 345 350

Gln His Ser Pro Tyr Trp Ala Pro Pro Cys Tyr Thr Leu Lys Pro Glu

355 360 365

Thr

<210> 21

<211> 368

<212> PRT

<213> 褐家鼠

<400> 21

Met Leu Lys Pro Leu Leu Pro Ser Arg Ser Phe Leu Leu Leu Gln Leu

1 5 10 15

Leu Leu Leu Arg Val Gly Trp Ser Ser Lys Val Leu Met Ser Ser Gly

20 25 30

Asn Glu Asp Thr Lys Ser Asp Leu Leu Leu Thr Ser Met Asp Leu Lys

35 40 45

His Leu Ser Val Pro Thr Leu Pro Leu Pro Glu Val Gln Cys Phe Val

50 55 60

Phe Asn Val Glu Tyr Met Asn Cys Thr Trp Asn Ser Ser Ser Glu Pro

65 70 75 80

Gln Pro Thr Asn Leu Thr Met His Tyr Arg Tyr Lys Gly Ser Asp Asn

85 90 95

Asn Thr Phe Gln Glu Cys Ser His Tyr Leu Phe Ser Lys Glu Ile Thr

100 105 110

Ser Gly Cys Gln Ile Gln Lys Glu Asp Ile Gln Leu Tyr Gln Thr Phe

115 120 125

Val Val Gln Leu Gln Asp Pro Gln Lys Pro Gln Arg Arg Ala Glu Gln

130 135 140

Lys Leu Asn Leu Gln Asn Leu Val Ile Pro Trp Ala Pro Glu Asn Leu

145 150 155 160

Thr Leu Tyr Asn Leu Ser Glu Ser Gln Val Glu Leu Arg Trp Lys Ser

165 170 175

Arg Tyr Ile Glu Arg Cys Leu Gln Tyr Leu Val Gln Tyr Arg Ser Asn

180 185 190

Arg Asp Arg Ser Trp Thr Glu Gln Ile Val Asp His Glu Pro Arg Phe

195 200 205

Ser Leu Pro Ser Val Asp Glu Gln Lys Leu Tyr Thr Phe Arg Val Arg

210 215 220

Ser Arg Phe Asn Pro Ile Cys Gly Ser Thr Gln Gln Trp Ser Lys Trp

225 230 235 240

Ser Gln Pro Ile His Trp Gly Ser His Thr Ala Glu Glu Asn Pro Ser

245 250 255

Leu Phe Ala Leu Glu Ala Val Leu Ile Pro Val Gly Thr Met Gly Leu

260 265 270

Ile Ile Thr Leu Ile Phe Val Tyr Cys Trp Leu Glu Arg Met Pro Arg

275 280 285

Ile Pro Ala Ile Lys Asn Leu Glu Asp Leu Val Thr Glu Tyr His Gly

290 295 300

Asn Phe Ser Ala Trp Ser Gly Val Ser Lys Gly Leu Thr Glu Ser Leu

305 310 315 320

Gln Pro Asp Tyr Ser Glu Arg Phe Cys His Val Ser Glu Ile Pro Pro

325 330 335

Lys Gly Gly Ala Leu Gly Glu Gly Pro Gly Gly Ser Pro Cys Ser Leu

340 345 350

His Ser Pro Tyr Trp Pro Pro Pro Cys Tyr Ser Leu Lys Pro Glu Ala

355 360 365

<210> 22

<211> 368

<212> PRT

<213> 人工序列

<220>

<223> 包含具有来自人类的IL-2γ受体的胞外结构域的大鼠IL-2受体γ蛋白的嵌合的IL-2受体γ

<400> 22

Met Leu Lys Pro Ser Leu Pro Phe Thr Ser Leu Leu Phe Leu Gln Leu

1 5 10 15

Pro Leu Leu Gly Val Gly Leu Asn Thr Thr Ile Leu Thr Pro Asn Gly

20 25 30

Asn Glu Asp Thr Thr Ala Asp Phe Phe Leu Thr Thr Met Pro Thr Asp

35 40 45

Ser Leu Ser Val Ser Thr Leu Pro Leu Pro Glu Val Gln Cys Phe Val

50 55 60

Phe Asn Val Glu Tyr Met Asn Cys Thr Trp Asn Ser Ser Ser Glu Pro

65 70 75 80

Gln Pro Thr Asn Leu Thr Leu His Tyr Trp Tyr Lys Asn Ser Asp Asn

85 90 95

Asp Lys Val Gln Lys Cys Ser His Tyr Leu Phe Ser Glu Glu Ile Thr

100 105 110

Ser Gly Cys Gln Leu Gln Lys Lys Glu Ile His Leu Tyr Gln Thr Phe

115 120 125

Val Val Gln Leu Gln Asp Pro Arg Glu Pro Arg Arg Gln Ala Thr Gln

130 135 140

Met Leu Lys Leu Gln Asn Leu Val Ile Pro Trp Ala Pro Glu Asn Leu

145 150 155 160

Thr Leu His Lys Leu Ser Glu Ser Gln Leu Glu Leu Asn Trp Asn Asn

165 170 175

Arg Phe Leu Asn His Cys Leu Glu His Leu Val Gln Tyr Arg Thr Asp

180 185 190

Trp Asp His Ser Trp Thr Glu Gln Ser Val Asp Tyr Arg His Lys Phe

195 200 205

Ser Leu Pro Ser Val Asp Gly Gln Lys Arg Tyr Thr Phe Arg Val Arg

210 215 220

Ser Arg Phe Asn Pro Leu Cys Gly Ser Ala Gln His Trp Ser Glu Trp

225 230 235 240

Ser His Pro Ile His Trp Gly Ser Asn Thr Ser Lys Glu Asn Pro Phe

245 250 255

Leu Phe Ala Leu Glu Ala Val Leu Ile Pro Val Gly Thr Met Gly Leu

260 265 270

Ile Ile Thr Leu Ile Phe Val Tyr Cys Trp Leu Glu Arg Met Pro Arg

275 280 285

Ile Pro Ala Ile Lys Asn Leu Glu Asp Leu Val Thr Glu Tyr His Gly

290 295 300

Asn Phe Ser Ala Trp Ser Gly Val Ser Lys Gly Leu Thr Glu Ser Leu

305 310 315 320

Gln Pro Asp Tyr Ser Glu Arg Phe Cys His Val Ser Glu Ile Pro Pro

325 330 335

Lys Gly Gly Ala Leu Gly Glu Gly Pro Gly Gly Ser Pro Cys Ser Leu

340 345 350

His Ser Pro Tyr Trp Pro Pro Pro Cys Tyr Ser Leu Lys Pro Glu Ala

355 360 365

<210> 23

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 连接向导RNA (gRNA)的基因组靶序列

<220>

<221> misc_feature

<222> (2)...(21)

<223> n= A, T, C 或 G

<220>

<221> misc_feature

<222> (0)...(0)

<223> n可为1-20个核苷酸

<400> 23

gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 24

gggaacccac agcatactcc 20

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 25

gaatcatgca cggctacccc 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 26

tgctcctatg gggaggcgcg 20

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 27

cttggataac attgataccc 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 28

ggggcagagc ccttatatca 20

<210> 29

<211> 20

<212> DNA

<213> 向导序列

<220>

<223> 向导序列

<400> 29

tcgctcacat taatccctag 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 30

gtactgggga atcggtggtc 20

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 31

cacgcactcc aaatttatcc 20

<210> 32

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 32

ctaagtgtgt atcagtacat 20

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 33

tgccctgcac aataagcgca 20

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 34

actcattgaa acgttatggc 20

<210> 35

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 35

agtaagggtg gattaaattc 20

<210> 36

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 36

gccatctaga ttcatgtaac 20

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 37

gactagaaat gttctgcacc 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 38

tgaaccaatt gtgtagcctt 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 39

aatagtggta aagcaccatg 20

<210> 40

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 40

gtgtgctaag gatcgaagtc 20

<210> 41

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 41

caccgagatg cttgggtatt 20

<210> 42

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 42

tgtaaccgcc ctgaatgacc 20

<210> 43

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 43

aaaagggcat cataaatccc 20

<210> 44

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 44

tcaaaaatag tcatacacct 20

<210> 45

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 45

ggtctctagt acattgtaga 20

<210> 46

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 46

atcacaaacc agttaaccgg 20

<210> 47

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 47

tttcagacga gccgacccgg 20

<210> 48

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 48

ctgtcaacag tgccgcgttt 20

<210> 49

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 49

tgtgtgtcat agcgatgtcg 20

<210> 50

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 50

aacaggtacc ctatcctcac 20

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 51

tcgtggttgc atgcgcactg 20

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 52

ggcccggacc tagtctctct 20

<210> 53

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 53

agtctgtaaa gttagcagtc 20

<210> 54

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 54

ggtggtggtg ctgacggaca 20

<210> 55

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 55

tatgagatca acactcgcta 20

<210> 56

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 56

ccaaggactt ccccacgtta 20

<210> 57

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 57

tgcttccctt atgcaagatt 20

<210> 58

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 58

ttaggtaccc tatttgaata 20

<210> 59

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 59

tgcagtgggt gacaggtcca 20

<210> 60

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 60

agggttatac tgacgttgtg 20

<210> 61

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 61

tgtctttcaa ggagggctac 20

<210> 62

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 62

tgatgtgcag tcagacaaag 20

<210> 63

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 63

tgcactatgg ttgactatga 20

<210> 64

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 64

ggaatattct aataggaagt 20

<210> 65

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 65

aagtgctgta ccattctagc 20

<210> 66

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 66

taatcaatag acaacctcgt 20

<210> 67

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 67

tcattcctaa tggtattata 20

<210> 68

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 68

agggtacata gatggcatcg 20

<210> 69

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 69

ctctttaaca attaccactt 20

<210> 70

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 70

tgtgggcctt tgctgatcac 20

<210> 71

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 71

aatctatgat cctatggcct 20

<210> 72

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 72

tgccaatagc agtgacttga 20

<210> 73

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 73

gggaagaatg ggctattgtc 20

<210> 74

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 74

ggttgtttgt gctgatgacg 20

<210> 75

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 75

ccgtcctagg ccttctacgt 20

<210> 76

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 76

actagtagac ctgaggggtt 20

<210> 77

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 77

gctccagtgt ttaggccttg 20

<210> 78

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 78

ggcaagctga aaacgcatgc 20

<210> 79

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 79

gtagatcgct ttccactacc 20

<210> 80

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 80

gaactccact gctcgtgagc 20

<210> 81

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 81

ataggtgggc actattgaag 20

<210> 82

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 82

atgggaaggt ttataccagc 20

<210> 83

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 83

cggtgtaaaa acaacgggaa 20

<210> 84

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 向导序列

<400> 84

gacccgcagu cccagcgucg 20

<210> 85

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 85

actgagatca atgaccccga 20

<210> 86

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 86

gggtcgcccg gaacctctac 20

<210> 87

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 87

gcaggccctg aaccgcttct tgg 23

<210> 88

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 88

cctgcgctgg gtgcagacgc ttt 23

<210> 89

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 89

ccagctactt gctcgtacaa 20

<210> 90

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 90

cccctcagat tcacgtgcgt 20

<210> 91

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 91

gaagctcttt ctatacaatc tgg 23

<210> 92

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 向导序列

<400> 92

cccccgaaag gaggagccct agg 23

<210> 93

<211> 56

<212> DNA

<213> 褐家鼠

<400> 93

ttctgagcct cagccgacca acctcactat gcactatagg tatgagaagg gggagg 56

<210> 94

<211> 20

<212> DNA

<213> a人工序列

<220>

<223> 向导序列

<400> 94

gtatagccct gttacacatt 20

Claims

1.一种在人类诱导的多潜能干细胞中修饰目标基因组基因座处的基因组的体外方法，包括：

向所述人类诱导的多潜能干细胞引入Cas9蛋白或编码所述Cas9蛋白的核酸、在所述目标基因组基因座处与CRISPR靶序列杂交的CRISPR RNA或编码所述CRISPR RNA的DNA、tracrRNA或编码所述tracrRNA的DNA，以及大靶向载体，所述大靶向载体大小至少为10kb，其包括插入核酸，所述插入核酸侧接：

(i)与在所述目标基因组基因座处的5'靶序列同源的5'同源臂；和

(ii)与在所述目标基因组基因座处的3'靶序列同源的3'同源臂，以及

其中在将所述Cas9蛋白或编码所述Cas9蛋白的核酸、所述CRISPR RNA或编码所述CRISPR RNA的所述DNA、所述tracrRNA或编码所述tracrRNA的所述DNA，以及所述大靶向载体引入所述人类诱导的多潜能干细胞后，所述人类诱导的多潜能干细胞的基因组被修饰以包含靶向基因修饰，所述靶向基因修饰包括(i)所述目标基因组基因座的区的缺失，所述的缺失至少为30kb和/或(ii)在所述目标基因组基因座处插入所述插入核酸，其中所述插入至少为30kb。

2.如权利要求1所述的方法，其中将所述CRISPR RNA和所述tracrRNA作为包含所述CRISPR RNA和所述tracrRNA的单一核酸分子引入。

3.如权利要求2所述的方法，其中所述单一核酸分子包含以单向导RNA形式融合在一起的所述CRISPR RNA和所述tracrRNA。

4.如权利要求1所述的方法，其中所述CRISPR RNA和所述tracrRNA单独地引入。

5.如权利要求1-4中任一项所述的方法，其中：

(a)所述Cas9蛋白以蛋白质、编码所述Cas9蛋白的信使RNA(mRNA)或编码所述Cas9蛋白的DNA的形式引入；

(b)所述CRISPR RNA以编码所述CRISPR RNA的RNA或DNA的形式引入；且

(c)所述tracrRNA以编码所述tracrRNA的RNA或DNA的形式引入。

6.如权利要求5所述的方法，其中将所述Cas9蛋白、所述CRISPR RNA和所述tracrRNA作为蛋白质-RNA复合体引入。

7.如权利要求5所述的方法，其中：

(a)编码所述Cas9蛋白的所述DNA呈包含操作性连接编码所述Cas9蛋白的第一核酸的第一启动子的第一表达构建体的形式；

(b)编码所述CRISPR RNA的所述DNA呈包含操作性连接编码所述CRISPR RNA的第二核酸的第二启动子的第二表达构建体的形式；且

(c)编码所述tracrRNA的所述DNA呈包含操作性连接编码所述tracrRNA的第三核酸的第三启动子的第三表达构建体的形式；

其中所述第一启动子、所述第二启动子和所述第三启动子在所述人类诱导的多潜能干细胞中具有活性，且

其中所述第一表达构建体、所述第二表达构建体和所述第三表达构建体在单一核酸分子上或在多个核酸分子上。

8.如权利要求5所述的方法，其中：

(a)编码所述Cas9蛋白的所述DNA呈包含操作性连接编码所述Cas9蛋白的第一核酸的第一启动子的第一表达构建体的形式；且

(b)编码所述CRISPR RNA的所述DNA和编码所述tracrRNA的所述DNA呈包含操作性连接编码包含所述CRISPR RNA和所述tracrRNA的gRNA的第二核酸的第二启动子的第二表达构建体的形式；

其中所述第一启动子和所述第二启动子在所述人类诱导的多潜能干细胞中具有活性，且

其中所述第一表达构建体和所述第二表达构建体在单一核酸分子上或在单独的核酸分子上。

9.如权利要求1-4和6-8中任一项所述的方法，其中所述靶向基因修饰同时包括在所述目标基因组基因座处缺失内源核酸序列和在所述目标基因组基因座处插入所述插入核酸。

10.如权利要求9所述的方法，其中所述缺失的内源核酸序列为30kb至110kb，且所述插入核酸为40kb至140kb。

11.如权利要求1-4、6-8和10中任一项所述的方法，其中所述靶向基因修饰为双等位基因基因修饰。

12.如权利要求11所述的方法，其中所述双等位基因基因修饰包括在两种同源染色体中在所述目标基因组基因座处内源核酸序列的缺失和所述插入核酸的插入。

13.如权利要求11所述的方法，其中所述修饰的人类诱导的多潜能干细胞在所述目标基因组基因座处为复合杂合的或半合的。

14.如权利要求13所述的方法，其中在一种染色体中在所述目标基因组基因座处的所述靶向基因修饰包括内源核酸序列的缺失和所述插入核酸的插入。

15.如权利要求14所述的方法，其中所述靶向基因修饰包括：(1)在第一同源染色体和第二同源染色体中在所述目标基因组基因座处缺失内源核酸序列；和(2)所述插入核酸插入在所述第一同源染色体中的所述目标基因组基因座中并破坏在所述第二同源染色体中的所述目标基因组基因座。

16.如权利要求1-4、6-8、10和12-15中任一项所述的方法，其中所述大靶向载体为至少40kb；或

其中所述靶向基因修饰包括所述目标基因组基因座的区的缺失，其中所述缺失至少为30kb，而所述大靶向载体为至少15kb。

17.如权利要求1-4、6-8、10和12-15中任一项所述的方法，其中靶向基因修饰包括所述插入核酸的插入，其中所述插入核酸为至少40kb；或

其中所述靶向基因修饰包括所述目标基因组基因座的区的缺失和所述插入核酸的插入，其中所述缺失至少为30kb，其中所述插入核酸至少为10kb。

18.如权利要求1-4、6-8、10和12-15中任一项所述的方法，其中所述插入核酸为40kb至140kb。

19.如权利要求1-4、6-8、10和12-15中任一项所述的方法，其中所述CRISPR靶序列由原间隔区邻近基序序列直接侧接。

20.如权利要求1-4、6-8、10和12-15中任一项所述的方法，其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为10kb至150kb。

21.如权利要求20所述的方法，其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为30kb至150kb。

22.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述大靶向载体的长度为100kb至300kb。

23.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述靶向基因修饰包括：

(a)用同源或直系同源的核酸序列替换内源核酸序列；

(b)缺失内源核酸序列；

(c)插入外源核酸序列；

(d)插入包含同源或直系同源的核酸序列的外源核酸序列；

(e)插入包含人类核酸序列和非人类核酸序列的嵌合核酸序列；

(f)插入由位点特异性重组酶靶序列侧接的条件性等位基因；

(g)插入操作性连接在所述人类诱导的多潜能干细胞中具有活性的启动子的可选择标记或报道基因；或

(h)其组合。

24.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述靶向基因修饰包括缺失所述目标基因组基因座的区，

其中所述缺失至少为40kb；或

其中所述靶向基因修饰还包括在所述目标基因组基因座处插入所述插入核酸和所述目标基因组基因座的区的缺失，其中所述插入至少为30kb，其中所述缺失至少为10kb。

25.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中缺失的所述基因组基因座的所述区为30kb至110kb。

26.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述靶向基因修饰包括缺失所述目标基因组基因座的区和在所述目标基因组基因座处插入所述插入核酸，其中所述缺失至少为30kb，其中所述插入至少为30kb。

27.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述大靶向载体为100kb至300kb，所述5'同源臂和3'同源臂的总和为30kb至150kb，且所述靶向基因修饰包括缺失所述目标基因组基因座的区和在所述目标基因组基因座处插入所述插入核酸，其中所述缺失为30kb至110kb，其中所述插入为40kb至140kb。

28.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述目标基因组基因座为与所述人类诱导的多潜能干细胞内源的。

29.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述目标基因组基因座包含整合到所述人类诱导的多潜能干细胞的所述基因组中的DNA的异源或外源片段。

30.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述目标基因组基因座是免疫球蛋白基因座。

31.如权利要求30所述的方法，其中所述免疫球蛋白基因座编码人免疫球蛋白重链可变区氨基酸序列。

32.如权利要求30所述的方法，其中所述免疫球蛋白基因座编码人免疫球蛋白轻链可变区氨基酸序列。

33.如权利要求32所述的方法，其中所述免疫球蛋白基因座包括：(i)未重排的人λ轻链可变区核酸序列；(ii)未重排的人κ轻链可变区核酸序列；或(iii)未重排的人λ和κ轻链可变区核酸序列。

34.如权利要求32所述的方法，其中所述免疫球蛋白基因座包括：(i)重排的人λ轻链可变区核酸序列；(ii)重排的人κ轻链可变区核酸序列；或(iii)重排的人λ和κ轻链可变区核酸序列。

35.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述目标基因组基因座是T细胞受体基因座。

36.如权利要求35所述的方法，其中所述T细胞受体基因座是T细胞受体α基因座。

37.如权利要求1-4、6-8、10、12-15和21中任一项所述的方法，其中所述目标基因组基因座包括干扰白细胞素-2受体γ基因座、ApoE基因座、Rag1基因座、Rag2基因座、所述Rag1基因座和所述Rag2基因座两者、Adamts5基因座、Trpa1基因座、Folh1基因座、Erbb4基因座、Lrp5基因座、C5基因座、Ror1基因座或Dpp4基因座。

38.如权利要求1-4、6-8、10、12-15、21、31-34和36中任一项所述的方法，其中所述插入核酸包含编码人类免疫球蛋白重链可变区氨基酸序列的基因组核酸序列。

39.如权利要求38所述的方法，其中所述插入核酸包含一个或多个功能性人类V_H基因片段，所述功能性人类V_H基因片段包含V_H1-2、V_H1-3、V_H1-8、V_H1-18、V_H1-24、V_H1-45、V_H1-46、V_H1-58、V_H1-69、V_H2-5、V_H2-26、V_H2-70、V_H3-7、V_H3-9、V_H3-11、V_H3-13、V_H3-15、V_H3-16、V_H3-20、V_H3-21、V_H3-23、V_H3-30、V_H3-30-3、V_H3-30-5、V_H3-33、V_H3-35、V_H3-38、V_H3-43、V_H3-48、V_H3-49、V_H3-53、V_H3-64、V_H3-66、V_H3-72、V_H3-73、V_H3-74、V_H4-4、V_H4-28、V_H4-30-1、V_H4-30-2、V_H4-30-4、V_H4-31、V_H4-34、V_H4-39、V_H4-59、V_H4-61、V_H5-51、V_H6-1、V_H7-4-1、V_H7-81，或其组合。

40.如权利要求38所述的方法，其中所述插入核酸包含一个或多个功能性人类D基因片段，所述人类D基因片段包含D1-1、D1-7、D1-14、D1-20、D1-26、D2-2、D2-8、D2-15、D2-21、D3-3、D3-9、D3-10、D3-16、D3-22、D4-4、D4-11、D4-17、D4-23、D5-12、D5-5、D5-18、D5-24、D6-6、D6-13、D6-19、D6-25、D7-27或其组合。

41.如权利要求38所述的方法，其中所述插入核酸包含一个或多个功能性J_H基因片段，所述功能性J_H基因片段包括J_H1、J_H2、J_H3、J_H4、J_H5、J_H6或其组合。

42.如权利要求1-4、6-8、10、12-15、21、31-34和36中任一项所述的方法，其中所述插入核酸包含编码人类免疫球蛋白轻链可变区氨基酸序列的基因组核酸序列。

43.如权利要求42所述的方法，其中所述插入核酸包含一个或多个人类Vκ基因片段，所述人类Vκ基因片段包含Vκ4-1、Vκ5-2、Vκ7-3、Vκ2-4、Vκ1-5、Vκ1-6、Vκ3-7、Vκ1-8、Vκ1-9、Vκ2-10、Vκ3-11、Vκ1-12、Vκ1-13、Vκ2-14、Vκ3-15、Vκ1-16、Vκ1-17、Vκ2-18、Vκ2-19、Vκ3-20、Vκ6-21、Vκ1-22、Vκ1-23、Vκ2-24、Vκ3-25、Vκ2-26、Vκ1-27、Vκ2-28、Vκ2-29、Vκ2-30、Vκ3-31、Vκ1-32、Vκ1-33、Vκ3-34、Vκ1-35、Vκ2-36、Vκ1-37、Vκ2-38、Vκ1-39、Vκ2-40或其组合。

44.如权利要求42所述的方法，其中所述插入核酸包含一个或多个人类V_λ基因片段，所述人类V_λ基因片段包含V_λ3-1、V_λ4-3、V_λ2-8、V_λ3-9、V_λ3-10、V_λ2-11、V_λ3-12、V_λ2-14、V_λ3-16、V_λ2-18、V_λ3-19、V_λ3-21、V_λ3-22、V_λ2-23、V_λ3-25、V_λ3-27或其组合。

45.如权利要求42所述的方法，其中所述插入核酸包含一个或多个人类Jκ基因片段，所述人类Jκ基因片段包含Jκ1、Jκ2、Jκ3、Jκ4、Jκ5或其组合。

46.如权利要求1-4、6-8、10、12-15、21、31-34和36中任一项所述的方法，其中所述插入核酸包括编码人类T细胞受体的至少一个区的多核苷酸。

47.如权利要求46所述的方法，其中所述T细胞受体是T细胞受体α。

48.如权利要求1-4、6-8、10、12-15、21、31-34和36中任一项所述的方法，其中所述插入核酸包含至少一个疾病等位基因。

49.如权利要求48所述的方法，其中所述插入核酸包含人类基因的至少一个人类疾病等位基因。

50.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列不存在于所述插入核酸中。

51.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列位于所述目标基因组基因座处的所述5'靶序列与所述3'靶序列之间的任何地方。

52.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列直接邻近于所述目标基因组基因座处的所述5'靶序列或所述3'靶序列。

53.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列位于内含子、外显子、或调控区中。

54.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列位于基因的编码区内或影响所述基因的表达的调控区内。

55.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述向导RNA包括SEQ ID NO：2、3、4、5、6、7或8。

56.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述人类诱导的多潜能干细胞正维持在包含基础培养基和补充剂的培养基中，其中所述培养基包含：

(a)白血病抑制因子多肽；

(b)肝糖合成酶激酶抑制剂；和

(c)MEK抑制剂；

其中所述基础培养基具有180mOsm/kg至250mOsm/kg的渗透压度。

57.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述Cas9蛋白包含核定位信号。

58.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为至少10kb。

59.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述CRISPR靶序列是对所述人类诱导的多潜能干细胞为内源的天然序列。

60.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述目标基因组基因座对所述人类诱导的多潜能干细胞为天然的。

61.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述Cas9蛋白包含核定位信号，并且

其中所述CRISPR靶序列位于所述5'靶序列和所述3'靶序列之间的任何地方，或者所述CRISPR靶序列直接邻近于所述5'靶序列或所述3'靶序列。

62.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为至少10kb，

其中所述CRISPR靶序列是对所述人类诱导的多潜能干细胞为内源的天然序列，以及

63.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为至少10kb，

其中所述目标基因组基因座对所述人类诱导的多潜能干细胞为天然的，以及

64.如权利要求1-4、6-8、10、12-15、21、31-34、36、39-41、43-45、47和49中任一项所述的方法，其中所述靶向基因修饰包括在所述目标基因组基因座处插入所述插入核酸，或者其中所述靶向基因修饰包括缺失所述目标基因组基因座的所述区，以及在所述目标基因组基因座处插入所述插入核酸。

65.如权利要求64所述的方法，其中所述CRISPR靶序列是对所述人类诱导的多潜能干细胞为内源的天然序列，且其中所述大靶向载体的所述5'同源臂和所述3'同源臂的总和为10kb至150kb。