CN115074343A

CN115074343A - Cas转基因小鼠胚胎干细胞和小鼠及其应用

Info

Publication number: CN115074343A
Application number: CN202210528912.0A
Authority: CN
Inventors: 国春·龚; 查琳·亨特; 大辅·梶村; 苏珊娜·哈特福德; 布莱恩·扎姆布罗维兹
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2017-07-31
Filing date: 2018-07-31
Publication date: 2022-09-20
Also published as: US11130999B2; CN110891420A; CN110891420B; RU2020105343A; SG11201912235PA; IL272334A; JP2020532952A; KR20200032693A; MX2020001178A; US20210392862A1; RU2020105343A3; AU2018309716A1; BR112020001364A2; US11866794B2; US20190032155A1; JP2023165953A; WO2019028032A1; CA3067872A1; EP3585159A1; US20240093316A1

Abstract

本文提供用于评价CRISPR/Cas介导的非同源末端连接的活性和/或CRISPR/Cas诱导的目标基因组基因座与外源供体核酸的体内或离体重组的方法和组合物。所述方法和组合物使用包含诸如基因组整合的Cas表达盒之类的Cas表达盒的细胞和非人类动物，从而使得Cas蛋白质组成上可获取的或以组织特异性或时间特异性的方式可获取。本文还提供用于产生和使用这些非人类动物的方法和组合物，包括使用这些非人类动物通过腺相关病毒(AAV)介导的将向导RNA递送至所述非人类动物来评价CRISPR/Cas的体内活性。

Description

CAS转基因小鼠胚胎干细胞和小鼠及其应用

分案申请说明

本申请是申请日为2018年07月31日，申请号为201880044435.2，发明名称为“CAS转基因小鼠胚胎干细胞和小鼠及其应用”的发明专利申请的分案申请。

相关申请的交叉引用

本申请要求2017年7月31日提交的美国申请US62/539,275的权益，该美国申请的全部内容通过引用并入本文，用于所有目的。

对通过EFS WEB以TEXT文件格式提交的序列表的引用

在文件516569SEQLIST.txt中写入的序列表的大小为178千字节，其于2018年7月30日创建，并通过引用并入本文。

背景技术

CRISPR/Cas技术有望成为一种新的治疗形式。然而，目前需要更好的通过引入体内的CRISPR/Cas试剂评价突变产生效率或目标基因突变效率的方式。在体内对系统进行测试的一个限制在于需要将所有成分同时引入活体生物体中。引入这些成分的经典方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法很有效，但是这种方法具有固有缺点，这是因为细胞必须依赖于质粒DNA构建体，从而先经历转录再进行翻译，随后Cas9蛋白质能够与sgRNA成分发生相互作用。因此，需要更好的方法和工具来更加有效地评价引入的CRISPR/Cas试剂的活性并且评价靶定体内特定组织或细胞类型的不同的递送方法和参数。

此外，诸如CRISPR/Cas试剂之类的生物活性试剂向受治者的递送通常由于各个成分难以到达目标细胞或组织而受到限制。这些限制可能会导致例如，需要使用比实现期理想结果高得多的浓度的试剂，这会增加毒副作用的风险。因此，本领域需要改进的递送方法以及体内评价这种递送方法的方法。

发明内容

本文提供Cas9就绪(Cas9-ready)的非人类动物，并且本文提供用于评价CRISPR/Cas核酸酶试剂体内修饰目标基因组基因座的能力的方法和组合物。在一个方面，本文提供测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法。一些这样的方法包括：(a)向非人类动物体内引入设计为靶定目标基因组基因座的向导RNA靶向序列的向导RNA，其中，所述非人类动物包括基因组整合的Cas表达盒，该表达盒包括NLS-Cas编码序列，并且，其中，向导RNA通过腺相关病毒(AAV)介导的递送被引入；以及(b)评价对目标基因组基因座的修饰。一些这样的方法包括：(a)向非人类动物体内引入设计为靶定目标基因组基因座的向导RNA靶向序列的向导RNA，其中，所述非人类动物包含基因组整合的Cas表达盒，该表达盒包括NLS-Cas编码序列，并且，其中，所述向导RNA通过脂质纳米颗粒(LNP)介导的递送被引入，以及(b)评价对所述目标基因组基因座的修饰。

在一些这样的方法中，所述AAV是AAV7,AAV8,或AAV9，步骤(b)包括对肝脏中的目标基因组基因座的修饰进行评价。任选地，AAV是AAV8。

在一些这样的方法中，向所述非人类动物给药AAV的途径是静脉内注射，脑实质内注射，腹膜内注射，鼻灌注或玻璃体内注射。

在一些这样的方法中，在步骤(a)中引入外源供体核酸，其中，所述外源供体核酸被设计为与所述目标基因组基因座重组。任选地，所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。

在一些这样的方法中，所述非人类动物是大鼠或小鼠。任选地，所述非人类动物是小鼠。

在一些这样的方法中，所述目标基因组基因座包括目标基因，并且步骤(b)包括测量所述目标基因的表达或所述目标基因编码的蛋白质的活性。

在一些这样的方法中，步骤(b)包括对分离自所述非人类动物的一种或多种细胞中的目标基因组基因座进行测序。

在一些这样的方法中，步骤(b)包括从所述非人类动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰。任选地，步骤(b)包括对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰进行评价。

在一些这样的方法中，步骤(b)包括从所述非人类动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。

在一些这样的方法中，所述NLS-Cas编码序列是NLS-Cas9编码序列。

在一些这样的方法中，所述Cas表达盒还包括NLS-Cas编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述Cas表达盒中的聚腺苷酸化信号已通过组织特异性方式删除。任选地，在肝脏中，所述Cas表达盒中的NLS-Cas编码序列上游的聚腺苷酸化信号已被删除。任选地，所述Cas表达盒中的识别重组酶识别位点的重组酶是Cre重组酶。任选地，所述非人类动物还包括基因组整合的Cre重组酶表达盒，其中，所述Cre重组酶表达盒包括Cre重组酶编码序列，其可操作地连接至组织特异性启动子。任选地，所述Cre重组酶基因可操作地连接至表2中列出的启动子中的一个。

在一些这样的方法中，Cas表达盒还包括NLS-Cas编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述方法还包括将重组酶以组织特异性的方式引入非人类动物体内。任选地，所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。任选地，所述重组酶通过AAV8介导的递送被引入。任选地，所述重组酶被引入至肝脏。

在一些这样的方法中，Cas表达盒还包括荧光蛋白编码序列。任选地，所述Cas表达盒包括多顺反子核酸，该多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的NLS-Cas编码序列和荧光蛋白编码序列。任选地，所述Cas表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的NLS-Cas编码序列和绿色荧光蛋白编码序列。在一些这样的方法中，Cas表达盒不包括荧光蛋白编码序列。在一些这样的方法中，NLS-Cas编码序列编码包含蛋白质标签的Cas蛋白质。

在一些这样的方法中，Cas表达盒可操作地连接至内源启动子。在一些这样的方法中，Cas表达盒可操作地连接至外源组成性启动子。

在一些这样的方法中，Cas表达盒的5’端还包括3’剪接序列。

在一些这样的方法中，Cas表达盒编码包含SEQ ID NO:13,16,19或22中列出的序列的蛋白质。任选地，Cas表达盒包含SEQ ID NO:28,29,30或31中列出的序列。任选地，Cas表达盒包含SEQ ID NO:1,12,14,15,17,18,20或21中列出的序列。

在一些这样的方法中，Cas表达盒被整合至安全港基因座。任选地，所述安全港基因座是Rosa26基因座。任选地，Cas表达盒被整合至Rosa26基因座的第一内含子中。

在一些这样的方法中，所述非人类动物对于Cas表达盒而言是杂合的。在一些这样的方法中，所述非人类动物对于Cas表达盒而言是纯合的。

在一些这样的方法中，所述非人类动物是小鼠，AAV是AAV8，Cas表达盒可操作地连接至内源Rosa26启动子，被插入至Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列，以及(ii)NLS-Cas9编码序列，并且步骤(b)包括评价非人类动物的肝脏中的目标基因组基因座的修饰。在一些这样的方法中，所述非人类动物是小鼠，AAV是通过静脉内注射递送至所述非人类动物的AAV8，Cas表达盒可操作地连接至内源Rosa26启动子，被插入至Rosa26基因座的第一内含子，并且在5’至3’方向上包括：(i)3’剪接序列；以及(ii)NLS-Cas9编码序列，并且步骤(b)包括评价非人类动物的肝脏中的目标基因组基因座的修饰。

另一方面，本文提供优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法。一些这样的方法包括：(I)在第一非人类动物体内第一次执行上述任何一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法；(II)改变可变量并且在第二非人类动物体内使用改变的可变量再次执行步骤(I)的方法；以及(III)将步骤(I)中目标基因组基因座的修饰与步骤(II)中目标基因组基因座的修饰进行比较，并且选择产生对目标基因组基因座的修饰具有较高的效率，较高的精确度，较高的一致性或较高的特异性中的一种或多种的方法。

在一些这样的方法中，步骤(II)中改变的可变量是AAV血清型。在一些这样的方法中，步骤(II)中改变的可变量是将向导RNA引入至非人类动物中的给药途径。在一些这样的方法中，步骤(II)中改变的可变量是引入至非人类动物中的向导RNA的浓度或量。在一些这样的方法中，步骤(II)中改变的可变量是引入至非人类动物中的向导RNA(例如，向导RNA的形式或序列)。在一些这样的方法中，所述方法包括引入外源供体核酸，并且，其中，步骤(II)中改变的可变量是将所述外源供体核酸引入至非人类动物的递送方法。在一些这样的方法中，所述方法包括引入外源供体核酸，并且，其中，步骤(II)中改变的可变量是将所述外源供体核酸引入至非人类动物的给药途径。在一些这样的方法中，所述方法包括引入外源供体核酸，并且步骤(II)中改变的可变量是引入至非人类动物中的外源供体核酸的浓度或量。在一些这样的方法中，所述方法包括引入外源供体核酸，并且步骤(II)中改变的可变量是相对于引入至非人类动物中的外源供体核酸的浓度或量的引入至非人类动物中的向导RNA的浓度或量。在一些这样的方法中，步骤(II)中改变的可变量是引入至非人类动物中的外源供体核酸(例如，外源供体核酸的形式)。

附图说明

图1显示了Cas9等位基因(MAID2599，不是成比例的)，其在5’至3’方向上包括：3’剪接序列，第一loxP位点，新霉素耐药基因，聚腺苷酸化信号，第二loxP位点，NLS-Cas9编码序列，P2A肽编码序列，以及GFP编码序列。

图2A显示了野生型F1H4小鼠胚胎干细胞(mESC)以及具有和不具有lox-stop-lox新霉素盒(分别为MAID2599和MAID2600)并随后引入了靶向第一目标基因的起始密码子区域和终止密码子区域的两个sgRNA(质粒形式或RNA形式)的Cas9就绪的mESC中的NHEJ活性，任选地，Cas9就绪的mESC中还引入了Cas9质粒。在左图中测量了5’切割效率，在中间图中测量了3’切割效率，在右图中测量了将介入的DNA完全删除的速率。

图2B显示了切割效率(左图)和HDR效率(右图)，随后引入靶定第二目标基因的sgRNA(质粒形式或RNA形式)以及作为点突变供体的单链寡脱氧核苷酸(ssODN)，任选地还引入了Cas9质粒。

图3A至图3F显示了野生型小鼠和杂合的Cas9就绪的小鼠(MAID2600)的肝脏(图3A)，肾脏(图3B)以及脑组织(图3C)的亮视场图像，以及野生型小鼠和Cas9就绪的小鼠(MAID2600)的肝脏(图3D)，肾脏(图3E)以及脑组织(图3F)的GFP荧光图像。

图4A显示了通过RT-qPCR测定的从杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9 mRNA表达水平。y轴显示了与来自脑组织的平均Cas9 Ct相比的δCt+1。

图4B显示了从野生型小鼠和杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9蛋白质的表达。肌动蛋白用作对照。

图4C显示了通过RT-qPCR测定的从杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9平均Cas9和β-2-微球蛋白(B2m)mRNA的表达水平。柱形上方显示了每种类型的组织中所测试的样本数量。

图5A至图5B显示了在由脂质纳米颗粒(LNP)递送了GFP mRNA和对照(dead)sgRNA，GFP mRNA和目标基因3sgRNA或者Cas9mRNA和目标基因3sgRNA之后从野生型小鼠(图5A)和表达盒删除的Cas9小鼠(MAID2600；图5B)中分离出来的初级肝细胞中第三目标基因处的NHEJ活性百分比(插入/缺失(indel)频率)。测试得到mRNA的浓度为15.6,62.5,250,和1000ng/mL。

图6A至图6D显示了如下蛋白质的血清水平，所述蛋白质被肝脏分泌并且在血清中发现并由第三目标基因(目标基因3)编码，随后通过流体动力学DNA递送(HDD)，脂质纳米颗粒(LNP)递送，或通过尾静脉注射腺相关病毒(AAV)递送将目标基因3sgRNA引入野生型小鼠(msCas9-)或表达盒删除的Cas9就绪的小鼠。在一些情况下，Cas9也被引入(对于LNP递送而言以mRNA的形式，对于HDD以及AAV递送而言以DNA的形式(Cas9质粒))。未处理的小鼠，LNP对照小鼠，AAV对照小鼠和HDD对照小鼠用作阴性对照。对于LNP介导的递送而言，测试了如下三组小鼠：(1)Cas9就绪的小鼠(3只雄性+3只雌性；2mg/kg对照向导RNA+GFP mRNA)；(2)Cas9就绪的小鼠(3只雄性+3只雌性；2mg/kg向导RNA用于目标基因3+GFP mRNA)；以及(3)WT小鼠(3只雄性+3只雌性；2mg/kg向导RNA用于目标基因3+Cas9 mRNA)。对于AAV-介导的递送而言，测试了如下两组小鼠：(1)Cas9就绪的小鼠(3只雄性+3只雌性；AAV8-向导RNA用于目标基因3)；以及(2)WT小鼠(3只雄性+3只雌性；AAV8-向导RNA用于目标基因3+AAV8-Cas9)。对于HDD而言，测试如下两组小鼠：(1)Cas9就绪的小鼠(3只雄性+3只雌性；向导RNA用于目标基因3)；以及(2)WT小鼠(3只雄性+3只雌性；向导RNA用于目标基因3+Cas9)。测量了雄性小鼠(图6A和图6B)和雌性小鼠(图6C和图6D)中由目标基因3编码的蛋白质的血清水平，并且在第7天(图6A和图6C)和第21天(图6B和图6D)测量了由目标基因3编码的蛋白质的血清水平。

图7显示了在脂质纳米颗粒(LNP)单独递送sgRNA或递送sgRNA和Cas9 mRNA，由流体动力学(HDD)单独递送sgRNA质粒或sgRNA质粒和Cas9质粒，或者单独递送AAV8-sgRNA或AAV8-sgRNA和AAV8-Cas9之后一个月野生型小鼠(msCas9-)和表达盒删除的Cas9小鼠(msCas9+；MAID2600)的肝脏中的目标基因3基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。

图8A显示了通过尾静脉注射在由AAV8递送sgRNA之后3至4周表达盒删除的Cas9小鼠(MAID2600)的肝脏中目标基因4基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。UNT＝未处理的对照。

图8B显示了在通过尾静脉注射由AAV8递送sgRNA之后3至4周从表达盒删除的Cas9小鼠(MAID2600)中分离出来的肝脏组织中由TAQMAN分析测定的目标基因4表达的相对水平。WT mastermix是指混合在一起的并且注射至作为阴性对照的野生型小鼠的所有五种sgRNA病毒。

图9显示了通过尾静脉注射在注射了LNP-Cre之后一个星期在从LSL-Cas小鼠(MAID2599)中分离的肝脏、脾脏和肾脏样本中Cas9表达的western印迹。未进行LNP-Cre注射的小鼠用作阴性对照。表达盒删除的Cas9小鼠(MAID2600)用作阳性对照。

图10显示了仅通过AAV8或者通过AAV8和LNP-Cre将目标基因3sgRNA注射至LSL-Cas9小鼠(MAID2599)中之后1周和3周由第三目标基因(目标基因3)编码的、由肝脏分泌的并且在血清中发现的蛋白质的血清水平。既没有经过LNP-Cre处理也没有通过AAV8-gRNA处理的小鼠用作阴性对照。还在表达盒删除的小鼠(ROSA Cas9；MAID2600)中测试了所有条件。

图11显示了仅通过AAV8或通过AAV8和LNP-Cre将目标基因3sgRNA注射至LSL-Cas9小鼠(MAID2599)之后3个星期在分离的肝脏的目标基因3基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。既没有经过LNP-Cre处理也没有通过AAV8-gRNA处理的小鼠用作阴性对照。还在表达盒删除的小鼠(ROSA Cas9；MAID2600)中测试了所有条件。

图12A显示了从LSL-Cas9小鼠(MAID2599)和LSL-Cas9/Alb-Cre小鼠中分离出来的肝脏中的Cas9的western印迹。肌动蛋白用作负载对照。

图12B显示了从LSL-Cas9小鼠(MAID2599)和LSL-Cas9/Alb-Cre小鼠中分离出来的脑组织中的Cas9的western印迹。肌动蛋白用作负载对照。

图13显示了通过AAV8向WT小鼠，表达盒删除的Cas9小鼠(ROSA Cas9，MAID2600)，LSL-Cas9小鼠(MAID2599)，白蛋白-Cre小鼠或LSL-Cas9/Alb-Cre小鼠中注射目标基因3sgRNA之后1个星期由肝脏分泌的、在血清中发现的并且由第三目标基因(目标基因3)编码的蛋白质的血清水平。

图14显示了四种不同的Cas9等位基因(不按照比例的)，包括MAID2599等位基因(一旦删除了lox-stop-lox(LSL)表达盒即为MAID2600)，MAID2658等位基因(一旦删除了LSL表达盒即为MAID2659)，MAID2660等位基因(一旦删除了LSL表达盒即为MAID2661)以及MAID2672等位基因(一旦删除了LSL表达盒即为MAID2673)。

具体实施方式

释义

本文中可互换使用的术语“蛋白质”，“多肽”和“肽”包括任何长度的氨基酸的聚合形式，包括编码的和非编码的氨基酸以及化学或生物化学修饰的或衍生的氨基酸。这些术语还包括诸如具有修饰的肽骨架的多肽之类的已经被修饰的聚合物。

蛋白质被描述为具有“N-末端”和“C-末端”。术语“N-末端”涉及蛋白质或多肽的起始点，其以具有游离胺基(-NH2)的氨基酸为终点。术语“C-末端”涉及氨基酸链(蛋白质或多肽)的终点，其以游离羧基(-COOH)为终点。

本文中可互换使用的术语“核酸”和“多核苷酸”包括任何长度的核苷酸的聚合形式，包括核糖核苷酸，脱氧核糖核苷酸或其类似物或修饰的形式。它们包括单链DNA或RNA，双链DNA或RNA和多链DNA或RNA，基因组DNA，cDNA，DNA-RNA杂合体以及包含嘌呤碱基，嘧啶碱基或其他天然的、化学修饰的、生物化学修饰的、非天然的或衍生得到的核苷酸碱基的聚合物。

核酸被描述为具有“5’端”和“3’端”，因为单核苷酸以使一个单核苷酸戊糖环的5’磷酸酯在一个方向上通过磷酸二酯键连接至相邻的单核苷酸戊糖环的3’氧的方式发生反应形成寡核苷酸。若寡核苷酸的5’磷酸酯没有与单核苷酸戊糖环的3’氧连接，那么寡核苷酸的这一端被称为5’端。如果寡核苷酸的3’氧没有与另一单核苷酸戊糖环的5’磷酸酯连接，那么寡核苷酸的这一端被称为3’端。即便核酸序列内部形成较大的寡核苷酸，那么核酸序列也可被描述为具有5’端和3’端。在线性或环状DNA分子中，离散元件被称为“上游”元件或“下游”的5’元件或3’元件。

术语“基因组整合的”是指已被引入至细胞内使得核苷酸序列整合至细胞的基因组中的核酸。任何操作规程可用于将核酸稳定地合并至细胞的基因组中。

术语“表达载体”或“表达构建体”是指如下重组核酸，其含有可操作地连接至合适的核酸序列的期望的编码序列，所述合适的核酸序列是可操作地连接的编码序列在特定宿主细胞或生物体内表达所必需的。在原核生物中表达所必需的核酸序列通常包括启动子、操纵子(任选)和核糖体结合位点，以及其他序列。通常已知真核细胞使用启动子、增强子以及终止和聚腺苷酸化信号，虽然一些元件可能被删除或添加了其他元件，但是不会牺牲必要的表达。

术语“靶向载体”是指可通过同源重组，非同源末端结合介导的连接或任何其他重组方式引入至细胞基因组中的目标位置的重组核酸。

术语“病毒载体”是指重组核酸，其包含病毒来源中的至少一种元件并且包括足以包装至病毒载体颗粒中或能够包装至病毒载体颗粒中的元件。载体和/或颗粒可用于将DNA，RNA或其他核酸离体或体内转染至细胞的目的。本领域已知多种形式的病毒载体。

与蛋白质、核酸和细胞有关的术语“分离的”包括相对于通常可能原位存在的细胞成分或生物体成分而相对地进行纯化的蛋白质、核酸和细胞，相当于并且包括蛋白质、核酸或细胞的基本纯的制剂。术语“分离的”还包括具有非天然生成的相应成分或蛋白质或核酸的蛋白质或核酸，所述非天然生成的相应成分或蛋白质或核酸是化学合成的并且因此基本没有被其他蛋白质或核酸污染。术语“分离的”还包括从与其天然伴生的大多数其他细胞成分或生物体成分中分离出来的或纯化得到的蛋白质、核酸或细胞(例如，其他细胞蛋白、核酸或者细胞或细胞外成分)。

术语“野生型”包括具有在正常(与突变、患病、发生改变等相反的)状态或情况中发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同的形式(例如，等位基因)存在。

术语“内源序列”是指在细胞或非人类动物中天然出现的核酸序列。例如，非人类动物的内源Rosa26序列是指在非人类动物的Rosa26基因座处天然出现的原生Rosa26序列。

“外源”分子或序列包括外源形式的通常不存在于细胞中的分子或序列。通常存在包括相对于细胞的特定发育阶段和环境条件的存在。例如，外源分子或序列可包括细胞内的相应内源序列的突变形式(例如，内源序列的人源化形式)或可包括对应于细胞内的内源序列的不同形式的(即，不存在于染色体内)序列。相反，内源分子或序列包括通常以内源形式在特定环境条件下在特定发育阶段存在于特定细胞中的分子或序列。

本文中在涉及核酸或蛋白质时使用术语“异源”表明核酸或蛋白质包括至少两个不会天然地在同一分子中一同出现的片段。例如，当涉及核酸片段或蛋白质片段时使用术语“异源”表明核酸或蛋白质包括两个或多个子序列，该子序列没有在本质上彼此相同的关系(例如，连接在一起)中发现。例如，核酸载体的“异源”区域是另一核酸分子内或与另一核酸分子连接的核酸的片段，所述另一核酸分子没有被发现与其他分子本质上相关。例如，核酸载体的异源区域可包括如下编码序列，其侧面具有没有发现与该编码序列本质上相关的序列。类似地，蛋白质的“异源”区域是另一肽分子内的或与另一肽分子连接的氨基酸的片段，所述另一肽分子没有被发现与其他肽分子本质上相关(例如，融合蛋白或带有标签的蛋白)。类似地，核酸或蛋白质可包括异源标签或异源分泌物或定位序列。

“密码子优化”利用了密码子的简并性，如指定氨基酸的三碱基对密码子组合的多样性所展现的那样，并且，所述密码子优化总体上包括通过由宿主细胞基因中更加频繁使用的或最频繁使用的密码子取代天然序列中的至少一个密码子并同时保留天然氨基酸序列来修饰核酸序列以提高其在特定宿主细胞中的表达的过程。例如，编码Cas9蛋白质的核酸可被修饰为与天然生成的核酸序列相比取代了给定的原核细胞或真核细胞中具有较高使用频率的密码子，所述原核细胞或真核细胞包括细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其他宿主细胞。密码子使用表格易于获取自例如，在“密码子使用数据库(Codon Usage Database)”。这些表格可以多种方式进行调节。参见，Nakamura等人,(2000)Nucleic Acids Research 28:292，该参考文献的全部内容通过引用并入本文，用于所有目的。还可获得用于在特定宿主中进行表达的特定序列的密码子的优化的计算机算法(参见例如，Gene Forge)。

“启动子”是DNA的调节性区域，其通常包括能够指向RNA聚合酶II以在特定的多核苷酸序列的合适的转录起始位点启动RNA合成的TATA盒。启动子还可包括影响转录启动速度的其他区域。本文公开的启动子序列调节可操作地连接的多核苷酸的转录。启动子在本文公开的细胞类型(例如，真核细胞、非人类哺乳动物细胞、人类细胞、啮齿动物细胞、多能细胞、单细胞期胚胎、分化的细胞或其组合)中的一种或多种中可具有活性。例如，启动子可以是组成性活性启动子、条件性启动子、可诱导的启动子、时间限制启动子(例如，发育调节的启动子)或空间限制启动子(例如，细胞特异性或组织特异性启动子)。启动子的实例可在例如WO2013/176772中找到，该参考文献的全部内容通过引入并入本文，用于所有目的。

组成性启动子是一种在所有组织或所有发育阶段的具体组织中均具有活性的启动子。组成性启动子的实例包括：人巨细胞病毒立即早期(hCMV)启动子，小鼠巨细胞病毒立即早期(mCMV)启动子，人延长因子1α(hEF1α)启动子，小鼠延长因子1α(mEF1α)启动子，小鼠磷酸甘油酯激酶(PGK)启动子，鸡β肌动蛋白杂合体启动子(CAG或CBh)，SV40早期启动子以及β2微管蛋白启动子。

可诱导的启动子的实例包括例如：化学调节启动子和物理调节启动子。化学调节启动子包括例如：乙醇调节的启动子(例如，乙醇脱氢酶(alcA)基因启动子)，四环素调节的启动子(例如，四环素响应的启动子，四环素操作子序列(tetO)，tet-On启动子或tet-Off启动子)，类固醇调节的启动子(例如，大鼠糖皮质激素受体，雌激素受体的启动子，或蜕皮素受体的启动子)，或金属调节的启动子(例如，金属蛋白启动子)。物理调节的启动子包括例如：温度调节的启动子(例如，热休克启动子)和光调节的启动子(例如，光诱导的启动子或光抑制的启动子)。

组织特异性启动子可以是例如：神经元特异性启动子，神经胶质特异性启动子，肌肉细胞特异性启动子，心脏细胞特异性启动子，肾细胞特异性启动子，骨细胞特异性启动子，内皮细胞特异性启动子或免疫细胞特异性启动子(例如，B细胞启动子或T细胞启动子)。

发育调节的启动子包括例如：仅在胚胎发育阶段具有活性的启动子或仅在成体细胞中具有活性的启动子。

“可操作地连接”或“被可操作地连接的”包括两个或多个成分(例如，启动子和另一序列元件)并列在一起，使这两个成分正常发挥作用并使得所述成分中的至少一个能够调节在其他成分中的至少一个之后发挥功能。例如，如果启动子响应一个或多个转录调节因子的存在或不存在控制编码序列的转录水平，那么所述启动子可以可操作地连接至所述编码序列。可操作的连接可包括彼此邻近的序列或反向作用的序列(例如，调节性序列可远距离发挥作用以控制所述编码序列的转录)。

核酸的“互补”是指核酸的一个链中的核苷酸序列根据其碱基的方向性与相对的核酸链上的另一序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中，互补碱基通常是C与G和U与A。互补性可以是完全互补的或者大量/充分互补的。两个核酸之间的完全互补是指两个核酸可形成二倍体，其中，该二倍体中的每个碱基通过沃森-克里克(Watson-Crick)碱基配对原则与互补碱基键合。“大量”或“充分”互补是指一个链中的序列不与相对链中的序列全部和/或完全互补，但是在这两个链上的碱基之间出现足够的键合以在一系列杂交条件(例如，盐浓度和温度)下形成稳定的杂交复合物。这些条件可使用序列和预测杂交的链的Tm(熔融温度)的标准数学计算方法进行预测，或可使用常规方法由经验确定Tm来进行预测。Tm包括两个核酸链之间形成的杂交复合物群发生50％变性(即，双链核酸分子群的一半解离成单链)的温度。在低于Tm温度的条件下，有利于形成杂交复合物，而在高于Tm温度的条件下，有利于杂交复合物中的链发生熔融或分离。可使用例如Tm＝81.5+0.41(％G+C)估算在1M NaCl水溶液中具有已知的G+C含量的核酸的Tm，虽然其他已知的Tm计算方法需要考虑核酸的结构特征。

“杂交条件”包括通过互补链相互作用和氢键合将一个核酸链结合至另一核酸链以生成杂交复合物的累积环境。这些条件包括含有核酸的水溶液或有机溶液的化学成分及其浓度(例如，盐、螯合剂、甲酰胺)以及混合物的温度。诸如孵育时间的长度或反应腔室的尺寸之类的其他因素可有助于所述环境。参见，例如，Sambrook等人,Molecular Cloning,ALaboratory Manual,2.sup.nd ed.,pp.1.90-1.91,9.47-9.51,1 1.47-11.57(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989)，该参考文献的全部内容通过引用并入本文，用于所有目的。

虽然在碱基之间可能会发生错配，但是，杂交要求两个核酸包含互补的序列。适于在两个核酸之间发生杂交的条件取决于核酸的长度和互补的程度，其是本领域熟知的可变量。两个核苷酸序列之间的互补程度越大，具有那些序列的核酸的杂交体的熔融温度(Tm)的数值越大。对于具有较短的互补片段(例如，35个核苷酸或更少的核苷酸互补，30个核苷酸或更少的核苷酸互补，25个核苷酸或更少的核苷酸互补，22个核苷酸或更少的核苷酸互补，20个核苷酸或更少的核苷酸互补，或18个核苷酸或更少的核苷酸互补)的核酸之间的杂交而言，错配位置变得非常重要(参见上述Sambrook等人，11.7-11.8)。通常，可杂交的核酸的长度为至少约10个核苷酸。可杂交的核酸的示例性的最小长度包括至少约15个核苷酸，至少约20个核苷酸，至少约22个核苷酸，至少约25个核苷酸，以及至少约30个核苷酸。而且，温度和洗涤溶液的盐浓度可根据诸如互补区域的长度和互补程度之类的因素进行必要地调节。

多核苷酸的序列不需要与待进行特异性杂交的其靶向核酸的序列100％互补。而且，多核苷酸可在一个或多个片段上进行杂交，使得中间的片段或邻近片段不涉及杂交事件(例如，环结构或发夹结构)。多核苷酸(例如，gRNA)可包括与其所靶定的靶向核酸序列内的目标区域具有至少70％序列互补性，至少80％序列互补性，至少90％序列互补性，至少95％序列互补性，至少99％序列互补性或100％序列互补性。例如，18个至20个核苷酸与目标区域互补并且因此进行特异性杂交的gRNA可表现出90％的互补性。在该实例中，剩余的非互补性核苷酸可以是成簇的或穿插在互补核苷酸之间并且无需彼此相邻或与互补的核苷酸相邻。

核酸内核酸序列的特定片段之间的互补百分比可使用BLAST(碱基局部比对检索工具，basic local alignment search tool)程序和PowerBLAST程序(Altschul等人,(1990)J.Mol.Biol.215:403-410；Zhang and Madden(1997)Genome Res.7:649-656)进行常规确定或通过使用Gap程序(Wisconsin Sequence Analysis Package,Version 8forUnix,Genetics Computer Group,University Research Park,Madison Wis.)，使用默认设置进行常规确定，所述Gap程序使用Smith和Waterman算法(Adv.Appl.Math.,1981,2,482-489)。

本文提供的方法和组合物使用多种不同的成分。全文中的一些成分可具有活性变体和片段。这些成分包括例如：Cas蛋白质，CRISPR RNA，tracrRNA，和向导RNA。这些成分中的每一个的生物活性在本文中进行描述。术语“功能”是指蛋白质或核酸(或其片段或变体)展现出生物活性或功能的固有能力。这些生物活性或功能可包括例如：Cas蛋白质结合至向导RNA以及结合至目标DNA序列的能力。功能片段或变体的生物功能可以是相同的或相对于原始功能片段或变体实质上可发生改变(例如，关于其特异性或选择性或效率)，但是仍然保留其基本生物功能。

术语“变体”是指不同于种群中的最普遍的序列的核苷酸序列(例如，一个核苷酸的差异)或者不同于种群中的最普遍的序列的蛋白质序列(例如，一个氨基酸的差异)。

涉及蛋白质的术语“片段”是指比全长蛋白质具有更短或更少的氨基酸的蛋白质。涉及核酸的术语“片段”是指比全长核酸具有更短或更少的核苷酸的核酸。片段可以是例如N-末端片段(即，除去了蛋白质的C末端部分)，C-末端片段(即，除去了蛋白质的N末端部分)，或内部片段。

涉及两个多核苷酸或多肽序列的上下文中的“序列一致性”或“一致性”涉及在特定比对窗口上进行最大一致性比对时两个序列中的相同残基。当针对蛋白质使用序列一致性的百分比时，不一致的残基位置通常由于保守氨基酸的取代而不同，其中，氨基酸残基被具有类似化学性质(例如，电荷或疏水性)的其他氨基酸残基取代并且因此不会改变分子的功能特性。当序列的不同之处在于保守取代时，序列一致性百分比可向上调节以校正取代的保守性。因这种保守取代而不同的序列被称为具有“序列类似性”或“类似性”。本领域熟知进行这种调节的方式。通常，这涉及将保守取代记为部分错配而非完全错配，从而增加序列一致性百分比。因此，例如，在等同氨基酸计分为1并且非保守取代计分为0的条件下，保守取代的计分为0和1之间。例如，如在程序PC/GENE(Intelligenetics,Mountain View,California)中所实施的，计算保守取代的计分。

“序列一致性的百分比”包括通过在比较窗口上比较两个最佳比对的序列(完全匹配的残基的最大数目)所确定的数值，其中，对于两个序列的最佳比对而言，比较窗口中的多核苷酸序列的一部分可包括相比于参比序列(其不包括添加或删除)的添加或删除(即，空隙)。百分比如下进行计算：确定两个序列中出现等同的核酸碱基或氨基酸残基的位置数目以获得匹配的位置数目，匹配的位置数目除以比较窗口中的总位置数目并乘以100以得到序列一致性百分数。除非另有说明(例如，较短的序列包括连接的异源序列)，比较窗口是全长的进行比较的两个较短的序列。

除非另有说明，序列一致性/类似性数值包括通过使用如下参数的GAP版本10而获得的数值，所述参数为：对于核苷酸序列的％一致性和％相似性使用50的GAP权重和3的长度权重以及nwsgapdna.cmp计分矩阵，对于氨基酸序列的％一致性和％相似性使用8的GAP权重和2的长度权重以及BLOSUM62计分矩阵，或其任何等同程序。“等同程序”包括任何序列比较程序，对于所考虑的任何两个序列而言，当与GAP版本10生成的相应比对比较时，所述序列比较程序产生具有等同的核苷酸或氨基酸残基匹配和序列一致性等同百分比的比对。

术语“保守氨基酸取代”是指使用类似尺寸、电荷或极性的不同氨基酸取代通常存在于序列中的氨基酸。保守取代的实例包括将非极性(疏水)残基(例如，异亮氨酸、缬氨酸或亮氨酸)取代为另一非极性残基。类似地，保守取代的实例包括将一个极性(亲水性)残基取代为另一极性残基，例如，精氨酸和赖氨酸之间的取代，谷氨酰胺和天冬酰胺之间的取代，或甘氨酸和丝氨酸之间的取代。此外，将碱性残基(例如，赖氨酸、精氨酸或组氨酸)取代为另一碱性残基或将一个酸性残基(例如，天冬氨酸或谷氨酸)取代为另一酸性残基是保守取代的其他实例。非保守取代的实例包括将非极性(疏水)氨基酸残基(例如，异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代为极性(亲水)残基(例如，半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或将极性残基取代为非极性残基。典型的氨基酸分类在下表1中予以总结。

表1.氨基酸分类

术语“体外(in vitro)”包括人工环境以及在人工环境(例如，试管)中发生的加工或反应。术语“体内(in vivo)”包括天然环境(例如，细胞或生物体或人体)以及在天然环境中发生的加工或反应。术语“离体(ex vivo)”包括已从个体体内取出的细胞以及在该细胞中发生的加工或反应。

术语“报告体基因”是指具有编码基因产物(通常为酶)的序列的核酸，在将包含可操作地连接至内源或异源启动子和/或增强子元件的报告体基因序列的构建体引入至含有(或可能含有)活化所述启动子和/或增强子元件所必需的因子的细胞中时易于定量分析所述基因产物。报告体基因的实例包括但不限于：编码β-半乳糖苷酶(lacZ)的基因，细菌氯霉素乙酰转移酶(cat)基因，萤火虫荧光素酶基因，编码β-葡萄糖醛酸酶(GUS)的基因，以及编码荧光蛋白的基因。“报告体蛋白”是指由报告体基因编码的蛋白质。

本文使用的术语“荧光报告体蛋白”是指可基于荧光进行检测的报告体蛋白，其中，所述荧光可直接来自于报告体蛋白，来自于报告体蛋白在荧光底物上的活性或来自于对荧光标记的化合物结合具有亲和性的蛋白质。荧光蛋白的实例包括绿色荧光蛋白(例如，GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,ZsGreenl)，黄色荧光蛋白(例如，YFP,eYFP,Citrine,Venus,YPet,PhiYFP,ZsYellowl)，蓝色荧光蛋白(例如，BFP，eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,T-sapphire)，青色荧光蛋白(例如，CFP，eCFP,Cerulean,CyPet,AmCyanl,Midoriishi-Cyan)，红色荧光蛋白(例如，RFP，mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,Jred)，橙色荧光蛋白(例如，mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,tdTomato)和任何其他合适的可通过流式细胞术方法检测其在细胞中的存在的荧光蛋白。

响应双链断裂(DSB)的修复主要通过两种保守DNA修复通路：同源重组(HR)和非同源性末端结合(NHEJ)而发生。参见，Kasparek&Humphrey(2011)Seminars in Cell&Dev.Biol.22:886-897，其全部内容通过引用并入本文，用于所有目的。同样，由外源供体核酸介导的目标核酸的修复可包括两个多核苷酸之间的遗传信息进行交换的任何过程。

术语“重组”包括在两个多核苷酸之间发生遗传信息交换的任何过程并且“重组”可通过任何机理发生。重组可通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包括可能需要核苷酸序列同源性的核酸修复形式，使用作为用于修复“目标”分子(即，经历了双链断裂的分子)的模板的“供体”分子并且引起遗传信息从供体转移至靶标。在不受任何特定理论的限制的条件下，这些转移可能会涉及在断裂的靶标和供体之间形成的异源双链DNA的错配校正和/或合成依赖的链退火和/或相关过程，在所述合成依赖的链退火过程中，所述供体用于再合成将会成为靶标的一部分的遗传信息。在一些情况下，供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合进入靶标DNA。参见，Wang等人,(2013)Cell 153:910-918；Mandalos等人,(2012)PLOS ONE 7:e45768:1-9；and Wang等人,(2013)Nat Biotechnol.31:530-532，这些参考文献中的每一个的全部内容通过引用并入本文，用于所有目的。

NHEJ包括通过使断裂末端彼此直接连接或使断裂末端连接至外源序列而无需同源模板而对核酸中的双链断裂进行修复。通过NHEJ进行非邻近序列的连接通常可在双链断裂的位点附近产生删除、插入或位移。例如，NHEJ还可通过使断裂末端与外源供体核酸的末端直接连接(例如，基于NHEJ的捕获)而产生外源供体核酸的定向整合。当同源定向修复(HDR)通路不易于使用(例如，在未分化的细胞，初始细胞和难以进行同源DNA修复的细胞中)时，这种NHEJ介导的定向整合对于外源供体核酸的插入而言是优选的。此外，与同源定向修复形成鲜明对照的是，不太需要涉及裂解位点(超出由Cas介导的裂解产生的悬挂)侧面较大区域的序列一致性的知识，这些知识在尝试向具有对其基因组序列不太了解的基因组的生物体内进行定向插入时是有益的。整合可通过将外源供体核酸和裂解的基因组序列之间的平端进行连接或通过使用外源供体核酸连接粘性末端(即，具有5’或3’的悬挂)来进行，其中，所述外源供体核酸位于与由裂解的基因组序列中的Cas蛋白质生成的那些悬挂相容的悬挂的侧面。参见例如，US 2011/020722,WO 2014/033644,WO 2014/089290,andMaresca等人,(2013)GenomeRes.23(3):539-546，这些参考文献中的每一个的全部内容通过引用并入本文，用于所有目的。如果平端被连接，那么可能需要靶点切除和/或供体切除以生成片段连接所需的微同源区域，靶点切除和/或供体切除可能会在靶向序列中产生不想要的改变。

组合物或方法“包含”或“包括”一种或多种所记载的成分可能包括其他未特别记载的成分。例如，“包含”或“包括”蛋白质的组合物可能只含有蛋白质或含有蛋白质以及其他成分。过渡性措辞“基本由…构成”是指权利要求的范围被解释为包含权利要求中所记载的指定成分以及不会实质上影响要求保护的发明的基本特征和新特征的那些成分。因此，本发明的权利要求中所使用的术语“基本由…构成”无意被解释为等同于“包含”。

“任选的”或“任选地”是指后续描述的事件或情况可能发生或可能不发生并且该描述包括所述事件或情况发生的实例和所述事件或所述情况不发生的实例。

数值范围的指定包括所述范围内的或所述范围所限定的所有整数以及该范围内由整数限定的所有子范围。

除非另有明确说明，术语“约”包括所述值的测量误差的标准偏差(例如，SEM)范围内的值。

术语“和/或”是指并且包括所列出的相关项目中的一个或多个中的任何可能的组合或所有可能的组合并且当使用可选术语“或”时包括缺少某些组合。

术语“或”是指具体列表中的任何一个成员并且还包括所列出的成员中的任何组合。

除非另有明确说明，单数形式的冠词“a”，“an”以及“the”包括复数指代物。例如，术语“单数形式的Cas蛋白质”或“至少一个Cas蛋白质”可包括多个Cas蛋白质，包括其混合物。

统计学上显著的是指p≤0.05。

I.概述

CRISPR/Cas9系统是一种用于基因组工程化的有力工具。这种系统在体内的一种限制在于需要同时将所有成分引入至活体生物体中。引入这些成分的典型方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法很有效，但是这种方法具有固有缺陷，这是因为细胞必须依赖于质粒DNA构建体先经历转录再进行翻译，随后使Cas9蛋白质与sgRNA成分发生相互作用。本领域需要更好的方法和工具来更加有效地评价CRISPR/Cas试剂的体内活性并且评价靶定特定组织或细胞类型的不同的体内递送方法和参数。

本文提供用于评价CRISPR/Cas介导的非同源末端连接(NHEJ)的活性和/或CRISPR/Cas诱导的目标基因组基因座与外源供体核酸体内或离体重组的方法和组合物。所述方法和组合物使用包含Cas表达盒(例如，基因组整合的Cas表达盒)的细胞和非人类动物，从而使得Cas蛋白质是组成性可获得的，或者例如以组织特异性的方式或时间特异性的方式可获得的。

因为仅需要将向导RNA引入至非人类动物，因此，包含Cas表达盒的非人类动物简化了用于测试CRISPR/Cas成分的体内递送和体内活性的方法。此外，Cas表达盒任选地可以是条件性Cas表达盒，其可以在特定组织或发育阶段选择性地表达，从而降低了Cas介导的体内毒性的风险，或者，Cas表达盒可以被组成性表达，从而能够测试任何类型和所有类型的细胞、组织和器官中的活性。

本文还提供了用于产生和使用这些非人类动物以测试和测量CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法和组合物。在一些这样的测试和测量CRISPR/Cas核酸酶体内修饰目标基因组基因座的方法中，向导RNA可通过AAV-介导的递送被递送至Cas-就绪的非人类动物。如实施例1所示，AAV介导的将向导RNA递送至Cas9就绪的小鼠以及具体地AAV8-介导的将向导RNA递送至肝脏使得CRISPR/Cas的靶定水平显著高于通过LNP或HDD将向导RNA递送至Cas9就绪的小鼠或显著高于通过LNP或HDD将Cas9和向导RNA这两者递送至野生型小鼠。

II.包含Cas表达盒的非人类动物||

本文提供使用包含Cas表达盒的非人类动物或细胞评价成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统或该系统的成分(例如，将向导RNA引入非人类动物或细胞)体内或离体修饰目标基因组基因座的能力的方法和组合物。

CRISPR/Cas系统包括Cas基因的表达或定向活化所涉及的转录体和其他元件。CRISPR/Cas系统可以是例如，I型系统，II型系统或III型系统。可选地，CRISPR/Cas系统可以是V型系统(例如，V-A亚型或V-B亚型)。在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然生成的。“非天然生成的”系统包括显示出人工参与的任何事件，例如，从系统的天然生成的状态改变或突变而来的系统中的一个或多个成分，至少基本上不含与系统本质上天然相关的至少一种其他成分，或与系统非天然相关的至少一种其他成分相关联。例如，非天然生成的CRISPR/Cas系统可使用包含非天然一同生成的gRNA和Cas蛋白质的CRISPR复合物，非天然生成的Cas蛋白质或非天然生成的gRNA。

本文公开的方法和组合物使用CRISPR/Cas系统，测试CRISPR复合物(包含与Cas蛋白质复合的向导RNA(gRNA))体内诱导目标基因组基因座中的位点定向裂解事件以通过非同源末端连接(NHEJ)，在外源供体核酸存在的条件下通过同源定向修复或通过任何其他修复或组合方法修复所述目标基因组基因座的能力。

A.Cas9就绪的非人类动物

本文公开的细胞和非人类动物包括Cas表达盒。Cas蛋白质通常包括至少一个可与向导RNA(gRNA，其在下文详细描述)发生相互作用的RNA识别结构域或RNA结合结构域，以及核酸酶结构域。核酸酶结构域对核酸裂解具有催化活性，所述核酸裂解包括核酸分子的共价键的断裂。裂解可产生平端或交错端，并且其可以是单链的或双链的。Cas蛋白质可具有完全裂解活性以在目标核酸中产生双链断裂(例如，带有平端的双链断裂)，或其可以是在目标核酸中产生单链断裂的切口酶。

包括Cas表达盒的细胞或非人类动物具有仅需要递送向导RNA以检测CRISPR/Cas介导的对目标基因组基因座的修饰的优点。

(1)Cas表达盒

本文所述的细胞和非人类动物包含Cas表达盒。所述Cas表达盒可被稳定地整合至所述细胞或非人类动物的基因组(即，整合至染色体)中，或者其可位于染色体的外部(例如，染色体外复制DNA)。任选地，Cas表达盒被稳定地整合至基因组中。稳定整合的Cas表达盒可被随机整合至非人类动物的基因组(即，转基因)，或者其可被整合至非人类动物的基因组的预定区域中(即，敲入)。任选地，Cas表达盒被稳定地整合至本文其他地方描述的安全港。稳定整合有Cas表达盒的目标基因组基因座对于Cas表达盒而言可以是杂合的或者对于Cas表达盒而言可以是纯合的。

由Cas表达盒编码的Cas蛋白质可以是任何Cas蛋白质(例如，Cas9蛋白质)，其实例在下文中描述。编码的Cas蛋白质可还包含一种或多种细胞核定位信号(NLS)(例如，N-末端NLS和C-末端NLS)，并且编码Cas蛋白质的序列可以是被优化为用于下文描述的细胞或非人类动物的密码子。例如，这种表达盒可编码包含如下氨基酸序列的蛋白质，或编码基本由如下氨基酸序列构成的蛋白质，或编码由如下氨基酸序列构成的蛋白质，所述氨基酸序列与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性。编码序列可包含如下序列，基本由如下序列构成或由如下序列构成，所述序列与SEQ ID NO:30中列出的Cas9编码序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性。

Cas表达盒的实例包括聚腺苷酸化信号下游的Cas编码序列或侧面具有由位点特异性重组酶识别的重组酶识别位点的转录终止子下游的Cas编码序列。所述聚腺苷酸化信号或转录终止子防止Cas蛋白质转录和表达。然而，在暴露于位点特异性重组酶之后，聚腺苷酸化信号或转录终止子将会被删除，并且Cas蛋白质可被表达。

如果以组织特异性的方式或者发育阶段特异性的方式删除了聚腺苷酸化信号或转录终止子，那么，Cas表达盒的这种结构能够在包含Cas表达盒的非人类动物体内产生组织特异性表达或发育阶段特异性表达。这可降低由于Cas蛋白质在细胞或非人类动物体内表达的延长或Cas蛋白质在不期望的发育阶段或在非人类动物体内的不期望的细胞或组织类型中表达而引起的毒性。例如，毒性可能是由于脱靶位点的裂解和中断而产生的。参见，例如，Parikh等人,(2015)PLoS One 10(1):e0116484。可诱导的表达也可能是有益的，这是因为编辑某些组织(例如，免疫细胞)中的一些基因可能是有害的，并且可能会产生免疫反应。例如，在一些情况下，如果某个基因在整个个体中发生突变，那么可能是致死性的，但是如果这个基因在特定组织或细胞类型中发生突变，那么这可能是有益的。如果包含Cas表达盒的非人类动物还包含可操作地连接至组织特异性或发育阶段特异性启动子(例如，用于肝脏特异性表达的白蛋白启动子或用于胰腺特异性表达的胰岛素2启动子)的位点特异性重组酶，那么可以实现以组织特异性的方式或发育阶段特异性的方式删除聚腺苷酸化信号或转录终止子。类似地，对肝脏或其他组织具有特异性的LNP制剂可用于递送重组酶，或对于特定组织具有特异性的AAV递送方法或AAV血清型(例如，用于肝脏的AAV8，或用于胰腺的AAV定向注射)可用于递送重组酶。可以仅删除那些组织或那些发育阶段的聚腺苷酸化信号或转录终止子，从而能够进行Cas蛋白质的组织特异性表达或发育阶段特异性表达。在一个实例中，Cas蛋白质可以肝脏特异性的方式被表达。已用于研发非人类动物的这些“重组酶删除”株(recombinase delete strain)的这些启动子的实例在本文的其他地方公开。

可使用任何转录终止子或聚腺苷酸化信号。本文使用的“转录终止子”是指导致转录终止的DNA序列。在真核细胞中，转录终止子由蛋白质因子识别，并且在终止之后进行聚腺苷酸化(这是一种在存在poly(A)聚合酶的条件下将poly(A)尾端添加至mRNA转录子中的过程)。哺乳动物poly(A)信号通常由长度为约45个核苷酸的核心序列构成，该核心序列的侧面可能具有用于提高裂解和聚腺苷酸化效率的多种辅助序列。核心序列由mRNA中高度保守的上游元件(AATAAA或AAUAAA，被称为poly A识别基序或poly A识别序列，其由裂解和聚腺苷酸化特异性因子(CPSF)识别)和难以界定的下游区域(Us中富含或Gs和Us中富含的区域)构成，所述下游区域由裂解刺激因子(CstF)限制。可使用的转录终止子的实例包括例如：人生长激素(HGH)聚腺苷酸化信号，猿猴病毒40(SV40)晚期聚腺苷酸化信号，兔β-球蛋白聚腺苷酸化信号，牛生长激素(BGH)聚腺苷酸化信号，磷酸甘油酸酯激酶(PGK)聚腺苷酸化信号，AOXI转录终止序列，CYC1转录终止序列，或适于调节真核细胞中的基因表达的任何已知的转录终止序列。

位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶，其中，单个核酸内两个重组位点被从物理上分隔开或者两个重组位点位于不同的核酸上。重组酶的实例包括Cre，Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei，其中，编码Cre重组酶的两个外显子被内含子分隔开以防止其在原核细胞中表达。这种重组酶可还包含细胞核定位信号以促进定位至细胞核(例如，NLS-Crei)。重组酶识别位点包括被位点特异性重组酶识别的并且可作为重组事件的底物的核苷酸序列。重组酶识别位点的实例包括FRT,FRT11,FRT71,attp,att,rox,and lox sites such as loxP,lox511,lox2272,lox66,lox71,loxM2,和lox5171。

Cas表达盒可以可操作地连接至任何合适的用于在非人类动物体内表达的启动子。所述非人类动物可以是本文其他地方描述的任何合适的非人类动物。作为一个实例，Cas表达盒可以可操作地连接至目标基因组基因座的内源启动子(例如，Rosa26启动子)。可选地，Cas表达盒可以可操作地连接至外源启动子，例如，组成性活性启动子(例如，CAG启动子或与巨细胞病毒(CMV)立即早期增强子(CAGG)连接的鸡β肌动蛋白启动子/增强子)，条件性启动子，可诱导的启动子，时间限制的启动子(例如，发育调节的启动子)或空间限制的启动子(例如，细胞特异性或组织特异性启动子)。这些启动子是本领域熟知的并且在本文其他地方进行了讨论。示例性的CAGG启动子在SEQ ID NO:38中列出或者包含如下序列，基本由如下序列构成或者由如下序列构成，所述序列与SEQ ID NO:38中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性。

本文公开的Cas表达盒还可包含其他成分。Cas表达盒可还包含位于Cas表达盒的5’端的3’剪接序列和/或位于Cas表达盒的3’端的Cas蛋白质的编码序列之后的另一聚腺苷酸化信号。Cas表达盒可还包含选择盒，该选择盒包含例如耐药蛋白的编码序列。合适的选择标志物的实例包括：新霉素磷酸转移酶(neo_r)，潮霉素B磷酸转移酶(hyg_r)，嘌呤霉素-N-乙酰转移酶(puro_r)，灭瘟素S脱氢酶(bsr_r)，黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)以及单纯疱疹病毒胸苷激酶(HSV-k)。任选地，选择盒的侧面可具有位点特异性重组酶的重组酶识别位点。如果Cas表达盒还包含位于上述Cas编码序列上游的聚腺苷酸化信号侧面的重组酶识别位点，那么任选地，将由不同的重组酶识别的不同的重组酶识别位点组用在选择盒的侧面。可选地，相同的重组酶识别位点组可位于Cas编码序列上游的聚腺苷酸化信号和选择盒这两者的侧面。示例性的neo_r-聚腺苷酸化序列在SEQ ID NO:37中列出或者其包含如下序列，基本由如下序列构成或由如下序列构成，所述序列为与SEQ ID NO:37中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性。

Cas表达盒可还包含编码蛋白质标签(例如，3x FLAG标签)的核酸。这样的标签的实例在SEQ ID NO:23中列出，其任选地由SEQ ID NO:34编码。例如，所述标签可以位于Cas蛋白质的N-末端，Cas蛋白质的C-末端，或Cas蛋白质的内部。例如，这种表达盒可编码如下蛋白质，其包含与SEQ ID NO:22中列出的3x FLAG-Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性的氨基酸序列，或基本由该氨基酸序列构成或由该氨基酸序列构成，或者包含与SEQ ID NO:16中列出的3x FLAG-Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％的一致性的氨基酸序列，或基本由该氨基酸序列构成或由该氨基酸序列构成。编码序列可包含与SEQ ID NO:31中列出的3xFLAG-Cas9编码序列或SEQ ID NO:29中列出的3xFLAG-Cas9-P2A-eGFP编码序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成，或由该序列构成。

Cas表达盒可还包含编码一种或多种报告体蛋白(例如，荧光蛋白(例如，绿色荧光蛋白))的核酸。可使用任何合适的报告体蛋白。例如，可使用本文其他地方描述的荧光报告体蛋白或可使用非荧光报告体蛋白。荧光报告体蛋白的实例在本文的其他地方提供。非荧光报告体蛋白包括例如：在组化分析或生物发光分析中使用的报告体蛋白，例如β-半乳糖苷酶，荧光素酶(例如，海肾荧光素酶，萤火虫荧光素酶和NanoLuc荧光素酶)以及β-葡萄糖醛酸酶。Cas表达盒可包括可在流式细胞分析法中检测到的报告体蛋白(例如，诸如绿色荧光蛋白之类的荧光报告体蛋白)和/或可在组化分析中检测到的报告体蛋白(例如，β-半乳糖苷酶蛋白)。这种组化分析的一个实例是通过水解X-Gal(5-溴-4-氯-3-吲哚基-b-D-半乳糖苷)通过组化方法使β-半乳糖苷酶的原位表达可视化，其产生蓝色沉淀，或者使用诸如β-甲基伞酮半乳糖苷(MUG)和荧光素双半乳糖苷(FDG)之类的荧光底物使β-半乳糖苷酶的原位表达可视化。

这些情况下的Cas表达盒包括多顺反子核酸。例如，所述核酸可包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的Cas蛋白质编码序列和报告体蛋白编码序列(以任何顺序均可)。多顺反子表达构建体同时表达两个或多个来自相同mRNA的不同蛋白质(即，相同启动子产生的转录体)。用于蛋白质的多顺反子表达的合适的策略包括例如，使用2A肽和使用内部核糖体进入位点(IRES)。例如，这些核酸可包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的两个或多个报告体蛋白的编码序列。作为一个实例，这种多顺反子载体可使用一个或多个内部核糖体进入位点(IRES)以允许从mRNA的内部区域开始进行翻译。作为另一实例，这种多顺反子载体可使用一个或多个2A肽。这些肽是较小的“自裂解”肽，其通常具有18至22个氨基酸的长度，并且这些肽通过相同的mRNA产生等摩尔水平的多种基因。核糖体跳过2A肽的C-末端的甘氨酰基-脯氨酰基肽键的合成，在2A肽及其相邻下游肽之间产生“裂解”。参见，例如，Kim等人,(2011)PLoS One 6(4):e18556，其全部内容通过引用并入本文，用于所有目的。“裂解”在C-末端上发现的甘氨酸和脯氨酸之间发生，这意味着上游顺反子将会具有若干个额外的残基添加至末端，同时下游顺反子将会从脯氨酸开始。因此，“裂解除去”的下游肽在其N-末端具有脯氨酸。2A-介导的裂解是所有真核细胞中的常见现象。已从小核糖核酸病毒，昆虫病毒和C型轮状病毒中识别出2A肽。参见，例如，Szymczak等人,(2005)Expert Opin Biol Ther 5:627-638，其全部内容通过引用并入本文，用于所有目的。可使用的2A肽的实例包括明脉扁刺蛾病毒(Thosea asigna virus)2A(T2A)；猪捷申病毒(porcine teschovirus)-12A(P2A)；马鼻炎A病毒(equine rhinitis A virus，ERAV)2A(E2A)和FMDV 2A(F2A)。示例性的T2A，P2A，E2A和F2A序列包括如下序列：T2A(EGRGSLLTCGDVEENPGP；SEQ ID NO:2)；P2A(ATNFSLLKQAGDVEENPGP；SEQ ID NO:3)；E2A(QCTNYALLKLAGDVESNPGP；SEQ ID NO:4)；和F2A(VKQTLNFDLLKLAGDVESNPGP；SEQ ID NO:5)。GSG残基可加至这些肽的任一种的5’端以改善裂解效率。带有添加在5’端的GSG残基的P2A的示例性的编码序列在SEQ ID NO:32中列出或者包括与SEQ ID NO:32中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列或SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。编码序列可包含与SEQ ID NO:28中列出的Cas9-P2A-eGFP编码序列或SEQ IDNO:29中列出的3xFLAG-Cas9-P2A-eGFP编码序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成，或由该序列构成。

Cas表达盒可还包含其他元件，例如转录后调节元件或Cas编码序列下游的聚腺苷酸化信号。示例性的转录后调节元件是土拨鼠肝炎病毒(woodchuck hepatitis virus)转录后调节元件(WPRE)，其在SEQ IDNO:35中列出或者包含与SEQ ID NO:35中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成，或者由该序列构成。示例性的聚腺苷酸化信号是SEQ IDNO:36中列出的牛生长激素聚腺苷酸化信号，或包含与SEQ ID NO:36中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成，或者由该序列构成。

一个示例性的Cas表达盒在5’至3’方向上包括：(a)3’剪接序列；(b)侧面具有重组酶的第一和第二重组酶识别位点(例如，Cre重组酶的loxP位点)的聚腺苷酸化信号；(c)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，其中，NLS位于N-末端并且NLS位于C-末端)；(d)2A蛋白质编码序列(例如，P2A编码序列)；以及(e)报告体蛋白(例如，荧光报告体蛋白，例如，绿色荧光蛋白)的编码序列。参见，例如，图1和图14中的MAID2599。这种表达盒可包含与SEQ ID NO:1中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这种表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或者由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)3’剪接序列；(b)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS)；(c)2A蛋白质编码序列(例如，P2A编码序列)；以及(d)报告体蛋白(例如，荧光报告体蛋白，例如，绿色荧光蛋白)的编码序列。参见，例如，图14中的MAID2600。这样的表达盒可包含与SEQ IDNO:12中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)3’剪接序列；(b)侧面具有重组酶的第一和第二重组酶识别位点(例如，Cre重组酶的loxP位点)的聚腺苷酸化信号；以及(c)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS)。参见，例如，图14中的MAID2600。这样的表达盒可包含与SEQ ID NO:17中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)3’剪接序列；以及(b)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS)。参见，例如，图14中的MAID2661。这样的表达盒可包含与SEQ ID NO:18中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)外源启动子(例如，组成性启动子，例如，CAGG启动子)；(b)侧面具有重组酶的第一和第二重组酶识别位点(例如，Cre重组酶的loxP位点)的聚腺苷酸化信号；(c)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS，任选地，在N-末端或C-末端具有标签，例如，在N-末端具有3xFLAG标签)；(d)2A蛋白编码序列(例如，P2A编码序列)；以及(e)报告体蛋白(例如，荧光报告体蛋白，例如，绿色荧光蛋白)的编码序列。参见，例如，图14中的MAID2658。这样的表达盒可包含与SEQ ID NO:14中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)外源启动子(例如，组成性启动子，例如，CAGG启动子)；(b)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS，任选地，在N-末端或C-末端具有标签，例如，在N-末端具有3xFLAG标签)；(c)2A蛋白编码序列(例如，P2A编码序列)；以及(d)报告体蛋白(例如，荧光报告体蛋白，例如，绿色荧光蛋白)的编码序列。参见，例如，图14中的MAID2659。这样的表达盒可包含与SEQ ID NO:15中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)外源启动子(例如，组成性启动子，例如，CAGG启动子)；(b)侧面具有重组酶的第一和第二重组酶识别位点(例如，Cre重组酶的loxP位点)的聚腺苷酸化信号；以及(c)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS，任选地，在N-末端或C-末端具有标签，例如，在N-末端具有3xFLAG标签)。参见，例如，图14中的MAID2672。这样的表达盒可包含与SEQ IDNO:20中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:22中列出的3xFLAG-Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

另一示例性的Cas表达盒在5’至3’方向上包括：(a)外源启动子(例如，组成性启动子，例如，CAGG启动子)；以及(b)Cas蛋白质编码序列(例如，NLS-Cas9编码序列，例如，在N-末端具有NLS并且在C-末端具有NLS，任选地，在N-末端或C-末端具有标签，例如，在N-末端具有3xFLAG标签)。参见，例如，图14中的MAID2673。这样的表达盒可包含与SEQ ID NO:21中列出的序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的序列，基本由该序列构成或者由该序列构成。例如，这样的表达盒可编码如下蛋白质，该蛋白质包含与SEQ ID NO:22中列出的3xFLAG-Cas9蛋白质序列具有至少90％,91％,92％,93％,94％,95％,96％,97％,98％,99％,或100％一致性的氨基酸序列，基本由该氨基酸序列构成或由该氨基酸序列构成。

本文所述的Cas表达盒可以是任何形式。例如，Cas表达盒可以位于载体中或质粒中，例如，病毒载体。Cas表达盒可以可操作地连接至能够在除去上游聚腺苷酸化信号之后定向Cas蛋白质的表达的表达构建体中的启动子。可选地，Cas表达盒可以位于本文其他地方定义的靶向载体中。例如，所述靶向载体可包含位于Cas表达盒侧面的同源臂，其中，所述同源臂适于与期望的目标基因组基因座进行定向重组以促进基因组整合。

本文所述的Cas表达盒可位于体外，它们可位于离体(例如，基因组整合的或染色体外)细胞内(例如，胚胎干细胞内)，或者它们可位于生物体(例如，非人类动物)体内(例如，基因组整合的或染色体外)。如果是离体的情况，Cas表达盒可位于来自任何生物体的任何类型的细胞内，例如，全能细胞，例如，胚胎干细胞(例如，小鼠或大鼠胚胎干细胞)或者诱导多能性干细胞(例如，人诱导多能性干细胞)。如果是体内的情况，Cas表达盒可位于任何类型的生物体内(例如，本文其他地方进一步描述的非人类动物)。

(2)Cas蛋白质和编码Cas蛋白质的多核苷酸

Cas蛋白质通常包含可与向导RNA(gRNA，下文中详细描述)发生相互作用的至少一个RNA识别结构域或至少一个RNA结合结构域。Cas蛋白质可还包含核酸酶结构域(例如，DNase或RNase结构域)，DNA结合结构域，解旋酶结构域，蛋白质-蛋白质相互作用结构域，二聚化结构域和其他结构域。一些这样的结构域(例如DNase结构域)可来自于原生Cas蛋白质。可添加其他这样的结构域以产生修饰的Cas蛋白质。核酸酶结构域对核酸裂解具有催化活性，所述核酸裂解包括核酸分子的共价键的断裂。裂解可产生平端或交错端，并且其可以是单链或双链裂解。例如，野生型Cas9蛋白质通常会产生平端裂解产物。可选地，野生型Cpf1蛋白质(例如，FnCpf1)可产生带有5-核苷酸5’悬挂的裂解产物，其中，裂解发生在非目标链上的PAM序列的第18个碱基对之后以及目标链上的第23个碱基之后。Cas蛋白质可具有完全裂解活性以在目标基因组基因座处产生双链断裂(例如，带有平端的双链断裂)，或者Cas蛋白质可以是在目标基因组基因座处产生单链断裂的切口酶。

Cas蛋白质的实例包括Cas1,Cas1B,Cas2,Cas3,Cas4,Cas5,Cas5e(CasD),Cas6,Cas6e,Cas6f,Cas7,Cas8a1,Cas8a2,Cas8b,Cas8c,Cas9(Csn1 or Csx12),Cas10,Cas10d,CasF,CasG,CasH,Csy1,Csy2,Csy3,Cse1(CasA),Cse2(CasB),Cse3(CasE),Cse4(CasC),Csc1,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmr1,Cmr3,Cmr4,Cmr5,Cmr6,Csb1,Csb2,Csb3,Csx17,Csx14,Csx10,Csx16,CsaX,Csx3,Csx1,Csx15,Csf1,Csf2,Csf3,Csf4,和Cu1966，以及它们的同系物或修饰形式。

示例性的Cas蛋白质是Cas9蛋白质或从Cas9蛋白质衍生得到的蛋白质。Cas9蛋白质获自II型CRISPR/Cas系统并且通常与保守结构共享四个关键基序。基序1，2和4是类RuvC基序，并且基序3是HNH基序。示例性的Cas9蛋白质来自产脓链球菌(Streptococcuspyogenes)，嗜热链球菌(Streptococcus thermophilus)，链球菌属(Streptococcus sp.)，金黄色葡萄球菌(Staphylococcus aureus)，拟诺卡氏菌(Nocardiopsis dassonvillei)，始旋链霉素(Streptomyces pristinaespiralis)，绿色产色链霉菌(Streptomycesviridochromogenes)，绿色产色链霉菌(Streptomyces viridochromogenes)，玫瑰链孢囊菌(Streptosporangium roseum)，玫瑰链孢囊菌(Streptosporangium roseum)，酯环酸芽孢杆菌(Alicyclobacillus acidocaldarius)，假真菌样芽孢杆菌(Bacilluspseudomycoides)，还原砸酸盐芽孢杆菌(Bacillus selenitireducens)，西伯利亚微杆菌(Exiguobacterium sibiricum)，保加利亚乳杆菌(Lactobacillus delbrueckii)，唾液乳杆菌(Lactobacillus salivarius)，海洋微颤菌(Microscilla marina)，伯克氏菌目(Burkholderiales bacterium)，Polaromonas naphthalenivorans，极单胞菌(Polaromonas sp.)，海洋固氮蓝藻(Crocosphaera watsonii)，蓝杆藻(Cyanothece sp.)，铜绿微囊藻(Microcystis aeruginosa)，聚球藻(Synechococcus sp.)，阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)，Ammonifex degensii，嗜热厌氧菌(Caldicelulosiruptorbecscii)，Candidatus Desulforudis，肉毒杆菌(Clostridium botulinum)，艰难梭菌(Clostridium difficile)，大芬戈尔德菌(Finegoldia magna)，嗜热盐碱厌氧菌(Natranaerobius thermophilus)，Pelotomaculum thermopropionicum，喜温硫杆菌(Acidithiobacillus caldus)，嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)，Allochromatium vinosum，海杆状菌(Marinobactersp.)，嗜盐亚硝化球菌(Nitrosococcushalophilus)，瓦氏亚硝化球菌(Nitrosococcuswatsoni)，河豚毒素假交替单胞菌(Pseudoalteromonashaloplanktis)，成簇细枝菌(Ktedonobacterracemifer)，调查甲烷盐菌(Methanohalobiumevestigatum)，多变鱼腥藻(Anabaenavariabilis)，泡沫节球菌(Nodularia spumigena)，念球藻(Nostoc sp.)，极大节螺藻(Arthrospira maxima)，钝顶节螺藻(Arthrospira platensis)，节旋藻(Arthrospira sp.)，鞘丝藻(Lyngbya sp.)，原型微鞘藻(Microcoleus chthonoplastes)，颤藻(Oscillatoria sp.)，Petrotogamobilis，Thermosipho africanus，Acaryochloris marina，脑膜炎双球菌(Neisseriameningitidis)或空肠弯曲菌(Campylobacter jejuni)。Cas9家族成员中的其他实例在WO2014/131833中描述，其全部内容通过引用并入本文，用于所有目的。来自化脓性链球菌(S.pyogenes)的Cas9(SpCas9)(SwissProt登录号：Q99ZW2)是示例性的Cas9蛋白质。来自金黄色葡萄糖球菌(S.aureus)的Cas9(SaCas9)(UniPort登录号：J7RUA5)是另一示例性的Cas9蛋白质。来自空肠弯曲菌(Campylobacter jejuni)的Cas9(CjCas9)(UniPort登录号为：Q0P897)是另一示例性的Cas9蛋白质。参见，例如，Kim等人,(2017)Nat.Comm.8:14500，其全部内容通过引用并入本文，用于所有目的。SaCas9比SpCas9小，并且，CjCas9比SaCas9和SpCas9小。

Cas蛋白质的另一实例是Cpf1(来自普氏菌属(Prevotella)和弗浪西斯氏菌1(Francisella 1)的CRISPR)蛋白质。Cpf1是包含与Cas9的对应结构域具有同源性的类RuvC核酸酶结构域以及Cas9的特有的富精氨酸簇的对应物的较大的蛋白质(约1300个氨基酸)。然而，Cpf1缺乏存在于Cas9蛋白质中的HNH核酸酶结构域，并且类Ruv-C结构域在Cpf1序列中是连续的，这与Cas9形成鲜明对照，Ruv-C结构域包含包括HNH结构域在内的较长的插入体。参见例如，Zetsche等人,(2015)Cell 163(3):759-771，其全部内容通过引用并入本文，用于所有目的。示例性的Cpf1蛋白质来自土拉弗朗西斯菌1(Francisella tularensis 1)，土拉弗朗西斯菌亚种novicida(Francisella tularensis subsp.novicida)，Prevotellaalbensis，毛螺旋菌科细菌MC2017 1(Lachnospiraceae bacterium MC2017 1)，丁酸弧菌(Butyrivibrio proteoclasticus)，佩莱格里尼菌科细菌GW2011_GWA2_33_10(Peregrinibacteria bacterium GW2011_GWA2_33_10)，Parcubacteria细菌GW2011_GWC2_44_17(Parcubacteria bacterium GW2011_GWC2_44_17)，Smithella sp.SCADC，氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6)，毛螺菌科细菌MA2020(Lachnospiraceaebacterium MA2020)，Candidatus Methanoplasma termitum，挑剔真杆菌(Eubacteriumeligens)，牛眼莫拉氏菌237(Moraxella bovoculi 237)，Leptospira inadai，毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006)，狗口腔红棕色单胞菌3(Porphyromonascrevioricanis 3)，解糖胨普雷沃菌(Prevotella disiens)，以及猕猴卟啉单胞菌(Porphyromonas macacae)。来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1,UniProt登录号：A0Q7Q2)是示例性的Cpf1蛋白质。

Cas蛋白质可以是野生型蛋白质(即，天然生成的那些)，修饰的Cas蛋白质(即，Cas蛋白质变体)或者野生型或修饰的Cas蛋白质的片段。Cas蛋白质也可以是关于野生型或修饰的Cas蛋白质的催化活性的活性变体或片段。关于催化活性的活性变体或片段可包含与野生型或修饰的Cas蛋白质或其部分具有至少80％,85％,90％,91％,92％,93％,94％,95％,96％,97％,98％,99％或更高的序列一致性，其中，活性变体保留了在期望的裂解位点进行切断的能力并且因此保留了切口诱导活性或双链断裂诱导活性。切口诱导活性或双链断裂诱导活性的分析方法是本领域已知的并且该分析方法通常测量在包含裂解位点的DNA底物上的Cas蛋白质的整体活性和特异性。

Cas蛋白质可被修饰为提高或降低核酸结合亲和性，核酸结合特异性和酶活性中的一种或多种。Cas蛋白质还可被修饰为改变蛋白质的任何其他活性或性质，例如稳定性。例如，Cas蛋白质的一个或多个核酸酶结构域可以被修饰、删除或灭活，或者Cas蛋白质可被截短以除去对蛋白质功能非必需的结构域或优化(例如，提高或降低)Cas蛋白质的活性或性质。

修饰的Cas蛋白质的一个实例是修饰的SpCas9-HF1蛋白质，其是产脓链球菌Cas9的高保真度变体，其带有设计为降低非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)。参见，例如，Kleinstiver等人,(2016)Nature 529(7587):490-495，其全部内容通过引用并入本文，用于所有目的。修饰的Cas蛋白质的另一实例是设计为降低脱靶效应的修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见，例如，Slaymaker等人,(2016)Science351(6268):84-88，其全部内容通过引用并入本文，用于所有目的。其他SpCas9变体包括K855A和K810A/K1003A/R1060A。

Cas蛋白质可包括至少一个核酸酶结构域，例如，DNase结构域。例如，野生型Cpf1蛋白质通常包含裂解目标DNA的双链的类RuvC结构域，其可能处于二聚结构中。Cas蛋白质还可包含至少两个核酸酶结构域，例如，DNase结构域。例如，野生型Cas9蛋白质通常包含类RuvC核酸酶结构域和类HNH核酸酶结构域。RuvC和HNH结构域可分别切割双链DNA的不同链以在DNA中产生双链断裂。参见，例如，Jinek等人,(2012)Science 337:816-821，其全部内容通过引用并入本文，用于所有目的。

核酸酶结构域中的一个或多个可被删除或发生突变，这样它们不再是功能性的或具有降低的核酸酶活性。例如，如果Cas9蛋白质中的核酸酶结构域中的一个被删除或发生突变，得到的Cas9蛋白质可被称为切口酶并且可在双链DNA中的向导RNA靶向序列处产生单链断裂，但不会产生双链断裂(即，它可裂解互补链或非互补链，但不会裂解这两者)。将Cas9转化成切口酶的突变的实例是在来自化脓性链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10将天冬氨酸盐突变为丙氨酸)突变。类似地，来自化脓性链球菌的Cas9的HNH结构域中的H939A(氨基酸位置839处组氨酸突变为丙氨酸)，H840A(氨基酸位置840处组氨酸突变为丙氨酸)或N863A(氨基酸位置N863处天冬酰胺突变为丙氨酸)可将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其他实例包括对来自嗜热链球菌(S.thermophilus)的Cas9进行的相应突变。参见，例如，Sapranauskas等人,(2011)Nucleic Acids Research39:9275-9282和WO 2013/141680，其中的每一个的全部内容通过引用并入本文，用于所有目的。这些突变可使用诸如位点定向突变形成，PCR介导的突变形成，或总基因合成之类的方法产生。产生切口酶的其他突变的实例可在例如WO 2013/176772和WO 2013/142578中找到，其中的每一个的全部内容通过引用并入本文，用于所有目的。

本领域还已知使金黄色葡萄球菌Cas9蛋白质的催化结构域中的突变失活的实例。例如，金黄色葡萄球菌Cas9酶(SaCas9)可包含位置N580的取代(例如，N580A取代)和位置D10的取代(例如，D10A取代)，从而产生核酸酶惰性Cas蛋白质。参见，例如，WO 2016/106236，其全部内容通过引用并入本文，用于所有目的。

本领域还已知使Cpf1蛋白质的催化结构域中的突变失活的实例。对于来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1)，来自氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6)的Cpf1(AsCpf1)，来自毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006)的Cpf1(LbCpf1)以及来自牛眼莫拉氏菌237(Moraxella bovoculi237)的Cpf1(MbCpf1 Cpf1)而言，这些突变可包括AsCpf1的位置908，993或1263处的突变或Cpf1直系同源物中的相应位置处的突变，或者LbCpf1的位置832，925，947或1180处的突变或Cpf1直系同源物中的相应位置处的突变。这些突变可包括例如，AsCpf1的突变D908A,E993A和D1263A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个，或LbCpf1的D832A,E925A,D947A和D1180A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个。参见，例如，US 2016/0208243，其全部内容通过引用并入本文，用于所有目的。

Cas蛋白质还可以可操作地连接至作为融合蛋白的异源多肽。例如，Cas蛋白质可融合至裂解结构域或表观遗传修饰结构域。参见，WO2014/089290，其全部内容通过引用并入本文，用于所有目的。Cas蛋白质还可融合至提供提高的或降低的稳定性的异源多肽。融合的结构域或异源多肽可位于N-末端，C-末端或Cas蛋白质内部。

作为一个实例，Cas蛋白质可融合至提供亚细胞定位的一个或多个异源多肽。这些异源多肽可包括例如：一个或多个核定位信号(NLS)，例如，用于靶向细胞核的单组分SV40NLS和/或双组分α-内输蛋白NLS，用于靶向线粒体的线粒体定位信号，ER滞留信号，等等。参见，例如，Lange等人,(2007)J.Biol.Chem.282:5101-5105，其全部内容通过引用并入本文，用于所有目的。这些亚细胞定位信号可位于Cas蛋白质的N-端，C-端或任何其他地方。NLS可包含碱性氨基酸的延伸并且可以是单组分序列或双组分序列。任选地，Cas蛋白质可包含两个或多个NLS，包括N-末端的NLS(例如，α-内输蛋白NLS或单组分NLS)和C-末端NLS(例如，SV40 NLS或双组分NLS)。Cas蛋白质还可以包含位于N-末端的两个或多个NLS和/或位于C-末端的两个或多个NLS。

Cas蛋白质还可以可操作地连接至细胞渗透结构域或蛋白转导结构域。例如，所述细胞渗透结构域可衍生自HIV-1TAT蛋白质，来自人乙型肝炎病毒的TLM细胞渗透基序，MPG，Pep-1，VP22，来自单纯性疱疹病毒的细胞渗透肽或聚精氨酸肽序列。参见，例如，WO2014/089290和WO2013/176772，其每一个的全部内容通过引用并入本文，用于所有目的。所述细胞渗透结构域可位于Cas蛋白质的N-末端，C-末端或任何其他地方。

Cas蛋白质还可以可操作地连接至易于跟踪或纯化的异源多肽，例如，荧光蛋白，纯化标签或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如，GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,ZsGreenl)，黄色荧光蛋白(例如，YFP,eYFP,Citrine,Venus,YPet,PhiYFP,ZsYellowl)，蓝色荧光蛋白(例如，eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,T-sapphire)，青色荧光蛋白(例如，eCFP,Cerulean,CyPet,AmCyanl,Midoriishi-Cyan)，红色荧光蛋白(例如，mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,Jred)，橙色荧光蛋白(例如，mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,tdTomato)和任何其他合适的荧光蛋白。标签的实例包括谷胱甘肽-S-转移酶(GST)，甲壳素结合蛋白(CBP)，麦芽糖结合蛋白，硫氧还蛋白(TRX)，聚(NANP)，串联亲和纯化(TAP)标签，myc，AcV5，AU1,AU5,E,ECS,E2,FLAG，血球凝集素(HA)，nus，Softag 1，Softag3,Strep,SBP,Glu-Glu,HSV,KT3,S,S1,T7,V5,VSV-G，组氨酸(His)，生物素羟基载体蛋白(BCCP)和钙调蛋白。

编码Cas蛋白质的核酸可以是被优化为在特定细胞或生物体中有效翻译为蛋白质的密码子。例如，编码Cas蛋白质的核酸可被修饰为取代在人细胞、非人类细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其他目标宿主细胞中相对于天然生成的多核苷酸序列具有更高的使用频率的密码子。

(3)向导RNA

“向导RNA”或“gRNA”是结合至Cas蛋白质(例如，Cas9蛋白质)并使该Cas蛋白质靶向目标DNA中的特定位置的RNA分子。向导RNA可包含两个片段：“DNA靶向片段”和“蛋白质结合片段”。“片段”包括诸如RNA中的核苷酸的连续延伸片段之类的分子的某个部分或区域。诸如Cas9的gRNA之类的一些gRNA可包含两个不同的RNA分子：“活化RNA”(例如，tracrRNA)和“靶向RNA”(例如CRISPR RNA或crRNA)。其他gRNA是单个RNA分子(单个RNA多核苷酸)，其还可称为“单分子gRNA”，“单个向导RNA”或“sgRNA”。参见，例如，WO 2013/176772,WO 2014/065596,WO 2014/089290,WO 2014/093622,WO 2014/099750,WO 2013/142578,和WO 2014/131833，其中的每一个的全部内容通过引用并入本文，用于所有目的。对于Cas9而言，例如，单个向导RNA可包含(例如通过连接体)融合至tracrRNA的crRNA。对于Cpf1而言，例如，只需要crRNA就可实现与目标序列的结合和/或裂解目标序列。术语“向导RNA”和“gRNA”包括双分子(即，模块化)gRNA和单分子gRNA。

示例性的双分子gRNA包含类crRNA(“CRISPR RNA”或“靶向RNA”或“crRNA”或“crRNA重复序列”)分子和对应的类tracrRNA(“反式激活CRISPR RNA”，或“活化RNA”或“tracrRNA”)分子。crRNA包含gRNA的DNA靶向片段(单链)和形成gRNA的蛋白质结合片段的dsRNA双倍体的一半的核苷酸延伸序列(即，crRNA尾部)。位于DNA靶向片段的下游(3’)的crRNA尾部的实例包含GUUUUAGAGCUAUGCU(SEQ ID NO:25)，基本由GUUUUAGAGCUAUGCU(SEQID NO:25)构成或由GUUUUAGAGCUAUGCU(SEQ ID NO:25)构成。本文公开的DNA靶向片段中的任一个可连接至SEQ ID NO:25的5’端以形成crRNA。

对应的tracrRNA(活化RNA)包含形成gRNA的蛋白质结合片段的dsRNA双倍体的另一半的核苷酸延伸序列。crRNA的核苷酸延伸序列与tracrRNA的核苷酸延伸序列互补并杂交以形成gRNA的蛋白质结合结构域的dsRNA双倍体。这样，每个crRNA可被认为具有对应的tracrRNA。tracrRNA序列的实例包含AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26)，基本由AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26)构成或由AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26)构成。

在既需要crRNA又需要tracrRNA的系统中，crRNA和对应的tracrRNA杂交形成gRNA。在仅需要crRNA的系统中，crRNA可以是gRNA。crRNA还提供通过杂交至相对链(即，互补链)而靶向向导RNA靶向序列的单链DNA靶向片段。如果用于在细胞内进行修饰，给定的crRNA或tracrRNA分子的提取序列可被设计为对使用了RNA分子的物种具有特异性。参见，例如，Mali等人,(2013)Science 339:823-826；Jinek等人,(2012)Science337:816-821；Hwang等人,(2013)Nat.Biotechnol.31:227-229；Jiang等人,(2013)Nat.Biotechnol.31:233-239；以及Cong等人,(2013)Science 339:819-823，上述参考文献中的每一个的全部内容通过引用并入本文，用于所有目的。

给定的gRNA的DNA-靶向片段(crRNA)包含与目标DNA中的序列(即，向导RNA靶向序列的相对链上的向导RNA识别序列的互补链)互补的核苷酸序列。gRNA的DNA靶向片段以序列特异性的方式通过杂交(即，碱基配对)与目标DNA发生相互作用。这样，DNA-靶向片段的核苷酸序列可发生改变并且决定了目标DNA中的gRNA和目标DNA发生相互作用的位置。目标gRNA的DNA-靶向片段可被修饰为与目标DNA内的任何期望的序列进行杂交。天然生成的crRNA基于CRISPR/Cas系统和生物体而不同，但是通常包含长度为21个核苷酸至72个核苷酸的靶向片段，其侧面具有长度为21个核苷酸至46个核苷酸的两个正向重复序列(DR)(参见，例如，WO 2014/131833，其全部内容通过引用并入本文，用于所有目的)。在化脓性链球菌的情况下，DR的长度为36个核苷酸并且靶向片段的长度为30个核苷酸。位于3’的DR与对应的tracrRNA互补并且与对应的tracrRNA杂交，其进而结合至Cas蛋白质。

DNA-靶向片段的长度可以为至少约12个核苷酸，至少约15个核苷酸，至少约17个核苷酸，至少约18个核苷酸，至少约19个核苷酸，至少约20个核苷酸，至少约25个核苷酸，至少约30个核苷酸，至少约35个核苷酸，至少约40个核苷酸。这样的DNA-靶向片段的长度可以为约12个核苷酸至约100个核苷酸，约12个核苷酸至约80个核苷酸，约12个核苷酸至约50个核苷酸，约12个核苷酸至约40个核苷酸，约12个核苷酸至约30个核苷酸，约12个核苷酸至约25个核苷酸，或约12个核苷酸至约20个核苷酸。例如，DNA靶向片段可以为约15个核苷酸至约25个核苷酸(例如，约17个核苷酸至约20个核苷酸或约17个核苷酸，约18个核苷酸，约19个核苷酸或约20个核苷酸)。参见，例如，US 2016/0024523，其全部内容通过引用并入本文，用于所有目的。对于来自化脓性链球菌的Cas9而言，典型的DNA-靶向片段的长度为16个核苷酸至20个核苷酸或17个核苷酸至20个核苷酸。对于来自金黄色葡萄球菌的Cas9而言，典型的DNA-靶向片段的长度为21个核苷酸至23个核苷酸。对于Cpf1而言，典型的DNA-靶向片段的长度为至少16个核苷酸或至少18个核苷酸。

TracrRNA可以是任何形式(例如，全长tracrRNA或部分活性tracrRNA)并且具有不同的长度。它们可包括初级转录体或加工过的形式。例如，tracrRNA(作为单个向导RNA的一部分或作为双分子gRNA的一部分作为单个的分子)可包含全部或部分野生型tracrRNA序列(例如，约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多)，基本由全部或部分野生型tracrRNA序列(例如，约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多)构成或由全部或部分野生型tracrRNA序列(例如，约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多)构成。来自化脓性链球菌的野生型tracrRNA序列的实例包括171个核苷酸，89个核苷酸，75个核苷酸和65个核苷酸的版本。参见，例如，Deltcheva等人,(2011)Nature471:602-607；WO2014/093661，其每一个的全部内容通过引用并入本文，用于所有目的。单个向导RNA(sgRNA)中的tracrRNA的实例包括在sgRNA的+48，+54，+67和+85版本中发现的tracrRNA片段，其中，“+n”表示多达野生型tracrRNA的+n个核苷酸被包括在sgRNA中。参见，US 8,697,359，其全部内容通过引用并入本文，用于所有目的。

DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60％(例如，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，至少97％，至少98％，至少99％，或100％)。DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60％，超过约20个连续核苷酸互补。作为实例，DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100％，目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有14个连续核苷酸互补并且其余部分的互补百分比为0％这么低。在这种情况下，DNA-靶向序列被认为长度为14个核苷酸。作为另一实例，DNA-靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100％，目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有7个连续核苷酸互补并且其余部分的互补百分比为0％这么低。在这种情况下，DNA靶向序列被认为长度为7个核苷酸。在一些向导RNA中，DNA靶向序列中的至少17个核苷酸与目标DNA互补。例如，DNA靶向序列的长度可以为20个核苷酸并且可包含与向导RNA识别序列的互补链的1个，2个或3个错配。任选地，所述错配不与前间区序列邻近基序(PAM)序列相邻(例如，错配位于DNA靶向序列的5’端或者错配远离PAM序列至少2个碱基对，至少3个碱基对，至少4个碱基对，至少5个碱基对，至少6个碱基对，至少7个碱基对，至少8个碱基对，至少9个碱基对，至少10个碱基对，至少11个碱基对，至少12个碱基对，至少13个碱基对，至少14个碱基对，至少15个碱基对，至少16个碱基对，至少17个碱基对，至少18个碱基对，或至少19个碱基对)。

gRNA的蛋白结合片段可包含彼此互补的核苷酸的两个延伸片段。蛋白结合片段的互补核苷酸进行杂交形成双链RNA双倍体(dsRNA)。目标gRNA的蛋白结合片段与Cas蛋白质发生相互作用并且gRNA通过DNA-靶向片段将结合的Cas蛋白质定向至目标DNA中的特定核苷酸序列。

单个向导RNA具有DNA靶向片段和骨架序列(即，向导RNA的蛋白结合序列或Cas结合序列)。例如，这种向导RNA具有5’DNA靶向片段和3’骨架序列。示例性的骨架序列包括如下序列，基本由如下序列构成或由如下序列构成：

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1；SEQ ID NO:27)；GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2；SEQ ID NO:6)；

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3；SEQ ID NO:7)；以及

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4；SEQ ID NO:8)。靶向任何向导RNA靶向序列的向导RNA可包括例如：位于融合至向导RNA的3’端上的示例性的向导RNA骨架序列中的任一个的向导RNA的5’端上的DNA靶向片段。也就是说，本文公开的DNA靶向片段中的任一个可连接至SEQ IDNO:27，6，7或8中的任一个的5’端以形成单个向导RNA(嵌合向导RNA)。本文其他地方公开的向导RNA版本1，2，3和4涉及分别与骨架版本1，2，3和4连接的DNA靶向片段。

向导RNA可包括提供额外的期望特性(例如，修饰的或调节的稳定性，亚细胞定位，荧光标签跟踪，蛋白质或蛋白质复合物的结合位点，等等)的修饰或序列。这些修饰的实例包括例如：5’帽(例如，7-甲基鸟苷酸帽(m7G))；3’聚腺苷酸化尾(即，3’poly(A)尾)；核糖开关序列(例如，允许由蛋白质和/或蛋白质复合物调节稳定性和/或调节可及性)；稳定性控制序列，形成dsRNA双倍体的序列(即，发夹)，将RNA定向至亚细胞位置(例如，细胞核，线粒体，叶绿体，等等)的修饰或序列；提供跟踪的修饰或序列(例如，直接偶联至荧光分子、偶联至有利于荧光检测的基团、允许进行荧光检测的序列，等等)；为蛋白质提供结合位点的修饰或序列(例如，作用于DNA上的蛋白质，包括DNA甲基转移酶，DNA脱甲基酶，组蛋白乙酰转移酶，组蛋白脱乙酰酶，等等)，以及它们的组合。修饰的其他实例包括工程化的茎环双倍体结构，工程化的凸出区域，茎环双倍体结构的工程化的发夹3’，或其任何组合。参见例如，US2015/0376586，其全部内容通过引用并入本文，用于所有目的。凸出部分可以是由类crRNA区域和最小的类tracrRNA区域构成的双倍体内的核苷酸的未配对区域。在双倍体的一侧，凸出部分可包括未配对的5’-XXY-3’，其中，X是任何嘌呤并且Y可以是可与相对链上的核苷酸形成摇摆碱基对的核苷酸，在双倍体的另一侧，凸出部分可包含未配对的核苷酸区域。

未修饰的核酸可易于发生降解。外源核酸还可诱导固有免疫反应。修饰可有助于引入稳定性并且降低免疫原性。向导RNA可包括修饰的核苷和修饰的核苷酸，包括例如下列中的一种或多种：(1)改变或取代磷酸二酯骨架连接中的未连接的磷酸盐氧中的一个或两个和/或连接的磷酸盐氧中的一个或多个；(2)改变或取代核糖中的成分，例如，改变或取代核糖上的2’羟基；(3)由脱磷酸连接体取代磷酸基团；(4)修饰或取代天然生成的碱基；(5)取代或修饰核糖-磷酸酯骨架；(6)修饰寡核苷酸的3’端或5’端(例如，除去，修饰或取代末端磷酸酯基团或基团的结合)；以及(7)修饰糖类。其他可能的向导RNA修饰包括修饰或取代尿嘧啶或聚-尿嘧啶束(poly-uracil tract)。参见，例如，WO 2015/048577和US2016/0237455，其每一个的全部内容通过引用并入本文，用于所有目的。类似的修饰可作用于Cas编码核酸，例如，Cas mRNA。

作为一个实例，向导RNA的5’或3’端的核苷酸可包括硫代磷酸键(例如，碱基可具有作为硫代磷酸基团的修饰的磷酸酯基团)。例如，向导RNA可包括位于向导RNA的5’端或3’端的2个，3个或4个末端核苷酸之间的硫代磷酸键。作为另一实例，位于向导RNA的5’端和/或3’端的核苷酸可具有2’-O-甲基修饰。例如，向导RNA可包括位于向导RNA的5’端和/或3’端(例如，5’端)的2个，3个或4个末端核苷酸的2’-O-甲基修饰。参见，例如，WO 2017/173054A1和Finn等人,(2018)Cell Reports 22:1-9，其每一个的全部内容通过引用并入本文，用于所有目的。在一个特定的实例中，向导RNA包括位于前三个5’和3’末端RNA残基处的2’-O甲基类似物和3’-硫代磷酸核苷酸间键合。在另一特定实例中，向导RNA被修饰为由2’-O-甲基类似物取代不与Cas9蛋白质发生相互作用的所有2’OH基团，并且，与Cas9具有最小相互作用的向导RNA的尾部区域被5’和3’硫代磷酸核苷酸间键修饰。参见，例如，Yin等人,(2017)Nat.Biotech.35(12):1179-1187，其全部内容通过引用并入本文，用于所有目的。

本文提供任何形式的向导RNA。例如，以RNA的形式提供gRNA，作为两个分子(不同的crRNA和tracrRNA)或作为一个分子(sgRNA)，并且任选地，提供与Cas蛋白质的复合物形式的RNA。gRNA还可以以编码gRNA的DNA的形式提供。编码gRNA的DNA可编码单个RNA分子(sgRNA)或不同的RNA分子(例如，不同的crRNA和tracrRNA)。在后一种情况下，编码gRNA的DNA可作为DNA分子或作为分别编码crRNA和tracrRNA的不同的DNA分子提供。

当以DNA的形式提供gRNA时，gRNA可在细胞中瞬时表达，条件性表达或组成性表达。编码gRNA的DNA可稳定地整合至细胞的基因组中并且可操作地连接至在细胞中具有活性的启动子。可选地，编码gRNA的DNA可以可操作地连接至表达构建体中的启动子。例如，编码gRNA的DNA可位于包含异源核酸的载体中，例如，编码Cas蛋白质的核酸。可选地，编码gRNA的DNA可以位于载体中或质粒中，所述载体或质粒从包含编码Cas蛋白质的核酸的载体中分离出来。可用于这种表达构建体的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子：真核细胞、人细胞、非人类细胞、哺乳动物细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如，条件性启动子，可诱导启动子，组成性启动子或组织特异性启动子。这些启动子还可以是例如，双向启动子。合适的启动子的特定实例包括RNA聚合酶III启动子，例如，人U6启动子，大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。

可选地，gRNA可通过各种不同的其他方法制备。例如，gRNA可使用例如T7 RNA聚合酶通过体外转录进行制备(参见，例如，WO2014/089290和WO 2014/065596，其每一个的全部内容通过引用并入本文，用于所有目的)。向导RNA还可以是通过化学合成制备的通过合成方法产生的分子。

(4)向导RNA识别序列和向导RNA靶向序列

术语“向导RNA识别序列”包括存在于如下目标DNA中的核酸序列，只要存在足够的结合条件所述目标DNA将会结合gRNA的DNA靶向片段。本文使用的术语向导RNA识别序列包含目标双链DNA的两个链(即，与向导RNA杂交的互补链上的序列以及与前间区序列邻近基序(PAM)邻近的非互补链上的对应序列)。本文使用的术语“向导RNA靶向序列”具体地是指与PAM邻近的非互补链上的序列(即，PAM的上游或5’)。也就是说，向导RNA靶向序列是指与在互补链上与向导RNA杂交的序列对应的非互补链上的序列。向导RNA靶向序列等同于向导RNA的DNA靶向片段，但是由胸腺嘧啶替代了尿嘧啶。作为一个实例，Cas9酶的向导RNA靶向序列是指在与5’-NGG-3’PAM邻近的非互补链上的序列。向导RNA识别序列包括设计为与向导RNA具有互补性的序列，其中，向导RNA识别序列的互补链和向导RNA的DNA靶向序列之间的杂交促进CRISPR复合物的形成。只要具有足以导致杂交并促进CRISPR复合物的形成的互补性，就不必要求具有完全互补。向导RNA识别序列或向导RNA靶向序列还包括Cas蛋白质的裂解位点，其在下文中详细描述。向导RNA识别序列或向导RNA靶向序列可包含任何多核苷酸，其可位于例如细胞的细胞核内或细胞质内或位于细胞的细胞器(例如线粒体或叶绿体)内。

目标DNA内的向导RNA识别序列可被Cas蛋白质或gRNA靶定(即，与Cas蛋白质或gRNA结合，或与Cas蛋白质或gRNA杂交或与Cas蛋白质或gRNA互补)。合适的DNA/RNA结合条件包括通常存在于细胞中的生理条件。本领域已知其他合适的DNA/RNA结合条件(例如，无细胞系统中的条件)(参见，例如，Molecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook等人,Harbor Laboratory Press 2001)，其全部内容通过引用并入本文，用于所有目的)。与Cas蛋白或gRNA互补并杂交的目标DNA的链可被称为“互补链”，并且与“互补链”互补的目标DNA的链(因此，其不与Cas蛋白质或gRNA互补)可被称为“非互补链”或“模板链”。

Cas蛋白质可在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列的内部或外部的位点处裂解核酸。“裂解位点”包括Cas蛋白质产生单链断裂或双链断裂的核酸位置。例如，CRISPR复合物(包含与向导RNA识别序列的互补链杂交并与Cas蛋白复合的gRNA)的形成可导致在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列中或附近(例如，距离所述核酸序列的1个，2个，3个，4个，5个，6个，7个，8个，9个，10个，20个，50个或更多个碱基对内)发生一个链的断裂或两个链的断裂。如果裂解位点位于待与gRNA的DNA靶向片段结合的核酸序列外部，那么，裂解位点仍被认为位于“向导RNA识别序列”内或“向导RNA靶向序列”内。裂解位点可仅位于核酸的一个链上或位于核酸的两个链上。裂解位点可位于核酸的两个链上的相同位置(产生平端)或位于每个链上的不同位点(产生交错端(即，悬挂))。例如，可通过使用两个Cas蛋白质产生交错端，每个Cas蛋白质在不同链上的不同裂解位点产生单个链断裂，从而产生双链断裂。例如，第一切口酶可在双链DNA(dsDNA)的第一链上产生单链断裂并且第二切口酶可在dsDNA的第二链上产生单链断裂，这就产生了悬挂序列。在一些情况下，第一链上的切口酶的向导RNA识别序列或向导RNA靶向序列与第二链上的切口酶的向导RNA识别序列或向导RNA靶向序列分隔开至少2个碱基对，至少3个碱基对，至少4个碱基对，至少5个碱基对，至少6个碱基对，至少7个碱基对，至少8个碱基对，至少9个碱基对，至少10个碱基对，至少15个碱基对，至少20个碱基对，至少25个碱基对，至少30个碱基对，至少40个碱基对，至少50个碱基对，至少75个碱基对，至少100个碱基对，至少250个碱基对，至少500个碱基对，或至少1,000个碱基对。

Cas蛋白质对目标DNA的位点特异性结合和/或裂解可发生在不同的位置，这由(i)gRNA和目标DNA之间的碱基对互补性和(ii)目标DNA中的被称为前间区序列邻近基序(PAM)的短基序确定。PAM可位于与向导RNA杂交的链相对的非互补链上的向导RNA靶向序列的侧面。任选地，向导RNA靶向序列的侧面可具有PAM的3’端。可选地，向导RNA靶向序列的侧面可具有PAM的5’端。例如，Cas蛋白质的裂解位点可位于PAM序列的上游或下游约1个碱基对至约10个碱基对或约2个碱基对至约5碱基对(例如，3个碱基对)的位置。在一些情况下(例如，当使用来自化脓性链球菌的Cas9或使用紧密相关的Cas9时)，非互补链的PAM序列可以是5’-N₁GG-3’，其中N₁是任何DNA核苷酸并且就是目标DNA的非互补链的向导RNA识别序列的3’(即，就是向导RNA靶向序列的3’)。这样，互补链的PAM序列可以是5’-CCN₂-3’，其中，N₂是任何DNA核苷酸并且就是目标DNA的互补链的向导RNA识别序列的5’。在一些这样的情况下，N₁和N₂可以是互补的并且N₁-N₂碱基对可以是任何碱基对(例如，N₁＝C并且N₂＝G，N₁＝G并且N₂＝C；N₁＝A并且N₂＝T；或N₁＝T,并且N₂＝A)。在Cas9来自金黄色葡萄糖球菌的情况下，PAM可以是NNGRRT或NNGRR，其中，N可以是A,G,C,或T，并且R可以是G或A。在Cas9来自空肠弯曲菌的情况下，PAM可以是例如NNNNACAC或NNNNRYAC，其中，N可以是A,G,C,或T，并且R可以是G或A。在一些情况(例如，对于FnCpf1而言)下，PAM序列可以是5’端的上游并且具有序列5’-TTN-3’。

除了PAM序列之外，下文还提供向导RNA靶向序列的实例。例如，向导RNA靶向序列可以是就在由Cas9蛋白质识别的NGG基序之前的20个核苷酸的DNA序列。这些向导RNA靶向序列连同PAM序列的实例是GN₁₉NGG(SEQ ID NO:9)或N₂₀NGG(SEQ ID NO:10)。参见，例如，WO2014/165825，其全部内容通过引用并入本文，用于所有目的。5’端的鸟嘌呤可通过RNA聚合酶促进细胞内的转录。向导RNA靶向序列连同PAM序列的其他实例可包括5’端的两个鸟嘌呤核苷酸(例如，GGN₂₀NGG，SEQ ID NO:11)以通过T7聚合酶促进体外有效转录。参见，例如，WO2014/065596，其全部内容通过引用并入本文，用于所有目的。其他向导RNA靶向序列连同PAM序列的长度可为SEQ ID NO:9-11的4个核苷酸至22个核苷酸，其包括5’G或GG以及3’GG或NGG。其他向导RNA靶向序列的长度为SEQ ID NO:9-11的14个核苷酸至20个核苷酸。

向导RNA识别序列或向导RNA靶向序列可以是细胞内源的或外源性的任何核酸序列。向导RNA识别序列或向导RNA靶向序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如，调节性序列)或可包括这两者。

B.包含Cas表达盒的细胞和非人类动物

本文还提供包含本文所述的Cas表达盒的细胞和非人类动物。所述Cas表达盒可稳定地整合至细胞或非人类动物的基因组(即，整合至染色体)或者其可位于染色体的外部(例如，染色体外复制DNA)。任选地，Cas表达盒稳定地整合至基因组。稳定整合的Cas表达盒可以随机地整合至非人类动物的基因组(即，转基因的)，或其可整合至非人类动物的基因组的预定区域(即，敲入)。任选地，Cas表达盒稳定地整合至基因组的预定区域，例如安全港基因座。稳定整合有Cas表达盒的目标基因组基因座对于Cas表达盒而言可以是杂合的，或者对于Cas表达盒而言可以是纯合的。双倍体生物体在每个基因组基因座处具有两个等位基因。每对等位基因代表特定基因组基因座的基因分型。如果在特定基因座处具有两个等同的等位基因，那么基因分型被描述为纯合的，如果在特定基因座处的两个等位基因是不同的，那么基因分型被描述为杂合的。

本文提供的细胞可以是例如，真核细胞，其包括例如：真菌细胞(例如，酵母)，植物细胞，动物细胞，哺乳动物细胞，非人类哺乳动物细胞和人类细胞。术语“动物”包括哺乳动物，鱼类和鸟类。哺乳动物细胞可以是例如：非人类哺乳动物细胞，人类细胞，啮齿动物细胞，大鼠细胞，小鼠细胞或仓鼠细胞。其他非人类哺乳动物包括例如：非人类灵长动物，猴子，猿猴，猫，狗，兔，马，公牛，鹿，野牛，家畜(例如，牛科动物，例如，奶牛，阉牛等等；绵羊属动物，例如，绵羊，山羊等等，以及猪科动物，例如，猪和野猪)。鸟类包括例如：鸡，火鸡，鸵鸟，鹅，鸭子等等。本文还包括家养动物和农业动物。术语“非人类”排除了人类。

细胞还可以是任何类型的未分化的状态或分化的状态。例如，细胞可以是全能细胞，多能细胞(例如，人多能细胞或非人类多能细胞，例如，小鼠胚胎干(ES)细胞或大鼠ES细胞)或者非多能细胞。全能细胞包括可产生任何细胞类型的未分化的细胞，并且多能细胞包括具有发育成多于一种分化的细胞类型的能力的未分化的细胞。这些多能和/或全能细胞可以是例如，ES细胞或类ES细胞，例如，诱导多能性干(iPS)细胞。ES细胞包括胚胎衍生的全能细胞或多能细胞，其能够有助于在引入胚胎中之后使胚胎发育成任何组织。ES细胞可衍生自囊胚的内部细胞团并且能够分化成三种脊椎动物胚层(内胚层，外胚层和中胚层)中的任一胚层的细胞。

人多能细胞的实例包括人ES细胞，人成体干细胞，发育限制的人祖细胞，以及人诱导多能性干(iPS)细胞(例如，始发态人iPS细胞和原始人iPS细胞)。诱导多能干细胞包括从分化的成体细胞直接衍生得到的多能干细胞。人iPS细胞可通过向细胞中引入特定的重编程因子组而生成，所述重编程因子组可包括例如，Oct3/4，Sox家族转录因子(例如，Sox1，Sox2，Sox3，Sox15)，Myc家族转录因子(例如，c-Myc，1-Myc，n-Myc)，Krüppel-样家族(KLF)转录因子(例如，KLF1，KLF2，KLF4，KLF5)，和/或相关转录因子，例如，NANOG，LIN28，和/或Glis1。人iPS细胞还可例如通过使用miRNA，模拟转录因子的作用的小分子或细胞谱系特异性分子(lineage specifier))而生成。人iPS细胞通过其分化成三种脊椎动物胚层(例如，内胚层，外胚层或中胚层)中的任何细胞的能力来表征。人iPS细胞还可通过其在合适的体外培养条件下无限繁殖的能力来表征。参见，例如，Takahashi and Yamanaka(2006)Cell126:663-676，该参考文献的全部内容通过引用并入本文，用于所有目的。始发态人ES细胞和始发态人iPS细胞包括表达与植入后的外胚层细胞的特性类似的特性并且进行细胞谱系特异性化和分化的细胞。原始人ES细胞和原始人iPS细胞包括表达与植入前的胚胎的内部细胞团的ES细胞的特性类似的特性并且不进行细胞谱系特异性化的细胞。参见，例如，Nichols and Smith(2009)Cell Stem Cell 4:487-492，该参考文献的全部内容通过引用并入本文，用于所有目的。

本文提供的细胞还可以是生殖细胞(例如，精子或卵细胞)。所述细胞可以是有丝分裂感受态细胞或有丝分裂惰性细胞，减数分裂感受态细胞或减数分裂惰性细胞。类似地，细胞还可以是初级体细胞或非初级体细胞的细胞。体细胞包括不是配子，生殖细胞，配子母细胞或未分化的干细胞的任何细胞。例如，细胞可以是肝细胞，肾脏细胞，造血细胞，内皮细胞，上皮细胞，成纤维细胞，间充质细胞，角化细胞，血细胞，黑素细胞，单核细胞，单核细胞，单核细胞前体，B细胞，红细胞-巨核细胞，嗜酸性粒细胞，巨噬细胞，T细胞，胰岛β细胞，外分泌细胞，胰腺祖细胞，内分泌祖细胞，脂肪细胞，前脂肪细胞，神经细胞，胶质细胞，神经干细胞，神经细胞，成肝细胞(hepatoblasts)，肝细胞，心肌细胞，骨骼肌成肌细胞，平滑肌细胞，导管细胞，腺泡细胞，α细胞，β细胞，δ细胞，PP细胞，胆管上皮细胞，白色或棕色脂肪细胞，或视细胞(例如，小梁网细胞，视网膜色素上皮细胞，视网膜微血管内皮细胞，视网膜周细胞，结膜上皮细胞，结膜成纤维细胞，虹膜色素上皮细胞，角膜细胞，晶状体上皮细胞，非色素纤毛上皮细胞，眼脉络成纤维细胞，感光细胞，神经节细胞，双极细胞，水平细胞或无长突细胞)。

本文提供的合适的细胞还包括初级细胞。初级细胞包括直接从生物体，器官或组织中分离出来的细胞或细胞培养物。初级细胞包括既未转化的也非永生的细胞。它们包括自生物体，器官或组织获得的任何细胞，所述细胞先前没有在组织培养中进行传代或先前已经在组织培养中进行了传代但是无法在组织培养中进行无限传代。这些细胞可通过常规技术进行分离并且包括例如：体细胞，造血细胞，内皮细胞，上皮细胞，成纤维细胞，间充质细胞，角化细胞，黑素细胞，单核细胞，单核细胞，脂肪细胞，前脂肪细胞，神经细胞，胶质细胞，成肝细胞，骨骼肌成肌细胞，和平滑肌细胞。例如，初级细胞可衍生自结缔组织，肌肉组织，神经系统组织或上皮组织。

本文提供的其他合适的细胞包括非永生的细胞。非永生的细胞包括来自多细胞生物体的细胞，所述多细胞生物体通常不会无限繁殖但是由于突变或发生改变其逃避了正常的细胞老化而能够继续进行分化。所述突变或改变可以自然发生或有意诱导。非永生的细胞的实例包括中国仓鼠卵巢(CHO)细胞，人胚胎肾脏细胞(例如，HEK293细胞或293T细胞)，以及小鼠胚胎成纤维细胞(例如，3T3细胞)。本领域熟知多种类型的非永生细胞。非永生细胞或初级细胞包括通常用于培养或表达重组基因或蛋白质的细胞。

本文提供的细胞还包括单细胞期胚胎(即，已受精的卵细胞或受精卵)。这种单细胞期胚胎可来自于任何遗传背景(例如，小鼠BALB/c，小鼠C57BL/6，小鼠129，或它们的组合)，可以是新鲜的或冷冻的并且可源自于自然繁殖或体外受精。

本文提供的细胞可以是正常的健康细胞或可以是患病的或带有突变的细胞。

包含本文描述的Cas表达盒的非人类动物可由本文其他地方描述的方法产生。术语“动物”包括哺乳动物，鱼类和鸟类。哺乳动物包括例如：人类，非人类灵长类动物，猴子，猿猴，猫，狗，马，公牛，鹿，野牛，绵羊，兔，啮齿动物(例如，小鼠，大鼠，仓鼠以及豚鼠)以及家畜(例如，牛科动物，例如，奶牛和阉牛，绵羊科动物，例如，绵羊和山羊，以及猪科动物，例如，猪和野猪)。鸟类包括例如：鸡，火鸡，鸵鸟，鹅以及鸭子。本文还包括家养动物和农业动物。术语“非人类动物”排除了人类。优选的非人类动物包括例如：啮齿动物，例如，小鼠和大鼠。

非人类动物可来自于任何遗传背景。例如，合适的小鼠可来自于129种系，C57BL/6种系，129种系和C57BL/6种系的混合，BALB/c种系，或Swiss Webster种系。129种系的实例包括129P1,129P2,129P3,129X1,129S1(例如，129S1/SV,129S1/Svlm),129S2,129S4,129S5,129S9/SvEvH,129S6(129/SvEvTac),129S7,129S8,129T1,和129T2。参见，例如，Festing等人,(1999)Mammalian Genome 10(8):836，其全部内容通过引用并入本文，用于所有目的。C57BL种系的实例包括C57BL/A,C57BL/An,C57BL/GrFa,C57BL/Kal_wN,C57BL/6,C57BL/6J,C57BL/6ByJ,C57BL/6NJ,C57BL/10,C57BL/10ScSn,C57BL/10Cr,和C57BL/Ola。合适的小鼠还可来自于前述129种系和前述C57BL/6种系的混合(例如，50％129和50％C57BL/6)。类似地，合适的小鼠可来自于前述129种系的混合或前述BL/6种系的混合(例如，129S6(129/SvEvTac)种系)。

类似地，大鼠可来自于任何大鼠种系，包括例如，ACI大鼠种系，Dark Agouti(DA)大鼠种系，Wistar大鼠种系，LEA大鼠种系，Sprague Dawley(SD)大鼠种系或Fischer大鼠种系(例如，Fisher F344或Fisher F6)。大鼠还可获自于衍生自上述两种或多种种系的混合的种系。例如，合适的大鼠可获自DA种系或ACI种系。ACI大鼠种系被表征为具有黑色刺豚鼠，其具有白色腹部和足部以及RT1^av1单体型。这些种系可获自包括Harlan实验室在内的多种不同的来源。Dark Agouti(DA)大鼠种系被表征为具有刺豚鼠外表和RT1^av1单体型。这些大鼠获自包括Charles River和Harlan实验室在内的多种不同的来源。在一些情况下，合适的大鼠可来自同系交配大鼠种系。参见例如，US2014/0235933，其全部内容通过引用并入本文，用于所有目的。

C.目标基因组基因座

本文描述的Cas表达盒可基因组整合至细胞或非人类动物中的目标基因组基因座处。可使用任何能够表达基因的目标基因组基因座。

其中可稳定地整合有Cas表达盒的目标基因组基因座的实例是非人类动物的基因组中的安全港基因座。整合的外源DNA和宿主基因组之间的相互作用可限制整合的可靠性和安全性并且可产生明显的表型作用，该表型作用不是由于靶定的基因修饰而产生的，但是其由于在周围的内源基因上产生的无意的整合作用而产生。例如，随机插入的转基因可经历位置效应和沉默，使得其表达不可靠并且不可预测。同样，将外源DNA整合至染色体基因座可影响周围内源基因和染色质，从而改变细胞行为和表型。安全港基因座包括染色体基因座，其中，转基因或其他外源核酸插入体可在所有目标组织中稳定且可靠地表达，不会明显地改变细胞行为或表型(即，不会对宿主细胞产生任何有害作用)。参见，例如，Sadelain等人,(2012)Nat.Rev.Cancer 12:51-58，其全部内容通过引用并入本文，用于所有目的。任选地，安全港基因座是插入的基因序列的表达不被任何来自邻近基因的通读表达扰动的基因座。例如，安全港基因座可包括如下染色体基因座，其中，外源DNA可以以可预见的方式整合至其中并且发挥作用而不会不利地影响内源基因结构或表达。安全港基因座可包括基因外区域或基因内区域，例如，非必需的、非必要的或可被中断而不会产生明显的表型后果的基因内的基因座。

例如，人体内的Rosa26基因座及其等同物在所有组织中提供开放的染色质结构并且在胚胎发育过程中以及成人体内泛表达。参见，例如，Zambrowicz等人,(1997)Proc.Natl.Acad.Sci.USA 94:3789-3794，该参考文献的全部内容通过引用并入本文，用于所有目的。此外，Rosa26基因座可被高效靶定并且Rosa26基因的中断不会产生明显表型。安全港基因座的其他实例包括CCR5，HPRT，AAVS1和白蛋白。参见，例如，美国专利US7,888,121；US7,972,854；US7,914,796；US7,951,925；US8,110,379；US8,409,861；US8,586,526，以及美国专利公开US2003/0232410；US2005/0208489；US2005/0026157；US2006/0063231；US2008/0159996；US2010/00218264；US2012/0017290；US2011/0265198；US2013/0137104；US2013/0122591；US2013/0177983；US2013/0177960；以及US2013/0122591，上述美国专利以及美国专利公开中的每一个的全部内容通过引用并入本文，用于所有目的。安全港基因座(例如，Rosa26基因座)的双等位基因的靶定不会产生阴性结果，因此，不同的基因或报告体可被靶定至两个Rosa26等位基因。在一个实例中，Cas表达盒被整合至Rosa26基因座的内含子(例如，Rosa26基因座的第一内含子)中。

D.重组酶删除的非人类动物(Recombinase Deleter Non-Human Animals)

包含Cas表达盒的细胞或非人类动物可还包含重组酶表达盒，其驱动位点特异性重组酶的表达，其中，所述Cas表达盒包含位于侧面具有被本文所述的位点特异性重组酶识别的重组酶识别位点的聚腺苷酸化信号或转录终止子下游的Cas编码序列。位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶，其中，单个核酸中的两个重组位点在物理上被分隔开或者两个重组位点位于不同的核酸上。重组酶的实例包括Cre，Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei，其中，编码Cre重组酶的两个外显子被内含子分隔开以防止其在原核细胞中的表达。这样的重组酶可还包含细胞核定位信号以促进定位至细胞核(NLS-Crei)。重组酶识别位点包括由位点特异性重组酶识别的并且可用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包括FRT,FRT11,FRT71,attp,att,rox和lox位点(例如，loxP,lox511,lox2272,lox66,lox71,loxM2,和lox5171)。

Cas表达盒和重组酶表达盒可以整合至不同的目标基因组基因座，或者它们可被基因组整合至相同的目标基因座(例如，Rosa26基因座，例如，整合在Rosa26基因座的第一内含子中)。例如，细胞或非人类动物对于Cas表达盒和重组酶表达盒中的每一个而言可以是杂合的，其中，目标基因组基因座中的一个等位基因包括Cas表达盒，并且目标基因组基因座的另一等位基因包含重组酶表达盒。

重组酶表达盒中的重组酶基因可以可操作地连接至任何合适的启动子。启动子的实例在本文的其他地方公开。例如，启动子可以是组织特异性启动子(例如，用于肝脏特异性表达的白蛋白启动子或用于胰腺特异性表达的胰岛素2启动子)或发育阶段特异性启动子。这些启动子提供的优势在于Cas的表达可以在期望的组织中被选择性地活化或者仅在期望的发育阶段被选择性地活化，从而降低了Cas介导体内毒性的可能。用于小鼠重组酶删除株(recombinase delete strain)的示例性的启动子的非限定性列表在表2中提供。

表2.在小鼠重组酶删除株中使用的示例性的启动子

III.评价CRISPR/Cas的体内活性的方法

本文提供各种不同的用于评价CRISPR/Cas递送至活体动物的组织和器官以及用于评价CRISPR/Cas在活体动物的组织和器官中的活性的方法。这些方法利用包含本文其他地方描述的Cas表达盒的非人类动物。

A.测试CRISPR/Cas体内或离体修饰目标基因组基因座的能力的方法

本文提供各种不同的使用本文所述的包括Cas表达盒的非人类动物评价CRISPR/Cas切口酶或核酸酶体内修饰目标基因组基因座的能力的方法。这些方法可包括：(a)向所述非人类动物体内引入设计为靶向目标基因组基因座的向导RNA靶向序列的向导RNA，以及(b)评价对目标基因座的修饰。当向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座，并且Cas/向导RNA复合物裂解了向导RNA靶向序列，触发细胞进行修复(例如，如果不存在供体序列的话，通过非同源末端连接)时，诱导对目标基因组基因座的修饰。

任选地，可引入两个或多个向导RNA，其每一个被设计为靶向目标基因组基因座中的不同向导RNA靶向序列。例如，两个向导RNA可被设计为切除这两个向导RNA靶向序列之间的基因组序列。在第一向导RNA与Cas蛋白质形成复合物且使Cas定向至目标基因组基因座，第二向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座，第一Cas/向导RNA复合物裂解第一向导RNA靶向序列并且第二Cas/向导RNA复合物裂解第二向导RNA靶向序列，从而切除介入的序列时，诱导对目标基因组基因座的修饰。可选地，可引入两个或多个向导RNA，其中的每一个被设计为靶向不同基因组基因座的不同向导RNA靶向序列(即，复用)。

任选地，向所述非人类动物体内引入能够与目标基因组基因座重组并且修饰目标基因组基因座的外源供体核酸。任选地，Cas蛋白质可栓系于本文其他地方描述的外源供体核酸。任选地，可引入两个或多个外源供体核酸，其中的每一个能够与不同的目标基因组基因座重组并且修饰不同的目标基因组基因座。例如，当向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座，Cas/向导RNA复合物裂解了向导RNA靶向序列并且目标基因组基因座与外源供体核酸重组以修饰目标基因组基因座时，将会诱导对目标基因组基因座的修饰。所述外源供体核酸可与目标基因组基因座通过例如同源定向修复(HDR)或通过NHEJ介导的插入进行重组。可使用任何类型的外源供体核酸，其实例在本文的其他地方提供。

同样，本文提供的用于评价CRISPR/Cas体内活性的各种不同的方法还可使用包括本文其他地方描述的Cas表达盒的细胞评价CRISPR/Cas的离体活性。

向导RNA和任选的外源供体核酸可通过本文其他地方公开的任何递送方法(例如，AAV,LNP或HDD)以及任何给药途径被引入细胞或非人类动物。在特定的方法中，向导RNA通过AAV-介导的递送进行递送。例如，当靶定肝脏时，可使用AAV8。

用于评价对目标基因组基因座的修饰的方法在本文其他地方提供并且是熟知的。对目标基因组基因座的修饰的评价可在本文其他地方公开的任何细胞类型，任何组织类型或任何器官类型中进行。在一些方法中，对目标基因组基因座的修饰的评价在肝细胞中进行(例如，评价肝细胞中目标基因组基因座表达的分泌的蛋白质的血清水平)。例如，目标基因组基因座包括目标基因并且评价可包括测量目标基因的表达或由目标基因编码的蛋白质的活性。可选地或此外，评价可包括对分离自非人类动物的一种或多种细胞中的目标基因组基因座进行测序。评价可包括从非人类动物中分离目标器官或组织以及评价目标器官或组织中的对目标基因组基因座的修饰。评价还可包括评价对目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰。类似地，评价可包括从非人类动物中分离非目标器官或组织(例如，两种或多种非目标器官或组织)以及评价对非目标器官或组织中的目标基因组基因座的修饰。

(1)外源供体核酸

本文公开的方法和组合物利用外源供体核酸修饰目标基因组基因座，随后采用Cas蛋白裂解所述目标基因组基因座。在这些方法中，Cas蛋白质裂解目标基因组基因座以产生单链断裂(切口)或双链断裂，并且外源供体核酸通过非同源末端连接(NHEJ)介导的连接或通过同源定向修复事件重组目标基因组基因座。任选地，采用外源供体核酸进行修复除去或干扰向导RNA靶向序列或Cas裂解位点，使得已被靶定的等位基因无法被Cas蛋白质再次靶定。

外源供体核酸可包含脱氧核糖核酸(DNA)或核糖核酸(RNA)，它们可以是单链的或双链的，并且它们可以是线性形式或环状形式。例如，外源供体核酸可以是单链寡脱氧核苷酸(ssODN)。参见，例如，Yoshimi等人,(2016)Nat.Commun.7:10431，其全部内容通过引用并入本文，用于所有目的。示例性的外源供体核酸的长度为约50个核苷酸至约5kb，约50个核苷酸至约3kb，或约50个核苷酸至约1,000个核苷酸。其他示例性的外源供体核酸的长度为约40个核苷酸至约200个核苷酸。例如，外源供体核酸的长度可以为约50-60个核苷酸，60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-200个核苷酸。可选地，外源供体核酸的长度可以为约50-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。可选地，外源供体核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb。可选地，外源供体核酸的长度可以为例如不超过5kb，4.5kb，4kb，3.5kb，3kb，2.5kb，2kb，1.5kb，1kb，900个核苷酸，800个核苷酸，700个核苷酸，600个核苷酸，500个核苷酸，400个核苷酸，300个核苷酸，200个核苷酸，100个核苷酸，或50个核苷酸。外源供体核酸(例如，靶向载体)还可以更长。

在一个实例中，外源供体核酸是长度为约80个核苷酸至约200个核苷酸的ssODN。在另一实例中，外源供体核酸是长度为约80个核苷酸至约3kb的ssODN。这样的ssODN可具有同源臂，例如，其长度为约40个核苷酸至约60个核苷酸。这样的ssODN还可具有例如长度为约30个核苷酸至100个核苷酸的同源臂。所述同源臂可以是对称的(例如，每个同源臂的长度均为40个核苷酸或60个核苷酸)或所述同源臂可以是非对称的(例如，一个同源臂的长度为36个核苷酸，另一同源臂的长度为91个核苷酸)。

外源供体核酸可包括提供额外的理想特性(例如，改良的或调节的稳定性，采用荧光标记跟踪或检测，用于蛋白质或蛋白质复合物的结合位点，等等)的修饰或序列。外源供体核酸可包含一个或多个荧光标记，纯化标签，表位标签或其组合。例如，外源供体核酸可包含一个或多个荧光标记(例如，荧光蛋白或其他荧光团或染料)，例如，至少一个荧光标记，至少2个荧光标记，至少3个荧光标记，至少4个荧光标记或至少5个荧光标记。示例性的荧光标记包括诸如荧光素(例如，6-羧基荧光素(6-FAM))之类的荧光团，德克萨斯红，HEX，Cy3，Cy5，Cy5.5，Pacific Blue，5-(和6-)-羧基四甲基罗丹明(TAMRA)和Cy7。用于标记寡核苷酸的多种荧光染料是商业上可获得的(例如，可获自Integrated DNA Technologies)。这些荧光标记(例如，内部荧光标记)可用于例如检测外源供体核酸，所述外源供体核酸已直接整合至具有与外源供体核酸的末端相容的凸出端的裂解的目标核酸。标记或标签可位于外源供体核酸内的5’端，3’端或位于外源供体核酸内部。例如，外源供体核酸可以在5’端与来自Integrated DNA Technologies的IR700荧光团(

700)偶联。

外源供体核酸可还包含核酸插入体，该核酸插入体包括待整合至目标基因组基因座的DNA片段。核酸插入体在目标基因组基因座处的整合可导致将目标核酸序列添加至目标基因组基因座，删除目标基因组基因座处的目标核酸序列或取代目标基因组基因座处的目标核酸序列(即，删除和插入)。一些外源供体核酸被设计为在目标基因组基因座处插入核酸插入体而不会在目标基因组基因座处产生任何相应的删除。其他外源供体核酸被设计为删除目标基因组基因座处的目标核酸序列而不会产生核酸插入体的任何相应插入。其他外源供体核酸被设计为删除目标基因组基因座处的目标核酸序列并且使用核酸插入体将其取代。

在目标基因组基因座处被删除和/或取代的核酸插入体或相应核酸可具有各种不同的长度。目标基因组基因座处的被删除和/或取代的示例性的核酸插入体或相应的核酸的长度为约1个核苷酸至约5kb或约1个核苷酸至约1,000个核苷酸。例如，在目标基因组基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-120个核苷酸。同样，目标基因组基因座处的被删除和/或取代的核酸插入体或相应核酸的长度可以为1-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。同样，在目标基因组基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb，或者更长。

核酸插入体可包含与取代靶定的所有序列或部分序列同源或直系同源的序列。例如，核酸插入体可包含如下序列：该序列与目标基因组基因座处取代靶定的序列相比包含一个或多个点突变(例如，1个，2个，3个，4个，5个或更多)。任选地，这些点突变可在编码的多肽中产生保守氨基酸取代(例如，谷氨酸[Glu,E]取代天冬氨酸[Asp,D])。

(2)用于非同源末端连接介导的插入的供体核酸

一些外源供体核酸在5’端和/或3’端具有短单链区域，其与目标基因组基因座处由Cas-蛋白介导的裂解产生的一个或多个悬挂互补。这些悬挂还可被称为5’和3’同源臂。例如，一些外源供体核酸在5’端和/或3’端具有短单链区域，其与由目标基因组基因座处的5’和/或3’目标序列的Cas蛋白介导的裂解产生的一个或多个悬挂互补。一些这样的外源供体核酸具有仅位于5’端或仅位于3‘端的互补区域。例如，一些这样的外源供体核酸具有仅位于5’端与目标基因组基因座处的5’目标序列产生的悬挂互补的互补区域或具有仅位于3’端与目标基因组基因座处的3’目标序列产生的悬挂互补的互补区域。其他这样的外源供体核酸在5’端和3’端均具有互补区域。例如，其他这样的外源供体核酸具有位于5’和3’这两端的分别与目标基因组基因座处的Cas介导的裂解产生的第一和第二悬挂互补的互补区域。例如，如果外源供体核酸是双链的，那么单链互补区域可从供体核酸的顶部链的5’端和供体核酸的底部链的5’端延伸出来，从而在每一端产生5’悬挂。可选地，单链互补区域可从供体核酸的顶部链的3’端和模板的底部链的3’端延伸出来，从而产生3’悬挂。

互补区域可具有任何足以促进外源供体核酸和目标核酸之间的连接的长度。示例性的互补区域的长度为约1个核苷酸至约5个核苷酸，约1个核苷酸至约25个核苷酸，或约5个核苷酸至约150个核苷酸。例如，互补区域的长度可以为至少约1个核苷酸,2个核苷酸,3个核苷酸,4个核苷酸,5个核苷酸,6个核苷酸,7个核苷酸,8个核苷酸,9个核苷酸,10个核苷酸,11个核苷酸,12个核苷酸,13个核苷酸,14个核苷酸,15个核苷酸,16个核苷酸,17个核苷酸,18个核苷酸,19个核苷酸,20个核苷酸,21个核苷酸,22个核苷酸,23个核苷酸,24个核苷酸,或25个核苷酸。可选地，互补区域的长度可以为约5-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,或140-150个核苷酸，或者更长。

这些互补区域可以与两对切口酶产生的悬挂互补。带有交错端的两个双链断裂可通过使用产生第一双链断裂的裂解DNA的相对链的第一和第二切口酶以及产生第二双链断裂的裂解DNA的相对链的第三和第四切口酶产生。例如，Cas蛋白质可用于在与第一、第二、第三和第四向导RNA对应的第一、第二、第三和第四向导RNA靶向序列上产生切口。所述第一和第二向导RNA靶向序列可位于产生第一裂解位点的位置，这样由第一和第二切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即，第一裂解位点包含位于第一和第二向导RNA靶向序列内的切口)。类似地，第三和第四向导RNA靶向序列可位于产生第二裂解位点的位置，这样，由第三和第四切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即，第二裂解位点包含位于第三和第四向导RNA靶向序列内的切口)。任选地，位于第一和第二向导RNA靶向序列和/或第三和第四向导RNA靶向序列内的切口可以是产生悬挂的偏置切口。偏置窗口可以是例如至少约5bp,10bp,20bp,30bp,40bp,50bp,60bp,70bp,80bp,90bp,100bp或更大。参见，Ran等人,(2013)Cell 154:1380-1389；Mali等人,(2013)Nat.Biotech.31:833-838；和Shen等人,(2014)Nat.Methods 11:399-404，其每一个的全部内容通过引用并入本文，用于所有目的。在这些情况下，双链外源供体核酸可使用如下单链互补区域设计，所述单链互补区域与由第一和第二向导RNA靶向序列内的切口产生的悬挂以及由第三和第四向导RNA靶向序列内的切口产生的悬挂互补。这样的外源供体核酸随后可通过非同源末端连接介导的连接插入。

(3)通过同源定向修复进行插入的供体核酸

一些外源供体核酸包含同源臂。如果外源供体核酸还包含核酸插入体，那么所述同源臂可位于所述核酸插入体的侧面。为了便于参考，本文中的同源臂被称为5’和3’(即，上游和下游)同源臂。该术语涉及同源臂与外源供体核酸内的核酸插入体的相对位置。5’和3’同源臂对应于目标基因组基因座内的区域，该区域在本文中被分别称为“5’靶向序列”和“3’靶向序列”。

当两个区域彼此之间共享足够水平的序列一致性时，同源臂和靶向序列彼此之间“对应”以作为同源重组反应的底物。术语“同源”包括与对应序列等同或与对应序列共享序列一致性的DNA序列。给定的目标序列和在外源供体核酸中发现的对应的同源臂之间的序列一致性可以是允许同源重组发生的任何程度的序列一致性。例如，外源供体核酸(或其片段)的同源臂和目标序列(或其片段)共享的序列一致性的量可以是至少50％,55％,60％,65％,70％,75％,80％,81％,82％,83％,84％,85％,86％,87％,88％,89％,90％,91％,92％,93％,94％,95％,96％,97％,98％,99％或100％序列一致性，从而所述序列经历同源重组。而且，同源臂和对应的目标序列之间的具有同源性的对应区域可具有足以促进同源重组的任何长度。示例性的同源臂的长度为约25个核苷酸至约2.5kb，约25个核苷酸至约1.5kb或约25个核苷酸至约500个核苷酸。例如，给定的同源臂(或同源臂中的每一个)和/或对应的目标序列可包含长度为约25-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-150个核苷酸,150-200个核苷酸,200-250个核苷酸,250-300个核苷酸,300-350个核苷酸,350-400个核苷酸,400-450个核苷酸,或450-500个核苷酸的具有同源性的对应区域，这样，同源臂具有足以与目标核酸内的对应的目标序列进行同源重组的同源性。可选地，给定的同源臂(或每个同源臂)和/或对应的目标序列可包含长度为约0.5kb至约1kb，约1kb至约1.5kb，约1.5kb至约2kb，或约2kb至约2.5kb的同源性对应区域。例如，同源臂中的每一个的长度可为约750个核苷酸。同源臂可以是对称的(每个同源臂具有大约相同的长度)或可以是非对称的(一个同源臂比另一个长)。

当CRISPR/Cas系统与外源供体核酸联合使用时，5’和3’目标序列任选地位于足够靠近Cas裂解位点的位置(例如，足够靠近向导RNA靶向序列的位置之内)，从而促进Cas裂解位点处单链断裂(切口)或双链断裂之后目标序列和同源臂之间发生同源重组事件。术语“Cas裂解位点”包括由Cas酶产生切口或双链断裂的DNA序列(例如，与向导RNA复合的Cas9蛋白)。目标基因座内的与外源供体核酸的5’和3’同源臂对应的目标序列位于“足够靠近Cas裂解位点的位置”，只要该距离能够促进Cas裂解位点处单链断裂或双链断裂之后5’和3’目标序列和同源臂之间发生同源重组事件。因此，对应于外源供体核酸的5’和/或3’同源臂的目标序列可以是例如位于给定的Cas裂解位点的至少1个核苷酸之内，或给定的Cas裂解位点的至少10个核苷酸至约1,000个核苷酸之内。作为实例，Cas裂解位点可以就在目标序列中的至少一个或两个的附近。

对应于外源供体核酸的同源臂的目标序列和Cas裂解位点之间的空间关系可发生改变。例如，目标序列可位于Cas裂解位点的5’端，目标序列可位于Cas裂解位点的3’端，或目标序列可位于Cas裂解位点的侧面。

B.优化CRISPR/Cas体内或离体切除目标基因组核酸的能力的方法

本文提供用于优化将CRISPR/Cas递送至细胞或非人类动物或优化CRISPR/Cas的体内活性的各种不同的方法。这些方法可包括，例如：(a)在第一非人类动物或第一细胞中第一次执行测试CRISPR/Cas修饰上文所述的目标基因组基因座的能力的方法；(b)改变可变量并且使用改变的可变量在第二非人类动物(即，相同的种类)或第二细胞中再次执行上述方法；以及(c)将步骤(a)中对目标基因组基因座的修饰与步骤(b)中对目标基因组基因座的修饰进行比较，并且选择产生对目标基因组基因座更有效的修饰的方法。

对目标基因组基因座的更加有效的修饰可以是指基于非人类动物或细胞中的期望作用的不同事件。例如，对目标基因组基因座的更加有效的修饰可以是指更高的效率，更高的精确度，更高的一致性或更高的特异性中的一种或多种或全部。更高的效率是指对目标基因组基因座的更高水平的修饰(例如，靶定特定目标细胞类型中，特定目标组织中，或特定目标器官中更高百分比的细胞)。更高的精确度是指对目标基因组基因座的更加精确的修饰(例如，更高百分比的靶定细胞具有相同的修饰或具有期望的修饰而不产生额外的不期望的插入和删除(例如，NHEJ插入/缺失))。更高的一致性是指如果靶定多于一种类型的细胞、组织或器官的话，对不同类型的靶定的细胞、组织或器官中的目标基因组基因座产生更加一致的修饰(例如，在目标器官中对更多的细胞类型进行修饰)。如果靶定特定器官的话，更高的一致性还可以是指在器官内的所有位置中产生更加一致的修饰。更高的特异性可以是指对靶定的基因组基因座或靶定的基因座具有更高的特异性，对靶定的细胞类型具有更高的特异性，对靶定的组织类型具有更高的特异性，或者对靶定的器官具有更高的特异性。例如，提高的基因组基因座特异性是指对脱靶的基因组基因座具有较少的修饰(例如，在不期望的，脱靶的基因组基因座处对较低百分比的靶定细胞进行修饰，而对目标基因组基因座进行修饰)。同样，如果靶定特定细胞类型、组织类型或器官类型的话，提高的细胞类型特异性、组织特异性或器官类型特异性是指对脱靶的细胞类型、组织类型或器官类型具有较少的修饰(例如，当靶定特定器官(例如，肝脏)的话，对不期望靶定的器官或组织中的细胞具有较少的修饰)。

被改变的可变量可以是任何参数。作为一个实例，被改变的可变量可以是将向导RNA(或包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部引入至细胞或非人类动物中的包装方法或递送方法。递送方法的实例在本文的其他地方公开，例如，LNP，HDD和AAV。例如，改变的可变量可以是AAV血清型。作为另一实例，改变的可变量可以是将向导RNA(例如，包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部引入细胞或非人类动物中的给药途径。给药途径的实例在本文的其他地方公开，例如，静脉内，玻璃体内，脑实质内以及鼻灌注。

作为另一实例，改变的可变量可以是引入的向导RNA(例如，包装在AAV中的向导RNA)和引入的外源供体核酸中的一种或多种或全部的浓度或量。作为另一实例，改变的可变量可以是相对于引入的外源供体核酸的浓度或量的引入的向导RNA(例如，包装在AAV中的向导RNA)的浓度或量。

作为另一实例，改变的可变量可以是相对于测量一种或多种报告体蛋白的表达或活性的时机引入向导RNA(例如，包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部的时机。作为另一实例，改变的可变量可以是引入向导RNA(例如，包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部的次数或频率。作为另一实例，改变的可变量可以是相对于引入外源供体核酸的时机引入向导RNA的时机。

作为另一实例，改变的可变量可以是引入的向导RNA和外源供体核酸中的一种或多种或全部的形式。例如，向导RNA以DNA的形式或RNA的形式引入。外源供体核酸可以是DNA，RNA，单链，双链，线性，环状等等。类似地，各个成分可包含稳定性修饰，降低脱靶作用的修饰，促进递送的修饰等等的各种不同的组合。作为另一实例，改变的可变量可以是引入的向导RNA(例如，引入具有不同序列的不同向导RNA)和引入的外源供体核酸(例如，引入具有不同序列的不同外源供体核酸)中的一种或多种或全部。

C.将向导RNA和其他成分引入细胞或非人类动物

本文公开的方法包括向细胞或非人类动物引入向导RNA和外源供体核酸中的一个或多个或全部。“引入”包括以使核酸或蛋白质接近细胞的内部或接近非人类动物内的细胞的内部的方式向细胞或非人类动物呈递核酸或蛋白质。所述引入可通过任何方式完成并且上述成分中的两个或多个(例如，上述成分中的两个或所有成分)可同时或按顺序以任何组合引入至细胞或非人类动物。例如，可在引入向导RNA之前将外源供体核酸引入细胞或非人类动物，或者可在引入向导RNA之后引入外源供体核酸(例如，可在引入向导RNA之前或之后的约1小时，2小时，3小时，4小时，8小时，12小时，24小时，36小时，48小时或72小时给药外源供体核酸)。参见，例如，US 2015/0240263和US 2015/0110762，其每一个的全部内容通过引用并入本文，用于所有目的。此外，上述成分中的两种或多种可通过相同的递送方法或不同的递送方法引入至细胞或非人类动物。类似地，上述成分中的两种或多种可通过相同的给药途径或不同的给药途径引入至非人类动物。

向导RNA可以RNA的形式(例如，体外转录的RNA)或编码向导RNA的DNA的形式引入至细胞中。当以DNA的形式引入向导RNA时，编码向导RNA的DNA可以可操作地连接至在细胞中具有活性的启动子。例如，向导RNA可通过AAV递送并在U6启动子下体内表达。这样的DNA可以位于一个或多个表达构建体中。例如，这些表达构建体可以是单个核酸分子的成分。可选地，它们可以任何组合被分开在两个或多个核酸分子之间(即，编码一个或多个CRISPRRNA的DNA和编码一个或多个tracrRNA的DNA可以是不同的核酸分子的成分)。

编码向导RNA的核酸可以可操作地连接至表达构建体中的启动子。表达构建体包括任何能够定向目标基因或其他目标核酸序列的表达的核酸构建体并且所述核酸构建体可将这样的目标核酸序列转移至目标细胞。可在表达构建体中使用的合适的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子：真核细胞，人细胞，非人类细胞，哺乳动物细胞，非人类哺乳动物细胞，啮齿动物细胞，小鼠细胞，大鼠细胞，仓鼠细胞，兔细胞，多能细胞，胚胎干(ES)细胞，成体干细胞，发育受限祖细胞，诱导多能性干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如条件性启动子，可诱导启动子，组成性启动子或组织特异性启动子。任选地，所述启动子可以是驱动向导RNA在一个方向上表达并且驱动另一成分在另一方向上表达的双向启动子。这些双向启动子可由如下成分构成：(1)包含3个外部控制元件的完整传统单向Pol III启动子：远端序列元件(DSE)，近端序列元件(PSE)和TATA盒；和(2)包括在反方向上融合至DSE的5’末端的PSE和TATA盒的第二碱性Pol III启动子。例如，在H1启动子中，DSE接近PSE和TATA盒并且所述启动子可通过产生杂交启动子在双向上产生，在所述杂交启动子中，反向转录通过添加源自U6启动子的PSE和TATA盒来控制。参见，例如，US2016/0074535，其全部内容通过引用并入本文，用于所有目的。使用双向启动子同时表达编码向导RNA的基因和另一成分能够产生紧凑表达盒以促进递送。

外源供体核酸和向导RNA(或编码向导RNA的核酸)可在包含载体的组合物中提供，所述载体提高了外源供体核酸或向导RNA的稳定性(例如，延长了其在给定的存储条件(例如，-20℃，4℃或室温)下的存储时间段，在该时间段内降解产物仍然低于阈值，例如，低于起始核酸或蛋白质的重量的0.5％；或者提高了体内稳定性)。这种载体的非限定性实例包括聚(乳酸)(PLA)微球，聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球，脂质体，胶束，反相胶束，脂质卷(lipid cochleate)和脂质微管。

本文提供各种不同的方法和组合物将核酸或蛋白质引入细胞或非人类动物。将核酸引入各种不同的细胞类型中的方法是本领域已知的并且包括例如，稳定转染法，瞬时转染法和病毒介导的方法。

转染规程以及将核酸序列引入细胞中的操作规程可能各不相同。非限定性的转染方法包括使用脂质体，纳米颗粒，磷酸钙(Graham等人,(1973)Virology 52(2):456–67,Bacchetti等人,(1977)Proc.Natl.Acad.Sci.USA74(4):1590–4,以及Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman andCompany.pp.96–97)，树枝状聚合物，或诸如DEAE-葡聚糖或聚乙烯亚胺之类的阳离子聚合物的基于化学的转染方法。非化学方法包括电穿孔，Sono-穿孔，和光转染。基于颗粒的转染包括使用基因枪或磁性辅助转染(Bertram(2006)Current PharmaceuticalBiotechnology 7,277–28)。病毒方法也可用于转染。

将核酸或蛋白质引入细胞内还可以由电穿孔介导，由胞质内注射介导，由病毒感染介导，由腺病毒介导，由腺相关病毒介导，由慢病毒介导，由逆转录病毒介导，由转染介导，由脂质介导的转染介导，或由核转染(nucleofection)介导。核转染是一种改进的电穿孔技术，其不仅能够将核酸底物递送至细胞质而且还可以通过核膜将核酸底物递送至细胞核内。此外，在本文公开的方法中使用核转染相对于常规电穿孔需要少得多的细胞(例如，相对于常规电穿孔需要7百万个细胞，其仅需要约2百万个细胞)。在一个实例中，核转染使用

NUCLEOFECTOR^TM系统进行。

将核酸或蛋白质引入细胞(例如，受精卵)内还可通过显微注射完成。在受精卵(即，单细胞期胚胎)中，显微注射可进入母本和/或父本原核中或进入细胞质内。如果显微注射只进入一个原核中，父本原核由于其具有较大的尺寸而是优选的。可选地，显微注射可通过注射进入细胞核/原核和细胞质这两者来实施：首先可将针头引入细胞核/原核内并注射第一量，并且在将所述针头从单细胞期胚胎中移出时，向细胞质中注射第二量。实施显微注射的方法是本领域熟知的。参见，例如，Nagy等人,(Nagy A,Gertsenstein M,VinterstenK,Behringer R.,2003,Manipulating the Mouse Embryo.Cold Spring Harbor,NewYork:Cold Spring Harbor Laboratory Press)；还可参见Meyer等人,(2010)Proc.Natl.Acad.Sci.USA 107:15022-15026以及Meyer等人,(2012)Proc.Natl.Acad.Sci.USA 109:9354-9359。

用于将核酸或蛋白质引入细胞内或非人类动物体内的其他方法可包括例如，载体递送，颗粒介导的递送，核外体介导的递送，脂质纳米颗粒介导的递送，细胞渗透肽介导的递送，或可植入设备介导的递送。作为特定实例，可将核酸或蛋白质引入至诸如聚(乳酸)(PLA)微球，聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球，脂质体，胶束，反相胶束，脂质卷(lipid cochleate)或脂质微管之类的载体中的细胞或非人类动物。递送至非人类动物的一些特定实例包括流体力学递送，病毒介导的递送(例如，腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。

将核酸和蛋白质引入细胞或非人类动物还可通过流体力学递送(HDD)完成。流体力学递送作为一种体内递送细胞内DNA的方法而出现。对于将基因递送至实质细胞而言，只需要将必需DNA序列通过所选择的血管进行注射，这消除了与目前的病毒载体和合成载体相关的安全顾虑。当将DNA注射至血流中时，DNA能够到达接近血液的不同组织中的细胞。流体力学递送使用将大量溶液快速注射进入循环中的不可压缩的血液中产生的力以克服内皮的物理障碍和细胞膜的物理障碍，所述细胞膜防止较大的且细胞膜不可渗透的化合物进入实质细胞。除了DNA的递送之外，该方法可用于体内有效细胞内递送RNA，蛋白质和其他小化合物。参见，例如，Bonamassa等人,(2011)Pharm.Res.28(4):694-701，其全部内容通过引用并入本文，用于所有目的。

引入核酸还可通过病毒介导的递送(例如，AAV-介导的递送或慢病毒介导的递送)完成。其他示例性的病毒/病毒载体包括逆转录病毒，腺病毒，牛痘病毒，痘病毒以及单纯疱疹病毒。所述病毒可感染分化的细胞，未分化的细胞或分化的和未分化的细胞这两者。所述病毒可整合至宿主基因组中，或者，可选地，所述病毒未整合至宿主基因组中。这些病毒还可被工程化以具有降低的免疫性。病毒可以是能够进行复制的或可以是复制有缺陷的(例如，缺乏一种或多种多轮病毒复制和/或包装所必需的基因)。病毒可导致瞬时表达，长期表达(例如，至少1周，两周，1个月，2个月，或3个月)，或者永久表达(例如，Cas9和/或gRNA的永久表达)。示例性的病毒滴度(例如，AAV滴度)包括10¹²个载体基因组/mL，10¹³个载体基因组/mL，10¹⁴个载体基因组/mL，10¹⁵个载体基因组/mL和10¹⁶个载体基因组/mL。

ssDNA AAV基因组由两个开放阅读框Rep和Cap构成，其侧面具有两个允许互补DNA链合成的倒置末端重复序列(inverted terminal repeat)。当构建AAV转移质粒时，转基因被放置于两个ITR之间并且Rep和Cap可以反式提供。除了Rep和Cap之外，AAV可能需要包含来自腺病毒的基因的辅助质粒。这些基因(E4，E2a和VA)介导AAV复制。例如，转移质粒，Rep/Cap和辅助质粒可被转染至含有腺病毒基因E1+的HEK293细胞中以产生感染的AAV颗粒。可选地，Rep，Cap和腺病毒辅助基因可被合并至单个质粒中。类似的包装细胞和包装方法可用于其他病毒，例如，逆转录病毒。

已识别了AAV的多种血清型。这些血清型的区别在于其所感染的细胞类型(即，其趋向性)，这使得特定细胞类型被优先转导。CNS组织的血清型包括AAV1,AAV2,AAV4,AAV5,AAV8,和AAV9。心脏组织的血清型包括AAV1，AAV8和AAV9。肾脏组织的血清型包括AAV2。肺组织的血清型包括AAV4，AAV5，AAV6和AAV9。胰腺组织的血清型包括AAV8。光感受器细胞的血清型包括AAV2，AAV5和AAV8。视网膜色素上皮组织的血清型包括AAV1,AAV2,AAV4,AAV5,和AAV8。骨骼肌组织的血清型包括AAV1,AAV6,AAV7,AAV8,和AAV9。肝脏组织的血清型包括AAV7，AAV8和AAV9，尤其是AAV8。

趋向性还可通过假型进行细分，其是衣壳和来自不同病毒血清型的基因组的混合。例如，AAV2/5表示病毒包含包装在血清型5的衣壳中的血清2的基因组。假型病毒的使用可改善转导效率并且改变趋向性。源自不同血清型的杂交衣壳还可用于改变病毒趋向性。例如，AAV-DJ包含来自八个血清型的杂交衣壳并且在各种不同的细胞类型中在体内显示出较高的传染性。AAV-DJ8是显示出AAV-DJ性质但带有提高的脑部摄入的另一实例。AAV血清型还可通过突变进行修饰。AAV2的突变修饰的实例包括Y444F,Y500F,Y730F,和S662V。AAV3的突变修饰的实例包括Y705F，Y731F和T492V。AAV6的突变修饰的实例包括S663V和T492V。其他假型/修饰的AAV变体包括AAV2/1,AAV2/6,AAV2/7,AAV2/8,AAV2/9,AAV2.5,AAV8.2,和AAV/SASTG。

为了加快转基因表达，可使用自身互补的AAV(scAAV)变体。因为AAV依赖于细胞的DNA复制装置以合成AAV的单链DNA基因组的互补链，因此可延缓转基因表达。为了解决这种延缓，可使用包含能够在感染之后自发退火的互补序列的scAAV，从而消除进行宿主细胞DNA合成的需求。然而，还可使用单链AAV(ssAAV)载体。

为了增加包装容量，较长的转基因可在两个AAV转移质粒之间分离开，第一部分具有3’剪接供体并且第二部分具有5’剪接受体。在细胞的共感染之后，这些病毒形成串联体，被剪接在一起，并且可表达全长转基因。虽然这使得更长的转基因进行表达，但是表达不够有效。用于增加容量的类似的方法使用了同源重组。例如，可在两个转移质粒之间分开转基因，但是分开的转基因之间具有大量序列重叠，这样共表达诱导同源重组以及全长转基因的表达。

引入核酸和蛋白质还可通过脂质纳米颗粒(LNP)介导的递送来完成。例如，LNP介导的递送可用于递送RNA形式的向导RNA。通过这些方法进行的递送导致向导RNA的瞬时呈现并且生物可降解的脂质改善了清除率，改善了耐受性并降低了免疫原性。脂质制剂可保护生物分子不发生降解，而同时改善它们的细胞摄入。脂质纳米颗粒是包含多种彼此通过分子间作用力而物理相关联的脂质分子的颗粒。这些脂质纳米颗粒包括微球(包括单层和多层囊泡，例如，脂质体)，分散相乳液，胶束或悬浮液中的内部相。这些脂质纳米颗粒可用于包裹一种或多种核酸或蛋白质用于递送。包含阳离子脂质的制剂可用于递送诸如核酸之类的聚阴离子。可包括的其他脂质是中性脂质(即，不带电荷的或两性脂质)，阴离子脂质，提高转染的辅助脂质以及增加纳米颗粒在体内的存在时间长度的隐形脂质。合适的阳离子脂质，中性脂质，阴离子脂质，辅助脂质和隐形脂质的实例可在WO2016/010840A1中找到，其全部内容通过引用并入本文，用于所有目的。示例性的脂质纳米颗粒可包含阳离子脂质和一种或多种其他成分。在一个实例中，其他成分可包含诸如胆固醇之类的辅助脂质。在另一实例中，其他成分可包含诸如胆固醇之类的辅助脂质和诸如DSPC之类的中性脂质。在另一实例中，其他成分可包含诸如胆固醇之类的辅助脂质，诸如DSPC之类的任选的中性脂质，以及诸如S010,S024,S027,S031,或S033之类的隐形脂质(stealth lipid)。

LNP可包含下列成分中的一种或多种或者全部：(i)用于包裹和胞内逃逸的脂质；(ii)用于稳定的中性脂质；(iii)用于稳定的辅助脂质；以及(iv)隐形脂质。参见，例如，Finn等人,(2018)Cell Reports 22:1-9和WO 2017/173054 A1，其每一个的全部内容通过引用并入本文，用于所有目的。在一些LNP中，载体(cargo)可包括向导RNA或编码向导RNA的核酸。在一些LNP中，载体(cargo)可包括向导RNA或编码向导RNA的核酸以及外源供体核酸。

用于包裹和胞内逃逸的脂质可以是阳离子脂质。脂质还可以是生物可降解的脂质，例如，生物可降解的可电离的脂质。合适的脂质的一个实例是脂质A或LP01，其是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯，也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯。参见，例如，Finn等人,(2018)Cell Reports22:1-9和WO 2017/173054 A1，其每一个的全部内容通过引用并入本文，用于所有目的。合适的脂质的另一实例是脂质B，其是((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐)，也称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐)。合适的脂质的另一实例是脂质C，其是2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧)十六酰基)氧)丙烷-1,3-二基(9Z,9’Z,12Z,12’Z)-双(十八烷-9,12-二烯酸酯)。合适的脂质的另一实例是脂质D，其是3-(((3-(二甲基氨基)丙氧基)羰基)氧)-13-(辛酰基氧)十三烷基3-辛基十一酸酯。其他合适的脂质包括4-(N,N-二甲基胺基)丁酸-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(heptatriaconta-6,9,28,31-tetraen-19-yl 4-(dimethylamino)butanoate，也称为Dlin-MC3-DMA(MC3))。

用于本文所述的LNP的一些这样的脂质是体内可生物降解的。例如，包含这种脂质的LNP包括其中至少75％的脂质在8小时内，10小时内，12小时内，24小时内或48小时内或者3天内，4天内，5天内，6天内，7天内或10天内从血浆中清除的那些LNP。作为另一实例，LNP中至少50％的脂质在8小时内，10小时内，12小时内，24小时内或48小时内或者3天内，4天内，5天内，6天内，7天内或10天内从血浆中清除。

这些脂质可以是基于其所在的培养基的pH可电离的。例如，在弱酸性培养基中，脂质可被质子化并且因此带有正电荷。相反，在弱碱性培养基中，例如，pH为约7.35的血液中，脂质可不被质子化，因此不带有电荷。在一些实施方式中，在pH为至少约9，9.5或10的条件下脂质可以被质子化。这样的脂质的带电荷的能力与其固有pKa相关。例如，脂质可独立地具有约5.8至约6.2的pKa。

中性脂质发挥稳定并改善LNP的加工的作用。合适的中性脂质的实例包括多种不同的中性的，不带电荷的或两性脂质。用于本文公开的内容中的中性磷脂的实例包括但不限于：5-十七烷基苯-1,3-二醇(间苯二酚)，二棕榈酰基磷脂酰胆碱(DPPC)，二硬脂酰基磷脂酰胆碱(DSPC)，磷酰胆碱(DOPC)，二肉豆蔻酰基磷脂酰胆碱(DMPC)，磷脂酰胆碱(PLPC)，1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DAPC)，磷脂酰乙醇胺(PE)，卵黄磷脂酰胆碱(EPC)，二月桂酰基磷脂酰胆碱(DLPC)，二肉豆蔻酰基磷脂酰胆碱(DMPC)，1-肉豆蔻酰基-2-棕榈酰基磷脂酰胆碱(MPPC)，1-棕榈酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC)，1-棕榈酰基-2-硬脂酰基磷脂酰胆碱(PSPC)，1,2-二花生酰基-sn-甘油-3-磷酸胆碱(DBPC)，1-硬脂酰基-2-棕榈酰基磷脂酰胆碱(SPPC)，1,2-双二十碳烯酰基-sn-甘油-3-磷酸胆碱(DEPC)，棕榈酰基油酰基磷脂酰胆碱(POPC)，溶血磷脂酰胆碱，二油酰基磷脂酰乙醇胺(DOPE)，二亚油酰基磷脂酰胆碱，二硬脂酰基磷脂酰乙醇胺(DSPE)，二肉豆蔻酰基磷脂酰乙醇胺(DMPE)，二棕榈酰基磷脂酰乙醇胺(DPPE)，棕榈酰基油酰基磷脂酰乙醇胺(POPE)，溶血磷脂酰乙醇胺以及它们的组合。例如，中性磷脂可选自二硬脂酰基磷脂酰胆碱(DSPC)和二肉豆蔻酰基磷脂酰乙醇胺(DMPE)。

辅助脂质包括提高转染的脂质。通过辅助脂质提高转染的机理可包括提高颗粒稳定性。在一些情况下，辅助脂质可提高膜融合性。辅助脂质包括类固醇，固醇以及烷基间苯二酚。合适的辅助脂质的实例包括胆固醇，5-十七烷基间苯二酚，以及胆固醇半琥珀酸酯。在一个实例中，辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。

隐形脂质包括改变纳米颗粒可在体内存在的时间长度的脂质。隐形脂质可通过例如降低颗粒聚集以及控制颗粒尺寸有助于制剂的加工。隐形脂质可调节LNP的药代动力学。合适的隐形脂质包括具有连接至脂质基团的亲水头端的脂质。

隐形脂质的亲水头端基团可包括例如选自基于如下聚合物的聚合物基团：PEG(有时称为聚乙二醇)，聚噁唑啉，聚乙烯醇，聚丙三醇，聚(N-乙烯吡咯烷酮)，聚氨基酸，以及聚N-(2-羟丙基)甲基丙烯酰胺。术语PEG是指任何聚乙二醇或其他聚亚甲基醚聚合物。在一些LNP制剂中，PEG是PEG-2K，也称为PEG2000，其平均分子量为约2,000道尔顿。参见例如，WO2017/173054A1，其全部内容通过引用并入本文，用于所有目的。

隐形脂质的脂质基团可衍生自例如甘油二酯或二酰基甘酰胺，包括含有二烷基甘油或二烷基甘酰胺基团的那些，所述二烷基甘油或二烷基甘酰胺基团具有长度独立地为含有约C4至约C40饱和或不饱和碳原子的烷基链，其中，所述链可包含诸如酰胺或酯之类的一个或多个官能团。二烷基甘油或二烷基甘酰胺还可包含一个或多个取代的烷基。

作为一个实例，隐形脂质可选自：PEG-二月桂酰基甘油,PEG-二肉豆蔻酰基甘油(PEG-DMG),PEG-二棕榈酰基甘油,PEG-二硬脂酰基甘油(PEG-DSPE),PEG-二月桂基甘酰胺,PEG-二肉豆蔻基甘酰胺,PEG-二棕榈酰基甘酰胺,和PEG-二硬脂酰基甘酰胺,PEG-胆固醇(l-[8'-(胆甾-5-烯-3[β]-氧)甲酰胺-3',6'-二氧辛烷基]氨基甲酰-[Ω]-甲基-聚乙二醇,PEG-DMB(3,4-双十四氧苄基-[Ω]-甲基-聚乙二醇醚),1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG),1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE),1,2-二硬脂酰基-sn-甘油,甲氧基聚乙二醇(PEG2k-DSG),聚乙二醇-2000-二甲基丙烯酸酯(PEG2k-DMA),以及1,2-二硬酯基氧丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一种特定实例中，隐形脂质可以是PEG2k-DMG。

制剂中，LNP可包含不同摩尔比例的各个组分的脂质。CCD脂质的mol-％可以是例如约30mol-％至约60mol-％,约35mol-％至约55mol-％,约40mol-％至约50mol-％,约42mol-％至约47mol-％,或约45％。辅助脂质的mol-％可以为例如约30mol-％至约60mol-％,约35mol-％至约55mol-％,约40mol-％至约50mol-％,约41mol-％至约46mol-％,或约44mol-％。中性脂质的mol-％可以为例如约1mol-％至约20mol-％,约5mol-％至约15mol-％,约7mol-％至约12mol-％,或约9mol-％。隐形脂质的mol-％可以为例如约1mol-％至约10mol-％,约1mol-％至约5mol-％,约1mol-％至约3mol-％,约2mol-％,或约1mol-％。

LNP中生物可降解脂质(N)的带有正电荷的氨基基团与待包裹的核酸的带有负电荷的磷酸基团(P)之间可具有不同比例。这可在数学上由方程式N/P表示。例如，N/P比例可以为约0.5至约100，约1至约50，约1至约25，约1至约10，约1至约7，约3至约5，约4至约5，约4，约4.5或约5。

在一些LNP中，载体可包含外源供体核酸和gRNA。外源供体核酸和gRNA可具有不同比例。例如，LNP制剂可包括如下比例的外源供体核酸和gRNA核酸：约25:1至约1:25，约10:1至约1:10，约5:1至约1:5，或约1:1。可选地，LNP制剂可包括如下比例的外源供体核酸和gRNA核酸：约1:1至约1:5，约5:1至约1:1，约10:1，或约1:10。可选地，LNP制剂可包括如下比例的外源供体核酸和gRNA核酸：约1:10,25:1,10:1,5:1,3:1,1:1,1:3,1:5,1:10,或1:25。

合适的LNP的具体实例具有4.5的氮磷比(N/P)并且包含摩尔比为45:44:9:2的生物可降解的阳离子脂质，胆固醇，DSPC和PEG2k-DMG。生物可降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基十八碳-9,12-二烯酸酯，也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基(9Z,12Z)-十八碳-9,12-二烯酸酯。参见，例如，Finn等人,(2018)Cell Reports22:1-9，其全部内容通过引用并入本文，用于所有目的。合适的LNP的另一具体实例包含摩尔比为50:38.5:10:1.5的Din-MC3-DMA(MC3)，胆固醇，DSPC，以及PEG-DMG。

可选择降低免疫原性的递送模式。例如，gRNA和外源供体核酸可通过不同的模式进行递送(例如，双模态递送)。这些不同的模式可赋予目标递送分子(例如，gRNA或编码gRNA的核酸，或外源供体核酸/修复模板)不同的药效学或药代动力学性质。例如，不同的模式可产生不同的组织分布，不同的半衰期或不同的时间分布。一些递送模式(例如，递送通过自体复制或基因组整合留存在细胞中的核酸载体)产生更持久的表达并且更加持久地存在于分子中，而其他递送模式是瞬时的并且不太持久(例如，递送RNA或蛋白质)。以更加瞬时的方式递送各个成分(例如RNA或蛋白质)可确保Cas/gRNA复合物仅仅存在较短的时间段并且仅在较短的时间段内具有活性并且可降低免疫原性。这些瞬时递送还可降低脱靶修饰的可能性。

体内给药可通过合适的途径进行，例如，肠胃外给药，静脉内给药，口服给药，皮下给药，动脉内给药，颅内给药，鞘内给药，腹膜内给药，局部给药，鼻内给药或肌肉内给药。全身给药模式包括例如：口服途径和肠胃外途径。肠胃外途径的实例包括静脉内途径，动脉内途径，骨内途径，肌肉内途径，皮内途径，皮下途径，鼻内途径和腹膜内途径。具体实例是静脉内输注。局部给药模式包括例如：鞘内途径，脑室内途径，脑实质内途径(例如，定位脑实质内递送至纹状体(例如，递送至尾状核内或硬膜内)，大脑皮层，中央前回，海马体(例如，递送至齿状回或CA3区域)，颞叶皮层，杏仁核，额叶皮层，丘脑，小脑，髓质，下丘脑，顶盖，被盖或黑质)，眼内途径，框内途径，结膜下途径，玻璃体内途径，视网膜下途径和经虹膜途径。相比于全身给药(例如，静脉内给药)而言，明显较少量(与全身方式相比)的成分可在局部给药(例如，脑实质内给药或玻璃体内给药)时发挥作用。局部给药模式还可降低或消除当全身给药治疗有效量的成分时可能产生的潜在的毒副作用的发生率。

体内给药可通过任何合适的途径进行，包括例如：肠胃外途径，静脉内途径，口服途径，皮下途径，动脉内途径，颅内途径，鞘内途径，腹膜内途径，局部途径，鼻内途径，或者肌肉内途径。特定的实例是静脉内输注。鼻灌注和玻璃体内注射是其他具体实例。含有向导RNA(或编码向导RNA的核酸)的组合物可使用一种或多种生理学和药学上可接受的载体，稀释剂，赋形剂或助剂配制。剂型可依赖于所选择的给药途径。术语“药学上可接受的”是指载体，稀释剂，赋形剂或助剂与制剂的其他成分相容并且对制剂的接受者不会产生实质的有害作用。

给药频率和剂量次数可取决于外源供体核酸或向导RNA(或编码向导RNA的核酸)的半衰期，以及给药途径等等因素。将核酸或蛋白质引入细胞或非人类动物中可进行一次或在一段时间段内进行多次。例如，引入可在一段时间段内进行至少两次，至少三次，至少四次，至少五次，至少六次，至少七次，至少八次，至少九次，至少10次，至少11次，至少12次，至少13次，至少14次，至少15次，至少16次，至少17次，至少18次，至少19次或至少20次。

D.测量CRISPR/Cas的体内活性并且评价对目标基因组基因座的修饰

本文公开的方法可还包括评价目标基因组基因座的修饰。用于检测或测量表达或活性的方法将取决于被修饰的目标基因组基因座。

例如，如果目标基因组基因座包括编码RNA或蛋白质的基因，并且想要进行的修饰是改变编码的RNA或蛋白质的表达，那么，评价对目标基因组基因座的修饰的方法可包括测量编码的RNA或蛋白质的表达或活性。例如，如果编码的蛋白质是释放至血清的蛋白质，那么可测量编码的蛋白质的血清水平。测量RNA和蛋白质的水平和活性的分析方法是本领域熟知的。

可选地，本文公开的方法可还包括识别具有修饰的目标基因组基因座的细胞，在修饰的目标基因组基因座中，序列已通过非同源末端连接(例如，存在小的插入或删除(indels))进行修饰，随后通过CRISPR/Cas裂解序列，其中，位于两个向导RNA靶向序列之间的目标基因组基因座处的序列已被切除，或者，其中，目标基因组基因座已通过与外源供体核酸的重组而被修饰。可使用各种不同的方法识别具有靶定的基因组修饰的细胞。筛选可包括对亲本染色体的等位基因的修饰(MOA)进行评价的定量分析法。例如，所述定量分析法可通过定量PCR(例如，实时PCR(qPCR))进行。实时PCR可利用识别目标基因座的第一引物组和识别非目标参比基因座的第二引物组。引物组可包括识别扩增的序列的荧光探针。合适的定量分析法的其他实例包括荧光介导原位杂交(FISH)，比较基因组杂交，等温DNA扩增，与固定化探针的定量杂交，

探针，

分子信标探针或ECLIPSE^TM探针技术(参见，例如，US 2005/0144655，其全部内容通过引用并入本文，用于所有目的)。

还可使用第二代测序(NGS)进行筛选。第二代测序还可被称为“NGS”或“大规模平行测序”或“高通量测序”。除了MOA分析方法之外，还可使用NGS作为筛选工具以定义靶定的基因修饰的确切本质以及整个细胞类型或组织类型或器官类型中靶定的基因修饰是否一致。

评价非人类动物体内的目标基因组基因座的修饰可在来自任何组织或器官的任何细胞类型中进行。例如，对目标基因组基因座的修饰可在来自相同组织或器官的多种细胞类型中进行或者可在来自组织或器官中的多种位置的细胞中进行。这可提供关于目标组织或器官中何种类型的细胞被修饰或CRISPR/Cas到达并修饰组织或器官的哪个部分的信息。作为另一实例，目标基因组基因座的修饰可在多种类型的组织或多种器官中进行评价。在靶定特定组织或器官的方法中，这可提供关于如何有效靶定组织或器官以及其他组织或器官中是否产生脱靶作用的信息。

在一些特定的实例中，Cas9就绪的非人类动物可用于评估各种不同的向导RNA的编辑速率。向导RNA可作为单个向导RNA(修饰的和未修饰的)或双倍体RNA被引入，或在U6启动子下被表达(例如，通过AAV)。Cas9就绪的非人类动物还可与包含人源化的等位基因的非人类动物表达向导RNA的非人类动物杂交，用于在疾病模型中进行评估。

IV.产生包含Cas表达盒和/或重组酶表达盒的非人类动物的方法

本文提供各种不同的方法产生包含本文其他地方公开的Cas表达盒和重组酶表达盒中的一种或多种或全部的非人类动物。用于产生遗传修饰的生物体的任何方便的方法或操作规程适于产生这种遗传修饰的非人类动物。参见，例如，Cho等人,(2009)CurrentProtocols in Cell Biology42:19.11:19.11.1–19.11.22和Gama Sosa等人,(2010)BrainStruct.Funct.214(2-3):91-109，其每一个的全部内容通过引用并入本文，用于所有目的。这些遗传修饰的非人类动物可通过例如在靶定基因座(例如，诸如Rosa26之类的安全港基因座)敲入基因或通过使用随机整合的转基因产生。参见，例如，WO 2014/093622和WO2013/176772，其每一个的全部内容通过引用并入本文，用于所有目的。将构建体靶定至Rosa26基因座的方法例如在US 2012/0017290,US 2011/0265198,和US 2013/0236946(其每一个的全部内容通过引用并入本文，用于所有目的)中描述。

例如，产生包含本文其他地方描述的Cas表达盒和重组酶表达盒中的一种或多种或全部的非人类动物的方法可包括：(1)修饰多能细胞的基因组以包含Cas表达盒和重组酶表达盒中的一种或多种或全部；(2)识别或选择包含Cas表达盒和重组酶表达盒中的一种或多种或全部的遗传修饰的多能细胞；(3)将所述遗传修饰的多能细胞引入非人类动物宿主胚胎；以及(4)将所述宿主胚胎植入代孕母体并在代孕母体内孕育。任选地，可孵育包含修饰的多能细胞(例如，非人类ES细胞)的宿主胚胎直至囊胚阶段，随后将其植入代孕母体并在代孕母体中孕育以产生F0非人类动物。随后代孕母体可产生包含Cas表达盒和重组酶表达盒中的一种或多种或全部的F0代非人类动物。

所述方法可进一步包括识别具有修饰的目标基因组基因座的细胞或动物。可使用各种不同的方法识别具有靶定的基因组修饰的细胞和动物。

筛选步骤可包括例如：评价亲代染色体的等位基因修饰(MOA)的定量分析方法。例如，定量分析方法可通过定量PCR(例如，实时PCR(qPCR))进行。实时PCR可使用识别目标基因座的第一引物组和识别非目标参比基因座的第二引物组。引物组可包括识别扩增的序列的荧光探针。

合适的定量分析方法的其他实例包括荧光原位杂交(FISH)，比较基因组杂交，等温DNA扩增，与固定化探针的定量杂交，

探针，

分子信标探针，或ECLIPSE^TM探针技术(参见，例如，US 2005/0144655，其全部内容通过引用并入本文，用于所有目的)。

合适的多能细胞的实例是胚胎干(ES)细胞(例如，小鼠ES细胞或大鼠ES细胞)。修饰的多能细胞可例如通过如下步骤产生：(a)向细胞内引入包含插入体核酸的一个或多个靶向载体，其中，所述插入体核酸的侧面具有与5’和3’靶向位点对应的5’和3’同源臂，其中，所述插入体核酸包含Cas表达盒和重组酶表达盒中的一种或多种或全部；以及(b)识别在其基因组中包含整合在目标基因组基因座处的插入体核酸的至少一个细胞。可选地，修饰的多能细胞可通过如下步骤产生：(a)向细胞中引入(i)核酸酶试剂，其中，所述核酸酶试剂诱导目标基因组基因座内的目标序列处产生切口或双链断裂；和(ii)包含插入体核酸的一个或多个靶向载体，所述插入体核酸的侧面具有与5’和3’目标位点对应的5’和3’同源臂，所述5’和3’目标位点位于足够靠近目标序列的位置，其中，插入体核酸包括Cas表达盒和重组酶表达盒中的一种或多种或全部；和(c)识别包含位于目标基因组基因座处的修饰(例如，整合插入体核酸)的至少一个细胞。可使用诱导切口或双链断裂产生期望的目标序列的任何核酸酶试剂。合适的核酸酶的实例包括类转录活化因子核酸酶(TALEN)，锌指核酸酶(ZFN)，大范围核酸酶以及成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR-相关(Cas)系统或这些系统的成分(例如，CRISPR/Cas9)。参见，例如，US 2013/0309670和US2015/0159175，其每一个的全部内容通过引用并入本文，用于所有目的。

供体细胞可在任何阶段引入至宿主胚胎，例如，囊胚阶段或前桑葚胚(pre-morula)阶段(即，四细胞阶段或八细胞阶段)。产生能够通过胚系遗传基因修饰的后代。参见，例如，美国专利US7,294,754，其全部内容通过引用并入本文，用于所有目的。

可选地，产生本文其他地方描述的非人类动物的方法可包括：(1)使用上文所述的用于修饰多能细胞的方法修饰单细胞期胚胎的基因组以包括Cas表达盒和重组酶表达盒中的一种或多种或全部；(2)选择遗传修饰的胚胎；以及(3)将遗传修饰的胚胎植入代孕母体并在代孕母体中进行孕育。产生能够通过胚系遗传基因修饰的后代。

细胞核转移技术还可用于产生非人类哺乳动物。简言之，细胞核转移的方法可包括如下步骤：(1)从卵细胞中除去细胞核或提供除去细胞核的卵细胞；(2)分离或提供待与除去细胞核的卵细胞结合的供体细胞或细胞核；(3)将细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞；(4)将重新构成的细胞植入动物的子宫以形成胚胎；以及(5)使胚胎发育。在这些方法中，卵细胞通常提取自死亡的动物，虽然它们也可分离自活体动物的输卵管和/或卵巢。卵细胞可在多种熟知的培养基中发育成熟，随后除去细胞核。除去卵细胞的细胞核可以多种熟知的方式进行。将供体细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞可通过在透明带下进行供体细胞的显微注射随后进行融合来完成。融合可通过在接触/融合平面上施加DC电脉冲来诱导(电融合)，通过使细胞暴露于融合促进化学试剂(例如，聚乙二醇)来诱导，或通过使诸如仙台病毒(Sendai virus)之类的病毒失活来诱导。可在细胞核供体和受体卵细胞的融合之前，过程中和/或之后通过电学方式和/或非电学方式活化重新构成的细胞。活化方法包括电脉冲，化学诱导休克，精子穿透，增加卵细胞中的二价阳离子的水平，以及降低卵细胞中细胞蛋白质的磷酸化作用(通过激酶抑制剂的方式)。活化的重新构成的细胞或胚胎可在熟知的培养基中培养并随后转移至动物的子宫。参见，例如，US 2008/0092249,WO 1999/005266,US 2004/0177390,WO 2008/017234,和美国专利US7,612,250，其每一个的全部内容通过引用并入本文，用于所有目的。

本文提供的各种不同的方法能够产生基因修饰的非人类F0动物，其中，基因修饰的F0动物的细胞包括Cas表达盒和重组酶表达盒中的一种或多种或全部。基于用于产生F0动物的方法，能够发现F0动物体内具有Cas表达盒和重组酶表达盒中的一种或多种或全部的细胞的数量将会发生改变。通过例如

方法将供体ES细胞引入来自相应的生物体(例如，8细胞阶段小鼠胚胎)的前桑葚阶段胚胎能够产生更高百分比的F0动物的细胞群，从而包括具有目标核苷酸序列的细胞，所述目标核苷酸序列包含靶定的基因修饰。例如，非人类F0动物的至少50％,60％,65％,70％,75％,85％,86％,87％,87％,88％,89％,90％,91％,92％,93％,94％,95％,96％,97％,98％,99％或100％的细胞分布可包含具有靶定的修饰的细胞群。

基因修饰的F0动物的细胞可以是对于Cas表达盒和重组酶表达盒中的一种或多种或全部而言的杂合的或可以是对于Cas表达盒和重组酶表达盒中的一种或多种或全部而言的纯合的。

上文或下文记载的所有专利的提交文件，网页内容，其他公开出版物，登录号等等的全部内容通过引用并入本文用于所有目的，这与将专利的提交文件，网页内容，其他公开出版物，登录号等等中的每一个单独地且特别地通过引用并入本文的程度相同。如果序列的不同版本与不同时间的登录号相关，那么意味着版本与本申请的有效提交日期的登录号相关。有效提交日期是指早于实际提交日期或涉及登录号的优先权申请(如果有的话)的提交日期。同样，如果不同版本的公开出版物、网页等在不同的时间公开，那么，除非另有说明，是指与申请的有效提交日期最近的日期公开的版本。除非另有明确说明，本发明的任何特征、步骤、元素、实施方式或方面可与任何其他联合使用。虽然本发明已通过举例说明和实例的方式进行了一些详细描述为了明确和理解本发明，但是明显的是，可在所附的权利要求的范围内做出一些改变和修饰。

对序列的简要描述

所附的序列表中列出的核苷酸和氨基酸序列显示为使用标准字母缩写用于核苷酸碱基以及三字母编码用于氨基酸。核苷酸序列遵循在序列的5’端开始并且正向书写至3’端(即，每一行从左至右)的标准惯例。仅显示了每个核苷酸序列的一个链，但是可被理解的是通过参考所显示的链互补链也包括在本文内。当提供编码氨基酸序列的核苷酸序列时，应当理解的是，还提供了编码相同氨基酸的密码子简并变体。氨基酸序列遵循在序列的氨基末端开始并正向书写至羧基末端(即，每一行从左至右)的标准惯例。

表3.对序列的描述

实施例

实施例1.Cas9就绪的小鼠的验证

CRISPR/Cas9(一种RNA向导的DNA核酸内切酶)催化DNA在其RNA向导的结合位点产生双链断裂(DSB)。示例性的RNA向导可由与87-核苷酸反式激活RNA(tracrRNA)连接的42-核苷酸CRISPR RNA(crRNA)构成。tracrRNA与crRNA互补并且与crRNA碱基配对，形成功能性crRNA/tracrRNA向导。这种双倍体RNA与Cas9蛋白质结合以形成活性核糖核蛋白(RNP)，其可识别与crRNA的20-核苷酸向导部分具有互补性的基因组。链断裂的第二要求在于Cas9蛋白质必须识别与crRNA的向导部分(crRNA靶向序列)互补的序列直接相邻的前间区序列邻近基序(PAM)。可选地，活性RNP复合物还可通过使用单个向导RNA(sgRNA)取代crRNA/tracrRNA双倍体形成，单个向导RNA(sgRNA)通过共价连接crRNA和tracrRNA形成。例如，这样的sgRNA可通过将crRNA的20核苷酸向导部分与加工过的tracrRNA序列直接融合而形成。sgRNA可以相同的方式与Cas9蛋白质和DNA这两者发生相互作用并且产生与crRNA/tracrRNA双倍体类似的效率。CRISPR细菌天然防御机制已表现出在哺乳动物细胞内有效发挥作用并且激活断裂诱导的内源修复通路。当在基因组中发生双链断裂时，修复通路将会通过经典途径或可选的非同源末端连接(NHEJ)途径或同源重组(也称为同源定向修复(HDR))尝试修复DNA，如果有合适的模板的话。我们可利用这些途径促进哺乳动物细胞内基因组区域的位点特异性删除或外源DNA的插入或HDR。

CRISPR/Cas9系统是一种强有力的基因组工程化工具。然而，对该体系的体内使用的一个限制在于需要同时将所有成分引入至活体生物体中。将这些成分引入至细胞中的典型方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法非常有效，但是该方法具有固有缺陷，这是因为细胞必须依赖质粒DNA构建体先经过转录随后进行翻译，随后使Cas9蛋白质与sgRNA成分发生相互作用。我们认为Cas9诱导的突变频率和重组频率可通过具有组成性可获得的蛋白质得到极大改善。

野生型Cas9编码序列(CDS)是被优化用于在小鼠中表达的密码子。随后合并了N-末端单组分细胞核定位(NLS)信号，C-末端双组分NLS和C末端P2A连接的GFP荧光报告体。Cas9表达盒(MAID2599)在图1和图14以及SEQ ID NO:1中描述。P2A-GFP可用于更好地跟踪Cas9的体内表达。这些成分连同先前液氧混合(floxed)的新霉素耐药盒(neo盒)和合适的剪接信号以及较强的聚腺苷酸化(polyA)信号被工程化至小鼠基因组的Rosa26基因座的第一内含子中。Cas9表达盒中的成分在5’至3’方向上在表4中显示，并且在除去液氧混合的新霉素盒之后的Cas9等位基因的各个成分在表5中显示。由等位基因编码的Cas9-P2A-eGFP蛋白质序列在SEQ ID NO:13中列出。

表4.MAID2599 Cas9等位基因中的各个成分

表5.MAID2600 Cas9等位基因的各个成分

成分	SEQ ID NO:12中的核苷酸区域
		小鼠Rosa26上游序列	1-170
LoxP位点	300-333
		Kozak序列	382-391
密码子-被优化的Cas9编码序列	388-4560
		N-末端单组分NLS	397-417
C-末端双组分NLS	4513-4560
		P2A编码序列	4561-4626
eGFP编码序列	4627-5340
		土拨鼠肝炎病毒转录后调节性元件(WPRE)	5390-5986
牛生长激素聚腺苷酸化信号(bGH polyA)	5987-6202
		小鼠Rosa26下游序列	6262-6411

在通过Cre重组酶的作用除去盒之后，新霉素耐药基因通常被有效转录和翻译；然而，Cas9 CDS通常不会由于存在强poly(A)区域而被表达，这可有效阻断贯通转录(run-through transcription)。在通过Cre重组酶的作用除去neo盒之后，Cas9和GFP蛋白质的杂交mRNA通常会通过Rosa26启动子被组成性表达。在除去neo盒之前和之后靶定的细胞通过等位基因缺失筛选首次被检验到，从而检测靶向载体在Rosa26基因座处的单个位点特异性整合。Cas9和GFP的表达通过从靶定的mESC中提取总RNA来验证，随后通过逆转录以产生cDNA和

qPCR，从而检测逆转录的cDNA(RT-qPCR)。总之，所产生的系统能够在mESC和从其衍生得到的小鼠中连续或条件性地表达(需要除去新霉素耐药盒)一致水平的Cas9蛋白质。

另一版本被设计为不带有P2A-eGFP(MAID2660)。参见图14。Cas9表达盒中5’至3’的方向上的各个成分在表6中显示，并且除去液氧混合的新霉素盒的Cas9等位基因的各个成分在表7中显示。由等位基因编码的Cas9蛋白质序列在SEQ ID NO:19中列出。

表6.MAID2660 Cas9等位基因的成分

表7.MAID2661 Cas9等位基因的成分

成分	SEQ ID NO:18中的核苷酸区域
		小鼠Rosa26上游序列	1-170
LoxP位点	300-333
		Kozak序列	382-391
密码子-被优化的Cas9编码序列	388-4560
		N-末端单组分NLS	397-417
C-末端双组分NLS	4513-4560
		牛生长激素聚腺苷酸化信号(bGH polyA)	4566-4781
小鼠Rosa26下游序列	4841-4990

此外，设计了带有外源CAGG启动子和3xFLAG标签序列的两个版本。第一版本包括P2A-eGFP(MAID2658)，并且第二版本被设计为不带有P2A-eGFP(MAID2672)。参见图14。CAGG-Cas9表达盒的第一版本的在5’至3’方向上的各个成分在表8中显示，并且除去液氧混合的新霉素盒之后的CAGG-Cas9等位基因的第一版本的各个成分在表9中显示。由该等位基因编码的3xFLAG-Cas9-P2A-eGFP蛋白质序列在SEQ ID NO:16中列出。CAGG-Cas9表达盒的第二版本的在5’至3’方向上的各个成分在表10中显示，并且除去了液氧混合的新霉素盒之后的CAGG-Cas9等位基因的第二版本的各个成分在表11中显示。由该等位基因编码的3xFLAG-Cas9蛋白质序列在SEQ ID NO:22中列出。

表8.MAID2658 Cas9等位基因的成分

表9.MAID2659 Cas9等位基因的成分

表10.MAID2672 Cas9等位基因的成分

表11.MAID2673 Cas9等位基因的成分

为了验证MAID2599/MAID2600系统，使用靶定第一目标基因的起始密码子区域和终止密码子区域的两个sgRNA转染带有新霉素盒和不带有新霉素盒的Cas9 mESC(分别为MAID2599和MAID2600)。参见图2A。随后通过等位基因缺失筛选分析Cas9裂解效率以评价gRNA-靶定的Cas9裂解位点中具有插入删除突变的mESC克隆的比例。还确定了一个或两个目标等位基因上Cas9裂解位点之间的DNA被删除(导致无效突变)的mESC克隆的比例。Cas9能够仅在新霉素盒和poly(A)(终止序列)被除去(MAID2600)时诱导基因组改变。为了更好地评价有关同源定向修复的基因组编辑的能力，引入靶向第二目标基因的sgRNA以及作为点突变供体的单链寡脱氧核苷酸(ssODN)。参见图2B。本文描述的组成性Cas9表达系统与通过质粒和ssODN引入Cas9和sgRNA的传统方法进行比较。当与表达sgRNA的质粒合并时，本文描述的Cas9表达系统能够活化断裂诱导的内源修复通路，从而以与通过外源质粒表达Cas9和sgRNA时的频率相同的频率合并期望的点突变。然而，当本文所述的Cas9表达系统与直接递送的sgRNA合并时，本文所述的Cas9系统以接近质粒递送方法的效率的两倍的效率诱导同源定向插入突变形成。

为了确定活体小鼠中内源表达的Cas9的有效性，使用

方法将这些靶定的mESC显微注射至8细胞小鼠胚胎中。参见，例如，US 7,576,259；US 7,659,442；US 7,294,754；US 2008/007800；以及Poueymirou等人,(2007)Nature Biotech.25(1):91-99，其每一个的全部内容通过引用并入本文，用于所有目的。具体而言，在透明带中建立小孔以促进靶定的mESC的注射。这些被注射的8-细胞胚胎被转移至代孕母体以产生带有转基因的活体幼崽。在代孕母体的妊娠期之后，被注射的胚胎产生F0小鼠，其不带有可检测的宿主胚胎分布。完全ES细胞衍生的小鼠是正常的、健康的且有生育能力的(带有种系遗传)。从盒删除的F0小鼠(MAID2600)中收获组织用于GFP可视化，Cas9 mRNA表达和Cas9蛋白质的表达。参见图3A至图3F(亮视场和GFP可视化)以及图4A至图4C(图4A和图4C：Cas9 mRNA的表达，图4B：蛋白质的表达)。图3D显示了杂合的Rosa26Cas9小鼠(MAID2600)中的eGFP表达，但是缺少相应的eGFP在野生型小鼠的肝脏中的表达，图3E显示杂合的Rosa26 Cas9小鼠中的eGFP的表达，但是缺少相应的eGFP在野生型小鼠的肾脏中的表达，图3F显示了杂合的Rosa26 Cas9小鼠中eGFP的表达，但是缺少相应的eGFP在野生型小鼠的脑部的表达。同样，如RT-qPCR所分析的，Cas9 mRNA的表达在杂合的Rosa26 Cas9小鼠的脑部、心脏、肾脏、肝脏、肺、四头肌、脾脏和胸腺中观察到，但是在野生型小鼠的相应的组织中没有观察到Cas9mRNA的表达。参见图4A和图4C。在实验中，通过RT-qPCR分析来自每种组织的等质量的RNA。数据显示Cas9就绪的小鼠在所有组织中以易于检测的水平表达Cas9 mRNA。从Cas9就绪的小鼠中收获各种不同的组织。从十四个小鼠中收获三种组织并且从四个小鼠中收获额外五种组织以评价小鼠之间的差异以及小鼠中各个组织之间的差异。这些组织中的每一种具有提取的RNA。基因组DNA被降解，这样其不算作qPCR反应。RNA被逆转录并且随后将对Cas9具有特异性的分析方法用于检测Cas9转录体。如所预期的，Cas9小鼠表现出显著表达(ct值低于30)，而WT小鼠显示出30以及更高的ct值，这说明Cas9蛋白质没有产生内源表达。

类似地，使用1:250稀释度的ThermoFisher Cas9抗体MA5-23519以及作为对照的肌动蛋白通过western印迹确定的Cas9蛋白质的表达表明Cas9蛋白质在杂合的Rosa26Cas9小鼠(MAID2600)的脾脏、肝脏和脑部中表达，而在野生型小鼠的相同组织中没有观察到Cas9蛋白质。参见图4B。所有三种测试说明在所有被分析的组织中表达水平一致。

通过脂质纳米颗粒(LNP)递送将sgRNA引入至分离自盒删除的Cas9小鼠(MAID2600)的初级肝细胞而进行目标基因3(其编码由肝脏分泌的且在血清中发现的蛋白质)敲除的实验。参见图5B。作为对照，通过在分离自野生型(WT)小鼠的初级肝细胞中表达外源Cas9匹配地进行相同方法引入sgRNA。参见图5A。通过第二代测序(NGS)评价非同源末端连接以测量在目标基因3基因座处的插入/缺失(indel)频率。在实验中使用三种条件：(1)LNP介导的GFP mRNA和对照(即，dead)sg RNA的递送，(2)LNP介导的GFP mRNA和目标基因3sgRNA的递送，以及(3)LNP介导的Cas9 mRNA和目标基因3sgRNA的递送。对于每种条件而言，测试了四种浓度的mRNA：15.6ng/mL,62.5ng/mL,250ng/mL,和1000ng/mL。在野生型初级小鼠肝细胞中，仅在引入Cas9 mRNA和目标基因3sgRNA这两者时观察到插入/缺失频率的剂量依赖性增加。相反，在Cas9就绪的初级小鼠肝细胞中，在引入目标基因3向导RNA和对照GFP mRNA而非Cas9mRNA时观察到类似的剂量依赖作用，并且插入/缺失频率的水平基本与还引入了Cas9 mRNA时所观察到的水平相等。

通过流体动力学DNA递送(HDD)，脂质纳米颗粒(LNP)递送，或通过尾静脉注射引入带有sgRNA表达序列的腺相关病毒(AAV)将sgRNA引入至盒删除的Cas9小鼠(MAID2600)而进行体内敲除目标基因3的实验。参见图6A至图6D。作为对照，通过在野生型(WT)小鼠中表达外源Cas9匹配地进行相同的方法引入sgRNA。对于LNP介导的递送而言，测试了如下三组小鼠：(1)Cas9就绪的小鼠(3雄性+3雌性；2mg/kg对照sgRNA+GFP mRNA)；(2)Cas9就绪的小鼠(3雄性+3雌性；用于目标基因3的2mg/kg sgRNA+GFP mRNA)；以及(3)WT小鼠(3雄性+3雌性；用于目标基因3的2mg/kg sgRNA+Cas9 mRNA)。对于AAV-介导的递送而言，测了如下两组小鼠：(1)Cas9就绪的小鼠(3雄性+3雌性；用于目标基因3的AAV8-sgRNA)；以及(2)WT小鼠(3雄性+3雌性；用于目标基因3的AAV8-sgRNA+AAV8-Cas9)。对于HDD而言，测试了如下两组小鼠：(1)Cas9就绪的小鼠(3雄性+3雌性；用于目标基因3的sgRNA)；以及(2)WT小鼠(3雄性+3雌性；用于目标基因3的sgRNA+Cas9)。Cas9就绪的小鼠一致地且明显地具有比带有外源Cas9表达的WT小鼠更多的靶定基因的失活。

令人惊讶的是，AAV8介导的将目标基因3sgRNA递送至Cas9就绪的小鼠(MAID2600)比在靶定的肝脏目标基因3处的LNP介导的递送或HDD更加有效。参见图6A至图6D。此外，AAV8介导的将目标基因3sgRNA递送至Cas9就绪的小鼠比AAV8介导的将目标基因3sgRNA和Cas9这两者递送至WT小鼠更加有效，而在使用LNP-介导的递送或使用HDD的条件下并未观察到这两者之间具有明显差异。参见图6A至图6D。这些结果表明AAV-介导的将向导RNA递送至Cas9就绪的小鼠对于体内测定gRNA活性而言是特别有效的方式。在引入CRISPR/Cas成分之后第7天和第21天测量了雌性和雄性小鼠中的由目标基因3编码的蛋白质(即，目标蛋白质3)的血清水平。所测试的小鼠包括Cas9就绪的小鼠和野生型小鼠。对照包括既未引入Cas9也未引入目标基因3sgRNA的Cas9就绪的小鼠和WT小鼠。流体力学递送向导RNA或Cas9和向导RNA的组合并未以相对于其中既未引入Cas9也未引入向导RNA的对照WT小鼠更加明显的方式降低目标蛋白质3的血清水平。对于LNP介导的递送而言，将sgRNA引入至Cas9就绪的小鼠产生与其中引入了Cas9和sgRNA这两者的WT小鼠类似的目标蛋白质血清水平，并且，这些条件中的每一个相比于其中既未引入Cas9也未引入向导RNA的Cas9就绪的对照小鼠使得目标蛋白质3的血清水平降低约50％。然而，对于AAV8-介导的递送，将sgRNA递送至Cas9就绪的小鼠使得目标蛋白质3的血清水平相比于引入了Cas9和sgRNA这两者的WT小鼠降低了七倍，甚至使得相比于既未引入Cas9也未引入向导RNA的对照WT小鼠产生更加显著的目标蛋白质3血清水平的降低。21天后，通过AAV8引入了sgRNA的Cas9就绪的小鼠中，目标蛋白质3的血清水平下降至接近检测限。

图7显示了在脂质纳米颗粒(LNP)仅递送sgRNA或递送sgRNA和Cas9 mRNA，流体动力学(HDD)仅递送sgRNA质粒或sgRNA质粒和Cas9质粒，或AAV8仅递送sgRNA或递送sgRNA和Cas9之后一个月野生型小鼠和盒删除的Cas9小鼠(MAID2600)的肝脏中目标基因3基因座处的NHEJ活性百分比(添加/缺失频率)。通过NGS测量了基因座处带有插入/缺失(indel)的肝细胞的百分比。向导RNA或Cas9和向导RNA的组合的流体动力学递送产生较低的indel百分比。对于LNP-介导的递送而言，将sgRNA引入至Cas9就绪的小鼠产生与其中引入了Cas9和sgRNA这两者的WT小鼠类似的indel百分比，并且这些条件中的每一种产生约40％的indel百分比水平。然而，对于AAV8-介导的递送而言，将sgRNA递送至Cas9就绪的小鼠产生比其中引入了Cas9和sgRNA这两者的WT小鼠(约35％)大得多的indel(约75％)百分比，甚至产生比其中既未引入Cas9也未引入向导RNA的对照WT小鼠更加显著增加的indel百分比。

在收获的组织中还进行了第二代测序(NGS)。扩增子测序随后用于评价收获的组织中的编辑数量。特定的目标引物被设计为产生约300bp的产物，其略微偏离了围绕向导的预期切割位点的中心。引物具有添加至其中的“适体”序列，所述“适体”序列使得单个样品在次级PCR反应中带有条码。一旦添加了条码，样品被全部放在一起并且加载至MiSeq。在目标区域上预期进行五千次至一万次读取。随后运行带有信息的程序以对读取结果进行绘图，从而确定每个编辑的精确序列。随后，程序对WT(未编辑)读取结果进行计数并且提供对所有已编辑的读取结果进行的编辑类型的分类(评价在预期的编辑区域进行碱基对的添加和/或删除的数目)。

通过将带有靶定目标基因4的外显子2的sgRNA的Cas9引入至分离自野生型(WT)小鼠的初级肝细胞进行敲除目标基因4(其编码II型膜结合糖蛋白)的实验。测试了五种不同的sgRNA(向导1-5)。通过脂质体将Cas9/sgRAN核糖核蛋白(RNP)复合物引入至细胞中。随后通过第二代测序(NGS)评价非同源末端连接，从而测量在目标基因4基因座处的indel频率。编辑百分比是总NHEJ事件相对于总读取结果的测量值。NHEJ事件被认为是在切割位点前后20bp中发生的所有编辑(插入，删除，碱基改变)。向导1-5的编辑百分比如下：35.4％,37.4％,43.8％,51.2％,和55.8％(数据未显示)。

通过AAV8将相同的五种sgRNA引入至不同的盒删除的Cas9小鼠(MAID2600)进行目标基因4的体内敲除实验。具体而言，将由U6启动子表达的各个向导包装在AAV8中并通过尾静脉注射将其引入至6至12周龄的盒删除的Cas9小鼠中。引入的病毒载量为1x 10¹¹至1x10¹²，体积大约为50-100μL。注射后3至4周收获肝脏。编辑百分比被计算为初级肝细胞中的编辑百分比并且在图8A中显示。编辑水平与初级肝细胞中观察到的编辑水平一致并且事实上更高。还测试了自目标基因4转录的mRNA的表达水平。如图8B所示，每种gRNA降低了注射后3至4周收获的肝脏中的目标基因4转录的mRNA的相对水平。

还进行了测试肝脏中若干种其他目标基因中的编辑百分比的实验。在每种实验中，小鼠的年龄为约6至12周。对于每种目标基因而言，针对关键外显子设计了五种不同的向导RNA。通过尾静脉注射由体积为约50-100μL病毒载量为1x10¹¹至1x10¹²的AAV8递送向导RNA。注射后3至4周收获肝脏。如前所述测定编辑百分比。表12中显示了通过AAV8-gRNA的递送在盒删除的Cas9小鼠(MAID2600)的肝脏中的编辑百分比。每种基因的最佳gRNA在肝脏中产生48％至70％的体内编辑。

表12.肝脏中的编辑百分比

目标基因	向导#1	向导#2	向导#3	向导#4	向导#5
						5	49.4％	37.1％	43.3％	21.3％	35.7％
6	25.6％	68.9％	44.8％	63.3％	42.1％
						7	43.5％	36.1％	30.0％	48.2％	41.4％
8	24.5％	35.2％	66.1％	56.3％	45.5％
						9	27.8％	32.7％	47.4％	65.0％	38.9％
4	52.3％	58.8％	63.6％	57.0％	61.5％

实施例2.Cas9就绪的小鼠的可诱导性的验证

实施例1中描述的LSL-Cas9等位基因(MAID2599)包括Cas9编码序列的上游的液氧混合的强poly(A)区域(lox-stop-lox，或LSL)。在通过Cre重组酶作用除去盒之前，新霉素耐药基因通常被有效地转录和翻译；然而，Cas9 CDS由于存在强poly(A)区域而不会正常地表达，这可有效阻断贯通转录。在通过Cre重组酶的作用除去neo盒之后，Cas9和GFP蛋白质的杂交mRNA通常被Rosa26启动子组成性表达。这使得Cas9等位基因是可诱导的。出于以下原因这是有益的。编辑某些组织(例如，免疫细胞)中的一些基因可能是有害的，这会潜在地引起免疫反应。此外，在一些情况下，靶定的个体整体上进行基因突变可能是致死性的，而在特定组织或细胞类型中的基因突变会是有益的。MAID2599等位基因的可诱导的本质对通过组织特异性或细胞特异性方式仅活化Cas9而编辑的组织和细胞类型具有更高的特异性。

为了测试Cas9的表达在肝脏中的体内可诱导性，在Precision NanosystemsBenchtop NanoAssmblr上配制了含有Cre重组酶mRNA的脂质纳米颗粒(LNP)。将来自Trilink的Cre mRNA(批号#7211)在10mM柠檬酸钠中进行稀释并且以3:1的比例通过NanoAssemblr盒与摩尔比为50:10:38.5:1.5的阳离子脂质，DSPC，胆固醇和PEG-DMG的脂质组合进行混合。该制剂易于被肝脏吸收。得到的LNP-Cre以1mg/kg的量通过LSL-Cas9小鼠(MAID2599)的尾静脉进行注射。在对照小鼠中，未注射LNP-Cre。1周后，宰杀小鼠并且收获器官用于western分析(其使用抗-Cas9(7A9)单克隆抗体(Invitrogen Cat#MA5-23519)和抗-肌动蛋白(C4)单克隆抗体(Millipore Sigma Cat#MAB1501))。来自盒删除的Cas9小鼠(MAID2600)的器官用作阳性对照。在这些小鼠中，已通过Cre重组酶删除了LSL盒。结果在图9中显示，其显示了通过用于肝脏特异性基因编辑的LNP-Cre递送对肝脏特异性Cas9活化的概念验证。

随后体内测试了Cas9介导的基因编辑的可诱导性。LNP-Cre如上所述的进行配制。向如下几组小鼠给药LNP-Cre和AAV8-gRNA靶定的目标基因3(通过尾静脉注射进行共注射)：(1)由LNP-Cre和AAV8-gRNA处理的3LSL-Cas9小鼠；(2)由LNP-Cre和PBS处理的3LSL-Cas9小鼠；(3)由PBS和AAV8-gRNA处理的3LSL-Cas9小鼠；(4)仅由PBS处理的3LSL-Cas9小鼠；(5)由LNP-Cre处理的3盒删除的Cas9小鼠；(6)由AAV8-gRNA处理的3盒删除的Cas9小鼠；(7)由PBS处理的3盒删除的Cas9小鼠；以及(8)3WT小鼠(未处理的)。在递送了LNP-Cre的组中，以1mg/kg的浓度递送LNP-Cre。在递送AAV8-gRNA的组中，以约2x 10¹¹的病毒载量递送AAV8-gRNA。注射后1周和3周，给小鼠抽血用于血清化学测试并且测量目标蛋白质3的循环血清水平。在第三周，还收获组织用于NGS和western分析。通过ELISA测量目标蛋白质3的血清水平。结果在图10中显示。递送LNP-Cre以及AAV8-gRNA至LSL-Cas9小鼠产生目标蛋白质3的血清水平的降低，这与在递送了AAV8-gRNA的盒删除的Cas9小鼠中所观察到的降低一致。这些ELISA结果与注射后3周的小鼠中分离的肝脏中的目标基因3的编辑百分比的NGS结果一致。参见图11。

接着，使LSL-Cas9小鼠与来自Jax(3601-Tg(Alb-cre)21Mgn；MAID3601)的白蛋白-Cre小鼠杂交，在白蛋白-Cre小鼠中，白蛋白启动子可操作地连接至Cre重组酶编码序列并且驱动其在肝脏中进行表达。杂交之后，从小鼠中收获若干组织进行western印迹分析。从没有与白蛋白-Cre小鼠杂交的LSL-Cas9小鼠中收获相应的组织。随后进行测量肝脏和大脑中Cas9表达的western印迹。使用肌动蛋白作为负载对照。Cas9的预期尺寸为150.48kD，并且肌动蛋白的预期尺寸为41.25kD。使用了17.5μg的肝脏蛋白细胞溶解产物和脑蛋白细胞溶解产物。使用TruCut v2 Cas9(17.5μg)作为阳性对照。如图12A所示，在LSL-Cas9/Alb-Cre小鼠的肝脏中观察到Cas9表达但是在LSL-Cas9小鼠的肝脏中没有观察到Cas9表达。在任何小鼠的脑组织中均未观察到Cas9的表达(参见图12B)，这证实了在肝脏中特异性诱导Cas9的表达。

在这些小鼠中进行测试Cas9介导的体内基因编辑的实验。实验包括通过尾静脉注射向如下五组8至12周龄的小鼠注射AAV8-gRNA靶定的目标基因3：(1)3只LSL-Cas9:Alb-Cre小鼠(MAID2599 Het,MAID3601Het)；(2)3只WT:Alb-Cre小鼠(MAID2599 WT,MAID3601Het)；(3)3只LSL-Cas9:WT小鼠(MAID2599 Het,MAID3601 WT)；(4)3只Cas9小鼠(MAID2600Het or Hom)；和(5)3只75/25(50500WT)小鼠。每组中没有注射AAV8-gRNA的小鼠作为对照。在递送了AAV8-gRNA的组中，递送的病毒载量为约2x10¹¹。注射后1周，从小鼠中取血用于血清化学分析和ELISA分析。注射后三周，从小鼠中取血并收获组织。结果在图13中显示。LSL-Cas9小鼠与白蛋白-Cre小鼠的杂交并随后注射AAV8-gRNA使得目标蛋白质3的血清水平降低，这与递送了AAV8-gRNA的盒删除的Cas9小鼠中观察到的降低一致。

本文所述的Cas9就绪的小鼠系统能够诱导比基于外源引入Cas9的其他方法更强的基因编辑。而且，该系统可基于新霉素盒的删除条件性表达Cas9。通过将该系统与各种不同的Cre删除的小鼠谱系组合，可控制Cas9诱导的基因组编辑的时机并且可在体内提供组织特异性Cas9表达。

序列表

<110> 瑞泽恩制药公司

<120> CAS转基因小鼠胚胎干细胞和小鼠及其应用

<130> 57766-516569

<150> US 62/539,275

<151> 2017-07-31

<160> 38

<170> PatentIn version 3.5

<210> 1

<211> 8628

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (424)..(2489)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (2517)..(2550)

<223> LoxP

<220>

<221> misc_feature

<222> (2599)..(2608)

<223> Kozak

<220>

<221> misc_feature

<222> (2605)..(6777)

<223> Cas9

<220>

<221> misc_feature

<222> (2614)..(2634)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (6730)..(6777)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (6778)..(6843)

<223> P2A

<220>

<221> misc_feature

<222> (6844)..(7557)

<223> eGFP

<220>

<221> misc_feature

<222> (7607)..(8203)

<223> WPRE

<220>

<221> misc_feature

<222> (8204)..(8419)

<223> bGH polyA

<220>

<221> misc_feature

<222> (8479)..(8628)

<223> 小鼠Rosa26下游

<400> 1

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180

ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240

cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300

taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc aggaattgtt 360

gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa 420

accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 480

gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 540

ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 600

ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 660

tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 720

gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 780

gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 840

gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 900

gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 960

cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 1020

atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 1080

cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 1140

gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 1200

tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag aaattgatga 1260

tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 1320

aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 1380

tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 1440

taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 1500

attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560

tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620

aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680

gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980

tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040

aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220

atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460

catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520

cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580

gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640

agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700

aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760

aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820

agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880

ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940

ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000

gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060

accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120

ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180

atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240

gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300

atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360

ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420

ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480

tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540

ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600

gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660

aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720

ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780

accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840

gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900

caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960

ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020

accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080

gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140

aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200

aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260

aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320

gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380

agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440

ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500

tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560

aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620

ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680

gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740

gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800

aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860

gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920

gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980

gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040

ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100

caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160

tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220

aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280

ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340

ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400

cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460

aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520

ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580

gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640

agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700

gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760

ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820

aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880

gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940

agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000

tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060

gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120

atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180

ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240

ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300

ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360

aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420

ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480

aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540

gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600

tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660

accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720

ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaaggga 6780

agcggagcca ctaacttctc cctgttgaaa caagcagggg atgtcgaaga gaatcccggg 6840

ccagtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 6900

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 6960

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 7020

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 7080

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 7140

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 7200

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 7260

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 7320

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 7380

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 7440

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 7500

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 7560

acgcgtatgc atggccggcc ctgcaggaat tcgatatcaa gcttatcgat aatcaacctc 7620

tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 7680

tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 7740

ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 7800

tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 7860

ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 7920

cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 7980

acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 8040

ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 8100

accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 8160

ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgcgacctc gacctcgact 8220

gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 8280

gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 8340

agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 8400

gaagacaatg gcaggcatgc tggggaacta gtggtgccag ggcgtgccct tgggctcccc 8460

gggcgcggcg gccatcgctc gagtaaaatt ggagggacaa gacttcccac agattttcgg 8520

ttttgtcggg aagtttttta ataggggcaa ataaggaaaa tgggaggata ggtagtcatc 8580

tggggtttta tgcagcaaaa ctacaggtta ttattgcttg tgatccgc 8628

<210> 2

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 2

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 3

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 3

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 4

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 4

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 5

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 5

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

<210> 6

<211> 82

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 6

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggca ccgagucggu gc 82

<210> 7

<211> 76

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 7

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugc 76

<210> 8

<211> 86

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 8

guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60

uugaaaaagu ggcaccgagu cggugc 86

<210> 9

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (2)..(21)

<223> n = A, T, C, or G

<400> 9

gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 10

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(21)

<223> n = A, T, C, or G

<400> 10

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 11

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (3)..(23)

<223> n = A, T, C, or G

<400> 11

ggnnnnnnnn nnnnnnnnnn nnngg 25

<210> 12

<211> 6411

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (382)..(391)

<223> Kozak

<220>

<221> misc_feature

<222> (388)..(4560)

<223> Cas9

<220>

<221> misc_feature

<222> (397)..(417)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (4513)..(4560)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (4561)..(4626)

<223> P2A

<220>

<221> misc_feature

<222> (4627)..(5340)

<223> eGFP

<220>

<221> misc_feature

<222> (5390)..(5986)

<223> WPRE

<220>

<221> misc_feature

<222> (5987)..(6202)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (6262)..(6411)

<223> 小鼠Rosa26下游

<400> 12

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180

ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240

cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300

taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360

agtgcccggg aattcgctag ggccaccatg gacaagccca agaaaaagcg gaaagtgaag 420

tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 480

tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgacaggca cagcatcaag 540

aagaacctga tcggcgccct gctgttcgac agcggcgaaa cagccgaggc caccagactg 600

aagagaaccg ccagaagaag atacaccagg cggaagaaca ggatctgcta tctgcaagag 660

atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 720

ttcctggtgg aagaggacaa gaagcacgag agacacccca tcttcggcaa catcgtggac 780

gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 840

agcaccgaca aggccgacct gagactgatc tacctggccc tggcccacat gatcaagttc 900

agaggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 960

ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1020

ggcgtggacg ccaaggctat cctgtctgcc agactgagca agagcagaag gctggaaaat 1080

ctgatcgccc agctgcccgg cgagaagaag aacggcctgt tcggcaacct gattgccctg 1140

agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 1200

cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 1260

cagtacgccg acctgttcct ggccgccaag aacctgtctg acgccatcct gctgagcgac 1320

atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1380

tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1440

gagaagtaca aagaaatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgat 1500

ggcggcgcta gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1560

ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgagaaa gcagagaacc 1620

ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc tatcctgaga 1680

aggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1740

accttcagga tcccctacta cgtgggcccc ctggccagag gcaacagcag attcgcctgg 1800

atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1860

ggcgccagcg cccagagctt catcgagaga atgacaaact tcgataagaa cctgcccaac 1920

gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 1980

accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 2040

aaaaaggcca tcgtggacct gctgttcaag accaacagaa aagtgaccgt gaagcagctg 2100

aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 2160

gatagattca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 2220

gacttcctgg ataacgaaga gaacgaggac attctggaag atatcgtgct gaccctgaca 2280

ctgtttgagg accgcgagat gatcgaggaa aggctgaaaa cctacgctca cctgttcgac 2340

gacaaagtga tgaagcagct gaagagaagg cggtacaccg gctggggcag gctgagcaga 2400

aagctgatca acggcatcag agacaagcag agcggcaaga caatcctgga tttcctgaag 2460

tccgacggct tcgccaaccg gaacttcatg cagctgatcc acgacgacag cctgacattc 2520

aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg actctctgca cgagcatatc 2580

gctaacctgg ccggcagccc cgctatcaag aagggcatcc tgcagacagt gaaggtggtg 2640

gacgagctcg tgaaagtgat gggcagacac aagcccgaga acatcgtgat cgagatggct 2700

agagagaacc agaccaccca gaagggacag aagaactccc gcgagaggat gaagagaatc 2760

gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2820

cagctgcaga acgagaagct gtacctgtac tacctgcaga atggccggga tatgtacgtg 2880

gaccaggaac tggacatcaa cagactgtcc gactacgatg tggaccatat cgtgcctcag 2940

agctttctga aggacgactc catcgataac aaagtgctga ctcggagcga caagaacaga 3000

ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcga 3060

cagctgctga acgccaagct gattacccag aggaagttcg ataacctgac caaggccgag 3120

agaggcggcc tgagcgagct ggataaggcc ggcttcatca agaggcagct ggtggaaacc 3180

agacagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 3240

gaaaacgata agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 3300

gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3360

cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3420

gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3480

agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3540

tttttcaaga ccgaaatcac cctggccaac ggcgagatca gaaagcgccc tctgatcgag 3600

acaaacggcg aaaccgggga gatcgtgtgg gataagggca gagacttcgc cacagtgcga 3660

aaggtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3720

ttcagcaaag agtctatcct gcccaagagg aacagcgaca agctgatcgc cagaaagaag 3780

gactgggacc ccaagaagta cggcggcttc gacagcccta ccgtggccta ctctgtgctg 3840

gtggtggcta aggtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3900

gggatcacca tcatggaaag aagcagcttt gagaagaacc ctatcgactt tctggaagcc 3960

aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4020

gagctggaaa acggcagaaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 4080

gagctggccc tgcctagcaa atatgtgaac ttcctgtacc tggcctccca ctatgagaag 4140

ctgaagggca gccctgagga caacgaacag aaacagctgt ttgtggaaca gcataagcac 4200

tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 4260

gccaatctgg acaaggtgct gtctgcctac aacaagcaca gggacaagcc tatcagagag 4320

caggccgaga atatcatcca cctgttcacc ctgacaaacc tgggcgctcc tgccgccttc 4380

aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4440

gccaccctga tccaccagag catcaccggc ctgtacgaga caagaatcga cctgtctcag 4500

ctgggaggcg acaagagacc tgccgccact aagaaggccg gacaggccaa aaagaagaag 4560

ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 4620

gggccagtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 4680

gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 4740

tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 4800

accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 4860

aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 4920

ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 4980

ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 5040

cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 5100

aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 5160

gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 5220

cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 5280

gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 5340

taaacgcgta tgcatggccg gccctgcagg aattcgatat caagcttatc gataatcaac 5400

ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 5460

cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 5520

tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 5580

ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 5640

gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 5700

cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 5760

ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 5820

ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 5880

cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 5940

gccctcagac gagtcggatc tccctttggg ccgcctcccc gcatcgcgac ctcgacctcg 6000

actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 6060

ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 6120

ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 6180

tgggaagaca atggcaggca tgctggggaa ctagtggtgc cagggcgtgc ccttgggctc 6240

cccgggcgcg gcggccatcg ctcgagtaaa attggaggga caagacttcc cacagatttt 6300

cggttttgtc gggaagtttt ttaatagggg caaataagga aaatgggagg ataggtagtc 6360

atctggggtt ttatgcagca aaactacagg ttattattgc ttgtgatccg c 6411

<210> 13

<211> 1651

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<220>

<221> MISC_FEATURE

<222> (1)..(1391)

<223> Cas9

<220>

<221> MISC_FEATURE

<222> (1392)..(1413)

<223> P2A

<220>

<221> MISC_FEATURE

<222> (1414)..(1651)

<223> eGFP

<400> 13

Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu

1 5 10 15

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

20 25 30

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

35 40 45

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

50 55 60

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

65 70 75 80

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

85 90 95

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

100 105 110

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

115 120 125

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

130 135 140

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

145 150 155 160

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

165 170 175

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

180 185 190

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

195 200 205

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

210 215 220

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

225 230 235 240

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

245 250 255

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

260 265 270

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

275 280 285

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

290 295 300

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

305 310 315 320

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

325 330 335

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

340 345 350

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

355 360 365

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

370 375 380

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

385 390 395 400

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

405 410 415

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

420 425 430

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

435 440 445

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

450 455 460

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

465 470 475 480

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

485 490 495

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

500 505 510

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

515 520 525

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

530 535 540

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

545 550 555 560

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

565 570 575

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

580 585 590

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

595 600 605

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

610 615 620

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

625 630 635 640

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

645 650 655

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

660 665 670

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

675 680 685

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

690 695 700

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

705 710 715 720

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

725 730 735

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

740 745 750

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

755 760 765

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

770 775 780

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

785 790 795 800

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

805 810 815

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

820 825 830

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

835 840 845

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

850 855 860

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

865 870 875 880

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

885 890 895

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

900 905 910

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

915 920 925

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

930 935 940

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

945 950 955 960

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

965 970 975

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

980 985 990

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

995 1000 1005

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1010 1015 1020

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1025 1030 1035

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1040 1045 1050

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1055 1060 1065

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1070 1075 1080

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1085 1090 1095

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1100 1105 1110

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1115 1120 1125

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1130 1135 1140

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1145 1150 1155

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1160 1165 1170

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1175 1180 1185

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1190 1195 1200

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1205 1210 1215

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1220 1225 1230

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1235 1240 1245

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1250 1255 1260

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1265 1270 1275

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1280 1285 1290

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1295 1300 1305

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1310 1315 1320

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1325 1330 1335

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1340 1345 1350

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1355 1360 1365

Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1370 1375 1380

Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Ala Thr Asn Phe

1385 1390 1395

Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

1400 1405 1410

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1415 1420 1425

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser

1430 1435 1440

Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys

1445 1450 1455

Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu

1460 1465 1470

Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro

1475 1480 1485

Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu

1490 1495 1500

Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn

1505 1510 1515

Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val

1520 1525 1530

Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn

1535 1540 1545

Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val

1550 1555 1560

Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe

1565 1570 1575

Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp

1580 1585 1590

His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu

1595 1600 1605

Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp

1610 1615 1620

Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr

1625 1630 1635

Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

1640 1645 1650

<210> 14

<211> 10439

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (195)..(1913)

<223> CAGG 启动子

<220>

<221> misc_feature

<222> (1996)..(2029)

<223> LoxP

<220>

<221> misc_feature

<222> (2120)..(4185)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (4213)..(4246)

<223> LoxP

<220>

<221> misc_feature

<222> (4341)..(4350)

<223> Kozak

<220>

<221> misc_feature

<222> (4350)..(4415)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (4416)..(8588)

<223> Cas9

<220>

<221> misc_feature

<222> (4425)..(4445)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (8541)..(8588)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (8589)..(8654)

<223> P2A

<220>

<221> misc_feature

<222> (8655)..(9368)

<223> eGFP

<220>

<221> misc_feature

<222> (9418)..(10014)

<223> WPRE

<220>

<221> misc_feature

<222> (10015)..(10230)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (10290)..(10439)

<223> 小鼠Rosa26下游

<400> 14

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180

ggcctccaag gcctactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 240

catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 300

acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 360

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 420

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 480

ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 540

tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 600

cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 660

tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 720

gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 780

cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 840

ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 900

gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 960

tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 1020

aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 1080

cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 1140

ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1200

gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1260

gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1320

cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1380

tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1440

ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1500

cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1560

gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1620

cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1680

gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1740

gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1800

gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1860

cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcgctaggag 1920

aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc cactagtgga 1980

tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt aggtccctcg 2040

acctgcagga attgttgaca attaatcatc ggcatagtat atcggcatag tataatacga 2100

caaggtgagg aactaaacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 2160

tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 2220

ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 2280

cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 2340

cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 2400

gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 2460

gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2520

cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2580

tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2640

cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2700

ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2760

gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2820

gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2880

gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaggggatc cgctgtaagt 2940

ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 3000

gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 3060

gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 3120

tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 3180

aattaagggc cagctcattc ctcccactca tgatctatag atctatagat ctctcgtggg 3240

atcattgttt ttctcttgat tcccactttg tggttctaag tactgtggtt tccaaatgtg 3300

tcagtttcat agcctgaaga acgagatcag cagcctctgt tccacataca cttcattctc 3360

agtattgttt tgccaagttc taattccatc agaagcttgc agatctgcga ctctagagga 3420

tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt 3480

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 3540

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 3600

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 3660

ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac atttgtagag 3720

gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3780

gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3840

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3900

ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata atcagccata 3960

ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 4020

aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 4080

aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 4140

gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc aagctgatcc 4200

ggaaccctta atataacttc gtataatgta tgctatacga agttattagg tccctcgacc 4260

tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct agatcgaatt 4320

cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga gactacaagg 4380

atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag aaaaagcgga 4440

aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg gccgtgatca 4500

ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gacaggcaca 4560

gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca gccgaggcca 4620

ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg atctgctatc 4680

tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg 4740

aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc ttcggcaaca 4800

tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac 4860

tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg gcccacatga 4920

tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg 4980

acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca 5040

acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag agcagaaggc 5100

tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc ggcaacctga 5160

ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg 5220

ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga 5280

tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac gccatcctgc 5340

tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga 5400

tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc 5460

agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc tacgccggct 5520

acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc atcctggaaa 5580

agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgagaaagc 5640

agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcta 5700

tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 5760

agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc aacagcagat 5820

tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg 5880

tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc gataagaacc 5940

tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtaca 6000

acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg 6060

gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa gtgaccgtga 6120

agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg 6180

gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg aaaattatca 6240

aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat atcgtgctga 6300

ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc tacgctcacc 6360

tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc tggggcaggc 6420

tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca atcctggatt 6480

tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac gacgacagcc 6540

tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac tctctgcacg 6600

agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg cagacagtga 6660

aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac atcgtgatcg 6720

agatggctag agagaaccag accacccaga agggacagaa gaactcccgc gagaggatga 6780

agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg 6840

aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat ggccgggata 6900

tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg gaccatatcg 6960

tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact cggagcgaca 7020

agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact 7080

actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat aacctgacca 7140

aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag aggcagctgg 7200

tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta 7260

agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc 7320

tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc 7380

accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc 7440

ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga 7500

tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca 7560

tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga aagcgccctc 7620

tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga gacttcgcca 7680

cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga 7740

caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag ctgatcgcca 7800

gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc gtggcctact 7860

ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag 7920

agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct atcgactttc 7980

tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact 8040

ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc gaactgcaga 8100

agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg gcctcccact 8160

atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt gtggaacagc 8220

ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc 8280

tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg gacaagccta 8340

tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg ggcgctcctg 8400

ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg 8460

tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca agaatcgacc 8520

tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga caggccaaaa 8580

agaagaaggg aagcggagcc actaacttct ccctgttgaa acaagcaggg gatgtcgaag 8640

agaatcccgg gccagtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 8700

tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 8760

atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 8820

cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 8880

accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 8940

gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 9000

gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 9060

tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 9120

agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 9180

tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 9240

ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 9300

atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 9360

tgtacaagta aacgcgtatg catggccggc cctgcaggaa ttcgatatca agcttatcga 9420

taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 9480

tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 9540

tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 9600

gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 9660

tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 9720

tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 9780

gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 9840

cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 9900

caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 9960

tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgcgacct 10020

cgacctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 10080

ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 10140

cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 10200

gggaggattg ggaagacaat ggcaggcatg ctggggaact agtggtgcca gggcgtgccc 10260

ttgggctccc cgggcgcggc ggccatcgct cgagtaaaat tggagggaca agacttccca 10320

cagattttcg gttttgtcgg gaagtttttt aataggggca aataaggaaa atgggaggat 10380

aggtagtcat ctggggtttt atgcagcaaa actacaggtt attattgctt gtgatccgc 10439

<210> 15

<211> 8222

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (195)..(1913)

<223> CAGG 启动子

<220>

<221> misc_feature

<222> (1996)..(2029)

<223> LoxP

<220>

<221> misc_feature

<222> (2124)..(2133)

<223> Kozak

<220>

<221> misc_feature

<222> (2133)..(2198)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (2199)..(6371)

<223> Cas9

<220>

<221> misc_feature

<222> (2208)..(2228)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (6324)..(6371)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (6372)..(6437)

<223> P2A

<220>

<221> misc_feature

<222> (6438)..(7151)

<223> eGFP

<220>

<221> misc_feature

<222> (7201)..(7797)

<223> WPRE

<220>

<221> misc_feature

<222> (7798)..(8013)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (8073)..(8222)

<223> 小鼠Rosa26下游

<400> 15

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180

ggcctccaag gcctactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 240

catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 300

acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 360

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 420

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 480

ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 540

tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 600

cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 660

tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 720

gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 780

cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 840

ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 900

gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 960

tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 1020

aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 1080

cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 1140

ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1200

gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1260

gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1320

cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1380

tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1440

ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1500

cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1560

gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1620

cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1680

gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1740

gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1800

gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1860

cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcgctaggag 1920

aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc cactagtgga 1980

tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt aggtccctcg 2040

acctgcagcc caagctagtg cccgggtagg tccctcgacc tgcagcccaa gctagatcga 2100

attcggccgg ccttcgaaca cgtgccacca tggactataa ggaccacgac ggagactaca 2160

aggatcatga tattgattac aaagacgatg acgataagat ggacaagccc aagaaaaagc 2220

ggaaagtgaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc tgggccgtga 2280

tcaccgacga gtacaaggtg cccagcaaga aattcaaggt gctgggcaac accgacaggc 2340

acagcatcaa gaagaacctg atcggcgccc tgctgttcga cagcggcgaa acagccgagg 2400

ccaccagact gaagagaacc gccagaagaa gatacaccag gcggaagaac aggatctgct 2460

atctgcaaga gatcttcagc aacgagatgg ccaaggtgga cgacagcttc ttccacagac 2520

tggaagagtc cttcctggtg gaagaggaca agaagcacga gagacacccc atcttcggca 2580

acatcgtgga cgaggtggcc taccacgaga agtaccccac catctaccac ctgagaaaga 2640

aactggtgga cagcaccgac aaggccgacc tgagactgat ctacctggcc ctggcccaca 2700

tgatcaagtt cagaggccac ttcctgatcg agggcgacct gaaccccgac aacagcgacg 2760

tggacaagct gttcatccag ctggtgcaga cctacaacca gctgttcgag gaaaacccca 2820

tcaacgccag cggcgtggac gccaaggcta tcctgtctgc cagactgagc aagagcagaa 2880

ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaacggcctg ttcggcaacc 2940

tgattgccct gagcctgggc ctgaccccca acttcaagag caacttcgac ctggccgagg 3000

atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac ctgctggccc 3060

agatcggcga ccagtacgcc gacctgttcc tggccgccaa gaacctgtct gacgccatcc 3120

tgctgagcga catcctgaga gtgaacaccg agatcaccaa ggcccccctg agcgcctcta 3180

tgatcaagag atacgacgag caccaccagg acctgaccct gctgaaagct ctcgtgcggc 3240

agcagctgcc tgagaagtac aaagaaatct tcttcgacca gagcaagaac ggctacgccg 3300

gctacatcga tggcggcgct agccaggaag agttctacaa gttcatcaag cccatcctgg 3360

aaaagatgga cggcaccgag gaactgctcg tgaagctgaa cagagaggac ctgctgagaa 3420

agcagagaac cttcgacaac ggcagcatcc cccaccagat ccacctggga gagctgcacg 3480

ctatcctgag aaggcaggaa gatttttacc cattcctgaa ggacaaccgg gaaaagatcg 3540

agaagatcct gaccttcagg atcccctact acgtgggccc cctggccaga ggcaacagca 3600

gattcgcctg gatgaccaga aagagcgagg aaaccatcac cccctggaac ttcgaggaag 3660

tggtggacaa gggcgccagc gcccagagct tcatcgagag aatgacaaac ttcgataaga 3720

acctgcccaa cgagaaggtg ctgcccaagc acagcctgct gtacgagtac ttcaccgtgt 3780

acaacgagct gaccaaagtg aaatacgtga ccgagggaat gagaaagccc gccttcctga 3840

gcggcgagca gaaaaaggcc atcgtggacc tgctgttcaa gaccaacaga aaagtgaccg 3900

tgaagcagct gaaagaggac tacttcaaga aaatcgagtg cttcgactcc gtggaaatct 3960

ccggcgtgga agatagattc aacgcctccc tgggcacata ccacgatctg ctgaaaatta 4020

tcaaggacaa ggacttcctg gataacgaag agaacgagga cattctggaa gatatcgtgc 4080

tgaccctgac actgtttgag gaccgcgaga tgatcgagga aaggctgaaa acctacgctc 4140

acctgttcga cgacaaagtg atgaagcagc tgaagagaag gcggtacacc ggctggggca 4200

ggctgagcag aaagctgatc aacggcatca gagacaagca gagcggcaag acaatcctgg 4260

atttcctgaa gtccgacggc ttcgccaacc ggaacttcat gcagctgatc cacgacgaca 4320

gcctgacatt caaagaggac atccagaaag cccaggtgtc cggccagggc gactctctgc 4380

acgagcatat cgctaacctg gccggcagcc ccgctatcaa gaagggcatc ctgcagacag 4440

tgaaggtggt ggacgagctc gtgaaagtga tgggcagaca caagcccgag aacatcgtga 4500

tcgagatggc tagagagaac cagaccaccc agaagggaca gaagaactcc cgcgagagga 4560

tgaagagaat cgaagagggc atcaaagagc tgggcagcca gatcctgaaa gaacaccccg 4620

tggaaaacac ccagctgcag aacgagaagc tgtacctgta ctacctgcag aatggccggg 4680

atatgtacgt ggaccaggaa ctggacatca acagactgtc cgactacgat gtggaccata 4740

tcgtgcctca gagctttctg aaggacgact ccatcgataa caaagtgctg actcggagcg 4800

acaagaacag aggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag aagatgaaga 4860

actactggcg acagctgctg aacgccaagc tgattaccca gaggaagttc gataacctga 4920

ccaaggccga gagaggcggc ctgagcgagc tggataaggc cggcttcatc aagaggcagc 4980

tggtggaaac cagacagatc acaaagcacg tggcacagat cctggactcc cggatgaaca 5040

ctaagtacga cgaaaacgat aagctgatcc gggaagtgaa agtgatcacc ctgaagtcca 5100

agctggtgtc cgatttccgg aaggatttcc agttttacaa agtgcgcgag atcaacaact 5160

accaccacgc ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg atcaaaaagt 5220

accctaagct ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac gtgcggaaga 5280

tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc ttctacagca 5340

acatcatgaa ctttttcaag accgaaatca ccctggccaa cggcgagatc agaaagcgcc 5400

ctctgatcga gacaaacggc gaaaccgggg agatcgtgtg ggataagggc agagacttcg 5460

ccacagtgcg aaaggtgctg agcatgcccc aagtgaatat cgtgaaaaag accgaggtgc 5520

agacaggcgg cttcagcaaa gagtctatcc tgcccaagag gaacagcgac aagctgatcg 5580

ccagaaagaa ggactgggac cccaagaagt acggcggctt cgacagccct accgtggcct 5640

actctgtgct ggtggtggct aaggtggaaa agggcaagtc caagaaactg aagagtgtga 5700

aagagctgct ggggatcacc atcatggaaa gaagcagctt tgagaagaac cctatcgact 5760

ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag ctgcctaagt 5820

actccctgtt cgagctggaa aacggcagaa agagaatgct ggcctctgcc ggcgaactgc 5880

agaagggaaa cgagctggcc ctgcctagca aatatgtgaa cttcctgtac ctggcctccc 5940

actatgagaa gctgaagggc agccctgagg acaacgaaca gaaacagctg tttgtggaac 6000

agcataagca ctacctggac gagatcatcg agcagatcag cgagttctcc aagagagtga 6060

tcctggccga cgccaatctg gacaaggtgc tgtctgccta caacaagcac agggacaagc 6120

ctatcagaga gcaggccgag aatatcatcc acctgttcac cctgacaaac ctgggcgctc 6180

ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc agcaccaaag 6240

aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag acaagaatcg 6300

acctgtctca gctgggaggc gacaagagac ctgccgccac taagaaggcc ggacaggcca 6360

aaaagaagaa gggaagcgga gccactaact tctccctgtt gaaacaagca ggggatgtcg 6420

aagagaatcc cgggccagtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 6480

tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 6540

gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 6600

tgccctggcc caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc 6660

ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 6720

agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 6780

agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 6840

acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 6900

acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 6960

gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 7020

tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 7080

gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 7140

agctgtacaa gtaaacgcgt atgcatggcc ggccctgcag gaattcgata tcaagcttat 7200

cgataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 7260

tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 7320

ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 7380

gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 7440

cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 7500

ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 7560

gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 7620

gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 7680

cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 7740

tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcgcga 7800

cctcgacctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 7860

cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 7920

catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 7980

agggggagga ttgggaagac aatggcaggc atgctgggga actagtggtg ccagggcgtg 8040

cccttgggct ccccgggcgc ggcggccatc gctcgagtaa aattggaggg acaagacttc 8100

ccacagattt tcggttttgt cgggaagttt tttaataggg gcaaataagg aaaatgggag 8160

gataggtagt catctggggt tttatgcagc aaaactacag gttattattg cttgtgatcc 8220

gc 8222

<210> 16

<211> 1673

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<220>

<221> MISC_FEATURE

<222> (1)..(22)

<223> 3xFLAG

<220>

<221> MISC_FEATURE

<222> (23)..(1413)

<223> Cas9

<220>

<221> MISC_FEATURE

<222> (1414)..(1435)

<223> P2A

<220>

<221> MISC_FEATURE

<222> (1436)..(1673)

<223> eGFP

<400> 16

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val

20 25 30

Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala

35 40 45

Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu

50 55 60

Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu

65 70 75 80

Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr

85 90 95

Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln

100 105 110

Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His

115 120 125

Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg

130 135 140

His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys

145 150 155 160

Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp

165 170 175

Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys

180 185 190

Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser

195 200 205

Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu

210 215 220

Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile

225 230 235 240

Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala

245 250 255

Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala

260 265 270

Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala

275 280 285

Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu

290 295 300

Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu

305 310 315 320

Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

325 330 335

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys

340 345 350

Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val

355 360 365

Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser

370 375 380

Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu

385 390 395 400

Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu

405 410 415

Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg

420 425 430

Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu

435 440 445

His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp

450 455 460

Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr

465 470 475 480

Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg

485 490 495

Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp

500 505 510

Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp

515 520 525

Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr

530 535 540

Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr

545 550 555 560

Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

565 570 575

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln

580 585 590

Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu

595 600 605

Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

610 615 620

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu

625 630 635 640

Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu

645 650 655

Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe

660 665 670

Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp

675 680 685

Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser

690 695 700

Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

705 710 715 720

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp

725 730 735

Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His

740 745 750

Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln

755 760 765

Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys

770 775 780

Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln

785 790 795 800

Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

805 810 815

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn

820 825 830

Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

835 840 845

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

850 855 860

Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

865 870 875 880

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser

885 890 895

Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp

900 905 910

Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn

915 920 925

Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly

930 935 940

Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

945 950 955 960

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

965 970 975

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val

980 985 990

Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn

995 1000 1005

Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly

1010 1015 1020

Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

1025 1030 1035

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1040 1045 1050

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1055 1060 1065

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1070 1075 1080

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1085 1090 1095

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1100 1105 1110

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1115 1120 1125

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1130 1135 1140

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1145 1150 1155

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1160 1165 1170

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1175 1180 1185

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1190 1195 1200

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1205 1210 1215

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1220 1225 1230

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1235 1240 1245

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1250 1255 1260

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1265 1270 1275

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1280 1285 1290

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1295 1300 1305

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1310 1315 1320

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1325 1330 1335

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1340 1345 1350

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1355 1360 1365

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1370 1375 1380

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys

1385 1390 1395

Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1400 1405 1410

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp

1415 1420 1425

Val Glu Glu Asn Pro Gly Pro Val Ser Lys Gly Glu Glu Leu Phe

1430 1435 1440

Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn

1445 1450 1455

Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr

1460 1465 1470

Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu

1475 1480 1485

Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val

1490 1495 1500

Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe

1505 1510 1515

Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile

1520 1525 1530

Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys

1535 1540 1545

Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

1550 1555 1560

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

1565 1570 1575

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys

1580 1585 1590

Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp

1595 1600 1605

Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile

1610 1615 1620

Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr

1625 1630 1635

Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met

1640 1645 1650

Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met

1655 1660 1665

Asp Glu Leu Tyr Lys

1670

<210> 17

<211> 7207

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (424)..(2489)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (2517)..(2550)

<223> LoxP

<220>

<221> misc_feature

<222> (2599)..(2608)

<223> Kozak

<220>

<221> misc_feature

<222> (2605)..(6777)

<223> Cas9

<220>

<221> misc_feature

<222> (2614)..(2634)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (6730)..(6777)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (6783)..(6998)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (7058)..(7207)

<223> 小鼠Rosa26下游

<400> 17

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180

ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240

cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300

taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc aggaattgtt 360

gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa 420

accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 480

gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 540

ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 600

ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 660

tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 720

gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 780

gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 840

gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 900

gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 960

cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 1020

atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 1080

cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 1140

gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 1200

tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag aaattgatga 1260

tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 1320

aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 1380

tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 1440

taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 1500

attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560

tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620

aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680

gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980

tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040

aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220

atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460

catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520

cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580

gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640

agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700

aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760

aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820

agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880

ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940

ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000

gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060

accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120

ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180

atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240

gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300

atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360

ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420

ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480

tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540

ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600

gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660

aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720

ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780

accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840

gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900

caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960

ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020

accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080

gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140

aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200

aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260

aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320

gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380

agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440

ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500

tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560

aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620

ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680

gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740

gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800

aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860

gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920

gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980

gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040

ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100

caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160

tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220

aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280

ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340

ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400

cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460

aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520

ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580

gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640

agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700

gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760

ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820

aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880

gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940

agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000

tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060

gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120

atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180

ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240

ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300

ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360

aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420

ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480

aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540

gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600

tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660

accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720

ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaagtga 6780

gtcgacctcg acctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 6840

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 6900

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 6960

cagcaagggg gaggattggg aagacaatgg caggcatgct ggggaactag tggtgccagg 7020

gcgtgccctt gggctccccg ggcgcggcgg ccatcgctcg agtaaaattg gagggacaag 7080

acttcccaca gattttcggt tttgtcggga agttttttaa taggggcaaa taaggaaaat 7140

gggaggatag gtagtcatct ggggttttat gcagcaaaac tacaggttat tattgcttgt 7200

gatccgc 7207

<210> 18

<211> 4990

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (382)..(391)

<223> Kozak

<220>

<221> misc_feature

<222> (388)..(4560)

<223> Cas9

<220>

<221> misc_feature

<222> (397)..(417)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (4513)..(4560)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (4566)..(4781)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (4841)..(4990)

<223> 小鼠Rosa26下游

<400> 18

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180

ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240

cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300

taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360

agtgcccggg aattcgctag ggccaccatg gacaagccca agaaaaagcg gaaagtgaag 420

tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 480

tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgacaggca cagcatcaag 540

aagaacctga tcggcgccct gctgttcgac agcggcgaaa cagccgaggc caccagactg 600

aagagaaccg ccagaagaag atacaccagg cggaagaaca ggatctgcta tctgcaagag 660

atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 720

ttcctggtgg aagaggacaa gaagcacgag agacacccca tcttcggcaa catcgtggac 780

gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 840

agcaccgaca aggccgacct gagactgatc tacctggccc tggcccacat gatcaagttc 900

agaggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 960

ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1020

ggcgtggacg ccaaggctat cctgtctgcc agactgagca agagcagaag gctggaaaat 1080

ctgatcgccc agctgcccgg cgagaagaag aacggcctgt tcggcaacct gattgccctg 1140

agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 1200

cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 1260

cagtacgccg acctgttcct ggccgccaag aacctgtctg acgccatcct gctgagcgac 1320

atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1380

tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1440

gagaagtaca aagaaatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgat 1500

ggcggcgcta gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1560

ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgagaaa gcagagaacc 1620

ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc tatcctgaga 1680

aggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1740

accttcagga tcccctacta cgtgggcccc ctggccagag gcaacagcag attcgcctgg 1800

atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1860

ggcgccagcg cccagagctt catcgagaga atgacaaact tcgataagaa cctgcccaac 1920

gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 1980

accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 2040

aaaaaggcca tcgtggacct gctgttcaag accaacagaa aagtgaccgt gaagcagctg 2100

aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 2160

gatagattca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 2220

gacttcctgg ataacgaaga gaacgaggac attctggaag atatcgtgct gaccctgaca 2280

ctgtttgagg accgcgagat gatcgaggaa aggctgaaaa cctacgctca cctgttcgac 2340

gacaaagtga tgaagcagct gaagagaagg cggtacaccg gctggggcag gctgagcaga 2400

aagctgatca acggcatcag agacaagcag agcggcaaga caatcctgga tttcctgaag 2460

tccgacggct tcgccaaccg gaacttcatg cagctgatcc acgacgacag cctgacattc 2520

aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg actctctgca cgagcatatc 2580

gctaacctgg ccggcagccc cgctatcaag aagggcatcc tgcagacagt gaaggtggtg 2640

gacgagctcg tgaaagtgat gggcagacac aagcccgaga acatcgtgat cgagatggct 2700

agagagaacc agaccaccca gaagggacag aagaactccc gcgagaggat gaagagaatc 2760

gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2820

cagctgcaga acgagaagct gtacctgtac tacctgcaga atggccggga tatgtacgtg 2880

gaccaggaac tggacatcaa cagactgtcc gactacgatg tggaccatat cgtgcctcag 2940

agctttctga aggacgactc catcgataac aaagtgctga ctcggagcga caagaacaga 3000

ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcga 3060

cagctgctga acgccaagct gattacccag aggaagttcg ataacctgac caaggccgag 3120

agaggcggcc tgagcgagct ggataaggcc ggcttcatca agaggcagct ggtggaaacc 3180

agacagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 3240

gaaaacgata agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 3300

gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3360

cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3420

gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3480

agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3540

tttttcaaga ccgaaatcac cctggccaac ggcgagatca gaaagcgccc tctgatcgag 3600

acaaacggcg aaaccgggga gatcgtgtgg gataagggca gagacttcgc cacagtgcga 3660

aaggtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3720

ttcagcaaag agtctatcct gcccaagagg aacagcgaca agctgatcgc cagaaagaag 3780

gactgggacc ccaagaagta cggcggcttc gacagcccta ccgtggccta ctctgtgctg 3840

gtggtggcta aggtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3900

gggatcacca tcatggaaag aagcagcttt gagaagaacc ctatcgactt tctggaagcc 3960

aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4020

gagctggaaa acggcagaaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 4080

gagctggccc tgcctagcaa atatgtgaac ttcctgtacc tggcctccca ctatgagaag 4140

ctgaagggca gccctgagga caacgaacag aaacagctgt ttgtggaaca gcataagcac 4200

tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 4260

gccaatctgg acaaggtgct gtctgcctac aacaagcaca gggacaagcc tatcagagag 4320

caggccgaga atatcatcca cctgttcacc ctgacaaacc tgggcgctcc tgccgccttc 4380

aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4440

gccaccctga tccaccagag catcaccggc ctgtacgaga caagaatcga cctgtctcag 4500

ctgggaggcg acaagagacc tgccgccact aagaaggccg gacaggccaa aaagaagaag 4560

tgagtcgacc tcgacctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4620

ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4680

ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4740

ggacagcaag ggggaggatt gggaagacaa tggcaggcat gctggggaac tagtggtgcc 4800

agggcgtgcc cttgggctcc ccgggcgcgg cggccatcgc tcgagtaaaa ttggagggac 4860

aagacttccc acagattttc ggttttgtcg ggaagttttt taataggggc aaataaggaa 4920

aatgggagga taggtagtca tctggggttt tatgcagcaa aactacaggt tattattgct 4980

tgtgatccgc 4990

<210> 19

<211> 1391

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 19

Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu

1 5 10 15

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

20 25 30

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

35 40 45

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

50 55 60

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

65 70 75 80

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

85 90 95

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

100 105 110

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

115 120 125

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

130 135 140

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

145 150 155 160

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

165 170 175

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

180 185 190

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

195 200 205

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

210 215 220

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

225 230 235 240

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

245 250 255

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

260 265 270

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

275 280 285

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

290 295 300

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

305 310 315 320

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

325 330 335

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

340 345 350

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

355 360 365

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

370 375 380

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

385 390 395 400

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

405 410 415

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

420 425 430

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

435 440 445

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

450 455 460

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

465 470 475 480

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

485 490 495

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

500 505 510

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

515 520 525

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

530 535 540

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

545 550 555 560

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

565 570 575

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

580 585 590

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

595 600 605

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

610 615 620

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

625 630 635 640

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

645 650 655

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

660 665 670

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

675 680 685

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

690 695 700

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

705 710 715 720

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

725 730 735

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

740 745 750

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

755 760 765

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

770 775 780

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

785 790 795 800

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

805 810 815

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

820 825 830

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

835 840 845

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

850 855 860

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

865 870 875 880

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

885 890 895

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

900 905 910

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

915 920 925

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

930 935 940

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

945 950 955 960

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

965 970 975

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

980 985 990

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

995 1000 1005

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1010 1015 1020

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1025 1030 1035

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1040 1045 1050

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1055 1060 1065

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1070 1075 1080

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1085 1090 1095

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1100 1105 1110

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1115 1120 1125

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1130 1135 1140

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1145 1150 1155

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1160 1165 1170

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1175 1180 1185

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1190 1195 1200

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1205 1210 1215

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1220 1225 1230

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1235 1240 1245

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1250 1255 1260

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1265 1270 1275

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1280 1285 1290

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1295 1300 1305

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1310 1315 1320

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1325 1330 1335

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1340 1345 1350

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1355 1360 1365

Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1370 1375 1380

Ala Gly Gln Ala Lys Lys Lys Lys

1385 1390

<210> 20

<211> 9673

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (205)..(1923)

<223> CAGG 启动子

<220>

<221> misc_feature

<222> (2006)..(2039)

<223> LoxP

<220>

<221> misc_feature

<222> (2130)..(4195)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (4223)..(4256)

<223> LoxP

<220>

<221> misc_feature

<222> (4351)..(4360)

<223> Kozak

<220>

<221> misc_feature

<222> (4360)..(4425)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (4426)..(8598)

<223> Cas9

<220>

<221> misc_feature

<222> (4435)..(4455)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (8551)..(8598)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (8645)..(9241)

<223> WPRE

<220>

<221> misc_feature

<222> (9249)..(9464)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (9524)..(9673)

<223> 小鼠Rosa26下游

<400> 20

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180

acgcgtctgg cctcgcgagt gtgtactagt tattaatagt aatcaattac ggggtcatta 240

gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 300

tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 360

ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 420

gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 480

tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 540

atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 600

ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 660

tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 720

gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 780

cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 840

cggcgggcgg ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct 900

cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 960

gcccttctcc tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 1020

ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 1080

ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg 1140

gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga 1200

gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg 1260

tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac 1320

cccccctgca cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc 1380

gtacggggcg tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc 1440

cgggcggggc ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc 1500

ggagcgccgg cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt 1560

gcgagagggc gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc 1620

gccgccgcac cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa 1680

tgggcgggga gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc 1740

ggggctgtcc gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct 1800

tctggcgtgt gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt 1860

tcctacagct cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat 1920

tcgctaggag aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc 1980

cactagtgga tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt 2040

aggtccctcg acctgcagga attgttgaca attaatcatc ggcatagtat atcggcatag 2100

tataatacga caaggtgagg aactaaacca tgggatcggc cattgaacaa gatggattgc 2160

acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 2220

caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 2280

ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 2340

cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 2400

gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 2460

ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 2520

cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 2580

tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 2640

ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc 2700

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 2760

actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 2820

ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 2880

ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaggggatc 2940

cgctgtaagt ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga 3000

agtttttcct gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg 3060

aaggattgga gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact 3120

gaaggctctt tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca 3180

agcaaaacca aattaagggc cagctcattc ctcccactca tgatctatag atctatagat 3240

ctctcgtggg atcattgttt ttctcttgat tcccactttg tggttctaag tactgtggtt 3300

tccaaatgtg tcagtttcat agcctgaaga acgagatcag cagcctctgt tccacataca 3360

cttcattctc agtattgttt tgccaagttc taattccatc agaagcttgc agatctgcga 3420

ctctagagga tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt 3480

tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa 3540

ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 3600

caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 3660

tcaatgtatc ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac 3720

atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 3780

taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 3840

aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 3900

tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata 3960

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 4020

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 4080

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 4140

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc 4200

aagctgatcc ggaaccctta atataacttc gtataatgta tgctatacga agttattagg 4260

tccctcgacc tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct 4320

agatcgaatt cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga 4380

gactacaagg atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag 4440

aaaaagcgga aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg 4500

gccgtgatca ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc 4560

gacaggcaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca 4620

gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg 4680

atctgctatc tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc 4740

cacagactgg aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc 4800

ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg 4860

agaaagaaac tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg 4920

gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac 4980

agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa 5040

aaccccatca acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag 5100

agcagaaggc tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc 5160

ggcaacctga ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg 5220

gccgaggatg ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg 5280

ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac 5340

gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc 5400

gcctctatga tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc 5460

gtgcggcagc agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc 5520

tacgccggct acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc 5580

atcctggaaa agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg 5640

ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag 5700

ctgcacgcta tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa 5760

aagatcgaga agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc 5820

aacagcagat tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc 5880

gaggaagtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc 5940

gataagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc 6000

accgtgtaca acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc 6060

ttcctgagcg gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa 6120

gtgaccgtga agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg 6180

gaaatctccg gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg 6240

aaaattatca aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat 6300

atcgtgctga ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc 6360

tacgctcacc tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc 6420

tggggcaggc tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca 6480

atcctggatt tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac 6540

gacgacagcc tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac 6600

tctctgcacg agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg 6660

cagacagtga aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac 6720

atcgtgatcg agatggctag agagaaccag accacccaga agggacagaa gaactcccgc 6780

gagaggatga agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa 6840

caccccgtgg aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat 6900

ggccgggata tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg 6960

gaccatatcg tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact 7020

cggagcgaca agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag 7080

atgaagaact actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat 7140

aacctgacca aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag 7200

aggcagctgg tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg 7260

atgaacacta agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg 7320

aagtccaagc tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc 7380

aacaactacc accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc 7440

aaaaagtacc ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg 7500

cggaagatga tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc 7560

tacagcaaca tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga 7620

aagcgccctc tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga 7680

gacttcgcca cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc 7740

gaggtgcaga caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag 7800

ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc 7860

gtggcctact ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag 7920

agtgtgaaag agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct 7980

atcgactttc tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg 8040

cctaagtact ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc 8100

gaactgcaga agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg 8160

gcctcccact atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt 8220

gtggaacagc ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag 8280

agagtgatcc tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg 8340

gacaagccta tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg 8400

ggcgctcctg ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc 8460

accaaagagg tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca 8520

agaatcgacc tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga 8580

caggccaaaa agaagaagtg ataaatgcat ggccggccct gcaggaattc gatatcaagc 8640

ttatcgataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 8700

atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 8760

cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 8820

aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 8880

cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 8940

ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 9000

ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 9060

ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 9120

cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 9180

cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcatc 9240

gataccgtcg acctcgacct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 9300

ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 9360

tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 9420

gcaggacagc aagggggagg attgggaaga caatggcagg catgctgggg aactagtggt 9480

gccagggcgt gcccttgggc tccccgggcg cggcggccat cgctcgagta aaattggagg 9540

gacaagactt cccacagatt ttcggttttg tcgggaagtt ttttaatagg ggcaaataag 9600

gaaaatggga ggataggtag tcatctgggg ttttatgcag caaaactaca ggttattatt 9660

gcttgtgatc cgc 9673

<210> 21

<211> 7456

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(170)

<223> 小鼠Rosa26上游

<220>

<221> misc_feature

<222> (205)..(1923)

<223> CAGG 启动子

<220>

<221> misc_feature

<222> (2006)..(2039)

<223> LoxP

<220>

<221> misc_feature

<222> (2134)..(2143)

<223> Kozak

<220>

<221> misc_feature

<222> (2143)..(2208)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (2209)..(6381)

<223> Cas9

<220>

<221> misc_feature

<222> (2218)..(2238)

<223> 单组分 NLS

<220>

<221> misc_feature

<222> (6334)..(6381)

<223> 双组分 NLS

<220>

<221> misc_feature

<222> (6428)..(7024)

<223> WPRE

<220>

<221> misc_feature

<222> (7032)..(7247)

<223> bGH PolyA

<220>

<221> misc_feature

<222> (7307)..(7456)

<223> 小鼠Rosa26下游

<400> 21

ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60

gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120

ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180

acgcgtctgg cctcgcgagt gtgtactagt tattaatagt aatcaattac ggggtcatta 240

gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 300

tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 360

ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 420

gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 480

tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 540

atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 600

ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 660

tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 720

gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 780

cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 840

cggcgggcgg ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct 900

cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 960

gcccttctcc tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 1020

ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 1080

ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg 1140

gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga 1200

gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg 1260

tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac 1320

cccccctgca cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc 1380

gtacggggcg tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc 1440

cgggcggggc ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc 1500

ggagcgccgg cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt 1560

gcgagagggc gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc 1620

gccgccgcac cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa 1680

tgggcgggga gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc 1740

ggggctgtcc gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct 1800

tctggcgtgt gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt 1860

tcctacagct cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat 1920

tcgctaggag aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc 1980

cactagtgga tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt 2040

aggtccctcg acctgcagcc caagctagtg cccgggtagg tccctcgacc tgcagcccaa 2100

gctagatcga attcggccgg ccttcgaaca cgtgccacca tggactataa ggaccacgac 2160

ggagactaca aggatcatga tattgattac aaagacgatg acgataagat ggacaagccc 2220

aagaaaaagc ggaaagtgaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc 2280

tgggccgtga tcaccgacga gtacaaggtg cccagcaaga aattcaaggt gctgggcaac 2340

accgacaggc acagcatcaa gaagaacctg atcggcgccc tgctgttcga cagcggcgaa 2400

acagccgagg ccaccagact gaagagaacc gccagaagaa gatacaccag gcggaagaac 2460

aggatctgct atctgcaaga gatcttcagc aacgagatgg ccaaggtgga cgacagcttc 2520

ttccacagac tggaagagtc cttcctggtg gaagaggaca agaagcacga gagacacccc 2580

atcttcggca acatcgtgga cgaggtggcc taccacgaga agtaccccac catctaccac 2640

ctgagaaaga aactggtgga cagcaccgac aaggccgacc tgagactgat ctacctggcc 2700

ctggcccaca tgatcaagtt cagaggccac ttcctgatcg agggcgacct gaaccccgac 2760

aacagcgacg tggacaagct gttcatccag ctggtgcaga cctacaacca gctgttcgag 2820

gaaaacccca tcaacgccag cggcgtggac gccaaggcta tcctgtctgc cagactgagc 2880

aagagcagaa ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaacggcctg 2940

ttcggcaacc tgattgccct gagcctgggc ctgaccccca acttcaagag caacttcgac 3000

ctggccgagg atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac 3060

ctgctggccc agatcggcga ccagtacgcc gacctgttcc tggccgccaa gaacctgtct 3120

gacgccatcc tgctgagcga catcctgaga gtgaacaccg agatcaccaa ggcccccctg 3180

agcgcctcta tgatcaagag atacgacgag caccaccagg acctgaccct gctgaaagct 3240

ctcgtgcggc agcagctgcc tgagaagtac aaagaaatct tcttcgacca gagcaagaac 3300

ggctacgccg gctacatcga tggcggcgct agccaggaag agttctacaa gttcatcaag 3360

cccatcctgg aaaagatgga cggcaccgag gaactgctcg tgaagctgaa cagagaggac 3420

ctgctgagaa agcagagaac cttcgacaac ggcagcatcc cccaccagat ccacctggga 3480

gagctgcacg ctatcctgag aaggcaggaa gatttttacc cattcctgaa ggacaaccgg 3540

gaaaagatcg agaagatcct gaccttcagg atcccctact acgtgggccc cctggccaga 3600

ggcaacagca gattcgcctg gatgaccaga aagagcgagg aaaccatcac cccctggaac 3660

ttcgaggaag tggtggacaa gggcgccagc gcccagagct tcatcgagag aatgacaaac 3720

ttcgataaga acctgcccaa cgagaaggtg ctgcccaagc acagcctgct gtacgagtac 3780

ttcaccgtgt acaacgagct gaccaaagtg aaatacgtga ccgagggaat gagaaagccc 3840

gccttcctga gcggcgagca gaaaaaggcc atcgtggacc tgctgttcaa gaccaacaga 3900

aaagtgaccg tgaagcagct gaaagaggac tacttcaaga aaatcgagtg cttcgactcc 3960

gtggaaatct ccggcgtgga agatagattc aacgcctccc tgggcacata ccacgatctg 4020

ctgaaaatta tcaaggacaa ggacttcctg gataacgaag agaacgagga cattctggaa 4080

gatatcgtgc tgaccctgac actgtttgag gaccgcgaga tgatcgagga aaggctgaaa 4140

acctacgctc acctgttcga cgacaaagtg atgaagcagc tgaagagaag gcggtacacc 4200

ggctggggca ggctgagcag aaagctgatc aacggcatca gagacaagca gagcggcaag 4260

acaatcctgg atttcctgaa gtccgacggc ttcgccaacc ggaacttcat gcagctgatc 4320

cacgacgaca gcctgacatt caaagaggac atccagaaag cccaggtgtc cggccagggc 4380

gactctctgc acgagcatat cgctaacctg gccggcagcc ccgctatcaa gaagggcatc 4440

ctgcagacag tgaaggtggt ggacgagctc gtgaaagtga tgggcagaca caagcccgag 4500

aacatcgtga tcgagatggc tagagagaac cagaccaccc agaagggaca gaagaactcc 4560

cgcgagagga tgaagagaat cgaagagggc atcaaagagc tgggcagcca gatcctgaaa 4620

gaacaccccg tggaaaacac ccagctgcag aacgagaagc tgtacctgta ctacctgcag 4680

aatggccggg atatgtacgt ggaccaggaa ctggacatca acagactgtc cgactacgat 4740

gtggaccata tcgtgcctca gagctttctg aaggacgact ccatcgataa caaagtgctg 4800

actcggagcg acaagaacag aggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag 4860

aagatgaaga actactggcg acagctgctg aacgccaagc tgattaccca gaggaagttc 4920

gataacctga ccaaggccga gagaggcggc ctgagcgagc tggataaggc cggcttcatc 4980

aagaggcagc tggtggaaac cagacagatc acaaagcacg tggcacagat cctggactcc 5040

cggatgaaca ctaagtacga cgaaaacgat aagctgatcc gggaagtgaa agtgatcacc 5100

ctgaagtcca agctggtgtc cgatttccgg aaggatttcc agttttacaa agtgcgcgag 5160

atcaacaact accaccacgc ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg 5220

atcaaaaagt accctaagct ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac 5280

gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc 5340

ttctacagca acatcatgaa ctttttcaag accgaaatca ccctggccaa cggcgagatc 5400

agaaagcgcc ctctgatcga gacaaacggc gaaaccgggg agatcgtgtg ggataagggc 5460

agagacttcg ccacagtgcg aaaggtgctg agcatgcccc aagtgaatat cgtgaaaaag 5520

accgaggtgc agacaggcgg cttcagcaaa gagtctatcc tgcccaagag gaacagcgac 5580

aagctgatcg ccagaaagaa ggactgggac cccaagaagt acggcggctt cgacagccct 5640

accgtggcct actctgtgct ggtggtggct aaggtggaaa agggcaagtc caagaaactg 5700

aagagtgtga aagagctgct ggggatcacc atcatggaaa gaagcagctt tgagaagaac 5760

cctatcgact ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag 5820

ctgcctaagt actccctgtt cgagctggaa aacggcagaa agagaatgct ggcctctgcc 5880

ggcgaactgc agaagggaaa cgagctggcc ctgcctagca aatatgtgaa cttcctgtac 5940

ctggcctccc actatgagaa gctgaagggc agccctgagg acaacgaaca gaaacagctg 6000

tttgtggaac agcataagca ctacctggac gagatcatcg agcagatcag cgagttctcc 6060

aagagagtga tcctggccga cgccaatctg gacaaggtgc tgtctgccta caacaagcac 6120

agggacaagc ctatcagaga gcaggccgag aatatcatcc acctgttcac cctgacaaac 6180

ctgggcgctc ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc 6240

agcaccaaag aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag 6300

acaagaatcg acctgtctca gctgggaggc gacaagagac ctgccgccac taagaaggcc 6360

ggacaggcca aaaagaagaa gtgataaatg catggccggc cctgcaggaa ttcgatatca 6420

agcttatcga taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta 6480

actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta 6540

ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt 6600

atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg 6660

caacccccac tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt 6720

tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 6780

gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc 6840

cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc 6900

cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc 6960

ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc 7020

atcgataccg tcgacctcga cctcgactgt gccttctagt tgccagccat ctgttgtttg 7080

cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7140

aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7200

ggggcaggac agcaaggggg aggattggga agacaatggc aggcatgctg gggaactagt 7260

ggtgccaggg cgtgcccttg ggctccccgg gcgcggcggc catcgctcga gtaaaattgg 7320

agggacaaga cttcccacag attttcggtt ttgtcgggaa gttttttaat aggggcaaat 7380

aaggaaaatg ggaggatagg tagtcatctg gggttttatg cagcaaaact acaggttatt 7440

attgcttgtg atccgc 7456

<210> 22

<211> 1413

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<220>

<221> MISC_FEATURE

<222> (1)..(22)

<223> 3xFLAG

<220>

<221> MISC_FEATURE

<222> (23)..(1413)

<223> Cas9

<400> 22

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val

20 25 30

Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala

35 40 45

Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu

50 55 60

Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu

65 70 75 80

Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr

85 90 95

Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln

100 105 110

Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His

115 120 125

Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg

130 135 140

His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys

145 150 155 160

Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp

165 170 175

Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys

180 185 190

Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser

195 200 205

Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu

210 215 220

Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile

225 230 235 240

Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala

245 250 255

Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala

260 265 270

Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala

275 280 285

Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu

290 295 300

Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu

305 310 315 320

Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

325 330 335

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys

340 345 350

Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val

355 360 365

Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser

370 375 380

Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu

385 390 395 400

Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu

405 410 415

Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg

420 425 430

Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu

435 440 445

His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp

450 455 460

Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr

465 470 475 480

Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg

485 490 495

Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp

500 505 510

Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp

515 520 525

Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr

530 535 540

Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr

545 550 555 560

Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

565 570 575

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln

580 585 590

Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu

595 600 605

Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

610 615 620

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu

625 630 635 640

Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu

645 650 655

Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe

660 665 670

Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp

675 680 685

Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser

690 695 700

Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

705 710 715 720

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp

725 730 735

Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His

740 745 750

Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln

755 760 765

Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys

770 775 780

Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln

785 790 795 800

Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

805 810 815

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn

820 825 830

Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

835 840 845

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

850 855 860

Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

865 870 875 880

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser

885 890 895

Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp

900 905 910

Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn

915 920 925

Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly

930 935 940

Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

945 950 955 960

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

965 970 975

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val

980 985 990

Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn

995 1000 1005

Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly

1010 1015 1020

Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

1025 1030 1035

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1040 1045 1050

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1055 1060 1065

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1070 1075 1080

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1085 1090 1095

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1100 1105 1110

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1115 1120 1125

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1130 1135 1140

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1145 1150 1155

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1160 1165 1170

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1175 1180 1185

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1190 1195 1200

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1205 1210 1215

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1220 1225 1230

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1235 1240 1245

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1250 1255 1260

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1265 1270 1275

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1280 1285 1290

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1295 1300 1305

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1310 1315 1320

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1325 1330 1335

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1340 1345 1350

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1355 1360 1365

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1370 1375 1380

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys

1385 1390 1395

Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1400 1405 1410

<210> 23

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 23

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys

20

<210> 24

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 合成的

<400> 24

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1 5 10 15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

35 40 45

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu

50 55 60

Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln

65 70 75 80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

85 90 95

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

100 105 110

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

115 120 125

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

130 135 140

Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly

145 150 155 160

Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

165 170 175

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

180 185 190

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser

195 200 205

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

210 215 220

Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 25

<211> 16

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 25

guuuuagagc uaugcu 16

<210> 26

<211> 67

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 26

agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60

gugcuuu 67

<210> 27

<211> 77

<212> RNA

<213> 人工序列

<220>

<223> 合成的

<400> 27

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcu 77

<210> 28

<211> 4953

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(4173)

<223> Cas9

<220>

<221> misc_feature

<222> (4174)..(4239)

<223> P2A

<220>

<221> misc_feature

<222> (4240)..(4953)

<223> eGFP

<400> 28

atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60

aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120

gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180

gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240

aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300

gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360

gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420

accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480

atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540

ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600

cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660

gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720

aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780

agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840

gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900

aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960

aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020

ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080

cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140

aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200

aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260

atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320

aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380

cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440

accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500

agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560

ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620

atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680

aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740

tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800

taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860

gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920

gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980

aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040

cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100

atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160

tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220

aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280

cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340

cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400

cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460

tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520

tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580

aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640

gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700

cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760

gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820

atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880

aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940

aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000

ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060

aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120

gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180

aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240

tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300

atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360

aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420

ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480

tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540

tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600

ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660

ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720

aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780

cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840

agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900

tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960

accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020

aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080

ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140

actaagaagg ccggacaggc caaaaagaag aagggaagcg gagccactaa cttctccctg 4200

ttgaaacaag caggggatgt cgaagagaat cccgggccag tgagcaaggg cgaggagctg 4260

ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 4320

agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 4380

tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 4440

gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 4500

atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 4560

acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 4620

atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 4680

cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 4740

cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 4800

atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 4860

agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 4920

gggatcactc tcggcatgga cgagctgtac aag 4953

<210> 29

<211> 5019

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(66)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (67)..(4239)

<223> Cas9

<220>

<221> misc_feature

<222> (4240)..(4305)

<223> P2A

<220>

<221> misc_feature

<222> (4306)..(5019)

<223> eGFP

<400> 29

gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60

gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120

ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180

ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240

ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300

tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360

aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420

aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480

taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540

agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600

ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660

tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720

ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780

gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840

ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900

gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960

gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020

atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080

ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140

ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200

ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260

aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320

caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380

ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440

gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500

accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560

atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620

agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680

gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740

ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800

atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860

ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920

aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980

atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040

aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100

gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160

aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220

caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280

gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340

ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400

aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460

ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520

tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580

agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640

atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700

tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760

attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820

gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880

gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940

gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000

ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060

gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120

gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180

gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240

ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300

atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360

gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420

cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480

ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540

ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600

agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660

aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720

agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780

tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840

aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900

cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960

tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020

ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080

gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140

atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200

gccgccacta agaaggccgg acaggccaaa aagaagaagg gaagcggagc cactaacttc 4260

tccctgttga aacaagcagg ggatgtcgaa gagaatcccg ggccagtgag caagggcgag 4320

gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 4380

aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 4440

ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 4500

tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 4560

tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 4620

tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 4680

aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 4740

aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 4800

aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 4860

acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 4920

gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 4980

gccgccggga tcactctcgg catggacgag ctgtacaag 5019

<210> 30

<211> 4173

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 30

atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60

aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120

gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180

gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240

aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300

gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360

gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420

accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480

atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540

ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600

cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660

gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720

aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780

agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840

gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900

aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960

aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020

ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080

cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140

aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200

aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260

atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320

aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380

cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440

accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500

agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560

ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620

atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680

aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740

tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800

taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860

gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920

gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980

aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040

cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100

atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160

tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220

aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280

cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340

cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400

cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460

tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520

tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580

aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640

gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700

cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760

gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820

atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880

aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940

aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000

ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060

aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120

gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180

aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240

tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300

atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360

aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420

ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480

tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540

tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600

ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660

ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720

aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780

cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840

agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900

tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960

accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020

aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080

ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140

actaagaagg ccggacaggc caaaaagaag aag 4173

<210> 31

<211> 4239

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<220>

<221> misc_feature

<222> (1)..(66)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (67)..(4239)

<223> Cas9

<400> 31

gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60

gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120

ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180

ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240

ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300

tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360

aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420

aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480

taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540

agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600

ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660

tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720

ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780

gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840

ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900

gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960

gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020

atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080

ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140

ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200

ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260

aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320

caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380

ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440

gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500

accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560

atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620

agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680

gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740

ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800

atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860

ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920

aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980

atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040

aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100

gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160

aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220

caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280

gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340

ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400

aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460

ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520

tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580

agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640

atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700

tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760

attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820

gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880

gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940

gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000

ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060

gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120

gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180

gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240

ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300

atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360

gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420

cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480

ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540

ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600

agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660

aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720

agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780

tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840

aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900

cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960

tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020

ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080

gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140

atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200

gccgccacta agaaggccgg acaggccaaa aagaagaag 4239

<210> 32

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 32

ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 60

gggcca 66

<210> 33

<211> 714

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 33

gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60

gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120

aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180

gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240

cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300

aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360

aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420

ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480

atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540

cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600

ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660

ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag 714

<210> 34

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 34

gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60

gataag 66

<210> 35

<211> 597

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 35

cgataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60

tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120

ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180

gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240

cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300

ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360

gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420

gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480

cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540

tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcg 597

<210> 36

<211> 216

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 36

cgacctcgac ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 60

tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 120

ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 180

gcaaggggga ggattgggaa gacaatggca ggcatg 216

<210> 37

<211> 2066

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 37

atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 60

aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 120

cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 180

aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 240

gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 300

ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 360

gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 420

aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 480

ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 540

atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 600

gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 660

tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 720

gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 780

cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 840

attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 900

ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 960

ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 1020

tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 1080

cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 1140

ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 1200

aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 1260

ctaattccat cagaagcttg cagatctgcg actctagagg atctgcgact ctagaggatc 1320

ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc 1380

cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 1440

tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1500

ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatctgc 1560

gactctagag gatcataatc agccatacca catttgtaga ggttttactt gctttaaaaa 1620

acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact 1680

tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 1740

aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 1800

atgtctggat ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt 1860

acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 1920

tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 1980

aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 2040

caatgtatct tatcatgtct ggatcc 2066

<210> 38

<211> 1719

<212> DNA

<213> 人工序列

<220>

<223> 合成的

<400> 38

actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 60

cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 120

ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 180

caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 240

ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 300

tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 360

accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 420

cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 480

gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 540

agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 600

cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcggggag tcgctgcgac 660

gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 720

tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 780

agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc 840

tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg 900

tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg 960

cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc 1020

ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt 1080

gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc cctccccgag 1140

ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg 1200

ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg 1260

ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg 1320

cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt 1380

tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc 1440

gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc cttcgtgcgt 1500

cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg ggggacggct 1560

gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc ggcggctcta 1620

gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg ggcaacgtgc 1680

tggttattgt gctgtctcat cattttggca aagaattcg 1719

Claims

1.一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法，包括：

(a)向啮齿动物体内引入设计为靶向目标基因组基因座处的向导RNA靶向序列的向导RNA，

其中，所述啮齿动物在其种系中，在Rosa26基因座处包含基因组整合的Cas9表达盒，

其中，所述Cas9表达盒包含Cas9蛋白质的编码序列，其中所述Cas9蛋白质包含SEQ IDNO:19中列出的完整序列，以及

其中，所述向导RNA通过腺相关病毒(AAV)介导的递送被引入；以及

(b)评价对所述目标基因组基因座的修饰。

2.根据权利要求1所述的方法，其中，所述啮齿动物为大鼠或小鼠。

3.根据权利要求1或2所述的方法，其中所述AAV是AAV7、AAV8或AAV9，且步骤(b)包括评估对肝脏中所述目标基因组基因座的修饰。

4.根据权利要求3所述的方法，其中所述AAV是AAV8。

5.根据权利要求1、2和4中任意一项所述的方法，其中，将所述AAV给药于所述啮齿动物的途径是静脉内注射、脑实质内注射、腹膜内注射、鼻灌注或玻璃体内注射。

6.根据权利要求1、2和4中任意一项所述的方法，其中，在步骤(a)中引入外源供体核酸，其中，所述外源供体核酸被设计为与所述目标基因组基因座重组。

7.根据权利要求6所述的方法，其中，所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。

8.根据权利要求1、2、4和7中任意一项所述的方法，其中，所述目标基因组基因座包括目标基因，并且步骤(b)包括测量所述目标基因的表达或由所述目标基因编码的蛋白质的活性。

9.根据权利要求1、2、4和7中任意一项所述的方法，其中，步骤(b)包括对分离自所述啮齿动物的一种或多种细胞中的目标基因组基因座进行测序。

10.根据权利要求1、2、4和7中任意一项所述的方法，其中，步骤(b)包括从所述非啮齿动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰。

11.根据权利要求10所述的方法，其中，步骤(b)包括评价对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰。

12.根据权利要求1、2、4、7和11中任意一项所述的方法，其中，步骤(b)包括从所述啮齿动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。

13.根据权利要求1、2、4、7和11中任意一项所述的方法，其中，所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述Cas9表达盒中的聚腺苷酸化信号以组织特异性的方式被删除。

14.根据权利要求13所述的方法，其中，在所述肝脏中已删除了所述Cas9蛋白质的编码序列上游的所述聚腺苷酸化信号。

15.根据权利要求13所述的方法，其中，所述识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。

16.根据权利要求15所述的方法，其中，所述啮齿动物还包含基因组整合的Cre重组酶表达盒，所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。

17.根据权利要求15或16所述的方法，其中，所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。

18.根据权利要求1、2、4、7和11中任意一项所述的方法，其中，所述Cas9表达盒还包含所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述方法还包括以组织特异性的方式向所述啮齿动物体内引入重组酶。

19.根据权利要求18所述的方法，其中，所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。

20.根据权利要求1、2、4、7、11、14-16和19中任意一项所述的方法，其中，所述Cas9表达盒还包含荧光蛋白编码序列。

21.根据权利要求20所述的方法，其中，所述Cas9表达盒包括多顺反子核酸，所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和所述荧光蛋白编码序列。

22.根据权利要求21所述的方法，其中，所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。

23.根据权利要求1、2、4、7、11、14-16和19中任意一项所述的方法，其中，所述Cas9表达盒不包括荧光蛋白编码序列。

24.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9蛋白质还包含蛋白质标签。

25.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9表达盒的5’端还包含3’剪接序列。

26.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9表达盒可操作地连接至内源启动子。

27.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9表达盒可操作地连接至外源组成性启动子。

28.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。

29.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法，其中，所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。

30.根据权利要求29所述的方法，其中，所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。

31.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法，其中，所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。

32.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法，其中，所述啮齿动物对于所述Cas9表达盒而言是杂合的。

33.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法，其中，所述啮齿动物对于所述Cas9表达盒而言是纯合的。

34.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法，其中，所述AAV是通过静脉内注射递送至所述啮齿动物的AAV8，

其中，所述Cas9表达盒可操作地连接至所述内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列；和(ii)所述Cas9蛋白质的编码序列；并且

其中，步骤(b)包括评价对所述啮齿动物的肝脏中的目标基因组基因座的修饰。

35.一种优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法，包括：

(I)在第一啮齿动物中第一次执行权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法；

(II)改变可变量并且在第二啮齿动物中使用改变的可变量再次执行步骤(I)的方法；以及

(III)将步骤(I)中的对所述目标基因组基因座的修饰与步骤(II)中的对所述目标基因组基因座的修饰进行比较并且选择对所述目标基因组基因座的修饰具有较高的效率、较高的精确度、较高的一致性或较高的特异性中的一种或多种的方法。

36.根据权利要求35所述的方法，其中，所述啮齿动物是大鼠或小鼠。

37.根据权利要求35或36所述的方法，其中，步骤(II)中改变的可变量是AAV血清型。

38.根据权利要求35或36所述的方法，其中，步骤(II)中改变的可变量是将所述向导RNA引入至所述啮齿动物的给药途径。

39.根据权利要求35或36所述的方法，其中，步骤(II)中改变的可变量是引入至所述啮齿动物的向导RNA的浓度或量。

40.根据权利要求35或36所述的方法，其中，步骤(II)中改变的可变量是引入至所述啮齿动物的向导RNA。

41.根据权利要求35或36所述的方法，其中，所述方法包括引入外源供体核酸，并且，其中，步骤(II)中改变的可变量是将所述外源供体核酸引入至所述啮齿动物的递送方法。

42.根据权利要求35或36所述的方法，其中，所述方法包括引入外源供体核酸，并且，步骤(II)中改变的可变量是将所述外源供体核酸引入至所述啮齿动物的给药途径。

43.根据权利要求35或36所述的方法，其中，所述方法包括引入外源供体核酸，并且，步骤(II)中改变的可变量是引入至所述啮齿动物的所述外源供体核酸的浓度或量。

44.根据权利要求35或36所述的方法，其中，所述方法包括引入外源供体核酸，并且，步骤(II)中改变的可变量是相对于引入至所述啮齿动物的外源供体核酸的浓度或量的引入至所述啮齿动物的向导RNA的浓度或量。

45.根据权利要求35或36所述的方法，其中，步骤(II)中改变的可变量是引入至所述啮齿动物的所述外源供体核酸。

46.一种啮齿动物基因组，其包含在Rosa26基因座处基因组整合的Cas9表达盒，其中，所述Cas9表达盒包含Cas9蛋白的编码序列，并且，其中，所述Cas9蛋白包含SEQ ID NO:19中列出的完整序列。

47.根据权利要求46所述的啮齿动物基因组，其中，所述啮齿动物是大鼠或小鼠。

48.根据权利要求46或47所述的啮齿动物基因组，其中，所述Cas9表达盒进一步包括位于所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中所述聚腺苷酸化信号的侧面具有重组酶识别位点。

49.根据权利要求48所述的啮齿动物基因组，其中，识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。

50.根据权利要求49所述的啮齿动物基因组，其中，所述啮齿动物基因组还包含基因组整合的Cre重组酶表达盒，所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。

51.根据权利要求49所述的啮齿动物基因组，其中，所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。

52.根据权利要求46、47和49-51中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒还包含荧光蛋白编码序列。

53.根据权利要求52所述的啮齿动物基因组，其中，所述Cas9表达盒包括多顺反子核酸，所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。

54.根据权利要求53所述的啮齿动物基因组，其中，所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。

55.根据权利要求46、47和49-51中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒还不包括荧光蛋白编码序列。

56.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9蛋白质包含蛋白质标签。

57.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒的5’端还包含3’剪接序列。

58.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒可操作地连接至内源启动子。

59.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒可操作地连接至外源组成性启动子。

60.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。

61.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。

62.根据权利要求61所述的啮齿动物基因组，其中，所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。

63.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。

64.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组，其中，所述啮齿动物基因组对于所述Cas9表达盒而言是杂合的。

65.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组，其中，所述啮齿动物基因组对于所述Cas9表达盒而言是纯合的。

66.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组，其中，所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列；和(ii)所述Cas9蛋白质的编码序列。

67.一种啮齿动物细胞，其包含在Rosa26基因座处基因组整合的Cas9表达盒，其中，所述Cas9表达盒包含Cas9蛋白质的编码序列，其中，所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列，以及

其中，所述啮齿动物细胞不是胚胎干(ES)细胞。

68.根据权利要求67所述的啮齿动物细胞，其中，所述啮齿动物为大鼠或小鼠。

69.根据权利要求67或68所述的啮齿动物细胞，其中，所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点。

70.根据权利要求69所述的啮齿动物细胞，其中，识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。

71.根据权利要求70所述的啮齿动物细胞，其中，所述啮齿动物还包含基因组整合的Cre重组酶表达盒，所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。

72.根据权利要求70所述的啮齿动物细胞，其中，所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。

73.根据权利要求67、68和70-72中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒还包含荧光蛋白编码序列。

74.根据权利要求73所述的啮齿动物细胞，其中，所述Cas9表达盒包括多顺反子核酸，所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。

75.根据权利要求74所述的啮齿动物细胞，其中，所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。

76.根据权利要求67、68和70-72中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒还不包括荧光蛋白编码序列。

77.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9蛋白质包含蛋白质标签。

78.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒的5’端还包含3’剪接序列。

79.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒可操作地连接至内源启动子。

80.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒可操作地连接至外源组成性启动子。

81.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。

82.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。

83.根据权利要求82所述的啮齿动物细胞，其中，所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。

84.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。

85.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞，其中，所述啮齿动物细胞对于所述Cas9表达盒而言是杂合的。

86.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞，其中，所述啮齿动物细胞对于所述Cas9表达盒而言是纯合的。

87.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞，其中，所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列；和(ii)所述Cas9蛋白质的编码序列。

88.一种制造啮齿动物的方法，所述啮齿动物在其种系中包含基因组整合的Cas9表达盒，包括：

(a)修饰啮齿动物胚胎干(ES)细胞的基因组，以包含在Rosa26基因座处基因组整合的Cas9表达盒，其中，所述Cas9表达盒包含Cas9蛋白质的编码序列，其中，所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列；

(b)识别或选择包含所述Cas9表达盒的遗传修饰的啮齿动物ES细胞；

(c)将所述遗传修饰的啮齿动物ES细胞引入啮齿动物宿主胚胎；以及

(d)将所述啮齿动物宿主胚胎植入啮齿动物代孕母体并在所述啮齿动物代孕母体内孕育。

89.根据权利要求88所述的方法，其中，所述啮齿动物为大鼠或小鼠。

90.一种制造啮齿动物的方法，所述啮齿动物在其种系中包含基因组整合的Cas9表达盒，包括：

(a)修饰啮齿动物单细胞期胚胎的基因组，以包含在所述Rosa26基因座处基因组整合的Cas9表达盒，其中，所述Cas9表达盒包含Cas9蛋白质的编码序列，其中，所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列；

(b)选择包含所述Cas9表达盒的遗传修饰的啮齿动物单细胞期胚胎；以及

(c)将所述遗传修饰的啮齿动物单细胞期胚胎植入啮齿动物代孕母体并在所述啮齿动物代孕母体内孕育。

91.根据权利要求90所述的方法，其中，所述啮齿动物为大鼠或小鼠。

92.根据权利要求88-91所述的方法，其中，所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点。

93.根据权利要求88-91所述的方法，其中，所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述Cas9表达盒中的聚腺苷酸化信号以组织特异性的方式被删除。

94.根据权利要求93所述的方法，其中，在所述肝脏中已删除了所述Cas9蛋白质的编码序列上游的所述聚腺苷酸化信号。

95.根据权利要求93所述的方法，其中，识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。

96.根据权利要求95所述的方法，其中，所述啮齿动物还包含基因组整合的Cre重组酶表达盒，所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。

97.根据权利要求95所述的方法，其中，所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。

98.根据权利要求88-91和94-97中任意一项所述的方法，其中，所述Cas9表达盒还包含荧光蛋白编码序列。

99.根据权利要求98所述的方法，其中，所述Cas9表达盒包括多顺反子核酸，所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。

100.根据权利要求99所述的方法，其中，所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。

101.根据权利要求88-91和94-97中任意一项所述的方法，其中，所述Cas9表达盒还不包括荧光蛋白编码序列。

102.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9蛋白质包含蛋白质标签。

103.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9表达盒的5’端还包含3’剪接序列。

104.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9表达盒可操作地连接至内源启动子。

105.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9表达盒可操作地连接至外源组成性启动子。

106.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。

107.根据权利要求88-91、94-97、99和100中任意一项所述的方法，其中，所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。

108.根据权利要求107所述的方法，其中，所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。

109.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法，其中，所述Cas9表达盒被整合至是说Rosa26基因座的第一内含子中。

110.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法，其中，所述啮齿动物对于所述Cas9表达盒而言是杂合的。

111.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法，其中，所述啮齿动物对于所述Cas9表达盒而言是纯合的。

112.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法，其中，所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列；和(ii)所述Cas9蛋白质的编码序列。

113.一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法，包括：

(a)向非人类动物体内引入设计为靶向目标基因组基因座处的向导RNA靶向序列的向导RNA，

其中，所述非人类动物包含基因组整合的Cas表达盒，所述基因组整合的Cas表达盒包含Cas蛋白质的编码序列，所述Cas蛋白质还包含一个或多个核定位信号，以及

其中，所述向导RNA通过腺相关病毒(AAV)介导的递送引入，其中所述AAV是AAV8；以及

(b)评价对所述非人类动物的肝脏中的所述目标基因组基因座的修饰。

114.根据权利要求113所述的方法，其中，将所述AAV给药于所述非人类动物的途径是静脉内注射、脑实质内注射、腹膜内注射、鼻灌注或玻璃体内注射。

115.根据权利要求113或114所述的方法，其中，在步骤(a)中引入外源供体核酸，其中，所述外源供体核酸被设计为与所述目标基因组基因座重组，可选地，其中，所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。

116.根据权利要求113或114所述的方法，其中，所述非人类动物为大鼠或小鼠。

117.根据权利要求116所述的方法，其中，所述非人类动物为所述大鼠。

118.根据权利要求113、114和117中任意一项所述的方法，其中：

(I)所述目标基因组基因座包括目标基因，并且步骤(b)包括测量所述目标基因的表达或由所述目标基因编码的蛋白质的活性；和/或

(II)步骤(b)包括对分离自所述非人类动物的一种或多种细胞中的所述目标基因组基因座进行测序；和/或

(III)步骤(b)包括从所述非人类动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰，可选地，其中，步骤(b)包括评价对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰；和/或

(IV)步骤(b)包括从所述非人类动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。

119.根据权利要求113、114和117中任意一项所述的方法，其中，所述Cas蛋白质是Cas9蛋白质，可选地，其中，所述Cas9蛋白质包含蛋白质标签。

120.根据权利要求113、114和117中任意一项所述的方法，其中，所述Cas表达盒还包括所述Cas蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述Cas表达盒中的聚腺苷酸化信号在肝脏中以组织特异性的方式被删除。

121.根据权利要求120所述的方法，其中，识别所述Cas表达盒中的重组酶识别位点的重组酶是Cre重组酶，可选地，其中，所述非人类动物还包含基因组整合的Cre重组酶表达盒，所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列，且可选地，其中，所述Cre重组酶基因可操作地连接至大鼠白蛋白启动子或小鼠白蛋白启动子。

122.根据权利要求113、114和117中任意一项所述的方法，其中，所述Cas表达盒还包含所述Cas蛋白质的编码序列上游的聚腺苷酸化信号，其中，所述聚腺苷酸化信号的侧面具有重组酶识别位点，并且，其中，所述方法还包括以组织特异性的方式向所述非人类动物体内引入重组酶，可选地，其中，所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。

123.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒还包含荧光蛋白编码序列，可选地，其中，所述Cas表达盒包括多顺反子核酸，所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas蛋白质的编码序列和荧光蛋白编码序列，且可选地，其中，所述Cas表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas蛋白质的编码序列和绿色荧光蛋白编码序列。

124.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒还不包括荧光蛋白编码序列。

125.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒的5’端还包含3’剪接序列。

126.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒可操作地连接至内源启动子。

127.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒可操作地连接至外源组成性启动子。

128.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒编码包含SEQ ID NO:13、16、19或22中列出的序列的蛋白质，可选地，其中，所述Cas表达盒包含SEQ ID NO:28、29、30或31中列出的序列，且可选地，其中，所述Cas表达盒包含SEQ IDNO:1、12、14、15、17、18、20或21中列出的序列。

129.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述Cas表达盒被整合至安全港基因座中，可选地，其中，所述安全港基因座为Rosa26基因座，且可选地，其中，所述Cas表达盒被整合至所述Rosa26基因座的第一内含子中。

130.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述非人类动物对于所述Cas表达盒而言是杂合的。

131.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述非人类动物对于所述Cas表达盒而言是纯合的。

132.根据权利要求113、114、117和121中任意一项所述的方法，其中，所述非人类动物是小鼠，

其中，所述AAV8通过静脉内注射递送至所述非人类动物，且

其中，所述Cas表达盒可操作地连接至内源Rosa26启动子、插入Rosa26基因座的第一内含子中，并且在5’至3’方向上包括：(i)3’剪接序列；以及(ii)所述Cas蛋白质的编码序列还包含一个或多个核定位信号，其中所述Cas蛋白质为Cas9蛋白质。

133.一种优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法，包括：

(I)在第一非人类动物中第一次执行权利要求113、114、117和121中任意一项所述的方法；

(II)改变可变量并且在第二非人类动物中使用改变的可变量再次执行步骤(I)的方法；以及

134.根据权利要求133所述的方法，其中

(1)步骤(II)中改变的可变量是将所述向导RNA引入至所述非人类动物的给药途径；

(2)步骤(II)中改变的可变量是引入至所述非人类动物的所述向导RNA的浓度或量；

(3)步骤(II)中改变的可变量是引入至所述非人类动物的所述向导RNA；

(4)其中，所述方法包括引入外源供体核酸，并且，其中，步骤(II)中改变的可变量是将所述外源供体核酸引入所述非人类动物的递送方法或给药途径；

(5)其中，所述方法包括引入外源供体核酸，且步骤(II)中改变的可变量为引入所述非人动物体内的所述外源供体核酸的浓度或量；

(6)其中，所述方法包括引入外源供体核酸，且步骤(II)中改变的可变量是相对于引入至所述非人类动物的外源供体核酸的浓度或量的引入至所述非人类动物的向导RNA的浓度或量；或者

(7)其中，所述方法包括引入外源供体核酸，且步骤(II)中改变的可变量是引入至所述反人类动物的外源供体核酸。