用于驱动T1事件多样性的组合物和方法
相关申请
本申请要求2019年2月25日提交的PCT/CN 2019/076062的优先权,将其通过引用以全文并入本文。
序列表
本申请附有一个序列表,该序列表定名为81776-WO-PCT_Seq_ST25.txt,创建于2020年2月23日,大小为大约1,566kb。本序列表通过引用以其全文并入本文。本序列表随同此申请经由EFS-Web提交,并且符合37C.F.R.§1.824(a)(2)-(6)和(b)。
背景技术
对用来改善作物的数量和质量的科学方法的开发是一项至关重要的工作。基因编辑(例如,通过靶向诱变、插入事件、等位基因替代等的基因编辑)是一种非常重要的技术,广泛用于改善各种作物的数量和质量二者。目前有许多种编辑特异性基因靶的方法,这些方法包括成簇规律间隔短回文重复(CRISPR)和CRISPR相关序列(Cas)酶、转录激活因子样效应子核酸酶(TALEN)、大范围核酸酶和锌指。但是基因编辑并不总是一件容易的事。
通过基因组编辑可以相对容易地完成关闭基因功能的编辑(通常称为“敲除”)。通过使用定点核酸酶,例如Cas9酶和相关的CRISPR指导RNA(gRNA),可以容易地在靶基因的编码序列中产生小的插入或缺失(“indels”),这常常会导致截短蛋白质或产生异常序列的移码。与这些熟知的基因敲除方法相比,实现其他类型的编辑(例如导致部分丧失功能或获得功能的等位基因的编辑,或改变基因的表达水平或蛋白质产物的功能的编辑)可能是非常劳动密集的。这些编辑中的许多需要等位基因替代,而等位基因替代是非常低效的。同样地,进行缺失整个外显子或基因或染色体区域(大缺失)的编辑可能是具有挑战性的,因为这些编辑可能需要同时对多于一个gRNA靶位点进行切割。类似地,引入SNP的编辑-例如,将胞嘧啶核苷酸改变为胸腺嘧啶核苷酸,可以利用“碱基编辑”技术,但是只能在与靶位点相关的某些窗口中进行。仅有一些实例,其中由于所使用的DNA修饰酶系统缺乏完全的特异性或缺乏效率,获得所希望的编辑结果是具有挑战性的。
对于等位基因替代(有时也称为“等位基因交换(allele swapping)”),这是一种利用同源重组或同源定向修复的编辑方法,用来将植物细胞中的内源序列替代为可提供的新序列。虽然在酵母和许多动物系统中这是相当容易做到的,但在植物中却是非常具有挑战性的,因为DNA修复非常倾向于非同源末端连接途径。此外,此过程需要递送丰富的供体DNA至切割位点以作为经由同源重组的DNA修复的模板。此递送并不容易完成,在植物中尤其如此。出于此原因,植物中的等位基因替代典型地是非常昂贵和劳动密集的。例如,如果希望转化植物并进行等位基因替代,可能需要产生一千个稳定转化的事件,才能确保在这些事件中的仅仅一个或两个中产生一个等位基因交换。效率通常小于1%,在一些情况下,效率在0%和0.3%之间。甚至在最好的作物、品系和构建体设计中,效率仍然是非常低的。
本申请人认为,产生等位基因替代、大缺失、某些碱基编辑和各种其他编辑结果的成本和劳动强度已经成为了植物育种的主要瓶颈。很少有方法可以缓解该过程的极低效率问题。因此,本披露涉及这些问题或另外的问题中的至少一个。
除了等位基因替代之外,基因组编辑的另一个主要挑战是制备广泛多样的序列(基因座的等位基因多样性)所需的时间和劳动。例如,通过修饰基因的调控区(启动子)来产生基因编码序列的多样性等位基因阵列或产生表达多样性是非常耗时和昂贵的。在许多实施例中,本披露还涉及成本效益好的用于产生等位基因系列的方法。基于下文的详细说明,这些益处和其他益处将是显而易见的。
发明内容
本披露尤其涉及用于改善基因编辑效率(例如,用于降低在植物DNA中产生多个编辑所需的转化数量)的系统、组合物和方法。在各个实施例中,本披露涉及用于在植物的T1种子中产生多个独特编辑(例如,多个独特等位基因替代、多个独特碱基插入、多个独特碱基缺失和/或多个独特碱基取代)的方法。
例如,这些方法包括将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码DNA修饰酶的核酸;花镶嵌(FMOS)调控序列;和任选地,编码至少一种指导RNA(gRNA)的核酸。FMOS调控序列在花原基细胞和花生殖器官(例如,花药或心皮)中的至少一个中介导DNA修饰酶的表达,并在花原基细胞和花生殖器官中介导多个编辑。然后使植物细胞或组织生长、授粉并产生多个含有多个独特编辑的T1种子。FMOS调控序列将包括FMOS启动子,并且在一些实施例中,进一步包括FMOS终止子。
DNA修饰酶的表达率可因实施例而异,但是在花原基和花生殖器官中的至少一个中是显著的,当营养生长和成熟的种子相比时,尤其如此。例如,在花原基和/或花生殖器官中表达率将是在叶组织或芽尖分生组织(SAM)中的至少2倍,并且在花原基和/或花生殖器官中表达率将是在种子或愈伤组织中的至少2倍。更典型地,表达率甚至将更高,例如,至少10倍、至少50倍、至少100倍、至少500倍或更多倍,例如,高至少1000倍。再在一些实施例中,在营养组织或种子中的一者或二者中将不会有表达。
使用本文所披露的方法,可以在T1种子中产生多个独特编辑。例如,T1代的种子可含有至少3个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑。
所选择的DNA修饰酶可以变化并可以包括例如定点核酸酶,该定点核酸酶选自由以下组成的组:大范围核酸酶(MN);锌指核酸酶(ZFN);转录激活因子样效应子核酸酶(TALEN);Cas9核酸酶、Cas12a(在本文中也称为“Cpf1”)核酸酶、Cas12b核酸酶、Cas12i核酸酶、Cas12h核酸酶等;dCas9-FokI;dCpf1-FokI;嵌合Cas9-胞苷脱氨酶或嵌合Cas12a-胞苷脱氨酶;嵌合Cas9-腺嘌呤脱氨酶或嵌合Cas12a-腺嘌呤脱氨酶(AID);Cas9-EvolvR序列或Cas12a EvolvR序列(易错细菌DNA聚合酶I);嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCas12a非FokI核酸酶。
当产生多个独特等位基因替代时,该至少一个表达盒还可以包括另外的组分,这些组分包括目的核酸(在本文中也称为“供体DNA”)以赋予所希望的等位基因。可使用另外的特征,例如,用于驱动供体DNA复制的复制酶(Rep或RepA)基因,来辅助供体DNA的复制。在许多实例中,供体DNA将是复制子中的组分,该复制子包括另外的特征,例如,小麦矮化病毒(WDV)的长基因间区(LIR)和例如衍生自小麦矮化病毒(WDV)的短基因间区(SIR)。Rep/RepA引发供体DNA的滚环扩增,供体DNA位于同一病毒的长基因间区(LIR)和短基因间区(SIR)之间,在这里通常可见例如迁移蛋白基因和包被蛋白基因。
在一些实施例中,该DNA修饰酶是Cas9核酸酶或Cas12a核酸酶并且该至少一个表达盒包含编码gRNA的核酸。编码gRNA的核酸可操作地连接至FMOS启动子或第二启动子。该至少一个表达盒可进一步包含目的核酸(供体DNA)并可用于等位基因替代编辑。该至少一个表达盒可进一步包含可操作地连接至供体DNA以驱动供体DNA的复制的复制启动子。
这些方法可进一步包括使T1种子生长以产生多个T1植物,测量T1代的植物中的至少一种表型,和基于所测量的受独特编辑驱动的表型差异选择T1代的植物。在一些实施例中,这些方法可包括对T1代的所选择的植物中的供体DNA、INDEL或SNP的插入位点进行测序,对T1代的非选择的植物的供体DNA、INDEL或SNP的插入位点进行测序,和将这些序列进行比对。所选择的具有独特编辑的植物还可与不具有独特编辑的植物杂交或者自交以产生具有独特编辑的后代。
在另一个实施例中,用于在植物的T1种子中产生多个独特编辑的方法包括在花原基细胞或花生殖器官中表达编码DNA修饰酶的核酸和编码指导RNA(gRNA)的核酸。编码DNA修饰酶的核酸和编码gRNA的核酸中的至少一种可操作地连接至FMOS启动子。然后将植物组织再生为具有多个T1种子的植物,其中T1种子含有多个独特编辑。在此实例中,该方法可进一步包括将供体DNA递送至在其中进行表达的植物细胞或植物组织中,和将供体DNA插入到植物的DNA中,例如以产生例如具有功能获得或功能替代的等位基因替代。
本披露还涉及用于改善基因编辑效率的各种组合物。例如,一个实施例包括用于在植物的T1种子中产生独特编辑的至少一个表达盒。在此实施例中,表达盒包含编码DNA修饰酶的核酸、任选的编码至少一种指导RNA(gRNA)的核酸和FMOS启动子。在另一个实施例中,该至少一个表达盒被包含在载体中。
在一些实施例中,本披露提供了用于在植物的种子中改变靶基因的表达的方法和组合物。示例性方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码DNA修饰酶的核酸;编码至少一种指导RNA(gRNA)的核酸,其中该至少一种指导RNA靶向靶基因的调控区;和花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导DNA修饰酶的表达,并(ii)在花原基和花生殖器官中的至少一个中的靶基因的调控区中介导多个编辑。可以将植物细胞或植物组织再生为具有多个T1种子的T0植物,其中该T1种子在靶基因的调控区中含有多个独特编辑,从而产生多个靶基因表达谱。
在一些实施例中,本披露提供了用于在至少具有编码第一网络成员的第一DNA和编码第二网络成员的第二DNA的基因调控网络(GRN)中产生可变敲除组合的方法和组合物。示例性方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码DNA修饰酶的核酸;编码第一指导RNA(gRNA)的核酸,该指导RNA靶向编码第一网络成员的第一DNA;编码第二指导RNA(gRNA)的核酸,该指导RNA靶向编码第二网络成员的第二DNA;和花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导DNA修饰酶的表达,并(ii)在花原基和花生殖器官中的至少一个中介导多个编辑。然后可以将植物细胞或组织再生为具有多个T1种子的T0植物,其中该T1种子在GRN中含有多个独特敲除组合。
在一些实施例中,本披露提供了用于在植物的T1种子中产生多个独特点突变的方法和组合物。示例性方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码催化失活的Cas(dCas)的核酸;编码至少一种指导RNA(gRNA)的核酸,该指导RNA携带MS2发夹结合位点;编码脱氨酶的核酸;和花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导DNA修饰酶的表达,并(ii)在花原基和花生殖器官中的至少一个中介导多个编辑。可以将植物细胞或组织再生为具有多个T1种子的T0植物,其中该T1种子含有多个独特点突变。dCas可因实施例而异并且可包括例如失活的Cas9(dCas9)或失活的Cas12a(dCas12a)。示例性脱氨酶是活化诱导的胞苷脱氨酶(AID)。
在其他实施例中,用于在植物的T1种子中产生多个独特点突变的方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码Cas的切口变体(nCas)的核酸;编码DNA聚合酶(Pol)的核酸;编码至少一种指导RNA(gRNA)的核酸;和花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导nCas和Pol的表达,并(ii)在花原基和花生殖器官中的至少一个中介导多个编辑。可以将植物细胞或组织再生为具有多个T1种子的T0植物,其中该T1种子含有多个独特点突变。nCas可以是切口Cas9(nCas9)或切割Cas12a(nCas12a),可以将其融合至例如编码的Pol。在许多实例中,nCas是具有D10A突变的nCas9。在许多实例中,Pol是大肠杆菌Pol,其可包括以下突变D424A、I709N和A759R中的至少一个。
在一些实施例中,本披露提供了用于在植物的T1种子中缺失大基因间区的组合物和方法。示例性方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码RNA定点核酸酶的核酸;编码至少一种第一指导RNA(gRNA-1)的核酸;编码至少一种第二指导RNA(gRNA-2)的核酸,其中该gRNA-1靶向染色体上的第一靶序列并且其中该gRNA-2靶向染色体上的第二靶序列,其中该第一靶序列和该第二靶序列相距至少0.1Mb;和花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导DNA修饰酶的表达,并(ii)在花原基和花生殖器官中的至少一个中介导多个编辑。可以将植物细胞或组织再生为具有多个T1种子的T0植物,其中该T1种子含有至少一个大基因间缺失。大基因间区的尺寸可因实施例而异。例如,大基因间区可包括在0.1-2Mb、0.2-1.9Mb、0.3-1.8Mb、0.4-1.7Mb、0.5-1.6Mb、0.6-1.5Mb、0.7-1.4Mb、0.7-1.3Mb、0.7-1.2Mb、0.3-1.1Mb、0.3-1.0Mb、0.4-1.0Mb、0.5-1.0Mb和0.6-0.8Mb中的至少一个的范围中的至少一个区域。有些类似地,第一靶序列和第二靶序列之间的距离可因实施例而异。例如,第一靶序列和第二靶序列可由在0.1-2Mb、0.2-1.9Mb、0.3-1.8Mb、0.4-1.7Mb、0.5-1.6Mb、0.6-1.5Mb、0.7-1.4Mb、0.7-1.3Mb、0.7-1.2Mb、0.3-1.1Mb、0.3-1.0Mb、0.4-1.0Mb、0.5-1.0Mb和0.6-0.8Mb中的至少一个的范围中的至少一个距离隔开。编码gRNA-1的核酸可操作地连接至FMOS启动子或第二启动子,并且编码gRNA-2的核酸可操作地连接至FMOS启动子,至第二启动子,或至第三启动子。
在其他实施例中,本披露提供了用于在植物的T1种子中产生多个独特编辑的另外的组合物和方法。示例性方法包括a)将至少一个表达盒转化至植物细胞或植物组织中,其中该至少一个表达盒包含编码RNA定点核酸酶的核酸;编码指导RNA(gRNA)的核酸;和包含FMOS启动子的花镶嵌(FMOS)调控序列,其中该FMOS调控序列(i)在花原基细胞和花生殖器官中的至少一个中介导gRNA的表达,(ii)在花原基和花生殖器官中的至少一个中介导多个编辑,(iii)在花原基和花生殖器官中的至少一个中比在芽尖分生组织(SAM)中介导gRNA至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个,并且(iv)在花原基和花生殖器官中的至少一个中比在种子中介导gRNA至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个。可以将植物细胞或组织再生为具有多个T1种子的植物,该T1种子具有多个独特编辑。
在一些方面,本披露提供了通过本文所述的实施例中的任一个所述的用途或方法可获得或获得的作物植物或其种子。在一些方面,本披露提供了包含如本文所披露的至少一个表达盒的植物细胞。
以上发明内容旨在总结本披露的某些实施例。在下文中的表和描述中将更详细地对实施例进行陈述。然而,将清楚的是,对特定实施例的具体描述并非旨在限制本发明的范围。
序列表的简要说明
SEQ ID NO:1是载体24301的核苷酸序列。
SEQ ID NO:2是载体24301中的启动子prZmAP1-01的核苷酸序列。
SEQ ID NO:3是载体24301中的终止子tZmAP1-01的核苷酸序列。
SEQ ID NO:4是载体24301中的cCas9-02的核苷酸序列。
SEQ ID NO:5是载体24301中的rsgRNAZmADH1-01的核苷酸序列。
SEQ ID NO:6是载体24301中的ZmADH1靶的核苷酸序列。
SEQ ID NO:7是载体24301中的rCrRNA-01的核苷酸序列。
SEQ ID NO:8是载体24301中的rTracrRNA-01的核苷酸序列。
SEQ ID NO:9是载体24301中的启动子prOsU3-01的核苷酸序列。
SEQ ID NO:10是载体24224(对照)的核苷酸序列。
SEQ ID NO:11是载体24224中的启动子_prCMP-04的核苷酸序列。
SEQ ID NO:12是载体24224中的终止子tNOS-05-01的核苷酸序列。
SEQ ID NO:13是载体24224中的Cas9的核苷酸序列。
SEQ ID NO:14是载体24224中的rsgRNAZmADH1-01的核苷酸序列。
SEQ ID NO:15是载体24224中的ZmADH1靶的核苷酸序列。
SEQ ID NO:16是载体24224中的rCrRNA-01的核苷酸序列。
SEQ ID NO:17是载体24224中的rTracrRNA-01的核苷酸序列。
SEQ ID NO:18是载体24224中的启动子prOsU3-01的核苷酸序列。
SEQ ID NO:19是载体24265的核苷酸序列。
SEQ ID NO:20是载体24265中的启动子prZmBde1-01的核苷酸序列。
SEQ ID NO:21是载体24265中的终止子tNOS-05-01的核苷酸序列。
SEQ ID NO:22是载体24266的核苷酸序列。
SEQ ID NO:23是载体24266中的启动子prZmBde1-01的核苷酸序列。
SEQ ID NO:24是载体24266中的终止子tZmBde1-01的核苷酸序列。
SEQ ID NO:25是载体24269的核苷酸序列。
SEQ ID NO:26是载体24269中的启动子prZmAGO18A-01的核苷酸序列。
SEQ ID NO:27是载体24269中的终止子tZmAGO18A-01的核苷酸序列。
SEQ ID NO:28是载体24270的核苷酸序列。
SEQ ID NO:29是载体24270中的启动子prZmAGO5B-01的核苷酸序列。
SEQ ID NO:30是载体24270中的终止子tZmAGO5B-01的核苷酸序列。
SEQ ID NO:31是载体24289的核苷酸序列。
SEQ ID NO:32是载体24289中的启动子prZmAG5-02的核苷酸序列。
SEQ ID NO:33是载体24289中的终止子tZmAG5-01的核苷酸序列。
SEQ ID NO:34是载体24299的核苷酸序列。
SEQ ID NO:35是载体24299中的启动子prZmAG5-01的核苷酸序列。
SEQ ID NO:36是载体24299中的终止子tZmAG5-01的核苷酸序列。
SEQ ID NO:37是载体24230的核苷酸序列。
SEQ ID NO:38是载体24230中的启动子prZmAGO18B-01的核苷酸序列。
SEQ ID NO:39是载体24230中的终止子tZmAGO18B-01的核苷酸序列。
SEQ ID NO:40是载体24243的核苷酸序列。
SEQ ID NO:41是载体24243中的启动子prOsMEL1-01的核苷酸序列。
SEQ ID NO:42是载体24243中的终止子tOsMEL1-01的核苷酸序列。
SEQ ID NO:43是载体24305的核苷酸序列。
SEQ ID NO:44是载体24305中的启动子prOsMEL1-02的核苷酸序列。
SEQ ID NO:45是载体24305中的终止子tOsMEL1-01的核苷酸序列。
SEQ ID NO:46是载体24306的核苷酸序列。
SEQ ID NO:47是载体24306中的启动子prZmCoLig-01的核苷酸序列。
SEQ ID NO:48是载体24306中的终止子tZmCoLig-01的核苷酸序列。
SEQ ID NO:49是载体24320的核苷酸序列。
SEQ ID NO:50是载体24320中的启动子prZmBde1-02的核苷酸序列。
SEQ ID NO:51是载体24320中的终止子tZmBde1-01的核苷酸序列。
SEQ ID NO:52是载体24426的核苷酸序列。
SEQ ID NO:53是载体24426中的启动子prOsZFP-01的核苷酸序列。
SEQ ID NO:54是载体24426中的终止子tOsZFP-01的核苷酸序列。
SEQ ID NO:55是载体24427的核苷酸序列。
SEQ ID NO:56是载体24427中的启动子prZmAMS-01的核苷酸序列。
SEQ ID NO:57是载体24427中的终止子tZmAMS-01的核苷酸序列。
SEQ ID NO:58是载体24428的核苷酸序列。
SEQ ID NO:59是载体24428中的启动子prZmAMS-01的核苷酸序列。
SEQ ID NO:60是载体24428中的终止子tNOS-05-01的核苷酸序列。
SEQ ID NO:61是载体24454的核苷酸序列。
SEQ ID NO:62是载体24454中的启动子prZmExine1-01的核苷酸序列。
SEQ ID NO:63是载体244254中的终止子tZmExine1-01的核苷酸序列。
SEQ ID NO:64是载体24455的核苷酸序列。
SEQ ID NO:65是载体24455中的启动子prOsExine1-01的核苷酸序列。
SEQ ID NO:66是载体244255中的终止子tOsExine1-01的核苷酸序列。
SEQ ID NO:67是载体24458的核苷酸序列。
SEQ ID NO:68是载体24458中的启动子prZmAMS-01的核苷酸序列。
SEQ ID NO:69是载体244258中的终止子tNOS-05-01的核苷酸序列。
SEQ ID NO:70是载体24459的核苷酸序列。
SEQ ID NO:71是载体24459中的启动子prOsTBr1-01的核苷酸序列。
SEQ ID NO:72是载体24429中的终止子tOsTBr1-01的核苷酸序列。
SEQ ID NO:73是载体24460的核苷酸序列。
SEQ ID NO:74是载体24460中的启动子prOsAP1-01的核苷酸序列。
SEQ ID NO:75是载体24460中的终止子tOsAP1-01的核苷酸序列。
SEQ ID NO:76是载体24548的核苷酸序列。
SEQ ID NO:77是载体24548中的启动子prZmRa2-02的核苷酸序列。
SEQ ID NO:78是载体24548中的终止子tZmRa2-02的核苷酸序列。
SEQ ID NO:79是载体24602的核苷酸序列。
SEQ ID NO:80是载体24602中的启动子prOsCoLig-01的核苷酸序列。
SEQ ID NO:81是载体24602中的终止子tOsCoLig-01的核苷酸序列。
SEQ ID NO:82是载体24688的核苷酸序列。
SEQ ID NO:83是载体24688中的启动子prZmWUS2-01的核苷酸序列。
SEQ ID NO:84是载体24688中的终止子tZmWUS2-01的核苷酸序列。
SEQ ID NO:85是载体24300的核苷酸序列。
SEQ ID NO:86是载体24300中的启动子prZmAGO18B-01的核苷酸序列。
SEQ ID NO:87是载体24300中的终止子tZmAGO18B-01的核苷酸序列。
SEQ ID NO:88是载体25123的核苷酸序列。
SEQ ID NO:89是载体25123中的启动子prZmBde1-02的核苷酸序列。
SEQ ID NO:90是载体25123中的终止子tZmBde1-01的核苷酸序列。
SEQ ID NO:91是载体25123中的启动子prOsU3-1的核苷酸序列。
SEQ ID NO:92是载体25123中的内含子iZmBde1-01的核苷酸序列。
SEQ ID NO:93是载体25123中的xNLS-01的核苷酸序列。
SEQ ID NO:94是载体25123中的xALS靶-01的核苷酸序列。
SEQ ID NO:95是载体25123中的ALS靶的核苷酸序列。
SEQ ID NO:96是载体25123中的ALS靶的核苷酸序列。
SEQ ID NO:97是载体25123中的xZmALS-V2的核苷酸序列(供体DNA)。
SEQ ID NO:98是载体25123中的rsgRNAZmALS-V1的核苷酸序列。
SEQ ID NO:99是载体25123中的rCrRNA-01的核苷酸序列。
SEQ ID NO:100是载体25123中的rTracrRNA-01的核苷酸序列。
SEQ ID NO:101是载体25123中的启动子prOsU3-01的核苷酸序列。
SEQ ID NO:102是25123中的Cas9的核苷酸序列。SEQ ID NO:103是来自载体24269(事件编号MZKE181002A135A,样品1)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:104是来自载体24269(事件编号MZKE181002A135A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:105是来自载体24269(事件编号MZKE181002A135A,样品2)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:106是来自载体24269(事件编号MZKE181002A135A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:107是来自载体24269(事件编号MZKE181002A135A,样品3)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:108是来自载体24269(事件编号MZKE181002A135A,样品4)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:109是来自载体24269(事件编号MZKE181002A135A,样品5)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:110是来自载体24269(事件编号MZKE181002A135A,样品6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:111是来自载体24269(事件编号MZKE181002A135A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:112是来自载体24269(事件编号MZKE181002A135A,样品7)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:113是来自载体24269(事件编号MZKE181002A135A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:114是来自载体24269(事件编号MZKE181002A135A,样品8)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:115是来自载体24269(事件编号MZKE181002A135A,样品9)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:116是来自载体24269(事件编号MZKE181002A135A,样品10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:117是来自载体24269(事件编号MZKE181002A135A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:118是来自载体24269(事件编号MZKE181002A135A,样品12)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:119是来自载体24269(事件编号MZKE181002A135A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:120是来自载体24269(事件编号MZKE181002A135A,样品14)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:121是来自载体24269(事件编号MZKE181002A135A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:122是来自载体24269(事件编号MZKE181002A135A,样品15)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:123是来自载体24269(事件编号MZKE181002A135A,样品16)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:124是来自载体24269(事件编号MZKE181002A135A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:125是来自载体24269(事件编号MZKE181002A135A,样品17)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:126是来自载体24269(事件编号MZKE181002A135A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:127是来自载体24269(事件编号MZKE181002A135A,样品19)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:128是来自载体24269(事件编号MZKE181002A135A,样品19a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:129是来自载体24269(事件编号MZKE181002A135A,样品19b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:130是来自载体24269(事件编号MZKE181002A135A,样品20)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:131是来自载体24269(事件编号MZKE181002A135A,样品21)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:132是来自载体24269(事件编号MZKE181002A135A,样品21a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:133是来自载体24269(事件编号MZKE181002A135A,样品22)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:134是来自载体24269(事件编号MZKE181002A135A,样品22a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:135是来自载体24269(事件编号MZKE181002A135A,样品23)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:136是来自载体24269(事件编号MZKE181002A135A,样品23a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:137是来自载体24269(事件编号MZKE181002A135A,样品23b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:138是来自载体24269(事件编号MZKE181002A135A,样品24)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:139是来自载体24269(事件编号MZKE181002A135A,样品24a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:140是来自载体24269(事件编号MZKE181002A135A,样品24b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:141是来自载体24269(事件编号MZKE181002A135A,样品25)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:142是来自载体24269(事件编号MZKE181002A135A,样品25a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:143是来自载体24269(事件编号MZKE181002A135A,样品26)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:144是来自载体24269(事件编号MZKE181002A135A,样品26a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:145是来自载体24269(事件编号MZKE181002A135A,样品27)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:146是来自载体24269(事件编号MZKE181002A135A,样品28)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:147是来自载体24269(事件编号MZKE181002A135A,样品28a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:148是来自载体24269(事件编号MZKE181002A135A,样品29)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:149是来自载体24269(事件编号MZKE181002A135A,样品29a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:150是来自载体24269(事件编号MZKE181002A135A,样品30)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:151是来自载体24269(事件编号MZKE181002A135A,样品30a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:152是来自载体24269(事件编号MZKE181002A135A,样品31)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:153是来自载体24269(事件编号MZKE181002A135A,样品32)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:154是来自载体24269(事件编号MZKE181002A135A,样品32a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:155是来自载体24269(事件编号MZKE181002A135A,样品33)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:156是来自载体24269(事件编号MZKE181002A135A,样品33a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:157是来自载体24269(事件编号MZKE181002A135A,样品34)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:158是来自载体24269(事件编号MZKE181002A135A,样品34a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:159是来自载体24269(事件编号MZKE181002A135A,样品35)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:160是来自载体24269(事件编号MZKE181002A135A,样品35a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:161是来自载体24269(事件编号MZKE181002A135A,样品36)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:162是来自载体24269(事件编号MZKE181002A135A,样品36a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:163是来自载体24269(事件编号MZKE181002A135A,样品37)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:164是来自载体24269(事件编号MZKE181002A135A,样品37a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:165是来自载体24269(事件编号MZKE181002A135A,样品38)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:166是来自载体24269(事件编号MZKE181002A135A,样品38a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:167是来自载体24269(事件编号MZKE181002A135A,样品39)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:168是来自载体24269(事件编号MZKE181002A135A,样品39a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:169是来自载体24269(事件编号MZKE181002A135A,样品40)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:170是来自载体24269(事件编号MZKE181002A135A,样品40a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:171是来自载体24269(事件编号MZKE181002A135A,样品41)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:172是来自载体24269(事件编号MZKE181002A135A,样品42)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:173是来自载体24269(事件编号MZKE181002A135A,样品42a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:174是来自载体24269(事件编号MZKE181002A135A,样品43)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:175是来自载体24269(事件编号MZKE181002A135A,样品44)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:176是来自载体24269(事件编号MZKE181002A135A,样品44a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:177是来自载体24269(事件编号MZKE181002A135A,样品45)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:178是来自载体24269(事件编号MZKE181002A135A,样品45a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:179是来自载体24269(事件编号MZKE181002A135A,样品46)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:180是来自载体24269(事件编号MZKE181002A135A,样品47)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:181是来自载体24269(事件编号MZKE181002A135A,样品47a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:182是来自载体24269(事件编号MZKE181002A135A,样品48)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:183是来自载体24269(事件编号MZKE181002A135A,样品49)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:184是来自载体24269(事件编号MZKE181002A135A,样品49a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:185是来自载体24269(事件编号MZKE181002A135A,样品50)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:186是载体AR-SDN2_REP_NoCut的核苷酸序列。
SEQ ID NO:187是载体AR-SDN2_REP_2Cuts的核苷酸序列。
SEQ ID NO:188是载体AR-SDN2_REP_1Cut的核苷酸序列。
SEQ ID NO:189是来自载体24269(事件编号MZKE181002A135A,样品13)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:190是来自载体24301(事件编号MZKE18100A050A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:191是来自载体24301(事件编号MZKE18100A050A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:192是来自载体24301(事件编号MZKE18100A050A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:193是来自载体24301(事件编号MZKE18100A050A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:194是来自载体24301(事件编号MZKE18100A050A,样品3)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:195是来自载体24301(事件编号MZKE18100A050A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:196是来自载体24301(事件编号MZKE18100A050A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:197是来自载体24301(事件编号MZKE18100A050A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:198是来自载体24301(事件编号MZKE18100A050A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:199是来自载体24301(事件编号MZKE18100A050A,样品6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:200是来自载体24301(事件编号MZKE18100A050A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:201是来自载体24301(事件编号MZKE18100A050A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:202是来自载体24301(事件编号MZKE18100A050A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:203是来自载体24301(事件编号MZKE18100A050A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:204是来自载体24301(事件编号MZKE18100A050A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:205是来自载体24301(事件编号MZKE18100A050A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:206是来自载体24301(事件编号MZKE18100A050A,样品10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:207是来自载体24301(事件编号MZKE18100A050A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:208是来自载体24301(事件编号MZKE18100A050A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:209是来自载体24301(事件编号MZKE18100A050A,样品12)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:210是来自载体24301(事件编号MZKE18100A050A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:211是来自载体24301(事件编号MZKE18100A050A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:212是来自载体24301(事件编号MZKE18100A050A,样品14)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:213是来自载体24301(事件编号MZKE18100A050A,样品15)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:214是来自载体24301(事件编号MZKE18100A050A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:215是来自载体24301(事件编号MZKE18100A050A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:216是来自载体24301(事件编号MZKE18100A050A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:217是来自载体24301(事件编号MZKE18100A050A,样品17b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:218是来自载体24301(事件编号MZKE18100A050A,样品18a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:219是来自载体24301(事件编号MZKE18100A050A,样品18b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:220是来自载体24301(事件编号MZKE18100A050A,样品19)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:221是来自载体24301(事件编号MZKE18100A050A,样品20a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:222是来自载体24301(事件编号MZKE18100A050A,样品20b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:223是来自载体24301(事件编号MZKE18100A050A,样品21)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:224是来自载体24301(事件编号MZKE18100A063A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:225是来自载体24301(事件编号MZKE18100A063A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:226是来自载体24301(事件编号MZKE18100A063A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:227是来自载体24301(事件编号MZKE18100A063A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:228是来自载体24301(事件编号MZKE18100A063A,样品3)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:229是来自载体24301(事件编号MZKE18100A063A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:230是来自载体24301(事件编号MZKE18100A063A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:231是来自载体24301(事件编号MZKE18100A063A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:232是来自载体24301(事件编号MZKE18100A063A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:233是来自载体24301(事件编号MZKE18100A063A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:234是来自载体24301(事件编号MZKE18100A063A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:235是来自载体24301(事件编号MZKE18100A063A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:236是来自载体24301(事件编号MZKE18100A063A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:237是来自载体24301(事件编号MZKE18100A063A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:238是来自载体24301(事件编号MZKE18100A063A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:239是来自载体24301(事件编号MZKE18100A064A,样品1)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:240是来自载体24301(事件编号MZKE18100A064A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:241是来自载体24301(事件编号MZKE18100A064A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:242是来自载体24301(事件编号MZKE18100A064A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:243是来自载体24301(事件编号MZKE18100A064A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:244是来自载体24301(事件编号MZKE18100A064A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:245是来自载体24301(事件编号MZKE18100A064A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:246是来自载体24301(事件编号MZKE18100A064A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:247是来自载体24301(事件编号MZKE18100A064A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:248是来自载体24301(事件编号MZKE18100A064A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:249是来自载体24301(事件编号MZKE18100A064A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:250是来自载体24301(事件编号MZKE18100A064A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:251是来自载体24301(事件编号MZKE18100A064A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:252是来自载体24301(事件编号MZKE18100A064A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:253是来自载体24301(事件编号MZKE18100A064A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:254是来自载体24301(事件编号MZKE18100A064A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:255是来自载体24301(事件编号MZKE18100A064A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:256是来自载体24301(事件编号MZKE18100A064A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:257是来自载体24301(事件编号MZKE18100A064A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:258是来自载体24301(事件编号MZKE18100A064A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:259是来自载体24301(事件编号MZKE18100A064A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:260是来自载体24301(事件编号MZKE18100A078A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:261是来自载体24301(事件编号MZKE18100A078A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:262是来自载体24301(事件编号MZKE18100A078A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:263是来自载体24301(事件编号MZKE18100A078A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:264是来自载体24301(事件编号MZKE18100A078A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:265是来自载体24301(事件编号MZKE18100A078A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:266是来自载体24301(事件编号MZKE18100A078A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:267是来自载体24301(事件编号MZKE18100A078A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:268是来自载体24301(事件编号MZKE18100A078A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:269是来自载体24301(事件编号MZKE18100A078A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:270是来自载体24301(事件编号MZKE18100A078A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:271是来自载体24301(事件编号MZKE18100A078A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:272是来自载体24301(事件编号MZKE18100A078A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:273是来自载体24301(事件编号MZKE18100A078A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:274是来自载体24301(事件编号MZKE18100A078A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:275是来自载体24301(事件编号MZKE18100A078A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:276是来自载体24301(事件编号MZKE18100A078A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:277是来自载体24301(事件编号MZKE18100A078A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:278是来自载体24301(事件编号MZKE18100A078A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:279是来自载体24301(事件编号MZKE18100A078A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:280是来自载体24301(事件编号MZKE18100A078A,样品11)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:281是来自载体24301(事件编号MZKE18100A078A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:282是来自载体24301(事件编号MZKE18100A078A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:283是来自载体24301(事件编号MZKE18100A078A,样品13)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:284是来自载体24301(事件编号MZKE18100A078A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:285是来自载体24301(事件编号MZKE18100A078A,样品14b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:286是来自载体24301(事件编号MZKE18100A078A,样品15a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:287是来自载体24301(事件编号MZKE18100A078A,样品15b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:288是来自载体24301(事件编号MZKE18100A078A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:289是来自载体24301(事件编号MZKE18100A078A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:290是来自载体24301(事件编号MZKE18100A078A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:291是来自载体24301(事件编号MZKE18100A078A,样品17b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:292是来自载体24301(事件编号MZKE18100A078A,样品18a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:293是来自载体24301(事件编号MZKE18100A078A,样品18b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:294是来自载体24301(事件编号MZKE18100A078A,样品19a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:295是来自载体24301(事件编号MZKE18100A078A,样品19b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:296是来自载体24301(事件编号MZKE18100A078A,样品20a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:297是来自载体24301(事件编号MZKE18100A078A,样品20b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:298是来自载体24301(事件编号MZKE18100A078A,样品21a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:299是来自载体24301(事件编号MZKE18100A078A,样品21b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:300是来自载体24301(事件编号MZKE18100A078A,样品22)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:301是来自载体24301(事件编号MZKE18100A078A,样品23a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:302是来自载体24301(事件编号MZKE18100A078A,样品23b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:303是来自载体24301(事件编号MZKE18100A078A,样品24)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:304是来自载体24301(事件编号MZKE18100A078A,样品25a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:305是来自载体24301(事件编号MZKE18100A078A,样品25b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:306是来自载体24301(事件编号MZKE18100A078A,样品26a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:307是来自载体24301(事件编号MZKE18100A078A,样品26b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:308是来自载体24301(事件编号MZKE18100A078A,样品27a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:309是来自载体24301(事件编号MZKE18100A078A,样品27b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:310是来自载体24301(事件编号MZKE18100A078A,样品28a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:311是来自载体24301(事件编号MZKE18100A078A,样品28b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:312是来自载体24301(事件编号MZKE18100A078A,样品29a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:313是来自载体24301(事件编号MZKE18100A078A,样品29b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:314是来自载体24301(事件编号MZKE18100A084A,样品1)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:315是来自载体24301(事件编号MZKE18100A084A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:316是来自载体24301(事件编号MZKE18100A084A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:317是来自载体24301(事件编号MZKE18100A084A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:318是来自载体24301(事件编号MZKE18100A084A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:319是来自载体24301(事件编号MZKE18100A084A,样品4)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:320是来自载体24301(事件编号MZKE18100A084A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:321是来自载体24301(事件编号MZKE18100A084A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:322是来自载体24301(事件编号MZKE18100A084A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:323是来自载体24301(事件编号MZKE18100A084A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:324是来自载体24301(事件编号MZKE18100A084A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:325是来自载体24301(事件编号MZKE18100A084A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:326是来自载体24301(事件编号MZKE18100A084A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:327是来自载体24301(事件编号MZKE18100A084A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:328是来自载体24301(事件编号MZKE18100A084A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:329是来自载体24301(事件编号MZKE18100A084A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:330是来自载体24301(事件编号MZKE18100A084A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:331是来自载体24301(事件编号MZKE18100A084A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:332是来自载体24301(事件编号MZKE18100A084A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:333是来自载体24301(事件编号MZKE18100A084A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:334是来自载体24301(事件编号MZKE18100A084A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:335是来自载体24301(事件编号MZKE18100A084A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:336是来自载体24301(事件编号MZKE18100A084A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:337是来自载体24301(事件编号MZKE18100A084A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:338是来自载体24301(事件编号MZKE18100A084A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:339是来自载体24301(事件编号MZKE18100A084A,样品14b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:340是来自载体24301(事件编号MZKE18100A084A,样品15a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:341是来自载体24301(事件编号MZKE18100A084A,样品15b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:342是来自载体24301(事件编号MZKE18100A084A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:343是来自载体24301(事件编号MZKE18100A084A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:344是来自载体24301(事件编号MZKE18100A084A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:345是来自载体24301(事件编号MZKE18100A084A,样品17b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:346是来自载体24301(事件编号MZKE18100A084A,样品18)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:347是来自载体24301(事件编号MZKE18100A084A,样品19a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:348是来自载体24301(事件编号MZKE18100A084A,样品19b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:349是来自载体24320(事件编号MZKE18200A019A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:350是来自载体24320(事件编号MZKE18200A019A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:351是来自载体24320(事件编号MZKE18200A019A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:352是来自载体24320(事件编号MZKE18200A019A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:353是来自载体24320(事件编号MZKE18200A019A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:354是来自载体24320(事件编号MZKE18200A019A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:355是来自载体24320(事件编号MZKE18200A019A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:356是来自载体24320(事件编号MZKE18200A019A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:357是来自载体24320(事件编号MZKE18200A019A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:358是来自载体24320(事件编号MZKE18200A019A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:359是来自载体24320(事件编号MZKE18200A019A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:360是来自载体24320(事件编号MZKE18200A019A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:361是来自载体24320(事件编号MZKE18200A019A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:362是来自载体24320(事件编号MZKE18200A019A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:363是来自载体24320(事件编号MZKE18200A019A,样品8)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:364是来自载体24320(事件编号MZKE18200A019A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:365是来自载体24320(事件编号MZKE18200A019A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:366是来自载体24320(事件编号MZKE18200A019A,样品10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:367是来自载体24320(事件编号MZKE18200A019A,样品11)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:368是来自载体24320(事件编号MZKE18200A019A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:369是来自载体24320(事件编号MZKE18200A019A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:370是来自载体24320(事件编号MZKE18200A019A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:371是来自载体24320(事件编号MZKE18200A019A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:372是来自载体24320(事件编号MZKE18200A019A,样品14)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:373是来自载体24320(事件编号MZKE18200A019A,样品15a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:374是来自载体24320(事件编号MZKE18200A019A,样品15b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:375是来自载体24320(事件编号MZKE18200A019A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:376是来自载体24320(事件编号MZKE18200A019A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:377是来自载体24320(事件编号MZKE18200A019A,样品17)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:378是来自载体24320(事件编号MZKE18200A028A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:379是来自载体24320(事件编号MZKE18200A028A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:380是来自载体24320(事件编号MZKE18200A028A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:381是来自载体24320(事件编号MZKE18200A028A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:382是来自载体24320(事件编号MZKE18200A028A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:383是来自载体24320(事件编号MZKE18200A028A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:384是来自载体24320(事件编号MZKE18200A028A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:385是来自载体24320(事件编号MZKE18200A028A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:386是来自载体24320(事件编号MZKE18200A028A,样品5)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:387是来自载体24320(事件编号MZKE18200A028A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:388是来自载体24320(事件编号MZKE18200A028A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:389是来自载体24320(事件编号MZKE18200A028A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:390是来自载体24320(事件编号MZKE18200A028A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:391是来自载体24320(事件编号MZKE18200A028A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:392是来自载体24320(事件编号MZKE18200A028A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:393是来自载体24320(事件编号MZKE18200A028A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:394是来自载体24320(事件编号MZKE18200A028A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:395是来自载体24320(事件编号MZKE18200A028A,样品10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:396是来自载体24320(事件编号MZKE18200A028A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:397是来自载体24320(事件编号MZKE18200A028A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:398是来自载体24320(事件编号MZKE18200A028A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:399是来自载体24320(事件编号MZKE18200A028A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:400是来自载体24320(事件编号MZKE18200A028A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:401是来自载体24320(事件编号MZKE18200A028A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:402是来自载体24320(事件编号MZKE18200A028A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:403是来自载体24320(事件编号MZKE18200A028A,样品14b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:404是来自载体24320(事件编号MZKE18200A028A,样品15)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:405是来自载体24320(事件编号MZKE18200A028A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:406是来自载体24320(事件编号MZKE18200A028A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:407是来自载体24320(事件编号MZKE18200A028A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:408是来自载体24320(事件编号MZKE18200A028A,样品17b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:409是来自载体24320(事件编号MZKE18200A028A,样品18a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:410是来自载体24320(事件编号MZKE18200A028A,样品18b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:411是来自载体24320(事件编号MZKE18200A028A,样品19a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:412是来自载体24320(事件编号MZKE18200A028A,样品19b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:413是来自载体24320(事件编号MZKE18200A028A,样品20a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:414是来自载体24320(事件编号MZKE18200A028A,样品20b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:415是来自载体24320(事件编号MZKE18200A028A,样品21a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:416是来自载体24320(事件编号MZKE18200A028A,样品21b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:417是来自载体24320(事件编号MZKE18200A028A,样品22a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:418是来自载体24320(事件编号MZKE18200A028A,样品22b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:419是来自载体24320(事件编号MZKE18200A028A,样品23a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:420是来自载体24320(事件编号MZKE18200A028A,样品23b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:421是来自载体24320(事件编号MZKE18200A028A,样品24a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:422是来自载体24320(事件编号MZKE18200A028A,样品24b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:423是来自载体24320(事件编号MZKE18200A045A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:424是来自载体24320(事件编号MZKE18200A045A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:425是来自载体24320(事件编号MZKE18200A045A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:426是来自载体24320(事件编号MZKE18200A045A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:427是来自载体24320(事件编号MZKE18200A045A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:428是来自载体24320(事件编号MZKE18200A045A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:429是来自载体24320(事件编号MZKE18200A045A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:430是来自载体24320(事件编号MZKE18200A045A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:431是来自载体24320(事件编号MZKE18200A045A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:432是来自载体24320(事件编号MZKE18200A045A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:433是来自载体24320(事件编号MZKE18200A045A,样品6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:434是来自载体24320(事件编号MZKE18200A045A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:435是来自载体24320(事件编号MZKE18200A045A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:436是来自载体24320(事件编号MZKE18200A045A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:437是来自载体24320(事件编号MZKE18200A045A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:438是来自载体24320(事件编号MZKE18200A045A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:439是来自载体24320(事件编号MZKE18200A045A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:440是来自载体24320(事件编号MZKE18200A045A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:441是来自载体24320(事件编号MZKE18200A045A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:442是来自载体24320(事件编号MZKE18200A045A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:443是来自载体24320(事件编号MZKE18200A045A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:444是来自载体24320(事件编号MZKE18200A045A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:445是来自载体24320(事件编号MZKE18200A045A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:446是来自载体24320(事件编号MZKE18200A045A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:447是来自载体24320(事件编号MZKE18200A045A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:448是来自载体24320(事件编号MZKE18200A045A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:449是来自载体24320(事件编号MZKE18200A045A,样品14b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:450是来自载体24320(事件编号MZKE18200A045A,样品15)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:451是来自载体24320(事件编号MZKE18200A045A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:452是来自载体24320(事件编号MZKE18200A045A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:453是来自载体24320(事件编号MZKE18200A045A,样品17)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:454是来自载体24320(事件编号MZKE18200A045A,样品18a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:455是来自载体24320(事件编号MZKE18200A045A,样品18b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:456是来自载体24320(事件编号MZKE18200A045A,样品19)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:457是来自载体24320(事件编号MZKE18200A057A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:458是来自载体24320(事件编号MZKE18200A057A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:459是来自载体24320(事件编号MZKE18200A057A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:460是来自载体24320(事件编号MZKE18200A057A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:461是来自载体24320(事件编号MZKE18200A057A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:462是来自载体24320(事件编号MZKE18200A057A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:463是来自载体24320(事件编号MZKE18200A057A,样品4)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:464是来自载体24320(事件编号MZKE18200A057A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:465是来自载体24320(事件编号MZKE18200A057A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:466是来自载体24320(事件编号MZKE18200A057A,样品5)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:467是来自载体24320(事件编号MZKE18200A057A,样品6a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:468是来自载体24320(事件编号MZKE18200A057A,样品6b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:469是来自载体24320(事件编号MZKE18200A057A,样品7)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:470是来自载体24320(事件编号MZKE18200A057A,样品8)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:471是来自载体24320(事件编号MZKE18200A057A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:472是来自载体24320(事件编号MZKE18200A057A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:473是来自载体24320(事件编号MZKE18200A057A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:474是来自载体24320(事件编号MZKE18200A057A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:475是来自载体24320(事件编号MZKE18200A057A,样品11a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:476是来自载体24320(事件编号MZKE18200A057A,样品11b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:477是来自载体24320(事件编号MZKE18200A057A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:478是来自载体24320(事件编号MZKE18200A057A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:479是来自载体24320(事件编号MZKE18200A064A,样品1a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:480是来自载体24320(事件编号MZKE18200A064A,样品1b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:481是来自载体24320(事件编号MZKE18200A064A,样品2a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:482是来自载体24320(事件编号MZKE18200A064A,样品2b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:483是来自载体24320(事件编号MZKE18200A064A,样品3a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:484是来自载体24320(事件编号MZKE18200A064A,样品3b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:485是来自载体24320(事件编号MZKE18200A064A,样品4a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:486是来自载体24320(事件编号MZKE18200A064A,样品4b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:487是来自载体24320(事件编号MZKE18200A064A,样品5a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:488是来自载体24320(事件编号MZKE18200A064A,样品5b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:489是来自载体24320(事件编号MZKE18200A064A,样品6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:490是来自载体24320(事件编号MZKE18200A064A,样品7a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:491是来自载体24320(事件编号MZKE18200A064A,样品7b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:492是来自载体24320(事件编号MZKE18200A064A,样品8a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:493是来自载体24320(事件编号MZKE18200A064A,样品8b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:494是来自载体24320(事件编号MZKE18200A064A,样品9a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:495是来自载体24320(事件编号MZKE18200A064A,样品9b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:496是来自载体24320(事件编号MZKE18200A064A,样品10a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:497是来自载体24320(事件编号MZKE18200A064A,样品10b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:498是来自载体24320(事件编号MZKE18200A064A,样品11)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:499是来自载体24320(事件编号MZKE18200A064A,样品12a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:500是来自载体24320(事件编号MZKE18200A064A,样品12b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:501是来自载体24320(事件编号MZKE18200A064A,样品13a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:502是来自载体24320(事件编号MZKE18200A064A,样品13b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:503是来自载体24320(事件编号MZKE18200A064A,样品14a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:504是来自载体24320(事件编号MZKE18200A064A,样品14b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:505是来自载体24320(事件编号MZKE18200A064A,样品15a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:506是来自载体24320(事件编号MZKE18200A064A,样品15b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:507是来自载体24320(事件编号MZKE18200A064A,样品16a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:508是来自载体24320(事件编号MZKE18200A064A,样品16b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:509是来自载体24320(事件编号MZKE18200A064A,样品17a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:510是来自载体24320(事件编号MZKE18200A064A,样品17b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:511是来自载体24320(事件编号MZKE18200A064A,样品18a)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:512是来自载体24320(事件编号MZKE18200A064A,样品18b)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:513是载体24857的核苷酸序列。
SEQ ID NO:514是大豆中的prGmMADS28-01(FMOS启动子)的核苷酸序列。
SEQ ID NO:515是大豆中的tGmMADS28-01(FMOS终止子)的核苷酸序列。
SEQ ID NO:516是含有大豆组成型启动子的载体24905(对照)的核苷酸序列。
SEQ ID NO:517是载体24925的核苷酸序列。
SEQ ID NO:518是大豆中的prGmMMD1-01(FMOS启动子)的核苷酸序列。
SEQ ID NO:519是大豆中的tGmMMD1-01(FMOS终止子)的核苷酸序列。
SEQ ID NO:520是载体24857和24905中靶向大豆GmCenH3中的第一外显子的gRNA1的核苷酸序列。
SEQ ID NO:521是载体24857和24905中靶向大豆GmCenH3中的第4外显子的gRNA2的核苷酸序列。
SEQ ID NO:522是CP4测定中的正义引物的核苷酸序列。
SEQ ID NO:523是CP4测定中的反义引物的核苷酸序列。
SEQ ID NO:524是CP4测定中的探针的核苷酸序列。
SEQ ID NO:525是Cas测定中的正义引物的核苷酸序列。
SEQ ID NO:526是Cas测定中的反义引物的核苷酸序列。
SEQ ID NO:527是Cas测定中的探针的核苷酸序列。
SEQ ID NO:528是Cas测定中的正向引物的核苷酸序列。
SEQ ID NO:529是Cas测定中的反向引物的核苷酸序列。
SEQ ID NO:530是Cas测定中的探针的核苷酸序列。
SEQ ID NO:531是泛素启动子prUbi1-18的内含子iUbi1-07的核苷酸序列。
SEQ ID NO:532是Cas12a的核苷酸序列。
SEQ ID NO:533是载体25053的核苷酸序列。
SEQ ID NO:534是载体25074的核苷酸序列。
SEQ ID NO:535是载体25068的核苷酸序列。
SEQ ID NO:536是载体25069的核苷酸序列。
SEQ ID NO:537是载体24997的核苷酸序列。
SEQ ID NO:538是载体25002的核苷酸序列。
SEQ ID NO:539是载体25003的核苷酸序列。
SEQ ID NO:540是载体25004的核苷酸序列。
SEQ ID NO:541是载体25005的核苷酸序列。
SEQ ID NO:542是载体25006的核苷酸序列。
SEQ ID NO:543是载体25007的核苷酸序列。
SEQ ID NO:544是载体25008的核苷酸序列。
SEQ ID NO:545是载体25009的核苷酸序列。
SEQ ID NO:546是用于Adh1编辑分析的引物的核苷酸序列。
SEQ ID NO:547是用于Adh1编辑分析的引物的核苷酸序列。
SEQ ID NO:548是用于Adh1靶参考的核苷酸序列。
SEQ ID NO:549是来自载体25002(事件编号GVG01189803,植物1)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:550是来自载体25002(事件编号GVG01189803,植物1)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:551是来自载体25002(事件编号GVG01189803,植物2)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:552是来自载体25002(事件编号GVG01189803,植物2)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:553是来自载体25002(事件编号GVG01189803,植物3)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:554是来自载体25002(事件编号GVG01189803,植物3)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:555是来自载体25002(事件编号GVG01189803,植物4)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:556是来自载体25002(事件编号GVG01189803,植物4)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:557是来自载体25002(事件编号GVG01189803,植物5)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:558是来自载体25002(事件编号GVG01189803,植物6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:559是来自载体25002(事件编号GVG01189803,植物6)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:560是来自载体25002(事件编号GVG01189803,植物7)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:561是来自载体25002(事件编号GVG01189803,植物7)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:562是来自载体25002(事件编号GVG01189803,植物8)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:563是来自载体25002(事件编号GVG01189803,植物8)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:564是来自载体25002(事件编号GVG01189803,植物9)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:565是来自载体25002(事件编号GVG01189803,植物9)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:566是来自载体25002(事件编号GVG01189803,植物10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:567是来自载体25002(事件编号GVG01189803,植物10)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:568是来自载体25002(事件编号GVG01189803,植物11)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:569是来自载体25002(事件编号GVG01189803,植物11)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:570是来自载体25002(事件编号GVG01189803,植物12)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:571是来自载体25002(事件编号GVG01189803,植物12)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:572是来自载体25002(事件编号GVG01189803,植物13)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:573是来自载体25002(事件编号GVG01189803,植物13)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:574是来自载体25002(事件编号GVG01189803,植物13)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:575是来自载体25002(事件编号GVG01189803,植物14)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:576是来自载体25002(事件编号GVG01189803,植物14)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:577是来自载体25002(事件编号GVG01189803,植物15)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:578是来自载体25002(事件编号GVG01189803,植物16)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:579是来自载体25002(事件编号GVG01189803,植物16)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:580是来自载体25002(事件编号GVG01189803,植物17)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:581是来自载体25002(事件编号GVG01189803,植物17)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:582是来自载体25002(事件编号GVG01189803,植物18)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:583是来自载体25002(事件编号GVG01189803,植物19)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:584是来自载体25002(事件编号GVG01189803,植物20)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:585是来自载体25002(事件编号GVG01189803,植物20)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:586是来自载体25002(事件编号GVG01189803,植物21)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:587是来自载体25002(事件编号GVG01189803,植物22)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:588是来自载体25002(事件编号GVG01189803,植物22)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:589是来自载体25002(事件编号GVG01189803,植物23)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:590是来自载体25002(事件编号GVG01189803,植物23)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:591是来自载体25002(事件编号GVG01189803,植物24)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:592是来自载体25002(事件编号GVG01189803,植物24)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:593是来自载体25002(事件编号GVG01189803,植物25)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:594是来自载体25002(事件编号GVG01189803,植物26)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:595是来自载体25002(事件编号GVG01189803,植物27)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:596是来自载体25002(事件编号GVG01189803,植物27)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:597是来自载体25002(事件编号GVG01189803,植物28)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:598是来自载体25002(事件编号GVG01189803,植物28)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:599是来自载体25002(事件编号GVG01189803,植物29)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:600是来自载体25002(事件编号GVG01189803,植物30)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:601是来自载体25002(事件编号GVG01189803,植物30)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:602是来自载体25002(事件编号GVG01189803,植物31)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:603是来自载体25002(事件编号GVG01189803,植物31)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:604是来自载体25002(事件编号GVG01189803,植物32)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:605是来自载体25002(事件编号GVG01189803,植物32)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:606是来自载体25002(事件编号GVG01189803,植物33)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:607是来自载体25002(事件编号GVG01189803,植物33)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:608是来自载体25002(事件编号GVG01189803,植物34)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:609是来自载体25002(事件编号GVG01189803,植物34)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:610是来自载体25002(事件编号GVG01189803,植物35)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:611是来自载体25002(事件编号GVG01189803,植物36)的T1后代的经编辑的核苷酸序列。
SEQ ID NO:612是含有经修饰的Cas的载体Cr-X-FMOS的核苷酸序列。
SEQ ID NO:613是含有经修饰的Cas的载体Ev-FMOS的核苷酸序列。
SEQ ID NO:614是对24997中使用的prZmAP1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:615是对25002中使用的prZmBde1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:616是对25003中使用的prZmBde1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:617是对25004中使用的prZmBde1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:618是对25005中使用的prZmBde1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:619是对25006中使用的prZmBde1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:620是对25007中使用的prOsAP1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:621是对25008中使用的prOsAP1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:622是对25009中使用的prOsAP1的经修饰的形式编码的核苷酸序列。
SEQ ID NO:623是对prZmAP1-03中的内含子的经修饰的形式编码的核苷酸序列。
SEQ ID NO:624是对prZmBde1-03和prZmBde1-07中的内含子的经修饰的形式编码的核苷酸序列。
SEQ ID NO:625是对prZmBde1-04中的内含子的经修饰的形式编码的核苷酸序列。
SEQ ID NO:626是对prZmBde1-05中的内含子的经修饰的形式编码的核苷酸序列。
SEQ ID NO:627是对prOsAP1-02和prOsAP1-04中的内含子的经修饰的形式编码的核苷酸序列。
SEQ ID NO:628是用于CENH3编辑分析的正向引物的核苷酸序列。
SEQ ID NO:629是用于CENH3编辑分析的反向引物的核苷酸序列。
SEQ ID NO:630是用于CENH3编辑分析的正向引物的核苷酸序列。
SEQ ID NO:631是构建体24905的gRNA2靶的野生型核苷酸序列。
SEQ ID NO:632是构建体24905的gRNA2靶的经编辑的核苷酸序列。
SEQ ID NO:633是查尔酮合酶(WHP1)靶1的核苷酸靶序列。
SEQ ID NO:634是查尔酮合酶(C2)靶1的核苷酸靶序列。
SEQ ID NO:635是查尔酮合酶(WHP1)靶2的核苷酸靶序列。
SEQ ID NO:636是查尔酮合酶(C2)靶2的核苷酸靶序列。
SEQ ID NO:637是WHP1靶1的引物1的核苷酸序列。
SEQ ID NO:638是WHP1靶1的引物2的核苷酸序列。
SEQ ID NO:639是WHP1靶1的探针的核苷酸序列。
SEQ ID NO:640是C2靶1的引物1的核苷酸序列。
SEQ ID NO:641是C2靶1的引物2的核苷酸序列。
SEQ ID NO:642是C2靶1的探针的核苷酸序列。
SEQ ID NO:643是WHP1靶2的引物1的核苷酸序列。
SEQ ID NO:644是WHP1靶2的引物2的核苷酸序列。
SEQ ID NO:645是WHP1靶2的探针的核苷酸序列。
SEQ ID NO:646是C2靶2的引物1的核苷酸序列。
SEQ ID NO:647是C2靶2的引物2的核苷酸序列。
SEQ ID NO:648是C2靶2的探针的核苷酸序列。
SEQ ID NO:649是用于PMI测定的正向引物的核苷酸序列。
SEQ ID NO:650是用于PMI测定的反向引物的核苷酸序列。
SEQ ID NO:651是用于PMI测定的探针的核苷酸序列。
SEQ ID NO:652是用于对照基因ZmEF1测定的正向引物的核苷酸序列。
SEQ ID NO:653是用于对照基因ZmEF1测定的反向引物的核苷酸序列。
SEQ ID NO:654是用于对照基因ZmEF1测定的探针的核苷酸序列。
SEQ ID NO:655是构建体24905中的gRNA2靶的WT核苷酸序列。
SEQ ID NO:656是来自用构建体24905转化的T0植物的经编辑的核苷酸序列。
SEQ ID NO:657是载体24925的核苷酸序列。
SEQ ID NO:658是大豆中缺失的核苷酸序列。
SEQ ID NO:659是大豆中缺失的核苷酸序列。
SEQ ID NO:660是大豆中缺失的核苷酸序列。
SEQ ID NO:661是大豆中缺失的核苷酸序列。
SEQ ID NO:662是大豆中的WT核苷酸序列。
SEQ ID NO:663是大豆中的经编辑的核苷酸序列。
SEQ ID NO:664是大豆中的经编辑的核苷酸序列。
SEQ ID NO:665是大豆中的经编辑的核苷酸序列。
SEQ ID NO:666是大豆中的经编辑的核苷酸序列。
SEQ ID NO:667是大豆中的WT核苷酸序列。
SEQ ID NO:668是大豆中的经编辑的核苷酸序列。
SEQ ID NO:669是大豆中的经编辑的核苷酸序列。
SEQ ID NO:670是大豆中的经编辑的核苷酸序列。
SEQ ID NO:671是大豆中的经编辑的核苷酸序列。
SEQ ID NO:672是大豆中的WT核苷酸序列。
SEQ ID NO:673是大豆中的经编辑的核苷酸序列。
SEQ ID NO:674是大豆中的经编辑的核苷酸序列。
SEQ ID NO:675是大豆中的经编辑的核苷酸序列。
SEQ ID NO:676是大豆中的经编辑的核苷酸序列。
SEQ ID NO:677是大豆中的经编辑的核苷酸序列。
SEQ ID NO:678是大豆中的经编辑的核苷酸序列。
SEQ ID NO:679是大豆中的经编辑的核苷酸序列。
SEQ ID NO:680是大豆中的经编辑的核苷酸序列。
SEQ ID NO:681是大豆中的经编辑的核苷酸序列。
SEQ ID NO:682是大豆中的经编辑的核苷酸序列。
SEQ ID NO:683是大豆中的WT核苷酸序列。
SEQ ID NO:684是大豆中的经编辑的核苷酸序列。
SEQ ID NO:685是大豆中的经编辑的核苷酸序列。
SEQ ID NO:686是大豆中的经编辑的核苷酸序列。
SEQ ID NO:687是大豆中的经编辑的核苷酸序列。
SEQ ID NO:688是大豆中的经编辑的核苷酸序列。
SEQ ID NO:689是大豆中的经编辑的核苷酸序列。
SEQ ID NO:690是大豆中的经编辑的核苷酸序列。
SEQ ID NO:691是大豆中的经编辑的核苷酸序列。
SEQ ID NO:692是大豆中的经编辑的核苷酸序列。
SEQ ID NO:693是大豆中的经编辑的核苷酸序列。
SEQ ID NO:694是大豆中的经编辑的核苷酸序列。
SEQ ID NO:695是大豆中的经编辑的核苷酸序列。
SEQ ID NO:696是大豆中的经编辑的核苷酸序列。
SEQ ID NO:697是载体AR-SDN2_RETRON的核苷酸序列。
SEQ ID NO:698是编码启动子prAtAPETALA1-01的核苷酸序列。
SEQ ID NO:699是编码终止子tAtAPETALA1-01的核苷酸序列。
SEQ ID NO:700是编码启动子prAtSEPELLATA2-01的核苷酸序列。
SEQ ID NO:701是编码终止子tAtSEPELLATA2-01的核苷酸序列。
SEQ ID NO:702是编码启动子prMMD1-01的核苷酸序列。
SEQ ID NO:703是编码终止子tMMD1-01的核苷酸序列。
SEQ ID NO:704是编码启动子prSlLOXA-01(番茄)的核苷酸序列。
SEQ ID NO:705是编码终止子prSlLOXA-01(番茄)的核苷酸序列。
SEQ ID NO:706是编码启动子prSlTM5-01的核苷酸序列。
SEQ ID NO:707是编码终止子tSlTM5-01的核苷酸序列。
SEQ ID NO:708是编码启动子prSlTM29-01的核苷酸序列。
SEQ ID NO:709是编码终止子tSlTM29-01的核苷酸序列。
SEQ ID NO:710是编码启动子prGmMMD1-02(增强的)的核苷酸序列。
SEQ ID NO:711是编码prGmMMD1-02的第一增强子的核苷酸序列。
SEQ ID NO:712是编码prGmMMD1-02的第二增强子的核苷酸序列。
SEQ ID NO:713是编码prGmMMD1-02的第三增强子的核苷酸序列。
SEQ ID NO:714是编码gRNA的核苷酸序列。
SEQ ID NO:715是编码gRNA的核苷酸序列。
SEQ ID NO:716是编码靶向番茄ADH1基因的gRNA的核苷酸序列。
SEQ ID NO:717是编码prZmMSCA1-01的核苷酸序列。
SEQ ID NO:718是编码tZmMSCA1-01的核苷酸序列。
SEQ ID NO:719是编码prZmPPG4-01的核苷酸序列。
SEQ ID NO:720是编码tZmPPG4-01的核苷酸序列。
SEQ ID NO:721是编码用于NADH脱氢酶的启动子的核苷酸序列。
SEQ ID NO:722是编码用于NADH脱氢酶的终止子的核苷酸序列。
SEQ ID NO:723是编码prZmCID11的核苷酸序列。
SEQ ID NO:724是编码tZmCID11的核苷酸序列。
附图说明
图1是载体24301(SEQ ID NO:1)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图2是用于转化玉蜀黍未成熟的胚的载体的示例性图。
图3是载体24224(SEQ ID NO:10)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图4是载体24243(SEQ ID NO:40)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图5是载体24265(SEQ ID NO:19)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图6是载体24266(SEQ ID NO:22)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图7是载体24269(SEQ ID NO:25)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图8是载体24270(SEQ ID NO:28)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图9是载体24289(SEQ ID NO:31)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图10是载体24299(SEQ ID NO:34)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图11是载体24300(SEQ ID NO:85)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图12是载体24305(SEQ ID NO:43)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图13是载体24306(SEQ ID NO:46)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图14是载体24320(SEQ ID NO:49)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图15是载体24426(SEQ ID NO:52)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图16是载体24427(SEQ ID NO:55)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图17是载体24428(SEQ ID NO:58)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图18是载体24454(SEQ ID NO:61)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图19是载体24455(SEQ ID NO:64)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图20是载体24458(SEQ ID NO:67)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图21是载体24459(SEQ ID NO:70)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图22是载体24460(SEQ ID NO:73)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图23是载体24548(SEQ ID NO:76)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图24是载体24602(SEQ ID NO:79)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图25是载体24688(SEQ ID NO:82)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图26a展示了雄穗取样计划。
图26b是示出五种构建体的镶嵌性得分的图。
图26c是将缩短的启动子构建体的镶嵌性得分与其他构建体的镶嵌性得分相比较的图。
图26b是示出各种构建体的镶嵌性得分的图。
图27展示了至少一个表达盒,该表达盒具有位于供体DNA侧翼的一个gRNA靶位点。
图28展示了至少一个表达盒,该表达盒具有位于供体DNA侧翼的两个gRNA靶位点。
图29展示了至少一个表达盒,该表达盒不具有位于供体DNA侧翼的gRNA靶位点。
图30展示了至少一个表达盒的另一个实施例。
图31是载体AR-SDN2_REP_1Cut(SEQ ID NO:188)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图32是载体AR-SDN2_REP_2Cuts(SEQ ID NO:187)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图33是载体AR-SDN2_REP_NoCut(SEQ ID NO:186)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图34是展示对prZmBde1的修饰的示意图。
图35是用于转化大豆的载体24857(SEQ ID NO:513)的示意图。
图36是用于转化大豆的载体24905(SEQ ID NO:514)的示意图。
图37是T1植物的照片。
图38和39展示了缩短以用于各种构建体的启动子的实例。
图40展示了序列比对,其示出了在T1种子中的多个独特编辑。
图41是示出在组成型启动子的控制下PMI的表达水平的图。
图42是示出在FMOS启动子的控制下Cas9的表达水平的图。
图43是用于转化玉蜀黍未成熟的胚的载体24925的示意图。
图44是载体AR-SDN2_RETRON(SEQ ID NO:697)的示意图,该载体用于转化玉蜀黍未成熟的胚。
定义
虽然认为以下术语可以被本领域普通技术人员很好地理解,还是对以下定义进行了陈述,以便于解释本申请披露的主题。
除非下文中另有定义,本文所用的所有技术和科学术语旨在具有与本领域普通技术人员通常所理解的相同的含义。本文采用的技术的参考文献旨在参考本领域中通常理解的技术,包括对本领域普通技术人员而言很清楚的那些技术的变化和/或等效技术的替换。虽然认为以下术语可以被本领域普通技术人员很好地理解,还是对以下定义进行了陈述,以便于解释本申请披露的主题。
根据长期存在的专利法公约,在本申请(包括权利要求书)中使用的术语“一个(a)”、“一种(an)”和“所述(the)”是指“一个/种或多个/种”。例如,短语“一个细胞”是指一个或多个细胞,并且在一些实施例中可以是指组织和/或器官。类似地,短语“至少一个”当在本文中用于指代实体时,是指例如,1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100个或更多个该实体,包括但不限于1与100之间的所有整数值以及大于100的整数。
除非另外指明,本说明书和权利要求书中使用的表示成分的量、反应条件等的所有数字应被理解为在所有情况下用术语“约”来修饰。如本文所用的术语“约”,当指代可测量的值例如质量、重量、时间、体积、浓度或百分比的量时,意味着涵盖在一些实施例中与规定量相比±20%的变化、在一些实施例中与规定量相比±10%的变化、在一些实施例中与规定量相比±5%的变化、在一些实施例中与规定量相比±1%的变化、在一些实施例中与规定量相比±0.5%的变化、以及在一些实施例中与规定量相比±0.1%的变化,因为此类变化适合于进行所披露的方法和/或使用所披露的组合物、核酸、多肽等。因此,除非相反地指明,在本说明书和所附权利要求书中所陈述的数值参数是可以取决于试图通过本申请披露的主题获得的所希望的特性而变化的近似值。
如本文所用,术语“等位基因”是指遗传基因座处的变体或替代序列形式。在二倍体中,在每一个基因座处的单个等位基因由后代个体分别从每一个亲本处遗传。虽然本领域普通技术人员理解在任何特定个体中的等位基因不必代表存在于该物种中的所有等位基因,但是存在于二倍体生物体中的给定基因座的两个等位基因占据一对同源染色体上相对应的位置。
如本文所用,术语“和/或”当在列举实体的上下文中使用时,是指实体单独存在或以组合存在。因此,例如,短语“A、B、C和/或D”包括单独地A、B、C和D,但也包括A、B、C和D的任何和所有组合和子组合(例如,AB、AC、AD、BC、BD、CD、ABC、ABD和BCD)。在一些实施例中,“和/或”所指的一个或多个元件也可以单独存在于一个或多个组合和/或一个或多个子组合中的单次或多次出现中。
如本文所用,短语“与……相关”是指两个实体之间的可识别和/或可测定的关系。例如,短语“与HI相关”是指性状、基因座、基因、等位基因、标志物、表型等或其表达,它们的存在或不存在可以影响植物或其后代表现HI或单倍体诱导的范围和/或程度。因此,当标志物与性状连锁并且当标志物的存在指明了所希望的性状或性状形式是否会和/或会以什么程度发生在包含标志物的植物/种质中时,则该标志物与该性状“相关”。类似地,当标志物与等位基因连锁并且当标志物的存在指明了等位基因是否存在于包含标志物的植物/种质中时,则该标志物与该等位基因“相关”。例如,“与HI相关的标志物”是指其存在或不存在可以用于预测植物是否会和/或会以什么程度展现单倍体诱导的标志物。
术语“包含”(comprising)与“包括”(including)、“含有”(containing)和“特征在于”(characterized by)是同义的,是包含性的或开放式的,并且不排除另外的未列举的元件和/或方法步骤。“包含”是意指所指定的元件和/或步骤存在,但是其他元件和/或步骤可以添加进来并且仍然落入相关主题的范围内的术语。
如本文所用,短语“由……组成”排除未具体列举的任何元件、步骤或成分。当短语“由……组成”出现在权利要求主体的子句中,而不是直接地接在前序部分后面时,它只限制该子句中所阐述的元件;其他元件并不整体排除在该权利要求之外。
如本文所用,短语“基本上由……组成”限制相关的披露或权利要求的范围至规定的材料和/或步骤,加上并不实质上影响所披露的和/或所要求保护的主题的一个或多个基本和新颖特征的那些。
关于术语“包含”、“基本上由……组成”和“由……组成”,在本文中使用这三个术语之一的情况下,本申请披露和要求保护的主题可以在一些实施例中包括使用其他两个术语中的任一个。例如,如果主题在一些实施例中涉及编码包含与SEQ ID NO:至少95%相同的氨基酸序列的多肽的核酸。应当理解的是,所披露的主题因此还涵盖编码在一些实施例中基本上由与SEQ ID NO:至少95%相同的氨基酸序列组成的多肽的核酸以及编码在一些实施例中由与SEQ ID NO:至少95%相同的氨基酸序列组成的多肽的核酸。类似地,还应当理解的是,在一些实施例中,用于所披露的主题的方法包括本文所披露的步骤,在一些实施例中,用于本申请披露的主题的方法基本上由披露的步骤组成,并且在一些实施例中,用于本申请披露的主题的方法由本文所披露的步骤组成。
如本文所用,术语“事件”是指制备以具有在自然界中通常不会发现的非天然DNA的遗传工程化的生物体或细胞,例如,遗传工程化的植物或种子。事件可包括将转基因插入至生物体的DNA中的转基因事件。事件还可包括将具体转基因插入至染色体上的特定位置。事件还可包括插入或缺失和点突变的任何组合。
如本文所用,术语“基因”是指包括DNA序列的遗传单位,该遗传单位占据染色体上的特定位置并且含有生物体中的具体特征或性状的遗传指令。
“遗传图谱”是对给定物种内的一个或多个染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格形式描绘。
如本文所用,“基因调控网络”(或“GRN”)是分子调控物(molecular regulator)的集合,它们与彼此以及细胞中的其他物质相互作用,以控制mRNA和蛋白质的基因表达水平。该调控物可以是DNA、RNA、蛋白质以及这些的复合物。GRN还可包括如本文所用的“基因家族”。“基因家族”是指一组若干个相似的基因,它们通常具有相似的生物化学功能。
如本文所用,称为“单倍体”的植物在单倍体植物中具有减少数量的染色体(n),并且它的染色体组等于配子的染色体组。在单倍体生物中,仅存在染色体正常数量的一半。因此二倍体生物(例如,玉蜀黍)的单倍体示出单倍性;四倍体生物(例如,黑麦草)的单倍体示出二倍性;六倍体生物(例如,小麦)的单倍体示出三倍性;等等。如本文所用,被称为“双单倍体”的植物通过使染色体的单倍体组加倍而开发。从自交到任何数量的世代的双单倍体植物获得的植物或种子仍然可以被鉴定为双单倍体植物。双单倍体植物被认为是纯合植物。如果植物是可育的,即使该植物的整个营养部分不是由具有加倍的染色体组的细胞组成的,该植物也被认为是双单倍体;也就是说,如果植物含有存活的配子,即使它在营养组织中是嵌合的,该植物也将被认为是双单倍体。
如本文所用,术语“人诱导的突变”是指由于直接或间接的人类作用而发生的任何突变。此术语包括但不限于通过任何靶向诱变方法获得的突变。
如本文所用,“引入的”是指递送的、表达的、施用的、运输的、转移的、渗透的或其他相似的术语以指明所希望的物体的核酸或蛋白质或其组合向一个物体的递送。例如,可将编码定点核酸酶的核酸和任选地至少一种指导RNA引入植物细胞中。
如本文所用,术语“标志物探针”和“探针”是指可以用于检测较大序列内序列的存在或不存在的核苷酸序列或核酸分子(例如,通过核酸杂交与标志物或标志物基因座的全部或部分互补的核酸探针)。包含约8、10、15、20、30、40、50、60、70、80、90、100个或更多个连续核苷酸的标志物探针可以用于核酸杂交。
如本文所用,当鉴定HI相关的基因座的存在/不存在时,术语“分子标志物”可以用于指如上文所定义的遗传标志物,或其用作参比点的编码产物(例如,蛋白质)。分子标志物可衍生自基因组核苷酸序列或表达的核苷酸序列(例如,衍生自RNA、cDNA等)。该术语也指与标志物序列互补或与位于其侧翼的核苷酸序列,例如,用作能够扩增标志物序列的探针和/或引物的核苷酸序列。当核苷酸序列在溶液中特异性杂交时,这些核苷酸序列是“互补的”(例如,根据沃森-克里克碱基配对原则)。此术语也指通过与标志物序列互补或与位于其侧翼的核苷酸序列(例如,用作能够扩增标志物序列的探针和/或引物的核苷酸序列)的不存在指明性状的遗传标志物。
如本文所用,术语“核苷酸序列”、“多核苷酸”、“核酸序列”、“核酸分子”和“核酸片段”是指单链或双链的RNA或DNA的聚合物,任选地含有合成的、非天然的、和/或改变的核苷酸碱基。“核苷酸”是从其构建DNA或RNA聚合物并且由嘌呤或嘧啶碱基、戊糖和磷酸基团组成的单体单元。核苷酸(通常以其5'-单磷酸酯形式发现)以其单字母名称表示如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。
如本文所用,术语“核苷酸序列同一性”是指在两个多核苷酸的对应位置处存在相同的核苷酸。当进行比对以获得最大对应时(例如,在比较窗口中),如果在两个多核苷酸中的核苷酸序列是相同的,则多核苷酸具有“相同的”序列。通常通过在比较窗口上比较这两个序列的部分来进行两个或多个多核苷酸之间的序列比较,以鉴定并比较序列相似性的局部区域。比较窗口通常是从约20至200个连续核苷酸。多核苷酸的“序列同一性百分比”,例如约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性,可以在比较窗口上通过比较两个最佳比对的序列来确定,其中为了两个序列的最佳比对,与参考序列相比,在比较窗口中的多核苷酸序列的部分可以包括添加或缺失(即,空位)。在一些实施例中,通过以下方式计算百分比:(a)确定在两个序列中出现相同的核酸碱基的位置的数量;(b)将匹配位置的数量除以比较窗口中位置的总数量;并且(c)将结果乘以100。还可以通过已知算法的计算机化实施方式或者通过目视检查进行用于比较的序列的最佳比对。易于获得的序列比较和多重序列比对算法分别是可在因特网(例如,EMBL-EBI的网站)上获得的基本局部比对搜索工具(BLAST)和ClustalW/ClustalW2/Clustal Omega程序。其他合适的程序包括但不限于,GAP、BestFit、Plot Similarity和FASTA,它们是可从Accelrys公司(美国,加利福尼亚州,圣地亚哥)获得的Accelrys GCG软件包的一部分。还参见Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;Ausubel等人,1988;以及Sambrook和Russell,2001。
适于确定百分比序列同一性和序列相似性的算法的一个实例是BLAST算法,它描述于Altschul等人,1990中。在一些实施例中,序列同一性百分比是指进行比较的SEQ IDNo:1的最大ORF中的gDNA、cDNA或预测的蛋白质序列之一的全长上的序列同一性。在一些实施例中,确定核酸序列同一性百分比的计算在计算中并不包括所比较的核酸之一包括“N”(即,其中在该位置可以存在任何核苷酸)的任何核苷酸位置。
术语“开放阅读框”(ORF)是指编码多肽的核酸序列。在一些实施例中,ORF包含翻译起始密码子(即,起始密码子)、翻译终止(termination)(即,终止(stop)密码子)、以及其间的编码多肽中存在的氨基酸的核酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(即,密码子)的单位,它对应地指明蛋白质合成(mRNA翻译)的起始和链终止。
如本文所用,术语“表型”、“表型性状”或“性状”是指植物或植物细胞的一个或多个性状。表型是可通过裸眼或通过本领域已知的任何其他评估手段(例如,显微术、生物化学分析、或电子机械测定)观察的。在一些情况下,表型直接由单一基因或遗传基因座控制(即,对应于“单基因性状”)。在其他情况下,表型是若干个基因之间相互作用的结果,在一些实施例中,其也由植物和/或植物细胞与其环境相互作用引起。
如本文所用,术语“植物”可以是指全株植物、其任何部分、或从植物衍生的细胞或组织培养物。因此,术语“植物”可以指以下中的任一项:全株植物、植物组分或器官(例如,叶、茎、根等)、植物组织、种子和/或植物细胞。
植物细胞是从植物取得的植物细胞,或者是通过培养从取自植物的细胞衍生的植物细胞。因此,术语“植物细胞”包括但不限于种子、悬浮培养物、胚、分生区、愈伤组织、叶、芽、配子体、孢子体、花粉和小孢子内的细胞。短语“植物部分”是指植物的一部分,包括单细胞和细胞组织(例如植物中完整的植物细胞)、细胞团块和可以再生植物的组织培养物。植物部分的实例包括但不限于来自以下各项的单细胞和组织:花粉、胚珠、叶、胚、根、根尖、花药、花、果实、茎、芽和种子;以及接穗、根茎、原生质体、愈伤组织等。
如本文所用,术语“引物”是指如下寡核苷酸,当置于诱导引物延伸产物合成的条件下(例如,在核苷酸和用于聚合的试剂(如DNA聚合酶)的存在下以及在合适的温度和pH下)时,其能够与核酸靶退火(在一些实施例中,特异性地与核酸靶退火),以允许DNA聚合酶和/或逆转录酶与其附接,从而用作DNA合成的起始点。在一些实施例中,采用一个或多个引物来扩增植物核酸(例如,使用聚合酶链式反应;PCR)。
如本文所用,术语“探针”是指可以与靶核酸序列中的互补序列形成氢键合的双链体的核酸(例如,单链核酸或双链或更高级核酸的链、或其子序列)。典型地,探针具有足够的长度以便与其互补序列形成稳定且序列特异性的双链体分子,并且这样可以在一些实施例中用于检测在多个核酸中存在的目的序列。
如本文所用,术语“后代”和“后代植物”是指从一个或多个亲本植物通过营养生殖或有性繁殖产生的植物。后代植物可以通过克隆单一亲本植物或使单一亲本植物自交、或者通过使两个或更多个亲本植物杂交来获得。例如,后代植物可以通过一个亲本植物的克隆或自交或者通过两个亲本植物的杂交而获得,并且包括自交体以及F1或F2或甚至更远的世代。F1是产生自两个亲本的第一代后代(两个亲本的至少一个是第一次用作性状的供体),而第二代(F2)或后续代(F3、F4等)的子代是产生于F1、F2等的自交、互交、回交和/或其他杂交的样本。因此,F1可以是(并且在一些实施例中是)从两个纯育亲本(即,对于目的性状或其等位基因而言纯育的亲本中的每一个都是纯合的)之间的杂交产生的杂交种,而F2可以是(并且在一些实施例中是)从F1杂交种自花授粉产生的后代。
如本文所用,短语“重组”是指在相似或相同核苷酸序列的区域中,在配对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉互换”)。“重组事件”在本文中被理解为在一些实施例中是指减数分裂交叉互换。
如本文所用,术语“参考序列”是指用作核苷酸序列比较的基础的确定的核苷酸序列。
如本文所用,术语“再生”及其语法变体是指从组织培养物中产生植物。
如本文所用,短语“严格杂交条件”是指多核苷酸典型地在复杂的核酸混合物中与其靶子序列杂交(但基本上不与其他序列杂交)的条件。严格条件是序列依赖性的并且在不同的环境下可以是不同的。
典型地,较长的序列在较高的温度下特异性杂交。核酸杂交的全面指南可见于Sambrook和Russell,2001中。通常,对于在确定的离子强度pH下的特异性序列,将严格条件选择为比热熔点(Tm)约低5℃至10℃。Tm是50%的与靶互补的探针杂交靶序列处于平衡状态时(在靶序列过量存在时,在Tm时,50%的探针被占据处于平衡状态)的温度(在确定的离子强度、pH、和核酸浓度下)。示例性的严格条件是如下这些:盐浓度小于约1.0M钠离子、典型地在pH 7.0至8.3下约0.01至1.0M钠离子浓度(或其他盐),并且对于短探针(例如,10至50个核苷酸)温度为至少约30℃而对于长探针(例如,大于50个核苷酸)至少约60℃。
还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。另外的示例性严格杂交条件包括50%甲酰胺、5x SSC和1%SDS,在42℃孵育;或SSC、1%SDS,在65℃孵育;在65℃在0.2x SSC和0.1%SDS中洗涤一次或多次。对于PCR,约36℃的温度典型地用于低严格扩增,但是取决于引物长度,退火温度可以在约32℃与48℃(或更高)之间变化。在许多的参考文献中提供了用于确定杂交参数的另外的指南(参见例如,Ausubel等人,1999)。
如本文所用,术语“性状”是指目的表型、促成目的表型的基因、以及与促成目的表型的基因相关的核酸序列。例如,“HI性状”是指单倍体诱导表型、以及促成单倍体诱导的基因(例如,玉蜀黍中的matl或水稻中的Os03g27610)和与单倍体诱导表型的存在或不存在相关的核酸序列(例如,HI相关的基因产物)。
如本文所用,术语“转基因”是指通过某些形式的人工转移技术引入生物体或一个或多个其祖先中的核酸分子。因此,人工转移技术产生“转基因生物体”或“转基因细胞”。应当理解的是,人工转移技术可以在祖先生物体(或其中的细胞和/或可以发育成祖先生物体的细胞)中发生,并且即使一种或多种自然和/或辅助育种导致了人工转移的核酸分子存在于后代个体中,具有人工转移的核酸分子或其片段的任何后代个体仍然被认为是转基因的。
如本文所用,术语“靶向诱变”或“诱变策略”是指导致所选择的基因的有意诱变的任何诱变方法。靶向诱变包括方法CRISPR、TILLING、TALEN和其他尚未发现但可以用于实现相同结果的其他方法。
特别考虑到人们可以诱变启动子以潜在地改善元件用于在植物中表达转基因的效用。这些元件的诱变可以随机进行,并且在试错程序(trial-by-error procedure)中筛选诱变的启动子序列的活性。可替代地,可以鉴定为启动子提供希望的表达特征或为启动子提供表达增强活性的特定序列,并且可以经由突变将这些或类似序列引入启动子中。进一步考虑到人们可以诱变这些序列以便增强其转基因在特定物种中的表达。用于诱变编码本发明的启动子序列的DNA区段的手段是本领域技术人员熟知的。如所指明的,可以通过随机或位点特异性诱变程序对启动子或其他调控元件进行修饰。启动子和其他调控元件可以通过在编码相应的未修饰序列的序列中添加或缺失一个或多个核苷酸改变它们的结构来进行修饰。
可以根据本领域已知的技术中的任一种进行诱变,例如但不限于合成在特定调控序列的序列内具有一个或多个突变的寡核苷酸。具体地,位点特异性诱变是通过对基础DNA(underlying DNA)的特异性诱变可用于制备启动子突变体的技术。还可以使用RNA指导的内切核酸酶(“RGEN”,例如,CRISPR/Cas9)。例如,结合一个或多个前述考虑,通过将一个或多个核苷酸序列改变引入DNA中,该技术进一步提供制备和测试序列变体的现成能力。位点特异性诱变允许通过使用编码所希望的突变的DNA序列的特定寡核苷酸序列以及足够数量的相邻核苷酸来提供足够大小和序列复杂性的引物序列以在正在详细研究的缺失连接片段的两侧形成稳定的双链体而产生突变体。典型地,长度为约17个至约75个核苷酸或更多个核苷酸的引物是优选的,其中序列连接片段的两侧上约10个至约25个或更多个残基被改变。
在根据本发明分离出包含启动子的克隆的情况下,人们可能希望界定克隆内的启动子区域。用于制备诱变的启动子的一种有效的靶向手段依赖于在启动子序列内鉴定推定的调控元件。这可以通过与已知以相似的组织特异性或发育独特模式表达的启动子序列进行比较来引发。在具有相似的表达模式的启动子之间共享的序列可能是转录因子结合的候选物,并且因此可能是赋予表达模式的元件。这些推定的调控元件的确认可以通过对每个推定的调控序列进行缺失分析,接着通过测定与每个构建体功能性附接的报告基因对每个缺失构建体进行功能分析来实现。因此,一旦提供了起始启动子序列,就可以容易地制备起始启动子的许多不同的缺失突变体中的任何一个。
本文所披露的发明提供了包含可以用于构建新颖嵌合调控元件的调控元件片段的多核苷酸分子。包含这些多核苷酸分子的片段和至少一个其他调节元件或片段的新颖组合可以在植物中构建和测试并且被认为是在本发明的范围内。因此,嵌合调控元件的设计、构建和使用是本发明的一个实施例。本发明的启动子包括显示与本发明的启动子序列具有同源性的、已知影响基因调控的顺式元件的同系物。
本文所述的转录调控核酸之一的功能等价片段包含至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个碱基对的转录调控核酸。然后,通过缺失编码mRNA的5′非翻译区的区域获得的转录调控核酸的等价片段将仅提供(未转录的)启动子区域。5′非翻译区可以通过本领域已知的方法(例如5′-RACE分析)容易地确定。因此,本文所述的一些转录调控核酸是其他序列的等价片段。
如上文所指明的,也可以随机制备本发明的启动子的缺失突变体并且然后对其进行测定。按照此策略,制备一系列构建体,每个构建体含有启动子的不同部分(亚克隆),并且然后筛选这些构建体的活性。用于筛选活性的合适手段是将含有缺失区段的缺失的启动子或内含子构建体附接至可选择的或可筛选的标志物,并且仅分离表达标志物基因的那些细胞。以这种方式,鉴定了许多不同的、缺失的启动子构建体,其仍然保留了所希望的甚至增强的活性。由此通过比较所选择的构建体来鉴定活性所需的最小区段。然后,此区段可以用于构建用于表达外源基因的载体。
如本文所述的“至少一个表达盒”尤其是指将通过转染的细胞表达的包括调控序列和编码DNA修饰酶的核酸的DNA。在一个实例中,该至少一个表达盒是载体DNA的组分并且在转染的细胞中在转化后表达。如本文所述的至少一个表达盒通常将包括多个表达盒,例如:包含调控序列和编码gRNA的核酸的表达盒;包含引发供体DNA复制的调控序列的表达盒;包含调控序列和选择性标志物或其某种组合的表达盒,例如包含编码在FMOS调控序列的控制下的Cas酶和gRNA的DNA的表达盒。本文所述的至少一个表达盒可以包含另外的调控元件。在此上下文中的术语应被广义地理解为包含可以影响至少一个表达盒的构建或功能的所有序列。例如,调控元件可以修饰原核生物体或真核生物体中的转录和/或翻译。本文所述的至少一个表达盒可以在待表达的核酸序列的下游(在3′方向)并且任选地含有另外的调控元件,例如转录或翻译增强子。每个另外的调控元件都可以可操作地连接至待表达的核酸序列(或转录调节核苷酸序列)。另外的调控元件可以包含可以修饰或增强表达调控特性的另外的启动子、最小启动子、启动子元件或转座子元件。该至少一个表达盒还可以含有一个或多个内含子、一个或多个外显子和一个或多个终止子。
此外,考虑到了启动子组合来自多于一个启动子的元件可能是有用的。例如,美国专利号5,491,288披露了将花椰菜花叶病毒启动子与组蛋白启动子组合。因此,可以将来自本文所披露的启动子(例如FMOS启动子)的元件与来自其他启动子(FMOS或其他的)的元件组合,只要保持FMOS功能即可。例如,在某些实施例中FMOS启动子中的内含子可以被来自其他启动子的内含子(例如来自泛素启动子的内含子)替代。进一步地,在一些实施例中,可以例如通过与来自其他启动子的内含子融合来延长FMOS启动子,例如像,将FMOS启动子与泛素启动子的内含子融合。
具体实施方式
本披露尤其涉及用于改善基因编辑效率(例如,用于降低在植物DNA中产生编辑(例如新突变或事件)所需的转化数量)的系统和方法。
在各个实施例中,本披露涉及用于在植物的T1种子中产生多个独特编辑(例如,多个独特等位基因替代、多个独特碱基插入、多个独特碱基缺失或多个独特点突变)的方法。
在一个示例性实施例中,方法包括将至少一个表达盒转化至植物细胞或植物组织中。图1展示了适合用于转化方法中的至少一个表达盒2的实例。如本文所描述,盒2示出为质粒载体3中的特征组合,但在其他实例中,表达盒可以是分离的DNA或可以是在病毒载体中的特征。表达盒2包含编码DNA修饰酶的核酸4;编码至少一种指导RNA(gRNA)的核酸6;和包括FMOS启动子10a的花镶嵌(FMOS)调控序列10。在许多实施例中,FMOS调控序列将进一步包括FMOS终止子10b。
核酸4可编码多种DNA修饰酶。例如,核酸4可编码定点核酸酶,该定点核酸酶选自由以下组成的组:大范围核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)、Cas核酸酶、Cas9核酸酶、Cas12a核酸酶(在本文中也称为Cpf1核酸酶)、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、嵌合FEN1-FokI和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。SEQ IDNO:4是Cas核酸酶(具体为Cas9a核酸酶)的实例。SEQ ID NO:532是Cas核酸酶(具体为Cas12a核酸酶)的另一实例。Cas核酸酶可以是经修饰的并仍然保持了Cas核酸酶活性。例如,此Cas12a,基于先前的出版物,是来自毛螺科(Lachnospiraceae)细菌ND2006的水稻密码子优化形式,除了其中有3bp的改变以去除2个Bsp119I和一个RsrII位点。将两个核定位信号(NLS)分别添加在其N末端和C末端;N末端还含有表位标签。其他的期望其他改变。因此,在一些实例中,Cas核酸酶将具有与SEQ ID NO:4或SEQ ID NO:532至少90%、95%、98%或99%相同的序列。
根据所使用的核酸酶,任选地包括编码至少一种gRNA的核酸6。例如,当使用形成核酸酶-gRNA复合物的核酸酶(例如Cas)时,希望的是使用编码gRNA的至少一种核酸。进一步地,gRNA可以是单链,或者可以包括多于一条链,例如,与靶DNA序列杂交的靶剂-RNA(targeter-RNA)和与靶剂-RNA杂交的活化剂-RNA(activator-RNA)。美国专利号8,697,359和美国专利号10,000,772以及美国专利公开US 20160208243(将其全部通过引用并入本文)描述了各种单一和多个指导RNA方法。
FMOS调控序列10在花原基细胞和花生殖器官中的至少一个中介导DNA修饰酶的表达,并且在花原基和花生殖器官中的至少一个中介导多个编辑。花原基和花生殖器官包括在完全发育的花中含有的结构以及如在从营养生长到花发育的过渡开始后所引发的这些结构的全部发育阶段。例如,花原基和花生殖器官包括小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头,以及这些结构的任何发育阶段。
因此,该FMOS调控序列可在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱、柱头或这些结构的任何发育阶段中的至少一个中介导表达。在许多实施例中,FMOS调控序列将在雄性和雌性二者的花生殖器官或其原基中介导DNA修饰酶的表达,并且在雄性和雌性二者的花生殖器官或其原基中介导多个编辑。
应当清楚的是,FMOS调控序列在花原基和花生殖器官中将比在营养组织(例如叶或芽分生组织)中介导显著更多的DNA修饰酶表达。提高的表达率可因实施例而异。例如,FMOS调控序列在花原基和花生殖器官中将介导比在芽顶端分生组织(SAM)中多以下中的至少一个倍数的DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。当将表达率与其他的营养组织例如叶组织相比较时,将可见相似的比率改善。
FMOS调控序列在花原基和花生殖器官中还将比在种子中介导显著更多的DNA修饰酶表达。例如,FMOS调控序列在花原基和花生殖器官中将介导比在种子中多以下中的至少一个倍数的DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
在一些实施例中,FMOS调控序列在雄性和雌性二者的花生殖器官中介导DNA修饰酶的表达,并且在雄性和雌性二者的花生殖器官中介导多个编辑。在此类实施例中,DNA修饰酶在雄性花生殖器官中的表达是在花原基和花生殖器官中的DNA修饰酶比在芽顶端分生组织(SAM)中多以下中的至少一个至少一个倍数:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。类似地,DNA修饰酶在雌性花生殖器官中的表达是在花原基和花生殖器官中的DNA修饰酶比在芽顶端分生组织(SAM)中多以下中的至少至少一个倍数:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
FMOS表达测试:DNA修饰酶表达率可以使用qRT PCR来测量。针对营养组织,我们对V3叶进行了取样。针对种子,我们对成熟的种子进行了取样。针对花原基和花生殖器官,我们对未成熟的雄穗和雌穗(原基)以及四个阶段的花药进行了取样。这些阶段为如下:雌穗原基和雄穗原基:1cm、2cm、4cm雄穗和雌穗。花药:0.5mm、1.0mm、1.5mm、2.0mm花药(贯穿减数分裂前和减数分裂)。
针对使用qRT-PCR方案进行的表达评估,从冷冻的(叶、花药、原基、种子)组织中提取RNA。将gDNA用DNA酶消化2小时。将其在一步法qRT-PCR中在384孔板中用作模板,使用了西格玛公司(Sigma)和英杰公司(Invitrogen)试剂。我们使用了用Primer Express软件设计的TaqMan测定。在QuantStudios上运行实时qPCR并且在调节基线和阈值后,捕获Ct(或Cq)值。针对每个样品通过以下来计算表达值:将GOI Ct归一化为内源管家/参考基因Ct。测定设计将因核酸酶而异。对于例如Cas9,qRT-PCR的引物为:正向引物:TTGTGCTGCTCCACGAACA(SEQ ID NO:528);反向引物:GCCAGCCACTACGAGAAGCT(SEQ ID NO:529),和探针:CTGCTTCTGCTCGTTGTCCTCCGG(SEQ ID NO:530)。对于PMI测定,qRT-PCR的引物为:正向引物:CCGGGTGAATCAGCGTTT(SEQ ID NO:649);反向引物:GCCGTGGCCTTTGACAGT(SEQID NO:650),和探针:TGCCGCCAACGAATCACCGG(SEQ ID NO:651)。对于对照基因ZmEF1α测定,qRT-PCR的引物为:正向引物:GCGCCGTCACCGTATCC(SEQ ID NO:652);反向引物:GCTCGTCGGGCGTCAGTA(SEQ ID NO:653);和探针:ATCAGAGGCGAGCAGAAACCACACCAC(SEQ IDNO:654)。
在图1所示的实例中,盒2被包含在载体24301(SEQ ID NO:1)中。核酸4对应于编码Cas9的核酸(SEQ ID NO:4)。编码至少一种指导RNA(gRNA)的核酸6对应于包含靶剂-RNA序列和活化剂-RNA序列的单个gRNA。在此实例中,靶剂-RNA序列编码靶向ADH1基因的序列的序列。FMOS启动子10a对应于prZmAP1-01,其是用于在早期和晚期雄性和雌性花序中特异性表达的玉蜀黍APETALA1(AP1)基因的启动子序列。该序列包括上游启动子、第一外显子、第一内含子和第二外显子(部分),该第二外显子(部分)具有2bp改变以去除ATG起始密码子,从而使得外显子是不可翻译的。在一些实例中,FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中该第二外显子的该部分是不可翻译的。FMOS终止子10b对应于tZmAP1-01,其是玉蜀黍APETALA1(AP1)基因中的终止子序列。盒2可用于产生多个编辑,例如,多个插入或缺失,包括多个单碱基缺失和较大缺失、以及单碱基插入和较大插入。
在许多实施例中,盒可以包括另外的特征。例如,盒2包括gRNA启动子12以调控至少一种gRNA的表达。在此实例中,gRNA启动子12对应于prOsU3-01,其是用于非编码RNA的pol III依赖性转录的水稻U3启动子。载体可类似地包括另外的特征例如,选择性标志物,例如,标志物14a,其编码磷酸甘露糖异构酶(PMI)并可与甘露糖选择一起使用来回收稳定转化的植物。另外的特征包括调控序列,例如用于调控选择性标志物的表达的启动子14b和终止子14c。
载体可进一步包括另外的特征以辅助转化,例如辅助农杆菌介导的转化的特征,农杆菌介导的转化是将外源核酸分子引入植物中的熟知且有用的技术。例如,载体可包括Ti(致瘤)质粒的部分,例如毒力(VIR)基因和T-DNA边界(左边界或LB和右边界或RB)。简而言之,农杆菌的野生型形式含有Ti(致瘤)质粒,其在宿主植物中指导致瘤冠瘿生长的产生。将Ti质粒的致瘤T-DNA区域向植物基因组的转移使用了Ti质粒编码的毒力基因以及T-DNA边界(通常称为LB和RB),其是描绘了待转移的区域的一组正向DNA重复。例如,载体1包括RB18a、LB 18B、VIR基因18c和VIR启动子18d。在许多实施例中,在RB和LB之间的载体部分可以被认为是至少一个表达盒。
用于和如本文所述的表达盒一起使用的多种载体是可商购的,例如从克罗泰克公司(Clontech(加利福尼亚州帕洛阿尔托(Palo Alto)))商购。本领域也熟知将农杆菌与所培养的植物细胞或创伤组织例如像叶组织、根外植体、下胚轴(hypocotyledon)、茎段或块茎共培养的方法。参见例如Glick和Thompson,(编辑),Methods in Plant MolecularBiology and Biotechnology[植物分子生物学和生物技术方法],Boca Raton,Fla.[佛罗里达州波卡拉顿]:CRC Press[CRC出版社](1993)。
可以如所希望的,对植物细胞或组织进行转化,例如,农杆菌介导的转化或生物射弹介导的转化。生物射弹介导的转化(最初由Klein等人(Nature[自然]327:70-73(1987))进行了描述)依赖于通过与氯化钙、亚精胺或聚乙二醇沉淀而被所希望的核酸分子包被的微弹,例如金或钨。使用装置例如生物弹射击(BIOLISTIC)PD-1000(伯乐公司(Biorad);加利福尼亚州赫拉克勒斯(Hercules Calif.)),将微弹粒子以高速加速引入被子植物组织中。
转化后,将植物细胞或植物组织再生为具有多个T1种子的T0植物。T1种子将典型地是自花授粉的种子。在一些实例中,还可使T0植物回交以产生“BC1”种子或异交以产生“F1”种子。如本文所用,T1种子被认为包括自花授粉或“自交的”种子、BC1种子和F1种子。该“1”是指T0转化代后的第一代。使用如本文所披露的本发明的实施例,T1种子(包括自交的种子、BC1种子或F1种子)含有多个独特编辑。出于本披露的目的,当经由花转化在拟南芥上使用本披露的方法(例如,如本领域所熟知的,将花浸入农杆菌中)时,随后产生的植物被认为是T0植物。独特编辑可因实施例而异。例如,独特编辑可包括多个独特等位基因替代、多个独特碱基插入和多个独特碱基缺失。编辑的数量可以变化,并且可以包括以下中的至少一项:每转化至少至少3个、至少4个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、和至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑。可以通过将序列与未经编辑序列的比较来确定独特编辑。
在一些实施例中,这些方法进一步包括使T1种子生长以产生多个T1植物,测量T1代的植物中的至少一种表型,和基于对至少一种表型的测量选择T1代的植物,其中所选择的植物具有独特编辑。进一步地,这些方法可包括对T1代的所选择的植物中的编辑的靶位点或插入位点进行测序,对T1代的非选择的植物中的编辑的靶位点或插入位点进行测序,以及出于比较的目的将所选择的植物中的靶序列或插入序列与非选择的植物中的靶位点序列或插入位点序列进行比对,例如以发现哪些突变可赋予所希望的表型而哪些不会。
这些方法还包括将T1代的具有独特编辑的所选择的植物与不具有该独特编辑的植物杂交以产生具有独特编辑的后代。在一些实施例中,T1代的所选择的植物可以是自交的,例如以提高纯合性。
图2展示了包含至少一个表达盒20的载体19,其适合用于转化方法中以产生多个编辑,尤其是多个不同等位基因替代。表达盒20包含编码DNA修饰酶的核酸24;编码至少一种指导RNA(gRNA)的核酸26;和包括FMOS启动子30A和FMOS终止子30B的花镶嵌(FMOS)调控序列30。
在此实例中,至少一个盒20还包括用于等位基因替代的供体DNA32和用于驱动供体DNA复制的复制酶34。还包括LIR 36(长基因间区,例如衍生自小麦矮化病毒(WDV))、SIR40(短基因间区,例如衍生自小麦矮化病毒(WDV))和LIR 42。复制酶34引发供体DNA 32的滚环扩增,该供体DNA 32位于LIR 36和SIR 40之间,例如,在WDV中在此处可见迁移蛋白基因和/或包被蛋白基因。还可包括供体左靶序列44a和供体右靶序列44b以帮助供体DNA靶向基因组DNA。还可包括荧光报道基因44(cZsGreen)。核酸24对应于编码定点核酸酶(例如Cas)的核酸。核酸26编码至少一种指导RNA(gRNA)。
FMOS调控序列的示例性FMOS启动子示出于表1a中。表1b列出了如果期望则也可以使用的示例性FMOS终止子。
进一步地,本领域普通技术人员将能够修饰表1a和1b中所披露的FMOS序列以实践如下表1c和表1d中展示的本发明。例如,可以将转录因子(TF)结合基序去除或修饰以实现或改善FMOS调控序列的性能。在修饰启动子时,诸位申请人典型地保留重要的TF结合基序,即与开花相关的那些基序。例如,诸位申请人倾向于保留TF结合基序AC:RSP02530//OS:稻(粳稻)/基因:DEP1/RE:GTAC-motif 3/BF:IPA1(DEP1是开花TF)。
图34通过举例的方式展示了prZmBde1-02(SEQ ID NO:50,例如在载体24320中),其经修饰以去除760bp(5′UTR上游的启动子序列的38%)。在其他实例中,在对FMOS启动子进行甚至更多的修饰的情况下,FMOS功效保持。例如,甚至在去除序列的53%之后,prOsAP1-01(SEQ ID NO:74)仍保持功效。还可期望将启动子或终止子融合,例如(例如通过内含子替代)以产生Bde1序列与AP1序列的融合物,并具有相似的FMOS性能。在一些实例中,可以通过将天然FMOS启动子内含子用来自另一启动子(例如来自泛素启动子)的内含子替代来改善FMOS性能。通过举例的方式,prBde1-02(如在载体24320中)的内含子或其部分可以被来自泛素启动子的内含子或其部分(例如iUbi1-07)(例如,SEQ ID NO:531的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或全部)替代。进一步地,在一些实例中,可以通过将天然FMOS启动子与来自泛素启动子的内含子融合来改善FMOS性能。例如,启动子prBde1-02(如在载体24320中)可以与泛素启动子,例如,iUbi1-07(例如,SEQ ID NO:531的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或全部)融合。
表1a、1b、1c和1d中列出的FMOS序列仅仅旨在为示例性的,因为本领域普通技术人员通过针对FMOS活性鉴定并筛选候选物调控序列(例如启动子和终止子),将能够容易地构建如本文所述的表达盒。筛选将类似地帮助区分非FMOS调控序列,这些调控序列可能不符合FMOS标准,例如,它们可能不会以足够强烈从而可见足够的编辑的方式表达编辑机制,或者当在异源盒中使用以驱动转基因表达时,它们的表现像组成型启动子一样。可替代地,非FMOS序列可能会失败,因为它们是有“遗漏”的并且会导致该编辑的转基因在不希望的位置-例如非花组织(例如,愈伤组织或营养分生组织)中显著表达。以下实例中提供了验证FMOS调控序列的方法。
示例性实施例:
1.一种用于在植物的T1种子中产生多个独特编辑的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码DNA修饰酶的核酸,
任选地,编码至少一种指导RNA(gRNA)的核酸,以及
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;和
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子含有多个独特编辑。
2.如1所述的方法,其中所述多个独特编辑选自由以下组成的组:多个独特等位基因替代、多个独特碱基插入和多个独特碱基缺失。
3.如1或2所述的方法,其中所述DNA修饰酶是定点核酸酶,所述定点核酸酶选自由以下组成的组:大范围核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)、Cas核酸酶、Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、嵌合FEN1-FokI和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
4.如以上中的任一项所述的方法,其中
所述DNA修饰酶是Cas9核酸酶或Cpf1核酸酶,以及
所述至少一个表达盒包含编码gRNA的核酸,其中所述编码gRNA的核酸可操作地连接至FMOS启动子或第二启动子。
5.如以上中的任一项所述的方法,其中
所述独特编辑是等位基因替代,以及
所述至少一个表达盒进一步包含目的核酸(供体DNA)。
6.如5中任一项所述的方法,其中所述至少一个表达盒进一步包含可操作地连接至所述供体DNA以驱动所述供体DNA的复制的复制启动子。
7.如5或6所述的方法,其中所述至少一个表达盒进一步包含至少一个LIR。
8.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有独特编辑。
9.如8所述的方法,所述方法进一步包括
对所述T1代的所述选择的植物中的所述供体DNA的插入位点进行测序,
对所述T1代的非选择的植物中的所述供体DNA的插入位点进行测序,以及
将所述选择的植物的插入位点序列与所述非选择的植物的插入位点序列进行比对。
10.如8或9所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
11.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
12.如以上中的任一项所述的方法,其中所述FMOS调控序列介导
在所述花原基和所述花生殖器官中比在营养组织中多以下中的至少一个倍数的所述DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍,以及
在所述花原基和所述花生殖器官中比在种子中多以下中的至少一个倍数的所述DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
13.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
14.如以上中的任一项所述的方法,其中所述FMOS启动子选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:47、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:56、SEQ ID NO:62、SEQ ID NO:65、SEQ ID NO:71、SEQ ID NO:74、SEQ ID NO:77、SEQ ID NO:80、SEQ ID NO:83、SEQ ID NO:86、SEQ IDNO:514、SEQ ID NO:518、SEQ ID NO:614、SEQ ID NO:615、SEQ ID NO:616、SEQ ID NO:617、SEQ ID NO:618、SEQ ID NO:619、SEQ ID NO:620、SEQ ID NO:621、SEQ ID NO:622、SEQ IDNO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721和SEQ ID NO:723或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列。
15.如以上中的任一项所述的方法,其中所述FMOS终止子选自由以下组成的组:SEQ ID NO:3、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54、SEQ ID NO:57、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:72、SEQ ID NO:75、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:84、SEQ IDNO:87、SEQ ID NO:515、SEQ ID NO:519、SEQ ID NO:699、SEQ ID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:718、SEQ ID NO:720、SEQ IDNO:722和SEQ ID NO:724或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列中的至少一个。
16.如以上中的任一项所述的方法,其中所述多个独特编辑包括以下中的至少一项:至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑。
17.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
18.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个编辑。
19.如以上中的任一项所述的方法,其中
所述DNA修饰酶在所述雄性花生殖器官中的表达是所述DNA修饰酶在所述花原基和所述花生殖器官中比在营养组织中多以下中的至少一个至少一个倍数:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍,以及
所述DNA修饰酶在所述雌性花生殖器官中的表达是所述DNA修饰酶在所述花原基和所述花生殖器官中比在营养组织中多以下中的至少至少一个倍数:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
20.如以上中的任一项所述的方法,所述方法进一步包括测量在T0植物的T0花、T0雄穗和种子中的至少一个中的编辑的数量。
21.一种用于在植物的T1种子中产生多个独特编辑的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码DNA修饰酶的核酸,所述DNA修饰酶选自由以下组成的组:Cas9核酸酶和Cpf1核酸酶,
编码指导RNA(gRNA)的核酸,和
包含FMOS启动子的花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,
(ii)在所述花原基和所述花生殖器官中的至少一个中介导多个编辑,
(iii)在所述花原基和所述花生殖器官中的至少一个中比在芽顶端分生组织(SAM)中介导DNA修饰酶至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个,以及
(iv)在所述花原基和所述花生殖器官中的至少一个中比在种子中介导DNA修饰酶至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个;
b)将所述植物细胞或植物组织再生为具有多个T1种子的植物;和
c)使所述T1种子生长以产生T1代,其中所述T1代含有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑中的至少一项。
22.如21所述的方法,所述方法进一步包括
d)测量所述T1代的植物中的至少一种表型,
e)基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有独特编辑,和
f)对所述T1代的所述选择的植物中的所述供体DNA的插入位点进行测序。
23.如21或22所述的方法,其中FMOS启动子选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:47、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:56、SEQ ID NO:62、SEQ ID NO:65、SEQ ID NO:71、SEQ IDNO:74、SEQ ID NO:77、SEQ ID NO:80、SEQ ID NO:83、SEQ ID NO:86、SEQ ID NO:514、SEQID NO:518、SEQ ID NO:614、SEQ ID NO:615、SEQ ID NO:616、SEQ ID NO:617、SEQ ID NO:618、SEQ ID NO:619、SEQ ID NO:620、SEQ ID NO:621、SEQ ID NO:622、SEQ ID NO:698、SEQID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721和SEQ ID NO:723或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列。
24.一种用于在植物的T1种子中产生多个独特编辑的方法,所述方法包括:
a)在选自由花原基细胞和花生殖器官组成的组的植物细胞或植物组织中表达
编码DNA修饰酶的核酸,和
编码指导RNA(gRNA)的核酸,
其中所述编码DNA修饰酶的核酸和所述编码gRNA的核酸中的至少一个可操作地连接至花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶和所述gRNA中的至少一个的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的植物,其中所述T1种子含有多个独特编辑。
25.如24所述的方法,所述方法进一步包括
将目的核酸(供体DNA)递送至其中进行表达的所述植物细胞或所述植物组织中,以及
将所述供体DNA插入到所述植物的基因组中。
26.如24或25所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子中的至少一个,其中
所述FMOS启动子选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:47、SEQ ID NO:50、SEQ ID NO:53、SEQ IDNO:56、SEQ ID NO:62、SEQ ID NO:65、SEQ ID NO:71、SEQ ID NO:74、SEQ ID NO:77、SEQ IDNO:80、SEQ ID NO:83、SEQ ID NO:86、SEQ ID NO:514、SEQ ID NO:518、SEQ ID NO:614、SEQID NO:615、SEQ ID NO:616、SEQ ID NO:617、SEQ ID NO:618、SEQ ID NO:619、SEQ ID NO:620、SEQ ID NO:621、SEQ ID NO:622、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721和SEQ ID NO:723或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列,以及
所述FMOS终止子选自由以下组成的组:SEQ ID NO:3、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:48、SEQ ID NO:51、SEQ IDNO:54、SEQ ID NO:57、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:72、SEQ ID NO:75、SEQ IDNO:78、SEQ ID NO:81、SEQ ID NO:84、SEQ ID NO:87、SEQ ID NO:515、SEQ ID NO:519、SEQID NO:699、SEQ ID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722和SEQ ID NO:724或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列中的至少一个。
27.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
28.至少一个用于在植物的T1种子中产生至少20个独特编辑的表达盒,所述
表达盒包含:
编码DNA修饰酶的核酸,
任选地,编码至少一种指导RNA(gRNA)的核酸,以及
花镶嵌(FMOS)启动子,其中所述FMOS启动子
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑,以及
(iii)介导
在所述花原基和所述花生殖器官中的至少一个中比在营养组织中多表达以下中的至少一个至少一个倍数的DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍,以及
在所述花原基和所述花生殖器官中的至少一个中比在种子中多表达以下中的至少一个至少一个倍数的所述DNA修饰酶:至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
29.如28所述的盒,其中
所述DNA修饰酶是Cas9核酸酶或Cpf1核酸酶;
所述盒包含编码gRNA的核酸,其中所述编码gRNA的核酸可操作地连接至所述FMOS启动子或第二启动子;
所述盒进一步包含目的核酸(供体DNA)和可操作地连接至所述供体DNA以驱动所述供体DNA的复制的复制启动子;以及
所述FMOS启动子在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
29.如27或28所述的盒,其中所述FMOS启动子选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:47、SEQ ID NO:50、SEQ ID NO:53、SEQ ID NO:56、SEQ ID NO:62、SEQ ID NO:65、SEQ ID NO:71、SEQ IDNO:74、SEQ ID NO:77、SEQ ID NO:80、SEQ ID NO:83、SEQ ID NO:86、SEQ ID NO:514、SEQID NO:518、SEQ ID NO:614、SEQ ID NO:615、SEQ ID NO:616、SEQ ID NO:617、SEQ ID NO:618、SEQ ID NO:619、SEQ ID NO:620、SEQ ID NO:621、SEQ ID NO:622、SEQ ID NO:698、SEQID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721和SEQ ID NO:723或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列,以及
任选地,所述盒进一步包含FMOS终止子,所述FMOS终止子选自由以下组成的组:SEQ ID NO:3、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54、SEQ ID NO:57、SEQ ID NO:63、SEQ ID NO:66、SEQ ID NO:72、SEQ ID NO:75、SEQ ID NO:78、SEQ ID NO:81、SEQ ID NO:84、SEQ IDNO:87、SEQ ID NO:515、SEQ ID NO:519、SEQ ID NO:699、SEQ ID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:718、SEQ ID NO:720、SEQ IDNO:722和SEQ ID NO:724或与其具有至少60%、至少65%、至少70%、至少75%、至少80%、至少90%中的至少一个的同源性的序列中的至少一个。
30.一种植物,所述植物通过如1-27所述的方法产生。
31.一种植物细胞,所述植物细胞含有如28-29所述的盒。
尽管上文中已经披露了多种FMOS调控序列,本领域普通技术人员将能够容易地使用下文实例1-4产生如在权利要求中所述的FMOS调控序列。
实例
实例1:鉴定用于FMOS调控序列的候选物
通过在作物物种或相关物种中搜索符合两个初步筛选标准的基因,鉴定用作FMOS调控序列的候选物:
1.在含有许多事实上的生殖细胞的组织(花组织)中具有中等或高表达。这可能包括花序原基、枝分生组织、花分生组织或花药或胚珠原基,它们产生体(非生殖)细胞类型和生发(生殖)细胞类型。示例性FMOS候选物驱动已获得生殖细胞命运的花药和胚珠细胞(生发细胞、孢原细胞或孢子细胞、花粉母细胞或大孢子母细胞)中的表达。示例性FMOS候选物也可能在减数分裂细胞(性母细胞)或减数分裂后配子体细胞中具有中等或高表达:小孢子、大孢子或经过受精以产生下一代的卵子和精子。
2.示例性FMOS候选物在产生植物区域部分(包括转化的组织(在玉蜀黍中,这意味着胚胎和愈伤组织))的前体干细胞中无表达或表达非常低。FMOS候选物也应该在顶端分生组织中沉默或低表达。FMOS候选物应该在非常早期的花序分生组织中具有低表达-并且可能在花分生组织已分化为小穗对或花分生组织后首次开启。典型的FMOS候选物在花发育之前不会表达。
对于玉蜀黍基因,根据来自内部mRNASeq基因图谱研究的归一化表达值,将SAM中的表达水平分类为“低”、“中”或“高”。在这项研究中,使用69个组织/发育阶段中所有检测到的基因的归一化计数值的完整矩阵来计算四分位数。四分位数提供了将单个基因表达值分类为低(小于第一四分位数)、中(表达值为第一和第三四分位数之间)和高(表达值大于第三四分位数)的阈值。玉蜀黍愈伤组织蛋白表达值获得自以下文献中的补充表S3:Ge F等人(2017)Metabolomic and Proteomic Analysis of Maize Embryonic Callus inducedfrom immature embryo.[未成熟胚诱导的玉蜀黍胚愈伤组织的代谢组学和蛋白质组学分析]Scientific Reports[科学报道]7(1):1004。该表包含在他们对玉蜀黍胚愈伤组织的蛋白质组学分析的全部3次重复中鉴定的超过4,000种蛋白质的列表。如果我们的候选物基因不包括在愈伤组织表达的蛋白质列表中,我们将其在愈伤组织中的表达归类为“关”。类似地,稻愈伤组织蛋白表达值获得自以下文献:Abiko M等人(2013)Identification ofproteins enriched in rice egg or sperm cells by single-cell proteomics.[通过单细胞蛋白质组学鉴定富含水稻卵子或精子细胞的蛋白质]PLoS One.[公共科学图书馆·综合]7月25日;8(7):e69578。补充表S6包含通过LC-MS/MS在稻愈伤组织中检测到的蛋白质的列表。至于玉蜀黍基因,如果我们的候选物基因不包括在愈伤组织表达的蛋白质列表中,我们将其表达归类为“关”。类似的标准也可用于评估双子叶植物的候选物。
除了通过测量表达来鉴定候选物序列外,本领域技术人员还可以基于植物组织表达数据库中的基因表达数据来鉴定候选物调控序列,这些数据库称为基因图谱,其显示了许多物种基因在不同组织中的表达以评估调控序列候选物。
下面在表2中展现了申请人选择的基因启动子列表,以及申请人最终测试的构建体设计。所有这些基因都具有花优选或特异性表达。还示出了玉蜀黍或稻组织的愈伤组织或顶端分生组织中基因的RNA或蛋白质表达水平。
表2
表2.FMOS候选物的基因表达谱和构建体设计(玉蜀黍中17种;稻中7种)
在分析了来自多种组织和数据源的基因图谱、微阵列和RNA-seq数据集后,申请人选择了十一种具有生殖谱系特异性表达的玉蜀黍基因用于测试FMOS活性。申请人还鉴定了在稻中表现出相似表达模式的六种稻基因(通常是我们发现的玉蜀黍基因的同源物)。示例性提名包括在雄性和雌性生殖器官的花药和胚珠原基和/或生发细胞(孢原细胞、花粉母细胞、大孢子母细胞或性母细胞)中表现出高优先表达的启动子。
实例2.生产包含FMOS调控序列的构建体
一旦确定了调控序列的候选列表,就通过构建构建体使用启动子和终止子来驱动Cas9的表达并测量在稳定转化的植物(T0植物)和后代(T1植物)中产生的编辑多样性来筛选活性。
从实例1中鉴定的19个FMOS候选物开始,我们设计了24个构建体,包括启动子序列和5′非翻译区(UTR)、终止子的不同变体,并且在某些情况下,我们将不可翻译的第一外显子和内含子以及第二外显子的前15个碱基对(来自FMOS候选物基因)包括为调控序列。这些序列共同构成了侧接Cas9编码序列并驱动Cas9编码序列表达的调控区。所有24个构建体中的指导RNA都靶向醇脱氢酶I(ADH1,GRMZM2G442658)的外显子2,其靶位点序列为5′-cggcaagccactgtcgatcg-3′(SEQ ID NO:6)。选择性标志物是磷酸甘露糖异构酶(PMI),并且我们使用甘露糖选择来重新获得稳定转化的玉蜀黍自交系NP2222的植物。
一个另外的对照构建体具有由组成型CMP启动子驱动的Cas9。
图1示出了载体24301(SEQ ID NO:1)的示意图,载体24301用于用于转化玉蜀黍未成熟的胚以在ZmADH1基因中产生多个不同的编辑:启动子prZmAP1-01;终止子tZmAP1-01;指导RNA(gRNA)序列;rsgRNAZmVLHP-01:单指导RNA(sgRNA),其包含gRNA、tracRNA和PolIII终止序列。cPMI:PMI选择性标志物基因;cCas9:Cas9核酸酶基因;RB:T-DNA右边界;LB:T-DNA左边界;tNOS:胭脂碱合成酶终止子。cSpec:大观霉素抗性基因。
图3是载体24224(SEQ ID NO:10)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图4是载体24243(SEQ ID NO:40)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图5是载体24265(SEQ ID NO:19)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图6是载体24266(SEQ ID NO:22)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图7是载体24269(SEQ ID NO:25)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图8是载体24270(SEQ ID NO:28)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图9是载体24289(SEQ ID NO:31)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图10是载体24299(SEQ ID NO:34)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图11是载体24300(SEQ ID NO:85)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图12是载体24305(SEQ ID NO:43)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图13是载体24306(SEQ ID NO:46)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图14是载体24320(SEQ ID NO:49)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图15是载体24426(SEQ ID NO:52)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图16是载体24427(SEQ ID NO:55)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图17是载体24428(SEQ ID NO:58)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图18是载体24454(SEQ ID NO:61)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图19是载体24455(SEQ ID NO:64)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图20是载体24458(SEQ ID NO:67)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图21是载体24459(SEQ ID NO:70)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图22是载体24460(SEQ ID NO:73)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图23是载体24548(SEQ ID NO:76)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图24是载体24602(SEQ ID NO:79)的示意图,该载体用于转化玉蜀黍未成熟的胚。
图25是载体24688(SEQ ID NO:82)的示意图,该载体用于转化玉蜀黍未成熟的胚。
各种载体中使用的启动子和终止子连同序列信息也列于下文。实例3.用包含FMOS调控序列的表达盒转化植物
对于每个构建体,我们将10至20个单拷贝T0事件(除了具有低转化频率且仅产生两个事件的24265外)发送到温室。我们对幼苗进行采样并检查PMI和Cas9转基因的单拷贝,并检查在ADH1靶位点的编辑。我们还检查了幼苗叶中的PMI和Cas9表达。
我们发现几乎所有的构建体都表现得如所希望的那样——根据qPCR有一个转基因拷贝(参见下文的二级Taqman检测数据),并且在对照构建体中编辑了ADH1靶位点(载体24224,参见Taqman得分为0[两个拷贝均被编辑]或1[一个拷贝被编辑,一个WT]),但不在大多数FMOS候选物构建体中(参见Taqman得分为2[两个拷贝仍为WT,或未被编辑])。此外,大部分FMOS候选物构建体在叶中具有PMI表达,但没有Cas9表达-进一步表现出表达控制仅限于营养组织。这在每个测试的构建体中都很明显,尽管不是在每个事件中。例如,具有对照构建体24224的13个事件(经转化的植物)中的13个在ADH1靶位点进行了编辑(其中8个植物的ADH1基因的两个拷贝都经编辑),并且Cas9的表达比对照基因高1000x以上。
相比之下,构建体24269中的ZmAGO18A(ARGONAUTE 18A)启动子/终止子组合仅在十七个事件中的两个中具有编辑,并且仅在一个事件中表达超过1000x。因此,FMOS候选物在17个事件中的15个中按所希望的工作。根据我们的数据库和文献分析,Aris基因在玉蜀黍花药和胚珠的生发孢原细胞中具有高度特异性表达。当调控序列用于驱动Cas9时,在大多数事件中,在愈伤组织中不会发生编辑,并且Cas9的表达受到限制,这是FMOS调控序列候选物中所希望的性能。
同样,在具有ZmAP1启动子/终止子的构建体中,我们发现没有任何事件在幼苗叶Taqman样品中具有编辑,并且叶的Cas9表达非常低。因此,这两个调控区代表有前途的FMOS候选物,因为它们允许经转化的植物在营养发育过程中保持未经编辑。类似地,除了构建体24305和24243中的稻OsMEL1启动子和终止子之外,我们测试的大多数其他调控区在该幼苗分析中表现良好。我们测试了这两种版本,在大多数事件中,两者都在愈伤组织或早期营养分生组织期间发生编辑,导致叶中的经编辑的ADH1。
表3
表3.测试的FMOS构建体,包括叶编辑数据(由Taqman qPCR测定产生)和来自幼苗叶的qRT数据。Taqman测定是针对标准内部对照运行的qPCR检测,该标准内部对照也恰好是ADH1(与指导RNA所靶向的区域不同,因此,对照测定不受可能发生的基因任何小编辑的影响)。对于转基因测定以及靶位点PCR测定,Taqman qPCR得分为“1”表示存在基因(或转基因)的一个“野生型”拷贝。这是通过与对照组织的板内比较来确定的。得分为“2”表示存在两个“野生型”拷贝。得分为“0”表示存在零个野生型拷贝;换句话说,两个靶位点都被编辑。对于定量逆转录酶(qRT)-PCR数据(表格右侧的两列),两种转基因PMI和Cas9的表达参照内标测定进行评分。这两列中提供的数字代表相对于该内部对照的倍数变化。
根据每个事件中“0”或“1”的一致野生型ADH1 Taqman测定得分,对照构建体在叶中表现出高效的编辑,这意味着ADH1靶位点的1个或两个拷贝携带由编辑机器诱导的新突变。相比之下,FMOS候选物主要保持ADH1靶位点完整,可能是由于Cas9蛋白在愈伤组织、分生组织和未成熟的叶中的低表达。通过检查每个事件的qRT-PCR和ELISA数据验证了FMOS启动子构建体中Cas9 RNA和CAS9蛋白的低表达。稻MEL1启动子的两个版本(在细线期1中止的减数分裂)引发了许多事件,其中在叶中具有编辑,但Cas9低表达;编辑很可能是由于Cas9与OsMEL1调控区配对时Cas9的愈伤组织或营养分生组织表达。这是具有独特的减数分裂特异性表型的候选物调控序列的示例,但是,由于在愈伤组织或营养分生组织中的早期表达,它不是理想的FMOS候选物。我们舍弃了在愈伤组织或营养分生组织中显示编辑(如在叶中的编辑所示)的植物或构建体。因为叶来自分生组织,我们推断叶编辑意味着分生组织编辑。
我们关注使用FMOS调控序列在花中生成具有多个编辑的事件(如通过实例4中讨论的并在表4中说明的雄穗编辑和镶嵌性测定所确定的)。
实例4.产生多个独特的编辑并确认编辑机器的花富集表达
使用两种雄穗编辑和镶嵌性测定来说明FMOS调控序列的性能。两种测定均表明ADH1靶位点是否存在编辑-第一种测定是使用脱氢酶染色进行的花粉ADH1生化测定,可用于在从雄穗上多达48个不同位置收集的花粉中快速提供有效读出的adh1功能。第二种测定是通过下一代序列(NGS)进行的靶侧DNA-seq,仅对来自T0事件的那些在adh1花粉测定筛选中显示出高度编辑的位置的雄穗样品进行。NGS测定揭示了靶位点处编辑的多样性。因此,通过结合来自第一和第二筛选的数据,我们能够生成一个非常高质量的数据集,显示雄穗不同部分的花编辑效率和镶嵌性的程度。然后通过雄穗上的突变类型和位置分析启动子的NGS数据,以计算镶嵌性得分,该镶嵌性得分近似于在T0事件的给定雄穗中检测到的不同编辑事件的平均数。
图26a说明了从每个事件的雄穗采样以进行测定。将每个事件的雄穗采样24-48次。收获开花前阶段的小穗,并将上部和小花花药按标准顺序放入96孔板的孔中,如所示-在每个板中的位置相同。如果我们没有足够的侧枝来填充C行和D行或G行和H行,我们只需在每个事件中我们具有的侧枝数处停止。
为了定量雄穗中编辑的程度和编辑事件的多样性,从雄穗上的不同位置(每个雄穗有数百个小穗)取24至48个雄穗小穗(花),以及用镊子将每个小穗的上部小花的三个花药夹成两半并装入96孔ADH1染色板的孔中。该板的每个孔在室温下含有800μl 0.1M Tris-HCl(pH 6.7)。将来自每个小穗的三个下部小花花药放入96孔DNA测序板的相应孔中,以储存在-80冰箱中。使用Wisman等人Genetic and molecular characterization of an Adh-1null mutant[Adh-1无效突变体的遗传和分子特征]Mol Gen Genet[分子遗传学与普通遗传学]1991 226:120-128的方案(我们使其适用于96孔板筛选,以能够进行对花各部分的高通量分析)对染色板中的花粉进行ADH1活性染色。
简而言之,染色板在-20℃下冷冻过夜并解冻2-3小时。通过移液穿过96孔40μm尼龙网烧结滤板收集花粉。将其吸干并置于96孔收集板中;每孔含有400uL MTT染色缓冲液,该染色缓冲液含有94%v/v 0.1M Tris-HCL、6%v/v乙醇、0.3g/L烟酰胺腺嘌呤二核苷酸(NAD)、0.2g/L 3-(4,5-二甲基噻唑-2-基)-2,5-二苯基溴化四唑(MTT)和40mg/L吩嗪硫酸甲酯(PMS)。然后将板覆盖并在28℃下避光孵育一小时。野生型花粉染成紫色。失去ADH1活性的花粉保持未染色(透明)。花粉发育、生存或受精不需要ADH1。在WT对照样品中检测到11%的非活花粉。将具有<1%ADH1阳性花粉的样品评为完全经编辑;将具有>90%ADH1阳性花粉的样品评为未经编辑。部分经编辑的条目以孔中ADH1阳性花粉的百分比来表征,估计增量为5%(即5%、10%、15、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%和95%)。将平均百分比归一化(-11%,基于对照)。通过不同%ADH1+括号的频率来评估编辑的多样性。具有镶嵌性和高编辑效率的构建体被提名用于NGS以进一步说明编辑的多样性。
表4
表4.ADH1染色得分(数百个样品的平均值)。这些数据鼓励我们将花粉测序工作重点放在三个构建体24301、24320和24269上,它们经假定编辑的花粉量最高。十二个FMOS启动子中的八个显示<50%的编辑。计算那些在叶样品中未显示编辑的事件的经编辑的adh1花粉的%。通过100减去%WT ADH1+花粉来计算经编辑的花粉的%。然后通过减去11%(这是WT样品中未染色花粉的平均%)将这个数字归一化。
尽管预测在生发谱系中表达,表4示出了八个FMOS启动子候选物通过ADH1染色显示出>50%WT花粉。其原因之一可能是那些FMOS候选物具有花表达而不是生发表达。尽管我们使用了许多高质量的表达数据集,但在许多情况下,样品包含生发细胞和体细胞的混合物。另一种可能的解释是由于缺失染色质特征或远端序列,在异源环境中表达活性低。顺式增强子可能与它们在玉蜀黍中增强的基因相距数百的千碱基。还可以通过来自特定生殖谱系细胞的改善的RNAseq数据以及通过利用染色质图景研究(如ChIP-seq、ATAC-seq、DNAseI-seq、MNase-seq或其他数据类型)来进一步辅助进行FMOS启动子的选择。因此,这将导致设计具有不同增强子、启动子、内含子和终止子的嵌合启动子,以在生殖细胞中诱导高特异性表达。
ADH1染色还有助于检查ADH1基因编辑中的镶嵌性程度。通过查看雄穗上不同位置的24至48个样品,我们可以看到编辑的程度不同。例如,下表5示出了构建体24320对于14个事件的ADH1花粉染色结果(超过7个板)。在第一个事件GVG00887355中,一些花药样品比其他花药样品(B7孔中5%)具有更多的WT花粉(40%,在A4孔中)。这是镶嵌性的标志——如果编辑在发育中发生的非常早,则所有孔都将具有“0%”WT花粉,如同对照CMP启动子的情况(参见表6)。
表5
表5.示出了花粉染色结果的实例。这是对于来自构建体24320的14个事件而言。每个孔中的数字代表染色(未经编辑)花粉的百分比。像GVG00887372这样的一些事件没有太多的编辑,但14个事件中的11个有高效的编辑。板中一些具有较高和较低编辑程度的样品的普遍存在表明镶嵌性。
表6
表6.对照构建体24224(CMP组成型启动子)显示在花粉中100%编辑。
表7
表7.对于24305的ADH1染色结果在许多事件中表现出Cas9的过早表达,如叶中的编辑测定数据(得分为0或1)所示。这导致雄穗中缺乏镶嵌性(这些事件中的大多数/所有孔都显示近100%的编辑)。
表7a
表7a.24460的ADH1染色结果。15个事件中的13个具有高效编辑。板中一些具有较高和较低编辑程度的样品的普遍存在表明镶嵌性。
ADH1测定是用于确定编辑多样性的廉价、首过筛选,而ADH1靶位点的DNA测序是更具特异性的评估。在此实例中,我们仅对表现出通过ADH1染色测定表明没有或很少发生叶编辑但>50%ADH1编辑的花粉的构建体进行测序。对于构建体24301、24320、24460、24305和24269中的那些选定事件,从-80冰箱中取出花药样品并提取基因组DNA。对每个样品进行ADH1靶位点的PCR扩增。将PCR扩增子送去进行下一代测序。对于被视为“真实”的序列,设置了1%读取丰度的截止值。
本文中我们呈现了内部开发和实施的以实现对基因组编辑事件的高通量筛选和表征的分子分析途径,包括高通量TaqMan分析、桑格(Sanger)和ICE分析、下一代测序(NGS)和基因组编辑分析。
镶嵌性得分方法1:
可以使用三步过程直接测量驱动核酸酶和/或指导RNA的任何启动子的FMOS活性的测量值,以经由镶嵌性得分方法1确定“镶嵌性得分”。可以使用此过程计算每个T0事件或后代植物的镶嵌性得分。这种评分方法可用于任何开花植物或作物。
步骤1)对T0一个或多个花序或花序部分(即花药和心皮)进行四次至多达数百次采样。创建花序或整株植物的图谱,指示不同样品的来源以进行追踪。该图谱的性质可取决于植物。在玉蜀黍中,我们按雄穗枝布置。在大豆或番茄中,可以使用花枝或花簇。
步骤2)对这些样品进行NGS,为读取%设置1%的截止值,并为获得的每个编辑创建单独的植物图谱。
步骤3)使用这些图谱计算镶嵌性得分,如下:计算一次第一编辑,所有后续编辑(如果与同一分支/簇中具有相同编辑的样品相邻)则仅当读段%与相邻读段%相差>15%时才进行计数(可以从相邻标准中排除小于10%的读段%)。将整个植物的所有编辑类型(等位基因)的所有计数编辑相加,然后除以样品数。这给出了该植物的镶嵌性得分。镶嵌性得分等于鉴定的独特编辑数/样品。
申请人认为镶嵌性得分大于0.5被视为“功能性”FMOS启动子。得分大于2应被视为“良好”。得分大于5应被视为“非常好”的FMOS启动子。得分大于10应被视为“优秀”的FMOS启动子。得分大于15应被视为“精英”的FMOS启动子。
下文提供了使用镶嵌性得分方法1在玉米中测量的镶嵌性得分的实例。
高通量TaqMan筛选
对于编辑切割位点分析,将靶特异性引物设计为位于预期编辑区域的两侧,其中靶特异性探针放置在编辑切割位点处。进行定量实时PCR用于基因组编辑事件的高通量筛选中的拷贝数分析。靶位点的两个拷贝表明没有编辑,一个拷贝表明一个等位基因被编辑,零个拷贝表明两个等位基因都被编辑。在384孔板中建立实时PCR。将反应进行多重复用以同时扩增靶基因和内源对照基因。对于每个样品,通过将3μl提取的基因组DNA与包含Jumpstart Taq ReadyMix(西格玛公司(Sigma))(补充有各自最终浓度为300nM的引物和各自最终浓度为100nM的探针)的3μl主混合物组合来设置Taqman测定。将384孔板热封,并在ABI 7900实时PCR机器或美国生命科技公司(Life Technologies)Quant Studio Flex 7仪器中使用以下参数进行实时PCR:95℃持续5分钟,95℃持续5秒和60℃持续30秒进行40个循环。根据制造商的说明进行运行后数据分析。
对于等位基因替代/靶插入分析,还可以设计独特的TaqMan测定以适应特定目的(本文未描述)。
NGS(下一代测序)和基因组编辑分析途径
使用GNS和基因组编辑分析来表征事件。
对基因组编辑分析进行设计以使用NGS数据检测和表征靶序列变化或等位基因替代。
申请人进行了以下分析任务:
·从NGS资源库中检索Illumina读段
·修整读段
·合并配对末端读段
·读段采样(而不是使用所有读段)
·将合并的读段与WT参考比对
·将WT参考和具有所希望的等位基因替代的参考比对(仅限等位基因替代事件)
·调用具有所希望的等位基因替代的参考中的变异(仅限等位基因替代事件)
·调用单个读段和WT参考之间的变异
·鉴定部分比对的存在和位置
·鉴定读段共有的变异
·确定变异频率并去除低频变异
·鉴定变异诱导的移码
·评估分阶段插入缺失对阅读框的影响
·确定单倍型
·制作结果报告
·将结果存档于NGS资源库中
然而,其他人可能更喜欢其他方式来评估他们的途径。
以96孔板标准实验室方案提取和纯化DNA。如果样品量有限,如花粉粒较少,则相应减少提取缓冲液和洗脱缓冲液的用量。将靶特异性引物设计为位于靶编辑区域的侧翼。对于Adh1编辑分析,设计了CTAACTCGTTGAGTGGCCCTG(SEQ ID NO:546)的靶特异性引物1(FE4228)和CAGATAAGCCGCCAAGAAGG(SEQ ID NO:546)的靶特异性引物2(FE4229)。将NGS通用TAG序列添加到设计的靶特异性引物中。
在96孔板中用高保真聚合酶(如Q5)建立PCR反应。对于每个PCR反应,加入12.5ul2x Q5热启动高保真主混合物、1.25ul引物1、1.25ul引物2、4ul DNA和6ul H2O,并混合。PCR扩增在以下条件下运行:
检查PCR产物的质量,以1:50或1:100的比率用H2O稀释,用于下一代测序。在NGS文库制备中,进行嵌套PCR以向每个样品添加样品特异性条形码和测序TAG。将多达384个带条形码的样品合并在一起,并由Miseq以2x 250bp或2x 300bp配对末端读段进行测序。
为了捕获低频率的异类编辑,相应地调整默认分析参数,例如,将“分析的读段数”增加到>=1000,将“最小变异百分比”减少到=<1%。当“最小变异百分比”设置得低时,可能会出现更多的假阳性SNP。为了帮助评估假阳性,在过程和分析中包括了一些WT样品。
在NGS分析中使用的Adh1靶参考(SEQ ID NO:548):
ctaactcgttgagtggccctgtttctcggacgtaaggcctttgctgctccacacatgtccattcgaattttaccgtgtttagcaagggcgaaaagtttgcatcttgatgatttagcttgactatgcgattgctttcctggacccgtgcagctgcggtggcatgggaggccggcaagccactgtcgatcgaggaggtggaggtagcgcctccgcaggccatggaggtgcgcgtcaagatcctcttcacctcgctctgccacaccgacgtctacttctgggaggccaaggtatctaatcagccatcccatttgtgatctttgtcagtagatatgatacaacaactcgcggttgacttgcgccttcttggcggcttatctg
桑格测序和ICE分析途径
作为NGS的替代选择,其他人可能更喜欢桑格测序和CRISPR编辑推断(ICE)(由桑格公司(Synthego Inc.)开发)用于基因组编辑事件的高通量测序分析。引物设计、PCR、PCR产物的净化和桑格测序遵循标准实验室方案。
为了使用此数据来估计镶嵌性,重要的是我们确定哪些编辑可能是独立的(例如,在发育植物的不同细胞中进行的)以及哪些被视为假定克隆扇区的一部分(源于单一细胞,该编辑最初发生的地方)。更好的FMOS活性将与前者-更独立的编辑(发生在植物发育后期)相关,而不是后者-检测到的作为同一克隆衍生细胞扇区的一部分的编辑。为了做到这一点,对于每次编辑(例如突变、变异、转基因事件),编辑都被映射到雄穗的图表上。该图表被称为对于每个变异的“雄穗图”。对于我们在实践中的编辑评估的良好证明,参见表8。对于此实例,显示了两个不同事件的TCGA的四个碱基对缺失(这是非常常见的整体编辑),包括样品板和96孔板的位置。为了理解和管理镶嵌扇区模式,我们将原序列读段(如表8所示)转换为雄穗图(如表9所示),以便于进行邻近/相邻分析。
表8
表8示出了两个事件的182:缺失TCGA的序列信息。
表9
表9.等位基因(或编辑)“缺失TCGA”的雄穗图:单元格代表包含该编辑的雄穗上的小穗样品位置,以及该编辑在那些样品的所有NGS读段中的百分比,这是对于两个事件而言
表9是雄穗图,其信息与表8所示的信息相同。两个事件的编辑182:缺失TCGA被发现于雄穗不同部分的多个位置,包括中心穗和侧枝。每个单元格中的%表示具有该序列的读段的分数,并对应于96孔板的一个孔。每个孔是不同的雄穗小穗。每个孔还具有其他不同的编辑,这些编辑出现在本文未示出的其他雄穗图中。这种突变出现在雄穗的不同位置,但两个事件中心穗中的一些相邻部分可能显示出来自植物或雄穗发育早期同一单一编辑事件的扇区。为了标准化所有事件和构建体的过程,并因此能够比较哪些构建体充当最佳FMOS启动子,我们设置了以下规则:检查雄穗图,从每个穗的底部开始,第一个突变总是被视为独特突变。从第一个突变向上移动,其他突变仅在突变丰度小于10%或突变丰度与前一个小穗的差异超过15%时才计算在内。换句话说,对在给定列(在雄穗图中,列代表雄穗枝或中心穗)中发现的第一个编辑进行计数;随后的编辑也被计数,除非在前一个单元格中表示相同的编辑,其中这两个样品之间的NGS数据中代表性百分比在+/-15%内(这是基于这样的想法,即具有相似丰度的此类编辑更有可能成为连续扇区的一部分)。将具有<10%代表性的编辑排除在15%规则之外,因为它们的稀有性表明它们不是连续扇区的一部分。使用此规则,表9中以粗斜体显示的编辑不能认为与先前的编辑无关,因此不计算在内。对于表9中的此序列突变,确定MSKE181002A045A有七个独立编辑,MZKE181002A151A有17个独立编辑。
对于每个事件,计算独立编辑的总数(所有编辑),所得值除以由NGS评估的样品总数(通常,针对中心穗的12个样品加上针对每个侧枝的6个样品,但不同事件的总数不同)。此计算为我们提供了每个采样小穗的独立编辑的平均值,并将此平均值视为“镶嵌性得分”。对于组成型启动子CMP,当在整个雄穗中仅检测到一个(纯合子)或两个(双等位基因)编辑时,被采样24至48次的事件的镶嵌性得分将出现在0.021-0.083的范围内。关于FMOS启动子,首过分析揭示了几个事件在花粉ADH1测定中没有显示出编辑,并且在NGS数据中也只有很少或没有编辑——这些可能是转基因表达几乎完全沉默的事件-并给出了极低的镶嵌性得分(0.0-.1)。从分析去除这些事件(MZKE181800A021A、MZKE181800A056A、MZKE181800A074A、MZKE182000A005A、MZKE182000A029A、MZKE182000A031A),我们通过NGS评估的五个FMOS启动子的镶嵌性得分范围在1.24(prZmAgo18A-01,构建体#24269)和11.79(prZmBde1-02,构建体#24230)之间。因此,通过这种保守的分析,这些FMOS启动子的镶嵌性显示出比普遍存在的启动子能够实现的镶嵌性高大约15倍(1.24/0.083)至561倍(11.79/0.021)。鉴于并非所有雄穗和雌穗都被采样进行NGS,这肯定是低估的。同样,本文花镶嵌性被定义为事件的生殖细胞中不同(多样)编辑的数量或频率:这些更高的镶嵌性得分清楚地表明雄穗中的编辑具有高度多样性,因此FMOS启动子活性更高。同样,镶嵌性得分代表在小穗样品中平均检测到的不同编辑的数量。
图26b示出了我们对其评估NGS数据的五个构建体中每一个的镶嵌性得分。表10示出了基于NGS数据的来自示例性FMOS启动子的事件的镶嵌性得分。
表10
通过T1后代种子的测序进一步证实FMOS活性:从构建体24301、24320、24269和24460的五个事件的每一个中萌发了多达100种种子。Taqman测定表明ADH1中靶位点的合子型。(表11)
表11
表9b.对于四个FMOS构建体的T1后代(从五个事件汇集)的Taqman得分总结。Taqman得分为0意指两个拷贝都经编辑;得分为1是杂合的;得分为2是“WT/WT”或未经编辑。
通过将具有经编辑的ADH1的一个拷贝的后代数量与2*(具有经编辑的ADH1的两个拷贝的后代数量)相加来计算后代中经编辑的总编辑等位基因。然后减去来自雄性方面的预测编辑数(这是通过将父本编辑率[来自表4]乘以采样的后代植物数来确定的);然后将总编辑等位基因与每个构建体的预测的父本编辑数之间的差异除以总后代数,以提供母本编辑率的代理。
使用此方法发现24301、24320、24269和24460的母本编辑率分别为61%、73%、62%和61%。其他实例可能具有其他编辑率,例如至少50%、至少55%、至少60%、至少70%、至少80%。因此,构建体24320中的prZmBde1-02启动子在编辑雌性细胞(雌穗中)方面是最有效的,尽管prOsAP1-01(24460)在编辑雄性细胞方面是最好的(在雄穗中85%的雄性细胞编辑率)。为了解在后代中发现的编辑的多样性,从具有一个或两个经编辑的ADH1等位基因的后代中提取DNA。对靶位点PCR产物进行测序。在大多数情况下,从靶位点开始观察到色谱双峰。为阐明桑格测序结果,CRISPR编辑推断(ICE)程序(桑格公司)将这两个等位基因进行了区分。
表12和表13说明了来自载体24269,事件编号MZKE181002A135A的50个T1后代的T0花粉ADH1染色和测序结果。该事件未显示叶中的编辑,并且ADH1染色似乎显示出良好的FMOS活性。我们没有进行NGS测序,但检查了T1后代,大多数个体是双等位基因,具有从母本(卵细胞)和父本(花粉粒/精子细胞)花遗传的两种不同的编辑。在某些情况下,未找到编辑或遗传的编辑相同,但这是例外而不是规律。这只是从该启动子和其他测试的FMOS调控系统获得的成百上千个类似结果的一个示例。
表12.对于事件MZKE181002A135A(构建体24269)的花粉ADH1染色数据
表13
S=样品#
表14说明了来自载体24301,事件编号MZKE18100A050A、MZKE18100A063A、MZKE18100A064A、MZKE18100A078A和MZKE18100A084A的T1后代的测序结果。大多数个体是双等位基因,具有从母本(卵细胞)和父本(花粉粒/精子细胞)花遗传的两种不同的编辑。在少数情况下,未找到编辑或遗传的编辑相同。
表14
S#=样品#
表15说明了来自载体24320,事件编号MZKE18200A019A、MZKE18200A028A、MZKE18200A045A、MZKE18200A057A和MZKE18200A064A的T1后代的测序结果。大多数个体是双等位基因,具有从母本(卵细胞)和父本(花粉粒/精子细胞)花遗传的两种不同的编辑。在某些情况下,未找到编辑或遗传的编辑相同。
表15
S#=样品#
表16汇总了来自载体24460,事件编号MZKE184306A030A、MZKE184306A047A、MZKE184306A060A、MZKE184306A062A和MZKE184306A104A的T1后代的测序结果。大多数个体是双等位基因,具有从母本(卵细胞)和父本(花粉粒/精子细胞)花遗传的两种不同的编辑。在某些情况下,未找到编辑或遗传的编辑相同。来自E1后代的信息用于计算母本编辑频率。
表16
发现了在后代中产生的不同编辑的总数,例如至少一个核苷酸差异。结合叶编辑率、ADH1染色数据和花粉镶嵌性得分,将这四种数据类型结合起来,并用于评估FMOS调控系统和了解FMOS构建体的时间和组织特异性。
在测试的24个FMOS构建体中,基于花粉NGS数据,五个似乎是高效的FMOS构建体,因此我们经由NGS检查了这五个中的一些事件并评估了T1后代。基于花粉NGS和镶嵌性得分分析,我们发现这五个中的三个被确认是非常高质量的FMOS构建体:24320(prZmBde1-02)、24301(prZmAP1-01)和24460(prOsAP1-01)。在T0叶样品中,这些构建体在大多数事件中给出低编辑或零编辑,并且在雄穗和后代中进行高度多样化的编辑-导致大多数事件的花镶嵌性得分平均高于3(基于镶嵌性得分,由于每个雄穗有至少100个小穗,并且每个小穗将进行至少3次编辑来计算,预测整个雄穗中具有超过300个不同编辑事件)。CMP组成型启动子(构建体24224)在叶中显示100%编辑。通过ADH1染色,这些事件还显示在雄穗中具有接近100%的编辑。没有分析不同雄穗样品中的编辑序列。对于几种其他构建体,虽然在叶中几乎没有或根本没有编辑的证据,但是通过ADH1染色,在雄穗中的编辑效率也相当低。这可能是由于启动子在天然状态下不是很强,或者它在天然状态下很强但对产生花粉的生发组织不具有很大特异性。或许在针对启动子和/或终止子选择的区域中未捕获必需的顺式或反式增强子序列。
载体24320中的一个盒使用prZmBde1-v2,一种从天然玉蜀黍BEARDED EAR1基因IDZm00001d017614中提取的高表达的花特异性启动子,作为FMOS启动子。Cas9在构建体中由来自B73v5的天然ZmBde1启动子序列驱动,用于在早期花序分生组织中特异性表达(来自Thompson等人的原位杂交数据,2009)。使用的序列包括启动子、第一外显子、第一内含子和第二外显子(部分)。这总共是5741bp的调控序列,包括2000bp上游启动子序列+209bp 5'UTR、182bp第一外显子、大第一内含子(3332bp)和以3bp起始密码子结束的部分15bp第二外显子。两个bp的改变用于去除外显子中的ATG起始密码子并去除一个用于克隆的BbsI位点,这不会破坏任何转录因子结合位点的任何基序,如通过Nsite所确定。Cas9之后的终止子序列也来自ZmBde1天然终止子,其由终止密码子下游828bp组成,包括324bp的3′非翻译区。包含此构建体的十四个事件中的零个在叶中表现出任何编辑。虽然3个事件在雄穗中具有最少编辑,但10个事件表现出对花粉中ADH1基因的高效编辑,并且从这些事件的NGS数据中看出大的编辑多样性(镶嵌性得分=11.79)。在T1种子中还遗传了广泛多样的编辑(母本编辑得分=73%)。该启动子缺少第一内含子的版本被用来表达具有tNOS(构建体24265)或天然ZmBde1终止子(构建体24266)的Cas9,但通过ADH1染色得知这些组合都不能进行高效编辑。因此,对于此构建体,当第一内含子作为启动子的一部分被包括在内时,花的表达得到了改善。
载体24301中的另一个FMOS盒包含prZmAP1-v1,一种从天然玉蜀黍APETALA1基因(ID Zm00001d007949)中提取的高表达花特异性启动子。启动子序列为2846bp,包括520bp上游序列+220bp5'UTR、185bp第一外显子、大内含子(2846bp)和以3bp起始密码子结束的15bp的第二外显子。终止子tZmAP1-v1是953bp的调控序列,包括324bp的3'UTR和629bp的下游序列。十四个事件中的十一个在叶中显示没有编辑(测试了两个幼苗叶样品),而其他三个事件仅显示出非常低的编辑百分比。在ADH1染色中,十一株植物显示出非常高的编辑水平。基于对来自48个花药样品的ADH1靶位点PCR产物进行测序的雄穗镶嵌性得分为4.16,这表明在T0雄穗中的编辑具有高度多样性。母本编辑得分为61%。T1后代表现出不同的编辑。另一个实施例可以包括测试的该启动子的稻版本,取自OsAPETALA1基因(Os07t01089000-02),构建体24660。该启动子在叶取样和ADH1花粉染色测定中也表现良好。我们通过NGS检查了四个事件,数据中发现的不同编辑致使镶嵌性得分为5.86。T1后代也表现出广泛多样的编辑结果。
载体24460中的另一个FMOS盒包含prOsAP1-v1,一种从天然稻APETALA1基因(IDOs07g01820或Os07t01089000-02)中提取的高表达花特异性启动子。启动子序列含有2000bp的上游序列+124bp 5'UTR,185bp第一外显子(在5'末端的ATG变为AAG,以确保翻译不会过早开始),然后是第一内含子(2416bp),和以3bp起始密码子结束的15bp的第二外显子。终止子tZmAP1-v1是1000bp的调控序列,包括361bp的3'UTR和629bp的下游序列。十五个事件中的十五个在叶中均显示没有编辑(测试了两个幼苗叶样品),13个事件在ADH1染色中显示出非常高的编辑水平。基于对来自每个事件多达48个花药样品的ADH1靶位点PCR产物进行测序的雄穗镶嵌性得分为6.01,这表明在T0雄穗中的编辑具有高度多样性。母本编辑得分为61%。T1后代表现出不同的编辑-我们发现T1的多样性与其他高功能性FMOS构建体24320和24301(两者都具有在其T1后代中产生超过20个不同突变等位基因的事件)所见的多样性相匹配;类似地,24460具有在其T1后代中产生超过20个不同突变等位基因的事件。
另一个FMOS构建体24269含有prZmAGO18A-v1,一种从玉蜀黍ARGONAUTE18A基因(ID Zm00001d006351)中提取的高表达生发细胞特异性启动子。Cas9在构建体中由天然ZmAGO18A启动子序列驱动,包括1,225bp上游序列、包含完整5'UTR的第一外显子和755bp内含子,直到外显子2的前15bp。终止子由终止密码子下游的1116bp序列组成,包括3′UTR终止密码子(包括3′UTR)。十五个事件中的十三个在叶中表现没有编辑,而这十三个事件在花粉ADH1染色中还表现出有效的编辑和中等程度的镶嵌性。T1种子数据表明后代中遗传的编辑具有高度多样性(母本衍生的编辑百分比为62%)。然而,后代中的许多编辑都是。如此多的后代携带相同的编辑序列这一事实导致假设编辑发生在分生组织发育的早期的某些事件中-以致大部分T0事件都带有相同的编辑。事实上,这一假设得到了NGS分析的支持-使用我们新的镶嵌性得分方法来分析NGS数据,我们发现镶嵌性得分远低于其他FMOS启动子-只有1.24。虽然这仍然比遍在型启动子或组成型启动子高至少14倍,但比其他FMOS启动子低3至10倍。这些分析既证实了我们的测定途径的稳健性,也证实了镶嵌性得分过程的能力,以确切阐明某些FMOS启动子相对于其他启动子的表现如何。
最后,为了确认花组织表达富集并揭示这些启动子驱动高编辑酶表达的花发育阶段,我们对携带FMOS启动子编辑构建体的一个拷贝的T1植物进行了qRT-PCR。我们测试了来自构建体24320的3个事件(prZmBde1-02:事件MZKE182000A057A、MZKE182000A064A和MZKE182000A028A),来自构建体24301的3个事件(prZmAP1-01:事件MZKE181800A050A、MZKE181800A033A和MZKE181800A073A)和来自构建体24269的3个事件(prZmAGO18A-01:事件MZKE181002A088A、MZKE181002A080A和MZKE181002A121A)。我们测试了受组成型启动子控制的PMI选择性标志物(磷酸甘露糖异构酶)的表达(图41)和受FMOS启动子控制的Cas9的表达(图42)。qRT测定利用阳性对照基因延伸因子1α来针对所有样品类型进行归一化。我们从花形成前的幼年(<3cm)雄穗、减数分裂前的花药(<1mm)、幼年(<3cm)雌穗原基和未受精的R1阶段籽粒中收集样品。
如图41所示,通过qRT-PCR示出了选择性标志物基因PMI的表达,PMI基因在所有构建体的所有事件中表达。虽然在不同花组织间的水平不同(花药最丰富),但事件和构建体之间的水平相当等效。如图42所示,经由qRT-PCR示出了核酸酶Cas9的表达,Cas9基因在所有构建体的所有事件中表达,尽管对于24269,在所有组织类型中的表达都相当低。这可能是由于构建体24269使用prZmAGO18a,其对生发细胞(减数分裂前细胞)具有特异性,而与这些组织的所有体细胞相比,生发细胞非常少。因此,可以通过从整个花序中提取总RNA来稀释Cas9信号。相比之下,使用prZmBde1-02(24320)和ZmAP1-01(24301)的Cas9在花组织(包括雄性和雌性(雄穗、花药、穗和籽粒)中具有高表达。它在构建体的不同事件之间相当等效。
实例5:在启动子修饰情况下保持FMOS启动子功效
根据申请人的教导,例如像上文实例1-4中所例示的,FMOS启动子可以易于修饰并且仍然保持FMOS活性。举例来说,prZmBde1被修饰以去除缺乏显著的花转录因子结合基序并且不在紧邻转录或翻译起始位点的上游或下游的结构域。为了测试这些结构域是否对FMOS活性是非必需的,我们去除了它们,然后重建构建体并通过与实例2和3中描述的相同方法重新测试它们。例如,我们通过从构建体25002中prZmBde1-02(SEQ ID NO:538)内的内含子(iZmBde1-01)中去除1,696bp来构建启动子prZmBde1-03(SEQ ID NO:615)。我们产生了十个事件,并且有8/10个事件在叶中显示没有编辑(Taqman测定为2,这意味着ADH1的两个拷贝都未经编辑)。在这八个事件中,有7个事件在大多数小穗样品中的ADH1花粉测定主要呈阴性(显示出良好的编辑程度)(表17)。在这七个事件中,我们对三个事件(GVG01189795、GVG01189803和GVG01192964)进行了NGS,并发现平均镶嵌性得分为11.72。
表17.来自构建体25002的十个事件的叶测定和花粉ADH1染色得分ZmBde1-02启动子的截短形式,其中去除了内含子的很大一部分。
我们从三个事件(GVG01189795、GVG01189803和GVG01192964)中萌发了100个自花授粉的T1后代,并对一个子集的靶位点进行了PCR测序。我们发现了来自T1雄性和雌性花序的几十种不同的编辑和广泛多样的编辑结果。如下表18所例示(来自事件GVG01189803),我们发现不同的个体通常在50%的读段比例中包含多种编辑:换句话说,T1植物通常是双等位基因,接受了两种不同的编辑-一种来自雄配子体(花粉衍生或雄穗衍生),另一种来自雌配子体(卵衍生或雌穗衍生)。在某些情况下,从雄性和雌性接收到的编辑在这些T1后代中是相同的。
表18.在启动子25002、事件GVG1189803中的T1编辑结果。
对于构建体25002,T0雄穗镶嵌性得分和T1多样性基本上等同于实例4中未截短的启动子。因此,prZmBde1-02和prZmBde1-03(短40%)大致相当于FMOS启动子。
有趣的是,当我们以稍微不同的方式截短ZmBde1-02启动子时,在构建体25003(SEQ ID NO:539)中,我们获得了另一种有效的FMOS启动子。在构建体25003中,我们包括启动子prZmBde1-04(SEQ ID NO:616),其从prZmBde1-02内的内含子(iZmBde1-01)中去除了2,337bp。在总长度上,该启动子小于ZmBde1-02长度的60%(由于在截短的启动子prZmBde1-04中去除的内含子2中的大间隙,比对将显示小于60%的相似性)。尽管这个大的缺失片段,我们发现12/12个事件在叶中没有编辑(保持特异性),并且在大多数小穗样品中,7个事件的ADH1花粉测定主要呈阴性(显示在雄穗中的编辑程度良好)(表14),而通过ADH1测定,5/12个事件未显示在雄穗中的良好编辑。
表19示出了来自构建体25003的10个事件的叶测定和花粉ADH1染色得分,该构建体含有prZmBde1-04,其是ZmBde1-02启动子的截短形式,其中内含子的很大一部分被去除,被去除的部分构成了总prZmBde1-02调控序列的40%以上。
表19
通过ADH1染色,在雄穗中具有强编辑的7个事件中,我们对四个事件(GVG01191002、GVG01191008、GVG01191010和GVG01191012)进行了NGS并发现镶嵌性。我们从三个事件(GVG01191002、GVG01191010和GVG01191012)中萌发了100个自花授粉的T1后代,并对一个子集的靶位点进行了PCR测序。我们在这些事件的自花授粉后代中发现了超过20种不同的编辑。如下表20中对于事件GVG01191002所例示的,我们通过PCR-seq,仅在15个后代中发现了九个不同的等位基因。在大多数情况下,发现的编辑是不同的(双等位基因T1),尽管在一些情况下它们是相同的(纯合T1后代)。
表20汇总了构建体25003事件GVG01191002的T1 PCR测序数据,示出了15个后代中的ADH1靶位点编辑。
表20
在又另一个实例中,我们从启动子prZmBde1-02的最开始处去除了300bp以及从第一内含子中去除了1,696bp,以获得构建体25006(SEQ ID NO:542)中的prZmBde1-07(SEQID NO:619)。产生了17个事件,并且所有事件都没有叶编辑证据,而通过雄穗ADH1染色,15/17个事件显示至少达到中等水平的编辑(表21),且基于ADH1染色,5/17个事件显示高度的编辑。事件GVG01195902、GVG01195903、GVG01195904、GVG01195891和GVG01195894平均有14%的染色,假设小百分比的未染色花粉是死亡的(这可以从其中约10%的花粉未染色的阴性对照[WT花粉]看出),那么算出大约75%-85%的花粉经编辑。对来自事件GVG01195902、GVG01195904和GVG01195894的相应雄穗样品进行了NGS,并且这些样品产生的平均镶嵌性得分为11.88。
表21示出了来自构建体25006的十个事件的叶测定和花粉ADH1染色得分,该构建体是ZmBde1-02启动子的截短形式,其中内含子的很大一部分被去除,并且启动子5′末端的前300bp也被去除。
表21
使来自事件GVG01195902、GVG01195904和GVG01195894的100个T1自花授粉后代萌发并对子集的gRNA靶位点进行PCR测序。我们在这些事件的自花授粉后代中发现了超过20种不同的编辑。在大多数情况下,发现的编辑是不同的(双等位基因T1),尽管在一些情况下它们是相同的(纯合T1后代)。
将这些经修饰的启动子结果与构建体24320(prZmBde1-02)进行比较,我们发现通过所有措施,T0叶编辑、花粉染色、NGS多样性、E1多样性和镶嵌性得分不会影响FMOS活性。一个小小的例外是我们确实看到构建体25003中FMOS活性的下降,该构建体去除了8bp序列,该序列对应于稻转录因子Leafless1(LFL1)的假定转录因子结合基序。有趣的是,如果考虑所有Bde1启动子探索,很明显甚至不需要整个内含子-事实上,您可以去除内含子的很大一部分,并且启动子仍然可以作为FMOS启动子。此外,至少不需要我们最初在prZmBde1-02中捕获的启动子的前300bp。可以移除内含子的很大一部分,2,337bp(prZmBde1-04)并仍然获得不错的FMOS活性,尽管镶嵌性得分确实下降了几个点,这可能是由于缺少OsLFL1位点。图38说明了截短的启动子的概述。总而言之,25002的平均得分为11.7(相比于25320为11.8);25003的得分为9.1;25006的得分为11.9。构建体25004和25005在转化或编辑频率方面表现不佳。
如所见,使用实例1-5开发的FMOS启动子可以很容易地以多种方式被修饰并且仍然保持FMOS启动子功效。此外,可以使用本文披露的方法容易地确定对使用实例1-5鉴定的FMOS启动子的修饰是否对FMOS活性具有负面影响。例如,在构建体24460中,稻AP1调控序列作为FMOS启动子表现良好,然而,在prOsAP1-02(构建体25007)中,我们去除了内含子的很大一部分;在prOsAP1-03(构建体25008)中,我们去除了启动子的很大一部分;在prOsAP1-04中,我们去除这两个部分(从内含子和启动子中)。在所有这三个构建体中,FMOS活性都降低了,因为一些事件在叶中显示出编辑(ADH1叶taqman测定得分为0或1)。然而,通过ADH1花粉染色、雄穗小穗样品NGS和T1后代分析的进一步表征后,在叶Taqman测定得分为0的某些情况下,FMOS活性明显保持。例如,在构建体25007中,13个事件中的12个的叶Taqman测定得分为0或略高于0,这表明在叶中的一些编辑。我们假设这意味着芽分生组织也已经编辑过,因此雄穗和穗不会是镶嵌性的。然而,如果我们查看花粉染色数据,我们会看到一些样品保留了ADH1活性-例示了FMOS活性,而不是我们通常在组成型启动子情况下看到的(表22)。
表22示出了花粉ADH1染色测定数据。这些板的孔中显示的百分比是采样的花粉为ADH1+的比例。
表22
此外,我们查看了来自事件GVG01195930的T1数据,其在T0叶Taqman中得分为0,我们发现在下表23中汇总的主要双等位基因后代中的存在广泛多样的编辑。
表23
类似地,构建体25008,事件GVG01195946,产生了镶嵌性得分为4.97的花粉NGS数据和显示非常广泛多样性的编辑的T1数据(表24)。表24汇总了来自事件GVG01195946的E1编辑的多样性,该事件是prOsAP1的截短形式,即prOsAP1-03,其从启动子中去除了约1kb。
表24
类似地,使用经修饰形式的prOsAP1(SEQ ID NO:622)的构建体25009(SEQ ID NO:545)去除了启动子的超过52%(从4.6kB启动子中总共去除了2.4kB),并且所有这四个事件都产生了良好的编辑多样性,并且NGS数据显示大量编辑/样品。对于NGS数据的小实例,参见表25;此事件GVG01195812的镶嵌性得分为5.92。对于GVG01195906,得分为6.38,对于GVG01195915,得分为5.63。表25汇总了事件GVG01195812的NGS数据,其显示出叶中的一些编辑,但仍保留了FMOS活性,如该表所证明的,其中在雄穗中发现了广泛多样的编辑;在每个花粉样品中发现了至少5或6种编辑。该事件的镶嵌性得分为5.92。
表25
总而言之,截短的启动子prOsAP1-01保持了FMOS活性。图39示出了在以下构建体中截短的启动子prOsAP1:在构建体25007中(平均镶嵌性得分为4.9);在构建体25008中(平均镶嵌性得分为4.9);以及在构建体25009中(平均镶嵌性得分为6.0)。与构建体24460的基线(6.0)相比,这些都是良好的表现。
通过另一个实例,prZmAP1-01(SEQ ID NO:2)被修饰以去除缺乏显著的花转录因子结合基序并且位于启动子中的结构域。为了测试这些结构域是否对FMOS活性是非必需的,我们去除了它们,然后重建构建体并通过与实例2和3中描述的完全相同的方法重新测试它们。例如,我们通过从构建体24997的prZmAP1-01启动子(SEQ ID NO:537)中去除1,746bp(46%)来构建启动子prZmAP1-03(SEQ ID NO:614)。我们产生了11个事件,其中8个事件在叶Taqman测定中的得分为“2”(即它们没有被编辑),通过ADH1花粉评估,其中5个事件在雄穗阶段看起来没有被编辑(参见下表26),而三个事件看起来像它们具有FMOS活性。此外,一个事件的叶Taqman为“0”,并且具有看起来像组成型启动子的花粉ADH1染色(所有样品均为“0”)。两个事件在叶测定中得分为“1”。
表26示出了来自构建体24997(截短的prZmAP1)的11个事件的ADH1染色数据。得分代表每个样品的ADH1染色呈阳性的花粉粒的比例。
表26
通过ADH1花粉染色,三个事件GVG01189786、GVG01189784和GVG01189781的得分为“2”并且具有良好的FMOS表观活性。后两者被送至进行雄穗小穗NGS和T1后代分析。此外,对Taqman测定得分为“1”(杂合)的并通过ADH1染色得知保持FMOS活性的事件GVG01189790进行雄穗小穗NGS。三个事件的镶嵌性得分相似,但GVG01189790最低(4.33),其次是T0阶段FMOS指标较好的事件(GVG01189781为4.75,GVG01189784为5.58)。在T1分析中,从这两个事件中的每一个的后代中都可以看到许多不同的编辑。存在与对于原始prZmAP1-01所见到的的值相似的值。
将原始启动子的镶嵌性得分与其截短形式进行比较(图26c),您可以看到prZmAP1-01(构建体24301)和截短的prZmAP1-03(构建体24997)之间的得分没有变化;prZmBde1-02与prZmBde1-03和prZmBde1-07(分别为25002和25006)之间的得分没有变化,而prZmBde1-04(25003)的得分略有下降;prOsAP1-01(24460)与prOsAP1-02、prOsAP1-03和prOsAP1-04(分别为25007、25008和25009)之间的得分变化不大,只是25008略有下降。
我们还使用不同的公式(镶嵌性方法2)重新计算镶嵌性得分,以重新检查所有构建体的NGS数据集的结果。如前面所述,我们对每个等位基因类型(或编辑类型)使用了雄穗图。从每个穗的底部开始,第一个突变总是被视为独特突变。从第一个突变向上移动,其他突变仅在突变丰度与前一个小穗样品的差异超过15%时才计算在内。丰度<10%的突变也服从此规则(此前,它们被排除在该规则之外;参见实例4)。对于每个事件,计算独立编辑的总数(跨所有编辑),并将结果值除以经NGS评估的样品总数。因此,此‘镶嵌性得分’代表了每个小穗样品的独特编辑的平均值。计算每个事件的镶嵌性得分。图26d示出了使用镶嵌性方法2(其更保守并且可能低估实际编辑多样性)的镶嵌性得分-总体趋势与前面相同。表26d示出了使用镶嵌性方法2的镶嵌性得分,该方法使具有<10%丰度的编辑经受<15%相邻规则(参见上文和实例4以进行解释)。除非另有具体指示,否则权利要求中的所有镶嵌性得分均使用镶嵌性方法1计算。
下文提供了包含根据本发明各种实施例的表达盒的示例性载体构建体的详细描述。
下文总结了截短的启动子和内含子。
实例6:经由FMOS启动子驱动Cas9进行有效等位基因替代(同源定向修复)
本发明的实施例还可用于等位基因替代,包括提高等位基因替代的效率。下文描述了适合于等位基因替代的五种构建体。所有五种设计都使用相同的供体DNA和指导RNA序列,该指导RNA序列靶向5号染色体上的除草剂耐受乙酰乳酸合酶(ALS)基因GRMZM2G143008。供体DNA含有大约1000bp的序列,与内源性玉蜀黍基因具有高度同源性。靠近供体序列中心的是一些在供体和内源序列之间不同的SNP,包括诱导ALS编码序列的氨基酸568从色氨酸变为亮氨酸的SNP。这种熟知的突变赋予了对广谱的常见除草剂的抗性。因此,ALS靶的使用提供了编辑(等位基因替代)成功的显性遗传特征。可以针对以下六种构建体设计中的每一种进行若干事件,并且T1后代并用咪草烟除草剂(312ml/ha Pursuit)喷洒。对那些在除草剂处理中幸存下来的植物进行取样,并对假定的等位基因替代等位基因进行扩增和测序。
第一种设计是使用FMOS启动子来驱动Cas9的表达,以具有从稻U3启动子驱动的指导RNA,并提供DNA供体的拷贝用于在T-DNA载体中进行同源驱动修复。可替代地,可以包括在T-DNA中DNA供体侧翼的指导RNA靶位点,使得供体可以从T-DNA插入位点中释放出来,并可用作靶位点处同源定向修复的修复模板(例如在ALS基因中)。例如载体构建体25123(SEQID NO:88)。
第二、第三和第四种设计使用两种不同的FMOS启动子:一个驱动Cas9的表达(优选地,该启动子在雄性和雌性生殖器官(花药和心皮)之一或两者中的减数分裂前或减数分裂期间有活性);另一个启动子用于驱动剪接mRNA的表达,该剪接mRNA产生来自玉米线条病毒属(Mastrevirus)的反式作用复制因子Rep和RepA。在此实例中,我们使用小麦矮化病毒Rep/RepA编码序列(参见下文的设计)。Rep/RepA引发供体DNA的滚环扩增,供体DNA位于同一病毒的长基因间区(LIR)和短基因间区(SIR)之间,在这里通常可见迁移蛋白基因和衣壳蛋白基因。我们在LIR和SIR之间放置了ZsGreen序列,这里通常是Rep/RepA基因所在的位置。ZcGreen和DNA供体的确切位置可能会有所不同;例如,他们的位置可以互换。
Rep/RepA的表达可由组成型启动子驱动,但更典型地是由FMOS启动子驱动。这可能有用,因为在某些情况下,RepA表达的持续诱导与对整体植物适应性、健康和种子生产的负面影响相关。在许多实例中,Rep/RepA在生发细胞谱系中的非常短的时间窗口期间表达,然后正当Cas9、Cas12a或其他靶向核酸酶的表达开启时关闭(通过使用第二FMOS启动子)。这种设计将Rep/RepA的表达限制在较短的时间窗口(防止对植物的毒性)但在核酸酶表达之前,允许有足够的时间在靶基因开始编辑之前扩增DNA供体。在许多实例中,在编辑核酸酶(Cas9)之前大约一或两天,或甚至仅仅几个小时表达Rep/RepA。在下文的设计中,早期花药原基特异性证实的FMOS启动子prZmAGO18A(其特别在花药和胚珠的生发细胞中具有低或中等表达)用于驱动Rep/RepA基因的表达。Cas9核酸酶的表达受prZmBde1-02启动子的调控区控制,该启动子在花特化、减数分裂前和减数分裂期间有活性。该构建体还含有我们想要用于等位基因替代的DNA供体序列,该DNA供体序列包括与天然靶基因座中的切割位点具有高度序列相似性的同源臂,以及同一环中的LIR、ZsGreen和SIR序列。RepA蛋白的作用将通过滚环扩增导致扩增,从而导致大量单链DNA供体分子,这些分子可能因宿主DNA聚合酶的活性而变成双链。当是双链时,环可以被Cas9和指导RNA切割(参见载体AR-SDN2_REP_NoCut(图33)(AR-SDN2_REP_NoCut(SEQ ID NO:186)。任选的一个或多个指导RNA靶位点也可以位于供体序列的侧翼,如载体AR-SDN2_REP_2Cuts(图32)(SEQ ID NO:#187)和载体AR-SDN2_REP_1cut(图31)(SEQ ID NO:188)中-这些位点可以被核酸酶切割,线性化和/或释放环状供体,这可以使其适合在Cas9切割靶位点后可以参与重组(同源定向修复)。下文示出了SEQID#XYZ(AR-SDN2_REP_CUT)的特征图。在一些实施例中,还期望使驱动RepA的启动子以低于驱动CRISPR的启动子的50%表达。例如,在观察到植物毒性或希望增加事件产生率的实施例中,可能希望降低RepA的表达。
在另一个实例中,使用在花发育的非常短的窗口期间驱动表达的MSCA1(MS22)启动子(prZmMSCA1-01)(SEQ ID NO:717)(GRMZM2G442791)和终止子1ZmMSCA1-01(SEQ IDNO:718)以表达Rep/RepA。这种表达很快就会关闭,因为此基因只负责花药和胚珠中生殖细胞的特化。几个小时后,prZmAGO18A FMOS启动子开启Cas9在减数分裂前阶段的花药和胚珠中刚刚分化的生发细胞中的表达。在其他设计中,FMOS启动子prOsMEL1(SEQ ID NO:41或42)和终止子tOsMEL1(SEQ ID NO:44或45)用于驱动靶向核酸酶的表达。在另一个设计中,来自以下基因的高表达的假定FMOS启动子和终止子:具有prZmPPG4-01(SEQ ID NO:719)和tZmPPG4-01(SEQ ID NO:720)的蛋白磷酸聚糖4(ppg4)(GRMZM2G032528);具有启动子(SEQID NO:721)和终止子(SEQ ID NO:722)的NADH脱氢酶(GRMZM2G158188);或具有启动子prZmCID11(SEQ ID NO:723)和终止子tZmCID11(SEQ ID NO:724)的CID11(GRMZM2G173428)可用于驱动核酸酶的表达(高度表达、非常富集的生发细胞基因)。在又另一个设计中,可以从下面这篇关于花中初始生发细胞群的文章来源(Kelliher和Walbot(2014)GerminalCell Initials Accommodate Hypoxia and Precociously Express Meiotic Genes[生发细胞初始适应缺氧并早熟地表达减数分裂基因]Plant Journal[植物杂志]77(4)639-652.)中鉴定出许多花和生发细胞特异性基因,并且从此来源中,选择了两个:理想情况下,低表达或中等表达的高度特异性基因,其可用于驱动Rep/RepA的表达,其在发育中该基因比第二启动子稍早具有活性,第二启动子以更高的水平表达并用于表达核酸酶。
图27说明了一个实施例,包括使用位于LIR和SIR之前的供体序列侧翼的一个指导RNA靶位点。花中RepA和Cas9的顺序激活触发高拷贝供体DNA,其通过同源重组可用于靶位点的等位基因替代。在这种情况下,在ALS靶基因(5号染色体上的GRMZM2G143008)中显示出靶位点。该版本有一个gRNA切割位点,可将扩增的DNA供体复制子线性化。
图28说明了另一个实施例,其类似于图27的实施例,但在位于DNA供体序列侧翼的复制子中包括两个指导RNA靶位点。这将在被Cas9和guideRNA切割后,从LIR、ZsGreen和SIR序列中完全释放扩增的DNA供体。
图29说明了另一个实施例,其类似于图27的实施例,不同之处在于供体DNA的侧翼没有gRNA靶位点,从而使扩增的供体序列保持环状,并且未被线性化。
图30说明了另一个实施例,其也使用了两个FMOS启动子,但在这种情况下没有病毒元件。相反,第一个FMOS启动子(prAGO18a-01)驱动逆转录酶(RT)酶的表达,该酶与反转录子RNA(例如Ec86)特异性相互作用,而第二个FMOS启动子驱动Cas9或另一个靶向核酸酶(SEQ ID AR-SDN2_RETRON)的表达。该构建体中的供体DNA是在细胞中通过逆转录从反转录子-供体RNA-指导RNA嵌合转录物产生的,该嵌合转录物受稻U3启动子的控制。反转录子序列和供体RNA的逆转录导致供体DNA序列与指导RNA共价连接。这种使用反转录子进行等位基因替代的方法,也称为CRISPEY(Sharon,E.,Chen,S-A.A.,Khosla,N.M.,Smith,J.D.,Pritchard,J.K.,and Fraser,H.B.(2018)FUNCTIONAL GENETIC VARIANTS REVEALED BYMASSIVELY PARALLEL PRECISE GENOME EDITING[大规模平行精确基因组编辑揭示的功能性遗传变异]Cell[细胞]175(2):544-557)将丰富的供体DNA递送到靶位点处形成指导RNA和Cas9双链断裂的位点。在此实例中,在胚胎或愈伤组织阶段,我们使用FMOS启动子来提高等位基因替代成功的效率,而不是标准使用CRISPEY(推测这种方法仍然非常低效并且可能具有植物毒性)。图44说明了载体AR-SDN2_RETRON(SEQ ID NO:697)的示意图,其是根据本披露的各个方面的另一个基于反转录子的实例。
上文讨论的图32示出了载体AR-SDN2_REP_2Cuts(SEQ ID NO:187)的示意图,其是适合于等位基因替代的载体的一个实例。在下文的注释中进一步描述了载体AR-SDN2_REP_2Cuts的附加特征。
构建多个构建体以使用含有供体DNA的复制子测试不同的等位基因替代设计,该复制子任选地侧接指导RNA靶位点、由一个FMOS启动子控制的Rep或RepA基因盒、和由另一个FMOS启动子驱动的Cas9或另一个核酸酶盒,以及选择性标志物盒。如通过测量在稳定转化植物(T0植物)中产生的编辑频率和在后代(T1植物)中产生的成功等位基因替代的数量所描述的来确定这些优选构建体中的等位基因替代频率。这些构建体中的指导RNA靶向乙酰乳酸合成酶(ALS,GRMZM2G143008)基因的外显子2,其靶位点序列为5′-CAAGTATGTGTGCGCTCTGT-3′(SEQ ID NO:6)。选择性标志物是在组成型启动子控制下的磷酸甘露糖异构酶(PMI),甘露糖选择用于重新获得稳定转化的玉蜀黍自交系NP2222的植株。对于每个构建体,在幼苗取样确认ADH1靶位点没有编辑后,鉴定出大约10个单拷贝T0事件,并使其生长至成熟。还通过qRT-PCR检查了PMI和Cas9在叶中的表达。使植物异交并自花授粉。
进行胚胎拯救,然后进行等位基因替代成功的Taqman检测,或者种植成熟的种子并用标准浓度的除草剂如Pursuit(例如咪草烟)以至少200mL/ha的浓度喷洒发芽的植物,以确定植物存活的频率(因为存活可能是由于成功的等位基因替代)。采集样品并通过Taqman测定进行测试,以确定供体是否替换了靶序列:如果呈阳性,则表示可能成功替换。对这些存活者进行测序以确认它们确实代表了完全SDN2编辑的等位基因。
如上所述,这种等位基因替代在植物中可能非常具有挑战性,例如因为非同源末端连接途径非常有利于DNA修复。通过使用FMOS启动子来驱动编辑机制,人们可以克服上述挑战并在大多数T0事件中容易生成等位基因替代。申请人的披露可用于节省大量时间和大量资源成本。与现有技术相比,通过使用本技术(在一些实例中)可以相对容易地进行五到十个事件并恢复T1代中的等位基因替代。这种改善(至少部分)可能归因于两个因素。首先,通过生成具有成百上千至成千上万个编辑的镶嵌性T0植物,每个T0植物明显有更好的机会产生至少一个或多个具有等位基因交换的T1种子。种子中遗传的突变的多样性减少了过程中整体所需的精力和财力——可以简单地进行一些事件并筛选种子以进行正确的编辑。然后可以根据需要使用测序进行筛选。与产生1000个T0事件相比,测序1000个T1种子所需的时间、财力和劳动力更少。这主要是因为测序相对快速且便宜。简而言之,FMOS调控系统,特别是FMOS启动子提供了显著的优势。FMOS启动子可以提高等位基因替代效率的第二个原因是同源重组机器可以在减数分裂之前和期间在生发谱系细胞中表达。等位基因替代需要这些促进同源修复的因子,但是当大多数组成型启动子将表达Cas9并进行编辑时,这些因子在愈伤组织或营养组织中表达不是很高。由于至少这些原因,申请人认为FMOS启动子在等位基因替代方面明显优于组成型启动子。
示例性实施例:
1.一种用于在植物的T1种子中产生多个独特等位基因替代的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码DNA修饰酶的核酸,
任选地,编码至少一种指导RNA(gRNA)的核酸,
目的核酸(供体DNA),
可操作地连接至供体DNA以驱动供体DNA复制的复制启动子,
以及
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的至少一个中介导独特等位基因替代;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子含有多个独特的等位基因替代。
2.如1所述的方法,其中所述DNA修饰酶是定点核酸酶,所述定点核酸酶选自由以下组成的组:大范围核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)、Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、嵌合FEN1-FokI和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
3.如1所述的方法,其中
所述DNA修饰酶是Cas9核酸酶或Cpf1核酸酶,以及
所述至少一个表达盒包含编码gRNA的核酸,其中所述编码gRNA的核酸可操作地连接至FMOS启动子或第二启动子。
4.如以上中任一项所述的方法,其中所述至少一个表达盒进一步包含至少一个LIR。
5.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有等位基因交换。
6.如5所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
7.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
8.如以上中任一项所述的方法,其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在营养组织中表达更多,以及其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(相对量,例如多至少2倍、多至少3倍,这与其他实施例中描述的相同)。
9.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
10.一种FMOS启动子,其可以选自本文中描述的那些。
11.一种FMOS终止子,其可以选自本文中描述的那些。
12.如以上中任一项所述的方法,其中所述多个独特等位基因替代包括以下中的至少一项:至少5个、至少10个、至少15个和至少20个独特等位基因替代。
13.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
14.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个等位基因替代。
15.如以上中的任一项所述的方法,所述方法进一步包括测量在T0植物的T0花、T0雄穗和种子中的至少一个中的编辑的数量。
16.如以上1-15中任一项所述的至少一个表达盒。
17.一种植物,所述植物通过如1-15所述的方法产生。
18.一种植物细胞,所述植物细胞含有如16所述的至少一个表达盒。
实例7:经由FMOS启动子(启动子重击(Bashing))进行有效表达改变
本发明的实施例还可用于改变基因的表达。例如,驱动工程化的核酸酶的FMOS启动子可以与靶向该基因调控区(启动子、终止子、5′或3′非翻译区、内含子、顺式增强子或顺式阻遏因子)的多个指导RNA配对。
因此,构建体具有在花中在基因调控区的多个位置诱导新突变的能力,从而产生该调控区的小的和大的插入缺失,以及在某些情况下的重排。这会对基因的调控方式产生许多影响。在一些生发谱系中,并由此在一些T1后代种子中,这将导致在不同遗传背景下基因的组织特异性或性能的稳定的下调、稳定的上调或改变。将多个指导RNA设计到基因调控区的想法称为启动子重击,但使用FMOS启动子可以实现显著改进。因此,驱动Cas9的FMOS启动子(或FMOS调节区)与启动子重击概念的组合是相对于使用组成型启动子进行的启动子重击的重大改善。有关启动子重击的背景信息参见Rodrl′guez-Leal等人,2017,Cell[细胞]171,470-480,2017年10月5日。
传统的启动子重击概念涉及产生一个区域的大的编辑多样性。本披露通过使用FMOS启动子以更加有效和更快速地并以最少的交叉努力产生多样性来改善启动子重击。
为了证明经由FMOS启动子进行的有效表达改变,使用玉蜀黍APETALA1(ZmAP1)启动子生成构建体以驱动Cas12a活性,其与靶向以下调控序列的多个指导RNA配对,这些调控序列介导转基因表达,所述转基因编码5-烯醇丙酮莽草酸-3-磷酸酯(EPSP)合酶(EPSPS),这赋予对除草剂草甘膦的抗性。在此事件中,EPSPS基因的调控序列包括玄参花叶病毒(FMV)启动子的增强子(eFMV)、花椰菜花叶病毒35S启动子的增强子(e35S)、玉蜀黍ubi1启动子(prZmUbi158)和烟草花叶病毒的Ω5'UTR前导序列(eTMV)。本实验的目的是确定使用FMOS启动子编辑一些增强子或启动子序列是否可以产生一系列新的EPSPS表达等位基因。我们鉴定了共计八种指导RNA,旨在与核酸酶Cas12a配对。这八个指导RNA应该能够对EPSPS转基因的调控序列产生独特的编辑:两个针对eFMV增强子、两个针对e35S增强子、三个针对prUbi158启动子、以及一个针对eTMV翻译增强子。在构建体中,指导RNA的表达由来自甘蔗的组成型Ubi4启动子驱动,其中每个指导RNA侧接两个可自我切割的核酶(锤头状和HDV),以进行有效处理。载体还含有PMI作为选择性标志物。
构建体25068(SEQ ID NO:535)是二元CRISPR构建体,其靶向JHAX背景中的EPSPS事件以降低EPSPS性状基因的表达水平。内切核酸酶LbCas12a(以前称为LbCpf1)的表达由玉蜀黍Apetala1启动子(prZmAP1-02)和终止子(tZmAP1-01)驱动,用于在早期和晚期雄性和雌性花序中进行特异性表达。crRNA盒含有8个多重crRNA,其由甘蔗泛素4启动子prSoUbi4-02驱动;靶向eFMV、e35S、prZmUbi158和eTMV,其中每个crRNA侧接两个可自我切割的核酶(锤头状和HDV),用于高效指导RNA处理。
我们通过农杆菌介导的未成熟胚胎转化,用构建体25068并遵循标准方案转化了对事件转基因是纯合的NP2222植物。几个事件被送到温室,生长到成熟,并与“野生型”植物回交以产生BC1(回交1)代种子。在通过胚胎拯救或种植获得的BC1幼苗中重新获得了不同的突变集。使用设计用于检测五个靶中的编辑的靶特异性Taqman测定进行DNA提取和分析(详见表27)。在来自携带构建体25068的事件UR228452062(也称为GVG01191245)的回交雌穗的幼苗中鉴定出三种独特的编辑模式。我们分离了100个胚胎,但有几个没有发芽,因此我们最终仅对30株植物测试了Taqman测定。在这30株植物中,编号为3、78和92的植物各含有单个突变。植物3在35S增强子位点含有2bp缺失。植物78在FMV靶位点1中含有8bp缺失。植物92在FMV靶位点1中含有5bp缺失。这些植物都有FMOS编辑盒的单个拷贝,并且具有在这个回交事件的后代中重新获得的不同的编辑。
表27
还有许多以这种方式创建并在BC1中重新获得的其他经编辑的等位基因。因此,对于EPSPS基因的启动子,我们创建了不同的等位基因集。含有这些等位基因的植物被送入温室并生长至成熟并使其自花授粉。在BC1-(自交)代中,携带这三个新表达等位基因的纯合植物将与野生型和原始EPSPS事件一起生长,并且可以通过qRT-PCR评估其在不同事件中由不同编辑集导致的表达变化。然后可以进一步检查具有降低的表达的品系(例如,使用农艺学测定和除草剂应用来检查那些植物的耐受水平和农艺学性能,与原始构建体相比)。
示例性实施例:
1.一种用于改变植物T1种子中靶基因表达的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码DNA修饰酶的核酸,
编码至少一种指导RNA(gRNA)的核酸,其中所述至少一种指导RNA靶向所述靶基因的调节区,和
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的至少一个中介导所述靶基因的所述调控区中的多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子在靶基因的调控区中含有多个独特编辑,从而产生多个靶基因表达谱。
2.如1所述的方法,其中所述多个独特编辑选自由以下组成的组:多个独特多个独特碱基插入和多个独特碱基缺失。
3.如以上中任一项所述的方法,其中所述DNA修饰酶是定点核酸酶,所述定点核酸酶选自由以下组成的组:Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、嵌合FEN1-FokI和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
4.如以上中任一项所述的方法,其中所述DNA修饰酶是Cas9核酸酶或Cpf1核酸酶。
5.如以上中任一项所述的方法,其中所述被靶向的靶基因的调控区包括启动子、终止子、5′或3′非翻译区、内含子、顺式增强子和顺式阻遏子中的至少一个。
6.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物在所述靶基因的所述调控区域中具有独特编辑。
7.如6所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
8.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
9.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
10.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
11.如1所述的方法,其中所述多个独特编辑包括以下中的至少一项:至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑。
12.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
13.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个编辑。
14.如以上中任一项所述的方法,其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在营养组织中表达更多,以及其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(相对量,例如多至少2倍、多至少3倍,这与其他实施例中描述的相同)。
15.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
16.至少一个表达盒,所述至少一个表达盒包括以上1-14中所述的组分的任何组合。
17.一种植物,所述植物通过如1-14所述的方法产生,其中所述植物具有改变的表型。
18.一种植物细胞,所述植物细胞含有如15所述的至少一个表达盒。
实例8:拟南芥启动子
本发明的实施例也可用于拟南芥。例如,人们可能会寻找在具有相似的表达模式(这些物种典型地只有花或FM表达)的大豆和番茄中具有同源性的高表达/假定的性母细胞特异性拟南芥基因。理想的实例包括在性母细胞和花药中高度表达但在幼苗和顶端分生组织(SAM)中低/关表达的基因。还可以检查在大孢子母细胞中的表达。可以通过挖掘来自以下文件的归一化表达数据来鉴定高表达或性母细胞特异性拟南芥基因:Dukowic-Schulze,Anthony Harris,Junhua Li,Anitha Sundararajan,Joann Mudge,Ernest F.Retzel,Wojciech P.Pawlowski,Changbin Chen(2014)COMPARATIVE TRANSCRIPTOMICS OF EARLYMEIOSIS IN ARABIDOPSIS AND MAIZE[拟南芥和玉米早期减数分裂的比较转录组学]JOURNAL OF GENETICS AND GENOMICS[遗传学和基因组学杂志]41(3):139-152。可以对重复数据进行平均并使用所有基因(19,509个基因)的平均数据计算分位数。例如,在这些基因中,在性母细胞中表达>90%分位数和在幼苗中表达<10%分位数的79个基因将代表假定的FMOS启动子来源。可以使用PANTHER(pantherdb.org/genes/)鉴定假定的大豆和番茄直向同源物。SAM表达可以使用来自以下的文献的数据获得:Anna V.Klepikova,ArtemS.Kasianov,Evgeny S.Gerasimov,Maria D.Logacheva,Aleksey A.Penin(2016)A HIGHRESOLUTION MAP OF THE ARABIDOPSIS THALIANA DEVELOPMENTAL TRANSCRIPTOME BASEDON RNA-SEQ PROFILING[基于RNA-SEQ分析的拟南芥发育转录组的高分辨率图谱]THEPLANT JOURNAL[植物杂志]88(6):1058-1070(通过//travadb.org/访问);可以基于报告值推测相对表达水平。可以使用表S1中的数据获得大孢子母细胞(MMC)的存在/不存在-具有在4个MMC重复中的每一个中给定的存在/不存在调用的微阵列数据来自:Anja Schmidt,Samuel E.Wuest,Kitty Vijverberg,Célia Baroux,Daniela Kleen,Ueli Grossniklaus(2011)TRANSCRIPTOME ANALYSIS OF THE ARABIDOPSIS MEGASPORE MOTHER CELLUNCOVERS THE IMPORTANCE OF RNA HELICASES FOR THE PLANT GERMLINE DEVELOPMENT[拟南芥大孢子母细胞的转录组分析揭示了RNA解旋酶对植物种系发育的重要性]PLoSBIOLOGY[公共科学图书馆·生物学]9(9):e1001155。另一个用于验证拟南芥基因表达的公开数据源是以下网站://travadb.org/browse/BaySeq/AT5G40260/RawNorm/AvNorm/Color=RCount。
在拟南芥中可以按与上述用于玉蜀黍的非常相同的方式评估候选FMOS启动子:启动子借助它们控制的基因的表达模式(在花部分富集,而在分生组织和种子中表达关闭或表达较少)来鉴定。然后将这些启动子用于驱动二元载体中的编辑机器,该二元载体被转化到拟南芥中,例如通过使用农杆菌进行花浸转化(参见构建体25231,它使用了生发细胞特异性基因MALE MEIOCYTE DEATH1[MMD1]的启动子和终止子)。使转化的植物生长至成熟并允许自花授粉,然后评估后代种子中突变的多样性。由于容易进行无毛状体(trichomeless)植物(这是与基因的两个拷贝(经编辑的纯合子)的敲除相关的表型)的视觉评分,因此可以选择靶基因GLABROUS1;然后通过PCR测序评估无毛状体植物,作为发现测试的给定启动子是否最能在转化的花中呈现FMOS活性后在随后的后代中产生大的突变多样性的方法。如先前对于玉蜀黍所述,一些实施例不仅包括启动子,还包括终止子,以及任选的第一内含子和外显子以及第二外显子的前15bp,通常对其外显子进行修饰以使其不可翻译。构建体还可以包含卡那霉素抗性盒或另一种选择性标志物以及驱动一个或多个指导RNA(例如5′-ggaaaagttgtagactgaga-3′(SEQ ID NO:714)或5′-atggactatgttcttaatca-3′(SEQ ID NO:715))的U3启动子,所述一个或多个指导RNA靶向GLABROUS1基因的编码序列或基因组中的任何其他靶。可以在卡那霉素培养基上选择转化的后代。可以鉴定以下这样的事件:这些事件被稳定转化并具有prFMOS:Cas9或prFMOS:Cas12a或其他转基因的一个或多个拷贝,但是通过Taqman测定仍然具有GLABROUS1野生型等位基因的2个拷贝,并且通过目测检查具有毛状体(无毛(glabrous)突变植物的叶上没有毛状体)。对于未经编辑的三个启动子的转化植物的百分比可以大于30%、大于50%或大于90%。可以使这些植物自花授粉,并且收获单个长角果,然后在盆中随后的后代种子发芽期间进行追踪。可以记录每盆(相当于每个长角果)无毛个体的数量,然后进行测序以确定指导RNA靶位点处的突变。或者将整批植物或来自给定长角果(来自一个花)的种子的DNA组合起来并进行NGS,然后通过跟踪这些花在植物图上的位置来计算镶嵌性得分。提供高频无毛后代和非常高的突变多样性的启动子将具有高镶嵌性得分,这将表明这些启动子对于双子叶植物是非常高质量的减数分裂阶段的FMOS启动子。
这些相同的启动子可以在大豆、番茄、向日葵和其他双子叶植物中具有同源物,它们可以根据本发明的各种实施方式使用。此外,在一些实例中,如果将拟南芥启动子(调控区)转化到那些作物中或使用这些同源基因的启动子,那么拟南芥启动子(调控区)本身将具有很大的FMOS活性。在许多双子叶植物中,这些启动子及其同源物可以互换。
拟南芥中其他高质量FMOS启动子的实例可以包括prAtAPETALA1(AT3G02310)、prAtSEPELLATA2(AT3G54340)、prAtMALEMEIOCYTEDEATH1(prAtMMD1)(AT1G66170)以及来自这些基因的向日葵、番茄、烟草或大豆直向同源物的启动子。表28中中包括了另外的实例。由于这些启动子在减数分裂细胞、以及在花药、胚珠或花中的高表达和特异性表达,以及它们在顶端分生组织(SAM)和幼苗组织中的低表达,这些启动子被特别鉴定为高质量的潜在FMOS候选物。如果能够从特定基因的表达研究中辨别出该基因在生发细胞中以高水平表达,而在前体愈伤组织、胚胎、种子、幼苗或顶端分生组织细胞中表达水平相对较低,则该基因的调控区域可能是用于测试FMOS活性的良好候选物-特别是如果可以确定启动子在花的雄性和雌性组织之一或两者的生发细胞中驱动高表达。
表28示出了拟南芥基因在减数分裂细胞和花药中高表达但在种子和顶端分生组织中低表达或表达关闭。基因的这些调控区以及它们的番茄和大豆直向同源物可用于本发明的一些实施例中。
表28
实例9:番茄FMOS启动子
通过挖掘科学文献和公开基因表达数据集中关于在花分生组织(FM)中具有高表达和在营养分生组织(VM)中低/无表达的基因来鉴定番茄(Tomato,Solanumlycopersicum)启动子候选物(表29)。番茄分生组织基因表达数据获得自ZH等人(2016)Theevolution of inflorescence diversity in the nightshades and heterochronyduring meristem maturation.[分生组织成熟过程中茄属植物花序多样性和异时性的演变]Genome Res.[基因组研究]12月;26(12):1676-1686,而愈伤组织、雌蕊、精细胞和小孢子基因表达值取自Liu L等人(2018)Transcriptomics analyses reveal the molecularroadmap and long non-coding RNA landscape of sperm cell lineage development.[转录组学分析揭示了精子细胞谱系发育的分子路线图和长非编码RNA景观]PlantJournal.[植物杂志]十月;96(2):421-437。对于每个数据集,使用所有检测到的基因的计数值的完整矩阵计算四分位数。四分位数提供了将单个基因表达值分类为低(小于第一四分位数)、中(第一和第三四分位数之间)和高(表达值大于第三四分位数)的阈值。许多靠前的候选物都属于SEPALLATA家族,但为了增加所测试启动子的功能多样性,仅从该家族中选择了一个基因。还注意到愈伤组织、雌蕊、精细胞和小孢子细胞的表达。
表29
表29.VM=早期/中期/晚期营养分生组织,TM=过渡分生组织,FM=花分生组织
SIM=合轴花序分生组织,ND=无数据;exp=表达
为筛选这三个候选番茄FMOS启动子,使用LOXA(Solyc08g014000),UFO(Solyc02g081670)、TM5/SEP3(Solyc05g015750)和TM29/SEP1(Solyc02g089200)的启动子和终止子来驱动Cas9酶的表达,并且单独使用靶向番茄ADH1基因的指导RNA(5′-gctgcggttgcatgggaagc-3′(SEQ ID NO:716)),利用拟南芥U6启动子组成型表达所述指导RNA,如实例1中对于玉蜀黍构建体24879(其用于测试prUFO/tUFO);选择性标志物大观霉素受大豆延伸因子启动子的控制。类似于实例1-4进行编辑效率和花镶嵌性的分析,不同之处在于从番茄的来自植物周围不同位置的成熟花的花药中收集样品而不是不同的雄穗样品。类似地进行T0分析、花粉/花药测序和T1幼苗序列分析。如下计算镶嵌性得分:使用收获T1种子的花/果实的位置来制作植物图,然后使用分批发芽和靶位点基因分型后的NGS结果来计算得分。
实例10:大豆FMOS启动子
通过挖掘科学文献和公开基因表达数据集中关于涉及减数分裂和/或在花序分生组织(IM)中具有特异性表达的基因的来鉴定大豆(Soybean,Glycine max)启动子候选物(表30)。对于除GmMADS28之外的所有基因,基因表达数据均来自Wang L等人RNA-seqanalyses of multiple meristems of soybean:novel and alternative transcripts,evolutionary and functional implications.[大豆多个分生组织的RNA-seq分析:新的和可替代的转录、进化和功能影响]BMC Plant Biol[植物生物学].2014;14:169。在这篇文献中,他们对11种大豆组织进行了mRNASeq分析:根尖,下胚轴,子叶,愈伤组织、第6、17和38天阶段的顶端分生组织(SAM6D、SAM17D和SAM38D),腋生分生组织(AM),减数分裂期前后的花序(IBM和IAM,分别类似于在阶段1-9和9-12时的拟南芥花序)和开放的花(OF)。根据利用所有候选基因的表达值的简单方案,将基因分为低、中或高表达:低=小于所有表达值的中点,中=处于或接近第50个百分位数,高=大于所有表达值的中点。此外,如果启动子的基因在减数分裂过程中具有高表达或在减数分裂中具有明确的作用(例如,根据其他物种的数据已知MS5和MMD1都参与减数分裂并在性母细胞中表达),则会鉴定并优先考虑这些启动子。GmMADS28的表达值获得自Phytozome、Genevestigator和来自nlm.nih.gov/pmc/articles/PMC4021551/的原位杂交数据。
表30
选择这四种大豆启动子(包括5′UTR和内含子和第一外显子)和终止子(包括3′UTR)并安装在二元盒中,用于稳定转化表达Cas9核酸酶的大豆(Glycine max)品种“Jack”。在这些载体中,使用在拟南芥EF1aA1启动子和PsE9终止子控制下的选择性标志物CP4EPSPS来选择阳性转化体。选择两种靶向大豆基因GmCenH3(Glyma.07G057300)的指导RNA:gRNA1(SEQ ID NO:515:ATACCGGATTTGCGAGAAGC)靶向第1外显子,gRNA2(SEQ ID NO:516:GAAGGAAGAAGAGGCGCAAT)靶向第4外显子。在由拟南芥和大豆U6启动子驱动的构建体中也分别包含这些指导RNA。作为对照,使用一种利用大豆GmEF(延伸因子)启动子的构建体来驱动Cas9盒的组成性表达,该构建体使用tNos终止子。
在选择和再生之后,使来自五种构建体(四种FMOS和一种组成型)中的每一个的几个假定转化的植物生长并取样用于Taqman qPCR测定,以测试转基因的存在以及检查基因中的指导RNA靶位点是否被编辑。然后将来自FMOS构建体的稳定转化但未经编辑的植物保留直至开花,并通过qPCR测定测试后代植物的靶位点突变。然后对那些具有假定编辑的植物进行测序,并检查不同突变的多样性。对于四种FMOS启动子构建体的每个事件,在后代家族中重新获得了非常大的突变多样性。相比之下,在对照构建体的后代中重新获得了极少的不同突变。
表31:构建体以及T0和T1数据的汇总
在构建体24857(图35,SEQ ID NO:513)和24925(SEQ ID NO:657)中,SpCas9基因进行大豆密码子优化,在3′末端具有NLS,并由候选FMOS启动子和终止子驱动。对于构建体24857,prGmMADS28启动子和tGmMADS28-01终止子控制Cas9表达。对于构建体24925,使用prGmMMD1启动子和tGmMMD1终止子来控制Cas9表达。这两种gRNA由拟南芥U6和大豆U6驱动,其由金斯瑞公司(GenScript,genscript.com)合成并克隆到二元载体中,该二元载体包括由拟南芥EF-1αA1启动子驱动的EPSPS,其中eFMV增强子作为选择标志物。类似地,对于24905(图36,SEQ ID NO:514),相同的SpCas9由prGmEF驱动,并且选择tNOS作为终止子。基于公开方法(Watts J.和Ganesan S.美国专利号9,758,792,2017年9月12日),使用大豆品种Jack用于转化。从EPSPS选择中存活的植物接受对cCP4EPSPSCTP2和cCas9的Taqman检查。按照以下进行Taqman检查:在ABI7900HT快速系统中,95℃持续5分钟,保持如下的40个循环:95℃持续5秒、60℃持续30秒(引物序列参见表XBOX)
表32,用于Taqman测定的序列
当两种测定中的Taqman结果均为阳性时选择植物并使其进行GH。使所有T0植物均在SBC温室中生长,温度为25℃(白天,14h)/20℃(黑暗,10h),高压钠灯提供的平均光子通量超过300mmol m-2s-1。在允许T0植物自花授粉后收获T1种子。
表33,24857T0植物和收获的T1种子的Taqman数据
表34,24925T0植物和收获的T1种子的Taqman数据
在开花期收集T0的幼叶样品。使用MagneSilTM顺磁性颗粒分离基因组DNA。一个覆盖gRNA1和gRNA2的扩增子通过CENH3正向引物(PF)(SEQ ID NO:628)和CENH3反向引物PR(SEQ ID NO:629)进行扩增。使用KOD-plus-neo(Toyobo)的PCR反应按以下过程进行:95℃持续3分钟;94℃持续15秒,63℃持续20秒,68℃持续50秒,30个循环;68℃持续2分钟。通过用CENH3 SeqF引物(SEQ ID NO:630)进行桑格测序,我们能够在一个反应中同时读取gRNA1和gRNA2靶序列。从构建体24905仅产生1株T0植物。在gRNA1基因座处没有发生编辑;在gRNA2中,编辑了一个等位基因。使用从开花时间收集的叶样品检查了来自构建体24857的三株T0植物,gRNA1和gRNA2均未被编辑。
24905T0在gRNA2基因座处的测序数据
WT GAAGGAAGAAGAGGCGC-AATAGG(SEQ ID NO:655)
编辑1GAAGGAAGAAGAGGCGCCAATAGG(插入C)(SEQ ID NO:656)
表35,24857T1植物(prGmMADS28)的发芽率
对三个事件的T1植物进行取样,并使用cCP4EPSPSCTP2和cCas9测定找出哪些植物携带编辑转基因(表35),然后通过靶位点菌落测序检查植物的编辑(平均15个克隆/样品)。用载体NTI软件来分析桑格测序数据。T1植物的测序遵循相同的过程,但使用在V3阶段收集的叶。在SYKE191119B011A的18株T1植物中,gRNA2基因座中有10种以上编辑类型(表PRR%和图QST)。由于在后代中重新获得的这种编辑类型的多样性,该事件中的启动子显然充当了优质FMOS启动子。另外两个事件显示没有编辑。
这些植物都是1或2个拷贝Cas9。在检查的45株E1植物中,20株没有Cas9或编辑,23株有Cas9转基因的1个拷贝并且其中的16株在一个等位基因(杂合)中被编辑,2株有Cas9转基因的2个拷贝并且其中两者都被编辑(再次,杂合)。基于无法在没有Cas9的T1中找到编辑(并且基于T1中不存在嵌合性),我们怀疑在受精之前的花发育的配子体阶段已经触发编辑(雄性、雌性或两者)。这可能反映了启动子的真实活性,尽管它也可能低于实际所做的编辑-因为这些编辑是在一个重要的发育基因(CenH3)中进行的,许多实际所做的编辑可能会由于经编辑的等位基因无法通过雄性或雌性生殖谱系传播,或由于花或种子在经编辑的植物部位中未能发育而丢失。
表36.经编辑的SYKE191119B011A T1植物在gRNA2基因座处的Taqman和测序数据
图36说明了24857T1在gRNA2基因座处的测序数据。此外,在gRNA1基因座处进行了编辑,尽管与gRNA2相比,gRNA1的整体编辑效率较低;在来自SYKE191119B011A的25株转基因T1植物中,在gRNA1基因座中仅鉴定了4种编辑类型(表37)。
表37,经编辑的SYKE191119B011A T1植物在gRNA1基因座处的测序数据
检查启动子prGmMMD1(构建体24925)(图34),通过种子产生维持了七个事件,并且在幼苗或早期开花期,所有七个事件在T0叶中都没有任何编辑。在T1代中,表38描述了种植的种子数量(该构建体中的种子产量通常高于前两个)、进行Taqman的发芽和取样的数量以及Cas9转基因呈Taqman+的T0植物的数量,以及经编辑的植物的数量(尽管仍有几株植物未被测序-我们没有检查每一株)。
表38,24925株T1植物和gRNA2基因座中经编辑的T1植物的发芽率
在事件SYKE191900A005A的T1后代中,我们在34株植物中在gRNA2基因座中鉴定了4种突变类型(图8)。大多数经编辑的T1植物具有至少一个CenH3的WT等位基因,因此表型与WT植物相似(图37)。图37是展示SYKE191900A009A的T1植物表型的照片
表39,SYKE191900A005A的T1植株在gRNA2基因座处的测序数据
WT AGGCTCAGGGAAGGAAGAAGAGGCGC-AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:667) |
编辑1AGGCTCAGGGAAGGAAGAAGAGGCGCAAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsA(SEQ ID NO:668) |
编辑2AGGCTCAGGGAAGGAAGAAGAGGCGCTAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsT(SEQ ID NO:669) |
编辑3AGGCTCAGGGAAGGAAGAAGAGGCGC--AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔA(SEQ ID NO:670) |
编辑4AGGCTCAGGGAAGGAAGAA---------------------------GCTTCGTGAGAΔ27nt(SEQ ID NO:671) |
事件SYKE191900A009A的三十九个经测序T1后代中的十七个被编辑,并且有10个经鉴定的不同等位基因(表40)。大多数类型是1nt的插入到1nt至8nt的缺失。
表40
WT AGGCTCAGGGAAGGAAGAAGAGGCGC-AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:672) |
编辑1AGGCTCAGGGAAGGAAGAAGAGGCGCAAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsA(SEQ ID NO:673) |
编辑2AGGCTCAGGGAAGGAAGAAGAGGCGCCAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsC(SEQ ID NO:674) |
编辑3AGGCTCAGGGAAGGAAGAAGAGGCGCTAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsT(SEQ ID NO:675) |
编辑4AGGCTCAGGGAAGGAAGAAGAGGCGC--AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔA(SEQ ID NO:676) |
编辑5AGGCTCAGGGAAGGAAGAAGAGGCG--AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔC(SEQ ID NO:677) |
编辑6AGGCTCAGGGAAGGAAGAAGAGGCGC---<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔAAT(SEQ ID NO:678) |
编辑7AGGCTCAGGGAAGGAAGAAGA-------AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:679) |
编辑8AGGCTCAGGGAAGGAAGAAGAGG----AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔCGC(SEQ ID NO:680) |
编辑9AGGCTCAGGGAAGGAAGAAGA--------AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:681) |
编辑10AGGCTCAGGGAAGGAAGAA---------AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:682) |
事件SYKE191900A010A的四十六个经测序T1后代中的三十一个被编辑,并且有13个经鉴定的不同等位基因(表41)。
表41
WT AGGCTCAGGGAAGGAAGAAGAGGCGC-AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA(SEQ ID NO:683) |
编辑1AGGCTCAGGGAAGGAAGAAGAGGCGCAAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsA(SEQ ID NO:684) |
编辑2AGGCTCAGGGAAGGAAGAAGAGGCGCCAATAGGTCGGGAACTGTGGCGCTTCGTGAGA InsC(SEQ ID NO:685) |
编辑3AGGCTCAGGGAAGGAAGAAGAGGCGCTAAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGA InsT(SEQ ID NO:686) |
编辑4AGGCTCAGGGAAGGAAGAAGAGG----AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔCGC(SEQ ID NO:687) |
编辑5AGGCTCAGGGAAGGAAGAAGAGGCGC---T<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔAA(SEQ ID NO:688) |
编辑6AGGCTCAGGGAAGGAAGAAGAGGC---AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔGC(SEQ ID NO:689) |
编辑7AGGCTCAGGGAAGGAAGAAGAGGC----AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔGCA(SEQ ID NO:690) |
编辑8AGGCTCAGGGAAGGAAGAAGA------AAT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔ5(SEQ ID NO:691) |
编辑9AGGCTCAGGGAAGGAAGAAGA-------AT<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔ6(SEQ ID NO:692) |
编辑10AGGCTCAGGGAAGGAAGAAGAGGCGC------GTCGGGAACTGTGGCGCTTCGTGAGAΔ5(SEQ ID NO:693) |
编辑11AGGCTCAGGGAAGGAAGAAGAGG----------TCGGGAACTGTGGCGCTTCGTGAGAΔ9(SEQ ID NO:694) |
编辑12AGGCTCAGGGAAGGAAGAA----------T<u>AGG</u>TCGGGAACTGTGGCGCTTCGTGAGAΔ9(SEQ ID NO:695) |
编辑13AGGCTCAGGGAAGGAAGAAGAGGC-----------------------GCTTCGTGAGAΔ22nt(SEQ ID NO:696) |
事件SYKE191900A010A的四十六个经测序T1后代中的三十一个被编辑,并且有10个经鉴定的不同等位基因。对于其他四个事件的其余T1植物,每个在gRNA2靶位点处都有10种以上突变类型。未编辑指导RNA1靶位点。表42中示出了不同的等位基因。
表42,来自左边4个事件的T1植物的突变类型汇总。
编号 |
SYKE191900A012A |
SYKE191900A022A |
SYKE191900A023A |
SYKE191900A025A |
1 |
Δ22nt |
Δ11nt |
Δ12nt |
Δ11nt |
2 |
Δ3nt(ΔAAT) |
Δ17nt |
Δ14nt |
Δ1nt(ΔA) |
3 |
Δ3nt(ΔCGC) |
Δ1nt(ΔC) |
Δ15nt |
Δ1nt(ΔC) |
4 |
Δ6nt |
Δ22nt |
Δ22nt |
Δ22nt |
5 |
Δ6nt |
Δ2nt(ΔAA) |
Δ2nt(ΔAA) |
Δ3nt(ΔCGC) |
6 |
Δ7nt |
Δ2nt(ΔGC) |
Δ2nt(ΔCA) |
Δ4nt |
7 |
Δ9nt |
Δ3nt(ΔAAT) |
Δ2nt(ΔGC) |
Δ8nt |
8 |
Δ9nt) |
Δ3nt(ΔCAA) |
Δ3nt(ΔAAT) |
Δ9nt |
9 |
ΔGCGC |
Δ3nt(ΔCGC) |
Δ5nt |
Δ9nt |
10 |
Ins A |
Δ5nt |
Δ7nt |
Ins C |
11 |
Ins C |
Δ5nt |
Δ8nt |
Ins T |
12 |
Ins T |
Ins A |
ΔA |
|
13 |
|
Ins C |
Ins A |
|
14 |
|
Ins T |
Ins T |
|
总而言之,所有7个事件都显示出来自MMD1启动子的FMOS活性。
此外,本披露的实施例包括使用增强子来改善FMOS活性。例如,为了提高prGmMMD1-01启动子的编辑效率(和整体编辑率),可以将另外的花特异性转录因子结合基序插入到如prGmMMD1-02(SEQ ID NO:710)中所示例的MMD1启动子中。在此实例中,将驱动花特异性表达的合成增强子(SEQ ID NO:711)添加到GmMMD1启动子的5′末端以及添加到靠近3′末端的启动子内(SEQ ID NO:712)。该增强子由来自拟南芥的SEPTALLATA3(AGL3)转录因子结合基序(5′-CCATAAATAG)的三个重复基序以及SEPETALLA1转录因子结合基序(5′-TTACCATATATAGAAAT-3′)的三个重复序列(其之间由六个核苷酸(AAGCTT)彼此分开)组成。此外,翻译前导序列(特别是来自烟草花叶病毒的Ω序列)或eTMV-03(SEQ ID NO:713)刚好添加到启动子的末端和盒的5′UTR中的起始密码子前。其他实例包括选自SEQ ID NO:711、712、713的增强子的任何组合,或与其具有至少50%、至少60%、至少70%、至少80%、至少90%或至少95%同一性的增强子。由于这是5′-UTR,该序列成为Cas9转录物的一部分并增强翻译。通过将这些基序添加到功能性FMOS启动子(如MMD1)进行转录和翻译的组合增强,提供新的启动子(例如prGmMMD1-02),这增加了Cas9在花组织中的表达,并且在双子叶植物和单子叶植物的营养分生组织中没有渗漏表达。这导致整体E0花编辑效率提高,更大地重新获得了后代中经编辑的变体,以及更高的镶嵌性得分。换句话说,这些增强可以将“良好”的FMOS启动子在镶嵌性得分量表上提升为“优秀”或“精英”。
实例11:基因调控网络的有效诱变
本发明的实施例还可用于在基因调控网络(GRN)中创建等位基因系列和多种敲除组合。例如,可以通过使用FMOS启动子(与靶向核酸酶配对来编辑GRN中的一个或多个基因(但不是所有基因))驱动Cas9活性,与多个指导RNA配对来创建等位基因系列和一系列敲除组合。每个指导RNA将被设计为一个家庭成员。由于表达水平低,Cas9可以编辑每个生发细胞谱系中的一个或多个基因(但不是所有八个基因),使得后代具有家族中等位基因的不同组合。通过自交T1以产生T2,因此可以重新获得不同基因的纯合突变体。没有与使用这种方法类似的简单明确的方式以如此小的努力来创建一组基因家族敲除。
本发明的实施例还可用于在基因调控网络(GRN)中创建等位基因系列和多种敲除组合。例如,与靶向核酸酶配对的FMOS启动子可用于编辑GRN中的一个或多个基因(但不是所有基因),使得后代具有家族中等位基因的不同组合。通过自交T1以产生T2,因此可以重新获得不同基因的纯合突变体。没有与使用这种方法类似的简单明确的方式以如此小的努力来创建一组基因家族敲除。
为了证明基因家族的诱变,并了解基因家族的不同成员如何相互作用或冗余地发挥作用,我们通过以下创建等位基因系列和敲除组合:使用玉蜀黍APETALA1(ZmAP1)启动子驱动Cas9活性,与靶向玉蜀黍查尔酮合酶白花粉1(WHP1,Chr2上的Zm00001d007403)和查尔酮合酶C2(Chr4上的Zm00001d052673)基因的两个双重指导RNA配对。WHP1和C2基因的编码序列具有95%相似性。第一指导RNA靶向它们第一外显子上的两个基因,第二指导RNA靶向它们第二外显子上的两个基因(详见表43)。两个指导RNA和TracrRNA的表达由来自甘蔗的组成型Ubi4启动子驱动,其中每个RNA侧接两个可自我切割的核酶(锤头状和HDV)以进行有效处理。载体还含有PMI作为选择性标志物。构建体25053(SEQ ID NO:533)具有TracrRNA的一个拷贝。以下提供了构建体25053的详细描述。
表43
SEQ ID NO:633是查尔酮合酶(WHP1)靶1的核苷酸靶序列。SEQ ID NO:634是查尔酮合酶(C2)靶1的核苷酸靶序列。SEQ ID NO:635是查尔酮合酶(WHP1)靶2的核苷酸靶序列。SEQ ID NO:636是查尔酮合酶(C2)靶2的核苷酸靶序列。
我们按照标准方案,通过农杆菌介导的未成熟胚胎转化(MZKE193004A),用构建体25053转化了WT JHAX植物。转化频率为27.87%。将总计32株植物送到温室,
使植物生长至成熟用于授粉以产生T1种子。因为查尔酮合酶基因的编辑会影响花粉育性,所以T0植物的花粉颗粒在授粉前用类黄酮处理。(黄酮类处理的细节)。分离T1胚胎,然后进行DNA提取和分析。基因特异性和靶特异性Taqman测定旨在检测两个家族成员中每一个中的编辑(详见表44)。
表44
SEQ ID NO:637是WHP1靶1的引物1的核苷酸序列。SEQ ID NO:638是WHP1靶1的引物2的核苷酸序列。SEQ ID NO:639是WHP1靶1的探针的核苷酸序列。SEQ ID NO:640是C2靶1的引物1的核苷酸序列。SEQ ID NO:641是C2靶1的引物2的核苷酸序列。SEQ ID NO:642是C2靶1的探针的核苷酸序列。SEQ ID NO:643是WHP1靶2的引物1的核苷酸序列。SEQ ID NO:644是WHP1靶2的引物2的核苷酸序列。SEQ ID NO:645是WHP1靶2的探针的核苷酸序列。SEQ IDNO:646是C2靶2的引物1的核苷酸序列。SEQ ID NO:647是C2靶2的引物2的核苷酸序列。SEQID NO:648是C2靶2的探针的核苷酸序列。
在T1种子中,我们鉴定了具有不同编辑模式的事件GVG01194901的三个后代(表16,前三行)。植物44在C2基因中有1bp插入;植物77在WHP1基因中有不同的1bp插入,以及植物91在C2中有24bp缺失。类似地,在事件GVG01194902中,在六个后代中,两个基因中有五种不同的编辑模式。事件GVG01194908中,在七个后代中有四种不同的编辑模式,包括一个植物在C2和WHP1基因中都具有编辑(其他植物在一个基因或另一个基因中具有编辑,而不是两个基因都具有编辑)。事件GVG01194912中,有五个具有四种不同编辑模式的经编辑的后代。本文很清楚的是,不仅可以在具有驱动靶向核酸酶的FMOS启动子的事件的后代中获得多个不同的编辑,而且一些后代将在一个基因中具有编辑,而其他后代将在两个基因中具有编辑。
表45.来自构建体25053的T1基因分型信息。对构建体25053的后代进行采样用于Taqman测定,然后进行PCR测序以发现不同的编辑模式(测序结果示出了产生的变异)。
示例性实施例:
1.一种用于在至少具有编码第一网络成员的第一DNA和编码第二网络成员的第二DNA的基因调控网络(GRN)中产生可变敲除组合的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码DNA修饰酶的核酸,
编码第一指导RNA(gRNA)的核酸,所述第一指导RNA靶向编码所述第一网络成员的第一DNA,
编码第二指导RNA(gRNA)的核酸,所述第二指导RNA靶向编码所述第二网络成员的第二DNA,以及
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子在GRN中含有多个独特敲除组合。
2.如权利要求1所述的方法,所述方法进一步包括
使具有独特敲除组合的所述多个T1种子之一自交以产生对所述独特敲除组合是纯合的T2突变植物;以及
使具有独特敲除组合的所述多个T1种子中的另一个自交以产生对不同独特敲除组合是纯合的不同T2突变植物。
3.如以上中任一项所述的方法,其中所述DNA修饰酶是定点核酸酶,所述定点核酸酶选自由以下组成的组:Cas9核酸酶、Cpf1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9-胞苷脱氨酶、嵌合Cas9-腺嘌呤脱氨酶、嵌合FEN1-FokI和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
4.如以上中任一项所述的方法,其中所述DNA修饰酶是Cas9核酸酶或Cpf1核酸酶。
5.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有独特表型。
6.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
7.如以上中任一项所述的方法,其中所述FMOS调控序列介导在所述花原基和所述花生殖器官中表达更多DNA修饰酶(比率与本文先前描述的比率相似),以及介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(比率与本文先前描述的比率相似)。
8.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
9.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
11.如以上中任一项所述的方法,其中所述多个独特敲除组合包括以下中的至少一项:至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特组合。
12.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
13.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个编辑。
14.如以上中任一项所述的方法,其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在营养组织中表达更多,以及其中所述FMOS调控序列介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(相对量,例如多至少2倍、多至少3倍,这与其他实施例中描述的相同)。
15.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
16.至少一个表达盒,所述至少一个表达盒包括以上1-15中所述的组分的任何组合。
17.一种植物,所述植物通过如1-15所述的方法产生。
18.一种植物细胞,所述植物细胞含有如16所述的至少一个表达盒。
实例12:配合使用FMOS与靶向饱和诱变,例如CRISPR-X或EvolvR
在一些实施例中,本披露提供改善现有饱和诱变技术的方法和组合物。例如,当与靶向饱和诱变技术(例如CRISPR-X或EvolvR技术)配合使用时,本发明的实施例提供了意想不到的益处。CRISPR-X是指与过度活跃的AID(胞苷脱氨酶)相连的dCas9,其可以产生靶向的(并半随机的)点突变(如本文所用,“点突变”是指用不同的核苷酸替代单个核苷酸)。关于CRISPR-X技术的更多讨论,参见美国专利申请公开2019309288A,其全部内容通过引用并入本文。EvolvR是与易错DNA聚合酶相连的nCas9,如Halperin,S.O.,Tou,C.J.,Wong,E.B.等人CRISPR-guided DNA polymerases enable versification of all nucleotides ina tunable window.[CRISPR指导的DNA聚合酶使所有核苷酸的多样化能够在可调窗口中实现]Nature[自然]560,248-252(2018)中所述。新的遗传变异可以通过利用CRISPR-X或使用EvolvR来实现。这些新技术利用遍在启动子是可行的,但申请人认为,由于缺乏镶嵌性和早期编辑,在每一代或每株植物中只有相当有限范围的突变可以产生。此外,申请人认为现有系统在某些情况下可能对植物的适应性具有负面影响。因此,在本披露的一些实施例中,申请人尤其使用FMOS启动子对现有技术进行了显著改善,以在花的不同生发谱系中产生极其多样性的结果,这些结果将在后代种子中差异遗传。
根据本发明的一些实施例,通过稳定转化含有FMOS启动子的构建体来产生植物,该FMOS启动子驱动失活CRISPR或切口酶CRISPR(dCas9、nCas9、dCas12a或另一种非双链DNA切割核酸酶)的表达,其含有N-末端融合(或C末端融合)的过度活跃胞苷脱氨酶(AID)。在构建体的另一个盒或另一部分中,一个或多个靶向指导RNA被组成型表达或利用FMOS启动子表达。因此融合酶的编辑发生在T0事件的花中,使得可以在后代中重新获得多个不同的碱基编辑等位基因。然后通过测序分析那些基于编辑的等位基因,或者任选地,对后代进行表型筛选,以鉴定在所希望的水平上对特定目的性状进行的变异(任选地,然后对满足表型阈值的植物进行测序以发现哪个碱基编辑突变产生了此有利结果)。在另一个典型的实施例中,使用高度表达的组成型启动子或遍在启动子表达含有MS2 RNA发夹的核酸酶和指导RNA,并且使用FMOS启动子表达与MS2结构域连接的AID。和前述一样,然后不同的碱基编辑将在花中发生,并且可以在后代中重新获得多种不同的编辑。
在一些实施例中,通过稳定转化至少一个表达盒来产生植物,该表达盒包含驱动切口酶CRISPR(nCas9、nCas12a或另一种切口酶)表达的FMOS启动子,该切口酶CRISPR含有N-末端融合(或C-末端融合)的易错DNA聚合酶,例如DNA polI3M。在构建体的至少一个盒或另一部分中,一个或多个靶向指导RNA被组成型表达或利用FMOS启动子表达。因此融合酶的编辑发生在T0事件的花中,使得可以在后代中重新获得多个不同的碱基编辑等位基因。然后通过测序分析那些基于编辑的等位基因,或者任选地,对后代进行表型筛选,以鉴定在所希望的水平上对特定目的性状进行的变异(任选地,然后对满足表型阈值的植物进行测序以发现哪个碱基编辑突变产生了此有利结果)。在另一个典型的实施例中,使用高度表达的组成型启动子或遍在启动子表达含有MS2 RNA发夹的核酸酶和指导RNA,并且使用FMOS启动子表达与MS2结构域连接的易错DNA聚合酶。和前述一样,然后不同的碱基编辑将在花中发生,并且可以在后代中重新获得多种不同的编辑。
SEQ ID NO:612是载体Cr-X-FMOS的核苷酸序列,载体Cr-X-FMOS是含有至少一个包含nCas的表达盒的载体的一个实例,并且根据本发明的实施例其可用于创建多个独特点突变。
SEQ ID NO:613是载体Ev-FMOS的核苷酸序列,载体Ev-FMOS是含有至少一个包含nCas的表达盒的载体的另一个实例,并且根据本发明的实施例其可用于创建多个独特点突变。
dCas的示例性实施例:
1.一种用于在植物的T1种子中产生多个独特点突变的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码催化失活的Cas(dCas)的核酸,
编码至少一种携带MS2发夹结合位点的指导RNA(gRNA)的核酸,
编码脱氨酶的核酸,和
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子含有多个独特点突变。
2.如1所述的方法,其中所述催化失活的Cas(dCas)是催化失活的Cas9(dCas9)或失活的Cas 12a(dCas12a)。
3.如以上中任一项所述的方法,其中所述脱氨酶是激活诱导的胞苷脱氨酶(AID)。
4.如以上中任一项所述的方法,其中所述编码gRNA的核酸可操作地连接至所述FMOS启动子或第二启动子。
5.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有多个独特点突变。
6.如5所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
7.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
8.如以上中任一项所述的方法,其中所述FMOS调控序列介导在所述花原基和所述花生殖器官中表达更多DNA修饰酶(比率与本文先前描述的比率相似),以及介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(比率与本文先前描述的比率相似)。
9.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
10.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
11.如以上中任一项所述的方法,其中所述多个独特点突变包括以下中的至少一项:至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个点突变。
12.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
13.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个独特点突变。
14.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
15.至少一个表达盒,所述至少一个表达盒包括如1-14中所述的组分的任何组合。
16.一种植物,所述植物通过如1-14所述的方法产生。
16.一种植物细胞,所述植物细胞包含如15所述的至少一个表达盒。
CRISPR-指导的DNA聚合酶的示例性实施例
1.一种用于在植物的T1种子中产生多个独特点突变的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码Cas的切口变体(nCas)的核酸,
编码DNA聚合酶(Pol)的核酸,
编码至少一种指导RNA(gRNA)的核酸,和
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述nCas和所述Pol的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子含有多个独特点突变。
2.如1所述的方法,其中所述nCas是切口Cas9(nCas9)或切口Cas 12a(nCas12a)。
3.如2所述的方法,其中所述nCas是具有D10A突变的nCas9。
4.如以上中任一项所述的方法,所编码的nCas与所编码的Pol融合。
5.如以上中任一项所述的方法,其中所述Pol是大肠杆菌PolI。
6.如以上中任一项所述的方法,所述Pol包括以下突变D424A、I709N和A759R中的至少一个。
7.如以上中任一项所述的方法,其中所述编码gRNA的核酸可操作地连接至所述FMOS启动子或第二启动子。
8.如以上中任一项所述的方法,所述方法进一步包括使T1种子生长以产生多个T1植物,测量T1代的植物中的至少一种表型,和基于对至少一种表型的测量选择T1代的植物,其中选择的植物具有多个独特点突变。
9.如8所述的方法,所述方法进一步包括
对所述T1代的所述选择的植物中的所述供体DNA的插入位点进行测序,
对所述T1代的非选择的植物中的所述供体DNA的插入位点进行测序,以及
将所述选择的植物的插入位点序列与所述非选择的植物的插入位点序列进行比对。
10.如9所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
11.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
12.如以上中任一项所述的方法,其中所述FMOS调控序列介导在所述花原基和所述花生殖器官中表达更多DNA修饰酶(比率与本文先前描述的比率相似),以及介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(比率与本文先前描述的比率相似)。
13.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
14.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
15.如以上中任一项所述的方法,其中所述多个独特点突变包括以下中的至少一项:至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个点突变。
16.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
17.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个独特点突变。
18.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
19.至少一个表达盒,所述至少一个表达盒包括如1-18中所述的组分的任何组合。
20.一种植物,所述植物通过如1-17所述的方法产生。
21.一种植物细胞,所述植物细胞包含如19所述的至少一个表达盒。
实例13:使用FMOS启动子情况下的大缺失
在一些实施例中,本披露提供了用于在植物基因组(包括基因区域、重组热点、重组冷点(cold spot)、反向区(inverted region)、着丝粒、端粒、结(knob)和其他的区域)中产生大缺失的方法和组合物。通常,在没有大量投资以产生较大的事件群体的情况下,产生大缺失的极低效率使得这些实验目标变得非常困难。通过使用FMOS启动子,只需用少量投资来制备少量的事件就可以更加容易实现大缺失。在一些实施例中,进一步存在缺失整个染色体区域或甚至整个染色体臂的潜力。
在一个实例中,将两个相距约1Mb(一百万个碱基对)的指导RNA设计为缺失玉蜀黍中的大基因间区。这两个指导RNA安装在具有由FMOS启动子驱动的Cas9和选择性标志物(PMI)的二元载体中。由于将两个指导RNA同时切割以产生缺失的效率较低,并且由于随着两个靶位点之间的间隔增加产生缺失的效率越低这一事实,缺失1Mb的序列的可能性极其低。使用组成型启动子,通常需要约5000个事件才能实现这一大缺失。使用FMOS启动子,筛选来自十个事件的5000个后代就可实现这一目标,这总体上显著降低了制备该缺失的时间、劳动力和成本。从那5000株植物中,鉴定出具有所希望的缺失的那一株。通过使用位于1Mb区域侧翼的两个引物(设计在上游指导RNA靶的上游的正向引物和设计在下游指导RNA靶的下游的反向引物)运行PCR来进行这一检测。此PCR测定仅在5000株植物中的一株中呈阳性,抑或假阳性PCR扩增子被进一步揭示为错误。在对PCR产物进行进一步测序后,发现该序列与预测的一样-缺失了1Mb基因间区。此基因间区不包含基因,但包含大量转座子和重复DNA。没有观察到可以将具有大缺失的经编辑植物与未经编辑植物区分开来的植物表型。在另一个实施例中,缺失的区域含有若干个对植物生长或发育具有有害影响的基因。在另一个实施例中,缺失的区域含有驱动异常生殖表型的结,将其去除简化了育种方法。在另一个实施例中,遍及整个基因组区域中的大量指导RNA用于产生一系列大小不一的缺失。
在另一个实施例中,跨越整个染色体或染色体臂的指导RNA用于诱导该臂或该染色体的完全缺失。在该实施例中,构建体被转化进入近交品系、杂交品系、种间杂交品系或种内杂交品系、或这些的衍生品系,其具有可缺失的多余染色体或不希望的染色体区段。
在另一个实施例中,通过使用由FMOS启动子驱动的Cas3核酸酶复合物(替换载体中的Cas9),通过缺失非常大的区域来产生等位基因系列,而不是使用Cas9核酸酶和多个指导RNA。
用于缺失大基因间区的示例性实施例:
1.一种用于在植物的T1种子中缺失大基因间区的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码RNA定点核酸酶的核酸,
编码至少一种第一指导RNA(gRNA-1)的核酸,
编码至少一种第二指导RNA(gRNA-2)的核酸,其中所述gRNA-1靶向染色体上的第一靶序列以及其中所述gRNA-2靶向染色体上的第二靶序列,其中所述第一靶序列和所述第二靶序列相距至少0.1Mb,和
花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述DNA修饰酶的表达,以及
(ii)在所述花原基和所述花生殖器官中的所述至少一个中介导多个编辑;以及
b)将所述植物细胞或植物组织再生为具有多个T1种子的T0植物,其中所述T1种子含有至少一个大基因间缺失。
2.如1所述的方法,其中所述大基因间区包括在0.1-2Mb、0.2-1.9Mb、0.3-1.8Mb、0.4-1.7Mb、0.5-1.6Mb、0.6-1.5Mb、0.7-1.4Mb、0.7-1.3Mb、0.7-1.2Mb、0.3-1.1Mb、0.3-1.0Mb、0.4-1.0Mb、0.5-1.0Mb和0.6-0.8Mb中的至少一个的范围中的至少一个区域。
3.如以上中的任一项所述的方法,其中所述第一靶序列和所述第二靶序列由在0.1-2Mb、0.2-1.9Mb、0.3-1.8Mb、0.4-1.7Mb、0.5-1.6Mb、0.6-1.5Mb、0.7-1.4Mb、0.7-1.3Mb、0.7-1.2Mb、0.3-1.1Mb、0.3-1.0Mb、0.4-1.0Mb、0.5-1.0Mb和0.6-0.8Mb中的至少一个的范围中的至少一个距离隔开。
4.如以上中的任一项所述的方法,其中所述定点核酸酶是Cas核酸酶。
5.如以上中的任一项所述的方法,其中
其中所述编码gRNA-1的核酸可操作地连接至所述FMOS启动子或第二启动子,以及
其中所述编码gRNA-2的核酸可操作地连接至所述FMOS启动子,至所述第二启动子或至第三启动子。
5.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有大基因间缺失。
6.如5所述的方法,所述方法进一步包括
对所述T1代的所述选择的植物中的所述供体DNA的插入位点进行测序,
对所述T1代的非选择的植物中的所述供体DNA的插入位点进行测序,以及
将所述选择的植物的插入位点序列与所述非选择的植物的插入位点序列进行比对。
7.如6所述的方法,所述方法进一步包括将所述T1代的具有所述大基因间缺失的所述选择的植物与不具有所述大基因间缺失的植物杂交以产生具有所述大基因间缺失的后代。
8.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
9.如以上中任一项所述的方法,其中所述FMOS调控序列介导在所述花原基和所述花生殖器官中表达更多DNA修饰酶(比率与本文先前描述的比率相似),以及介导DNA修饰酶在所述花原基和所述花生殖器官中比在种子中表达更多(比率与本文先前描述的比率相似)。
10.如1所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
11.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
12.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
13.至少一个表达盒,所述至少一个表达盒包括如1-12中所述的组分的任何组合。
14.一种植物,所述植物使用如以上1-12中所述的方法产生。
15.一种植物细胞,所述植物细胞含有如13所述的至少一个表达盒。
实例14:使用FMOS启动子诱导指导RNA在花中表达
在本发明的范围内可以进行各种改变。例如,在一些实施例中,不使用FMOS启动子来驱动Cas9,而是通过使用FMOS启动子来驱动指导RNA的表达也可以获得相同的结果,并且仅仅需要使Cas处于组成型启动子控制下。
示例性实施例:
1.一种用于在植物的T1种子中产生多个独特编辑的方法,所述方法包括:
a)将至少一个表达盒转化至植物细胞或植物组织中,其中所述至少一个表达盒包含
编码RNA定点核酸酶的核酸,
编码指导RNA(gRNA)的核酸,和
包含FMOS启动子的花镶嵌(FMOS)调控序列,其中所述FMOS调控序列
(i)在花原基细胞和花生殖器官中的至少一个中介导所述gRNA的表达,
(ii)在所述花原基和所述花生殖器官中的至少一个中介导多个编辑,
(iii)在所述花原基和所述花生殖器官中的至少一个中比在芽顶端分生组织(SAM)中介导gRNA至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个,以及
(iv)在所述花原基和所述花生殖器官中的至少一个中比在种子中介导gRNA至少多表达两倍、至少多表达三倍、至少多表达四倍、至少多表达5倍和至少多表达六倍中的至少一个;
b)将所述植物细胞或植物组织再生为具有多个T1种子的植物;以及
c)使所述T1种子生长以产生T1代,其中所述T1代含有至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个独特编辑中的至少一项。
2.如1所述的方法,其中所述定点核酸酶可操作地连接至组成型启动子或至所述FMOS启动子。
3.如1所述的方法,其中所述定点核酸酶是Cas核酸酶。
4.如以上中的任一项所述的方法,所述方法进一步包括
使所述T1种子生长以产生多个T1植物,以及
测量T1代的植物中的至少一种表型,以及
基于对至少一种表型的测量选择所述T1代的植物,其中选择的植物具有至少一个独特编辑。
5.如4所述的方法,所述方法进一步包括将所述T1代的具有独特编辑的所述选择的植物与不具有所述独特编辑的植物杂交以产生具有所述独特编辑的后代。
6.如以上中的任一项所述的方法,其中所述FMOS调控序列在花序、小孢子母细胞、花药、雄蕊、毡绒层、大孢子母细胞、雌蕊、子房、花柱和柱头中的至少一个中介导表达。
7.如以上中的任一项所述的方法,其中所述FMOS调控序列介导
在所述花原基和所述花生殖器官中比在营养组织中多以下中的至少一个倍数的所述gRNA:7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍,以及
在所述花原基和所述花生殖器官中比在种子中多以下中的至少一个倍数的所述gRNA:至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍、至少20倍、至少21倍、至少22倍、至少23倍、至少24倍、至少25倍、至少26倍、至少27倍、至少28倍、至少29倍、至少30倍、至少31倍、至少32倍、至少33倍、至少34倍、至少35倍、至少36倍、至少37倍、至少38倍、至少39倍、至少40倍、至少41倍、至少42倍、至少43倍、至少44倍、至少45倍、至少46倍、至少47倍、至少48倍、至少49倍、至少50倍、至少51倍、至少52倍、至少53倍、至少54倍、至少55倍、至少56倍、至少57倍、至少58倍、至少59倍、至少60倍、至少61倍、至少62倍、至少63倍、至少64倍、至少65倍、至少66倍、至少67倍、至少68倍、至少69倍、至少70倍、至少71倍、至少72倍、至少73倍、至少74倍、至少75倍、至少76倍、至少77倍、至少78倍、至少79倍、至少80倍、至少81倍、至少82倍、至少83倍、至少84倍、至少85倍、至少86倍、至少87倍、至少88倍、至少89倍、至少90倍、至少91倍、至少92倍、至少93倍、至少94倍、至少95倍、至少96倍、至少97倍、至少98倍、至少99倍和至少100倍。
8.如以上中的任一项所述的方法,其中所述FMOS调控序列包含FMOS启动子和FMOS终止子。
9.所述FMOS启动子和终止子可以是本文公开的那些启动子和终止子中的任何。
10.如以上中的任一项所述的方法,其中所述至少一个表达盒不包含对于所述FMOS调控序列而言是天然的可翻译的外显子。所述FMOS启动子可包括以下中的至少一个:经修饰以去除起始密码子的第一天然外显子、第一内含子和第二外显子的至少一部分,其中所述第二外显子的所述部分是不可翻译的。进一步地,在一些实例中,可以将FMOS启动子修饰以包括例如泛素内含子从而增强FMOS活性。
11.如以上中的任一项所述的方法,其中FMOS调控序列
(i)在雄性和雌性二者的花生殖器官中介导所述DNA修饰酶的表达,以及
(ii)在雄性和雌性二者的花生殖器官中介导多个独特点突变。
12.如以上中的任一项所述的方法,其中所述T0植物具有至少0.5、1、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19和20的镶嵌性得分,其中所述镶嵌性得分是通过镶嵌性得分方法1确定的。镶嵌性得分的上限将通过FMOS启动子的功效来确定,然而,本申请人期望典型的镶嵌性得分在0.5至30、1至25、2至25、3至25、4至25、5至25、6至25、5至20、5至19、5至18、5至17、5至16和5至15中的至少一项的范围内。
13.至少一个表达盒,所述至少一个表达盒包括如1-12中所述的组分的任何组合。
14.一种植物,所述植物使用如1-12中所述的方法产生。
15.一种植物细胞,所述植物细胞包含如权利要求13所述的至少一个表达盒。