CN116529370A - 具有特征性原间隔子相邻基序或特征性指导rna识别位点的可切除植物转基因基因座 - Google Patents

具有特征性原间隔子相邻基序或特征性指导rna识别位点的可切除植物转基因基因座 Download PDF

Info

Publication number
CN116529370A
CN116529370A CN202180058119.2A CN202180058119A CN116529370A CN 116529370 A CN116529370 A CN 116529370A CN 202180058119 A CN202180058119 A CN 202180058119A CN 116529370 A CN116529370 A CN 116529370A
Authority
CN
China
Prior art keywords
transgenic
locus
dna
transgenic plant
transgene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180058119.2A
Other languages
English (en)
Inventor
迈克尔·安德烈亚斯·考克
迈克尔·李·努奇奥
弗雷德里克·范·埃克斯
亚历山德拉·埃拉塔
丹尼尔·罗德里格斯·莱尔
约书亚·L·普莱斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inari Agricultural Technology Co ltd
Original Assignee
Inari Agricultural Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inari Agricultural Technology Co ltd filed Critical Inari Agricultural Technology Co ltd
Priority claimed from PCT/US2021/043192 external-priority patent/WO2022026395A2/en
Publication of CN116529370A publication Critical patent/CN116529370A/zh
Pending legal-status Critical Current

Links

Abstract

披露了转基因植物,其包含在转基因插入物与非转基因基因组DNA的连接处或附近引入的合成的原间隔子相邻基序(sPAM)或合成的指导RNA识别位点,制备此类植物的方法,以及此类植物用于促进育种的用途。

Description

具有特征性原间隔子相邻基序或特征性指导RNA识别位点的 可切除植物转基因基因座
发明人:Michael A.Kock、Michael L.Nuccio、Frédéric Van Ex、AlexandraElata、Daniel Rodriguez Leal、Joshua L.Price
参考以电子方式提交的序列表
包含在名为“10078WO1_ST25.txt”的文件中的序列表,其在Windows操作系统中测量为492,407字节,于2021年7月14日创建并于2021年7月26日以电子方式提交,其通过引用以其整体并入本文。
背景技术
通过非位点特异性整合置于植物基因组不同位置的转基因可以表现出不同的表达水平(Weising等人,1988,Ann.Rev.Genet.[遗传学年鉴]22:421-477)。这样的转基因插入位点还可以包含外来DNA元件的各种不期望的重排,包括缺失和/或重复。此外,许多转基因插入位点还可以包含可选择的或可评分的标记基因,在某些情况下,一旦选择了含有赋予所期望性状的连锁转基因的转基因植物事件,就不再需要这些标记基因。
商业转基因植物通常在宿主植物基因组的特定位置包含一个或多个独立的转基因插入,这些位置已针对包括以下的特征进行了选择:表达一个或多个目的转基因和转基因赋予的一个或多个性状、缺失或最小化重排,以及一个或多个性状向后代的正常孟德尔传递。所选择转基因玉米、大豆、棉花和卡诺拉油菜植物事件(其赋予性状诸如除草剂耐受性和/或有害生物耐受性)的实例披露于美国专利号7323556;8575434;6040497;10316330;8618358;8212113;9428765;8455720;7897748;8273959;8093453;8901378;8466346;RE44962;9540655;9738904;8680363;8049071;9447428;9944945;8592650;10184134;7179965;7371940;9133473;8735661;7381861;8048632;和9738903。
在植物基因组的转基因插入位点去除可选择标记基因和/或重复转基因的方法(这些方法涉及使用位点特异性重组酶系统(例如,cre-lox)以及将新基因插入转基因插入位点)已被披露(Srivastava和Ow;Methods Mol Biol[分子生物学方法],2015,1287:95-103;Dale和Ow,1991,Proc.Natl Acad.Sci.USA[美国国家科学院院刊]88,10558–10562;Srivastava和Thomson,Plant Biotechnol J[植物生物技术杂志],2016;14(2):471-82)。此类方法通常需要在转基因内的特定位置掺入重组酶识别的重组位点序列。
发明内容
提供了经编辑的转基因植物基因组,其包含第一组特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中sPAM和/或sigRNAR位点可操作地连接至转基因植物基因组中第一经修饰的转基因基因座的两个DNA连接多核苷酸并且其中sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。还提供了经编辑的转基因植物基因组,其包含特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中sPAM和/或sigRNAR位点可操作地连接至转基因植物基因组中第一经修饰的转基因基因座的DNA连接多核苷酸并且其中sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。还提供了包含经编辑的转基因植物基因组的转基因植物细胞、植物、植物部分和经加工的植物产品。还提供了获自转基因植物细胞、转基因植物或转基因植物部分的生物样品,其中生物样品包含一个或多个多核苷酸,其包含第一、第二和/或第三经修饰的转基因基因座的一个或两个DNA连接多核苷酸中的sPAM和/或sigRNAR。提供了检测经编辑的转基因植物基因组的方法,这些方法包括检测包含所述sPAM和/或sigRNAR中的一个或多个的多核苷酸的存在的步骤。
提供了获得植物育种系的方法,包括:(a)使包含经编辑的转基因基因组的上述转基因植物杂交,其中将包含第一经修饰的转基因基因座的第一植物与包含第二经修饰的转基因基因座的第二植物杂交;并且(b)从该杂交中选择包含该第一和第二经修饰的转基因基因座的后代植物,从而获得该植物育种系。还提供了获得用于商业种子生产的大量近交种子群体的方法,这些包括转基因植物自交和从自交优良作物植物收获种子。获得杂交作物种子的方法包括将包含转基因植物的第一作物植物与第二作物植物杂交并从杂交中收获种子。
提供了获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,这些方法包括在原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中sigRNAR位点可操作地连接至该第一和第二DNA连接多核苷酸。
提供了从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,这些方法包括以下步骤:(a)将任何上述经编辑的转基因植物基因组与以下接触:(i)识别第一组sPAM、第二组sPAM和/或第三组sPAM的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻第一组sPAM的5’或3’的DNA的RNA等同物;并且(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sPAM的经修饰的转基因基因座已被切除。
提供了从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,这些方法包括以下步骤:(a)将上述经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sPAM和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sigRNAR位点的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻该sPAM和预先存在的PAM或sigRNAR位点的5’或3’的DNA的RNA等同物;并且(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sPAM和该预先存在的PAM或sigRNAR位点的经修饰的转基因基因座已被切除。
提供了从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,这些方法包括以下步骤:(a)将上述经编辑的转基因植物基因组与以下接触:(i)识别第一组sigRNAR位点、第二组sigRNAR位点和/或第三组sigRNAR位点的RdDe;和(ii)定向至该第一组sigRNAR位点的指导RNA(gRNA);并且(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sigRNAR位点的经修饰的转基因基因座已被切除。
提供了从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,这些方法包括以下步骤:(a)将上述经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sigRNAR位点和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sPAM位点的RdDe;以及(ii)定向至该第一sigRNAR位点和该预先存在的PAM或sPAM位点的指导RNA(gRNA);并且(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sigRNAR和预先存在的PAM或sPAM位点的经修饰的转基因基因座已被切除。
提供了包含sPAM和/或sigRNAR的DNA,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。还提供了含有DNA的经加工的转基因植物产品和含有DNA的生物样品。
提供了适用于检测基因组DNA或其片段的核酸标记,该核酸标记包含sPAM和/或sigRNAR的DNA,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
提供了获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,这些方法包括在原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入第一和第二sPAM位点的步骤,其中这些sPAM位点可操作地连接至该第一和第二DNA连接多核苷酸。
提供了获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,这些方法包括在原始转基因基因座的第一DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中sigRNAR位点可操作地连接至该第一DNA连接多核苷酸。
提供了获得含有不同转基因性状的近交转基因植物种质的方法,这些方法包括:(a)将至少第一转基因基因座和第二转基因基因座进行基因渗入近交种质以获得包含该第一和第二转基因基因座的供体近交亲本植物系,其中特征性原间隔子相邻基序(sPAM)位点或特征性指导RNA识别(sigRNAR)位点可操作地连接至至少该第一转基因基因座的两个DNA连接多核苷酸并且任选地连接至该第二转基因基因座;(b)将该供体近交亲本植物系的转基因植物基因组与以下接触:(i)定向至与两个sPAM位点相邻的基因组DNA或定向至这些sigRNAR位点的至少第一指导RNA,其中这些sPAM或sigRNAR位点可操作地连接至该第一转基因基因座;和(ii)一个或多个识别这些sPAM或sigRNAR位点的RNA依赖性DNA核酸内切酶(RdDe);并且(c)在近交种质中选择包含经编辑的转基因植物基因组的转基因植物细胞、转基因植物部分或的转基因植物,其中该第一转基因基因座已被切除并且该第二转基因基因座存在于该近交种质中。
附图说明
图1显示了SEQ ID NO:1中所示的DAS-59122-7转基因基因座中的转基因表达盒和可选择标记的图解。
图2显示了SEQ ID NO:2中所示的DP-4114转基因基因座中的转基因表达盒和可选择标记的图解。
图3显示了SEQ ID NO:3中所示的MON87411转基因基因座中的转基因表达盒和可选择标记的图解。
图4显示了MON89034转基因基因座中的转基因表达盒和可选择标记的图解。
图5显示了MIR162转基因基因座中的转基因表达盒和可选择标记的图解。
图6显示了SEQ ID NO:6中所示的MIR604转基因基因座中的转基因表达盒和可选择标记的图解。
图7显示了SEQ ID NO:7中所示的NK603转基因基因座中的转基因表达盒和可选择标记的图解。
图8显示了SEQ ID NO:8中所示的SYN-E3272-5转基因基因座中的转基因表达盒和可选择标记的图解。
图9显示了SEQ ID NO:8中所示的转基因基因座中的转基因表达盒和可选择标记的图解。
图10显示了SEQ ID NO:10中所示的TC1507转基因基因座中的转基因表达盒和可选择标记的图解。
图11显示了示意图,它比较了当前的转基因事件(即转基因基因座)基因渗入育种策略与转基因事件基因渗入的替代育种策略,其中转基因事件(即转基因基因座)可以在基因渗入后被去除,以提供不同的转基因性状组合。
图12显示了SEQ ID NO:12中所示的DAS68416-4转基因基因座中的转基因表达盒和可选择标记的图解。
图13显示了SEQ ID NO:14中所示的MON87701转基因基因座中的转基因表达盒和可选择标记的图解。
图14显示了SEQ ID NO:16中所示的MON89788转基因基因座中的转基因表达盒和可选择标记的图解。
图15显示了SEQ ID NO:19中所示的COT102转基因基因座中的转基因表达盒和可选择标记的图解。
图16显示了SEQ ID NO:21中所示的MON88302转基因基因座中的转基因表达盒和可选择标记的图解。
图17A和B显示了用于MON89034事件中sPAM插入的靶序列(SEQ ID NO:4的碱基对1972至2117及其反向互补序列)。
图18显示了MON89034中的人工锌指蛋白f DNA靶序列。顶部的输入序列是SEQ IDNO:35,第一分离的靶位点是SEQ ID NO:36(中间序列),第二分离的靶位点是SEQ ID NO:37(底部)。
图19显示了用于结合MON89034中的靶序列的人工锌指蛋白。N末端骨架:YKCPECGKSFS(SEQ ID NO:38);C末端骨架:HQRTH(SEQ ID NO:39);ZF接头:TGEKP(SEQ IDNO:40);N末端固定:LEPGEKP(SEQ ID NO:41);C末端固定:TGKKTS(SEQ ID NO:42);指1螺旋:QAGHLAS(SEQ ID NO:43);指2螺旋QSGNLTE(SEQ ID NO:44);指3螺旋:RADNLTE(SEQ IDNO:45);结合至靶的预测ZF蛋白:LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSRADNLTEHQRTHTGKKTS(SEQ ID NO:46)。
图20显示了用于结合MON89034中的靶序列的人工锌指蛋白。N末端骨架:YKCPECGKSFS(SEQ ID NO:38);C末端骨架:HQRTH(SEQ ID NO:39);ZF接头:TGEKP(SEQ IDNO:40);N末端固定:LEPGEKP(SEQ ID NO:41);C末端固定:TGKKTS(SEQ ID NO:42);指1螺旋:TSGNLTE(SEQ ID NO:47);指2螺旋:THLDLIR(SEQ ID NO:48);指3螺旋:TSGNLTE(SEQ IDNO:47);结合至靶的预测ZF蛋白:LEPGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPYKCPECGKSFSTHLDLIRHQR THTGEKPYKCPECGKSFSTSGNLTEHQRTHTGKKTS(SEQ ID NO:49)。
图21显示了核酸酶结构域(SEQ ID NO:50)和人工锌指核酸酶蛋白(SEQ ID NO:51和52)。
图22显示了靶位点(SEQ ID NO:35)的人工锌指核酸酶切割和合成的寡核苷酸衔接子的插入以产生特征性PAM(sPAM)序列(SEQ ID NO:53)。
具体实施方式
除非另有说明,本说明书正文中的核酸序列在从左到右阅读时均按5’到3’方向给出。核酸序列可以以DNA或RNA的形式提供,如具体所述;如本领域普通技术人员已知的那样,一个的披露内容必然定义另一个,以及必然定义精确的补充。
在术语以单数形式提供的情况下,发明人还考虑了由该术语的复数形式描述的实施例。
本文使用的术语“约”是指值或值范围,该值或值范围可以理解为所陈述值的等同物,并且可以大于或小于所陈述值或值范围的10%。以术语“约”开头的每个值或值范围也意在涵盖所陈述绝对值或值范围的实施例。
如本文所用的短语“等位基因变体”是指在给定生物的不同菌株、变种或分离株中出现的多核苷酸或多肽序列变体。
本文使用的术语“和/或”将被视为对在具有或不具有另一指定特征或组分的情况下对两个指定特征或组分中的每一个的特定披露。因此,如在本文中诸如“A和/或B”的短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独)和“B”(单独)。同样地,如在诸如“A、B、和/或C”的短语中使用的术语“和/或”旨在涵盖以下实施例中的每一个:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独);B(单独);和C(单独)。
如本文所用,短语“批准的转基因基因座”是指已经被政府机授权、批准和/或解除管制用于田间试验、栽培、人类消费、动物消费和/或进口中的任何一种的转基因植物事件。提供此类批准的政府机构的说明性和非限制性实例包括阿根廷农业部、澳大利亚新西兰食品标准局、巴西国家生物安全技术委员会(CTNBio)、加拿大食品检验局、中国农业部生物安全网络、欧洲食品安全局、美国农业部、美国环境保护部和美国食品药品监督管理局。
如本文所用,术语“回交”是指将一个或多个F1植物与原始亲本之一杂交。回交用于维持或建立一个亲本(物种)的身份,并掺入第二亲本(物种)的特定性状。如本文所用,术语“回交世代”是指回交的后代。
如本文所用,短语“生物样品”是指完整的或非完整的(例如,磨碎的种子或植物组织、切碎的植物组织、冻干组织)植物组织。它还可以是包含完整或不完整种子或植物组织的提取物。生物样品可以包括面粉、粗粉、糖浆、油、淀粉和谷物,其全部或部分被制造以含有作物植物副产物。在某些实施例中,生物样品是“不可再生的”(即,不能再生为植物或植物部分)。在某些实施例中,生物样品是指含有从中获得生物样品的生物体的基因组DNA的匀浆、提取物或其任何部分,其中生物样品不包含活细胞。
例如,术语“相应的”、“对应的”等,当用于任何给定多核苷酸(例如SEQ ID NO:1-34的等位基因变体)相对于参考多核苷酸序列(例如SEQ ID NO:1-34)的核苷酸位置、突变和/或取代的上下文中时,全部是指当使用成对比对算法(例如,带有默认参数的CLUSTAL O1.2.4)将给定多核苷酸与参考多核苷酸序列比对时,给定序列中与参考核苷酸序列中的残基具有同一性的多核苷酸残基的位置。
如本文所用,术语“Cpf1”和“Cas12a”可互换使用,指相同的RNA依赖性DNA核酸内切酶(RdDe)。Cas12a蛋白包括本文提供的如SEQ ID NO:54的蛋白。
如本文所用,术语“杂交”是指雌性植物(或配子)与雄性植物(或配子)的受精。术语“配子”是指植物中配子体通过减数分裂产生并参与有性繁殖(在此过程中,两个异性配子融合形成二倍体合子)的单倍体生殖细胞(卵或花粉)。该术语通常包括对花粉(包括精子细胞)和胚珠(包括卵子)的提及。当在实现基因组区域或区段的基因渗入的背景下提及杂交时,技术人员将理解,为了实现一个植物的染色体的仅一部分进行基因渗入另一个植物的染色体中,由于在亲本系配子产生过程中发生交换事件,两个亲本系基因组的随机部分在杂交过程中重组。因此,亲本双方的基因组必须通过杂交组合在一个细胞中,其中细胞产生配子并在受精过程中融合将导致基因渗入事件。
如本文所用,短语“DNA连接多核苷酸”和“连接多核苷酸”是指长度为约18至约500个碱基对的多核苷酸,其由植物基因组的内源染色体DNA和插入植物基因组中的异源转基因DNA构成。因此,连接多核苷酸可包含约8、10、20、50、100、200或250个碱基对的植物基因组内源染色体DNA和约8、10、20、50、100、200或250个碱基对的异源转基因DNA,该异源转基因DNA跨越植物染色体DNA中转基因插入位点的一端。染色体中的转基因插入位点通常包含5'连接多核苷酸和3'连接多核苷酸两者。在本文SEQ ID NO:1-34所示的实施例中,5'连接多核苷酸位于序列的5’末端,3’连接多核苷酸位于序列的3'末端。在一个非限制性和说明性的实例中,转基因基因座的5'连接多核苷酸在染色体臂的端粒近端,并且转基因基因座的3'连接多核苷酸在同一染色体臂的着丝粒近端。在另一个非限制性和说明性的实例中,转基因基因座的5'连接多核苷酸在染色体臂的着丝粒近端,并且转基因基因座的3'连接多核苷酸在同一染色体臂的端粒近端。
如本文在植物上下文中使用的术语“供体”是指性状、转基因事件或基因组区段起源的植物或植物系,其中供体可具有呈杂合子或纯合子状态的性状、基因渗入或基因组区段。
如本文所用,术语“切除”和“缺失”在DNA分子的上下文中使用时可互换使用,指DNA分子的给定DNA区段或元件(例如,转基因元件或转基因基因座)的去除。
如本文所用,短语“优良作物植物”是指经过育种以提供一个或多个性状改良的植物。优良作物植物系包括基本上纯合的植物,例如近交或加倍的单倍体。优良作物植物可包括原样使用或在杂交种子生产(例如用于生产F1植物)中用作花粉供体或花粉受体的近交系。优良作物植物可包括自交产生非杂交栽培品种或品种或产生(例如,批量增加)用于杂交种子生产的花粉供体或受体系的近交系。优良作物植物可包括两个不同的优良近交系或双单倍体植物系之间杂交的杂种F1后代。
如本文所用,“事件”、“转基因事件”、“转基因基因座”和相关短语指一个或多个转基因在植物基因组的独特位点处的插入,以及指包含含有转基因插入的基因组DNA的DNA片段、植物细胞、植物和植物部分(例如种子)。此类事件通常包含5'和3'DNA连接多核苷酸两者,并赋予一个或多个有用的性状,包括除草剂耐受性、昆虫抗性、雄性不育等。
如本文所用,短语“内源序列”、“内源基因”、“内源DNA”等是指多核苷酸、基因或多肽在其于生物体或生物体基因组中的天然位置中的天然形式。
如本文所用,术语“外源DNA序列”是已从其天然位置移除并插入新位置从而改变位于已移动的核酸序列侧翼的序列的任何核酸序列。例如,外源DNA序列可以包含来自另一个物种的序列。
如本文所用,术语“F1”是指两个遗传上不同的个体之间杂交的任何后代。
如本文所用,术语“基因”是指由DNA序列组成的遗传单位,其占据染色体上的特定位置并且包含生物体中特定特征或性状的遗传指令。因此,术语“基因”包括核酸(例如,DNA或RNA)序列,其包含产生RNA或多肽或其前体所必需的编码序列。功能性多肽可以由全长编码序列或由编码序列的任何部分编码,只要RNA或多肽的所期望的活性或功能特性(例如,酶活性、杀有害生物活性、配体结合和/或信号转导)被保留。
如本文所用的关于植物的术语“鉴定”是指建立植物的身份或区分性状(包括展示某种性状、含有一个或多个转基因、和/或含有一个或多个分子标记)的过程。
如本文所用的术语“分离的”意指已经从其自然环境中移除。
如本文所用,术语“包括(include、includes和including)”应被解释为至少具有它们所指的特征而不排除任何另外的未指定特征。
如本文所用,短语“引入的转基因”是初始转基因事件的基因组中的原始转基因基因座中或从初始转基因事件获得的后代品系的基因组中不存在的转基因。引入的转基因的实例包括插入常驻的原始转基因基因座中的外源转基因。
如本文所用,术语“基因渗入”、“基因渗入的”和“进行基因渗入”是指自然和人工过程,以及由此产生的植物,其中通过将一个物种、品种或栽培品种与另一个物种、品种或栽培品种杂交来将性状、基因或DNA序列从所述一个物种、品种或栽培品种移至所述另一个物种、品种或栽培品种。该过程可以任选地通过回交到轮回亲本来完成。基因渗入的实例包括将基因、转基因、调控元件、标记、性状、性状基因座或染色体区段从一个植物的基因组进入或引入另一个植物的基因组中。
如本文所用,短语“标记辅助选择”是指以下诊断过程:鉴定,随后任选地使用分子标记的存在作为诊断特征或选择标准从一组植物中选择植物。该过程通常涉及检测植物基因组中特定核酸序列或多态性的存在。
如本文所用,短语“分子标记”是指用于可视化核酸序列特征差异的方法中的指标。此类指标的实例包括限制性片段长度多态性(RFLP)标记、扩增片段长度多态性(AFLP)标记、单核苷酸多态性(SNP)、微卫星标记(例如SSR)、序列特征扩增区域(SCAR)标记、下一代测序(NGS)分子标记、切割扩增多态性序列(CAPS)标记或同功酶标记或本文所述的定义特定的遗传和染色体位置的标记的组合。
如本文所用,术语“天然的”或“自然的”定义在自然界中发现的条件。“天然DNA序列”是自然界中存在的DNA序列,它是通过自然手段或传统育种技术产生的,而不是通过基因工程(例如,使用分子生物学/转化技术)产生的。
如本文所用,术语“后代”是指由杂交、自交或其他繁殖技术产生的任何子代。
短语“可操作地连接”是指一种并列关系,其中如此描述的组分处于允许它们以其预期方式发挥功能的关系中。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。当在特征性PAM位点和DNA连接多核苷酸的上下文中使用短语“可操作地连接”时,它是指特征性PAM位点,当存在与邻近PAM位点的序列互补的指导RNA时其允许用识别PAM位点的RNA依赖性DNA核酸内切酶、RNA依赖性DNA结合蛋白或RNA依赖性DNA切口酶切割连接多核苷酸中的至少一条DNA链。当在sigRNA位点和DNA连接多核苷酸的上下文中使用短语“可操作地连接”时,它是指sigRNA位点,当存在与邻近sigRNA位点的异源序列互补的指导RNA时其允许用识别sigRNA位点的RNA依赖性DNA核酸内切酶、RNA依赖性DNA结合蛋白或RNA依赖性DNA切口酶切割连接多核苷酸中的至少一条DNA链。
如本文所用,术语“植物”包括整个植物以及植物的任何后代、细胞、组织或部分。术语“植物部分”包括植物的任何一个或多个部分,包括例如但不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;或植物器官(例如,花粉、胚、花、果实、芽、叶、根、茎和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织或者组织成结构或功能单位的任何其他植物细胞群。植物细胞或组织培养物可以能够再生具有从其获得该细胞或组织的植物的生理和形态特征的植物,并且能够再生具有与该植物基本相同的基因型的植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、丝、花、籽粒、穗、穗轴、外壳或茎。相比之下,一些植物细胞不能再生以产生植物,并且在本文中称为“不可再生的”植物细胞。
如本文所用的术语“纯化的”定义了分子或化合物以基本上不含通常与天然或自然环境中的分子或化合物相关的污染物的形式分离,并且意味着由于与原始组合物的其他组分分离而提高了纯度。术语“纯化的核酸”在本文中用于描述已经与其他化合物分离的核酸序列,这些其他化合物包括但不限于多肽、脂质和碳水化合物。
如本文所用,术语“受体”是指从供体接收性状、转基因事件或基因组区段的植物或植物系,并且该受体本身可能具有或不具有呈杂合子或纯合子状态的该性状、转基因事件或基因组区段。
如本文所用,术语“轮回亲本”或“轮回植物”描述作为杂交中的受体植物系的优良品系,其将用作连续回交的亲本品系以产生最终所期望系。
如本文所用,术语“轮回亲本百分比”涉及回交后代植物与回交中使用的轮回亲本植物相同的百分比。与轮回亲本的同一性百分比可以通过测量遗传标记如SNP和/或RFLP来实验确定,或者可以根据数学公式进行理论上的计算。
如本文所用,术语“自交的”、“进行自交”和“自交”指用于从相同植物或植物系获得后代的任何过程以及由该过程产生的植物。如本文所用,该术语因此包括任何受精过程(其中胚珠和花粉均来自相同的植物或植物系)以及由此产生的植物。通常,这些术语指的是自花授粉过程和自花授粉产生的后代植物。
如本文所用,术语“选择”是指从一组个体中挑选出特定植物个体的过程,通常基于该个体的特定身份、性状、特征和/或分子标记。
如本文所用,短语“特征性原间隔子相邻基序(sPAM)”或首字母缩写词“sPAM”是指已通过基因组编辑引入转基因植物基因组中的PAM,其中sPAM不存在于包含原始转基因基因座的转基因植物基因组中。sPAM可以通过基因组DNA中一个或多个核苷酸的插入、缺失和/或取代来引入。
如本文所用,短语“特征性指导RNA识别位点”或首字母缩写词“sigRNAR位点”是指包含紧邻PAM位点5'或3'的异源crRNA(CRISPR RNA)结合序列的DNA多核苷酸,其中已经通过基因组编辑将sigRNAR位点引入转基因植物基因组中并且其中至少异源crRNA结合序列不存在于包含原始转基因基因座的转基因植物基因组中。在某些实施例中,异源crRNA结合序列可操作地连接至转基因植物基因组中预先存在的PAM位点。在其他实施例中,异源crRNA结合序列可操作地连接至转基因植物基因组中的sPAM位点。
如本文所用,短语“转基因基因座切除位点”是指保留在植物基因组或在DNA分子(例如分离或纯化的DNA分子)中的DNA,其中包含转基因基因座、基本上由其组成或由其组成的区段已被缺失。在非限制性和说明性的实例中,转基因基因座切除位点因此可以包含连续的DNA区段,该区段包含至少10个碱基对的DNA(其在缺失的转基因基因座或缺失的转基因基因座区段的端粒近端)以及在至少10个碱基对的DNA(其在缺失的转基因基因座或缺失转基因基因座区段的着丝粒近端)。
如本文所用,短语“转基因元件”是指包含以下、基本上由以下组成或由以下组成的DNA区段:启动子、5’UTR、内含子、编码区、3’UTR或聚腺苷酸化信号。聚腺苷酸化信号包括称为“终止子”的转基因元件(例如,NOS、pinII、rbcs、Hsp17、TubA)。
在任何前述定义与通过引用并入本文的任何专利或非专利参考文献、本文引用的任何专利或非专利参考文献或在别处找到的任何专利或非专利参考文献中提供的定义不一致的程度情况下,应当理解,本文将使用该前述定义。
基因组编辑分子可以允许引入靶向遗传改变,从而在各种作物植物中赋予期望的性状(Zhang等人Genome Biol.[基因生物学]2018;19:210;Schindele等人FEBS Lett.[FEBS快报]2018;592(12):1954)。引入作物植物如玉蜀黍和大豆的期望性状包括除草剂耐受性、改善的食物和/或饲料特征、雄性不育和干旱胁迫耐受性。尽管如此,要充分发挥基因组编辑方法在作物改良方面的潜力,就需要有效地将靶向遗传改变掺入适应不同生长条件的不同优良作物植物的种质中。此类优良作物植物还将理想地包含有用的转基因基因座,其赋予各种性状,包括除草剂耐受性、有害生物抗性(例如;昆虫、线虫、真菌疾病和细菌疾病抗性),用于杂交种子生产的条件性雄性不育系统,非生物胁迫耐受性(例如,干旱耐受性),改善的食品和/或饲料质量,以及改善的工业用途(例如,生物燃料)。本文提供的是将靶向遗传改变与优良后代植物系(例如,用于杂交种子生产或用于近交品种生产的优良近交系)中的所期望的转基因基因座子集有效组合的方法。还提供了含有可以被选择性切除的转基因基因座的植物基因组、通过切除此类经修饰的转基因基因座产生的独特的转基因基因座切除位点、包含经修饰的转基因基因座的DNA分子、独特的转基因基因座切除位点和/或包含它们的植物、包含该DNA的生物样品、适于检测DNA分子的核酸标记、以及鉴定包含独特转基因基因座切除位点的优良作物植物的相关方法。
本文进一步提供了通过在这种插入物内或附近定向插入、缺失和/或取代DNA来改进植物基因组中预先存在的转基因基因座,以及实现和使用这种改进的方法。在某些实施例中,本文提供的改进的转基因基因座的特征在于可以根据需要促进从基因组中去除转基因基因座的多核苷酸序列。这种改进的转基因基因座和相关制作方法的有用应用包括在某些育种系中靶向切除给定的转基因基因座,以便于获得具有为特定地理位置和/或种植者偏好定制的转基因性状子集的种质。此类改进的转基因基因座和相关制作方法的其他有用应用包括当期望在不破坏其他转基因基因座和/或非转基因基因座的情况下替换育种系中的性状时从某些育种系中去除转基因性状。在某些实施例中,改进的转基因基因座可提供新转基因的插入,其在改进的转基因基因座的基因组位置处赋予替代或其他所期望性状。
本文提供的方法可用于切除任何转基因基因座,其中包含在植物基因组中的转基因插入位点处连接的内源非转基因基因组DNA和异源转基因DNA的5'和3'连接序列是已知的或已被确定。在本文提供的某些实施例中,可以从作物植物系中去除转基因基因座以获得具有转基因基因座的定制组合和任选的靶向遗传改变的作物植物系。这种5'和3'连接序列很容易在新的转基因事件中通过反向PCR技术使用与插入的转基因序列互补的引物来鉴定。在某些实施例中,公布了5'和3'连接序列。可在本文提供的方法中改进和使用的转基因基因座的实例包括分别列于表1、2、3和4中的玉蜀黍、大豆、棉花和卡诺拉油菜转基因基因座。某些事件的转基因连接序列也描绘在附图中。表1-4中列出的此类转基因基因座存在于作物植物中,这些作物植物在某些情况下已被栽培、投入商业,和/或已由各种政府机构在各种出版物中进行了描述。汇编了包括表1-4中所列基因座在内的已批准转基因基因座描述的数据库包括国际农业生物技术应用采购服务(International Service for theAcquisition of Agri-biotech Applications,ISAAA)数据库(可在互联网站点“isaaa.org/gmapprovaldatabase/event”上获得)、GenBit LLC数据库(可在互联网网站“genbitgroup.com/en/gmo/gmodatabase”上获得)和生物安全信息交换所(BiosafetyClearing-House,BCH)数据库(可在http互联网网站“bch.cbd.int/database/organisms”上获得)。
表1.玉米事件(转基因基因座)
/>
/>
/>
/>
1性状:IR=昆虫抗性;HT=除草剂耐受性;AR=抗生素抗性;MU=甘露糖利用率;BF=生物燃料;MS=雄性不育;MSR=雄性不育恢复;Q=食品和/或饲料质量;AST=非生物胁迫耐受性;YG=产率/生长。
2每个美国专利或专利申请公开均通过引用以其整体并入本文。
3单个转基因赋予植物草甘膦耐受性并表现出草甘膦诱导的雄性不育。
4对鞘翅目和鳞翅目有害生物的抗性。
表2.大豆事件(转基因基因座)
1性状:IR=昆虫抗性;HT=除草剂耐受性;AR=抗生素抗性;MU=甘露糖利用率;BF=生物燃料;MS=雄性不育。
2每个美国专利或专利申请公开均通过引用以其整体并入本文。
3ATCC是美国典型培养物保藏中心(American Type Culture Collection),10801马纳萨斯大学大道,VA 20110USA(用于“PTA-XXXXX”保藏)。
4NCIMB是国家工业、食品和海洋细菌保藏中心(National Collection ofIndustrial,Food and Marine Bacteria),弗格森大楼(Ferguson Building),克莱伯斯通庄园(Craibstone Estate),巴克斯伯恩(Bucksburn),阿伯丁AB9YA(Aberdeen AB9YA),苏格兰。
5针对以下的HT:2,4-D;草甘膦和草铵膦;也称为pDAB8264.44.06.1。
6独立的IR/HT和HT事件通过育种组合。IR/HT事件(Cry1F、Cry1Ac synpro(Cry1Ac)和PAT)是DAS81419-2,以PTA-12006保藏于ATCC,也称为DAS81419-2。
7麋鹿丘种子(Elk Mound Seed),铁路街308号,麋鹿丘,威斯康星州,USA 54739。
8针对麦草畏的HT。
9针对草甘膦和异草酮除草剂的HT。
10针对草铵膦和甲基磺草酮除草剂的HT。
表3.棉花事件(转基因基因座)
1性状:IR=昆虫抗性;HT=除草剂耐受性;AR=抗生素抗性;SM=可筛选标记
2cry1Ac棉花事件3006-210-23和cry1F棉花事件281-24-236在US 7,179,965中描述了;作为PTA-6233保藏在ATCC的包含两个事件的种子。
3包含MON531嵌合Cry1A和MON15985X Cry2Ab插入两者。
4对麦草畏和草铵膦除草剂的耐受性。
表4.卡诺拉油菜事件(转基因基因座)
/>
1性状:HT=除草剂耐受性;MS=雄性不育
表1-4(例如,SEQ ID NO:1-34)、其中列出并通过引用整体并入本文的专利参考文献以及本披露的其他地方列出了5'和3'连接多核苷酸以及通过本文提供的方法可以被改进的某些转基因基因座的一个或多个转基因插入的序列。表1和表2中某些玉蜀黍和大豆转基因基因座的5'和3'连接多核苷酸的位置在表5中提供。此类5'连接多核苷酸跨越表5中指示的转基因事件(即转基因基因座)的5'植物基因组侧翼核苷酸和转基因插入核苷酸的连接。此类3'连接多核苷酸跨越指示的转基因事件(即转基因基因座)的转基因插入核苷酸和3'植物基因组侧翼核苷酸的连接。在本文提供的某些实施例中,表1-4中列出的转基因基因座(例如,SEQ ID NO:1-4)被称为“原始转基因基因座”。对应于表1-4(例如,SEQ ID NO:1-34)、其中列出并通过引用以其整体并入本文的专利参考文献和本披露的其他地方中列出的序列的等位基因或其他变体序列(其可能存在于某些变异的转基因植物基因座中)也可以通过进行成对比对(例如,使用带有默认参数的CLUSTAL O 1.2.4)鉴定对应于表1-5的序列的变体中的序列并在等位基因或其他变体序列中进行相应的改变来进行改进。此类等位基因或其他变体序列包括跨表1-4(例如,SEQ ID NO:1-34)、其中列出并通过引用以其整体并入本文的专利参考文献以及在本披露的其他地方中列出的序列的全长或至少20、40、100、500、1,000、2,000、4,000、8,000、10,000或12,000个核苷酸具有至少85%、90%、95%、98%或99%序列同一性的序列。还提供了表1-4中列出的植物、基因组DNA和/或从植物获得的DNA,其包含一个或多个修饰(例如,通过插入一个或多个与一个或多个连接序列可操作地连接的sPAM和/或sigRNAR位点),这些修饰提供了它们的切除以及转基因基因座切除位点,其中缺失了包含转基因基因座、基本上由其组成或由其组成的区段。在某些实施例中,表1-4和SEQ ID NO:1-34中列出的转基因基因座通过缺失包含可选择标记基因、基本上由其组成或由其组成的DNA区段和/或非必需的DNA进一步修饰。本文还提供了检测表1-4中列出的植物、基因组DNA和/或从植物获得的DNA的方法,它们包含sPAM位点、sigRNAR位点、可选择标记基因的缺失、非必需DNA的缺失或转基因基因座切除位点。
表5.表1和表2中某些玉蜀黍和大豆转基因基因座的5'和3'连接多核苷酸的位置。
1US 8759618中未提供HCEM485的5’植物基因组侧翼核苷酸
本文提供的方法可用于多种育种方案以获得包含所期望的经修饰的转基因基因座的子集的优良作物植物,所述经修饰的转基因基因座包含一个或多个sPAM和/或sigRNAR位点,其可操作地连接至一个或多个连接序列和转基因基因座切除位点,其中不期望的转基因基因座已被缺失(例如,通过使用sPAM和/或sigRNAR位点)。这样的方法是有用的,至少在它们允许产生不同的有用的供体植物系的范围内,每个供体植物系具有经修饰的转基因基因座的独特集,并且在一些情况下,具有针对不同的地理和/或产品供应而定制的靶向遗传改变。在说明性和非限制性实例中,包含仅赋予三种类型除草剂耐受性(例如草甘膦、草铵膦和麦草畏)中的两种的转基因基因座的不同产品系可以从单一供体系获得,该单一供体系包含三个赋予对所有三种除草剂抗性的不同转基因基因座。在某些方面,包含不期望的转基因基因座和转基因基因座切除位点的子集的植物可以进一步包含靶向遗传改变。此类优良作物植物可以是近交植物系或可以是杂交植物系。在某些实施例中,至少两个转基因基因座(例如表1-4中的转基因基因座或其修饰,其中一个或多个sPAM位点和/或sigRNAR位点可操作地连接至连接序列并且任选地可选择标记基因和/或非必需DNA被缺失)进行基因渗入到包含优良作物植物种质的所期望供体系中,然后经受基因组编辑分子以获得植物,这些植物包含两个渗入转基因基因座之一以及通过基因组编辑分子切除另一个转基因基因座而引入的转基因基因座切除位点。在某些实施例中,基因组编辑分子可用于去除转基因基因座并在作物植物基因组中引入靶向遗传改变。可以通过将包含转基因基因座的植物与包含所期望优良种质的轮回亲本回交并选择具有转基因基因座和轮回亲本种质的后代来实现基因渗入。此类回交可以通过使用SNP或其他核酸标记的分子辅助育种技术重复和/或补充,以选择轮回亲本种质,直到获得所期望的轮回亲本百分比(例如,至少约95%、96%、97%、98%或99%的轮回亲本百分比)。图11(底部“可替代性”分图)显示了用于获得具有转基因基因座子集和靶向遗传改变两者的植物的方案的非限制性说明性描述,其中两个或更多个转基因基因座(在图11中的“事件”)在系A中提供,然后通过基因渗入转移到优良作物植物种质中。在非限制性图11说明中,基因渗入可以通过将包含两个或更多个经修饰的转基因基因座的“系A”与优良种质杂交,然后将包含转基因基因座的杂交的后代与作为轮回亲本的优良种质回交以获得包含两个或更多个经修饰的转基因基因座的“通用供体”(例如图11中的系A+)。这种含有经修饰的转基因基因座的优良种质(例如图11的“通用供体”)然后可以经受基因组编辑分子,这些分子可以切除至少一个转基因基因座(图11中的“事件去除”))并在优良作物植物的基因组中引入其他靶向遗传改变(图11中的“GE”),这些优良作物植物包含一个转基因基因座和对应于一个转基因基因座的去除位点的转基因基因座切除位点。这种转基因基因座的选择性切除可以通过将包含两个转基因基因座的植物基因组与识别一个转基因基因座但不是另一个转基因基因座的基因编辑分子(例如,RdDe和gRNAs、TALENS和/或ZFN)接触。因此获得了具有不同转基因基因座子集和所期望的靶向遗传改变的不同植物系(图11中的例如“系B-1”、“系B-2”和“系B-3”)。在某些实施例中,还期望通过自交扩大包含转基因基因座子集和转基因基因座切除位点的近交优良作物植物或其种子的群体。这种自交植物的近交后代可以按原样用于商业销售,在这种情况下,作物可以长出包含所期望转基因基因座的子集和一个或多个转基因基因座切除位点的变种非杂交作物(例如,通常但不总是在大豆、棉花或卡诺拉油菜中)。在某些实施例中,自交植物的近交后代可用作杂交种子生产的花粉供体或受体(例如,最常见于玉蜀黍,但也在棉花、大豆和卡诺拉油菜中)。这样的杂交种子和从其生长的后代可以包含所期望的转基因基因座的子集和转基因基因座切除位点。
在本文中还提供了包含优良作物植物种质、至少一个转基因基因座和至少一个转基因基因座切除位点,以及在某些方面另外的靶向遗传改变的杂交植物系。用于生产此类杂交种子的方法可包括使优良作物植物系杂交,其中花粉供体或受体中至少一种至少包含转基因基因座和转基因基因座切除位点和/或另外的靶向遗传改变。在某些实施例中,花粉供体和受体将包含不同杂种优势群的种质,并且提供表现出杂种优势的杂交种子和植物。在某些实施例中,花粉供体和受体可以各自包含不同的转基因基因座,其赋予不同的性状(例如,除草剂耐受性或昆虫抗性)、不同类型的性状(例如,对不同除草剂或不同昆虫诸如鞘翅目或鳞翅目昆虫的耐受性)、或同一性状的不同作用模式(例如,通过两种不同的作用模式对鞘翅目昆虫的抗性或通过两种不同的作用模式对鳞翅目昆虫的抗性)。在某些实施例中,将使花粉受体雄性不育或条件性雄性不育。用于诱导雄性不育或条件性雄性不育的方法包括去势(例如,去雄)、细胞质雄性不育、化学杂交剂或系统、转基因或转基因系统和/或一种或多种内源植物基因中的一个或多个突变。可以适用于本文提供的优良作物植物的各种雄性不育系统的描述在Wan等人Molecular Plant[分子植物];12,3,(2019):321-342以及US 8,618,358;US 20130031674;和US 2003188347中有所描述。
在某些实施例中,期望使用基因组编辑分子来切除转基因基因座和/或在良种作物植物或其他种质中进行靶向遗传改变。用于在作物植物(例如,玉米)中实现基因组编辑的技术包括使用形态发生因子,诸如Wuschel(WUS)、胚珠发育蛋白(ODP)和/或Babyboom(BBM),其可以提高恢复具有所期望基因组编辑的植物的效率。在一些方面,形态发生因子包括WUS1、WUS2、WUS3、WOX2A、WOX4、WOX5、WOX9、BBM2、BMN2、BMN3和/或ODP2。在某些实施例中,使用WUS、BBM和/或ODP的组合物和方法,以及可以适用于在优良作物植物和其他种质中实现基因组编辑的其他技术在US 20030082813、US 20080134353、US 20090328252、US20100100981、US 20110165679、US 20140157453、US 20140173775和US 20170240911中阐述,其各自通过引用以其整体并入。在某些实施例中,基因组编辑可以在优良作物植物的可再生植物部分(例如,植物胚)中通过瞬时提供基因编辑分子或编码其的多核苷酸来实现,并且不一定需要将选择标志物基因掺入植物基因组中(例如,US 20160208271和US20180273960,这两个专利均通过引用以其整体并入本文;Svitashev等人Nat Commun[自然通讯].2016;7:13274)。
在某些实施例中,经编辑的转基因植物基因组、含有那些基因组的转基因植物细胞、部分或植物,以及从中获得的DNA分子,可以包含所期望的转基因基因座子集和/或包含至少一个转基因基因座切除位点。在非限制性和说明性实例(其中包含经修饰的转基因基因座(例如,包含一个或多个与5’或3’连接序列可操作地连接的sPAM或sigRNAR位点的转基因基因座)的区段已经被缺失)中,转基因基因座切除位点可以包含连续的DNA区段,该连续的DNA区段包含至少10个碱基对的DNA(其在缺失的转基因基因座区段的端粒近端)和至少10个碱基对的DNA(其在缺失的转基因基因座区段的着丝粒近端),其中已经插入作物植物基因组的转基因DNA(即异源DNA)已经被缺失。在某些实施例(其中包含转基因基因座的区段已经被缺失)中,转基因基因座切除位点可包含连续的DNA区段,该连续的DNA区段包含至少10个碱基对的DNA(其在缺失的转基因基因座区段的端粒近端)和至少10个碱基对的DNA(其是缺失的转基因基因座区段的着丝粒近端DNA)其中异源转基因DNA和位于已被缺失的原始转基因基因座的5’连接序列中和/或3’连接序列中的至少1、2、5、10、20、50或更多个碱基对的内源DNA。在包含转基因基因座的DNA被缺失的此类实施例中,转基因基因座切除位点可以包含至少10个碱基对的DNA(它在转基因基因座的缺失区段的端粒近端)和至少10个碱基对的DNA(它在转基因基因座的缺失区段的着丝粒近端),其中所有转基因DNA都不存在,并且存在转基因DNA序列侧翼的全部或少于全部的内源DNA。在某些实施例(其中基本上由原始转基因基因座组成的区段已经被缺失)中,转基因基因座切除位点可以是连续区段,该连续区段是至少10个碱基对的DNA(其在缺失的转基因基因座区段的端粒近端)和至少10个碱基对的DNA(其在缺失的转基因基因座区段的着丝粒近端)其中少于已插入作物植物基因组的异源转基因DNA的全部被切除。在某些上述实施例(其中基本上由原始转基因基因座组成的区段已被缺失)中,转基因基因座切除位点可因此包含至少1个碱基对的DNA或1至约2或5、8、10、20或50个碱基对的DNA,其包含已插入作物植物基因组的端粒近端和/或着丝粒近端异源转基因DNA。在某些实施例(其中由原始转基因基因座组成的区段已经被缺失)中,转基因基因座切除位点可以包含连续的DNA区段,该连续的DNA区段包含至少10个碱基对的DNA(其在缺失的转基因基因座区段的端粒近端)和至少10个碱基对的DNA(其在缺失的转基因基因座区段的着丝粒近端),其中已插入作物植物基因组的异源转基因DNA被缺失。在某些实施例(其中由转基因基因座组成的DNA已经被缺失)中,转基因基因座切除位点可以包含至少10个碱基对的DNA(其在缺失的转基因基因座区段的端粒近端)和至少10个碱基对的DNA(其在缺失的转基因基因座区段的着丝粒近端),其中已插入作物植物基因组的异源转基因DNA的全部被缺失并且转基因基因座的异源序列侧翼的内源DNA的全部都存在。在任何上述实施例或其他实施例中,包含转基因基因座切除位点的连续DNA区段还可包含在缺失的转基因基因座区段的端粒近端的DNA和在缺失的转基因基因座区段的着丝粒近端的DNA之间的1至约2、5、10、20或更多个核苷酸的插入。此类插入可由在切除位点引入的双链断裂处的内源DNA修复和/或重组活动和/或由寡核苷酸的有意插入引起。本文提供了包含转基因基因座切除位点的植物、经编辑的植物基因组、生物样品和DNA分子(例如,包括分离的或纯化的DNA分子)。
在某些实施例中,提供了经批准的转基因基因座的经修饰形式,这些经修饰形式可包含一个或多个sPAM位点和/或sigRNAR位点,其可操作地连接至连接序列并且进一步包含可选择标记基因的缺失。在它们的未修饰形式中(在某些实施例中,“未修饰形式”是“原始形式”、“原始转基因基因座”等),许多批准的转基因基因座包含至少一个可选择标记基因。在经修饰的版本中,至少一个可选择标记已经用如本文别处所述的基因组编辑分子从未修饰的批准的转基因基因座中缺失。在某些实施例中,可选择标记基因的缺失不影响批准的转基因基因座的任何其他功能。在某些实施例中,被缺失的可选择标记基因赋予对抗生素的抗性、对除草剂的耐受性或在特定碳源例如甘露糖上生长的能力。在某些实施例中,可选择标记基因包含编码如下的DNA:膦丝菌素乙酰转移酶(PAT)、草甘膦耐受性5-烯醇丙酮酸莽草酸-3-磷酸合酶(EPSPS)、草甘膦氧化酶(GOX)、新霉素磷酸转移酶(npt),潮霉素磷酸转移酶(hyg)、氨基糖苷腺苷转移酶或磷酸甘露糖异构酶(pmi)。在某些实施例中,经修饰的基因座不包含位点特异性重组系统DNA识别位点,例如,在某些实施例中,经修饰的基因座不包含lox或FRT位点。在某些实施例中,待缺失的可选择标记基因侧翼是经批准的转基因基因座的未修饰形式中可操作地连接的原间隔子相邻基序(PAM)位点。因此,在经修饰的基因座的某些实施例中,PAM位点位于缺失的可选择标记基因的切除位点的侧翼。在某些实施例中,PAM位点被RNA依赖性DNA核酸内切酶(RdDe)识别;例如,2类II型或2类V型RdDe。在某些实施例中,缺失的可选择标记基因在经修饰的批准的转基因基因座中被引入的DNA序列替代,如本文别处进一步详细讨论的。例如,在某些实施例中,引入的DNA序列包含性状表达盒,例如另一个转基因基因座的性状表达盒。除了可选择标记基因的缺失之外,在某些实施例中,还用基因组编辑分子从未修饰的批准的转基因基因座中缺失了至少一个重复序列拷贝。在某些实施例中,重复序列的缺失增强了经修饰的批准的转基因基因座的功能。在某些实施例中,批准的经修饰的转基因基因座是:(i)转基因玉蜀黍植物基因组中的Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140、和/或TC1507转基因基因座;(ii)转基因大豆植物基因组中的A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、MST-/>-3、和/或SYHT0H2转基因基因座;(iii)转基因棉花植物基因组中的DAS-21023-5、DAS-24236-5、COT102、LL棉花25(LLcotton25)、MON15985、MON88701、和/或MON88913转基因基因座;或(iv)转基因卡诺拉油菜植物基因组中的GT73、HCN28、MON88302、和/或MS8转基因基因座。本文还提供了包含任何上述经修饰的转基因基因座的植物。
在某些实施例中,经编辑的转基因植物基因组和含有那些经编辑的基因组的转基因植物细胞、植物部分或植物包含原始转基因基因座的修饰,其中该修饰包含可操作地连接至连接序列的一个或多个sPAM位点和/或sigRNAR位点,并且任选地缺失原始转基因基因座的区段。在某些实施例中,修饰包含两个或更多个单独的缺失和/或在两个或更多个原始转基因植物基因座中存在修饰。在某些实施例中,缺失区段包含以下、基本上由以下组成或由以下组成:转基因基因座中的非必需DNA区段。非必需DNA的说明性实例包括但不限于合成的克隆位点序列、转基因序列的重复;转基因序列的片段,和农杆菌右和/或左边界序列。在某些实施例中,非必需DNA是启动子序列的重复和/或片段和/或不是可操作地连接在盒中以驱动转基因表达的启动子序列。在某些实施例中,非必需DNA的切除改进了转基因基因座的转基因的特征、功能和/或表达,或者以其他方式赋予包含经编辑的转基因植物基因组的转基因植物的公认的改进。在某些实施例中,非必需DNA不包含编码可选择标记基因的DNA。在经编辑的转基因植物基因组的某些实施例中,修饰包括非必需DNA的缺失和可选择标记基因的缺失。产生经编辑的转基因植物基因组的修饰可以通过同时切除非必需DNA和可选择标记基因两者来发生例如,在相同的修饰步骤中,或者修饰可以逐步发生。例如,其中可选择标记基因先前已从转基因基因座移除的经编辑的转基因植物基因组可包含从中进一步切除非必需DNA的原始转基因基因座,并且反之亦然。在某些实施例中,包含非必需DNA缺失和可选择标记基因缺失的修饰包括切除包含非必需DNA和可选择标记基因两者的原始转基因基因座的单个区段。这种修饰将导致经编辑的转基因基因组中的一个切除位点对应于非必需DNA和可选择标记基因两者的缺失。在某些实施例中,包括非必需DNA的缺失和可选择标记基因的缺失的修饰包括切除原始转基因基因座的两个或更多个区段以实现非必需DNA和可选择标记基因的缺失。这种修饰将导致经编辑的转基因基因组中的至少有两个切除位点对应于非必需DNA和可选择标记基因两者的缺失。在经编辑的转基因植物基因组的某些实施例中,在切除之前,要缺失的区段侧翼是原始或未经修饰的转基因基因座中可操作地连接的原间隔子相邻基序(PAM)位点和/或要缺失的区段包含原始或未修饰的转基因基因座中可操作地连接的PAM位点。在某些实施例中,在区段切除后,得到的经编辑的转基因植物基因组包含位于经修饰的转基因基因座中的缺失位点侧翼的PAM位点。在经编辑的转基因植物基因组的某些实施例中,修饰包括转基因玉米植物基因组中的Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140、和/或TC1507原始转基因基因座的修饰。在经编辑的转基因植物基因组的某些实施例中,修饰包括转基因大豆植物基因组中的A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS40-3-2、MON87701、MON87708、MON89788、MST-/>-3、和/或SYHT0H2原始转基因基因座的修饰。在经编辑的转基因植物基因组的某些实施例中,修饰包括转基因棉花植物基因组中的DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701、和/或MON88913原始转基因基因座的修饰。在经编辑的转基因植物基因组的某些实施例中,修饰包括转基因油菜植物基因组中的GT73、HCN28、MON88302和/或MS8原始转基因基因座的修饰。
本文还提供了适用于检测转基因基因座切除位点的核酸标记以及用于检测包含转基因基因座切除位点的DNA分子的存在的方法。本文还提供了用于检测植物、经编辑的植物基因组和生物样品的方法和试剂(例如,包括核酸探针和/或引物的核酸标记),这些植物、经编辑的植物基因组和生物样品含有包含转基因基因座切除位点和/或非必需DNA缺失的DNA分子。DNA分子的检测可以通过核酸扩增(例如,PCR扩增)、杂交、测序和/或基于质谱的技术的任何组合来实现。US 20190136331和US 9,738,904中阐述的用于检测未经修饰的转基因基因座中的连接核酸的方法可以适用于检测本文提供的核酸,这两个专利均通过引用以其整体并入本文。在某些实施例中,这种检测通过扩增和/或基于杂交的检测方法来实现,这些检测方法使用特异性识别靶DNA分子(例如,转基因基因座切除位点)但不识别来自未修饰的转基因基因座的DNA的方法(例如,选择性扩增引物)和/或探针(例如,能够选择性杂交或产生特异性引物延伸产物)。在某些实施例中,杂交探针可包含可检测标记(例如荧光标记、放射性标记、表位标记和化学发光标记)。在某些实施例中,单核苷酸多态性检测分析可适用于检测靶DNA分子(例如,转基因基因座切除位点)。
在某些实施例中,转基因植物基因座的改进是通过引入新的特征性原间隔子相邻基序(sPAM)位点获得的,这些位点可操作地连接到转基因植物基因组中转基因基因座的两个DNA连接多核苷酸。此类sPAM位点可被RdDe以及合适的指导RNA(其定向至与sPAM相邻的DNA序列)识别,以提供在两个连接多核苷酸内或附近的切割。在某些实施例中,创建的sPAM被相同类别的RdDe(例如,2类II型或2类V型)或相同的RdDe识别(例如,两个sPAM都被相同的Cas9或Cas 12RdDe识别)。可以通过在DNA连接多核苷酸中插入、缺失和/或取代至少一个核苷酸在植物基因组中创建sPAM位点。这种插入、缺失和/或取代可以在连接多核苷酸的非转基因植物基因组DNA中、连接多核苷酸的插入的转基因DNA中进行,或者可以跨越包含连接多核苷酸的DNA的非转基因植物基因组DNA和插入的转基因DNA的连接。通过使用基因编辑分子(例如,RdDe和指导RNA、RNA依赖性切口酶和指导RNA、锌指核酸内切酶和TALEN)可以在植物基因组中实现此类核苷酸插入和缺失,这些基因编辑分子会在DNA连接多核苷酸中引入平末端双链断裂或交错的双链断裂。在DNA插入的情况下,基因组编辑分子在某些实施例中还可以进一步包含供体DNA模板,该模板包含用于插入的核苷酸。可以使用碱基编辑分子(例如,腺嘌呤碱基编辑器(ABE)或胞嘧啶碱基对编辑器(CBE))在植物核基因组中实现此类核苷酸取代,这些碱基编辑分子与定向至连接多核苷酸的指导RNA一起使用。通过使用位于转基因基因座的连接多核苷酸内或附近的预先存在的PAM位点,可以将指导RNA定向至连接多核苷酸。在实例的表7中列出了这种存在于连接多核苷酸中的这种预先存在的PAM位点的非限制性实例,其可被合适的指导RNA用于引导RdDe、RNA依赖的切口酶、ABE或CBE至5’或3’连接多核苷酸中的位置。表6中说明了在DNA序列中创建sPAM位点的非限制性实例。
表6.新特征性原间隔子相邻基序(sPAM)位点的非限制性实例
转换类型 PAM类型 天然未编辑序列1 sPAM序列
取代 Cas9 5'-NWG-3' 5'-NGG-3'
插入 Cas9 5'-NWG-3' 5'-NWGG-3'
取代 Cas9 5'-NGW-3' 5'-NGG-3'
插入 Cas9 5'-NGW-3' 5'-NGGW-3'
缺失 Cas9 5'-NGWG-3' 5'-NGG-3'
取代 Cas12 5’-TSTV-3’ 5’-TTTV-3’
插入 Cas12 5’-TSTV-3’ 5’-TSTTTV-3’
缺失 Cas12 5’-TSTTV-3’ 5’-TTTV-3’
1N=A或C或G或T;V=A/C/G;Y=T或C;S=G或C;W=A或T
在某些实施例中,转基因植物基因座的改进是通过引入新的特征性指导RNA识别(sigRNAR)位点获得的,这些位点可操作地连接到转基因植物基因组中转基因基因座的两个DNA连接多核苷酸。此类sigRNAR位点可被RdDe和合适的指导RNA(其包含与邻近PAM或sPAM位点的异源DNA序列互补的crRNA)识别,以提供在两个连接多核苷酸内或附近的切割。这种在sigRNAR位点引入的异源序列长度为至少17或18个核苷酸,并且与指导RNA的crRNA互补。在某些实施例中,sigRNAR的异源多核苷酸长度为约17或18至约24个核苷酸。sigRNAR中异源DNA序列的非限制性特征包括:(i)与转基因植物基因组或被转化和编辑的特定作物植物(例如,玉米、大豆、棉花、卡诺拉油菜、水稻、小麦等)的其他转基因基因组中存在的任何其他内源或转基因序列缺乏显著的同源性或序列同一性(例如,在异源序列的整个长度上的序列同一性小于50%);(ii)第一sigRNAR位点的异源序列与第二或第三sigRNAR位点的异源序列不存在显著的同源性或序列同一性(例如,在异源序列的整个长度上的序列同一性小于50%);和/或(ii)当与特定PAM序列结合使用时,优化异源序列以供RdDe和指导RNA识别。在某些实施例中,创建的sigRNAR位点被相同类别的RdDe(例如,2类II型或2类V型)或相同的RdDe识别(例如,sigRNAR的两个sPAM或PAM都被相同的RdDe(例如Cas9或Cas12)识别)。在某些实施例中,可以在5'和3'连接多核苷酸两者中引入相同的sigRNAR位点,以允许通过单指导RNA和单RdDe切除转基因基因座。在某些实施例中,可以在不同转基因基因座的5'和3'连接多核苷酸中引入不同不同sigRNAR位点的集,以允许通过定向至位于转基因基因座的侧翼的不同sigRNA位点的单一指导RNA和单一RdDe选择性切除任何单一转基因基因座。通过使用基因组编辑分子将异源序列插入到预先存在的PAM序列附近,可以在植物基因组中创建sigRNAR位点。通过使用基因组编辑分子将异源序列插入到预先存在的PAM序列附近,可以在植物基因组中创建sigRNAR位点。还可以通过在连接多核苷酸中插入异源序列和相关的PAM或sPAM位点两者,在植物基因组中创建sigRNAR位点。这种插入可以在连接多核苷酸的非转基因植物基因组DNA中、连接多核苷酸的插入的转基因DNA中进行,或者可以跨越包含连接多核苷酸的DNA的非转基因植物基因组DNA和插入的转基因DNA的连接。通过使用基因编辑分子(例如,RdDe和指导RNA、RNA依赖性切口酶和指导RNA、锌指核酸酶或切口酶、或TALE核酸酶或切口酶)可以在植物基因组中实现此类核苷酸插入,这些基因编辑分子会在DNA连接多核苷酸中引入平末端双链断裂或交错的双链断裂。在DNA插入的情况下,基因组编辑分子在某些实施例中还可以进一步包含包含用于插入的异源核苷酸的供体DNA模板或其他DNA模板。通过使用位于转基因基因座的连接多核苷酸内或附近的预先存在的PAM位点,可以将指导RNA定向至连接多核苷酸。在表8中列出连接多核苷酸中存在的这种预先存在的PAM位点的非限制性实例,其可以与插入的异源序列结合使用以形成sigRNAR位点,或者其可以用于产生双链断裂以插入或产生sigRNAR位点。实例5中说明了在DNA序列中创建sigRNAR位点的非限制性实例。可用于产生双链断裂以插入或产生sigRNAR位点的接头序列中靶接头多核苷酸序列的非限制性实例在表10中说明。
在5’和3’连接多核苷酸中包含一个或多个预先存在的PAM位点、sPAM位点或sigRNAR位点的转基因基因座可以通过以下从转基因植物的基因组中切除:将转基因基因座与RdDe或RNA引导的切口酶、以及定向至与预先存在的PAM位点或sPAM位点相邻的序列或至sigRNAR位点的合适的指导RNA接触。在某些实施例中,转基因基因座包含5'和3'连接多核苷酸中的一个或多个中的sPAM和预先存在的PAM位点,并使用合适的RdDe和定向至sPAM位点和预先存在的PAM位点的指导RNA切除。在某些实施例中,转基因基因座在5'和3'连接处均包含sPAM位点,并使用合适的RdDe和定向至sPAM位点的指导RNA切除。在某些实施例中,转基因基因座包含5'和3'连接多核苷酸中的一个或多个中的sigRNAR和预先存在的PAM位点,并使用合适的RdDe和定向至sigRNAR位点和预先存在的PAM位点的指导RNA切除。在某些实施例中,转基因基因座包含5'和3'连接多核苷酸中的一个或多个中的sigRNAR和sPAM位点,并使用合适的RdDe和定向至sigRNAR位点和sPAM位点的指导RNA切除。在某些实施例中,转基因基因座在5'和3'连接处均包含sigRNAR位点,并使用合适的RdDe和定向至sigRNAR位点的指导RNA切除。
在某些实施例中,本文提供的经编辑的转基因植物基因组可能缺少在原始事件(转基因基因座)中发现的一个或多个可选择的和/或可评分的标记。原始转基因基因座(事件),包括表1-4中列出的那些(例如,SEQ ID NO:1-34)、其中列出并通过引用以其整体并入本文的专利参考文献中列出的那些和图中描绘的那些,可以包含可选择的转基因标记,这些转基因标记赋予除草剂耐受性、抗生素抗性或在碳源上生长的能力。可以赋予除草剂耐受性的可选择标记转基因包括编码膦丝菌素乙酰转移酶(PAT)、草甘膦耐受性5-烯醇-丙酮酰莽草酸-3-磷酸合酶(EPSPS)和草甘膦氧化酶(GOX)的基因。可以赋予抗生素抗性的可选择标记转基因包括编码新霉素磷酸转移酶(npt)、潮霉素磷酸转移酶和氨基糖苷腺苷转移酶的基因。编码磷酸甘露糖异构酶(pmi)的转基因可以赋予在甘露糖上生长的能力。原始转基因基因座(事件),包括表1-4(例如,SEQ ID NO:1-34)和其中列出并通过引用以其整体并入本文的专利参考文献中列出的那些,可以包含可评分的转基因标记,这些标记可以通过酶促、组织化学或其他测定来检测。可评分标记可包括编码β-葡萄糖醛酸酶(uid)或荧光蛋白(例如GFP、RFP或YFP)的基因。这种可选择或可评分的标记转基因可以通过以下从原始转基因基因座中切除:将转基因基因座与一种或多种基因编辑分子(例如RdDe和指导RNA,其定向至位于包含选择性标记转基因的表达盒的5’和3’末端的PAM位点)接触,所述基因编辑分子在包含可选择标记转基因的表达盒的5’和3’末端处的转基因基因座中引入双链断裂,以及选择其中可选择或可评分标记已被切除的植物细胞、植物部分或植物。在某些实施例中,可选择或可评分标记转基因可以被失活。失活可以通过修饰来实现,包括在可选择标记转基因的启动子元件、5'或3'非翻译区(UTR)、内含子、编码区和/或3'终止子和/或聚腺苷酸化位点中的一个或多个核苷酸的插入、缺失和/或取代。此类修饰可通过消除或降低启动子活性、引入错义突变和/或引入早熟终止密码子来使可选择或可评分标记转基因失活。在某些实施例中,可选择和/或可评分标记转基因可以被引入的转基因替代。在某些实施例中,与基因编辑分子(该基因编辑分子在包含可选择标记和/或可评分转基因的表达盒的5’和3’末端的转基因基因座中引入双链断裂)接触的原始转基因基因座也可以与合适的供体DNA模板接触,该模板包含表达盒,该表达盒的侧翼是与位于可选择标记切除位点的5’和3’的转基因基因座中剩余DNA同源的DNA。在某些实施例中,可选择和/或可评分标记转基因的编码区可以用另一个编码区替换,使得替换编码区可操作地连接到可选择和/或可评分标记转基因的启动子和3'终止子或聚腺苷酸化位点。
在某些实施例中,本文提供的经编辑的转基因植物基因组可包含插入给定事件的转基因基因座中的另外的新引入的转基因(例如,表达盒)。可以通过以下获得在事件的最初分离之后在事件的转基因基因座处插入的引入的转基因:在原始转基因基因座内的位点处诱导双链断裂(例如,用包括RdDe和一个或多个合适的指导RNA的基因组编辑分子);合适的工程改造的锌指核酸酶;TALEN蛋白等)并在供体DNA模板中提供外源转基因,该模板可以整合到双链断裂位点处(例如,通过同源定向修复(HDR)或非同源末端连接(NHEJ))。在某些实施例中,可以使用合适的RdDe、指导RNA和预先存在的PAM位点、sPAM和/或sigRNAR位点,将引入的转基因整合到5'连接多核苷酸或3'连接多核苷酸中。在其他实施例中,位于5'连接多核苷酸或3'连接多核苷酸两者中的预先存在的PAM位点和/或sPAM位点可用于缺失转基因基因座并将其替换为一个或多个新的表达盒。在其他实施例中,位于5'连接多核苷酸或3'连接多核苷酸两者中的sigRNAR位点可用于缺失转基因基因座并将其替换为一个或多个新的表达盒。在某些实施例中,通过在两个连接多核苷酸中引入dsDNA断裂并在供体DNA模板上提供新的表达盒来实现此类缺失和替换。用于插入的合适的表达盒包括包含启动子的DNA分子,所述启动子可操作地连接到编码赋予有用性状的蛋白质的DNA和/或RNA分子,所述DNA和/或RNA分子又可操作地连接到聚腺苷酸化位点或终止子元件。在某些实施例中,此类表达盒还可包含5'UTR、3'UTR和/或内含子。有用的性状包括生物胁迫耐受性(例如,昆虫抗性、线虫抗性或疾病抗性)、非生物胁迫耐受性(例如,热、冷、干旱和/或盐耐受性)、除草剂耐受性和品质性状(例如,改进的脂肪酸组成、蛋白质含量、淀粉含量等)。适合插入的表达盒包括表1-4(例如,SEQ ID NO:1-34)、其中列出并通过引用以其整体并入本文的专利参考文献中或在附图中列出的任何事件(转基因基因座)中包含的表达盒,其赋予昆虫抗性、除草剂耐受性、生物燃料用途或雄性不育性状。
在某些实施例中,本文提供的植物,包括具有一个或多个转基因基因座、经修饰的转基因基因座和/或包含转基因基因座切除位点的植物,可以进一步包含由一个或多个基因编辑分子或系统引入的一个或多个靶向遗传改变。还提供了其中靶向遗传改变和一个或多个转基因基因座切除位点以串联或平行方式从植物中去除的方法(例如,如图11底部的“可替代性”分图中的非限制性图示中所示,其中“GE”可以代表由基因编辑分子诱导的靶向遗传改变,“事件去除”代表用基因编辑分子切除一个或多个转基因基因座)。此类靶向遗传改变包括与缺乏靶向遗传改变的对照植物相比,赋予诸如提高的产量、提高的食物和/或饲料特征(例如,提高的油、淀粉、蛋白质或氨基酸质量或数量)、提高的氮利用效率、提高的生物燃料利用特征(例如,提高的乙醇产量)、雄性不育/条件性雄性不育系统(例如,通过靶向内源MS26、MS45和MSCA1基因)、除草剂耐受性(例如,通过靶向内源ALS、EPSPS、HPPD或其他除草剂靶基因)、延迟开花、不开花、提高的生物胁迫抗性(例如,对昆虫、线虫、细菌或真菌损害的抗性)、增加的非生物胁迫抗性(例如,对干旱、冷、热、金属或盐的抗性)、增强的抗倒伏性、增强的生长速率、增强的生物量、增强的分蘖、增强的分枝、延迟的开花时间、延迟的衰老、增加的花数、用于高密度种植的改进的结构、改进的光合作用、增加的根质量、增加的细胞数、改进的幼苗活力、改进的幼苗大小、增加的细胞分裂速率、改进的代谢效率和增加的分生组织大小的性状的那些靶向遗传改变。可以引入的靶向遗传改变的类型包括作物植物基因组中一个或多个核苷酸的插入、缺失和取代。内源植物基因中用于靶向遗传改变的位点包括启动子、编码区和非编码区(例如,5'UTR、内含子、剪接供体和受体位点以及3'UTR)。在某些实施例中,靶向遗传改变包括在内源植物基因中插入调控DNA序列或其他DNA序列。可以用基因编辑分子插入内源植物基因中以实现赋予有用表型的靶向遗传改变的调节序列的非限制性实例包括美国专利申请公开20190352655(其通过实例并入本文)中列出的那些,诸如:(a)生长素响应元件(AuxRE)序列;(b)至少一个D1-4序列(Ulmasov等人(1997)Plant Cell[植物细胞],9:1963-1971),(c)至少一个DR5序列(Ulmasov等人(1997)Plant Cell[植物细胞],9:1963-1971);(d)至少一个m5-DR5序列(Ulmasov等人(1997)Plant Cell[植物细胞],9:1963-1971);(e)至少一个P3序列;(f)由对应小RNA结合的小RNA识别位点序列(例如,siRNA、微RNA(miRNA)、如美国专利号8,030,473中所述的反式作用siRNA或如美国专利号8,404,928中所述的分阶段sRNA;这两个引用的专利通过引用并入本文);(g)微RNA(miRNA)识别位点序列;(h)特异性结合剂可识别的序列包括工程化miRNA的微RNA(miRNA)识别序列,其中特异性结合剂是对应的工程化成熟miRNA;(i)转座子识别序列;(j)由乙烯响应元件结合因子相关的两亲性阻遏(EAR)基序识别的序列;(k)剪接位点序列(例如,供体位点、分支位点或受体位点;参见例如,在互联网站lemur[dot]amu[dot]edu[dot]pl/share/ERISdb/home.html中列出的剪接位点和剪接信号);(l)由位点特异性重组酶识别的重组酶识别位点序列;(m)编码RNA或氨基酸适体或RNA核糖开关的序列,特异性结合剂是对应的配体,并且表达的变化是上调或下调;(n)由核受体或其激素结合结构域识别的激素响应元件;(o)转录因子结合序列;以及(p)多梳响应元件(参见Xiao等人(2017)Nature Genetics[自然遗传学],49:1546-1552,doi:10.1038/ng.3937)。可以进行靶向基因编辑以赋予有用性状的靶玉米基因的非限制性实例包括:(a)ZmIPK1(耐除草剂和肌醇六磷酸减少的玉米;Shukla等人,Nature.[自然]2009;459:437-41);(b)ZmGL2(叶中的表皮蜡减少;Char等人Plant Biotechnol J.[植物生物技术杂志]2015;13:1002);(c)ZmMTL(单倍体植物的诱导;Kelliher等人Nature.[自然]2017;542:105);(d)Wx1(高支链淀粉含量;US20190032070;将其通过引用以其整体并入本文);(e)TMS5(热敏雄性不育;Li等人J GenetGenomics.[遗传学报]2017;44:465–8);(f)ALS(除草剂耐受性;Svitashev等人;PlantPhysiol.[植物生理学]2015;169:931–45);以及(g)ARGOS8(干旱胁迫耐受性;Shi等人,Plant Biotechnol J.[植物生物技术杂志]2017;15:207-16)。可以进行靶向基因编辑以赋予有用性状的靶大豆基因的非限制性实例包括:(a)FAD2-1A、FAD2-1B(油酸含量增加;Haun等人;Plant Biotechnol J.[植物生物技术杂志]2014;12:934–40);(b)FAD2-1A、FAD2-1B、FAD3A(油酸增加和亚麻酸含量减少;Demorest等人,BMC Plant Biol.[BMC植物生物学]2016;16:225);以及(c)ALS(除草剂耐受性;Svitashev等人;Plant Physiol.[植物生理学]2015;169:931–45)。可以进行靶向基因编辑以赋予有用性状的靶芸苔属基因的非限制性实例包括:(a)赋予早期开花的FRIGIDA基因(Sun Z等人J Integr Plant Biol.[植物学报]2013;55:1092-103);和(b)ALS(除草剂耐受性;US 20160138040,其通过引用以其整体并入本文)。可以经受赋予有用表型的靶向遗传改变的作物植物(包括玉米和大豆)中靶基因的非限制性实例包括美国专利申请号20190352655、20200199609、20200157554和20200231982中列出的那些基因,其各自以其整体并入本文;和Zhang等人(Genome Biol.[基因生物学]2018;19:210)。
在本文提供的方法中使用的基因编辑分子包括能够在双链DNA中,诸如在基因组DNA或位于基因组DNA内的靶基因以及伴随的指导RNA或供体或DNA模板多核苷酸中引入双链断裂(“DSB”)或单链断裂(“SSB”)的分子。此类基因编辑分子的实例包括:(a)核酸酶,包括RNA指导的核酸酶、RNA指导的DNA核酸内切酶或RNA指导的DNA核酸内切酶(RdDe)、1类CRISPR型核酸酶系统、II型Cas核酸酶、Cas9、nCas9切口酶、V型Cas核酸酶、Cas12a核酸酶、nCas12a切口酶、Cas12d(CasY)、Cas12e(CasX)、Cas12b(C2c1)、Cas12c(C2c3)、Cas12i、Cas12j、Cas14、工程化核酸酶、密码子优化的核酸酶、锌指核酸酶(ZFN)或切口酶、转录激活因子样效应物核酸酶(TAL-效应物核酸酶或TALEN)或切口酶(TALE-切口酶)、Argonaute和兆核酸酶或工程化兆核酸酶;(b)编码一种或多种核酸酶的多核苷酸,该一种或多种核酸酶能够实现靶核苷酸序列的位点特异性改变(包括引入DSB或SSB);(c)针对受RNA指导的核酸酶的指导RNA(gRNA),或编码针对受RNA指导的核酸酶的gRNA的DNA;(d)供体DNA模板多核苷酸;和(e)适于在基因组DNA的断裂处插入(例如,通过非同源末端连接(NHEJ)或微同源介导的末端连接(MMEJ))的其他DNA模板(dsDNA、ssDNA、或其组合)。
CRISPR型基因组编辑可以以几种方式适用于本文提供的植物细胞和方法。CRISPR元件,例如包含CRISPR核酸内切酶和CRISPR指导RNA(包括单指导RNA或与tracrRNA或scoutRNA组合的指导RNA,或编码其的多核苷酸)的基因编辑分子,可用于实现基因组编辑,而不会在后代中出现CRISPR元件或选择性遗传标志物的残余。在某些实施例中,将CRISPR元件作为分离的分子、作为无细胞合成过程(例如,在体外翻译中)的分离或半纯化产物、或者作为基于细胞的合成过程(例如像在细菌或其他细胞裂解物中)的分离或半纯化产物直接提供至真核细胞(例如,植物细胞)、系统、方法和组合物。在某些实施例中,基因组插入的CRISPR元件可用于适用于本文提供的方法的植物品系。在某些实施例中,本文提供的系统、方法和组合物中使用的植物或植物细胞可以包含表达CRISPR核酸内切酶(例如,Cas9、Cpf1型或其他CRISPR核酸内切酶)的转基因。在某些实施例中,可以使用一种或多种具有独特PAM识别位点的CRISPR核酸内切酶。指导RNA(sgRNA或crRNA和tracrRNA)形成RNA指导的核酸内切酶/指导RNA复合物,该复合物可以特异性结合gDNA靶位点中与原间隔区相邻基序(PAM)序列相邻的序列。RNA指导的核酸内切酶的类型典型地告知合适的PAM位点的位置和crRNA或sgRNA的设计。富含G的PAM位点,例如,5'-NGG,典型地被靶向用于设计与Cas9蛋白一起使用的crRNA或sgRNA。PAM序列的实例包括5'-NGG(酿脓链球菌(Streptococcuspyogenes))、5'-NNAGAA(嗜热链球菌(Streptococcus thermophilus)CRISPR1)、5'-NGGNG(嗜热链球菌CRISPR3)、5'-NNGRRT或5'-NNGRR(金黄色葡萄球菌(Staphylococcus aureus)Cas9、SaCas9)和5'-NNNGATT(奈瑟氏脑膜炎双球菌(Neisseria meningitidis))。富含T的PAM位点(例如,5'-TTN或5'-TTTV,其中“V”是A、C或G)典型地被靶向用于设计与Cas12a蛋白一起使用的crRNA或sgRNA。在一些情况下,Cas12a也可以识别5'-CTA PAM基序。潜在的Cas12a PAM序列的其他实例包括TTN、CTN、TCN、CCN、TTTN、TCTN、TTCN、CTTN、ATTN、TCCN、TTGN、GTTN、CCCN、CCTN、TTAN、TCGN、CTCN、ACTN、GCTN、TCAN、GCCN和CCGN(其中N定义为任何核苷酸)。Cpf1核酸内切酶和相应的指导RNA和PAM位点在美国专利申请公开2016/0208243A1中披露,其披露的编码Cpf1核酸内切酶和指导RNA和PAM位点的DNA通过引用并入本文。引入与整合到植物基因组中或以其他方式提供给植物的CRISPR核酸内切酶相互作用的广泛多种CRISPR指导RNA中的一种或多种可用于基因编辑用于提供所期望的表型或性状、性状筛选或基因编辑介导的性状渗入(例如,用于将性状引入新基因型而不与轮回亲本回交或与轮回亲本有限回交)。可以在具有适当启动子的表达盒中提供多个核酸内切酶以允多个基因组位点编辑。
在美国专利申请公开2016/0138008A1和US 2015/0344912A1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物的基因的CRISPR技术。Cpf1核酸内切酶和相应的指导RNA和PAM位点在美国专利申请公开2016/0208243A1中披露。其他可用于编辑基因组的CRISPR核酸酶包括Cas12b和Cas12c(参见Shmakov等人(2015)Mol.Cell[分子细胞],60:385–397;Harrington等人(2020)MolecularCell[分子细胞]doi:10.1016/j.molcel.2020.06.022)和CasX和CasY(参见Burstein等人(2016)Nature[自然],doi:10.1038/nature21059;Harrington等人(2020)Molecular Cell[分子细胞]doi:10.1016/j.molcel.2020.06.022),或Cas12j(Pausch等人,(2020)Science[科学]10.1126/science.abb1400)。在国际专利申请PCT/US2015/018104(公开为WO 2015/131101,并要求美国临时专利申请61/945,700的优先权)中公开了用于表达CRISPR指导RNA和植物密码子优化的CRISPR Cas9核酸内切酶的植物RNA启动子。在美国专利申请公开US2015/0082478A1和US 2015/0059010A1以及国际专利申请PCT/US2015/038767A1(公开为WO2016/007347,并要求美国临时专利申请62/023,246的优先权)中公开了在植物中使用CRISPR技术进行基因组编辑的方法。本段中引用的所有专利出版物均通过引用以其整体并入本文。在某些实施例中,使用RNA指导的核酸内切酶,其在切割靶位点后留下平端。平端切割RNA指导的核酸内切酶包括Cas9、Cas12c和Cas 12h(Yan等人,2019)。在某些实施例中,使用RNA指导的核酸内切酶,其在切割靶位点后留下交错的单链DNA突出端。错端切割RNA指导的核酸内切酶包括Cas12a、Cas12b和Cas12e。
这些方法还可以使用序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,它们在dsDNA靶位点中切割单DNA链。dsDNA靶位点中单DNA链的这种切割在本文和其他地方也称为“切口”,并且可以通过各种“切口酶”或提供切口的系统来实现。可以使用的切口酶包括nCas9(包含D10A氨基酸取代的Cas9)、nCas12a(例如包含R1226A氨基酸取代的Cas12a;Yamano等人,2016)、Cas12i(Yan等人2019)、锌指切口酶(例如Kim等人,2012中披露)、TALE切口酶(例如Wu等人,2014中披露),或其组合。在某些实施例中,提供切口的系统可包含Cas核酸酶(例如Cas9和/或Cas12a)和与靶编辑位点中的DNA序列至少有一个碱基错配的指导RNA分子(Fu等人,2019)。在某些实施例中,可以通过在相隔不超过约10、20、30、40、50、60、80、100、150或200个DNA碱基对的基因组位置创建单链断裂(即“缺口”)将基因组修饰引入靶编辑位点。在某些说明性和非限制性实施例中,两种切口酶(即引入单链DNA断裂的CAS核酸酶,包括nCas9、nCas12a、Cas12i、锌指切口酶、TALE切口酶、它们的组合等)或切口酶系统可以引导切割附近的位点,这些位点相隔不超过约10、20、30、40、50、60、80或100个DNA碱基对。在使用RNA指导的切口酶和RNA指导物的情况下,RNA指导物与足够接近(即相隔不超过约10、20、30、40、50、60、80、100、150或200个DNA碱基对)的PAM序列相邻。出于基因编辑的目的,可以设计CRISPR阵列以含有对应于希望的靶DNA序列的一个或多个指导RNA序列;参见例如,Cong等人(2013)Science[科学],339:819-823;Ran等人(2013)Nature Protocols[自然实验手册],8:2281-2308。为了发生DNA裂解,Cas9需要gRNA序列的至少16或17个核苷酸;对于Cpf1,需要gRNA序列的至少16个核苷酸才能实现可检测的DNA切割,并且据报道对于体外进行有效的DNA切割,需要gRNA序列的至少18个核苷酸;参见Zetsche等人(2015)Cell[细胞],163:759-771。在实践中,指导RNA序列通常被设计为具有17-24个核苷酸的长度(通常为19、20或21个核苷酸)以及与靶向的基因或核酸序列的精确互补性(即,完全碱基配对);可以使用与靶序列互补性小于100%的指导RNA(例如,长度为20个核苷酸且与靶序列有1-4个错配的gRNA),但其可以增加脱靶效应的可能性。用于植物基因组编辑的有效指导RNA的设计在美国专利申请公开2015/0082478 A1(其整个说明书通过引用并入本文)中披露。最近,使用嵌合的“单指导RNA”(“sgRNA”)(一种模拟天然存在的crRNA-tracrRNA复合物并包含tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶指导至被靶向进行编辑的序列)的工程化(合成)单RNA分子)已经实现有效基因编辑;参见例如,Cong等人(2013)Science[科学],339:819-823;Xing等人(2014)BMC Plant Biol.[BMC植物生物学],14:327-340。已经证明,在基因组编辑中,经化学修饰的sgRNA是有效的;参见例如,Hendel等人(2015)Nature Biotechnol.[自然生物技术],985-991。用于植物基因组编辑的有效gRNA的设计在美国专利申请公开2015/0082478A1(其整个说明书通过引用并入本文)中披露。
基因组DNA也可以通过碱基编辑进行修饰。将基因组DNA中的A/T碱基对转换为G/C碱基对的腺嘌呤碱基编辑器(ABE)以及影响C到T取代的胞嘧啶碱基对编辑器(CBE)均可用于本文提供的方法的某些实施例中。在某些实施例中,有用的ABE和CBE可以包含基因组位点特异性DNA结合元件(例如,RNA依赖性DNA结合蛋白,包括催化失活的Cas9和Cas12蛋白或Cas9和Cas12切口酶),其可操作地连接到腺嘌呤或胞苷脱氨酶并与指导RNA(其将蛋白质定位在要靶向取代的核苷酸附近)一起使用。文献(Kim,Nat Plants[天然植物],2018年3月;4(3):148-151)中披露的合适的ABE和CBE可适用于本文所述的方法。在某些实施例中,CBE可包含催化失活的Cas9(dCas9)RNA依赖性DNA结合蛋白(其与将胞嘧啶(C)转化为尿苷(U)的胞苷脱氨酶融合)与选定的指导RNA之间的融合,从而实现C至T取代;参见Komor等人(2016)Nature[自然],533:420–424。在其他实施例中,C到T的取代受到Cas9切口酶[Cas9n(D10A)]的影响,该切口酶融合到改进的胞苷脱氨酶和任选的噬菌体μdsDNA(双链DNA)末端结合蛋白Gam;参见Komor等人,Sci Adv.[科学前沿]2017年8月;3(8):eaao4774。在其他实施例中,包含与催化失活Cas9(dCas9)或Cas9 D10A切口酶融合的腺嘌呤脱氨酶的腺嘌呤碱基编辑器(ABE)可用于将基因组DNA中的A/T碱基对转化为G/C碱基对(Gaudelli等人,(2017)Nature[自然]551(7681):464-471。
在某些实施例中,锌指核酸酶或锌指切口酶也可以用于本文提供的方法中。锌指核酸酶是位点特异性核酸内切酶,包含两个蛋白质结构域:DNA结合结构域,其包含多个单独的锌指重复序列,每个重复序列识别9至18个碱基对,和DNA切割结构域,其包含核酸酶结构域(典型地为Fokl)。切割结构域二聚化以便切割DNA;因此,需要一对ZFN来靶向非回文靶多核苷酸。在某些实施例中,已描述的锌指核酸酶和锌指切口酶设计方法(Urnov等人(2010)Nature Rev.Genet.[自然综述遗传学],11:636–646;Mohanta等人(2017)Genes[基因]第8卷,12:399;Ramirez等人Nucleic Acids Res.[核酸研究](2012);40(12):5560–5568;Liu等人(2013)Nature Communications[自然通讯],4:2565)可以适用于本文所述的方法。锌指核酸酶或切口酶的锌指结合结构域提供特异性,并且可以被工程化以特异性识别任何期望的靶DNA序列。锌指DNA结合结构域来源于一大类称为锌指蛋白(ZFP)的真核转录因子的DNA结合结构域。ZFP的DNA结合结构域典型地含有至少三个锌“指”的串联阵列,每个锌“指”识别特定的DNA三联体。许多策略可以用于设计锌指结合结构域的结合特异性。一种称为“模块化组装”的方法,依赖于带有DNA的单个锌指的功能自主性。在这种方法中,通过鉴定序列中每个三联体组分的锌指并将它们连接成多指肽,来靶向给定的序列。还开发了用于设计锌指DNA结合结构域的几种替代策略。这些方法被设计成适应锌指接触相邻指以及它们的靶三联体之外的核苷酸碱基的能力。典型地,与天然存在的锌指蛋白相比,工程化锌指DNA结合结构域具有新的结合特异性。工程化方法包括,例如,合理设计和各种类型的选择。合理设计包括,例如,使用三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列相关联。参见例如,美国专利6,453,242和6,534,261,均通过引用以其整体并入本文。示例性选择方法(例如,噬菌体展示和酵母双杂交系统)可以适用于本文所述的方法。此外,增强锌指结合结构域的结合特异性已在美国专利6,794,136中有所描述,该专利通过引用以其整体并入本文。此外,可以使用任何合适的接头序列将单个锌指结构域连接在一起。接头序列的示例是公知的,例如,参见美国专利6,479,626;6,903,185;和7,153,949,通过引用以其整体并入本文。核酸切割结构域是非特异性的,并且典型地是限制性核酸内切酶,诸如Fokl。这种核酸内切酶必须二聚化才能切割DNA。因此,作为ZFN的一部分被Fokl切割需要两个相邻且独立的结合事件,这两个事件必须以正确的方向和适当的间隔发生以允许二聚体形成。对两个DNA结合事件的要求使得能够更特异性地靶向长的和潜在独特的识别位点。已经描述了具有增强活性的Fokl变体,并且其可以适用于本文所述的方法;参见例如,Guo等人(2010)J.Mol.Biol.[分子生物学杂志],400:96-107。
转录激活因子样效应物(TALE)是由某些黄单胞菌属(Xanthomonas)物种分泌的蛋白质,用于调节宿主植物中的基因表达,并促进细菌的定殖和存活。TALE作为转录因子,并调节植物中抗性基因的表达。最近对TALE的研究揭示了将TALE的重复区域与其靶DNA结合位点连接的密码。TALE包含一个高度保守和重复区域,由大部分33或34个氨基酸区段的串联重复序列组成。重复单体主要在氨基酸位置12和13处彼此不同。已经发现在位置12和13处的独特氨基酸对和在TALE结合位点中的对应核苷酸之间有很强的相关性。氨基酸序列和TALE结合结构域的DNA识别之间的简单关系允许设计任何所期望特异性的DNA结合结构域。TALE可以与非特异性DNA切割结构域连接,以制备基因组编辑蛋白,称为TAL效应核酸酶或TALEN。如在ZFN的情况下,可以方便地使用限制性核酸内切酶,诸如Fokl。在植物中使用TALEN的方法已有描述,并且可以适用于本文所述的方法,参见Mahfouz等人(2011)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],108:2623-2628;Mahfouz(2011)GMCrops[转基因作物],2:99-103;以及Mohanta等人.(2017)Genes[基因]第8卷,12:399。TALE切口酶也已有描述,并且可以适用于本文所述的方法(Wu等人;Biochem Biophys ResCommun.[生物化学和生物物理学研究通讯](2014);446(1):261-6;Luo等人;ScientificReports[科学报告]6,文章编号:20657(2016))。
具有整合在基因组中至少一个双链断裂(DSB)的位点处的序列的供体DNA模板分子的实施例包括双链DNA、单链DNA、单链DNA/RNA杂交体、和双链DNA/RNA杂交体。在实施例中,直接向植物原生质体或植物细胞提供呈双链(例如dsDNA或dsDNA/RNA杂交体)分子的供体DNA模板,其以双链DNA或双链DNA/RNA杂交体的形式,或作为能够杂交形成dsDNA的两个单链DNA(ssDNA)分子,或作为能够杂交形成双链DNA/RNA杂交体的单链DNA分子和单链RNA(ssRNA)分子;也就是说,双链多核苷酸分子不是例如由质粒或其他载体编码的dsDNA在细胞中的表达间接提供的。在该方法的各种非限制性实施例中,在基因组中至少一个双链断裂(DSB)位点处整合(或具有整合的序列)的供体DNA模板分子是双链的并且平末端的;在其他实施例中,供体DNA模板分子是双链的并且在一个末端或两个末端处具有由不配对的核苷酸(例如,1、2、3、4、5或6个不配对的核苷酸)组成的突出端或“粘性末端”。在实施例中,基因组中的DSB在切割位点处没有未配对的核苷酸,并且在DSB位点处整合(或具有在DSB位点处整合的序列)的供体DNA模板分子是平末端双端链DNA或平末端双链DNA/RNA杂交体分子,或者可替代地是单链DNA或单链DNA/RNA杂交体分子。在另一个实施例中,基因组中的DSB在切割位点的一侧或两侧具有一个或多个未配对的核苷酸,并且在DSB位点处整合(或具有在DSB位点处整合的序列)的供体DNA模板分子是在一个或两个末端具有由不配对核苷酸组成的突出端或“粘性末端”的双链DNA或双链DNA/RNA杂交体分子,或可替代地是单链DNA或单链DNA/RNA杂交体分子;在实施例中,供体DNA模板分子DSB是在一个或两个末端包含突出端的双链DNA或双链DNA/RNA杂交体分子,其中突出端由与以偏移方式(其中,Cas12核酸酶在基因组序列中实现具有5个核苷酸突出端的偏移DSB,要整合到DSB位点(或具有要整合到DSB位点的序列)的供体DNA模板分子是双链的,并且在一个或两个末端具有5个不配对的核苷酸)切割的核酸酶在DSB的位点处产生的不配对核苷酸数量相同数量的不配对核苷酸组成。在某些实施例中,供体DNA模板分子的一个或两个末端不包含与DSB侧翼的基因组区域具有序列同源性(同一性或互补性)的区域;也就是说,供体DNA模板分子的一个或两个末端不包含足够互补以允许与紧邻DSB位置的基因组区域杂交的序列区域。在实施例中,供体DNA模板分子不包含与DSB基因座的同源性,也就是说,供体DNA模板分子不包含足够互补以允许与紧邻DSB位置的基因组区域杂交的核苷酸序列。在实施例中,供体DNA模板分子至少部分是双链的并且包括2-20个碱基对,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个碱基对;在实施例中,供体DNA模板分子是双链且平末端的,由2-20个碱基对组成,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个碱基对;在其他实施例中,供体DNA模板分子是双链的并包括2-20个碱基对,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个碱基对,并且在一个或两个末端具有至少一个突出端或由至少一个另外的未配对核苷酸组成的“粘性末端”。在一个实施例中,在基因组中至少一个双链断裂(DSB)位点处整合(或具有在基因组中至少一个双链断裂(DSB)位点处整合的序列)的供体DNA模板分子是平末端双链DNA或具有约18至约300个碱基对、或约20至约200个碱基对、或约30至约100个碱基对并且在5’末端、3’末端或5’和3’末端的相邻核苷酸之间具有至少一个硫代磷酸酯键的平末端双链DNA/RNA杂交体分子。在实施例中,供体DNA模板分子包括至少11、至少18、至少20、至少30、至少40、至少60、至少80、至少100、至少120、至少140、至少160、至少180、至少200、至少240、至少280、或至少320个核苷酸。在实施例中,供体DNA模板分子的长度为至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10,或至少11个碱基对(如果是双链的)或核苷酸(如果是单链的),或约2至约320个碱基对(如果是双链的)或核苷酸(如果是单链的),或约2至约500个碱基对(如果是双链的)或核苷酸(如果是单链的),或约5至约500个碱基对(如果是双链的)或核苷酸(如果是单链的),或约5至约300个碱基对(如果是双链的)或核苷酸(如果是单链的),或约11至约300个碱基对(如果是双链的)或核苷酸(如果是单链的),或约18至约300个碱基对(如果是双链的)或核苷酸(如果是单链的),或约30至约100个碱基对(如果是双链的)或核苷酸(如果是单链的)。在实施例中,供体DNA模板分子包括经化学修饰的核苷酸(参见,例如,描述于Verma和Eckstein(1998)Annu.Rev.Biochem.[生物化学年鉴],67:99-134的核苷酸间键联、碱基和糖的各种修饰);在实施例中,供体DNA模板分子的天然存在的磷酸二酯骨架部分或完全被硫代磷酸酯、二硫代磷酸酯或甲基膦酸酯核苷酸间键联修饰进行修饰,或者供体DNA模板分子包括经修饰的核苷碱基或经修饰的糖,或者供体DNA模板分子被标记有荧光部分(例如,荧光素或罗丹明或荧光核苷类似物)或其他可检测标签(例如,生物素或同位素)。在另一个实施例中,供体DNA模板分子包含提供稳定性或充当适体的二级结构。其他相关实施例包括双链DNA/RNA杂交体分子、单链DNA/RNA杂交体供体分子和单链DNA供体分子(包括单链、化学修饰的DNA供体分子),它们在类似的程序中被整合在双链断裂位点处(或具有被整合在双链断裂位点处的序列)。
本文提供的方法中使用的供体DNA模板分子包括从5'至3'包含第一同源臂、替换DNA和第二同源臂的DNA分子,其中同源臂含有与gDNA中靶位点特异性核酸内切酶切割位点侧翼的基因组DNA(gDNA)序列部分或完全同源的序列。在某些实施例中,替换DNA可以相对于靶gDNA包含1个或多个DNA碱基对的插入、缺失或取代。在实施例中,供体DNA模板分子是双链的,并且在其全部或大部分长度上是完全碱基配对的,其中可能的例外是任一末端或两个末端处的任何不成对的核苷酸。在另一个实施例中,供体DNA模板分子是双链的,并且在另外的双链双链体中包含一个或多个非末端错配或非末端不成对的核苷酸。在实施例中,整合在至少一个双链断裂(DSB)位点处的供体DNA模板分子在一条链(如果是单链的话)或两条链(如果是双链的话)中包含2-20个核苷酸,例如在一条链或两条链上包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸,每个核苷酸均可以与相对链上的核苷酸碱基配对(在完全碱基配对的双链多核苷酸分子的情况下)。此类供体DNA模板可以通过同源定向修复(HDR)整合到含有平的和/或交错的双链DNA断裂的基因组DNA中。在某些实施例中,供体DNA模板同源臂的长度可以是约20、50、100、200、400或600至约800或1000个碱基对。在某些实施例中,供体DNA模板分子可以以环状(例如,质粒或病毒载体,包括双生病毒载体)或线性DNA分子递送至植物细胞。在某些实施例中,使用的环状或线性DNA分子可以包含经修饰的供体DNA模板分子,其从5'至3'包含靶序列特异性核酸内切酶切割位点序列的第一拷贝、第一同源臂、替换DNA、第二同源臂和靶序列特异性核酸内切酶切割位点序列的第二拷贝。不寻求受理论的限制,此类经修饰的供体DNA模板分子可被用于切割真核细胞的靶位点gDNA的相同序列特异性核酸内切酶切割,以释放能参与植物细胞基因组中靶编辑位点的HDR介导的基因组修饰的供体DNA模板分子。在某些实施例中,供体DNA模板可包含线性DNA分子,该分子从5'到3'包含切割的靶序列特异性核酸内切酶切割位点序列、第一同源臂、替换DNA、第二同源臂和切割的靶序列特异性核酸内切酶切割位点序列。在某些实施例中,切割的靶序列特异性核酸内切酶序列可包含以下:平DNA末端或可任选地包含5’磷酸基团的平DNA末端。在某些实施例中,切割的靶序列特异性核酸内切酶序列包含具有单链5’或3’DNA突出端的DNA末端。这种切割的靶序列特异性核酸内切酶切割位点序列可以通过以下来产生:切割完整的靶序列特异性核酸内切酶切割位点序列或合成切割的靶序列特异性核酸内切酶切割位点序列的拷贝。供体DNA模板可以化学合成或酶促合成(例如在聚合酶链反应(PCR)中)。
各种处理可用于将基因编辑分子和/或其他分子递送至植物细胞。在某些实施例中,采用一种或多种处理来将基因编辑或其他分子(例如,包含多核苷酸、多肽或其组合)递送到真核细胞或植物细胞中,例如,穿过屏障诸如细胞壁、质膜、核被膜和/或其他脂质双层。在某些实施例中,例如通过将组合物与植物细胞直接接触,直接递送包含分子的含多核苷酸、多肽或RNP的组合物。前述组合物可以以液体、溶液、悬浮液、乳液、反相乳液、胶体、分散体、凝胶、脂质体、胶束、可注射材料、气溶胶、固体、粉末、微粒、纳米颗粒、或其组合的形式提供,可以直接施用于植物、植物部分、植物细胞或植物外植体(例如,通过磨损或穿刺或其他方式破坏细胞壁或细胞膜,通过喷雾或浸渍或浸泡或其他方式直接接触,通过显微注射)。例如,将植物细胞或植物原生质体浸泡在含液体基因组编辑分子的组合物中,由此将试剂递送至植物细胞。在某些实施例中,使用负压或正压,例如使用真空渗透或施加流体动力或流体压力,来递送含试剂的组合物。在某些实施例中,将含试剂的组合物引入植物细胞或植物原生质体中,例如通过显微注射或通过细胞壁或细胞膜的破裂或变形,例如通过物理处理,诸如通过施加负压或正压、剪切力,或者用化学或物理递送剂诸如表面活性剂、脂质体或纳米颗粒处理;参见例如,如美国公开专利申请2014/0287509中所述,采用微流体流通过细胞变形收缩物将材料递送至细胞,该专利申请通过引用以其整体并入本文。可用于将含试剂的组合物递送至真核细胞、植物细胞或植物原生质体的其他技术包括:超声波或超声处理;振动、摩擦、剪切应力、涡流、气蚀;离心或施加机械力;机械性细胞壁或细胞膜变形或破裂;酶细胞壁或细胞膜破裂或透化;磨损或机械划痕(例如,用金刚砂或其他颗粒磨料磨损或者用锉刀或砂纸划痕)或化学划痕(例如,用酸或腐蚀剂处理);以及电穿孔。在某些实施例中,通过用编码基因组编辑分子(例如,RNA依赖性DNA核酸内切酶、RNA依赖性DNA结合蛋白、RNA依赖性切口酶、ABE或CBE和/或指导RNA)的多核苷酸细菌介导(例如,农杆菌属(Agrobacterium sp.)、根瘤菌属(Rhizobium sp.)、中华根瘤菌属(Sinorhizobiumsp.)、中生根瘤菌属(Mesorhizobium sp.)、慢生根瘤菌属(Bradyrhizobium sp.)、固氮菌属(Azobacter sp.)、叶杆菌属(Phyllobacterium sp.))转染植物细胞或植物原生质体来提供含试剂的组合物;参见,例如,Broothaerts等人(2005)Nature[自然],433:629–633)。这些技术中的任一种或其组合可替代地用于植物外植体、植物部分或组织或完整植物(或种子),随后任选地从其获得或分离植物细胞;在某些实施例中,在分离植物细胞后,在单独的步骤中递送含试剂的组合物。
在一些实施例中,将驱动一个或多个基因组编辑分子或性状赋予基因(例如;除草剂耐受性、昆虫抗性和/或雄性不育性)表达的一个或多个多核苷酸或载体引入植物中细胞。在某些实施例中,多核苷酸载体包含调控元件,例如可操作地连接到编码基因组编辑分子和/或性状赋予基因的一个或多个多核苷酸的启动子。在这样的实施例中,这些多核苷酸的表达可以通过选择合适的启动子来控制,特别是在真核细胞(例如植物细胞)中有功能的启动子;有用的启动子包括组成型、条件型、诱导型和时间或空间特异性启动子(例如组织特异性启动子、发育调节型启动子或细胞周期调节型启动子)。可用于植物细胞的发育调节型启动子包括磷脂转移蛋白(PLTP)、果糖-1,6-双磷酸酶蛋白、NAD(P)结合的罗斯曼折叠(Rossmann-Fold)蛋白、脂肪细胞质膜相关蛋白样蛋白、Rieske[2Fe-2S]铁硫结构域蛋白、叶绿体呼吸(chlororespiratory)还原6蛋白、D-甘油酸3-激酶、叶绿体样蛋白、叶绿素a-b结合蛋白7、叶绿体样蛋白、紫外线B抑制蛋白、索尔(Soul)血红素结合家族蛋白、光系统I反应中心亚基psi-N蛋白和短链脱氢酶/还原酶蛋白,披露于美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)中。在某些实施例中,启动子与编码多个指导RNA的核苷酸序列可操作地连接,其中编码指导RNA的序列被切割位点(例如编码微RNA识别/切割位点或自切割核酶的核苷酸序列)隔开(参见,例如Ferré-D'Amaré和Scott(2014)Cold Spring Harbor Perspectives Biol.[生物学中的冷泉港观点],2:a003574)。在某些实施例中,启动子是与编码一种或多种指导RNA的核苷酸序列可操作地连接的RNA聚合酶III启动子。在某些实施例中,RNA聚合酶III启动子是植物U6剪接体RNA启动子,其可以是植物细胞基因组天然的或来自不同物种,例如,来自玉蜀黍、番茄或大豆的U6启动子,例如美国专利申请公布2017/0166912中披露的启动子,或其同系物;在实例中,这样的启动子可操作地连接到编码第一RNA分子(包括Cas12a gRNA)的DNA序列,随后是可操作地连接的合适的3'元件,例如U6聚-T终止子。在另一个实施例中,RNA聚合酶III启动子是植物U3、7SL(信号识别颗粒RNA)、U2或U5启动子,或其嵌合体,例如,如美国专利申请公布20170166912中所述。在某些实施例中,与一种或多种多核苷酸可操作地连接的启动子是驱动真核细胞(例如植物细胞)中基因表达的组成型启动子。在某些实施例中,启动子驱动细胞核或细胞器(例如叶绿体或线粒体)中的基因表达。用于植物的组成型启动子的示例包括美国专利5,858,742和5,322,938中披露的CaMV 35S启动子、美国专利5,641,876中披露的稻肌动蛋白启动子、美国专利7,151,204中披露的玉蜀黍叶绿体醛缩酶启动子,以及来自根癌农杆菌的胭脂碱合酶(NOS)和章鱼碱合酶(OCS)启动子。在某些实施例中,与编码基因组编辑系统的元件的一种或多种多核苷酸可操作地连接的启动子是来自无花果花叶病毒(FMV)的启动子、RUBISCO启动子或丙酮酸磷酸双激酶(PPDK)启动子(其在光合组织中有活性)。其他考虑的启动子包括细胞特异性或组织特异性或发育调节型启动子,例如,将核酸靶向系统的表达限制于种系细胞或生殖细胞的启动子(例如,编码DNA连接酶、重组酶、复制酶的基因或其他在种系细胞或生殖细胞中特异性表达的基因的启动子)。在某些实施例中,基因组改变仅限于在后代中从其遗传DNA的那些细胞,这在希望限制基因组编辑系统的表达以避免基因毒性或其他不想要的影响的情况下是有利的。本段中引用的所有专利出版物均通过引用以其整体并入本文。
本文提供的表达载体或多核苷酸可包含靠近表达盒3’末端的DNA区段,其充当终止转录的信号并指导所得mRNA的聚腺苷酸化,并且还可支持启动子活性。这种3’元件通常称为“3’-非翻译区”或“3’-UTR”或“聚腺苷酸化信号”。在某些情况下,基于植物基因的3'元件(或终止子)由3'-UTR和下游非转录序列组成(Nuccio等人,2015)。有用的3’元件包括:披露于美国专利号6,090,627(通过引用并入本文)中的根癌农杆菌nos 3'、tml 3'、tmr 3'、tms 3'、ocs 3'和tr7 3'元件,以及披露于美国专利申请公开2002/0192813A1中的来自植物基因(例如来自小麦(Triticum aestivum)的热休克蛋白17、泛素和果糖-1,6-二磷酸酶基因,以及来自水稻(Oryza sativa)的谷蛋白、乳酸脱氢酶和β-微管蛋白基因)的3’元件。本段中引用的所有专利出版物均通过引用以其整体并入本文。
在某些实施例中,植物细胞可包含单倍体、二倍体或多倍体植物细胞或植物原生质体,例如从单倍体、二倍体或多倍体植物、植物部分或组织或愈伤组织获得的那些。在某些实施例中,培养中的植物细胞(或再生植物、后代种子和后代植物)是单倍体或可以被诱导成为单倍体;用于制造和使用单倍体植物和植物细胞的技术是本领域已知的,参见例如,通过将野生型株系与表达改变形式的着丝粒特异性组蛋白CENH3的单倍体诱导株系杂交在拟南芥中产生单倍体的方法,如以下所述:Maruthachalam和Chan在“How to make haploidArabidopsis thaliana[如何制作单倍体拟南芥]”中,在www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf可用的方案;(Ravi等人(2014)Nature Communications[自然通讯],5:5334,doi:10.1038/ncomms6334)。单倍体也可以在广泛多种单子叶植物(例如玉蜀黍、小麦、稻、高粱、大麦)或双子叶植物(例如大豆、芸苔属物种(Brassica sp.),包括卡诺拉油菜、棉花、番茄)中通过将包含突变的CENH3基因的植物与野生型二倍体植物杂交以产生单倍体后代来获得,如美国专利号9,215,849(其通过引用以其整体并入本文)中披露。可用于获得单倍体玉蜀黍植物和/或细胞的单倍体诱导玉蜀黍品系包括Stock 6、MHI(摩尔多瓦单倍体诱导者(Moldovian Haploid Inducer))、不确定的配子体(ig)突变、KEMS、RWK、ZEM、ZMS、KMS和美国专利号9,677,082(其通过引用以其整体并入本文)中披露的转基因单倍体诱导者品系。单倍体细胞的示例包括但不限于从单倍体植物获得的植物细胞和从生殖组织获得的植物细胞,例如,来自花、发育中的花或花芽、子房、胚珠、大孢子、花药、花粉、大配子体和小孢子。在植物细胞或植物原生质体是单倍体的某些实施例中,可以通过在植物细胞或植物原生质体中进行染色体加倍(例如通过减数分裂未减数的自发染色体加倍,或通过使用染色体加倍剂,例如秋水仙碱、安磺灵、氟乐灵、拿草特、一氧化二氮气体、抗微管除草剂、抗微管剂和有丝分裂抑制剂)来使遗传互补物加倍以产生加倍的单倍体植物细胞或植物原生质体,其中基因或等位基因的互补物是纯合的;又其他实施例包括从双单倍体植物细胞或植物原生质体再生双单倍体植物。另一个实施例涉及具有至少一个亲本植物的杂种植物,该亲本植物是由该方法提供的双单倍体植物。双单倍体植物的产生在一代内提供纯合性,而不需要几代自交以获得纯合植物。在希望在尽可能短的时间内建立遗传纯度(即纯合性)的任何情况下,使用双单倍体都是有利的。双单倍体产生在生长缓慢的植物中特别有利,或特别有利用于产生作为至少一个双单倍体植物的后代的杂种植物。
在某些实施例中,本文提供的方法中使用的植物细胞可包括非分裂细胞。这样的非分裂细胞可包括植物细胞原生质体、经受一种或多种遗传和/或药物诱导的细胞周期阻断等的植物细胞。
在某些实施例中,用于本文提供的方法的植物细胞可包括分裂细胞。分裂细胞可以包括在包括叶、分生组织和胚在内的各种植物组织中发现的那些细胞。这些组织包括但不限于来自玉蜀黍幼叶、分生组织和盾片组织(来自授粉后(DAP)约8或10至约12或14天的胚)的分裂细胞。玉蜀黍胚的分离已在一些出版物中进行了描述(Brettschneider,Becker,和1997;Leduc等人1996;Frame等人2011;K.Wang和Frame 2009)。在某些实施例中,基部叶组织(例如叶组织位于距离玉蜀黍植物的叶舌约0至3cm;Kirienko、Luo和Sylvester2012)是HDR介导的基因编辑的靶标。用于从本文提供的HDR介导的植物细胞基因编辑获得可再生植物结构和再生植物的方法可以改编自美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)中披露的方法。在某些实施例中,经受HDR介导的基因编辑的单个植物细胞将产生单个可再生植物结构。在某些实施例中,单个可再生植物细胞结构可以由已经进行HDR介导的基因编辑的外植体上或内的单个细胞形成。在一些实施例中,本文提供的方法可以包括从已经进行改进的HDR介导的基因编辑的植物细胞或从获得自该植物细胞的可再生植物结构生长或再生植物的另外步骤。在某些实施例中,植物可进一步包含由本文披露的方法和组合物提供的插入的转基因、靶基因编辑或基因组编辑。在某些实施例中,愈伤组织由植物细胞产生,小植物和植物由这样的愈伤组织产生。在其他实施例中,整个幼苗或植物直接从植物细胞生长而没有愈伤组织阶段。因此,另外的相关方面涉及从具有靶基因编辑或基因组编辑的植物细胞或植物原生质体生长或再生的整个幼苗和植物,以及这样的植物的种子。在其中植物细胞或植物原生质体经受基因修饰(例如,通过例如RdDe进行基因组编辑)的某些实施例中,生长或再生的植物表现出与基因修饰相关的表型。在某些实施例中,生长或再生的植物在其基因组中包括两个或更多个遗传或表观遗传修饰,它们组合地提供至少一个目的表型。在某些实施例中,具有靶基因编辑或基因组编辑的异质植物细胞群(其中至少一些包括至少一个遗传或表观遗传修饰)由该方法提供;相关方面包括具有与基因修饰或表观遗传修饰相关的目的表型的植物,其通过以下来提供:从植物细胞或植物原生质体再生具有目的表型的植物(该植物细胞或植物原生质体选自具有靶基因或基因组编辑的异质植物细胞群),或从生长或再生自具有靶基因编辑或基因组编辑的植物细胞群的异质植物群中选择具有目的表型的植物。目的表型的示例包括除草剂抗性、对非生物胁迫(例如,对极端温度、干旱或盐的耐受性)或生物胁迫(例如,对线虫、细菌或真菌病原体的抗性)的改善的耐受性,改善营养物质或水的利用,经修饰的脂质、碳水化合物或蛋白质组成,改善的风味或外观,改善的储存特性(例如,对碰伤(bruising)、褐变或软化的抗性),增加的产率,改变的形态(例如,花卉结构或颜色,植物高度,分枝,根结构)。在一个实施例中,具有靶基因编辑或基因组编辑的异质植物细胞群(或从中生长或再生的幼苗或植物)暴露于允许目的表型表达的条件;例如,对除草剂抗性的选择可以包括将具有靶基因编辑或基因组编辑的植物细胞群(或从中生长或再生的幼苗或植物)暴露于一定量的除草剂或其他抑制生长或有毒的物质,允许鉴定和选择那些在处理后存活的抗性植物细胞(或幼苗或植物)。获得可再生植物结构和从植物细胞或可再生植物结构再生植物的方法可以改编自已公开的程序(Roest和Gilissen,Acta Bot.Neerl.[荷兰植物学报],1989,38(1),1-23;Bhaskaran和Smith,Crop Sci.[作物科学]30(6):1328-1337;Ikeuchi等人,Development[发育],2016,143:1442-1451)。用于获得可再生植物结构和从植物细胞或可再生植物结构再生植物的方法也可以改编自美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)。还提供了此类植物或其部分(例如种子)的异质或同质群体、后继世代或从植物细胞或植物原生质体生长或再生的此类植物的种子,它们具有靶基因编辑或基因组编辑。其他相关方面包括通过将从具有靶基因编辑或基因组编辑并具有至少一个遗传或表观遗传修饰的植物细胞或植物原生质体生长或再生的第一植物与第二植物杂交而提供的杂种植物,其中该杂种植物包含遗传或表观遗传修饰;还考虑由杂种植物产生的种子。还预想相关方面是后代种子和后代植物,包括具有再生植物作为亲本或祖先的杂种种子和杂种植物。本文披露的植物细胞和衍生植物和种子可用于对消费者或种植者有用的各种目的。在其他实施例中,加工产品由植物或其种子制成,包括:(a)玉米、大豆、棉花或卡诺拉油菜种子粉(脱脂或未脱脂);(b)提取的蛋白质、油、糖、和淀粉;(c)发酵产品;(d)动物饲料或人类食品(例如,包含玉米、大豆、棉花或卡诺拉油菜种子粉(脱脂或未脱脂)和其他成分(例如,其他谷物、其他种子粉、其他蛋白粉、其他油、其他淀粉、其他糖、粘合剂、防腐剂、湿润剂、维生素和/或矿物质)的饲料和食品;(e)药物;(f)生的或加工的生物质(例如,纤维素和/或木质纤维素材料);和(g)各种工业产品。
实施例
本文描述的植物、基因组、方法、生物样品和其他组合物的各种实施例在以下编号的实施例集合中阐述。
1.一种经编辑的转基因植物基因组,其包含第一组特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中该sPAM和/或sigRNAR位点可操作地连接至该转基因植物基因组中第一经修饰的转基因基因座的两个DNA连接多核苷酸并且其中该sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。
2.一种经编辑的转基因植物基因组,其包含特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中该sPAM和/或sigRNAR位点可操作地连接至该转基因植物基因组中第一经修饰的转基因基因座的DNA连接多核苷酸并且其中该sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。
3.如实施例1所述的经编辑的转基因植物基因组,其中该第一组sPAM和/或sigRNAR位点被相同RNA依赖性DNA核酸内切酶(RdDe)或相同类RdDe识别。
4.如实施例1所述的经编辑的转基因植物基因组,其中该第一组sigRNAR位点被相同RNA依赖性DNA核酸内切酶(RdDe)或相同类RdDe和第一指导RNA识别。
5.如实施例1所述的经编辑的转基因植物基因组,其中该基因组进一步包含第二组sPAM和/或sigRNAR位点,其可操作地连接至该经编辑的转基因植物基因组中第二经修饰的转基因基因座的两个DNA连接多核苷酸,并且其中该第二组sPAM和/或sigRNAR位点被相同RdDe或相同类别RdDe识别。
6.如实施例1所述的经编辑的转基因植物基因组,其中(i)该第一组sPAM和/或sigRNAR位点和该第二组sPAM和/或sigRNAR位点各自被不同RdDe或不同类别RdDe识别。
7.如实施例1所述的经编辑的转基因植物基因组,其中(i)该第一组sigRNAR位点和该第二组sigRNAR位点各自分别被第一指导RNA和指导RNA识别。
8.如实施例1所述的经编辑的转基因植物基因组,其中该基因组进一步包含第三组sPAM和/或sigRNAR位点,其可操作地连接至该经编辑的转基因植物基因组中第三经修饰的转基因基因座的两个DNA连接多核苷酸,并且其中该第三组sPAM和/或sigRNAR被相同RdDe或相同类别RdDe识别。
9.如实施例8所述的经编辑的转基因植物基因组,其中该第一、第二和第三组sigRNAR位点各自分别被第一指导RNA、第二指导RNA和第三指导RNA识别。
10.如实施例1至9中任一项所述的经编辑的转基因植物基因组,其中该RdDe是2类II型或2类V型RdDe。
11.如实施例1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座缺乏可选择标记转基因,该可选择标记转基因赋予对抗生素的抗性、对除草剂的耐受性或在特定碳源上生长的能力,其中该特定碳源任选地是甘露糖。
12.如实施例11所述的经编辑的转基因植物基因组,其中该可选择标记转基因存在于该原始转基因基因座中。
13.如实施例1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座进一步包含第二引入的转基因。
14.如实施例1所述的经编辑的转基因植物基因组,其中该第二引入的转基因被整合到该经修饰的转基因基因座中被该原始转基因基因座中的可选择标记转基因占据的位点处。
15.如实施例1至14中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座包含转基因玉米植物基因组中Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140或TC1507原始转基因基因座的至少一个修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
16.如实施例1至14中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和或第三经修饰的转基因基因座包含转基因大豆植物基因组中A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、MST--3或SYHT0H2原始转基因基因座的修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
17.如实施例1至14中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座包含转基因棉花植物基因组中DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701或MON88913原始转基因基因座的至少一个修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
18.如实施例1至14中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和或第三经修饰的转基因基因座包含转基因卡诺拉油菜植物基因组中GT73、HCN28、MON88302或MS8原始转基因基因座的修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
19.如实施例1至18中任一项所述的经编辑的转基因植物基因组,其中该基因组进一步包含靶向遗传改变。
20.一种转基因植物细胞,其包含如实施例1至19中任一项所述的经编辑的转基因植物基因组。
21.一种转基因植物,其包含如实施例1至19中任一项所述的转基因植物基因组。
22.一种转基因植物部分,其包含如实施例1至19中任一项所述的经编辑的转基因植物基因组。
23.如实施例22所述的转基因植物部分,其中该部分是种子、叶、块茎、茎、根或圆荚。
24.一种获得用于商业种子生产的大量近交种子群体的方法,该方法包括如实施例21所述的转基因植物自交以及从自交优良作物植物收获种子。
25.一种获得杂交作物种子的方法,该方法包括将包含如实施例21所述的转基因植物的第一作物植物与第二作物植物杂交并从杂交中收获种子。
26.如实施例25所述的方法,其中该第一作物植物和该第二作物植物在不同的杂种优势组中。
27.如实施例25所述的方法,其中该第一或第二作物植物是已成为雄性不育的花粉受体。
28.如实施例27所述的方法,其中通过去雄、细胞质雄性不育、化学杂交剂或系统、转基因和/或内源植物基因中的突变,使该作物植物成为雄性不育。
29.如实施例25至28中任一项所述的方法,其进一步包括播种该杂交作物种子的步骤。
30.一种DNA,该DNA包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
31.如实施例30所述的DNA,其中该经修饰的转基因基因座是Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140或TC1507转基因基因座,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
32.如实施例30所述的DNA,其中该经修饰的转基因基因座是A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、MST--3、和/或SYHT0H2转基因基因座并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
33.如实施例30所述的DNA,其中该经修饰的转基因基因座是:(i)DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701、和/或MON88913转基因基因座并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失;或(ii)其中该经修饰的转基因基因座是GT73、HCN28、MON88302或MS8转基因基因座并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
34.如实施例30至33中任一项所述的DNA,其中该DNA是纯化或分离的。
35.一种经加工的转基因植物产品,其含有如实施例30至34中任一项所述的DNA。
36.一种生物样品,其包含如实施例30至34中任一项所述的DNA。
37.一种适用于检测基因组DNA或其片段的核酸标记,该核酸标记包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
38.如实施例37所述的核酸标记,其包含长度至少为18个核苷酸的跨sPAM和/或sigRNAR的多核苷酸。
39.如实施例37所述的核酸标记,其中该标记进一步包含可检测标签。
40.如实施例37所述的核酸标记,其中该经修饰的转基因基因座是经修饰的Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140或TC1507转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
41.如实施例37所述的核酸标记,其中该经修饰的转基因基因座是经修饰的A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、MST--3、或SYHT0H2转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
42.如实施例37所述的核酸标记,其中该经修饰的转基因基因座是DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701和/或MON88913转基因基因座,这些转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
43.如实施例37所述的核酸标记,其中该经修饰的转基因基因座是GT73、HCN28、MON88302或MS8转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
44.从如实施例22或23所述的转基因植物部分获得的经加工的转基因植物产品,其中该经加工的植物产品含有多核苷酸,该多核苷酸在该第一、第二和/或第三经修饰的转基因基因座的一个或两个DNA连接多核苷酸中或附近包含sPAM和/或sigRNAR。
45.从如实施例20所述的转基因植物细胞、如实施例21所述的转基因植物或如实施例22所述的转基因植物部分获得的生物样品,其中该生物样品含有一个或多个多核苷酸,该一个或多个多核苷酸在该第一、第二和/或第三经修饰的转基因基因座的一个或两个DNA连接多核苷酸中包含sPAM和/或sigRNAR。
46.一种检测如实施例1至19中任一项所述的经编辑的转基因植物基因组的方法,该方法包括检测包含所述sPAM和/或sigRNAR中的一个或多个的多核苷酸的存在的步骤。
47.如实施例46所述的方法,其中通过检测存在于该经修饰的转基因基因座中但不存在于该原始转基因基因座中的sPAM和/或sigRNAR中的单核苷酸多态性(SNP)来检测该多核苷酸。
48.如实施例46所述的方法,其中在转基因植物细胞、转基因植物部分、转基因植物、经加工的转基因植物产品或生物样品中检测该经编辑的转基因植物基因组。
49.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一DNA连接多核苷酸中或附近引入第一sPAM位点的步骤,其中该sPAM位点可操作地连接至该第一DNA连接多核苷酸。
50.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入第一和第二sPAM位点的步骤,其中该sPAM位点可操作地连接至该第一和第二DNA连接多核苷酸。
51.如实施例50所述的方法,其中每个sPAM通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)催化缺陷型RNA依赖性DNA核酸内切酶(cdRdDe)或RdDe切口酶,其中该cdRdDe或RdDe切口酶可操作地连接至核碱基脱氨酶;以及(ii)指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;并且
(b)选择包含该第一和第二sPAM的转基因植物细胞、转基因植物部分或转基因植物。
52.如实施例51所述的方法,其中该核碱基脱氨酶是胞嘧啶脱氨酶或腺嘌呤脱氨酶。
53.如实施例50所述的方法,其中至少一个sPAM通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)识别该原始转基因基因座的连接多核苷酸的锌指核酸酶或TALEN或(ii)识别该原始转基因基因座的连接多核苷酸的锌指切口酶或Tale切口酶,以及任选地跨该连接多核苷酸中的双链DNA断裂位点的供体DNA模板;并且
(b)选择包含该sPAM的转基因植物细胞、转基因植物部分或转基因植物。
54.如实施例50所述的方法,其进一步包括使该原始转基因基因座与一个或多个基因编辑分子接触,该基因编辑分子提供该原始转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
55.如实施例54所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
56.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中该sigRNAR位点可操作地连接至该第一DNA连接多核苷酸。
57.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中该sigRNAR位点可操作地连接至该第一和第二DNA连接多核苷酸。
58.如实施例57所述的方法,其中每个sigRNAR通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)RdRe或RdDe切口酶;以及指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;(ii)指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;以及(iii)供体DNA模板,其跨该连接多核苷酸中的双链DNA断裂位点,该连接多核苷酸包含该sigRNAR的异源crRNA(CRISPR RNA)结合序列和任选地PAM或sPAM位点;并且
(b)选择包含该sigRNAR位点的转基因植物细胞、转基因植物部分或转基因植物。
59.如实施例57所述的方法,其中每个sigRNAR通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)识别该原始转基因基因座的连接多核苷酸的锌指核酸酶或TALEN或(ii)识别该原始转基因基因座的连接多核苷酸的锌指切口酶或Tale切口酶,以及跨该连接多核苷酸中的双链DNA断裂位点的供体DNA模板,该连接多核苷酸包含该sigRNAR的异源crRNA(CRISPR RNA)结合序列和任选地PAM或sPAM位点;并且
(b)选择包含这些sigRNAR位点的转基因植物细胞、转基因植物部分或转基因植物。
60.如实施例57所述的方法,其进一步包括使该原始转基因基因座与一个或多个基因编辑分子接触,该基因编辑分子提供该原始转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
61.如实施例60所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板或其他DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
62.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如实施例1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别第一组sPAM、第二组sPAM和/或第三组sPAM的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻该第一组sPAM的5’或3’的DNA的RNA等同物;以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sPAM的经修饰的转基因基因座已被切除。
63.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如实施例1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sPAM和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sigRNAR位点的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻该sPAM和预先存在的PAM或sigRNAR位点的5’或3’的DNA的RNA等同物;以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sPAM和该预先存在的PAM或sigRNAR位点的经修饰的转基因基因座已被切除。
64.如实施例63所述的方法,其中在步骤(a)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该经编辑的转基因植物基因组的转基因植物细胞中来接触该经编辑的转基因植物基因组。
65.如实施例63所述的方法,其中该转基因植物细胞处于组织培养物、愈伤组织培养物、植物部分或整株植物中。
66.如实施例63所述的方法,其中该转基因植物细胞是单倍体植物细胞。
67.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如实施例1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别该第一组sigRNAR位点、第二组sigRNAR位点和/或第三组sigRNAR位点的RdDe;和(ii)定向至该第一组sigRNAR位点的指导RNA(gRNA);以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sigRNAR位点的经修饰的转基因基因座已被切除。
68.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如实施例1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sigRNAR位点和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sPAM位点的RdDe;以及(ii)定向至该第一sigRNAR位点和该预先存在的PAM或sPAM位点的指导RNA(gRNA);以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sigRNAR和预先存在的PAM或sPAM位点的经修饰的转基因基因座已被切除。
69.如实施例68所述的方法,其中在步骤(a)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该经编辑的转基因植物基因组的转基因植物细胞中来接触该经编辑的转基因植物基因组。
70.如实施例68所述的方法,其中该转基因植物细胞处于组织培养物、愈伤组织培养物、植物部分或整株植物中。
71.如实施例68所述的方法,其中该转基因植物细胞是单倍体植物细胞。
72.一种获得植物育种系的方法,该方法包括:
(a)杂交包含如实施例1至19中任一项所述的经编辑的转基因基因组的转基因植物,其中将包含该第一经修饰的转基因基因座的第一植物与包含该第二经修饰的转基因基因座的第二植物杂交;以及,
(b)从该杂交中选择包含该第一和第二经修饰的转基因基因座的后代植物,从而获得该植物育种系。
73.如实施例72所述的方法,其中(a)的该第二植物进一步包含该第三经修饰的转基因基因并且其中在(b)中选择来自该杂交的包含该第一、第二和第三经修饰的转基因基因座的后代植物。
74.如实施例72或73所述的方法,其中使该植物育种系经受单倍体诱导剂并且选择至少包含该第一和第二育种系的单倍体植物育种系。
75.一种获得含有不同转基因性状的近交转基因植物种质的方法,该方法包括:
(a)将至少第一转基因基因座和第二转基因基因座进行基因渗入近交种质以获得包含该第一和第二转基因基因座的供体近交亲本植物系,其中特征性原间隔子相邻基序(sPAM)位点或特征性指导RNA识别(sigRNAR)位点可操作地连接至至少该第一转基因基因座的两个DNA连接多核苷酸并且任选地连接至该第二转基因基因座;
(b)将该供体近交亲本植物系的转基因植物基因组与以下接触:(i)定向至与两个sPAM位点相邻的基因组DNA或定向至这些sigRNAR位点的至少第一指导RNA,其中这些sPAM或sigRNAR位点可操作地连接至该第一转基因基因座;和(ii)一个或多个识别这些sPAM或sigRNAR位点的RNA依赖性DNA核酸内切酶(RdDe);并且
(c)在该近交种质中选择包含经编辑的转基因植物基因组的转基因植物细胞、转基因植物部分或的转基因植物,其中该第一转基因基因座已被切除并且该第二转基因基因座存在于该近交种质中。
76.如实施例75所述的方法,其中该基因渗入包括将包含该第一和/或第二转基因植物基因座的种质与近交种质杂交,选择包含该第一或第二转基因植物基因座的后代,并且将所选后代与作为轮回亲本的近交种质杂交。
77.如实施例75所述的方法,其进一步包括使步骤(b)中的该转基因植物基因组与一个或多个基因编辑分子接触,该基因编辑分子提供该第二转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
78.如实施例75所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
79.如实施例75所述的方法,其中将第三转基因基因座进行基因渗入或引入该近交种质中以获得包含该第一、第二和第三转基因基因座的供体近交亲本植物系。
80.如实施例75所述的方法,其进一步包括使该转基因植物基因组与定向至邻近两个sPAM位点的基因组DNA的第二指导RNA接触,其中该sPAM位点可操作地连接至该第二或第三转基因基因座的5'和3'DNA连接多核苷酸;和(ii)一个或多个识别步骤(b)中的sPAM位点的RNA依赖性DNA核酸内切酶(RdDe);并且选择其中该第二或第三转基因基因座已在步骤(c)中切除的转基因植物细胞、转基因植物部分或转基因植物。
81.如实施例75所述的方法,其进一步包括使该转基因植物基因组与定向至sigRNA位点的第二指导RNA接触,这些sigRNA位点可操作地连接至该第二或第三转基因基因座的5'和3'DNA连接多核苷酸;和(ii)一个或多个识别步骤(b)中的sigRNAR位点的RNA依赖性DNA核酸内切酶(RdDe);并且选择其中该第二或第三转基因基因座已在步骤(c)中切除的转基因植物细胞、转基因植物部分或转基因植物。
82.如实施例75所述的方法,其中在步骤(b)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该转基因植物基因组的转基因植物细胞中来接触该转基因植物基因组。
83.如实施例75所述的方法,其中步骤(b)的该转基因植物基因组进一步包含第三转基因植物基因座,其中特征性原间隔子相邻基序(sPAM)位点可操作地连接至该第三转基因基因座的两个DNA连接多核苷酸。
84.如实施例75所述的方法,其中在步骤(b)中进一步使该转基因植物基因组与包含引入的转基因的供体DNA模板分子接触,并且在步骤(c)中选择包含经编辑的转基因植物基因组的转基因植物细胞,该经编辑的转基因植物基因组包含该引入的转基因在该第一转基因基因座中的插入。
85.如实施例75所述的方法,其中该转基因植物基因组在步骤(b)中进一步与以下接触:(i)包含引入的转基因的供体DNA模板分子;以及(ii)一个或多个DNA编辑分子,其在该第二转基因基因座中引入双链DNA断裂;并且在步骤(b)中选择包含经编辑的转基因植物基因组的转基因植物细胞,该经编辑的转基因植物基因组包含该引入的转基因在该第二转基因基因座中的插入。
86.如实施例75所述的方法,其进一步包括:
(d)将步骤(c)中选择的转基因植物细胞中的经编辑的转基因植物基因组与以下接触:(i)包含引入的转基因的供体DNA模板分子;以及(ii)一个或多个DNA编辑分子,其在该第一转基因基因座的切除位点中或附近或在该第二转基因基因座中引入双链DNA断裂;以及,
(e)选择包含进一步经编辑的转基因植物基因组的转基因植物细胞、转基因植物部分或转基因植物,该进一步经编辑的转基因植物基因组包含该引入的转基因在该第一转基因基因座的切除位点中或附近或在该第二转基因基因座中的插入。
87.如实施例75至86中任一项所述的方法,其中该转基因植物种质是转基因玉米植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因玉米植物基因组中Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、VCO--5、98140和/或TC1507转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
88.如实施例75至86中任一项所述的方法,其中该转基因植物种质是转基因大豆植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因大豆植物基因组中A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、MST--3和/或SYHT0H2转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
89.如实施例75至86中任一项所述的方法,其中该转基因植物种质是转基因棉花植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因棉花植物基因组中DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701、和/或MON88913转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
90.如实施例75至86中任一项所述的方法,其中该转基因植物种质是转基因卡诺拉油菜植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因卡诺拉油菜植物基因组中GT73、HCN28、MON88302或MS8转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
实例
实例1.在转基因基因座的5'和/或3'连接多核苷酸中引入sPAM和sigRNAR位点
含有一个或多个如下转基因基因座(事件)的转基因植物基因组与以下接触:
(i)ABE或CBE和指导RNA,其识别事件的5'和3'连接多核苷酸中指定的靶DNA位点(指导RNA编码加PAM位点),以在连接多核苷酸中引入特征性PAM(sPAM)位点;
(ii)RdDe和指导RNA(其识别事件的5'和3'连接多核苷酸中指定的靶DNA位点(指导RNA编码加PAM位点))以及跨越连接多核苷酸中双链DNA断裂位点的供体DNA模板以在连接多核苷酸中引入特征性PAM(sPAM)位点或sigRNAR位点。
选择在转基因植物基因组中包含引入的sPAM或sigRNAR位点的植物细胞、愈伤组织、部分或整个植物。
表7.在事件(转基因基因座)5'连接和3'连接多核苷酸中使用预先存在的基因组DNA靶标和2类II型RdDe PAM位点(例如,Cas9)以引入sPAM或sigRNAR位点。
表8.在事件(转基因基因座)5'连接和3'连接多核苷酸中使用预先存在的基因组DNA靶标和2类V型RdDe PAM位点(例如,Cas12)以引入sPAM或sigRNAR位点。
/>
实例2.使用RdDe、指导RNA和DNA寡核苷酸插入在连接多核苷酸中引入sPAM位点或sigRNAR
含有一个或多个如下转基因基因座(事件)的转基因植物基因组与以下接触:2类II型(例如,Cas9)或2类V型(Cas12)RdDe和指导RNA(其识别事件的连接多核苷酸中指定的靶DNA位点(指导RNA编码加上PAM位点))以及连接多核苷酸中的供体DNA寡核苷酸,以在连接多核苷酸中引入特征性PAM(sPAM)位点。选择在转基因植物基因组中包含引入的sPAM位点的植物细胞、愈伤组织、部分或整个植物。
表9.在具有2类V型RdDe的连接多核苷酸中插入sPAM位点(例如,Cas12)
在需要插入sigRNAR序列的其他情况下,上述寡核苷酸可以替换为包含sigRNAR(包含异源crRNA(CRISPR RNA)结合序列+PAM)的寡核苷酸,而不仅仅是PAM位点并且可以选择包含sigRNAR位点的植物细胞、部分或整个植物。
实例3.中断或插入连接多核苷酸中的PAM位点
含有一个或多个如下转基因基因座(事件)的转基因植物基因组与以下接触:2类II型(例如,Cas9)或2类V型(Cas12)RdDe和指导RNA(其识别事件的连接多核苷酸中指定的靶DNA位点(指导RNA编码加上PAM位点),以在连接多核苷酸的PAM位点中引入插入或缺失INDEL。在插入的情况下,提供合适的供体DNA模板、插入寡核苷酸或其他用于通过NHEJ或MMEJ插入的DNA。在某些情况下,可以用供体DNA寡核苷酸实现插入,以在连接多核苷酸中引入特征性PAM(sPAM)位点或sigRNAR位点。选择在转基因植物基因组中包含引入的INDEL的植物细胞、愈伤组织、部分或整个植物。
表10.连接多核苷酸靶DNA
实例4.使用人工锌指核酸酶和供体寡核苷酸在靶转基因基因座的5'连接多核苷酸中插入PAM位点
目的是插入PAM以在玉蜀黍基因组的特定位置启用2类V型RdDe(例如,Cas12)切割位点。Cas12 PAM不像其他RNA依赖性DNA核酸内切酶(如Cas9)那样宽容。在某些情况下,期望在基因组中的特定基因座启用CasS切割。例如,MON89034中T-DNA插入的5'连接多核苷酸缺少Cas12 PAM。插入PAM将使CasS能够接近此位置,从而实现基于CRISPR的基因组编辑。这是通过设计和部署人工锌指核酸酶(AZFN)以在该位置打开gDNA,然后插入Cas12 PAM来实现的。
MON89034事件的T-DNA插入(SEQ ID NO:4)如图4所示。靶序列如图17A和B所示。该靶序列是锌指工具(Zinc Finger Tools)网页(在因特网万维网站“scripps.edu/barbas/zfdesign/zfdesignhome.php”;Mandell JG,Barbas CF 3rd.Nucleic Acids Res[核酸研究].2006年7月1日;34(Web服务器问题):W516-23)的输入来定义针对该特定序列的锌指结构域。Gersbach等人,Acc.Chem.Res.[化学研究评述],2014,47(8):2309-2318对此工具进行了说明。遵循为此目的使用网站的说明。图18中显示的结果说明了两个ZFN的推定锌指结构域,当与FokI核酸酶融合时,这两个ZFN将能够切割靶位点。此应用程序的AZFN将基于图18中的第一实例(跨越上面的残基11和18)。顶部链(11)锌指结构域序列是LEPGEKPYKCPECGKSFSQAGHLASHQRTHTGEKPYKCPECGKSFSQSGNLTEHQRTHTGEKPYKCPECGKSFSRADNLTEHQRTHTGKKTS(SEQ ID NO:46),如图19所示。底部链(18)锌指结构域序列是LEPGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPYKCPECGKSFSTHLDLIRHQRTHTGEKPYKCPECGKSFSTSGNLTEHQRTHTGKKTS(SEQID NO:49),如图20所示。AZFN蛋白可以融合到FokI‘sharkey’核酸酶结构域(SEQ ID NO:50);J.Mol.Biol.[分子生物学杂志]400(1),96-107(2010))以产生靶向预期切割位点的功能性AZFN。图21中带下划线的粗体文本表示定义FokI结构域的“sharkey”变体的突变。最终的AZFN如图21所示(SEQ ID NO:51和52)。甲硫氨酸被添加到直接融合到FokI结构域的ZFN结构域(双下划线)。
这些AZFN中的每一个的玉蜀黍优化蛋白质编码序列可以由许多DNA合成公司之一生产。蛋白质编码序列可与水稻肌动蛋白和玉蜀黍泛素等高活性启动子融合(Christensen和Quail,Transgenic Res[转基因研究]1996,5(3):213-8),并组装成用于农杆菌介导或基因枪玉蜀黍转化的标准二元载体。基因枪法可能是首选方法,因为插入DNA可以与AZFN基因共同递送,例如Svitashev等人,Plant Physiol[植物生理学]2015;169(2):931-45或Ainley等人Plant Biotechnol J.[植物生物技术杂志]2013;11(9):1126-1134中。AZFN将以类似于图22(顶部)所示的方式一起切割靶DNA(SEQ ID NO:35)。由寡核苷酸5'-TGGATTTC-3'和5'-TCCAGAAA-3'构成的合成衔接子以足够的浓度与质粒DNA共同递送,有利于在AZFN切割位点处的插入以在如图22所示的MON89034连接多核苷酸(SEQ ID NO:53)中产生特征性PAM位点的插入。
实例5.使用人工锌指核酸酶和供体寡核苷酸在靶转基因基因座的5'连接多核苷酸中插入sigRNAR位点
为了在MON89034中插入sigRNAR序列,基本上如实例4中所述进行实验,但合成衔接子由寡核苷酸5'-tggatttcactgactgactgactgactgact-3’(SEQ ID NO:137)和5'-tccaagtcagtcagtcagtcagtcagtgaaa-3’(SEQ ID NO:138)构成。将该合成寡核苷酸衔接子插入图22顶部所示的切割位点,以生成sigRNAR插入5’-TAATGAGTATGAtggatttcactgactgactgactgactgactTGGATCAGCAATGAGTAT-3’(SEQ ID NO:139)。
本披露的广度和范围不应受到上述任何实施例的限制。

Claims (90)

1.一种经编辑的转基因植物基因组,其包含第一组特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中该sPAM和/或sigRNAR位点可操作地连接至该转基因植物基因组中第一经修饰的转基因基因座的两个DNA连接多核苷酸并且其中该sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。
2.一种经编辑的转基因植物基因组,其包含特征性原间隔子相邻基序(sPAM)位点和/或特征性指导RNA识别(sigRNAR)位点,其中该sPAM和/或sigRNAR位点可操作地连接至该转基因植物基因组中第一经修饰的转基因基因座的DNA连接多核苷酸并且其中该sPAM和/或sigRNAR位点在包含原始转基因基因座的转基因植物基因组中不存在。
3.如权利要求1所述的经编辑的转基因植物基因组,其中该第一组sPAM和/或sigRNAR位点被相同RNA依赖性DNA核酸内切酶(RdDe)或相同类RdDe识别。
4.如权利要求1所述的经编辑的转基因植物基因组,其中该第一组sigRNAR位点被相同RNA依赖性DNA核酸内切酶(RdDe)或相同类RdDe和第一指导RNA识别。
5.如权利要求1所述的经编辑的转基因植物基因组,其中该基因组进一步包含第二组sPAM和/或sigRNAR位点,其可操作地连接至该经编辑的转基因植物基因组中第二经修饰的转基因基因座的两个DNA连接多核苷酸,并且其中该第二组sPAM和/或sigRNAR位点被相同RdDe或相同类别RdDe识别。
6.如权利要求1所述的经编辑的转基因植物基因组,其中(i)该第一组sPAM和/或sigRNAR位点和该第二组sPAM和/或sigRNAR位点各自被不同RdDe或不同类别RdDe识别。
7.如权利要求1所述的经编辑的转基因植物基因组,其中(i)该第一组sigRNAR位点和该第二组sigRNAR位点各自分别被第一指导RNA和指导RNA识别。
8.如权利要求1所述的经编辑的转基因植物基因组,其中该基因组进一步包含第三组sPAM和/或sigRNAR位点,其可操作地连接至该经编辑的转基因植物基因组中第三经修饰的转基因基因座的两个DNA连接多核苷酸,并且其中该第三组sPAM和/或sigRNAR被相同RdDe或相同类别RdDe识别。
9.如权利要求8所述的经编辑的转基因植物基因组,其中该第一、第二和第三组sigRNAR位点各自分别被第一指导RNA、第二指导RNA和第三指导RNA识别。
10.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该RdDe是2类II型或2类V型RdDe。
11.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座缺乏可选择标记转基因,该可选择标记转基因赋予对抗生素的抗性、对除草剂的耐受性或在特定碳源上生长的能力,其中该特定碳源任选地是甘露糖。
12.如权利要求11所述的经编辑的转基因植物基因组,其中该可选择标记转基因存在于该原始转基因基因座中。
13.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座进一步包含第二引入的转基因。
14.如权利要求1所述的经编辑的转基因植物基因组,其中该第二引入的转基因被整合到该经修饰的转基因基因座中被该原始转基因基因座中的可选择标记转基因占据的位点处。
15.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座包含转基因玉米植物基因组中Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、98140或TC1507原始转基因基因座的至少一个修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
16.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和或第三经修饰的转基因基因座包含转基因大豆植物基因组中A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、或SYHT0H2原始转基因基因座的修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
17.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和/或第三经修饰的转基因基因座包含转基因棉花植物基因组中DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701或MON88913原始转基因基因座的至少一个修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
18.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该第一、第二和或第三经修饰的转基因基因座包含转基因卡诺拉油菜植物基因组中GT73、HCN28、MON88302或MS8原始转基因基因座的修饰,其中该修饰包含该第一、第二和/或第三经修饰的转基因基因座的DNA连接多核苷酸中的第一、第二和/或第三组sPAM和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一种可选择标记基因和/或非必需DNA的缺失。
19.如权利要求1至9中任一项所述的经编辑的转基因植物基因组,其中该基因组进一步包含靶向遗传改变。
20.一种转基因植物细胞,其包含如权利要求1至9中任一项所述的经编辑的转基因植物基因组。
21.一种转基因植物,其包含如权利要求1至9中任一项所述的转基因植物基因组。
22.一种转基因植物部分,其包含如权利要求1至9中任一项所述的经编辑的转基因植物基因组。
23.如权利要求22所述的转基因植物部分,其中该部分是种子、叶、块茎、茎、根或圆荚。
24.一种获得用于商业种子生产的大量近交种子群体的方法,该方法包括如权利要求21所述的转基因植物自交以及从自交优良作物植物收获种子。
25.一种获得杂交作物种子的方法,该方法包括将包含如权利要求21所述的转基因植物的第一作物植物与第二作物植物杂交并从杂交中收获种子。
26.如权利要求25所述的方法,其中该第一作物植物和该第二作物植物在不同的杂种优势组中。
27.如权利要求25所述的方法,其中该第一或第二作物植物是已成为雄性不育的花粉受体。
28.如权利要求27所述的方法,其中通过去雄、细胞质雄性不育、化学杂交剂或系统、转基因和/或内源植物基因中的突变,使该作物植物成为雄性不育。
29.如权利要求25所述的方法,其进一步包括播种该杂交作物种子的步骤。
30.一种DNA,该DNA包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
31.如权利要求30所述的DNA,其中该经修饰的转基因基因座是Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、98140或TC1507转基因基因座,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
32.如权利要求30所述的DNA,其中该经修饰的转基因基因座是A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、和/或SYHT0H2转基因基因座并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
33.如权利要求30所述的DNA,其中该经修饰的转基因基因座是:(i)DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701、和/或MON88913转基因基因座并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失;或(ii)其中该经修饰的转基因基因座是GT73、HCN28、MON88302或MS8转基因基因座并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
34.如权利要求30至33中任一项所述的DNA,其中该DNA被纯化或分离。
35.一种经加工的转基因植物产品,其含有如权利要求30至33中任一项所述的DNA。
36.一种生物样品,其含有如权利要求30至33中任一项所述的DNA。
37.一种适用于检测基因组DNA或其片段的核酸标记,该核酸标记包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
38.如权利要求37所述的核酸标记,其包含长度为至少18个核苷酸的多核苷酸,该多核苷酸跨sPAM和/或sigRNAR。
39.如权利要求37所述的核酸标记,其中该标记进一步包含可检测标签。
40.如权利要求37所述的核酸标记,其中该经修饰的转基因基因座是经修饰的Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、98140或TC1507转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
41.如权利要求37所述的核酸标记,其中该经修饰的转基因基因座是经修饰的A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、或SYHT0H2转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
42.如权利要求37所述的核酸标记,其中该经修饰的转基因基因座是DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701和/或MON88913转基因基因座,这些转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接,并且其中这些修饰任选地进一步包含该原始转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
43.如权利要求37所述的核酸标记,其中该经修饰的转基因基因座是GT73、HCN28、MON88302或MS8转基因基因座,该转基因基因座包含sPAM和/或sigRNAR,该sPAM和/或sigRNAR在该经修饰的转基因基因座的一个或两个DNA连接多核苷酸中、与其相邻或与其可操作地连接。
44.从如权利要求22或23所述的转基因植物部分获得的经加工的转基因植物产品,其中该经加工的植物产品含有多核苷酸,该多核苷酸在该第一、第二和/或第三经修饰的转基因基因座的一个或两个DNA连接多核苷酸中或附近包含sPAM和/或sigRNAR。
45.从如权利要求20所述的转基因植物细胞、如权利要求21所述的转基因植物或如权利要求22所述的转基因植物部分获得的生物样品,其中该生物样品含有一个或多个多核苷酸,该一个或多个多核苷酸在该第一、第二和/或第三经修饰的转基因基因座的一个或两个DNA连接多核苷酸中包含sPAM和/或sigRNAR。
46.一种检测如权利要求1至9中任一项所述的经编辑的转基因植物基因组的方法,该方法包括检测包含所述sPAM和/或sigRNAR中的一个或多个的多核苷酸的存在的步骤。
47.如权利要求46所述的方法,其中通过检测存在于该经修饰的转基因基因座中但不存在于该原始转基因基因座中的sPAM和/或sigRNAR中的单核苷酸多态性(SNP)来检测该多核苷酸。
48.如权利要求46所述的方法,其中在转基因植物细胞、转基因植物部分、转基因植物、经加工的转基因植物产品或生物样品中检测该经编辑的转基因植物基因组。
49.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一DNA连接多核苷酸中或附近引入第一sPAM位点的步骤,其中该sPAM位点可操作地连接至该第一DNA连接多核苷酸。
50.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入第一和第二sPAM位点的步骤,其中该sPAM位点可操作地连接至该第一和第二DNA连接多核苷酸。
51.如权利要求50所述的方法,其中每个sPAM通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)催化缺陷型RNA依赖性DNA核酸内切酶(cdRdDe)或RdDe切口酶,其中该cdRdDe或RdDe切口酶可操作地连接至核碱基脱氨酶;以及(ii)指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;并且
(b)选择包含该第一和第二sPAM的转基因植物细胞、转基因植物部分或转基因植物。
52.如权利要求51所述的方法,其中该核碱基脱氨酶是胞嘧啶脱氨酶或腺嘌呤脱氨酶。
53.如权利要求50所述的方法,其中至少一个sPAM通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)识别该原始转基因基因座的连接多核苷酸的锌指核酸酶或TALEN或(ii)识别该原始转基因基因座的连接多核苷酸的锌指切口酶或Tale切口酶,以及任选地跨该连接多核苷酸中的双链DNA断裂位点的供体DNA模板;并且
(b)选择包含该sPAM的转基因植物细胞、转基因植物部分或转基因植物。
54.如权利要求50所述的方法,其进一步包括使该原始转基因基因座与一个或多个基因编辑分子接触,该基因编辑分子提供该原始转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
55.如权利要求54所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
56.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中该sigRNAR位点可操作地连接至该第一DNA连接多核苷酸。
57.一种获得包含经修饰的转基因基因座的经编辑的转基因植物基因组的方法,该方法包括在该原始转基因基因座的第一和第二DNA连接多核苷酸中或附近引入sigRNAR位点的步骤,其中该sigRNAR位点可操作地连接至该第一和第二DNA连接多核苷酸。
58.如权利要求57所述的方法,其中每个sigRNAR通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)RdRe或RdDe切口酶;以及指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;(ii)指导RNA,该指导RNA包含位于紧邻原始PAM位点的5'或3'的DNA的RNA等同物,该原始PAM位点位于该原始转基因基因座的第一连接多核苷酸内或与其相邻;以及(iii)供体DNA模板,其跨该连接多核苷酸中的双链DNA断裂位点,该连接多核苷酸包含该sigRNAR的异源crRNA(CRISPR RNA)结合序列和任选地PAM或sPAM位点;并且
(b)选择包含该sigRNAR位点的转基因植物细胞、转基因植物部分或转基因植物。
59.如权利要求57所述的方法,其中每个sigRNAR通过以下引入:
(a)将该原始转基因基因座与以下接触:(i)识别该原始转基因基因座的连接多核苷酸的锌指核酸酶或TALEN或(ii)识别该原始转基因基因座的连接多核苷酸的锌指切口酶或Tale切口酶,以及跨该连接多核苷酸中的双链DNA断裂位点的供体DNA模板,该连接多核苷酸包含该sigRNAR的异源crRNA(CRISPR RNA)结合序列和任选地PAM或sPAM位点;并且
(b)选择包含这些sigRNAR位点的转基因植物细胞、转基因植物部分或转基因植物。
60.如权利要求57所述的方法,其进一步包括使该原始转基因基因座与一个或多个基因编辑分子接触,该基因编辑分子提供该原始转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
61.如权利要求60所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板或其他DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
62.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如权利要求1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别该第一组sPAM、该第二组sPAM和/或该第三组sPAM的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻该第一组sPAM的5’或3’的DNA的RNA等同物;以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sPAM的经修饰的转基因基因座已被切除。
63.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如权利要求1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sPAM和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sigRNAR位点的RdDe;和(ii)两个指导RNA(gRNA),其中每个gRNA包含位于紧邻该sPAM和预先存在的PAM或sigRNAR位点的5’或3’的DNA的RNA等同物;以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sPAM和该预先存在的PAM或sigRNAR位点的经修饰的转基因基因座已被切除。
64.如权利要求63所述的方法,其中在步骤(a)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该经编辑的转基因植物基因组的转基因植物细胞中来接触该经编辑的转基因植物基因组。
65.如权利要求63所述的方法,其中该转基因植物细胞处于组织培养物、愈伤组织培养物、植物部分或整株植物中。
66.如权利要求63所述的方法,其中该转基因植物细胞是单倍体植物细胞。
67.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如权利要求1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别该第一组sigRNAR位点、第二组sigRNAR位点和/或第三组sigRNAR位点的RdDe;和(ii)定向至该第一组sigRNAR位点的指导RNA(gRNA);以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该第一组sigRNAR位点的经修饰的转基因基因座已被切除。
68.一种从经编辑的转基因植物基因组中切除经修饰的转基因基因座的方法,该方法包括以下步骤:
(a)将如权利要求1至19中任一项所述的经编辑的转基因植物基因组与以下接触:(i)识别第一连接多核苷酸中的sigRNAR位点和第一转基因基因座的第二连接多核苷酸中预先存在的PAM或sPAM位点的RdDe;以及(ii)定向至该第一sigRNAR位点和该预先存在的PAM或sPAM位点的指导RNA(gRNA);以及,
(b)选择转基因植物细胞、转基因植物部分或转基因植物,其中侧翼是该sigRNAR和预先存在的PAM或sPAM位点的经修饰的转基因基因座已被切除。
69.如权利要求68所述的方法,其中在步骤(a)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该经编辑的转基因植物基因组的转基因植物细胞中来接触该经编辑的转基因植物基因组。
70.如权利要求68所述的方法,其中该转基因植物细胞处于组织培养物、愈伤组织培养物、植物部分或整株植物中。
71.如权利要求68所述的方法,其中该转基因植物细胞是单倍体植物细胞。
72.一种获得植物育种系的方法,该方法包括:
(a)杂交包含如权利要求1至19中任一项所述的经编辑的转基因基因组的转基因植物,其中将包含该第一经修饰的转基因基因座的第一植物与包含该第二经修饰的转基因基因座的第二植物杂交;以及,
(b)从该杂交中选择包含该第一和第二经修饰的转基因基因座的后代植物,从而获得该植物育种系。
73.如权利要求72所述的方法,其中(a)的该第二植物进一步包含该第三经修饰的转基因基因并且其中在(b)中选择来自该杂交的包含该第一、第二和第三经修饰的转基因基因座的后代植物。
74.如权利要求72或73所述的方法,其中使该植物育种系经受单倍体诱导剂并且选择至少包含该第一和第二育种系的单倍体植物育种系。
75.一种获得含有不同转基因性状的近交转基因植物种质的方法,该方法包括:
(a)将至少第一转基因基因座和第二转基因基因座进行基因渗入近交种质以获得包含该第一和第二转基因基因座的供体近交亲本植物系,其中特征性原间隔子相邻基序(sPAM)位点或特征性指导RNA识别(sigRNAR)位点可操作地连接至至少该第一转基因基因座的两个DNA连接多核苷酸并且任选地连接至该第二转基因基因座;
(b)将该供体近交亲本植物系的转基因植物基因组与以下接触:(i)定向至与两个sPAM位点相邻的基因组DNA或定向至这些sigRNAR位点的至少第一指导RNA,其中这些sPAM或sigRNAR位点可操作地连接至该第一转基因基因座;和(ii)一个或多个识别这些sPAM或sigRNAR位点的RNA依赖性DNA核酸内切酶(RdDe);并且
(c)在该近交种质中选择包含经编辑的转基因植物基因组的转基因植物细胞、转基因植物部分或的转基因植物,其中该第一转基因基因座已被切除并且该第二转基因基因座存在于该近交种质中。
76.如权利要求75所述的方法,其中该基因渗入包括将包含该第一和/或第二转基因植物基因座的种质与近交种质杂交,选择包含该第一或第二转基因植物基因座的后代,并且将所选后代与作为轮回亲本的近交种质杂交。
77.如权利要求75所述的方法,其进一步包括使步骤(b)中的该转基因植物基因组与一个或多个基因编辑分子接触,该基因编辑分子提供该第二转基因基因座的可选择标记转基因的切除或失活,并选择其中该可选择标记转基因已被切除或失活的转基因植物细胞、转基因植物部分或转基因植物。
78.如权利要求75所述的方法,其中这些基因编辑分子包括含有赋予有用性状的表达盒或编码区的供体DNA模板,并且针对该表达盒在该可选择标记转基因切除或失活的位点处的整合来选择该转基因植物细胞、转基因植物部分或转基因植物。
79.如权利要求75所述的方法,其中将第三转基因基因座进行基因渗入或引入该近交种质中以获得包含该第一、第二和第三转基因基因座的供体近交亲本植物系。
80.如权利要求75所述的方法,其进一步包括使该转基因植物基因组与定向至邻近两个sPAM位点的基因组DNA的第二指导RNA接触,其中该sPAM位点可操作地连接至该第二或第三转基因基因座的5'和3'DNA连接多核苷酸;和(ii)一个或多个识别步骤(b)中的sPAM位点的RNA依赖性DNA核酸内切酶(RdDe);并且选择其中该第二或第三转基因基因座已在步骤(c)中切除的转基因植物细胞、转基因植物部分或转基因植物。
81.如权利要求75所述的方法,其进一步包括使该转基因植物基因组与定向至sigRNA位点的第二指导RNA接触,这些sigRNA位点可操作地连接至该第二或第三转基因基因座的5'和3'DNA连接多核苷酸;和(ii)一个或多个识别步骤(b)中的sigRNAR位点的RNA依赖性DNA核酸内切酶(RdDe);并且选择其中该第二或第三转基因基因座已在步骤(c)中切除的转基因植物细胞、转基因植物部分或转基因植物。
82.如权利要求75所述的方法,其中在步骤(b)中通过将包含或编码该一个或多个RdDe和gRNA的一个或多个组合物引入包含该转基因植物基因组的转基因植物细胞中来接触该转基因植物基因组。
83.如权利要求75所述的方法,其中步骤(b)的该转基因植物基因组进一步包含第三转基因植物基因座,其中特征性原间隔子相邻基序(sPAM)位点可操作地连接至该第三转基因基因座的两个DNA连接多核苷酸。
84.如权利要求75所述的方法,其中在步骤(b)中进一步使该转基因植物基因组与包含引入的转基因的供体DNA模板分子接触,并且在步骤(c)中选择包含经编辑的转基因植物基因组的转基因植物细胞,该经编辑的转基因植物基因组包含该引入的转基因在该第一转基因基因座中的插入。
85.如权利要求75所述的方法,其中该转基因植物基因组在步骤(b)中进一步与以下接触:(i)包含引入的转基因的供体DNA模板分子;以及(ii)一个或多个DNA编辑分子,其在该第二转基因基因座中引入双链DNA断裂;并且在步骤(b)中选择包含经编辑的转基因植物基因组的转基因植物细胞,该经编辑的转基因植物基因组包含该引入的转基因在该第二转基因基因座中的插入。
86.如权利要求75所述的方法,其进一步包括:
(d)将步骤(c)中选择的转基因植物细胞中的经编辑的转基因植物基因组与以下接触:(i)包含引入的转基因的供体DNA模板分子;以及(ii)一个或多个DNA编辑分子,其在该第一转基因基因座的切除位点中或附近或在该第二转基因基因座中引入双链DNA断裂;以及,
(e)选择包含进一步经编辑的转基因植物基因组的转基因植物细胞、转基因植物部分或转基因植物,该进一步经编辑的转基因植物基因组包含该引入的转基因在该第一转基因基因座的切除位点中或附近或在该第二转基因基因座中的插入。
87.如权利要求75至86中任一项所述的方法,其中该转基因植物种质是转基因玉米植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因玉米植物基因组中Bt11、DAS-59122-7、DP-4114、GA21、MON810、MON87411、MON87427、MON88017、MON89034、MIR162、MIR604、NK603、SYN-E3272-5、5307、DAS-40278、DP-32138、DP-33121、HCEM485、LY038、MON863、MON87403、MON87403、MON87419、MON87460、MZHG0JG、MZIR098、98140和/或TC1507转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
88.如权利要求75至86中任一项所述的方法,其中该转基因植物种质是转基因大豆植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因大豆植物基因组中A5547-127、DAS44406-6、DAS68416-4、DAS81419-2、GTS 40-3-2、MON87701、MON87708、MON89788、和/或SYHT0H2转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
89.如权利要求75至86中任一项所述的方法,其中该转基因植物种质是转基因棉花植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因棉花植物基因组中DAS-21023-5、DAS-24236-5、COT102、LL棉花25、MON15985、MON88701、和/或MON88913转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
90.如权利要求75至86中任一项所述的方法,其中该转基因植物种质是转基因卡诺拉油菜植物种质,并且其中该第一、第二和/或第三转基因基因座包含转基因卡诺拉油菜植物基因组中GT73、HCN28、MON88302或MS8转基因基因座的修饰,所述修饰包含与该转基因基因座的两个DNA连接多核苷酸可操作地连接的特征性原间隔子相邻基序(sPAM)位点和/或sigRNAR位点,并且其中这些修饰任选地进一步包含该转基因基因座中至少一个可选择标记基因和/或非必需DNA的缺失。
CN202180058119.2A 2020-07-31 2021-07-26 具有特征性原间隔子相邻基序或特征性指导rna识别位点的可切除植物转基因基因座 Pending CN116529370A (zh)

Applications Claiming Priority (19)

Application Number Priority Date Filing Date Title
US63/059,916 2020-07-31
US63/059,860 2020-07-31
US63/059,963 2020-07-31
US63/059,813 2020-07-31
US63/199,930 2021-02-03
US63/199,949 2021-02-04
US63/199,951 2021-02-04
US17/248,936 2021-02-12
US17/249,640 2021-03-08
US63/201,029 2021-04-09
US63/201,030 2021-04-09
US17/302,110 2021-04-23
US17/302,121 2021-04-23
US17/302,739 2021-05-11
US17/303,116 2021-05-20
US63/202,569 2021-06-16
US202163203137P 2021-07-09 2021-07-09
US63/203,137 2021-07-09
PCT/US2021/043192 WO2022026395A2 (en) 2020-07-31 2021-07-26 Excisable plant transgenic loci with signature protospacer adjacent motifs or signature guide rna recognition sites

Publications (1)

Publication Number Publication Date
CN116529370A true CN116529370A (zh) 2023-08-01

Family

ID=87399843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180058119.2A Pending CN116529370A (zh) 2020-07-31 2021-07-26 具有特征性原间隔子相邻基序或特征性指导rna识别位点的可切除植物转基因基因座

Country Status (1)

Country Link
CN (1) CN116529370A (zh)

Similar Documents

Publication Publication Date Title
US11773398B2 (en) Modified excisable 5307 maize transgenic locus lacking a selectable marker
CN116390644A (zh) 通过基因组编辑产生具有改进的转基因基因座的植物
US20220364105A1 (en) Inir12 transgenic maize
US20220098602A1 (en) Inir6 transgenic maize
US11326177B2 (en) INIR12 transgenic maize
US11359210B2 (en) INIR12 transgenic maize
CA3188276A1 (en) Inir11 transgenic maize
US20230265445A1 (en) Removable plant transgenic loci with cognate guide rna recognition sites
US20230313221A1 (en) Expedited breeding of transgenic crop plants by genome editing
CN116529370A (zh) 具有特征性原间隔子相邻基序或特征性指导rna识别位点的可切除植物转基因基因座
CN116367714A (zh) 具有经修饰的转基因基因座的转基因作物植物的基因组编辑
EP4172342A2 (en) Removable plant transgenic loci with cognate guide rna recognition sites
EP4172344A1 (en) Expedited breeding of transgenic crop plants by genome editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination