CN114829612A

CN114829612A - 使用配对切口酶的改进的基因组编辑

Info

Publication number: CN114829612A
Application number: CN202080087624.5A
Authority: CN
Inventors: K·德哈卢因; T·J·戈尔兹; D·德弗莱斯豪韦尔
Original assignee: BASF Agricultural Solutions Seed US LLC
Current assignee: BASF Agricultural Solutions Seed US LLC
Priority date: 2019-12-16
Filing date: 2020-12-07
Publication date: 2022-07-29
Also published as: WO2021122080A1; KR20220116485A; US20230042273A1; AU2020404580A1; EP4077682A1; CA3161254A1

Abstract

在二倍体植物中很好地建立了包括引入精确基因编辑的基因组编辑。本领域充分建立的方法应用如锌指核酸酶、归巢核酸内切酶、TALEN或RNA指导的核酸酶(例如Cas9或Cas12a)的技术在植物基因组中引入双链DNA断裂。

Description

使用配对切口酶的改进的基因组编辑

发明描述

本发明属于植物分子生物学领域，并且涉及作物，优选异倍体和/或多倍体作物中改进的基因组编辑的方法。

引言

在二倍体植物中很好地建立了包括引入精确基因编辑的基因组编辑。本领域充分建立的方法应用如锌指核酸酶、归巢核酸内切酶、TALEN或RNA指导的核酸酶(例如Cas9或Cas12a)的技术在植物的基因组中引入双链DNA断裂。

在植物细胞(例如胚、愈伤组织或原生质体)中应用的基因组编辑是相当有效的，如果基因组中的双链断裂通过易错非同源末端连接(NHEJ)修复，则导致包含随机插入和/或缺失(插入缺失(InDel))的突变，如果编辑方法失败，则导致未改变的基因组序列，或者如果断裂通过同源重组修复，则导致精确编辑(PE)，同源重组通常是在植物双链断裂修复中最少发生的机制。

在二倍体植物中，这将导致以下基因型：WT/WT、WT/InDel、InDel/InDel、PE/WT、PE/InDel或PE/PE。在预期精确编辑并且应避免随机突变的情况下，优选的组合将是PE/WT或PE/PE。用于这些组合的筛选系统是容易获得的，并且在基因组编辑效率提高的情况下，仅需要在二倍体植物中筛选合理数量的细胞。然而，在异倍体和/或多倍体生物体中，潜在组合的数量增加，并且需要筛选大量细胞以避免包含InDel突变的植物细胞并鉴定异倍体和/或多倍体植物中存在的多于一个基因组中的优选组合。为了降低成本和劳动密集型筛选，本领域需要具有降低的InDel百分比和更高的PE百分比的方法。

这样的方法对于异倍体和/或多倍体作物是特别令人感兴趣的，如小麦、黑小麦、棉花、马铃薯、油菜、韭葱、烟草、花生、燕麦、猕猴桃、香蕉、草莓、甘蔗、oca以及一些苹果和金诺橘品种。

NHEJ主要发生在其中双链DNA断裂处不存在允许HR修复的DNA的情况下。HR修复需要与双链断裂处或附近的DNA具有一定程度的同源性的DNA区域。该同源DNA可以存在于植物的基因组内，或者可以存在于供体DNA上，所述供体DNA在3′和/或5′端包含与双链断裂处或附近的基因组DNA具有一定程度的同源性的区域。然而，即使供体DNA与双链断裂诱导剂一起引入细胞中，它也可能在发生DNA修复时不存在于断裂位点处。

本发明提供了一个使用配对切口酶的方法，所述配对切口酶对双链DNA的一条或两条链进行切口而不导致双链DNA的物理分离。这样的切口不会导致双链断裂，但是切口之间的碱基对将通过保持两条链的互补碱基之间的氢键完整来将互补DNA链保持在一起。如果在修复时在切口处存在在3′和/或5′端具有同源突出端的相应供体DNA分子，并且随机插入InDel的百分比降低，则修复将导致WT序列或精确的基因编辑。

EP3138912公开了配对的Cas9切口酶，其用于将双链断裂引入植物细胞的基因组中，以降低由在与指导RNA具有一定同源性的非靶位点处结合的单个Cas9核酸酶引入的脱靶双链断裂的百分比。作者明确指出，切口酶需要在足够接近的位置产生切口以诱导双链断裂。然而，他们没有给出什么距离足够接近以引入双链断裂的指导，并且他们没有提及在修复过程中降低InDel百分比的问题。

Mali等(2013)公开了在二倍体人细胞中使用配对的Cas9切口酶来诱导InDel而无需共同递送供体DNA分子。

Schiml等(2014)和Fauser等(2014)描述了在二倍体拟南芥细胞中使用配对的Cas9切口酶或单个Cas9切口酶来诱导染色体内同源重组而无需共同递送供体DNA分子。

Mikami等(2016)描述了在二倍体水稻细胞中使用配对的Cas9切口酶来降低脱靶突变的百分比而无需共同递送供体DNA分子。

Wolter等(2018)公开了在二倍体拟南芥细胞中使用配对的Cas9切口酶来诱导染色体内同源重组而无需共同递送供体DNA分子。他们进一步表明了在拟南芥中的植物内基因靶向系统中，其依赖于在基因组的不同基因座处在重组前从植物基因组切除的供体DNA，仅在靶基因座处引入双链DNA断裂导致植物基因组中大量的精确基因编辑，而使用切口酶或配对切口酶没有或几乎没有鉴定到任何真实的基因靶向事件。用配对切口酶获得的事件的主要部分是异位重组事件。本领域需要使用最近开发的CRISPR方法将供体DNA有效且可靠地引入异倍体和/或多倍体植物，优选异倍体和/或多倍体作物的基因组的预定区域。此外，本领域需要通过降低植物基因组中存在的InDel的比例来提高将供体DNA引入植物(优选异倍体和/或多倍体植物，例如异倍体和/或多倍体作物)基因组中的效率。

发明详述

本发明的第一个实施方案包括一个将至少一个供体DNA分子引入植物细胞，优选作物植物细胞(更优选异倍体或多倍体或异倍体和多倍体作物植物细胞，最优选小麦细胞)基因组的至少一个靶区域中的方法，其包括以下步骤：

a.向所述植物细胞中引入

i.供体DNA分子，和

ii.至少一个RNA指导的切口酶，和

iii.至少两个单指导RNA(sgRNA)或至少两个CRISPR RNA(crRNA)和反式激活RNA(tracrRNA)，和

b.孵育植物细胞以允许将所述至少一个供体DNA引入所述基因组的至少一个靶区域中，和

c.选择在所述靶区域中包含供体DNA分子序列的植物细胞，

其中切口酶在靶位点处在相对链上或在一条链上形成至少两个切口，即在植物细胞(优选作物植物细胞，更优选异倍体或多倍体或异倍体和多倍体作物植物细胞，最优选小麦细胞)的基因组DNA的靶区域中或附近形成至少两个切口，和

其中这些切口彼此间隔至少20个碱基对，和

其中切口之间的碱基对不溶解(dissolved)并通过保持互补碱基之间的氢键完整而将DNA双链保持在一起，和

其中每个切口位点与至少一个PAM序列相邻，和

其中至少两个sgRNA或至少两个tracrRNA和crRNA将至少一个RNA指导的切口酶靶向靶位点。

在优选实施方案中，切口至少彼此间隔21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145或150个碱基对，但彼此间隔不超过200、195、190、185、180、175、170、165、160或155个碱基对。

在一个实施方案中，供体DNA在其5′和/或3′端功能性地连接至少30个碱基，各自与靶区域中的序列至少80％相同，优选供体DNA在其5′和3′端功能性地连接这样的序列。优选，供体DNA的至少一侧，优选供体DNA的两侧的序列包含至少40、至少50、至少60、至少70、至少80、至少90或至少100个碱基。更优选，供体DNA的至少一侧，优选供体DNA的两侧的序列包含至少150个碱基、至少200个碱基、至少300个碱基、至少350个碱基或至少400个碱基。这些碱基与由RNA指导的切口酶引入的双链或单链切口的相应5′和3′区域至少80％，优选至少85％，优选90％，优选91％、92％、93％、94％、92％、93％或94％相同。更优选，这些碱基与由RNA指导的切口酶引入的双链或单链切口的相应5′和3′区域具有至少95％同一性、96％同一性、97％同一性、98％同一性或99％同一性。在最优选的实施方案中，这些碱基与由RNA指导的切口酶引入的双链或单链切口的相应5′和3′区域100％相同。

在一个实施方案中，供体DNA的5′和/或3′末端的至少30个碱基与其中基因组DNA中插入供体DNA或其序列的双链或单链切口的相应5′和/或3′区域100％相同。在另一个实施方案中，供体DNA的5′和/或3′末端的至少40或50个碱基与双链或单链切口的相应5′和/或3′区域至少98％相同。在另一个实施方案中，供体DNA的5′和/或3′末端的至少60或70个碱基与双链或单链切口的相应5′和/或3′区域至少95％相同。在优选实施方案中，供体DNA的5′和/或3′末端的至少80或90个碱基与双链或单链切口的相应5′和/或3′区域至少92％相同。在更优选的实施方案中，供体DNA的5′和/或3′末端的至少100个碱基与双链或单链切口的相应5′和/或3′区域至少90％相同。在更优选的实施方案中，供体DNA的5′和/或3′末端的至少150或200个碱基与双链或单链切口的相应5′和/或3′区域至少85％相同。在进一步优选的实施方案中，供体DNA的5′和/或3′末端的至少250、300、350或400与双链或单链切口的相应5′和/或3′区域至少80％相同。

在本发明的一个实施方案中，供体DNA分子是单链的，在另一个实施方案中，供体DNA分子是双链的。在一个实施方案中，供体DNA分子的长度不超过10个核苷酸，在另一个实施方案中，其长度不超过20、30、40或50个核苷酸。在另一个实施方案中，供体DNA分子的长度不超过60、70、80、90或100个核苷酸。在另一个实施方案中，供体DNA分子的长度不超过125、150、200、300、400或500个核苷酸。在另一个实施方案中，供体DNA分子的长度不超过600、700、800、900、1000、1100、1200、1300、1400或1500个核苷酸。在另一个实施方案中，供体DNA分子的长度不超过2000、2500、3000、3500、4000、4500或5000个核苷酸。

在一个实施方案中，将供体DNA分子添加至异倍体或多倍体植物(优选异倍体或多倍体作物)的基因组的靶区域，并且不替换基因组DNA。在另一个实施方案中，供体DNA分子替换异倍体或多倍体植物(优选异倍体或多倍体作物)基因组的靶区域中的序列，所述序列比供体DNA分子更短、相同大小或更长。

在一个实施方案中，供体DNA分子包含不存在于异倍体或多倍体植物(优选异倍体或多倍体作物)基因组的靶区域的序列。通过在异倍体或多倍体植物(优选异倍体或多倍体作物)基因组的靶区域中引入此类DNA分子，将另外的DNA添加到基因组中，所述另外的DNA可以包含调控区，如启动子、内含子、增强子或终止子，其可以包含转录区，例如ORF，或可以编码非编码RNA，如微RNA前体、长非编码RNA等，或其可以包含一个或多种表达构建体。在另一个实施方案中，供体DNA分子包含与异倍体或多倍体植物(优选异倍体或多倍体作物)基因组的靶区域同源的序列，但包含与基因组靶区域处的WT序列不同的一个或多个精确基因编辑。这样的供体DNA分子替换基因组中的相应序列，从而将精确的基因编辑引入异倍体或多倍体植物(优选异倍体或多倍体作物)基因组中。

植物细胞优选源自异倍体或多倍体植物，如菊花、大丽花或藏红花，优选异倍体或多倍体作物，例如小麦、黑小麦、棉花、马铃薯、油菜、韭葱、烟草、花生、燕麦、猕猴桃、香蕉、草莓、无籽西瓜、香蕉、柑橘、甘蔗、oca以及一些苹果和金诺橘品种。

孵育植物细胞以允许将供体DNA引入细胞基因组中可以在有利于维持细胞活力的任何条件下发生。温度优选在20℃与32℃之间，这取决于例如所使用的RNA指导的切口酶。关于Cas9切口酶(nCas9)，温度优选在18℃与30℃之间，更优选在20℃与28℃之间，最优选在22℃与26℃之间。关于Cas12a切口酶(nCas12a)，温度优选在22℃至32℃之间，更优选在24℃至30℃之间，最优选在28℃至30℃之间。

优选在16h光照/8h黑暗条件下，优选在昏暗光照条件下，更优选在黑暗中孵育细胞。在所述条件下，孵育时间为1天至7周，优选5周至7周。

RNA指导的切口酶分别通过退火的crRNA和tracrRNA或单指导RNA引导至靶位点。靶位点与PAM序列相邻，所述PAM序列对所使用的RNA指导的切口酶具有特异性。

如果在相应细胞的基因组DNA中对两个靶位点进行切口，则将至少两个退火的crRNA和tracrRNA或至少两个单指导RNA或至少一个退火的crRNA和tracrRNA和至少一个单指导RNA引入细胞中，每个将相应的切口酶靶向其与PAM序列相邻的靶位点。

本发明的另一个实施方案是一个用于产生包含供体DNA的植物的方法，所述植物优选作物植物，更优选异倍体或多倍体作物植物，最优选包含供体DNA的小麦植物，所述供体DNA优选包含精确的基因编辑，所述方法包括以下步骤：

a.向所述植物细胞中引入

i.供体DNA分子，和

ii.至少一个RNA指导的切口酶，和

iii.至少两个sgRNA或至少两个crRNA和tracrRNA，和

b.孵育植物细胞以允许将所述至少一个供体DNA引入所述植物细胞的基因组的靶区域中，和

c.选择在所述靶区域中包含供体DNA分子序列的植物细胞，和

d.从所述选择的植物细胞再生植物，

其中切口酶在靶位点处在相对链上或在一条链上形成至少两个切口，即在植物细胞(优选作物植物细胞，更优选异倍体或多倍体作物植物细胞，最优选小麦细胞)的基因组DNA的靶区域中或附近形成至少两个切口，和

其中这些切口彼此间隔至少20个碱基对，和

其中切口之间的碱基对不溶解并通过保持互补碱基之间的氢键完整而将DNA双链保持在一起，和

其中每个切口位点与至少一个PAM序列相邻，和

本发明的另一个实施方案是如上所述的方法，其中在步骤b.之后，将植物细胞在包含选择剂的培养基上孵育。

负向选择标记赋予对杀生物化合物(如代谢抑制剂(例如，2-脱氧葡萄糖-6-磷酸，WO 98/45456)、抗生素(例如，卡那霉素、G418、博来霉素或潮霉素)或除草剂(例如，草丁膦或草甘膦))的抗性。特别优选的负向选择标记是赋予除草剂抗性的那些。这些标记中的一些(除了它们作为标记的功能之外)可以用于赋予所得植物除草剂抗性性状。可以提及的实例是：

-草丁膦乙酰转移酶(PAT；也称为双丙氨膦抗性；bar；de Block等(1987)EMBO J6：25 13-2518；EP 0 333 033；US 4,975,374)

-赋予草甘膦(N-膦酰基甲基甘氨酸)抗性的5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS；US 5,633,435)或草甘膦氧化还原酶基因(US 5,463,175)(Shah等(1986)Science233：478)

-草甘膦降解酶(草甘膦氧化还原酶；GOX)，

-茅草枯失活脱卤酶(deh)

-磺酰脲-和咪唑啉酮-灭活乙酰乳酸合酶(例如具有例如S4和/或Hra突变的突变ALS变体)

-溴苯腈降解腈水解酶(bxn)

-卡那霉素-或G418-抗性基因(NPTII；NPTI)，编码例如新霉素磷酸转移酶(Fraley等(1983)Proc Natl Acad Sci USA 80：4803)，其表达赋予对抗生素卡那霉素和相关抗生素新霉素、巴龙霉素、庆大霉素和G418的抗性的酶，

-赋予对2-脱氧葡萄糖的抗性的2-脱氧葡萄糖-6-磷酸磷酸酶(DOGR1基因产物；WO98/45456；EP 0 807 836)(Randez-Gil等(1995)Yeast 11：12 33-1240)

-潮霉素磷酸转移酶(HPT)，其介导对潮霉素的抗性(Vanden Elzen等(1985)PlantMol Biol.5：299)。

-二氢叶酸还原酶(Eichholtz等(1987)Somatic Cell and Molecular Genetics13，67-76)

赋予对抗生素抗性的细菌来源的其他负向选择标记基因包括aadA基因，其赋予对抗生素大观霉素、庆大霉素乙酰转移酶、链霉素磷酸转移酶(SPT)、氨基糖苷-3-腺苷转移酶和博来霉素抗性决定簇的抗性(Svab等(1990)Plant Mol.Biol.14：197；Jones等(1987)Mol.Gen.Genet.210：86；Hille等(1986)Plant Mol.Biol.7：171(1986)；Hayford等(1988)Plant Physiol.86：1216)。

负向选择标记可进一步赋予对D-氨基酸(如，例如D-丙氨酸和D-丝氨酸)施加的毒性作用的抗性(WO 03/060133；Erikson等，(2004)NatBiotechnol.22(4)：455-8)，例如来自酵母瘦弱红酵母(Rhodotorula gracilis)(圆红冬孢酵母(Rhodosporidium toruloides))的daol基因(EC：1.4.3.3：GenBank登录号：U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨酶)[EC：4.3.1.18；GenBank登录号：J01603)。根据所用的D-氨基酸，D-氨基酸氧化酶标记可用作提供负向选择(例如，与例如D-丙氨酸或D-丝氨酸组合时)或反向选择(例如，与D-亮氨酸或D-异亮氨酸组合时)的双功能标记。

或者，正向选择标记可以应用于本发明的方法中。与未转化的植物相比，此类正向选择标记赋予转化的植物生长优势。基因，如来自根癌土壤杆菌(菌株：PO22；GenBank登录号：AB025109)的异戊烯基转移酶，可以--作为细胞分裂素生物合成的关键酶--促进转化植物的再生(例如，通过在无细胞分裂素的培养基上选择)。描述了相应的选择方法(Ebinuma等(2000a)Proc Natl Acad Sci USA 94：2117-2121；Ebinuma等(2000b)Selection ofMarker-free transgenic plants using the oncogenes(ipt，rol A、B、C)ofAgrobacterium as selecable markers，见Molecular Biology of Woody Plants.KluwerAcademic Publishers)。与非转化植物相比，赋予转化植物生长优势的其他正向选择标记描述于例如EP-A 0601092中。生长刺激选择标记可包括(但不应限于)葡糖醛酸糖苷酶(与例如细胞分裂素葡糖苷酸组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、UDP-半乳糖-4-差向异构酶(与例如半乳糖组合)。

反向选择标记特别适合于选择具有包含所述标记的限定缺失序列的生物体(Koprek等(1999)Plant J 19(6)：719-726)。反向选择标记的实例包括胸苷激酶(TK)、胞嘧啶脱氨酶(Gleave等(1999)Plant Mol Biol.40(2)：223-35；Perera等，(1993)PlantMol.Biol 23(4)：793-799；Stougaard(1993)Plant J 3：755-761)、细胞色素P450蛋白(Koprek等(1999)Plant J 19(6)：719-726)、卤代烷脱卤酶(Naested(1999)Plant J 18：571-576)、iaaH基因产物(Sundaresan等(1995)Gene Develop 9：1797-1810)、胞嘧啶脱氨酶codA(Schlaman和Hooykaas(1997)Plant J 11：13 77-1385)或tms2基因产物(Fedoroff和Smith(1993)Plant J 3：27 3-289)。

在本发明的方法中，RNA指导的切口酶可以是任何RNA指导的切口酶，优选它们是Cas切口酶。技术人员知道本领域中描述的许多Cas切口酶。例如，Cas9、Cas12a、Cas12b、CasX、CasY、C2c1、C2c3、C2c2、Cas12k等。

此外，描述了用于鉴定新Cas切口酶的方法(US9790490)，并允许技术人员进一步分离未知的Cas切口酶。

在本发明的优选实施方案中，Cas切口酶是Cas9或Cas12a切口酶或无活性Cas(dCas)，例如与切口酶活性融合的dCas9或dCas12a融合蛋白，如，例如FokI切口酶(US9200266)。

在本发明方法的另一个实施方案中，将由核酸分子编码的切口酶或至少一个sgRNA或至少一个crRNA和tracrRNA引入所述细胞中。所述核酸分子可以是编码相应的切口酶、sgRNA、crRNA和/或tracrRNA的RNA分子或线性DNA分子，优选核酸分子是包含编码所述至少一个切口酶或至少一个sgRNA或至少一个crRNA和tracrRNA的表达盒的质粒。

在优选实施方案中，至少一个切口酶对于在相应的异倍体或多倍体植物中表达是序列优化的。序列优化是本领域技术人员已知的技术。可获得使任何给定的DNA或RNA分子适应于其中应表达相应蛋白质的生物体的优选密码子使用的计算机程序。一些程序另外允许隐蔽剪接侧的突变、RNA折叠的减少等。

可以使用技术人员已知的任何方法将RNA指导的切口酶和至少一个sgRNA或至少一个crRNA和tracrRNA引入细胞中。可以应用如农杆菌介导的转化，使用PEG、脂蛋白或其他多肽的转染，电穿孔或弹道方法(如粒子轰击)的方法。优选，将至少一个RNA指导的切口酶和至少一个sgRNA或至少一个crRNA和tracrRNA作为在所述细胞外组合的核糖核蛋白(RNP)引入所述细胞中。

在本发明方法的优选实施方案中，预先选择供体DNA和crRNA/tracrRNA或sgRNA的组合以将供体DNA分子有效地引入靶区域。在本发明方法的优选实施方案中，使用颗粒轰击或土壤杆菌介导的DNA引入，将至少一个供体DNA和至少一个RNA指导的切口酶和至少一个单指导-eRNA(sgRNA)或tracrRNA和crRNA引入所述细胞中。

优选，至少一个RNA指导的切口酶包含核定位信号。

定义

缩写：GFP-绿色荧光蛋白、GUS-β-葡糖醛酸糖苷酶、BAP-6-苄氨基嘌呤；2，4-D-2，4-二氯苯氧基乙酸；MS-Murashige和Skoog培养基；NAA-1-萘乙酸；MES，2-(N-吗啉代-乙磺酸，IAA吲哚乙酸；Kan：硫酸卡那霉素；GA3-赤霉酸；Timentin^TM：替卡西林二钠/克拉维酸钾，microl：微升。

应当理解，本发明不限于特定的方法或方案。还应理解，本文使用的术语仅用于描述特定实施方案的目的，并不旨在限制本发明的范围，本发明的范围将仅由所附权利要求书限制。必须注意，除非上下文另有明确规定，否则如本文和所附权利要求书中所用，单数形式“一个(a)”、“一个(an)”和“该(the)”包括复数指代。因此，例如，提及“载体”是指一个或多个载体，并且包括本领域技术人员已知的其等同物，等等。术语“约”在本文中用于表示近似地、大致地、周围或在......的区域中。术语“约”与数值范围结合使用时，它通过将边界扩展到所述数值之上和之下来修饰该范围。通常，术语“约”在本文中用于以20％的变化在所述值之上和之下修饰数值，优选向上或向下(更高或更低)10％。如本文所用，词语“或”意指特定列表，并且还包括该列表的成员的任何组合的任何一个成员。在本说明书和所附权利要求中使用时，“包含(comprise)”、“包含(comprising)”、“包括(include)”、“包括(including)”和“包括(includes)”旨在指定一个或多个所述特征、整数、部件或步骤的存在，但它们不排除一个或多个其他特征、整数、部件、步骤或其组的存在或添加。为清楚起见，说明书中使用的某些术语定义和使用如下：

反平行：“反平行”在本文中是指通过互补碱基残基之间的氢键配对的两个核苷酸序列，其中磷酸二酯键在一个核苷酸序列中以5′-3′方向延伸，并且在另一个核苷酸序列中以3′-5′方向延伸。

反义：术语“反义”是指相对于其转录或功能的正常方向反转的核苷酸序列，并因此表达与宿主细胞内表达的靶基因mRNA分子互补的RNA转录物(例如，它可以通过Wat-Son-Crick碱基配对与靶基因mRNA分子或单链基因组DNA杂交)或表达与靶DNA分子(如，例如存在于宿主细胞中的基因组DNA)互补的RNA转录物。

编码区：如本文所用的，用于提及结构基因时，术语“编码区”是指编码由于mRNA分子的翻译而在新生多肽中发现的氨基酸的核苷酸序列。在真核生物中，编码区在5′侧由编码起始甲硫氨酸的核苷酸三联体“ATG”界定，并且在3′侧由指定终止密码子的三个三联体之一(即TAA、TAG、TGA)界定。除了含有内含子，基因的基因组形式还可以包括位于RNA转录物上存在的序列的5′-和3′-末端的序列。这些序列被称为“侧翼”序列或区域(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5′或3′)。5′-侧翼区可含有调控序列，如控制或影响基因转录的启动子和增强子。3′-侧翼区可含有指导转录终止、转录后切割和聚腺苷酸化的序列。

互补：“互补”或“互补性”是指包含能够在反平行核苷酸序列中的互补碱基残基之间形成氢键时彼此配对(通过碱基配对规则)的反平行核苷酸序列的两个核苷酸序列。例如，序列5’-AGT-3′与序列5′-ACT-3′互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则不匹配。核酸分子之间的“全部”或“完全”互补性是每个核酸碱基在碱基配对规则下与另一个碱基匹配的情况。核酸分子链之间的互补程度对核酸分子链之间的杂交效率和强度具有显著影响。如本文所用的核酸序列的“互补序列”是指其核酸分子显示出与核酸序列的核酸分子的全部互补性的核苷酸序列。

供体DNA分子：如本文所用的，术语“供体DNA分子”、“修复DNA分子”或“模板DNA分子”在本文中均可互换使用，意指具有待引入细胞基因组中的序列的DNA分子。它可以在5′和/或3′末端侧接与所述细胞基因组的靶区域中的序列同源或相同的序列。它可以包含在相应细胞中不是天然存在的序列，如ORF、非编码RNA或应引入靶区域中的调控元件，或者它可以包含除了至少一个突变外与靶区域同源的序列。

基因编辑：供体DNA分子的序列可以添加到基因组中，或者它可以替换供体DNA序列长度的基因组中的序列。

双链RNA：“双链RNA”分子或“dsRNA”分子包含核苷酸序列的有义RNA片段和核苷酸序列的反义RNA片段，其均包含彼此互补的核苷酸序列，从而允许有义和反义RNA片段配对并形成双链RNA分子。

内源性：“内源性”核苷酸序列是指存在于未转化的植物细胞的基因组中的核苷酸序列。

增强的表达：“增强”或“增加”核酸分子在植物细胞中的表达在本文中等同地使用，并且意指与应用该方法前在植物、植物部分或植物细胞中的表达相比，或与缺乏本发明的重组核酸分子的参考植物相比，在应用本发明的方法后核酸分子在植物、植物部分或植物细胞中的表达水平较高。例如，参考植物包含仅缺少相应NEENA结构的相同构建体。如本文所用的术语“增强的”或“增加的”是同义的，并且在本文中意指待表达的核酸分子的更高、优选显著更高的表达。如本文所用的，如蛋白质、mRNA或RNA等物质的水平的“增强”或“增加”是指相对于在基本上相同的条件下生长的，但缺乏本发明的重组核酸分子，例如缺乏本发明的NEENA分子、重组构建体或重组载体的基本上相同的植物、植物部分或植物细胞的水平增加。如本文所用的，由靶基因表达的物质(如，例如preRNA、mRNA、rRNA、tRNA、snoRNA、snRNA)和/或由其编码的蛋白质产物的水平的“增强”或“增加”意指相对于缺乏本发明的重组核酸分子的细胞或生物体，水平增加50％或更多，例如100％或更多，优选200％或更多，更优选5倍或更多，甚至更优选10倍或更多，最优选20倍或更多，例如50倍。增强或增加可以通过技术人员熟悉的方法来确定。因此，核酸或蛋白质量的增强或增加可以例如通过蛋白质的免疫学检测来确定。此外，诸如蛋白质测定、荧光、Northern杂交、核酸酶保护测定、逆转录(定量RT-PCR)、ELISA(酶联免疫吸附测定)、Western印迹、放射免疫测定(RIA)或其他免疫测定和荧光激活细胞分析(FACS)的技术可用于测量植物或植物细胞中的特定蛋白质或RNA。根据诱导的蛋白质产物的类型，还可以确定其活性或对生物体或细胞的表型的影响。用于确定蛋白质量的方法是本领域技术人员已知的。可以提及的实例是：微-Biuret法(Goa J(1953)Scand J Clin Lab Invest 5：218-222)、Folin-Ciocalteau法(Lowry OH等(1951)J Biol Chem 193：265-275)或测量CBB G-250的吸收(Bradford MM(1976)Analyt Bio-Chem 72：248-254)。作为用于定量蛋白质活性的一个实例，荧光素酶活性的检测描述于以下实施例中。

表达：“表达”是指基因产物的生物合成，优选是指细胞中核苷酸序列(例如内源基因或异源基因)的转录和/或翻译。例如，在结构基因的情况下，表达涉及结构基因转录成mRNA和任选随后mRNA翻译成一个或多个多肽。在其他情况中，表达可以仅指携带RNA分子的DNA的转录。

表达构建体：如本文所用的“表达构建体”意指能够指导特定核苷酸序列在植物或植物细胞的适当部分中表达的DNA序列，其包含在其将被引入的植物或植物细胞的所述部分中有功能的启动子，所述启动子可操作地连接目的核苷酸序列，所述目的核苷酸序列任选可操作地连接终止信号。如果需要翻译，其通常还包含核苷酸序列正确翻译所需的序列。编码区可以编码目的蛋白质，但也可以在有义或反义方向上编码目的功能性RNA，例如RNAa、siRNA、snoRNA、snRNA、微RNA、ta-siRNA或任何其他非编码调节RNA。包含目的核苷酸序列的表达构建体可以是嵌合的，这意味着其一个或多个组分相对于其一个或多个其他组分是异源的。表达构建体也可以是天然存在的但以可用于异源表达的重组形式获得的表达构建体。然而，通常，表达构建体相对于宿主是异源的，即表达构建体的特定DNA序列不天然存在于宿主细胞中，并且必须通过转化事件引入宿主细胞或宿主细胞的祖先中。表达构建体中的核苷酸序列的表达可以在组成型启动子或诱导型启动子的控制下，其仅在宿主细胞暴露于一些特定的外部刺激时才启动转录。在植物的情况下，启动子也可以对特定组织或器官或发育阶段具有特异性。

外源：术语“外源”是指通过实验操作引入细胞基因组中的任何核酸分子(例如，基因序列)，并且可以包括在细胞中发现的序列，只要引入的序列含有一些修饰(例如，点突变、存在选择性标记基因等)，并且因此相对于天然存在的序列是不同的。

功能性连接：术语“功能性连接”或“功能性连接的”应理解为意指例如调节元件(例如启动子)与待表达的核酸序列以及(如果合适的话)另外的调节元件(例如终止子或NEENA)的顺序排列，使得每个调节元件可以实现其预期功能以允许、修饰、促进或以其他方式影响所述核酸序列的表达。作为同义词，可以使用措辞“可操作的连接”或“可操作地连接”。表达可以根据核酸序列相对于有义或反义RNA的排列而产生。为此，不一定需要化学意义上的直接连接。遗传控制序列，如，例如，增强子序列也可以从更远的位置或实际上从其他DNA分子对靶序列发挥其功能。优选的排列是其中待重组表达的核酸序列位于作为启动子的序列后，使得两个序列彼此共价连接的那些排列。启动子序列和待重组表达的核酸序列之间的距离优选小于200个碱基对，特别优选小于100个碱基对，非常特别优选小于50个碱基对。在优选实施方案中，待转录的核酸序列位于启动子后，以这样的方式使得转录起始与本发明的嵌合RNA的所需起始相同。功能性连接和表达构建体可以通过所述的常规重组和克隆技术产生(例如，Maniatis T，Fritsch EF和Sambrook J(1989)Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor Laboratory，Cold Spring Harbor(NY)；Silhavy等(1984)Experiments with Gene Fusions，Cold Spring HarborLaboratory，Cold Spring Harbor(NY)；Ausubel等(1987)Current Protocols inMolecular Biology，Greene Publishing AS Soc.and Wiley Interscience；Gelvin等(编)(1990)Plant Molecular Biology Manual；Kluwer Academic Publisher，Dordrecht，The Netherlands)。然而，例如充当具有限制酶的特异性切割位点的接头或充当信号肽的其他序列也可以位于两个序列之间。序列的插入也可导致融合蛋白的表达。优选，由调控区(例如启动子)和待表达的核酸序列的连接组成的表达构建体可以以载体整合的形式存在，并例如通过转化插入植物基因组中。

基因：术语“基因”是指可操作地连接能够以某种方式调节基因产物(例如，多肽或功能性RNA)的表达的适当调节序列的区域。基因包括编码区(开放阅读框，ORF)之前(上游)和之后(下游)的DNA的非翻译调节区(例如，启动子、增强子、遏制子等)，以及在适用的情况下，各个编码区(即外显子)之间的中间序列(即内含子)。如本文所用的术语“结构基因”旨在意指转录成mRNA的DNA序列，该mRNA然后被翻译成特定多肽的特征性氨基酸序列。

在本文中使用时，“基因编辑”意指在细胞基因组的特定位置处引入特定突变。可以通过使用更先进的技术的精确编辑，例如使用CRISPR Cas系统和供体DNA，或与诱变活性相关的CRISPR Cas系统，如脱氨酶(WO15133554、WO17070632)，来引入基因编辑。

基因组和基因组DNA：术语“基因组”或“基因组DNA”是指宿主生物体的固有遗传信息。所述基因组DNA包含细胞核的DNA(也称为染色体DNA)，但也包含质体(例如，叶绿体)和其他细胞器(例如，线粒体)的DNA。优选，术语基因组或基因组DNA是指细胞核的染色体DNA。

异源的：关于核酸分子或DNA的术语“异源的”是指与第二核酸分子可操作地连接或被操纵以变得可操作地连接的核酸分子，所述第二核酸分子例如是在自然界中(例如在WT植物的基因组中)不与其可操作地连接的启动子，或在自然界中在不同地点或位置处(例如在WT植物的基因组中)与其可操作地连接的启动子。

优选地，关于核酸分子或DNA(例如NEENA)的术语“异源”是指与第二核酸分子(例如在自然界中不与其可操作地连接的启动子)可操作地连接或被操纵以变得可操作地连接的核酸分子。

包含核酸分子和与其连接的一个或多个调控核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体，其中a)所述核酸分子，或b)所述调控核酸分子，或c)两者(即(a)和(b))不位于其自然(天然)遗传环境中或已通过实验操作修饰，修饰的实例是一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境是指起源生物体中的天然染色体基因座，或基因组文库中的存在。在基因组文库的情况下，优选至少部分地保留核酸分子序列的天然遗传环境。环境至少在一侧侧接核酸序列，并且具有长度为至少50bp，优选至少500bp，特别优选至少1,000bp，非常特别优选至少5,000bp的序列。天然存在的表达构建体-例如启动子与相应基因的天然存在的组合-其通过非天然的合成“人工”方法(如，例如，诱变)修饰时变成转基因表达构建体。这些方法已有描述(US 5,565,350；WO 00/15815)。例如，编码蛋白质的核酸认为与启动子(其不是该分子的天然启动子)可操作地连接的分子相对于启动子是异源的。优选，异源DNA对于其所引入的细胞不是内源的或不是与其天然相关的，而是已经从另一个细胞获得或已经合成。异源DNA还包括内源DNA序列，其含有一些修饰、非天然存在的多拷贝的内源DNA序列，或与其物理连接的另一DNA序列不天然相关的DNA序列。通常，尽管不是必需的，但异源DNA编码通常不由它在其中表达的细胞产生的RNA或蛋白质。

高表达启动子：如本文所用的“高表达启动子”意指在植物或其部分中引起表达的启动子，其中源自在相应启动子控制下的核酸分子的RNA的积累或合成速率或RNA的稳定性高于，优选显著高于由缺乏本发明NEENA的启动子引起的表达。优选地，相对于缺少本发明NEENA的启动子，RNA的量和/或RNA的合成速率和/或RNA的稳定性增加50％或更多，例如100％或更多，优选200％或更多，更优选5倍或更多，甚至更优选10倍或更多，最优选20倍或更多，例如50倍。

杂交：如本文所定义的术语“杂交”是其中基本上互补的核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中发生，即两个互补核酸都在溶液中。杂交过程也可以用固定在基质(如磁珠、琼脂糖珠或任何其它树脂)上的互补核酸之一进行。杂交过程还可以用其中互补核酸之一固定在固体支持物(如硝酸纤维素或尼龙膜)上或通过例如光刻法固定在例如硅质玻璃支持物(后者称为核酸阵列或微阵列或核酸芯片)上来进行。为了允许杂交发生，通常将核酸分子热变性或化学变性以将双链解链成两条单链和/或从单链核酸中除去发夹或其他二级结构。

术语“严格性”是指发生杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成的这些条件影响。通常，选择低严格性条件为在限定的离子强度和pH下比特定序列的热解链点(Tm)低约30℃。中等严格条件是温度比Tm低20℃时，并且高严格条件是温度比Tm低10℃时。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。然而，由于遗传密码的简并性，核酸可能在序列上偏离并且仍然编码基本上相同的多肽。因此，有时可能需要中等严格性杂交条件来鉴定此类核酸分子。

“Tm”是在限定的离子强度和pH下的温度，在该温度下50％的目标序列与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成和长度。例如，较长的序列在较高温度下特异性地杂交。从低于Tm约16℃至32℃获得最大杂交速率。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥，从而促进杂合体形成；对于高达0.4M的钠浓度，这种效应是明显的(对于较高浓度，这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度，每百分比甲酰胺降低0.6至0.7℃，并且添加50％甲酰胺允许杂交在30至45℃下进行，尽管杂交速率将降低。碱基对错配降低了双链体的杂交速率和热稳定性。平均而言，且对于大的探针，每％碱基错配，Tm降低约1℃。根据杂合体的类型，可以使用以下等式计算Tm：

·DNA-DNA杂合体(Meinkoth和Wahl，Anal.Biochem.，138：267-284，1984)：

Tm＝81.5℃+16.6xlog([Na+]a)+0.41x％[G/Cb]-500×[Lc]-1-0.61x％甲酰胺

·DNA-RNA或RNA-RNA杂合体：

Tm＝79.8+18.5(log10[Na+]a)+0.58(％G/Cb)+11.8(％G/Cb)2-820/Lc

·寡-DNA或寡-RNAd杂合体：

对于＜20个核苷酸：Tm＝2(In)

对于20-35个核苷酸：Tm＝22+1.46(In)

其中：

A或对于其它一价阳离子，但仅在0.01-0.4M范围内准确

B对于％GC，仅在30％至75％范围内准确

c L＝碱基对中双链体的长度

d寡，寡核苷酸

In，引物的有效长度＝2×(G/C的数量)+(A/T的数量)

可以使用许多已知技术中的任何一种来控制非特异性结合，如，例如用含蛋白质的溶液封闭膜，向杂交缓冲液中添加异源RNA、DNA和SDS，以及用RNA酶处理。

对于非相关探针，可以通过改变(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50％至0％)中的一种来进行一系列杂交。本领域技术人员知道可以在杂交期间改变的各种参数并且所述参数将维持或改变严格条件。

除了杂交条件外，杂交的特异性通常还取决于杂交后洗涤的功能。为了去除由非特异性杂交产生的背景，用稀盐溶液洗涤样品。这种洗涤的关键因素包括最终洗涤溶液的离子强度和温度：盐浓度越低和洗涤温度越高，洗涤的严格性越高。洗涤条件通常在杂交严格性下或低于杂交严格性下进行。阳性杂交产生的信号至少是背景信号的两倍。通常，用于核酸杂交测定或基因扩增检测程序的合适的严格条件如上所述。也可以选择更严格或更不严格的条件。本领域技术人员知道可以在洗涤期间改变并且将维持或改变严格条件的各种参数。

例如，长于50个核苷酸的DNA杂合体的典型高严格性杂交条件包括在65℃下在1×SSC中或在42℃下在1×SSC和50％甲酰胺中杂交，然后在65℃下在0.3×SSC中洗涤。长于50个核苷酸的DNA杂合体的中等严格杂交条件的实例包括在50℃下在4×SSC中或在40℃下在6×SSC和50％甲酰胺中杂交，然后在50℃下在2×SSC中洗涤。杂合体的长度是杂交核酸的预期长度。杂交已知序列的核酸时，可以通过比对序列并鉴定本文所述的保守区域来确定杂合体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠；杂交溶液和洗涤溶液可以另外包括5×Denhardt’s试剂、0.5-10％SDS、100μg/ml变性的片段化鲑鱼精子DNA、0.5％焦磷酸钠。高严格条件的另一个实例是在65℃下在包含0.1×SDS和任选的5×Denhardt’s试剂、100μg/ml变性的片段化鲑鱼精子DNA、0.5％焦磷酸钠的0.1×SSC中杂交，然后在65℃下在0.3×SSC中洗涤。

为了确定严格性水平，可以参考Sambrook等(2001)Molecular Cloning：ALaboratory Manual，第3版，Cold Spring Harbor Laboratory Press，CSH，New York或Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.(1989和年度更新)。

“同一性”：关于两个或更多个核酸或氨基酸分子的比较使用时，“同一性”意指所述分子的序列共享一定程度的序列相似性，所述序列是部分相同的。

与亲本酶相比时，酶变体可以通过它们的序列同一性来定义。序列同一性通常以“％序列同一性”或“％同一性”提供。为了确定两个氨基酸序列之间的同一性百分比，在第一步中在这两个序列之间产生成对序列比对，其中两个序列在其完整长度上比对(即，成对全局比对)。用实施Needleman和Wunsch算法的程序(J.Mol.Biol.(1979)48，第443-453页)产生比对，优选通过使用程序“NEEDLE”(The European Molecular Biology OpenSoftware Suite(EMBOSS))，其具有程序默认参数(gapopen＝10.0，gapextend＝0.5和matrix＝EBLOSUM62)。出于本发明的目的，优选的比对是可以确定最高序列同一性的比对。

以下实施例旨在说明两个核苷酸序列，但相同的计算适用于蛋白质序列：

SEQ A：AAGATACTG长度：9个碱基

SEQ B：GATCTGA长度：7个碱基

因此，较短的序列是序列B。

产生显示两个序列在其完整长度上的成对全局比对导致

比对中的“|”符号表示相同的残基(其意指DNA的碱基或蛋白质的氨基酸)。相同残基的数目为6。

比对中的符号“-”指示缺口。通过序列B内的比对引入的缺口数为1。在序列B的边界处通过比对引入的缺口数为2，并且在序列A的边界处为1。

显示比对序列在其整个长度上的比对长度为10。

因此根据本发明产生在其整个长度上显示较短序列的成对比对导致：

因此根据本发明产生显示在其整个长度上序列A的成对比对导致：

因此根据本发明产生显示在其整个长度上序列B的成对比对导致：

显示较短序列在其整个长度上的比对长度为8(存在一个缺口，其在较短序列的比对长度中是考虑因素)。

因此，在其整个长度上显示序列A的比对长度将为9(意味着序列A是本发明的序列)。

因此，在其整个长度上显示序列B的比对长度将为8(意味着序列B是本发明的序列)。

在比对两个序列后，在第二步中，应从比对中确定同一性值。因此，根据本说明书，以下同一性百分比的计算适用：

％-同一性＝(相同残基/显示本发明的相应序列的在其完整长度上比对区域的长度)*100。因此，与根据本发明的两个氨基酸序列的比较相关的序列同一性通过将相同残基数除以比对区域的长度来计算，所述比对区域显示本发明的相应序列的完整长度。将该值乘以100以给出“％-同一性”。根据上文提供的实例，％-同一性为：对于作为本发明序列的序列A(6/9)*100＝66.7％；对于序列B，本发明的序列(6/8)*100＝75％。

InDel是与通过NHEJ修复DSB相关的生物体基因组中碱基的随机插入或缺失的术语。它被分类为小的遗传变异，长度从1到10000个碱基对。如本文所用的，它是指在靶位点中或其附近(例如，在上游和/或下游小于1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、25bp、20bp、15bp、10bp或5bp)的碱基的随机插入或缺失。

关于将供体DNA分子引入靶DNA的靶位点的术语“引入(introducing)”、“引入(introduction)”等意指将供体DNA分子的序列引入靶区域中，例如通过将供体DNA分子或其部分物理整合到靶区域中或将供体DNA分子的序列或其部分引入靶区域中，其中供体DNA用作聚合酶的模板。

内含子：是指基因内的DNA区段(间插序列)，其不编码基因产生的蛋白质部分，并且在从细胞核输出前从基因转录的mRNA中剪接出来。内含子序列是指内含子的核酸序列。因此，内含子是与编码序列(外显子)一起转录但在成熟mRNA形成期间被去除的DNA序列的那些区域。内含子可以位于实际编码区内或前mRNA(未剪接的mRNA)的5′或3′非翻译前导序列中。切除初级转录物中的内含子，同时精确地连接编码序列以形成成熟mRNA。内含子和外显子的连接形成剪接位点。内含子的序列以GU开始并以AG结束。此外，在植物中，已经描述了AU-AC`内含子的两个实例：来自拟南芥的recA样蛋白基因的第十四内含子和G5基因的第七内含子是AT-AC内含子。含有内含子的前mRNA具有三个短序列，除了其他序列之外，这三个短序列对于内含子被准确剪接是必需的。这些序列是5′剪接位点、3′剪接位点和分支点。mRNA剪接是去除初级mRNA转录物中存在的插入序列(内含子)并接上或连接外显子序列。这也称为顺式剪接，其在同一RNA上连接两个外显子，并去除间插序列(内含子)。内含子的功能元件包含被剪接体的特定蛋白质组分识别和结合的序列(例如在内含子末端剪接共有序列)。功能元件与剪接体的相互作用导致从成熟前mRNA去除内含子序列并重新连接外显子序列。内含子具有三个短序列，这三个短序列对于内含子被准确剪接是必需的(尽管不是足够的)。这些序列是5′剪接位点、3′剪接位点和分支点。分支点序列在植物的剪接和剪接位点选择中是重要的。分支点序列通常位于3′剪接位点上游10-60个核苷酸。

同基因的：生物体(例如植物)，其在遗传上是相同的，除了它们可以通过异源DNA序列的存在或不存在而不同。

分离的：如本文所用的术语“分离的”意指材料已通过人工移除并且与其原始的天然环境分开存在，因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化形式存在，或者可以存在于非天然环境中，如，例如，存在于在转基因宿主细胞中。例如，存在于活植物中的天然存在的多核苷酸或多肽不是分离的，但是与天然系统中的一些或所有共存材料分离的相同的多核苷酸或多肽是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或多肽可以是组合物的一部分并且将被分离，因为这样的载体或组合物不是其原始环境的一部分。优选地，关于核酸分子使用时，如在“分离的核酸序列”中，术语“分离的”是指从至少一个杂质核酸分子中鉴定和分离的核酸序列，所述杂质核酸分子通常在其天然来源中与其相关。分离的核酸分子是以与其在自然界中发现的形式或环境不同的形式或环境存在的核酸分子。相反，非分离的核酸分子是以它们在自然界中存在的状态发现的核酸分子，例如DNA和RNA。例如，给定的DNA序列(例如，基因)在邻近相邻基因的宿主细胞染色体上发现；RNA序列，如编码特定蛋白质的特定mRNA序列，作为与编码多种蛋白质的许多其他mRNA的混合物存在于细胞中。然而，包含例如SEQ ID NO：1的分离的核酸序列包括例如通常含有SEQ ID NO：1的细胞中的此类核酸序列，其中所述核酸序列位于与天然细胞不同的染色体或染色体外位置，或者以其他方式侧接与自然界中发现的核酸序列不同的核酸序列。分离的核酸序列可以以单链或双链形式存在。将分离的核酸序列用于表达蛋白质时，核酸序列最少将含有有义链或编码链的至少一部分(即，核酸序列可以是单链的)。或者，它可以含有有义链和反义链(即，核苷酸序列可以是双链的)。

最小启动子：启动子元件，特别是TATA元件，其在不存在上游激活的情况下是无活性的或具有大大降低的启动子活性。在合适的转录因子存在下，最小启动子起到允许转录的作用。

非编码：术语“非编码”是指不编码部分或全部表达的蛋白质的核酸分子序列。非编码序列包括但不限于内含子、增强子、启动子区、3′非翻译区和5′非翻译区。

核酸表达增强核酸(NEENA)：术语“核酸表达增强核酸”是指在与NEENA功能性连接的启动子的控制下具有增强核酸表达的固有性质的特定序列的序列和/或核酸分子。与启动子序列不同，NEENA本身不能驱动表达。为了实现增强与NEENA功能性连接的核酸分子的表达的功能，NEENA本身必须与启动子功能性连接。与本领域已知的增强子序列不同，NEENA以顺式而非反式起作用，并且必须位于待表达核酸的转录起始位点附近。

核酸和核苷酸：术语“核酸”和“核苷酸”是指天然存在的或合成的或人工的核酸或核苷酸。术语“核酸”和“核苷酸”包括单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另有说明，特定的核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)和互补序列，以及明确指出的序列。术语“核酸”在本文中可与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸，所述修饰包括但不限于5-位嘧啶修饰、8-位嘌呤修饰、胞嘧啶环外胺处的修饰、5-溴-尿嘧啶的取代等；和2′-位糖修饰，包括但不限于糖修饰的核糖核苷酸，其中2′-OH被选自H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN的基团替代。

短发夹RNA(shRNA)还可以包含非天然元件，如非天然碱基，例如离子蛋白和黄嘌呤，非天然糖，例如2′-甲氧基核糖，或非天然磷酸二酯键，例如甲基膦酸酯、硫代磷酸酯和肽。

核酸序列：短语“核酸序列”是指从5′-至3′-端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。它包括染色体DNA、自我复制质粒、DNA或RNA的感染性聚合物以及执行主要结构作用的DNA或RNA。“核酸序列”还指代表核苷酸的缩写、字母、字符或单词的连续列表。在一个实施方案中，核酸可以是“探针”，其是相对短的核酸，通常长度小于100个核苷酸。通常，核酸探针的长度为约50个核苷酸至约10个核苷酸。核酸的“靶区域”是被鉴定为目的核酸的一部分。核酸的“编码区”是核酸的一部分，置于适当的调节序列的控制下时，其以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。据说编码区编码这样的多肽或蛋白质。

寡核苷酸：术语“寡核苷酸”是指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的寡聚物或聚合物，以及具有功能类似的非天然存在的部分的寡核苷酸。这种修饰或取代的寡核苷酸常常优于天然形式，因为具有所需的性质，如，例如增强的细胞摄取、增强的对核酸靶标的亲和力以及在核酸酶存在下增加的稳定性。寡核苷酸优选包括通过键(例如磷酸二酯)或取代键彼此共价偶联的两个或更多个核单体。

突出端：“突出端”是在双链寡核苷酸分子的5′-或3′-羟基端上的相对短的单链核苷酸序列(也称为“延伸”、“凸出端”或“粘性端”)。

植物：通常理解为意指能够光合作用的任何真核单细胞或多细胞生物体或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。出于本发明的目的，包括植物界的高等和低等植物的所有属和种。一年生、多年生、单子叶和双子叶植物是优选的。该术语包括成熟植物、种子、芽和幼苗及其衍生部分、繁殖材料(如种子或小孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物，例如细胞培养物，以及产生功能或结构单元的任何其他类型的植物细胞分组。成熟植物是指处于超出幼苗发育阶段的任何所需发育阶段的植物。幼苗是指处于早期发育阶段的幼小的未成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因植物的优选宿主生物体。此外，基因的表达在所有观赏植物、有用的或观赏树木、花、切花、灌木或草坪中是有利的。可以通过举例而非限制的方式提及的植物是被子植物、苔藓植物，如，例如苔纲(Hepaticae)(苔类(liverworts))和藓纲(Musci)(藓类(mosses))；蕨类植物门(Pteridophytes)，如蕨类植物、木贼和棒苔藓；裸子植物，如针叶树、苏铁、银杏和买麻藤纲(Gnetatae)；藻类，如绿藻科、褐藻科、红藻科、粘藻科、黄藻科、硅藻科(硅藻属)和裸藻科。优选用于食物或饲料目的的植物，如豆科，如豌豆、苜蓿和大豆；禾本科，如稻、玉米、小麦、大麦、高粱、粟、黑麦、黑小麦或燕麦；伞形科，特别是胡萝卜属，非常特别是胡萝卜种(胡萝卜)和芹菜属，非常特别是芹菜种(芹菜)等；茄科，特别是番茄属，非常特别是番茄(番茄)种和茄属，非常特别是马铃薯种(马铃薯)和茄子种(茄子)，以及许多其他(如烟草)；和辣椒属，特别是辣椒种(辣椒)和许多其它种；豆科，特别是大豆属，非常特别是max种(大豆)、苜蓿、豌豆、紫花苜蓿、菜豆或花生以及许多其他种；和十字花科(Brassicacae)，尤其是芸苔属，特别是欧洲油菜(油菜)、白菜型油菜(甜菜)、oleracea cv Tastie(卷心菜)、oleracea cv Snowball Y(花椰菜)和oleracea cv Emperor(西兰花)；和拟南芥属，特别是拟南芥种和许多其它种；菊科(Compositae)，特别是莴苣属，非常特别是Sativa种(生菜)和许多其它种；菊科(Asteraceae)，如向日葵、万寿菊、生菜或金盏花和许多其他种；葫芦科，如甜瓜、南瓜/倭瓜或小西葫芦和亚麻籽。进一步优选的是棉花、甘蔗、大麻、亚麻、辣椒和各种树、坚果和葡萄物种。

多肽：术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在本文中可互换使用，是指连续氨基酸残基的聚合物或寡聚物。

前蛋白：蛋白质，其通常靶向细胞器，如叶绿体，并且仍然包含其转运肽。

关于在靶区域中引入供体DNA分子的“精确”意指与不包含在供体DNA分子序列中的靶区域的未改变的DNA序列相比，供体DNA分子的序列被引入靶区域而没有任何Indel、重复或其他突变。

初级转录物：如本文所用的术语“初级转录物”是指基因的未成熟RNA转录物。例如，“初级转录物”仍然包含内含子和/或尚未包含polyA尾或帽结构和/或缺少其作为转录物的正确功能所需的其他修饰，例如修剪或编辑。

启动子：术语“启动子”或“启动子序列”是等同物，并且如本文所用的，是指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。此类启动子可以例如在以下公共数据库http://www.grassius.org/grasspromdb.html、http://mendel.cs.rhul.ac.uk/mendel.php？topic＝plantprom、http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi中找到。其中列出的启动子可以用本发明的方法解决，并且通过引用并入本文。启动子位于目的核苷酸序列的转录起始位点的5′(即上游)附近，其控制所述目的核苷酸序列转录成mRNA，并且提供用于通过RNA聚合酶和其他转录因子特异性结合以起始转录的位点。所述启动子包含邻近转录起始位点例如至少10kb，例如5kb或2kb。它还可以包含邻近转录起始位点至少1500bp，优选至少1000bp，更优选至少500bp，甚至更优选至少400bp，至少300bp，至少200bp或至少100bp。在进一步优选的实施方案中，启动子包含邻近转录起始位点至少50bp，例如至少25bp。启动子不包含外显子和/或内含子区域或5′非翻译区。启动子可以例如是相应植物异源或同源的。如果源自外来物种，或如果来自相同物种，是修饰的而不同于其原始形式，则多核苷酸序列对于生物体或第二多核苷酸序列是“异源的”。例如，与异源编码序列可操作地连接的启动子是指来自与衍生启动子的物种不同的物种的编码序列，或者如果来自相同的物种，则是与启动子不天然相关的编码序列(例如，遗传工程化的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当发生表达的宿主细胞的基因或源自该宿主细胞的病原体(例如，植物或植物病原体，如植物病毒)。植物特异性启动子是适于在植物中调节表达的启动子。它可以源自植物，但也可以源自植物病原体，或者它可以是由人设计的合成启动子。如果启动子是诱导型启动子，则转录速率响应于诱导剂而增加。此外，启动子可以以组织特异性或组织优选的方式调节，使得其仅在或主要在转录特定组织类型(例如叶、根或分生组织)中的相关编码区中具有活性。术语“组织特异性”在其应用于启动子时是指在不同类型的组织(例如根)中相对不存在相同目的核苷酸序列的表达的情况下，能够指导目的核苷酸序列在特定类型的组织(例如花瓣)选择性表达的启动子。启动子的组织特异性可以通过例如将报道基因与启动子序列可操作地连接以产生报道构建体，将报道构建体引入植物的基因组中，使得报道构建体整合到所得转基因植物的每个组织中，并检测报道基因在转基因植物的不同组织中的表达(例如，检测由报道基因编码的mRNA、蛋白质或蛋白质的活性)来评估。相对于报道基因在其他组织中的表达水平，在一个或多种组织中检测到报道基因的更高表达水平表明启动子对检测到更高表达水平的组织是特异性的。应用于启动子的术语“细胞类型特异性”是指这样的启动子，其能够在相同组织内的不同类型的细胞中相对不存在相同目的核苷酸序列的表达的情况下，指导目的核苷酸序列在特定类型的细胞中的选择性表达。应用于启动子时，术语“细胞类型特异性”还意指能够促进目的核苷酸序列在单个组织内的区域中的选择性表达的启动子。启动子的细胞类型特异性可以使用本领域熟知的方法来评估，例如GUS活性染色、GFP蛋白或免疫组织化学染色。提及启动子或源自启动子的表达时，术语“组成型”意指在植物或植物部分基本上整个生命周期中在大部分组织和细胞中，启动子能够在不存在刺激(例如，热休克、化学、光等)的情况下指导可操作地连接的核酸分子的转录。通常，组成型启动子能够在基本上任何细胞和任何组织中指导转基因的表达。

启动子特异性：提及启动子时，术语“特异性”意指由相应启动子赋予的表达模式。特异性描述了植物或其部分的组织和/或发育状态，其中启动子赋予在相应启动子的控制下核酸分子的表达。启动子的特异性还可以包括环境条件，在该环境条件下，启动子可以被激活或下调，例如通过生物或环境胁迫(例如寒冷、干旱、创伤或感染)诱导或抑制。

纯化的：如本文所用，术语“纯化的”是指从其天然环境中取出、分离或分开的分子(核酸或氨基酸序列)。“基本上纯化的”分子至少60％不含，优选至少75％不含，更优选至少90％不含与其天然缔合的其它组分。纯化的核酸序列可以是分离的核酸序列。

重组：关于核酸分子的术语“重组”是指通过重组DNA技术产生的核酸分子。重组核酸分子还可以包含这样的分子，其本身不存在于自然界中，而是由人修饰、改变、突变或以其他方式操纵。优选，“重组核酸分子”是在序列上与天然存在的核酸分子相差至少一个核酸的非天然存在的核酸分子。“重组核酸分子”还可以包含“重组构建体”，其包含(优选可操作地连接)非天然以该顺序存在的核酸分子序列。用于产生所述重组核酸分子的优选方法可包括克隆技术、定向或非定向诱变、合成或重组技术。

有义：术语“有义”应理解为意指具有与靶序列互补或相同的序列的核酸分子，例如与蛋白质转录因子结合并参与给定基因表达的序列。根据优选的实施方案，核酸分子包含目的基因和允许所述目的基因表达的元件。

显著增加或减少：例如酶活性或基因表达的增加或减少，其大于测量技术中固有的误差范围，优选对照细胞中对照酶或表达的活性增加或减少约2倍或更多，更优选增加或减少约5倍或更多，最优选增加或减少约10倍或更多。

小核酸分子：“小核酸分子”理解为由核酸或其衍生物(如RNA或DNA)组成的分子。它们可以是双链或单链的，并且为约15至约30bp，例如15至30bp，更优选约19至约26bp，例如19至26bp，甚至更优选约20至约25bp，例如20至25bp。在特别优选的实施方案中，寡核苷酸为约21至约24bp，例如21至24bp。在最优选的实施方案中，小核酸分子为约21bp和约24bp，例如21bp和24bp。

基本上互补：在其最广泛的意义上，在本文中关于与参考或靶核苷酸序列相关的核苷酸序列使用时，术语“基本上互补”意指在基本上互补的核苷酸序列与所述参考或靶核苷酸序列的精确互补序列之间具有至少60％、更期望至少70％、更期望至少80％或85％、优选至少90％、更优选至少93％、还更优选至少95％或96％，还更优选至少97％或98％，还更优选至少99％或最优选100％的同一性百分比的核苷酸序列(后者在本文中等同于术语“相同”)。优选地，在核酸序列的至少19个核苷酸，优选至少50个核苷酸，更优选整个长度的长度上评估与所述参考序列的同一性(如果下文没有另外说明)。基于Needleman和Wunsch的算法(Needleman和Wunsch(1970)J.Mol.Biol.48：443-453，如上文所定义)，使用Wisconsin大学GCG的默认GAP分析，GAP的SWQWEB应用进行序列比较。与参考核苷酸序列“基本上互补”的核苷酸序列在低严格条件下，优选中等严格条件下，最优选高严格条件下(如上定义)与参考核苷酸序列杂交。

如本文所用的“靶区域”意指靠近靶位点例如离靶位点10个碱基、20个碱基、30个碱基、40个碱基、50个碱基、60个碱基、70个碱基、80个碱基、90个碱基、100个碱基、125个碱基、150个碱基、200个碱基或500个碱基或更多个碱基的区域，或包括其中供体DNA分子的序列被引入细胞基因组中的靶位点。

如本文所用的“靶位点”意指基因组中使用重组技术诱导双链断裂或一个或一对单链断裂(切口)的位置，所述重组技术如锌指、TALEN、限制酶、归巢核酸内切酶、RNA指导的核酸酶、RNA指导的切口酶，如CRISPR/Cas核酸酶或切口酶等。

转基因：如本文所用的术语“转基因”是指通过实验操作引入细胞基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源DNA序列”是指核苷酸序列，其天然存在于其所引入的细胞中，只要其相对于天然存在的序列不含一些修饰(例如，点突变、选择性标记基因的存在等)。

转基因的：当提及时，术语转基因的意指用重组DNA分子转化的，优选稳定转化的生物体，所述重组DNA分子优选包含与目的DNA序列可操作地连接的合适启动子。

载体：如本文所用的，术语“载体”是指能够转运已经与其连接的另一核酸分子的核酸分子。一个类型的载体是基因组整合的载体或“整合载体”，其可以整合到宿主细胞的染色体DNA中。另一个类型的载体是附加型载体，即能够染色体外复制的核酸分子。能够指导与其可操作地连接的基因表达的载体在本文中称为“表达载体”。在本说明书中，除非上下文另有明确说明，否则“质粒”和“载体”可互换使用。设计用于在体外或体内产生如本文所述的RNA的表达载体可以含有被任何RNA聚合酶识别的序列，包括线粒体RNA聚合酶、RNApol I、RNA pol II和RNA pol III。这些载体可用于在根据本发明的细胞中转录所需的RNA分子。植物转化载体应理解为适合于植物转化过程的载体。

野生型：关于生物体、多肽或核酸序列，术语“野生型”、“天然的”或“天然来源”意指所述生物体是天然存在的或在至少一个未被人改变、突变或以其他方式操纵的天然存在的生物体中可获得的。

附图：

图1：具有和不具有InDel等位基因的水稻单等位基因TIPS编辑事件的频率：配对Cas9切口酶与Cas9核酸酶

实施例

化学品和常用方法

除非另有说明，出于本发明的目的进行的克隆程序包括限制性消化、琼脂糖凝胶电泳、核酸纯化、核酸连接、转化、细菌细胞的选择和培养，如所述的进行(Sambrook等，1989)。使用Sanger技术(Sanger等，1977)，用激光荧光DNA测序仪(Applied Biosystems，Foster City，CA，USA)进行重组DNA的序列分析。除非另外描述，否则化学品和试剂获自Sigma Aldrich(Sigma Aldrich，St.Louis，USA)、Promega(Madison，WI，USA)、Duchefa(Haarlem，荷兰)或Invitrogen(Carlsbad，CA，USA)。限制性内切核酸酶来自New EnglandBiolabs(Ipswich，MA，USA)或Roche Diagnostics GmbH(Penzberg，德国)。寡核苷酸由Eurofins Eurofins Genomics(Ebersberg，德国)或Integrated DNA Technologies(Coralville，IA，USA)合成。

实施例1：筛选用于异源六倍体小麦中HDR介导的精确基因编辑的最佳gRNA和供体DNA组合

我们用于小麦中精确基因编辑的方法是基于首先在盾片愈伤组织水平筛选一组不同的gRNA/供体DNA组合，以鉴定用于产生编辑的小植株的优选gRNA/供体DNA组合。

在这个实施例中，我们描述了为了将特定的单个氨基酸取代(11781L)引入ACCase基因的编码序列中，我们预先筛选了5种不同的gRNA/供体DNA组合。设计了五种不同的gRNA，其将Cas9引导至I1781L取代的靶密码子附近的5个不同的靶位点。将sgRNA载体pBAY02528(SEQ ID NO：5)、pBAY02529(SEQ ID NO：6)、pBAY02530(SEQ ID NO：7)、pBAY02531(SEQ ID NO：8)和pBAY02532(SEQ ID NO：9)，各自包含用于表达gRNA的盒，所述gRNA可以指导Cas9在靶位点处产生DSB，所述靶位点序列分别为：TS1序列CTAGGTGTGGAGAACATACA-TGG(SEQ ID NO：50)、TS2序列GAAGGAGGATGGGCTAGGTG-TGG(SEQ IDNO：51)、TS3序列ATAGGCCCTAGAATAGGCAC-TGG(SEQ ID NO：52)、TS4序列CTCCTCATAGGCCCTAGAAT-AGG(SEQ ID NO：53)、TS5序列CTATTGCCAGTGCCTATTCT-AGG(SEQ IDNO：54)。开发了三种供体DNA载体，pBAY02539(SEQ ID NO：13)、pBAY02540(SEQ ID NO：14)和pBAY02541(SEQ ID NO：15)，其各自包括普通小麦栽培品种Fielder(Triticumaestivum，cv.Fielder)亚基因组B，含有所需突变(11781L取代)的ACCase基因的803bp DNA片段。3种供体DNA仅在少数沉默突变方面不同，以防止供体DNA和具有所需突变(11781L)的编辑的等位基因的切割。每个供体DNA中的3-bp(CTC)核心序列侧接约400-bp的左右同源臂，其与亚基因组B的WT ACCase序列相同。Cas9表达pBAY02430(SEQ ID NO：1)包含针对小麦优化的Cas9核酸酶密码子，并处于pUbiZM启动子和3′35S终止子的控制下。将具有Cas9核酸酶、gRNA、供体DNA的载体的质粒DNA与含有egfp-bar融合基因的质粒pIB26(SEQ ID NO：18)混合，以允许在草丁膦(PPT)上选择并针对GFP荧光进行筛选。

从普通小麦栽培品种Fielder的灭菌穗中分离出2-3mm大小的未成熟胚。如Sparks和Jones(Cereal Genomics：Methods in Molecular Biology，第1099卷，第17章)所述的，使用PDS-1000/He粒子递送系统进行轰击。以下DNA混合物用于轰击：

1)pBAY02430(Cas9)，pBAY02539(donor DNA-1)，pBAY02528(gRNA1)，pIB26

2)pBAY02430(Cas9)，pBAY02539(donor DNA-1)，pBAY02529(gRNA2)，pIB26

3)pBAY02430(Cas9)，pBAY02540(donor DNA-2)，pBAY02530(gRNA3)，pIB26

4)pBAY02430(Cas9)，pBAY02540(donor DNA-2)，pBAY02531(gRNA4)，pIB26

5)pBAY02430(Cas9)，pBAY02540(donor DNA-2)，pBAY02532(gRNA5)，pIB26

6)pBAY02430(Cas9)，pBAY02541(donor DNA-3)，pBAY02530(gRNA3)，pIB26

7)pBAY02430(Cas9)，pBAY02541(donor DNA-3)，pBAY02531(gRNA4)，pIB26

8)pBAY02430(Cas9)，pBAY02541(donor DNA-3)，pBAY02532(gRNA5)，pIB26

轰击的未成熟胚转移至非选择性愈伤组织诱导培养基中几天，然后移至含有PPT的选择培养基中，如Ishida等所述(Agrobacterium Protocols：第1卷，Methods inMoleclar Biology，第1223卷，第15章)。3-4周后，从单个未成熟胚的盾片愈伤组织中提取基因组DNA用于PCR分析。设计以下引物对用于编辑的ACCase基因的特异性扩增：用于供体DNA pBAY02539(SEQ ID NO：13)的引物对HT-18-111正向/HT-18-112反向，用于供体DNApBAY02540(SEQ ID NO：14)和供体DNA pBAY02541(SEQ ID NO：15)的引物对HT-18-113正向/HT-18-112反向(表1)。当供体DNA-1(pBAY02539)(SEQ ID NO：13)与gRNA1 pBAY02528(SEQ ID NO：5)组合使用时，精确基因编辑的效率最高，使用这种gRNA/供体DNA组合，13％的源自单个未成熟胚的盾片愈伤组织在编辑特异性PCR中产生预期大小的扩增产物(表2)。

为了产生具有ACCase(I1781L)突变的小麦植物，我们用DNA混合物1)pBAY02430(Cas9)(SEQ ID NO：1)、pBAY02539(供体DNA-1)(SEQ ID NO：13)、pBAY02528(gRNA1)(SEQID NO：5)、pLB26(SEQ ID NO：18)对未成熟小麦胚进行共轰击(cobombardment)，并且我们显示了可以以相对高的成功率获得通过在PPT上间接选择在一个或多个同源等位基因中具有靶向AA取代(I1781L)的小麦植物(参见实施例2)。这证明如这个实施例中所述的，预筛选不同gRNA/供体DNA组合以在来自轰击的未成熟胚的盾片组织中进行精确的HR介导的基因编辑，允许很好地预测在异源六倍体小麦中产生在一个或多个同源等位基因中具有所需AA修饰的小麦植物的可行性。

表2.筛选用于编辑ACCaseI1781L的不同gRNA/供体DNA组合：编辑PCR(ACCaseI1781L)中阳性盾片组织样本的数量

*只有具有浓度＞2ng/μL的扩增的编辑特异性PCR片段的样品认为是阳性的

实施例2：通过Cas9核酸酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。

我们证明了通过使用Cas9核酸酶和预筛选的gRNA/供体DNA组合在异源六倍体小麦中进行潜在HR介导的精确基因编辑的能力，如实施例1中所述，可以将所需突变引入一个或多个同源等位基因中的靶密码子中。sgRNA载体pBAY02528(SEQ ID NO：5)包含用于gRNA1表达的盒，所述gRNA1指导Cas9核酸酶靶位点TS1序列CTAGGTGTGGAGAACATACA-TGG(SEQ IDNO：50)处产生DSB，其定位在靶密码子上。设计供体DNA pBAY2539用于在靶密码子处引入2个碱基取代(ATA至CTC)，导致蛋白质水平的I1781L变化。供体DNA包括普通小麦栽培品种Fielder亚基因组B含有所需突变(I1781L取代)的ACCase基因的803bp DNA片段。供体DNA还含有一些其他沉默突变以防止切割供体DNA和具有所需突变的编辑的等位基因(I1781L)。供体DNA中的3bp(CTC)核心序列侧接约400bp左右同源臂，其与亚基因组B的WT ACCase序列相同。

从普通小麦栽培品种Fielder的灭菌穗中分离出2-3mm大小的未成熟胚，并如Sparks和Jones(Cereal Genomics：Methods in Molecular Biology，第1099卷，第17章)所述的使用PDS-1000/He粒子递送系统进行轰击。将载体pBAY02430(Cas9核酸酶)(SEQ IDNO：1)、pBAY02528(gRNA)(SEQID NO：5)、pBAY02539(供体DNA)(SEQ ID NO：13)的质粒DNA与质粒pIB26(SEQ ID NO：18)混合。载体pIB26(SEQ ID NO：18)含有在35S启动子控制下的egfp-bar融合基因。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中1-2周，然后转移到含有PPT的选择培养基中，选择PPT抗性愈伤组织并转移到再生培养基中用于芽形成，如Ishida等所述的(Agrobacterium Protocols：第1卷，Methods in MolecularBiology，Vol.1223，第15章)。

将从一个未成熟胚发育的所有植物合并作为池处理。从合并的叶样品中提取基因组DNA，并设计引物组(HT-18-111正向(SEQ ID NO：28)/HT-18-112反向(SEQ ID NO：29))用于编辑的ACCase基因的特异性扩增。将在这第1个编辑特异性PCR中给出了预期PCR片段的池中的小苗随后转移到单独管中，并使用引物组HT-18-111(SEQ ID NO：28)/HT-18-112(SEQ ID NO：29)通过PCR和通过深度测序进一步分析。对于9个实验，用pBAY02430(Cas9核酸酶)(SEQ ID NO：1)、pBAY02528(gRNA)(SEQ ID NO：5)、pBAY02539(供体DNA)(SEQ ID NO：13)和pLB26(SEQ ID NO：18)的质粒DNA的混合物轰击总共337、326、415、322、350、329、261、361和362个胚胎。在这9个实验中，从总共132、172、111、177、107、166、122、244和279个未成熟胚获得草丁膦(PPT)耐受性芽再生愈伤组织。在8、17、15、9、16、7、6、9和8个合并的叶样品中观察到编辑的ACCase基因的特异性扩增。对源自在第1个编辑PCR中评分为阳性的8、15、15、8、16、7、6、9和8个小苗池的总共51、62、66、33、49、25、35、42和31个单株植物进行第2个编辑特异性PCR，并且分别在源自6、11、8、7、10、7、4、8和8个小苗池的16、28、12、25、19、19、13、21和12个单独小苗中观察到编辑的ACCase基因的特异性扩增(表3)。由于每个小苗池源自单个未成熟胚，因此源自单个未成熟胚的所有小苗(小苗池)被认为是独立编辑事件，尽管我们不能排除在第2个编辑PCR中评分为阳性的源自单个未成熟胚的单个芽之间可能存在多个独立的编辑事件。来自在第2个编辑PCR中评分为阳性的每个事件的一个植物上，进行了深度测序。用Q5高保真聚合酶(M0492L)通过巢式PCR扩增预期靶位点周围的区域。对于第1个PCR，使用引物对HT-18-162(SEQID NO：34)/HT-18-112(SEQ ID NO：29)；这些引物位于供体DNA的同源臂之外，用于扩增1736bp片段。对于扩增用于NGS的386bp区域的巢式PCR，使用引物对HT-18-048(SEQ ID NO：19)/HT-18-053(SEQ ID NO：21)。

我们通过计算显示了由供体DNA指导的靶密码子处存在所需突变(AA取代)的证据的序列读段作为读段总数的比例的百分比来评估编辑频率。这些数据总结在表4中，显示了基于来自59个独立事件的64个小苗的读段总数的具有所需突变(I1781L取代)的精确编辑的读段的％和WT读段的％。如预期的，来自源自未轰击的未成熟胚的小苗TMTA0136-Ctrl0001-01$002的对照样品显示～100％WT读数并且没有精确编辑的读数。

这些深度测序分析数据显示了通过异源六倍体小麦中天然ACCase基因的一个至多4个等位基因的同源重组(HR)进行的精确基因编辑。通过克隆的PCR片段的Sanger测序进一步证实了HR介导的精确供体，其导致所需的AA取代和由供体DNA指导的其他沉默突变的引入。在通过深度测序分析的这些事件中的11个中，用引物对HT-18-162正向(SEQ ID NO：34)/HT-18-112(SEQ ID NO：29)反向在靶区域上进行PCR扩增、克隆和Sanger测序，用于亚基因组表征。每个事件对52至96个克隆进行测序。这些数据总结在表5中，并且显示具有精确编辑的等位基因的植物最常见地还含有具有NHEJ衍生的InDel的等位基因，并且有时还含有WT等位基因。将这些T0植物转移到温室进行种子生产。来自在不同亚基因组上具有精确编辑的等位基因的独立事件的植物可以杂交以产生在例如ACCase基因的所有3个同源拷贝中具有所需AA修饰的植物，并且通过后代分离去除不需要的具有NHEJ衍生的插入缺失的等位基因。

表3.基于编辑PCR分析的ACCase I1781L编辑的小苗数量

*每个叶池源自一个未成熟胚

表4.来自在第2个编辑PCR中评分为阳性的独立事件的单个小苗中乙酰辅酶A羧化酶靶基因座(ACCaseI1781L)处精确编辑的读段百分比(％)

表5.通过克隆的PCR片段的Sanger测序，来自独立事件的11株T0植物中的ACCase基因座基因型。精确编辑是指存在具有由供体DNA指导所需AA取代和其他沉默突变的精确编辑的ACCase等位基因，InDel是指存在NHEJ突变，并且WT是指存在WT天然ACCase序列。精确编辑、WT、InDel前的数字指示鉴定了3种不同版本的ACCase等位基因的频率。

实施例3：通过配对Cas9切口酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。

以下实施例描述了通过配对Cas9切口酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。通过使用Cas9切口酶和2个sgRNA，其将SpCas9切口酶引导至相对链上彼此接近并且与靶密码子ACCase I1781紧密接近的2个靶位点(TS1、T2)，和供体DNA，可以在靶密码子中有效地引入所需突变。构建Cas9切口酶表达载体pBay02734(SEQ ID NO：3)。通过在RuvC结构域内的位置10处将天冬氨酸突变为丙氨酸(D10A突变)的Cas9切口酶针对小麦进行密码子优化，并且处于pUbiZM启动子和3′35S终止子的控制下。设计两个sgRNA用于靶向3个小麦亚基因组A、B和D上的所有基因拷贝，并用于产生跨越靶密码子的32bp3′突出端。sgRNA载体pBAY02528(SEQ ID NO：5)包含用于表达gRNA1的盒，所述gRNA1可以指导Cas9切口酶在靶位点TS1序列CTAGGTGTGGAGAACATACA-TGG(SEQ ID NO：50)处产生切口。sgRNA载体pBAY02531包含用于表达靶向靶位点TS2序列CTCCTCATAGGCCCTAGAAT-AGG(SEQ ID NO：53)的gRNA2的盒。设计供体DNA pBAY02540(SEQID NO：14)用于在靶密码子(ATA至CTC)处引入2个碱基取代，导致蛋白质水平的I1781L变化。供体DNA包括普通小麦栽培品种Fielder亚基因组B的803bp DNA片段，含有所需突变(I1781L取代)的ACCase基因。供体DNA还含有一些其他沉默突变以防止切割供体DNA和具有所需突变的编辑的等位基因(I1781L)。供体DNA中的3bp(CTC)核心序列侧接约400bp左右同源臂，其与亚基因组B的WT ACCase序列相同。

从普通小麦栽培品种Fielder的灭菌穗中分离出2-3mm大小的未成熟胚，并使用PDS-1000/He粒子递送系统进行轰击，如Sparks和Jones(CerealGenomics：Methods inMolecular Biology，第1099卷，第17章)所述的。将载体pBAY02734(Cas9切口酶)(SEQ IDNO：3)、pBAY02528(gRNA1)(SEQ ID NO：5)、pBAY02531(gRNA2)(SEQ ID NO：8)、pBAY02540(供体DNA)(SEQ ID NO：14)的质粒DNA与质粒pIB26(SEQ ID NO：18)混合。载体pIB26(SEQID NO：18)含有在35S启动子控制下的egfp-bar融合基因。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中1-2周，然后转移到含有PPT的选择培养基中，选择PPT抗性愈伤组织并转移到再生培养基中用于芽形成，如Ishida等所述的(Agrobacterium Protocols：第1卷，Methods in Molecular Biology，Vol.1223，第15章)。

将从一个未成熟胚发育的所有植物合并作为池处理。从合并的叶样品提取基因组DNA，并设计引物组(HT-18-113正向/HT-18-112反向(SEQ ID NO：30；29))用于编辑的ACCase基因的特异性扩增。随后将在第1个编辑特异性PCR中给出了预期PCR片段的池中的小苗转移到单独管中，并使用引物组HT-18-113/HT-18-112(SEQ ID NO：30；29)通过PCR和通过深度测序进一步分析。对于6个实验，用pBAY02734(Cas9切口酶)(SEQ ID NO：3)、pBAY02528(gRNA1)(SEQ ID NO：5)、pBAY02531(gRNA2)(SEQ ID NO：8)、pBAY02540(供体DNA)(SEQ ID NO：14)和pIB26(SEQ ID NO：18)的质粒DNA的混合物轰击总共358、423、365、355、409和395个胚胎。在这6个实验中，从总共195、163、192、181、268和190个未成熟胚获得草丁膦(PPT)耐受性芽再生愈伤组织。在13、6、44、22、21和22个合并的叶样品中观察到编辑的ACCase基因的特异性扩增。对源自在第1个编辑PCR中评分为阳性的11、5、39、17、16和20个小苗池的总共45、20、258、64、94、93个单株植物进行第2个编辑特异性PCR。在分别源自11、5、33、14、12和17个小苗池的22、18、93、41、18和35个单独芽中观察到编辑的ACCase基因的特异性扩增(表6)。由于每个小苗池源自单个未成熟胚，因此源自单个未成熟胚(小苗池)的所有小苗被认为是独立编辑事件，尽管我们不能排除源自第2次编辑PCR中评分为阳性的单个未成熟胚的各个芽之间可能存在多个独立编辑事件。对来自在第2个编辑PCR中评分为阳性的每个事件的一株植物进行深度测序。通过巢式PCR，用Q5高保真聚合酶(M0492L)对预期靶位点周围的区域进行PCR扩增。对于第1个PCR，使用了引物对HT-18-162/HT-18-112(SEQ ID NO 34；29)；这些引物位于供体DNA的同源臂外，用于扩增1736bp片段。对于扩增用于NGS的386bp区域的巢式PCR，使用了引物对HT-18-048/HT-18-053(SEQ ID NO：19，21)

我们通过计算显示在靶密码子处存在所需I1781L突变的证据的序列读段的百分比作为读段总数的比例来评估编辑频率。这些数据总结在表7中，其显示了对于均源自独立事件的57个小苗的读段总数、具有所需突变(I1781L取代)的读段的％、具有所需突变和供体DNA中存在的所有沉默突变的读段的％，以及WT读段的％。这些深度序列分析数据显示了异源六倍体小麦中的天然ACCase基因的一个至多4个等位基因含有所需的I1781L取代。这些数据进一步表明，在具有所需AA取代的植物中，并非总是引入来自修复DNA的所有沉默突变。沉默突变位于靶位点TS2(gRNA2)周围。这些数据进一步显示，具有所需编辑(I1781L)的等位基因的约50％(28/57)的植物不含具有NHEJ衍生的InDel的读段。在另外50％中，具有NHEJ衍生的InDel的读段的数量有时非常低。相比之下，通过使用CRISPR/Cas9核酸酶而不是CRISPR/Cas切口酶，98-100％的具有一个或多个精确编辑的等位基因的事件也含有具有NHEJ衍生的InDel的等位基因(表4)。通过利用切口酶在具有精确编辑的等位基因的事件中不存在具有插入缺失的等位基因将使得更容易研究精确编辑的等位基因的性能影响的剂量效应，因为对于用于精确编辑的一个或多个小麦亚基因组(A、B、D)，纯合(HH)、杂合(Hh)和WT(hh)植物将在T1代中已经变得可用于进一步的性能评估。来自在不同亚基因组上具有精确编辑的等位基因的独立事件的植物可以杂交以产生在例如靶基因的所有3个同源拷贝中具有所需AA修饰的植物。

表6.通过使用基于编辑PCR分析的Cas9配对切口酶的ACCase I1781L编辑的小苗的数量

表7.来自在第2个编辑PCR中评分为阳性的独立事件的单个小苗中乙酰辅酶A羧化酶靶基因座(ACCase I1781L)处精确编辑的读段百分比(％)

实施例4：通过Cas9核酸酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入A2004V突变的同源依赖性精确基因编辑。

如实施例1所述，通过使用Cas9核酸酶和预筛选的gRNA/供体DNA组合在异源六倍体小麦中的潜在HR介导的精确基因编辑能力，我们通过靶向DSB的HR介导的供体并通过间接选择PPT抗性，回收了在ACCase基因的一个或多个等位基因中具有所需氨基酸取代A2004V的经编辑的小麦植物。sgRNA载体pBAY02524(SEQ ID NO：10)包含用于表达gRNA的盒，所述gRNA指导Cas9核酸酶在靶位点TS序列TTCCTCGTGCTGGGCAAGTC-TGG(SEQ ID NO：55)处产生DSB，所述靶位点TS序列位于靶GCT密码子上游附近。供体DNA pBAY02536(SEQ IDNO：16)被设计用于在靶密码子处引入2个碱基取代(GCT至GTC)，导致蛋白质水平的A2004改变。供体DNA包括普通小麦栽培品种Fielder亚基因组B，含有所需突变(A2004V取代)的ACCase基因的787bp DNA片段。供体DNA还含有一些其他沉默突变以防止供体DNA和具有所需突变(A2004V)的经编辑的等位基因的切割。供体DNA中的3-bp(GTC)核心序列侧接约390-bp左右同源臂，其与亚基因组B的WT ACCase序列相同。从小麦栽培品种Fielder的灭菌穗中分离出2-3mm大小的未成熟胚，并使用PDS-1000/He粒子递送系统进行轰击，如Sparks和Jones(Cereal Genomics：Methods in Molecular Biology，第1099卷，第17章)所述的。将载体pBAY02430(Cas9核酸酶)(SEQ ID NO：1)、pBAY02524(gRNA)(SEQ ID NO：10)、pBAY02536(供体DNA)(SEQ ID NO：16)的质粒DNA与质粒pIB26(SEQ ID NO：18)混合。载体pIB26(SEQ ID NO：18)含有在35S启动子控制下的egfp-bar融合基因。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中1-2周，然后转移到含有PPT的选择培养基中，选择PPT抗性愈伤组织并转移到再生培养基中用于芽形成，如Ishida等所述的(AgrobacteriumProtocols：Volume 1，Methods in Molecular Biology，Vol.1223，第15章)。

将从一个未成熟胚发育的所有植物合并作为池处理。从合并的叶样品提取基因组DNA，并设计引物对(HT-18-101正向(SEQ ID NO：25)/HT-18-102反向(SEQ ID NO：26))用于特异性扩增编辑的ACCase基因。随后将在第1个编辑特异性PCR中给出预期PCR片段的池中的小苗转移到单独管中，并使用引物组HT-18-101正向(SEQ ID NO：25)/HT-18-102反向(SEQ ID NO：26)通过PCR并通过深度测序进一步分析。对于4个实验，用pBAY02430(Cas9核酸酶)(SEQ ID NO：1)、pBAY02524(gRNA1)(SEQ ID NO：10)、pBAY02536(供体DNA-1)(SEQ IDNO：16)和pLB26(SEQ ID NO：18)的质粒DNA的混合物轰击总共382、424、401和375个胚。在这4个实验中，从总共107、326、341和300个未成熟胚获得草丁膦(PPT)耐受芽再生愈伤组织。在2、28、7和5个合并的叶样品中观察到编辑的ACCase基因的特异性扩增。对源自在第1个编辑PCR中评分为阳性的2、27、6和5个小苗池的总共14、259、29和40个单株植物进行第2个编辑特异性PCR，并且在来自2、23、3和6个小苗池的7、58、7和7个单株小苗中观察到编辑的ACCase基因的特异性扩增(表8)。由于每个小苗池源自单个未成熟胚，因此源自单个未成熟胚(小苗池)的所有小苗被认为是独立编辑事件，尽管我们不能排除源自第2个编辑PCR中评分为阳性的单个未成熟胚的各个芽之间可能存在多个独立编辑事件。来自在第2个编辑PCR中评分为阳性的独立事件的植物，进行了深度测序。对于第1个PCR，使用了引物对HT-18-101(SEQ ID NO：25)/HT-18-110(SEQ ID NO：27)；这些引物位于供体DNA的同源臂之外，用于扩增1313bp片段。对于扩增用于NGS的348bp区域的巢式PCR，使用引物对HT-18-051(SEQID NO：20)/HT-18-054(SEQ ID NO：22)。这些数据表明了我们已经回收了具有用所需AA取代A2004V精确编辑的一个或两个等位基因的植物(表9)。

表8.

表9.来自在第2个编辑PCR评分为阳性的独立事件的单株小苗中乙酰辅酶A羧化酶靶基因座(ACCase A2004V)处精确编辑的读段百分比(％)

实施例5：通过Cas9核酸酶在异源六倍体小麦的ALS(乙酰乳酸合酶)基因中引入ALSW548L突变的同源依赖性精确基因编辑。

如实施例3所述，通过使用Cas9核酸酶和预筛选的gRNA/供体DNA组合在异源六倍体小麦中的潜在HR介导的精确基因编辑能力，通过靶向DSB的HR介导的供体并通过间接选择PPT抗性，我们回收了在ALS基因的一个或多个等位基因中具有所需氨基酸取代W548L的编辑的小麦植物。我们鉴定了2种适当的sgRNA载体。sgRNA载体pBAY02533(SEQ ID NO：11)和pBAY02535(SEQ ID NO：12)包含用于表达gRNA的盒，所述gRNA指导Cas9核酸酶以分别在靶位点TS序列GAACAACCAGCATCTGGGAA-TGG(SEQ ID NO：56)和ATCTGGGAATGGTGGTGCAG-TGG(SEQ ID NO：57)处产生DSB。供体DNA pBAY02542(SEQ ID NO：17)被设计用于在靶密码子处引入2个碱基取代(TGG至CTC)，导致蛋白质水平的W548L改变。供体DNA包括普通小麦栽培品种Fielder亚基因组D，含有所需突变(W548L取代)的ALS基因的805bp DNA片段。供体DNA还含有一些其他沉默突变以防止供体DNA和具有所需突变(W548L)的编辑等位基因的切割。供体DNA中的3-bp(CTC)核心序列侧接约400-bp左右同源臂，其与亚基因组D的WT ALS序列相同。

从小麦栽培品种Fielder的灭菌穗中分离出2-3mm大小的未成熟胚，并使用如Sparks和Jones(Cereal Genomics：Methods in Molecular Biology，vol.1099，第17章)所述的PDS-1000/He粒子递送系统进行轰击。将载体pBAY02430(Cas9核酸酶)(SEQ ID NO：1)、pBAY02533(gRNA)(SEQ ID NO：11)、pBAY02535(gRNA)(SEQ ID NO：12)、pBAY02542(供体DNA)(SEQ ID NO：17)的质粒DNA与质粒pIB26(SEQ ID NO：18)混合。载体pIB26(SEQ ID NO∶18)含有在35S启动子控制下的egfp-bar融合基因。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中1-2周，然后转移到含有PPT的选择培养基中，选择PPT抗性愈伤组织并转移到再生培养基中用于芽形成，如Ishida等所述的(Agrobacterium Protocols：第1卷，Methods in Molecular Biology，Vol.1223，第15章)。

将从一个未成熟胚发育的所有植物合并作为池处理。从合并的叶样品提取基因组DNA，并设计引物对(HT-18-135正向(SEQ ID NO：32)/HT-18-136反向(SEQ ID NO：33))用于编辑的ALS基因的特异性扩增。随后将在这第1个编辑特异性PCR中给出预期PCR片段的池中的小苗转移到单独管中，并使用引物组HT-18-135正向(SEQ ID NO：32)/HT-18-136反向(SEQ ID NO：33)通过PCR并通过深度测序进一步分析。对于4个实验，用pBAY02430(Cas9核酸酶)(SEQ ID NO：1)、pBAY02533(gRNA)(SEQ ID NO：11)或pBAY02535(SEQ ID NO：12)和pBAY02542(供体DNA)(SEQ ID NO：17)和pIB26(SEQ ID NO：18)的质粒DNA的混合物轰击总共325、467、385和339个胚胎。在这4个试验中，分别从总的235、～258、112和164个未成熟胚中获得了草丁膦(PPT)抗性芽再生愈伤组织。在10、11、3和4个合并的叶样品中观察到编辑的ALS基因的特异性扩增。对源自在第1个编辑PCR中评分为阳性的10、11、3和3个小苗库的总共53、71、27和13个单株植物进行第2个编辑特异性PCR，并在分别源自4、7、3和2个小苗库的14、25、12和4个单株小苗中观察到编辑的ALS基因的特异性扩增(表10)。在来自在第2个编辑PCR中评分为阳性的独立事件的一些植物进行了深度测序。对于第1个PCR，使用了引物对HT-18-130(SEQ ID NO：31)/HT-18-136(SEQ ID NO：33)；这些引物位于供体DNA的同源臂外，用于扩增1278bp片段。对于扩增用于NGS的320bp区域的巢式PCR，使用引物对HT-18-065(SEQ ID NO：23)/HT-18-066(SEQ ID NO：24)。这些数据表明了我们已经收集了具有含所需AA取代W548L的精确编辑的一个或两个等位基因的植物。精确编辑％低于10％的小苗被认为是嵌合小苗(例如TMTA0158-0107-B01-01$001、TMTA0183-0055-B01-01$001)(表11)。

表10.基于编辑PCR分析的ALS W548L编辑的小苗数量

表11.来自在第2个编辑PCR中评分为阳性的独立事件的单株小苗中乙酰乳酸合酶基因(ALS W548L)处精确编辑的读段百分比(％)

实施例6：通过Cas9核酸酶和通过直接选择在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。

用质粒DNA pBAY02430(Cas9)(SEQ ID NO：1)、pBAY02528(gRNA)(SEQ ID NO：5)和供体DNA pBAY02539(SEQ ID NO：13)的混合物轰击经轰击的未成熟胚，用于在ACCase基因中引入I1781L突变。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中1-2周，然后转移到含有200和300nM喹禾灵的选择培养基中。已经收集了在使用引物对HT-18-111正向(SEQ ID NO：28)/HT-18-112反向(SEQ ID NO：29)的编辑特异性PCR中为阳性的喹禾灵耐受系。对来自在第2个编辑PCR中评分为阳性的独立事件的一些植物进行深度测序。这些NGS数据进一步证实这些植物含有一个或多个具有所需AA取代I1781L的精确编辑的等位基因。

实施例7：通过RNP介导的CRISPR/Cas9组分的递送在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑

为了产生CRISPR/Cas9 RNP复合物，将Cas9蛋白(

S.p.Cas9核酸酶V3，IDT)和sgRNA(

CRISPR-Cas9crRNA XT和

CRISPR-Cas9 tra-crRNA，IDT)根据IDT的方案(www.idtdna.com)预混合。设计sgRNA用于靶向序列CTAGGTGTGGAGAACATACA-TGG(SEQ ID NO：50)，其位于ACCase中的靶密码子上。

使用如Svitashev等2016所述的PDS-1000/He粒子递送系统，用RNP和供体DNApBay02539(SEQ ID NO：13)的混合物轰击2-3mm大小的未成熟胚。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中2周，然后转移到含有200nM喹禾灵的选择培养基中。对于2个实验，用RNP和供体DNApBAY02539(SEQ ID NO：13)的混合物轰击总共298和302个胚。从这2个实验中，从16个和9个未成熟胚获得喹禾灵耐受系，并且对于这25个系观察到使用引物对HT-18-111正向(SEQ ID NO：28)/HT-18-112反向(SEQ ID NO：29)的编辑ACCase基因的特异性扩增。

对于在编辑PCR中评分为阳性的9个独立事件，对1个植物/事件进行深度测序。用Q5高保真聚合酶(M0492L)通过巢式PCR对预期靶位点周围的区域进行PCR扩增。对于第一个PCR，使用了引物对HT-18-162(SEQ ID NO：34)/HT-18-112(SEQ ID NO：29)；这些引物位于供体DNA的同源臂外，用于扩增1736bp片段。对于扩增用于NGS的386bp区域的巢式PCR，使用引物对HT-18-048(SEQ ID NO：19)/HT-18-053(SEQ ID NO：21)。我们通过计算显示了由供体DNA指导的靶密码子处存在所需突变AA取代(ACCase I1781L)证据的序列读段的百分比作为读段总数的比例来评估编辑频率。这些数据表明了我们已经收集了具有用所需AA取代I1781L精确编辑的一至三个等位基因的植物(表12)。

表12.来自在第二个编辑PCR中评分为阳性的独立事件的单株小苗中乙酰CoA羧化酶靶基因座(ACCase I1781L)处的精确编辑读段的百分比(％)

实施例8：通过RNP介导的CRISPR/Cas9组分的递送，通过配对的Cas9切口酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。

为了产生CRISPR/Cas9切口酶RNP复合物，根据IDT(www.idtdna.com)的方案将Cas9切口酶蛋白(

S.p.Cas9D10A切口酶V3，IDT)和每种sgRNA(

CRISPR-Cas9crRNA XT和

CRISPR-Cas9 tracrRNA，IDT)预混合。crRNA1设计成靶向序列CTAGGTGTGGA-GAACATACA-TGG(TS1)(SEQ ID NO：50)，并且crRNA2设计成靶向靶序列CTCCTCATAGGCCCTAGAAT-AGG(TS2)(SEQ ID NO：53)，其位于相对链上，2个切口位点之间的距离为32nt。

使用如Svitashev等2016所述的PDS-1000/He粒子递送系统，用靶向TS1的RNP1和靶向TS2的RNP2的1∶1混合物以及供体DNA pBay02540(SEQ ID NO：14)轰击2-3mm大小的未成熟胚。将轰击的未成熟胚转移到非选择性愈伤组织诱导培养基中2周，然后转移到含有200nM喹禾灵的选择培养基中。针对编辑的ACCase基因的特异性扩增，使用引物组(HT-18-112/HT-18-113)(SEQ ID NO：29；30)通过PCR进一步分析喹禾灵抗性植物。对编辑PCR中评分为阳性的植物进行深度测序。对于深度测序，通过巢式PCR，用Q5高保真聚合酶(M0492L)对预期靶位点周围的区域进行PCR扩增。对于第一个PCR，使用了引物对HT-18-162/HT-18-112(SEQ ID NO：34；29)；这些引物位于供体DNA的同源臂外。对于巢式PCR，使用了引物对HT-18-048/HT-18-053(SEQ ID NO：19；21)。

这些数据显示，在几乎所有含有具有所需编辑(11781L)的等位基因的植物中，不存在具有NHEJ衍生的InDel的等位基因(表13)。

表13.通过作为RNP递送的配对Cas9切口酶编辑的喹禾灵抗性植物中乙酰CoA羧化酶靶基因座(ACCase I1781L)处的精确编辑读段百分比(％)

实施例9：通过在切口之间具有更大距离的配对Cas9切口酶在异源六倍体小麦的ACCase(乙酰辅酶A羧化酶)基因中引入I1781L突变的同源依赖性精确基因编辑。

对于这个实验，设计gRNA，将SpCas9切口酶引导至相对链上的靶位点，其中2个切口位点之间的距离为45nt或136nt。用Cas9切口酶载体pBas02734(SEQ ID NO：3)、供体DNApBas04096(SEQ ID NO：35)和gRNA载体对pBay02528(SEQ ID NO：5)和pBas04093(SEQ IDNO：37)共同轰击未成熟胚，以在相对链上产生彼此相距136nt的切口，或者用Cas9切口酶载体pBas02734(SEQ ID NO：3)、供体DNA pBay02544(SEQ ID NO：36)和gRNA载体对pBay02529(SEQ ID NO：6)和pBay02531(SEQ ID NO：36)共同轰击胚，各自在相对链上形成彼此距离为45nt的切口。轰击后，将未成熟的胚转移到非选择性愈伤组织诱导培养基中2周，然后转移到含有200nM喹禾灵的选择培养基中。使用引物组(HT-18-113正向/HT-18-112反向)(SEQID NO：30；29)通过PCR对喹禾灵抗性植株进一步分析经编辑的ACCase基因的特异扩增。对在编辑PCR中评分为阳性的植物进行深度测序。对于深度测序，通过巢式PCR用Q5高保真聚合酶(M0492L)PCR扩增预期靶位点周围的区域。对于第一个PCR，使用了引物对HT-18-162/HT-18-112(SEQ ID NO：34；29)；这些引物位于供体DNA的同源臂外，用于扩增1736bp片段。对于巢式PCR，使用了引物对18-048/HT-18-053(SEQ ID NO：19；21)。表14中的这些数据表明了即使在切口之间具有更大的距离，也可以鉴定具有一个精确编辑的等位基因的植物，该等位基因不携带具有NHEJ衍生的InDel的等位基因

表14.通过配对Cas9切口酶编辑的喹禾灵抗性植物中乙酰CoA羧化酶靶基因座(ACCase I1781L)处的精确编辑读段百分比(％)

实施例10：用于在水稻中的5-烯醇丙酮酰莽草酸-3-磷酸合酶基因中引入TIPS突变的同源依赖性精确基因编辑。

以下实施例描述了通过配对切口酶进行的同源依赖性精确基因编辑，用于在水稻的5-烯醇丙酮酰莽草酸-3-磷酸合酶基因中引入T173I和P177S突变，提供TIPS氨基酸取代，赋予草甘膦抗性。通过使用Cas9切口酶(D10A)(PKVA824(SEQ ID NO：43))和2个gRNA(pKVA766(SEQ ID NO：45))和pKVA769(SEQ ID NO：46))和供体DNA(pKVA791(SEQ ID NO：47))的水稻密码子优化形式，可以在靶密码子中引入所需突变。设计两个sgRNA用于产生跨越靶密码子的33bp 3′突出端。sgRNA载体pKVA766和pKVA769分别将SpCas9切口酶引导至靶位点TS1(5′-CCA-TTGACAGCAGCCGTGACTGC-3′)(SEQ ID NO：58)和TS2(5′-GAGGAAGTGCAACTCTTCTTG-GGG 3′)(SEQ ID NO：59)。供体质粒pKVA791中外显子2的序列含有TIPS氨基酸核苷酸取代C518T和C529T以及沉默突变A531G，以形成独特的PvuI限制性位点。将源自成熟种子的水稻胚愈伤组织用作粒子轰击的起始材料。使用粒子流入枪(PIG)系统(Grayel)轰击胚愈伤组织。轰击参数如下：直径金颗粒，0.6μm；靶距离17cm，轰击压力500kPa，并且对于每个质粒DNA(Cas9、gRNA、供体DNA)，每次轰击使用1.25μg DNA。轰击后将愈伤组织块转移到非选择性RSK500愈伤组织诱导培养基(SK-1m salts Duchefa(Khanna&Raina，1998，Plant Cell，Tissue and Organ Culture，52：145-153)、Khanna维生素(Khanna&Raina，同上)、L-脯氨酸1.16g/L、CuSO4·5H2O2.5mg/L、2.4-D 2mg/L、麦芽糖20g/L、山梨糖醇30g/L、MES 0.5g/L、琼脂糖6g/L，pH 5.8)中几天，然后转移到补充有150mg/L草甘膦的RSK500培养基中。从活跃生长的草甘膦耐受性胚愈伤组织系再生芽。在草甘膦耐受事件的靶区域上进行扩增的PCR产物的限制性消化(PvuI)作为第一分子筛选，以确认TIPS突变在天然epsps基因中的引入。将形成PvuI位点的沉默突变引入供体DNA中的TIPS突变附近，以便于分子筛选以鉴定TIPS编辑的事件。24个glyT事件的扩增PCR产物的PvuI消化揭示13个单等位基因TIPS编辑事件、10个双等位基因TIPS编辑事件和1个没有TIPS突变的事件。双等位基因事件的测序分析证实了在两个等位基因中存在TIPS突变。从通过配对切口酶获得的13个单等位基因编辑事件获得的克隆PCR产物的测序显示出这些事件中的10个是单等位基因TIPS编辑事件，其中一个等位基因用TIPS突变精确编辑和一个WT等位基因(TIPS/WT)。其他3个事件也具有精确编辑的TIPS等位基因，但在另一个等位基因中具有非特异性突变(InDel)(图1)。

通过共同递送Cas9核酸酶(pKVA790(SEQ ID NO：48))、单个sgRNA(pKVA766(SEQID NO：45))和修复DNA(pKVA761(SEQ ID NO：60)替代如上所述的配对Cas9切口酶获得的23个单等位基因TIPS编辑事件获得的克隆的PCR产物的测序显示出所有这23个具有用TIPS突变精确编辑的一个等位基因的事件也含有InDel等位基因(TIPS/InDel)(图1)。这些数据显示出通过使用配对切口酶而不是核酸酶，(TIPS/WT)事件的数量增加并且(TIPS/InDel)事件的数量减少。