CN117858951A

CN117858951A - 修饰质体基因组的方法

Info

Publication number: CN117858951A
Application number: CN202280056348.5A
Authority: CN
Inventors: 叶旭东
Original assignee: Monsanto Technology LLC
Current assignee: Monsanto Technology LLC
Priority date: 2021-08-17
Filing date: 2022-08-16
Publication date: 2024-04-09
Also published as: US20230159944A1; AU2022330111A1; WO2023023516A1; JP2024531291A; EP4388113A1; CA3228943A1

Abstract

本文提供了用于质体基因组编辑和开发包含编辑的质体基因组的植物、植物细胞、植物部分和种子的方法。本文进一步提供了用于转化质体基因组的组合物。具体地，质体基因组被修饰以包括用靶质体序列的修饰型式替换靶向内源质体基因组序列，其中修饰的质体基因组序列被设计成故意降低其与靶向内源质体基因组序列的同源性，并且在一些情况下，编码含有一个或多个突变的蛋白质。

Description

修饰质体基因组的方法

相关申请的交叉引用

本申请要求2021年8月17日提交的美国临时申请序列号63/233,921的权益，其通过引用整体并入本文。

技术领域

本公开涉及农业生物技术领域，并且更具体地涉及用于质体中的基因组编辑的方法和组合物。

序列表的并入

在35,989个字节(在中测量)并于2022年8月15日创建的名为“MONS498WO.xml”的文件中所包含的序列表以电子方式随同提交，并且通过引用整体并入本文。

背景技术

基因编辑已成为作物开发的重要工具，并且已经开发出使用位点特异性核酸酶编辑植物核基因组的方法。然而，编辑位于植物质体基因组上的基因的努力尚未取得重大成功。质体基因组编辑通常依赖于同源重组来引导将感兴趣的转基因插入两个预定的质体基因组序列之间。由于极其活跃的质体DNA修复系统与高质体拷贝数以及高同源序列之间发生的广泛重组，以前不可能将点突变有效地引入质体基因组序列中。因此，本领域需要开发一种允许将点突变有效引入质体基因组序列的方法。

发明内容

本公开提供了修饰质体基因组的方法，其包括：a.将重组核酸分子引入植物细胞中，其中所述重组核酸分子从5'至3'包含：i.与第一内源质体基因组序列同源的第一同源序列；ii.修饰的序列，其包含相对于靶质体序列的至少一个沉默突变；和iii.与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间；以及b.允许同源重组发生，使得修饰的序列替换植物细胞的质体基因组中的靶质体序列。在一些实施方案中，修饰的序列包含相对于靶质体序列的至少第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四、第十五、第十六、第十七、第十八、第十九或第二十沉默突变。在其他实施方案中，修饰的序列包含相对于靶质体序列的至少一个功能突变。在某些实施方案中，修饰的序列包含相对于靶质体序列的至少第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四、第十五、第十六、第十七、第十八、第十九或第二十功能突变。在具体实施方案中，修饰的序列与靶质体序列至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％相同。在其他实施方案中，修饰的序列与靶质体序列的同一性小于30％、小于35％、小于40％、小于45％、小于50％、小于55％、小于60％、小于65％、小于70％、小于75％小于80％、小于85％、小于90％或小于95％。

在一些实施方案中，第一同源序列与第一内源质体基因组序列基本相同。在其他实施方案中，第二同源序列与第二内源质体基因组序列基本相同。在另外的实施方案中，靶质体序列包含质体基因的至少一部分，或与质体基因的至少一部分互补的序列。在一些实施方案中，重组核酸分子还包含第一同源序列与第二同源序列之间的可选择标记基因。在一些实施方案中，可选择标记基因选自由以下组成的组：nptII、aph IV、aadA、aac3、aacC4、bar、pat、DMO、EPSPS、及aroA。在其他实施方案中，重组核酸分子还包含第一同源序列与第二同源序列之间的终止子序列。在再其他实施方案中，重组核酸分子还包含第一同源序列与第二同源序列之间的启动子序列。

在一些实施方案中，所述方法的植物细胞是单子叶植物细胞。在某些实施方案中，单子叶植物细胞是玉米细胞、水稻细胞、小麦细胞、大麦细胞或甘蔗细胞。在其他实施方案中，所述方法的植物细胞是双子叶植物细胞。在具体实施方案中，双子叶植物细胞是大豆细胞、苜蓿细胞、棉花细胞、番茄细胞、拟南芥细胞或油菜细胞。

在另外的实施方案中，该方法还包括以下步骤：c.选择包含修饰的序列的转化的植物细胞。在进一步的实施方案中，选择步骤包括基于分子技术选择转化的植物细胞。在再其他实施方案中，选择步骤包括基于由转化的植物细胞的质体基因组中的修饰的序列引起的表型变化来选择转化的植物细胞。在再其他实施方案中，选择步骤包括基于转化的植物细胞的质体基因组中的修饰的序列的存在来选择转化的植物细胞。在某些实施方案中，该方法还包括：c.从转化的植物细胞再生转化的植物。

本公开还提供了用于替换植物细胞中的靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：i.第一同源序列，其中第一同源序列与第一内源质体基因组序列同源；ii.修饰的序列，其中所述修饰的序列包含相对于靶质体序列的至少一个沉默突变；和iii.第二同源序列，其中第二同源序列与第二内源质体基因组序列同源；其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间。

本公开提供了修饰质体基因组的方法，其包括：a.将重组核酸分子引入植物细胞中，其中所述重组核酸分子从5'至3'包含：i.与第一内源质体基因组序列同源的第一同源序列；ii.修饰的序列，其相对于靶质体序列，每1,000个核苷酸包含至少一个沉默突变；和iii.与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间；以及b.允许同源重组发生，使得修饰的序列替换植物细胞的质体基因组中的靶质体序列。在一些实施方案中，修饰的序列相对于靶质体序列，每500个核苷酸包含至少一个沉默突变。在其他实施方案中，修饰的序列相对于靶质体序列，每250个核苷酸包含至少一个沉默突变。

本公开还提供了用于替换植物细胞中的靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：i.第一同源序列，其中第一同源序列与第一内源质体基因组序列同源；ii.修饰的序列，其中所述修饰的序列相对于靶质体序列，每1,000个核苷酸包含至少一个沉默突变；和iii.第二同源序列，其中第二同源序列与第二内源质体基因组序列同源；其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间。在某些实施方案中，修饰的序列相对于靶质体序列，每500个核苷酸包含至少一个沉默突变。在其他实施方案中，修饰的序列相对于靶质体序列，每250个核苷酸包含至少一个沉默突变。在其他实施方案中，修饰序列相对于靶质体序列，每3、6、9、12、15、18、21、24、27、30、33、36、39、42、45、48、51、54、57、60、63、66、69、72、75、78、81、84、87、90、93、96、99、102、105、108、111、114、117、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、234、237、240、243、246或249个核苷酸包含至少一个沉默突变。还提供了通过本文所述的方法产生的并且在质体基因组内包含修饰的序列的转基因植物细胞。

附图说明

图1显示了RNA密码子表，其展示了哪些氨基酸是由各种RNA三联体编码的。密码子旁边的上标数字表示每个密码子在天然大豆rbcL编码序列(SEQ ID NO:1)中出现的频率。

图2显示野生型大豆rbcL基因(顶部)和密码子修饰的大豆rbcL基因序列(底部)的序列比对。修饰的rbcL序列侧翼的同源臂表现出高同源性，而修饰的rbcL序列由于密码子修饰而表现出低同源性。

图3描述了用于经由同源重组替换天然大豆rbcL基因的重组DNA构建体的设计。质体基因组与DNA构建体之间同源重组的潜在区域由构建体与野生型(WT)质体序列之间的实线“X”表示。“aptB”代表位于天然rbcL序列上游的aptB基因的连续序列。“P”代表天然rbcL启动子序列，并且“T”代表天然rbcL终止子序列。“Trnk-matK”代表天然rbcL序列下游区域的连续序列并编码Trnk-matK。

图4描述了用于鉴定修饰的rbcL替换(mrbcL)的各种PCR引物的位置。使用的引物包括引物3615(SEQ ID NO:12)、引物3620(SEQ ID NO:13)、引物2980(SEQ ID NO:14)和引物3622(SEQ ID NO:15)。

图5显示了检测基因替换事件的PCR结果。图5A描绘了E6G-N95Q和E6G-P89G rbcL的基因替换事件的鉴定。图5B描绘了密码子优化的(CM)rbcL的基因替换事件的鉴定。

序列简述

SEQ ID NO:1是编码RuBisCO大亚基的野生型大豆rbcL基因的DNA序列。

SEQ ID NO:2是由SEQ ID NO:1编码的大豆RuBisCO大亚基的氨基酸序列。

SEQ ID NO:3是密码子修饰的rbcL基因的DNA序列。

SEQ ID NO:4是对应于大豆质体基因组中rbcL基因上游区域的5'同源序列的DNA序列。

SEQ ID NO:5是对应于大豆质体基因组中rbcL基因下游区域的3'同源序列的DNA序列。

SEQ ID NO:6是天然大豆rbcL基因启动子序列的DNA序列。

SEQ ID NO:7是天然大豆rbcL基因终止子序列的DNA序列。

SEQ ID NO:8是编码突变体E6G-P89G RuBisCO大亚基的DNA序列。

SEQ ID NO:9是由SEQ ID NO:8编码的突变体E6G-P89G RuBisCO大亚基的氨基酸序列。

SEQ ID NO:10是编码突变体E6G-N95Q RuBisCO大亚基的DNA序列。

SEQ ID NO:11是由SEQ ID NO:10编码的突变体E6G-N95Q RuBisCO大亚基的氨基酸序列。

SEQ ID NO:12至SEQ ID NO:15是用于检测转化事件的PCR引物序列。

SEQ ID NO:16是侧翼为5'和3'同源序列的野生型大豆rbcL基因的DNA序列。

SEQ ID NO:17是侧翼为5'和3'同源序列的密码子修饰的大豆rbcL基因序列的DNA序列。

具体实施方式

近年来，基因编辑已成为作物开发的重要工具。基因编辑可以对植物基因组进行精确、靶向的改变，范围从单核苷酸改变到在特定基因组位置插入整个外源基因。非同源末端连接(NHEJ)DNA修复或DNA寡核苷酸/模板介导的交换已有效用于核基因组编辑。

然而，许多涉及植物呼吸、光合作用和发育的基因是在质体基因组而不是核基因组上发现的。研究人员花了数年时间试图将特定的点突变引入位于植物质体基因组上的基因中，但没有取得重大成功。这可能是由于涉及用于引入修饰的序列的质粒载体内的天然质体序列的同源重组。叶绿体基因组具有天然的高水平重组活性，而利用同源定向修复的质体DNA修复系统被认为在纠正其基因组中发现的突变方面非常挑剔。这是由于单个植物细胞内存在大量质体拷贝以及高同源序列之间发生的广泛重组。事实上，即使利用可选择标记来维持质体基因组中的靶向点突变，重组也有可能将点突变与引入的可选择标记基因分开，从而使得成功转化体的选择变得困难。由于所有这些原因，将点突变引入位于质体基因组上的基因已被证明是困难且耗时的。

为了解决这些限制，本公开提供了编辑质体基因组的改进方法。在某些实施方案中，提供了用于在质体基因组中的所需基因中可靠地产生一种或多种靶向点突变的方法。例如，本公开提供了用经设计以降低其与内源靶质体序列的同源性的修饰的序列替换质体基因组中的内源靶质体序列的方法。修饰的序列可包含一种或多种沉默突变，使得修饰的核酸序列与靶质体序列具有低序列同一性，同时仍编码相同或相似的氨基酸序列。修饰的序列与相应内源序列的降低的同源性降低了修饰的序列被质体DNA修复系统修复的可能性，从而提高了编辑效率。

在一些实施方案中，修饰序列除了包含一个或多个同义密码子取代(沉默突变)之外，还可包含一个或多个非同义密码子取代(功能突变)，因此将编码与由内源靶序列编码的氨基酸序列相比，具有一个或多个氨基酸取代的蛋白质。在一些实施方案中，为了促进经由叶绿体转化递送修饰的序列，修饰的序列包含在重组DNA分子中。重组DNA分子可包含位于修饰的序列侧翼的至少第一同源序列和第二同源序列，以允许在靶细胞的质体或质体系DNA分子或基因组内的特定靶位点或基因座处同源重组。虽然修饰的序列可能与内源靶质体序列具有相对较低的同源性，但每个同源臂将与相应的质体基因组序列具有较高的同源性。在一些实施方案中，同源臂可以与相应的质体基因组序列完全同源或100％相同。在一些实施方案中，同源臂可以与相应质体基因组序列是基本上同源的或95％、95.5％、96％、96.5％、97％、97.5％、98％、98.5％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％、99.9％或更高相同。这种配置提高了质体转化效率并避免引入额外的突变，同时增加了内源靶序列被修饰的序列替换的可能性。在某些实施方案中，重组DNA分子还包含可选择标记基因以促进转化体的选择。标记基因还可以位于左同源序列与右同源序列之间。重组DNA分子与质体基因组之间通过两个侧翼区域的同源重组可以将标记基因引入质体基因组中，同时用修饰的序列完全替换内源靶序列。所公开的方法代表了优于现有技术的显著优点，因为它们允许有效替换任何内源质体序列。在一些实施方案中，内源靶序列是编码序列。在一些实施方案中，内源靶序列是非编码序列。在一些实施方案中，内源靶序列是增强子序列、内含子序列、外显子序列、终止子序列、启动子序列和/或增强子序列。

I.植物基因组编辑

基因组编辑技术已成为开发改良作物品种的重要工具。基因组编辑能够对基因组中的特定靶标进行精确修饰，并且通常利用细胞自身的DNA修复机制来进行所需的修饰。在植物细胞中，内源DNA修复系统通过同源重组和非同源末端连接(NHEJ)来修复DNA。同源重组涉及两个核酸分子共享的保守区域的核苷酸交换，而NHEJ只是将两个核酸连接在一起。通过NHEJ引入的靶向修饰通常是提前终止密码子和/或移码突变。

同源重组可用于通过使用供体序列来修饰基因组以包含基因的插入或替换。将供体多核苷酸引入植物基因组或修饰植物基因组DNA的方法的实例包括使用序列特异性核酸酶，诸如锌指核酸酶、工程化或天然大范围核酸酶、TALE核酸内切酶或RNA引导的核酸内切酶(例如，I型成簇规律间隔短回文重复(CRISPR)-Cas系统、II型CRISPR-Cas系统(例如Cas9系统)、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统(例如Cas12a(Cpf1)系统、Cas12b系统、Cas12c(C2c3)系统、Cas12d(CasY)系统、Cas12e(CasX)系统、Cas12g系统、Cas12h系统、Cas12i系统、C2c1系统、C2c4系统、C2c5系统、C2c8系统、C2c9系统、C2c10系统、Cas14a系统、Cas14b系统、Cas14c系统等)、VI型CRISPR-Cas系统)。一些实施方案涉及使用单链寡核苷酸在植物基因组中引入精确碱基对修饰的基因组编辑方法，如Sauer等人(Plant Physiol.2016Apr；170(4):1917–1928)所述，然而，使用基因组编辑来修饰、删除核酸序列或将核酸序列插入基因组DNA的方法是本领域众所周知的。虽然基因组编辑有潜力成为植物育种计划中的宝贵工具，但其在作物开发中的应用受到生产和鉴定包含所需基因组修饰的植物所需的时间和费用的限制。此外，质体基因组编码了大量对植物发育和光合作用过程重要的基因(因此是理想的修饰靶标)。因此，需要质体基因组修饰的方法。具体而言，没有有效的方法将特定点突变引入质体基因组中的靶向位点或用相同序列的修饰型式替换内源质体序列(诸如基因)。为了解决这个问题，本公开提供了在质体基因组中在单个步骤中有效靶向序列替换的新方法，其可用于在编码序列或由靶向序列编码的氨基酸中产生一个或多个点突变。

如本文所用，“内源”或“天然”基因是指源自给定生物体、细胞、组织、基因组或染色体内并且先前未被人类行为修饰的基因。类似地，“内源蛋白质”是指由内源基因编码的蛋白质。

如本文所用，“替换”内源质体序列包括在质体基因组中用该序列的修饰型式交换特定的内源质体序列。

如本文所用，“修饰的”在植物、种子、植物成分、植物细胞和植物基因组的上下文中是指包含相对于其自然或天然状态的变化或改变的状态。例如，基因的“天然转录物”是指从未修饰的基因产生的RNA转录物。通常，天然转录物是有义转录物。改良植物或种子的遗传物质中含有分子变化，包括遗传或表观遗传修饰。修饰的植物或种子或其亲本或祖先品系已经进行诱变、基因组编辑(例如但不限于经由使用同源重组的方法)、遗传转化(例如但不限于经由叶绿体转化或微粒轰击的方法)或它们的组合。

如本文所用，“修饰的序列”包含替换质体基因组中的靶质体序列的多核苷酸序列。在一个方面，修饰的序列包含相对于内源靶序列的一个或多个同义密码子取代。在另一个方面，基于密码子在内源序列中出现的频率来选择同义密码子。“修饰的序列”可以指与内源序列相比具有一个或多个沉默突变、功能突变、取代、缺失或插入的序列。在某些实例中，“修饰的序列”是指与内源质体基因组序列相比具有一个或多个沉默突变的序列。与内源质体基因组序列相比，“修饰序列”可以具有一个或多个功能突变。与内源质体基因组序列相比，“修饰序列”也可具有一个或多个沉默突变和一个或多个功能突变。

在一个方面，对编码蛋白质的核酸分子的修饰导致与内源蛋白质相比，修饰的序列具有至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75或至少100个突变。在另一个方面，对核酸分子的修饰包括与未修饰核酸分子相比，取代至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸。在另一个方面，对核酸分子的修饰包括与未修饰核酸分子相比，至少每3个、至少每6个、至少每9个、至少每12个、至少每15个、至少每18个、至少每21个、至少每24个、至少每27个、至少每30个、至少每33个、至少每36个、至少每39个、至少每42个、至少每45个、至少每48个、至少每51个、至少每54个、至少每57个、至少每60个、至少每63个、至少每66个、至少每69个、至少每72个、至少每75个、至少每78个、至少每81个、至少每84个、至少每87个、至少每90个、至少每93个、至少每96个、至少每99个、至少每102个、至少每105个、至少每108个、至少每111个、至少每114个、至少每117个、至少每120个、至少每123个、至少每126个、至少每129个、至少每132个、至少每135个、至少每138个、至少每141个、至少每144个、至少每147个、至少每150个、至少每153个、至少每156个、至少每159个、至少每162个、至少每165个、至少每168个、至少每171个、至少每174个、至少每177个、至少每180个、至少每183个、至少每186个、至少每189个、至少每192个、至少每195个、至少每198个、至少每201个、至少每204个、至少每207个、至少每210个、至少每213个、至少每216个、至少每219个、至少每222个、至少每225个、至少每228个、至少每231个、至少每234个、至少每237个、至少每240个、至少每243个、至少每246个或至少每249个核苷酸取代一个核苷酸。在一些实施方案中，“修饰”包括在核酸序列中用“A”取代“C”、“G”或“T”。在一些实施方案中，“修饰”包括在核酸序列中用“C”取代“A”、“G”或“T”。在一些实施方案中，“修饰”包括在核酸序列中用“G”取代“A”、“C”或“T”。在一些实施方案中，“修饰”包括在核酸序列中用“T”取代“A”、“C”或“G”。在一些实施方案中，“修饰”包括在核酸序列中用“C”取代“U”。在一些实施方案中，“修饰”包括在核酸序列中用“G”取代“A”。在一些实施方案中，“修饰”包括在核酸序列中用“A”取代“G”。在一些实施方案中，“修饰”包括在核酸序列中用“T”取代“C”。在一些实施方案中，“修饰”包括在核酸序列中删除一个或多个核苷酸。在一些实施方案中，“修饰”包括在核酸序列中插入一个或多个核苷酸。在一些实施方案中，“修饰”包括在核酸序列中复制一个或多个核苷酸。

如本文所用，“同义”修饰是指导致编码相同氨基酸的密码子的单核苷酸改变。如本文所用，“非同义”修饰是指导致编码不同氨基酸的密码子的单核苷酸改变。例如，密码子“CGU”编码精氨酸氨基酸。如果同义修饰将U更改为A，产生“CGA”密码子，该密码子仍然编码精氨酸氨基酸。如果非同义修饰将G更改为U，产生“CUU”密码子，则该密码子现在编码亮氨酸氨基酸。在一个方面，如本文所述的修饰的序列与质体基因组中的内源靶序列相比包含一个或多个同义修饰。

几个实施方案涉及通过本文公开的方法产生的植物细胞、植物组织、植物种子和植物。植物可以是单子叶植物或双子叶植物，并且可以包括例如水稻、小麦、大麦、燕麦、黑麦、高粱、玉米、葡萄、番茄、辣椒、马铃薯、生菜、西兰花、黄瓜、花生、甜瓜、韭菜、洋葱、大豆、苜蓿、向日葵、棉花、油菜和甜菜植物

如本文所用，“植物”是指整个植物。源自植物的细胞或组织培养物可以包含任何植物部分或植物器官(例如叶、茎、根等)、植物组织、种子、植物细胞和/或其后代。后代植物可以来自任何子代，例如，F₁、F₂、F₃、F₄、F₅、F₆、F₇等。植物细胞是植物的生物细胞，取自植物或通过培养取自植物的细胞而衍生。

在一个方面，本文提供的植物部分包括但不限于叶、茎、根、种子、花、花粉、花药、胚珠、花梗、果实、分生组织、子叶、下胚轴、荚果、胚、胚乳、外植体、愈伤组织、组织培养物、芽、细胞和原生质体。在另外的方面，本公开提供了不是繁殖材料并且不介导植物的自然繁殖的植物细胞、组织和器官。在另一个方面，本公开还提供了是繁殖材料并且介导植物的自然繁殖的植物细胞、组织和器官。在另一个方面，本公开提供了不能经由光合作用维持自身的植物细胞、组织和器官。在另一个方面，本公开提供了体细胞植物细胞。与生殖细胞相反，体细胞不介导植物繁殖。

所提供的细胞、组织和器官可以来自种子、果实、叶、子叶、下胚轴、分生组织、胚、胚乳、根、芽、茎、荚果、花、花序、柄(stalk)、花梗、花柱、柱头、花托、花瓣、萼片、花粉、花药、花丝、子房、胚珠、果皮、韧皮部和维管组织。在另一个方面，本公开提供了植物叶绿体。在另一个方面，本公开提供了植物有色体。在另一个方面，本公开提供了植物前质体。在另一个方面，本公开提供了植物黄质体。在另一个方面，本公开提供了植物白质体。在另一个方面，本公开提供了植物造粉体。在另一个方面，本公开提供了植物油质体。在另一个方面，本公开提供了植物蛋白质体。在另一方面，本公开提供了表皮细胞、气孔细胞、毛状体细胞、根毛或贮藏根。在另一个方面，本公开提供原生质体。

在一个方面，本文提供的植物细胞是玉米细胞。在另一个方面，本文提供的植物细胞是水稻细胞。在另一方面，本文提供的植物细胞是小麦细胞。在另一个方面，本文提供的植物细胞是大麦细胞。在再另一个方面，本文提供的植物细胞是甘蔗细胞。在一个方面，本文提供的植物细胞选自由玉米细胞、水稻细胞、小麦细胞、大麦细胞和甘蔗细胞组成的组。

在一个方面，本文提供的植物细胞是大豆细胞。在另一个方面，本文提供的植物细胞是苜蓿细胞。在又另一个方面，本文提供的植物细胞是棉花细胞。在一个方面，本文提供的植物细胞是番茄细胞。在另一个方面，本文提供的植物细胞是拟南芥细胞。在另一个方面，本文提供的植物细胞是油菜细胞。在一个方面，本文提供的植物细胞选自由大豆细胞、苜蓿细胞、棉花细胞、番茄细胞、拟南芥细胞和油菜细胞组成的组。

在一个方面，本文提供的植物细胞是被子植物细胞。在另一个方面，本文提供的植物细胞是裸子植物细胞。在另一个方面，本文提供的植物细胞是双子叶植物细胞。在又一个方面，本文提供的植物细胞是单子叶植物细胞。

在一个方面，本公开提供了修饰的玉米细胞。在另一个方面，本公开提供了修饰的水稻细胞。在另一方面，本公开提供了修饰的小麦细胞。在另一个方面，本公开提供了修饰大麦细胞。在又一个方面，本公开提供修饰甘蔗细胞。在一个方面，本公开提供了修饰的大豆细胞。在另一个方面，本公开提供了修饰的苜蓿细胞。在又另一个方面，本公开提供了修饰的棉花细胞。在一个方面，本公开提供了修饰的番茄细胞。在另一个方面，本公开提供了修饰的拟南芥细胞。在另一个方面，本公开提供了修饰的油菜细胞。在一个方面，本公开提供了修饰的被子植物细胞。在另一个方面，本公开提供了修饰的裸子植物细胞。在另一个方面，本公开提供了修饰的双子叶植物细胞。在又一个方面，本公开提供修饰的单子叶植物细胞。

在一个方面，本公开提供了修饰的玉米植物。在另一个方面，本公开提供了修饰的水稻植物。在另一方面，本公开提供了修饰的小麦植物。在另一个方面，本公开提供了修饰大麦植物。在又一个方面，本公开提供修饰的甘蔗植物。在一个方面，本公开提供了修饰的大豆植物。在另一个方面，本公开提供了修饰的苜蓿植物。在又另一个方面，本公开提供了修饰的棉花植物。在一个方面，本公开提供了修饰的番茄植物。在另一个方面，本公开提供了修饰的拟南芥植物。在另一个方面，本公开提供了修饰的油菜植物。在一个方面，本公开提供了修饰的被子植物。在另一个方面，本公开提供了修饰的裸子植物。在另一个方面，本公开提供了修饰的双子叶植物。在又一个方面，本公开提供修饰的单子叶植物。

在一个方面，本公开提供了转化的玉米细胞。在另一个方面，本公开提供了转化的水稻细胞。在另一方面，本公开提供了转化的小麦细胞。在另一个方面，本公开提供了转化的大麦细胞。在又一个方面，本公开提供转化的甘蔗细胞。在一个方面，本公开提供了转化的大豆细胞。在另一个方面，本公开提供了转化的苜蓿细胞。在又另一个方面，本公开提供了转化的棉花细胞。在一个方面，本公开提供了转化的番茄细胞。在另一个方面，本公开提供了转化的拟南芥细胞。在另一个方面，本公开提供了转化的油菜细胞。在一个方面，本公开提供了转化的被子植物细胞。在另一个方面，本公开提供了转化的裸子植物细胞。在另一个方面，本公开提供了转化的双子叶植物细胞。在又一个方面，本公开提供转化的单子叶植物细胞。

在一个方面，本公开提供了转化的玉米植物。在另一个方面，本公开提供了转化的水稻植物。在另一方面，本公开提供了转化的小麦植物。在另一个方面，本公开提供了转化的大麦植物。在又一个方面，本公开提供转化的甘蔗植物。在一个方面，本公开提供了转化的大豆植物。在另一个方面，本公开提供了转化的苜蓿植物。在又另一个方面，本公开提供了转化的棉花植物。在一个方面，本公开提供了转化的番茄植物。在另一个方面，本公开提供了转化的拟南芥植物。在另一个方面，本公开提供了转化的油菜植物。在一个方面，本公开提供了转化的被子植物。在另一个方面，本公开提供了转化的裸子植物。在另一个方面，本公开提供了转化的双子叶植物。在又一个方面，本公开提供转化的单子叶植物。

II.用于质体基因组编辑的构建体

质体基因组的基因组编辑利用质体转化方法和这些方法特有的载体。根据所提供的方法用于质体转化的载体和构建体可包含待引入植物细胞或组织中的一种或多种修饰的序列、遗传元件和/或转基因，其可包括可选择标记基因和/或农艺学目的基因。这些修饰的序列、遗传元件和/或转基因可并入重组双链质粒或载体DNA分子中，所述重组双链质粒或载体DNA分子通常可包含至少以下组分：(a)至少一种修饰的序列；和(b)修饰的序列侧翼的两个同源臂(源自并对应于待转化植物物种的内源靶序列侧翼的质体基因组序列)。载体可以进一步包含(i)至少一种在植物细胞中、更具体地在植物质体中起作用的启动子或调节元件，以引起或驱动可操作地连接至启动子的可转录核酸序列(诸如修饰的序列、可选择标记等)的表达，和(ii)编码可选择标记(即可选择标记基因)的可转录DNA序列。每个表达盒还可包含5'和3'非翻译区序列、内含子序列、额外的调节或表达元件等，用于来自植物细胞质体转化事件的基因表达。

关于DNA分子、构建体、载体等的如本文使用的术语“重组”是指DNA分子或序列，所述DNA分子或序列未发现于自然界中，和/或存在于其中自然界中未发现所述分子或序列的情况下，包括包含无人类干预将不能天然地连续地或紧密接近地一起存在的DNA序列之组合的DNA分子、构建体等，和/或包含至少两种彼此异源的DNA序列的DNA分子、构建体等。重组DNA分子、构建体等可包含与自然界中邻近此类DNA序列存在的一个或多个其他多核苷酸序列分离的DNA序列，和/或与非天然地彼此邻近的一个或多个其他多核苷酸序列相邻(或邻接)的DNA序列。重组DNA分子、构建体等还可指已经进行遗传工程改造且在细胞外构建的DNA分子或序列。例如，重组DNA分子可以包含任何合适质粒、载体等，并且可以包括线性或环状DNA分子。此类质粒、载体等可含有各种维持元件，包括原核生物复制起点和可选择标记，以及除了植物可选择标记基因以外可能存在的转基因或表达盒等。

在一个方面，提供了用于替换植物细胞的靶质体序列的方法，其包括：将重组核酸分子引入植物细胞中，其中所述重组核酸分子按从5'至3'的顺序包含：第一同源序列，其中第一同源序列与第一内源质体基因组序列同源；修饰的序列，其中所述修饰的序列包含相对于靶质体序列的至少一个沉默突变；和第二同源序列，其中第二同源序列与第二内源质体基因组序列同源；其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间；和培养植物细胞，使得修饰的序列经由同源重组替换植物细胞的质体基因组中的靶质体序列。在一个方面，提供了重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：第一同源序列，其中第一同源序列与第一内源质体基因组序列同源，修饰的序列，其中所述修饰的序列包含相对于靶质体序列的至少一个沉默突变，和第二同源序列，其中第二同源序列与第二内源质体基因组序列同源，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间。

如本文所用，“内源靶序列”或“靶质体序列”是指与质体基因组中的序列相同的核酸序列。在一个方面，本文提供的方法用修饰的序列替换靶质体序列。靶质体序列可以是野生型质体基因组序列或先前修饰的转基因质体基因组序列。在一个方面，靶质体序列包含蛋白质编码序列。在另一个方面，靶质体序列包含RNA编码序列。在另一方面，靶质体序列编码非蛋白质编码序列。在一个方面，靶质体序列包含转录序列。在另一方面，靶质体序列包含非转录序列。在一个方面，靶质体序列包含质体基因内含子序列的至少一部分或其互补序列。在一个方面，靶质体序列在内含子序列中包含至少一个功能突变，其改变质体基因的剪接或表达。在再另一方面，靶质体序列包含质体基因的启动子或调节序列的至少一部分或其互补序列。在再另一方面，靶质体序列包含启动子的至少一部分或其互补序列。在另一个方面，靶质体序列包含至少一个改变质体基因表达的功能突变。在一个方面，靶质体序列包含质体基因外显子序列的至少一部分或其互补序列。在一个方面，靶质体序列在内含子序列中包含至少一个功能突变，其改变质体基因的剪接或表达。在一个方面，靶质体序列作为单个拷贝存在于质体基因组中。

在一个方面，靶质体序列的长度为至少25个核苷酸。在另一个方面，靶质体序列的长度为至少30个核苷酸。在另一个方面，靶质体序列的长度为至少35个核苷酸。在另一个方面，靶质体序列的长度为至少40个核苷酸。在另一个方面，靶质体序列的长度为至少45个核苷酸。在另一个方面，靶质体序列的长度为至少50个核苷酸。在另一个方面，靶质体序列的长度为至少60个核苷酸。在另一个方面，靶质体序列的长度为至少70个核苷酸。在另一个方面，靶质体序列的长度为至少80个核苷酸。在另一个方面，靶质体序列的长度为至少90个核苷酸。在另一个方面，靶质体序列的长度为至少100个核苷酸。在另一个方面，靶质体序列的长度为至少125个核苷酸。在另一个方面，靶质体序列的长度为至少150个核苷酸。在另一个方面，靶质体序列的长度为至少200个核苷酸。在另一个方面，靶质体序列的长度为至少250个核苷酸。在另一个方面，靶质体序列的长度为至少300个核苷酸。在另一个方面，靶质体序列的长度为至少350个核苷酸。在另一个方面，靶质体序列的长度为至少400个核苷酸。在另一个方面，靶质体序列的长度为至少450个核苷酸。在另一个方面，靶质体序列的长度为至少500个核苷酸。在另一个方面，靶质体序列的长度为至少750个核苷酸。在另一个方面，靶质体序列的长度为至少1000个核苷酸。在另一个方面，靶质体序列的长度为至少1500个核苷酸。在另一个方面，靶质体序列的长度为至少2000个核苷酸。在另一个方面，靶质体序列的长度为至少3000个核苷酸。在另一个方面，靶质体序列的长度为至少4000个核苷酸。在另一个方面，靶质体序列的长度为至少5000个核苷酸。在一个方面，本文提供的靶质体序列的长度为至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个或至少5000个核苷酸。

在一个方面，修饰序列与内源靶质体序列之间的百分比同一性是至少30％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少40％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少50％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少60％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少70％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少75％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少80％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少85％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少90％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少95％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少96％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少97％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少98％。在一个方面，修饰序列与内源靶序列之间的百分比同一性是至少99％。

在另一个方面，修饰的序列的长度为至少10个核苷酸。在另一个方面，修饰的序列的长度为至少15个核苷酸。在另一个方面，修饰的序列的长度为至少20个核苷酸。在一个方面，修饰的序列的长度为至少25个核苷酸。在另一个方面，修饰的序列的长度为至少30个核苷酸。在另一个方面，修饰的序列的长度为至少35个核苷酸。在另一个方面，修饰的序列的长度为至少40个核苷酸。在另一个方面，修饰的序列的长度为至少45个核苷酸。在另一个方面，修饰的序列的长度为至少50个核苷酸。在另一个方面，修饰的序列的长度为至少60个核苷酸。在另一个方面，修饰的序列的长度为至少70个核苷酸。在另一个方面，修饰的序列的长度为至少80个核苷酸。在另一个方面，修饰的序列的长度为至少90个核苷酸。在另一个方面，修饰的序列的长度为至少100个核苷酸。在另一个方面，修饰的序列的长度为至少125个核苷酸。在另一个方面，修饰的序列的长度为至少150个核苷酸。在另一个方面，修饰的序列的长度为至少200个核苷酸。在另一个方面，修饰的序列的长度为至少250个核苷酸。在另一个方面，修饰的序列的长度为至少300个核苷酸。在另一个方面，修饰的序列的长度为至少350个核苷酸。在另一个方面，修饰的序列的长度为至少400个核苷酸。在另一个方面，修饰的序列的长度为至少450个核苷酸。在另一个方面，修饰的序列的长度为至少500个核苷酸。在另一个方面，修饰的序列的长度为至少750个核苷酸。在另一个方面，修饰的序列的长度为至少1000个核苷酸。在另一个方面，修饰的序列的长度为至少1500个核苷酸。在另一个方面，修饰的序列的长度为至少2000个核苷酸。在另一个方面，修饰的序列的长度为至少3000个核苷酸。在另一个方面，修饰的序列的长度为至少4000个核苷酸。在另一个方面，修饰的序列的长度为至少5000个核苷酸。在一个方面，本文提供的修饰序列的长度为至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个或至少5000个核苷酸。

如本文所用，“沉默突变”是指多核苷酸的突变，其不改变其发生的细胞或生物体的表型。沉默突变可以发生在基因组的非编码区或基因组的编码区。如果沉默突变发生在基因组的编码区，则它可以发生在内含子或外显子中。在本领域中已知，由于遗传密码的简并性，大多数氨基酸可以由多个密码子编码。如本文所用，“密码子”是指编码特定氨基酸的三个DNA或RNA核苷酸(“三联体”)。编码信使RNA(mRNA)的DNA中的沉默突变可以改变mRNA序列，但不能改变被变化的密码子编码的氨基酸。发生在外显子中并且不改变编码的氨基酸的沉默突变被认为是“同义突变”。或者，如果新的氨基酸不改变编码蛋白质的功能或者如果内源氨基酸的性质是保守的，则mRNA中的沉默突变可以改变编码的氨基酸。在一个方面，本文提供的修饰的序列包含相对于靶内源序列的一个或多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶内源序列的一个或多个沉默突变，其不改变质体基因的编码蛋白质序列。

在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的一个或多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的一个或多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的两个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的两个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的三个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的三个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的四个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的四个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的五个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的五个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的六个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的六个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的七个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的七个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的八个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的八个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的九个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的九个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的10个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的10个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的15个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的15个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的20个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的20个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的25个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的25个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的30个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的30个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的35个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的35个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的40个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的40个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的50个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的50个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的60个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的60个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的70个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的70个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的80个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的80个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的90个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的90个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的100个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的100个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的150个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的150个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的200个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的200个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的250个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的250个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的300个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的300个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的350个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的350个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的400个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的400个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的450个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的450个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的500个或更多个沉默突变。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的500个或更多个沉默突变，其不改变质体基因的表达或编码蛋白质序列。

在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个沉默突变，其不改变质体基因的表达或编码的蛋白质序列。

在一个方面，本文提供的修饰的序列平均每1000个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每900个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每800个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每700个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每600个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每500个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每400个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每300个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每250个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每200个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每175个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每150个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每125个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每100个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每99个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每96个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每93个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每90个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每87个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每84个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每81个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每80个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每78个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每75个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每72个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每70个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每69个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每66个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每63个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每60个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每57个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每54个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每51个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每50个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每48个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每45个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每42个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每40个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每39个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每39个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每33个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每30个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每27个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每24个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每21个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每20个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每18个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每15个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每12个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每10个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每9个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每6个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每5个核苷酸包含至少一个沉默突变。在一个方面，本文提供的修饰的序列平均每3个核苷酸包含至少一个沉默突变。

如本文所用，“功能突变”是指改变靶肽的氨基酸序列或表达的突变。功能突变也称为“非同义突变”。在另一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少一个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少两个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少三个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少四个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少五个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少六个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少七个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少八个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少九个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十一个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十二个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十三个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十四个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十五个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十六个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十七个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十八个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十九个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少二十个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少二十五个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少三十个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少四十个功能突变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少五十个功能突变。

在另一方面，修饰的序列包含相对于靶向内源序列的至少一个功能突变，其编码由质体基因编码的蛋白质中的至少一个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少两个功能突变，其编码由质体基因编码的蛋白质中的至少两个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少三个功能突变，其编码由质体基因编码的蛋白质中的至少三个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少四个功能突变，其编码由质体基因编码的蛋白质中的至少四个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少五个功能突变，其编码由质体基因编码的蛋白质中的至少五个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少六个功能突变，其编码由质体基因编码的蛋白质中的至少六个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少七个功能突变，其编码由质体基因编码的蛋白质中的至少七个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少八个功能突变，其编码由质体基因编码的蛋白质中的至少八个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少九个功能突变，其编码由质体基因编码的蛋白质中的至少九个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十个功能突变，其编码由质体基因编码的蛋白质中的至少十个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十一个功能突变，其编码由质体基因编码的蛋白质中的至少十一个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十二个功能突变，其编码由质体基因编码的蛋白质中的至少十二个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十三个功能突变，其编码由质体基因编码的蛋白质中的至少十三个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十四个功能突变，其编码由质体基因编码的蛋白质中的至少十四个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十五个功能突变，其编码由质体基因编码的蛋白质中的至少十五个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十六个功能突变，其编码由质体基因编码的蛋白质中的至少十六个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十七个功能突变，其编码由质体基因编码的蛋白质中的至少十七个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十八个功能突变，其编码由质体基因编码的蛋白质中的至少十八个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少十九个功能突变，其编码由质体基因编码的蛋白质中的至少十九个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少二十个功能突变，其编码由质体基因编码的蛋白质中的至少二十个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少二十五个功能突变，其编码由质体基因编码的蛋白质中的至少二十五个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少三十个功能突变，其编码由质体基因编码的蛋白质中的至少三十个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少四十个功能突变，其编码由质体基因编码的蛋白质中的至少四十个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少五十个功能突变，其编码由质体基因编码的蛋白质中的至少五十个氨基酸改变。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少一个功能突变，其影响靶向质体基因的剪接。在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少一个功能突变，其导致由靶质体基因编码的蛋白质的截短。

在一个方面，本文提供的修饰的序列包含相对于靶向内源序列的至少两个功能突变，其编码质体基因编码的蛋白质中至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少40个或至少50个氨基酸改变。

在一个方面，修饰的序列包含质体基因内含子序列的至少一部分或其互补序列。在一个方面，修饰的序列在内含子序列中包含至少一个功能突变，其改变质体基因的剪接或表达。修饰的序列还可以在内含子序列中包含至少一个突变，其降低修饰的序列与内源序列的序列同一性，但不改变内含子序列的功能。在再另一方面，修饰的序列包含质体基因的启动子或调节序列的至少一部分或其互补序列。调节序列的非限制性实例包括增强子、5'-UTR、内含子区域、3'-UTR、转录区域和其他功能序列区域。在另一方面，修饰的序列包含启动子的至少一部分或其互补序列。在另一个方面，修饰的序列包含至少一种改变质体基因表达的功能突变或至少一种不改变质体基因表达的突变。修饰的序列还可以在启动子或调节序列中包含至少一个突变，其降低修饰的序列与内源序列的序列同一性，但不改变启动子或调节序列的功能。在一个方面，修饰的序列包含质体基因外显子序列的至少一部分或其互补序列。在一个方面，修饰的序列在外显子序列中包含至少一个功能突变，其改变质体基因的剪接或表达。修饰的序列还可以在外显子序列中包含至少一个突变，其降低修饰的序列与内源序列的序列同一性，但不改变外显子序列的功能。

在一个方面，本文提供的修饰的序列包含与SEQ ID NO:1、3、8或10有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％序列同一性的序列。在另一个方面，编码蛋白质的修饰的序列与SEQ ID NO:2、9或11具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％序列同一性。

质体基因组通常包含大约30至50个RNA基因和多达200个蛋白质编码基因，其中许多是光合作用所需的。如本文所用，“质体基因”是指质体基因组中的任何蛋白质编码序列。在一个方面，靶向内源序列包含质体基因的至少一部分，或与质体基因的至少一部分互补的序列。在另一个方面，靶质体序列包含质体基因的编码序列的至少一部分，或与质体基因的编码序列的至少一部分互补的序列。在再另一个方面，本文提供的靶质体序列包含至少一种改变质体基因的表达或活性的功能突变。

如本文所用，“基因”是指可以产生功能单元(例如但不限于例如蛋白质)的多核苷酸。基因可包含启动子、增强子序列、前导序列、转录起始位点、转录终止位点、聚腺苷酸化位点、一个或多个外显子、一个或多个内含子、5'-UTR、3'-UTR或其任何组合。“基因序列”可包含编码启动子、增强子序列、前导序列、转录起始位点、转录终止位点、聚腺苷酸化位点、一个或多个外显子、一个或多个内含子、5'-UTR、3'-UTR或其任何组合的多核苷酸序列。在一个方面，基因编码RNA分子或其前体。在另一个方面，基因编码蛋白质。“编码序列”是编码蛋白质(例如，外显子序列)或RNA分子的序列。

在一个方面，本文提供的质体基因是atpE。在一个方面，本文提供的质体基因是ndhC。在一个方面，本文提供的质体基因是ndhJ。在一个方面，本文提供的质体基因是rps4。在一个方面，本文提供的质体基因是rps14。在一个方面，本文提供的质体基因是psbZ。在一个方面，本文提供的质体基因是psbD。在一个方面，本文提供的质体基因是petN。在一个方面，本文提供的质体基因是rps2。在一个方面，本文提供的质体基因是atpI。在一个方面，本文提供的质体基因是atpH。在一个方面，本文提供的质体基因是psbI。在一个方面，本文提供的质体基因是psbK。在一个方面，本文提供的质体基因是psaI。在一个方面，本文提供的质体基因是cemA。在一个方面，本文提供的质体基因是petA。在一个方面，本文提供的质体基因是psbJ。在一个方面，本文提供的质体基因是psbL。在一个方面，本文提供的质体基因是psbF。在一个方面，本文提供的质体基因是psbE。在一个方面，本文提供的质体基因是petL。在一个方面，本文提供的质体基因是petG。在一个方面，本文提供的质体基因是psaJ。在一个方面，本文提供的质体基因是rpl33。在一个方面，本文提供的质体基因是rps18。在一个方面，本文提供的质体基因是psbT。在一个方面，本文提供的质体基因是psbN。在一个方面，本文提供的质体基因是psbH。在一个方面，本文提供的质体基因是petB。在一个方面，本文提供的质体基因是petD。在一个方面，本文提供的质体基因是rpoA。在一个方面，本文提供的质体基因是rps11。在一个方面，本文提供的质体基因是rpl36。在一个方面，本文提供的质体基因是rps8。在一个方面，本文提供的质体基因是rpl14。在一个方面，本文提供的质体基因是rps3。在一个方面，本文提供的质体基因是rps19。在一个方面，本文提供的质体基因是rps15。在一个方面，本文提供的质体基因是ndhH。在一个方面，本文提供的质体基因是ndhI。在一个方面，本文提供的质体基因是ndhG。在一个方面，本文提供的质体基因是ndhE。在一个方面，本文提供的质体基因是psaC。在一个方面，本文提供的质体基因是ccsA。在一个方面，本文提供的质体基因是rpl32。在一个方面，本文提供的质体基因是ycf1。在一个方面，本文提供的质体基因是rpl23。在一个方面，本文提供的质体基因是psbA。在一个方面，本文提供的质体基因是matK。在一个方面，本文提供的质体基因是rbcL。在一个方面，本文提供的质体基因是atpB。在一个方面，本文提供的质体基因是ndhK。在一个方面，本文提供的质体基因是ycf3。在一个方面，本文提供的质体基因是psaA。在一个方面，本文提供的质体基因是psaB。在一个方面，本文提供的质体基因是psbC。在一个方面，本文提供的质体基因是psbM。在一个方面，本文提供的质体基因是rpoB。在一个方面，本文提供的质体基因是rpoC1。在一个方面，本文提供的质体基因是rpoC2。在一个方面，本文提供的质体基因是atpF。在一个方面，本文提供的质体基因是atpA。在一个方面，本文提供的质体基因是rps16。在一个方面，本文提供的质体基因是accD。在一个方面，本文提供的质体基因是rpl20。在一个方面，本文提供的质体基因是clpP。在一个方面，本文提供的质体基因是psbB。在一个方面，本文提供的质体基因是rpl16。在一个方面，本文提供的质体基因是rpl2。在一个方面，本文提供的质体基因是ndhB。在一个方面，本文提供的质体基因是rps7。在一个方面，本文提供的质体基因是ndhA。在一个方面，本文提供的质体基因是ndhD。在一个方面，本文提供的质体基因是ndhF。在另一方面，质体基因选自由以下组成的组：atpE、ndhC、ndhJ、rps4、rps14、psbZ、psbD、petN、rps2、atpI、atpH、psbI、psbK、psaI、cemA、petA、psbJ、psbL、psbF、psbE、petL、petG、psaJ、rpl33、rps18、psbT、psbN、psbH、petB、petD、rpoA、rps11、rpl36、rps8、rpl14、rps3、rps19、rpl23、rps15、ndhH、ndhI、ndhG、ndhE、psaC、ccsA、rpl32、ycf1、rpl23、psbA、matK、rbcL、atpB、ndhK、ycf3、psaA、psaB、psbC、psbM、rpoB、rpoC1、rpoC2、atpF、atpA、rps16、accD、rpl20、clpP、psbB、rpl16、rpl2、ndhB、rps7、ndhA、ndhD、ndhF和rpl2。

在一个方面，靶质体序列包含选自由以下组成的组的质体基因的序列或序列部分：atpE、ndhC、ndhJ、rps4、rps14、psbZ、psbD、petN、rps2、atpI、atpH、psbI、psbK、psaI、cemA、petA、psbJ、psbL、psbF、psbE、petL、petG、psaJ、rpl33、rps18、psbT、psbN、psbH、petB、petD、rpoA、rps11、rpl36、rps8、rpl14、rps3、rps19、rpl23、rps15、ndhH、ndhI、ndhG、ndhE、psaC、ccsA、rpl32、ycf1、rpl23、psbA、matK、rbcL、atpB、ndhK、ycf3、psaA、psaB、psbC、psbM、rpoB、rpoC1、rpoC2、atpF、atpA、rps16、accD、rpl20、clpP、psbB、rpl16、rpl2、ndhB、rps7、ndhA、ndhD、ndhF、及rpl2。

在一个方面，第一同源区段包含选自由以下组成的组的质体基因的序列或序列部分：atpE、ndhC、ndhJ、rps4、rps14、psbZ、psbD、petN、rps2、atpI、atpH、psbI、psbK、psaI、cemA、petA、psbJ、psbL、psbF、psbE、petL、petG、psaJ、rpl33、rps18、psbT、psbN、psbH、petB、petD、rpoA、rps11、rpl36、rps8、rpl14、rps3、rps19、rpl23、rps15、ndhH、ndhI、ndhG、ndhE、psaC、ccsA、rpl32、ycf1、rpl23、psbA、matK、rbcL、atpB、ndhK、ycf3、psaA、psaB、psbC、psbM、rpoB、rpoC1、rpoC2、atpF、atpA、rps16、accD、rpl20、clpP、psbB、rpl16、rpl2、ndhB、rps7、ndhA、ndhD、ndhF、及rpl2。

在一个方面，第二同源区段包含选自由以下组成的组的质体基因的序列或序列部分：atpE、ndhC、ndhJ、rps4、rps14、psbZ、psbD、petN、rps2、atpI、atpH、psbI、psbK、psaI、cemA、petA、psbJ、psbL、psbF、psbE、petL、petG、psaJ、rpl33、rps18、psbT、psbN、psbH、petB、petD、rpoA、rps11、rpl36、rps8、rpl14、rps3、rps19、rpl23、rps15、ndhH、ndhI、ndhG、ndhE、psaC、ccsA、rpl32、ycf1、rpl23、psbA、matK、rbcL、atpB、ndhK、ycf3、psaA、psaB、psbC、psbM、rpoB、rpoC1、rpoC2、atpF、atpA、rps16、accD、rpl20、clpP、psbB、rpl16、rpl2、ndhB、rps7、ndhA、ndhD、ndhF、及rpl2。

在一个方面，质体基因组区段的长度为至少25个核苷酸。在另一个方面，质体基因组区段的长度为至少30个核苷酸。在另一个方面，质体基因组区段的长度为至少35个核苷酸。在另一个方面，质体基因组区段的长度为至少40个核苷酸。在另一个方面，质体基因组区段的长度为至少45个核苷酸。在另一个方面，质体基因组区段的长度为至少50个核苷酸。在另一个方面，质体基因组区段的长度为至少60个核苷酸。在另一个方面，质体基因组区段的长度为至少70个核苷酸。在另一个方面，质体基因组区段的长度为至少80个核苷酸。在另一个方面，质体基因组区段的长度为至少90个核苷酸。在另一个方面，质体基因组区段的长度为至少100个核苷酸。在另一个方面，质体基因组区段的长度为至少125个核苷酸。在另一个方面，质体基因组区段的长度为至少150个核苷酸。在另一个方面，质体基因组区段的长度为至少200个核苷酸。在另一个方面，质体基因组区段的长度为至少250个核苷酸。在另一个方面，质体基因组区段的长度为至少300个核苷酸。在另一个方面，质体基因组区段的长度为至少350个核苷酸。在另一个方面，质体基因组区段的长度为至少400个核苷酸。在另一个方面，质体基因组区段的长度为至少450个核苷酸。在另一个方面，质体基因组区段的长度为至少500个核苷酸。在另一个方面，质体基因组区段的长度为至少750个核苷酸。在另一个方面，质体基因组区段的长度为至少1000个核苷酸。在另一个方面，质体基因组区段的长度为至少1500个核苷酸。在另一个方面，质体基因组区段的长度为至少2000个核苷酸。在另一个方面，质体基因组区段的长度为至少3000个核苷酸。在另一个方面，质体基因组区段的长度为至少4000个核苷酸。在另一个方面，质体基因组区段的长度为至少5000个核苷酸。在一个方面，本文提供的质体基因组区段的长度为至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少125个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个或至少5000个核苷酸。

如本文所用，“同源序列”或“同源臂”是指能够与天然或内源质体基因组序列进行同源重组的任何序列。重组DNA分子可包含至少两个同源序列，用于在质体内的特定靶位点或基因座处进行同源重组。同源序列位于用于整合到质体或质体系DNA分子或基因组中的序列的任一侧。重组DNA分子可包含位于修饰的序列侧翼的第一同源序列和第二同源序列。这些同源序列中的每一个通常可以具有高达约5千碱基(kb)的碱基对(bp)长度，诸如长度在约0.1kb至约5kb的范围内(即，约100至约5000个核苷酸长度)，或长度在约0.5kb至约2kb的范围内，或长度在约1kb至约1.5kb的范围内。在某些实施方案中，本文提供的同源序列可以与相应的内源质体基因组序列100％同源或完全同源。

在一个方面，第一同源序列的长度为至少5个核苷酸。在另一个方面，第一同源序列的长度为至少10个核苷酸。在另一个方面，第一同源序列的长度为至少15个核苷酸。在另一个方面，第一同源序列的长度为至少20个核苷酸。在另一个方面，第一同源序列的长度为至少25个核苷酸。在另一个方面，第一同源序列的长度为至少30个核苷酸。在另一个方面，第一同源序列的长度为至少35个核苷酸。在另一个方面，第一同源序列的长度为至少40个核苷酸。在另一个方面，同源序列的长度为至少45个核苷酸。在另一个方面，同源序列的长度为至少50个核苷酸。在另一个方面，同源序列的长度为至少60个核苷酸。在另一个方面，同源序列的长度为至少70个核苷酸。在另一个方面，同源序列的长度为至少80个核苷酸。在另一个方面，同源序列的长度为至少90个核苷酸。在另一个方面，同源序列的长度为至少100个核苷酸。在另一个方面，同源序列的长度为至少125个核苷酸。在另一个方面，同源序列的长度为至少150个核苷酸。在另一个方面，同源序列的长度为至少200个核苷酸。在另一个方面，同源序列的长度为至少250个核苷酸。在另一个方面，同源序列的长度为至少300个核苷酸。在另一个方面，同源序列的长度为至少350个核苷酸。在另一个方面，同源序列的长度为至少400个核苷酸。在另一个方面，同源序列的长度为至少450个核苷酸。在另一个方面，同源序列的长度为至少500个核苷酸。在另一个方面，同源序列的长度为至少750个核苷酸。在另一个方面，同源序列的长度为至少1000个核苷酸。在另一个方面，同源序列的长度为至少1500个核苷酸。在另一个方面，同源序列的长度为至少2000个核苷酸。在另一个方面，同源序列的长度为至少3000个核苷酸。在另一个方面，同源序列的长度为至少4000个核苷酸。在另一个方面，同源序列的长度为至少5000个核苷酸。

在另一个方面，本公开提供了重组核酸分子，其按从5'至3'的顺序包含：与第一内源质体基因组序列同源的第一同源序列、与内源靶序列具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％，至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的修饰的序列，以及与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞的质体基因组中，在第一质体基因组区段与第二质体基因组区段之间。

在另一个方面，本公开提供了重组核酸分子，其按从5'至3'的顺序包含：与第一内源质体基因组序列同源的第一同源序列、与内源靶序列具有小于30％、小于35％、小于40％、小于45％、小于50％、小于55％、小于60％、小于65％、小于70％、小于75％、小于80％、小于85％相同、小于90％或小于95％同一性的修饰的序列，以及与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞质体基因组中，在第一质体基因组片段与第二质体基因组片段之间。

如本文关于两个或更多个核苷酸或蛋白质序列所用的术语“同一性百分比”或“相同百分比”通过以下方式计算：(i)在比较窗上比较两个最优对准的序列(核苷酸或蛋白质)，(ii)确定相同核酸碱基(对于核苷酸序列)或氨基酸残基(对于蛋白质)存在于两个序列中所处的位置的数目以产生匹配位置的数目，(iii)用匹配位置的数目除以所述比较窗中位置的总数，接着(iv)用100％乘以这个商以产生同一性百分比。如果“同一性百分比”在未指定特定比较窗的情况下相对于参考序列计算，那么通过用在比对区域上匹配的位置的数目除以所述参考序列的总长度来确定同一性百分比。因此，出于本公开的目的，当两个序列(查询和目标)最优比对(在它们的比对中虑及空位)时，查询序列的“同一性百分比”等于在两个序列之间相同的位置的数目除以查询序列中在它的长度(或比较窗)上的位置的总数，接着乘以100％。当使用序列同一性百分比来参考蛋白质时，我们认识到，不相同的残基位置通常因保守氨基酸取代而不同，其中氨基酸残基被具有相似化学性质(例如，电荷或疏水性)的其他氨基酸残基取代，因此不会改变分子的功能性质。当序列在保守性取代中不同时，可以向上调整序列同一性百分比以校正取代的保守性。由于这种保守取代而不同的序列被称为具有“序列相似性”或“相似性”。

对于最优比对序列以计算它们的同一性百分比，可用于比较两个或更多个核苷酸或蛋白质序列之间的序列同一性或相似性的各种成对或多重序列比对算法和程序在本领域中是已知的，诸如ClustalW或Basic Local Alignment Search(BLAST)等。尽管其他比对和比较方法在本领域中是已知的，但两个序列之间的比对和同一性百分比(包括以上所述的同一性百分比范围)可如通过ClustalW算法来确定，参见例如Chenna R.等人,“Multiple sequence alignment with the Clustal series of programs,”NucleicAcids Research 31:3497-3500(2003)；Thompson JD等人“Clustal W:Improving thesensitivity of progressive multiple sequence alignment through sequenceweighting,position-specific gap penalties and weight matrix choice,”NucleicAcids Research 22:4673-4680(1994)；Larkin MA等人,“Clustal W and Clustal Xversion 2.0,”Bioinformatics 23:2947-48(2007)；和Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.&Lipman,D.J.(1990)"Basic local alignment search tool."J.Mol.Biol.215:403-410(1990)，所述文献的全部内容和公开内容通过引用并入本文。

如本文所用，“基本相同”序列是指与第二序列至少95％相同的序列。在一些实施方案中，基本相同的序列与第二序列至少96％、97％、98％、99％或100％相同。

在一个方面，本文提供的重组核酸分子包含可选择标记基因。可选择标记基因可以位于重组核酸分子中，例如位于第一同源序列或第二同源序列之间。植物可选择标记基因或转基因可包括赋予对对应选择剂的耐受性的任何基因，使得用植物可选择标记转基因转化的植物细胞可耐受并承受通过选择剂所施加的选择压力。结果，修饰的质体细胞在选择下有利于生长、增殖、发育等。有用的植物可选择标记基因为本领域中已知的，并且可包括编码赋予对以下的抗性或耐受性的蛋白质的植物可选择标记基因：链霉素或大观霉素(例如，aadA或spec/strep)、卡那霉素(例如，nptII)、潮霉素B(例如，aph IV)、庆大霉素(例如，aac3和aacC4)和氯霉素(例如，CAT)。编码赋予对除草剂或其他选择剂的抗性或耐受性的蛋白质的已知植物可选择标记基因的其他实例。例如，编码5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS，用于草甘膦耐受性；例如，如美国专利号5,627,061；5,633,435；6,040,497；和5,094,945中所述，全部通过引用并入本文)的可转录DNA分子；编码草甘膦氧化还原酶和草甘膦-N-乙酰基转移酶(GOX；例如，如美国专利号5,463,175中所述；GAT如美国专利公开号20030083480中所述)的可转录DNA分子；编码八氢番茄红素去饱和酶(crtI；例如，如Misawa,等人,Plant Journal,4:833-840(1993)和Misawa,等人,Plant Journal,6:481-489(1994)中所述，用于达草灭(norflurazon)耐受性，通过引用并入本文)的可转录DNA分子；以及bar基因(例如，如DeBlock,等人,EMBO Journal,6:2513-2519(1987)中所述，用于草铵膦和双丙氨磷耐受性，通过引用并入本文)。另请参见，例如，Bock,R.,“EngineeringPlastid Genomes:Methods,Tools,and Applications in Basic Research andBiotechnology,”Annu.Rev.Plant Biol.,66:3.1-3.31(2015)，和Ziemienowicz,A.,“Plant selectable markers and reporter genes,”Acta Physiologiae Plantarum 23(3):363-374(2001)，其全部内容和公开内容通过引用并入本文。

如本文所用，“终止子序列”是指在转录过程中标记基因末端的任何核酸序列。在一个方面，本文提供的重组核酸分子包含终止子序列。在另一个方面，本文提供的重组核酸分子包含终止子序列，其中终止子序列位于重组核酸分子中，在修饰的序列与第一同源序列或第二同源序列之间。在另一方面，重组核酸分子包含可选择标记基因和终止子序列两者。在再另一方面，重组核酸分子包含终止子序列，其中终止子序列位于重组核酸分子中，在修饰的序列与可选择标记基因之间。在一个方面，本文提供的终止子序列与质体基因组异源。在另一个方面，本文提供的终止子序列对于植物细胞是异源的。术语“异源”可以指两个或更多个DNA分子或序列的组合，诸如启动子和相关的可转录DNA序列、编码序列或基因，当这样的组合是人造的并且通常在自然界中不存在时。

在一个方面，本文提供的重组核酸分子包含启动子序列，其中启动子序列位于重组核酸分子中，在修饰的序列与第一同源序列或第二同源序列之间。如本文使用，“启动子”是指含有RNA聚合酶结合位点和/或转录起始位点并协助或促进相关可转录多核苷酸序列和/或基因(或转基因)的转录和表达的DNA序列。启动子可由已知或天然存在的启动子序列或其他启动子序列人工产生、变化或衍生。启动子还可包括包含两个或更多个异源序列的组合的嵌合启动子。因此，本公开的启动子可包括与本文已知或提供的一个或多个其他启动子序列在组成上类似但不相同的启动子序列的变体。可根据与可操作地连接启动子的相关编码或可转录序列或基因(包括转基因)的表达模式有关的多种标准对启动子进行分类，诸如组成型、发育型、组织特异性、诱导型等。在植物的所有或大多数组织中驱动表达的启动子称为“组成型”启动子。在发育的某些时期或阶段期间驱动表达的启动子称为“发育型”启动子。相对于生物体的其他组织而驱动生物体的某些组织中的表达增强的启动子被称为“组织优选”启动子。因此，“组织优选”启动子在植物的一个或多个特定组织中引起相对较高或优先的表达，但在植物的一个或多个其他组织中表达水平较低。在生物体的一个或多个特定组织内表达而在其他组织中几乎不表达的启动子被称为“组织特异性”启动子。“诱导型”启动子为响应于环境刺激诸如热、冷、干旱、光照或其他刺激诸如伤口或化学施加而启动转录的启动子。启动子也可关于其来源进行分类为诸如异源、同源、嵌合、合成等。

在一个方面，本文提供的重组核酸分子包含一个或多个启动子序列。在另一个方面，本文提供的重组核酸分子包含至少两个启动子序列。在另一个方面，本文提供的重组核酸分子包含至少三个启动子序列。在一个方面，本文提供的重组核酸分子包含启动子序列和终止子序列。在一个方面，本文提供的重组核酸分子包含启动子序列和可选择标记基因。在一个方面，本文提供的重组核酸分子包含启动子序列、可选择标记基因和终止子序列。在一个方面，本文提供的启动子对于质体基因组是异源的。在另一个方面，本文提供的启动子对于植物细胞是异源的。在一个方面，本文提供的启动子是组成型启动子。在另一个方面，本文提供的启动子是组织优选的启动子。在一个方面，本文提供的启动子是组织特异性启动子。在另一方面，本文提供的启动子是诱导型启动子。在另一个方面，本文提供的启动子是嵌合启动子。在又另一个方面，本文提供的启动子是质体基因的天然启动子序列。在又另一个方面，本文提供的启动子是植物细胞中的质体基因的天然启动子序列。在一个方面，本文提供的启动子选自由组成型启动子、组织特异性启动子和诱导型启动子组成的组。

重组DNA分子可进一步包含用于在成功产生和/或确认转质体植物后，特别是在不再需要转基因或表达盒之后去除一种或多种转基因或表达盒，诸如植物可选择标记转基因或其任何部分或序列的序列。在一些实施方案中，这可以通过在要去除的序列的侧翼添加已知的后来开发的重组位点(例如，LoxP位点、FRT位点等)来实现，所述重组位点可以被内源或外源提供的重组酶(例如，Cre、Flp等)识别和去除。重组酶可以反式引入和表达，诸如通过将转质体植物与具有重组酶转基因的另一种植物杂交，以实现转基因的切除。因此，一旦不需要的序列元件或转基因的用途或目的到期，就可以将其去除，从而防止其在种系中进一步表达或传播。

III.质体转化方法

实施方案提供了通过质体转化将质体基因组中的一种或多种内源靶序列替换为至少一种植物细胞中的修饰的序列的方法。质体是包含圆形双链基因组的细胞器，存在于植物、藻类和一些原生动物物种中。质体可以根据其功能分化成不同的形式。如本文所用，“前质体”是指未分化的质体。前质体可以分化为黄质体、叶绿体和白质体。黄质体可以分化为叶绿体。叶绿体可分化为有色体。白质体可以分化为淀粉体、油质体和蛋白质体。在许多情况下，反向分化也是可能的(例如，叶绿体分化成黄质体)。

无限制地，已知质体执行多种功能，包括进行光合作用(例如，叶绿体)、合成和储存色素(例如，有色体)、分解光合装置(例如，老年体)、单萜合成(例如，白质体)、淀粉储存(例如，造粉体)、脂肪储存(例如，油质体)、蛋白质的储存和修饰(例如，蛋白质体)、合成鞣质和多酚(例如，鞣质体)、重力检测、氨基酸合成、核苷酸合成、脂肪酸合成、植物激素合成、维生素合成、硫同化和氮同化。

在一个方面，本文提供的质体是前质体。在另一个方面，本文提供的质体是黄质体。在一个方面，本文提供的质体是叶绿体。在另一个方面，本文提供的质体是有色体。在另一个方面，本文提供的质体是老年质体。在一个方面，本文提供的质体是白质体。在另一方面，本文提供的质体是造粉体。在另一个方面，本文提供的质体是油质体。在一个方面，本文提供的质体是蛋白质体。在再另一方面，本文提供的质体是鞣质体。在另一个方面，本文提供的质体选自由前质体、黄质体、叶绿体、有色体、老年质体、白质体、造粉体、油质体、蛋白质体和鞣质体组成的组。

在一个方面，本文提供的质体基因组是前质体基因组。在另一个方面，本文提供的质体基因组是黄质体基因组。在一个方面，本文提供的质体基因组是叶绿体基因组。在另一个方面，本文提供的质体基因组是有色体基因组。在另一个方面，本文提供的质体基因组是老年质体基因组。在一个方面，本文提供的质体基因组是白质体基因组。在另一方面，本文提供的质体基因组是造粉体基因组。在另一个方面，本文提供的质体基因组是油质体基因组。在一个方面，本文提供的质体基因组是蛋白质体基因组。在又一方面，本文提供的质体基因组是鞣质体基因组。在另一个方面，本文提供的质体基因组选自由前质体基因组、黄质体基因组、叶绿体基因组、有色体基因组、老年质体基因组、白质体基因组、造粉体基因组、油质体基因组、蛋白质体基因组和鞣质体基因组组成的组。

质体基因组的大小范围为约140千碱基(kb)至约218kb。例如，玉米质体基因组约为140kb，而大豆质体基因组约为152kb，并且棉花质体基因组约为160kb。超过800个质体基因组已被测序，并可在国家生物技术信息中心细胞器基因组数据库中在线获取。参见Daniell等人2016,Genome Biology,17:134；以及www.ncbi.nlm.nih.gov/genome/organelle，两者均通过引用整体并入本文。植物质体基因组的组织是高度保守的，并且大多数植物质体基因组具有两个相同的20kb至30kb反向重复拷贝，将大的单拷贝区域和小的单拷贝区域分开。

在一个方面，所提供的方法允许修饰的序列转化至植物细胞质体基因组中的频率高于不包含相对于靶质体序列的至少一个沉默突变的对照构建体。在一个方面，本文提供的方法包括选择质体基因组中具有修饰的序列的转化的植物细胞。在另一个方面，本文提供的方法包括从质体基因组中具有修饰的序列的转化的植物细胞发育或再生转化的植物。在又另一个方面，本文提供的方法包括选择在转化的植物的至少一个细胞的质体基因组中具有修饰的序列的转化的植物。在另一方面，本文提供的选择方法包括经由分子技术检测植物细胞的质体基因组中修饰的序列的存在。在另一方面，本文提供的方法包括经由分子技术检测植物细胞的质体基因组中修饰的序列的存在。在一个方面，本文提供的方法包括经由分子技术检测植物的质体基因组中修饰的序列的存在。在另一个方面，本文提供的选择方法包括经由分子技术检测植物的质体基因组中修饰的序列的存在。

在一个方面，本文提供的方法包括用选择剂处理转化的植物并基于转化的植物对选择剂的抗性或耐受性进行选择。在另一个方面，本文提供的方法包括用选择剂处理转化的植物细胞并基于转化的植物细胞对选择剂的抗性或耐受性进行选择。在一个方面，本文提供的方法包括重组核酸分子，所述重组核酸分子包含提供对选择剂的抗性或耐受性的可选择标记基因，其中转化的植物在转化的植物的质体基因组中具有可选择标记基因，并且其中选择步骤包括用选择剂处理转化的植物并基于转化的植物对选择剂的抗性或耐受性进行选择。在一个方面，包括本文提供的选择步骤的方法包括基于由转化的植物的质体基因组中的修饰的序列引起的表型变化来选择转化的植物。表型变化的非限制性实例包括叶子颜色的变化(例如，白色叶子而不是绿色叶子)；淀粉生产或储存的变化；糖生产或储存的变化；光合速率的变化。

如本文所用的“分子技术”是指分子生物学、生物化学、遗传学、植物生物学或生物物理学领域中已知的任何方法，其涉及核酸、蛋白质或脂质的使用、操作或分析。无限制地，可用于检测质体基因组中修饰的序列的存在的分子技术包括表型筛选；分子标记技术，诸如通过或Illumina/Infinium技术进行的单核苷酸多态性(SNP)分析；南方印迹；聚合酶链式反应(PCR)；酶联免疫吸附测定(ELISA)；和测序(例如，Sanger、454、Pac-Bio、Ion Torrent^TM)。在一个方面，本文提供的检测方法包括表型筛选。在另一个方面，本文提供的检测方法包括SNP分析。在另一方面，本文提供的检测方法包括南方印迹。在另一方面，本文提供的检测方法包括PCR。在一个方面，本文提供的检测方法包括ELISA。在另一方面，本文提供的检测方法包括确定核酸或蛋白质的序列。无限制地，可以使用杂交来检测核酸。Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)详细讨论了核酸之间的杂交。

可使用本领域中的常规技术分离核酸。举例来说，可使用包括但不限于重组核酸技术和/或聚合酶链式反应(PCR)的任何方法来分离核酸。一般性PCR技术例如描述于PCRPrimer:A Laboratory Manual,Dieffenbach和Dveksler编,Cold Spring HarborLaboratory Press,1995中。重组核酸技术包括例如限制酶消化和连接，其可用于分离核酸。分离的核酸还可以单一核酸分子形式或以一系列寡核苷酸形式化学合成。可通过已知方法诸如DEAE离子交换、凝胶过滤和羟磷灰石色谱法从天然来源(例如生物样品)纯化多肽。还可例如通过在表达载体中表达核酸来纯化多肽。此外，可通过化学合成获得纯化的多肽。可使用任何适当方法例如柱色谱法、聚丙烯酰胺凝胶电泳或HPLC分析测量多肽的纯度。

如本文所用，关于核酸分子的术语“互补”是指核苷酸碱基的配对，使得A与T(或U)互补，并且G与C互补。两个互补的核酸分子能够彼此杂交。作为非限制性实例，双链DNA的两条链(例如，有义链和反义链)彼此互补。

如本文所用，术语“多肽”是指至少两个共价连接的氨基酸的链。多肽可以由本文提供的多核苷酸编码。多肽的一个实例是蛋白质。本文提供的蛋白质可以由本文提供的核酸分子编码。

可使用抗体检测多肽。用于使用抗体检测多肽的技术包括酶联免疫吸附测定(ELISA)、西方印迹、免疫沉淀和免疫荧光。本文提供的抗体可为多克隆抗体或单克隆抗体。可使用本领域中熟知的方法产生对本文提供的多肽具有特异性结合亲和力的抗体。可使用本领域中已知的方法使本文提供的抗体附接于固体支持物，诸如微量滴定板。

在一个方面，提供了用于检测修饰的质体基因组序列的方法，包括使用能够与如本文所述的修饰的序列杂交的寡核苷酸探针来检测修饰的质体基因组序列。在一个方面，寡核苷酸探针是PCR引物。在一个方面，PCR引物充当体外聚合酶链式反应期间DNA合成的起点。在另一个方面，寡核苷酸探针能够与修饰的序列的至少一个沉默突变杂交。在一个方面，寡核苷酸探针包含荧光团。在另一个方面，寡核苷酸探针包含锁核酸。在另一方面，寡核苷酸探针包含放射性同位素。在另一个方面，寡核苷酸探针包含表位。在又另一个方面，寡核苷酸探针包含生物素。

在一个方面，本文提供的寡核苷酸探针包含与本文提供的SEQ ID NO:12-17至少70％相同或互补、至少75％相同或互补、至少80％相同或互补、至少85％相同或互补、至少90％相同或互补、至少95％相同或互补、至少97％相同或互补、至少99％相同或互补或100％相同或互补的序列。

在另一个方面，寡核苷酸探针能够与修饰的序列的至少两个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少三个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少四个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少五个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少六个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少七个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少八个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少九个沉默突变杂交。在另一个方面，寡核苷酸探针能够与修饰的序列的至少十个沉默突变杂交。在另一方面，寡核苷酸探针能够与修饰的序列和第一质体基因组区段杂交。在另一个方面，寡核苷酸探针能够与修饰的序列和第二质体基因组区段杂交。

本文提供的方法采用同源重组以实现用来自重组DNA分子的靶向序列的修饰的型式对质体基因组DNA(即“质体系”)中的靶向内源序列进行位点特异性替换。如上所述，重组DNA分子通常可包含位于靶序列的修饰型式侧翼的两个臂区，这两个臂区中的每一个与各自的靶质体基因组序列同源，以驱动在质体基因组的靶位点处的内源序列的重组和替换。经由同源重组定点整合到植物细胞的质体基因组中，减少了通常与在整个核基因组的不同位置处具有转基因插入的核转化事件相关的事件变异性。因此，质体中的表达水平在相同质量的转质体事件之间通常应该是一致的(与核转化事件不同，核转化事件根据其插入位点表现出可变和不可预测的表达水平)。这种一致且可预测的表达降低了产生转质体事件的开发成本。

转化植物细胞的方法是本领域普通技术人员众所周知的。例如，通过用涂有重组DNA的粒子进行粒子轰击(例如基因枪转化)来转化植物细胞的具体说明可见于美国专利号5,015,580(大豆)；5,550,318(玉米)；5,538,880(玉米)；5,914,451(大豆)；6,160,208(玉米)；6,399,861(玉米)和6,153,812(小麦)；6,002,070(大米)；7,122,722(棉花)；6,051,756(芸苔属)；6,297,056(芸苔属)；美国专利公开号2004/0123342(甘蔗)。用于转化其他植物的方法可例如见于Compendium of Transgenic Crop Plants(2009)BlackwellPublishing中。具体用于使用基因枪转化和PEG介导的转化技术转化质体基因组的方法也是本领域已知的。例如，参见Vermand Daniell,2007,Plant Physiology,145:1129-1143；Daniell等人,1990,Proc.Natl.Acad.Sci.USA,87:88-92；Sanford等人,1993,MethodsEnzymol.217:483-509；O’Neill等人,1993,Plant J.,3:729-738；及Golds等人,1993,Nature Biotechnology,11:95-97，所有这些均通过引用整体并入本文。本领域技术人员已知的任何合适的方法可以用于用本文提供的任何核酸分子转化植物细胞。

在一个方面，本文提供的方法稳定地转化植物细胞。在另一个方面，本文提供的方法瞬时转化植物细胞。在一个方面，转化植物细胞的方法包括基因枪转化。在一个方面，转化植物细胞的方法包括PEG介导的转化。

提供包含本文提供的稳定整合的核酸分子的转质体植物细胞和转质体植物的转化方法优选在培养基上和受控环境中的组织培养中实施。

在一个方面，本公开提供了不是繁殖材料并且不介导植物的自然繁殖的植物细胞。在另一个方面，本公开也提供了是繁殖材料并且介导植物的自然繁殖的植物细胞。在另一个方面，本公开提供了不能经由光合作用维持自身的植物细胞。在另一个方面，本公开提供了体细胞植物细胞。与生殖细胞相反，体细胞不介导植物繁殖。

用于转化的接受细胞靶标包括但不限于种子细胞、果实细胞、叶细胞、子叶细胞、下胚轴细胞、分生组织细胞、胚细胞、胚乳细胞、根细胞、嫩芽细胞、茎细胞、荚细胞、花细胞、花序细胞、柄细胞、花梗细胞、花柱细胞、柱头细胞、花托细胞、花瓣细胞、萼片细胞、花粉细胞、花药细胞、花丝细胞、子房细胞、胚珠细胞、果皮细胞、韧皮部细胞、芽细胞或维管组织细胞。在另一个方面，本公开提供了包含质体的细胞。在另一个方面，本公开提供了包含叶绿体的细胞。在另一方面，本公开提供了表皮细胞、气孔细胞、毛状体细胞、根毛细胞、贮藏根细胞或块茎细胞。在另一个方面，本公开提供原生质体。在另一个方面，本公开提供了植物愈伤组织细胞。可育植物可从其再生的任何细胞被考虑为用于实施本公开的有用接受细胞。愈伤组织可从各种组织来源创始，包括但不限于胚或胚的部分、幼苗顶端分生组织、小孢子等。能够增殖成愈伤组织的那些细胞都可充当用于转化的接受细胞。用于制备本公开的转基因植物的实用转化方法和材料(例如，各种培养基和接受靶细胞、未成熟胚胎的转化以及可育转基因植物的随后再生)公开于例如美国专利号6,194,636和6,232,526和美国专利申请公开号2004/0216189。

转化或轰击之后，可使植物组织与一种或多种含有选择剂的选择培养基接触，以偏向具有用于转化的重组DNA分子的质体基因组中整合的可选择标记基因的表达的转质体细胞的存活、生长、增殖和/或发育。可选择标记基因通常将与用于选择的选择剂配对，使得可选择标记基因赋予对以选择剂进行选择的耐受性。通常使用的可选择标记基因包括但不限于赋予对抗生素诸如卡那霉素(kanamycin)和巴龙霉素(paromomycin)(nptII)、潮霉素B(hygromycin B)(aph IV)、链霉素(streptomycin)或大观霉素(spectinomycin)(aadA)和庆大霉素(gentamycin)(aac3和aacC4)的耐受性或抗性的那些，或赋予对除草剂诸如草铵膦(glufosinate)(bar或pat)、麦草畏(dicamba)(DMO)和草甘膦(glyphosate)(aroA或EPSPS)的耐受性或抗性的那些。也可以使用可选择标记基因，其提供了视觉筛选转化体的能力。非限制性实例包括荧光素酶或绿色荧光蛋白(GFP)或表达β葡萄糖醛酸酶的基因或uidA基因(GUS)，其各种显色底物是已知的。

除非本文另有定义，否则术语应根据相关领域的普通技术人员的常规用法来理解。描述本文使用的与分子生物学相关的许多术语的资源的实例可见于Alberts等人,Molecular Biology of The Cell,第5版,Garland Science Publishing,Inc.:New York,2007；Rieger等人,Glossary of Genetics:Classical and Molecular,第5版,Springer-Verlag:New York,1991；King等人,A Dictionary of Genetics,第6版,OxfordUniversity Press:New York,2002；和Lewin,Genes IX,Oxford University Press:NewYork,2007。使用如37CFR§1.822处所阐述的DNA碱基的命名法。

以下为本公开的非限制性示例性实施方案。

第一实施方案涉及修饰质体基因组的方法，其包括：将重组核酸分子引入植物细胞中，其中所述重组核酸分子从5'至3'包含：与第一内源质体基因组序列同源的第一同源序列，修饰的序列，其包含相对于靶质体序列的至少一个沉默突变；和与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间；以及允许同源重组发生，使得修饰的序列替换植物细胞的质体基因组中的靶质体序列。

第二实施方案涉及实施方案1的方法，其中修饰的序列包含相对于靶质体序列的至少第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四、第十五、第十六、第十七、第十八、第十九或第二十沉默突变。

第三实施方案涉及实施方案1的方法，其中修饰的序列包含相对于靶质体序列的至少一个功能突变。

第四实施方案涉及实施方案3的方法，其中修饰的序列包含相对于靶质体序列的至少第二功能突变。

第五实施方案涉及实施方案1的方法，其中修饰的序列与靶质体序列至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％相同。

第六实施方案涉及实施方案1的方法，其中第一同源序列与第一内源质体基因组序列基本相同。

第七实施方案涉及实施方案1的方法，其中第二同源序列与第二内源质体基因组序列基本相同。

第八实施方案涉及实施方案1的方法，其中靶质体序列包含质体基因的至少一部分，或与质体基因的至少一部分互补的序列。

第九实施方案涉及实施方案1的方法，其中重组核酸分子还包含第一同源序列与第二同源序列之间的可选择标记基因。

第十实施方案涉及实施方案9的方法，其中可选择标记基因选自由nptII、aph IV、aadA、aac3、aacC4、bar、pat、DMO、EPSPS和aroA组成的组。

第十一实施方案涉及实施方案1的方法，其中重组核酸分子还包含第一同源序列与第二同源序列之间的终止子序列。

第十二实施方案涉及实施方案1的方法，其中重组核酸分子还包含第一同源序列与第二同源序列之间的启动子序列。

第十三实施方案涉及实施方案1的方法，其中植物细胞是单子叶植物细胞。

第十四实施方案涉及实施方案13的方法，其中所述单子叶植物细胞是玉米细胞、水稻细胞、小麦细胞、大麦细胞或甘蔗细胞。

第十五实施方案涉及实施方案1的方法，其中所述植物细胞是双子叶植物细胞。

第十六实施方案涉及实施方案15的方法，其中所述双子叶植物细胞是大豆细胞、苜蓿细胞、棉花细胞、番茄细胞、拟南芥细胞或油菜细胞。

第十七实施方案涉及实施方案1的方法，其中所述方法还包括选择包含修饰的序列的转化的植物细胞的步骤。

第十八实施方案涉及实施方案17的方法，其中选择步骤包括基于分子技术选择转化的植物细胞。

第十九实施方案涉及实施方案17的方法，其中选择步骤包括基于由转化的植物细胞的质体基因组中的修饰的序列引起的表型变化来选择转化的植物细胞。

第二十实施方案涉及实施方案1的方法，其中所述方法还包括从转化的植物细胞再生转化的植物。

第二十一实施方案涉及用于替换植物细胞中的靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：第一同源序列，其中第一同源序列与第一内源质体基因组序列同源，修饰的序列，其中所述修饰的序列包含相对于靶质体序列的至少一个沉默突变，和第二同源序列，其中第二同源序列与第二内源质体基因组序列同源，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间。

第二十二实施方案涉及通过实施方案1的方法产生的转基因植物细胞，其包含质体基因组内的修饰的序列。

第二十三实施方案涉及修饰质体基因组的方法，其包括：将重组核酸分子引入植物细胞中，其中所述重组核酸分子从5'至3'包含：与第一内源质体基因组序列同源的第一同源序列，修饰的序列，其相对于靶质体序列，每1,000个核苷酸包含至少一个沉默突变，和与第二内源质体基因组序列同源的第二同源序列，其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间；以及允许同源重组发生，使得修饰的序列替换植物细胞的质体基因组中的靶质体序列。

第二十四实施方案涉及实施方案23的方法，其中修饰的序列相对于靶质体序列，每500个核苷酸包含至少一个沉默突变。

第二十五实施方案涉及实施方案23的方法，其中修饰的序列相对于靶质体序列，每250个核苷酸包含至少一个沉默突变。

第二十六实施方案涉及用于替换植物细胞中的靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：第一同源序列，其中第一同源序列与第一内源质体基因组序列同源；修饰的序列，其中所述修饰的序列相对于靶质体序列，每1,000个核苷酸包含至少一个沉默突变；和第二同源序列，其中第二同源序列与第二内源质体基因组序列同源；其中靶质体序列位于植物细胞的质体基因组中，在第一内源质体基因组序列与第二内源质体基因组序列之间。

第二十七实施方案涉及实施方案26的方法，其中修饰的序列相对于靶质体序列，每500个核苷酸包含至少一个沉默突变。

第二十八实施方案涉及实施方案26的方法，其中修饰的序列相对于靶质体序列，每250个核苷酸包含至少一个沉默突变。

第二十九实施方案涉及实施方案26的方法，其中修饰的序列相对于靶质体序列，每3、6、9、12、15、18、21、24、27、30、33、36、39、42、45、48、51、54、60、63、66、69、72、75、78、81、84、87、90、93、96、99、102、105、108、111、114、117、120、123、126、129、132、135、138、141、144、147、150、153、156、159、162、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、234、237、240、243、246、249、252、255、258、261、264、267、270、273、276、279、282、285、288、291、294、297或300个核苷酸包含至少一个沉默突变。

第三十实施方案涉及通过实施方案23的方法产生的转基因植物细胞，其包含质体基因组内的修饰的序列。

实施例

实施例1.创建重组DNA构建体，用大豆质体中密码子修饰的rbcL基因完全替换野生型rbcL基因

已知叶绿体基因组包含许多参与植物呼吸和光合作用调节的基因。这些基因对于作物品种的改良特别有意义。此类基因之一是核酮糖二磷酸羧化酶大链(rbcL)基因，它编码核酮糖1,5-二磷酸羧化酶/加氧酶(Rubisco)的大亚基。Rubisco是植物光合作用中的关键酶，但据信在C₃植物(包括许多农作物物种)中效率相对较低。另外，C₄植物中的Rubisco似乎具有与其C₃对应物不同的动力学性质，这导致C₄植物具有更有效的光合作用过程。有鉴于此，在C₃和C₄植物中的Rubisco及其结构和功能的研究引起了农业生物技术领域的兴趣。工程改造作物来表达具有改善动力学性质的Rubisco尚未成功。用来自具有更高效Rubisco的物种的rbcL基因替换野生型rbcL基因往往会导致参与光合作用途径的其他蛋白质的兼容性问题。经由基因组编辑向天然Rubisco大亚基引入特定修饰通常会产生极少量具有所需修饰的转化体。此外，由于野生型基因与修饰的基因之间的高序列同源性，修饰可能被细胞自身的DNA修复机制去除。

为了确定是否可以有效地替换野生型大豆rbcL基因(SEQ ID NO:1)，设计了修饰的大豆rbcL基因序列以减少修饰的rbcL序列与内源rbcL序列之间重组的可能性。因为叶绿体中的重组发生在高序列同源性的区域，所以修饰的rbcL序列被设计为在核酸水平上与野生型rbcL序列具有相对较低的序列同源性，同时仍然编码相同的蛋白质。这是通过利用编码氨基酸的密码子的简并性来实现的。评估野生型大豆rbcL基因编码序列以确定编码每个氨基酸的密码子以及每个密码子在序列全长上的频率(图1)。修饰的rbcL序列是根据密码子使用频率生成的。对于野生型序列中的每个密码子，如果现有密码子不是其各自密码子家族中最常出现的密码子，则在修饰的序列中将其替换为具有最频繁使用的同义密码子。所得密码子修饰的大豆rbcL序列(SEQ ID NO:3)与野生型大豆rbcL序列仅具有约67％的序列同源性，但两者编码的氨基酸序列具有100％的序列同源性(图2)。

包含密码子修饰的rbcL序列的重组DNA构建体被设计用于质体转化。将密码子修饰的rbcL序列(SEQ ID NO:3)插入天然大豆rbcL启动子(SEQ ID NO:6)与天然大豆rbcL终止子(SEQ ID NO:7)序列之间。在大豆质体基因组中，rbcL基因位于一侧的matK和tRNA-Lys基因与另一侧的atpB基因之间。因此，构建体含有位于完整rbcL序列侧翼的5'同源序列(SEQ ID NO:4)和3'同源序列(SEQ ID NO:5)，以便引导与大豆质体基因组重组，从而将野生型rbcL序列(SEQ ID NO:1)替换成密码子修饰的rbcL序列(SEQ ID NO:3)。链霉素/大观霉素腺苷酸转移酶(aadA)基因是质体特异性可选择标记基因，存在于两个侧翼同源区之间，用于选择转化体。aadA表达盒的两侧是一对loxP位点。所得重组DNA构建体的图显示于图3中。

实施例2.编码修饰的RuBisCO蛋白的重组DNA构建体的创建

如上文实施例1中所述，密码子修饰的rbcL序列与其野生型对应物相比包含多个同义密码子改变，但两个序列编码相同的氨基酸序列。使用密码子修饰的rbcL序列作为模板，生成在编码的氨基酸序列中含有特定突变的修饰的rbcL序列。

修饰密码子修饰的rbcL序列，使得编码的氨基酸序列与野生型/密码子修饰的rbcL氨基酸序列(SEQ ID NO:2)相比包含至少两个氨基酸取代。突变体E6G-P89G编码序列(SEQ ID NO:8)编码变体氨基酸序列(SEQ ID NO:9)，其在对应于SEQ ID NO:2的残基6的位置处包含第一氨基酸取代，其中该位置处的谷氨酸被甘氨酸取代，并且第二氨基酸取代在对应于SEQ ID NO:2的残基89的位置处，其中该位置处的脯氨酸被甘氨酸取代。突变体E6G-N95Q编码序列(SEQ ID NO:10)编码变体氨基酸序列(SEQ ID NO:11)，其在对应于SEQ IDNO:2的残基6的位置处包含第一氨基酸取代，其中该位置处的谷氨酸被甘氨酸取代，并且第二氨基酸取代在对应于SEQ ID NO:2的残基95的位置处，其中该位置处的天冬酰胺被谷氨酰胺取代。将E6G-P89G和E6G-N95Q突变体编码序列各自与天然大豆rbcL启动子和终止子序列、5'同源序列、3'同源序列和aadA基因一起克隆到转化质粒中，以产生与实施例1中描述的相似的重组DNA构建体。aadA表达盒侧翼是一对LoxP位点，当转质体植物与表达Cre重组酶的植物杂交时，这使得可选择标记基因能够在此类植物中被去除。可以采用多种方法来切除aadA标记基因，如美国专利申请号2005/0166288中所述，该专利申请通过引用整体并入本文。

实施例3.质体转化

将实施例1和2中描述的每种重组DNA构建体转化到大豆质体中。用于大豆分生组织外植体的质体转化的方法是本领域已知的，并且在此基本上如美国专利申请公开号2016/0264983中所述进行，该专利申请公开通过引用整体并入本文。

将重组DNA构建体包被在金颗粒上，并轰击到1天龄或2天龄的预培养大豆外植体上。将轰击的外植体转移至静息培养基上过夜后，将外植体转移至包含150mg/L大观霉素的选择培养基上，在16小时光照和8小时黑暗的光周期下持续两至三个月。质体基因组与DNA构建体之间通过5'和3'侧翼同源区的同源重组应当用修饰的rbcL基因替换野生型rbcL基因，并且还将aadA基因引入质体基因组中，从而允许选择转化体。一旦绿芽出现，它们就被传代培养生根或转移到温室中以建立再生大豆植物。

实施例4.包含rbcL基因替换的植物的鉴定

从实施例3获得的再生大豆植物收集叶尖样品。从每个样品中提取DNA并用作PCR的模板。图4显示了所用PCR引物的位置，其中引物3615(SEQ ID NO:12)和引物3620(SEQ IDNO:13)扩增含有5'同源臂的区域，并且引物2980(SEQ ID NO:14)和引物3622(SEQ ID NO:15)扩增含有3'同源臂的区域。筛选再生植物以确认野生型rbcL基因被密码子修饰的rbcL基因、E6G-P89G突变体rbcL基因或E6G-N95Q突变体rbcL基因替换。结果在以下表1中示出。

表1.再生大豆植物中rbcL基因替换事件总结

每个替换事件的代表性PCR结果显示在图5A和5B中。PCR产物的测序证实了再生大豆植物中存在E6G-N95Q和E6G-P89G突变体rbcL替换事件。

Claims

1.一种修饰质体基因组的方法，其包括：

a.将重组核酸分子引入植物细胞中，其中所述重组核酸分子从5'至3'包含：

i.与第一内源质体基因组序列同源的第一同源序列；

ii.修饰的序列，其包含相对于靶质体序列的至少一个沉默突变；和

iii.与第二内源质体基因组序列同源的第二同源序列，

其中所述靶质体序列位于所述植物细胞的质体基因组中，在所述第一内源质体基因组序列与所述第二内源质体基因组序列之间；以及

b.允许同源重组发生，使得所述修饰的序列替换所述植物细胞的质体基因组中的靶质体序列。

2.如权利要求1所述的方法，其中所述修饰的序列包含相对于所述靶质体序列的至少第二沉默突变。

3.如权利要求1所述的方法，其中所述修饰的序列包含相对于所述靶质体序列的至少一个功能突变。

4.如权利要求3所述的方法，其中所述修饰的序列包含相对于所述靶质体序列的至少第二功能突变。

5.如权利要求1所述的方法，其中所述修饰的序列与所述靶质体序列至少30％相同。

6.如权利要求1所述的方法，其中所述第一同源序列与所述第一内源质体基因组序列相同。

7.如权利要求1所述的方法，其中所述第二同源序列与所述第二内源质体基因组序列相同。

8.如权利要求1所述的方法，其中所述靶质体序列包含质体基因的至少一部分，或与质体基因的至少一部分互补的序列。

9.如权利要求1所述的方法，其中所述重组核酸分子还包含所述第一同源序列与所述第二同源序列之间的可选择标记基因。

10.如权利要求9所述的方法，其中所述可选择标记基因选自由以下组成的组：nptII、aph IV、aadA、aac3、aacC4、bar、pat、DMO、EPSPS和aroA。

11.如权利要求1所述的方法，其中所述重组核酸分子还包含所述第一同源序列与所述第二同源序列之间的终止子序列。

12.如权利要求1所述的方法，其中所述重组核酸分子还包含所述第一同源序列与所述第二同源序列之间的启动子序列。

13.如权利要求1所述的植物细胞，其中所述植物细胞是单子叶植物细胞。

14.如权利要求13所述的方法，其中所述单子叶植物细胞是玉米细胞、水稻细胞、小麦细胞、大麦细胞或甘蔗细胞。

15.如权利要求1所述的植物细胞，其中所述植物细胞是双子叶植物细胞。

16.如权利要求15所述的方法，其中所述双子叶植物细胞是大豆细胞、苜蓿细胞、棉花细胞、番茄细胞、拟南芥细胞或油菜细胞。

17.如权利要求1所述的方法，其中所述方法还包括以下步骤：

c.选择包含所述修饰的序列的转化的植物细胞。

18.如权利要求17所述的方法，其中所述选择步骤包括基于分子技术选择所述转化的植物细胞。

19.如权利要求17所述的方法，其中所述选择步骤包括基于由所述转化的植物细胞的质体基因组中的所述修饰的序列引起的表型变化来选择所述转化的植物细胞。

20.如权利要求1所述的方法，其中所述方法还包括：

c.从所述转化的植物细胞再生转化的植物。

21.一种用于替换植物细胞中靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：

i.第一同源序列，其中所述第一同源序列与第一内源质体基因组序列同源；

ii.修饰的序列，其中所述修饰的序列包含相对于所述靶质体序列的至少一个沉默突变；和

iii.第二同源序列，其中所述第二同源序列与第二内源质体基因组序列同源；

其中所述靶质体序列位于所述植物细胞的质体基因组中，在所述第一内源质体基因组序列与所述第二内源质体基因组序列之间。

22.一种通过如权利要求1所述的方法产生的转基因植物细胞，其包含质体基因组内的修饰的序列。

23.一种修饰质体基因组的方法，其包括：

i.与第一内源质体基因组序列同源的第一同源序列；

ii.修饰的序列，其相对于靶质体序列，每1,000个核苷酸包含至少一个沉默突变；和

iii.与第二内源质体基因组序列同源的第二同源序列，

24.如权利要求23所述的方法，其中所述修饰的序列相对于所述靶质体序列，每500个核苷酸包含至少一个沉默突变。

25.如权利要求23所述的方法，其中所述修饰的序列相对于所述靶质体序列，每250个核苷酸包含至少一个沉默突变。

26.一种用于替换植物细胞中靶质体序列的载体，其中所述质粒载体包含重组核酸分子，所述重组核酸分子按从5'至3'的顺序包含：

ii.修饰的序列，其中所述修饰的序列相对于所述靶质体序列，每1,000个核苷酸包含至少一个沉默突变；和

27.如权利要求26所述的载体，其中所述修饰的序列相对于所述靶质体序列，每500个核苷酸包含至少一个沉默突变。

28.如权利要求26所述的载体，其中所述修饰的序列相对于所述靶质体序列，每250个核苷酸包含至少一个沉默突变。

29.一种通过如权利要求23所述的方法产生的转基因植物细胞，其包含质体基因组内的修饰的序列。