CN102131932A

CN102131932A - 人工植物微染色体

Info

Publication number: CN102131932A
Application number: CN2008801308277A
Authority: CN
Inventors: E·阿纳尼耶夫; M·A·钱伯林; W·J·戈顿-凯姆; S·斯维塔舍; 吴成仓
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2008-06-20
Filing date: 2008-07-29
Publication date: 2011-07-20
Also published as: CA2736061A1; EP2310516A1; MX2010014365A; WO2009154639A1; US20090100550A1; BRPI0822806A2

Abstract

描述了包含能特异性结合着丝粒蛋白C(CENPC)的功能性着丝粒的人工植物微染色体以及所述微染色体的制备方法。

Description

人工植物微染色体

发明领域

本发明涉及植物生物工程领域；具体地讲，涉及人工微染色体以及在植物中制备这类微染色体的方法。

背景

目前在染色体工程上的进展使得改变植物基因组成为可能，因此可改变其表型。当转基因整合到植物基因组时，通常是以随机方式，而且拷贝数无法预知。因此，研究工作直接针对更好地控制转基因整合。

如果有这样的需要，研究人员想知道答案是否在于使用人工微染色体。它们是由顺式作用(cis-acting)DNA序列元件构建的人工制备的线状或环状DNA分子，所述序列元件可提供所构建微染色体的复制和分配。

据信，人工染色体的产生将会减少或消除与随机基因组整合到天然植物染色体相关的问题，例如因转基因与宿主植物基因组材料结合而造成的连锁拖曳(linkage drag)。人工染色体也可提供比标准转化载体多10-100倍的基因的递送方法，并提供大染色体区段，用于互补和/或基于图谱的克隆。

对于人工染色体复制、稳定性和维持/遗传，已经鉴定出3种组分：(i)作为复制起点的自主复制序列；(ii)起到稳定和维持线状染色体末端作用的端粒；和(iii)作为动粒装配位点的着丝粒，用于有丝分裂和减数分裂中染色体的适当分离。来自单细胞生物(例如酵母)的分离着丝粒在高等真核生物中不起作用。

美国专利5,270,201(1993年12月14日授予Richards等人)描述了基于端粒和任选着丝粒的植物人工染色体。

美国专利7,119,250(2006年10月10日授予Luo等人)描述了植物着丝粒的组成。

美国专利7,132,240(2006年11月7日授予Richards等人)描述了从任何生物的着丝粒中有效分离甲基化着丝粒DNA的可行方法。

美国专利7,193,128(2007年3月20日授予Copenhaver等人)描述了用植物着丝粒的核酸序列来产生或增加作物收益的方法。

2007年3月15日公布的公布号为WO 2007/030510的PCT申请描述了用自主微染色体转化植物的制备方法。

概述

本发明涉及包含功能性着丝粒的人工植物微染色体，其包含：(a)至少2个反向CentC串联重复序列阵列，其中第1阵列包含至少50个拷贝的CentC，第2阵列包含至少50个拷贝的CentC；和(b)至少一个拷贝的反转录转座元件，其中反转录转座元件位于第1阵列和第2阵列之间。

在第2个实施方案中，本发明的人工植物微染色体包含选自CentA、CRM1和CRM2的反转录转座元件。

在第3个实施方案中，本发明的人工植物微染色体还包含至少一个功能性端粒。

在第4个实施方案中，人工植物微染色体所包含的功能性着丝粒与着丝粒蛋白C(CENPC)特异性结合。

在第5个实施方案中，玉米植物(corn plant)可包含任何本发明的人工微染色体。

在第6个实施方案中，本发明涉及包含功能性着丝粒的人工植物微染色体，其中着丝粒与着丝粒蛋白C(CENPC)特异性结合。

在第7个实施方案中，本发明涉及分离的多核苷酸，其包含：(a)至少2个反向CentC串联重复序列阵列，其中第1阵列包含至少10个拷贝的CentC，第2阵列包含至少10个拷贝的CentC；和(b)至少一个拷贝的反转录转座元件，其中反转录转座元件位于第1阵列和第2阵列之间。

在第8个实施方案中，本发明的分离多核苷酸包含选自CentA、CRM1和CRM2的反转录转座元件。

在第9个实施方案中，本发明涉及分离的多核苷酸，其包含：(a)至少一个CentC串联重复序列阵列，该阵列包含至少10个拷贝的CentC；和(b)至少一个拷贝的选自CentA、CRM1和CRM2的反转录转座元件。

在第10个实施方案中，本发明涉及分离的多核苷酸，其包含：(a)至少一个CentC串联重复序列阵列，该阵列包含至少10个拷贝的CentC；和(b)CentA、CRM1和CRM2各自至少一个拷贝。

在第11个实施方案中，本发明涉及重组构建体以及包含这类重组构建体的转基因玉米植物，所述构建体包含本发明的分离多核苷酸。

在第12个实施方案中，本发明涉及包含具有功能性着丝粒的人工植物微染色体的转基因玉米植物的制备方法，所述方法包括：

(a)使至少一个玉米植物细胞与包含本发明重组构建体的混合物接触；

(b)鉴定来自步骤(a)并包含具有功能性着丝粒的人工植物微染色体的至少一个玉米植物细胞；和

(c)使来自步骤(b)的玉米植物细胞再生出能育的玉米植物，其中所述玉米植物包含具有功能性着丝粒的人工植物微染色体。所述混合物还可包含编码用于刺激细胞生长的多肽的多核苷酸，其中该多肽选自wuschel、baby boom、RepA或Lec1。

附图简述

根据作为本申请组成部分的以下详述和附图及序列表，可以更全面地理解本发明。

图1.来自Hi-II转化CMC3库1事件#14的玉米胚胎发生愈伤组织(embryogenic calli)的有丝分裂染色体铺片(spread)的荧光原位杂交(FISH)。愈伤组织源自用Tn5-3改型(retrofit)的线性化BAC克隆库1转化的未成熟胚。前中期(左)和中期(右)核都显示出20条天然染色体和1条微染色体(箭头和插图)。这两种微染色体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)都呈阳性，其中CentC和23715基本上共同定位(colocalize)于微染色体(插图)。

图2.来自Hi-II转化CMC3库1事件#14的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的FISH。愈伤组织源自用Tn5-3改型的线性化BAC克隆库1转化的未成熟胚。图A显示中期核，显示出20条天然染色体和2条微染色体(方框)。这两种微染色体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)都呈阳性。图B-D是该方框的更高放大倍数图，显示出微染色体(箭头)，其中：B-仅DAPI；C-DAPI+23715探针(红色—颜色；白色—灰度)；和D-DAPI+CentC探针(绿色—颜色；白色—灰度)。

图3.来自Hi-II转化CMC3库1事件#14的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的免疫荧光。愈伤组织源自用Tn5-3改型的线性化BAC克隆库1转化的未成熟胚。图A显示中期核，显示出20条天然染色体和1条微染色体(箭头)。天然染色体和微染色体的所有着丝粒对着丝粒蛋白C(即CENPC，一种着丝粒/动粒特异性蛋白)(红色—颜色；白色—灰度)都呈阳性。图B-C是微染色体的更高放大倍数图，其中：B-仅DAPI；和C-DAPI+CENPC(红色—颜色；白色—灰度)。CENPC的形态和免疫学定位表明，微染色体由各自具有功能性着丝粒的两条姐妹染色单体组成。

图4.图A-来自Hi-II转化CMC3库1事件#14的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的免疫荧光。愈伤组织源自用Tn5-3改型的线性化BAC克隆库1转化的未成熟胚。在分裂后期观察到天然染色体和微染色体(方框)的姐妹染色单体分离。天然染色体和微染色体的所有着丝粒对着丝粒蛋白C(即CENPC，一种着丝粒/动粒特异性蛋白)(红色—颜色；白色—灰度)都呈阳性。图B是A中方框的更高放大倍数图，显示出微染色体姐妹染色单体的分离(双箭头)，表明微染色体同正常染色体一样，在有丝分裂中可以分离。

图5.来自Hi-II转化CMC3库3事件#12的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的FISH。愈伤组织源自用Tn5-3改型的线性化BAC克隆库3转化的未成熟胚。显示了四-非整倍体(tetra-aneuploid)(39条染色体，缺乏1个拷贝的染色体6)中期核，显示出天然染色体和1条微染色体(箭头)。微染色体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)都呈阳性。图B-D是方框区的更高放大倍数图，显示出微染色体(箭头)和天然染色体，其中：A-仅DAPI；B-DAPI+CentC探针(绿色—颜色；白色—灰度)；和D-DAPI+23715探针(红色—颜色；白色—灰度)。如微染色体的FISH染色所示，CentC重复序列的两极定位表明它是由两条姐妹染色单体组成，这与天然染色体中所观察的一样。

图6.来自Hi-II转化CMC3库3事件#12的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的FISH。愈伤组织源自用Tn5-3改型的线性化BAC克隆库3转化的未成熟胚。图A-四-非整倍体(39条染色体，缺乏1个拷贝的染色体6)中期核，显示出天然染色体和2条微染色体(箭头)。微染色体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)都呈阳性。图B是2条微染色体的更高放大倍数图，显示出CentC重复序列和独特标记23715的丰度的变化。

图7.来自Hi-II转化CMC3库3事件#12的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的FISH。愈伤组织源自用Tn5-3改型的线性化BAC克隆库3转化的未成熟胚。图A-四-非整倍体(39条染色体，缺乏1个拷贝的染色体6)核，显示出在早后期天然染色体和2条微染色体(方框)的姐妹染色单体的分离。2条微染色体的姐妹染色单体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)都呈阳性。图B-C是2条微染色体(双箭头)的更高放大倍数图，显示出B-DAPI+CentC探针(绿色—颜色；白色—灰度)；和C-DAPI+23715探针(红色—颜色；白色—灰度)。在后期，微染色体姐妹染色单体的分离表明，功能性着丝粒的存在允许在有丝分裂期间进行分离。

图8.来自Hi-II转化CMC3库3事件#12的玉米胚胎发生愈伤组织的有丝分裂染色体铺片的免疫荧光。愈伤组织源自用Tn5-3改型的线性化BAC克隆库3转化的未成熟胚。图A表明四-非整倍体(39条染色体，缺乏1个拷贝的染色体6)中期核，显示出39条天然染色体和2条微染色体(箭头)。天然染色体和微染色体的所有着丝粒对着丝粒蛋白C(即CENPC，一种着丝粒/动粒特异性蛋白)(红色—颜色；白色—灰度)都呈阳性。图B-C是微染色体的更高放大倍数图。CENPC免疫学定位模式(每条微染色体2次聚焦)表明，微染色体由两条姐妹染色单体组成，而且各自具有能形成动粒复合物的功能性着丝粒。

图9.来自Hi-II玉米转化事件的再生植物根尖的有丝分裂染色体铺片的FISH。植物源自用Tn5-3改型的线性化bacm.pk128.j21转化的未成熟胚。图A显示非整倍体中期核，显示出19条天然染色体和1条微染色体(箭头)。微染色体对CentC(绿色—颜色；白色—灰度)着丝粒特异性重复序列和对转化构建体具有特异性的独特标记探针23715(红色—颜色；白色—灰度)呈阳性。图B-D是微染色体的更高放大倍数图，其中：B-仅DAPI；C-DAPI+CentC探针(绿色—颜色；白色—灰度)；和D-DAPI+23715探针(红色—颜色；白色—灰度)。

图10.来自Hi-II玉米转化事件的再生植物根尖的有丝分裂染色体铺片的免疫荧光。植物源自用Tn5-3改型的线性化bacm.pk128.j21转化的未成熟胚。图A显示非整倍体中期核，显示出19条天然染色体和1条微染色体(箭头)。天然染色体和微染色体的所有着丝粒对着丝粒蛋白C(即CENPC，一种着丝粒/动粒特异性蛋白)(红色—颜色；白色—灰度)都呈阳性。图B-C是微染色体的更高放大倍数图，其中：B-仅DAPI；和C-DAPI+CENPC。CENPC免疫学定位模式(每条微染色体2次聚焦)表明，微染色体由两条姐妹染色单体组成，而且各自具有能形成动粒复合物的功能性着丝粒。

图11.经纤维-FISH显示的玉米着丝粒精细结构。4个着丝粒重复序列CentC(绿色—颜色；白色—灰度)以及CentA、CRM1和CRM2的总和(红色—颜色；灰色—灰度)用于含单条玉米染色体的燕麦-玉米附加系(addition line)的伸展DNA纤维的多色FISH。这显示了长达百万碱基的杂交延伸，这对每条染色体都是唯一的。

图12.玉米着丝粒模型。着丝粒的组成用玉米着丝粒重复序列名称来表示。CentC的连续阵列可由成百上千个重复元件组成。其它玉米着丝粒特异性反转录转座元件(例如CentA、CRM1和/或CRM2)可整合到CentC阵列中，在彼此之间和/或在着丝粒区中。除了着丝粒特异性反转录转座子以外，其它反转录转座子可整合在阵列中，整合到元件(例如CentA、CentC、CRM1和CRM2)中和/或整合而形成中断CentC串联重复序列阵列的插入序列。该图表示玉米CentC元件(箭头)的一个组成模型，构成2组头尾串联的重复序列。可发现相反方向的CentC阵列，形成着丝粒DNA的大区段。减数分裂后期染色体的纤维-FISH和FISH以及克隆着丝粒DNA区段的斑点杂交分析表明，具有高密度的所有4个着丝粒重复序列(CentC、CRM1、CentA和CRM2)的区域都参与了动粒的形成。

图13.BAC克隆的改型和体外转化到线状人工微染色体中。BAC克隆DNA用定制的转座子Tn5-3改型，所述转座子Tn5-3包含氨苄青霉素抗性基因(AP^r)，复制起点(ori)，选择标记(MO-PAT)和可见标记(DS-RED2)标记(处于泛蛋白启动子(UBI1ZM PRO)之下)，被卡那霉素抗性gen(KAN^r)基因分开的处于反向的端粒序列(TEL)，以及归巢限制酶I-Ppo I、I-Ceu I和PI-Sce I的位点。ME位于转座子嵌合末端。用归巢限制酶I-Ceu I消化BAC构建体，将环状BAC转化为邻接端粒序列的线状DNA分子。

图14.对于来自CMC3库1事件#14的愈伤组织中期核，探测着丝粒和端粒元件。用荧光标记探针，对着丝粒特异性CentC重复序列(绿色—颜色；白色—灰度)和端粒特异性telo-31重复序列(红色—颜色；白色—灰度)进行FISH分析。标明这些探针的定位，用于天然染色体，CentC用星号(*)标明，telo-31用双箭头标明。图B-E显示微染色体的更高放大倍数图。图B-DAPI+Cent C+telo31(绿色/红色—颜色；白色—灰度)；C-仅DAPI；D-DAPI+CentC探针(绿色—颜色；白色—灰度)；和E-DAPI+23715探针(红色—颜色；白色—灰度)。telo-31杂交模式表明，微染色体(箭头)具有与天然染色体类似的功能性端粒。

图15.对于来自CMC3亚库1.3事件#27的愈伤组织中期核，探测着丝粒和端粒元件。用荧光标记探针，对着丝粒特异性CentC重复序列(绿色—颜色；白色—灰度)和端粒特异性telo-31重复序列(红色—颜色；白色—灰度)进行FISH分析。标明这些探针的定位，用于天然染色体，CentC用星号(*)标明，telo-31用双箭头标明。图B-E显示微染色体的更高放大倍数图。图B-DAPI+Cent C+telo-31(绿色/红色—颜色；白色—灰度)；C-仅DAPI；D-DAPI+CentC探针(绿色—颜色；白色—灰度)；和E-DAPI+23715探针(红色—颜色；白色—灰度)。telo-31杂交模式表明，微染色体(箭头)具有与天然染色体类似的功能性端粒。

详述

本文所提出的各参考文献的公开内容通过引用全部结合到本文中。

除非另有说明，否则本文和所附权利要求书所用的术语前未加数词修饰时包括其复数形式。因此，例如“植物”包括多种(个)这样的植物；“细胞”包括一种(个)或多种(个)细胞以及本领域技术人员已知的等价物，等等。

就本说明书而言，使用了大量术语和缩略语。提供以下定义。

“可读框”缩写为ORF。

“美国典型培养物保藏中心(American Type Culture Collection)”缩写为ATCC。

本文所用的术语“人工植物微染色体(artificial plant minichromosome)”是指包含着丝粒和端粒的任何人工产生的染色体，其具有与天然染色体类似的性质，例如在有丝分裂和减数分裂期间可复制和分离并因而在细胞分裂期间是自主的并可传递。术语人工微染色体、微染色体和人工染色体在本文中可互换使用。

术语“功能性着丝粒”是指真核细胞的染色体纺锤体附着区，其功能与天然染色体的着丝粒类似。它是染色体的最凝聚和缢缩区，在有丝分裂期间纺锤丝与它连接在一起。在典型的动植物细胞有丝分裂期间，每条染色体纵向分裂成2个姐妹染色体，最终分离并进入有丝分裂纺锤体的两极。在有丝分裂一开始，当姐妹染色体分裂但仍成对时，每条染色体沿其长度附着在纺锤体特定位点。该位点称为着丝粒或纺锤体附着区。着丝粒由高度重复DNA组成，也就是说DNA序列在基因组中存在许多拷贝。

术语“阵列”是指元件的有序排列。

术语“串联重复序列”是指呈相同方向的相同碱基序列的多个拷贝。因此，它们是例如沿染色体方向多次重复的串联核苷酸序列的拷贝。任何串联重复序列阵列可包括单个元件的多个拷贝，或者可具有至少一个散布在阵列内或阵列元件内的其它元件。

术语“相反方向”是指相同序列的两个或更多拷贝呈相反形式。

术语“反转录转座元件”和“反转录转座子”在本文中可互换使用，是指可转移到DNA新位置上的遗传元件，即可通过先制备本身的RNA拷贝，再用逆转录酶制备该RNA的DNA拷贝，然后将该DNA拷贝插入靶DNA。反转录转座子是可在基因组中扩增自己的遗传元件，是在许多真核生物DNA中广泛存在的组分。它们是转座子的一个亚类。它们在植物中特别丰富，常常是植物细胞核DNA的主要成分。

术语“功能性端粒”是指在真核细胞染色体末端发现的结构。端粒的功能是通过保护染色体末端，以免重组、与其它染色体融合或被核酸酶降解。它们允许细胞区分随机DNA断裂与染色体末端。它们在确定正常细胞分裂次数方面也起到重要作用。端粒是线状染色体末端的高度重复DNA区，其功能是作为可任意使用的缓冲物质(disposable buffer)。每当线状真核染色体在晚S期复制时，DNA聚合酶复合物不能一路复制到染色体末端；如果没有端粒，这将会很快导致维持细胞活性所需的重要遗传信息的丢失。

本文所用的“核酸”是指多核苷酸，包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链多聚体。核酸也可包括片段和修饰核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”是可互换使用的，是指单链或双链RNA或DNA的多聚体，任选包含合成、非天然或改变的核苷酸碱基。核苷酸(通常呈5′-单磷酸形式)用如下单字母命名：“A”代表腺苷或脱氧腺苷(分别对于RNA或DNA)，“C”代表胞苷或脱氧胞苷。“G”代表鸟苷或脱氧鸟苷。“U”代表尿苷，“T”代表脱氧胸苷，“R”代表嘌呤(A或G)，“Y”代表嘧啶(C或T)，“K”代表G或T，“H”代表A或C或T，“I”代表肌苷，“N”代表任何核苷酸。

术语“在功能上等同的亚片段”和“功能等同的亚片段”在本文中可互换使用。这些术语是指分离的核酸片段的一部分或亚序列，其中保留了改变基因表达或产生某种表型的能力，无论所述片段或亚片段是否编码活性酶。例如，片段或亚片段可用于设计嵌合基因，以在转化植物中产生所需表型。可设计嵌合基因，用于通过连接核酸片段或其亚片段而进行抑制，无论它是否编码活性酶、相对于植物启动子序列而言呈有义或反义方向。

术语“保守区”或“基序”是指在进化相关蛋白质的比对序列的特定位置上保守的一组氨基酸。尽管在其它位置的氨基酸可在同源蛋白质之间变化，但是在特定位置上高度保守的氨基酸表明是蛋白质结构、稳定性或活性必不可少的氨基酸。因为它们通过蛋白质同源物家族比对序列的高度保守而鉴定，所以它们可用作标识物或“标记(signature)”，以确定具有新测定序列的蛋白质是否属于先前已鉴定的蛋白质家族。

术语“同源性”、“同源”、“基本相似”、“基本相同”和“基本对应”在本文中可互换使用。它们是指这样的核酸片段：其中一个或多个核苷酸碱基的改变不影响核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明核酸片段的修饰(例如缺失或插入一个或多个核苷酸)，而与未修饰的原始片段相比，基本上不改变所得核酸片段的功能特性。这些术语还指具有或没有修饰、缺失、插入或取代的氨基酸序列、多肽或肽片段，与未修饰的原始序列相比，所述修饰、缺失、插入或取代基本上不改变功能特性。因此，本领域技术人员可以理解，本发明包括的不止是具体的示例性序列。

此外，技术人员知道，本发明所包括的基本相似的核酸序列也可按照它们与本文举例的序列杂交(在中等严格性条件下，例如0.5XSSC、0.1％SDS，60℃)的能力，或与本文所公开的核苷酸序列的任何部分和本文所公开的任何核酸序列的功能等同物杂交的能力来定义。严格性条件可调节到从筛选中度类似片段(例如远缘相关生物体的同源序列)，到筛选高度类似片段(例如能复制密切相关生物的功能性酶的基因)。杂交后洗涤确定严格性条件。

术语“选择性杂交”包括这样的杂交：在严格性杂交条件下，核酸序列与特定核酸靶序列杂交，检测到其杂交程度比其与非靶核酸序列杂交程度高(例如超过背景至少2倍)，因而可基本上排除非靶核酸。选择性杂交序列通常彼此具有约至少80％序列同一性，或90％序列同一性，至多100％序列同一性并包括100％序列同一性(即完全互补)。

术语“严格性条件”或“严格性杂交条件”包括探针将会与其靶序列选择性杂交的条件。严格性条件是序列依赖性的，在不同情况下将会不同。对于控制杂交和/或洗涤条件的严格性而言，可鉴定出与探针100％互补的靶序列(同源探测)。或者，严格性条件可调节到允许序列中的某些错配，使得可检测较低程度的相似性(异源探测)。通常，探针长度小于约1000个核苷酸，任选小于500个核苷酸。

通常，严格性条件如下：其中盐浓度小于约1.5M Na离子，通常约0.01-1.0M Na离子浓度(或其它盐)，pH 7.0-8.3，而温度至少约30℃(对于短探针，例如10-50个核苷酸)和至少约60℃(对于长探针，例如大于50个核苷酸)。通过添加去稳定剂(destabilizing agent)例如甲酰胺，也可得到严格性条件。示例性的低严格性条件包括在缓冲液(30-35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠))中在37℃杂交，并在1X-2X SSC(20X SSC＝3.0M NaCl/0.3M柠檬酸三钠)中在50-55℃洗涤。示例性的中等严格性条件包括在40-45％甲酰胺、1M NaCl、1％SDS中在37℃杂交，并在0.5X-1X SSC中在55-60℃洗涤。示例性的高严格性条件包括在50％甲酰胺、1M NaCl、1％SDS中在37℃杂交，并在0.1X SSC中在60-65℃洗涤。

特异性通常因杂交后洗涤而异，关键因素是最终洗涤液的离子强度和温度。对于DNA-DNA杂合体，T_m可按Meinkoth等((1984)Anal Biochem 138：267-284)的等式来求出：T_m＝81.5℃+16.6(log M)+0.41(％GC)-0.61(％甲酰胺)-500/L；其中M是单价阳离子的体积摩尔浓度，％GC是鸟苷酸和胞苷酸在DNA中所占的百分率，％甲酰胺是杂交溶液中甲酰胺的百分率，而L是按碱基对计杂合体的长度。T_m是50％互补靶序列与完全匹配的探针杂交的温度(在指定离子强度和pH下)。每错配1％，T_m降低约1℃；因此，T_m、杂交和/或洗涤条件可调整到与所需同一性的序列杂交。例如，如果寻找具有＞90％同一性的序列，则T_m可下降10℃。通常，在指定离子强度和pH下，对于特定序列及其互补序列而言，选择严格性条件比热解链温度(T_m)低约5℃。然而，高严格性条件可使用在比热解链温度(T_m)低1℃、2℃、3℃或4℃的温度下进行杂交和/或洗涤；中等严格性条件可使用在比热解链温度(T_m)低6℃、7℃、8℃、9℃或10℃的温度下进行杂交和/或洗涤；低严格性条件可使用比热解链温度(T_m)低11℃、12℃、13℃、14℃、15℃或20℃的温度下进行杂交和/或洗涤。用该等式、杂交和洗涤液组成以及所需要的T_m，本领域普通技术人员将会知道杂交和/或洗涤液严格性的变化如上所述是固有的。如果所需错配程度导致T_m低于45℃(水溶液)或32℃(甲酰胺溶液)，最好提高SSC浓度，使得可以使用更高温度。有关核酸杂交的更详细指南可参见Tijssen，Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes，第I部分，第2章，“Overview of principles of Hybridization and the strategy of Nucleic Acid Probe assays”，Elsevier，New York(1993)；和Current Protocols in Molecular Biology，第2章，Ausubel等主编，Greene Publishing and Wiley-Interscience，New York(1995)。杂交和/或洗涤条件可用至少10分钟、30分钟、60分钟、90分钟、120分钟或240分钟。

对于核酸或多肽序列而言，术语“序列同一性”或“同一性”是指两个序列中的核酸碱基或氨基酸残基当在特定比较窗口比对最大对应性时是相同的。术语“％序列同一性”是指通过在一个比较窗口比较两个优化比对序列所求出的值，其中对于两个序列优化比对而言，当与参考序列(其不包括插入或缺失)比较时，在比较窗口中多核苷酸或多肽序列部分可包括插入或缺失(即空位)。百分率是这样求出的：通过测定两条序列中存在的相同核酸碱基或氨基酸残基的位置数而得到匹配位置数，再用匹配位置数除以比较窗口的总位置数，并将结果乘以100，就得到％序列同一性。％序列同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％、或50％-100％之间的任何整数百分数。这些同一性可用本文所述的任何程序来测定。

用设计用于测定同源序列的各种比较方法，可进行序列比对和％同一性或相似性计算，这些方法包括但不限于LASERGENE生物信息学计算程序集(suite)的MegAlign^TM程序(DNASTAR Inc.，Madison，WI)。就本申请的内容而言，可以理解，当用序列分析软件进行分析时，分析结果可根据所用程序的“默认值”，除非另有说明。本文所用的“默认值”是指软件在首次初始化时原本带有的任何一组数值或参数。术语“Clustal V比对方法”相当于标记为Clustal V的比对方法(描述于Higgins和Sharp(1989)CABIOS 5：151-153；Higgins等(1992)Comput Appl Biosci 8：189-191)并可参见LASERGENE生物信息学计算程序集的MegAlign^TM程序(DNASTAR Inc.，Madison，WI)。对于多重比对，默认值相当于空位罚分＝10，空位长度罚分＝10。采用Clustal方法，对于成对比对和蛋白质序列的％同一性计算的默认参数为KTUPLE＝1，空位罚分＝3，WINDOW＝5和DIAGONALSSAVED＝5。对于核酸，这些参数为KTUPLE＝2，空位罚分＝5，WINDOW＝4和DIAGONALS SAVED＝4。当用Clustal V程序比对序列后，可通过查看同一程序中的“序列距离”表而得到“％同一性”。术语“Clustal W比对方法”相当于标记为Clustal W的比对方法(描述于Higgins和Sharp(1989)CABIOS 5：151-153；Higgins等(1992)Comput Appl Biosci 8：189-191)并可参见LASERGENE生物信息学计算程序集的MegAlign^TM第6.1版程序(DNASTAR Inc.，Madison，WI)。多重比对的默认参数是空位罚分＝10，空位长度罚分＝0.2，延迟发散序列(％)＝30，DNA转换权重＝0.5，蛋白质权重矩阵＝Gonnet Series，DNA权重矩阵＝IUB。当用Clustal W程序比对序列后，可通过查看同一程序中的“序列距离”表而得到“％同一性”。术语“BLASTN比对方法”是由国立生物技术信息中心(National Center forBiotechnology Information，NCBI)提供的算法，用于用默认参数比较核苷酸序列。

本领域技术人员都知道，多个水平的序列同一性可用于从其它物种中鉴别出多肽，其中这样的多肽具有相同或相似功能或活性。％同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％、或95％或50％-100％的任何整数百分率。的确，50％-100％的任何整数的氨基酸同一性可用于描述本发明，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。

术语“基因”是指表达特定蛋白质的核酸片段，其包含编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节序列。“天然基因”是指在自然界发现的带有其自身调节序列的基因。“嵌合基因”是指并非天然基因的任何基因，其包含在自然界中不在一起的调节序列和编码序列。因此，嵌合基因可包含来自不同来源的调节序列和编码序列，或来自同一来源、但与自然界中所排列方式不同的调节序列和编码序列。“外源”基因是指在宿主生物中并非正常存在的、而是通过基因转移而导入宿主生物的基因。外源基因可包含插入到非天然生物体或嵌合基因中的天然基因。“转基因”是通过转化方法导入基因组的基因。

术语“基因组”当用于植物细胞时，不仅包括细胞核内染色体DNA，而且还包括细胞的亚细胞组分(例如线粒体或质体)内的细胞器DNA。

“密码子优化基因”或“密码子优选基因”是指经设计其密码子使用频率模拟宿主细胞的优选密码子使用频率的基因。

“等位基因”是占据染色体上特定位置的基因的若干替代形式之一。当在染色体上特定位置存在的所有等位基因都相同时，则植物在该基因座上就是纯合的。如果在染色体上特定位置存在的等位基因不同，则植物在该基因座上就是杂合的。

术语“编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列上游(5′非编码序列)、中间或下游(3′非编码序列)并可影响转录、RNA加工或稳定性、或所连接编码序列的翻译的核苷酸序列。调节序列可包括但不限于：启动子、翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎-环结构(stem-loop structure)。

术语“启动子”是指能控制编码序列或功能性RNA的表达的DNA序列。启动子序列由近侧和远侧上游元件组成，后者常称为增强子。因此，“增强子”是能刺激启动子活性的DNA序列，它可以是启动子的天然元件或者是插入其中以增强启动子水平或组织特异性的异源元件。启动子可全部来自天然基因，或者是由来自在自然界发现的不同启动子的不同元件组成，或者甚至包含合成DNA区段。本领域技术人员知道，不同启动子可指导不同组织或细胞类型或不同发育时期的基因表达、或响应不同环境条件的基因表达。本领域技术人员还知道，因为在大多数情况下并未完全界定调节序列的准确边界，所以某些变异的DNA片段可具有相同的启动子活性。在大多数细胞种类中、在大多数时间都能使基因得以表达的启动子通常称为“组成型启动子”。不断发现用于植物细胞的不同类型的新启动子；大量实例可参见Okamuro和Goldberg(1989)Biochemistry of Plants 15：1-82。

术语“翻译前导序列”是指位于基因的启动子序列与编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的完全加工的mRNA上游。翻译前导序列可影响初级转录物成为mRNA的加工、mRNA稳定性或翻译效率。翻译前导序列的实例已有描述(Turner和Foster(1995)Mol Biotechnol 3：225-236)。

术语“3′非编码序列”、“转录终止子”或“终止序列”是指位于编码序列下游的DNA序列，包括聚腺苷酸化识别序列和编码调节信号的其它序列，所述信号能够影响mRNA加工或基因表达。聚腺苷酸化信号通常表征为影响聚腺苷酸链添加到mRNA前体的3′端。不同3′非编码序列的使用实例可参见Ingelbrecht等(1989)Plant Cell1：671-680。

术语“RNA转录物”是指由RNA聚合酶催化DNA序列转录而产生的产物。当RNA转录物是DNA序列的完全互补拷贝时，它就称为初级转录物。当初级转录物经转录后加工而得到RNA序列时，该RNA转录物则称为成熟RNA。“信使RNA”或“mRNA”是指不含内含子并可由细胞翻译为蛋白质的RNA。“cDNA”是指采用逆转录酶由mRNA模板合成并与之互补的DNA。cDNA可以是单链或使用DNA聚合酶I克列诺(Klenow)片段而转化为双链形式。“有义”RNA是指包含mRNA并可在细胞内或体外翻译为蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补的RNA转录物，其可阻断靶基因的表达(美国专利5,107,065)。反义RNA可以与特定基因转录物的任何部分(即5′非编码序列、3′非编码序列、内含子或编码序列)互补。“功能性RNA”是指不能翻译、但能影响细胞加工的反义RNA、核酶RNA或其它RNA。对于mRNA转录物而言，术语“互补”和“反向互补”在本文中可互换使用，用于限定反义信使RNA。

术语“有效连接”是指单一核酸片段上核酸序列的连接使得一个序列的功能由其它序列调节。例如，当启动子能够调节编码序列的表达(即编码序列处于启动子的转录控制之下)，则该启动子与编码序列的连接就是有效连接。编码序列可以有义或反义方向与调节序列有效连接。在另一实例中，本发明的互补RNA区可直接或间接地有效连接到靶mRNA的5′、或靶mRNA的3′、或连接在靶mRNA内，或第一互补区为靶mRNA的5′，而其互补序列为靶mRNA的3′。

本文所用的标准重组DNA和分子克隆技术是本领域众所周知的，详见Sambrook等，Molecular Cloning：A Laboratory Manual；Cold Spring Harbor Laboratory：Cold Spring Harbor，NY(1989)。转化方法是本领域技术人员众所周知的，在下文进行描述。

“PCR”或“聚合酶链式反应”是特定DNA区段的合成技术，由一系列重复的变性、退火和延伸循环组成。通常，双链DNA经热变性，与靶区段的3′边界互补的两个引物在低温下退火，然后在中温下延伸。一组这样的3个连续步骤称为一次“循环”。

术语“重组”是指两个不同的分离的序列区段的人工组合，例如通过化学合成或通过遗传工程技术操作分离的核酸区段。

术语“质粒”、“载体”和“盒”是指额外的染色体元件，其通常携带并非细胞重要代谢组成部分的基因，通常呈环状双链DNA片段形式。这样的元件可以是自主复制序列、基因组整合序列、噬菌体或核苷酸序列、线状或环状、单链或双链DNA或RNA，来自任何来源，其中许多核苷酸序列连接或重组成独特构建体，这样的构建体可将启动子片段和选定基因产物的DNA序列以及合适的3′非翻译序列引入细胞中。“转化盒”是指含有外源基因以及除外源基因以外的能促进特定宿主细胞转化的元件的特定载体。“表达盒”是指含有外源基因以及除外源基因以外的能允许该基因在外源宿主中表达的元件的特定载体。

术语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含核酸片段的人工组合，例如在自然界并不在一起的调节序列和编码序列。例如，嵌合构建体可包含来自不同来源的调节序列和编码序列，或来自同一来源、但排列方式与自然界不同的调节序列和编码序列。这样的构建体可单独使用或与载体联用。如果使用载体，则载体的选择取决于转化宿主细胞所用的方法，这是本领域技术人员众所周知的。例如，可使用质粒载体。技术人员非常清楚，遗传元件必须存在于载体中，以便成功地转化、选择和扩增含有任何本发明分离核酸片段的宿主细胞。技术人员也将会知道，不同的独立转化事件可导致不同水平和模式的表达(Jones等(1985)EMBO J 4：2411-2418；De Almeida等(1989)Mol Gen Genet 218：78-86)，因此必须筛选多个事件，以便获得表现出所需表达水平和模式的品系。可通过DNA的DNA印迹分析、mRNA表达的RNA印迹分析、蛋白质表达的免疫印迹分析或表型分析等方法来完成这样的筛选。

本文所用的术语“表达”是指产生功能性终产物(例如前体或成熟形式的mRNA或蛋白质)。

术语“导入”是指将核酸(例如表达构建体)或蛋白质导入细胞中。导入包括将核酸导入真核细胞或原核细胞中并结合到细胞基因组中，还包括将核酸或蛋白质瞬时提供给细胞。导入包括稳定或瞬时转化方法，以及有性杂交。因此，就将核酸片段(例如重组DNA构建体/表达构建体)插入到细胞中而言，“导入”是指“转染”或“转化”或“转导”并包括将核酸片段导入真核细胞或原核细胞中，在其中核酸片段可结合到细胞基因组(例如染色体、质粒、质体或线粒体的DNA)上，转变成为自主复制子或瞬时表达(例如转染mRNA)。

术语“成熟”蛋白质是指经翻译后加工的多肽(即已除去初级翻译产物中存在的任何前肽(prepeptide)或肽原(propeptide)的多肽)。“前体”蛋白是指mRNA翻译的初级产物(即仍然含有前肽和肽原)。前肽和肽原可能是但不限于胞内定位信号。

术语“稳定的转化”是指核酸片段转移到宿主生物基因组(包括核基因组和细胞器基因组)中而产生遗传稳定的遗传。相反，“瞬时转化”是指核酸片段转移到宿主生物的细胞核或含DNA的细胞器中而导致非整合或非稳定遗传的基因表达。含转化核酸片段的宿主生物称为“转基因”生物。

术语“转基因”是指基因组内含有异源多核苷酸的植物或细胞。优选异源多核苷酸是稳定整合到基因组中，使多核苷酸可连续传代。异源多核苷酸可单独整合到基因组上或作为表达构建体的组成部分而整合。本文所用的转基因包括其基因型已因异源核酸的存在而改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物，其包括起先这样改变的转基因以及由起先的转基因经有性杂交或无性繁殖而产生的那些。本文所用的术语“转基因”不包括由常规植物育种方法或天然发生事件导致基因组(染色体或染色体外)的改变，例如随机交叉受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变。

术语“植物”是指整株植物、植物器官、植物组织、种子、植物细胞、种子及其后代。植物细胞包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。植物部分包括分化和未分化组织，包括但不限于以下：根、茎、芽、叶、花粉、种子、肿瘤组织以及各种细胞和培养物形式(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以在植物或植物器官、组织或细胞培养物中。术语“植物器官”是指组成形态和功能独特的植物部分的植物组织或一组组织。术语“基因组”是指以下：(1)在生物体、或病毒或细胞器的每个细胞中都存在的遗传材料的完全互补序列(基因和非编码序列)；和/或(2)作为来自一个亲本的(单倍体)单位而遗传的一整套染色体。“后代”包括植物的任何后续世代。

本发明涉及包含功能性着丝粒的人工植物微染色体，其包含：(a)至少2个反向的CentC串联重复序列阵列，其中第1阵列包含至少50个拷贝的CentC，第2阵列包含至少50个拷贝的CentC；和(b)至少一个拷贝的反转录转座元件，其中反转录转座元件位于第1阵列和第2阵列之间。优选反转录转座元件选自CentA、CRM1和CRM2。

人工染色体包含具有CentC串联重复序列阵列的功能性着丝粒。每个CentC重复序列阵列可包含至少30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280、300、320、340、360、380、400、450或500个拷贝的CentC。此外，每个CentC串联重复序列阵列中可间插另一序列元件，包括但不限于反转录转座子(其插入到CentC拷贝之间或CentC元件内或反转录转座子内)，或阵列中的任何其它序列元件。反转录转座子包括但不限于CentA、CRM1和CRM2。

在大多数真核生物中，着丝粒作为染色体中动粒形成和纺锤体附着的位点，嵌入异染色质中。酿酒酵母(S.cerevisiae)染色体缺乏随体序列，而具有精确定位的小着丝粒，它限定纺锤体连接～125bp DNA(Blackburn和Szostak(1984)Ann Rev Biochem 53：163-194)。

然而，来自其它真菌谱系的着丝粒包含与动植物中发现的更类似的重复序列阵列(Fishel等(1988)Mol Cell Biol 8：754-763)。在高等真核生物中，细胞学研究和生物化学研究显示出串联重复的随体DNA、着丝粒区和特定着丝粒相关蛋白之间的物理连接(Henikoff等(2001)Science 293：1098-1102；Yu和Dawe(2000)J Cell Biol 151：131-142)。

尽管缺乏通用序列基序，但大多数着丝粒随体重复序列在不同生物体间都具有明显类似的单元长度，例如基本随体单元为171bp(灵长类)、186bp(鱼金头鲷(Sparus aurata))和155bp(昆虫Chironomus Pallidivittatus)(Henikoff等(2001)Science 293：1098-1102)。

植物着丝粒具有类似单元长度重复序列，例如，156bp重复序列(玉米)(Ananiev等(1998)Proc Natl Acad Sci USA 95：13073-13078)、168bp重复序列(水稻)(Dong等(1998)Proc Natl Acad Sci USA 95：8135-8140)和180bp重复序列(拟南芥(Arabidopsis))(Copenhaver(2003)Chromosome Res 11：255-262)。在拟南芥中，着丝粒通常含有2.8-4Mb串联重复的178bp随体序列段(Hall等(2004)Curr Opin Plant Biol 7：108-114)。在玉米中，完整功能的额外B染色体着丝粒含有约500kb串联重复序列，其中部分缺失减少了传递(Alfenito和Birchler(1993)Genetics 135：589-597)。含有额外B染色体的玉米染色体铺片与来自位于A染色体着丝粒区的不同重复元件(包括CentC、CRM和CentA)的探针杂交。这些重复元件(主要存在于A染色体着丝粒附近)与不同于B染色体着丝粒的许多位点杂交(Lamb等(2005)Chromosoma 113：337-349)。

至少两个实例违背了着丝粒随体DNA基础上的着丝粒形成的基本原则。首先，外来着丝粒(alien centromere)在体细胞杂合体或燕麦-玉米渐渗系中的明确正常功能(Ananiev等(1998)Proc Natl Acad Sci USA 95：13073-13078)表明保留了着丝粒功能和相应蛋白质复合物。支持含无关着丝粒随体DNA的外来着丝粒功能的所有着丝粒蛋白明显都由宿主提供(Jin等(2004)Plant Cell 16：571-81)。第二，新着丝粒是最近描述于人和果蝇(Drosophila)的基于非重复DNA的一类新型着丝粒(Williams(1998)Nat Genet 18：30-37；Choo(1997)Am J Hum Genet 61：1225-1233)。新着丝粒在正常染色体经多次染色体重排的衍生物中存在，新着丝粒在明显的常染色质DNA区形成，缺乏通常与着丝粒功能相关重复序列。具有新着丝粒的染色体具有不同的有丝分裂或减数分裂稳定性。

着丝粒的特性和功能尚未完全清楚，还需要更多分析。迄今为止，大多数人工染色体都具有基于天然着丝粒随体DNA的功能性着丝粒。knob重复序列，例如180bp和350bp(TRI)可用作新着丝粒的组分。已经知道某些knob在减数分裂玉米染色体中可获得着丝粒功能，这些新着丝粒仅包含180bp和350bp的串联重复序列。对人和低等生物的新着丝粒进行研究，解决了先前未知的着丝粒DNA动态特性的现象(Choo等(1997)Am J Hum Genet.61：1225-33)。在该现象的核心中，着丝粒功能看来并不是特定DNA序列的需要；而响应合适的外来影响的大量序列看来才提供该功能。

对着丝粒序列的深入表征来自对酵母的研究，例如酿酒酵母(S.cerevisaie)和粟酒裂殖酵母(S.pombe)，已经定义了功能性酵母着丝粒元件和组构。例如在酿酒酵母着丝粒中，3个必需区域(CDEI、CDEII和CDEIII)的结构和功能总共才125bp，即占每条染色体的0.006-0.06％(Carbon等(1990)New Biologist 2：10-19；Bloom(1993)Cell 73：621-624)。

粟酒裂殖酵母着丝粒介于40-100kb之间，由重复元件组成，占每条染色体的1-3％(Baum等(1994)Mol Cell Biol 5：747-761)。后续研究表明，不到1/3的天然粟酒裂殖酵母着丝粒对着丝粒功能而言是足够的(Baum等(1994)Mol Cell Biol 5：747-761)。在粟酒裂殖酵母中，已经知道反向重复序列区是着丝粒功能必不可少的，但是无论是中部核心(central core)还是反向重复序列的一条臂都不能赋予功能。侧接中部核心的重复序列部分的缺失对有丝分裂分离功能或微染色体分离成为单倍体后代的减数分裂都没有影响，但在减数分裂I期间能显著破坏着丝粒介导的对同源姐妹染色单体配对的维持。在粟酒裂殖酵母3条不同染色体之间有明显变异性，不同粟酒裂殖酵母菌株之间的任何特定染色体的着丝粒都具有明显变异性。然而，基础DNA结构基序(即反向重复序列)是粟酒裂殖酵母着丝粒的通用参数(Clarke等(1993)Cold Spring Harb Symp Quant Biol 58：687-695)。

高等真核生物着丝粒很少有表征。虽然已鉴定出与高等真核生物着丝粒区杂交的DNA片段，但是对这些序列的结构、组织和/或功能的了解甚少。然而，水稻却是个例外，因其具有不同的着丝粒大小。虽然某些水稻染色体具有的着丝粒与其它物种大小类似(＞1Mb)，但一些染色体的着丝粒却惊人地小，可以被采用标准技术构建的BAC毗连群(contig)完全覆盖。水稻着丝粒4和8的完全测序表明，染色体区段内存在认为是着丝粒的着丝粒串联重复序列的反向区组(inverted block)，类似于酵母中观察到的反向重复序列结构(Zhang等(2004)Nucl Acids Res 32：2023-2030；Wu等(2004)Plant Cell 16：967-976)。

就许多情况而言，着丝粒重复序列的探针与着丝粒位置具有细胞学和遗传学关系，许多这样的序列以串联重复随体元件和分散重复序列形式存在，其阵列长度范围为300-5000kb(Willard(1990)Trends Genet 6：410-416)。原位杂交已经显示出每个人类着丝粒中都存在alphoid随体171bp重复序列(Tyler-Smith等(1993)Curr Biol 390-397)。尚未确定这些重复序列是否组成功能性着丝粒，但看来需要其它基因组DNA赋予DNA遗传性。用alphoid随体转染细胞系，得到新染色体，但这些新染色体也含有宿主DNA，其可影响着丝粒活性(Haaf等(1992)Cell 70：681-696；Willard(1997)Nat Genet 15：345-354)。此外，新染色体可显示出其全长alphoid DNA铺片仅具有一个着丝粒缢痕，这表明alphoid DNA区组可能不足以赋予着丝粒功能。

植物着丝粒的遗传表征采用染色体片段的分离分析，包括分析携带遗传标记的端着丝粒片段的三体品系(例如Koornneef(1983)Genetica 62：33-40)。已经鉴定出与着丝粒遗传连锁(Richards等(1991))Nucl Acids Res 19：3351-3357或物理连接(Alfenito等(1993)Genetics 135：589-597；Maluszynska等(1991)Plant J 1：159-166)的植物着丝粒重复元件，但是涉及着丝粒功能的这些序列的重要性尚未充分表征其功能。

在拟南芥(Arabidopsis thaliana)中进行的细胞学研究，已经找出着丝粒结构与重复序列之间的关系。用非特异性荧光DNA结合剂(例如4′，6-二脒基-2-苯基吲哚(DAPI))染色，可观察到中期染色体的着丝粒染色质区。针对180bp pALI重复序列的荧光原位杂交(FISH)探针与所有5条拟南芥(Arabidopsis)染色体着丝粒附近的DAPI标记共同定位(Maluszynska等(1991)Plant J 1：159-166；Martinez-Zapater等(1986)Mol Gen Genet 204：417-423)。提出了pALI的功能性作用，但新近研究没有检测到拟南芥(Arabidopsis)密切相关物种的着丝粒附近的该序列(Maluszynska等(1993)Ann Botany 71：479-484)。据信，所检测的一个物种小拟南芥(A.pumila)是拟南芥(A.thaliana)与另一密切相关物种杂交而来的双二倍体(Maluszynska等(1991)Plant J 1：159-166；Price等(1995)载于Arabidopsis，Somerville和Meyerowitz(主编)Cold Spring Harbor Press，NY)。另一重复序列(pAt12)遗传作图到1号染色体着丝粒5cM和5号染色体中心区之内(Richards等(1991)Nucl Acids Res 19：3351-3357)，但它在着丝粒功能上的作用仍然不清楚。

植物着丝粒区主要由着丝粒特异性重复序列、着丝粒反转录转座子和主要分散在植物基因组中的少量其它重复元件组成。例如着丝粒重复序列(例如CentO和CRR)已知来自水稻。已经描述了玉米的4个着丝粒重复元件：CentA、CentC、CRM1和CRM2(SEQ ID NO：1-4)。在玉米中，第一个发现的串联重复着丝粒特异性元件是CentC(Ananiev等(1998)Proc Natl Acad Sci USA 95：13073-13078)。CentC形成多个不同长度的串联阵列，其中一些串联阵列包含多达1千个拷贝的CentC重复序列。CentC串联重复序列与着丝粒核小体中的CENH3蛋白相互作用。

根据玉米着丝粒特异性元件CentA的结构和性质，看来它是反转录转座子(Ananiev等(1998)Proc Natl Acad Sci USA 95：13073-13078；GenBank AF078917)。玉米的另一高度保守的着丝粒特异性反转录转座子CRM2于2003年发现(Nagaki等(2003)Genetics 163：759-770；GenBank AY129008)。通过公开的两个玉米着丝粒BAC克隆DNA序列(Nagaki等(2003)Genetics 163：759-770)和有产权的玉米基因组DNA序列(Ananiev(2005)未公开)的比较分析，鉴定出第4个着丝粒特异性反转录转座子CRM1(SEQ ID NO：3)。在密切相关物种的着丝粒重复元件中检测到某些同源性，所述物种例如高粱和甘蔗(Miller等(1998)Genetics 150：1615-1623；Nagaki等(1998)Chromosome Res 6：295-302；Zwick等(2000)Am J Bot 87：1757-1764)；以及玉米和水稻(Ananiev等(1998)Proc Natl Acad Sci USA 95：13073-13078)；Cheng等(2002)Plant Cell 14：1691-1704)。

另外，植物着丝粒含有冗余反转录转座子(CR)，在谷物中，许多CR元件属于高度保守的Ty3/gypsy元件种系发生进化枝(Miller等(1998)Theor Appl Genet 96：832-839；Presting等(1998)Plant J 16：721-728；Langdon等(2000)Genetics 156：313-325)。DNA同源性足够高，使得来自高粱或短柄草(Brachypodium sylvaticum)的CR探针可鉴定大多数或所有农业上重要谷物的着丝粒，这些谷物例如水稻、玉米、小麦、高粱、大麦和黑麦(Aragon-Alcaide等(1996)Chromosoma105：261-268；Jiang等(1996)Proc Natl Acad Sci USA 93：14210-14213；Miller等(1998)Theor Appl Genet 96：832-839)。

反转录转座子(也称为进化枝I转座元件)由2个亚型(长末端重复序列(LTR)和非LTR反转录转座子)组成。长末端重复序列亚型具有直接LTR，其大小范围为～100bp至5kb。根据LTR反转录转座子的序列相似性程度和所编码基因产物的顺序，将其进一步分为Ty1-copia样组(Pseudoviridae)和Ty3-gypsy样组(Metaviridae)。反转录转座子的Ty1-copia组和Ty3-gypsy组通常在大基因组植物中具有高拷贝数(每个单倍体核中高达几百万拷贝)。Ty1-copia反转录转座子在包括单细胞藻类到苔藓植物、裸子植物和被子植物在内的物种中含量丰富。Ty3-gypsy反转录转座子的分布也很广泛，包括裸子植物和被子植物。LTR反转录转座子占人类基因组的约8％。非LTR反转录转座子由两个亚型(长散在核元件(LINE)和短散在核元件(SINE))组成。它们在植物中也具有高拷贝数(高达250,000)。有关植物转座子(包括反转录转座子)的综述可参见Feschotte等(2002)Nat Rev Genet 3：329-341。有关植物反转录转座子的综述可参见Kumar和Bennetzen(1999)Ann Rev Genet 33：479-532。

根据用于系统发育和分类学研究的逆转录元件统一分类，可以鉴别着丝粒反转录转座子。完整的反转录元件和逆转录病毒包含编码单种蛋白或多蛋白的两个或更多个可读框(ORF)。元件中基因的顺序不同，根据逆转录酶(RT)、RNA酶H 15(RH)、整合酶(INT)和天冬氨酸蛋白酶(PR)基因和保守半胱氨酸-组氨酸(CH)锌指样结构域中的氨基酸比对和关键保守残基或结构域来分类。反转录元件也包含侧接反转录元件内部区的长末端重复(LTR)序列。反转录转座子的每个家族都具有不同的非交叉杂交LTR，家族内的组分在其LTR序列中可不同(0-50％)。在转座过程中，两个LTR在插入时间通常相同，但随时间变化，替代可引起序列趋异。已知许多反转录元件，包括着丝粒特异性反转录转座子(参见例如SanMiguel等(1998)Nat Genet 20：43-45；Turcotte等(2001)Plant J 25：169-179；Feng等(2002)Nature 420：316；Nagaki等(2004)Nat Genet 36：138；Nagaki等(2003)Genetics163：750-770：Wu等(2004)Plant Cell 16：967-976；Hansen和Haslop-Harrison(2004)Adv Bot Res 41：165-193)。

就相对大小和重复序列组成而言，不同玉米染色体着丝粒之间存在明显差异。在玉米不同染色体中，CentC簇可小至约100kb或大于约2000kb，但是常见范围为约200kb至约300kb。假设更小的大小范围，可能在单个BAC克隆中发现玉米着丝粒区的完整中心部分。所观察到的结构多态性表明，玉米着丝粒由多个功能性区组(block)组成，每个区组都可支持着丝粒功能。在不同玉米染色体中观察到受到CentC着丝粒串联重复序列的长度和/或拷贝数限制的着丝粒大小上的显著(至少10倍)差异。在不同的近交系的同源染色体着丝粒之间也具有明显差异。

另一方面，本发明的人工植物微染色体可包含至少一个功能性端粒。

端粒是线状真核染色体末端的核蛋白封端(cap)，是维持染色体末端必不可少的。端粒DNA是通过端粒末端转移酶、具有逆转录酶活性的核糖核蛋白而合成的(McKnight等(2002)Plant Mol Biol48：331-337)。端粒末端转移酶通过在其RNA亚基内拷贝短模板序列，而将端粒DNA加到染色体3′端。大多数生物的端粒由高度保守的不对称短重复序列组成。

已知许多端粒重复序列，包括CCCCAA(C₄A₂，四膜虫属(Tetrahymena)和草履虫属(Paramectum))；C4A4(尖毛虫属(Oxytricha)和游仆虫属(Euplotes))；C3TA(锥虫属(Trypanosoma)、利什曼原虫属(Leishmania)和绒泡菌属(Physarum))；C1-3A(酵母属(Saccharomyces))；C1-8T(网柄菌属(Dictyostelium))；和C3TA3(拟南芥属(Arabidopsis)、人类、小鼠、新小杆线虫属(Caenrhabditis))。在各生物的天然染色体中观察到的重复序列数差异很大，例如某些纤毛虫具有约50个重复序列，而在拟南芥中观察到小于350个重复序列，在酵母属中观察到重复序列共约300-500bp。

植物的端粒长度(通常范围为约2-75kb)受到遗传因素和发育因子的控制。已经从拟南芥中分离出端粒区，显示串联重复序列的大小不同(Richards和Ausubel，(1988)Cell 53：127-136)。在玉米近亲交配系中，端粒长度有25倍差异，范围为小于2kb(WF9系)至约40kb(CM37系)(Burr等(1992)Plant Cell4：953-960)。越靠近着丝粒，经常发现正则端粒重复序列与植物基因组的其它重复元件混合。相比之下，果蝇属(Drosophila)在其染色体末端使用转座子。在每条染色体末端都发现多拷贝的转座子(HeT-A和TART元件)。通过新转座子重复序列转座到末端，可以逆转端粒的逐渐缩短。与端粒末端转移酶对端粒的维持类似，果蝇的转座模型采用这样的机制：使用RNA转座媒介，通过逆转录酶将其转化到末端DNA上。

DNA复制是这样的过程：通过该过程，细胞在细胞分裂前制造其遗传信息的一个完整拷贝。在大肠杆菌(E.coli)、哺乳动物病毒和酿酒酵母(S.cerevisiae)中，DNA复制的起始受到反式作用起始蛋白的控制，反式作用起始蛋白又与顺式作用DNA复制基因序列相互作用。对于酿酒酵母，复制基因包含100-200bp并包括DNA合成开始的主要复制起始位点。这些复制基因含有保守11bp自主复制序列(ARS)，其结合起始识别复合物(ORC)产生前复制复合物(prereplication complex)的核酸形成(Gilbert(2001)Science 294：96-100)。

在高等真核生物中，DNA复制可在成百上千个染色体位点上同时开始。限定的起点序列是不需要的，存在许多潜在复制起点，由接近间隔的起始位点的广泛区域组成，其中的有些可能会频繁使用。

然而，已知若干特定真核细胞的复制起点，例如18S-26S rDNA的复制起点，其位于非转录间隔区内(Ivessa和Zakian(2002)Genes Dev16：2459-2464)。该区能促进转基因构建体的扩增(Hemann等(1994)DNA Cell Biol 13：437-445)。另一特定起点是在中国仓鼠卵巢(CHO)细胞的二氢叶酸还原酶(DHFR)基因下游区内发现的(Altman和Fanning(2001)Mol Cell Biol 21：1098-1110)。在含有chorion基因的果蝇染色体区段中也发现了优选的复制起始位点(Levine和Spradling(1985)Chromosoma 92：136-142)。

动植物细胞的复制机器很可能可复制任何类型的渐渗DNA，包括整合构建体、附加体、完整染色体或其片段(Gilbert(2001)Science294：96-100)。

人工微染色体是由顺式作用DNA序列元件构建的线状或环状DNA分子，所述元件负责适当复制并将染色体分配给子细胞。顺式作用元件包括：复制起点(ori)，DNA复制的起始位点(也称为自主复制序列(ARS))；着丝粒，动粒装配位点，用于在有丝分裂和减数分裂中适当分离复制的染色体；和端粒，特化DNA重复序列结构，其可使线状染色体末端稳定并促进染色体末端的完全复制。

产生真核微染色体的若干策略是可行的，包括但不限于：通过真核细胞中的内源细胞染色体维持机器，自组分元件体内自我装配微染色体，自原核细胞中的组分元件装配真核微染色体，以及自组分元件体外装配真核微染色体。

人工微染色体首先是在酿酒酵母中构建的(Murray等(1986)Mol Cell Biol 6：3166-3172；Blackburn和Szostak(1984)Ann Rev Biochem 53：163-194)。通过常规重组DNA技术，装配环状质粒，其包含酵母125bp着丝粒、复制起点、选择标记和回文排列的两个延伸端粒DNA，然后通过原生质球转化引入酵母，在其中成为简单线状分子。含着丝粒、复制起点和两个端粒且长度为50kb的线状构建体，在有丝分裂时复制并分离，准确度为～99％，并在分裂培养物中维持至少20代。YAC的世代显示出在其它真核生物例如动植物中装配人工染色体的潜力。在YAC上进行的实验表明，需要3个顺式作用DNA序列以构建人工染色体：端粒、复制起点和着丝粒。

可通过两种不同方法产生动物人工染色体：自克隆DNA区段，从头合成染色体；或通过天然染色体的断裂和重排(Brown等(2000)Trends Biotechnol 18：402-403；Cooke(2001)Cloning Stem Cells 3：243-249；Lipps等(2003)，Gene 304：23-33)。从头合成方法(即装配或自下而上(bottom-up)方法)通过组合必需的克隆组分产生人工染色体。用人类alphoid DNA、端粒、人类基因组DNA和选择标记的混合物共转染HT1080细胞，导致形成微染色体(Harrington等(1997)Nat Genet 15：345-355)。

微染色体的表征表明，它们都具有复杂的细胞遗传结构，并且在没有任何选择时能稳定维持。结论是，可通过复合物重排，自输入DNA从头合成微染色体及其着丝粒。此后，其它研究小组也使用HT1080细胞以引入含人alphoid DNA和在YAC、PAC或BAC中克隆的端粒的线状或环状DNA构建体(Compton等(1999)Nucl Acids Res 27：1762-1765；Grimes等(2001)EMBO Rep 2：910-914)。观察到不同频率的微染色体，显示出不同的有丝分裂稳定性。所产生的所有微染色体都明显大于原始构建体，变动范围为5-10Mb。因此，可自克隆DNA(作为从头装配的主链)开始产生完整功能的哺乳动物染色体。

保留着丝粒和端粒区的天然染色体的断裂和重排是产生微染色体的另一策略。小染色体片段可通过脉冲场凝胶电泳进行分离，用所需基因改型，再重新导入宿主细胞中。在辐射后，在癌细胞和其它细胞类型中观察到断裂的微染色体，但是，片段太大则无法分离，而且无法控制基因组成。

一个控制降低染色体大小的方法是根据端粒相关的染色体断裂(TACF)或端粒定向截短(TDT)(Heller等(1996)Proc Natl Acad Sci USA 93：7125-7130；Shen等(1997)Hum Mol Genet 6：1375-1382)。该方法涉及特定人类宿主染色体连续断裂成较小的微染色体，使用打靶载体，其包含末端端粒区段、选择标记和有时包含靶染色体的同源区。所得“工程微染色体”保留自主并能正常分离。已经产生小至0.5Mb的微染色体，其含有alphoid DNA，作为人、仓鼠-人体细胞杂合系或鸡细胞的功能性着丝粒序列。

目前，人类人工染色体用于产生转染色体-克隆的牛，其能产生人免疫球蛋白。在同源重组的鸡DT40细胞中，由Cre/loxP介导的染色体易位和端粒定向的染色体截短而构建人类微染色体(HAC)载体，通过微细胞介导的染色体转移(MMCT)，将该载体导入牛的原代胎儿成纤维细胞。将来自具有HAC的胎儿成纤维细胞的分离核转移到去核的成熟卵母细胞中，产生克隆牛(Kuroiwa等(2002)Nat Biotechnol20：889-894)。根据诱导哺乳动物细胞内在的大规模扩增机制，已经开发出在体内产生人工染色体的方法。将着丝粒随体DNA和非转录的rDNA间隔区定向整合到特定染色体上，导致着丝粒区的大规模扩增。这些扩增的染色体不稳定，经历明显重排，产生优先由随体DNA组成的稳定微染色体(Kereso等(1996)Chromosome Res 4：226-239；Hadlaczky(2001)Curr Opin Mol Ther 3：125-132)。

开发出含多个序列特异性重组接受位点的人工染色体(ACE平台)。在打靶载体中提供目标序列，用λ(lambda)整合酶催化ACE平台和打靶载体间的重组。

在植物中也观察到类似过程。观察到植物天然染色体的自发断裂。在拟南芥(Murata等(2006)Chromosoma，2006年4月11日在线公布)和玉米(Brock和Pryor(1996)Chromosoma 104：575-584；Kato等(2005)Cytogenet Genome Res 109：156-165)中发现了微染色体。在某些情况下，电离辐射可诱导微染色体(Riera-Lizarazu等(2000)Genetics 156：327-339)。

已经构建了水稻着丝粒5的物理图谱，可用于产生水稻人工染色体(Nonomura和Kurata，(2001)Chromosoma 110：284-291)。提出构建人工染色体的类似方法，用于平匐甜菜(Beta procumbens)(Gindullis等(2001)Genome 44：846-855)。在植物转化事件中可发现转基因构建体多联体化、连接和重排。用标准构建体的通用植物转化可产生复杂的重排、多联体化和构建体扩增(Svitashev和Somers(2001)Genome 44：691-697；Svitashev等(2002)Plant J 32：443-445)。用多个质粒共转化植物，可产生含不同转基因组合的转基因基因座(Wu等(2002)Transgene Res 11：533-541)。类似于在动物细胞中进行的研究，在植物细胞中可通过各组分的自发多联体化和连接，从头装配人工微染色体(参见图1-10和14-15)。

本发明涉及包含功能性着丝粒的人工植物微染色体，其中着丝粒与着丝粒蛋白C特异性结合。

动粒将着丝粒DNA与纺锤丝连接在一起。在着丝粒附近特异性结合的人类自身抗体可促进着丝粒相关蛋白的克隆(CENP，Rattner(1991)Bioassays 13：51-56)。这些蛋白质中的至少一种属于微管动力蛋白的驱动蛋白超家族(Yen(1991)EMBO J 10：1245-1254)。通过遗传和生化研究已经鉴定出酵母着丝粒结合蛋白(Bloom(1993)Cell73：621-624；Lechner等(1991)Cell 64：717-725)。CENH3是取代着丝粒中的组蛋白H3的高度保守蛋白，认为它能募集染色体运动所需的其它蛋白质。CENH3在整个细胞周期中都存在，并与减数分裂细胞中的动粒着丝粒蛋白C(CENPC)共同定位。

可使用着丝粒相关蛋白的特异性抗体，以证实DNA构建体和/或微染色体中的着丝粒装配。CENP(例如CENH3和/或CENPC)免疫定位在微染色体着丝粒上，表明形成包含着丝粒DNA元件和相关结合蛋白的功能性着丝粒。制备针对玉米着丝粒组蛋白H3(CENH3，17kD)的抗血清，并在天然玉米染色体上进行了测试(Zhong等(2002)Plant Cell 14：2825-2836)。染色质免疫沉淀表明，CentC和CRM2与CENH3特异性相互作用。约38％和33％CentC和CRM2在染色质免疫沉淀测定中沉淀下来，证明大部分CENH3与CentC共同定位。Dawe等((1999)Plant Cell 11：1227-1238)分离出哺乳动物CENPC的玉米同源物，其显示出是玉米动粒的组分。使用来自氨基端结构域的20个氨基酸的保守肽，产生对玉米CENPC具有特异性的抗血清，其经直接标记并用于证明CENPC特异性定位到玉米天然和人工微染色体的着丝粒上(参见例如图3、4、8和10)。

着丝粒重复元件CentA、CentC、CRM1和CRM2包括与SEQ ID NO：1-4中的CentA、CentC、CRM1和CRM2的玉米序列基本相同的序列。基本相同的序列包括彼此高度同源的序列，例如具有显著％序列同一性和/或在严格性条件下与CentA、CentC、CRM1或CRM2(SEQ ID NO：1-4)或其互补序列选择性杂交。在严格性杂交条件下选择性杂交的序列包括这样的序列：其与靶序列杂交比背景至少高2倍并可基本上排除非靶核酸。选择性杂交序列通常与靶序列具有约至少80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性。可使用本领域已知的任何合适杂交条件和缓冲液，其实例在本文中有描述。序列同一性可用于比较两个多核苷酸或多肽序列的一级结构。序列同一性测定两个序列中的相同残基，当比对最大对应性时。可用计算机执行的算法来分析序列关系。两个或更多个多核苷酸、或者两个或更多个多肽之间的序列关系测定如下：通过测定序列的最佳比对，给比对中的匹配和空位打分，得到％序列同一性和％序列相似性。根据比较各自所编码的多肽，也可描述多核苷酸的关系。已知许多用于序列比较和分析的程序和算法。除非另有说明，否则本文提供的序列同一性/相似性值是指用GAP第10版(GCG，Accelrys，San Diego，CA)并用以下参数得到的值：对于核苷酸序列的％同一性和％相似性，用空位权重(GAP Weight)为50和长度权重(Length Weight)为3，nwsgapdna.cmp打分矩阵；对于氨基酸序列的％同一性和％相似性，用空位权重(GAP Weight)为8和长度权重(Length Weight)为2，BLOSUM62打分矩阵(Henikoff和Henikoff(1992)Proc Natl Acad Sci USA 89：10915-10919)。GAP使用Needleman和Wunsch((1970)J Mol Biol 48：443-453)的算法，得到两个完整序列最大匹配数和最小空位数的比对。基本相同包括具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列，其中序列有望保留天然功能，根据总体％序列同一性、序列相似性、一级序列的总体比对、保守残基区组的存在、保守元件和/或结构域的存在、保守功能性结构域的存在、结合区的存在、催化残基的存在、预测的二级和/或三级结构、已知三维结构的可利用性和本领域技术人员采用的其它标准，来鉴定和预测任何特定序列的功能性同源序列。

与天然多核苷酸相比，多核苷酸变异体包括在5′端、3′端、和/或内部位点(包括内含子或外显子)中的至少一个具有至少一个缺失、添加和/或取代的多核苷酸。多核苷酸变异体包括天然存在的变异体以及人工衍生的多核苷酸，例如，用定点诱变产生的那些。保守变异体包括这样的序列：与天然多核苷酸相比，所述序列保留其功能，编码相同的多肽，或编码具有基本类似的同一性、功能和/或活性的多肽变异体。用聚合酶链式反应(PCR)和/或杂交技术等已知技术可鉴定变异体。通常，特定多核苷酸的变异体与特定多核苷酸具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性。也可采用标准比对程序和参数，通过比较所编码多肽间的％序列同一性，评价多核苷酸变异体。当通过比较各自所编码的两个多肽共享的％序列同一性时，这两个所编码的多肽的％序列同一性通常为至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。

与天然多肽相比，蛋白变异体包括在N-末端、C-末端和/或内部位点中的至少一个具有至少一个缺失、添加和/或取代的蛋白质。蛋白变异体具有蛋白质所需生物活性。变异体包括天然存在的多肽，以及通过人工操作的那些。经序列比对程序测定，蛋白质的生物活性变异体通常与天然蛋白的氨基酸序列具有至少约40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。蛋白质的生物活性变异体与所述蛋白质的差异可能仅在1-15个氨基酸残基上。保守取代通常是指一个氨基酸被另一个具有相似特性的氨基酸交换。例如Dayhoff等(1978)Atlas of Protein Sequence and Structure(Natl Biomed Res Found，Washington，D.C.)的模型提供了不希望影响蛋白质生物活性的氨基酸取代的指南。

多核苷酸和蛋白质变异体包含来自诱变和/或重组方法(例如诱变和/或DNA改组)的序列。诱变和改变核苷酸序列的方法是已知的(参见例如Kunkel(1985)Proc Natl Acad Sci USA 82：488-492；Kunkel等(1987)Methods Enzymol 154：367-382；美国专利4,873,192；Walker和Gaastra编著(1983)Techniques in Molecular Biology(MacMillan Publ.Co.，NY)及其中引用的参考文献)。例如，可操作一个或多个不同的重组酶编码序列，产生和选择具有所需特性的新的重组酶蛋白。通常，从相关序列群体中产生重组多核苷酸文库，并且可在体外或体内同源重组(参见例如Stemmer(1994)Proc Natl Acad Sci USA 91：10747-10751；Stemmer(1994)Nature 370：389-391；Crameri等(1997)Nat Biotechnol 15：436-438；Moore等(1997)J Mol Biol 272：336-347；Zhang等(1997)Proc Natl Acad Sci USA 94：4504-4509；Crameri等(1998)Nature 391：288-291；和美国专利5,605,793和5,837,458)。通常，编码多肽的多核苷酸的修饰不应改变读框，或产生和/或改变DNA或mRNA的二级结构。参见EP专利申请公布号75,444。

重叠寡核苷酸(缩写为overgo)是长度跨越约40bp的引物对，通常由在3′端具有8bp重叠区的2个24bp寡核苷酸组成。该特征允许重叠寡核苷酸引物对彼此引导，并通过克列诺(Klenow)填补法，用标记核苷酸合成其互补链(McPherson(1999)Genome Analysis：A Laboratory Manual，4：207-213，Birren等主编，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY)。可使用各种标记核苷酸，包括但不限于放射性标记的核苷酸或荧光标记的核苷酸。这用于产生探针，用于不同的杂交方法，包括但不限于菌落杂交、斑点印迹、DNA印迹和原位杂交，例如FISH。对于文库杂交而言，与常规探针相比，重叠寡核苷酸探针的主要优势在于可选择用于设计重叠寡核苷酸的序列，因此可避免常规DNA片段探针中存在的重复序列；因此，可减少大基因组DNA文库筛选中经常会出现的交叉杂交问题。因为有该优势，所以重叠寡核苷酸杂交结合探针库策略(Cai等(1998)Genomics 54：387-397；Chang等(2001)Genetics 159：1231-1242；Tao等(2001)Genetics 158：1711-1724；Romanov等(2003)Cytogenet Genome Res 101：277-281)已经成为用于高通量BAC文库筛选的方法，用于克隆鉴定和物理基因作图。

在某些实例中，与DNA构建体一起或在该构建体内提供可增强或刺激细胞生长的基因或所编码的多肽。增强或刺激细胞生长的基因包括这样的基因：其参与转录调节、同源异型基因调节、干细胞维持和增殖、细胞分裂和/或细胞分化，例如WUS同源序列(Mayer等(1998)Cell 95：805-815；WO01/0023575；US2004/0166563)；aintegumenta(ANT)(Klucher等(1996)Plant Cell 8：137-153；Elliott等(1996)Plant Cell 8：155-168；GenBank检索号U40256、U41339、Z47554)；clavata(例如CLV1、CVL2、CLV3)(WO03/093450；Clark等(1997)Cell 89：575-585；Jeong等(1999)Plant Cell 11：1925-1934；Fletcher等(1999)Science 283：1911-1914)；Clavata和Embryo Surround region基因(例如CLE)(Sharma等(2003)Plant Mol Biol 51：415-425；Hobe等(2003)Dev Genes Evol 213：371-381；Cock和McCormick，(2001)Plant Physiol 126：939-942；Casamitjana-Martinez等(2003)Curr Biol 13：1435-1441)；baby boom(例如BNM3、BBM、ODP1、ODP2)(WO00/75530；Boutileir 等(2002)Plant Cell 14：1737-1749)；Zwille(Lynn等(1999)Dev 126：469-481)；leafy cotyledon(例如Lec1、Lec2)(Lotan等(1998)Cell93：1195-1205；WO00/28058；Stone等(2001)Proc Natl Acad Sci USA 98：11806-11811；美国专利6,492,577)；Shoot Meristem-less(STM)(Long等(1996)Nature 379：66-69)；ultrapetala(ULT)(Fletcher(2001)Dev 128：1323-1333)；促分裂原激活蛋白激酶(MAPK)(Jonak等(2002)Curr Opin Plant Biol 5：415)；激酶相关蛋白磷酸酶(KAPP)(Williams等(1997)Proc Natl Acad Sci USA 94：10467-10472；Trotochaud等(1999)Plant Cell 11：393-406)；ROP GTPase(Wu等(2001)Plant Cell 13：2841-2856；Trotochaud等(1999)Plant Cell 11：393-406)；fasciata(例如FAS1、FAS2)(Kaya等(2001)Cell 104：131-142)；细胞周期基因(美国专利6,518,487；WO99/61619；WO02/074909)、Shepherd(SHD)(Ishiguro等(2002)EMBO J 21：898-908)；Poltergeist(Yu等(2000)Dev 127：1661-1670；Yu等(2003)Curr Biol 13：179-188)；Pickle(PKL)(Ogas等(1999)Proc Natl Acad Sci USA 96：13839-13844)；knox基因(例如KN1、KNAT1)(Jackson等(1994)Dev 120：405-413；Lincoln等(1994)Plant Cell 6：1859-1876；Venglat等(2002)Proc Natl Acad Sci USA 99：4730-4735)；受精独立性胚乳(fertilization independent endosperm(FIE)(Ohad等(1999)Plant Cell 11：407-415)等等。多核苷酸组合包括多拷贝的任何一个目标多核苷酸，而且组合可具有上调和下调所组合多核苷酸表达的任何组合。组合可以在或不在一个用于转化宿主细胞的构建体上组合，因此可相继或同时提供。宿主细胞可以是野生型或突变型的细胞，以正常或非整倍体状态。

位点特异性重组酶系统可以与任何微染色体系统一起使用。在植物细胞中建立了DNA构建体或微染色体之后，能催化正向和反向反应的整合酶和重组酶都可用于引入修饰。可进行不同分子内的修饰，例如给定序列的缺失或倒位。此外，可进行分子间的插入和交换，包括用含有相容的位点特异性重组位点的内源染色体来易位。也可使用重组酶系统，在微染色体内建立靶位点(泊靠位点)，用于随后通过任何方法(包括杂交或直接递送)进行目标多核苷酸的位点特异性整合。

可使用来自重组系统的元件，例如重组酶和重组位点，例如在DNA构建体内、靶位点和/或转移盒中。靶位点包括整合到基因组的多核苷酸，所述多核苷酸包含有效连接至少一个重组位点的启动子。转移盒包括有效连接目标多核苷酸和/或编码选择标记的多核苷酸的至少一个第一重组位点，其中第一重组位点是用靶位点中的重组位点重组产生的。中靶种子或植物已将DNA构建体稳定结合在其基因组中，所述构建体是通过使用重组系统而产生和/或操作的。可以采用导致不同整合、改变和/或切除事件而产生所述的DNA构建体的位点特异性重组方法，得到中靶种子。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855、WO99/25853、WO99/23202、WO99/55851、WO01/07572、WO02/08409和WO03/08045。

重组酶是在其相容重组位点间催化位点特异性重组的多肽，包括天然存在的重组酶序列、变异体和/或保留活性的片段。重组位点是由重组酶特异性识别的核苷酸序列，包括天然存在的重组位点序列、变异体和/或保留活性的片段。有关位点特异性重组酶的综述可参见Sauer(1994)Curr Op Biotech 5：521-527；Sadowski(1993)FASEB 7：760-767；Groth和Calos，(2004)J Mol Biol 335：667-678；和Smith和Thorpe(2002)Mol Microbiol 44：299-307。任何重组系统或系统组合都可采用，包括但不限于重组酶和来自整合酶和/或解离酶家族的重组位点、生物活性变异体和其片段、和/或任何其它天然存在的或重组产生的酶或其变异体(其催化特定重组位点间的保守位点特异性重组)、和天然存在的或修饰的重组位点或其变异体(其由重组酶特异性识别而产生重组事件)。

所用的重组位点可以是相应位点或不相似位点。相应重组位点、或一组相应重组位点是具有相同核苷酸序列的位点。在合适重组酶存在下，一组相应重组位点将会与彼此有效重组。不相似重组位点具有不同序列，彼此间含有至少一个核苷酸差异。一组不相似重组位点中的重组位点可以彼此重组或不重组。一组不相似位点中的每个重组位点都具有生物活性，可以与相同位点重组。在合适重组酶的存在下，致重组位点能彼此重组。致重组位点包括这样的位点：其中在切除测定中，在标准条件下，与野生性对照相比，致重组位点之间重组的相对切除效率在检出限之上，通常高出2％、5％、10％、20％、50％、100％或更高。在合适重组酶存在下，非致重组位点彼此不重组，或位点之间的重组无法检出。非致重组的重组位点包括这样的位点：在切除测定中，在标准条件下，与野生性对照相比，其彼此重组的频率低于检出限，通常低于2％、1.5％、1％、0.75％、0.5％、0.25％、0.1％、0.075、0.005％、0.001％。任何合适的非致重组的重组位点都可利用，包括FRT位点或其活性变异体、lox位点或其活性变异体、att位点或其活性变异体、其任何组合、或非致重组的重组位点的任何其它组合。一组致重组的重组位点中的同向重复的重组位点以同一方向排列，这些位点之间的重组导致间插DNA序列的切除。一组致重组的重组位点中的反向重组位点以相反方向排列，这些位点之间的重组导致间插DNA序列的倒位。

重组酶的整合酶家族成员超过100个，包括例如FLP、Cre、Dre、Int和R。对于整合酶家族的其它成员，参见例如Esposito等(1997)Nucl Acids Res 25：3605-3614；Nunes-Duby等(1998)Nucl Acids Res 26：391-406；Abremski等(1992)Protein Eng 5：87-91；Groth和Calos，(2004)J Mol Biol 335：667-678；和Smith和Thorpe，(2002)Mol Microbiol 44：299-307。其它重组系统包括例如链霉菌噬菌体phiC31(Kuhstoss 等(1991)J Mol Biol 20：897-908)；噬菌体λ(Landy，(1989)Ann Rev Biochem 58：913-949和Landy，(1993)Curr Op Genet Dev 3：699-707)；希氏硫化叶菌(Sulfolobus shibatae)的SSV1位点特异性重组系统(Maskhelishvili等(1993)Mol Gen Genet 237：334-342)；和基于逆转录病毒整合酶的整合系统(Tanaka等(1998)Gene 17：67-76)。在某些实例中，重组酶是不需要辅因子或超螺旋底物的酶。这样的重组酶包括Cre、FLP、phiC31 Int、突变λInt、R、SSV1、Dre或其活性变异体或其片段。FLP重组酶催化两个FRT位点间的位点特异性反应，并在DNA复制期间参与扩增酿酒酵母2μ质粒的拷贝数。FLP蛋白已克隆并表达。参见例如Cox，(1993)Proc Natl Acad Sci USA 80：4223-4227。所用的FLP重组酶可来自酵母属。在某些实例中，采用由植物优选密码子编码的重组酶合成的多核苷酸。由包含玉米优选密码子的核苷酸序列编码的催化位点特异性重组事件的FLP酶(FLPm)是已知的(美国专利5,929,301)。额外的功能性变异体和FLP片段是已知的。参见例如Buchholz等(1998)Nat Biotechnol 16：617-618，Hartung等(1998)J Biol Chem 273：22884-22891，Saxena等(1997)Biochim Biophys Acta 1340：187-204，Hartley等(1980)Nature 286：860-864，Shaikh和Sadowski，(2000)J Mol Biol 302：27-48，Voziyanov等(2002)Nucl Acids Res 30：1656-1663和Voziyanov等(2003)J Mol Biol 326：65-76。噬菌体P1重组酶Cre催化两个lox位点之间的位点特异性重组。参见例如Guo等(1997)Nature 389：40-46；Abremski等(1984)J Biol Chem 259：1509-1514；Chen等(1996)Somat Cell Mol Genet 22：477-488；Shaikh等(1977)J Biol Chem 272：5695-5702；和Buchholz等(1998)Nat Biotechnol 16：617-618。Cre多核苷酸序列也可使用植物优选密码子来合成，例如moCre(参见例如WO 99/25840)，其它变异体是已知的，参见例如Vergunst等(2000)Science 290：979-982，Santoro和Schulz(2002)Proc Natl Acad Sci USA 99：4185-4190，Shaikh和Sadowski(2000)J Mol Biol 302：27-48，Rufer和Sauer(2002)Nucl Acids Res 30：2764-2771，Wierzbicki等(1987)Mol Biol 195：785-794，Petyuk等(2004)J Biol Chem 279：37040-37048，Hartung和Kisters-Wolke(1998)J Biol Chem 273：22884-22891，Koresawa等(2000)J Biochem(Tokyo)127：367-372，美国专利6,890,726和Buchholz和Stewart(2001)Nat Biotechnol 19：1047-1052。在P1相关噬菌体中已经鉴定出Cre同源序列，从噬菌体D6中分离的重组酶称为Dre，它是与Cre密切相关的酪氨酸重组酶，但它识别不同32bp rox位点(Sauer和McDermott(2004)Nucl Acids Res 32：1-10)。phiC31整合酶和变异体是已知的(Kushtoss等(1991)J Mol Biol 222：897-908，WO03/066867，WO05/017170，US2005/0003540和Sclimenti等(2001)Nucl Acids Res 29：5044-5051。λ整合酶和辅因子(Hoess等(1980)Proc Natl Acad Sci USA 77：2482-2486，Blattner等(1997)Science 277：1453-1474)及其变异体是已知的，包括辅因子-独立型Int变异体(Miller等(1980)Cell 20：721-729，Lange-Gustafson和Nash(1984)J Biol Chem 259：12724-12732，Christ等(1998)J Mol Biol 288：825-836和Lorbach等(2000)J Mol Biol 296：1175-1181)、att位点识别变异体(Dorgai等(1995)J Mol Biol 252：178-188，Yagu等(1995)J Mol Biol 252：163-167和Dorgai等(1998)JMol Biol 277：1059-1070)、以及玉米密码子优化的Int、变异体和辅因子序列(WO03/08045)。其它整合酶和变异体是已知的，例如HK022整合酶(Kolot等(1999)Mol Biol Rep 26：207-213)和变异体，例如att位点识别变异体(Dorgai等(1995)J Mol Biol 252：178-188，Yagu等(1995)JMol Biol 252：163-167和Dorgai等(1998)J Mol Biol 277：1059-1070)。

野生型重组位点、突变型或者野生型和/或突变型位点的任何组合都可使用。这样的重组位点包括例如野生型的lox、FRT和att位点，以及突变型的lox、FRT和att位点。突变型lox位点的重组活性分析可参见Lee等(1998)Gene 216：55-65。其它重组位点和变异体是已知的，参见例如Hoess等(1982)Proc Natl Acad Sci USA 79：3398-3402；Hoess等(1986)Nucl Acids Res 14：2287-2300；Thomson等(2003)Genesis 36：162-167；Schlake和Bode(1994)Biochemistry 33：12746-12751；Siebler和Bode(1997)Biochemistry 36：1740-1747；Huang等(1991)Nucl Acids Res 19：443-448；Sadowski(1995)载于Progress in Nucleic Acid Research and Molecular Biolory 51：53-91；Cox(1989)载于Mobile DNA，Berg和Howe(主编)American Society of Microbiology，Washington D.C.，第116-670页；Dixon等(1995)Mol Microbiol 18：449-458；Umlauf 和Cox(1988)EMBO J 7：1845-1852；Buchholz等(1996)Nucl Acids Res 24：3118-3119；Kilby等(1993)Trends Genet 9：413-421；Rossant和Geagy (1995)Nat Med 1：592-594；Bayley等(1992)Plant Mol Biol 8：353-361；Odell等(1990)Mol Gen Genet 223：369-378；Dale和Ow(1991)Proc Natl Acad Sci USA 88：10558-10562；Qui等(1994)Proc Natl Acad Sci USA 91：1706-1710；Stuurman等(1996)Plant Mol Biol 32：901-913；Dale等(1990)Gene 91：79-85；Albert等(1995)Plant J 7：649-659，美国专利6,465,254，WO01/23545，WO99/55851和WO01/11058。在某些实例中，可使用多组不相似和相应重组位点，例如来自不同重组系统的位点。因此，任何合适的重组位点或重组位点组都可使用，包括FRT位点、FRT位点的生物活性变异体、lox位点、lox位点的生物活性变异体、att位点、att位点的生物活性变异体、其任何组合或重组位点的任何其它组合。FRT位点的实例包括例如最小野生型FRT位点(FRT1)和各种突变型FRT位点，包括但不限于FRT5、FRT6和FRT7(参见美国专利6,187,994)。额外的变异FRT位点是已知的，(参见例如WO01/23545和美国专利申请公布说明书2007/0015195，通过引用结合到本文中)。可使用的其它重组位点包括att位点，例如以下文献中公开的那些：Landy(1989)Ann Rev Biochem 58：913-949，Landy(1993)Curr Op Genet Dev 3：699-707，美国专利5,888,732，WO01/07572和Thygarajan等(2001)Mol Cell Biol 21：3926-3934。所用的位点特异性重组酶取决于靶位点和转移盒中的重组位点。如果使用FRT位点，则提供FLP重组酶，当使用lox位点时，则提供Cre重组酶，当使用λatt位点时，则提供λInt，当使用phiC31 att位点时，则提供phiC31 Int。如果所用的重组位点包括来自不同系统的位点，例如FRT和lox位点，可提供这两种重组酶活性，无论是作为独立的实体还是嵌合重组酶，例如FLP/Cre(参见例如WO 99/25840)。

提供标记，用于鉴定和/或选择表达标记的细胞、植物和/或种子。标记包括例如筛选标记、可见标记和/或选择标记。选择标记是任何这样的标记：当以足够量表达时，赋予对选择试剂的抗性。例如可使用可见标记鉴定含有导入DNA构建体的转化细胞。在一个实例中，可见标记是荧光蛋白。这样的荧光蛋白包括但不限于黄色荧光蛋白(YFP)、绿色荧光蛋白(GFP)、蓝色荧光蛋白(CFP)和红色荧光蛋白(RFP)。在再一个实例中，可见标记是由具有玉米优选密码子的多核苷酸所编码的。在又一个实例中，可见标记包括GFPm、AmCyan、ZsYellow或DsRed。参见Wenck等(2003)Plant Cell Rep.22：244-251。

选择标记及其相应选择试剂包括但不限于除草剂抗性基因和除草剂；抗生素抗性基因和抗生素；和其它化学抗性基因及其相应的化学试剂。细菌药物抗性基因包括但不限于新霉素磷酸转移酶II(nptII)(其赋予对卡那霉素、巴龙霉素、新霉素和G418的抗性)和潮霉素磷酸转移酶(hph)(其赋予对潮霉素B的抗性)。另见Bowen(1993)Markers for Plant Gene Transfer，Transgenic Plants，第1卷，Engineering and Utilization；Everett等(1987)Bio/Technology 5：1201-1204；Bidney等(1992)Plant Mol Biol 18：301-313；和WO97/05829。

若干类群也可赋予除草剂抗性，包括氨基酸合成抑制剂、光合作用抑制剂、脂质抑制剂、生长调节剂、细胞膜破坏剂、色素抑制剂、幼苗生长抑制剂，包括但不限于咪唑啉酮、磺酰脲、三唑并嘧啶、草甘膦、烯禾啶、

唑禾草灵、草铵膦、草丁膦、均三氮苯类、溴苯腈等。参见例如Holt(1993)Ann Rev Plant Physiol Plant Mol Biol 44：203-229；和Miki等(2004)J Biotechnol 107：193-232。选择标记包括赋予除草剂抗性的序列，包括但不限于bar基因，其编码赋予草铵膦抗性的膦丝菌素乙酰转移酶(PAT)(Thompson等(1987)EMBO J 6：2519-2523)；草甘膦氧化还原酶(GOX)、草甘膦N-乙酰转移酶(GAT)和5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS)，其赋予对草甘膦的抗性(Barry等，(1992)载于Biosynthesis and Molecular Regulation of Amino Acids in Plants，Singh等(主编)第139-145页；Kishore等(1992)Weed Tech 6：626-634；Castle(2004)Science 304：1151-1154；Zhou等(1995)Plant Cell Rep 15：159-163；WO97/04103；WO02/36782；和WO03/092360)。其它选择标记包括二氢叶酸还原酶(DHFR)，其赋予对甲氨蝶呤的抗性(参见例如Dhir等(1994)Improvements of Cereal Quality by Genetic Engineering，Henry(主编)，Plenum Press，New York；和Hauptmann等(1988)Plant Physiol 86：602-606)。乙酰羟酸合酶(AHAS或ALS)突变序列导致对咪唑啉酮类(imidiazolinones)和/或磺酰脲类(例如咪草烟和/或氯磺隆)的抗性(参见例如Zu等(2000)Nat Biotechnol 18：555-558；美国专利6,444,875和6,660,910；Sathasivan等(1991)Plant Physiol 97：1044-1050；Ott等(1996)J Mol Biol 263：359-368；和Fang等(1992)Plant Mol Biol 18：1185-1187)。

另外，化学物质抗性基因还包括赋予4-甲基色氨酸(4-mT)抗性的色氨酸脱羧酶(Goodijn等(1993)Plant Mol Biol 22：907-912)；和赋予溴苯腈抗性的溴苯腈腈水解酶。选择标记可包括氨腈水合酶(Cah)，参见例如Greiner等(1991)Proc Natl Acad Sci USA 88：4260-4264；和Weeks等(2000)Crop Sci 40：1749-1754。氨腈水合酶将氨腈转化为脲，因而赋予氨腈抗性。氨腈的任何形式或衍生物都可用作选择试剂，包括但不限于氰氨基钙(Perlka

(SKW，Trotberg Germany)和氰胺(Dormex(SKW))。另见美国专利6,096,947和6,268,547。氨腈水合酶的多核苷酸和/或多肽的变异体将会保留氨腈水合酶活性。氨腈水合酶的生物活性变异体将会保留将氨腈转化为脲的能力。这类活性的测定方法包括测定表达氨腈水合酶的植物对氨腈的抗性。额外的测定包括氨腈水合酶比色测定(参见例如Weeks等(2000)Crop Sci 40：1749-1754；和美国专利6,268,547)。

本发明也涉及分离的多核苷酸，其包含：(a)至少2个反向CentC串联重复序列阵列，其中第1阵列包含至少10个拷贝的CentC，第2阵列包含至少10个拷贝的CentC；和(b)至少一个拷贝的反转录转座元件，其中反转录转座元件位于第1阵列和第2阵列之间。合适的反转录转座元件讨论同上。

本发明范围之内还包括分离的多核苷酸，其包含：(a)至少一个CentC串联重复序列阵列，该阵列包含至少10个拷贝的CentC；和，(b)至少一个拷贝的选自CentA、CRM1和CRM2的反转录转座元件。

再一方面，本发明涉及分离的多核苷酸，其包含：(a)至少一个CentC串联重复序列阵列，该阵列包含至少10个拷贝的CentC；和，(b)CentA、CRM1和CRM2各自至少一个拷贝。

分离的多核苷酸包含至少一个CentC串联重复序列阵列。每个CentC重复序列阵列可包含至少5、10、15、20、25、30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280或300个拷贝的CentC。此外，每个CentC串联重复序列阵列中可间插另一序列元件，包括但不限于反转录转座子(其插入到CentC拷贝之间或CentC元件内或反转录转座子内)，或阵列中的任何其它序列元件。反转录转座子包括但不限于CentA、CRM1和CRM2。

多核苷酸包括任何核酸分子，并且包含天然存在的、合成的和/或修饰的核糖核苷酸、脱氧核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合。多核苷酸包括所有序列形式，包括但不限于单链、双链、线状、环状、分枝、发夹、茎-环结构等。

本发明范围之内还包括重组构建体，其包含本发明的任何分离的多核苷酸。

重组DNA构建体包含多核苷酸，当存在于植物基因组中时，所述多核苷酸是对植物基因组的该染色体位置而言是异源的或外源的。在制备DNA构建体中，可操作不同片段，以提供合适方向和/或合适读框的序列。连接基或接头可用于连接各片段。可使用其它操作以提供方便的限制位点、除去冗余DNA或除去限制位点。例如，可使用体外诱变、引物修复、限制、退火、重新取代、转换、倒位或重组系统。目标多核苷酸是指DNA构建体中包含的用于任何目的的任何核酸分子，包括但不限于非翻译区、调节区、转录起始区、翻译起始区、内含子、外显子、编码RNA的多核苷酸、选择标记、筛选标记、表型标记、编码重组酶的多核苷酸、重组位点、靶位点、转移盒、限制位点、识别位点、绝缘子、增强子、间隔/填充序列、复制起点、端粒序列、操纵基因等，都可在DNA构建体中提供。构建体可包含与合适序列有效连接的5′和3′调节序列。DNA构建体可包含在植物中有功能的、以5′至3′方向转录的至少一个以下区域：转录和翻译的起始区、多核苷酸、和转录和翻译的终止区。或者，DNA构建体可缺乏至少一个5′和/或3′调节元件。例如，可设计DNA构建体，使得一旦导入细胞且存在合适的重组酶时，在靶位点的重组事件将5′和/或3′调节区与DNA构建体的合适序列有效连接。

根据所用的多核苷酸元件、重组位点、转移盒和/或靶位点，可按多种方式使用调节元件。在某些实例中，间插序列可存在于有效连接元件之间而不破坏功能性连接。例如，启动子和目标多核苷酸之间的有效连接允许启动子启动和介导目标多核苷酸的转录。在某些实例中，翻译起始位点与重组位点有效连接。在某些实例中，重组位点位于内含子中。

盒可另外含有至少一个要导入植物的额外序列。或者，可分别提供额外序列。可给DNA构建体提供多个限制位点或重组位点，用于操作不同组分和元件。DNA构建体可另外含有选择标记基因。

转录起始区对植物宿主或目标多核苷酸而言可以是天然的、类似的、外源或异源的，并且可以是天然序列、修饰序列或合成序列。大量启动子可用于表达编码序列。

有关用于植物的各种启动子的综述可参见Potenza等(2004)In Vitro Cell Dev Biol Plant 40：1-22。在某些实例中，表达选择标记的启动子在种子中具有活性。在种子中具有活性的启动子包括组成型启动子，例如，Rsyn7启动子的核心启动子和以下文献中公开的其它组成型启动子：WO99/43838和美国专利6,072,050；核心CaMV 35S启动子(Odell等(1985)Nature 313：810-812)；MVV(紫茉莉花叶病毒)启动子(Dey和Maiti(1999)Plant Mol Biol 40：771-782)；水稻肌动蛋白(McElroy等(1990)Plant Cell 2：163-171)；泛蛋白(Christensen等(1989)Plant Mol Biol.12：619-632和Christensen等(1992)Plant Mol Biol 18：675-689)；pEMU(Last等(1991)Theor Appl Genet 81：581-588)；MAS(Velten等(1984)EMBO J 3：2723-2730)；ALS启动子(美国专利5,659,026)等。其它组成型启动子包括以下文献中公开的那些：例如美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611。

启动子可以是组织优选的启动子，以便在特定植物组织中增强表达。在某些实例中，种子优选的启动子用于表达选择标记。种子优选的启动子包括种子特异性启动子(其在种子发育中具有活性)以及种子萌发启动子(其在种子萌发中具有活性)。参见Thompson等(1989)BioEssays 10：108。种子优选的启动子包括但不限于Cim1(细胞分裂素诱导的信息)；cZ19B1(玉米19kDa玉米醇溶蛋白)；milps(肌醇-1-磷酸合酶)(参见WO00/11177和美国专利6,225,529)、豆类β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、糯质蛋白(waxy)、超甜蛋白1(shrunken 1)、超甜蛋白2(shrunken 2)、球蛋白1、end1和end2启动子(WO00/12733)等。

化学物质调节的启动子可通过利用外源化学调节剂来调节种子中的表达。启动子可以是化学物质诱导型启动子(其中利用化学物质诱导基因表达)或化学物质阻遏型启动子(其中利用化学物质阻遏基因表达)。化学物质诱导型启动子包括但不限于玉米In2-2启动子(由苯磺酰胺除草剂类安全剂(safener)活化)；玉米GST启动子(由疏水亲电化合物(例如某些芽前除草剂)活化)；和烟草PR-1a启动子(由水杨酸活化)。其它化学物质调节的目标启动子包括甾体响应型启动子(参见例如糖皮质激素诱导型启动子，参见Schena等(1991)Proc Natl Acad Sci USA 88：10421-10425和McNellis等(1998)Plant J 14：247-257)以及四环素诱导型和四环素阻遏型启动子(参见例如Gatz等(1991)Mol Gen Genet227：229-237和美国专利5,814,618和5,789,156)。

DNA构建体可包含表达单元。表达单元可具有包括但不限于以下的元件：内含子、增强子、前导序列、绝缘子、间隔序列、RNA编码区、标记基因、重组位点、终止区、重组酶的编码序列、增强子、接头、识别位点等。另外，DNA构建体可包含转移盒、靶位点或其任何部分或组合。可以各种方式修饰DNA构建体，包括但不限于位点特异性重组/整合方法或基于转座子的转座，以使DNA构建体中具有各种变化。可以修饰多核苷酸序列，用于在植物中表达。参见例如Campbell和Gowri(1990)Plant Physiol 92：1-11。合成植物优选基因的方法包括例如美国专利5,380,831、5,436,391和Murray等(1989)Nucl Acids Res 17：477-498。

已知额外的序列修饰在细胞宿主内能增强基因表达。这些修饰包括消除编码假聚腺苷酸化信号的序列、外显子-内含子剪接位点信号、转座子样重复序列和对基因表达有害的其它已充分表征的序列。序列的G-C含量可调节到给定宿主的平均水平，该水平是通过参考该宿主中表达的内源基因而求出的。也可修饰序列以避免二级mRNA结构。DNA盒中可另外含有5′前导序列，其可起到增强翻译的作用。翻译前导序列包括例如pimaizeavirus前导序列例如EMCV前导序列(Elroy-Stein等(1989)Proc Natl Acad Sci USA 86：6126-6130)；马铃薯Y病毒(Potyvirus)前导序列例如TEV前导序列(Gallie等(1995)Gene 165：233-238)、MDMV前导序列(Kong等(1988)Arch Virol 143：1791-1799)和人免疫球蛋白重链结合蛋白(BiP)(Macejak等(1991)Nature 353：9094)；苜蓿花叶病毒外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling等(1987)Nature 325：622-625)；烟草花叶病毒前导序列(TMV)(Gallie等(1989)载于Molecular Biology of RNA，ed.Cech(Liss，New York)，第237-256页)；和玉米褪绿斑驳病毒前导序列(MCMV)(Lommel等(1991)Virology 81：382-385)。另见Della-Cioppa等(1987)Plant Physiol 84：965-968。已知能增强翻译的其它方法或序列也可采用，例如内含子等。

目标序列包括例如锌指、激酶、热激蛋白、转录因子、DNA修复、农艺学性状、抗虫性、抗病性、除草剂抗性、不育性、油、蛋白质、淀粉、可消化性、果仁大小、成熟度、营养组成、含量或代谢等。抗虫基因可编码对害虫的抗性，例如根虫(线虫)、地老虎、欧洲玉米螟等。这样的基因包括例如苏云金芽孢杆菌(B.thuringiensis)毒蛋白基因(美国专利5,366,892；5,747,450；5,736,514；5,723,756；5,593,881；Geiser等(1986)Gene 48：109)等。抗病性状包括解毒基因，例如针对伏马毒素(fumonosin)的基因(美国专利5,792,931)；减毒(avr)和抗病(R)基因(Jones等(1994)Science 266：789；Martin等(1993)Science262：1432；Mindrinos等(1994)Cell 78：1089)等。除草剂抗性性状包括编码除草剂抗性的基因，包括磺酰脲型除草剂(例如ALS的S4和/或Hra突变)、抑制谷氨酰胺合酶作用的除草剂，例如草丁膦或草铵膦(basta)(例如bar基因)、EPSPS(美国专利6,867,293；5,188,642和5,627,061)、GOX(Zhou等(1995)Plant Cell Rep 15：159-163)和GAT(美国专利6,395,485)。也可使用抗生素抗性基因，例如编码抗生素卡那霉素和庆大霉素抗性的nptII基因。也可使用不育基因，例如作为去雄的替代方法，包括雄性组织优选的基因和具有雄性不育表型的基因例如QM(例如美国专利5,583,210)、激酶和编码对雌雄配子体发育具有毒性的化合物的基因。

需要降低特定基因的活性、沉默和/或抑制。用于基因沉默的许多技术是已知的，包括但不限于反义技术(参见例如Sheehy等(1988)Proc Natl Acad Sci USA 85：8805-8809；和美国专利5,107,065；5,453,566和5,759,829)；共抑制(例如Taylor(1997)Plant Cell 9：1245；Jorgensen(1990)Trends Biotech 8：340-344；Flavell(1994)Proc Natl Acad Sci USA91：3490-3496；Finnegan等(1994)Bio/Technology 12：883-888；和Neuhuber等(1994)Mol Gen Genet 244：230-241)；RNA干扰(Napoli等(1990)Plant Cell 2：279-289；美国专利5,034,323；Sharp(1999)Genes Dev 13：139-141；Zamore等(2000)Cell 101：25-33；Javier(2003)Nature 425：257-263；和Montgomery等(1998)Proc Natl Acad Sci USA 95：15502-15507)、病毒诱导的基因沉默(Burton等(2000)Plant Cell 12：691-705；和Baulcombe(1999)Curr Op Plant Bio 2：109-113)；靶向RNA特异性核酶(Haseloff等(1988)Nature 334：585-591)；发夹结构(Smith等(2000)Nature 407：319-320；WO99/53050；WO02/00904和WO98/53083)；核酶(Steinecke等(1992)EMBO J 11：1525；美国专利4,987,071；和Perriman等(1993)Antisense Res Dev 3：253)；寡核苷酸介导的定向修饰(例如WO03/076574；和WO99/25853)；Zn指靶向分子(例如WO01/52620；WO03/048345和WO00/42219)；和其它方法或上述方法的组合。

终止区可以是天然的，转录起始区可天然带有有效连接的目标DNA序列，或可来自另一来源。方便的终止区可得自根癌土壤杆菌(Agrobacterium tumefsciens)Ti-质粒，例如章鱼碱合酶和胭脂碱合酶的终止区。另见Guerineau等(1991)Mol Gen Genet 262：141-144；Proudfoot(1991)Cell 64：671-674；Sanfacon等(1991)Genes Dev 5：141-149；Mogen等(1990)Plant Cell 2：1261-1272；Munroe等(1990)Gene 91：151-158；Ballas等(1989)Nucl Acids Res 17：7891-7903和Joshi等(1987)Nucl Acids Res 15：9627-9639。

再一方面，本发明涉及包含具有功能性着丝粒的人工植物微染色体的转基因玉米植物的制备方法，所述方法包括：

(c)使来自步骤(b)的玉米植物细胞再生出能育的玉米植物，其中所述玉米植物包含具有功能性着丝粒的人工植物微染色体。

混合物还可包含编码用于刺激细胞生长的多肽的多核苷酸。刺激细胞生长的多肽的实例包括但不限于wuschel、baby boom、RepA或Lec1。

将序列导入植物的任何方法都可使用，只要多核苷酸或多肽能够进入至少一个细胞内部。将序列导入植物的方法是已知的，包括但不限于稳定转化、瞬时转化、病毒介导的方法和有性育种。稳定结合是指导入的多核苷酸整合到基因组中并由后代遗传下去。瞬时转化是指导入的序列没有整合到基因组中，使得从宿主遗传给后代。所用的植物和种子可具有稳定结合在其基因组上的DNA构建体。任何方案都可使用，以导入DNA构建体、任何组分的位点特异性重组系统、多肽或任何其它目标多核苷酸。提供包含将任何多肽和/或多核苷酸与任何其它所述组分结合在一起的任何方法。任何方法都可采用，以将靶位点、转移盒和合适的重组酶结合在一起，所述方法包括例如稳定转化、瞬时递送和有性杂交(参见例如WO99/25884)。在某些实例中，可提供多肽或mRNA形式的重组酶。可采用一系列方案，以将不同组分结合在一起。例如，可通过各种方法将这些组分中的至少一种提供给细胞，所述方法包括瞬时和稳定的转化方法；将重组酶DNA、mRNA或蛋白质直接共同引入细胞；使用可表达重组酶的生物(例如株或品系)；或让携带靶位点的细胞或生物生长/培养，与表达活性重组酶蛋白的生物杂交，然后在后代选择事件。当转移盒主要在靶位点整合时，得到简单的整合模式。能够在生物体内调节表达的任何启动子，包括组成型、诱导型、发育型、时间和/或空间调节型启动子等，都可使用。

转化方案以及将多肽或多核苷酸序列引入植物的方案因转化所靶向的植物或植物细胞种类不同而异。将多肽或多核苷酸引入植物细胞的合适方法包括显微注射(Crossway等(1986)Biotechniques4：320-334，美国专利6,300,543；和美国专利申请号11/427,947和11/427,371，所有这些文献都通过引用结合到本文中)、电穿孔(Riggs等(1986)Proc Natl Acad Sci USA 83：5602-5606)、土壤杆菌介导的转化(美国专利5,563,055和5,981,840)、直接基因转移(Paszkowski等(1984)EMBO J 3：2717-2722)和生物射弹粒子加速(ballistic particle acceleration)(美国专利4,945,050；5,879,918；5,886,244和5,932,782；Tomes等(1995)载于Plant Cell，Tissue，and Organ Culture：Fundamental Methods，Gamborg和Phillips主编(Springer-Verlag，Berlin)；McCabe等(1988)Biotechnology 6：923-926)；和Lec1转化(WO00/28058)。另见Weissinger等(1988)Ann Rev Genet 22：421-477；Sanford等(1987)Particulate Science and Technology 5：27-37(洋葱)；Christou等(1988)Plant Physiol 87：671-674(大豆)；Finer和McMullen(1991)In Vitro Cell Dev Biol 27P：175-182(大豆)；Singh等(1998)Theor Appl Genet 96：319-324(大豆)；Datta等(1990)Biotechnology 8：736-740(水稻)；Klein等(1988)Proc Natl Acad Sci USA 85：4305-4309(玉米)；Klein等(1988)Biotechnology 6：559-563(玉米)；美国专利5,240,855；5,322,783和5,324,646；Klein等(1988)Plant Physiol 91：440-444(玉米)；Fromm等(1990)Biotechnology 8：833-839(玉米)；Hooykaas-Van Slogteren等(1984)Nature 311：763-764；美国专利5,736,369(谷物类)；Bytebier等(1987)Proc Natl Acad Sci USA 84：5345-5349(百合科(Liliaceae))；De Wet等(1985)载于The Experimental Manipulation of Ovule Tissues，Chapman等主编(Longman，New York)，第197-209页(花粉)；Kaeppler等(1990)Plant Cell Rep 9：415-418，Kaeppler等(1992)Theor Appl Genet 84：560-566(颈须(whisker)介导的转化)；D′Halluin等(1992)Plant Cell 4：1495-1505(电穿孔)；Li等(1993)Plant Cell Rep 12：250-255；Christou和Ford(1995)Ann Bot 75：407-413(水稻)；Osjoda等(1996)Nat Biotechnol 14：745-750(玉米，通过根癌土壤杆菌)；和载于Advances in Cellular and Molecular Biology of Plants，第5卷，第8章，第189-253页，Vasil主编，Kluwer Acad Publ(Dordrecht，The Netherlands)1999。

不同化合物可与任何直接递送方法一起用于将任何多核苷酸、多肽或其组合(任选包含其它组分)导入植物细胞中。例如，在阳离子型脂质溶液、脂质体溶液、阳离子型聚合物、DNA结合蛋白、阳离子蛋白、阳离子肽、阳离子聚氨基酸或其组合的存在下，可通过使DNA构建体与微弹结合而制备用于基因枪(particle gun)方法的微弹。在某些实例中，在以下物质存在下，通过使DNA构建体与微弹相结合，制备用于基因枪方法的微弹：Tfx-10、Tfx-20、Tfx-50、脂转染试剂(Lipofectin)、脂转染胺试剂(Lipofectamine)、细胞转染试剂(Cellfectin)、Effectene、细胞转染试剂GSV(Cytofectin GSV)、Perfect Lipids、DOTAP、DMRIE-C、FuGENE-6、Superfect、Polyfect、聚乙烯亚胺、脱乙酰壳多糖、鱼精蛋白Cl、DNA结合蛋白、组蛋白H1、组蛋白CENH3、聚-L-赖氨酸、DMSA等。

可通过用病毒或病毒核酸与植物接触，将多核苷酸导入植物中。通常，这样的方法包括将所需多核苷酸结合在病毒DNA或RNA分子中。序列开始可合成在病毒多蛋白中，然后在体内或体外加工产生所需蛋白质。有用的启动子包括病毒RNA聚合酶转录所用的启动子。将多核苷酸(包括病毒DNA或RNA分子)引入植物并表达所编码的蛋白质的方法是已知的，参见例如美国专利5,889,191；5,889,190；5,866,785；5,589,367；5,316,931；和Porta等(1996)Mol Biotech 5：209-221。

使用各种瞬时方法，可将不同组分(包括来自位点特异性重组系统的那些)提供给植物。这样的瞬时转化方法包括但不限于向植物中直接引入重组酶或其活性片段或其变异体、引入重组酶mRNA或使用非整合方法、或引入低水平的DNA。这样的方法包括例如显微注射、粒子轰击、病毒载体系统和/或多核苷酸沉淀，其中转录是自结合粒子的DNA发生的，而基本不自粒子中释放或不整合到基因组中，这样的方法通常使用包被聚乙烯亚胺(polyethylimine)的粒子(参见例如Crossway等(1986)Mol Gen Genet 202：179-185；Nomura等(1986)Plant Sci 44：53-58；Hepler等(1994)Proc Natl Acad Sci USA 91：2176-2180；和Hush等(1994)J Cell Sci 107：775-784)。

采用标准方案和介质，可将转化细胞再生为植物，参见例如McCormick等(1986)Plant Cell Rep 5：81-84。然后可培养这些植物并自花授粉、回交和/或远交，鉴定具有所需性状的所得后代。培养两代或更多代，以保证性质能稳定维持并遗传，然后收获种子。按照该方法，提供具有所述DNA构建体稳定地结合在基因组的转化/转基因种子。具有稳定结合的DNA构建体的植物和/或种子可进一步表征其表达、位点特异性整合潜力、农业经济学和拷贝数(参见例如美国专利6,187,994)。

可使用目标重组位点、重组酶、选择标记和核苷酸序列的片段和变异体，除非另有说明，否则是指所述变异体或片段保留了至少某些原始组成的活性/功能。就多核苷酸编码蛋白质而言，多核苷酸片段可编码保留全长蛋白生物活性的蛋白片段。多核苷酸片段的范围为至少约20个核苷酸、约50个核苷酸、约100个核苷酸和至多全长多核苷酸。编码蛋白质生物活性部分的多核苷酸片段通常编码至少15、25、30、50、100、150、200、250、300、325、350、375、400、420或450个连续氨基酸，或该范围内的任何整数，至多并包括全长蛋白质所含的氨基酸总数。可通过分离编码目标多肽部分的一个多核苷酸部分而制备多肽的生物活性片段，然后表达蛋白质片段并评价其活性。

或者，可通过选择性化学裂解或蛋白酶裂解全长多肽而制备多肽的生物活性片段，再测定其活性。例如，编码重组酶多肽片段的多核苷酸可包括这样的核苷酸序列：其包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1,000、1,100、1,200、1,300或1,400个核苷酸，或该范围内的任何整数，至多并包括全长多核苷酸的核苷酸总数。另外，在合适的重组酶存在下，在经历重组事件后，重组位点片段保留重组位点的生物活性。重组位点片段的范围为至少约5、10、15、20、25、30、35、40个核苷酸，至多达全长重组位点。例如全长FRT、lox、attB和attP位点是已知的，其范围为约50个核苷酸至约250个核苷酸，而完全活性的最小值是已知的，范围为约20、25、30、35、40、45和50个核苷酸。

重组位点和重组酶生物活性的测定是已知的(参见例如Senecoll等(1988)J Mol Biol 201：406-421；Voziyanov等(2002)Nucl Acids Res 30：7；美国专利6,187,994；WO01/00158；Albert等(1995)Plant J 7：649-659；Hartang等(1998)J Biol Chem 273：22884-22891；Saxena等(1997)Biochim Biophys Acta 1340：187-204；和Hartley等(1980)Nature280-860-864)。重组酶活性测定通常测定酶对含重组位点的DNA底物的总体活性。例如，为了测定FLP的活性，可检测含两个反向FRT位点的环状质粒中的DNA序列倒位，因为限制酶位点的位置发生改变(参见例如Vetter等(1983)Proc Natl Acad Sci USA 80：7284)。或者，可以测定从线状分子切除的DNA或由酶诱导的分子间重组频率(参见例如Babineau等(1985)J Biol Chem 260：12313；Meyer-Leon等(1987)Nucl Acids Res 15：6469；和Gronostajski等(1985)J Biol Chem 260：12328)。也可测定重组酶活性，即通过切除致重组FRT位点侧接的序列，以激活可测定的标记基因。

实施例

以下实施例进一步界定了本发明，其中份和百分比以重量计，温度以摄氏度计，除非另有说明。应当理解，当这些实施例表示本发明的优选实施方案时，它们仅用于说明性目的。根据以上讨论和这些实施例，本领域技术人员可以确定本发明的基本特征，而且在不偏离其精神和范围下，可对本发明作出不同的改动和修饰，以适用于不同用途和条件。因此，根据上述描述，对本发明进行除本文所示和所述之外的各种修饰，将会是本领域技术人员显而易见的。这样的修饰也落入所附权利要求书的范围之内。

缩略语的含义如下：“sec”表示秒，“min”表示分钟，“h”表示小时，“d”表示天，“μl”表示微升，“mL”表示毫升，“L”表示升，“μM”表示微摩尔浓度，“mM”表示毫摩尔浓度，“M”表示摩尔浓度，“mmol”表示毫摩尔，“μmole”表示微摩尔，“g”表示克，“μg”表示微克，“ng”表示纳克，“U”表示单位，“bp”表示碱基对，“kB”表示千破基对。

实施例1.玉米着丝粒的鉴定和分离

为了评价单个着丝粒的大小、组成和结构组织，单独和/或在合剂中使用对CentC、CentA、CRM1和/或CRM2具有特异性的标记探针，用于对玉米减数分裂粗线期、中期、后期I的染色体进行荧光原位杂交(FISH)和对延伸DNA分子进行荧光原位杂交(纤维-FISH)。这4个探针也用于筛选基因组玉米BAC文库。

A.原位杂交

玉米中期染色体的多色FISH表明，这4个着丝粒重复序列是着丝粒特异性的并共同定位于体细胞所有染色体的着丝粒区。FISH分析表明，反转录转座子CRM1、CRM2和CentA占据在玉米着丝粒中大致相同的区域。在不同玉米染色体的着丝粒之间，重复序列的组成和重复序列区相对大小有显著差异。

FISH结果表明，CentA探针具有最微弱的杂交信号；CRM1探针表现出梯度样杂交模式，在中期染色体最初缢痕周围具有最强信号，在着丝粒区外围信号逐渐减弱；而CRM2探针表现出最清楚而致密的杂交信号。CentC重复序列的FISH信号强度高度依赖于CentC拷贝数，这在不同玉米染色体着丝粒之间是不同的。在某些着丝粒中，CentC紧密簇集，表现出与其它着丝粒重复序列的轻微重叠，在其它染色体中，CentC重复序列分布显示出与所有其它重复序列更多的重叠。具有所有4个着丝粒重复序列的花粉母细胞减数分裂后期I染色体的FISH表明，这一时期的着丝粒区高度延伸，完整着丝粒区中仅有小区段实际上与动粒连接。所有4个重复序列共同定位于微管连接区段，这表明天然功能性着丝粒区包含所有4个着丝粒重复序列。延伸DNA分子的纤维-FISH用于以更高分辨率进一步表征着丝粒重复序列的分布和排列。

燕麦与玉米杂交产生的F1胚保留一条或多条玉米染色体(参见例如Riera-Lizarazu等(1996)Theor Appl Genet 93：123-135；Ananiev等(1997)Proc Natl Acad Sci USA 94：3524-3529)。这些品系提供了研究一条玉米染色体、而没有其它9条玉米染色体的复杂背景的方法。大量燕麦-玉米附加系可得自明尼苏达大学(University of Minnesota，St.Paul，MN，USA)的Ron Phillips，包括本文所用的Seneca 60、A188和B73燕麦-玉米附加系。

燕麦-玉米染色体附加系的DNA用于分析一条玉米染色体的着丝粒区。燕麦-玉米染色体附加系的多色纤维-FISH显示每条染色体独特的长达百万碱基的着丝粒重复序列杂交延伸(图11)。在染色体1、7和8中，所有4个重复序列分散在整个着丝粒区中。在其它染色体中，CentC呈现出比较短的延伸(约300kb)，其侧接其它3个着丝粒重复序列的“松散”阵列。经FISH观察，不同玉米染色体之间着丝粒区的总长度有很大差异。在该重复序列的丰度方面，CentC表现出一条染色体的着丝粒之间的显著多态性，在任何给定基因型中观察到的差异高达10倍。在中期和粗线期染色体中，染色体7具有最大的CentC串联重复序列区组。同样，具有玉米染色体7的燕麦-玉米附加系具有最长延伸的DNA纤维，其与CentC探针杂交。相反，在中期染色体中，玉米染色体4的着丝粒却具有最小段的CentC重复序列区组，而最小的CentC在燕麦-玉米染色体4附加系、尤其是在玉米系B73染色体4中。当通过纤维-FISH分析时，着丝粒反转录转座子CentA、CRM1和CRM2显示出斑点样模式，在阳性杂交信号之间具有大的缺口。当这3个反转录转座子的探针混合在一起并用作一个混合探针时，它们显示出分散在CentC重复序列区组中的更连续的标记DNA纤维。连续标记着丝粒反转录转座子的侧翼显示出沿DNA分子的斑点样模式，表明其它类型的DNA序列散布在着丝粒反转录转座子中，包括非着丝粒特异性元件。着丝粒反转录转座子在具有小的CentC重复序列区组的染色体(例如染色体4)着丝粒中可形成至多1Mb的松散阵列。玉米杂种Zapalote chico具有额外的(supernumary)B-染色体。Zapalote chico的减数分裂染色体的FISH表明，玉米B-染色体功能性着丝粒含有所有4个着丝粒重复序列，与在所有A-染色体中观察到的一样。然而，在B-染色体长臂的若干非着丝粒位点中也发现了CentC重复序列簇集。这些位点显然不含其它着丝粒重复序列。

有丝分裂和减数分裂染色体的FISH和纤维FISH的结果表明，负责在玉米染色体上形成动粒的功能性天然着丝粒区段通常包含CentC串联重复序列阵列以及其它3个着丝粒重复序列：CRM1、CRM2和CentA(图12)。

B.BAC文库

BAC载体允许克隆大片段的基因组DNA，其大小至多达约300kb，其在细菌宿主(典型的是大肠杆菌)中可维持。已经从动植物中产生了各种各样的BAC文库并成为公众可得的，参见例如以下信息：Clemson University Genome Institute(CUGI；参见以下网站：genome.clemson.edu)和Children′s Hospital Oakland Research Institiute(CHORI；参见以下网站：chori.org)。使用多种酶，用分别代表Dent和Lancaster杂种群的两种不同玉米基因型(B73和Mo17)进行文库构建，筛选大于13X覆盖面的玉米基因组BAC文库中的玉米着丝粒序列。

i.玉米Mo17基因组BAC文库

自pBAC108L(Shizuya等(1992)Proc Natl Acad Sci USA 89：8794-8797)开发出pIndigoBac536(Shizuya，未发表)和pBeloBAC11(Kim等(1996)Genomics 34：213-218)BAC克隆载体。pBAC108L是基于小F因子的质粒。F因子编码调节其自身在细胞中的复制和拷贝数的基因。载体pBeloBAC11是通过引入LacZ基因而产生，以便通过蓝色或无色(白色)表型而鉴定重组克隆。pBeloBAC11具有3个独特的克隆位点：BamHI、SphI和HindIII，这些位点侧接T7和SP6启动子。稀有切点酶(rare-cutter)限制位点NotI、EagI、XmaI、SmaI、BglI和SfiI可用于切除来自pBeloBAC11的插入序列。在载体pIndigoBac536中，EcoRI位点在氯霉素(CM^R)基因中被修饰，使得克隆位点中的EcoRI位点可用于文库构建。pBeloBAC11载体和pIndigoBac536载体具有2个选择标记(LacZ和CM^R)用于转化体的选择。

基本上按照Kim等((1996)Genomics 34：213-218)所述，在与加州理工学院(California Institute of Technology)的Shizuya实验室的合同之下，自玉米Mo17公用近交系，在pBeloBAC11或pIndigoBac536中构建了有产权的玉米基因组BAC文库。简而言之，Mo17基因组DNA用HindIII或EcoRI限制酶部分消化。在琼脂糖凝胶中对DNA片段进行大小分级分离后，克隆在pBeloBAC11 HindIII位点或pIndigoBac536 EcoRI位点中。平均插入序列大小为约150kb。完整Mo17基因组BAC文库由433个384孔板或总共166,272个BAC克隆组成。包括214板的文库的一半含有具有HindIII插入序列的BAC克隆，而包括219板的文库的另一半则含有具有EcoRI插入序列的BAC克隆。BAC克隆维持在大肠杆菌DH10B(BRL Life Technologies)中。

ii.玉米B73基因组BAC文库

得到两个公用玉米B73基因组BAC文库。文库ZMMBBb可得自Clemson University Genome Institute(CUGI，University of Georgia，Athens，GA，USA)。ZMMBBb BAC文库在CUGI产生，即通过将HindIII部分消化的玉米B73基因组DNA克隆到包含氯霉素(CM^R)抗性基因的pIndigoBac536载体中。ZMMBBb BAC文库包含总共247,680个BAC克隆，平均插入序列大小为约137kb，代表14X基因组的覆盖度。第二个B73BAC文库CHORI-201(ZMMBBc)是由Chil dren′s Hospital Oakland Research Institiute(CHORI)的Pieter de Jong实验室的制备的，该文库可得自CHORI的BACPAC Resource Center。为了构建该文库，从玉米B73核中分离出基因组DNA。用经EcoRI和EcoRI甲基化酶的组合部分消化的DNA构建了文库的第一区段，用MboI部分消化的DNA构建了第二区段。将经大小选择的DNA克隆到pTARBAC2.1载体(区段1，板1-288)的EcoRI位点之间，并克隆到pTARBAC1.3载体(区段2，板289-576)的BamHI位点之间。用连接产物转化大肠杆菌DH10B电感受态细胞(BRL Life Technologies)。将每个载体中用于各文库区段的BAC克隆排列到288个384孔微量滴定板中。区段1包含106,637个单个BAC克隆，平均插入序列大小为163kb，代表6.9X基因组覆盖度。区段2包含105,579个单个BAC克隆，平均插入序列大小为167kb，代表7.0X 基因组覆盖度。总ZMMBBc文库包含212,216个单个BAC克隆，平均插入序列大小为165kb，代表13.9X基因组覆盖度。

C.BAC文库筛选

用4个针对着丝粒序列CentA、CentC、CRM1和CRM2的单独探针筛选玉米B73和Mo17 BAC文库。探针经设计成为40bp长的OVERGO寡核苷酸，并且对每个着丝粒元件而言都是独特的。通过使用合适标记，这些探针可用于菌落、和斑点杂交以及FISH和纤维-FISH。

i.重叠寡核苷酸探针

重叠寡核苷酸探针通常设计为具有8bp互补重叠区的两个短寡核苷酸。短寡核苷酸通常范围为23-28bp，其中24bp是最常用的。退火后，寡核苷酸形成二聚体，其中16bp单链DNA位于两侧。标记部分双链探针，即在标记核苷酸存在下，通过用克列诺(Klenow)酶的聚合活性填补凹进的3′端。最终重叠寡核苷酸探针包含标记双链40bp探针。表1列出引物和探针，用于产生、筛选和表征BAC克隆、DNA构建体和玉米微染色体事件。

表1

ii.BAC文库筛选结果

菌落杂交筛选鉴定了约8000个BAC克隆库，其可与4个着丝粒特异性探针中的至少一个杂交。根据杂交特性，将8000个BAC克隆分为4组(表2)。

表2

组别	总量
		含有CentA的所有BAC	842
含有CentC的所有BAC	2479
		含有CRM2的所有BAC	2968

含有CRM1的所有BAC

6012

根据着丝粒重复序列组成，根据与每个特定BAC克隆杂交的探针组合，可将BAC克隆进一步分为15组(表3)。

表3

BAC克隆还可根据与每个特定探针杂交的BAC克隆的总和来分类(表4)。

表4

含有CentA的所有BAC	842
		含有CentA和CentC的所有BAC	302
含有CentA、CentC和CRM1的所有BAC	292
		含有CentA、CentC和CRM2的所有BAC	253

含有CentA和CRM1的所有BAC	539
		含有CentA、CRM1和CRM2的所有BAC	363
含有CentA和CRM2的所有BAC	396
		含有CentA、CentC、CRM1和CRM2的所有BAC	247
含有CentC的所有BAC	2479
		含有CentC和CRM1的所有BAC	1851
含有CentC和CRM2的所有BAC	1080
		含有CentC、CRM1和CPM2的所有BAC	977
含有CRM1的所有BAC	6012
		含有CRM1和CRM2的所有BAC	1842
含有CPM2的所有BAC	2968

一组247个BAC克隆含有所有4个着丝粒重复序列。它们包含0.15％的玉米基因组，或者它们在每个着丝粒中的DNA区段上平均存在约300kb。该组BAC克隆鉴定为核心组(core set)，可先用于实验以构建玉米微染色体。从核心组中所有247个BAC中纯化DNA，用XmnI或RsaI消化，转印并与4个着丝粒重复序列的每一个杂交。DNA斑点杂交证实，该核心组的克隆含有所有4个着丝粒重复序列。BAC表现出限制片段组成和杂交模式的普遍差异，并且可根据限制片段相似性，进一步分为87组。87组(表5)中每组取一个代表，产生核心组DNA构建体和/或BAC核心组构建体库，用于转化和微染色体装配。

表5

D.反向CentC重复序列阵列的鉴定

在来自玉米系Mo17和B73的BAC文库中搜索反向CentC串联阵列。对Mo17 BAC-末端序列数据库进行BLAST搜索，显示出591个含CentC重复序列的BAC末端。这其中仅有45个BAC克隆在两端含有CentC重复序列，而44个BAC具有相同方向的CentC重复序列，仅一个BAC具有相反方向的CentC重复序列(bacm.pk128.j21)。通过DNA印迹杂交分析发现了第二个具有相反方向的CentC重复序列的BAC克隆bacm.pk008.d20。该克隆的DNA印迹分析表明杂交模式与bacm.pk128.j21中所观察到的非常相近。对公用的B73 BAC-末端序列数据库进行BLAST搜索，显示出136个含有CentC重复序列的BAC末端。这其中仅有5个BAC克隆在两端含有CentC重复序列，而4个BAC具有相同方向的CentC重复序列，仅一个BAC具有相反方向的CentC重复序列(ZMMBBb0243L15，150kb插入序列)。bacm.pk128.j21(80kb插入序列)和bacm.pk008.d20的DNA用XmnI限制酶水解，将CentC重复序列切割成单体或二聚体的短片段。分离出10kb XmnI片段，亚克隆并测序。序列分析表明，CRM1元件(SEQ ID NO：191)的一个完整拷贝加一部分拷贝位于两个反向CentC重复序列之间。

E.玉米染色体4的着丝粒BAC克隆的分离

玉米染色体4含有最短的CentC重复序列阵列。经纤维-FISH评价，这些阵列以约300kb的单一延伸DNA的形式存在。该区段可含有核心功能性着丝粒DNA序列，并且可潜在地由2-4个重叠BAC克隆表示。可通过发现位于染色体4着丝粒区的独特DNA序列，而鉴定染色体4特异性着丝粒BAC克隆。

分析玉米Mo17基因组BAC文库(包含10,965个BAC末端序列)，以鉴定在文库中只出现一次的独特BAC末端序列。鉴定和选择了81个独特BAC末端序列，用于进一步表征。针对81个独特BAC末端序列的每一个都设计出一对PCR引物，用于作图到燕麦-玉米染色体附加系图上，而且每个独特序列都分配到单条玉米染色体。

来自Mo17的bacm.pk108.h15 BAC末端序列(170kb)作图到染色体4。该BAC经过测序，发现6个独特序列以及所有4个着丝粒重复序列CentA、CentC、CRM1和CRM2。使用PCR，该BAC分配到含若干BAC的毗连群，其也与CentC杂交。经测序证实，该毗连群的多两个BAC克隆bacm.pk010.m7(170kb)和bacm.pk184.c21(150kb)与bacm.pk108.h15部分重叠并共享某些独特标记。在这3个BAC克隆中鉴定出3个独特DNA序列，而且通过对燕麦-玉米附加系DNA进行PCR，证实其染色体4的定位。开发出相应的重叠寡核苷酸探针(表1中的SEQ ID NO：102-104)并用于筛选B73公用BAC文库。

根据与所有3个染色体4特异性探针杂交，选择来自B73 BAC文库的7个BAC克隆。这些BAC克隆的DNA用XmnI消化，转移到膜上并与所有4个着丝粒重复序列探针杂交。所选B73 BAC克隆中有4个含有CentC、CRM1和CRM2着丝粒重复元件：bacb.0424.d20(150kb)；bacb.0155.h15(175kb)；bacc.0048.g5(170kb)；和bacc.0237.m8(125kb)。另有3个B73 BAC克隆只含CRM1着丝粒重复元件和CRM2着丝粒重复元件：bacc.0143.i9(205kb)；bacc.0237.j16(175kb)；和bacc.0270.c1(180kb)。对bacb.0155.h15 BAC克隆进行测序证实，它含有与染色体4特异性Mo17 BAC克隆bacm.pk010.m7和bacm.pk108.h15显著同源的区域。根据限制位点分析，这7个BAC克隆中有6个(除了bacb.0424.d20之外的所有克隆)装配成毗连群。bacb.0155.h15和bacc.0143.i9这两个克隆具有约50kb的重叠并覆盖包含约240kb的整个毗连群。

代表来自Mo17和B73近交系的染色体4的着丝粒区的2组BAC克隆用于产生DNA构建体，用于微染色体装配。

F.染色体着丝粒DNA片段的分离和纯化

基本上所有玉米基因组DNA都有大量甲基化，而且这样的甲基化模式可能在玉米着丝粒的装配、功能和/或维持方面起作用。维持甲基化和/或其它天然基因组特性(例如元件的大小、组构和其它天然核苷酸修饰)的分离玉米基因组DNA，可用于产生DNA构建体，用于玉米微染色体装配。

i.限制酶的选择

玉米着丝粒重复序列的序列分析鉴定出了大量限制酶(6个切点酶)，这些酶在任何着丝粒重复序列CentA、CentC、CRM1或CRM2内都没有识别位点(表6)。这些限制酶应当将大量基因组DNA消化成小DNA片段，其大多数的大小为约1-20kb，而预期着丝粒DNA明显更长。可使用这些限制酶中的至少一种，部分或完全消化玉米高分子量(HMW)基因组DNA，分离玉米染色体着丝粒区。在琼脂糖凝胶块中埋置的玉米核脉冲场凝胶电泳(PFGE)后，可纯化含有约50kb至约1000kb大片段的已消化的HMW基因组DNA部分。

ii.HMW玉米基因组DNA的制备和表征

基本上按照Liu和Whittier((1994)Nucl Acids Res 22：2168-2169)所述，通过用表6的各种限制酶消化和PFGE分级分离，自琼脂糖凝胶块中埋置的DNA，制备来自Mo17的HMW玉米基因组DNA。选择5种限制酶BspTI、AatII、Cfr9I、MbiI、MluI用于初步分析。从中选出BspTI用于所有的进一步制备。用标记CentC着丝粒探针进行斑点杂交表明，BspTI限制酶产生一系列基因组着丝粒DNA片段，范围为约50kb至约600kb，它们与其余基因组DNA分离良好。用3种其它着丝粒探针(CentA、CRM1和CRM2)与同样的DNA片段杂交证实，含有所有4个着丝粒重复序列的这些长DNA片段基本上不含BspTI限制位点。杂交条带表示单个着丝粒DNA片段，其可分离出来并用于产生DNA构建体，用于微染色体装配。

表6

实施例2.端粒序列的鉴定和分离

含有端粒重复序列的任何功能性端粒区，无论是天然的、克隆的还是合成的，都可用于制备DNA构建体。若干端粒重复序列是已知的，包括来自以下的那些：四膜虫属(Tetrahymena)、草履虫属(Paramecium)、尖毛虫属(Oxytricha)、游仆虫属(Euplotes)、网柄菌属(Dictyostelium)、酵母属(Saccharomyces)、新小杆线虫属(Caenorhabditis)、锥虫属(Trypanosoma)、利什曼原虫属(Leishmania)、绒泡菌属(Physarum)、拟南芥属(Arabidopsis)、人和小鼠。

端粒重复序列示例性的生物

CCCCAA(C₄A₂) 四膜虫属(Tetrahymena)、草履虫属(Paramecium)

CCCCAAAA(C₄A₄) 尖毛虫属(Oxytricha)、游仆虫属(Euplotes)

CCCTA(C₃TA) 锥虫属(Trypanosoma)、

利什曼原虫属(Leishmania)、

绒泡菌属(Physarum)

C_1-3A 酵母属(Saccharomyces)

C_1-8T 网柄菌属(Dictyostelium)

CCCTAAA(C₃TA₃) 拟南芥属(Arabidopsis)、人、小鼠、

新小杆线虫属(Caenorhabditis)

A.合成端粒序列

端粒序列的高度保守的重复特性允许化学合成和/或PCR扩增长端粒区，适用于载体构建。可产生侧接微染色体末端的长端粒重复序列段，例如(CCCTAAA)n。

可通过几轮PCR扩增，用引物对SEQ ID NO：5和6，通过两个互补端粒寡核苷酸及其产物共同引发，可制备长延伸的串联端粒重复序列。用低浓度引物(＜0.1μM)的PCR反应可制备约100-10000bp的DNA区段。可通过磷酸化寡核苷酸的连接，产生任选的合成端粒重复序列。克隆端粒DNA区段并用于制备DNA构建体。

B.亚端粒序列的鉴定和分离

i.含端粒重复序列的BAC克隆

具有含端粒重复序列的亚端粒区的BAC克隆可用于稳定微染色体构建体的染色体末端。先前已鉴定许多序列是亚端粒重复序列(Burr等(1992)J Plant Cell 4：953-60)。Genbank序列数据库对于端粒和亚端粒序列是关键词搜索。对所选序列进行比对并鉴定共同的重复元件(Telo266，SEQ ID NO：189)。采用SEQ ID NO：189，可设计若干寡核苷酸并用作探针，以筛选Mo17 BAC文库。回收大量BAC，选择一个(bacm.pk107.g1)，进行标记，然后与粗线期染色体杂交。在玉米染色体的20个亚端粒中发现了6个成簇的BAC克隆序列。将bacm.pk107.g1 BAC插入序列亚克隆并测序。序列分析显示出共同的重复元件(TR430，SEQ ID NO：190)，其可用于设计重叠寡核苷酸探针(表1)。通过对玉米Mo17和B73粗线期染色体进行FISH，证实了这些重复序列的亚端粒定位。用同样的探针，通过菌落杂交筛选玉米Mo17基因组BAC文库。

证实约有71个含玉米亚端粒重复序列区组的BAC克隆具有TR430亚端粒重复序列(表7)。

表7

bacm.pk155.e24	bacm.pk166.a12	bacm.pk173.m16	bacm.pk203.j15
				bacm2.pk022.m14	bacam2.pk092.a9	bacm2.pk114.i4	bacm2.pk169.b21
bacm2.pk177.j18	bacm2.pk190.m10	bacm2.pk220.h7	bacm.pk001.k4
				bacm.pk009.c19	bacm.pk024.j15	bacm.pk024.k8	bacm.pk036.g23
bacm.pk038.g6	bacm.pk061.i6	bacm.pk062.g4	bacm.pk064.f6
				bacm.pk070.j17	bacm.pk071.c12	bacm.pk073.m7	bacm.pk082.m9
bacm.pk101.h5	bacm.pk107.g1	bacm.pk110.h10	bacm.pk112.b18
				bacm.pk123.e21	bacm.pk125.n6	bacm.pk132.h6	bacm.pk141.p12
bacm.pk142.b15	bacm.pk146.l14	bacm.pk148.j17	bacm.pk154.a21
				bacm.pk155.p12	bacm.pk157.d2	bacm.pk164.n4	bacm.pk165.n1
bacm.pk169.n16	bacm.pk171.d3	bacm.pk172.m20	bacm.pk172.n19
				bacm.pk172.n16	bacm.pk173.e9	bacm.pk173.i12	bacm.pk174.g4
bacm.pk176.g2	bacm.pk184.e5	bacm.pk185.o19	bacm.pk189.a10

bacm.pk197.m23	bacm.pk198.f9	bacm.pk198.k3	bacm.pk200.c20
				bacm.pk208.j1	bacm.pk213.f2	bacm.pk214.i17	bacm.pk214.k16
bacm.pk214.l11	bacm.pk214.m20	bacm2.pk007.d1	bacm2.pk034.k22
				bacm2.pk043.g14	bacm2.pk043.j16	bacm2.pk073.o7	bacm2.pk102.o18
bacm2.pk108.a3	bacm2.pk117.h13	bacm2.pk160.l2	bacm.pk203.j15
				bacm.pk155.e24	bacm.pk166.a12	baacm.pk173.m16	bacm2.pk169.b21
bacm2.pk022.m14	bacam2.pk092.a9	bacm2.pk114.i4	bacm.pk001.k4
				bacm2.pk177.j18	bacm2.pk190.m10	bacm2.pk220.h7	bacm.pk036.g23
bacm.pk009.c19	bacm.pk024.j15	bacm.pk024.k8

用DpnI进行限制性指纹图谱分析，并用TR430探针(CCCTAAA)n探针进行斑点杂交，并针对knob 180bp重复序列探针表明，至少有3类亚端粒BAC克隆。第一类是大于10-20kb的长TR430相关重复序列段。第二类BAC克隆具有TR430相关重复序列，其在单元内具有限制位点，其中单元大小可以为800bp或900bp。某些BAC克隆同时含有这2种重复序列。第三类BAC克隆具有约500bp的TR430bp相关单元。这些BAC克隆中的一些也具有端粒(CCCTAAA)n相关重复序列。knob 180bp重复序列也存在于37个亚端粒BAC克隆中，表明knob 180bp重复序列可以是某些亚端粒区的组成部分。每一类都用代表性BAC克隆进行进一步分析、改型实验和转基因实验：bacm.pk038.g6；bacm2.pk063.g24；bacm.pk071.c12；bacm.pk112.b18；bacm.pk142.b15；bacm.pk173.e9。具有亚端粒片段的BAC插入序列可用于DNA构建体，用于微染色体的体外装配或在植物细胞内装配。

ii.天然染色体端粒DNA片段的分离

通过用限制酶消化的玉米基因组DNA的大小分级分离，从玉米基因组DNA中纯化保留至少一种天然基因组特征(例如甲基化模式)的染色体端粒片段，其具有4bp或更小的短识别位点。天然玉米端粒序列在每个端粒中包含成百上千个CCCTAAA串联重复序列，这种短端粒串联重复序列没有任何已知限制酶的识别位点。任何能识别2-4bp序列的短切点限制酶都可使用，只要它们对正则端粒串联重复序列(CCCTAAA)n没有特异性。短切点酶将大部分基因组DNA消化成小片段，其可与更大的端粒DNA分开。用两种或更多种短切点限制酶的组合可消除未被第一种酶裂解的其它非端粒DNA片段。已知的限制酶在正则串联端粒重复序列中都没有识别位点。

来自Mo17的玉米基因组DNA用Sau3A限制酶消化，通过印迹杂交测定，大多数玉米基因组DNA变为非常小的片段(小于1kb)，而大多数端粒DNA片段却大于约15kb。每个单倍体基因组的Sau3A端粒DNA区段的总长度为约400kb，或占总玉米单倍体基因组的0.02％。约1mg总玉米基因组DNA得到约200ng端粒DNA片段(在未消化的残留部分中)。可以从凝胶纯化基因组端粒DNA部分，用于产生DNA构建体，用于微染色体装配。

实施例3.复制起点

DNA构建体用携带复制起点的DNA区段改型，以使转基因植物细胞核中的构建体和/或微染色体能适当复制。在植物细胞中起作用的任何复制起点都可使用。可用的复制起点是已知的，包括植物复制起点和病毒复制起点。任选如果非植物宿主细胞中保留构建体的话，构建体中至少包含一个合适复制起点，例如细菌和/或酵母菌的复制起点。

A.18-26S rDNA的非转录间隔序列

已充分了解的真核复制起点是18-26S rDNA非转录间隔序列(Ivessa和Zakian(2002)Genes Dev 16：2459-2464)，其在植物中具有功能(Hernandez等(1993)EMBO J 12：1475-85)。可从以下各种不同植物中分离18-26S rDNA NTS DNA序列，例如：玉米(Zes mays)、小麦(Triticum aestivum)、燕麦(Avena sativa)、大麦(Hordeum vulgare)、拟南芥(Arabidopsis thaliana)和/或大豆(Glycine max)。将这些序列以单拷贝或多个分散拷贝形式克隆到构建体中。真核细胞染色体通常具有多个复制起点，因此含有多个复制起点的DNA构建体是有用的。除非另有说明，否则玉米18-26S rDNA NTS序列用于DNA构建体(Toloczyki和Feix(1986)Nucl Acids Res 14：4969-86)。

B.小麦矮缩病毒(Wheat dwarf virus，WDV)起始子蛋白(Rep)

小麦矮缩病毒(WDV)起始子蛋白(Rep)及其同源复制起点可用于产生DNA构建体，用于微染色体装配。小麦矮缩病毒(WDV)起始子蛋白(Rep)及其同源复制起点可用于支持微染色体构建体在玉米细胞中复制。DNA构建体中可提供WDV复制起点(顺式)，而起始子Rep蛋白和细胞周期刺激RepA蛋白所需基因可通过共同转化由独立质粒构建体(反式)提供(Sanz-Burgos和Gutierrez(1998)Virology243：119-129)。

实施例4.刺激生长的多核苷酸和多肽

可在引入包含玉米着丝粒序列和/或亚端粒片段的DNA构建体之前、期间或之后，提供多核苷酸和/或多肽，所述多核苷酸和/或多肽通过促进细胞分裂、进入S期、刺激细胞分裂和/或在培养基中生长或改进转化而增强细胞生长。采用任何合适的递送方法，任何这样的组成或其组合都可使用，包括多核苷酸、多肽和/或其它因子。

A.复制相关蛋白A

可提供小麦矮缩病毒(WDV)复制蛋白A以增强细胞生长和/或转基因事件的恢复。保留复制活性的RepA和不支持病毒复制的修饰RepA都可使用。例如，可将携带nos启动子::RepA的质粒与DNA构建体共同递送到植物细胞中。预期最初3天RepA的瞬时表达足以刺激细胞分裂并增强事件的恢复(参见例如WO00/50614，通过引用结合到本文中)。

B.细胞周期蛋白

参与细胞周期调节的细胞周期蛋白可增强细胞生长和转基因事件的恢复。例如，玉米细胞周期蛋白D可刺激培养基中细胞分裂和愈伤组织生长并改进玉米转化。E2F的异位表达诱导拟南芥细胞增殖，通过Dpa的共同表达可增强该效应(de Veylder等(2002)EMBO J 21：1360-1368)。已从植物中分离到许多细胞周期同源物，包括细胞周期蛋白D、细胞周期蛋白E、wee1、Rb、Rbr3、E2F/DP等(美国专利6,518,487；WO99/61619；WO00/37645；WO02/074909；Xie等(1996)EMBO J 15：4900-4908；所有这些文献都通过引用结合到本文中)，并可导入载体中，递送到植物细胞内。

C.Wuschel

触发特定发育途径的基因也可用于增强细胞生长。例如WOX家族成员(例如wuschel(WUS))看来在表达WUS的细胞和相邻细胞中都能刺激细胞分裂。可使用含有编码WUS多肽的多核苷酸的构建体，通过与DNA构建体共同转化而刺激细胞分裂。已知拟南芥和玉米等植物中有若干植物WUS同源物(例如Mayer等(1998)Cell 95：805-815；WO01/0023575；和US2004/0166563，所有这些文献通过引用结合到本文中)，并且可用于增强转化细胞的生长。例如，构建了包含玉米WUS基因的构建体：

PHP21139 ubi pro::ubi 5′UTR::ubiintron::WUS::pinII

D.胚珠发育蛋白2

其它目标基因包括转录因子AP2/ERF家族的相关成员，其优先在发育中的胚和种子中表达，包括在玉米胚胎形成早期表达的胚珠发育蛋白2(ZmODP2)。当异位表达时，ODP2可刺激包括非胚胎组织在内的各种组织的细胞生长，这可促进转基因事件的恢复。该基因家族包括baby boom(BBM、BNM3、ODP2)，其已知能诱导植物的异位体细胞胚(ectopic somatic embryos)(Boutilier等(2002)Plant Cell 14：1737-1749)。BBM/ODP2同源物是已知的，包括玉米同源物(WO00/75530，通过引用结合到本文中)并且可递送到植物细胞中，以增强细胞生长。例如，构建了含玉米ODP2基因的构建体：

PHP21875 ubi pro::ubi 5′UTR::ubi intron::ODP2::pinII

E.Knotted-1

同源框基因(包括knox基因家族成员，例如KN1、KNAT1和STM)在植物分生组织的起始和/或维持中起作用(Jackson等(1994)Dev 120：405-413；Lincoln等(1994)Plant Cell 6：1859-1876；Venglat等(2002)Proc Natl Acad Sci USA 99：4730-4735)。在植物中，许多knox家族成员是已知的，包括玉米同源物(Vollbrecht和Hake(1991)Nature 350：241-243；Kerstetter等(1994)Plant Cell 6：1877-1887；Serikawa等(1996)Plant Mol Biol 32：673-683)并可用于构建载体，递送到植物细胞中。

F.Lec1

Leafy cotyledon基因(例如Lec1和Lec2)参与植物胚胎发育和转录活性的调节(Meinke等(1994)Plant Cell 6：1049-1064；Lotan等(1998)Cell 93：1195-1205；WO00/28058；Stone等(2001)Proc Natl Acad Sci USA 98：11806-11811；美国专利6,492,577，通过引用结合到本文中)。许多同源物是已知的，其可用于构建载体，用于递送到植物细胞中。

G.生长刺激多核苷酸组合

可在引入包含玉米着丝粒序列和/或亚端粒片段的DNA构建体之前、期间或之后，提供多核苷酸和/或多肽的组合，所述组合通过促进细胞分裂、进入S期、刺激细胞分裂和/或在培养基中生长或改进转化而增强细胞生长。例如编码玉米ODP2(PHP21875)和玉米WUS(PHI21139)的多核苷酸可与包含玉米着丝粒和/或亚端粒区的DNA构建体一起用于转化实验。通常，如实施例6D所述，通过BARR表型和荧光标记蛋白(DsRed)表达测定，在未成熟玉米胚粒子轰击共同转化中的ODP2和/或WUS显示转基因事件的频率明显增加。当在转化混合物中提供时，观察到平均1008次事件/4800个原始胚(21％)。没有PHP21139或PHP21875，观察到8次事件/706个原始胚(约1％)。对转基因事件进行进一步分析表明，ODP2和/或WUS共同轰击的构建体不整合到基因组或装配微染色体中。

实施例5.载体的构建

参见例如以下文献，采用标准分子生物学方案，用任何标准转化方案构建环状或线状载体，用于递送到植物细胞中：Sambrook等(1989)Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor Laboratory第1-3卷。使用标准技术，通过组合分离的染色体元件，任选与其它目标多核苷酸一起，构建转化植物细胞的载体。载体包括经设计能维持在常用宿主系统(例如大肠杆菌、土壤杆菌或酵母菌以及植物细胞)中的那些。通常，构建体还包含在植物细胞中起作用的选择标记和/或筛选标记，从而有助于维持、鉴定和/或选择包含微染色体构建体的植物细胞。此外，构建体通常包含可克隆额外目标多核苷酸的若干独特限制位点。构建体也可包括位点特异性重组位点，用于重组克隆，和/或用于随后打靶和/或修饰微染色体。下文描述来自含有着丝粒序列的玉米BAC克隆的DNA构建体，用于直接递送或土壤杆菌介导的植物转化。可在BAC克隆构建体上和/或以反式在单独DNA构建体中提供不同组分。

A.标记

各种标记可用于鉴定包含所导入DNA构建体的转化细胞。可见标记包括荧光蛋白，例如AmCyan、ZsYellow或DsRed(ClonTech Laboratories，Inc.，Mountain View，CA，USA)。选择标记包括PAT、BAR、GAT等。

构建了用于递送给植物细胞的含红色荧光蛋白(DsRed2)和PAT选择标记的表达盒PHP 23715，其包含以下有效连接的组分：

ubi pro::ubi 5′UTR::ubi intron::DsRed2::moPAT::pinII

构建了用于递送给植物细胞的含蓝色荧光蛋白(AmCyan)的DNA构建体PHP 23714，其包含以下有效连接的组分：

ubi pro::ubi 5′UTR::ubi intron::AmCyan1::moPAT::pinII

B.土壤杆菌载体

用以下文献所述的杂交系统，制备土壤杆菌双元质粒：Komari等((1996)Plant J 10：165-174)。将pSB11衍生物构建成媒介T-DNA构建体，其在T-DNA边界序列之间含有所需构型。质粒pSB11得自Japan Tobacco Inc.(Tokyo，Japan)。自pSB21构建pSB11，自起始载体构建pSB21，描述于Komari等((1996)Plant J 10：165-174)。T-DNA质粒通过同源重组整合到超级双元质粒pSB1的描述可参见EP672752 A1。质粒pSB1也得自Japan Tobacco Inc.。在LBA4404中制备共合体后，这些质粒用于土壤杆菌介导的转化。按照以下文献所述方案，产生携带pSB1的土壤杆菌LBA4404菌株的电感受态细胞：Lin(1995)载于Methods in Molecular Biology，Nickoloff，J.A.主编(Humana Press，Totowa，NJ)。制备细胞和DNA用于电穿孔，即通过将1μl质粒DNA(～100ng)与20μl感受态细胞在Life Technologies(现为Whatman Biometra)的0.15cm间距电极杯(Whatman Biometra#11608-031)中混合。在Cell-Porator电穿孔仪中进行电穿孔，用脉冲控制单元(Whatman Biometra #11604-014)，设定在330μ？F，增压器(Whatman Biometra #11612-017)设定在4kW。系统递送约1.8kV给土壤杆菌细胞。通过限制分析共合体质粒证实成功重组，然后分离并转化给大肠杆菌DH5α细胞，用于扩增。

C.线状DNA构建体通过连接进行体外装配

通过制备处于泛蛋白启动子(ubi)之下的组分DNA片段，例如玉米着丝粒序列、选择标记(DsRed2和AmCyan)、真核复制起点(ori)、端粒序列(TEL)和赋予双丙氨膦(PAT)抗性的基因，产生线状DNA构建体微染色体载体。在一个实例中，从包含侧接CRM1着丝粒重复序列元件的反向CentC重复序列串联阵列的着丝粒BAC克隆bacm.pk128.j21，制备线状微染色体载体。通过用NotI消化和琼脂糖凝胶纯化，自bacm.pk128.j21产生DNA片段。将包含着丝粒区的纯化片段与特异性限制消化片段结合，后者包含选择标记和复制起点：ubi pro::ubi 5′UTR::ubi intron::DsRed::moPAT-18S-26S rDNA NTS(NotI/SpeI)和第二选择标记盒：ubi pro::ubi 5′UTR::ubiintron::AmCyan::moPAT(Notl/SmaI)以及来自其构建体的端粒序列(SpeI/XhoI或Smal/KpnI)。制备DNA片段，使得各片段包含独特识别位点，用于在连接期间进行独特线状结构的体外装配。所装配的线性化载体包含：

TEL-(Spel)-ubi pro::ubi 5′UTR：ubiintron::AmCyan::moPAT-(Notl)-bacm.pk128.j21-(NotI)-ori-ubi pro::ubi5′UTR::ubi intron::DsRed::moPAT-(Smal)-TEL

D.DNA构建体-环状改型BAC克隆载体

任何着丝粒和/或亚端粒BAC克隆或染色体片段克隆都可用额外组分改型，用于植物转化。

EPICENTRE EZ::TN^TM pMOD^TM-2 MCS转座子构建载体系统(EpiCentre Madison，WI，USA)用于将目标多核苷酸改型为现有的BAC克隆。pMOD-2是基于pUC的质粒，其具有colE1复制起点和介于EZ-Tn5转座酶识别的极度活跃的19bp镶嵌末端(ME)之间多克隆位点(MCS)。Tn5-2转座子随机整合到各靶DNA上，因此各转座反应产生小的构建体文库，其具有不同整合位点。单个改型克隆或克隆组的DNA制备物可用于转化植物细胞。

i.着丝粒BAC

根据限制酶消化和DNA印迹杂交模式，选择2个代表性仅含CentC的BAC(bacm.pk018.l13和bacm2.pk174.o21)。这些BAC克隆用EPICENTRE EZ::TN^TM pMOD^TM-2 MCS构建系统改型，产生环状DNA构建体，用于植物转化和微染色体装配

MCS用于插入DNA片段，其包含选择标记：ubi pro::ubi 5′UTR::ubi intron::DsRed::moPAT，其含有或不含玉米18-26S rDNA NTS ori，以产生第一形式的定制转座子构建体Tn5-1s。克隆目标DNA序列后，通过PshAI限制酶消化产生转座子。一旦整合后，BAC构建体通过用转座子探针进行菌落杂交，选择转化大肠杆菌阳性克隆，并从所选阳性克隆中分离DNA。

ii.亚端粒BAC

从亚端粒BAC库中选出6个代表性BAC克隆：bacm.pk038.g06、bacm2.pk063.g24、bacm.pk071.c12、bacmpk112.b18、bacm.pk142.b15和bacm.pk173.e09。构建了包含18-26S rDNA NTS ori-ubi pro::ubi 5′UTR::ubi intron::DsRed::moPAT、Kanr基因和3种不同归巢限制酶(I-PpoI、I-CeuI和PI-SceI)的位点的新定制的Tn5-2转座子构建体，用于改型亚端粒BAC克隆。改型的BAC构建体转化大肠杆菌，在卡那霉素和氯霉素上进行选择，从所选阳性克隆中分离DNA。

E.DNA构建体-线性化改型的BAC克隆

产生了额外定制的Tn5-3转座子构建体。这些Tn5-3载体包含18-26S rDNA NTS ori-ubi pro::ubi 5′UTR::ubi intron::DsRed::moPAT。构建体也包含Kan^r基因，其侧接两个反向DNA区段(各自由两个归巢限制酶I-CeuI和PI-SceI的识别位点组成)和包含端粒重复序列阵列的端粒序列。克隆目标DNA序列后，通过PshAI限制酶消化产生转座子。一旦整合后，BAC构建体转化大肠杆菌，在卡那霉素和氯霉素上进行选择，从所选阳性克隆中分离DNA。重组改型的BAC DNA用归巢限制酶(I-CeuI或PI-SceI)进行体外消化，将环状DNA转变成线状DNA构建体，其侧接以正确方向排列的端粒序列，并除去包含Kan^r的片段(图13)。

3类着丝粒BAC克隆用该Tn5-3载体改型：

1.具有反向着丝粒CentC重复序列区组并侧接CRM1着丝粒元件bacm.pk128.j21的着丝粒BAC克隆，没有CentA或CRM2序列；

2.属于含所有4个着丝粒特异性重复序列CentA、CentC、CRM1和CRM2的着丝粒BAC克隆核心组的着丝粒BAC克隆(表8)；和，

3.玉米染色体4的着丝粒BAC克隆(表9)。

各BAC克隆的DNA样品在琼脂糖凝胶中分离，切下含线状改型BAC构建体的条带。从琼脂糖上电洗脱出DNA，用于生物射弹转化(biolistic transformation)Hi-II未成熟胚8-11 DAP(授粉后的几天)。任选这些构建体可用于DNA的显微注射，或转化成载体，用于土壤杆菌介导的转化。

表8

库1	库2	库3	库4
				bacm.pk007.a2	bacm.pk011.l8	bacm.pk001.n1	bacm.pk109.h24
bacm.pk036.e13	bacm.pk012.n20	bacm.pk023.i5	bacm.pk039.a3
				bacm.pk066.j14	bacm.pk013.m8	bacm.pk043.o23	bacm.pk039.m16
bacm.pk075.l6	bacm.pk062.c14	bacm.pk051.g11	bacm.pk041.e16
				bacm.pk076.m3	bacm.pk064.n1	bacm.pk056.j19	bacm.pk077.b21
bacm.pk119.a23	bacm.pk068.p16	bacm.pk076.o15	bacm.pk079.m11
				bacm.pk133.b10a	bacm.pk070.h17	bacm.pk087.m4	bacm.pk085.k5
bacm.pk133.b10b	bacm.pk090.o5	bacm.pk089.l8	bacm.pk098.h2
				bacm.pk133.b11	bacm.pk098.f3	bacm.pk093.d8	bacm.pk102.i4
bacm.pk135.i6	bacm.pk135.l7	bacm.pk106.j20	bacm.pk112.p1
				bacm.pk178.c10	bacm2.pk002.g7	bacm.pk129.a4	bacm.pk124.j24
bacm2.pk023.e24	bacm2.pk003.g6	bacm.pk134.f15	bacm.pk143.m18

bacm2.pk064.e15	bacm2.pk012.g19	bacm.pk135.j2	bacm.pk148.e2
				bacm2.pk066.m12	bacm2.pk013.c9	bacm.pk138.e14	bacm.pk156.i17
bacm2.pk083.a2	bacm2.pk034.g20	bacm.pk141.j4	bacm.pk164.b11
				bacm2.pk093.h11	bacm2.pk053.g23	bacm.pk161.h1	bacm.pk166.n7
bacm2.pk099.m24	bacm2.pk070.g7	bacm.pk164.e18	bacm.pk178.o20
				bacm2.pk116.g16	bacm2.pk094.f14	bacm.pk179.d4	bacm2.pk034.j8
bacm2.pk174.e4	bacm2.pk096.d23	bacm2.pk130.e20	bacm2.pk075.n6
				bacm2.pk179.b18	bacm2.pk100.j24	bacm2.pk137.f2	bacm2.pk115.o22
bacm2.pk179.e1	bacm2.pk179.o14	bacm2.pk158.f12	bacm2.pk169.a21

表9

F.DNA构建体-改型多BAC组合载体

属于含所有4个着丝粒特异性重复序列CentA、CentC、CRM1和CRM2的着丝粒BAC克隆核心组的着丝粒BAC克隆(表8)，也用Tn5-2载体改型。Tn5-2构建体包含ori-ubi pro::ubi 5′UTR::ubiintron::DsRed2::moPAT、Kan^r基因和3种归巢限制酶(I-PpoI、I-CeuI和PI-SceI)的位点。用归巢限制酶I-CeuI和PI-SceI切割改型的BAC，通过脉冲场凝胶电泳(PFGE)，在以下标准条件下进行分离：1％琼脂糖、1X TAE，起始脉冲5秒、最终脉冲10秒，总运行时间12小时，在12℃。纯化大片段，将其连接而形成长达1Mb的多聚体DNA构建体。

实施例6：植物的转化

任何合适的植物转化方法都可采用。同样，可转化、培养和/或再生成为植物的任何植物细胞和/或组织都可使用。这些植物细胞和组织、以及培养基和条件、合适转化方法和再生培养基和条件都是众所周知的。

A.细胞类型

评价各种玉米细胞类型作为微染色体的产生和构建体的递送靶标的潜力，包括BMS(Black Mexican Sweet)悬浮细胞、分生组织细胞、合子、未成熟胚中的盾片细胞、培养的体细胞胚中的细胞、中央细胞和早期胚乳细胞。可通过将给定基因型与RWS系或其它诱导系杂交，采用可行的方法来产生单倍体胚。单倍体未成熟胚是微染色体递送的良好靶标，无论是在授粉后10-12天(10-12DAP)递送到盾片细胞还是递送到胚芽鞘期(coleoptilar stage)胚的暴露顶端分生组织(7-8DAP)。可以对微染色体引入二倍体或单倍体环境的行为进行重要的比较，此外，如果微染色体引入后，再进行化学诱导的染色体加倍(例如秋水仙素或氧化亚氮)，这些加倍的单倍体胚可快速再生而产生含微染色体的近交系。所有上述二倍体和单倍体细胞类型都可转化为悬浮培养物和/或原生质体或已建立的悬浮培养物，例如BMS是合适的，可用于转化。DNA构建体递送后，悬浮细胞和/或原生质体可为显微镜监测提供便利和光学清晰度。将构建体递送给植物原生质体培养物的任何合适方法都可使用，包括标准电穿孔和PEG介导的直接递送方法，参见例如载于Advances in Cellular and Molecular Biology of Plants，第5卷，第8章，第189-253页，Vasil主编，Kluwer Acad Publ(Dordrecht，The Netherlands)1999。

B.玉米的显微注射

任何适于植物细胞、组织和/或胚的显微注射的方法都可使用。此外，任何组合物或各组合物的组合/混合物都可注射，包括多核苷酸、多肽、辅因子、化学物质、辅助剂等。直接递送到合子，提供产生转基因植物的机会，而无需组织培养和再生的中间步骤。例如，可基本按照美国专利6,300,543所述，进行玉米的显微注射。简而言之，对未成熟玉米胚珠切片，得到包含胚囊的珠心片(nucellar slab)，这是显微注射转化组合物的靶标。显微注射之后，将胚囊放在合适培养基中培养，进行增殖和植物再生。

C.土壤杆菌介导的转化

基本上按照Zhao(WO98/32326)所述，进行土壤杆菌介导的玉米转化。简而言之，从玉米胚珠分离未成熟胚，使胚接触含T-DNA的土壤杆菌悬液，其中细菌能够将DNA构建体转移到至少一个未成熟胚的至少一个细胞中。任选，靶组织可与包含T-DNA、包含不同DNA构建体和/或目标多核苷酸的多个土壤杆菌系共同转化。

步骤1：感染步骤。将未成熟胚浸泡在土壤杆菌悬液中，用于开始接种。

步骤2：共同培养步骤。将胚与土壤杆菌共同培养一段时间。

步骤3：静置步骤。在共同培养后任选进行静置步骤。将未成熟胚培养在含抗生素、但不含选择剂的固体培养基中，用于消除土壤杆菌并用于感染细胞的静置期。

步骤4：选择步骤。将接种的胚培养在含选择剂的培养基中，让生长的转化愈伤组织得以恢复。将未成熟胚培养在含选择剂的固体培养基中，导致转化细胞的选择性生长。

步骤5：再生步骤。将生长在选择性培养基中的愈伤组织培养在固体培养基上，再生成植物。

D.玉米的粒子轰击

未成熟玉米胚用环状或线状DNA构建体轰击，所述构建体包含分离的玉米着丝粒序列和任选亚端粒区、复制起点、重组泊靠位点(docking site)、多肽和/或赋予对除草剂双丙氨膦抗性的标记(例如选择标记基因例如PAT)(Wohlleben等(1988)Gene 70：25-37)、或另一合适的选择标记或筛选标记(例如RFP和/或CFP)。构建体也可包含其它标记基因，或者可与包含标记的额外多核苷酸构建体共同转化。基本上如下所述地进行转化。

来自8-11DAP的未成熟玉米穗在30％漂白粉溶液和0.5％Micro去污剂溶液中表面消毒20分钟，用无菌水清洗两次。切下未成熟胚，将胚轴侧面向下放置(胚子叶侧朝上)，每板50个胚，在560L培养基中在26℃避光培养1-3天。转化之前，将未成熟胚移至560Y培养基过4小时，然后在2.5cm靶区内排列，准备进行轰击。

如下所述，用水溶性阳离子型脂质Tfx^TM-50(产品目录号E1811，Promega，Madison，WI，USA)将DNA沉淀到0.6μm(平均直径)金珠上：在冰上用1μg玉米着丝粒DNA构建体(10μl)制备DNA溶液；任选其它构建体用于共同轰击，例如50ng(0.5μl)PHP21875(BBM)和50ng(0.5μl)PHP21139(WUS)；混合DNA溶液。向预混的DNA中加入20μl制备的金颗粒(15mg/ml)的水溶液；10μl Tfx-50的水溶液；小心混合。在制备大载体(macrocarrier)期间，可将该溶液贮存于冰上，通常约10分钟。沉淀的金颗粒在微量离心机中以10,000rpm离心1分钟，除去上清液。用100ml 100％EtOH小心清洗沉淀，别让沉淀重悬浮起来，再小心除去EtOH清洗液。加入20μl 100％EtOH并用短时超声处理，小心重悬浮颗粒，将10μl点样到各大载体中心并让其干燥约2分钟，然后进行轰击。

对玉米靶胚的样品板每板轰击2次，每次轰击使用约0.5μgDNA，用Bio-Rad PDS-1000/He仪器(Bio-Rad Laboratories，Hercules，CA)，破裂压力450PSI，真空压力27-28英寸Hg，粒子飞行距离8.5cm。

轰击后，将胚移至560P固体培养基，于26℃避光维持4-6天，然后移至含3mg/L双丙氨膦的560R选择培养基，每2周进行一次传代培养。约10周选择后，将选出的愈伤组织抗性克隆移至288J培养基，以启动植物的再生。体细胞胚成熟后(2-4周)，将发育良好的体细胞胚移至272V培养基进行萌发并移入有光照的培养室。约7-10天后，将发育的小植株移栽到小管中的272V无激素培养基培养7-10天，直到小植株长势良好。再将植株移栽到铺有盆栽土的平板衬垫(inserts in flats)(相当于2.5″花盆)中，放在培养室内生长1周，然后再放在温室内生长1-2周，接着移至传统600花盆(1.6加仑)中并让其生长至成熟。

E.大豆的粒子轰击

基本上采用以下文献所述方法，通过粒子轰击，将多核苷酸、多核苷酸混合物和任选多肽导入大豆胚胎发生悬浮培养基中：Parrott等(1989)Plant Cell Rep 7：615-617。对该方法进行了修改，如下所述。

从未成熟豆荚中取出种子，选择长度小于4mm的子叶。种子在0.5％v/v漂白粉溶液中消毒15分钟，再用无菌蒸馏水清洗。通过先切去含胚轴的种子部分，切开未成熟的子叶。再用解剖刀片的钝端小心推挤种子远端，从种皮中取出子叶。将子叶放入装有SB1起始培养基的培养皿中(平侧向上)。将培养皿在26℃在光照下保温(16hr天；75-80μE)。培养4周后，将子叶移至新鲜SB1培养基。再过2周后，切开表现出增殖区的球形期体细胞胚并移至FN Lite液体培养基中(Samoylov等(1998)In Vitro Cell Dev Biol Plant 34：8-13)。将约10-12个体细胞胚小簇放入装有35ml SB172培养基的250ml烧瓶中。将大豆胚胎发生悬浮培养物维持在35mL液体培养基中，在旋转摇床上，150rpm，26℃并有荧光灯(20μE)，按照16∶8小时的白/昼时间表。培养物每隔一周传代培养一次，即将约35mg组织接种到35mL液体培养基中。

再用粒子枪轰击，转化大豆胚胎发生悬浮培养物(Klein等(1987)Nature 327：70；美国专利4,945,050)。BioRad

PDS1000/HE仪器可用于这些转化。选择标记基因可用于促进大豆转化，例如可使用表达盒，其含有花椰菜花叶病毒35S启动子(Odell等(1985)Nature 313：810-812)、质粒pJR225的潮霉素磷酸转移酶基因(来自大肠杆菌；Gritz等(1983)Gene 25：179-188)和根癌土壤杆菌Ti质粒的T-DNA的胭脂碱合酶基因的3′区。

向50μL 60mg/mL 1μm金颗粒悬液中加入(按顺序)：5μL DNA(1μg/μL)、20μl亚精胺(0.1M)和50μLCaCl₂(2.5M)。将颗粒制备物搅拌3分钟，在微量离心机中离心10秒钟，取出上清液。DNA包被的颗粒在400μL70％乙醇中洗涤1次，再重悬于40μL无水乙醇。DNA/颗粒悬液用超声处理3次，每次1秒钟。再将5μL DNA包被的金颗粒加载到每个大载体盘。

将约300-400mg 2周龄的悬浮培养物放在空的60x15mm培养皿中，用移液管从组织中吸出残留液体。膜破裂压力设定在1100psi，将小室抽真空至28英寸汞。将组织放在距离保留屏(retaining screen)约8cm远，轰击3次。轰击后，将组织分成两半，放入2个单独的瓶中，每瓶装有35ml FN Lite培养基。

轰击后5-7天，液体培养基用新鲜培养基更换。轰击后11天，培养基用含50mg/mL潮霉素的新鲜培养基更换。该选择性培养基每周更换。轰击后7-8周，观察到从未转化的坏死的胚胎发生簇中长出绿色转化组织。取出分离的绿色组织并接种到单个瓶中，以再生出新的无性繁殖的转化胚胎发生悬浮培养物。每个新系都当作独立转化事件来处理。再将这些悬浮液传代培养并维持未成熟胚簇，或者通过单个胚的成熟和萌发，使组织再生成为完整植株。

对于再生，事件与液体培养基无关，成熟过程开始于固体培养基。从液体SB196中取出胚胎发生簇，点样在无菌滤纸上，放在固体琼脂培养基SB166上过1-2周。破碎组织块或用勺子小心挤压。将直径约4-5mm的约10-20个组织块在培养基SB103或SB148中传代培养3周，产生胚。在冷的白色荧光灯泡和Agro灯泡(40瓦)下以光强度为90-120μE/m2s的16∶8小时的光周期，在26℃将胚培养4-6周。成熟4-6周后，将单个胚放入用纤维带密封的大(60x 25mm)无菌培养皿中或放入塑料盒(没有纤维带)过4-7天，使其干燥。将干燥的胚放入装有固体SB71-4培养基的通风圆培养容器(RCV)中或在100x25mm培养皿中，在冷的白色荧光灯泡和Agro灯泡(40瓦)下以光强度为90-120μE/m2s的16∶8小时的光周期，在26℃萌发以产生小植株。将小植株栽到浅盘(cell pack tray)中并放在培养箱中过约2周，条件为16小时光周期，26℃/24℃白/昼温度，然后移栽到土壤中以产生种子。

F.植物细胞培养基

培养基560L含有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/LEriksson氏维生素混合物(1000X Sigma 1511)、0.5mg/L硫胺素HCl、20g/L蔗糖、1.0mg/L 2，4-D和2.88g/L L-脯氨酸(用去离子H₂O定容，然后用KOH调节至pH 5.8)；2.0g/L脱乙酰吉兰糖胶(Gelrite

)(用去离子H₂O定容后再添加)；和8.5mg/L硝酸银(培养基灭菌并冷却至室温后再添加)。

培养基560P含有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/LEriksson氏维生素混合物(1000X Sigma 1511)、0.5mg/L硫胺素HCl、30g/L蔗糖、2.0mg/L 2，4-D和0.69g/L L-脯氨酸(用去离子H₂O定容，然后用KOH调节至pH 5.8)；3.0g/L脱乙酰吉兰糖胶(Gelrite

)(用去离子H₂O定容后再添加)；和0.85mg/L硝酸银(培养基灭菌并冷却至室温后再添加)。

培养基560Y含有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/LEriksson氏维生素混合物(1000X Sigma 1511)、0.5mg/L硫胺素HCl，、120g/L蔗糖、1.0mg/L 2，4-D和2.88g/L L-脯氨酸(用去离子H₂O定容，然后用KOH调节至pH 5.8)；2.0g/L脱乙酰吉兰糖胶(Gelrite

培养基560R含有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/LEriksson氏维生素混合物(1000X Sigma 1511)、0.5mg/L硫胺素HCl、30.0g/L蔗糖和2.0mg/L 2，4-D(用去离子H₂O定容，然后用KOH调节至pH 5.8)；3.0g/L脱乙酰吉兰糖胶(Gelrite)(用去离子H₂O定容后再添加)；和0.85mg/L硝酸银和3.0mg/L双丙氨膦(培养基灭菌并冷却至室温后再添加)。

培养基288J含有4.3g/L MS盐(Gibco 11117-074)、5.0ml/L MS维生素贮液(0.100g/L烟酸、0.02g/L硫胺素HCl、0.10g/L吡哆醇HCl和0.40g/L甘氨酸，用去离子H₂O定容)(Murashige和Skoog(1962)Physiol Plant 15：473)、100mg/L肌醇、0.5mg/L玉米素、60g/L蔗糖和1.0ml/L 0.1mM脱落酸(用去离子H₂O定容，然后调节至pH 5.6)；3.0g/L脱乙酰吉兰糖胶(Gelrite)(用去离子H₂O定容后再添加)；和1.0mg/L吲哚乙酸和3.0mg/L双丙氨膦(培养基灭菌和冷却至60℃后再添加)。

培养基272V含有4.3g/L MS盐(Gibco 11117-074)、5.0ml/L MS维生素贮液(0.100g/L烟酸、0.02g/L硫胺素HCl、0.10g/L吡哆醇HCl和0.40g/L甘氨酸，用去离子H₂O定容)、0.1g/L肌醇和40.0g/L蔗糖(用去离子H₂O定容，然后调节至pH 5.6)；和6g/L细菌培养用琼脂(bacto-agar)(用去离子H₂O定容后再添加)，灭菌并冷却至60℃。

培养基SB1含有MS盐(Gibco/BRL-产品目录号11117-066，1pk/L)、B5维生素贮液1ml/L、20mg/L 2，4-D、31.5g/L蔗糖、8g/L TC琼脂，pH 5.8。

B5维生素1000X贮液含有10g肌醇、100mg烟酸、100mg吡哆醇HCl、1g硫胺素、去离子H₂O加至100ml，分成等分试样并贮存于-20℃。

G.从愈伤组织和叶组织分离DNA

可筛选存在转基因的推定的转化事件。可用植物核分离、裂解和HMW纯化、或使用修改的CTAB(十六烷基三乙基溴化铵，SigmaH5882)方法，从愈伤组织、叶或其它组织中提取基因组DNA，所述方法参见Stacey和Isaac(1994载于Methods in Molecular Biology第28卷，第9-15页，P.G.Isaac主编，Humana Press，Totowa，NJ)。在液氮中将约100-200mg冷冻组织磨成粉末并在1ml CTAB提取缓冲液(2％CTAB，0.02M EDTA，0.1M TrisHCl pH 8，1.4M NaCl，25mM DTT)中在65℃匀浆30分钟。让匀浆样品冷却至室温达15分钟，然后用约1ml 24∶1(体积比)氯仿∶辛醇提取单一蛋白质。样品在13,000rpm离心7分钟，用广口移液管头收集上清液上层。通过在冰上的95％乙醇中保温1小时，从上清液中沉淀DNA。DNA丝缠绕在玻璃钩上，在含0.2M乙酸钠的75％乙醇中洗涤10分钟，风干5分钟，然后重悬于TE缓冲液。向样品中加入5μl RNA酶A，并在37℃保温1小时。为了定量测定基因组DNA，用0.8％琼脂糖凝胶的1x TBE缓冲液，进行凝胶电泳。1微升的各样品分级分离为200、400、600和800ng μl-1λ未切割DNA标记。

实施例7.转化结果

基本上按照实施例6D所述，通过粒子轰击，转化在8-11 DAP的未成熟Hi-II玉米胚。用ODP2、WUS和/或ODP2+WUS载体，以及改型BAC DNA构建体，共同转化胚。在轰击后2周，转化细胞增殖形成具有多个体细胞胚的胚胎发生愈伤组织。这些体细胞胚中的某些表达作为可稳定遗传标记的荧光DsRed2标记基因。切割单个体细胞胚并作为独立转基因事件而在双丙氨膦选择培养基上增殖。自每个事件，建立无性繁殖的愈伤组织培养物。

用FISH进行各转化事件的初次筛选。按照实施例8所述，单个体细胞胚用于制备染色体铺片，用于FISH。用针对mo-PAT/DsRed2标记(PHP23715)和CentC串联着丝粒重复序列的单独FISH探针，以分别检测转基因标记和着丝粒DNA序列遗传性，表征每个事件。

初次筛选后，将所选目标转化事件移至再生培养基中，产生小植株，最终移至土壤，以恢复植物。生长期后，通过FISH分析根尖压片，第2次筛选所选植物，以再次证实遗传性。

A.BAC库的共同转化实验

用DNA构建体库共同转化胚。这些库可包括来自含玉米着丝粒重复序列的BAC克隆的DNA构建体的组合，来自含端粒和/或亚端粒DNA区段的BAC克隆的DNA构建体、可见标记质粒PHP23715和编码生长增强蛋白即胚珠发育蛋白-2即ODP-2(PHP21875)的多核苷酸和Wushel(PHP21139)质粒。来自着丝粒BAC克隆的DNA构建体包含这样的BAC克隆：其仅有CentC、仅有CRM2，仅有CentC和CRM2，以及具有所有4个着丝粒重复序列CentA、CentC、CRM1和CRM2的核心BAC。

通过FISH分析用含着丝粒DNA的BAC库转化的80个愈伤组织表明，除了正常着丝粒位点之外，新CentC簇有42个细胞遗传学可检测事件。在某些实例中，玉米着丝粒元件用于转化插入天然染色体，导致双着丝粒结构。这些着丝粒DNA序列的插入序列在大小(重复序列数量)、每条染色体中的插入数量(在一条染色体中至多可检出3个)和具有插入的染色体数量(至多4条染色体具有至少一个插入序列)上不同，所有插入序列与RFP标记质粒探针共同定位。这表明外源DNA片段可装配成大区组并可整合到玉米染色体中。

B.用体外连接着丝粒BAC克隆、端粒序列和标记序列而装配的线状微染色体原型DNA构建体进行转化

按照实施例1D所述，鉴定具有反向CentC串联重复序列的Mo17BAC克隆(bacm.pk128.j21)。通过PCR扩增端粒寡核苷酸而产生端粒序列并在质粒载体中克隆。通过与选择标记(moPAT、AmCyan1、DsRed2)、18-26S rRNA NTS复制起点(ori)和端粒序列(TEL)进行体外装配，从这个BAC克隆产生线状DNA构建体。每个DNA片段都具有识别位点，一旦连接后，就允许装配成独特结构。装配的线性化构建体包含：

TEL-(SpeI)-ubi pro::ubi 5′UTR::ubiintron::AmCyan::moPAT-(NotI)-bacm.pk.128J21-(NotI)-ori-ubi pro::ubi5′UTR::ubi intron::DsRed::moPAT-(SmaI)-TEL

通过生物射弹转化，将含有装配构建体以及连接副产物的全部连接混合物递送到未成熟Hi-II胚中。根据荧光标记和选择标记的选择(PAT)，超过200个事件增殖为单个愈伤组织克隆。回收了3组克隆：仅显示红色荧光标记(72个)，仅显示蓝色荧光标记(83个)或两种都显示(137个)的那些。选择同时表达这两种标记的事件，用于进一步通过FISH进行分析。

除了简单整合事件，在同一染色体或不同染色体中观察到各种多重整合事件。在2个事件中，我们观察到染色体重排。着丝粒重复序列CentC的额外插入位点与标记探针PHP23715共同定位，表明可能形成双着丝粒染色体。对后期分裂细胞进行分析表明，染色体桥与具有2个功能性着丝粒的双着丝粒染色体的存在是一致的，因为外源着丝粒CentC DNA序列的整合。双着丝粒染色体的形成、后期染色体桥的出现和染色体断裂的诱导显示出着丝粒功能。这些结果表明，染色体元件在植物细胞中可自我装配成多拷贝区组，与染色质蛋白结合，而且在某些情况下还可获得着丝粒功能。

一个事件表明，重排染色体6在核仁组织区(NOR)附近具有2个着丝粒DNA构建体插入位点，以及一个额外微染色体样结构，其具有一个大着丝粒区和一个额外的着丝粒DNA构建体的小插入位点。该事件的细胞学显示出由于形成双着丝粒染色体而引起的染色体断裂。

C.用线性化改型的BAC克隆库进行转化

基本上按照实施例5E所述，用转座酶系统(EPICENTREEZ::TN^TM pMOD^TM-2MCS转座子构建载体系统(EpiCentre，Madison，WI，USA))，若干BAC克隆用Tn5-3定制转座子改型。将它们线性化并用于生物射弹转化玉米Hi-II未成熟胚：

1.将具有反向着丝粒CentC重复序列区组的改型bacm.pk128.j21克隆的7个不同变异体(代表不同转座酶产生的插入序列插入到同一BAC克隆中)混合；

2.结合84个改型着丝粒核心组BAC克隆，产生4个库，各自具有21个单独变异体(表8)。这4个库的每一个单独用于生物射弹转化；

3.将来自染色体4的改型着丝粒BAC克隆分为2个库，其含有来自B73的3个BAC克隆和来自Mo17的3个BAC克隆(表9)；和，

4.将表8的库1分为5个或6个改型着丝粒核心组BAC克隆的4个亚库(表10)。每个亚库都单独用于生物射弹转化。

表10

亚库1.1	亚库1.2	亚库1.3	亚库1.4
				bacm.pk007.a2	bacm.pk133.b10	bacm.pk119.a23	bacm.pk075.l6
bacm.pk036.e13	bacm.pk077.k5	bacm2.pk174.e4	bacm.pk0066.j14
				bacm.pk178.c10	bacm2.pk179.b18	bacm2.pk116.g16	bacm2.pk099.m24
bacm2.pk179.e1	bacm.pk0133.b11	bacm2.pk023.e24	bacm2.pk093.h11
				bacm2.pk064.e15	bacm2.pk066.m12	bacm.pk135.l6	bacm2.pk083.a2
			bacm.pk076.m3

对于以上各实施例，用ODP2、WUS和/或ODP2+WUS表达载体和改型BAC库共同转化Hi-II未成熟胚。

当来自BAC克隆的线性化改型构建体用于转化时，发现若干不同类型的转化事件。例如，当来自含有反向着丝粒CentC重复序列区组(bacm.pk128.j21)的BAC、或BAC克隆核心组的改型库或亚库的构建体用于转化时：

1.单整合到宿主染色体的常染色质区；

2.多整合到宿主染色体的常染色质区；

3.单整合到宿主染色体着丝粒区；

4.多整合到宿主染色体着丝粒区；

5.导致染色体断裂的整合，例如染色体臂减少或某些染色体区重复的玉米染色体的新的不常见变异体，例如具有2个NOR、或形成双着丝粒染色体的染色体6；

6.一旦整合，就局部扩增标记和着丝粒构建体；

7.在某些细胞中，标记和着丝粒构建体扩增到染色体外染色质区段；

8.产生具有类似于天然染色体的功能性着丝粒的新微染色体，例如在有丝分裂中自主分离。

这些观察结果表明，改型着丝粒BAC克隆bacm.pk128.j21和改型BAC克隆库核心组能够诱导不同的细胞遗传学效应，例如双着丝粒染色体的形成、染色体的断裂、转基因构建体的局部扩增和染色体外元件(即微染色体)的形成。

如下所述，单一BAC或着丝粒特异性BAC库用Tn5-3构建体改型，随后将其线性化而形成线状转化构建体，从而导致成功微染色体事件：

1)着丝粒特异性BAC库1核心组(表8)或库1的亚库(表10)；

2)着丝粒特异性BAC库3核心组(表8)；

3)单个BAC克隆bacm.pk128.j21，其具有反向CentC重复序列；和，

4)3个B73染色体4着丝粒特异性BAC克隆(表9)。

在通过用线性化Tn5-3改型核心组BAC库1进行生物射弹转化而产生的事件中，发现第一玉米微染色体事件(CMC3库1事件#14)(表8)。在选择性培养基上，活跃生长的胚胎发生愈伤组织表达DsRed2可见标记。对中期进行FISH分析表明0、1、2或3个额外微染色体具有不同形式和大小(图1-4)。在该事件中，所研究的80个核中有60个具有1、2或3条微染色体以及20条天然染色体的正常互补序列。在中期进行测定，这些人工染色体的大小范围为约20％至约50％平均天然玉米染色体。在前中期进行的初步测定表明微染色体的大小相对不变，而天然染色体则变长约4-5倍，因此在该时期所测定的微染色体是平均天然玉米前中期染色体长度的约5％至约15％。通过FISH测定，微染色体主要由着丝粒重复序列和Tn5-3组分组成。也观察到具有更复杂组织的环状染色体的形成的若干实例。这些新形成的微染色体在有丝分裂期间明显能够复制和分离(图4)，但是分离不完美，观察到某些不分离，导致细胞中微染色体数量上的变化。在选择下，CMC3库1事件#14愈伤组织保持活跃生长达至少10个月，在不同时间点取样，并通过FISH分析证实，经过多轮有丝分裂细胞分裂，稳定维持了微染色体。也通过FISH分析了该事件即CMC3库1事件#14，用于分析端粒的存在，使用Telo-31重叠寡核苷酸探针(SEQ ID NO：192和193)使用愈伤组织中期核。在每一微染色体上都观察到2-4个telo-31阳性转化灶(focus)，其中所观察的2个转化灶代表在该分辨率下无法区分的4个单独转化灶。在每个样品中，在微染色体上telo-31信号强度通常比天然染色体上观察到的信号更微弱。从该事件再生植物，用FISH分析其根尖，以确定微染色体通过在温室环境中连续有丝分裂是否仍可遗传。从该转化事件再生的19株植物中有5株显示存在微染色体。4株植物具有高发生率的核，其具有1条微染色体加上20条天然染色体的正常互补序列。第5株植物的大多数核都具有1、2或3条微染色体和20条天然染色体的正常互补序列。上述所有微染色体主要包含着丝粒重复序列和Tn5-3组分。

然后，将改型核心组BAC库1进一步分为具有5-6个改型核心组BAC克隆的4个亚库(表10)。FISH分析表明亚库1.1和1.3产生的胚性愈伤组织中存在微染色体。从亚库1.1产生2个微染色体事件：第一事件具有20条染色体的正常互补序列以及1条微染色体，该染色体不以可检测水平与PHP23715标记或CentC杂交；第二事件显示出24-28条染色体，3拷贝的染色体6和1条微染色体。根据FISH观察，该微染色体对CentC呈阳性，但对PHP23715探针却不呈阳性。通过天然染色体整合和断裂、和/或由非整倍体产生或来自非整倍体的条件，产生该事件。亚库1.3产生5个事件。这5个事件中有3个看来是从头形成微染色体，并且具有20条染色体的正常互补序列以及1条微染色体，而且通过FISH分析中期的最初愈伤组织事件，微染色体对PHP23715标记和CentC呈阳性。用Telo-31重叠寡核苷酸探针(SEQ ID NO：192和193)并用愈伤组织中期核，通过FISH进一步分析这些事件之一即CMC3亚库1.3事件#27，分析端粒的存在。该事件具有非常小的微染色体，每条微染色体上具有两个强烈CentC转化灶和2个telo-31转化灶。所观察的2个telo-31转化灶可代表4个单独的转化灶，其在该分辨率下无法区分。该事件具有比前述事件中观察到的更小的微染色体。当在中期测定时，微染色体长度为约0.5-1微米，其为其它独立事件中微染色体大小的约三分之一至约二分之一。在微染色体上，telo-31的FISH信号通常比天然染色体上的更微弱。在选择下，CMC3亚库1.3事件#27的愈伤组织保持活跃生长达至少10个月，在不同时间点取样，并通过FISH分析证实，经过多轮有丝分裂细胞分裂，稳定维持了微染色体。两个其它亚库1.3事件具有19条正常染色体加上一条微染色体，可能是整合和染色体断裂的结果。采用FISH分析，两个微染色体中的一个仅对CentC呈阳性，第二个同时对PHP23715标记和CentC呈阳性。使用FISH对愈伤组织中期核进行分析，所有亚库事件看来基本上类似于所产生的其它微染色体事件的相应样品，如图1、2、5、6和9所示。来自亚库1.3的单个BAC克隆进一步用于转化未成熟胚细胞。两个改型载体，bacm.pk119.a23和bacm2.pk174.e4，产生微染色体。这两个事件含有与1-2条微染色体互补的二倍体组的玉米染色体。

从Hi-II未成熟胚用线性化改型核心组BAC克隆库3的生物射弹转化事件，观察到另一个微染色体事件(图5-8)(表8)。所得胚胎发生愈伤组织在双丙氨膦选择培养基上呈阳性，并且表达DsRed荧光标记蛋白。FISH分析表明，该事件是四-非整倍体(tetra-aneuploid)，其中仅观察到39条染色体，因为一条染色体6缺失。在该事件中，每个核都具有0、1或2条微染色体。如库1的第一微染色体事件所述，该事件的微染色体主要包括着丝粒重复序列和Tn5-3组分。在后期，微染色体的姐妹染色单体可以分离(图7)，表明存在功能性着丝粒。以上结果表明，微染色体可自主复制并通过连续有丝分裂显示出稳定性。

从Hi-II未成熟胚用线性化、Tn5-3改型BAC克隆bacm.pk128.j21的生物射弹转化事件，观察到另一个微染色体事件(图9-10)。此外，这个事件的胚胎发生愈伤组织在双丙氨膦选择培养基上呈阳性，并且表达DsRed荧光蛋白。从该事件再生植物，通过FISH进行根尖筛选。每个核具有0或1条微染色体。在具有微染色体的核中，仅观察到20条天然染色体中的19条。对中期铺片进行FISH分析表明，单个微染色体主要包括着丝粒重复序列和Tn5-3组分。

从Hi-II未成熟胚用线性化、Tn5-3改型的3个B73染色体4着丝粒特异性BAC克隆的生物射弹转化事件，观察到另一个微染色体事件bCMC4事件#73(表9)。所得到的胚胎发生愈伤组织事件在双丙氨膦选择培养基上呈阳性，并且表达DsRed荧光标记蛋白。FISH分析表明，该事件是非整倍体，其中仅观察到19条染色体和1或2条微染色体。类似于上述微染色体，该事件的微染色体主要包括着丝粒重复序列和Tn5-3组分。

对所有微染色体事件的观察表明，新形成的微染色体主要来自一级线状DNA构建体的串联或/和扩增，所述构建体递送给植物细胞以从头产生微染色体。

用免疫荧光，用针对着丝粒/动粒特异性蛋白即着丝粒蛋白C(CENPC)产生的荧光标记抗体，进一步分析了3个微染色体事件。核铺片的免疫染色表明，CENPC与天然染色体着丝粒区特异性结合。另外，在所研究的所有3个微染色体事件中，CENPC定位于所有微染色体的明确位置上(图3、4、8和10)。联合FISH和免疫定位表明，CentC重复序列和DsRed2标记探针定位与微染色体上的CENPC重叠。正如在天然染色体中所观察到的，在中期，微染色体具有CENPC的两个独特转化灶(图3、8和10)，在后期，微染色体的姐妹染色单体分离，每条姐妹染色单体具有单个CENPC转化灶(图4)。以上结果表明，微染色体可募集必需蛋白质，例如CENPC，用于动粒形成，因此天然染色体在有丝分裂和减数分裂期间，在复制和分离到子细胞中自主起作用。

产生了几千个双丙氨膦抗性、DsRed阳性玉米转基因事件，至少几百个已经进行细胞学表征。事件显示整合到宿主染色体的频率很高，约60％的事件显示出经FISH可检出的整合。可见标记和选择标记在约39％的事件中同时存在，但FISH分析不可检出。迄今为止，大部分重组构建体组合产生同时含有标记和CentC重复序列的微染色体，仅在约1％事件中可由FISH检出(4个事件，图1-10)。例外的是亚库1.3，其在所分析的约12％事件(34个中有4个)中产生同时含标记和CentC重复序列的微染色体。如上所述成功地产生微染色体的BAC克隆用于转化实验，不与ZmODP2载体和ZmWUS载体共转化。在最初用于转化的超过6,500个胚中，有149个恢复事件含有整合BAC序列，但未检测到微染色体。

单独和/或在库中产生微染色体事件的包含玉米着丝粒序列的若干BAC克隆已经于2008年5月21日保藏于美国典型培养物保藏中心(ATCC)专利保藏库(Patent Depository)(Manassas，Virginia)并且给予专利保藏号PTA-9213-PTA-9218。这些保藏物将在国际承认用于专利程序的微生物保藏布达佩斯条约的条款下保藏，用于专利程序的目的。这些保藏物仅仅为了便于本领域技术人员而制得而并不是承认在35U.S.C.§112.下需要保藏物。

BAC克隆ID	ATCC专利保藏物指定号
		bacm2.pk174.e04	PTA-9213
bacm.pk128.j21	PTA-9214

bacm2.pk116.g16	PTA-9215
		bacm2.pk023.e24	PTA-9216
bacm.pk119.a23	PTA-9217
		bacm.pk135.l06	PTA-9218

D.人工微染色体的大小测定

通过测定所装配的微染色体和染色体6的大小，进一步表征具有自主玉米微染色体的3个事件，其可由18-26S rDNA FISH探针容易地鉴定。所有测定都在中期核上进行，这给出最一致的测定。其它时期少有界定，染色体大小高度变化，例如，在前中期进行的初步测定表明，相对于中期测定而言，微染色体的大小相对不变，而天然染色体则变长约4-5倍，因此在该时期所测定的微染色体是平均天然玉米前中期染色体长度的约5％至约15％。因此，在中期测定的微染色体可能比天然染色体更长，如果在不同时期测定的话。用Leica DMRXA荧光显微镜测量染色体，用Photometrics CoolSnap CCD相机捕获图像，用Metamorph

图像分析软件(Molecular Devices，Sunnyvale，CA，USA)进行图像测定。所有测定都以微米计。

天然染色体6(n＝29)：

平均值＝4.62(l)和2.38(w)

范围＝3.16-5.78(l)和2.06-2.70(w)

微染色体(n＝37)：

平均值＝1.29(l)和1.67(w)

范围＝0.75-3.07(l)和1.12-3.17(w)

玉米微染色体的长度平均占染色体6的约28％，但范围为中期染色体6总长度的约13-97％。

所观察到的玉米微染色体的大小也可以Mb来估计。例如，玉米基因组包含约2500Mb总DNA，其染色体大小范围为约150-350Mb，染色体6为约200Mb(Seneca 60)。

E.细胞学分析

用细胞学方法在3个事件(库1事件#14，亚库1.3.事件#27和bacm2.pk174.e4事件#96)中分析微染色体组成，在所述事件中微染色体互补20条天然玉米染色体。

首先，采用一组类似于以下文献所用的重复探针，在野生型细胞和转基因细胞中分析天然染色体的核型：Kato等(2004)Biochem Biophys Res Commun 321：280-290。除了CentC重复序列之外，探针还包括18-26S rDNA的非转录间隔序列、180bp knob重复序列、微卫星AGT重复序列和266bp亚端粒重复序列。该分析表明，在所有3个事件的天然染色体中都没有出现可见的染色体重排和/或畸变。另外，微染色体不与除CentC之外的任何探针杂交。

第二，将微染色体与来自亚库1.3的5个完整的基于BAC的构建体的混合物杂交。该探针的杂交跨越所分析的微染色体的整个实体，表明它们含有高比例的递送的DNA分子。为了检测基因组DNA序列的存在，我们也开发了对6个冗余基因组反转录元件(Cinful-1、Grande、Huck、Opie-2、Prem-2/Ji和Tekay)的LTR区具有特异性的一组重叠寡核苷酸探针(Mroczek和Dawe(2003)Genetics 165：809-819)。DNA杂交表明，在来自库1的21个BAC中，有11个存在着至少一个这些反转录元件。将仅在21个BAC中的5个BAC中存在的4个反转录元件(Opie-2、Huck、Prem-2和Grande)分别标记并混合用于涂染(paint)微染色体事件中的染色体。发现来自用库1(库1事件#14)产生的事件的染色体含有这些反转录元件，但不能测定这些反转录转座子的起源，因为这21个合并BAC中有5个在DNA杂交中与这些序列杂交。因此，分析了用5个BAC的较小的库(其中仅一个BAC与Prem-2杂交，但不与其它3个反转录元件杂交)产生的另一事件(亚库1.3事件#27)。当所有4个探针同时使用时，该事件仍然显示出对微染色体的强烈而散布的覆盖。然而，使用4个RT序列的每一个作为单独的探针却产生明显不同的模式。当Huck在微染色体上高度散布时，其余3个反转录元件以低水平存在。对于详细分析的2个事件，杂交结果清楚表明所引入BAC和反转录元件彼此交替分布。对于以该方式分析的3个微染色体事件(bacm2.pk174.e4事件#96)，反转录元件覆盖微染色体的整个实体，而BAC序列覆盖大约一半。

最后，事件与改型成转化构建体或由共转化提供的元件杂交。与ZmODP2探针和ZmWUS探针的杂交表明这些质粒掺入到微染色体中。通过FISH，使用(CCCTAAA)n探针，检测人工微染色体中端粒序列的存在。在正常染色体和所检测的每一条微染色体中检测到端粒DNA。例如，在CMC3库1事件#14中，较大的微染色体表明4个端粒序列阳性转化灶的存在，一个在两个姐妹染色单体的任一端。

我们断定在某些事件中微染色体显然是由染色体断裂产生，尽管对其它事件作出的观察与微染色体从头形成的可能性一致。

实施例8：方法

基本上按照以下文献所述，从未成熟玉米穗或绿叶中分离DNA：Ananiev等(1997)Proc Natl Acad Sci USA 94：3524-3529。用Nucleobond 质粒试剂盒(BD Biosciences Clontech，California)，按照制造商的推荐，分离BAC克隆DNA。基本上按照以下文献所述，在琼脂糖凝胶块中制备高分子量DNA：Liu和Whittier(1994)Nucl Acids Res 22：2168-2169。如以下文献所述，使用标准技术进行DNA限制性消化、凝胶电泳、DNA印迹和滤膜杂交：Sambrook等(1989)Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor Laboratory第1-3卷。以上参考文献全部通过引用结合到本文中。

A.重叠寡核苷酸探针标记，用于菌落和DNA印迹杂交

各探针的混合重叠寡核苷酸(各寡核苷酸5pmol)与以下组分混合：2μl 10x克列诺(Klenow)缓冲液、1μl克列诺酶(5U/μl)、1μl 1mMdGTP、1μl 1mM dTTP、[α-³²P]dCTP和[α-³²P]dATP-各5μl，用无菌水加至终体积为20μl。将反应混合物在14℃保温2小时。求出结合率，认为大于等于50％是可接受的。

B.膜制备和杂交

用在Mo17 EcoRI和HindIII BAC文库间均匀分布的432个384孔板，制备膜。使用允许将96板与384孔点样到一个Millipore Imobilon N+尼龙膜(Bedford，MA)上的4x 4网格模式。带网格的96板包括90个BAC克隆板和6个质粒克隆板，用作网格标记。加网格后，将膜小心放在含17μg/mL氯霉素的LB(Luria-Bertani)琼脂平板上的细菌一侧，盖好平板，翻转，在37℃培养过夜。菌落生长后，从平板上取下膜，各自在1.5M NaCl和0.5M NaOH中变性5分钟，然后在1.5M NaCl、1M Tris-HCl中中和2次，每次5分钟。将膜干燥，用蛋白酶K(100ml 1mg/mL；Sigma，St.Louis，MO)在37℃处理50分钟。

将每片膜浸泡在装入塑料盒的6x SSC、0.5％SDS溶液中。滤膜在56℃，在6x SSC、0.5％SDS中预杂交并持续搅拌至少20分钟。混合的重叠寡核苷酸探针在100℃变性5分钟，加入到已经用于预杂交的杂交液中。在56℃杂交12-16小时。在56℃，在2x SSC和0.1％SDS(洗涤1)、1.5x SSC和0.1％SDS(洗涤2)、和0.1x SSC和0.1％SDS(洗涤3)中依次将膜各自洗涤1小时。用塑料包裹膜并暴露给X射线胶片达3小时至过夜。杂交后，在100ml 0.1x SSC和0.1％SDS中剥离滤膜，在90℃过10分钟并贮存于-20℃。膜可使用多次。

C.细胞学方法

任何合适的细胞学方法和组合物，包括许多标准细胞学方法、制备等是本领域已知的，可用于检查植物组织。

i.玉米愈伤组织的核的制备

1.用于制备核制剂的愈伤组织先用氧化亚氮(150psi)充气3小时，然后立即固定。氧化亚氮使核在中期停滞，这允许改进染色体铺片，用于FISH分析。

2.在50％乙酸中固定愈伤组织样品至少1小时。组织可无限期地贮存在50％乙酸中，在-20℃。

3.从愈伤组织中分离体细胞胚，放在50μl PIM缓冲液(50mMCaCl₂、10mM乙酸钠，pH 5.8)的小培养皿中。

4.将体细胞胚切成0.5mm小块。

5.在1小时内，在PIM缓冲液中将组织洗涤3-5次，除去固定剂。缓慢吸打几次，洗涤，更换新鲜PIM缓冲液。

6.小心除去PIM缓冲液。加入50μl酶消化液(2％w/v纤维素酶(产品目录号CEL，Worthington Biochemical Corp.(Lakewood，NJ，USA))、0.2％w/v果胶酶(产品目录号PASE，Worthington Biochemical Corp.(Lakewood，NJ，USA))；0.5％w/v牛血清白蛋白)

7.在保湿室中，在室温下避光处消化组织达1-2小时。当组织开始软化时，非常轻地吸打和/或用探针挤压，以破碎较大的块状物并释放出细胞。

8.小心除去酶消化液，并更换为约50μl PIM缓冲液。

9.将游离细胞/核移至微量离心管中。加入更多PIM缓冲液以维持消化组织并轻轻吸打，以释放出细胞，将这些细胞移至微量离心管，视需要可重复。

10.沉淀细胞在微量离心机中在500rpm离心3分钟，去掉上清液。加入新鲜PIM缓冲液并轻轻地重悬浮细胞。再将该洗涤步骤重复多3次。

11.除去PIM缓冲液和并更换为50％乙酸。轻轻地重悬浮细胞。在500rpm离心10分钟，去掉上清液，加入50％乙酸。重复。

12.在-20℃，将分离核贮存于50％乙酸中。50％乙酸的终体积应当是核沉淀体积的2倍。

13.将5ul重悬浮核移至载玻片上，盖上18mm²盖玻片。

14.在70℃加热板上加热载玻片15秒。

15.将载玻片从热源移开，轻轻压下盖玻片以挤压核。

16.让载玻片很快冷却，然后将载玻片浸在液氮中达10-15秒。

17.从液氮中取出载玻片，用你的呼吸使盖玻片回暖。

18.用剃须刀片边缘迅速去掉盖玻片。

19.将载玻片放入100％EtOH中，更换2次，每次2分钟。

20.让载玻片风干。在-20℃贮存载玻片直至需要。

ii.FISH，然后进行核的直接免疫定位

a重叠寡核苷酸探针制备，用于FISH

重叠寡核苷酸探针描述于表1。

1.将10μl 100μM重叠寡核苷酸混合物(每种重叠寡核苷酸浓度相等)加入到5μl去离子水中。

2.在95℃加热1分钟，然后转移到冰中。

3.加入到以上混合物中：

-2μl 10X DNA聚合酶缓冲液(100mM Tris-HCl，pH 7.5，100mM MgCl₂、7.5mM DTT)

-0.5μl dUTP荧光团

a)dUTP-Cy3(Amersham)

b)dUTP-FITC(Roche)

c)dUTP-德克萨斯红(Texas Red)(Molecular Probe)

-2μl dNTP(200μM A-、G-、CTP；40μM TTP)

-0.5μl克列诺(Klenow)

4.在37℃保温20分钟。

5.用Quigen核苷酸提取试剂盒清洗探针。在50ml 50％甲酰胺的试剂盒洗脱缓冲液中洗脱。

b.荧光原位杂交(FISH)

基本上按照如下所述，在玻片上进行玉米核的FISH：

1.在1％v/v低聚甲醛的磷酸缓冲盐溶液(PBS)(pH 7.2)中固定载玻片10分钟。

2.洗涤2X 5分钟，在PBS中

4.洗涤2分钟，在蒸馏水/去离子水中

5.风干载玻片。

6.在80℃，在滴定的荧光探针的50％甲酰胺(终浓度为50mMMgCl₂)中杂交2分钟。

7.在37℃保湿室中，杂交30分钟至过夜。

8.洗涤5分钟，在2X SSC中

9.洗涤5分钟，在0.2X SSC中

10.风干载玻片

11.加含有DAPI的Vectashield

(产品目录号H-1200，Vector Laboratories，Burlingame，CA，USA)和盖玻片(5ml浸片介质/22mm盖玻片)

12.在显微镜下检查，视需要，用合适的滤光片组合和/或浸油。

c.免疫定位

FISH探针定位检查和表征后，这些相同样品可处理并用于免疫定位，用直接标记的抗体探针。基本上如下所述，进行荧光标记的多克隆兔抗CENPC抗体免疫定位：

1.去掉盖玻片

2.洗涤5分钟，在70％v/v EtOH中，以除去浸片介质和浸油

3.洗涤3X 5分钟，在PBS中

4.在37℃的保湿室中，在5％v/v正常兔血清(Jackson Immunoresearch，West Grove，PA，USA)的PBS-BT(PBS中含有3％w/vBSA、0.02％w/v叠氮化钠、0.5％v/v曲通X-100)中封闭1小时

5.在PBS中清洗

6.在37℃的保湿室中，与1°抗体的5％v/v正常兔血清的PBS-BT一起保温过夜。使用1∶200稀释度的兔抗CENPC-Cy3(或-FITC)，终浓度2.5μg/mL标记抗体。

7.在1小时内在PBS中洗涤3X

8.风干载玻片

9.加含有DAPI的Vectashield

(产品目录号H-1200，VectorLaboratories，Burlingame，CA，USA)和盖玻片(5ml浸片介质/22mm盖玻片)

10.用指甲油密封盖玻片

11.在显微镜下检查，视需要，用合适的滤光片和/或浸油。

d.CENPC抗体的产生和标记

按照Dawe等(1999)Plant Cell 11：1227-1238)所述，分离哺乳动物CENPC的玉米同源物，显示出是玉米动粒的组分。合成氨基端区的20个氨基酸的保守肽，用于在兔子中制备多克隆抗体(Openbiosystems，Huntsville，AL，USA)。所得抗体直接用Fluorolink-AbCy3标记试剂盒(GE Healthcare，UK)或荧光素蛋白标记试剂盒(Roche Diagnostics Corp.，Indianapolis，IN，USA)的荧光团标记。

iii.纤维-FISH

按照以下文献所述，在细胞学载玻片上制备延伸DNA纤维：Jackson等(1998)Genome 41：566-572。按照制造商的推荐，纤维-FISH的探针用生物素-11-dUTP(Roche，Germany)或DIG-dUTP(Roche，Germany)标记，用Nik翻译标记试剂盒(Roche，Germany)。沉淀后，探针重溶于TE缓冲液并贮存在-20℃。对于纤维-FISH，将探针与DNA纤维的混合物(含有50％(v/v)甲酰胺、10％(v/v)SDS和2x SSC，终体积为10μL)杂交。给载玻片盖上盖玻片，用橡胶胶水密封，在80℃保温2分钟，使探针和靶DNA变性，然后再在37℃保温。按照以下文献所述，进行杂交后的洗涤和信号检测：Zhong等(1996)Plant Mol Biol Rep 14：232-242。生物素标记的探针用以下蛋白质进行检测：荧光素-抗生物素蛋白DN(Vector Laboratories，Burlingame，CA，USA)、生物素化抗抗生物素蛋白D(Vector Laboratories，Burlingame，CA，USA)和荧光素-抗生物素蛋白DN(Vector Laboratories，Burlingame，CA，USA)。DIG-标记的探针用小鼠抗DIG单克隆抗体(Jackson ImmunoResearch，West Grove，PA，USA)和Cy3缀合的绵羊抗小鼠抗体(Jackson ImmunoResearch，West Grove，PA，USA)检测。然后将载玻片放在Vectashield浸片介质(Vector Laboratories，Burlingame，CA，USA)中。用Leica DMRXA荧光显微镜检查制备物，用Photometrics CoolSnap CCD相机捕获图像。用Metamorph

图像分析软件(Molecular Devices，Sunnyvale，CA，USA)进行图像捕获。来自各系的3-5个制备物上进行纤维-FISH。

D.着丝粒BAC测序

任何测序方法都可用于从BAC克隆或含着丝粒序列的其它构建体获取序列信息，然而，克隆大小和着丝粒序列的重复特性对于DNA的操作、制备、测序和序列装配成毗连群而言可具有技术挑战性。

可通过鸟枪法，使用衍生自随机产生的亚文库的配对末端阅读(paired-end read)，测定所有着丝粒BAC序列(Messing等(1981)Nucl Acids Res 9：309-321；Edwards等(1990)Genomics 6：593-608)。BACDNA从2xYT+氯霉素(cloramphenicol)过夜培养物中分离并通过喷雾法随机剪切。使用T4聚合酶和多核苷酸激酶(EndRepair kit，Epicentre)组合对经剪切的DNA片段进行末端修复，然后通过琼脂糖凝胶电泳分离。使用凝胶提取试剂盒(Qiagen，Inc.)，从凝胶中回收范围在2-4kb的DNA部分并亚克隆到去磷酸化的、经EcoRV消化的pBluescript II SK(+)(Promega)。连接产物经电穿孔到大肠杆菌DH-10B细胞。用自动化Q-Bot菌落挑取器(Genetix)挑取单菌落到384孔微量滴定板中并贮存在含有6％甘油和100μg/ml氨苄青霉素的冷冻培养基中。

为了测序，从阵列培养物中直接扩增单个质粒，采用Templiphi DNA方法(GE Biosciences；Dean等(2001)Genome Res 11：1095-1099；Nelson等(2002)Biotechniques 32：S44-S47)。将扩增产物稀释，在95℃变性10分钟，然后使用M13通用引物和BigDye 3.1荧光试剂盒(ABI)进行末端测序。测序产物在ABI 3730xl自动测序仪上分辨。用Phred/Phrap包来装配单个序列(Ewing等(1998)Genome Res 8：175-185)，已装配的毗连群用Consed来观察(Gordon等(1998)Genome Res 8：195-202)。基于Phrap的装配的毗连群顺序和准确性用Exgap(由A.Hua(University of Oklahoma)开发)来证实。

通过随机转座测序，使用模板Generation System II(TGS II，Finnzymes)，也可完成bacm.pk128.j21的全序列。也可进行使用特异性引物的直接测序，以分辨毗连群定向和序列空位。

Claims

1.一种包含功能性着丝粒的人工植物微染色体，所述着丝粒与着丝粒蛋白C(CENPC)特异性结合，其中所述微染色体在严格性杂交条件下与选自以下的多核苷酸特异性杂交：

(a)包含至少一个植物着丝粒元件的多核苷酸，其中所述多核苷酸选自bacm.pk128.j21、bacm2.pk023.e24、bacm2.pk116.g16、bacm2.pk174.e04、bacm.pk135.106和bacm.pk119.a23；

(b)包含至少一个植物着丝粒元件的多核苷酸，其中所述多核苷酸由选自以下的美国典型培养物保藏中心指定号的ATCC保藏物提供：PTA-9214、PTA-9213、PTA-9215、PTA-9216、PTA-9217和PTA-9218；

(c)包含来自bacm2.pk170.a08的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：194-242；

(d)包含来自bacb.pk243.l15的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：243-323；

(e)包含来自bacm.pk147.d02的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：324-373；

(f)包含来自bacm.pk184.c21的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：374-396；

(g)包含来自bacm.pk024.f21的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：397-446；

(h)包含来自bacm.pk155.l13的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：437-519；

(i)包含来自bacm.pk010.m07的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：188和520-566；

(j)包含来自bacm.pk007.b16的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：567-590；

(l)包含来自bacm.pk128.j21的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：191、591-603和695-696；

(m)包含来自bacm.pk108.h15-2的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：186-187和604-651；

(n)包含来自bacm.pk044.a19的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：652-663；

(o)包含来自bacb.pk155.h15的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：664-694；

(p)包含来自bacm2.pk023.e24的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：697-705；

(q)包含来自bacm2.pk116.g16的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：706-728；

(r)包含来自bacm2.pk174.e04的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：729-744；

(s)包含来自bacm.pk135.l06的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：745-763；和

(t)包含来自bacm.pk119.a23的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：764-810；和

(u)与(a)至(t)中任一项的多核苷酸具有至少90％序列同一性的多核苷酸。

2.一种包含功能性着丝粒的人工植物微染色体，所述着丝粒与着丝粒蛋白C(CENPC)特异性结合，其中所述功能性着丝粒包含：至少2个反向CentC串联重复序列阵列，其中第1阵列包含至少50个拷贝的CentC，第2阵列包含至少50个拷贝的CentC；和至少一个拷贝的反转录转座元件，其中所述反转录转座元件位于第1阵列和第2阵列之间，

其中所述微染色体在严格性杂交条件下与选自以下的多核苷酸特异性杂交：

(a)来自bacm.pk128.j21的多核苷酸；

(b)美国典型培养物保藏中心保藏物指定号PTA-9214提供的多核苷酸；

(c)包含来自bacm.pk128.j21的核酸序列的多核苷酸，其中所述多核苷酸选自SEQ ID NO：191、591-603和695-696；和

(d)与(a)至(c)中任一项的多核苷酸具有至少90％序列同一性的多核苷酸。

3.权利要求10的人工植物微染色体，其中所述反转录转座元件选自CentA、CRM1和CRM2。

4.权利要求1-3中任一项的人工植物微染色体，其中所述微染色体还包含至少一个功能性端粒。

5.权利要求1-4中任一项的人工植物微染色体，其中所述微染色体介于至少约5Mb至约50Mb之间。

6.包含权利要求1-5中任一项的人工微染色体的植物细胞。

7.权利要求6的植物细胞，其中所述植物细胞选自玉米、水稻、小麦、燕麦、大麦、高粱、黍、大豆、向日葵、红花、芸薹(Brassica)、苜蓿、棉花和拟南芥(Arabidopsis)。

8.权利要求6或7的植物细胞，其中所述植物细胞来自玉米。

9.包含权利要求1-5中任一项的人工微染色体的植物。

10.权利要求8的植物，其中所述植物选自玉米、水稻、小麦、燕麦、大麦、高粱、黍、大豆、向日葵、红花、芸薹(Brassica)、苜蓿、棉花和拟南芥(Arabidopsis)。

11.权利要求9-10的植物，其中所述植物是玉米。