CN101128591B

CN101128591B - 用于植物中种子偏好性表达的表达盒

Info

Publication number: CN101128591B
Application number: CN2006800061174A
Authority: CN
Inventors: E·杜维尼哥; L·P·洛亚尔
Original assignee: BASF Plant Science GmbH
Current assignee: BASF Plant Science GmbH
Priority date: 2005-02-26
Filing date: 2006-02-24
Publication date: 2013-02-13
Anticipated expiration: 2026-02-24
Also published as: US20090031440A1; AU2006217847B2; CA2598307A1; EP1856264A2; BRPI0607378A2; CA2598307C; WO2006089950A3; US20130019343A1; CN101128591A; WO2006089950A2; AU2006217847A1; US9267147B2; EP1856264B1

Abstract

本发明涉及包含转录调节核苷酸序列的表达盒，所述转录调节核苷酸序列具有植物中种子偏好性或种子特异性表达谱，可以从拟南芥基因座At1g48130所述基因或它的来自其它植物物种(例如，亚麻)的直向同源物获得。该转录调节核苷酸序列优选尤其在种子和种子组织中呈现强的表达活性。

Description

用于植物中种子偏好性表达的表达盒

技术领域

本发明涉及包含转录调节核苷酸序列的表达盒，所述转录调节核苷酸序列在植物中具有种子偏好性或种子特异性表达谱，来自如基因座At1g48130所述的拟南芥基因，或来自其它植物物种(例如亚麻(Linumusitatissimum))的直向同源物。该转录调节核苷酸序列优选在种子和种子组织中特异性地呈现强的表达活性。

背景技术

改变和/或改良表型特征(例如产量或质量)的植物操作需要在植物组织中表达异源基因。这样的遗传操作依赖于能够获得按照所需驱动和控制基因表达的手段。例如，遗传操作依赖于可以获得和使用适当的启动子，该启动子在植物中有效且调节基因表达，从而在转基因植物中给出期望的效果。

种子偏好性或种子特异性启动子对于表达基因和产生大量蛋白质、表达油或目的蛋白质(例如抗体)、增加种子营养价值的基因等等是有用的。

选择具有多种不同启动子是有利的，从而可以为特定基因、构建体、细胞、组织、植物或环境选择最适合的启动子。此外，对带有多个植物转录单元(PTU)的共转化植物增加的兴趣以及为此目的使用常用调节序列伴随的潜在问题促使利用多个启动子序列成为可行。

因此，非常需要用于鉴定能够在重要经济植物中表达所选择转基因的新序列的技术。因此，本发明的目的是为植物中种子偏好性或种子特异性的表达提供新的和备选的表达盒。通过本发明解决这一目标。

发明概述

本发明的第一个实施方案涉及用于在植物中调节种子特异性或种子偏好性表达的表达盒，其包括

i)编码过氧化物氧还蛋白(PER1)蛋白质的基因的至少一个转录调节核苷酸序列，且其与该基因功能性连接，

ii)至少一个相对于所述转录调节核苷酸序列异源的核酸序列。

优选的，本发明的表达盒包含

a)植物基因的至少一个转录调节核苷酸序列，并且其与该植物基因功能性连接，所述植物基因选自以下组成的组，

i)由GenBank的拟南芥基因组基因座At1g48130所述基因，和

ii)由GenBank的拟南芥基因组基因座At1g48130所述基因的直向同源基因，

b)至少一个相对于所述转录调节核苷酸序列异源的核酸序列。

可以或能够从植物基因组DNA的编码多肽的基因获得转录调节核苷酸序列，所述多肽

a)包含从以下氨基酸序列组成的组选择的至少一条序列基序

i)GDTVPNL(SEQ ID NO：37)，优选MPG(I/L)T(L/I)GDTVPNLE(SEQ ID NO：38)，

ii)GDFTPVC(SEQ ID NO：39)，优选LFSHPGDFTPVCTTEL(SEQID NO：40)，

iii)VKLLGLS(SEQ ID NO：41)，优选RGVKLLGLSCDD(SEQ IDNO：42)，

iv)YPI(I/M)ADP(SEQ ID NO：43)，优选SKV(T/N)YPI(I/M)ADP(SEQ ID NO：44)，

v)KLSFLYP(SEQ ID NO：45)，优选(K/V)(I/V)KLSFLYPS(SEQID NO：46)，

vi)GRNMDEV(SEQ ID NO：47)，优选TGRNMDEV(L/V)RA(SEQID NO：48)，

vii)(I/V)ATP(V/A)NW(SEQ ID NO：49)，优选K(I/V)ATP(V/A)NW(K/N)P(SEQ ID NO：50)，和

viii)PSKKGYL(SEQ ID NO：51)，优选LPSKKGYLR(SEQ IDNO：52)，

和

b)与从SEQ ID NO：13、15、17、19、21和23所述组选择的多肽具有至少50％的氨基酸序列同一性。

优选的，所述直向同源蛋白质还与拟南芥基因座At1g48130编码的蛋白质相同的酶活性。

优选的，转录调节核苷酸序列选自以下序列组成的组：

i)由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述序列，

ii)在i)的序列内至少50个连续碱基的片段，

iii)与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列具有至少50％的序列同一性的基本相似的核苷酸序列；

iv)能够与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列或其互补序列杂交的核苷酸序列(优选在条件为在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用2×SSC、0.1％SDS于50℃洗脱；更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用1×SSC、0.1％SDS于50℃洗脱；还更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.5×SSC、0.1％SDS于50℃洗脱；优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于50℃洗脱；更优选在7％十二烷基磺酸钠(SDS)、0.5MNaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于65℃洗脱)；

v)能够与包含由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述转录调节核苷酸序列的50-200个或更多连续的核苷酸的核酸或其互补序列杂交的核苷酸序列(优选在条件为在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用2×SSC、0.1％SDS于50℃洗脱；更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用1×SSC、0.1％SDS于50℃洗脱；还更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.5×SSC、0.1％SDS于50℃洗脱；优选在7％十二烷基磺酸钠(SDS)、0.5MNaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于50℃洗脱；更优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于65℃洗脱)；

vi)与在i)至v)中任一项的前述核苷酸序列互补或反向互补的核苷酸序列。

在优选的实施方案中，以上ii)、iii)、iv)、v)和vi)指定的序列能够调节植物细胞或生物体中的转录，优选所述序列与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列具有基本相同的转录活性。

优选与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列基本相似的核苷酸序列与由SEQ IDNO：1、2、3、4、5、6、7、8、9、10或11所述的序列具有至少50％或60％，优选至少70％或80％，更优选至少90％或95％，最优选至少98％的序列同一性。

优选在严格条件(包括低严格条件和高严格条件)下，更优选在高严格条件进行杂交。

待表达的异源核苷酸序列还优选有效连接于3’-非翻译区、转录终止和/和多聚腺苷化作用信号。3’-非翻译区适于稳定mRNA表达和结构。这可以延长mRNA的存在因而增加表达水平。终止和/和多聚腺苷化作用信号适于稳定mRNA表达，以保证恒定的mRNA转录物长度和防止转录通读。尤其在多基因表达构建体中，这是重要的特征。此外，正确的转录终止与从调节性5’核苷酸序列重新起始转录有关，其导致增加的表达水平。上述信号可以是在植物中有功能的任何信号，并且可以是例如从植物基因、植物病毒基因或其它植物病原体分离的。然而，在优选的实施方案中，3’-非翻译区、转录终止和多聚腺苷化作用信号来自使用作为本发明的启动子来源的基因。

可以出于多种表达目的，例如表达蛋白质或表达反义RNA、正义或双链RNA来使用表达盒。优选核酸序列的表达赋予植物有农业价值的性状。

本发明的其它实施方案涉及包含本发明的表达盒的载体，和包含本发明的表达盒或载体的转基因宿主细胞或非人类的生物。优选的生物为植物。更优选用于土壤生产的植物，例如欧洲油菜(Brassica napus)、芥菜(Brassicajuncea)、亚麻、大豆或向日葵。

本发明的另一优选的实施方案涉及用于鉴别和/或分离调节核苷酸序列的转录物的方法，其特征在于所述鉴别和/或分离利用编码如SEQ ID NO：13、15、17、19、21或23所述的多肽的核酸序列，或所述核酸序列的至少15个连续的核苷酸的部分。优选用于分离的核酸序列是如SEQ ID NO：12、14、16、18、20或22所述，或其至少15个连续的核苷酸的部分。更优选通过选自聚合酶链式反应、杂交和数据库筛选的方法实现所述鉴别和/或分离。

本发明的另一实施方案涉及提供或产生在植物中异源表达的转基因表达盒的方法，其包括步骤：

I.利用至少一条编码如SEQ ID NO：13、15、17、19、21或23所述的多肽的核酸序列，或所述核酸序列的至少15个连续的核苷酸的部分分离植物基因的转录调节核苷酸序列，和

II.将所述转录调节核苷酸序列与另一目的核苷酸序列功能性连接，所述另一目的核苷酸序列相对于所述转录调节核苷酸序列是异源的。

本发明的另一实施方案涉及提供种子特异性或种子偏好性表达的转基因表达盒的方法，其包括步骤：

I.使用至少一条核酸序列或其部分分离种子偏好性或种子特异性的转录调节核苷酸序列，其中所述序列编码如SEQ ID NO：8、10、12、14、16、18或36所述的多肽，或所述序列的至少15个连续的核苷酸部分，和

II.将所述种子偏好性或种子特异性的转录调节核苷酸序列与另一目的核苷酸序列功能性连接，所述另一目的核苷酸序列相对于所述种子偏好性或种子特异性的转录调节核苷酸序列是异源的。

优选的，分离所述转录调节核苷酸序列所使用的核苷酸序列编码的多肽包含从下列氨基酸序列组成的组中选择的至少一条序列基序：

i)GDTVPNL(SEQ ID NO：37)，优选MPG(I/L)T(L/I)GDTVPNLE(SEQ ID NO：38)，

ii)GDFTPVC(SEQ ID NO：39)，优选LFSHPGDFTPVCTTEL(SEQID NO：40)，

iii)VKLLGLS(SEQ ID NO：41)，优选RGVKLLGLSCDD(SEQ IDNO：42)，

iv)YPI(I/M)ADP(SEQ ID NO：43)，优选SKV(T/N)YPI(I/M)ADP(SEQ ID NO：44)，

v)KLSFLYP(SEQ ID NO：45)，优选(K/V)(I/V)KLSFLYPS(SEQID NO：46)，

vi)GRNMDEV(SEQ ID NO：47)，优选TGRNMDEV(L/V)RA(SEQID NO：48)，

vii)(I/V)ATP(V/A)NW(SEQIDNO：49)，优选K(I/V)ATP(V/A)NW(K/N)P(SEQ ID NO：50)，和

viii)PSKKGYL(SEQ ID NO：51)，优选LPSKKGYLR(SEQ IDNO：52)。

如这类本文提供的转录调节序列是新的，且在先前技术中没有描述。相应的，本发明的另一实施方案涉及从以下序列组成的组中选择的分离的核苷酸序列(优选具有转录调节的活性，更优选具有启动子活性)：

a)如由SEQ ID NO：1、2、3或4所述的序列，和与由SEQ ID NO：1、2、3或4所述的序列具有至少99％，优选99.5％，更优选99.8％的序列同一性的序列，和包含如由SEQ ID NO：1、2、3或4所述序列的至少600个连续的核苷酸，优选至少800个连续的核苷酸，更优选至少900个连续的核苷酸，更优选至少1000个连续的核苷酸的序列，和

b)如由SEQ ID NO：9、10或11所述序列，和与由SEQ ID NO：5或26所述序列具有至少40％或50％，优选60％或70％，更优选80％或90％，最优选95％或98％的序列同一性的序列，和包含如由SEQ ID NO：9、10或11所述序列的至少15或20个连续的核苷酸，优选至少50或100个续的核苷酸，更优选至少250个连续的核苷酸，更优选至少500个连续的核苷酸的序列。

附图说明

图1：来自拟南芥的推测的过氧化物氧还蛋白(PER1)蛋白质(At1g48130蛋白质)与它的来自其它物种，包括欧洲油菜、圆柱小麦(Triticum turgidum)、大麦(Hordeum vulgare)、黑麦状雀麦(Bromus secalinus)和亚麻的直向同源物的比对。

图2：来自亚麻的转录调节核苷酸序列的序列。将具有不同密度的启动子基序的三个启动子区框出(A、B、C)。对于有下划线基序的详细解释见实施例8。

定义

应该理解的是，本发明并非是对特定的方法学、方案、细胞系、植物种或属、构建体和此类所述试剂的限制。还应该理解的是，本文使用的术语仅为了描述特定的实施方案，而非意在限制本发明的范围，本发明的范围仅由所附权利要求限制。必须指出的是，除非另外说明，如在本文和在所附权利要求中所用的单数形式包括多个指代。因此，例如参考“载体”是对一个或多个载体的参考，且包括本领域技术人员公知的载体的等同物等等。

本文所用术语“约”意指大约、大概、左右或在此区域内。当术语“约”与数字范围连接使用时，其修饰由设定的数值上下边界延伸的范围。通常，本文所用的术语“约”用于通过20％，优选10％上或下(高或低)的差异修饰所述值的以上和以下的数值。

如本文所用的，单词“或”意指特定列举的任何成分，并且也包括该列举成分的任何组合。

术语“基因”被用于泛指与生物功能相关的核酸的任意段。因此，基因包括编码序列和/或其表达所需的调节序列。例如，基因指表达mRNA或功能RNA，或编码特异性蛋白质的核酸片段，并且其包括调节序列。基因还包括不表达的DNA段，例如对其它蛋白质形成识别的序列。可以从多种来源获得基因，包括从目的来源克隆或从已知或预测的序列信息合成，并且基因可以包括设计的具有期望参数的序列。

术语“天然”或“野生型”基因指在未转化的细胞，即不具有已知突变的细胞的基因组中存在的基因。

“标记基因”编码可选择的或可筛选的性状。

术语“嵌合基因”指任何基因，其含有

1)包括调节和编码序列的DNA序列，其在天然中未被一起发现，或

2)编码非天然毗连的蛋白质的部分的序列，或

3)非天然毗连的启动子的部分。

相应的，嵌合基因可以包含从不同来源衍生的调节序列和编码序列，或包含从相同来源衍生但是以不同于天然发现的方式而安排的调节序列和编码序列。

“转基因”指已经通过转化导入基因组并且稳定维持的基因。转基因可以包括，例如与被转化的特定植物的基因异源或同源的基因。此外，转基因可以包含插入在非天然生物中的天然基因或嵌合基因。术语“内源基因”指在生物基因组的天然位置中的天然基因。“外源”基因指在宿主生物中通常未发现而是通过基因转移导入的基因。

“寡核苷酸”相应于本发明的核苷酸序列，例如用于检测或扩增反应，其可以是长度上约30或更少的核苷酸(例如9、12、15、18、20、21、22、23或24，或在9至30之间的任意数字)。通常，特异性引物的长度在14个核苷酸以上。出于最佳特异性和成本有效性，优选长度为16至24核苷酸的引物。本领域技术人员精通用于例如PCR过程的引物的设计。如果需要，可以使用本文公开的基因的完整限制性片段进行检测，其长度可以是100或甚至1000个核苷酸。

在本文中术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”可交换的使用，指连续氨基酸残基的聚合体或寡聚体。如这里使用的，术语“氨基酸序列”或“多肽序列”指代表氨基酸残基的缩写、字母、字符或单词的序列。本文中的氨基酸可以通过其公知的三字母符号或通过由IUPAC-IUB生化命名委员会推荐的单个字母符号来指代。本文使用的缩写是氨基酸的单字母密码：A，丙氨酸；B，天冬酰胺或天冬氨酸；C，半胱氨酸；D天冬氨酸；E，谷氨酸；F，苯丙氨酸；G，甘氨酸；H，组氨酸；I，异亮氨酸；K，赖氨酸；L，亮氨酸；M，甲硫氨酸；N，天冬酰胺；P，脯氨酸；Q，谷氨酰胺；R，精氨酸；S，丝氨酸；T，苏氨酸；V，缬氨酸；W，色氨酸；Y，酪氨酸；Z，谷氨酰胺或谷氨酸(见L.Stryer，Biochemistry，1988，W.H.Freeman and Company，New York)。在氨基酸序列内如本文所使用的字母“X”可以代表任何氨基酸残基。

“编码序列”指编码特异性氨基酸序列的DNA或RNA序列，并且不包括非编码序列。其可以由“无中断的编码序列”，即没有内含子，例如在cDNA中的序列组成，或可以包括由正确的剪接连接为边界的一个或多个内含子。“内含子”是在初级转录物中含有的RNA序列，但是其在细胞内通过RNA的切割和重新连接被除去以产生可以翻译成蛋白质的成熟mRNA。

术语“开放阅读框”和“ORF”指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”指在编码序列上三个相邻的核苷酸单元(“密码子”)，其分别指定蛋白质合成(mRNA翻译)的起始和链终止。

“功能性RNA”指不翻译的反义RNA、核酶或其它RNA。

术语“RNA转录物”指由RNA聚合酶催化的DNA序列的转录产生的产物。当RNA转录物为DNA序列的完全互补拷贝时，称其为初始转录物，或者RNA转录物可以是从初始转录物的转录后加工衍生的RNA序列并被称为成熟RNA。“信使RNA”(mRNA)指没有内含子的RNA，且其可以由细胞翻译为蛋白质。“cDNA”指从mRNA衍生的并且与其互补的单链或双链DNA。

“转录调节核苷酸序列”、“调节序列”和“适当的调节序列”各自指影响所缔合的(或功能性连接的)待转录的核苷酸序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。转录调节的核苷酸序列相对于待转录的核苷酸序列可以具有多种位置。转录调节的核苷酸序列可以位于待转录的序列(例如，编码序列)的上游(5’非编码序列)、其中或下游(3’非编码序列)。转录调节核苷酸序列可以选自由增强子、启动子、转录前导序列、内含子、5’非翻译序列、3’非翻译序列和多聚腺苷化作用信号序列组成的组。其包括天然和合成的序列，并且可以是合成和天然序列的组合。如上所述，术语“转录调节的核苷酸序列”不限于启动子。然而，优选本发明的转录调节的核苷酸序列包含至少一个启动子序列(例如，位于基因的转录起始上游，能够诱导下游序列的转录的序列)。在一个优选的实施方案中，本发明的转录调节的核苷酸序列包括相应基因的启动子序列和(任选且优选地)所述基因的5’非翻译区。此外，也可以使用所述基因的3’非翻译区和/或多聚腺苷化作用区。如本文所用，术语“顺式元件”或“启动子基序”指顺式作用的转录调节元件，其赋予基因表达整体方面的控制。顺式以及可以结合调节转录的转录因子、反式作用蛋白质因子来起作用。一些顺式元件结合超过一种的转录因子，且转录因子可以以不同的亲和力与超过一种顺式元件相互作用。本发明的启动子理想地含有能够赋予或调节基因表达的顺式元件。可以鉴别顺式元件的多种技术包括缺失分析，即从启动子的5’末端或内部缺失一个或多个核苷酸；使用DNA酶I足迹法、甲基化干扰、电泳迁移率变动分析、通过连接介导的PCR的体内基因组足迹法以及其它的常规测定进行的DNA结合蛋白质分析；或通过DNA序列相似性分析与已知的顺式元件基序通过常规DNA序列比较方法比较。可以通过诱变(或取代)一个或多个核苷酸或通过其它常规方法进一步研究顺式元件的精细结构。通过化学合成或通过从包括这类元件的启动子分离可以获得顺式元件，且可以合成额外带有含有用的限制性酶位点的侧翼核苷酸以利于亚序列操作。

“5’非编码序列”或“5’非翻译序列”或“区”指位于编码序列5’(上游)的核苷酸序列。其存在于起始密码子的完全加工的mRNA上游并且可以影响初级转录物至mRNA的加工、mRNA稳定性或翻译效率(Turner1995)。

“3’非编码序列”或“3’非翻译序列”或“区”指位于编码序列3’(下游)的核苷酸序列且包括多聚腺苷化作用信号序列和编码能够影响mRNA加工或基因表达的调节信号的其它序列。多聚腺苷化作用信号通常表现为影响多聚腺苷酸向mRNA前体的3’末端的添加。不同的3’非编码序列的用途由Ingelbrecht等人，1989举例说明。

术语“翻译前导序列”指在启动子和编码序列之间的基因的DNA序列部分，其被转录成为RNA且存在于完全加工的mRNA翻译起始密码子的上游(5’)。翻译前导序列可以影响初级转录物至mRNA的加工、mRNA稳定性或翻译效率。

“信号肽”指多肽的氨基末端延伸，其与多肽相结合翻译形成前体肽，并且其为进入分泌途径所需。术语“信号序列”指编码信号肽的核苷酸序列。如本文所用的术语“转运肽”指表达的多肽的部分(优选多肽的氨基末端延伸)，其与多肽结合翻译形成前体肽，并且其为进入细胞器(例如质粒(例如叶绿体)或线粒体)所需。术语“转运序列”指编码转运肽的核苷酸序列。

“启动子”指核苷酸序列，通常在其编码序列的上游(5’)，其通过提供RNA聚合酶和其它正确转录所需因子的识别控制编码序列的表达。“启动子”包括包含TATA盒的短DNA序列的最小启动子，以及作用以明确转录起始位点的其它序列，向其加入调节元件来控制表达。“启动子”还指包括最小启动子加上调节元件的核苷酸序列，其能够控制编码序列或功能性RNA的表达。这一类型的启动子序列由邻近和更远的上游元件组成，后者的元件通常指增强子。因此，“增强子”为DNA序列，其能够刺激启动子活性并且可以是启动子的天然元件或插入以增强启动子的水平或组织特异性的异源元件。它可以双向(正向或翻转的)作用，并且甚至能够从启动子的上游或下游起作用。增强子和其它上游启动子元件都与介导其效果的序列特异性DNA结合蛋白结合。启动子可以完整衍生自天然基因，或可以由天然发现的不同启动子衍生的不同元件组成，或甚至由合成的DNA区段组成。启动子还可以含有涉及蛋白质因子结合的DNA序列，其应答生理或发育的条件控制转录起始的效力。

“起始位点”是第一核苷酸周围的位置，其为转录序列的部分，也被定义为位置+1。相关于此位点对基因的全部其它序列及其控制区编号。下游序列(即在3’方向的更多的蛋白质编码序列)被命名为正数，而上游序列(在5’方向的多数控制区)被命名为负数。

启动子元件，特别是TATA元件，在缺少上游激活时其为无活性的或具有大大降低的启动子活性，被称为“最小或核心启动子”。当存在合适的转录因子时，最小启动子作用使允许转录。因此，“最小或核心启动子”仅由转录起始所需的全部基本元件，例如TATA盒和/或起始子组成。

“组成型表达”指使用组成型或调节性启动子的表达。“条件性和调节性表达”指由调节性启动子控制的表达。

“组成型启动子”指能够表达开放阅读框(ORF)的启动子，其在全部或几乎全部的植物组织中于全部或几乎全部的植物发育阶段控制。每个转录激活元件不呈现绝对的组织特异性，但是在多数植物部分以在转录最活跃的植物部分水平的至少1％的水平介导转录激活。

“调节性启动子”指并非组成地而是以时间地和/或空间地调节方式指导基因表达的启动子，并且同时包括组织特异性和可诱导启动子。其包括天然的和合成的序列，还可以是合成的和天然序列的组合。不同的启动子可以在不同组织或细胞类型中、或在不同发育阶段、或应答不同的环境条件指导基因的表达。连续发现用于植物细胞中的多种类型的新启动子，在由Okamuro等人(1989)的编辑中可以找到多个实例。典型的用于植物的调节性启动子包括，但不限于安全剂诱导的启动子、从四环素诱导系统衍生的启动子、从水杨酸盐诱导系统衍生的启动子、从醇诱导系统衍生的启动子、从糖皮质激素诱导系统衍生的启动子、从病原体诱导系统衍生的启动子以及从蜕皮激素诱导系统衍生的启动子。

“组织特异性启动子”指调节性启动子，其并非在所有植物细胞中，而是仅在特异器官(例如叶或种子)中的一种或多种细胞类型中、特异性组织(例如胚或子叶)、或特异的细胞类型(例如叶薄壁组织或种子储存细胞)中表达。这些也包括受时间调节的启动子，例如在胚胎发生早期或晚期，在发育中的种子或果实中的果实成熟期、在完全分化的叶中、或在老化起始中。

“可诱导启动子”指受到调节的启动子，其在一种或多种细胞可以由外部刺激，例如化学药品、光、激素、胁迫或病原体开启。

“有效连接”或“功能性连接”指优选在单个核酸片段上的核酸序列的缔合，从而彼此影响其功能。例如，调节性DNA序列被称为“有效连接于”或“缔合于”编码RNA或多肽的DNA序列，如果使两个序列位于调节性DNA序列影响编码DNA序列的表达(即，编码序列或功能性RNA在启动子的转录控制下)的位置。编码序列可以以正义或反义方向有效连接至调节性序列。

“表达”指内源基因、其ORF或部分、或转基因在植物中的转录和/或翻译。例如，在反义构建体的情况下，表达可以仅指反义DNA的转录。此外，表达指正义(mRNA)或功能性RNA的转录和稳定积累。表达还可以指蛋白质的产生。

“特异性表达”是基因产物的表达，其限于一种或几种植物组织(空间限制)和/或一个或几个植物发育阶段(时间限制)。应该承认的是几乎没有真正的特异性存在：启动子似乎在一些组织中偏好的开启，而在其它组织中没有或仅很少的活性。此现象被称为泄漏表达。然而，在本发明中具有特异性的表达意指在一种或几种植物组织中偏好表达。

启动子的“表达模式”(带有或没有增强子)是表达水平的方式，其显示由所述启动子起始的转录在植物的何处位置以及在何发育阶段。当一组启动子中一个启动子的表达模式与其它启动子的表达模式几乎不重叠时，称该组启动子的表达模式是互补的。可以通过测量标准转录的报道基因mRNA的“稳定态”浓度来确定启动子的表达水平。由于报道基因mRNA不仅依赖于其合成速率，还依赖于该mRNA的降解速率，这一测量是间接的。因此，该稳定态水平是合成速率和降解速率的产物。然而，当被转录序列相同时，降解速率可以认为在固定速率下进行，因此该值可以作为合成速率的测量。当以此方式比较启动子时，本领域技术人员可使用的技术为杂交S1-RNA酶分析、northern印迹和竞争性RT-PCR。这一技术的列举并非代表全部可用技术，而是对用于分析mRNA的转录活性和表达水平的通用操作的描述。在几乎全部启动子中转录起始位点的分析揭示，通常没有在其位置上开始转录的单一的碱基，而是或多或少的成簇的起始位点组，其中每个看作mRNA的一些起始位点。由于这一分布在启动子与启动子之间变化，在该群体的每个之中报道基因mRNA的序列彼此不同。由于每种mRNA物种或多或少倾向于降解，对于不同的报道基因mRNA无法期望单一的降解速率。多种真核启动子序列已经表明，在起始位点(起始子)周围的序列在确定由特异性启动子指导的RNA表达的水平中发挥重要功能。这也包括被转录序列的部分。因此启动子与报道序列的直接融合将导致转录的次佳水平。通常用来分析表达模式和水平的操作是通过确定在细胞中蛋白质累积的“稳定态”水平。本领域技术人员公知的通用的报道基因是β-葡糖醛酸糖苷酶(GUS)、氯霉素乙酰转移酶(CAT)和带有荧光特性的蛋白质，例如来自Aequora victoria的绿色荧光蛋白质(GFP)。然而，原则上，只要蛋白质不干扰基本的植物功能，许多蛋白质适合于这一目的。大量工具适于定量和确定其定位。可以容易地产生或获得检测系统，其基于例如，免疫化学、酶、荧光的检测和定量。可以在植物组织提取物中或在完整的组织中使用蛋白质表达的原位分析确定蛋白质水平。通常，使用一个嵌合启动子报道基因构建体个体转化的株系在其报道基因的表达水平有变化。还经常观察到这样的现象，这类转化体不表达任何可检测的产物(RNA或蛋白质)。表达的变化通常被描述为“位置效应”，然而在这一失活之下的分子机制通常尚不清楚。

“过表达”指在转基因细胞或生物中的表达水平超过正常或未转化(非转基因)细胞或生物中的表达水平。

“反义抑制”指产生能够抑制来自内源基因或转基因的蛋白质表达的反义RNA转录物。

“基因沉默”指对病毒基因、转基因或内源核基因的依赖同源性的抑制。基因沉默可以是转录的(当该抑制是由于受影响基因的减少的转录时)，或者是转录后的(当该抑制是由于与受影响的基因同源的RNA种增加的周转(降解))(English1996)。基因沉默包括病毒诱导的基因沉默(Ruiz等人，1998)。

本文使用的术语“异源DNA序列”、“外源DNA区段”或“异源核酸”各自指相对特定宿主细胞外源来源产生的序列，或者，如果来自相同来源，该序列从其来自的原始形式被修饰。因此，宿主细胞中的异源基因包括相对特定宿主细胞内源，但是已经通过例如使用DNA改组被修饰的基因。该术语也包括天然产生DNA序列的非天然产生的多拷贝。因此，该术语指相对细胞外源或异源的DNA区段，或相对细胞同源但是在宿主细胞核酸内的位置上通常不会找到该元件的DNA区段。表达外源DNA区段以提供外源多肽。“同源”DNA序列是与其导入的宿主细胞有天然联系的DNA序列。

关于核苷酸序列同一性，“同源”指在两个核酸分子的核苷酸序列之间或在两个蛋白质分子的氨基酸序列之间的相似性。通过本领域技术人员熟知的严格条件下的DNA-DNA或DNA-RNA杂交(如在Haines和Higgins(编辑)，Nucleic Acid Hybridization，IRL Press，Oxford，英国，所述)，或通过比较两个核酸或蛋白质之间的序列相似性提供对这类同源性的估计。

术语“基本相似”指核苷酸和氨基酸序列，其代表本文公开的拟南芥或亚麻序列的功能和/或结构的等同物或直向同源物。

就其广义而言，术语“基本相似”当在本文用于核苷酸序列时，意指该核苷酸序列是基因的部分，该基因编码的多肽与由参考核苷酸序列的基因编码的多肽具有基本相同的结构和功能，例如该核苷酸序列包含来自基因的启动子(所述基因是相应于参考核苷酸序列的基因的直向同源物)，以及与本文特定举例的启动子序列结构相关的启动子序列(即该基本相似的启动子序列在高或极高的严格条件下与本文举例的启动子序列的互补序列杂交)。例如，改变的核苷酸序列(其仅反映遗传密码子的简并但是编码与特定氨基酸序列相同的氨基酸序列)与该特定序列是基本相似的。术语“基本相似”还包括其中序列已被修饰的核苷酸序列，例如，在特定细胞中优化表达，以及编码相对于由参考序列编码的(未修饰的)多肽具有一个或多个氨基酸取代的变异多肽的核苷酸序列，该取代不改变变异多肽相对于未修饰多肽的活性。

就其广义而言，术语“基本相似”当在本文用于多肽时，意指该多肽与参考多肽具有基本相同的结构和功能。此外，与特定序列基本相似的氨基酸序列是其中整体氨基酸同一性为当前序列的至少50％或更多的那些序列。产生等同的核苷酸或氨基酸序列的修饰是本领域常规技术人员熟知的。在基本相似序列和参考多肽之间氨基酸序列同一性的百分数为至少50％，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％和甚至90％或更多，例如91％、92％、93％、94％、95％、96％、97％、98％直至至少99％，其中该参考多肽是由带有启动子的基因编码的多肽(例如来自拟南芥或亚麻)，所述启动子具有SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11的任一，核苷酸序列包含具有SEQ ID NO：12、14、16、18、20或22的任一的开放阅读框，其编码SEQ ID NO：8、10、12、14、16、18或36的任一。两个多肽除了具有基本相同的功能，彼此基本相似的一个表现为特异性结合于多肽之一的试剂，例如抗体，也与另一多肽特异性结合。

可以使用Smith-Waterman序列比对算法进行序列比较(见，例如Waterman(1995))。优选使用局部S程序，版本1.16，其带有下列参数：匹配：1；错配罚分：0.33；开放空位罚分：2；延伸空位罚分：2。

此外，与参考核苷酸序列“基本相似”的核苷酸序列被称为“等同”于参考核苷酸序列。熟练的技术人员了解本发明包括的该等同的核苷酸序列也可以由其能够在低、中等和/或严格条件下(例如，0.1×SSC、0.1％SDS，65℃)与当前权利要求的字面范围之内的核苷酸序列杂交的能力被限定。

当用于多核苷酸或多肽片段时，“基本相同的活性”意指该片段具有全长多核苷酸或全长多肽的活性的至少50％，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％和甚至90％或更多，例如91％、92％、93％、94％、95％、96％、97％、98％直至为至少99％。

“靶基因”指在复制子中的基因，其表达期望的靶编码序列、功能性RNA或蛋白质。靶基因并非复制子复制所必需的。此外，靶基因可以包含插入非天然生物的天然非病毒基因、或嵌合基因，并且在合适的调节序列的控制下。因此，在靶基因中的调节序列可以来自任何来源，包括病毒。靶基因可以包括与被转化的特定植物的基因异源或同源的编码序列。然而，靶基因不包括天然病毒基因。典型的靶基因包括，但不限于天然病毒基因。典型的靶基因包括，但不限于编码结构蛋白质、种子储存蛋白质、赋子除草剂抗性的蛋白质和赋予昆虫抗性的蛋白质的基因。由靶基因编码的蛋白质被称为“外源蛋白质”。靶基因在植物中的表达通常产生改变的植物性状。

术语“改变的植物性状”意指在转基因植物中相对于野生型或非转基因植物宿主的任何表型或基因型的改变。

“复制基因”指编码病毒复制蛋白质的基因。除了复制蛋白质的ORF，复制基因还可以含有如在天然病毒序列中发现的其它重叠的或非重叠的ORF。尽管并非复制所必需，这些额外的ORF可以提高复制和/或病毒DNA累积。这类额外的ORF的实例分别为ACMV和TGMV双生病毒群中的AC3和AL3。

“嵌合的反式激活复制基因”指其中复制蛋白质的编码序列在天然病毒复制基因之外的调节性植物启动子控制下的复制基因，或修饰的天然病毒复制基因，例如其中位点特异性序列被插入5’被转录但不被翻译的区域。这类嵌合基因还包括在启动子和转录起始位点之间已知的复制蛋白结合位点的插入，其减弱病毒复制蛋白基因的转录。

“染色体整合”指外源基因或DNA构建体通过共价键整合进入宿主DNA。其中基因并非“染色体整合的”，其可以是“瞬时表达的”。基因的瞬时表达指未整合进入宿主染色体的基因的表达，其作为自主复制质粒或表达盒的部分，或者作为另一生物系统(例如病毒)的部分独立的起作用。

术语“转化”指将核酸片段转移至宿主细胞，产生基因稳定的遗传。含有转化的核酸片段的宿主细胞被称为“转基因”细胞，包含转基因细胞的生物被称为“转基因生物”。植物和植物细胞转化方法的实例包括农杆菌介导的转化(De Blaere1987)和颗粒轰击技术(US4,945,050)。可以通过技术人员熟知的技术从转基因细胞再生整个植物(见，例如Fromm1990)。

“转化的”、“转基因的”和“重组的”指向其中导入异源核酸分子的宿主生物，例如细菌或植物。核酸分子可以被稳定整合进入通常本领域已知且已公布的基因组(Sambrook1989；Innis1995；Gelfand1995；Innis和Gelfand1999)。已知的PCR技术包括，但不限于，使用成对引物、巢式引物、单个特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等等的方法。例如，“转化的”、“转化体”和“转基因”植物或胝已经经过转化过程且含有整合进入其染色体的外源基因。术语“未转化的”指未经过转化过程的正常植物。

“瞬时转化的”指其中已经导入转基因和外源DNA(例如，通过农杆菌介导的转化或生物轰击这类方法)，但是未进行稳定维持筛选的细胞。

“稳定转化的”指在转化后被选择并且在选择培养基上再生的细胞。

“转基因表达”指细胞中的表达，其中通过病毒感染或如农杆菌介导的转化、电穿孔或生物轰击的此类方法向所述细胞中导入病毒或转基因，但未对其稳定维持做筛选。

“遗传稳定的”和“可遗传的”指在植物中稳定维持且通过连续世代由子代稳定遗传的染色体整合的遗传元件。

“初级转化体”和“T0代”指与初始转化的植物相同遗传世代的转基因植物(即从转化之后未经历减数分裂和受精)。

“二级转化体”和“T1、T2、T3等代”指通过一次或多次减数分裂和受精循环从初级转化体衍生的转基因植物。它们可以衍生自初级或二级转化体的自体受精，或初级或二级转化体与其它转化或未转化植物的杂交。

“野生型”指天然发现的不带有任何已知突变的病毒或生物。

术语“基因组”或“基因组DNA”指宿主生物的可遗传的基因信息。所述基因组DNA包含核的DNA(也称为染色体DNA)，以及质粒DNA(例如叶绿体)和其它细胞器(例如，线粒体)。优选的，术语基因组或基因组DNA指核的染色体DNA。

术语“染色体DNA”或“染色体DNA序列”被理解为不依赖细胞周期状态的细胞核的基因组DNA。因此可以在染色体或染色单体中识别染色体DNA，其可以是凝聚的或解螺旋的。可以通过本领域多种已知方法，例如聚合酶链式反应(PCR)分析、Southern印迹分析、荧光原位杂交(FISH)和原位PCR证明和分析染色体DNA中的插入。

术语“核酸”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物，其由单体(核苷酸)组成，所述单体含有糖、磷酸和碱基(其为嘌呤或嘧啶)。除非特别限定，该术语包括含有已知的天然核苷酸类似物的核酸，其与参照的核酸具有相似的结合特性并且以与天然产生的核苷酸相似的方式被代谢。除非另外指出，特定的核酸序列还显然包括其保守修饰的变体(例如简并的密码子取代)和互补序列以及明确指出的序列。具体而言，可以通过产生序列获得简并密码子的取代，所述序列中一个或多个选择的(或全部的)密码子的第三位置由混合的碱基和/或脱氧肌苷残基取代(Batzer1991；Ohtsuka1985；Rossolini1994)。“核酸片段”是指定核酸分子的片段。在高等植物中，脱氧核酸(DNA)是遗传物质，而核糖核酸(RNA)涉及在DNA内所含信息向蛋白质的转移。术语“核苷酸序列”指DNA或RNA的聚合物，其可以为单链或双链，任选的含有能够掺入DNA或RNA聚合物的合成的、非天然的或改变的核苷酸碱基。术语“核酸”或“核酸序列”还可以与基因、由基因编码的cDNA、DNA和RNA交换的使用。

本发明包括分离的或基本纯化的核酸或蛋白质组合物。在本发明中，“分离的”或“纯化的”DNA分子或“分离的”或“纯化的”多肽是通过人工操作从其天然环境分开存在的DNA分子或多肽，且因而不是天然的产物。分离的DNA分子或多肽可以以纯化的形式存在，或可以在非天然的环境，例如转基因的宿主细胞中存在。例如，“分离的”或“纯化的”核酸分子或蛋白质，或其有生物活性的部分，当由重组技术产生时，基本不含有其它细胞物质或培养基；当化学合成时基本不含有化学前体或其它化学药物。优选的，“分离的”核酸不含有在该核酸衍生自的生物基因组DNA中该核酸的天然侧翼序列(即位于该核酸的5’和3’末端的序列)(优选蛋白质编码序列)。例如，在多个实施方案中，分离的核酸分子可以含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，所述核苷酸序列是该核酸分子衍生自的细胞的基因组DNA中该核酸分子的天然侧翼序列。基本不含有细胞物质的蛋白质包括含有少于约30％、20％、10％、5％(以干重计)的污染蛋白质的蛋白质或多肽的制备。当重组的产生本发明的蛋白质或其生物活性部分时，优选培养基存在少于约30％、20％、10％或5％(以干重计)的化学前体或非蛋白质的目的化学药物。本发明的核苷酸序列包括天然产生的序列和突变的(突变体)形式。这类突变体连续的拥有期望的活性，即启动子活性或由非突变的核苷酸序列的开放阅读框编码产物的活性。

关于序列(例如多肽或核酸序列，例如本发明的转录调节核苷酸序列)，术语“突变体”意指基本相似的序列。对于包含开放阅读框的核苷酸序列，突变体包括由于遗传密码简并性而编码天然蛋白质的相同氨基酸序列的那些序列。可以使用熟知的分子生物技术，例如使用聚合酶链式反应(PCR)和杂交技术鉴别如这类天然产生的等位变体。变体的核苷酸序列也包括由合成衍生的核苷酸序列(例如通过使用定点诱变产生的那些)，和对于开放阅读框，编码天然蛋白质，以及编码相对于天然蛋白质有氨基酸取代的那些。通常，本发明的核苷酸序列变体具有至少与天然(野生型或内源的)核苷酸序列相比，将具有至少40、50、60，到70％，例如，优选地71％、72％、73％、74％、75％、76％、77％、78％到79％，通常至少80％，例如，81％-84％，至少85％，例如，86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％，到98％和99％的核苷酸序列同一性。

特定核酸序列的“保守修饰的变异”指编码相同或基本相同的氨基酸序列的那些核酸序列，或者指基本上相同的序列，其中核酸序列不编码氨基酸序列。由于遗传密码子的简并性，大量功能上相同的核酸编码任何指定的多肽。例如，密码子CGT、CGC、CGA、CGG、AGA和AGG都编码氨基酸精氨酸。因此，在精氨酸用密码子表示的每个位置上，可将该密码子变为所述相应密码子中的任何一个，而不改变所编码的蛋白质。这种核酸变异是“沉默变异”，其是“保守性修饰变异”中的一种。除非另外注明，这里所述每个编码多肽的核酸序列也描述每个可能的沉默变异。本领域技术人员将会意识到可通过标准技术修饰核酸中的每个密码子(除了ATG，其通常是甲硫氨酸的唯一密码子)以产生功能相同的分子。因此，编码多肽的核酸的每个“沉默变异”是每个所述序列中含有的。

可“优化”本发明的核酸分子以提高其在目的植物中的表达(见，例如，WO91/16432；Perlak1991；Murray1989)。在该方式中，可利用植物优选的密码子合成基因或基因片段中的开放阅读框(见，例如，Campbell&Gowri，1990对宿主优选的密码子选择的讨论)。因此，可优化核苷酸序列用于任何植物中的表达。人们公认，可优化或合成基因序列的全部或者任何部分。即，也可以使用合成的或部分优化的序列。变体核苷酸序列和蛋白质也包括，从诱变和重组操作，如DNA改组中获得的序列和蛋白质。可用这种方法操作一个或多个不同的编码序列以产生具有期望特性的新多肽。使用该方式，可以从大量包含具有基本的序列同一性并能在体外或在体内同源重组的序列区域的相关序列多核苷酸中产生重组的多核苷酸文库。这种DNA改组的策略在本领域技术中是公知的(见，例如，Stemmer1994；Stemmer1994；Crameri1997；Moore1997；Zhang1997；Crameri1998；以及US5,605，7912，14，16，18，20和22,837,458)。

“变体”多肽意指源自天然蛋白质的多肽，通过缺失(所谓的截短)或者向天然蛋白质的N末端和/或C末端添加一个或多个氨基酸；在天然蛋白质的一个或多个位点上缺失或添加一个或多个氨基酸；或者在天然蛋白质的一个或多个位点上取代一个或多个氨基酸。这种变体可能由，例如，遗传多态性或人为处理所产生。这种操作的方法通常是本领域已知的。

因此，可以多种方式改变多肽，包括氨基酸取代、缺失、截短和插入。这种操作的方法通常是本领域已知的。例如，可通过DNA中的突变制备多肽的氨基酸序列变体。诱变和核苷酸序列改变的方法是本领域公知的(见，例如，Kunkel1985；Kunkel1987；US4,873,192；Walker&Gaastra，1983及其所引用的参考文献)。可在Dayhoff等(1978)的模型中发现对不影响目的蛋白质生物活性的适当氨基酸取代的指导。优选保守取代，如氨基酸与另一个具有相似性质的氨基酸的交换。在编码序列中，改变、添加或缺失单个氨基酸或低百分率的氨基酸(一般小于5％，更一般地小于1％)的单个取代、缺失或添加是“保守性修饰变异”，其中，该改变导致用化学上相似的氨基酸取代另一个氨基酸。提供功能相似氨基酸的保守取代表是本领域公知的.下列五组中，每组都含有彼此是保守性取代的氨基酸：脂肪族：甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)；芳香族：苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)；含硫的：甲硫氨酸(M)、半胱氨酸(C)；碱性的：精氨酸(R)、赖氨酸(K)、组氨酸(H)；酸性的：天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷胺酰胺(Q)。也见，Creighton，1984。另外，编码序列中改变、添加或缺失单个氨基酸或小百分率的氨基酸的单个取代、缺失或添加也是“保守性修饰变异”。

这里所使用的“表达盒”意指能在适当的宿主细胞中指导特定核苷酸序列表达的DNA序列，包括有效连于目的核苷酸序列的启动子，其任选地有效连于终止信号和/或其它调节元件。表达盒也可包括核苷酸序列的适当翻译所必需的序列。编码区通常以正义或反义方向编码目的蛋白质，但也可编码功能性目的RNA，例如反义RNA或非翻译的RNA。包含目的核苷酸序列的表达盒可以是嵌合的，意指其至少一个组分对于其至少一个其它组分来说是异源的。表达盒也可以是一种表达盒，其是天然存在的，但以用于异源表达的重组体形式获得。表达盒可以完全在细胞外装配(例如，通过重组体克隆技术)。然而，表达盒也可以使用部分内源组分进行装配。例如，表达盒可通过将启动子序列置于(插入)内源序列上游获得，其因此形成功能上相连的并受到所述启动子序列控制。同样地，可将要表达的核酸序列置于(或插入)内源性启动子序列的下游，因此形成表达盒。表达盒中核苷酸序列的表达可在保守性启动子的控制下，或者在仅在宿主细胞暴露于某些特定外部刺激时引起转录的诱导型启动子的控制下。在多细胞生物体的情况中，启动子也可能对特定组织或器官或发育阶段特异的(例如，本发明的种子特异性启动子或种子偏好性的启动子)。在优选的实施方案中，这类表达盒包含与目的核苷酸序列连接的本发明的转录起始区。优选向这类表达盒提供多个限制位点以插入目的基因于调节区的转录调节下。表达盒还可以含有可选择的标记基因。该表达盒可以以转录的5’-3’方向包括在植物中有功能的转录和翻译起始区、目的DNA序列和转录和翻译终止区。终止区可以与转录起始区相同来源，可以与目的DNA序列相同来源，或可以衍生自另一来源。可以从根瘤农杆菌的Ti质粒方便的获得终止区，例如章鱼碱合酶和胭脂碱合酶的终止区，以及如下所述的其它终止区(又见Guerineau1991；Proudfoot1991；Sanfacon1991；Mogen1990；Munroe1990；Ballas1989；Joshi1987)。

将“载体”定义为包括，尤其为，双链或单链，线性或环型的任何质粒、粘粒、噬菌体或农杆菌双元载体，其可以或者不能自我传递或移动，并且其可通过整合到细胞基因组内或者在染色体外存在(例如，具有复制起点的自主复制的质粒)来转化原核或真核宿主。

特别包括穿梭载体，其意味着天然地或通过设计，能在两个不同宿主生物体中复制的DNA载体，其可选自放线菌和相关物种、细菌和真核生物(例如，高等植物、哺乳动物、酵母或真菌细胞)。

优选地载体中的核酸在适当的启动子或其它调节元件的控制下，并与它们有效连接，用于在宿主细胞如微生物(例如，细菌)或者植物细胞中的转录。载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况中，这可能包含其自己的启动子或者其它调节元件，在cDNA的情况中，这可能是在用于在宿主细胞中表达的适当启动子或者其它调节元件的控制下。

“克隆载体”一般含有一个或少量限制性核酸内切酶识别位点，可在其上以可测定的方式插入外源DNA序列，而不丧失载体的基本生物功能，以及适于在用克隆载体转化的细胞的鉴定和选择中使用的标记基因。标记基因一般包括提供四环素抗性、潮霉素抗性或氨苄青霉素抗性的基因。

“转基因植物”是具有一个或多个含有表达载体的植物细胞的植物。

“植物组织”包括分化的和未分化的组织或植物，包括但不限于根、茎、叶、花粉、种子、肿瘤组织和细胞和培养物的各种形式，如单细胞、原生质体、胚，以及愈伤组织。植物组织可以在植物中或在器官中，可以是组织或细胞培养物。

使用下列术语描述两个或多个核酸或者多核苷酸之间的序列关系：(a)“参考序列”，(b)“比较窗”，(c)“序列同一性”，(d)“序列同一性百分率”和(e)“基本相同”。

(a)如这里所使用的，“参考序列”是一种定义的序列，用作序列对比的基础。参考序列可以是指定序列的子集或全部；例如，作为全长cDNA或基因序列的片段，或者全长的cDNA或基因序列。

(b)如这里所使用的，“比较窗”涉及多核苷酸序列邻近和指定的片段，其中与用于两个序列的最佳比对的参考序列(其不包括添加或缺失)相比，比较窗中的多核苷酸序列可包括添加或缺失(即，空位)。通常，比较窗至少为20个连续的核苷酸长，任选地可以是30、40、50、100或者更长。本领域技术人员理解，为了避免由于多核苷酸序列中包含空位而与参考序列具有高相似性，一般地引入空位罚分并从匹配数中减去。

用于比较序列比对的方法是本领域公知的。因此，可使用数学算法完成任何两个序列之间同一性百分率的测定。优选地，这种数学算法的非限制性实例是Myers和Miller，1988的算法；Smith等1981的局部同源性算法；Needleman和Wunsch1970的同源性比对算法；Pearson和Lipman1988的搜索相似性法；Karlin和Altschul，1990的算法，如在Karlin和Altschul，1993中被修改。

可利用计算机执行这些数学算法用于序列的比较以确定序列同一性。这类执行包括，但不限于：PC/Gene程序(可从Intelligenetics，Mountain View，Calif.获得)中的CLUSTAL；ALIGN程序(2.0版)以及Wisconsin Genetics软件包，8版(可从Genetics Computer Group(GCG)，575Science Drive，Madison，Wis.，USA中获得)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。可使用缺省参数进行使用这些程序的比对。已充分描述了CLUSTAL程序(Higgins1988，1989；Corpet1988；Huang1992；Pearson1994)。ALIGN程序是基于Myers和Miller的算法，见上。Altschul等，1990的BLAST程序是基于Karlin和Altschul的算法，见上。多个比对(即超过2个序列)优选使用Clustal W算法(Thompson1994；例如在软件VectorNTITM，9版；InvitrogenInc.)，用BLOSUM62MT2记分矩阵使用缺省设置(空位开放罚分15/19；空位延伸罚分6.66/0.05；空位分离罚分范围8；比对延迟的同一性％为40；使用残基特异性空位和亲水残基空位)进行。

公众可通过国立生物技术信息中心(National Center forBiotechnology Information)(http://www.ncbi.nlm.nih.gov/)获得进行BLAST分析的软件。该算法包括通过鉴定查询序列中长W的短词，首先鉴定高得分序列对(HSP)，当与数据库序列中同样长度的词比对时，其匹配或满足某些正值阈值得分T。将T称作邻近词得分阈值(Altschul1990)。这些最初的邻近词命中作为开始搜索以发现含有它们的更长HSP的根据。然后在两个方向上沿着每个序列延伸词命中，直到可增加累积的比对得分。使用参数M(匹配残基对的奖励得分；总是>0)和N(错配残基的罚分；总是<0)计算核苷酸序列的累积得分。对于氨基酸序列，使用评分矩阵计算累积得分。当累积的比对得分从其获得的最大值下降数量X，累积得分由于一个或多个负得分残基比对的累积为零或者零以下，或者到达序列的任一端时，停止每个方向上词命中的延伸。

除了计算序列同一性百分率，BLAST算法也进行两个序列之间相似性的统计学分析(见，例如Karlin & Altschul(1993)。由BLAST算法所提供的相似性的一个测量值是最小总概率(P(N))，其提供两个核苷酸或氨基酸序列之间偶然发生匹配的可能性指数。例如，如果在检验核酸序列与参考序列的比较中最小总概率小于约0.1，更优选地小于约0.01，以及最优选地小于约0.001，那么认为检验核酸序列与参考序列相似。

为了获得用于比较目的的空位比对，可如Altschul等1997所述利用Gapped BLAST(在BLAST2.0中)。可选择地，可使用PSI-BLAST(在BLAST2.0中)进行检测分子之间的远关系的重复搜索。当利用BLAST、Gapped BLAST、PSI-BLAST时，可使用各自程序的缺省参数(例如，BLASTN用于核苷酸序列，BLASTX用于蛋白质)。BLASTN程序(对于核苷酸序列)使用词长(W)为11、期望值(E)为10、截断为100、M＝5、N＝-4作为缺省值，并且比较两条链。对于氨基酸序列，BLASTP程序使用词长(W)为3、期望值(E)为10作为缺省值，以及BLOSUM62评分矩阵(见，Henikoff& Henikoff，1989)。见http://www.ncbi，nlm.nih.gov。也可通过目测人工进行比对。

出于本发明的目的，优选地使用具有缺省参数的BlastN程序(1.4.7版或更迟的版本)或者任何等同程序进行核苷酸的比较，用于测定与这里所公开的启动子序列的序列同一性百分率。“等同程序”意指任何序列比较程序，当与通过优选程序所产生的相应比对比较时，其对于任何两个所讨论的序列都产生具有相同核苷酸或氨基酸残基匹配和相同百分率序列同一性的比对。

(c)如这里所使用的，在两条核酸或多肽序列的情况中，“序列同一性”或“同一性”涉及两个序列中的残基，当对指定的比较窗进行比对获得最大一致时，它们是相同的。当使用序列同一性百分率涉及蛋白质时，公认不相同的残基位置常常由于保守性氨基酸取代而不同，其中将氨基酸残基用具有相似化学特性(例如，电荷或疏水性)的其它氨基酸残基取代，因此不改变分子的功能特性。当序列因保守性取代而不同时，可上调序列同一性百分率以修正取代的保守性。将由于这种保守取代而不同的序列称作具有“序列相似性”或“相似性”。进行这种调节的手段是本领域技术人员公知的。一般地这包括保守性取代作为部分而不是完全错配进行评分，由此增加序列同一性百分率。因此，例如，对相同的氨基酸给1分，非保守性取代给0分，保守性取代给0和1之间的记分。计算保守性取代的得分，例如，如在程序PC/GENE(Intelligenetics，Mountain View，Calif.)中进行。

(d)如这里所使用的，“序列同一性的百分率”意指通过将两个最佳比对序列经由比较窗进行比较所测定的值，其中与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比，比较窗中的多核苷酸序列中的部分可包括添加或缺失(即，空位)。计算百分率，通过测定两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配的位置数，将匹配的位置数除以比较窗中的总的位置数，并将结果乘以100以产生序列同一性的百分率。

(e)(i)术语多核苷酸序列的“基本一致”意指，用使用标准参数的所述比对程序之一，与参考序列相比，多核苷酸包含具有至少70％、71％、72％、73％、74％、75％、76％、77％、78％，或79％，优选至少80％、81％、82％、83％、84％、85％、86％、87％、88％，或89％，更优选至少90％、91％、92％、93％，或94％，以及最优选地至少95％、96％、97％、98％或99％序列同一性的序列。本领域技术人员将会意识到，通过考虑密码子简并性、氨基酸相似性、阅读框位置等因素，可对这些值适当调节以确定由两个核苷酸序列所编码的相应蛋白质的同一性。出于此目的的氨基酸序列的基本一致通常意味着至少50％或60％，优选至少70％或80％，更优选至少90％、95％，以及最优选地至少98％的序列同一性。

核苷酸序列基本相同的另一个指标是两个分子是否在严格条件下相互杂交(见下面)。通常，选择严格条件低于限定离子强度和pH下特异性序列的热解链温度(Tm)约5℃。然而，严格条件包括约1℃到约20℃范围的温度，取决于期望的严格度及这里所限定的其它因素。如果其编码的多肽基本相同，那么严格条件下不相互杂交的核酸仍然基本相同。这可能在例如，当使用遗传密码子所允许的最大密码子简并性产生核酸的拷贝时发生。两个核酸序列基本相同的一个指标是由第一个核酸所编码的多肽与由第二个核酸所编码的多肽在免疫学上发生交叉反应。

(ii)在肽的情况下，术语“基本一致”表示肽包含的序列在指定的比较窗与参考序列具有至少50％，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％或79％，优选80％、81％、82％、83％、84％、85％、86％、87％、88％或89％，更优选至少90％，91％、92％、93％或94％，或者甚至优选95％、96％、97％、98％或99％的序列同一性。优选使用Needleman和Wunsch(1970)的同源性比对算法进行最佳比对。两个多肽序列基本相同的指标是一个肽与针对第二个肽所产生的抗体在免疫学上发生反应。因此，肽与第二个肽基本上相同，例如，其中两个肽仅由于保守性取代而不同。

对于序列比较，一般地一个序列作为与测试序列比较的参考序列。当使用序列比较算法时，将测试和参考序列输入到计算机中，随后如果需要指定序列坐标，并且指定序列算法程序参数。然后，基于指定的程序参数，序列比较算法计算测试序列相对于参考序列的序列同一性百分率。

如上所指出的，两个核酸序列基本相同的另一个指标是两个分子在严格条件下相互杂交。术语“杂交特异性”指当序列以复杂混合物(例如，总的细胞DNA或RNA)存在时，分子仅在严格条件下与特定核苷酸序列结合、形成双链体或杂交。“基本结合”指探针核酸和靶核酸之间的互补杂交，并且包括可通过降低杂交媒介的严格性提供较小的错配，以达到对靶核酸序列的期望检测。

在核酸杂交试验如Southern和Northern杂交中，“严格杂交条件”和“严格杂交洗涤条件”依赖于序列，并且在不同环境参数下是不同的。Tm是50％的靶序列与完全匹配的探针杂交的温度(在限定的离子强度和pH下)。特异性一般是杂交后洗涤的函数，关键因素是离子强度和最后的洗涤溶液的温度。对于DNA-DNA杂交，Tm可从Meinkoth和Wahl，1984的等式中估计：

Tm＝81.5℃+16.6(log₁₀M)+0.41(％GC)-0.61(％甲酰胺)-500/L其中，M是单价阳离子的摩尔浓度，％GC是DNA中鸟苷和胞嘧啶的百分率，％甲酰胺是杂交溶液中甲酰胺的百分率，L是碱基对中杂交体的长度。每1％错配，Tm减少约1℃；因此，可调节Tm、杂交和/或洗涤条件以与期望的同一性的序列杂交。例如，如果寻找具有>90％同一性的序列，那么可将Tm降低10℃。通常，选择严格条件比限定离子强度和pH下特异性序列和其互补链的热解链温度I低约5℃。然而，强严格条件可在比热解链温度I低1、2、3或4℃时进行杂交和/或洗涤；中等严格条件可在比热解链温度I低6、7、8、9或10℃时进行杂交和/或洗涤；低严格条件可在比热解链温度I低11、12、13、14、15或20℃时进行杂交和/或洗涤。使用该等式、杂交和洗涤组分和期望的T的普通技术人员将会理解，对杂交和/或洗涤溶液的严格性变化的描述是不言自明的。如果期望的错配程度导致T小于45℃(水溶液)或32℃(甲酰胺溶液)，那么优选增加SSC浓度以便可使用更高的温度。在Tijssen，1993中发现对核酸杂交的广泛指导。通常，选择高严格的杂交和洗涤条件低于在限定离子强度和pH下特异性序列的热解链温度Tm约5℃。

高严格的洗涤条件的实例是0.15M NaCI，72℃约15分钟。严格洗涤条件的实例是在65℃用0.2×SSC洗涤15分钟(见，Sambrook，下文对SSC缓冲液的描述)。通常，在高严格洗涤之前进行低严格洗涤，以除去背景探针信号。

对于双链体，例如100个以上核苷酸，中等严格洗涤的实例是在45℃用1×SSC洗涤15分钟。对于例如100个以上核苷酸的双链体，低严格洗涤的实例是在40℃用4-6×SSC洗涤15分钟。对于短探针(例如，约10-50个核苷酸)，严格条件一般包括小于约1.5M的盐浓度，更优选在pH7.0-8.3时约0.01-1.0M的钠离子浓度(或者其它盐)，温度一般是至少约30℃，且对于长探针(例如，>50个核苷酸)至少约60℃。也可通过添加去稳定剂如甲酰胺达到严格条件。通常，在特定杂交测定中，信噪比高于无关探针所观察到的2倍(或者更高)，表示特异性杂交的检测。如果其编码的蛋白质基本相同，那么在严格条件下不彼此杂交的核酸仍然是基本相同的。这发生在，例如，当使用由遗传密码子允许的最大密码子简并性产生核酸拷贝时。

选择非常严格的条件等同于特定探针的T_m。互补核酸的严格杂交条件的实例(其在Southern或Northern印迹中的滤膜上具有100个以上的互补残基)是在37℃，50％甲酰胺(例如，在50％甲酰胺、1M NaCl、1％SDS中)杂交，并且在60-65℃，在0.1×SSC中洗涤。示范性的低严格条件包括在37℃与30-35％甲酰胺、1M NaCI，1％SDS(十二烷基硫酸钠)的缓冲液杂交，并且在50-55℃，在1×SSC-2×SSC(20×SSC＝3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示范性的中等严格条件包括在37℃在40-45％甲酰胺、1.0M NaCl，1％SDS(十二烷基硫酸钠)中杂交，并且在55-60℃，在0.5×SSC-1×SSC中洗涤。

以下是可用于克隆与本发明的参考核苷酸序列基本相同的直向同源核苷酸序列的杂交/洗涤条件组的实例：参考核苷酸序列优选地于50℃，在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中与参考核苷酸序列杂交，在50℃用2×SSC、0.1％SDS洗涤，更期望在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中杂交，在50℃用1×SSC、0.1％SDS洗涤，甚至更期望在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mMEDTA中杂交，在50℃用0.5×SSC、0.1％SDS洗涤，优选在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中杂交，在50℃用0.1×SSC、0.1％SDS洗涤，更优选地在50℃在7％十二烷基硫酸钠(SDS)、0.5M NaPO₄、1mM EDTA中杂交，在65℃用0.1×SSC、0.1％SDS洗涤。

“DNA改组”是在DNA分子中(优选随机的)引入突变或重排的方法，或者在两个或多个DNA分子之间(优选随机的)产生DNA序列交换的方法。由DNA改组所得到的DNA分子是改组的DNA分子，其是从至少一个模板DNA分子中衍生的非天然发生的DNA分子。改组的DNA优选编码相对于由模板DNA编码的多肽经过修饰的变体多肽，并且相对于由模板DNA编码的多肽，可能具有改变的生物学活性。

“重组DNA分子”是使用，例如在Sambrook等人，1989中所述的用于连接DNA序列的重组DNA技术和操作将DNA序列连接在一起的DNA序列的组合。

“植物”指任何植物，特别是农业上有用的植物(例如，种子植物)，“植物细胞”是植物的结构和生理单位，其包含细胞壁但也可能指原生质体。植物细胞可以为分离的单细胞或培养的细胞形式，或者作为高级的有组织的单元部分，例如，植物组织，或者分化成结构的植物器官，所述结构存在于植物发育的任何阶段。这种结构包括一种或多种植物器官，包括，但不限于，果实、枝条、茎、叶、花瓣等。优选地，术语“植物”包括整个植物、枝条营养器官/结构(例如，叶、茎和块茎)、根、花和花器官/结构(例如，苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳，和种皮)、和果实(成熟子房)、植物组织(例如，维管组织、基本组织等)以及细胞(例如，保卫细胞、卵细胞、藻丝等)，以及相同的子代。可在本发明方法中使用的植物的种类通常与适于转化技术的高等或低等植物的种类一样广泛，包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类以及多细胞藻类。其包括多种倍性水平的植物，包括非整倍体、多倍体、二倍体、单倍体和半合子。包括在本发明范围内的是植物界的高等和低等植物的所有属和种。此外包括成熟植物、种子、枝条和幼苗，以及从其衍生的部分、繁殖材料(例如，种子和果实)和培养物，例如细胞培养物。优选下列植物科的植物和植物材料：苋科(Amaranthaceae)、十字花科(Brassicaceae)、石竹科(Carophyllaceae)、藜科(Chenopodiaceae)、菊科(Compositae)、葫芦科(Cucurbitaceae)、唇形科(Labiatae)、豆科蝶形花亚科(Leguminosae，Papilionoideae)、百合科(Liliaceae)、亚麻科(Linaceae)、锦葵科(Malvaceae)、蔷薇科(Rosaceae)、虎耳草科(Saxifragaceae)、玄参科(Scrophulariaceae)、茄科(Solanaceae)、番杏科(Tetragoniaceae)。一年生的、多年生的单子叶植物和多子叶植物是用于产生转基因植物的优选的宿主生物。在所有观赏植物、林业、果实，或观赏树木、花、插花、灌木或草坪草中使用根据本发明的重组系统或者方法是特别有利的。所述植物可包括，但不限于，苔藓植物如，例如，苔类植物(hepaticas)和藓类(mosses)；蕨类植物如蕨类、马尾和伸筋草(clubmosses)；裸子植物如针叶树、苏铁科类植物、银杏以及Gnetaeae；藻类如绿藻(Chlorophyceae)、Phaeophpyceae、红藻(Rhodophyceae)、粘藻(Myxophyceae)、黄藻(Xanthophyceae)、硅藻(Bacillariophyceae)(硅藻属)和裸藻(Euglenophyceae)。用于本发明目的的植物可包括蔷薇科，如玫瑰；杜鹃花科(Ericaceae)如杜鹃花(rhododendron)和杜鹃花(azalea)；大戟科(Euphorbiaceae)如猩猩木和巴豆，石竹科，如石竹花；茄科，如矮牵牛花；苦苣苔科(Gesneriaceae)如非洲紫罗兰，凤仙花科(Balsaminaceae)，如凤仙花；兰科(Orchidaceae)，如兰花；鸢尾科(Iridaceae)，如唐菖蒲、鸢尾属植物、小苍兰和番红花；菊科(Compositae)，如万寿菊；牛儿苗科(Geraniaceae)，如天竺葵；百合科(Liliaceae)，如Drachaena；桑科(Moraceae)，如榕树；天南星科(Araceae)，如蔓绿绒和许多其它植物。根据本发明的转基因植物还特别选自双子叶作物植物，如，例如选自豆科的植物如豌豆、苜蓿和大豆；伞形科(Umbelliferae)，特别是胡萝卜(Daucus)属(非常特别是胡萝卜(carota)种(胡萝卜))和芹属(Apium)(非常特别地是旱芹(graveolens var.dulce)种(旱芹))以及许多其它植物；茄科，特别是番茄(Lycopersicon)属，非常特别地是番茄(esculentum)种(番茄)，和茄(Solanum)属，非常特别地是马铃薯(tuberosum)种和茄子(melongena)种(茄子)、烟草和许多其它植物；辣椒(melongena)属，非常特别地是annum种(胡椒)和许多其它植物；豆科，特别是大豆(Glycine)属，非常特别地是(max)种(大豆)和许多其它植物；十字花科(Cruciferae)，特别是芸苔(Brassica)属，非常特别地是甘蓝型(napus)种(油菜)，白菜型(campestris)种(甜菜)、oleracea cv Tastie(甘蓝)、oleracea cv Snowball Y(花椰菜)和oleracea cv Emperor(椰菜)；以及拟南芥(Arabidopsis)属，非常特别地是thaliana种和许多其它植物；菊科家族，特别是(Lactuca)属，非常特别地是sativa种(莴苣)和许多其它植物。根据本发明的转基因植物可以选自单子叶作物植物，例如谷类如小麦、大麦、高粱和栗、黑麦、黑小麦、玉米、稻或燕麦，以及甘蔗。另外优选地是树木，如苹果树、梨树、温柏、李树、樱桃树、桃树、油桃、杏树、番木瓜树、芒果树以及包括针叶树和落叶树的其它木本种，如杨树、松树、美洲杉、雪松、橡树等。最优选的是拟南芥、烟草、油菜、大豆、玉米、小麦、亚麻(亚麻籽和亚麻)、亚麻荠(camelina sativa)、荠菜、马铃薯和万寿菊。

“显著增加”是大于测量技术中固有的误差界限的增加，优选增加约2倍或更多。

“显著减少”意指大于测量技术中固有误差界限的减少，优选减少约2倍或更多。

发明详述

本发明因此提供分离的核酸分子，其包含的植物核苷酸序列在植物细胞中指导其有效连接的核酸片段的种子偏好性或种子特异性的转录。

具体而言，本发明提供在植物中调节种子特异性或种子偏好性表达的转基因表达盒，其包含

a)编码过氧化物氧还蛋白(PER1)蛋白质的基因的至少一个转录调节核苷酸序列，并且其与该基因功能性连接，

优选的，本发明的表达盒包含

i)由GenBank的拟南芥基因组基因座At1g48130所述基因，和

种子偏好性的或种子特异性启动子对于表达基因和产生大量蛋白质、表达油或目的蛋白质(例如抗体)、表达增加种子营养价值的基因等等是有用的。

术语“种子”在本发明中意指在任何发育阶段的植物的种子，即从花粉和卵母细胞的融合开始，持续整个胚期和休眠种子期，直至种子萌发到早期幼苗器官(例如，子叶和下胚轴)为止。

“种子特异性转录”在本发明中意指由转录调节元件以某种方式控制的核酸序列的转录，其中所述核酸序列在种子中的转录占在整个植物发育期的任何阶段中所述核酸序列转录的RNA的全部量的超过90％，优选超过95％，更优选超过99％。本文明确公开的转录调节核苷酸序列被认为是种子特异性的转录调节核苷酸序列。

“种子偏好性的转录”在本发明中意指由转录调节元件以某种方式控制的核酸序列的转录，其中所述核酸序列在种子中的转录占在整个植物发育期的任何阶段中所述核酸序列转录的RNA的全部量的超过50％，优选超过70％，更优选超过80％。本文明确公开的转录调节核苷酸序列被认为是种子特异性的转录调节核苷酸序列。

“同源性”是遗传术语，用于本领域指与参考序列拥有高度的序列相关性的多核苷酸或多肽序列。这类相关性可以如以上定义的通过确定两个序列之间的同一性和/或相似性的程度来定量。术语“直向同源物”和“旁系同源物”落入这一遗传术语之内。“旁系同源物”指在相同物种中功能相似的多核苷酸或多肽。“直向同源物”指在另一物种中功能等同的多核苷酸或多肽。直向同源基因意指优选编码直向同源的蛋白质的基因。更具体而言，术语“直向同源物”指从一个物种获得的多肽或蛋白质与来自不同物种的多肽或蛋白质功能相似。直向同源物之间的序列差异是物种形成的结果。更优选的，本文所用的“直向同源基因”或“直向同源物”，关于如基因座At1g48130所述的拟南芥基因(和/或包含如SEQ ID NO：9、10、11或20所述序列的亚麻基因)，意指编码蛋白质的基因，所述蛋白质与由SEQ ID NO：13或21的任一所述多肽具有至少50％或60％，优选至少70％或80％，更优选至少80％或90％，最优选至少95％的氨基酸序列同一性。更优选所述蛋白质还具有过氧化物氧还蛋白(PER1)蛋白质的酶特性。本文公开了多个这样的蛋白质(直向同源的蛋白质)，例如由SEQ ID NO：13、15、17、19、21或23所述的多肽序列。在直向同源蛋白质之间的同一性如下表1中所述。

表1：直向同源蛋白质之间的同一性(全长的蛋白质)

	拟南芥	欧洲油菜	圆柱小麦	大麦	黑麦状雀麦
						拟南芥	100	90	71	72	66
欧洲油菜		100	68	69	65
						圆柱小麦			100	98	90
大麦				100	90
						黑麦状雀麦					100

表2：直向同源蛋白质相对于亚麻蛋白质片段之间的同一性(对比限于该片段长度，且计算在此部分上的同一性范围，即仅在亚麻的部分序列的长度上)。

	拟南芥	欧洲油菜	亚麻(部分)	大麦	圆柱小麦	黑麦状雀麦
							拟南芥	100	89	76	73	73	61
欧洲油菜		100	73	68	68	56
							亚麻(部分)			100	73	73	58
大麦				100	100	82
							圆柱小麦					100	82
黑麦状雀麦						100

优选本发明的转录调节核苷酸序列包含有关基因的至少一个启动子序列(例如，位于有关基因的转录起始上游能够诱导下游序列转录的序列)。所述转录调节的核苷酸序列可以包含所述基因的启动子序列，但是还可以包含其它元件，例如5’非翻译序列、增强子、内含子等。优选的，所述启动子指导有效连接的核酸片段在植物或植物细胞中的种子偏好性或种子特异性转录，例如连接的植物DNA，其含有结构或调节基因的开放阅读框。

下表1阐明本发明的启动子优选从其分离的基因、所述基因的功能、由所述基因编码的cDNA，和由所述基因编码的蛋白质(ORF)。

表1：本发明的启动子优选从其分离的基因、所述基因的推测的功能、由所述基因编码的cDNA，和由所述基因编码的蛋白质。

基因座	推测的功能	启动子SEQ ID	mRNA基因座IDcDNASEQ ID	蛋白质ID蛋白质SEQ ID
					At1g48130	拟南芥推测的过氧化物氧还蛋白(PER1)蛋白质	SEQ ID NO：1，2，3，4，5，6，7，8	BT003916SEQ ID NO：12	AAO41963.1SEQ ID NO：13
	亚麻推测的过氧化物氧还蛋白(PER1)蛋白质	SEQ ID NO：9，10，11	SEQ ID NO：20	SEQ ID NO：21

如这些本文提供的转录调节序列是新的，且在先前技术中没有描述。相应的，本发明的另一实施方案涉及从以下序列组成的组中选择的分离的核苷酸序列(优选具有转录调节的活性，更优选具有启动子活性)：

a)如由SEQ ID NO：1、2、3或4所述的序列，且与由SEQ ID NO：1、2、3或4所述的序列具有至少99％，优选99.5％，更优选99.8％的序列同一性的序列，和包含如由SEQ ID NO：1、2、3或4所述序列的至少600个连续的核苷酸，优选至少800个连续的核苷酸，更优选至少900个连续的核苷酸，更优选至少1000个连续的核苷酸的序列，和

b)如由SEQ ID NO：9、10或11所述的序列，且与由SEQ ID NO：5或26所述的序列具有至少40％或50％，优选60％或70％，更优选80％或90％，最优选95％或98％的序列同一性的序列，和包含如由SEQ ID NO：9、10或11所述序列的至少15或20个连续的核苷酸，优选至少50或100个续的核苷酸，更优选至少250个连续的核苷酸，更优选至少500个连续的核苷酸的序列。

如在以上定义部分所说明，核苷酸序列之间的同一性测量优选通过BLASTN程序，使用词长(W)为11、期望值(E)为10、截断为100、M＝5、N＝-4作为缺省值，并且比较两条链。对于氨基酸序列的同一性测量，通过BLASTP程序使用词长(W)为3、期望值(E)为10作为缺省值，以及BLOSUM62评分矩阵(见，Henikoff & Henikoff，1989)。使用1.4.7版或其后的BLAST程序。

优选的，转录调节核苷酸序列选自以下序列组成的组：

i)由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述序列，

ii)在i)的序列的至少50个连续碱基的片段，

v)能够与包含由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述转录调节核苷酸序列的50-200个或更多连续的核苷酸的核酸杂交或者与其互补序列杂交的核苷酸序列(优选在条件为在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用2×SSC、0.1％SDS于50℃洗脱；更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mMEDTA中于50℃杂交，用1×SSC、0.1％SDS于50℃洗脱；还更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.5×SSC、0.1％SDS于50℃洗脱；优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于50℃洗脱；更优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于65℃洗脱)；

在优选的实施方案中，以上ii)、iii)、iv)、v)和vi)中明确的序列能够调节植物细胞或生物体中的转录，优选所述序列与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列具有基本相同的转录活性。

优选与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的转录调节核苷酸序列基本相似的核苷酸序列与由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的序列具有至少50％或60％，优选至少70％或80％，更优选至少90％或95％，最优选至少98％的序列同一性。

转录调节核苷酸序列可以或能够从植物基因组DNA的编码多肽的基因(优选从直向同源的基因，即编码直向同源蛋白质的基因)获得，所述多肽

a)包含从以下氨基酸序列组成的组选择的至少一条序列基序

i)GDTVPNL(SEQ ID NO：37)，优选MPG(I/L)T(L/I)GDTVPNLE(SEQ ID NO：38)，

ii)GDFTPVC(SEQ ID NO：39)，优选LFSHPGDFTPVCTTEL(SEQID NO：40)，

iii)VKLLGLS(SEQ ID NO：41)，优选RGVKLLGLSCDD(SEQ IDNO：42)，

iv)YPI(I/M)ADP(SEQ ID NO：43)，优选SKV(T/N)YPI(I/M)ADP(SEQ ID NO：44)，

v)KLSFLYP(SEQ ID NO：45)，优选(K/V)(I/V)KLSFLYPS(SEQID NO：46)，

vi)GRNMDEV(SEQ ID NO：47)，优选TGRNMDEV(L/V)RA(SEQID NO：48)，

viii)PSKKGYL(SEQ ID NO：51)，优选LPSKKGYLR(SEQ IDNO：52)，

或

转录调节核苷酸序列的功能等同物获得自或能够获得自植物基因组DNA编码多肽的基因(优选从直向同源基因，即编码直向同源蛋白质的基因)或呈现种子偏好性或种子特异性方式的启动子活性的所述转录调节核苷酸序列的片段，所述多肽分别与由SEQ ID NO：13、15、17、19、21或23的任一所述多肽基本相似，且优选具有至少50％或60％，优选至少70％或80％，更优选至少90％或95％，最优选至少97％或98％的氨基酸序列同一性。

另外的本发明的转录调节核苷酸序列的功能性等同物可以从植物基因组DNA的编码多肽的基因获得，所述多肽包含由SEQ ID NO：37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52所述的至少二或三条，优选至少四或五条，更优选六条，最优选全部的序列，且其优选在植物中呈现启动子活性(优选以种子偏好性或种子特异性的方式)。

优选的，该表达盒包含转录调节性核苷酸序列，该序列可以或能够从植物基因组DNA的编码多肽(优选直向同源蛋白质)的基因获得，所述多肽

a)包含从以下氨基酸序列组成的组选择的至少一条，优选至少二或三条，更优选全部序列基序

i)GDTVPNL(SEQ ID NO：37)，优选MPG(I/L)T(L/I)GDTVPNLE(SEQ ID NO：38)，

ii)GDFTPVC(SEQ ID NO：39)，优选LFSHPGDFTPVCTTEL(SEQID NO：40)，

iii)VKLLGLS(SEQ ID NO：41)，优选RGVKLLGLSCDD(SEQ IDNO：42)，

iv)YPI(I/M)ADP(SEQ ID NO：43)，优选SKV(T/N)YPI(I/M)ADP(SEQ ID NO：44)，

v)KLSFLYP(SEQ ID NO：45)，优选(K/V)(I/V)KLSFLYPS(SEQID NO：46)，

vi)GRNMDEV(SEQ ID NO：47)，优选TGRNMDEV(L/V)RA(SEQID NO：48)，

viii)PSKKGYL(SEQ ID NO：51)，优选LPSKKGYLR(SEQ IDNO：52)，

和

优选的，所述直向同源蛋白质还具有与由拟南芥基因座At1g48130编码的蛋白质相同的酶活性。

如果以种子偏好性或种子特异性的方式(如上定义的)起始转录，认为转录调节核苷酸序列的活性是等同的。优选使用与所述转录调节核苷酸序列有效连接的报道基因证明这类表达谱。在这里，优选的报道基因(Schenborn1999)是绿色荧光蛋白(GFP)(Chui1996；Leffel1997)、氯霉素转移酶、萤光素酶(Millar1992)、β-葡糖醛酸糖苷酶或β-半乳糖苷酶。尤其优选β-葡糖醛酸糖苷酶(Jefferson1987)。

除了功能性等同物的转录调节活性，尤其是功能性等同物的表达水平可以与其亲本序列的活性不同。表达水平可以比亲本序列的表达水平更高或更低。由待表达的核酸序列决定，两种衍生物都可以是有利的。优选这样的功能性等同的序列，其(与其亲本序列相比)与所述亲本序列的表达水平的改变不超过50％，优选25％，更优选10％(优选由mRNA表达或蛋白质(例如，报道基因)表达判断)。此外，优选这样的等同序列，已证明与其亲本序列相比，其表达优选增加至少50％，更优选至少100％，最优选至少500％。

优选转录调节核苷酸序列的功能等同物可以或能够从植物基因组DNA从由cDNA所述的表达mRNA的基因获得，所述cDNA分别与由SEQID NO：12、14、16、18、20或22的任一所述序列，或以种子偏好性或种子特异性方式呈现启动子活性的所述转录调节核苷酸序列的片段基本相似，且优选具有至少50％或60％，优选至少70％或80％，更优选至少90％或95％，最优选至少97％或98％的氨基酸序列同一性。

使用本文所述的种子偏好性或种子特异性的拟南芥或亚麻启动子序列作为探针，通过在低、中等或严格的杂交条件下杂交，在其它植物中筛选同源的结构基因，可以从其它植物物种获得这类转录调节核苷酸序列的功能性等同物。在种间保守的本发明的种子偏好性或种子特异性启动子序列区还可以用作PCR引物从拟南芥或亚麻之外的物种扩增片段，并且该片段用作杂交探针(后者的方法使能够进行更高严格度的筛选)或在转录测定中用于确定启动子活性。此外，可以使用种子偏好性或种子特异性启动子序列使用计算机算法在数据库中鉴别结构相关的序列。

更具体而言，基于本发明的核酸序列，可以基于其与拟南芥或亚麻核酸序列的序列相似性根据熟知的技术(例如杂交、PCR或计算机产生的序列比对)，从任何期望的生物(优选从另一植物的基因组)，鉴别或分离直向同源物。例如，使用特定拟南芥或亚麻核酸序列的全部或部分作为探针，选择性杂交至存在于从所选来源的生物克隆的基因组DNA区段或cDNA区段的群(即，基因组或cDNA文库)中的其它基因序列。此外，可以从生物的任何细胞或组织制备合适的基因组文库和cDNA文库。这类技术包括使用以DNA文库(噬菌斑或菌落，见，例如Sambrook1989)为平台的杂交筛选，和使用寡核苷酸引物(其优选对应于在相关多肽之间或本文提供的核苷酸序列的亚序列之间保守的序列结构域)通过PCR的扩增(见，例如Innis1990)。这些方法特别非常适于从与探针序列衍生自的生物相对近似的生物中分离基因序列。使用拟南芥或亚麻序列作为探针的这些方法的应用非常适于从任何来源的生物，优选其它植物物种，分离基因序列。在PCR方法中，可以设计寡核苷酸引物用于PCR反应来扩增来自从任何目的植物提取的cDNA或基因组DNA的对应DNA序列。设计PCR引物和PCR克隆的方法通常是本领域公知的。

在杂交技术中，使用已知核苷酸序列的全部或部分作为探针选择性杂交至在来自所选择生物的克隆的基因组DNA区段或cDNA区段的群(即，基因组文库或cDNA文库)中存在的其它对应的核苷酸序列。杂交探针可以是基因组DNA区段、cDNA区段、RNA片段或其它寡核苷酸，并且可以用可检测的基团，例如³²P或任何其它可检测的标记标记。因此，例如，可以基于本发明的序列通过标记合成的寡核苷酸制备用于杂交的探针。用于杂交和用于构建cDNA和基因组文库的探针的制备方法是本领域公知的，并且公布于Sambrook等人(1989)。通常，与本文公布的序列杂交的序列与所公布的序列具有至少约50％至70％，甚至约80％、85％、90％、95％至98％或更多的同一性。即，序列的序列相似性可以共享至少约50％至70％，甚至约80％、85％、90％、95％至98％的序列相似性范围内。

还可以通过例如在已知的数据库搜索编码有确定的氨基酸序列同一性的多肽的基因或具有确定的核苷酸序列同一性的DNA来鉴别本发明的核酸分子。用于比较的序列比对方法是本领域已知的并且如上所述。

因此，本发明的分离的核酸分子包括本文公开的拟南芥或亚麻序列的直向同源物，即，除了拟南芥或亚麻之外的生物中的对应核苷酸序列，所述生物包括但不限于除了拟南芥或亚麻之外的植物，优选双子叶植物，例如苜蓿、向日葵、大豆、棉花、花生、烟草、油菜或甜菜，以及谷类植物，例如玉米、小麦、黑麦、草坪草、高梁、粟、甘蔗、大麦和香蕉。直向同源基因是不同物种的基因，其编码具有相同或相似功能(例如，催化与由参考生物体的基因所编码的产物相同的反应)的产物。因此，直向同源物包括具有小于，例如，50％氨基酸序列同一性的多肽，但是该直向同源物编码的多肽具有相同或相似的功能。可使用如GenBank的数据库以鉴定与拟南芥序列相关的序列，例如，在其它双子叶植物中的直向同源物。可选择地，可使用如杂交或PCR的重组DNA序列以鉴定与拟南芥或亚麻序列相关的序列或者克隆来自不同DNA的等同序列。

本发明的转录调节核苷酸序列或它们的功能等同物可从任何植物或非植物来源中获得或者分离，或者通过纯化学手段合成生产。优选的来源包括，但不限于上述定义部分所定义的植物。

因此，本发明的另一个优选的实施方案涉及用于鉴定和/或分离所表征的转录调节核苷酸序列(优选带有种子偏好性或种子特异性的转录调节活性)的方法，所述鉴定和/或分离利用编码由SEQ ID NO：13、15、17、19、21或23所述多肽的核酸序列，或者所述核酸序列的部分。优选的是由SEQID NO：12、14、16、18、20或22所述的核酸序列或其部分。在本文中，“部分”意指至少15个连续的核苷酸，优选至少25个连续的核苷酸，更优选地至少50个连续的核苷酸的核酸序列。

用于鉴定和/或分离的方法可基于(但不限于)上述方法，例如聚合酶链反应、杂交或数据库筛选。优选地，本发明的这一方法基于聚合酶链反应，其中所述核酸序列或其部分用作寡核苷酸引物。本领域技术人员意识到用于从其编码序列部分(例如，cDNA的部分)开始扩增和分离基因的启动子的几种方法。这类方法可包括，但不限于，例如反向PCR(“iPCR”)或“热不对称交错PCR”(“TAIL PCR”)的方法。

因此，本发明的另一实施方案涉及提供或产生用于在植物中异源表达的转基因表达盒的方法，包括下列步骤：

I.利用至少一条编码由SEQ ID NO：13、15、17、19、21或23所述的多肽的核酸序列，或所述核酸序列的至少15个连续的核苷酸的部分分离植物基因的转录调节核苷酸序列，和

II.将所述转录调节核苷酸序列功能性连接至另一目的核苷酸序列，所述另一目的核苷酸序列相对于所述转录调节核苷酸序列是异源的。

I.利用至少一条编码由SEQ ID NO：13、15、17、19、21或23所述多肽的核酸序列或其至少15个连续核苷酸的部分分离种子偏好性或种子特异性的转录调节核苷酸序列，和

II.将所述种子偏好性或种子特异性的转录调节核苷酸序列功能性连接至另一目的核苷酸序列，所述另一目的核苷酸序列相对于所述种子偏好性或种子特异性的转录调节核苷酸序列是异源的。

i)GDTVPNL(SEQ ID NO：37)，优选MPG(I/L)T(L/I)GDTVPNLE(SEQ IDNO：38)，

ii)GDFTPVC(SEQ ID NO：39)，优选LFSHPGDFTPVCTTEL(SEQID NO：40)，

iii)VKLLGLS(SEQ ID NO：41)，优选RGVKLLGLSCDD(SEQ IDNO：42)，

iv)YPI(I/M)ADP(SEQ ID NO：43)，优选SKV(T/N)YPI(I/M)ADP(SEQ ID NO：44)，

v)KLSFLYP(SEQ ID NO：45)，优选(K/V)(I/V)KLSFLYPS(SEQID NO：46)，

vi)GRNMDEV(SEQ ID NO：47)，优选TGRNMDEV(L/V)RA(SEQID NO：48)，

viii)PSKKGYL(SEQ ID NO：51)，优选LPSKKGYLR(SEQ IDNO：52)。

优选的，用于分离的核酸序列包含由SEQ ID NO：12、14、16、18、20或22所述序列的至少15个连续的核苷酸，优选至少25个连续的核苷酸，更优选至少50个连续的核苷酸。优选的，使用所述核酸序列作为引物通过聚合酶链式反应实现种子偏好性或种子特异性转录调节的核苷酸序列的分离。可以通过本领域中已知的标准克隆方法，例如连接介导的克隆或重组介导的克隆实现有效的连接。

优选的，本发明的转录调节核苷酸序列和启动子包括SEQ ID NO：1、2、3、4、5、6、7、8、9、10和11的任一序列或者其启动子直向同源物的约25至2000(包括50至500或100至250，直到1000或1500)的连续核苷酸的连续一段序列(例如，40至约743，60至约743，125至约743，250至约743，400至约743，600至约743的连续一段序列)，其包括最小启动子区。

在本发明的特定实施方案中，所述的约25至2000(包括50至500或100至250，直到1000或1500)的连续核苷酸的连续一段序列(例如，40至约743，60至约743，125至约743，250至约743，400至约743，600至约743的连续序列)与SEQ ID NO：1、2、3、4、5、6、7、8、9、10和11的任一序列或者其启动子直向同源物的约25至2000(包括50至500或100至250，直到1000或1500)的连续核苷酸对应的连续一段序列(例如，40至约743，60至约743，125至约743，250至约743，400至约743，600至约743的连续序列)具有至少50％或60％，优选至少70％或80％，更优选至少90％和最优选至少95％的核酸序列同一性，其包括最小启动子区。上述定义的连续的一段核苷酸序列优选包含选自TATA盒、GC盒、CAAT盒和转录起始位点的一个或多个启动子基序。

本发明的转录调节核苷酸序列或其功能等同物能在靶细胞，特别是在植物细胞中驱动编码序列的种子偏好性或种子特异性表达。这里所公开的启动子序列和方法可用于分别调节任何异源核苷酸序列在宿主植物中的种子偏好性或种子特异性的表达，以改变植物的表型。这些启动子可与增强子、上游元件，和/或植物可表达的结构基因的5’侧翼区的活化序列组合使用。同样地，上游元件可与多种植物启动子序列组合使用。

本发明的转录调节核苷酸序列和启动子可用于修饰植物的表型。可期望转基因植物表型中的多种改变，即，修饰植物中的脂肪酸组成、改变植物的氨基酸含量、改变植物的病原体防御机制等。可在植物中通过提供异源产物的表达或内源产物增加的表达获得这些结果。可选择地，可通过在植物中提供减少一个或多个内源产物的表达，特别是酶或辅因子达到这些结果。这些改变导致所转化植物表型的改变。

通常，本发明的转录调节核苷酸序列和启动子可用于在植物中表达与所述启动子有效连接的核酸片段如，例如，开放阅读框或其部分、反义序列、编码双链RNA序列的序列或者转基因。

有效连接可以，例如，包括本发明的转录调节核苷酸序列(例如，如由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述的序列)与将要表达的核酸序列，以及任选地，额外的调节元件，例如，多聚腺苷化作用或转录终止元件、增强子、内含子等的顺序排列，以转录调节核苷酸序列可在适当条件下在目的核酸序列表达的过程中完成其功能的方式。术语“适当条件”意指优选表达盒存在于植物细胞中。优选这样的排列，其中将要表达的目的核酸序列以两个序列共价连接的方式置于本发明的转录调节核苷酸序列的下游(即，在3’方向)。任选地，可在两个序列中间插入另外的序列。这种序列可以是例如，接头或多克隆位点。此外，可插入编码融合蛋白的部分的序列(万一要表达由目的核酸编码的蛋白质的融合蛋白)。优选地，在要表达的目的核酸序列与本发明的转录调节核苷酸序列之间的距离不超过200个碱基对，优选不超过100个碱基对，更优选地不超过50个碱基对。

可通过本领域已知的多种方法实现与本发明的任何表达盒的有效连接，包括体外和体内操作。因此，可通过使用本领域公知的标准重组和克隆技术实现本发明的表达盒或包含这类表达盒的载体(见，例如，Maniatis1989；Silhavy1984；Ausubel1987)。

也可通过将本发明的转录调节核苷酸序列(例如，如由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述序列)插入植物基因组内装配表达盒。这种插入将导致与本身已经存在于基因组中的目的核酸序列的有效连接。由于转录调节序列的转录调节特性，通过插入，以种子偏好性或种子特异性的方式表达目的核酸。插入可以是定向的或偶然的。优选插入是定向的并且通过例如同源重组实现。通过此操作，可用本发明的转录调节核苷酸序列交换天然启动子，由此修饰内源基因的表达谱。转录调节核苷酸序列也可以以表达内源基因的反义mRNA的方式插入，由此诱导基因沉默。

同样地，可通过将要表达的目的核酸序列以所插入的序列有效连于转录调节序列的方式，插入到其天然基因组环境(即，连于其天然基因)中包括转录调节核苷酸序列的植物基因组内，因此形成本发明的表达盒。

该表达盒可以用于多种表达目的，例如蛋白质的表达、或反义RNA、正义或双链RNA的表达。优选的，核酸序列的表达赋予植物农业上有价值的性状。

要连于本发明的转录调节核苷酸序列的开放阅读框可从下列基因中获得：昆虫抗性基因、疾病抗性基因(例如，细菌疾病抗性基因、真菌疾病抗性基因、病毒疾病抗性基因、线虫疾病抗性基因)、除草剂抗性基因、影响颗粒组成或品质的基因、营养利用基因、真菌毒素还原基因、雄性不育基因、选择标记基因、可筛选的标记基因、阴性筛选标记、阳性筛选标记、影响植物农艺性状的基因，即，产量、稳定性等，或者环境或胁迫抗性基因，即，赋予除草剂抗性或耐受性、昆虫抗性或耐受性、疾病抗性或耐受性(病毒、细菌、真菌、霉菌或线虫)、胁迫耐受性或抗性(如通过对干旱、热、寒冷、冰冻、过潮、盐胁迫或氧化应激的抗性或耐受性举例说明)、增加的产量、食物含量和组成、物理外观、雄性不育、脱水(drydown)、稳定性、繁殖能力、淀粉性质或量、油量和品质、氨基酸或蛋白质组成等的一个或多个基因。“抗性”意指植物在被施用试剂、病原体感染或者暴露于胁迫时，作为结果，其基本上不显示表型改变。“耐受性”意指植物尽管可能作为感染的结果显示一些表型改变，但是基本上不减少繁殖能力或基本上不改变代谢。

种子偏好性或种子特异性的转录调节核苷酸序列(例如，启动子)可用于表达多种基因，包括改变代谢途径、赋予疾病抗性，用于蛋白质生成(例如，抗体生产)，或者提高养分摄取等。可修饰种子偏好性或种子特异性的转录调节核苷酸序列(例如，启动子)使其可调节，例如，可诱导。可以使用如上所述的基因和转录调节核苷酸序列(例如，启动子)用于鉴定直向同源基因和它们的转录调节核苷酸序列(例如，启动子)，其也可能在特定组织和/或发育方式中表达。此外，直向同源转录调节核苷酸序列(例如，启动子)可用于表达相连的开放阅读框。另外，通过将这些直向同源物的转录调节核苷酸序列(例如，启动子)进行比对，可鉴定用于产生合成的转录调节核苷酸序列(例如，启动子)的新的顺式元件。

上述表达调节核苷酸序列可任选的有效连于其它适当的调节序列，例如，转录终止序列、操纵基因、阻抑物结合位点、转录因子结合位点和/或增强子。

本发明还提供含有本发明的表达盒的重组载体，以及包含表达盒或载体(例如，包含质粒)的宿主细胞。表达盒或载体可增大转化植物的基因组或者可在染色体外维持。本发明的表达盒或载体可存在于核、叶绿体、线粒体和/或植物细胞的质体中。优选本发明的表达盒或载体包含在植物核的染色体DNA中。本发明也提供通过该方法所制备的转基因植物，来自这样植物的种子和来自这样植物的子代植物(包括杂种和近亲交配)。表达盒可有效连于结构基因、其开放阅读框、或者其部分。表达盒还可包含Ti质粒并被包含在根瘤农杆菌细胞中；其可在微粒上被携带，其中微粒适于植物细胞的弹果转化；或者其可被包含在植物细胞或原生质体中。此外，表达盒或载体可被包含在转化植物或其细胞内，且该植物可以是双子叶植物或单子叶植物。特别地，植物可以是双子叶植物。优选的转基因植物是转基因玉米、大豆、大麦、苜蓿、向日葵、油菜、大豆、棉花、花生、高粱、烟草、甜菜、稻、小麦、黑麦、草坪草、栗、甘蔗、番茄或马铃薯。

本发明还提供植物育种的方法，例如，制备杂交能育的转基因植物。该方法包括将包含本发明的特定表达盒的能育的转基因植物与其自身或与第二种植物(例如，缺乏特定表达盒的植物)杂交，以制备包含特定表达盒的杂交能育的转基因植物的种子。然后种植该种子以获得杂交能育的转基因植物。该植物可以是单子叶植物或双子叶植物。在具体的实施方案中，植物是双子叶植物。杂交能育的转基因植物可具有通过母本或者通过父本遗传的特定的表达盒。第二种植物可以是自交植物。杂交能育的转基因植物可以是杂种。这些杂交能育的转基因植物中任何一种的种子也包括在本发明内。

本发明的转录调节核苷酸序列还包括与在严格条件下与SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述核酸分子以及从该核酸分子中转录的RNA杂交的序列(以下称作“检验”序列)互补的序列。当在严格条件下杂交时，优选地将本发明的检验或核酸分子置于支持物上，例如，膜或DNA芯片上。因此，优选地将本发明的变性的检验或核酸分子首先结合到支持物上，在例如，55和70℃之间的温度，在含有0.1％SDS的2×柠檬酸缓冲盐(SC)中进行指定时间的杂交，随后将支持物在同一温度下但用SC浓度降低的缓冲液冲洗。取决于所需的严格程度，这种减少浓度的缓冲液一般是含有0.1％SDS的1×SC、含有0.1％SDS的0.5×SC和含有0.1％SDS的0.1×SC。更优选在高严格条件(如上所定义)进行杂交。

实际上，可使用任何DNA组合物用于向受体植物细胞(例如，双子叶细胞)递送，以最终产生依照本发明的能育的转基因植物。例如，可使用载体和质粒形式的DNA区段或片段，或者在一些情况下仅含有将在植物中表达的DNA元件的线性DNA区段或片段等等。根据本发明公开的教导，构建可与本发明一起使用的载体将是本领域技术人员公知的(见，例如，Sambrook1989；Gelvin1990)。

当然，用于转化这类细胞的载体、质粒、粘粒、YAC(酵母人工染色体)、BAC(细菌人工染色体)和DNA区段通常包括cDNA、基因或期望引入细胞内的基因。这些DNA构建体可进一步包括如启动子、增强子、多位点接头，或者甚至期望的调节基因的结构。选择用于细胞内导入的DNA部分、片段或基因常常编码蛋白质，所述蛋白质将在产生的重组细胞中表达，例如将产生可筛选的或可选择的性状和/或其将赋予再生植物改良的表型。然而，可能不总是这种情况，本发明也包括掺入不表达的转基因的转基因植物。

在某些实施方案中，可希望使用在单子叶植物转化中可复制型病毒载体。这种载体包括，例如，小麦矮缩病毒(WDV)“穿梭”载体，如pW1-11和PW1-GUS(Ugaki1991)。这些载体能在玉米细胞以及大肠杆菌中自主复制因而可提供增强的对检测向转基因细胞中递送DNA的灵敏度。复制载体也可用于递送两侧为转座因子如Ac、Ds或Mu的DNA序列的基因。已提出在玉米基因组内这些元件的转座需要DNA复制(Laufs1990)。也期望转座元件可用于引入缺乏质粒载体在细菌中选择和维持所必需元件的DNA部分或片段，例如，抗生素抗性基因和DNA复制起点。也建议使用如Ac、Ds或Mu的转座元件，其将积极促进期望的DNA的整合并且因此增加稳定转化细胞的频率。使用如Ac、Ds或Mu的转座元件可积极促进目的DNA的整合并且因此增加稳定转化细胞的频率。转座元件可用于允许在细菌中从质粒载体的选择和维持所必需的元件中分离目的基因或者选择转化体。通过使用转座元件，可将期望的和非期望的DNA序列在基因组内转座分开，这样通过子代中的遗传分离，可鉴定具有期望的或非期望DNA序列的植物。

与一个或多个本发明的转录调节核苷酸序列相连的目的核苷酸序列，可以，例如，编码核糖体RNA、反义RNA或者不被翻译成蛋白质的任何其它类型的RNA。在本发明的另一优选的实施方案中，所述目的核苷酸序列被翻译成蛋白质产物。转录调节的核苷酸序列和/或与其相连的目的核苷酸序列对于将转化的植物来说，可以是同源或异源起源的。用于引入植物细胞内的重组DNA分子包括从任何来源中获得或分离的DNA分子，可随后对其结构、大小和/或功能进行表征，用化学方法改变，以及稍后引入到植物内。从来源“衍生”的目的核苷酸序列或片段的实例，是在给定的生物体内被鉴定为有用的片段的核苷酸序列或片段，并且随后以基本上纯的形式对其进行化学合成。从来源中“分离”的这类目的核苷酸序列或片段的实例，是通过化学手段，例如，通过使用限制性内切酶从所述来源中切除或除去的核苷酸序列或片段，从而可以通过基因工程的方法对其进一步操作(例如扩增)用于本发明。通常将这类核苷酸序列或片段称作“重组体”。

因此，有用的核苷酸序列、目的部分或片段包括完全合成的DNA、半合成的DNA、从生物来源中分离的DNA以及从引入的RNA衍生的DNA。通常，引入的DNA并非原始存在于作为DNA受体的植物基因型中，但是从给定的植物基因型中分离基因，以及随后将基因的多拷贝引入到相同的基因型，例如以提高给定基因产物的产量(如，贮存蛋白或者赋予对水缺乏的耐受性或抗性的蛋白质)，在本发明的范围之内。

所引入的重组DNA分子包括，但不限于，来自植物基因的DNA，以及来自非植物基因，如细菌、酵母、动物或病毒的那些基因的DNA。所引入的DNA包括修饰的基因、基因的部分，或者嵌合基因，包括来自相同或不同基因型的基因。将术语“嵌合基因”或“嵌合DNA”定义为包含至少两个DNA序列或片段的基因或DNA序列或片段，所述DNA序列或片段来自在自然条件下不组合DNA的物种，或者该DNA序列或片段在未转化植物的天然基因组中以通常不存在的方式安置或相连。

这里用于转化的引入的重组DNA分子可以是环状或线形的，双链或单链的。通常，DNA是嵌合DNA的形式，如质粒DNA，其也可含有两侧是调节序列的编码区，所述调节序列在所产生的植物中促进重组DNA的表达。通常，引入的重组DNA分子相对较小，即，小于约30kb以使对物理、化学或酶促降解的任何易感性降到最小，已知所述易感性随核苷酸分子大小的增加而增大。如上所述，优选预先选择和限定引入植物基因组的蛋白质、RNA转录物或其混合物的数量，例如，可形成所引入DNA的1到约5-10个这样的产物。

已知控制表达的两个主要方法，即：过量表达和表达不足。可通过插入所选基因的一个或多个额外拷贝达到过量表达。然而，对于用核苷酸序列的一个或多个额外拷贝原始转化的植物或它们的子代，以呈现表达不足和过量表达的效果并非未知。对于表达不足，有两个主要方法，其通常在本领域技术中被称作“反义下调”和“有义下调”(有义下调也被称作“共抑制”)。通常，将这些方法称作“基因沉默”。这两个方法都导致靶基因表达的抑制。

在适当的植物组织中获得充足的转基因表达水平是基因工程作物生产中的重要方面。植物宿主中异源DNA序列的表达取决于在植物宿主内功能性启动子的有效连接的存在。启动子序列的选择将决定在生物体内何时间以及何处表达异源DNA序列。

发明人特别期望诱变启动子以有可能提高用于在植物中表达转基因的元件的效用。可随机进行这些元件的诱变并且在尝试法(trial-by-errorprocedure)中筛选诱变的启动子序列的活性。可选择地，可以鉴定向启动子提供期望表达特性或者表达增强活性的特殊序列，并且通过突变，将这些序列或相似序列引入序列中。还可期望诱变这些序列，以增强转基因在特定物种中的表达。

诱变编码本发明的启动子序列的DNA片段的方法是本领域技术人员公知的。如所指出的，可通过随机的，或者位点特异性诱变方法对启动子或其它调节元件进行修饰。可通过从编码相应未修饰序列的序列添加或缺失一个或多个核苷酸改变其结构来修饰启动子或其它调节元件。

可根据本领域中已知的任何技术进行诱变，例如，但不限于，合成在特定调节区的序列内具有一个或多个突变的寡核苷酸。特别地，位点特异性诱变是通过基础DNA的特异性诱变来制备启动子突变体的有用技术。该技术进一步提供易于制备和检验序列变体的能力，例如，通过将一个或多个核苷酸序列改变引入DNA中，掺入前面考虑的一个或几个。位点特异性诱变通过使用编码期望突变的DNA序列的特异性寡核苷酸序列以及足够数量的相邻核苷酸，来提供足够大小和足够序列复杂性的引物序列以便在横断缺失接点的两侧形成稳定的双链体，从而能够产生突变体。一般而言，优选引物长约17-约75个核苷酸或者更长，被改变的序列的接点两侧上具有约10-约25个或者更多的残基。

通常，位点特异性诱变技术是本领域技术中公知的，如多个公开的举例说明。应该了解，该技术通常使用同时以单链和双链形式存在的噬菌体载体。在定点诱变中有用的典型载体包括如M13噬菌体的载体。这些噬菌体易于通过商业途径获得并且其使用通常是本领域技术人员公知的。在定点诱变中也常使用双链质粒，其排除了将目的基因从质粒转移到噬菌体的步骤。

通常，通过首先获得单链载体或者双链载体的两条链的解链进行定点诱变，在其序列内包括编码启动子的DNA序列。通常通过合成制备具有期望突变序列的寡核苷酸引物。接着，为了完成带有突变的链的合成，将该引物与单链载体退火，并且用DNA聚合酶如大肠杆菌聚合酶I Klenow片段处理。因而形成异源双链体，其中一条链编码最初的未突变的序列，第二条链带有期望的突变。然后用该异源双链体载体转化或转染适当的细胞，如大肠杆菌细胞，以及选择包含具有突变序列排列的重组载体的细胞。然后可从这些细胞中分离载体DNA并用于植物转化。基因选择方案由Kunkel等(1987)设计以富集掺入诱变寡核苷酸的克隆。可选择地，使用具有热稳定性的可商购的酶，如Taq聚合酶的PCR可将诱变的寡核苷酸引物掺入扩增的DNA片段，然后将扩增的DNA片段克隆到适当的克隆或表达载体内。Tomic等(1990)和Upender等(1995)的PCR介导的诱变操作提供这种方案的两个实例。除了热稳定的聚合酶外，还使用热稳定的连接酶的PCR还可用于将磷酸化的诱变寡核苷酸整合到扩增的DNA片段内，然后可将扩增的DNA片段克隆到适当的克隆或表达载体内。由Michael(1994)所描述的诱变操作提供这种方案的一个实例。

提供使用定点诱变制备所选编码启动子的DNA片段的序列变体作为生成潜在有用物种的手段，其并非意在限制，因为有可从中获得DNA序列的序列变体的其它方式。例如，可用诱变剂，如羟胺，处理编码期望启动子序列的重组载体以获得序列变体。

如这里所使用的，术语“寡核苷酸定点诱变操作”指模板依赖的方法和载体介导的繁殖，其导致特异性核酸分子相对于其起始浓度的浓度增加，或者检测信号的浓度增加，如放大。如这里所使用的，术语“寡核苷酸定点诱变法”也旨在指包括引物分子的模板依赖的延伸的方法。术语模板依赖的方法指RNA或DNA分子的核酸合成，其中通过互补碱基配对的公知规则(见，例如，Watson和Rarnstad，1987)规定核酸新合成链的序列。通常，载体介导的方法包括将核酸片段引入DNA或RNA内、载体的克隆扩增以及扩增的核酸片段的回收。由美国专利No.4,237,224提供这类方法的实例。可利用许多依赖模板的方法来扩增样品中存在的目的靶序列，这种方法是本领域公知的并且这里在下面被具体的公开。

如果克隆中包含根据本发明的分离的启动子，可以希望划定基本启动子区在克隆内的界限。制备诱变处理的启动子的一个有效的靶向手段依赖于启动子序列内推定的调节元件的鉴定。这可通过与以类似的组织特异性或发育独特性的方式表达的已知的启动子序列比较开始。具有相似表达模式的启动子之间共有的序列可能是转录因子结合的候选物，因此可能是赋予表达模式的元件。可通过每个推定的调节区的缺失分析，随后通过测定与每个构建体功能性连接的报道基因，进行每个缺失构建体的功能分析，从而完成对这些推定的调节元件的确定。同样地，一旦提供起始启动子序列，那么可很容易地制备起始启动子的多个不同缺失突变体中的任何一个。

也可通过除去或缺失非必需序列，而不缺失必需序列，获得本发明的转录调节核苷酸序列的功能性等同片段。可在体外通过尝试法缺失突变，或者在计算机芯片上使用启动子元件搜索程序实现将转录调节核苷酸序列限于基本的转录介导元件。启动子活性必需的区域常常证明是某些已知启动子元件簇。可使用可利用的计算机算法，如PLACE(“植物顺式作用调节的DNA元件”；Higo1999)、BIOBASE数据库“Transfac”(BiologischeDatenbanken GmbH，Braunschweig；Wingender2001)或者数据库PlantCARE(Lescot2002)进行这种分析。

优选地，一个本发明转录调节序列的功能等同片段包括由SEQ ID NO：1、2、3、4、5、6、7、8、9、10或11所述转录调节核苷酸序列的至少100个碱基对，优选至少200个碱基对，更优选至少500个碱基对。更优选该片段从所示序列的3’末端开始。

尤其优选地是转录调节序列的等同片段，其可通过缺失编码mRNA的5’非翻译区的区域获得，因此仅提供(非转录的)启动子区。可很容易地通过本领域的已知方法(如5’-RACE分析)确定5’非翻译区。因此，一些本发明的转录调节序列是其它序列的等同片段(见下面的表2)。

表2：本发明的转录调节的核苷酸序列之间的关系

转录调节序列	等同序列	等同片段
			SEQIDNO：1(1683bp)	SEQ ID NO：5(1696bp)	SEQ ID NO：2(1619bp)SEQ ID NO：3(985bp)SEQ ID NO：4(921bp)SEQ ID NO：6(1632bp)SEQ ID NO：7(989bp)SEQ ID NO：8(925bp)
SEQ ID NO：9(1727bp)		SEQ ID NO：10(933bp)SEQ ID NO：11(458bp)

如上所示，也可随机制备本发明的缺失突变体、本发明启动子的缺失突变体，然后进行分析。用这个策略，制备一系列构建体，每个含有克隆的不同部分(亚克隆)，然后筛选这些构建体的活性。筛选活性的适当的方法是将含有缺失片段的缺失的启动子或内含子构建体连于可选择的或可筛选的标记，并且仅分离表达标记基因的那些细胞。用这一方式鉴定了许多不同的，缺失的启动子构建体，其仍然保留期望的，或者甚至增强的活性。因此可以通过比较所选的构建体鉴定活性必需的最小片段。然后可将该片段用于构建表达外源基因的载体。

可以，例如通过使用Genomatix软件MatInspector Releaseprofessional7.3(August2004)完成启动子基序分析(详见实施例8)。相应的本发明的另一实施方案包含在表达盒中的转录调节序列包含选自以下组成组的序列区的至少一个(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后)

a)包含至少两个，优选三或四个，更优选五个或六个，最优选全部以下基序的区(长度为50至1500bp，优选60至1000bp)：

i)TACT(SEQ ID NO：53)，优选anTACTctt(SEQ ID NO：77)，更优选agTACTctttga(SEQ ID NO：101)，

ii)AGAA(SEQ ID NO：54)，优选gannnnacnAGAA(SEQ ID NO：78)，更优选agaggagacaAGAAa(SEQ ID NO：102)，

iii)AAAG(SEQ ID NO：55)，优选gannntgcAAAGnnna(SEQ ID NO：79)，更优选gaagttgcAAAGttgag(SEQ ID NO：103)，

iv)CCAT(SEQ ID NO：56)，优选CCATtccttgtagta(SEQ ID NO：80)，更优选CCATtccttgtagtact(SEQ ID NO：104)，

v)TAAA(SEQ ID NO：57)，优选TAAAnaatc(SEQ ID NO：81)，更优选TAAAtaatctat(SEQ ID NO：105)，

vi)CTAT(SEQ ID NO：58)，优选ccattgCTATcctngntagaaacta(SEQ IDNO：82)，更优选tccattgCTATccttgttagaaactaa(SEQ ID NO：106)，

vii)ACGT(SEQ ID NO：59)，优选tnnnACGTa(SEQ ID NO：83)，更优选ttttacACGTacc(SEQ ID NO：107)，

其中所述基序优选按照上述编号以5’-3’方向(即，编号ii)在编号i)的下游)，

b)包含至少两个，优选三或四个，更优选五个或六个，最优选全部以下基序的区(长度为50至1000bp，优选60至500bp)：

i)AAAA(SEQ ID NO：60)，优选annnnaAAAAtgtta(SEQ ID NO：84)，更优选acaaaacaAAAAtgttaatat(SEQ ID NO：108)，

ii)GTTA(SEQ ID NO：61)，优选annanGTTA(SEQ ID NO：85)，更优选acaaaaatGTTAata(SEQ ID NO：109)，

iii)TTAA(SEQ ID NO：62)，优选TTAAna(SEQ ID NO：86)，更优选aaaaatgTTAAtatttt(SEQ ID NO：110)，

iv)ACAT(SEQ ID NO：63)，优选gaaannannnACAT(SEQ ID NO：87)，更优选atatgaaaatattaACATttt(SEQ ID NO：111)，

v)TnCC(SEQ ID NO：64)，优选TnCCnnannngt(SEQ ID NO：88)，更优选aatTTCCatatttgtaggaaa(SEQ ID NO：112)，

c)包含至少两个，优选三或四个，更优选五个或六个，最优选全部以下基序的区(长度为50至1500bp，优选60至1000bp)：

i)CATG(SEQ ID NO：65)，优选CATGca(SEQ ID NO：89)，更优选cccaagtaCATGcaaaatttaacggtt(SEQ ID NO：113)，

ii)TTAT(SEQ ID NO：66)，优选TTATtataagtaaat(SEQ ID NO：90)，更优选TTATtataagtaaattg(SEQ ID NO：114)，

iii)TTTT(SEQ ID NO：67)，优选TTTTt(SEQ ID NO：91)，更优选atTTTTtatta(SEQ ID NO：115)，

iv)ACGT(SEQ ID NO：68)，优选gtggnngnnnACGT(SEQ ID NO：92)，更优选aaatgtggtagcgtACGTgtg(SEQ ID NO：116)，

v)AGAA(SEQ ID NO：69)，优选ggnnnntcnAGAA(SEQ ID NO：93)，更优选tggcggctccAGAAt(SEQ ID NO：117)，

vi)ACGT(SEQ ID NO：70)，优选cgtACGTggc(SEQ ID NO：94)，更优选cttgcgtACGTggcggc(SEQ ID NO：118)，

vii)ACGT(SEQ ID NO：71)，优选ACGTggc(SEQ ID NO：95)，更优选tgaagagaACGTggccctgag(SEQ ID NO：119)，

viii)ACGT(SEQ ID NO：72)，优选gnnnACGTg(SEQ ID NO：96)，更优选tgcatgaagagaACGTggccctgagtc(SEQ ID NO：120)，

ix)CATG(SEQ ID NO：73)，优选CATGca(SEQ ID NO：97)，更优选gttctcttCATGcaaggatagtagaac(SEQ ID NO：121)，

x)ACCC(SEQ ID NO：74)，优选cACCCanc(SEQ ID NO：98)，更优选actccACCCacctcc(SEQ ID NO：122)，

xi)CCAT(SEQ ID NO：75)，优选cannCCATc(SEQ ID NO：99)，更优选ctttcccatcCCATcca(SEQ ID NO：123)，

xii)TTTT(SEQ ID NO：76)，优选TTTTt(SEQ ID NO：100)，更优选caTTTTtatca(SEQ ID NO：124)，

其中所述基序优选按照上述编号以5’-3’方向(即，编号ii)在编号i)的下游)。

如以上使用术语“基序”意指并不需要指定序列的全部核苷酸存在来限定基序的存在。完全基序矩阵(例如，atagattaTTTAgaa)的单个核苷酸具有不同相关性。基序包含保守区(例如，attaTTTA)，其由核心区(例如，TTA粗体大写字母)和其次保守的部分(例如，att，粗体小写字母)组成。上述基序可以在不同区以一个或多个拷贝存在(实例见实施例8)。

更具体而言，在表达盒中包含的转录调节序列包含至少一个选自以下组成的组的序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后)：

a)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：53、54、55、56、57、58或59所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：54在SEQ ID NO：53的下游)，

b)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1000bp，优选60至500bp)，该启动子基序如SEQ ID NO：60、61、62、63或64所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：61在SEQ ID NO：60的下游)，

c)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：65、66、67、68、69、70、71、72、73、74、75或76所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ IDNO：71在SEQ ID NO:70的下游)。

优选的，表达盒中包含的转录调节序列包含至少一个序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后))选自以下组成的组：

a)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：77、78、79、80、81、82或83所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：78在SEQ ID NO：77的下游)，

b)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1000bp，优选60至500bp)，该启动子基序如SEQ ID NO：84、85、86、87或88所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：85在SEQ ID NO：84的下游)，

c)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：89、90、91、92、93、94、95、96、97、98、99或100所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ IDNO：71在SEQ ID NO：70的下游)。

更优选的，表达盒中包含的转录调节序列包含至少一个序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后))选自以下组成的组：

a)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：101、102、103、104、105、106或107所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：78在SEQ IDNO：77的下游)，

b)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1000bp，优选60至500bp)，该启动子基序如SEQ ID NO：108、109、110、111或112所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：85在SEQ ID NO：84的下游)，

c)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：113、114、115、116、117、118、119、120、121、122、123或124所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ ID NO：115在SEQ ID NO：114的下游)。

本文公开的启动子的基本基序还可以用于通过标准克隆技术将所述基序融合在一起构建合成的启动子。

因此，本发明的另一实施方案涉及合成的转录调节序列，其包含至少一个序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后))选自以下组成的组：

c)包含至少两个，优选三或四个，更优选五个或六个，最优选全部启动子基序的区(长度为50至1500bp，优选60至1000bp)，该启动子基序如SEQ ID NO：65、66、67、68、69、70、71、72、73、74、75或76所述，其中所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQ IDNO：71在SEQ ID NO：70的下游)。

优选的，该合成的转录调节序列中包含的转录调节序列包含至少一个序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后))选自以下组成的组：

更优选的，该合成的转录调节序列中包含的转录调节序列包含至少一个序列区(优选2个区，更优选全部3个区；其中优选b)区在a)区之后，且如果有c)区，在a)和/或b)区之后))选自以下组成的组：

本发明的另一实施方案涉及提供合成的转录调节核苷酸序列的方法，所述序列表征为分离的启动子基序或启动子基序的簇被组合(例如，通过如连接或重组的标准克隆技术)，所述基序包含由SEQ IDNO：53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或76的任一所述基序的至少5个，优选至少8个，更优选至少10个，最优选至少15个或其全部。

优选的，提供合成的转录调节核苷酸序列的方法其表征为分离的启动子基序或启动子基序的簇被组合(例如，通过如连接或重组的标准克隆技术)，所述基序包含由SEQ ID NO：77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100的任一所述基序的至少5个，优选至少8个，更优选至少10个，最优选至少15个或其全部。

更加优选的，提供合成的转录调节核苷酸序列的方法其表征为分离的启动子基序或启动子基序的簇被组合(例如，通过如连接或重组的标准克隆技术)，所述基序包含由SEQ ID NO：101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123或124的任一所述基序的至少5个，优选至少8个，更优选至少10个所述基序优选根据其SEQ ID编号以5’-3’方向排列(即，SEQID NO：71在SEQ ID NO：70的下游)。，最优选至少15个或其全部。

优选的，所述基序按照其SEQ ID编号以5’-3’方向排列(即，SEQ IDNO：115在SEQ ID NO：114的下游)。

本发明的表达盒可以包含更多的调节元件。在本文中该术语应该广义的理解为包含可以影响表达盒的构建或功能的全部序列。调节元件可以例如在原核生物或真核生物中修饰转录和/或翻译。在优选的实施方案中，本发明的表达盒包含要表达核酸序列的下游(在3’方向)的转录终止序列和-任选的额外的调节元件-各自有效的连接于要表达的核酸序列(或转录调节核苷酸序列)。

额外的转录元件可以包含额外的启动子、最小启动子或可以修饰表达调节特性的启动子元件。例如，可以使该表达依赖于某些胁迫因素，例如水胁迫、脱落素(Lam1991)或热胁迫(Schoffl1989)。此外，可以使用在其它生物(例如大肠杆菌或农杆菌)中实现表达的额外的启动子或启动子元件。这类调节元件可以在细菌的启动子序列(例如amy和SPO2)或在酵母或真菌启动子的启动子序列(例如ADC1、MFa、AC、P-60、CYC1、GAPDH、TEF、rp28、和ADH)中找到。

此外，认为来自一种以上启动子的元件组合的启动子可能是有用的。例如，US5,491,288公开了花椰菜花叶病毒启动子与组蛋白启动子的组合。因此，来自本文公开的启动子的元件可以与来自其它启动子的元件组合。用于植物转基因表达的启动子包括可诱导的、病毒的、合成的、组成型(Odell1985)、时间调节的、空间调节的、组织特异性的和时空调节的那些启动子。

期望在特异的组织或器官中表达可以使用组织特异性启动子。相反，当期望基因表达应答刺激时，可以选择的调节元件为可诱导型启动子。期望在植物全部细胞中连续表达可使用组成型启动子。在转化载体的表达构建体中可以包括核心启动子序列上游和/或下游的额外的调节序列，以在转基因植物中改变异源核苷酸序列表达的水平。

多种5’和3’转录调节序列可以用于本发明。转录终止子负责转录的终止和正确的mRNA多聚腺苷化。3’非翻译调节DNA序列优选包括从约50至约1000，更优选约100至约1000核苷酸碱基对，并且含有植物转录和翻译终止序列。合适的转录终止子和已知在植物中起作用的那些包括CaMV35S终止子、tml终止子、胭脂碱合酶终止子、豌豆rbcS E9终止子、来自根瘤农杆菌章鱼碱合酶基因的T7转录的终止子和来自马铃薯或番茄的蛋白酶抑制剂I或II基因的3’末端，然而，也可以使用本领域技术人员已知的其它3’元件。可选择的，还可以使用γ薏苡醇溶蛋白(coixin)、油质蛋白3或来自薏苡属的其它终止子。

优选的3’元件包括来自根瘤农杆菌胭脂碱合酶基因的那些(Bevan1983)、来自根瘤农杆菌章鱼碱合酶基因的T7转录的终止子，和来自马铃薯或番茄的蛋白酶抑制剂I或II基因的3’末端。

由于在转录起始位点和编码序列的起始之间的DNA序列(即，未翻译的前导序列)可以影响基因表达，也可以期望使用特定的前导序列。优选的前导序列被设计包括预测指导相连基因的最佳表达的那些(包括序列在内)，即，包括优选的共有前导序列，其可以增加或维持mRNA稳定性和防止不正确的翻译起始。在本公开的教导下这类序列的选择对本领域技术人员是已知的。最优选的是从在植物中高表达的基因衍生的序列。

优选的调节元件还包括基因的5’非翻译区、内含子和3’非翻译区。已发现的在转基因植物中增加基因表达的这类序列包括内含子序列(例如，来自Adh1、bronze1、actin1、actin2(WO00/760067)，或蔗糖合酶内含子，见：The Maize Handbook，116章，Freeling和Walbot，编辑，Springer，New York(1994))和病毒前导序列(例如，来自TMV、MCMV和AMV；Gallie1987)。例如，已知从病毒衍生的大量非翻译的前导序列增加表达。具体而言，已显示来自烟草花叶病毒(TMV)、玉米褪绿斑驳病毒(MCMV)、和苜蓿花叶病毒(AMV)的前导序列有效增加表达(例如，Gallie1987；Skuzeski1990)。本领域已知的其它前导包括但不限于：小RNA病毒前导序列，例如，EMCV前导(脑心肌炎5’非编码区)(Elroy-Stein1989)；马铃薯Y病毒前导，例如TEV前导(烟草蚀斑病毒)；MDMV前导(玉米矮缩花叶病毒)；人免疫球蛋白重链结合蛋白(BiP)前导，(Macejak1991)；来自苜蓿花叶病毒包被蛋白质mRNA(AMV RNA4)的非翻译前导，(Jobling1987)；烟草花叶病毒前导(TMV)，(Gallie1989)；和玉米褪绿斑驳病毒前导(MCMV)(Lommel1991，又见Della-Cioppa1987)。需要之处还可以包括调节元件例如Adh内含子1(Callis1987)、蔗糖合酶内含子(Vasil1989)或TMVΩ元件(Gallie1989)。特别优选选自以下的5’非翻译区、内含子和3’非翻译区

a)由GenBank拟南芥基因组基因座At1g48130所述基因，和

b)由GenBank拟南芥基因组基因座At1g48130所述基因的直向同源基因。

最优选的是包含在如SEQ ID NO：1、3、5、7、9、10或11所述序列中的5’非翻译序列(见序列表的位置说明)。

额外优选的调节元件是增强子序列或多聚腺苷化作用序列。

要表达的异源核苷酸序列优选还有效连接于3’非翻译区，转录终止和/或多聚腺苷化作用信号。3’非翻译区适于稳定mRNA表达和结构。这可以延长mRNA的存在并且因此增加表达水平。终止和多聚腺苷化作用信号适于稳定mRNA表达、保证稳定的mRNA转录物长度和阻止通读转录。这尤其是多基因表达构建体中的重要特征。此外，转录的正确终止与从调节性5’核苷酸序列的转录的重新起始有关，引起增加的表达水平。上述信号可以是在植物中有功能的任何信号，并且可以，例如，从植物基因、植物病毒基因或其它植物病原体中被分离。然而，在优选的实施方案中，3’非翻译区、转录终止和多聚腺苷化作用信号是来自用作本发明的启动子来源的基因。甚至更优选下列序列：

SEQ ID NO：125代表拟南芥过氧化物氧还蛋白(PER1)基因(At1g48130)的编码区(CDS)之后876个核苷酸序列，包含3′-UTR作为转录终止序列

SEQ ID NO：126代表拟南芥过氧化物氧还蛋白(PER1)基因(At1g48130)的编码区(CDS)之后400个核苷酸序列，包含3′-UTR作为转录终止序列(SEQ ID NO：126是SEQ ID NO：125的截短的衍生物)

SEQ ID NO：127代表过氧化物氧还蛋白(PER1)基因(At1g48130)的3’非翻译区的227个核苷酸序列。

因此，在优选的实施方案中，本发明的表达盒还包含与要表达的核苷酸序列功能性连接的至少一条序列，其选自以下组成的组：

a)由SEQ ID NO：125、126和127所述序列，和

b)包含由SEQ ID NO：125、126或127所述序列的至少25个(优选至少50或75或100个，更优选至少150或200个，最优选250或300个)连续的核苷酸的片段的序列，

c)与由SEQ ID NO：125、126或127所述序列具有至少50％(优选至少60％、70％或80％，更优选至少90％或95％，最优选至少98％)的同一性的序列，

d)能够与包含由SEQ ID NO：125、126或127所述序列的连续核苷酸的核酸或其互补链杂交的序列(优选在条件等同于在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用2×SSC、0.1％SDS于50℃洗脱；更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mMEDTA中于50℃杂交，用1×SSC、0.1％SDS于50℃洗脱；还更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.5×SSC、0.1％SDS于50℃洗脱；优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于50℃洗脱；更优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于65℃洗脱)，

其中所述序列能够介导RNA稳定性，RNA表达、RNA转录终止和/或RNA多聚腺苷化作用的稳定性。

该序列本身适于且用于在植物中的转基因表达。相应的，本发明的另一实施方案涉及的表达盒包含

i)至少一个转录调节核苷酸序列，所述转录调节核苷酸序列能够介导植物中的转录并且与其功能性连接，

ii)至少一个核酸序列，并且与其功能的连接

iii)选自以下组成的组的至少一个序列：

a)由SEQ ID NO：125、126和127所述序列，和

d)能够与由SEQ ID NO：125、126或127所述序列的50至200个或更多(优选全部)连续的核苷酸或其互补链杂交的序列(优选在条件等同于在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用2×SSC、0.1％SDS于50℃洗脱；更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用1×SSC、0.1％SDS于50℃洗脱；还更适宜在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.5×SSC、0.1％SDS于50℃洗脱；优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于50℃洗脱；更优选在7％十二烷基磺酸钠(SDS)、0.5MNaPO₄、1mM EDTA中于50℃杂交，用0.1×SSC、0.1％SDS于65℃洗脱)，

其中所述序列iii)能够介导RNA稳定性，RNA表达、RNA转录终止和/或RNA多聚腺苷化作用的稳定性；

其中所述转录调节序列i)，或所述序列iii)，或i)和iii)两者同时相对于所述核苷酸序列ii)异源。

其它优选的多聚腺苷化作用序列是来自植物基因或农杆菌T-DNA基因的那些(例如，OCS(章鱼碱合酶)或NOS(胭脂碱合酶)基因的终止子序列)。

增强子的实例包括来自CaMV35S启动子、章鱼碱合酶基因(Ellis等人，1987)、稻肌动蛋白I基因、玉米醇脱氢酶(Callis1987)、玉米皱缩I基因(Vasil1989)、TMVΩ元件(Gallie1989)的元件和来自非植物真核细胞的启动子(例如，酵母；Ma1988)。根据本发明可以构建使用的载体以包括ocs增强子元件。这一元件最初被鉴定为来自ultilane的章鱼碱合酶(ocs)基因16bp回文序列增强子，且存在于至少10个其它的启动子中(Bouchez1989)。当用于这里的植物转化时，使用增强子元件，例如ocs元件且特别是该元件的多个拷贝将增加来自相邻启动子的转录水平。

本发明的表达盒(或由其衍生的载体)可以包含额外的功能元件，其被广义理解为全部元件，其影响表达盒或载体或包含它们的转基因生物的构建、增殖或功能。这类功能元件可以包括复制的起始点(以允许在细菌中复制；pBR322或P15A的复制起始点；Sambrook1989)，或农杆菌T-DNA转移所需元件(例如，T-DNA的左和/或右边界)。

最后，用于引入(例如双子叶基因组)的最佳DNA区段可以是同源基因或基因族，其编码期望的性状(例如，每英亩增加的产量)，并且其在新的启动子或增强子等，或可能甚至是同源或组织特异性(例如，根-、珠托/叶鞘-、轮-、茎、earshank-、种子-或叶-特异性)启动子或控制元件的控制下被引入。实际上，可以预期本发明的特定用途是以种子偏好性或种子特异性方式的基因表达。

此外，可以构建载体并用于在转基因植物细胞内的特定基因产物的细胞内靶向或用于指导蛋白质至细胞外环境。这通常通过将编码转运或信号肽序列的DNA序列与特定基因的编码序列结合而获得。产生的转运或信号肽分别将蛋白质转运至特定的细胞内或细胞外目的地，并且接着被以翻译后地方式除去。转运或信号肽通过促进蛋白质通过胞内膜，例如，液泡、小泡、质体和线粒体膜起作用，而信号肽指导蛋白质通过胞外膜。

这类使用的特定实例涉及指导除草剂抗性基因，例如EPSPS基因到特定细胞器，例如叶绿体而非到细胞质。这可以通过使用赋予蛋白质的质体特异性靶向的rbcs转运肽示例说明。此外，推测可期望将某些负责雄性不育的基因靶向至线粒体，或将某些致植物病生物的抗性基因靶向至细胞外空间，或将蛋白质靶向至液泡。

通过促进蛋白质进入细胞内和细胞外区室的转运，这些序列可以增加基因产物的积累，保护它们不被蛋白水解降解。这些序列还使允许来自高表达基因的额外的mRNA序列附着于基因的编码序列。由于核糖体翻译的mRNA比裸mRNA更加稳定，在基因之前可翻译的mRNA的存在可以增加来自基因的mRNA转录物的整体稳定性，并且由此增加基因产物的合成。由于转运和信号序列通常在翻译后从初始翻译产物中被除去，这些序列的使用允许在最终多肽上不出现的额外翻译的序列的添加。可以期望某些蛋白质的靶向以增加该蛋白质的稳定性(US5,545,818)。

将DNA本身靶向在细胞内可以是有用的。例如，将引入的DNA靶向至核由于可以增加转化的频率而可能是有用的。在核内，靶向基因可能是有用的，以获得位点特异性整合。例如，其可用于将通过转化引入的基因代替细胞中存在的基因。其它元件包括那些可以被内源或外源试剂，例如锌指蛋白质，包括天然存在的锌指蛋白或嵌合的锌指蛋白(见，例如US

5,789,538，WO99/48909；WO99/45132；WO98/53060；WO98/53057；WO98/53058；WO00/23464；WO95/19431和WO98/54311)，或myb类转录因子调节的那些。例如，嵌合的锌指蛋白可以包括与特异性DNA序列(锌指)结合的氨基酸序列，和激活(例如，GAL4序列)或抑制连接于特异性DNA序列的序列转录的氨基酸序列。

本发明的目标之一是提供重组的DNA分子，其包含有效连接于目的核苷酸片段的根据本发明的核苷酸序列。

目的核苷酸片段是商业市场和涉及作物发育兴趣的反映。作为和市场兴趣改变，并且随着国家发展中市场开放的国际化，也将出现新的作物和技术。此外，随着对农业性状和特征(例如产量和杂种优势)的理解增加，对用于转化的基因的选自将相应改变。目的核苷酸的常用类包括，例如，涉及转化的基因，例如锌指蛋白；涉及免疫的基因，例如激酶；和涉及看家基因，例如热休克蛋白。更具体的转基因的类别包括，例如，编码农业、昆虫抗性、疾病抗性、除草剂抗性、不育、谷物特征和商业产品的基因。目的基因通常包括涉及淀粉、油、碳水化合物或营养代谢的那些，以及影响种子大小、糖载量、锌指蛋白，见，例如US5,789,538，WO99/48909；WO99/45132；WO98/53060；WO98/53057；WO98/53058；WO00/23464；WO95/19431和WO98/54311等那些。

本领域技术人员认识到在株系之间植物中转基因的表达水平和调节可以变化显著。因此，人们必需测试几种株系以找到具有期望的表达水平和调节的株系。一旦株系被鉴定具有嵌合的Cre转基因的期望的调节特异性，可以将其与带有不同的无活性复制子或无活性转基因的株系杂交来激活。

可以连接到目的基因(其编码多肽)的其它序列是在植物细胞内可以靶向特异性细胞器，例如，至线粒体、核或质体的那些序列。可以通过向多肽提供合适的靶向肽序列，例如分泌信号肽(用于分泌或细胞壁或膜靶向的)、质体转运肽、叶绿体转运肽，例如叶绿素a/b结合蛋白、线粒体靶向肽、液泡靶向肽、或核靶向肽等等实现靶向性。例如，可以使用核酮糖二磷酸羧化酶转运肽、EPSPS转运肽或二氢吡啶二羧酸合酶转运肽作为例如质体细胞器靶向序列(见WO00/12732)。质体是衍生自前质体的一类植物细胞器，并且包括叶绿体、白色体、造粉体、和色质体。质体是植物中生物合成的主要位置。除了在叶绿体中的光合作用，质体也是脂类生物合成、硝酸盐还原成铵以及淀粉贮存的位置。而且尽管质体含有其自己的环状基因组，位于质体上的大部分蛋白质是由核基因组编码并且被从细胞质运输至细胞器。

本发明使用的转基因通常是指导特定蛋白质或多肽产物表达的基因，但是其也可以是不能表达的DNA区段，例如，转座子，例如Ds，其不指导自身的转座。如本文所用，“可表达的基因”能够被转录为RNA(例如，mRNA、反义RNA等)，或翻译为蛋白质、作为目的性状被表达等等，且不限于可选择的、可筛选的或不可选择的标记基因。本发明还考虑到，当将可表达的基因(其无需是标记基因)与标记基因组合使用时，可以使用在相同或不同的DNA区段上的分开的基因进行转化。在后者的情况下，将不同的载体同时传递至受体细胞以使共转化最大化。

要被传递至受体细胞的特定DNA区段的选择通常由转化的目的决定。作物植物转化的主要目的之一是向植物添加一些商业可期望的、农业上的重要性状。这类性状包括但不限于除草剂抗性或耐受性、昆虫抗性或耐受性、疾病抗性或耐受性(病毒、细菌、真菌、线虫)、胁迫耐受性和/或抗性(如对干旱、热、寒冷、冰冻、过度潮湿、盐胁迫的抗性或耐受性的示例说明)、氧化应激、增加的产量、食物含量和组成、物理外观、雄性不育、脱水、稳定性、繁殖能力、淀粉性质、油量和品质等。可以期望掺入赋予任何这类期望性状的一个或多个基因，例如，编码病原体抗性的基因。

在某些实施方案中，本发明考虑到使用超过一种有利的转基因对受体细胞的转化。使用不同的转基因编码载体或使用掺入两个或多个基因编码序列的单个载体可以在单独的转化事件中提供两个或多个转基因。例如，以同向、反向或共线性方向带有bar和aroA表达单元的质粒被认为是特别有用的。更优选的组合是昆虫抗性基因(例如Bt基因)与蛋白酶抑制剂基因(例如pinII的组合)，或使用bar与任意上述基因的组合。当然，可以按照期望的使用任何描述的任何两个或多个转基因，例如赋予除草剂、昆虫、疾病(病毒、细菌、真菌、线虫)或干旱抗性、雄性不育、脱水、稳定性、繁殖能力、淀粉性质、油量和品质的的那些或那些增加产量或营养的那些。

1.代表性转基因

1.1.除草剂抗性

编码膦丝菌素酰基转移酶的基因(bar和pat)、耐受草甘膦的EPSP合酶基因、编码草甘膦氧化还原酶的草甘膦降解酶基因gox、deh(编码失活茅草枯的脱卤素酶)、除草剂抗性(例如，磺酰脲和咪唑啉酮)乙酸乳酸合酶、和bxn基因(编码降解Bromoxynil的腈水解酶)是用于转化的除草剂抗性基因的良好的实例。Bar和pat基因编码膦丝菌素酰基转移酶(PAT)，其失活除草剂膦丝菌素并且阻止这一化合物抑制谷氨酸合酶。5-烯醇式丙酮基莽草酸-3-磷酸合酶(EPSP合酶)通常受到除草剂N-(膦酰基甲基)甘氨酸(草甘膦)的抑制。然而，已知编码草甘膦抗性EPSP合酶的基因。Deh基因编码茅草枯的脱卤素酶并且赋予对除草剂茅草枯的抗性。Bxn基因编码特异性腈水解酶，其将Bromoxynil转变为非除草剂的降解产物。

1.2昆虫抗性

本发明的重要方面涉及将赋予昆虫抗性的基因引入植物。可以被引入的潜在的昆虫抗性基因包括苏云金杆菌晶体毒素基因或Bt基因(Watrud1985)。Bt基因可以对鳞翅目或鞘翅目害虫，例如欧洲玉米螟(ECB)和玉米根虫(CRW)提供抗性。在这类实施方案中优选使用的Bt毒素基因包括CryIA(b)和CryIA(c)基因。来自苏云金杆菌的其它物种的内毒素基因(其影响昆虫生长或发育)也可以用于这一方面。蛋白酶抑制剂也可以提供昆虫抗性(Johnson1989)，并且将因此利用于植物转化中。来自番茄或马铃薯的蛋白酶抑制剂II基因，pinII，被预期是特别有用的。甚至更有利的是pinII基因与Bt毒素基因的组合使用，本发明的发明人已发现其组合效果产生协同的杀昆虫活性。编码昆虫消化系统抑制剂的其它基因，或编码促进抑制剂产生的酶或辅因子的那些基因也可以是有用的。半胱氨酸蛋白酶抑制剂和淀粉酶抑制剂(例如来自小麦和大麦的那些)可以示例说明此组。

编码凝集素的基因也可以赋予额外的或可选择的杀昆虫特性。凝集素(最初称为植物凝集素)是多价结合碳水化合物的蛋白质，其能够从物种范围凝集红血细胞。近来，凝集素已经被鉴定为抗象鼻虫、ECB和根虫的杀昆虫剂(Murdock1990；Czapla和Lang，1990)。认为有用的凝集素基因包括，例如大麦和小麦胚芽凝集素(WGA)和稻凝集素(Gatehouse1984)，优选WGA。

本发明的另一方面是当引入虫害时，控制产生大或小的抗昆虫活性多肽的基因，所述多肽例如，裂解肽、肽激素以及毒素和毒液。例如，可以考虑到，表达针对特定虫害的保幼激素酯酶也可以产生杀昆虫活性，或可能引起变态的中断(Hammock1990)。

本发明的又一方面是表达基因的转基因植物，所述基因编码的酶影响昆虫角质层的完整性。这类基因包括编码例如，几丁质酶、蛋白酶、脂肪酶的那些，以及产生日光霉素(抑制几丁质合成的化合物)的基因，其任一的产生被认为产生昆虫抗性的玉米植物。编码起到影响昆虫蜕皮作用、影响产生蜕皮甾类UDP葡糖基转移酶的那些类基因也落入本发明的有用的转基因范围内。

本发明还包括编码酶的基因，所述酶促使产生降低宿主植物对虫害的营养质量的化合物。也可以例如，通过改变其固醇组分赋予植物杀昆虫的活性。昆虫从其饮食获得固醇并且用于激素合成以及膜稳定。因此，通过表达新基因(例如，直接促进产生不期望的固醇的那些基因或将期望的固醇转换成为不期望的形式的那些基因)改变植物固醇的组分，能够对昆虫生长和/或发育具有负面效果，并且因此赋予植物杀昆虫活性。脂肪加氧酶是天然存在的植物酶，已表明对昆虫呈现抗营养效果并且降低其饮食的营养质量。因此，本发明的更多的实施方案涉及带有增加的脂肪加氧酶活性的转基因植物，其可以抵抗昆虫摄食。

本发明还提供方法和组合物，通过其获得植物二级代谢上的质或量的改变。一个实例涉及转化植物以产生DIMBOA，其被认为赋予对欧洲玉米螟、根虫和几种其它玉米虫害的抗性。特别考虑用于这一方面的候选基因包括位于已知涉及合成DIMBOA途径的bx基因座的那些基因(Dunn1981)。引入可以调节玉米可凝性球蛋白的产生的基因和涉及高梁中蜀黍苷的生产的基因也被考虑分别用于促进对有害幼虫(earworm)和根虫的抗性。

鸭茅状摩擦禾(Tripsacum dactyloides)是对某些昆虫，包括玉米根虫有抗性的一种草。推测可以从摩擦禾属(Tripsacum)分离编码对昆虫有毒性的蛋白质的基因或涉及对昆虫有毒性化合物的合成的基因，并且这些基因在赋予对昆虫抗性中是有用的。由于在摩擦禾属中对昆虫的抗性已经经由有性杂交转移至玉蜀黍，所述抗性是遗传基础的(Branson和Guss，1972)。

更多的基因也可以以同样方式用作转基因，所述基因编码的蛋白质表征为具有潜在的杀昆虫活性。这类基因包括，例如，豇豆胰蛋白酶抑制剂(CpTI；Hilder1987)，其可用作根虫阻止剂；编码除虫菌素的基因(Campbell1989；Ikeda1987)，其可以证明特别有效的用作玉米根虫阻止剂；核糖体失活蛋白基因；以及甚至调节植物结构的基因。也考虑包括抗昆虫抗体基因和编码酶的基因的转基因玉米，所述酶能够将应用于植物外部的非毒性杀虫剂(前杀虫剂)转化成为植物内部的杀虫剂。

1.3环境或胁迫抗性

也可以通过表达异源基因或过表达同源基因有效改良植物耐受多种环境胁迫的能力，所述环境胁迫例如，但不限于，干旱、过潮、寒冷、冰冻、高温、盐或氧化胁迫。通过引入“抗冻”蛋白质，例如Winter　Flounder的蛋白质(Cutler1989)或其合成基因的衍生物可以有利于增加对冰冻温度的抗性。也可以通过增加叶绿体中的甘油-3-磷酸乙酰转移酶的表达赋予改良的寒冷耐受性(Murata1992；Wolter1992)。可以通过表达超氧化物歧化酶赋予(Gupta1993)，也可以通过谷胱甘肽还原酶改善(Bowler1992)对氧化应激的抗性(通常由例如与高光强组合的寒冷温度的条件加剧)。这类策略使能够在新出现的领域耐受寒冷，以及将较晚成熟的更高产量品种扩大至更早的相对成熟区。

有利于影响植物水含量、总水势、渗透势和膨胀的新基因的表达可以增加植物对干旱的耐受力。如本文所用，术语“干旱抗性”和“干旱耐受性”指植物对由可利用水的减少(与正常环境相比)引起的胁迫增加的抗性或耐受性，以及植物在缺水环境中发挥功能和生存，并且以相对较好的方式执行的能力。本发明的这一方面中推测，例如，表达编码渗透活性溶质的生物合成的基因能够给予对干旱的保护。在这类基因中有编码甘露醇脱氢酶(Lee和Saier，1982)和海藻糖-6-磷酸合酶(Kaasen1992)的DNA。通过天然磷酸酶在细胞中随后的作用或通过引入和共表达特异性磷酸酶，这些引入的基因将分别产生甘露醇或海藻糖的累积，这两者都已经被记载作为能够减轻胁迫影响的保护性化合物。在转基因烟草中甘露醇的累积已经得到证明并且初步结果表明表达高水平的这一代谢物的植物能够耐受施加的渗透胁迫(Tarczynski1992)。

同样的，其它代谢物在保护酶功能(例如，丙氨奥品(alanopine)或丙酸)或膜完整性(例如，丙氨奥品)的有效性已被报道(Loomis1989)，并且因此表达编码这些化合物的生物合成的基因能够以与甘露醇相似或互补的方式赋予干旱抗性。其它具有渗透活性和/或在干旱和/或干燥期间提供一些直接的保护效果的天然存在代谢物的实例包括糖类和糖类衍生物，例如果糖、赤藓糖醇(Coxson1992)、山梨糖醇、半乳糖醇(Karsten1992)、葡糖甘油(Reed1984；Erdmann1992)、蔗糖、水苏四糖(Koster和Leopold1988；Blackman1992)、芒柄醇(ononitol)和松醇(Vernon&Bohnert1992)、以及棉子糖(Bernal-Lugo和Leopold1992)。其它渗透活性的溶质(其并非糖类)包括，但不限于，脯氨酸和甜菜碱(Wyn-Jones和Storey，1981)。可以通过引入和表达基因来增加在胁迫期间连续的林冠生长和增加的可再生适合度，所述基因例如，控制上述渗透活性化合物以及其它这样的化合物(如在一个示例性实施方案中由肌醇甲基转移酶所代表)的那些基因。

表达特异性蛋白质还也可能增加干旱耐受性。三类晚期胚胎发生蛋白质已经基于结构相似性而被划分(见Dure1989)。已经证明，全部这三类蛋白质存在于成熟(即，干燥)种子中。在这三种类型的蛋白质中，类型II(脱水蛋白类型)通常在营养性植物部分涉及干旱和/或干燥耐受性(例如，Mundy和Chua，1988；Piatkowski1990；Yamaguchi-Shinozaki1992)。近来发现，在烟草中类型IIILEA(HVA-1)的表达影响植物高度、成熟和干旱耐受性(Fitzpatrick，1993)。因此，表达来自全部三类的结构基因可以赋予干旱耐受性。在水胁迫中诱导的其它类型蛋白质包括巯基蛋白酶、醛缩酶和跨膜转运蛋白(Guerrero1990)，其在干旱胁迫期间可以赋予多种保护性和/或修复型功能。影响脂类生物合成并且因此影响膜组分的基因的表达也能够用于赋予植物对干旱的抗性。

改良干旱抗性的许多基因具有互补的作用模式。因此，这些基因的组合在改善玉米的干旱抗性中具有附加和/或协同的效果。许多这些基因还改善冰冻耐受性(或抗性)；在冰冻和干旱期间发生的物理胁迫天然相似并且可能以相似方式减轻。

可以经由组成型表达或组织特异性表达这些基因使之受益，但是优选的表达这些新基因的手段可以通过使用膨胀诱导的启动子(例如，在Guerrero等人1990和Shagan1993所述膨胀诱导基因的启动子)。这些基因的时空表达方式可以使玉米能够更好的承受胁迫。

表达涉及特异性形态特性使增加从干燥土壤中的水摄取的基因是有益的。例如，引入和表达改变根特征的基因可以增加水摄取。表达在胁迫期间提高再生适合度的基因具有限制的价值。例如，表达改良花粉散落的同步化和雌性花部分(即，穗丝)的接受性的基因是有益的。此外，表达在胁迫期间最小化种子败育的基因将增加孵育的谷物量因而是有价值的。通过引入和表达带有合适调节序列的异戊基转移酶基因，调节单子叶植物(例如，玉米)中的细胞分裂素水平能够改良单子叶胁迫抗性和产量(Gan1995)。

如果水在决定产量中具有总的功能，考虑到通过引入和表达新基因使植物能够更有效的利用水，将改良总的行为(即使当不限制土壤水的可获得性时)。通过引入基因，可以实现改良植物在经历广泛的胁迫(其涉及水可获得性、产量稳定性或产量行为的连贯性)时最大化水利用的能力。

也可以，例如，通过过表达来自杜父鱼(Myoxocephalus Scorpius)(WO00/00512)、多刺床杜父鱼(Myoxocephalus octodecemspinosus)的抗冰冻多肽、拟南芥转录激活因子CBF1、谷氨酸脱氢酶(WO97/12983，WO98/11240)、钙依赖的蛋白质激酶基因(WO98/26045)、钙依赖磷酸酶(WO99/05902)、来自酵母的酪蛋白激酶(WO02/052012)、法尼基转移酶(WO99/06580；Pei ZM等人(1998)Science282：287-290)、铁蛋白(Deak M等人(1999)Nature Biotechnology17：192-196)、草酸氧化酶(WO99/04013；Dunwell JM(1998)Biotechn Genet Eng Rev15：1-32)、DREB1A因子(“脱水应答元件B1A”；Kasuga M等人(1999)Nature Biotech17：276-286)、甘露醇或海藻糖合成的基因，例如海藻糖-磷酸盐合酶或海藻糖-磷酸盐磷酸酶(WO97/42326)或者通过抑制例如海藻糖酶的基因(WO97/50561)来提高植物对例如，干旱、热或寒冷的非生物胁迫因素的保护。

1.4疾病抗性

建议可以通过向植物周期中引入基因实现增加的疾病抗性。可能产生对由病毒、细菌、真菌、根际病原体、昆虫和线虫引起的疾病的抗性。也可考虑通过引入基因的表达实现真菌毒素产生生物的控制。

可以通过表达新基因产生对病毒的抗性。例如，已经证明病毒包被蛋白在转基因植物中的表达可以给予被感染植物对该病毒和可能其它近似相关病毒感染的抗性(Cuozzo1988，Hemenway1988，Abel1986)。认为表达以必需病毒功能为靶标的反义基因可以给予对所述病毒的抗性。例如，以负责病毒核酸复制的基因为靶标的反义基因可以抑制所述复制并且产生对该病毒的抗性。相信通过使用反义基因干扰其它病毒功能也可以增加对病毒的抗性。此外，推测可能通过其它方法，包括，但不限于使用卫星病毒获得对病毒的抗性。

建议可以通过引入新基因实现对由细菌和真菌引起疾病的增加的抗性。认为编码所谓“肽抗生素”、致病相关(PR)蛋白、毒素抗性和影响宿主病原体相互作用(例如形态特征)的蛋白质是有用的。肽抗生素是抑制细菌和其它微生物生长的多肽序列。例如，称为杀菌肽和爪蟾抗菌肽的肽类抑制许多细菌和真菌物种的生长。认为在植物中表达PR蛋白质对于赋予对细菌疾病的抗性是有用的。这些基因在病原体侵染宿主植物之后被引入并且被划分为至少五类蛋白质(Bol1990)。包括在PR蛋白之中的是β-1，3-葡聚糖酶、几丁质酶和渗透蛋白，以及被认为在植物对疾病生物抗性中起作用的其它蛋白质。已经被鉴定具有抗真菌特性的其它基因，例如，UDA(蛰毛荨麻凝集素)和橡胶蛋白(Broakgert1989；Barkai-Golan1978)。已知某些植物疾病由产生毒植物素引起。可以通过表达编码能够降解或失活毒植物素的酶的新基因获得对这些疾病的抗性。表达改变宿主植物和病原体之间的相互作用的新基因在降低疾病生物入侵宿主植物组织的能力中可能是有用的，例如增加叶角质层的蜡质或其它形态特征。

植物寄生的线虫是许多植物的病因。推测可能通过表达新基因产生对这些生物的植物抗性。推测可以通过改变线虫识别或附着于宿主植物的能力和/或使植物能够产生杀线虫化合物(包括，但不限于蛋白质)来实现对线虫侵染的控制。

此外，可以通过靶向积累某些代谢物或蛋白质获得对真菌、昆虫、线虫和疾病的抗性。这类蛋白质包括，但不限于芥子油苷(防御食植动物)；几丁质酶或葡聚糖酶以及其它损害寄生虫细胞壁的酶；核糖体失活蛋白质(RIP)以及植物抗性和胁迫反应的其它蛋白质(当植物受到微生物攻击或化学上，例如水杨酸、茉莉酮酸或乙烯的攻击)；或来自非生物来源的溶菌酶，例如，T4-溶菌酶或来自多种哺乳底物的溶菌酶；杀昆虫蛋白，例如苏云金杆菌内毒素；α-淀粉酶抑制剂或蛋白水解酶抑制剂(豇豆胰蛋白酶抑制剂)；凝集素，例如小麦胚凝集素；RNA酶或核酶。更多的实例是这些核酸，其编码哈茨木霉chit42内切几丁质酶(GenBank Acc.No.：S78423)或来自双色高梁的N-羟基化多功能细胞色素P-450(CYP79)蛋白质(GenBank Acc.No.：U32624)、或这些的功能等同物。积聚芥子油苷保护抵抗虫害(RaskL等人(2000)Plant Mol Biol42：93-113；Menard R等人(1999)Phytochemistry52：29-35)、表达苏云金杆菌内毒素(Vaeck等人(1987)Nature328：33-37)或通过表达例如来自豆的几丁质酶保护抵抗真菌侵入(Broglie等人(1991)Science254：1194-1197)是有利的。可以通过表达雪滴花(雪花莲(Galanthus nivalis))外源凝集素获得稻植物中对虫害例如稻害虫褐飞虱(Nilaparvata lugens)的抗性(Rao等人(1998)Plant J15(4)：469-77)。表达合成的cryIA(b)和cryIA(c)基因，其编码鳞翅目特异性苏云金杆菌D-内毒素可以在多种生物中带来对虫害的抗性(Goyal RK等人(2000)CropProtection19(5)：307-312)。适于抵御病原体的更多的靶基因包括“多聚半乳糖醛酸酶抑制蛋白质”(PGIP)、奇异果甜蛋白、转化酶和抗菌肽，例如，乳铁结合蛋白(Lee TJ等人(2002)J Amer Soc Horticult Sci127(2)：158-164)。本文中可以有利的使用的其它核酸序列包括特征为昆虫控制(U.S.Pat.Nos.6,063,597；6,063,756；6,093,695；5,942,664；和6,110,464)、真菌疾病抗性(U.S.Pat.Nos.5,516,671；5,773,696；6,121,436；6,316,407；和6,506,962)、病毒抗性(U.S.Pat.Nos.5,304,730和6,013,864)线虫抗性(U.S.Pat.No.6,228,992)、以及细菌疾病抗性(U.S.Pat.No.5,516,671)。

1.5真菌毒素的还原/消除

由与植物有关的真菌产生真菌毒素，包括黄曲霉毒素和串珠镰孢菌毒素，是使谷物不能使用的重要因素。这些真菌生物不引起疾病症状和/或干扰植物生长，但是它们产生对动物有毒性的化学物质(真菌毒素)。抑制这些真菌的生长将减少这些毒性物质的合成，从而减少由于真菌毒素污染引起的谷物损失。可以将新的基因引入植物来抑制真菌毒素的合成而不干扰真菌生长。表达编码能够使真菌毒素无毒性的新基因对于获得减少的真菌毒素污染是有用的。上述任何机制的结果是减少谷物上真菌毒素的存在。

1.6谷物组分或质量

可以将基因引入植物，特别是商业上重要的谷类，例如玉米、小麦或稻，以改良谷物主要生长所要的谷粒。由谷物的特定最终用途决定，可以预期以此方式引入的广泛的新转基因植物。

例如，玉米粒的最大使用是用于饲料或食物。引入基因改变谷粒的组分可以大大提高饲料或食物的价值。玉米粒的主要成分是淀粉、蛋白质和油。玉米粒的这些主要成分各自可以通过改变其水平或组分而被改良。可以提出几个实例用于说明目的，而非提供可能性的彻底列举。

许多谷物的谷粒蛋白质对于饲料和食品目的，特别当用于喂养猪、家禽和人的时候是不理想的。蛋白质缺乏在这些物种饮食中必需的几种氨基酸，需要向谷粒加入补充物。有限的必需氨基酸可以包括赖氨酸、甲硫氨酸、色氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。一些氨基酸仅在谷物补充了其它用于饲料形成的输入物之后成为限制。例如，当谷物补充了大豆粗粉以满足赖氨酸需要时，甲硫氨酸成为限制。可以通过机制提高种子和谷粒中的这些必需氨基酸的水平，所述机制包括，但不限于，引入基因以增加氨基酸的生物合成、减少氨基酸的降解、增加蛋白质中氨基酸的贮存、或增加氨基酸向种子或谷粒的转运。

增加氨基酸的生物合成的一个机制是引入失调氨基酸生物合成途径的基因，使植物不再能充分的控制其产生水平。这可以通过失调或旁通过氨基酸生物合成途径中的步骤(其通常受到该途径的氨基酸终产物水平的调节)而完成。实例包括引入编码基因，所述基因编码失调型酶，天冬氨酸激酶或二氢吡啶二羧酸(DHDP)-合酶用于增加赖氨酸和苏氨酸产生，和邻氨基苯甲酸合酶用于增加色氨酸产生。可以通过引入减少或消除基因表达的DNA序列实现对氨基酸分解代谢的降低，所述基因编码的酶催化分解代谢途径中的步骤，例如赖氨酸-酮戊二酸还原酶。

可以改变谷物的蛋白质组分以多种方式改良氨基酸的平衡，包括提高天然蛋白质的表达、降低低组分的那些蛋白质的表达、改变天然蛋白质的组分、或引入编码全新蛋白质(其拥有更好的组分)的基因。可以引入DNA，其减少贮存蛋白质的玉米醇溶蛋白家族成员的表达。这一DNA可以编码核酶或反义序列，其指向损害玉米醇溶蛋白的表达或玉米醇溶蛋白表达的调节子(例如，不透明2号基因产物)的表达。可以通过共抑制现象，即通过表达由转化引入的同样的结构基因或基因片段抑制内源基因的表达，来修饰谷物的蛋白质组分(Goring1991)。此外，引入的DNA可以编码降解玉米醇溶蛋白的酶。获得的玉米醇溶蛋白表达的减少可能伴随着具有更理想的氨基酸组成的蛋白质增加或在其它主要种子组成(例如淀粉)的增加。可选择的，可以引入嵌合基因，其包含足够氨基酸组分的天然蛋白质的编码序列(例如，一种球蛋白或10kD的玉米的玉米醇溶蛋白)和设计提高所述蛋白质表达的启动子或其它调节性序列。所述基因的编码序列可能额外的包括或代替必需氨基酸的密码子。而且，可以使用来自另一物种的编码序列或部分或完全合成的序列，其设计编码完全独特的肽序列以提高种子的氨基酸组成。

引入改变谷物的油含量的基因可能是有价值的。油含量的增加可以导致用于饲料和食品的种子的可代谢能量含量和密度的增加。引入的基因可以编码除去或降低脂肪酸或脂质生物合成中的速率限制或调节步骤的酶。这类基因可以包括，但不限于，编码乙酰-CoA羧化酶、ACP-乙酰转移酶、β-酮脂酰-ACP合酶，以及其它众所周知的脂肪酸生物合成活性的那些。其它的可能是编码不具有酶活性的蛋白质，例如酰基载体蛋白。另外的实例包括2-酰基转移酶、油质蛋白丙酮酸脱氢酶复合物、酰基CoA合成酶、ATP柠檬酸盐裂解酶、ADP-葡萄糖焦磷酸化酶和肉碱-CoA-酰基-CoA穿梭的基因。预测与油生物合成有关基因的表达将靶向于质体，使用质体转运肽序列并且优选在种子胚中表达。可以引入基因改变在油中存在的脂肪酸的平衡，提供更健康或有营养的饲料。引入的DNA也可以编码阻断涉及脂肪酸生物合成的酶表达的序列，改变在如下所述谷物中存在的脂肪酸比例。

可以引入提高谷物的淀粉成分营养价值的基因，例如通过增加支链度，致使通过延迟其代谢提高淀粉在奶牛中的利用。

除了影响谷物的主要组成，可以引入基因影响用于饲料或食品的谷物的多种其它营养、加工或其它质量方面。例如，可以增加或降低谷物的色素形成。在一些动物饲料中黄色色素形成的增加和稳定是期望的，并且可以通过引入基因由消除生产中的限速步骤提高叶黄素和胡萝卜素的生产而实现。这类基因可以编码改变形式的八氢番茄红素合酶、八氢番茄红素去饱和酶或番茄红素合酶。可选择的，用于许多食物产品生产的无色素形成的白色玉米是期望的，并且可以通过引入阻断或消除色素产生途径中的步骤的DNA而生产。

含有一些谷类谷粒的饲料或食物拥有不足量的维生素，并且必须必需得到补充以提供足够的营养价值。在种子中引入提高维生素生物合成的基因是可预想的，包括例如，维生素A、E、B₁₂、胆碱等。例如，玉米粒也不拥有对于最佳营养价值足够的矿物质含量。影响化合物(其中含有磷、硫、钙、镁、锌和铁)的积聚或可获得性的基因是有价值的。一个实例是引入降低植酸产生或编码增加植酸分解的植酸酶的基因。这些基因将增加饮食中可获得磷酸盐的水平，减少补充无机磷酸盐的需要。

用于饲料和食品目的的谷物改良的多个其它实例可以被描述。改良可能甚至不涉及谷粒，而可以，例如提高谷物的青贮饲料价值。为实现此目的而引入的DNA可能包括改变木质素产生的序列，例如产生与牲畜更好的饲料价值相关的“褐色中脉”现象的那些。

除了直接改良饲料或食品价值，也可以引入基因提高谷物的加工和提高从加工产生的产物的价值。加工某些谷物例如玉米的初步方法是湿磨法。可以通过表达新基因来改良玉米，其例如通过减少浸泡时间增加加工的效率和减少加工成本。

改良湿磨产品的价值可以包括改变淀粉、油、玉米谷蛋白粗粉或玉米谷蛋白饲料成分的数量或质量。可以通过鉴别和消除淀粉生物合成中的限速步骤或通过降低其它谷物成分的水平导致淀粉比例增加，实现淀粉的增加。前者的实例是引入具有改变的调节活性或以高水平表达的ADP-葡萄糖焦磷酸化酶基因。后者的实例可以包括例如在种子发育晚期表达的蛋白质或油生物合成的选择性抑制物。

可以通过改变直链淀粉对支链淀粉的比率、淀粉分子的大小或其分支方式有益的改变淀粉的特性。通过这些改变可以修饰广泛的特性，其包括但不限于，改变凝胶化作用温度、凝胶化作用的热度、膜和浆糊的透明度、理论特性等。为了实现这些特性上的改变，可以单独或组合引入编码颗粒结合或可溶淀粉合酶活性或分支酶活性的基因。也可以使用例如反义构建体的DNA减少这些酶的内源的活性水平。引入的基因或构建体可能拥有调节序列，其在淀粉生物合成和淀粉颗粒发育的特定时间间隔安排它们的表达。此外，引入和表达导致淀粉分子的葡萄糖部分的体内衍生化和其它修饰的基因是可取的。可以预想任何分子的共价连接，仅受到在淀粉颗粒中催化衍生化的酶的存在和合适的底物的可接近性的限制。重要的衍生化作用的实例可以包括加入功能性基团，例如，胺、羧基、或磷酸基团，其为随后的体外衍生化作用提供位点或通过引入离子电荷影响淀粉特性。其它修饰的实例可以包括葡萄糖单元的直接改变，例如丧失羟基基团或它们氧化为醛基或羧基。

油是玉米和其它谷物湿磨的另一产物，其价值可以通过引入和表达基因得到改良。可以通过饲料和食品的上述方法提高从湿磨提取的油量。还可以改变油的特性以改良其在生产中以及在烹调油、起酥油、润滑剂或其它油衍生产品用途中的性能或当用于食品相关应用时改良其健康特性。还可以合成新的脂肪酸，其在提取时可以作为化学综合性的起始材料。可以通过改变在油中存在的脂肪酸的类型、水平或脂类排列实现油特性的改变。这可以依次通过加入编码酶的基因，所述酶催化新的脂肪酸的合成，和拥有它们的脂类或通过增加天然脂肪酸的水平而可能的降低前体水平来实现。可选择的，可以引入DNA序列，其降低或阻断脂肪酸生物合成中的步骤，导致前体脂肪酸中间体的增加。可能加入的基因包括去饱和酶、环氧酶、水合酶、去水合酶和其它催化涉及脂肪酸中间体反应的酶。可以被阻断的催化步骤的代表性实例包括从硬脂酸到油酸和油酸到亚麻酸的去饱和，导致硬脂酸和油酸分别的积聚。

也可以通过引入基因以获得新的植物来实现对其它主要谷类湿磨产品、谷蛋白粗粉和谷蛋白饲料的改良。有代表性的可能包括但不限于上述用于改良食品和饲料价值的那些。

此外，还可以考虑将植物用于产生或制造有用的生物化合物，该化合物在此之前在该植物中完全不产生或不以相同水平产生。通过转化方法引入和表达基因使制备生产这些化合物的新植物成为可能。可能性包括但不限于任何生物的化合物，其目前由任何生物产生，例如蛋白质、核酸、初级和中间体代谢物、碳水化合物多聚体等。该化合物可以由植物产生，在收获和/或加工时提取，并且用于任何目前认可的使用目的，例如药物、香料以及工业用酶。

其它可以示例性说明的谷物特性或由在转基因植物中引入的基因潜在编码特性的范围包括通过引入增加γ玉米醇溶蛋白合成的基因具有出于运输目的的较低破损敏感性或在当用干磨加工时具有更大的石细胞大小的谷物，通过增加果皮厚度的基因具有提高的爆裂质量和膨胀体积的爆米花，通过引入有效阻断涉及色素产生途径的酶表达的基因而具有用于食品用途的白色谷粒的玉米，以及通过引入影响口味的基因(例如甜玉米的shrunken基因(编码蔗糖合酶))而改良品质的酒精饮料或甜玉米。

1.7块茎或种子组成或品质

可以在种子或块茎中特别有利的表达多种性状以改良组成或品质。可以与本发明的启动子核酸序列组合并且提供改良的终产物特性的有用的核酸序列包括，不限于，编码种子贮存蛋白、脂肪酸途径酶、维生素E生物合成酶、氨基酸生物合成酶和淀粉分支酶的那些。用于修饰植物表型的示例性异源DNA的讨论可在以下中发现，例如，U.S.Pat.Nos.6,194,636；6,207,879；6,232,526；6,426,446；6,429,357；6,433,252；6,437,217；6,515,201；和6,583,338以及PCT公开WO02/057471，其各自以其整体引用作为参考。这类性状包括，但不限于：

-用于食品和饲料部分的代谢酶的表达，例如，植酸酶和纤维素酶。特别优选核酸，例如人工cDNA，其编码微生物的植酸酶(GenBank Acc.No.：A19451)或其功能等同物。

-基因的表达，其致使精细化学药物，例如维生素E、生育三烯酚或类胡萝卜素的积累。可以提到的一个实例是八氢番茄红素去饱和酶。优选编码喇叭水仙(Narcissus pseudonarcissus)八氢番茄红素去饱和酶(GenBank Acc.No.：X78815)的核酸或其功能等同物。优选的维生素E生物合成酶包括tyrA、slr1736、ATPT2、dxs、dxr、GGPPS、HPPD、GMT、MT1、tMT2、AANT1、slr1737和尿黑酸双加氧酶的反义构建体(Kridl等人，Seed Sci.Res.，1：209：219(1991)；Keegstra，Cell，56(2)：247-53(1989)；Nawrath等人，Proc.Natl.Acad.Sci.USA，91：12760-12764(1994)；Xia等人，J.Gen.Microbiol.，138：1309-1316(1992)；Lois等人，Proc.Natl.Acad.Sci.USA，95(5)：2105-2110(1998)；Takahashi等人，Proc.Natl.Acad.Sci.USA，95(17)：9879-9884(1998)；Norris等人，Plant Physiol.，117：1317-1323(1998)；Bartley和Scolnik，Plant Physiol.，104：1469-1470(1994)；Smith等人，Plant J.，11：83-92(1997)；WO00/32757；WO00/10380；Saint Guily等人，Plant Physiol.，100(2)：1069-1071(1992)；Sato等人，J.DNA Res.，7(1)：31-63(2000))其全部在此被并入作为参考。

-淀粉生产(U.S.Pat.Nos.5,750,876和6,476,295)、高蛋白质生产(U.S.Pat.No.6,380,466)、果实成熟(U.S.Pat.No.5,512,466)、提高的动物和人营养(U.S.Pat.Nos.5,985,605和6,171,640)、生物聚合物(U.S.Pat.No.5,958,745和U.S.Patent Publication No.2003/0028917)、环境胁迫抗性(U.S.Pat.No.6,072,103)、药物肽(U.S.Pat.No.6,080,560)、改良的加工特性(U.S.Pat.No.6,476,295)、改良的可消化性(U.S.Pat.No.6,531,648)、低棉子糖(U.S.Pat.No.6,166,292)、工业酶生产(U.S.Pat.No.5,543,576)、改良的口味(U.S.Pat.No.6,011,199)、氮固定(U.S.Pat.No.5,229,114)、杂交种子生产(U.S.Pat.No.5,689,041)、和生物燃料生产(U.S.Pat.No.5,998,700)，在以上列举专利中所述的遗传元件和转基因在这里被引入作为参考。优选的淀粉分支酶(用于修饰淀粉特性)包括在U.S.Pat.Nos.6,232,122和6,147,279；以及PCT公开WO97/22703提到的，其全部在这里被引入作为参考。

-修饰的油的生产(U.S.Pat.No.6,444,876)、大量的油生产(U.S.Pat.Nos.5,608,149和6,476,295)、或修饰的脂肪酸含量(U.S.Pat.No.6,537,750)。优选的脂肪酸途径酶包括硫酯酶(U.S.Pat.Nos.5,512,482；5,530,186；5,945,585；5,639,790；5,807,893；5,955,650；5,955,329；5,759,829；5,147,792；5,304,481；5,298,421；5,344,771；和5,760,206)、二乙酰基甘油乙酰转移酶(美国专利公开20030115632A1和20030028923A1)、以及去饱和酶(U.S.Pat.Nos.5,689,050；5,663,068；5,614,393；5,856,157；6,117,677；6,043,411；6,194,167；5,705,391；5,663,068；5,552,306；6,075,183；6,051,754；5,689,050；5,789,220；5,057,419；5,654,402；5,659,645；6,100,091；5,760,206；6,172,106；5,952,544；5,866,789；5,443,974；和5,093,249)，其全部在这里被引入作为参考。

-优选的氨基酸生物合成酶包括邻氨基苯甲酸合酶(U.S.Pat.No.5,965,727和PCT公开WO97/26366、WO99/11800、WO99/49058)、色氨酸脱羧酶(PCT公开WO99/06581)、苏氨酸脱羧酶(U.S.Pat.Nos.5,534,421和5,942,660；PCT公开WO95/19442)、苏氨酸脱氨酶(PCT公开WO99/02656和WO98/55601)、二氢吡啶二羧酸合酶(U.S.Pat.No.5,258,300)、以及天冬氨酸激酶(U.S.Pat.Nos.5,367,110；5,858,749；和6,040,160)，其全部在这里被引入作为参考。

营养辅助食品的生产，诸如，例如，通过表达脂肪酸延长酶和/或去饱和酶的多聚不饱和脂肪酸(例如，花生四烯酸、十二碳五烯酸、或二十二碳六烯酸)，或产生具有提高的营养价值的蛋白质，诸如，例如，具有高含量的必需氨基酸(例如，巴西坚果的高甲硫氨酸2S白蛋白基因)。优选以下蛋白质的编码核酸：巴西坚果(Bertholletia excelsa)高甲硫氨酸2S白蛋白的编码核酸(GenBank Acc.No.：AB044391)、小立碗藓(Physcomitrella patens)6-酰基-脂去饱和酶(GenBank Acc.No.：AJ222980；Girke等人(1998)PlantJ15：39-48)、高山被孢霉(Mortierella alpina)6-去饱和酶(Sakuradani等人1999Gene238：445-453)、线虫(Caenorhabditis elegans)5-去饱和酶(Michaelson等人1998，FEBS Letters439：215-218)、线虫5-脂肪酸去饱和酶(des-5)(GenBank Acc.No.：AF078796)、高山被孢霉5-去饱和酶(Michaelson等人JBC273：19055-19059)、线虫6-延长酶(Beaudoin等人2000，PNAS97：6421-6426)、小立碗藓6-延长酶(Zank等人2000，Biochemical Society Transactions28：654-657)，或其功能等同物。

生产用于工业目的的大量蛋白质和酶(例如，酶，诸如，脂肪酶)或用作药物(诸如，例如，抗体、凝血因子、干扰素、淋巴因子、集落刺激因子、纤溶酶原激活物、激素或疫苗，如由Hood EE，Jilka JM(1999)Curr OpinBiotechnol10(4)：382-6；Ma JK，Vine ND(1999)Curr Top MicrobiolImmunol236：275-92所述)。例如，已经可以在转基因玉米植物中大规模生产来自小鸡白蛋白的重组抗生物素蛋白和细菌β-葡糖醛酸糖苷酶(GUS)(Hood等人(1999)Adv Exp Med Biol464：127-47.综述)。

-出于增加蛋白或脂类物质产量的目的，在细胞中获得增加的贮存力(所述细胞通常包含较少贮存蛋白或贮存脂类)，例如通过表达乙酰-CoA羧化酶。优选的核酸是那些，其编码紫苜蓿(Medicago sativa)乙酰-CoA羧化酶(ACCase)(GenBank Acc.No.：L25042)，或其功能的等同物。可以选择的，在一些情况下，增加的贮存蛋白质含量对于高蛋白质产品的生产可能是有利的。优选的种子贮存蛋白质包括玉米醇溶蛋白(U.S.Pat.Nos·4,886,878；4,885,357；5,215,912；5,589,616；5,508,468；5,939,599；5,633,436；和5,990,384；PCT公开WO90/01869、WO91/13993、WO92/14822、WO93/08682、WO94/20628、WO97/28247、WO98/26064和WO99/40209)、7S蛋白(U.S.Pat.Nos.5,003,045和5,576,203)、巴西坚果蛋白(U.S.Pat.No.5,850,024)、苯丙氨酸游离蛋白(PCT公开WO96/17064)、白蛋白(PCT公开WO97/35023)、β-伴大豆球蛋白(PCT公开WO00/19839)、11S(U.S.Pat·No.6,107,051)、α-hordothionin(U.S.Pat.Nos.5,885,802和5，88，5801)、arcelin种子贮存蛋白质(U.S.Pat.No.5,270,200)、凝集素(U.S.Pat.No.6,110,891)、和麦谷蛋白(U.S.Pat.Nos.5,990,389和5,914,450)，其全部在这里被引入作为参考。

优选在马铃薯块茎内α-葡聚糖L-型块茎磷酸化酶(GLTP)或α-葡聚糖H-型块茎磷酸化酶(GHTP)降低的酶活性水平(见US5,998,701)。特别是当贮存在7℃以下的温度时，在马铃薯块茎中淀粉到糖的转化在块茎中下降呈现降低的GLTP或GHTP酶活性。马铃薯中降低的冷-变甜使马铃薯能够贮存在更冷的温度，产生延长的冬眠期、降低的疾病发生和增加的贮存时间。可以通过如使用同源反义或双链RNA、共抑制的使用、调节沉默序列抑制基因表达这样的技术来实现马铃薯块茎中GLTP或GHTP活性的降低。具有改良的冷-贮存特性的马铃薯植物，包括用具有TPT启动子的表达盒转化的马铃薯植物，所述启动子有效连接于包含基因的至少20个核苷酸的DNA序列，该基因编码的α-葡聚糖磷酸化酶选自α-葡聚糖L-型块茎磷酸化酶(GLTP)和α-葡聚糖H-型块茎磷酸化酶(GHTP)组成的组。

有利基因的更多实例在例如Dunwell JM，Transgenic approaches tocrop improvement，J Exp Bot.2000；51Spec No；487-96页中提到。

1.8植物农业特性

决定植物可以在何处生长的两个因素是在生长季节的平均每日温度和霜冻之间的时间长度。在能够生长特定植物的区域内，关于允许生长至成熟和被收获的最大时间上有多样化的限制。选择在特定区域中生长的植物能够在具有最大可能产量的所需时间内成熟和脱水至可收获的水含量的能力。因此，对于不同的生长地点开发了多种成熟度的植物。除了需要充分脱水以允许收获之外，期望在地里最大程度的脱水以使在收获后另外的干燥所需的能量最小化。同样，谷物越容易脱水，用于生长和种子饱满的时间就越多。可以使用转化技术鉴定影响成熟和/或脱水的基因并且引入植物品系以产生适于不同生长地点或在相同的生长地点但是在收获时具有提高的产量对含水量比率的新品种。涉及植物发育调节的基因的表达可能是尤其有用的，例如，在植物中已经鉴别的无舌叶和粗糙叶鞘基因。

可以将提高直立能力和其它植物生长特性的基因引入植物。例如，表达赋予更强壮的茎、改良的根系、或阻止或减少复穗状花序损耗的基因对于玉米农场主具有巨大价值。引入和表达通过，例如增加光分布和/或中断可实现光同化作用总量增加的基因是有利的。此外，表达增加光合作用效率和/或叶冠的基因将进一步增加谷物的生产力。这类方法将允许在田地中增加的植物种群。

营养老化的晚季延迟将增加进入谷物的同化产物流因而增加产量。在植物中过表达与“保持绿色”有关的基因或表达延迟老化的任何基因将是有利的。例如，已经在草甸羊茅(Festuca pratensis)中鉴定了非黄化突变体(Davies1990)。表达这一基因以及其它可以阻止叶绿素过早分解，从而维持林冠功能。

1.9养分利用

利用可获得养分和矿物质的能力可能是许多植物生长的限制因素。已提出，通过引入新基因改变养分摄取、pH极值耐受性、通过植物的转移、贮存库和代谢活性的可用性是可能的。这些修饰将使植物更有效的利用可获得的养分。认为例如通常存在于植物中并且涉及养分利用的酶活性的增加将增加养分的可用性。这类酶的一个实例是植酸酶。也认为表达新基因可能使先前不易获得的养分来源可以利用，例如从更复杂分子，可能为大分子释放营养值的酶。

1.10雄性不育

雄性不育用于杂交种子的生产中。已提出可以通过表达新基因产生雄性不育。例如，已经显示表达编码干扰雄性花序和/或配子体发育蛋白质的基因导致雄性不育。已经证明在转基因烟草和油菜花药中表达的嵌合核糖核酸酶基因导致雄性不育(Mariani1990)。例如，在玉米中发现了赋予胞质雄性不育的大量突变。一种突变，特别称为T胞质，还与对玉米小斑病的敏感性有关。命名为TURF-13的一段DNA序列(Levings1990)被鉴定与T胞质有关。通过经由转化引入TURF-13从疾病敏感性分离雄性不育是可能的。如果为了育种目的和为了谷物生产需要能够恢复雄性生育力，也可以引入编码恢复雄性生育力的基因。

1.11.非蛋白质表达序列

1.11.1RNA-表达

可以出于表达影响植物表型而不翻译为蛋白质的RNA转录物的目的引入DNA。两个实例是反义RNA和带有核酶活性的RNA。两者都可能作用于减少和消除天然或引入的植物基因的表达。

可以构建或分离基因，其当被转录时产生与靶向的信使RNA的全部或部分互补的反义RNA或双链RNA。反义RNA减少信使RNA的多肽产物的产生。多肽产物可以是由植物基因组编码的任何蛋白质。上面提到的基因被称为反义基因。可以由此通过转化方法将反义基因引入植物以产生具有减少表达所选择目的蛋白质的新的转基因植物。例如，该蛋白质可以是在植物中催化反应的酶。酶活性的降低可以减少或消除反应的产物，其包括植物中的任何酶促合成的化合物，例如，脂肪酸、氨基酸、碳水化合物、核酸等。可选择的，该蛋白质可以是贮存蛋白，例如玉米醇溶蛋白，或结构蛋白，其减少的表达可能分别导致种子氨基酸组成的改变或植物形态改变。以上引用的可能性仅通过实例提供，而不代表申请的全部范围。

通过本发明的表达盒之一表达反义RNA或双链RNA是尤其优选的。

也可以使用表达正义RNA用于基因沉默(共抑制)。这一RNA优选是不能翻译的RNA。通过双链RNA(“双链RNA干扰”；dsRNAi)的基因调节是本领域众所周知的，并且在包括植物的多种生物中有描述(例如，Matzke2000；Fire A等人1998；WO99/32619；WO99/53050；WO00/68374；WO00/44914；WO00/44895；WO00/49035；WO00/63364)。

可以构建或分离基因，当被转录时产生RNA酶或核酶，其可以作用为内切核糖核酸酶并且催化带有所选择序列的RNA分子的切割。选择的信使RNA的切割可以减少其编码的多肽产物的产生。这些基因可以用于制备拥有它们的新的转基因植物。转基因植物可以拥有降低水平的多肽，包括，但不限于可以由反义RNA影响的上述多肽。

也可以引入基因产生新的转基因植物，通过共抑制机制使其具有天然基因产物的减少的表达。已经在烟草、番茄和矮牵牛花(Goring1991；Smith1990；Napoli1990；van der Krol1990)中证明天然基因的正义转录物的表达将以与反义基因所观察到的相似的方式减少或消除天然基因的表达。引入的基因可以编码全部或部分的靶向的天然蛋白质，但是减少天然蛋白质的水平可以不需要它的翻译。

1.11.2非-RNA-表达

例如，可以插入基因并且引起突变的DNA元件包括那些可转座的元件，例如，Ds、Ac或Mu。可以插入这些DNA元件以失活(或激活)基因和由此“标记”特定的性状。在这种情况下，可转座的元件并不引起标记突变的不稳定性，因为元件的利用不依赖于它在基因组中移动的能力。一旦期望的性状被标记，可以使用引入的DNA序列克隆相应的基因，例如，使用引入的DNA序列作为PCR引物连同PCR基因克隆技术(Shapiro，1983；Dellaporta1988)。一旦被鉴定，特定性状的整个基因，包括所期望处的控制或调节区可以按照期望的被分离、克隆和操作。出于基因标记目的向生物中引入的DNA元件的利用不依赖于DNA序列并且不依赖于DNA序列的任何生物活性，即，转录为RNA或翻译为蛋白质。DNA元件的唯一功能是破坏基因的DNA序列。

可以考虑将不表达的DNA序列，包括新合成的序列引入细胞作为那些细胞和植物及其种子的持有“标记”。由于标记DNA的唯一功能是鉴定该生物的起源，这一DNA元件不需要干扰宿主生物内源基因的功能。例如，可以向植物引入唯一的DNA序列，并且这一DNA元件将鉴定从标记来源产生的这些细胞的全部细胞、植物和子代。提出包括标记DNA使人们能够将拥有其的种质或从这类衍生的种质与未标记的种质区分开。

可以引入的另一可能的元件是基质附着区元件(MAR)，例如小鸡溶菌酶A元件(Stief1989)，其可以被置于可表达的目的基因周围以影响基因整体表达的增加和消除当掺入植物基因组时的位置依赖效果(Stief1989；Phi-Van1990)。

可以考虑在本发明的范围内用于与根据本发明的启动子序列有效连接的更多的目的核苷酸序列是分离的核酸分子，例如，DNA或RNA，包括构建本发明的植物核苷酸序列，其包含开放阅读框，所述开放阅读框优选在特异性组织，即种子、根、绿色组织(叶和茎)、圆锥花序或花粉中表达或组成型表达。

2.标记基因

为了提高鉴别转化株的能力，可以期望使用可选择的或可筛选的标记基因作为可表达的目的基因或在可表达的目的基因之外加入。“标记基因”赋予表达标记基因的细胞独特的表型并且因此使这类转化的细胞能够与不具有该标记的细胞相区分。这类基因可以编码可选择的或可筛选的标记，依赖于该标记是否赋予可通过化学手段，即通过使用选择性试剂(例如，除草剂、抗体等)“选择”的性状，或其仅是可通过观察或测量，即通过“筛选”(例如，R-基因座性状、绿色荧光蛋白(GFP))鉴别的性状。当然，合适的标记基因的许多实例是本领域已知的并且可以用于本发明的操作中。

术语可选择或可筛选的标记基因还包括编码“可选择标记”的基因，其分泌可以被检测作为鉴别或选择转化细胞的手段。实例包括标记，其编码能够通过抗体相互作用被鉴别的可分泌的抗原，或甚至可分泌的酶，其可以通过其催化活性被检测。可分泌的蛋白质分为数类，包括可检测的(例如通过ELISA)小的可扩散的蛋白质、在细胞外溶液中可检测的小的有活性的酶(例如，α-淀粉酶、β-内酰胺酶、膦丝菌素乙酰基转移酶)、和被插入或捕获于细胞壁的蛋白质(例如，包括例如在伸展蛋白或烟草PR-S的表达单元中发现的前导序列的蛋白质)。

关于可选择的可分泌标记，认为使用这样的基因是特别有利的，所述基因编码的蛋白质被汇集在细胞壁中并且该蛋白包括独特的表位。这类分泌的抗原标记将理想的使用在植物组织中低背景的表位序列、赋予有效表达和靶向穿过细胞膜的启动子前导序列，并且产生结合在细胞壁中并且对抗体而言仍可到达的蛋白质。被修饰包括独特表位的正常分泌的细胞壁蛋白质将满足全部这些需要。

适合以此方式修饰的蛋白质的一个实例是伸展蛋白、或富羟脯氨酸糖蛋白(HPRG)。例如，玉米HPRG(Steifel1990)分子就分子生物学、表达和蛋白质结构方面而言是被良好表征的。然而，多种ultilane和/或富甘氨酸壁蛋白中的任何一种(Keller1989)能够通过加入抗原位点以产生可筛选的标记而被修饰。

可分泌的可筛选标记的一个示例性实施方案涉及使用编码壁蛋白HPRG的玉米序列，修饰使其包括来自鼠白介素前区的15个残基表位，然而，在这类实施方案中实际上可以使用选自本领域技术人员已知的非常广泛多样的抗原-抗体组合的任何可检测的表位。接着，可以使用产色素或荧光的连接物标记的抗体直接检测独特的细胞外表位。

可以通过使用bar和/或GUS基因，也可以通过使用多种其它标记具体示例说明本公开的元件。当然，在本公开的指导下，除了在下文提出的，多种可能的可选择和/或可筛选的标记基因对于本领域技术人员而言是显而易见的。因此，应该理解下列讨论是示例性而非详尽无遗。在本文公开的技术和本领域已知的常用重组技术的指导下，本发明使向受体细胞引入任何基因(包括标记基因)以产生转化的植物成为可能。

2.1可选择的标记

适合植物转化的多种可选择的标记是本领域已知的。这类标记可以包括但不限于：

2.1.1负选择标记

负选择标记赋予对杀生物剂化合物的抗性，所述化合物例如代谢抑制剂(例如，2-脱氧葡萄糖-6-磷酸，WO98/45456)、抗生素(例如，卡那霉素、G418、博来霉素或潮霉素)或杀虫剂(例如，膦丝菌素或草甘膦)。表达标记基因的转化的植物材料(例如，细胞、组织或小植株)能够在抑制未转化的野生型组织生长的相应选择性化合物(例如，抗生素或除草剂)的浓度存在中发育。尤其优选的负选择性标记是赋予对除草剂抗性的那些。可以提到的实例是：

-膦丝菌素乙酰转移酶(PAT；也称为Bialophos

抗性；bar；deBlock1987；Vasil1992，1993；Weeks1993；Becker1994；Nehra1994；Wan&Lemaux1994；EP0 333 033；US4,975,374)。优选来自吸水链霉素(Streptomyces hygroscopicus)的bar基因或来自产绿链霉素(Streptomycesviridochromogenes)的pat基因。PAT使除草剂双丙氨磷、膦丝菌素(PPT)中的活性成分失活。PPT抑制谷氨酰胺合成酶(Murakami1986；Twell1989)，引起快速的氨积累和细胞死亡。

-改变的5-烯醇式丙酮基莽草酸-3-磷酸合酶(EPSP)赋予对草甘

(N-(磷酰甲基)甘氨酸)的抗性(Hinchee1988；Shah1986；Della-Cioppa1987)。其中使用突变的EPSP合酶基因，可以通过掺入合适的叶绿体转运肽CTP(EP-A10218571)获得额外的益处。

-草甘

降解酶(草甘

氧化还原酶；gox)，

-失活茅草

的脱卤素酶(deh)，

-失活磺酰脲和/或咪唑啉酮的乙酸乳酸合酶(ahas或ALS；例如，突变的ahas/ALS突变依，带有，例如S4、XI12、XA17和/或Hra突变(EP-A1154204))

-降解

的腈水解酶(bxn；Stalker1988)

-卡那霉素或遗传霉素(G418)抗性基因(NPTII；NPT或neo；Potrykus1985)编码例如，新霉素磷酸转移酶(Fraley1983；Nehra1994)

-2-脱氧葡萄糖-6-磷酸磷酸酶(DOGR1-基因产物；WO98/45456；EP0807836)，赋予对2-脱氧葡萄糖的抗性(Randez-Gil1995)

-潮霉素磷酸转移酶(HPT)，其介导对潮霉素的抗性(Vanden Elzen1985)

-改变的二氢叶酸还原酶(Eichholtz1987)赋予对氨甲蝶呤的抗性(Thillet1988)；

-突变的邻氨基苯甲酸合酶基因，其赋予对5-甲基色氨酸的抗性。

赋予对抗生素抗性的另外的细菌起源的负选择标记基因包括aadA基因，其赋予对抗生素壮观霉素、庆大霉素乙酰转移酶、链霉素磷酸转移酶(SPT)、氨基糖苷-3-腺嘌呤基转移酶和博来霉素抗性决定子(Hayford1988；Jones1987；Svab1990；Hille1986)。

尤其优选的负选择性标记赋予对由D-氨基酸，例如，D-丙氨酸和D-丝氨酸引起的毒性效果的抗性(WO03/060133；Erikson2004)。在本文中尤其优选的负选择性标记是来自瘦弱红酵母(Rhodotorula gracilis)的daol基因(EC：1.4.3.3：GenBank Acc.-No.：U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨酶)[EC：4.3.1.18；GenBank Acc.-No.：J01603)。

表达这些标记基因的转化的植物材料(例如，细胞、胚、组织或小植株)能够在抑制未转化的野生型组织生长的相应选择性化合物(例如，抗生素或除草剂)的浓度存在中发育。产生的植物可以以惯例的方式培养和杂交。可以生长两个或更多的世代以保证基因组整合是稳定的和遗传的。相应的方法被描述(Jenes1993；Potrykus1991)。

此外，可以使用报告基因以使能够视觉筛选，其可能需要或可能不需要(由报告基因类型决定)补充底物作为选择性化合物。

可以使用不同的时间方案用于各种负选择标记基因。在抗性基因的情况(例如，针对除草剂或D-氨基酸)，优选在约4周的整个愈伤组织诱导期，和进入再生至少超过4周应用选择。这样的选择方案可以用于全部选择方案。还可以(尽管不明确优选)也在整个再生期，包括生根期保持选择。

例如，使用膦丝菌素抗性基因(bar)作为选择性标记，在培养基中可以包括从约1至50mg/l浓度的膦丝菌素。例如，使用dao1基因作为选择性标记，在培养基中可以包括从约3至100mg/l浓度的D-丝氨酸或D-丙氨酸。典型的选择浓度是20至40mg/l。例如，使用特别的ahas基因作为选择性标记，在培养基中可以包括从约3至100mg/l浓度的PURSUITTM。典型的选择浓度是20至40mg/l。

2.1.2正选择标记

另外，可以使用正选择标记。基因，例如来自根瘤农杆菌(菌株：PO22；Genbank Acc.-No.：AB025109)的异戊烯基转移酶可以(作为细胞分裂素生物合成的关键酶)有利于转化植物的再生(例如，通过在无细胞分裂素的培养基上选择)。相应的选择方法被描述(Ebinuma2000a，b)。相对未转化植物赋予转化植物生长优势的另外的正选择标记被描述，例如，在EP-A0601092。生长刺激选择标记可以包括(但不应限于)β-葡糖醛酸糖苷酶(与例如细胞分裂素葡糖苷酸组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、UDP-半乳糖-4-差向异构酶(与例如，半乳糖组合)，其中尤其优选甘露糖-6-磷酸异构酶与甘露糖组合。

2.1.3反选择标记

反选择性标记尤其适于选择带有包含所述标记的限定的缺失序列的生物(Koprek1999)。反选择标记的实例包括胸苷激酶(TK)、胞嘧啶脱氨酶(Gleave1999；Perera1993；Stougaard1993)、细胞色素P450蛋白质(Koprek1999)、卤代链烷脱卤素酶(Naested1999)、iaaH基因产物(Sundaresan1995)、胞嘧啶脱氨酶codA(Schlaman和Hooykaas1997)或tms2基因产物(Fedoroff和Smith1993)或α-萘乙酰胺(NAM；Depicker1988)。反选择标记可以用于构建转座子标签的品系。例如，通过使用反选择标记来标记能够自主转座的元件，例如Ac、Master Mu或En/Spn，能够选择其中自主元件未稳定整合进入基因组的转化体。这将是所想要的，例如，当期望自主元件的瞬时表达反式激活缺陷型可转座元件，例如Ds的转座，而不期望自主元件的稳定整合时。可以不期望存在自主元件以稳定化缺陷型元件，即，阻止其进一步转座。然而，已经提出，如果期望在植物中自主可转座元件的稳定整合，负选择标记的存在可以使在培育过程中消除自主元件成为可能。

2.2.可筛选标记

可以使用的可筛选标记包括，但不限于β-葡糖醛酸糖苷酶(GUS)或编码已知的多种产色素底物的酶的uidA基因；编码调控植物组织中的花青苷色素(红色)产生的R-基因座基因(Dellaporta1988)；编码已知的多种产色素底物(例如，PADAC，产色素头孢菌素)的酶的β-内酰胺酶基因(Sutcliffe1978)；编码可以转化产色素儿茶酚的儿茶酚双加氧酶的xylE基因(Zukowsky1983)；淀粉酶基因(Ikuta1990)；编码能够氧化酪氨酸成为DOPA和多巴醌(其接着缩合形成易检测的化合物黑色素)的酶的酪氨酸酶基因(Katz1983)；编码有产色素底物的酶的β-半乳糖苷酶基因；萤光素酶(lux)基因(Ow1986)，其允许双萤光检测；或甚至水母发光蛋白基因(Prasher1985)，其可以用于钙敏感的双萤光检测，或绿色荧光蛋白基因(Niedz1995)。

来自玉米R基因复合物的基因被认为是特别有用的选择性标记。玉米中的R基因复合物编码的蛋白质在大多数种子和植物组织中作用以调节花青苷色素的产生。将来自R基因复合物的基因用于玉米转化，因为在转化细胞中表达这一基因不损害该细胞。因此，将R基因引入这类细胞将引起红色色素的表达，并且，如果稳定的掺入，可以被作为红色部分可视的计分。如果玉米株系对于编码花青苷生物合成调节中的酶促中间体(C2、A1、A2、Bz1和Bz2)的基因是显性的，而在R基因座带有隐性等位基因，用R转化来自该株系的任何细胞将导致红色色素形成。示例性的株系包括Wisconsin22(其含有rg-Stadler等位基因)和TR112，K55衍生物，其为r-g、b、P1。可选择的，如果一起引入C1和R等位基因，可以利用玉米的任何基因型。

还提出，可以在嵌合构建体中使用R基因调节区以提供控制嵌合基因表达的机制。已知比在任何其它基因座更多样的表型表达(Coe1988)。认为从结构R基因的5’区域获得的调节区在指导基因表达中是有价值的，所述基因例如，昆虫抗性、干旱抗性、除草剂耐受性或其它蛋白质编码区。出于本发明的目的，认为可以成功使用任一的多种R基因家族(例如，P、S、Lc等)。然而，最优选的通常是Sn(特别是Sn：bol3)。Sn是R基因复合物的主要成员，并且功能上与R和B基因座相似，由于Sn控制花青苷色素在某些幼苗和植物细胞中的组织特异性沉积，因此，其表型与R相似。

认为可以用于本发明的另一可筛选标记是由lux基因编码的萤火虫荧光酶。可以使用，例如，X-射线胶片、闪烁计数、荧光分光光度计、低光视频照相、光子计数照相或多孔发光计检测转化细胞中lux基因的存在。还可以设想开发这一系统用于双荧光的群体筛选，例如在组织培养板或甚至用于整个植物筛选。在期望使用可筛选标记基因诸如lux或GFP的地方，可以通过在可筛选标记基因和可选择标记基因之间产生基因融合，例如GFP-NPTII基因融合来实现益处。这将允许，例如，在筛选转基因植物或种子之后选择转化的细胞。

3.代表性DNA分子

本发明提供分离的核酸分子，例如DNA或RNA，其包含包含了开放阅读框的植物核苷酸序列或其启动子，所述开放阅读框优选在特异性植物组织，即在种子、根、绿色组织(叶和茎)、圆锥花序或花粉中表达，或组成型表达。

这些启动子包括，但不限于，组成型、可诱导的、时间调节的、发育调节的、空间调节的、化学调节的、胁迫应答的、组织特异性、病毒和合成的启动子。已知启动子序列是强或弱的。强的启动子提供高水平的基因表达，而弱启动子提供非常低水平的基因表达。可诱导的启动子应答外源加入的试剂或环境或发育刺激提供基因表达的开启和关闭。细菌启动子例如Ptac启动子由加入转化细菌细胞的异硫丙基半乳糖苷水平决定可以诱导不同水平的基因表达。分离的启动子序列对于异源核酸是强启动子是有利的，因为它提供了足够水平的基因表达允许容易的检测和选择转化的细胞并且当需要时提供了高水平的基因表达。

在植物启动子区域中，有几个结构域是启动子完整功能所必需的。这些结构域中的第一个位于紧接结构基因的上游，并且形成共有序列的含有“核心启动子区”，通常为紧接基因上游的70个碱基对。该核心启动子区含有特征性CAAT和TATA盒以及周围的序列，且代表限定结构基因的转录起始点的转录起始序列。

核心启动子区的存在限定了一个序列作为启动子：如果缺少该区，该启动子是无功能的。另外，核心启动子区不足以提供完整的启动子活性。核心上游的一系列调节序列组成启动子的其余部分。调节序列决定表达水平、表达的空间和时间方式，以及，对于启动子的重要子集而言，决定在诱导条件(由外部因子，例如光、温度、化学药物、激素调节)下的表达。

可以通过其它遗传策略进一步调节嵌合的反式作用病毒复制蛋白的受调节的表达。例如，由Odell等人1990所述的Cre介导的基因激活。因此，含有3’调节序列的DNA片断与在启动子和复制蛋白编码序列之间的lox位点结合阻断嵌合复制基因从该启动子的表达，可以通过Cre介导的切割除去所述DNA片断并且导致反式复制基因的表达。在这种情况，嵌合的Cre基因、嵌合的反式复制基因或两者同时可以在组织和发育特异性或可诱导的启动子的控制下。可选择的遗传策略是使用tRNA抑制子基因。例如，tRNA抑制子基因的受调节的表达能够条件性控制含有如Ulmasov等人1997所述合适的终止密码子的反式复制代表编码序列的表达。此外，嵌合tRNA抑制子基因、嵌合反式复制基因，或两者同时可以在组织或发育特异性启动子或可诱导的启动子控制之下。

通常期望以不依赖组织的方式在整个生物的细胞中具有DNA序列的连续的或可诱导的表达。例如，可以通过对植物基因组的遗传操作使其包含有效连接于异源病原体抗性基因的连续启动子，从而病原体抗性蛋白质在整个植物组织中被连续的表达，获得对由土壤和气生病原体引起的植物t6感染增加的抗性。

可以选择的，可以期望抑制天然DNA序列在植物种子中的表达以获得期望的表型。在这一情况下，可以通过转化植物，使其包含有效连接于反义核苷酸序列的启动子，从而使反义序列的种子偏好性或种子特异性表达产生RNA转录物，干扰天然DNA序列的mRNA的翻译，来实现这类抑制。

为了定义启动子区，通过本技术领域众所周知的重组DNA技术从目的基因的5’区移去启动子区并且有效连接至标记(报告)基因的编码序列。该报告基因被有效连接于启动子的下游，从而在启动子开始的转录物通过报告基因进行。报告基因通常编码容易测量的蛋白质，其包括但不限于，氯霉素乙酰转移酶(CAT)、β-葡糖醛酸糖苷酶(GUS)、绿色荧光蛋白(GFP)、β-半乳糖苷酶(β-GAL)和萤光蛋白酶。

接着，通过本技术领域熟知的转染技术将含有在启动子控制下的报告基因的构建体引入合适的细胞类型。为了测定报告基因蛋白，制备细胞裂解物并且对报告蛋白进行本领域熟知的适当测定。例如，如果选择CAT为报告基因，裂解用含有所研究启动子控制下的CAT的构建体转染的细胞，将裂解物与同位素标记的氯霉素和乙酰辅酶A(乙酰-CoA)混和。CAT酶将乙酰基团从乙酰-CoA转移至氯霉素的2-或3-位。使用薄层层析监测该反应，其从未反应材料分离乙酰化的氯霉素。接着通过自显影观察反应产物。

酶活性水平对应于制备的酶量，其揭示来自目的启动子的表达水平。可以将这一表达水平与其它启动子比较来确定所研究启动子的相对强度。为了保证该表达水平由启动子而非mRNA的稳定性决定，可以例如通过Northern印迹分析直接测量报告mRNA的水平。

一旦检测到活性，可以使用突变和/或缺失分析来确定起始转录所需要的最小区和/或序列。因此，可以在启动子区的5’末端和/或在启动子区的3’末端缺失序列，并且引入核苷酸取代。接着将这些构建体引入细胞并且确定其活性。

在一个实施方案中，启动子可以是γ玉米醇溶蛋白启动子、油质蛋白ole16启动子、球蛋白启动子、肌动蛋白I启动子、肌动蛋白cl启动子、蔗糖合成酶启动子、INOPS启动子、EXM5启动子、球蛋白2启动子、b-32，ADPG焦磷酸化酶启动子、Ltp1启动子、Ltp2启动子、油质蛋白ole17启动子、油质蛋白ole18启动子、肌动蛋白2启动子、花粉特异性蛋白启动子、花粉特异性果胶酸裂合酶、花药-特异性蛋白启动子、花药-特异性基因RTS2启动子、花粉特异性基因启动子、tapeturn-特异性基因启动子、tapeturn-特异性基因RAB24启动子、邻氨基苯甲酸合酶α亚基启动子、α玉米醇溶蛋白启动子、邻氨基苯甲酸合酶β亚基启动子、二氢吡啶二羧酸合酶启动子、Thil启动子、乙醇脱氢酶启动子、cab结合蛋白质启动子、H3C4启动子、核酮糖二磷酸羧化酶-加氧酶SS淀粉分支酶启动子、ACC酶启动子、肌动蛋白3启动子、肌动蛋白7启动子、调节蛋白GF14-12启动子、核糖体蛋白L9启动子、纤维素生物合成酶启动子、S-腺嘌呤基-L-高半胱氨酸水解酶启动子、超氧化物歧化酶启动子、C-激酶受体启动子、磷酸甘油酸变位酶启动子、根特异性RCc3mRNA启动子、葡萄糖-6磷酸异构酶启动子、焦磷酸果糖-6-磷酸磷酸转移酶启动子、泛素启动子、β-酮脂酰-ACP合酶启动子、33kDa光系统11启动子、氧离析蛋白质启动子、69kDa液泡ATP酶亚基启动子、类金属硫蛋白蛋白质启动子、甘油醛-3-磷酸脱氢酶启动子、ABA-和成熟诱导类蛋白质启动子、苯丙氨酸氨裂合酶、腺苷三磷酸酶S-腺苷-L-高半胱氨酸水解酶启动子、α-微管蛋白启动子、cab启动子、PEPC酶启动子、R基因启动子、凝集素启动子、光孵育复合物启动子、热休克蛋白启动子、苯基苯乙烯酮合酶启动子、玉米醇溶蛋白启动子、球蛋白-1启动子、ABA启动子、生长素结合蛋白启动子、UDP葡萄糖类黄酮糖基转移酶基因启动子、NTI启动子、肌动蛋白启动子、不透明2号启动子、b70启动子、油质蛋白启动子、CaMV35S启动子、CaMV34S启动子、CaMV19S启动子、组蛋白启动子、膨胀诱导启动子、豌豆小亚基RuBP羧化酶启动子、Ti质粒甘露碱合酶启动子、Ti质粒胭脂碱合酶启动子、矮牵牛查耳酮异构酶启动子、豆富甘氨酸蛋白I启动子、CaMV35S转录物启动子、马铃薯patatin启动子、或S-E9小亚基RuBP羧化酶启动子。

4.本发明的转化(转基因)植物和制备方法

可以使用本发明的DNA构建体通过DNA介导的植物细胞原生质体转化和随后根据本技术领域熟知的操作从形成的原生质体再生植物来形成生物物种。

可以使用本发明的载体转化能够继之克隆增殖(或者通过器官发生或胚胎发生)的任何植物组织。这里使用的术语“器官发生”意指枝条和根顺序从分生组织中心发育的过程；这里使用的术语“胚胎发生”意指枝条和根一起以共同的方式(非顺序地)从体细胞或配子发育的过程。所选择的特定组织将依据被转化的特定物种可获得和最适于的克隆增殖系统改变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、现存分生组织(例如，顶端分生组织、腋芽、和根分生组织)、以及可诱导的分生组织(例如，子叶分生组织和终末分生组织)。

本发明的植物可以采取多种形式。植物可以是转化细胞和非转化细胞的嵌合体；植物可以是克隆的转化体(例如，转化含有表达盒的全部细胞)；植物可以包含转化和未转化的组织的移植物(例如，在柑桔物种中转化的根状茎嫁接至未转化的接穗)。转化的植物可以通过多种方式增殖，例如通过克隆增殖或经典的育种技术。例如，转化植物的第一代(或T1)可以自交产生纯合的第二代(或T2)转化植物，并且T2植物进一步通过经典育种技术增殖。在育种中可以将显性可选择标记(例如，npt II)与表达盒连接以提供支持。

因此，本发明提供在植物中或植物外的转化的(转基因的)植物细胞，包括转化的质体或其它器官，例如，核、线粒体或叶绿体。可以使用本发明转化任何植物物种，包括，但不限于来自以上定义部分详细说明的植物物种的细胞。优选的，本发明的转基因植物是作物植物，并且特别是谷类(例如，玉米、苜蓿、向日葵、稻、白菜、油菜、大豆、大麦、大豆、甜菜、棉花、红花、花生、高梁、小麦、粟、烟草、亚麻(亚麻籽和亚麻)、亚麻荠和芥菜等)，并且甚至更有效玉米、稻和大豆。本发明的其它实施方案涉及这类植物的细胞、细胞培养物、组织、部分(例如，植物器官、叶、根等)和繁殖材料(例如种子)。

本发明的转基因表达盒可以不仅包含在植物或植物细胞中，而是还可以有利的在其它生物，例如，细菌中含有。因此，本发明的另一实施方案涉及包含本发明的表达盒的转基因细胞或非人类的转基因生物。优选原核和真核生物。包括微生物和更高等生物。优选的微生物是细菌、酵母、藻类和真菌。优选的细菌是、埃希氏菌属(Escherichia)、欧文氏菌属(Erwinia)、农杆菌属、黄杆菌属(Flavobacterium)、产碱杆菌属(Alcaligenes)、假单孢菌、芽孢杆菌属或蓝细菌属，例如，Synechocystis的那些，和其它在BrockBiology of Microorganisms第八版(A-8、A-9、A10和A11页)所述的其它细菌。最优选的包含本发明表达盒的转基因细胞或非人类的转基因生物是植物细胞或植物(如以上定义的)，更优选用于油生产的植物，例如，欧洲油菜、芥菜、亚麻、大豆、亚麻芥或向日葵。

尤其优选的是能够感染植物并且将DNA转移至其基因组的微生物，尤其是农杆菌属的细菌，尤其是根瘤农杆菌和毛根农杆菌。优选的酵母是假丝酵母属(Candida)、酵母属(Saccharomyces)、汉森式酵母属(Hansenula)和毕赤酵母属(Pichia)。优选的真菌是曲霉(Aspergillus)、木霉属(Trichoderma)、Ashbya、脉孢霉(Neurospora)、镰孢属(Fusarium)和Beauveria。最优选的是如上定义的植物生物。

可以使用单个DNA分子或多个DNA分子(即，共转化)进行植物的转化，并且这两种技术都适于使用本发明的表达盒。多种转化载体可以用于植物转化，并且本发明的表达盒可以用于与任何这类载体连接。载体的选择依赖于优选的转化技术以及用于转化的靶标物种。

将构建体引入植物细胞宿主的多种技术对本领域的技术人员是已知的。这些技术通常包括使用根瘤农杆菌或毛根农杆菌作为转化试剂用DNA转化、脂质体、PEG沉淀、电穿孔、DNA注射、直接的DNA摄取、微粒轰击、颗粒加速等(见，例如EP295959和EP138341)(见以下)。然而，可以使用本发明的表达盒转化植物细胞之外的细胞。植物表达载体和报告基因以及农杆菌和农杆菌介导的转移的通常描述可以在Gruber等人(1993)中找到。

可以将含有基因组片断或合成片断的表达载体引入原生质体或完整的组织或分离的细胞。优选将表达载体引入完整的组织。培养植物组织的常用方法由Maki等人，(1993)和由Phillips等人(1988)提供作为实例。优选使用直接的基因转移方法，例如，微注射介导的传递、DNA注射、电穿孔等将表达载体引入玉米或其它植物组织。更优选使用生物射弹装置用微注射介质传递将表达载体引入植物组织。见，例如，Tomes等人(1995)。本发明的载体不仅可用于结构基因的表达，还可以用于外显子-诱捕克隆或启动子诱捕操作来检测在多种组织中不同的基因表达(Lindsey1993；Auch和Reth1990)。

特别优选使用农杆菌物种的Ti和Ri质粒的双元型载体。Ti-衍生的载体转化广泛多样的高等植物，包括单子叶和双子叶植物，例如大豆、棉花、油菜、烟草和稻(Pacciotti1985：Byrne1987；Sukhapinda1987；Lorz1985；Potrykus，1985；Park1985：Hiei1994)。使用T-DNA转化植物细胞已经获得广泛的研究并且被详细的描述(EP120516；Hoekema，1985；Knauf，1983；和An1985)。为了引入植物，可以如在实例所述将本发明的嵌合基因插入双元载体。

其它转化方法是本领域技术人员可以使用的，例如，外源DNA构建体的直接摄取(见EP295959)、电穿孔技术(Fromm1986)或使用包被有核酸构建体的金属颗粒进行的高速度弹轰击(Kline1987和US4,945,050)。一旦转化，可以由本领域技术人员将细胞再生。特别有关的是近来描述的将外源基因转化进入商业重要作物的方法，所述作物例如油菜(De Block1989)、向日葵(Everett1987)、大豆(McCabe1988；Hinchee1988；Chee1989；Christou1989；EP301749)、稻(Hiei1994)和玉米(Gordon-Kamm1990；Fromm1990)。

本领域技术人员应该理解方法的选择可以依赖于植物的类型，即，作为转化靶标的单子叶或双子叶。转化植物细胞的合适的方法包括，但不限于，微注射(Crossway1986)、电穿孔(Riggs1986)、农杆菌介导的转化(Hinchee1988)、直接的基因转移(Paszkowski1984)以及使用从Agracetus，Inc.，Madison，Wis.和BioRad，Hercules，Calif.获得的装置进行的弹颗粒加速(见，例如US4,945,050；和McCabe1988)。又见Weissinger1988；Sanford1987(洋葱)；Christou1988(大豆)；McCabe1988(大豆)；Datta1990(稻)；Klein1988(玉米)；Klein1988(玉米)；Klein1988(玉米)；Fromm1990(玉米)；和Gordon-Kamm1990(玉米)；Svab1990(烟草叶绿体)；Koziel1993(玉米)；Shimamoto1989(稻)；Christou1991(稻)；欧洲专利申请EP0332581(果园草和其它Pooideae)；Vasil1993(小麦)；Weeks1993(小麦)。

在另一实施方案中，将本发明的核苷酸序列直接转化进入质体基因组。质体转化技术在US5,451,513、5,545,817和5,545,818，在PCT申请号WO95/16783，以及在McBride等人，1994有广泛描述。用于叶绿体转化的基本技术涉及例如使用生物射弹或原生质体转化(例如，氯化钙或PEG介导的转化)将侧翼为可选择标记连同目的基因的克隆的质体DNA区引入合适的靶组织。1至1.5kb的侧翼区，称为靶向序列，促进与质体基因组的直向同源重组，并且由此允许质体基因组特异区域的代替或修饰。最初，使用在叶绿体16S rRNA和rps12基因上的点突变赋予对壮观霉素和/或链霉素的抗性作为转化的选择标记(Svab1990；Staub1992)。这以每100个靶向叶的轰击大约一个的频率产生稳定的同质转化体。在这些标记之间克隆位点的存在使能够产生质体靶向的载体来引入外源基因(Staub1993)。转化频率的实质增加可以通过使用显性选择标记，编码壮观霉素-解毒酶氨基糖苷-3N-腺嘌呤转移酶的细菌aadA基因代替隐性rRNA或r-蛋白质抗生素抗性基因而获得(Svab1993)。用于质体转化的其它选择标记是本领域已知的，并且包括在本发明的范围内。通常，要达到同质体状态需要在转化之后约15-20细胞分裂周期。质体表达，其中通过直向同源重组将基因插入每个植物细胞中存在的环形质体基因组的全部几千个拷贝，利用了超过核表达基因的大量拷贝数的优势，以允许表达水平容易的超过总可溶植物蛋白质的10％以上。在优选的实施方案中，将本发明的核苷酸序列插入质体靶向的载体并且转化进入所期望植物宿主的质体基因组。可以获得与含有本发明核苷酸序列的质体基因组同型的植物，并且优选能够高表达核苷酸序列。

含有包含本发明的表达盒的载体的根瘤农杆菌在制备转化植物的方法中是有用的，其中所述载体包含Ti质粒。如上所述，使用根瘤农杆菌感染植物细胞以产生转化的植物细胞，并且接着从转化的植物细胞再生植物。多种用于进行本发明的农杆菌载体系统是已知的。

可以使用多种农杆菌菌株，优选卸甲根瘤农杆菌或根毛农杆菌菌株。在优选的实施方案中，用于本发明的操作的农杆菌菌株包括章鱼碱菌株，例如，LBA4404，或农杆碱菌株，例如EHA101或EHA105。用于DNA转移的合适的根瘤农杆菌菌株是例如EHA101[pEHA101](Hood1986)、EHA105[pEHA105](Li1992)、LBA4404[pAL4404](Hoekema1983)、C58C1[pMP90](Koncz和Schell1986)以及C58C1[pGV2260](Deblaere1985)。其它合适的菌株是根瘤农杆菌C58，胭脂碱菌株。其它合适的菌株是根瘤农杆菌C58C1(Van Larebeke1974)、A136(Watson1975)或LBA4011(Klapwijk1980)。在另一优选的实施方案中，土生细菌是毛根农杆菌菌株K599(NCPPB2659)的卸甲变体。优选的，这些菌株包含Ti或Ri质粒的卸甲质粒变体，其提供T-DNA转移进入植物细胞所需的功能(例如，vir基因)。在优选的实施方案中，用于转化使用植物酚类化合物预培养的植物组织的农杆菌菌株含有L，L-琥珀碱型Ti-质粒，优选卸甲质粒，例如pEHA101。在另一优选的实施方案中，用于转化使用植物酚类化合物预培养的植物组织的农杆菌菌株含有章鱼碱型Ti-质粒，优选卸甲质粒，例如pAL4404。通常，当使用章鱼碱型Ti质粒或辅助质粒时，优选virF基因是缺失或失活的(Jarschow1991)。

本发明的方法还可与特定农杆菌菌株组合使用以进一步增加转化效率，例如其中vir基因表达和/或其诱导由于存在突变的或嵌合的virA或virG基因而改变的农杆菌菌株(例如，Hansen1994；Chen和Winans1991；Scheeren-Groot，1994)。优选根瘤农杆菌菌株LBA4404(Hiei1994)与超毒力的质粒进一步的组合。这些是优选的基于pTOK246的质粒(Ishida1996)。

双元载体或任何其它载体可以通过普通DNA重组技术修饰，在大肠杆菌中繁殖，并且通过，例如，电穿孔或其它转化技术引入农杆菌(Mozo &Hooykaas1991)。

以类似于Ishida(1996)所述的方式生长和使用农杆菌。包含载体的农杆菌菌株可以，例如，在补加了合适的抗生素(例如，50mg/l壮观霉素)的YP培养基(5g/l酵母提取物、10g/l蛋白胨、5g/lNaCl、15g/l琼脂，pH6.8)上生长3天。用接菌环从固体培养基收集细菌并且重悬。在本发明的优选的实施方案中，农杆菌培养物从在-80℃等分冻存部分的开始使用。

用农杆菌转化靶标组织(例如，未成熟的胚胎)可以仅通过将靶标组织与农杆菌接触来进行。用于感染和共培养的农杆菌的浓度可能需要改变。例如，制备具有菌落密度大约从105-1011，优选106至1010，更优选约108个细胞或cfu/ml的农杆菌细胞悬液，并且将靶组织浸没于该悬液约3至10分钟。接着将产生的靶组织连同农杆菌在固体培养基培养数天。

优选的，使用浓度为106至1010cfu/ml的细菌。在优选的实施方案中，对于共培养步骤，在共培养的培养基中土生细菌(例如，农杆菌)悬液的约1至10μl被直接用于每个靶组织外植体并且风干。这省时省力并且减少了由于过多农杆菌的使用引起不期望的农杆菌介导的损伤。

细菌被重悬在植物相容的共培养培养基用于农杆菌处理。在共培养培养基中补入抗氧化剂(例如，硝酸银)、酚吸收化合物(例如，聚乙烯吡咯烷酮，Perl1996)或巯基化合物(例如，二硫苏糖醇、L-半胱氨酸，Olhoft2001)可以减少由于植物防御应答(例如，酚氧化)引起的组织坏死，可能进一步提高农杆菌介导的转化的效率。在另一优选的实施方案中，共培养培养基包含至少一种巯基化合物，其优选选自由硫代硫酸钠、二硫苏糖醇(DTT)和半胱氨酸组成的组。优选浓度在1mM和10mM的L-半胱氨酸、0.1mM至5mM DTT，和/或0.1mM至5mM硫代硫酸钠。优选在共培养中使用的培养基包含从约1μM至约10μM的硝酸银和从约50mg/L至约1,000mg/L的L-半胱氨酸。这导致靶组织对农杆菌介导的损坏(例如，诱导的坏死)的危险性降低并且大大提高了整体转化效率。

多种载体系统可以与农杆菌组合使用。优选双元载体系统。普通的双元载体是基于“广泛宿主范围”的质粒，例如pRK252(Bevan1984)或衍生自P-型质粒RK2的pTJS75(Watson1985)。这些载体的大部分是pBIN19(Bevan1984)的衍生物。多种双元载体是已知的，其中一些是可商购的，例如pBI101.2或pBIN19(Clontech Laboratories，Inc.USA)。另外在关于大小和处理方面改良载体(例如，pPZP；Hajdukiewicz1994)。改良的载体系统也在WO02/00900中被描述。

使用直接的基因转移方式或农杆菌介导的转移的方法通常，但并非必需，采取可选择的标记，其可以提供对抗生素(例如，卡那霉素、潮霉素或氨甲蝶呤)或除草剂(例如，磷丝菌素)的抗性。然而，对于植物转化的可选择标记的选择对于本发明并非关键。

对于某些植物物种，优选不同的抗生素或除草剂选择标记。常规用于转化的选择标记包括nptII基因，其赋予对卡那霉素和相关抗生素的抗性(Messing和Vierra，1982；Bevan1983)、bar基因，其赋予对除草剂磷丝菌素的抗性(White1990，Spencer1990)、hph基因，其赋予对抗生素潮霉素的抗性(Blochlinger和Diggelmann)、以及dhfr基因，其赋予对氨甲蝶呤的抗性(Bourouis1983)。

5.稳定转化的植物的产生和特征

接着将转基因植物细胞置于合适的选择培养基来选择转基因细胞，其接着生长为愈伤组织。枝条从愈伤组织长出。小植株从在生根培养基中生长的枝条产生。各种构建体通常将与用于在植物细胞中选择的标记连接。方便的，该标记可以是对杀生物剂(特别是抗生素，例如卡那霉素、G418、博来霉素、潮霉素、氯霉素、除草剂)抗性的。使用的特定标记将使能够选择选择转化的细胞(相对于缺少被引入的DNA的细胞)。包括本发明的转录盒的DNA构建体成分可以从对宿主天然(内源)或外来(外源)的序列制备。“外源”意指在构建体引入的野生型宿主中未发现的序列。异源构建体含有至少一个区，其对于转录起始区衍生自的基因是非天然的。

为了确定在转基因细胞和植物中转基因的存在，可以进行多种测定。这些测定包括，例如，本领域技术人员熟知的“分子生物”测定，例如Southern和Northern印迹、原位杂交和基于核酸的扩增方法，例如PCR或RT-PCR或TaqMan；“生化”测定，例如检测蛋白质产物的存在，例如，通过免疫手段(ELISA和Western印迹)或通过酶作用；植物部分测定，例如，种子测定；以及还有通过分析整个再生植物的表型，例如，对疾病或害虫的抗性。

可以从细胞系或任何植物部分分离DNA，通过本领域技术人员熟知的技术确定预选的核酸区段的存在。注意完整的序列可能并不总是存在，可能由于细胞中序列的重排或缺失。

可以通过聚合酶链式反应(PCR)确定由本发明的方法引入的核酸元件的存在。使用这些技术扩增核酸的不同片断并且通过凝胶电泳检测。这一类型的分析使人们能够确定在稳定的转化体中是否存在预选择的核酸区段，但是并不证明该引入的预选的核酸区段整合进入宿主细胞基因组。此外，不可以使用PCR技术来确定是否转化体具有引入基因组不同位点的外源基因，即，是否转化体是独立的来源.认为使用PCR技术将能够克隆宿主基因组DNA的片断邻于引入引入的预选DNA区段。

使用Southern杂交技术可以确定DNA整合进入宿主基因组的阳性证据和转化体的独立的鉴定。使用这一技术可以鉴定被引入宿主基因组并且侧翼为宿主DNA序列的特异性DNA序列。因此，指定的转化体的Southern杂交方式作为该转化体的鉴定特征。此外，可能通过Southern杂交来证明在高分子量DNA中引入的预选DNA的存在，即，证实引入的预选DNA区段已经整合进入宿主细胞基因组。Southern杂交的技术提供使用PCR获得的信息，例如预选DNA区段的存在，并且证明整合进入基因组并且表征每个单独的转化体。

认为使用点或狭线杂交的技术(其为Southern杂交技术的修饰)可以获得由PCR衍生的相同信息，例如，预选DNA区段的存在。

PCR和Southern杂交技术都可以用于证明预选DNA区段至子代的传输。在大多数情况，指定转化体的特征性Southern杂交方式将在子代分离为表明基因的稳定遗传的一个或多个孟德尔基因(Spencer1992)；Laursen1994)。愈伤组织和亲本转化体(R0)的非嵌合特性可以由种系运输以及在愈伤组织、R0植物和转化基因分离的R1子代中相同的Southern印迹杂交模式和强度表明。

尽管可以使用从植物任何部分分离的DNA进行DNA分析技术，RNA可能仅在特定细胞或组织类型中表达并且因此需要从这些组织中制备RNA用于分析。也可以使用PCR技术用于检测和定量从引入的预选DNA区段产生的RNA。在PCR的这一应用中，首先需要使用例如反转录酶的酶反转录RNA为DNA，和接着通过使用常规PCR技术扩增DNA。在大多数情况，PCR技术，尽管有用，不证明RNA产物的完整性。可以通过Northern印迹获得关于RNA产物特性的更多信息。这一技术将证明RNA物种的存在并且给出关于该RNA的完整性的信息。这些技术是Northern印迹的修改并且仅证明RNA物种的存在或缺少。

尽管可以使用Southern印迹和PCR检测研究的预选DNA区段，他们不提供预选的DNA区段是否被表达的信息。可以通过特异性鉴定引入的预选DNA区段的蛋白质产物或评估由其表达带来的表型改变来鉴定表达。

用于产生和鉴定特异性蛋白质的测定可以利用蛋白质的物理-化学、结构、功能或其它特性。独特的物理-化学或结构特性使蛋白质能够通过，例如天然或变性的凝胶电泳或等电聚焦的电泳操作或通过例如离子交换或凝胶排阻层析的层析技术被分离和鉴定。个体蛋白质的独特结构使能够使用特异性抗体以检测其在，例如ELISA测定形式中的存在。可以使用甚至更具特异性的方法的组合，例如Western印迹，其中使用抗体定位已经通过电泳技术分离的单个基因产物。可以使用额外的技术，例如通过在纯化后氨基酸测序的评估来证实目的产物的特征。然而，这些是最常用的方法，还可以另外使用其它操作。

也可以通过蛋白质的功能，特别是酶催化涉及特异性底物和产物的特异性化学反应的能力使用测定操作来鉴定蛋白质的表达。接着可以通过物理或化学操作提供和定量在反应后丧失的底物或产生的产物。实例随着被分析的酶而变化。

通过评估基因产物表达的表型结果来确定其表达的真实频率。这些测定还可以采取多种形式，包括但不限于分析在植物的化学成分、形态或生理特性中的改变。形态改变可以包括更高的高度或更厚的茎。在称为生物测定的仔细控制的条件下评估应答植物或植物部分对施加处理的最经常的改变。

6.转基因植物的用途

一旦本发明的表达盒被转化进入特定的植物物种，使用常规育种技术可以使其在那物种中增殖或移动进入相同物种的其它变种，特别包括商业变种。特别优选的本发明的植物包括以上列举的农业重要的作物。改造进入上述转基因种子和植物的遗传特性通过有性繁殖被传递并且因此在子代植物中维持和增殖。本发明还涉及从转基因植物获得的转基因植物细胞、组织、器官、种子或植物的部分。本发明中还包括植物的转基因后代以及从后代获得的转基因植物细胞、组织、器官、种子和植物的部分。

优选的，在转基因植物中的表达盒是性传递的。在一个优选的实施方案中，编码序列通过R0植物的完整正常的有性循环性传递至R1代。另外优选的，表达盒在转基因植物的细胞、组织、种子或植物中以与仅在缺乏该表达盒上不同的植物的细胞、组织、种子或植物中不同的量表达。

因此这里产生的转基因植物可以期望用于多种商业和研究的目的。可以产生转基因植物用于传统农业，使该转基因植物的性状有益于种植者(例如，农业性状，诸如，对缺水的抗性、害虫抗性、除草剂抗性或增加的产量)、有益于从植物收获的谷物的消费者(例如，在人的食品或动物饲料中提高的营养含量；增加的维生素、氨基酸和抗氧化剂含量；抗体的产生(被动免疫)和营养药)，或有益于食品加工者(例如，提高的加工性状)。在这类用途中，植物通常生长用于在人或动物食品中使用其谷物。此外，在转基因植物中使用根特异性启动子可以提供位于例如胡萝卜、欧洲防风和甜菜的可消费植物根的有益性状。然而，植物的其它部分，包括茎干、外壳、营养部分等还可以具有包括植物青贮部分或用于装饰目的的用途。通常，提取玉米和其它作物的化学组分(例如，油或淀粉)用于食品或工业用途，并且可以产生具有这类组分的提高或改变的水平的转基因植物。

转基因植物还可以找到其在蛋白质或其它分子的商业制造中的用途，其中从植物部分、种子等提取或纯化目的分子。也可以在体外培养、生长来自植物的细胞或组织，或者发酵来制备这类分子。该转基因植物也可以在商业育种程序中使用，或可以将其与相关作物物种的植物杂交或育种。可以转移由表达盒编码的改良，例如通过原生质体融合，例如从玉米细胞转移至其它物种的细胞。

转基因植物可以在研究或育种中具有许多用途，包括通过插入的诱变产生新的突变植物，用以鉴定可能通过传统突变和选择随后产生的有益突变体。一个实例是引入编码可转座元件的重组DNA序列，其可以用于产生遗传变异。本发明的方法还用于产生具有独特的“标签序列”或可用于鉴定其所有的品系或变体的其它标记序列的植物。

因此，根据本发明的转基因植物和种子能够用于植物育种，其目的在于植物的开发，所述植物具有由表达盒赋予的改良的特性，例如对干旱、疾病或其它胁迫的耐受性。各种育种步骤通过具体限定的人工干扰，例如选择杂交的品系、指导亲本品系的授粉或选择合适的后代植物来表征。由期望的特征决定采取不同的育种措施。有关的技术是本领域熟知的，包括但不限于杂交、近交、回交育种、多线育种、品种混和、种间杂交、非整倍体技术等。杂交技术还包括通过机械、化学或生化手段的植物不育以提供雄性或雌性的不育植物。雄性不育植物与不同品系花粉的杂交授粉保证雄性不育而非雌性不育的植物基因组将均一的获得两种亲本系的特性。因此，根据本发明的转基因种子和植物能够用于改良的植物系的育种，其例如增加常规方法(例如除草剂或杀虫剂处理)的有效性或使由于它们改变的遗传特性能够施行所述方法。可选择的，可以获得具有改良的胁迫耐受性的新作物，其由于它们优化的遗传“装备”比不能耐受可比较的不良发育条件的产物产生具有更好质量的收获产物。

实施例

材料和常用方法

除非另外说明，在实施例中的化学药品和试剂从Sigma化学药品公司(St.Louis，MO)获得，限制性核酸内切酶从New England Biolabs(Beverly，MA)或Roche(Indianapolis，IN)获得，寡核苷酸由MWG Biotech Inc.(HighPoint，NC)合成，并且关于生化和分子生物测定的其它修饰酶或试剂盒来自Clontech(Palo Alto，CA)、Pharmacia Biotech(Piscataway，NJ)、Promega Corporation(Madison，WI)或Stratagene(La Jolla，CA)。用于细胞培养培养基的材料从Gibco/BRL(Gaithersburg，MD)或DIFCO(Detroit，MI)获得。出于本发明的目的进行克隆步骤，例如，按照Sambrook(1989)所述进行限制性切割、琼脂糖凝胶电泳、DNA片断的纯化、核酸转移至硝酸纤维素和尼龙膜、连接DNA片断、转化大肠杆菌细胞、生长细菌、增殖噬菌体以及重组DNA的序列分析。重组DNA分子的测序在Sanger方法(Sanger1977)之后使用ABI激光荧光DNA测序仪进行。

实施例1：转基因植物的产生

1.1转基因拟南芥植物的产生

为了产生转基因拟南芥植物，使用多种启动子::GUS载体构建体(见以下)转化根瘤农杆菌(菌株C58C1[pMP90])。接着使用产生的农杆菌菌株以获得转基因植物。为此目的，将分离的转化农杆菌菌落孵育在4ml培养基(培养基：YEB培养基含有50μg/ml卡那霉素和25μg/ml利福平)在28℃过夜。使用这一培养物接种400ml相同培养基的培养物并且过夜孵育(28℃，220转/分钟)。通过离心沉淀细菌(GSA-转子，8.000U/min，20min)并且以渗透培养基(1/2MS-培养基；0，5g/l MES，pH5，8；50g/l蔗糖)重悬沉淀。悬液被置于植物盒(Duchefa)并且加入100ml SILVET L-77(OsiSpecial-ties Inc.，Cat.P030196)至终浓度为0.02％。将带有8至12个植物的植物盒置于干燥仪在真空下10至15分钟，随后自发的通风(膨胀)。重复这一过程2-3次。其后，将全部植物转移至带有湿土的花盆并且生长在长日照条件(16h光照；室温22-24℃，夜晚温度19℃；65％相对湿度)。在6周之后收获种子。

1.2产生转基因亚麻子

例如通过Bell等人，1999，In Vitro Cell.Dev.Biol.-Plant.35(6)：456-465的方法使用颗粒轰击产生转基因的亚麻子植物。可以例如通过Mlynarova等人(1994)，Plant Cell Report13：282-285的方法产生农杆菌介导的转化。

1.3农杆菌介导的欧洲油菜的转化

可以通过子叶柄或下胚轴转化来转化油菜(Moloney1989；De Block1989)。使用的用于选择农杆菌的抗生素和植物由用于转化的双元载体和农杆菌菌株决定。通常使用卡那霉素作为可选择的植物标记进行油菜的选择。

更具体的，可以转化油菜如下：用目的质粒转化的农杆菌菌株在50mLYEB培养基于28℃生长过夜。将农杆菌溶液与液体共培养培养基(二倍浓度的MSB5盐(Duchefa)、30g/L蔗糖(Duchefa)、3.75mg/LlBAP(6-苄氨基嘌呤，Duchefa)、0.5g/L MES(Duchefa)、0.5mg/LGA3(赤霉酸，Duchefa)；pH5.2)混和，直至达到OD₆₅₀为0.5。切下生长在生长培养基B(MSB5盐(Duchefa)、3％蔗糖(Duchefa)、0.8％oxoidagar(Oxoid GmbH)；pH5.8)欧洲油菜栽培品种Westar的4天龄幼苗的叶柄。将叶柄在农杆菌溶液中浸渍2-3秒并且随后放入固体培养基用于共培养(共培养培养基补加1.6％的Oxoidagar)。共培养持续3天(于24℃和约50μMol/m²s光强)。随后将叶柄转移至共培养培养基，该培养基补加了合适的选择试剂(18mg/L卡那霉素(Duchefa)用于带有nptII抗性标记，包含nptII标记卡那霉素的植物；或0.3至30mM D-氨基酸，如下所述，用于包含来自Rhodotorulagracilis的dao1基因的表达盒的植物)和300mg/L Timentin(Duchefa)。

在选择培养基中于24℃孵育转化的叶柄四周。重复这一步骤直至出现枝条。将枝条转移至A6培养基(MS盐(Sigma Aldrich)、20g/L蔗糖、100mg/L肌醇(Duchefa)、40mg/L硫酸腺嘌呤(Sigma Aldrich)、500mg/L MES、0.0025mg/L BAP(Sigma)、5g/L oxoidagar(Oxoid GmbH)、150mg/Ltimetin(Duchefa)、0.1mg/L IBA(吲哚丁酸，Duchefa)；pH5.8)补加合适的选择试剂(18mg/L卡那霉素(Duchefa)用于带有nptII抗性标记，包含nptII标记卡那霉素的植物，或0.3至30mM D-氨基酸；如下所述)直至它们伸长。在A7培养基(A6培养基不含BAP)中培养伸长的枝条用于生根。将生根的植物转移至土壤并且生长在温室。

实施例2：用于组织特异性表达分析的植物的生长条件

为了获得4和7天龄的幼苗，约400个种子(拟南芥哥伦比亚生态型)使用80％(v/v)乙醇：水溶液灭菌2分钟，用次氯酸钠溶液(0.5％v/v)处理5分钟，用蒸馏水洗三次并且在4℃孵育4天以保证标准化的萌发。接着，将种子孵育在培养皿中，所述培养皿带有MS培养基(Sigma M5519)，补充了1％蔗糖、0.5g/l MES(Sigma M8652)、0.8％Difco-细菌培养用琼脂(Difco0140-01)，调节至pH5.7。该幼苗在16h光/8h黑暗循环(Philips58W/33白光)于22℃生长并且分别在4或7天之后收获。

为了获得根组织，如上述灭菌100个种子，在4℃孵育4天，并且转移至250ml培养瓶，该培养瓶带有MS培养基(Sigma M5519)，补充了额外的3％蔗糖和0.5g/lMES(Sigma M8652)，调节至pH5.7用于进一步生长。幼苗在16h光/8h黑暗循环(Philips58W/33白光)于22℃生长并且在3周之后于120转/分钟离心和收获。为了获得使用的全部其它植物器官，将种子播种在标准土壤(Type VM，Manna-Italia，Via S.Giacomo42，39050San Giacomo/Laives，Bolzano，Italien)，于4℃孵育4天以确保均一的萌发，并且随后生长在16h光/8h黑暗模式(OSRAM Lumi-lux日光36W/12)于22℃。在8-叶阶段(约3周之后)收获年轻的莲座叶，在8周之后，茎即将形成之前收获成熟的莲座叶。在长出枝条之后即刻收获长出枝条的茎的尖端。在发育阶段12，雄蕊发育之前收获茎、茎叶和花芽(Bowmann J(编辑)，Arabidopsis，Atlas of Morphology，Springer New York，1995)。在发育阶段14，雄蕊发育之后立即收获开放的花。在阶段15至16收获枯萎的花。用于分析的绿色和黄色枝条的长度为10至13mm。

在组织培养物中测试再生的转基因亚麻子和油菜籽植物的早期渗漏。

为了详细分析，在全部非种子组织中以及在种子发育的不同时期分析每单个或多个插入株系(每个构建体总共5-15株)的3个个体植物在T1至T3代有关候选启动子的潜在表达：

-成熟种子

-3天龄幼苗：根基、根尖、主根、侧根、其它根区域、子叶、下胚轴

-10天龄幼苗：根基、根尖、主根、侧根、其它根区域、子叶、下胚轴、初生叶、跟随叶

-17天龄幼苗：根基、根尖、主根、侧根、其它根区域、子叶、下胚轴、初生叶、跟随叶

-成熟植物：根、新叶、成熟叶、茎

-花0、1daf(开花后的天数)，3daf蒴果/长角果/果实，3daf种子/胚，6daf蒴果/长角果/果实，6daf种子/胚，9daf蒴果/长角果/果实，9daf种子/胚，12daf蒴果/长角果/果实，12daf种子/胚，15daf蒴果/长角果/果实，15daf种子/胚，18daf蒴果/长角果/果实，18daf种子/胚，21daf蒴果/长角果/果实，21daf种子/胚，24daf蒴果/长角果/果实，24daf种子/胚

-可选择的，来自例如：亚麻子蒴果和油菜籽长角果的胚是基于视觉参数从果实发育的不同阶段分离，并且分类为胚发育的下列阶段：早期、初期、中期、晚期和成熟期。

还经由喷洒在叶上的ABA检查生物和非生物胁迫对启动子的诱导性。

实施例3：表达谱的证明

为了证明和分析启动子的转录调节特性，将启动子或其片段有效连接至报告基因，所述报告基因可以同时用于定性和定量的监测其表达。优选使用细菌β-葡糖醛酸糖苷酶(Jefferson1987)。可以在相应的活性测定中使用生色底物，例如，5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸监测植物中的β-葡糖醛酸糖苷酶活性(Jefferson1987)。为了确定启动子活性和组织特异性，如所述(例如，

Figure S06806117420070828D00115124756QIETU

1991)将植物切片、包埋、染色和分析

为了定量β-葡糖醛酸糖苷酶活性分析，使用MUG(甲基伞形基葡糖苷酸)作为底物，其被转换为MU(甲基伞形酮)和葡糖醛酸。在碱性条件下，如所述(Bustos1989)，可以荧光定量的(发射在365nm，测量在455nm；SpectroFluorimeter Thermo Life Sciences Fluoroscan)监测这一转换。

实施例4：启动子片段的克隆

为了分离由SEQ ID NO：1、2、3、4、5、6、7、8、9、10和11所述的启动子片段，如所述(Galbiati2000)从拟南芥(哥伦比亚生态型)或欧洲油菜分离基因组DNA。使用分离的基因组DNA作为模板DNA用于聚合酶链式反应(PCR)介导的扩增，使用以下标明的寡核苷酸引物和方案(表3)。

表3：用于多种转录调节核苷酸序列的扩增的PCR寡核苷酸引物和用于修饰产生的PCR产物的限制酶。

SEQ ID	启动子	正向引物	反向引物	限制酶
					SEQ IDNO：1	AtPER-1683-Lo322	AtPER-1683-Lo322SEQ ID NO：24	AtPER-1683-Lo322SEQ ID NO：25	SalI/NdeI
SEQ IDNO：2	AtPER-1619-Lo322	AtPER-1619-Lo322SEQ ID NO：24	AtPER-1619-Lo322SEQ ID NO：26	SalI/HindII
					SEQ IDNO：3	AtPER-985-Lo322	AtPER-985-Lo322SEQ ID NO：27	AtPER-985-Lo322SEQ ID NO：28	SpeI/NdeI
SEQ IDNO：4	AtPER-921-Lo322	AtPER-921-Lo322SEQ ID NO:27	AtPER-921-Lo322SEQ IDNO：29	SpeI/NdeI
					SEQ IDNO：5	AtPER-1696-bac	AtPER-1696-bacSEQ ID NO：24	AtPER-1696-bacSEQ ID NO：25	SalI/NdeI
SEQ IDNO：6	AtPER-1632-bac	AtPER-1632-bacSEQ ID NO：24	AtPER-1632-bacSEQ ID NO：30	SalI/HindIII
					SEQ IDNO：7	AtPER-989-bac	AtPER-989-bacSEQ ID NO：27	AtPER-989-bacSEQ ID NO：31	SpeI/KpnI
SEQ 1DNO：8	AtPER-925-bac	Se AtPER-925-bacSEQ ID NO：27	Se AtPER-925-bacSEQ IDNO：32	SpeI/NdeI
					SEQ IDNO：9	LuPER-Lo383-1727bp	LuPER-Lo383SEQ ID NO：33	LuPER-Lo383SEQ ID NO：34	SalI/SpeI
SEQ IDNO：10	LuPER-933bp	LuPER-933bpSEQ ID NO：35	LuPER-933bpSEQ ID NO：34	SalI/SpeI
					SEQ IDNO：11	LuPER-458bp	LuPER-458bpSEQ ID NO：36	LuPER-458bpSEQ ID NO：34	SalI/SpeI

进行扩增如下：

100ng基因组DNA

1×PCR缓冲液

2.5mM MgCl₂，

200μM每种dATP、dCTP、dGTP和dTTP

10pmol的每种寡核苷酸引物

2.5单位Pfu DNA聚合酶(Stratagene)

在50μl终体积中。

使用下列温度程序用于各种扩增(BIORAD热循环仪).

1.95℃，5分钟

2.54℃，1分钟；接着72℃，5分钟；和95℃，30秒。重复25次。

3.54℃，1分钟；接着72℃，10分钟。

4.贮存于4℃。

产生的PCR-产物使用在上表(表3)指定的限制性核酸内切酶消化并且将其克隆进入载体pSUN0301(SEQ ID NO：147)(使用相同的酶预消化)上游且可操作的连接至葡糖醛酸糖苷酶(GUS)基因。将这些构建体的每种稳定转化进入拟南芥组织之后，分别通过组织化学和定量的GUS测定分析特异性和表达谱。

实施例5：多个启动子∷GUS构建体在稳定转化的拟南芥、油菜籽和亚麻子植物中的表达谱。

在拟南芥、油菜籽和亚麻子中研究来自拟南芥(pAtPer；SEQ ID NO：1、2、3、4、5、6、7和8)和亚麻(pLuPer；SEQ ID NO：9、10和11)的过氧化物氧还蛋白(PER1)启动子的葡糖醛酸糖苷酶(GUS)表达模式。

概括结果：在早期和初期胚中检测到弱至中强的GUS表达。在中期、晚期和成熟期胚中发现中等强度至强的GUS表达。未发现渗漏。

拟南芥中的特征：在胚的全部发育阶段检测到pAtPer和pLuPer启动子的强GUS表达。未发现渗漏。

油菜籽中的特征：在早期和初期胚中检测到弱的pAtPer启动子表达。在中期、晚期和成熟期种子中发现中等强度至强的表达。未发现渗漏。在早期、初期、中期、晚期和成熟期种子中发现中等强度至强的pLuPer启动子表达。未发现渗漏。

亚麻子中的特征在早期和初期亚麻胚中pAtPer和pLuPer启动子显示没有表达至弱的表达。在中期、晚期和成熟期种子中发现这些启动子的中等强度表达。未发现渗漏。

实施例7：过表达载体的构建和基因“敲除”实验

7.1过表达

用于在植物中目的“候选基因”全长表达(过表达)的载体被设计用于过表达目的蛋白质，并且是两个常用的类型，生物射弹和双元类型载体(由使用的植物转化方法决定)。

对于生物射弹转化(生物射弹载体)，需要如下：

1.带有细菌选择性标记(通常是抗生素抗性基因)和在大肠杆菌(大肠杆菌；例如，ColE1)中有复制功能的起点的骨架，和

2.由以下组成的植物特异性部分：

a.由启动子(例如，ZmUBIint MOD)、目的基因(通常是全长的cDNA)和转录终止子(例如，根瘤农杆菌nos终止子)组成的基因表达盒；

b.由合适的启动子、选择性标记基因(例如，D-氨基酸氧化酶；dao1)和转录终止子(例如，nos终止子)组成的植物选择性标记盒。

为根瘤农杆菌(根瘤农杆菌；双元载体)转化设计的载体，其由以下组成：

1.带有在大肠杆菌和根瘤农杆菌中都有功能的细菌选择标记(例如，由aadA基因介导的壮观霉素抗性)和在每种上述细菌宿主中有功能的两个复制起点以及根瘤农杆菌virG基因的骨架；

2.如以上生物射弹载体所述的植物特异性部分，除了在这一情况下该部分侧翼为根瘤农杆菌右和左边界序列，其介导由这两个序列侧翼的DNA转移至植物。

7.2基因沉默载体

设计用于减少或破坏单个基因或基因族或有关基因的表达的载体(基因沉默载体)也是相应于方法学用于下调基因表达的两个常用类型：反义或双链RNA干扰(dsRNAi)。

(a)反义

对于反义载体，可以在所述用于全长表达的相同载体中使用全长或部分的基因片段(通常，cDNA的部分)作为基因表达盒的部分。对于反义介导的基因表达的下调，基因的编码区或基因片段将位于与启动子相反的方向；因此，mRNA从植物中的非编码(反义)链制备。

(b)dsRNAi

对于dsRNAi载依，在基因表达盒中使用部分的基因片段(通常为，300至500个碱基对长)，并且同时以正义和反义方向表达，由间隔区(通常，植物内含子，例如，OsSH1内含子1或选择性标记，例如，赋予卡那霉素抗性)分开。这一类型的载体被设计形成双链mRNA茎，其由植物中两个互补基因片段的碱基配对产生。

设计用于过表达或敲除的生物射弹载体或双元载体可以以多种不同方式变化，包括例如，用于植物和细菌的选择性标记、用于基因表达的转录终止子和植物选择性标记盒，以及用于在目的基因或基因片段中克隆的方法(通常，常规的限制酶介导的或基于Gateway^TM重组酶的克隆)。

实施例8：启动子元件分析

使用Genomatix软件MatInspector Release professional7.3(August2004)进行启动子基序分析。来自亚麻(pLuPer；SEQ ID NO：9；1727bp)的过氧化物氧还蛋白(PER1)启动子包含带有不同启动子基序密度的三个区(见，图2；区A、B、C)。以下列表给出一些包含的启动子基序。位置表明在由SEQ ID NO：9所述序列中核苷酸位置。根据下列原则描述该基序：

●atagattaTTTAgaa-基序基质(完全的)

●attaTTTA-基序的保守区

●TTA-(粗体、大写字母)基序的核心区

●att-(粗体、小写字母)保守的启动子基序的部分，但是保守性低于核心区。

8.1A区(1-794bp；仅在SEQ ID NO：9)包含表征为种子特异性表达的多个启动子基序：

-甜马铃薯的DNA-结合蛋白质，其结合至sporamin和β-淀粉酶基因的SP8a(ACTGTGTA)和SP8b(TACTATT)序列

位置：178-186(正义链)；基序：agTACTctttga

-热休克元件。位置：223-235(正义链)；基序：agaggagacaAGAAa

-谷醇溶蛋白盒，在谷类种子贮存蛋白基因启动子中保守位置：266-281(正义链)；基序：gaagttgcAAAGttgag

-不透明2号。位置：316-330(反义链)；基序：CCATtccttgtagtact

-Storekeeper(STK)，对于块茎特异性和蔗糖可诱导的基因表达重要的植物特异性DNA结合蛋白质。

位置：621-628(反义链)；基序：TAAAtaatctat

-豆球蛋白盒，在豆球蛋白基因中TSS的上游约100bp高度保守的序列元件

位置：645-669(反义链)、655-679(反义链)。

基序：tccattgCTATccttgttagaaactaa

-ABA应答元件。位置：727-734(正义链)。基序：ttttacACGTacc

8.2B区(795-1269bp；包含于SEQ ID NO：9和10)包含相对低密度的种子特异性启动子基序而是更常见的或其它的基序。

-确定花分生组织和萼片以及花瓣发育的鉴定

位置：857-872(正义链)、917-931(反义链)；1013-1027(正义链)和在1134-1139(正义链)的相似的基序；基序：acaaaacaAAAAtgttaatat

-矮牵牛种间杂交的Myb类蛋白

位置：864-872(正义链)、801-809(反义链)；1178-1186(反义链)；1218-1226(正义链)；1268-1276(正义链)；基序：acaaaaatGTTAata

-SBF。位置：870-875(正义链)、898-903(反义链)、1179-1184(反义链)。基序：aaaaatgTTAAtatttt

-OCS类元件。位置：867-880(反义链)。基序：atatgaaaatattaACATttt

-隐花的，正常花发育所需，相似于SRF(人)和MCM(酵母)蛋白质

位置：919-930(正义链)；基序：aatTTCCatatttgtaggaaa

8.3C区(1270-1727bp；包含在SEQ IDS NO：9、10和11)(～SEQ.IDNO11)包含一些种子特异性启动子基序的聚簇：

-在种子特异性启动子中保守的RY和Sph基序

位置：1282-1287(反义链)、1522-1527(反义链)和1615-1620(正义链)；

基序：cccaagtaCATGcaaaatttaacggtt

-不透明2号。位置：1372-1386(反义链)、1608-1622(反义链)和1688-1696(正义链)。基序：TTATtataagtaaattg

-大豆胚因子4。位置：1386-1390(反义链)、1713-1717(正义链)；基序：atTTTTtatta

-OCS类元件。

位置：1446-159(正义链)；基序：aaatgtggtagcgtACGTgtg

-热休克元件。位置：1571-1583(反义链)；基序：tggcggctccAGAAt

-稻转录激活子-1(RITA)，碱性亮氨酸拉链蛋白，在种子发育中高表达。

位置：1584-1587(反义链)；基序：cttgcgtACGTggcggc

-稻bZIP蛋白8。

位置：1602-1608(反义链)、1583-1589(反义链)；基序：tgaagagaACGTggccctgag

-ABA应答元件。

位置：1598-1608(反义链)、1581-1589(反义链)、1452-1460(正义链)；基序：tgcatgaagagaACGTggccctgagtc

-在种子特异性启动子中保守的RY和Sph基序。

位置：-1615-1620(正义链)；基序：gttctcttCATGcaaggatagtagaac

-SEF3，大豆胚因子3。

位置：1641-1650(正义链)。基序：actccACCCacctcc

-不透明2号。位置：1688-1696(正义链)；基序：ctttcccatcCCATcca

-大豆胚因子4。位置：1713-1717(正义链)；基序：caTTTTtatca

参考文献

1.Abel et al.，Science，232：738(1986).

2.Altschul et al.，Nucleic Acids Res.，25：3389(1997).

3.Altschul et al.，J.Mol.Biol.，215：403(1990).

4.An et al.，EMBO J.，4：277(1985).

5.Auch & Reth，Nucleic Acids Research，18：6743(1990).

6.Ausubel et al.(1987)Current Protocols in Molecular Biology，GreenePublishing Assoc.and Wiley Interscience

7.Ballas et al.，Nucleic Acids Res.，17：7891(1989).

8.Barkai-Golan et al.，Arch.Microbiol.，116：119(1978).

9.Batzer et al.，Nucleic Acid Res.，19：5081(1991).

10.

Figure S06806117420070828D00122125513QIETU

et al.Mol Gen Genet225：121-128(1991)

11.Becker et al.(1994)Plant J.，5：299-307，

12.Bernal-Lugo and Leopold，Plant Physiol.，98：1207(1992).

13.Bevan et al.，Nature，304：184(1983).

14.Bevan et al.，Nucl.Acids Res.，11：369(1983).

15.Bevan，Nucl.Acids Res.，12：8711(1984).

16.Blackman et al.，Plant Physiol.，100：225(1992).

17.Blochlinger & Diggelmann，Mol CellBiol，4：2929(1984).

18.Bol et al.，Ann.Rev.Phytopath.，28：113(1990).

19.Bouchez et al.，EMBO J.，8Ｐ：4197(1989).

20.Bourouis et al.，EMBO J.，2：1099(1983).

21.Bowler et al.，Ann.Rev.Plant Physiol.，43：83(1992).

22.Branson and Guss，Proc.North Central Branch EntomologicalSociety of America(1972).

23.Broakgert et al.，Science，245：110(1989).

24.Bustos MM et al.(1989)Plant Gell1：839-853

25.Byrne et al.Plant Cell Tissue and Organ Culture，8：3(1987).

26.Callis et al.，Genes and Develop.，1：1183(1987).

27.Campbell and Gowri，Plant Physiol.，92：1(1990).

28.Campbell，W.C.，ed.Ivermectin and Abamectin，Springer-Verlag，New York，1989.

29.Chee et al.Plant Physiol.，91：1212(1989).

30.Chen and Winans(1991)J.Bacteriol.173：1139-1144

31.Christou et al.Proc.Natl.Acad.Sci USA，86：7500(1989).

32.Christou et al.，Biotechnology，9：957(1991).

33.Christou et al.，Plant Physiol.，87：671(1988).

34.Chui et al.(1996)Curr Biol6：325-330

35.Coe et al.，In：Corn and Corn Improvement，Sprague et al.(eds.)pp·81-258(1988).

36.Corpet et al.Nucleic Acids Res.，16：10881(1988).

37.Coxson et al.，Biotropica，24：121(1992).

38.Crameri et al.，Nature Biotech.，15：436(1997).

39.Crameri et al.，Nature，391：288(1998).

40.Crossway et al.，BioTechniques，4：320(1986).

41.Cuozzo et al.，Bio/Technology，6：549(1988).

42.Cutler et al.，J.Plant Physiol.，135：351(1989).

43.Czapla and Lang，J.Econ.Entomol.，83：2480(1990).

44.Datta et al.，Bio/Technology，8：736(1990).

45.Davies et al.，Plant Physiol.，93：588(1990).

46.Dayhoff et al.，Atlas of Protein Seq uence and Structure，Natl.Biomed.Res.Found.，Washington，C.D.(1978).

47.De Blaere et al.，Meth.Enzymol.，143：277(1987).

48.De Block et al.Plant Physiol.，91：694(1989).

49.De Block et al.，EMBO Journal，6：2513(1987).

50.Deblaere et al.Nucl Acids Res13：4777-4788(1985)

51.Della-Cioppa et al.Bio/Technology5：579-584(1987)

52.Della-Cioppa et al.，Plant Physiology，84：965-968(1987).

53.Dellaporta et al.，in Chromosome Structure and Function，PlehumPress，263-282(1988).

54.Depicker et al.，Plant CellReports，7：63(1988).

55.Dunn et al.，Can.J.Plant Sci.，61：583(1981).

56.Dure et al.，Plant Mol.Biol.，12：475(1989).

57.Ebinuma et al.Proc Natl Acad Sci USA94：2117-2121(2000a)

58.Ebinuma et al.Selection of Marker-free transgenic plants using theoncogenes(iqt，rolA，B，C)of Agrobacterium as selectable markers，In Molecular Biology of Woody Plants.Kluwer AcademicPublishers(2000b)

59.Eichholtz et al.Somatic Cell and Molecular Genetics13，67-76(1987)

60.Ellis et al.，EMBO Journal，6：3203(1987).

61.Elroy-Stein et al.，Proc.Natl.Acad.Sci.U.S.A.，86：6126(1989).

62.English et al.，Plant Cell，8：179(1996).

63.Erdmann et al.，J.Gen.Microbiol.，138：363(1992).

64.Erikson et al.Nat Biotechnol.22(4)：455-8(2004)

65.Everett et al.，Bio/Technology，5：1201(1987).

66.Fedoroff NV&Smith DL Plant J 3：273-289(1993)

67.Fire A et al Nature391：806-811(1998)

68.Fitzpatrick，Gen.Engineering News，22：7(1993).

69.Fraley et al.Proc Natl Acad Sci USA80：4803(1983)

70.Fromm et al.，Bio/Technology，8：833(1990).

71.Fromm et al.，Nature(London)，319：791(1986).

72.Galbiati et al.Funct.Integr Genozides2000，201：25-34

73.Gallie et al.Nucl Acids Res15：8693-8711(1987)

74.Gallie et al.，Nucleic Acids Res.，15：3257(1987).

75.Gallie et al.，The Plant Cell，1：301(1989).

76.Gan et al.，Science，270：1986(1995).

77.Gatehouse et al.，J.Sci.Food Agric.，35：373(1984).

78.Gelfand，eds.，PCR Strategies Academic Press，New York(1995).

79.Gelvin et al.，Plant Molecular Biology Manual，(1990).

80.Gleave et al.Plant Mol Biol.40(2)：223-35(1999)

81.Gordon-Kamm et al.，Plant Cell，2：603(1990).

82.Goring et al，PNAS，88：1770(1991).

83.Gruber，et al.，Vectors for Plant Transformation，in：Methods inPlant Molecular Biology&Biotechnology″in Glich et al.，(Eds.pp.89-119，CRC Press，1993).

84.Guerineau et al.，Mol.Gen.Genet.，262：141(1991).

85.Guerrero et al.，Plant Mol.Biol.，15：11(1990).

86.Gupta et al.，PNAS，90：1629(1993).

87.Haines and Higgins(eds.)，Nucleic Acid Hybridization，IRL Press，Oxford，U.K.

88.Hajdukiewicz et al.Plant Mol Biol25：989-994(1994)

89.Hammock et al.，Nature，344：458(1990).

90.Hansen et al.Proc.Natl.Acad.Sci.USA91：7603-7607(1994)

91.Hayford et al.Plant Physiol.86：1216(1988)

92.Hemenway et al.，EMBO Journal，7：1273(1988).

93.Henikoff & Henikoff，Proc.Natl.Acad.Sci.USA，89：10915(1989).

94.Hiei et al.Plant J6：271-282(1994)

95.Higgins et al.，Gene，73：237(1988).

96.Higo et al.(1999)Nucl Acids Res27(1)：297-300

97.Hilder et al.，Nature，330：160(1987).

98.Hille et al.Plant Mol.Biol.7：171(1986)

99.Hinchee et al.Bio/Technology6：915(1988).

100.Hoekema et al.(1983)Nature303：179-181

101.Hoekema，In：The Binary Plant Vector System.Offset-drukkerijKanters B.V.；Alblasserdam(1985).

102.Hood et al.J Bacteriol168：1291-1301(1986)

103.Huang et al.，CABIOS，8：155(1992).

104.Ikeda et al.，J.Bacteriol.，169：5612(1987).

105.Ikuta et al.，Biotech.，8：241(1990).

106.Ingelbrecht et al.，Plant Cell，1：671(1989).

107.Innis and Gelfand，eds.，PCR Methods Manual(Academic Press，New York)(1999).

108.Inniset al.，eds.，PCR Protocols：A Guide to Methods andApplications(Academic Press，New York(1995).

109.Innis et al.，PCR Protocols：A Guide to Methods and Applications，Academic Press，Inc.，San Diego，Calif.(1990).

110.Ishida Y et al.Nature Biotech745-750(1996)

111.Jefferson et al.EMBO J6：3901-3907(1987)

112.Jefferson et al.Plant Mol Biol Rep5：387-405(1987)

113.Jenes B et al.Techniques for Gene Transfer，in：Recombinant Plants，Vol.1，Engineering and Utilization，edited by SD Kung and R Wu，Academic Press，pp.128-143(1993)

114.Jobling et al.，Nature，325：622(1987).

115.Johnson et al.，PNAS USA，86：9871(1989)

116.Jones et al.Mol.Gen.Genet.，210：86(1987)

117.Joshi et al.，Nucleic Acid Res.，15：9627(1987).

118.Kaasen et al.，J.Bacteriol.，174：889(1992).

119.Karlin and Altschul，Proc.Natl.Acad Sci.USA，87：2264(1990).

120.Karlin and Altschul，Proc.Natl.Acad.Sci.USA，90：5873(1993).

121.Karsten et al.，Botanica Marina，35：11(1992).

122.Katz et al.，J.Gen.Microbiol.，129：2703(1983).

123.Keller et al.，EMBO Journal，8：1309(1989).

124.Keller et al.，Genes Dev.，3：1639(1989).(Eine der beiden《Keller》Referenzen ist zuviel)

125.Klapwijk et al.J.Bacteriol.，141,128-136(1980)

126.Klein et al.，Bio/Technoloy，6：559(1988).

127.Klein et al.，Plant Physiol.，91：440(1988).

128.Klein et al.，Proc.Natl.Acad.Sci.USA，85：4305(1988).

129.Knauf，et al.，Genetic Analysis ofHost Range Expression byAgrobacteriumIn：Molecular Genetics of the Bacteria-PlantInteraction，Puhler，A.ed.，Springer-Verlag，New York，1983.

130.Koncz&SchellMol Gen Genet204：383-396(1986)

131.Koprek T et al.Plant J19(6)：719-726(1999)

132.Koster and Leopold，Plant Physiol.，88：829(1988).

133.Koziel et al.，Biotechnology，11：194(1993).

134.Kunkel et al.，Methods in Enzymol.，154：367(1987).

135.Kunkel，Proc.Natl.Acad.Sci.USA，82：488(1985).

136.Lam E und Chua NH，J Biol Chem；266(26)：17131-17135(1991)

137.Laufs et al.，PNAS，87：7752(1990).

138.Lawton et al.，Mol.CellBiol.，7：335(1987).

139.Lee and Saier，J.Bacteriol.，153(1982).

140.Leffel et al.Biotechniques23(5)：912-8(1997)

141.Lescot et al.Nucleic Acids Res30(1)：325-7(2002)

142.Levings，Science，250：942(1990).

143.Li et al.Plant Mol Biol20：1037-1048(1992)

144.Lindsey et al.，Transgenic Research，2：3347(1993).

145.Liu et al.，.Plant J.8，457-463(1995)

146.Lommel et al.，Virology，181：382(1991).

147.Loomis et al.，J.Expt.Zool.，252：9(1989).

148.Lorz et al.，Mol.Gen.Genet.，199：178(1985).

149.Ma et al.，Nature，334：631(1988).

150.Macejak et al.，Nature，353：90(1991).

151.Maki et al.，Methods in Plant Molecular Biology&Biotechnology，Glich et al.，67-88CRC Press，(1993).

152.Maniatis T，Fritsch EF，and Sambrook J Molecular Cloning：ALaboratory Manual，Cold Spring Harbor Laboratory，Cold SpringHarbor(NY)，(1989)

153.Mariani et al，Nature，347：737(1990).

154.Matzke et al.(2000)Plant Mol Biol43：401-415；

155.McBride et al.，PNAS USA，91：7301(1994).

156.McCabe et al.，Bio/Technology，6：923(1988).

157.Meinkoth and Wahl，Anal.Biochem.，138：267(1984).

158.Messing and Vierra，Gene，19：259(1982).

159.Michael et al.，J.Mol.Biol.，26：585(1990).(im Text steht：Michaelet al.1994)

160.Millar et al.Plant Mol Biol Rep10：324-414(1992)

161.Mogen et al.，Plant Cell，2:1261(1990).

162.Moore et al.，J.Mol.Biol.，272：336(1997).

163.Mozo & Hooykaas Plant Mol.Biol.16：917-918(1991)

164.Mundy and Chua，EMBO J.，7：2279(1988).

165.Munroe et al.，Gene，91：151(1990).

166.Murakami et al.，Mol.Gen.Genet.，205：42(1986).

167.Murata et al.，FEBS Lett.，296：187(1992).

168.Murdock et al.，Phytochemistry，29：85(1990).

169.Murray et al.，Nucleic Acids Res.，17：477(1989).

170.Myers and Miller，CABIOS，4：11(1988).

171.Naested H Plant J18：571-576(1999)

172.Napoli et al.，Plant Cell，2：279(1990).

173.Needleman and Wunsch，J.Mol.Biol.，48：443-453(1970).

174.Nehra et al.Plant J.5：285-297(1994)

175.Niedz et al.，Plant CellReports，14：403(1995).

176.Odellet al.，Mol.Gen.Genet.，113：369(1990).

177.Odellet al.，Nature，313：810(1985).

178.Ohtsuka et al.，J.Biol.Chem.，260：2605(1985)

179.Olhoft et al.Plant CellRep20：706-711(2001)

180.Ow et al.，Science，234：856(1986).

181.Pacciotti et al.，Bio/Technology，3：241(1985).

182.Park et al.，J.Plant Biol.，38：365(1985).

183.Paszkowski et al.，EMBO J.，3：2717(1984).

184.Pearson and Lipman，Proc.Natl.Acad.Sci.，85：2444(1988).

185.Pearson et al.，Meth.Mol.Biol.，24：307(1994).

186.Perera RJ et al.Plant Mol.Biol23(4)：793-799(1993)

187.Perlak et al.，Proc.Natl.Acad.Sci.USA，88：3324(1991).

188.Phillips et al.，In Corn & Corn Improvement，3rd Edition10Sprague et al.(Eds.Pp.345-387)(1988).

189.Phi-Van et al.，Mol.Cell.Biol.，10：2302(1990).

190.Piatkowski et al.，Plant Physiol.，94：1682(1990).

191.Potrykus et al.，Mol.Gen.Genet.，199：183(1985).

192.Potrykus，Trends Biotech.，7：269(1989).

193.Prasher et al.，Biochem.Biophys.Res.Comm.，126：1259(1985).

194.Proudfoot，Cell，64：671(1991).

195.Reed et al.，J.Gen.Microbiol.，130：1(1984).

196.Riggs et al.，Proc.Natl.Acad.Sci.USA，83：5602(1986).

197.Rossolini et al.，Mol.Cell.Probes，8：91(1994).

198.Ruiz，Plant Cell，10：937(1998).

199.Sambrook et al.，Molecular Cloning：A Laboratory Manual(2d ed.，Cold Spring Harbor Laboratory Press，Plainview，N.Y.)(1989).

200.Sanfacon et al.，Genes Dev.，5：141(1991).

201.Sanford et al.，Particulate Science and TechnologY，5：27(1987).

202.Scheeren-Groot et al.J.Bacteriol176：6418-6426(1994)

203.Schenborn and Groskreutz Mol Biotechnol13(1)：29-44(1999)

204.Schlaman and Hooykaas Plant J11：1377-1385(1997)

205.Schoffl F et al.(1989)Mol Gen Genetics217(2-3)：246-53

206.Shagan et al.，Plant Physiol.，101：1397(1993).

207.Shah et al.Science233：478(1986)

208.Shapiro，Mobile Genetic Elements，Academic Press，N.Y.(1983).

209.Shimamoto et al.，Nature，338：274(1989).

210.Silhavy TJ，Berman ML，and Enquist LW Experiments with GeneFusions，Cold Spring Harbor Laboratory Press，Cold SpringHarbor(NY)，(1984)

211.Skuzeski et al.，Plant Molec.Biol.15：65-79(1990).

212.Smith et al.，Adv.Appl.Math.，2：482.(1981).

213.Smith et al.，Mol.Gen.Genet.，224：447(1990).

214.Spencer et al.，Theor.Appl.Genet，79：625(1990).Spencer1992Referenz fehlt

215.Stalker et al.，Science，242：419(1988).

216.Staub et al.，EMBO J.，12：601(1993).

217.Staub et al.，Plant Cell，4：39(1992).

218.Steifel et al.，The Plant Cell，2：785(1990).

219.Stemmer，Nature，370：389(1994).

220.Stemmer，Proc.Natl.Acad.Sci.USA，91：10747(1994).

221.Stief et al.，Nature，341：343(1989).

222.Stougaard Plant J3：755-761(1993)

223.Sukhapinda et al.，Plant Mol.Biol.，8：209(1987).

224.Sundaresan et al.Gene Develop9：1797-1810(1995)

225.Sutcliffe，PNAS USA，75：3737(1978).

226.Svab et al.，Plant Mol.Biol.14：197(1990)

227.Svab et al.，Proc.Natl.Acad.Sci.USA，87：8526(1990).

228.Svab et al.，Proc.Natl.Acad.Sci.USA，90：913(1993).

229.Tarczynski et al.，PNAS USA，89：2600(1992).

230.Thillet et al.，J.Biol.Chem.，263：12500(1988).

231.Tij ssen，Laboratory Techniq ues in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes，Elsevier，N.Y.(1993).

232.Tomes et al.，Plant Cell，Tissue and Organ Culture：FundamentalMethods，Springer Verlag，Berlin(1995).

233.Tomic et al.，NAR，12：1656(1990).

234.Thompson JD et al.，NAR22(22)：4673-4680(1994).

235.Turner et al.，Molecular Biotechnology，3：225(1995).

236.Twell et al.，Plant Physiol.，91：1270(1989).

237.Ugaki et al.，Nucl.Acids Res.，19：371(1991).

238.Ulmasov et al.，Plant Mol.Biol.，35：417(1997).

239.Upender et al.，Biotechniques，18：29(1995).

240.van der Krol et al.，Plant Cell，2：291(1990).

241.Vanden Elzen et al.Plant Mol Biol.5：299(1985)

242.Vasil et al.Bio/Technology，10：667-674(1992)

243.Vasil et al.Bio/Technology，11：1153-1158(1993)

244.Vasil et al.，Mol.Microbiol.，3：371(1989).

245.Vasil et al.，Plant Physiol.，91：1575(1989).

246.Vernon and Bohnert，EMBO J.，11：2077(1992).

247.Walker and Gaastra，eds.，Techniques in Molecular Biology，MacMillan Publishing Company，New York(1983).

248.Wan & Lemaux(1994)Plant Physiol.，104：3748

249.Wang et al.，Mol.Cell.Biol.，12：3399(1992).

250.Waterman，M.S.Introduction to Computational Biology：Maps，sequences and genomes.Chapman & Hall.London(1995).

251.Watrudet al.，in Engineered Organismsand the Environment(1985).

252.Watson et al.J.Bacteriol123，255-264(1975)

253.Watson et al.，Corn：Chemistry and Technology(1987).

254.Weeks et al.Plant Physiol102：1077-1084(1993)

255.Weissinger et al.，Annual Rev.Genet.，22：421(1988).

256.White et al，Nucl Acids Res，18，1062(1990).

257.Wingender E et al.Nucleic Acids Res29(1)：281-3(2001)

258.Wolter et al.，EMBO Journal，11：4685(1992).

259.Wyn-Jones and Storey，Physiology and Biochemistry of DroughtResistance in Plants，Paleg et al.(eds.)，pp.171-204(1981).

260.Yamaguchi-Shinozaki et al.，Plant Cell Physiol.，33：217(1992).

261.Zhang et al.，Proc.Natl.Acad.Sci.USA，94：4504(1997).

262.Zukowsky et al.，PNAS USA，80：1101(1983).

全部出版物、专利和专利申请在此被引入作为参考。尽管在前述说明书中，本发明关于其某些优选的实施方案已被描述，并且已经提出许多细节用于说明，对于本领域技术人员而言，很明显，本发明容许另外的实施方案，并且这里描述的某些细节可以相应的变化而不背离本发明的基本原则。

序列表

<110>巴斯福植物科学有限公司

<120>用于植物中种子偏好性表达的表达盒

<130>AE20050148/PF56382-AT

<160>127

<170>PatentIn version 3.3

<210>1

<211>1683

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>启动子

<222>(1)..(1683)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)包含5’非翻译区的转录调节核苷酸序列

<220>

<221>misc_feature

<222>(1503)..(1508)

<223>在种子特异性启动子中保守的RY和Sph基序(正义链)ctcttttgCATGcacctcaatttgaac

<220>

<221>TATA_信号

<222>(1586)..(1593)

<223>推测的TATA盒

<220>

<221>5’UTR

<222>(1620)..(1683)

<223>推测的5’-非翻译区

<400>1

gccacatcat gtttagactt atctccataa agaaaaccac tcatcaaagc taatacaaaa 60

gctctagtgt gacacttcaa cgtcacttca tcaggatcag caggtaaatt ccgaaaattc 120

tcacgcagcc acgctaagga cacatgagaa ccatgaagat ccttgggacc tggcctatga 180

ccaagcaaat cctcacataa atcagcccag ttgtattttg tactaccagt tactgcaggt 240

ccatcgacac gtagacccaa caaaatattc acatcttgta aagtcacagt gatctctcca 300

gcaggaagat gaaaagtatg cgtttcgggt ctccatctct ccaccaaagc tgttatcaga 360

gcataatcaa gttgtataaa ggcaaccttg taaactccat atagaccaaa ctctatcaac 420

ttttgacaca cgagaggatc cagaggccaa tctcgcatcc ccaataactt gtgccgacat 480

gtcagttcac gaggaggaac ctgaatgtga agtataacgg taaaaaggaa ataattaaaa 540

caacggaagc aaaacaagaa acaagatgaa atgagaaact agtaacacac ctcatcttcc 600

catatagcag ctgatctatg ctcatgttgc cacaccaata tagattgatc aactggacca 660

ggatccaaat caaagtttaa tagactttgc acctccatct atataatata tcacaggaca 720

ataaacacaa tgatcagtga ttatacaaca tcaaagaaaa cttgtaattc tgggaatata 780

actgagaaat gagaattaaa gattcataat ttgaacacaa gaaatcctaa actggtacga 840

aagaaaaatt gctcaacaaa aaaatcaagc taattactcg tatacaaaga cacgaagaac 900

taatacaaga aacaagaaac aacaaaccac aaagagattg aaccaatcca aattcgacaa 960

cataaaccaa gtgtgtgggt gattggaatc agaggacgta ccaaagaaaa gcgtccgtga 1020

tcaacaaaaa ccaaaaagag acgtttgaaa taaaccagag gaagacgaag aataattaag 1080

caaagagaag cgttaagcgg gagcgagaaa ggaaacgaga gaaagagaga gcttccagat 1140

ccgacagaag ttttcggctt cttctttttc gtttaagaac ttctgatcct cctaggtctg 1200

tccgaagaac taatcttttt gaggtaacga cgccgttttt ctcaaaacat gggcccatta 1260

accatagtct cggcccaaac gaaacttaat acgacaatgt ttgggtgtaa acgcaaagat 1320

tttgtcgatt atcacaagta aaaaaataaa tacaaacact tgagtctctc tagacatcgt 1380

gcgtcgcctt agctttaagt tttttctcga aacaaaagag ttattttatt tgaactttga 1440

agattatacg aagacacgtg gcgtgaaccc aattcataac aacgccacgc tatactcttt 1500

tgcatgcacc tcaatttgaa catcatcaag tctctctctc tctttttctg actttgatcc 1560

acgaacctaa ccagcttgcg atctctattt aatcggtcct cgacgcaact tcaacttcta 1620

ctacatccat tcacatcaaa tcaatacaga aagttttttc tatatataaa tataaaaggt 1680

aaa 1683

<210>2

<211>1619

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(1619)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)的转录调节核苷酸序列

<220>

<221>TATA_信号

<222>(1586)..(1593)

<223>推测的TATA盒

<400>2

gccacatcat gtttagactt atctccataa agaaaaccac tcatcaaagc taatacaaaa 60

gctctagtgt gacacttcaa cgtcacttca tcaggatcag caggtaaatt ccgaaaattc 120

tcacgcagcc acgctaagga cacatgagaa ccatgaagat ccttgggacc tggcctatga 180

ccaagcaaat cctcacataa atcagcccag ttgtattttg tactaccagt tactgcaggt 240

ccatcgacac gtagacccaa caaaatattc acatcttgta aagtcacagt gatctctcca 300

gcaggaagat gaaaagtatg cgtttcgggt ctccatctct ccaccaaagc tgttatcaga 360

gcataatcaa gttgtataaa ggcaaccttg taaactccat atagaccaaa ctctatcaac 420

ttttgacaca cgagaggatc cagaggccaa tctcgcatcc ccaataactt gtgccgacat 480

gtcagttcac gaggaggaac ctgaatgtga agtataacgg taaaaaggaa ataattaaaa 540

caacggaagc aaaacaagaa acaagatgaa atgagaaact agtaacacac ctcatcttcc 600

catatagcag ctgatctatg ctcatgttgc cacaccaata tagattgatc aactggacca 660

ggatccaaat caaagtttaa tagactttgc acctccatct atataatata tcacaggaca 720

ataaacacaa tgatcagtga ttatacaaca tcaaagaaaa cttgtaattc tgggaatata 780

actgagaaat gagaattaaa gattcataat ttgaacacaa gaaatcctaa actggtacga 840

aagaaaaatt gctcaacaaa aaaatcaagc taattactcg tatacaaaga cacgaagaac 900

taatacaaga aacaagaaac aacaaaccac aaagagattg aaccaatcca aattcgacaa 960

cataaaccaa gtgtgtgggt gattggaatc agaggacgta ccaaagaaaa gcgtccgtga 1020

tcaacaaaaa ccaaaaagag acgtttgaaa taaaccagag gaagacgaag aataattaag 1080

caaagagaag cgttaagcgg gagcgagaaa ggaaacgaga gaaagagaga gcttccagat 1140

ccgacagaag ttttcggctt cttctttttc gtttaagaac ttctgatcct cctaggtctg 1200

tccgaagaac taatcttttt gaggtaacga cgccgttttt ctcaaaacat gggcccatta 1260

accatagtct cggcccaaac gaaacttaat acgacaatgt ttgggtgtaa acgcaaagat 1320

tttgtcgatt atcacaagta aaaaaataaa tacaaacact tgagtctctc tagacatcgt 1380

gcgtcgcctt agctttaagt tttttctcga aacaaaagag ttattttatt tgaactttga 1440

agattatacg aagacacgtg gcgtgaaccc aattcataac aacgccacgc tatactcttt 1500

tgcatgcacc tcaatttgaa catcatcaag tctctctctc tctttttctg actttgatcc 1560

acgaacctaa ccagcttgcg atctctattt aatcggtcct cgacgcaact tcaacttct 1619

<210>3

<211>985

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(985)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)包含5’非翻译区的转录调节核苷酸序列(推测的

核心启动子区)

<220>

<221>TATA_信号

<222>(888)..(895)

<223>推测的TATA盒

<220>

<221>5’UTR

<222>(922)..(985)

<223>推测的5’-非翻译区

<400>3

ctatataata tatcacagga caataaacac aatgatcagt gattatacaa catcaaagaa 60

aacttgtaat tctgggaata taactgagaa atgagaatta aagattcata atttgaacac 120

aagaaatcct aaactggtac gaaagaaaaa ttgctcaaca aaaaaatcaa gctaattact 180

cgtatacaaa gacacgaaga actaatacaa gaaacaagaa acaacaaacc acaaagagat 240

tgaaccaatc caaattcgac aacataaacc aagtgtgtgg gtgattggaa tcagaggacg 300

taccaaagaa aagcgtccgt gatcaacaaa aaccaaaaag agacgtttga aataaaccag 360

aggaagacga agaataatta agcaaagaga agcgttaagc gggagcgaga aaggaaacga 420

gagaaagaga gagcttccag atccgacaga agttttcggc ttcttctttt tcgtttaaga 480

acttctgatc ctcctaggtc tgtccgaaga actaatcttt ttgaggtaac gacgccgttt 540

ttctcaaaac atgggcccat taaccatagt ctcggcccaa acgaaactta atacgacaat 600

gtttgggtgt aaacgcaaag attttgtcga ttatcacaag taaaaaaata aatacaaaca 660

cttgagtctc tctagacatc gtgcgtcgcc ttagctttaa gttttttctc gaaacaaaag 720

agttatttta tttgaacttt gaagattata cgaagacacg tggcgtgaac ccaattcata 780

acaacgccac gctatactct tttgcatgca cctcaatttg aacatcatca agtctctctc 840

tctctttttc tgactttgat ccacgaacct aaccagcttg cgatctctat ttaatcggtc 900

ctcgacgcaa cttcaacttc tactacatcc attcacatca aatcaataca gaaagttttt 960

tctatatata aatataaaag gtaaa 985

<210>4

<211>921

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(921)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)的转录调节核苷酸序列(推测的核心启动子区)

<220>

<221>TATA_信号

<222>(888)..(895)

<223>推测的TATA盒

<400>4

ctatataata tatcacagga caataaacac aatgatcagt gattatacaa catcaaagaa 60

aacttgtaat tctgggaata taactgagaa atgagaatta aagattcata atttgaacac 120

aagaaatcct aaactggtac gaaagaaaaa ttgctcaaca aaaaaatcaa gctaattact 180

cgtatacaaa gacacgaaga actaatacaa gaaacaagaa acaacaaacc acaaagagat 240

tgaaccaatc caaattcgac aacataaacc aagtgtgtgg gtgattggaa tcagaggacg 300

taccaaagaa aagcgtccgt gatcaacaaa aaccaaaaag agacgtttga aataaaccag 360

aggaagacga agaataatta agcaaagaga agcgttaagc gggagcgaga aaggaaacga 420

gagaaagaga gagcttccag atccgacaga agttttcggc ttcttctttt tcgtttaaga 480

acttctgatc ctcctaggtc tgtccgaaga actaatcttt ttgaggtaac gacgccgttt 540

ttctcaaaac atgggcccat taaccatagt ctcggcccaa acgaaactta atacgacaat 600

gtttgggtgt aaacgcaaag attttgtcga ttatcacaag taaaaaaata aatacaaaca 660

cttgagtctc tctagacatc gtgcgtcgcc ttagctttaa gttttttctc gaaacaaaag 720

agttatttta tttgaacttt gaagattata cgaagacacg tggcgtgaac ccaattcata 780

acaacgccac gctatactct tttgcatgca cctcaatttg aacatcatca agtctctctc 840

tctctttttc tgactttgat ccacgaacct aaccagcttg cgatctctat ttaatcggtc 900

ctcgacgcaa cttcaacttc t 921

<210>5

<211>1696

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(1696)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)包含5’非翻译区的转录调节核苷酸序列(衍生物)

<220>

<221>TATA_信号

<222>(1595)..(1602)

<223>推测的TATA盒

<220>

<221>5’UTR

<222>(1633)..(1696)

<223>推测的5’-非翻译区

<400>5

gccacatcat gtttagactt atctccataa agaaaaccac tcatcaaagc taatacaaaa 60

gctctagtgt gacacttcaa cgtcacttca tcaggatcag caggtaaatt ccgaaaattc 120

tcacgcagcc acgctaagga cacatgagaa ccatgaagat ccttgggacc tggcctatga 180

ccaagcaaat cctcacataa atcagcccag ttgtattttg tactaccagt tactgcaggt 240

ccatcgacac gtagacccaa caaaatattc acatcttgta aagtcacagt gatctctcca 300

gcaggaagat gaaaagtatg cgtttcgggt ctccatctct ccaccaaagc tgttatcaga 360

gcataatcaa gttgtataaa ggcaaccttg taaactccat atagaccaaa ctctatcaac 420

ttttgacaca cgagaggatc cagaggccaa tctcgcatcc ccaataactt gtgccgacat 480

gtcagttcac gaggaggaac ctgaatgtga agtataacgg taaaaaggaa atatatatta 540

aaacaacgga agcaaaacaa gaaacaagat gaaatgagaa actagtaaca cacctcataa 600

tcttcccata tagcagctga tctatgctca tgttgccaca ccaatataga ttgatcaacc 660

attggaccag gatccaaatc aaagtttaat agactttgca cctccatcta tataatatat 720

cacaggacaa taaacacaat gatcagtgat tatacaacat caaagaaaac ttgtaattct 780

gggaatataa ctgagaaatg agaattaaag attcataatt tgaacacaag aaatcctaaa 840

ctggtacgaa agaaaaattg ctcaacaaaa aaatcaagct aattactcgt atacaaagac 900

acgaagaact aatacaagaa acaagaaaca acaaaccaca aagagattga accaatccaa 960

attcgacaac ataaaccaag tgtgtgggtg attggaatca gaggacgtac caaagaaaag 1020

cgtccgtgat caacaaaaac caaaaagaga cgtttgaaat aaaccagagg aagacgaaga 1080

ataattaagc aaagagaagc gttaagcggg agcgagaaag gaaacgagag aaagagagag 1140

cttccagatc cgacagaagt tttcggcttc ttctttttcg tttaagaact tctgatcctc 1200

ctaggtctgt ccgaagaact aatctttttg aggtaacgac gccgtttttc tcaaaacatg 1260

ggcccattaa ccatagtctc ggcccaaacg aaacttaata cgacaatgtt tgggtgtaaa 1320

cgcaaagatt ttgtcgatta tcacaagtaa aaaaataaat acaaacactt gagtctctct 1380

agacatcgtg cgtcgcctta gctttaagtt ttttctcgaa acaaaagagt tattttattt 1440

gaactttgaa gattatacga agacacgtgg cgtgaaccca attcataaca acgccacgct 1500

atactctttt gcatgcacct caatttgaac atcatcaagt ctctctctct ctttttctga 1560

ctttgatcca cgaacctaac cagcttgcga tctctattta atcggtcctc gacgcaactt 1620

catataactt ctactacatc cattcacatc aaatcaatac agaaagtttt ttctatatat 1680

aaatataaaa ggtaaa 1696

<210>6

<211>1632

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(1632)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)的转录调节核苷酸序列(衍生物)

<220>

<221>TATA_信号

<222>(1595)..(1602)

<223>推测的TATA盒

<400>6

gccacatcat gtttagactt atctccataa agaaaaccac tcatcaaagc taatacaaaa 60

gctctagtgt gacacttcaa cgtcacttca tcaggatcag caggtaaatt ccgaaaattc 120

tcacgcagcc acgctaagga cacatgagaa ccatgaagat ccttgggacc tggcctatga 180

ccaagcaaat cctcacataa atcagcccag ttgtattttg tactaccagt tactgcaggt 240

ccatcgacac gtagacccaa caaaatattc acatcttgta aagtcacagt gatctctcca 300

gcaggaagat gaaaagtatg cgtttcgggt ctccatctct ccaccaaagc tgttatcaga 360

gcataatcaa gttgtataaa ggcaaccttg taaactccat atagaccaaa ctctatcaac 420

ttttgacaca cgagaggatc cagaggccaa tctcgcatcc ccaataactt gtgccgacat 480

gtcagttcac gaggaggaac ctgaatgtga agtataacgg taaaaaggaa atatatatta 540

aaacaacgga agcaaaacaa gaaacaagat gaaatgagaa actagtaaca cacctcataa 600

tcttcccata tagcagctga tctatgctca tgttgccaca ccaatataga ttgatcaacc 660

attggaccag gatccaaatc aaagtttaat agactttgca cctccatcta tataatatat 720

cacaggacaa taaacacaat gatcagtgat tatacaacat caaagaaaac ttgtaattct 780

gggaatataa ctgagaaatg agaattaaag attcataatt tgaacacaag aaatcctaaa 840

ctggtacgaa agaaaaattg ctcaacaaaa aaatcaagct aattactcgt atacaaagac 900

acgaagaact aatacaagaa acaagaaaca acaaaccaca aagagattga accaatccaa 960

attcgacaac ataaaccaag tgtgtgggtg attggaatca gaggacgtac caaagaaaag 1020

cgtccgtgat caacaaaaac caaaaagaga cgtttgaaat aaaccagagg aagacgaaga 1080

ataattaagc aaagagaagc gttaagcggg agcgagaaag gaaacgagag aaagagagag 1140

cttccagatc cgacagaagt tttcggcttc ttctttttcg tttaagaact tctgatcctc 1200

ctaggtctgt ccgaagaact aatctttttg aggtaacgac gccgtttttc tcaaaacatg 1260

ggcccattaa ccatagtctc ggcccaaacg aaacttaata cgacaatgtt tgggtgtaaa 1320

cgcaaagatt ttgtcgatta tcacaagtaa aaaaataaat acaaacactt gagtctctct 1380

agacatcgtg cgtcgcctta gctttaagtt ttttctcgaa acaaaagagt tattttattt 1440

gaactttgaa gattatacga agacacgtgg cgtgaaccca attcataaca acgccacgct 1500

atactctttt gcatgcacct caatttgaac atcatcaagt ctctctctct ctttttctga 1560

ctttgatcca cgaacctaac cagcttgcga tctctattta atcggtcctc gacgcaactt 1620

catataactt ct 1632

<210>7

<211>989

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(989)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)包含5’非翻译区的转录调节核苷酸序列(衍生的

推测核心启动子区)

<220>

<221>TATA_信号

<222>(888)..(895)

<223>推测的TATA盒

<220>

<221>5’UTR

<222>(926)..(989)

<223>推测的5’-非翻译区

<400>7

ctatataata tatcacagga caataaacac aatgatcagt gattatacaa catcaaagaa 60

aacttgtaat tctgggaata taactgagaa atgagaatta aagattcata atttgaacac 120

aagaaatcct aaactggtac gaaagaaaaa ttgctcaaca aaaaaatcaa gctaattact 180

cgtatacaaa gacacgaaga actaatacaa gaaacaagaa acaacaaacc acaaagagat 240

tgaaccaatc caaattcgac aacataaacc aagtgtgtgg gtgattggaa tcagaggacg 300

taccaaagaa aagcgtccgt gatcaacaaa aaccaaaaag agacgtttga aataaaccag 360

aggaagacga agaataatta agcaaagaga agcgttaagc gggagcgaga aaggaaacga 420

gagaaagaga gagcttccag atccgacaga agttttcggc ttcttctttt tcgtttaaga 480

acttctgatc ctcctaggtc tgtccgaaga actaatcttt ttgaggtaac gacgccgttt 540

ttctcaaaac atgggcccat taaccatagt ctcggcccaa acgaaactta atacgacaat 600

gtttgggtgt aaacgcaaag attttgtcga ttatcacaag taaaaaaata aatacaaaca 660

cttgagtctc tctagacatc gtgcgtcgcc ttagctttaa gttttttctc gaaacaaaag 720

agttatttta tttgaacttt gaagattata cgaagacacg tggcgtgaac ccaattcata 780

acaacgccac gctatactct tttgcatgca cctcaatttg aacatcatca agtctctctc 840

tctctttttc tgactttgat ccacgaacct aaccagcttg cgatctctat ttaatcggtc 900

ctcgacgcaa cttcatataa cttctactac atccattcac atcaaatcaa tacagaaagt 960

tttttctata tataaatata aaaggtaaa 989

<210>8

<211>925

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(925)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)的转录调节核苷酸序列(衍生物；推测的核心启动

子区)

<220>

<221>TATA_信号

<222>(888)..(895)

<223>推测的TATA盒

<400>8

ctatataata tatcacagga caataaacac aatgatcagt gattatacaa catcaaagaa 60

aacttgtaat tctgggaata taactgagaa atgagaatta aagattcata atttgaacac 120

aagaaatcct aaactggtac gaaagaaaaa ttgctcaaca aaaaaatcaa gctaattact 180

cgtatacaaa gacacgaaga actaatacaa gaaacaagaa acaacaaacc acaaagagat 240

tgaaccaatc caaattcgac aacataaacc aagtgtgtgg gtgattggaa tcagaggacg 300

taccaaagaa aagcgtccgt gatcaacaaa aaccaaaaag agacgtttga aataaaccag 360

aggaagacga agaataatta agcaaagaga agcgttaagc gggagcgaga aaggaaacga 420

gagaaagaga gagcttccag atccgacaga agttttcggc ttcttctttt tcgtttaaga 480

acttctgatc ctcctaggtc tgtccgaaga actaatcttt ttgaggtaac gacgccgttt 540

ttctcaaaac atgggcccat taaccatagt ctcggcccaa acgaaactta atacgacaat 600

gtttgggtgt aaacgcaaag attttgtcga ttatcacaag taaaaaaata aatacaaaca 660

cttgagtctc tctagacatc gtgcgtcgcc ttagctttaa gttttttctc gaaacaaaag 720

agttatttta tttgaacttt gaagattata cgaagacacg tggcgtgaac ccaattcata 780

acaacgccac gctatactct tttgcatgca cctcaatttg aacatcatca agtctctctc 840

tctctttttc tgactttgat ccacgaacct aaccagcttg cgatctctat ttaatcggtc 900

ctcgacgcaa cttcatataa cttct 925

<210>9

<211>1727

<212>DNA

<213>亚麻(Linum usitatissimum)

<220>

<221>启动子

<222>(1)..(1727)

<223>来自拟南芥基因At1g48130(过氧化物氧还蛋白)的亚麻直向同源基因的包含5’非翻译区的转录调

节核苷酸序列(衍生物)

<220>

<221>misc_feature

<222>(1282)..(1287)

<223>种子特异性启动子中保守的RY和Sph基序(反义链)cccaagtaCATGcaaaatttaacggtt

<220>

<221>misc_feature

<222>(1615)..(1620)

<223>种子特异性启动子中保守的RY和Sph基序(正义链)gttctcttCATGcaaggatagtagaac

<220>

<221>TATA信号

<222>(1652)..(1656)

<223>推测的TATA盒

<400>9

cacgggcagg acatagggac tactacaagc atagtatgct tcagacaaag agctaggaaa 60

gaactcttga tggaggttaa gagaaaaaag tgctagaggg gcatagtaat caaacttgtc 120

aaaaccgtca tcatgatgag ggatgacata atataaaaag ttgactaagg tcttggtagt 180

actctttgat tagtattata tattggtgag aacatgagtc aagaggagac aagaaaccga 240

ggaaccatag tttagcaaca agatggaagt tgcaaagttg agctagccgc tcgattagtt 300

acatctccta agcagtacta caaggaatgg tctctatact ttcatgttta gcacatggta 360

gtgcggattg acaagttaga aacagtgctt aggagacaaa gagtcagtaa aggtattgaa 420

agagtgaagt tgatgctcga caggtcagga gaagtccctc cgccagatgg tgactaccaa 480

ggggttggta tcagctgaga cccaaataag attcttcggt tgaaccagtg gttcgaccga 540

gactcttagg gtgggatttc actgtaagat ttgtgcattt tgttgaatat aaattgacaa 600

ttttttttat ttaattatag attatttaga atgaattaca tatttagttt ctaacaagga 660

tagcaatgga tgggtatggg tacaggttaa acatatctat tacccaccca tctagtcgtc 720

gggttttaca cgtacccacc cgtttacata aaccagaccg gaattttaaa ccgtacccgt 780

ccgttagcgg gtttcagatt tacccgttta atcgggtaaa acctgattac taaatatata 840

ttttttattt gataaacaaa acaaaaatgt taatattttc atattggatg caattttaag 900

aaacacatat tcataaattt ccatatttgt aggaaaataa aaagaaaaat atattcaaga 960

acacaaattt caccgacatg acttttatta cagagttgga attagatcta acaattgaaa 1020

aattaaaatt aagatagaat atgttgagga acatgacata gtataatgct gggttacccg 1080

tcgggtaggt atcgaggcgg atactactaa atccatccca ctcgctatcc gataatcact 1140

ggtttcgggt atacccattc ccgtcaacag gcctttttaa ccggataatt tcaacttata 1200

gtgaatgaat tttgaataaa tagttagaat accaaaatcc tggattgcat ttgcaatcaa 1260

attttgtgaa ccgttaaatt ttgcatgtac ttgggataga tataatagaa ccgaattttc 1320

attagtttaa tttataactt actttgttca aagaaaaaaa atatctatcc aatttactta 1380

taataaaaaa taatctatcc aagttactta ttataatcaa cttgtaaaaa ggtaagaata 1440

caaatgtggt agcgtacgtg tgattatatg tgacgaaatg ttatatctaa caaaagtcca 1500

aattcccatg gtaaaaaaaa tcaaaatgca tggcaggctg tttgtaacct tggaataaga 1560

tgttggccaa ttctggagcc gccacgtacg caagactcag ggccacgttc tcttcatgca 1620

aggatagtag aacaccactc cacccacctc ctatattaga cctttgccca accctcccca 1680

actttcccat cccatccaca aagaaaccga catttttatc ataaatc 1727

<210>10

<211>933

<212>DNA

<213>寡核苷酸引物

<220>

<221>启动子

<222>(1)..(933)

节核苷酸序列(衍生物；推测的核心启动子区)

<220>

<221>TATA_信号

<222>(858)..(862)

<223>推测的TATA盒

<400>10

cagatttacc cgtttaatcg ggtaaaacct gattactaaa tatatatttt ttatttgata 60

aacaaaacaa aaatgttaat attttcatat tggatgcaat tttaagaaac acatattcat 120

aaatttccat atttgtagga aaataaaaag aaaaatatat tcaagaacac aaatttcacc 180

gacatgactt ttattacaga gttggaatta gatctaacaa ttgaaaaatt aaaattaaga 240

tagaatatgt tgaggaacat gacatagtat aatgctgggt tacccgtcgg gtaggtatcg 300

aggcggatac tactaaatcc atcccactcg ctatccgata atcactggtt tcgggtatac 360

ccattcccgt caacaggcct ttttaaccgg ataatttcaa cttatagtga atgaattttg 420

aataaatagt tagaatacca aaatcctgga ttgcatttgc aatcaaattt tgtgaaccgt 480

taaattttgc atgtacttgg gatagatata atagaaccga attttcatta gtttaattta 540

taacttactt tgttcaaaga aaaaaaatat ctatccaatt tacttataat aaaaaataat 600

ctatccaagt tacttattat aatcaacttg taaaaaggta agaatacaaa tgtggtagcg 660

tacgtgtgat tatatgtgac gaaatgttat atctaacaaa agtccaaatt cccatggtaa 720

aaaaaatcaa aatgcatggc aggctgtttg taaccttgga ataagatgtt ggccaattct 780

ggagccgcca cgtacgcaag actcagggcc acgttctctt catgcaagga tagtagaaca 840

ccactccacc cacctcctat attagacctt tgcccaaccc tccccaactt tcccatccca 900

tccacaaaga aaccgacatt tttatcataa atc 933

<210>11

<211>458

<212>DNA

<213>寡核苷酸引物

<220>

<221>启动子

<222>(1)..(458)

节核苷酸序列(衍生物；推测的核心启动子区)

<220>

<221>TATA_信号

<222>(383)..(387)

<223>推测的TATA盒

<400>11

accgttaaat tttgcatgta cttgggatag atataataga accgaatttt cattagttta 60

atttataact tactttgttc aaagaaaaaa aatatctatc caatttactt ataataaaaa 120

ataatctatc caagttactt attataatca acttgtaaaa aggtaagaat acaaatgtgg 180

tagcgtacgt gtgattatat gtgacgaaat gttatatcta acaaaagtcc aaattcccat 240

ggtaaaaaaa atcaaaatgc atggcaggct gtttgtaacc ttggaataag atgttggcca 300

attctggagc cgccacgtac gcaagactca gggccacgtt ctcttcatgc aaggatagta 360

gaacaccact ccacccacct cctatattag acctttgccc aaccctcccc aactttccca 420

tcccatccac aaagaaaccg acatttttat cataaatc 458

<210>12

<211>973

<212>DNA

<213>拟南芥

<220>

<221>CDS

<222>(109)..(759)

<223>编码拟南芥At1g48130的基因产物(过氧化物氧还蛋白)

<400>12

tggcgatctc tatttaatcg gtcctcgacg caacttcaac ttctactaca tccattcaca 60

tcaaatcaat acagaaagtt ttttctatat ataaatataa aaggtaaa atg cca ggg 117

Met Pro Gly

1

atc aca cta gga gac acg gtg ccg aac cta gaa gtg gag acg aca cat 165

Ile Thr Leu Gly Asp Thr Val Pro Asn Leu Glu Val Glu Thr Thr His

5 10 15

gac aag ttc aaa ctt cat gac tac ttc gcc aat tct tgg acc gtc ctc 213

Asp Lys Phe Lys Leu His Asp Tyr Phe Ala Asn Ser Trp Thr Val Leu

20 25 30 35

ttc tct cat ccc ggg gat ttc aca ccc gtg tgc acc acg gag ctt ggt 261

Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr Glu Leu Gly

40 45 50

gcg atg gcc aaa tac gct cat gag ttc gat aag aga ggc gtg aag ctc 309

Ala Met Ala Lys Tyr Ala His Glu Phe Asp Lys Arg Gly Val Lys Leu

55 60 65

ctt ggt ctg tct tgt gac gat gta cag tca cac aaa gac tgg atc aaa 357

Leu Gly Leu Ser Cys Asp Asp Val Gln Ser His Lys Asp Trp Ile Lys

70 75 80

gat att gaa gcc ttt aat cac gga agc aag gtg aat tac ccg ata atc 405

Asp Ile Glu Ala Phe Asn His Gly Ser Lys Val Asn Tyr Pro Ile Ile

85 90 95

gct gac ccg aac aaa gag atc att cct cag ctt aac atg att gat cca 453

Ala Asp Pro Asn Lys Glu Ile Ile Pro Gln Leu Asn Met Ile Asp Pro

100 105 110 115

att gag aac gga ccg tct cgt gcc ctt cat att gtt ggt cct gac agt 501

Ile Glu Asn Gly Pro Ser Arg Ala Leu His Ile Val Gly Pro Asp Ser

120 125 130

aag ata aaa ttg agc ttc ttg tat ccg tcg acc acg gga cgt aac atg 549

Lys Ile Lys Leu Ser Phe Leu Tyr Pro Ser Thr Thr Gly Arg Asn Met

135 140 145

gac gaa gta ttg agg gct tta gac tcg ttg ttg atg gcg tcc aag cac 597

Asp Glu Val Leu Arg Ala Leu Asp Ser Leu Leu Met Ala Ser Lys His

150 155 160

aat aac aag atc gcc act ccg gtt aac tgg aag cca gat caa ccg gtt 645

Asn Asn Lys Ile Ala Thr Pro Val Asn Trp Lys Pro Asp Gln Pro Val

165 170 175

gtg att tcg cct gct gtg tcg gac gag gaa gcc aaa aag atg ttc cca 693

Val Ile Ser Pro Ala Val Ser Asp Glu Glu Ala Lys Lys Met Phe Pro

180 185 190 195

cag ggt ttc aag acc gcc gat ctt ccg tca aag aaa ggc tat ctg cgt 741

Gln Gly Phe Lys Thr Ala Asp Leu Pro Ser Lys Lys Gly Tyr Leu Arg

200 205 210

cgc aca gag gtc tct tga aaagataata acaaaagcc t actatataac 789

Arg Thr Glu Val Ser

215

gtacatgcaa gtattgtatg atattaatgt ttttacgtac gtgtaaacaa aaataattac 849

gtttgtaacg tatggtgatg atgtggtgca ctaggtgtag gccttgtatt aataaaaaga 909

agtttgttct atatagagtg gtttagtacg acgatttatt tactaaacaa aaaaaaaaaa 969

aaaa 973

<210>13

<211>216

<212>PRT

<213>拟南芥

<400>13

Met Pro Gly Ile Thr Leu Gly Asp Thr Val Pro Asn Leu Glu Val Glu

1 5 10 15

Thr Thr His Asp Lys Phe Lys Leu His Asp Tyr Phe Ala Asn Ser Trp

20 25 30

Thr Val Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

Glu Leu Gly Ala Met Ala Lys Tyr Ala His Glu Phe Asp Lys Arg Gly

50 55 60

Val Lys Leu Leu Gly Leu Ser Cys Asp Asp Val Gln Ser His Lys Asp

65 70 75 80

Trp Ile Lys Asp Ile Glu Ala Phe Asn His Gly Ser Lys Val Asn Tyr

85 90 95

Pro Ile Ile Ala Asp Pro Asn Lys Glu Ile Ile Pro Gln Leu Asn Met

100 105 110

Ile Asp Pro Ile Glu Asn Gly Pro Ser Arg Ala Leu His Ile Val Gly

115 120 25

Pro Asp Ser Lys Ile Lys Leu Ser Phe Leu Tyr Pro Ser Thr Thr Gly

130 135 140

Arg Asn Met Asp Glu Val Leu Arg Ala Leu Asp Ser Leu Leu Met Ala

145 150 155 160

Ser Lys His Asn Asn Lys Ile Ala Thr Pro Val Asn Trp Lys Pro Asp

165 170 175

Gln Pro Val Val Ile Ser Pro Ala Val Ser Asp Glu Glu Ala Lys Lys

180 185 190

Met Phe Pro Gln Gly Phe Lys Thr Ala Asp Leu Pro Ser Lys Lys Gly

195 200 205

Tyr Leu Arg Arg Thr Glu Val Ser

210 215

<210>14

<211>862

<212>DNA

<213>欧洲油菜(Brassica napus)

<220>

<221>CDS

<222>(37)..(687)

<223>编码拟南芥At1g48130基因产物(过氧化物氧还蛋白)的欧洲油菜直向同源物

<400>14

ccaatacata cattttcatt tcgataacaa gaaaaa atg cca ggg atc aca cta 54

Met Pro Gly Ile Thr Leu

1 5

gga gac acg gtg cca aac cta gag gtg gag acg aca cac aag aac ttc 102

Gly Asp Thr Val Pro Asn Leu Glu Val Glu Thr Thr His Lys Asn Phe

10 15 20

aag ctc cat gac tac ttc gcc gat tct tgg acc gtc ctc ttc tct cac 150

Lys Leu His Asp Tyr Phe Ala Asp Ser Trp Thr Val Leu Phe Ser His

25 30 35

cct ggg gat ttc aca ccc gta tgc aca acc gag ctt ggt gcg atg gga 198

Pro Gly Asp Phe Thr Pro Val Cys Thr Thr Glu Leu Gly Ala Met Gly

40 45 50

aaa tac gct cat gag ttc gag cag aga ggt gtg aag ctc ctt ggt ttg 246

Lys Tyr Ala His Glu Phe Glu Gln Arg Gly Val Lys Leu Leu Gly Leu

55 60 65 70

tct tgt gac gac ata cag tcg cac aaa gat tgg atc ccc gac att gag 294

Ser Cys Asp Asp Ile Gln Ser His Lys Asp Trp Ile Pro Asp Ile Glu

75 80 85

gca ttt act cct gga agc aaa gtg aca tac cca ata atc gct gat ccg 342

Ala Phe Thr Pro Gly Ser Lys Val Thr Tyr Pro Ile Ile Ala Asp Pro

90 95 100

aac aaa gag atc atc cct cag ctt aac atg att gat cct att gag aac 390

Asn Lys Glu Ile Ile Pro Gln Leu Asn Met Ile Asp Pro Ile Glu Asn

105 110 115

ggt ccc tct cgt gcc ctt cat gta gtt ggt cct gat tgc aag ata aag 438

Gly Pro Ser Arg Ala Leu His Val Val Gly Pro Asp Cys Lys Ile Lys

120 125 130

ttg agt ttc ctg tat ccg tcc acc acg gga cgt aac atg gac gaa gtg 486

Leu Ser Phe Leu Tyr Pro Ser Thr Thr Gly Arg Asn Met Asp Glu Val

135 140 145 150

ctg agg gct tta gac tcg ttg ttg atg gcg gcc aaa cat aag aac aag 534

Leu Arg Ala Leu Asp Ser Leu Leu Met Ala Ala Lys His Lys Asn Lys

155 160 165

att gcc act ccg gtt aac tgg aaa cca gat gaa ccc gtt gtt atc tca 582

Ile Ala Thr Pro Val Asn Trp Lys Pro Asp Glu Pro Val Val Ile Ser

170 175 180

cca gct gtg tca gac gaa gag gct aag aag ttg ttt cct cag ggt ttc 630

Pro Ala Val Ser Asp Glu Glu Ala Lys Lys Leu Phe Pro Gln Gly Phe

185 190 195

aag act gcc aaa ctt ccg tcc aag aaa ggc tac cta cgt gtc gcc gat 678

Lys Thr Ala Lys Leu Pro Ser Lys Lys Gly Tyr Leu Arg Val Ala Asp

200 205 210

gtc tct tga aagaccgaaa agaaagaaac tagttatgtt gtctgagtgt 727

Val Ser

215

attgtataat aatgctcaca atgggttgat aaaaatatga aaaactacgt ttgtaacgta 787

tcgtgtgtgt gctctggagg atatagcctt atattaatag aaataatgtg ttttataaaa 847

aaaaaaaaaa aaaaa 862

<210>15

<211>216

<212>PRT

<213>欧洲油菜

<400>15

Met Pro Gly Ile Thr Leu Gly Asp Thr Val Pro Asn Leu Glu Val Glu

1 5 10 15

Thr Thr His Lys Asn Phe Lys Leu His Asp Tyr Phe Ala Asp Ser Trp

20 25 30

Thr Val Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

Glu Leu Gly Ala Met Gly Lys Tyr Ala His Glu Phe Glu Gln Arg Gly

50 55 60

Val Lys Leu Leu Gly Leu Ser Cys Asp Asp Ile Gln Ser His Lys Asp

65 70 75 80

Trp Ile Pro Asp Ile Glu Ala Phe Thr Pro Gly Ser Lys Val Thr Tyr

85 90 95

Pro Ile Ile Ala Asp Pro Asn Lys Glu Ile Ile Pro Gln Leu Asn Met

100 105 110

Ile Asp Pro Ile Glu Asn Gly Pro Ser Arg Ala Leu His Val Val Gly

115 120 125

Pro Asp Cys Lys Ile Lys Leu Ser Phe Leu Tyr Pro Ser Thr Thr Gly

130 135 140

Arg Asn Met Asp Glu Val Leu Arg Ala Leu Asp Ser Leu Leu Met Ala

145 150 155 160

Ala Lys His Lys Asn Lys Ile Ala Thr Pro Val Asn Trp Lys Pro Asp

165 170 175

Glu Pro Val Val Ile Ser Pro Ala Val Ser Asp Glu Glu Ala Lys Lys

180 185 190

Leu Phe Pro Gln Gly Phe Lys Thr Ala Lys Leu Pro Ser Lys Lys Gly

195 200 205

Tyr Leu Arg Val Ala Asp Val Ser

210 215

<210>16

<211>816

<212>DNA

<213>黑麦状雀麦(Bromus secalinus)

<220>

<221>CDS

<222>(2)..(610)

<223>编码拟南芥At1g48130基因产物(过氧化物氧还蛋白)的黑麦状雀麦直向同源物

<400>16

c tcc acc cat ggc aag atc cgc atc cac gac tac gtc gcc aac ggc tac 49

Ser Thr His Gly Lys Ile Arg Ile His Asp Tyr Val Ala Asn Gly Tyr

1 5 10 15

gtc atc ctc ttc tcg cac ccc ggc gat ttc acc ccg gtg tgc acg acg 97

Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

20 25 30

gag ctg gcg gcg atg gcc aac tac gcc aag gag ttc gag aag agg ggc 145

Glu Leu Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly

35 40 45

gtc aag ctg ctg ggc atc tcc tgc gac gac gtg cag tcc cac aag gag 193

Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu

50 55 60

tgg acc aag gac atc gag gcc tac aag cct ggg agc aag gtg acg tac 241

Trp Thr Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr

65 70 75 80

ccg atc atg gcg gac ccg gac cgg tcg gcc atc aag cag ctc aac atg 289

Pro Ile Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met

85 90 95

gtg gat ccg gac gag aag gac gcg gag ggg cag ctg ccg tcg cgc acg 337

Val Asp Pro Asp Glu Lys Asp Ala Glu Gly Gln Leu Pro Ser Arg Thr

100 105 110

ctg cac atc gtg ggg ccg gac aag aag gtg aag ctg agc ttc ctg tac 385

Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu Tyr

115 120 125

ccg tcg tgc acg ggg agg aac atg gac gag gtt gtg cgc gcg gtg gac 433

Pro Ser Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp

130 135 140

tcg ctg ctg acg gcg gcc aag cac aag gtg gcc acc ccg gcc aac tgg 481

Ser Leu Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp

145 150 155 160

aag ccc ggg gag tgc gtg gtg atc gcg ccg ggc gtg tcc gac gag gag 529

Lys Pro Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Glu Glu

165 170 175

gcc aag aag ttg ttc ccg cag ggg ttc gag acc aag gac ctg ccc tcc 577

Ala Lys Lys Leu Phe Pro Gln Gly Phe Glu Thr Lys Asp Leu Pro Ser

180 185 190

aag aag gga tac ctc cgc ttc acc aag gtc tag gcgtgcccgt cgccgtgggc 630

Lys Lys Gly Tyr Leu Arg Phe Thr Lys Val

195 200

tagctcgtcg gcgctttaag agttcacctg tggtacaagt attgtgtcgt cgttgtggta 690

cttttggggt acgtagtagc atggcgtttg tttctgttgt aatccagtac tcgactgctg 750

gtggcgtcga gctaatatat gcgtgtactg tgtggactgt tggccccttt gaaaaaaaaa 810

aaaaaa 816

<210>17

<211>202

<212>PRT

<213>黑麦状雀麦

<400>17

Ser Thr His Gly Lys Ile Arg Ile His Asp Tyr Val Ala Asn Gly Tyr

1 5 10 15

Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

20 25 30

Glu Leu Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly

35 40 45

Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu

50 55 60

Trp Thr Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr

65 70 75 80

Pro Ile Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met

85 90 95

Val Asp Pro Asp Glu Lys Asp Ala Glu Gly Gln Leu Pro Ser Arg Thr

100 105 110

Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu Tyr

115 120 125

Pro Ser Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp

130 135 140

Ser Leu Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp

145 150 155 160

Lys Pro Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Glu Glu

165 170 175

Ala Lys Lys Leu Phe Pro Gln Gly Phe Glu Thr Lys Asp Leu Pro Ser

180 185 190

Lys Lys Gly Tyr Leu Arg Phe Thr Lys Val

195 200

<210>18

<211>864

<212>DNA

<213>大麦(Hordeum vulgare)

<220>

<221>CDS

<222>(51)..(707)

<223>编码拟南芥At1g48130基因产物(过氧化物氧还蛋白)的大麦直向同源物

<400>18

gttcgcagca gcaaagagca cgcagcaact agctttcagt tgtttcaacc atg ccg 56

Met Pro

1

ggg ctc acc att ggc gac acc gtc ccc aac ctg gag ctg gac tcc acc 104

Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp Ser Thr

5 10 15

cat ggc aag atc cgc atc cac gac tac gtc ggc aac ggc tac gtc atc 152

His Gly Lys Ile Arg Ile His Asp Tyr Val Gly Asn Gly Tyr Val Ile

20 25 30

ctc ttc tcg cac ccc ggt gat ttc acc ccg gtg tgc acg acg gag ctg 200

Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr Glu Leu

35 40 45 50

gcg gcc atg gcc aac tac gcc aag gag ttc gag aag cgg ggc gtg aag 248

Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly Val Lys

55 60 65

ctg ctc ggc atc tcc tgc gac gac gtg cag tcc cac aag gag tgg acc 296

Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu Trp Thr

70 75 80

aag gac atc gag gcc tac aag cct ggg agc aag gtg acg tac ccg atc 344

Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr Pro Ile

85 90 95

atg gcg gac ccg gac cgg tcg gcg atc aag cag ctc aac atg gtg gac 392

Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met Val Asp

100 105 110

ccg gac gag aag gac gcg cag ggg cag ctg ccg tcc cgc acc ctg cac 440

Pro Asp Glu Lys Asp Ala Gln Gly Gln Leu Pro Ser Arg Thr Leu His

115 120 125 130

atc gtg ggg ccg gac aag gtg gtg aag ctg agc ttc ctg tac ccg tcg 488

Ile Val Gly Pro Asp Lys Val Val Lys Leu Ser Phe Leu Tyr Pro Ser

135 140 145

tgc acg ggg cgg aac atg gac gag gtg gtg cgc gcc gtg gac tcg ctg 536

Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp Ser Leu

150 155 160

ctg acg gcg gca aag cac aag gtg gca acc ccg gcc aac tgg aag ccc 584

Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp Lys Pro

165 170 175

ggc gag tgc gtt gtg atc gcg ccc ggc gtc tcc gac gag gag gcc aag 632

Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Glu Glu Ala Lys

180 185 190

aag atg ttc ccg cag ggg ttc gag acc gcc gac ctg ccc tcc aag aag 680

Lys Met Phe Pro Gln Gly Phe Glu Thr Ala Asp Leu Pro Ser Lys Lys

195 200 205 210

ggc tac ctc cgc ttc acc aag gtc tag gcgtccgtcc gtgctagctc 727

Gly Tyr Leu Arg Phe Thr Lys Val

215

gtcggcgctt gctcggttac ttatggtggt ggtatgtgtc gttgtggtgc gtgcgtactt 787

ttgtggtagc atgtgtcgtt tcttctgtaa ttctactcgc gtcgccgagc tatctctact 847

gtgacttcgc ctctttc 864

<210>19

<211>218

<212>PRT

<213>大麦

<400>19

Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp

1 5 10 15

Ser Thr His Gly Lys Ile Arg Ile His Asp Tyr Val Gly Asn Gly Tyr

20 25 30

Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

Glu Leu Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly

50 55 60

Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu

65 70 75 80

Trp Thr Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr

85 90 95

Pro Ile Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met

100 105 110

Val Asp Pro Asp Glu Lys Asp Ala Gln Gly Gln Leu Pro Ser Arg Thr

115 120 125

Leu His Ile Val Gly Pro Asp Lys Val Val Lys Leu Ser Phe Leu Tyr

130 135 140

Pro Ser Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp

145 150 155 160

Ser Leu Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp

165 170 175

Lys Pro Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Glu Glu

180 185 190

Ala Lys Lys Met Phe Pro Gln Gly Phe Glu Thr Ala Asp Leu Pro Ser

195 200 205

Lys Lys Gly Tyr Leu Arg Phe Thr Lys Val

210 215

<210>20

<211>273

<212>DNA

<213>亚麻

<220>

<221>CDS

<222>(1)..(273)

<223>编码拟南芥At1g48130基因产物(过氧化物氧还蛋白)的亚麻直向同源物

<400>20

atg cct gga ctc acc atc ggg gac acc gtc cca aat ctt gaa gtg gag 48

Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Val Glu

1 5 10 15

agc act cat gga gtc atc aat ctc cac gac ttc ttc acc aat tcc tgg 96

Ser Thr His Gly Val Ile Asn Leu His Asp Phe Phe Thr Asn Ser Trp

20 25 30

acc atc ctc ttc tct cac ccc ggt gat ttc acg ccg gtg tgc acc acg 144

Thr Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

gaa cta ggg aag atg gca gct tat gcg ccg gag ttt gag aag aga ggg 192

Glu Leu Gly Lys Met Ala Ala Tyr Ala Pro Glu Phe Glu Lys Arg Gly

50 55 60

gtc aaa ctc ctg ggc ttg tca tgc gac gac gtt ttg tct cat gtc gag 240

Val Lys Leu Leu Gly Leu Ser Cys Asp Asp Val Leu Ser His Val Glu

65 70 75 80

tgg atc aag gac gta gaa gcc ttc acc gtg agc 273

Trp Ile Lys Asp Val Glu Ala Phe Thr Val Ser

85 90

<210>21

<211>91

<212>PRT

<213>亚麻

<400>21

Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Val Glu

1 5 10 15

Ser Thr His Gly Val Ile Asn Leu His Asp Phe Phe Thr Asn Ser Trp

20 25 30

Thr Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

Glu Leu Gly Lys Met Ala Ala Tyr Ala Pro Glu Phe Glu Lys Arg Gly

50 55 60

Val Lys Leu Leu Gly Leu Ser Cys Asp Asp Val Leu Ser His Val Glu

65 70 75 80

Trp Ile Lys Asp Val Glu Ala Phe Thr Val Ser

85 90

<210>22

<211>827

<212>DNA

<213>圆柱小麦(Triticum turgidum)

<220>

<221>CDS

<222>(1)..(657)

<223>编码拟南芥At1g48130基因产物(过氧化物氧还蛋白)的圆柱小麦直向同源物

<400>22

atg ccg ggg ctg acg ata ggc gac acc gtc ccc aac ctg gag ctg gac 48

Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp

1 5 10 15

tcc acc cat ggc aag atc cgg atc cac gac tac gtc ggc aac ggc tac 96

Ser Thr His Gly Lys Ile Arg Ile His Asp Tyr Val Gly Asn Gly Tyr

20 25 30

gtc atc ctc ttc tca cac ccc ggt gat ttc acc ccg gtg tgc acg acg 144

Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

gag tta gcg gcg atg gcc aac tac gcc aag gag ttc gag aag cgg ggc 192

Glu Leu Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly

50 55 60

gtg aag ctg ctg ggc atc tcc tgc gac gac gtg cag tcc cac aag gaa 240

Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu

65 70 75 80

tgg acc aag gac atc gag gcc tac aag cct ggg agc aag gtg acg tac 288

Trp Thr Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr

85 90 95

ccg atc atg gcg gac ccg gac cgg tcg gcc atc aag caa ctg aac atg 336

Pro Ile Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met

100 105 110

gtc gac ccc gac gag aag gac gcg gag ggg cag ctg ccg tcc cgc acc 384

Val Asp Pro Asp Glu Lys Asp Ala Glu Gly Gln Leu Pro Ser Arg Thr

115 120 125

ttg cac atc gtg ggg ccg gac aag aag gtg aag ctg agc ttc ctg tac 432

Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu Tyr

130 135 140

ccg tcg tgc acg ggg cgg aac atg gac gag gtg gtg cgc gcc gtg gac 480

Pro Ser Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp

145 150 155 160

tcg ctg ctg acg gcg gcc aag cac aag gtg gcc acc ccg gcc aac tgg 528

Ser Leu Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp

165 170 175

aat ccc ggg gag tgc gtg gtg atc gcg ccc ggc gtc tcc gac gac ggg 576

Asn Pro Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Asp Gly

180 185 190

gcc aag aag atg ttc ccg cag ggg ttc gag act gcc gac ctg ccc tcc 624

Ala Lys Lys Met Phe Pro Gln Gly Phe Glu Thr Ala Asp Leu Pro Ser

195 200 205

aag aag ggg tac ctc cgc ttc acc aag gtc tag gcgtgcgtcc gtgctagctc 677

Lys Lys Gly Tyr Leu Arg Phe Thr Lys Val

210 215

gtcggcgcct gctcggttac tcgtggcggt ctgtgtcgtt gtggtccgtg cgtacttttg 737

tggtggtacg tgtcgtttct tctgtaaatc taccagcgtc tccgagctat gtatgtgtac 797

tgtgactttg tctcaaaaaa aaaaaaaaaa 827

<210>23

<211>218

<212>PRT

<213>圆柱小麦

<400>23

Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp

1 5 10 15

Ser Thr His Gly Lys Ile Arg Ile His Asp Tyr Val Gly Asn Gly Tyr

20 25 30

Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr

35 40 45

Glu Leu Ala Ala Met Ala Asn Tyr Ala Lys Glu Phe Glu Lys Arg Gly

50 55 60

Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Glu

65 70 75 80

Trp Thr Lys Asp Ile Glu Ala Tyr Lys Pro Gly Ser Lys Val Thr Tyr

85 90 95

Pro Ile Met Ala Asp Pro Asp Arg Ser Ala Ile Lys Gln Leu Asn Met

100 105 110

Val Asp Pro Asp Glu Lys Asp Ala Glu Gly Gln Leu Pro Ser Arg Thr

115 120 125

Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu Tyr

130 135 140

Pro Ser Cys Thr Gly Arg Asn Met Asp Glu Val Val Arg Ala Val Asp

145 150 155 160

Ser Leu Leu Thr Ala Ala Lys His Lys Val Ala Thr Pro Ala Asn Trp

165 170 175

Asn Pro Gly Glu Cys Val Val Ile Ala Pro Gly Val Ser Asp Asp Gly

180 185 190

Ala Lys Lys Met Phe Pro Gln Gly Phe Glu Thr Ala Asp Leu Pro Ser

195 200 205

Lys Lys Gly Tyr Leu Arg Phe Thr Lys Val

210 215

<210>24

<211>39

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>24

ttttttgtcg acgccacatc atgtttagac ttatctcca 39

<210>25

<211>44

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>25

ttaattcata tgtttacctt ttatatttat atatagaaaa aact 44

<210>26

<211>32

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>26

ttaattaagc ttagaagttg aagttgcgtc ga 32

<210>27

<211>34

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>27

ttttttacta gtctatataa tatatcacag gaca 34

<210>28

<211>33

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>28

ttaattcata tgtttacctt ttatatttat ata 33

<210>29

<211>32

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>29

ttaattcata tgagaagttg aagttgcgtc ga 32

<210>30

<211>36

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>30

ttaattaagc ttagaagtta tatgaagttg cgtcga 36

<210>31

<211>33

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>31

ttaattggta cctttacctt ttatatttat ata 33

<210>32

<211>33

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>32

ttaattcata tgagaagtta tatgaagttg cgt 33

<210>33

<211>38

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>33

ttttttgtcg accacgggca ggacataggg actactac 38

<210>34

<211>44

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>34

ttaattacta gtgatttatg ataaaaatgt cggtttcttt gtgg 44

<210>35

<211>36

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>35

ttttttgtcg accagattta cccgtttaat cgggta 36

<210>36

<211>34

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>36

ttttttgtcg acaccgttaa attttgcatg tact 34

<210>37

<211>7

<212>PRT

<213>人工序列

<220>

<223>过氧化物氧还蛋白的氨基酸基序(拟南芥At1g48130基因产物的直向同源物)

<400>37

Gly Asp Thr Val Pro Asn Leu

1 5

<210>38

<211>14

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(4)..(4)

<223>(I/L)变异

<220>

<221>变体

<222>(6)..(6)

<223>(L/I)变异

<400>38

Met Pro Gly Ile Thr Leu Gly Asp Thr Val Pro Asn Leu Glu

1 5 10

<210>39

<211>7

<212>PRT

<213>人工序列

<220>

<400>39

Gly Asp Phe Thr Pro Val Cys

1 5

<210>40

<211>16

<212>PRT

<213>人工序列

<220>

<400>40

Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr Glu Leu

1 5 10 15

<210>41

<211>7

<212>PRT

<213>人工序列

<220>

<400>41

Val Lys Leu Leu Gly Leu Ser

1 5

<210>42

<211>12

<212>PRT

<213>人工序列

<220>

<400>42

Arg Gly Val Lys Leu Leu Gly Leu Ser Cys Asp Asp

1 5 10

<210>43

<211>7

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(4)..(4)

<223>(I/M)变异

<400>43

Tyr Pro Ile Ile Ala Asp Pro

1 5

<210>44

<211>11

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(4)..(4)

<223>(T/N)变异

<220>

<221>变体

<222>(8)..(8)

<223>(I/M)变异

<400>44

Ser Lys Val Thr Tyr Pro Ile Ile Ala Asp Pro

1 5 10

<210>45

<211>7

<212>PRT

<213>人工序列

<220>

<400>45

Lys Leu Ser Phe Leu Tyr Pro

1 5

<210>46

<211>10

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(1)..(1)

<223>(K/V)变异

<220>

<221>变体

<222>(2)..(2)

<223>(I/V)变异

<400>46

Lys Ile Lys Leu Ser Phe Leu Tyr Pro Ser

1 5 10

<210>47

<211>7

<212>PRT

<213>人工序列

<220>

<400>47

Gly Arg Asn Met Asp Glu Val

1 5

<210>48

<211>11

<212>PRT

<213>人工序列

<220>

<400>48

Thr Gly Arg Asn Met Asp Glu Val Leu Arg Ala

1 5 10

<210>49

<211>7

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(1)..(1)

<223>(I/V)变异

<220>

<221>变体

<222>(5)..(5)

<223>(V/A)变异

<400>49

Ile Ala Thr Pro Val Asn Trp

1 5

<210>50

<211>10

<212>PRT

<213>人工序列

<220>

<221>变体

<222>(2)..(2)

<223>(I/V)变异

<220>

<221>变体

<222>(6)..(6)

<223>(V/A)变异

<400>50

Lys Ile Ala Thr Pro Val Asn Trp Lys Pro

1 5 10

<210>51

<211>7

<212>PRT

<213>人工序列

<220>

<400>51

Pro Ser Lys Lys Gly Tyr Leu

1 5

<210>52

<211>9

<212>PRT

<213>人工序列

<220>

<400>52

Leu Pro Ser Lys Lys Gly Tyr Leu Arg

1 5

<210>53

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>53

tact 4

<210>54

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>54

agaa 4

<210>55

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>55

aaag 4

<210>56

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>56

ccat 4

<210>57

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>57

taaa 4

<210>58

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>58

ctat 4

<210>59

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>59

acgt 4

<210>60

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>60

aaaa 4

<210>61

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>61

gtta 4

<210>62

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>62

ttaa 4

<210>63

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>63

acat 4

<210>64

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(2)

<223>n为a、c、g或t

<400>64

tncc 4

<210>65

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>65

catg 4

<210>66

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>66

ttat 4

<210>67

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>67

tttt 4

<210>68

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>68

acgt 4

<210>69

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>69

agaa 4

<210>70

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>70

acgt 4

<210>71

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>71

acgt 4

<210>72

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>72

acgt 4

<210>73

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>73

catg 4

<210>74

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>74

accc 4

<210>75

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>75

ccat 4

<210>76

<211>4

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>76

tttt 4

<210>77

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(2)

<223>n为a、c、g或t

<400>77

antactctt 9

<210>78

<211>13

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(3)..(6)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(9)..(9)

<223>n为a、c、g或t

<400>78

gannnnacna gaa 13

<210>79

<211>16

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(3)..(5)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(13)..(15)

<223>n为a、c、g或t

<400>79

gannntgcaa agnnna 16

<210>80

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>80

ccattccttg tagta 15

<210>81

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(5)..(5)

<223>n为a、c、g或t

<400>81

taaanaatc 9

<210>82

<211>25

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(14)..(14)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(16)..(16)

<223>n为a、c、g或t

<400>82

ccattgctat cctngntaga aacta 25

<210>83

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(4)

<223>n为a、c、g或t

<400>83

tnnnacgta 9

<210>84

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(5)

<223>n为a、c、g或t

<400>84

annnnaaaaa tgtta 15

<210>85

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(3)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(5)..(5)

<223>n为a、c、g或t

<400>85

annangtta 9

<210>86

<211>6

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(5)..(5)

<223>n为a、c、g或t

<400>86

ttaana 6

<210>87

<211>14

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(5)..(6)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(8)..(10)

<223>n为a、c、g或t

<400>87

gaaannannn acat 14

<210>88

<211>12

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(2)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(5)..(6)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(8)..(10)

<223>n为a、c、g或t

<400>88

tnccnnannn gt 12

<210>89

<211>6

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>89

catgca 6

<210>90

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>90

ttattataag taaat 15

<210>91

<211>5

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>91

ttttt 5

<210>92

<211>14

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(5)..(6)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(8)..(10)

<223>n为a、c、g或t

<400>92

gtggnngnnn acgt 14

<210>93

<211>13

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(3)..(6)

<223>n为a、c、g或t

<220>

<221>misc_feature

<222>(9)..(9)

<223>n为a、c、g或t

<400>93

ggnnnntcna gaa 13

<210>94

<211>10

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>94

cgtacgtggc 10

<210>95

<211>7

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>95

acgtggc 7

<210>96

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(2)..(4)

<223>n为a、c、g或t

<400>96

gnnnacgtg 9

<210>97

<211>6

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>97

catgca 6

<210>98

<211>8

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(7)..(7)

<223>n为a、c、g或t

<400>98

cacccanc 8

<210>99

<211>9

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<220>

<221>misc_feature

<222>(3)..(4)

<223>n为a、c、g或t

<400>99

cannccatc 9

<210>100

<211>5

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>100

ttttt 5

<210>101

<211>12

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>101

agtactcttt ga 12

<210>102

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>102

agaggagaca agaaa 15

<210>103

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>103

gaagttgcaa agttgag 17

<210>104

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>104

ccattccttg tagtact 17

<210>105

<211>12

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>105

taaataatct at 12

<210>106

<211>27

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>106

tccattgcta tccttgttag aaactaa 27

<210>107

<211>13

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>107

ttttacacgt acc 13

<210>108

<211>21

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>108

acaaaacaaa aatgttaata t 21

<210>109

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>109

acaaaaatgt taata 15

<210>110

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>110

aaaaatgtta atatttt 17

<210>111

<211>21

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>111

atatgaaaat attaacattt t 21

<210>112

<211>21

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>112

aatttccata tttgtaggaa a 21

<210>113

<211>27

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>113

cccaagtaca tgcaaaattt aacggtt 27

<210>114

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>114

ttattataag taaattg 17

<210>115

<211>11

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>115

attttttatt a 11

<210>116

<211>21

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>116

aaatgtggta gcgtacgtgt g 21

<210>117

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>117

tggcggc tcc agaat 15

<210>118

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>118

cttgcgtacg tggcggc 17

<210>119

<211>21

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>119

tgaagagaacgtggccctga g 21

<210>120

<211>27

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>120

tgcatgaaga gaacgtggcc ctgagtc 27

<210>121

<211>27

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>121

gttctcttca tgcaaggata gtagaac 27

<210>122

<211>15

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>122

actccaccca cctcc 15

<210>123

<211>17

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>123

ctttcccatc ccatcca 17

<210>124

<211>11

<212>DNA

<213>人工序列

<220>

<223>启动子基序

<400>124

catttttatc a 11

<210>125

<211>876

<212>DNA

<213>拟南芥

<220>

<221>terminator

<222>(1)..(876)

<223>At1g48130拟南芥过氧化物氧还蛋白(PER1)基因的CDS之后的序列，包含3’-UTR作为转录终止序

列

<400>125

aaagataata acaaaagcct actatataac gtacatgcaa gtattgtatg atattaatgt 60

ttttacgtac gtgtaaacaa aaataattac gtttgtaacg tatggtgatg atgtggtgca 120

ctaggtgtag gccttgtatt aataaaaaga agtttgttct atatagagtg gtttagtacg 180

acgatttatt tactagtcgg attggaatag agaaccgaat tcttcaatcc ttgcttttga 240

tcaagaattg aaaccgaatc aaatgtaaaa gttgatatat ttgaaaaacg tattgagctt 300

atgaaaatgc taatactctc atctgtatgg aaaagtgact ttaaaaccga acttaaaagt 360

gacaaaaggg gaatatcgca tcaaaccgaa tgaaaccgat atgaaaccgc atcaaaccga 420

tatagcgtga accaaaatgt ggattaatga catttagacc ggaggaacat aagtggggac 480

tatacggcat cgttttagtg tataagtgaa ttcgcatatt cacgagttcc ccgtattcac 540

cggttgttat atcgtcgatt catcgtcgtc gacggcgagt acttgtgacc tccacaccca 600

gattaatctt ctataactga ttttatcgct tagacgatca cgatctcatc gattaactgt 660

gagtataatc gattcctcct ctttattttg tgtgttgtat cgatttacga taattttttg 720

gaggaacatc tcctttcgga tcggttttgt tgggaattta tatttctttg ccatggtttt 780

atcttgattt ggtgatttac cttgtgtttg ttctggtgta ctatttagct aatttagtat 840

aagctttcag atgattctag gaaacttttg tgctac 876

<210>126

<211>400

<212>DNA

<213>拟南芥

<220>

<221>terminator

<222>(1)..(400)

<223>At1g48130拟南芥过氧化物氧还蛋白(PER1)基因的CDS之后的序列，包含3’-UTR(衍生物)作为转

录终止序列

<400>126

aaagataata acaaaagcct actatataac gtacatgcaa gtattgtatg atattaatgt 60

ttttacgtac gtgtaaacaa aaataattac gtttgtaacg tatggtgatg atgtggtgca 120

ctaggtgtag gccttgtatt aataaaaaga agtttgttct atatagagtg gtttagtacg 180

acgatttatt tactagtcgg attggaatag agaaccgaat tcttcaatcc ttgcttttga 240

tcaagaattg aaaccgaatc aaatgtaaaa gttgatatat ttgaaaaacg tattgagctt 300

atgaaaatgc taatactctc atctgtatgg aaaagtgact ttaaaaccga acttaaaagt 360

gacaaaaggg gaatatcgca tcaaaccgaa tgaaaccgat 400

<210>127

<211>227

<212>DNA

<213>拟南芥

<220>

<221>3’UTR

<222>(1)..(227)

<223>At1g48130拟南芥过氧化物氧还蛋白(PER1)转录物的3’非翻译区

<400>127

aaagataata acaaaagcct actatataac gtacatgcaa gtattgtatg atattaatgt 60

ttttacgtac gtgtaaacaa aaataattac gtttgtaacg tatggtgatg atgtggtgca 120

ctaggtgtag gccttgtatt aataaaaaga agtttgttct atatagagtg gtttagtacg 180

acgatttatt tactagtcgg attggaatag agaaccgaat tcttcaa 227

Claims

1.在植物中调节种子特异性或种子偏好性表达的表达盒，其包含

i)SEQ ID NO：9、10或11所述序列；

以及功能性连接的至少一个核酸序列，其相对于i)下所述转录调节核苷酸序列是异源的。

2.权利要求1的表达盒，其中该核酸序列的表达导致蛋白质的表达或反义RNA、正义或双链RNA的表达。

3.权利要求2的表达盒，其中该核酸序列的表达赋予植物有农业价值的性状。

4.权利要求1-3的任一项的表达盒，其中该表达盒还包含功能性连接至要表达的核苷酸序列的至少一个序列，其选自由SEQ ID NO：125、126和127所述序列组成的组，其中所述序列能够介导RNA稳定性，RNA表达、RNA转录终止和/或RNA多聚腺苷化作用的稳定性。

5.分离的核苷酸，其选自以下序列组成的组：SEQ ID NO：9、10或11所述的序列。

6.包含权利要求5的分离的核苷酸或权利要求1至4的任一项的表达盒的载体。

7.用于鉴定和/或分离权利要求5所述的核苷酸的方法，其特征为，利用表3所示的引物SEQ ID NO：33和34鉴定和/或分离SEQ ID NO：9的序列、利用表3所示的引物SEQ ID NO：35和34鉴定和/或分离SEQ ID NO：10的序列、利用表3所示的引物SEQ ID NO：36和34鉴定和/或分离SEQ ID NO：11的序列。

8.权利要求7的方法，其中所述鉴定和/或分离是通过选自聚合酶链式反应、杂交和数据库筛选的方法实现。

9.提供或产生用于在植物的种子中异源表达的转基因表达盒的方法，其包含以下步骤：

I.根据权利要求7的方法分离权利要求5所述的核苷酸，和

II.将权利要求5所述的核苷酸功能性连接至相对于所述转录调节核苷酸序列异源的另一目的核苷酸序列。

10.提供用于种子特异性或者种子偏好性表达的转基因表达盒的方法，其包括步骤：

I.根据权利要求7的方法分离权利要求5所述的核苷酸，和

II.将权利要求5所述的核苷酸功能性连接至另一目的核苷酸序列，所述另一目的核苷酸序列相对于所述种子偏好性或种子特异性转录调节核苷酸序列是异源的。

11.表达盒，其包含

i)至少一个能够介导植物中的转录并且功能性的连接于其上的权利要求5所述的转录调节核苷酸的序列，

ii)至少一个核酸序列，并且功能性的连接于其上，

iii)至少一个选自由SEQ ID NO：125、126和127所述序列组成的组的序列：

其中所述序列iii)能够介导RNA稳定性，RNA表达、RNA

转录终止和/或RNA多聚腺苷化作用的稳定性；和

其中所述转录调节序列i)或所述序列iii)，或i)和iii)两者同时是相对于所述核苷酸序列ii)异源的。

12.表达盒在功能性连接的异源基因的种子特异性或偏好性转录中的用途，其中表达盒包含

i)由SEQ ID NO：9、10或11所述序列；