CN102027115A - 启动子、启动子控制元件以及其组合和用途 - Google Patents

启动子、启动子控制元件以及其组合和用途 Download PDF

Info

Publication number
CN102027115A
CN102027115A CN200980116964XA CN200980116964A CN102027115A CN 102027115 A CN102027115 A CN 102027115A CN 200980116964X A CN200980116964X A CN 200980116964XA CN 200980116964 A CN200980116964 A CN 200980116964A CN 102027115 A CN102027115 A CN 102027115A
Authority
CN
China
Prior art keywords
motif
nucleic acid
plant
seq
promotor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200980116964XA
Other languages
English (en)
Inventor
迈克尔·F·波特雷科
尼科莱·亚历山德罗夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ceres Inc
Original Assignee
Ceres Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ceres Inc filed Critical Ceres Inc
Publication of CN102027115A publication Critical patent/CN102027115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Abstract

本发明涉及启动子序列和启动子控制元件、包含所述启动子和控制元件的多核苷酸构建体、以及鉴定所述启动子、控制元件或它们的片段的方法。本发明还涉及这些启动子或启动子控制元件调节植物中转录水平的用途、以及含有这种启动子或启动子控制元件的植物。

Description

启动子、启动子控制元件以及其组合和用途
相关申请的交叉引用
本申请要求2008年3月31日提交的美国临时申请系列第61/041,018号的优先权。在先申请的公开内容以整体方式通过引用并入。
序列表或表格的引用并入
所附序列表中的材料通过引用并入本申请中。
技术领域
本发明涉及可用于调控期望的多核苷酸的转录的启动子和启动子控制元件。这种启动子和启动子控制元件可以被包括在多核苷酸构建体中、表达盒中、载体中、或插入到染色体中或作为外源元件来调控多核苷酸的体内和体外转录。使用包含本文所述的启动子和启动子控制元件的多核苷酸的具有期望性状或特征的宿主细胞(包括植物细胞)和有机体(例如自其再生的植物)也是本发明的一部分。
背景
本发明涉及可用于宿主细胞或转化的宿主生物体中多核苷酸转录的启动子序列和启动子控制元件序列。
向植物中引入基因导致具有如下的新的和可用的表型的植物开发:如病原体抗性、较高水平的更健康类型的油、健康组分的新颖生产,如水稻中的β-胡萝卜素合成。引入的基因一般为包括赋予期望的性状的编码区和调控序列的嵌合基因。一种调控序列是启动子,其位于编码区的5’端。此序列参与调控其3’编码区的表达模式。启动子序列结合RNA聚合酶复合体以及参与产生编码区的RNA转录物的一个或多个转录因子。
植物转化中所用的基因的启动子区最通常来源于与编码区不同的来源。它可以来自相同植物物种的不同基因、来自不同植物物种、来自植物病毒、藻类物种、真菌物种,或者它可以是不同的天然和/或合成序列的复合物。启动子序列的特性一般决定了与启动子可操作地连接的编码区的表达模式。已经描述了具有不同的表达特征的启动子。如在广泛使用的花椰菜花叶病毒(CaMV)35S启动子的情况下,启动子可以赋予广泛的表达。如在种子特异性菜豆蛋白启动子的情况下,启动子可以赋予组织特异性表达。启动子可以赋予表达的发育变化模式。可以通过施加的化学化合物或通过施加于植物的环境条件来诱导启动子。
用于调节具体的编码区的启动子通过该编码区所期望的表达模式来确定,表达模式本身则通过植物中所期望的最终表型来确定。例如,期望整个植物的除草剂抗性,所以35S启动子适于除草剂抗性基因的表达。种子特异性启动子适于改变大豆种子的含油量。胚乳特异性启动子适于改变玉米种子的淀粉组成。根特异性启动子可能对于改善植物中的水或养分的摄取很重要。通过启动子控制引入基因的表达很重要,因为在非靶组织中具有引入基因的表达有时是有害的。例如,诱导细胞死亡的基因可以在与生物限制(bioconfinement)有关的雄性和/或雌性配子细胞中表达。
生物技术的一个主要目标是获得具有特定的期望特征或性状的生物体,诸如植物、哺乳动物、酵母和原核生物。这些特征或性状的实例很丰富并且可以包括:例如,在植物中,病毒抗性、昆虫抗性、除草剂抗性、增强的稳定性或额外的营养价值。在遗传工程中的最近进展使得本领域的研究人员能够将多核苷酸序列整合到宿主细胞中以在所选的生物体中获得期望的品质。这种技术容许来自与所选的生物体不同来源的一种或多种多核苷酸被所选的生物体转录。如果期望,则可以调节这些新多核苷酸在生物体中的转录和/或翻译以表现期望的特征或性状。可选择地,可以产生生物体内源多核苷酸的转录和/或翻译的新模式。
概述
本发明涉及分离的多核苷酸序列,所述分离的多核苷酸序列包含来自植物尤其高粱(Sorghum bicolor)的启动子和启动子控制元件以及在植物中有功能的其他启动子和启动子控制元件。本发明的一个目的是提供分离的多核苷酸,所述分离的多核苷酸是启动子或启动子控制序列。这些启动子序列包含:例如,
(1)具有根据SEQ.ID.NO.1-18的核苷酸序列的多核苷酸;
(2)具有与根据SEQ.ID.NO.1-18的序列具有至少80%序列同一性的核苷酸序列的多核苷酸;以及
(3)具有在确定的Tm-5℃的条件下与根据SEQ.ID.NO.1-18的序列杂交的核苷酸序列的多核苷酸。
本发明的启动子或启动子控制元件序列能够调控优先转录。在一个实施方案中,本发明描述包括与SEQ ID NO.1-18的任一个或其片段所列的核苷酸序列具有90%或更高(例如,95%或更高,或98%或更高)序列同一性的调节区的分离的核酸,其中所述调节区指导可操作地连接的异源多核苷酸的转录。所述核酸可以包括选自由下列组成的组的一个或多个基序:ABRE基序、ABREATRD22基序、ABRERATCAL基序、ABREZMRAB28基序、ACGTABREMOTIFA2OSEM基序、ACIIPVPAL2基序、AGCBOXNPGLB基序、AMYBOX1基序、ARE1基序、ATHB1ATCONSENSUS基序、ATHB6COREAT基序、AUXRETGA2GMGH3基序、BOXIIPCCHS基序、CAATBOX1基序、CACGCAATGMGH3基序、CARGCW8GAT基序、CCA1ATLHCB1基序、CEREGLUBOX2PSLEGA基序、E2FAT基序、E2FCONSENSUS基序、ERELEE4基序、GADOWNAT基序、GARE1OSREP1基序、GAREAT基序、IBOXCORENT基序、INRNTPSADB基序、LRENPCABE基序、MARTBOX基序、MYBGAHV基序、MYBPLANT基序、NRRBNEXTA基序、P1BS基序、PRECONSCRHSP70A基序、ROOTMOTIFTAPOX1基序、RYREPEATGMGY2基序、RYREPEATVFLEB4基序、SBOXATRBCS基序、SP8BFIBSP8BIB基序、SPHCOREZMC1基序、TATABOX1基序、TATABOX2基序、TATABOX4基序、TATABOXOSPAL基序、TATCCAY基序OSRAMY3D基序、TE2F2NTPCNA基序、TRANSINITMONOCOTS基序、UP2ATMSD基序以及UPRMOTIFIIAT基序。
本发明还描述包含下列的载体构建体:第一核酸,其包含与SEQ ID NO.1-18的任一个或其片段具有90%或更高序列同一性(例如,95%或更高,或98%或更高)的调节区,其中所述调节区指导可操作地连接的异源多核苷酸的转录;以及待转录的第二核酸,其中所述第一核酸和第二核酸彼此是异源的并且可操作地连接。在一些实施方案中,第一核酸由SEQ ID NO:1-18中任一个所列的核酸组成。在一些实施方案中,第二核酸包括编码多肽的核酸序列。第二核酸可以以有义方向可操作地连接至第一核酸。在一些实施方案中,第二核酸可以转录成表达该第二核酸所编码的多肽的RNA分子。第二核酸可以以反义方向可操作地连接至第一核酸。第二核酸可以转录成反义RNA分子。第二核酸可以转录成针对内源基因的干扰RNA。
在另一方面,本发明描述用本文所述的分离的核酸或本文所述的载体构建体转化的转基因植物或植物细胞,所述分离的核酸与异源多核苷酸可操作地连接。本发明还描述这种植物的种子。在一些实施方案中,异源核酸编码农学上重要的多肽。
本发明还描述了在适于转录的环境中,通过组合下列物质来指导转录的方法:第一核酸,其包含与SEQ ID NO.1-18的任一个或其片段具有90%或更高序列同一性(例如,95%或更高,或98%或更高)的调节区;和待转录的第二核酸;其中所述第一核酸和第二核酸彼此是异源的并且可操作地连接。第一核酸分子可以由根据SEQ ID NO:1-18的任一个的序列组成。可操作地连接的第一核酸和第二核酸可以插入到植物细胞中,并且该植物细胞可以再生为植物。
在又一方面,本发明描述在植物中表达外源编码区的方法。该方法包括:用本文所述的载体转化植物细胞;由所述转化的植物细胞再生稳定地转化的植物;以及选择含有转化的植物细胞的植物,其中所述载体的表达导致第二核酸所编码的多肽的产生。
本发明还描述改变植物中基因表达的方法。该方法包括:用与异源多核苷酸可操作地连接的本文所述的核酸转化植物细胞,和由所述转化的植物细胞再生稳定地转化的植物。还描述了根据这种方法制备的植物以及由这种植物所获得的种子。
在另一方面,本发明描述产生转基因植物的方法。该方法将下列物质引入植物细胞:(i)与异源多核苷酸可操作地连接的本文所述的分离的多核苷酸、或(ii)本文所述的载体;并且由所述植物细胞生长植物。异源多核苷酸可以包括编码多肽的核酸序列。异源多核苷酸可以以反义方向可操作地连接至调节区。异源多核苷酸可以转录成干扰RNA。
在另一实施方案中,本发明的启动子控制元件能够充当或完成下列元件的功能:例如,核心启动子、TATA框、聚合酶结合位点、起始位点、转录结合位点、增强子、反向重复序列、基因座控制区和/或支架/基质附着区。
本发明的又一目的是提供包含至少第一启动子控制元件和第二启动子控制元件的多核苷酸。所述第一启动子控制元件是如上所讨论的启动子控制元件序列,并且所述第二启动子控制元件与所述第一启动子控制元件是异源的;其中,所述第一控制元件和第二控制元件可操作地连接。这种启动子可以在特定的组织或在特定的条件下优先调控转录水平。
在另一实施方案中,本发明的分离的多核苷酸包含如上所述的启动子或启动子控制元件,其中所述启动子或启动子控制元件与待转录的多核苷酸可操作地连接。
在本发明的另一实施方案中,本发明的启动子和启动子控制元件与是调控序列的异源多核苷酸可操作地连接。
本发明的另一目的是提供包含上述分离的多核苷酸或载体或其片段的宿主细胞。宿主细胞包括:例如,细菌、酵母、昆虫、哺乳动物、真菌、藻类和植物。宿主细胞可以包括对基因组外源的启动子或启动子控制元件。这种启动子可以以顺式和反式调控转录。在又一实施方案中,宿主细胞是能够再生为植物的植物细胞。
本发明的另一目的是提供在含有无细胞的转录系统或含有宿主细胞的样品中调控转录的方法。此方法包括:提供如上所述的根据本发明的多核苷酸或载体,并使所述多核苷酸或载体的样品接触容许转录的条件。
在本发明方法的另一实施方案中,多核苷酸或载体依据具体启动子的功能优先调控:组成性转录、胁迫诱导性转录、光诱导性转录、黑暗诱导性转录、叶转录、根转录、茎或芽转录、长角果或果实转录、愈伤组织转录、根茎转录、茎节转录、配子组织转录、花转录、未成熟的芽或小花和花序特异性转录、衰老诱导性转录、发芽转录和/或干旱转录。
本发明的其他的和另外的目的将由下列说明而清楚或变得明显。
表格和附图简述
表格由本文所述的各启动子的表达报告组成,并且提供了各启动子的核苷酸序列和转基因植物中所观察到的由各核酸启动子序列所驱动的表达的细节。结果呈现为空间表达的概述,其提供了关于在多种植物器官和组织中的总表达和/或特异性表达的信息。还呈现了观察到的表达模式,其给出了在不同代或一代内的不同发育阶段期间的表达细节。提供了关于启动子的来源生物体、用于构建体的载体和标记基因的额外信息。在各表格中一致地使用下列标号:
-T0:第一代转化体
-T1:第二代转化体
表格各行以该部分中所出现的数据标题开始。接着提供在各部分中所出现的数据的描述:
图1-CRS380_启动子_EGFP
图1是可用于将本文所述的启动子插入植物中的载体的示意性代表图。载体图谱中所用的缩写定义如下:Ori-大肠杆菌(E.coli)宿主所用的复制起点;RB-来自pMOG800的T-DNA的右缘的序列;SfiI-用于克隆的限制性酶裂解位点;EGFP-绿色荧光蛋白基因的增强形式;OCS-来自章鱼碱合酶基因的终止序列;p28716(也称为28716短)-用于驱动PAT(BAR)基因表达的启动子;PAT(BAR)-赋予除草剂抗性的标记基因;LB-来自pMOG800的T-DNA的左缘的序列;Spec-赋予大观霉素抗性的标记基因;TrfA-转录阻抑因子基因;RK2-OriV-用于农杆菌(Agrobacterium)的复制起点。
详细说明
提供了下列定义和方法以更好地定义本发明并在本发明的实践中指导本领域的普通技术人员。除非另外指明,否则术语应根据相关领域的普通技术人员的常规用法来理解。
本文所公开的文件提供了能够驱动可操作地连接的转基因表达的启动子。这些启动子的设计、构建和使用是本发明的一个目的。启动子序列SEQ ID NO:1-18能够在特定的植物组织/器官中或在特定的植物生长阶段期间转录可操作地连接的核酸分子,并且因此可以在这些组织/器官中或在植物发育的这些时间选择性地调节转基因的表达。
1.定义
术语“核酸”和“多核苷酸”在本文中可互换使用,并且是指RNA和DNA二者,包括cDNA、基因组DNA、合成DNA以及含有核酸类似物的DNA或RNA。多核苷酸可以具有任何三维结构。核酸可以是双链的或单链的,即,有义链或反义链。多核苷酸的非限制性实例包括:基因、基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、siRNA、微小RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸(branched polynucleotide)、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物以及核酸类似物。
分离的核酸可以是:例如,天然存在的DNA分子,只要紧邻天然存在的基因组中的DNA分子两侧的正常存在的核酸序列之一被移除或不存在即可。因此,分离的核酸包括但不限于作为独立于其他序列的单独的分子存在的DNA分子,例如化学合成的核酸、或通过聚合酶链式反应(PCR)或限制性内切酶处理所产生的cDNA或基因组DNA片段。分离的核酸还指整合到载体中、自动复制的质粒中或病毒中,或转化到原核生物或真核生物的基因组中的DNA分子。此外,分离的核酸可以包括工程化的核酸,例如是杂合核酸或融合核酸的一部分的DNA分子。认为在例如cDNA文库或基因组文库中或含有基因组DNA限制性消化物的凝胶片中的数百乃至数百万的其他核酸中所存在的核酸不是分离的核酸。
嵌合的:术语“嵌合的”用于描述多核苷酸或基因或构建体,其中所述多核苷酸或基因或构建体的至少两个元件如启动子和待转录的多核苷酸和/或其他调控序列和/或填充序列(filler sequence)和/或它们的互补序列彼此为异源的。
广泛表达的启动子:在本文中称为“广泛表达的启动子”的启动子积极地促进在大多数但不必是所有的环境条件和发育或细胞分化阶段下的转录。广泛表达的启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区、和源自根癌农杆菌(Agrobacterium tumefaciens)的T-DNA的1’或2’启动子、以及技术人员所已知的来自多种植物基因的其他转录起始区,如玉米泛素-1启动子。
结构域:结构域是可用于表征蛋白家族和/或蛋白的部分的指纹或标志。这种指纹或标志可以包括保守的(1)一级序列、(2)二级结构和/或(3)三维构象。可将类似的分析应用于多核苷酸。一般地,各结构域与保守的一级序列或序列基序相关。一般地,这些保守的一级序列基序与特异性的体外和/或体内活性相关。结构域可以为任何长度,包括待转录的整个多核苷酸。结构域的实例包括但不限于:AP2、解旋酶、同源框、锌指等。
内源:在本发明内容内的术语“内源”是指是细胞或由该细胞再生的生物体的天然部分的任何多核苷酸、多肽或蛋白序列。在启动子的上下文中,术语“内源编码区”或“内源cDNA”是指与该启动子天然地可操作连接的编码区。
增强子/阻抑子:“增强子”是可以增加转录物的稳态水平的DNA调节元件,其通常通过增加转录起始的速率进行。增强子通常发挥其作用而与增强子相对于转录起始位点的距离、上游或下游位置或方向无关。相反,“阻抑子”是降低转录物的稳态水平的相应DNA调节元件,其通常也是通过影响转录起始的速率进行的。增强子和阻抑子元件的基本活性是结合蛋白质因子。这种结合可以通过例如下面所述的方法测定。该结合通常以影响细胞中或体外转录提取物中的转录物稳态水平的方式进行。
外源:如其中所提到的“外源”是以通过有性杂交以外的任何方法被引入宿主细胞或由所述宿主细胞再生的生物体的基因组中的任何多核苷酸、多肽或蛋白质序列,无论是嵌合的或非嵌合的。可以完成其的方法的实例在下面描述,并且包括农杆菌介导的转化(对于双子叶植物-例如,Salomon等人(1984)EMBO J.3:141;Herrera-Estrella等人(1983)EMBO J.2:987;对于单子叶植物,代表性的论文为Escudero等人(1996)Plant J.10:355)、Ishida等人(1996)Nature Biotech 14:745;May等人(1995)Bio/Technology 13:486)的那些论文;生物射弹法(Armaleo等人(1990)Current Genetics 17:97);电穿孔;整株技术(in planta technique)以及类似方法。这种含有外源核酸的植物的原代转基因植物在此称为T0,并且第一代称为T1。本文所用的术语“外源”还旨在涵盖将天然存在的元件插入到非天然存在的位置中。
异源序列:“异源序列”是本质上彼此未被可操作地连接或不连续的那些序列。例如,认为来自玉米的启动子对拟南芥(Arabidopsis)编码区序列是异源的。而且,认为来自编码玉米的生长因子的基因的启动子对编码生长因子的玉米受体的序列是异源的。认为本质上不来源于与编码序列相同的基因的调节元件序列(诸如UTR或3′末端序列)对所述编码序列是异源的。彼此本质上可操作地连接并且连续的元件对彼此不是异源的。另一方面,这些相同的元件之间如果放入其他填充序列,则它们保持可操作地连接但是变为异源的。因此,表达氨基酸运载蛋白的玉米基因的启动子和编码序列对彼此不是异源的,但是以新颖的方式可操作地连接的玉米基因的启动子和编码序列是异源的。
同源:在本申请中,“同源”多核苷酸是指与感兴趣的多核苷酸具有序列相似性的多核苷酸。这种类似性可以仅在序列的片段中并且通常代表功能结构域,例如实例包括但不限于DNA结合结构域或具有酪氨酸激酶活性的结构域。同源多核苷酸的功能活性并非必须相同。
诱导型启动子:在本申请上下文中的“诱导型启动子”是指活性受如下的某些条件影响的启动子:如光、温度、化学物质浓度、蛋白质浓度、生物体、细胞或细胞器状态等。可用于本发明的多核苷酸的诱导型启动子的典型实例是PARSK1,它是来自编码丝氨酸-苏氨酸激酶的拟南芥基因的启动子,并且该启动子被脱水、脱落酸和氯化钠诱导(Wang和Goodman(1995)Plant J.8:37)。可以影响通过诱导型启动子转录的环境条件的实例包括:缺氧状态、升高的温度、养分或其他化合物存在与否、或光的存在。
异常表达:术语“异常表达”是指与野生型相比编码区转录成互补RNA序列的增加或减少。该术语还涵盖基因或编码区的表达和/或翻译或这种转录和/或翻译的抑制与野生型相比持续不同的时间,和/或基因或编码区来自植物基因组中的非天然位置,包括来自不同植物物种或来自非植物生物体的基因或编码区。
调控转录水平:如本文所用的短语“调控转录”描述启动子序列或启动子控制元件的生物活性。这种调控包括但不限于:转录起始、转录速率和/或转录水平的上调和下调。
可操作的连接:“可操作的连接”是其中启动子序列或启动子控制元件与多核苷酸序列以将多核苷酸序列的转录放置在该启动子或启动子控制元件的影响或控制之下的方式相连的连接。两种DNA序列(如待转录的多核苷酸和与待转录的多核苷酸的5’端连接的启动子序列)在下列情况下被说成是可操作地连接的:如果启动子功能的诱导导致编码该多核苷酸的mRNA转录并且如果在这两种DNA序列之间的连接的性质不会(1)导致移码突变的引入;(2)干扰启动子序列指导蛋白、反义RNA、RNAi或核酶表达的能力;或(3)干扰DNA模板被转录的能力。因此,如果启动子能够实现多核苷酸序列的转录,则该启动子序列与该多核苷酸序列可操作地连接。
序列同一性百分比如本文所用术语“序列同一性百分比”是指在任何给定的查询序列与主题序列之间相同的程度。主题序列通常具有查询序列长度的约80%至250%的长度,例如查询序列长度的82%、85%、87%、89%、90%、93%、95%、97%、99%、100%、105%、110%、115%、或120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%或250%。使用计算机程序ClustalW(1.83版,缺省参数)将查询核酸或氨基酸序列与一种或多种主题核酸或氨基酸序列比对,该程序容许核酸或蛋白序列沿它们的整个长度进行比对(总体比对)。Chenna等人(2003)Nucleic Acids Res.31(13):3497-500。
ClustalW计算查询序列与一个或多个主题序列之间的最佳匹配,并对它们进行比对以便可以确定同一性、相似性和差异。可以将一个或多个残基的空位(gap)插入到查询序列、主题序列或两者中以将序列比对最大化。对于核酸序列的快速成对比对,使用下列缺省参数:给定序列长度(word size):2;单位比对长度(window size):4;评分方法:百分比;上对角线数(number of top diagonal):4;和空位罚分:5。对于多个核酸序列的比对,使用下列参数:空位开放罚分(gap opening penalty):10.0;空位延伸罚分(gap extension penalty):5.0;和加权转变(weight transition):是(yes)。对于蛋白质序列的快速成对比对,使用下列参数:定序列长度:1;单位比对长度:5;评分方法:百分比;上对角线数:5;空位罚分:3。对于蛋白序列的多重比对,使用下列参数:加权矩阵(weight matrix):Blosum;空位开放罚分:10.0;空位延伸罚分:0.05;亲水空位:开(on);亲水残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys;残基特异性空位罚分:开。输出结果为反映序列之间的关系的序列比对。ClustalW可以在例如万维网上的贝勒医学院检索网站(Baylor College of Medicine Search Launcher website)和欧洲生物信息学研究所网站(European Bioinformatics Institute website)运行。
为了确定查询序列与主题序列之间的多肽或核酸序列的同一性百分比,使用Clustal W比对序列,将比对中相同匹配的数目除以查询长度,并将结果乘以100。输出结果为主题序列相对于查询序列的同一性百分比。应注意,同一性百分比值可以四舍五入至最接近的十分位。例如,78.11、78.12、78.13和78.14被四舍至78.1,而78.15、78.16、78.17、78.18和78.19被五入直至78.2。
植物启动子:“植物启动子”是能够启动植物细胞中的转录并且可以调控多核苷酸的转录的启动子。这种启动子不需要是植物来源的。例如,源自植物病毒的启动子如CaMV35S启动子或如T-DNA启动子的来自根癌农杆菌的启动子可以是植物启动子。植物来源的植物启动子的典型实例为本领域技术人员已知的玉米泛素-1(ubi-1)启动子。
植物组织:术语“植物组织”包括分化的和未分化的组织或植物,包括但不限于根、茎、芽、根茎、子叶、上胚轴、下胚轴、叶、花粉、种子、瘿组织和各种形式的培养细胞,如单细胞、原生质体、胚和愈伤组织。植物组织可以在植物中或在器官、组织或细胞培养物中。
优先转录:“优先转录”定义为在特定模式的细胞类型或发育时间或响应于特定的刺激物或它们的组合而发生的转录。优先转录的非限制性实例包括:根组织中期望序列的高水平转录;在胚胎发生期间某些细胞类型中期望序列的可检测水平的转录;以及在干旱条件下期望序列的低水平转录。这种优先转录可以通过测量转录的起始、速率和/或水平来确定。
启动子:“启动子”是指导多核苷酸转录的DNA序列。通常,启动子位于待转录的多核苷酸的5’区,接近该多核苷酸的转录起始位点。更通常地,启动子被定义为第一外显子上游的区域;更通常地,被定义为多个转录起始位点的第一个的上游区域;更通常地,定义为前面的基因的下游且在多个转录起始位点的第一个的上游的区域;更通常地,多聚A信号的下游且在多个转录起始位点的第一个的上游的区域;甚至更通常地,第一外显子的ATG上游的约3,000个核苷酸;甚至更通常地,多个转录起始位点的第一个的上游的2,000个核苷酸。本发明的启动子包括至少一个如上所定义的核心启动子。通常,启动子能够指导位于该启动子3’端的各互补DNA链上的基因转录。换言之,许多启动子表现出双方向性,并且可以在以任一方向(即,相对于基因的编码区为5’至3’或3’至5’)存在时指导下游基因的转录。另外,启动子还可以包含至少一个控制元件,如上游元件。这种元件包括UAR和任选地影响多核苷酸转录的其他DNA序列,如合成的上游元件。
启动子控制元件:如本文所用的术语“启动子控制元件”描述影响启动子活性的元件。启动子控制元件包括转录调节序列决定子,例如但不限于:增强子、支架/基质附着区、TATA框、转录起始基因座控制区、UAR、URR、其他转录因子结合位点和反向重复序列。
公开序列:如用于本申请上下文中的术语“公开序列”是指在本申请的申请日之前已保藏在可以公开得到的数据库中的任何序列。此术语涵盖了氨基酸和核苷酸序列二者。这种序列可以在例如NCBI FTP网站上的BLAST数据库上公开获得(经由因特网获得)。NCBI FTP网站的数据库利用由NCBI指定的“gi”编号作为数据库中每个序列的独特标识,从而提供了来自包括下列数据库的多个数据库的序列的非冗余数据库:GenBank、EMBL、DBBJ(日本的DNA数据库)和PDB(Brookhaven蛋白质数据库)。
调节区:术语“调节区”是指当可操作地连接至序列上时影响所述序列的转录起始或翻译起始或转录终止以及所述过程的速率、和/或转录或翻译产物的稳定性和/或移动性的核苷酸序列。如本文所用的术语“可操作地连接”是指能够达成所述影响的调节区与所述序列的定位。调节区包括但不限于:启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导元件、蛋白结合序列、5′和3′非翻译区(UTR)、转录起始位点、终止序列、多聚腺苷酸化序列和内含子。调节区可以被分为两类:启动子和其他调节区。
调节序列:如本申请中所用的术语“调节序列”是指影响转录或翻译的起始和速率或者转录物或多肽产物的稳定性和/或移动性的任何核苷酸序列。调节序列包括但不限于:启动子、启动子控制元件、蛋白质结合序列、5′和3′UTR、转录起始位点、终止序列、多聚腺苷酸化序列、内含子、氨基酸编码序列内的某些序列如分泌信号、蛋白酶裂解位点等。
特异性启动子:在本申请的上下文里“特异性启动子”是指对调控在特定组织、或器官或细胞和/或生物体发育期间的特定时间的转录物水平高度优先的启动子亚类。所谓“高度优先”意指与考虑的任何其他参考条件下的转录相比,在特定条件下转录水平增加了至少3倍,优选5倍,更优选至少10倍,甚至更优选至少20倍、50倍或100倍。可用于本发明的多核苷酸的植物来源的瞬时特异性和/或组织特异性或器官特异性启动子的典型实例是:PTA29,能够在绒毡层和仅在花粉囊发育期间特异性地驱动基因转录的启动子(Koltonow等人(1990)Plant Cell 2:1201);RCc2和RCc3,指导水稻中根特异性基因转录的启动子(Xu等人(1995)Plant Mol.Biol.27:237);TobRB27,来自烟草的根特异性启动子(Yamamoto等人(1991)Plant Cell 3:371)。受发育控制的组织特异性启动子的实例包括仅在某些组织或器官如根、胚珠、果实、种子或花中启动转录的启动子。其他特异性启动子包括来自编码种子储藏蛋白或脂质体膜蛋白、油质蛋白的基因的那些启动子。几种根特异性启动子在上面提到。还参见“优先转录”。
严紧性:如本文所用的“严紧性”是核酸分子探针长度、核酸分子探针组成(G+C含量)、盐浓度、有机溶剂浓度和杂交温度和/或洗涤条件的函数。严紧性通常由参数Tm来衡量,以与Tm的温差表示,Tm是在杂交测定中互补核酸分子的50%被杂交的温度。高严紧性条件是提供Tm-5℃至Tm-10℃的条件的那些条件。中度或适度严紧性条件是提供Tm-20℃至Tm-29℃的那些条件。低严紧性条件是提供Tm-40℃至Tm-48℃的条件的那些条件。杂交条件与Tm(℃)之间的关系由以下数学等式表示:
Tm=81.5-16.6(log10[Na+])+0.41(%G+C)-(600/N)            (I)
其中N是核酸分子探针的核苷酸数。这个等式很好地适用于长度为14至70个核苷酸的与靶序列相同的探针。DNA-DNA杂交体的Tm的下列等式可用于长度介于50至大于500个核苷酸的范围内的探针,并且用于包含有机溶剂(甲酰胺)的条件:
Tm=81.5+16.6log{[Na+]/(1+0.7[Na+])}+0.41(%G+C)-500/L 0.63(%甲酰胺)(II)
其中L表示杂交体的探针中的核苷酸数(21)。等式II的Tm受杂交体的性质影响:对于DNA-RNA杂交体,Tm比计算值高10-15℃;对于RNA-RNA杂交体,Tm高20-25℃。因为使用长探针时,同源性每增加1%,Tm就降低约1℃(Frischauf等人(1983)J.MolBiol,170:827-842),可以调节严紧性条件以利于相同的基因或相关家族成员的检测。
等式II是在假设反应处于平衡的条件下得到的。因此,根据本发明的杂交最优选是在探针过量并且容许足够的时间来达到平衡的条件下进行的。达到平衡所需的时间可以通过使用杂交缓冲液来缩短,该杂交缓冲液含有杂交加速剂,如硫酸葡聚糖或另一高容量聚合物。
严紧性可以在杂交反应期间或在杂交发生后通过改变洗涤溶液的盐和温度条件来控制。上面所显示的公式在用于计算洗涤溶液的严紧性时同样有效。优选的洗涤溶液严紧性处于上述范围内;高严紧性为低于Tm5-8℃,中度或适度的严紧性为低于Tm26-29℃并且低严紧性为低于Tm45-48℃。
T0:术语“T0”是指用转化培养基培植的整个植物、外植体或愈伤组织。
T1:术语T1在整个植物转化的情况下是指T0植物的子代,或者在外植体或愈伤组织转化的情况下是指再生的幼苗。
T2:术语T2是指T1植物的子代。T2子代是T1植物自体受精或异花授粉的结果。
T3:术语T3是指为转化实验的直接结果的植物的第二代子代。T3子代是T2植物自体受精或异花授粉的结果。
TATA至起点:“TATA至起点”应意指一级TATA基序与转录起点之间的以核苷酸数计的距离。
转基因植物:“转基因植物”是具有含通过重组核酸方法引入的至少一个外源多核苷酸的一个或多个植物细胞的植物。
翻译起始位点:在本申请的上下文中,“翻译起始位点”通常是转录物中的ATG或AUG,通常为第一个ATG或AUG。然而,编码单个蛋白质的转录物可以具有多个翻译起始位点。
转录起始位点:“转录起始位点”用在本申请中来描述转录开始的点。该点通常位于距TFIID结合位点(如TATA框)的下游约25个核苷酸处。转录可以在基因中的一个或多个位点开始,并且待转录的单个多核苷酸可以具有多个转录起始位点,它们中的一些可能对特定细胞类型或组织或器官中的转录具有特异性。“+1”是相对于转录起始位点而言的并且表示转录物中的第一个核苷酸。
上游激活区(UAR):“上游激活区”或“UAR”是位置或方向依赖性的核酸元件,其主要指导转录水平的组织、器官、细胞类型或环境调节,通常通过影响转录起始的速率而进行。具有转录抑制作用的对应DNA元件在本文中称为“上游阻抑区”或“URR”。这些元件的基本活性是结合蛋白质因子。这种结合可以通过下面所述的方法测定。该结合通常以影响细胞中或体外转录提取物中的转录物稳态水平的方式进行。
非翻译区(UTR):非翻译区(UTR):“UTR”是被转录但是不被翻译的任何连续核苷酸碱基系列。5′UTR处于转录物的起始位点和翻译起始密码子(ATG密码子)之间并且包括信使RNA或cDNA的+1核苷酸。可选择地,5’UTR可以为合成制备的或操纵的DNA元件。“植物5’UTR”可以是在植物细胞中有功能的固有的或非固有的5’UTR。5’UTR可以用作5′调节元件来调控可操作地连接的可转录多核苷酸分子表达。例如,已证明源自热激蛋白基因的5′UTR增强植物中的基因表达(参见例如,美国专利第5,659,122号和美国专利第5,362,865号,它们全部都通过引用并入本文)。5’UTR的实例包括在SEQ ID NO:1-7、SEQ ID NO:9-12、SEQ ID NO:16-18中显示的那些。3′UTR处于转录终止密码子和转录物末端之间。UTR可以具有诸如增加mRNA信息稳定性或翻译弱化的特定功能。3′UTR的实例包括但不限于多聚腺苷酸化信号和转录终止序列。
2.启动子的用途
本发明的启动子和启动子控制元件能够调控转录。此类启动子和启动子控制元件可以与固有的或异源的启动子片段、控制元件或其他调节序列组合用于调控转录和/或翻译。
具体地,本发明的启动子和控制元件可用于调控期望的多核苷酸的转录,所述期望的多核苷酸包括但不限于:
a)反义;
b)核酶;
c)编码序列;或
d)它们的片段。
启动子还可以顺式或反式调控宿主基因组中的转录。
在诸如植物的生物体中,本发明的启动子和启动子控制元件可用于产生优先转录,该优先转录会在特定细胞、组织或器官中或者在特定条件下产生期望模式的转录水平。
3.鉴定和分离启动子序列
本发明的启动子和启动子控制元件在自高粱(Sorghum bicolor)所鉴定的启动子报告表中列出。使用已知的技术从包含本发明的启动子和启动子控制元件的多核苷酸的基因组文库中分离是可能的。例如,聚合酶链式反应(PCR)可以使用自SEQ ID NO:1-18设计的引物来扩增期望的多核苷酸。包含基因组序列的多核苷酸文库可以根据例如Sambrook等人,Molecular  Cloning:A Laboratory Manual(分子克隆:实验室手册),第2版.(1989)Cold Spring Harbor Press,Cold Spring Harbor,NY)构建。
分离包含本发明的启动子序列的多核苷酸的其他方法包括但不限于热不对称交错PCR(tail-PCR)和cDNA端的5′快速扩增(RACE)。参见,对于热不对称交错PCR,例如Liu等人(1995)Plant J 8(3):457-463;Liu等人(1995)Genomics 25:674-681;Liu等人(1993)Nucl.Acids Res.21(14):3333-3334;以及Zoe等人(1999)BioTechniques 27(2):240-248;对于RACE,参见,例如PCR Protocols:AGuide to Methods and Applications(PCR方案:方法与应用指南),(1990)Academic Press,Inc。
此外,在启动子报告表中所描述的启动子和启动子控制元件(SEQ.ID.No.1-18)可以根据常用技术化学合成。参见,例如Beaucage等人(1981)Tet.Lett.22:1859和美国专利第4,668,777号。这种化学的寡核苷酸合成可以使用商购获得的装置进行,例如Perkin-Elmer Corp.,Foster City,California,USA的分部Applied Biosystems的Biosearch 4600或8600 DNA合成仪;以及Perceptive Biosystems,Framingham,Massachusetts,USA的Expedite。
本发明包括表现出与SEQ.ID.No.1-18的核苷酸序列同一性的启动子。具体地,本发明的启动子可以表现出与SEQ.ID.No.1-18的任一个中所列的核苷酸序列相比至少80%的序列同一性(例如,至少85%、至少90%、至少95%、96%、97%、98%或99%的序列同一性)。序列同一性可由上述算法和计算机程序计算。此外,本文所述的启动子还可以是SEQ ID NO:1-18的任一个的片段,只要该片段保留指导多核苷酸转录的能力即可。合适的片段可以是例如SEQ ID NO:1-18的任一个中所列的核苷酸序列的长度的至少80%(例如,至少85%、90%、95%、96%、97%、98%或99%)。例如,调节区可以是保留了指导可操作地连接的核酸表达的能力的SEQ ID NO:1-18的任一个的片段,该片段长度为100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200或2400个核苷酸。
调节区可以含有保守的调节基序。这种调节区可以具有SEQ ID NO:1-18的任一个中所列的核苷酸序列,或者可以是具有衍生自SEQ ID NO:1-18中所列的核苷酸序列同时保留指导可操作地连接的核酸表达的能力的调节区。例如,调节区可以含有CAAT框或TATA框。CAAT框是参与转录起始的保守核苷酸序列。CAAT框充当称为转录因子的调节蛋白的识别和结合位点。TATA框是参与转录起始的另一保守核苷酸序列。TATA框似乎对于准确地确定转录起始的位置很重要。
其他保守的调节基序可以使用本领域中已知的方法鉴定。例如,调节区可以使用dna.affrc.go.jp/PLACE/signalscan.html的万维网上的PLACE(PLAnt顺式作用调节DNA元件)网络信号扫描程序(Web Signal Scan program)来分析。参见,Higo等人,Nucleic Acids Research,27(1):297-300(1999);和Prestridge,CABIOS,7:203-206(1991)。保守的调节基序的实例可以见于dna.affrc.go.jp/PLACE/的万维网上的PLACE数据库中。参见,Higo等人,如上。
具有SEQ ID NO:1-18的任一个中所列的核苷酸序列的调节区,或者具有衍生自SEQ ID NO:1-18中所列的核苷酸序列同时保留指导可操作地连接的核酸表达的能力的调节区可以含有一个或多个保守的调节基序,该基序可见于PLACE数据库中。例如,调节区可以含有具有共有序列ACGTG的ABRE基序。参见,Simpson等人,Plant J.33:259-270(2003);Nakashima等人,Plant Mol Biol.60:51-68(2006)。调节区可以含有具有共有序列RYACGTGGYR(SEQ ID NO:19)的ABREATRD22基序。参见,Iwasaki等人,Mol Gen Genet 247:391-398(1995);Bray,Trends Plant Sci.2:48-54(1997);Busk和Pages,Plant Mol Biol 37:425-435(1998)。调节区可以含有具有共有序列MACGYGB的ABRERATCAL基序。参见,Kaplan等人,Plant Cell.18:2733-2748(2006)。调节区可以含有具有共有序列CCACGTGG的ABREZMRAB28基序。参见,Suzuki等人,Plant Physiol.139:437-447(2005);Busk和Pages,Plant Mol Biol 37:425-435(1998);Alonso-Blanco等人,PlantPhysiology 139:1304-1312(2005);Guan等人,Plant J 22:87-95(2000);Benedict等人,Plant Cell Environ.29:1259-1272(2006);Jaglo-Ottosen等人,Science 1998 3:104-106(1998);以及Gilmour等人,Plant J 16:433-442(1998)。调节区可以含有具有共有序列ACGTGKC的ACGTABREMOTIFA2OSEM基序。参见,Hattori等人,Plant Cell Physiol 43:136-140(2002);和Narusaka等人,Plant J.34:137-148(2003)。调节区可以含有具有共有序列CCACCAACCCCC(SEQ ID NO:20)的ACIIPVPAL2基序。参见,Patzlaff等人,Plant Mol Biol.53:597-608(2003);Hatton等人,Plant J 7:859-876(1995);以及Gomez-Maldonado等人,Plant J.39:513-526(2004)。调节区可以含有具有共有序列TATTCT的AGCBOXNPGLB基序。参见,Hart等人,Plant Mol Biol 21:121-131(1993);Fujimoto等人,Plant Cell 12:393-404(2000);Sato等人,Plant Cell Physiol 37:249-255(1996);Ohme-Takagi等人,Plant Cell Physiol 41:1187-1192(2000);Rushton等人,Plant Cell 14:749-762(2002);Cheong等人,Plant Physiol.132:1961-1972(2003);和Zhang等人,Planta.220:262-270(2004)。调节区可以含有具有共有序列TAACARA的AMYBOX1基序。参见,Huang等人,Plant Mol Biol 14:655-668(1990)。调节区可以含有具有共有序列RGTGACNNNGC(SEQ ID NO:21)的ARE1基序。参见,Rushmore等人,J Biol Chem 266:11632-11639(1991)。调节区可以含有具有共有序列CAATWATTG的ATHB1ATCONSENSUS基序。参见,Sessa等人,EMBO J 12:3507-3517(1993)。调节区可以含有具有共有序列CAATTATTA的ATHB6COREAT基序。参见,Himmelbach等人,EMBO J.21:3029-3038(2002)。调节区可以含有具有共有序列TGACGTAA的AUXRETGA2GMGH3基序。参见,Liu等人,Plant Cell 6:645-657(1994);Liu等人,Plant Physiol 115:397-407(1997);以及Guilfoyle等人,Plant Physiol 118:341-347(1998)。调节区可以含有具有共有序列ACGTGGC的BOXIIPCCHS基序。参见,Block等人,Proc Natl Acad Sci USA 87:5387-5391(1990);Terzaghi和Cashmore,Annu Rev Plant Physiol Plant Mol Biol 46:445-474(1995);以及Nakashima等人,Plant Mol Biol.60:51-68(2006)。调节区可以含有具有共有序列CCAAT的CAATBOX1基序。参见,Shirsat等人,Mol Gen Genet 215:326-331(1989)。调节区可以含有具有共有序列CACGCAAT的CACGCAATGMGH3基序。参见,Ulmasov等人,Plant Cell 7:1611-1623(1995)。调节区可以含有具有共有序列CWWWWWWWWG(SEQ ID NO:22)的CARGCW8GAT基序。参见,Tang和Perry,J Biol Chem.278:28154-28159(2003);Folter和Angenent,Trends Plant Sci.11:224-231(2006)。调节区可以含有具有共有序列AAMAATCT的CCA1ATLHCB1基序。参见,Wang等人,Plant Cell 9:491-507(1997)。调节区可以含有具有共有序列TGAAAACT的CEREGLUBOX2PSLEGA基序。参见,Shirsat等人,如上。调节区可以含有具有共有序列TYTCCCGCC的E2FAT基序。参见,Ramirez-Parra等人,Plant J.33:801-811(2003)。调节区可以含有具有共有序列WTTSSCSS的E2FCONSENSUS基序。参见,Vandepoele等人,Plant Physiol.139:316-328(2005)。调节区可以含有具有共有序列AWTTCAAA的ERELEE4基序。参见,Itzhaki等人,Proc Natl Acad Sci USA 91:8925-8929(1994);Montgomery等人,Proc Natl Acad Sci USA 90:5939-5943(1993);Tapia等人,Plant Physiol.138:2075-2086(2005);以及Rawat等人,Plant Mol Biol.57:629-643(2005)。调节区可以含有具有共有序列ACGTGTC的GADOWNAT基序。参见,Ogawa等人,Plant Cell 15:1591-1604(2003);以及Nakashima等人,Plant Mol Biol.60:51-68(2006)。调节区可以含有具有共有序列TAACAGA的GARE1OSREP1基序。参见,Sutoh和Yamauchi,Plant J.34:636-645(2003)。调节区可以含有具有共有序列TAACAAR的GAREAT基序。参见,Ogawa等人,Plant Cell 15:1591-1604(2003)。调节区可以含有具有共有序列GATAAGR的IBOXCORENT基序。参见,Martinez-Hernandez等人,Plant Physiol.128:1223-1233(2002)。调节区可以含有具有共有序列YTCANTYY的INRNTPSADB基序。参见,Nakamura等人,Plant J 29:1-10(2002)。调节区可以含有具有共有序列ACGTGGCA的LRENPCABE基序。参见,Castresana等人,EMBO J 7:1929-1936(1988)。调节区可以含有具有共有序列TTWTWTTWTT(SEQ ID NO:23)的MARTBOX基序。参见,Gasser等人,Int Rev Cyto 119:57-96(1989)。调节区可以含有具有共有序列TAACAAA的MYBGAHV基序。参见,Gubler等人,Plant Cell 7:1879-1891(1995);Morita等人,FEBS Lett 423:81-85(1998);Gubler等人,Plant J.17:1-9(1999)。调节区可以含有具有共有序列MACCWAMC的MYBPLANT基序。参见,Sablowski等人,EMBO J 13:128-137(1994);Tamagnone等人,Plant Cell 10:135-154(1998)。调节区可以含有具有共有序列TAGTGGAT的NRRBNEXTA基序。参见,Elliott和Shirsat,Plant Mol Biol 37:675-687(1998)。调节区可以含有具有共有序列GNATATNC的P1BS基序。参见,Rubio等人,Genes Dev.15:2122-2133.(2001);Shunmann等人,J Exp Bot.55:855-865.(2004);以及Shunmann等人,Plant Physiol.136:4205-4214(2004)。调节区可以含有具有共有序列SCGAYNRNNNNNNNNNNNNNNNHD(SEQ ID NO:24)的PRECONSCRHSP70A基序。参见,von Gromoff等人,Nucleic Acids Res.34:4767-4779(2006)。调节区可以含有具有共有序列ATATT的ROOTMOTIFTAPOX1基序。参见,Elmayan和Tepfer,Transgenic Res 4:388-396(1995)。调节区可以含有具有共有序列CATGCAT的RYREPEATGMGY2基序。参见,Lelievre等人,Plant Physiol 98:387-391(1992)。调节区可以含有具有共有序列CATGCATG的RYREPEATVFLEB4基序。参见,Curaba等人,Plant Physiol.136:3660-3669(2004);和Nag等人,Plant Mol Biol.59:821-838(2005)。调节区可以含有具有共有序列CACCTCCA的SBOXATRBCS基序。参见,Acevedo-Hernandez等人,Plant J.43:506-519(2005)。调节区可以含有具有共有序列TACTATT的SP8BFIBSP8BIB基序。参见,Ishiguro和Nakamura,Plant Mol Biol 18:97-108(1992);Ishiguro和Nakamura,Mol Gen Genet 244:563-571(1994)。调节区可以含有分别具有共有序列CTATAAATAC(SEQ ID NO:25)、TATAAAT和TATATAA的TATABOX1、TATABOX2或TATABOX4基序。参见,Grace等人,J Biol Chem.279:8102-8110(2004);和Shirsat等人,如上。调节区可以含有具有共有序列TATTTAA的TATABOXOSPAL基序。参见,Zhu等人,Plant Cell 14:795-803(2002)。调节区可以含有具有共有序列TATCCAY的TATCCAYMOTIFOSRAMY3D基序。参见,Toyofuku等人,FEBS Lett 428:275-280(1998);和Rubio-Somoza等人,Plant J.47:269-281(2006)。调节区可以含有具有共有序列ATTCCCGC的TE2F2NTPCNA基序。参见,Kosugi和Ohashi,Plant J 29:45-59(2002)。调节区可以含有具有共有序列RMNAUGGC的TRANSINITMONOCOTS基序。参见,Joshi等人,Plant Mol Biol 35:993-1001(1997)。调节区可以含有具有共有序列AAACCCTA的UP2ATMSD基序。参见,Tatematsu等人,Plant Physiol.138:757-766(2005)。调节区可以含有具有共有序列CCNNNNNNNNNNNNCCACG(SEQ ID NO:26)的UPRMOTIFIIAT基序。参见,Martinez和Chrispeels,Plant Cell.15:561-576(2003);和Oh等人,Biochem Biophys Res Commun.301:225-230(2003)。
在一些实施方案中,调节区具有与SEQ ID NO:1中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有GARE1OSREP1、ACIIPVPAL2、ABRERATCAL和TATABOX基序。GARE1OSREP1基序可以是SEQ ID NO:1的核苷酸80至86或核苷酸122至128的基序,或者是与SEQ ID NO:1中的那些基序异源的GARE1OSREP1基序。ACIIPVPAL2基序可以是SEQ ID NO:1的核苷酸201至212的基序,或者是与SEQ ID NO:1中的基序异源的ACIIPVPAL2基序。ABRERATCAL基序可以是SEQ ID NO:1的核苷酸327至333的基序,或者是与SEQ ID NO:1中的基序异源的ABRERATCAL基序。TATABOX可以是SEQ ID NO:1的核苷酸461至467的基序,或者是与SEQ ID NO:1中的基序异源的TATABOX。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:1的核苷酸501至561或1069至1100的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:2中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有AUXRETGA2GMGH3、ACGTABREMOTIFA2OSEM、TATCCAYMOTIFOSRAMY3D、AMYBOX1和GAREAT基序。AUXRETGA2GMGH3基序可以是SEQ ID NO:2的核苷酸24至32的基序,或者是与SEQ ID NO:2中的基序异源的AUXRETGA2GMGH3基序。ACGTABREMOTIFA2OSEM基序可以是SEQ ID NO:2的核苷酸24至30的基序,或者是与SEQ ID NO:2中的基序异源的ACGTABREMOTIFA2OSEM基序。TATCCAYMOTIFOSRAMY3D基序可以是SEQ ID NO:2的核苷酸52至58的基序,或者是与SEQ ID NO:2中的基序异源的TATCCAYMOTIFOSRAMY3D基序。AMYBOX1基序可以是SEQ ID NO:2的核苷酸135至141的基序,或者是与SEQ ID NO:2中的基序异源的AMYBOX1基序。GAREAT基序可以是SEQ ID NO:2的核苷酸135至141的基序,或者是与SEQ ID NO:1中的基序异源的GAREAT基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:2的核苷酸140至219的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:3中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有ARE1、SBOXATRBCS、TE2F2NTPCNA、GADOWNAT、ACGTABREMOTIFA2OSEM和TATABOX基序。ARE1基序可以是SEQ ID NO:3的核苷酸124至134的基序,或者是与SEQ ID NO:3中的基序异源的ARE1基序。SBOXATRBCS基序可以是SEQ ID NO:3的核苷酸202至209的基序,或者是与SEQ ID NO:3中的基序异源的SBOXATRBCS基序。TE2F2NTPCNA基序可以是SEQ ID NO:3的核苷酸240至247的基序,或者是与SEQ ID NO:3中的基序异源的TE2F2NTPCNA基序。GADOWNAT基序可以是SEQ ID NO:3的核苷酸308至314的基序,或者是与SEQ ID NO:3中的基序异源的GADOWNAT基序。ACGTABREMOTIFA2OSEM基序可以是SEQ ID NO:3的核苷酸308至314的基序,或者是与SEQ ID NO:3中的基序异源的ACGTABREMOTIFA2OSEM基序。TATABOX可以是SEQ ID NO:3的核苷酸280至286的基序,或者是与SEQ ID NO:3中的基序异源的TATABOX。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:3的核苷酸311至400的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:4中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有ROOTMOTIFTAPOX1、RYREPEATVFLEB4和TATABOX基序。ROOTMOTIFTAPOX1基序可以是SEQ ID NO:4的核苷酸179至183或182至186的基序,或者是与SEQ ID NO:4中的那些基序异源的ROOTMOTIFTAPOX1基序。RYREPEATVFLEB4基序可以是SEQ ID NO:4的核苷酸225至232或229至236的基序,或者是与SEQ ID NO:4中的那些基序异源的RYREPEATVFLEB4基序。TATABOX可以是SEQ ID NO:4的核苷酸292至299的基序,或者是与SEQ ID NO:4中的基序异源的TATABOX基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:4的核苷酸324至420的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:5中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有CARGCW8GAT、INRNTPSADB和TATABOX2基序。CARGCW8GAT基序可以是SEQ ID NO:5的核苷酸415至424的基序,或者是与SEQ ID NO:5中的基序异源的CARGCW8GAT基序。INRNTPSADB基序可以是SEQ ID NO:5的核苷酸580至587的基序,或者是与SEQ ID NO:5中的基序异源的INRNTPSADB基序。TATABOX2基序可以是SEQ ID NO:5的核苷酸417至423的基序,或者是与SEQ ID NO:5中的基序异源的TATABOX2基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:5的核苷酸630至759的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:6中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有MARTBOX、RYREPEATVFLEB4、NRRBNEXTA、TRANSINITMONOCOTS、TATABOXOSPAL和P1BS基序。MARTBOX基序可以是SEQ ID NO:6的核苷酸453至462的基序,或者是与SEQ ID NO:6中的基序异源的MARTBOX基序。RYREPEATVFLEB4基序可以是SEQ ID NO:6的核苷酸480至487或832至839的基序,或者是与SEQ ID NO:6中的那些基序异源的RYREPEATVFLEB4基序。NRRBNEXTA基序可以是SEQ ID NO:6的核苷酸693至700的基序,或者是与SEQ ID NO:6中的基序异源的NRRBNEXTA基序。TRANSINITMONOCOTS基序可以是SEQ ID NO:6的核苷酸853至860的基序,或者是与SEQ ID NO:6中的基序异源的TRANSINITMONOCOTS基序。TATABOXOSPAL基序可以是SEQ ID NO:6的核苷酸884至890的基序,或者是与SEQ ID NO:6中的基序异源的TATABOXOSPAL基序。P1BS基序可以是SEQ ID NO:6的核苷酸907至914的基序,或者是与SEQ ID NO:6中的基序异源的P1BS基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:6的核苷酸914至1020的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:7中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有CARGCW8GAT、P1BS和TATABOX基序。CARGCW8GAT基序可以是SEQ ID NO:7的核苷酸294至303或394至403的基序,或者是与SEQ ID NO:7中的那些基序异源的CARGCW8GAT基序。P1BS基序可以是SEQ ID NO:7的核苷酸666至673的基序,或者是与SEQ ID NO:7中的基序异源的P1BS基序。TATABOX可以是SEQ ID NO:7的核苷酸883至891的基序,或者是与SEQ ID NO:7中的基序异源的TATABOX基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:7的核苷酸917至1075的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:8中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有ROOTMOTIFTAPOX1、ATHB6COREAT、TATABOX2和UP2ATMSD基序。ROOTMOTIFTAPOX1基序可以是SEQ ID NO:8的核苷酸120至124、392至396或522至526的基序,或者是与SEQ ID NO:8中的那些基序异源的ROOTMOTIFTAPOX1基序。ATHB6COREAT基序可以是SEQ ID NO:8的核苷酸779至787的基序,或者是与SEQ ID NO:8中的基序异源的ATHB6COREAT基序。TATABOX2基序可以是SEQ ID NO:8的核苷酸813至819的基序,或者是与SEQ ID NO:8中的基序异源的TATABOX2基序。UP2ATMSD基序可以是SEQ ID NO:8的核苷酸951至958的基序,或者是与SEQ ID NO:8中的基序异源的UP2ATMSD基序。在一些情况下,这种调节区还可以包含5’UTR。
在一些实施方案中,调节区具有与SEQ ID NO:9中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有PRECONSCRHSP70A、IBOXCORENT、AGCBOXNPGLB、UP2ATMSD和TATABOX4基序。PRECONSCRHSP70A基序可以是SEQ ID NO:9的核苷酸22至45、38至61或60至83的基序,或者是与SEQ ID NO:9中的那些基序异源的PRECONSCRHSP70A基序。IBOXCORENT基序可以是SEQ ID NO:9的核苷酸153至159的基序,或者是与SEQ ID NO:9中的基序异源的IBOXCORENT基序。AGCBOXNPGLB基序可以是SEQ ID NO:9的核苷酸216至222或306至312的基序,或者是与SEQ ID NO:9中的那些基序异源的AGCBOXNPGLB基序。UP2ATMSD基序可以是SEQ ID NO:9的核苷酸306至312的基序,或者是与SEQ ID NO:9中的基序异源的UP2ATMSD基序。TATABOX4基序可以是SEQ ID NO:9的核苷酸359至365的基序,或者是与SEQ ID NO:9中的基序异源的TATABOX4基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:9的核苷酸390至1428的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:10中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有IBOXCORENT、ERELEE4、ABREATRD22、P1BS和TATABOX基序。IBOXCORENT基序可以是SEQ ID NO:10的核苷酸1472至1478的基序,或者是与SEQ ID NO:10中的基序异源的IBOXCORENT基序。ERELEE4基序可以是SEQ ID NO:10的核苷酸1565至1572或2270至2277的基序,或者是与SEQ ID NO:10中的那些基序异源的ERELEE4基序。ABREATRD22基序可以是SEQ ID NO:10的核苷酸2193至2202的基序,或者是与SEQ ID NO:10中的基序异源的ABREATRD22基序。P1BS基序可以是SEQ ID NO:10的核苷酸2353至2360的基序,或者是与SEQ ID NO:10中的基序异源的P1BS基序。TATABOX基序可以是SEQ ID NO:10的核苷酸2391至2396的基序,或者是与SEQ ID NO:10中的基序异源的TATABOX基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:10的核苷酸2426至2485的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:11中所列的多核苷酸序列或其片段(例如,含有SEQ ID NO:11的核苷酸1至896的片段)具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有CACGCAATGMGH3和UPRMOTIFIIAT基序。CACGCAATGMGH3基序可以是SEQ ID NO:11的核苷酸716至723的基序,或者是与SEQ ID NO:11中的基序异源的CACGCAATGMGH3基序。UPRMOTIFIIAT基序可以是SEQ ID NO:11的核苷酸770至788的基序,或者是与SEQ ID NO:11中的基序异源的UPRMOTIFIIAT基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:11的核苷酸837至896的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:12中所列的多核苷酸序列或其片段(例如,含有SEQ ID NO:12的核苷酸501至2000的片段,在本文中称为PD3777)具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有PRECONSCRHSP70A、ACIIPVPAL2、TATABOX4和CAAT-box基序。PRECONSCRHSP70A基序可以是SEQ ID NO:12的核苷酸535至558的基序,或者是与SEQ ID NO:12中的基序异源的PRECONSCRHSP70A基序。ACIIPVPAL2基序可以是SEQ ID NO:12的核苷酸765至776的基序,或者是与SEQ ID NO:12中的基序异源的ACIIPVPAL2基序。TATABOX4基序可以是SEQ ID NO:12的核苷酸954至960的基序,或者是与SEQ ID NO:12中的基序异源的TATABOX4基序。CAAT-box基序可以是SEQ ID NO:12的核苷酸986至990的基序,或者是与SEQ ID NO:12中的基序异源的CAAT-box基序。在一些实施方案中,这种调节区还含有CAATBOX1和UPRMOTIFIIAT基序。CAATBOX1基序可以是SEQ ID NO:12的核苷酸11至15的基序,或者是与SEQ ID NO:12中的基序异源的CAATBOX1基序。UPRMOTIFIIAT基序可以是SEQ ID NO:12的核苷酸326至344的基序,或者是与SEQ ID NO:12中的基序异源的UPRMOTIFIIAT基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:12的核苷酸984至1043的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:13中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有RYREPEATVFLEB4、SPHCOREZMC1和AGCBOXNPGLB基序。RYREPEATVFLEB4基序可以是SEQ ID NO:13的核苷酸786至793的基序,或者是与SEQ ID NO:13中的基序异源的RYREPEATVFLEB4基序。SPHCOREZMC1基序可以是SEQ ID NO:13的核苷酸787至795的基序,或者是与SEQ ID NO:13中的基序异源的SPHCOREZMC1基序。AGCBOXNPGLB基序可以是SEQ ID NO:13的核苷酸1082至1088的基序,或者是与SEQ ID NO:13中的基序异源的AGCBOXNPGLB基序。在一些情况下,这种调节区还可以包含5’UTR。
在一些实施方案中,调节区具有与SEQ ID NO:14中所列的多核苷酸序列或其片段(例如,SEQ ID NO:14的核苷酸501至990)具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有RYREPEATVFLEB4、P1BS和TATABOX1基序。RYREPEATVFLEB4基序可以是SEQ ID NO:14的核苷酸707至713或795至801的基序,或者是与SEQ ID NO:14中的那些异源RYREPEATVFLEB4基序。P1BS基序可以是SEQ ID NO:14的核苷酸798至805的基序,或者是与SEQ ID NO:14中的基序异源的P1BS基序。TATABOX1基序可以是SEQ ID NO:14的核苷酸855至864的基序,或者是与SEQ ID NO:14中的基序异源的TATABOX1基序。在一些实施方案中,这种调节区还包含ROOTMOTIFTAPOX1基序。例如,ROOTMOTIFTAPOX1基序可以是SEQ ID NO:14的核苷酸27至31、77至81或145至149的基序,或者是与SEQ ID NO:14中的那些基序异源的ROOTMOTIFTAPOX1基序。在一些情况下,这种调节区还可以包含5’UTR。
在一些实施方案中,调节区具有与SEQ ID NO:15中所列的多核苷酸序列或其片段(例如,SEQ ID NO:15的核苷酸702至1500)具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有SBOXATRBCS、MYB结合位点和ATHB1ATCONSENSUS基序。SBOXATRBCS基序可以是SEQ ID NO:15的核苷酸846至853的基序,或者是与SEQ ID NO:15中的那些基序异源的SBOXATRBCS基序。MYB结合位点基序可以是SEQ ID NO:15的核苷酸994至999的基序,或者是与SEQ ID NO:15中的基序异源的MYB结合位点基序。ATHB 1ATCONSENSUS基序可以是SEQ ID NO:15的核苷酸1315至1323的基序,或者是与SEQ ID NO:15中的基序异源的ATHB1ATCONSENSUS基序。在一些实施方案中,这种调节区还包含ABRE、E2FAT、PRECONSCRHSP70A、MYBPLANT和E2FCONSENSUS基序。例如,ABRE基序可以是SEQ ID NO:15的核苷酸80至85的基序,或者是与SEQ ID NO:15中的那些基序异源的ABRE基序。E2FAT基序可以是SEQ ID NO:15的核苷酸139至147的基序,或者是与SEQ ID NO:15中的基序异源的E2FAT基序。PRECONSCRHSP70A基序可以是SEQ ID NO:15的核苷酸167至190或297至320的基序,或者是与SEQ ID NO:15中的那些基序异源的PRECONSCRHSP70A基序。MYBPLANT基序可以是SEQ ID NO:15的核苷酸269至276的基序,或者是与SEQ ID NO:15中的基序异源的MYBLANT基序。E2FCONSENSUS基序可以是SEQ ID NO:15的核苷酸526至533的基序,或者是与SEQ ID NO:15中的基序异源的E2FCONSENSUS基序。在一些情况下,这种调节区还可以包含5’UTR。
在一些实施方案中,调节区具有与SEQ ID NO:16中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有P1BS、ABREZMRAB28、SP8BFIBSP8BIB、CCA1ATLHCB1、BOXIIPCCHS和LRENPCABE基序。P1BS基序可以是SEQ ID NO:16的核苷酸739至746的基序,或者是与SEQ ID NO:16中的基序异源的P1BS基序。ABREZMRAB2基序可以是SEQ ID NO:16的核苷酸349至356的基序,或者是与SEQ ID NO:16中的基序异源的ABREZMRAB2基序。SP8BFIBSP8BIB基序可以是SEQ ID NO:16的核苷酸1168至1174、1347至1353或1377至1383的基序,或者是与SEQ ID NO:16中那些基序异源的SP8BFIBSP8BIB基序。CCA1ATLHCB1基序可以是SEQ ID NO:16的核苷酸1509至1516的基序,或者是与SEQ ID NO:16中的基序异源的CCA1ATLHCB1基序。BOXIIPCCHS基序可以是SEQ ID NO:16的核苷酸1624至1630的基序,或者是与SEQ ID NO:16中的基序异源的BOXIIPCCHS基序。LRENPCABE基序可以是SEQ ID NO:16的核苷酸1624至1631的基序,或者是与SEQ ID NO:16中的基序异源的LRENPCABE基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:16的核苷酸1857至1989的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:17中所列的多核苷酸序列或其片段具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有P1BS、MYBGAHV和CEREGLUBOX2PSLEGA基序。P1BS基序可以是SEQ ID NO:17的核苷酸261至268或716至723的基序,或者是与SEQ ID NO:17中的基序异源的P1BS基序。MYBGAHV基序可以是SEQ ID NO:17的核苷酸430至436的基序,或者是与SEQ ID NO:17中的基序异源的MYBGAHV基序。CEREGLUBOX2PSLEGA基序可以是SEQ ID NO:17的核苷酸484至491的基序,或者是与SEQ ID NO:17中的基序异源的CEREGLUBOX2PSLEGA基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:17的核苷酸930至1000的5’UTR,或者可以是异源的UTR。
在一些实施方案中,调节区具有与SEQ ID NO:18中所列的多核苷酸序列或其片段(SEQ ID NO:18的核苷酸353至1248)具有90%或更高序列同一性的核苷酸序列,其中所述核酸含有CACGCAATGMGH3或UPRMOTIFIIAT基序。注意SEQ ID NO:18的核苷酸353至1500与SEQ ID NO:11的核苷酸1至1148相同。CACGCAATGMGH3基序可以是SEQ ID NO:18的核苷酸1068至1075的基序,或者是与SEQ ID NO:18中的基序异源的CACGCAATGMGH3基序。UPRMOTIFIIA基序可以是SEQ ID NO:18的核苷酸1122至1140的基序,或者是与SEQ ID NO:18中的基序异源的UPRMOTIFIIA基序。在一些情况下,这种调节区还可以包含5’UTR。5’UTR可以是SEQ ID NO:18的核苷酸1189至1248的5’UTR,或者可以是异源的UTR。
4.启动子的测试
通过下列步骤测试本发明的启动子的活性:将序列克隆到适当的载体中,用构建体转化植物并测定标记基因的表达。制备重组DNA构建体,该构建体包含插入到适于转化植物细胞的载体中的本发明的启动子序列。构建体可以使用标准的重组DNA技术(Sambrook等人1989)来制备,并且可以通过农杆菌介导的转化或通过下面所提到的其他转化方式被引入感兴趣的物种中。
载体骨架可以是本领域中典型的那些骨架的任一种,如质粒、病毒、人工染色体、BAC、YAC和PAC以及下面所述类别的载体:
(a)BAC:Shizuya等人(1992)Proc.Natl.Acad.Sci.USA 89:8794-8797;Hamilton等人(1996)Proc.Natl.Acad.Sci.USA 93:9975-9979;
(b)YAC:Burke等人(1987)Science 236:806-812;
(c)PAC:Sternberg N.等人(1990)Proc Natl Acad Sci U S A.87(1):103-7;
(d)细菌-酵母穿梭载体:Bradshaw等人(1995)Nucl Acids Res 23:4850-4856;
(e)λ噬菌体载体:置换型载体,例如Frischauf等人(1983)J.Mol Biol 170:827-842;或插入型载体,例如Huynh等人(1985)在Glover NM(编辑)DNA Cloning:A practical Approach(DNA克隆:一种实用方法),第1卷,Oxford:IRL Press中;T-DNA基因融合载体:Walden等人(1990)Mol Cell Biol 1:175-194;以及
(g)质粒载体:Sambrook等人,如下文。
通常,构建体含有包含与任何标记基因可操作地连接的本发明启动子序列的载体。启动子通过标记基因的表达而被鉴定为启动子。尽管可以使用许多标记基因,但绿色荧光蛋白(GFP)是优选的。载体还可以包含赋予植物细胞可选择表型的标记基因。标记物可以编码杀生物剂抗性,尤其为抗生素抗性,如卡那霉素、G418、博来霉素、潮霉素抗性;或除草剂抗性,如氯磺隆(chlorosulfuron)或草胺膦(phosphinotricin)抗性。载体还可以包括复制起点、支架附着区(SAR)、标记物、同源序列、内含子等。
5.构建具有控制元件的启动子
5.1 组合启动子与启动子控制元件
本发明的启动子和启动子控制元件二者均为天然存在的和合成的,它们可单独或彼此组合使用以产生期望的优先转录。而且,本发明的启动子可以与其他已知序列相组合以获得其他可用的启动子来调控例如特异的组织转录或对某些条件特异的转录。这种优先转录可以使用上述技术或测定来确定。
启动子可以含有任何数目的控制元件。例如,启动子可以含有多个转录结合位点或其他控制元件。一种元件可以赋予组织或器官特异性;另一种元件可以限制在特定时间段的转录等。通常,启动子将至少含有如上所述的基础启动子或核心启动子。可以根据需要含有任何其他的元件。例如,例如,包含基础启动子或“核心”启动子的片段可以与具有任何数目的其他控制元件的另一片段融合。
下面是在胁迫条件下诱导的并且可以与本发明的那些启动子相组合的启动子:ldh1(氧应激;番茄;参见Germain和Ricard(1997)Plant Mol Biol 35:949-54)、GPx和CAT(氧应激;小鼠;参见Franco等人(1999)Free Radic Biol Med 27:1122-32)、ci7(冷胁迫;马铃薯;参见Kirch等人(1997)Plant Mol Biol.33:897-909)、Bz2(重金属;玉米;参见Marrs和Walbot(1997)Plant Physiol 113:93-102)、HSP32(过热;大鼠;参见Raju和Maines(1994)Biochim Biophys Acta 1217:273-80)以及MAPKAPK-2(热激;果蝇;参见Larochelle和Suter(1995)Gene 163:209-14)。
此外,下列启动子的实例是通过存在或不存在光而诱导的,可以与本发明的那些启动子组合使用:拓扑异构酶II(豌豆;参见Reddy等人(1999)Plant Mol Biol 41:125-37)、查耳酮合酶(大豆;参见Wingender等人(1989)Mol Gen Genet 218:315-22)、mdm2基因(人肿瘤;参见Saucedo等人(1998)Cell Growth Differ 9:119-30)、Clock和BMAL1(大鼠;参见Namihira等人(1999)Neurosci Lett 271:1-4)、PHYA(拟南芥;参见Canton和Quail(1999)Plant Physiol 121:1207-16)、PRB-1b(烟草;参见Sessa等人(1995)Plant Mol Biol 28:537-47)和Ypr10(普通菜豆;参见Walter等人(1996)Eur J Biochem 239:281-93)。
下列基因的启动子和控制元件可以与本发明组合使用以赋予组织特异性:用于根的MipB(冰叶日中花(iceplant);Yamada等人(1995)Plant Cell 7:1129-42)和SUCS(根瘤;蚕豆;Kuster等人(1993)Mol Plant Microbe Interact 6:507-14)、用于叶的OsSUT1(稻;Hirose等人(1997)Plant Cell Physiol38:1389-96)、用于长角果的Msg(大豆;Stomvik等人(1999)Plant Mol Biol 41:217-31)、用于花序的cell(拟南芥;Shani等人(1997)Plant Mol Biol 34(6):837-42)和ACT11(拟南芥;Huang等人(1997)Plant Mol Biol 33:125-39)。
还有其他启动子受激素的影响或参与特定的生理过程,它们可与本发明的那些启动子组合使用。一些实例是被乙烯和油菜素类固醇差异性诱导的ACC合酶基因(绿豆;Yi等人(1999)Plant Mol Biol 41:443-54)、在脱落期间有活性的TAPG1基因(番茄;Kalaitzis等人(1995)Plant Mol Biol 28:647-56),以及1-氨基环丙烷-1-羧酸合酶基因(康乃馨(carnation);Jones等人(1995)Plant Mol Biol 28:505-12)和CP-2/组织蛋白酶L基因(大鼠;Kim和Wright(1997)Biol Reprod 57:1467-77),两者均在衰老期间为活性的。
可以确定或优化控制元件之间的间距或控制元件的构型以容许发生期望的蛋白-多核苷酸或多核苷酸相互作用。
例如,如果两个转录因子同时或时间相当接近地结合启动子,则将结合位点间隔以容许各因子结合而没有空间位阻。这样的两个杂交控制元件之间的间距可以与结合控制元件的蛋白质的轮廓一样小。在一些情况下,当蛋白质在转录过程中不同时间结合时,两个蛋白质结合位点可以彼此邻近。
此外,当两个控制元件杂交时,这两个元件之间的间距将足以容许启动子多核苷酸形成发夹或形成环以容许这两个元件结合。这两个杂交控制元件之间的间距可以为与t-RNA环一样小,至10kb大。
通常,间距不小于5个碱基;更通常,不小于8个;更通常,不小于15个碱基;更通常,不小于20个碱基;更通常,不小于25个碱基;甚至更通常,不小于30、35、40或50个碱基。
通常,片段大小不长于5kb碱基;更通常,不长于2kb;更通常,不长于1kb;更通常,不长于800个碱基;更通常,不长于500个碱基;甚至更通常,不大于250、200、150或100个碱基。
启动子控制元件之间的这种间隔可以使用上述技术和测定来确定。
5.2 用于转化细胞/宿主的载体
可以通过任何植物转化方法将含有本发明的启动子的植物转化构建体引入植物中。用于在本发明的实践中通过将植物表达构建体引入植物基因组来转化植物的方法和材料可以包括任何熟知的和已证明的方法,包括:电穿孔(美国专利第5,384,253号);微粒轰击(美国专利第5,015,580号;美国专利第5,550,318号;美国专利第5,538,880号;美国专利第6,160,208号;美国专利第6,399,861号;和美国专利第6,403,865号);农杆菌介导的转化(美国专利第5,824,877号;美国专利第5,591,616号;美国专利第5,981,840号;和美国专利第6,384,301号);以及原生质体转化(美国专利第5,508,184号)。
可以通过载体将本发明的启动子和/或启动子控制元件递送至系统,如细胞。为了本发明的目的,这种递送的范围可以是从简单地将启动子或启动子控制元件自身随机地引入细胞中到整合含有本发明的启动子或启动子控制元件的克隆载体。因此,载体不必限于具有在宿主细胞中自主复制的能力的DNA分子,如质粒、粘粒或细菌噬菌体。还包括了递送本发明的启动子和启动子控制元件的所有其他方式。多种T-DNA载体类型是用于本发明的优选载体。一些可用的载体是可商购获得的。
还可能有用的是将标记序列与本发明的启动子和启动子控制元件连接以确定这些序列的活性。标记序列通常包括提供抗生素抗性或提供除草剂抗性的基因,所述抗生素抗性如四环素抗性、潮霉素抗性或氨苄西林抗性。具体的选择性标记基因可用于赋予对诸如草甘膦、草胺膦(glufosinate)或溴草腈的除草剂抗性(Comai等人(1985)Nature 317:741-744;Gordon-Kamm等人(1990)Plant Cell 2:603-618;和Stalker等人(1988)Science 242:419-423)。存在提供激素反应性的其他标记基因。
本发明的启动子或启动子控制元件可以可操作地连接至待转录的多核苷酸上。以这种方式,启动子或启动子控制元件可以通过在插入基因组中时调控该多核苷酸的转录水平来修饰转录。
然而,在插入到基因组中之前,启动子或启动子控制元件不是必须与待转录的多核苷酸可操作地或以其他方式连接。例如,启动子或启动子控制元件可以单独插入到基因组中已经存在于基因组中的多核苷酸之前。以此方式,启动子或启动子控制元件可以调控已经存在于基因组中的多核苷酸的转录。这种多核苷酸可以是基因组所固有的或在较早的时间插入的。
可选择地,启动子或启动子控制元件可以单独插入到基因组中以调控转录。参见,例如Vaucheret,H等人(1998)Plant J 16:651-659。更确切地,启动子或启动子控制元件可以简单地插入到基因组中或保持在染色体外作为将系统的转录资源转向自身的途径。这种方法可用于下调一组多核苷酸的转录水平。
待转录的多核苷酸的性质不受限制。具体地,多核苷酸可以包括具有RNA活性的序列以及产生多肽产物的序列。这些序列可以包括但不限于反义序列、RNAi序列、核酶序列、剪接体、氨基酸编码序列以及它们的片段。具体的编码序列可以包括但不限于内源蛋白质或其片段、或包括标记基因的异源蛋白质或其片段。
本发明的构建体通常含有与可转录的核酸分子可操作地连接的启动子,该可转录的核酸分子与3’转录终止核酸分子可操作地连接。此外,构建体可以包括但不限于来自植物基因的3’非翻译区(3′UTR)的其他的调节核酸分子(例如,增加mRNA的mRNA稳定性的3′UTR,如马铃薯的PI-II终止区或章鱼碱合酶或胭脂氨酸合酶3’终止区)。构建体可以包括但不限于可以在翻译起始中起重要作用并且还可以是植物表达构建体的遗传组分的mRNA核酸分子的5′非翻译区(5′UTR)。例如,已证明源自热激蛋白基因的非翻译的5′前导核酸分子增强植物中的基因表达(参见例如,美国专利第5,659,122号和美国专利第5,362,865号,它们全部都通过引用并入本文)。这些另外的上游和下游调节核酸分子可以源自对于启动子构建体上所存在的其他元件为固有的或异源的来源。
因此,本发明的一个实施方案是诸如SEQ ID NO:1-18中所提供的启动子或其片段,其与可转录的核酸分子可操作地连接以便在将所述构建体引入植物细胞中之后指导所述可转录的核酸分子以期望的水平或在期望的组织或发育模式中转录。在一些情况下,可转录的核酸分子包含基因的蛋白质编码区,并且启动子提供了被翻译和表达为蛋白质产物的功能mRNA分子的转录。还可以将构建体构建为用于反义RNA分子或其他类似的抑制性RNA的转录以便抑制靶宿主细胞中感兴趣的特定RNA分子表达。
用于整合到本发明的构建体中的示例性可转录核酸分子包括:例如,来自非靶基因物种的物种的核酸分子或基因、或者甚至是起源于或存在于相同的物种中但是通过遗传工程方法而非经典的再生或育种技术整合到受体细胞中的基因。外源基因或遗传元件旨在表示引入受体细胞中的任何基因或核酸分子。外源核酸分子中所包括的核酸分子的类型可以包括:已经存在于植物细胞中的核酸分子、来自另一植物的核酸分子、来自不同生物体的核酸分子、或外部产生的核酸分子如含基因的反义信息的核酸分子、或编码人工的或修饰形式的基因的核酸分子。
可以使用如所述的标记基因将本发明的启动子整合到构建体中并且在瞬时分析中对其进行测试,所述瞬时分析提供在稳定的植物系统中基因表达的指示。如本文所用的术语“标记基因”是指其表达可以某种方式被筛选或评分的任何可转录核酸分子。在瞬时测定中测试标记基因表达的方法是本领域技术人员已知的。已报道了使用多种植物、组织、植物细胞和DNA递送系统进行的标记基因的瞬时表达。例如,瞬时分析的类型可以包括但不限于使用任何感兴趣的植物物种在任何瞬时植物测定中经由电穿孔或粒子轰击的直接基因递送。这种瞬时系统将包括但不限于来自多种组织来源的原生质体的电穿孔或感兴趣的特定组织的粒子轰击。本发明涵盖了使用任何瞬时表达系统来评价与任何可转录的核酸分子可操作地连接的启动子或启动子片段,所述可转录的核酸分子包括但不限于选择的报道基因、标记基因或农学上重要的基因。预计经由适当的递送系统瞬时测试的植物组织的实例包括但不限于:叶基组织、愈伤组织、子叶、根、胚乳、胚、花组织、花粉和表皮组织。
本发明的启动子和控制元件可用于调控代谢或分解代谢过程。这种过程包括但不限于:次级产物代谢、氨基酸合成、种子蛋白质储存、生物量增加、油形成(oil development)、害虫防御和氮利用。可以被本发明调控的参与这些过程的基因、转录物和肽或多肽的一些实例为:色氨酸脱羧酶(tdc)和异胡豆苷合成酶(strl)、二氢吡啶二羧酸合酶(DHDPS)和天冬氨酸激酶(AK)、2S白蛋白和α-玉米醇溶蛋白、β-玉米醇溶蛋白、和γ-玉米醇溶蛋白、蓖麻油酸酯和3-酮酯酰-ACP合酶(KAS)、苏芸金芽孢杆菌(Bacillus thuringiensis(Bt))杀虫蛋白、豇豆胰蛋白酶抑制剂(CpTI)、天冬酰胺合成酶和亚硝酸还原酶。可选择地,可以通过将启动子整合到用于反义使用、共抑制使用或产生显性失活突变的构建体中来使用表达构建体抑制这些肽和多肽的表达。
如上面所解释的,存在关于转录调节的多种类型的调节元件。如果期望,可以将这些调节元件的每一种与本发明的载体组合。真核mRNA的翻译通常是在编码第一个甲硫氨酸的密码子处开始。因此,当构建用于表达蛋白质产物的根据本发明的重组多核苷酸时,优选确保在启动子的3’部分(优选包括TATA框)与待转录的多核苷酸之间的连接或其功能衍生物不含有能够编码甲硫氨酸的任何干扰密码子。
本发明的载体可以含有另外的组分。例如,复制起点容许载体在宿主细胞中复制。另外,在特定序列侧翼的同源序列容许特定序列在靶基因组中的期望位置特异性重组。T-DNA序列还容许特定序列随机插入靶基因组中。
载体还可以设有多个限制性位点以用于插入待转录的多核苷酸以及本发明的启动子和/或启动子控制元件。载体可以另外含有选择性标记基因。载体还可以含有在宿主细胞中具有功能的转录和翻译起始区以及转录和翻译终止区。终止区可以是转录起始区所固有的、可以是待转录的多核苷酸所固有的、或可以源自另一来源。方便的终止区可以自根癌农杆菌(A.Tumefaciens)的Ti-质粒获得,如章鱼碱合酶和胭脂氨酸合酶终止区。还参见Guerineau等人(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res.17:7891-7903;Joshi等人(1987)Nucleic Acid Res.15:9627-9639。
适当时可以优化待转录的多核苷酸以使在某些宿主中的表达增加。例如,可以使用用于改善的转录和翻译的优选密码子来合成多核苷酸。参见美国专利第5,380,831号、第5,436,391号;并且还参见Murray等人(1989)Nucleic Acids Res.17:477-498。
其他的序列修饰包括消除编码假多聚腺苷酸化信号、外显子内含子剪接位点信号、转座子样重复序列的序列以及已充分地证明对表达有害的其他此类序列。可以将多核苷酸的G-C含量调节至给定细胞宿主的平均水平,如通过参考宿主细胞中表达的已知基因所计算的。可以修饰多核苷酸序列以避免mRNA二级发夹结构。
表达载体和报道基因的一般描述可见于Gruber等人(1993)“Vectors for Plant Transformation(用于植物转化的载体)”在Methods in Plant Molecular Biology & Biotechnology(植物分子生物学与生物技术中的方法)中,Glich等人编辑,第89-119页,CRC Press。此外,GUS表达载体和GUS基因盒可以自Clonetech Laboratories,Inc.,Palo Alto,California获得,而荧光素酶表达载体和荧光素酶基因盒可以自Promega Corp.(Madison,Wisconsin)获得。GFP载体可以自Aurora Biosciences获得。
5.3 多核苷酸插入到宿主细胞中
根据本发明的启动子可以被插入宿主细胞中。宿主细胞包括但不限于:植物、哺乳动物、昆虫、酵母和原核细胞,优选植物细胞。
插入宿主细胞基因组的方法基于方便性来选择。例如,向宿主细胞基因组的插入可以通过将整合到宿主细胞基因组中的载体或通过独立于宿主细胞基因组存在的载体来完成。
本发明的启动子可以自主地存在于宿主细胞基因组中或独立于宿主细胞基因组存在。这些类型的载体是本领域中已知的并且包括:例如,某些类型的非整合病毒载体、自主复制的质粒、人工染色体以及类似物。
另外,在一些情况下可能期望启动子瞬时表达。
可以将本发明的启动子序列、启动子控制元件或载体转化到宿主细胞中。这些转化可以在原生质体中或完整的组织中或分离的细胞中。优选地,将表达载体引入完整的组织中。培养植物组织的一般方法提供于:例如Maki等人(1993)“Procedures for Introducing Foreign DNA into Plants(将外来DNA引入植物中的步骤)”在Methods in Plant Molecular Biology & Biotechnology(植物分子生物学与生物技术中的方法)中,Glich等人编辑,第67-88页CRC Press;和Phillips等人(1988)“Cell-Tissue Culture and In-Vitro Manipulation(细胞-组织培养和体外操作)”在Corn & Corn Improvement(谷物与谷物改良)中,第3版Sprague等人编辑,第345-387页,American Society of Agronomy Inc.等。
将多核苷酸引入植物组织的方法包括直接感染或将植物细胞与根癌农杆菌共培养,Horsch等人(1985)Science,227:1229。农杆菌载体系统和用于农杆菌介导的基因转移的方法的描述由Gruber等人(如上)提供。
可选择地,使用直接基因转移法将多核苷酸引入植物细胞或其他植物组织,所述直接基因转移法如微粒介导的递送、DNA注射、电穿孔以及类似方法。更优选地,使用利用基因枪装置的微粒介质递送将多核苷酸引入植物组织中。参见,例如Tomes等人,“Direct DNA transfer into intact plant cells via microprojectile bombardment(经由微粒轰击将DNA直接转移到完整的植物细胞中)”在:Gamborg和Phillips(编辑)Plant Cell,Tissue and Organ Culture:Fundamental Methods(植物细胞、组织和器官培养:基础方法),Springer Verlag,Berlin(1995)中。
用于特异性转化双子叶植物的方法是本领域技术人员所熟知的。使用这些方法的转化和植物再生已经在大量作物中描述,包括但不限于:棉花(Gossypium hirsutum)、大豆(Glycine max)、花生(Arachis hypogaea)和芸苔属(Brassica)成员。
用于转化单子叶植物的方法是本领域技术人员所熟知的。使用这些方法的转化和植物再生已经在大量作物中描述,包括但不限于:大麦(Hordeum vulgarae);玉米(Zea mays);燕麦(Avena sativa);鸭茅(Dactylis glomerata);稻(Oryza sativa,包括籼稻(indica)和粳稻(japonica)品种);高粱(Sorghum bicolor);甘蔗(Saccharum sp);高羊茅(Festuca arundinacea);草坪物种(例如,物种:匍匐剪股颖(Agrostis stolonifera)、草地早熟禾(Poa pratensis)、金边钝叶草(Stenotaphrum secundatum));小麦(Triticum aestivum)、柳枝稷(Panicum vigatum)和紫苜蓿(Medicago sativa)。对本领域技术人员来说明显的是,可以使用大量的转化方法并对其改造以便由任何数目的感兴趣的靶植物产生稳定的转基因植物。
本文所述的多核苷酸和载体可用于转化大量单子叶植物和双子叶植物和植物细胞系统,包括来自下列科之一的物种:爵床科(Acanthaceae)、葱科(Alliaceae)、六出花科(Alstroemeriaceae)、石蒜科(Amaryllidaceae)、夹竹桃科(Apocynaceae)、棕榈科(Arecaceae)、菊科(Asteraceae)、小檗科(Berberidaceae)、红木科(Bixaceae)、十字花科(Brassicaceae)、凤梨科(Bromeliaceae)、大麻科(Cannabaceae)、石竹科(Caryophyllaceae)、三尖杉科(Cephalotaxaceae)、藜科(Chenopodiaceae)、秋水仙科(Colchicaceae)、葫芦科(Cucurbitaceae)、薯蓣科(Dioscoreaceae)、麻黄科(Ephedraceae)、古柯科(Erythroxylaceae)、大戟科(Euphorbiaceae)、豆科(Fabaceae)、唇形科(Lamiaceae)、亚麻科(Linaceae)、石松科(Lycopodiaceae)、锦葵科(Malvaceae)、黑药花科(Melanthiaceae)、芭蕉科(Musaceae)、桃金娘科(Myrtaceae)、蓝果树科(Nyssaceae)、罂粟科(Papaveraceae)、松科(Pinaceae)、车前科(Plantaginaceae)、禾本科(Poaceae)、蔷薇科(Rosaceae)、茜草科(Rubiaceae)、杨柳科(Salicaceae)、无患子科(Sapindaceae)、茄科(Solanaceae)、红豆杉科(Taxaceae)、山茶科(Theaceae)或葡萄科(Vitaceae)。
合适的物种可以包括下列属的成员:秋葵属(Abelmoschus)、冷杉属(Abies)、槭属(Acer)、剪股颖属(Agrostis)、葱属(Allium)、六出花属(Alstroemeria)、凤梨属(Ananas)、穿心莲属(Andrographis)、须芒草属(Andropogon)、蒿属(Artemisia)、芦竹属(Arundo)、颠茄属(Atropa)、小檗属(Berberis)、甜菜属(Beta)、红木属(Bixa)、芸苔属、金盏花属(Calendula)、山茶属(Camellia)、喜树属(Camptotheca)、大麻属(Cannabis)、辣椒属(Capsicum)、红花属(Carthamus)、长春花属(Catharanthus)、三尖杉属(Cephalotaxus)、茼蒿属(Chrysanthemum)、金鸡纳属(Cinchona)、西瓜属(Citrullus)、咖啡属(Coffea)、秋水仙属(Colchicum)、鞘蕊花属(Coleus)、黄瓜属(Cucumis)、南瓜属(Cucurbita)、狗牙根属(Cynodon)、曼陀罗属(Datura)、石竹属(Dianthus)、毛地黄属(Digitalis)、薯蓣属(Dioscorea)、油棕属(Elaeis)、麻黄属(Ephedra)、蔗茅属(Erianthus)、古柯属(Erythroxylum)、桉属(Eucalyptus)、羊茅属(Festuca)、草莓属(Fragaria)、雪花莲属(Galanthus)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、大麦属(Hordeum)、天仙子属(Hyoscyamus)、麻风树属(Jatropha)、莴苣属(Lactuca)、亚麻属(Linum)、毒麦属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、石松属(Lycopodium)、木薯属(Manihot)、苜蓿属(Medicago)、薄荷属(Mentha)、芒属(Miscanthus)、芭蕉属(Musa)、烟草属(Nicotiana)、稻属(Oryza)、黍属(Panicum)、罂粟属(Papaver)、银胶菊属(Parthenium)、狼尾草属(Pennisetum)、矮牵牛属(Petunia)、虉草属(Phalaris)、梯牧草属(Phleum)、松属(Pinus)、早熟禾属(Poa)、大戟属(Poinsettia)、杨属(Populus)、萝芙木属(Rauwolfia)、蓖麻属(Ricinus)、蔷薇属(Rosa)、甘蔗属(Saccharum)、柳属(Salix)、血根草属(Sanguinaria)、东莨菪属(Scopolia)、黑麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、大米草属(Spartina)、菠菜属(Spinacea)、菊蒿属(Tanacetum)、红豆杉属(Taxus)、可可属(Theobroma)、小黑麦属(Triticosecale)、小麦属(Triticum)、北美穗草属(Uniola)、藜芦属(Veratrum)、蔓长春花属(Vinca)、葡萄属(Vitis)和玉蜀黍属(Zea)。
合适的物种包括黍属物种或其杂交种、高粱属物种或其杂交种、苏丹草、芒属物种或其杂交种、甘蔗属物种或其杂交种、蔗茅属物种、杨属物种、大须芒草(Andropogon gerardii,big bluestem)、象草(Pennisetum purpureum,elephant grass)或其杂交种(例如,象草×御谷(Pennisetum typhoidum))、虉草(Phalaris arundinacea,reed canarygrass)、狗牙根(Cynodon dactylon,bermudagrass)、高羊茅(Festuca arundinacea,tall fescue)、草原网茅(Spartina pectinata,prairie cord-grass)、紫苜蓿(alfalfa)、芦竹(Arundo donax,giant reed)或其杂交种、黑麦(Secale cereale,rye)、柳属物种(柳树)、桉属物种(桉树)、小黑麦(小麦属-小麦×黑麦)、东部加马草(Tripsicum dactyloides,Eastern gammagrass)、灰色赖草(Leymus cinereus,盆地野麦)、巨型野生黑麦(Leymus condensatus,giant wildrye)和竹子。
在一些实施方案中,合适的物种可以是野生的、丛生的(weedy)或培养的高粱属物种,例如但不限于黑高梁(Sorghum almum)、阔叶高粱(Sorghum amplum)、狭叶高粱(Sorghum angustum)、Sorghum arundinaceum、高粱(Sorghum bicolor,例如双色族(bicolor)、几内亚族(guinea)、顶尖族(caudatum)、卡佛尔族(kafir)和都拉族(durra))、短柄高粱(Sorghum brachypodum)、球茎高粱(Sorghum bulbosum)、缅甸高粱(Sorghum burmahicum)、Sorghum controversum、Sorghum drummondii、Sorghum ecarinatum、Sorghum exstans、Sorghum grande、假高粱(Sorghum halepense)、中间高粱(Sorghum interjectum)、Sorghum intrans、Sorghum laxiflorum、Sorghum leiocladum、Sorghum macrospermum、Sorghum matarankense、Sorghum miliaceum、Sorghum nigrum、光高粱(Sorghum nitidum)、羽高粱(Sorghum plumosum)、拟高梁(Sorghum propinquum)、Sorghum purpureosericeum、Sorghum stipoideum、苏丹草(Sorghum sudanensese)、Sorghum timorense、Sorghum trichocladum、多色高粱(Sorghum versicolor)、Sorghum virgatum、高粱(Sorghum vulgare)、或杂交种,如高粱×黑高粱、高粱×苏丹草或高粱×drummondii。
合适的物种还包括:向日葵(Helianthus annuus,sunflower)、红花(Carthamus tinctorius,safflower)、麻风树(Jatropha curcas,jatropha)、蓖麻(Ricinus communis,castor)、油棕(Elaeis guineensis,palm)、亚麻(Linum usitatissimum,flax)和芥菜(Brassica juncea)。
合适的物种还包括甜菜(Beta vulgaris,sugarbeet)和木薯(Manihot esculenta,cassava)。
合适的物种还包括:番茄(Lycopersicon esculentum,tomato)、莴苣(Lactuca sativa,lettuce)、香蕉(Musa paradisiaca,banana)、马铃薯(Solanum tuberosum,potato)、甘蓝(Brassica oleracea,绿花椰菜、花椰菜、抱子甘蓝)、茶(Camellia sinensis,tea)、草莓(Fragaria ananassa,strawberry)、可可(Theobroma cacao,cocoa)、小果咖啡(Coffea arabica,coffee)、葡萄(Vitis vinifera,grape)、凤梨(Ananas comosus,pineapple)、七色椒(Capsicum annum,辣椒&甜椒)、洋葱(Allium cepa,onion)、甜瓜(Cucumis melo,melon)、黄瓜(Cucumis sativus,cucumber)、笋瓜(Cucurbita maxima,squash)、南瓜(Cucurbita moschata,squash)、菠菜(Spinacea oleracea,spinach)、西瓜(Citrullus lanatus,watermelon)、秋葵(Abelmoschus esculentus,okra)和茄子(Solanum melongena,eggplant)。
合适的物种还包括罂粟(Papaver somniferum,opium poppy)、东方罂粟(Papaver orientale)、欧洲紫杉(Taxus baccata)、短叶紫杉(Taxus brevifolia)、青蒿(Artemisia annua)、大麻(Cannabis sativa)、喜树(Camptotheca acuminate)、长春花(Catharanthus roseus)、玫瑰红长春花(Vinca rosea)、正鸡纳(Cinchona officinalis)、秋水仙(Colchicum autumnale)、加州藜芦(Veratrum californica)、毛花洋地黄(Digitalis lanata)、紫花洋地黄(Digitalis purpurea)、薯蓣属物种(Dioscorea spp.)、穿心莲(Andrographis paniculata)、颠茄(Atropa belladonna)、曼陀罗(Datura stomonium)、小檗属物种(Berberis spp.)、三尖杉属物种(Cephalotaxus spp.)、草麻黄(Ephedra sinica)、麻黄属物种(Ephedra spp.)、东方古柯(Erythroxylum coca)、雪花莲(Galanthus wornorii)、东莨菪属物种(Scopolia spp.)、千层塔(Lycopodium serratum)(=蛇足石杉(Huperzia serrata))、石松属物种(Lycopodium spp.)、蛇根萝芙木(Rauwolfia serpentina)、萝芙木属物种(Rauwolfia spp.)、加拿大血根草(Sanguinaria canadensis)、天仙子属物种(Hyoscyamus spp.)、金盏菊(Calendula officinalis)、小白菊(Chrysanthemum parthenium)、毛喉鞘蕊花(Coleus forskohlii)和夏白菊(Tanacetum parthenium)。
合适的物种还包括:银胶菊(Parthenium argentatum,guayule)、橡胶树属(橡胶)、留兰香(Mentha spicata,mint)、辣薄荷(Mentha piperita,mint)、红木(Bixa orellana)和六出花属(Alstroemeria spp.)。
合适的物种还包括蔷薇属物种(玫瑰)、康乃馨(Dianthus caryophyllus,carnation)、矮牵牛属物种(牵牛花)和一品红(Poinsettia pulcherrima,poinsettia)。
合适的物种还包括:烟草(Nicotiana tabacum,tobacco)、白羽扇豆(Lupinus albus,lupin)、燕麦(Uniola paniculata,oats)、翦股颖(剪股颖属物种)、白杨(Populus tremuloides,aspen)、松属物种(松)、冷杉属物种(冷杉)、械属物种(槭树)、大麦(Hordeum vulgare,barley)、草地早熟禾(早熟禾)、毒麦属(毒麦)和梯牧草(Phleum pratense,timothy)。
因此,方法和组合物可以在大范围的植物物种内使用,包括来自下列的物种:双子叶属,芸苔属、红花属、大豆属、棉属、向日葵属、麻风树属、银胶菊属、杨属和蓖麻属;和单子叶属,油棕属、羊茅属、大麦属、毒麦属、稻属、黍属、狼尾草属、梯牧草属、早熟禾属、甘蔗属、黑麦属、高粱属、小黑麦属、小麦属和玉蜀黍属。在一些实施方案中,植物为下列物种的成员:柳枝稷(Panicum virgatum,switchgrass)、高粱(高粱属,双色高粱)、奇岗(Miscanthus giganteus,芒属)、甘蔗属物种(能源甘蔗(energycane))、大叶钻天杨(Populus balsamifera,poplar)、玉蜀黍(Zea mays,corn)、大豆(Glycine max,soybean)、甘蓝型油菜(Brassica napus,canola)、小麦(Triticum aestivum,wheat)、陆地棉(Gossypium hirsutum,cotton)、稻(Oryza sativa,rice)、向日葵(Helianthus annuus,sunflower)、紫苜蓿(Medicago sativa,alfalfa)、甜菜(Beta vulgaris,sugarbeet)或珍珠粟(Pennisetum glaucum,pearl millet)。
在某些实施方案中,本文所述的多核苷酸和载体可用于转化大量单子叶和双子叶植物和植物细胞系统,其中这种植物是不同物种的杂交种或特定的物种的变种(例如,甘蔗属物种×芒属物种、柳枝稷×矮沙丘草(Panicum amarum)、柳枝稷×Panicum amarulum和象草×御谷)
在本发明的另一实施方案中,表达构建体可用于愈伤组织培养物中的基因表达,以为了表达编码容许鉴定转化的植物的肽或多肽的标记基因。此处,将与待转录的多核苷酸可操作地连接的启动子转化到植物细胞中并且然后将转化的组织置于愈伤组织诱导性培养基上。例如,如果用叶盘进行转化,则愈伤组织将沿切割边缘开始。一旦开始愈伤组织生长,便可以将愈伤组织细胞转移到愈伤组织芽诱导性或愈伤组织根诱导性培养基中。将在适当的培养基上发育的愈伤组织细胞中发生基因表达:愈伤组织根诱导性启动子将在愈伤组织根诱导性培养基上激活等。可用作转化标记的这种肽或多肽的实例包括但不限于:barstar、草甘膦、氯霉素乙酰基转移酶(CAT)、卡那霉素、大观霉素、链霉素或其他抗生素抗性酶、绿色荧光蛋白(GFP)和β-葡糖醛酸糖苷酶(GUS)等。提供于SEQ ID NO:1-18中的启动子的一些还将能够在再生开始或完成后在一些组织或器官中维持表达。这些组织或器官的实例是体细胞胚、子叶、下胚轴、上胚轴、叶、茎、干、根、花和种子。
向宿主细胞基因组中的整合还可以通过本领域中已知的方法完成,例如,通过上面所讨论的同源序列或T-DNA或使用Cre-lox系统(A.C.Vergunst等人(1998)Plant Mol.Biol.38:393)。
6.启动子的用途
6.1 使用启动子来研究和筛选表达
本申请的启动子可用于进一步了解发育机制。例如,在愈伤组织形成、体细胞胚形成、芽形成或根形成期间特异性诱导的启动子可用于探究靶基因的过表达、阻抑或异位表达的作用或用于分离反式作用因子。
本申请的载体可不仅用于表达编码区,还可以用于外显子捕获克隆或启动子捕获步骤以检测不同组织中的差异基因表达(参见Lindsey等人(1993)Transgenic Research 2:3347.Auch和Reth(1990)Nucleic Acids Research 18:6743)。
最初被描述用于细菌的捕获载体(Casadaban和Cohen(1979)Proc.Nat.Aca.Sci.U.S.A.76:4530;Casadaban等人(1980)J.Bacteriol.143:971)容许选择位于编码序列内的插入事件。可以将捕获载体引入培养的多潜能ES细胞中,然后经由嵌合体传递到种系中(Gossler等人1989)Science 244:463;Skarnes(1990)Biotechnology 8:827)。启动子或基因捕获载体通常含有报道基因,例如LacZ,其缺乏自身的启动子和/或上游的剪接受体序列。也就是说,启动子捕获载体含有具有剪接位点但是没有启动子的报道基因。如果载体落在基因中并被剪接成基因产物,那么会表达报道基因。
最近,基于条件营养缺陷型补充或药物抗性的先进的启动子包载(例如,IVET)的使用使得优先诱导的基因的分离成为可能。在一种IVET方法中,将多种细菌基因组片段置于与报道基因偶联的必需代谢基因前。将DNA构建体插入到另外缺乏该代谢基因的细菌菌株中,并且将所得细菌用于感染宿主生物体。仅表达代谢基因的细菌在宿主生物体中存活;因此可以通过仅收获在宿主中存活某一最短时间的细菌来消除非活性构建体。同时,可以通过在实验室条件下仅筛选不表达报道基因的细菌来消除广泛活性的构建体。通过这种方法选择的细菌含有仅在宿主感染期间被选择性诱导的构建体。可以对IVET方法进行改造以用于在植物中鉴定病原体感染或根定植之后在细菌或植物细胞中诱导的基因。关于IVET的信息,参见如下论文:Mahan等人(1993)Science 259:686-688,Mahan等人(1995)Proc.Natl.Acad.Sci.USA 92:669-673;Heithoff等人(1997)Proc.Natl.Acad.Sci USA 94:934-939以及Wang等人(1996)Proc.Natl.Acad.Sci USA 93:10434。
6.2 使用启动子转录感兴趣的基因
在本发明的一个实施方案中,将SEQ ID NO:1-12中所示的核酸分子掺入到构建体中以便使本发明的启动子可操作地连接到可转录核酸分子上,所述可转录的核酸分子为农学上重要的基因。如本文所用术语“农学上重要的基因”是指可转录核酸分子,其包括但不限于提供与下列方面有关的期望特征的基因:植物形态、生理、生长和发育、产量、营养强化、疾病或害虫抗性、或环境或化学耐受。期望表达农学上重要的基因以便赋予农学上重要的性状。为农作物提供有益的农学性状的农学上重要的基因可以是例如,包括但不限于包含下列的遗传元件:除草剂抗性、增加的产量、增加的生物量、昆虫控制、真菌性疾病抗性、病毒抗性、线虫抗性、细菌疾病抗性、淀粉生产、改良的油生产、高油生产、改良的脂肪酸含量、高蛋白生产、果实催熟、强化的动物和人营养、生物聚合物、环境胁迫抗性、药用肽、改良的加工性状、改良的可消化性、工业酶生产、改良的香味、固氮作用、杂交种种子生产和生物燃料生产。上面所列专利中所描述的遗传元件、方法和转基因通过引用并入本文。
可选择地,可转录的核酸分子可以通过编码引起内源基因表达的靶向抑制的RNA分子来实现上面所提到的表型,例如经由反义、抑制性RNA(RNAi)或共抑制介导的机制。RNA还可以是被工程化以裂解期望的内源mRNA产物的催化性的RNA分子(即,核酶)。因此,编码表达感兴趣的表型或形态改变的蛋白或mRNA的任何核酸分子可用于实践本发明。
6.3.胁迫诱导的优先转录
在氧化、干旱、氧气、创伤和茉莉酮酸甲酯胁迫下提供转录调控的启动子和控制元件尤其可用于产生对生物和非生物胁迫更具抗性的宿主细胞或生物体。在植物中,例如,响应于氧化应激的基因、转录物和/或多肽调控可以保护细胞免受如过氧化氢和其他自由基等氧化剂所引起的损伤。
基因、转录物和/或多肽的干旱诱导可用于增加植物的生存力,例如在水是限制性因素时。相比之下,在氧应激期间诱导的基因、转录物和/或多肽可有助于植物的耐涝性。
本发明的启动子和控制元件可以调控与下列文献中所描述的那些类似的胁迫:例如VuPLD1(干旱胁迫;豇豆;参见Pham-Thi等人(1999)Plant Mol Biol 39:1257-65)、丙酮酸脱羧酶(氧应激;稻;参见Rivosal等人(1997)Plant Physiol 114(3):1021-29);色质体特异性类胡萝卜素基因(氧化应激;辣椒;参见Bouvier等人(1998)J Biol Chem 273:30651-59)。
在创伤期间提供优先转录或通过茉莉酮酸甲酯诱导而提供优先转录的启动子和控制元件可以在宿主细胞或生物体中产生防御反应。在植物中,例如,在这种条件下基因、转录物和/或多肽的优先调控可用于诱导对机械创伤、害虫或病原体的攻击或某些化学物质处理的防御反应。
本发明的启动子和控制元件还可以触发类似于关于下列文献所描述的那些的反应:cf9(病毒性病原体;番茄;参见O’Donnell等人(1998)Plant J 14(1):137-42);1型肝细胞生长因子激活物抑制因子(HAI-1),其增强组织再生(组织损伤;人;Koono等人(1999)J Histochem Cytochem 47:673-82);铜胺氧化镁(CuAO),其在个体发生和创伤愈合期间诱导(创伤;鹰嘴豆;Rea等人(1998)FEBS Lett 437:177-82);蛋白酶抑制剂II(创伤;马铃薯;参见Pena-Cortes等人(1988)Planta 174:84-89);蛋白酶抑制剂II(茉莉酮酸甲酯;番茄;参见Farmer和Ryan(1990)Proc Natl Acad Sci USA 87:7713-7716);两种营养储藏蛋白基因VspA和VspB(创伤、茉莉酮酸和水分亏缺;大豆;参见Mason和Mullet(1990)Plant Cell 2:569-579)。
转录的上调和下调可用于这些应用。例如,增加耐氧化性、耐涝性或耐旱性的基因、转录物和/或多肽可能需要上调转录。
通常,在创伤或茉莉酮酸甲酯诱导下提供优先转录的启动子或控制元件产生与其他条件下的细胞类型、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.4.光诱导的优先转录
在被光暴露诱导时提供优先转录的启动子和控制元件可用于调控生长、代谢和发育;增加耐旱性;并降低宿主细胞或生物体因光胁迫引起的损伤。在植物中,例如,响应于光的基因、转录物和/或多肽的调控可用于
(1)增加光合速率;
(2)仅增加叶或绿色部分中某些分子的储藏,例如,具有高蛋白或淀粉含量的青贮;
(3)调控绿色组织中外源组分的产生,例如,某些饲用酶;
(4)在延长的光暴露期间诱导生长或发育,如果实发育和成熟;
(5)调控保卫细胞以控制叶中气孔的大小从而防止水分损失,或
(6)诱导β-胡萝卜素积累从而有助于农作物对付光诱导的胁迫。
本发明的启动子和控制元件还可以触发类似于下列文献中所描述的那些反应的反应:脱落酸不敏感型蛋白3(ABI3)(黑暗生长的拟南芥幼苗,参见Rohde等人(2000)Plant Cell 12:35-52)、天冬酰胺合成酶(豌豆根瘤,参见Tsai和Coruzzi(1990)EMBO J 9:323-32)、mdm2基因(人肿瘤,参见Saucedo等人(1998)Cell Growth Differ 9:119-30)。
转录的上调和下调可用于这些应用。例如,增加耐旱性或耐光性的基因、转录物和/或多肽可能需要上调转录。
通常,在暴露于光的细胞、组织或器官中提供优先转录的启动子或控制元件会产生与在降低光暴露(强度或时间长度)条件下的细胞、组织或器官相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.5.黑暗诱导的优先转录
在通过黑暗或降低的光强度或降低的光暴露时间诱导时提供优先转录的启动子和控制元件可用于对生长、代谢和发育定时以调控宿主细胞或生物体的光合成能力。在植物中,例如,例如响应于黑暗的基因、转录物和/或多肽的调控可用于:例如,
(1)尽管缺乏光也诱导生长或发育,如果实发育和成熟;
(2)调控在夜晚或在阴天有活性的基因、转录物和/或多肽;或
(3)在黑暗开始时保护存在的质体超微结构。
本发明的启动子和控制元件还可以触发类似于上节所述的那些反应的反应。
转录的上调和下调可用于这些应用。例如,增加或降低生长和发育的基因、转录物和/或多肽可能需要上调转录。
通常,在暴露于黑暗或降低光强度或降低暴露时间的条件下提供优先转录的启动子或控制元件会产生统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.6.叶优先转录
在叶中提供优先转录的启动子和控制元件可以调控生长、代谢和发育,或调控宿主细胞或生物体中的能量和营养物质利用。在植物中,例如,在叶中的基因、转录物和/或多肽的优先调控可用于:例如,
(1)调控叶的大小、形状和发育;
(2)调控叶的数目;或
(3)调控相对于其他器官和组织对能量或营养物质的利用。
转录的上调和下调可用于这些应用。例如,增加生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在叶的细胞、组织或器官中提供优先转录的启动子或控制元件会产生与其他细胞、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.7.根优先转录
在根中提供优先转录的启动子和控制元件可以调控生长、代谢、发育、养分吸收、固氮作用,或调控宿主细胞或生物体中的能量和养分的利用。在植物中,例如,在根中的基因、转录物和/或多肽的优先调控可用于:
(1)调控根的大小、形状和发育;
(2)调控根或根毛的数目;
(3)调控矿质、肥料或水分的吸收;
(4)调控营养物质运输;或
(4)调控相对于其他细胞、器官和组织对能量或营养物质的利用。
转录的上调和下调可用于这些应用。例如,增加或减少生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在根的细胞、组织或器官中提供优先转录的启动子或控制元件会产生与其他细胞、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.8.茎/芽优先转录
在茎或芽中提供优先转录的启动子和控制元件可以调控生长、代谢和发育,或调控宿主细胞或生物体中的能量和养分的利用。在植物中,例如,在茎或芽中的基因、转录物和/或多肽的优先调控可用于:例如
(1)调控茎/芽的大小、形状和发育;或
(2)调控相对于其他器官和组织对能量或营养物质的利用。
转录的上调和下调可用于这些应用。例如,增加生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在茎或芽的细胞、组织或器官中提供优先转录的启动子或控制元件会产生与其他细胞、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.9.果实和种子优先转录
在长角果或果实中提供优先转录的启动子和控制元件可以对生长、发育或成熟进行定时;或调控繁殖力;或调控宿主细胞或生物体中的能量和养分的利用。在植物中,例如,在果实中的基因、转录物和/或多肽的优先调控可用于:
(1)调控果实的大小、形状、发育和成熟;
(2)调控果实或种子的数目;
(3)调控种子落粒;
(4)调控种子的组分,如储存分子、淀粉、蛋白、油、维生素、抗营养组分如植酸;
(5)调控种子和/或幼苗的活力或生存力;
(6)将外源组分整合到种子中,如富含赖氨酸的蛋白;
(7)容许对于早和晚开花的类似果实成熟进行时控;
(8)调控相对于其他器官和组织对能量或养分的利用。
转录的上调和下调可用于这些应用。例如,增加或降低生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在长角果或果实的细胞、组织或器官中提供优先转录的启动子或控制元件会产生与其他细胞、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.10.愈伤组织优先转录
在愈伤组织中提供优先转录的启动子和控制元件可用于调控分化的宿主细胞中的转录。在植物转化中,例如,在愈伤组织中基因、转录物的优先调控可用于调控标记基因的转录,这可促进选择用外源多核苷酸转化的细胞。
转录的上调和下调可用于这些应用。例如,增加标记基因可检测性的基因、转录物和/或多肽可能例如需要上调转录。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.11.花特异性转录
在花中提供优先转录的启动子和控制元件可以调控着色;或调控宿主细胞或生物体中的繁殖力。在植物中,例如,在花中的基因、转录物和/或多肽的优先调控可用于:
(1)调控花瓣颜色;或
(2)调控雌蕊和/或雄蕊的繁殖力。
转录的上调和下调可用于这些应用。例如,增加或减少着色的基因、转录物和/或多肽可能例如需要上调转录。
通常,在花中提供优先转录的启动子或控制元件会产生与其他细胞、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.12.未成熟的芽/小花和花序优先转录
在未成熟的芽/小花或花序中提供优先转录的启动子和控制元件可以对生长、发育或成熟进行定时;或调控宿主细胞或生物体中的繁殖力或生存力。在植物中,例如,在未成熟的芽和/或花序中的基因、转录物和/或多肽的优先调控可用于:
(1)调控胚胎的发育、大小和成熟;
(2)调控胚乳的发育、大小和成熟;
(3)调控种子和果实的数目;或
(4)调控种子的发育和生存力。
转录的上调和下调可用于这些应用。例如,增加或减少生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在未成熟的芽/小花和花序中提供优先转录的启动子或控制元件会产生与其他细胞类型、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.13.衰老优先转录
在衰老期间提供优先转录的启动子和控制元件可用于调控宿主细胞或生物体中的细胞变性、养分迁移和自由基清除。可以调控的其他反应类型包括:例如编码被认为参与细胞变性和养分迁移的酶的衰老相关基因(SAG)(拟南芥;参见Hensel等人(1993)Plant Cell 5:553-64)和CP-2/组织蛋白酶L基因(大鼠;Kim和Wright(1997)Biol Reprod 57:1467-77),二者均在衰老期间被诱导。
在植物中,例如,在衰老期间的基因、转录物和/或多肽的优先调控可用于调控果实催熟。
转录的上调和下调可用于这些应用。例如,增加或减少自由基清除的基因、转录物和/或多肽可能例如需要上调转录。
通常,衰老期间在细胞、组织或器官中提供优先转录的启动子或控制元件会产生与其他条件相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
6.14.发芽优先转录
在发芽的种子中提供优先转录的启动子和控制元件可以对生长、发育或成熟进行定时;或调控宿主细胞或生物体中的生存力。在植物中,例如,在发芽的种子中的基因、转录物和/或多肽的优先调控可用于:
(1)调控下胚轴、子叶和根(radical)的出现;或
(2)调控芽和初生根的生长和发育。
转录的上调和下调可用于这些应用。例如,增加或减少生长的基因、转录物和/或多肽可能例如需要上调转录。
通常,在发芽的种子中提供优先转录的启动子或控制元件会产生与其他细胞类型、器官或组织相比统计学上显著的转录水平。
对于优先上调的转录,启动子和控制元件产生高于测定背景的转录水平。
7.实验步骤和结果
农杆菌介导的稻的转化
由成熟的稻种子诱导愈伤组织形成
使用脱壳器(de-husker)(Kett;Cat# TR120)将成熟种子脱壳并且将带斑点的种子弃去(若存在)。将100粒脱壳的种子转移到50mL锥形管中。添加24mL高压灭菌的蒸馏水并且然后添加6ml CloroxTM(Clorox含有5.25%次氯酸钠,因此次氯酸钠的终浓度为1.05%)和2-3滴Liqui-Nox。不时地摇晃试管,持续30分钟。倒出CloroxTM溶液并用无菌水清洗种子5次。在高压灭菌的KimwipesTM上将种子干燥几分钟。将种子转移到半固体N6-P培养基上(3.98g/L N6基本盐混合物、0.8mg/L KI、0.025mg/L CoCl2.6H2O、0.025mg/L CuSO4.5H2O、0.25mg/L NaMoO4.2H2O、2mg/L甘氨酸、100mg/L肌醇、5mg/L硫胺.HCl、1mg/L吡哆醇.HCl、1mg/L烟酸、2.8g/L脯氨酸、300mg/L酪蛋白氨基酸、30g/L蔗糖、2mg/L 2,4-二氯-苯氧基乙酸、4g/L Gel rite,pH 5.6);每个培养皿10粒种子。每个培养皿含有30ml N6-P培养基。用抗真菌的胶带密封培养皿以容许空气交换。于28℃下将板放置在冷荧光下。应在4周内形成许多粒状的愈伤组织。良好品质的愈伤组织由具有稠密胞质的小的和球形的细胞组成,它们对于转化是感受态的。可以直接将愈伤组织用于农杆菌感染,或将它们进行继代培养以供以后使用。
用农杆菌细胞感染和共培养愈伤组织
从母液中挑取单个农杆菌克隆并通过使其在振荡器上生长过夜来将其培养于2mL YEB液体培养基中。含有50mg/L或更高的适当抗生素。放在28℃振荡器上过夜。第二天,将25μL过夜培养物再接种到带有选择的5mL液体YEB中,在28℃生长过夜。第二天,使用这种培养物进行转化。将液体培养物转移到1.5mL微型管中并将其以10,000RPM离心2分钟。弃去上清液并将细胞重悬于15mL N6-AS液体培养基中(3.98g/L N6基本盐混合物、0.8mg/L KI、0.025mg/L CoCl2.6H2O、0.025mg/L CuSO4.5H2O、0.25mg/L NaMoO4.2H2O、2mg/L甘氨酸、100mg/L肌醇、5mg/L硫胺.HCl、1mg/L吡哆醇.HCl、1mg/L烟酸、1g/L酪蛋白氨基酸、30g/L蔗糖、10g/L葡萄糖、2mg/L 2,4-二氯-苯氧基乙酸,pH 5.6)。用N6-AS培养基调整细胞密度。可以通过分光光度计测量密度(使用750μL等分试样进行读数)。最佳的OD600读数依据农杆菌菌株并且有时依据载体而显著改变。最佳读数意味着在至少3天的共培养内没有农杆菌细胞的过度生长。稻的最佳OD600是0.2。将稻愈伤组织与农杆菌细胞混合。这是在50mL无菌锥形管中进行的。将试管放置在无菌的1加仑塑料袋中并水平放置在振荡器上持续30分钟。用10-mL移液管吸出溶液。将愈伤组织转移到高压灭菌的KimwipesTM上以去除过量溶液。移除任何琼脂培养基(若存在),因为农杆菌在琼脂上将生长较快。在置于N6-AS半固体培养基(含有4g/L Gel rite的N6-AS培养基)的高压灭菌的滤纸上培养愈伤组织。每个100mm×20mm培养皿含有10-20mL N6-AS培养基。用抗真菌的胶带密封培养皿。用铝箔覆盖平板,因为培养基中所存在的乙酰丁香酮是光敏感性的。在黑暗中于22℃共培养愈伤组织和农杆菌细胞直到肉眼可以看到农杆菌团块。
选择转化的愈伤组织
用无菌的一次性匙突将感染的愈伤组织转移到含有35mL无菌蒸馏水的无菌的50mL试管中。摇晃试管几秒钟并吸出水。重复洗涤3次或更多次(若需要)直至溶液变澄清。对于最后的洗涤,添加浓度为500mg/L的羧苄西林。用一次性蓝接种环将愈伤组织转移到高压灭菌的2层厚的KimwipesTM纸上以进行印迹,该KimwipesTM纸在大的球形培养板中。在冷荧光下于28℃在培养皿上培养愈伤组织6天,该培养皿中含有具有250mg/L羧苄西林的半固体N6-P培养基。每个100mm×20mm培养皿含有30mLN6-P培养基,对于每个构建体使用约4个愈伤组织培养皿。用抗真菌的胶带密封培养皿。将愈伤组织从剩余培养基转移到含有下列物质的选择培养基上持续14天:250mg/L羧苄西林和5mg/L纯化的BialaphosTM(用于BAR基因的选择)或100mg/L硫酸巴龙霉素(用于NPTII基因的选择)。对于第二轮选择,将愈伤组织再继代培养14天。在这轮选择结束时,通常可以清楚地看到转化的愈伤组织。如果第二轮选择没有产生足够抗性的愈伤组织,则进行第三轮选择。
转基因植物的再生
将单独的抗性愈伤组织转移到N6-R植物再生培养基中(3.98g/L N6基本盐混合物、0.8mg/L KI、0.025mg/L CoCl2.6H2O、0.025mg/L CuSO4.5H2O、0.25mg/L NaMoO4.2H2O、2mg/L甘氨酸、100mg/L肌醇、5mg/L硫胺.HCl、1mg/L吡哆醇.HCl、1mg/L烟酸、1g/L酪蛋白氨基酸、25g/L蔗糖、25g/L山梨醇、2mg/L 6-苄氨基嘌呤、0.05mg/L 1-萘乙酸、7g/L琼脂糖(Omnipur),pH 5.6)。每个100mm×20mnm培养皿含有30mL N6-R培养基,每个培养皿上4或6个愈伤组织系。用抗真菌的胶带密封培养皿。在冷荧光下于28℃培养愈伤组织直到形成芽和根。通常,应在3周内看到芽。将小植株转移到含有30mL 1/2 MS1A(2.165g/L MS盐、1ml/L 1000×B5维生素母液、15g/L蔗糖、5g/L琼脂,pH 5.7)的Magenta盒中。使小植株在冷荧光(old fluorescent)下于28℃生长10-14天。
选择10个独立转化的事件(小植株),其中对来自每个事件的一个分蘖进行T0代中的GFP表达评定。
土壤混合物制备:在水泥混合器中将6L盆栽土(Potting Soil)(Farmers Organic Potting Soil,Chino,CA)与4L蒙脱石(Turface)混合以制备60∶40的土壤混合物。向该土壤混合物中添加1茶匙Marathon 1%颗粒(Hummert,Earth City,MO)、2汤匙OSMOCOTE
Figure BPA00001254710000531
14-14-14(Hummert,Earth City,MO)。每月一次将1汤匙Peters肥料20-20-20(J.R.Peters,Inc.,Allentown,PA)充分混合在三加仑的水中并倒入底部板以进行施肥。使用6英寸直径的杜鹃花盆(Azalea pot)进行移植,每个花盆1-2株植物。
种植:小心地将生长在magenta盒中的植物从MS琼脂稻培养基中拔出。清洁植物的根并将植物分开成单个分蘖,确保每个分蘖具有有活力的根并且没有残余的愈伤组织材料。对所述分蘖进行GFP表达筛选,并且将每个独立转化的事件的一个阳性表达的分蘖移植到土壤中并使其生长至成熟以用于进一步分析。
植物维持:在生命周期的整个持续期间中对植物进行充分的浇水。清洁平板底部并每周添加两次新水。在种植后约21天,用Peters肥料以1茶匙/3加仑水的浓度对稻进行地下灌溉。在T0幼苗、T0成熟和T1代对植物进行GFP表达分析。
GFP测定和成像
使用绿色荧光蛋白(GFP)测定以下列方式来对本发明的多核苷酸序列进行启动子活性测试。
使用后接SfiI限制性位点的适当引物将序列表中所描述的每种分离的核酸克隆到Ti质粒载体CRS380_双元_DF_EGFP中。使用这些引物和基因组DNA进行标准PCR反应。分离所得产物、用SfiI裂解并将其克隆到诸如CRS380_双元_DF_EGFP(参见图1)等适当载体的SfiI位点。
稻愈伤组织中的GFP测定
早至共培养后第4-7天即可以观察到稻愈伤组织中的GFP表达。在Zeiss Stemi SVII APO解剖显微镜下观察用于共培养的稻愈伤组织的GFP表达。对于检查GFP表达,我们在显微镜中使用GFP 500滤光器。可以使用Axiocam(Zeiss)照相机和Axiovision软件将显微镜下观察到的图像转移、捕获并储存到计算机中。
T0幼苗中的GFP测定
将每个独立转化的事件分开成单个分蘖,然后将该单个分蘖进行Typhoon扫描激光成像。每个事件选择一个GFP表达阳性的分蘖用于随后通过共聚焦显微镜进行的GFP分析,并且最终将该分蘖进行移植以用于进一步的成熟组织分析。
Typhoon扫描:最初用Typhoon扫描仪扫描植物以检查总体水平的植物GFP表达。如果存在表达,则通过Typhoon扫描激光成像和激光扫描共聚焦显微镜收集图像。由Typhoon扫描仪扫描的图像作为整株植物的2维图像获取,并且可以使用程序ImageQuant将其打开。
共聚焦显微镜:通过眼睛或在放大的条件下使用INOX 5级镊子解剖组织,并将其置于具有水的载玻片上并盖上盖玻片。尝试记录在下列组织发育的最早阶段和最晚阶段观察到的表达模式图像。将具体的组织定义为具有阳性表达或没有表达。
Figure BPA00001254710000541
Ziess UV立体镜:太大而不能使用共聚焦显微镜的生殖组织使用INOX 5级镊子利用解剖显微镜在高倍放大下准备并将其放置在载玻片上。尝试记录在成熟稻生殖组织中所观察到的表达模式的图像。Auxiovision是用于捕获GFP图像的程序,其设置如下:
GFP:4900ms,增益(gain)=3,分辨率=1300×1030插值(interpolated)
亮视野:100ms,转化率=平方根,分辨率=1300×1030插值。
T0成熟
这些是由来自单个独立转化事件的具有预定的阳性GFP表达的单个分蘖得到的T0植物。它们是在3-5期(即,在晚期营养至圆锥花序开始与花成熟之间)筛选的,是6-8周龄的。在此阶段,成熟植物具有幼小的圆锥花序至年轻的花、完全伸展的叶、多个茎节以及成熟的茎和根组织。首先使用Typhoon扫描仪将植物成像,并且然后使用Leica共聚焦显微镜和Ziess UV立体镜详细成像以容许在总体水平上检查成熟植物。
T1幼苗
从T0植物收集种子并储藏以便进一步用于诱导实验。
结果
启动子表达报告表呈现了GFP测定的结果,该结果以它们相应的构建体编号和株系编号报告。
启动子PD3525活性的分析
Figure BPA00001254710000561
Figure BPA00001254710000581
启动子PD3559活性的分析
Figure BPA00001254710000582
Figure BPA00001254710000591
Figure BPA00001254710000601
启动子PD3560活性的分析
Figure BPA00001254710000602
Figure BPA00001254710000611
Figure BPA00001254710000621
启动子PD3561活性的分析
Figure BPA00001254710000631
启动子PD3562活性的分析
Figure BPA00001254710000641
Figure BPA00001254710000651
启动子PD3564活性的分析
Figure BPA00001254710000652
Figure BPA00001254710000661
Figure BPA00001254710000671
Figure BPA00001254710000672
启动子PD3565活性的分析
启动子PD3567活性的分析
Figure BPA00001254710000692
Figure BPA00001254710000701
Figure BPA00001254710000702
启动子PD3573活性的分析
Figure BPA00001254710000703
Figure BPA00001254710000711
Figure BPA00001254710000721
启动子PD3574活性的分析
Figure BPA00001254710000731
Figure BPA00001254710000741
启动子PD3578活性的分析
Figure BPA00001254710000742
Figure BPA00001254710000751
Figure BPA00001254710000752
Figure BPA00001254710000761
构建了含有SEQ ID NO:10的核苷酸1801至2500的启动子PD3578(SEQ ID NO:10)的截短形式PD3775并如本文所述进行测试。没有观察到这种截短形式的表达。
启动子PD3579活性的分析
Figure BPA00001254710000762
启动子PD3580活性的分析
Figure BPA00001254710000782
Figure BPA00001254710000791
Figure BPA00001254710000801
Figure BPA00001254710000811
启动子PD3655活性的分析
Figure BPA00001254710000812
Figure BPA00001254710000821
启动子PD3720活性的分析
Figure BPA00001254710000822
Figure BPA00001254710000831
启动子PD3777活性的分析
Figure BPA00001254710000832
Figure BPA00001254710000841
Figure BPA00001254710000851
Figure BPA00001254710000852
启动子PD3786活性的分析
Figure BPA00001254710000853
Figure BPA00001254710000861
Figure BPA00001254710000871
Figure BPA00001254710000872
启动子PD3805活性的分析
Figure BPA00001254710000873
启动子PD3812活性的分析
Figure BPA00001254710000892
Figure BPA00001254710000901
Figure BPA00001254710000912
PD3525、PD3559、PD3560、PD3561、PD3562、PD3564、PD3565、PD3573、PD3574、PD3578、PD3579、PD3580、PD3567、PD3655、PD3720、PD3786、PD3805或PD3812的衍生物通过将突变引入如美国专利第6,747,189中所公开的SEQ ID NO:1-SEQ ID NO:18中所列的核苷酸序列来产生,所述专利通过引用并入本文。产生了许多衍生自PD3525、PD3559、PD3560、PD3561、PD3562、PD3564、PD3565、PD3573、PD3574、PD3578、PD3579、PD3580、PD3567、PD3655、PD3720、PD3786、PD3805或PD3812的包括具有核苷酸缺失和修饰的衍生物的诱变DNA片段,并且将它们插入到与GFP标记基因可操作地连接的植物转化载体中。每种植物转化载体基本上如上文所述制备,不同的是用诱变的衍生物代替全长启动子。用每种植物转化载体转化植物(如,稻植物)并分析GFP标记物的表达以鉴定具有启动子活性的那些诱变衍生物。
通过设计SEQ ID NO:1-18中所列的启动子的克隆片段的引物来分离PD3525、PD3559、PD3560、PD3561、PD3562、PD3564、PD3565、PD3573、PD3574、PD3578、PD3579、PD3580、PD3567、PD3655、PD3720、PD3786、PD3805或PD3812的片段。使用PCR获得了PD3525、PD3559、PD3560、PD3561、PD3562、PD3564、PD3565、PD3573、PD3574、PD3578、PD3579、PD3580、PD3567、PD3655、PD3720、PD3786、PD3805或PD3812的许多克隆片段,这些克隆片段的大小范围在SEQ ID NO:1-18中所列的50个核苷酸直到全长序列。例如,获得了来自PD3525(SEQ ID NO:1)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975或990个核苷酸的PD3525的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3535的片段可以包含GARE1OSREP1、ACIIPVPAL2、ABRERATCAL和TATABOX基序的一个或多个。
获得了来自PD3559(SEQ ID NO:2)的多个部分的长度为约50、75、100、125、150、175、190或200个核苷酸的PD3559的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3559的片段可以包含AUXRETGA2GMGH3、ACGTABREMOTIFA2OSEM、TATCCAYMOTIFOSRAMY3D、AMYBOX1和GAREAT基序的一个或多个。
获得了来自PD3560(SEQ ID NO:3)的多个部分的长度为约50、100、150、200、250、275、300、350、375或390个核苷酸的PD3560的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3560的片段可以包含ARE1、SBOXATRBCS、TE2F2NTPCNA、GADOWNAT、ACGTABREMOTIFA2OSEM和TATABOX基序的一个或多个。
获得了来自PD3561(SEQ ID NO:4)的多个部分的长度为约50、100、150、200、250、275、300、350、375、390、400或410个核苷酸的PD3561的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3561的片段可以包含ROOTMOTIFTAPOX1、RYREPEATVFLEB4和TATABOX基序的一个或多个。
获得了来自PD3562(SEQ ID NO:5)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、725或750个核苷酸的PD3562的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3562的片段可以包含CARGCW8GAT、INRNTPSADB和TATABOX2基序的一个或多个。
获得了来自PD3564(SEQ ID NO:6)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000或1010个核苷酸的PD3564的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3564的片段可以包含MARTBOX、RYREPEATVFLEB4、NRRBNEXTA、TRANSINITMONOCOTS、TATABOXOSPAL和P1BS基序的一个或多个。
获得了来自PD3565(SEQ ID NO:7)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1010、1025、1050或1060个核苷酸的PD3565的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3565的片段可以包含CARGCW8GAT、P1BS和TATABOX基序的一个或多个。
获得了来自PD3573(SEQ ID NO:8)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990或1000个核苷酸的PD3573的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3573的片段可以包含ROOTMOTIFTAPOX1、ATHB6COREAT、TATABOX2和UP2ATMSD基序的一种或多种。
获得了来自PD3574(SEQ ID NO:9)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350或1400个核苷酸的PD3574的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3574的片段可以包含PRECONSCRHSP70A、IBOXCORENT、AGCBOXNPGLB、UP2ATMSD和TATABOX4基序的一种或多种。
获得了来自PD3578(SEQ ID NO:10)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2150、2200、2250、2300、2350、2400、2450或2475个核苷酸的PD3578的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3578的片段可以包含IBOXCORENT、ERELEE4、ABREATRD22、P1BS和TATABOX基序的一个或多个。
获得了来自PD3579(SEQ ID NO:11)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050或2075个核苷酸的PD3579的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3579的片段可以包含CACGCAATGMGH3和UPRMOTIFIIAT基序的一个或多个。例如,PD3579的片段可以含有SEQ ID NO:11的核苷酸1至896。
获得了来自PD3580(SEQ ID NO:12)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或1975个核苷酸的PD3580的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3580的片段可以包含PRECONSCRHSP70A、ACIIPVPAL2、TATABOX4、CAAT-box、CAATBOX1和UPRMOTIFIIAT基序的一个或多个。例如,片段可以含有SEQ ID NO:12的核苷酸501至2000。
获得了来自PD3567(SEQ ID NO:13)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250或1275个核苷酸的PD3567的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3567的片段可以包含RYREPEATVFLEB4、SPHCOREZMC1和AGCBOXNPGLB基序的一个或多个。
获得了来自PD3655(SEQ ID NO:14)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或975个核苷酸的PD3655的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3655的片段可以包含ROOTMOTIFTAPOX1、RYREPEATVFLEB4、P1BS和TATABOX1基序的一个或多个。例如,PD3655的片段可以含有SEQ ID NO:14的核苷酸501至990。
获得了来自PD3720(SEQ ID NO:15)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450或1475个核苷酸的PD3720的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3720的片段可以包含SBOXATRBCS、MYB结合位点、ATHB1ATCONSENSUS、ABRE、E2FAT、PRECONSCRHSP70A、MYBPLANT和E2FCONSENSUS基序的一个或多个。例如,PD3720的片段可以含有SEQ ID NO:15的核苷酸702至1500。
获得了来自PD3786(SEQ ID NO:16)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850或1875个核苷酸的PD3786的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3786的片段可以包含P1BS、ABREZMRAB28、SP8BFIBSP8BIB、CCA1ATLHCB1、BOXIIPCCHS和LRENPCABE基序的一个或多个。
获得了来自PD3805(SEQ ID NO:17)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975或990个核苷酸的PD3805的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3805的片段可以包含P1BS、MYBGAHV和CEREGLUBOX2PSLEGA基序的一个或多个。
获得了来自PD3812(SEQ ID NO:18)的多个部分的长度为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、975、990、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450或1475个核苷酸的PD3812的片段,并将其插入到与GFP标记基因可操作地连接的植物转化载体中。这种PD3812的片段可以包含CACGCAATGMGH3或UPRMOTIFIIAT基序的一种或多种。例如,PD3812的片段可以含有SEQ ID NO:18的核苷酸353至1248。
每种植物转化载体基本上如上文所述制备,不同的是用含有一个或多个本文所述基序的片段代替全长序列。用每种植物转化载体转化拟南芥植株并分析GFP标记物的表达以鉴定具有启动子活性的那些片段。
这样描述了本发明,但是对于本领域的普通技术人员来说明显的是可以对实践本发明的材料和方法进行各种修改。认为这些修改在下列权利要求书所界定的本发明的范围内。
来自本文所引用的专利和期刊文献的各个参考文献通过这种引用整体清楚地并入本文。
Figure IPA00001254709500011
Figure IPA00001254709500021
Figure IPA00001254709500031
Figure IPA00001254709500041
Figure IPA00001254709500051
Figure IPA00001254709500071
Figure IPA00001254709500081
Figure IPA00001254709500101
Figure IPA00001254709500111
Figure IPA00001254709500121
Figure IPA00001254709500131
Figure IPA00001254709500141
Figure IPA00001254709500151
Figure IPA00001254709500161
Figure IPA00001254709500171
Figure IPA00001254709500181
Figure IPA00001254709500191
Figure IPA00001254709500201
Figure IPA00001254709500211
Figure IPA00001254709500221

Claims (29)

1.一种分离的核酸,所述分离的核酸包含与SEQ ID NO.1-18中所列的核苷酸序列的任一个或其片段具有90%或更高序列同一性的调节区,其中所述调节区指导可操作地连接的异源多核苷酸的转录。
2.根据权利要求1所述的核酸,其中所述序列同一性为95%或更高。
3.根据权利要求1所述的核酸,其中所述序列同一性为98%或更高。
4.根据权利要求1所述的分离的核酸,其中所述核酸含有选自由下列组成的组的一个或多个基序:ABRE基序、ABREATRD22基序、ABRERATCAL基序、ABREZMRAB28基序、ACGTABREMOTIFA2OSEM基序、ACIIPVPAL2基序、AGCBOXNPGLB基序、AMYBOX1基序、ARE1基序、ATHB1ATCONSENSUS基序、ATHB6COREAT基序、AUXRETGA2GMGH3基序、BOXIIPCCHS基序、CAATBOX1基序、CACGCAATGMGH3基序、CARGCW8GAT基序、CCA1ATLHCB1基序、CEREGLUBOX2PSLEGA基序、E2FAT基序、E2FCONSENSUS基序、ERELEE4基序、GADOWNAT基序、GARE1OSREP1基序、GAREAT基序、IBOXCORENT基序、INRNTPSADB基序、LRENPCABE基序、MARTBOX基序、MYBGAHV基序、MYBPLANT基序、NRRBNEXTA基序、P1BS基序、PRECONSCRHSP70A基序、ROOTMOTIFTAPOX1基序、RYREPEATGMGY2基序、RYREPEATVFLEB 4基序、SBOXATRBCS基序、SP8BFIBSP8BIB基序、SPHCOREZMC1基序、TATABOX1基序、TATABOX2基序、TATABOX4基序、TATABOXOSPAL基序、TATCCAYMOTIFOSRAMY3D基序、TE2F2NTPCNA基序、TRANSINITMONOCOTS基序、UP2ATMSD基序以及UPRMOTIFIIAT基序。
5.一种载体构建体,所述载体构建体包含:
a)根据权利要求1所述的第一核酸;和
b)待转录的第二核酸,
其中所述第一核酸和所述第二核酸彼此是异源的并且可操作地连接。
6.根据权利要求5所述的载体构建体,其中所述第一核酸由SEQ ID NO:1-18的任一个中所列的核酸序列构成。
7.根据权利要求5所述的载体,其中所述第二核酸包含编码多肽的核酸序列。
8.根据权利要求7所述的载体,其中所述第二核酸与所述第一核酸以有义方向可操作地连接。
9.根据权利要求8所述的载体,其中所述第二核酸被转录成RNA分子,所述RNA分子表达由所述第二核酸所编码的多肽。
10.根据权利要求5所述的载体,其中所述第二核酸与所述第一核酸以反义方向可操作地连接。
11.根据权利要求10所述的载体,其中所述第二核酸被转录成反义RNA分子。
12.根据权利要求5所述的载体,其中所述第二核酸被转录成针对内源基因的干扰RNA。
13.一种植物或植物细胞,所述植物或植物细胞转化有下列物质:
a)根据权利要求1所述的核酸,所述核酸与异源多核苷酸可操作地连接;或
b)根据权利要求5所述的载体构建体。
14.根据权利要求13所述的植物或植物细胞,其中所述第一核酸由SEQ ID NO:1-18的任一个中所列的核苷酸序列构成。
15.一种植物或植物细胞,所述植物或植物细胞转化有根据权利要求5-12中任一项所述的载体构建体。
16.一种在适于转录的环境中通过组合下列物质来指导转录的方法:
a)根据权利要求1所述的第一核酸;和
b)待转录的第二核酸;
其中所述第一核酸和所述第二核酸彼此是异源的并且可操作地连接。
17.根据权利要求16所述的方法,其中所述第一核酸分子由根据SEQ ID NO:1-18的任一个的序列构成。
18.根据权利要求16或17所述的方法,其中所述可操作地连接的所述第一核酸和所述第二核酸被插入到植物细胞中并且所述植物细胞再生为植物。
19.一种转基因植物,包含根据权利要求5所述的载体。
20.根据权利要求19所述的转基因植物,其中所述第二核酸编码农学上重要的多肽。
21.一种根据权利要求19或20所述的植物的种子。
22.一种在植物中表达外源编码区的方法,所述方法包括:
a)用权利要求8所述的载体转化植物细胞;
b)由步骤(a)的转化的植物细胞再生稳定地转化的植物;以及
c)选择含有转化的植物细胞的植物,
其中所述载体的表达导致了由所述第二核酸所编码的多肽的产生。
23.一种改变植物中基因表达的方法,所述方法包括:
a)用根据权利要求1所述的核酸转化植物细胞,所述核酸与异源多核苷酸可操作地连接;和
b)由所述转化的植物细胞再生稳定地转化的植物。
24.一种根据权利要求22或23所述的方法制备的植物。
25.来自根据权利要求24所述的植物的种子。
26.一种产生转基因植物的方法,所述方法包括:
(a)向植物细胞中引入:
(i)包含根据权利要求1所述的核酸的分离的多核苷酸,所述核酸与异源多核苷酸可操作地连接;或
(ii)根据权利要求5所述的载体;以及
(b)由所述植物细胞生长植物。
27.根据权利要求26所述的方法,其中所述异源多核苷酸包含编码多肽的核酸序列。
28.根据权利要求26所述的方法,其中所述异源多核苷酸以反义方向与所述调节区可操作地连接。
29.根据权利要求26所述的方法,其中所述异源多核苷酸被转录成干扰RNA。
CN200980116964XA 2008-03-31 2009-03-30 启动子、启动子控制元件以及其组合和用途 Pending CN102027115A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US4101808P 2008-03-31 2008-03-31
US61/041,018 2008-03-31
PCT/US2009/038792 WO2009146015A2 (en) 2008-03-31 2009-03-30 Promoter, promoter control elements, and combinations, and uses thereof

Publications (1)

Publication Number Publication Date
CN102027115A true CN102027115A (zh) 2011-04-20

Family

ID=41377847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980116964XA Pending CN102027115A (zh) 2008-03-31 2009-03-30 启动子、启动子控制元件以及其组合和用途

Country Status (4)

Country Link
US (2) US8592646B2 (zh)
CN (1) CN102027115A (zh)
BR (1) BRPI0909285B1 (zh)
WO (1) WO2009146015A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480216A (zh) * 2016-12-07 2017-03-08 江苏省农业科学院 一种用于检测转基因调控元件的标准质粒及其构建方法与应用
CN111876429A (zh) * 2020-04-10 2020-11-03 中国科学技术大学 一种水稻蛋白OsYAF9a在调控水稻株型中的用途
CN113832153A (zh) * 2021-09-07 2021-12-24 中国热带农业科学院三亚研究院 高粱启动子、制备方法及应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027115A (zh) 2008-03-31 2011-04-20 希尔雷斯股份有限公司 启动子、启动子控制元件以及其组合和用途
BR112013010278B1 (pt) 2010-10-27 2020-12-29 Ceres, Inc método para produzir uma planta, método para modular a composição de biomassa em uma planta, ácido nucleico isolado e método para alterar a composição de biomassa em uma planta
WO2013067252A1 (en) * 2011-11-03 2013-05-10 Syngenta Participations Ag Polynucleotides, polypeptides and methods for enhancing photossimilation in plants
BR122020026837B1 (pt) 2011-11-02 2021-04-13 Ceres, Inc Método de aumento do rendimento de planta em solo contendo níveis elevados de al3+, método de aumento da tolerância de uma planta
WO2013086499A2 (en) 2011-12-09 2013-06-13 Ceres, Inc. Transgenic plants having altered biomass composition
US9896695B2 (en) 2012-02-02 2018-02-20 Consejo Nacional De Investigaciones Cientificas Y Tecnicas (Conicet) HAHB11 provides improved plant yield and tolerance to abiotic stress
US9497380B1 (en) * 2013-02-15 2016-11-15 Red.Com, Inc. Dense field imaging
US9243258B2 (en) 2013-03-12 2016-01-26 Pioneer Hi Bred International Inc Root-preferred promoter and methods of use
US10045540B2 (en) 2014-04-01 2018-08-14 Fayetteville State University Pest control composition
US9101100B1 (en) 2014-04-30 2015-08-11 Ceres, Inc. Methods and materials for high throughput testing of transgene combinations
US10325673B2 (en) * 2017-07-25 2019-06-18 Insilico Medicine, Inc. Deep transcriptomic markers of human biological aging and methods of determining a biological aging clock
US11373732B2 (en) 2017-07-25 2022-06-28 Deep Longevity Limited Aging markers of human microbiome and microbiomic aging clock
US11260078B2 (en) 2017-07-25 2022-03-01 Insilico Medicine Ip Limited Method of treating senescence with multi-stage longevity therapeutics

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4668777A (en) * 1981-03-27 1987-05-26 University Patents, Inc. Phosphoramidite nucleoside compounds
US5380831A (en) * 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
ATE87032T1 (de) * 1986-12-05 1993-04-15 Ciba Geigy Ag Verbessertes verfahren zur transformation von pflanzlichen protoplasten.
US5015580A (en) * 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5416011A (en) * 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US7705215B1 (en) * 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) * 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5484956A (en) * 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
CA2074355C (en) * 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US6403865B1 (en) * 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5384253A (en) * 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
US5907086A (en) 1991-05-01 1999-05-25 Pioneer Hi-Bred International, Inc. Plant promoter sequences
TW261517B (zh) * 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5591616A (en) * 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
US5362865A (en) * 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
US5981840A (en) * 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
AU2848800A (en) * 1999-01-14 2000-08-01 Monsanto Technology Llc Soybean transformation method
US7098324B2 (en) * 2001-07-30 2006-08-29 Texas Tech University Chitinase encoding DNA molecules from cotton expressed preferentially in secondary walled cells during secondary wall deposition and a corresponding promoter
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
BRPI0408896A (pt) * 2003-03-28 2006-04-25 Monsanto Technology Llc promotores de planta para uso no desenvolvimento precoce de sementes
AR059119A1 (es) * 2005-12-23 2008-03-12 Arcadia Biosciences Inc Utilizacion eficaz de nitrogeno en plantas monocotiledoneas
CN102027115A (zh) 2008-03-31 2011-04-20 希尔雷斯股份有限公司 启动子、启动子控制元件以及其组合和用途

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480216A (zh) * 2016-12-07 2017-03-08 江苏省农业科学院 一种用于检测转基因调控元件的标准质粒及其构建方法与应用
CN111876429A (zh) * 2020-04-10 2020-11-03 中国科学技术大学 一种水稻蛋白OsYAF9a在调控水稻株型中的用途
CN111876429B (zh) * 2020-04-10 2022-05-17 中国科学技术大学 一种水稻蛋白OsYAF9a在调控水稻株型中的用途
CN113832153A (zh) * 2021-09-07 2021-12-24 中国热带农业科学院三亚研究院 高粱启动子、制备方法及应用
CN113832153B (zh) * 2021-09-07 2022-07-01 中国热带农业科学院三亚研究院 高粱启动子、制备方法及应用

Also Published As

Publication number Publication date
WO2009146015A2 (en) 2009-12-03
BRPI0909285B1 (pt) 2020-01-28
BRPI0909285A2 (pt) 2019-03-06
US20140096286A1 (en) 2014-04-03
US20110030092A1 (en) 2011-02-03
WO2009146015A3 (en) 2010-03-11
US8592646B2 (en) 2013-11-26
US9896693B2 (en) 2018-02-20

Similar Documents

Publication Publication Date Title
US11560569B2 (en) Promoter, promoter control elements, and combinations, and uses thereof
US9896693B2 (en) Promoter, promoter control elements, and combinations, and uses thereof
US8389805B2 (en) Promoter, promoter control elements, and combinations, and uses thereof
US20050223422A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
US20050246785A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
US20090181851A1 (en) Promoter, Promoter Control Elements, And Combinations, And Uses Thereof
US20060021083A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
US10851383B2 (en) Promoter, promoter control elements, and combinations, and uses thereof
CA2078327A1 (en) Plant promoter
WO2012009551A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
CN102533804B (zh) 白沙蒿Δ12脂肪酸脱氢酶(As FAD2)基因及用途
CN116103262A (zh) 棉花丝/苏氨酸蛋白磷酸酶GhTOPP4及其编码基因和应用
US20100299784A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
US20230287442A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
US7217864B2 (en) Shade responsive promoter, promoter control elements, and combinations, and uses thereof
AU2429299A (en) Nucleic acid comprising the sequence of a promoter inductible by stress and a gene sequence coding for stilbene synthase
US20080134357A1 (en) Promoter, promoter control elements, and combinations, and uses thereof
EP1268829B1 (en) Atrsp gene promoters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110420