CN103131697A - 在单子叶植物中调控表达的表达盒 - Google Patents

在单子叶植物中调控表达的表达盒 Download PDF

Info

Publication number
CN103131697A
CN103131697A CN2012104998130A CN201210499813A CN103131697A CN 103131697 A CN103131697 A CN 103131697A CN 2012104998130 A CN2012104998130 A CN 2012104998130A CN 201210499813 A CN201210499813 A CN 201210499813A CN 103131697 A CN103131697 A CN 103131697A
Authority
CN
China
Prior art keywords
sequence
gene
nucleotide sequence
seq
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104998130A
Other languages
English (en)
Inventor
H-S·宋
M·莫拉
C·达曼
C·E·罗赫
E·托伦
A·多布森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Publication of CN103131697A publication Critical patent/CN103131697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8227Root-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Reproductive Health (AREA)
  • Pregnancy & Childbirth (AREA)
  • Developmental Biology & Embryology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及在单子叶植物中调控表达的表达盒,包括至少一个可从如下单子叶植物基因中获得的转录调控核苷酸序列:咖啡酰-CoA-O-甲基转移酶基因、C8,7-固醇异构酶基因、富含羟脯氨酸的糖蛋白(HRGP)基因、乳酸脱氢酶基因以及叶绿体蛋白12样基因。更优选转录调控序列可从玉米或稻中获得。所述转录调控序列对于根/仁偏好性表达、叶/胚乳偏好性表达、根/穗丝/仁偏好性表达或组成型表达尤其有用。

Description

在单子叶植物中调控表达的表达盒
本申请为下述分案申请的分案申请;所述分案申请的申请号为201110234476.8,申请日为2006年2月8日,提交日为2011年8月16日,发明名称为“在单子叶植物中调控表达的表达盒”;其母案申请为2006年2月8日提交的、发明名称为“在单子叶植物中调控表达的表达盒”的PCT申请PCT/EP2006/050781,所述PCT申请进入中国国家阶段的日期为2007年10月8日,申请号为200680011376.6。 
发明领域
本发明涉及表达盒,包括至少一个可从如下单子叶植物基因中获得的转录调控核苷酸序列:咖啡酰-CoA-O-甲基转移酶基因、C8,7-固醇异构酶基因、富含羟脯氨酸的糖蛋白(HRGP)基因、乳酸脱氢酶基因以及叶绿体蛋白12样基因。更优选转录调控序列可从玉米(Zea mays)或稻(Oryza sativa)中获得。所述转录调控序列对于根/仁偏好性表达、叶/胚乳偏好性表达、根/穗丝/仁偏好性表达或者组成型表达尤其有用。 
发明背景 
操作植物以改变和/或改善表型特征(如生产力或品质)需要在植物组织中表达异源基因。这类基因操作依赖于用于驱动和控制所需基因表达的方法的可用性。例如,基因操作依赖于在植物中有效并在转基因植物中调控基因表达以产生期望效果的适当启动子的可用性和使用。 
在需要在植物发育的所有(或大部分)时间在所有(或大部分)组织中表达的情况下优选组成型启动子。在单子叶植物中有功能的组成型启动子的数量是有限的,并且包括稻肌动蛋白1(Wang 1992;US 5,641,876)、CaMV35S(Odell 1985)、CaMV 19S(Lawton 1987)和玉米遍在蛋白启动子(Christensen 1996)。尽管以序列描述了双子叶植物的几种组成型和组织特异性启动子(例如,欧芹的咖啡酰-CoA-O-甲基转移酶基因(Grimmig 1997)、杨树(Chen 1998)和松树(Li 1999)的启动子),但是在异源基因表达方面,仅表征了非常有限的启动子。与双子叶启动子相比,单子叶植物的启动子仍然非常有限。最好可以选择多种不同启动子,以便可以选择对特定基因、构建体、细胞、组织、植物或环境最适宜的启动子。此外,随着对用多重 植物转录单位(PTU)共转化植物日益增长的兴趣,以及与用于这些目的的共有调控序列的使用有关的潜在问题,我们应该获得多种启动子序列。 
根优选的或根特异性的启动子有益于改变根组织的功能、改良生长速度、改进对根偏好性病原体、害虫、除草剂或不利天气条件的抗性,有益于土壤解毒以及扩大植物可生长的土壤或环境的范围。根丰富的或根特异性基因表达将提供一种机制,据此可改变形态学和代谢,以改善产量并生产更大量的有用蛋白质。特别是,根特异性启动子可有益于表达防御相关基因,包括赋予昆虫抗性和胁迫耐性的那些基因,例如,盐、寒冷或干旱耐性,以及用于改变养分摄取的基因。在单子叶植物中有功能的根偏好性和根特异性启动子的数量非常有限。这些包括玉米MR7启动子(美国专利No.5,837,848)、玉米ZRP2启动子(美国专利No.5,633,363)和玉米MTL启动子(美国专利No.5,466,785和6,018,099)。这些实例中的许多公开了表达模式限于有限数量根组织的启动子。其他的不能提供所选基因表达所需的根特异性。最好可以选择多种不同的启动子,以便可选择对特定基因、构建体、细胞、组织、植物或环境最适宜的启动子。此外,随着对用多重植物转录单位(PTU)共转化植物日益增长的兴趣,以及与用于这些目的的共有调控序列的使用有关的潜在问题,我们应该获得多种启动子序列。 
因此,本领域技术中非常需要鉴定新的序列,其可用于在经济上最重要的单子叶植物,尤其是在稻和玉米中表达所选的转基因。因此本发明的目的是提供用于在单子叶植物中表达转基因的新的和可选择的表达盒,更优选借此调节表达的组织特异性。 
附图的简短说明 
图1Os.CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::CCoAMT1终止子嵌合构建体(pBPSMM325)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Os.CCoAMT1启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及Os.CCoAMT1的非翻译区和转录终止区。SM 盒代表选择标记(ahas)盒。 
图2玉米中受稻(Os)CCoAMT1启动子构建体(pBPSMM325)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶+根:5叶期 
(B)叶:开花期 
(C)仁(授粉前) 
(D)仁:授粉后30天(30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图3 A:Os.CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子融合构建体(pBPSMM271)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Os.CCoAMT1启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及胭脂碱合酶(NOS)终止子。SM盒代表选择标记(ahas)盒。 
B:玉米中受(Os)CCoAMT1启动子构建体(pBPSMM271)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶和根:5叶期 
(B)叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图4 A:Os.SI::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子融合构建体(pBPSMM331)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Os.SI启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及NOS终止子的表达构建体。SM盒代表选择标记盒。 
B:玉米中受Os.SI启动子构建体(pBPSMM331)控制的GUS表达。上面 一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶和根:5叶期 
(B)叶:5叶期;叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图5 A:Zm.HRGP::玉米遍在蛋白内含子::GUS(PIV2)::Zm.HRGP终止子融合构建体(pBPSET003)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Zm.HRGP启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及HRGP终止子。SM盒代表选择标记(ahas)盒。 
B:玉米中受玉米Zm.HRGP启动子构建体(pBPSET003)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶和根:5叶期 
(B)叶:5叶期;叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图6 A:Zm.LDH::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子融合构建体(pBPSMM272)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Zm.LDH启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及NOS终止子。SM盒代表选择标记(ahas)盒。 
B:玉米中受玉米Zm.LDH启动子构建体(pBPSMM272)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。含有pBPSMM272或pBPSET007的转基因植物显示出同样的表达模式。 
(A)叶和根:5叶期 
(B)叶:5叶期;叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表8个T1单拷贝株系的可重复表达模式。 
图7 A:Zm.LDH::玉米遍在蛋白内含子::GUS(PIV2)::Zm.LDH终止子融合构建体(pBPSET007)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Zm.LDH启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及LDH终止子。SM盒代表选择标记(ahas)盒。 
B:玉米中受玉米Zm.LDH启动子构建体(pBPSET007)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶和根:5叶期 
(B)叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图8 A:Os.CP12::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子融合构建体(pBPSMM304)图。 
该质粒包含表达构建体,所述表达构建体含有有效连接于玉米遍在蛋白内含子的Os.CP12启动子、β葡糖醛酸糖苷酶基因(GUS,包括马铃薯转化酶[PIV]2内含子)以及NOS终止子。SM盒代表选择标记盒。 
B:玉米中受玉米Os.CP12启动子构建体(pBPSMM304)控制的GUS表达。上面一组(I)代表用GUS染色的原始照片,而下面的一组(II)表示被阴影区域覆盖的清楚地被染成蓝色的区域。 
(A)叶和根:5叶期 
(B)叶:开花期 
(C)仁(授粉后30天:30DAP) 
照片代表15个T1单拷贝株系的可重复表达模式。 
图9干旱胁迫诱导的玉米中Zm.LDH启动子构建体(pBPSMM272)的 表达。将5叶期转基因植物通过停止供水进行干旱胁迫。在所示的时间点从叶上采集样品。从叶样品中分离RNA,并以定量RT-PCR进行分析。将GUS表达对每个样品中的内对照基因进行标准化。将结果表示为与0时间点相比表达水平增加的倍数,其中将0时间点的表达设定为1。 
图10A-10B稻乳酸脱氢酶(LDH)蛋白与玉米(1)、稻(2)、大麦(3)、稻(4)、拟南芥(Arabidopsis)(5、6)、番茄(7)、马铃薯(8)LDH蛋白的蛋白质序列比对。 
区分单子叶LDH蛋白和其他双子叶LDH蛋白的序列基序加框表示(用“+”标记相应的不同氨基酸)。本领域技术人员基于本序列比对可以很容易地鉴定更多的这类序列基序。 
图11稻C8,7固醇异构酶(SI)蛋白与拟南芥(1-3)和稻(4)SI蛋白的蛋白质序列比对。 
图12稻咖啡酰-CoA-O-甲基转移酶1(CCoAMT1)与烟草(1)、桉树(2)、杨树(3)、玉米(4、5、6)和稻(7)CCoAMT1蛋白的蛋白质序列比对。 
区分单子叶CCoAMT蛋白和其他双子叶CCoAMT蛋白的序列基序加框表示(用“+”标记相应的不同氨基酸)。本领域技术人员基于本序列比对可以很容易地鉴定更多的这类序列基序。 
发明概述 
因此,本发明的第一个实施方案涉及用于在单子叶植物中调控表达的表达盒,包括 
i)至少一个单子叶植物基因的转录调控核苷酸序列,所述的单子叶植物基因选自咖啡酰-CoA-O-甲基转移酶基因、C8,7-固醇异构酶基因、富含羟脯氨酸的糖蛋白(HRGP)基因、乳酸脱氢酶基因以及叶绿体蛋白12样基因, 
和与之功能性相连的 
ii)至少一个核苷酸序列,其与所述转录调控序列是异源的。 
优选转录调控核苷酸序列可从多肽编码基因的单子叶植物基因组 DNA中获得,其中所述多肽 
a1)包含单子叶植物乳酸脱氢酶蛋白的至少一个序列基序,所述序列基序选自如下氨基酸序列: 
i)SLSELGFDA       (SEQ ID NO:76), 
ii)VIGAGNVGMA     (SEQ ID NO:77), 
iii)IVTAGARQI     (SEQ ID NO:78), 
iv)L(F/Y)RKIVP    (SEQ ID NO:79), 
v)GFPASRV         (SEQ ID NO:80), 
vi)RF(L/I)AEHL    (SEQ ID NO:81), 
vii)QAYMVGEH      (SEQ ID NO:82), 
viii)ALEGIRRAV    (SEQ ID NO:83),和 
ix)GYSVAS(L/I)A   (SEQ ID NO:84), 
或者 
b1)编码单子叶植物乳酸脱氢酶蛋白,与选自SEQ ID NO:26、60和65所述的多肽具有至少90%的氨基酸序列同一性,或者 
a2)包含单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白的至少一个序列基序,所述序列基序选自如下氨基酸序列: 
x)EQKTRHSE         (SEQ ID NO:85), 
xi)L(I/L)KLIGAK    (SEQ ID NO:86), 
xii)KTMEIGVY       (SEQ ID NO:87), 
xiii)HERL(L/M)KLV  (SEQ ID NO:88), 
xiv)CQLPVGDG       (SEQ ID NO:89),和 
xv)TLCRRVK         (SEQ ID NO:90), 
或者 
b2)编码单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白,与选自SEQ IDNO:5和70所述的多肽具有至少90%的氨基酸序列同一性,或者 
b3)编码单子叶植物富含羟脯氨酸的糖蛋白,与选自SEQ ID NO:18和75所述的多肽具有至少90%的氨基酸序列同一性,或者 
b4)编码单子叶植物C8,7-固醇异构酶蛋白,与SEQ ID NO:10所述的多肽具有至少90%的氨基酸序列同一性,或者 
b5)编码单子叶植物叶绿体蛋白12样蛋白,与SEQ ID NO:31所述的多肽具有至少90%的氨基酸序列同一性。 
优选转录调控核苷酸序列来自玉米或稻植物。甚至更优选转录调控核苷酸序列是选自稻咖啡酰-CoA-O-甲基转移酶基因、稻C8,7-固醇异构酶基因、玉米富含羟脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脱氢酶基因、稻叶绿体蛋白12样基因的植物基因及其功能等同物。优选功能等同物编码的多肽与选自SEQ ID NO:5、10、18、26、31、60、65、70和75所述多肽具有至少90%的氨基酸序列同一性。 
在更优选的实施方案中,转录调控核苷酸序列选自如下序列: 
i)由SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73所述的序列,和 
ii)i)中序列的至少50个连续碱基的片段;和 
iii)与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述转录调控核苷酸序列基本上相似的核苷酸序列(优选具有至少60%的序列同一性;更优选通过BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较);和 
iv)能与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或其互补物杂交的核苷酸序列;和 
v)能与如下核酸杂交的核苷酸序列,其中所述核酸包含SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的 转录调控核苷酸序列或其互补物的50-200个或更多连续核苷酸(优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用2×SSC、0.1%SDS于50℃洗涤;更优选在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA中于50℃杂交,用1×SSC、0.1%SDS于50℃洗涤,还更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.5×SSC、0.1%SDS于50℃洗涤,甚至更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于50℃洗涤,最优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤);和 
vi)上述i)至v)核苷酸序列中任一的互补物或反向互补物核苷酸序列。 
另一优选的实施方案涉及用于在单子叶植物中调控表达的表达盒,其包括: 
a)至少一个在单子叶植物中有功能的转录调控核苷酸序列,其包含选自如下序列的至少一个序列: 
i)SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73所述的序列,和 
ii)i)中序列的至少50个连续碱基的片段;和 
iii)与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述转录调控核苷酸序列基本上相似的核苷酸序列(优选具有至少60%的序列同一性;更优选通过BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较);和 
iv)能与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或其互补物杂交的核苷酸序列(优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于 50℃杂交,用2×SSC、0.1%SDS于50℃洗涤;更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用1×SSC、0.1%SDS于50℃洗涤,还更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中于50℃杂交,用0.5×SSC、0.1%SDS于50℃洗涤,甚至更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于50℃洗涤,最优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤);和 
v)能与如下核酸杂交的核苷酸序列,其中所述核酸包含SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或其互补物的50-200个或更多连续核苷酸;和 
vi)上述i)至v)核苷酸序列中任一的互补物或反向互补物核苷酸序列, 
和 
b)至少一个核苷酸序列,其与所述转录调控序列是异源的。 
优选上段中ii)、iii)、iv)、v)和vi)中定义的序列能够在单子叶植物细胞或生物体中修饰转录。更优选ii)、iii)、iv)、v)和vi)中定义的所述序列与SEQID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列基本上具有相同的转录调控活性。 
还优选上述iii)中定义的序列与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述序列具有至少60%、优选70%或80%、更优选90%或95%的序列同一性,其中同一性优选通过BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较。 
更优选上述iv)或v)中定义的序列在严谨条件下,优选在中等严谨条件下,最优选在高严谨条件下(如在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤)与指定的靶序列杂交。 
在本发明表达盒的一个优选的实施方案中,核酸序列的表达导致蛋白质的表达,或者反义RNA、正义或双链RNA的表达。 
本发明表达盒的表达谱可依靠转录调控核苷酸序列与增强表达的内含子和/或转录终止序列的结合进行调控。在本发明表达盒的优选实施方案中,这包括至少一种选自如下的额外元件: 
a)5’非翻译区,和 
b)内含子编码序列,和 
c)转录终止序列。 
内含子编码序列优选编码单子叶植物的表达增强内含子。更优选内含子序列是遍在蛋白、肌动蛋白或醇脱氢酶基因的内含子。优选将内含子插入到表达构建体中欲表达核酸序列的5’非翻译区(即,位于转录调控核苷酸序列与蛋白质编码序列(开放读框)或欲表达核酸序列之间)。 
优选5’非翻译区来自与转录调控序列相同的基因。 
转录终止序列优选也包括诱导多聚腺苷化作用的序列。转录终止序列可以异源于转录调控核苷酸序列和/或待表达核酸序列,但也可以是所述转录调控核苷酸序列和/或所述待表达的核酸序列基因的天然转录调控核苷酸序列。在本发明一个优选的实施方案中,转录调控核苷酸序列是转录调控序列基因的天然转录调控核苷酸序列。优选转录终止序列选自SEQ IDNO:32、34和35所述的序列。 
本发明的转录调控序列尤其可用于单子叶植物中组成型或根/仁偏好性表达或根/仁特异性表达。然而不排除在其他植物(例如,双子叶或裸子植物)和其他组织中的应用。已经证明,本发明的转录调控序列的组织特异性能够最好通过结合内含子和/或转录终止序列进行调控。 
表达盒可用于多种表达目的,例如用于蛋白质的表达,或者反义RNA、正义或双链RNA的表达。优选核酸序列的表达赋予植物农艺学上有价值的性状。 
本发明有些转录调控序列甚至如所述的那样是新的(即,如所分离的核苷酸序列)。因此,本发明的另一个实施方案涉及分离的核苷酸序列,其包含至少一个如SEQ ID NO:6、7、8、11、12、13、19、20或21所述的转录调控核苷酸序列。 
本发明的其他实施方案涉及含有本发明表达盒的载体,以及含有本发明表达盒或载体的转基因宿主细胞或非人生物。优选生物是植物,更优选是单子叶植物,最优选选自玉米、稻、小麦(Triticum aestivum)、大麦(Hordeum vulgare)和燕麦(Avena sativa)。 
本发明的另一个实施方案涉及用于在单子叶植物中鉴定和/或分离转录调控核苷酸序列的方法,其特征在于所述鉴定和/或分离利用如SEQ IDNO:5、10、18、26、31、60、65、70或75所述氨基酸序列的编码核酸序列,或者至少15个碱基的所述核酸序列的部分。优选所使用的核酸序列为SEQ ID NO:4、9、17、25、30、59、64、69或74,或者至少15个碱基的所述核酸序列的部分。优选所述鉴定和/或分离通过选自聚合酶链式反应、杂交和数据库筛选的方法实现。 
本发明的另一个实施方案涉及提供用于在单子叶植物中进行异源表达的转基因表达盒的方法,包括步骤: 
I.利用至少一个核酸序列或其部分从单子叶植物中分离转录调控核苷酸序列,其中所述序列编码SEQ ID NO:5、10、18、26、31、60、65、70或75所述的多肽,或者至少15个碱基的所述核酸序列的部分,和 
II.将所述转录调控核苷酸序列功能性连接于其他目的核苷酸序列,后者与所述转录调控核苷酸序列异源。 
对于上述两类方法,优选分离所述转录调控核苷酸序列所采用的核苷酸序列编码这样的多肽,所述多肽包含: 
a1)单子叶植物乳酸脱氢酶蛋白的至少一个序列基序,其中序列基序选自如下氨基酸序列: 
i)SLSELGFDA    (SEQ ID NO:76), 
ii)VIGAGNVGMA  (SEQ ID NO:77), 
iii)IVTAGARQI     (SEQ ID NO:78), 
iv)L(F/Y)RKIVP    (SEQ ID NO:79), 
v)GFPASRV         (SEQ ID NO:80), 
vi)RF(L/I)AEHL    (SEQ ID NO:81), 
vii)QAYMVGEH      (SEQ ID NO:82), 
viii)ALEGIRRAV    (SEQ ID NO:83),和 
ix)GYSVAS(L/I)A   (SEQ ID NO:84), 
或者 
a2)单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白的至少一个序列基序,其中序列基序选自如下氨基酸序列: 
x)EQKTRHSE       (SEQ ID NO:85), 
xi)L(I/L)KLIGAK  (SEQ ID NO:86), 
xii)KTMEIGVY     (SEQ ID NO:87), 
xiii)HERL(L/M)KLV(SEQ ID NO:88), 
xiv)CQLPVGDG     (SEQ ID NO:89),和 
xv)TLCRRVK       (SEQ ID NO:90)。 
定义 
应当理解的是,本发明不限于所述的特定方法、方案、细胞系、植物物种或属、构建体以及试剂身。也应当理解的是,这里所使用的术语仅用于描述特定实施方案的目的,而非旨在限制本发明的范围,后者将仅通过所附的权利要求书进行限定。必须注意到,如文中和所附权利要求书中所使用的,单数形式的“一个”、“一种”和“该”包括复数,除非上下文清楚地另行指示。因此,例如,提及“载体”时是指一种或多种载体,包括本领域技术人员已知的其等同物,等等。 
文中所使用的术语“约”是指近似地、粗略地、左右或附近。当术语“约”与数值范围一起使用时,其通过扩展所示数值的上下边界而修饰该范围。通常,文中所使用的术语“约”以所示值上下20%的方差、优选上 下(高低)10%的方差修饰数值范围。 
如这里所使用的,措辞“或”是指特定列单中的任何一个成员,也包括该列单中成员的任意组合。 
术语“基因”广泛地指与生物功能有关的任何核酸节断。因此,基因包括编码序列和/或它们表达必需的调控序列。例如,基因指表达mRNA或功能性RNA,或者编码特定蛋白质的核酸片段,并且包括调控序列。基因也包括非表达的DNA节断,例如,构成其他蛋白质的识别序列。基因可从多种来源获得,包括从目的来源中克隆,或者根据已知的或预测的序列信息合成,并且可包括设计用于具有期望参数的序列。 
术语“内含子”指基因内的DNA区段(间插序列),其不编码基因所产生的蛋白质的部分,并且在从细胞核中输出前,其在从基因中转录的mRNA中被剪接掉。内含子序列指内含子的核酸序列。因此,内含子是DNA序列中那些随编码序列(外显子)一起被转录,但是在成熟mRNA的形成期间被除去的区域。内含子可位于实际的编码区内或者位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导区。将初级转录物中的内含子切除,并将编码序列同时精确地连接起来,从而形成成熟mRNA。内含子和外显子的接点形成剪接位点。内含子的序列以GU开始并以AG结束。此外,在植物中,已经描述了两例AU-AC内含子:拟南芥(Arabidopsis thaliana)的RecA-样蛋白基因的内含子14和G5基因的内含子7是AU-AC内含子,含有内含子的前mRNA具有三个短序列,除了其他序列之外,这三个短序列是内含子准确剪接必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接是除去初级mRNA转录物中存在的间插序列(内含子)并结合或连接外显子序列。这也被称作顺式剪接,其在除去间插序列(内含子)的同一RNA上连接两个外显子。内含子的功能元件包括被剪接体的特异性蛋白组分识别并结合的序列(例如,内含子末端的剪接共有序列)。功能性元件与剪接体的相互作用导致从未成熟的mRNA中除去内含子序列并将外显子序列重新连接。内含子具有三个短序列,是内含子被准确剪接所必要的,但并非充分条件。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序列在植物 的剪接和剪接位点选择中很重要。分支点序列通常位于3’剪接位点上游10-60核苷酸处。植物序列就分支点而言显示出序列偏差,共有序列是CURAY或YURAY。 
术语“天然的”或“野生型”基因指未转化细胞的基因组中存在的基因,即,没有已知突变的细胞。 
“标记基因”编码可选择的或可筛选的性状。 
术语“嵌合基因”指任何基因,其包括 
1)DNA序列,包括并非在自然界中连在一起的调控和编码序列,或者 
2)编码非天然毗邻的蛋白质部分的序列,或者 
3)非天然毗邻的启动子部分。 
因此,嵌合基因可包括源自不同来源的调控序列和编码序列,或者包括源自同一来源的调控序列和编码序列,但是以不同于天然发现的方式排列。 
“转基因”指已通过转化引入到基因组内并稳定维持的基因。转基因可包括,例如,与待转化的特定植物的基因异源或同源的基因。另外,转基因可包括插入到非天然生物体内的天然基因,或者嵌合基因。术语“内源基因”指生物体基因组中其天然位置中的天然基因。“外源”基因指通常未在宿主生物体中发现,但通过基因转移被引入的基因。 
与本发明的核苷酸序列对应的“寡核苷酸”,例如用于探测或扩增反应,长度可以是约30个或更少核苷酸(例如,9、12、15、18、20、21或24,或者是9-30的任意数)。通常,特异性引物长度超过14个核苷酸。对于最适特异性和成本效率来说,长度为16-24个核苷酸的引物可能是优选的。本领域技术人员通晓用于如PCR方法的引物设计。如果必需的话,可用这里所公开的基因的整套限制性片段进行探测,其长度可以是100个或者甚至是1,000个核苷酸。 
术语“蛋白质”、“肽”和“多肽”这里可互换使用。 
可将本发明的核苷酸序列引入到任何植物中。可在表达盒中方便地使用待引入的基因,用于任何目的植物中的引入和表达。这类表达盒将包括 与目的核苷酸序列相连的本发明的转录起始区。优选的启动子包括组成型、组织特异性、发育特异性、诱导型和/或病毒启动子。提供具有多个限制性位点的这类表达盒,用于将目的基因插入到调控区的转录调控下。表达盒可另外含有可选择的标记基因。该盒在5′-3′转录方向上将包括在植物中有功能的转录和翻译起始区、目的DNA序列,以及转录和翻译终止区。终止区可以是转录起始区的天然终止区,可以是目的DNA序列的天然终止区,或者可以来自其他来源。合适的终止区可从根癌农杆菌(Agrobacteriumtumefaciens)的Ti-质粒中获得,如,章鱼碱合酶和胭脂碱合酶终止区(也见,Guerineau 1991;Proudfoot 1991;Sanfacon 1991;Mogen 1990;Munroe1990;Ballas 1989;Joshi 1987)。 
“编码序列”指编码特定氨基酸序列并排除非编码序列的DNA或RNA序列。其可构成“不间断的编码序列”,即,缺乏内含子,如在cDNA中,或者其可包括由适当的剪接接点为界限的一个或多个内含子。“内含子”是RNA序列,初级转录物中含有该序列,但是在细胞内通过RNA的裂解和再连接被除去以产生可被翻译成蛋白质的成熟mRNA。 
术语“开放读框”和“ORF”指编码序列的翻译起始和终止密码子之间所编码的氨基酸序列。术语“起始密码子”和“终止密码子”指编码序列中三个相邻核苷酸单位(“密码子”),其分别规定蛋白质合成(mRNA翻译)的起始和链终止。 
“功能性RNA”指反义RNA、双链RNA、核糖核酸酶,或不被翻译的其他RNA。 
术语“RNA转录物”指由RNA聚合酶催化DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完全互补拷贝时,其被称作初级转录物,或者其可以是源于初级转录物的转录后加工的RNA序列并被称作成熟RNA。“信使RNA”(mRNA)指无内含子并且可被细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补并源于其的单链或双链DNA。 
“转录调控核苷酸序列”、“调控序列”,和“适当的调控序列”,每个都指影响转录、RNA加工或稳定性、或者相关(或功能性相连的)待转 录核苷酸序列的翻译的核苷酸序列。相对于待转录的核苷酸序列,转录调控核苷酸序列的定位可有多处。转录调控核苷酸序列可位于待转录序列(例如,编码序列)的上游(5′非编码序列),之内或下游(3′非编码序列)。转录调控序列可选自增强子、启动子、翻译前导序列、内含子、5′非翻译序列、3′非翻译序列以及多聚腺苷酸化信号序列。它们包括天然的和合成的序列,可以是合成的和天然序列的组合。如上所述,术语“转录调控序列”不限于启动子。然而,优选本发明的转录调控核苷酸序列包括至少一个启动子序列(例如,位于基因的转录起点上游,能诱导下游序列的转录的序列)。在本发明的一个优选的实施方案中,本发明的转录调控核苷酸序列包括相应基因的启动子序列,任选且优选所述基因的天然5′非翻译区。此外,也可使用所述基因的3′非翻译区和/或多聚腺苷酸化区。 
“5′非编码序列”指位于编码序列5′(上游)的核苷酸序列。其位于经过充分加工的mRNA的起始密码子的上游,并且可以影响初级转录物加工成mRNA、影响mRNA稳定性或翻译效率(Turner 1995)。 
“3′非编码序列”指位于编码序列3′(下游)的核苷酸序列,并且包括多聚腺苷酸化信号序列和编码能影响mRNA加工或基因表达的调控信号的其他序列。通常,多聚腺苷酸化信号的特征是影响向mRNA前体的3′末端添加多聚腺苷酸束。Ingelbrecht等,1989举例说明了不同3′非编码序列的用途。 
术语“翻译前导序列”指基因的启动子和编码序列之间的DNA序列部分,其转录成RNA并且位于经过充分加工的mRNA的转录起始密码子的上游(5′)。翻译前导序列可影响初级转录物加工成mRNA、影响mRNA稳定性或翻译效率。 
“信号肽”指多肽的氨基末端延伸,其与多肽一起翻译,形成前体肽,并且对于其进入分泌途径是必需的。术语“信号序列”指编码信号肽的核苷酸序列。如这里所使用的术语“转运肽”指所表达的多肽的一部分(优选指多肽的氨基末端延伸),其与多肽一起翻译,形成前体肽,并且对于其进入细胞器是必需的(如质体(例如,叶绿体)或线粒体)。术语“转运序列”指 编码转运肽的核苷酸序列。 
“启动子”指通常位于编码序列上游(5′)的核苷酸序列,通过提供对正确转录所必需的RNA聚合酶和其他因子的识别,控制编码序列的表达。“启动子”包括短DNA序列的最小启动子,其由TATA盒和用于指定转录起始位点的其他序列构成,向其添加调控元件用于表达的控制。“启动子”也指包括最小启动子加上能用于控制编码序列或功能性RNA表达的调控元件的核苷酸序列。该类型的启动子序列由近侧和更远侧的上游元件构成,后者通常称作增强子。因此,“增强子”是这样的DNA序列,其可刺激启动子活性,并且可以是启动子的先天元件或者是插入的异源元件,以增强启动子的水平或组织特异性。其在两个方向上都能发挥功能(正常的或翻转的),并且甚至当移动到启动子的上游或下游时仍然有功能。增强子和其他上游启动子元件都与介导其效应的序列特异性的DNA结合蛋白结合。启动子可整体源自天然基因,或者由不同元件构成,源自天然所发现的完全不同的启动子,或者甚至由合成的DNA片段构成。启动子也可含有参与蛋白因子结合的DNA序列,其控制响应生理或发育条件的转录起始的效率。 
“起始位点”是围绕第一核苷酸的位置,是所转录序列的一部分,其也被定义为位置+1。相对于此位点对基因的所有其他序列和其控制区进行编号。将下游序列(即,3′方向上其余蛋白质编码序列)命名为正,而将上游序列(5′方向上控制区的大部分)命名为负。 
将启动子元件,特别是TATA元件,在缺乏上游激活时无活性或者启动子活性极度降低,称作“最小或核心启动子”。在存在适当的转录因子时,最小启动子起允许转录的功能。“最小或核心启动子”因此仅由转录起始所必需的所有基本元件构成,即,TATA盒和/或起始子。 
“组成型表达”指使用组成型或可调型启动子的表达。 
“组织非依赖性的”、“组织通用的”或“组成型”旨在指大部分时间在整个植物的细胞中和在大部分组织中的表达。与归为“组成型”的其他启动子(例如,遍在蛋白)一样,可以在不同组织或阶段的绝对表达水平存在一些变动。然而,组成型启动子通常在大多数组织中,优选在所有组 织中,以及在大多数发育阶段,优选在所有发育阶段都高水平或中等水平表达。“有条件的”和“可调的表达”指受可调型启动子控制的表达。 
“组成型启动子”指这样的启动子,其能在植物的所有或几乎所有发育阶段期间在所有或几乎所有植物组织中表达受其控制的开放读框(ORF)。各转录激活元件都不显示绝对的组织特异性,但在大多数植物部分中介导的转录激活水平至少为在转录最活跃的植物部分中所达水平的1%。 
“可调型启动子”指指导基因非组成型表达,而以时间和/或空间调控的方式表达的启动子,并且包括组织特异性和诱导型启动子。其包括天然的和合成序列,可以是合成的和天然序列的组合。不同启动子可在不同组织或细胞类型中,或在不同的发育阶段,或者响应不同的环境条件指导基因的表达。在植物细胞中有用的多种类型的新启动子不断地被发现,众多实例可见于Okamuro等(1989)的汇编出版物。在植物中有用的典型的可调型启动子包括但不限于安全剂诱导型启动子、源于四环素诱导型系统的启动子、源于水杨酸诱导型系统的启动子、源于醇诱导型系统的启动子、源于糖皮质激素诱导型系统的启动子、源于病原体诱导型系统的启动子,以及源于蜕皮激素诱导型系统的启动子。 
“组织特异性启动子”指不在所有植物细胞中表达,而仅在特定器官(如叶或种子)、特定组织(如胚或子叶)中的一种或多种细胞类型中表达、或仅在特定细胞类型(如叶实质或种子储藏细胞)中表达的可调型启动子。这些也包括时间调控的启动子,如在早期或晚期胚发生中,在发育种子或果实的果实成熟期间,在完全分化的叶中,或者在衰老开始发生时。 
在本发明上下文中,术语“根”是指通常为地下的植物器官,其缺乏芽或叶或节,吸收水分和矿物盐,并通常将植物固定在地面。植物根由许多细胞类型构成,如表皮细胞、根冠、轴柱、皮层、中柱鞘、维管细胞和形成根毛的生毛细胞,组织起来形成根组织或根区,例如,根尖、根表皮、分生组织区、初生根、侧根、根毛和维管组织。分离为根特异性或根偏好的转录调控序列可在一种或几种这些细胞类型中调控表达。该细胞特异性 活性可用于特异性应用,如仅在分生细胞区中调控分生组织活性,或者仅在线虫害虫接触的细胞类型中调控杀线虫基因的表达。 
在本发明上下文中,就某组织或组织群(例如,根和仁)而言的术语“组织特异性转录”是指转录调控元件如此转录核酸序列,从而在整个植物中在其发育的任何一个阶段期间,所述核酸序列在所述组织或组织群中的转录占由所述核酸序列转录的全部RNA量的90%以上,优选95%以上,更优选99%以上。 
在本发明上下文中,就某组织或组织群(例如,根和仁)而言的术语“组织偏好的转录”是指转录调控元件如此转录核酸序列,从而在整个植物中在其发育的任何一个阶段期间,所述核酸序列在所述组织或组织群中的转录占由所述核酸序列转录的全部RNA量的50%以上,优选70%以上,更优选80%以上。 
“诱导型启动子”指可在一种或多种细胞类型中被外部刺激,例如化学品、光、激素、胁迫或病原体开启的那些可调型启动子。 
“有效连接”指单链核酸片段上核酸序列的结合,使得一个核酸序列的功能受另一个核酸序列的影响。例如,如果调控DNA序列与编码RNA或多肽的DNA序列的排布使得调控DNA序列影响编码DNA序列的表达(即,编码序列或功能性RNA在启动子的转录控制下),则调控DNA序列被表述为“有效连接于”或“连于”编码RNA或多肽的DNA序列。可将编码序列以正义或反义方向有效连接到调控序列上。 
“表达”指植物中内源基因、ORF或其部分、或者转基因的转录和/或翻译。例如,在反义构建体的情况中,表达可以仅指反义DNA的转录。另外,表达还指正义(mRNA)或功能性RNA的转录和稳定累积。表达也可指蛋白质的产生。 
“特异性表达”是基因产物的表达限于一种或几种植物组织(空间限制)和/或限于植物的一个或几个发育阶段(时间限制)。普遍认为几乎不存在真正的特异性:启动子似乎优选在一些组织中开启,而在其他组织中可能不开启或者仅有很小的活性。这种现象被称作渗漏表达。然而,在本发明中 特异性表达意味着在一个或几个植物组织中的偏好表达。 
启动子的“表达模式”(有或无增强子)是表达水平的模式,其表明在植物中何处、在哪个发育阶段,转录由所述启动子引发。当一个启动子的表达模式显示与其他启动子的表达模式几乎不重叠时,将这组启动子的表达模式称作是互补的。可通过测量标准的转录报道分子mRNA的“稳态”浓度,确定启动子的表达水平。这种测量是间接的,因为报道分子mRNA的浓度不仅依赖于其合成速率,而且也依赖于mRNA被降解的速率。因此,稳态水平是合成速率和降解速率的乘积。 
然而,当所转录的序列相同时,降解速率可视为以固定速率进行,因此这个值可作为合成速率的衡量值。当以这种方式比较启动子时,本领域技术人员可利用的技术是杂交S1-RNAse分析、Northern印迹和竞争性RT-PCR。该技术列表决不代表所有可利用的技术,而仅仅是说明分析转录活性和mRNA的表达水平的常用方法。 
在几乎所有启动子中,转录起点的分析已经显示转录起点通常不是单个碱基,而是一组或多或少簇集的起始位点,其中的每一个都是mRNA的某些起点。由于该分布随着启动子不同而变化,因此群体各个体中报道分子mRNA的序列相互之间也将不同。由于每种mRNA物质或多或少易于降解,因此不能预测不同报道分子mRNA的单个降解速度。对于多种真核启动子序列来说,已证明围绕起始位点(起始子)的序列在决定由该特定启动子所指导的RNA表达水平中起着重要的作用。这也包括部分转录序列。因此启动子与报道序列的直接融合将导致转录的亚适度水平。 
通常所使用的用于分析表达模式和水平的方法是通过测定细胞中蛋白质累积的“稳态”水平。对于报告基因来说,本领域技术人员已知的通常使用的候选物是β-葡糖醛酸糖苷酶(GUS)、氯霉素乙酰转移酶(CAT)和具有荧光特性的蛋白质,如Aequora victoria的绿色荧光蛋白(GFP)。然而,原则上,更多蛋白质适于这个目的,只要所述蛋白质不干扰基本的植物功能。许多工具适合定量和测定定位。例如,可很容易地创建或者获得基于免疫化学、酶促、荧光检测和定量的检测系统。可使用蛋白质表达的原位分析 测定植物组织提取物中或完整组织中的蛋白质水平。 
通常,具有嵌合启动子报道构建体的单个转化系的报道基因的表达水平将不同。也常常观察到这类转化体不表达任何可检测产物(RNA或蛋白质)的现象。尽管通常不清楚这种失活的分子机制基础,但是表达的变异性通常归咎于“位置效应”。 
“过表达”指转基因细胞或生物体中表达的水平超过正常或者未转化(非转基因)细胞或生物体中的表达水平。 
“反义抑制”指反义RNA转录物的产生能抑制内源性基因或转基因的蛋白质表达。 
“基因沉默”指病毒基因、转基因,或内源性核基因的依赖同源性的抑制。基因沉默可以是转录水平的,此时的抑制是由于受影响基因的转录降低,或者是转录后水平的,此时的抑制是由于与受影响的基因同源的RNA物质的周转(降解)增加(English 1996)。基因沉默包括病毒诱导的基因沉默(Ruiz等1998)。 
术语“异源DNA序列”、“外源DNA片段”或“异源核酸”,如这里所使用的,每一个都指源于与特定宿主细胞异源来源的序列,或者如果来自同一来源,那么是从其原来形式中经过修饰的。因此,宿主细胞中的异源基因包括是特定宿主细胞的内源性基因,但是已经通过例如使用DNA改组进行过修饰。该术语也包括天然存在的DNA序列的非天然发生的多个拷贝。因此,该术语指外源的或与细胞异源,或者与细胞同源但是元件不在平常发现的宿主细胞核酸内的位置上的DNA片段。表达外源DNA片段以生产外源多肽。“同源”DNA序列是与其所引入的宿主细胞天然相关的DNA序列。 
在核苷酸序列同一性的上下文中,“同源”指两核酸分子的核苷酸序列或者两蛋白质分子的氨基酸序列之间的相似性。通过本领域技术人员充分理解的在严谨条件下的DNA-DNA或DNA-RNA杂交(如在Haines和Higgins(编辑),Nucleic Acid Hybridization,IRL Press,Oxford,U.K.所描述的),或者通过两核酸或蛋白质之间的序列相似性的比较提供这种同源性 的评估。 
术语“基本上相似”指代表这里所具体公开的玉米或稻的转录调控序列的功能和/或结构等同物的核苷酸和氨基酸序列。 
在其最广泛的意思中,当谈到核苷酸序列时,这里所使用的术语“基本上相似的”是指核苷酸序列是基因的一部分,其编码与由参照核苷酸序列的基因所编码的多肽具有基本上相同结构和功能的多肽,例如,核苷酸序列包括是与参照核苷酸序列相应基因的直向同源物的基因的启动子,以及在结构上与这里所举例说明的启动子序列相关的启动子序列,即,基本上相似的启动子序列与这里所举例说明的启动子序列的互补物在高或极高严谨条件下杂交。例如,仅仅反映遗传密码的简并性、但编码与特定氨基酸序列相同氨基酸序列的改变了的核苷酸序列,与该特定序列基本上相似。术语“基本上相似”也包括序列已被修饰以例如优化特定细胞内的表达的核苷酸序列,以及相对于由参照序列所编码的(未修饰的)多肽,编码具有一个或多个氨基酸取代的变体多肽的核苷酸序列,其中,相对于未修饰的多肽,取代不改变变体多肽的活性。 
在其最广泛的意思中,当谈到多肽时,这里所使用的术语“基本上相似的”是指多肽与参照多肽具有基本上相同的结构和功能。另外,与特定序列基本上相似的氨基酸序列是与本发明序列的全部氨基酸同一性至少为65%或者更高的那些。产生等同核苷酸或氨基酸序列的修饰在本领域的常规技术内。基本上相似的多肽和参照多肽之间的氨基酸序列同一性百分比为至少65%、66%、67%、68%、69%、70%,例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%,甚至90%或者更高,例如91%、92%、93%、94%、95%、96%、97%、98%,直至至少99%,其中参照多肽是由具有SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73中任一序列的启动子的基因所编码的多肽,包括具有SEQ IDNO:4、9、17、25、30、59、64、69或74中任一序列的开放读框的核苷酸 序列,其编码SEQ ID NO:5、10、18、26、31、60、65、70或75中任一序列。除了具有基本上相同的功能之外,两多肽相互之间基本上相似的一个指标还在于:特异性结合一条多肽的物质(例如抗体),也特异性结合另一条。 
可使用Smith-Waterman序列比对算法(见,例如,Waterman(1995)或者http://www hto.usc.edu/software/seqaln/index.html)进行序列比较。优选使用具有如下参数的localS程序,1.16版:匹配:1,错配罚分:0.33,开放缺口罚分:2,延伸缺口罚分:2。 
此外,将与参照核苷酸序列“基本上相似”的核苷酸序列称作参照核苷酸序列的“等同物”。技术人员能够认识到,本发明所包含的等同核苷酸序列也可通过它们在低、中等和/或严谨条件下(例如,0.1×SSC,0.1%SDS,65℃)与本发明权利要求的文字范围内的核苷酸序列杂交的能力来定义。 
当谈到多核苷酸或多肽片段使用时,“基本上相同的活性”是指该片段具有全长多核苷酸或者全长多肽活性的至少65%、66%、67%、68%、69%、70%,例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%,甚至90%或更高,例如91%、92%、93%、94%、95%、96%、97%、98%,直至至少99%。 
“靶基因”指复制子上的基因,表达期望的靶编码序列、功能性RNA或蛋白质。靶基因不是复制子复制必需的。另外,靶基因可包括插入到非天然生物体内的天然非病毒基因,或者嵌合基因,并且将在适当的调控序列的控制下。因此,靶基因中的调控序列可来自任何来源,包括病毒。靶基因可包括与待转化的特定植物的基因异源或同源的编码序列。然而,靶基因不包括天然病毒基因。典型的靶基因包括,但不限于结构蛋白、种子储藏蛋白、传达除草剂抗性的蛋白,以及传达昆虫抗性的蛋白的编码基因。由靶基因编码的蛋白质称作“外源蛋白”。靶基因在植物中的表达一般地将产生改变的植物性状。 
术语“改变的植物性状”是指相对于野生型或非转基因植物宿主,转基因植物中的表型或基因型的改变。 
“复制基因”指编码病毒复制蛋白的基因。除了复制蛋白的ORF外,复制基因也可含有其他重叠或非重叠ORF,如自然界在病毒序列中所发现的。这些额外的ORF尽管不是复制必需的,却可以增强复制和/或病毒DNA累积。这类额外ORF的实例分别是ACMV和TGMV双生病毒中的AC3和AL3。 
“嵌合反式作用复制基因”指不同于天然病毒复制基因的复制基因,其中复制蛋白的编码序列在可调型植物启动子的控制下,或者修饰的天然病毒复杂基因,例如,其中在5’转录但不翻译的区域中插入位点特异性序列。这种嵌合基因也包括在启动子和转录起始位点之间插入结合复制蛋白的已知位点,削弱病毒复制蛋白基因的转录。 
“染色体整合的”指外源基因或DNA构建体通过共价键整合到宿主DNA内。如果基因不是“染色体整合的”,它们可以是“瞬时表达的”。基因的瞬时表达指没有被整合到宿主染色体组内但独立地起作用,例如,作为自主复制的质粒或表达盒的一部分,或者作为另一个生物系统如病毒的一部分的基因的表达。 
术语“转化”指核酸片段转移到宿主细胞的基因组内,导致遗传上的稳定遗传。将含有转化核酸片段的宿主细胞称作“转基因”细胞,将包括转基因细胞的生物体称作“转基因生物体”。转化植物和植物细胞方法的实例包括农杆菌(Agrobacterium)介导的转化(De Blaere 1987)和粒子轰击技术(US 4,945,050)。整个植物可通过技术人员公知的方法从转基因细胞中再生(见,例如,Fromm 1990)。 
“转化的”、“转基因的”和“重组的”指已引入异源核酸分子的宿主生物体,如细菌或植物。可通过本领域技术中通常已知的和公开的方法(Sambrook 1989;Innis 1995;Gelfand 1995;Innis&Gelfand 1999)将核酸分子稳定地整合到基因组内。已知的PCR法包括,但不限于,使用成对引物、嵌套引物、单特异性引物、简并引物、基因特异性引物、载体特异 性引物、部分错配引物等引物的方法。例如,“转化的”、“重组的”和“转基因的”植物或愈伤组织已经历转化过程并含有整合到其染色体内的外源基因。术语“未转化的”指没有经历转化过程的正常植物。 
“瞬时转化的”指已引入转基因和外源DNA(例如,通过如农杆菌介导的转化或生物射弹轰击这样的方法),但未经稳定维持选择的细胞。 
“稳定转化的”指已经选择并在转化后在选择培养基上再生的细胞。 
“瞬时表达”指在通过病毒感染或通过如农杆菌介导的转化、电穿孔或生物射弹轰击这样的方法引入病毒或转基因,但未经稳定维持选择的细胞表达。 
“遗传上稳定的”和“可遗传的”指在植物中稳定维持并由子代通过连续传代而稳定遗传的染色体整合的遗传元件。 
“初级转化体”和“T0代”指与最初转化的组织同一遗传代的转基因植物(即,自转化后没有经历减数分裂和受精)。 
“次级转化体”和“T1、T2、T3代等”指初级转化体通过一个或多个减数分裂和受精周期得到的转基因植物。它们可来自初级或次级转化体的自体受精或者初级或次级转化体与其他转化的或未转化植物的杂交。 
“野生型”指天然发现的没有任何已知突变的病毒或生物体。 
“基因组”指生物体的全部遗传物质。 
术语“核酸”指以单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其多聚体,由含糖、磷酸盐和碱基的单体(核苷酸)构成,其中碱基是嘌呤或嘧啶。除非特别限定,该术语包括含有天然核苷酸的已知类似物的核酸,其具有与参照核酸类似结合特性,并且以与天然存在的核苷酸类似的方式代谢。除非有其他指示,特定核酸序列也包括其保守修饰的变体(例如,简并密码子取代)和互补序列以及明确表示的序列。具体地,可通过用混合碱基和/或脱氧肌苷残基取代所选的一个或多个(或者所有)密码子的第三位所产生的序列来实现简并密码子取代(Batzer 1991;Ohtsuka 1985;Rossolini1994)。“核酸片段”是给定核酸分子的一部分。在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)参与将DNA内所含的信息传递 给蛋白质。术语“核苷酸序列”指DNA或RNA的多聚体,其可以是单链或双链,任选地含有能整合到DNA或RNA多聚体内的合成的、非天然的或改变的核苷酸碱基。术语“核酸”或“核酸序列”也可与基因、cDNA、DNA和由基因所编码的RNA交换使用。 
本发明包括分离的或基本上纯的核酸或蛋白质组合物。在本发明的上下文中,“分离的”或“纯化的”DNA分子或者“分离的”或“纯化的”多肽是通过人工方法获得的,远离其天然环境存在的DNA分子或多肽,因此不是自然的产物。分离的DNA分子或多肽可以纯化形式存在或者可存在于非天然环境如转基因宿主细胞中。例如,“分离的”或“纯化的”核酸分子或蛋白质或其生物活性部分,当通过重组技术生成时,基本上无其他细胞材料或培养基,或者当通过化学方法合成时,基本上无化学前体或其他化学品。优选“分离的”核酸不含核酸来源生物体基因组DNA中天然位于该核酸两侧(即,位于核酸的5′和3′端的序列)的序列(优选编码蛋白质的序列)。例如,在多个实施方案中,分离的核酸分子可含有小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的侧接核苷酸序列,其中所述侧接核苷酸序列在核酸所来源的细胞的基因组DNA中天然地位于核酸分子的两侧。基本上不含细胞材料的蛋白质包括具有小于约30%、20%、10%、5%(以干重计)污染蛋白的蛋白质或多肽制品。当通过重组生成本发明的蛋白质或其生物活性部分时,优选培养基代表小于约30%、20%、10%或5%(以干重计)的化学前体或非蛋白目的化学品。 
本发明的核苷酸序列包括天然存在的序列以及突变体(变体)形式。这类变体将继续具有期望的活性,即,启动子活性或者由非变体核苷酸序列的开放读框所编码的产物的活性。 
就序列(例如,多肽或核苷酸序列,例如本发明的转录调控核苷酸序列)而言,术语“变体”旨在表示基本上相似的序列。对于包括开放读框的核苷酸序列,变体包括那些由于遗传密码子的简并性而存在的编码天然蛋白质的相同氨基酸序列的那些序列。天然发生的等位基因变体如可使用公知的分子生物学技术,例如用聚合酶链式反应(PCR)和杂交技术鉴定的这些。 变体核苷酸序列也包括合成来源的核苷酸序列,例如通过使用定点诱变所产生的那些;以及对于开放读框而言,编码天然蛋白质,以及相对于天然蛋白质,编码具有氨基酸取代的多肽的那些。通常,本发明的核苷酸序列变体与天然(野生型或内源)核苷酸序列相比,将具有至少40%、50%、60%,至70%,例如优选71%、72%、73%、74%、75%、76%、77%、78%,至79%,通常至少80%,例如81%-84%,至少85%,例如,86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%,至98%以及99%的核苷酸序列同一性。 
特定核酸序列“保守修饰的变异”指编码相同或基本上相同氨基酸序列的那些核酸序列,或者其中核酸序列不编码氨基酸序列,指基本上相同的序列。由于遗传密码子的简并性,大量功能上相同的核酸编码任何指定的多肽。例如,密码子CGT、CGC、CGA、CGG、AGA和AGG都编码氨基酸精氨酸。因此,在精氨酸用密码子表示的每个位置上,可将该密码子变为所述相应密码子中的任何一个,而不改变所编码的蛋白质。这种核酸变异是“沉默变异”,其是“保守性修饰变异”中的一种。这里所述的每个编码多肽的核酸序列,也记述了每种可能的沉默变异,除非有其他注释。本领域技术人员将会意识到可通过标准技术修饰核酸中的每个密码子(除了ATG,其平常仅是甲硫氨酸的密码子)以产生功能相同的分子。因此,编码多肽的核酸的每个“沉默变异”是每个所述序列中固有的。 
可“优化”本发明的核酸分子以提高目的植物中的表达(见,例如,WO 91/16432;Perlak 1991;Murray 1989)。在该方式中,可利用植物偏好的密码子合成基因的开放读框或基因片段(见,例如,Campbell&Gowri,1990对宿主偏好密码子使用的讨论)。因此,可优化核苷酸序列用于任何植物的表达。人们公认,可优化或合成基因序列的全部或者任何一部分。换句话说,也可以使用合成的或部分优化的序列。变体核苷酸序列和蛋白质也包括,从诱变和重组方法如DNA改组中获得的序列和蛋白质。可用这类方法操作一个或多个不同的编码序列,以产生具有期望特性的新多肽。在该方式中,从大量包括序列基本上相同并能在体外或在体内同源重组的序 列区域的相关序列多核苷酸群中产生重组多核苷酸文库。这种DNA改组的策略在本领域技术中是公知的(见,例如,Stemmer 1994;Stemmer 1994;Crameri 1997;Moore 1997;Zhang 1997;Crameri 1998;以及US 5,605,793和5,837,458)。 
“变体”多肽是指源自天然蛋白质的多肽,通过在天然蛋白质的N末端和/或C末端缺失(所谓的截短)或者添加一个或多个氨基酸;在天然蛋白质的一个或多个位点上缺失或添加一个或多个氨基酸;或者在天然蛋白质的一个或多个位点上取代一个或多个氨基酸。这种变体可以由于,例如,遗传多态性或人为操作所产生。这类操作的方法通常是本领域已知的。 
因此,可以多种方式改变多肽,包括氨基酸取代、缺失、截短和插入。这种操作的方法通常是本领域已知的。例如,可通过DNA突变制备多肽的氨基酸序列变体。诱变和核苷酸序列改变的方法是本领域公知的(见,例如,Kunkel 1985;Kunkel 1987;US 4,873,192;Walker&Gaastra,1983及其中所引用的参考文献)。可在Dayhoff等(1978)的模型中发现对不影响目的蛋白质的生物活性的适当氨基酸取代的指导。优选保守取代,如氨基酸与其他具有相似性质的氨基酸的交换。 
在编码序列中,改变、添加或缺失单个氨基酸或小百分比的氨基酸(一般小于5%,更一般地小于1%)的个别取代、缺失或添加是“保守性修饰变异”,其中,该改变导致用化学上相似的氨基酸取代另一个氨基酸。提供功能相似氨基酸的保守取代表是本领域公知的。如下五组中,每组都含有彼此是保守性取代的氨基酸:脂肪族氨基酸:甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I);芳香族氨基酸:苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);含硫氨基酸:甲硫氨酸(M)、半胱氨酸(C);碱性氨基酸:精氨酸(R)、赖氨酸(K)、组氨酸(H);酸性氨基酸:天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷胺酰胺(Q)。也见,Creighton,1984。另外,编码序列中改变、添加或缺失单个氨基酸或小百分比氨基酸的个别取代、缺失或添加也是“保守性修饰变异”。 
这里所使用的“表达盒”是指能在适当的宿主细胞中指导特定核苷酸 序列表达的DNA序列,包括有效连接于目的核苷酸序列的启动子,其任选地有效连接于终止信号和/或其他调控元件。表达盒也可包括核苷酸序列的正确翻译所必需的序列。编码区通常编码目的蛋白质,但也可编码目的功能性RNA,例如正义或反义方向的反义RNA或非翻译的RNA。包括目的核苷酸序列的表达盒可以是嵌合的,是指其至少一个组分对于其至少一个其他组分来说是异源的。表达盒也可以是这样的表达盒,其是天然存在的,但以用于异源表达的重组体形式获得。表达盒可以完全在细胞外装配(例如,通过重组体克隆技术)。然而,表达盒也可以使用部分内源组分进行装配。例如,表达盒可通过将启动子序列置于(插入)内源序列上游获得,其因此形成功能上相连的并通过所述启动子序列控制的表达盒。同样地,可将待表达核酸序列置于(或插入)内源性启动子序列的下游,由此形成表达盒。表达盒中核苷酸序列的表达可在保守性启动子的控制下,或者在仅在宿主细胞暴露于某些特定外部刺激时引起转录的诱导型启动子的控制下。在多细胞生物体的情况中,启动子也可以特异于特定的组织或器官或发育阶段(例如,根/仁特异性或偏好性)。 
“载体”定义为包括,特别地,双链或单链线性或环型的任何质粒、粘粒、噬菌体或农杆菌双载体,其可以或者不能自我传递或移动,并且其可通过整合到细胞基因组内或者在染色体外存在(例如,具有复制起点的自主复制质粒)来转化原核或真核宿主。 
特别包括穿梭载体,其意味着天然地或通过设计,能在两种不同宿主生物体中复制的DNA载体,其可选自放线菌属(Actinomycetes)和相关物种、细菌和真核生物(例如,高等植物、哺乳动物、酵母或真菌细胞)。 
优选载体中的核酸在适当的启动子或其他调控元件的控制下,并与之有效连接,用于在宿主细胞如微生物,例如细菌,或者植物细胞中进行转录。载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况中,这可以包含其自己的启动子或者其他调控元件,在cDNA的情况中,这可以是在用于在宿主细胞中表达的适当启动子或者其他调控元件的控制下。 
“克隆载体”一般含有一个或少量限制性核酸内切酶识别位点以及适于在用克隆载体转化的细胞的鉴定和选择中使用的标记基因,可在所述内切酶识别位点上以可测定的方式插入外源DNA序列,而不丧失载体的基本生物功能。标记基因一般包括提供四环素抗性、潮霉素抗性或氨苄青霉素抗性的基因。 
“转基因植物”为具有含表达载体的一个或多个植物细胞的植物。 
“植物组织”包括分化的和未分化的组织或植物,包括但不限于,根、茎、叶、花粉、种子、肿瘤组织以及多种形式细胞和培养物,如单细胞、原生质体、胚以及愈伤组织。植物组织可以在植物或在器官中,可以是组织或细胞培养物。 
如下术语用于描述两个或多个核酸或者多核苷酸之间的序列关系:(a)“参照序列”,(b)“比较窗”,(c)“序列同一性”,(d)“序列同一性百分比”和(e)“基本相同”。 
(a)如这里所使用的,“参照序列”是用作序列对比基础的定义序列。参照序列可为指定序列的子集或全部;例如,为全长cDNA或基因序列的片段,或者全长cDNA或基因序列。 
(b)如这里所使用的,“比较窗”涉及多核苷酸序列的连续指定片段,其中与用于两序列最佳比对的参照序列(其不包括添加或缺失)相比,比较窗中的多核苷酸序列可包括添加或缺失(即,缺口)。通常,比较窗至少为20个连续的核苷酸,任选地可以是30、40、50、100或者更长。本领域技术人员理解,为了避免由于多核苷酸序列中包含缺口而与参照序列具有高相似性,一般地引入缺口罚分并从匹配数中减去。 
用于比较的序列比对的方法是本领域公知的。因此,可使用数学算法完成任何两个序列之间同一性百分比的测定。优选这类数学算法的非限制性实例是Myers和Miller,1988的算法;Smith等1981的局部同源性算法;Needleman和Wunsch 1970的同源性比对算法;Pearson和Lipman 1988的搜索相似性法;Karlin和Altschul,1990的算法,在Karlin和Altschul,1993中予以改进。 
可利用计算机执行这些数学算法用于序列的比较以确定序列同一性。这类执行包括,但不限于:PC/Gene程序(可从Intelligenetics,MountainView,Calif.获得)中的CLUSTAL;ALIGN程序(2.0版)以及WisconsinGenetics软件包,8版(可从Genetics Computer Group(GCG),575ScienceDrive,Madison,Wis.,USA中获得)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。可使用默认参数进行使用这些程序的比对。已充分描述了CLUSTAL程序(Higgins 1988,1989;Corpet 1988;Huang 1992;Pearson1994)。ALIGN程序是基于Myers和Miller的算法,同前。Altschul等,1990的BLAST程序是基于Karlin和Altschul的算法,同前。 
公众可通过国立生物技术信息中心(National Center for BiotechnologyInformation)(http://www.ncbi.nlm.nih.gov/)获得进行BLAST分析的软件。该算法包括通过鉴定查询序列中长度为W的短字节,首先鉴定高得分序列对(HSP),当与数据库序列中同样长度的字节比对时,其匹配或满足某些正数阈值得分T。将T称作邻近字节得分阈值(Altschul 1990)。这些最初的邻近字节命中事件作为种子起始搜索,以发现含有它们的更长HSP。然后在两个方向上沿着每个序列延伸字节命中,只要累积比对得分增加。使用参数M(匹配残基对的奖励得分;总是>0)和N(错配残基的罚分;总是<0)计算核苷酸序列的累积得分。对于氨基酸序列,使用评分矩阵计算累积得分。当累积比对得分从其获得的最大值下降量达X,累积得分由于一个或多个得负分的残基比对的累积而变为零或者零以下,或者到达序列的一端时,停止每个方向上字节命中的延伸。 
除了计算序列同一性百分比,BLAST算法也进行两个序列之间相似性的统计学分析(见,例如Karlin&Altschul(1993)。由BLAST算法所提供的相似性的一个测量值是最小总概率(P(N)),为两核苷酸或氨基酸序列之间将偶然发生匹配的概率指数。例如,如果在测试核酸序列与参照核酸序列的比较中最小总概率小于约0.1,更优选小于约0.01,且最优选小于约0.001,那么认为测试核酸序列与参照序列相似。 
为了获得用于比较目的的缺口比对,可如Altschul等1997所述利用 Gapped BLAST(BLAST 2.0)。可选地,可使用PSI-BLAST(BLAST 2.0)进行检测分子之间的远关系的重复搜索(见Altschul等,同前)。当利用BLAST、Gapped BLAST、PSI-BLAST时,可使用相应程序的默认参数(例如,用于核苷酸序列的BLASTN,用于蛋白质的BLASTX)。BLASTN程序(用于核苷酸序列)使用如下默认值:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并且比较两条链。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10作为默认值,以及BLOSUM62评分矩阵(见,Henikoff & Henikoff,1989)。见http://www.ncbi.nlm.nih.gov。也可通过目测人工进行比对。 
对于本发明的目的,优选使用具有默认参数的BlastN程序(1.4.7版或更新的版本)或者任何等同程序进行核苷酸的比较,用于测定与这里所公开的启动子序列的序列同一性百分比。“等同程序”是指任何序列比较程序,当与通过优选程序所产生的相应比对比较时,其对于任何两个所讨论的序列都产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对。 
(c)如这里所使用的,在两核酸或多肽序列的上下文中,“序列同一性”或“同一性”是指在指定比较窗进行比对以获得最大对应性时,两序列中相同的残基。当使用序列同一性百分比涉及蛋白质时,公认不相同的残基位置常常由于保守性氨基酸取代而不同,其中将氨基酸残基用具有相似化学特性(例如,电荷或疏水性)的其他氨基酸残基取代,因此不改变分子的功能特性。当序列因保守性取代而不同时,可上调序列同一性百分比以修正取代的保守性。将由于这种保守取代而不同的序列称作具有“序列相似性”或“相似性”。进行这种调整的方法是本领域技术人员公知的。一般这包括保守性取代作为部分而不是完全错配进行评分,因此提高序列同一性百分比。因此,例如,对相同的氨基酸给1分,非保守性取代给0分,保守性取代给0和1之间的记分。计算保守性取代的得分,例如,如在程序PC/GENE(Intelligenetics,Mountain View,Calif.)中进行的那样。 
(d)如这里所使用的,“序列同一性百分比”是指通过将两个最佳比对 序列对比较窗进行比较所测定的值,其中与用于两个序列最佳比对的参照序列(其不包括添加或缺失)相比,比较窗中的多核苷酸序列中的部分可包括添加或缺失(即,缺口)。如下计算百分比:测定两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配的位置数,将匹配的位置数除以比较窗中的总的位置数,并将结果乘以100以产生序列同一性百分比。 
(e)(i)术语“基本上相同”的多核苷酸序列是指与参照序列相比,多核苷酸包括具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%,或79%,优选至少80%、81%、82%、83%、84%、85%、86%、87%、88%,或89%,更优选至少90%、91%、92%、93%,或94%,以及最优选至少95%、96%、97%、98%,或99%序列同一性的序列,用所述使用标准参数的比对程序之一。本领域技术人员将会意识到,通过考虑密码子简并性、氨基酸相似性、阅读框位置分布等因素,可将这些值适当地进行调整以确定相应的由两个核苷酸序列所编码的蛋白质的同一性。用于这些目的的基本相同的氨基酸序列通常意味着至少70%的序列同一性,更优选至少80%、90%,且最优选至少95%。 
核苷酸序列基本上相同的另一指标是两个分子是否在严谨条件下相互杂交(见下文)。通常,选择严谨条件低于固定离子强度和pH时特定序列的热解链温度(Tm)约5℃。然而,严谨条件包括约1℃到约20℃的温度范围,取决于期望的严谨度,如文中别处所限定的那样。如果它们编码的多肽基本上相同,那么严谨条件下不相互杂交的核酸仍然基本上相同。这可以发生,例如,当使用遗传密码子所允许的最大密码子简并性产生核酸的拷贝时。两个核酸序列基本上相同的一个指标是由第一个核酸所编码的多肽与由第二个核酸所编码的多肽在免疫学上发生交叉反应。 
(ii)在肽的上下文中,术语“基本上相同”表示在所指定的比较窗上,肽包括与参照序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%,或79%,优选80%、81%、82%、83%、84%、85%、86%、87%、88%,或89%,更优选至少90%、91%、92%、93%,或94%,或者甚至优选95%、96%、97%、98%或99%序列同一性的序列。优选使用 Needleman和Wunsch(1970)的同源性比对算法进行最佳比对。两个多肽序列基本上相同的指标是一个肽与针对第二个肽所产生的抗体在免疫学上发生反应。因此,肽与第二个肽基本上相同,例如,其中两个肽仅由于保守性取代而不同。 
对于序列比较,一般一个序列作为与测试序列比较的参照序列。当使用序列比较算法时,将测试和参照序列输入到计算机中,如果必要的话,指定序列坐标,并指定序列算法程序参数。然后,基于指定的程序参数,序列比较算法计算测试序列相对于参照序列的序列同一性百分比。 
如上所指出的,两个核酸序列基本上相同的另一个指标是两个分子在严谨条件下相互杂交。当序列以复杂混合物(例如,总细胞DNA或RNA)存在时,术语“特异性杂交于”指在严谨条件下分子仅与特定核苷酸序列结合、形成双链体或杂交。“基本上结合”指探针核酸和靶核酸的互补杂交,并且包括可通过降低杂交介质的严谨性提供较小的错配,以达到靶核酸序列的期望检测。 
在核酸杂交试验如Southern和Northern杂交的上下文中,“严谨杂交条件”和“严谨杂交洗涤条件”是序列依赖性的,并且在不同环境参数下是不同的。Tm是50%的靶序列与完全匹配的探针杂交的温度(在固定的离子强度和pH条件下)。特异性一般是杂交后洗涤的函数,关键因素是离子强度和最后的洗涤溶液的温度。对于DNA-DNA杂交,Tm可从Meinkoth和Wahl,1984的等式中估计: 
Tm=81.5℃+16.6(log10M)+0.41(%GC)-0.61(%甲酰胺)-500/L 
其中,M是单价阳离子的摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%甲酰胺是杂交溶液中甲酰胺的百分比,L是杂合体的碱基对长度。每发生1%错配,Tm减少约1℃;因此,可调整Tm、杂交,和/或洗涤条件以与期望同一性的序列杂交。例如,如果寻找具有>90%同一性的序列,那么可将Tm降低10℃。通常,选择严谨条件低于固定离子强度和pH时阿到序列和其互补物的热解链温度I约5℃。然而,严格严谨条件可在比热解链温度I低1、2、3或4℃时进行杂交和/或洗涤;中等严谨条件可 在比热解链温度I低6、7、8、9或10℃时进行杂交和/或洗涤;低严谨条件可在比热解链温度I低11、12、13、14、15或20℃时进行杂交和/或洗涤。利用该等式、杂交和洗涤组合物以及期望的T,普通技术人员将会理解,杂交和/或洗涤溶液的严谨性的变动已予以内在地描述。如果期望的错配程度导致T小于45℃(水溶液)或32℃(甲酰胺溶液),那么优选增加SSC浓度以便可使用更高的温度。有关核酸杂交的详尽指导可见Tijssen,1993。通常,选择高严谨杂交和洗涤条件低于固定离子强度和pH时特定序列的热解链温度Tm约5℃。 
高严谨洗涤条件的实例是0.15M NaCl,72℃约15分钟。严谨洗涤条件的实例是于65℃用0.2×SSC洗涤15分钟(见,Sambrook,下文,对SSC缓冲液的描述)。常常,高严谨洗涤之前是低严谨洗涤,以除去背景探针信号。对于双链体,例如100个以上核苷酸,中等严谨洗涤的实例是在45℃用1×SSC洗涤15分钟。对于双链体,例如100个以上核苷酸,低严谨洗涤的实例是在40℃用6×SSC洗涤15分钟。对于短探针(例如,约10-50个核苷酸),严谨条件一般包括小于约1.5M的盐浓度,优选约0.01-1.0M,pH 7.0-8.3的钠离子浓度(或者其他盐),温度一般是至少约30℃,对于长探针(例如,>50个核苷酸)至少约60℃。也可通过添加去稳定剂如甲酰胺获得严谨条件。通常,在特定杂交测定中,信噪比为无关探针所观察到的2倍(或者更高),表示特异性杂交的检测。如果它们编码的蛋白质基本上相同,那么严谨条件下不相互杂交的核酸仍然是基本上相同的。这发生在,例如,当使用由遗传密码子所允许多最大密码子简并性产生核酸拷贝时。 
选择非常严谨的条件是与特定探针的Tm相等。Southern或Northern印迹中滤膜上具有100个以上互补残基的互补核酸的严谨杂交条件的实例是在50%甲酰胺,例如,在50%甲酰胺,1M NaCl,1%SDS中于37℃杂交,以及在0.1×SSC中于60-65℃洗涤。示范性的低严谨条件包括在37℃用30-35%甲酰胺、1M NaCl,1%SDS(十二烷基硫酸钠)的缓冲液杂交,并在50-55℃,在1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示范性的中等严谨条件包括在37℃在40-45%甲酰胺、1.0M NaCl,1 %SDS(十二烷基硫酸钠)中杂交,以及在55-60℃,在0.5×至1×SSC中洗涤。 
如下是可用于克隆与本发明的参照核苷酸序列基本上相同的直向同源物核苷酸序列的杂交/洗涤条件设置的实例:参照核苷酸序列优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与参照核苷酸序列于50℃杂交,用2×SSC、0.1%SDS于50℃洗涤;还更期望在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用1×SSC、0.1%SDS于50℃洗涤;还更期望在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.5×SSC、0.1%SDS于50℃洗涤;优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于50℃洗涤;更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤。 
“DNA改组”是在DNA分子中引入突变或重排(优选随机),或者在两个或多个DNA分子之间发生DNA序列的交换(优选随机)的方法。由DNA改组所得到的DNA分子是改组的DNA分子,是从至少一个模板DNA分子中获得的非天然发生的DNA分子。改组的DNA优选编码对由模板DNA所编码的多肽进行修饰的变体多肽,并且相对于由模板DNA所编码的多肽,可以具有改变的生物学活性。 
“重组DNA分子”是使用重组DNA技术和用于将DNA序列连接在一起的方法连接在一起的DNA序列的组合,所述技术和方法如Sambrook等,1989所述。 
用语“植物”指任何植物,特别是农艺上有用的植物(例如,种子植物),“植物细胞”是植物的结构和生理单位,其包括细胞壁但也可指原生质体。植物细胞可以为分离的单细胞或培养细胞的形式,或者作为高级的有组织的单元的一部分,例如,植物组织,或者分化成存在于植物发育的任何阶段的结构的植物器官。这类结构包括一种或多种植物器官,包括但不限于:果实、枝条(shoot)、茎、叶、花瓣等。优选术语“植物”包括整个植物、 枝条营养器官/结构(例如,叶、茎和块茎)、根、花和花器官/结构(例如,苞、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如,维管组织、基本组织等)及细胞(例如,保卫细胞、卵细胞、毛状体等),及其子代。 
可在本发明中使用的植物的种类通常与适用于转化技术的高等或低等植物的种类一样宽,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类以及多细胞藻类。其包括多种倍性水平的植物,包括非整倍体、多倍体、二倍体、单倍体和半合子。包括在本发明范围内的是植物界的高等和低等植物的所有属和种。此外包括成熟植物、种子、枝条和幼苗,以及从其衍生的部分、繁殖材料(例如,种子和果实)和培养物,例如细胞培养物。 
一年生、多年生的单子叶植物和双子叶植物是用于产生转基因植物的优选的宿主生物体。此外,在所有观赏植物、林业、果实,或观赏树木、花、切花、灌木或草皮中使用重组系统或者根据本发明的方法是有利的。所述植物可包括但不限于:苔藓植物如苔纲(Hepaticae)(獐耳细辛属(hepaticas))和藓纲(Musci)(藓类(mosses));蕨类植物(pteridophyte)如蕨(fern)、马尾(horsetail)和石松类(clubmosses);裸子植物如松柏纲(conifers)、苏铁纲(cycads)类植物、银杏纲(ginkgo)以及买麻藤纲(Gnetaeae);藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻(diatoms))和裸藻纲(Euglenophyceae)。 
用于本发明目的的植物可包括蔷薇科(Rosaceae)家族如玫瑰,杜鹃花科(Ericaceae)如北美杜鹃花(rhododendrons)和杜鹃花(azaleas),大戟科(Euphorbiaceae)如猩猩木(poinsettias)和巴豆(croton),石竹科(Caryophyilaceae)如石竹花(pinks),茄科(Solanaceae)如矮牵牛花(petunias),苦苣苔科(Gesneriaceae)如非洲紫罗兰(African violet),凤仙花科(Balsaminaceae)如凤仙花(touch-me-not),兰科(Orchidaceae)如兰花(orchids),鸢尾科(Iridaceae)如唐菖蒲(gladioli)、鸢尾属植物(iris)、小苍兰(freesia)、番红花(crocus),菊科(Compositae)如万寿菊(marigold),牛儿苗 科(Geraniaceae)如天竺葵(geraniums),百合科(Liliaceae)如Drachaena,桑科(Moraceae)如榕树(ficus),天南星科(Araceae)如蔓绿绒(philodendron)和许多其他植物。 
此外,根据本发明的转基因植物选自双子叶农作物植物,如,例如选自豆科(Leguminosae)的植物如豌豆、苜蓿和大豆;伞形科(Umbelliferae),特别是胡萝卜属(Daucus)(非常特别地是胡萝卜(D.carota))和芹属(Apium)(非常特别地是旱芹(A.graveolens var.dulce))以及许多其他植物;茄科,特别是番茄属(Lycopersicon)和茄属(Solanum),非常特别地是番茄(L.esculentum)、马铃薯(S.tuberosum)和茄子(S.melongena)、烟草和许多其他植物;辣椒属(Capsicum),非常特别地是辣椒(C.annum)和许多其他植物;豆科(Leguminosae),特别是大豆属(Glycine),非常特别地是大豆(G.max)和许多其他植物;十字花科(Cruciferae),特别是芸苔属(Brassica),非常特别地是甘蓝型油菜(B.napus)(油料种子油菜)、白菜型油菜(B.campestris)(甜菜)、甘蓝(B.oleracea cv Tastie)、花椰菜(B.oleracea cvSnowball Y)和椰菜(B.oleracea cv Emperor);拟南芥属(Arabidopsis),非常特别地是拟南芥(A.thaliana)和许多其他植物;菊科(Compositae),特别是莴苣属(Lactuca),非常特别地是莴苣(L.sativa)和许多其他植物。另外优选是树木,如苹果树、梨树、温柏、李树、樱桃树、桃树、油桃树、杏树、番木瓜树、芒果树以及包括针叶树和落叶树的其他木本物种,如杨树、松树、美洲杉、雪松、橡树等。 
最优选根据本发明的转基因植物可选自单子叶作物植物。当指根据本发明的转基因植物或指本发明的转录调控序列的来源时,术语“单子叶植物”旨在包括单子叶植物的所有科、属和种。优选是禾本科(Gramineae)植物如,例如,谷类如玉米、稻、小麦、大麦、高粱、栗、黑麦、黑小麦,或燕麦,以及其他非谷类单子叶植物如甘蔗或香蕉。尤其优选是谷物(玉米)、稻、大麦、小麦、黑麦和燕麦。最优选是玉米和稻的所有品种。 
“显著增加”是大于测量技术固有误差界限的增加,优选增加约2倍或更多。 
“显著减少”是指大于测量技术固有误差界限的减少,优选减少约2倍或更多。 
发明详述 
本发明提供分离的核酸分子,其包括在植物细胞中优选在单子叶植物中指导有效连接的核酸片段转录的植物核苷酸序列。具体地,本发明提供用于在单子叶植物中调控表达的表达盒,包括 
i)至少一个单子叶植物基因的转录调控核苷酸序列,所述的单子叶植物基因选自咖啡酰-CoA-O-甲基转移酶基因、C8,7-固醇异构酶基因、富含羟脯氨酸的糖蛋白(HRGP)基因、乳酸脱氢酶基因以及叶绿体蛋白12样基因, 
和与之功能性相连的 
ii)至少一个核苷酸序列,其与所述转录调控序列是异源的。 
优选本发明的转录调控核苷酸序列包括至少一个相应基因的启动子序列(例如,位于相应基因的转录起点上游,能诱导下游序列转录的序列)。本发明的转录调控核苷酸序列可包括所述基因的启动子序列,但可进一步包括其他元件如5’-非翻译序列、增强子、内含子等。优选所述启动子序列指导有效连接的核苷酸片段在植物或植物细胞中的转录,例如,连接的植物DNA包括结构或调控基因的开放读框。 
本发明的转录调控序列可与多种5’非翻译区、内含子(优选表达增强内含子)以及转录终止序列(在下文所更详细地描述)组合。已证明,通过与内含子和/或转录终止序列的组合,可有利地调控本发明的转录调控序列的组织特异性。在大多数组合中,所得的表达盒显示在根和仁中偏好性或特异性表达。然而,可获得其他表达特异性(例如,组成型表达)。在根中具有表达活性的转录调控序列可用于改变根组织的功能,改进生长速度,改善对根偏好的病原体、害虫、除草剂或不利天气调控的抗性,用于土壤的解毒以及扩大植物可生长的土壤或环境的范围。根丰富的或根特异性基因表达将提供一种机制,据此可改变形态学和代谢,以改善产量并生产更大量 的有用蛋白质。 
然而,在某些组合中,转录调控序列可显示强组成型表达谱。在需要在植物发育的所有(或者大部分)时间在所有(或者大部分)组织中表达的情况下,优选组成型启动子。其他组织特异性可以取决于与本发明的转录调控序列组合使用的调控元件。 
下表1举例说明优选从中分离本发明启动子的基因、所述基因的功能、所述基因编码的cDNA,以及由所述基因编码的蛋白质(ORF)。 
表1:优选从中分离本发明启动子的基因、 
所述基因的推定功能、由所述基因编码的cDNA和蛋白质 
Figure BDA00002496098200411
优选转录调控核苷酸序列可从多肽编码基因的单子叶植物基因组DNA中获得,其中所述多肽 
a1)包含单子叶植物乳酸脱氢酶蛋白的至少一个(优选至少2或3个,更优选至少4或5个,更优选所有)序列基序,其中所述序列基序选自如下氨基酸序列 
i)SLSELGFDA      (SEQ ID NO:76), 
ii)VIGAGNVGMA    (SEQ ID NO:77), 
iii)IVTAGARQI    (SEQ ID NO:78), 
iv)L(F/Y)RKIVP   (SEQ ID NO:79), 
v)GFPASRV        (SEQ ID NO:80), 
vi)RF(L/I)AEHL   (SEQ ID NO:81), 
vii)QAYMVGEH     (SEQ ID NO:82), 
viii)ALEGIRRAV   (SEQ ID NO:83),和 
ix)GYSVAS(L/I)A  (SEQ ID NO:84), 
或者 
b1)编码单子叶植物的乳酸脱氢酶蛋白,与选自SEQ ID NO:26、60和65所述的多肽具有至少90%,优选至少95%,更优选至少98%的氨基酸序列同一性,或者 
a2)包含单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白的至少一个(优选至少2或3个,更优选至少4或5个,更优选所有)序列基序,其中序列基序选自如下氨基酸序列: 
x)EQKTRHSE       (SEQ ID NO:85), 
xi)L(I/L)KLIGAK  (SEQ ID NO:86), 
xii)KTMEIGVY     (SEQ ID NO:87), 
xiii)HERL(L/M)KLV(SEQ ID NO:88), 
xiv)CQLPVGDG     (SEQ ID NO:89),和 
xv)TLCRRVK       (SEQ ID NO:90), 
或者 
b2)编码单子叶植物的咖啡酰-CoA-O-甲基转移酶蛋白,与选自SEQID NO:5、和70所述的多肽具有至少90%,优选至少95%,更优选至少98%的氨基酸序列同一性,或者 
b3)编码单子叶植物的富含羟脯氨酸的糖蛋白,与选自SEQ ID NO:18和75所述的多肽具有至少90%,优选至少95%,更优选至少98%的氨基酸序列同一性,或者 
b4)编码单子叶植物的C8,7-固醇异构酶蛋白,与SEQ ID NO:10所述的多肽具有至少90%,优选至少95%,更优选至少98%的氨基酸序列同一性,或者 
b5)编码单子叶植物的叶绿体蛋白12样蛋白,与SEQ ID NO:31所述的多肽具有至少90%,优选至少95%,更优选至少98%的氨基酸序列同一性。 
优选可从mRNA表达基因的植物基因组DNA中获得以cDNA描述的转录调控核苷酸序列的功能等同物,其中cDNA分别与由SEQ ID NO:4、9、17、25、30、59、64、69或74中任一所述序列基本上相似,且优选具有至少70%,优选80%,更优选90%,最优选95%的序列同一性,或者显示相同启动子活性(例如,根/仁偏好性的或根/仁特异性或者组成型表达活性)的所述转录调控核苷酸序列的片段。 
优选转录调控核苷酸序列来自玉米或稻植物。甚至更优选转录调控核苷酸序列是选自稻咖啡酰-CoA-O-甲基转移酶基因、稻C8,7-固醇异构酶基因、玉米富含羟脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脱氢酶基因、稻叶绿体蛋白12样基因及其功能等同物的植物基因。功能等同物基因优选编码与选自SEQ ID NO:5、10、18、26、31、60、65、70和75所述多肽具有 至少90%氨基酸序列同一性,优选至少95%氨基酸序列同一性,更优选至少98%氨基酸序列同一性。 
这里所提供的本发明的一些转录调控序列如所述的那样是新的(即,如所分离的核苷酸序列)。因此,本发明的另一个实施方案涉及包含至少一个如SEQ ID NO:6、7、8、11、12、13、19、20或21所述的转录调控核苷酸序列的分离的核酸序列。 
在更优选的实施方案中,转录调控核苷酸序列选自如下序列: 
i)SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73所述的序列,和 
ii)i)中序列的至少50个(优选至少70或100个,更优选至少150或200个,甚至更优选至少300或400个,最优选至少500或700个)连续碱基的片段;和 
iii)与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述转录调控核苷酸序列基本上相似的核苷酸序列(优选具有至少60%的序列同一性;更优选通过BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较);和 
iv)能与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或者其互补物杂交的核苷酸序列(优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用2×SSC、0.1%SDS于50℃洗涤;更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用1×SSC、0.1%SDS于50℃洗涤,还更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中于50℃杂交,用0.5×SSC、0.1%SDS于50℃洗涤,甚至更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于50℃洗涤,最优选在7%十二烷基硫酸钠(SDS)、0-5 M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤);和 
v)能与如下核酸杂交的核苷酸序列,其中所述核酸包含SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或其互补物的50-200个或更多(优选至少70或100个,更优选至少150或200个,甚至更优选至少300或400个,最优选至少500或700个)连续核苷酸;和 
vi)上述i)至v)中所述核苷酸序列中任一的互补物或反向互补物核苷酸序列。 
另一优选的实施方案涉及用于在单子叶植物中调控表达的表达盒,其包括 
a)至少一个在单子叶植物中有功能的转录调控核苷酸序列,其包含选自如下序列的至少一个序列: 
i)SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73所述的序列,和 
ii)i)中序列的至少50个(优选至少70或100个,更优选至少150或200个,甚至更优选至少300或400个,最优选至少500或700个)连续碱基的片段;和 
iii)与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述转录调控核苷酸序列基本上相似的核苷酸序列(优选具有至少60%的序列同一性;更优选通过BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较);和 
iv)能与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或者其互补物杂交的核苷 酸序列(优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用2×SSC、0.1%SDS于50℃洗涤;更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用1×SSC、0.1%SDS于50℃洗涤,还更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中于50℃杂交,用0.5×SSC、0.1%SDS于50℃洗涤,甚至更优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于50℃洗涤,最优选在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤);和 
v)能与如下核酸杂交的核苷酸序列,其中所述核酸包含SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列或者其互补物的50-200个或更多(优选至少70或100个,更优选至少150或200个,甚至更优选至少300或400个,最优选至少500或700个)连续核苷酸;和 
vi)上述i)至v)中所述核苷酸序列中任一的互补物或反向互补物核苷酸序列, 
和 
b)至少一个核苷酸序列,其与所述转录调控序列是异源的。 
优选上段中ii)、iii)、iv)、v)和vi)中定义的序列能够在单子叶植物细胞或生物体中修饰转录。更优选ii)、iii)、iv)、v)和vi)中定义的所述序列与SEQID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的转录调控核苷酸序列基本上具有相同的转录调控活性。 
也优选上述iii)中定义的序列与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述序列具有至少60%,优选70%或80%,更优选90%或95%的序列同一性,其中同一性优选通过 BLASTN程序以如下默认参数测量:字长(W)为11、期望值(E)为10、截断为100、M=5、N=-4,并进行两条链的比较。 
更优选上述iv)或v)中定义的序列在严谨条件下,优选在中等严谨条件下,最优选在高严谨条件下(如在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤)与指定的靶序列杂交。 
如果在其他都相同的条件下(即,与额外的调控元件设置(例如,内含子、转录终止序列和5’非翻译区)相组合,并在相同的植物表达系统中表达相同的核酸序列),与原始启动子相比,特定转录调控核苷酸序列在同一组织中偏好性地或特异性地引发转录(例如,在根和仁中偏好性地或特异性地,或者在所有的或大部分组织中组成型转录),则认为该特定转录调控核苷酸序列的活性基本上相同或等同。优选使用与所述转录调控序列有效连接的报道基因证明这类表达谱。在本上下文中,优选的报道基因(Schenborn1999)是绿色荧光蛋白(GFP)(Chui 1996;Leffel 1997),氯霉素转移酶、荧光素酶(Millar 1992)、β-葡糖醛酸糖苷酶或半乳糖苷酶。尤其优选是β-葡糖醛酸糖苷酶(Jefferson 1987)。关于具有组成型表达活性的启动子,术语“在大多数时间”是指优选在植物发育周期的至少50%,优选至少70%,更优选至少90%期间的转录调控活性(如下面实施例中通过所述的β-葡糖醛酸糖苷酶测定所证明的那样),其中植物包含稳定整合到其染色体DNA内的相应表达盒。 
就组成型转录调控核苷酸序列(例如,组成型启动子)而言的术语“在大部分组织中”是指优选总共占植物整个生物量的至少50%,优选至少70%,更优选至少90%的组织中的转录调控活性(如下面实施例中通过所述的β-葡糖醛酸糖苷酶测定所证明的那样),其中植物包含稳定整合到其染色体DNA内的相应表达盒。 
除此之外,功能等同物的转录调控活性可随其亲本序列的活性不同而改变,在表达水平方面尤其如此。表达水平可高于或低于亲本序列的表达水平。这两类衍生都可以是有利的,取决于待表达的目的核酸序列。优选 这样的功能等同序列,与其亲本序列相比,其表达水平不超过所述亲本序列的50%,优选不超过25%,更优选不超过10%(优选通过mRNA表达或蛋白质(例如,报道基因)表达来判断)。此外,优选的是与其亲本序列相比显示表达增加的等同序列,优选增加至少50%,更优选至少100%,最优选至少500%。 
可通过使用这里所述的转录调控序列作为探针,通过在低、中等或严谨杂交条件下的杂交,筛选其他植物中的同源结构基因,从其他单子叶植物物种中获得转录调控核苷酸序列的这类功能等同物。本发明的转录调控核苷酸序列的区域在物种间是保守的,也可用作PCR引物以扩增稻或玉米以外物种的区段,所述区段用作杂交探针(后者的方法允许更高严谨性筛选)或用于转录测定中以测定启动子活性。此外,可使用转录调控序列通过使用计算机算法以鉴定数据库中结构相关的序列。 
更具体地,基于本发明的转录调控序列,基于与本发明转录调控序列的序列相似性,根据公知技术,例如,杂交、PCR或计算机产生的序列比较,可鉴定或从任何期望的生物体(优选从其他植物)的基因组中分离直向同源物。例如,本发明特定转录调控核苷酸序列的全部或部分用作探针,选择性地与大量从所选来源生物体中克隆的基因组DNA片段(即,基因组文库)中存在的其他基因序列杂交。此外,可从生物体的任何细胞或组织中制备适当的基因组文库。这类技术包括平板DNA文库(噬斑或克隆;见,例如,Sambrook 1989)的杂交筛选,以及通过使用寡核苷酸引物的PCR扩增,引物优选对应于相关多肽或这里所提供的核苷酸序列的亚序列中保守的序列结构域(见,例如,Innis 1990)。这些方法尤其非常适于从与探针序列来源的生物体密切相关的生物体中分离基因序列。使用本发明的转录调控序列作为探针的这些方法的应用非常适于从任何来源生物体(优选从其他植物)中分离基因序列。在PCR方法中,可设计用于在PCR反应中使用的寡核苷酸引物,以便从cDNA或从任何目的植物中所提取的基因组DNA中扩增相应的DNA序列。设计PCR引物和PCR克隆的方法通常是本领域已知的。 
在杂交技术中,已知核苷酸序列的全部或部分作为探针,其选择性地 与大量从所选生物体中克隆的基因组DNA片段或cDNA片段(即,基因组或cDNA文库)中存在的其他相应的核苷酸序列杂交。杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可用可检测的基团标记,如32P,或者任何其他可检测的标记。因此,例如,可通过标记基于本发明序列的合成寡核苷酸制备用于杂交的探针。制备用于杂交的探针的方法和用于构建cDNA和基因组文库的方法通常是本领域已知的,并描述于Sambrook等(1989)。通常,与这里所公开的序列杂交的序列将与所公开的序列具有至少40%至50%,约60%至70%,甚至约80%、85%、90%,95%至98%或更高的同一性。换句话说,序列的序列相似性的范围可变,共有至少约40%至50%,约60%至70%,甚至约80%、85%、90%,95%至98%的序列同一性。 
也可通过例如搜索已知序列库,寻找编码具有指定氨基酸序列同一性的多肽的基因,或者具有指定核苷酸序列同一性的DNA,来鉴定本发明的核酸分子。用于比较的序列比对的方法是本领域公知的,并且已在上文中描述。 
因此,本发明的分离的核酸分子包括这里所公开的转录调控序列的直向同源物,即,在其他(即,不同于这里所公开的特定序列来源的宿主生物体)单子叶植物生物体中相应的核苷酸序列,优选例如谷物类植物如玉米、小麦、黑麦、大麦、燕麦、草皮草、高粱、栗,或者其他单子叶植物如甘蔗或香蕉。直向同源物或直向同源基因是来自不同物种的基因,其编码具有相同或相似功能的产物,例如,与由参照生物体的基因所编码的产物催化相同的反应。因此,直向同源物包括包括具有小于例如90%氨基酸序列同一性的多肽,但是该直向同源物编码具有相同或相似功能的多肽。可使用如GenBank的数据库以鉴定与这里所公开的玉米或稻序列相关的序列,例如,其他单子叶植物如小麦、大麦、燕麦等的直向同源物。可选地,可使用如杂交或PCR的重组DNA序列以鉴定与玉米和稻序列相关的序列,或者克隆不同的玉米或稻DNA的等同序列。 
本发明的转录调控核苷酸序列或它们的功能等同物可从任何植物或非 植物来源中获得或者分离,或者通过纯化学方法合成生产。优选的来源包括,但不限于上述定义部分所定义的植物。 
因此,本发明的另一个实施方案涉及用于从单子叶植物中鉴定和/或分离转录调控核苷酸序列的方法,其特征在于所述鉴定和/或分离利用如SEQID NO:5、10、18、26、31、60、65、70或75所述氨基酸序列的编码核酸序列,或者所述核酸序列的一部分。优选的是如SEQ ID NO:4、9、17、25、30、59、64、69或74所述的核酸序列或其部分。在该上下文中,“部分”是指至少15个碱基,优选至少25个碱基,更优选至少50个碱基的核酸序列。该方法可基于(但不限于)上述方法,如聚合酶链式反应、杂交或数据库筛选。优选本发明的该方法是基于聚合酶链式反应,其中所述核酸序列或其部分用作寡核苷酸引物。本领域技术人员知晓始于基因编码序列的一部分(例如,cDNA的一部分)来扩增和分离其启动子的若干方法。这类方法可包括,但不限于如反向PCR(“iPCR”)或“热不对称交错PCR”(“TAIL PCR”)的方法。 
本发明的另一个实施方案涉及提供用于在单子叶植物中进行异源表达的转基因表达盒的方法,包括步骤: 
I.利用至少一个核酸序列或其部分从单子叶植物中分离转录调控核苷酸序列,其中所述序列编码SEQ ID NO:5、10、18、26、31、60、65、70或75所述的多肽,或者至少15个碱基的所述核酸序列的部分,和 
II.将所述转录调控核苷酸序列功能性连接于其他目的核苷酸序列,后者与所述转录调控核苷酸序列异源。 
优选用于分离的核酸序列包括SEQ ID NO:4、9、17、25、30、59、64、69或74所述序列的至少15个碱基,优选至少25个碱基,更优选至少50个碱基。优选利用所述核酸序列作为引物通过聚合酶链式反应,实现转录调控核苷酸序列的分离。可通过本领域已知的标准克隆方法实现有效连接,如连接介导的克隆或重组介导的克隆。 
对于上述两类方法,优选用于分离所述转录调控核苷酸序列的核苷酸序列编码这样的多肽,所述多肽包含: 
a1)单子叶植物乳酸脱氢酶蛋白的至少一个序列基序,其中序列基序选自如下氨基酸序列: 
i)SLSELGFDA      (SEQ ID NO:76), 
ii)VIGAGNVGMA    (SEQ ID NO:77), 
iii)IVTAGARQI    (SEQ ID NO:78), 
iv)L(F/Y)RKIVP   (SEQ ID NO:79), 
v)GFPASRV        (SEQ ID NO:80), 
vi)RF(L/I)AEHL   (SEQ ID NO:81), 
vii)QAYMVGEH     (SEQ ID NO:82), 
viii)ALEGIRRAV   (SEQ ID NO:83),和 
ix)GYSVAS(L/I)A  (SEQ ID NO:84), 
或者 
a2)单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白的至少一个序列基序,其中序列基序选自如下氨基酸序列: 
x)EQKTRHSE       (SEQ ID NO:85), 
xi)L(I/L)KLIGAK  (SEQ ID NO:86), 
xii)KTMEIGVY     (SEQ ID NO:87), 
xiii)HERL(L/M)KLV(SEQ ID NO:88), 
xiv)CQLPVGDG     (SEQ ID NO:89),和 
xv)TLCRRVK       (SEQ ID NO:90)。 
优选本发明的转录调控核苷酸序列和启动子包括SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73中任一或其包括最小启动子区的启动子直向同源物中约25至2,000的连续核苷酸段,包括50至500或100至250,长达1,000或1,500个连续核苷酸,例如40至约743,60至约743,125至约743,250至约743,400至约743,600至约743个连续核苷酸。 
在本发明的具体实施方案中,所述的约25至2,000的连续核苷酸段(包 括50至500或100至250,长达1,000或1,500个连续核苷酸,例如40至约743,60至约743,125至约743,250至约743,400至约743,600至约743个连续核苷酸),与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72和73中任一或包括最小启动子区的其启动子直向同源物中约25至2,000的连续核苷酸段(包括50至500或100至250,长达1,000或1,500个连续核苷酸,例如40至约743,60至约743,125至约743,250至约743,400至约743,600至约743个连续核苷酸)具有至少75%,优选80%,更优选90%、最优选95%的核酸序列同一性。上述定义的连续核苷酸段优选包含选自TATA盒、GC盒、CAAT盒和转录起始位点的一个或多个启动子基序。 
本发明的转录调控核苷酸序列或它们的功能等同物能够在单子叶植物中驱动编码序列在靶细胞(特别是植物细胞)中的表达。这里所公开的启动子序列和方法可分别用于在单子叶植物中调控任何异源核苷酸序列在宿主植物中的表达,以改变植物的表型。这些启动子可与增强子、上游元件,和/或植物可表达结构基因5’侧翼区的激活序列组合使用。同样地,上游元件可与多种植物启动子序列组合使用。 
本发明的转录调控核苷酸序列和启动子可用于修饰植物的表型。转基因植物表型的多种改变是期望的,即,修饰植物中的脂肪酸组成、改变植物的氨基酸含量、改变植物的病原体防御机制等。可在植物中通过提供异源产物的表达或增强内源产物的表达来获得这些结果。可选地,可通过在植物中提供减少一个或多个内源产物的表达,特别是酶或辅因子达到这些结果。这些改变导致所转化植物表型的改变。 
通常,本发明的转录调控核苷酸序列和启动子可用于在植物中表达与所述启动子有效连接的核酸片段如,例如,开放读框或其部分,反义序列、双链RNA序列的编码序列或者转基因。 
例如,有效连接可包括本发明的转录调控核苷酸序列(例如,如SEQ IDNO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、 24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的序列)与待表达的核酸序列,以及任选的额外调控元件(如,例如,多聚腺苷化作用或转录终止元件、增强子、内含子等)的序贯排列,从而转录调控核苷酸序列可在适宜条件下在目的核酸序列表达的过程中实现其功能。术语“适宜条件”是指优选表达盒存在于植物细胞中。优选如此排列,其中待表达的目的核酸序列以两个序列共价连接的方式置于本发明的转录调控核苷酸序列的下游(即,在3’方向)。任选地,可在两个序列中间插入额外的序列。这类序列可以是例如,接头或多克隆位点。此外,可插入编码融合蛋白的一部分的序列(在旨在表达由目的核酸所编码的蛋白质的融合蛋白的情况下)。优选待表达的目的核酸序列和本发明的转录调控核苷酸序列之间的距离不超过200个碱基对,优选不超过100个碱基对,更优选不超过50个碱基对。 
可通过本领域技术中的各种已知方法实现与本发明任何表达盒的有效连接,包括体外和体内方法。因此,可通过使用本领域公知的标准重组和克隆技术获得本发明的表达盒或含有此表达盒的载体(见,例如,Maniatis1989;Silhavy 1984;Ausubel 1987)。 
也可通过将本发明的转录调控核苷酸序列(例如,如SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的序列)插入到植物基因组内装配表达盒。此类插入将导致与本身已经存在于基因组中的目的核酸序列的有效连接。由于转录调控序列的转录调控性质,目的核酸借助于插入以期望的方式(例如,根/仁偏好性的或者根/仁特异的或者组成型)表达。插入可以是定向的或偶然的。优选插入是定向的,并通过例如同源重组实现。通过该方法,可用本发明的转录调控核苷酸序列交换天然启动子,由此修饰内源基因的表达谱。也可以以表达内源基因的反义mRNA的方式插入转录调控核苷酸序列,由此诱导基因沉默。 
同样地,可通过将待表达目的核酸序列以所插入的序列有效连接于转录调控序列的方式,插入到其天然基因组环境(即,连于其天然基因)中包 括转录调控核苷酸序列的植物基因组内,由此形成本发明的表达盒。 
待连于本发明转录调控核苷酸序列的开放读框可从如下基因中获得:昆虫抗性基因、疾病抗性基因,如,例如,细菌疾病抗性基因、真菌疾病抗性基因、病毒疾病抗性基因、线虫疾病抗性基因、除草剂抗性基因,影响谷粒组成或品质的基因、营养利用基因、真菌毒素降低基因、雄性不育基因、可选择标记基因、可筛选标记基因、阴性选择标记、阳性选择标记、影响植物农艺学特征的基因,即产量、稳定性等,或者环境或胁迫抗性基因,即,赋予除草剂抗性或耐受性、昆虫抗性或耐受性、抗病性或耐受性(病毒、细菌、真菌、卵菌或线虫)、胁迫耐受性或抗性(如对干旱、热、寒冷、冰冻、过潮、盐胁迫或氧化应激的抗性或耐受性)、增加产量、食物含量和组成、物理外观、雄性不育、脱水(drydown)、稳定性、繁殖能力、淀粉性能或量、油量和品质、氨基酸或蛋白质组成等的一个或多个基因。“抗性”是指在施用试剂、被病原体感染或者暴露于胁迫之后,基本上不显示表型改变的植物。“耐受性”是指尽管可能作为感染的结果显示一些表型改变,但是基本上不减少繁殖能力或基本上不改变代谢的植物。 
具有组成型表达谱的本发明的转录调控序列可有利地用于表达多种基因,包括改变代谢途径、赋予疾病抗性,对于蛋白质生产(例如,抗体生产),或者改变养分摄取等。可修饰组成型启动子以使其可调节,例如,可诱导。在上文中所述的基因和启动子可用于鉴定直向同源基因和它们的启动子,其也可以在特定组织中和/或以特定发育方式表达。此外,直向同源启动子可用于表达相连的开放读框。另外,通过将这些直向同源物的启动子进行比对,可鉴定可用于产生合成启动子的新的顺式元件。 
上述表达调控核苷酸序列可任选地有效连接于其他适当的调控序列,例如,转录终止序列、操纵基因、阻遏物结合位点、转录因子结合位点和/或增强子。 
本发明进一步提供含有本发明表达盒的重组载体,以及含有表达盒或载体(例如,含有质粒)的宿主细胞。表达盒或载体可增加转化植物的基因组或者可特别地在染色体外维持。本发明的表达盒或载体可存在于核、 叶绿体、线粒体和/或植物细胞的质体中。优选本发明的表达盒或载体包含在植物核的染色体DNA中。本发明也提供通过该方法所制备的转基因植物,来自这类植物的种子和来自这类植物的子代植物(包括杂种和近亲交配)。表达盒可有效连接于结构基因、其开放读框、或者其部分。表达盒还可含有Ti质粒并被包含在根癌农杆菌细胞中;其可携带在微粒上,其中微粒适于植物细胞的弹射转化;或者其可被包含在植物细胞或原生质体中。此外,表达盒或载体可被包含在转化植物或其细胞内,且植物可以是双子叶植物或单子叶植物。特别地,植物可以是单子叶植物。优选的转基因植物是转基因玉米、大豆、大麦、苜蓿、向日葵、芸苔、大豆、棉花、花生、高粱、烟草、甜菜、稻、小麦、黑麦、草皮草、栗、甘蔗、番茄或马铃薯。 
本发明也提供植物育种的方法,例如,制备杂交可育转基因植物。该方法包括将包含本发明特定表达盒的可育转基因植物与其自身或与第二种植物杂交(例如,缺乏特定表达盒的植物),以制备包含特定表达盒的杂交可育转基因植物的种子。然后种植该种子以获得杂交可育的转基因植物。该植物可以是单子叶植物或双子叶植物。在具体的实施方案中,植物是双子叶植物。杂交可育的转基因植物可具有通过母本或者通过父本遗传的特定表达盒。第二种植物可以是自交植物。杂交可育转基因植物可以是杂种。这些杂交可育的转基因植物中的任何一种的种子也包括在本发明内。 
本发明的转录调控序列还包括互补于在严谨条件下与SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述的核酸分子以及从该核酸分子转录的RNA杂交的序列之一(以下称作“测试”序列)的序列。当在严谨条件下杂交时,优选将本发明的测试或核酸分子置于支持物上,例如,膜或DNA芯片上。因此,优选将本发明变性的测试或核酸分子首先结合到支持物上,在例如,55至70℃的温度,在含有0.1%SDS的2×柠檬酸缓冲盐(SC)中进行指定时间的杂交,随后将支持物于同一温度但用SC浓度降低的缓冲液冲洗。取决于所需严谨程度,这种浓度降低的缓冲液一般是含0.1%SDS的1×SC、含0.1%SDS的0.5×SC以及含0.1%SDS的 0.1×SC。更优选在高严谨条件(如上所定义的)下进行杂交。 
实际上,可向受体植物细胞(例如,双子叶植物细胞)递送任何DNA组合物,以最终生成依照本发明的可育转基因植物。例如,可使用载体和质粒形式的DNA区段或片段,或者在一些情况下仅含有待在植物中表达的DNA元件的线性DNA区段或片段,等等。根据本发明公开的教导,构建可与本发明一起使用的载体将是本领域技术人员已知的(见,例如,Sambrook1989;Gelvin 1990)。 
当然,用于转化这种细胞的载体、质粒、粘粒、YAC (酵母人工染色体)、BAC(细菌人工染色体)和DNA区段通常将包括cDNA、基因或期望引入细胞内的基因。这些DNA构建体还可包括如启动子、增强子、多聚接头,或者甚至期望的调控基因的结构。选择用于细胞内引入的DNA部分、片段或基因常常将编码待在所得的重组细胞中表达的蛋白质,如将导致可筛选的或可选择的性状和/或其将赋予再生植物改良的表型。然而,可以不总是这种情况,本发明也包括掺入不表达的转基因的转基因植物。 
在某些实施方案中,可希望使用在单子叶植物转化中能复制的病毒载体。这类载体包括,例如,小麦矮缩病毒(WDV)“穿梭”载体,如pW1-11和PW1-GUS(Ugaki 1991)。这些载体能在玉米细胞以及大肠杆菌(E.coli)中自主复制因而可提供增强的对检测向转基因细胞中递送DNA的灵敏度。复制载体也可用于递送两侧为转座因子如Ac、Ds或Mu的DNA序列的基因。已提出玉米基因组内这些元件的转座需要DNA复制(Laufs 1990)。也期望转座元件可用于引入缺乏质粒载体在细菌中选择和维持所必需的DNA部分或片段,例如,抗生素抗性基因和DNA复制起点。也建议使用如Ac、Ds或Mu的转座元件,其将积极促进期望DNA的整合并且因此增加稳定转化细胞的频率。使用如Ac、Ds或Mu的转座元件可积极促进目的DNA的整合并且因此增加稳定转化细胞的频率。转座元件能够在细菌中从质粒载体的选择和维持所必需的元件中分离目的基因或者用于转化体的选择。通过使用转座元件,可将期望的和非期望的DNA序列在基因组内转座分开,从而通过子代中的遗传分离,可鉴定具有期望的或非期望DNA序列的植物。 
与一个或多个本发明的转录调控序列相连的目的核苷酸序列,可以例如编码核糖体RNA、反义RNA或者不被翻译成蛋白质的任何其他类型的RNA。在本发明的另一个优选的实施方案中,所述目的核苷酸序列翻译成蛋白质产物。转录调控核苷酸序列和/或与其相连的目的核苷酸序列对于待转化的植物来说,可以是同源的或异源起源。用于引入植物细胞内的重组DNA分子包括从任何来源中获得或分离的DNA分子,可随后对其结构、大小和/或功能进行表征,用化学方法改变,以及稍后引入到植物内。从来源中“衍生”的目的核苷酸序列或片段的实例,是在给定的生物体内被鉴定为有用片段的核苷酸序列或片段,并且随后以基本上纯的形式对其进行化学合成。从来源中“分离”的这类目的核苷酸序列或片段的实例,是通过化学手段,例如,通过使用限制性内切酶从所述来源中切下或取出的核苷酸序列或片段,从而可以通过基因工程的方法对其进一步操作(例如,扩增)用于本发明。通常将这类核苷酸序列或片段称作“重组体”。 
因此,有用的核苷酸序列,目的部分或片段包括完全合成的DNA、半合成的DNA、从生物来源中分离的DNA以及源于所引入的RNA的DNA。通常,所引入的DNA原始并不存在于作为DNA受体的植物基因型中,但是从给定的植物基因型中分离基因,以及随后将基因的多拷贝引入到相同的基因型内,例如,以提高给定基因产物(如,贮存蛋白或者赋予对水缺乏的耐受性或抗性的蛋白)的产量,在本发明的范围之内。 
所引入的重组DNA分子包括,但不限于,来自植物基因,以及来自非植物基因的DNA,如细菌、酵母、动物或病毒的那些基因。所引入的DNA包括修饰的基因、基因的部分,或者嵌合基因,包括来自相同或不同基因型的基因。将术语“嵌合基因”或“嵌合DNA”定义为包括至少两个DNA序列或片段的基因或者DNA序列或片段,所述DNA序列或片段来自在自然条件下不组合DNA的物种,或者该DNA序列或片段在未转化植物的天然基因组中以通常不存在的方式安置或相连。 
这里用于转化的所引入的重组DNA分子可以是环状的或线形的,双链的或单链的。通常,DNA是嵌合DNA的形式,如质粒DNA,其也可包含两 侧是调控序列的编码区,其中调控序列促进所得植物中存在的重组DNA的表达。通常,所引入的重组DNA分子相对较小,即,小于约30kb以使对物理、化学或酶促降解的任何易感性降到最小,已知易感性随核苷酸分子大小的增加而增大。如上所述,优选预选和限定引入植物基因组内的蛋白质、RNA转录物或其混合物的数量,例如,可形成所引入DNA的1至约5-10个这样的产物。 
控制表达到两个主要方法是已知的,即:过表达和表达不足。可通过插入所选基因的一个或多个额外拷贝达到过表达。然而,对于最初用核苷酸序列的一个或多个额外拷贝转化的植物或它们的子代,事先并不知道其呈现表达不足还是过表达的效果。对于表达不足,有两个主要方法,其通常在本领域技术中被称作“反义下调”和“正义下调”(正义下调也被称作“共抑制”)。通常,将这些方法称作“基因沉默”。这两个方法都导致靶基因表达的抑制。 
在适当的植物组织中获得充足的转基因表达水平是基因工程作物生产中很重要的一个方面。植物宿主中异源DNA序列的表达取决于在植物宿主内有功能的有效连接的启动子是否存在。启动子序列的选择将决定在生物体内何时以及何处表达异源DNA序列。 
发明人特别地期望诱变启动子以潜在地提高用于在植物中表达转基因的元件的效用。可随机进行这些元件的诱变并且在试错法(trial-by-errorprocedure)中筛选诱变的启动子序列的活性。可选地,可以鉴定为启动子提供期望表达特性或者表达增强活性的特殊序列,并通过突变,将这些或相似序列引入到序列中。此外,还可期望诱变这些序列,以增强转基因在特定物种中的表达。 
诱变编码本发明的启动子序列的DNA片段的方法是本领域技术人员公知的。如所指出的,可通过随机,或者位点特异性诱变方法对启动子或其他调控元件进行修饰。可通过对相应未修饰序列的编码序列添加或缺失一个或几个核苷酸改变其结构来修饰启动子或其他调控元件。 
可根据本领域技术中的任何已知技术进行诱变,例如但不限于,合成 在特定调控区的序列内具有一个或多个突变的寡核苷酸。特别地,位点特异性诱变通过基础DNA的特异性诱变来制备启动子突变体的有用技术。该技术进一步提供易于制备和测试序列变体的能力,例如,结合前面一种或多种考虑,将一个或多个核苷酸序列改变引入到DNA中。位点特异性诱变能够产生突变体:通过使用编码期望突变的DNA序列的特异性寡核苷酸序列,以及足够量的相邻核苷酸,来提供足够大小和足够序列复杂性的引物序列以便在跨越缺失接点的两侧形成稳定的双链体。一般地,优选引物长约17至约75个核苷酸或者更长,被改变的序列的接点两侧上具有约10至约25个或者更多的残基。 
通常,位点特异性诱变技术是本领域技术中公知的,如由多个出版物举例说明。应该了解,该技术一般使用以单链和双链形式存在的噬菌体载体。在定点诱变中有用的典型载体包括如M13噬菌体的载体。这些噬菌体易于通过商业途径获得并且它们的使用通常是本领域技术人员公知的。在定点诱变中也常规使用双链质粒,其消除了将质粒的目的基因转移到噬菌体中的步骤。 
通常,通过首选获得单链载体或者双链载体的两条链的解链进行定点诱变,其中其序列内包括编码启动子的DNA序列。通常通过合成制备具有期望突变序列的寡核苷酸引物。为了完成带有突变的链的合成,将该引物与单链载体退火,并用DNA聚合酶如大肠杆菌聚合酶I Klenow片段处理。因而形成异源双链体,其中一条链编码最初的未突变的序列,第二条链具有期望的突变。然后将该异源双链体载体用于转化或转染适当的细胞,如大肠杆菌细胞,并选择包含具有突变序列排列的重组载体的细胞。然后可从这些细胞中分离载体DNA并用于植物转化。基因选择方案由Kunkel等(1987)设计以富集掺入诱变寡核苷酸的克隆。可选地,使用具有可通过商业途径获得的热稳定酶,如Taq聚合酶的PCR可将诱变寡核苷酸引物掺入到扩增的DNA片段,然后将扩增的DNA片段克隆到适当的克隆或表达载体内。Tomic等(1990)和Upender等(1995)的PCR介导的诱变方法提供这种方案的两个实例。使用除了热稳定的聚合酶外,还使用热稳定的连接酶的 PCR也可用于将磷酸化的诱变寡核苷酸掺入到扩增的DNA片段内,然后可将扩增的DNA片段克隆到适当的克隆或表达载体内。由Michael(1994)所描述的诱变方法提供这种方案的一个实例。 
提供使用定点诱变制备所选编码启动子的DNA片段的序列变体作为生成潜在有用物种的手段,其并非意在限制,因为有可从中获得DNA序列的序列变体的其他方式。例如,可用诱变剂,如羟胺,处理编码期望启动子序列的重组载体以获得序列变体。 
如这里所使用的,术语“寡核苷酸定点诱变法”指模板依赖的方法和载体介导的繁殖,其导致特异性核酸分子的浓度相对于其起始浓度增加,或者检测信号的浓度增加,如放大。如这里所使用的,术语“寡核苷酸定点诱变法”也旨在指包括引物分子的模板依赖的延伸的方法。术语模板依赖的方法指RNA或DNA分子的核酸合成,其中通过互补碱基配对的公知规则(见,例如,Watson和Rarnstad,1987)规定核酸新合成链的序列。一般地,载体介导的方法包括将核酸片段引入到DNA或RNA内、载体的克隆扩增以及扩增的核酸片段的回收。由美国专利No.4,237,224提供这类方法的实例。可利用许多模板依赖的方法来扩增样品中存在的目的靶序列,这类方法是本领域公知的并且这里在下面具体公开。 
如果根据本发明已经分离了包括启动子的克隆,那么可以希望确定克隆内基本启动子区的界限。制备诱变处理的启动子的一个有效的靶向手段依赖于启动子序列内推定的调控元件的鉴定。这可通过与以类似组织特异性或发育独特的方式表达的已知启动子序列比较开始。具有相似表达模式的启动子之间共有的序列可以是转录因子结合的候选物,因此可以是赋予表达模式的元件。可通过每个推定的调控区的缺失分析,随后通过测定与每个构建体功能性相连的报道基因,进行每个缺失构建体的功能分析,完成这些推定的调控元件的确认。同样地,一旦提供起始启动子序列,那么可很容易地制备起始启动子的多个不同缺失突变体中的任何一个。 
也可通过除去或缺失非必需序列,而不缺失必需序列,获得本发明的转录调控核苷酸序列的功能等同片段。可通过体外试错法缺失突变,或者 在计算机芯片上使用启动子元件搜索程序实现将转录调控核苷酸序列限于基本的转录介导元件。启动子活性必需的区域常常证明是某些已知启动子元件簇。可使用可利用的计算机算法进行这种分析,如PLACE (“植物顺式作用调控DNA元件”;Higo 1999)、BIOBASE数据库“Transfac”(Biologische Datenbanken GmbH,Braunschweig;Wingender 2001)或者数据库PlantCARE(Lescot 2002)。 
优选本发明转录调控序列之一的功能等同片段包括SEQ ID NO:1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72或73所述转录调控核苷酸序列的至少100个碱基对,优选至少200个碱基对,更优选至少500个碱基对。更优选该片段从所示序列的3’末端开始。 
尤其优选是转录调控序列的等同片段,其可通过缺失编码mRNA 5’非翻译区的区域获得,因此仅提供(非转录的)启动子区。可很容易地通过本领域的已知方法(如5’-RACE分析)确定5’非翻译区。因此,一些本发明的转录调控序列是其他序列的等同片段(见下表2)。 
表2:本发明转录调控序列的关系 
Figure BDA00002496098200611
Figure BDA00002496098200621
如上所示,也可随机制备缺失突变体、本发明启动子的缺失突变体,然后进行分析。用这个策略,制备一系列构建体,每个都含有克隆的不同部分(亚克隆),然后筛选这些构建体的活性。筛选活性的适当的方法是将含有缺失片段的缺失的启动子或内含子构建体连于可选择的或可筛选的标记,并且仅分离表达标记基因的那些细胞。以该方式可鉴定许多不同的缺失的启动子构建体,仍然保留期望的或者甚至增强的活性。因而通过所选构建体的比较,可以鉴定活性所必需的最小片段。然后可将该片段用于构建内源基因表达的载体。 
本发明的表达盒可包含更多的调控元件。在该上下文中,将以广泛的含义理解该术语,包括可影响表达盒构建或功能的所有序列。调控元件可以例如在原核或真核生物体中修饰转录和/或翻译。在优选的实施方案中,本发明的表达盒含有位于待表达核酸序列下游(在3’方向)的转录终止序列和任选的额外调控元件,每个都有效连接于待表达的核酸序列(或者转录调控序列)。 
可视转录调控核苷酸序列与表达增强内含子和/或转录终止序列的组合调控本发明表达盒的表达谱。在优选的实施方案中,本发明的表达盒包括至少一个选自如下的额外元件: 
a)5’非翻译区,和 
b)内含子编码序列,和 
c)转录终止序列。 
内含子编码序列优选编码单子叶植物的表达增强内含子。更优选内含子序列是遍在蛋白、肌动蛋白或醇脱氢酶基因的内含子。优选将该内含子插入到表达构建体中待表达核酸序列的5’非翻译区中(即,在转录调控核苷酸序列与蛋白质编码序列(开放读框)或待表达核酸序列之间)。 
优选5’非翻译区来自与转录调控序列相同的基因。 
转录终止序列优选也包括诱导多聚腺苷酸化作用的序列。转录终止序列可与转录调控核苷酸序列和/或待表达核酸序列异源,但也可是所述转录调控核苷酸序列和/或所述待表达核酸序列基因的天然转录调控核苷酸序列。在本发明的一个优选的实施方案中,转录调控核苷酸序列是转录调控序列基因的天然转录调控核苷酸序列。优选转录终止序列选自由SEQ IDNO:32、34和35所述的序列。 
其他调控元件可包括额外的启动子、最小启动子或者启动子元件,它们可修饰表达调控特性。例如,可以使表达依赖于某些胁迫因素如水胁迫、脱落素(Lam 1991)或热胁迫(Schoffl 1989)。此外,可使用在其他生物体(如大肠杆菌或农杆菌)中实现表达的其他启动子或启动子元件。可在细菌的启动子序列如amy和SPO2中或者在酵母或真菌启动子序列(如,ADC1、Mfa、AC、P-60、CYC1、GAPDH、TEF、rp28和ADH)中找到这类调控元件。 
此外,预期组合来自一个以上启动子元件的启动子可以是有用的。例如,US 5,491,288公开了将花椰菜花叶病毒启动子与组蛋白启动子组合。因此,可将这里所公开的启动子的元件与其他启动子的元件组合。用于植物转基因表达的启动子包括诱导型、病毒的、合成的、组成型(Odell 1985)、时间调控的、空间调控的、组织特异性的和时空调控的那些启动子。 
如果期望在特异性组织或器官中表达,可使用组织特异性启动子。相反,如果期望应答刺激的基因表达,那么诱导型启动子是可选择的调控元件。如果期望整个植物细胞的持续表达,那么利用组成型启动子。在转化载体的表达构建体中可包括位于核心启动子序列的上游和/或下游的额外调控序列,以改变转基因植物中异源核苷酸序列的表达水平。 
多种5’和3’转录调控序列可用于本发明。转录终止子负责转录的终止和正确的mRNA多聚腺苷酸化。3’非翻译调控DNA序列优选包括约50至约1,000,更优选约100至约1,000个核苷酸碱基对,并且含有植物转录和翻译终止序列。适当的转录终止子和已知在植物中起作用的那些包括CaMV35S终止子、tml终止子、胭脂碱合酶终止子、豌豆rbcS E9终止子、来自根癌农杆菌章鱼碱合酶基因的T7转录物的终止子,和来自马铃薯或番茄的蛋白酶抑制剂I或II基因的3’末端,然而,也可使用本领域技术人员已知的其他3’元件。可选地,也可使用γ薏苡醇溶蛋白(coixin)、油质蛋白3或来自薏苡(Coix)属的其他终止子。 
优选的3’元件包括来自根癌农杆菌的胭脂碱合酶基因(Bevan 1983)、来自根癌农杆菌的章鱼碱合酶基因的T7转录物的终止子,以及来自马铃薯或番茄的蛋白酶抑制剂I或II基因的3’末端的那些的启动子。 
由于转录起始位点和编码序列的启动之间的DNA序列(即非翻译的前导序列)可影响基因表达,因此可能期望使用特殊的前导序列。期望优选的前导序列包括预测指导所连基因的最适表达的序列的那些,即,期望包括可增加或维持mRNA稳定性并防止不正确翻译开始的优选共有前导序列。根据本发明的公开,这种序列的选择将是本领域技术人员已知的。源于在植物中高度表达的基因的序列将是最优选的。 
优选的调控元件也包括基因的5’非翻译区、内含子和3’非翻译区。已发现在转基因植物中增强基因表达的这类序列包括内含子序列(例如,来自Adh1、bronze1、肌动蛋白1、肌动蛋白2(WO 00/760067),或者蔗糖合酶内含子;见:The Maize Handbook,Chapter 116,Freeling和Walbot编辑,Springer,New York(1994))和病毒前导序列(例如,来自TMV、MCMV和 AMV;Gallie 1987)。例如,已知许多衍生自病毒的非翻的前导序列增强表达。具体地,已证明烟草花叶病毒(TMV)、玉米褪绿斑驳病毒(MCMV)和苜蓿花叶病毒(AMV)的前导序列有效增强表达(例如,Gallie 1987;Skuzeski1990)。本领域中已知的其他前导序列包括但不限于:小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎5’非编码区)(Elroy-Stein 1989);马铃薯Y病毒属前导序列,例如,TEV前导序列(烟草蚀斑病毒);MDMV前导序列(玉米矮缩病毒);人免疫球蛋白重链结合蛋白(BiP)前导序列,(Macejak1991);苜蓿花叶病毒的外壳蛋白mRNA(AMV RNA 4)的非翻译的前导序列,(Jobling 1987);烟草花叶病毒前导序列(TMV),(Gallie 1989);以及玉米褪绿斑驳病毒前导序列(MCMV)(Lommel 1991,也见Della-Cioppa1987)。如果期望的话,还可包括调控元件如Adh内含子1(Callis 1987)、蔗糖合酶内含子(Vasil 1989)或者TMV Ω元件(Gallie 1989)。 
尤其优选是选自咖啡酰-CoA-O-甲基转移酶基因、C8,7-固醇异构酶基因、富含羟脯氨酸的糖蛋白(HRGP)基因、乳酸脱氢酶基因以及叶绿体蛋白12样基因的基因的5’非翻译区、内含子和3’非翻译区。更优选在本发明的表达盒中所利用的5’非翻译区、内含子和3’非翻译区是来自选自稻咖啡酰-CoA-O-甲基转移酶基因、稻C8,7-固醇异构酶基因、玉米富含羟脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脱氢酶基因、稻叶绿体蛋白12样基因及其功能等同物的植物基因。 
最优选的是包括在SEQ ID NO:1、6、11、14、19、22和27所述序列的3’末端的5’非翻译区。尤其优选的是SEQ ID NO:1的核苷酸993-1034、SEQ ID NO:6的核苷酸767-797、SEQ ID NO 11的核苷酸1112-1182、SEQID NO 14的核苷酸1192-1270、SEQ ID NO:19的核苷酸947-1060、SEQ IDNO:22的核苷酸949-1093以及SEQ ID NO:27的核苷酸949-998所述的序列。 
内含子编码序列优选编码单子叶植物的表达增强内含子。优选将该内含子插入到表达构建体中待表达的核酸序列的5’非翻译区中(即,在转录调控核苷酸序列与蛋白质编码序列(开放读框)或待表达核酸序列之间)。更优 选内含子序列是: 
a)玉米遍在蛋白基因的内含子,优选其内含子I,最优选如SEQ ID NO:36的核苷酸1,082-2,091所述的内含子序列, 
b)稻肌动蛋白基因的内含子,优选其内含子I,最优选如GenBank登录号:X63830的核苷酸121-568所述的内含子序列, 
c)玉米醇脱氢酶(adh)基因的内含子,优选其内含子6,最优选如GenBank登录号:X04049的核苷酸3,135-3,476所述的内含子序列, 
转录终止序列优选也包括诱导多聚腺苷酸化作用的序列。转录终止序列可与转录调控核苷酸序列和/或待表达的核酸序列异源,但也可以是所述转录调控核苷酸序列和/或将表达的所述核酸序列的基因的天然转录调控核苷酸序列。在本发明的一个优选的实施方案中,转录调控核苷酸序列是转录调控序列的基因的天然转录调控核苷酸序列。优选的转录终止序列选自稻咖啡酰-CoA-O-甲基转移酶基因、稻C8,7-固醇异构酶基因、玉米富含羟脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脱氢酶基因、稻叶绿体蛋白12样基因及其功能等同物的植物基因的转录终止序列。最优选的是SEQ IDNO:32所述的玉米乳酸脱氢酶基因的转录终止序列、SEQ ID NO:34所述的稻咖啡酰-CoA-O-甲基转移酶基因的转录终止序列,以及SEQ ID NO:35所述的玉米富含羟脯氨酸的糖蛋白(HRGP)基因的转录终止序列。通过转录调控序列与特异性5’非翻译区、内含子和/或转录终止序列的组合,可调控表达特异性,尤其是组织特异性。 
Figure BDA00002496098200671
自身的:启动子天然所属基因的元件;NOS:胭脂碱合酶。 
其他优选的调控元件是增强子序列或者多聚腺苷酸化序列。优选的多聚腺苷酸化序列是来自植物基因或农杆菌T-DNA基因的那些(如,例如,OCS(章鱼碱合酶)或NOS(胭脂碱合酶)基因的终止序列)。 
增强子的实例包括CaMV 35S启动子、章鱼碱合酶基因(Ellis等,1987)、稻肌动蛋白I基因、玉米醇脱氢酶基因(Callis 1987)、玉米皱缩(shrunken)I基因(Vasil 1989)、TMV Ω元件(Gallie 1989)和非植物真核生物的启动子(例如,酵母;Ma 1988)的元件。可构建用于本发明的载体以包括ocs增强子元件。该元件最初被鉴定为ultilane的章鱼碱合酶(ocs)基因的16bp回文增强子(Ellis 1987),且存在于至少10个其他启动子(Bouchez 1989)中。当在植物转化的上下文中应用时,使用增强子元件,如ocs元件,特别是多拷贝的增强子元件将增加相邻启动子的转录水平。 
本发明的表达盒(或自其衍生的载体)可包含额外的功能元件,其应当在广泛的意义上理解为影响表达盒或载体或者包含它们的转基因生物体的构建、繁殖或功能的所有元件。这类功能元件可包括复制起点(以允许在细菌中复制;例如,pBR322的ORI或者P15A ori;Sambrook 1989),或者农杆菌T-DNA转移所必需的元件(如,例如,T-DNA的左和/或边界)。 
最后,最期望的DNA片段(例如引入到单子叶植物基因组中的DNA片段),可以是异源基因或者基因家族,其编码期望性状(例如,每英亩产量增加),并且在新的启动子或增强子等的控制下引入,或者可以甚至是异源 的或组织特异性(例如,根-、珠托/叶鞘-、轮生体-、茎-、穗胫-、仁-或叶特异性)启动子或控制元件。实际上,预想本发明的特定用途将是基因以组成型方式或者根/仁偏好性的或根/仁特异性方式的表达。 
另外,可构建载体并在转基因植物的细胞内中用于细胞内寻靶特定的基因产物,或者将蛋白质定向到细胞外环境。这通常将通过编码转运或信号肽的DNA序列与特定基因的编码序列相连完成。所得的转运或信号肽将蛋白质分别转运到特定的细胞内或细胞外目的地,然后在翻译后被除去。转运或信号肽起促进蛋白质通过细胞内膜转运的作用,例如,液泡、泡囊、质体和线粒体膜,其中信号肽指导蛋白质通过细胞外膜。 
这种用途具体实例涉及将除草剂抗性基因,如EPSPS基因定向到特定的细胞器如叶绿体而不是细胞质。这通过使用赋予蛋白质质体特异性寻靶的rbcs转运肽举例说明。另外,认为可以期望将负责雄性不育的某些基因靶向至线粒体,或者将对植物病原体生物体抗性的某些基因靶向至细胞外间隙,或者将蛋白质靶向至液泡。 
通过促进蛋白质转运到细胞内和细胞外区室,这些序列可增加基因产物的累积,防止它们被蛋白水解降解。这些序列也允许高度表达基因的附加mRNA序列附着到基因的编码序列上。由于由核糖体翻译的mRNA比裸mRNA更稳定,因此基因前存在可翻译的mRNA可以增加基因的mRNA转录物的总稳定性,由此增加基因产物的合成。由于转运和信号序列通常在翻译后从初始翻译产物中除去,因此使用这些序列允许添加可以不在最后多肽上出现的额外被翻译的序列。为了增强蛋白质的稳定性(US5,545,818),可能期望某些蛋白质的靶向。 
细胞内靶DNA本身可以是有用的。例如,可用于将所引入的DNA靶向至核,这可以增加转化的频率。在核内,为了达到位点特异性整合,靶向基因可以是有用的。例如,可用于用具有通过转化所引入的基因取代细胞内存在的基因。其他元件包括可通过内源性或外源性试剂调控的那些,例如,通过锌指蛋白,包括天然存在的锌指蛋白或嵌合锌指蛋白(见,例如,US 5,789,538、WO 99/48909;WO 99/45132;WO 98/53060;WO 98/53057; WO 98/53058;WO 00/23464;WO 95/19431;和WO 98/54311)或者myb样转录因子调控的那些。例如,嵌合锌指蛋白可包括结合特异性DNA序列(锌指)的氨基酸序列,以及激活(例如,GAL 4序列)或抑制与特定DNA序列相连序列的转录的氨基酸序列。 
本发明的一个目的是提供重组DNA分子,其包含与目的核苷酸片段有效连接的根据本发明的核苷酸序列。 
目的核苷酸片段是商业市场的反映和参予农作物研发的那些人的兴趣所在。随着作物和市场的变化,以及发展中国家打开世界市场,新的作物和技术也将出现。另外,随着对农艺性状和特征如产量和杂种优势的理解的增加,对用于转化的基因的选择也将相应改变。一般类型的目的核苷酸包括,例如,与参与信息的基因,如锌指蛋白;参与通讯的基因,如激酶;以及参与管家的基因,如热休克蛋白。更具体的转基因类别包括,例如,编码农学重要的性状、昆虫抗性、疾病抗性、除草剂抗性、不育性、谷物特征和商业产品的基因。目的基因一般包括,与淀粉、油、糖类或营养代谢有关的那些,以及影响仁大小、糖载量、锌指蛋白的那些,见,例如,US 5,789,538、WO 99/48909;WO 99/45132;WO 98/53060;WO 98/53057;WO 98/53058;WO 00/23464;WO 95/19431;以及WO 98/54311等。 
本领域技术人员认识到,转基因在植物中的表达水平和调控可显著地随品系的不同而不同。因此,必须测试几个株系以发现具有期望表达水平和调控的株系。株系一经鉴定具有嵌合Cre转基因的期望的调控特异性,那么可将其与携带不同失活复制子或失活转基因的株系杂交来激活。 
可与目的基因(其编码多肽)相连的其他序列,是可靶向植物细胞内特异性细胞器的那些,例如,靶向线粒体、核或质体。可以通过向多肽提供合适的靶向肽序列,如分泌信号肽(用于分泌或者靶向细胞壁或膜,质体转运肽、叶绿体转运肽,例如,叶绿素a/b结合蛋白、线粒体靶向肽、液泡靶向肽,或者核靶向肽等实现寻靶。例如,可使用核酮糖二磷酸羧化酶转运肽的小亚基、EPSPS转运肽或二氢吡啶二羧酸合酶转运肽。例如,质体细胞器靶向序列(见WO 00/12732)。质体是衍生自前质体的一类植物细胞 器,并且包括叶绿体、白色体、淀粉体和色质体。质体是植物中生物合成的主要部位。除了叶绿体中的光合作用,质体也是脂类生物合成、硝酸还原成铵和淀粉贮藏的部位。尽管质体含有其自己的环状基因组,但是质体上的大部分蛋白质由核基因组编码并从细胞质运输到细胞器内。 
在本发明中所使用的转基因常常是指导特定蛋白质或多肽产物表达的基因,但是它们也可以是非表达的DNA片段,例如,转座子,如不指导它们自身转座的Ds。如这里所使用的,“可表达的基因”是能被转录成RNA(例如,mRNA、反义RNA等)或者被翻译成蛋白质,作为目的性状表达等的任何基因,并且不限于选择性,筛选性或非选择性标记基因。本发明也考虑,如果可表达基因(不必是标记基因)与标记基因结合使用,那么可使用在相同或不同DNA区段上的不同基因用于转化。在后者的情况中,将不同的载体同时传递至受体细胞以使共转化最大化。 
传递至受体细胞的特定DNA区段的选择将常常取决于转化目的。作物植物转化的主要目的之一是向植物添加一些商业上期望的,农艺学上重要的性状。这类性状包括但不限于:除草剂抗性或耐受性;昆虫抗性或耐受性;疾病抗性或耐受性(病毒、细菌、真菌、线虫);胁迫耐受性和/或抗性,例如,对干旱、热、寒冷、冰冻、过潮、盐胁迫的抗性或耐受性;氧化应激;增加的产量;食物含量和组成;物理外观;雄性不育;脱水;耐倒伏性(standability);繁殖能力;淀粉性质;油量和品质等等。可期望掺入赋予任何期望性状的一个或多个基因,例如,编码病原体抗性的基因。 
在某些实施方案中,本发明考虑使用一个以上有利的转基因转化受体细胞。可在单个转化事件中应用两个或多个转基因,使用不同的转基因编码载体,或者使用掺入两个或多个基因编码序列的单个载体。例如,认为具有以同向、反向或者共线性方向携带bar和aroA表达单元的质粒特别有用。另外优选的组合是昆虫抗性基因(如Bt基因)与蛋白酶抑制剂基因如pinII的组合,或者bar与上述基因中的任何一种组合使用。当然,如果期望的话,可使用任何描述的任何两个或多个转基因,如赋予除草剂、昆虫、疾病(病毒、细菌、真菌、线虫)或干旱抗性、雄性不育、脱水、耐倒伏性、 繁殖能力、淀粉性质、油量和品质的那些或者增加产量或营养品质的那些。 
1.示范性的转基因 
本发明的转录调控序列对于在单子叶植物(如上述定义部分中所定义的)中的表达(优选组成型或者根/仁偏好性的或根/仁特异性表达)尤其有用,尤其是在谷类植物中,如玉米、稻、小麦、黑麦、大麦和燕麦。然而,不排除在其他植物(例如,双子叶植物或裸子植物)和其他组织中的使用。 
可使用本发明的转录调控核苷酸序列和表达盒用于多种表达目的,如,例如蛋白质的表达,或者反义RNA、正义或双链RNA的表达。优选核酸序列的表达赋予植物农艺上有价值的性状。 
1.1.除草剂抗性 
编码膦丝菌素酰基转移酶(bar和pat)的基因、耐受草苷膦的EPSP合酶基因、编码草苷膦氧化还原酶的草苷膦降解酶基因gox、deh(编码失活茅草枯的脱卤素酶)、除草剂抗性(例如,磺酰脲和咪唑啉酮)乙酰乳酸合酶,以及bxn基因(编码降解溴苯腈的腈水解酶)是用于转化的除草剂抗性基因的良好实例。bar和pat基因编码膦丝菌素酰基转移酶(PAT),其灭活除草剂膦丝菌素并防止该化合物抑制谷氨酰胺合成酶。5-烯醇式丙酮基莽草酸3-磷酸合酶(EPSP合酶),通常被除草剂N-(膦酸基甲基)甘氨酸(草苷膦)抑制。然而,编码草苷膦抗性EPSP合酶的基因是已知的。deh基因编码茅草枯脱卤素酶并赋予除草剂茅草枯抗性。bxn基因编码特异性腈水解酶,将溴苯腈转变成非除草剂降解产物。 
1.2昆虫抗性 
本发明的重要方面涉及将赋予昆虫抗性的基因引入到植物中。可被引入的潜在的昆虫抗性基因包括苏云金芽孢杆菌(Bacillus thuringiensis)结晶毒素基因或Bt基因(Watrud 1985)。Bt基因可提供对鳞翅目或鞘翅目害虫如欧洲玉米螟(ECB)和玉米根虫(CRW)的抗性。用于这类实施方案的优选的 Bt毒素基因包括CryIA(b)和CryIA(c)基因。在这方面,也可使用影响昆虫生长或发育的苏云金芽孢杆菌其他种的内毒素基因。蛋白酶抑制剂也可提供昆虫抗性(Johnson 1989),并因此将在植物转化中有用。预想使用番茄或马铃薯的蛋白酶抑制剂II基因,pinII,将特别有用。甚至更有利的是pinII基因与Bt毒素基因组合使用,本发明人已经发现,组合效应产生协同杀昆虫活性。编码昆虫消化系统抑制剂的其他基因,或者编码促进抑制剂产生的酶或辅因子的那些基因,可以也是有用的。该组可通过半胱氨酸蛋白酶抑制剂和淀粉酶抑制剂举例说明,如来自小麦和大麦的那些。 
同样,编码凝集素的基因可以赋予另外的或选择性杀昆虫特性。凝集素(最初称作植物凝集素)是多价糖类结合蛋白质,其具有凝聚许多物种的红细胞的能力。最近已将凝集素鉴定为具有抗象鼻虫、ECB和根虫活性的杀昆虫剂(Murdock 1990;Czapla&Lang,1990)。预期有用的凝集素基因包括,例如,大麦和小麦胚芽凝集素(WGA)和稻凝集素(Gatehouse 1984),优选WGA。 
当引入到昆虫害虫中时,控制产生具有抗昆虫活性的大小多肽(例如,裂解肽、肽激素以及毒素和毒液)的基因,形成本发明的另一个方面。例如,期望针对特定昆虫害虫的保幼激素酯酶的表达也可导致杀昆虫活性,或者可以导致变态的中断(Hammock 1990)。 
本发明的另一个方面是表达基因的转基因植物,所述基因编码影响昆虫表皮角质层完整性的酶。这类基因包括编码例如,几丁质酶、蛋白酶、脂肪酶的那些以及产生尼可霉素(nikkomycin)(抑制几丁质合成的化合物)的基因,期望引入这些中的任何一个以产生昆虫抗性的玉米植物。编码影响昆虫蜕皮活性的基因,例如影响产生蜕皮类固醇UDP-葡糖基转移酶的那些基因,也落入本发明的有用转基因的范围内。 
本发明也包括编码酶的基因,所述酶促使产生降低宿主植物对昆虫害虫的营养质量的化合物。例如,可通过改变其固醇组成赋予植物杀昆虫活性。昆虫从其饮食中获得固醇并用于激素合成和膜稳定性。因此,通过表达新基因(例如,直接促进产生不期望的固醇的那些或者将期望的固醇转 变成不期望的形式的那些基因)改变植物固醇组成,可对昆虫生长和/或发育具有负效应,因此赋予植物杀昆虫活性。脂肪加氧酶是天然存在的植物酶,已证明显示对昆虫的抗营养效应并降低其饮食的营养质量。因此,本发明另外的实施方案涉及可抗昆虫摄食的带有增强的脂加氧酶活性的转基因植物。 
本发明也提供完成植物次级代谢物的定性或定量改变的方法和组合物。一个实施例涉及转化植物以生产DIMBOA,期望其将赋予对欧洲玉米螟、根虫以及几种其他玉米昆虫害虫的抗性。特别考虑用于这方面的候选基因包括bx基因座上已知与合成DIMBOA途径有关的那些基因(Dunn1981)。也考虑引入可调控玉米可凝性球蛋白(maysin)生产的基因,和高粱中涉及蜀黍苷生产的基因,分别用于促进对蠕虫(earworm)和根虫的抗性。 
鸭茅状摩擦禾(Tripsacum dactyloides)是对某些昆虫包括玉米根虫具有抗性的草。期望将从摩擦禾属(Tripsacum)分离出编码对昆虫有毒性的或者参与对昆虫有毒性化合物生物合成的蛋白质的基因,这些新基因将可用于赋予对昆虫的抗性。已知摩擦禾属(Tripsacum)中昆虫抗性的基础是遗传性的,因为所述抗性已通过有性杂交转移到玉米中(Branson&Guss,1972)。 
此外也可使用编码特征为具有潜在杀昆虫活性的蛋白质的基因作为转基因。这类基因包括,例如,可用作根虫阻止剂的豇豆胰蛋白酶抑制剂(CpTI;Hilder 1987);编码可证明作为特别有效的玉米根虫阻止剂的除虫菌素的基因(Campbell 1989;Ikeda 1987);核糖体失活蛋白基因;以及甚至调控植物结构的基因。也期望包括抗昆虫抗体基因和编码酶的基因的转基因玉米,所述酶可将应用到植物外部的非毒性杀虫剂(前杀虫剂(pro-insecticide))转变成植物内部杀虫剂。 
1.3环境或胁迫抗性 
也可通过异源表达,或者同源基因的过表达有效改良植物耐受多种环境胁迫的能力,如,但不限于,干旱、过潮、寒冷、冰冻、高温、盐和氧 化胁迫。在增强对冰冻温度的抗性方面,可通过引入“抗冻”蛋白如WinterFlounder(Cutler 1989)所描述的或者其合成基因衍生物实现。也可通过增加叶绿体中甘油-3-磷酸乙酰转移酶的表达赋予改良的寒冷耐受性(Murata1992;Wolter 1992)。氧化应激(常常由于条件而恶化,如与高光强度结合的冷却温度)抗性可通过表达超氧化物岐化酶赋予(Gupta 1993),也可通过谷胱甘肽还原酶改善(Bowler 1992)。这类策略可允许在新出现的领域中耐受冰冻,以及将较晚成熟的更高产量品种扩大至更早的相对成熟区。 
表达利于影响植物水含量、总水势、渗透势和膨胀的新基因可增强植物耐受干旱的能力。如这里所使用的,术语“干旱抗性”和“干旱耐受性”用于指与正常环境相比,植物对由水可用性减少所引起的胁迫的增强的抗性或耐受性,以及植物以相对较好的方式在缺水环境中发挥功能和存活的能力。认为在本发明的这个方面,例如,编码渗透活性溶质的生物合成的基因的表达可赋予抗干旱保护。在这类基因中有编码甘露醇脱氢酶(Lee和Saier,1982)和海藻糖-6-磷酸合酶(Kaasen 1992)的DNA。通过随后细胞中天然磷酸酶的作用或者通过引入和共表达特异性磷酸酶,这些所引入的基因将分别导致甘露醇或海藻糖的累积,两者都已被充分记载为能减轻胁迫影响的保护性化合物。已经证实甘露醇在转基因烟草中累积,并且初步结果表明高水平表达该代谢产物的植物能耐受外加的渗透胁迫(Tarczynski1992)。 
类似地,文献已证明了其他代谢物在保护酶功能(例如,丙氨奥品(alanopine)或丙酸)或膜完整性(例如,丙氨奥品)中的效力(Loomis 1989),因此编码这些化合物生物合成的基因的表达可以以与甘露醇类似或互补的方式赋予干旱抗性。具有渗透活性和/或在干旱和/或干燥期间提供某些直接保护效应的天然存在的代谢物的其他实例包括糖和糖类衍生物,如果糖、赤藓糖醇(Coxson 1992)、山梨糖醇、卫矛醇(Karsten 1992)、葡糖甘油(glucosylglycerol)(Reed 1984;Erdmann 1992)、蔗糖、水苏糖(Koster&Leopold 1988;Blackman 1992)、芒柄醇(ononitol)和松醇(pinitol)(Vernon&Bohnert 1992),以及棉子糖(Bernal-Lugo&Leopold 1992)。并非糖类的其 他渗透活性溶质包括,但不限于,脯氨酸和甘氨酸甜菜碱(Wyn-Jones和Storey,1981)。胁迫期间连续的株冠生长和增强的繁殖适度可通过基因的引入和表达增强,如控制上面所讨论的渗透活性化合物和其他这类化合物的那些基因,如在一个示范性实施方案中通过肌醇-0-甲基转移酶所代表的。 
特异性蛋白质的表达也可望增加干旱耐受性。已经根据结构相似性确定了三类晚期胚胎发生蛋白(见Dure 1989)。已经在成熟(即,干燥)种子中证明了所有这三类蛋白质。在这三类蛋白质中,II型(脱水诱生蛋白型(dehydrin-type))通常牵涉到营养性植物部分的干旱和/或干燥耐受(例如,Mundy和Chua,1988;Piatkowski 1990;Yamaguchi-Shinozaki 1992)。最近,发现烟草中III型LEA(HVA-1)的表达影响植物高度、成熟和干旱耐受性(Fitzpatrick,1993)。因此所有三类结构基因的表达可赋予干旱耐受性。在水胁迫期间诱导的其他类型的蛋白质包括巯基蛋白酶、醛缩酶和跨膜转运蛋白(Guerrero 1990),其可在干旱胁迫期间赋予多种保护性和/或修复型功能。影响脂类生物合成并因此影响膜组成的基因的表达也可用于赋予植物干旱抗性。 
改善干旱抗性的许多基因具有互补的作用模式。因此,这些基因的组合可在改善玉米的干旱抗性中具有加性和/或协同效应。这些基因中的许多也改善冰冻耐受性(或抗性);冷冻和干旱期间所引起的物理性胁迫本质上相似并且可以以相似方式减轻。可通过这些基因的组成型表达或者根/仁偏好性的或根/仁特异性表达获益,但是表达这些新基因的优选的方法可以是通过使用膨胀诱导的启动子(如在Guerrero等1990和Shagan 1993中所述的膨胀诱导的基因的启动子)。这些基因的时空表达模式可使玉米更好地抵御胁迫。 
表达涉及允许增加从干燥土壤中摄取水分的特异性形态性状的基因将是有益的。例如,改变根特性的基因的引入和表达可增强水分摄入。表达胁迫期间增强繁殖适度的基因将具有重要价值。例如,改善花粉散落的同步性和雌性花部分(即穗丝)的接受性的DNA的表达,将是有益的。另外, 胁迫期间使仁败育最小化的基因的表达将增加欲收获的谷物量并因此是有价值的。通过带有适当调控序列的异戊烯基转移酶基因的引入和表达,调控单子叶植物,如玉米中细胞分裂素的水平可改善单子叶植物胁迫抗性和产量(Gan 1995)。 
给定水在决定产量中的总体作用,考虑通过新基因的引入和表达能使植物更有效地利用水,将改善全部性能,甚至当土壤水利用性没有限制时。通过引入改善植物在与水利用性相关的广泛胁迫中对水使用最大化的能力的基因,可实现产量稳定性或产量行为的连贯性。 
也可达到改善植物对非生物胁迫因子如干旱、热或寒冷的保护,例如,通过过表达杜父鱼(Myoxocephalus Scorpius)(WO 00/00512)、多刺杜父鱼(Myoxocephalus octodecemspinosus)的抗冻多肽、拟南芥转录激活因子CBF1、谷氨酸脱氢酶(WO 97/12983、WO 98/11240)、依赖钙的蛋白激酶基因(WO 98/26045)、钙依赖磷酸酶(WO 99/05902)、来自酵母的酪氨酸激酶(WO 02/052012)、法尼基转移酶(WO 99/06580;Pei ZM等(1998)Science282:287-290)、铁蛋白(Deak M等(1999)Nature Biotechnology 17:192-196)、草酸氧化酶(WO 99/04013;Dunwell JM(1998)Biotechn Genet Eng Rev15:1-32)、DREB1A因子(“脱水应答元件B 1A”;Kasuga M等(1999)NatureBiotech 17:276-286)、甘露醇或海藻糖合成的基因如海藻糖-磷酸合酶或海藻糖-磷酸磷酸酶(WO 97/42326)或者通过抑制基因如海藻糖酶(WO97/50561)。 
1.4疾病抗性 
认为可通过将基因引入到植物周期内实现增强的疾病抗性。可产生对由病毒、细菌、真菌、根际病原体、昆虫和线虫所致疾病的抗性。也期望可通过所引入基因的表达实现真菌毒素生产生物体的控制。 
可通过新基因的表达产生对病毒的抗性。例如,已证明转基因植物内病毒外壳蛋白的表达可赋予植物对该病毒以及可以其他密切相关病毒感染的抗性(Cuozzo 1988,Hemenway 1988,Abel 1986)。认为靶向必须病毒功能 的反义基因的表达可赋予对所述病毒的抗性。例如,靶向负责病毒核酸复制的基因的反义基因可抑制所述复制并导致对病毒的抗性。认为通过使用反义基因干扰其他病毒功能也可增加对病毒的抗性。此外,认为可通过其他方法达到对病毒的抗性,包括,但不限于使用卫星病毒。 
建议可通过引入新基因实现增加对由细菌和真菌所致疾病的抗性。期望编码所谓“肽抗生素”、致病相关(PR)蛋白、毒素抗性和影响宿主-病原体相互作用如形态特征的蛋白质的基因将是有用的。肽抗生素是抑制细菌和其他微生物生长的多肽序列。例如,称作杀菌肽和爪蟾抗菌肽的肽类抑制许多种细菌和真菌的生长。认为植物中PR蛋白的表达可用于赋予对细菌疾病的抗性。这些基因在病原体攻击宿主植物后被诱导并且已经被分成至少五类蛋白质(Bol 1990)。包括在PR蛋白中的是β-1,3-葡聚糖酶、几丁质酶和渗透蛋白,以及被认为在植物对疾病生物体的抗性中起作用的其他蛋白质。已鉴定了具有抗真菌特性的其他基因,例如,UDA(蛰毛荨麻凝集素)和橡胶蛋白(Broakgert 1989;Barkai-Golan 1978)。已知某些植物疾病是由植物毒素的产生所致。可通过表达编码能降解或者用其他方法灭活植物毒素的酶的新基因,获得对这些疾病的抗性。表达改变宿主植物和病原体之间相互作用的新基因可用于减少疾病生物体侵袭宿主植物组织的能力,例如,增加叶角质层的蜡质或其他形态特征。 
植物寄生线虫在许多植物中是疾病的病因。建议可通过新基因的表达使植物抵抗这些生物体。期望可通过改变线虫识别或附着于宿主植物的能力和/或能使植物产生杀线虫的化合物(包括但不限于蛋白质),实现控制线虫侵袭。 
此外,可通过某些代谢产物或蛋白质的靶向累积,获得对真菌、昆虫、线虫和疾病的抗性。这种蛋白质包括,但不限于芥子油苷(防御食草动物)、几丁质酶或葡聚糖酶和破坏寄生虫的细胞壁的其他酶、核糖体失活蛋白(RIP)以及(当植物受到微生物损伤或攻击时,或者通过化学方法,通过,例如,水杨酸、茉莉酮酸或乙烯损伤时所诱导的)植物抗性和胁迫反应的其他蛋白质,或者非植物来源的溶菌酶如,例如,T4溶菌酶或者多种哺乳 动物的溶菌酶,杀昆虫蛋白如苏云金芽孢杆菌内毒素,α-淀粉酶抑制剂或蛋白酶抑制剂(豇豆胰蛋白酶抑制剂),凝集素如麦胚凝集素、核糖核酸酶或核酶。其他实例是编码哈茨木霉(Trichoderma harzianum)chit42几丁质酶(GenBank登陆号No.:S78423)或者来自高粱(Sorghum bicolor)的N-羟基化多功能细胞色素P-450(CYP79)蛋白(GenBank登录号:U32624),或者这些的功能等同物的核酸。芥子油苷的累积保护植物避免害虫侵害(Rask L等(2000)Plant Mol Biol 42:93-113;Menard R等(1999)Phytochemistry52:29-35),表达苏云金芽孢杆菌内毒素(Vaeck等(1987)Nature 328:33-37)或通过表达几丁质酶(例如豆类的几丁质酶)避免受真菌攻击(Broglie等(1991)Science 254:1194-1197)是有利的。可通过表达雪滴花(雪花莲(Galanthus nivalis))凝集素(Rao等(1998)Plant J 15(4):469-77)获得对害虫的抗性如,例如,稻植物中的稻害虫褐飞虱(Nilaparvata lugens)。编码鳞翅目特异性苏云金芽孢杆菌D-内毒素的合成的cryIA(b)和cryIA(c)基因的表达可在多种植物中产生对昆虫害虫的抗性(Goyal RK等(2000)CropProtection 19(5):307-312)。适于病原体防御的另外的靶基因包括“多聚半乳糖醛酸酶抑制蛋白”(PGIP)、奇异果甜蛋白、转化酶和抗菌肽如乳铁蛋白(Lee TJ等(2002)J Amer Soc Horticult Sci 127(2):158-164)。 
1.5真菌毒素减少/消除 
由与植物相关的真菌所产生的真菌毒素,包括黄曲霉毒素和串珠镰孢菌素(fumonisin)是造成谷粒无用的重要因素。这些真菌生物体不导致疾病症状和/或干扰植物的生长,但是它们产生对动物有毒性的化学品(真菌毒素)。对这些真菌生长的抑制将减少这些毒性物质的合成,因此减少由于真菌毒素污染所致的谷粒损失。可将抑制真菌毒素的合成而不干扰真菌生长的新基因引入到植物中。为了减少谷粒的真菌毒素污染,表达编码能使真菌毒素无毒性的酶的新基因将是有用的。上述任何机制的结果是减少谷粒上存在的真菌毒素。 
1.6谷粒组成或品质 
可将基因引入到植物内,特别是商业上重要的谷类如玉米、小麦或稻,以改良种植谷物主要所需的谷粒。可预见到以这种方式所生产的大量转基因植物,这视谷粒的特定的最终用途而定。 
例如,玉米谷粒的最大用途是用作饲料或食物。引入改变谷粒组成的基因可极大地增加饲料或食物价值。玉米粒的主要成分是淀粉、蛋白质和油。可通过改变其水平或组成来改良玉米粒的这些主要成分中的每一种。可提及几个实例用于说明的目的,但决非提供可能性的详尽列表。 
许多谷物谷粒的蛋白质是亚适于饲料和食品目的,当用于饲养猪、家禽和供应人时尤为如此。这些物种饮食中的蛋白质缺乏几种必需氨基酸,需要向谷粒中添加补充物。有限的必需氨基酸可包括赖氨酸、甲硫氨酸、色氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。一些氨基酸仅在谷粒补充了饲料配方的其他补充物后变成有限的。例如,当谷粒补充了大豆粉以满足赖氨酸需要时,甲硫氨酸就变成有限的。可通过各种机制提高种子和谷粒中这些必需氨基酸的水平,包括,但不限于,引入基因以增加氨基酸的生物合成,减少氨基酸的降解,增加蛋白质中氨基酸的贮藏,或者增加氨基酸向种子或谷粒的转运。 
增加氨基酸的生物合成的一个机制是引入失调氨基酸生物合成途径的基因,使得植物不再能充分控制其生产水平。这可通过失调或者旁通氨基酸生物合成途径中的步骤(通常受到该途径氨基酸终产物的水平的调控)来完成。实例包括引入编码解失调的用于增加赖氨酸和苏氨酸产量的天冬氨酸激酶或二氢吡啶二羧酸(DHDP)合酶,以及用于增加色氨酸产量的邻氨基苯甲酸合酶的基因。可通过引入减少或消除基因表达的DNA序列,减少氨基酸的分解代谢,所述基因编码催化分解代谢途径步骤的酶如赖氨酸-酮戊二酸还原酶 
可用多种方式改变谷粒的蛋白质组成以改善氨基酸的平衡,包括提高天然蛋白质的表达,降低那些组成较差的蛋白质的表达,改变天然蛋白质的组成,或者引入编码具有优良组成的全新蛋白质的基因。可引入DNA, 降低贮存蛋白的玉米醇溶蛋白家族成员的表达。该DNA可编码核酶或反义序列,针对削弱玉米醇溶蛋白的表达或者玉米醇溶蛋白(如不透明二号基因产物)表达的调控物。可通过共抑制的现象修饰谷粒的蛋白质组成,即,通过表达经转化所引入的相同结构基因或基因片段来抑制内源基因的表达(Goring 1991)。另外,所引入的DNA可编码降解玉米醇溶蛋白的酶。实现玉米醇溶蛋白表达的减少可以伴随增加具有更期望的氨基酸组成的蛋白质或者增加其他主要种子成分如淀粉。可选地,可引入嵌合基因,其包含具有适当氨基酸组成的天然蛋白质(如,球蛋白之一或玉米的10kD玉米醇溶蛋白)的编码序列,以及启动子或设计的用以提高所述蛋白表达的其他调控序列。所述基因的编码序列可包括必需氨基酸的额外的或代替的密码子。此外,可使用从其他物种中所获得到编码序列,或者,部分地或全部合成的序列,编码所设计的用于提高种子的氨基酸组成的完全独特的肽序列。 
引入改变谷粒油含量的基因可以是有价值的。增加油含量可导致增加用于饲料和食物的种子的代谢能含量和密度。所引入的基因可编码除去或减少脂肪酸或脂类生物合成中的限速酶或调控步骤的酶。这类基因可包括,但不限于,编码乙酰辅酶A羧化酶、ACP-酰基转移酶、β-酮脂酰-ACP合酶,以及其他具有公知的脂肪酸生物合成活性的那些。其他可以是编码不具有酶促活性的蛋白质如酰基载体蛋白的基因。另外的实例包括2-酰基转移酶、油质蛋白丙酮酸脱氢酶复合物、乙酰辅酶A合成酶、ATP柠檬酸裂合酶、ADP-葡糖焦磷酸化酶和肉毒碱-CoA-乙酰-CoA穿梭体的基因。期望与油生物合成相关的基因的表达将靶向质粒,使用质粒转运肽序列,优选在种子胚中表达。可引入改变油中存在的脂肪酸的平衡的基因,提供更健康或更有营养的饲料。所引入的DNA也可编码阻断与脂肪酸生物合成有关的酶表达的序列,如下面所描述的,改变谷粒中存在的脂肪酸的比例。 
可引入增强谷粒淀粉成分的营养价值的基因,例如,通过增加支链度,通过延迟其代谢导致改善奶牛中淀粉的利用。 
除了影响谷粒的主要成分,可引入基因影响用于饲料或食品的谷粒的 多种其他营养、加工或其他品质方面。例如,可增加或降低谷粒的色素沉着。在某些动物饲料中黄色色素沉着的增强和稳定性是期望的,并且可通过引入基因消除其生产中的限速步骤从而导致增加叶黄素和胡萝卜素的生产而实现。这类基因可编码改变形式的八氢番茄红素合酶、八氢番茄红素去饱和酶,或番茄红素合酶。可选地,对于许多食物产品的生产来说,期望无色素沉着的白色玉米,可通过引入阻断或消除色素产生途径中的步骤的DNA生产。 
含有一些谷物谷粒的饲料或食物具有不足量的维生素,并且必需予以补充以提供适当营养值。可预想在种子中引入增强维生素生物合成的基因,包括,例如,维生素A、E、B12、胆碱等。例如,玉米粒也不具有对于最佳营养值足够的矿物含量。影响含磷、硫、钙、镁、锌和铁的化合物的累积或可用性的基因将是有价值的。实例可以是引入减少植酸生产或者编码增强植酸分解的植酸酶的基因。这些基因将增加饮食中可利用的磷酸盐的水平,减少补充矿物磷酸盐的需要。 
可描述许多改善用于饲料和食物目的的谷物的其他实例。改善可以甚至不必涉及谷粒,但可以,例如,改善谷粒的青贮饲料价值。为实现此目的而引入的DNA可以包括改变木质素生产的序列,如导致与对牲畜有优良饲养价值的“褐色中脉”表型的那些。 
除了直接改善饲料或食物价值,也可引入基因改善谷粒加工和提高由加工所产生的产品的价值。加工某些谷粒如玉米的主要方法是湿磨法。可通过表达新基因提高效率并减少加工成本,如通过减少浸泡时间改良玉米。 
提高湿磨产品的价值可包括改变淀粉、油、玉米谷蛋白粗粉或玉米谷蛋白饲料成分的量或质。可通过鉴定和消除淀粉生物合成中的限速步骤或者通过降低谷粒其他成分的水平导致淀粉比例增加,提高淀粉含量。前者的实例可以是引入编码具有改变的调控活性或者以更高水平表达的ADP-葡萄糖焦磷酸化酶的基因。后者的实例可包括,例如,仁发育晚期所表达的蛋白质或油生物合成的选择性抑制剂。 
可通过改变直链淀粉与支链淀粉的比例、淀粉分子的大小,或者它们 的分支模式,有益地改变淀粉的特性。通过这些改变,可修饰广泛的特性,包括但不限于,胶凝化作用温度、胶凝化作用的热度、膜和浆糊的澄清度、理论特性等的改变。为了实现这些特性的改变,可单独或联合引入编码结合颗粒体的或可溶性淀粉合酶活性或者分支酶活性的基因。也可利用DNA如反义构建体降低这些酶的内源活性水平。所引入的基因或构建体可具有调控序列,它们在淀粉生物合成和淀粉颗粒发育的特定时间间隔表达。此外,引入和表达导致淀粉分子的葡萄糖部分的体内衍生化或其他修饰的基因可以是可取的。可预见任何分子的共价附着,仅受限于淀粉颗粒体中催化衍生化的酶的存在以及适当底物的可及性。重要衍生化的实例可包括添加官能团,如胺、羧基或磷酸基团,其提供随后体外衍生化的位点或者通过引入离子电荷影响淀粉特性。其他修饰的实例可包括葡萄糖单元的直接改变,如丧失羟基或它们氧化为醛或羧基。 
油是玉米和其他谷粒湿磨的另一种产品,可通过基因的引入和表达提高其价值。可通过所述用于上述饲料和食物的方法提高可通过湿磨提取的油量。也可改变油特性以提高其在烹饪油、起酥油、润滑剂或其他油衍生产品的生产以及使用中的性能,或者当在食物相关应用中使用时,改良其健康属性。也可合成新的脂肪酸,经提取可用作化学合成体的起始材料。可通过改变油中存在的脂肪酸的类型、水平或脂质排列,完成油特性的改变。这依次可通过添加编码催化新脂肪酸及具有新脂肪酸的脂质合成的酶的基因,或者通过提高天然脂肪酸的水平,而可能地减少前体的水平来完成。可选地,可引入DNA序列减慢或阻断脂肪酸生物合成步骤,导致增加前体脂肪酸中间体。可添加的基因包括去饱合酶、环氧酶、水合酶、脱水酶,以及催化涉及脂肪酸中间体反应的其他酶的基因。可被阻断的催化步骤的典型实例包括硬脂酸去饱和作用成为油酸以及油酸去饱和作用成为亚麻酸,阻断后将导致硬脂酸和油酸分别累积。 
也可通过引入基因以获得新植物,完成其他主要谷类湿磨产品、谷蛋白粗粉和谷蛋白饲料的改良。典型的可能性包括但不限于上述用于改良食物和饲料价值的那些。 
另外,可进一步考虑利用所述植物生产或制造以前在植物中根本不生产,或者不以同样的水平生产的有用生物化合物。可通过转化方法引入和表达基因来制备生产这些化合物的新植物。可能性包括,但不限于,目前通过任何生物体所生产的任何生物化合物如蛋白质、核酸、初级和中间体代谢物、碳水化合物多聚体等。化合物可通过植物生产、经收获和/或加工提取,并用于任何目前公认的有用目的,例如药物、香料、工业用酶。 
举例说明转基因植物中可以由所引入的基因潜在编码的谷粒性状或性质范围的另外的可能性包括通过引入增强γ玉米醇溶蛋白合成的基因,具有出于运输目的的较低破损敏感性或者当通过干磨加工时具有更大粗碾大小的谷粒;通过增加果皮厚度的基因而使爆米花具有改进的爆裂品质和膨胀体积;通过引入有效阻断涉及色素产生途径的酶表达的基因而使玉米具有用于食物用途的更白的谷粒;以及通过引入影响口味的基因如甜玉米的皱缩基因(编码蔗糖合酶)提高酒精饮料或甜玉米的品质。 
1.7块茎或种子组成或品质 
可以在种子或块茎中特别有利地表达多种性状以改善组成或品质。这类性状包括但不限于: 
-表达在食物和饲料行业中使用的代谢酶,例如,植酸酶和纤维素酶。尤其优选的是如编码微生物植酸酶的人工cDNA的核酸(GenBank登录号:A19451)或其功能等同物。 
-表达使精细化学品如生育酚、生育三烯酚(tocotrienols)或类胡萝卜素累积的基因。可提及的一个实例是八氢番茄红素去饱和酶。优选编码喇叭水仙(Narcissus pseudonarcissus)八氢番茄红素去饱和酶的核酸(GenBank登录号:X78815)或其功能等同物。 
-通过表达脂肪酸延长酶和/或去饱和酶生产滋养物(nutraceutical)如,例如,多聚不饱和脂肪酸(例如,花生四烯酸、二十碳五烯酸或二十二碳六烯酸),或者生产具有改良的营养价值的蛋白质如,例如,具有高含量的必需氨基酸(例如,巴西坚果的高甲硫氨酸2S白蛋白基因)。优选编码巴 西坚果(Bertholletia Bertholletia)高甲硫氨酸2S白蛋白(GenBank登录号:AB044391)、小立宛藓(Physcomitrella patens)Δ6-酰基-脂质去饱合酶(GenBank登录号:AJ222980;Girke等(1998)Plant J 15:39-48)、高山被孢霉(Mortierella alpina)Δ6-去饱合酶(Sakuradani等1999Gene238:445-453)、秀丽隐杆线虫(Caenorhabditis elegans)Δ5-去饱合酶(Michaelson等1998,FEBS Letters 439:215-218)、秀丽隐杆线虫Δ5-脂肪酸去饱和酶(des-5)(GenBank登录号:AF078796)、高山被孢霉Δ5-去饱合酶(Michaelson等JBC 273:19055-19059)、秀丽隐杆线虫Δ6-延长酶(Beaudoin等2000,PNAS 97:6421-6426)、小立宛藓Δ6-延长酶的核酸(Zank等2000,Biochemical Society Transactions 28:654-657),或者这些的功能等同物。 
-生产用于工业目的(例如,酶,如脂肪酶)或者作为药物(如,例如,抗体、凝血因子、干扰素、淋巴因子、集落刺激因子、纤溶酶原激活物、激素或疫苗,如Hood EE,Jilka JM(1999)Curr Opin Biotechnol10(4):382-6;Ma JK,Vine ND(1999)Curr Top Microbiol Immunol236:275-92所述)的高品质蛋白质和酶。例如,可在转基因玉米植物中大规模生产重组鸡白蛋白的抗生物素蛋白和细菌β-葡糖醛酸酶(GUS)(Hood等(1999)Adv Exp Med Biol 464:127-47综述)。 
-在细胞中获得增加的贮存力,所述细胞通常包括较少的贮藏蛋白或贮藏类脂,以增加这些物质的产量为目的,例如通过表达乙酰辅酶A羧化酶。优选的核酸是编码紫花苜蓿(Medicago sativa)乙酰辅酶A羧化酶(ACCase)(GenBank登录号:L25042)的那些,或其功能等同物。 
-优选减少马铃薯块茎内α-葡聚糖L-型块茎磷酸化酶(GLTP)或α-葡聚糖H-型块茎磷酸化酶(GHTP)活性的水平(见US 5,998,701)。特别是当在7℃以下的温度贮藏时,在显示降低的GLTP或GHTP酶活性的块茎中,降低马铃薯块茎中淀粉向糖的转化。减少马铃薯中冷变甜使马铃薯能贮藏在更冷的温度,导致延长休眠、减少疾病发生,并增加保存期限。可通过如使用同源反义或双链RNA,使用共抑制,调控沉默序列这类抑制基因表达 的技术完成马铃薯块茎内GLTP或GHTP活性的降低。具有改善的冷藏特性的马铃薯植物,包括用具有有效连接于DNA序列的TPT启动子序列的表达盒转化的马铃薯植物,其中该DNA序列包括编码选自α-葡聚糖L-型块茎磷酸化酶(GLTP)或α-葡聚糖H-型磷酸化酶(GHTP)的葡聚糖磷酸化酶基因的至少20个核苷酸。 
有利基因更多实例在例如Dunwell JM,Transgenic approaches to cropimprovement,J Exp Bot.2000;51Spec No;pages 487-96中提及。 
1.7植物农艺学特征 
决定可在何处种植植物的因素中的两个是生长季节期间的日平均温度和霜冻之间的时间长度。在可种植特定植物的区域内,在允许生长到成熟和收获的最大时间上有不同的限制。选择在特定区域中种植的植物能够在具有最大可能收获量的所需时间内成熟并脱水到可收获的含水量的能力。因此,发展用于不同种植地点的具有不同成熟期的植物。除了需要充分脱水以允许收获外,期望在田间发生最大程度的干燥以便将收获后需要另外干燥的能量数降到最小。同样,如果谷粒可更容易地脱水,那么生长和仁填充可利用的时间就越多。可鉴定影响成熟和/或脱水的基因并使用转化技术引入到植物品系中,以创造适于不同生长地点或者同一生长地点但在收获时具有提高的产量与水分比的新品种。参与植物发育调控的基因的表达可尤其有用,例如,在植物中已鉴定的无舌叶(liguleless)和粗糙叶鞘基因。 
可将改善耐倒伏性和其他植物生长特性的基因引入到植物中。例如,表达赋予更强壮的茎、改良的根系,或者防止或减少落穗的新基因对于种植玉米的农民来说非常有价值。通过,例如,增加光分布和/或遮光作用增加可利用的光同化作用总量的基因的引入和表达将是有利的。另外,增加光合作用效率和/或叶冠的基因的表达将进一步增加谷物生产力。这类方法将允许增加田间的植物群。 
营养老化的晚季延迟将增加同化物进入谷粒的流量并因此增加产量。植物内与“保持绿色”有关的基因的过表达或者延迟老化的任何基因的表 达将是有利的。例如,已在草甸羊茅(Festuca pratensis)中鉴定了非黄化突变体(Davies 1990)。该基因以及其他基因的表达可防止叶绿体的未成熟分解并且因此维持林冠功能。 
1.8养分利用 
利用可用养分和矿物质的能力可能是许多植物生长中的限制因素。提出可通过引入新基因改变养分摄取、耐受极端pH、通过植物的转移、贮存池和代谢活性的可用性。这些修饰将允许植物更有效地利用可用养分。期望例如,增加在植物中正常存在并且涉及养分利用的酶的活性,将增加养分的可利用性。这类酶的实例将是植酸酶。也期望,新基因的表达可使以前不易获得的营养源变得可利用,例如,从更复杂的分子,可以是高分子中释放有营养价值的成分的酶。 
1.9雄性不育 
雄性不育可用于生产杂种种子。已提出可通过新基因的表达产生雄性不育。例如,已证明表达编码干扰雄性花序和/或配子体发育的蛋白质的基因导致雄性不育。已证明在转基因烟草和油料种子油菜的花药中表达的嵌合核糖核酸酶基因导致雄性不育(Mariani 1990)。例如,在玉米中发现许多赋予胞质雄性不育的突变。特别地,称作T胞质的一种突变也与对南方玉米条斑病的敏感性有关。DNA序列,称作TURF-13(Levings 1990),被鉴定为与T胞质有关。可通过转化引入TURF-13以便将雄性不育和疾病敏感性区开。由于必需能恢复雄性生育力用于育种目的和用于谷物生产,因此也可引入编码恢复雄性生育力的基因。 
1.10.非蛋白质表达序列 
1.10.1RNA表达 
可出于表达起影响植物表型而不被翻译成蛋白质的功能性RNA转录物的目的而将DNA引入到植物中。两个实例是反义RNA和具有核酶活性的 RNA。两者都可降低或消除天然的或所引入的植物基因的表达。 
可构建或分离当被转录时产生与靶向信使RNA的全部或部分互补的反义RNA或双链RNA的基因。反义RNA减少产生信使RNA的多肽产物。多肽产物可以是由植物基因组所编码的任何蛋白质。上述基因将被称作反义基因。可因此通过转化方法将反义基因引入到植物内以产生具有减少所选目的蛋白质表达的新的转基因植物。例如,蛋白质可以是植物中催化反应的酶。酶活性的降低可减少或消除反应的产物,其中产物包括植物中任何酶促合成的化合物如脂肪酸、氨基酸、碳水化合物、核酸等。可选地,蛋白质可以是贮藏蛋白,如玉米醇溶蛋白,或者结构蛋白,其表达降低可分别导致种子氨基酸组成的改变或者植物形态改变。上面所引用的可能性仅通过实例的方式提供,并不代表申请的全部范围。 
尤其优选的是通过本发明的表达盒之一表达反义RNA或双链RNA。也可使用正义RNA的表达用于基因沉默(共抑制)。该RNA优选是非翻译的RNA。通过双链RNA(“双链RNA干扰”;dsRNAi)的基因调控是本领域中公知的并在包括植物的多种生物体中有描述(例如,Matzke 2000;Fire A等1998;WO 99/32619;WO 99/53050;WO 00/68374;WO 00/44914;WO 00/44895;WO 00/49035;WO 00/63364)。 
也可构建或分离基因,当被转录产生RNA酶或核酶时,其可作为内切核糖核酸酶并催化切割具有所选序列的RNA分子。所选信使RNA的切割可导致减少产生它们所编码的多肽产物。这些基因可用于制备具有它们的新的转基因植物。转基因植物可具有降低的多肽水平,包括但不限于上面所引用的可通过反义RNA影响的多肽。 
也可以引入通过共抑制的机制减少天然基因产物表达的新基因以产生新的转基因植物。已在烟草、番茄和矮牵牛花(Goring 1991;Smith 1990;Napoli 1990;van der Krol 1990)中证明,天然基因的正义转录物的表达将以与所观察到的反义基因类似的方式减少或消除天然基因的表达。所引入的基因可编码靶向天然蛋白质的全部或一部分,但是其翻译对于减少该天然蛋白质的水平可以不是必需的。 
1.10.2非RNA表达 
例如,可将包括那些转座因子如Ds、Ac或Mu的DNA元件插入到基因内并导致突变。为了灭活(或者激活)基因并和由此“标记”特定性状,可插入这些DNA元件。在这种情况下,转座元件并不导致标记突变的不稳定性,因为元件的利用不依赖于其是否能在基因组中移动。一旦标记期望的性状,那么可使用所引入的DNA序列克隆相应的基因,例如,使用所引入的DNA序列作为PCR引物连同PCR基因克隆技术(Shapiro,1983;Dellaporta 1988)。一旦鉴定,可如期望的那样分离、克隆和操作特定性状的整个基因,包括控制或调控区。所引入到生物体内用于基因标记目的的DNA元件的利用不依赖于DNA序列,并且不依赖DNA序列的任何生物活性,即,转录成RNA或翻译成蛋白质。DNA元件的唯一功能是破坏基因的DNA序列。 
期望可将不表达的DNA序列,包括新合成的序列引入到细胞内作为那些细胞和植物及其种子的专有“标签”。由于该标签DNA的唯一功能是鉴定生物体的起源,因此对于标签DNA元件来说,不必破坏宿主生物体内源基因的功能。例如,可将独特的DNA序列引入到植物内并且该DNA元件将鉴定从该标记来源中所产生的所有细胞、植物和这些细胞的子代。认为纳入标签DNA将能够从未标记的种质中区分专有种质或其衍生种质。 
可引入的另一可能元件是基质附着区元件(MAR),如鸡溶菌酶A元件(Stief 1989),其可位于可表达的目的基因的周围以增加该基因的总体表达,并消除掺入到植物基因组内的位置依赖效应(Stief 1989;Phi-Van 1990)。 
可期望在本发明范围内用于与根据本发明的启动子序列有效连接的其他目的核苷酸序列是分离的核酸分子,例如,DNA或RNA,包括根据本发明的包含在特定组织中偏好表达的开放读框的植物核苷酸序列,即,种子偏好、根偏好、绿色组织(叶和茎)偏好、圆锥花序偏好,或花粉偏好,或者是组成型表达。 
2.标记基因 
为了改善鉴定转化体的能力,可期望使用选择性或筛选性标记基因作为可表达的目的基因或在可表达的目的基因之外加入。“标记基因”是赋予表达标记基因的细胞独特表型的基因,并因此允许这类转化的细胞与不具有标记的细胞相区分。这种基因可编码选择性或筛选性标记,取决于标记是否赋予可用于通过化学方法,即通过使用选择剂(例如,除草剂、抗生素等)“选择”的性状,或其是否仅仅是可通过观察或测试,即通过“筛选”(例如,R-基因座性状、绿色荧光蛋白(GFP))鉴定的性状。当然,适当标记基因的许多实例是本领域已知的并可在本发明的实践中使用。 
术语选择性或筛选性标记基因内所包括的还有编码“分泌性标记物”的基因,可检测其分泌作为鉴定或选择转化细胞的手段。实例包括编码可通过抗体相互作用鉴定的分泌性抗原的标记物,或者甚至可通过它们的催化活性予以检测的分泌性酶。分泌性蛋白质可分成许多类,包括可检测的(例如通过ELISA)小的可扩散的蛋白质;可在细胞外溶液中检测到的小的活性酶(例如,α-淀粉酶、β-内酰胺酶、膦丝菌素酰基转移酶);以及插入或陷于细胞壁内的蛋白质(例如,包括如在伸展蛋白或烟草PR-S的表达单元中所发现的前导序列的蛋白质)。 
关于选择性分泌性标记,认为使用编码隐蔽在细胞壁中的蛋白质,并且其中蛋白质包括独特表位的基因是特别有利的。这类分泌的抗原标记将理想地使用将在植物组织中提供低背景的表位序列,赋予有效表达并靶向穿过质膜的启动子-前导序列,并产生结合在细胞壁中且抗体可及的蛋白质。经修饰以包括独特表位的正常分泌的胞壁蛋白质将满足所有这些要求。 
适于以该方式修饰的蛋白质的一个实例是伸展蛋白,或者富含羟脯氨酸的糖蛋白(HPRG)。例如,在分子生物学、表达和蛋白质结构方面充分表征了玉米HPRG(Steifel 1990)分子。然而,可通过添加抗原位点修饰多种ultilane和/或富含甘氨酸的胞壁蛋白(Keller 1989)中的任何一个以产生筛选性标记。 
分泌性筛选性标记的一个示范性实施方案涉及使用编码胞壁蛋白 HPRG的玉米序列,对其进行修饰以包括鼠白介素前区(pro-region)的15个残基表位,然而,实际上在这种实施方案中可使用任何可检测的表位,如选自本领域技术人员已知的各种抗原-抗体组合。然后可使用与产色素或荧光附属物组合的抗体直接地检测独特的细胞外表位。 
可通过使用bar和/或GUS基因,也可通过使用多种其他标记详细地举例说明本发明公开的元件。当然,除了这里在下面所阐述的,根据本发明公开,许多其他可以的选择性和/或筛选性标记基因对于本领域技术人员来说将是显而易见的。因此,将会理解,下面的讨论是示范性的而不是详尽的。根据这里所公开的技术和本领域已知的一般重组技术,本发明使得可将任何基因(包括标记基因)引入到受体细胞内以产生转化植物。 
2.1选择性标记 
本领域中已知多种选择性标记适于植物转化。这类标记可包括,但不限于: 
2.1.1负选择性标记 
负选择性标记赋予对杀生物剂化合物的抗性,所述化合物例如代谢抑制剂(例如,2-脱氧葡萄糖-6-磷酸,WO 98/45456)、抗生素(例如,卡那霉素、G418、博来霉素或潮霉素)或者除草剂(例如,膦丝菌素或草苷膦)。转化的植物材料(例如,细胞、组织或小植物)表达标记基因,能够在存在抑制未转化野生型组织生长的相应的选择化合物(例如,抗生素或除草剂)的浓度时发育。尤其优选的负选择性标记是赋予除草剂抗性的那些。可提及的实例是: 
-膦丝菌素酰基转移酶(PAT;也称作
Figure BDA00002496098200901
抗性;bar;de Block1987;Vasil 1992,1993;Weeks 1993;Becker 1994;Nehra 1994;Wan&Lemaux 1994;EP 0333033;US 4,975,374)。优选的是吸水链霉菌(Streptomyces hygroscopicus)的bar基因或者绿色产色链霉菌(Streptomyces viridochromogenes)的pat基因。PAT灭活除草剂双丙氨磷、 膦丝菌素(PPT)中的活性成分。PPT抑制谷氨酰胺合酶(Murakami 1986;Twell 1989),导致氨迅速累积和细胞死亡。 
-赋予草苷膦
Figure BDA00002496098200911
(N-(膦酸甲基)甘氨酸)抗性的改变的5-烯醇式丙酮酸莽草酸3-磷酸合酶(EPSP合酶)(Hinchee 1988;Shah 1986;Della-Cioppa1987)。如果使用突变体EPSP合酶基因,那么可通过掺入适当的叶绿体转运肽CTP获得额外的益处(EP-A10218571)。 
-草苷膦
Figure BDA00002496098200912
降解酶(草苷膦
Figure BDA00002496098200913
氧化还原酶;gox), 
-灭活茅草枯
Figure BDA00002496098200914
的脱卤素酶(deh) 
-灭活磺酰脲和/或咪唑啉酮的乙酰乳酸合酶(ahas或ALS;例如突变的ahas/ALS变体,具有例如,S4、XI12、XA17和/或Hra突变(EP-A1154204) 
-降解溴苯腈
Figure BDA00002496098200915
的睛水解酶(bxn;Stalker 1988) 
-卡那霉素抗性基因或者遗传霉素(G418)抗性基因(NPTII;NPT或neo;Potrykus 1985),编码例如,新霉素磷酸转移酶(Fraley 1983;Nehra 1994) 
-赋予2-脱氧葡萄糖抗性的2-脱氧葡萄糖-6-磷酸磷酸酶(DOGR1-基因产物;WO 98/45456;EP 0807836)(Randez-Gil 1995)。 
-潮霉素磷酸转移酶(HPT),其介导对潮霉素的抗性(Vanden Elzen1985)。 
-赋予氨甲喋呤抗性(Thillet 1988)的改变的二氢叶酸还原酶(Eichholtz1987); 
-赋予5-甲基色氨酸抗性的突变的邻氨基苯甲酸合酶基因。 
赋予抗生素抗性的细菌起源的其他负选择性标记基因包括赋予抗生素壮观霉素抗性的aadA基因、庆大霉素乙酰转移酶、链霉素磷酸转移酶(SPT)、氨基糖苷-3-腺嘌呤转移酶和博来霉素抗性决定子(Hayford 1988;Jones 1987;Svab 1990;Hille 1986)。 
尤其优选的负选择性标记赋予对由D-氨基酸象例如,D-丙氨酸和D-丝氨酸所施加的毒性效应抗性(WO 03/060133;Erikson 2004)。本文尤其优选的负选择性标记是来自瘦弱红酵母(Rhodotorula gracilis)的daol基因(EC:1.4.3.3:GenBank登录号:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶 (D-丝氨酸脱氨酶)[EC:4.3.1.18;GenBank登录号:J01603]。 
表达这类标记基因的转化的植物材料(例如,细胞、胚、组织或小植物)能在存在抑制未转化野生型组织生长的相应的选择化合物(例如,抗生素或除草剂)的浓度时发育。可以按常规方式繁殖和杂交所得的植物。为了确保基因组整合是稳定和遗传的,应当种植两代或多代。相应的方法已有描述(Jenes 1993;Potrykus 1991)。 
此外,可使用报道基因以允许视觉筛选,这可能需要或可能不需要(由报告基因类型决定)补充底物作为选择性化合物。 
对于多种负选择性标记基因,可使用多种时间方案。假如是抗性基因(例如,抗除草剂或D-氨基酸),优选在约4周的整个愈伤组织诱导期,和进入再生至少超过4周应用选择。这样的选择方案可应用于所有选择方案。此外,也可(尽管不是明确优选的)在包括生根的整个再生方案中一直保持该选择。 
例如,如果用膦丝菌素抗性基因(bar)作为选择性标记,那么培养基中可包括约1至50mg/L浓度的膦丝菌素。例如,如果用dao1基因作为选择性标记,那么培养基中可包括约3至100mg/L浓度的D-丝氨酸或D-丙氨酸。一般的选择浓度是20至40mg/L。例如,如果用突变的ahas基因作为选择性标记,那么培养基中可包括约3至100mg/L浓度的PURSUITTM。一般的选择浓度是20至40mg/L。 
2.1.2正选择性标记 
此外,可使用正选择性标记。象根癌农杆菌的异戊烯转移酶的基因(菌株:PO22;Genbank登录号:AB025109)可作为细胞分裂素生物合成的关键酶,有利于转化植物的再生(例如,通过在无细胞分裂素的培养基上选择)。已描述了相应的选择法(Ebinuma 2000a,b)。例如,在EP-A 0 601 092中描述了另外的正选择性标记,与未转化的植物相比,其赋予转化植物生长优势。生长刺激选择性标记可包括(但不应当限于)β-葡糖醛酸糖苷酶(与例如,细胞分裂素葡糖苷酸组合)、甘露醇-6-磷酸异构酶(与甘露糖组合)、UDP- 半乳糖-4-差向异构酶(与例如,半乳糖组合),其中尤其优选的是与甘露糖组合的甘露醇-6-磷酸异构酶。 
2.1.3反选择性标记 
反选择性标记优选适于选择具有包括所述标记的明确缺失序列的生物体(Koprek 1999)。反选择性标记的实例包括胸苷激酶(TK)、胞嘧啶脱氨酶(Gleave 1999;Perera 1993;Stougaard 1993)、细胞色素P450蛋白(Koprek1999)、卤代链烷脱卤素酶(Naested 1999)、iaaH基因产物(Sundaresan1995)、胞嘧啶脱氨酶codA(Schlaman & Hooykaas 1997)、tms2基因产物(Fedoroff & Smith 1993),或α-萘乙酰胺(NAM;Depicker 1988)。反选择性标记可用于构建转座子标记系。例如,通过用反选择性标记来标记自主转座元件如Ac、Master Mu或者En/Spn,可选择自主元件没有稳定整合到基因组内的转化体。例如,当期望自主元件瞬时表达以反式激活缺陷型可转座元件如Ds的转座,而不期望自主元件稳定整合时,这将是期望的。为了稳定缺陷型元件,可以不期望存在自主元件,即,防止其进一步转座。然而,建议如果期望植物中自主转座元件的稳定整合,那么负选择性标记的存在可使得在育种过程期间消除自主元件成为可能。 
2.2.可筛选标记 
可使用的可筛选标记包括,但不限于,β-葡糖醛酸糖苷酶(GUS)或编码已知多种显色底物的酶的uidA基因;R-基因座基因,其编码产物调控植物组织中花青苷色素(红色)生产(Dellaporta 1988);β-内酰胺酶基因(Sutcliffe 1978),其编码已知多种显色底物的酶(例如,PADAC,产色素头孢菌素);编码可转化显色儿茶酚的儿茶酚双加氧酶的xyIE基因(Zukowsky1983);α-淀粉酶基因(Ikuta 1990);酪氨酸酶基因(Katz 1983),其编码能使酪氨酸氧化成DOPA和多巴醌的酶,DOPA和多巴醌依次缩合形成容易检测的化合物黑色素;β-半乳糖苷酶基因,其编码有显色底物的酶;荧光素酶(lux)基因(Ow 1986),其允许生物发光检测;或者甚至水母发光蛋白基 因(Prasher1985),其可用于钙敏感的生物发光检测,或者绿色荧光蛋白基因(Niedz 1995)。 
认为玉米R基因复合物的基因作为筛选标记特别有用。玉米中的R基因复合物编码在大部分种子和植物组织中起调控花青苷色素生产的蛋白质。将R基因复合物的基因应用于玉米转化,因为在转化细胞中该基因的表达不伤害细胞。因此,引入到这类细胞内的R基因将导致红色色素的表达,如果稳定整合的话,可根据红色部分进行视觉评分。如果玉米株系携带的花青苷生物合成途径中编码酶促中间体的基因(C2、A1、A2、Bz1和Bz2)是显性的quadrature.ultila,但是在R基因座上携带隐性等位基因,那么该株系的任何细胞用R的转化将导致形成红色色素。示范性的株系包括含有rg-Stadler等位基因的Wisconsin 22,以及TR112,是r-g、b、P1的K55衍生物。可选地,如果将C1和R等位基因一起引入的话,那么可利用玉米的任何基因型。 
还提出,为了提供控制嵌合基因表达的机理,可在嵌合构建体中使用R基因调控区。已知R基因座上的表型表达比任何其他基因座上更多样(Coe1988)。认为从结构R基因的5’区所获得的调控区在指导基因的表达中将是有价值的,例如,昆虫抗性、干旱抗性、除草剂耐受性或者其他蛋白质编码区。对于本发明的目的,据信可成功地使用多种R基因家族成员中的任何一个(例如,P、S、Lc,等)。然而,最优选的通常是Sn(特别地是Sn:bol3)。Sn是R基因复合物的主要成员,并且功能上与R和B基因座相似,因为Sn控制某些幼苗和植物细胞中花青苷色素的组织特异性沉积,因此,其表型与R相似。 
期望在本发明中使用的另一可筛选标记是由lux基因所编码的萤火虫荧光素酶。可检测转化细胞中是否存在lux基因,使用例如,X射线胶片、闪烁计数、荧光分光光度法、低光视频照相、光子计数照相机或多孔发光测定法。也预想,可发展该系统用于生物发光的群体筛选,如在组织培养板上,或者甚至用于整个植物筛选。如果期望使用筛选标记基因如lux或GFP,那么可通过在筛选标记基因和选择性标记基因之间产生基因融合而 获益,例如,GFP-NPTII基因融合。这将允许,例如,选择转化细胞后筛选转基因植物或种子。 
3.示范性的DNA分子 
本发明提供包含植物核苷酸序列的分离的核酸分子,例如,DNA或RNA,所述植物核苷酸序列包含在特定植物组织(例如,根和仁)中偏好表达或者组成型表达的开放读框或其启动子。 
这些启动子包括,但不限于,组成型、诱导型、时间调控的、发育调控的、空间调控的、化学调控的、胁迫应答性、组织特异性、病毒性和合成性启动子。已知启动子序列是强启动子或弱启动子。强启动子提供高水平的基因表达,而弱启动子提供非常低水平的基因表达。诱导型启动子应答外源所添加的试剂或者环境或发育刺激,开启和关闭基因表达。可将细菌启动子如Ptac启动子诱导到不同的基因表达水平,视添加到转化的细菌细胞中的异硫丙基半乳糖苷水平而定。对于异源核酸是强启动子的分离的启动子序列是有利的,因为其提供足够的基因表达水平以允许很容易地检测和选择转化细胞并且当期望时,提供高水平的基因表达。 
在植物启动区内,有几个结构域是启动子的完整功能所必需的。这些结构域中的第一个紧靠结构基因的上游,并形成含有共有序列的“核心启动子区”,通常是紧靠该基因上游的70个碱基对。核心启动子区含有特征性的CAAT和TATA盒加上周围序列,并且代表规定结构基因的转录起始点的转录起始序列。 
核心启动子区的存在定义这样的序列作为启动子:如果该区缺乏,那么启动子是无功能的。此外,核心启动子区不足以提供全部启动子活性。核心上游的一系列调控序列构成启动子的其余部分。调控序列决定表达水平、表达的空间和时间模式,并且对于启动子的重要子集而言,决定诱导条件下的表达(通过外界因素调控,如光、温度、化学品、激素)。 
可通过其他遗传策略进一步调控嵌合的反式作用病毒复制蛋白的受控表达。例如,如Odell等1990所描述的Cre介导的基因激活。因此,在启动 子和复制蛋白编码序列之间的lox位点所结合的含3’调控序列的DNA片断阻断嵌合复制基因从该启动子的表达,可以通过Cre介导的切割除去所述DNA片断,导致反式复制基因的表达。在这种情况中,嵌合Cre基因,嵌合的反式作用复制基因,或者两者都可在组织和发育特异性的或者诱导型启动子的控制下。可选的遗传策略是使用tRNA阻遏基因。例如,tRNA阻遏基因的调控表达可如Ulmasov等1997所述有条件地控制含有适当终止密码子的反式作用复制蛋白编码序列的表达。此外,嵌合tRNA阻遏基因、嵌合反式作用复制基因,或者两者都可在组织和发育特异性的或者诱导型启动子的控制下。 
常常期望在生物体的整个细胞中具有DNA序列以不依赖组织的方式连续的或诱导型表达。例如,可通过植物基因组的基因操作以包括有效连接于异源病原体抗性基因的连续启动子,使得病原体抗性蛋白在整个植物组织中连续表达,从而增强植物t6对由土壤和空气传播的病原体感染的抗性。 
可选地,可期望在植物组织内抑制天然DNA序列的表达以达到期望的表型。在这种情况中,可以通过转化植物,使其包含有效连接于反义核苷酸序列的不依赖组织的组成型启动子,从而反义序列的组成型表达产生RNA转录物,干扰天然DNA序列的mRNA翻译,来实现这类抑制。 
为了定义最小启动子区,通过本领域公知的重组DNA技术从目的基因的5’区除去代表启动子区的DNA片段,并有效连接于标记(报道)基因的编码序列。将报道基因有效连接于启动子的下游,使得在启动子开始的转录物继续通过报道基因。报道基因通常编码很容易测定的蛋白质,包括,但不限于,氯霉素乙酰转移酶(CAT)、β-葡糖醛酸糖苷酶(GUS)、绿色荧光蛋白(GFP)、β-半乳糖苷酶(β-GAL)和荧光素酶。 
接着通过本领域公知的转染技术将含有在启动子控制下的报道基因的构建体引入到适当的细胞类型中。为了测定报道蛋白,制备细胞裂解物并用本领域公知的适当的测定方法测定报道蛋白。例如,如果CAT是选择的报道基因,那么将用含有在所研究启动子控制下的CAT的构建体转染的细 胞裂解物与同位素标记的氯霉素和乙酰辅酶A(乙酰CoA)混合。CAT酶将乙酰基从乙酰辅酶A转移到氯霉素的2或3位。反应通过薄层层析监控,其从未反应的材料中分离乙酰化的氯霉素。接着通过放射自显影显示反应产物。 
酶活性的水平对应于所制备的酶量,其进而揭示目的启动子的表达水平。可将该表达水平与其他启动子比较以测定所研究启动子的相对强度。为了确保表达水平是由启动子而不是由mRNA的稳定性决定,可直接测定报道基因mRNA的水平,如通过Northern印迹分析。 
一旦检测了活性,那么可使用突变和/或缺失分析以测定启动转录所需的最小区和/或序列。因此,可在启动子区的5’末端和/或启动子区的3’末端缺失序列,以及引入核苷酸取代。然后将这些构建体引入到细胞内并测定它们的活性。 
在一个实施方案中,启动子可以是γ玉米醇溶蛋白启动子、油质蛋白ole16启动子、球蛋白启动子、肌动蛋白I启动子、肌动蛋白cl启动子、蔗糖合成酶启动子、INOPS启动子、EXM5启动子、球蛋白2启动子、b-32,ADPG-焦磷酸化酶启动子、LtpI启动子、Ltp2启动子、油质蛋白ole17启动子、油质蛋白ole18启动子、肌动蛋白2启动子、花粉特异性蛋白质启动子、花粉特异性果胶酸裂合酶启动子、花药特异性蛋白质启动子、花药特异性基因RTS2启动子、花粉特异性基因启动子、绒毡层特异性基因启动子、绒毡层特异性基因RAB24启动子、邻氨基苯甲酸合酶α亚基启动子、α玉米醇溶蛋白启动子、邻氨基苯甲酸合酶β亚基启动子、二氢吡啶二羧酸合酶启动子、Thil启动子、醇脱氢酶启动子、cab结合蛋白启动子、H3C4启动子、核酮糖二磷酸羧化酶加氧酶RUBISCO SS淀粉分支酶启动子、ACC酶启动子、肌动蛋白3启动子、肌动蛋白7启动子、调控蛋白GF14-12启动子、核糖体蛋白L9启动子、纤维素生物合成酶启动子、S-腺苷-L-高半胱氨酸水解酶启动子、超氧化物岐化酶启动子、C激酶受体启动子、磷酸甘油酸变位酶启动子、根特异性RCc3mRNA启动子、葡糖-6磷酸异构酶启动子、焦磷酸-果糖6-磷酸磷酸转移酶启动子、遍在蛋白启动子、β-酮脂酰-ACP合酶启动 子、33kDa光体系11启动子、氧离析蛋白启动子、69kDa液泡ATP酶亚基启动子、金属硫蛋白样蛋白启动子、甘油醛-3-磷酸脱氢酶启动子、ABA-和成熟诱导样蛋白启动子、苯丙氨酸氨裂合酶启动子、腺苷三磷酸酶S-腺苷-L-高半胱氨酸水解酶启动子、α-微管蛋白启动子、cab启动子、PEPC酶启动子、R基因启动子、凝集素启动子、集光复合物启动子、热休克蛋白启动子、查耳酮合酶启动子、玉米醇溶蛋白启动子、球蛋白-1启动子、ABA启动子、生长素结合蛋白启动子、UDP葡糖黄酮糖基转移酶基因启动子、NTI启动子、肌动蛋白启动子、不透明二号启动子、b70启动子、油质蛋白启动子、CaMV 35S启动子、a CaMV 34S启动子、CaMV 19S启动子、组蛋白启动子、膨胀诱导的启动子、豌豆小亚基RuBP羧化酶启动子、Ti质粒甘露碱合酶启动子、Ti质粒胭脂碱合酶启动子、矮牵牛花查耳酮异构酶启动子、富含甘氨酸豆蛋白I启动子、CaMV 35S转录物启动子、马铃薯patatin启动子、或者S-E9小亚基RuBP羧化酶启动子。 
4.本发明转化的(转基因的)植物和制备方法 
植物物种可用本发明的DNA构建体转化,根据本领域公知的方法通过DNA介导的植物细胞原生质体转化,随后从所转化的原生质体再生植物。 
任何能随后克隆繁殖的植物组织,无论通过器官发生或者胚胎发生,都可用本发明的载体转化。术语“器官发生”,如这里所使用的,是指其枝条和根相继从分生组织中心发育的过程;术语“胚胎发生”,如这里所使用的,是指枝条和根以一致的方式(不是相继地)从体细胞或配子一起发育的过程。所选择的特定组织将视可利用的和最适于待转化特定物种的克隆繁殖系统而变化。示范性的组织靶包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、现有的分生组织(例如,顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如,子叶分生组织和终末分生组织)。 
本发明的植物可采取多种形式。植物可以是转化细胞和非转化细胞的嵌合体;植物可以是克隆转化体(例如,转化所有细胞以含有表达盒);植物可包括转化的和未转化的组织的移植物(例如,嫁接到柑桔种中未转化的 接穗上的转化的根状茎)。可通过多种方法增殖转化的植物,如通过克隆增殖或经典育种技术。例如,可将第一代(或T1)转化的植物自交以产生纯合的第二代(或T2)转化的植物,T2植物通过经典育种技术进一步繁殖。可将显性选择性标记(如nptII)与表达盒相连以帮助繁殖。 
因此,本发明提供转化的(转基因的)植物细胞,植物内或植物外(inplanta or ex planta),包括转化的质体或其他细胞器,例如,细胞核、线粒体或叶绿体。本发明可用于转化任何植物物种,包括,但不限于,上述在定义部分中详细说明的植物物种的细胞。优选本发明的转基因植物是作物植物,特别地是谷类(例如,玉米、苜蓿、向日葵、稻、油菜、芸苔、大豆、大麦、大豆、甜菜、棉花、红花、花生、高粱、小麦、栗、烟草等),甚至更优选是玉米、稻和大豆。本发明的其他实施方案涉及这类植物的细胞、细胞培养物、组织、部分(如植物器官、叶、根等)和繁殖材料(如种子)。 
本发明的转基因表达盒可以不仅被包含在植物或植物细胞中,而且也可有利地被包含在其他生物体中,例如细菌。因此,本发明的另一个实施方案涉及包含本发明表达盒的转基因细胞或非人的转基因生物体。优选原核和真核生物体。包括微生物和高等生物体。优选的微生物是细菌、酵母、藻类和真菌。优选的细菌是埃希氏杆菌属(Escherichia)、欧文氏菌属(Erwinia)、农杆菌属、黄杆菌属(Flavobacterium)、产碱菌属(Alcaligenes)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)或蓝细菌属(Cyanobacterim)的那些,如,例如集胞蓝细菌属(Synechocystis)以及BrockBiology of Microorganisms Eighth Edition(pages A-8,A-9,A10和A11)中所描述的其他细菌。 
尤其优选的是能感染植物并将DNA转移到其基因组内的微生物,尤其是农杆菌属的细菌,优选是根癌农杆菌和发根农杆菌(Agrobacteriumrhizogenes)。优选的酵母是假丝酵母属(Candida)、酵母属(Saccharomyces)、汉逊酵母属(Hansenula)和毕赤酵母属(Pichia)。优选的真菌是曲霉属(Aspergillus)、木霉属(Trichoderma)、阿舒囊霉属(Ashbya)、脉胞霉属(Neurospora)、镰孢菌属(Fusarium)和白僵菌属(Beauveria)。最优选的是上 述所定义的植物生物体。 
植物的转化可采用单个DNA分子或多个DNA分子(即,共转化),这两种技术都适于与本发明的表达盒一起使用。许多转化载体可用于植物转化,本发明的表达盒可与任何这种载体结合使用。载体的选择将取决于优选的转化技术和用于转化的靶物种。 
可利用多种技术将构建体引入到植物细胞宿主内,并且这些技术对于本领域技术人员来说是已知的。这些技术通常包括使用根癌农杆菌或发根农杆菌作为转化剂用DNA进行转化,脂质体、PEG沉淀、电穿孔、DNA注射、直接的DNA摄取、微粒轰击、粒子加速等(见,例如,EP 295959和EP 138341)(见下文)。然而,可用本发明的表达盒转化非植物细胞的细胞。可在Gruber等(1993)中发现植物表达载体和报道基因,以及农杆菌属和农杆菌属介导的基因转移的一般描述。 
可将含有基因组片段或合成片段的表达载体引入到原生质体内或者完整组织或分离的细胞内。优选将表达载体引入到完整组织内。提供培养植物组织的一般方法,例如由Maki等(1993)和由Phillips等(1988)提供。优选将表达载体引入到玉米或其他植物组织内,使用直接基因转移法如微粒介导的递送、DNA注射、电穿孔等。更优选将表达载体引入到植物组织内,使用用生物射弹装置的微注射介质递送。见,例如,Tomes等(1995)。本发明的载体不仅可用于结构基因的表达,而且可用于外显子-诱捕克隆,或者启动子诱捕方法以检测多种组织中不同基因的表达(Lindsey 1993;Auch&Reth 1990)。 
特别优选使用农杆菌属物种的Ti和Ri质粒的双元型载体。Ti衍生载体转化各种各样的高等植物,包括单子叶和双子叶植物,如大豆、棉花、油菜、烟草和稻(Pacciotti 1985:Byrne 1987;Sukhapinda 1987;Lorz 1985;Potrykus,1985;Park 1985:Hiei 1994)。使用T-DNA转化植物细胞已受到广泛研究并被充分描述(EP 120516;Hoekema,1985;Knauf,1983;和An1985)。为引入植物,可将本发明的嵌合基因插入到实施例中所述的双元载体中。 
对本领域技术人员来说,可利用其他转化方法,如外源DNA构建体的直接摄取(见EP 295959),电穿孔技术(Fromm 1986)或者用核酸构建体包被的金属颗粒的高速弹果轰击(Kline 1987和US 4,945,050)。一旦转化,细胞可通过本领域技术人员再生。特别相关的是最近所描述的方法,用于将外源基因转化到商业上重要的作物内,如油菜籽(De Block 1989)、向日葵(Everett 1987)、大豆(McCabe 1988;Hinchee 1988;Chee 1989;Christou1989;EP 301749)、稻(Hiei 1994)和玉米(Gordon-Kamm 1990;Fromm1990)。 
本领域技术人员将会意识到,方法的选择可取决于作为转化靶标的植物的类型,即,单子叶或双子叶植物。转化植物细胞的适当方法包括,但不限于,微注射(Crossway 1986)、电穿孔(Riggs 1986)、农杆菌介导的转化(Hinchee 1988)、直接的基因转移(Paszkowski 1984),以及使用可从Agracetus,Inc.,Madison,Wis.和BioRad,Hercules,Calif获得的装置进行的弹果粒子加速(见,例如US 4,945,050和McCabe 1988)。也见Weissinger1988;Sanford 1987(洋葱);Christou 1988(大豆);McCabe 1988(大豆);Datta 1990(稻);Klein 1988(玉米);Klein 1988(玉米);Klein 1988(玉米);Fromm 1990(玉米);以及Gordon-Kamm 1990(玉米);Svab 1990(烟草叶绿体);Koziel 1993(玉米);Shimamoto 1989(稻);Christou 1991(稻);欧洲专利申请EP 0 332 581(果园草(orchardgrass)和其他Pooideae);Vasil1993(小麦);Weeks 1993(小麦)。 
在另一个实施方案中,直接将本发明的核苷酸序列转化到质体基因组内。质体转化技术广泛描述于US 5,451,513、5,545,817和5,545,818,PCT申请WO 95/16783,以及McBride等,1994。叶绿体转化的基本技术包括将侧翼是选择性标记的所克隆的质体DNA的区,连同目的基因一起引入到适当的靶组织内,例如,使用生物射弹或原生质体转化(例如,氯化钙或PEG介导的转化)。1至1.5kb侧翼区,称作靶向序列,促进与质体基因组的直向同源重组并因此允许原质体组特定区域的取代或修饰。最初,利用叶绿体16S rRNA和赋予对壮观霉素和/或链霉素抗性的rps12基因中的点突变作 为转化的选择性标记(Svab 1990;Staub 1992)。这以每100个靶叶的轰击大约一个转化体的频率产生稳定的同质转化体。这些标记之间克隆位点的存在允许产生用于引入外源基因的质体靶向载体(Staub 1993)。通过用显性选择性标记,编码壮观霉素解毒酶氨基糖苷-3N-腺嘌呤转移酶的细菌aadA基因取代隐性rRNA或r-蛋白质抗生素抗性基因,获得转化频率的大幅增加(Svab 1993)。其他用于质体转化的选择性标记是本领域公知的并且包含在本发明的范围内。一般地,需要在转化之后大约15-20个细胞分裂周期达到同质体状态。质体表达,其中通过直向同源重组将基因插入到每个植物细胞中存在的环形质体基因组的所有几千个拷贝中,利用优于细胞核表达基因的巨大拷贝数,能很容易地超过总可溶性植物蛋白10%的表达水平。在优选的实施方案中,将本发明的核苷酸序列插入到质体靶向载体内并转化到期望植物宿主的质体基因组内。可以获得含有本发明核苷酸序列的质体基因组同型的植物,优选能高水平表达该核苷酸序列。 
含有包括本发明表达盒的载体的根癌农杆菌细胞在制备转化植物的方法中有用,其中所述载体包含Ti质粒。如上所述将植物细胞用根癌农杆菌感染以产生转化的植物细胞,然后从所转化的植物细胞中再生植物。已知可用于完成本发明的大量农杆菌属载体系统。 
可使用多种农杆菌株,优选去臂根癌农杆菌或发根农杆菌株。在优选的实施方案中,在本发明实践中使用的农杆菌株包括章鱼碱菌株,例如,LBA4404或农杆碱菌株,例如,EHA101或EHA105。用于DNA转移的适当的根癌农杆菌株是例如EHA101[pEHA101](Hood 1986)、EHA105[pEHA105](Li 1992)、LBA4404[pAL4404](Hoekema 1983)、C58C1[pMP90](Koncz&Schell 1986)和C58C1[pGV2260](Deblaere1985)。其他适宜的菌株是根癌农杆菌C58,一种胭脂碱菌株。其他适宜的菌株是根癌农杆菌C58C1(Van Larebeke 1974)、A136(Watson 1975)或LBA4011(Klapwijk 1980)。在另一个优选的实施方案中,土生细菌是发根农杆菌株K599的去臂变体(NCPPB 2659)。优选这些菌株包括提供T-DNA转移到植物细胞内所需功能的Ti-或Ri-质粒的去臂质粒变体(例如,vir基 因)。在优选的实施方案中,用于转化与植物酚类化合物预培养的植物组织的农杆菌株含有L,L-琥珀碱(succinamopine)型Ti-质粒,优选去臂质粒,如pEHA101。在另一个优选的实施方案中,用于转化与植物酚类化合物预先培养的植物组织的农杆菌株含有章鱼碱型Ti-质粒,优选去臂质粒,如pAL4404。通常,当使用章鱼碱型Ti-质粒或辅助质粒时,优选缺失或灭活virF基因(Jarschow 1991)。 
本发明的方法也可与特定农杆菌株组合用于进一步提高转化效率,如由于存在突变体或者嵌合的virA或virG基因而改变vir基因表达和/或其诱导的农杆菌株(例如,Hansen 1994;Chen和Winans 1991;Scheeren-Groot,1994)。优选的是根癌农杆菌株LBA4404(Hiei 1994)与超毒力质粒的更多组合。这些优选是基于pTOK246的载体(Ishida 1996)。 
双元载体或任何其他载体可通过常规DNA重组技术进行修饰,在大肠杆菌中繁殖,并通过例如,电穿孔或其他转化技术引入到农杆菌中(Mozo&Hooykaas 1991)。 
培养农杆菌并以与Ishida(1996)中所述类似的方式使用。例如,可将包含农杆菌株的载体在补充了适当抗生素(例如,50mg/L壮观霉素)的YP培养基(5g/L酵母提取物,10g/L蛋白胨,5g/L NaCl,15g/L琼脂,pH 6.8)上培养3天。将细菌用环从固体培养基上收集并重悬。在本发明的优选实施方案中,通过使用在-80℃冷冻的等分试样开始农杆菌培养。用于感染和共培养的农杆菌的浓度可能需要改变。例如,制备具有大约105至1011,优选106至1010,更优选约108细胞或cfu/mL的农杆菌的细胞悬液,并将靶组织浸在该悬液中约3至10分钟。将细菌在植物相容的共培养基中重悬。在共培养基中补加抗氧化剂(例如,硝酸银)、酚吸收化合物(象聚乙烯吡咯烷酮,Perl 1996)或者硫醇化合物(象二硫苏糖醇,L-半胱氨酸,Olhoft 2001)可降低由于植物防御反应(象酚氧化)引起的组织坏死,可进一步提高农杆菌介导的转化效率。在另一优选的实施方案中,共培养基包括至少一种硫醇化合物,优选选自硫代硫酸钠、二硫苏糖醇(DTT)和半胱氨酸。优选浓度是约1mM至10mM的L-半胱氨酸,0.1mM至5mM DTT,和/或0.1mM至5 mM硫代硫酸钠。优选共培育期间所使用的培养基包括约1μM至约10μM的硝酸银和约50mg/L至约1,000mg/L L-半胱氨酸。这导致靶组织对农杆菌介导的损害(如诱导的坏死)的脆弱性大幅降低,并大大提高整体转化效率。 
多种载体系统可与农杆菌组合使用。优选的是双元载体系统。常规双元载体是基于“广泛宿主范围”的质粒,象源于P型质粒RK2的pRK252(Bevan 1984)或者pTJS75(Watson 1985)。这些载体的大部分是pBIN19(Bevan 1984)的衍生物。多种双元载体是已知的,其中的一些可通过商业途径获得,如,例如,pBI101.2或pBIN19(Clontech Laboratories,Inc.USA)。对另外的载体在大小和操作方面进行改良(例如,pPZP;Hajdukiewicz 1994)。WO 02/00900中也描述了改良的载体系统。 
使用直接基因转移形式或者农杆菌介导的转移的方法通常,但不是必需地,采用可提供抗生素(例如,卡那霉素、潮霉素或氨甲喋呤)或除草剂(例如,膦丝菌素)抗性的选择性标记。然而,用于植物转化的选择性标记的选择不是本发明的关键。 
对于某些植物物种,优选不同的抗生素或除草剂选择性标记。在转化中常规使用的选择性标记包括赋予对卡那霉素和相关抗生素抗性的nptII基因(Messing & Vierra,1982;Bevan 1983),赋予对除草剂膦丝菌素抗性的bar基因(White 1990,Spencer 1990),赋予对抗生素潮霉素抗性的hph基因(Blochlinger & Diggelmann),以及赋予对氨甲喋呤抗性的dhfr基因(Bourouis 1983)。 
5.稳定转化的植物的产生和表征 
然后将转基因植物细胞置于适当的选择培养基中选择转基因细胞,其接着生长为愈伤组织。从愈伤组织中培养出枝条,通过在生根培养基中培养从该枝条中产生小植物。通常将多种构建体与用于在植物细胞中选择的标记连接。方便地,标记可以是杀生物剂(特别是抗生素,如卡那霉素,G418、博来霉素、潮霉素、氯霉素,除草剂等)抗性的。与缺乏所引入的 DNA的细胞相比,所使用的特定标记将允许选择转化的细胞。可从对于宿主是天然(内源)或外源(异源)序列中制备包括本发明转录盒的DNA构建体成分。“外源”是指在构建体所引入的野生型宿主中未发现的序列。异源构建体将含有至少一个区,其不是转录起始区所来源的基因的天然区。 
为了确定转基因细胞和植物中存在转基因,可进行多种测定。这类测定包括,例如,本领域技术人员公知的“分子生物学”测定,如Southern和Northern印迹、原位杂交和基于核酸的扩增法如PCR或RT-PCR;“生化”测定,如检测是否存在蛋白质产物,例如,通过免疫学法(ELISA和Western印迹)或者通过酶促功能;植物部分测定,如种子测定;以及同样地,通过分析整个再生植物的表型,例如,对于疾病或害虫的抗性。 
通过使用本领域技术人员公知的技术,可从细胞系或者任何植物部分分离DNA以测定是否存在预选的核酸区段。注意可能不总是存在完整序列,推测是由于细胞中序列的重排或缺失所致。 
可通过聚合酶链式反应(PCR)测定是否存在通过本发明方法所引入的核酸元件。使用该技术扩增核酸的散布片段并通过凝胶电泳检测。该类型的分析允许测定稳定转化体中是否存在预选的核酸区段,但是并不证明所引入的预选核酸区段整合到宿主细胞基因组内。另外,不可以使用PCR技术来测定转化体是否具有引入到基因组不同位置上的外源基因,即,转化体是否是独立起源的。认为使用PCR技术,能够克隆与所引入的预选DNA区段相邻的宿主基因组DNA的片段。 
可使用Southern杂交技术测定DNA整合到宿主基因组内的阳性证据和转化体的独立身份。使用该技术可鉴定被引入到宿主基因组内并位于宿主DNA序列侧翼的特异性DNA序列。因此,给定转化体的Southern杂交模式作为该转化体的鉴别特征。另外,可通过Southern杂交证明是否存在所引入的高分子量DNA的预选DNA区段,即,确定所引入的预选DNA区段是否已整合到宿主细胞基因组内。Southern杂交技术提供使用PCR所获得的信息,例如,是否存在所预选DNA区段,并且也证明整合到基因组内并且表征每个独立的转化体。 
期望使用作为改良的Southern杂交技术的点或狭缝印迹杂交技术可获得源于PCR的同样信息,例如,是否存在所预选的DNA区段。 
PCR和Southern杂交技术两者都可用于证明预选的DNA区段传递到子代。在大多数情况中,给定转化体的特征性Southern杂交模式将在子代中分离为表明基因稳定遗传的一个或多个孟德尔基因(Spencer 1992);Laursen 1994)。通过种系传递和相同的Southern印迹杂交模式以及转化的DNA在愈伤组织、R.sub.0植物和转化基因分离的R.sub.1子代中的强度,提示愈伤组织和亲代转化体(R.sub.0)的非嵌合性质。 
尽管可使用从植物的任何部分分离的DNA进行DNA分析技术,但是RNA可能仅在特定细胞或组织类型中表达,因此将有必要从这些组织中制备用于分析的RNA。也可使用PCR技术检测和定量从所引入的预选DNA区段产生的RNA。在PCR的该应用中,首先必需使用酶,如反转录酶将RNA逆转录成DNA,接着通过使用常规PCR技术扩增该DNA。在大多数情况中,PCR技术尽管有用,但是并不证明RNA产物的完整性。可通过Northern印迹获得有关RNA产物特性的其他信息。该技术将证明是否存在RNA并且给出关于该RNA的完整性的信息。也可使用点或狭缝印迹Northern杂交,确定RNA的存在或缺乏。这些技术是Northern印迹的改良并且将仅证明RNA的存在或缺乏。 
尽管Southern印迹和PCR可用于检测所讨论的预选DNA区段,但是它们不提供预选DNA区段是否正得以表达的信息。可通过特异性鉴定所引入的预选DNA区段的蛋白质产物或者评估由其表达所带来的表型改变,对表达进行评估。 
用于产生和鉴定特异性蛋白质的测定可利用蛋白质的物理-化学结构、功能或者其他特性。独特的物理-化学或结构特性允许蛋白质通过电泳方法(如天然的或变性凝胶电泳或者等电聚焦)或者通过层析技术如离子交换或凝胶排阻色谱法分离和鉴定。单个蛋白质的独特结构提供使用特异性抗体在如ELISA测定的方式中检测其存在的机会。可使用具有甚至更高特异性的方法如Western印迹的组合,其中抗体用于定位已通过电泳技 术分离的单个基因产物。可使用另外的技术以完全确定目的产物的身份,如纯化后通过氨基酸测序评估。尽管这些是最常用的方法,但是可另外使用其他方法。 
测定方法也可通过蛋白质的功能用于鉴定蛋白质的表达,尤其是酶催化涉及特异性底物和产物的特异性化学反应的能力。这些反应可随后通过物理或化学方法提供和定量底物的丧失或产生的反应产物。实例随将分析的酶不同而不同。 
非常频繁地通过评估其表达的表型结果来测定基因产物的表达。这些测定也采取许多方式,包括但不限于,分析植物的化学组成、形态学或生理特性的改变。形态改变可包括更高的高度或更厚的茎。在称作生物测定的仔细控制的条件下,评估植物或植物部分对所施处理的响应中最经常的改变。 
6.转基因植物的用途 
一旦本发明的表达盒已转化到特定的植物物种中,那么其可在该物种中繁殖或者被移动到同一物种的其他变种内,特别地包括使用传统育种技术的商业变种。本发明的特别优选的植物包括上述所列的农艺上重要的作物。经基因工程转移到上述转基因种子和植物内的遗传特性通过有性生殖传递,并且可因此在子代植物中维持和增殖。本发明也涉及转基因植物细胞、组织、器官、种子或从转基因植物中获得的植物部分。也包括在本发明内的是植物的转基因子代以及转基因植物细胞、组织、器官、种子和从子代中获得的植物部分。 
优选转基因植物中的表达盒通过有性传递。在一个优选的实施方案中,编码序列通过R0植物到R1代的完全正常的有性循环进行有性传递。另外优选表达盒在转基因植物的细胞、组织、种子或植物中表达,其表达量不同于仅由于表达盒缺乏而不同的植物的细胞、组织、种子或植物中的表达量。 
因此预计这里所产生的转基因植物可用于多种商业和研究目的。可产生转基因植物用于传统农业,以使之具有对种植者有益的性状(例如,农艺 性状,如对水缺乏的抗性、害虫抗性、除草剂抗性或增加产量)、对从植物中所收获的谷物的消费者有益的性状(例如,改善人类食品或动物饲料中的营养含量;增加维生素、氨基酸和抗氧化剂含量;生产抗体(被动免疫)和营养药),或者有益于食物加工者的性状(例如,改善的加工性状)。在这类用途中,通常培养植物,将它们的谷粒用于人类或动物食品。另外,在转基因植物中使用根特异性启动子可提供位于植物如胡萝卜、欧洲防风草(parsnips)和甜菜的(动物和人类)可消费根中的有益性状。然而,植物的其他部分,包括茎干、外壳、营养部分等,也可以有用,包括用作动物青贮饲料的一部分或者用于装饰目的。常常,提取玉米和其他作物的化学成分(例如,油或淀粉)用于食物或工业用途,并且可产生提高或修饰这类成分的水平的转基因植物。 
转基因植物也可用于蛋白质或其他分子的商业生产,其中从植物部分、种子等提取或纯化目的分子。也可培养、体外种植或发酵植物的细胞或组织以生产这类分子。转基因植物也可用于商业育种程序,或者可与相关作物物种杂交或育种。可转移由表达盒所编码的改良,例如从玉米细胞到其他物种的细胞,例如通过原生质体融合。 
转基因植物在研究和育种中具有许多用途,包括通过插入诱变产生新的突变植物,以鉴定可稍后通过传统突变和选择所产生的有益突变体。实例将是引入编码可用于产生遗传变异的转座元件的重组DNA序列。本发明的方法也可用于产生具有可用于鉴定专有品系或变种的独特“标签序列”或其他标记序列的植物。 
因此,根据本发明的转基因植物和种子可用于植物育种,其力求发展具有由表达盒所赋予的改良特性的植物,如干旱、疾病或其他胁迫的耐受性。通过明确的人为干涉表征各种育种步骤,如选择待杂交的品系,指导亲本品系的授粉,或者选择适当的子代植物。根据期望的特性,采取不同的育种措施。相关技术是本领域公知的,并且包括但不限于杂交、近交、回交育种、多线繁殖、品种混合、种间杂交、非整倍体技术等。杂交技术也包括通过机械、化学或生化方法使植物绝育以产生雄性或雌性不育植物。 具有不同品系花粉的雄性不育植物的异花授粉,保证雄性不育而不是雌性不育植物的基因组将一致地获得两个亲本品系的特性。因此,根据本发明的转基因种子和植物可用于改良的植物品系的育种,这例如提高传统方法如除草剂或杀昆虫剂处理的效率,或者由于它们修饰的遗传特性允许免除所述方法。可选地,可获得具有改良的胁迫耐受性的新作物,其由于它们优化的遗传“装备”,产生比不能耐受相对不利发展条件的产物的品质更好的收获产物。 
序列 
1.SEQ ID NO:1编码稻咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)基因的转录调控核苷酸序列的核酸序列,包括5′非翻译区 
2.SEQ ID NO:2编码稻咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)基因的转录调控核苷酸序列的核酸序列 
3.SEQ ID NO:3编码稻咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)基因的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
4.SEQ ID NO:4编码稻咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)的核酸序列 
5.SEQ ID NO:5编码稻咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)的氨基酸序列 
6.SEQ ID NO:6编码稻C8,7-固醇异构酶基因(Os.SI)的转录调控核苷酸序列的核酸序列,包括基因的5′非翻译区。 
7.SEQ ID NO:7编码稻C8,7-固醇异构酶基因(Os.SI)的转录调控核苷酸序列的核酸序列。 
8.SEQ ID NO:8编码稻C8,7-固醇异构酶基因(Os.SI)的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
9.SEQ ID NO:9编码稻C8,7-固醇异构酶基因(Os.SI)的核酸序列 
10.SEQ ID NO:10编码稻C8,7-固醇异构酶基因(Os.SI)的氨基酸序列 
11.SEQ ID NO:11编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的核酸序列,包括基因的5′非翻译区。 
12.SEQ ID NO:12编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的核酸序列。 
13.SEQ ID NO:13编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
14.SEQ ID NO:14编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的功能等同物的核酸序列,包括基因的5′非翻译区。 
15.SEQ ID NO:15编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的功能等同物的核酸序列。 
16.SEQ ID NO:16编码玉米富含羟脯氨酸的糖蛋白(HRGP)(Zm.HRGP)的转录调控核苷酸序列的功能等同物的核心启动子区的核酸序列,包括启动子元件簇。 
17.SEQ ID NO:17编码玉米富含羟脯氨酸的糖蛋白(HRGP)的核酸序列 
18.SEQ ID NO:18编码玉米富含羟脯氨酸的糖蛋白(HRGP)的氨基酸序列 
19.SEQ ID NO:19编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的核酸序列,包括基因的5′非翻译区。 
20.SEQ ID NO:20编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的核酸序列。 
21.SEQ ID NO:21编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
22.SEQ ID NO:22编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的功能等同物的核酸序列,包括基因的5′非翻译区。 
23.SEQ ID NO:23编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的功能等同物的核酸序列 
24.SEQ ID NO:24编码玉米乳酸脱氢酶(Zm.LDH)的转录调控核苷酸序列的功能等同物的核心启动子区的核酸序列,包括启动子元件簇。 
25.SEQ ID NO:25编码玉米乳酸脱氢酶(Zm.LDH)的核酸序列。 
26.SEQ ID NO:26编码玉米乳酸脱氢酶(Zm.LDH)的氨基酸序列 
27.SEQ ID NO:27编码稻叶绿体12(CP12)蛋白的转录调控核苷酸序列的功能等同物的核酸序列,包括基因的5′非翻译区。 
28.SEQ ID NO:28编码稻叶绿体12(CP12)蛋白的转录调控核苷酸序列的功能等同物的核酸序列。 
29.SEQ ID NO:29编码稻叶绿体12(CP12)蛋白的转录调控核苷酸序列的功能等同物的核心启动子区的核酸序列,包括启动子元件簇。 
30.SEQ ID NO:30编码稻叶绿体12(CP12)蛋白的核酸序列。 
31.SEQ ID NO:31编码稻叶绿体12(CP12)蛋白的氨基酸序列。 
32.SEQ ID NO:32编码包括具有转录终止和多聚腺苷酸化序列的玉米乳酸脱氢酶基因3′非翻译区的基因间序列的核酸序列。 
33.SEQ ID NO:33编码构建体pBPSMM304[稻CP12启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子]的核酸序列 
34.SEQ ID NO:34编码包括具有转录终止和多聚腺苷酸化序列的咖啡酰-CoA-O-甲基转移酶3′非翻译区的基因间序列的核酸序列。 
35.SEQ ID NO:35编码包括具有转录终止和多聚腺苷酸化序列的富含羟脯氨酸的糖蛋白3′非翻译区的基因间序列的核酸序列。 
36.SEQ ID NO:36编码构建体pBPS325[稻CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::稻CCoAMT1终止子]的核酸序列 
37.SEQ ID NO:37编码构建体pBPS331[稻SI启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子]的核酸序列 
38.SEQ ID NO:38编码构建体pBPSET003[玉米HRGP启动子::玉米遍在蛋白内含子::GUS(PIV2)::玉米HRGP终止子]的核酸序列 
39.SEQ ID NO:39编码构建体pBPSET007[玉米LDH启动子::玉米遍在蛋白内含子::GUS(PIV2)::玉米LDH终止子]的核酸序列 
40.SEQ ID NO:40正向引物稻CCoAMT1启动子-5’5’-CAACTACTGCACGGTAAAAGTGATAGG-3’ 
41.SEQ ID NO:41反向引物稻CCoAMT1启动子-3’5’-GCAGCTTGCTTCGATCTCTCGCTCGCC-3’ 
42.SEQ ID NO:42正向引物稻CCoAMT13’UTR-5’5’-GCCGATGCCCAAGAACTAGTCATTTTAA-3’ 
43SEQ ID NO:43反向引物稻CCoAMT13’UTR-3’5’-ATTAACACGTCAACCAAACCGCCGTCC-3’ 
44SEQ ID NO:44正向引物稻SI启动子-5’5’-TGCCTCGATTCGACCGTGTAATGGAAT-3’ 
45.SEQ ID NO:45反向引物稻SI启动子-3’5’-ACTCCTGGCTTCCTTCCGATCTGGACT-3’ 
46.SEQ ID NO:46正向引物玉米HRGP启动子-5’5’-CCGGTGACCTTCTTGCTTCTTCGATCG-3’ 
47.SEQ ID NO:47反向引物玉米HRGP启动子-3’5’-CCTCTCTCTCACACACACTCTCAGTAA-3’ 
48.SEQ ID NO:48正向引物玉米LDH启动子-5’5’-AACAAATGGCGTACTTATATAACCACA-3’ 
49.SEQ ID NO:49反向引物玉米LDH启动子-3’5’-CGGGCGGAATGGGATGGGATTACGTGT-3’ 
50.SEQ ID NO:50正向引物玉米HRGP 3’UTR-5’5’-AAAGCGATGCCTACCATACCACACTGC-3’ 
51.SEQ ID NO:51反向引物玉米HRGP 3’UTR-3’5’-TGCCCACATTTATTATGGTTTTACACCC-3’ 
52.SEQ ID NO:52正向引物玉米LDH 3’UTR-5’ 5’-TGATCACATCACCGTCTCTCTTCATTAA-3’ 
53.SEQ ID NO:53反向引物玉米LDH 3’UTR-3’5’-TATCCCAGTCTCGATATTGTCATCCGCT-3’ 
54.SEQ ID NO:54正向引物稻CP12-p  FP5’-TTTGTATTTAGGTCCCTAACGCCCTC-3’ 
55.SEQ ID NO:55反向引物稻CP12-p RP5’-TGTTGATGCGGATTTCTGCGTGTGAT-3’ 
56.SEQ ID NO:56编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核酸序列,包括基因的5′非翻译区。 
57.SEQ ID NO:57编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核酸序列。 
58.SEQ ID NO:58编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
59.SEQ ID NO:59编码稻乳酸脱氢酶(Os.LDH)的核酸序列 
60.SEQ ID NO:61编码稻乳酸脱氢酶(Os.LDH)的氨基酸序列 
61.SEQ ID NO:61编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核酸序列,包括基因的5′非翻译区。 
62.SEQ ID NO:62编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核酸序列。 
63.SEQ ID NO:63编码稻乳酸脱氢酶(Os.LDH)的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
64.SEQ ID NO:64编码稻乳酸脱氢酶(Os.LDH)的核酸序列。 
65.SEQ ID NO:65编码稻乳酸脱氢酶(Os.LDH)的氨基酸序列。 
66.SEQ ID NO:66编码玉米咖啡酰-CoA-O-甲基转移酶(Zm.CCoAMT1)基因的转录调控核苷酸序列的核酸序列,包括5′-非翻译区 
67.SEQ ID NO:67编码玉米咖啡酰-CoA-O-甲基转移酶(Zm.CCoAMT1)基因的转录调控核苷酸序列的核酸序列 
68.SEQ ID NO:68编码玉米咖啡酰-CoA-O-甲基转移酶(Zm.CCoAMT1)基因的转录调控核苷酸序列的核心启动子区的核酸序列,包括启动子元件簇。 
69.SEQ ID NO:69编码玉米咖啡酰-CoA-O-甲基转移酶(Zm.CCoAMT1)的核酸序列 
70.SEQ ID NO:70编码玉米咖啡酰-CoA-O-甲基转移酶(Zm.CCoAMT1)的氨基酸序列 
71.SEQ ID NO:71编码大刍草(Zea diploperennis)富含羟脯氨酸的糖蛋白(HRGP)的转录调控核苷酸序列的功能等同物的核酸序列,包括基因的5′-非翻译区。 
72.SEQ ID NO:72编码大刍草富含羟脯氨酸的糖蛋白(HRGP)的转录调控核苷酸序列的功能等同物的核酸序列。 
73.SEQ ID NO:73编码大刍草富含羟脯氨酸的糖蛋白(HRGP)的转录调控核苷酸序列的功能等同物的核心启动子区的核酸序列,包括启动子元件簇。 
74.SEQ ID NO:74编码大刍草富含羟脯氨酸的糖蛋白(HRGP)的核酸序列。 
75.SEQ ID NO:75编码大刍草富含羟脯氨酸的糖蛋白(HRGP)的氨基酸序列 
76.SEQ ID NO:76-84单子叶植物乳酸脱氢酶蛋白的氨基酸序列基序 
77.SEQ ID NO:85-90单子叶植物咖啡酰-CoA-O-甲基转移酶蛋白的氨基酸序列基序 
78.SEQ ID NO:91寡核苷酸引物GUS-正向:5’-ttacgtggcaaaggattcgat-3’ 
79.SEQ ID NO:92寡核苷酸引物GUS-反向:5’-gccccaatccagtccattaa-3 
80.SEQ ID NO:93寡核苷酸引物对照基因正向5’-tctgccttgcccttgctt-3’ 
81.SEQ ID NO:94寡核苷酸引物对照基因反向 
5’-caattgcttggcaggtcttattt-3’ 
实施例
材料和一般方法 
除非有其他指示,实施例中的化学品和试剂购自Sigma化学公司(St.Louis,MO),限制性内切酶购自New England Biolabs(Beverly,MA)或者Roche(Indianapolis,IN),寡核苷酸由MWG Biotech Inc.(High Point,NC)合成,有关生化和分子生物学测定的其他修饰酶或试剂盒购自Clontech(Palo Alto,CA)、Pharmacia Biotech(Piscataway,NJ)、PromegaCorporation(Madison,WI)或者Stratagene(La Jolla,CA)。细胞培养基的材料购自Gibco/BRL(Gaithersburg,MD)或DIFCO(Detroit,MI)。所进行的用于本发明目的的克隆步骤,如,例如,限制性切割、琼脂糖凝胶电泳、DNA片段的纯化、核酸转移到硝酸纤维素和尼龙膜、连接DNA片段、大肠杆菌细胞的转化、培养细菌、增殖噬菌体和重组DNA的序列分析,如Sambrook(1989)所述进行。根据Sanger法(Sanger 1977),使用ABI激光荧光DNA测序仪进行重组DNA分子的测序。 
为了产生转基因植物,用多种启动子::GUS载体构建体转化根癌农杆菌(C58C1[pMP90]株)(见下面)。随后使用所得到的农杆菌株以获得转基因植物。为此目的,将所分离的转化的农杆菌克隆在4mL培养物(培养基:具有50μg/mL卡那霉素和25μg/mL利福平的YEB培养基)中于28℃过夜。用该培养物接种同一培养基的400ml培养物并孵育过夜(28℃,220rpm)。将细菌通过离心(GSA-Rotor,8,000U/分钟,20分钟)沉淀,并将沉淀在渗透培养基(1/2MS-培养基;0,5g/L MES,pH 5,8;50g/L蔗糖)中重悬。将悬液置于苗木箱(Duchefa)中并添加100mL SILVET L-77(Osi Special-tiesInc.,Cat.P030196)到0.02%的终浓度。将具有8至12个植物的苗木箱置于干燥器内,在真空下随后自发通风(膨胀)10至15分钟。这个过程重复2-3次。其后,将所有植物转移到带有湿土的花盆内并在长日照条件(16小时光照; 日间温度22-24℃,夜间温度19℃,65%相对湿度)下培养。6周后收获种子。实施例1.启动子的分离 
使用Qiagen DNAeasy Plant Mini试剂盒(Qiagen)提取玉米和稻的基因组DNA。使用常规PCR从基因组DNA中分离启动子区。使用大约0.1μg消化的基因组DNA进行常规PCR反应(见下面)。根据EST候选物上游的玉米或稻基因组DNA序列、玉米基因组序列或公共数据库中所公开的启动子序列(例如,稻咖啡酰-CoA-O-甲基转移酶[CCoAMT1],GenBank登录号AB023482;稻未知蛋白质,GenBank登录号AP002818;玉米富含羟脯氨酸的糖蛋白[HRGP],GenBank登录号AJ131535;玉米乳酸脱氢酶[LDH],GenBank登录号Z11754)设计引物。1μL稀释的消化的基因组DNA用作初级PCR反应中的DNA模板。反应包括溶于含缓冲液3的混合物的正向(5’)和反向(3’)引物,根据Expand Long PCR试剂盒(Cat#1681-842,Roche-Boehringer Mannheim)所列方案进行。使用所分离的DNA作为PCR扩增反应中的模板DNA,使用如下引物: 
表3.用于分离启动子或终止子区的引物序列 
Figure BDA00002496098201171
*包括3’UTR的终止子 
在优化的热循环仪程序(T3热循环仪Biometra;95℃180秒,1个循环;95℃40秒,53℃60秒和72℃2分钟,共30个循环;以及72℃5分钟,1个循环,随后于4℃停止反应)中,在反应溶液[1×PCR反应缓冲液(RocheDiagnostics),5μL基因组DNA(相当于大约80ng),dATP、dCTP、dGTP和dTTP各2.5mM(Invitrogen:dNTP混合物),1μL5’引物(100μM),1μL3’引物(100μM),1μLTaq DNA聚合酶5U/μL(Roche Diagnostics),终体积100μL]中扩增启动子区。 
将PCR产物施加到1%(w/v)琼脂糖凝胶中,并在80V分离,随后从凝胶 中切除并借助于Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)进行纯化。适当的情况下,可蒸发50μL洗脱液。根据生产商的说明,将PCR产物直接克隆到载体pCR4-TOPO(Invitrogen)中,即将所获得的PCR产物插入到具有其A突出端和拓扑异构酶的T突出端的载体内。 
实施例2.包括3’非翻译区的目的终止子的分离 
使用基于公共数据库中所公开的序列的序列特异性引物,分离含有咖啡酰-CoA-O-甲基转移酶(Os.CCoAMT1)的3’非翻译区的稻基因组DNA片段(1,092bp)(GenBank登录号AB023482)。用于植物基因组DNA分离和常规PCR扩增的方案在实施例1中予以描述。 
正向引物OsCCoAMT13’UTR-5’: 
5’-GCCGATGCCCAAGAACTAGTCATTTTA-3’(SEQ ID NO:42) 
反向引物OsCCoAMT13’UTR-3’: 
5’-ATTAACACGTCAACCAAACCGCCGTCC-3’(SEQ ID NO:43) 
向序列特异性引物中添加正向引物的SacI和反向引物的PmeI用于进一步的克隆目的(所举例说明的引物序列不包括限制性酶位点)。 
分别使用基于公共数据库中所公开的序列的序列特异性引物,分离519bp或473bp的含有HRGP或LDH基因3’非翻译区的稻基因组DNA片段(GenBank登录号AJ131535;Z11754)。使用序列特异性引物用于植物基因组DNA分离和常规PCR扩增的方案在实施例1中予以描述。 
向序列特异性引物中添加正向引物的SacI和反向引物的PmeI用于进一步的克隆目的(所举例说明的引物序列不包括限制性酶位点)。 
实施例3.载体构建 
3.1基于pUC的载体(目的启动子::内含子(IME)::GUS::NOS或目的终止子) 
将内含子候选物克隆到其BglI和XmaI位点上的基础载体是pBPSMM270。该载体包括多克隆位点(MCS),随后依次(5’到3’)是玉米遍 在蛋白内含子、GUSint ORF(包括马铃薯转化酶[PIV]2内含子以防止细菌表达)以及胭脂碱合酶(NOS)终止子。可用在内含子介导的增强中起作用的目的内含子替换玉米遍在蛋白内含子。 
用SacI和PmeI酶消化含目的终止子的PCR片段(例如,包括CCoAMT1终止子的1,092bp稻基因组DNA;包括HRGP终止子的558bp玉米基因组DNA,包括LDH终止子的477bp玉米基因组DNA)。用CCoAMT1终止子、HRGP终止子或LDH终止子替换pBPSMM270中的胭脂碱合酶终止子,分别产生pBPSMM270a、pBPSMM270-HRGP3’或pBPSMM270-LDH3’。 
用PacI和AscI消化Topo载体(Invitrogen)中含稻CCoAMT1或稻SI启动子的基因组DNA片段,随后分别亚克隆到pBPSMM270中玉米遍在蛋白内含子的上游。 
用PacI和AscI消化Topo载体(Invitrogen)中含CCoAMT1启动子的基因组DNA片段,随后分别亚克隆到pBPSMM270-CCoAMT13’中玉米遍在蛋白内含子的上游。 
用PacI和AscI消化Topo载体(Invitrogen)中含玉米HRGP或玉米LDH启动子的基因组DNA片段,随后分别亚克隆到pBPSMM270-HRGP3’或pBPSMM270-LDH3’中玉米遍在蛋白内含子的上游。 
3.2转化双元载体(目的启动子::内含子(IME)::GUS::NOS或目的终止子) 
用AscI或PacI(5’)与PmeI(3’)消化基于pUC的载体中的GUS嵌合盒(稻CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::CCoAMT1终止子,玉米CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS,稻SI启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS,玉米HRGP启动子::玉米遍在蛋白内含子::GUS(PIV2)::玉米HRGP终止子,或者玉米LDH启动子::玉米遍在蛋白内含子::GUS(PIV2)::玉米LDH终止子),并亚克隆到含植物选择性标记盒的单子叶植物双元载体(pBPSMM344)的AscI或PacI(5’)与PmlI(3’)位点上,分别产生pBPSMM325、pBPSMM271、pBPSMM331、pBPSET003或pBPSET007。 
实施例4.单子叶植物中农杆菌介导的转化 
也可使用标准的转化和再生技术进行农杆菌介导的植物转化,用于转化作物植物的目的(Gelvin 1995;Glick 1993)。 
利用例如US 5,591,616中所述的技术能够进行玉米或其他单子叶植物的转化。 
例如,Freeling&Walbot(1993)“The maize handbook”ISBN3-540-97826-7,Springer Verlag New York)描述了使用粒子轰击、聚乙二醇介导的DNA摄取或者经碳酸硅纤维技术的植物的转化。 
实施例5.报道基因表达的检测 
为了鉴定启动子的特征和致使其组织特异性的启动子基本元件,有必要将启动子本身及其多种片段置于称为报道基因(其允许测定表达活性)的前面。可提及的实例是细菌的β-葡糖醛酸糖苷酶(Jefferson 1987a)。可通过显色底物如5-溴-4-氯-3-吲哚-β-D-葡糖醛酸活性染色的方法在植物体内(in-planta)检测β-葡糖醛酸糖苷酶活性(Jefferson 1987b)。为了研究组织特异性,根据(例如,
Figure BDA00002496098201211
1991b)所描述的将植物组织切下、包埋、染色和分析。 
另一测定允许定量测定所研究的组织中的GUS的活性。对于定量活性测定,使用MUG(4-甲基伞形酮-β-D-葡糖醛酸苷)作为β-葡糖醛酸糖苷酶的底物,并将MUG裂解成MU(甲基伞形酮)和葡糖醛酸。 
为此,首先制备期望组织的蛋白提取物,然后向提取物中加入GUS的底物。可仅在GUS已经反应后通过荧光测定法测量底物。在多个时间点采集随后在荧光计中测量的样品。例如,可用多个发育阶段(开花后21、24或30天)的亚麻子胚进行该测定。为此,在每个情形中借助于振动碾磨机(型号:Retsch MM 2000)将一个胚碾磨成粉末置于液氮中的2mL反应容器内。添加100μL EGL缓冲液(0.1M KPO4,pH 7.8;1mM EDTA;5%甘油;1M DTT)后,将混合物在25℃,以14,000×g离心10分钟。取出上清液并再 次离心。再次将上清液转移到新的反应容器中并置于冰上备用。用65μLEGL缓冲液(不含DTT)处理25μL该蛋白提取物并用于GUS测定。现在添加10μL底物MUG(10mM 4-甲基伞形酮-β-D-葡糖醛酸苷),将混合物涡旋,立即取出30μL作为零位值,并用470μL终止缓冲液(0.2M Na2CO3)处理。对所有样品重复该步骤,间隔30秒。将所采集的样品贮藏在冰箱中直到测量。1小时和2小时后进一步采集读数。对于荧光测量值,建立含有0.1mM至10mM MU(4-甲基伞形酮)浓度的校准系列。如果样品值在这些浓度之外,那么使用更少的蛋白提取物(10μL、1μL、1∶10稀释的1μL稀释液),以及测量更短的时间间隔(0小时、30分钟、1小时)。在Fluoroscan II装置(Labsystem)中以365nm的激发和445nm的发射进行测量。作为可供选择的方法,如Bustos(1989)所述可在碱性条件下通过荧光测定法监控底物裂解(在365nm激发,测量445nm的发射光;Spectro Fluorimeter BMGPolarstar+)。通过Bradford(1976)法对所有样品进行蛋白质浓度测定,从而得以鉴定多种组织和植物中的启动子活性和启动子强度。 
实施例6.玉米中的组成型表达 
6.1稻CCoAMT1启动子::玉米遍在蛋白内含子::GUS::CCoAMT1终止子(pBPSMM325) 
与CCoAMT1终止子组合的CCoAMT1启动子在不同发育阶段的所有组织和器官中显示强组成型和遍在表达。也能够在体外植物中检测到强遍在表达。 
表4.受单子叶植物组成型启动子候选物所控制的GUS表达 
Figure BDA00002496098201221
Figure BDA00002496098201231
*作为组成型启动子的阳性对照(pBPSMM232=玉米遍在蛋白启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子;pBPSMM247=甘蔗杆状病毒启动子::GUS(PIV2)::NOS终止子);通过组化测定测量GUS表达水平的范围(-到+++++),ND:未测定 
实施例7.玉米中根和仁优先表达 
7.1稻CCoAMT1启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子 
咖啡酰-CoA-O-甲基转移酶(CCoAMT1)启动子::遍在蛋白内含子::NOS终止子(pBPSMM271)在T1植物的叶和茎中显示低表达,但是在根中强表达。也检测到仁和花粉中的GUS染色。 
7.2稻SI启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子 
OsC8,7-固醇异构酶启动子::玉米遍在蛋白内含子::NOS终止子(pBPSMM331)在植物的多数部分显示弱表达,但是在根和仁中表达良好。 
7.3玉米HRGP启动子::玉米遍在蛋白内含子::GUS(PIV2)::HRGP终止子 
含有遍在蛋白内含子和HRGP终止子的HRGP启动子(pBPSET003)在叶中不显示表达,但是在根和穗丝中强表达。在仁中,表达主要在胚中,而在胚乳中仅弱表达。 
7.4玉米LDH启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS或LDH终 止子 
乳酸脱氢酶(LDH)启动子::玉米遍在蛋白内含子::NOS或LDH终止子(分别是pBPSMM272或pBPSET007)在叶中显示弱表达,但是在根和仁中表达良好。 
表5.由单子叶植物根和仁优先的启动子候选物所控制的GUS表达 
Figure BDA00002496098201241
*作为组成型启动子的阳性对照(pBPSMM232=玉米遍在蛋白启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子);通过组化测定检测GUS表达水平的范围(-到+++++),ND:未测定 
实施例8.玉米中叶和胚乳优先的表达 
Os.CP12启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子(pBPSMM304)在叶和胚乳中显示强表达,但在根或胚中不表达。 
表6.由叶和胚乳优先的单子叶植物启动子所控制的GUS表达 
Figure BDA00002496098201251
*作为组成型启动子的阳性对照(pBPSMM232=玉米遍在蛋白启动子::玉米遍在蛋白内含子::GUS(PIV2)::NOS终止子);通过组化测定测量GUS表达水平的范围(-到+++++),ND:未测定 
实施例9.使用实时RT PCR分析来分析干旱诱导的表达 
在标准条件下在温室中从种子培养幼小玉米植物。当植物具有5个真叶(5叶期)时,对干旱胁迫植物停止供水,而对于水对照植物继续灌溉。将末次灌溉日记做0时间点。此后当土壤干燥但植物仍然不显示干旱症状时(大约3天),记做第一时间点,当每株植物的至少一个叶子显示“卷起”时(轻度症状,大约5天),记做第二时间点,当所有叶子都显示“卷起”时(严重症状,大约7天),记做最后的时间点。 
使用GeneAmp 5700序列检测系统(Applied Biosystems),在mRNA水平测量报道基因的表达水平。使用Wizard Magnetic 96DNA植物系统试剂盒(Promega,FF3661),从干旱胁迫试验期间在多个时间点采集的玉米叶样品中提取总核酸。随后,使用无DNA试剂盒(Ambion,#1906)从样品中除去 DNA。将所得的无DNA的RNA溶液用于随后的PCR反应。用于表达分析的一批RT/定量PCR反应含有: 
10μL RNA溶液 
15μL SYBR Green master Mix(2×;Eurogentec#RTSNRT032X-1) 
0.15μL  反转录酶+抑制剂1混合物(Eurogentec#RTSNRT032X-1) 
0.6μL正向引物(10pmol/μL) 
0.6μL反向引物(10pmol/μL) 
3.65μL  无菌水 
PCR程序是: 
1个循环48℃,30分钟(RT反应) 
40个循环90℃,10分钟;95℃,15秒和60℃,1分钟 
扩增后进行的解离方案: 
95℃15秒,60℃20秒 
20分钟缓慢变温,从60℃升至95℃。 
表7.GUS基因和编码微管相关蛋白1轻链3的对照基因的引物序列 
对于干旱胁迫试验的每个时间点,在同一平板上在同一时间进行的两个qPCR反应中使用每个样品的RNA溶液。一个反应含有GUS引物,另一反应含有玉米内源性对照基因的引物。该内源性对照基因在多个组织中在胁迫条件下显示稳定表达。 
在所有试验中使用GeneAmp 5700软件的预置基线和阈值以产生原始数据(循环数)。为标准化以GeneAmp 5700序列测定系统获得的值,从GUS引物反应的值中减去内源性引物反应的值。然后使用循环数的差计算表达水平的改变。由于PCR期间指数性扩增模板,因此一个循环差别等于模板水平的两倍差别。将结果显示为与设为1的0时间点相比的x倍诱导。 
9.1由玉米LDH启动子所控制的干旱诱导的表达 
在含有单拷贝的T1植物中,在根和仁中显示强组成型表达。不同发育阶段的叶和茎中的表达很弱。与充分灌溉的对照相比,经干旱胁迫后,在叶子中诱导两倍表达。 
实施例10.转基因作物的利用 
可用欲以组成型和遍在方式表达的目的基因替换pBPSMM325中的报道基因,可用欲主要地在根和仁中表达的目的基因替换pBPSMM271、pBPSMM331、pBPSET003和pBPSET007中的报道基因,可用欲主要地在叶和胚乳中表达的目的基因(例如,通过反义或双链RNA)替换pBPSMM304中的报道基因,由此改善例如生物量和/或产量,或者耐受生物的和非生物的环境胁迫。将嵌合构建体转化到单子叶植物内。如果需要的话,可使用本领域中的标准转化方法。使用已知方法再生转化植物。测量多个表型以确定生物量、产量、脂肪酸组成、高油、疾病耐受性,或者与产量增加或稳定性相关的任何其他表型的改善。在不同发育阶段并对不同世代(T0到T2植物或者更多世代)测定基因表达水平。植物中的评估结果确定了与该启动子组合的增加产量、改善疾病耐受性,和/或改善非生物胁迫耐受性的适当基因。 
实施例11.单子叶植物中选择性标记基因的表达 
可用选择性标记基因替换pBPSMM325中的报道基因,并转化到单子叶植物内,如稻、大麦、玉米、小麦或者黑麦草,但不限于这些植物物种。 可适用改善单子叶植物中表达的任何方法,如添加内含子,或者添加5’UTR中的内含子未经剪接的或剪接过的外显子。如果需要的话,可使用本领域中的标准转化方法。在目的选择剂存在下选择转化的植物,并使用已知方法再生。在组织或组织培养细胞的早期发育阶段检查选择方案。可在不同发育阶段并对不同世代(T0到T2植物或者更多世代)测定基因表达水平。植物中的评估结果确定了与该启动子组合的适当基因。 
实施例12.单子叶植物中用于根活力的转基因的表达 
可用欲主要地在根中表达、影响根结构的目的基因替换pBPSMM271、pBPSMM331、pBPSET003、pBPSMM272和pBPSET007中的报道基因,并转化到单子叶植物内,如稻、大麦、玉米、小麦或黑麦草,但不限于这些植物物种。可适用改善单子叶植物中表达的任何方法,如添加内含子,或者添加5’UTR中的内含子未经剪接的或剪接过的外显子。如果需要的话,可使用本领域中的标准转化方法。在目的选择剂存在下选择转化的植物,并使用已知方法再生。在组织或组织培养细胞的早期发育阶段检查选择方案。可在不同发育阶段并对不同世代(T0到T2植物或者更多世代)测定基因表达水平测定基因表达水平。植物中的评估结果确定了与该启动子组合的适当基因。 
实施例13.单子叶植物中用于饲料和食物的转基因的表达 
用欲主要地在仁中表达、改善胚和胚乳中的营养的目的基因替换pBPSMM271、pBPSMM331、pBPSET003、pBPSMM272、pBPSET007和pBPSMM304中的报道基因,并转化到单子叶植物内如,稻、大麦、玉米、小麦或黑麦草,但不限于这些植物物种。可适用改善单子叶植物中表达的任何方法,如添加内含子,或者添加5’UTR中的内含子未经剪接的或剪接过的外显子。如果需要的话,可使用本领域中的标准转化方法。在目的选择剂存在下选择转化的植物并使用已知方法再生。在组织或组织培养细胞的早期发育阶段检查选择方案。可在不同发育阶段并对不同世代(T0 到T2植物或者更多世代)测定基因表达水平。植物中的评估结果导致确定与该启动子结合的适当基因。 
实施例14.缺失分析 
克隆方法由Rouster(1997)和Sambrook(1989)描述。通过产生首先含有全部启动子区和其次含有其多种片段的多种报道基因表达载体,进行这些启动子的详细作图(即,缩小与其特异性相关的核酸片段)。首先,将全部启动子区或其片段克隆到含有GUS或其他报道基因的双元载体内。为此,首先使用通过使用限制性酶切割全长启动子序列中的固有限制性切割位点所获得的片段。其次,使用具有通过引物所引入的切割位点的PCR片段。使用当前领域中的转化方法将含有多种缺失启动子的嵌合GUS构建体转化到玉米、拟南芥及其他植物物种中。通过使用GUS组化测定或者其他适当的方法分析不同发育阶段的多种组织和器官中的启动子活性。启动子序列的修饰能够基于需求消除遗漏。 
实施例15.体内诱变 
技术人员熟悉启动子活性的修饰或重要启动子元件鉴定的多种方法。这些方法之一基于随机突变,随后用上述报道基因测试。可经维持遗传信息完整性能力破坏的大肠杆菌或其他微生物(例如,芽孢杆菌属物种或酵母如酿酒酵母(Saccharomyces cerevisiae))传代质粒(或者其他载体)DNA,获得微生物的体内诱变。常规突变株具有DNA修复系统基因的突变(例如,mutHLS、mutD、mutT等;参考文献见Rupp 1996)。技术人员熟悉这些菌株。例如Greener(1994)举例说明了这些菌株的用途。微生物的选择和测试后优选将突变的DNA分子转移到植物内。产生转基因植物并如上所述进行分析。 
实施例16.稻CCoAMT1启动子(SEQ ID NO:1)的PLACE分析 
根据下面所给出的PLACE结果,潜在的TATA盒位于SEQ ID NO:1 的碱基对952至碱基对958。所以5’非翻译区在SEQ ID NO:1的约碱基对993处开始并延伸到碱基对1,035。SEQ ID NO:2所述的序列在ATG起始密码子前17个碱基对处结束。 
在如SEQ ID NO:1所述的稻CCoAMT1启动子中鉴定了如下启动子元件簇: 
Figure BDA00002496098201301
Figure BDA00002496098201311
实施例17.Os.SI启动子(SEQ ID NO:6)的PLACE分析 
根据下面所给出的PLACE结果,在该启动子区(797bp)中没有发现常规TATA盒。在如SEQ ID NO:6所述的Zm.SI启动子中鉴定了如下启动子元件簇: 
Figure BDA00002496098201332
Figure BDA00002496098201341
Figure BDA00002496098201351
实施例18.Zm.HRGP启动子(SEQ ID NO:11)的PLACE分析 
根据下面所给出的PLACE结果,潜在的TATA盒位于SEQ ID NO:11的碱基对1,071至碱基对1,077处。所以5’非翻译区在SEQ ID NO:11的约碱基对1,112处开始并延伸到1,182碱基对。SEQ ID NO:11所述的序列刚好在ATG起始密码子处结束。 
在如SEQ ID NO:11所述的Zm.HRGP启动子中鉴定了如下启动子元件簇: 
Figure BDA00002496098201352
Figure BDA00002496098201361
Figure BDA00002496098201371
Figure BDA00002496098201381
实施例19.Zm.LDH启动子(SEQ ID NO:19)的PLACE分析 
根据下面所给出的PLACE结果,潜在的TATA盒位于SEQ ID NO:19的碱基对906至碱基对912处。所以5’非翻译区在SEQ ID NO:19的约碱基对947处开始并延伸到碱基对1,060。SEQ ID NO:19所述的序列在ATG起始密码子前31个碱基对处结束。 
在如SEQ ID NO:19所述的Zm.LDH启动子中鉴定了如下启动子元件簇: 
Figure BDA00002496098201382
Figure BDA00002496098201391
Figure BDA00002496098201401
实施例20.Os.Cp12启动子(SEQ ID NO:27)的PLACE分析 
根据下面所给出的PLACE结果,潜在的TATA盒位于SEQ ID NO:27的碱基对908至碱基对914处。所以5’非翻译区在SEQ ID NO:27的约碱基对960处开始并延伸到碱基对998。 
在如SEQ ID NO:27所述的Os.Cp12启动子中鉴定了如下启动子元件簇: 
Figure BDA00002496098201411
Figure BDA00002496098201421
实施例21.用于过表达和基因“敲除”实验的载体构建 
21.1过表达 
设计用于在植物中表达(过表达)全长目的“候选基因”以便过表达目的蛋白质的载体,载体归属于两大类,生物射弹和双元型,视植物转化方法而定。 
对于生物射弹转化(生物射弹载体),要求如下: 
1.载体骨架,具有细菌选择性标记(一般地,抗生素抗性基因)和在大肠杆菌(例如,ColE1)中有功能的复制起点,和 
2.植物特异性部分,包括: 
a.基因表达盒,包括启动子(例如,ZmUBIint MOD)、目的基因(一般为全长cDNA)和转录终止子(例如,根癌农杆菌nos终止子); 
b.植物选择性标记盒,包括适当的启动子、选择性标记基因(例如,D-氨基酸氧化酶;dao1)和转录终止子(例如,nos终止子)。 
设计用于通过根癌农杆菌(双元载体)转化的载体包括: 
1.载体骨架,具有在大肠杆菌和根癌农杆菌两者中都有功能的细菌选择性标记(例如,由aadA基因介导的壮观霉素抗性)和在每一上述细菌宿主中都有功能的两个复制起点,加上根癌农杆菌virG基因; 
2.用于上述生物射弹载体所述的植物特异性部分,除了在这种情况下该部分侧接根癌农杆菌右边界和左边界序列,所述边界序列介导侧接这两个序列的DNA转移到植物中。 
21.2基因沉默载体 
设计用于减少或废除单个基因或者家族基因或相关基因表达的载体(基因沉默载体)也归属于两大类,对应于用于下调基因表达的方法:反义或双链RNA干扰(dsRNAi)。 
(a)反义 
对于反义载体,可在用于全长表达所述的相同载体中使用全长或部分基因片段(一般为cDNA的一部分),作为基因表达盒的一部分。对于反义介 导的基因表达的下调,基因或基因片段的编码区将与启动子的方向相反;因此,将从植物内的非编码(反义)链制备mRNA。 
(b)dsRNAi 
对于dsRNAi载体,在基因表达盒中使用部分基因片段(一般300至500个碱基对长),并且在正义和反义方向上均表达,通过间隔区(一般为植物内含子,如OsSH1内含子1,或者选择性标记,如赋予卡那霉素抗性的选择性标记)分开。设计这类载体以便在植物内形成由两个互补基因片段的碱基配对所致的双链mRNA茎。 
设计用于过表达或敲除的生物射弹或双元载体可随多种不同方式而变化,包括,例如用于植物和细菌的选择性标记、用于基因表达和植物选择性标记盒的转录终止子,以及用于克隆目的基因或基因片段的方法(一般为常规限制性酶介导的或基于GatewayTM重组酶的克隆)。 
参考文献 
1.Abel等,Science,232:738(1986). 
2.Altschul等,Nucleic Acids Res.,25:3389(1997). 
3.Altschul等,J.Mol.Biol.,215:403(1990). 
4.An等,EMBO J.,4:277(1985). 
5.Auch&Reth,Nucleic Acids Research,18:6743(1990). 
6.Ausubel等(1987)Current Protocols  in  Molecular Biology,GreenePublishing Assoc.and Wiley Interscience 
7.Ballas等,Nucleic Acids Res.,17:7891(1989). 
8.Barkai-Golan et al.,Arch.Microbiol.,116:119(1978). 
9.Batzer等,Nucleic Acid Res.,19:5081(1991). 
10.
Figure BDA00002496098201451
等Mol Gen Genet 225:121-128(1991) 
11.Becker等(1994)Plant J.,5:299-307, 
12.Bernal-Lugo和Leopold,Plant Physiol.,98:1207(1992). 
13.Bevan等,Nature,304:184(1983). 
14.Bevan等,Nucl.Acids Res.,11:369(1983). 
15.Bevan,Nucl.Acids Res.,12:8711(1984). 
16.Blackman等,Plant Physiol.,100:225(1992). 
17.Blochlinger&Diggelmann,Mol Cell Biol,4:2929(1984). 
18.Bol等,Ann.Rev.Phytopath.,28:113(1990). 
19.Bouchez等,EMBO J.,8:4197(1989). 
20.Bourouis等,EMBO J.,2:1099(1983). 
21.Bowler等,Ann.Rev.Plant Physiol.,43:83(1992). 
22.Branson和Guss,Proc.North Central Branch Entomological Society ofAmerica(1972). 
23.Broakgert等,Science,245:110(1989). 
24.Bustos等(1989)Plant Gell 1:839-853 
25.Byrne等Plant Cell Tissue and Organ Culture,8:3(1987). 
26.Callis等,Genes and Develop.,1:1183(1987). 
27.Campbell和Gowri,Plant Physiol.,92:1(1990). 
28.Campbell,W.C.,编辑Ivermectin and Abamectin,Springer-Verlag,New York,1989. 
29.Chee等Plant Physiol.,91:1212(1989). 
30.Chen和Winans(1991)J.Bacteriol.173:1139-1144 
31.Christensen AH,Quail PH(1996)Transgenic Res 5:213-218. 
32.Christou等Proc.Natl.Acad.Sci USA,86:7500(1989). 
33.Christou等,Biotechnology,9:957(1991). 
34.Christou等,Plant Physiol.,87:671(1988). 
35.Chui等(1996)Curr Biol 6:325-330 
36.Coe等,在:Corn and Corn Improvement,Sprague等(编辑)pp.81-258(1988). 
37.Corpet等Nucleic Acids Res.,16:10881(1988). 
38.Coxson等,Biotropica,24:121(1992). 
39.Crameri等,Nature Biotech.,15:436(1997). 
40.Crameri等,Nature,391:288(1998). 
41.Crossway等,BioTechniques,4:320(1986). 
42.Cuozzo等,Bio/Technology,6:549(1988). 
43.Cutler等,J.Plant Physiol.,135:351(1989). 
44.Czapla和Lang,J.Econ.Entomol.,83:2480(1990). 
45.Datta等,Bio/Technology,8:736(1990). 
46.Davies等,Plant Physiol.,93:588(1990). 
47.Dayhoff等,Atlas of Protein Sequence and Structure,Natl.Biomed.Res.Found.,ashington,C.D.(1978). 
48.De Blaere等,Meth.Enzymol.,143:277(1987). 
49.De Block等Plant Physiol.,91:694(1989). 
50.De Block等,EMBO Journal,6:2513(1987). 
51.Deblaere等Nucl Acids Res 13:4777-4788(1985) 
52.Della-Cioppa等Bio/Technology 5:579-584(1987) 
53.Della-Cioppa等,Plant Physiology,84:965-968(1987). 
54.Dellaporta等,in Chromosome Structure and Function,Plenum Press,263-282(1988). 
55.Depicker等,Plant Cell Reports,7:63(1988). 
56.Dunn等,Can.J.Plant Sci.,61:583(1981). 
57.Dure等,Plant Mol. Biol.,12:475(1989). 
58.Ebinuma等Proc Natl Acad Sci USA 94:2117-2121(2000a) 
59.Ebinuma等Selection of Marker-free transgenic plants using theoncogenes(ipt,rol A,B,C)of Agrobacteriumas selectable markers,InMolecular Biology of Woody Plants.Kluwer Academic Publishers(2000b) 
60.Eichholtz等Somatic Cell and Molecular Genetics 13,67-76(1987) 
61.Ellis等,EMBO Journal,6:3203(1987). 
62.Elroy-Stein等,Proc.Natl.Acad.Sci.U.S.A.,86:6126(1989). 
63.English等,Plant Cell,8:179(1996). 
64.Erdmann等,J.Gen.Microbiol.,138:363(1992). 
65.Erikson等Nat Biotechnol.22(4):455-8(2004) 
66.Everett等,Bio/Technology,5:1201(1987). 
67.Fedoroff&Smith Plant J 3:273-289(1993) 
68.Fire等,Nature 391:806-811(1998) 
69.Fitzpatrick,Gen.Engineering News,22:7(1993). 
70.Fraley等Proc Natl Acad Sci USA 80:4803(1983) 
71.Fromm等,Bio/Technology,8:833(1990). 
72.Fromm等,Nature(London),319:791(1986). 
73.Galbiati等Funct.Integr Genozides 2000,201:25-34 
74.Gallie等Nucl Acids Res 15:8693-8711(1987) 
75.Gallie等,Nucleic Acids Res.,15:3257(1987). 
76.Gallie等,The Plant Cell,1:301(1989). 
77.Gan等,Science,270:1986(1995). 
78.Gatehouse等,J.Sci.Food Agric.,35:373(1984). 
79.Gelfand,编辑,PCR Strategies Academic Press,New York(1995). 
80.Gelvin等,Plant Molecular Biology Manual,(1990). 
81.Gleave等Plant Mol Biol.40(2):223-35(1999) 
82.Gordon-Kamm等,Plant Cell,2:603(1990). 
83.Goring等,PNAS,88:1770(1991). 
84.Gruber等,Vectors for PlantTransformation,in:Methods in PlantMolecular Biology&Biotechnology″in Glich等,(Eds.pp.89-119,CRC Press,1993). 
85.Guerineau等,Mol.Gen.Genet.,262:141(1991). 
86.Guerrero等,Plant Mol.Biol.,15:11(1990). 
87.Gupta等,PNAS,90:1629(1993). 
88.Haines和Higgins(编辑),Nucleic Acid Hybridization,IRL Press,Oxford,U.K. 
89.Hajdukiewicz等Plant Mol Biol 25:989-994(1994) 
90.Hammock等,Nature,344:458(1990). 
91.Hansen等,Proc.Natl.Acad.Sci.USA 91:7603-7607(1994) 
92.Hayford等,Plant Physiol.86:1216(1988) 
93.Hemenway等,EMBO Journal,7:1273(1988). 
94.Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA,89:10915(1989). 
95.Hiei等,Plant J 6:271-282(1994) 
96.Higgins等,Gene,73:237(1988). 
97.Higo等,Nucl Acids Res 27(1):297-300(1999). 
98.Hilder等,Nature,330:160(1987). 
99.Hille等,Plant Mol.Biol.7:171(1986) 
100.Hinchee等,Bio/Technology 6:915(1988). 
101.Hoekema等,Nature 303:179-181(1983). 
102.Hoekema,在:The Binary Plant Vector System.Offset-drukkerijKanters B.V.;Alblasserdam(1985). 
103.Hood等J Bacteriol 168:1291-1301(1986) 
104.Huang等,CABIOS,8:155(1992). 
105.Ikeda等,J.Bacteriol.,169:5612(1987). 
106.Ikuta等,Biotech.,8:241(1990). 
107.Ingelbrecht等,Plant Cell,1:671(1989). 
108.Innis和Gelfand,编辑,PCR Methods Manual(Academic Press,NewYork)(1999). 
109.Innis等,编辑,PCR Protocols:A Guide to Methods and Applications(Academic Press,New York(1995). 
110.Innis等,PCR Protocols:A Guide to Methods and Applications,Academic Press,Inc.,San Diego,Calif.(1990). 
111.Ishida等,Nature Biotech 745-750(1996). 
112.Jefferson等,EMBO J 6:3901-3907(1987). 
113.Jefferson等,Plant Mol Biol Rep 5:387-405(1987). 
114.Jenes等,Techniques for Gene Transfer,in:Recombinant Plants,Vol.1,Engineering and Utilization,由SD Kung和R Wu编辑,AcademicPress,pp.128-143(1993). 
115.Jobling等,Nature,325:622(1987). 
116.Johnson等,PNAS USA,86:9871(1989). 
117.Jones等,Mol.Gen.Genet.,210:86(1987). 
118.Joshi等,Nucleic Acid Res.,15:9627(1987). 
119.Kaasen等,J.Bacteriol.,174:889(1992). 
120.Karlin和Altschul,Proc.Natl.Acad Sci.USA,87:2264(1990). 
121.Karlin和Altschul,Proc.Natl.Acad.Sci.USA,90:5873(1993). 
122.Karsten等,Botanica Marina,35:11(1992). 
123.Katz等,J.Gen.Microbiol.,129:2703(1983). 
124.Keller等,EMBO Journal,8:1309(1989). 
125.Keller等,Genes Dev.,3:1639(1989). 
126.Klapwijk等,J.Bacteriol.,141,128-136(1980.) 
127.Klein等,Bio/Technoloy,6:559(1988). 
128.Klein等,Plant Physiol.,91:440(1988). 
129.Klein等,Proc.Natl.Acad.Sci.USA,85:4305(1988). 
130.Knauf等,Genetic Analysis of Host Range Expression byAgrobacterium In:Molecular Genetics of the Bacteria-PlantInteraction,Puhler,A.编辑,Springer-Verlag,New York,1983. 
131.Koncz&Schell Mol Gen Genet 204:383-396(1986) 
132.Koprek等,Plant J 19(6):719-726(1999) 
133.Koster和Leopold,Plant Physiol.,88:829(1988). 
134.Koziel等,Biotechnology,11:194(1993). 
135.Kunkel等,Methods in Enzymol.,154:367(1987). 
136.Kunkel,Proc.Natl.Acad.Sci.USA,82:488(1985). 
137.Lam和Chua,J Biol Chem;266(26):17131-17135(1991) 
138.Laufs等,PNAS,87:7752(1990). 
139.Lawton等,Mol.Cell Biol.,7:335(1987). 
140.Lee和Saier,J.Bacteriol.,153(1982). 
141.Leffel等Biotechniques 23(5):912-8(1997) 
142.Lescot等,Nucleic Acids Res 30(1):325-7(2002) 
143.Levings,Science,250:942(1990). 
144.Li等Plant Mol Biol 20:1037-1048(1992) 
145.Lindsey等,Transgenic Research,2:3347(1993). 
146.Liu等,.Plant J.8,457-463(1995) 
147.Lommel等,Virology,181:382(1991). 
148.Loomis等,J.Expt.Zool.,252:9(1989). 
149.Lorz等,Mol.Gen.Genet.,199:178(1985). 
150.Ma等,Nature,334:631(1988). 
151.Macejak等,Nature,353:90(1991). 
152.Maki等,Methods in Plant Mol.Biol&Biotechn.,Glich等,67-88 CRCPress,(1993). 
153.Maniatis等,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,Cold Spring Harbor(NY),(1989) 
154.Mariani等,Nature,347:737(1990). 
155.Matzke等Plant Mol Biol 43:401-415(2000). 
156.McBride等,PNAS USA,91:7301(1994). 
157.McCabe等,Bio/Technology,6:923(1988). 
158.Meinkoth和Wahl,Anal.Biochem.,138:267(1984). 
159.Messing和Vierra,Gene,19:259(1982). 
160.Michael等,J.Mol.Biol.,26:585(1990).(im Text steht:Michael等1994) 
161.Millar等,Plant Mol Biol Rep 10:324-414(1992) 
162.Mogen等,Plant Cell,2:1261(1990). 
163.Moore等,J.Mol.Biol.,272:336(1997). 
164.Mozo&Hooykaas Plant Mol.Biol.16:917-918(1991). 
165.Mundy和Chua,EMBO J.,7:2279(1988). 
166.Munroe等,Gene,91:151(1990). 
167.Murakami等,Mol.Gen.Genet.,205:42(1986). 
168.Murata等,FEBS Lett.,296:187(1992). 
169.Murdock等,Phytochemistry,29:85(1990). 
170.Murray等,Nucleic Acids Res.,17:477(1989). 
171.Myers和Miller,CABIOS,4:11(1988). 
172.Naested,Plant J 18:571-576(1999). 
173.Napoli等,Plant Cell,2:279(1990). 
174.Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970). 
175.Nehra等Plant J.5:285-297(1994) 
176.Niedz等,Plant Cell Reports,14:403(1995). 
177.Odell等,Mol.Gen.Genet.,113:369(1990). 
178.Odell等,Nature,313:810(1985). 
179.Ohtsuka等,J.Biol.Chem.,260:2605(1985) 
180.Olhoft等Plant Cell Rep 20:706-711(2001) 
181.Ow等,Science,234:856(1986). 
182.Pacciotti等,Bio/Technology,3:241(1985). 
183.Park等,J.Plant Biol.,38:365(1985). 
184.Paszkowski等,EMBO J.,3:2717(1984). 
185.Pearson和Lipman,Proc.Natl.Acad.Sci.,85:2444(1988). 
186.Pearson等,Meth.Mol.Biol.,24:307(1994). 
187.Perera等Plant Mol.Biol 23(4):793-799(1993). 
188.Perlak等,Proc.Natl.Acad.Sci.USA,88:3324(1991). 
189.Phillips等,In Corn&Corn Improvement,3rd Edition 10Sprague etal.(Eds.pp.345-387)(1988). 
190.Phi-Van等,Mol.Cell.Biol.,10:2302(1990). 
191.Piatkowski等,Plant Physiol.,94:1682(1990). 
192.Potrykus等,Mol. Gen.Genet.,199:183(1985). 
193.Potrykus,Trends Biotech.,7:269(1989). 
194.Prasher等,Biochem.Biophys.Res.Comm.,126:1259(1985). 
195.Proudfoot,Cell,64:671(1991). 
196.Reed等,J.Gen.Microbiol.,130:1(1984). 
197.Riggs等,Proc.Natl.Acad.Sci.USA,83:5602(1986). 
198.Rossolini等,Mol.Cell.Probes,8:91(1994). 
199.Ruiz,Plant Cell,10:937(1998). 
200.Sambrook等,Molecular Cloning:A Laboratory Manual(2d ed.,ColdSpring Harbor Laboratory Press,Plainview,N.Y.)(1989). 
201.Sanfacon等,Genes Dev.,5:141(1991). 
202.Sanford等,Particulate Science and Technology,5:27(1987). 
203.Scheeren-Groot等J.Bacteriol 176:6418-6426(1994). 
204.Schenborn和Groskreutz Mol Biotechnol 13(1):29-44(1999). 
205.Schlaman和Hooykaas Plant J 11:1377-1385(1997). 
206.Schoffl等Mol Gen Genetics 217(2-3):246-53(1989). 
207.Shagan等,Plant Physiol.,101:1397(1993). 
208.Shah等,Science 233:478(1986). 
209.Shapiro,Mobile Genetic Elements,Academic Press,N.Y.(1983). 
210.Shimamoto等,Nature,338:274(1989). 
211.Silhavy等,Experiments with  Gene Fusions,Cold  Spring HarborLaboratory Press,Cold Spring Harbor(NY),(1984). 
212.Skuzeski等,Plant Molec.Biol.15:65-79(1990). 
213.Smith等,Adv.Appl.Math.,2:482.(1981). 
214.Smith等,Mol.Gen.Genet.,224:447(1990). 
215.Spencer等,Theor.Appl.Genet,79:625(1990).Spencer 1992Referenzfehlt 
216.Stalker等,Science,242:419(1988). 
217.Staub等,EMBO J.,12:601(1993). 
218.Staub等,Plant Cell,4:39(1992). 
219.Steifel等,The Plant Cell,2:785(1990). 
220.Stemmer,Nature,370:389(1994). 
221.Stemmer,Proc.Natl.Acad.Sci.USA,91:10747(1994). 
222.Stief等,Nature,341:343(1989). 
223.Stougaard,Plant J 3:755-761(1993) 
224.Sukhapinda等,Plant Mol. Biol.,8:209(1987). 
225.Sundaresan等Gene Develop 9:1797-1810(1995) 
226.Sutcliffe,PNAS USA,75:3737(1978). 
227.Svab等,Plant Mol.Biol.14:197(1990) 
228.Svab等,Proc.Natl.Acad.Sci.USA,87:8526(1990). 
229.Svab等,Proc.Natl.Acad.Sci.USA,90:913(1993). 
230.Tarczynski等,PNAS USA,89:2600(1992). 
231.Thillet等,J.Biol.Chem.,263:12500(1988). 
232.Tij ssen,Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes,Elsevier,N.Y.(1993). 
233.Tomes等,Plant Cell,Tissue and Organ Culture:FundamentalMethods,Springer Verlag,Berlin(1995). 
234.Tomic等,NAR,12:1656(1990). 
235.Turner等,Molecular Biotechnology,3:225(1995). 
236.Twell等,Plant Physiol.,91:1270(1989). 
237.Ugaki等,Nucl.Acids Res.,19:371(1991). 
238.Ulmasov等,Plant Mol.Biol.,35:417(1997). 
239.Upender等,Biotechniques,18:29(1995). 
240.van der Krol等,Plant Cell,2:291(1990). 
241.Vanden Elzen等,Plant Mol Biol.5:299(1985) 
242.Vasil等Bio/Technology,10:667-674(1992) 
243.Vasil等,Bio/Technology,11:1153-1158(1993) 
244.Vasil等,Mol.Microbiol.,3:371(1989). 
245.Vasil等,Plant Physiol.,91:1575(1989). 
246.Vernon和Bohnert,EMBO J.,11:2077(1992). 
247.Walker和Gaastra,编辑,Techniques in Molecular Biology,MacMillanPublishing Company,New York(1983). 
248.Wan&Lemaux,Plant Physiol.,104:3748(1994). 
249.Wang等,Mol.Cell.Biol.,12:3399(1992). 
250.Waterman,Introduction to Computational Biology:Maps,sequencesand genomes.Chapman&Hall.London(1995). 
251.Watrud等,in Engineered Organisms and the Environment(1985). 
252.Watson等J.Bacteriol 123,255-264(1975) 
253.Watson等,Corn:Chemistry and Technology(1987). 
254.Weeks等Plant Physiol 102:1077-1084(1993) 
255.Weissinger等,Annual Rev.Genet.,22:421(1988). 
256.White等,Nucl Acids Res,18,1062(1990). 
257.Wingender等,Nucleic Acids Res 29(1):281-3(2001) 
258.Wolter等,EMBO Journal,11:4685(1992). 
259.Wyn-Jones和Storey,Physiology and Biochemistry of DroughtResistance in Plants,Paleg等(编辑),pp.171-204(1981). 
260.Yamaguchi-Shinozaki等,Plant Cell Physiol.,33:217(1992). 
261.Zhang等,Proc.Natl.Acad.Sci.USA,94:4504(1997). 
262.Zukowsky等,PNAS USA,80:1101(1983). 
所有出版物、专利和专利申请在此引入作为参考。尽管在前述关于某些优选实施方案的说明书中已经描述了本发明,并且用于说明的目的已经阐述了许多细节,但是对于本领域技术人员来说显而易见的是,本发明容许另外的实施方案,并且这里描述的某些细节可进行相当大的变化而不背离本发明的基本原则。 
Figure IDA00002496098900011
Figure IDA00002496098900021
Figure IDA00002496098900031
Figure IDA00002496098900061
Figure IDA00002496098900071
Figure IDA00002496098900101
Figure IDA00002496098900111
Figure IDA00002496098900131
Figure IDA00002496098900141
Figure IDA00002496098900151
Figure IDA00002496098900161
Figure IDA00002496098900171
Figure IDA00002496098900191
Figure IDA00002496098900201
Figure IDA00002496098900221
Figure IDA00002496098900231
Figure IDA00002496098900241
Figure IDA00002496098900261
Figure IDA00002496098900271
Figure IDA00002496098900291
Figure IDA00002496098900301
Figure IDA00002496098900311
Figure IDA00002496098900321
Figure IDA00002496098900331
Figure IDA00002496098900341
Figure IDA00002496098900351
Figure IDA00002496098900371
Figure IDA00002496098900381
Figure IDA00002496098900401
Figure IDA00002496098900411
Figure IDA00002496098900421
Figure IDA00002496098900431
Figure IDA00002496098900441
Figure IDA00002496098900451
Figure IDA00002496098900461
Figure IDA00002496098900471
Figure IDA00002496098900481
Figure IDA00002496098900491
Figure IDA00002496098900501
Figure IDA00002496098900511
Figure IDA00002496098900531
Figure IDA00002496098900541
Figure IDA00002496098900551
Figure IDA00002496098900561
Figure IDA00002496098900571
Figure IDA00002496098900581
Figure IDA00002496098900591
Figure IDA00002496098900611
Figure IDA00002496098900621
Figure IDA00002496098900631
Figure IDA00002496098900641
Figure IDA00002496098900651
Figure IDA00002496098900661
Figure IDA00002496098900671
Figure IDA00002496098900681
Figure IDA00002496098900691
Figure IDA00002496098900701
Figure IDA00002496098900711
Figure IDA00002496098900721
Figure IDA00002496098900731
Figure IDA00002496098900741
Figure IDA00002496098900751
Figure IDA00002496098900761
Figure IDA00002496098900771
Figure IDA00002496098900791
Figure IDA00002496098900801
Figure IDA00002496098900811
Figure IDA00002496098900821
Figure IDA00002496098900831
Figure IDA00002496098900851
Figure IDA00002496098900871
Figure IDA00002496098900881
Figure IDA00002496098900891
Figure IDA00002496098900901
Figure IDA00002496098900931
Figure IDA00002496098900941

Claims (26)

1.在单子叶植物中调控表达的表达盒,包括
i)至少一个单子叶植物基因的转录调控核苷酸序列,所述的单子叶植物基因为乳酸脱氢酶基因,
和与之功能性相连的
ii)至少一个核苷酸序列,其与所述转录调控序列是异源的。
2.权利要求1的表达盒,其中转录调控核苷酸序列可从多肽编码基因的单子叶植物基因组DNA中获得,其中所述多肽
a1)包含单子叶植物乳酸脱氢酶蛋白的至少一个序列基序,所述序列基序选自如下氨基酸序列:
i)SLSELGFDA      (SEQ ID NO:76),
ii)VIGAGNVGMA    (SEQ ID NO:77),
iii)IVTAGARQI    (SEQ ID NO:78),
iv)L(F/Y)RKIVP   (SEQ ID NO:79),
v)GFPASRV        (SEQ ID NO:80),
vi)RF(L/I)AEHL   (SEQ ID NO:81),
vii)QAYMVGEH     (SEQ ID NO:82),
viii)ALEGIRRAV   (SEQ ID NO:83),和
ix)GYSVAS(L/I)A  (SEQ ID NO:84),
或者
b1)编码单子叶植物乳酸脱氢酶蛋白,与选自SEQ ID NO:26、60和65所述的多肽具有至少90%的氨基酸序列同一性。
3.权利要求1或2的表达盒,其中转录调控核苷酸序列来自玉米或稻植物。
4.权利要求1至3中任一项的表达盒,其中转录调控核苷酸序列来自选自玉米乳酸脱氢酶基因及其功能等同物的植物基因。
5.权利要求4的表达盒,其中功能等同物基因编码与选自SEQ ID NO:26、60和65所述多肽具有至少90%氨基酸序列同一性的多肽。
6.在单子叶植物中调控表达的表达盒,包括
a)至少一个在单子叶植物中有功能的转录调控核苷酸序列,其包含选自如下序列的至少一个序列:
i)SEQ ID NO:19、20、21、22、23、24、56、57、58、61、62、和63所述的序列,和
ii)i)中序列的至少50个连续碱基的片段;和
iii)与SEQ ID NO:19、20、21、22、23、24、56、57、58、61、62、或63所述转录调控核苷酸序列基本上相似、具有至少60%序列同一性的核苷酸序列;和
iv)能与SEQ ID NO:19、20、21、22、23、24、56、57、58、61、62、或63所述的转录调控核苷酸序列或其互补物在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用2×SSC、0.1%SDS于50℃洗涤的条件下杂交的核苷酸序列;和
v)能与如下核酸杂交的核苷酸序列,其中所述核酸包含SEQ ID NO:19、20、21、22、23、24、56、57、58、61、62、或63所述的转录调控核苷酸序列或其互补物的50至200个或更多个连续核苷酸;和
vi)上述i)至v)核苷酸序列中任一的互补物或反向互补物核苷酸序列,
b)至少一个核酸序列,其与所述转录调控序列是异源的。
7.权利要求1至5中任一项的表达盒,其中转录调控核苷酸序列如权利要求6中所定义。
8.权利要求6或7的表达盒,其中权利要求6的ii)、iii)、iv)、v)和vi)中所定义的序列能够在单子叶植物细胞或生物体中修饰转录。
9.权利要求6或7的表达盒,其中权利要求6的ii)、iii)、iv)、v)和vi)中所定义的序列与SEQ ID NO:19、20、21、22、23、24、56、57、58、61、62、或63所述的转录调控核苷酸序列基本上具有相同的转录调控活性。
10.权利要求6的表达盒,其中权利要求6的iv)或v)中所定义的序列在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,用0.1×SSC、0.1%SDS于65℃洗涤的严谨条件下与所指定的靶序列杂交。
11.权利要求1至10中任一项的表达盒,其中核酸序列的表达导致蛋白质的表达,或者反义RNA、正义或双链RNA的表达。
12.权利要求1至11中任一项的表达盒,其中表达盒还包括至少一种选自如下的元件:
a)植物表达基因的5’非翻译区,和
b)植物表达基因的内含子序列,和
c)植物表达基因的转录终止序列。
13.权利要求12的表达盒,其中转录终止序列选自SEQ ID NO:32、34和35所述的序列。
14.权利要求12的表达盒,其中5’非翻译区与转录调控序列来自相同的基因。
15.权利要求12的表达盒,其中内含子序列具有增强表达的特性。
16.权利要求12或15的表达盒,其中内含子序列是遍在蛋白、肌动蛋白或醇脱氢酶基因的内含子。
17.权利要求1至16中任一项的表达盒,其中核酸序列的表达赋予植物农艺学上有价值的性状。
18.分离的核酸序列,包含至少一个如SEQ ID NO:19、20或21所述的转录调控核苷酸序列。
19.载体,含有权利要求1至17中任一项所述的表达盒。
20.转基因宿主细胞或者非人生物体,含有权利要求1至17中任一项所述的表达盒或者权利要求19所述的载体。
21.转基因植物,含有权利要求1至17中任一项所述的表达盒或者权利要求19所述的载体。
22.用于在单子叶植物中鉴定和/或分离转录调控核苷酸序列的方法,其特征在于所述鉴定和/或分离利用如SEQ ID NO:26、60、或65所述氨基酸序列的编码核酸序列,或者至少15个碱基的所述核酸序列的部分。
23.权利要求22的方法,其中核酸序列如SEQ ID NO:25、59、或64所述,或其至少15个碱基的部分。
24.权利要求22或23的方法,其中所述鉴定和/或分离通过选自聚合酶链式反应、杂交和数据库筛选的方法实现。
25.提供用于在单子叶植物中进行异源表达的转基因表达盒的方法,包括步骤:
I.利用至少一个核酸序列或其部分从单子叶植物分离转录调控核苷酸序列,其中所述序列编码SEQ ID NO:26、60、或65所述的多肽,或者至少15个碱基的所述核酸序列的部分,和
II.将所述转录调控核苷酸序列功能性连接于其他目的核苷酸序列,后者与所述转录调控核苷酸序列异源。
26.权利要求22至25中任一项的方法,其中分离所述转录调控核苷酸序列所采用的核苷酸序列编码这样的多肽,所述多肽包含:
a1)单子叶植物乳酸脱氢酶蛋白的至少一个序列基序,其中序列基序选自如下氨基酸序列:
i)SLSELGFDA       (SEQ ID NO:76),
ii)VIGAGNVGMA     (SEQ ID NO:77),
iii)IVTAGARQI     (SEQ ID NO:78),
iv)L(F/Y)RKIVP    (SEQ ID NO:79),
v)GFPASRV         (SEQ ID NO:80),
vi)RF(L/I)AEHL    (SEQ ID NO:81),
vii)QAYMVGEH      (SEQ ID NO:82),
viii)ALEGIRRAV    (SEQ ID NO:83),和
ix)GYSVAS(L/I)A   (SEQ ID NO:84)。
CN2012104998130A 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒 Pending CN103131697A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US65126805P 2005-02-09 2005-02-09
US60/651,268 2005-02-09

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN 200680011376 Division CN101155922A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒

Publications (1)

Publication Number Publication Date
CN103131697A true CN103131697A (zh) 2013-06-05

Family

ID=36659859

Family Applications (5)

Application Number Title Priority Date Filing Date
CN2011102344768A Pending CN102277377A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN2012104994394A Pending CN103184218A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN2012104998376A Pending CN103131727A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN2012104998130A Pending CN103131697A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN 200680011376 Pending CN101155922A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN2011102344768A Pending CN102277377A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN2012104994394A Pending CN103184218A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒
CN2012104998376A Pending CN103131727A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN 200680011376 Pending CN101155922A (zh) 2005-02-09 2006-02-08 在单子叶植物中调控表达的表达盒

Country Status (6)

Country Link
US (2) US8884098B2 (zh)
EP (5) EP2186903A3 (zh)
CN (5) CN102277377A (zh)
AU (1) AU2006212223B2 (zh)
CA (1) CA2596600A1 (zh)
WO (1) WO2006084868A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110709519A (zh) * 2017-03-31 2020-01-17 先锋国际良种公司 表达调控元件及其用途
CN116891862A (zh) * 2023-08-22 2023-10-17 江苏省中国科学院植物研究所 一种沟叶结缕草耐盐基因ZmLA1、蛋白及其应用

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2343618B1 (es) * 2009-02-03 2011-06-20 Consejo Superior De Investigaciones Cientificas (Csic) Polinucleotido que comprende secuencias de gliadinas de trigo y su uso para silenciamiento mediante rnai.
CA3175433A1 (en) 2009-08-31 2011-03-03 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for enhancing constitutive gene expression in plants
EP3473722B1 (en) * 2010-01-14 2021-05-05 Monsanto Technology LLC Plant regulatory elements and uses thereof
AR085759A1 (es) * 2011-04-21 2013-10-23 Basf Plant Science Co Gmbh Metodos para modificar la biosintesis de la lignina y mejorar la digestibilidad
US10316327B2 (en) 2013-03-15 2019-06-11 Yi Li Genetically modified plants that are insect-resistant and/or rot resistant
US20140283220A1 (en) * 2013-03-15 2014-09-18 Yi Li Genetically Modified Plants that are Herbivore-Resistant
US20160210446A1 (en) * 2015-01-19 2016-07-21 Dell Products, Lp System and Method for Providing Persistent Authentication in an Information Handling System
RS65228B1 (sr) * 2016-08-03 2024-03-29 Meiragtx Uk Ii Ltd Celularni skrining visoke propusnosti za aptamere
US10412186B2 (en) * 2016-08-18 2019-09-10 Level 3 Communications, Llc Front-end optimization in a content delivery network (CDN)
CN107058525B (zh) * 2017-03-21 2020-12-29 济南大学 一种基于基因表达量与性状动态相关性预测玉米未知基因功能的方法
CN109943579B (zh) * 2019-04-18 2020-06-02 长江师范学院 一种岷江百合LrCCoAOMT基因及其应用
US20220220495A1 (en) 2019-05-10 2022-07-14 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants
CA3150334A1 (en) 2019-09-12 2021-03-18 Frank Meulewaeter REGULATORY NUCLEIC ACID MOLECULES TO ENHANCE GENE EXPRESSION IN PLANTS
CN110484545B (zh) * 2019-09-17 2023-03-28 东北师范大学 一种从野生大豆中分离出来的抗花叶病毒GsCAD1基因、编码蛋白及其应用
WO2021069387A1 (en) 2019-10-07 2021-04-15 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants
CN114787365A (zh) 2019-12-03 2022-07-22 巴斯夫欧洲公司 用于在植物中增强基因表达的调节性核酸分子
CN112159816B (zh) * 2020-10-09 2022-08-26 西南大学 番茄富含羟脯氨酸系统素前体蛋白基因SlHypSys在提高植物对黄萎病抗性中的应用
CN113046377B (zh) * 2021-04-28 2022-08-16 吉林农业大学 一种雄性不育基因MsGAL及其应用
CN113957087B (zh) * 2021-11-22 2023-04-28 天津市农业科学院 Sub基因在调控水稻耐寒性中的应用
WO2024083579A1 (en) 2022-10-20 2024-04-25 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants
CN116676417B (zh) * 2023-07-24 2023-09-29 捷康生物科技(海南)有限公司 转基因大豆事件jk1001-3及其检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003000898A1 (en) * 2001-06-22 2003-01-03 Syngenta Participations Ag Plant genes involved in defense against pathogens
WO2003040322A2 (en) * 2001-11-07 2003-05-15 Syngenta Participations Ag Promoters for regulation of gene expression in plant roots

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
EP0138341B1 (en) 1983-09-03 1988-10-26 Bass Public Limited Company Beer and other beverages and their manufacture
EP0154204B1 (en) 1984-03-06 1994-01-12 Mgi Pharma, Inc. Herbicide resistance in plants
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
DE3687682T2 (de) 1985-08-07 1993-08-19 Monsanto Co Glyphosat resistente pflanzen.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
NZ225044A (en) 1987-06-19 1990-01-29 Plant Cell Res Inst Bertholletia excelsa dna molecule; sulphur rich storage protein
DE58909753D1 (de) 1988-03-08 1997-01-23 Ciba Geigy Ag Regeneration von fertilen Gramineen-Pflanzen aus der Unterfamilie Pooideae ausgehend von Protoplasten
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
US5837848A (en) * 1990-03-16 1998-11-17 Zeneca Limited Root-specific promoter
ATE225853T1 (de) * 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
FR2673642B1 (fr) 1991-03-05 1994-08-12 Rhone Poulenc Agrochimie Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate.
DK152291D0 (da) 1991-08-28 1991-08-28 Danisco Fremgangsmaade og kemiske forbindelser
CA2181548C (en) 1994-01-18 2009-11-03 Carlos F. Barbas, Iii Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
US5633363A (en) * 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5879941A (en) 1995-10-06 1999-03-09 University Of Florida Polypeptides and polynucleotides relating to the α-and β-subunits of a glutamate dehydrogenase and methods of use
IN1997CH00924A (en) 1996-05-03 2005-03-04 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate
DE19619353A1 (de) 1996-05-14 1997-11-20 Bosch Gmbh Robert Verfahren zur Herstellung eines integriert optischen Wellenleiterbauteiles sowie Anordnung
US6420629B1 (en) 1996-09-09 2002-07-16 B.C. Research Inc. Process of increasing plant growth and yield and modifying cellulose production in plants
WO1998026045A1 (en) 1996-12-13 1998-06-18 The General Hospital Corporation Stress-protected transgenic plants
US5998701A (en) 1997-06-04 1999-12-07 Her Majesty The Queen In Right Of Canada As Represented By The Department Of Agriculture Potatoes having improved quality characteristics and methods for their production
EP0870836A1 (de) 1997-04-09 1998-10-14 IPK Gatersleben 2-Desoxyglucose-6-Phosphat (2-DOG-6-P) Phosphatase DNA-Sequenzen als Selektionsmarker in Pflanzen
CA2288672A1 (en) 1997-05-02 1998-11-12 Mogen International N.V. Regulating metabolism by modifying the level of trehalose-6-phosphate by inhibiting endogenous trehalase levels
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
ZA986308B (en) 1997-07-18 1999-11-24 Pioneer Hi Bred Int The induction of stress-related factors in plants.
WO1999005902A1 (en) 1997-07-30 1999-02-11 Purdue Research Foundation Transgenic plants tolerant of salinity stress
ES2232000T3 (es) 1997-08-01 2005-05-16 Performance Plants, Inc. Metodo para producrir una planta tolerante a la sequedad.
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
PT1056864E (pt) * 1998-02-26 2004-12-31 Pioneer Hi Bred Int Promotores constitutivos do milho
ES2341926T3 (es) 1998-03-02 2010-06-29 Massachusetts Institute Of Technology Poliproteinas con dedos de cinc que tienen enlazadores mejorados.
CN1202246C (zh) 1998-04-08 2005-05-18 联邦科学和工业研究组织 获得修饰表型的方法和措施
US6429293B1 (en) 1998-06-26 2002-08-06 Hsc Research And Development Limited Partnership Sculpin-type antifreeze polypeptides and nucleic acids
AU5779499A (en) 1998-08-28 2000-03-21 Pioneer Hi-Bred International, Inc. Organelle targeting sequences
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6545200B1 (en) * 1998-12-16 2003-04-08 E. I. Du Pont De Nemours And Company Sterol biosynthetic enzymes
WO2000044914A1 (en) 1999-01-28 2000-08-03 Medical College Of Georgia Research Institute, Inc. Composition and method for in vivo and in vitro attenuation of gene expression using double stranded rna
DE19956568A1 (de) 1999-01-30 2000-08-17 Roland Kreutzer Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens
WO2000049035A1 (en) 1999-02-19 2000-08-24 The General Hospital Corporation Gene silencing
EP2363478B1 (en) 1999-04-21 2019-07-24 Alnylam Pharmaceuticals, Inc. Methods and compositions for inhibiting the function of polynucleotide sequences
SK16222001A3 (sk) 1999-05-10 2002-04-04 Syngenta Participations Ag Spôsob zmeny expresie vírusového genómu
US6429357B1 (en) 1999-05-14 2002-08-06 Dekalb Genetics Corp. Rice actin 2 promoter and intron and methods for use thereof
US6207879B1 (en) * 1999-05-14 2001-03-27 Dekalb Genetics Corporation Maize RS81 promoter and methods for use thereof
GB9914210D0 (en) * 1999-06-17 1999-08-18 Danisco Promoter
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
WO2002000900A2 (de) 2000-06-28 2002-01-03 Sungene Gmbh & Co. Kgaa Binärvektoren zur verbesserten transformation von pflanzlichen systemen
EP1343875B1 (en) 2000-12-22 2012-02-29 CropDesign N.V. Sugar beet genes involved in stress tolerance
AU2002341541A1 (en) 2001-06-22 2003-03-03 Syngenta Participations Ag Abiotic stress responsive polynucleotides and polypeptides
GB0201043D0 (en) 2002-01-17 2002-03-06 Swetree Genomics Ab Plants methods and means
US7205454B2 (en) * 2002-07-31 2007-04-17 Bayer Bioscience N.V. Corn root preferential promoters and uses thereof
EP1620539A4 (en) * 2003-05-05 2007-09-26 Monsanto Technology Llc TRANSGENIC PLANTS WITH INCREASED GLYCIN BETAIN

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003000898A1 (en) * 2001-06-22 2003-01-03 Syngenta Participations Ag Plant genes involved in defense against pathogens
WO2003040322A2 (en) * 2001-11-07 2003-05-15 Syngenta Participations Ag Promoters for regulation of gene expression in plant roots

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GOOD A.G.AND PAETKAU D.H.: "Identification and characterization of a hypoxically induced maize lactate dehydrogenase gene", 《PLANT MOLECULAR BIOLOGY》 *
GOOD A.G.AND PAETKAU D.H.: "Z11754.1", 《NCBI GENBANK》 *
MARY E.CHRISTOPHER AND ALLEN C.COOD: "Characterization of Hypoxically Inducible Lactate Dehydrogenase in Maize", 《PLANT PHYSIOL.》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110709519A (zh) * 2017-03-31 2020-01-17 先锋国际良种公司 表达调控元件及其用途
CN110709519B (zh) * 2017-03-31 2023-09-15 先锋国际良种公司 表达调控元件及其用途
US11814637B2 (en) 2017-03-31 2023-11-14 Pioneer Hi-Bred International, Inc Expression modulating elements and use thereof
CN116891862A (zh) * 2023-08-22 2023-10-17 江苏省中国科学院植物研究所 一种沟叶结缕草耐盐基因ZmLA1、蛋白及其应用
CN116891862B (zh) * 2023-08-22 2024-01-30 江苏省中国科学院植物研究所 一种沟叶结缕草耐盐基因ZmLA1、蛋白及其应用

Also Published As

Publication number Publication date
EP2163633A1 (en) 2010-03-17
AU2006212223B2 (en) 2010-11-25
CN101155922A (zh) 2008-04-02
US8884098B2 (en) 2014-11-11
US20150033409A1 (en) 2015-01-29
WO2006084868A2 (en) 2006-08-17
CA2596600A1 (en) 2006-08-17
EP2147977A1 (en) 2010-01-27
CN103184218A (zh) 2013-07-03
EP2184361A3 (en) 2010-07-14
US20080163395A1 (en) 2008-07-03
EP2186903A2 (en) 2010-05-19
EP1851318A2 (en) 2007-11-07
EP2186903A3 (en) 2010-09-08
CN103131727A (zh) 2013-06-05
WO2006084868A3 (en) 2007-01-25
AU2006212223A1 (en) 2006-08-17
CN102277377A (zh) 2011-12-14
EP2184361A2 (en) 2010-05-12

Similar Documents

Publication Publication Date Title
CN103131697A (zh) 在单子叶植物中调控表达的表达盒
CN101128591B (zh) 用于植物中种子偏好性表达的表达盒
CN101631868B (zh) 用于在单子叶植物中调节胚特异性表达的核酸序列
CN101198701B (zh) 单子叶植物中的淀粉胚乳特异性和/或萌芽胚特异性表达
US7902423B2 (en) Expression cassettes for seed-preferential expression that utilize the promoter from a flax tonoplast intrinsic protein gene
AU2005222518B2 (en) Constitutive expression cassettes for regulation of plant expression
CN102471777B (zh) 用于在植物中胚乳-特异性表达的表达盒
US7375209B2 (en) Expression cassettes for seed-preferential expression in plants
AU2006245701A1 (en) Expression cassettes for seed-preferential expression in plants
AU2013202703A1 (en) Constitutive expression cassettes for regulation of plant expression
WO2006131490A1 (en) Expression cassettes for seed-preferential expression in plants
AU2006228605A1 (en) Expression cassettes for seed-preferential expression in plants
EP1655364A2 (en) Expression cassettes for seed-preferential expression in plants
WO2006125749A2 (en) Expression cassettes for seed-preferential expression in plants
WO2006089911A2 (en) Expression cassettes for seed-preferential expression in plants
WO2006131477A1 (en) Expression cassettes for seed-preferential expression in plants

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130605