CN109068602A - 用于转基因表达的植物启动子和3’utr - Google Patents

用于转基因表达的植物启动子和3’utr Download PDF

Info

Publication number
CN109068602A
CN109068602A CN201780027892.6A CN201780027892A CN109068602A CN 109068602 A CN109068602 A CN 109068602A CN 201780027892 A CN201780027892 A CN 201780027892A CN 109068602 A CN109068602 A CN 109068602A
Authority
CN
China
Prior art keywords
sequence
plant
promoter
seq
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780027892.6A
Other languages
English (en)
Inventor
M·古谱塔
S·库马尔
S·戈尔曼
A·F·渥尔登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN109068602A publication Critical patent/CN109068602A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本公开涉及采用玉米GRMZM2G138258启动子促进植物或植物细胞中核苷酸序列转录的组合物和方法。一些实施方案涉及玉米GRMZM2G138258启动子,其在植物中起作用以促进可操作连接的核苷酸序列的转录。其他实施方案涉及玉米GRMZM2G138258 3'UTR,其在植物中起作用以终止可操作连接的核苷酸序列的转录。

Description

用于转基因表达的植物启动子和3’UTR
本申请要求基于2016年3月11日在美国专利商标局提交的临时申请62/306,990的优先权,该临时申请的全部公开内容通过提述并入本文。
通过提述并入以电子方式提交的材料
通过提述整体并入与本同时提交的计算机可读核苷酸/氨基酸序列列表,其被标识如下:建立于2016年3月11日的名称为“78797-US-PSP-20160126-Sequence-Listing-ST25.txt”的一个26.0KB的ACII(文本)文件”。
公开领域
本公开总体上涉及用于促进植物或植物细胞中核苷酸序列转录的组合物和方法。一些实施方案涉及新的玉米(Zea mays)GRMZM2G138258启动子和其他玉米GRMZM2G138258调控元件,其在植物发挥促进和/或终止可操作连接的核苷酸序列的转录的作用。特定的实施方案涉及包括启动子的方法(例如,将核酸分子引入细胞)和包含启动子的细胞、细胞培养物、组织、生物体及生物体部分,以及由此产生的产物。其他实施方案涉及包括3’UTR的方法(例如,将核酸分子引入细胞)和包含启动子的细胞、细胞培养物、组织、生物体及生物体部分,以及由此产生的产物。
背景
许多植物物种能够用转基因进行转化,以导入农艺学上期望的性状或特征。植物物种被开发和/或修饰从而具有特定的期望性状。通常,期望性状例如包括,提高营养价值质量,增加产量,赋予抗虫性或抗病性,增加干旱和胁迫耐受性,提高园艺质量(例如,着色和生长),赋予除草剂耐受性,使得能够从植物生产在工业上有用的化合物和/或材料,和/或使得植物能够生产药物。
通过植物转化技术来生产包含在单一基因组基因座中叠加的多个转基因的转基因植物物种。植物转化技术导致转基因导入植物细胞中、回收在植物基因组中含有转基因的稳定整合拷贝的能育转基因植物,并且通过植物基因组的转录和翻译的后续转基因表达生成具有期望性状和表型的转基因植物。然而,能够产生高表达构造为性状堆(traitstack)的多个转基因的转基因植物物种的机制是人们所期望的。
同样,能够在植物的特定组织或器官内表达转基因的机制是人们所期望的。例如,可以借助于土传病原体通过用病原体抗性基因转化植物基因组使得病原体-抗性蛋白在植物根内强表达而实现植物对感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。此外,可能希望在植物的叶和茎组织中表达转基因,以提供对除草剂的耐受性、或对地表昆虫和害虫的抗性。
因此,需要能够在特定植物组织中驱动期望的转基因表达水平的新的基因调控元件。
简述
在本主题公开的实施方案中,本主题公开涉及包含启动子的核酸载体,所述启动子与多接头序列、非GRMZM2G138258基因、或多接头序列与非GRMZM2G138258基因的组合可操作连接,其中所述启动子包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。在这个实施方案的若干方面中,启动子的长度为1,838bp。进一步的实施方案包括由与SEQID NO:1具有至少90%序列同一性的多核苷酸序列组成的启动子。在其他方面,启动子与选择标志物可操作连接。在另外的方面,启动子与转基因可操作连接。示例性转基因包括:选择标志物或赋予杀虫抗性、除草剂耐受性、氮利用效率、小RNA表达、位点特异性核酸酶、水分利用效率或营养品质的基因产物。在进一步的方面,核酸载体包含与SEQ ID NO:5具有至少90%序列同一性的3'非翻译多核苷酸序列,其中3'非翻译序列与所述多接头或所述转基因可操作连接。在其他方面,核酸载体包含与SEQ ID NO:3具有至少90%序列同一性的5'非翻译多核苷酸序列,其中5'非翻译序列与所述多接头或所述转基因可操作连接。在进一步的方面,核酸载体包含内含子序列。本公开的启动子进一步驱动叶组织中的转基因表达。
在本主题公开进一步的实施方案中,本公开涉及非玉米栽培种B73植物,其包含与转基因可操作连接的与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。在这个实施方案的一个方面,植物选自下组:小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属、烟草、向日葵、和卡诺拉。在另一个方面,植物是玉米植物。在进一步的方面,将转基因插入植物的基因组中。在其他实施方案中,与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列是启动子。在另一个方面,植物包含含有SEQ ID NO:5的3'非翻译序列,其中3'非翻译序列与所述转基因可操作连接。在进一步的方面,启动子驱动叶组织的转基因表达。在这些实施方案的另外方面,启动子的长度为1,838bp。
在本主题公开的其他实施方案中,提供了用于产生转基因植物细胞的方法。所述方法包括下列步骤:用包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米GRMZM2G138258启动子的基因表达盒转化植物细胞;分离包含所述基因表达盒的转化植物细胞;以及,产生包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米GRMZM2G138258启动子的转基因植物细胞。在这个实施方案的一个方面,用植物转化方法进行植物细胞的转化。植物转化方法选自下列转化方法中的任一种:土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列优先在叶组织中表达。在另外的方面,感兴趣的多核苷酸序列稳定整合到转基因植物细胞的基因组中。在另外的方面,所述方法进一步包括以下步骤:将转基因植物细胞再生成转基因植物,并获得转基因植物,其中所述转基因植物包括包含与至少一个感兴趣的多核苷酸序列可操作连接的权利要求1的玉米GRMZM2G138258启动子的基因表达盒。在所述实施方案的另一个方面,所述转基因植物细胞是单子叶转基因植物细胞或双子叶转基因植物细胞。因此,双子叶转基因植物细胞可以是拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,单子叶植物转基因植物细胞可以是玉米植物细胞、水稻植物细胞和小麦植物细胞。在其他方面,玉米GRMZM2G138258启动子包含多核苷酸SEQ IDNO:1。在一个方面,所述实施方案包括与SEQ ID NO:1的3'端可操作连接的第一感兴趣的多核苷酸序列。
本主题公开进一步涉及用于在植物细胞中表达感兴趣的多核苷酸序列的方法,所述方法包括将与玉米GRMZM2G138258启动子可操作连接的感兴趣的多核苷酸序列引入植物细胞中。在这个实施方案的一个方面,通过植物转化方法将与玉米GRMZM2G138258启动子可操作连接的感兴趣的多核苷酸序列引入植物细胞中。在一个另外的方面,植物转化方法选自土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列在整个植物细胞中呈组成型表达。在其他方面,感兴趣的多核苷酸序列稳定整合到植物细胞的基因组中。在一个实施方案中,转基因植物是单子叶植物细胞或双子叶植物细胞。因此,双子叶植物细胞包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,单子叶植物细胞包括玉米植物细胞、水稻植物细胞和小麦植物细胞。
本主题公开进一步涉及包含玉米GRMZM2G138258启动子的转基因植物细胞。在这个实施方案的一个方面,转基因植物细胞包含转基因事件。在其他方面,转基因事件包括农艺性状。示例性转基因性状包括杀虫抗性性状、除草剂耐受性性状、氮利用效率性状、水分利用效率性状、营养品质性状、DNA结合性状、选择标志物性状、小RNA性状或其任何组合。在一个实施方案中,除草剂耐受性性状包括aad-1编码序列。在其他方面,转基因植物细胞产生商品。例如,所述商品可以是蛋白质浓缩物、蛋白质分离物、籽粒、粗粉、面粉、油或纤维。在进一步的方面,转基因植物细胞选自双子叶植物细胞或单子叶植物细胞。例如,单子叶植物细胞可以是玉米植物细胞。在其他方面,玉米GRMZM2G138258启动子包含与多核苷酸SEQID NO:1具有至少90%序列同一性的多核苷酸。在进一步的方面,玉米GRMZM2G138258启动子的长度为1,838bp。在又另一个方面,玉米GRMZM2G138258启动子包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。进一步的方面包括与SEQ ID NO:1的3'端可操作连接的第一感兴趣的多核苷酸序列。在一个另外的方面,农艺性状优先在叶组织中表达。
本主题公开进一步涉及包含与多核苷酸SEQ ID NO:1具有至少90%序列同一性的核酸序列的分离的多核苷酸。在这个实施方案的一个方面,分离的多核苷酸在叶组织中具有优先表达。在其他方面,分离的多核苷酸在植物细胞内具有表达活性。在进一步的方面,分离的多核苷酸包含编码多肽的开放阅读框多核苷酸;和终止序列。在一个另外的方面,多核苷酸SEQ ID NO:1的长度为1,838bp。
根据下面参考附图展开的若干实施方案的详细说明,能够更清楚地了解前述特征和其他特征。
附图简述
图1:这个图是pDAB108741的示意图,pDAB108741在驱动cry3Ab1转基因表达的基因表达盒中含有具有SEQ ID NO:1的玉米GRMZM2G138258启动子和具有SEQ ID NO:5的玉米GRMZM2G1382583’UTR。
发明详述
I.若干实施方案概述
转基因植物产品的开发变得日益复杂。现在,对于商业上可行的转基因植物,需要将多个转基因叠加到单基因座中。用于基础研究或生物技术应用的植物启动子通常是单向的,仅仅指导融合在其3’端(下游)的一个基因。用于基础研究或生物技术应用的植物3’UTR通常是单向的,其仅仅终止融合在其5’端(上游)的一个基因的表达。因此,每个转基因通常需要用于表达的启动子和用于终止表达的3'UTR,其中在一个基因叠加内需要多个启动子和3'UTR来表达多个转基因。随着基因叠加中转基因数量的增加,常规使用相同的启动子和3'UTR来获得不同转基因的表达模式的相似水平。获得转基因表达的相似水平对于产生单一多基因性状是必需的。不幸的是,已知由相同的启动子和3’UTR驱动的多基因构建体引起基因沉默,从而产生在该领域中不十分有效的转基因产品。重复的启动子和3’UTR元件可导致基于同源性的基因沉默。另外,在转基因内的重复序列可能导致基因基因座内同源重组,从而导致多核苷酸重排。转基因的沉默和重排将很可能对产生的转基因植物表达转基因的性能具有不良影响。此外,由于启动子重复导致的转录因子(TF)结合位点的过量可引起内源TF的消耗,从而导致转录失活。鉴于对于代谢工程和性状叠加而言需要将多个基因引入植物中,需要多个启动子和3'UTR来开发驱动多个基因表达的转基因作物。
在启动子鉴定中的一个突出问题是需要鉴定组织特异性启动子,此类启动子与植物中的具体细胞类型、发育阶段和/或功能有关,在其他植物组织中不表达。组织特异性(即,组织优选的)或器官特异性启动子驱动某些组织中(如植物的籽粒、根、叶或绒毡层中)的基因表达。根据观察在特定组织中或在植物发育过程中的特定时期表达的基因的表达,可以初步鉴定出组织和发育阶段特异性启动子。这些组织特异性启动子在转基因植物行业中对于某些应用是需要的和期望的,因为它们可允许异源基因以组织和/或发育阶段选择性方式特异性表达,指示异源基因在不同的器官、组织和/或时间上的差别表达,而不是在其他组织中表达。例如,可以用病原体抗性基因转化植物基因组,使得病原体抗性蛋白在植物根内强表达,而实现植物对土传病原体感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。另一种令人期望的应用是利用组织特异性启动子将编码农艺性状的转基因的表达局限在特定的组织类型中,如发育的薄壁组织细胞中。如此,在启动子鉴定中的一个突出问题是如何鉴定启动子,以及如何将鉴定的启动子与用于特异性组织表达的细胞的发育特性相关联。
与鉴定启动子或3’UTR有关的另一个问题是必须克隆所有相关的顺式-作用和反式激活转录控制元件,使得克隆的DNA片段以想要的特异性表达模式驱动转录。鉴于这样的控制元件位于远离翻译起始或开始位点的位置,包含启动子的多核苷酸的大小的选择对于提供启动子多核苷酸序列的表达水平和表达模式是重要的。鉴于用于终止3'UTR的类似元件位于远离翻译终止或停止位点的位置,包含3'UTR的多核苷酸的大小选择为对于提供由多核苷酸序列编码的转基因的表达的终止是重要的。已知启动子和3'UTR的长度包括功能信息,并且已显示,许多不同基因相比基因组中其他基因的启动子具有更长或更短的启动子。阐明启动子的转录起始位点和预测启动子区中的功能基因元件是具有挑战性的。调控基序及顺式和反式调控元件的复杂性、多样性和固有的简并性质进一步增加了这种挑战性(Blanchette,Mathieu等人,"Genome-wide computational prediction oftranscriptional regulatory modules reveals new insights into human geneexpression."Genome research16.5(2006):656-668)。顺式和反式调控元件位于启动子的远端部分,其调节基因的空间和时间表达,使之仅在需要的位点和特定时间发生(Porto,MilenaSilva等人,"Plant promoters:an approach of structure and function."Molecular biotechnology 56.1(2014):38-49)。现有的启动子分析工具无法可靠地鉴定基因组序列中的这种顺式调控元件,因而会预测太多的假阳性,原因是这些工具通常只关注序列内容(Fickett JW,Hatzigeorgiou AG(1997)Eukaryotic promoterrecognition.Genome research 7:861–878)。因此,鉴定启动子调控元件要求获得具有特定大小的适当序列,其将导致以期望的方式驱动可操作连接的转基因的表达。此外,鉴定3'UTR调控元件要求获得具有特定大小的适当序列,其将导致以期望的方式终止可操作连接的转基因的表达。
提供了通过使用玉米GRMZM2G138258启动子元件和其他玉米GRMZM2G138258调控元件来克服这样的问题以便在植物中表达转基因的方法和组合物。
II.术语和缩写
在整个申请中,使用了许多术语。为了提供对说明书和权利要求书的清楚且一致的理解,包括要赋予此类术语的范围,提供了以下定义。
如本文中使用的,术语“内含子”是指包含在基因(或表达的感兴趣的多核苷酸序列)中的被转录但不被翻译的任何核酸序列。内含子包括表达的DNA序列之内的非翻译核酸序列、以及从所述DNA序列转录的RNA分子中的相应序列。本文中描述的构建体还可以含有增强翻译和/或mRNA的稳定性的序列,如内含子。一个这样的内含子的实例是拟南芥组蛋白H3变体的基因II的第一内含子或任何其他公知的内含子序列。内含子可与启动子序列联合用于增强翻译和/或mRNA的稳定性。
如本文中使用的术语“分离的”意指当化合物最初形成时已经从其自然环境中移除,或者已经从存在的其他化合物中移除。术语“分离的”包括从天然来源分离的物质以及通过在宿主细胞中重组表达制备之后回收的物质(例如,核酸和蛋白质),或化学合成的化合物,如核酸分子、蛋白质、和肽类。
如本文中使用的术语“纯化的”涉及分子或化合物的分离,所述分子或化合物处于基本上不含污染物(通常与天然或自然环境中的所述分子或化合物相关)的形式,或相对于在所述化合物最初形成时存在的其他化合物在浓度上高度富集,并且意指作为从原始组成的其他组分分离的结果在纯度上已经增加。术语“纯化的核酸”在本文中用来描述已经从其他生物化合物(包括但不限于,多肽、脂质和碳水化合物)分离、分开产生、或纯化出来,同时影响组分的化学或功能变化的核酸序列(例如,通过移除蛋白质污染物并使连接核酸与染色体中的其余DNA的化学键断裂,可将核酸从染色体中纯化出来)。
如本文中使用的,术语“合成的”是指通过作为体外过程的化学合成产生的多核苷酸(即DNA或RNA)分子。例如,可以在EppendorfTM管内的反应过程中产生合成DNA,从而由DNA或RNA的天然链以酶促方式产生合成DNA。可以使用其他实验室方法来合成多核苷酸序列。可以使用亚磷酰胺通过固相合成在寡核苷酸合成仪上化学合成寡核苷酸。合成的寡核苷酸可以退火到彼此之上成为复合物,从而产生“合成的”多核苷酸。用于化学合成多核苷酸的其他方法是本领域已知的,并且可以容易地实施以便用于本公开中。
本文中使用的术语“大约”意指比陈述的值或值的范围大或小10%,但不意图针对仅仅这个更宽的定义指定任何值或值的范围。在每个值或值的范围之前的术语“大约”同样意图涵盖所陈述的绝对值或值的范围的实施方案。
就本公开的目的而言,“基因”包括编码基因产物(如上所述)的DNA区域,也包括调节基因产物的产生的所有DNA区域,无论这类调控序列是否位于编码和/或转录序列的附近。因此,基因包括而不必限于,启动子序列、终止子、翻译调控序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和基因座控制区。
如本文中使用的术语“天然的”或“自然的”定义了在自然界中发现的状况。“天然DNA序列”是通过自然手段或传统育种技术产生的而不是通过基因工程(例如,使用分子生物学/转化技术)产生的存在于自然界中的DNA序列。
如本文中使用的“转基因”定义为编码基因产物(包括,例如但不限于mRNA)的核酸序列。在一个实施方案中,转基因为外源核酸,其中转基因序列已通过基因工程引入通常未发现所述转基因的宿主细胞(或其后代)中。在一个实例中,转基因编码在工业上或药学上有用的化合物、或编码期望的农艺性状的基因(例如,除草剂抗性基因)。在又另一个实例中,转基因为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。在一个实施方案中,转基因为内源核酸,其中所述内源核酸的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸序列处于反义取向的核酸。
如本文中使用的,术语“非GRMZM2G138258转基因”或“非GRMZM2G138258基因”是任何与GRMZM2G138258基因编码序列(SEQ ID NO:4)的序列同一性小于80%的转基因。
如本文中定义的“基因产物”是由基因产生的任何产物。例如,基因产物可以是基因直接转录的产物(例如,mRNA、tRNA、rRNA、反义RNA、干扰RNA、核酶、结构RNA或任何其他类型的RNA)或mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和剪接(editing)修饰过的RNA,以及通过例如,甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、豆蔻酰化(myristilation)和糖基化修饰的蛋白质。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从DNA到RNA再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、RNA运输和加工、中间分子比如mRNA的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,Northern印迹、RT-PCR、Western印迹,或体外、原位或体内蛋白活性测定,可以在RNA水平或蛋白质水平测量基因表达。
如本文中使用的,术语“基因表达”是指这样的过程,通过该过程,核酸转录单元(包括,例如基因组DNA)的编码信息被转化为细胞的操作部分、非操作部分、或结构部分(常常包括蛋白质的合成)。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从DNA到RNA再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、RNA运输和加工、中间分子比如mRNA的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,Northern印迹、RT-PCR、Western印迹,或体外、原位或体内蛋白活性测定,可以在RNA水平或蛋白质水平测量基因表达。
如本文中使用的,术语“基于同源性的基因沉默”(HBGS)为通用术语,其包括转录基因沉默和转录后基因沉默两者。通过未连接的沉默基因座使靶基因座沉默可由于转录抑制(转录基因沉默;TGS)或mRNA降解(转录后基因沉默;PTGS)所致,原因在于产生分别对应于启动子或转录序列的双链RNA(dsRNA)。在每个过程中涉及不同的细胞组分表明,dsRNA诱导的TGS和PTGS很可能是由于古老的普遍机制的多样化所致。然而,由于通常依赖于分析不同的沉默基因座,已经难于实现TGS和PTGS的严格比较。在一些情况下,由于产生对应于启动子和不同靶基因的转录序列的dsRNA,单个转基因基因座能够触发TGS和PTGS两者。Mourrain等人,(2007)Planta225:365-79。siRNA很可能是在同源序列上触发TGS和PTGS的实际分子:siRNA在这个模型中将通过转基因序列的甲基化扩散到内源启动子中来触发顺式和反式同源序列的沉默和甲基化。
如本文中使用的,术语“核酸分子”(或“核酸”、或“多核苷酸”)可以是指核苷酸的聚合形式,其可包括RNA的正义和反义链、cDNA、基因组DNA、和合成形式,以及上述的混合聚合物。核苷酸可以是指核糖核苷酸、脱氧核糖核苷酸、或这两种类型核苷酸的任一者的修饰形式。如本文中使用的“核酸分子”与“核酸”和“多核苷酸”是同义词。除非另外指明,核酸分子的长度通常为至少10个碱基。该术语可以指具有不确定长度的RNA或DNA分子。该术语包括DNA的单和双链形式。核酸分子可以包括天然存在的核苷酸和/或修饰核苷酸,它们通过天然存在和/或非天然存在的核苷酸连接而连接在一起。
本领域技术人员易于理解,核酸分子可被化学修饰或生物化学修饰,或者可以含有非天然的或衍生的核苷酸碱基。这样的修饰包括,例如,标记物、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰(例如,如不带电连接(uncharged linkage)的修饰:例如甲基膦酸盐、磷酸三酯、亚磷酰胺、氨基甲酸酯等;带电连接(charged linkage)的修饰:例如,硫代磷酸酯、二硫代磷酸酯等;悬垂部分的修饰:例如肽类;嵌入剂修饰:例如吖啶、补骨脂素等;螯合剂修饰;烷化剂(alkylator)修饰;和修饰的连接:例如α异头核酸等)。术语“核酸分子”还包括任何拓扑结构,包括单链的、双链的、部分双链体的、三链体的、发夹形的(hairpinned)、圆形的、和挂锁形的结构。
转录以5′到3′的方式沿着DNA链进行。这表明通过向生长链的3′端连续添加5′-核糖核苷三磷酸而产生RNA(消除焦磷酸基团是必不可少的)。在线性或环状核酸分子中,如果离散元件结合到或将要结合到同一核酸上另一个元件的5′方向,则所述离散元件(例如,特定的核苷酸序列)可称为相对于所述另一个元件的“上游”或“5′”。类似地,如果离散元件结合到或将要结合到同一核酸上另一个元件的3′方向,则所述离散元件可为相对于所述另一个元件的“下游”或“3′”。
如本文中使用的,碱基“位置”是指在指定核酸之内的给定碱基或核苷酸残基的位置。可通过与参考核酸的比对(参见下文)定义指定核酸。
杂交涉及两条多核苷酸链通过氢键结合。寡核苷酸及其类似物通过互补碱基之间的氢键杂交,所述氢键包括Watson-Crick、Hoogsteen或反Hoogsteen氢键。通常,核酸分子由含氮碱基组成,所述碱基为嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或嘌呤(腺嘌呤(A)和鸟嘌呤(G))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶对嘌呤的键合被称为“碱基配对”。更具体地说,A会与T或U键合,而G会与C键合。“互补”指在两条不同的核酸序列或同一核酸序列的两个不同区域之间发生的碱基配对。
“可特异性杂交”和“特异性互补”为表明互补性的足够程度的术语,该互补性使得在寡核苷酸与DNA或RNA靶之间发生稳定且特异的结合。寡核苷酸不必100%与其可特异性杂交的靶序列互补。当寡核苷酸与靶DNA或RNA分子的结合干扰了DNA或RNA的正常功能时,所述寡核苷酸是可特异性杂交的,并且存在足够的互补程度,以避免在期望特异性结合的条件下(例如在体内测定或系统情形的生理条件下)的寡核苷酸与非靶序列的非特异性结合。这样的结合被称为特异性杂交。
导致特定严格程度的杂交条件会根据选择的杂交方法的性质和杂交的核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg2+浓度)有助于杂交的严格性,尽管洗涤时间也影响严格性。关于得到特定严格程度所需要的杂交条件的计算论述于Sambrook等人(编),Molecular Cloning:A Laboratory Manual,第2版,1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York,1989,第9章和第11章中。
如本文中使用的,“严格条件”涵盖的条件为,在这样的条件下,只有当杂交分子与DNA靶之间的错配小于50%时才发生杂交。“严格条件”包括进一步的特定严格性水平。因此,如本文中使用的,“中等严格性”条件为具有大于50%的序列错配的分子不会杂交的条件;“高严格性”条件为具有大于20%错配的分子不会杂交的条件;并且“极高严格性”条件为具有大于10%错配的序列不会杂交的条件。
在特定的实施方案中,严格条件可包括:在65℃杂交,然后在65℃用0.1x SSC/0.1%SDS洗涤40分钟。
以下是代表性的非限制性杂交条件:
极高严格性:在5x SSC缓冲液中在65℃杂交16小时;在2x SSC缓冲液中在室温下洗涤两次,每次15分钟;并且在0.5x SSC缓冲液中在65℃洗涤两次,每次20分钟。
高严格性:在5x-6x SSC缓冲液中在65-70℃杂交16-20小时;在2x SSC缓冲液中在室温下洗涤两次,每次5-20分钟;并且在1x SSC缓冲液中在55-70℃洗涤两次,每次30分钟。
中等严格性:在6x SSC缓冲液中在室温到55℃杂交16-20小时;在2x-3x SSC缓冲液中在室温到55℃洗涤至少两次,每次20-30分钟。
在特定的实施方案中,可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。
寡核苷酸:寡核苷酸是一种短的核酸聚合物。寡核苷酸可通过切割较长核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪能够合成在长度上高达几百个碱基对的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合,它们可用作检测DNA或RNA的探针。由DNA组成的寡核苷酸(寡脱氧核糖核苷酸)可用于PCR中,PCR为用于扩增小DNA序列的技术。在PCR中,寡核苷酸一般被称为“引物”,其允许DNA聚合酶延伸寡核苷酸并复制互补链。
如本文中使用的,在两个核酸或多肽序列的情况下,如本文中使用的术语“序列同一性”或“同一性”可以是指在指定比较窗口上比对最大对应性时在这两个序列中相同的残基。
如本文中使用的,术语“序列同一性百分比”可以是指通过在比较窗口上比较两个最优比对序列(例如核酸序列和氨基酸序列)确定的值,其中在该比较窗口中的序列部分可以包含相比于参考序列(不包含添加或缺失)的添加或缺失(即,空位),用于这两个序列的最优比对。通过确定相同核苷酸或氨基酸残基出现在两个序列中的位置的数目而产生匹配位置的数目,用该匹配位置的数目除以比较窗口中的位置的总数,将结果乘以100而产生序列同一性的百分比,从而计算出该百分比。
用于比较的序列比对方法是本领域技术人员熟知的。各种程序和比对算法例如描述于Smith和Waterman(1981)Adv.Appl.Math.2:482;Needleman和Wunsch(1970)J.Mol.Biol.48:443;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins和Sharp(1988)Gene 73:237-44;Higgins和Sharp(1989)CABIOS 5:151-3;Corpet等人(1988)Nucleic Acids Res.16:10881-90;Huang等人(1992)Comp.Appl.Biosci.8:155-65;Pearson等人(1994)Methods Mol.Biol.24:307-31;Tatiana等人(1999)FEMSMicrobiol.Lett.174:247-50。序列比对方法和同源性计算的详细考虑事项可见于例如Altschul等人(1990)J.Mol.Biol.215:403-10。
可在几个来源访问美国国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLASTTM;Altschul等人(1990)),包括美国国家生物技术信息中心(Bethesda,MD)、以及在互联网上,其与几种序列分析程序结合使用。怎样使用该程序确定序列同一性的描述可在互联网的BLASTTM的“帮助”部分获得。为了比较核酸序列,可以采用利用默认参数的BLASTTM(Blastn)程序的“Blast 2序列”函数。在用这种方法评估时,与参考序列具有较大相似性的核酸序列将显示出同一性百分比的增加。
如本文中使用的,术语“可操作连接”涉及与第二核酸序列可操作连接的第一核酸序列,此时第一核酸序列处于与第二核酸序列的功能关系中。例如,当启动子影响编码序列的转录或表达时,则该启动子与该编码序列是可操作连接的。当以重组方式产生时,可操作连接的核酸序列通常是连续的,并且在这种情况下必需将两个蛋白质编码区连接在同一个阅读框内。然而,元件不必是连续地可操作连接的。
如本文中使用的,术语“启动子”是指通常位于基因上游(朝向基因的5’区)并且对于启动和驱动基因转录是需要的DNA区域。启动子可容许它所控制的基因的正确激活或阻抑。启动子可含有被转录因子识别的特异性序列。这些因子可与启动子DNA序列结合,导致RNA聚合酶的募集,所述RNA聚合酶为从基因的编码区合成RNA的酶。启动子通常是指位于基因上游的所有基因调控元件,包括上游启动子、5’UTR、内含子、和前导序列。
如本文中使用的,术语“上游启动子”是指足以指导转录起始的连续多核苷酸序列。如本文中使用的,上游启动子涵盖具有若干序列基序的转录起始位点,所述序列基序包括TATA盒、起始序列、TFIIB识别元件和其他启动子基序(Jennifer,E.F.等人,(2002)Genes&Dev.,16:2583-2592)。该上游启动子对RNA聚合酶II提供作用位点,所述RNA聚合酶II为具有像TFIIA、B、D、E、F和H的基础或通用转录因子的多亚基酶。这些因子组装成转录前起始复合物,所述转录前起始复合物催化从DNA模板到RNA的合成。
上游启动子的激活是通过另外的调控性DNA序列元件的序列完成的,其中各种蛋白质结合到调控性DNA序列元件上并且随后与转录起始复合物相互作用而激活基因表达。这些基因调控元件序列与特异性DNA结合因子相互作用。这些序列基序有时可称为顺式元件。组织特异性或发育特异性转录因子与之结合的这样的顺式元件可单独地或联合地在转录水平决定启动子的时空表达模式。这些顺式元件在它们在可操作连接的基因上发挥作用的控制类型方面变化很大。一些元件响应于环境反应(例如,温度、湿度、和伤害)起作用而增加可操作连接的基因的转录。其他的顺式元件可响应于发育线索(例如,萌发、种子成熟、和开花)或响应于空间信息(例如,组织特异性)。参见,例如,Langridge等人,(1989)Proc.Natl.Acad.Sci.USA 86:3219-23。这些顺式元件位于转录起始位点的不同距离,一些顺式元件(称作近端元件)邻近最小核心启动子区,而其他元件可定位在启动子(增强子)的上游或下游几千个碱基处。
如本文中使用的,术语“5’非翻译区”或“5’UTR”或“5’UTR”定义为前mRNA或成熟mRNA的5’端中的非翻译区段。例如,在成熟mRNA上,5’UTR一般在其5’端上包含7-甲基鸟苷帽并涉及许多过程,如剪接、多腺苷酸化、mRNA朝向细胞质输出、通过翻译机器的mRNA的5’端的识别、以及保护mRNA免于降解。
如本文中使用的,术语“转录终止子”定义为前mRNA或成熟mRNA的3’端中的转录区段。例如,超过“多腺苷酸化信号”位点的更长DNA段被转录为前mRNA。这个DNA序列常常含有用于将前mRNA正确加工为成熟mRNA的转录终止信号。
如本文中使用的,术语“3’非翻译区”或“3’UTR”或“3’UTR”定义为前mRNA或成熟mRNA的3’端中的非翻译区段。例如,在成熟mRNA上,这个区域包含多聚(A)尾并且已知其在mRNA稳定性、翻译起始、和mRNA输出中具有多种作用。另外,3’UTR被认为包括多腺苷酸化信号和转录终止子。
如本文中使用的,术语“多腺苷酸化信号”指示存在于mRNA转录物中的核酸序列,当存在多聚(A)聚合酶时,所述核酸序列允许在例如位于多聚(A)信号的下游的10到30个碱基的多腺苷酸化位点上进行转录物的多腺苷酸化。许多多腺苷酸化信号在本领域是已知的并可用于本发明。示例性序列包括AAUAAA及其变体,正如描述于Loke J.等人,(2005)PlantPhysiology 138(3);1457-1468。
“DNA结合转基因”是编码DNA结合蛋白的多核苷酸编码序列。随后,DNA结合蛋白能够与另一个分子结合。结合蛋白可与例如DNA分子(DNA-结合蛋白)、RNA分子(RNA-结合蛋白)和/或蛋白质分子(蛋白质-结合蛋白)结合。在蛋白质-结合蛋白的情况下,它可与自身结合(形成同二聚体、同三聚体,等)和/或它可与一个或多个不同的蛋白质分子结合。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有DNA-结合、RNA-结合和蛋白质-结合的活性。
DNA结合蛋白的实例包括:大范围核酸酶、锌指、CRISPR和TALE结合结构域,其可被“工程改造”为与预定的核苷酸序列结合。工程改造的DNA结合蛋白(例如,锌指、CRISPR、或TALE)一般是非-天然存在的蛋白质。用于工程改造DNA-结合蛋白的方法的非-限制性实例是设计和选择。设计的DNA结合蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rational criteria)。用于设计的合理标准包括应用替换原则和计算机化算法对存储已有ZFP、CRISPR、和/或TALE设计和结合数据的信息的数据库进行信息处理。参见,例如,美国专利6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496和美国公开文本No.20110301073、20110239315和20119145940。
“锌指DNA结合蛋白”(或结合结构域)是一种蛋白质,或一种更大蛋白质内的结构域,其通过一个或多个锌指以序列-特异性的方式结合DNA,所述锌指是结合结构域内的氨基酸序列区域,其结构通过与锌离子的配位而稳定化。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。锌指结合结构域可被“工程改造”为结合预定的核苷酸序列。用于工程改造锌指蛋白的方法的非-限制性实例是设计和选择。设计的锌指蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rational criteria)。用于设计的合理的标准包括应用替换原则和计算机化算法对存储已有ZFP设计和结合数据的信息的数据库进行信息处理。参见,例如,美国专利No.6,140,081;6,453,242;6,534,261和6,794,136;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
在其他实例中,一种或多种核酸酶的DNA-结合结构域包含天然存在的或工程改造的(非-天然存在的)TAL效应子DNA结合结构域。参见,例如,美国专利公开文本No.20110301073,通过提述将其完整并入本文。已知黄单胞菌属的植物病原菌在重要作物中引起许多疾病。黄单胞菌属的致病性依赖于保守的III型分泌(T3S)系统,其将25种以上不同的效应子蛋白注入植物细胞中。这些注入的蛋白质为转录激活子-样(TALEN)效应子,其模拟植物转录激活子并操纵植物转录组(参见Kay等人,(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录活化结构域。最充分表征的TAL-效应子之一是来自野油菜黄单胞菌疱病致病变种的AvrBs3(参见Bonas等人,(1989)Mol Gen Genet 218:127-136和WO2010079430)。TAL-效应子含有串联重复序列的集中域,每个重复序列大致含34个氨基酸,所述氨基酸对于这些蛋白质的DNA结合特异性是关键的。另外,它们含有核定位序列和酸性转录活化域(综述可参见Schornack S等人,(2006)J Plant Physiol 163(3):256-272)。另外,在植物病原细菌青枯劳尔氏菌中,已经发现在青枯劳尔氏菌生物型菌株GMI1000和生物型4菌株RS1000中的命名为brg11和hpx17的两个基因与黄单胞菌属AvrBs3家族同源(参见Heuer等人,(2007)Appl and Enviro Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此有98.9%相同,但是因在hpx17的重复结构域中的1,575bp的缺失而不同。然而,两种基因产物都具有与黄单胞菌属AvrBs3家族蛋白小于40%的序列同一性。参见,例如,美国专利公开文本No.20110301073,通过提述将其完整并入。
这些TAL效应子的特异性取决于在串联重复序列中发现的序列。重复序列大致包含102bp,并且重复序列彼此之间一般具有91-100%的同源性(Bonas等人,同前)。重复序列的多态性常常位于位置12和13处,并且在位置12和13处的高变双残基的同一性与在TAL-效应子的靶序列中的连续核苷酸的同一性之间,似乎存在着在一-对-一的对应关系(参见Moscou和Bogdanove,(2009)Science 326:1501和Boch等人,(2009)Science 326:1509-1512)。在实验上,已经确定了这些TAL-效应子的DNA识别的天然密码,使得在位置12和13处的HD序列导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,并且ING与T结合。这些DNA结合重复序列已组装成具有新的重复序列组合和数目的蛋白质,从而产生能够与新的序列相互作用并激活植物细胞中的非-内源报告基因表达的人工转录因子(Boch等人,同前)。工程改造的TAL蛋白已经与FokI切割半结构域连接以产生在酵母报告基因测定(基于质粒的靶标)中表现出活性的TAL效应子结构域核酸酶融合(TALEN)。
CRISPR(成簇的规律间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶系统是基于可用于基因组工程改造的细菌系统的最近工程改造的核酸酶系统。其基于许多细菌和古细菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入物的DNA区段通过‘免疫'应答转化为CRISPR RNA(crRNA)。然后,这种crRNA通过部分互补区域与另一类称为tracrRNA的RNA结合,以将Cas9核酸酶引导至与靶DNA中的crRNA同源的区域,称为“原型间隔序列”。Cas9切割DNA以在由crRNA转录物中所含的20-核苷酸的引导序列指定的位点处在双-链断裂(DSB)处产生平末端。对于位点特异性DNA识别和切割,Cas9需要crRNA和tracrRNA两者。这个系统现已被工程改造,使得crRNA和tracrRNA可结合成一个分子(“单个引导RNA”),单个引导RNA的crRNA等效部分可经工程改造以引导Cas9核酸酶靶向任何期望序列(参见Jinek等人,(2012)Science 337,816-821页,Jinek等人,(2013),eLife 2:e00471,和David Segal,(2013)eLife 2:e00563)。因此,CRISPR/Cas系统可经工程改造以在基因组中的期望靶标处产生DSB,并且可通过使用修复抑制剂影响DSB的修复而引起易错修复增加。
在其他实例中,DNA结合转基因为包含工程改造的(非天然存在的)大范围核酸酶(也描述为归巢核酸内切酶)的位点特异性核酸酶。归巢核酸内切酶或大范围核酸酶(如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII)的识别序列是已知的。还参见美国专利No.5,420,032;美国专利No.6,833,252;Belfort等人,(1997)Nucleic Acids Res.25:3379–30 3388;Dujon等人,(1989)Gene 82:115–118;Perler等人,(1994)Nucleic Acids Res.22,11127;Jasin(1996)Trends Genet.12:224–228;Gimble等人,(1996)J.Mol.Biol.263:163–180;Argast等人,(1998)J.Mol.Biol.280:345–353和New England Biolabs catalogue。另外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可被工程改造为结合非天然靶位点。参见,例如,Chevalier等人,(2002)Molec.Cell 10:895-905;Epinat等人,(2003)NucleicAcids Res.5 31:2952-2962;Ashworth等人,(2006)Nature 441:656-659;Paques等人,(2007)Current Gene Therapy 7:49-66;美国专利公开No.20070117128。归巢核酸内切酶和大范围核酸酶的DNA-结合结构域总的来说在核酸酶的背景下可予以改变(即,使得核酸酶包括同源切割结构域)或可融合至异源切割结构域。
如本文中使用的,术语“转化”涵盖可将核酸分子引入这种细胞中的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质体转染;显微注射(Mueller等人,(1978)Cell 15:579-85);土壤杆菌-介导的转移;直接DNA摄取;WHISKERSTM-介导的转化;和微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化两者。术语“稳定转化”指将核酸片段引入宿主生物的基因组中,从而导致在遗传上稳定的遗传。一旦稳定转化,该核酸片段稳定整合到宿主生物和任何后续世代的基因组中。含有该转化的核酸片段的宿主生物被称为“转基因”生物。术语“瞬时转化”指将核酸片段引入宿主生物的细胞核、或含有DNA的细胞器中,从而导致不具备在遗传上稳定的遗传的基因表达。
外源核酸序列。在一个实例中,转基因是基因序列(例如,除草剂抗性基因)、编码工业或药学上有用的化合物的基因、或编码期望的农业性状的基因。在又另一个实例中,转基因为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。转基因可含有与该转基因可操作连接的调控序列(例如,启动子)。在一些实施方案中,感兴趣的多核苷酸序列为转基因。然而,在其他实施方案中,感兴趣的多核苷酸序列为内源核酸序列,其中所述内源核酸序列的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸分子处于反义取向的核酸序列。
如本文中使用的,通过用异源DNA(即,包含感兴趣的转基因的核酸构建体)转化植物细胞,再生由于将转基因插入植物的基因组中所产生的植物群体,并选择其特征为插入到特定基因组位置中的特定植物,产生了术语转基因“事件”。术语“事件”是指原始转化体和包含所述异源DNA的所述转化体的子代。术语“事件”也指通过转化体与包含基因组DNA/转基因DNA的另一个品种之间的有性异型杂交所产生的子代。即使在与轮回亲本重复回交之后,来自转化亲本的插入转基因DNA和侧翼基因组DNA(基因组DNA/转基因DNA)也存在于杂交子代中的相同染色体位置。术语“事件”也指来自包含插入DNA和紧邻插入DNA的侧翼基因组序列的原始转化体及其子代的DNA,由于包含插入DNA的一个亲本品系(例如原始转化体和由自交产生的子代)与不含所述插入DNA的亲本品系的有性杂交,预期所述插入DNA将被转移到接受包括感兴趣的转基因在内的插入DNA的子代中。
如本文中使用的,术语“聚合酶链反应”或“PCR”定义了其中微量核酸、RNA和/或DNA被扩增的程序或技术,正如1987年7月28日公布的美国专利No.4,683,195中所描述的。通常,需要可用的来自感兴趣区域的末端的序列信息或其他信息,使得可以设计寡核苷酸引物;这些引物与有待扩增的模板的相对链在序列上相同或相似。两个引物的5’端核苷酸可与扩增材料的末端一致。PCR可用来扩增特异性RNA序列、来自总的基因组DNA的特异性DNA序列、和从总的细胞RNA、噬菌体或质粒序列等转录的cDNA。总体上参见Mullis等人,Cold Spring Harbor Symp.Quant.Biol.,51:263(1987);Erlich编辑,PCR Technology,(Stockton Press,NY,1989)。
如本文中使用的,术语“引物”是指当条件适合于合成引物延伸产物时能够用作沿着互补链的合成的起始点的寡核苷酸。合成条件包括四种不同的脱氧核糖核苷三磷酸和诸如逆转录酶或DNA聚合酶的至少一种聚合诱导剂的存在。这些物质存在于适合的缓冲液中,所述缓冲液可包括作为辅因子或在不同的适当温度下影响诸如pH等条件的组分。引物优选地是单链序列,使得扩增效率得以最佳化,但亦可以利用双链序列。
如本文中使用的,术语“探针”是指与靶序列杂交的寡核苷酸。在型测定程序中,探针与位于两个引物的退火位点之间的靶部分杂交。探针包含约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸、或约五十个核苷酸。在一些实施方案中,探针包含从约八个核苷酸到约十五个核苷酸。探针可进一步包含可检测标记,例如,荧光团异硫氰酸荧光素,等)。可检测标记可直接地共价附接到探针寡核苷酸上,例如位于探针的5’端或探针的3’端。包含荧光团的探针还可进一步包含猝灭剂,例如,Black Hole QuencherTM、Iowa BlackTM,等。
如本文中使用的,术语“限制性核酸内切酶”和“限制酶”是指细菌酶,它们每一者切割在特异性核苷酸序列处或附近的双链DNA。2型限制酶在同一位点识别和切割DNA,并且包括但不限于XbaI、BamHI、HindIII、EcoRI、XhoI、SalI、KpnI、AvaI、PstI和SmaI。
如本文中使用的,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换地使用,并且意指藉此可将DNA或RNA序列(例如,外来序列)引入宿主细胞中的媒介物,从而转化宿主并促进引入序列的表达(例如转录和翻译)。“非病毒载体”意图表示不包含病毒或反转录病毒的任何载体。在一些实施方案中,“载体”为包含至少一个DNA复制起点和至少一个选择标志物基因的DNA序列。实例包括但不限于携带外源DNA进入细胞的质粒、粘粒、噬菌体、细菌人工染色体(BAC)或病毒。载体还可包括一个或多个基因、反义分子、和/或选择标志物基因和本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,由此引起细胞表达核酸分子和/或由该载体编码的蛋白质。术语“质粒”定义了能够在原核或真核宿主细胞中进行常染色体复制的环链核酸。该术语包括可为DNA或RNA并且可为单链或双链的核酸。质粒的定义还可包括相应于细菌复制起点的序列。
如本文中使用的,如本文中使用的术语“选择标志物基因”定义了编码蛋白质的基因或其他表达盒,所述蛋白质便于鉴定所述选择标志物基因插入其中的细胞。例如,“选择标志物基因”涵盖报告基因以及在植物转化中使用的基因,以便例如保护植物细胞免受选择剂的影响或提供针对选择剂的抗性/耐受性。在一个实施方案中,只有那些接受功能性选择标志物的细胞或植物才能在具有选择剂的条件下分裂或生长。选择剂的实例可以包括,例如包括大观霉素、新霉素、卡那霉素、巴龙霉素、庆大霉素、和潮霉素在内的抗生素。这些选择标志物包括表达赋予抗生素卡那霉素抗性的酶的针对新霉素磷酸转移酶的基因(nptII),和针对有关抗生素新霉素、巴龙霉素、庆大霉素和G418的基因,或表达赋予潮霉素抗性的酶的针对潮霉素磷酸转移酶的基因(hpt)。其他选择标志物基因可以包括编码除草剂抗性的基因,包括bar或pat(针对草胺磷或膦丝菌素的抗性)、乙酰乳酸合酶(ALS,针对抑制剂诸如磺酰脲类(SU)、咪唑啉酮类(IMI)、三唑并嘧啶类(TP)、嘧啶基氧基苯甲酸酯类(POB)、和阻止支链氨基酸合成第一步的磺酰基氨基羰基三唑啉酮类的抗性)、草甘膦、2,4-D、和金属抗性或敏感性。可用作选择标志物基因的“报告基因”的实例包括表达的报告基因蛋白的视觉观察,所述报告基因蛋白例如编码的蛋白质:β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、DsRed、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT)、碱性磷酸酶等。短语“标志物阳性”是指已经被转化而包含选择标志物基因的植物。
如本文中使用的,术语“可检测标志物”是指能够检测的标记物,例如像放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螫合剂、或酶。可检测标志物的实例包括但不限于下列各项:荧光标记(例如,FITC、罗丹明、镧系磷光体)、酶标记(例如,辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶)、化学发光标记、生物素基;由次级报道分子识别的预定多肽表位(例如,亮氨酸拉链对序列、二级抗体的结合位点、金属结合结构域、表位标签)。在一个实施方案中,可检测标志物可通过不同长度的间隔臂附接,以降低潜在的空间位阻。
如本文中使用的,术语“盒”、“表达盒”和“基因表达盒”是指可在特异的限制性位点或通过同源重组插入核酸或多核苷酸中的DNA区段。如本文中使用的DNA区段包括编码感兴趣多肽的多核苷酸,所述盒和限制性位点被设计为确保所述盒插入用于转录和翻译的正确阅读框中。在一个实施方案中,表达盒可包含编码感兴趣多肽的多核苷酸,并且具有除了所述多核苷酸之外的便于特定宿主细胞转化的元件。在一个实施方案中,基因表达盒还可包括允许编码感兴趣多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、反应元件、终止子序列、多聚腺苷酸化序列,等。
如本文中使用的“接头”或“间隔区”是使两个分开的实体彼此结合的键、分子或分子基团。接头和间隔区可为两个实体提供最佳间距,或者可进一步提供允许两个实体彼此分开的不稳定连接。不稳定连接包括可光裂解的基团、酸不稳定性模块、碱不稳定性模块和酶可裂解的基团。如本文中使用的术语“多接头”或“多克隆位点”定义了彼此位于核酸序列上10个核苷酸之内的一簇三个或更多个2型限制酶位点。包含多接头的构建体用于插入和/或切除诸如基因的编码区的核酸序列。在其他情况下,如本文中使用的术语“多接头”是指通过任何已知的无缝克隆方法(即,GibsonNEBuilder HiFiDNAGolden Gate Assembly、Assembly,等等。)靶向连接两个序列的一段核苷酸。包含多接头的构建体用于插入和/或切除诸如基因的编码区的核酸序列。
如本文中使用的,术语“对照”是指在用于比较目的的分析程序中使用的样品。对照可为“阳性”或“阴性”。例如,在分析程序的目的为检测细胞或组织中的差异表达的转录物或多肽的情况下,通常优选包括阳性对照,例如来自展现出期望表达的已知植物的样品,以及阴性对照,例如来自缺乏期望表达的已知植物的样品。
如本文所使用的,术语“植物”包括整个植物及植物的任何后代、细胞、组织、或部分。可用于本发明中的植物类别通常宽泛地为适合于诱变的高等和低等植物类别,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类和多细胞藻类。因此,“植物”包括双子叶和单子叶植物。术语“植物部分”包括植物的任何部分,包括,例如但不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(如花粉、胚、花、果实、芽(shoot)、叶、根、茎、和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织、或者任何其他被组织成一定结构或功能单位的植物细胞群。植物细胞或组织培养物可能能够再生出具有该细胞或组织所来源的植物的生理学和形态学特征的植物,并且可能能够再生出与该植物具有基本上相同的基因型的植物。与之相反,一些植物细胞不能够再生而产生植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、须、花、果仁、穗、穗轴、壳、或茎。
植物部分包括可收获部分和可用于繁殖后代植物的部分。可用于繁殖的植物部分包括,例如但不限于:种子;果实;插条;苗;块茎;和根砧木。植物的可收获部分可以是植物的任何有用部分,包括,例如但不限于:花;花粉;苗;块茎;叶;茎;果实;种子;和根。
植物细胞是植物的结构和生理单位,包括原生质体和细胞壁。植物细胞可以是分离的单细胞或细胞聚集体的形式(例如,松散型(friable)愈伤组织和培养细胞),并且可以是更高级组织单位的一部分(例如,植物组织、植物器官、和植物)。因此,植物细胞可以是原生质体、配子产生细胞、或可以再生成完整植物的细胞或细胞集合。因此,包含多个植物细胞并能够再生为完整植物的种子,在本文的实施方案中被认为是“植物细胞”。
如本文中使用的,术语“小RNA”是指几类非编码核糖核酸(ncRNA)。术语小RNA描述了在细菌细胞、动物、植物、和真菌中产生的短链ncRNA。这些短链ncRNA可在细胞中天然产生或可以通过引入表达短链ncRNA的外源序列而产生。小RNA序列不直接编码蛋白质,并且与其他RNA在功能上不同之处在于,小RNA序列仅仅被转录而不被翻译。小RNA序列涉及其他细胞功能,包括基因表达和修饰。小RNA分子常常由约20个到30个核苷酸构成。小RNA序列可衍生自较长的前体。所述前体形成在自身-互补区中彼此折回的结构;然后它们被动物体内的核酸酶切丁酶或植物中的DCL1加工。
许多类型的小RNA天然存在或人工产生,包括microRNA(miRNA)、短干扰RNA(siRNA)、反义RNA、短发夹RNA(shRNA)、和小核仁RNA(snoRNA)。某些类型的小RNA,如microRNA和siRNA在基因沉默和RNA干扰(RNAi)中是重要的。基因沉默是其中通常表达的基因被细胞内元件(在这种情况下为小RNA)“关闭”的遗传调节过程。通常经由此遗传信息形成的蛋白质由于干扰而未形成,并且在该基因中编码的信息被阻断表达。
如本文中使用的,术语“小RNA”涵盖RNA分子,其在文献中被描述为“极小RNA”(Storz,(2002)Science 296:1260-3;Illangasekare等人,(1999)RNA 5:1482-1489);原核“小RNA”(sRNA)(Wassarman等人,(1999)Trends Microbiol.7:37-45);真核“非编码RNA(ncRNA)”;“微-RNA(miRNA)”;“小非-mRNA(snmRNA)”;“功能性RNA(fRNA)”;转运RNA(tRNA)”;“催化性RNA”[例如,核酶,包括自身-酰化核酶(Illangaskare等人,(1999)RNA 5:1482-1489);“小核仁RNA(snoRNA)”;“tmRNA”(又名“10S RNA”,Muto等人,(1998)TrendsBiochem Sci.23:25-29;和Gillet等人,(2001)Mol Microbiol.42:879-885);RNAi分子,包括但不限于“小干扰RNA(siRNA)”、“核酸内切酶-制备的siRNA(e-siRNA)”、“短发夹RNA(shRNA)”、和“时序调节小RNA(stRNA)”;“切丁酶酶切的siRNA(d-siRNA)”、以及包含至少一个尿嘧啶碱基的适体、寡核苷酸和其他合成核酸。
除非另外特别地解释,本文中使用的全部技术术语和科学术语具有与属于本公开的领域之内的普通技术人员通常所理解的相同的含义。可以在以下出版物中找到分子生物学中常见术语的定义:例如,Lewin,Genes V,Oxford University Press,1994(ISBN 0-19-854287-9);Kendrew等(编),The Encyclopedia of Molecular Biology,BlackwellScience Ltd.,1994(ISBN 0-632-02182-9);和Meyers(编),Molecular Biology andBiotechnology:A Comprehensive Desk Reference,VCH Publishers,Inc.,1995(ISBN 1-56081-569-8)。
如本文中使用的,冠词“一个(a)”、“一种(an)”和“该(the)”包括复数引用,除非上下文清楚且毫不含糊地另外规定。
III.玉米GRMZM2G138258启动子及包含它的核酸
提供了使用来自玉米GRMZM2G138258基因的启动子和其他调控元件在植物中表达非转基因的方法和组合物。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子。在进一步的实施方案中,3’UTR可以是具有SEQ ID NO:5的玉米GRMZM2G138258 3’UTR。
在一个实施方案中,提供了包含启动子的多核苷酸,其中所述启动子与SEQ IDNO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,启动子是玉米GRMZM2G138258启动子,其包含与多核苷酸SEQ ID NO:1具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在一个实施方案中,提供了分离的多核苷酸,其包含与多核苷酸SEQ ID NO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%的同一性。在一个实施方案中,提供了包含具有SEQ ID NO:1的玉米GRMZM2G138258启动子的核酸载体。在一个实施方案中,提供了包含与多接头可操作连接的玉米GRMZM2G138258启动子的多核苷酸。在一个实施方案中,提供了包含与非GRMZM2G138258转基因可操作连接的玉米GRMZM2G138258启动子的基因表达盒。在一个实施方案中,提供了包含与非GRMZM2G138258转基因可操作连接的玉米GRMZM2G138258启动子的核酸构建体。在一个实施方案中,启动子由SEQ ID NO:1组成。在说明性实施方案中,核酸载体包含与转基因可操作连接的玉米GRMZM2G138258启动子,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择标志物转基因、或它们的组合。
还可通过位于基因的编码序列下游的3’非翻译基因区(即,3’UTR)来调节转基因表达。启动子和3’UTR两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但3’UTR基因区能终止转录并起始用于翻译和蛋白质合成的所得mRNA转录物的多腺苷酸化。3’UTR基因区有助于转基因的稳定表达。
在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和3’UTR的核酸载体。在一个实施方案中,核酸构建体包含玉米GRMZM2G138258 3’UTR。在一个实施方案中,玉米GRMZM2G138258 3’UTR是SEQ ID NO:5。
在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和3’UTR的核酸载体,其中3’UTR与多核苷酸SEQ ID NO:5至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的核酸载体,其中玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR两者与多接头的两端可操作连接。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的基因表达盒,其中玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR两者与非GRMZM2G138258转基因的两端可操作连接。在一个实施方案中,3’UTR由SEQ ID NO:5组成。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的基因表达盒,其中玉米GRMZM2G138258启动子包含SEQ ID NO:1,并且玉米GRMZM2G1382583’UTR包含SEQ ID NO:5,其中所述启动子和3’UTR与非GRMZM2G138258转基因的两端可操作连接。在这个实施方案的一个方面,3’UTR由SEQ ID NO:5组成。在这个实施方案的另一方面,启动子由SEQ ID NO:1组成。在说明性实施方案中,基因表达盒包含与转基因可操作连接的玉米GRMZM2G1382583’UTR,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因或蛋白质、小RNA转基因、选择标志物转基因、或它们的组合。在进一步的实施方案中,转基因与来自相同GRMZM2G138258样基因的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR可操作连接。
还可通过位于启动子序列下游的内含子区来调节转基因表达。启动子和内含子两者都能调节转基因表达。启动子对于驱动转录是必要的,而内含子的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。内含子基因区有助于转基因的稳定表达。在一个另外的实施方案中,内含子与玉米GRMZM2G138258启动子可操作连接。
还可通过位于启动子序列下游的5’UTR区来调节转基因表达。启动子和5’UTR两者都能调节转基因表达。启动子对于驱动转录是必要的,而5’UTR的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。5’UTR基因区有助于转基因的稳定表达。在一个另外的实施方案中,5’UTR与玉米GRMZM2G138258启动子可操作连接。
在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的核酸构建体。在一个实施方案中,玉米GRMZM2G138258 5’UTR与启动子的3'端可操作连接。在一个实施方案中,提供了包含与从玉米栽培种B73中分离的玉米GRMZM2G138258启动子的3'端可操作连接的玉米GRMZM2G1382585’UTR的核酸构建体。在一个另外的实施方案中,5’UTR的3’端与内含子的5'端可操作连接。在一个实施方案中,5’UTR可以是具有SEQ ID NO:3的玉米GRMZM2G138258 5’UTR。
在一个实施方案中,提供了包含如本文中公开的玉米GRMZM2G138258启动子和5’UTR的核酸构建体,其中5’UTR与SEQ ID NO:3至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,提供了包含玉米GRMZM2G138258启动子和与多接头可操作连接的具有SEQ ID NO:3的玉米GRMZM2G138258 5’UTR的核酸构建体,其中所述启动子与SEQ ID NO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,提供了包含玉米GRMZM2G138258启动子和与非GRMZM2G138258转基因可操作连接的具有SEQ ID NO:3的玉米GRMZM2G138258 5’UTR序列的基因表达盒,其中所述启动子与SEQ ID NO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。任选地,所述构建体可进一步包含与玉米GRMZM2G138258 5’UTR的3'端和非GRMZM2G138258转基因的5'端可操作连接的如本文中公开的内含子并且任选地进一步包含与非GRMZM2G138258转基因的3'端可操作连接的3’UTR。在一个实施方案中,所述启动子和3’UTR序列选自本文中所述的那些,并且所述5’UTR序列由SEQ ID NO:3组成。在一个实施方案中,3'UTR由SEQ ID NO:5组成。
在一个实施方案中,基因表达盒包含与启动子可操作连接的玉米GRMZM2G1382585’UTR,其中所述启动子为玉米GRMZM2G138258启动子,或为源自植物(例如,玉米泛素1启动子)、病毒(例如,木薯叶脉花叶病毒启动子)或细菌(例如,根癌土壤杆菌δmas)的启动子。在说明性实施方案中,基因表达盒包含与转基因可操作连接的具有SEQ ID NO:3的GRMZM2G138258 5’UTR,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。
在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子、5’UTR和3’UTR的核酸载体,其中5’UTR与多核苷酸SEQ ID NO:3至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的核酸载体,其中玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR两者彼此可操作连接。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的核酸载体,其中玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR两者与多接头可操作连接。在一个实施方案中,提供了包含如本文所述的玉米GRMZM2G138258启动子、玉米GRMZM2G138258 5’UTR和玉米GRMZM2G138258 3’UTR的基因表达盒,其中玉米GRMZM2G138258启动子和5’UTR与非GRMZM2G138258转基因的5’端可操作连接,并且3’UTR与非GRMZM2G138258转基因的3'端可操作连接。在一个实施方案中,5’UTR由SEQ ID NO:3组成。在一个实施方案中,提供了包含如本文中所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的基因表达盒,其中玉米GRMZM2G138258启动子包含SEQ ID NO:1,并且玉米GRMZM2G138258 5’UTR包含SEQ ID NO:3,其中所述启动子和玉米GRMZM2G138258 5’UTR与非GRMZM2G138258转基因的5’端可操作连接。在这个实施方案的一个方面,玉米GRMZM2G138258 5’UTR由SEQ ID NO:3组成。在这个实施方案的另一方面,玉米GRMZM2G138258启动子由SEQ ID NO:1组成。在说明性实施方案中,基因表达盒包含与转基因可操作连接的玉米GRMZM2G138258 5’UTR,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择标志物转基因、或它们的组合。在进一步的实施方案中,转基因与来自相同GRMZM2G138258样基因的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR可操作连接。
玉米GRMZM2G138258启动子还可包含一个或多个另外的序列元件。在一些实施方案中,玉米GRMZM2G138258启动子可包含外显子(例如,前导序列或信号肽,比如叶绿体转运肽或ER滞留信号)。例如,但不限于,作为一个另外的实施方案,玉米GRMZM2G138258启动子可以编码组入玉米GRMZM2G138258启动子中的外显子。
在一个实施方案中,核酸载体包含如本文中公开的基因表达盒。在一个实施方案中,载体可以是质粒、粘粒、细菌人工染色体(BAC)、噬菌体、病毒、或在直接转化或基因打靶中使用的切割的多核苷酸片段,如供体DNA。
根据一个实施方案,提供了包含重组基因表达盒的核酸载体,其中所述重组基因盒包含与多接头序列可操作连接的玉米GRMZM2G138258启动子、非GRMZM2G138258转基因或它们的组合。在一个实施方案中,所述重组基因盒包含与非GRMZM2G138258转基因可操作连接的玉米GRMZM2G138258启动子。在一个实施方案中,所述重组基因盒包含与多接头序列可操作连接的如本文中公开的玉米GRMZM2G138258启动子。所述多接头以某种方式与玉米GRMZM2G138258启动子可操作连接,所述方式使得编码序列到所述多接头的限制性位点之一中的插入将会可操作地连接所述编码序列,从而允许在载体转化或转染到宿主细胞中时表达所述编码序列。
根据一个实施方案,玉米GRMZM2G138258启动子包含SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。根据一个实施方案,所述启动子序列具有不超过1.5、2、2.5、3或4kb的总长度。根据一个实施方案,玉米GRMZM2G138258启动子由SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的1,838bp序列组成。
根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒由玉米GRMZM2G138258启动子、非GRMZM2G138258转基因和具有SEQ ID NO:5的玉米GRMZM2G1382583'UTR组成。在一个实施方案中,具有SEQ ID NO:5的玉米GRMZM2G138258 3’UTR与非GRMZM2G138258转基因的3'端可操作连接。在一个另外的实施方案中,3'非翻译序列包含SEQ ID NO:5或与SEQ ID NO:5具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒的组成为SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的1,838bp序列、非GRMZM2G138258转基因和玉米GRMZM2G138258 3’UTR,其中SEQ ID NO:1与非GRMZM2G138258转基因的5'端可操作连接,并且具有SEQ ID NO:5的3’UTR与非GRMZM2G138258转基因的端3'可操作连接。在一个另外的实施方案中,3'非翻译序列包含SEQ ID NO:5或与SEQ ID NO:5具有至少80%、85%、90%、95%、99%或100%序列同一性的序列。在一个另外的实施方案中,玉米GRMZM2G138258 3'非翻译序列由SEQ ID NO:5或与SEQ ID NO:5具有至少80%、85%、90%、95%或99%序列同一性的1,037bp序列组成。
根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒由玉米GRMZM2G138258启动子、具有SEQ ID NO:3的玉米GRMZM2G138258 5'UTR、非GRMZM2G138258转基因和具有SEQ ID NO:5的玉米GRMZM2G138258 3'UTR组成。在一个实施方案中,具有SEQID NO:3的玉米GRMZM2G138258 5'UTR与非GRMZM2G138258转基因的5'端和具有SEQ ID NO:1的玉米GRMZM2G138258启动子的3'端可操作连接。在一个另外的实施方案中,玉米GRMZM2G138258 5'非翻译序列包含SEQ ID NO:3或与SEQ ID NO:3具有至少80%、85%、90%、95%或100%序列同一性的序列。根据一个实施方案,提供了包含基因盒的核酸载体,所述基因盒的组成为SEQ ID NO:3或与SEQ ID NO:3具有至少80%、85%、90%、95%或100%序列同一性的序列、启动子、非GRMZM2G138258转基因和玉米GRMZM2G138258 3'UTR,其中SEQ ID NO:1与玉米GRMZM2G138258 5'非翻译区的5'端可操作连接,并且5'非翻译区与非GRMZM2G138258转基因的3'端可操作连接,并且具有SEQ ID NO:5的玉米GRMZM2G1382583'UTR与非GRMZM2G138258转基因的3'端可操作连接。在一个另外的实施方案中,玉米GRMZM2G138258 5'非翻译序列包含SEQ ID NO:3或与SEQ ID NO:3具有至少80%、85%、90%、95%或100%序列同一性的序列。在一个另外的实施方案中,玉米GRMZM2G138258 5'非翻译序列由SEQ ID NO:3或与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的206bp序列组成。
在一个实施方案中,提供了包含启动子和非GRMZM2G138258转基因以及任选地一个或多个下列元件的核酸构建体:
a)5'非翻译区;
b)内含子;和
c)3'非翻译区,
其中,
所述启动子由SEQ ID NO:1或与SEQ ID NO:1具有至少98%序列同一性的序列组成;
所述5'非翻译区由SEQ ID NO:3或与SEQ ID NO:3具有至少98%序列同一性的序列组成;并且
所述3'非翻译区由SEQ ID NO:5或与SEQ ID NO:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述转基因可操作连接,并且当存在时,每个任选的元件也与启动子和转基因两者可操作连接。在一个另外的实施方案中,提供了包含就在上文公开的核酸构建体的转基因细胞。在一个实施方案中,所述转基因细胞为植物细胞,并且在一个另外的实施方案中提供了植物,其中所述植物包含所述转基因细胞。
在一个实施方案中,提供了包含启动子和非GRMZM2G138258转基因以及任选地一个或多个下列元件的核酸构建体:
a)5'非翻译区;和
c)3'非翻译区,
其中,
所述启动子由SEQ ID NO:1或与SEQ ID NO:1具有至少98%序列同一性的序列组成;
所述5'非翻译区由SEQ ID NO:3或与SEQ ID NO:3具有至少98%序列同一性的序列组成;并且
所述3'非翻译区由SEQ ID NO:5或与SEQ ID NO:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述转基因可操作连接,并且当存在时,每个任选的元件也与启动子和转基因两者可操作连接。在另一个实施方案中,提供了包含前面刚公开的核酸构建体的转基因细胞。在一个实施方案中,所述转基因细胞为植物细胞,并且在另一个实施方案中提供了植物,其中所述植物包含所述转基因细胞。
在一个实施方案中,提供了包含启动子和多接头以及任选地一个或多个下列元件的核酸构建体:
a)5'非翻译区;
b)内含子;和
c)3'非翻译区,
其中,
所述启动子由SEQ ID NO:1或与SEQ ID NO:1具有至少98%序列同一性的序列组成;
所述5'非翻译区由SEQ ID NO:3或与SEQ ID NO:3具有至少98%序列同一性的序列组成;
所述3'非翻译区由SEQ ID NO:5或与SEQ ID NO:5具有至少98%序列同一性的序列组成;进一步地,其中所述启动子与所述多接头可操作连接,并且当存在时,每个任选的元件也与启动子和多接头两者可操作连接。
根据一个实施方案,所述核酸载体进一步包含编码选择标志物的序列。根据一个实施方案,所述重组基因盒与土壤杆菌T-DNA边界可操作连接。根据一个实施方案,所述重组基因盒进一步包含第一和第二T-DNA边界,其中第一T-DNA边界与基因构建体的一端可操作连接,并且第二T-DNA边界与基因构建体的另一端可操作连接。所述第一和第二土壤杆菌T-DNA边界可独立地选自来源于细菌菌株的T-DNA边界序列,所述T-DNA边界序列选自下组:胭脂碱合成土壤杆菌T-DNA边界、章鱼碱(ocotopine)合成土壤杆菌T-DNA边界、甘露碱合成土壤杆菌T-DNA边界、琥珀碱合成土壤杆菌T-DNA边界、或它们的任何组合。在一个实施方案中,提供了选自下组的土壤杆菌菌株:胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含与选自SEQ ID NO:1的序列或与SEQ ID NO:1具有至少80%、85%、90%、95%、或99%序列同一性的序列可操作连接的转基因。
适合于在本公开构建体中使用的感兴趣的转基因包括但不限于赋予下列各项的编码序列:(1)对害虫或疾病的抗性,(2)对除草剂的耐受性,(3)增值的农艺性状,比如产量提高、氮利用效率、水分利用效率和营养品质,(4)蛋白质以位点特异性方式与DNA结合,(5)小RNA的表达,和(6)选择标志物。根据一个实施方案,所述转基因编码选择标志物或赋予杀虫抗性、除草剂耐受性、小RNA表达、氮利用效率、水分利用效率、或营养品质的基因产物。
1.昆虫抗性
不同的昆虫抗性编码序列可与包含SEQ ID NO:1的启动子或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接;在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ ID NO:3的玉米GRMZM2G1382585'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性昆虫抗性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的昆虫抗性编码序列的实施方案,提供了以下性状。提供示例性鳞翅目昆虫抗性的编码序列包括:cry1A;cry1A.105;cry1Ab;cry1Ab(截短);cry1Ab-Ac(融合蛋白);cry1Ac(以销售);cry1C;cry1F(以销售);cry1Fa2;cry2Ab2;cry2Ae;cry9C;mocry1F;pinII(蛋白酶抑制剂蛋白);vip3A(a);和vip3Aa20。提供示例性鞘翅目昆虫抗性的编码序列包括:cry34Ab1(以销售);cry35Ab1(以销售);cry3A;cry3Bb1;dvsnf7;和mcry3A。提供示例性多昆虫抗性的编码序列包括ecry31.Ab。以上列出的昆虫抗性基因并非意味着是限制性的。本公开涵盖任何昆虫抗性基因。
2.除草剂耐受性
不同的除草剂耐受性编码序列可与包含SEQ ID NO:1的玉米GRMZM2G138258启动子或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子、包含SEQ IDNO:1的启动子、或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ ID NO:3的玉米GRMZM2G1382585'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性除草剂耐受性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的除草剂耐受性编码序列的实施方案,提供了以下性状。草甘膦除草剂具有通过抑制EPSPS酶(5-烯醇丙酮酰莽草酸-3-磷酸合酶)起作用的模式。这种酶参与对植物的生长和发育至关重要的芳香族氨基酸的生物合成。可用于抑制这种酶的各种酶机制是本领域已知的。编码此类酶的基因可与本主题公开的基因调控元件可操作连接。在一个实施方案中,选择标志物基因包括但不限于编码草甘膦抗性基因的基因,包括:突变型EPSPS基因,比如2mEPSPS基因、cp4EPSPS基因、mEPSPS基因、dgt-28基因;aroA基因;和草甘膦降解基因,比如草甘膦乙酰转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前以Gly-TolTM GT和Roundup销售。草铵膦和/或双丙氨磷化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前以销售。还包括提供对2,4-D抗性的耐受基因,比如aad-1基因(应该注意的是,aad-1基因对芳氧苯氧丙酸酯类(arloxyphenoxypropionate)除草剂具有进一步的活性)和aad-12基因(应该注意的是,aad-12基因对吡啶基氧基乙酸合成生长素具有进一步的活性)。这些性状以作物保护技术销售。ALS抑制剂(磺酰脲类、咪唑啉酮类、三唑并嘧啶类、嘧啶基硫代苯甲酸酯类和磺酰基氨基-羰基-三唑啉酮类)的抗性基因是本领域已知的。这些抗性基因最常由于ALS编码基因序列的点突变而产生。其他ALS抑制剂抗性基因包括hra基因、csr1-2基因、Sr-HrA基因和surB基因。一些性状以商品名销售。抑制HPPD的除草剂包括吡唑啉酮类,比如苄草唑、吡草酮和苯唑草酮;三酮类,比如甲基磺草酮、磺草酮、环磺酮、苯并双环酮;和二酮腈类,比如异恶唑草酮。可以通过已知性状耐受这些示例性HPPD除草剂。HPPD抑制剂的实例包括hppdPF_W336基因(异恶唑草酮抗性)和avhppd-03基因(甲基磺草酮抗性)。耐苯腈除草剂的性状的一个例子包括bxn基因,该基因已经显示出赋予对除草剂/抗生素溴苯腈的抗性。麦草畏的抗性基因包括如国际PCT公开号WO 2008/105890中公开的麦草畏单加氧酶基因(dmo)。PPO或PROTOX抑制剂类除草剂(例如,三氟羧草醚、氟丙嘧草酯、flupropazil、环戊噁草酮、唑草酮、异丙吡草酯、吡草醚、苯草醚、唑啶草酮、丙炔氟草胺、氟烯草酸、治草醚、乙氧氟草醚、乳氟禾草灵、氟磺胺草醚、乙羧氟草醚和甲磺草胺)的抗性基因是本领域已知的。赋予对PPO抗性的示例性基因包括野生型拟南芥PPO酶的过表达(Lermontova I和Grimm B,(2000)Overexpression of plastidic protoporphyrinogenIX oxidase leads to resistance to the diphenyl-ether herbicideacifluorfen.Plant Physiol 122:75–83.)、枯草芽孢杆菌PPO基因(Li,X.和NichollD.2005.Development of PPO inhibitor-resistant cultures and crops.PestManag.Sci.61:277-285以及Choi KW,Han O,Lee HJ,Yun YC,Moon YH,Kim MK,Kuk YI,HanSU和Guh JO,(1998)Generation of resistance to the diphenyl ether herbicide,oxyfluorfen,via expression of the Bacillus subtilis protoporphyrinogenoxidase gene in transgenic tobacco plants.Biosci Biotechnol Biochem 62:558–560.)吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括编码乙酰辅酶A羧化酶(ACCase)抑制剂的基因(例如,Acc1-S1、Acc1-S2和Acc1-S3)。示例性基因赋予对包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵和喹禾灵在内的环己二酮和/或芳氧基苯氧基丙酸的抗性。最后,包括三嗪或苯甲腈在内的除草剂可以抑制光合作用,通过psbA基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供对它们的耐受性。以上列出的除草剂耐受性基因并非意味着是限制性的。本公开涵盖任何除草剂耐受性基因。
3.农艺性状
不同的农艺性状编码序列可与包含SEQ ID NO:1的玉米GRMZM2G138258启动子或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子、包含SEQ ID NO:1的启动子、或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ IDNO:3的玉米GRMZM2G1382585'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性农艺性状编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的农艺性状编码序列的实施方案,提供了以下性状。由pg基因提供的延迟果实软化抑制了导致细胞壁中果胶分子分解的多聚半乳糖醛酸酶的产生,并因此引起果实的延迟软化。此外,acc基因的延迟果实成熟/衰老起到抑制天然acc合酶基因的正常表达的作用,导致乙烯产生减少和果实成熟延迟。然而,accd基因代谢果实成熟激素乙烯的前体,导致果实成熟延迟。或者,sam-k基因通过还原S-腺苷甲硫氨酸(SAM)(产生乙烯的底物)引起成熟延迟。在水胁迫条件下,由cspB基因提供的干旱胁迫耐受表型通过保持RNA稳定性和翻译维持正常的细胞功能。另一个实例包括EcBetA基因,其催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水胁迫的耐受性。另外,RmBetA基因催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水胁迫的耐受性。bbx32基因提供光合作用和产量提高,其表达与一种或多种内源转录因子相互作用以调节植物日/夜生理过程的蛋白质。通过编码热稳定性α-淀粉酶的amy797E基因的表达可以增加乙醇产生,所述α-淀粉酶通过增加用于降解淀粉的淀粉酶的热稳定性而提高生物乙醇的产生。最后,可以通过表达编码二氢吡啶二羧酸合酶的cordapA基因而产生修饰的氨基酸组成,所述二氢吡啶二羧酸合酶增加氨基酸赖氨酸的产生。以上列出的农艺性状编码序列并非意味着是限制性的。本公开涵盖任何农艺性状编码序列。
4.DNA结合蛋白
不同的DNA结合蛋白编码序列可与包含SEQ ID NO:1的玉米GRMZM2G138258启动子或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子、包含SEQ IDNO:1的启动子、或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ ID NO:3的玉米GRMZM2G1382585'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性DNA结合蛋白编码序列是本领域已知的。作为可与本主题公开的调控元件可操作连接的DNA结合蛋白编码序列的实施方案,以下类型的DNA结合蛋白可包括:锌指、转录激活子样效应因子核酸酶(Talen)、CRISPR和大范围核酸酶。以上列出的DNA结合蛋白编码序列并非意味着是限制性的。本公开涵盖任何DNA结合蛋白编码序列。
5.小RNA
不同的小RNA可与包含SEQ ID NO:1的玉米GRMZM2G138258启动子或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子、包含SEQ ID NO:1的启动子、或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ ID NO:3的玉米GRMZM2G138258 5'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性小RNA性状是本领域已知的。作为可以与本主题公开的调控元件可操作连接的小RNA编码序列的实施方案,提供了以下性状。例如,通过使编码乙烯形成酶的ACO基因沉默来抑制乙烯的产生,抗efe小RNA的延迟果实成熟/衰老作用延迟了成熟。通过抑制内源性S-腺苷-L-甲硫氨酸:反式咖啡酰CoA3-O-甲基转移酶(CCOMT基因),ccomt小RNA改变木质素产生降低了愈创木基(guanacyl)(G)木质素的含量。此外,通过Ppo5小RNA可以降低野生马铃薯(Solanum verrucosum)中的黑斑擦伤耐受性,Ppo5小RNA触发Ppo5转录物的降解以阻止黑斑擦伤的产生。还包括dvsnf7小RNA,其利用含有西方玉米根虫Snf7基因的240bp片段的dsRNA来抑制西方玉米根虫。改性淀粉/碳水化合物可来源于小RNA,例如pPhL小RNA(降解PhL转录物以限制通过淀粉降解形成还原糖)和pR1小RNA(降解R1转录物以限制通过淀粉降解形成还原糖)。另外的益处比如为由asn1小RNA所致的丙烯酰胺减少,asn1小RNA触发Asn1降解,从而损害天冬酰胺的形成并减少聚丙烯酰胺。最后,pgas ppo抑制小RNA的非褐变表型导致抑制PPO,从而产生具有非褐变表型的苹果。以上列出的小RNA并非意味着是限制性的。本公开涵盖任何小RNA编码序列。
6.选择标志物
还被描述为报告基因的不同的选择标志物可与包含SEQ ID NO:1的玉米GRMZM2G138258启动子或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米GRMZM2G138258启动子、包含SEQ ID NO:1的启动子、或与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性的序列。在一些实施方案中,所述序列与包含SEQ ID NO:1的玉米GRMZM2G138258启动子和包含SEQ ID NO:3的玉米GRMZM2G1382585'UTR可操作连接,或与这样的序列可操作连接,该序列与SEQ ID NO:1具有至少80%、85%、90%、95%或99%序列同一性,其和与SEQ ID NO:3具有至少80%、85%、90%、95%或99%序列同一性的序列可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。许多方法可用于证实转化植物中选择标志物的表达,包括例如DNA测序和PCR(聚合酶链反应)、Southern印迹、RNA印迹和用于检测从载体表达的蛋白质的免疫学方法。但是,当蛋白质表达产生有色产物时,通常通过目视观察蛋白质来观察报告基因。示例性报告基因是本领域已知的并且编码β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP、Phi-YFP)、红色荧光蛋白(DsRFP、RFP等)、β-半乳糖苷酶等(参见Sambrook等人,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor Press,N.Y.,2001,其内容通过提述完整并入本文)。
利用选择标志物基因来选择转化的细胞或组织。选择标志物基因包括编码抗生素抗性的基因,比如编码新霉素磷酸转移酶II(NEO)、大观霉素/链霉素(streptinomycin)抗性(AAD)和潮霉素磷酸转移酶(HPT或HGR)的那些基因,以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对该除草剂不敏感的修饰的靶蛋白或编码在植物中在该除草剂能够起作用之前降解该除草剂或将其脱毒的酶。例如,通过使用编码突变体靶酶5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)的基因,已获得对草甘膦的抗性。针对EPSPS的基因和突变体是熟知的,并且在下文进一步描述。通过使用编码PAT或DSM-2、腈水解酶、AAD-1或AAD-12基因的细菌基因,已经获得了对草铵膦、溴苯腈、以及2,4-二氯苯氧乙酸(2,4-D)的抗性,它们中的每一者都是使它们对应的除草剂脱毒的蛋白质的例子。
在一个实施方案中,除草剂可以抑制生长点或分生组织,所述除草剂包括包括咪唑啉酮或磺酰脲,并且针对这些除草剂的乙酰羟酸合酶(AHAS)和乙酰乳酸合酶(ALS)的抗性/耐受性的基因是熟知的。草甘膦抗性基因分别包括突变体5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSP)和dgt-28基因(经由引入重组核酸和/或天然EPSP基因的各种形式的体内诱变)、aroA基因和草甘膦乙酰转移酶(GAT)基因)。其他膦酰基化合物的抗性基因包括来自链霉菌属物种(包括吸水链霉菌和绿色产色链霉菌)的bar和pat基因、以及吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵、喹禾灵)抗性的示例性基因包括乙酰辅酶A羧化酶(ACCase)基因;Acc1-S1、Acc1-S2和Acc1-S3。在一个实施方案中,除草剂可以抑制光合作用,包括三嗪(psbA和1s+基因)或苄腈(腈水解酶基因)。此外,这样的选择标志物可包括阳性选择标志物,例如磷酸甘露糖异构酶(PMI)。
在一个实施方案中,选择标志物基因包括但不限于,编码下列物质的基因:2,4-D;新霉素磷酸转移酶II;氰酰胺水合酶;天冬氨酸激酶;二氢吡啶二羧酸合成酶;色氨酸脱羧酶;二氢吡啶二羧酸合成酶和脱敏型天冬氨酸激酶;bar基因;色氨酸脱羧酶;新霉素磷酸转移酶(NEO);潮霉素磷酸转移酶(HPT或HYG);二氢叶酸还原酶(DHFR);膦丝菌素乙酰转移酶;2,2-二氯丙酸脱卤素酶;乙酰羟酸合酶;5-烯醇丙酮酰-莽草酸-磷酸合酶(aroA);卤代芳基腈水解酶;乙酰辅酶A羧化酶;二氢蝶酸合酶(sul I);和32kD光系统II多肽(psbA)。一个实施方案还包括编码对下列物质的抗性的选择标志物基因:氯霉素;甲氨蝶呤;潮霉素;大观霉素;溴苯腈;草甘膦;和膦丝菌素。以上列出的选择标志物基因并非意味着是限制性的。本公开涵盖任何报告基因或选择标志物基因。
在一些实施方案中,合成了编码序列,以便在植物中优化表达。例如,在一个实施方案中,基因的编码序列已通过密码子优化进行修饰,以增强在植物中的表达。可以优化杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因或选择标志物转基因,以便在特定植物物种中表达,或者可以修饰上述转基因,以便在双子叶或单子叶植物中优化表达。根据在感兴趣的特定植物物种中以最大量表达的蛋白质中最高频率的密码子,可以确定植物优选的密码子。在一个实施方案中,编码序列、基因或转基因被设计为以较高水平在植物中表达,从而产生更高的转化效率。用于基因的植物优化的方法是熟知的。关于合成的DNA序列的优化和生产的指南可例如在WO2013016546、WO2011146524、WO1997013402、美国专利No.6166302、美国专利No.5380831中找到,将其通过提述并入本文。
转化
用于植物转化的适合方法包括藉此将DNA引入细胞中的任何方法,例如但不限于:电穿孔(参见,例如,美国专利5,384,253);微粒轰击(参见,例如,美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861、和6,403,865);土壤杆菌介导的转化(参见,例如,美国专利5,635,055、5,824,877、5,591,616;5,981,840、和6,384,301);和原生质体转化(参见,例如,美国专利5,508,184)。
使用诸如利用碳化硅纤维搅动的技术(参见,例如,美国专利5,302,523和5,464,765)可以将DNA构建体直接引入植物细胞的基因组DNA中,或者可以使用生物射弹法如DNA粒子轰击将DNA构建体直接引入植物组织中(参见,例如,Klein等人(1987)Nature 327:70-73)。或者,可通过纳米颗粒转化将DNA构建体引入植物细胞中(参见,例如,美国专利公开No.20090104700,通过提述将其完整并入本文)。
另外,可以使用非土壤杆菌细菌或病毒,比如根瘤菌菌种NGR234、苜蓿中华根瘤菌、百脉根根瘤菌、马铃薯病毒X、花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒实现基因转移,参见,例如Chung等人(2006)Trends Plant Sci.11(1):1-4。
通过应用转化技术,事实上任何植物物种的细胞可被稳定转化,并且可通过熟知的技术将这些细胞开发为转基因植物。例如,在棉花转化背景下可以特别有用的技术描述于美国专利5,846,797、5,159,135、5,004,863、和6,624,344中;用于转化芸苔属植物的技术例如描述于美国专利5,750,871中;用于转化大豆的技术例如描述于美国专利6,384,301中;并且用于转化玉蜀黍的技术例如描述于美国专利7,060,876和5,591,616、以及国际PCT公开WO 95/06722中。
在完成外源核酸到受体细胞的递送之后,通常鉴定出转化的细胞用于进一步培养和植物再生。为了提高鉴定转化体的能力,人们可能期望采用选择标志物基因,其中使用转化载体再生转化体。在说明性实施方案中,可通过使细胞暴露于一种或多种选择剂来测定转化的细胞群,或者可筛选所述细胞的期望标志物基因性状。
暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞,可以在支持植物再生的介质中加以培养。在一个实施方案中,可通过包含其他物质,如生长调节剂来改良任何适合的植物组织培养基。可将组织维持在具有生长调节剂的基本培养基上,直到可得到足够的组织开始植物再生的努力时为止,或者在重复轮的手动选择之后,直到组织形态适合于再生时为止(例如,至少2周),然后转移到有助于芽形成的介质中。定期转移培养物,直到已经出现充分的芽形成时为止。一旦芽形成,将它们转移到有助于根形成的介质中。一旦形成足够的根,可将植物转移到土壤中,以便进一步生长和成熟。
分子确认
通过利用转化DNA上存在的标志物基因所编码的性状对工程改造的植物材料进行选择或筛选,可以鉴定和分离转化的植物细胞、愈伤组织、组织、或植物。例如,可以通过在含有抑制量的抗生素或除草剂(转化基因构建体提供对该抗生素或除草剂的抗性)的培养基上培育工程改造的植物材料来实施选择。此外,也可通过筛选可能存在于重组核酸构建体上的任何可见标志物基因(例如,β-葡糖醛酸糖苷酶、萤光素酶、或gfp基因)的活性来鉴定转化的植物和植物细胞。这样的选择和筛选方法对于本领域技术人员是熟知的。可用于鉴定转基因植物的分子确认方法是本领域技术人员已知的。下面进一步描述几种示例性方法。
已描述了分子信标用于序列检测。简要地说,设计与侧翼基因组和插入物DNA接点重叠的FRET寡核苷酸探针。FRET探针的独特结构导致它含有使荧光部分和猝灭部分保持非常靠近的二级结构。在热稳定聚合酶和dNTP的存在下,使FRET探针和PCR引物(一个引物在插入DNA序列内,一个引物在侧翼基因组序列内)循环。在成功的PCR扩增之后,FRET探针与靶序列的杂交导致探针的二级结构消除以及荧光部分和淬灭部分的空间分离。荧光信号指示由于成功的扩增和杂交导致的侧翼基因组/转基因插入序列的存在。这样的用于检测扩增反应的分子信标测定是本主题公开的实施方案。
水解探针测定,或者也称作(Life Technologies,Foster City,Calif.),是一种检测和定量DNA序列之存在的方法。简要地说,设计FRET寡核苷酸探针,其具有一段在转基因内的寡聚体,一段在侧翼基因组序列内的寡聚体,用于事件特异性检测。在热稳定聚合酶和dNTP的存在下,使FRET探针和PCR引物(一个引物在插入DNA序列内,一个引物在侧翼基因组序列内)循环。FRET探针的杂交导致荧光部分从FRET探针上的猝灭部分被切断并释放。荧光信号指示由于成功的扩增和杂交导致的侧翼/转基因插入序列的存在。这样的用于检测扩增反应的水解探针测定是本主题公开的实施方案。
测定是检测和定量DNA序列之存在的方法。简言之,利用被称为测定系统的基于聚合酶链反应(PCR)的测定法,筛选了包含整合的基因表达盒多核苷酸的基因组DNA样品。在主题公开的实践中使用的测定可利用含有多种引物的PCR测定混合物。在PCR测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。正向引物含有相应于DNA多核苷酸的特定区域的序列,并且反向引物含有相应于基因组序列的特定区域的序列。另外,在PCR测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。例如,PCR测定混合物可利用相应于两个不同等位基因的两个正向引物和一个反向引物。正向引物之一含有相应于内源基因组序列的特定区域的序列。第二正向引物含有相应于DNA多核苷酸的特定区域的序列。反向引物含有相应于基因组序列的特定区域的序列。这样的用于检测扩增反应的测定法是本主题公开的实施方案。
在一些实施方案中,荧光信号或荧光染料选自下组:HEX荧光染料、FAM荧光染料、JOE荧光染料、TET荧光染料、Cy 3荧光染料、Cy 3.5荧光染料、Cy 5荧光染料、Cy 5.5荧光染料、Cy 7荧光染料、和ROX荧光染料。
在其他实施方案中,使用适合的第二荧光DNA染料进行扩增反应,所述第二荧光DNA染料能够在流式细胞术可检测的浓度范围内使细胞DNA染色,并且具有通过实时热循环仪可检测的荧光发射光谱。本领域普通技术人员应当理解的是,其他核酸染料是已知的并且正在被不断地鉴定。可以采用具有适当激发和发射光谱的任何适合的核酸染料,如SYTOXSYBR 在一个实施方案中,第二荧光DNA染料是以少于10μM、少于4μM、或少于2.7μM使用的
在进一步的实施方案中,下一代测序(NGS)可用于检测。如由Brautigma等人在2010年所述,可以使用DNA序列分析来确定分离和扩增的片段的核苷酸序列。可以分离扩增的片段并亚克隆到载体中,并使用链终止子法(也称为Sanger测序)或染料终止子测序进行测序。另外,可以用下一代测序将扩增子测序。NGS技术不需要亚克隆步骤,并且可以在单个反应中完成多个测序读取。有三种NGS平台可商购:来自454Life Sciences/Roche的GenomeSequencer FLXTM,来自Solexa的Illumina Genome AnalyserTM和Applied Biosystems的SOLiDTM(首字母缩写词,代表:“寡聚物连接和检测测序”(“Sequencing by Oligo Ligationand Detection”)。另外,目前正在开发两种单分子测序方法。这些包括来自HelicosBioscienceTM的真实单分子测序(tSMS)和来自Pacific Biosciences的单分子Real TimeTM测序(SMRT)。
由454Life Sciences/Roche推向市场的Genome Sequencer FLXTM是长读段NGS,其使用乳液PCR和焦磷酸测序来生成测序读段。可以使用300-800bp的DNA片段或含有3-20kb片段的文库。反应每次运行可以产生超过100万个约250至400个碱基的读段,总产量为250至400兆碱基。与其他NGS技术相比,这种技术产生的读段最长,但每次运行的总序列输出较低。
由SolexaTM推向市场的Illumina Genome AnalyserTM是一种短读段NGS,其利用荧光染料标记的可逆终止子核苷酸的边合成边测序法,并且以固相桥式PCR为基础。可以使用含有高达10kb的DNA片段的配对末端测序文库的构建。反应产生长度为35-76个碱基的超过1亿个短读段。这些数据每次运行可以产生3-6千兆碱基。
由Applied BiosystemsTM推向市场的寡聚物连接和检测测序(SOLiD)系统是一种短读段技术。这种NGS技术使用长度最多可达10kb的片段化双链DNA。该系统使用通过染料标记的寡核苷酸引物的连接和乳液PCR进行的测序,以生成10亿个短读段,其导致每次运行高达30千兆碱基的总序列输出。
Helicos BioscienceTM的tSMS和Pacific BiosciencesTM的SMRT应用了一种不同的方法,所述方法使用单个DNA分子进行序列反应。tSMSHelicosTM系统产生高达8亿个短读段,每次运行生成21千兆碱基。使用荧光染料标记的虚拟终止子核苷酸完成这些反应,其被描述为“边合成边测序”方法。
由Pacific BiosciencesTM推向市场的SMRT下一代测序系统使用实时的边合成边测序。由于不受可逆终止子的限制,这种技术可以产生长度高达1,000bp的读段。使用这种技术每天可以产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。
在另一个实施方案中,可以使用包括Western印迹、Northern印迹和Southern印迹在内的印迹测定法完成检测。此类印迹测定法是在生物样品的鉴定和定量的生物研究中常用的技术。这些测定法包括首先通过电泳分离凝胶中的样品组分,接着将电泳分离的组分从凝胶转移到诸如用硝酸纤维素、聚偏二氟乙烯(PVDF)或尼龙的材料制成的转移膜上。也可以将分析物直接点样在这些支持物上,或通过施加真空、毛细管作用或压力而定向到支持物上的特定区域上,而不需要预先分离。然后通常对转移膜进行转移后处理,以增强分析物彼此区分和在视觉上或通过自动读取器被检出的能力。
在一个另外的实施方案中,可以使用ELISA测定法来完成检测,所述ELISA测定法使用固相酶免疫测定法检测液体样品或湿样品中物质(通常是抗原)的存在。将来自样品的抗原附着在平板的表面上。然后,将另一种特异性抗体施用在该表面上,使得它可以与所述抗原结合。这种抗体是与酶连接的,并且,在最后的步骤中,添加含有该酶的底物的物质。随后的反应产生可检测的信号,最常见的是底物中的颜色变化。
转基因植物
在一个实施方案中,植物、植物组织、或植物细胞包含玉米GRMZM2G138258启动子。在一个实施方案中,植物、植物组织或植物细胞包含玉米GRMZM2G138258启动子,所述启动子具有选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在另一个实施方案中,植物、植物组织或植物细胞包含玉米GRMZM2G138258 3’UTR,所述3’UTR具有选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在另一个实施方案中,植物、植物组织或植物细胞包含与玉米GRMZM2G138258 5'UTR可操作连接的来自SEQ ID NO:1的玉米GRMZM2G138258启动子,所述玉米GRMZM2G138258 5'UTR包含选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有至少至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,所述基因表达盒包含选自SEQ ID NO:1的序列,或与非GRMZM2G138258转基因可操作连接的与选自SEQ IDNO:1的序列具有至少至少80%、85%、90%、95%或99.5%序列同一性的序列。在说明性实施方案中,植物、植物组织、或植物细胞包含含有与转基因可操作连接的玉米GRMZM2G138258启动子的基因表达盒,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、选择标志物转基因、或它们的组合。
根据一个实施方案,提供了植物、植物组织或植物细胞,其中植物、植物组织或植物细胞包含与转基因可操作连接的非内源GRMZM2G138258基因衍生的启动子序列,其中玉米GRMZM2G138258启动子衍生的启动子序列包含SEQ ID NO:1的序列或与SEQ ID NO:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含与非GRMZM2G138258转基因可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,所述植物、植物组织、或植物细胞包含与非GRMZM2G138258转基因可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞包含与转基因可操作连接的启动子,其中所述启动子的组成为SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,包含与转基因可操作连接的玉米GRMZM2G138258启动子序列的基因构建体被组入植物、植物组织、或植物细胞的基因组中。
在一个实施方案中,提供了非玉米栽培种B73植物、植物组织、或植物细胞,其包含与转基因可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,所述非玉米栽培种B73植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的植物细胞或组织。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,与转基因可操作连接的启动子序列被组入植物、植物组织、或植物细胞的基因组中。
在一个实施方案中,提供了非玉米栽培种B73植物、植物组织、或植物细胞,其包含与转基因的5'端可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列、以及包含SEQ ID NO:5或与SEQ ID NO:5具有至少80%、85%、90%、95%或99.5%序列同一性的序列的3'非翻译序列,其中3'非翻译序列与所述转基因可操作连接。在另一个实施方案中,提供了非玉米栽培种B73植物、植物组织、或植物细胞,其包含与5'非翻译序列的3'端可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有至少80%、85%、90%、95%或99.5%序列同一性的序列,所述5'非翻译序列包含SEQ ID NO:3或与SEQ ID NO:3具有至少80%、85%、90%、95%或99.5%序列同一性的序列,其中所述5'非翻译序列与所述转基因可操作连接。根据一个实施方案,所述非玉米栽培种B73植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的植物组织或细胞。在一个实施方案中,所述植物选自下组:玉蜀黍、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为大豆。根据一个实施方案,与转基因可操作连接的启动子序列被组入植物、植物组织、或植物细胞的基因组中。
在一个实施方案中,根据本文中公开的方法的植物、植物组织、或植物细胞可以是单子叶植物。所述单子叶植物、植物组织、或植物细胞可以是,但不限于玉米、水稻、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、小米、柳枝稷、草坪草和黑小麦。
在一个实施方案中,根据本文中公开的方法的植物、植物组织、或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是,但不限于苜蓿、油菜、卡诺拉、芥菜、埃塞俄比亚芥、大豆、向日葵、棉花、豆类、西兰花、卷心菜、花椰菜、芹菜、黄瓜、茄子、莴苣;甜瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、番茄和西瓜。
本领域技术人员将认识到,在外源序列稳定组入转基因植物中并经证实为可操作之后,可通过有性杂交将其引入其他植物中。可以使用许多标准育种技术中的任何一种,这取决于被杂交的物种。
本发明公开还包括上述转基因植物的种子,其中所述种子具有含有本主题公开的基因调控元件的转基因或基因构建体。本发明公开进一步包括上述转基因植物的后代、克隆、细胞系或细胞,其中所述后代、克隆、细胞系或细胞具有含有本主题公开的基因调控元件的转基因或基因构建体。
本发明公开还包括上述转基因植物的培育,其中所述转基因植物具有含有本主题公开的基因调控元件的转基因或基因构建体。因此,通过用根据本发明的核酸分子转化,这样的转基因植物可以被工程改造为具有一个或多个期望的性状或含有本主题公开的基因调控元件的转基因事件,并且可以通过本领域技术人员已知的任何方法加以种植或培育。
表达转基因的方法
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米GRMZM2G138258启动子的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5'UTR的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米GRMZM2G138258 3’UTR的植物。在一个实施方案中,玉米GRMZM2G138258启动子由选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米GRMZM2G138258 5’UTR由选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米GRMZM2G138258 3’UTR由选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G1382583’UTR的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的植物组织或植物细胞。
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258启动子的基因表达盒的植物。在一个实施方案中,玉米GRMZM2G138258启动子由选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米GRMZM2G138258 3’UTR由选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在另一个实施方案中,玉米GRMZM2G138258 5’UTR由选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有至少80%、85%、90%、95%或99.5%序列同一性的序列组成。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3’UTR的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258 3’UTR的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258 5’UTR的基因表达盒的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258启动子的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258 3’UTR的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米GRMZM2G138258 5’UTR的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的基因表达盒、玉米GRMZM2G138258启动子和玉米GRMZM2G1382583’UTR的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的基因表达盒、玉米GRMZM2G138258启动子和玉米GRMZM2G138258 5’UTR的植物组织或植物细胞。
提供以下实施例以展示某些具体特征和/或实施方案。不应将这些实施例解释为将本公开限制为所例示的具体特征或实施方案。
实施例
实施例1:新的启动子和其他调控元件的分离
通过分析公众可获得的玉米幼苗的转录组,鉴定了新的玉米GRMZM2G138258基因调控元件。鉴定、分离并克隆这些调控元件,以表征在转基因植物中使用的所述调控元件的表达谱。产生了用下述基因稳定转化的转基因玉米系,并评估了转基因表达水平和组织特异性:分离自苏云金芽孢杆菌的cry3Ab1基因、和源自食除草剂鞘氨醇菌(Sphingobiumherbicidovorans)的aad-1选择标志物基因。如此,鉴定和表征了新的玉米GRMZM2G138258基因调控元件。公开了适于基因表达构建体中使用的启动子和3’UTR调控元件。
我们认为三个数据来源决定了玉米幼苗的芽和根中的高表达玉米基因的优先顺序:1)截至2010年进行本研究时,在公共玉米数据库中存在35,000个玉米基因序列及其注释;2)V4芽和根的总玉米转录组的基因表达数据(Wang等人,[2009],The Plant Cell;21:1053–1069);以及3)9,000个基因的全长cDNA序列(Alexandrov,N.等人,[2009]PlantMolecular Biology;69:179–194)。在本研究中,将基因表达数据与9,000个全长cDNA序列以及35,000个玉米基因进行比对。基于每百万个映射的片段中每千碱基外显子的片段数(FPKM)值——这是基因表达的一种定量量度——针对玉米芽和根组织各自鉴定了500个最佳表达基因。
因为转基因表达要求转基因在玉米植物的整个生命周期中的表达,所以从叶的3个不同阶段(V4、V12和R3)、2个不同的根发育阶段(V4和V12)和花粉的一个阶段(R1)分离了总mRNA用于转基因表达分析。所有分析均使用玉米栽培种B73玉米基因型。在被优先排序的500个基因中,对约150个最佳表达基因进行定量PCR,以确认基因表达。结果鉴定出这些基因的一个子集作为叶和根优选表达的最佳表达基因。
来自玉米GRMZM2G138258基因调控元件(SEQ ID NO:1)的启动子是从玉米栽培种B73基因组DNA(gDNA)序列鉴定的一个1,838bp的多核苷酸序列。根据对跨越数百万个碱基对的连续染色体序列进行的评估,鉴定了一个1,838bp的多核苷酸序列,并将其分离用于表达异源编码序列。分析这个新的多核苷酸序列以便将其用作驱动基因的表达的调控序列。如在下文的序列(SEQ ID NO:2)中所示,具有SEQ ID NO:1的1,838bp玉米GRMZM2G138258启动子如碱基对1–1,838所示。具有SEQ ID NO:3的206bp玉米GRMZM2G138258 5’UTR如SEQ IDNO:2的碱基对1,839–2,044所示。具有SEQ ID NO:4的天然基因编码序列如SEQ ID NO:2的碱基对2,045–4,803所示(ATG起始密码子和TAA终止密码子以大写字母显示)。具有SEQ IDNO:5的1,037bp玉米GRMZM2G138258 3’UTR如SEQ ID NO:2的碱基对4,804–5,840所示。
ataaccctcgtcttttacagccagcatcagtgactagagaatttccatgcatcagagaaaacatctgtgcaagtccggagttcactcatgcgcctgcttccctgctggcgcccgtgcatattatattcagtgtcgatactgtttgtttctatctgggtccggtggtccttcctattagcttgacctgtcagtgtgcaatctacccgtggttatgagagtttgaaactggaaggcaacgcaaaccaacattgggggcagcggtactggtgcattttcctatgtaaatgttcgtctcgggacacgcggtgtcgcacagtgactagagaattttgctgaccggaggtgcagacaagagggcaacgacgtacgtactagtagcaaaccaacatggtaattaacggccatatgctgccgtgccgaccggcggatctccaggcccctttgctttttgtctgtttcaatcgttttgtctggctcacatgacaccgcggcattccgattagggtggataacaagccagctcgtctcgtctcggctgctcgactcgactcgtttagctcgcgagccagagcagaaaaaataatatgtacataataattaatttttagttaatcttaaactaatttaataatagaaagtagtaattatactcatagtttcacaaaccacgtcaatgtaacaccaaattagcacaattagtcactcatcaattcacaaatcacatacatgttcatcagtttaacctacaattatatttgcatggaccaaattaacacatagacataggtcattaatcattagtttaactcataggtcatagacctcacatttatataacgtgttcatcaattattctgtaaatgatatgcatatagtttcgttttgctgaaatatgataacttgtttagctcgcgagctggctcgttaacgaaccgagctgcatcgttaatgaaccgagctagaatgtcagctcagctcgtgaaaaaattcaaaagggtcgatccgagccgagccgagctgaccatgaaccgagcgagccaacgagccacgagtatttcatccggccctgattcaacgagccacgattgcaaaagctgtaacatggtggacctctcgggccgaatacgtgggcttctccgtcctccggtgttgaagaataccaacggcccaccatacaaaaaaaaacacaacagtgcggcccaccaggaagatccggaaaagccgtgacaccatggtgttaagcttcagttgtggtgaaaaggtaagcttactaacttacctgtgccatgaccatgagtccatgacgattcctcgacctcaaggaaatcccggataggagaaagctcatgtgtgtgttgtgtgtgaggctcacaatttagctagatagatgtcccttatctctgcaagtgtaggccgacatgtatggctcctcgagcagctgtgcccactggtagcttttttttttattgttattatcattgtacactttatattaccatcaatcgtccgataaagcggatctcgtcccactaagacgaaaaagttgtggactgtgggagcaggcgacgcgagtccgcaatgacaggccgcagcagcccaccaaccaagccttacccaatccgcggcccggagacggagtgtggccacgggccacacggcttctgaccgagaggccgaggcgagggataagagcgtgtcccaccggccggccacccgcagcatctttaaaattcggcccggcgcgcgtcgggtgacgaaaacggaaccctggctggtggagcgcggcgcggggcatgcgtgcaagtgcaaccaatcgcctcgtcgtgtgcgctcgcctttgcttccctcgttaacgtgagtaacctcgttggctgatcaaggctttgacggcggcaccaacgttcttccctcgccgcctcgttgcgtccgcccgcccagcgccaactcctcgtcctcgtacataaccccccaccccaccgcgtacagcgttccctctcgcgccccgcggtgagctacccccgctcgccttagctagctacccaccATGgccctcccgccgtcctcctcgccgtcgtcgctctccgccgcgtcagcgcagcccacgcccctgcacctgcacctcccgaccaaggcgcccggccgcctcccgctgctccccttctcgcgcgccgccctcccgccgccgctgcgcctccgcattgcgcgcaccagcctctccccgggcacgcccctcccgcgcgcgctcctgccaccaccctccgcctccgccgacgccgcagcctccgacgtcggcggcggcggcgccggcttcggcggccatgacgacgacggccacaaccaccacggcggcgagggtggcggcgacgacggcggccatggcgacgacgccggccacggcgatgacgcgcccggcggcggcgacgcccgcggggaggcgctgttcgtgctggcgcagctgggccgcaagctcgacagcctgccgtccgatctcgccgccgccgtcgacagcggccgcatcggggccgacatcgtgcgccgcttcaccgaactcgaggccaacggcttcttccgatggctcctccagttccagggcttcagggagaggctcctcgccgacgagctcttcctcaccaagctcggcatagagtgcggcatcggtctcgtcgccaaggtcaccttgccattctgtttttattttatttttttatgaagaaaaaaaaaactccctctgttcgtaaacaggtgacgacgacgatgtagcttaccaaagagtttctaatgctgctaatacttattataaatctaatcaagtctaagaaagtttgaccaacacaacttattcacagttctcatgatcaactgcgtcgagctgtgtagttctaatctggctccttttgcactatttcaccttttgttcagaccgtggctgagttccagaagagaggggacaatttcttcaaagagattgaagttgtcatatctgatgtggtacgcccgcctaactgtgcttatctcatatcatccagaccgcttcaggcttcatatctcaaccggtagcgcattggattgtcaatcaggacaaatccgcactttcgtctttgcagcaacaacgtaatgtttggaaattttggaaataaggtcaatttcatgtaatgcgatcccaaatatgtcagagccctggcttttccatggaaccaacctgttcatttcttattcttttcacatactgctgatgaaacatgtcgatctttgcaatctcagactaatggaagaccttaagatctgttttatcaaaacaaaacatattttctgtgctttcacttcactagttgtaaaatacttcactgtctgagattagtatctttctaactttacatttaaactcttctgatatggaatctaattcagttgttgcttctgatactacctaggtcatggcgattgttgcggacgtcatgcttgtctatcttcctgctccaactattggtttacagccgccactggcaagaaacgctggagctattgccaactttttctataactgccctgataatactttccaagtaaagcaaccgtttctcatttcctagtagagttgaatggacctcctatttcttttccttgtattcaaaagcatgttatgcgacttttttctgcagattgctatggctggaaggtcattctcacttctgcagaggattggagcttttgtggtaaagtagattcattgcattcaattgttaactattttacgataatcatagttacctggatgtattcgcaacccatgttgatcaactaacagcggctgcttctttccagaggaatggtataaagcttttggcagtgggaactactgcttctttggttagtttgtttatctcattagctattgatgatcttcattagcagtctcttttgatattttgctagaaagttgccattctcttttctgagcgatatacagttgaacatgatcgtgttatgaagaaacatttcttcaaaacgggaattatctgctagcaatatgttattgttacgcttgcataaattatttatggatcagttggtttcatctccctgaattattcctgtaaccttgcaatggctatgaatttgtcatcttcccagattggcactagtgtcacgaatgcagcgctcaaagcaaagagggctgttgataaggaccttgaggacgaagtcatggaaattccagtcgtctcaactagtgttgcctatggtgtatacatgtccatttctagtaacctcaggtaaacagagttcctaaatattctagcatacagggcatacttaaacttatggatttatgactgattatattgttctgctatgagtagccagagggagtaagcgtgtcagttgaattggcaatctttgttattttttttacccttgaatcagatcaaagctgtgaaacatgtagcaaatagatacagactactatgttgatgttaacaatttggtttgctgccattcacagtttcattcttatgacataaatcatatacttcatcaggtatcagcttctggctggtgtgatcgagcagaggatgctggagccgttgctgcataaccagaagctactgctgagtgcaatgtgcttcatcgttcgtacgggcaacacattccttggctctttgctgtgagtaacattcacctcaccagaagttgggatcttatatcctctgctgttgctgtatttgcttactggtgaactttgtgaacaggtgggttgactatgccagatggataggcgtccagaagtctcacgaagaggccTAAagttctagcagcttgcctgcatgttccgctgtcactgcctcactaggcacgttcacaataccatcgatggcttgcctgcctctatagaatgctgatctactcttcactggaggcccccttatatataggacaaaaatcccaattttgtttggaaaaccacaagtagggatatatctgtcgaattctcgtatgcaacggcaacgccgttctacccctcaacttttttttttcctttttctactttgcaacatgcaacaagggctgtcattgatcgaaattcaaatatatgttacattgggaattccatgcgactgcctaaactctaggaagtttcacttgtcctgtttcatatgtatgtatgcattgtagccttgttgtatttcctcaatgtcttggttgctttcatcggttagagttcttgacgactgttgcagagattctgtcggagtatattcagggtcgcctattaccagacatgctgcccggacaacatgttgattcgttcattggcagcgcaacatgcaattagaaattaacagctactctagaacaagcaaataacagctgtcgctaaaattcaatattccatccctgttaacattgaatttattgtcttgtttatgaaccctatgtatctgacagcaccattgccttttttttacttaggcggtccattattgtcacacccggatttaaagagaaagttggatgcatcttatacatgcgacaaagaagaaaacatatatatgtatagagataaatgtcataataacatcaaaatacttattacaatgcgtaagtcttacaaaataaaagataaatataaatcaaactaaaatctatctttggcgccaataagtcaactgggagatgccacctagatcagatcaaattcctcgttgtgtggctcctcttgaaccatctgttcttctcctgtggggagtgtgagacagcaagggtgagctcacacatgttcattgttcaacaagttgtggggaataggagttcatgcgatttgtaaggctaatcaacaatag(SEQ ID NO:2)
实施例2:载体构建
构建以下载体以在转基因上游组入玉米GRMZM2G138258启动子。载体构建体pDAB108741含有一个基因表达盒,其中cry34ab1转基因(来自苏云金芽孢杆菌的报告基因)由具有SEQ ID NO:1的玉米GRMZM2G138258启动子驱动,并且其侧翼为具有SEQ ID NO:5的玉米GRMZM2G138258 3'UTR。这个基因表达盒图示于图1中,并如SEQ ID NO:15所示。该载体还含有一个选择标志物基因表达盒,该表达盒含有由玉米泛素1启动子(Christensen等人,(1992)Plant Molecular Biology 18;675-689)驱动的aad-1转基因(美国专利No.7,838,733),并且由玉米脂肪酶3'-UTR(美国专利No.7,179,902)终止。这个基因表达盒图示于图1中,并如SEQ ID NO:16所示。
由外部供应商(Geneart via Life Technologies,Carlsbad,CA)合成该新设计的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3'UTR序列,并且使用无缝克隆和组装试剂盒(Life technologies)和限制酶将所述启动子克隆到GatewayTM(LifeTechnologies)供体载体中,来构建这个构建体。使用GatewayTM克隆系统(LifeTechnologies)将得到的供体载体整合到最终的二元目的载体中。获得pDAB108741的克隆并通过限制酶消化和测序加以确认。得到的构建体含有一个启动子,可以稳健驱动与该启动子的3'端可操作连接的转基因表达。
组装对照构建体pDAB101556,其含有由玉米泛素-1启动子(Christensen等人,(1992)Plant Molecular Biology 18;675-689)驱动的Phi-yfp转基因(Shagin等,2004,Mol Biol Evol 21;841-50)和玉米过氧化物酶5 3’UTR调控元件。这个对照构建体含有与pDAB108741中存在的相同的aad-1表达盒。使用与pDAB108741相同的试剂和方案将这个对照构建体转化到植物中。
实施例3:玉米转化
根癌土壤杆菌的转化:
将二元表达载体转化到根癌土壤杆菌菌株DAt13192(RecA缺陷型三重菌株)中(国际专利公开No.WO2012016222)。选择细菌菌落,分离二元质粒DNA并经由限制酶消化加以确认。
土壤杆菌培养启动:
将土壤杆菌培养物从甘油储液划线接种在AB基本培养基(Gelvin,S.,2006,Agrobacterium Virulence Gene Induction,in Wang,K.,ed.,Agrobacterium ProtocolsSecond Edition Vol.1,Humana Press,第79页;没有蔗糖,具有5g/L葡萄糖和15g/LBactoTM琼脂)上并在20℃下在黑暗中温育3天。然后将土壤杆菌培养物划线接种在YEP培养基(Gelvin,S.,2006,Agrobacterium Virulence Gene Induction,in Wang,K.,ed.,Agrobacterium Protocols Second Edition Vol.1,Humana Press,第79页)的平板上并在20℃下在黑暗中温育1天。
在实验当天,以适合于实验大小的体积制备接种培养基(2.2g/L MS盐、68.4g/L蔗糖、36g/L葡萄糖、115mg/L L-脯氨酸、2mg/L甘氨酸、100mg/L肌醇、0.05mg/L烟酸、0.5mg/L盐酸吡哆辛、0.5mg/L盐酸硫胺素)和乙酰丁香酮的混合物。将100%二甲亚砜中的1M乙酰丁香酮储备溶液添加到接种培养基中,以产生200μM的乙酰丁香酮终浓度。
对于每种构建体,从YEP平板将1-2环土壤杆菌悬浮在一次性50ml无菌离心管内15ml的接种培养基/乙酰丁香酮混合物中,在分光光度计中在600nm(O.D.600)处测量溶液的光密度。然后使用另外的接种培养基/乙酰丁香酮混合物将悬液稀释降到0.25-0.35O.D.600。然后在使用之前将土壤杆菌悬液的管水平放置在设置为在室温下约75rpm的平台摇床上1到4小时。
玉米转化:
通过从近交系玉米栽培种B104分离的未成熟胚的土壤杆菌介导的转化将实验构建体转化到玉米中。使用的方法类似于Ishida等人,(1996)Nature Biotechnol 14:745–750和Frame等人,(2006)Plant Cell Rep 25:1024–1034所公开的方法,但是进行了若干修改和改进,以产生适合于高通量转化的方法。用于在玉米中产生许多转基因事件的方法的实例在美国专利申请公开号US 2013/0157369A1中给出,从胚感染和共培养步骤开始。
将推定的T0转基因小植株从PhytatraysTM(Sigma-Aldrich;St.Louis,MO)移栽到充填有生长培养基(Premix BX;Premier Tech Horticulture)的小型3.5英寸塑料盆(T.O.Plastics;Clearwater,MN)中,用湿度控制圆顶(humidome)(Arco Plastics Ltd.)覆盖,然后在生长室中炼苗(白天28℃/夜晚24℃,16小时光周期,50-70%RH,200μEm-2sec-1光强度)。当植物达到V3-V4发育阶段(可见3-4片叶圈)时,将它们移栽到Sunshine CustomBlend 160TM土壤混合物中并在温室中(光曝露类型:光合或同化作用;高光限:1200PAR;16小时昼长;白天27℃/夜晚24℃)培养至开花。通过使用设计用于检测转基因的相对拷贝数的引物的qPCR测定法分析植物的转基因拷贝数,并将进一步选择的推定单拷贝事件移栽到5加仑盆中。
实施例4:基因拷贝数和蛋白质表达的分子确认
转基因存在和拷贝数的估计:
在V2-3叶期对玉米植物取样,并使用cry34Ab1和aad-1定量PCR测定法筛选转基因的存在和它们的拷贝数。使用来自QiagenTM的MagAttract DNA extraction kitTM按照制造商的说明从叶样品中提取总DNA。
然后用引物/探针组扩增DNA片段,所述引物/探针组含有用于cry34Ab1基因的FAM标记的荧光探针和用于内源转化酶参考基因的HEX标记的荧光探针。以下引物用于cry34Ab1和转化酶基因扩增。
Cry34Ab1引物/探针:
SEQ ID NO:6(TQ.8v6.1.F):GCCATACCCTCCAGTTG
SEQ ID NO:7(TQ.8v6.1.R):GCCGTTGATGGAGTAGTAGATGG
探针:SEQ ID NO:8(TQ.8v6.1.MGB.P):5’-/56-FAM/CCGAATCCAACGGCTTCA/MGB/-3’
转化酶引物:
SEQ ID NO:9(转化酶F):TGGCGGACGACGACTTGT
SEQ ID NO:10(转化酶R):AAAGTTTGGAGGCTGCCGT
SEQ ID NO:11(转化酶探针):5’-/5-HEX/CGA GCA GAC CGC CGT GTA CTT/3BHQ_1/-3’
PCR反应在终体积10μl中进行,其含有5μl的Roche LightCycler 480ProbesMaster MixTM(Roche Applied Sciences,Indianapolis,IN;目录号04887301001);来自10μM储液至终浓度400nM的TQ.8v6.1.F、TQ.8v6.1.R、转化酶F和转化酶R引物各0.4μl;来自5μM储液至终浓度200nM的各种探针、TQ.8v6.1.MGB.P和InvertaseProbe各0.4μl,终浓度为0.1%的0.1μl的10%聚乙烯吡咯烷酮(PVP);2μl的10ng/μl的基因组DNA和0.5μl水。在Roche LightCycler 480SystemTM中在下列条件下扩增DNA:95℃10分钟1个循环;40个循环的下列3个步骤:95℃10秒;58℃35秒和72℃1秒,以及4℃10秒的最后一个循环。通过将未知样品的靶/参考值(由LightCycler 480输出)与cry34Ab1拷贝数对照的靶/参考值进行比较来确定cry34Ab1拷贝数。
使用转化酶内源参考基因如上对cry34Ab1基因所述进行aad-1基因检测。Aad-1引物序列如下;PCR循环保持不变:
SEQ ID NO:12(AAD1正向引物):TGTTCGGTTCCCTCTACCAA
SEQ ID NO:13(AAD1反向引物):CAACATCCATCACCTTGACTGA
SEQ ID NO:14(AAD1探针):5’FAM/CACAGAACCGTCGCTTCAGCAACA-MGB/BHQ3’
筛选T0植物用于转基因表达:
将含有cry34Ab1和aad-1转基因并在温室中生长的T0植物在V4-5发育阶段取样,用于叶ELISA测定。取四个叶片打孔块(leaf punch)样品。在每个含有叶片和300μl提取缓冲液(1X PBST[[Fischer Scientific,St.Louis,Mo])(补充有0.05%吐温20和0.5%BSA)1.2ml管中加入一个1/8”不锈钢珠(Hoover Precision Products,Cumming,GA,USA),制备用于ELISA测定的蛋白质提取物。将样品在GenogrinderTM(SPEX SamplePrep,Metuchen,Nj)中以1,500rpm处理4分钟。将样品在Sorvall Legend XFRTM离心机中以4,000rpm离心2分钟。在这个步骤之后,将另外300μl提取缓冲液添加到样品中,并且在GenogrinderTM中以1,500rpm将它们再次处理2分钟。将样品以4,000rpm离心7分钟。收集上清液,连同Cry34Ab1和AAD-1蛋白质标准品完成在不同稀释度下的ELISA。按照制造商的说明进行Cry34Ab1(Agdia,Inc.;目录号04500/4800)、AAD-1(Acadia BioScience,LLC;目录号ABS-041)ELISA测定,ELISA结果表示为ng/cm2叶表面积或百万分率(或每mg总植物蛋白的靶蛋白的ng数)。
将另一组植物在V4-5时对整个根块取样。将样品立即冷冻并冻干一周,然后研磨。如上对叶样品所述进行ELISA。按照制造商的说明(Thermo Scientific/Pierce,USA),用Bradford检测方法进行总根蛋白估计。根ELISA结果表示为百万分率(或每mg总植物蛋白的靶蛋白的ng数)。
筛选T1植物用于转基因检测和基因表达:
使T0植物与玉米栽培种B104互交,获得T1种子。每个调控元件构建体的三至五个T1系(或事件)进一步用于蛋白质表达研究。播种每个事件的大约40粒T1种子,用II喷洒V2-3发育阶段的幼苗以杀死空(null)植物。对所有存活的植物取样,如上所述进行转基因拷贝数测定。
为了转基因的基因表达分析,在如下多个生长和发育阶段对植物取样:叶(V4、V12和R3);根(V4);茎、花粉、穗丝(都在R1)以及籽粒和穗轴(都在R3)。所有组织均取样到嵌入干冰的管中;然后在取样完成后立即转移至-80℃。冻干冷冻组织,然后提取蛋白质用于ELISA。
如对前面部分中所述的T0样品所述进行蛋白质提取用于叶ELISA。例如,通过将冻干组织置于50ml管中,在8个0.25”陶瓷珠(MP Biomedicals,USA)存在下在油漆搅拌器中研磨30秒,进行用于各种组织类型的ELISA的蛋白质提取。对于需要进一步研磨另外30秒的某些组织重复该步骤。然后在2ml聚丙烯管中提取蛋白质,所述聚丙烯管含有足以覆盖管的弯曲底部的石榴石粉。将粗磨的组织转移到2ml管中以装填至0.3ml标记处。然后向每个管中加入一个0.25”的陶瓷球和0.6ml提取缓冲液(200μl蛋白酶抑制剂混合物[[ResearchProducts International Corp.,Solon,OH,USA]、200μl的500mM EDTA、15.5mg DTT粉和PBST至20ml)。将所有管在冰上保持10分钟,然后在GenogrinderTM中处理45秒。接下来,将40μl的10%Tween-20和另外300μl提取缓冲液加入管中,将样品再研磨45秒。将管以13,000rpm离心7-14分钟。将上清液小心地转移到新的管中。对于ELISA测定,在需要时将提取物在提取缓冲液中稀释。ELISA结果表示为ng/cm2叶表面积或百万分率(或每mg总植物蛋白的蛋白质ng数)。
实施例5:与玉米GRMZM2G138258启动子和3'UTR调控元件可操作连接的基因的表达
用含有如上所述的玉米GRMZM2G138258启动子和玉米GRMZM2G138258的基因表达构建体转化玉米植物。ELISA分析证实,该新的启动子驱动了转基因的稳健表达,并且该新的3'UTR有效终止了转基因的表达。从包含新的启动子构建体的转基因植物获得的Cry34Ab1蛋白的定量测量显示在表1中。数据显示,在含有新的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3'UTR(即pDAB108741)的植物中,Cry34Ab1蛋白的叶组织中表达,相比之下在根、茎、籽粒、穗丝和穗轴等组织中表达微不足道。此外,该新的玉米GRMZM2G138258启动子和玉米GRMZM2G138258 3'UTR并不驱动转基因在花粉组织内表达。
表1:Cry34Ab1和AAD-1的玉米GRMZM2G138258启动子T0表达
*ND=未确定。
Cry34Ab1ELISA结果表明,在用构建体pDAB108741转化的T1事件中,玉米GRMZM2G138258启动子调控元件(SEQ ID NO:1)和玉米GRMZM2G138258 3'UTR(SEQ ID NO:5)驱动偏好叶的Cry34Ab1表达。转化产生的事件也在叶和根组织中稳健表达AAD-1蛋白。总之,开发了在植物物种的叶组织中显示出高水平转基因表达的玉米GRMZM2G138258启动子。
实施例6:与玉米GRMZM2G138258启动子可操作连接的基因的作物转化
可以利用先前在专利申请WO 2007/053482的实施例11或实施例13中描述的相同技术,用与玉米GRMZM2G138258启动子可操作连接的基因转化大豆。
可以利用先前在美国专利No.7,838,733的实施例14或在专利申请WO 2007/053482(Wright等人)的实施例12中描述的相同技术,用与玉米GRMZM2G138258启动子可操作连接的基因转化棉花。
可以利用先前在美国专利No.7,838,733的实施例26或在专利申请WO 2007/053482(Wright等人)的实施例22中描述的相同技术,用与玉米GRMZM2G138258启动子可操作连接的基因转化卡诺拉。
可以利用先前在专利申请WO 2013/116700A1(Lira等人)的实施例23中描述的相同技术,用与玉米GRMZM2G138258启动子可操作连接的基因转化小麦。
可以利用先前在专利申请WO 2013/116700A1(Lira等人)的实施例19中描述的相同技术,用与玉米GRMZM2G138258启动子可操作连接的基因转化水稻。
实施例7:与玉米GRMZM2G138258启动子可操作连接的基因的土壤杆菌介导的转化
根据本主题公开,可根据本主题公开的实施方案使用本领域已知的技术转化其他作物。对于土壤杆菌介导的黑麦转化,参见,例如Popelka JC,Xu J,Altpeter F.,“Generation of rye with low transgene copy number after biolistic genetransfer and production of(Secale cereale L.)plants instantly marker-freetransgenic rye,”Transgenic Res.2003Oct;12(5):587-96.)。对于土壤杆菌介导的高粱转化,参见,例如Zhao等人,“Agrobacterium-mediated sorghum transformation,”PlantMol Biol.2000Dec;44(6):789-98。对于土壤杆菌介导的大麦转化,参见,例如Tingay等人,“Agrobacterium tumefaciens-mediated barley transformation,”The Plant Journal,(1997)11:1369–1376。对于土壤杆菌介导的小麦转化,参见,例如Cheng等人,“GeneticTransformation of Wheat Mediated by Agrobacterium tumefaciens,”PlantPhysiol.1997Nov;115(3):971-980。对于土壤杆菌介导的水稻转化,参见,例如Hiei等人,“Transformation of rice mediated by Agrobacterium tumefaciens,”PlantMol.Biol.1997Sep;35(1-2):205-18。
这些和其他植物的拉丁名称在下面给出。应当清楚的是,可使用其他(非土壤杆菌)转化技术将例如与玉米GRMZM2G138258启动子可操作连接的基因转化到这些和其他植物中。例子包括但不限于;玉蜀黍(Zea mays)、小麦(Triticum spp.)、水稻(Oryza spp.和Zizania spp.)、大麦(大麦属(Hordeum spp.))、棉花(水麻(Abroma augusta)和棉属(Gossypium spp.))、大豆(Glycine max)、糖用甜菜和食用甜菜(Beta spp.)、甘蔗(秀贵甘蔗(Saccharum officinarum)和其他物种)、羽叶棕榈(Feather palm)(桄榔(Arengapinnata))、番茄(Lycopersicon esculentum和其他种类、粘果酸浆(Physalis ixocarpa)、黄水茄(Solanum incanum)和其他种类、以及树番茄(Cyphomandra betacea))、马铃薯(Solanum tuberosum)、甘薯(Ipomoea batatas)、黑麦(Secale spp.)、辣椒(Capsicumannuum、中国辣椒(chinense)、以及小米椒(Capsicum frutescens))、莴苣(山莴苣(Lactuca sativa)、宿根莴苣(perennis)、以及野莴苣(pulchella))、卷心菜(Brassicaspp.)、芹菜(Apium graveolens)、茄子(Solanum melongena)、花生(Arachis hypogea)、高粱(Sorghum spp.)、苜蓿(Medicago sativa)、胡萝卜(Daucus carota)、豆类(菜豆属(Phaseolus spp.)和其他属)、燕麦(Avena sativa和strigosa)、豌豆(豌豆属(Pisum)、豇豆属(Vigna)、和Tetragonolobus spp.)、向日葵(Helianthus annuus)、南瓜(Cucurbitaspp.)、黄瓜(Cucumis sativa)、烟草(Nicotiana spp.)、拟南芥(Arabidopsis thaliana)、草坪草(黑麦草属(Lolium)、剪股颖属(Agrostis)、早熟禾属(Poa)、狗牙根属(Cynodon)、以及其他属)、三叶草(Trifolium)、巢菜属(Vicia)。例如,在本主题公开的实施方案中考虑了用与玉米GRMZM2G138258启动子可操作连接的基因转化这样的植物。
使用玉米GRMZM2G138258启动子来驱动可操作连接的基因可以在许多落叶和常绿木材物种中采用。这样的应用也在本公开的实施方案的范围内。这些种类包括,但不限于;桤木(桤木属(Alnus spp.))、白蜡木(ash)(梣属(Fraxinus spp.))、白杨和杨树种类(杨属(Populus spp.))、山毛榉(山毛榉属(Fagus spp.))、桦树(桦木属(Betula spp.))、樱桃(李属(Prunus spp.))、桉树(桉树属(Eucalyptus spp.))、山胡桃树(山核桃属(Caryaspp.))、枫树(枫属(Acer spp.))、橡树(栎属(Quercus spp.))、以及松树(松属(Pinusspp.))。
使用玉米GRMZM2G138258启动子来驱动可操作连接的基因可以在许多观赏和结果物种中采用。这样的应用也在本公开的实施方案的范围内。例子包括但不限于:玫瑰(蔷薇属物种(Rosa spp.))、地肤(burning bush)(卫矛属物种(Euonymus spp.))、矮牵牛(矮牵牛属物种(Petunia spp.))、秋海裳(秋海棠属物种(Begonia spp.))、杜鹃(杜鹃属物种(Rhododendron spp.))、海棠或苹果(苹果属物种(Malus spp.))、梨(梨属物种(Pyrusspp.))、桃(李属物种(Prunus spp.))、和万寿菊(万寿菊属物种(Tagetes spp.))。
虽然上面已经论述了许多示例性方面和实施方案,但是本领域技术人员将认识到它们的某些修改、置换、添加和子组合。因此,以下所附权利要求和此后引入的权利要求旨在被解释为包括在它们的真实精神和范围内的所有这些修改、置换、添加和子组合。
序列表
<110> 美国陶氏益农公司
M·古谱塔
S·库马尔
S·戈尔曼
A·F·渥尔登
<120> 用于转基因表达的植物启动子和3’UTR
<130> 78797-US-PSP-20160126-Sequence-Listing
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 1838
<212> DNA
<213> 玉米
<400> 1
ataaccctcg tcttttacag ccagcatcag tgactagaga atttccatgc atcagagaaa 60
acatctgtgc aagtccggag ttcactcatg cgcctgcttc cctgctggcg cccgtgcata 120
ttatattcag tgtcgatact gtttgtttct atctgggtcc ggtggtcctt cctattagct 180
tgacctgtca gtgtgcaatc tacccgtggt tatgagagtt tgaaactgga aggcaacgca 240
aaccaacatt gggggcagcg gtactggtgc attttcctat gtaaatgttc gtctcgggac 300
acgcggtgtc gcacagtgac tagagaattt tgctgaccgg aggtgcagac aagagggcaa 360
cgacgtacgt actagtagca aaccaacatg gtaattaacg gccatatgct gccgtgccga 420
ccggcggatc tccaggcccc tttgcttttt gtctgtttca atcgttttgt ctggctcaca 480
tgacaccgcg gcattccgat tagggtggat aacaagccag ctcgtctcgt ctcggctgct 540
cgactcgact cgtttagctc gcgagccaga gcagaaaaaa taatatgtac ataataatta 600
atttttagtt aatcttaaac taatttaata atagaaagta gtaattatac tcatagtttc 660
acaaaccacg tcaatgtaac accaaattag cacaattagt cactcatcaa ttcacaaatc 720
acatacatgt tcatcagttt aacctacaat tatatttgca tggaccaaat taacacatag 780
acataggtca ttaatcatta gtttaactca taggtcatag acctcacatt tatataacgt 840
gttcatcaat tattctgtaa atgatatgca tatagtttcg ttttgctgaa atatgataac 900
ttgtttagct cgcgagctgg ctcgttaacg aaccgagctg catcgttaat gaaccgagct 960
agaatgtcag ctcagctcgt gaaaaaattc aaaagggtcg atccgagccg agccgagctg 1020
accatgaacc gagcgagcca acgagccacg agtatttcat ccggccctga ttcaacgagc 1080
cacgattgca aaagctgtaa catggtggac ctctcgggcc gaatacgtgg gcttctccgt 1140
cctccggtgt tgaagaatac caacggccca ccatacaaaa aaaaacacaa cagtgcggcc 1200
caccaggaag atccggaaaa gccgtgacac catggtgtta agcttcagtt gtggtgaaaa 1260
ggtaagctta ctaacttacc tgtgccatga ccatgagtcc atgacgattc ctcgacctca 1320
aggaaatccc ggataggaga aagctcatgt gtgtgttgtg tgtgaggctc acaatttagc 1380
tagatagatg tcccttatct ctgcaagtgt aggccgacat gtatggctcc tcgagcagct 1440
gtgcccactg gtagcttttt tttttattgt tattatcatt gtacacttta tattaccatc 1500
aatcgtccga taaagcggat ctcgtcccac taagacgaaa aagttgtgga ctgtgggagc 1560
aggcgacgcg agtccgcaat gacaggccgc agcagcccac caaccaagcc ttacccaatc 1620
cgcggcccgg agacggagtg tggccacggg ccacacggct tctgaccgag aggccgaggc 1680
gagggataag agcgtgtccc accggccggc cacccgcagc atctttaaaa ttcggcccgg 1740
cgcgcgtcgg gtgacgaaaa cggaaccctg gctggtggag cgcggcgcgg ggcatgcgtg 1800
caagtgcaac caatcgcctc gtcgtgtgcg ctcgcctt 1838
<210> 2
<211> 5840
<212> DNA
<213> 玉米
<400> 2
ataaccctcg tcttttacag ccagcatcag tgactagaga atttccatgc atcagagaaa 60
acatctgtgc aagtccggag ttcactcatg cgcctgcttc cctgctggcg cccgtgcata 120
ttatattcag tgtcgatact gtttgtttct atctgggtcc ggtggtcctt cctattagct 180
tgacctgtca gtgtgcaatc tacccgtggt tatgagagtt tgaaactgga aggcaacgca 240
aaccaacatt gggggcagcg gtactggtgc attttcctat gtaaatgttc gtctcgggac 300
acgcggtgtc gcacagtgac tagagaattt tgctgaccgg aggtgcagac aagagggcaa 360
cgacgtacgt actagtagca aaccaacatg gtaattaacg gccatatgct gccgtgccga 420
ccggcggatc tccaggcccc tttgcttttt gtctgtttca atcgttttgt ctggctcaca 480
tgacaccgcg gcattccgat tagggtggat aacaagccag ctcgtctcgt ctcggctgct 540
cgactcgact cgtttagctc gcgagccaga gcagaaaaaa taatatgtac ataataatta 600
atttttagtt aatcttaaac taatttaata atagaaagta gtaattatac tcatagtttc 660
acaaaccacg tcaatgtaac accaaattag cacaattagt cactcatcaa ttcacaaatc 720
acatacatgt tcatcagttt aacctacaat tatatttgca tggaccaaat taacacatag 780
acataggtca ttaatcatta gtttaactca taggtcatag acctcacatt tatataacgt 840
gttcatcaat tattctgtaa atgatatgca tatagtttcg ttttgctgaa atatgataac 900
ttgtttagct cgcgagctgg ctcgttaacg aaccgagctg catcgttaat gaaccgagct 960
agaatgtcag ctcagctcgt gaaaaaattc aaaagggtcg atccgagccg agccgagctg 1020
accatgaacc gagcgagcca acgagccacg agtatttcat ccggccctga ttcaacgagc 1080
cacgattgca aaagctgtaa catggtggac ctctcgggcc gaatacgtgg gcttctccgt 1140
cctccggtgt tgaagaatac caacggccca ccatacaaaa aaaaacacaa cagtgcggcc 1200
caccaggaag atccggaaaa gccgtgacac catggtgtta agcttcagtt gtggtgaaaa 1260
ggtaagctta ctaacttacc tgtgccatga ccatgagtcc atgacgattc ctcgacctca 1320
aggaaatccc ggataggaga aagctcatgt gtgtgttgtg tgtgaggctc acaatttagc 1380
tagatagatg tcccttatct ctgcaagtgt aggccgacat gtatggctcc tcgagcagct 1440
gtgcccactg gtagcttttt tttttattgt tattatcatt gtacacttta tattaccatc 1500
aatcgtccga taaagcggat ctcgtcccac taagacgaaa aagttgtgga ctgtgggagc 1560
aggcgacgcg agtccgcaat gacaggccgc agcagcccac caaccaagcc ttacccaatc 1620
cgcggcccgg agacggagtg tggccacggg ccacacggct tctgaccgag aggccgaggc 1680
gagggataag agcgtgtccc accggccggc cacccgcagc atctttaaaa ttcggcccgg 1740
cgcgcgtcgg gtgacgaaaa cggaaccctg gctggtggag cgcggcgcgg ggcatgcgtg 1800
caagtgcaac caatcgcctc gtcgtgtgcg ctcgcctttg cttccctcgt taacgtgagt 1860
aacctcgttg gctgatcaag gctttgacgg cggcaccaac gttcttccct cgccgcctcg 1920
ttgcgtccgc ccgcccagcg ccaactcctc gtcctcgtac ataacccccc accccaccgc 1980
gtacagcgtt ccctctcgcg ccccgcggtg agctaccccc gctcgcctta gctagctacc 2040
caccatggcc ctcccgccgt cctcctcgcc gtcgtcgctc tccgccgcgt cagcgcagcc 2100
cacgcccctg cacctgcacc tcccgaccaa ggcgcccggc cgcctcccgc tgctcccctt 2160
ctcgcgcgcc gccctcccgc cgccgctgcg cctccgcatt gcgcgcacca gcctctcccc 2220
gggcacgccc ctcccgcgcg cgctcctgcc accaccctcc gcctccgccg acgccgcagc 2280
ctccgacgtc ggcggcggcg gcgccggctt cggcggccat gacgacgacg gccacaacca 2340
ccacggcggc gagggtggcg gcgacgacgg cggccatggc gacgacgccg gccacggcga 2400
tgacgcgccc ggcggcggcg acgcccgcgg ggaggcgctg ttcgtgctgg cgcagctggg 2460
ccgcaagctc gacagcctgc cgtccgatct cgccgccgcc gtcgacagcg gccgcatcgg 2520
ggccgacatc gtgcgccgct tcaccgaact cgaggccaac ggcttcttcc gatggctcct 2580
ccagttccag ggcttcaggg agaggctcct cgccgacgag ctcttcctca ccaagctcgg 2640
catagagtgc ggcatcggtc tcgtcgccaa ggtcaccttg ccattctgtt tttattttat 2700
ttttttatga agaaaaaaaa aactccctct gttcgtaaac aggtgacgac gacgatgtag 2760
cttaccaaag agtttctaat gctgctaata cttattataa atctaatcaa gtctaagaaa 2820
gtttgaccaa cacaacttat tcacagttct catgatcaac tgcgtcgagc tgtgtagttc 2880
taatctggct ccttttgcac tatttcacct tttgttcaga ccgtggctga gttccagaag 2940
agaggggaca atttcttcaa agagattgaa gttgtcatat ctgatgtggt acgcccgcct 3000
aactgtgctt atctcatatc atccagaccg cttcaggctt catatctcaa ccggtagcgc 3060
attggattgt caatcaggac aaatccgcac tttcgtcttt gcagcaacaa cgtaatgttt 3120
ggaaattttg gaaataaggt caatttcatg taatgcgatc ccaaatatgt cagagccctg 3180
gcttttccat ggaaccaacc tgttcatttc ttattctttt cacatactgc tgatgaaaca 3240
tgtcgatctt tgcaatctca gactaatgga agaccttaag atctgtttta tcaaaacaaa 3300
acatattttc tgtgctttca cttcactagt tgtaaaatac ttcactgtct gagattagta 3360
tctttctaac tttacattta aactcttctg atatggaatc taattcagtt gttgcttctg 3420
atactaccta ggtcatggcg attgttgcgg acgtcatgct tgtctatctt cctgctccaa 3480
ctattggttt acagccgcca ctggcaagaa acgctggagc tattgccaac tttttctata 3540
actgccctga taatactttc caagtaaagc aaccgtttct catttcctag tagagttgaa 3600
tggacctcct atttcttttc cttgtattca aaagcatgtt atgcgacttt tttctgcaga 3660
ttgctatggc tggaaggtca ttctcacttc tgcagaggat tggagctttt gtggtaaagt 3720
agattcattg cattcaattg ttaactattt tacgataatc atagttacct ggatgtattc 3780
gcaacccatg ttgatcaact aacagcggct gcttctttcc agaggaatgg tataaagctt 3840
ttggcagtgg gaactactgc ttctttggtt agtttgttta tctcattagc tattgatgat 3900
cttcattagc agtctctttt gatattttgc tagaaagttg ccattctctt ttctgagcga 3960
tatacagttg aacatgatcg tgttatgaag aaacatttct tcaaaacggg aattatctgc 4020
tagcaatatg ttattgttac gcttgcataa attatttatg gatcagttgg tttcatctcc 4080
ctgaattatt cctgtaacct tgcaatggct atgaatttgt catcttccca gattggcact 4140
agtgtcacga atgcagcgct caaagcaaag agggctgttg ataaggacct tgaggacgaa 4200
gtcatggaaa ttccagtcgt ctcaactagt gttgcctatg gtgtatacat gtccatttct 4260
agtaacctca ggtaaacaga gttcctaaat attctagcat acagggcata cttaaactta 4320
tggatttatg actgattata ttgttctgct atgagtagcc agagggagta agcgtgtcag 4380
ttgaattggc aatctttgtt atttttttta cccttgaatc agatcaaagc tgtgaaacat 4440
gtagcaaata gatacagact actatgttga tgttaacaat ttggtttgct gccattcaca 4500
gtttcattct tatgacataa atcatatact tcatcaggta tcagcttctg gctggtgtga 4560
tcgagcagag gatgctggag ccgttgctgc ataaccagaa gctactgctg agtgcaatgt 4620
gcttcatcgt tcgtacgggc aacacattcc ttggctcttt gctgtgagta acattcacct 4680
caccagaagt tgggatctta tatcctctgc tgttgctgta tttgcttact ggtgaacttt 4740
gtgaacaggt gggttgacta tgccagatgg ataggcgtcc agaagtctca cgaagaggcc 4800
taaagttcta gcagcttgcc tgcatgttcc gctgtcactg cctcactagg cacgttcaca 4860
ataccatcga tggcttgcct gcctctatag aatgctgatc tactcttcac tggaggcccc 4920
cttatatata ggacaaaaat cccaattttg tttggaaaac cacaagtagg gatatatctg 4980
tcgaattctc gtatgcaacg gcaacgccgt tctacccctc aacttttttt tttccttttt 5040
ctactttgca acatgcaaca agggctgtca ttgatcgaaa ttcaaatata tgttacattg 5100
ggaattccat gcgactgcct aaactctagg aagtttcact tgtcctgttt catatgtatg 5160
tatgcattgt agccttgttg tatttcctca atgtcttggt tgctttcatc ggttagagtt 5220
cttgacgact gttgcagaga ttctgtcgga gtatattcag ggtcgcctat taccagacat 5280
gctgcccgga caacatgttg attcgttcat tggcagcgca acatgcaatt agaaattaac 5340
agctactcta gaacaagcaa ataacagctg tcgctaaaat tcaatattcc atccctgtta 5400
acattgaatt tattgtcttg tttatgaacc ctatgtatct gacagcacca ttgccttttt 5460
tttacttagg cggtccatta ttgtcacacc cggatttaaa gagaaagttg gatgcatctt 5520
atacatgcga caaagaagaa aacatatata tgtatagaga taaatgtcat aataacatca 5580
aaatacttat tacaatgcgt aagtcttaca aaataaaaga taaatataaa tcaaactaaa 5640
atctatcttt ggcgccaata agtcaactgg gagatgccac ctagatcaga tcaaattcct 5700
cgttgtgtgg ctcctcttga accatctgtt cttctcctgt ggggagtgtg agacagcaag 5760
ggtgagctca cacatgttca ttgttcaaca agttgtgggg aataggagtt catgcgattt 5820
gtaaggctaa tcaacaatag 5840
<210> 3
<211> 206
<212> DNA
<213> 玉米
<400> 3
tgcttccctc gttaacgtga gtaacctcgt tggctgatca aggctttgac ggcggcacca 60
acgttcttcc ctcgccgcct cgttgcgtcc gcccgcccag cgccaactcc tcgtcctcgt 120
acataacccc ccaccccacc gcgtacagcg ttccctctcg cgccccgcgg tgagctaccc 180
ccgctcgcct tagctagcta cccacc 206
<210> 4
<211> 2759
<212> DNA
<213> 玉米
<400> 4
atggccctcc cgccgtcctc ctcgccgtcg tcgctctccg ccgcgtcagc gcagcccacg 60
cccctgcacc tgcacctccc gaccaaggcg cccggccgcc tcccgctgct ccccttctcg 120
cgcgccgccc tcccgccgcc gctgcgcctc cgcattgcgc gcaccagcct ctccccgggc 180
acgcccctcc cgcgcgcgct cctgccacca ccctccgcct ccgccgacgc cgcagcctcc 240
gacgtcggcg gcggcggcgc cggcttcggc ggccatgacg acgacggcca caaccaccac 300
ggcggcgagg gtggcggcga cgacggcggc catggcgacg acgccggcca cggcgatgac 360
gcgcccggcg gcggcgacgc ccgcggggag gcgctgttcg tgctggcgca gctgggccgc 420
aagctcgaca gcctgccgtc cgatctcgcc gccgccgtcg acagcggccg catcggggcc 480
gacatcgtgc gccgcttcac cgaactcgag gccaacggct tcttccgatg gctcctccag 540
ttccagggct tcagggagag gctcctcgcc gacgagctct tcctcaccaa gctcggcata 600
gagtgcggca tcggtctcgt cgccaaggtc accttgccat tctgttttta ttttattttt 660
ttatgaagaa aaaaaaaact ccctctgttc gtaaacaggt gacgacgacg atgtagctta 720
ccaaagagtt tctaatgctg ctaatactta ttataaatct aatcaagtct aagaaagttt 780
gaccaacaca acttattcac agttctcatg atcaactgcg tcgagctgtg tagttctaat 840
ctggctcctt ttgcactatt tcaccttttg ttcagaccgt ggctgagttc cagaagagag 900
gggacaattt cttcaaagag attgaagttg tcatatctga tgtggtacgc ccgcctaact 960
gtgcttatct catatcatcc agaccgcttc aggcttcata tctcaaccgg tagcgcattg 1020
gattgtcaat caggacaaat ccgcactttc gtctttgcag caacaacgta atgtttggaa 1080
attttggaaa taaggtcaat ttcatgtaat gcgatcccaa atatgtcaga gccctggctt 1140
ttccatggaa ccaacctgtt catttcttat tcttttcaca tactgctgat gaaacatgtc 1200
gatctttgca atctcagact aatggaagac cttaagatct gttttatcaa aacaaaacat 1260
attttctgtg ctttcacttc actagttgta aaatacttca ctgtctgaga ttagtatctt 1320
tctaacttta catttaaact cttctgatat ggaatctaat tcagttgttg cttctgatac 1380
tacctaggtc atggcgattg ttgcggacgt catgcttgtc tatcttcctg ctccaactat 1440
tggtttacag ccgccactgg caagaaacgc tggagctatt gccaactttt tctataactg 1500
ccctgataat actttccaag taaagcaacc gtttctcatt tcctagtaga gttgaatgga 1560
cctcctattt cttttccttg tattcaaaag catgttatgc gacttttttc tgcagattgc 1620
tatggctgga aggtcattct cacttctgca gaggattgga gcttttgtgg taaagtagat 1680
tcattgcatt caattgttaa ctattttacg ataatcatag ttacctggat gtattcgcaa 1740
cccatgttga tcaactaaca gcggctgctt ctttccagag gaatggtata aagcttttgg 1800
cagtgggaac tactgcttct ttggttagtt tgtttatctc attagctatt gatgatcttc 1860
attagcagtc tcttttgata ttttgctaga aagttgccat tctcttttct gagcgatata 1920
cagttgaaca tgatcgtgtt atgaagaaac atttcttcaa aacgggaatt atctgctagc 1980
aatatgttat tgttacgctt gcataaatta tttatggatc agttggtttc atctccctga 2040
attattcctg taaccttgca atggctatga atttgtcatc ttcccagatt ggcactagtg 2100
tcacgaatgc agcgctcaaa gcaaagaggg ctgttgataa ggaccttgag gacgaagtca 2160
tggaaattcc agtcgtctca actagtgttg cctatggtgt atacatgtcc atttctagta 2220
acctcaggta aacagagttc ctaaatattc tagcatacag ggcatactta aacttatgga 2280
tttatgactg attatattgt tctgctatga gtagccagag ggagtaagcg tgtcagttga 2340
attggcaatc tttgttattt tttttaccct tgaatcagat caaagctgtg aaacatgtag 2400
caaatagata cagactacta tgttgatgtt aacaatttgg tttgctgcca ttcacagttt 2460
cattcttatg acataaatca tatacttcat caggtatcag cttctggctg gtgtgatcga 2520
gcagaggatg ctggagccgt tgctgcataa ccagaagcta ctgctgagtg caatgtgctt 2580
catcgttcgt acgggcaaca cattccttgg ctctttgctg tgagtaacat tcacctcacc 2640
agaagttggg atcttatatc ctctgctgtt gctgtatttg cttactggtg aactttgtga 2700
acaggtgggt tgactatgcc agatggatag gcgtccagaa gtctcacgaa gaggcctaa 2759
<210> 5
<211> 1037
<212> DNA
<213> 玉米
<400> 5
agttctagca gcttgcctgc atgttccgct gtcactgcct cactaggcac gttcacaata 60
ccatcgatgg cttgcctgcc tctatagaat gctgatctac tcttcactgg aggccccctt 120
atatatagga caaaaatccc aattttgttt ggaaaaccac aagtagggat atatctgtcg 180
aattctcgta tgcaacggca acgccgttct acccctcaac tttttttttt cctttttcta 240
ctttgcaaca tgcaacaagg gctgtcattg atcgaaattc aaatatatgt tacattggga 300
attccatgcg actgcctaaa ctctaggaag tttcacttgt cctgtttcat atgtatgtat 360
gcattgtagc cttgttgtat ttcctcaatg tcttggttgc tttcatcggt tagagttctt 420
gacgactgtt gcagagattc tgtcggagta tattcagggt cgcctattac cagacatgct 480
gcccggacaa catgttgatt cgttcattgg cagcgcaaca tgcaattaga aattaacagc 540
tactctagaa caagcaaata acagctgtcg ctaaaattca atattccatc cctgttaaca 600
ttgaatttat tgtcttgttt atgaacccta tgtatctgac agcaccattg cctttttttt 660
acttaggcgg tccattattg tcacacccgg atttaaagag aaagttggat gcatcttata 720
catgcgacaa agaagaaaac atatatatgt atagagataa atgtcataat aacatcaaaa 780
tacttattac aatgcgtaag tcttacaaaa taaaagataa atataaatca aactaaaatc 840
tatctttggc gccaataagt caactgggag atgccaccta gatcagatca aattcctcgt 900
tgtgtggctc ctcttgaacc atctgttctt ctcctgtggg gagtgtgaga cagcaagggt 960
gagctcacac atgttcattg ttcaacaagt tgtggggaat aggagttcat gcgatttgta 1020
aggctaatca acaatag 1037
<210> 6
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> Prime TQ.8v6.1.F
<400> 6
gccataccct ccagttg 17
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Primer TQ.8v6.1.R
<400> 7
gccgttgatg gagtagtaga tgg 23
<210> 8
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> Probe TQ.8v6.1.MGB.P
<400> 8
ccgaatccaa cggcttca 18
<210> 9
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 转化酶F
<400> 9
tggcggacga cgacttgt 18
<210> 10
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物 转化酶R
<400> 10
aaagtttgga ggctgccgt 19
<210> 11
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 转化酶探针
<400> 11
cgagcagacc gccgtgtact t 21
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> AAD1正向引物
<400> 12
tgttcggttc cctctaccaa 20
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> AAD1反向引物
<400> 13
caacatccat caccttgact ga 22
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> AAD1探针
<400> 14
cacagaaccg tcgcttcagc aaca 24
<210> 15
<211> 3300
<212> DNA
<213> 人工序列
<220>
<223> Gene expression cassette for expresion of Cry34Ab1
<400> 15
ataaccctcg tcttttacag ccagcatcag tgactagaga atttccatgc atcagagaaa 60
acatctgtgc aagtccggag ttcactcatg cgcctgcttc cctgctggcg cccgtgcata 120
ttatattcag tgtcgatact gtttgtttct atctgggtcc ggtggtcctt cctattagct 180
tgacctgtca gtgtgcaatc tacccgtggt tatgagagtt tgaaactgga aggcaacgca 240
aaccaacatt gggggcagcg gtactggtgc attttcctat gtaaatgttc gtctcgggac 300
acgcggtgtc gcacagtgac tagagaattt tgctgaccgg aggtgcagac aagagggcaa 360
cgacgtacgt actagtagca aaccaacatg gtaattaacg gccatatgct gccgtgccga 420
ccggcggatc tccaggcccc tttgcttttt gtctgtttca atcgttttgt ctggctcaca 480
tgacaccgcg gcattccgat tagggtggat aacaagccag ctcgtctcgt ctcggctgct 540
cgactcgact cgtttagctc gcgagccaga gcagaaaaaa taatatgtac ataataatta 600
atttttagtt aatcttaaac taatttaata atagaaagta gtaattatac tcatagtttc 660
acaaaccacg tcaatgtaac accaaattag cacaattagt cactcatcaa ttcacaaatc 720
acatacatgt tcatcagttt aacctacaat tatatttgca tggaccaaat taacacatag 780
acataggtca ttaatcatta gtttaactca taggtcatag acctcacatt tatataacgt 840
gttcatcaat tattctgtaa atgatatgca tatagtttcg ttttgctgaa atatgataac 900
ttgtttagct cgcgagctgg ctcgttaacg aaccgagctg catcgttaat gaaccgagct 960
agaatgtcag ctcagctcgt gaaaaaattc aaaagggtcg atccgagccg agccgagctg 1020
accatgaacc gagcgagcca acgagccacg agtatttcat ccggccctga ttcaacgagc 1080
cacgattgca aaagctgtaa catggtggac ctctcgggcc gaatacgtgg gcttctccgt 1140
cctccggtgt tgaagaatac caacggccca ccatacaaaa aaaaacacaa cagtgcggcc 1200
caccaggaag atccggaaaa gccgtgacac catggtgtta agcttcagtt gtggtgaaaa 1260
ggtaagctta ctaacttacc tgtgccatga ccatgagtcc atgacgattc ctcgacctca 1320
aggaaatccc ggataggaga aagctcatgt gtgtgttgtg tgtgaggctc acaatttagc 1380
tagatagatg tcccttatct ctgcaagtgt aggccgacat gtatggctcc tcgagcagct 1440
gtgcccactg gtagcttttt tttttattgt tattatcatt gtacacttta tattaccatc 1500
aatcgtccga taaagcggat ctcgtcccac taagacgaaa aagttgtgga ctgtgggagc 1560
aggcgacgcg agtccgcaat gacaggccgc agcagcccac caaccaagcc ttacccaatc 1620
cgcggcccgg agacggagtg tggccacggg ccacacggct tctgaccgag aggccgaggc 1680
gagggataag agcgtgtccc accggccggc cacccgcagc atctttaaaa ttcggcccgg 1740
cgcgcgtcgg gtgacgaaaa cggaaccctg gctggtggag cgcggcgcgg ggcatgcgtg 1800
caagtgcaac caatcgcctc gtcgtgtgcg ctcgccttag ctagctaccc accccagaag 1860
acaccatgtc cgcccgcgag gtgcacatcg acgtgaacaa caagaccggc cacaccctcc 1920
agctggagga caagaccaag ctcgacggcg gcaggtggcg cacctccccg accaacgtgg 1980
ccaacgacca gatcaagacc ttcgtggccg aatccaacgg cttcatgacc ggcaccgagg 2040
gcaccatcta ctactccatc aacggcgagg ccgagatcag cctctacttc gacaacccgt 2100
tcgccggctc caacaaatac gacggccact ccaacaagtc ccagtacgag atcatcaccc 2160
agggcggctc cggcaaccag tcccacgtga cctacaccat ccagaccacc tcctcccgct 2220
acggccacaa gtcctgagta gttagcttaa tcacctagag ctcagttcta gcagcttgcc 2280
tgcatgttcc gctgtcactg cctcactagg cacgttcaca ataccatcga tggcttgcct 2340
gcctctatag aatgctgatc tactcttcac tggaggcccc cttatatata ggacaaaaat 2400
cccaattttg tttggaaaac cacaagtagg gatatatctg tcgaattctc gtatgcaacg 2460
gcaacgccgt tctacccctc aacttttttt tttccttttt ctactttgca acatgcaaca 2520
agggctgtca ttgatcgaaa ttcaaatata tgttacattg ggaattccat gcgactgcct 2580
aaactctagg aagtttcact tgtcctgttt catatgtatg tatgcattgt agccttgttg 2640
tatttcctca atgtcttggt tgctttcatc ggttagagtt cttgacgact gttgcagaga 2700
ttctgtcgga gtatattcag ggtcgcctat taccagacat gctgcccgga caacatgttg 2760
attcgttcat tggcagcgca acatgcaatt agaaattaac agctactcta gaacaagcaa 2820
ataacagctg tcgctaaaat tcaatattcc atccctgtta acattgaatt tattgtcttg 2880
tttatgaacc ctatgtatct gacagcacca ttgccttttt tttacttagg cggtccatta 2940
ttgtcacacc cggatttaaa gagaaagttg gatgcatctt atacatgcga caaagaagaa 3000
aacatatata tgtatagaga taaatgtcat aataacatca aaatacttat tacaatgcgt 3060
aagtcttaca aaataaaaga taaatataaa tcaaactaaa atctatcttt ggcgccaata 3120
agtcaactgg gagatgccac ctagatcaga tcaaattcct cgttgtgtgg ctcctcttga 3180
accatctgtt cttctcctgt ggggagtgtg agacagcaag ggtgagctca cacatgttca 3240
ttgttcaaca agttgtgggg aataggagtt catgcgattt gtaaggctaa tcaacaatag 3300
<210> 16
<211> 3307
<212> DNA
<213> 人工序列
<220>
<223> 用于表达AAD-1的基因表达盒
<400> 16
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaatagttt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840
ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900
caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960
cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccccct ctctaccttc 1020
tctagatcgg cgttccggtc catgcatggt tagggcccgg tagttctact tctgttcatg 1080
tttgtgttag atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga 1140
cctgtacgtc agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg 1200
ggatggctct agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca 1260
tagggtttgg tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt 1320
catcttttca tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt 1380
ctagatcgga gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt 1440
atgtgtgtgc catacatatt catagttacg aattgaagat gatggatgga aatatcgatc 1500
taggataggt atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt 1560
tcgcttggtt gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt 1620
agaatactgt ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca 1680
tacatcttca tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca 1740
tgttgatgtg ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg 1800
ctctaacctt gagtacctat ctattataat aaacaagtat gttttataat tatttcgatc 1860
ttgatatact tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct 1920
tcatacgcta tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg 1980
tgttacttct gcaggtacag tagttagttg aggtaccgga tccacacgac accatggctc 2040
atgctgccct cagccctctc tcccaacgct ttgagagaat agctgtccag ccactcactg 2100
gtgtccttgg tgctgagatc actggagtgg acttgaggga accacttgat gacagcacct 2160
ggaatgagat attggatgcc ttccacactt accaagtcat ctactttcct ggccaagcaa 2220
tcaccaatga gcagcacatt gcattctcaa gaaggtttgg accagttgat ccagtgcctc 2280
ttctcaagag cattgaaggc tatccagagg ttcagatgat ccgcagagaa gccaatgagt 2340
ctggaagggt gattggtgat gactggcaca cagactccac tttccttgat gcacctccag 2400
ctgctgttgt gatgagggcc atagatgttc ctgagcatgg cggagacact gggttccttt 2460
caatgtacac agcttgggag accttgtctc caaccatgca agccaccatc gaagggctca 2520
acgttgtgca ctctgccaca cgtgtgttcg gttccctcta ccaagcacag aaccgtcgct 2580
tcagcaacac ctcagtcaag gtgatggatg ttgatgctgg tgacagagag acagtccatc 2640
ccttggttgt gactcatcct ggctctggaa ggaaaggcct ttatgtgaat caagtctact 2700
gtcagagaat tgagggcatg acagatgcag aatcaaagcc attgcttcag ttcctctatg 2760
agcatgccac cagatttgac ttcacttgcc gtgtgaggtg gaagaaagac caagtccttg 2820
tctgggacaa cttgtgcacc atgcaccgtg ctgttcctga ctatgctggc aagttcagat 2880
acttgactcg caccacagtt ggtggagtta ggcctgcccg ctgagtagtt agcttaatca 2940
cctagagctc ggtcgcagcg tgtgcgtgtc cgtcgtacgt tctggccggc cgggccttgg 3000
gcgcgcgatc agaagcgttg cgttggcgtg tgtgtgcttc tggtttgctt taattttacc 3060
aagtttgttt caaggtggat cgcgtggtca aggcccgtgt gctttaaaga cccaccggca 3120
ctggcagtga gtgttgctgc ttgtgtaggc tttggtacgt atgggcttta tttgcttctg 3180
gatgttgtgt actacttggg tttgttgaat tattatgagc agttgcgtat tgtaattcag 3240
ctgggctacc tggacattgt tatgtattaa taaatgcttt gctttcttct aaagatcttt 3300
aagtgct 3307

Claims (21)

1.一种核酸载体,其包含启动子,所述启动子可操作连接于
a)多接头序列;
b)非GRMZM2G138258基因;或
c)a)和b)的组合,所述启动子包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。
2.权利要求1的核酸载体,其中所述启动子的长度为1,838bp。
3.权利要求1的核酸载体,其中所述启动子由与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列组成。
4.权利要求1-3中任一项的核酸载体,进一步包含编码选择标志物的序列。
5.权利要求1的核酸载体,其中所述启动子与转基因可操作连接。
6.权利要求5的核酸载体,其中所述转基因编码选择标志物或赋予杀虫抗性、除草剂耐受性、氮利用效率、小RNA表达、位点特异性核酸酶、水分利用效率、或营养品质的基因产物。
7.权利要求1-3或5中任一项的核酸载体,进一步包含3'非翻译多核苷酸序列,所述3'非翻译多核苷酸序列与SEQ ID NO:5具有至少90%序列同一性,其中所述3'非翻译序列与所述多接头或所述转基因可操作连接。
8.权利要求1-3或5中任一项的核酸载体,进一步包含5'非翻译多核苷酸序列,所述5'非翻译多核苷酸序列与SEQ ID NO:3具有至少90%序列同一性,其中所述5'非翻译序列与所述多接头或所述转基因可操作连接。
9.权利要求1-3或5中任一项的核酸载体,进一步包含内含子序列。
10.权利要求1的核酸载体,其中所述启动子驱动叶组织中的转基因表达。
11.一种非玉米栽培种B73植物,其包含与转基因可操作连接的与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。
12.权利要求11的植物,其中所述植物选自下组:小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥、烟草、向日葵、和卡诺拉。
13.权利要求11的植物,其中所述植物是玉蜀黍。
14.权利要求11-13中任一项的植物,其中所述转基因插入在所述植物的基因组中。
15.权利要求11的植物,其中启动子包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列,并且所述启动子与转基因可操作连接。
16.权利要求15的植物,进一步包含含有SEQ ID NO:5的3'非翻译序列,其中所述3'非翻译序列与所述转基因可操作连接。
17.权利要求15的植物,其中所述启动子驱动叶组织中的转基因表达。
18.权利要求15的植物,其中所述启动子的长度为1,838bp。
19.一种产生转基因植物细胞的方法,所述方法包括下列步骤:
a)用基因表达盒转化植物细胞,所述基因表达盒包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米GRMZM2G138258启动子;
b)分离包含所述基因表达盒的经转化的植物细胞;并且,
c)产生包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米GRMZM2G138258启动子的转基因植物细胞。
20.一种在植物细胞中表达感兴趣的多核苷酸序列的方法,所述方法包括将与玉米GRMZM2G138258启动子可操作连接的感兴趣的多核苷酸序列引入植物细胞中。
21.一种分离的多核苷酸,其包含与多核苷酸SEQ ID NO:1具有至少90%序列同一性的核酸序列。
CN201780027892.6A 2016-03-11 2017-03-08 用于转基因表达的植物启动子和3’utr Pending CN109068602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662306990P 2016-03-11 2016-03-11
US62/306,990 2016-03-11
PCT/US2017/021295 WO2017156080A1 (en) 2016-03-11 2017-03-08 Plant promoter and 3'utr for transgene expression

Publications (1)

Publication Number Publication Date
CN109068602A true CN109068602A (zh) 2018-12-21

Family

ID=59789818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780027892.6A Pending CN109068602A (zh) 2016-03-11 2017-03-08 用于转基因表达的植物启动子和3’utr

Country Status (8)

Country Link
US (1) US20170298373A1 (zh)
EP (1) EP3426018A4 (zh)
CN (1) CN109068602A (zh)
AR (1) AR109235A1 (zh)
CA (1) CA3015250A1 (zh)
TW (1) TW201736600A (zh)
UY (1) UY37150A (zh)
WO (1) WO2017156080A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284559A (zh) * 2021-07-21 2021-08-20 暨南大学 一种物种基因组的启动子查询方法、系统及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034888A1 (en) * 1999-05-06 2004-02-19 Jingdong Liu Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
CN101370939A (zh) * 2005-12-16 2009-02-18 关键基因公司 组成型植物启动子
CN104662156A (zh) * 2012-08-17 2015-05-27 美国陶氏益农公司 玉米非翻译区域用于植物中转基因表达的用途

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5986174A (en) * 1996-06-21 1999-11-16 Pioneer Hi-Bred International, Inc. Maize promoter sequence for leaf- and stalk-preferred gene expression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034888A1 (en) * 1999-05-06 2004-02-19 Jingdong Liu Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
CN101370939A (zh) * 2005-12-16 2009-02-18 关键基因公司 组成型植物启动子
CN104662156A (zh) * 2012-08-17 2015-05-27 美国陶氏益农公司 玉米非翻译区域用于植物中转基因表达的用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WILSON,R,K: "Zea mays", 《GENEBANK》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284559A (zh) * 2021-07-21 2021-08-20 暨南大学 一种物种基因组的启动子查询方法、系统及设备

Also Published As

Publication number Publication date
US20170298373A1 (en) 2017-10-19
EP3426018A4 (en) 2019-07-31
TW201736600A (zh) 2017-10-16
WO2017156080A1 (en) 2017-09-14
AR109235A1 (es) 2018-11-14
CA3015250A1 (en) 2017-09-14
EP3426018A1 (en) 2019-01-16
UY37150A (es) 2017-10-31

Similar Documents

Publication Publication Date Title
US20170081676A1 (en) Plant promoter and 3' utr for transgene expression
US10294485B2 (en) Plant promoter and 3′ UTR for transgene expression
US20190040404A1 (en) Plant promoter and 3' utr for transgene expression
CN110291199A (zh) 用于转基因表达的植物启动子
CN109673156A (zh) 用于转基因表达的植物启动子和3’utr
US10450577B2 (en) Root-preferred promoter from a Panicum virgatum metallothionein-like gene
AU2023200524A1 (en) Plant promoter and 3'utr for transgene expression
US20220098606A1 (en) Plant promoter for transgene expression
CN109068602A (zh) 用于转基因表达的植物启动子和3’utr
US10443067B2 (en) Root-preferred promoter from a brachypodium distachyon metallothionein-like gene
US10280429B2 (en) Plant promoter for transgene expression
CN109996436A (zh) 用于转基因表达的植物启动子
CN109844119A (zh) 用于转基因表达的植物启动子和3#utr
CN109415420B (zh) 用于转基因表达的植物启动子和3’utr
US20170121726A1 (en) Plant promoter for transgene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181221

WD01 Invention patent application deemed withdrawn after publication