CN110291199B - 用于转基因表达的植物启动子 - Google Patents

用于转基因表达的植物启动子 Download PDF

Info

Publication number
CN110291199B
CN110291199B CN201780073306.1A CN201780073306A CN110291199B CN 110291199 B CN110291199 B CN 110291199B CN 201780073306 A CN201780073306 A CN 201780073306A CN 110291199 B CN110291199 B CN 110291199B
Authority
CN
China
Prior art keywords
sequence
gene
plant
promoter
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780073306.1A
Other languages
English (en)
Other versions
CN110291199A (zh
Inventor
S·库马尔
P·巴龙
D·海明威
E·艾奇逊
A·阿斯百里
H·彭斯
A·J·博林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN110291199A publication Critical patent/CN110291199A/zh
Application granted granted Critical
Publication of CN110291199B publication Critical patent/CN110291199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8233Female-specific, e.g. pistil, ovule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本公开涉及采用来自玉米卵细胞基因的启动子促进植物或植物细胞中核苷酸序列转录的组合物和方法。一些实施方案涉及来自玉米卵细胞基因的启动子,其在植物中起作用以促进可操作连接的核苷酸序列的转录。其他实施方案涉及来自玉米卵细胞基因的3'UTR,其在植物中起作用以促进可操作连接的核苷酸序列的转录。

Description

用于转基因表达的植物启动子
相关申请的交叉引用
本申请要求2016年10月3日提交的美国临时专利申请序列号62/403238的权益,将其公开内容通过提述完整并入本文。
通过提述并入以电子方式提交的材料
通过提述将其完整并入的是与此同时提交的计算机可读核苷酸/氨基酸序列列表,其被标识如下:建立于2017年8月16日的名称为“79401-US-PSP-20161003-Sequence-Listing-ST25.txt”的一个19.6KB的ASCII(文本)文件”。
背景
许多植物物种能够用转基因进行转化,以引入农艺学上期望的性状或特征。得到的植物物种经开发和/或修饰为具有特定的期望性状。通常,期望性状例如包括,提高营养价值质量,增加产量,赋予抗虫性或抗病性,增加干旱和胁迫耐受性,提高园艺质量(例如,着色和生长),赋予除草剂耐受性,使得能够从植物生产在工业上有用的化合物和/或材料,和/或使得能够生产药物。
通过植物转化技术来生产包含在单个基因组基因座处叠加的多个转基因的转基因植物物种。植物转化技术导致转基因引入植物细胞中、在植物基因组中含有转基因的稳定整合拷贝的能育转基因植物的恢复,并且通过转录和翻译的后续转基因表达产生具有期望性状和表型的转基因植物。然而,使得能够产生高表达多个转基因的转基因植物物种的新型基因调控元件是期望的,所述多个转基因以性状叠加的方式被工程改造。
同样,使得能够在植物的特定组织或器官内表达转基因的新型基因调控元件是期望的。例如,可以通过用病原体-抗性基因转化植物基因组使得病原体-抗性蛋白在植物的根内强表达而实现植物对土-传病原体感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因。此外,可能希望在植物的叶和茎组织中表达转基因,以提供对除草剂的耐受性、或对地表昆虫和害虫的抗性。
因此,需要能够在特定植物组织中驱动期望的转基因表达水平的新的基因调控元件。
简述
在本主题公开的实施方案中,所述公开涉及包含启动子的核酸载体,所述启动子与a)多接头序列;b)非玉米卵细胞基因;或c)a)和b)的组合可操作连接,其中所述启动子包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列。在这个实施方案的方面,启动子的长度为1,500bp。在进一步的方面,启动子由与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列组成。在另一方面,启动子包含编码选择标志物的序列。在又另一方面,启动子与转基因可操作连接。在一些情况下,所述转基因编码选择标志物或赋予杀虫抗性、除草剂耐受性、氮利用效率、水分利用效率、RNAi表达、或营养品质的基因产物。在另外的方面,核酸载体包含3'非翻译多核苷酸序列。在另外的方面,核酸载体包含5'非翻译多核苷酸序列。在另外的方面,核酸载体包含内含子序列。在进一步的方面,启动子具有胚细胞表达。在另外的方面,多核苷酸序列与可操作连接于转基因的SEQ ID NO:1具有至少90%序列同一性。
在又另一个实施方案中,本主题公开涉及包含核酸载体的转基因植物。在一个方面,植物选自下组:玉米、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥属、烟草、向日葵、和卡诺拉。在进一步的方面,将转基因插入到所述植物的基因组中。在另一方面,转基因植物包括包含与SEQ ID NO:1具有至少90%序列同一性的多核苷酸序列的启动子,并且所述启动子与转基因可操作连接。在进一步的方面,转基因植物包含3'非翻译序列。在其他方面,转基因启动子驱动转基因植物中转基因的胚细胞组织特异性表达或组织优选表达。在又另一方面,转基因植物包含长度为1,500bp的启动子。
在本主题公开的实施方案中,所述公开涉及产生转基因植物细胞的方法,所述方法包括下列步骤:a)用包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米卵细胞启动子的基因表达盒转化植物细胞;b)分离包含所述基因表达盒的转化植物细胞;以及,c)产生包含与至少一个感兴趣的多核苷酸序列可操作连接的玉米卵细胞启动子的转基因植物细胞。在一个方面,利用植物转化方法进行植物细胞的转化。这些转化方法可以包括选自下组的植物转化方法,该组的组成为:土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列在植物细胞中表达。在其他方面,感兴趣的多核苷酸序列稳定整合到转基因植物细胞的基因组中。在另外的方面,所述方法进一步包括以下步骤:d)将转基因植物细胞再生成转基因植物;以及e)获得转基因植物,其中所述转基因植物包括包含与至少一个感兴趣的多核苷酸序列可操作连接的权利要求1的玉米卵细胞启动子的基因表达盒。在进一步的方面,所述转基因植物细胞是单子叶转基因植物细胞或双子叶转基因植物细胞。因此,双子叶转基因植物细胞可以包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,单子叶转基因植物细胞可以包括玉米植物细胞、水稻植物细胞和小麦植物细胞。在另一方面,玉米卵细胞启动子包含多核苷酸SEQ ID NO:1。在后续的方面,第一感兴趣的多核苷酸序列与SEQ ID NO:1的3'端可操作连接。在另外的方面,所述方法包括将与玉米卵细胞启动子可操作连接的感兴趣的多核苷酸序列引入到植物细胞中。在进一步的方面,通过植物转化方法将与玉米卵细胞启动子可操作连接的感兴趣的多核苷酸序列引入到植物细胞中。这种植物转化方法的例子包括土壤杆菌介导的转化法、基因枪转化法、碳化硅转化法、原生质体转化法、和脂质体转化法。在进一步的方面,感兴趣的多核苷酸序列在胚细胞组织中表达。在另外的方面,感兴趣的多核苷酸序列稳定整合到植物细胞的基因组中。在又另一方面,转基因植物是单子叶植物细胞或双子叶植物细胞。示例性双子叶植物细胞包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,示例性单子叶植物细胞包括玉米植物细胞、水稻植物细胞和小麦植物细胞。
在本主题公开的实施方案中,本公开涉及包含玉米卵细胞启动子的转基因植物细胞。在一个方面,所述转基因植物细胞包含转基因事件。在进一步的方面,转基因事件包括农艺性状。这样的农艺性状可包括杀虫抗性性状、除草剂耐受性性状、氮利用效率性状、水分利用效率性状、营养品质性状、DNA结合性状、可选择标志物性状、小RNA性状或其任何组合。例如,除草剂耐受性性状可包括aad-1编码序列。在后续的方面,转基因植物细胞产生商品。这样的商品可以包括蛋白质浓缩物、蛋白质分离物、籽粒、粗粉、面粉、油或纤维。在其他方面,转基因植物细胞选自双子叶植物细胞或单子叶植物细胞。示例性双子叶植物细胞包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉植物细胞和棉花植物细胞。同样,示例性单子叶植物细胞包括玉米植物细胞、水稻植物细胞和小麦植物细胞。在一个方面,玉米卵细胞启动子包含与多核苷酸SEQ ID NO:1具有至少90%序列同一性的多核苷酸。在后续的方面,玉米卵细胞启动子的长度为1,500bp。在进一步的方面,玉米卵细胞启动子由SEQID NO:1组成。在又另一方面,第一感兴趣的多核苷酸序列与SEQ ID NO:1的3'端可操作连接。在后续的方面,农艺性状在胚细胞组织中表达。
在本主题公开的实施方案中,本公开涉及包含与多核苷酸SEQ ID NO:1具有至少90%序列同一性的核酸序列的分离的多核苷酸。在一个方面,分离的多核苷酸特异性地在胚细胞组织中表达。在另一方面,分离的多核苷酸在植物细胞中表达。在其他方面,分离的多核苷酸包含编码多肽的开放阅读框多核苷酸和终止序列。在一个方面,多核苷酸SEQ IDNO:1的长度为1,500bp。
在本主题公开的实施方案中,本公开涉及包含与异源编码序列可操作连接的启动子的基因表达盒,其中所述启动子包含与SEQ ID NO:1具有至少95%序列同一性的多核苷酸。在一些实施方案中,所述多核苷酸与SEQ ID NO:1具有至少95%序列同一性。在另外的实施方案中,基因表达盒包含内含子。在进一步的实施方案中,基因表达盒包含5'UTR。在后续的实施方案中,启动子具有组织优选表达。在其他实施方案中,启动子与编码多肽或小RNA基因的异源编码序列可操作连接。编码的多肽或小RNA基因的例子包括赋予杀虫抗性、除草剂耐受性的异源编码序列、赋予氮利用效率的核酸、赋予水分利用效率的核酸、赋予营养品质的核酸、编码DNA结合蛋白的核酸和编码可选择标志物的核酸。在另外的实施方案中,基因表达盒包含3'非翻译区。在另外的实施方案中,基因表达盒包含5'非翻译区。在另外的实施方案中,基因表达盒包含终止子区。在其他实施方案中,本主题公开涉及包含基因表达盒的重组载体,其中所述载体选自下组:质粒、粘粒、细菌人工染色体、病毒和噬菌体。在其他实施方案中,本主题公开涉及包含基因表达盒的转基因细胞。在这个实施方案的一个方面,转基因细胞是转基因植物细胞。在这个实施方案的其他方面,转基因植物包含所述转基因植物细胞。在进一步的方面,转基因植物是单子叶植物或双子叶植物。单子叶植物的例子包括玉米植物、水稻植物和小麦植物。在该实施方案的进一步方面,转基因植物产生包含基因表达盒的种子。在其他实施方案中,启动子是组织优选启动子。在一些实施方案中,组织优选启动子是胚细胞优选启动子。
根据下面若干实施方案的详细说明,能够更清楚地了解前述特征和其他特征。
发明详述
I.若干实施方案概述
转基因植物产品的开发变得日益复杂。现在,对于商业上可行的转基因植物,需要将多个转基因叠加到单基因座中。用于基础研究或生物技术应用的植物启动子和3'UTR通常是单向的,其仅仅指导对于启动子而言融合在其3'端(下游)或者对于3'UTR而言融合在其5'端(上游)的一个基因。因此,每个转基因/异源编码序列常常需要用于表达的启动子和3'UTR,其中在一个基因叠加中需要多个调控元件来表达多个转基因。随着基因叠加中转基因数量的增加,常规使用相同的启动子和/或3'UTR来获得不同转基因的表达模式的最佳水平。获得转基因/异源编码序列表达的最佳水平对于产生单一多基因性状是必需的。不幸的是,已知由相同的启动子和/或3'UTR驱动的多基因构建体引起基因沉默,从而产生在该领域中不十分有效的转基因产品。重复的启动子和/或3'UTR元件可导致基于同源性的基因沉默。另外,在转基因内的重复序列可能导致基因基因座内同源重组,从而导致多核苷酸重排。转基因的沉默和重排将很可能对产生的转基因植物表达转基因的性能具有不良影响。此外,由于启动子重复导致的转录因子(TF)结合位点的过量可引起内源TF的消耗,从而导致转录失活。鉴于对于代谢工程和性状叠加而言需要将多个基因引入植物中,需要多个启动子和/或3'UTR来开发驱动多个基因表达的转基因作物。
在启动子和/或3'UTR鉴定中的特殊问题是,需要鉴定与植物中的具体细胞类型、发育阶段和/或功能有关的在其他植物组织中不表达的组织-特异性/优选的启动子。组织特异性(即,组织优选的)或器官特异性启动子驱动某些组织中(如植物的籽粒、根、叶或绒毡层中)的基因表达。根据观察在特定组织中或在植物发育过程中的特定时期表达的基因的表达,可以初步鉴定出组织和发育阶段特异性启动子/或3'UTR。这些组织特异性/优选的启动子和/或3'UTR在转基因植物行业中对于某些应用是需要的和期望的,因为它们允许异源基因以组织和/或发育阶段选择性方式特异性地表达,表明异源基因在不同的器官、组织和/或时间有差别地表达,而不是在其他不期望的组织中表达。例如,可以借助于土-传病原体通过用病原体-抗性基因转化植物基因组使得病原体-抗性蛋白在植物的根内强表达而实现植物对感染的抵抗力增加。或者,可能希望在处于特定的生长或发育阶段(例如像细胞分裂或伸长)的植物组织中表达转基因/异源编码序列。另一种应用是使用组织特异性/优选的启动子和/或3'UTR的需要,以将编码农艺性状的转基因的表达局限在特定的组织类型中,如发育的薄壁组织细胞中。正因为如此,在启动子和/或3'UTR鉴定中的特殊问题是如何鉴定启动子以及如何将鉴定的启动子与用于特异性/优选的组织表达的细胞的发育特性相关联。
关于鉴定启动子的另一个问题是要求克隆所有相关的顺式-作用和反式激活转录控制元件,使得克隆的DNA片段以想要的特异性表达模式驱动转录。鉴于这样的控制元件位于翻译起始或开始位点的远侧,将多核苷酸的大小选择为包含启动子对于提供启动子多核苷酸序列的表达水平和表达模式是重要的。已知启动子的长度包括功能信息,并且已显示不同的基因具有比基因组中其他基因的启动子更长或更短的启动子。阐明启动子的转录起始位点和预测启动子区中的功能基因元件是具有挑战性的。进一步增加挑战性的是调控基序及顺式和反式调控元件的复杂性、多样性和固有的简并性质(Blanchette,Mathieu等人,"Genome-wide computational prediction of transcriptional regulatorymodules reveals new insights into human gene expression."Genome research 16.5(2006):656-668)。顺式和反式调控元件位于启动子的远端部分,其调节基因的空间和时间表达仅在所需位点和特定时间发生(Porto,Milena Silva等人,"Plant promoters:anapproach of structure and function."Molecular biotechnology 56.1(2014):38-49)。因此,启动子调控元件的鉴定要求获得具有特定大小的含有必需的顺式和反式调控元件的适当序列,其将导致以期望的方式驱动可操作连接的转基因/异源编码序列的表达。
提供了通过使用玉米卵细胞启动子元件来克服这样的问题以便在植物体内(inplanta)表达转基因的方法和组合物。
II.术语和缩写
在整个申请中,使用了许多术语。为了提供对说明书和权利要求书的清楚且一致的理解,包括要赋予此类术语的范围,提供了以下定义。
如本文中使用的,术语“内含子”是指包含在基因(或表达的感兴趣的多核苷酸序列)中的被转录但不被翻译的任何核酸序列。内含子包括表达的DNA序列之内的非翻译核酸序列、以及从所述DNA序列转录的RNA分子中的相应序列。本文中描述的构建体还可以含有增强翻译和/或mRNA稳定性的序列,如内含子。一个这样的内含子的实例是拟南芥组蛋白H3变体的基因II的第一内含子或任何其他公知的内含子序列。内含子可与启动子序列联合用于增强翻译和/或mRNA稳定性。
如本文中使用的术语“分离的”意指当化合物最初形成时已经从其自然环境中移出,或者已经从存在的其他化合物中移出。术语“分离的”包括从天然来源分离的物质以及通过在宿主细胞中重组表达制备之后回收的物质(例如,核酸和蛋白质),或化学合成的化合物,如核酸分子、蛋白质、和肽类。
如本文中使用的术语“纯化的”涉及分子或化合物的分离,所述分子或化合物处于基本上不含污染物(通常与天然或自然环境中的所述分子或化合物相关)的形式,或相对于在所述化合物最初形成时存在的其他化合物在浓度上高度富集,并且意指作为从原始组成的其他组分分离的结果在纯度上已经增加。术语“纯化的核酸”在本文中用来描述已经从其他生物化合物(包括但不限于,多肽、脂质和碳水化合物)分离、分开产生、或纯化出来,同时影响组分的化学或功能变化的核酸序列(例如,通过移除蛋白质污染物并使连接所述核酸与染色体中的其余DNA的化学键断裂,可将核酸从染色体中纯化出来)。
如本文中使用的,术语“合成的”是指通过作为体外过程的化学合成产生的多核苷酸(即DNA或RNA)分子。例如,可以在EppendorfTM管内的反应过程中产生合成DNA,从而由DNA或RNA的天然链以酶促方式产生合成DNA。可以使用其他实验室方法来合成多核苷酸序列。可以使用亚磷酰胺通过固相合成在寡核苷酸合成仪上化学合成寡核苷酸。合成的寡核苷酸可以退火到彼此之上成为复合物,从而产生“合成的”多核苷酸。用于化学合成多核苷酸的其他方法是本领域已知的,并且可以容易地实施以便用于本公开中。
如本文中使用的术语“大约”意指比陈述的值或值的范围大或小10%,但不意图针对仅仅这个更宽的定义指定任何值或值的范围。在每个值或值的范围之前的术语“大约”同样意图涵盖所陈述的绝对值或值的范围的实施方案。
就本公开的目的而言,“基因”包括编码基因产物(参见下文)的DNA区域,也包括调节基因产物的产生的所有DNA区域,无论这类调控序列是否位于编码和/或转录序列的附近。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点、内含子和基因座控制区。
如本文中使用的术语“天然的”或“自然的”定义了在自然界中发现的状况。“天然DNA序列”是通过自然手段或传统育种技术产生的而不是通过基因工程(例如,使用分子生物学/转化技术)产生的存在于自然界中的DNA序列。
如本文中使用的“转基因”或“异源编码序列”定义为编码基因产物(包括,例如但不限于mRNA)的核酸序列。在一个实施方案中,转基因/异源编码序列为外源核酸,其中转基因/异源编码序列已通过基因工程被引入通常在其中未发现所述转基因/异源编码序列的宿主细胞(或其后代)中。在一个实例中,转基因/异源编码序列编码在工业上或药学上有用的化合物、或编码期望的农艺性状的基因(例如,除草剂抗性基因)。在又另一个实例中,转基因/异源编码序列为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。在一个实施方案中,转基因/异源编码序列为内源核酸,其中所述内源核酸的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸序列处于反义取向的核酸。如本文中使用的,“异源编码序列”意指除天然地编码玉米卵细胞基因或表达的玉米卵细胞蛋白的任何同源物的编码序列之外的任何编码序列。术语“异源的”用于在本发明的上下文中的核酸序列的任何组合,所述组合在自然界中通常未被紧密相关地发现。
如本文中使用的,术语“非玉米卵细胞转基因”或“非玉米卵细胞基因”是与玉米卵细胞基因编码序列(具有Genbank NCBI登录号GRMZM2G083190的SEQ ID NO:6)具有小于80%序列同一性的任何转基因。
如本文中定义的“基因产物”是由基因产生的任何产物。例如,基因产物可以是基因直接转录的产物(例如,mRNA、tRNA、rRNA、反义RNA、干扰RNA、核酶、结构RNA或任何其他类型的RNA)或mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和编辑等过程修饰过的RNA,以及通过例如,甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、豆蔻酰化(myristilation)和糖基化修饰的蛋白质。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从DNA到RNA再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、RNA运输和加工、中间分子比如mRNA的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,Northern印迹、RT-PCR、Western印迹,或体外、原位或体内蛋白活性测定,可以在RNA水平或蛋白质水平测量基因表达。
如本文中使用的,术语“基因表达”涉及这样的过程,通过该过程,核酸转录单元(包括,例如基因组DNA)的编码信息被转化为细胞的操作部分、非操作部分、或结构部分(常常包括蛋白质的合成)。基因表达可能受到外部信号的影响,例如细胞、组织、或生物暴露于增加或降低基因表达的物质。基因表达也可以在从DNA到RNA再到蛋白质的途径中的任何位置受到调节。例如,通过控制对转录、翻译、RNA运输和加工、中间分子比如mRNA的降解的作用,或通过在特异性蛋白分子已经产生之后的活化、失活、区室化、或降解,或它们的组合,由此发生基因表达的调节。通过本领域已知的任何方法,包括但不限于,Northern印迹、RT-PCR、Western印迹,或体外、原位或体内蛋白活性测定,可以在RNA水平或蛋白质水平测量基因表达。
如本文中使用的,术语“基于同源性的基因沉默”(HBGS)为通用术语,其包括转录基因沉默和转录后基因沉默两者。通过未连接的沉默基因座使靶基因座沉默可由于转录抑制(转录基因沉默;TGS)或mRNA降解(转录后基因沉默;PTGS)所致,原因在于产生分别对应于启动子或转录序列的双链RNA(dsRNA)。在每个过程中涉及不同的细胞组分表明,dsRNA诱导的TGS和PTGS很可能是由于古老的普遍机制的多样化所致。然而,由于通常依赖于分析不同的沉默基因座,已经难于实现TGS和PTGS的严格比较。在一些情况下,由于产生对应于启动子和不同靶基因的转录序列的dsRNA,单个转基因基因座能够触发TGS和PTGS两者。Mourrain等人,(2007)Planta 225:365-79。siRNA很可能是在同源序列上触发TGS和PTGS的实际分子:siRNA在这个模型中将通过转基因序列的甲基化扩散到内源启动子中来触发顺式和反式同源序列的沉默和甲基化。
如本文中使用的,术语“核酸分子”(或“核酸”、或“多核苷酸”)可以是指核苷酸的聚合形式,其可包括RNA的正义和反义链、cDNA、基因组DNA、和合成形式,以及上述的混合聚合物。核苷酸可以是指核糖核苷酸、脱氧核糖核苷酸、或这两种类型核苷酸的任一者的修饰形式。如本文中使用的“核酸分子”与“核酸”和“多核苷酸”是同义词。除非另外指明,核酸分子的长度通常为至少10个碱基。该术语可以指具有不确定长度的RNA或DNA分子。该术语包括DNA的单和双链形式。核酸分子可以包括天然存在的核苷酸和/或修饰核苷酸,它们通过天然存在和/或非天然存在的核苷酸连接而连接在一起。
本领域技术人员易于理解,核酸分子可被化学修饰或生物化学修饰,或者可以含有非天然的或衍生的核苷酸碱基。这样的修饰包括,例如,标记物、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰(例如,如不带电连接(uncharged linkage)的修饰:例如甲基膦酸盐、磷酸三酯、亚磷酰胺、氨基甲酸酯等;带电连接(charged linkage)的修饰:例如,硫代磷酸酯、二硫代磷酸酯等;悬垂部分的修饰:例如肽类;嵌入剂修饰:例如吖啶、补骨脂素等;螯合剂修饰;烷化剂(alkylator)修饰;和修饰的连接:例如α异头核酸等)。术语“核酸分子”还包括任何拓扑结构,包括单链的、双链的、部分双链体的、三链体的、发夹形的(hairpinned)、圆形的、和挂锁形的结构。
转录以5’到3’的方式沿着DNA链行进。这表明通过向生长链的3’端连续添加5’-核糖核苷三磷酸而产生RNA(消除焦磷酸盐必不可少)。在线性或环状核酸分子中,如果离散元件以从另一个元件的5’方向结合到或将要结合到同一核酸上,则所述离散元件(例如,特定的核苷酸序列)可被称为相对于所述另一个元件的“上游”或“5’”。类似地,如果离散元件以从另一个元件的3’方向结合到或将要结合到同一核酸上,则所述离散元件可为相对于所述另一个元件的“下游”或“3’”。
如本文中使用的,碱基“位置”是指在指定核酸之内的给定碱基或核苷酸残基的位置。可通过与参考核酸的比对(参见下文)定义指定核酸。
杂交涉及两条多核苷酸链通过氢键结合。寡核苷酸及其类似物通过互补碱基之间的氢键杂交,所述氢键包括Watson-Crick、Hoogsteen或反Hoogsteen氢键。通常,核酸分子由含氮碱基组成,所述碱基为嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或嘌呤(腺嘌呤(A)和鸟嘌呤(G))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶对嘌呤的键合被称为“碱基配对”。更具体地说,A会与T或U键合,而G会与C键合。“互补”指在两条不同的核酸序列或同一核酸序列的两个不同区域之间发生的碱基配对。
“可特异性杂交”和“特异性互补”为表明互补性的足够程度的术语,该互补性使得在寡核苷酸与DNA或RNA靶之间发生稳定且特异的结合。寡核苷酸不必100%与其可特异性杂交的靶序列互补。当寡核苷酸与靶DNA或RNA分子的结合干扰了DNA或RNA的正常功能时,所述寡核苷酸是可特异性杂交的,并且存在足够的互补程度,以避免在期望特异性结合的条件下(例如在体内测定或系统情形的生理条件下)的寡核苷酸与非靶序列的非特异性结合。这样的结合被称为特异性杂交。
导致特定严格程度的杂交条件会根据选择的杂交方法的性质和杂交的核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg2+浓度)有助于杂交的严格性,尽管洗涤时间也影响严格性。关于得到特定严格程度所需要的杂交条件的计算论述于Sambrook等人(编),Molecular Cloning:A Laboratory Manual,第2版,1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York,1989,第9章和第11章中。
如本文中使用的,“严格条件”涵盖的条件为,在这样的条件下,只有当杂交分子与DNA靶之间的错配小于50%时才发生杂交。“严格条件”包括进一步的特定严格性水平。因此,如本文中使用的,“中等严格性”条件为具有大于50%的序列错配的分子不会杂交的条件;“高严格性”条件为具有大于20%错配的序列不会杂交的条件;并且“极高严格性”条件为具有大于10%错配的序列不会杂交的条件。
在具体实施方案中,严格条件可包括:在65℃杂交,然后在65℃用0.1x SSC/0.1%SDS洗涤40分钟。
以下是代表性的非限制性杂交条件:
极高严格性:在5x SSC缓冲液中在65℃杂交16小时;在2x SSC缓冲液中在室温下洗涤两次,每次15分钟;并且在0.5x SSC缓冲液中在65℃洗涤两次,每次20分钟。
高严格性:在5x-6x SSC缓冲液中在65-70℃杂交16-20小时;在2x SSC缓冲液中在室温下洗涤两次,每次5-20分钟;并且在1x SSC缓冲液中在55-70℃洗涤两次,每次30分钟。
中等严格性:在6x SSC缓冲液中在室温到55℃杂交16-20小时;在2x-3x SSC缓冲液中在室温到55℃洗涤至少两次,每次20-30分钟。
在具体实施方案中,可特异性杂交的核酸分子可在极高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在高严格性杂交条件下保持结合。在这些和进一步的实施方案中,可特异性杂交的核酸分子可在中等严格性杂交条件下保持结合。
寡核苷酸:寡核苷酸是一种短的核酸聚合物。寡核苷酸可通过切割较长核酸区段、或通过使单独的核苷酸前体聚合而形成。自动合成仪能够合成在长度上高达几百个碱基对的寡核苷酸。由于寡核苷酸可与互补的核苷酸序列结合,它们可用作检测DNA或RNA的探针。由DNA组成的寡核苷酸(寡脱氧核糖核苷酸)可用于PCR中,PCR为用于扩增小DNA序列的技术。在PCR中,寡核苷酸一般被称为“引物”,其允许DNA聚合酶延伸寡核苷酸并复制互补链。
术语“序列同一性百分比”或“同一性百分比”或“同一性”可互换使用,是指基于在两个或更多个氨基酸或核苷酸序列之间比较的序列中在对应地相同位置之间的相同匹配的序列比较。同一性百分比是指两个最佳比对的多核苷酸或肽序列在组分(例如核苷酸或氨基酸)的整个比对窗口中不变的程度。可以使用本领域已知的杂交实验和数学算法来确定同一性百分比。作为本领域已知的计算同一性百分比的序列比对计算机程序,存在着许多数学算法。可以将这些程序分类为全局序列比对程序或局部序列比对程序。
全局序列比对程序通过如下方式计算两个序列的同一性百分比:比较端对端对齐以便找到精确匹配,将精确匹配的数目除以较短序列的长度,然后乘以100。基本上,其为参考(“查询”)多核苷酸分子与测试(“主题”)多核苷酸分子相比的线性多核苷酸序列中的相同核苷酸的百分比,此时所述两个序列被最佳比对(具有适当的核苷酸插入、缺失或空位)。
局部序列比对程序在其计算方面是相似的,但仅比较对齐的序列片段而不利用端对端分析。可以使用诸如BLAST的局部序列比对程序来比较两个序列的特定区域。两个序列的BLAST比较产生代表不同比对的数目的E值或期望值,所述不同比对具有等于或优于原始比对评分S的评分,预期其偶然出现在数据库搜索中。E值越低,匹配越显著。由于数据库大小是E值计算中的一个要素,因此对于任何给定的查询/条目匹配,通过针对公共数据库(比如GENBANK)进行BLAST获得的E值通常会随着时间的推移而增加。在设定多肽功能预测的置信度标准时,“高”BLAST匹配在本文中被认为具有小于1E-30的顶部BLAST命中E值;中等BLASTX E值为1E-30至1E-8;低BLASTX E值大于1E-8。使用E值、同一性百分比、查询覆盖率和命中覆盖率的组合来确定本发明中的蛋白质功能分配。查询覆盖率是指在BLAST比对中表示的查询序列的百分比。命中覆盖率是指在BLAST比对中表示的数据库条目的百分比。在本发明的一个实施方案中,从蛋白质同源物的功能推断出查询多肽的功能,其中(1)命中_p<1e-30或同一性%>35%和查询_覆盖率>50%和命中_覆盖率>50%,或者(2)命中_p<1e-8和查询_覆盖率>70%和命中_覆盖率>70%。在序列的BLAST分析过程产生以下缩写。
/>
用于比较的序列比对方法是本领域熟知的。描述了各种程序和比对算法。在一个实施方案中,本主题公开涉及使用Vector NTI软件包的AlignX比对程序(Invitrogen,Carlsbad,CA)计算两个多核苷酸或氨基酸序列之间的同一性百分比。AlignX比对程序是用于多核苷酸或蛋白质的全局序列比对程序。在一个实施方案中,本主题公开涉及使用LASERGENE生物信息学计算软件包的MegAlign程序(MegAlignTM(1993-2016).DNASTAR.Madison,WI)计算两个多核苷酸或氨基酸序列之间的同一性百分比。MegAlign程序是用于多核苷酸或蛋白质的全局序列比对程序。在一个实施方案中,本主题公开涉及使用Clustal比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于ClustalW和ClustalV(Higgins和Sharp(1988)Gene.Dec.15;73(1):237-44;Higgins和Sharp(1989)CABIOS 5:151-3;Higgins等人,(1992)Comput.Appl.Biosci.8:189-91)。在一个实施方案中,本主题公开涉及使用GCG程序软件包(Wisconsin PackageVersion 9.0,Genetics Computer Group(GCG),Madison,WI)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用BLAST比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述软件包例如但不限于BLASTP、BLASTN、BLASTX等(Altschul等人(1990)J.Mol.Biol.215:403-10)。在一个实施方案中,本主题公开涉及使用FASTA比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于FASTA、TFASTX、TFASTY、SSEARCH、LALIGN等(Pearson(1994)Comput.Methods Genome Res.[Proc.Int.Symp.],Meeting Date 1992(Suhai和Sandor编辑),Plenum:New York,NY,第111-20页)。在一个实施方案中,本主题公开涉及使用T-Coffee比对程序(Notredame等人(2000)J.Mol.Biol.302,205-17)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用DIALIGN比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于DIALIGN、CHAOS、DIALIGN-TX、DIALIGN-T等(Al Ait等人(2013)DIALIGN at GOBICSNuc.Acids Research 41,W3-W7)。在一个实施方案中,本主题公开涉及使用MUSCLE比对程序软件包(Edgar(2004)Nucleic Acids Res.32(5):1792-1797)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用MAFFT比对程序(Katoh等人(2002)Nucleic Acids Research 30(14):3059-3066)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Genoogle程序(Albrecht,Felipe.arXiv150702987v1[cs.DC]10 Jul.2015)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用HMMER程序软件包(Eddy.(1998)Bioinformatics,14:755-63)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用PLAST比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于TPLASTN、PLASTP、KLAST和PLASTX(Nguyen和Lavenier.(2009)BMC Bioinformatics,10:329)。在一个实施方案中,本主题公开涉及使用USEARCH比对程序(Edgar(2010)Bioinformatics 26(19),2460-61)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用SAM比对程序软件包(Hughey和Krogh(Jan.1995)Technical Report UCSC0CRL-95-7,University of California,Santa Cruz)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用IDF搜索器(O'Kane,K.C.,The Effect ofInverse Document Frequency Weights on Indexed Sequence Retrieval,OnlineJournal of Bioinformatics,Volume 6(2)162-173,2005)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Parasail比对程序(Daily,Jeff.Parasail:SIMD C library for global,semi-global,and local pairwisesequence alignments.BMC Bioinformatics.17:18.February 10,2016)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用ScalaBLAST比对程序(Oehmen C,Nieplocha J."ScalaBLAST:A scalable implementationof BLAST for high-performance data-intensive bioinformatics analysis."IEEETransactions on Parallel&Distributed Systems 17(8):740-749 AUG 2006)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用SWIPE比对程序(Rognes,T.Faster Smilth-Waterman database searches with inter-sequence SIMD parallelization.BMC Bioiinformatics.12,221(2011))计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用ACANA比对程序(Weichun Huang,David M.Umbach和Leping Li,Accurate anchoring alignment ofdivergent sequences.Bioinformatics 22:29-34,Jan 1 2006)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用DOTLET比对程序(Junier,T.&Pagni,M.DOTLET:diagonal plots in a web browser.Bioinformatics 16(2):178-9 Feb.2000)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用G-PAS比对程序(Frohmberg,W.等人,G-PAS 2.0–an improvedversion of protein alignment tool with an efficient backtracking routine onmultiple GPUs.Bulletin of the Polish Academy of Sciences Technical Sciences,Vol.60,491 Nov.2012))计算两个多核苷酸或氨基酸序列之间的同一性百分比。如本文中使用的,术语“可操作连接”涉及与第二核酸序列可操作连接的第一核酸序列,此时第一核酸序列处于与第二核酸序列的功能关系中。例如,当启动子影响编码序列的转录或表达时,则该启动子与该编码序列是可操作连接的。当以重组方式产生时,可操作连接的核酸序列通常是连续的,并且在这种情况下必需将两个蛋白质编码区连接在同一个阅读框内。然而,元件不必是连续地可操作连接的。.在一个实施方案中,本主题公开涉及使用GapMis比对程序(Flouri,T.等人,Gap Mis:A tool for pairwise sequence alignment with a singlegap.Recent Pat DNA Gene Seq.7(2):84-95 Aug.2013)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用EMBOSS比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于:Matcher、Needle、Stretcher、Water、Wordmatch等(Rice,P.,Longden,I.&Bleasby,A.EMBOSS:TheEuropean Molecular Biology Open Software Suite.Trends in Genetics 16(6)276-77(2000))。在一个实施方案中,本主题公开涉及使用Ngila比对程序(Cartwright,R.Ngila:global pairwise alignments with logarithmic and affine gapcosts.Bioinformatics.23(11):1427-28.June 1,2007)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用probA(也称为propA)比对程序(Mückstein,U.,Hofacker,IL,&Stadler,PF.Stochastic pairwisealignments.Bioinformatics 18 Suppl.2:S153-60.2002)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用SEQALN比对程序软件包(Hardy,P.&Waterman,M.The Sequence Alignment Software Library at USC.1997)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用SIM比对程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于GAP、NAP、LAP等(Huang,X&Miller,W.A Time-Efficient,Linear-Space LocalSimilarity Algorithm.Advances in Applied Mathematics,vol.12(1991)337-57)。在一个实施方案中,本主题公开涉及使用UGENE比对程序(Okonechnikov,K.,Golosova,O.&Fursov,M.Unipro UGENE:a unified bioinformatics toolkit.Bioinformatics.201228:1166-67)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用BAli-Phy比对程序(Suchard,MA &Redelings,BD.BAli-Phy:simultaneous Bayesian inference of alignment and phylogeny.Bioinformatics.22:2047-48.2006)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Base-By-Base比对程序(Brodie,R.等人,Base-By-Base:Singlenucleotide-level analysis of whole viral genome alignments,BMCBioinformatics,5,96,2004)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用DECIPHER比对程序(ES Wright(2015)"DECIPHER:harnessing local sequence context to improve protein multiple sequencealignment."BMC Bioinformatics,doi:10.1186/s12859-015-0749-z.)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用FSA 比对程序(Bradley,RK等人(2009)Fast Statistical Alignment.PLoS ComputationalBiology.5:e1000392)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Geneious比对程序(Kearse,M.等人(2012).Geneious Basic:an integrated and extendable desktop software platform for the organizationand analysis of sequence data.Bioinformatics,28(12),1647-49)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Kalign比对程序(Lassmann,T.&Sonnhammer,E.Kalign–an accurate and fast multiple sequencealignment algorithm.BMC Bioinformatics 2005 6:298)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用MAVID比对程序(Bray,N.&Pachter,L.MAVID:Constrained Ancestral Alignment of MultipleSequences.Genome Res.2004 Apr;14(4):693-99)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用MSA比对程序(Lipman,DJ等人,Atool for multiple sequence alignment.Proc.Nat’l Acad.Sci.USA.1989;86:4412-15)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用MultAlin比对程序(Corpet,F.,Multiple sequence alignment with hierarchialclustering.Nucl.Acids Res.,1988,16(22),10881-90)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用LAGAN或MLAGAN比对程序(Brudno等人,LAGAN and Multi-LAGAN:efficient tools for large-scale multiplealignment of genomic DNA.Genome Research 2003 Apr;13(4):721-31)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Opal比对程序(Wheeler,T.J.,&Kececiouglu,J.D.Multiple alignment by aligningalignments.Proceedings of the 15th ISCB conference on Intelligent Systems forMolecular Biology.Bioinformatics.23,i559-68,2007)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用PicXAA程序软件包计算两个多核苷酸或氨基酸序列之间的同一性百分比,所述程序包括但不限于PicXAA、PicXAA-R、PicXAA-Web等(Mohammad,S.,Sahraeian,E.&Yoon,B.PicXAA:greedy probabilisticconstruction of maximum expected accuracy alignment of multiplesequences.Nucleic Acids Research.38(15):4917-28.2010)。在一个实施方案中,本主题公开涉及使用PSAlign比对程序(SZE,S.-H.,Lu,Y.,&Yang,Q.(2006)A polynomial timesolvable formulation of multiple sequence alignment Journal of ComputationalBiology,13,309-19)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用StatAlign比对程序(Novák,/>等人(2008)StatAlign:anextendable software package for joint Bayesian estimation of alignments andevolutionary trees.Bioinformatics,24(20):2403-04)计算两个多核苷酸或氨基酸序列之间的同一性百分比。在一个实施方案中,本主题公开涉及使用Needleman和Wunsch的Gap比对程序计算两个多核苷酸或氨基酸序列之间的同一性百分比(Needleman and Wunsch,Journal of Molecular Biology 48:443-453,1970)。在一个实施方案中,本主题公开涉及使用Smith和Waterman的BestFit比对程序(Smith和Waterman,Advances in AppliedMathematics,2:482-489,1981,Smith等人,Nucleic Acids Research 11:2205-2220,1983)计算两个多核苷酸或氨基酸序列之间的同一性百分比。这些程序产生具有生物学意义的趋异序列的多个序列比对。将所选序列的计算的最佳匹配比对加以排列,以便可以看到同一性、相似性和差异。
术语“相似性”是指氨基酸序列之间的比较,并且不仅考虑相应位置中完全相同的氨基酸,而且考虑相应位置中功能相似的氨基酸。因此,在多肽序列之间的相似性指示了除序列相似性之外的功能相似性。
术语“同源性”有时用于表示两个或更多个核酸或氨基酸序列之间在位置同一性(即序列相似性或同一性)百分比方面的相似性水平。同源性还指进化相关性的概念,通常由共享相似序列的不同核酸或蛋白质之间的相似功能特性证明。
如本文中使用的,术语“变体”表示基本上相似的序列。对于核苷酸序列,可以使用熟知的分子生物学技术例如用如本文中概述的聚合酶链反应(PCR)和杂交技术鉴定天然存在的变体。
对于核苷酸序列,变体包含在天然多核苷酸内的一个或多个内部位点处的一个或多个核苷酸的缺失和/或添加和/或在天然多核苷酸中一个或多个位点处的一个或多个核苷酸的取代。如本文中使用的,“天然”核苷酸序列包括天然存在的核苷酸序列。对于核苷酸序列,可以使用熟知的分子生物学技术例如用如下文概述的聚合酶链反应(PCR)和杂交技术鉴定天然存在的变体。变体核苷酸序列还包括合成衍生的核苷酸序列,比如通过例如使用定点诱变生成的核苷酸序列。通常,本发明的特定核苷酸序列的变体与通过本文中其他地方描述的序列比对程序和参数确定的特定核苷酸序列具有将具有至少约40%、45%、50%>、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。本发明核苷酸序列的生物活性变体可以与该序列相差少至1-15个核酸残基,少至1-10个,例如少至6-10个、少至5个、少至4、3、2或甚至1个核酸残基。
如本文中使用的,术语“可操作连接”涉及与第二核酸序列可操作连接的第一核酸序列,此时第一核酸序列处于与第二核酸序列的功能关系中。例如,当启动子影响编码序列的转录或表达时,则该启动子与该编码序列是可操作连接的。当以重组方式产生时,可操作连接的核酸序列通常是连续的,并且在这种情况下必需将两个蛋白质编码区连接在同一个阅读框内。然而,元件不必是连续地可操作连接的。
如本文中使用的,术语“启动子”是指通常位于基因上游(朝向基因的5'区)并且对于启动和驱动基因转录是需要的DNA区域。启动子可容许它所控制的基因的正确激活或阻抑。启动子可含有被转录因子识别的特异性序列。这些因子可与启动子DNA序列结合,导致RNA聚合酶的募集,所述RNA聚合酶为从基因的编码区合成RNA的酶。启动子通常是指位于基因上游的所有基因调控元件,包括上游启动子、5'UTR、内含子、和前导序列。
如本文中使用的,术语“上游-启动子”是指足以指导转录起始的连续多核苷酸序列。如本文中使用的,上游-启动子涵盖具有若干序列基序的转录起始位点,所述序列基序包括TATA盒、起始序列、TFIIB识别元件和其他启动子基序(Jennifer,E.F.等人,(2002)Genes&Dev.,16:2583-2592)。该上游启动子对RNA聚合酶II提供作用位点,所述RNA聚合酶II为具有像TFIIA、B、D、E、F和H的基础或通用转录因子的多-亚基酶。这些因子组装成转录前起始复合物,所述转录前起始复合物催化从DNA模板到RNA的合成。
上游-启动子的激活是通过另外的调控性DNA序列元件的序列完成的,其中各种蛋白质结合到调控性DNA序列元件上并且随后与转录起始复合物相互作用而激活基因表达。这些基因调控元件序列与特异性DNA-结合因子相互作用。这些序列基序有时可称为顺式-元件。组织-特异性或发育-特异性转录因子与之结合的这样的顺式-元件可单独地或联合地在转录水平决定启动子的时空表达模式。这些顺式-元件在它们在可操作连接的基因上发挥作用的控制类型方面变化很大。一些元件响应于环境反应(例如,温度、湿度、和伤害)起作用而增加可操作-连接的基因的转录。其他的顺式-元件可响应于发育线索(例如,萌发、种子成熟、和开花)或响应于空间信息(例如,组织特异性)。参见,例如,Langridge等人,(1989)Proc.Natl.Acad.Sci.USA 86:3219-23。这些顺式-元件位于转录起始位点的不同距离,一些顺式-元件(称作近端元件)邻近最小核心启动子区,而其他元件可定位在启动子(增强子)的上游或下游几千个碱基处。
如本文中使用的,术语“5'非翻译区”或“5'UTR”定义为前mRNA或成熟mRNA的5'端中的非翻译区段。例如,在成熟mRNA上,5'UTR一般在其5'端上包含7-甲基鸟苷帽并涉及许多过程,如剪接、多腺苷酸化、mRNA朝向细胞质输出、通过翻译机器的mRNA的5'端的识别、以及保护mRNA免于降解。
如本文中使用的,术语“转录终止子”定义为前mRNA或成熟mRNA的3'端中的转录区段。例如,超过“多腺苷酸化信号”位点的更长DNA段被转录为前mRNA。这个DNA序列常常含有用于将前mRNA正确加工为成熟mRNA的转录终止信号。
如本文中使用的,术语“3'非翻译区”或“3'UTR”定义为前mRNA或成熟mRNA的3'端中的非翻译区段。例如,在成熟mRNA上,这个区域包含多聚(A)尾并且已知其在mRNA稳定性、翻译起始、和mRNA输出中具有多种作用。另外,3'UTR被认为包括多腺苷酸化信号和转录终止子。
如本文中使用的,术语“多腺苷酸化信号”指示存在于mRNA转录物中的核酸序列,当存在多聚(A)聚合酶时,所述核酸序列允许在例如位于多聚(A)信号的下游的10到30个碱基的多腺苷酸化位点上进行转录物的多腺苷酸化。许多多腺苷酸化信号在本领域是已知的并可用于本发明。示例性序列包括AAUAAA及其变体,正如描述于Loke J.等人,(2005)PlantPhysiology 138(3);1457-1468。
“DNA结合转基因”是编码DNA结合蛋白的多核苷酸编码序列。随后,DNA结合蛋白能够与另一个分子结合。结合蛋白可与例如DNA分子(DNA-结合蛋白)、RNA分子(RNA-结合蛋白)和/或蛋白质分子(蛋白质-结合蛋白)结合。在蛋白质-结合蛋白的情况下,它可与自身结合(形成同二聚体、同三聚体,等)和/或它可与一个或多个不同的蛋白质分子结合。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有DNA-结合、RNA-结合和蛋白质-结合活性。
DNA结合蛋白的实例包括:大范围核酸酶、锌指、CRISPR和TALEN结合结构域,其可被“工程改造”为与预定的核苷酸序列结合。工程改造的DNA结合蛋白(例如,锌指、CRISPR或TALEN)一般是非-天然存在的蛋白质。用于工程改造DNA-结合蛋白的方法的非-限制性实例是设计和选择。设计的DNA结合蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rational criteria)。设计的合理标准包括应用替代规则和计算机化算法,加工储存现有ZFP、CRISPR、和/或TALEN设计和结合数据信息的数据库中的信息。参见,例如,美国专利6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496和美国公开文本No.20110301073、20110239315和20119145940。
“锌指DNA结合蛋白”(或结合结构域)是一种蛋白质,或一种更大蛋白质内的结构域,其通过一个或多个锌指以序列-特异性的方式结合DNA,所述锌指是结合结构域内的氨基酸序列区域,其结构通过与锌离子的配位而稳定化。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。锌指结合结构域可被“工程改造”为与预定的核苷酸序列结合。用于工程改造锌指蛋白的方法的非-限制性实例是设计和选择。设计的锌指蛋白是非自然界产生的蛋白质,其设计/组成主要来自合理标准(rational criteria)。设计的合理标准包括应用替代规则和计算机化算法,加工储存现有ZFP设计和结合数据信息的数据库中的信息。参见,例如,美国专利No.6,140,081;6,453,242;6,534,261和6,794,136;还参见WO 98/53058;WO98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
在其他实例中,一种或多种核酸酶的DNA-结合结构域包含天然存在的或工程改造的(非-天然存在的)TAL效应子DNA结合结构域。参见,例如,美国专利公开文本No.20110301073,通过提述将其完整并入本文。已知黄单胞菌属的植物病原菌在重要作物中引起许多疾病。黄单胞菌属的致病性依赖于保守的III型分泌(T3S)系统,其将多于25种不同的效应子蛋白注入植物细胞中。这些注入的蛋白质为转录激活子-样(TALEN)效应子,其模拟植物转录激活子并操纵植物转录组(参见Kay等人,(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录活化结构域。最充分表征的TAL-效应子之一是来自野油菜黄单胞菌疱病致病变种的AvrBs3(参见Bonas等人,(1989)Mol Gen Genet 218:127-136和WO2010079430)。TAL-效应子含有串联重复序列的集中域,每个重复序列大致含34个氨基酸,所述氨基酸对于这些蛋白质的DNA结合特异性是关键的。另外,它们含有核定位序列和酸性转录活化域(对于评论参见Schornack S等人,(2006)J Plant Physiol 163(3):256-272)。另外,在植物病原细菌青枯劳尔氏菌中,已经发现在青枯劳尔氏菌生物型菌株GMI1000和生物型4菌株RS1000中的命名为brg11和hpx17的两个基因与黄单胞菌属AvrBs3家族同源(参见Heuer等人,(2007)Appl and Enviro Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此有98.9%相同,但是因在hpx17的重复结构域中的1,575bp的缺失而不同。然而,两种基因产物都具有与黄单胞菌属AvrBs3家族蛋白小于40%的序列同一性。参见,例如,美国专利公开文本No.20110301073,通过提述将其完整并入。
这些TAL效应子的特异性取决于在串联重复序列中发现的序列。重复序列大致包含102bp,并且重复序列彼此之间一般具有91-100%的同源性(Bonas等人,同前)。重复序列的多态性常常位于位置12和13处,并且在位置12和13处的高变双残基的同一性与在TAL-效应子的靶序列中的连续核苷酸的同一性之间,似乎存在着在一对一的对应关系(参见Moscou和Bogdanove,(2009)Science 326:1501和Boch等人,(2009)Science 326:1509-1512)。在实验上,已经确定了这些TAL-效应子的DNA识别的天然密码,使得在位置12和13处的HD序列导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,并且ING与T结合。这些DNA结合重复序列已组装成具有新的重复序列组合和数目的蛋白质,从而产生能够与新的序列相互作用并激活植物细胞中的非-内源报告基因表达的人工转录因子(Boch等人,同前)。工程改造的TAL蛋白已经与FokI切割半结构域连接以产生在酵母报告基因测定(基于质粒的靶标)中表现出活性的TAL效应子结构域核酸酶融合(TALEN)。
CRISPR(成簇的规律间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶系统是基于可用于基因组工程改造的细菌系统的最近工程改造的核酸酶系统。其基于许多细菌和古细菌的适应性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入物的DNA区段通过‘免疫'应答转化为CRISPR RNA(crRNA)。然后,这种crRNA通过部分互补区域与另一类称为tracrRNA的RNA结合,以将Cas9核酸酶引导至与靶DNA中的crRNA同源的区域,称为“原型间隔序列”。Cas9切割DNA,以在由crRNA转录物中所含的20-核苷酸的引导序列指定的位点处在双-链断裂(DSB)处产生平末端。对于位点特异性DNA识别和切割,Cas9需要crRNA和tracrRNA两者。这个系统现已被工程改造,使得crRNA和tracrRNA可结合成一个分子(“单个引导RNA”),单个引导RNA的crRNA等效部分可经工程改造以引导Cas9核酸酶靶向任何期望序列(参见Jinek等人,(2012)Science 337,816-821页,Jinek等人,(2013),eLife 2:e00471,和David Segal,(2013)eLife 2:e00563)。在其他实例中,crRNA与tracrRNA结合以将Cpf1核酸酶引导至与crRNA同源的区域,从而切割具有交错末端的DNA(参见Zetsche,Bernd等人,Cell 163.3(2015):759-771.)。因此,CRISPR/Cas系统可经工程改造以在基因组中的期望靶标处产生DSB,并且可通过使用引起易错修复增加的修复抑制剂而影响DSB的修复。
在其他实例中,DNA结合转基因为包含工程改造的(非天然存在的)大范围核酸酶(也描述为归巢核酸内切酶)的位点特异性核酸酶。归巢核酸内切酶或大范围核酸酶(如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII)的识别序列是已知的。还参见美国专利No.5,420,032;美国专利No.6,833,252;Belfort等人,(1997)Nucleic Acids Res.25:3379–30 3388;Dujon等人,(1989)Gene 82:115–118;Perler等人,(1994)Nucleic Acids Res.22,11127;Jasin(1996)Trends Genet.12:224–228;Gimble等人,(1996)J.Mol.Biol.263:163–180;Argast等人,(1998)J.Mol.Biol.280:345–353和New England Biolabs catalogue。另外,归巢核酸内切酶和大范围核酸酶的DNA-结合特异性可被工程改造为结合非-天然靶位点。参见,例如,Chevalier等人,(2002)Molec.Cell 10:895-905;Epinat等人,(2003)NucleicAcids Res.5 31:2952-2962;Ashworth等人,(2006)Nature 441:656-659;Paques等人,(2007)Current Gene Therapy 7:49-66;美国专利公开No.20070117128。归巢核酸内切酶和大范围核酸酶的DNA-结合结构域总的来说在核酸酶的背景下可予以改变(即,使得核酸酶包括同源切割结构域)或可融合至异源切割结构域。
如本文中使用的,术语“转化”涵盖可将核酸分子引入这种细胞中的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质体转染;显微注射(Mueller等人,(1978)Cell 15:579-85);土壤杆菌-介导的转移;直接DNA摄取;WHISKERSTM-介导的转化;和微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化两者。术语“稳定转化”指将核酸片段引入宿主生物的基因组中,从而导致在遗传上稳定的遗传。一旦稳定转化,该核酸片段稳定整合到宿主生物和任何后续世代的基因组中。含有该转化的核酸片段的宿主生物被称为“转基因”生物。术语“瞬时转化”指将核酸片段引入宿主生物的细胞核、或含有DNA-的细胞器中,从而导致不具备在遗传上稳定的遗传的基因表达。
外源核酸序列。在一个实例中,转基因是基因序列(例如,除草剂抗性基因)、编码工业或药学上有用的化合物的基因、或编码期望的农业性状的基因。在又另一个实例中,转基因为反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。转基因可含有与该转基因可操作连接的调控序列(例如,启动子)。在一些实施方案中,感兴趣的多核苷酸序列为转基因。然而,在其他实施方案中,感兴趣的多核苷酸序列为内源核酸序列,其中所述内源核酸序列的额外基因组拷贝是期望的,或者为相对于宿主生物中的靶核酸分子的序列处于反义取向的核酸序列。
如本文中使用的,通过用异源DNA(即,包含感兴趣的转基因的核酸构建体)转化植物细胞,再生由于将转基因插入植物的基因组中所产生的植物群体,并选择其特征为插入到特定基因组位置中的特定植物,产生了术语转基因“事件”。术语“事件”是指原始转化体和包含所述异源DNA的所述转化体的子代。术语“事件”也指通过转化体与包含基因组DNA/转基因DNA的另一个品种之间的有性异型杂交所产生的子代。即使在与轮回亲本重复回交之后,来自转化亲本的插入转基因DNA和侧翼基因组DNA(基因组DNA/转基因DNA)也存在于杂交子代中的相同染色体位置。术语“事件”也指来自包含插入DNA和紧邻插入DNA的侧翼基因组序列的原始转化体及其子代的DNA,由于包含插入DNA的一个亲本品系(例如原始转化体和由自交产生的子代)与不含所述插入DNA的亲本品系的有性杂交,预期所述插入DNA将被转移到接受包括感兴趣的转基因在内的插入DNA的子代中。
如本文中使用的,术语“聚合酶链反应”或“PCR”定义了其中微量核酸、RNA和/或DNA被扩增的程序或技术,正如1987年7月28日发布的美国专利No.4,683,195中所描述。通常,需要可用的来自感兴趣区域的末端的序列信息或其他信息,使得可以设计寡核苷酸引物;这些引物与有待扩增的模板的相对链在序列上相同或相似。两个引物的5'端核苷酸可与扩增材料的末端一致。PCR可用来扩增特异性RNA序列、来自总的基因组DNA的特异性DNA序列、和从总的细胞RNA、噬菌体或质粒序列等转录的cDNA。总体上参见Mullis等人,ColdSpring Harbor Symp.Quant.Biol.,51:263(1987);Erlich编辑,PCR Technology,(Stockton Press,NY,1989)。
如本文中使用的,术语“引物”是指当条件适合于合成引物延伸产物时能够用作沿着互补链的合成的起始点的寡核苷酸。合成条件包括四种不同的脱氧核糖核苷三磷酸和诸如逆转录酶或DNA聚合酶的至少一种聚合诱导剂的存在。这些物质存在于适合的缓冲液中,所述缓冲液可包括作为辅因子或在不同的适当温度下影响诸如pH等条件的组分。引物优选地是单链序列,以便扩增效率得以最优化,但也可以使用双链序列。
如本文中使用的,术语“探针”是指与靶序列杂交的寡核苷酸。在型测定程序中,探针与位于两个引物的退火位点之间的靶部分杂交。探针包含约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸、或约五十个核苷酸。在一些实施方案中,探针包含从约八个核苷酸到约十五个核苷酸。探针可进一步包含可检测标记物,例如,荧光团(Texas-/>异硫氰酸荧光素,等)。可检测标记物可直接地共价附接到探针寡核苷酸上,例如位于探针的5'端或探针的3'端。包含荧光团的探针还可进一步包含猝灭剂,例如,Black Hole QuencherTM、Iowa BlackTM,等。
如本文中使用的,术语“限制性核酸内切酶”和“限制酶”是指细菌酶,它们每一者切割在特异性核苷酸序列处或附近的双链DNA。2型限制酶在同一位点识别和切割DNA,并且包括但不限于XbaI、BamHI、HindIII、EcoRI、XhoI、SalI、KpnI、AvaI、PstI和SmaI。
如本文中使用的,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换地使用,并且意指藉此可将DNA或RNA序列(例如,外来序列)引入宿主细胞中的媒介物,从而转化宿主并促进引入序列的表达(例如转录和翻译)。“非病毒载体”意图表示不包含病毒或反转录病毒的任何载体。在一些实施方案中,“载体”为包含至少一个DNA复制起点和至少一个选择标志物基因的DNA序列。实例包括但不限于携带外源DNA进入细胞的质粒、粘粒、噬菌体、细菌人工染色体(BAC)或病毒。载体还可包括一个或多个基因、反义分子、和/或可选择标志物基因和本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,由此引起细胞表达核酸分子和/或由该载体编码的蛋白质。术语“质粒”定义了能够在原核或真核宿主细胞中进行常染色体复制的环链核酸。该术语包括可为DNA或RNA并且可为单链或双链的核酸。质粒的定义还可包括相应于细菌复制起点的序列。
如本文中使用的,如本文中使用的术语“可选择标志物基因”定义了编码蛋白质的基因或其他表达盒,所述蛋白质便于鉴定所述可选择标志物基因插入其中的细胞。例如,“可选择标志物基因”涵盖报告基因以及在植物转化中使用的基因,以便例如保护植物细胞免受选择剂的影响或提供针对选择剂的抗性/耐受性。在一个实施方案中,只有那些接受功能性可选择标志物的细胞或植物才能在具有选择剂的条件下分裂或生长。选择剂的实例可以包括,例如包括大观霉素、新霉素、卡那霉素、巴龙霉素、庆大霉素、和潮霉素在内的抗生素。这些可选择标志物包括表达赋予抗生素卡那霉素抗性的酶的针对新霉素磷酸转移酶的基因(npt II),和针对有关抗生素新霉素、巴龙霉素、庆大霉素和G418的基因,或表达赋予潮霉素抗性的酶的针对潮霉素磷酸转移酶的基因(hpt)。其他可选择标志物基因可以包括编码除草剂抗性的基因,包括bar或pat(针对草胺磷或膦丝菌素的抗性)、乙酰乳酸合酶(ALS,针对抑制剂诸如磺酰脲类(SU)、咪唑啉酮类(IMI)、三唑并嘧啶类(TP)、嘧啶基氧基苯甲酸酯类(POB)、和阻止支链氨基酸合成第一步的磺酰基氨基羰基三唑啉酮类的抗性)、草甘膦、2,4-D、和金属抗性或敏感性。可用作可选择标志物基因的“报告基因”的实例包括表达的报告基因蛋白的视觉观察,所述报告基因蛋白例如编码的蛋白质:β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、DsRed、β-半乳糖苷酶、氯霉素乙酰转移酶(CAT)、碱性磷酸酶等。短语“标志物阳性”是指已经被转化而包含可选择标志物基因的植物。
如本文中使用的,术语“可检测标志物”是指能够检测的标记物,例如像放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螫合剂、或酶。可检测标志物的实例包括但不限于下列各项:荧光标记(例如,FITC、罗丹明、镧系磷光体)、酶标记(例如,辣根过氧化物酶、β-半乳糖苷酶、萤光素酶、碱性磷酸酶)、化学发光标记、生物素基;由次级报道分子识别的预定多肽表位(例如,亮氨酸拉链对序列、二级抗体的结合位点、金属结合结构域、表位标签)。在一个实施方案中,可检测标志物可通过不同长度的间隔臂附接,以降低潜在的空间位阻。
如本文中使用的,术语“盒”、“表达盒”和“基因表达盒”是指可在特异的限制性位点或通过同源重组插入核酸或多核苷酸中的DNA区段。如本文中使用的DNA区段包括编码感兴趣多肽的多核苷酸,所述盒和限制性位点被设计为确保所述盒插入用于转录和翻译的正确阅读框中。在一个实施方案中,表达盒可包含编码感兴趣多肽的多核苷酸,并且具有除了所述多核苷酸之外的便于特定宿主细胞转化的元件。在一个实施方案中,基因表达盒还可包括允许编码感兴趣多肽的多核苷酸在宿主细胞中增强表达的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、反应元件、终止子序列、多聚腺苷酸化序列,等。
如本文中使用的“接头”或“间隔区”是使两个分开的实体彼此结合的键、分子或分子基团。接头和间隔区可为两个实体提供最佳间距,或者可进一步提供允许两个实体彼此分开的不稳定连接。不稳定连接包括可光裂解的基团、酸不稳定性模块、碱不稳定性模块和酶可裂解的基团。如本文中使用的术语“多接头”或“多克隆位点”定义了彼此位于核酸序列上10个核苷酸之内的一簇三个或更多个2型限制酶位点。在其他情况下,如本文中使用的术语“多接头”是指靶向的经由任何已知的无缝克隆方法(即,Gibson NEBuilder HiFiDNA />Golden Gate Assembly、/> Assembly,等等。)连接两个序列的一段核苷酸。包含多接头的构建体用于插入和/或切除诸如基因的编码区的核酸序列。
如本文中使用的,术语“对照”是指在用于比较目的的分析程序中使用的样品。对照可为“阳性”或“阴性”。例如,在分析程序的目的为检测细胞或组织中的差异表达的转录物或多肽的情况下,通常优选包括阳性对照,例如来自展现出期望表达的已知植物的样品,以及阴性对照,例如来自缺乏期望表达的已知植物的样品。
如本文中使用的,术语“植物”包括整个植物及植物的任何后代、细胞、组织、或部分。可用于本发明中的植物类别通常宽泛地为适合于诱变的高等和低等植物类别,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类和多细胞藻类。因此,“植物”包括双子叶和单子叶植物。术语“植物部分”包括植物的任何部分,包括,例如但不限于:种子(包括成熟种子和未成熟种子);植物插条;植物细胞;植物细胞培养物;植物器官(如花粉、胚、花、果实、芽(shoot)、叶、根、茎、和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织、或者任何其他被组织成一定结构或功能单位的植物细胞群。植物细胞或组织培养物可能能够再生出具有该细胞或组织所来源的植物的生理学和形态学特征的植物,并且可能能够再生出与该植物具有基本上相同的基因型的植物。与之相反,一些植物细胞不能够再生而产生植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、须、花、果仁、穗、穗轴、壳、或茎。
植物部分包括可收获部分和可用于繁殖后代植物的部分。可用于繁殖的植物部分包括,例如但不限于:种子;果实;插条;苗;块茎;和根砧木。植物的可收获部分可以是植物的任何有用部分,包括,例如但不限于:花;花粉;苗;块茎;叶;茎;果实;种子;和根。
植物细胞是植物的结构和生理单位,包括原生质体和细胞壁。植物细胞可以是分离的单细胞或细胞聚集体的形式(例如,松散型(friable)愈伤组织和培养细胞),并且可以是更高级组织单位的一部分(例如,植物组织、植物器官、和植物)。因此,植物细胞可以是原生质体、配子产生细胞、或可以再生成完整植物的细胞或细胞集合。因此,包含多个植物细胞并能够再生为完整植物的种子,在本文的实施方案中被认为是“植物细胞”。
如本文中使用的,术语“小RNA”是指几类非-编码核糖核酸(ncRNA)。术语小RNA描述了在细菌细胞、动物、植物、和真菌中产生的短链ncRNA。这些短链ncRNA可在细胞中天然产生或可以通过引入表达短链ncRNA的外源序列而产生。小RNA序列不直接编码蛋白质,并且与其他RNA在功能上不同之处在于,小RNA序列仅仅被转录而不被翻译。小RNA序列涉及其他细胞功能,包括基因表达和修饰。小RNA分子常常由约20个到30个核苷酸构成。小RNA序列可衍生自较长的前体。所述前体形成在自身-互补区中彼此折回的结构;然后它们被动物体内的核酸酶切丁酶或植物中的DCL1加工。
许多类型的小RNA天然存在或经人工产生,包括microRNA(miRNA)、短干扰RNA(siRNA)、反义RNA、短发夹RNA(shRNA)、和小核仁RNA(snoRNA)。某些类型的小RNA,如microRNA和siRNA在基因沉默和RNA干扰(RNAi)中是重要的。基因沉默是其中通常表达的基因被细胞内元件(在这种情况下为小RNA)“关闭”的遗传调节过程。通常经由此遗传信息形成的蛋白质由于干扰而未形成,并且在该基因中编码的信息被阻断表达。
如本文中使用的,术语“小RNA”涵盖RNA分子,其在文献中被描述为“极小RNA”(Storz,(2002)Science 296:1260-3;Illangasekare等人,(1999)RNA 5:1482-1489);原核“小RNA”(sRNA)(Wassarman等人,(1999)Trends Microbiol.7:37-45);真核“非编码RNA(ncRNA)”;“微-RNA(miRNA)”;“小非-mRNA(snmRNA)”;“功能性RNA(fRNA)”;转运RNA(tRNA)”;“催化性RNA”[例如,核酶,包括自身-酰化核酶(Illangaskare等人,(1999)RNA 5:1482-1489);“小核仁RNA(snoRNA)”;“tmRNA”(又名“10S RNA”,Muto等人,(1998)TrendsBiochem Sci.23:25-29;和Gillet等人,(2001)Mol Microbiol.42:879-885);RNAi分子,包括但不限于“小干扰RNA(siRNA)”、“核酸内切酶-制备的siRNA(e-siRNA)”、“短发夹RNA(shRNA)”、和“时序调节小RNA(stRNA)”;“切丁酶酶切的siRNA(d-siRNA)”、以及包含至少一个尿嘧啶碱基的适体、寡核苷酸和其他合成核酸。
除非另外特别地解释,本文中使用的全部技术术语和科学术语具有与属于本公开的领域之内的普通技术人员通常所理解的相同的含义。可以在以下出版物中找到分子生物学中常见术语的定义:例如,Lewin,Genes V,Oxford University Press,1994(ISBN 0-19-854287-9);Kendrew等(编),The Encyclopedia of Molecular Biology,BlackwellScience Ltd.,1994(ISBN 0-632-02182-9);和Meyers(编),Molecular Biology andBiotechnology:A Comprehensive Desk Reference,VCH Publishers,Inc.,1995(ISBN 1-56081-569-8)。
如本文中使用的,冠词“一个(a)”、“一种(an)”和“该(the)”包括复数引用,除非上下文另外清楚且毫不含糊地规定。
III.玉米卵细胞基因调控元件和包含它们的核酸
提供了使用来自玉米卵细胞基因的启动子在植物中表达非玉米卵细胞转基因的方法和组合物。在一个实施方案中,启动子可以是具有SEQ ID NO:1的玉米卵细胞基因启动子。
在一个实施方案中,提供了包含启动子的多核苷酸,其中所述启动子与SEQ IDNO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%相同。在一个实施方案中,启动子是玉米卵细胞基因启动子,其包含与多核苷酸SEQ ID NO:1具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性的多核苷酸。在一个实施方案中,提供了分离的多核苷酸,其包含与多核苷酸SEQ ID NO:1至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%的同一性。在一个实施方案中,提供了包含具有SEQ ID NO:1的玉米卵细胞基因启动子的核酸载体。在一个实施方案中,提供了包含与多接头可操作连接的玉米卵细胞基因启动子的多核苷酸。在一个实施方案中,提供了包含与非玉米卵细胞转基因可操作连接的玉米卵细胞基因启动子的基因表达盒。在一个实施方案中,提供了包含与非玉米卵细胞转基因可操作连接的玉米卵细胞基因启动子的核酸载体。在一个实施方案中,启动子由SEQ ID NO:1组成。在说明性实施方案中,核酸载体包含与转基因可操作连接的玉米卵细胞基因启动子,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、可选择标志物转基因、或它们的组合。
在一个实施方案中,核酸载体包含如本文中公开的基因表达盒。在一个实施方案中,载体可以是质粒、粘粒、细菌人工染色体(BAC)、噬菌体、病毒、或在直接转化或基因打靶中使用的切割的多核苷酸片段,如供体DNA。
还可通过位于启动子序列下游的5'UTR区来调节转基因表达。启动子和5'UTR两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但5'UTR的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。5'UTR基因区有助于转基因的稳定表达。在一个另外的实施方案中,5'UTR与玉米卵细胞基因启动子可操作连接。
还可通过位于启动子序列下游的内含子区来调节转基因表达。启动子和内含子两者都能调节转基因表达。虽然启动子对于驱动转录是必要的,但内含子的存在能增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。内含子基因区有助于转基因的稳定表达。在一个另外的实施方案中,内含子与玉米卵细胞基因启动子可操作连接。
根据一个实施方案,提供了包含重组基因表达盒的核酸载体,其中所述重组基因表达盒包含与多接头序列可操作连接的玉米卵细胞基因启动子、非玉米卵细胞基因或玉米卵细胞转基因或它们的组合。在一个实施方案中,重组基因盒包含与非玉米卵细胞基因或转基因可操作连接的玉米卵细胞基因启动子。在一个实施方案中,重组基因盒包含与多接头序列可操作连接的如本文中公开的玉米卵细胞基因启动子。所述多接头以某种方式与玉米卵细胞基因启动子可操作连接,所述方式使得编码序列到所述多接头的限制性位点之一中的插入将会可操作地连接所述编码序列,从而允许在载体转化或转染到宿主细胞中时表达所述编码序列。
根据一个实施方案,提供了包含由玉米卵细胞基因启动子和非玉米卵细胞基因组成的基因盒的核酸载体。在一个实施方案中,具有SEQ ID NO:1的玉米卵细胞基因启动子与非玉米卵细胞基因或转基因的3'端可操作连接。在一个另外的实施方案中,玉米卵细胞基因启动子序列包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供了包含由玉米卵细胞基因启动子、非玉米卵细胞基因组成的基因盒的核酸载体,其中所述玉米卵细胞基因启动子与非玉米卵细胞基因的5'端可操作连接,并且所述玉米卵细胞基因启动子序列包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%、99%或100%序列同一性的序列。在一个另外的实施方案中,玉米卵细胞基因启动子序列由SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的1,500bp序列组成。
玉米卵细胞基因启动子还可包含一个或多个另外的序列元件。在一些实施方案中,玉米卵细胞基因启动子可包含外显子(例如,前导序列或信号肽,比如叶绿体转运肽或ER滞留信号)。例如,但不限于,作为一个另外的实施方案,玉米卵细胞基因启动子可编码组入玉米卵细胞基因启动子中的外显子。
进一步提供了使用来自玉米卵细胞基因的3'UTR以终止在植物中的非玉米卵细胞转基因的方法和组合物。在一个实施方案中,3'UTR终止子可以是具有SEQ ID NO:2的玉米卵细胞基因3'UTR。
在一个实施方案中,提供了包含3'UTR的多核苷酸,其中所述3'UTR与SEQ ID NO:2至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%相同。在一个实施方案中,3'UTR是玉米卵细胞基因3'UTR,其包含与多核苷酸SEQ ID NO:2具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性的多核苷酸。在一个实施方案中,提供了分离的多核苷酸,其与多核苷酸SEQ ID NO:2具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或100%同一性。在一个实施方案中,提供了包含具有SEQ ID NO:2的玉米卵细胞基因3'UTR的核酸载体。在一个实施方案中,提供了包含与多接头可操作连接的玉米卵细胞基因3'UTR的多核苷酸。在一个实施方案中,提供了包含与非玉米卵细胞转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒。在一个实施方案中,提供了包含与非玉米卵细胞转基因可操作连接的玉米卵细胞基因3'UTR的核酸载体。在一个实施方案中,3'UTR由SEQ ID NO:2组成。在说明性实施方案中,核酸载体包含与转基因可操作连接的玉米卵细胞基因3'UTR,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、可选择标志物转基因、或它们的组合。
根据一个实施方案,提供了包含重组基因表达盒的核酸载体,其中所述重组基因表达盒包含与多接头序列可操作连接的玉米卵细胞基因3'UTR、非玉米卵细胞基因或玉米卵细胞转基因或它们的组合。在一个实施方案中,重组基因盒包含与非玉米卵细胞基因或转基因可操作连接的玉米卵细胞基因3'UTR。在一个实施方案中,重组基因盒包含与多接头序列可操作连接的如本文中公开的玉米卵细胞基因3'UTR。所述多接头以某种方式与玉米卵细胞基因3'UTR可操作连接,所述方式使得编码序列到所述多接头的限制性位点之一中的插入将会可操作地连接所述编码序列,从而允许在载体转化或转染到宿主细胞中时表达所述编码序列。
根据一个实施方案,提供了包含由玉米卵细胞基因3'UTR和非玉米卵细胞基因组成的基因盒的核酸载体。在一个实施方案中,具有SEQ ID NO:2的玉米卵细胞基因3'UTR与非玉米卵细胞基因或转基因的5'端可操作连接。在一个另外的实施方案中,玉米卵细胞基因3'UTR序列包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施方案,提供了包含由玉米卵细胞基因3'UTR、非玉米卵细胞基因组成的基因盒的核酸载体,其中所述玉米卵细胞基因3'UTR与非玉米卵细胞基因的3'端可操作连接,并且所述玉米卵细胞基因3'UTR序列包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%、99%或100%序列同一性的序列。在一个另外的实施方案中,玉米卵细胞基因3'UTR序列由SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的971bp序列组成。
在一个实施方案中,提供了包含玉米卵细胞基因启动子和非玉米卵细胞基因以及任选地一个或多个下列元件的核酸构建体,所述元件为:
a)5'非翻译区;
b)内含子;和
c)3'非翻译区,
其中,
所述玉米卵细胞基因启动子由SEQ ID NO:1或与SEQ ID NO:1具有95%序列同一性的序列组成;并且,
所述3'非翻译区由已知的3'非翻译区、SEQ ID NO:2或与SEQ ID NO:2具有95%序列同一性的序列组成;进一步地,其中所述玉米卵细胞基因启动子与所述转基因可操作连接,并且当存在时,每个任选的元件也与所述启动子和所述转基因两者可操作连接。在一个另外的实施方案中,提供了包含就在上文公开的核酸构建体的转基因细胞。在一个实施方案中,所述转基因细胞为植物细胞,并且在一个另外的实施方案中提供了植物,其中所述植物包含所述转基因细胞。
根据一个实施方案,所述核酸载体进一步包含编码可选择标志物的序列。根据一个实施方案,所述重组基因盒与土壤杆菌T-DNA边界可操作连接。根据一个实施方案,所述重组基因盒进一步包含第一和第二T-DNA边界,其中第一T-DNA边界与基因构建体的一端可操作连接,并且第二T-DNA边界与基因构建体的另一端可操作连接。所述第一和第二土壤杆菌T-DNA边界可独立地选自来源于细菌菌株的T-DNA边界序列,所述T-DNA边界序列选自下组:胭脂碱合成土壤杆菌T-DNA边界、章鱼碱(ocotopine)合成土壤杆菌T-DNA边界、甘露碱合成土壤杆菌T-DNA边界、琥珀碱合成土壤杆菌T-DNA边界、或它们的任何组合。在一个实施方案中,提供了选自下组的土壤杆菌菌株,该组的组成为:胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含与选自SEQ ID NO:1的序列或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列可操作连接的转基因。在另一个实施方案中,所述第一和第二土壤杆菌T-DNA边界可独立地选自来源于细菌菌株的T-DNA边界序列,所述T-DNA边界序列选自下组:胭脂碱合成土壤杆菌T-DNA边界、章鱼碱(ocotopine)合成土壤杆菌T-DNA边界、甘露碱合成土壤杆菌T-DNA边界、琥珀碱合成土壤杆菌T-DNA边界、或它们的任何组合。在一个实施方案中,提供了选自下组的土壤杆菌菌株,该组的组成为:胭脂碱合成菌株、甘露碱合成菌株、琥珀碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含与选自SEQ ID NO:2的序列或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列可操作连接的转基因。
适合于在本公开构建体中使用的感兴趣的转基因包括但不限于赋予下列各项的编码序列:(1)对害虫或疾病的抗性,(2)对除草剂的耐受性,(3)增值的农艺性状,比如产量提高、氮利用效率、水分利用效率和营养品质,(4)蛋白质以位点特异性方式与DNA结合,(5)小RNA的表达,和(6)可选择标志物。根据一个实施方案,所述转基因编码可选择标志物或赋予杀虫抗性、除草剂耐受性、小RNA表达、氮利用效率、水分利用效率、或营养品质的基因产物。
1.昆虫抗性
不同的昆虫抗性基因可与包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述昆虫抗性基因可与包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性昆虫抗性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的昆虫抗性编码序列的实施方案,提供了以下性状。提供示例性鳞翅目昆虫抗性的编码序列包括:cry1A;cry1A.105;cry1Ab;cry1Ab(截短);cry1Ab-Ac(融合蛋白);cry1Ac(以销售);cry1C;cry1F(以销售);cry1Fa2;cry2Ab2;cry2Ae;cry9C;mocry1F;pinII(蛋白酶抑制剂蛋白);vip3A(a);和vip3Aa20。提供示例性鞘翅目昆虫抗性的编码序列包括:cry34Ab1(以销售);cry35Ab1(以/>销售);cry3A;cry3Bb1;dvsnf7;和mcry3A。提供示例性多昆虫抗性的编码序列包括ecry31.Ab。以上列出的昆虫抗性基因并非意味着是限制性的。本公开涵盖任何昆虫抗性基因。
2.除草剂耐受性
不同的除草剂耐受性基因可与包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述除草剂耐受性基因可与包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性除草剂耐受性编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的除草剂耐受性编码序列的实施方案,提供了以下性状。草甘膦除草剂具有通过抑制EPSPS酶(5-烯醇丙酮酰莽草酸-3-磷酸合酶)起作用的模式。这种酶参与对植物的生长和发育至关重要的芳香族氨基酸的生物合成。可用于抑制这种酶的各种酶机制是本领域已知的。编码此类酶的基因可与本主题公开的基因调控元件可操作连接。在一个实施方案中,可选择标志物基因包括但不限于编码草甘膦抗性基因的基因,包括:突变型EPSPS基因,比如2mEPSPS基因、cp4 EPSPS基因、mEPSPS基因、dgt-28基因;aroA基因;和草甘膦降解基因,比如草甘膦乙酰转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前以Gly-TolTMGT和Roundup />销售。草铵膦和/或双丙氨磷化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前以/>销售。还包括提供对2,4-D抗性的耐受基因,比如aad-1基因(应该注意的是,aad-1基因对芳氧苯氧丙酸酯类(arloxyphenoxypropionate)除草剂具有进一步的活性)和aad-12基因(应该注意的是,aad-12基因对吡啶基氧基乙酸合成生长素具有进一步的活性)。这些性状以/>作物保护技术销售。ALS抑制剂(磺酰脲类、咪唑啉酮类、三唑并嘧啶类、嘧啶基硫代苯甲酸酯类和磺酰基氨基-羰基-三唑啉酮类)的抗性基因是本领域已知的。这些抗性基因最常由于ALS编码基因序列的点突变而产生。其他ALS抑制剂抗性基因包括hra基因、csr1-2基因、Sr-HrA基因和surB基因。一些性状以商品名/>销售。抑制HPPD的除草剂包括吡唑啉酮类,比如苄草唑、吡草酮和苯唑草酮;三酮类,比如甲基磺草酮、磺草酮、环磺酮、苯并双环酮;和二酮腈类,比如异恶唑草酮。可以通过已知性状耐受这些示例性HPPD除草剂。HPPD抑制剂的实例包括hppdPF_W336基因(异恶唑草酮抗性)和avhppd-03基因(甲基磺草酮抗性)。耐苯腈除草剂的性状的一个例子包括bxn基因,该基因已经显示出赋予对除草剂/抗生素溴苯腈的抗性。麦草畏的抗性基因包括如国际PCT公开号WO2008/105890中公开的麦草畏单加氧酶基因(dmo)。PPO或PROTOX抑制剂类除草剂(例如,三氟羧草醚、氟丙嘧草酯、flupropazil、环戊噁草酮、唑草酮、异丙吡草酯、吡草醚、苯草醚、唑啶草酮、丙炔氟草胺、氟烯草酸、治草醚、乙氧氟草醚、乳氟禾草灵、氟磺胺草醚、乙羧氟草醚和甲磺草胺)的抗性基因是本领域已知的。赋予对PPO抗性的示例性基因包括野生型拟南芥PPO酶的过表达(Lermontova I和Grimm B,(2000)Overexpression of plastidic protoporphyrinogenIX oxidase leads to resistance to the diphenyl-ether herbicideacifluorfen.Plant Physiol 122:75–83.)、枯草芽孢杆菌PPO基因(Li,X.和NichollD.2005.Development of PPO inhibitor-resistant cultures and crops.PestManag.Sci.61:277-285以及Choi KW,Han O,Lee HJ,Yun YC,Moon YH,Kim MK,Kuk YI,HanSU和Guh JO,(1998)Generation of resistance to the diphenyl ether herbicide,oxyfluorfen,via expression of the Bacillus subtilis protoporphyrinogenoxidase gene in transgenic tobacco plants.Biosci Biotechnol Biochem 62:558–560.)吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括编码乙酰辅酶A羧化酶(ACCase)抑制剂的基因(例如,Acc1-S1、Acc1-S2和Acc1-S3)。示例性基因赋予对包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵和喹禾灵在内的环己二酮和/或芳氧基苯氧基丙酸的抗性。最后,包括三嗪或苯甲腈在内的除草剂可以抑制光合作用,通过psbA基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供对它们的耐受性。以上列出的除草剂耐受性基因并非意味着是限制性的。本公开涵盖任何除草剂耐受性基因。
3.农艺性状
不同的农艺性状基因可与包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述农艺性状基因可与包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性农艺性状编码序列是本领域已知的。作为可以与本主题公开的调控元件可操作连接的农艺性状编码序列的实施方案,提供了以下性状。由pg基因提供的延迟果实软化抑制了导致细胞壁中果胶分子分解的多聚半乳糖醛酸酶的产生,并因此引起果实的延迟软化。此外,acc基因的延迟果实成熟/衰老起到抑制天然acc合酶基因的正常表达的作用,导致乙烯产生减少和果实成熟延迟。然而,accd基因引起果实成熟激素乙烯的前体代谢,导致果实成熟延迟。或者,sam-k基因通过还原S-腺苷甲硫氨酸(SAM)(产生乙烯的底物)引起成熟延迟。在水分胁迫条件下,由cspB基因提供的干旱胁迫耐受表型通过保持RNA稳定性和翻译维持正常的细胞功能。另一个实例包括EcBetA基因,其催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水分胁迫的耐受性。另外,RmBetA基因催化渗透保护剂化合物甘氨酸甜菜碱的产生,从而赋予对水分胁迫的耐受性。bbx32基因提供光合作用和产量提高,其表达与一种或多种内源转录因子相互作用以调节植物日/夜生理过程的蛋白质。通过编码热稳定性α-淀粉酶的amy797E基因的表达可以增加乙醇产生,所述α-淀粉酶通过增加用于降解淀粉的淀粉酶的热稳定性而提高生物乙醇的产生。最后,可以通过表达编码二氢吡啶二羧酸合酶的cordapA基因而产生修饰的氨基酸组成,所述二氢吡啶二羧酸合酶增加氨基酸赖氨酸的产生。以上列出的农艺性状编码序列并非意味着是限制性的。本公开涵盖任何农艺性状编码序列。
4.DNA结合蛋白
不同的DNA结合转基因基因可与包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述DNA结合转基因基因可与包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性DNA结合蛋白编码序列是本领域已知的。作为可与本主题公开的调控元件可操作连接的DNA结合蛋白编码序列的实施方案,以下类型的DNA结合蛋白可包括:锌指、转录激活子样效应因子核酸酶(TALENS)、CRISPR和大范围核酸酶。以上列出的DNA结合蛋白编码序列并非意味着是限制性的。本公开涵盖任何DNA结合蛋白编码序列。
5.小RNA
不同的小RNA可与包含SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述小RNA序列可与包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。示例性小RNA性状是本领域已知的。作为可以与本主题公开的调控元件可操作连接的小RNA编码序列的实施方案,提供了以下性状。例如,通过使编码乙烯形成酶的ACO基因沉默来抑制乙烯的产生,抗efe小RNA的延迟果实成熟/衰老作用延迟了成熟。通过抑制内源性S-腺苷-L-甲硫氨酸:反式咖啡酰CoA 3-O-甲基转移酶(CCOMT基因),ccomt小RNA改变木质素产生降低了愈创木基(guanacyl)(G)木质素的含量。此外,通过Ppo5小RNA可以降低野生马铃薯(Solanum verrucosum)中的黑斑擦伤耐受性,Ppo5小RNA触发Ppo5转录物的降解以阻止黑斑擦伤的产生。还包括dvsnf7小RNA,其利用含有西方玉米根虫Snf7基因的240bp片段的dsRNA来抑制西方玉米根虫。改性淀粉/碳水化合物可来源于小RNA,例如pPhL小RNA(降解PhL转录物以限制通过淀粉降解形成还原糖)和pR1小RNA(降解R1转录物以限制通过淀粉降解形成还原糖)。另外的益处比如为由asn1小RNA所致的丙烯酰胺减少,asn1小RNA触发Asn1降解,从而损害天冬酰胺的形成并减少聚丙烯酰胺。最后,pgas ppo抑制小RNA的非褐变表型导致抑制PPO,从而产生具有非褐变表型的苹果。以上列出的小RNA并非意味着是限制性的。本公开涵盖任何小RNA编码序列。
6.可选择标志物
也被描述为报告基因的不同的可选择标志物可与包含SEQ ID NO:1或与SEQ IDNO:1具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因启动子可操作连接。同样,所述也被描述为报告基因的可选择标志物可与包含SEQ ID NO:2或与SEQ IDNO:2具有80%、85%、90%、95%或99%序列同一性的序列的玉米卵细胞基因3'UTR可操作连接。然后可以将可操作连接的序列组入选择的载体中以允许鉴定和选择转化的植物(“转化体”)。许多方法可用于证实转化植物中可选择标志物的表达,包括例如DNA测序和PCR(聚合酶链反应)、Southern印迹、RNA印迹和用于检测从载体表达的蛋白质的免疫学方法。但是,当蛋白质表达产生有色产物时,通常通过目视观察蛋白质来观察报告基因。示例性报告基因是本领域已知的并且编码β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP、Phi-YFP)、红色荧光蛋白(DsRFP、RFP等)、β-半乳糖苷酶等(参见Sambrook等人,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor Press,N.Y.,2001,其内容通过提述完整并入本文)。
利用可选择标志物基因来选择转化的细胞或组织。可选择标志物基因包括编码抗生素抗性的基因,比如编码新霉素磷酸转移酶II(NEO)、大观霉素/链霉素(streptinomycin)抗性(AAD)和潮霉素磷酸转移酶(HPT或HGR)的那些基因,以及赋予对除草化合物的抗性的基因。除草剂抗性基因通常编码对该除草剂不敏感的修饰的靶蛋白或编码在植物中在该除草剂能够起作用之前降解该除草剂或将其脱毒的酶。例如,通过使用编码突变体靶酶5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)的基因,已获得对草甘膦的抗性。针对EPSPS的基因和突变体是熟知的,并且在下文进一步描述。通过使用编码PAT或DSM-2、腈水解酶、AAD-1或AAD-12的细菌基因,已经获得了对草铵膦、溴苯腈、以及2,4-二氯苯氧乙酸(2,4-D)的抗性,它们中的每一者都是使它们对应的除草剂脱毒的蛋白质的例子。
在一个实施方案中,除草剂可以抑制生长点或分生组织,所述除草剂包括包括咪唑啉酮或磺酰脲,并且针对这些除草剂的乙酰羟酸合酶(AHAS)和乙酰乳酸合酶(ALS)的抗性/耐受性的基因是熟知的。草甘膦抗性基因分别包括突变体5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSP)和dgt-28基因(经由引入重组核酸和/或天然EPSP基因的各种形式的体内诱变)、aroA基因和草甘膦乙酰转移酶(GAT)基因)。其他膦酰基化合物的抗性基因包括来自链霉菌属物种(包括吸水链霉菌和绿色产色链霉菌)的bar和pat基因、以及吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸(包括氟吡甲禾灵、禾草灵、精恶唑禾草灵、吡氟禾草灵、喹禾灵)抗性的示例性基因包括乙酰辅酶A羧化酶(ACCase)基因;Acc1-S1、Acc1-S2和Acc1-S3。在一个实施方案中,除草剂可以抑制光合作用,包括三嗪(psbA和1s+基因)或苄腈(腈水解酶基因)。此外,这样的可选择标志物可包括阳性选择标志物,例如磷酸甘露糖异构酶(PMI)。
在一个实施方案中,可选择标志物基因包括但不限于,编码下列物质的基因:2,4-D;新霉素磷酸转移酶II;氰酰胺水合酶;天冬氨酸激酶;二氢吡啶二羧酸合成酶;色氨酸脱羧酶;二氢吡啶二羧酸合成酶和脱敏型天冬氨酸激酶;bar基因;色氨酸脱羧酶;新霉素磷酸转移酶(NEO);潮霉素磷酸转移酶(HPT或HYG);二氢叶酸还原酶(DHFR);膦丝菌素乙酰转移酶;2,2-二氯丙酸脱卤素酶;乙酰羟酸合酶;5-烯醇丙酮酰-莽草酸-磷酸合酶(aroA);卤代芳基腈水解酶;乙酰辅酶A羧化酶;二氢蝶酸合酶(sul I);和32kD光系统II多肽(psbA)。一个实施方案还包括编码对下列物质的抗性的可选择标志物基因:氯霉素;甲氨蝶呤;潮霉素;大观霉素;溴苯腈;草甘膦;和膦丝菌素。以上列出的可选择标志物基因并非意味着是限制性的。本公开涵盖任何报告基因或可选择标志物基因。
在一些实施方案中,合成了编码序列,以便在植物中优化表达。例如,在一个实施方案中,基因的编码序列已通过密码子优化进行修饰,以增强在植物中的表达。可以优化杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因或可选择标志物转基因,以便在特定植物物种中表达,或者可以修饰上述转基因,以便在双子叶或单子叶植物中优化表达。根据在感兴趣的特定植物物种中以最大量表达的蛋白质中最高频率的密码子,可以确定植物优选的密码子。在一个实施方案中,编码序列、基因或转基因被设计为以较高水平在植物中表达,从而产生更高的转化效率。用于基因的植物优化的方法是熟知的。关于合成的DNA序列的优化和生产的指南可例如在WO2013016546、WO2011146524、WO1997013402、美国专利No.6166302、美国专利No.5380831中找到,将其通过提述并入本文。
转化
用于植物转化的适合方法包括藉此将DNA引入细胞中的任何方法,例如但不限于:电穿孔(参见,例如,美国专利5,384,253);微粒轰击(参见,例如,美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861、和6,403,865);土壤杆菌介导的转化(参见,例如,美国专利5,635,055、5,824,877、5,591,616;5,981,840、和6,384,301);和原生质体转化(参见,例如,美国专利5,508,184)。
使用诸如利用碳化硅纤维搅动的技术(参见,例如,美国专利5,302,523和5,464,765)可以将DNA构建体直接引入植物细胞的基因组DNA中,或者可以使用生物射弹法如DNA粒子轰击将DNA构建体直接引入植物组织中(参见,例如,Klein等人(1987)Nature 327:70-73)。或者,可通过纳米颗粒转化将DNA构建体引入植物细胞中(参见,例如,美国专利公开No.20090104700,通过提述将其完整并入本文)。
另外,可以使用非土壤杆菌细菌或病毒,比如根瘤菌物种NGR234、苜蓿中华根瘤菌、百脉根根瘤菌、马铃薯病毒X、花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒实现基因转移,参见,例如Chung等人(2006)Trends Plant Sci.11(1):1-4。
通过应用转化技术,事实上任何植物物种的细胞可被稳定转化,并且可通过熟知的技术将这些细胞开发为转基因植物。例如,在棉花转化背景下可以特别有用的技术描述于美国专利No.5,846,797、5,159,135、5,004,863、和6,624,344中;用于转化芸苔属植物的技术例如具体描述于美国专利5,750,871中;用于转化大豆的技术例如描述于美国专利6,384,301中;并且用于转化玉米的技术例如描述于美国专利7,060,876和5,591,616、以及国际PCT公开WO 95/06722中。
在完成外源核酸到受体细胞的递送之后,通常鉴定出转化的细胞用于进一步培养和植物再生。为了提高鉴定转化体的能力,人们可能期望采用可选择标志物基因,其中使用转化载体再生转化体。在说明性实施方案中,可通过使细胞暴露于一种或多种选择剂来测定转化的细胞群,或者可筛选所述细胞的期望标志物基因性状。
暴露于选择剂后存活的细胞、或者在筛选测定中已被评分为阳性的细胞,可以在支持植物再生的介质中加以培养。在一个实施方案中,可通过包含其他物质,如生长调节剂来改良任何适合的植物组织培养基。可将组织维持在具有生长调节剂的基本培养基上,直到可得到足够的组织开始植物再生的努力时为止,或者在重复轮的手动选择之后,直到组织形态适合于再生时为止(例如,至少2周),然后转移到有助于芽形成的介质中。定期转移培养物,直到已经出现充分的芽形成时为止。一旦芽形成,将它们转移到有助于根形成的介质中。一旦形成足够的根,可将植物转移到土壤中,以便进一步生长和成熟。
分子确认
通过利用转化DNA上存在的标志物基因所编码的性状对工程改造的植物材料进行选择或筛选,可以鉴定和分离转化的植物细胞、愈伤组织、组织、或植物。例如,可以通过在含有抑制量的抗生素或除草剂(转化基因构建体提供对该抗生素或除草剂的抗性)的培养基上培育工程改造的植物材料来实施选择。此外,还可以通过筛选可存在于重组核酸构建体上的任何可见的标志物基因(例如β-葡糖苷酸酶、荧光素酶或绿色荧光蛋白基因)的活性来鉴定转化的植物和植物细胞。这样的选择和筛选方法是本领域技术人员熟知的。可用于鉴定转基因植物的分子确认方法是本领域技术人员已知的。下面进一步描述几种示例性方法。
已描述了分子信标用于序列检测。简要地说,设计与侧翼基因组和插入物DNA接点重叠的FRET寡核苷酸探针。FRET探针的独特结构导致它含有使荧光模块和猝灭模块保持非常靠近的二级结构。在热稳定聚合酶和dNTP的存在下,使FRET探针和PCR引物(一个引物在插入DNA序列内,一个引物在侧翼基因组序列内)循环。在成功的PCR扩增之后,FRET探针与靶序列的杂交导致探针的二级结构消除以及荧光模块和淬灭模块的空间分离。荧光信号指示由于成功的扩增和杂交导致的侧翼基因组/转基因插入序列的存在。这样的用于检测扩增反应的分子信标测定是本主题公开的实施方案。
水解探针测定,或者也称作(Life Technologies,Foster City,Calif.),是一种检测和定量DNA序列之存在的方法。简要地说,设计FRET寡核苷酸探针,其具有一段在转基因内的寡聚体,一段在侧翼基因组序列内的寡聚体,用于事件特异性检测。在热稳定聚合酶和dNTP的存在下,使FRET探针和PCR引物(一个引物在插入DNA序列内,一个引物在侧翼基因组序列内)循环。FRET探针的杂交导致荧光模块从FRET探针上的猝灭模块被切断并释放。荧光信号指示由于成功的扩增和杂交导致的侧翼/转基因插入序列的存在。这样的用于检测扩增反应的水解探针测定是本主题公开的实施方案。
测定是检测和定量DNA序列之存在的方法。简言之,利用被称为测定系统的基于聚合酶链反应(PCR)的测定法,筛选了包含整合的基因表达盒多核苷酸的基因组DNA样品。在主题公开的实践中使用的/>测定可利用含有多种引物的/>PCR测定混合物。在PCR测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。正向引物含有相应于DNA多核苷酸的特定区域的序列,并且反向引物含有相应于基因组序列的特定区域的序列。另外,在PCR测定混合物中使用的引物可包括至少一个正向引物和至少一个反向引物。例如,/>PCR测定混合物可利用相应于两个不同等位基因的两个正向引物和一个反向引物。正向引物之一含有相应于内源基因组序列的特定区域的序列。第二正向引物含有相应于DNA多核苷酸的特定区域的序列。反向引物含有相应于基因组序列的特定区域的序列。这样的用于检测扩增反应的/>测定法是本主题公开的实施方案。
在一些实施方案中,荧光信号或荧光染料选自下组:HEX荧光染料、FAM荧光染料、JOE荧光染料、TET荧光染料、Cy 3荧光染料、Cy 3.5荧光染料、Cy 5荧光染料、Cy 5.5荧光染料、Cy 7荧光染料、和ROX荧光染料。
在其他实施方案中,使用适合的第二荧光DNA染料进行扩增反应,所述第二荧光DNA染料能够在流式细胞术可检测的浓度范围内使细胞DNA染色,并且具有通过实时热循环仪可检测的荧光发射光谱。本领域普通技术人员应当理解的是,其他核酸染料是已知的并且正在被不断地鉴定。可以采用具有适当激发和发射光谱的任何适合的核酸染料,如YO-PRO-SYTOX/>SYBR Green /> 和/>在一个实施方案中,第二荧光DNA染料是以少于10μM、少于4μM、或少于2.7μM使用的/>
在进一步的实施方案中,下一代测序(NGS)可用于检测。如由Brautigma等人在2010年所述,可以使用DNA序列分析来确定分离和扩增的片段的核苷酸序列。可以分离扩增的片段并亚克隆到载体中,并使用链终止子法(也称为Sanger测序)或染料终止子测序进行测序。另外,可以用下一代测序将扩增子测序。NGS技术不需要亚克隆步骤,并且可以在单个反应中完成多个测序读取。有三种NGS平台可商购:来自454Life Sciences/Roche的GenomeSequencer FLXTM,来自Solexa的Illumina Genome AnalyserTM和Applied Biosystems的SOLiDTM(首字母缩写词,代表:“寡聚物连接和检测测序”(“Sequencing by Oligo Ligationand Detection”)。另外,目前正在开发两种单分子测序方法。这些包括来自HelicosBioscienceTM的真实单分子测序(tSMS)和来自Pacific Biosciences的单分子Real TimeTM测序(SMRT)。
由454 Life Sciences/Roche推向市场的Genome Sequencer FLXTM是长读段NGS,其使用乳液PCR和焦磷酸测序来生成测序读段。可以使用300-800bp的DNA片段或含有3-20kb片段的文库。反应每次运行可以产生超过100万个约250至400个碱基的读段,总产量为250至400兆碱基。与其他NGS技术相比,这种技术产生的读段最长,但每次运行的总序列输出较低。
由SolexaTM推向市场的Illumina Genome AnalyserTM是一种短读段NGS,其利用荧光染料标记的可逆终止子核苷酸的边合成边测序法,并且以固相桥式PCR为基础。可以使用含有高达10kb的DNA片段的配对末端测序文库的构建。反应产生长度为35-76个碱基的超过1亿个短读段。这些数据每次运行可以产生3-6千兆碱基。
由Applied BiosystemsTM推向市场的寡聚物连接和检测测序(SOLiD)系统是一种短读段技术。这种NGS技术使用长度最多可达10kb的片段化双链DNA。该系统使用通过染料标记的寡核苷酸引物的边连接边测序和乳液PCR,以生成10亿个短读段,其导致每次运行高达30千兆碱基的总序列输出。
Helicos BioscienceTM的tSMS和Pacific BiosciencesTM的SMRT应用了一种不同的方法,所述方法使用单个DNA分子进行序列反应。tSMS HelicosTM系统产生高达8亿个短读段,每次运行生成21千兆碱基。使用荧光染料标记的虚拟终止子核苷酸完成这些反应,其被描述为“边合成边测序”方法。
由Pacific BiosciencesTM推向市场的SMRT下一代测序系统使用实时的边合成边测序。由于不受可逆终止子的限制,这种技术可以产生长度高达1,000bp的读段。使用这种技术每天可以产生相当于二倍体人类基因组的一倍覆盖度的原始读取通量。
在另一个实施方案中,可以使用包括Western印迹、Northern印迹和Southern印迹在内的印迹测定法完成检测。此类印迹测定法是在生物样品的鉴定和定量的生物研究中常用的技术。这些测定法包括首先通过电泳分离凝胶中的样品组分,接着将电泳分离的组分从凝胶转移到用诸如硝酸纤维素、聚偏二氟乙烯(PVDF)或尼龙的材料制成的转移膜上。也可以将分析物直接点样在这些支持物上,或通过施加真空、毛细管作用或压力而定向到支持物上的特定区域上,而不需要预先分离。然后通常对转移膜进行转移后处理,以增强分析物彼此区分和在视觉上或通过自动读取器被检出的能力。
在一个另外的实施方案中,可以使用ELISA测定法来完成检测,所述ELISA测定法使用固相酶免疫测定法检测液体样品或湿样品中物质(通常是抗原)的存在。将来自样品的抗原附着在平板的表面上。然后,将另一种特异性抗体施用在该表面上,使得它可以与所述抗原结合。这种抗体是与酶连接的,并且,在最后的步骤中,添加含有该酶的底物的物质。随后的反应产生可检测信号,最常见的是底物中的颜色变化。
转基因植物
在一个实施方案中,植物、植物组织、或植物细胞包含玉米卵细胞基因启动子。在一个实施方案中,植物、植物组织或植物细胞包含玉米卵细胞基因启动子,所述启动子具有选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,所述基因表达盒包含与非玉米卵细胞基因可操作连接的选自SEQ ID NO:1的序列、或与选自SEQID NO:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在说明性实施方案中,植物、植物组织、或植物细胞包含含有与转基因可操作连接的玉米卵细胞基因启动子的基因表达盒,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、可选择标志物转基因、或它们的组合。
根据一个实施方案,提供了植物、植物组织或植物细胞,其中所述植物、植物组织或植物细胞包含与转基因可操作连接的玉米卵细胞基因启动子衍生的序列,其中所述玉米卵细胞基因启动子衍生的序列包含序列SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含与非玉米卵细胞基因可操作连接的SEQ IDNO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,所述植物选自下组:玉米、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为玉米。根据一个实施方案,所述植物、植物组织、或植物细胞包含与非玉米卵细胞基因可操作连接的SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞包含与转基因可操作连接的启动子,其中所述启动子的组成为SEQ ID NO:1或与SEQ ID NO:1具有80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,包含与转基因可操作连接的玉米卵细胞基因启动子序列的基因构建体被组入植物、植物组织、或植物细胞的基因组中。
在一个实施方案中,植物、植物组织、或植物细胞包含玉米卵细胞基因3'UTR。在一个实施方案中,植物、植物组织或植物细胞包含玉米卵细胞基因3'UTR,所述3'UTR具有选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,植物、植物组织或植物细胞包含基因表达盒,所述基因表达盒包含与非玉米卵细胞基因可操作连接的选自SEQ ID NO:2的序列、或与选自SEQ IDNO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在说明性实施方案中,植物、植物组织、或植物细胞包含含有与转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒,其中所述转基因可以是杀虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水分利用效率转基因、营养品质转基因、DNA结合转基因、可选择标志物转基因、或它们的组合。
根据一个实施方案,提供了植物、植物组织或植物细胞,其中所述植物、植物组织或植物细胞包含与转基因可操作连接的玉米卵细胞基因3'UTR衍生的序列,其中所述玉米卵细胞基因3'UTR衍生的序列包含序列SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含与非玉米卵细胞基因可操作连接的SEQ IDNO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞为双子叶或单子叶植物或来源于双子叶或单子叶植物的细胞或组织。在一个实施方案中,所述植物选自下组:玉米、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵、和卡诺拉。在一个实施方案中,所述植物为玉米。根据一个实施方案,所述植物、植物组织、或植物细胞包含与非玉米卵细胞基因可操作连接的SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,所述植物、植物组织、或植物细胞包含与转基因可操作连接的3'UTR,其中所述3'UTR的组成为SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列。根据一个实施方案,包含与转基因可操作连接的玉米卵细胞基因3'UTR序列的基因构建体被组入植物、植物组织、或植物细胞的基因组中。
在一个实施方案中,根据本文中公开的方法的植物、植物组织、或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是,但不限于苜蓿、油菜、卡诺拉、芥菜、埃塞俄比亚芥、大豆、向日葵、棉花、豆类、西兰花、卷心菜、花椰菜、芹菜、黄瓜、茄子、莴苣;甜瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、番茄和西瓜。
本领域技术人员将认识到,在外源序列稳定组入转基因植物中并经证实为可操作之后,可通过有性杂交将其引入其他植物中。可以使用许多标准育种技术中的任何一种,这取决于被杂交的物种。
本公开还包括上述转基因植物的种子,其中所述种子具有含有本主题公开的基因调控元件的转基因或基因构建体。本公开进一步包括上述转基因植物的后代、克隆、细胞系或细胞,其中所述后代、克隆、细胞系或细胞具有含有本主题公开的基因调控元件的转基因或基因构建体。
本公开还包括上述转基因植物的培育,其中所述转基因植物具有含有本主题公开的基因调控元件的转基因或基因构建体。因此,通过用根据本发明的核酸分子转化,这样的转基因植物可以被工程改造为特别地具有一个或多个期望的性状或含有本主题公开的基因调控元件的转基因事件,并且可以通过本领域技术人员已知的任何方法加以种植或培育。
表达转基因的方法
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米卵细胞基因启动子的植物。在一个实施方案中,所述玉米卵细胞基因启动子的组成为选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米卵细胞基因启动子的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米卵细胞基因启动子的植物组织或植物细胞。
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因启动子的基因表达盒的植物。在一个实施方案中,所述玉米卵细胞基因启动子的组成为选自SEQ ID NO:1的序列或与选自SEQ ID NO:1的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因启动子的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因启动子的基因表达盒的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米卵细胞基因启动子的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含基因表达盒、与至少一个转基因可操作连接的玉米卵细胞基因启动子的植物组织或植物细胞。
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因或多接头序列可操作连接的玉米卵细胞基因3'UTR的植物。在一个实施方案中,所述玉米卵细胞基因3'UTR的组成为选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的植物组织或植物细胞。
在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒的植物。在一个实施方案中,所述玉米卵细胞基因3'UTR的组成为选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒的植物。在一个实施方案中,在植物中表达至少一个转基因的方法包括种植包含含有与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒的植物。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含含有与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的基因表达盒的植物组织或植物细胞。在一个实施方案中,在植物组织或植物细胞中表达至少一个转基因的方法包括培养包含基因表达盒、与至少一个转基因可操作连接的玉米卵细胞基因3'UTR的植物组织或植物细胞。
提供以下实施例以展示某些具体特征和/或实施方案。不应将这些实施例解释为将本公开限制为所例示的具体特征或实施方案。
实施例
实施例1:来自玉米卵细胞基因的优化的调控元件组合的新设计
从玉米基因组DNA(gDNA)序列中鉴定出来自玉米卵细胞基因的启动子(SEQ IDNO:1)和来自玉米卵细胞基因的3'UTR(SEQ ID NO:2)。这些调控元件序列是这样鉴定出来的:用拟南芥卵细胞基因DD45/EC1.2(Genbank登录号At2g21740)对Phytozome数据库(Goodstein DM,Shu S,Howson R,Neupane R,Hayes RD,Fazo J,Mitros T,Dirks W,Hellsten U,Putnam N,Rokhsar DS(2012)Nucleic Acids Res.40:D1178-1186)进行BLAST。分析得到的命中,并选择单个编码序列用于进一步分析。为了鉴定新的启动子区,检索在翻译起始位点(ATG密码子)上游的1至3kb的核苷酸,并进行另外的计算机分析。为了鉴定新的3'UTR区,检索在终止位点下游的0.5至2kb的核苷酸,并进行另外的计算机分析。计算机分析包括根据需要鉴定来自任何其他周围基因的多核苷酸序列,检查可能导致基因表达沉默的重复序列的存在、或可能含有非编码外显子和内含子的5'UTR的存在。基于这些分析,合成玉米卵细胞启动子序列并将其向前移动以进一步用于驱动转基因的表达。根据跨越数百万个碱基对的连续染色体序列的评估,鉴定并分离了一个1,500bp的多核苷酸序列,用于表达异源编码序列。分析这个新的多核苷酸序列,将其用作驱动基因的表达的调控序列,并且提供为在SEQ ID NO:3中的碱基对1-1,500。同样,根据跨越数百万个碱基对的连续染色体序列的评估,鉴定并分离了一个971bp的多核苷酸序列,用于表达异源编码序列。分析这个新的多核苷酸序列,将其用作终止基因的表达的调控序列,并且提供为在SEQ IDNO:3中的碱基对1,984-2,954。
实施例2:载体构建(pDAB129559)
构建pDAB129559载体,用于在转基因的侧翼组入调控性多核苷酸序列的新组合。所述载体构建体pDAB129559含有基因表达盒,其中PhiYFP转基因由具有SEQ ID NO:1的玉米卵细胞启动子驱动,并且其侧翼为具有SEQ ID NO:2的玉米卵细胞3'UTR。这个基因表达盒的序列表被提供为SEQ ID NO:4。所述载体还含有可选择标志物基因表达盒,所述表达盒含有由水稻肌动蛋白1启动子(美国专利No.5,641,876)驱动的aad-1转基因(美国专利No.7,838,733),并且以玉米脂肪酶3'UTR(美国专利No.7,179,902)终止。这个基因表达盒的序列表被提供为SEQ ID NO:5。通过合成新设计的来自玉米卵细胞基因的启动子和3'UTR并且利用第三方提供者将所述启动子克隆到GeneArt Seamless CloningTM(LifeTechnologies)入门载体中来构建该构建体。将得到的入门载体标记为pDAB129548,其含有驱动PhiYFP转基因的玉米卵细胞基因启动子,用于玉米组织的粒子轰击。获得入门载体pDAB129548的克隆,分离质粒DNA并通过限制酶消化和测序加以证实。另外,使用GatewayTM克隆系统(Life Technologies)将pDAB129548入门载体整合到目的载体中。获得产生的二元质粒pDAB129559的克隆,分离质粒DNA并通过限制酶消化和测序加以证实。产生的构建体含有驱动转基因表达和终止转基因表达的调控元件的组合。
实施例3:玉米转化
通过粒子轰击转化玉米
通过分离的未成熟胚的粒子轰击转化,将实验性pDAB129548构建体转化到玉米栽培种B104中。例如,随机地从八个穗分离玉米栽培种B104未成熟胚,其中胚大小平均为1.8-2.4mm。将未成熟胚收集在感染培养基中,置于渗透溶解(osmolysis)培养基上,在亮光下温育过夜,其中光子通量为50μM,温度为27℃。分离后第二天将每板36个未成熟胚布置在目标圆内,用于进行粒子轰击(PB)。每构建体使用三个平板,其中一个具有大小在2.2-2.4mm之间的未成熟胚,两个具有大小在1.8-2.2mm之间的未成熟胚。使用CaCl2/亚精胺沉淀,用5μl的DNA(1.0μg/μl的原液)包被金颗粒。用于轰击的参数是:1.0微米金颗粒,1100psi破裂盘,27英寸汞柱真空和6厘米轰击距离。
一旦轰击完成,将平板置于透明盒中并返回到如上所示的相同培养条件。72小时后收获未成熟胚,进行表达YFP蛋白的显微图像分析。使用配备有Leica Planapo 2.0x物镜的Leica M165 FC荧光立体显微镜和Leica DFC310 FX 1.4兆像素相机进行图像分析。
在轰击的未成熟胚中的YFP表达的图像分析表明,与未导致玉米中的YFP蛋白表达的未转化的未成熟胚相比,新的玉米卵细胞基因启动子和玉米卵细胞基因3'UTR成功地驱动了玉米中的YFP表达。
实施例4:与作物植物中的玉米卵细胞调控元件可操作连接的基因的表达谱
如pDAB129548中提供的,具有SEQ ID NO:1的玉米卵细胞启动子调控元件和具有SEQ ID NO:2的玉米卵细胞3'UTR调控元件导致了玉米未成熟胚中YFP转基因的表达。正因为如此,鉴定并表征了新的玉米卵细胞基因调控元件(具有SEQ ID NO:1的玉米卵细胞启动子和具有SEQ ID NO:2的玉米卵细胞3'UTR)。首次公开了在基因表达构建体中使用的新的启动子调控元件。
实施例5:水解探针(qPCR)转基因拷贝数分析
采用各种类型的分子分析来筛选低拷贝简单事件。使用THERMO FISHERKingFisherTM磁性颗粒处理器和供应商推荐的方案,使用QIAGEN MagAttractTM试剂盒提取DNA。使用针对phiyfp和aad1基因的特异性水解探针测定进行整合的转基因拷贝数分析。另外,通过对二元载体骨架上携带的大观霉素(Spec)抗性基因特异的水解探针测定,检测二元载体质粒骨架的无意整合所致的污染。对于内源玉米基因的水解探针测定,开发了转化酶(GenBankTM登录号U16123)和滞蛋白(GenBankTM登录号XM_008664750)作为内部参考标准品。表1列出了水解探针测定组分的寡核苷酸序列(引物和BHQ探针由INTEGRATED DNATECHNOLOGIES(Coralville,IA)合成,MGB探针由APPLIED BIOSYSTEMS(Grand Island,NY)合成)。根据表2以约10ng的DNA建立Biplex水解探针PCR反应,测定条件呈现在表3中。
为了扩增,制备了在10μL体积的多重反应物中的1X终浓度的Fast AdvancedTM母液混合物(Life Technologies,Carlsbad,CA),其含有0.1%的PVP、0.4μM的各引物以及0.2μM的各探针。在465nm处激发FAM(6-羧基荧光素Amidite)荧光模块,并测量在510nm处的荧光;对于HEX(六氯荧光素)荧光模块的对应值为533nm和580nm,并且对于的所述值为538nm和554nm。使用Roche />480实时PCR系统,根据制造商的建议分析了针对每个反应生成的荧光水平。通过将未知样品的靶/参考基因值的/>480输出与已知拷贝数标准品的靶/参考基因值比较,确定了转基因拷贝数(1-拷贝代表半合子植物,2-拷贝代表纯合植物)。
使用Cp评分(即,使用拟合点算法(软件版本1.5)和相对定量模块(基于ΔΔCt法),荧光信号与背景阈值交叉的点)进行实时PCR数据分析。
表1:用于感兴趣的基因的拷贝数和相对表达检测的正向和反向核苷酸引物和荧光探针(由Applied Biosystems合成)的列表。
表2:用于DNA拷贝数分析的PCR混合物.
表3:用于水解探针PCR扩增的热循环仪条件.
实施例6:相对转录物(RNA)分析
使用水解探针PCR检测phiyfp转录物的相对水平。收集含有未受精的卵细胞的未成熟穗组织样品。用KingFisher总RNA试剂盒(Thermo Scientific,目录号97020196)提取RNA。使用在20μL反应物中的随机引物(TVN寡核苷酸–SEQ ID NO:19:TTTTTTTTTTTTTTTTTTTTVN),用高容量cDNA合成试剂盒(Invitrogen,Carlsbad,Ca,目录号:4368814)由约500ng的RNA制备cDNA,所述反应物含有2.5单位/μl的MultiScribe逆转录酶、200nM的TVN寡核苷酸和4mM的dNTP。以在25℃下预温育10分钟开始反应,然后在37℃下合成120分钟,并且在85℃下失活5分钟。
然后将新合成的cDNA用于扩增,qPCR设置、运行条件和信号捕获与DNA拷贝数分析相同,不同之处为使用滞蛋白作为玉米参考基因。使用相对于滞蛋白水平的2-ΔΔCt计算感兴趣的基因的表达数据。
实施例7:未受精玉米胚珠中的卵细胞特异性启动子表达模式的显微镜分析
在温室中种植含有卵细胞特异性启动子构建体pDAB129559的T0玉米转基因植物。在同一温室中种植野生型植物。将植物去雄,在从穗丝出现到穗丝长7cm时的阶段的不同发育阶段期间,收获未成熟的穗。将周围的苞叶从穗上移除,将6-8个籽粒切成切片。将这些切片以籽粒侧向上附着到具有氰基丙烯酸酯胶的样品台上,并在Leica VT1200振动切片机上切成250微米厚。将这些切片封固在载玻片上的一滴水中,在Leica DM5000直立复式显微镜上检查,并使用YFP滤光片组用Leica DFC T7000数码相机捕获图像。
来自转基因系pDAB129559的籽粒切片显示了胚囊中的表达YFP的细胞/组织。然而,对于从非转基因对照植物获得的籽粒的胚囊,未观察到YFP荧光。
如pDAB129559中提供的,具有SEQ ID NO:1的玉米卵细胞启动子调控元件和具有SEQ ID NO:2的玉米卵细胞3'UTR调控元件导致了玉米未成熟胚中YFP转基因的表达。正因为如此,鉴定并表征了新的玉米卵细胞基因调控元件(具有SEQ ID NO:1的玉米卵细胞启动子和具有SEQ ID NO:2的玉米卵细胞3'UTR)。首次公开了在基因表达构建体中使用的新的启动子调控元件。
实施例8:受精的玉米胚珠中的卵细胞特异性启动子表达模式的显微镜分析
在温室中种植含有卵细胞特异性启动子构建体pDAB129559的T0玉米转基因植物。在同一温室中种植野生型植物。将植物去雄,使用来自非转基因玉米植物的花粉对穗进行异花授粉。授粉之后4天,收获受精的穗。将周围的苞叶从穗上移除,将6-8个籽粒切成切片。将这些切片以籽粒侧向上附着到具有氰基丙烯酸酯胶的样品台上,并在Leica VT1200vibratomeTM上切成250微米厚。将这些切片封固在载玻片上的一滴水中,在Leica DM5000直立复式显微镜上检查,并使用YFP滤光片组用Leica DFC T7000TM数码相机捕获图像。
从转基因系pDAB129559成像的受精胚珠显示了胚/胚囊中的表达YFP的细胞/组织。
如pDAB129559中提供的,具有SEQ ID NO:1的玉米卵细胞启动子调控元件和具有SEQ ID NO:2的玉米卵细胞3'UTR调控元件导致了玉米未成熟胚中YFP转基因的表达。正因为如此,鉴定并表征了新的玉米卵细胞基因调控元件(具有SEQ ID NO:1的玉米卵细胞启动子和具有SEQ ID NO:2的玉米卵细胞3'UTR)。首次公开了在基因表达构建体中使用的新的启动子调控元件。
实施例9:与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因的土壤杆菌介导的转化
通过利用先前在专利申请WO 2007/053482的实施例11或实施例13中描述的相同技术,可以用与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因转化大豆。
通过利用先前在美国专利No.7,838,733的实施例14或专利申请WO 2007/053482(Wright等人)的实施例12中描述的相同技术,可以用与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因转化棉花。
通过利用先前在美国专利No.7,838,733的实施例26或专利申请WO 2007/053482(Wright等人)的实施例22中描述的相同技术,可以用与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因转化卡诺拉。
通过利用先前在专利申请WO 2013/116700A1(Lira等人)的实施例23中描述的相同技术,可以用与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因转化小麦。
通过利用先前在专利申请WO 2013/116700A1(Lira等人)的实施例19中描述的相同技术,可以用与玉米卵细胞启动子和/或玉米卵细胞3'UTR可操作连接的基因转化水稻。
实施例10:与玉米卵细胞调控元件可操作连接的基因的土壤杆菌介导的转化
根据本主题公开,可根据本主题公开的实施方案使用本领域已知的技术转化另外的作物。对于土壤杆菌介导的黑麦转化,参见,例如Popelka JC,Xu J,Altpeter F.,“Generation of rye with low transgene copy number after biolistic genetransfer and production of(Secale cereale L.)plants instantly marker-freetransgenic rye,”Transgenic Res.2003Oct;12(5):587-96.)。对于土壤杆菌介导的高粱转化,参见,例如Zhao等人,“Agrobacterium-mediated sorghum transformation,”PlantMol Biol.2000 Dec;44(6):789-98。对于土壤杆菌介导的大麦转化,参见,例如Tingay等人,“Agrobacterium tumefaciens-mediated barley transformation,”The PlantJournal,(1997)11:1369–1376。对于土壤杆菌介导的小麦转化,参见,例如Cheng等人,“Genetic Transformation of Wheat Mediated by Agrobacterium tumefaciens,”PlantPhysiol.1997Nov;115(3):971-980。对于土壤杆菌介导的水稻转化,参见,例如Hiei等人,“Transformation of rice mediated by Agrobacterium tumefaciens,”PlantMol.Biol.1997 Sep;35(1-2):205-18。
这些和其他植物的拉丁名称在下面给出。应当清楚的是,可使用其他(非土壤杆菌)转化技术将例如与玉米卵细胞启动子可操作连接的基因转化到这些和其他植物中。例子包括但不限于;玉蜀黍(Zea mays)、小麦(Triticum spp.)、水稻(Oryza spp.和Zizaniaspp.)、大麦(大麦属(Hordeum spp.))、棉花(水麻(Abroma augusta)和棉属(Gossypiumspp.))、大豆(Glycine max)、糖用甜菜和食用甜菜(Beta spp.)、甘蔗(桄榔(Arengapinnata))、番茄(Lycopersicon esculentum和其他种类、粘果酸浆(Physalis ixocarpa)、黄水茄(Solanum incanum)和其他种类、以及树番茄(Cyphomandra betacea))、马铃薯(Solanum tuberosum)、甘薯(Ipomoea batatas)、黑麦(Secale spp.)、辣椒(Capsicumannuum、中国辣椒(chinense)、以及小米椒(Capsicum frutescens))、莴苣(山莴苣(Lactuca sativa)、宿根莴苣(perennis)、以及野莴苣(pulchella))、卷心菜(Brassicaspp.)、芹菜(Apium graveolens)、茄子(Solanum melongena)、花生(Arachis hypogea)、高粱(Sorghum spp.)、苜蓿(Medicago sativa)、胡萝卜(Daucus carota)、豆类(菜豆属(Phaseolus spp.)和其他属)、燕麦(Avena sativa和strigosa)、豌豆(豌豆属(Pisum)、豇豆属(Vigna)、和四棱豆属物种(Tetragonolobus spp.))、向日葵(Helianthus annuus)、南瓜(Cucurbita spp.)、黄瓜(Cucumis sativa)、烟草(Nicotiana spp.)、拟南芥(Arabidopsis thaliana)、草坪草(黑麦草属(Lolium)、剪股颖属(Agrostis)、早熟禾属(Poa)、狗牙根属(Cynodon)、以及其他属)、三叶草(Trifolium)、巢菜属(Vicia)。例如,在本主题公开的实施方案中考虑了用与玉米卵细胞基因的3'UTR可操作连接的基因转化这样的植物。
玉米卵细胞启动子和/或玉米卵细胞3'UTR驱动可操作连接的基因的用途可以运用于许多落叶和常绿木材物种中。这样的应用也在本公开的实施方案的范围内。这些种类包括,但不限于;桤木(桤木属(Alnus spp.))、白蜡木(ash)(梣属(Fraxinus spp.))、白杨和杨树种类(杨属(Populus spp.))、山毛榉(山毛榉属(Fagus spp.))、桦树(桦木属(Betula spp.))、樱桃(李属(Prunus spp.))、桉树(桉树属(Eucalyptus spp.))、山胡桃树(山核桃属(Carya spp.))、枫树(枫属(Acer spp.))、橡树(栎属(Quercus spp.))、以及松树(松属(Pinus spp.))。
玉米卵细胞启动子和/或玉米卵细胞3'UTR驱动可操作连接的基因的用途可以运用于许多装饰物种和结实物种中。这样的应用也在本公开的实施方案的范围内。例子包括但不限于:玫瑰(蔷薇属物种(Rosa spp.))、地肤(burning bush)(卫矛属物种(Euonymusspp.))、矮牵牛(矮牵牛属物种(Petunia spp.))、秋海裳(秋海棠属物种(Begonia spp.))、杜鹃(杜鹃属物种(Rhododendron spp.))、海棠或苹果(苹果属物种(Malus spp.))、梨(梨属物种(Pyrus spp.))、桃(李属物种(Prunus spp.))、和万寿菊(万寿菊属物种(Tagetesspp.))。
虽然上面已经论述了许多示例性方面和实施方案,但是本领域技术人员将认识到它们的某些修改、置换、添加和子组合。因此,以下所附权利要求和此后引入的权利要求旨在被解释为包括在它们的真实精神和范围内的所有这些修改、置换、添加和子组合。
序列表
<110> 美国陶氏益农公司
S·库马尔
P·巴龙
D·海明威
E·艾奇逊
A·阿斯百里
H·彭斯
A·J·博林
<120> 用于转基因表达的植物启动子
<130> 79401-US-PSP
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 1500
<212> DNA
<213> zea mays
<400> 1
actaccagca gcatgatcag agtgaggata gttgctactt caatggccta ggtttgataa 60
ctactgtcga tccatctgtc gacaattgtt tgtttcctct cacaattcac gtttctgccg 120
ccacttcttt gcacctaaca ttgcccgtgt cgctgttatt agttttgtgg ttttgcattg 180
tctgtatata gtctgatgag gctatagatt gagccttcaa aagtgtttcg ttgggcctct 240
tgttgaatgt actccaaagt ctcggtgcac catcagacgt attcctagaa tggcacaatc 300
tggctatcag aactggtagg tttagtccaa atgtaatgat gtgttctaaa gtagtcgggc 360
tgagtcaaac agcagcttct tctcttgttc aaaattttga acctggtaat gttgtcattt 420
catgatagat catagataca ttcttggttt cactatatct tagaaagtcc agccaacaga 480
agtactcaag tacaggtgaa cctttcagtt tagctggaga cctgggcagc agtgtacaaa 540
gtctaatcca cagctgtgac cctgtgagct gggggttggg cctgcctcgg aggggatcgt 600
gtcttttctg tttgtgcaat tatcagtgcc taaagaacat gtgttataac agttatacac 660
ggtcaattat tcaatccatc ttttaacgtg tgtttggttg tacgtataag aagggatcaa 720
agagggcggc cacattttct ataacatttg gatgagagtc acacgagaac gagatgaaca 780
ccgaagtaat tttttatgac agcatgatcc aaaaaaatcg agagaacggt gttatccccg 840
tctcatccta ttttgatctc aaaccaaaca cataattagt caatgagcac tgacttgatg 900
tagaagaact tggtacatat accaggaaat gactctgact tgctgagatg ccttgtagtc 960
cctcggtccc gtaaattata cagtagtatt taaacttcct cgcacaaagg aaaactattt 1020
gtttttgcat gccttgtaaa ttagctatca agtttttttt taaaaaaaac gacctttgaa 1080
aaccagtaag gaggactcgt tcggtattca gttttaaagt tcaaggttaa aaatcgaact 1140
gacgtgcaaa acaccctggg ggttaaaatc aaaacacaca aatttggaaa atgagcaggc 1200
atgacttatg ttgtgtccgt tgaagtgccg tggctccatg gcacggtgga actttacatt 1260
agtgcggtag tgtcactgtg gcagtaaagc ccacttattt tccattagag agagggagat 1320
taaaaacgtg gctttacaca ttctgaaact aattgtgagt ttgtgactct tggcttgcct 1380
gcagtgtccg cctgcacctt ctataagtac agtcgcgagc ctcagctata caaaccaact 1440
agcgcatagt atctcctgag ctccattcat catcccaagt cttcactggt cttagatcac 1500
<210> 2
<211> 971
<212> DNA
<213> zea mays
<400> 2
gctatggatc aggatgtgga tgtgttcgtt cgatcgtttc cacgtccaat ctcgctgaat 60
aaattgtctc gagaaagttt ggctttgccg agataaataa tagtgataat tcttactcct 120
gctacaaact gttttccttg aagcaactat gagcatcttc catagattcg cgacacgatt 180
taaattttaa aaataacatt tttaaaaaaa tgtgtcacgg ttacacaact ttttttttaa 240
cactagttgc gccccgcgtc caagcttact ccctgaaatt gcattcaaac tctcgattca 300
tgtctgccct tctcaccttc tgtgtgcctg tgtgggctcg acgtctagtc gtcttcggct 360
cttcgcctac atcagtcacc tcctcacacg acgtgtctgc gacacaggcc gcggcataga 420
gcacgggcat gtagttttga acaagtgcat gttgctacct cgactatgat catgcaaaat 480
atttttttta ttatttatag aggtttaaaa taagacatgg aataataagc ctggtggcct 540
tgaagctgga agtgtagcat ggtggaagtg cgggtttgac aggccgacag cgcagagcat 600
atcgaaaata cagctgaaaa aagatccgat tatacttgaa aaaaaggata atcaccgaag 660
caatggaaag ctccattcct gtttcccggt ggaagaaaaa tttctagcct ccatccctgc 720
gaacacatag gagaactttt tatcccttca ccgataaatt tatgcccgcg agaaatctgc 780
aaatacaata aatacaaatt aattatatta aattaatata aattgaaaaa caagatttaa 840
aattataata gatttctact ttagagttca gttagctatt ttataattag ttgtattgaa 900
attttagtaa aattttaaca tatcaataag ctaaaagaag attatggaac aagtatacgg 960
ggaattgggg g 971
<210> 3
<211> 2954
<212> DNA
<213> zea mays
<400> 3
actaccagca gcatgatcag agtgaggata gttgctactt caatggccta ggtttgataa 60
ctactgtcga tccatctgtc gacaattgtt tgtttcctct cacaattcac gtttctgccg 120
ccacttcttt gcacctaaca ttgcccgtgt cgctgttatt agttttgtgg ttttgcattg 180
tctgtatata gtctgatgag gctatagatt gagccttcaa aagtgtttcg ttgggcctct 240
tgttgaatgt actccaaagt ctcggtgcac catcagacgt attcctagaa tggcacaatc 300
tggctatcag aactggtagg tttagtccaa atgtaatgat gtgttctaaa gtagtcgggc 360
tgagtcaaac agcagcttct tctcttgttc aaaattttga acctggtaat gttgtcattt 420
catgatagat catagataca ttcttggttt cactatatct tagaaagtcc agccaacaga 480
agtactcaag tacaggtgaa cctttcagtt tagctggaga cctgggcagc agtgtacaaa 540
gtctaatcca cagctgtgac cctgtgagct gggggttggg cctgcctcgg aggggatcgt 600
gtcttttctg tttgtgcaat tatcagtgcc taaagaacat gtgttataac agttatacac 660
ggtcaattat tcaatccatc ttttaacgtg tgtttggttg tacgtataag aagggatcaa 720
agagggcggc cacattttct ataacatttg gatgagagtc acacgagaac gagatgaaca 780
ccgaagtaat tttttatgac agcatgatcc aaaaaaatcg agagaacggt gttatccccg 840
tctcatccta ttttgatctc aaaccaaaca cataattagt caatgagcac tgacttgatg 900
tagaagaact tggtacatat accaggaaat gactctgact tgctgagatg ccttgtagtc 960
cctcggtccc gtaaattata cagtagtatt taaacttcct cgcacaaagg aaaactattt 1020
gtttttgcat gccttgtaaa ttagctatca agtttttttt taaaaaaaac gacctttgaa 1080
aaccagtaag gaggactcgt tcggtattca gttttaaagt tcaaggttaa aaatcgaact 1140
gacgtgcaaa acaccctggg ggttaaaatc aaaacacaca aatttggaaa atgagcaggc 1200
atgacttatg ttgtgtccgt tgaagtgccg tggctccatg gcacggtgga actttacatt 1260
agtgcggtag tgtcactgtg gcagtaaagc ccacttattt tccattagag agagggagat 1320
taaaaacgtg gctttacaca ttctgaaact aattgtgagt ttgtgactct tggcttgcct 1380
gcagtgtccg cctgcacctt ctataagtac agtcgcgagc ctcagctata caaaccaact 1440
agcgcatagt atctcctgag ctccattcat catcccaagt cttcactggt cttagatcac 1500
atggcattcc ctcggctgtc cctcgccgtg ctcagctgcc tggcgctgct cgccgcgacg 1560
gccgcgcacc gggcgcccat cacggggccg tcgccctcgg ctcctcgcgg cctgacgaca 1620
ctggcggagc ggctggaggg cgcggagacg cagcagtgct gggaggcgct ggttgagatc 1680
aagtcgtgca cgggcgagat catcatcctc ttcatcaggg gcgaggcgtt cctggggccc 1740
ggctgctgcc gcgccatccg cgtcatcgag caaagctgct gggccgccga ctcgatgatg 1800
tctatcatcg gtttcacccc gcaggaaggg gacatgctca aggggtactg cgacgcgggc 1860
gacgacaacg ccaccggcgg gcagagcggt tcgccgccgc ctcgcggtgc tgatgacgcg 1920
gtcggtgctg tccgcggaag cttcgccgcc gtggcgggaa ggaagggctc catgcaccgt 1980
taggctatgg atcaggatgt ggatgtgttc gttcgatcgt ttccacgtcc aatctcgctg 2040
aataaattgt ctcgagaaag tttggctttg ccgagataaa taatagtgat aattcttact 2100
cctgctacaa actgttttcc ttgaagcaac tatgagcatc ttccatagat tcgcgacacg 2160
atttaaattt taaaaataac atttttaaaa aaatgtgtca cggttacaca actttttttt 2220
taacactagt tgcgccccgc gtccaagctt actccctgaa attgcattca aactctcgat 2280
tcatgtctgc ccttctcacc ttctgtgtgc ctgtgtgggc tcgacgtcta gtcgtcttcg 2340
gctcttcgcc tacatcagtc acctcctcac acgacgtgtc tgcgacacag gccgcggcat 2400
agagcacggg catgtagttt tgaacaagtg catgttgcta cctcgactat gatcatgcaa 2460
aatatttttt ttattattta tagaggttta aaataagaca tggaataata agcctggtgg 2520
ccttgaagct ggaagtgtag catggtggaa gtgcgggttt gacaggccga cagcgcagag 2580
catatcgaaa atacagctga aaaaagatcc gattatactt gaaaaaaagg ataatcaccg 2640
aagcaatgga aagctccatt cctgtttccc ggtggaagaa aaatttctag cctccatccc 2700
tgcgaacaca taggagaact ttttatccct tcaccgataa atttatgccc gcgagaaatc 2760
tgcaaataca ataaatacaa attaattata ttaaattaat ataaattgaa aaacaagatt 2820
taaaattata atagatttct actttagagt tcagttagct attttataat tagttgtatt 2880
gaaattttag taaaatttta acatatcaat aagctaaaag aagattatgg aacaagtata 2940
cggggaattg gggg 2954
<210> 4
<211> 3403
<212> DNA
<213> Artificial Sequence
<220>
<223> PhiYFP Gene Expression Cassette from pDAB129559
<400> 4
actaccagca gcatgatcag agtgaggata gttgctactt caatggccta ggtttgataa 60
ctactgtcga tccatctgtc gacaattgtt tgtttcctct cacaattcac gtttctgccg 120
ccacttcttt gcacctaaca ttgcccgtgt cgctgttatt agttttgtgg ttttgcattg 180
tctgtatata gtctgatgag gctatagatt gagccttcaa aagtgtttcg ttgggcctct 240
tgttgaatgt actccaaagt ctcggtgcac catcagacgt attcctagaa tggcacaatc 300
tggctatcag aactggtagg tttagtccaa atgtaatgat gtgttctaaa gtagtcgggc 360
tgagtcaaac agcagcttct tctcttgttc aaaattttga acctggtaat gttgtcattt 420
catgatagat catagataca ttcttggttt cactatatct tagaaagtcc agccaacaga 480
agtactcaag tacaggtgaa cctttcagtt tagctggaga cctgggcagc agtgtacaaa 540
gtctaatcca cagctgtgac cctgtgagct gggggttggg cctgcctcgg aggggatcgt 600
gtcttttctg tttgtgcaat tatcagtgcc taaagaacat gtgttataac agttatacac 660
ggtcaattat tcaatccatc ttttaacgtg tgtttggttg tacgtataag aagggatcaa 720
agagggcggc cacattttct ataacatttg gatgagagtc acacgagaac gagatgaaca 780
ccgaagtaat tttttatgac agcatgatcc aaaaaaatcg agagaacggt gttatccccg 840
tctcatccta ttttgatctc aaaccaaaca cataattagt caatgagcac tgacttgatg 900
tagaagaact tggtacatat accaggaaat gactctgact tgctgagatg ccttgtagtc 960
cctcggtccc gtaaattata cagtagtatt taaacttcct cgcacaaagg aaaactattt 1020
gtttttgcat gccttgtaaa ttagctatca agtttttttt taaaaaaaac gacctttgaa 1080
aaccagtaag gaggactcgt tcggtattca gttttaaagt tcaaggttaa aaatcgaact 1140
gacgtgcaaa acaccctggg ggttaaaatc aaaacacaca aatttggaaa atgagcaggc 1200
atgacttatg ttgtgtccgt tgaagtgccg tggctccatg gcacggtgga actttacatt 1260
agtgcggtag tgtcactgtg gcagtaaagc ccacttattt tccattagag agagggagat 1320
taaaaacgtg gctttacaca ttctgaaact aattgtgagt ttgtgactct tggcttgcct 1380
gcagtgtccg cctgcacctt ctataagtac agtcgcgagc ctcagctata caaaccaact 1440
agcgcatagt atctcctgag ctccattcat catcccaagt cttcactggt cttagatcac 1500
ccagaagaca ccatgtcatc tggagcactt ctctttcatg ggaagattcc ttacgttgtg 1560
gagatggaag ggaatgttga tggccacacc tttagcatac gtgggaaagg ctacggagat 1620
gcctcagtgg gaaaggtatg tttctgcttc tacctttgat atatatataa taattatcac 1680
taattagtag taatatagta tttcaagtat ttttttcaaa ataaaagaat gtagtatata 1740
gctattgctt ttctgtagtt tataagtgtg tatattttaa tttataactt ttctaatata 1800
tgaccaaaac atggtgatgt gcaggttgat gcacaattca tctgtactac cggagatgtt 1860
cctgtgcctt ggagcacact tgtcaccact ctcacctatg gagcacagtg ctttgccaag 1920
tatggtccag agttgaagga cttctacaag tcctgtatgc cagatggcta tgtgcaagag 1980
cgcacaatca cctttgaagg agatggcaac ttcaagacta gggctgaagt cacctttgag 2040
aatgggtctg tctacaatag ggtcaaactc aatggtcaag gcttcaagaa agatggtcac 2100
gtgttgggaa agaacttgga gttcaacttc actccccact gcctctacat ctggggagac 2160
caagccaacc acggtctcaa gtcagccttc aagatatgtc atgagattac tggcagcaaa 2220
ggcgacttca tagtggctga ccacacccag atgaacactc ccattggtgg aggtccagtt 2280
catgttccag agtatcatca tatgtcttac catgtgaaac tttccaaaga tgtgacagac 2340
cacagagaca acatgagctt gaaagaaact gtcagagctg ttgactgtcg caagacctac 2400
ctttgagtag ttagcttaat cacctagagc tcgctatgga tcaggatgtg gatgtgttcg 2460
ttcgatcgtt tccacgtcca atctcgctga ataaattgtc tcgagaaagt ttggctttgc 2520
cgagataaat aatagtgata attcttactc ctgctacaaa ctgttttcct tgaagcaact 2580
atgagcatct tccatagatt cgcgacacga tttaaatttt aaaaataaca tttttaaaaa 2640
aatgtgtcac ggttacacaa cttttttttt aacactagtt gcgccccgcg tccaagctta 2700
ctccctgaaa ttgcattcaa actctcgatt catgtctgcc cttctcacct tctgtgtgcc 2760
tgtgtgggct cgacgtctag tcgtcttcgg ctcttcgcct acatcagtca cctcctcaca 2820
cgacgtgtct gcgacacagg ccgcggcata gagcacgggc atgtagtttt gaacaagtgc 2880
atgttgctac ctcgactatg atcatgcaaa atattttttt tattatttat agaggtttaa 2940
aataagacat ggaataataa gcctggtggc cttgaagctg gaagtgtagc atggtggaag 3000
tgcgggtttg acaggccgac agcgcagagc atatcgaaaa tacagctgaa aaaagatccg 3060
attatacttg aaaaaaagga taatcaccga agcaatggaa agctccattc ctgtttcccg 3120
gtggaagaaa aatttctagc ctccatccct gcgaacacat aggagaactt tttatccctt 3180
caccgataaa tttatgcccg cgagaaatct gcaaatacaa taaatacaaa ttaattatat 3240
taaattaata taaattgaaa aacaagattt aaaattataa tagatttcta ctttagagtt 3300
cagttagcta ttttataatt agttgtattg aaattttagt aaaattttaa catatcaata 3360
agctaaaaga agattatgga acaagtatac ggggaattgg ggg 3403
<210> 5
<211> 3307
<212> DNA
<213> artificial sequence
<220>
<223> AAD-1 Gene Expression Cassette from pDAB129559
<400> 5
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaatagttt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840
ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900
caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960
cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccccct ctctaccttc 1020
tctagatcgg cgttccggtc catgcatggt tagggcccgg tagttctact tctgttcatg 1080
tttgtgttag atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga 1140
cctgtacgtc agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg 1200
ggatggctct agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca 1260
tagggtttgg tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt 1320
catcttttca tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt 1380
ctagatcgga gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt 1440
atgtgtgtgc catacatatt catagttacg aattgaagat gatggatgga aatatcgatc 1500
taggataggt atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt 1560
tcgcttggtt gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt 1620
agaatactgt ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca 1680
tacatcttca tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca 1740
tgttgatgtg ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg 1800
ctctaacctt gagtacctat ctattataat aaacaagtat gttttataat tatttcgatc 1860
ttgatatact tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct 1920
tcatacgcta tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg 1980
tgttacttct gcaggtacag tagttagttg aggtaccgga tccacacgac accatggctc 2040
atgctgccct cagccctctc tcccaacgct ttgagagaat agctgtccag ccactcactg 2100
gtgtccttgg tgctgagatc actggagtgg acttgaggga accacttgat gacagcacct 2160
ggaatgagat attggatgcc ttccacactt accaagtcat ctactttcct ggccaagcaa 2220
tcaccaatga gcagcacatt gcattctcaa gaaggtttgg accagttgat ccagtgcctc 2280
ttctcaagag cattgaaggc tatccagagg ttcagatgat ccgcagagaa gccaatgagt 2340
ctggaagggt gattggtgat gactggcaca cagactccac tttccttgat gcacctccag 2400
ctgctgttgt gatgagggcc atagatgttc ctgagcatgg cggagacact gggttccttt 2460
caatgtacac agcttgggag accttgtctc caaccatgca agccaccatc gaagggctca 2520
acgttgtgca ctctgccaca cgtgtgttcg gttccctcta ccaagcacag aaccgtcgct 2580
tcagcaacac ctcagtcaag gtgatggatg ttgatgctgg tgacagagag acagtccatc 2640
ccttggttgt gactcatcct ggctctggaa ggaaaggcct ttatgtgaat caagtctact 2700
gtcagagaat tgagggcatg acagatgcag aatcaaagcc attgcttcag ttcctctatg 2760
agcatgccac cagatttgac ttcacttgcc gtgtgaggtg gaagaaagac caagtccttg 2820
tctgggacaa cttgtgcacc atgcaccgtg ctgttcctga ctatgctggc aagttcagat 2880
acttgactcg caccacagtt ggtggagtta ggcctgcccg ctgagtagtt agcttaatca 2940
cctagagctc ggtcgcagcg tgtgcgtgtc cgtcgtacgt tctggccggc cgggccttgg 3000
gcgcgcgatc agaagcgttg cgttggcgtg tgtgtgcttc tggtttgctt taattttacc 3060
aagtttgttt caaggtggat cgcgtggtca aggcccgtgt gctttaaaga cccaccggca 3120
ctggcagtga gtgttgctgc ttgtgtaggc tttggtacgt atgggcttta tttgcttctg 3180
gatgttgtgt actacttggg tttgttgaat tattatgagc agttgcgtat tgtaattcag 3240
ctgggctacc tggacattgt tatgtattaa taaatgcttt gctttcttct aaagatcttt 3300
aagtgct 3307
<210> 6
<211> 483
<212> DNA
<213> zea mays
<400> 6
atggcattcc ctcggctgtc cctcgccgtg ctcagctgcc tggcgctgct cgccgcgacg 60
gccgcgcacc gggcgcccat cacggggccg tcgccctcgg ctcctcgcgg cctgacgaca 120
ctggcggagc ggctggaggg cgcggagacg cagcagtgct gggaggcgct ggttgagatc 180
aagtcgtgca cgggcgagat catcatcctc ttcatcaggg gcgaggcgtt cctggggccc 240
ggctgctgcc gcgccatccg cgtcatcgag caaagctgct gggccgccga ctcgatgatg 300
tctatcatcg gtttcacccc gcaggaaggg gacatgctca aggggtactg cgacgcgggc 360
gacgacaacg ccaccggcgg gcagagcggt tcgccgccgc ctcgcggtgc tgatgacgcg 420
gtcggtgctg tccgcggaag cttcgccgcc gtggcgggaa ggaagggctc catgcaccgt 480
tag 483
<210> 7
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 7
tgttcggttc cctctaccaa 20
<210> 8
<211> 24
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 8
cacagaaccg tcgcttcagc aaca 24
<210> 9
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 9
caacatccat caccttgact ga 22
<210> 10
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 10
cgtgttggga aagaacttgg a 21
<210> 11
<211> 15
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 11
cactccccac tgcct 15
<210> 12
<211> 18
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 12
ccgtggttgg cttggtct 18
<210> 13
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequence
<400> 13
tggcggacga cgacttgt 18
<210> 14
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> Primer Sequence
<400> 14
cgagcagacc gccgtgtact t 21
<210> 15
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequence
<400> 15
aaagtttgga ggctgccgt 19
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequence
<400> 16
ctgcaacatc aatgctaagt ttga 24
<210> 17
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequecne
<400> 17
cgacatatca ggctgca 17
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequence
<400> 18
agcctttcgg atccattgaa 20
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Sequence
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, or t
<400> 19
tttttttttt tttttttttt vn 22

Claims (18)

1.一种核酸载体,其包含启动子,所述启动子可操作连接至
a)多接头序列;
b)非玉米卵细胞异源编码序列;或
c)a)和b)的组合;
其中所述启动子由SEQ ID NO:1的多核苷酸序列组成。
2.权利要求1的核酸载体,其中所述启动子的长度为1,500bp。
3.权利要求1的核酸载体,其进一步包含编码可选择标志物的序列。
4.权利要求1的核酸载体,其中所述启动子与异源编码序列可操作连接。
5.权利要求4的核酸载体,其中所述异源编码序列编码可选择标志物。
6.权利要求4的核酸载体,其中所述异源编码序列编码杀虫抗性蛋白、小RNA分子、位点特异性核酸酶蛋白、除草剂耐受性蛋白、氮利用效率蛋白、水分利用效率蛋白、营养品质蛋白或DNA结合蛋白。
7.权利要求1的核酸载体,其进一步包含3'非翻译多核苷酸序列。
8.权利要求1的核酸载体,其进一步包含5'非翻译多核苷酸序列。
9.权利要求1的核酸载体,其进一步包含内含子序列。
10.权利要求1的核酸载体,其中所述启动子具有胚细胞优选表达。
11.一种产生转基因植物的方法,所述转基因植物包含可操作连接于异源编码序列的SEQ IDNO:1的多核苷酸序列。
12.权利要求11的方法,其中所述植物选自下组:玉米、小麦、水稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、拟南芥、烟草、向日葵和卡诺拉。
13.权利要求12的方法,其中所述植物是玉米。
14.权利要求11的方法,其中所述异源编码序列插入所述植物的基因组中。
15.权利要求11的方法,其中启动子由SEQ ID NO:1的多核苷酸序列组成,并且该启动子与异源编码序列可操作连接。
16.权利要求15的方法,其进一步包含3'非翻译序列。
17.权利要求15的方法,其中所述异源编码序列具有胚细胞组织优选表达。
18.权利要求15的方法,其中所述启动子的长度为1,500bp。
CN201780073306.1A 2016-10-03 2017-09-08 用于转基因表达的植物启动子 Active CN110291199B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662403238P 2016-10-03 2016-10-03
US62/403238 2016-10-03
PCT/US2017/050581 WO2018067264A1 (en) 2016-10-03 2017-09-08 Plant promoter for transgene expression

Publications (2)

Publication Number Publication Date
CN110291199A CN110291199A (zh) 2019-09-27
CN110291199B true CN110291199B (zh) 2023-12-22

Family

ID=61757846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780073306.1A Active CN110291199B (zh) 2016-10-03 2017-09-08 用于转基因表达的植物启动子

Country Status (9)

Country Link
US (1) US10400246B2 (zh)
EP (1) EP3519574B1 (zh)
CN (1) CN110291199B (zh)
AR (1) AR109791A1 (zh)
BR (1) BR112019005600A2 (zh)
CA (1) CA3038508A1 (zh)
TW (1) TW201814046A (zh)
WO (1) WO2018067264A1 (zh)
ZA (1) ZA201901755B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022087616A1 (en) 2020-10-21 2022-04-28 Pioneer Hi-Bred International, Inc. Parthenogenesis factors and methods of using same
EP4232586A1 (en) 2020-10-21 2023-08-30 Pioneer Hi-Bred International, Inc. Doubled haploid inducer
WO2023183918A1 (en) 2022-03-25 2023-09-28 Pioneer Hi-Bred International, Inc. Methods of parthenogenic haploid induction and haploid chromosome doubling

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015103353A1 (en) * 2013-12-31 2015-07-09 Dow Agrosciences Llc Novel maize ubiquitin promoters
CA2933042A1 (en) * 2014-01-23 2015-07-30 Dow Agrosciences Llc Zea mays regulatory elements and uses thereof
CN106029882A (zh) * 2013-12-31 2016-10-12 美国陶氏益农公司 新型玉米泛素启动子

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5750871A (en) 1986-05-29 1998-05-12 Calgene, Inc. Transformation and foreign gene expression in Brassica species
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
ES2039474T3 (es) 1986-12-05 1993-10-01 Ciba-Geigy Ag Procedimineto mejorado para la transformacion de protoplastos vegetales.
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5244802A (en) 1987-11-18 1993-09-14 Phytogen Regeneration of cotton
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
US7060876B2 (en) 1992-07-07 2006-06-13 Japan Tobacco Inc. Method for transforming monocotyledons
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
PT672752E (pt) 1993-09-03 2004-10-29 Japan Tobacco Inc Processo de transformacao de uma monocotiledonea com a utilizacao de um escutelode um embriao imaturo
US5635055A (en) 1994-07-19 1997-06-03 Exxon Research & Engineering Company Membrane process for increasing conversion of catalytic cracking or thermal cracking units (law011)
US5846797A (en) 1995-10-04 1998-12-08 Calgene, Inc. Cotton transformation
DE69638032D1 (de) 1995-10-13 2009-11-05 Dow Agrosciences Llc Modifiziertes bacillus thuringiensis gen zur kontrolle von lepidoptera in pflanzen
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US9029523B2 (en) 2000-04-26 2015-05-12 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
WO2001044457A2 (en) * 1999-12-16 2001-06-21 Monsanto Technology Llc Dna constructs for expression of heterologous polypeptides in plants
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
JP2005500061A (ja) 2001-08-20 2005-01-06 ザ スクリップス リサーチ インスティテュート Cnnについての亜鉛フィンガー結合ドメイン
CA2490274A1 (en) 2002-06-27 2004-01-08 Dow Agrosciences Llc Use of regulatory sequences in transgenic plants
PL2308977T5 (pl) 2004-04-30 2017-10-31 Dow Agrosciences Llc Nowy gen odporności na herbicydy
US20060141495A1 (en) * 2004-09-01 2006-06-29 Kunsheng Wu Polymorphic markers and methods of genotyping corn
EP2341135A3 (en) 2005-10-18 2011-10-12 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
EP3241430B1 (en) 2005-10-28 2020-08-26 Dow AgroSciences LLC Novel herbicide resistance genes
ATE529521T1 (de) * 2006-02-13 2011-11-15 Adelaide Res & Innovation Pty Pflanzliche eizellentranskriptionskontrollsequenzen
US7838729B2 (en) 2007-02-26 2010-11-23 Monsanto Technology Llc Chloroplast transit peptides for efficient targeting of DMO and uses thereof
CA2701636C (en) 2007-10-05 2019-10-15 Dow Agrosciences Llc Methods for transferring molecular substances into plant cells
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
WO2011146121A1 (en) 2010-05-17 2011-11-24 Sangamo Biosciences, Inc. Novel dna-binding proteins and uses thereof
TW201144442A (en) 2010-05-17 2011-12-16 Dow Agrosciences Llc Production of DHA and other LC-PUFAs in plants
TW201307553A (zh) 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
US20130180009A1 (en) * 2012-01-06 2013-07-11 Pioneer Hi Bred International Inc Compositions and Methods for Expression of a Sequence in a Reproductive Tissue of a Plant
US20130180007A1 (en) 2012-01-06 2013-07-11 Pioneer Hi Bred International Inc Somatic Ovule Specific Promoters and Methods of Use
CA2863400C (en) 2012-02-01 2022-06-14 Dow Agrosciences Llc Synthetic chloroplast transit peptides
BR102014025574A2 (pt) * 2013-10-15 2015-09-29 Dow Agrosciences Llc elementos regulatórios de zea mays e usos dos mesmos
WO2016092570A2 (en) * 2014-12-10 2016-06-16 Council Of Scientific & Industrial Research A novel embryo sac specific bidirectional promoter from arabidopsis
US10648951B2 (en) 2017-11-14 2020-05-12 Ge Sensing & Inspection Technologies Gmbh Classification of ultrasonic indications using pattern recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015103353A1 (en) * 2013-12-31 2015-07-09 Dow Agrosciences Llc Novel maize ubiquitin promoters
CN106029882A (zh) * 2013-12-31 2016-10-12 美国陶氏益农公司 新型玉米泛素启动子
CA2933042A1 (en) * 2014-01-23 2015-07-30 Dow Agrosciences Llc Zea mays regulatory elements and uses thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ACCESSION No.:AC204854.6,Zea mays cultivar B73 chromosome 9 clone CH201-317F6, *** SEQUENCING IN PROGRESS ***, 15 unordered pieces;Wilson,R.K.等;《GenBank》;20140913;Features和Origin部分 *
ACCESSION No.:AC205006.4,Zea mays cultivar B73 chromosome 9 clone CH201-544I16, *** SEQUENCING IN PROGRESS ***, 17 unordered pieces;Wilson,R.K.等;《GenBank》;20130923;Features和Origin部分 *

Also Published As

Publication number Publication date
EP3519574B1 (en) 2022-01-19
WO2018067264A1 (en) 2018-04-12
EP3519574A1 (en) 2019-08-07
BR112019005600A2 (pt) 2019-07-30
EP3519574A4 (en) 2020-04-22
CA3038508A1 (en) 2018-04-12
US10400246B2 (en) 2019-09-03
AR109791A1 (es) 2019-01-23
TW201814046A (zh) 2018-04-16
US20180094273A1 (en) 2018-04-05
ZA201901755B (en) 2020-10-28
CN110291199A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
US11814633B2 (en) Plant terminator for transgene expression
US20170081676A1 (en) Plant promoter and 3&#39; utr for transgene expression
CN110291199B (zh) 用于转基因表达的植物启动子
US10443065B2 (en) Plant promotor and 3′ UTR for transgene expression
US10294485B2 (en) Plant promoter and 3′ UTR for transgene expression
CN111278276B (zh) 用于转基因表达的植物启动子
CN109996436B (zh) 用于转基因表达的植物启动子
US20220098606A1 (en) Plant promoter for transgene expression
US10968455B2 (en) Plant promoter and 3′UTR for transgene expression
US10280429B2 (en) Plant promoter for transgene expression
US20200277621A1 (en) Use of a maize untranslated region for transgene expression in plants
CN109415420B (zh) 用于转基因表达的植物启动子和3’utr
US20200299708A1 (en) Plant pathogenesis-related protein promoter for transgene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant