CN111386035B - 用于转基因表达的植物启动子 - Google Patents

用于转基因表达的植物启动子 Download PDF

Info

Publication number
CN111386035B
CN111386035B CN201880073592.6A CN201880073592A CN111386035B CN 111386035 B CN111386035 B CN 111386035B CN 201880073592 A CN201880073592 A CN 201880073592A CN 111386035 B CN111386035 B CN 111386035B
Authority
CN
China
Prior art keywords
sequence
plant
gmpsid2
gene
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880073592.6A
Other languages
English (en)
Other versions
CN111386035A (zh
Inventor
L·西多伦科
M·C·拉森
G·安东尼
S·斯里拉姆
J·H·巴特勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kedihua Agricultural Technology Co ltd
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN111386035A publication Critical patent/CN111386035A/zh
Application granted granted Critical
Publication of CN111386035B publication Critical patent/CN111386035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本公开涉及用于使用来自GmPSID2基因的启动子来促进植物或植物细胞中核苷酸序列转录的组合物和方法。一些实施例涉及来自在植物中起作用以促进可操作地连接的核苷酸序列的转录的来自GmPSID2基因的启动子或5'UTR。其他实施例涉及来自在植物中起作用以促进可操作地连接的核苷酸序列的转录的来自GmPSID2基因的3'UTR或终止子。

Description

用于转基因表达的植物启动子
通过引用并入
本申请要求于2017年11月16日提交的美国临时专利申请序列号62/587024的权益,其通过引用以其整体明确地并入本文。
通过引用以其整体并入的是与此同时提交且如下标识的计算机可读核苷酸/氨基酸序列表:创建于2017年11月16日的名称为“79350-US-PSP2_20170815_Sequence_ST25”的一个28.3KB的ASCII(文本)文件。
背景技术
许多植物物种能够被转基因转化以引入农学上希望的性状或特征。开发和/或修饰所得植物物种使其具有特定的希望的性状。通常,希望的性状包括,例如,改善营养价值质量、增加产量、赋予有害生物抗性或疾病抗性、增加干旱和胁迫耐受性、改善园艺品质(例如色素沉着和生长)、赋予除草剂耐受性、使得能够由植物产生工业上有用的化合物和/或材料、和/或使得能够产生药物。
通过植物转化技术产生包含堆叠在单个基因组基因座的多个转基因的转基因植物物种。植物转化技术导致将转基因引入植物细胞,回收在植物基因组中包含稳定地整合的转基因拷贝的可育转基因植物,并随后通过转录和翻译的转基因表达得到具有希望的性状和表型的转基因植物。然而,希望允许产生转基因植物物种以高表达多个工程化为性状堆叠的转基因的新颖基因调节元件。
同样,希望允许转基因在植物的特定组织或器官内表达的新颖基因调节元件。例如,增加植物对土壤传播的病原体感染的抵抗力,可以通过用病原体抗性基因转化植物基因组,从而使病原体抗性蛋白在植物根部内稳健表达来实现。可替代地,可能希望在处于特定生长或发育阶段(诸如像细胞分裂或伸长)的植物组织中表达转基因。此外,可能希望在植物的叶和茎组织中表达转基因以提供对除草剂的耐受性或对地面上昆虫和有害生物的抗性。
因此,需要能够驱动特定植物组织中转基因表达希望的水平的新基因调节元件。
发明内容
在本公开的实施例中,本公开涉及包含可操作地连接到以下的启动子的核酸载体:多接头序列;非GmPSID2异源编码序列;其中所述启动子包含与SEQ ID NO:2具有至少95%序列同一性的多核苷酸序列。在进一步的实施例中,所述启动子的长度为821bp。在其他实施例中,所述启动子由与SEQ ID NO:2具有至少95%序列同一性的多核苷酸序列组成。在另外的实施例中,所述启动子可操作地连接到异源编码序列。因此,所述异源编码序列编码选择性标记蛋白、杀昆虫抗性蛋白、除草剂耐受性蛋白、氮利用效率蛋白、水利用效率蛋白、小RNA分子、营养品质蛋白、或DNA结合蛋白。在其他实施例中,所述核酸载体包含终止子多核苷酸序列。在另外的实施例中,所述核酸载体包含3'非翻译多核苷酸序列。在另外的实施例中,所述核酸载体包含5'非翻译多核苷酸序列。在另外的实施例中,所述核酸载体包含内含子序列。在另外的实施例中,所述启动子具有组织偏好性表达。在进一步的实施例中,所述核酸载体包含与SEQ ID NO:2具有至少95%序列同一性的、可操作地连接到异源编码序列的多核苷酸序列。在进一步的实施例中,所述植物选自下组,该组由以下组成:玉蜀黍(Zea mays)、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆(Glycine max)、棉花、拟南芥(Arabidopsis)、烟草、向日葵、和卡诺拉油菜。在又另一个实施例中,所述植物是大豆。在一些实施例中,将所述异源编码序列插入所述植物的基因组中。在其他实施例中,所述启动子包含与SEQ ID NO:2具有至少95%序列同一性的多核苷酸序列,并且所述启动子可操作地连接到异源编码序列。在另外的实施例中,所述转基因植物包含3'非翻译序列。在进一步的实施例中,所述异源编码序列具有组织偏好性表达。在另外的实施例中,所述转基因植物包含长度为821bp的所述启动子。
在本公开的实施例中,本公开涉及一种用于产生转基因植物细胞的方法,所述方法包括以下步骤:用基因表达盒转化植物细胞,所述基因表达盒包含可操作地连接到至少一个目的多核苷酸序列的如权利要求1所述的GmPSID2启动子;分离包含所述基因表达盒的经转化的植物细胞;以及产生转基因植物细胞,所述转基因植物细胞包含可操作地连接到至少一个目的多核苷酸序列的如权利要求1所述的GmPSID2启动子。在其他实施例中,用植物转化方法进行植物细胞的转化。在一些方面,该植物转化方法选自下组,该组由以下组成:农杆菌属(Agrobacterium)介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法、和脂质体转化方法。在进一步的实施例中,所述目的多核苷酸序列在植物细胞中表达。在其他实施例中,所述目的多核苷酸序列被稳定地整合到所述转基因植物细胞的基因组中。在进一步的实施例中,所述方法包括将所述转基因植物细胞再生为转基因植物;以及获得所述转基因植物,其中所述转基因植物包含基因表达盒,所述基因表达盒包含可操作地连接到至少一个目的多核苷酸序列的如权利要求1所述的GmPSID2启动子。在其他实施例中,所述转基因植物细胞是单子叶转基因植物细胞或双子叶转基因植物细胞。双子叶转基因植物细胞的实例包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉油菜植物细胞、和棉花植物细胞。单子叶转基因植物细胞的实例包括玉蜀黍植物细胞、稻植物细胞、和小麦植物细胞。在一些实施例中,所述GmPSID2启动子包含SEQ ID NO:2的多核苷酸。在其他实施例中,所述GmPSID2启动子包含可操作地连接到SEQ ID NO:2的3'末端的目的第一多核苷酸序列。在另外的实施例中,所述方法包括将可操作地连接到GmPSID2启动子的目的多核苷酸序列引入所述植物细胞中。在进一步的实施例中,通过植物转化方法将可操作地连接到所述GmPSID2启动子的目的多核苷酸序列引入所述植物细胞中。植物转化方法的实例包括农杆菌属介导的转化方法、基因枪转化方法、碳化硅转化方法、原生质体转化方法、和脂质体转化方法。在进一步的实施例中,所述目的多核苷酸序列在胚胎细胞组织中表达。在另外的实施例中,所述目的多核苷酸序列被稳定地整合到所述植物细胞的基因组中。在一些实施例中,所述转基因植物细胞是单子叶植物细胞或双子叶植物细胞。双子叶植物细胞的实例包括拟南芥植物细胞、烟草植物细胞、大豆植物细胞、卡诺拉油菜植物细胞、和棉花植物细胞。单子叶植物细胞的实例包括玉蜀黍植物细胞、稻植物细胞、和小麦植物细胞。
在本公开的实施例中,本公开涉及转基因植物细胞,其包含GmPSID2启动子。在其他实施例中,所述转基因植物细胞包含转基因事件。在进一步的实施例中,所述转基因事件包含农学性状。农学性状的实例可包括杀昆虫抗性性状、除草剂耐受性性状、氮利用效率性状、水利用效率性状、营养品质性状、DNA结合性状、选择性标记性状、小RNA性状、或其任何组合。在进一步的实施例中,所述农学性状包含除草剂耐受性状。在该实施例的一方面,所述除草剂耐受性状包含aad-1编码序列。在又另一个实施例中,所述转基因植物细胞产生商品产品。商品产品的实例包括蛋白质浓缩物、蛋白质分离物、谷物、粗粉、面粉、油、或纤维。在进一步的实施例中,所述转基因植物细胞选自由双子叶植物细胞或单子叶植物细胞组成的组。例如,所述双子叶植物细胞是大豆植物细胞。在另外的实施例中,所述GmPSID2启动子包含与SEQ ID NO:2的多核苷酸具有至少95%序列同一性的多核苷酸。在其他实施例中,所述GmPSID2启动子的长度为821bp。在一些实施例中,所述GmPSID2启动子由SEQ ID NO:2组成。在随后的实施例中,所述GmPSID2启动子包含可操作地连接到SEQ ID NO:2的3′末端的目的第一多核苷酸序列。在其他实施例中,所述农学性状在植物组织中表达。在进一步的实施例中,分离的多核苷酸包含与SEQ ID NO:2的多核苷酸具有至少95%序列同一性的核酸序列。在另外的实施例中,所述分离的多核苷酸驱动组织偏好性表达。在其他实施例中,所述分离的多核苷酸包含在植物细胞内的表达活性。在一些实施例中,所述分离的多核苷酸包含编码多肽的可读框多核苷酸;以及终止序列。在随后的实施例中,SEQ ID NO:2的多核苷酸的长度为821bp。
在本公开的实施例中,本公开涉及基因表达盒,所述基因表达盒包含可操作地连接到异源编码序列的启动子,其中所述启动子包含与SEQ ID NO:2具有至少95%序列同一性的多核苷酸。在一些实施例中,所述多核苷酸与SEQ ID NO:2具有至少95%序列同一性。在另外的实施例中,所述基因表达盒包含内含子。在进一步的实施例中,所述基因表达盒包含5’UTR。在随后的实施例中,所述启动子具有组织偏好性表达。在其他实施例中,所述启动子与编码多肽或小RNA基因的异源编码序列可操作地连接。编码的多肽或小RNA基因的实例包括赋予杀昆虫抗性、除草剂耐受性的异源编码序列、赋予氮利用效率的核酸、赋予水利用效率的核酸、赋予营养品质的核酸、编码DNA结合蛋白的核酸、和编码选择性标记的核酸。在另外的实施例中,所述基因表达盒包含3'非翻译区。例如,所述3'非翻译区与SEQ ID NO:4具有至少95%序列同一性。在另外的实施例中,所述基因表达盒包含5'非翻译区。例如,所述5'非翻译区与SEQ ID NO:3具有至少95%序列同一性。在另外的实施例中,所述基因表达盒包含终止子区。例如,所述终止子区与SEQ ID NO:5具有至少95%序列同一性。在其他实施例中,本公开涉及包含基因表达盒的重组载体,其中所述载体选自由质粒、黏粒、细菌人工染色体、病毒和噬菌体组成的组。在其他实施例中,本公开涉及包含基因表达盒的转基因细胞。在该实施例的一方面,所述转基因细胞是转基因植物细胞。在该实施例的其他方面,所述转基因植物包含转基因植物细胞。在进一步的方面,所述转基因植物是单子叶植物或双子叶植物。单子叶植物的实例包括玉米植物、稻植物和小麦植物。在所述实施例的进一步的方面,所述转基因植物产生包含所述基因表达盒的种子。在其他实施例中,所述启动子是组织偏好性启动子。在一些实施例中,所述组织偏好性启动子是组织偏好性启动子。
根据以下参考附图进行的几个实施例的详细描述,前述特征和其他特征将变得更加显而易见。
附图说明
图1.提供了线性合成DNA片段的图,所述线性合成DNA片段含有通过多克隆位点连接的GmPSID2启动子、5'UTR和终止子。
具体实施方式
I.几个实施例的概述
转基因植物产品的开发变得越来越复杂。商业上可行的转基因植物现在需要将多个转基因堆叠到单个基因座中。用于基础研究或生物技术应用的植物启动子和3'UTR/终止子通常是单向的,仅指导已在其3'端(下游)(对于所述启动子)或在其5'端(上游)(对于所述3'UTR/终止子)融合的一个基因。因此,每个转基因/异源编码序列通常需要启动子和3'UTR/终止子才能表达,其中需要多个调节元件来表达一个基因堆叠件内的多个转基因。随着基因堆叠件中转基因数量的增加,通常使用相同的启动子和/或3'UTR/终止子来获得不同转基因的表达模式的最佳水平。获得最佳水平的转基因/异源编码序列表达对于产生单个多基因性状是必要的。不幸的是,已知由相同启动子和/或3'UTR/终止子驱动的多基因构建体会导致基因沉默,从而导致田野中的有效转基因产品较少。重复的启动子和/或3'UTR/终止子元件可能导致基于同源性的基因沉默。另外,转基因/异源编码序列内的重复序列可能导致基因座内基因同源重组,从而导致多核苷酸重排。转基因的沉默和重排将可能对产生以表达转基因的转基因植物的性能具有不希望的影响。此外,由于启动子重复而引起的过量的转录因子(TF)结合位点可引起内源性TF的耗尽,从而导致转录失活。考虑到需要将多个基因引入植物中以进行代谢工程和性状堆叠,需要多种启动子和/或3'UTR/终止子来开发驱动多个基因表达的转基因作物。
启动子和/或3'UTR/终止子鉴定中的一个特定问题是需要鉴定与其他植物组织中未表达的植物中特定细胞类型、发育阶段和/或功能有关的组织特异性/偏好性启动子。组织特异性(即组织偏好性)或器官特异性启动子驱动基因在某些组织中的表达,如在植物的籽粒(kernel)、根、叶或绒毡层中。可以从观察基因的表达来初步鉴定组织和发育阶段特异性启动子和/或3'UTR/终止子,所述基因在植物发育过程中的特定组织或特定时间段表达。这些组织特异性/偏好性启动子和/或3'UTR/终止子对于转基因植物工业中的某些应用是必需的,并且是理想的,因为它们允许异源基因在组织中和/或以发育阶段选择性方式特异性表达,表明所述异源基因在多种器官、组织和/或时间差异表达,但不在其他不希望的组织中表达。例如,增加植物对土壤传播的病原体感染的抵抗力,可以通过用病原体抗性基因转化植物基因组,从而使病原体抗性蛋白在植物根部内稳健表达来实现。可替代地,可能希望在处于特定生长或发育阶段(诸如像细胞分裂或伸长)的植物组织中表达转基因/异源编码序列。另一应用是希望使用组织特异性/偏好性启动子和/或3'UTR/终止子来限制转基因的表达,所述转基因编码特定组织类型(如发育中的薄壁组织细胞)中的农学性状。同样地,在鉴定启动子和/或3'UTR/终止子中的一个具体问题是如何鉴定启动子,以及如何将鉴定的启动子与细胞的发育特性联系起来以进行特异性/偏好性组织表达。
有关启动子鉴定的另一个问题是需要克隆所有相关的顺式作用和反式激活转录控制元件,使克隆的DNA片段以所需的特异性表达模式驱动转录。假定这样的控制元件位于翻译起始或起始位点的远侧,则选择包含启动子的多核苷酸的大小对于提供启动子多核苷酸序列的表达水平和表达模式是重要的。已知启动子长度包括功能信息,并且已经显示不同基因具有比基因组中其他基因的启动子更长或更短的启动子。阐明启动子的转录起始位点并预测启动子区域中的功能基因元件具有挑战性。进一步增加了挑战的是调节基序以及顺式和反式调节元件的复杂性、多样性和固有的简并性质(Blanchette,Mathieu等人“Genome-wide computational prediction of transcriptional regulatory modulesreveals new insights into human gene expression.[转录调节模块的全基因组计算预测揭示了对人类基因表达的新见解]”Genome research[基因组研究]16.5(2006):656-668)。顺式和反式调节元件位于启动子的远端,它们调节基因的空间和时间表达,使其仅在所需的位点和特定的时间出现(Porto,Milena Silva等人“Plant promoters:an approachof structure and function.[植物启动子:一种结构和功能的方法]”Molecularbiotechnology[分子生物技术]56.1(2014):38-49)。因此,鉴定启动子调节元件需要获得含有必需的顺式和反式调节元件的特定大小的合适序列,其将导致以希望的方式驱动可操作地连接的转基因/异源编码序列的表达。
提供了通过使用GmPSID2基因调节元件在植物中表达转基因来克服此类问题的方法和组合物。
II.术语和缩写
在整个申请中,使用了许多术语。为了提供对说明书和权利要求书的明确和一致的理解(包括在对此类术语给定的范围内),提供了以下定义。
如本文所使用的,冠词“一种/一个(a/an)”和“所述(the)”包括复数个指示物,除非上下文中另外明确且不含糊地指明。
如本文所使用的,术语“分离的”意指已经从其自然环境中除去,或从首次形成该化合物时存在的其他化合物中除去。术语“分离的”涵盖从自然来源分离的材料以及通过在宿主细胞中重组表达制备后回收的材料(例如,核酸和蛋白质),或化学合成的化合物,如核酸分子、蛋白质和肽。
如本文所使用的,术语“纯化的”涉及分子或化合物的分离,所述分子或化合物以基本上不含通常与在天然或自然环境中的分子或化合物相关的污染物,或者基本上在相对于化合物初次形成时存在的其他化合物的浓缩中富集的,并且意指由于与原始组合物中的其他组分分离而纯度提高了。本文使用的术语“纯化的核酸”来描述已经与其他生物化合物分离的、分离产生的或纯化的核酸序列,所述其他生物化合物包括但不限于多肽、脂质和碳水化合物,同时影响组分中的化学或功能改变组分(例如,可以通过去除蛋白质污染物并断开将核酸与染色体中其余DNA连接的化学键,从染色体上纯化核酸)。
如本文所使用的,术语“合成的”是指通过化学合成作为体外过程产生的多核苷酸(即,DNA或RNA)分子。例如,可以在EppendorfTM管内的反应期间产生合成DNA,使得合成DNA由DNA或RNA的天然链酶促产生。可以利用其他实验室方法来合成多核苷酸序列。寡核苷酸可以在寡核苷酸合成仪上通过使用亚磷酰胺的固相合成化学合成。合成的寡核苷酸可以作为复合物彼此退火,从而产生“合成的”多核苷酸。化学合成多核苷酸的其他方法是本领域已知的,并且可以容易地实现以用于本公开。
如本文所使用的,术语“约”是指大于或小于所陈述的值或值的范围的百分之十,但并非旨在仅针对此更宽泛的定义来指定任何值或值的范围。术语“约”之后的每个值或值的范围也旨在涵盖所述绝对值或值的范围的实施例。
为了本公开的目的,“基因”包括编码基因产物的DNA区域(参见下文),以及调节该基因产物的产生的所有DNA区域,无论此类调节序列是否与编码和/或转录序列相邻。因此,基因包括但不限于启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点、内含子和基因座控制区。
如本文所使用的,术语“天然的”或“自然的”定义了发现于自然界中的一种状况。“天然DNA序列”是自然界中存在的DNA序列,其是通过自然手段或传统育种技术产生的,但不是通过基因工程产生的(例如,使用分子生物学/转化技术)。
如本文所使用的,“转基因”被定义为编码基因产物的核酸序列,所述基因产物包括例如但不限于mRNA。在一个实施例中,所述转基因/异源编码序列是外源核酸,其中通过基因工程将转基因/异源编码序列引入宿主细胞(或其后代),其中通常找不到转基因/异源编码序列。在一个实例中,转基因/异源编码序列编码工业上或药学上有用的化合物,或编码希望的农艺性状(例如,除草剂抗性基因)的基因。在又另一个实例中,转基因/异源编码序列是反义核酸序列,其中反义核酸序列的表达抑制靶核酸序列的表达。在一个实施例中,所述转基因/异源编码序列是内源核酸,其中希望的是内源核酸的另外的基因组拷贝,或相对于宿主生物体中靶核酸的序列处于反义方向的核酸。
如本文所使用的,术语“非GmPSID2转基因”或“非GmPSID2基因”是与GmPSID2基因编码序列具有小于80%序列同一性的任何转基因/异源编码序列。
如本文所使用的,“异源DNA编码序列”是指除自然编码GmPSID2基因的编码序列以外的任何编码序列,或表达的GmPSID2蛋白的任何同源物。在本发明的上下文中,术语“异源的”用于通常发现在自然界中没有紧密联系的核酸序列的任何组合。
如本文所定义的“基因产品”是由基因产生的任何产品。例如,基因产物可以是基因(例如,mRNA、tRNA、rRNA、反义RNA、干扰RNA、核糖酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质的直接转录产物。基因产物还包括通过诸如加帽、聚腺苷酸化、甲基化和编辑等方法修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、肉豆蔻化和糖基化修饰的蛋白质。基因表达会受到外部信号的影响,例如,细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因的表达也可以在从DNA到RNA到蛋白质的途径中的任何地方受到调节。调节基因表达的方式是,例如,通过控制转录、翻译、RNA转运和加工、中间分子(如mRNA)的降解或特定蛋白质分子在制备后的激活、失活、区室化或降解,或其组合。可以通过本领域已知的任何方法在RNA水平或蛋白质水平测量基因表达,包括但不限于RNA印迹、RT-PCR、蛋白质印迹或体外、原位或体内蛋白活性测定。
如本文所使用的,术语“基因表达”涉及这样的过程,通过该过程,核酸转录单位(包括例如基因组DNA)的编码信息通常被转化为细胞的可操作的、不可操作的、或结构的部分,经常包括蛋白质的合成。基因表达会受到外部信号的影响;例如,细胞、组织或生物体暴露于增加或减少基因表达的药剂。基因的表达也可以在从DNA到RNA到蛋白质的途径中的任何地方受到调节。调节基因表达的方式是,例如,通过控制转录、翻译、RNA转运和加工、中间分子(如mRNA)的降解或特定蛋白质分子在制备后的激活、失活、区室化或降解,或其组合。可以通过本领域已知的任何方法在RNA水平或蛋白质水平测量基因表达,包括但不限于RNA印迹、RT-PCR、蛋白质印迹或体外、原位或体内蛋白活性测定。
如本文所使用的,“基于同源性的基因沉默”(HBGS)是通用术语,其包括转录基因沉默和转录后基因沉默。由于与启动子或转录序列相对应的双链RNA(dsRNA)的产生,转录抑制(转录基因沉默;TGS)或mRNA降解(转录后基因沉默;PTGS)可导致未连锁沉默基因座对靶基因座的沉默。每个方法中不同细胞成分的参与表明,dsRNA诱导的TGS和PTGS可能是由古老的共同机制的多样化导致的。但是,很难对TGS和PTGS进行严格比较,因为它通常依赖于不同沉默基因座的分析。在一些情况下,由于产生对应于不同靶基因的启动子和转录序列的dsRNA,单个转基因基因座可触发TGS和PTGS。Mourrain等人(2007)Planta[植物学]225:365-79。siRNA可能是在同源序列上触发TGS和PTGS的实际分子:所述siRNA在此模型中会通过将转基因序列的甲基化扩散到内源性启动子中引发顺式和反式同源序列的沉默和甲基化。
如本文所使用的,术语“核酸分子”(或“核酸”或“多核苷酸”)可以指核苷酸的聚合形式,其可以包括RNA、cDNA、基因组DNA和上述的合成形式和混合聚合物的有义链和反义链。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸或任何一种核苷酸的修饰形式。如本文所使用的,“核酸分子”与“核酸”和“多核苷酸”同义。除非另有说明,否则核酸分子的长度通常至少为10个碱基。所述术语可以指长度不确定的RNA或DNA分子。所述术语包括DNA的单链和双链形式。核酸分子可以包括通过自然存在的和/或非自然存在的核苷酸键连接在一起的自然存在的核苷酸和修饰的核苷酸之一或二者。
如本领域技术人员将容易理解的,核酸分子可以被化学或生物化学修饰,或可以含有非自然或衍生的核苷酸碱基。此类修饰包括例如标记、甲基化、用类似物取代一个或多个自然存在的核苷酸、核苷酸间修饰(例如,不带电荷的键:例如,甲基膦酸酯、磷酸三酯、亚磷酰胺、氨基甲酸酯等;带电荷的键:例如,硫代磷酸酯,二硫代磷酸酯等;下垂部分:例如,肽;嵌入剂:例如吖啶、补骨脂素等;螯合剂;烷基化剂;和修饰的键:例如,α异头核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链、双链、部分双链体、三链体、发夹、环状和挂锁构型。
转录沿着DNA链以5'到3'的方式进行。这意味着RNA是通过在生长链的3'末端顺序添加核糖核苷酸5'-三磷酸(必需消除焦磷酸盐)而制备的。在线性或环状核酸分子中,如果离散元件(例如特定的核苷酸序列)已结合或将在该元件的5′方向结合至另一个元件,则离散元件相对于那个元件可称为“上游”或“5'”。类似地,如果离散元件是或将要从另一个元件在3'方向上与相同的核酸结合,则离散元件相对于那个元件可以是“下游”或“3'”。
如本文所使用的,碱基“位置”是指给定碱基或核苷酸残基在指定核酸内的位置。可以通过与参考核酸比对(参见下文)来定义指定的核酸。
杂交涉及通过氢键结合两个多核苷酸链。寡核苷酸及其类似物通过互补碱基之间的氢键合杂交,包括沃森-克里克(Watson-Crick)、胡斯坦(Hoogsteen)或反向胡斯坦(Hoogsteen)氢键合。通常,核酸分子由含氮碱基组成,所述含氮碱基是嘧啶(胞嘧啶(C)、尿嘧啶(U)和胸腺嘧啶(T))或嘌呤(腺嘌呤(A)和鸟嘌呤(G))。这些含氮碱基在嘧啶和嘌呤之间形成氢键,并且嘧啶与嘌呤的键合称为“碱基配对”。更具体地说,A将氢键合至T或U,而G将键合至C。“互补的”是指发生在两个不同的核酸序列或同一核酸序列的两个不同的区域之间的碱基配对。
“特异性可杂交”和“特异性互补”是表示足够程度的互补性的术语,使得在寡核苷酸与DNA或RNA靶标之间发生稳定且特异性的结合。寡核苷酸不必与其靶序列100%互补即可特异性杂交。当寡核苷酸与靶DNA或RNA分子的结合干扰靶DNA或RNA的正常功能时,寡核苷酸可特异性杂交,并且具有足够程度的互补性以避免寡核苷酸与非靶序列在希望特异性结合的条件下(例如在体内测定或系统的情况中在生理条件下)的非特异性结合。这种结合称为特异性杂交。
导致特定严格程度的杂交条件将根据所选择的杂交方法的性质以及杂交核酸序列的组成和长度而变化。通常,杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg2+浓度)将有助于杂交的严格性,尽管洗涤时间也会影响严格性。关于得到特定严格性程度所需要的杂交条件的计算论述于Sambrook等人(编),Molecular Cloning:A LaboratoryManual[分子克隆,实验室手册],第2版,1-3卷,Cold Spring Harbor Press[冷泉港实验室出版社],冷泉港,纽约,1989,第9章和第11章。
如本文所使用的,“严格条件”涵盖仅在杂交分子与DNA靶之间的错配小于50%时才发生杂交的条件。“严格条件”包括进一步的严格的特定水平。因此,如本文所使用的,“中严格性”条件是指在所述条件下序列错配率超过50%的分子不会杂交;“高严格性”条件是指在所述条件下错配率超过20%的序列不会杂交;以及“非常高严格性”条件是指在所述条件下错配率超过10%的序列不会杂交。
在特定的实施例中,严格条件可以包括在65℃下杂交,随后在65℃下用0.1x SSC/0.1%SDS洗涤40分钟。
以下是代表性的非限制性的杂交条件:
非常高严格性:在65℃下,在5x SSC缓冲液中杂交16小时;在室温下,在2x SSC缓冲液中洗涤两次,每次15分钟;并且在65℃下,在0.5x SSC缓冲液中洗涤两次,每次20分钟。
高严格性:在65℃-70℃下,在5x-6x SSC缓冲液中杂交16-20小时;在室温下,在2xSSC缓冲液中洗涤两次,每次5-20分钟;并且在55℃-70℃下,在1x SSC缓冲液中洗涤两次,每次30分钟。
中严格性:在室温至55℃下,在6x SSC缓冲液中杂交16-20小时;在室温至55℃下,在2x-3x SSC缓冲液中洗涤两次,每次20-30分钟。
在特定的实施例中,特异性杂交的核酸分子可以在非常高严格性杂交条件下保持结合。在这些和进一步的实施例中,特异性杂交的核酸分子可以在高严格性杂交条件下保持结合。在这些和进一步的实施例中,特异性杂交的核酸分子可以在中严格性杂交条件下保持结合。
如本文所使用的,术语“寡核苷酸”是指短核酸聚合物。寡核苷酸可以通过切割更长的核酸区段或通过聚合单独的核苷酸前体来形成。自动化合成仪允许合成长度长达几百个碱基对的寡核苷酸。因为寡核苷酸可以结合互补的核苷酸序列,所以它们可以用作检测DNA或RNA的探针。由DNA组成的寡核苷酸(寡脱氧核糖核苷酸)可用于PCR(扩增小DNA序列的技术)。在PCR中,寡核苷酸典型地称为“引物”,它允许DNA聚合酶延伸寡核苷酸并复制互补链。
术语“百分比序列同一性”或“百分比同一性”或“同一性”可互换使用,是指基于在两个或更多个氨基酸或核苷酸序列之间进行比较的序列中相应相同位置之间的相同匹配的序列比较。百分比同一性是指两个最佳比对的多核苷酸或肽序列在组分例如核苷酸或氨基酸的比对窗口中不变的程度。本领域已知的杂交实验和数学算法可用于确定百分比同一性。存在许多数学算法作为本领域已知的计算序列百分比同一性的序列比对计算机程序。这些程序可以分为全局序列比对程序或局部序列比对程序。
全局序列比对程序通过端对端比较比对以找到精确匹配,将精确匹配的数目除以较短序列的长度,然后乘以100,计算出两个序列的百分比同一性。基本上,当两个序列最佳比对(具有适当的核苷酸插入、缺失或缺口)时,参考(“查询”)多核苷酸分子的线性多核苷酸序列与测试(“受试者”)多核苷酸分子相比,相同核苷酸的百分比。
本地序列比对程序在计算上相似,但是仅比较序列的比对片段,而不是利用端到端分析。诸如BLAST的局部序列比对程序可用于比较两个序列的特定区域。两个序列的BLAST比较会产生E值或期望值,该值表示具有得分等于或优于原始比对得分(S)的不同比对的数量,可能偶然在数据库搜索中发生。E值越低,匹配越显著。因为数据库大小是E值计算中的一个元素,所以对于任何给定的查询/条目匹配,通过BLASTing针对公共数据库(如GENBANK)获得的E值通常随着时间的推移而增加。在设定多肽功能预测的置信度标准时,“高”BLAST匹配在本文中被认为具有对于最高BLAST命中而言的E值小于1E-30;中等的BLASTX E值为1E-30至1E-8;并且低的BLASTX E值大于1E-8。使用E值、百分比同一性、查询覆盖率和命中覆盖率的组合来确定本发明中的蛋白质功能分配。查询覆盖率是指查询序列以BLAST比对表示的百分比。命中覆盖率是指以BLAST比对方式表示的数据库条目的百分比。在本发明的一个实施例中,从蛋白同源物的功能推断查询多肽的功能,其中(1)hit[命中]_p<1e-30或%identity[同一性]>35%且query[查询]_coverage[覆盖率]>50%且hit[命中]_coverage[覆盖率]>50%,或(2)hit[命中]_p<1e-8且query[查询]_coverage[覆盖率]>70%且hit[命中]_coverage[覆盖率]>70%。在序列的BLAST分析过程中会产生以下缩写。
用于比较的序列的比对方法是本领域熟知的。描述了多种程序和比对算法。在实施例中,本公开涉及使用Vector NTI套件的AlignX比对程序(英杰公司(Invitrogen),卡尔斯巴德,加利福尼亚州)计算两个多核苷酸或氨基酸序列之间的百分比同一性。AlignX比对程序是针对多核苷酸或蛋白质的全局序列比对程序。在实施例中,本公开涉及使用LASERGENE生物信息学计算套件的MegAlign程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(MegAlignTM(
Figure BDA0002490079900000141
1993-2016).DNASTAR.麦迪逊,威斯康星州)。MegAlign程序是针对多核苷酸或蛋白质的全局序列比对程序。在实施例中,本公开涉及使用比对程序(包括但不限于ClustalW和ClustalV)的Clustal套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Higgins和Sharp(1988)Gene.[基因]12月15日;73(1):237-44;Higgins和Sharp(1989)CABIOS[计算机在生物科学中的应用]5:151-3;Higgins等人(1992)Comput.Appl.Biosci.[计算机应用生物科学]8:189-91)。在实施例中,本公开涉及使用程序的GCG套件(威斯康星软件包版本9.0,遗传学计算机组(Genetics Computer Group(GCG)),麦迪逊,威斯康星州)计算两个多核苷酸或氨基酸序列之间的百分比同一性。在实施例中,本公开涉及使用比对程序(例如但不限于BLASTP、BLASTN、BLASTX等)的BLAST套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Altschul等人(1990)J.Mol.Biol.[分子生物学杂志]215:403-10)。在实施例中,本公开涉及使用比对程序(包括但不限于FASTA、TFASTX、TFASTY、SSEARCH、LALIGN等)的FASTA套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Pearson(1994)Comput.Methods Genome Res.[基因组研究中的计算方法][Proc.Int.Symp.],会议日期1992(Suhai和Sandor编辑),普莱南出版公司(Plenum):纽约市,纽约州,第111-20页)。在实施例中,本公开涉及使用T-Coffee比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Notredame等人(2000)J.Mol.Biol.[分子生物学杂志]302,205-17)。在实施例中,本公开涉及使用比对程序(包括但不限于DIALIGN、CHAOS、DIALIGN-TX、DIALIGN-T等)的DIALIGN套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Al Ait等人(2013)DIALIGN at GOBICS[在GOBICS的DIALIGN]Nuc.AcidsResearch[核酸研究]41,W3-W7)。在实施例中,本公开涉及使用比对程序的MUSCLE套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Edgar(2004)Nucleic Acids Res.[核酸研究]32(5):1792-1797)。在实施例中,本公开涉及使用MAFFT比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Katoh等人(2002)Nucleic Acids Research[核酸研究]30(14):3059-3066)。在实施例中,本公开涉及使用Genoogle程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Albrecht,Felipe.arXiv150702987v1[cs.DC]2015年7月10日)。在实施例中,本公开涉及使用程序的HMMER套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Eddy.(1998)Bioinformatics[生物信息学],14:755-63)。在实施例中,本公开涉及使用比对程序(包括但不限于TPLASTN、PLASTP、KLAST、和PLASTX)的PLAST套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Nguyen与Lavenier.(2009)BMCBioinformatics[BMC生物信息学],10:329)。在实施例中,本公开涉及使用USEARCH比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Edgar(2010)Bioinformatics[生物信息学]26(19),2460-61)。在实施例中,本公开涉及使用比对程序的SAM套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Hughey与Krogh(1995年1月)Technical ReportUCSC0CRL-95-7[技术报告UCSC0CRL-95-7],University of California[加利福尼亚大学],圣克鲁兹)。在实施例中,本公开涉及使用IDF检索器计算两个多核苷酸或氨基酸序列之间的百分比同一性(O'Kane,K.C.,The Effect of Inverse Document FrequencyWeights on Indexed Sequence Retrieval[反向文档频率权重对索引序列检索的影响],Online Journal of Bioinformatics[生物信息学在线杂志],第6卷(2)162-173,2005)。在实施例中,本公开涉及使用Parasail比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Daily,Jeff.Parasail:SIMD C library for global,semi-global,and localpairwise sequence alignments[用于全局、半全局和局部成对序列比对的SIMD C库].BMCBioinformatics[BMC生物信息学].17:18.2月10日,2016)。在实施例中,本公开涉及使用ScalaBLAST比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Oehmen C,Nieplocha J."ScalaBLAST:A scalable implementation of BLAST for high-performance data-intensive bioinformatics analysis[ScalaBLAST:用于高性能数据密集型生物信息学分析的BLAST的可扩展实现]."IEEE Transactions on Parallel&Distributed Systems[IEEE并行与分布式系统汇刊]17(8):740-749 AUG 2006)。在实施例中,本公开涉及使用SWIPE比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Rognes,T.Faster Smilth-Waterman database searches with inter-sequence SIMDparallelization[通过序列间SIMD并行化,可以更快地进行Smilth-Waterman数据库搜索].BMC Bioiinformatics[BMC生物信息学].12,221(2011))。在实施例中,本公开涉及使用ACANA比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Weichun Huang,David M.Umbach和Leping Li,Accurate anchoring alignment of divergent sequences[不同序列的精确锚定比对].Bioinformatics[生物信息学]22:29-34,2006年1月1日)。在实施例中,本公开涉及使用DOTLET比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Junier,T.与Pagni,M.DOTLET:diagonal plots in a web browser[DOTLET:网络浏览器中的对角线图].Bioinformatics[生物信息学]16(2):178-9 2000年2月)。在实施例中,本公开涉及使用G-PAS比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Frohmberg,W.等人G-PAS 2.0-an improved version of protein alignment tool withan efficient backtracking routine on multiple GPUs[G-PAS2.0-在多个GPU上具有高效的回溯程序的蛋白质比对工具的改进版本].Bulletin of the Polish Academy ofSciences Technical Sciences[波兰科学院技术科学通报],第60卷,491 2012年11月)。在实施例中,本公开涉及使用GapMis比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Flouri,T.等人,Gap Mis:A tool for pairwise sequence alignment with asingle gap[Gap-Mis:单空位成对序列比对工具].Recent Pat DNA Gene Seq[DNA和基因序列最新专利].7(2):84-95Aug.2013)。在实施例中,本公开涉及使用比对程序(包括但不限于Matcher、Needle、Stretcher、Water、Wordmatch等)的EMBOSS套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Rice,P.,Longden,I.与Bleasby,A.EMBOSS:TheEuropean Molecular Biology Open Software Suite[欧洲分子生物学开放软件套件].Trends in Genetics[遗传学趋势]16(6)276-77(2000))。在实施例中,本公开涉及使用Ngila比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Cartwright,R.Ngila:global pairwise alignments with logarithmic and affine gap costs[Ngila:对数和仿射空位成本的全局成对比对].Bioinformatics[生物信息学].23(11):1427-28.2007年6月1日)。在实施例中,本公开涉及使用probA(也称为propA)比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Mückstein,U.,Hofacker,IL与Stadler,PF.Stochastic pairwise alignments[随机成对比对].Bioinformatics[生物信息学]18增刊2:S153-60.2002)。在实施例中,本公开涉及使用比对程序的SEQALN套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Hardy,P.与Waterman,M.The SequenceAlignment Software Library at USC[USC的序列比对软件库].1997)。在实施例中,本公开涉及使用比对程序(包括但不限于GAP、NAP、LAP等)的SIM套件计算两个多核苷酸或氨基酸序列之间的百分比同一性(Huang,X与Miller,W.A Time-Efficient,Linear-SpaceLocal Similarity Algorithm[省时的线性空间局部相似性算法].Advances in AppliedMathematics[应用数学进展],第12卷(1991)337-57)。在实施例中,本公开涉及使用UGENE比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Okonechnikov,K.,Golosova,O.与Fursov,M.Unipro UGENE:a unified bioinformatics toolkit[UniproUGENE:统一的生物信息学工具包].Bioinformatics[生物信息学].2012 28:1166-67)。在实施例中,本公开涉及使用BAli-Phy比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Suchard,MA与Redelings,BD.BAli-Phy:simultaneous Bayesian inference ofalignment and phylogeny[BAli-Phy:比对和系统发育的贝叶斯同时推断].Bioinformatics[生物信息学].22:2047-48.2006)。在实施例中,本公开涉及使用Base-By-Base比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Brodie,R.等人,Base-By-Base:Single nucleotide-level analysis of whole viral genomealignments[Base-By-Base:全病毒基因组比对的单核苷酸水平分析],BMCBioinformatics[BMC生物信息学],5,96,2004)。在实施例中,本公开涉及使用DECIPHER比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(ES Wright(2015)"DECIPHER:harnessing local sequence context to improve protein multiplesequence alignment[DECIPHER:利用局部序列上下文改进蛋白质多序列比对]."BMCBioinformatics[BMC生物信息学],doi:10.1186/s12859-015-0749-z.)。在实施例中,本公开涉及使用FSA比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Bradley,RK等人(2009)Fast Statistical Alignment[快速统计比对].PLoS ComputationalBiology[PLoS计算生物学].5:e1000392)。在实施例中,本公开涉及使用Geneious比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Kearse,M.等人(2012).GeneiousBasic:an integrated and extendable desktop software platform for theorganization and analysis of sequence data[Geneious Basic:集成和可扩展的用于序列数据组织和分析的桌面软件平台].Bioinformatics[生物信息学],28(12),1647-49)。在实施例中,本公开涉及使用Kalign比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Lassmann,T.与Sonnhammer,E.Kalign-an accurate and fast multiplesequence alignment algorithm[Kalign-准确和快速的多序列比对算法].BMCBioinformatics[BMC生物信息学]2005 6:298)。在实施例中,本公开涉及使用MAVID比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Bray,N.与Pachter,L.MAVID:Constrained Ancestral Alignment of Multiple Sequences[MAVID:多个序列的约束祖先比对].Genome Res.[基因组研究]2004年4月;14(4):693-99)。在实施例中,本公开涉及使用MSA比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Lipman,DJ等人,Atool for multiple sequence alignment[多序列比对工具].Proc.Nat’l Acad.Sci.USA.[美国科学院院报]1989;86:4412-15)。在实施例中,本公开涉及使用MultAlin比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Corpet,F.,Multiple sequencealignment with hierarchial clustering[具有系统聚类法的多序列比对].Nucl.AcidsRes.[核酸研究],1988,16(22),10881-90)。在实施例中,本公开涉及使用LAGAN或MLAGAN比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Brudno等人,LAGAN andMulti-LAGAN:efficient tools for large-scale multiple alignment of genomic DNA[LAGAN和Multi-LAGAN:基因组DNA大规模多重比对的有效工具].Genome Research[基因组研究]2003年4月;13(4):721-31)。在实施例中,本公开涉及使用Opal比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Wheeler,T.J.与Kececiouglu,J.D.Multiplealignment by aligning alignments[通过对齐比对进行多重比对].Proceedings of the15th ISCB conference on Intelligent Systems for Molecular Biology[第15届ISCB分子生物学智能系统会议纪要].Bioinformatics[生物信息学].23,i559-68,2007)。在实施例中,本公开涉及使用程序的PicXAA套件(包括但不限于PicXAA、PicXAA-R、PicXAA-Web等)计算两个多核苷酸或氨基酸序列之间的百分比同一性(Mohammad,S.,Sahraeian,E.与Yoon,B.PicXAA:greedy probabilistic construction of maximum expected accuracyalignment of multiple sequences[多个序列的最大预期准确性比对的贪婪概率构建].Nucleic Acids Research[核酸研究].38(15):4917-28.2010)。在实施例中,本公开涉及使用PSAlign比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(SZE,S.-H.,Lu,Y.与Yang,Q.(2006)A polynomial time solvable formulation of multiplesequence alignment[多序列比对的多项式时间可解公式]Journal of ComputationalBiology[计算生物学杂志],13,309-19)。在实施例中,本公开涉及使用StatAlign比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Novák,/>
Figure BDA0002490079900000191
等人(2008)StatAlign:anextendable software package for joint Bayesian estimation of alignments andevolutionary trees[StatAlign:可扩展的联合贝叶斯比对和进化树估计软件包].Bioinformatics[生物信息学],24(20):2403-04)。在实施例中,本公开涉及使用Needleman和Wunsch的Gap比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Needleman和Wunsch,Journal of Molecular Biology[分子生物学杂志]48:443-453,1970)。在实施例中,本公开涉及使用Smith和Waterman的BestFit比对程序计算两个多核苷酸或氨基酸序列之间的百分比同一性(Smith和Waterman,Advances in AppliedMathematics,[应用数学进展]2:482-489,1981,Smith等人,Nucleic Acids Research[核酸研究]11:2205-2220,1983)。这些程序产生发散序列的生物学上有意义的多重序列比对。将针对所选序列计算的最佳匹配比对排列起来,以便可以看到同一性、相似性和差异。
术语“相似性”是指氨基酸序列之间的比较,并且不仅考虑对应位置的相同氨基酸,而且考虑对应位置的功能上相似的氨基酸。因此,除了序列相似性之外,多肽序列之间的相似性还指示功能相似性。
术语“同源性”有时用于表示两个或更多个核酸或氨基酸序列之间的相似性水平,以位置同一性(即序列相似性或同一性)的百分比表示。同源性也指进化相关性的概念,通常通过共享相似序列的不同核酸或蛋白质之间的相似功能特性来证明。
如本文所使用的,术语“变体”是指基本相似的序列。就核苷酸序列来说,可使用本领域熟知的分子生物学技术来鉴定自然存在的变体,诸如像用本文概述的聚合酶链反应(PCR)和杂交技术来鉴定。
对于核苷酸序列,变体包含在天然多核苷酸中的一个或多个内部位点处的一个或多个核苷酸的缺失和/或添加,和/或在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的取代。如本文所使用的,“天然”核苷酸序列包括自然存在的核苷酸序列。就核苷酸序列来说,可使用本领域熟知的分子生物学技术来鉴定自然存在的变体,例如,用以下概述的聚合酶链反应(PCR)和杂交技术来鉴定。核苷酸序列变体还包括人工合成的核苷酸序列,比如那些采用定点诱变技术产生的核苷酸序列。通常,如通过本文别处所描述的序列比对程序和参数确定的,本发明的具体核苷酸序列的变体将与该具体的核苷酸具有至少约40%、45%、50%>、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%o、99%或更高的序列同一性。本发明的核苷酸序列的生物活性变体与该序列不同的核酸残基数可能只有1至15个,只有1至10个,如6至10个,只有5个,只有4、3、2个,或甚至只有1个。
如本文所使用的,术语“可操作地连接到”涉及当第一核酸序列与第二核酸序列具有功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,当启动子影响编码序列的转录或表达时,该启动子可操作地连接到编码序列。当重组产生时,可操作地连接的核酸序列通常是连续的,并且在需要连接两个蛋白质编码区的情况下,它们在同一阅读框中。但是,元件不必连续地可操作地连接。
如本文所使用的,术语“启动子”是指通常位于基因上游(朝向基因的5'区域)的DNA区域,并且是启动和驱动基因转录所需要的。启动子可以允许其控制的基因的适当激活或抑制。启动子可以含有被转录因子识别的特定序列。这些因子可能与启动子DNA序列结合,导致募集RNA聚合酶,RNA聚合酶是一种从基因编码区合成RNA的酶。启动子通常是指位于基因上游的所有基因调节元件,包括上游启动子、5'UTR、内含子和前导序列。
如本文所使用的,术语“上游启动子”是指足以指导转录起始的连续多核苷酸序列。如本文所使用的,上游-启动子涵盖具有几个序列基序的转录起始位点,这些序列基序包括TATA Box、启动子序列、TFIIB识别元件和其他启动子基序(Jennifer,E.F.等人,(2002)Genes&Dev.[基因与发育],16:2583-2592)。上游启动子为RNA聚合酶II提供了作用位点,RNA聚合酶II是具有基础或一般的转录因子(例如TFIIA、B、D、E、F和H)的多亚基酶。这些因子组装成转录前起始复合物,催化从DNA模板合成RNA。
上游启动子激活是通过多种蛋白质结合并随后与转录起始复合物相互作用以激活基因表达的调节DNA序列元件的附加序列完成的。这些基因调节元件序列与特定DNA结合因子相互作用。这些序列基序有时可称为顺式元件。此类顺式元件,结合至其组织特异性或发育特异性的转录因子单独或组合,可以在转录水平决定启动子的时空表达模式。这些顺式元件对可操作地连接的基因施加的控制类型差异很大。一些元件的作用是增加可操作连接的基因的转录响应环境响应(例如,温度、湿度和伤害)。其他顺式元件可能对发育线索(例如,发芽、种子成熟和开花)或空间信息(例如,组织特异性)有反应。参见,例如,Langridge等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:3219-23。这些顺式元件位于距转录起点不同距离的位置,某些顺式元件(称为近端元件)与最小核心启动子区域相邻,而其他元件可位于启动子(增强子)上游或下游几千碱基处。
如本文所使用的,术语“5'非翻译区”或“5'UTR”定义为前mRNA或成熟mRNA的5'末端中的非翻译区段。例如,在成熟的mRNA上,一个5'UTR典型地在其5'末端带有一个7-甲基鸟苷帽,并参与许多过程,如剪接、聚腺苷酸化、mRNA向细胞质的输出,通过翻译机制鉴定mRNA的5'末端,以及保护mRNA免受降解。
如本文所使用的,术语“内含子”是指转录但未翻译的基因(或表达的目的多核苷酸序列)中包含的任何核酸序列。内含子包括在表达的DNA序列内的未翻译的核酸序列,以及从其转录的RNA分子中的相应序列。本文所述的构建体还可含有增强翻译和/或mRNA稳定性的序列,如内含子。一个这种内含子的实例是拟南芥(Arabidopsis thaliana)组蛋白H3变体的基因II的第一内含子或任何其他通常已知的内含子序列。内含子可以与启动子序列组合使用以增强翻译和/或mRNA的稳定性。
如本文所使用的,术语“转录终止子”或“终止子”定义为前mRNA或成熟mRNA的3'末端中的转录区段。例如,超过“聚腺苷酸化信号”位点的更长的一段DNA被转录为前mRNA。该DNA序列通常含有转录终止信号,用于将前mRNA正确加工成成熟的mRNA。
如本文所使用的,术语“3'非翻译区”或“3'UTR”定义为前mRNA或成熟mRNA的3'末端中的非翻译区段。例如,在成熟的mRNA上,该区域带有聚-(A)尾巴,并且已知在mRNA稳定性、翻译起始和mRNA输出中具有许多作用。另外,认为3'UTR包括聚腺苷酸化信号和转录终止子。
如本文所使用的,术语“聚腺苷酸化信号”表示存在于mRNA转录物中的核酸序列,当存在聚-(A)聚合酶时,其允许转录物在聚腺苷酸化位点上被聚腺苷酸化,例如位于聚-(A)信号下游的10至30个碱基。许多聚腺苷酸化信号是本领域已知的,并且可用于本发明。示例性序列包括AAUAAA及其变体,如Loke J.等人,(2005)Plant Physiology[植物生理学]138(3);1457-1468中所述。
“DNA结合转基因”是编码DNA结合蛋白的多核苷酸编码序列。所述DNA结合蛋白随后能够结合另一个分子。结合蛋白可以与例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。如果是蛋白质结合蛋白,它可以结合自身(以形成同型二聚体、同型三聚体等)和/或结合不同蛋白质的一个或多个分子。结合蛋白可以具有超过一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。
DNA结合蛋白的实例包括;大范围核酸酶、锌指、CRISPR、和TALEN结合结构域可以被“工程化”以结合预定的核苷酸序列。典型地,工程化的DNA结合蛋白(例如,锌指、CRISPR或TALEN)是非自然存在的蛋白质。设计和选择用于工程化DNA结合蛋白的方法的非限制性实例。设计的DNA结合蛋白是自然界中不存在的蛋白,其设计/组成主要来自合理的标准。设计的合理标准包括应用替换规则和计算机算法,以处理数据库中存储现有ZFP、CRISPR和/或TALEN设计信息和结合数据的信息。参见,例如美国专利6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496和美国公开号20110301073、20110239315和20119145940。
“锌指DNA结合蛋白”(或结合结构域)是一种蛋白质,或者是较大蛋白质中的一个结构域,其可以通过一个或多个锌指按序列特异性方式结合DNA,所述锌指是结合结构域内氨基酸序列的区域,其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。锌指结合结构域可以被“工程化”以结合预定的核苷酸序列。设计和选择用于工程化锌指蛋白的方法的非限制性实例。设计的锌指蛋白是自然界中不存在的蛋白,其设计/组成主要来自合理的标准。设计的合理标准包括应用替换规则和计算机算法,以处理数据库中存储现有ZFP设计信息和结合数据的信息。参见,例如美国专利号6,140,081;6,453,242;6,534,261和6,794,136;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
在其他实例中,一种或多种核酸酶的DNA结合结构域包含自然存在或工程化的(非自然存在的)TAL效应子DNA结合结构域。参见,例如美国专利公开号20110301073,其通过引以其整体并入本文。已知黄单胞菌属(Xanthomonas)的植物致病细菌在重要的作物植物中引起许多疾病。黄单胞菌属的致病性取决于保守的III型分泌(T3S)系统,该系统向植物细胞中注入的蛋白质超过了不同的效应子蛋白。在这些注射的蛋白质中有转录激活子样(TALEN)效应子,它们模仿植物转录激活子并操纵植物转录组(参见Kay等人,(2007)Science[科学]318:648-651)。这些蛋白质含有DNA结合结构域和转录激活结构域。表征最充分的TAL效应子之一是来自疱病野油菜黄单胞菌(Xanthomonas campestgrispv.Vesicatoria)的AvrBs3(参见Bonas等人,(1989)Mol Gen Genet[分子和普通遗传学]218:127-136和WO 2010079430)。TAL效应子含有串联重复的集中结构域,每个重复含有约34个氨基酸,这是这些蛋白质的DNA结合特异性的关键。另外,它们含有核定位序列和酸性转录激活结构域(综述参见Schornack S等人,(2006)J Plant Physiol[植物生理学]163(3):256-272)。另外,在植物病原细菌青枯雷尔氏菌(Ralstonia solanacearum)两个基因,指定brg11和hpx17已经发现与青枯雷尔氏菌生物变体菌株GMI1000和生物变体4菌株RS1000的黄单胞菌属AvrBs3家族同源(参见Heuer等人,(2007)Appl and Enviro Micro[应用与环境微生物学]73(13):4379-4384)。这些基因在核苷酸序列上彼此具有98.9%的同一性,但在hpx17的重复结构域中相差1,575bp的缺失。然而,两种基因产物与黄单胞菌属的AvrBs3家族蛋白具有少于40%序列同一性。参见,例如美国专利公开号20110301073,其通过引以其整体并入。
这些TAL效应子的特异性取决于在串联重复序列中发现的序列。重复序列包含约102bp,重复序列典型地与彼此为91%-100%同源(Bonas等人,同上)。重复序列的多态性通常位于位置12和13,并且似乎有位置12和13上的高变二残基的身份与TAL效应子的靶序列中连续核苷酸的身份之间的一种一一对应关系(参见Moscou和Bogdanove,(2009)Science[科学]326:1501和Boch等人(2009)Science[科学]326:1509-1512)。实验上,这些TAL效应子的DNA识别的自然密码已经确定了使得位置12和13的HD序列导致与胞嘧啶(C)结合,NG与T结合,NI与A、C、G或T结合,NN与A或G结合,而ING与T结合。这些DNA结合重复序列已被组装成具有新的重复序列的组合和数量的蛋白质,以制造能够与新序列相互作用并激活植物细胞中的非内源性报告基因表达的人工转录因子(Boch等人,同上)。工程化的TAL蛋白已与FokI切割半结构域连接,以产生TAL效应子结构域核酸酶融合蛋白(TALEN),其在酵母报告基因测定(基于质粒的靶标)中具有活性。
CRISPR(成簇的规律间隔的短回文重复序列)/Cas(CRISPR相关的)核酸酶系统是基于细菌系统的一种最近工程化的核酸酶系统,可用于基因组工程。它基于许多细菌和古细菌的适应性免疫反应的一部分。当病毒或质粒入侵细菌时,入侵者的DNA区段会通过“免疫”反应转化为CRISPR RNA(crRNA)。然后,该crRNA通过部分互补区域与另一种称为tracrRNA的RNA结合,以将Cas9核酸酶引导至与靶DNA中与crRNA同源的区域,称为“前间区序列”。Cas9切割DNA以在双链断裂末端(DSB)在由crRNA转录物中含有的20核苷酸指导序列指定的位点处产生平末端。Cas9需要crRNA和tracrRNA才能进行位点特异性DNA识别和切割。现在已经对该系统进行了工程化,以便可以将crRNA和tracrRNA组合至一个分子(“单个指导RNA”),并且可以对单个指导RNA的crRNA等效部分进行工程化,以指导Cas9核酸酶靶向任何所希望的序列(参见Jinek等人,(2012)Science[科学]337,第816-821页,Jinek等人,(2013),eLife 2:e00471和David Segal,(2013)eLife 2:e00563)。在其他实例中,crRNA与tracrRNA结合,以将Cpf1核酸酶引导至与crRNA同源的区域,以切割末端交错的DNA(参见Zetsche,Bernd等人,Cell[细胞]163.3(2015):759-771。)。因此,可以对CRISPR/Cas系统工程化以在基因组中的希望的靶标上产生DSB,并且可以通过使用修复抑制剂来影响DSB的修复,从而导致易于出错的修复增加。
在其他实例中,所述DNA结合转基因/异源编码序列是位点特异性核酸酶,其包含工程化的(非-自然存在的)大范围核酸酶(也称为归巢核酸内切酶)。归巢核酸内切酶或大范围核酸酶的识别序列,如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII是已知的。还参见美国专利号5,420,032;美国专利号6,833,252;Belfort等人,(1997)Nucleic Acids Res.[核酸研究]25:3379-303388;Dujon等人,(1989)Gene[基因]82:115-118;Perler等人,(1994)Nucleic Acids Res.[核酸研究]22,11127;Jasin(1996)Trends Genet.[遗传学趋势]12:224-228;Gimble等人,(1996)J.Mol.Biol.[分子生物学杂志]263:163-180;Argast等人,(1998)J.Mol.Biol.[分子生物学杂志]280:345-353和新英格兰生物实验室目录。另外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可以被工程化以结合非自然靶标位点。参见,例如,Chevalier等人(2002)Molec.Cell[分子细胞]10:895-905;Epinat等人,(2003)Nucleic Acids Res.[核酸研究]5 31:2952-2962;Ashworth等人,(2006)Nature[自然]441:656-659;Paques等人,(2007)Current Gene Therapy[目前基因疗法]7:49-66;美国专利公开号20070117128。归巢核酸内切酶和大范围核酸酶的DNA结合结构域可以在整个核酸酶的背景下改变(即,使得核酸酶包括同源切割结构域),或者可以与异源切割结构域融合。
如本文所使用的,术语“转化”涵盖可以将核酸分子引入这种细胞的所有技术。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔;脂质转染;显微注射(Mueller等人,(1978)Cell[细胞]15:579-85);农杆菌属介导的转移;直接DNA摄取;WHISKERSTM-介导的转化;和微粒轰击。这些技术可用于植物细胞的稳定转化和瞬时转化。“稳定转化”是指将核酸片段引入宿主生物体的基因组中,导致遗传稳定的遗传。一旦经稳定转化,核酸片段稳定地整合入宿主生物体和任何后代的基因组中。含有经转化的核酸片段的宿主生物体被称为“转基因的”生物体。“瞬时转化”是指将核酸片段引入宿主生物体的细胞核或含DNA的细胞器中,导致不具遗传稳定遗传的基因表达。
外源核酸序列。在一个实例中,转基因/异源编码序列是基因序列(例如,除草剂抗性基因)、编码工业上或药学上有用的化合物的基因、或编码希望的农艺性状的基因。在又另一个实例中,所述转基因/异源编码序列是反义核酸序列,其中所述反义核酸序列的表达抑制靶核酸序列的表达。转基因/异源编码序列可以含有可操作地连接到所述转基因/异源编码序列(例如,启动子)的调节序列。在一些实施例中,目的多核苷酸序列是转基因。然而,在其他实施例中,目的多核苷酸序列是内源核酸序列,其中希望的是内源核酸序列的另外的基因组拷贝,或相对于宿主生物体中靶核酸分子的序列处于反义方向的核酸序列。
如本文所使用的,通过以下来产生术语转基因“事件”:用异源DNA转化植物细胞,所述异源DNA为包括目的转基因/异源编码序列的核酸构建体;再生由所述转基因/异源编码序列插入所述植物的基因组中所产生的植物群体;并且选择表征为插入特定基因组位置的特定植物。术语“事件”是指包括异源DNA的原始转化体和该转化体的后代。术语“事件”还指由转化体与包括基因组/转基因DNA的另一种变体之间的有性杂交产生的后代。即使在与轮回亲本反复回交后,插入的转基因/异源编码序列DNA和来自经转化的亲本的侧翼基因组DNA(基因组/转基因DNA)也存在于杂交的后代中相同的染色体位置。术语“事件”也指来自原始转化体和其后代的DNA,所述后代包含插入的DNA和与插入的DNA直接相邻的侧翼基因组序列,插入的DNA预期将被转移到接受包括目的转基因/异源编码序列的插入的DNA的后代中,得到包括插入的DNA(例如,自交所产生的原始转化子和后代)的亲本系和不含有插入的DNA的亲本系发生性杂交的结果。
如本文所使用的,术语“聚合酶链式反应”或“PCR”定义了一种程序或技术,其中如1987年7月28日授权的美国专利号4,683,195中所述扩增了微量的核酸、RNA和/或DNA。通常,需要从目的区域的末端或以外的区域获得序列信息,以便可以设计寡核苷酸引物;这些引物在序列上与待扩增模板的相反链相同或相似。两个引物的5'末端核苷酸可以与扩增的材料的末端一致。PCR可用于从总的基因组DNA扩增特定的RNA序列、特定的DNA序列,以及从总的细胞RNA、噬菌体或质粒序列转录的cDNA等。通常参见Mullis等人,Cold SpringHarbor Symp.Quant.Biol.[冷泉港定量生物学研讨会],51:263(1987);Erlich编辑,PCRTechnology[PCR技术],(Stockton Press[斯托克顿出版社],纽约州,1989)。
如本文所使用的,术语“引物”是指当条件适合于引物延伸产物的合成时能够充当沿着互补链的合成起始点的寡核苷酸。合成条件包括存在四种不同的脱氧核糖核苷酸三磷酸和至少一种聚合诱导剂,如逆转录酶或DNA聚合酶。它们存在于合适的缓冲液中,其可以包括作为辅因子的成分或在多种合适的温度下影响诸如pH等条件的成分。引物优选地是单链序列,使得扩增效率最优化,但是可以使用双链序列。
如本文所使用的,术语“探针”是指与靶序列杂交的寡核苷酸。在
Figure BDA0002490079900000271
Figure BDA0002490079900000272
样测定过程中,探针与位于两个引物的退火位点之间的靶标的一部分杂交。探针包括约八个核苷酸、约十个核苷酸、约十五个核苷酸、约二十个核苷酸、约三十个核苷酸、约四十个核苷酸或约五十个核苷酸。在一些实施例中,探针包括约八个核苷酸至约十五个核苷酸。探针还可以包括可检测标记,例如荧光团(/>
Figure BDA0002490079900000273
异硫氰酸荧光素等)。可检测标记可以直接共价附接于探针寡核苷酸,例如位于探针的5'末端或探针的3'末端。包括荧光团的探针还可以进一步包括淬灭剂,例如Black Hole QuencherTM,Iowa BlackTM等。
如本文所使用的,术语“限制性内切核酸酶”和“限制酶”是指细菌酶,每种这样的酶在特定核苷酸序列上或附近切割双链DNA。2型限制酶在同一位点识别并切割DNA,包括但不限于XbaI、BamHI、HindIII、EcoRI、XhoI、SalI、KpnI、AvaI、PstI和SmaI。
如本文所使用的,术语“载体”与术语“构建体”、“克隆载体”和“表达载体”可互换使用,并且意指可将DNA或RNA序列(例如外源基因)引入宿主细胞,以转化宿主并促进所引入的序列的表达(例如转录和翻译)的载体。“非病毒载体”旨在意指不包含病毒或逆转录病毒的任何载体。在一些实施例中,“载体”是包含至少一个DNA复制起点和至少一个选择性标记基因的DNA序列。实例包括但不限于将外源DNA带入细胞的质粒、黏粒、噬菌体、细菌人工染色体(BAC)或病毒。载体还可以包括一个或多个基因、反义分子和/或选择性标记基因以及本领域已知的其他遗传元件。载体可以转导、转化或感染细胞,从而使细胞表达由载体编码的核酸分子和/或蛋白质。
术语“质粒”定义了能够在原核或真核宿主细胞中常染色体复制的核酸的环状链。该术语包括可以是DNA或RNA并且可以是单链或双链的核酸。该定义的质粒还可以包括对应于细菌复制起点的序列。
如本文所使用的,如本文所使用的术语“选择性标记基因”定义了编码蛋白质的基因或其他表达盒,所述蛋白质有助于鉴定插入了选择性标记基因的细胞。例如,“选择性标记基因”涵盖报告基因以及用于植物转化以例如保护植物细胞免于选择剂或对选择剂提供抗性/耐受性的基因。在一个实施例中,仅那些接受功能选择性标记的细胞或植物能够在具有选择剂的条件下分裂或生长。短语“标记阳性”是指已经被转化为包括选择性标记基因的植物。
如本文所使用的,术语“可检测标记”是指能够检测的标记,诸如像放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合剂或酶。可检测标记的实例包括但不限于以下:荧光标记(例如FITC、若丹明、镧系元素荧光粉)、酶标记(例如辣根过氧化物酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶)、化学发光、生物素基、由二级报告子识别的预定多肽表位(例如亮氨酸拉链对序列、二级抗体的结合位点、金属结合结构域、表位标签)。在实施例中,可检测标记可以通过多种长度的间隔臂附接以减少潜在的空间位阻。
如本文所使用的,术语“盒”、“表达盒”和“基因表达盒”是指可在特定限制位点处或通过同源重组插入核酸或多核苷酸中的DNA区段。如本文所使用的,DNA的区段包含编码目的多肽的多核苷酸,并且盒和限制位点被设计为确保将盒插入适当的阅读框中以进行转录和翻译。在实施例中,表达盒可以包括编码目的多肽的多核苷酸,并且除了促进特定宿主细胞转化的多核苷酸外还具有元件。在实施例中,基因表达盒还可以包括允许在宿主细胞中增强表达编码目的多肽的多核苷酸的元件。这些元件可包括但不限于:启动子、最小启动子、增强子、响应元件、终止子序列、聚腺苷酸化序列等。
如本文所使用的,“接头”或“间隔子”是将两个分开的实体彼此结合的键、分子或分子的组。接头和间隔子可以提供两个实体的最佳间隔,或者可以进一步提供允许两个实体彼此分离的不稳定的连接。不稳定键包括光可裂解基团、酸不稳定部分、碱基不稳定部分和酶可裂解基团。如本文所使用的,术语“多接头”或“多克隆位点”定义了位于核酸序列上彼此10个核苷酸内的三个或更多个2型限制酶位点的簇。在其他情况下,如本文所使用的“多接头”是指通过任何已知的无缝克隆方法(即Gibson
Figure BDA0002490079900000291
NEBuilder HiFiDNA
Figure BDA0002490079900000292
Golden Gate Assembly、/>
Figure BDA0002490079900000293
Assembly等)靶向连接两个序列的一段核苷酸。包含多接头的构建体用于核酸序列如基因的编码区的插入和/或切除。
如本文所使用的,术语“对照”是指在分析程序中用于比较目的的样品。对照可以是“阳性”或“阴性”。例如,在分析程序的目的是检测细胞或组织中差异表达的转录物或多肽的情况下,通常优选包括阳性对照(如来自已知植物的显示所希望表达的样品)和阴性对照(如来自已知植物的缺少所希望表达的样品)。
如本文所使用的,术语“植物”包括整株植物以及任何后代,细胞、组织或植物的一部分。可用于本发明的植物种类通常包括适合变异发生的高等及低等植物,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。因此,“植物”包括双子叶植物和单子叶植物。术语“植物部位”包括植物的任何部位,包括例如且不限于:种子(包括成熟种子和未成熟种子);植物切段;植物细胞;植物细胞培养物;植物器官(例如花粉、胚、花朵、果实、枝、叶、根、茎和外植体)。植物组织或植物器官可以是种子、原生质体、愈伤组织或组织成结构或功能单元的任何其他组的植物细胞。植物细胞或组织培养物可能能够再生具有从其获得细胞或组织的植物的生理和形态特征的植物,并且能够再生具有与该植物基本相同的基因型的植物。相比之下,一些植物细胞不能再生以产生植物。植物细胞或组织培养物中的可再生细胞可以是胚胎、原生质体、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、花丝、花、籽粒、耳朵、穗、苞叶或茎秆。
植物部分包括可收获部分和可用于后代植物繁殖的部分。可用于繁殖的植物部分包括例如且不限于:种子;果实;切段;秧苗;块茎;和根茎。植物的可收获部分可以是植物的任何有用的部分,包括例如且不限于:花;花粉;秧苗;块茎;叶;茎;果实;种子;和根。
植物细胞是植物的结构和生理单位,包括原生质体和细胞壁。植物细胞可以是分离的单个细胞或细胞聚集物(例如,易碎的愈伤组织和培养的细胞)的形式,并且可以是更高组织的单元(例如,植物组织、植物器官、和植物)的部分。因此,植物细胞可以是原生质体、产生配子的细胞或可以再生为整株植物的细胞或细胞集合。这样,包含多个植物细胞并且能够再生为完整植物的种子在本文的实施例中被认为是“植物细胞”。
如本文所使用的,术语“小RNA”是指几类非编码核糖核酸(ncRNA)。术语小RNA描述在细菌细胞、动物、植物和真菌中产生的ncRNA的短链。这些ncRNA的短链可以在细胞内自然产生,也可以通过引入表达该短链或ncRNA的外源序列来产生。小RNA序列不直接编码蛋白质,并且在功能上不同于其他RNA,因为小RNA序列仅被转录而不被翻译。小RNA序列参与其他细胞功能,包括基因表达和修饰。小RNA分子通常由约20至30个核苷酸组成。所述小RNA序列可以源自更长的前体。前体形成自我互补区域中彼此折叠的结构;然后由动物中的核酸酶Dicer或植物中的DCL1处理它们。
许多类型的小RNA自然存在或人工产生,包括微RNA(miRNA)、短干扰RNA(siRNA)、反义RNA、短发夹RNA(shRNA)和核仁小RNA(snoRNA)。某些类型的小RNA,如微RNA和siRNA,在基因沉默和RNA干扰(RNAi)中很重要。基因沉默是遗传调节的过程,其中通常会表达的基因被细胞内元件(在这种情况下为小RNA)“关闭”。由于干扰而不能形成通常由该遗传信息形成的蛋白质,并且该基因中编码的信息被阻止表达。
如本文所使用的,术语“小RNA”涵盖文献中描述为“微小RNA”的RNA分子(Storz,(2002)Science[科学]296:1260-3;Illangasekare等人,(1999)RNA 5:1482-1489);原核“小RNA”(sRNA)(Wassarman等人,(1999)Trends Microbiol.[微生物学趋势]7:37-45);真核“非编码RNA(ncRNA)”;“微RNA(miRNA)”;“小非mRNA(snmRNA)”;“功能性RNA(fRNA)”;“转移RNA(tRNA)”;“催化RNA”[例如,核酶,包括自我-酰化核酶(Illangaskare等人,(1999)RNA5:1482-1489);“核仁小RNA(snoRNA)”、“tmRNA”(又名“10S RNA,”Muto等人,(1998)TrendsBiochem Sci.[生物化学科学趋势]23:25-29;和Gillet等人,(2001)Mol Microbiol.[分子微生物学]42:879-885);RNAi分子包括但不限于“小干扰RNA(siRNA)”、“内切核糖核酸酶-制备的siRNA(e-siRNA)”、“短发夹RNA(shRNA)”、和“小时序RNA(stRNA)”、“切粒的siRNA(d-siRNA)”、和包含至少一个尿嘧啶碱基的适配子、寡核苷酸和其他合成核酸。
除非具体解释,否则在此所使用的所有技术和科学术语均具有与本公开所属领域普通技术人员所通常理解的相同含义。子生物学中常用术语的定义可以在例如:Lewin,Genes V[基因V],Oxford University Press[牛津大学出版社],1994(ISBN 0-19-854287-9);Kendrew等人(编辑),The Encyclopedia of Molecular Biology[分子生物学百科全书],Blackwell Science Ltd.[布莱克威尔科学有限公司],1994(ISBN 0-632-02182-9);和Meyers(编辑),Molecular Biology and Biotechnology:A Comprehensive DeskReference,[分子生物学和生物技术:综合办公桌参考]VCH Publishers,Inc.,[VCH出版公司]1995(ISBN 1-56081-569-8)中找到。
III.GmPSID2基因调节元件和包含其的核酸
提供了使用来自大豆Glyma10g39460(光系统I亚基PsaD)基因的启动子在植物中表达非GmPSID2转基因的方法和组合物。在实施例中,启动子可以是SEQ ID NO:2的GmPSID2基因启动子。
在实施例中,提供了包含启动子的多核苷酸,其中所述启动子与SEQ ID NO:2具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,启动子是GmPSID2基因启动子,其包含与SEQ ID NO:2的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在实施例中,提供了分离的多核苷酸,其包含与SEQ ID NO:2的多核苷酸至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,提供了核酸载体,其包含SEQ ID NO:2的GmPSID2启动子。在实施例中,提供了多核苷酸,其包含可操作地连接到多接头的GmPSID2启动子。在实施例中,提供了基因表达盒,其包含可操作地连接到非GmPSID2转基因的GmPSID2启动子。在实施例中,提供了核酸载体,其包含可操作地连接到非GmPSID2转基因的GmPSID2启动子。在一个实施例中,所述启动子由SEQ ID NO:2组成。在说明性实施例中,核酸载体包含可操作地连接到转基因的GmPSID2启动子,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择性标记转基因或其组合。
在实施例中,核酸载体包含如本文公开的基因表达盒。在实施例中,载体可以是用于直接转化或基因靶向如供体DNA的质粒、黏粒、细菌人工染色体(BAC)、噬菌体、病毒或切除的多核苷酸片段。
转基因表达也可以由位于启动子序列下游的5'UTR区域调节。启动子和5'UTR均可调节转基因/异源编码序列的表达。虽然启动子是驱动转录所必需的,但5'UTR的存在可以增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。5'UTR基因区域有助于转基因的稳定表达。在进一步的实施例中,5'UTR可操作地连接到GmPSID2启动子。在实施例中,5'UTR可以是SEQ ID NO:3的GmPSID2 5'UTR。
在实施例中,提供了包含5'UTR的多核苷酸,其中所述5'UTR与SEQ ID NO:3具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,5'UTR是GmPSID2 5'UTR,其包含与SEQ ID NO:3的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在实施例中,提供了分离的多核苷酸,其包含与SEQ IDNO:3的多核苷酸至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,提供了核酸载体,其包含SEQ ID NO:3的GmPSID2 5'UTR。在实施例中,提供了多核苷酸,其包含可操作地连接到多接头的GmPSID25'UTR。在实施例中,提供了基因表达盒,其包含可操作地连接到非GmPSID2转基因的GmPSID2 5'UTR。在实施例中,提供了核酸载体,其包含可操作地连接到非GmPSID2转基因的GmPSID2 5'UTR。在一个实施例中,所述5'UTR由SEQ ID NO:3组成。在说明性实施例中,核酸载体包含可操作地连接到转基因的GmPSID2 5’UTR,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择性标记转基因或其组合。
转基因表达也可以由位于启动子序列下游的内含子区域调节。启动子和内含子均可调节转基因/异源编码序列的表达。虽然启动子是驱动转录所必需的,但内含子的存在可以增加表达水平,从而产生用于翻译和蛋白质合成的mRNA转录物。内含子基因区域有助于转基因的稳定表达。在进一步的实施例中,内含子可操作地连接到GmPSID2启动子。
根据一个实施例,提供了核酸载体,其包含重组基因表达盒,其中所述重组基因表达盒包含可操作地连接到多接头序列的GmPSID2启动子、非GmPSID2基因或非GmPSID2转基因或其组合。在一个实施例中,所述重组基因盒包含可操作地连接到非GmPSID2基因或转基因的GmPSID2启动子。在一个实施例中,所述重组基因盒包含如本文公开的可操作地连接到多接头序列的GmPSID2启动子。所述多接头以一种方式可操作地连接到所述GmPSID2启动子,所述方式使得将编码序列插入所述多接头的限制性位点之一将可操作地连接所述编码序列,从而当所述载体被转化或转染到宿主细胞中时允许所述编码序列的表达。
根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2启动子和非GmPSID2基因组成。在实施例中,SEQ ID NO:2的GmPSID2启动子可操作地连接到所述非GmPSID2基因或转基因的5'末端。在进一步的实施例中,所述GmPSID2启动子序列包含SEQID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2启动子、非GmPSID2基因组成,其中所述GmPSID2启动子可操作地连接到所述非GmPSID2基因的5'末端,并且所述GmPSID2启动子序列包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%、99%或100%序列同一性的序列。在进一步的实施例中,所述GmPSID2启动子序列由SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%、或99%序列同一性的821bp序列组成。
根据一个实施例,提供了核酸载体,其包含重组基因表达盒,其中所述重组基因表达盒包含可操作地连接到多接头序列的GmPSID2 5'UTR、非GmPSID2基因或转基因或其组合。在一个实施例中,所述重组基因盒包含可操作地连接到非GmPSID2基因或转基因的GmPSID2 5'UTR。在一个实施例中,所述重组基因盒包含如本文公开的可操作地连接到多接头序列的GmPSID2 5'UTR。所述多接头以一种方式可操作地连接到所述GmPSID2 5’UTR,所述方式使得将编码序列插入所述多接头的限制性位点之一将可操作地连接所述编码序列,从而当所述载体被转化或转染到宿主细胞中时允许所述编码序列的表达。
根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2 5'UTR和非GmPSID2基因组成。在实施例中,SEQ ID NO:3的GmPSID2 5'UTR可操作地连接到所述非GmPSID2基因或转基因的5'末端。在进一步的实施例中,所述GmPSID2 5'UTR序列包含SEQID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2 5'UTR、非GmPSID2基因组成,其中所述GmPSID2 5'UTR可操作地连接到所述非GmPSID2基因的5'末端,并且所述GmPSID2基因5'UTR序列包含SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%、99%或100%序列同一性的序列。在进一步的实施例中,所述GmPSID2基因5'UTR序列由SEQID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%、或99%序列同一性的248bp序列组成。
GmPSID2启动子还可以包含一个或多个另外的序列元件。在一些实施例中,GmPSID2启动子可以包含外显子(例如,前导或信号肽,如叶绿体转运肽或ER保留信号)。例如但不限于,作为进一步的实施例,GmPSID2启动子可以编码掺入所述GmPSID2启动子中的外显子。
进一步提供了使用来自大豆Glyma10g39460(光系统I亚基PsaD)基因的3'UTR终止植物中非GmPSID2转基因的表达的方法和组合物。在实施例中,3'UTR终止子可以是SEQ IDNO:4的GmPSID2 3'UTR。
在实施例中,提供了包含3'UTR的多核苷酸,其中所述3'UTR与SEQ ID NO:4具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,3'UTR是GmPSID2 3'UTR,其包含与SEQ ID NO:4的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在实施例中,提供了分离的多核苷酸,其包含与SEQ IDNO:4的多核苷酸至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,提供了核酸载体,其包含SEQ ID NO:4的GmPSID2 3'UTR。在实施例中,提供了多核苷酸,其包含可操作地连接到多接头的GmPSID23'UTR。在实施例中,提供了基因表达盒,其包含可操作地连接到非GmPSID2转基因的GmPSID2 3'UTR。在实施例中,提供了核酸载体,其包含可操作地连接到非GmPSID2转基因的GmPSID2 3'UTR。在一个实施例中,所述3'UTR由SEQ ID NO:4组成。在说明性实施例中,核酸载体包含可操作地连接到转基因的GmPSID2基因3’UTR,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择性标记转基因或其组合。
根据一个实施例,提供了核酸载体,其包含重组基因表达盒,其中所述重组基因表达盒包含可操作地连接到多接头序列的GmPSID2 3'UTR、非GmPSID2基因或转基因/异源编码序列或其组合。在一个实施例中,所述重组基因盒包含可操作地连接到非GmPSID2基因或转基因的GmPSID2 3'UTR。在一个实施例中,所述重组基因盒包含如本文公开的可操作地连接到多接头序列的GmPSID2 3'UTR。所述多接头以一种方式可操作地连接到所述GmPSID23’UTR,所述方式使得将编码序列插入所述多接头的限制性位点之一将可操作地连接所述编码序列,从而当所述载体被转化或转染到宿主细胞中时允许所述编码序列的表达。
根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2 3'UTR和非GmPSID2基因组成。在实施例中,SEQ ID NO:4的GmPSID2 3'UTR可操作地连接到所述非GmPSID2基因或转基因的3'末端。在进一步的实施例中,所述GmPSID2 3'UTR序列包含SEQID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2 3'UTR、非GmPSID2基因组成,其中所述GmPSID2 3'UTR可操作地连接到所述非GmPSID2基因的3'末端,并且所述GmPSID2 3'UTR序列包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%、99%或100%序列同一性的序列。在进一步的实施例中,所述GmPSID2 3'UTR序列由SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%、或99%序列同一性的739bp序列组成。
提供了使用来自大豆Glyma10g39460(光系统I亚基PsaD)基因的终止子终止植物中非GmPSID2转基因的表达的方法和组合物。在实施例中,终止子可以是SEQ ID NO:5的GmPSID2终止子。
在实施例中,提供了包含终止子的多核苷酸,其中所述终止子与SEQ ID NO:5具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,终止子是GmPSID2终止子,其包含与SEQ ID NO:5的多核苷酸具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性的多核苷酸。在实施例中,提供了分离的多核苷酸,其包含与SEQ ID NO:5的多核苷酸至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%、或100%同一性。在实施例中,提供了核酸载体,其包含SEQ IDNO:5的GmPSID2终止子。在实施例中,提供了多核苷酸,其包含可操作地连接到多接头的GmPSID2终止子。在实施例中,提供了基因表达盒,其包含可操作地连接到非GmPSID2转基因的GmPSID2终止子。在实施例中,提供了核酸载体,其包含可操作地连接到非GmPSID2转基因的GmPSID2终止子。在一个实施例中,所述终止子由SEQ ID NO:5组成。在说明性实施例中,核酸载体包含可操作地连接到转基因的GmPSID2终止子,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、小RNA转基因、选择性标记转基因或其组合。
根据一个实施例,提供了核酸载体,其包含重组基因表达盒,其中所述重组基因表达盒包含可操作地连接到多接头序列的GmPSID2终止子、非GmPSID2基因或转基因或其组合。在一个实施例中,所述重组基因盒包含可操作地连接到非GmPSID2基因或转基因的GmPSID2终止子。在一个实施例中,所述重组基因盒包含如本文公开的可操作地连接到多接头序列的GmPSID2终止子。所述多接头以一种方式可操作地连接到所述GmPSID2终止子,所述方式使得将编码序列插入所述多接头的限制性位点之一将可操作地连接所述编码序列,从而当所述载体被转化或转染到宿主细胞中时允许所述编码序列的表达。
根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2终止子和非GmPSID2基因组成。在实施例中,SEQ ID NO:5的GmPSID2终止子可操作地连接到所述非GmPSID2基因或转基因的3'末端。在进一步的实施例中,所述GmPSID2终止子序列包含SEQID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%、99%或100%序列同一性的序列。根据一个实施例,提供了核酸载体,其包含基因盒,所述基因盒由GmPSID2终止子、非GmPSID2基因组成,其中所述GmPSID2终止子可操作地连接到所述非GmPSID2基因的3'末端,并且所述GmPSID2启动子序列包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%、99%或100%序列同一性的序列。在进一步的实施例中,所述GmPSID2终止子序列由SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%、或99%序列同一性的897bp序列组成。
在一个实施例中,提供了核酸构建体,其包含GmPSID2启动子和非GmPSID2基因,以及任选地一种或多种以下元件:
a)5'非翻译区;
b)内含子;和
c)3'非翻译区,
其中,
所述GmPSID2启动子由SEQ ID NO:2或与SEQ ID NO:2具有95%序列同一性的序列组成;
所述GmPSID2 5'UTR由已知的5'UTR、SEQ ID NO:3或与SEQ ID NO:3具有95%序列同一性的序列组成;和
所述3'UTR由已知的3'UTR、SEQ ID NO:4或与SEQ ID NO:4具有95%序列同一性的序列组成;进一步地,其中所述GmPSID2启动子可操作地连接到所述转基因/异源编码序列,并且每个任选的元件(当存在时)也可操作地连接到所述启动子和所述转基因。在一个进一步的实施例中,提供了转基因细胞,所述转基因细胞包含以上刚刚公开的核酸构建体。在一个实施例中,所述转基因细胞是植物细胞,在一个进一步的实施例中,提供了植物,其中所述植物包含所述转基因细胞。
在一个实施例中,提供了核酸构建体,其包含GmPSID2启动子和非GmPSID2基因,以及任选地一种或多种以下元件:
a)5'非翻译区;
b)内含子;和
c)3'终止子区,
其中,
所述GmPSID2启动子由SEQ ID NO:2或与SEQ ID NO:2具有95%序列同一性的序列组成;
所述GmPSID2 5'UTR由已知的5'UTR、SEQ ID NO:3或与SEQ ID NO:3具有95%序列同一性的序列组成;和
所述3'终止子由已知的3'终止子、SEQ ID NO:5或与SEQ ID NO:5具有95%序列同一性的序列组成;进一步地,其中所述GmPSID2启动子可操作地连接到所述转基因/异源编码序列,并且每个任选的元件(当存在时)也可操作地连接到所述启动子和所述转基因。在一个进一步的实施例中,提供了转基因细胞,所述转基因细胞包含以上刚刚公开的核酸构建体。在一个实施例中,所述转基因细胞是植物细胞,在一个进一步的实施例中,提供了植物,其中所述植物包含所述转基因细胞。
本公开的另一方面包含功能变体,其一个或多个核苷酸与本文提供的包含调节元件的核苷酸序列的那些不同。由于包含本文所述的序列的核苷酸序列的一种或多种修饰(例如,缺失、重排、或插入)而产生这种变体。例如,SEQ ID NO:2的GmPSID2启动子序列的片段和变体可以用于DNA构建体或基因表达盒中以驱动异源编码序列的表达。如本文所使用的,术语“片段”是指核酸序列的一部分。SEQ ID NO:2的GmPSID2启动子序列的片段可以保留引发转录的生物活性,更特别地以组织偏好性方式驱动转录的生物活性。可替代地,可用作杂交探针的核苷酸序列片段可以不必保留生物活性。SEQ ID NO:2的GmPSID2启动子序列的启动子区的核苷酸序列的片段可以是至少约20个核苷酸、约50个核苷酸、约100个核苷酸,最多至本发明的基因启动子区的全长核苷酸序列。
SEQ ID NO:2的GmPSID2启动子序列的生物活性部分可通过分离SEQ ID NO:2的GmPSID2启动子序列的一部分并评估所述部分的启动子活性来制备。作为GmPSID2启动子核苷酸序列的片段的核酸分子包含至少约16、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1100、1200、1300、1400、1500、1550、1600、1650、或1700个核苷酸,或最多至本文公开的全长GmPSID2启动子序列中存在的核苷酸的数目。
核苷酸序列变体还涵盖由诱变和重组发生程序(如DNA改组)产生的序列。通过这种程序,可以操纵SEQ ID NO:2的GmPSID2启动子核苷酸序列以创建新的GmPSID2启动子。以此方式,由相关序列多核苷酸的群体产生重组多核苷酸文库,所述相关序列多核苷酸包含具有基本序列同一性并且能够在体外或体内同源重组的序列区域。这种DNA改组的策略在本领域中是已知的。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]i:10747-10751;Stemmer(1994)Nature[自然]570:389-391;Crameri等人(1997)NatureBiotech.[自然生物技术]75:436-438;Moore等人(1997)J.Mol.Biol.[分子生物学杂志]272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA[美国科学院院报]£4:4504-4509;Crameri等人(1998)Nature[自然]527:288-291;以及美国专利号5,605,793和5,837,458。
本公开的核苷酸序列可用于分离来自其他生物(特别是其他植物,更特别是其他单子叶植物)的相应序列。以这种方式,可以使用如PCR、杂交等方法来鉴定此类序列(基于其与本文所示序列的序列同源性)。本发明涵盖了基于与本文所示的完整GmPSID2启动子序列或者与其片段的序列同一性而分离的序列。
在PCR方法中,可以设计寡核苷酸引物用于PCR反应,以便从提取自任何目的植物的基因组DNA中扩增出相应DNA序列。用于设计PCR引物和PCR克隆的方法是本领域通常已知的,并公开于Sambrook等人(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](第2版,Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],普莱恩维尤,纽约),以下简称为Sambrook。还参见Innis等人编辑,(1990)PCR Protocols:AGuide to Methods and Applications[PCR协议:方法和应用指南](Academic Press[学术出版社],纽约);Innis和Gelfand编辑,(1995)PCR Strategies[PCR策略](Academic Press[学术出版社],纽约);以及Innis和Gelfand编辑,(1999)PCR Methods Manual[PCR方法手册](Academic Press[学术出版社],纽约)。已知的PCR方法包括但不限于:使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
在杂交技术中,将已知核苷酸序列的全部或一部分用作探针,所述探针与来自所选生物体的一组克隆的基因组DNA片段中存在的其他相应核苷酸序列选择性杂交。所述杂交探针可以用可检测基团(如P32)或任何其他可检测标记物进行标记。因此,例如,可通过基于本发明的GmPSID2启动子序列标记合成的寡核苷酸来制得用于杂交的探针。制备用于杂交的探针和用于构建基因组文库的方法通常是本领域已知的,并且公开在Sambrook中。例如,本文所公开的完整GmPSID2启动子序列或其一个或多个部分可以用作能够与相应的GmPSID2启动子序列和信使RNA特异性杂交的探针。要在多种条件下实现特异性杂交,此类探针包括GmPSID2启动子序列中独特的序列,并且其长度为至少约10个核苷酸或者其长度为至少约20个核苷酸。可以使用此类探针通过PCR由选择的植物扩增相应的GmPSID2启动子序列。这项技术可以用于来从希望的生物体分离另外的编码序列,或者用作诊断测定以确定编码序列在生物体中的存在。杂交技术包括杂交筛选铺板的DNA文库(噬菌斑或菌落;参见,例如Sambrook)。
根据一个实施例,所述核酸载体进一步包含编码选择性标记的序列。根据一个实施例,所述重组基因盒可操作地连接到农杆菌属T-DNA边界。根据一个实施例,所述重组基因盒进一步包含第一和第二T-DNA边界,其中第一T-DNA边界可操作地连接到基因构建体的一端,而第二T-DNA边界可操作地连接到基因构建体的另一端。第一和第二农杆菌属T-DNA边界可独立地选自源自细菌菌株的T-DNA边界序列,所述细菌菌株选自由以下组成的组:胭脂碱合成的农杆菌属T-DNA边界、章鱼碱合成的农杆菌属T-DNA边界、甘露碱合成的农杆菌属T-DNA边界、农杆碱合成农杆菌属T-DNA边界或其任何组合。在一个实施例中,提供了农杆菌属菌株,其选自由以下组成的组:胭脂碱合成菌株、甘露碱合成菌株、农杆碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含可操作地连接到选自SEQ IDNO:2的转基因/异源编码序列或与SEQ ID NO:2具有80%、85%、90%、95%、或99%序列同一性的序列。在另一个实施例中,第一和第二农杆菌属T-DNA边界可以独立地选自源自细菌菌株的T-DNA边界序列,所述细菌菌株选自由以下组成的组:胭脂碱合成的农杆菌属T-DNA边界、章鱼碱合成的农杆菌属T-DNA边界、甘露碱合成的农杆菌属T-DNA边界、农杆碱合成农杆菌属T-DNA边界或其任何组合。在实施例中,提供了农杆菌属菌株,其选自由以下组成的组:胭脂碱合成菌株、甘露碱合成菌株、农杆碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含可操作地连接到选自SEQ ID NO:3的转基因/异源编码序列或与SEQ ID NO:3具有80%、85%、90%、95%、或99%序列同一性的序列。在一个实施例中,提供了农杆菌属菌株,其选自由以下组成的组:胭脂碱合成菌株、甘露碱合成菌株、农杆碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含可操作地连接到选自SEQ ID NO:4的转基因/异源编码序列或与SEQ ID NO:4具有80%、85%、90%、95%、或99%序列同一性的序列。在一个实施例中,提供了农杆菌属菌株,其选自由以下组成的组:胭脂碱合成菌株、甘露碱合成菌株、农杆碱合成菌株、或章鱼碱合成菌株,其中所述菌株包含质粒,其中所述质粒包含可操作地连接到选自SEQ ID NO:5的转基因/异源编码序列或与SEQ ID NO:5具有80%、85%、90%、95%、或99%序列同一性的序列。
适用于本公开的构建体的目的转基因包括但不限于赋予如下的编码序列:(1)有害生物抗性或疾病抗性、(2)对除草剂的耐受性、(3)添加农学性状的价值,诸如;产量提高、氮利用效率、水利用效率和营养品质,(4)蛋白质以位点特异性方式与DNA结合,(5)表达小RNA;以及(6)选择性标记。根据一个实施例,所述转基因/异源编码序列编码选择性标记或赋予杀昆虫抗性、除草剂耐受性、小RNA表达、氮利用效率、水利用效率、或营养品质的基因产品。
1.昆虫抗性
多种昆虫抗性基因可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID2 5'UTR包含SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。示例性昆虫抗性编码序列是本领域已知的。作为可与本公开的调节元件可操作地连接的昆虫抗性编码序列的实施方案,提供以下性状。提供示例性鳞翅目昆虫抗性的编码序列包括:cry1A;cry1A.105;cry1Ab;cry1Ab(截短的);cry1Ab-Ac(融合蛋白);cry1Ac(作为
Figure BDA0002490079900000421
销售);cry1C;cry1F(作为/>
Figure BDA0002490079900000422
销售);cry1Fa2;cry2Ab2;cry2Ae;cry9C;mocry1F;pinII(蛋白酶抑制剂蛋白);vip3A(a);和vip3Aa20。提供示例性鞘翅目昆虫抗性的编码序列包括:cry34Ab1(作为/>
Figure BDA0002490079900000423
销售);cry35Ab1(作为/>
Figure BDA0002490079900000424
销售);cry3A;cry3Bb1;dvsnf7;和mcry3A。提供示例性多昆虫抗性的编码序列包括ecry31.Ab。以上昆虫抗性基因的列表并不意味着具有限制性。本公开涵盖任何昆虫抗性基因。
2.除草剂耐受性
多种除草剂耐受性基因可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID2 5'UTR包含SEQ ID NO:3或与SEQID NO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。示例性除草剂耐受性编码序列是本领域已知的。作为可与本公开的调节元件可操作地连接的除草剂耐受性编码序列的实施方案,提供以下性状。草甘膦除草剂通过抑制EPSPS酶(5-烯醇式丙酮酸莽草酸酯-3-磷酸合酶)而发挥作用。该酶参与植物的生长和发育必不可少的芳香氨基酸的生物合成。本领域已知的多种酶促机制可用于抑制该酶。可以将编码此类酶的基因可操作地连接到本公开的基因调节元件。在实施例中,选择性标记基因包括但不限于编码草甘膦抗性基因的基因,包括:突变的EPSPS基因,如2mEPSPS基因、cp4 EPSPS基因、mEPSPS基因、dgt-28基因;aroA基因;和草甘膦降解基因,如草甘膦乙酰基转移酶基因(gat)和草甘膦氧化酶基因(gox)。这些性状目前作为Gly-TolTM
Figure BDA0002490079900000431
GT和Roundup/>
Figure BDA0002490079900000432
销售。草铵膦和/或双丙氨磷化合物的抗性基因包括dsm-2、bar和pat基因。bar和pat性状目前作为/>
Figure BDA0002490079900000433
销售。还包括提供对2,4-D的抗性的耐受性基因,如aad-1基因(应注意aad-1基因对芳氧基苯氧基丙酸酯除草剂具有进一步的活性)和aad-12基因(应注意aad-12基因对乙酰氧基乙酸酯合成植物生长素具有进一步的活性)。这些性状作为/>
Figure BDA0002490079900000434
作物保护技术销售。ALS抑制剂(磺酰脲类、咪唑啉酮类、三唑并嘧啶类、嘧啶基硫代苯甲酸酯类、和磺酰基氨基-羰基-三唑啉酮类)的抗性基因是本领域已知的。这些抗性基因最通常是由点突变为ALS编码基因序列引起的。其他的ALS抑制剂抗性基因包括hra基因、csr1-2基因、Sr-HrA基因和surB基因。一些性状以商品名/>
Figure BDA0002490079900000435
销售。抑制HPPD的除草剂包括吡唑啉酮,如苄草唑,吡草酮和苯吡唑草酮;三酮,如硝磺草酮、磺草酮、环磺酮、苯并双环酮;和二酮腈,如异噁唑草酮。已知性状可以耐受这些示例性HPPD除草剂可。HPPD抑制剂的实例包括hppdPF_W336基因(用于抗异噁唑草酮)和avhppd-03基因(用于抗甲基磺草酮)。奥昔尼除草剂耐受性状的实例包括bxn基因,该基因已被证明对除草剂/抗生素溴苯腈具有抗性。麦草畏的抗性基因包括麦草畏单加氧酶基因(dmo),如国际PCT公开号WO 2008/105890中所公开的。PPO或PROTOX抑制剂型除草剂的抗性基因(例如氟锁草醚、氟丙嘧草酯、氟丙草酯、戊基恶唑酮、唑草酮、异丙吡草酯、吡草醚、苯草醚、唑啶草酮、丙炔氟草胺、氟烯草酸、治草醚、乙氧氟草醚、乳氟禾草灵、氟磺胺草醚、乙羧氟草醚、和甲磺草胺)是本领域已知的。赋予对PPO抗性的示例性基因包括野生型拟南芥PPO酶的过表达(Lermontova I和Grimm B,(2000)Overexpression of plastidic protoporphyrinogen IXoxidase leads to resistance to the diphenyl-ether herbicide acifluorfen[质体原卟啉原IX氧化酶过表达导致对二苯醚除草剂氟锁草醚的抗性].Plant Physiol[植物生理学]122:75-83.)、枯草芽孢杆菌PPO基因的过表达(Li,X.和Nicholl D.2005.Development of PPO inhibitor-resistant cultures and crops[PPO抑制剂抗性培养物及作物的研制].Pest Manag.Sci.[有害生物管理科学]61:277-285以及Choi KW,Han O,Lee HJ,Yun YC,Moon YH,Kim MK,Kuk YI,Han SU和Guh JO,(1998)Generation of resistance to the diphenyl ether herbicide,oxyfluorfen,viaexpression of the Bacillus subtilis protoporphyrinogen oxidase gene in transgenictobacco plants[通过枯草芽孢杆菌原卟啉原氧化酶基因在转基因烟草植物中的表达产生对二苯醚除草剂氟锁草醚的抗性].Biosci Biotechnol Biochem[生物科学生物技术生物化学]62:558-560)。吡啶氧基或苯氧基丙酸和环己酮的抗性基因包括编码ACCase抑制剂的基因(例如Acc1-S1、Acc1-S2和Acc1-S3)。赋予对环己二酮和/或芳氧基苯氧基丙酸的抗性的示例性基因包括吡氟氯禾灵、禾草灵、精恶唑禾草灵酸、吡氟禾草灵和喹禾灵。最后,除草剂可以抑制光合作用,包括三嗪或苄腈,通过psbA基因(对三嗪的耐受性)、1s+基因(对三嗪的耐受性)和腈水解酶基因(对苯甲腈的耐受性)提供了耐受性。以上除草剂耐受性基因的列表并不意味着具有限制性。本公开涵盖任何除草剂耐受性基因。
3.农学性状
多种农学性状基因可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID2 5'UTR包含SEQ ID NO:3或与SEQ IDNO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。示例性农学性状编码序列是本领域已知的。作为可与本公开的调节元件可操作地连接的农学性状编码序列的实施方案,提供以下性状。pg基因提供的延迟的果实软化抑制了导致细胞壁中果胶分子分解的聚半乳糖醛酸酶的产生,从而导致了果实的延迟软化。此外,延迟的acc基因果实成熟/衰老抑制了天然acc合酶基因的正常表达,导致乙烯产量减少和果实成熟延迟。而accd基因代谢果实成熟激素乙烯的前体,导致果实成熟延迟。可替代地,sam-k基因通过减少S-腺苷甲硫氨酸(SAM)(乙烯生产的底物)而导致延迟成熟。cspB基因提供的干旱胁迫耐受表型通过保持RNA稳定性和翻译来维持水分胁迫条件下的正常细胞功能。另一个实例包括EcBetA基因,其催化渗透保护剂化合物甘氨酸甜菜碱的产生,赋予了对水分胁迫的耐受性。另外,RmBetA基因催化渗透保护剂化合物甘氨酸甜菜碱的产生,赋予了对水分胁迫的耐受性。bbx32基因提供光合作用和增产,该基因表达一种蛋白质,该蛋白质与一种或多种内源性转录因子相互作用以调节植物的昼/夜生理过程。可以通过表达编码热稳定的α-淀粉酶的amy797E基因来增加乙醇产量,该酶可以通过增加用于降解淀粉的淀粉酶的热稳定性来增强生物乙醇的产量。最后,修饰的氨基酸组合物可以通过编码二氢二吡啶甲酸合酶的cordapA基因的表达而产生,该酶增加了氨基酸赖氨酸的产生。农学性状编码序列的列表并不意指是限制性的。本公开涵盖任何农学性状编码序列。
4.DNA结合蛋白质
多种DNA结合转基因/异源编码序列基因/异源编码序列可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID25'UTR包含SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ IDNO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。示例性DNA结合蛋白质编码序列是本领域已知的。作为可与本公开的调节元件可操作地连接的DNA结合蛋白编码序列的实施例,以下类型的DNA结合蛋白可包括:锌指、TALEN、CRISPR和大范围核酸酶。DNA结合蛋白质编码序列的列表并不意指是限制性的。本公开涵盖任何DNA结合蛋白质编码序列。
5.小RNA
多种小RNA序列基因可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID2 5'UTR包含SEQ ID NO:3或与SEQID NO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。示例性小RNA性状是本领域已知的。作为可与本公开的调节元件可操作地连接的小RNA编码序列的实施方案,提供以下性状。例如,通过沉默编码乙烯形成酶的ACO基因的表达,抑制了乙烯的产生,抗efe小RNA的延迟果实成熟/衰老延迟了成熟。通过抑制内源性S-腺苷-L-蛋氨酸,改变了ccomt小RNA的木质素产生,从而降低了胍基(G)木质素的含量:反式咖啡酰氧基CoA 3-O-甲基转移酶(CCOMT基因)。此外,可通过Ppo5小RNA减少疣状茄(Solanum verrucosum)中缺乏B的斑点瘀伤耐受性,这会触发Ppo5转录物的降解,从而阻止黑点瘀伤的发展。还包括dvsnf7小RNA,其dsRNA包含西方玉米根虫(Western Corn Rootworm)Snf7基因的240bp片段,可抑制西方玉米根虫。修饰的淀粉/碳水化合物可以由小RNA产生,如pPhL小RNA(降解PhL转录物以限制通过淀粉降解形成还原糖)和pR1小RNA(降解R1转录物以限制通过淀粉降解形成还原糖)。另外,好处还包括asn1小RNA引起的丙烯酰胺含量降低,从而触发Asn1降解从而损害天冬酰胺的形成并降低了聚丙烯酰胺含量。最后,pgas ppo抑制小RNA的非褐色表型导致抑制PPO以产生具有非褐色表型的苹果。以上小RNA的列表并不意指是限制性的。本公开涵盖任何小RNA编码序列。
6.选择性标记
多种选择性标记(也称为报告基因)可以可操作地连接到所述GmPSID2启动子,所述GmPSID2启动子包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99%序列同一性的序列。另外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 5'UTR,所述GmPSID2 5'UTR包含SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99%序列同一性的序列。同样,所述昆虫抗性基因可以可操作地连接到所述GmPSID2 3'UTR,所述GmPSID2 3'UTR包含SEQ ID NO:4或与SEQID NO:4具有80%、85%、90%、95%或99%序列同一性的序列。此外,所述昆虫抗性基因可以可操作地连接到所述GmPSID2终止子,所述GmPSID2终止子包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99%序列同一性的序列。然后可将可操作地连接的序列掺入选择的载体中以允许鉴定和选择经转化的植物(“转化体”)。有许多方法可用于确认选择性标记在转化植物中的表达,包括例如DNA测序和PCR(聚合酶链反应)、DNA印迹、RNA印迹、用于检测从载体表达的蛋白质的免疫学方法。但是,通常通过目测观察蛋白质时观察到的报告基因,这些蛋白质在表达时会产生有色产物。示例性的报告基因是本领域已知的,并编码β-葡萄糖醛酸苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP、Phi-YFP)、红色荧光蛋白(DsRFP、RFP等)、β-半乳糖苷酶等(参见Sambrook等人,Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],第三版,冷泉港出版社,纽约,2001,其内容通过引以其整体并入本文)。
利用选择性标记基因来选择经转化的细胞或组织。选择性标记基因包括编码抗生素抗性的基因,如编码新霉素磷酸转移酶II(NEO)、壮观霉素/链霉素抗性(AAD)和潮霉素磷酸转移酶(HPT或HGR)的基因,以及赋予对除草化合物抗性的基因。除草剂抗性基因通常编码对除草剂不敏感的修饰目标蛋白,或编码在其起作用之前能降解植物中的除草剂或使其解毒的酶。例如,已经通过使用编码突变目标酶5-烯醇式丙酮酸莽草酸酯-3-磷酸合酶(EPSPS)的基因获得了对草甘膦的抗性。EPSPS的基因和突变体是众所周知的,并在下面进一步描述。通过使用编码PAT或DSM-2、腈水解酶、AAD-1或AAD-12的细菌基因分别获得了对草铵膦、溴苯腈和2,4-二氯苯氧基乙酸(2,4-D)的抗性这些都是使各自除草剂去毒的蛋白质的实例。
在实施例中,除草剂可抑制生长点或分生组织,包括咪唑啉酮或磺酰脲,并且对这些除草剂具有乙酰羟酸合酶(AHAS)和乙酰乳酸合酶(ALS)的抗性/耐受性的基因是众所周知的。草甘膦抗性基因包括突变型5-烯醇式丙酮酸莽草酸酯-3-磷酸合酶(EPSPs)和dgt-28基因(通过引入重组核酸和/或对天然EPSPs基因进行多种体内诱变)、aroA基因和草甘膦乙酰基转移酶(GAT)基因。其他膦酰基化合物的抗性基因包括来自链霉菌种的bar和pat基因,包括吸水链霉菌(Streptomyceshygroscopicus)和Streptomyces viridichromogenes,以及吡啶氧基或苯氧基丙酸和环己酮(编码ACCase抑制剂的基因)。赋予对环己二酮和/或芳氧基苯氧基丙酸的抗性的示例性基因(包括吡氟氯禾灵、禾草灵、精恶唑禾草灵酸、吡氟禾草灵和喹禾灵)包括乙酰辅酶A羧化酶(ACCase)的基因;Acc1-S1、Acc1-S2和Acc1-S3。在实施例中,除草剂可以抑制光合作用,包括三嗪(psbA和1s+基因)或苄腈(硝化酶基因)。此外,此类选择性标记可以包括阳性选择标记,如磷酸甘露糖异构酶(PMI)酶。
在实施例中,选择性标记基因包括但不限于编码如下的基因:2,4-D;新霉素磷酸转移酶II;氰酰胺水合酶;天冬氨酸激酶;二氢吡啶二羧酸合成酶;色氨酸脱羧酶;二氢吡啶二羧酸合成酶和脱敏天冬氨酸激酶;bar基因;色氨酸脱羧酶;新霉素磷酸转移酶(NEO);潮霉素磷酸转移酶(HPT或HYG);二氢叶酸还原酶(DHFR);草丁膦乙酰转移酶;2,2-二氯丙酸脱卤素酶;乙酰羟酸合成酶;5-烯醇式丙酮酸-莽草酸酯-磷酸合酶(aroA);卤代芳基腈水解酶;乙酰辅酶A羧化酶;二氢蝶呤合酶(sulI);和32kD光系统II多肽(psbA)。一个实施例还包括选择性标记基因,其编码对以下的抗性:氯霉素;甲氨蝶呤;潮霉素;壮观霉素;溴草腈;草甘膦;和草丁膦。以上选择性标记基因的列表并不意指是限制性的。本公开涵盖任何报告基因或选择性标记基因。
在一些实施例中,合成编码序列以在植物中最佳表达。例如,在实施例中,已经通过密码子优化修饰了基因的编码序列以增强在植物中的表达。可以优化杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、或选择性标记转基因/异源编码序列,以在特定植物物种中表达,或可替代地可以修饰上述转基因/异源编码序列以在双子叶或单子叶植物中最佳表达。植物偏好性密码子可以从特定目的植物物种中以最大量表达的蛋白质中频率最高的密码子确定。在实施例中,编码序列、基因、异源编码序列或转基因/异源编码序列被设计成在植物中以更高的水平表达,从而导致更高的转化效率。植物基因优化的方法是众所周知的。关于合成DNA序列的优化和产生的指导可以在例如WO 2013016546、WO 2011146524、WO1997013402、美国专利号6166302和美国专利号5380831中找到,其通过引用并入本文。
转化
合适的植物转化方法包括可以将DNA引入细胞的任何方法,例如且不限于:电穿孔(参见,例如,美国专利5,384,253);微粒轰击(参见,例如,美国专利5,015,580、5,550,318、5,538,880、6,160,208、6,399,861、和6,403,865);农杆菌属介导的转化(参见,例如,美国专利5,635,055、5,824,877、5,591,616;5,981,840、和6,384,301);和原生质体转化(参见,例如,美国专利5,508,184)。
可以使用诸如用碳化硅纤维搅拌的技术将DNA构建体直接引入植物细胞的基因组DNA中(参见,例如,美国专利5,302,523和5,464,765),或者可以使用基因枪方法将DNA构建体直接引入植物组织中,诸如DNA颗粒轰击(参见,例如,Klein等人(1987)Nature[植物]327:70-73)。可替代地,可以通过纳米颗粒转化将DNA构建体引入植物细胞中(参见,例如,美国专利公开号20090104700,通过引用以其整体并入本文)。
另外,可以使用非农杆菌属细菌或病毒如根瘤菌属物种(Rhizobium sp.)NGR234、苜蓿中华根瘤菌(Sinorhizoboium meliloti)、中慢生型百脉根根瘤菌(Mesorhizobium loti)、马铃薯病毒X、花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒来实现基因转移,参见,例如,Chung等人(2006)Trends Plant Sci.[植物科学趋势]11(1):1-4。
通过应用转化技术,几乎任何植物种类的细胞都可以稳定地转化,并且可以通过众所周知的技术将这些细胞发育成转基因植物。例如,在美国专利号5,846,797、5,159,135、5,004,863和6,624,344中描述了在棉花转化的背景下可能特别有用的技术;例如在美国专利5,750,871中特别描述了用于转化芸苔属植物的技术;例如在美国专利6,384,301中描述了用于转化大豆的技术;例如,在美国专利7,060,876和5,591,616以及国际PCT公开WO 95/06722中描述了用于转化玉蜀黍的技术。
在实现外源核酸向受体细胞的递送后,通常鉴定经转化的细胞用于进一步培养和植物再生。为了提高鉴定转化体的能力,人们可能希望将选择性标记基因与用于产生转化体的转化载体一起使用。在说明性的实施例中,可以通过将细胞暴露于一种或多种选择剂来测定经转化的细胞群,或者可以针对所希望的标记基因性状筛选细胞。
可以在暴露于选择剂的条件下存活的细胞,或在筛选测定中被评分为阳性的细胞,培养在支持植物再生的培养基中。在实施例中,可以通过包括其他物质如生长调节剂来修饰任何合适的植物组织培养基。可以将组织用生长调节剂维持在基本培养基上,直到有足够的组织可用于开始植物再生努力,或者经过反复的手动选择回合,直到组织的形态适合于再生(例如,至少2周),然后转移到有利于芽形成的培养基上。定期转移培养物,直到形成足够的芽。芽形成后,将其转移到有助于根形成的培养基中。一旦形成足够的根,就可以将植物转移到土壤中以进一步生长和成熟。
分子确认
可以通过选择或筛选工程化植物材料中存在于转化DNA上的标记基因编码的性状来鉴定和分离经转化的植物细胞、愈伤组织、组织或植物。例如,可以通过在含有抑制量的抗生素或除草剂的培养基上使工程化的植物材料生长来进行选择,所述转化基因构建体赋予其抗性。此外,还可以通过筛选可能存在于重组核酸构建体上任何可见标记基因(例如,β-葡萄糖醛酸酶、萤光素酶或绿色荧光蛋白基因)的活性来鉴定经转化的植物和植物细胞。这种选择和筛选方法是本领域技术人员众所周知的。可用于鉴定转基因植物的分子确认方法是本领域技术人员已知的。下面进一步描述几种示例性方法。
已经描述了分子信标用于序列检测。简而言之,设计了一种FRET寡核苷酸探针,该探针与侧翼基因组和插入DNA连接重叠。FRET探针的独特结构导致它含有一个二级结构,该二级结构使荧光和猝灭部分保持紧密相邻。FRET探针和PCR引物(插入DNA序列中的一个引物和侧翼基因组序列中的一个引物)在热稳定的聚合酶和dNTP存在下循环。成功进行PCR扩增后,一种或多种FRET探针与靶序列的杂交导致探针二级结构的去除以及荧光和淬灭部分的空间分离。荧光信号表明由于成功的扩增和杂交,存在侧翼基因组/转基因插入序列。用于检测扩增反应的这种分子信标测定是本公开的一个实施例。
水解探针测定,或者称为
Figure BDA0002490079900000501
(生命技术公司(Life Technologies),福斯特城,加利福尼亚州),是检测和定量DNA序列的存在的方法。简而言之,设计了FRET寡核苷酸探针,其在转基因/异源编码序列中有一个寡核苷酸,并且在侧翼基因组序列中有一个寡核苷酸,用于事件特异性检测。FRET探针和PCR引物(插入DNA序列中的一个引物和侧翼基因组序列中的一个引物)在热稳定的聚合酶和dNTP存在下循环。FRET探针的杂交导致荧光部分的裂解和释放,使其远离FRET探针上的淬灭部分。荧光信号表明由于成功的扩增和杂交,侧翼/转基因插入序列的存在。用于检测扩增反应的这种水解探针测定是本公开的实施例。
Figure BDA0002490079900000511
测定是一种检测和定量DNA序列存在的方法。简单地说,包含集成的基因表达盒的多核苷酸的基因组DNA样品,使用聚合酶链式反应(PCR)为基础的测定(被称为/>
Figure BDA0002490079900000512
测定系统)筛选。在本公开的实践中使用的/>
Figure BDA0002490079900000513
测定可以利用其中包含多个引物的/>
Figure BDA0002490079900000514
PCR测定混合物。PCR测定混合物中使用的引物可包含至少一种正向引物和至少一种反向引物。正向引物含有对应于DNA多核苷酸的特定区域的序列,而反向引物含有对应于基因组序列的特定区域的序列。此外,在PCR测定混合物中使用的引物可以包含至少一种正向引物和至少一种反向引物。例如,
Figure BDA0002490079900000515
PCR测定混合物可使用对应于两个不同的等位基因和一个反向引物的两种正向引物。正向引物之一含有对应于内源基因组序列的特定区域的序列。第二正向引物含有对应于DNA多核苷酸的特定区域的序列。反向引物含有对应于基因组序列的特定区域的序列。用于检测扩增反应的这种
Figure BDA0002490079900000516
测定是本公开的一个实施例。
在一些实施例中,荧光信号或荧光染料选自下组,该组由以下组成:HEX荧光染料、FAM荧光染料、JOE荧光染料、TET荧光染料、Cy 3荧光染料、Cy 3.5荧光染料、Cy 5荧光染料、Cy 5.5荧光染料、Cy 7荧光染料、和ROX荧光染料。
在其他实施例中,使用合适的第二荧光DNA染料进行扩增反应,所述第二荧光DNA染料能够以流式细胞术可检测的浓度范围染色细胞DNA,并且具有可被实时热循环仪检测的荧光发射光谱。本领域普通技术人员应该理解,其他核酸染料是已知的并且正在不断被鉴定。可以使用具有合适的激发和发射光谱的任何合适的核酸染料,如
Figure BDA0002490079900000517
SYTOX/>
Figure BDA0002490079900000518
SYBR
Figure BDA0002490079900000519
Figure BDA0002490079900000521
和/>
Figure BDA0002490079900000522
在一个实施例中,第二荧光DNA染料是以小于10μM、小于4μM或小于2.7μM使用的/>
Figure BDA0002490079900000523
在进一步的实施例中,下一代测序(NGS)可以用于检测。如Brautigma等人2010所述,DNA序列分析可用于确定分离和扩增片段的核苷酸序列。可将扩增的片段分离并亚克隆到载体中,并使用链终止子方法(也称为Sanger测序)或染料终止子测序进行测序。另外,扩增子可以用下一代测序进行测序。NGS技术不需要亚克隆步骤,并且可以在单个反应中完成多个测序读取。可商购获得三个NGS平台,来自454生命科学公司(Life Sciences)/罗氏公司(Roche)的基因组测序仪FLXTM,来自Solexa的Illumina Genome AnalyserTM和应用生物系统公司(Applied Biosystems)的SOLiDTM(缩写:“通过寡核苷酸连接和检测进行测序”)。另外,目前正在开发两种单分子测序方法。这些包括来自HelicosBioscienceTM的真正的单分子测序(tSMS)和来自太平洋生物科学公司(Pacific Biosciences)的Single Molecule Real TimeTM测序(SMRT)。
由454生命科学公司(Life Sciences)/罗氏公司(Roche)销售的基因组测序仪FLXTM是长读NGS,它使用乳液PCR和焦磷酸测序来生成测序读段。可以使用300-800bp的DNA片段或含有3-20kb的文库。该反应每次运行可产生超过一百万个约250至400个碱基的读段,总产量为250至400兆碱基。与其他NGS技术相比,该技术可产生最长的读段,但每次运行的总序列输出较低。
SolexaTM销售的Illumina Genome AnalyserTM是短读NGS,其使用荧光染料标记的可逆终止子核苷酸通过合成方法并基于固相桥式PCR测序。可以使用含有最多10kb DNA片段的配对末端测序文库的构建。反应产生超过1亿个短读段,长度为35-76个碱基。每次运行可产生3-6个千兆字节的数据。
Applied BiosystemsTM销售的寡核苷酸连接和检测测序(SOLiD)系统是一种短读段技术。这种NGS技术使用的片段双链DNA最长10kb。该系统通过连接染料标记的寡核苷酸引物和乳液PCR进行测序,以产生10亿个短读段,每次运行的总序列输出高达30个千兆位。
Helicos BioscienceTM的tSMS和Pacific BiosciencesTM的SMRT采用了不同的方法,其使用单个DNA分子进行序列反应。tSMS HelicosTM系统可产生多达8亿个短读段,每次运行可产生21个千兆字节。这些反应使用荧光染料标记的虚拟终止子核苷酸完成,所述核苷酸被称为“合成测序”方法。
Pacific BiosciencesTM销售的SMRT下一代测序系统使用合成实时测序。由于不受可逆终止子的限制,该技术可以产生高达1000bp的读段长度。每天使用该技术可以产生相当于二倍体人类基因组覆盖率一倍的原始读段吞吐量。
在另一个实施例中,可以使用印迹测定完成检测,包括蛋白质印迹、RNA印迹和DNA印迹。此类印迹测定是生物学研究中用于鉴定和定量生物样品的常用技术。这些测定包括首先通过电泳分离凝胶中的样品成分,随后将电泳分离的成分从凝胶中转移至由硝化纤维、聚偏二氟乙烯(PVDF)或尼龙等材料制成的转移膜上。也可以通过施加真空、毛细作用或压力将分析物直接点样在这些载体上,或直接定向到载体上的特定区域,而无需事先分离。然后通常对转移膜进行转移后处理,以增强被分析物彼此区分的能力并通过视觉或自动读取器进行检测。
在一个进一步的实施例中,可以使用ELISA测定完成检测,所述ELISA测定使用固相酶免疫测定来检测液体样品或湿样品中物质的存在,通常是抗原的存在。来自样品的抗原附接到板的表面。然后,将另一种特异性抗体涂在表面上,使其可以与抗原结合。该抗体与酶连接,在最后一步中,添加了含有酶底物的物质。随后的反应产生可检测的信号,最常见的是底物的颜色变化。
转基因植物
在实施例中,植物、植物组织、或植物细胞包含GmPSID2启动子。在一个实施例中,植物、植物组织、或植物细胞包含如下序列的GmPSID2启动子,所述序列选自SEQ ID NO:2的序列或与选自SEQID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在说明性实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含可操作地连接到转基因或异源编码序列的GmPSID2启动子,其中所述转基因或异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、选择性标记转基因或其组合。
根据一个实施例,提供了一种植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含可操作地连接到转基因的GmPSID2启动子衍生序列,其中所述GmPSID2启动子衍生序列包含序列SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施例中,提供了一种植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含SEQID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织或植物细胞是双子叶或单子叶植物或衍生自双子叶或单子叶植物的细胞或组织。在一个实施例中,所述植物选自下组,该组由以下组成:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和卡诺拉油菜。在一个实施例中,所述植物是玉蜀黍。在另一个实施例中,所述植物是大豆(soybean)(例如,大豆(Glycine max))。根据一个实施例,所述植物、植物组织、或植物细胞包含SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织、或植物细胞包含可操作地连接到转基因/异源编码序列的启动子,其中所述启动子由SEQ ID NO:2或与SEQ ID NO:2具有80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施例,所述基因构建体包含可操作地连接到转基因/异源编码序列的GmPSID2启动子序列,所述GmPSID2启动子序列被掺入植物、植物组织、或植物细胞的基因组中。
在实施例中,植物、植物组织、或植物细胞包含GmPSID25'UTR。在一个实施例中,植物、植物组织、或植物细胞包含如下序列的GmPSID2 5'UTR,所述序列选自SEQ ID NO:3的序列或与选自SEQID NO:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个说明性实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含可操作地连接到转基因的GmPSID2 5'UTR,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、选择性标记转基因或其组合。
根据一个实施例,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含可操作地连接到转基因的GmPSID2 5'UTR衍生序列,其中所述GmPSID2 5'UTR衍生序列包含序列SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施例中,提供了一种植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含SEQ IDNO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织或植物细胞是双子叶或单子叶植物或衍生自双子叶或单子叶植物的细胞或组织。在一个实施例中,所述植物选自下组,该组由以下组成:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和卡诺拉油菜。在一个实施例中,所述植物是玉蜀黍。在另一个实施例中,所述植物是大豆(soybean)(例如,大豆(Glycine max))。根据一个实施例,所述植物、植物组织、或植物细胞包含SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织、或植物细胞包含可操作地连接到转基因/异源编码序列的5'UTR,其中所述5'UTR由SEQ ID NO:3或与SEQ ID NO:3具有80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施例,将包含可操作地连接到转基因/异源编码序列的GmPSID2 5'UTR序列的基因构建体掺入所述植物、植物组织、或植物细胞的基因组中。
在实施例中,植物、植物组织、或植物细胞包含GmPSID2 3'UTR。在一个实施例中,植物、植物组织、或植物细胞包含如下序列的GmPSID2 3'UTR,所述序列选自SEQ ID NO:4的序列或与选自SEQID NO:4的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含选自SEQ ID NO:4的序列或与选自SEQ ID NO:4的序列具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个说明性实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含可操作地连接到转基因的GmPSID2 3'UTR,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、选择性标记转基因或其组合。
根据一个实施例,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含可操作地连接到转基因的GmPSID2 3'UTR衍生序列,其中所述GmPSID2 3'UTR衍生序列包含序列SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施例中,提供了一种植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含SEQ IDNO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织或植物细胞是双子叶或单子叶植物或衍生自双子叶或单子叶植物的细胞或组织。在一个实施例中,所述植物选自下组,该组由以下组成:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和卡诺拉油菜。在一个实施例中,所述植物是玉蜀黍。在另一个实施例中,所述植物是大豆(soybean)(例如,大豆(Glycine max))。根据一个实施例,所述植物、植物组织、或植物细胞包含SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织、或植物细胞包含可操作地连接到转基因/异源编码序列的3'UTR,其中所述3'UTR由SEQ ID NO:4或与SEQ ID NO:4具有80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施例,将包含可操作地连接到转基因/异源编码序列的GmPSID2基因3'UTR序列的基因构建体掺入所述植物、植物组织、或植物细胞的基因组中。
在实施例中,植物、植物组织、或植物细胞包含GmPSID2终止子。在一个实施例中,植物、植物组织、或植物细胞包含如下序列的GmPSID2终止子,所述序列选自SEQ ID NO:5的序列或与选自SEQID NO:5的序列具有80%、85%、90%、95%或99.5%序列同一性的序列。在实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个说明性实施例中,植物、植物组织、或植物细胞包含基因表达盒,所述基因表达盒包含可操作地连接到转基因的GmPSID2终止子,其中所述转基因/异源编码序列可以是杀昆虫抗性转基因、除草剂耐受性转基因、氮利用效率转基因、水利用效率转基因、营养品质转基因、DNA结合转基因、选择性标记转基因或其组合。
根据一个实施例,提供了植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含可操作地连接到转基因的GmPSID2终止子衍生序列,其中所述GmPSID2终止子衍生序列包含序列SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99.5%序列同一性的序列。在一个实施例中,提供了一种植物、植物组织、或植物细胞,其中所述植物、植物组织、或植物细胞包含SEQ IDNO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织或植物细胞是双子叶或单子叶植物或衍生自双子叶或单子叶植物的细胞或组织。在一个实施例中,所述植物选自下组,该组由以下组成:玉蜀黍、小麦、稻、高粱、燕麦、黑麦、香蕉、甘蔗、大豆、棉花、向日葵和卡诺拉油菜。在一个实施例中,所述植物是玉蜀黍。在另一个实施例中,所述植物是大豆(soybean)(例如,大豆(Glycine max))。根据一个实施例,所述植物、植物组织、或植物细胞包含SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99.5%序列同一性的序列,所述序列可操作地连接到非GmPSID2基因。在一个实施例中,所述植物、植物组织、或植物细胞包含可操作地连接到转基因/异源编码序列的终止子,其中所述终止子由SEQ ID NO:5或与SEQ ID NO:5具有80%、85%、90%、95%或99.5%序列同一性的序列组成。根据一个实施例,包含可操作地连接到转基因/异源编码序列的GmPSID2基因终止子的基因构建体被掺入所述植物、植物组织、或植物细胞的基因组中。
在实施例中,根据本文公开的方法的植物、植物组织或植物细胞可以是双子叶植物。双子叶植物、植物组织或植物细胞可以是但不限于苜蓿、油菜籽、卡诺拉油菜、印度芥菜、埃塞俄比亚芥菜、大豆、向日葵、棉花、豆类、西兰花、卷心菜、花椰菜、芹菜、黄瓜、茄子、生菜;瓜、豌豆、胡椒、花生、马铃薯、南瓜、萝卜、菠菜、甜菜、向日葵、烟草、番茄和西瓜。
本领域技术人员将认识到,在将外源序列稳定地掺入转基因植物中并确认是可操作的之后,可以通过有性杂交将其引入其他植物中。可以使用许多标准育种技术中的任何一种,这取决于要杂交的物种。
本公开还涵盖上述转基因植物的种子,其中所述种子具有含有本公开的基因调节元件的转基因/异源编码序列或基因构建体。本公开进一步涵盖上述转基因植物的后代、克隆、细胞系或细胞,其中所述后代、克隆、细胞系或细胞具有含有本公开的基因调节元件的转基因/异源编码序列或基因构建体。
本公开还涵盖上述转基因植物的培养,其中所述转基因植物具有含有本公开的基因调节元件的转基因/异源编码序列或基因构建体。因此,此类转基因植物可被工程化以尤其具有一个或多个所希望的性状或含有本公开的基因调节元件的转基因事件,通过与根据本发明的核酸分子被转化,并且可以通过本领域技术人员已知的任何方法被裁剪或培养。
表达转基因的方法
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因/异源编码序列或多接头序列的GmPSID2启动子的植物生长。在实施例中,所述GmPSID2启动子由选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因的GmPSID2启动子的植物生长。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含可操作地连接到至少一个转基因的GmPSID2启动子的植物组织或植物细胞。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2启动子。在一个实施例中,所述GmPSID2启动子由选自SEQ ID NO:2的序列或与选自SEQ ID NO:2的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2启动子。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2启动子。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2启动子。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2启动子。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因/异源编码序列或多接头序列的GmPSID2 5'UTR的植物生长。在实施例中,所述GmPSID2 5'UTR由选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因的GmPSID2 5'UTR的植物生长。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含可操作地连接到至少一个转基因的GmPSID2 5'UTR的植物组织或植物细胞。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 5'UTR。在一个实施例中,所述GmPSID2 5'UTR由选自SEQ ID NO:3的序列或与选自SEQ ID NO:3的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 5'UTR。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 5'UTR。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2 5'UTR。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2 5'UTR。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因/异源编码序列或多接头序列的GmPSID2 3'UTR的植物生长。在实施例中,所述GmPSID2 3'UTR由选自SEQ ID NO:4的序列或与选自SEQ ID NO:4的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因的GmPSID2 3'UTR的植物生长。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含可操作地连接到至少一个转基因的GmPSID2 3'UTR的植物组织或植物细胞。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 3'UTR。在一个实施例中,所述GmPSID2 3'UTR由选自SEQ ID NO:4的序列或与选自SEQ ID NO:4的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 3'UTR。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2 3'UTR。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2 3'UTR。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2 3'UTR。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因/异源编码序列或多接头序列的GmPSID2终止子的植物生长。在实施例中,所述GmPSID2终止子由选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含可操作地连接到至少一个转基因的GmPSID2终止子的植物生长。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含可操作地连接到至少一个转基因的GmPSID2终止子的植物组织或植物细胞。
在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2终止子。在一个实施例中,所述GmPSID2终止子由选自SEQ ID NO:5的序列或与选自SEQ ID NO:5的序列具有80%、85%、90%、95%或99.5%序列同一性的序列组成。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2终止子。在实施例中,在植物中表达至少一个转基因/异源编码序列的方法包括使包含基因表达盒的植物生长,所述基因表达盒包含可操作地连接到至少一个转基因的GmPSID2终止子。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2终止子。在实施例中,在植物组织或植物细胞中表达至少一个转基因/异源编码序列的方法包括培养包含基因表达盒的植物组织或植物细胞,所述基因表达盒含有可操作地连接到至少一个转基因的GmPSID2终止子。
提供以下实例以说明某些特定特征和/或实施例。这些实例不应被解释为将本公开限制为示例的特定特征或实施例。
实例
实例1:从大豆基因组序列中鉴定调节元件
通过下一代测序(NGS)获得25个大豆组织(品种Williams82)的总mRNA表达的表达谱,并用于鉴定寻找调节元件的候选大豆基因。包括的组织是从大豆植物的幼苗(展开的子叶、根、和下胚轴)、V5(叶和茎)、和R5(叶、花、种子和荚果发育的不同阶段)收集的。展现所希望的表达谱的大豆内源基因被鉴定为寻找调节序列的潜在候选者。
具有所希望的表达谱的基因之一是Glyma10g39460,其优选在地上绿色组织中表达。该基因被鉴定为光系统I亚基PsaD(Apweiler,Rolf等人"UniProt:the universal proteinknowledgebase[UniProt:通用蛋白质知识库]."Nucleic acids research 32[核酸研究].增刊_1(2004):D115-D119;可在http://www.uniprot.org/获得),因此将该基因称为“GmPSID2”。分离来自所述GmPSID2基因的调节序列,并表征其驱动转基因/异源编码序列表达的能力。所述GmPSID2的启动子在本文中以SEQ ID NO:1提供。
所述Glyma10g39460基因(GmPSID2)的调节序列被定义为所述启动子和5'非翻译前导序列(UTR)的Glyma10g39460基因的ATG上游约2kb序列,以及所述3'UTR和终止子的Glyma10g39460基因终止密码子下游约1kb。为了进一步改善所述调节序列,完成了对所述调节元件的另外的分析。使用先前在美国专利公开号20150128309A1(其通过引用以其整体并入本文)中公开的方法,对推定的上游和下游调节序列进行评估,以确定转座序列、抑制性DNA(甲基化)和染色质(组蛋白3赖氨酸4二甲基化,通常缩写为H3K4me2)标记的存在。包含抑制性DNA和染色质标记的Glyma10g39460基因DNA序列从来源的上游和下游调节序列中排除。还避免了在5'和3'序列中长段(100bp或更多)的AT富集序列(>75%AT富集),以作为减少从头合成DNA片段的困难的手段。
所得GmPSID2上游调节序列包含启动子(SEQ ID NO:2)和5'UTR(SEQ ID NO:3)。所述下游序列涵盖所述GmPSID2基因的3'UTR(SEQ ID NO:4)和终止子(SEQ ID NO:4)。所述终止子序列延伸超过最后一个已知的聚腺苷酸化位点约100-200bp。对候选GmpSID2启动子(SEQ ID NO:1)进行单碱基对改变以降低序列复杂性。从九个“A”段中去除碱基对的腺嘌呤核苷酸残基,得到八个“A”段;位于SEQ ID NO:1的启动子序列中第524位-第531位之间。
本文提供了源自大豆基因组的序列,GmPSID2(Glyma10g39460)基因启动子/5'UTR和终止子。
实例2:克隆来自大豆的调节序列
通过DNA2.0合成所述GmPSID2基因的启动子、5'UTR和3'UTR/终止子序列。图1显示了所述合成片段的图。在所述启动子/5'UTR与所述3'UTR/终止子序列之间包括含有接头的多克隆位点。
将所述合成GmPSID2片段(启动子/5'UTR和终止子)克隆到Gateway入门载体中,并将RFP/AAD12报告基因/异源编码序列(SEQ ID NO:10)插入在所述5'UTR与所述终止子之间。所述报告基因/异源编码序列是双报告子,所述双报告子编码包含通过刚性螺旋肽接头(Arai等人,(2001),ProteinEng[蛋白质工程],14,529-532以及Marqusee等人,(1987),Proc Natl Acad Sci USA[美国科学院院报],84,8898-8902所述的LAE(EAAAK)5AAA)连接的RFP和AAD12多肽的翻译融合蛋白。将所得表达盒(SEQ ID NO:11)移至二元载体并标记为pDAB122135。该二元载体还含有由拟南芥泛素3启动子和5'UTR(AtUbi3)驱动并由拟南芥泛素3终止子(AtUbi3)终止的绿色荧光蛋白(GFP)异源编码序列。同样,含有来自绿产色链霉菌(Streptomyces viridochromogenes)的合成草丁膦-N-乙酰转移酶基因/异源编码序列(PAT)的所述二元载体由木薯叶脉花叶病毒启动子(CsVMV)驱动,并由根癌农杆菌(Agrobacterium tumefaciens)Orf1终止子(AtuOrf1)终止。所述GFP和PAT基因/异源编码序列表达盒提供为SEQ ID NO:12。
用于GmAct7-2和GmGAPC1调节序列的克隆步骤与上述用于GmPSID2的克隆步骤相似。在pDAB122133构建体中测试所述GmAct7-2,并在pDAB122134构建体中测试GmGAPC1。
实例3:本氏烟(N.benthamiana)叶浸润及GmPSID2、GmAct7-2和GmGAPC1驱动的RFP/AAD12报告子表达的瞬时测定
接着,在27℃/24℃的16小时光周期下,使本氏烟植物在温室中生长。将20-24天大的植物用于瞬时表达测定。为此,使用两种修饰的根癌农杆菌菌株的混合物浸润顶部的3-4片叶子。将第一菌株用于所有浸润中,并携带含有表达P19沉默抑制子的转基因/异源编码序列的pDAB112236构建体(Voinnet等人(1999),Proc Natl Acad Sci U.S.A.[美国科学院院报],96,14147-14152)。第二农杆菌属菌株是携带测试构建体(带有GmPSID2、GmAct7-2、或GmGAPC1调节元件)的实验菌株,或是基准对照构建体(表1)。使用的两个基准构建体包含拟南芥泛素14启动子::拟南芥泛素14终止子(AtUbi14/AtUbi14)和拟南芥泛素10启动子::根癌农杆菌Orf23(AtUbi10/AtuOrf23)控制下的RFP/AAD12报告基因/异源编码序列。混合比率基于光密度(OD)读数。将所有农杆菌属培养物的密度调节至OD2.0。浸润后,使植物生长到ConvironTM上,直到浸润后第五天收集到被浸润的叶子为止。对于每个构建体,使用TyphoonTM扫描仪从25-30个单独的1.5cm叶盘上收集报告基因/异源编码序列的荧光数据。
在三个通道上扫描了来自本氏烟的所有样品;叶绿素(488nm蓝色激光,670nm BP30,580nm分离),GFP(488nm蓝色激光,520nm BP40,580nm分离),和RFP(532nm绿色激光,580nm BP30)。用于本氏烟的光电倍增管电压(PMT)设置为:叶绿素为340,GFP为340,并且RFP为360。
表1显示了本氏烟瞬时测定中的测试结果。对RFP/AAD12报告转基因/异源编码序列产生的荧光进行分析后揭示,所述GmPSID2调节序列产生的平均RFP荧光(794.1像素/面积)显著高于(p<0.0001)平均背景荧光(26.1像素/面积)。观察到,来自所述GmPSID2调节序列的RFP/AAD12荧光低于(p<0.0001)来自由所述AtUbi14/AtUbi14和所述AtUbi10/AtuOrf23的基准调节元件驱动的构建体的平均RFP/AAD12荧光:分别为7567.4和3084.5像素/面积。由所述GmPSID2调节元件支持的RFP/AAD12荧光显著高于背景表达,表明所述GmPSID2调节序列为功能性的,并且可用于驱动本氏烟叶瞬时测定中的转基因/异源编码序列的表达。
相比之下,对于所述GmPSID2调节序列(其驱动显著高于背景平均RFP/AAD12荧光表达),所述pDAB122333和pDAB122134构建体中分别含有的GmAct2-2和GmGAPC1调节序列仅产生与所述背景相似的低水平表达(表1)。这些结果证明,从头分离的GmAct2-2和GmGAPC1候选大豆调节序列不能驱动RFP/AAD12转基因/异源编码序列表达。所述pDAB122333和pDAB122134构建体缺少RFP/AAD12的表达并不是由于浸润差,而是因为这些构建体中的第二转基因/异源编码序列GFP显示出显著高于背景的强荧光(p<0.0001)。因此,这些结果显示来自Glyma06g15520和Glyma06g01850的从头候选调节序列不能驱动异源报告转基因/异源编码序列表达。
基于这些结果,不再进一步追究分别携带GmAct7-2和GmGAPC1候选调节序列的构建体pDAB122333和pDAB122134。相比之下,与所述本氏烟叶的背景相比,提出将含有所述GmPSID2调节序列并展现高水平RFP/AAD12荧光的pDAB122135构建体用于在稳定转化的拟南芥转基因植物中的进一步测试。
表1.在瞬时转化的本氏烟叶中测定RFP/AAD12荧光的结果。
Figure BDA0002490079900000651
注:***表明比平均背景荧光显著更高(p<0.0001)的平均值。使用非参数比较进行统计分析,对照使用Dunn方法,在
Figure BDA0002490079900000652
统计软件包中进行联合排名。
实例4:农杆菌属介导的拟南芥转化和转基因事件的分子分析
拟南芥生态型Columbia-0(Col-0)用于测试所述GmPSID2调节元件控制下的RFP/AAD12报告子的相对表达。使用标准的拟南芥转化程序通过荧光浸入法(inflorescence dip method)产生转基因种子(Clough和Bent,1998)。将T1种子播种在选择托盘(10.5"x21"x1",T.O.塑料公司(T.O.Plastics Inc.),克利尔沃特,明尼苏达州)上。为此,使用改良的气动喷雾装置将200mg冷分层种子(播种前48小时,0.1%琼脂+385mg/L Liberty)分配到选择托盘上,以每个选择托盘分配10ml种子悬浮液。将托盘用潮湿的圆顶覆盖,并用种子标识符标记,并且放在ConvironTM中,每个平板下面都有单独的浇水托盘。播种后约五天,将加湿圆顶移开。在播种后约10-14天,使用Hoagland的肥料进行次灌溉,进行选择托盘的第一次浇水。除用除草剂分层外,在播种后七天和九天,用0.2%的LibertyTM除草剂溶液(20μl/10mL蒸馏的H2O)喷洒植物。将抗LibertyTM的T1植物从选择托盘移植到两英寸的盆中,并使其生长七至十天,之后取样进行分子分析。
接着,使用从每棵植物上掐下的约0.5平方厘米的拟南芥叶,从叶上提取DNA。将所述样品收集在96孔DNA提取板中。然后将200μl提取缓冲液添加到每个孔中,并使用KlekoTM组织粉碎机(在最大设置下保持三分钟)用三毫米的不锈钢珠破坏组织。组织浸渍后,使用BioSprint 96DNA PlantKitTM分离DNA。
对于qPCR,使用设计用于检测pat和aad12基因/异源编码序列的水解探针测定转基因拷贝数(表2)。拟南芥内源基因AtTafII15(拟南芥基因座:AT4G31720)用于DNA模板浓度的归一化(表2)。如下执行qPCR:10μl Probes Master MixTM,含最终浓度为0.4μM的每种引物,以及0.2μM的每种探针。使用95℃进行PCR循环10分钟,随后进行40个扩增循环(95℃ 1分钟,60℃ 40秒,以及72℃ 1秒)和40℃ 1秒。所有qPCR测定均以双重形式运行,pat或aad12测定与内源基因AtTafII15的测定配对。基于ΔΔCt方法(
Figure BDA0002490079900000661
软件版本1.5),使用先进的相对定量算法将荧光信号跨越背景阈值的点的cp得分用于分析实时PCR数据。然后将所有样品相对于已知的半合子植物进行校准,以获得转基因/异源编码序列拷贝数。筛选了多达100个被鉴定为对LibertyTM有抗性的T1事件,以鉴定一个和两个拷贝的转基因事件,将其用于进一步分析T1转基因植物中转基因/异源编码序列表达。
表2.用于拟南芥转基因植物的基因分型和接合性分析的引物和探针
Figure BDA0002490079900000662
实例5:T1拟南芥植物中可操作地连接到GmPSID2调节序列的基因的评估
为了评估由所述GmPSID2启动子、GmPSID2 5'UTR和GmPSID2终止子调节元件驱动的RFP/AAD12报告基因/异源编码序列的表达,鉴定单拷贝转基因事件并使用Typhoon仪器测定RFP/AAD12荧光。在三个通道上扫描了所有样品:叶绿素(488nm蓝色激光,670nm BP30,580nm分离),GFP(488nm蓝色激光,520nm BP80,580nm分离)和RFP(532nm绿色激光,580nm BP30)。叶组织的PMT设置是叶绿素400、GFP 400和RFP 420。为了分析各叶的荧光,自低拷贝(1-2个拷贝)转基因事件从每棵植物中收获完全展开的莲座叶,并从近轴(顶)侧进行扫描。“轮廓绘制”功能用于勾勒叶片形状,并通过将信号量除以叶表面来确定归一化的荧光。表3显示了结果。
针对RFP/AAD12荧光的进行的T1事件分析揭示,所述GmPSID2调节元件支持高平均RFP/AAD12荧光(2418.8像素/面积),这在统计学上高于(p<0.0001)非转基因野生型对照(Wt)中检测的平均背景荧光(350.5像素/面积)(表3)。这些结果显示,所述GmPSID2调节序列驱动RFP/AAD12报告基因在转基因拟南芥植物中的高表达。由所述GmPSID2调节元件产生的平均RFP/AAD12荧光与所述pDAB117559(1492.3像素/面积)和pDAB117560(1547.6像素/面积)基准构建体的RFP/AAD12荧光水平相似(p=1.0000,未显示)。在所述pDAB117559和pDAB117560构建体中,所述RFP/AAD12报告子受以下调节元件的控制;分别为拟南芥泛素14启动子::拟南芥泛素14终止子和拟南芥泛素10启动子::根癌农杆菌Orf23终止子。基于这些结果,提出了含有所述GmPSID2调节序列的转基因pDAB122135事件,以进一步在T2拟南芥中进行表征。
表3.转基因T1拟南芥植物叶中RFP/AAD12报告基因/异源编码序列表达的测试性表达结果
Figure BDA0002490079900000671
注:***表明比平均背景荧光显著更高(p<0.0001)的平均值。使用非参数比较进行统计分析,对照使用Dunn方法,在
Figure BDA0002490079900000681
统计软件包中进行联合排名。
实例6:可操作地连接到GmPSID2调节序列的基因在T2拟南芥植物叶中的表达
与T1拟南芥中基准拟南芥泛素14启动子::拟南芥泛素14终止子和拟南芥泛素10启动子::根癌农杆菌Orf23终止子调节序列的表达水平相比,所述GmPSID2调节序列展现出相似的表达水平(实例5)。提出了含有驱动所述RFP/AAD12报告基因/异源编码序列的所述GmPSID2调节序列的选择事件,以进一步在T2拟南芥植物中进行表征。因此,选择了表达中至高RFP/AAD12和pDAB12235的GFP表达转基因事件的五个T1植物用于T2植物测试。从这五个事件中,每个事件都生长了56棵植物。如实施例4中所述对所述T2植物进行分子基因分型。基于分子分析,保留所有纯合子和相当数量的半合子植物用于荧光分析。为了简化两个拷贝转基因事件的数据解释,仅保留半合子植物用于表达分析。
表4提供了T2转基因植物的分析结果。在GmPSID2调节元件的控制下,含有RFP/AAD12转基因/异源编码序列的纯合子(1个拷贝)和半合子(1和2个拷贝)事件的结果展现出RFP/AAD12荧光显著高于非转基因对照植物的背景荧光。虽然由所述GmPSID2调节元件产生的平均RFP/AAD12荧光显著高于背景荧光,但该荧光却低于基准pDAB117559和pDAB117560构建体的荧光(p<0.001,未显示)。在所述pDAB117559和pDAB117560构建体中,所述RFP/AAD12报告子受以下调节元件的控制:分别为拟南芥泛素14启动子::拟南芥泛素14终止子和拟南芥泛素10启动子::根癌农杆菌Orf23终止子。这些结果证明,所述GmPSID2调节序列在两代转基因事件中支持转基因/异源编码序列的稳健表达,而所述GmPSID2调节序列支持可遗传的转基因表达。
表4.转基因T2拟南芥植物叶中RFP/AAD12报告基因/异源编码序列表达的测试性表达结果
Figure BDA0002490079900000691
注:星号表明荧光平均值显著高于平均背景荧光(**p<0.01,***p<0.0001)。使用非参数比较进行统计分析,对照使用Dunn方法,在
Figure BDA0002490079900000692
统计软件包中进行联合排名。
查询单独的转基因事件(表5)揭示,在所有单拷贝和两个拷贝的pDAB122135转基因事件中均检测到RFP/AAD12荧光,表明GmPSID2一致地表达,而与基因组整合位点或转基因整合的拷贝数无关。通常,来自单拷贝转基因事件的纯合子GmPSID2转基因植物展现出RFP/AAD12荧光增加,表明转基因/异源编码序列表达是拷贝数依赖性的。含有两个拷贝转基因事件的半合子转基因事件显示出可变的RFP/AAD12荧光。这种变异可能反映了可能的转基因/异源编码序列DNA重排,这可能会损害一些转基因/异源编码序列拷贝中的转基因/异源编码序列表达,从而导致具有不同潜在重排的单独的事件之间存在更大的变异。
总之,对转基因T2拟南芥事件的测试显示,在所有测试的转基因事件中,所述GmPSID2调节元件驱动所述RFP/AAD12报告基因/异源编码序列的可遗传表达。这些结果重申,在稳定转化的拟南芥植物中,所述GmPSID2调节元件在驱动可遗传的转基因/异源编码序列表达方面高度有效。
表5.单独的T2拟南芥事件的纯合子和半合子植物叶中RFP/AAD12报告基因/异源编码序列表达的测试性表达结果
Figure BDA0002490079900000701
实例7:使用实时
Figure BDA0002490079900000702
PCR进行的大豆转基因植物的产量和转基因拷贝数估计
在转基因大豆植物中进一步测试了所述GmPSID2调节元件(pDAB122135)。使用通过引用以其整体并入本文的Pareddy等人,US 2014/0173774 A1描述的分离种子方法产生转基因大豆植物。对转基因植株进行分子分析,以确定转基因/异源编码序列拷贝数。对于该叶组织,将来自转基因大豆植物和非转基因对照的样品收集在96孔收集管中。使用2mm钨珠进行组织破坏。组织浸渍后,使用Agilent BioCelTM上的MagAttract Plant kitTM(凯杰公司(Qiagen),希尔登,德国)以高通量形式分离基因组DNA。通过使用类似于
Figure BDA0002490079900000711
测定的水解探针测定,确定PAT的转基因拷贝数,与大豆内部参考基因GMS116(Genbank登录号:AK286292.1的GMFL01-25-J19)形成双重。使用
Figure BDA0002490079900000712
探针设计软件2.0设计所述测定。通过使用类似于/>
Figure BDA0002490079900000713
测定的水解探针测定,确定壮观霉素抗性基因(SpecR)的转基因存在/不存在,与大豆内部参考基因GMS116形成双重。设计该测定以检测位于用于转化的二元构建体骨架内的所述SpecR基因/异源编码序列。仅再生没有用SpecR探针扩增的事件,因为这表明在转基因大豆基因组中不太可能存在骨架片段。为了扩增所有目的基因(PAT,SpecR,GMS116),在10μL体积多重反应中以1x终浓度制备/>
Figure BDA0002490079900000714
ProbesMaster mixTM(罗氏应用科学公司(Roche Applied Science)),该多重反应含有0.4μM每个引物和0.2μM每个探针(表6中列出的引物和探针的组成)。使用LIGHTCYCLER 480systemTM(罗氏应用科学公司)进行两步扩增反应,并在60℃延伸60秒,并进行荧光采集。
使用
Figure BDA0002490079900000715
软件1.5版,使用高级相对定量模块,并且基于ΔΔCt方法进行实时PCR数据的分析。对于PAT,每次运行均包括已知的单拷贝gDNA的样品,并将其用作单拷贝校准物。另外,对于所有目的基因,每次运行都包括作为阴性对照的野生型(Maverick)样品。
表6.位于骨架和内部参照(GMS116)中的PAT和SpecR基因的水解探针测定的引物和探针信息。所有序列均以5'-3'表示。
Figure BDA0002490079900000716
实例8:T0大豆植物中GmPSID2调节序列表达的评估
在大豆转基因植物中测试了由所述GmPSID2调节元件进行的基因表达。对于该分析,如实施例7所述产生大豆植物的稳定转化。使携带来自所述GmPSID2调节元件构建体(pDAB122135)和对照基准构建体(pDAB117559和pDAB117560)转化的低转基因拷贝数(1-2个拷贝)的转基因植株再生并移植到土壤中。适应后,对植株取样以评估最顶部完全展开的叶中的转基因表达。为了评估由所述GmPSID2启动子/5'UTR和GmPSID2终止子调节元件驱动的RFP/AAD12报告基因的表达,使用Typhoon仪器在三个通道上扫描了转基因叶:叶绿素(488nm蓝色激光,670nm BP30,580nm分离),GFP(488nm蓝色激光,520nm BP40,580nm分离),和RFP(532nm绿色激光,580nm BP30)。叶组织的PMT设置是叶绿素400,GFP 400,和RFP 420。表7显示了所述RFP/AAD12和GFP报告基因的荧光结果。由所述GmPSID2调节序列驱动的报告基因/异源编码序列的表达是稳健的。由所述GmPSID2调节序列指定的平均RFP荧光显著高于(p<0.01)以下对照调节元件的平均RFP荧光:拟南芥泛素14启动子::拟南芥泛素14终止子和拟南芥泛素10启动子::根癌农杆菌Orf23终止子。这些结果显示,GmPSID2调节序列在驱动大豆转基因植物中报告转基因表达方面高度有效。
表7.低拷贝(1-2个拷贝)T0大豆植物叶中RFP/AAD12报告基因/异源编码序列表达的测试性表达结果
Figure BDA0002490079900000721
注:星号表明荧光平均值显著高于平均背景荧光(**p<0.01,***p<0.0001)。使用非参数比较进行统计分析,对照使用Dunn方法,在
Figure BDA0002490079900000722
统计软件包中进行联合排名。
实例9:可操作地连接到GmPSID2启动子、GmPSID2 5'UTR、GmPSID2 3'UTR和/或GmPSID2终止子的基因的农杆菌属介导的转化
通过利用与先前在专利申请WO 2007/053482的实例#11或实例#13中所述的相同的技术,可以将大豆用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化。
通过利用与先前在美国专利号7,838,733的实例#14或专利申请WO 2007/053482(Wright等人)的实例#12中所述的相同的技术,可以将棉花用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化。
通过利用与先前在美国专利号7,838,733的实例#26或专利申请WO 2007/053482(Wright等人)的实例#22中所述的相同的技术,可以将卡诺拉油菜用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化。
通过利用与先前在专利申请WO 2013/116700A1(Lira等人)的实例#23中所述的相同的技术,可以将小麦用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化。
通过利用与先前在专利申请WO 2013/116700A1(Lira等人)的实例#19中所述的相同的技术,可以将稻用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化。
实例10:可操作地连接到GmPSID2调节元件的基因的农杆菌属介导的转化
根据本公开,可以使用本领域已知的技术根据本公开的实施例转化另外的作物。对于农杆菌属介导的黑麦转化,参见,例如,Popelka JC,Xu J,Altpeter F.,“Generation of rye with lowtransgene copy number after biolistic gene transfer and production of(Secale cerealeL.)plants instantly marker-free transgenic rye[在进行基因枪基因转移后产生具有低转基因拷贝数的黑麦,并立即产生无标记的转基因黑麦(黑麦(Secale cereale L.))植物],”TransgenicRes.[转基因研究]2003年10月;12(5):587-96.)。对于农杆菌属介导的高粱转化,参见,例如,Zhao等人,“Agrobacterium-mediated sorghum transformation[农杆菌属介导的高粱转化],”Plant MolBiol.[植物分子生物学]2000年12月;44(6):789-98。对于农杆菌属介导的大麦转化,参见,例如,Tingay等人,“Agrobacterium tumefaciens-mediated barley transformation[根癌农杆菌介导的大麦转化],”The Plant Journal[植物杂志],(1997)11:1369-1376。对于农杆菌属介导的小麦转化,参见,例如,Cheng等人,“Genetic Transformation of Wheat Mediated by Agrobacteriumtumefaciens[通过根癌农杆菌介导的小麦基因转化],”Plant Physiol.[植物生理学]1997年11月;115(3):971-980。对于农杆菌属介导的稻转化,参见,例如,Hiei等人,“Transformation of ricemediated by Agrobacterium tumefaciens[通过根癌农杆菌属介导的稻转化],”Plant Mol.Biol.[植物分子生物学]1997年9月;35(1-2):205-18。
这些植物和其他植物的拉丁文名称如下。应当清楚,可以使用其他(非农杆菌属)转化技术将可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化到例如这些植物和其他植物中。实例包括但不限于:玉米(玉蜀黍)、小麦(小麦属物种(Triticum spp.))、稻(稻属物种(Oryza spp.)和菰属物种(Zizania spp.))、大麦(大麦属物种(Hordeum spp.))、棉花(水麻(Abroma augusta)和棉属物种(Gossypium spp.))、大豆(Soybean)(大豆(Glycine max))、糖和甜菜(甜菜属物种(Beta spp.))、甘蔗(砂糖椰子(Arenga pinnata))、番茄(Tomato)(番茄(Lycopersicon esculentum))及其他物种、粘果酸浆(Physalis ixocarpa)、黄水茄(Solanum incanum)及其他物种、和树番茄(Cyphomandra betacea))、马铃薯(Potato)(马铃薯(Solanum tuberosum))、甘薯(Sweet potato)(甘薯(Ipomoea batatas))、黑麦(黑麦属物种(Secalespp.))、辣椒(Peppers)(辣椒(Capsicum annuum)、中华辣椒(chinense)、和小米辣(frutescens))、莴苣(Lettuce)(莴苣(Lactuca sativa)、山莴菊(perennis)、和野莴苣(pulchella))、卷心菜(芸苔属物种(Brassica spp.))、芹菜(旱芹(Apium graveolens))、茄子(Eggplant)(茄子(Solanummelongena))、花生(落花生(Arachis hypogea))、高粱(高粱属物种(Sorghum spp.))、苜蓿(紫花苜蓿(Medicago sativa))、胡萝卜(野胡萝卜(Daucus carota))、豆类(菜豆属物种(Phaseolus spp.)、及其他属)、燕麦(Oats)(燕麦(Avena sativa)和糙伏毛燕麦(strigosa))、豌豆(豌豆属(Pisum)、豇豆属(Vigna)、和翅荚豌豆属(Tetragonolobus)物种)、向日葵(Sunflower)(向日葵(Helianthusannuus))、南瓜(南瓜属物种(Cucurbita spp.))、黄瓜(Cucumber)(黄瓜(Cucumis sativa))、烟草(烟草属物种(Nicotiana spp.))、拟南芥属(拟南芥(Arabidopsis thaliana))、草坪草(黑麦草属(Lolium)、翦股颖属(Agrostis)、早熟禾属(Poa)、狗芽根属(Cynodon)、及其他属)、三叶草(三叶草属(Trifolium))、野豌豆(野豌豆属(Vicia))。例如,在本公开的实施例中考虑了用可操作地连接到所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子的基因转化此类植物。
使用所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子来驱动可操作地连接的基因,这可以部署在许多落叶和常绿木材物种中。此类应用也在本公开的实施例的范围内。这些物种包括但不限于:桤木(桤木属物种(Alnus spp.))、白蜡(白蜡属物种(Fraxinus spp.))、山杨和白杨物种(杨属物种(Populus spp.))、山毛榉(山毛榉属物种(Fagusspp.))、桦木(桦木属物种(Betula spp.))、樱桃树(李属物种(Prunus spp.))、桉树(桉属物种(Eucalyptus spp.))、山核桃木(山核桃属物种(Carya spp.))、槭树(槭属物种(Acer spp.))、栎树(栎属物种(Quercus spp.))、和松树(松属物种(Pinus spp.))。
使用所述GmPSID2启动子、所述GmPSID2 5'UTR、所述GmPSID2 3'UTR和/或所述GmPSID2终止子来驱动可操作地连接的基因,这可以部署在观赏和挂果物种中。此类应用也在本公开的实施例的范围内。实例包括但不限于:玫瑰(蔷薇属物种(Rosa spp.))、紫果卫矛(卫矛属物种(Euonymusspp.))、矮牵牛(茄科物种Petunia spp.))、秋海棠(秋海棠属物种(Begonia spp.))、杜鹃(杜鹃花属物种(Rhododendron spp.))、红果或苹果(苹果属物种(Malus spp.))、梨(梨属物种(Pyrus spp.))、桃(李属物种(Prunus spp.))、和万寿菊(万寿菊属物种(Tagetes spp.))。
尽管上面已经讨论了许多示例性方面和实施例,但是本领域技术人员将认识到某些修饰、置换、添加和其亚组合。因此,旨在将以下所附权利要求和此后引入的权利要求解释为包括所有此类修饰、置换、添加和亚组合,如在其真实精神和范围内。
序列表
<110> 陶氏益农有限公司(Dow AgroSciences LLC)
SIDORENKO, LYUDMILA
LARSEN, CORY
ANTHONY, GENY
SREEDHARAN, SRIRAM
BUTLER, HOLLY
<120> 用于转基因表达的植物启动子
<130> 79350-US-PSP
<160> 27
<170> PatentIn 3.5版
<210> 1
<211> 2022
<212> DNA
<213> 人工序列
<220>
<223> 合成GmPSID2(由多克隆位点连接的启动子/5'UTR和终止子)
<400> 1
caaatggtaa aagaaataaa tagttcatac tatttttttc caaattttga aagactttgt 60
gatctcttac agacacaata gcaatcaaat agagaataat cttacgataa aaaaagagaa 120
acaaactcat taaatataat aataataact aggataaaat aagtttatag ccaatttttg 180
ttgaatctgg tttttagtct atgatatatc atgtaattta gttcctaaaa tttatatgaa 240
aaaaaatggt tttagtgtat gggttcactc ctcaattttt gtacttttct taacttgaga 300
tttagaaaag acactaaaaa caagtatttt ataaaattct gggacaaaat tgtttagtat 360
gaaagtttgg aaattagaca caagatttaa taaaagtttg tagactaaaa acatatttta 420
tctactaaaa gtcatcaatt tttataacaa ttatatataa ttatgtttat aatgtaatct 480
tagtaattag atatataaat agataaatga gacttataat aataaaaaaa acatataatt 540
aactcaagta ataacaattg agaaaaagac atagaaatgt cattcttatt atatctatta 600
attagtatac atatttcttt gggttagatt ataattaatg aaaacaaata ttagtaaaaa 660
gattaatata taataattga taacaaatat tattatattt attaataggt gtattttttt 720
tactataatt attatatatt cattaaaaaa tttaaggaag ggttactaaa agaaaataaa 780
atggttttga gaagaggggg ggctgattta gatgtctgat ttttttaatt aaactgtgaa 840
gtattctttt agctgagaaa caattctgtt tttgtaattg tatttttaag ggatatgaag 900
ctagctagga agatgaataa gaggtgtgag ttgtaagggt tgggtaaggg aatatgagat 960
tgtaattggt ccaaggcata tcaccttatc catatccaca tccaaaatct cctactttac 1020
tctctctctc tctctgacaa ccccaacact tgtattgtct caagcaaccg gatccacacg 1080
acaccatggt gagtagttag cttaatcact taggtcaccg agctcgcaca caactctatc 1140
ttcatcatca tcatcccccg tgcttccttt atatgctata tattctcatg tgatatcatg 1200
tacctattgt caattttatt atgccacaaa tattgcttaa actctgtacc ttaattttac 1260
acttcttttt cgctattttg gtgattatta tttgtgccaa ctgcatggtt tggattaata 1320
ttgatttgct tcagcttcat ccaacttatg ctagagtagg gaatagtgat agtcatactc 1380
aaaccaaacg aggataggtt gcgtaaatag tgaaatctga aatctcgagc tgaagtgaga 1440
attttgtgat cttcagtgaa ttgagtatta atattttata tcaaaaaggc gcgttaaagt 1500
aagatataat cgtcagggag actgttcacg ttctacaagc aatttagtcg ttactgcgtg 1560
ctttttaact tcagattgtg agaagggact ggtcattttt ttaactatat tgtatgattg 1620
catggtatga aagtttgaaa gactaaaaac atgattcaat cgtatatatt gaatttgaat 1680
caaacaataa attcgggaca cattcaaatt aacctctggg ctgaattagt gggacgggag 1740
aatcatggtc aaccctagaa gaaaaaaggg cttgataaga caacggacca ggtgagccat 1800
agttcaaaat tgcagcaact taaccagctt ccaaaccaaa tccccagacc tgaatccgct 1860
gagagtttga gtttgaggaa acttaattat gtgaatttga gtttaataga tactatatat 1920
gtactattat agtgtaaaca ttgttaatca gttataaatt atttttatat gattttttaa 1980
gtaattaata taaaaatcaa gaaatatata atatacaata at 2022
<210> 2
<211> 821
<212> DNA
<213> 人工序列
<220>
<223> 合成GmPSID2启动子
<400> 2
caaatggtaa aagaaataaa tagttcatac tatttttttc caaattttga aagactttgt 60
gatctcttac agacacaata gcaatcaaat agagaataat cttacgataa aaaaagagaa 120
acaaactcat taaatataat aataataact aggataaaat aagtttatag ccaatttttg 180
ttgaatctgg tttttagtct atgatatatc atgtaattta gttcctaaaa tttatatgaa 240
aaaaaatggt tttagtgtat gggttcactc ctcaattttt gtacttttct taacttgaga 300
tttagaaaag acactaaaaa caagtatttt ataaaattct gggacaaaat tgtttagtat 360
gaaagtttgg aaattagaca caagatttaa taaaagtttg tagactaaaa acatatttta 420
tctactaaaa gtcatcaatt tttataacaa ttatatataa ttatgtttat aatgtaatct 480
tagtaattag atatataaat agataaatga gacttataat aataaaaaaa acatataatt 540
aactcaagta ataacaattg agaaaaagac atagaaatgt cattcttatt atatctatta 600
attagtatac atatttcttt gggttagatt ataattaatg aaaacaaata ttagtaaaaa 660
gattaatata taataattga taacaaatat tattatattt attaataggt gtattttttt 720
tactataatt attatatatt cattaaaaaa tttaaggaag ggttactaaa agaaaataaa 780
atggttttga gaagaggggg ggctgattta gatgtctgat t 821
<210> 3
<211> 248
<212> DNA
<213> 大豆
<400> 3
tttttaatta aactgtgaag tattctttta gctgagaaac aattctgttt ttgtaattgt 60
atttttaagg gatatgaagc tagctaggaa gatgaataag aggtgtgagt tgtaagggtt 120
gggtaaggga atatgagatt gtaattggtc caaggcatat caccttatcc atatccacat 180
ccaaaatctc ctactttact ctctctctct ctctgacaac cccaacactt gtattgtctc 240
aagcaacc 248
<210> 4
<211> 740
<212> DNA
<213> 大豆
<400> 4
gcacacaact ctatcttcat catcatcatc ccccgtgctt cctttatatg ctatatattc 60
tcatgtgata tcatgtacct attgtcaatt ttattatgcc acaaatattg cttaaactct 120
gtaccttaat tttacacttc tttttcgcta ttttggtgat tattatttgt gccaactgca 180
tggtttggat taatattgat ttgcttcagc ttcatccaac ttatgctaga gtagggaata 240
gtgatagtca tactcaaacc aaacgaggat aggttgcgta aatagtgaaa tctgaaatct 300
cgagctgaag tgagaatttt gtgatcttca gtgaattgag tattaatatt ttatatcaaa 360
aaggcgcgtt aaagtaagat ataatcgtca gggagactgt tcacgttcta caagcaattt 420
agtcgttact gcgtgctttt taacttcaga ttgtgagaag ggactggtca tttttttaac 480
tatattgtat gattgcatgg tatgaaagtt tgaaagacta aaaacatgat tcaatcgtat 540
atattgaatt tgaatcaaac aataaattcg ggacacattc aaattaacct ctgggctgaa 600
ttagtgggac gggagaatca tggtcaaccc tagaagaaaa aagggcttga taagacaacg 660
gaccaggtga gccatagttc aaaattgcag caacttaacc agcttccaaa ccaaatcccc 720
agacctgaat ccgctgagag 740
<210> 5
<211> 897
<212> DNA
<213> 大豆
<400> 5
gcacacaact ctatcttcat catcatcatc ccccgtgctt cctttatatg ctatatattc 60
tcatgtgata tcatgtacct attgtcaatt ttattatgcc acaaatattg cttaaactct 120
gtaccttaat tttacacttc tttttcgcta ttttggtgat tattatttgt gccaactgca 180
tggtttggat taatattgat ttgcttcagc ttcatccaac ttatgctaga gtagggaata 240
gtgatagtca tactcaaacc aaacgaggat aggttgcgta aatagtgaaa tctgaaatct 300
cgagctgaag tgagaatttt gtgatcttca gtgaattgag tattaatatt ttatatcaaa 360
aaggcgcgtt aaagtaagat ataatcgtca gggagactgt tcacgttcta caagcaattt 420
agtcgttact gcgtgctttt taacttcaga ttgtgagaag ggactggtca tttttttaac 480
tatattgtat gattgcatgg tatgaaagtt tgaaagacta aaaacatgat tcaatcgtat 540
atattgaatt tgaatcaaac aataaattcg ggacacattc aaattaacct ctgggctgaa 600
ttagtgggac gggagaatca tggtcaaccc tagaagaaaa aagggcttga taagacaacg 660
gaccaggtga gccatagttc aaaattgcag caacttaacc agcttccaaa ccaaatcccc 720
agacctgaat ccgctgagag tttgagtttg aggaaactta attatgtgaa tttgagttta 780
atagatacta tatatgtact attatagtgt aaacattgtt aatcagttat aaattatttt 840
tatatgattt tttaagtaat taatataaaa atcaagaaat atataatata caataat 897
<210> 6
<211> 1416
<212> DNA
<213> 人工序列
<220>
<223> 来自Glyma06g15520的合成GmAct7-2启动子和5'UTR
<400> 6
aacaccagta tgacgaggtc gaccaacaat actgggaaac acagccctag gagcatcgtc 60
acagcaaatc ctgcctgtac acagatgatc atttaaataa attgagcaat aatgaaacca 120
agactaaata gatgcaatta cactaacaag aaactgcaaa gtactaacct tcaccattcc 180
agttccattg tcacaaacaa ggggttgaat atcctcagca tcagccattt tttaccaaac 240
tacagtacgc atacaataaa ttgtcagtac caccaagttt gaatagacaa tctacagaac 300
ccagccattt acagactttg agggtttact tcaaactctc tttttctaca caagacagca 360
tcatagtata tataacacac aaaatcaata ggaaagaaaa caaggaaaaa aaataattca 420
gtattataca atctacttag aaataaaaca gtaacaaatg tacataaaca gataaaggag 480
ccgatcctgt gcatttttta aatgaaactg ccaaaattaa tagatgaata gaaaacgtcc 540
attaggacac cagctaaaat ctcagaagtc ctctgacaca gcatatctta agttcccaaa 600
ccaaatgatc ttctactaag aaagatcaat gaggaaaaaa ataaagccaa aaaagtgata 660
aaaaaaacag atcagaccat aaatccatcc aacaccagat tatgtaatcg atggctatcc 720
acatttcaga ataagtaaag gtacagttca aaaagttcga agatctctgc tatagaagat 780
cggaactgtg atatgtcatt tccaccacta aaactacaga tcgccacaat ctactacatt 840
tcattcagta tagatcaggt agtacgaata taaataatca gatacaaaac atccagatat 900
gattttgatg aggtaggtaa caatcttatc tcacacagat ttaaaaagaa aaacataaaa 960
aagagtacta ctatggaaca aatctaagaa taaacattcg agattgcaaa aagcgctgaa 1020
tcaaagagca aaaggaaacg tactttgcat caaagttatg atgtgagaga ttaagatgaa 1080
taccttgtgt gagaagaaga agatggctta gcactcactc acacacacac acactctctc 1140
tctctccggt gcttgagggc tacagaaaga ggaaagagga atgagaagag agaaggggag 1200
aaggagaggg ggtatatata tgcggaaaga gagagtgtgt cgttggtgtg agagtgagag 1260
tgtaatgtaa tgtatttgaa attggaattg aggttgggac caaaaattga aattgaagga 1320
ctggagagag agggaatcat ttcgaccacg agaaaagagg gatagggtga ctggatgaca 1380
gccttttctt tttcatttca cacctttcta cccttt 1416
<210> 7
<211> 1170
<212> DNA
<213> 人工序列
<220>
<223> 来自Glyma0618110的合成GmGAPC2启动子和5' UTR
<400> 7
cccaaataac tgctaattag tatgaatagg ataggattag tacaatctat tgcaggaaag 60
tatgtgttca tgttttatta gacaaaaatt aaacaaaatt ttaaaataaa aaacagagga 120
aatcatgcct tggcttggta acttactatc ttctggtcct tcatatgata aacaaacagt 180
gtttttttcc cctaatcata agaatcatat aattattttt aaatgtatta ataactattt 240
ttttatatct ttaatttgtt gtgaagtctt ttaatgatca ctcattattc atgaaagtat 300
atacagttaa tgaactatta ataatataac ttattctcat cggttaacaa gtatttttca 360
tgtattatga gtagtgatat tatatgtaac cacttcttat atccattgat tttatggata 420
tttttaaaat aaaatttgaa tttatattag tattaattaa aagtaactac tttaatcatt 480
tttatttgtc ttgattattt aatcttatgg ttttcatttg tgatgatgat caaagatagt 540
atgatagtat gattttgtta tatttgtgca acacttagtt atgtttaata atttttttta 600
aaaaaatata aatatattga aaaggtcata tgcaagcggt agcctcaccc aagaataatt 660
aaaatagacc caaattctct gaataaatag acctaaatac tccatgaatg tgtttcattg 720
tttgttattt gatgttcatc aaatatcaaa tataattaaa gctcatcata ttctcgtaca 780
gtatagtatt agtattatat cctgctcact aaaccaaaca tctaagaata accttatttc 840
atttagaaaa aaaacccaag taaaattgaa aaaagaatca aaacaataaa aagagagaaa 900
agcgaatgga atattcgcat atctgttggc gtgaaacaga aaccacaaaa aaaacggtac 960
agcgtagtag tccttggcaa agcatcacga gtcacaaggc ggtcccgtag gagtcacgca 1020
cttcacttgg cccatttacc tgtcattgcg gtcttttact cttctcaata ccttattaaa 1080
accctatctc actcactcac tcacaccgtt ccatttctca acaacttctg ctacttccta 1140
ctccaaccgc acttctgctc cgcaattatc 1170
<210> 8
<211> 632
<212> DNA
<213> 大豆
<400> 8
aggtgggata ggattggagg gtatattcgg agctgtgatg tatcatatat tgtgtggcat 60
ccctctggat gtggcgggca cagaattgat gagaagcatt tttcaccttg gaattcatca 120
atgtcttcga aagtaggttg tctgtagcaa aggagtgatt gtgaatgctt attttatttt 180
ctatgtatcc tttttcagag ttcacatttt ttttggcctt cggaacatta atgtgaatgt 240
ctatagctac atgtatcgag aattttatat aagattgtca gttcgcactc aaattatcaa 300
attttagttt attcatgaat cacttgcccg atatttgagt gtgctatagg catgaagaca 360
cacttaaaag ttgtaatggt gaggatacct gcacgatccc tggtttacca ggagtccaag 420
ggaagggaaa atatctaaat actctaattt tgctatcggt taaatttaat tttaatattt 480
tttagtattg agtttattaa tgtgtatgat tatgctctgt tacgtgttat gtttttagtt 540
gagtaaataa tttcacaaga atttcagata acaagaataa ttttacattc aaacctagtg 600
gatacacgat atatgaatga aaagaatatt gt 632
<210> 9
<211> 525
<212> DNA
<213> 大豆
<400> 9
ggtgttactt caaagtagct tgtcttcaca ttattaccgt atgtttatgt ttagctgcga 60
tttagtgtct tgctcgagca aaaaatgaga ggtctgaata aatcggtttc tgaaaccagt 120
ggtgttactt gttggaggag cattagctct tttttggact tttgatgttt tctcttgtgg 180
agggggatcg agtttttgga tttttatata ctcgctgatg tacttggctt gaatacttgc 240
taatgtactt gttattgatt gttatagtag atatttgtcc gtcctttttt tcatttgtgg 300
ttctcgtata tttgatcctg tttgctttga atcttggatt cgtggtttaa acatttttct 360
gtgcttattt tagtccgtat ttaaattaac atttttggct tttagttcat attggtttga 420
ttggcgtacc tgatattcaa aacttaattg gttggataag ttatactgta atagtgtgaa 480
agtacttttt ggaaactgat tattccgtga agttctagat aaacg 525
<210> 10
<211> 1686
<212> DNA
<213> 人工序列
<220>
<223> 嵌合RFP/AAD12报告基因的编码序列
<400> 10
atggtgagca aaggcgagga acttatcaaa gagaacatgc acatgaagct ctacatggag 60
ggcactgtca acaatcatca cttcaaatgc acatccgagg gagaaggcaa gccttatgag 120
ggaacccaga ccatgaggat caaagtggtt gagggtggac cactcccatt tgccttcgac 180
atacttgcca ctagcttcat gtatggctcc agaactttca tcaatcacac acaagggatt 240
cccgacttct ttaagcagtc ttttcctgag ggtttcacat gggagcgtgt tacaacttac 300
gaagatggtg gcgtgttgac cgctactcaa gacacttctt tgcaagatgg gtgtctcatc 360
tacaatgtca agattagagg tgtgaacttt ccatcaaatg gaccagttat gcagaagaaa 420
acccttggat gggaagcaaa caccgagatg ctttacccag ccgatggtgg gcttgagggg 480
aggtctgata tggcactcaa gttggttgga ggtggccatt tgatttgcaa cttcaagacc 540
acataccgct caaagaaacc tgctaagaat ctcaagatgc ctggcgtcta ctatgtggat 600
catcgcttgg aaaggatcaa ggaggcagac aaggaaacct atgtcgaaca gcatgaggtg 660
gctgttgctc gttactgtga ccttcccagc aagctcggac acaagttgaa tctcgccgag 720
gaagcagccg ctaaagaggc tgcagccaag gaagccgctg caaaggaggc tgccgcaaaa 780
gaagccgcag ctaaggcagc tgccatggct cagaccactc tccaaatcac acccactggt 840
gccaccttgg gtgccacagt cactggtgtt caccttgcca cacttgacga tgctggtttc 900
gctgccctcc atgcagcctg gcttcaacat gcactcttga tcttccctgg gcaacacctc 960
agcaatgacc aacagattac ctttgctaaa cgctttggag caattgagag gattggcgga 1020
ggtgacattg ttgccatatc caatgtcaag gcagatggca cagtgcgcca gcactctcct 1080
gctgagtggg atgacatgat gaaggtcatt gtgggcaaca tggcctggca cgccgactca 1140
acctacatgc cagtcatggc tcaaggagct gtgttcagcg cagaagttgt cccagcagtt 1200
gggggcagaa cctgctttgc tgacatgagg gcagcctacg atgcccttga tgaggcaacc 1260
cgtgctcttg ttcaccaaag gtctgctcgt cactcccttg tgtattctca gagcaagttg 1320
ggacatgtcc aacaggccgg gtcagcctac ataggttatg gcatggacac cactgcaact 1380
cctctcagac cattggtcaa ggtgcatcct gagactggaa ggcccagcct cttgatcggc 1440
cgccatgccc atgccatccc tggcatggat gcagctgaat cagagcgctt ccttgaagga 1500
cttgttgact gggcctgcca ggctcccaga gtccatgctc accaatgggc tgctggagat 1560
gtggttgtgt gggacaaccg ctgtttgctc caccgtgctg agccctggga tttcaagttg 1620
ccacgtgtga tgtggcactc cagactcgct ggacgcccag aaactgaggg tgctgccttg 1680
gtttga 1686
<210> 11
<211> 3702
<212> DNA
<213> 人工序列
<220>
<223> 含有GmPSID2启动子 - GmPSID 5' UTR - RFP/AAD12编码序列 - GmPSID2终止子的基因表达盒
<400> 11
caaatggtaa aagaaataaa tagttcatac tatttttttc caaattttga aagactttgt 60
gatctcttac agacacaata gcaatcaaat agagaataat cttacgataa aaaaagagaa 120
acaaactcat taaatataat aataataact aggataaaat aagtttatag ccaatttttg 180
ttgaatctgg tttttagtct atgatatatc atgtaattta gttcctaaaa tttatatgaa 240
aaaaaatggt tttagtgtat gggttcactc ctcaattttt gtacttttct taacttgaga 300
tttagaaaag acactaaaaa caagtatttt ataaaattct gggacaaaat tgtttagtat 360
gaaagtttgg aaattagaca caagatttaa taaaagtttg tagactaaaa acatatttta 420
tctactaaaa gtcatcaatt tttataacaa ttatatataa ttatgtttat aatgtaatct 480
tagtaattag atatataaat agataaatga gacttataat aataaaaaaa acatataatt 540
aactcaagta ataacaattg agaaaaagac atagaaatgt cattcttatt atatctatta 600
attagtatac atatttcttt gggttagatt ataattaatg aaaacaaata ttagtaaaaa 660
gattaatata taataattga taacaaatat tattatattt attaataggt gtattttttt 720
tactataatt attatatatt cattaaaaaa tttaaggaag ggttactaaa agaaaataaa 780
atggttttga gaagaggggg ggctgattta gatgtctgat ttttttaatt aaactgtgaa 840
gtattctttt agctgagaaa caattctgtt tttgtaattg tatttttaag ggatatgaag 900
ctagctagga agatgaataa gaggtgtgag ttgtaagggt tgggtaaggg aatatgagat 960
tgtaattggt ccaaggcata tcaccttatc catatccaca tccaaaatct cctactttac 1020
tctctctctc tctctgacaa ccccaacact tgtattgtct caagcaaccg gatccaaaca 1080
atggtgagca aaggcgagga acttatcaaa gagaacatgc acatgaagct ctacatggag 1140
ggcactgtca acaatcatca cttcaaatgc acatccgagg gagaaggcaa gccttatgag 1200
ggaacccaga ccatgaggat caaagtggtt gagggtggac cactcccatt tgccttcgac 1260
atacttgcca ctagcttcat gtatggctcc agaactttca tcaatcacac acaagggatt 1320
cccgacttct ttaagcagtc ttttcctgag ggtttcacat gggagcgtgt tacaacttac 1380
gaagatggtg gcgtgttgac cgctactcaa gacacttctt tgcaagatgg gtgtctcatc 1440
tacaatgtca agattagagg tgtgaacttt ccatcaaatg gaccagttat gcagaagaaa 1500
acccttggat gggaagcaaa caccgagatg ctttacccag ccgatggtgg gcttgagggg 1560
aggtctgata tggcactcaa gttggttgga ggtggccatt tgatttgcaa cttcaagacc 1620
acataccgct caaagaaacc tgctaagaat ctcaagatgc ctggcgtcta ctatgtggat 1680
catcgcttgg aaaggatcaa ggaggcagac aaggaaacct atgtcgaaca gcatgaggtg 1740
gctgttgctc gttactgtga ccttcccagc aagctcggac acaagttgaa tctcgccgag 1800
gaagcagccg ctaaagaggc tgcagccaag gaagccgctg caaaggaggc tgccgcaaaa 1860
gaagccgcag ctaaggcagc tgccatggct cagaccactc tccaaatcac acccactggt 1920
gccaccttgg gtgccacagt cactggtgtt caccttgcca cacttgacga tgctggtttc 1980
gctgccctcc atgcagcctg gcttcaacat gcactcttga tcttccctgg gcaacacctc 2040
agcaatgacc aacagattac ctttgctaaa cgctttggag caattgagag gattggcgga 2100
ggtgacattg ttgccatatc caatgtcaag gcagatggca cagtgcgcca gcactctcct 2160
gctgagtggg atgacatgat gaaggtcatt gtgggcaaca tggcctggca cgccgactca 2220
acctacatgc cagtcatggc tcaaggagct gtgttcagcg cagaagttgt cccagcagtt 2280
gggggcagaa cctgctttgc tgacatgagg gcagcctacg atgcccttga tgaggcaacc 2340
cgtgctcttg ttcaccaaag gtctgctcgt cactcccttg tgtattctca gagcaagttg 2400
ggacatgtcc aacaggccgg gtcagcctac ataggttatg gcatggacac cactgcaact 2460
cctctcagac cattggtcaa ggtgcatcct gagactggaa ggcccagcct cttgatcggc 2520
cgccatgccc atgccatccc tggcatggat gcagctgaat cagagcgctt ccttgaagga 2580
cttgttgact gggcctgcca ggctcccaga gtccatgctc accaatgggc tgctggagat 2640
gtggttgtgt gggacaaccg ctgtttgctc caccgtgctg agccctggga tttcaagttg 2700
ccacgtgtga tgtggcactc cagactcgct ggacgcccag aaactgaggg tgctgccttg 2760
gtttgagtag ttagcttaat cacctagagc tcggtcaccg agctcgcaca caactctatc 2820
ttcatcatca tcatcccccg tgcttccttt atatgctata tattctcatg tgatatcatg 2880
tacctattgt caattttatt atgccacaaa tattgcttaa actctgtacc ttaattttac 2940
acttcttttt cgctattttg gtgattatta tttgtgccaa ctgcatggtt tggattaata 3000
ttgatttgct tcagcttcat ccaacttatg ctagagtagg gaatagtgat agtcatactc 3060
aaaccaaacg aggataggtt gcgtaaatag tgaaatctga aatctcgagc tgaagtgaga 3120
attttgtgat cttcagtgaa ttgagtatta atattttata tcaaaaaggc gcgttaaagt 3180
aagatataat cgtcagggag actgttcacg ttctacaagc aatttagtcg ttactgcgtg 3240
ctttttaact tcagattgtg agaagggact ggtcattttt ttaactatat tgtatgattg 3300
catggtatga aagtttgaaa gactaaaaac atgattcaat cgtatatatt gaatttgaat 3360
caaacaataa attcgggaca cattcaaatt aacctctggg ctgaattagt gggacgggag 3420
aatcatggtc aaccctagaa gaaaaaaggg cttgataaga caacggacca ggtgagccat 3480
agttcaaaat tgcagcaact taaccagctt ccaaaccaaa tccccagacc tgaatccgct 3540
gagagtttga gtttgaggaa acttaattat gtgaatttga gtttaataga tactatatat 3600
gtactattat agtgtaaaca ttgttaatca gttataaatt atttttatat gattttttaa 3660
gtaattaata taaaaatcaa gaaatatata atatacaata at 3702
<210> 12
<211> 4584
<212> DNA
<213> 人工序列
<220>
<223> 含有GFP和PAT报告子/选择性标记基因的基因表达盒
<400> 12
gtcgacctgc aggtcaacgg atcaggatat tcttgtttaa gatgttgaac tctatggagg 60
tttgtatgaa ctgatgatct aggaccggat aagttccctt cttcatagcg aacttattca 120
aagaatgttt tgtgtatcat tcttgttaca ttgttattaa tgaaaaaata ttattggtca 180
ttggactgaa cacgagtgtt aaatatggac caggccccaa ataagatcca ttgatatatg 240
aattaaataa caagaataaa tcgagtcacc aaaccacttg ccttttttaa cgagacttgt 300
tcaccaactt gatacaaaag tcattatcct atgcaaatca ataatcatac aaaaatatcc 360
aataacacta aaaaattaaa agaaatggat aatttcacaa tatgttatac gataaagaag 420
ttacttttcc aagaaattca ctgattttat aagcccactt gcattagata aatggcaaaa 480
aaaaacaaaa aggaaaagaa ataaagcacg aagaattcta gaaaatacga aatacgcttc 540
aatgcagtgg gacccacggt tcaattattg ccaattttca gctccaccgt atatttaaaa 600
aataaaacga taatgctaaa aaaatataaa tcgtaacgat cgttaaatct caacggctgg 660
atcttatgac gaccgttaga aattgtggtt gtcgacgagt cagtaataaa cggcgtcaaa 720
gtggttgcag ccggcacaca cgagtcgtgt ttatcaactc aaagcacaaa tacttttcct 780
caacctaaaa ataaggcaat tagccaaaaa caactttgcg tgtaaacaac gctcaataca 840
cgtgtcattt tattattagc tattgcttca ccgccttagc tttctcgtga cctagtcgtc 900
ctcgtctttt cttcttcttc ttctataaaa caatacccaa agcttcttct tcacaattca 960
gatttcaatt tctcaaaatc ttaaaaactt tctctcaatt ctctctaccg tgatcaaggt 1020
aaatttctgt gttccttatt ctctcaaaat cttcgatttt gttttcgttc gatcccaatt 1080
tcgtatatgt tctttggttt agattctgtt aatcttagat cgaagacgat tttctgggtt 1140
tgatcgttag atatcatctt aattctcgat tagggtttca taaatatcat ccgatttgtt 1200
caaataattt gagttttgtc gaataattac tcttcgattt gtgatttcta tctagatctg 1260
gtgttagttt ctagtttgtg cgatcgaatt tgtcgattaa tctgagtttt tctgattaac 1320
agagatctcc atggctcctg ccatgaagat tgaatgccgc atcactggca ccctcaacgg 1380
tgtggagttt gaattggttg gaggtggaga gggcacacct gaacaaggga ggatgaccaa 1440
caagatgaag tcaactaaag gggctctcac cttcagccca tacttgcttt ctcatgtcat 1500
gggctatgga ttctaccact ttggcaccta cccctctgga tatgagaacc ctttccttca 1560
tgccatcaac aatggaggct acacaaacac cagaattgag aagtacgaag atggtggagt 1620
cttgcatgtc tccttcagct accgctatga ggctgggagg gtcataggag acttcaaagt 1680
tgtgggcact ggattcccag aggactcagt catcttcact gacaagatca taaggagcaa 1740
tgccactgtt gagcacctcc atccaatggg tgacaatgtg cttgttggtt catttgcacg 1800
taccttcagc ctcagagatg gtggctacta ttcctttgtg gttgattctc acatgcactt 1860
caaatctgca atccacccct ccatcctcca gaatgggggt ccaatgtttg ctttcagacg 1920
tgtggaagag ttgcacagca acacagaact tggcattgtg gagtaccagc atgccttcaa 1980
gacacccatt gcatttgctt gagtagttag cttaatcact taggtcacca gcataatttt 2040
tattaatgta ctaaattact gttttgttaa atgcaatttt gctttctcgg gattttaata 2100
tcaaaatcta tttagaaata cacaatattt tgttgcaggc ttgctggaga atcgatctgc 2160
tatcataaaa attacaaaaa aattttattt gcctcaatta ttttaggatt ggtattaagg 2220
acgcttaaat tatttgtcgg gtcactacgc atcattgtga ttgagaagat cagcgatacg 2280
aaatattcgt agtactatcg ataatttatt tgaaaattca taagaaaagc aaacgttaca 2340
tgaattgatg aaacaataca aagacagata aagccacgca catttaggat attggccgag 2400
attactgaat attgagtaag atcacggaat ttctgacagg agcatgtctt caattcagcc 2460
caaatggcag ttgaaatact caaaccgccc catatgcagg agcggatcat tcattgtttg 2520
tttggttgcc tttgccaaca tgggagtcca aggttgcggc cgcttaatta acttactagt 2580
gctagcctcg aggtcgactc tgatcatgga tgctacgtca cggcagtaca ggactatcat 2640
cttgaaagtc gattgagcat cgaaacccag ctttcttgta caaagtggtt gcggccgctt 2700
aattaaattt aaatgtttgg gaagctaggc caccgtggcc cgcctgcagg ggaagcttgt 2760
ttaaacccag aaggtaatta tccaagatgt agcatcaaga atccaatgtt tacgggaaaa 2820
actatggaag tattatgtaa gctcagcaag aagcagatca atatgcggca catatgcaac 2880
ctatgttcaa aaatgaagaa tgtacagata caagatccta tactgccaga atacgaagaa 2940
gaatacgtag aaattgaaaa agaagaacca ggcgaagaaa agaatcttga agacgtaagc 3000
actgacgaca acaatgaaaa gaagaagata aggtcggtga ttgtgaaaga gacatagagg 3060
acacatgtaa ggtggaaaat gtaagggcgg aaagtaacct tatcacaaag gaatcttatc 3120
ccccactact tatcctttta tatttttccg tgtcattttt gcccttgagt tttcctatat 3180
aaggaaccaa gttcggcatt tgtgaaaaca agaaaaaatt tggtgtaagc tattttcttt 3240
gaagtactga ggatacaact tcagagaaat ttgtaagttt gtagatctcc atgtctccgg 3300
agaggagacc agttgagatt aggccagcta cagcagctga tatggccgcg gtttgtgata 3360
tcgttaacca ttacattgag acgtctacag tgaactttag gacagagcca caaacaccac 3420
aagagtggat tgatgatcta gagaggttgc aagatagata cccttggttg gttgctgagg 3480
ttgagggtgt tgtggctggt attgcttacg ctgggccctg gaaggctagg aacgcttacg 3540
attggacagt tgagagtact gtttacgtgt cacataggca tcaaaggttg ggcctaggat 3600
ccacattgta cacacatttg cttaagtcta tggaggcgca aggttttaag tctgtggttg 3660
ctgttatagg ccttccaaac gatccatctg ttaggttgca tgaggctttg ggatacacag 3720
cccgtggtac attgcgcgca gctggataca agcatggtgg atggcatgat gttggttttt 3780
ggcaaaggga ttttgagttg ccagctcctc caaggccagt taggccagtt acccagatct 3840
gactgagctt gagcttatga gcttatgagc ttagagctca gatcggcggc aatagcttct 3900
tagcgccatc ccgggttgat cctatctgtg ttgaaatagt tgcggtgggc aaggctctct 3960
ttcagaaaga caggcggcca aaggaaccca aggtgaggtg ggctatggct ctcagttcct 4020
tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg gatgaagcaa aagtgtccga 4080
ttgtaacaag atatgttgat cctacgtaag gatattaaag tatgtattca tcactaatat 4140
aatcagtgta ttccaatatg tactacgatt tccaatgtct ttattgtcgc cgtatgcaat 4200
cggcgtcaca aaataatccc cggtgacttt cttttaatcc aggatgaaat aatatgttat 4260
tataattttt gcgatttggt ccgttatagg aattgaagtg tgcttgcggt cgccaccact 4320
cccatttcat aattttacat gtatttgaaa aataaaaatt tatggtattc aatttaaaca 4380
cgtatacttg taaagaatga tatcttgaaa gaaatatagt ttaaatattt attgataaaa 4440
taacaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt 4500
cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag 4560
tgcgatatta tggtgtaata cata 4584
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 13
gaggattagg gtttcaacgg ag 22
<210> 14
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 14
gagaattgag ctgagacgag g 21
<210> 15
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 探针序列
<400> 15
agagaagttt cgacggattt cgggc 25
<210> 16
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 16
acaagagtgg attgatgatc tagagaggt 29
<210> 17
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 17
ctttgatgcc tatgtgacac gtaaacagt 29
<210> 18
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 探针序列
<400> 18
agggtgttgt ggctggtatt gcttacgct 29
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 19
cagagtccat gctcaccaat 20
<210> 20
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 20
acgtggcaac ttgaaatcc 19
<210> 21
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针序列
<400> 21
tggagatgtg gttgtgtggg acaa 24
<210> 22
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 22
acaagagtgg attgatgatc tagaga 26
<210> 23
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 23
ctttgatgcc tatgtgacac gtaaac 26
<210> 24
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 探针序列
<400> 24
ccagcgtaag caataccagc cacaacacc 29
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 25
cgccgaagta tcgactcaac t 21
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物序列
<400> 26
gcaacgtcgg ttcgagatg 19
<210> 27
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针序列
<400> 27
tcagaggtag ttggcgtcat cgag 24

Claims (11)

1.一种核酸载体,所述核酸载体包含可操作地连接到以下异源多核苷酸序列的启动子:
a)多接头序列;
b)非GmPSID2异源编码序列;或
c)a)和b)的组合;
其中所述启动子由SEQ ID NO:2所示的多核苷酸序列组成。
2.如权利要求1所述的核酸载体,其中所述启动子的长度为821bp。
3.如权利要求1所述的核酸载体,其中所述启动子可操作地连接到异源编码序列。
4.如权利要求3所述的核酸载体,其中所述异源编码序列编码选择性标记蛋白、杀昆虫抗性蛋白、除草剂耐受性蛋白、氮利用效率蛋白、水利用效率蛋白、小RNA分子、营养品质蛋白、或DNA结合蛋白。
5.如权利要求1所述的核酸载体,所述核酸载体进一步包含终止子多核苷酸序列。
6.如权利要求1所述的核酸载体,所述核酸载体进一步包含3'非翻译多核苷酸序列。
7.如权利要求1所述的核酸载体,所述核酸载体进一步包含5'非翻译多核苷酸序列。
8.如权利要求1所述的核酸载体,所述核酸载体进一步包含内含子序列。
9.如权利要求1所述的核酸载体,其中所述启动子具有组织偏好性表达。
10.一种用于产生转基因植物细胞的方法,所述方法包括以下步骤:
a)用基因表达盒转化植物细胞,所述基因表达盒包含GmPSID2启动子,其中所述GmPSID2启动子由SEQ ID NO:2所示的多核苷酸序列组成,其可操作地连接到至少一个目的多核苷酸序列;
b)分离包含所述基因表达盒的经转化的植物细胞;以及,
c)产生转基因植物细胞,所述转基因植物细胞包含所述可操作地连接到至少一个目的多核苷酸序列的GmPSID2启动子。
11.一种用于在转基因植物细胞中表达目的多核苷酸序列的方法,所述方法包括将可操作地连接到GmPSID2启动子的目的多核苷酸序列引入所述植物细胞中,其中所述GmPSID2启动子由SEQ ID NO:2所示的多核苷酸序列组成。
CN201880073592.6A 2017-11-16 2018-10-31 用于转基因表达的植物启动子 Active CN111386035B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762587024P 2017-11-16 2017-11-16
US62/587,024 2017-11-16
PCT/US2018/058338 WO2019099192A1 (en) 2017-11-16 2018-10-31 Plant promoter for transgene expression

Publications (2)

Publication Number Publication Date
CN111386035A CN111386035A (zh) 2020-07-07
CN111386035B true CN111386035B (zh) 2023-07-14

Family

ID=66538792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880073592.6A Active CN111386035B (zh) 2017-11-16 2018-10-31 用于转基因表达的植物启动子

Country Status (6)

Country Link
US (2) US11492631B2 (zh)
EP (1) EP3709792B1 (zh)
CN (1) CN111386035B (zh)
BR (1) BR112020008731A2 (zh)
CA (1) CA3072271A1 (zh)
WO (1) WO2019099192A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059464A1 (en) * 2022-09-14 2024-03-21 Monsanto Technology Llc Plant regulatory elements and uses thereof
CN116769778A (zh) * 2023-06-07 2023-09-19 中国科学院遗传与发育生物学研究所 番茄细胞工厂果实特异性启动子NP24pro及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999060109A2 (en) * 1998-05-18 1999-11-25 Pioneer Hi-Bred International, Inc. Soybean gene promoters
CA2995572A1 (en) * 2015-08-17 2017-02-23 Dow Agrosciences Llc Plant promoter and 3' utr for transgene expression

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8222482B2 (en) 2006-01-26 2012-07-17 Ceres, Inc. Modulating plant oil levels
WO2008140766A2 (en) * 2007-05-08 2008-11-20 The Ohio State University Highly active soybean promoters and uses thereof
US8080413B2 (en) * 2008-06-18 2011-12-20 E.I Du Pont De Nemours And Company Soybean transcription terminators and use in expression of transgenic genes in plants
AU2010224029B2 (en) 2009-03-11 2015-10-22 Sapphire Energy, Inc. Engineering salt tolerance in photosynthetic microorganisms
WO2011156520A2 (en) 2010-06-09 2011-12-15 Green Pacific Biologicals, Inc. Compositions and methods for increasing oil production and secretion

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999060109A2 (en) * 1998-05-18 1999-11-25 Pioneer Hi-Bred International, Inc. Soybean gene promoters
CA2995572A1 (en) * 2015-08-17 2017-02-23 Dow Agrosciences Llc Plant promoter and 3' utr for transgene expression

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Nucleotide sequence of cDNA clones encoding PSI-D2 protein of photosystem I in Nicotiana sylvestris;Yamamoto Y.等;《Plant Mol Biol》;19911231;全文 *
大豆GmPR10基因启动子的克隆及序列分析;孟凡姗等;《大豆科学》;20160722(第04期);全文 *
植物非生物逆境胁迫DREB/CBF转录因子的研究进展;李科友等;《林业科学》;20110115(第01期);全文 *

Also Published As

Publication number Publication date
EP3709792A1 (en) 2020-09-23
CN111386035A (zh) 2020-07-07
US20200392524A1 (en) 2020-12-17
US11492631B2 (en) 2022-11-08
US11814633B2 (en) 2023-11-14
BR112020008731A2 (pt) 2020-10-27
EP3709792A4 (en) 2021-08-11
EP3709792B1 (en) 2023-12-06
WO2019099192A1 (en) 2019-05-23
CA3072271A1 (en) 2019-05-23
US20230146220A1 (en) 2023-05-11

Similar Documents

Publication Publication Date Title
US11814633B2 (en) Plant terminator for transgene expression
TW201718861A (zh) 用於轉殖基因表現之植物啟動子及3’utr
EP3519574B1 (en) Plant promoter for transgene expression
US11913004B2 (en) Plant promoter for transgene expression
CN111278276B (zh) 用于转基因表达的植物启动子
US20220098606A1 (en) Plant promoter for transgene expression
EP4114942A1 (en) Cis-acting regulatory elements
EP3518657B1 (en) Plant promoter for transgene expression
CN111295093B (zh) 用于转基因表达的植物启动子
US20200299708A1 (en) Plant pathogenesis-related protein promoter for transgene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Indiana, USA

Patentee after: Kedihua Agricultural Technology Co.,Ltd.

Address before: Indiana, USA

Patentee before: DOW AGROSCIENCES LLC

CP01 Change in the name or title of a patent holder