CN101137752A - 增强表达的内含子序列 - Google Patents

增强表达的内含子序列 Download PDF

Info

Publication number
CN101137752A
CN101137752A CNA2006800076447A CN200680007644A CN101137752A CN 101137752 A CN101137752 A CN 101137752A CN A2006800076447 A CNA2006800076447 A CN A2006800076447A CN 200680007644 A CN200680007644 A CN 200680007644A CN 101137752 A CN101137752 A CN 101137752A
Authority
CN
China
Prior art keywords
sequence
intron
seq
plant
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800076447A
Other languages
English (en)
Other versions
CN101137752B (zh
Inventor
H-S·宋
M·莫拉
C·达曼
L·邢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Publication of CN101137752A publication Critical patent/CN101137752A/zh
Application granted granted Critical
Publication of CN101137752B publication Critical patent/CN101137752B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8227Root-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明涉及用于鉴定并使用具有增强基因表达特性的内含子的方法。根据本发明教导能够鉴定引起内含子介导性基因表达增强(IME)的内含子。本发明还涉及包含与启动子序列和核酸序列有效连接的所IME内含子的重组表达构建体和重组表达载体。本发明还涉及用这些重组表达构建体或载体所转化的转基因植物或转基因植物细胞,涉及从其衍生的培养物、部分或繁殖材料,并涉及它们用于制备食品、动物饲料、种子、药物或精细化学品的用途,涉及改善植物生物量,产量或提供需要的表型。

Description

增强表达的内含子序列
发明领域
本发明涉及用于鉴定并使用具有增强基因表达特性的内含子的方法。根据本发明教导能够鉴定引起内含子介导性基因表达增强(IME)的内含子。本发明还涉及包含与启动子序列和核酸序列有效连接的所述IME内含子的重组表达构建体和重组表达载体。本发明还涉及用这些重组表达构建体或载体所转化的转基因植物或转基因植物细胞,涉及从其衍生的培养物、部分或繁殖材料,并涉及它们用于制备食品、动物饲料、种子、药物或精细化学品的用途,涉及改善植物生物量、产量或提供需要的表型。
发明背景
植物生物技术的目标是产生具备有利的新特性如抗虫性和抗病性、环境胁迫(例如干旱)抗性、改善的品质(例如高产量)或用于产生某些化学品或药物的植物。适宜的基因表达速率在得到所需要的表型中发挥重要作用。基因表达速率主要受到特定基因的启动子、位于5′非转录区和5′非翻译区内的额外DNA序列及终止子序列的调节。启动子是位于基因5′末端的部分DNA序列,其含有RNA聚合酶启动转录以至于蛋白质合成随后可以继续进行的信号。位于5′非转录区内的调节性DNA序列调节应答特定生物性刺激(例如病原体感染)或非生物刺激(例如盐胁迫、热胁迫、干旱胁迫)的基因表达。此外,已经鉴定了以不依赖位置和方向的方式提高位于附近基因的表达水平的其它所谓“增强子”序列。
除了位于基因非转录区内的元件(例如启动子、增强子)以外,已报道了类型广泛的生物(例如线虫(nematode)、昆虫、哺乳动物和植物)中的一些内含子具有增强基因表达的特性。在植物中,相对于缺少内舍子的构建体而言,在基因构建体内包含一些内含子导致增加mRNA和蛋白质累积。这种效应已被称作基因表达的“内含子介导性增强”(IME)(Mascarenhas等(1990)Plant Mol.Biol.15:913-920)。已知在植物中刺激表达的内含子已经在玉米基因(例如tubA1、Adh1、Sh1、Ubi1[Jeon等(2000)Plant Physiol.123:1005-1014;Callis等(1987)Genes Dev.1:1183-1200;Vasil等(1989)Plant Physiol91:1575-1579;Christiansen等(1992)Plant Mol.Biol.18:675-689])和在稻基因内(例如salT、tpiIMcElroy等(1990)Plant Cell2:163-171;Xu等(1994)Plant Physiol106:459-467])中得到鉴定。类似地,已经发现来自双子叶植物基因的内含子,如来自碧冬茄(petunia)(例如rbcS)、马铃薯(例如st-ls1)和来自拟南芥菜(Arabidopsis thaliana)(例如ubq3和pat1)的那些内含子提高基因表达速率(Dean等(1989)Plant Cell1:201-208;Leon等(1991)Plant Phyisiol.95:968-972;Norris等(1993)Plant Mol Biol21:895-906;Rose和Last(1997)Plant J11:455-464)。已经证实在内含子剪接位点内的缺失或突变降低基因表达,表明剪接作用可能是IME所需要的(Mascarenhas等(1990)Plant Mol Biol15:913-920;Clancy和Hannah(2002)Plant Physiol130:918-929)。然而,已经通过在来自拟南芥菜的pat1基因剪接位点内点突变证实对于双子叶植物中的某些IME,并不需要剪接作用本身(Rose和Beliakoff(2000)Plant Physiol122:535-542)。
通过内含子增强基因的表达不是普遍现象,因为向重组表达盒插入一些内含子未能增强表达(例如来自双子叶植物基因的内含子(来自豌豆的rbcS基因、来自菜豆(bean)的菜豆蛋白基因和来自马铃薯(Solanumtuberosum)的stls-1基因)和来自玉米基因的内舍子(adh1基因第九内含子、hsp81基因第一内含子))(Chee等(1986)Gene41:47-57;Kuhlemeier等(1988)Mol Gen Genet212:405-411;Mascarenhas等(1990)Plant Mol Biol15:913-920;Sinibaldi和Mettler(1992)在WE Cohn,K Moldave编辑的《Progress in Nucleic Acid Research and Molecular Biology》第42卷,Academic Press,New York,第229-257页;Vancanneyt等1990Mol GenGent220:245-250)。因此,并非可以采用每一内含子以便在转基因植物中操纵外源基因或内源基因的基因表达水平。内含子序列内必须存在何种特征性或特异性序列特点以增强给定基因表达在现有技术内是未知的,并且从现有技术不可能预测给定的植物内含子在异源使用时是否将引起IME。
将外来基因导入新的植物宿主并不总是导致引进基因高表达。此外,若处理复杂性状,有时候需要以时间差异表达方式或空间差异表达方式调节数个基因。内含子原则上可提供如此调节。然而,相同内含子在一种植物中的多重使用已经显示出表现不利之处。在这些情况下,需要拥有用于构建适宜的重组DNA元件的基础控制元件集合。然而,可获得的具有增强表达特性的内含子集合是有限的并且需要替代物。
因此,对包括启动子、调节序列(例如诱导元件、增强子)或内含子序列在内的影响基因表达速率的基本控制元件的需要仍持续增长。本发明的目的因此是提供用于鉴定具有增强表达特性的内含子的高度可重复和可靠的方法。
该目标通过本发明中提供的方法得到实现。
发明简述
本发明的第一主题物因而涉及用于鉴定具有在植物中增强表达特性的内舍子的方法,包括从植物基因组中选择内舍子,其中所述的内舍子具有至少如下特征:
I)内舍子长度短于1,000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点上游存在类似于共有序列5′-CURAY-3′(SEQ IDNO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
在另一实施方案中,本发明涉及用于在植物内含子群体中富集具有在植物中增强表达特性的内含子数目至所述群体的至少50%的方法,该方法包括从所述群体内选择内含子,其中该内舍子具有至少如下特征:
I)内含子长度短于1,000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点上游存在类似于共有序列5′-CURAY-3′(SEQ IDNO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
优选地,选择用于富集具有在植物中增强基因表达特性的内舍子的植物内含子群体包含在基因组DNA序列数据库或植物基因组DNA文库中代表植物基因组的基本上全部的内含子。
在优选的实施方案中,在植物中具有增强基因表达的特性的内含子(“IME内含子”)通过本发明的用于鉴定IME内舍子的方法或本发明的用于在植物内含子群体中富集IME内舍子的数目的方法进行选择。优选地,所述内含子选自位于编码蛋白质的两个外显子之间的内含子或位于相应基因的5′非翻译区内部的内含子。
在特别优选的实施方案中,IME内含子通过本发明的方法之一从基因的组或群中鉴定或富集,其中所述基因代表在使用植物细胞、植物组织或完整植物所开展的基因表达分析实验中具有最高表达速率的基因的10%部分。
本发明还涉及方法,在该方法中用于鉴定或富集IME内含子的基因序列信息存在于DNA序列数据库内,并且鉴定或富集所述内含子的选择步骤使用自动化方法、优选地通过使用计算机装置和算法开展,其中所述算法定义了为完成鉴定或富集所述内含子的选择步骤所需要的指令。
此外,本发明涉及定义指令的计算机算法,其中所述指令是完成从植物基因组或这样的内含子群体中鉴定或富集IME内含子的选择步骤所需要的,其中所述的内含子群体选自位于编码蛋白质的两个外显子之间的内含子,和/或位于相应基因的5′非翻译区内部的内含子和/或位于基因的DNA序列内的内含子,其中所述的基因代表在使用植物细胞、植物组织或完整植物所开展的基因表达分析实验中具有最高表达速率的基因的10%部分。
本发明还涉及包含如上所述算法的计算机装置或数据存储装置。
在优选的实施方案中,本发明涉及用于分离、提供或产生IME内含子的方法,包括步骤:如上所述开展IME内含子的鉴定或富集并提供已鉴定或已富集的所述IME内含子的序列信息,并提供已鉴定或已富集的所述IME内含子的物理核苷酸序列及评估分离的内含子在体内(in vivo)表达实验或体外(in vitro)表达实验中增强基因表达的特性,以及从在体内表达实验或体外表达实验中已测试的内含子的群体中分离IME内含子。优选地,IME内含子增强基因表达特性的评估在植物细胞内完成并且其中IME内含子增强给定核酸的表达至少两倍。
本发明的另一主题物涉及重组DNA表达构建体,其包含在植物细胞中有功能的至少一个启动子序列、至少一个核酸序列和选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22所描述序列及其功能性等效物中的至少一个内含子,其中所述启动子序列和至少一个所述内含子序列功能性地连接于所述核酸序列,并且其中所述内含子对所述核酸序列或对所述启动子序列是异源的。
此外,本发明涉及重组表达构建体,其包含在植物细胞中有功能的至少一个启动子序列、至少一个核酸序列和由序列SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22中任意一个所描述内含子的至少一个功能性等效物,其中所述的功能性等效物包含内舍子的功能性元件并且具有如下特征:
a)该序列具有由SEQ ID NO:1、2、3、5、6、7、10、11、12、13、
14、15、16、17、18、19、20、21或22中任意一个所述的内含子序列的至少50个连续碱基对,或
b)与由SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所述的序列的跨越至少95个连续核酸碱基对的序列具有至少80%同一性,或
c)在高度严格条件下与由SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述核酸分子中至少50个连续碱基对的核酸片段杂交,
其中所述的启动子序列和至少一个所述的内含子序列功能性地连接于所述核酸序列,并且其中所述的内含子对所述的核酸序列或对所述的启动子序列是异源的。
在另一实施方案中,本发明的重组DNA表达构建体还含有与启动子功能性连接的一种和多种额外的调节序列。这些调节序列可以选自热休克应答元件、厌氧应答元件、病原体应答元件、干旱应答元件、低温应答元件、ABA应答元件、5′非翻译基因区、3′翻译基因区、转录终止子、多腺苷酸化信号和增强子。
本发明重组DNA表达构建体的核酸序列可以引起由所述的核酸序列编码的蛋白质和/或有义RNA、反义RNA或双链RNA的表达。
在另一实施方案中,编码本发明转基因表达构建体的核苷酸序列是双链的。在又一个实施方案中、编码本发明转基因表达构建体的核苷酸序列是单链的。
仍在本发明的另一个替代性实施方案中,重组表达构建体包含编码选择标记蛋白质、筛选标记蛋白质、合成活性蛋白质、分解活性蛋白质、抗生物胁迫蛋白质或抗非生物胁迫蛋白质、雄性不育蛋白质或影响植物农学特征的蛋白质的核酸序列。
本发明还涉及含有本发明转基因表达构建体的载体。此外,本发明涉及包含表达载体的转基因细胞或转基因非人生物,如细菌、真菌、酵母或植物,其中所述的表达载体含有本发明的转基因表达构建体。在优选的实施方案中,用本发明的表达构建体转化的转基因细胞或转基因非人生物是单子叶植物或衍生自该植物。在又一个更优选的实施方案中,单子叶植物选自大麦属(Hordeum)、燕麦属(Avena)、黑麦属(Secale)、小麦属(Triticum)、高粱属(Sorghum)、玉蜀黍属(Zea)、甘蔗属(Saccharumu)和稻属(Oryza)。本发明的其它实施方案涉及细胞培养物、部分或繁殖材料,其衍生自用本发明载体转化的或含有本发明重组表达构建体的非人生物,如细菌、真菌、酵母和/或植物,优选地是单子叶植物,最优选地是大麦属、燕麦属、黑麦属、小麦属、高粱属、玉蜀黍属、甘蔗属和稻属的植物。
本发明还涉及用于提供增强植物或植物细胞中核酸序列表达的表达盒的方法,包括步骤:将选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22的至少一个序列与所述核酸序列功能性地连接。
本发明还涉及用于增强植物或植物细胞中核酸序列表达的方法,包括步骤:将选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22的至少一个序列与所述核酸序列功能性地连接。
本发明另外的实施方案涉及方法
a)用于提供增强植物或植物细胞中核酸序列表达的表达盒,或
b)用于增强植物或植物细胞中核酸序列表达,
所述的方法包括将选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22的至少一个序列与所述核酸序列功能性地连接,其中在植物中有功能的启动子序列还与所述核酸序列连接。
优选地、选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22的至少一个序列经同源重组插入植物基因组内而与核酸序列连接。优选地,所述的同源重组包括至少如下步骤:
a)在体内或在体外提供包含在两侧具有如此序列(“重组底物”)的内含子的DNA构建体,其中所述的序列允许在所述表达盒的启动子和核酸之间与预先存在的表达盒发生同源重组,和
b)用包含步骤a)内所述表达盒转化受体植物细胞并再生转基因植物,其中所述的内含子已插入所述植物的基因组。优选地,整合至所述植物基因组内的位点通过步骤a)中的重组底物的DNA序列确定,其中与所述的基因组靶DNA序列共有足够同源性(如本文中所定义的)的所述序列允许经同源重组在所述的基因组靶DNA基因座处发生序列特异性整合。
在本发明优选的实施方案中,所述的受体植物或受体植物细胞是单子叶植物或单子叶植物细胞,更优选地是选自的大麦属、燕麦属、黑麦属、小麦属、高粱属、玉蜀黍属、甘蔗属和稻属的植物,最优选地是玉米植物。
优选地,与本发明的内含子之一功能性地连接的核酸序列编码选择标记蛋白质、筛选标记蛋白质、合成活性蛋白质、分解活性蛋白质、抗生物胁迫蛋白质或抗非生物胁迫蛋白质、雄性不育蛋白质或影响植物农学特征的蛋白质和/或有义RNA、反义RNA或双链RNA。
此外,本发明涉及本发明的转基因生物或衍生自该转基因生物的细胞培养物、部分或转基因繁殖材料的用途,用于产生食品、动物饲料、种子、药物或精细化学品。
本发明还涉及重组DNA表达构建体,包含:
a)在植物或植物细胞中有功能的至少一个启动子序列,和
b)选自在植物或植物细胞内具有增强表达特性的内含子中的至少一个内含子,其具有至少如下特征:
I)内含子长度短于1,000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点的上游存在类似于共有序列5′-CURAY-3′(SEQID NO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少55%的腺嘌呤加胸腺嘧啶的含量和至少30%的胸腺嘧啶含量,和
c)至少一个核酸序列,
其中所述的启动子序列和至少一个所述的内含子序列功能性地连接于所述核酸序列,并且其中所述的内含子对所述核酸序列和/或对所述的启动子序列是异源的。
附图简述
图1:pBPSMM291(SEQ ID NO:109)的图谱:
该载体包含玉米遍在蛋白启动子,其后是BPSI.1,随后是GUSintORF(包含马铃薯转化酶[PIV]2内含子以防止细菌性表达),再后是胭脂氨酸合成酶(NOS)终止子。该载体含有attL1和attL2位点以使该载体兼容于来自InvitrogenTM的Gateway克隆技术的修饰。该载体以基于pUC的表达载体pBPSMM267为基础。XmaI-RsrII消化的BPSI.1PCR产物与XmaI-RsrII消化的pBPSMM267连接以产生pBPSMM291。相应地,产生载体pBPSMM293、pBPSMM294和pBPSMM295(见表6和1.6.1)。
图2:pBPSMM305(SEQ ID NO:110)的图谱:
表达载体pBPSMM305包含无内含子(所述内舍子能推动GUSint ORF表达(包含马铃薯转化酶[PIV]2内含子以防止细菌性表达))的玉米乳酸脱氢酶(LDH)启动子,随后是NOS终止子。已经使用该载体来产生基于pUC的表达载体pBPSJB041、pBPSJB042、pBPSJB043、pBPSJB044、pBPSJB045、pBPSJB046和pBPSJB050(见实施例2.3)。
图3:pBPSMM350(SEQ ID NO:111)的图谱:
载体pBPSMM350包含玉米遍在蛋白启动子,其后是BPSI.1,随后是GUSint ORF(包含马铃薯转化酶[PIV]2内含子以防止细菌性表达),再后是胭脂氨酸合成酶(NOS)终止子。表达盒已经使用来自InvitrogenTM的Gateway克隆技术从载体中进行转移。相应地产生载体pBPSMM353、pBPSMM312和pBPSMM310(见表6和实施例1.6.2)。
图4:pBPSLM139(SEQ ID NO:112)的图谱:
载体pBPSLM139包含选择标记表达盒。为产生载体pBPSLI017至pBPSLI023,PmeI/PacI片段自载体pBPSJB-042、-043、-044、-045、046和050中分离并克隆至PmeI-PacI消化的pBPSLM130(见实施例2.3和2.4)。
图5a-f:用于从NCBI基因库文件中检索序列信息的计算机算法。
图6:在5叶阶段(A)、开花阶段(B)和结种子阶段(C)测试转基因植物的GUS表达,其中所述转基因植物含有带BPSI.1内含子的启动子构建体(除pBPSLM229以外的全部)或带BPSI.5内含子的启动子构建体(仅pBPSLM229)。所示是从至少15个独立事件中得到的代表性染色模式的实例。全部样品在GUS溶液中染色16个小时。构建体中的启动子是:稻叶绿体蛋白12(Os.CP12;pBPSMM355)、玉米羟脯氨酸丰富糖蛋白(Zm.HRGP;pBPSMM370)、稻p-咖啡酰辅酶A3-O-甲基转移酶(Os.CCoAMT1;pBPSMM358)、玉米球蛋白-1启动子W64A(Zm.Glb1;EXS1025)、推定的稻H+转运ATP合酶启动子(Os.V-ATP酶;pBPSMM369)、Zm.LDH(pBPSMM357)、稻C-8,7固醇异构酶启动子(Os.C8,7SI;pBPSMM366)、稻晚期胚胎发生丰富蛋白启动子(Os.Lea;pBPSMM371)和玉米乳酸脱氢酶启动子(ZM.LDH;pBPSLM229)。
一般定义
应当理解本发明不受如本文中所述的具体方法学、方案、细胞系、植物种和植物属、构建体和试剂限制。必须指出如本文中所用和在后续的权利要求书内,单数形式“a”和“the”包括复数指称,除非上下文清楚地说明。因此,对一个载体的指称是对一个和多个载体的称谓并且包括本领域技术人员已知的其等效物。
约:术语“约”在本文中用于指大致、大体、左右和在范围内。当术语“约”与数字范围一起使用时,它通过使界限延伸高于和低于所述数值而修饰该范围。通常,术语“约”在本文中用于修饰数值高于和低于所述数值达20%的变异、优选地是10%以上和以下(更高或更低)。如本文中所用,词“或”意指特定列中的任一成员。
农杆菌(Agrobacterium):指引起冠瘿的土生性革兰氏阴性杆状植物病原性细菌。术语“农杆菌”包括,但不限于根癌农杆菌菌株(Agrobacteriumtumefaciens)(其通常在感染的植物中引起冠瘿)和发根农杆菌菌株(Agrobacterium rhizogenes)(其在感染的植物中引起毛发状根病)。用农杆菌感染植物细胞通常引起感染的细胞产生冠瘿碱(例如胭脂氨酸、农杆碱、章鱼碱等)。因此,将引起胭脂氨酸产生的农杆菌菌株(例如菌株LBA4301、C58、A208)称作“胭脂氨酸型”农杆菌;将引起章鱼碱产生的农杆菌菌株(例如菌株LBA4404、Ach5、B6)称作“章鱼碱型”农杆菌,并且将引起农杆碱产生的农杆菌菌株(例如菌株EHA105、EHA101、A281)称作“农杆碱型”农杆菌。
算法:如本文中所用指计算机处理信息的方式,因为计算机程序实质上是告诉计算机(以何种具体顺序)实施哪些具体步骤以便执行指定任务(如鉴定一套基因的编码区)的算法。因此,可以将算法视作可以由计算机系统实施的操作的任何顺序。通常,当算法与处理信息结合时,数据从输入来源或输入装置中读出,书写至输出器或输出装置和/或为其它用途储存。对于任何此类计算方法,算法必须严格经过定义:以如此方式加以指定以致于它可以适应于可能出现的全部可能环境内。因此,任何条件性步骤必须系统地逐案处理;用于每一案例的标准必须是清晰的(和可计算的)。因为算法是精确步骤的精确列表,计算的顺序几乎总是对算法的功能至关重要。通常假定指令得到清晰地列出并且描述为“从顶部”开始并“下行至底部”,该概念通常更正式地由流程控制描述。在计算机应用中,脚本是自动操作一类任务的计算机程序,否则用户可能要在键盘上交互地完成所述的任务。广泛用来书写此类脚本的语言称作脚本化语言。此类众多语言非常复杂并已经用于书写复杂的程序,这些程序常常仍称作脚本,即便它们已经远远不止是使用户任务的简单顺序自动化。人们出于多种目的和不同类型的任务及编程风格创造了计算机语言。脚本编程语言(通常叫脚本化语言或脚本语言)是设计用于使计算机操作教本化的计算机编程语言。早期的脚本语言通常叫做批处理语言或工作控制语言。
脚本语言的实例是:ACS、ActionScript、ActiveServerPages(ASP)、AppleScript、Awk、BeanShell(用于Java的脚本)、bash、Brain、CobolScript、csh、ColdFusion、Dylan、Escapade(服务器端脚本)、Euphoria、Groovy、Guile、Haskell、HyperTalk、ICI、IRC脚本、JavaScript、mIRC脚本、MS-DOS batch、Nwscript、Perl、PHP、Pike、ScriptBasic。
反义:理解为具有与靶序列例如信使RNA(mRNA)互补的序列的核酸。如本文中所用。术语“互补的”或“互补性”用来指因碱基配对原则而相关的核苷酸序列。例如,序列5′-AGT-3′与序列5′-ACT-3′是互补的。互补可以是“部分的”或“全部的”。“部分”互补是根据碱基配对原则一个或多个核酸碱基不匹配的情况。核酸间“全部”或“完全”互补是每一和所有核酸碱基在碱基配对原则下与另一碱基配对。核酸链之间互补的程度对核酸链之间杂交的效率和强度有显著的影响。
有义:理解为意指具有与靶序列(例如与剪接体的蛋白质因子结合的序列)同源或完全相同的序列的核酸。
轰击、“轰击“”和“生物射弹轰击”:指这样的方法,其使粒子(微抛射体)向生物学靶样品(例如细胞、组织等)加速运动以造成生物学靶样品中的细胞的细胞膜损伤和/或使粒子穿入生物学靶样品。用于生物射弹轰击的方法在本领域是已知的(例如US5,584,807,其内容在本文引用作为参考),并且是可商业获得的(例如氦气驱动的微抛射体加速仪(PDS-1000/He)(BioRad))。
细胞:指单个细胞。术语“多个细胞”指细胞群。细胞群可以是包含一种细胞的纯细胞群。类似地,细胞群可以包含多于一种细胞类型。在本发明中,对细胞群可以包含的细胞类型的数目不加以限制。细胞可以是同步化的或不是同步化的,细胞优选地是同步化的。
染色体DNA或染色体DNA序列:应当理解为与细胞周期状态无关的细胞核的基因组DNA。染色体DNA因此可以是组织于染色体或染色单体内的,它们可以是压缩的或解螺旋状的。对染色体DNA的插入可以通过本领域已知的多种方法进行证实并分析,例如聚合酶链式反应(PCR)分析、DNA印迹分析、荧光原位(in situ)杂交(FISH)和原位PCR。
编码区或编码序列(CDS):当用来指基因时,是编码存在于作为mRNA分子翻译结果的新生多肽内氨基酸的核酸序列。在真核生物内,编码区的5′侧为编码起始甲硫氨酸的核苷酸三联体“ATG”并且3′侧为作为终止密码子(即TAA,TAG,TGA)的三个三联体之一。
核酸序列的互补序列:如本文中所用指其核酸与该核酸序列的核酸完全互补的核苷酸序列。
十分位数:当与统计数据一起使用时,是将分类的数据划分成10个相等部分的10个值中的任意值,以致于每个部分代表样品或群体的1/10。因此第一位十分位数分出数据中最低的10%,第九位十分位数分出数据中最低的90%或数据中最高的10%。四分位数是将分类的数据划分成4个相等部分的3个值中的任意值,以致于每个部分代表样品或群体的1/4(第三个四分位数=较高的四分位数=分出数据中最高的25%或最低的75%=第75个百分位数)。百分位数是将分类的数据划分成100个相等部分的99个值中的任意值,以致于每个部分代表样品或群体的1/100。因此,第一位百分位数数分出数据中最低的1%,第98位百分位数分出数据中最低的98%并且第25位百分位数分出数据中最低的25%。
DNA数据库:在生物信息学领域中,DNA序列数据库是储存在计算机内的DNA序列的庞大集合。数据库可以包括仅来自一种生物的序列,或它可以包括来自其DNA序列已经测序的全部生物的序列。
富集:当与选择本发明内含子一起使用时,指在内含子群体(例如代表存在于基因组DNA序列数据库内的植物基因组中全部内含子的内含子群体)中鉴定具有增强基因表达特性的内含子的成功率的增加。富集通过使用本发明的方法或本发明的选择标准减少候选内含子的数目得以实现。作为实例,若通过使用本文中所述的用于测量基因表达增强的方法,从给定内含子群体中鉴定具有增强表达特性的内含子的成功率是10个已分析内含子中的1个内含子,富集应当被理解为通过使用本发明的方法,增加已鉴定的具有增强基因表达特性的内含子的数目至10个已分析内含子中的至少5个内含子。因此,通过使用作为预选择方法或过滤方法的本发明方法,将需要进行分析以鉴定一个本发明内含子的内含子数目减少至两个内含子。
增强表达特性的评估:评估内含子的增强表达特性可以使用本领域已知的方法完成。例如,待测定其基因表达增强效应的候选内含子序列可以插入编码报告基因(例如可见的标记蛋白、选择标记蛋白质)的核酸序列的5′UTR,处于在植物或植物细胞内有活性的适宜启动子控制下以产生报告载体。此报告载体和缺少候选内含子的完全相同的对照报告载体可以使用本文中所述的方法导入植物组织,并且可以测量并比较依赖于候选内含子存在的报告基因的表达水平(例如检测所编码mRNA或所编码蛋白质的存在或由报告基因编码的蛋白质的活性),具有增强表达特性的内含子将产生比参考值高的表达速率,其中所述参考值在不改变其它条件下用缺少候选内含子的完全相同的对照报告载体得到。
报告基因可以表达可见的标记。表达可见的标记的报告基因系统包括β-葡糖醛酸糖苷酶及其底物(X-Gluc)、萤光素酶及其底物(萤光素)和β-半乳糖苷酶及其底物(X-Gal),它们不但广泛地用来鉴定转化体,而且还用来对源于具体载体系统的瞬时或稳定蛋白质的表达量定量(Rhodes(1995)Methods Mol Biol55:121-131)。极特别地优选用β-葡糖醛酸糖苷酶(GUS)的测定法(Jefferson等,GUS fusions:beta-glucuronidase as a sensitive andversatile gene fusion marker in higher plants.EMBO J.(1987)Dec20;6(13):3901-3907)。β-葡糖醛酸糖苷酶(GUS)的表达通过组织与5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸温育时的蓝色进行检测。选择标记基因可以提供抗生素耐抗性或除草剂抗性。报告基因的实例包括但不限于提供甲氨喋呤抗性的dhfr基因(Wigler(1980)Proc.Natl.Acad.Sci77:3567-3570);提供氨基糖甙类新霉素和G-418抗性的npt(Colbere-Garapin(1981)J.Mol.Biol.150:1-14)和分别提供氯磺隆和草铵膦乙酰基转移酶的als或pat。
期望值:当在DNA序列比对或DNA序列数据库搜索环境下使用时,指可能在整个数据库的搜索中期望特定匹配或更佳的匹配纯粹偶然发生的次数。因此,期望值越低,输入序列与匹配之间的相似性越高。期望值(E)是这样的参数,它描述人们在搜索特定大小的数据库时可以仅因偶然而“期望”看到的命中数。期望值随着对两种序列间匹配所赋予的相似性记分(S)呈指数性下降。相似性记分越高,E值越低。实际上,E值描述了对于序列间匹配存在的随机背景噪声。期望值作为便利的手段用于产生报道结果的显著性阈值。对命中所赋予的E值1可以解释为意指在目前大小的数据库内,你可能期望看到纯粹偶然地具有相似性记分的1个匹配。E值受a)序列长度(询问的序列越长,询问在数据库内因偶然而找到一个序列的概率越低),b)数据库大小(数据库越大,询问因偶尔而找到匹配的概率越高),c)记分矩阵(记分矩阵的严格性越小,询问在数据库内因偶尔而找到一个序列的概率越高)影响。
表达序列标签(EST):指从单次末端DNA测序中所得到的cDNA序列。EST序列指衍生自转录并因而来自已转录基因的序列。
可表达的核酸序列:如本发明上下文中所用是能够转录成RNA(例如mRNA、反义RNA、形成双链的RNA等)或翻译成特定蛋白质的任何核酸序列。
表达:指基因产物的生物合成,例如在结构基因的例子中,表达包括结构基因转录成mRNA和(任选地)随后mRNA翻译成一种或多种多肽。
功能性等效物:就本发明内舍子而言应当理解为SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述的该内含子的天然突变或人工突变。突变可以是不减少所述内含子的增强表达特性的一个或多个核苷酸的插入、缺失或置换。这些功能性等效物与如SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述内含子序列具有至少80%、优选地是85%、更优选地是90%、最优选地是多于95%、非常特别优选地至少98%的同一性,但小于100%的同一性,其中所述的同一性跨越序列的至少95个连续碱基对、优选地至少150个连续碱基对、更优选地至少200个连续碱基对进行测定,其中所述的序列由SEQID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个描述并具有与如SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所示内含子序列基本上相同的IME效应特征。
功能性等效物特别是衍生自其它植物的所述内含子的同系物。当用来指内含子时,同系物指自编码如下蛋白质的基因组核酸序列中分离的具有增强表达特性的内含子:
(i)所述的蛋白质在氨基酸水平与从中已经分离具有SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22的本发明内舍子的基因编码的蛋白质共有多于60%,优选地是65%、70%、75%、80%,更优选地是85%、90%、95%或最优选地是多于95%的序列同一性,或
(ii)如从中已经分离具有SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22的本发明内含子的基因编码的蛋白质那样催化相同的酶反应,或
(iii)显示出与从中已经分离本发明内含子SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22
的基因编码的蛋白质可比的时间表达谱或空间表达谱。
当与本发明内含子相比时,如上所述的“功能性等效物”可以具有降低的或增加的基因表达增强效应。在此上下文中,功能性等效内含子的基因表达增强效应比用SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中所示的任意内含子在不改变其它条件下得到的参考值高至少50%、优选地是至少100%、特别优选地至少300%,非常特别优选地至少500%。
功能性连接的或有效连接的:应当理解为意指例如调节性元件(例如启动子)与待表达的核酸序列和根据需要的其它调节性元件(如例如终止子)以如此方式顺序排列,以致于每一种调节性元件均可以实现其预期的功能以允许、修饰、促进或影响所述核酸序列的表达。表达可以依赖于与有义RNA或反义RNA有关的核酸序列的排列而发生。为此目的,实际上不需要化学意义上的直接连接。遗传控制序列例如增强子序列还可以从距离更远处,或甚至从其它DNA分子上对靶序列发挥其功能。术语“功能性连接的”、“有效连接的”、“处于有效的组合中”和“以有效的顺序”如本文中所用涉及具有增强基因表达的特性本发明内含子时,指至少一个所述内含子与核酸序列以如此方式的连接以致于实现表达增强效应,并且若已包括功能性剪接位点,则内含子可以通过负责剪接过程的细胞的因子被剪接出来。在本发明的优选实施方案中,将内含子导入核酸序列的5′非编码区。在实施例内展示本发明的表达构建体,其中本发明的内舍子与核酸序列功能性地连接。更优选这样的排列,即其中在内舍子介导性增强表达中具有功能的内含子插入启动子与核酸序列之间,优选地插入已转录的核酸序列内,或在编码蛋白质的核酸序列的例子中,插入核酸序列的5′非翻译区。启动子序列与待重组性表达的核酸序列间的距离优选地少于200个碱基对、特别优选地少于100个碱基对、非常特别优选地少于50个碱基对。有效连接和表达盒可以通过如在例如Maniatis T,Fritsch EF和Sambrook J(1989)《Molecular Cloning:A Laboratory Manual》,Cold Spring HarborLaboratory,Cold Spring Harbor(NY)、在Silhavy TJ,Berman ML和Enquist LW(1984)《Experiments with Gene Fusions》,Cold SpringHarbor Laboratory,Cold Spring Harbor(NY)、在Ausubel FM等(1987)《Current Protocols in Molecular Biology》,Greene Publishing Assoc.andWiley Interscience以及在Gelvin等(1990)《Plant Molecular BiologyManual》中所述的常用重组技术和克隆技术生成。然而还可以在这两种序列之间安置例如充当带限制性酶特异性切割位点的接头或充当信号肽的其它序列。序列的插入还可以导致融合蛋白的表达。优选地,由启动子、内含子和待表达的核酸序列的连接组成的表达构建体可以以载体整合的形式存在并可以例如通过转化插入植物基因组。
基因:指与适宜的调节序列有效连接的编码区,其中所述的调节序列能够以某种方式调节多肽表达。基因包括DNA中位于编码区(开方读码框,ORF)之前(上游)和之后(下游)的不翻译的调节区域(例如启动子、增强子、抑制子等),并且在间插序列可应用时,包括在各编码区(即外显子)之间的间插序列(即内含子)。基因还可以包括存在于RNA转录物内的位于序列5’末端和3′端的序列。这些序列称作“侧翼”序列或区域(这些侧翼序列坐落在存在于RAN转录内的不翻译序列的5′或3′)。5′侧翼区域可以含有控制或影响基因转录的调节序列,如启动子和增强子。3′侧翼区域可以含有指导转录终止、转录后切割或多腺苷酸化作用的序列。
增强基因表达特性、基因表达增强效应或内含子介导性基因表达增强(IME):当涉及内含子序列时指内含子的如此能力,该能力定量地增强作为(如本文中所定义)重组/转基因DNA表达盒中部分的核酸序列(例如基因)的表达水平,在不改变其它条件下与只缺少内含子而其它完全相同的表达构建体相比,其测量以已转录RNA、mRNA、蛋白质的量或蛋白质活性为基础。增强基因表达的特性在植物中涉及这样的内含子,其在不改变其它条件下与只缺少内含子而其它完全相同的表达构建体相比,能够定量地增强植物衍生性核酸序列在植物或植物细胞中的表达水平并增强非植物衍生性核酸在植物或植物细胞中的基因表达速率。在本发明的优选实施方案中,将表达增强效应理解为在不改变其它条件下与只缺少内含子而其它完全相同的表达构建体相比,RNA的稳定状态水平、蛋白质的稳定状态水平或核酸序列或相应蛋白质的蛋白质活性(例如报告基因或蛋白质)增加至少50%、或至少100%、或至少200%、300%、400%或至少500%、600%、700%、800%、900%或至少1,000%、或多于1,000%。此外,应当将表达增强效应或内含子介导性增强理解为内含子的能力,所述的能力改变作为本发明表达盒中部分的核酸序列(例如基因)的组织特异性表达谱、器官特异性表达谱或细胞特异性表达谱。改变作为本发明表达盒中部分的核酸序列的组织特异性表达谱、器官特异性表达谱或细胞特异性表达谱指这样的事实,即因存在本发明的内含子,相应基因的表达水平(mRNA或所编码的蛋白质的稳定状态水平、或蛋白质的活性)得到增加,高于所用检测方法的检测阈值。
基因沉默:可以通过反义RNA或双链RNA或通过共抑制(有义抑制)实现。技术人员知道其可以使用其它的cDNA或对应基因作为合适的反义构建体的初始模版。“反义”核酸优选地与靶蛋白的编码区或其部分互补。然而,“反义”核酸优选地与非编码区或其部分互补。从靶蛋白上的序列信息出发,考虑Watson和Crick碱基配对原则,反义核酸可以用技术人员熟悉的方式进行设计。反义核酸可以与靶蛋白的全部或部分核酸序列互补。
类似地所包含的是如上所述序列在有义方向上的用途,如技术人员已知,该用途可以导致共抑制(有义抑制)。已经证实表达有义核酸序列可以减少或关闭相应基因表达,其类似于已对反义方法所作的描述(Goring(1991)Proc.Natl Acad.Sci.USA88:1770-1774;Smith(1990)Mol.Gen.Genet.224:447-481;Napoli(1990)Plant Cell2:279-289;Van der Krol(1990)Plant Cell2:291-299)。在这种条件下,导入的构建体可以代表待完全或仅部分地进行减弱的基因。翻译的可能性是不需要的。特别优选借助双链RNAi的基因调节方法(“双链RNA干扰”)的用途。此类方法是本领域技术人员已知的(例如Matzke2000;Fire1998;WO99/32619;WO99/53050;WO00/68374;WO00/44914;WO00/44895;WO00/49035;WO00/63364)。在所述参考文献中描述的过程和方法公开地进行参考。
如本文中所用,生物的基因组和基因组DNA是生物的完整遗传信息,其编码于DNA(或对于某些病毒则是RNA)内。这包括基因序列和非编码序列。所述的基因组DNA包含胞核DNA(也称作染色体DNA)和质体(例如叶绿体)或其它细胞器(例如线粒体)的DNA。术语“基因组或基因组DNA”优选地指胞核的染色体DNA。术语“染色体DNA”或“染色体DNA序列”应当理解为与细胞周期状态无关的细胞核的基因组DNA。染色体DNA可能因此在染色体或染色单体内得以组织,它们可能是压缩的或解螺旋的。染色体DNA的插入可以通过本领域已知的多种方法进行证实和分析,例如聚合酶涟式反应(PCR)分析、DNA印迹分析、荧光原位杂交(FISH)和原位PCR。
异源的:相对于核酸序列指这样的核苷酸序列,该核苷酸序列与在自然界中不与该核苷酸序列连接的或在自然界中与该核苷酸序列在不同位置处连接的核酸序列连接。
杂交:如本文中所用包括“任何的如此过程,核酸的链通过该过程与互补链经碱基配对结合”(Coombs1994,Dictionary of Biotechnology,Stockton Press,New York N.Y.)。杂交和杂交的强度(即核酸间结合的强度)受如此因素的影响,如核酸间的互补程度、所涉及条件的严格性、所形成杂交体的Tm以及核酸内的G∶C比率。如本文中所用,术语“Tm”是用来指“解链温度”。解链温度是这样的温度,在此温度上双链核酸分子群体的一半解离成单链。用于计算核酸Tm的等式在本领域内众所周知。如标准参考文献所提及的那样,Tm值的简单估计可以由如下等式计算:Tm=81.5+0.41(%G+C),此时核酸处于1M NaCl的水溶液内[见例如Anderson和Young,Quantitative Filter Hybridization,《Nucleic AcidHybridization》(1985)]。其它参考文献包括了考虑用于计算Tm的结构特征和序列特征的更复杂计算。本领域技术人员完全知道可以采用多种杂交条件以包含低度严格条件或高度严格条件;考虑了如此的因素,如探针长度和性质(DNA、RNA、碱基组成)和靶标的性质(DNA、RNA、碱基组成、存在于溶液内或经固定等)以及盐和其它成分的浓度(例如存在或不存在甲酰胺、硫酸葡聚糖、聚乙二醇),并且可以改变杂交溶液以产生低的杂交严格性或高的杂交严格性。本领域技术人员知道优选较高的严格性以减少或消除本发明内含子与其它核酸序列之间的非特异性结合,而优选较低的严格性来检测与本发明的核苷酸序列具有不同同源性的较大数目的核酸序列。此类条件例如由Sambrook(《MolecularCloning;ALaboratoryManual》第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY(1989))或在《Current Protocols in Molecular Biology》,JohnWiley&Sons,N.Y.(1989)6.3.1-6.3.6内描述。优选的杂交条件是详细描述的公开内容。
同一性:当与核酸联系使用时,指互补程度。将两种核酸间的同一性理解为意指在每一例子中跨越序列全部长度的核酸序列的同一性,此同一性借助具有如下设置的参数的程序算法GAP(Wisconsin Package第10.0版,威斯康辛大学,Genetics Computer Group(GCG),Madison,美国)通过比较进行计算:
空位权重:12长度权重:4
平均匹配:2,912平均非匹配:-2,003
例如,将在核酸水平与序列SEQ ID NO:1具有至少95%同一性的序列理解为意指这样的序列,当通过以上具有所设置的参数的程序算法与序列SEQ ID NO:1比较时,此序列具有至少95%的同一性。可以存在部分的同一性(即少于100%的部分同一性)或完全的同一性(即100%的完全同一性)。
导入重组DNA表达构建体:在植物细胞中指将通过转化导入植物基因组并且得到稳定维持的重组DNA表达构建体。术语“导入”包括方法,例如转染、转导或转化。
鉴定、“鉴定”或“选择”:就植物的转化而言,应当理解为鉴定和选择在其中重组表达构建体已经稳定导入基因组的那些植物细胞的筛选方法。就具有增强基因表达特性的内含子而言,“鉴定”指从内含子群体中选择所述内含子的方法。优选地,“鉴定”指使用本发明方法的选择标准的计算机法(in silico)选择方法,更优选地是自动化的计算机法选择方法。此类计算机法鉴定方法可以例如包括如下步骤:
(1)以存在于DNA序列数据库内(例如经互联网可公开获得的基因组DNA数据库)的DNA序列为基础生成内含子序列数据库,
(2)为了得到具有增强基因表达特性的内舍子,使用本发明方法的标准筛选已生成的内含子DNA序列数据库或含有基因组DNA序列的其它数据库,
其中(使用本发明方法的标准)检索或生成DNA序列的步骤、内含子特异性DNA序列数据库的生成及这些DNA序列的筛选将借助适宜的计算机算法和计算机装置开展。
内含子:指基因中这样的DNA部分(间插序列),该DNA部分不编码此基因所产生蛋白质的部分并且从该基因所转录的并从细胞核中输出之前的mRNA内剪接下来。内舍子序列指内舍子的核酸序列。因此,内含子是DNA序列中的如此区域,它们随编码序列(外显子)一起转录但在成熟的mRNA形成期间被去除。内含子可以位于实际的编码区内或在前mRNA(未剪接的mRNA)的5′或3′非翻译前导序列内。初级转录物中的内含子可以被剪除并且编码序列同时而精确地连接以形成成熟mRNA。内含子与外显子的汇合处形成剪接位点。内含子的序列以GU开始并以AG结束。此外,在植物中,已经描述两种AU-AC内含子的实例:来自拟南芥菜的RecA样蛋白基因的第14内含子和G5基因的第7内含子是AT-AC内含子。含有内含子的前mRNA除其它序列以外,还具有对精确剪接内含子必需的三个短序列。这三个短序列是5′剪接位点、3′剪接位点和分支点。mRNA的剪接是除去存在于mRNA初级转录物内的间插序列(内含子)和汇合或连接外显子序列。这也称作顺式剪接,使两个外显子在同一RNA内连接,同时移除间插序列(内含子)。内含子的功能性元件包括由剪接体中(例如在内含子末端剪接共有序列的)特异性蛋白质成分所识别和结合的序列。功能性元件与剪接体相互作用导致内含子序列从不成熟的mRNA中去除和外显子序列再连接。内含子具有对精确剪接内含子必需(尽管不充分)的三个短序列。这三个短序列是5′剪接位点、3′剪接位点和分支点。分支点序列在植物内剪接和选择剪接位点中是重要的。分支点序列通常位于3′剪接位点上游10-60个核苷酸。植物的分支点序列具有变异,共有序列是5′-CURAY-3′(SEQ ID NO:75)或5′-YURAY-3′(SEQ ID NO:76)。
“IME内含子”或内含子介导性增强(IME)内含子:当涉及内含子序列时,指如本文中定义的具有在植物中增强基因表达特性的内舍子(见“增强基因表达的特性、基因表达增强效应或内含子介导性基因表达增强)。
分离或分离的:当相对于内含子或基因使用时,如在“内含子序列的分离”或“基因的分离”中指这样的核酸序列,该核酸序列在其相应来源生物的染色体核酸序列环境中鉴定并从中分离或分开。分离的核酸处于这样的形式或环境下,该形式或环境与它在自然中存在的形式或环境不同。相反,未分离的核酸是以其在自然中存在状态下找到的核酸,如DNA和RNA。例如,在宿主细胞染色体上靠近毗邻的基因找到给定的DNA序列(例如基因);内含子序列以内含子和外显子的交替顺序内嵌至基因的核酸序列内。分离的核酸序列可以以单链形式或双链形式存在。当分离的核酸序列待用于表达蛋白质时,核酸序列将至少含有有义链或编码链的至少一部分(即核酸序列可以是单链的)。或者,它可以含有有义链和反义链(即核酸序列可以是可以是双链的)。
核酸:指处于单链或双链的有义或反义形式的脱氧核糖核苷酸、核糖核苷酸或其聚合物或杂交体。除非另外说明,特定的核酸序列还内在地包含其经保守性修饰的变体(例如间并密码子置换)和互补序列,并且该序列得到清楚地说明。“核酸”可用于描述“基因”、“cDNA”、“DNA”、“mRNA”、“寡核苷酸”和“多核苷酸”。
核酸序列:如本文中所用指DNA片段(寡核苷酸、多核苷酸、基因组DNA、cDNA等)的脱氧核糖核苷酸或核糖核苷酸(核苷酸)的连续序列,只要所述的连续序列可以通过DNA测序技术得到作为一列代表核苷酸的缩写、字母、字符或字即可。
器官:就植物(或“植物器官”)而言意指植物的部分并可以包括(但不应当限于)例如根、果实、苗、茎、叶、花药、萼片、花瓣、花粉、种子等。
其它不改变的条件:意指例如通过待进行比较的表达构建体之一所启动的表达没有受额外的遗传控制序列(例如增强子序列)调节并且在相同环境内(例如相同植物物种)在相同发育阶段和相同生长条件下完成。
植物:通常理解为意指能够进行光合作用的任何单细胞生物或多细胞生物或它们的细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的包括植物界的高等植物和低等植物中的全部属和种。优选一年生、多年生的单子叶植物和和双子叶植物。本术语包括成熟植物、种子、苗和幼苗和它们所衍生的部分、繁殖材料(如种子或小孢子)、植物器官、组织、原生质体、愈伤组织和其它培养物例如细胞培养物,以及结成群以产生功能性单位和结构性单位的任何其它类型的植物细胞。成熟植物指处在除幼苗以外的任何所需要发育阶段内的植物。幼苗指在早期发育阶段内的年幼的不成熟植物。一年生、二年生的单子叶植物和双子叶植物是用于产生转基因植物的优选宿主生物。基因的表达更有利地是在全部观赏植物、用材树木或观赏树木、花、切花、灌木或草坪草内。可以通过举例方式提到而不限于此的植物是被子植物(angiosperm)、苔藓植物(bryophyte)例如苔纲(Hepaticae)(地钱(liverwort))和藓纲(Musci)(藓(mosse));蕨类植物(Pteridophytes)如蕨(fern)、问荆(horsetail)和石松(club mosses);裸子植物(gymnosperms)如针叶类(conifer)、苏铁类(cycad)、银杏(ginkgo)和买麻藤类(Gnetatae);藻类(algae)如绿藻纲(Chlorophyceae)、Phaeophpyceae、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻(diatom))和裸藻纲(Euglenophyceae)。优选用作食用或饲用目的的植物如豆科(Leguminosae)如豌豆、苜蓿(alfafa)和大豆(soya);禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱(sorghum)、黍(millet)、黑麦(rye)、小黑麦(triticale)或燕麦(oat);伞形科(Umbelliferae),特别是胡萝卜属(Daucus)、极特别地是野胡萝卜种(Dauus carota)(胡萝卜(carrot)),和芹属(Apium)、极特别地是旱芹种(Graveolens dulce)(芹菜(celery))和众多其它种;茄科(Solanaceae),特别是番茄属(Lycopersicon)、极特别地是番茄种(Lycopersicon esculentum)(番茄),和茄属(Solanum),极特别地是马铃薯种(Solanum tuberosum)(马铃薯)和茄种(Solanummelongena)(茄子)以及众多其它种(如烟草(tobacco));和辣椒属(Capsicum),极特别地是辣椒种(Capsicum annuum)(辣椒(pepper))和众多其它种;豆科(Leguminosae),特别是大豆属(Glycine),极特别地是大豆种(Glycine max)(大豆(soybean))、苜蓿、豌豆、紫花苜蓿(lucerne)、菜豆或落花生(peanut)和众多其它种;和十字花科(Cruciferae)(Brassicacae)、特别是芸苔属(Brassica),极特别地是欧洲油菜种(Brassica napus)(油菜(oil seedrape))、芸苔种(Brassica campestris)(甜菜(beet))、甘蓝栽培品种Tastie(Brassica oleracea cv Tastie)(卷心菜(cabbage))、甘蓝栽培品种SnowballY(Brassica oleracea cv SnowballY)(花椰菜(cauliflower))和甘蓝栽培品种Emperor(Brassica oleracea cv Emperor)(绿花菜(broccoli));和拟南芥属(Arabidopsis),极特别地是拟南芥菜种和众多其它种;菊科(Compositae),特别是莴苣属(Lactuca),极特别地是莴苣种(Lactucasativa)(莴苣(lettuce))和众多其它种;菊科(Asteraceae)如向日葵(sunflower)、万寿菊(Tagetes)、莴苣或金盏花(Calendula)和众多其它种;葫芦科(Cucurbitaceae)如甜瓜(melon)、南瓜(pumpkin/squash)或西葫芦(zucchini)和亚麻(linseed)。更优选棉花(cotton)、甘蔗(sugarcane)、大麻(hemp)、亚麻(flax)、辣椒(chillies)和各种树、坚果和藤本物种。
提供:当相对于内含子使用时,如在“物理性提供内含子”中指对来自目的植物的代表所述内含子的DNA序列进行克隆并在适合于本发明内含子的进一步克隆工作和后续应用的载体和质粒内物理性提供的该内含子。
产生:当相对于内含子使用时,如在“产生内舍子”中指基于本发明内含子的DNA序列信息合成了DNA分子。
启动子、启动子元件或启动子序列:如本文中所用,指能够在与目的核苷酸序列连接时控制目的核苷酸序列转录成mRNA的DNA序列。因此,启动子是DNA序列上如此的识别位点,该识别位点提供了用于基因的表达控制元件并且RNA聚合酶特异性地可与该识别位点结合并启动所述基因的RNA合成(转录)。启动子通常(尽管不是必须)位于目的核苷酸序列的5′(即上游)(例如接近结构基因的转录起始位点)。启动子可以是组织特异性或细胞特异性的。术语“组织特异性”在应用于启动子时,指这样的启动子,该启动子能够在特定类型的组织(例如花瓣)中指导目的核苷酸序列选择性表达,而在不同类型的组织(例如根)内则相对缺乏同一目的核苷酸序列的表达。启动子可以是组成型的或可调节的。术语“组成型的”当指启动子时,意指该启动子能够在缺乏刺激物(例如热休克、化学品、光等)下指导有效连接的核酸序列转录。通常,组成型启动子能够指导转基因在基本上任何细胞和任何组织内表达。相反,“可调节的”启动子是这样的启动子,其能够在存在刺激物(例如热休克、化学品、光等)时指导有效连接的核酸序列以这样一种水平转录,其不同于在缺乏刺激物下有效连接的核酸序列的转录水平。将植物中有功能的启动子序列理解为原则上意指能够控制基因(尤其外来基因)在植物或植物部分、植物细胞、植物组织或植物培养物内表达的任何启动子。在此条件下,表达可是是例如组成型的、诱导型的或发育依赖型的。组成型启动子是在其中RNA聚合酶结合和启动的速率是大致恒定的并相对与外界刺激物无关的启动子。有用的启动子是这样的组成型启动子(Benfey等(1989)EMBO J.8:2195-2202),如源自植物病毒如35S CAMV(Franck等(1980)Cell21:285-294)、19S CaMV(还见US5352605和WO84/02913)、34S FMV(Sanger等(1990)Plant Mol.Biol.,14:433-443)的那些组成型启动子、欧芹(parsley)遍在蛋白启动子或在US4,962,028中描述的植物启动子如Rubisco小亚基启动子或植物启动子PRP1[Ward等(1993)Plant Mol.Biol.22:361-6]、SSU、PGEL1、OCS[Leisner(1988)Proc.Natl.Acad.Sci.USA85(5):2553-2557]、lib4、usp、mas[Comai(1990)Plant Mol Biol15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol39(6):1221-1230)、B33、SAD1或SAD2(flax启动子,Jain等(1999)Crop Science39(6):1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。诱导启动子是在其中RNA聚合酶结合和启动的速率受到外界刺激物调节的启动子。此类刺激包括光、热、厌氧胁迫、营养条件的改变、代谢物的有或无、配体的存在、微生物侵袭、创伤等等(综述见Gatz(1997)Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89-108)。化学诱导启动子在需要以时间特异性方式表达基因时特别合适。化学诱导启动子的实例是水杨酸诱导启动子(WO95/19443)、以及脱落酸诱导启动子(EP335528)、四环素诱导启动子(Gatz等(1992)Plant J.2:397-404)、环己醇或乙醇诱导启动子(WO93/21334)或如本文中所述的其它化学诱导启动子。病毒启动子是具有与病毒基因5′末端内找到的启动子基本相似的DNA序列的启动子。常见的病毒启动子存在于由Huang等((1981)Cell27:245)所述的MMTV的编码p21蛋白的基因5’末端处。合成的启动子是化学合成的而非生物衍生的启动子。合成的启动子通常包含优化RNA聚合酶启动效率的序列改变。时间调节性启动子是其中RNA聚合酶结合和启动的速率在发育期间的特定时间内受调节的启动子。时间调节性启动子实例在Chua等[(1989)Science244:174-181]中给出。空间调节性启动子是其中RNA聚合酶结合和启动的速率在生物的特定结构内如叶、茎或根内受调节的启动子。空间调节性启动子的实例在Chua等[(1989)Science244:174-181]中给出。时空调节性启动子是其中RNA聚合酶结合和启动的速率在发育期间的特定时间内在生物的特定结构内受调节的启动子。常见的时空调节性启动子是Chua等[(1989)Science244:174-181]所述的EPSP合成酶-35S启动子。合适的启动子还有欧洲油菜的油菜籽蛋白基因启动子(US5,608,152)、蚕豆(Vicia faba)USP启动子(Bumlein等(1991)Mol GenGenet225(3):459-67)、拟南芥的油质蛋白启动子(WO98/45461)、菜豆(Phaseolus vulgaris)的菜豆球蛋白启动子(US5,504,200)、芸苔Bce4启动子(WO91/13980)、菜豆arc5启动子、胡萝卜DcG3启动子或豆球蛋白B4启动子(LeB4;Bumlein等(1992)Plant Journal2(2):233-9),以及在单子叶植物如玉米、大麦、小麦、黑麦、稻等中引起种子特异性表达的启动子。有利的种子特异性启动子是蔗糖结合蛋白质启动子(WO00/26388)、菜豆球蛋白启动子和油菜籽蛋白启动子。必须考虑的合适启动子是大麦lpt2或lpt1基因启动子(WO95/15389和WO95/23230)和在WO99/16890中所述的启动子(来自大麦的大麦醇溶蛋白基因、稻的谷蛋白基因、稻的水稻素基因、稻的谷醇溶蛋白基因、小麦的麦醇溶蛋白基因、小麦的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麦的谷蛋白基因、高粱的kasirin基因和黑麦的裸麦醇溶蛋白基因的启动子)。其它的合适启动子是Amy32b、Amy6-6和Aleurain[US5,677,474]、Bce4(欧洲油菜)[US5,530,149]、大豆球蛋白(大豆)[EP571741]、磷酸烯醇丙酮酸羧化酶(大豆)[JP06/62870]、ADR12-2(大豆)[WO98/08962]、异柠檬酸裂解酶(欧洲油菜)[US5,689,040]或α淀粉酶(大麦)[EP781849]的启动子。可获得用于在植物中表达基因的其它启动子是叶特异性启动子,如在DE-A19644478中所述的那些叶特异性启动子,或光调节性启动子,例如豌豆petE启动子。其它的合适植物启动子是胞质FBP酶启动子或马铃薯ST-LSI(Stockhaus等(1989)EMBO J.8:2445)、大豆磷酸核糖焦磷酸氨基转移酶启动子(GenBank登录号U87999)或在EP-A-0249676中所述的节结特异性启动子。其它的合适启动子是对生物性或非生物性胁迫条件作出反应的合适启动子,例如病原体诱导性PRP1基因启动子(Ward等(1993)Plant Mol.Biol.22:361-366)、番茄热诱导性hsp80启动子(US5,187,267)、马铃薯寒冷诱导性α淀粉酶启动子(WO96/12814)或创伤诱导性pinII启动子(EP-A-0375091)或如本文中所述的其它启动子。特别适合的其它启动子是引起质体特异性表达的那些启动子。合适的启动子如病毒RNA聚合酶启动子在WO95/16783和WO97/06250中描述,并且拟南芥clpP启动子在WO99/46394中描述。除了数个以上提及的病毒启动子和细菌启动子以外,用于在种类尽可能多的组织内(当然尤其在叶内)强烈表达异源序列的其它启动子还优选地是植物的肌动蛋白基因或遍在蛋白基因的启动子,例如,稻的肌动蛋白1启动子。植物的组成型启动子的其它实例是甜菜(sugarbeet)V-ATP酶启动子(WO01/14572)。合成的组成型启动子的实例是Super启动子(WO95/14098)和衍生自G-盒的启动子(WO94/12015)。根据需要,还可以使用化学诱导启动子,比较EP-A388186、EP-A335528、WO97/06268。以上所列的启动子可以包含影响对植物激素(Xu等,1994,Plant Cell6(8):1077-1085)、生物性或非生物性环境刺激例如胁迫条件做出应答的基因表达的其它调节性元件,其中所述的胁迫调节例如是干旱(Tran等(2004)Plant Cell16(9):2481-2498)、热、寒冷、冰冻、盐胁迫、氧化胁迫(US5,290,924)或生物性胁迫源,如细菌、真菌或病毒。
多肽、肽、寡肽、基因产物、表达产物和蛋白质:可互换使用以意指连续氨基酸残基的聚合物或寡聚物。
重组或转基因的DNA表达构建体:就例如核酸序列(包含所述核酸序列的表达构建体、表达盒或载体)指源自实验操作的全部构建体,在其中
a)所述的核酸序列,或
b)与所述核酸序列有效连接的遗传控制序列例如启动子,或
c)(a)和(b)
未处于其天然遗传环境内或已经通过实验操作得到修饰,修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒置或插入。天然遗传环境指来源生物中天然的染色体基因座或指存在于基因组文库中。以基因组文库为例,核酸序列的天然遗传环境优选地得以保留,至少部分得以保留。该环境在核酸序列的至少一侧分布并具有长度至少50bp、优选地至少500bp、特别优选地至少1,000bp、非常特别优选地至少5,000bp的序列。天然存在的表达构建体,例如启动子与相应基因的天然存在的组合,当其受到非天然的、合成的、“人工”方法如例如诱变修饰时,变成转基因表达构建体。此类方法已经得到描述(US5,565,350;WO00/15815)。
重组多肽或蛋白质:指这样的多肽或蛋白质,其通过重组DNA技术产生,即从用编码所需要的多肽或蛋白质的外源性重组DNA构建体转化的细胞中产生。重组核酸和多肽还可以包含如此的分子,其在自然界中不存在,但受到人的修改、改变、突变或其它操作。本发明内舍子的重要用途将是增强核酸序列的表达,其中所述的核酸序列编码可干扰正常转录或翻译的特定蛋白质、多肽或DNA序列,例如干扰RNA或反义RNA。在本发明的一个实施方案中,重组DNA表达构建体赋予一种或多种核酸分子的表达。所述的重组DNA表达构建体根据本发明有利地包含在植物中有功能的启动子、在植物中有功能的额外调节性或控制性元件或序列、在植物中具有增强表达特性的内舍子序列和在植物中有功能的终止子。此外,重组表达构建体可以含有额外的功能性元件,如赋予例如正向选择标记和负向选择标记、报告基因、重组酶或核酸内切酶表达的表达盒,它们影响着本发明的表达盒、载体或重组生物的产生、扩增或功能。此外,重组表达构建体可以包含与目的植物基因具有同源性的核酸序列,其具有足够长度以便在导入植物后在目的基因的基因座内诱导发生同源重组(HR)事件。本发明的重组转基因表达盒(或包含所述转基因表达盒的转基因载体)可以通过(例如在Maniatis1989,《Molecular Cloning:A Laboratory Manual》,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy1984,《Experiments with Gene Fusions》,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY和在Ausubel1987,《Current Protocols inMolecular Biology》,Greene Publishing Assoc.and Wiley Interscience)所述的常规重组技术和克隆技术产生。导入本发明的表达盒至生物或其细胞、组织、器官、部分或种子(优选地至植物或植物细胞、组织、器官、部分或种子)可以使用包含以上所述核酸、启动子、内含子、终止子、调节或控制元件和功能性元件的载体有利地实行。
再生:如本文中所用意指从植物细胞、植物细胞组、植物部分或植物碎片(例如来自原生质体、愈伤组织、原胚体样体或组织部分)中生长出完整植物。
调节序列:指DNA的启动子、增强子或其它节段,在其中调节蛋白如转录因子结合并因而影响给定基因的转录速率。
在基因组DNA序列数据库或基因组DNA文库内所代表的植物基因组中的基本上全部内含子:指全部内含子中大于80%、优选地大于90%、更优选地大于95%、仍更优选地大于98%的内含子存在于作为制备基因组DNA序列数据库或基因组DNA文库来源所使用的植物的基因组内。构建基因组文库和随后对基因组DNA测序以及使用已得到的序列信息构建基因组序列数据库或基因组DNA序列数据库在本领域内已充分建立(Mozo等(1998)Mol.Gen.Genet.258:562-570;Choi等(1995)Weeds World2:17-20;Lui等(1999)Proc.Natl.Acad.Sci.USA96:6535-6540;TheArabidopsis Genome initiative,Nature402:761-777(1999);TheArabidopsis Genome initiative,Nature408:796-826(2000)。
结构基因:如本文中所用,意指转录成mRNA的DNA序列,其中所述的mRNA随后翻译成作为具体多肽的特征的氨基酸序列。
足够长度:就包含于DNA构建体内的同源性序列(例如同源性序列A或B)而言理解为包含长度至少100个碱基对、优选地至少250个碱基对、更优选地至少500个碱基对、特别优选地至少1,000个碱基对、最优选地至少2,500个碱基对的序列。术语“足够的同源性”就包含于DNA构建体内的同源性序列(例如同源性序列A或B)而言将理解为包含如此序列,该序列与包含于染色体DNA内的相应靶序列(例如靶序列A′或B′)具有至少70%、优选地至少80%、更优选地至少90%、特别优选地至少95%、更特别优选地至少99%、最优选地100%的同源性,其中所述的同源性延续跨越至少50个碱基对、优选地至少100个碱基对、更优选地至少250个碱基对、最优选地至少500个碱基对的长度。
靶区域/序列:核酸序列的靶区域/序列是待鉴定的核酸序列的一部分。核酸序列的“编码区”是核酸序列中这样的部分,当其处于适宜的调节序列的控制下时以序列特异性方式得到转录和翻译以产生特定的多肽或蛋白质。据称编码区编码如此的多肽或蛋白质。
组织:就植物(或“植物组织”)而言意指多个植物细胞的排列,包括植物中分化的和未分化的组织。植物组织可以构成植物器官的部分(例如植物叶的表皮),但还可以构成肿瘤组织和多种培养中的细胞(例如单个细胞、原生质体、胚、愈伤组织、原胚体样体等)。植物组织可以在原有植物内(inplanta)、在器官培养、组织培养或细胞培养内。
转化或转化:如本文中所用,指遗传材料(例如转基因)导入细胞。细胞的转化可以是稳定的或瞬时的。术语“瞬时转化”或“瞬时地转化”指在转基因未整合至宿主细胞基因组内的情况下,将一种或多种转基因导入细胞。瞬时转化可以通过例如检测一种或多种转基因所编码多肽的存在的酶联免疫吸附测定(ELISA)检测。备选地,瞬时转化可以如本文中所示[例如实施例1.6和2.4,通过用X-gluc染色的GUS酶活性的组织化学测定,其中所述的X-gluc在GUS酶存在下产生蓝色沉淀物;以及使用GUS-光试剂盒(Tropix)的GUS酶活性的化学发光测定]通过检测转基因(例如uidA基因)所编码的蛋白质(例如β-葡糖醛酸糖苷酶)的活性进行检测。术语“瞬时转化体”指短暂地包含一种或多种转基因的细胞。相对而言,术语“稳定转化”或“稳定地转化”指一种或多种转基因导入和整合至细胞的基因组内,优选地产生经历减数分裂的染色体性整合和稳定遗传力。细胞的稳定转化可以通过细胞基因组DNA与能够与一种或多种转基因结合的核酸序列发生DNA印迹杂交进行检测。备选地,细胞的稳定转化还可以通过扩增转基因序列的细胞基因组DNA聚合酶链式反应进行检测。术语“稳定的转化体”指使得一种或多种转基因稳定整合至基因组DNA内的细胞。因此,稳定的转化体与瞬时转化体相区别在于其中来自稳定转化体的基因组DNA含有一种或多种转基因,而来自瞬时转化体的基因组DNA不含转基因。转化还包括以涉及染色体外复制和基因表达的植物病毒载体形式将遗传材料导入植物细胞,这可以表现出相对于减数分裂稳定性的可变特性。
转基因的或重组:当用来指细胞时,指含有转基因的细胞,或其基因组已经通过导入转基因得到改变的细胞。术语“转基因的”当用来指组织或指植物时,分别指这样的组织或植物,其包含含有转基因的或其基因组已经通过导入转基因得到改变的一个或多个细胞。转基因的细胞、组织和植物可以通过数种方法产生,包括通过人类干预如通过本文中所述方法,将包含核酸(通常是DNA)的“转基因”导入靶细胞或将此转基因整合至靶细胞的染色体。
野生型、天然的或天然来源的:就生物、多肽或核酸序列而言意指所述的生物、多肽或核酸序列是天然存在的或可以在至少一种天然存在的生物、多肽或核酸序列中得到,未受到人工改变、突变或其它操作。
载体:是能够在宿主细胞内复制的DNA分子。质粒和粘粒是示例性载体。此外,术语“载体”和“媒介”可互换使用以指将DNA片段从一种细胞转移至另一种细胞的核酸分子,因此细胞不必要属于相同的生物(例如将DNA片段从农杆菌细胞转移至植物细胞)。
术语“表达载体”如本文中所用,指含有所需要的编码序列和在特定宿主生物中表达有效连接的编码序列所需要的适宜核酸序列的重组DNA分子。
发明详述
根据本发明的教导可以鉴定引起内含子介导性基因表达增强(IME)的内含子。此外,本发明提供分离的植物内含子,若该植物内含子与在植物中有功能的启动子和核酸片段功能性地组合,则可以增强所述的核酸在植物或植物细胞中的表达速率。
本发明的第一实施方案涉及用于鉴定具有植物基因增强表达特性的内含子的方法,包括从植物基因组中选择内含子,其中所述内含子具有至少如下特征:
I)内含子长度短于1,000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点的上游存在类似于共有序列5′-CURAY-3′(SEQID NO:75)的分支点,和
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
在另一实施方案中,本发明涉及用于在植物内含子群体中富集具有在植物中增强表达特性的内含子数目至所述群体的至少50%的方法,所述方法包括从所述群体内选择内含子,该内含子具有至少如下特征:
I)内含子长度短于1,000碱基对,并且
II)存在包含二核苷酸序列5′GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点上游存在类似于共有序列5′-CURAY-3′(SEQ IDNO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
在受玉米(Zea mays)遍在蛋白启动子驱动的β-葡糖醛酸糖苷酶基因(GUS)的5′非翻译区(UTR)中包含通过SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22所描述的本发明内含子已经导致在玉米原生质体(Black Mexican Sweet)悬浮细胞和稳定转化的植物中的报告基因强烈的表达增强(见实施例)。此外,可以证实所述内含子的增强基因表达特性是与从文献中已知的那些增强基因表达特性可比的(例如在表达分析中作为阳性对照使用的玉米遍在蛋白基因的第一内含子)。
在优选的实施方案中,将通过应用本发明富集方法鉴定的内舍子群体中具有增强基因表达特性的内含子的数目富集达到至少50%、优选地至少55%、更优选地至少60%、特别优选地至少65%或非常特别优选地至少70%(即通过使用本发明方法所预选的100个内含子给定群体将包含至少50个、优选地至少55个、更优选地至少60个、特别优选地至少65个或70个具有增强基因表达特性的内含子)。更优选地,使通过应用本发明富集方法鉴定的内含子群体中具有增强基因表达特性的内含子的数目富集达到至少50%,其中所选择的内含子,若作为重组DNA表达构建体的部分,在不改变其它条件下与仅缺少内含子而其它完全相同的表达构建体相比,导致增加给定基因的基因表达至少300%。最优选地,富集是至少60%,其中所选择的内舍子增加受给定启动子驱动的基因的转录至少200%。特别优选地,富集是至少70%,其中所选择的内舍子增加受给定启动子驱动的基因的转录至少50%。
优选地,本发明IME内含子的长度优选地短于1,000个碱基对,更优选地短于900bp、最优选地短于800bp。在优选的实施方案中,本发明方法所鉴定的内舍子的分支点序列由核苷酸序列5′-CURAY-3′(SEQ ID NO:75)或5′-YURAY-3′(SEQ ID NO:76)描述,其中U和A是必需核苷酸并且分别在位置3和5处的嘌呤和嘧啶是优选的核苷酸。在位置1中,嘧啶为优选,并且C对U为优选。环绕GT双核苷酸的5′剪接位点的序列可以变化。优选序列是5′-RR/GT(RT)(RT)(GY)-3′(SEQ ID NO:77)的5′剪接位点,其中R代表核苷酸G或A,Y代表核苷酸C或T。在括号内给出的核苷酸描述了在各自位置内的替代性核苷酸。
在本发明优选的实施方案中,本发明内含子在全序列范围内的腺嘌呤/胸腺嘧啶含量是至少50%、更优选地是至少55%、甚至更优选地是至少60%。
在本发明优选的实施方案中,将应用于本发明方法的植物内含子群体包含a)DNA序列数据库内或b)植物基因组DNA文库内所代表的植物基因组的基本上全部内含子。在本发明额外的实施方案中,将应用于本发明方法的内含子群体选自:a)位于编码蛋白质的两个外显子之间的内含子,和b)位于相应基因的5′非翻译区内部的内含子。为了鉴定具有在植物或植物细胞中增强表达特性的位于编码区内(在两个蛋白质编码性外显子之间)或在给定基因5′非翻译区内的内含子,可以筛选来自(例如存在于序列数据库内的)一套基因的编码区和5′非翻译区以确定位于所述区域内的内含子的存在,并且已鉴定的内含子随后使用本发明的方法之一加以筛选。使用本领域技术人员已知的生物信息工具的计算机法鉴定方法可以通过筛选a)特定的DNA序列数据库(例如专一含有编码区或5′非翻译区)或b)其它公众可用的含有基因组DNA序列的数据库开展。在本发明优选的实施方案中,具有增强表达特性的位于5′非翻译区内的内含子通过包括如下步骤的方法鉴定:
a.鉴定存在于序列数据库中的一套基因内的编码序列,和
b.鉴定与(a)中所鉴定的基因相对应的EST序列,和
c.将所述的编码序列和EST序列与各个基因的基因组序列相比较,和
d.选择包含5′非翻译区的EST序列,和
e.鉴定位于5′非翻译区内的内含子。
优选地,(例如使用本发明方法的标准)搜索或生成DNA序列或生成特定DNA序列数据库并筛选同一DNA序列数据库的步骤可借助技术人员已知的适宜生物信息计算机算法和适宜计算机装置开展。在优选的实施方案中,其中选自于内含子群体的内含子衍生自单子叶植物,特别优选的是选自大麦属、燕麦属、黑麦属、小麦属、高粱属、玉蜀黍属、甘蔗属和稻属的单子叶植物。
在本发明又一个更优选的实施方案中,将应用于本发明方法的内含子群体选自这样的植物基因群体,所述的植物基因群体代表在使用植物细胞、植物组织或完整植物所开展的基因表达分析实验中具有最高表达速率的基因的10%部分(第九位十分位数)。
为测定基因表达水平,提出了多种不同的技术(Milosavljevic,A.等(1996)Genome Res.6:132-141;Shoemaker,D.等(1996)Nature Genet.14:450-456;Sikela,J.M.和Auffray,C.(1993)Nature Genet.3:189-191;Meier-Ewert S.等(1998)Nucleic Acids Research26(9):2216-2223)。因此,可以根据本发明采用多种不同的基因表达分析系统,包括但不限于微阵列分析、“数字化RNA印迹法”、利用“通过杂交法的DNA测序”对cDNA文库的克隆分布分析(Strezoska,Z.等(1991)Proc.Natl.Acad.Sci.USA88:10089-10093)和基因表达的系列分析(SAGEYelculescuVE等(1995)Science270:484-487)。
通过使用cDNA微阵列杂交技术,可以一次监测数千个基因的表达谱。DNA阵列分析已经变成分子生物实验室中用于监测基因表达的标准技术。阵列可以通过预先合成的DNA产物的机械点样或通过寡核苷酸在固体基质(通常是衍生化的载玻片)上的从头合成而制造。通常,阵列用于检测已转录自不同基因并编码不同蛋白质的mRNA的存在。该RNA从多种细胞或从单一细胞类型中提取,随后转换成cDNA或cRNA。RNA的拷贝可以通过(RT-)PCR“扩增”。荧光标签可以用酶方式加入新合成的链中或可以化学地结合至DNA或RNA的新链中。含有与单链探针序列之一互补的序列的cDNA或cRNA分子将与已附着互补探针的斑点经碱基配对发生杂交或粘附。该斑点随后在使用微阵列扫描仪检查时发出荧光。增加或减少的荧光强度表明样品中的细胞最近已经转录或停止转录含有所探测序列的基因。荧光的强度与存在的特定mRNA的拷贝数成正比,并且因而大致地显示该基因的活性或表达水平。可商业地获得可以根据本发明所采用的阵列(和开展表达分析实验所需要的相应设备)。产自Affimetrix(SantaClara,CA)的基因芯片拟南芥ATH1基因组阵列含有代表大约24,000个基因的超过22,500个探针组。该阵列基于来自2000年12月正式完成的国际拟南芥测序计划的信息(http://www.affymetrix.com)。因此,已分析的基因的表达速率可以(根据杂交过程后各个基因的荧光强度)进行归类并且可以通过使用微阵列分析鉴定10%的显示最高基因表达速率的基因。
通过互联网可公开地获得含有微阵列表达谱结果的数据库,例如诺丁汉姆拟南芥贮存中心微阵列数据库(Nottingham Arabidopsis StockCenter’s microarray database)或OSMID(渗透胁迫微阵列信息)数据库。诺丁汉姆拟南芥贮存中心微阵列数据库含有大范围选择的来自Affimetrix基因芯片(http://affymetrix.arabidopsis.info)的微阵列数据。OSMID数据库(http://www.osmid.org)含有在亚利桑那大学开展的大约100个微阵列实验的结果。该数据库包括对NaCl、寒冷和干旱处理拟南芥菜、稻(Oryzasativa)、大麦(Hordeumvulgaris)、冰叶日中花(Mesembryanthemum crystallinum)和玉米的分析。因此通过使用存在于序列/表达数据库内的表达谱,基因的表达速率可以(根据文库中相应cDNA的克隆分布)进行归类并且可以鉴定10%的显示最高(丰度)基因表达速率的基因。
“数字化RNA印迹”通过对数千个从相关cDNA文库中随机选择的克隆进行部分测序而生成。差异性表达的基因可以随后从它们同族序列标签的计数变异得以检测。基于序列标签的方法由自3′方向的区域性非归一化cDNA文库生成的大量(数千个)表达序列标签(EST)组成。“数字化RNA印迹”比较的概念如下:据报道众多标签同用于形成cDNA文库的组织类型或细胞类型中同族转录物的丰度成正比。在存储于计算机数据库内的这些标签的相对频率的变异随后用于说明相应基因的差异性表达(Okubo等1992;Matsubara和Okubo1994)。此技术的进一步发展是仅需要9个核苷酸作为标签因此允许更大通量的SAGE方法。因此,通过使用“数字化RNA印迹分析的基因的表达速率可以(根据文库中相应基因的标签的丰度)进行归类并且可以鉴定10%的表现最高(丰度)基因表达速率的基因。
使用在美国专利US5,667,972、US5,492,806、US5,695,940、US5,972,619、US6,018,041、US6,451,996、US6,309,824中所述的“通过杂交方法的测序”,有可能开展完整的cDNA文库的计算机法克隆分布分析。所述的美国专利的全部内容引用作为参考。本项技术是可商业获得的并且可以与HySeq Inc.合作开展定制的实验。为使用“通过杂交方法的测序”或“HySeq技术”确定克隆分布,将植物在多种条件和处理下生长,并且收集处于不同发育阶段的组织。这以一种策略性方式完成以便使收获至少一个或多个文库中的所有可表达基因的概率最大化。随后从已收集的每一份样品内提取mRNA并用于产生文库。文库可以从在寡dT柱上纯化的mRNA产生。随机挑取来自cDNA文库所转化大肠杆菌(E.coli)的菌落并置于微量滴定平板内并随后将DNA点样至一个表面。将来自微量滴定平板中每一克隆的cDNA插入物进行PCR扩增并点样至尼龙膜上。随后将288个33-P标记的7聚体寡核苷酸组依次与此膜杂交。杂交后,在磷光成像仪扫描期间捕获印迹图像以生成每个单一寡核苷酸的图谱。绝对同一性通过条形码成像盒、滤膜和盒内的方向得到维持。随后使用相对温和的条件处理滤膜以去除结合的探针并随后将滤膜返回杂交室用于下一轮杂交。重复杂交和成像循环直至用完整组288个寡聚物。在杂交结束后,每一个点(代表cDNA插入物)将记录自288个7聚体寡核苷酸内每一7聚体寡核苷酸产生的放射信号的量。将何种寡聚物与每一独立cDNA插入物(膜上的点)结合,结合至何种程度的图谱定义为生成自该克隆的签名。将每个克隆的签名与来自同一生物的所有其它签名进行比较以鉴定相关签名的簇。这个过程将来自一种生物的全部克隆在测序前“分类”成所谓的“簇”。在成簇的过程中,复杂的或组织特异性cDNA文库使用一系列288个7碱基对寡核苷酸进行“挖掘”。通过在这些寡聚物的杂交签名上收集数据,文库中随机成组的克隆可以分类成“簇”。簇用于说明特定文库中每一基因的丰度并且因此是单个基因的基因表达速率的度量。因此,基因的表达速率可以使用“HySeq”技术进行分类并且可以鉴定属于表现最高(丰度)基因表达速率的10%的基因。
选择用于鉴定本发明内舍子的基因、cDNA或表达序列标签为10%、优选地5%、更优选地3%、最优选地1%的在基因表达分析实验中显示最高基因表达速率的基因,其中基因表达速率可以通过使用以上所述的方法间接地计算。在本发明优选的实施方案中,10%的显示最高基因表达速率的基因的核酸序列用来通过使用杂交方法或RACE克隆技术(cDNA末端快速扩增)或染色体步移技术筛选例如适宜的含有DNA序列的数据库或基因组DNA或基因组DNA文库而分离相应基因的(包括内含子序列的)完整基因组DNA序列。在测定相应候选基因的已分离的完整基因组DNA的序列后,存在于所述基因内的内含子序列使用如上所述的鉴定具有增强表达特性的那些内含子的标准进行筛选。用于选择具有增强表达特性的内含子的所述计算机方法具有高的成功概率,但是所述方法的效率可以通过与其它方法组合进一步得到提高。因此在本发明一个优选的实施方案中,独立验证在基因表达分析实验中显示最高基因表达速率的10%的基因使用替代性基因表达分析工具如RNA印迹分析或实时PCR分析(见实施例)完成。
在本发明优选的实施方案中,使用自动化方法、更优选地使用计算机装置和算法,将用于鉴定或富集具有在植物中增强基因表达特性的内含子的方法应用于DNA序列数据库,其中所述算法定义如此指令,该指令是实现在已筛选的DNA序列群体中鉴定或富集具有在植物中增强基因表达特性的内含子的选择步骤所需要的。本发明的又一个实施方案是定义指令的计算机算法,所述的指令是实现如上所述的用于鉴定或富集具有增强植物基因表达特性的内含子的选择步骤所需要的。有用的计算机算法在生物信息学领域或计算生物学领域内众所周知。生物信息学或计算生物学通过创造或使用计算机程序、数学模型或二者,利用数学技术和信息技术来分析序列数据(例如生成序列数据、序列比对、筛选序列数据)。生物信息学的一个主要领域是对已汇集的不同来源的数据进行数据挖掘和分析。其它领域是序列比对、蛋白质结构预测。生物信息学在序列分析中的另一个方面是自动检索基因组内的基因或调节序列(例如基因组DNA范围内的内含子序列)。序列数据库可以使用多种方法进行搜索。最常见的搜索可能是搜索与特定靶基因相似的序列,其中靶基因的序列是用户已知的。这种类型方法的有用程序是BLAST(基本局部比对搜索工具)程序。BLAST是用于比较生物学序列如不同基因的DNA序列的算法。给定序列的文库或数据库,BLAST搜索可以使搜索者寻找特定序列。BLAST算法和执行该算法的计算机程序由美国国立生物技术信息中心(NCBI)的Stephen Altschul开发并可在网络上在http://www.ncbi.nlm.nih.gov/BLAST获得。BLAST程序可以下载并作为命令行应用“blastall”运行,或通过网络免费登录。由NCBI主控的BLAST网络服务器允许任何人用网络浏览器针对蛋白质和DNA持续更新的数据库开展相似性搜索,其中所述的数据库包括大部分最近已测序的生物。BLAST实际上是程序家族(blastall所包含的程序均可执行),除其它以外还包括核苷酸-核苷酸BLAST(BLASTN)。在给出DNA查询时,该程序从用户指定的DNA数据中返回最相似的序列。本领域技术人员知道如何从例如公共序列数据库中产生或检索序列数据库和如何设计算法以便以定制的方式筛选成套的序列(见实施例)。
此外,本发明涉及定义指令的计算机算法,其中所述的指令是实现从植物基因组或内含子群体中鉴定或富集具有在植物中增强基因表达特性的内含子的选择步骤所需要的,其中所述内含子群体选自位于编码蛋白质的两个外显子之间的内含子,和/或位于相应基因的5′非翻译区内部的内舍子,和/或位于如此基因的DNA序列内的内含子,其中所述的基因代表在使用植物细胞、植物组织和/或完整植物所开展的基因表达分析实验中具有最高表达速率的基因的10%部分。本发明的另一个实施方案是包含算法的计算机装置或数据存储装置。存储装置可以是“硬盘”(或“硬盘驱动器”)或光学数据存储介质如CD-ROM(“压缩的只读存储光盘”(ROM)或DVD(数字化通用光盘)或任何机械的、磁的或光的数据存储介质。
本发明另一个实施方案涉及用于分离、提供或产生具有在植物中增强基因表达特性的内含子的方法,包括如下步骤:
a)如上所述开展具有在植物中增强基因表达特性的内舍子的鉴定或富集并提供所述的已鉴定或已富集的内含子的序列信息,和
b)提供在a)中已鉴定或已富集的所述内含子的物理核苷酸序列,和
c)评估在b)中提供的内舍子序列在体内或体外表达实验中的增强基因表达特性,和
d)从所述的表达实验c)中分离显示增强表达特性的内含子。优选地,评估分离的内含子的增强基因表达特性包括:
c1)通过功能性地将来自步骤b)的各个核苷酸序列与至少一个在植物或植物细胞中有功能的启动子序列和至少一个可轻易定量的核酸序列连接而提供重组表达构建体,和
c2)将所述的重组DNA表达构建体导入植物细胞并评估所分离内含子的增强基因表达特性。
优选地,增强基因表达特性的评估在植物细胞或稳定转化的植物内完成并且其中所述分离的内含子增强给定基因的表达至少两倍(见实施例)。
本发明的额外主题物涉及重组DNA表达构建体,其包含在植物细胞中有功能的至少一个启动子序列、至少一个核酸序列和选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22所描述序列中的至少一个内含子及其功能性等效物,其中所述的启动子序列和所述的至少一个内舍子序列功能性地连接于所述核酸序列,并且其中所述内含子对所述的核酸序列或对所述的启动子序列是异源的。此外,本发明涉及重组表达构建体,其包含在植物细胞中有功能的至少一个启动子序列、至少一个核酸序列和由序列SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22中任意一个所描述内含子的至少一个功能性等效物。
优选地,所述的功能性等效物包含内含子的功能性元件,其中所述启动子序列和至少一个所述的内含子序列功能性地连接于所述的核酸序列,并且其中所述内含子对所述的核酸序列或对所述的启动子序列是异源的。更优选地,该功能性等效物还如下进一步加以表征:
i)具有SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述内含子序列的至少50个连续碱基对,或
ii)与SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述序列的跨越至少95个连续核酸碱基对具有至少80%同一性,或
iii)在高度严格条件下与SEQ IDNO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述核酸分子中至少50个连续碱基对的核酸片段杂交。
在本发明优选的实施方案中,内舍子包含分别毗邻于内含子5′和3′剪接位点的序列/外显子5′和3′的至少50个碱基对、更优选地至少40个碱基对、最优选地30个碱基对。在本发明的另一个实施方案中,本发明的重组DNA表达构建体还包含与与启动子功能性连接的一个或多个额外的调节序列。这些调节序列可以选自热休克应答元件、厌氧应答元件、病原体应答元件、干旱应答元件、低温应答元件、ABA应答元件、5′非翻译基因区、3′非翻译基因区、转录终止子、多腺苷酸化信号和增强子。参与ABA诱导性基因表达的顺式作用因子和反式作用因子由Bray(1997)Plant Mol.Biol.2:48-54;Busk等(1998)Plant Mol.Biol.37:425-435和Shinozaki和Yamaguchi-Shinozaki(2000)Curr.Opin.Plant Biol.3:217-223综述。众多ABA诱导性基因在其启动子区域内含有保守的ABA应答性顺式作用元件,称作ABRE(ABA应答元件;PyACGTGGC)(Guiltinan等(1990)Science250:267-271;Mundy等(1990)Proe.Natl.Acad.Sci.USA87:406-410)。分析了rd29A基因的启动子区域并且在核苷酸序列中鉴定了负责脱水诱导性和寒冷诱导性表达的新的顺式作用元件(Yamaguchi-Shinozaki和Shinozaki(1994)Plant Cell6:251-264)。称作脱水应答元件(DRE)的9-bp保守序列TACCGACAT对调节脱水应答性基因表达是必需的。DRE相关的基序已经在寒冷诱导型基因和干旱诱导型基因如kin1、cor6.6和rd17的启动子区域内得到报道(Wang等(1995)Plant Mol.Biol.28:605-617;Iwasaki等(1997)Plant Physiol.115:1287)。热休克基因的温度诱导性归因于热休克因子(HSF)的激活。HSF通过高度保守的热休克启动子元件(HSE)发挥作用,其中所述的热休克启动子元件已经定义为毗邻且倒转的重复基序5′-nGAAn-3′(Amin等(1988)Mol Cell Biol8:3761-3769)。防御应答元件或病原体应答元件的实例是W盒(TTGACY)和W盒样元件,其代表参与植物发育和植物对环境胁迫应答的植物特异性WRKY转录因子的结合位点(Eulgem等(2000)Trends Plant Sci5:199-206;Robatzek S等(2001)Plant J28:123-133),以及Myc元件(CACATG)(Rushton PJ等(1998)Curr OpinPlant Biol1:311-315)。可以与所述的启动子一起使用的此类调节序列或元件包括5′非翻译区、增强子序列和植物多腺苷酸化信号。可提及的翻译增强子的实例是烟草花叶病毒5′前导序列(Gallie等(1987)Nucl Acids Res15:8693-8711),来自章鱼碱合酶基因的增强子等等。此外,翻译增强子可以促进组织特异性(Rouster J等(1998)Plant J15:435-440)。重组DNA表达构建体通常将包含与3′末端核酸序列连在一起的目的基因,其中所述的3′末端核酸序列作为终止转录信号并随后作为RNA的多腺苷酸化信号发挥作用。优选的植物多腺苷酸化信号是基本上与来自根癌农杆菌、尤其来自Ti质粒pTiACHS(Gielen等(1984)EMBO J3:835-46)中T-DNA(章鱼碱合酶)的基因3的T-DNA多腺苷酸化信号或其功能性等效物相对应的多腺苷酸化信号。基本上合适的终止子序列的实例是OCS(章鱼碱合酶)终止子和NOS(胭脂氨酸合成酶)终止子。表达盒和衍生自该表达盒的载体可以包含其它的功能性元件。术语“功能性元件”应在较宽泛的意义上理解并指影响本发明的表达盒、载体或重组生物的生成、扩增或功能的全部元件。功能性元件可以通过举例的方式提及,但不限于此:
1.选择标记
选择标记用于选择和分离已成功转化或同源重组的细胞。为选择已成功发生同源重组的细胞或选择已转化的细胞,通常需要导入赋予已成功发生重组的细胞对杀生物剂(例如除草剂)、代谢抑制剂如2-脱氧葡萄糖-6-磷酸(WO98/45456)或抗生素抗性的选择标记。选择标记允许从未转化的细胞中选择出已转化的细胞(McCormick等(1986)Plant Cell Reports5:81-84)。
1.1负向选择标记
选择标记赋予对杀生物化合物如代谢抑制剂(例如2-脱氧葡萄糖-6-磷酸,WO98/45456)、抗生素(例如卡那霉素、G418、博来霉素或潮霉素)或除草剂(例如草丁膦或草甘膦的抗性)。特别优选的负向选择标记是赋予除草剂抗性的的那些负向选择标记。可提及的实例是:
-草丁膦乙酰基转移酶(PAT,也称作Bialophos抗性;bar;de Block等(1987)EMBO J6:2513-2518)
-5-烯醇式丙酮基莽草酸-3-磷酸合成酶(EPSPS),赋予草甘膦抗性(N-(磷酰甲基)甘氨酸),
-草甘膦降解酶(草甘膦氧化还原酶,gox),
-茅草枯失活性脱卤素酶(deh),
-磺酰脲失活乙酰乳酸合成酶和咪唑啉酮失活乙酰乳酸合成酶((例如具有例如S4和/或Hra突变的突变ALS变体),
-溴苯腈降解性腈水解酶(bxn)
-卡那霉素抗性或G418抗性基因(NPTII;NPTI),编码例如新霉素磷酸转移酶,
-2-脱氧葡萄糖-6-磷酸磷酸酯酶(DOGR1-基因产物;WO98/45456;EP0807836),赋予2-脱氧葡萄糖抗性(Randez-Gil等,1995Yeast11:1233-1240)。
其它合适的负向选择标记是赋予抗生素壮观霉素抗性的aadA基因、赋予链霉素抗性的链霉素磷酸转移酶(SPT)基因和介导潮霉素抗性的潮霉素磷酸转移酶(HPT)基因。特别优选的是赋予对D-氨基酸例如D-丙氨酸和D-丝氨酸所施加的毒性效应具有抗性的负向选择标记(WO03/060133;Erikson2004)。作为本文中特别优选的负向选择标记是来自瘦弱红酵母(Rhodotorula gracilis)(圆红冬酵母(Rhodosporidium toruloides))的daol基因(EC:1.4.3.3;GenBank登录号:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨基酶)[EC:4.3.1.18;GenBank登录号:J01603]。
1.2)反向选择标记
反向选择标记特别适合选择如此生物,其具有包含所述标记的明确的失的序列(KoprekT等(1999)Plant J19(6):719-726)。反向选择标记的实例包括胸苷激酶(TK)、胞嘧啶脱氨基酶(Gleave AP等(1999)Plant Mol Biol.40(2):223-35;Perera RJ等(1993)Plant Mol.Biol23(4):793-799;StougaardJ.(1993)Plant J3:755-761)、细胞色素P450蛋白(Koprek等(1999)Plant J16:719-726)、卤烷脱卤素酶(Naested H(1999)Plant J18:571-576)、iaaH基因产物(Sundaresan V等(1995)Gene&Development9:1797-1810)、胞嘧啶脱氨基酶codA(Schlaman HRM和Hooykaas PJJ(1997)Plant J11:1377-1385)或tms2基因产物(Fedoroff NV&Smith DL,1993,Plant J3:273-289)。
1.3正向选择标记
此外,可以采用正向选择标记。基因如来自根癌农杆菌(菌株;PO22;GenBank登录号:AB025109)的作为细胞分裂素生物合成关键酶的异戊烯基转移酶可以促进转化植物的再生(例如通过在无细胞分裂素培养基上选择)。描述了相应的选择方法(Ebinuma2000a、b)。与非转化植物相比,赋予转化植物生长优势的其它正向选择标记在例如EP-A0601092内描述。生长刺激选择标记可以包括(但不应当限于)β-葡糖醛酸糖苷酶(与例如细胞分裂素葡糖苷酸组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、UDP-半乳糖-4-差向异构酶(与例如半乳糖组合),其中特别优选与甘露糖组合的甘露糖-6-磷酸异构酶。
2)报告基因
报告基因编码可轻易定量的蛋白质,并通过它们的颜色或酶活性能够评估转化效率、表达的位点或表达的时间。在本上下文中极特别优选编码报告蛋白的基因(Schenborn E和Groskreutz D.(1999)Mol Biotechnol.13(1):29-44),如绿色荧光蛋白(GFP)(Sheen等(1995)Plant Journal8(5):777-784;Haseloff等(1997)Proc.Natl.Acad.Sci.USA94(6):2122-2127;Reichel等(1996)Proc.Natl.Acad.Sci.USA93(12):5888-5893;Tian等(1997)Plant Cell Rep16:267-271;WO97/41228;Chui WL等(1996)Curr Biol6:325-330;Leffel SM等(1997)Biotechniques.23(5):912-8)、氯霉素转移酶、萤光素酶(Ow等(1986)Science234:856-859;Millar等(1992)Plant Mol Biol Rep10:324-414)、水母发光蛋白基因(Prasher等(1985)Biochem Biophys Res Commun126(3):1259-1268)、β-半乳糖苷酶、R基因座基因(编码植物组织中调节花青素苷色素(呈红色)的产生因而能够对启动子活性直接分析而无需添加其它辅助物质或生色底物的蛋白质;Dellaporta等(1988):Chromosome Structure and Function:Impact of NewConcepts,18th Stadler Genetics Symposium11:263-282),极特别地优选β-葡糖醛酸糖苷酶(Jefferson等(1987)EMBO J.6:3901-3907)。
3)复制起点,其确保本发明的表达盒或载体在例如大肠杆菌内扩增。可提及的实例是ORI(DNA复制起点)、pBR322ori或P15A ori(Sambrook等:Molecular Cloning:A Laboratory Manual,第二版,Cold SpringHarbor LaboratoryPress,Cold Spring Harbor,NY,1989)。
4)农杆菌介导性植物转化所需要的元件,例如T-DNA的右边界或左边界或vir区域。
本发明的重组表达构建体地还含有除了编码标记蛋白的核酸序列外的可表达的核酸序列,或者与编码标记蛋白核酸序列不同的可表达的核酸序列。在本发明优选的实施方案中,重组DNA表达构建体包含编码i)蛋白质或ii)有义RNA、反义RNA或双链RNA序列的核酸序列。在本发明又一个优选的实施方案中,重组DNA表达构建体含有编码蛋白质的核酸序列。在本发明的又一个实施方案中,重组DNA表达构建体可以含有这样的DNA,其目的是表达影响植物表型而又不被翻译成蛋白质的RNA转录物。此类不表达蛋白质的序列包括反义RNA分子、有义RNA分子、具有核酶活性的RNA分子、形成双链的RNA分子(RNAi)。本发明的转基因表达构建体可以用于通过“基因沉默”抑制或减少内源性靶基因的表达。技术人员知道优选的基因或蛋白质,它的抑制导致有利的表型。此类实例包括但不限于下调拟南芥G蛋白的β-亚基以增加根的生物量(Ullah等(2003)Plant Cell15:393-409)、使环核苷酸门控离子通道(CNGC)失活以改善抗病性(WO2001007596)和下调4-香豆酸-CoA连接酶(4CL)基因以改变木质素和纤维素含量(US2002138870)。在本发明又一个优选的实施方案中,本发明的转基因表达构建体含有在转录时产生RNA酶(核酶)的核酸,其中所述的RNA酶可以作为核酸内切酶发挥作用并催化具有所选择序列的RNA分子。切割所选择的RNA可以导致减少它们编码的多肽产物的产生。核酶具有具备核酸内切酶活性的特异性催化结构域(Kim和Ceck1987,Proc.Natl.Acad.Sci.USA,84:8788-8792;Gerlach等,1987,Nature,328:802-805;Forster和Symons,1987,Cell,49:211-220)。已经描述具有RNA切割活性的数种不同的核酶基序(Symons,1992,Annu.Rev.Biochem.,61:641-671)。实例包括来自包括烟草环斑病毒在内的1组自我剪接型内舍子的序列(Prody等,1986,Science,231:1577-1580)。其它合适的核酶包括来自具有切割活性的RNA酶P的序列(Yan等(1992)Proc.Natl.Acad.Sci.USA87:4144-4148)、发夹核酶结构(Berzal-Herranz等(1992)Gene and Devel.98:1207-1210)和基于丁型肝炎病毒的核酶(美国专利第5,625,047号)。已经详细讨论了核酶指导的RNA切割活性的常规设计和优化(Haseloff和Gerlach(1988)Nature224:585-591;Symons(1992)Annu.Rev·Biochem.61:641-671)。待送递至宿主细胞或宿主植物的特定核酸序列的挑选取决于转化目的。通常,产生转基因植物的主要目的是向植物添加一些有益的性状。
在本发明的另一个实施方案中,重组表达构建体包含编码选择标记蛋白质、筛选标记蛋白质、合成活性蛋白质、分解活性蛋白质、抗生物胁迫蛋白质或抗非生物胁迫蛋白质、雄性不育蛋白质或影响植物农学特征的蛋白质的核酸序列。此类性状包括但不限于,除草剂抗性或耐性、昆虫抗性或耐性、(病毒、细菌、真菌、线虫)疾病抗性或耐性;如对干旱、热、寒冷、冰冻、盐胁迫、氧化胁迫的胁迫耐性;增加产量、食品含量、雄性不育、淀粉数量和质量、油含量和质量、维生素含量和质量(例如维生素E)等等。人们可能需要引入赋予任何此类所需要性状的一种或多种核酸序列。此外,本发明的重组表达构建体可以包含人工转录因子(例如锌指型蛋白质;Beerli(2000)Proc.Natl.Acad.Sci.USA97(4):1495-500)。这些因子结合至待表达或待抑制的内源性基因的调节区域内(这取决于因子的设计),引起内源性基因的表达或抑制。如下可以通过举例方式而不通过限制方式提及作为可用于这些应用的核酸序列或多肽。
通过过表达例如来自短角床杜父鱼(Myoxocephalus scorpius)(WO00/00512)、多刺床杜父鱼(Myoxocephalus octodecemspinosus)的抗冰冻多肽、拟南芥菜转录激活物CBF1、谷氨酸脱氢酶(WO97/12983,WO98/11240)、晚期胚胎发生基因(LEA),例如来自大麦(WO97/13843)、钙依赖性蛋白激酶基因(WO98/26045)、神经钙蛋白(WO99/05902)、法尼基转移酶(WO99/06580,Pei1998)、铁蛋白(Deak1999)、草酸氧化酶(WO99/04013;Dunwell1998)、DREB1A因子(脱水应答元件B1A;Kasuga1999)、甘露醇或海藻糖合成基因如海藻糖磷酸合酶或海藻糖磷酸磷酸酯酶(WO97/42326)或通过抑制基因如海藻糖基因(WO97/50561)改善了对植物胚胎抗生物性胁迫如干旱、高温或低温的保护。特别优选的核酸是编码来自拟南芥菜的转录激活物CBF1(GenBank登录号:U77378)或多刺床杜父鱼抗冰冻蛋白(GenBank登录号:AF306348)或其功能性等效物的那些核酸。为了在植物中表达,核酸分子必须与合适的启动子有效地连接。本发明重组表达构建体的植物特异性启动子、调节性元件和终止子不需要是植物来源的,并且可以源自病毒或微生物,尤其例如来自侵袭植物细胞的病毒。
本发明的又一个主题物是将本发明的内含子序列经同源重组(HR)导入靶核酸序列。作为重组表达构建体与基因组靶核酸序列之间发生HR的前提,重组表达构建体必须含有具有足够长度和同源性的靶核酸序列的片段。在本发明优选的实施方案中,将必须经HR插入目的基因的内含子序列放置在(重组表达构建体内)与优选插入位置的5′和3′区域完全相同的一对DNA序列之间。在此情况下,重组表达构建体可以仅包含内含子序列和为诱导HR事件所需要的核酸序列。在本发明优选的实施方案中,侧翼分布有靶DNA的核酸序列的内舍子序列含有能够表达选择标记蛋白质的表达盒,该表达盒允许选择已在转化后发生同源重组或无效重组的转基因植物。驱动选择标记蛋白质表达的表达盒可以在侧翼分布有特异性核酸内切酶或重组酶可识别的HR控制序列,以便于从基因组中去除此表达盒。此类所谓的标记切除法例如cre/lox技术允许从宿主生物基因组中组织特异性地去除表达盒,其根据需要可是诱导性去除(Sauer B(1998)Methods.14(4):381-92)。在这种方法中,特异性侧翼序列(lox序列)与靶基因连接,其中特异性侧翼序列允许稍后借助cre重组酶加以去除。
具体地,本发明涉及包含如下具有在植物中增强基因表达特性的内含子的转基因表达盒:
1)分离自稻金属硫蛋白样基因的第一内含子序列(BPSI.1,SEQ IDNO:1)(GeneBank登录号AP002540,稻(日本栽培变种)基因组DNA,染色体1,PAC克隆:P0434B04,基因标识号=“P0434B04.31”,蛋白质标识=“BAB44010.1”,互补的连接序列:142304..142409、143021..143098、143683..143747;Hsieh,H.M.等,RNA expression patterns of atype2metallothioneine-likegene fromrice.PlantMol.Biol.32(3),525-529(1996))。该基因包含两个内含子和三个外显子。稻金属硫蛋白样基因的第一内含子(BPSI.1,SEQ ID NO:1)在侧翼分布着5′剪接位点(5′-GU-3′,SEQ ID NO:1中的碱基对(bp)1-2)和3′剪接位点(5′-CAG-3′,SEQID NO:1中的碱基对582-584)。在本发明优选的实施方案中,稻金属硫蛋白样基因的第一内含子(BPSI.1,SEQ ID NO:1)包含分别与内含子(SEQ IDNO:82)的5′和3′剪接位点毗邻的5′和3′序列的至少28个碱基对、更优选地至少40个碱基对、最优选地至少50个碱基对。在核苷酸水平,稻金属硫蛋白样基因与来自其它单子叶植物或双子叶植物的正向同源基因的编码区共有高的同源性或同一性,例如与玉米CL11553mRNA序列(登录号AY109343)具有89%的同一性、与偏生早熟禾(Poa secunda)金属硫蛋白样蛋白质2型mRNA(登录号AF246982.1)具有88%的同一性、与普通小麦(Triticumaestivum)金属硫蛋白mRNA部分编码序列(登录号AF470355.1)具有93%的同一性、与Nicotiana plumbaginifolia金属硫蛋白样蛋白mRNA(登录号NPU35225)具有89%的同一性与甘蓝栽培变种Green King金属硫蛋白样蛋白质2(登录号AF200712)具有86%的同一性,分别与栽培大麦(Hordeumvulgare subsp.vulgare)金属硫蛋白2型mt2b(登录号HVU511346)和mtb2a(登录号HVU511345)基因的部分mRNA具有95%和88%的同一性(同一性使用BLASTN2.2.9算法计算[2004年5月1日]Altschul,Stephen F.等,(1997),Gapped BLAST and PSI-BLAST:a new generation of proteindatabase search programs,Nucleic Acids Res.25:3389-3402)。
2)分离自稻蔗糖UDP葡糖基转移酶-2基因的第一内含子序列(BPSI.2,SEQ IDNO:2)(GeneBank登录号AC084380,稻(日本栽培变种)基因组DNA,染色体3,BAC OSJNBa0090P23,基因标识号=“OSJNBa0090P23.15”,蛋白质标识号=AAK5219.1,互补结合(核苷酸62884至65255、65350..65594、65693..66011、66098..66322、66427..66593、66677..66793、66881..67054、67136..67231、67316..67532、67652..67770、67896..68088、68209..68360、68456..68585、69314..69453和70899..72082)。该基因包含13个内含子和14个外显子。稻蔗糖UDP葡糖基转移酶-2基因的第一内含子(BPSI.2,SEQ ID NO:2)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:2中的bpl-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:2中的bp726-728)。在本发明优选的实施方案中,稻蔗糖UDP葡糖基转移酶-2基因的第一内含子(SEQ ID NO:2)包含内含子(SEQ ID NO:83)5′-剪接位点的5′序列的至少19个碱基对和内含子(SEQ ID NO:83)3′-剪接位点的3′序列/外显子的23个碱基对。在特别优选的实施方案中,内含子BPSI.2包含分别与内含子5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地是至少50个碱基对。
3)分离自稻蔗糖UDP葡糖基转移酶-2基因的第二内含子序列(BPSI.3,SEQ ID NO:3)。所述的第二内含子在侧翼分布着5′-GU-3′,在SEQ ID NO:3中的bp1-2)和3′(5′-CAG-3′,在SEQ ID NO:3中的bp93-953)剪接位点。
在本发明优选的实施方案中,稻蔗糖UDP葡糖基转移酶-2基因的第二内含子(SEQ ID NO:3)包舍内含子(SEQ ID NO:84)5′-剪接位点的5′序列的至少25个碱基对和内舍子(SEQ ID NO:84)3′-剪接位点的3′序列的30个碱基对。在特别优选的实施方案中,内含子BPSI.3包含分别与内含子5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在核苷酸水平,稻蔗糖UDP葡糖基转移酶-2基因与来自其它单子叶植物或双子叶植物的正向同源基因的编码区共有高的同源性或同一性,例如与玉米蔗糖合成酶(Susl)mRNA(登录号L22296.1)具有88%同一性、与普通小麦蔗糖合成酶2型的mRNA(登录号AJ000153)具有85%的同一性,与大麦(H.vulgare)蔗糖合成酶的mRNA(登录号X69931)具有85%同一性、与甘蔗的蔗糖合成酶-2的mRNA(登录号AF263384.1)具有80%同一性、与稻蔗糖合成酶(S464基因)的mRNA部分序列(登录号D10418)具有95%同一性、与大豆蔗糖合成酶mRNA(登录号AF03231)具有79%同一性。同一性已经使用BLASTN2.2.9算法计算[2004年5月1日]Altschul,StephenF.等,(1997),Gapped BLAST and PSI-BLAST:a new generation of protein databasesearch programs,Nucleic Acids Res.25:3389-3402)。
4)分离自编码蔗糖转运蛋白的稻基因(GeneBank登录号AF280050)的第八内含子序列(BPSI.5,SEQ ID NO:5)。此第八内含子(SEQ ID NO:5)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:5中的bp223-225)。在本发明优选的实施方案中,编码蔗糖转运蛋白的稻基因的第八内含子(SEQ ID NO:5)包含内舍子(SEQID NO:86)5′-剪接位点的5′序列的至少35个碱基对和内含子(SEQ IDNO:86)3′-剪接位点的3′序列的30个碱基对。在特别优选的实施方案中,内含子BPSI.5包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在更优选的实施方案中,第八内含子(BPSI.5,SEQ ID NO:5)的5′和3′剪接位点使用PCR诱变法进行修饰(SEQID NO:87)以便匹配对于5′剪接位点是5′-AG::GTAAGT-3′(SEQ ID NO:80)和对于3′剪接位点是5′-CAG::GT-3′(SEQ ID NO:81)的植物共有序列。
5)分离自稻基因(GeneBank登录号BAA94221)的第四内含子序列(BPSI.6,SEQ ID NO:6),其中所述的稻基因编码与来自克隆T22O13、F12K2的编码推定性脂酶的拟南芥菜染色体II序列(AC006233)具有同源性的未知蛋白质。此第四内含子(SEQ ID NO:6)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:6中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ IDNO:6中的bp768-770)点。在本发明优选的实施方案中,稻基因(登录号BAA94221)的第四内含子(SEQ ID NO:6)包含内含子(SEQ ID NO:88)5′-剪接位点的5′序列的至少34个碱基对和内含子(SEQ ID NO:88)3′-剪接位点的3′序列的34个碱基对。在特别优选的实施方案中,内含子BPSI.6包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在更优选的实施方案中,第四内含子(BPSI.6,SEQ IDNO:6)的5′和3′剪接位点使用PCR诱变方法进行修饰(SEQ ID NO:89)以便匹配对于5′剪接位点是5′-AG::GTAAGT-3′(SEQ ID NO:80)和对于3′剪接位点是5′-CAG::GT-3′(SEQ ID NO:81)的植物共有序列。
6)分离自编码推定的肉桂醇脱氢酶的稻基因(登录号BAB90130)的第四内含子序列(BPSI.7,SEQ ID NO:7)。此第四内含子(SEQ ID NO:7)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:7中的bp1-27)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:7中的713-715bp)。在本发明优选的实施方案中,稻基因(登录号BAB90130)的第四内含子(SEQ ID NO:7)包含内含子(SEQID NO:90)5′-剪接位点的5′序列的至少34个碱基对和内含子(SEQ IDNO:90)3′-剪接位点的3′序列的26个碱基对)。在特别优选的实施方案中,内含子BPSI.7包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在更优选的实施方案,第四内含子(BPSI.7,SEQ ID NO:7)的5′和3′剪接位点使用PCR诱变方法进行修饰(SEQID NO:91)以便匹配对于5′剪接位点是5′-AG::GTAAGT-3′(SEQ ID NO:80)和对于3′剪接位点是5′-CAG::GT-3′(SEQ ID NO:81)的植物共有序列。
7)分离自编码推定的蛋白激酶的稻基因(登录号AP003300)的第三内含子序列(BPSI.10,SEQ ID NO:10)。此第三内含子(SEQ ID NO:10)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ IDNO:10中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:10中的536-538bp)。在本发明优选的实施方案中,稻基因(登录号AP003300)的第三内含子(SEQ ID NO:10)包含内含子(SEQ ID NO:94)5′-剪接位点的5′序列的至少31个碱基对和内含子(SEQ IDNO:94)3′-剪接位点的3′序列的31个碱基对。在特别优选的实施方案中,内含子BPSI.10包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在更优选的实施方案中,第三内含子(BPSI.10,SEQ ID NO:10)的5′和3′剪接位点使用PCR诱变方法进行修饰(SEQ ID NO:95)以便匹配对于5′剪接位点是5′-AG::GTAAGT-3′(SEQID NO:80)和对于3′剪接位点是5′-CAG::GT-3′(SEQ ID NO:81)的植物共有序列。
8)分离自编码MADS3盒蛋白的稻基因(登录号L37528)的第一内含子序列(BPSI.11,SEQ ID NO:11)。此第一内含子(SEQ ID NO:11)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:11中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:11中的bp329-331)。在本发明优选的实施方案中,稻基因(登录号L37528)的第一内含子(SEQ ID NO:11)包含内含子(SEQID NO:96)5′-剪接位点的5′序列的至少35个碱基对和内含子(SEQ IDNO:96)3′-剪接位点的3′序列的34个碱基对。在特别优选的实施方案中,内含子BPSI.11包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。在更优选的实施方案,第一内舍子(BPSI.11,SEQ ID NO:11)的5′和3′剪接位点使用PCR诱变方法进行修饰(SEQ ID NO:97)以便匹配对于5′剪接位点是5′-AG::GTAAGT-3′(SEQ IDNO:80)和对于3′剪接位点是5′-CAG::GT-3′(SEQ ID NO:81)的植物共有序列。
9)分离自编码推定的腺苷甲硫氨酸脱羧酶的稻基因(登录号CB625805)的第一内含子序列(BPSI.12,SEQ ID NO:12)。此第一内含子(SEQ IDNO:12)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:12中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:12中的bp959-961)。在本发明优选的实施方案中,稻基因(登录号CB625805)的第一内含子(SEQ ID NO:12)包含内含子(SEQ ID NO:98)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ ID NO:98)3′-剪接位点的3′序列的26个碱基对。在特别优选的实施方案中,内含子BPSI.12包含分别与内舍子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
10)分离自编码天冬氨酸蛋白酶的稻基因(登录号CF297669)的第一内含子序列(BPSI.13,SEQ ID NO:13)。此第一内含子(SEQ ID NO:13)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:13中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:13中的bp593-595)。在本发明优选的实施方案中,稻基因(登录号CF297669)的第一内含子(SEQ ID NO:13)包含内含子(SEQ ID NO:99)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ IDNO:99)3′-剪接位点的3′序列的24个碱基对。在特别优选的实施方案中,内含子BPSI.13包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
11)分离自编码Lec14b蛋白质的稻基因(登录号CB674940)的第一内含子序列(BPSI.14,SEQ ID NO:14)。此第一内含子(SEQ ID NO:14)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:14中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:14中的bp143-145)。在本发明优选的实施方案中,稻基因(登录号CB674940)的第一内含子(SEQ ID NO:14)包含内含子(SEQ ID NO:100)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQID NO:100)3′-剪接位点的3′序列的25个碱基对。在特别优选的实施方案中,内含子BPSI.14包含分别与内舍子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
12)分离自编码推定的SalT蛋白质前体的稻基因(登录号BAD37295.1)的5′UTR的第一内含子序列(BPSI.15,SEQ ID NO:15)。此第一内含子(SEQID NO:15)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:15中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:15中的bp312-314)。在本发明优选的实施方案中,稻基因(登录号BAD37295.1)的第一内含子(SEQ IDNO:15)包含内含子(SEQ ID NO:101)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ ID NO:101)3′-剪接位点的3′序列的25个碱基对。在特别优选的实施方案中,内舍子BPSI.15包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
13)分离自编码推定的reticulon的稻基因(登录号BX928664)的第一内含子序列(BPSI.16,SEQ ID NO:16)。此第一内含子(SEQ ID NO:16)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:16中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:16中的bp650-652)。在本发明优选的实施方案中,稻基因(登录号BX928664)的第一内含子(SEQ ID NO:16)包含内含子(SEQ ID NO:102)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQID NO:102)3′-剪接位点的3′序列的23个碱基对。在特别优选的实施方案中,内含子BPSI.16包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
14)分离自编码葡糖酸氧化酶的稻基因(登录号AA752970)的第一内舍子序列(BPSI.17,SEQ ID NO:17)。此第一内含子(SEQ ID NO:17)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:17中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:17中的bp266-268)。在本发明优选的实施方案中,稻基因(登录号AA752970)的第一内含子(SEQ ID NO:17)包含内含子(SEQ ID NO:103)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQID NO:103)3′-剪接位点的3′序列的35个碱基对。在特别优选的实施方案中,内含子BPSI.17包含分别与内舍子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
15)分离自与AT4g33690相似的稻克隆GI40253643(登录号AK064428)的第一内含子序列(BPSI.18,SEQ ID NO:18)。此第一内含子(SEQ IDNO:18)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:18中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:18中的bp544-546)。在本发明优选的实施方案中,稻基因(登录号AK064428)的第一内含子(SEQ ID NO:18)包含内含子(SEQ ID NO:104)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ ID NO:104)3′-剪接位点的3′序列的21个碱基对。在特别优选的实施方案中,内含子BPSI.18包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
16)分离自稻克隆GI51091887(登录号AK062197))的第一内含子序列(BPSI.19,SEQ ID NO:19)。此第一内含子(SEQ ID NO:19)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:19中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:19中的bp810-812)。在本发明优选的实施方案中,稻基因(登录号AK062197)的第一内舍子(SEQ ID NO:19)包含内含子(SEQ ID NO:105)5′-剪接位点的5′序列的至少26个碱基对和内舍子(SEQID NO:105)3′-剪接位点的3′序列的26个碱基对。在特别优选的实施方案中,内含子BPSI.19包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
17)分离自编码假设的蛋白质克隆(GI33657147)的稻基因(登录号CF279761)的第一内含子序列(BPSI.20,SEQ ID NO:20)。此第一内含子(SEQ ID NO:20)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:20中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:20中的bp369-371)剪接位点。在本发明优选的实施方案中,稻基因(登录号CF279761)的第一内含子(SEQ ID NO:20)包含内含子(SEQ ID NO:106)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ ID NO:106)3′-剪接位点的3′序列的27个碱基对。在特别优选的实施方案中,内含子BPSI.20包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
18)分离自编码推定的膜转运蛋白的稻基因(登录号CF326058)的第一内含子序列(BPSI.21,SEQ ID NO:21)。此第一内舍子(SEQ ID NO:21)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:21中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:21中的bp720-722)。在本发明优选的实施方案中,稻基因(登录号CF326058)的第一内含子(SEQ ID NO:21)包含内含子(SEQ ID NO:107)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQID NO:107)3′-剪接位点的3′序列的25个碱基对。在特别优选的实施方案中,内含子BPSI.21包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
19)分离自编码推定的ACT结构域重复蛋白的稻基因(登录号C26044)的第一内含子序列(BPSI.22,SEQ ID NO:22)。此第一内含子(SEQ IDNO:22)的侧翼分布着5′剪接位点(5′-GU-3′,在SEQ ID NO:22中的bp1-2)和3′剪接位点(5′-CAG-3′,在SEQ ID NO:22中的bp386-388)。在本发明优选的实施方案中,稻基因(登录号C26044)的第一内含子(SEQ ID NO:22)包含内含子(SEQ ID NO:108)5′-剪接位点的5′序列的至少26个碱基对和内含子(SEQ ID NO:108)3′-剪接位点的3′序列的28个碱基对。在特别优选的实施方案中,内含子BPSI.22包含分别与内含子的5′和3′剪接位点毗邻的5′和3′序列的至少40个碱基对、更优选地至少50个碱基对。
表1:从中优选地分离本发明内含子的基因,该基因推定的功能、
由该基因编码的cDNA和蛋白质
内含子 稻GI号 登录号 SEQID NO. 序列同源性
BPSI.1 AP002540 1 金属硫蛋白样基因
BPSI.2 AC084380 2 蔗糖UDP葡糖基转移酶-2基因,第一内舍子
内含子 稻GI号 登录号 SEQID NO. 序列同源性
BPSI.3 AC084380 3 蔗糖UDP葡糖基转移酶-2基因,第二内含子
BPSI.4 AC084380 4 蔗糖UDP葡糖基转移酶-2基因,第三内含子
BPSI.5 9624451 AF280050 5 蔗糖转运蛋白
BPSI.6 7523493 BAA94221 6 与来自克隆T22O13、F12K2的拟南芥菜染色体II序列相似;推定的脂酶(AC006233)
BPSI.7 20161203 BAB90130 7 推定的肉桂醇脱氢酶
BPSI.10 20160990 AP003300 10 推定的蛋白激酶
BPSI.11 886404 L37528 11 MADS3盒蛋白
BPSI.12 29620794 CB625805 12 推定的腺苷甲硫氨酸脱羧酶
BPSI.13 33666702 CF297669 13 天冬氨酸蛋白酶
BPSI.14 29678665 CB674940 14 Lec14b蛋白
BPSI.15 51535011 BAD37295 15 推定的SalT蛋白质前体
BPSI.16 41883853 BX928664 16 推定的Reticulon
BPSI.17 2799981 AA752970 17 葡糖酸氧化酶
BPSI.18 40253643 AK06442 18 推定的非编码(与AT4g33690相似)
BPSI.19 51091887 AK062197 19 推定的非编码
BPSI.20 33657147 CF279761 20 假设的蛋白质
BPSI.21 33800379 CF326058 21 推定的膜转运蛋白
BPSI.22 2309889 C26044 22 推定的ACT结构域重复蛋白
通过本发明实例发现具有SEQ ID NO:1、2、3、5、6、7、10和11的本发明内含子分别对瞬时表达分析和稳定转化的植物中的GUS基因表达速率有影响。可以证实将在GUS基因的5′UTR中包含所述内含子与缺少第一内舍子的对照构建体相比,导致该基因分别在瞬时转化和稳定转化的细胞内的表达速率强烈地增强(见实施例1.6.1(表7)、1.6.2(表8)、2.4(表15)。
具有SEQ ID NO:12、13、14、15、16、17、18、19、20、21或22的内含子的增强表达特性可以通过开展如上所述的瞬时表达分析和稳定表达分析予以证实。
本发明内含子的功能性等效物可以在核酸数据库中经同源性搜索或使用SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所述的核酸分子的至少50个连续碱基对的片段和严格杂交条件经DNA杂交(筛选基因组DNA文库)鉴定。在本发明优选的实施方案中,严格杂交条件可选择如下:
杂交缓冲液含有甲酰胺、NaCl和PEG6000(聚乙二醇,MW6000)。甲酰胺对双链核酸分子具有去稳定效应,因而当用于杂交缓冲液中时,允许降低杂交温度至42℃而不降低杂交严格性。NaCl对DNA双链体的复性速率和DNA探针与它的互补性DNA靶的杂交效率产生有利影响。PEG增加杂交缓冲液的粘度,这原则上对杂交效率产生不利影响。杂交缓冲液的组成如下:
250mM磷酸钠缓冲液pH7.2
1mM EDTA(乙二胺四乙酸)
7%SDS(g/v)(十二烷基硫酸钠)
250mM NaCl(氯化钠)10μg/ml单链DNA5%聚乙二醇(PEG)600040%甲酰胺
杂交优选地在42℃开展过夜。在早晨,杂交的滤膜用2×SSC+0.1%SDS洗涤3次,每次10分钟。杂交应当有利地用至少50、60、70或80bp、优选地至少90bp的片段实施。在特别优选的实施方案中,杂交应当用完整的核酸序列以如上所述的条件实施。
本发明内含子与不同的植物启动子的组合已经显示了它们的增强表达特性和/或调节特性。在本发明优选的实施方案中,重组DNA表达构建体包含(与本发明内含子功能性连接的)选自如下的在植物或植物细胞中有功能的启动子序列:
sa)如SEQ ID NO:113中核苷酸1至854所述的稻叶绿体蛋白12(Os.CP12)启动子(“片段”),或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
b)如SEQ ID NO:114中核苷酸1至1184所述的玉米羟脯氨酸丰富糖蛋白(Zm.HRGP)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
c)如SEQ ID NO:115中核苷酸1至1034所述的稻p-咖啡酰辅酶A3-O-甲基转移酶(Os.CCoAMT1)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
d)如SEQ ID NO:116中核苷酸1至1140所述的玉米球蛋白-1(Zm.Glb1)启动子(W64A),或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
e)如SEQ ID NO:117中核苷酸1至1589所述的推定的稻H+转运ATP合酶(Os.V-ATP酶)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
f)如SEQ ID NO:118中核苷酸1至796所述的推定的稻C-8,7固醇异构酶(Os.C8,7SI)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
g)如SEQ ID NO:119中核苷酸1至1062所述的玉米乳酸脱氢酶(Zm.LDH)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
h)如SEQ ID NO:121中核苷酸1至1386所述的稻晚期胚胎发生丰富蛋白(Os.Lea)启动子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于以上段落中所定义的高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列。
所述表达构建体优选地包含如上所定义的启动子之一与选自如下的至少一个内含子的组合:
i)如SEQ ID NO:113中核苷酸888至1470所述的BPSI.1内含子或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于如上所定义高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
ii)如SEQ ID NO:120中核苷酸1068至1318所述的BPSI.5内含子,或与所述片段具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,或与所述片段在严格条件下(优选地在等同于如上所定义高度严格条件的条件下)杂交的序列,或包含所述片段的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列。
表达构建体更优选地包含启动子与选自如下的内含子的组合:
i)如SEQ ID NO:113、114、115、116、117、118、119、120或121任意一个所述的序列,和
ii)具有由SEQ ID NO:113、114、115、116、117、118、119、120或121任意一个所述序列的至少50(优选地至少100、更优选地至少200或300、最优选地至少400或500)个连续核苷酸的序列,和
iii)与由SEQ ID NO:113、114、115、116、117、118、119、120或121任意一个所述的序列具有至少60%(优选地至少70%或80%、更优选地至少90%或95%、最优选地至少98%或99%)同一性的序列,和
iv)与由SEQ ID NO:113、114、115、116、117、118、119、120或121任意一个所述的序列在严格条件下(优选地在等同于如上所
定义高度严格条件的条件下)杂交的序列。
本发明优选的主题物是含有本发明的重组表达构建体的载体,优选地是植物转化载体。表达盒可以经合适的限制性切割位点导入载体。所形成的质粒首先导入大肠杆菌。选择正确转化的大肠杆菌、使其生长并且通过技术人员熟悉的方法得到重组质粒。限制性切割和测序可以起到验证克隆步骤的作用。优选的载体是有可能使表达盒稳定整合至宿主基因组的那些载体。本发明的表达构建体可以使用载体有利地导入细胞,优选地至植物细胞内。在一个实施方案中,本发明的方法包括用包含本发明至少一个转基因表达盒的转基因表达载体转化生物或细胞(例如植物或植物细胞)。本发明的方法不限于本文中已公开的表达载体。能够将目的核酸序列导入植物细胞的任何表达载体将处于本发明的范围内。通常,表达载体包含与允许载体克隆至细菌宿主或噬菌体宿主的元件所组合的本发明转基因表达盒。载体优选地,尽管不是必需,含有在类型广泛的原核宿主中有功能的复制起点。通常,但非必需,包括选择标记以允许选择携带所需要载体的细胞。优选允许表达构建体稳定整合至宿主基因组内的那些载体。在将DNA注射或电穿孔至植物细胞内的情况下,所用的质粒不需要满足任何特定的要求。可以使用简单的质粒,如pUC系列质粒。当欲从转化的细胞中再生完整的植物时,在质粒上需要额外的选择标记基因存在。可获得多种可能的质粒载体用来将外来基因导入植物,并且这些质粒载体通常含有用于在大肠杆菌内繁殖的复制起点和用于选择已转化细菌的标记基因。质粒实例是pBR322、pUC系列、M13mp系列、pACYC184等等。将通过表达构建体经合适的限制性切割位点导入载体。所形成的质粒首先导入大肠杆菌。选择正确转化的大肠杆菌、使其生长并且通过技术人员熟悉的方法得到重组质粒。限制性切割和测序可以起到验证克隆步骤的作用。
取决于导入DNA的方法,载体质粒上可能需要有其它基因。
根癌农杆菌和发根农杆菌(A.rhizogene)是通常转化植物细胞的植物病原性土壤细菌。根癌农杆菌和发根农杆菌的Ti和Ri质粒分别携带负责遗传地转化植物的基因(Kado(1991)Crit Rev Plant Sci10:1)。本发明的载体可以基于农杆菌Ti质粒或Ri质粒并因而可以利用将DNA转移至植物基因组内的天然系统。作为这种高度发达的寄生现象的部分,农杆菌将其基因组信息的限定的部分(T-DNA;在侧翼分布有约25bp重复区,称作左边界和右边界)转移至植物细胞的染色体DNA内(Zupan(2000)Plant J23(1):11-28)。通过所谓的vir基因(原始Ti质粒的一部分)的组合作用,介导所述的DNA转移。为利用这种天然系统,开发了缺乏原始的肿瘤诱导基因的Ti-质粒(“卸甲载体”)。在进一步改进中,将所谓的“双元载体系统”T-DNA通过整合至允许更容易操作的穿梭载体内而与Ti-质粒的其它功能性元件(例如vir基因)物理地分离开(EP-A120516;US4.940.838)。这些双元载体(除了具有其边界序列的卸甲T-DNA以外)还包含用于在农杆菌和大肠杆菌内均复制的原核序列。农杆菌介导性转化的有利之处是通常仅侧翼分布有边界的DNA才转移至基因组内并且优选地仅插入一个拷贝。对农杆菌载体系统的描述和用于农杆菌介导性基因转移的方法在本领域是已知的(Miki1993,“Procedures for Introducing Foreign DNA into Plants”在METHODSIN PLANTMOLECULARBIOLOGYANDBIOTECHNOLOGY;第67-88页;Gruber1993,“Vectors for PlantTransformation”在METHODS IN PLANT MOLECULAR BIOLOGYAND BIOTECHNOLOGY;第89-119页;Moloney(1989)Plant Cell Reports8:238-242)。T-DNA转化植物细胞的用途已经进行了大量研究和描述(EP120516;Hoekema1985,在:The Binary Plant Vector System,Offsetdrukkerij Kanters B.V.,Alblasserdam,第5章;Fraley(1985)CRCCrit.Rev.Plant.Sci.4:1-45;和An(1985)EMBO J.4:277-287)。多种双元载体是已知的,其中某些双元载体是可商业获得的,例如pBIN19(ClontechLaboratories,Inc.美国)。因此,对于农杆菌介导性转化,本发明的转基因表达构建体整合至特定的质粒,或至穿梭载体或中间载体内,或至双元载体。如果Ti或Ri质粒将用于转化,Ti或Ri质粒T-DNA的至少右边界,但是在大多数例子中左边界和右边界以侧翼区域的形式与待导入的转基因表达构建体连接。优选地使用双元载体。双元载体能够在大肠杆菌和在农杆菌内复制。双元载体可以包含在侧翼分布T-DNA右边界序列和T-DNA左边界序列的选择标记基因和接头或多接头(用于插入例如待转移的表达构建体)。它们可以直接转移至农杆菌(Holsters(1978)Mol Gen Genet163:181-187)。选择标记基因允许选择转化的农杆菌并且例如是赋予卡那霉素抗性的nptII基因。在此情况下作为宿主生物起作用的农杆菌应当已经含有带vir区域的质粒。vir区域是转移T-DNA至植物细胞所需要的。以如此方式所转化的农杆菌可用于转化植物细胞。T-DNA转化植物细胞的用途已经进行了大量研究和描述(EP120516;Hoekema(1985)Nature303:179-181;An(1985)EMBO J.4:277-287;还见下文)。常用的双元载体基于衍生自P型质粒RK2的“广泛宿主类型”质粒,如pRK252(Bevan(1984)Nucl.Acid Res.12:8711-8720)或pTJS75(Watson(1985)EMBO J4(2):277-284)。这些载体中的大部分是pBIN19(Bevan1984,Nucl.Acid Res.12:8711-8720)的衍生物。多种双元载体是已知的,其中某些双元载体是可商业获得的,例如pBI101.2或pBIN19(Clontech Laboratories,Inc.美国)。其它载体在大小和操作性方面得到改良(例如pPZP;Hajdukiewicz(1994)Plant Mol Biol25:989-994)。改良的载体系统也描述于WO02/00900内。在优选的实施方案中,用于实施本发明的农杆菌菌株包括章鱼碱菌株例如LBA4404,或农杆碱菌株例如EHA101或EHA105。用于DNA转移的合适的根癌农杆菌菌株是例如EHA101pEHA101(Hood(1986)J Bacteriol168:1291-1301)、EHA105[pEHA105](Li(1992)PlantMolBiol20:1037-1048)、LBA4404[pAL4404](Hoekema(1983)Nature303:179-181)、C58C1[pMP90](Koncz(1986)MolGenGenet204:383-396)和C58C1[pGV2260](Deblaere(1985)Nucl Acids Res13:4777-4788)。其它的合适菌株是根癌农杆菌胭脂氨酸菌株C58。其它的合适菌株是根癌农杆菌C58C1(Van Larebeke(1974)Nature252:169-170,A136(Watson(1975)J.Bacteriol123:255-264)或LBA4011(Klapwijk(1980)J.Bacteriol.141:128-136)。在优选的实施方案中,用以转化与植物酚化合物一起预培养的植物组织的农杆菌菌株含有L,L-琥珀碱型Ti-质粒,优选地是卸甲的所述质粒,如pEHA101。在另一个优选的实施方案中,用以转化与植物酚化合物一起预培养的植物组织的农杆菌菌株含有章鱼碱型Ti-质粒,优选地是卸甲的所述质粒,如pAL4404。通常,当使用章鱼碱型Ti质粒或辅助质粒时,优选virF基因被缺失或失活(Jarchow(1991)Proc.Natl.Acad.Sci.USA88:10426-10430)。在优选的实施方案中,农杆菌菌株用以转化与植物酚化合物如乙酰丁香酮一起预培养的植物组织。本发明的方法还可以与特定农杆菌菌株组合使用以进一步提高转化效率,如在其中vir基因的表达和/或其诱导因存在突变性或嵌合性virA或virG基因而受到改变的农杆菌菌株(例如Hansen(1994)Proc.Natl.Acad.Sci.USA91:7603-7607;Chen(1991)J.Bacteriol.173:1139-1144;Scheeren-Groot(1994)J.Bacteriol176:6418-6426)。双元载体或任何其它载体可以通过常用DNA重组技术进行修饰,在大肠杆菌内繁殖并通过例如电穿孔或其它转化技术导入农杆菌(Mozo(1991)Plant Mol.Biol.16:917-918)。农杆菌如本领域所描述生长和利用。包含载体的农杆菌菌株例如可以在补充适宜抗生素(例如50mg/l壮观霉素)的YP培养基(5g/l酵母提取物、10g/l胨、5g/lNaCl,15g/l琼脂,pH6.8)上生长3日。细菌用接种环从固体培养基上收集并重悬。
本发明又一个主题物涉及用含有本发明的转基因表达构建体的至少一种载体转化的转基因非人生物。在优选的实施方案中,本发明涉及细菌、真菌、酵母,更优选地涉及植物或植物细胞。在本发明优选的实施方案中,转基因生物是单子叶植物。在仍更优选的实施方案中,单子叶植物选自大麦属、燕麦属、黑麦属、小麦属、高粱属、玉蜀黍属、甘蔗属和稻属、极特别地是如此植物,其选自用本发明载体转化的或含有本发明重组表达构建体的大麦、普通小麦、普通小麦斯佩尔特亚种(Triticum aestivumsubsp.spelta)、小黑麦、燕麦(Avena sativa)、黑麦(Secale cereale)、两色高粱(Sorghum bicolor)、甘蔗、玉米和稻。优选的细菌是埃希氏菌属(Escherichia)、欧文氏菌属(Erwinia)、农杆菌属、黄杆菌属(Flavobacterium)、产碱杆菌属(Alcaligenes)或蓝细菌(cyanobacteria)如集胞藻属(Synechocystis)的细菌。特别优选能够感染植物并因此转移本发明的构建体的微生物。优选的微生物是来自农杆菌属的那些微生物并且尤其是根癌农杆菌。优选的酵母是念珠菌(Candida)、酵母菌(Saccharomyces)、汉逊酵母(Hansenula)或毕赤酵母(Pichia)。优选的真菌是曲霉(Aspergillus)、木霉(Trichoderma)、阿舒囊霉(Ashbya)、链孢霉(Neurospora)、镰孢霉(Fusarium)、白僵菌(Beauveria)或其它真菌。为本发明的目的,植物生物还是能够显示光合作用活性的其它生物,例如藻类或蓝细菌并且还是苔藓植物。优选的藻类是绿藻(green algae),例如红球藻属(Haematococcus)、Phaedactylum tricornatum、团藻属(Volvox)或盐藻属(Dunaliella)绿藻。此外,本发明涉及衍生于用含有本发明转基因表达构建体的至少一种载体转化的转基因非人生物,如细菌、真菌、酵母、植物或植物细胞的细胞培养物、组织、器官(例如在植物生物例子中的叶、根等等)或繁殖材料。
本发明的又一个主题物涉及提供用于增强核酸在植物或植物细胞中表达的表达盒的方法,包括将本发明内含子与不含所述内含子的植物表达盒功能性连接的步骤。仍在又一个优选的实施方案中,本发明涉及用于增强核酸序列在植物或植物细胞中表达的方法,包括将本发明内含子与所述的核酸序列功能性连接的步骤。优选地,提供用于增强核酸在植物或植物细胞中表达的表达盒的方法和用于增强核酸序列在植物或植物细胞中表达的方法还包括如下步骤:
i)提供重组表达盒,其中核酸序列与在植物中有功能的启动子序列并与选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22的内含子序列功能性地连接,
ii)将所述重组表达盒导入植物细胞或植物,
iii)鉴定或选择包含所述转基因表达构建体的转基因植物细胞。在另一个优选的实施方案中,如上所述的方法还包括如下步骤:
iv)从转基因植物细胞中再生转基因植物组织。
在备选的优选实施方案中,此方法还包括:
v)从转基因植物细胞中再生转基因植物。
生成转化的生物或转化的细胞需要将目的DNA导入目的宿主细胞。可以获得用于转化过程的多种方法(还见Keown(1990)Methods inEnzymology185:527-537)。例如DNA可以通过微量注射或通过用DNA包被的微粒子轰击直接地导入。另外,细胞可以得以化学地透化,例如使用聚乙二醇,以致于DNA可以通过扩散进入细胞。DNA还可以通过原生质体与其它含DNA的单元如微细胞、细胞、溶酶体或脂质体融合得到导入。导入DNA的另一个合适方法是电穿孔法,其中细胞通过电脉冲被可逆透化。用于将转基因表达构建体或载体导入植物组织的方法可以包括不限于,例如电注射法(Nan(1995)在“Biotechnology in Agriculture and Forestry”编者Y.P.S.Bajaj,Springer-Verlag Berlin Heidelberg34:145-155;Griesbach(1992)Hort Science27:620);与脂质体、溶酶体、细胞、微细胞或表面有脂质的可融合体的融合法(Fraley(1982)Proc.Natl.Acad.Sci.USA79:1859-1863);聚乙二醇(Krens(1982)Nature296:72-74);可以增加游离DNA摄入的化学品;使用病毒的转化等等。此外,可以采用带基因枪的生物射弹法、电穿孔法、干燥胚温育于含有DNA的溶液内和微量注射。可以采用(对稻)基于原生质体的方法,其中DNA经脂质体、PEG或电穿孔送递至原生质体(Shimamoto(1989)Nature338:274-276;Datta(1990)Bio/Technology8:736-740)。通过电穿孔法的转化涉及应用短时的高电压电场以在细胞膜中产生“孔”,经此DNA得以摄取。这些方法例如用以产生稳定转化的单子叶植物(Paszkowski(1984)EMBO J3:2717-2722;Shillito(1985)Bio/Technology,3:1099-1103;Fromm(1986)Nature319:791-793),尤其来自稻(Shimamoto(1989)Nature338:274-276;Datta(1990)Bio/Technology8:736-740;Hayakawa(1992)Proc.Natl.Acad.Sci.USA89:9865-9869)。粒子轰击法或“生物射弹”法是产生转化植物尤其是单子叶转化植物的广泛使用的方法。在“生物射弹”(微抛射体介导的DNA送递)法中,微抛射体粒子用DNA包被并通过机械装置加速至足以穿透植物细胞壁和细胞核的高速度(WO91/02071)。外来DNA得以整合至宿主DNA内并产生转化细胞。存在众多“生物射弹”方法的变型(Sanford(1990)Physiologia Plantarium79:206-209;Fromm(1990)Bio/Technology8:833-839;Christou(1988)Plant Physiol87:671-674;Sautter(1991)Bio/Technology9:1080-1085)。本方法已经用于产生稳定转化的单子叶植物,包括稻、玉米、小麦、大麦和燕麦(Christou(1991)Bio/Technology9:957-962;Gordon-Kamm(1990)Plant Cell2:603-618;Vasil(1992)Bio/Technology10:667-674,(1993)Bio/Technology11:1153-1158;Wan(1994)Plant Physiol.104:3748;Somers(1992)Bio/Technology10:1589-1594)。除了这些“直接”转化技术以外,转化还可以借助根癌农杆菌或发根农杆菌通过细菌性感染实行。这些菌株含有在农杆菌感染后被转移至植物内的质粒(Ti或Ri质粒)。质粒中称作T-DNA(转移DNA)的部分整合至植物细胞的基因组(见以上对载体的描述)。为将DNA转移至植物细胞,将植物外植体与转基因根癌农杆菌或发根农杆菌共培养。从感染的植物材料开始,(例如叶、根或茎切片,以及植物细胞的原生质体或混悬液),完整植物可以使用可含有例如用于选择已转化细胞的抗生素或杀生物剂的合适培养基产生。随后对所得的植物筛选所导入DNA的存在,在本例中即本发明的表达构建体。一旦DNA已整合至宿主基因组,通常稳定的目的基因型和所目的插入物也在后续世代中存在。所得的植物可以用通常方式进行培育并杂交。应当生长两个或更多个世代以确保基因组整合是稳定的和遗传性的。描述了以上提及的方法(例如在Kung&Wu编辑的TransgenicPlants,第1卷,Engineering and Utilization,Academic Press128-143,Jenes(1983)Techniques for Gene Transfer和在Potrykus(1991)Ann Rev PlantPhysiol Plant Mol Biol42:205-225)。本领域技术人员知道通过农杆菌转化的效率可以通过使用本领域已知的众多方法提高,例如已经证实向农杆菌培养物内添加创伤应答天然分子如乙酰丁香酮(AS)增强通过根癌农杆菌转化的效率(Shahla(1987)Plant Mol.Biol.8:291-298)。此外,转化效率可以通过致伤待转化的靶组织得到提高。植物组织的致伤可以例如通过穿孔、浸渍、用微抛射体轰击等实现(见例如Bidney(1992)Plant Mol.Biol.18:301-313)。已经报道用于转化植物(特别是单子叶植物)的众多其它方法,包括例如“花粉管法”(WO93/18168;Luo(1988)Plant Mol.Biol.Rep.6:165-174)、DNA大量注射至花蘖(Du(1989)Genet Manip Plants5:8-12)、农杆菌注射至发育的颖果(WO00/63398),以及种子在DNA溶液内的组织温育(Tpfer(1989)Plant Cell1:133-139)。在WO94/00583中公开了在胚胎发生开始时向受精植物胚珠直接注射外源性DNA。WO97/48814公开了用于产生稳定转化的能育小麦的方法和基于新鲜分离的或预培养的不成熟胚、胚性愈伤组织和悬浮细胞的经农杆菌转化小麦的系统。
通常,已整合的表达构建体含有赋予转化植物对杀生物剂(例如除草剂)或抗生素如卡那霉素、G418、博来霉素、潮霉素或草铵膦等抗性的选择标记。选择标记允许从未转化的细胞中选择已转化的细胞(McCormick1986)Plant Cell Reports5:81-84)。所得的植物可以用通常方式进行培育和杂交。应当生长两个或更多个世代以确保基因组整合是稳定的和遗传性的。描述了以上提及的方法(例如在Jenes1983;和在Potrykus1991)。一旦产生已转化的植物细胞,完整植物可以通过技术人员已知的方法得到。因此,本发明提供转基因植物。本发明的转基因植物不限于在其中每一细胞和所有细胞均在本文中所提供的启动子序列控制下表达目的核酸序列的植物。本发明的范围包括含有至少一个表达目的核酸序列的细胞的任意植物(例如嵌合植物)。优选,尽管不是必需,该转基因植物在一个或多个细胞内、优选在一种或多种组织内包含目的核酸序列。一旦得到含有表达载体的转基因植物组织,转基因植物可以使用本领域已知的方法从该转基因植物组织中再生。来自如下植物属的物种可以从转化的原生质体中再生:草莓属(Fragaria)、百脉根属(Lotus)、苜蓿属(Medicago)、驴食草属(Onobrychis)、车轴草属(Trifolium)、胡卢巴属(Trigonella)、豇豆属(Vigna)、柑橘属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡萝卜属、拟南芥属、芸苔属、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、辣椒属、天仙子属(Hyoscyamus)、番茄属、烟草属(Nicotiana)、茄属、碧冬茄属、毛地黄属(Digitalis)、Majorana、Ciohorium、向日葵属(Helianthus)、莴苣属、雀麦属(Bromus)、天门冬属(Asparagus)、金鱼草属(Antirrhinum)、Hererocallis、龙面花属(Nemesia)、天竺葵属(Pelargonium)、黍属(Panicum)、狼尾草属(Pennisetum)、毛莨属(Ranunculus)、千里光属(Senecio)、智利喇叭花属(Salpiglossis)、黄瓜属(Cucumis)、Browaalia、大豆属、豌豆属(Pisum)、黑麦草属(Lolium)、玉蜀黍属、小麦属、高粱属和曼陀罗属(Datura)。为了从转基因的原生质体中再生转基因植物,首先提供转化的原生质体的混悬液或含有已转化外植体的培养皿。形成愈伤组织,并且苗可以从愈伤组织中诱导并随后生根。备选地,可以在愈伤组织中诱导体细胞胚形成。这些体细胞胚萌发成形成植物的天然胚。培养基通常含有多种氨基酸和植物激素如植物生长素和细胞分裂素。有利地向培养基添加谷氨酸和脯氨酸,特别对于如此植物种,如玉米和苜蓿。有效再生取决于培养基、基因型和培育史。这三个变量可以是经验地加以控制来产生可重复的再生。植物还可以从培养的细胞或组织内再生。已经证实能够从旨在得到完整转基因植物而转化的单个细胞中再生的双子叶植物包括例如苹果(Malus pumila)、黑莓(blackberry)(悬钩子属(Rubus))、黑莓/树莓(raspberry)杂交体(悬钩子属(Rubus))、红树莓(redraspberry)(悬钩子属(Rubus))、野胡萝卜、花椰菜(甘蓝(Brassica oleracea))、芹菜(Apium graveolens)、黄瓜(Cucumis sativus)、茄(Solanum melongena)、莴苣(Lactuca sativa)、马铃薯(Solanum tuberosum)、欧洲油菜(Brassicanapus)、野大豆(Glycine canescens)、大豆(Glycine max)、草莓(Fragariaananassa)、番茄(Lycopersicon esculentum)、核桃(walnut)(Juglans regia)、甜瓜(Cucumis melo)、葡萄(Vitis vinifera)和芒果(mango)(Mangiferaindica)。从旨在得到完整转基因植物而转化的单个细胞中再生的双子叶植物包括例如稻(Oryza sativa)、黑麦(Secale cereale)和玉米(Zea mays)。
此外,完整植物从(实际上未转化的)细胞中的再生还在如下植物中观察到:杏(apricot)(Prunus armeniaca)、天门冬(asparagus)(Asparagusofficinalis)、香蕉(banana)(hybrid Musa)、菜豆(Phaseolus vulgaris)、樱桃(cherry)(hybrid Prunus)、葡萄(Vitis vinifera)、芒果(Mangifera indica)、甜瓜(Cucumis melo)、红秋葵(ochra)(Abelmoschus esculentus)、洋葱(onion)(hybrid Allium)、橘(orange)(Citrus sinensis)、papaya(Carricapapaya)、桃(peach)(Prunuspersica)、欧洲李(plum)(Prunus domestica)、梨(pear)(Pyrus communis)、凤梨(pineapple)(Ananas comosus)、西瓜(Citrullus vulgaris)和小麦(Triticum aestivum)。将再生的植物转移至标准的土壤条件下并以常规方式栽培。在表达载体稳定整合至已再生的转基因植物后,表达载体可以通过营养繁殖或有性杂交转移至其它植物。例如在营养繁殖的作物中,成熟的转基因植物通过采取插条或组织培养技术进行繁殖,以产生多个完全相同的植物。在种子繁殖的作物中,成熟的转基因植物自交以产生能够通过孟德尔遗传将转基因传递至其子代的纯合杂交植物。杂交植物产生含有目的核酸序列的种子。这些种子可以生长以产生将产生所选择表型的植物。杂交植物还可以用于通过与产生杂交体的另一种杂交植物杂交而发展新的杂交体。
可以通过PCR分析、抗生素或除草剂抗性、酶分析和/或DNA印迹证实细胞、组织和植物的转基因性质来验证转化。可以得到并分析再生植物的子代来验证转基因是否是可遗传的。转基因的遗传力是转基因在植物中稳定转化的进一步证实。得到的植物可以按照常规方式育种。应当生长两个或更多个世代以确保基因组整合是稳定的和遗传性的。相应方法已有描述(Jenes1993;Potrykus1991)。
还符合本发明的是自如上所述的转基因生物和转基因的繁殖材料如种子或果实衍生的细胞、细胞培养物、组织、部分、器官(例如以转基因植物生物为例,为根、叶等)。
优选地,用于增强核酸序列在植物或植物细胞中表达的方法还包含,
将具有增强表达特性的内舍子经过包含如下步骤的同源重组插入与表达盒连接:
a)在体内或在体外提供包含在两侧具有如此序列的内含子的DNA构建体,其中所述的序列允许在所述表达盒的启动子和核酸之间与预先存在的表达盒发生同源重组,
b)转化含有所述表达盒的受体植物细胞,
再生其中所述内含子已经通过同源重组插入所述启动子核酸构
建体的基因组DNA内的转基因植物。
用于将DNA分子整合至基因组的两种不同方式均是可能的:使用配偶体之间具有序列同一性的任何区域(同源重组(HR),“基因打靶”)或无需满足序列特异性要求(无效重组,也称作非同源末端连接(NHEJ))。基因打靶(GT)是通过外来DNA序列的同源重组介导性整合在基因组内产生特异性突变。相对于天然重组过程,重组配偶体中的一个配偶体是人造的并在基因打靶中通过转化得以导入。转化的DNA的整合按照已有重组途径进行。同源重组是具有相似核苷酸序列的任何成对DNA序列之间的反应,其中两种序列相互作用(重组)以形成新的重组DNA类型。同源重组的频率随共有的核苷酸DNA序列长度增加而增加,并且线性化的质粒分子比环化质粒分子的同源重组频率高。同源重组可以发生在不完全相同的两个DNA序列之间,但是重组频率随两种序列之间的差异增加而下降。导入的DNA序列可以通过目的DNA分子经同源重组与同宿主细胞的内源性序列共有同源性的序列连接而靶向。一旦DNA进入细胞,两种同源序列可以相互作用以将导入的DNA插入同源基因组DNA序列所在的位点内。因此,包含在所导入DNA上的同源序列的选择将决定在其中所导入DNA经同源重组得以整合的位点。例如,如果目的DNA序列连接于与宿主植物细胞单拷贝基因共有同源性的DNA序列,则目的DNA序列仅在所述的单个特异性位点处经同源重组插入。然而,如果目的DNA序列连接于与宿主真核细胞多拷贝基因共有同源性的DNA序列,则目的DNA序列将在该基因每一个拷贝所在的每一特定位点内经同源重组插入。例如,如果希望将外来基因插入其中所选择基因所在的基因组位点,则导入的DNA应当含有与所选择的基因同源的序列。双重组事件可以通过用在目的DNA序列(欲插入基因组的序列)的每一末端侧翼分布与所选择基因同源的DNA序列而实现。涉及每一同源侧翼区域的同源重组事件将导致外来DNA插入。因此仅处在共有基因组同源性的两个区域之间的那些序列整合至基因组内。
在经过同源重组的基因打靶例子中,待导入染色体内、优选地在基因(先存表达盒)的5′UTR内的本发明内含子(例如)位于DNA构建体上,并且在5′和3′侧翼分布着如此核酸序列,其与内含子应当整合至其中的靶DNA具有足够的同源性(如此的构建体称作“基因打靶底物”)。所述的侧翼区域必须足够长以发生重组。侧翼区域的长度范围通常是数百碱基至数千碱基(Thomas KR和Capecchi MR(1987)Cell51:503;Strepp等(1998)Proc.Natl.Acad.Sci.USA95(8):4368-4373)。在本发明优选的实施方案中,基因打靶底物包含允许选择重组事件的与内含子共整合至目的基因组区域内的选择标记。优选地,基因打靶底物通过长度和同源性足够导致插入内舍子序列(和根据需要,额外的核酸序列例如选择标记)的成对同源DNA序列之间的双重交叉事件而整合。利用同源重组,本发明的内含子可以通过连接该内含子至如此DNA序列而安置在待转基因表达的靶基因(例如内源性植物基因)5′非编码区内,其中所述的DNA序列与例如靶基因读码框上游和/或下游的内源性序列同源。在细胞用所述DNA构建体转化后,同源序列可以相互作用并且因此将本发明的内含子安置在所需要的位点内,以致于本发明的内含子序列与靶基因有效地连接并构成本发明的表达构建体。对于同源重组或基因打靶,宿主生物(例如植物)使用本文中所述的方法用重组构建体进行转化,并且已成功发生重组的克隆例如使用抗生素抗性或除草剂抗性进行选择。如果需要将目的核酸序列瞄准植物基因组上的特定基因座,目的核酸序列对植物细胞基因组的位点的定向整合可以使用农杆菌衍生性序列通过例如同源重组实现。通常,植物细胞与含有靶向性载体的农杆菌菌株温育,在所述靶向性载体内与靶基因座内部的DNA序列同源的序列在侧翼分布着如前所述(US5,501,967,该文献的全部内容在本文中引用作为参考)的农杆菌转移-DNA(T-DNA)序列。
本领域技术人员知道同源重组可以使用舍有与所靶向植物基因中任何部分(无论其属于该基因的调节性元件还是该基因的编码区)同源的序列的靶向性载体实现。同源重组可以在植物基因的任何区域内实现,只要在待打靶的位点两侧分布的该区域核酸序列是已知的。基因打靶在高等真核生物中、尤其在植物中是相对稀有的事件。随机整合至宿主基因组内占优势。消除随机整合的序列并因此增加具有正确同源重组的细胞克隆数的一种可能是利用如US6,110,736中所述的序列特异性重组系统,通过该系统可以再次剔除非特异性整合的序列,这使选择已通过同源重组成功整合的事件简化。
基因打靶的有效变体已经报道用于黑腹果蝇(Drosophilamelanogaster)(Rong和Golic2000Science.2000Jun16;288(5473):2013-8)。在此方法中,用于打靶的构建体整合至侧翼分布着位点特异性重组酶的两个识别位点的宿主基因组并包含稀有切割的限制性核酸内切酶位点。通过诱导位点特异性重组酶的表达,从基因组中切除一个DNA环。该环随后在限制性酶(本例中是I-SceI)表达后被线性化,产生具有与靶序列同源的两个末端的“激活的”DNA分子。在果蝇的雌性生殖系中,基因打靶以约500个细胞中一个细胞的比率发生。可以通过正向选择技术和负向选择技术的某些组合促进从无效重组事件中选择基因打靶事件(WO99/20780)。
反向选择是用于哺乳动物和植物系统中富集基因打靶事件的高效方法。在植物中,细菌codA基因作为细胞自主的负向选择标记可以用于在组织培养中的选择(Schlaman和Hooykaas Plant J11:1377-1385,1997;Thykjaer等,Plant Mol Biol.1997Nov;35(4):523-30.)。负向选择允许超过千倍地抑制植物中的随机整合(Risseeuw等,Plant J.1997Apr;11(4):717-28.;Gallego等,Plant Mol Biol.1999Jan;39(1):83-93;Terada等,Nat Biotechnol.2002Oct;20(10):1030-4.Epub2002Sep09)。在植物中增加基因打靶的探索性方法包括表达蛋白质如RecA(WO97/08331)或衍生自其它物种的RecA同系物例如Rad52(WO01/68882)或RecA/VirE2融合蛋白(WO01/38504)。已经显示,聚ADP核糖聚合酶抑制剂的使用在植物中增加HR(Puchta H等(1995)Plant J7:203-210)。还发现序列非特异性DNA双链断裂的启动提高植物中HR的效率(PuchtaH等(1995)Plant J7(2),203-210;Lebel EG等(1993)Proc.Natl.Acad.Sci.USA90(2):422-426)。然而DNA链断裂的序列非特异性诱导是不利的,原因在于潜在的诱变效应。DNA链断裂的序列特异性诱导也可以提高HR的效率,但限于人工方案(Siebert R和Puchta H(2002)Plant Cell14(5):1121-1131)。
由本发明人特别构思的是可以采用根据本发明所制备转化构建体的位点特异性整合或切除技术。位点特异性整合或切除的有利之处是它可以用于克服伴随常规转化技术而来的难题,在常规转化技术中,转化构建体通常以多重拷贝随机整合至宿主基因组内。如果外来DNA插入必需基因,这种导入的DNA向宿主细胞基因组的随机插入可能是致死的。此外,转基因的表达可以受周围基因组DNA的位置效应影响。另外,由于伴随在植物中多重转基因拷贝加工而来的困难(包括基因沉默、重组和不可预测的遗传),通常需要控制插入DNA的拷贝数,经常需要插入单拷贝的DNA序列。转基因或转基因的部分的位点特异性整合或切除可以通过同源重组方式在植物中实现(见例如,U.S.5,527,695)。本发明方法中所利用的DNA-构建体可以包含额外的核酸序列。所述序列可以例如相对于同源序列位于不同的位置内。优选地,额外的核酸序列位于两种同源序列之间并且可以通过同源重组导入染色体DNA,因而类似于所述的染色体DNA插入突变。然而,额外的序列还可以位于同源序列之外(例如在DNA构建体的5′端或3′端)。在额外的序列与反向选择标记类似的例子中,这可以允许区分经过同源重组介导的无效插入事件和有效插入事件。相应的负向标记描述如下并且合适的方法在本领域众所周知(WO99/20780)。
在本发明优选的实施方案中,本发明方法的效率可以通过与适用于提高同源重组的其它方法组合进一步得到提高。所述的方法可以包括例如表达增强HR的蛋白质(象例如RecA,WO97/08331;ReissB等(1996)Proc.Natl.Acad.Sci.USA93(7):3094-3098;Reiss B等(2000)Proc.Natl.Acad.Sci.USA97(7):3358-3363)或用PARP抑制剂处理(Puchta H等(1995)PlantJ.7:203-210)。适用于本发明中的多种PARP抑制剂是本领域技术人员已知的,并且可以例如优选地包括3-氨基苯甲酰胺、8-羟基-2-甲基喹唑啉-4-酮(NU1025)、1,11b-二氢-[2H]苯并吡喃并[4,3,2-de]异喹啉-3-酮(GPI6150)、5-氨基异喹啉酮、3,4-二氢-5-[4-(1-哌啶基)丁氧]-1(2H)-异喹啉酮或在WO00/26192、WO00/29384、WO00/32579、WO00/64878、WO00/68206、WO00/67734、WO01/23386或WO01/23390中所述的化合物。此外,本发明方法可以与促进同源重组和/或选择重组体的其它方法(例如正向/负向选择、切除无效重组事件或诱导序列特异性或非特异性DNA双链断裂)组合。在优选的实施方案中,还经同源重组插入将具有增强表达特性的内含子与表达盒连接而增强核酸序列在植物或植物细胞中表达的方法应用于单子叶植物或植物细胞,更优选地应用于选自大麦属、燕麦属、黑麦属、小麦属、高粱属、玉蜀黍属、甘蔗属和稻属的植物、最优选地是玉米植物。
在其中(经本发明的方法)插入本发明内含子之一并且与其功能性连接的核酸序列编码了如上所述的选择标记蛋白质、筛选标记蛋白质、合成活性蛋白质、分解活性蛋白质、抗生物胁迫蛋白质或抗非生物胁迫蛋白质、雄性不育蛋白质或影响植物农学特征的蛋白质和/或如上所述的有义RNA、反义RNA或双链RNA。在本发明的优选实施方案中,所述的核酸序列编码蛋白质。在本发明的又一个实施方案中,本发明的方法应用于含有旨在表达RNA转录物的DNA的重组DNA表达构建体,其中所述的RNA转录物起到影响植物表型的作用,而不被翻译成蛋白质。此类不表达蛋白质的序列包括如上所述的反义RNA分子、有义RNA分子、具有核酶活性的RNA分子、形成双链的RNA分子(RNAi)。
此外,本发明的又一主题物涉及用本发明方法所产生的如上所述的转基因生物的用途或从其衍生的细胞培养物、转基因繁殖材料的部分的用途,用于产生食品、动物饲料、种子、药物或精细化学品。还优选转基因生物用于产生药物或精细化学品的用途,其中宿主生物用如上所述的表达构建体之一转化,并且这种表达构建体含有编码所需要的精细化学品或催化所需要精细化学品的生物合成的一种或多种结构基因,培养转化的宿主生物并从培养基中分离所需要的精细化学品。这个过程可以广泛用于精细化学品如酶、维生素、氨基酸、糖、脂肪酸、天然香料和合成香料、芳香物质和色料。特别优选地产生生育酚和生育三烯酚类、类胡萝卜素、油、多不饱和脂肪酸等。通过技术人员已知的方法开展培养转化的宿主生物并从宿主生物或培养基中分离。描述了药物如抗体、疫苗、药物活性蛋白的产生(Hood(1999)Curr Opin Biotechnol.10(4):382-6;Ma(1999)Curr TopMicrobiol.Immunol.236:275-92;Russel(1999)Current Topics inMicrobiology and Immunology240:119-138;Cramer等(1999)CurrentTopics in Microbiology and Immunology240:95-118;Gavilondo(2000)Biotechniques29(1):128-138;Holliger(1999)Cancer&Metastasis Reviews18(4):411-419)。
此外,本发明涉及包含至少一个在植物或植物细胞中有功能的启动子序列,至少一个具有在植物或植物细胞中增强表达特性的内含子的重组DNA表达构建体,其中所述内含子表征为:
VIII)内含子长度短于1,000碱基对,并且
IX)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
X)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
XI)在3′剪接位点的上游存在类似于共有序列5′-CURAY-3′(SEQID NO:75)的分支点,和
XII)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
XIII)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
XIV)整个内含子范围内至少55%的腺嘌呤加胸腺嘧啶的含量和至少30%的胸腺嘧啶含量,并且
至少一个核酸序列,
其中所述启动子序列和至少一个所述内含子序列功能性地连接于所述核酸序列,并且其中所述内含子对所述核酸序列和/或对所述启动子序列是异源的。
序列
1.SEQ ID NO:1BPSI.1:分离自稻金属硫蛋白样基因(登录号AP002540)的第一内含子序列。
2.SEQ ID NO:2BPSI.2:分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第一内含子序列。
3.SEQ ID NO:3BPSI.3:分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第二内含子序列。
4.SEQ ID NO:4BPSI.4:分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第三内含子序列。
5.SEQ ID NO:5BPSI.5:分离自编码蔗糖转运蛋白的稻基因(登录号AF280050)的第八内含子序列。
6.SEQ ID NO:6BPSI.6:分离自编码未知蛋白质的稻基因(登录号BAA94221)的第四内含子序列,其中所述的未知蛋白质与来自克隆T22O13、F12K2的编码推定的脂酶(AC006233)的拟南芥菜染色体II序列具有同源性。
7.SEQ ID NO:7BPSI.7:分离自编码推定的肉桂醇脱氢酶的稻基因(登录号BAB90130)的第四内含子序列。
8.SEQ ID NO:8BPSI.8:分离自编码推定的核糖核蛋白的稻基因(登录号AC084766)的第二内含子序列。
9.SEQ ID NO:9BPSI.9:分离自稻克隆GI12061241的第五内含子序列。
10.SEQ ID NO:10BPSI.10:分离自编码推定的蛋白激酶的稻基因(登录号AP003300)的第三内含子序列。
11.SEQ ID NO:11BPSI.11:分离自编码MADS3盒蛋白的稻基因(登录号L37528)的第一内含子序列。
12.SEQ ID NO:12BPSI.12:分离自编码推定的腺苷甲硫氨酸脱羧酶稻基因(登录号CB625805)的第一内含子序列。
13.SEQ ID NO:13BPSI.13:分离自编码天冬氨酸蛋白酶的稻基因(登录号CF297669)的第一内含子序列。
14.SEQ ID NO:14BPSI.14:分离自编码Lec14b蛋白的稻基因(登录号CB674940)的第一内含子序列。
15.SEQ ID NO:15BPSI.15:分离自编码推定的SalT蛋白质前体的稻基因(登录号BAD37295.1)的第一内含子序列。
16.SEQ ID NO:16BPSI.16:分离自编码推定的Reticulon的稻基因(登录号BX928664)的第一内含子序列。
17.SEQ ID NO:17BPSI.17:分离自编码葡糖酸氧化酶的稻基因(登录号AA752970)的第一内含子序列。
18.SEQ ID NO:18BPSI.18:分离自编码推定非编码的稻克隆(登录号AK06442)的第一内含子序列。
19.SEQ ID NO:19BPSI.19:分离自编码推定非编码的稻克隆(登录号AK062197)的第一内含子序列。
20.SEQ ID NO:20BPSI.20:分离自编码假定的蛋白质的稻基因(登录号CF279761)的第一内含子序列。
21.SEQ ID NO:21BPSI.21:分离自编码推定的膜转运蛋白的稻基因(登录号CF326058)的第一内含子序列。
22.SEQ ID NO:22BPSI.22:分离自编码推定的ACT结构域重复蛋白的稻基因(登录号C26044)的第一内含子序列。
23.SEQ ID NO:23蔗糖-UDP葡糖基转移酶2正向(for)引物
24.SEQ ID NO:24蔗糖-UDP葡糖基转移酶2反向(rev)引物
25.SEQ ID NO:25推定的Bowman-Kirk胰蛋白酶抑制剂正向引物
26.SEQ ID NO:26推定的Bowman-Kirk胰蛋白酶抑制剂反向引物
27.SEQ ID NO:27登录号CF279761的假定蛋白质正向引物
28.SEQ ID NO:28登录号CF279761的假定蛋白质反向引物
29.SEQ ID NO:29苯丙氨酸脱氨酶正向引物
30.SEQ ID NO:30苯丙氨酸脱氨酶反向引物
31.SEQ ID NO:31金属硫蛋白样蛋白1正向引物
32.SEQ ID NO:32金属硫蛋白样蛋白1反向引物
33.SEQ ID NO:33过氧化氢酶正向引物
34.SEQ ID NO:34过氧化氢酶反向引物
35.SEQ ID NO:35推定的胁迫相关蛋白正向引物
36.SEQ ID NO:36推定的胁迫相关蛋白反向引物
37.SEQ ID NO:37推定的翻译起始因子SUI1正向引物
38.SEQ ID NO:38推定的翻译起始因子SUI1反向引物
39.SEQ ID NO:39多聚遍在蛋白正向引物
40.SEQ ID NO:40多聚遍在蛋白反向引物
41.SEQ ID NO:41谷胱甘肽S-转移酶II正向引物
42.SEQ ID NO:42谷胱甘肽S-转移酶II反向引物
43.SEQ ID NO:43金属硫蛋白样蛋白2正向引物
44.SEQ ID NO:44金属硫蛋白样蛋白2反向引物
45.SEQ ID NO:45翻译起始因子eIF1正向引物
46.SEQ ID NO:46翻译起始因子eIF1反向引物
47.SEQ ID NO:47OSJNBa0024F24.10(未知蛋白质)正向引物
48.SEQ ID NO:48OSJNBa0024F24.10(未知蛋白质)反向引物
49.SEQ ID NO:49与组蛋白3.2-614相似的蛋白质正向引物
50.SEQ ID NO:50与组蛋白3.2-614相似的蛋白质反向引物
51.SEQ ID NO:51OSJNBa0042L16.3正向引物
52.SEQ ID NO:52OSJNBa0042L16.3反向引物
53.SEQ ID NO:53BPSI.1-5′引物
54.SEQ ID NO:54BPSI.1-3′引物
55.SEQ ID NO:55BPSI.2-5′引物
56.SEQ ID NO:56BPSI.2-3′引物
57.SEQ ID NO:57BPSI.3-5′引物
58.SEQ ID NO:58BPSI.3-3′引物
59.SEQ ID NO:59BPSI.4-5′引物
60.SEQ ID NO:60BPSI.4-3′引物
61.SEQ ID NO:61BPSI.5-5′引物
62.SEQ ID NO:62BPSI.5-3′引物
63.SEQ ID NO:63BPSI.6-5′引物
64.SEQ ID NO:64BPSI.6-3′引物
65.SEQ ID NO:65BPSI.7-5′引物
66.SEQ ID NO:66BPSI.7-3′引物
67.SEQ ID NO:67BPSI.8-5′引物
68.SEQ ID NO:68BPSI.8-3′引物
69.SEQ ID NO:69BPSI.9-5′引物
70.SEQ ID NO:70BPSI.9-3′引物
71.SEQ ID NO:71BPSI.10-5′引物
72.SEQ ID NO:72BPSI.10-3′引物
73.SEQ ID NO:73BPSI.11-5′引物
74.SEQ ID NO:74BPSI.11-3′引物
75.SEQ ID NO:755′-CURAY-3′植物分支点共有序列1
76.SEQ ID NO:765′-YURAY-3′植物分支点共有序列2
77.SEQ ID NO:775′-(AG)(AG)/GT(AGT)(AGT)(GTC)-3′,优选的5′剪接位点
78.SEQ ID NO:785′剪接位点二核苷酸5′-GT-3′
79.SEQ ID NO:793′剪接位点三核苷酸5′-CAG-3′
80.SEQ ID NO:805′剪接位点植物共有序列5′-AG::GTAAGT-3′
81.SEQ ID NO:813′剪接位点植物共有序列5′-CAG::GT-3′
82.SEQ ID NO:82分离自稻金属硫蛋白样基因(登录号AP002540)的第一内含子序列,包括与内含子序列BPSI.1(SEQ ID NO:1)的5′和3′剪接位点毗邻的5′和3′序列
83.SEQ ID NO:83分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第一内含子序列,包括与内含子序列BPSI.2(SEQ ID NO:2)的5′和3′剪接位点毗邻的5′和3′序列
84.SEQ ID NO:84分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第二内含子序列,包括与内含子序列BPSI3.(SEQ ID NO:3)的5′和3′剪接位点毗邻的5′和3′序列
85.SEQ ID NO:85分离自稻蔗糖UDP葡糖基转移酶-2基因(登录号AC084380)的第三内含子序列,包括与内含子序列BPSI.4(SEQ ID NO:4)的5′和3′剪接位点毗邻的5′和3′序列
86.SEQ ID NO:86分离自编码蔗糖转运蛋白的稻基因(GenBank登录号AF280050)的第八内含子序列,包括与内含子序列BPSI.5(SEQ IDNO:5)的5′和3′剪接位点毗邻的5′和3′序列
87.SEQ ID NO:87分离自编码蔗糖转运蛋白的稻基因(登录号AF280050)的第八内含子序列,包括修饰的5′和3′剪接位点和与内含子序列BPSI.5(SEQ ID NO:5)的5′和3′剪接位点毗邻的5′和3′序列。
88.SEQ ID NO:88分离自编码未知蛋白质的稻基因的第四内含子序列,其中所述的未知蛋白质与来自克隆T22O13、F12K2的编码推定的脂酶(AC006233)的拟南芥菜染色体II序列具有同源性,包括与内含子序列BPSI.6(SEQ ID NO:6)的5′和3′剪接位点毗邻的5′和3′序列
89.SEQ ID NO:89分离自编码未知蛋白质的稻基因的第四内含子序列,其中所述的未知蛋白质与来自克隆T22O13、F12K2的编码推定的脂酶(AC006233)的拟南芥菜染色体II序列具有同源性,包括修饰的5′和3′剪接位点和与内含子序列BPSI.6(SEQ ID NO:6)的5′和3′剪接位点毗邻的5′和3′序列
90.SEQ ID NO:90分离自编码推定的肉桂醇脱氢酶稻基因(登录号BAB90130)的第四内含子序列,包括与内含子序列BPSI.7(SEQ ID NO:7)的5′和3′剪接位点毗邻的5′和3′序列
91.SEQ ID NO:91分离自编码推定的肉桂醇脱氢酶稻基因(登录号BAB90130)的第四内含子序列,包括修饰的5′和3′剪接位点和与内含子序列BPSI.7(SEQ ID NO:7)的5′和3′剪接位点毗邻的5′和3′序列
92.SEQ ID NO:92分离自编码推定的核糖核蛋白的稻基因(登录号AC084766)的第二内含子序列,包括与内含子序列BPSI.8(SEQ ID NO:8)的5′和3′剪接位点毗邻的5′和3′序列
93.SEQ ID NO:93分离自编码推定的核糖核蛋白的稻基因(登录号AC084766)的第二内含子序列,包括修饰的5′和3′剪接位点和与内含子序列BPSI.8(SEQ ID NO:8)的5′和3′剪接位点毗邻的5′和3′序列
94.SEQ ID NO:94分离自编码推定的蛋白质的稻基因(登录号AP003300)的第三内含子序列,包括与内含子序列BPSI.(SEQ ID NO:)的5′和3′剪接位点毗邻的5′和3′序列BPSI.10(SEQ ID NO:10)
95.SEQ ID NO:95分离自编码推定的蛋白质的稻基因(登录号AP003300)的第三内含子序列,包括修饰的5′和3′剪接位点和与内含子序列BPSI.10(SEQ ID NO:10)的5′和3′剪接位点毗邻的5′和3′序列
96.SEQ ID NO:96分离自编码MADS3盒蛋白的稻基因(登录号L37528)的第一内含子序列,包括与内含子序列BPSI.11(SEQ ID NO:11)的5′和3′剪接位点毗邻的5′和3′序列
97.SEQ ID NO:97分离自编码MADS3盒蛋白的稻基因(登录号L37528)的第一内舍子序列,包括修饰的5′和3′剪接位点和与内含子序列BPSI.11(SEQ ID NO:11)的5′和3′剪接位点毗邻的5′和3′序列
98.SEQ ID NO:98分离自编码推定的腺苷甲硫氨酸脱羧酶的稻基因(登录号CB625805)的第一内含子序列,包括与内含子序列BPSI.12(SEQID NO:12)的5′和3′剪接位点毗邻的5′和3′序列
99.SEQ ID NO:99分离自编码天冬氨酸蛋白酶的稻基因(登录号CF297669)的第一内含子序列,包括与内含子序列BPSI.13(SEQ ID NO:13)的5′和3′剪接位点毗邻的5′和3′序列
100.SEQ ID NO:100分离自编码Lec14b蛋白的稻基因(登录号CB674940)的第一内含子序列,包括与内含子序列BPSI.14(SEQ ID NO:14)的5′和3′剪接位点毗邻的5′和3′序列
101.SEQ ID NO:101分离自编码推定的甘露糖结合性稻凝集素的稻基因(登录号CA128696)的第一内含子序列,包括与内舍子序列BPSI.15(SEQ ID NO:15)的5′和3′剪接位点毗邻的5′和3′序列
102.SEQ ID NO:102分离自编码推定的Reticulon的稻基因(登录号BX928664)的第一内含子序列,包括与内含子序列BPSI.16(SEQ ID NO:16)的5′和3′剪接位点毗邻的5′和3′序列
103.SEQ ID NO:103分离自编码葡糖酸氧化酶的稻基因(登录号AA752970)的第一内含子序列,包括与内含子序列BPSI.17(SEQ IDNO:17)的5′和3′剪接位点毗邻的5′和3′序列
104.SEQ ID NO:104分离自稻克隆GI34763855的第一内含子序列,包括与内含子序列BPSI.18(SEQ ID NO:18)的5′和3′剪接位点毗邻的5′和3′序列
105.SEQ ID NO:105分离自稻克隆GI32533738的第一内含子序列,包括与内含子序列BPSI.19(SEQ ID NO:19)的5′和3′剪接位点毗邻的5′和3′序列
106.SEQ ID NO:106分离自编码假定的蛋白质的稻基因(登录号CF279761)的第一内含子序列,包括与内含子序列BPSI.20(SEQ ID NO:20)的5′和3′剪接位点毗邻的5′和3′序列
107.SEQ ID NO:107分离自编码推定的膜转运蛋白的稻基因(登录号CF326058)的第一内含子序列,包括与内含子序列BPSI.21(SEQ IDNO:21)的5′和3′剪接位点毗邻的5′和3′序列
108.SEQ ID NO:108分离自编码推定的ACT结构域重复蛋白的稻基因(登录号C26044)的第一内含子序列,包括与内含子序列BPSI.22(SEQID NO:22)的5′和3′剪接位点毗邻的5′和3′序列
109.SEQ ID NO:109双元载体pBPSMM291
110.SEQ ID NO:110双元载体pBPSMM305
111.SEQ ID NO:111双元载体pBPSMM350
112.SEQ ID NO:112双元载体pBPSLM139
113.SEQ ID NO:113人工序列:来自包含Os CP12启动子(bp1-854)和BPSI.1内含子(bp888-1470)的载体pBPSMM355(OsCP12::BPSI.1)的盒
114.SEQ ID NO:114人工序列:来自包含玉米[HRGP]羟脯氨酸丰富糖蛋白(伸展蛋白)5′/UTR启动子(bp1-1184)和稻BPSI.1内含子(bp1217-1799)的载体pBPSMM355(ZmHRGP::BPSI.1)的盒
115.SEQ ID NO:115人工序列:来自包含p-咖啡酰辅酶A3-O-甲基转移酶ICoA-O-甲基]启动子(bp1-1034)和BPSI.1内含子(1119-1701)的载体pBPSMM358(OsCCoAMT1::BPSI.1)的盒
116.SEQ ID NO:116人工序列:来自包含玉米球蛋白-1[ZmGlb1]启动子(W64A)(bp1-1440)和BPSI.1内含子(1443-1999)的载体EXS1025(Zm球蛋白1::BPSI.1)的盒
117.SEQ ID NO:117人工序列:来自包含推定的稻H+转运ATP合酶5′/UTR启动子(1-1589)和BPSI.1内含子(1616-2198)的载体pBPSMM369(OsV-ATP酶::BPSI.1)的盒
118.SEQ ID NO:118人工序列:来自包含推定的稻C-8,7固醇异构酶启动子(1-796)和BPSI.1内含子(827-1409)的载体pBPSMM366(OsC8,7SI::BPSI.1)的盒
119.SEQ ID NO:119人工序列:来自包含玉米乳酸脱氢酶基因5′/UTR启动子(bp1-1062)和BPSI.1内舍子(bp1095-1677)的载体pBPSMM357(ZmLDH::BPSI.1)的盒
120.SEQ ID NO:120人工序列:来自包含玉米乳酸脱氢酶基因5′/UTR启动子(bp1-1062)和BPSI.5内含子(bp1068-1318)的载体pBPSLM229(ZmLDH::BPSI.5)的盒
121.SEQ ID NO:121人工序列:来自包含稻Lea(晚期胚胎发生丰富蛋白)启动子(bp1-1386)和BPSI.1内含子(bp1387-2001)的载体pBPSMM371(OsLea::BPSI.1)的盒
实施例
化学品
除非另外说明,否则实施例中所用的化学品和试剂从Sigma ChemicalCompany(St.Louis,MO)得到,限制性核酸内切酶来自New EnglandBiolabs(Beverly,MA)或Roche(Indianapolis,IN),寡核苷酸由MWGBiotech Inc.(High Point,NC)合成,并且涉及生物化学分析和分子生物学分析的其它修饰酶或试剂盒来自Clontech(PaloAlto,CA)、PharmaciaBiotech(Piscataway,NJ)、Promega Corporation(Madison,WI)或Stratagene(La Jolla,CA)。用于细胞培养基的材料从Gibco/BRL(Gaithersburg,MD)或DIFCO(Detroit,MI)得到。为本发明目的所实施的克隆步骤,例如限制性切割、琼脂糖凝胶电泳、纯化DNA片段、转移核酸至硝酸纤维素膜和尼龙膜、连接DNA片段、转化大肠杆菌细胞、生长细菌、繁殖噬菌体和重组DNA的序列分析如Sambrook(1989)所述实施。重组DNA分子的测序按照Sanger(Sanger1977)的方法使用ABI激光荧光DNA序列仪实施。
实施例1:高表达基因中IME内含子的鉴定和表征
1.1鉴定强烈表达的和组成型表达的候选稻基因
使用以上所述“通过杂交方法测序”开展稻cDNA文库的计算机法克隆分布分析。
稻cDNA克隆分布谱衍生自大约七百六十万个稻cDNA克隆,这些克隆经在不同发育阶段上和接受不同生物性/非生物性处理的不同组织的23个稻cDNA文库生成。用于产生cDNA文库的方法在本领域众所周知(例如Gubler U,和Hoffman BJ.(1983)A simple and very efficient method forgenerating cDNA libraries.Gene25(2-3):263-269.;Jung-Hwa Oh等(2003)An improved method for constructing a full-length enriched cDNA librariyusingsmallamountsof totalRNAasastartingmaterial.EXPERIMENTAL AND MOLECULAR MEDICINE35(6):586-590;Lanfranchi等(1996)Identification of4370expressed sequence tags from a3′-end-specific cDNA library of human skeletal muscle by DNA sequencingand filter hybridization.Genome Res.6(1):35-42)。此外,对cDNA文库构建的广泛描述在1)Cowell和Austin.cDNA Library Protocols,在Methodsin Molecular Biology第69卷,1996年10月,Humana Press,Scientific andmedical publishers,ISBN:0-89603-383-X中;和2)Ying,Shao-Yao.Generation of cDNA Libraries,Methods and Protocols,在Methods in Molecular Biology第221卷,2003年2月,Humana Press,Scientific and medical publishers,ISBN:1-58829-066-2中提供。
使用如上所述的288个植物特异性7聚体寡核苷酸指纹分析的高通量技术(见“通过杂交方法测序”或“HySeq技术”),将全部克隆分簇为总共300,408个稻簇。对于每一个所生成的簇,使用杂交模式相似性的更严格截断值,已经将克隆进一步分簇成不同变体,产生335,073个稻克隆变体。因此,在对于指定簇的每一变体中,克隆更为同源。稻cDNA克隆在经归一化的23个cDNA文库范围内对给定变体的分布提供了稻变体表达谱。如此产生归一化的cDNA文库,即首先通过将原始文库克隆的大小调整至全部23个文库的平均克隆大小,随后基于该文库中已调整的克隆总数调整该文库中每一变体的克隆数。
从稻簇中选择用于测序的稻克隆以生成稻EST数据。在利用335,073个稻变体的克隆分布谱中,基于覆盖23个文库中每一文库的整个文库的克隆分布中最高1%的克隆数选择145个变体,并且使用与衍生自该变体的EST序列相对应的同系物鉴定基因。这些候选基因显示强烈的、组成型的和广泛的表达。将与这些候选基因相对应的稻EST序列同系物对稻基因组DNA序列作图。基于基因组序列的可获得性、注解和表达的高水平,从145个候选者中选择最高的15个候选者(表2),
表2.潜在IME内含子的候选基因
候选基因 注解
1 蔗糖-UDP葡糖基转移酶2
2 推定的Bowman-Kirk胰蛋白酶抑制剂
3 假设的蛋白质
4 苯丙氨酸脱氨酶
5 金属硫蛋白样蛋白1
6 过氧化氢酶
7 推定的胁迫相关性蛋白
8 推定的翻译起始因子SUI1
9 多聚遍在蛋白
10 谷胱甘肽S-转移酶II
11 金属硫蛋白样蛋白2
12 翻译起始因子eIF1
13 OSJNBa0024F24.10(未知蛋白质)
14 与组蛋白3.2-614类似
15 OSJNBa0042L16.3
1.2使用实时RT-PCR验证高度表达的候选基因
代表15个候选者的内源基因的表达水平使用LightCycler在mRNA水平测量。总RNA使用Qiagen RNeasy植物微量试剂盒(目录号74904)从不同发育阶段中的稻植物以及遭受(断水6、12、24和48小时)和未遭受干旱胁迫的组织内提取。RNA的质量和数量使用Molecular ProbesRiboGreen试剂盒(目录号R-11490)在Spectra MAX Gemini上确定。将1μgRNA用于在反应溶液I(1μg RNA、2μ l10×缓冲液、4μl25mM MgCl2、2μl 1mM dNTP、2μl 3.2μg随机引物、1μl 50单位RNA酶抑制剂、0.8μl 20单位AMV-RT聚合酶,用无菌水加满至20μl)中在优化的PCR程序(25℃10分钟,42℃1小时,99℃5分钟,4℃终止反应)下进行RT-PCR(Roche RT-PCR AMV试剂盒,目录号1483188)。
RT-PCR样品用于Roche(LightCycler FastStart DNA MasterSYBRGreen I,目录号3003230)所提供的在优化程序(95℃5分钟,95℃30秒,61℃40秒,72℃40秒并重复步骤2-4进行30个循环,72℃10分钟以及4℃终止反应)下的LightCycler反应(11.6μl无菌水、2.4μl25mM MgCl2、2μl SYBRGreen聚合酶混合物、2μl 10mM特异性引物混合物、2μlRT-PCR反应产物)。
表3.候选基因的引物序列
基因 引物 SEQ ID NO.
蔗糖-UDP葡糖基转移酶2 Fwd:5′-tttgtgcagcccgctttctacgagRev:5′-acggccaacgggacggtgcta 2324
推定的Bowman-Birk胰蛋白酶抑制剂 Fwd:5′-gtcctcgccggcatcgtcacRev:5′-cagaacggcgggttgatcc 2526
假设的蛋白质登录号CF279761 Fwd:5′-agctcgctcgcggtcttRev:5′-acagggcccaagtcgtgtgc 2728
苯丙氨酸脱氨酶 Fwd:5′-aggtctcgccatcgtcaatgRev:5′-cgagacgggcgttgt 2930
金属硫蛋白样蛋白1 Fwd:5′-ggctgcggaggatgcaagatgRev:5′-ggggttgcaggtgcagttgtcg 3132
过氧化氢酶 Fwd:5′-ggcgtcaacacctacaccttRev:5′-tgcactgcagcatcttgtcgtc 3334
推定的胁迫相关性蛋白 Fwd:5′-ggtggatgccacggtgcaagagRev:5′-ggggaggtactgtgctc 3536
推定的翻译起始因子SUI1 Fwd:5′-tgcggaagccaatgctgaRev:5′-ccagccctgaactaggaacgtc 3738
多聚遍在蛋白 Fwd:5′-tcaggggaggcatgcaaaRev:5′-tgcataccaccacggagacgaa 3940
谷胱甘肽S-转移酶II Fwd:5′-cgatttctccaaaggcgagcacRev:5′-tgcgggtatgcgtccaaca 4142
金属硫蛋白样蛋白2 Fwd:5′-acagccaccaccaagaccttcgRev:5′-ctgcagctggtgccacacttgc 4344
翻译起始因子eIF1 Fwd:5′-tcccaactgccttcgatcccttRev:5′-tggacagtggtcaggctcttacgg 4546
OSJNBa0024F24.10(未知蛋白质) Fwd:5′-gagttctaccagttcagcgaccRev:5′-aacccgaaggcgttgac 4748
与组蛋白3.2-614类似 Fwd:5′-agaccgcccgcaagtcRev:5′-cttgggcatgatggtgacgc 4950
OSJNBa0042L16.3 Fwd:5′-ccaagagggagtgctgtatgccaaRev:5′-acgaggaccaccacggtacccat 5152
若相同引物用于每一LightCycler反应,则使每一RT-PCR反应中的RNA(1μg)浓度标准化至足以直接比较样品。输出结果是与PCR循环相对应的数字,其中在所述的PCR循环中样品抵达所生成对数曲线中的拐点。循环数越低,样品中靶RNA的浓度越高。每一样品重复三次并且产生平均数以产生样品“交叉点”值。交叉点越低,该样品中靶基因表达越强(RocheMolecular Biochemicals LightCycler System:参考指南,1999年5月版)。基于LightCycler结果,选择11个候选者(表4)。
表4.代表候选稻基因在mRNA水平上表达的LightCycler结果
候选基因[强烈且组成型表达] 干旱胁迫的稻的根(R)和苗(s)(断水小时数) 充分浇水条件
R6 R12 R24 R48 S6 S12 S24 S48 幼苗 开花阶段期间的圆锥花序
未知 21.1 21.6 N/A 20.3 20.5 21.7 N/A 21.0 23.3 22.7 21.4 23.7
过氧化氢酶 21.2 22.7 26.7 26.0 21.9 21.7 N/A 27.8 22.8 31 20.6 23.5
GSTII 20.6 20.3 23.3 23.7 21.8 23.2 N/A 20.6 24.4 22.6 22.1 24.8
假设的蛋白质 31 31 31 31 31 31 31 31 31 31 27.4 27.0
金属硫蛋白1 20.1 21.5 16.5 16.3 18.3 19.8 N/A 19.2 21.0 22.5 20.6 20.6
金属硫蛋白2 20.2 20.8 23.8 24.8 18.5 18.7 N/A 18.7 19.9 17.8 21.2 19.2
多聚遍在蛋白 19.5 19.1 19.4 20.4 19.1 20.4 N/A 19.8 22.8 20.7 20.0 22.6
胁迫相关蛋白 24.1 23.9 23.7 24.0 23.4 23.4 N/A 23.3 24.6 24.0 23.6 24.9
蔗糖-UDP葡糖 21.3 21.9 26.6 26.7 20.7 20.9 27.2 22.6 20.9 19.1 20.7 26.0
基转移酶2
SUI1 21.3 21.1 23.1 23.6 21.9 22.8 N/A 21.7 24.4 23.8 22.9 30.2
TIF 23.6 23.6 N/A 22.9 22.1 23.3 N/A 23.1 24.6 23.8 22.8 23.7
胰蛋白酶抑制剂 24.0 23.8 24.5 25.0 22.8 23.3 23.5 23.2 26.2 23.8 23.2 23.05
数字代表到达PCR产物指数曲线的起点的PCR循环。数字越低表明内源性基因的表达越高。
1.3鉴定IME内含子
候选内含子使用公众可获得的基因组DNA序列(例如http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html)分离,产生总计20个内含子,大部分是来自靶基因的第一、第二和/或第三内含子。这些内含子通过如下IME标准进行筛选:
.5′剪接位点GT,3′剪接位点CAG
.离5′剪接位点GT下游100个核苷酸范围内至少40%的AT含量
.离3′剪接位点CAG上游100个核苷酸范围内至少50%的AT含量
.整个内含子范围至少55%的AT含量和35%的T含量
.CURAY分支点
.内含子大小小于1kb
所选择的候选内含子可以保留5′剪接位点上游和3′剪接位点下游高达50bp的外显子序列。
在用以上所述IME标准筛选内含子序列后,从20个候选者中选出4个候选者并如下命名。
表5.候选内含子
内含子名称 注解
BPSI.1(SEQ ID NO:1) 金属硫蛋白1第一内含子
BPSI.2(SEQ ID NO:2) 蔗糖-UDP葡糖基转移酶2第一内含子
BPSI.3(SEQ ID NO:3) 蔗糖-UDP葡糖基转移酶2第二内含子
BPSI.4(SEQ ID NO:4) 蔗糖-UDP葡糖基转移酶2第三内含子
1.4分离候选内含子
来自稻的基因组DNA使用Qiagen DNAeasy植物微量试剂盒(Qiagen)提取。含有目的内含子的基因组DNA区域使用常规PCR分离。将大约0.1μg消化的基因组DNA用于常规PCR反应(见下文)。基于稻基因组的序列设计引物。1μl稀释的消化的基因组DNA用作初级PCR反应中的DNA模版。包含在含有缓冲液3的混合物内的六套引物(表6)的反应,按照Expand LongPCR试剂盒(Cat#1681-842,Roche-Boehringer Mannheim)所概述的方案进行。分离的DNA用作使用如下引物的PCR扩增反应中的模版。
表6.引物序列
引物名称 序列
BPSI.1-5′(SEQ ID NO:53) 5′-cccgggcaccctgcggagggtaagatccgatcacc
BPSI.1-3′(SEQ ID NO:54) 5′-cggaccggtacatcttgcatctgcatgtac
BPSI.2-5′(SEQ ID NO:55) 5′-cccgggcacccttcaccaggttcgtgctgatttag
BPSI.2-3′(SEQ ID NO:56) 5′-cggaccgaaccagcctgcgcaaataacag
BPSI.3-5′(SEQ ID NO:57) 5′-cccgggcacctcctgaggagtgcacaggtttg
BPSI.3-3′(SEQ ID NO:58) 5′-cggaccgggagataacaatcccctcctgcatg
BPSI.4-5′(SEQ ID NO:59) 5′-cccgggcacccagcttgtggaagaagggtatg
BPSI.4-3′(SEQ ID NO:60) 5′-cggaccggttgttggtgctgaaatatacatc
扩增在Thermocycler(T3 Thermocycler Biometra)所提供的优化PCR程序(94℃ 15秒和80℃ 1分钟进行1个循环,在94℃ 15秒、在58℃ 1分钟和在72℃ 1分钟进行35个循环)下的PCR反应(5μl 10×Advantage PCR混合物[Eppendorf]、5μl基因组DNA[对应于大约80ng]、2.5mM的每一dATP、dCTP、dGTP和dTTP[Invitrogen:dNTP混合物]、1μl的20μM的5′内含子特异性引物、1μl的20μM的3′内含子特异性引物20pM、1μl TripleMasterDNA聚合酶混合物[Eppendorf],终体积50μl)内实施。
将PCR产物施用于1%(w/v)琼脂糖凝胶和在80V进行分离。将PCR产物从凝胶内切下并借助Qiagen凝胶提取试剂盒(Qiagen,Hilden,德国)进行纯化。PCR产物可以按照制造商说明书直接克隆至载体pCR4-TOPO(Invitrogen),即将所得的PCR产物插入具有与其A突出端结合的T突出端和拓扑异构酶的载体。
1.5载体构建
克隆候选内含子的基础载体是pBPSMM267。该载体包含没有内含子序列的玉米遍在蛋白启动子,其后是待用于添加目的内含子的多克隆位点(MCS),然后是GUS int ORF(包含阻止细菌性表达的马铃薯转化酶[PIV]2内含子),再后是胭脂氨酸合成酶(NOS)终止。含有内含子的表达载体通过将XmaI-RsrII消化的内含子PCR产物连接至XmaI-RsrII线性化的pBPSMM267内生成,因而产生如下载体(表7)。
表7.在5′UTR内含有内含子的GUS嵌合构建体
基于pUC的表达载体 双元载体 表达盒的组成(启动子::内舍子::报告基因::终止子)
pBPSMM291 pBPSMM350 Zm.遍在蛋白启动子::BPSI.1::GUS::NOS3′
pBPSMM293 pBPSMM353 Zm.遍在蛋白启动子::BPSI.2::GUS::NOS3′
pBPSMM294 pBPSMM312 Zm.遍在蛋白启动子::BPSI.3::GUS::NOS3′
pBPSMM295 pBPSMM310 Zm.遍在蛋白启动子::BPSI.4::GUS::NOS3′
1.6用于鉴定IME内舍子的植物分析
这些实验通过轰击植物组织或培养细胞(实施例4.1)或通过农杆菌介导性转化(实施例4.3)开展。用于这些实验的靶组织可以是用于农杆菌方法的植物组织(例如叶或根)、培养的细胞(例如玉米BMS)或植物组织(例如不成熟的胚)。
1.6.1瞬时分析
为鉴定IME内含子,使用微抛射体轰击法测试四种内含子(BPSI.1、BPSI.2、BPSI.3和BPSI.4)。不含任何内含子序列的玉米遍在蛋白启动子(Zm.遍在蛋白)用作基础表达(阴性对照)。将目的内含子克隆至Zm.遍在蛋白启动子的5′UTR区内。玉米遍在蛋白内含子用作阳性对照以便基于GUS表达而测量受目的内含子增强的表达的相对水平。检测到用BPSI.1和BPSI.2内含子的强烈增强(表8)。BPSI.3内含子表现出GUS表达的中等增强水平。未检测到用BPSI.4内含子的表达。
表8.测试内含子介导性增强的瞬时GUS表达
候选内含子 GUS表达*
仅有Zm.遍在蛋白启动子(阴性对照) ++ 50%**
Zm.遍在蛋白启动子+zm.遍在蛋白内含子1(阳性对照) ++++ 100%
Zm.遍在蛋白启动子+bpSI.1(pBPSMM291) ++++ 100%
Zm.遍在蛋白启动子+bpSI.2(pBPSMM293) ++++ 100%
Zm.遍在蛋白启动子+bpSI.3(pBPSMM294) +++ 80%
Zm.遍在蛋白启动子+bpSI.4(pBPSMM295) 0%
*GUS组织化学分析:GUS活性的范围(-无表达至++++高表达),**与受与Zm.遍在蛋白内含子融合的玉米遍在蛋白启动子控制的表达相比的GUS表达。
1.6.2在稳定转化的玉米中分析候选IME内含子
使用农杆菌介导性转化(实施例4.3)将双元载体pBPSMM350、pBPSMM353、pBPSMM312和pBPSMM310(表7)转化至玉米。受BPSI.1、bpSI.2、bpSI.3或BPSI.4内含子控制的GUS表达的水平和模式与受Zm.遍在蛋白内含子控制的GUS表达的水平和模式进行比较。BPSI.1,、BPSI.2和BPSI.3内舍子在多种发育阶段全程以与瞬时分析中观察到的相似水平地增强在根、叶和谷粒内的表达(表9)。无内含子的Zm.遍在蛋白启动子的表达在根和叶内检测不到并且在谷粒内限于胚乳。具有BPSI.4内舍子的Zm.遍在蛋白启动子的表达表现出与无内含子的Zm.遍在蛋白启动子所控制的表达模式相同的表达模式。该结果表明瞬时分析可以用作模型系统并且因此是鉴定在稳定的转化植物中在内含子介导性增强(IME)内有功能的内含子的重要筛选系统之一。然而,用瞬时分析得到的结果应当通过产生稳定的转基因转化植物进行验证。
表9.转基因玉米植物中的GUS表达
发育阶段 器官 Zm遍在蛋白启动子::Zm遍在蛋白内含子 Zm遍在蛋白启动子::无内含子 Zm遍在蛋白启动子::BPSI.1(pPSMM350)
五叶 ++++ ++++
++++ +++
开花 ++++ +++
晚期繁殖 谷粒 ++++ ++** +++
发育阶段 器官 Zm遍在蛋白启动子::BPSI.2(pBPSMM353) Zm遍在蛋白启动子::BPSI.3(pBPSMM312) Zm遍在蛋白启动子::BPSI.4(pBPSMM310)
五叶 +++ +++
+++ ++
开花 +++ +++
晚期繁殖 谷粒 +++ +++ ++**
GUS组织化学分析:GUS活性的范围(-无表达至++++高表达),
**仅在胚乳内,ND:未测定
实施例2.位于已注解的DNA序列内的IME内含子
2.1计算机法筛选系统
用于鉴定具有功能性IME的内含子的计算机法内含子筛选系统包括三个主要部分:(1)生成内含子序列数据库并使用(实施例1.3内所示)功能性IME标准筛选候选内含子;(2)定义从其中选择内含子的那些候选基因的表达谱;(3)通过在候选基因所处的基因组区域上实施EST序列作图而进一步检验所选择的基因结构。
从NCBI下载超过30,000个已注解的稻和玉米的基因组序列。内含子、5′-UTR和3′-UTR、启动子和终止子序列从这些已注解的基因中(以计算机法)分离,并且生成它们的相应序列数据库(表10,11)。基于功能性IME标准(见1.3),从生成的内舍子序列数据库中对超过111,800个内舍子(即106049个稻内含子、4587个玉米内含子)筛选潜在的内含子调节性增强元件。已经鉴定总计108个潜在的候选内含子,并且从NCBI中检索了含有候选内含子的基因的蛋白质序列。从实施例1内所述的cDNA文库中,对这些蛋白质序列使用E值为1.0e-20的BLASTx算法(该程序使核苷酸查询序列(两条链均为核苷酸查询序列)的6个读码框概念性翻译产物与蛋白质序列比较)鉴定了稻(我们未公开玉米序列)同系物EST序列。使用稻变体表达谱数据(见实施例1),选择其基因与具有所需要表达谱(如组成型表达模式和组织特异性表达模式)的稻基因同源的内含子作为计算机法鉴定的最终候选内含子,用于试验室实验性测试。
衍生自EST序列集合的稻UniGene使用汇集的稻EST公共数据并使用实施例1中所述数据库得到的EST数据加以更新,并且UniGene表达谱数据使用稻变体表达谱数据在实施例1中所述的23个不同文库范围内生成。新近更新的UniGene表达谱数据用于辅助选择最终的108个候选内舍子。撰写Perl脚本以从整个NCBI中稻和玉米的已注解的基因组DNA序列中分离内含子、5′-和3′-UTR、终止子和启动子序列来产生相应的序列数据库、筛选功能性IME和比较表达谱数据(见实施例5)。从已注解基因的CDS(编码序列)中检索内舍子。从超过30,000个已注解的基因中检索出如表11和12中概括的总计106,049个稻内含子和4,587个玉米内舍子。
表10.稻/玉米序列数据库概览
玉米
内含子 106049 4587
5′UTR 129 236
3′UTR 142 694
终止子 7 5
启动子 69 239
表11.稻基因和玉米基因概览*
平均数 玉米
基因长度 2471 3223
内含子长度 399 279
外显子长度 309 388
内含子/基因 3.9 2.61
外显子/基因 4 2.45
GC/内含子 39% 40.8%
GC/外显子 54.8% 55.3%
*无基因名称的内含子或外显子从计算中排除。
表12.数据库内基因的总数
基因名称 基因标识号
30059 30249
玉米 1281 3549
此外,在其中分离内含子的全部108个候选基因的全长编码序列下载自NCBI并使用BLASTN和1.0e-20的E截断值对Hyseq稻和玉米的UniGene搜索以鉴定Hyseq稻和玉米的同系物序列。选择最高命中的稻UniGene,并检验基因表达谱数据。对因为与所选择的内含子候选基因同源而鉴定的EST序列进行检索并沿着内含子候选基因序列对稻基因组区域作图。基于UniGene表达谱数据和候选基因结构,注解并通过EST序列比对证实,最终从108个候选内含子中选出9个内含子并接受实时RT-PCR表达测试。在9个内含子中,4个内含子表现组成型表达模式,3个内含子优选地在种子早期发育阶段表达,1个内含子优选地表达于根内,并且1个内含子在干旱条件下受到诱导。
表13.基于第二计算机法筛选系统选择的候选内含子
内含子 稻GI号 序列同源性
BPSI.5(SEQ ID NO:5) 9624451 蔗糖转运蛋白
BPSI.6(SEQ ID NO:6) 7523493 与来自的克隆T22O13、F12K2的拟南芥染色体II序列相似;推定的脂酶(AC006233)
BPSI.7(SEQ ID NO:7) 20161203 推定的肉桂醇脱氢酶
BPSI.8(SEQ ID NO:8) 18921322 推定的核糖核蛋白
BPSI.9(SEQ ID NO:9) 12061241 推定的线粒体载体蛋白
BPSI.10(SEQ ID NO:10) 20160990 推定的蛋白激酶
BPSI.11(SEQ IDNO:11) 886404 5′UTR内舍子(1st)MADS3盒蛋白
2.2分离候选内含子
来自稻的基因组DNA使用Qiagen DNAeasy植物微量试剂盒(Qiagen)提取。含有目的内含子的基因组DNA区域使用常规PCR分离。将大约0.1μg消化的基因组DNA用于常规PCR反应(见下文)。基于稻基因组序列设计引物。5μl稀释的已消化基因组DNA用作PCR反应中的DNA模版。PCR使用TripleMaster PCR系统(Eppendorf,德国汉堡)如制造商所述开展。
表14.用于扩增广泛表达的候选内含子的引物
引物 序列
BPSI.5-5′(SEQ ID NO:61) 5′-cggggtaccgagctctctggtggctgaggtaagttctgttattacc
BPSI.5-3′(SEQ ID NO:62) 5′-cggggatccggacaggaaaacctgaaaacaggg
BPSI.6-5′(SEQ ID NO:63) 5′-cggggtaccgagctcgacgatttaggtaagtcattattgtctc
BPSI.6-3′(SEQ IDNO:64) 5′-cggggatcctcactgaaacctgcagtgtagg
BPSI.7-5′(SEQ ID NO:65) 5′-cggggtaccgagctcgatcctaaggtaagcactctagctg
BPSI.7-3′(SEQ ID NO:66) 5′-cggggatccgtaactcaacctgtttttttta
BPSI.8-5′(SEQ ID NO:67) 5′-cggggtaccgagctccaatggctaggtaagtatatgcttcc
BPSI.8-3′(SEQ ID NO:68) 5′-cggggatcccccatcaagtacctgttttaag
BPSI.9-5′(SEQ ID NO:69) 5′-cggggtaccgagctcgaatacctaggtaagtccatctc
BPSI.9-3′(SEQ IDNO:70) 5′-cggggatcccacacaagcgacctggaaaaataagc
BPSI.10-5′(SEQ ID NO:71) 5′-cggggtaccgagctcccatctttttaggtaagtatctttgcg
BPSI.10-3′(SEQ ID NO:72) 5′-cggggatccggtaaagaacctgtttaatac
BPSI.11-5′(SEQ IDNO:73) 5′-cggggtaccgagctctgaacaggaaggtaagttctggctttcttgc
BPSI.11-3′(SEQ ID NO:74) 5′-cggggatcctcagatcgacctggacacaaacgc
扩增在Thermocycler(T3 Thermocycler Biometra)所提供的优化PCR程序(94℃ 15秒和80℃ 1分钟进行1个循环,在94℃ 15秒、在58℃ 1分钟和在72℃ 1分钟进行35个循环)下的PCR反应(5μl10×Advantage PCR混合物[Eppendorf]、5μl基因组DNA[对应于大约80ng]、2.5mM的每一dATP、dCTP、dGTP和dTTP[Invitrogen:dNTP混合物]、1μl的20μM的5′内含子特异性引物20pM、1μl的20μM的3′内含子特异性引物、1μlTripleMasterDNA聚合酶混合物[Eppendorf],终体积50μl)内实施。
使用QIA离心柱如制造商(Qiagen,Valencia,CA)的指导来纯化PCR产物,并且扩增的内舍子如下文所述直接用于克隆至表达载体。
2.3载体构建
用于这些实验的基础载体是pBPSMM305,该载体包含了无内含子驱动性GUSint基因表达的玉米乳酸脱氢酶(LDH)启动子,其后是NOS终止子。已经证实,L DH启动子在缺乏能够提供IME的内含子的条件下指导通过比色染色法不可检测的GUS表达水平。
内含子PCR产物用SacI和BamHI消化并克隆至用SacI和BamHI线性化的pBPSMM305,产生如下的LDH:内含子:GUS表达载体。
表15.在5′UTR内舍有内含子的GUS嵌合构建体
基于pUC的表达载体 表达盒的组成(启动子::内舍子::报告基因::终止子)
pBPSJB041(pBPSLI017) ZmLDH启动子::BPSI.5::GUS::NOS3′
pBPSJB042(pBPSLI018) ZmLDH启动子::BPSI.6::GUS::NOS3′
pBPSJB043(pBPSLI019) ZmLDH启动子::BPSI.7::GUS::NOS3′
pBPSJB044(pBPSLI020) ZmLDH启动子::BPSI.8::GUS::NOS3′
pBPSJB045(pBPSLI021) ZmLDH启动子::BPSI.9::GUS::NOS3′
pBPSJB046(pBPSLI022) ZmLDH启动子::BPSI.10::GUS::NOS3′
pBPSJB050(pBPSLI023) ZmLDH启动子::BPSI.11::GUS::NOS3′
双元载体pBPSLI017包含含有BPSI.5内含子的表达盒并通过来自pBPSJB041的PmeI-PacI片段连接至用PmeI和PacI线性化的pBPSLM139生成。
双元载体pBPSLI018包含含有BPSI.6内含子的表达盒并通过来自pBPSJB042的PmeI-PacI片段连接至用PmeI和PacI线性化的pBPSLM139生成。
双元载体pBPSLI019包含含有BPSI.7内含子的表达盒并通过来自pBPSJB043的PmeI-PacI片段连接至用PmeI和PacI线性化的pBPSLM139生成。
双元载体pBPSLI020包含含有BPSI.8内含子的表达盒并通过来自pBPSJB044的PmeI-PacI片段连接至用PmeI和PacI线性化的pBPSLM139生成。
双元载体pBPSLI021包含含有BPSI.9内含子的表达盒并通过来自pBPSJB045的PmeI-PacI片段连接至用PPmeI和PacI线性化的pBPSLM139生成。
双元载体pBPSLI022包含含有BPSI.10内含子的表达盒并通过来自pBPSJB046的PmeI-PacI片段连接至用PmeI-PacI线性化的pBPSLM139生成。
双元载体pBPSLI023包含含有BPSI.11内含子的表达盒并通过来自pBPSJB050的PmeI-PacI片段连接至用PmeI和PacI线性化的pBPSLM139生成。
2.4用于鉴定有IME功能的内含子的瞬时分析
这些实验通过轰击植物组织或培养细胞(实施例4.1)或通过农杆菌介导性转化(实施例4.3)开展。用于这些实验的靶组织是用于农杆菌方法的植物组织(例如叶或根)、培养的细胞(例如玉米BMS)或植物组织(例如不成熟的胚)。
对这些内含子与LDH启动子一起指导IME能力的表征通过分别轰击表达载体至玉米叶组织和液体培养的BMS细胞经瞬时表达加以实施。
不舍任何内含子序列的玉米乳酸脱氢酶启动子(Zm.LDH)用作基础表达(阴性对照)。将目的内舍子克隆至ZmLDH启动子的5′UTR区内。玉米遍在蛋白内含子用作阳性对照以便基于GUS表达而测量通过目的内含子增强的表达的相对水平。
由于ZmLDH启动子在没有内含子时非常低的背景(没有可检测的GUS表达),任何GUS染色的存在表明特定内含子能够提供IME。在所测试的内含子中,BPSI.10和BPSI.11内含子以与LDH::Zm.遍在蛋白内含子构建体可比的水平均一地产生最高的GUS表达。除了这些内含子以外,BPSI.5、BPSI.6和BPSI.7内含子均一地产生处于仅有LDH启动子和仅有LDH::Zm.遍在蛋白内含子之间的GUS的中等表达水平。在玉米叶和BMS细胞中得到可比的结果,这表明所测试的内含子在绿色组织和非绿色组织内赋予IME(表16)。
表16.测试内含子介导性增强的瞬时GUS表达
候选内含子 GUS表达*叶BMS
无内含子(仅有Zm.LDH启动子)
Zm.LDH+Zm.遍在蛋白内含子(阳性对照) ++++ ++++
Zm.LDH启动子+bpSI.5 ++ ++
Zm.LDH启动子+bpSI.6 +++ +++
Zm.LDH启动子+bpSI.7 +++ +++
Zm.LDH启动子+bpSI.8 +
Zm.LDH启动子+bpSI.9
Zm.LDH启动子+bpSI.10 ++++ +++
Zm.LDH启动子+bpSI.11 ++++ ND
GUS组织化学分析:GUS活性的范围(-无表达至++++高表达),ND:未测定
实施例3.鉴定位于5′非翻译区内的IME内含子
3.1计算机法筛选系统
用于鉴定位于5′UTR内具有功能性IME的内含子的计算机法内含子筛选系统包括三个主要部分:(1)基因组研究所(Institute of GenomeResearch)2003年10月2日发布的稻全体CDS基因组图,和EST序列库;(2)使用功能性IME标准和稻cDNA克隆分布谱鉴定并选择位于5′UTR内的内含子;(3)通过检验基因组DNA、CDS和EST、基因模型、序列读码框和内含子剪接位点之间的序列比对验证所选择的5′UTR内含子。
将总计56,056个注解的稻CDS在日本稻基因组上作图,在所述日本稻基因组中稻CDS和基因组DNA序列均自基因组研究所得到。公共来源和自有来源的额外422,882个稻EST序列也在稻基因组上作图。使用剪接比对软件GeneSeqer(来自爱荷华州立大学研究基金会(Iowa State UniversityResearch foundation)的2003年9月2日版本)来实施完整基因组作图。因为EST和CDS均在它们相应的基因组区域上得到作图,衍生自位于相同基因组区内的CDS作图和EST作图的序列比对协调者(coordinator)[协调者是基因组序列中CDS/EST序列与之比对的起始位置和/或终止位置]提供机会来鉴定沿基因组DNA超出CDS中起始密码子的EST序列的比对延伸。来自超出CDS的EST序列的这种序列比对表明鉴定了CDS内不包含而EST序列内包含的5′UTR。该系统选择了这些EST序列用于5′URT内含子筛选,该EST序列使序列比对沿基因组超出CDS延伸高达5千碱基长度。对于任何预测的外显子,在预测的5′UTR区内的最末外显子必须在CDS的首个外显子的相同位置处比对。基因作图结果已经鉴定了具有含有至少一个内含子的5′UTR的461个基因。
使用需要至少3个EST序列证实所预测的相同5′UTR内含子的其它严格标准来选择候选基因,由此鉴定了87个候选基因。使用视为与稻CDS相同的转录物的那些已鉴定EST序列来检索稻cDNA克隆分布数据或微阵列表达数据,在所述数据中那些已鉴定的EST序列的克隆已经点样于稻微阵列芯片上或那些鉴定的EST序列的同系物在该芯片上鉴定。对于给定的稻cDNA克隆分布谱,将具有分布于23个cDNA文库的超过100个克隆的簇/变体大小的基因视为高度表达。对于给定的微阵列表达,还将具有超过相同样品内顶部25%百分位数的杂交信号强度的基因视为高度表达。除了用于选择候选基因的基因表达标准外,还可应用(在实施例1.3内所述的)IME标准。
此外,所选候选基因的验证通过检验EST、CDS序列与基因组DNA序列之间序列比对的一致性实施。显然,EST序列需要支持从CDS中预测的基因模型。EST与CDS之间序列比对的任何冲突将导致候选基因中途淘汰。使用这些标准,选择了最终11个内含子(表17)。
表17.基于第三计算机法筛选系统而选择的候选内含子
内含子 稻GI号 序列同源性
BPSI.12(SEQ ID NO:12) 29620794 推定的腺苷甲硫氨酸脱羧酶
BPSI.13(SEQ ID NO:13) 33666702 天冬氨酸蛋白酶
BPSI.14(SEQ ID NO:14) 29678665 Lec14b蛋白
BPSI.15(SEQ ID NO:15) 35009827 推定的甘露糖结合性稻凝集素
BPSI.16(SEQ ID NO:16) 41883853 推定的reticulon
BPSI.17(SEQ ID NO:17) 2799981 葡糖酸氧化酶
BPSI.18(SEQ ID NO:18) 34763855 与AT4g33690/T16L1_180相似
BPSI.19(SEQ ID NO:19) 32533738 N/A
BPSI.20(SEQ ID NO:20) 33657147 假设的蛋白质
BPSI.21(SEQ ID NO:21) 33800379 推定的膜转运蛋白
BPSI.22(SEQ ID NO:22) 2309889 推定的ACT结构域重复蛋白
3.2内含子的分离
含有目的内舍子的基因组DNA用序列特异性引物通过PCR分离(见1.4),随后克隆至本领域的PCR克隆载体。
3.3载体构建
内含子使用在内含子5′末端设计有SacI位点和在序列5′设计有BamHI位点的引物从稻基因组DNA中PCR扩增。PCR产物用SacI和BamHI消化并连接至用SacI和BamHI线性化的pBPSMM305以生成基于pUC的表达载体,其包含Zm.LDH启动子::候选内含子::GUSint::NOS终止子。
用于玉米稳定转化的双元载体通过用PmeI和PacI消化pUC表达载体并连接至用PmeI和PacI消化的pBPSLM139内构建。
3.4用于鉴定IME内含子的瞬时分析
这些实验通过轰击植物组织或培养细胞(实施例4.1)或通过农杆菌介导性转化(实施例4.3)开展。用于这些实验的靶组织是用于农杆菌方法的植物组织(例如叶或根)、培养的细胞(例如玉米BMS)或植物组织(例如不成熟的胚)。
实施例4.用于鉴定IME内含子的分析法
这些实验通过轰击植物组织或培养细胞(实施例4.1)、通过PEG介导DNA至植物原生质体(实施例4.2)或通过农杆菌介导性转化(实施例4.3)开展。用于这些实验的靶组织是用于农杆菌方法的植物组织(例如叶或根)、培养的细胞(例如玉米-黑色墨西哥甜玉米(Black Mexican Sweetcorn)(BMS)或植物胚。
4.1使用微抛射体轰击法的瞬时分析
使用Qiagen质粒试剂盒(cat#12143)分离质粒构建体。将DNA根据Sanford等(1993)所述沉淀在0.6μM金粒子(Bio-Radcat#165-2262)上并使用PDS-1000/氦系统装置(Bio-Rad)加速至靶组织上(例如两周龄玉米的叶、BMS培养细胞等)。所有的DNA沉淀和轰击步骤在无菌条件下室温开展。
黑色墨西哥甜玉米(BMS)悬浮培养细胞在BMS细胞培养液体培养基[Murashige和Skoog(MS)盐(4.3g/l)、3%(w/v)蔗糖、肌醇(100mg/l)、3mg/l2,4-二氯苯氧代乙酸(2,4-D)、酪蛋白水解物(1g/l)、硫胺素(10mg/l)和L-脯氨酸(1.15g/l),pH5.8]内增殖。每周将10ml稳定期细胞培养物转移至40ml新鲜培养基内并在27℃在旋转式摇瓶机上的250ml烧瓶内以每分钟110转培养。
将硅化Eppendorf管内的60mg金粒子重悬于100%乙醇内,随后在微型离心机C1200(National Labnet Co.Wood bridge,NJ)内离心30秒。沉淀在100%乙醇内淋洗一次并在无菌水内淋洗两次,每次洗涤后离心。沉淀最终重悬于1ml无菌的50%甘油内。随后金混悬液分成50μl的等分式样并于4℃贮存。向一份金混悬液内添加如下试剂:5μl的1μg/μl总DNA、50μl的2.5MCaCl2、20μl的0.1M精脒、游离碱。将DNA溶液涡旋混合1分钟并在-80℃放置3分钟,随后在微型离心机C1200内离心10秒。除去上清液。通过轻弹Eppendorf管,小心地将沉淀重悬于1ml100%乙醇,随后离心10秒。除去上清液并且小心地将沉淀重悬于50μl100%乙醇并在-80℃放置直至使用(轰击前30分钟至4小时)。若在溶液内可见金沉积物,则该管在即将使用前于水浴超声仪器内超声处理1秒钟。
为了轰击,将两周龄玉米的叶切成长度大约1cm的片并且近轴侧向上地安放在渗透诱导培养基M-N6-702上[N6盐(3.96g/l)、3%(w/v)蔗糖、1.5mg/l2,4-二氯苯氧代乙酸(2,4-D)、酪蛋白水解物(100mg/l)和L-脯氨酸(2.9g/l)、MS维生素贮藏溶液(1ml/L)、0.2M甘露醇、0.2M山梨醇,pH5.8]。叶片温育1-2小时。
在BMS培养细胞的例子中,将一周龄的悬浮细胞于1000g在Beckman/Coulter Avanti J25离心机内沉淀并弃去上清液。将细胞用刮勺在42号Whatman圆形无灰滤纸上铺成厚1/16英寸的层。将承载植物材料的滤纸在轰击前1-2小时放置在27℃黑暗中的渗透诱导培养基上。即将轰击前,将滤纸从培养基上移走并置于一叠无菌滤纸上,使愈伤组织表面部分干燥。
每个平皿用6μl金-DNA溶液在1,800psi(对叶材料)和1,100psi(对BMS培养细胞)射击两次。为保持植物材料的位置,在样品的上面放置灭菌的金属筛。轰击后,将承载样品的滤纸转移至不含甘露醇和山梨醇的M-N6-702培养基上并在瞬时分析之前于27℃黑暗下温育2日。报告基因的瞬时表达水平使用本领域内的方案通过GUS染色、化学发光定量或RT-PCR测定。GUS染色通过将植物材料在GUS溶液[100mM NaHPO4,10mM EDTA,0.05%TritonX100,0.025%X-Gluc溶液(溶解于DMSO内的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸)、10%甲醇,pH7.0]内在37℃温育16-24小时完成。植物组织经真空15分钟渗透2次以促进染色更深。
报告基因的瞬时表达水平使用本领域内的方案通过染色、酶分析或RT-PCR确定。
4.2使用原生质体的瞬时分析
原生质体的分离通过Sheen(1990)发展的如下方案实施。将玉米幼苗在25℃黑暗中维持10日并在原生质体制备前光照20小时。将叶的中间部分切成0.5mm的条(长度约6cm)并在含有1%(w/v)纤维素RS、0.1%(w/v)、离析酶R10(二者均来自Yakult Honsha,Nishinomiya,日本)、0.6M甘露醇、10mM Mes(pH5.7)、1mM CaCl2、1mM MgCl2、10mMβ-巯基乙醇和0.1%BSA(w/v)的溶液内于23℃温育3小时,随后以每分钟80转轻柔振荡10分钟来释放原生质体。原生质体通过在100×g离心2分钟收集,在冷的0.6M甘露醇溶液内洗涤一次,离心并重悬于冷的0.6M甘露醇(2×106/ml)内。
将总体积100μl无菌水内的总计50μg质粒DNA添加至0.5ml玉米原生质体混悬液(1×106个细胞/ml)内并轻柔混合。添加0.5ml PEG溶液(40%PEG4,000、100mM CaNO3、0.5M甘露醇)并在70℃预加温,同时轻柔振荡,随后添加4.5ml MM溶液(0.6M甘露醇、15mM MgCl2和0.1%MES)。该混合物在室温下温育15分钟。原生质体通过以每分钟600转离心5分钟沉淀并重悬于1.0ml的MMB溶液[0.6M甘露醇、4mM Mes(pH5.7)和雀麦花叶病毒(BMV)盐(任选)]内洗涤两次,并在25℃黑暗中温育48小时。在最终洗涤步骤后,原生质体收集于3ml MMB培养基内并在25℃黑暗中温育48小时。报告基因的瞬时表达水平使用本领域内的方案通过对报告基因表达或RT-PCR定量进行测定,目的是确定在内含子介导性增强中有功能的潜在内含子。
4.3在双子叶植物和单子叶植物中的农杆菌介导性转化
4.3.1转基因拟南芥菜(Columbia)植物的转化和再生
为生成转基因拟南芥植物,根癌农杆菌(菌株C58C1 pGV2260)用以上所述的多种载体构建体转化。随后使用农杆菌菌株生成转基因植物。为此目的,单个已转化的农杆菌集落在4ml培养物(培养基:具有50μg/ml卡那霉素和25μg/ml利福平的YEB培养基)中在28℃温育过夜。随后该培养物接种于400ml相同培养基内,并将该培养物温育过夜(28℃,每分钟220转)并离心沉淀(GSA转头,每分钟8,000转,20分钟)。沉淀重悬于浸润培养基(1/2MS培养基;0.5g/lMES,pH5.8;50g/l蔗糖)内。将混悬液导入植物盒(Duchefa),并且添加100ml的SILWETL-77(以聚乙烯氧化物改性七甲基三硅氧烷;Osi Specialties Inc.,目录号P030196)至0.02%终浓度。在干燥器内,具有8至12株植物的植物盒于真空中10至15分钟,随后自然通气。重复2至3次。因此,将全部植物植入具有潮湿土壤的花盆并在长日条件(白天温度22至24℃,夜晚温度温度19℃;相对大气湿度65%)下生长。种子6周后收获。
作为备选,转基因拟南芥植物可以通过根转化得到。使用最大8周龄植物的白色根条。为此目的,使用在无菌条件下在1MS培养基(1%蔗糖;100mg/l肌醇;1.0mg/l硫胺素;0.5mg/l吡哆醇;0.5mg/l烟酸;0.5g MES,pH5.7;0.8%琼脂)内维持的植物。根在愈伤组织诱导培养基上(1×Gamborg氏B5培养基;2%葡萄糖;0.5g/l巯基乙醇;0.8%琼脂;0.5mg/l2,4-D(2,4-二氯苯氧代乙酸);0.05mg/l激动素)生长3日。将长度0.5cm的根切片转移至10至20ml液体愈伤组织诱导培养基(组成如上所述,但不舍琼脂补充物)内,接种1ml如上所述的过夜农杆菌培养物(在28℃的LB中生长,每分钟200转)并振荡2分钟。在排出过量培养基后,将根外植体转移至含琼脂的愈伤组织诱导液体培养基内,随后转移至不舍琼脂的愈伤组织诱导培养基(含500mg/l羧噻吩青霉素,SmithKline Beecham Pharma GmbH,Munich)内温育并振荡,并且最终转移至苗诱导培养基(5mg/l2-异戊烯腺嘌呤磷酸酯;0.15mg/l吲哚-3-乙酸;50mg/l卡那霉素;500mg/l羧噻吩青霉素)内。5周后并更换1次或2次培养基后,将绿色小苗转移至萌发培养基(1MS培养基;1%蔗糖;100mg/l肌醇;1.0mg/l硫胺素;0.5mg/l吡哆醇;0.5mg/l烟酸;0.5gMES;pH5.7;0.8%琼脂)内并再生成植物。
4.3.2作物植物的转化和再生
使用标准转化和再生技术的农杆菌介导性植物转化还可以用于转化作物植物(Gelvin & Schilperoort(1995)Plant Molecular Biology Manual,第二版,Dordrecht:Kluwer Academic Publ.ISBN0-7923-2731-4;Glick &Thompson(1993)Methods in Plant Molecular Biology and Biotechnology,Boca Raton:CRC Press,ISBN0-8493-5164-2)。例如,欧洲油菜可以通过子叶或下胚轴转化法进行转化(Moloney(1989)Plant Cell Reports8:238-242)。用于选择农杆菌和植物的抗生素取决于用于转化的双元载体和农杆菌菌株。欧洲油菜的选择通常使用卡那霉素作为植物选择标记实施。在亚麻(Linum usitatissimum)内的农杆菌介导性基因转移可以使用例如Mlynarova(1994)Plant Cell Report13:282-285所述的技术实施。大豆的转化可以使用例如在EP-A10424047或在EP-A10397687、US5,376,543、US5,169,770中所述的技术实施。玉米或其它单子叶植物的转化可以使用例如US5,591,616中所述的技术实施。使用粒子轰击、聚乙二醇介导性DNA摄取或经碳化硅纤维技术对植物的转化例如由Freeling & Walbot(1993)“The maize handbook”ISBN3-540-97826-7,Springer Verlag New York)描述。
实施例5:用于从NCBI基因库文件中检索序列信息的计算机算法
靶特征关键词是内含子、终止子、启动子、UTR。适合于以数据库信息为基础而鉴定合适的内含子序列的本发明计算机算法实例是如下脚本(以计算机语言Pearl撰写)(还见图5a-f):
#!/usr/local/bin/perl-w
#intron.pl
open(IN,$ARGV[0])or die″can′t find output″;
 while (defined(my $file=<IN>)) {
 #start of a single annotation
if ($file=~/LOCUS.*?\s+(\d+)\sbp(.*)/) {
     my $length=$l;
     my $mol=1;
     $mol=0 if $2=~/circular/;
 my @cdslist=();
 my @start=();
    my $order=0;#order=1:complementary coding.
 my @title=();
 my @title0=();
 my @intron=();
 my $id=″″;
 my @terminator=();
 my @promoter=();
 my @utr5=();
 my @utr3=();
 my @origin=();
 my $tab=″″;
 my $organism=″″;
   while (defined(my $line=<IN> )) {
 $line=$tab.$line;
if ($line=~/^VERSION.*?\s+(GI:\d+)/) {
      $id=$l;
}elsif ($line=~/^\s{2}ORGANISM\s+(.*)/) {
 if ($1=~/Oryza sativa/i) {
    $organism=″rice″;
    }elsif ($1=~/zea mays/i) {
    $organism=″maize″;
 }elsif ($1=~/Glycine max/i) {
   $organism=″soybean″;
 }else {
   $1=~/(\w+)/;
 $organism=$l;
 }
}elaif (Sline=~/^\s{5}(CDS\s*)/){#extract cds
 my $test=S′;
  my $gene=″N/A″;
  my $atart=1;
 my $product=″N/A″;
 my $gi=$id;
 my @cds=();
 my @temp=();
 if ($test=~/complement/) {
       $order=1;
   }else {
      $order=0;
   }
   while (my $in=<IN>) {
 if ($in=~/\s\/(.*)/) {
   $test=$test;
   if ($1=~/gene=″(.*)″/) {
     $gene=$1;
   }elsif ($1=~/note=″(.*)″/) {
      $product=$1;
   }else {
   last;
   }
 } else {
   $test=$test.$in;
 }
 } #close while loop;
   $test=~s/\w+\d+\.\d:\d+\.\.\d+//g;
   $test=~s/\D//g;
      $test=~s/\s+//g;
      $test=~s/^\s+//;
   my @sott;
 if (Smol==0) {
   @sort=split(//,$test);
     } else {
            @sort=$ort {$a<=>$b} split(//,$test);
     }
#tag complement cds
     if ($order==1) {
          @cds=(″complement″,@sort);
        } elsif ($order==0) {
         @cds=@sort;
        } #close if loop;
#retreave notation i fintron exist;
        if (scalar(@cds)>=4) {
         while (my Sin=<IN>) {
          $start=1;
             if ($in=~/codon_start=(\d+)/) {
           $tart=$1;
         }elsif (Sin=~/\/gene=(.*)″/) {
           $gene=$1;
           }elsif (Sin=~/\/product=(.*)/) {
           $product=$1;
           $product=~tr/′″′//d;
            }elsif (Sin=~/db_xref=″(GI:.*?)″/) {
            $gi=$1;
            last;
               } elsif (Sin=~/\/(pseudo)/) {
            $product=″pseudo″;
         last;
         }  #close if loop
        }  #close while loop;
        push @start,$start;
        push @cdslist,\@cds;
#retreave5′utr ifstart codon > 1;
        my @tem=();
        for (my$i=1;$i<=($#cds-1)/2;$i++) {
          my $titlel=″>$organism|$gi|Intron_$i″;
          my                                                 $title2=″
$gene|$start|″.($cds[2*$i-1+$order]+1).″..″.($cds[2*$i+$order]-1).″|$product\n″;
            my @title=($titlel,$title2);
            push @tem,\@title;
           } #close for loop
           push @title,\@tem;
           my                                       $title0=″>$organism|$gi|5UTR_0
 $gene|$start|″.($cds[$order]-1).″..″.($cds[$order]+$start-2).″|$product\n″;
           push @title0,$title0;
           } #close if @cds>4 loop
   } elsif($line=~/^\s{5}terminator/) {
    ($tab,my $note,my@term)=&getTerminator($line);
 push @terminator,$note;
 push @terminator,\@term;
}  elsif($line=~/^\s{5}promoter/) {
    (Stab,my $note,my@prom)=&getTerminator($line);
    push @promoter,$note;
 push @promoter,\@prom;
} elsif($line=~/^\s{5}5\DUTR/) {
     ($tab,my $note,my@temp)=&getTerminator($line);
 push @utr5,$note;
 push @utr5,\@temp;
} elsif($line=~/^\s{5}3\DUTR/) {
     ($tab,my $note,my @temp)=&getTerminator($line);
 push @utr3,$note;
 push @utr3,\@temp;
#get sequence @origin
     }
    if($line=~/^(ORIGIN)/) {
        $line=″″;
    while(my $code=<IN>) {
      if($code=~/\/\//) {
           last;
        }else{
       $line=$line.$code;
     }#close if loop
      } #close while loop
 #   $line=~s/\/\///g;
# print $line,″\n″;
       $line=~tr/0-9//d;
       $line=~tr///d;
       $line=~tr/\n//d;
 @origin=split(//,$line);
for (my $i=0;$i<=$#cdslist;$i++) {
if ($start[$i]>2) {
 my @first=();
 my $first;
if (${$cdslist[$i]}[0]eq″complement″) {
 my @utr=@origin[$cdslist[$i][1]-1..($cdslist[$i][1]+$start[$i]-2)];
print @utr,″\n″;
   $first=&complement(@utr);
 } else {
   @first=@origin[$cdslist[$i][0]-1..($cdslist[$i][0]+$start[$i]-2)];
$first=join(′′,@first);
 } #close if loop for complement
   print $title0 [$i],$first,″\n\n″;
  } #close if loop for $start>2;
if (${$cdslist[$i]}[0]eq″complement″) {
 shift @{$cdslist[$i] };
for (my $j=1;$j<=($#{$cdslist[$i]}-1)/2;$j++) {
     my @int=@origin[$cdslist[$i][2*$j-1]..$cdslist[$i][2*$j]-2];
   my $intl=&complement (@int);
   print               $title[$i][$j-1][0],scalar(@int),$title[$i][$j-1][1],
$intl,″\n\n″if $#int<5000;
           } #close 2nd for loop for complement
         } else {
           for (my $j=1;$j<=($#{$cdslist[$i]}-1)/2;$j++) {
     my   @int=@origin [$cdslist[$i][2*$j-1].$cdslist[$i][2*$j]-2];
     if($mol==0 && $cdslist[$i][2*$j-1]> $cdslist[$i][2*$j]) {
      @int=(@origin[$cdslist[$i][2*$j-1]..$#origin],@origin[0..
$cdslist[$i][2*$j]-2]);
           }
        my $intl=join(′′,@int);
           print               $title[$i][$j-1][0],scalar(@int),$title[$i][$j-1][1],
$intl,″\n\n″if $#int<5000;
         }#close 2nd for loop
            }#close else loop
         }#close lst for loop
      my $titlel=″>$organism|$id|terminator″;
      &getSequence(\@terminator,\@origin,$titlel);
        $titlel=″>$organism|$id|promoter″;
      &getSequence(\@promoter,\@origin,$titlel);
        $titlel=″>$organism|$id|5utr″;
      &getSequence(\@utr5,\@origin,$titlel);
    $titlel=″>$organism|$id|3utr″;
  &getSequence(\@utr3,\@origin,$titlel);
 last;
} else {
    $tab=″″;
     } #close if $line loop
   } #close while $line loop
    next;
  } #close if $file loop
 } #close while $file loop
close IN;
#retreave complement sequnce
sub complement{
  my @code=@_;
  my @complemnt=();
  for (my $i=0;$i<=$#code;$i++) {
   if (Scode[$#code-$i]eq″t″) {
     $complement[Si]=″a″;
   } elsif (Scode[$#code-$i]eq″a″) {
      $complement[$i]=″t″;
   } elsif ($code[$#code-$i]eq″c″) {
      $complement[$i]=″g″;
   } elsif ($code[$#code-$i]eq″g″) {
   $complement[$i]=″c″;
   } else {
      $complement[$i]=$code[$#code-$i];
   }#close if loop
 }  #close for loop
 my $comp=join(′′,@complement);
 @complement=();
 return $comp;
} #close sub
#get sequence reference for feature keys
sub getTerminator {
 my $line=$_[0];
 my $order=0;
 if ($line=~/complement/) {
   $order=1;
 } else {
 } #close if loop
 $line=~s/\d′UTR//;
 $line=~s/\D//g;
 $line=~s/\s+//g;
 $line=~s/^\s//;
 my @term=split(′′,$line);
         @term=(″c″,@term)if $order==1;
  my $in;
  read(IN,$in,6);
  my $note=″\n″;
if ($in!~/\w/) {
     $note=<IN>;
     $note=~s/\s+\///;
     $note=~s/note=//;
     $note=~tr/″″//d;
    }#close if loop
    return($in,$note,@term);
  } #close sub
  #retreave sequence information for feature keys
  sub getSequence {
  my @array=@{$_[0]};
  my @code=@{$_[1]};
  my $id=$_[2];
   for (my $i=0;$i<($#array+1)/2;$i++) {
      my $note=$array[2*$i];
      my @term=@{$array[2*$i+1]};
     if ($term[0]eq″c″) {
      shift @term;
      for (my $j=0;$j<=($#term-1)/2;$j++) {
       my @comp=@code[($term[2*$j]-1)..($term[2*$j+1]-1)];
       my $intl=&comp lement(@comp);
       my                 $title=$id.″_″.($i+1).″″.scalar(@comp).″
$term[2*$j]..$term[2*$j+1]|$note″;
       print $title,$intl,″\n\n″;
     } #close 2nd for loop
   } else {
     for (my $j=0;$j<($#term+1)/2;$j++) {
   my @int=@code[($term[2*$j]-1)..($term[2*$j+1]-1)];
      my $intl=join(′′,@int);
      my                    $title=$id.″_″.($i+1).″″.scalar(@int).″
$term[2*$j]..$term[2*$j+1]|$note″;
   print $title,$intl,″\n\n″;
     } #close 2nd for loop
    }#close if loop
  } #close lst for loop
 } #close sub
实施例6与IME内含子组合的组织特异性启动子的表达
BPSI.1和BPSI.5已经与多种单子叶植物启动子融合并证实这些没有IME内含子的启动子中的大部分不能显示GUS表达,但是IME内含子具有增强的表达。
6.1Os.CP12启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM355)
pBPSMM355显示强烈的叶特异性表达。在所有测试的发育阶段均检测到这种表达。在所试验的任何其它组织内没有检测到表达。
6.2Zm.HRGP启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM370)
pBPSMM370在根内强烈表达。还在穗丝和在包括糊粉层和种皮的谷粒最外层内检测到显著的表达。这种表达在谷粒基部周围最强烈。穗丝内的染色在靠近谷粒结合点的区域内最强烈并且在极早发育阶段检测到。
6.3Os.CCoAMT1启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM358)
与BPSI.1(pBPSMM358)组合的Os.咖啡酰辅酶A-O-甲基转移酶(CCoAMT1)启动子显示在T1和T2谷粒内的胚特异性表达。表达水平低但非常特异。在所试验的任何其它组织内没有检测到表达。
6.4Zm.球蛋白1启动子::BPSI.1内含子::GUS::NOS终止子(EXS1025)
EXS1025在胚内强烈表达。该表达在授粉(DAP)后5日至授粉后10日之间开始。表达在盾片内最强烈并且在胚轴(具有叶和节间、初生根的幼芽)内较弱。
在包括糊粉层在内的谷粒最外层内检测到显著的表达。表达在授粉后15日至授粉后25日的阶段中最强烈并在授粉后30日较弱。有时在胚乳内检测到弱表达。在所试验的任何其它组织(包括花粉)内检测不到表达。
6.5Os.V-ATP酶启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM369)
pBPSMM369在根内强烈表达。该表达在所试验的全部阶段内检测到。
还在谷粒的所有部分和在花粉内检测到显著的表达。在早期发育阶段和在开花时的叶中检测到弱表达。该表达在强度上是可变的并且在数种植物中处于检测界限上。通常,表达在纯合T1植物中比杂合T0中高。
6.6Zm.LDH启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM357)
pBPSMM357在谷粒内显示弱活性。谷粒内的表达主要位于胚内和胚周围。还在根内检测到极弱的表达。
6.7Os.C8,7SI启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM366)含有BPSI.1的Os.C-8,7-固醇异构酶启动子(pBPSMM366)在根内显示弱活性并在谷粒内良好表达。
6.8Os.Lea启动子::BPSI.1内含子::GUS::NOS终止子(pBPSMM371)
与BPSI.1组合的Os.Lea启动子(pBPSMM371)在谷粒内显示强烈胚特异性表达。在根尖内可以检测到一些表达但是在所试验的任何其它组织内检测不到表达。
6.9Zm.LDH启动子::BPSI.5内含子::GUS::NOS终止子(pBPSLM229)
pBPSLM229在胚乳和糊粉层内显示弱表达,主要在谷粒的顶侧。在所试验的任何其它组织内检测不到表达。
序列表
<110>  巴斯福植物科学有限公司(BASF Plant Science GmbH)
<120>  增强表达的内含子序列
<130>  PF 56400 AT/AE20040293
<160>  121
<170>  Patentln 版本3.3
<210>  1
<211>  584
<212>  DNA
<213>  稻(Oryza sativa)
<220>
<221>  内含子
<222>  (1)..(584)
<223>  BPSI.1
<400>  1
Figure A20068000764401281
<210>  2
<211>  728
<212>  DNA
<213>  稻
<400>  2
Figure A20068000764401282
<210>  3
<211>  95
<212>  DNA
<213>  稻
<400>  3
Figure A20068000764401292
<210>  4
<211>  120
<212>  DNA
<213>  稻
<400>  4
Figure A20068000764401293
<210>  5
<211>  225
<212>  DNA
<213>  稻
<400>  5
Figure A20068000764401294
<210>  6
<211>  770
<212>  DNA
<213>  稻
<400>  6
<21O>  7
<211>  715
<212>  DNA
<213>  稻
<400>  7
Figure A20068000764401302
Figure A20068000764401311
<210>  8
<211>  334
<212>  DNA
<213>  稻
<400>  8
Figure A20068000764401312
<210>  9
<211>  355
<212>  DNA
<213>  稻
<400>  9
Figure A20068000764401313
<210>  10
<2ll>  538
<212>  DNA
<213>  稻
<400>  10
Figure A20068000764401321
<210>  11
<211>  331
<212>  DNA
<213>  稻
<400>  11
Figure A20068000764401322
<210>  12
<211>  961
<212>  DNA
<213>  稻
<400>  12
Figure A20068000764401331
<210>  13
<211>  595
<212>  DNA
<213>  稻
<400>  13
Figure A20068000764401332
<210>  14
<211>  145
<212>  DNA
<213>  稻
<400>  14
Figure A20068000764401333
<210>  15
<211>  314
<212>  DNA
<213>  稻
<400>  15
Figure A20068000764401341
<210>  16
<211>  652
<212>  DNA
<213>  稻
<400>  16
Figure A20068000764401342
<210>  17
<211>  268
<212>  DNA
<213>  稻
<400>  17
Figure A20068000764401343
<210>  18
<211>  546
<212>  DNA
<213>  稻
<400>  18
Figure A20068000764401351
<210>  19
<211>  812
<212>  DNA
<213>  稻
<400>  19
Figure A20068000764401352
Figure A20068000764401361
<210>  20
<211>  371
<212>  DNA
<213>  稻
<400>  20
Figure A20068000764401362
<210>  21
<211>  722
<212>  DNA
<213>  稻
<400>  21
Figure A20068000764401363
<210>  22
<211>  388
<212>  DNA
<213>  稻
<400>  22
Figure A20068000764401371
<21O>  23
<211>  24
<212>  DNA
<213>  稻
<400>  23
<210>  24
<211>  21
<212>  DNA
<213>  稻
<400>  24
Figure A20068000764401373
<210>  25
<211>  20
<212>  DNA
<213>  稻
<400>  25
Figure A20068000764401374
<210>  26
<211>  19
<212>  DNA
<213>  稻
<400>  26
Figure A20068000764401375
<210>  27
<211>  17
<212>  DNA
<213>  稻
<400>  27
Figure A20068000764401381
<210>  28
<211>  20
<212>  DNA
<213>  稻
<400>  28
Figure A20068000764401382
<210>  29
<211>  20
<212>  DNA
<213>  稻
<400>  29
Figure A20068000764401383
<210>  30
<211>  15
<212>  DNA
<213>  稻
<400>  30
Figure A20068000764401384
<2lO>  31
<211>  21
<212>  DNA
<213>  稻
<400>  31
Figure A20068000764401385
<210>  32
<211>  22
<212>  DNA
<213>  稻
<400>  32
Figure A20068000764401386
<210>  33
<211>  20
<212>  DNA
<213>  稻
<400>  33
<210>  34
<211>  22
<212>  DNA
<213>  稻
<400>  34
Figure A20068000764401392
<210>  35
<211>  22
<212>  DNA
<213>  稻
<400>  35
Figure A20068000764401393
<210>  36
<211>  17
<212>  DNA
<213>  稻
<400>  36
Figure A20068000764401394
<2lO>  37
<211>  18
<212>  DNA
<213>  稻
<400>  37
Figure A20068000764401395
<210>  38
<211>  22
<212>  DNA
<213>  稻
<400>  38
Figure A20068000764401396
<210>  39
<211>  18
<212>  DNA
<213>  稻
<400>  39
Figure A20068000764401397
<210>  40
<211>  22
<212>  DNA
<213>  稻
<400>  40
Figure A20068000764401401
<210>  41
<211>  22
<212>  DNA
<213>  稻
<400>  41
Figure A20068000764401402
<210>  42
<211>  19
<212>  DNA
<213>  稻
<400>  42
Figure A20068000764401403
<21O>  43
<211>  22
<212>  DNA
<213>  稻
<400>  43
Figure A20068000764401404
<210>  44
<211>  22
<212>  DNA
<213>  稻
<400>  44
Figure A20068000764401405
<210>  45
<211>  22
<212>  DNA
<213>  稻
<400>  45
Figure A20068000764401406
<210>  46
<211>  24
<212>  DNA
<213>  稻
<400>  46
Figure A20068000764401411
<210>  47
<211>  22
<212>  DNA
<213>  稻
<400>  47
Figure A20068000764401412
<210>  48
<211>  17
<212>  DNA
<213>  稻
<400>  48
Figure A20068000764401413
<210>  49
<211>  16
<212>  DNA
<213>  稻
<400>  49
Figure A20068000764401414
<210>  50
<211>  20
<212>  DNA
<213>  稻
<400>  50
Figure A20068000764401415
<210>  51
<211>  24
<212>  DNA
<213>  稻
<400>  51
Figure A20068000764401416
<210>  52
<211>  23
<212>  DNA
<213>  稻
<400>  52
Figure A20068000764401421
<210>  53
<211>  35
<212>  DNA
<213>  稻
<400>  53
Figure A20068000764401422
<21O>  54
<211>  30
<212>  DNA
<213>  稻
<400>  54
Figure A20068000764401423
<21O>  55
<211>  35
<212>  DNA
<213>  稻
<400>  55
Figure A20068000764401424
<21O>  56
<211>  29
<212>  DNA
<213>  稻
<400>  56
Figure A20068000764401425
<210>  57
<211>  32
<212>  DNA
<213>  稻
<400>  57
<210>  58
<211>  32
<212>  DNA
<213>  稻
<400>  58
Figure A20068000764401427
<21O>  59
<211>  32
<212>  DNA
<213>  稻
<400>  59
<210>  60
<211>  31
<212>  DNA
<213>  稻
<400>  60
Figure A20068000764401432
<210>  61
<211>  46
<212>  DNA
<213>  稻
<400>  61
Figure A20068000764401433
<210>  62
<211>  33
<212>  DNA
<213>  稻
<400>  62
Figure A20068000764401434
<210>  63
<211>  43
<212>  DNA
<213>  稻
<400>  63
Figure A20068000764401435
<210>  64
<211>  31
<212>  DNA
<213>  稻
<400>  64
Figure A20068000764401436
<21O>  65
<211>  40
<212>  DNA
<213>  稻
<400>  65
Figure A20068000764401441
<210>  66
<211>  31
<212>  DNA
<213>  稻
<400>  66
Figure A20068000764401442
<210>  67
<211>  41
<212>  DNA
<213>  稻
<400>  67
Figure A20068000764401443
<210>  68
<211>  31
<212>  DNA
<213>  稻
<400>  68
Figure A20068000764401444
<210>  69
<211>  38
<212>  DNA
<213>  稻
<400>  69
Figure A20068000764401445
<210>  70
<211>  35
<212>  DNA
<213>  稻
<400>  70
<210>  71
<211>  42
<212>  DNA
<213>  稻
<400>  71
Figure A20068000764401447
<210>  72
<211>  30
<212>  DNA
<213>  稻
<400>  72
Figure A20068000764401451
<210>  73
<211>  46
<212>  DNA
<213>  稻
<400>  73
Figure A20068000764401452
<210>  74
<211>  33
<212>  DNA
<213>  稻
<400>  74
Figure A20068000764401453
<210>  75
<211>  5
<212>  RNA
<213>  稻
<400>  75
curay  5
<210>  76
<211>  5
<212>  RNA
<213>  稻
<400>  76
yuray  5
<210>  77
<211>  15
<212>  DNA
<213>  优选的5’剪接位点
<400>  77
Figure A20068000764401454
<210>  78
<211>  2
<212>  DNA
<213>  5’剪接位点二核苷酸
<400>  78
<210>  79
<211>  3
<212>  DNA
<213>  3’剪接位点三核苷酸
<400>  79
Figure A20068000764401462
<210>  80
<211>  8
<212>  DNA
<213>  稻
<400>  80
Figure A20068000764401463
<210>  81
<211>  5
<212>  DNA
<213>  稻
<400>  81
Figure A20068000764401464
<210>  82
<211>  640
<212>  DNA
<213>  稻
<400>  82
Figure A20068000764401465
Figure A20068000764401471
<210>  83
<211>  770
<212>  DNA
<213>  稻
<400>  83
Figure A20068000764401472
<210>  84
<211>  150
<212>  DNA
<213>  稻
<400>  84
Figure A20068000764401473
<210>  85
<211>  189
<212>  DNA
<213>  稻
<400>  85
Figure A20068000764401481
<210>  86
<211>  290
<212>  DNA
<213>  稻
<400>  86
Figure A20068000764401482
<210>  87
<211>  246
<212>  DNA
<213>  稻
<400>  87
Figure A20068000764401483
<210>  88
<211>  838
<212>  DNA
<213>  稻
<400>  88
Figure A20068000764401484
Figure A20068000764401491
<210>  89
<211>  788
<212>  DNA
<213>  稻
<400>  89
Figure A20068000764401492
<210>  90
<211>  775
<212>  DNA
<213>  稻
<400>  90
Figure A20068000764401501
<210>  91
<211>  734
<212>  DNA
<213>  稻
<400>  91
<21O>  92
<211>  400
<212>  DNA
<213>  稻
<400>  92
<210>  93
<211>  356
<212>  DNA
<213>  稻
<400>  93
Figure A20068000764401512
<210>  94
<211>  600
<212>  DNA
<213>  稻
<400>  94
Figure A20068000764401521
<210>  95
<211>  560
<212>  DNA
<213>  稻
<400>  95
Figure A20068000764401522
<210>  96
<211>  400
<212>  DNA
<213>  稻
<400>  96
Figure A20068000764401523
<210>  97
<211>  352
<212>  DNA
<213>  稻
<400>  97
Figure A20068000764401531
<210>  98
<211>  1013
<212>  DNA
<213>  稻
<400>  98
Figure A20068000764401532
Figure A20068000764401541
<210>  99
<211>  645
<212>  DNA
<213>  稻
<400>  99
Figure A20068000764401542
<210>  100
<211>  196
<212>  DNA
<213>  稻
<400>  100
Figure A20068000764401543
<210>  101
<211>  365
<212>  DNA
<213>  稻
<400>  101
Figure A20068000764401544
Figure A20068000764401551
<210>  102
<211>  701
<212>  DNA
<213>  稻
<400>  102
Figure A20068000764401552
<210>  103
<211>  329
<212>  DNA
<213>  稻
<400>  103
Figure A20068000764401553
<21O>  104
<211>  593
<212>  DNA
<213>  稻
<400>  104
Figure A20068000764401561
<210>  105
<211>  864
<212>  DNA
<213>  稻
<400>  105
Figure A20068000764401562
Figure A20068000764401571
<210>  106
<211>  424
<212>  DNA
<213>  稻
<400>  106
Figure A20068000764401572
<210>  107
<211>  773
<212>  DNA
<213>  稻
<400>  107
Figure A20068000764401573
Figure A20068000764401581
<210>  108
<211>  442
<212>  DNA
<213>  稻
<400>  108
Figure A20068000764401582
<210>  109
<211>  6794
<212>  DNA
<213>  基于puc的表达载体pBPSMM291
<220>
<221>  终止子
<222>  (920)..(1189)
<223>  胭脂氨酸合成酶基因多腺苷酸化信号(终止子)
<220>
<221>  基因
<222>  (1250)..(3255)
<223>  包含马铃薯转化酶2内含子的β-葡糖醛酸糖苷酶基因
      (序列是互补的)
<220>
<221>  内含子
<222>  (3311)..(3894)
<223>  本发明的内含子BPSI.1(序列是互补的)
<220>
<221>  启动子
<222>  (3921)..(4856)
<223>  真核生物启动子:玉米(Zea mais)遍在蛋白启动子(序列是互补的)
<400>  109
Figure A20068000764401583
Figure A20068000764401591
Figure A20068000764401601
Figure A20068000764401611
<210>  110
<211>  6077
<212>  DNA
<213>  基于puc的表达载体pBPSMM305
<220>
<221>  启动子
<222>  (286)..(1350)
<223>  真核生物启动子:玉米乳酸脱氢酶基因启动子
<220>
<221>  基因
<222>  (1369)..(3369)
<223>  包含马铃薯转化酶2内含子的β-葡糖醛酸糖苷酶基因
<220>
<221>  基因
<222>  (1369)..(3369)
<223>  包含马铃薯转化酶2内含子的β-葡糖醛酸糖苷酶基因
<220>
<221>  终止子
<222>  (3403)..(3640)
<223>  胭脂氨酸合成酶基因终止子
<220>
<221>  基因
<222>  (4276)..(5136)
<223>  β-内酰胺酶基因
<400>    11O
Figure A20068000764401631
Figure A20068000764401641
Figure A20068000764401651
Figure A20068000764401661
<210>  111
<211>  15790
<212>  DNA
<213>  双元载体pBPSMM350
<220>
<221>  misc recomb
<222>  (5254)..(5276)
<223>  Gateway克隆技术附着位点:attR2.(序列是互补的)
<220>
<221>  启动子
<222>  (5341)..(6276)
<223>  玉米遍在蛋白启动子
<220>
<221>  内含子
<222>  (6303)..(6886)
<223>  BPSI.1
<220>
<221>  基因
<222>  (6942)..(8942)
<223>  GUS基因
<220>
<221>  终止子
<222>  (9003)..(9282)
<223>  胭脂氨酸合成酶终止子序列(NosT)
<220>
<221>  misc recomb
<222>  (9551)..(9651)
<223>  Gateway克隆技术附着位点:attR1.(序列是互补的)
<400>  111
Figure A20068000764401671
Figure A20068000764401681
Figure A20068000764401691
Figure A20068000764401701
Figure A20068000764401711
Figure A20068000764401721
Figure A20068000764401731
Figure A20068000764401741
Figure A20068000764401751
Figure A20068000764401761
<210>  112
<211>  10196
<212>  DNA
<213>  双元载体pBPSLMl39
<220>
<221>  基因
<222>  (2178)..(4094)
<223>  玉米Als基因:突变的等位基因,对除草剂不敏感的基因产物
<220>
<221>  内含子
<222>  (8945)..(9760)
<223>  玉米遍在蛋白基因的第一个内含子
<220>
<221>  终止子
<222>  (8945)..(9760)
<220>
<221>  基因
<222>  (8945)..(9760)
<223>  卡那霉素抗性盒,转座子Tn903
<400>  112
Figure A20068000764401771
Figure A20068000764401781
Figure A20068000764401791
Figure A20068000764401801
Figure A20068000764401821
Figure A20068000764401831
<2lO>  113
<211>  1470
<212>  DNA
<213>  人工的
<220>
<223>  来自载体pBPSMM355的盒(0sCP12::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(854)
<223>  Os CP12启动子
<220>
<221>  内含子
<222>  (888)..(1470)
<223>  IME-内含子:BPSI.1内含子
<400>    113
Figure A20068000764401841
<21O)  114
<211>  1799
<212>  DNA
<213>  人工的
<220>
<223>  来自载体pBPSMM355的盒(ZmHRGP::BPSI.1)玉米启动子,稻内含子
<220>
<221>  启动子
<222>  (1)..(1184)
<223>  玉米[HRGP]羟脯氨酸丰富糖蛋白(伸展蛋白)5’/UTR
       启动子
<220>
<221>  内含子
<222>  (1217)..(1799)
<223>  IME-内含子:BPSI.1内含子
<400>  114
Figure A20068000764401842
<210>  115
<211>  1701
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒pBPSMM358(0sCCoAMTl::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(1034)
<223>  p-咖啡酰辅酶A 3-0-甲基转移酶[CCoAMTl]启动子
<220>
(221>  内含子
(222)  (1119)..(1701)
(223>  IME-内含子:BPSI.1内含子
<400>  115
Figure A20068000764401861
Figure A20068000764401871
<210>  116
<211>  1999
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒EXSl025(Zm球蛋白l::BPSI.1)玉米启动子,稻内含子
<220>
<221>  启动子
<222>  (1)..(1440)
<223>  玉米球蛋白-l[ZmGlbl]启动子(W64A)
<220>
<221>  内含子
<222>  (1443)..(1999)
<223>  IME-内含子:BPSI.1内含子
<400>  116
Figure A20068000764401872
Figure A20068000764401881
<210>  117
<211>  2198
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒pBPSMM369(0sV-ATPase::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(1589)
<223>  推定的稻H+转运ATP合酶5’/UTR启动子:与稻(日本栽培种)
       1号染色体基因组DNA#AP002901具有99%的同源性
<220>
<221>  内含子
<222>  (1616)..(2198)
<223>  IME-内含子:BPSI.1内含子
<400>  117
Figure A20068000764401891
<210>  118
<211>  1409
<212>  DNA
(213>  人工的
<220>
<223>  来自载体的盒pBPSMM366(0sC8,7SI::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(796)
<223>  推定的稻C-8,7固醇异构酶启动子:与稻(日本栽培种)
       1号染色体基因组DNA#AP002969具有99%+的同源性
<220>
<221>  内含子
<222>  (827)..(1409)
<223>  IME-内含子:BPSI.1内含子
<400>    118
Figure A20068000764401911
<210>  119
<211>  1677
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒pBPSMM357(ZmLDH::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(1062)
<223>  玉米乳酸脱氢酶基因5’/UTR启动子
<220>
<221>  内含子
<222>  (1095)..(1677)
<223>  IME-内含子:BPSI.1内含子
<400>  119
Figure A20068000764401912
Figure A20068000764401921
<210>  120
<211>  1318
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒pBPSLM229(ZmLDH::BPSI.5)
<220>
<221>  启动子
<222>  (1)..(1062)
<223>  玉米乳酸脱氢酶基因5’/UTR启动子
<220>
<221>  内含子
<222>  (1068)..(1318)
<223>  IME-内含子:BPSI.5内含子
<400>  120
Figure A20068000764401931
<210>  121
<211>  2001
<212>  DNA
<213>  人工的
<220>
<223>  来自载体的盒pBPSMM371(0sLea::BPSI.1)
<220>
<221>  启动子
<222>  (1)..(1386)
<220>
<221>  启动子
<222>  (1)..(1386)
<223>  稻Lea(晚期胚胎发生丰富蛋白)启动子
<220>
<221>  内含子
<222>  (1387)..(2001)
<223>  IME-内含子:BPSI.1内含子
<400>  121
Figure A20068000764401941
Figure A20068000764401951

Claims (33)

1.用于鉴定具有在植物中增强表达特性的内含子的方法,包括从植物基因组中选择内含子,其中所述的内含子具有至少如下特征:
I)内含子长度短于1000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点的上游存在类似于共有核苷酸序列5′-CURAY-3′(SEQ ID NO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
2.用于在植物内含子群体中富集具有在植物中增强表达特性的内含子的数目至所述群体的至少50%的方法,所述的方法包括从所述群体内选择内含子,其中该内含子具有至少如下特征:
I)内含子长度短于1000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点的上游存在类似于共有核苷酸序列5′-CURAY-3′(SEQ ID NO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
3.如权利要求1或2的方法,其中具有在植物中增强表达特性的所述内含子选自:
a)位于编码蛋白质的两个外显子之间的内含子,和
b)位于相应基因的5′非翻译区内部的内含子。
4.如权利要求1至3中任意一项所述的方法,其中具有在植物中增强表达特性的所述内含子衍生自这样一种基因,即该基因来自在使用植物细胞、植物组织或完整植物所开展的基因表达分析实验中代表着10%部分的具有最高表达速率的基因的一组基因。
5.权利要求2所述的方法,其中所述的植物内含子群体包含在基因组DNA序列数据库或植物基因组DNA文库内所代表的植物基因组的基本上全部内含子。
6.如权利要求1至5中任意一项所述的方法,其中用于鉴定或富集具有在植物中增强表达特性的所述内含子的基因序列信息存在于DNA序列数据库内,并且用于鉴定或富集具有在植物中增强表达特性的所述内含子的选择步骤使用自动化方法开展。
7.如权利要求6的方法,其中自动化方法使用计算机装置和算法完成,其中所述算法定义了实现用于鉴定或富集具有在植物中增强表达特性的所述内含子的选择步骤所需要的指令。
8.计算机算法,其定义了实现用于如权利要求1至7中任意一项所述的鉴定或富集具有在植物中增强表达特性的内含子的选择步骤所需要的指令。
9.计算机装置或数据存储装置,包含权利要求8所述的算法。
10.用于分离、提供或产生具有在植物中增强表达特性的内含子的方法,包括步骤:
a)开展如权利要求1至7中任意一项所述的鉴定或富集具有在植物中增强表达特性的内含子,并提供已鉴定或已富集的所述内含子的序列信息,和
b)提供在a)中已鉴定或已富集的所述内含子的物理核苷酸序列,和
c)评估在b)中所提供内含子序列在体内或体外表达实验中增强基因表达的特性,和
d)分离来自所述表达实验c)的表现增强表达特性的内含子。
11.权利要求10所述的方法,其中所述的评估增强表达特性在植物细胞中完成并且其中所述的分离的内含子增强表达至少两倍。
12.重组DNA表达构建体,包含:
a)至少一个在植物或植物细胞中有功能的启动子序列,和
b)选自SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22所描述序列的至少一个内含子及其功能性等效物,和
c)至少一个核酸序列,
其中至少一个所述的启动子序列和至少一个所述的内含子序列功能性地连接于至少一个所述的核酸序列,并且其中所述的内含子对所述的核酸序列和/或对所述的启动子序列是异源的。
13.权利要求12所述的重组DNA表达构建体,其中所述其功能性等效物包含内含子的功能性元件并且由如下序列表征,其中所述序列:
1.具有SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述内含子序列的至少50个连续碱基对,或
2.与由SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述序列的跨越至少95个连续核酸碱基对的序列具有至少80%同一性,或
3.在高度严格条件下与SEQ ID NO:1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一个所描述核酸分子中至少50个连续碱基对的核酸片段杂交。
14.权利要求12至13所述的重组DNA表达构建体,还包含与所述启动子功能性连接的一种或多种额外的调节序列。
15.权利要求14所述的重组DNA表达构建体,其中调节序列选自热休克应答元件、厌氧应答元件、病原体应答元件、干旱应答元件、低温应答元件、ABA应答元件、5′-非翻译基因区、3′-非翻译基因区、转录终止子、多腺苷酸化信号和增强子。
16.权利要求12至15中任意一项所述的重组DNA表达构建体,其中所述的核酸编码
i)蛋白质或
ii)有义RNA、反义RNA或双链RNA序列。
17.权利要求12至16中任意一项所述的重组DNA表达构建体,其中所述的核酸序列编码选择标记蛋白质、筛选标记蛋白质、合成活性蛋白质、分解活性蛋白质、抗生物胁迫蛋白质或抗非生物胁迫蛋白质、雄性不育蛋白质或影响植物农学特征的蛋白质。
18.权利要求12至17中任意一项所述的重组DNA表达构建体,其中在植物或植物细胞中有功能的所述启动子序列选自:
a)如SEQ ID NO:113中核苷酸1至854所述的稻叶绿体蛋白12启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
b)如SEQ ID NO:114中核苷酸1至1184所述的玉米羟脯氨酸丰富糖蛋白启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
c)如SEQ ID NO:115中核苷酸1至1034所述的p-咖啡酰辅酶A 3-O-甲基转移酶启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
d)如SEQ ID NO:116中核苷酸1至1440所述的玉米球蛋白-1[ZmGlb1]启动子(W64A),或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
e)如SEQ ID NO:117中核苷酸1至1589所述的推定的稻H+转运ATP合酶启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
f)如SEQ ID NO:118中核苷酸1至796所述的推定的稻C-8,7固醇异构酶启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
g)如SEQ ID NO:119中核苷酸1至1062所述的玉米乳酸脱氢酶启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列,和
h)如SEQ ID NO:121中核苷酸1至1386所述的稻Lea启动子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列。
19.权利要求12至18中任意一项所述的重组DNA表达构建体,其中所述表达构建体包含权利要求18的启动子与选自如下的内含子的组合:
i)如SEQ ID NO:113中核苷酸888至1470所述的BPSI.1内含子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列;和
ii)如SEQ ID NO:120中核苷酸1068至1318所述的BPSI.5内含子,或与所述片段具有至少60%同一性的序列,或在严格条件下与所述片段杂交的序列,或包含所述片段中至少50个连续核苷酸的序列。
20.权利要求12至19中任意一项所述的重组DNA表达构建体,其中所述的表达构建体包含选自如下的启动子与内含子的组合:
i)如SEQ ID NO:113、114、115、116、117、118、119、 120或121中任意一个所描述的序列,和
ii)具有SEQ ID NO:113、114、115、116、117、118、119、120或121中任意一个所描述序列中至少50个连续核苷酸的序列,和
iii)与SEQ ID NO:113、114、115、116、117、118、119、120或121中任意一个所描述序列具有至少60%同一性的序列,和
iv)与SEQ ID NO:113、114、115、116、117、118、119、120或121中任意一个所描述序列在严格条件下杂交的序列。
21.表达载体,包含权利要求12至20中任意一项所述的重组表达构建体。
22.转基因细胞或转基因非人生物,包含如权利要求21的表达载体或权利要求12至20中任意一项所述的表达构建体。
23.权利要求22所述的细胞或非人生物,选自细菌、真菌、酵母和植物。
24.权利要求22或23所述的转基因细胞或非人生物,其中所述的细胞或生物是选自大麦属(Hordeum)、燕麦属(Avena)、黑麦属(Secale)、小麦属(Triticum)、高粱属(Sorghum)、玉蜀黍属(Zea)、甘蔗属(Saccharum)和稻属(Oryza)的单子叶植物细胞或生物。
25.衍生自权利要求22至24所述转基因细胞生物的细胞培养物、部分或繁殖材料。
26.提供用于增强核酸序列在植物或植物细胞中表达的表达盒的方法,包括将如权利要求12至13中所述的至少一个内含子功能性地连接于所述核酸序列的步骤。
27.用于增强核酸序列在植物或植物细胞中表达的方法,包括将如权利要求12至13中所述的至少一个内含子功能性地连接于所述核酸序列。
28.如权利要求26至27所述的方法,其中在植物中有功能的启动子序列还与所述的核酸序列连接。
29.如权利要求26至27所述的方法,其中内含子经同源重组插入植物基因组DNA内而与所述核酸序列连接。
30.权利要求26至29中任意一项所述的方法,其中所述的植物或植物细胞是单子叶植物或植物细胞。
31.权利要求26至30所述的方法,其中所述的核酸编码如权利要求17中所述的蛋白质或有义RNA、反义RNA或双链RNA。
32.如权利要求22至24所述的转基因生物或从其中衍生的如权利要求25所述的细胞培养物、部分或转基因繁殖材料的用途,用于产生食品、动物饲料、种子、药物或精细化学品。
33.重组DNA表达构建体,包含:
a)至少一个在植物或植物细胞中有功能的启动子序列,和
b)具有在植物或植物细胞中增强表达特性的至少一个内含子,其具有至少如下特征:
I)内含子长度短于1000碱基对,并且
II)存在包含二核苷酸序列5′-GT-3′(SEQ ID NO:78)的5′剪接位点,并且
III)存在包含三核苷酸序列5′-CAG-3′(SEQ ID NO:79)的3′剪接位点,并且
IV)在3′剪接位点的上游存在类似于共有核苷酸序列5′-CURAY-3′(SEQ ID NO:75)的分支点,并且
V)从5′剪接位点向下游100个核苷酸范围至少40%的腺嘌呤加胸腺嘧啶含量,并且
VI)从3′剪接位点向上游100个核苷酸范围至少50%的腺嘌呤加胸腺嘧啶含量,并且
VII)整个内含子范围至少55%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。
c)至少一个核酸序列,
其中所述启动子序列和至少一个所述内含子序列功能性地连接于所述核酸序列,并且其中所述内含子对所述核酸序列和/或对所述启动子序列是异源的。
CN2006800076447A 2005-03-08 2006-03-07 增强表达的内含子序列 Expired - Fee Related CN101137752B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US65948205P 2005-03-08 2005-03-08
US60/659,482 2005-03-08
PCT/EP2006/060513 WO2006094976A2 (en) 2005-03-08 2006-03-07 Expression enhancing intron sequences

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201210405556XA Division CN102925479A (zh) 2005-03-08 2006-03-07 增强表达的内含子序列

Publications (2)

Publication Number Publication Date
CN101137752A true CN101137752A (zh) 2008-03-05
CN101137752B CN101137752B (zh) 2013-04-03

Family

ID=36593798

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2006800076447A Expired - Fee Related CN101137752B (zh) 2005-03-08 2006-03-07 增强表达的内含子序列
CN201210405556XA Pending CN102925479A (zh) 2005-03-08 2006-03-07 增强表达的内含子序列

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201210405556XA Pending CN102925479A (zh) 2005-03-08 2006-03-07 增强表达的内含子序列

Country Status (9)

Country Link
US (3) US8088971B2 (zh)
EP (7) EP2045327B8 (zh)
CN (2) CN101137752B (zh)
AT (1) ATE541043T1 (zh)
AU (1) AU2006222012B2 (zh)
BR (1) BRPI0609283A2 (zh)
CA (1) CA2599405A1 (zh)
WO (1) WO2006094976A2 (zh)
ZA (1) ZA200708512B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102154289A (zh) * 2011-01-11 2011-08-17 吉林大学 玉米干旱诱导型基因启动子及活性分析
CN104160020A (zh) * 2011-10-19 2014-11-19 麻省理工学院 工程改造的微生物及用于微生物油生产的方法
CN105683382A (zh) * 2013-08-30 2016-06-15 美国陶氏益农公司 利用来自短柄草属泛素1c基因的调节元件的转基因表达用构建体
CN106947762A (zh) * 2009-08-31 2017-07-14 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN109661469A (zh) * 2016-04-13 2019-04-19 巴斯夫农业种子解决方案美国有限责任公司 种子优选性和珠柄优选性启动子及其用途
CN111534538A (zh) * 2020-05-11 2020-08-14 山西大学 一种快速筛选非转基因定点突变植物的方法

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101023175B (zh) 2004-04-20 2012-02-29 辛根塔参与股份公司 用于在植物繁殖组织中表达基因产物的调控序列
EP2422615B1 (en) 2005-07-29 2014-06-18 Targeted Growth, Inc. Dominant negative mutant krp protein protection of active cyclin-cdk complex inhibition by wild-type krp
EP2843053A1 (en) 2006-02-17 2015-03-04 Monsanto Technology LLC Chimeric regulatory sequences comprising introns for plant gene expression
CN101631868B (zh) * 2007-02-16 2016-02-10 巴斯福植物科学有限公司 用于在单子叶植物中调节胚特异性表达的核酸序列
US8832581B2 (en) * 2009-03-05 2014-09-09 Ming Zhang Gene expression browser for web-based search and visualization of characteristics of gene expression
US10519458B2 (en) 2009-04-22 2019-12-31 Basf Plant Science Company Gmbh Whole seed specific promoter
ES2736037T3 (es) * 2010-01-14 2019-12-23 Monsanto Technology Llc Elementos reguladores de las plantas y usos de los mismos
EP2580334A1 (en) * 2010-06-09 2013-04-17 E.I. Du Pont De Nemours And Company Regulatory sequences for modulating transgene expression in plants
US20120131698A1 (en) * 2010-11-12 2012-05-24 Targetd Growth, Inc. Dominant Negative Mutant Kip-Related Proteins (KRP) in Zea Mays and Methods of Their Use
CN103429740B (zh) 2011-03-18 2016-06-15 巴斯夫植物科学有限公司 用于调节在植物中的表达的启动子
WO2012142116A2 (en) 2011-04-11 2012-10-18 Targeted Growth, Inc. Identification and use of krp mutants in wheat
RU2631790C2 (ru) 2011-04-11 2017-09-26 Таргетед Гроус, Инк. Идентификация и применение мутантных krp у растений
WO2014004638A2 (en) * 2012-06-29 2014-01-03 Monsanto Technology Llc Methods and compositions for enhancing gene expression
CN105473605A (zh) 2013-03-15 2016-04-06 先锋国际良种公司 Phi-4多肽及其使用方法
MX359026B (es) 2013-08-16 2018-09-12 Pioneer Hi Bred Int Proteinas insecticidas y metodos de uso.
BR122020001770B1 (pt) 2013-09-13 2022-11-29 Pioneer Hi-Bred International, Inc Construto de dna, método de obtenção de planta transgênica, proteína de fusão, método para controlar uma população de praga de inseto, método para inibir o crescimento ou matar uma praga de inseto
CN103555716B (zh) * 2013-11-06 2016-01-20 北京大北农科技集团股份有限公司 增强表达的内含子序列及其用途
RU2747978C2 (ru) 2014-02-07 2021-05-18 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
BR112016018103B1 (pt) 2014-02-07 2024-01-16 E.I. Du Pont De Nemours And Company Polipeptídeo e seu uso, polinucleotídeo, composição, proteína de fusão, método para controlar uma população, método para inibir o crescimento, método para controlar a infestação, método para obtenção de uma planta ou célula vegetal, construto
CN104318131A (zh) * 2014-10-11 2015-01-28 中国农业科学院棉花研究所 电子fish的方法
CN113372421A (zh) 2014-10-16 2021-09-10 先锋国际良种公司 杀昆虫蛋白及其使用方法
BR112017019419B1 (pt) 2015-03-11 2022-10-11 E. I. Du Pont De Nemours And Company Construto de dna, método de obtenção de uma planta transgênica e método para controlar uma população de praga de verme da raiz do milho
CN108064233B (zh) 2015-05-19 2022-07-15 先锋国际良种公司 杀昆虫蛋白及其使用方法
UA124495C2 (uk) 2015-08-06 2021-09-29 Піонір Хай-Бред Інтернешнл, Інк. Інсектицидний білок рослинного походження та спосіб його застосування
EP3390431A1 (en) 2015-12-18 2018-10-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US11008585B2 (en) 2016-05-04 2021-05-18 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CA3026113A1 (en) 2016-07-01 2018-01-04 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
US11174295B2 (en) 2016-12-14 2021-11-16 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US11213028B2 (en) 2016-12-22 2022-01-04 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CA3052794A1 (en) 2017-02-08 2018-08-16 Pioneer Hi-Bred International, Inc. Insecticidal combinations of plant derived insecticidal proteins and methods for their use
US11555203B2 (en) 2017-05-11 2023-01-17 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2019165128A1 (en) * 2018-02-21 2019-08-29 Nemametrix Inc. Transgenic animal phenotyping platform and uses thereof
EP3759489A1 (en) 2018-03-02 2021-01-06 Pioneer Hi-Bred International, Inc. Plant health assay
EP3768845A1 (en) 2018-03-23 2021-01-27 Pioneer Hi-Bred International, Inc. Methods of identifying, selecting, and producing disease resistant crops
CN111988988A (zh) 2018-04-18 2020-11-24 先锋国际良种公司 鉴定、选择和产生抗白叶枯病水稻的方法
CN108546670A (zh) * 2018-04-19 2018-09-18 贵州大学 一种高粱原生质体的制备方法及制备的原生质体的转化方法
CN108642064B (zh) * 2018-05-21 2021-11-26 安徽农业大学 小麦种子休眠持续期基因TaCNGC-2A及其功能标记
WO2019236257A1 (en) 2018-06-06 2019-12-12 Huazhong Agricultural University Methods of identifying, selecting, and producing southern corn rust resistant crops
WO2020025357A1 (en) * 2018-08-02 2020-02-06 Novozymes A/S Preparation of combinatorial libraries of dna constructs using introns
US11878999B2 (en) 2018-08-29 2024-01-23 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2021041077A1 (en) 2019-08-23 2021-03-04 Pioneer Hi-Bred International, Inc. Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
US20230203515A1 (en) * 2019-09-12 2023-06-29 Basf Se Regulatory Nucleic Acid Molecules for Enhancing Gene Expression in Plants
CN111153974A (zh) 2020-01-15 2020-05-15 华中农业大学 玉米抗病基因和分子标记及其应用
BR112022020714A2 (pt) 2020-04-15 2022-12-20 Pioneer Hi Bred Int Identificação de gene efetor de patógeno vegetal e de resistência à doença, composições e métodos de uso
EP4182466A2 (en) 2020-07-14 2023-05-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN113046373A (zh) * 2021-03-24 2021-06-29 中国热带农业科学院热带生物技术研究所 甘蔗UDP-糖基转移酶基因ShUGT2及其应用
CN115216554A (zh) 2021-04-16 2022-10-21 华中农业大学 植物病原体效应子和疾病抗性基因鉴定、组合物和使用方法
CN113462690B (zh) * 2021-07-02 2022-06-21 河南大学 大豆基因启动子pRPS28和pRPS28-I在大豆、拟南芥及烟草中的应用
EP4380352A1 (en) 2021-08-06 2024-06-12 KWS Vegetables B.V. Durable downy mildew resistance in spinach
CN114875025B (zh) * 2022-03-25 2023-09-19 广东省科学院南繁种业研究所 一种干旱、aba诱导型启动子pscbv-yz2060及其应用
WO2023250325A1 (en) * 2022-06-21 2023-12-28 The Regents Of The University Of California Compositions and methods for treating huntington's disease

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1322245A (zh) * 1999-09-27 2001-11-14 日本烟草产业株式会社 核酸片段、含该片段的重组载体以及使用该片段促使结构基因的表达方法

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US695A (en) 1838-04-16 Improved water-wheel
US5527A (en) 1848-04-25 Ship s windlass
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
EP0131623B2 (en) 1983-01-17 1999-07-28 Monsanto Company Chimeric genes suitable for expression in plant cells
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5290924A (en) 1987-02-06 1994-03-01 Last David I Recombinant promoter for gene expression in monocotyledonous plants
US5525464A (en) 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
US5202231A (en) 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
EP0397687B1 (en) 1987-12-21 1994-05-11 The University Of Toledo Agrobacterium mediated transformation of germinating plant seeds
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
KR920701453A (ko) 1989-03-17 1992-08-11 미리엄 디. 멕코나헤이 유전자발현의 외부조절
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
EP0814166A3 (en) 1989-08-09 1998-05-13 DeKalb Genetics Corporation Methods and compositions for the production of stably transformed fertile monocot plants and cells thereof
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
WO1991013980A1 (en) 1990-03-16 1991-09-19 Calgene, Inc. Novel sequences preferentially expressed in early seed development and methods related thereto
ES2149758T3 (es) * 1990-05-18 2000-11-16 Mycogen Plant Science Inc Promotor recombinante para la expresion de genes en monocotiledoneas.
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
DK152291D0 (da) 1991-08-28 1991-08-28 Danisco Fremgangsmaade og kemiske forbindelser
CA2127461A1 (en) 1992-01-13 1993-07-22 Michael D. Been Enzymatic rna molecules
IL101119A0 (en) 1992-03-03 1992-11-15 Univ Ramot Transgenic wheat
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
ES2164659T3 (es) 1992-04-13 2002-03-01 Syngenta Ltd Construcciones de dna y plantas que las incorporan.
WO1994000583A1 (en) 1992-06-23 1994-01-06 South Dakota State University Transformation of plants by direct injection of dna
DE69334225D1 (de) 1992-07-07 2008-07-31 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
US5527695A (en) 1993-01-29 1996-06-18 Purdue Research Foundation Controlled modification of eukaryotic genomes
BR9408093A (pt) 1993-11-19 1997-08-12 Biotechnology Res & Dev Região reguladora quimérica para expressar genes em plantas cassete para expressão de um gene cassete para expressão induzível de um gene estranho processo para expressar um gene em uma planta plasmideo processo para expressão induzível de um gene estranho em uma planta processo para expressão induzível de um gene estranho em uma planta plasmídeo e planta transgênica
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
EP0733059B1 (en) 1993-12-09 2000-09-13 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
CA2158733C (en) 1994-01-21 2007-01-16 Dennis E. Mccabe Gas driven gene delivery instrument
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
EP0769553B1 (en) 1995-03-29 2007-04-25 Japan Tobacco Inc. Dna fragment, recombination vector containing the same, and method of the expression of alien gene with the use of the same
AU717055B2 (en) 1995-07-05 2000-03-16 Sapporo Breweries Limited Tissue-specific promoter
GB9516241D0 (en) 1995-08-08 1995-10-11 Zeneca Ltd Dna constructs
AU703838B2 (en) 1995-08-10 1999-04-01 Rutgers University Nuclear-encoded transcription system in plastids of higher plants
ATE329047T1 (de) 1995-08-30 2006-06-15 Basf Plant Science Gmbh Stimulierung der homologen rekombination in pflanzlichen organismen mittels rekombinations fördernder enzyme
US5879941A (en) 1995-10-06 1999-03-09 University Of Florida Polypeptides and polynucleotides relating to the α-and β-subunits of a glutamate dehydrogenase and methods of use
WO1997013843A1 (en) 1995-10-12 1997-04-17 Cornell Research Foundation, Inc. Production of water stress or salt stress tolerant transgenic cereal plants
AR006928A1 (es) 1996-05-01 1999-09-29 Pioneer Hi Bred Int Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas.
IN1997CH00924A (en) 1996-05-03 2005-03-04 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate
DE19619353A1 (de) 1996-05-14 1997-11-20 Bosch Gmbh Robert Verfahren zur Herstellung eines integriert optischen Wellenleiterbauteiles sowie Anordnung
CZ86798A3 (cs) 1996-06-21 1999-03-17 Monsanto Company Fertilní transgenní rostlina pšenice, způsob její přípravy, buňky a semena této rostliny
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
US6420629B1 (en) 1996-09-09 2002-07-16 B.C. Research Inc. Process of increasing plant growth and yield and modifying cellulose production in plants
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
AU5898298A (en) 1996-12-13 1998-07-03 General Hospital Corporation, The Stress-protected transgenic plants
US6309824B1 (en) 1997-01-16 2001-10-30 Hyseq, Inc. Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
EP0870836A1 (de) 1997-04-09 1998-10-14 IPK Gatersleben 2-Desoxyglucose-6-Phosphat (2-DOG-6-P) Phosphatase DNA-Sequenzen als Selektionsmarker in Pflanzen
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
AU738098B2 (en) 1997-05-02 2001-09-06 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate by inhibiting endogenous trehalase levels
ZA986308B (en) 1997-07-18 1999-11-24 Pioneer Hi Bred Int The induction of stress-related factors in plants.
WO1999005902A1 (en) 1997-07-30 1999-02-11 Purdue Research Foundation Transgenic plants tolerant of salinity stress
IL134267A0 (en) 1997-08-01 2001-04-30 Performance Plants Inc Stress tolerance and delayed senescence in plants
US6642437B1 (en) 1997-09-30 2003-11-04 The Regents Of The University Of California Production of proteins in plant seeds
ZA989497B (en) 1997-10-20 2000-04-19 Roche Diagnostics Gmbh Positive-negative selection in homologous recombination.
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
BR9908624A (pt) 1998-03-11 2000-11-14 Novartis Ag Sequência de promotor de plastìdio de planta
EP3214177A3 (en) 1998-04-08 2017-11-22 Commonwealth Scientific and Industrial Research Organisation Methods and means for obtaining modified phenotypes
US6429293B1 (en) 1998-06-26 2002-08-06 Hsc Research And Development Limited Partnership Sculpin-type antifreeze polypeptides and nucleic acids
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
WO2000026192A1 (de) 1998-11-03 2000-05-11 Basf Aktiengesellschaft Substituierte 2-phenylbenzimidazole, deren herstellung und anwendung
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
SI1131301T1 (sl) 1998-11-17 2006-02-28 Abbott Gmbh & Co Kg 2-fenilbenzimidazoli in 2-fenilindoli, njihova priprava in uporaba
PL196367B1 (pl) 1998-11-27 2007-12-31 Basf Ag Podstawione benzimidazole, ich zastosowanie jako inhibitorów PARP oraz środek leczniczy
WO2000044914A1 (en) 1999-01-28 2000-08-03 Medical College Of Georgia Research Institute, Inc. Composition and method for in vivo and in vitro attenuation of gene expression using double stranded rna
DE19956568A1 (de) 1999-01-30 2000-08-17 Roland Kreutzer Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens
AU3369900A (en) 1999-02-19 2000-09-04 General Hospital Corporation, The Gene silencing
WO2000050561A2 (en) 1999-02-23 2000-08-31 Health Research Inc. CaESS1: A CANDIDA ALBICANS GENE, METHODS OF MAKING AND USE
JP2002541853A (ja) 1999-04-19 2002-12-10 ロビオ 植物の形質転換方法
CN1375004A (zh) 1999-04-21 2002-10-16 惠氏公司 抑制多核苷酸序列的功能的方法和组合物
DE19918211A1 (de) 1999-04-22 2000-10-26 Basf Ag Cycloalkylsubstituierte Benzimidazole, deren Herstellung und Anwendung
DE19920936A1 (de) 1999-05-07 2000-11-09 Basf Ag Heterozyklisch substituierte Benzimidazole, deren Herstellung und Anwendung
IL145538A0 (en) 1999-05-10 2002-06-30 Syngenta Participations Ag Regulation of viral gene expression
DE19921567A1 (de) 1999-05-11 2000-11-16 Basf Ag Verwendung von Phthalazine-Derivaten
CA2378107A1 (en) 1999-07-23 2001-02-01 Wisconsin Alumni Research Foundation <i>arabidopsis thaliana</i> cyclic nucleotide-gated ion channel/<i>dnd</i> genes; regulators of plant disease resistance and cell death
AU780117B2 (en) 1999-08-26 2005-03-03 Basf Plant Science Gmbh Plant gene expression, controlled by constitutive plant V-ATpase promoters
DE19946289A1 (de) 1999-09-28 2001-03-29 Basf Ag Benzodiazepin-Derivate, deren Herstellung und Anwendung
AU1271201A (en) 1999-09-28 2001-04-30 Basf Aktiengesellschaft Azepinoindole derivatives, the production and use thereof
WO2001038504A2 (en) 1999-11-23 2001-05-31 Maxygen, Inc. Homologous recombination in plants
US6569681B1 (en) 2000-03-14 2003-05-27 Transkaryotic Therapies, Inc. Methods of improving homologous recombination
EP1149915A1 (en) * 2000-04-28 2001-10-31 Frommer, Wolf-Bernd Modification of gene expression in transgenic plants
ATE412758T1 (de) 2000-06-28 2008-11-15 Sungene Gmbh & Co Kgaa Binärvektoren zur verbesserten transformation von pflanzlichen systemen
CN1473198A (zh) 2000-09-05 2004-02-04 ��Ъ������ѧ����ίԱ�� 植物中富含丁香基的木质素的遗传工程
GB0201043D0 (en) 2002-01-17 2002-03-06 Swetree Genomics Ab Plants methods and means
GB0201686D0 (en) * 2002-01-25 2002-03-13 Dca Design Consultants Ltd Improvements in and relating to a medicament delivery device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1322245A (zh) * 1999-09-27 2001-11-14 日本烟草产业株式会社 核酸片段、含该片段的重组载体以及使用该片段促使结构基因的表达方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALAN B. ROSE ET AL: "Intron-Mediated Enhancement of Gene Expression Independent of Unique Intron Sequences and Splicing", 《PLANT PHYSIOLOGY》 *
KENNETH R. LUEHRSEN AND VIRGINIA WALBOT: "Intron enhancement of gene expression and the splicing efficiency of introns in maize cells", 《MOL GEN GENET》 *
NIKKI RETHMEIER ET AL: "Intron-mediated enhancement of transgene expression in maize is a nuclear, gene-dependent process", 《THE PLANT JOURNAL》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106947762A (zh) * 2009-08-31 2017-07-14 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN106947762B (zh) * 2009-08-31 2020-06-23 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN102154289A (zh) * 2011-01-11 2011-08-17 吉林大学 玉米干旱诱导型基因启动子及活性分析
CN102154289B (zh) * 2011-01-11 2012-08-22 吉林大学 玉米干旱诱导型基因启动子及活性分析
CN104160020A (zh) * 2011-10-19 2014-11-19 麻省理工学院 工程改造的微生物及用于微生物油生产的方法
US9862977B2 (en) 2011-10-19 2018-01-09 Massachusetts Institute Of Technology Engineered microbes and methods for microbial oil production
CN109468241A (zh) * 2011-10-19 2019-03-15 麻省理工学院 工程改造的微生物及用于微生物油生产的方法
CN105683382A (zh) * 2013-08-30 2016-06-15 美国陶氏益农公司 利用来自短柄草属泛素1c基因的调节元件的转基因表达用构建体
CN105705644A (zh) * 2013-08-30 2016-06-22 美国陶氏益农公司 利用来自狗尾草属泛素基因的调节元件的转基因表达用构建体
CN106414746A (zh) * 2013-08-30 2017-02-15 美国陶氏益农公司 利用来自短柄草属泛素基因的调节元件的转基因表达用构建体
CN109661469A (zh) * 2016-04-13 2019-04-19 巴斯夫农业种子解决方案美国有限责任公司 种子优选性和珠柄优选性启动子及其用途
CN111534538A (zh) * 2020-05-11 2020-08-14 山西大学 一种快速筛选非转基因定点突变植物的方法

Also Published As

Publication number Publication date
EP2169058B1 (en) 2013-01-23
EP2166099A9 (en) 2011-10-19
EP2166100A2 (en) 2010-03-24
EP2166099A3 (en) 2011-06-29
AU2006222012A1 (en) 2006-09-14
EP1859037A2 (en) 2007-11-28
US20140237683A1 (en) 2014-08-21
AU2006222012B2 (en) 2011-03-31
WO2006094976A2 (en) 2006-09-14
EP2166100A9 (en) 2011-10-19
EP2166099B1 (en) 2012-12-19
EP2166100A3 (en) 2011-06-29
EP2166102A9 (en) 2011-10-19
CA2599405A1 (en) 2006-09-14
ZA200708512B (en) 2009-01-28
EP2045327A2 (en) 2009-04-08
EP2169058A2 (en) 2010-03-31
EP2166101A2 (en) 2010-03-24
EP2166101A3 (en) 2011-07-06
EP2045327A3 (en) 2010-08-04
EP2045327B1 (en) 2012-01-11
EP2166102A3 (en) 2011-07-06
EP2045327B8 (en) 2012-03-14
BRPI0609283A2 (pt) 2010-11-23
EP2166099A2 (en) 2010-03-24
US20120054922A1 (en) 2012-03-01
EP2166102B1 (en) 2012-12-19
EP2169058A3 (en) 2011-07-27
EP2166100B1 (en) 2012-07-18
US8759506B2 (en) 2014-06-24
US8088971B2 (en) 2012-01-03
EP2166102A2 (en) 2010-03-24
CN102925479A (zh) 2013-02-13
US20090144863A1 (en) 2009-06-04
CN101137752B (zh) 2013-04-03
WO2006094976A3 (en) 2006-12-28
EP2166101B1 (en) 2012-12-19
EP2166101A9 (en) 2011-10-19
ATE541043T1 (de) 2012-01-15
EP2169058A9 (en) 2011-10-19

Similar Documents

Publication Publication Date Title
CN101137752B (zh) 增强表达的内含子序列
AU2006212223B2 (en) Expression cassettes for regulation of expression in monocotyledonous plants
EP1723241B1 (en) Transgenic expression constructs for vegetative plant tissue specific expression of nucleic acids
AU2006237346A1 (en) Expression cassettes for seed-preferential expression in plants
AU2011202966B2 (en) Expression enhancing intron sequences
CA2521207C (en) Expression cassettes for guard cell-specific expression in plants
AU2011205193B2 (en) Expression cassettes for regulation of expression in monocotyledonous plants

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130403

Termination date: 20150307

EXPY Termination of patent right or utility model