CN1950510B - 富含谷氨酰胺的玉米种子蛋白质和启动子 - Google Patents

富含谷氨酰胺的玉米种子蛋白质和启动子 Download PDF

Info

Publication number
CN1950510B
CN1950510B CN2005800074593A CN200580007459A CN1950510B CN 1950510 B CN1950510 B CN 1950510B CN 2005800074593 A CN2005800074593 A CN 2005800074593A CN 200580007459 A CN200580007459 A CN 200580007459A CN 1950510 B CN1950510 B CN 1950510B
Authority
CN
China
Prior art keywords
sequence
nucleotide sequence
gln
polypeptide
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005800074593A
Other languages
English (en)
Other versions
CN1950510A (zh
Inventor
斯科特·贝茨
戴尔·韦恩·斯卡拉
桑德拉·琳恩·福尔拉特
科恩·亨德里克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1950510A publication Critical patent/CN1950510A/zh
Application granted granted Critical
Publication of CN1950510B publication Critical patent/CN1950510B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8221Transit peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm

Abstract

本发明提供了编码55kDa玉米醇溶蛋白家族蛋白质的核苷酸序列。本发明也提供了可用于在植物内表达异源序列的、源自55kDa玉米基因的启动子的核苷酸序列,以及利用所述核苷酸序列的方法。

Description

富含谷氨酰胺的玉米种子蛋白质和启动子
与相关申请的相互引用
本申请要求在2004年3月8日提交的美国临时专利申请No.60/551,286的优先权,通过引用将其全部内容并入本申请。
技术领域
本发明大体上涉及从玉蜀黍(Zeamays)中分离出的核酸。更具体地,本发明涉及编码玉蜀黍的谷类种子储存蛋白的谷醇溶蛋白家族成员的核苷酸序列,以及涉及所述谷醇溶蛋白家族成员的启动子的核苷酸序列。本发明也提供了在转基因植物中使用所述核酸分子的方法。
缩写表
2,4-D       -    2t4-二氯苯氧乙酸
AMV         -    苜蓿花叶病毒
β-ME       -    β-巯基乙醇
BiP         -    人免疫球蛋白重链结合多肽
bp          -    碱基对
CAB         -    叶绿素a/b结合
CaMV        -    花椰菜花叶病毒
CDPK        -    玉米钙依赖性蛋白激酶
cM          -    厘摩
CMV         -    巨细胞病毒
DEAE        -    二乙基氨乙基
DHFR        -    二氢叶酸还原酶
DTT        -    二硫苏糖醇
EDTA       -    乙二胺四乙酸
ELISA      -    酶联免疫吸附检测法
EMCV       -    脑炎心肌炎病毒
EPSP       -    5-烯醇-丙酮酰莽草酸-3-磷酸
(5-enol-pyruvyl shikimate-3-phosphate)
ER         -    内质网
EST        -    表达序列标记
GUS        -    β-葡糖苷酸酶
HEPES      -    N-(2-羟乙基)哌嗪-N'-(2-甲磺酸)
HSPs       -    高积分序列对
HSV-tk     -    单纯疱疹病毒胸苷激酶
kb         -    千碱基
kcat       -    催化常数
kDa        -    千道尔顿
km         -    米氏常数
MCMV       -    玉米萎黄病斑点病毒
MDMV       -    玉米矮花叶病毒
MTL        -    金属硫蛋白样
ORF        -    开放阅读框
PAGE       -    聚丙烯酰胺凝胶电泳
PEG        -    聚乙二醇
PEPC       -    磷酸烯醇羧化酶
pgk        -    磷酸甘油酸激酶
Protox     -    原卟啉原氧化酶
psi        -    磅/平方英寸
RFLPs      -    限制性片段长度多态性
RUBISCO        -    核酮糖-1,5-二磷酸羧化酶/氧合酶
SDS            -    十二烷基硫酸钠
SDS-PAGE       -    十二烷基硫酸钠聚丙烯酰胺凝胶电泳
SSC            -    标准盐枸橼酸
SSPE           -    标准盐-磷酸-EDTA
TEV            -    烟草蚀纹病毒
Tm             -    热熔点
TMTD           -    二硫四甲基秋兰姆
TMV            -    烟草花叶病毒
氨基酸缩写、密码子和功能等价密码子
氨基酸       3字母   1字母      密码子
丙氨酸       Ala      A         GCA;GCC;GCG;GCU
精氨酸       Arg      R         AGA;AGG;CGA;CGC;CGG;CGU
天冬酰胺     Asn      N         AAC;AAU
天冬氨酸     Asp      D         GAC;GAU
半胱氨酸     Cys      C         UGC;UGU
谷氨酸       Glu      E         GAA;GAG
谷氨酰胺     Gln      Q         CAA;CAG
甘氨酸       Gly      G         GGA;GGC;GGG;GGU
组氨酸       His      H         CAC;CAU
异亮氨酸     Ile      I         AUA;AUC;AUU
亮氨酸       Leu      L         UUA;UUG;CUA;CUC;CUG;CUU
赖氨酸       Lys      K         AAA;AAG
甲硫氨酸     Met      M         AUG
苯丙氨酸     Phe      F         UUC;UUU
脯氨酸       Pro      P         CCA;CCC;CCG;CCU
丝氨酸      Ser      S        ACG;AGU;UCA;UCC;UCG;UCU
苏氨酸      Thr      T        ACA;ACC;ACG;ACU
色氨酸      Trp      W        UGG
酪氨酸      Tyr      Y        UAC;UAU
缬氨酸      Val      V        GUA;GUC;GUG;GUU
背景技术
农作物性状的功能基因组学的一个目的是鉴定相关的农作物性状基因,例如能给农作物植物提供有用的农学性状的基因。这些农学性状包括,但不限定于,增加产量(不论是数量或质量方面的产量)、增加养分摄取和代谢效率、增加或变更用于食品、饲料、纤维、或加工的植物组织中的营养组分、增加用于农业或工业加工的实用性、增强对植物疾病的抗性、增强对不良环境条件的耐受性(不良环境条件包括但不限定于干旱、过冷、过热、或土壤盐分过量或极酸或极碱的环境)、植物构造或发育的变更(发育时相的变化)。通过转基因或非转基因方法对这些所鉴定的性状基因的配置(deployment)可以大大地提高农作物植物在农业方面的益处。
对于人类和动物的消费量而言,谷类植物是植物中最为重要的农作物植物。在水稻、玉米、小麦、大麦、黑麦、燕麦和其他农业上重要的单子叶植物(包括蜀黍)中都观察到了基因组同线性(大染色体片段内的基因序列的保守性)(见例如Kellogg,1998;Songetal.,2001,在此将其引用),这有助于依据单个谷类基因的序列从不同的谷类物种中绘制并分离出定向进化同源基因。在谷类物种中,水稻具有最小的基因组(约420Mb),最近它已经成为了公共的和私人的基因组和EST测序工作的重点,见Goffetal.,2002。
对在谷类植物发育中具有重要作用的基因的鉴定是目前农业工作者的工作重点。其他的信息也可以来源于对各种重要植物的基因组的分析。例如,对控制基因表达的调节元件的鉴定也可以造成控制植物基因组在特殊组织中表达相关多肽的能力。具体地,某些植物正成为被选定用于大规模生产商业上重要的蛋白(例如酶)的生物体。这个策略具有的优点是胚乳细胞在种子发育过程中合成了大量的玉米醇溶蛋白家族的储存蛋白的事实,所述储存蛋白存积在称作蛋白体的结构内,所述蛋白体源自于内质网。这些蛋白体与在谷类植物的湿磨中所产生的谷蛋白(gluten)部分共分镏(cofractionate)。因此存在着生成大量的与谷蛋白相关形式的重组酶的可能,或者存在着在从谷蛋白相关的或固定的状态中释放出重组酶活性之后,生成大量的更加纯化形式的重组酶的可能。
所需的是用于在植物细胞中表达异源核苷酸序列的新方法和试剂。为了满足这些需要,在一些实施方式中,本发明提供了用于在植物细胞中直接表达异源核苷酸序列的启动子序列。也提供了利用所述启动子在植物细胞中表达异源核苷酸序列的方法。
本发明针对这些与在转基因植物中表达核苷酸序列相关的问题以及其他问题。
发明内容
本发明内容给出了本发明的一些实施方式,以及在多种情况中,给出了这些实施方式的变异和变更。本发明内容只是很多的和不同的实施方式的示例。所提及的给定实施方式的一个或多个代表性的特点同样也是示例的。这样一个实施方式通常可以具有或不具有所提及的特点;同样,这些特点也可以被施用于本发明的其他实施方式中。为了避免过多的重复,本发明内容没有罗列或提示这些特点的所有可能的组合。
本发明提供了用于在植物中表达核苷酸序列的方法。在一些实施方式中,方法包括(a)将核苷酸序列可操纵地连接于包括SEQIDNO:6的启动子,以产生表达盒;和(b)生成包括表达盒的转基因植物,由此在植物中表达所述核苷酸。在一些实施方式中,所述生成包括用表达盒转化植物细胞并从所转化的植物细胞中再生出植物。在一些实施方式中,所述生成包括将核苷酸序列同源重组到处于包括SEQIDNO:6的启动子控制下的内源性基因座内。在一些实施方式中,通过包括表达盒的载体的生物弹射击法转化(Biolistictransformation)而进行所述转化。在一些实施方式中,载体是二元土壤杆菌表达载体。
在一些实施方式中,核苷酸序列表达多肽,所述多肽选自由糖酶、纤维素酶、半纤维素酶、果胶酶、异构酶、裂合酶、蛋白酶、热休克蛋白、伴侣蛋白、植酸酶、杀虫蛋白、抗微生物蛋白、α-淀粉酶、葡萄糖淀粉酶、葡聚糖酶、葡糖苷酶、木聚糖酶、阿魏酸酯酶、半乳糖苷酶、果胶酶和凝乳酶构成的组。
本发明也提供了用于在植物中表达核苷酸序列的方法。在一些实施方式中,方法包括(a)将核苷酸序列可操纵地连接于包括SEQIDNO:1的启动子,以产生表达盒;和(b)生成包括表达盒的转基因植物,由此在植物中表达所述核苷酸。在一些实施方式中,所述生成包括用表达盒转化植物细胞并从所转化的植物细胞中再生出植物。在一些实施方式中,通过包括表达盒的载体的生物弹射击法转化而进行所述转化。在一些实施方式中,载体是二元土壤杆菌表达载体。
本发明也提供了用于在植物中产生异源多肽的方法。在一些实施方式中,方法包括(a)生成包括与SEQIDNO:6可操纵地连接的编码异源多肽的核苷酸的植物细胞;和(b)在植物细胞内表达编码异源多肽的核苷酸序列,其中在植物细胞内产生异源多肽。在一些实施方式中,所述生成包括用包括编码异源多肽的核苷酸序列的表达盒转化植物细胞。在一些实施方式中,所述生成包括将核苷酸序列同源重组到处于包括SEQIDNO:6的启动子控制下的内源性基因座内,由此核苷酸序列成为与SEQIDNO:6可操纵地连接。在一些实施方式中,通过包括表达盒的载体的生物弹射击法转化而进行所述转化。在一些实施方式中,载体是二元土壤杆菌表达载体。在一些实施方式中,本方法还包括从植物细胞中再生出植物。在一些实施方式中,本发明还包括从植物中分离所述多肽。在一些实施方式中,多肽位于植物细胞的内质网的蛋白体内。
本发明的方法和组合物可以被用于在植物细胞中产生相关的异源多肽。在一些实施方式中,核苷酸序列编码多肽,所述多肽选自由糖酶、纤维素酶、半纤维素酶、果胶酶、异构酶、裂合酶、蛋白酶、热休克蛋白、伴侣蛋白、植酸酶、杀虫蛋白、抗微生物蛋白、α-淀粉酶、葡萄糖淀粉酶、葡聚糖酶、葡糖苷酶、木聚糖酶、阿魏酸酯酶、半乳糖苷酶、果胶酶和凝乳酶所构成的组。
本发明也提供了用于将感兴趣的蛋白质导向植物细胞内的结构的方法,所述结构选自由内质网(ER)和质外体(apoplast)构成的组。在一些实施方式中,方法包括(a)将编码玉蜀黍Q蛋白的信号序列的核酸分子与编码感兴趣的蛋白质的核苷酸序列框内融合,其中编码玉蜀黍Q蛋白的信号序列的核酸分子以及编码感兴趣的蛋白质的核苷酸序列可操纵地连接于启动子,以产生植物表达构建体;和(b)用植物表达构建体转化植物细胞,由此将感兴趣的蛋白质导向所述结构。
本发明也提供了用于生产营养价值增高的植物种子的方法。在一些实施方式中,方法包括(a)用包括编码SEQIDNO:2的核苷酸序列、或其片段或衍生物的表达载体转化植物细胞;(b)从转化植物细胞中再生出植物;和(c)从再生植物中分离出种子,其中生成了营养价值增高的种子。在一些实施方式中,当与相同物种的未转化植物的种子比较时,营养价值增高选自由增加必需氨基酸的水平、氨基酸平衡改善、和氨基酸可消化性提高所构成的组。
本发明也提供了用于将感兴趣的蛋白质导向植物内的蛋白体的方法。在一些实施方式中,方法包括(a)将编码SEQIDNO:2的核苷酸序列、或其片段或衍生物的核酸分子与编码感兴趣的蛋白质的核苷酸序列框内融合,其中编码SEQIDNO:2的核苷酸序列、或其片段或衍生物的核酸分子和编码感兴趣的蛋白质的核苷酸序列与启动子可操纵地连接,以产生植物表达构建体,其中相关蛋白导向植物内的蛋白体。
本发明也提供了包括所述核酸分子和表达盒的分离的核酸分子、表达盒、重组载体、细胞、和转基因植物。在一些实施方式中,核酸分子和表达盒包括SEQIDNO:1,在一些实施方式中,核酸和表达盒包括SEQIDNO:6。在一些实施方式中,在种子内表达所述表达盒,并且所述表达盒所编码的多肽位于所述种子细胞的内质网的蛋白体内。
本发明的方法和组合物可以施用于任一植物物种。在一些实施方式中,植物是单子叶植物。在一些实施方式中,单子叶植物选自由水稻、玉米、小麦、大麦、燕麦、黑麦(Rye)、粟、蜀黍、小黑麦(Triticale)、黑麦(Secale)、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草(Gramma grass)、摩擦禾和假蜀黍所构成的组。在一些实施方式中,植物选自由水稻、小麦、大麦、黑麦、玉米、马铃薯、Canola、大豆、向日葵、胡萝卜、红薯、甜菜、黄豆、碗豆、菊苣、莴苣、卷心菜、花椰菜、绿花椰菜、芜青、萝卜、菠菜、芦笋、洋葱、大蒜、茄子、胡椒、芹菜、南瓜、西葫芦、黄瓜、苹果、梨、Quince、甜瓜、李子、樱桃、桃、油桃、杏、草莓、葡萄、红莓、黑莓、波萝、鳄梨、木瓜、芒果、香蕉、大豆、烟草、番茄、蜀黍和甘蔗构成的组。在一些实施方式中,植物是玉米。
在本发明的一些实施方式中,在组织中表达所述表达盒,所述组织选自由表皮(epidermis)、根、维管组织、分生组织、形成层、皮层、木髓、叶、花、种子、及其组合所构成的组。在一些实施方式中,在种子中表达所述表达盒,并且核苷酸序列所编码的多肽位于所述种子细胞的内质网的蛋白体内。
因此,本发明的一个目的是提供用于在植物中表达异源序列的试剂和方法。用本发明可以全部或部分地实现这个目的和其他目的。
上面已经陈述了本发明的目的,本发明全部或部分地针对该目的,随着继续描述本说明书,结合下面最佳描述的附图说明,其他的目的将变得显而易见。
附图说明
图1描述了利用纯化Nov9x植酸酶的抗血清对粉提取物的Western印迹分析。印迹上的第1列描述了标准分子量(标记于左侧)的位置。A188是非转基因的玉米种子的提取物。Nov9x植酸酶(预计分子量为47kDa)被鉴定为迁移到55kDa标准物区的显著条带。在阴性对照的玉米(即A188)的粉提取物中没有检测到Nov9x植酸酶。
图2描述了对从非转基因玉米的胚乳粉(endo.)或胚芽糊(embryo)中提取到的蛋白的SDS-PAGE分析。在将提取物加热到80℃20分钟之前(-)或之后(+),将样品进行跑胶。
图3是描述测定转基因玉米的种子粉中的α-半乳糖苷酶活性的条线图,所述转基因玉米种子含有包括与α-半乳糖苷酶相融合的Q蛋白氨基酸序列的融合蛋白。活性被表达为每克单一种子粉的α-半乳糖苷酶单位。
图4是描述测定转基因玉米种子粉中的α-半乳糖苷酶活性的条线图,所述转基因玉米种子含有包括与α-半乳糖苷酶相融合的Q蛋白信号序列的融合蛋白。活性被表达为每克单一种子粉的α-半乳糖苷酶单位。
序列表说明
SEQIDNO:1是Q蛋白基因的开放阅读框的核苷酸序列。
SEQIDNO:2是SEQIDNO:1编码的氨基酸序列。
SEQIDNO:3是来自Q蛋白cDNA的核苷酸序列,其被用于基因组步移实验以便鉴定出Q蛋白基因的启动子(SEQIDNO:6)。
SEQIDNO:4和5是在基因组步移试验中所采用的两种Q蛋白的特异引物的核苷酸序列。
SEQIDNO:6是来自Q蛋白基因的核苷酸序列,其能指导可操纵地连接的核苷酸序列的表达。
SEQIDNO:7是从玉米胚乳分离到的丰富的27kDa部分的N末端氨基酸序列,其与28kDa玉米谷蛋白-2(glutelin-2)(γ-玉米醇溶蛋白;
Figure S05807459320060915D000101
编号P04706)的氨基末端相匹配。
SEQIDNO:8是从玉米胚乳分离到的丰富的55kDa部分的N末端氨基酸序列。
SEQIDNO:9是源自猿猴病毒5(SV5)的副粘液病毒的P和V蛋白的V5表位标记的氨基酸序列。
SEQIDNO:10是五肽表位标记的氨基酸序列。
SEQISNO:11是重组Nov9x植酸酶所具有的C末端的六肽。
SEQIDNO:12是植酸酶表达盒的基因产物的氨基酸序列。
SEQIDNO:13是已经添加了5’HindIII和3’BamHI识别序列的玉蜀黍γ-玉米醇溶蛋白启动子的核苷酸序列。
SEQIDNO:14是pNOV4061的核苷酸序列,它是一种在γ玉米醇溶蛋白启动子的控制下编码具有γ玉米醇溶蛋白信号序列的Nov9x植酸酶的表达构建体。
SEQIDNO:15是pNOV2117的核苷酸序列,它是一种在玉米泛素启动子的控制下编码大肠杆菌manA磷酸甘露糖异构酶的土壤杆菌二元载体。
SEQIDNO:16是pNOV4325的核苷酸序列,它是一种由9个核苷酸的连接物所分开的编码γ-玉米醇溶蛋白-galA的中间质粒。
SEQIDNO:17是pNOV4349的核苷酸序列,它是一种依据其中已经插入Q蛋白编码序列的Pnov2117的土壤杆菌二元载体。
SEQIDNO:18是pNOV4328的核苷酸序列,它是在γ-玉米醇溶蛋白启动子的转录控制下编码γ-玉米醇溶蛋白信号序列的中间质粒。
具体实施方式
现在,在此后通过引用所伴随的实施例将更充分地描述本发明,其中显示了本发明的代表性的实施方式。但是,本发明可以具体地表现为不同的形式,不应当将其认作为限定于对在此所示的实施方式。通过提供这些实施方式使得本说明书是十分充分的和完全的,并且将本发明的范围充分地传递给本领域的熟练人员。
通过引用将在此所引用的所有文献、专利申请书、专利和其他参考文献的全部内容并入本申请。
I.概述0
鉴定出一种55kDa玉米蛋白(称作Q蛋白),其显示是属于谷类种子储存蛋白的谷醇溶蛋白家族。在存在二硫苏糖醇(DTT)时,从胚乳粉中释放出蛋白,它在这些提取物中是在γ-玉米醇溶蛋白之后的第二丰富的蛋白,其中γ-玉米醇溶蛋白本身就构成了约15%的胚乳蛋白。从数据库中找到编码一部分蛋白的表达序列标记(EST)序列。利用源自EST序列的寡核苷酸引物,扩增两种重叠的cDNA克隆。组合克隆编码包括预期的19个残基的信号肽的308个残基的多肽链。成熟蛋白的推导序列是289个氨基酸长,并包括104个Gln和13个Glu。Gln和Glu残基的组合百分比是40%,比其他玉米醇溶蛋白所报道的组合百分比高出两倍多。预期序列也包括5个Lys,在除δ-玉米醇溶蛋白外的所有其他玉米醇溶蛋白中都完全缺乏这种氨基酸,δ-玉米醇溶蛋白恰好是含有该氨基酸的玉米醇溶蛋白。γ-玉米醇溶蛋白蓄积在蛋白体的周围,55kDaQ蛋白和γ-玉米醇溶蛋白的共分镏说明两种蛋白都蓄积在这个区域内。
先前的工作针对于增加玉米醇溶蛋白中的Lys含量,以便提高营养,其包括往α-玉米醇溶蛋白内插入1-2个Lys残基(Wallaceetal.,1988)以及往γ-玉米醇溶蛋白内插入最多10个Lys残基(Torrentetal.,1987)。当在利用非洲蟾蜍卵母细胞或玉米胚乳的临时表达载体中合成修饰玉米醇溶蛋白时,所述修饰玉米醇溶蛋白蓄积在与蛋白体类似的结构内。但是,α-玉米醇溶蛋白和γ-玉米醇溶蛋白都缺少Lys并且只含有1-4个酸性氨基酸,它们同样可以被用于中和带正电荷的残基。相反地,55kDaQ蛋白的推导序列总共含有16个酸性残基。55kDa蛋白中所具有的5个Lys以及其位于或邻近蛋白体表面上的表观定位都提示它的天然构象可以耐受附加的Lys残基的取代。
II.定义
除非有不同的定义,在此所用的所有技术术语和科学术语都具有与本发明所属领域的一般人员通常所理解的意义相同的意义。为了清楚地阐述本说明书,下面给出了特定的定义。
按照已长时间存在的专利法规约定,术语“一种”、“一个”、和“所述”在此指的是“一或多个(种)”,包括权利要求书在内同样如此。因此,词组“一个(种)细胞”和“所述细胞”指的是一或多个细胞(种),除非在上下文中有清楚的不同的定义。
术语“关联于”和“可操纵地连接于”在此指的是两种核苷酸序列是物理上或功能上相关联的。例如,启动子或调节DNA序列被认为是“关联于”编码RNA或多肽的DNA序列,只要这两个序列是可操纵地连接或定位使得调节DNA序列将影响编码或结构DNA序列的表达水平。
术语“嵌合体”在此指的是包括源自不同多肽或处于非天然存在的彼此相对的位置上的结构域或其他特征的多肽。
名词“嵌合构建体”在此指的是重组核酸分子,其中启动子或调节核苷酸序列被可操纵地连接于或关联于编码mRNA的核苷酸序列或表达多肽的核苷酸序列,使得调节核苷酸序列能调节所关联的核苷酸序列的转录或表达。嵌合构建体的调节核苷酸序列没有被正常地可操纵地连接于所关联的在自然界中可发现的核苷酸序列。
术语“编码序列”和“开放阅读框(ORF)”在此可互换使用,指的是转录成RNA例如mRNA、rRNA、tRNA、snRNA、有义RNA、或反义RNA的核苷酸序列。在一些实施方式中,RNA在体内或体外翻译产生了多肽。在一些实施方式中,玉米Q蛋白的ORF包括SEQ ID NO:1。
术语“互补的”在此指的是两种包括反向平行核苷酸序列的核苷酸序列,反向平行核苷酸序列能在反向平行核苷酸序列的互补碱基残基之间形成氢键后彼此相互配对。本领域已知的是,当都从5’到3’的方向看序列时,两种互补链的核苷酸序列是彼此反向互补的。
本领域也已知的是,两种在给定的条件组下能彼此杂交的序列不必必须是100%完全互补的。术语“完全互补的”和“100%互补的”指的是其中互补区是100%Watson-Crick碱基配对的序列,即在互补区内不存在错配。但是,常常对于被克隆到克隆载体内的重组分子(例如cDNA)的情况而言,某些分子可以在5’或3’端具有非互补的悬突部分,它们是克隆事件所造成的结果。在这样一种情况中,要明白100%或完全互补性的区域不包括任一单独地被添加到重组分子中(通常在末端)的序列,所述添加是克隆事件的结果或有助于克隆事件。这些序列是例如多位点接头序列、具有限制性内切酶识别位点的连接物等等。
当术语“结构域”和“特征”用于说明多肽或氨基酸序列时,其在此指的是具有特殊生物学功能的氨基酸序列的亚序列。具有特殊生物学功能的结构域和特征包括但不限定于信号序列、配体结合域、核酸结合区、催化区、底物结合区、和多肽-多肽相互作用区。同样,当在此被用于说明核苷酸序列时,“结构域”或“特征”是编码多肽的结构域或特征的核苷酸序列的亚序列。
术语“表达盒”在此指的是能指导在合适的宿主细胞内表达特殊核苷酸序列的核酸分子,包括与相关核苷酸序列可操纵地连接的启动子,以及所述相关核苷酸序列可操纵地连接于终止信号。这通常也包括核苷酸序列的正确翻译所需的序列。编码区通常编码相关多肽,但是也能在有义或反义的方向上编码相关的功能RNA例如反义RNA或非翻译RNA。包括相关核苷酸序列的表达盒可以是嵌合表达盒,意思是至少其中一种组分对于至少一种其他的组分是异源的。表达盒也可以是一种天然存在的表达盒,已经获得了可用于异源表达的重组形式的表达盒。但是,通常表达盒的至少一种组分对于宿主是异源的;例如表达盒的特殊DNA序列天然地不存在于宿主细胞内,其是通过转化事件而被引入到宿主细胞或宿主细胞的亲代细胞内。表达盒中的核苷酸序列的表达可以处于启动子(例如,Q蛋白启动子SEQIDNO:6)的控制之下。在一些实施方式中,仅仅当宿主细胞暴露于一些特殊的外来刺激时,启动子才引发转录。对于多细胞生物体例如植物而言,启动子也可以特异于特殊组织、器官、或发育阶段(例如植物种子)的启动子。
术语“片段”在此指的是包括另一个序列的亚组的序列。当用于核酸或氨基酸序列时,可以互换使用术语“片段”和“亚序列”。核苷酸序列的片段可以是任一数目的核苷酸,它比在另一个核苷酸序列中所发现的核苷酸数目更少,因此其包括但不限定于外显子或内含子、启动子、增强子、复制起点、5’或3’非翻译区、编码区、和多肽结合区的序列。要明白片段或亚序列也可以包括比核苷酸序列的全部序列更少的序列,例如外显子或内含子、启动子、增强子等的一部分。同样,氨基酸序列的片段或亚序列可以是任一数目的残基,其比在天然存在的多肽中所发现的残基数目更少,这包括但不限定于结构域、特征、重复等。也同样地,要明白氨基酸序列的片段或亚序列不必包括结构域、特征、重复等的氨基酸序列的全部序列。片段也可以是“功能片段”,其中片段保留了相关核苷酸序列或氨基酸序列的特异的生物学功能。例如,转录因子的功能片段可以包括,但不限定于DNA结合区、顺式活化结构域、或两者。同样,受体酪氨酸激酶的功能片段可以包括但不限定于配体结合区、激酶区、ATP结合区、及其组合。
术语“基因”在此被广泛地使用,其指的是与生物学功能相关的任一DNA片段。因此,基因包括但不限定于编码序列和/或编码序列表达所需的调节序列。基因也可以包括非表达的DNA片段,例如它形成了多肽的识别序列。可以从不同的来源中获得基因,包括从相关来源中克隆得到,或从已知的或预期的序列信号中合成得到,并且它可以包括被设计成具有所需参数的序列。
当术语“异源”和“重组”在此被用于说明核苷酸序列(例如DNA序列)或基因时,它们指的是源自异生于特殊宿主细胞的来源的序列,或来源于同一来源但经修饰其原始形式后得到的序列。因此宿主细胞中的异源基因包括已经经例如DNA步移或其他重组技术所修饰的内生于特殊宿主细胞的基因。术语也包括非天然存在的多个拷贝的天然存在的DNA序列。因此,术语指的是异生于宿主细胞的DNA片段,或宿主细胞中天然存在的DNA片段,但在自然界中通常不能找到其在宿主细胞内的位置或形式。同样,当用于说明多肽或氨基酸序列时,异源多肽或氨基酸序列是源自异生于特殊宿主细胞的来源的多肽或氨基酸序列(例如从异源编码序列中所产生的序列),或者如果来自同一来源,所述异源多肽或氨基酸序列是通过修饰其原始形式后得到的多肽或氨基酸序列。因此可以表达异源DNA片段以产生异源多肽。
“同源”核苷酸(或氨基酸)序列是与其所被引入到的宿主细胞天然相关的核苷酸(或氨基酸)序列,并且它出现在发现其在自然界中所正常位于的染色体或染色体外的位置上。
词语“特异地杂交于”指的是在严格条件下分子只与特殊核苷酸序列结合、双链化、或杂交,当序列存在于复合混和物(例如细胞的总DNA或RNA)中时。词语“基本上结合于”指的是探针核酸和靶核酸之间的互补杂交,包括微小错配,通过减少杂交介质的严格性可以调节错配,以便获得所需的对靶核苷酸序列的检测。
术语“突变”和“突变体”在此具有它们的常用含义,指的是在核酸或多肽序列中的遗传的、天然存在的、或引入的变化,它们的意义与本领域人员通常所知的意义相同。
术语“抑制物”在此指的是灭活或降低多肽的生物活性(例如生物合成的和催化的活性、受体、信号转导多肽、结构基因产物、或转运多肽)的化学物质。术语“除草剂”(或“除草化合物”)在此定义为施用于植物的任一发育阶段的抑制剂,其中除草剂抑制了植物生长或杀死植物。
当用于分离的DNA分子或分离的多肽的上下文时,术语“分离的”在此是通过人为的方法从其天然环境中分离到的DNA分子或多肽,因此它不是天然产物。分离的DNA分子或多肽可以以纯化的形式存在或者可以存在于非天然的环境中,例如在转基因的宿主细胞内。
术语“成熟多肽”在此指的是其中已经去除了转移肽、信号肽、和/或前肽部分的多肽。
术语“最小启动子”在此指的是能支持任何转录的最小片段的启动子,例如TATA元件。在没有上游或下游活化时,最小启动子通常已经极大地减弱了启动子活性。在存在合适的转录因子时,最小启动子可以发挥功能以容许转录。
术语“细胞”、“细胞系”、和“细胞培养物”在此可以互换使用,以及所有的这些称谓都包括子代。因此,名词“转化体”和“转化细胞”包括原代对象细胞和源自于原代细胞的培养物,与原始被处理的细胞可能已经进行的转移的数目和/或细胞分裂的轮数无关。也要明白所有的子代在DNA内容物方面可能不是精确相同的,因为有意或无意突变的原因。术语包括具有所筛选的与原始转化细胞相同的功能或生物学活性的突变子代。预期了不同的称谓,从上下文中可以清楚地知道这一点。
术语“天然的”在此指的是在未转化的植物细胞的基因组中天然存在的基因。同样,当用于多肽的上下文时,“天然多肽”是未转化的植物细胞的基因组的天然基因编码的多肽。
术语“天然存在的”在此指的是在自然界中所发现的物体,其不同于人为地人工生产的物体。例如,没有在实验室中被人为地故意修饰或分离的、以天然状态存在于生物体中的多肽或核苷酸是天然存在的。同样,如果多肽或核苷酸序列是被重组分子所编码的或存在于重组分子内,那么就认为多肽或核苷酸序列是“非天然存在的”,即使氨基酸或核苷酸序列与自然界中所发现的氨基酸或核苷酸序列相同。
术语“核酸”在此指的是单链或双链形式的脱氧核糖核苷酸或核糖核苷酸以及它们的聚合物。除非有特殊的限定,术语包括含有天然核苷酸的已知类似物的核酸,该核酸具有与参照核酸相似的结合性能,并以与天然存在的核苷酸相似的方式进行代谢。除非有不同的说明,特殊核苷酸序列也隐含地包括它的保守修饰的变体(例如简并密码子取代)和互补序列以及明确阐述的序列。具体地,通过产生其中一个或多个(或所有)选定密码子中的第三个位点被混和碱基和/或脱氧次黄苷残基所取代的序列可以实现简并密码子取代(Batzeretal.,1991;Ohtsukaetal.,1985;Rossolinietal.,1994)。术语“核酸”或“核苷酸序列”也可以与基因、cDNA、和基因所编码的mRNA互换使用。
术语“定向进化同源基因”指的是在不同物种中编码实施相同生物学功能的蛋白的基因。例如,来自例如蜀黍和水稻的葡萄糖-6-磷酸脱氢酶基因是定向进化同源基因。定向进化同源基因的核苷酸序列的特征通常是高度的序列相似性(例如,至少约90%序列相同性)。利用标准的分子生物学技术,可以用一个物种(例如,水稻)的定向进化同源基因的核苷酸序列分离出另一个物种(例如,蜀黍)的定向进化同源基因的核苷酸序列。例如利用下面更详细描述的技术可以实现这一点(也见于,Sambrook &Russell,2001关于对可以被用于分离紧密相关的序列的杂交条件的讨论)。
在两个核酸或多肽序列的上下文中,词语“相同性百分比”在此指的是当比较并排列两种或更多种序列或亚序列的最大对应性时,分别在一些实施方式中具有60%(例如,60、63、65、67、或69%)、在一些实施方式中具有70%(例如70、73、75、77、或79%)、在一些实施方式中具有80%(例如80、83、85、87、或89%)、在一些实施方式中具有90%(例如90、93、95、或97%)、以及在一些实施方式中具有至少99%核苷酸或氨基酸相同性的两种或更多种序列或亚序,如用下面的序列比较算法之一或通过肉眼观察所测定的那样。相同性百分比在一些实施方式中存在于长度为至少约50个残基的序列的区域上,在一些实施方式中存在于约100个残基的区域上,以及在一些实施方式中,相同性百分比存在于至少约150个残基上。在一些实施方式中,相同性百分比存在于序列的全长上。
对于序列比较,通常一个序列作为参照序列,将其与测试序列进行比较。当使用序列比较算法时,将测试和参照序列都输入到计算机内,如果需要则指定亚序列坐标系,并指定序列算法程序参数。然后序列比较算法依据所指定的程序参数计算出测试序列相对于参照序列的序列相同性百分比。
可以进行对用于比较的序列的最佳排列,例如通过在Smith&Waterman,1981中所阐述的局部同源性算法、通过在Needleman&Wunsch,1970中所阐述的同源性排列算法、通过在Pearson&Lipman,1988中所阐述的搜索相似性的方法,通过这些算法的电脑化实施(GAP、BESTFIT、FASTA、和
Figure S05807459320060915D000181
Figure S05807459320060915D000182
中的TFASTA,购自美国加州圣地亚哥的Accelrys公司)、或通过肉眼观察。通常见于Ausubeletal.,2002;Ausubel etal.,2003。
适用于确定序列相同性和序列相似性的算法的一个实例是BLAST算法,在Altschul等,1990中描述了这个算法。通过国立生物技术信息中心的网站能公开地得到进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中的长度为W的短子码鉴定出高积分序列对(HSPs),当其与数据库序列中的相同长度的子码排列时,其匹配或满足一些正值的阈值积分T。T指的是邻近子码积分阈值。通常见于Altschuletal.,1990。这些最初的邻近子码采样点作为最初的用于发现更长的含该邻近子码的HSPs的搜索的种子。然后沿着每个序列的两个方向延伸子码采样点,直到可以增加累积排列积分。用参数M(一对匹配残基的奖分,始终>0)和N(错配残基的罚分,始终<0)计算出核苷酸序列的累积积分。对于氨基酸序列,用积分矩阵计算累积积分。当累积排列积分比其最大实现值下降了数量X,累积积分因为累积了一个或更多个负值的残基排列而成为0或更低、或到达每个序列的末端时,就终止子码采集点在每个方向上的延伸。BLAST算法中的参数W、T和X确定了排列的敏感性和速度。BLASTTN程序(对于核苷酸序列)用缺省值进行两个链的比较,其中字长(W)为11,预期值(E)为10,截断点为100,M=5,N=-4。对于氨基酸序列,BLASTP程序使用缺省值,其中字长(W)为3,预期值(E)为10,以及BLOSUM62积分矩阵。见Henikoff&Henikoff,1992。
除了计算序列相同性百分比外,BLAST算法也进行两个序列之间的相似性的统计学分析(见例如Karlin&Altschul,1993)。BLAST算法所提供的一种相似性的测定法是最小总计概率(P(N)),它提供了对其中两个核苷酸或氨基酸序列之间可以随机发生匹配的概率的指示。例如,如果在测试核苷酸序列和参照核苷酸序列的比较中,最小总计概率在一些实施方式中小于约0.1、在一些实施方式中小于约0.01、以及在一些实施方式中小于约0.01时,就认为测试核苷酸序列与参照序列相似。
术语“Q蛋白”、“55kDa蛋白”、“55kDaQ蛋白”、和“55kDa玉米蛋白”在此可以互换使用,并且指的是包括氨基酸序列SEQ ID NO:2、及其变体、片段、和结构域的多肽。已经鉴定出了该多肽序列的代表性的开放阅读框,其具有SEQIDNO:1所提供的核苷酸序列。另外,已经鉴定出在玉米中控制该编码序列的转录的玉米启动子的区域,其在此也被称作“Q蛋白基因启动子”、“来自Q蛋白基因的启动子”等等,其包括在SEQIDNO:6中所呈现的核苷酸序列。
术语“穿梭核酸”在此指的是重组核酸分子,其中核苷酸序列包括多个核苷酸序列片段,其中至少其中一个片段对应于在SEQIDNO:1中所列的核苷酸序列的区域,以及其中多个序列片段中的至少两个片段是依序排列的,从5’到3’,该次序不是所述多个片段在核酸中天然存在的次序。
在两个核苷酸或氨基酸序列的上下文中,术语“基本上相同的”指的是当比较并排列两种或更多种序列或亚序列的最大对应性时,分别在一些实施方式中具有至少约60%核苷酸或氨基酸相同性(例如,60、63、65、67、或69%核苷酸或氨基酸相同性)、在一些实施方式中具有至少约70%核苷酸或氨基酸相同性(例如70、73、75、77、或79%核苷酸或氨基酸相同性)、在一些实施方式中具有至少约80%核苷酸或氨基酸相同性(例如80、83、85、87、或89%核苷酸或氨基酸相同性)、在一些实施方式中具有至少约90%核苷酸或氨基酸相同性(例如90、93、95、97或99%核苷酸或氨基酸相同性)的两种或更多种序列或亚序,如用下面的序列比较算法之一或通过肉眼观察所测定的那样。在一些实施方式中,基本上相同性存在于至少50个残基的核苷酸或氨基酸序列上,在一些实施方式中存在于至少约100个残基的核苷酸或氨基酸序列上,在一些实施方式中存在于至少约150个残基的核苷酸或氨基酸上,以及在一些实施方式中,存在于包括完全编码序列或完全氨基酸序列的核苷酸或氨基酸序列上。
在一个方面,多态性序列可以是基本上相同的序列。术语“多态性”指的是群体中的两种或多种遗传学上决定的可选择序列或等位基因。等位基因的差异可以小到一个碱基对。但是,本领域的一般人员能识别出对应于相同基因的多态性序列。
两种核苷酸序列是基本上相同的另一种指示是两种分子在中等或高严格性的条件下彼此特异地或基本上特异地杂交。在核酸杂交的上下文中,所比较的两种核苷酸序列被称作“探针序列”和“靶序列”。“探针序列”是参照核酸分子,以及“靶序列”是测试核酸分子,常常发现测试核酸分子是在异源的核酸群内。“靶序列”与“测试序列”同义。
用于杂交研究或检测的核苷酸序列示例包括在一些实施方式中与本发明的核酸分子中的至少约14到40个核苷酸序列互补或模拟该序列的探针序列。在一些实施方式中,探针包括14到20个核苷酸,或甚至更长(只要需要)例如30、40、50、60、100、200、或500个核苷酸或最大到SEQIDNO:1所示的任一核苷酸序列的全长核苷酸(例如,全部的互补序列)。例如通过化学直接合成片段、或通过应用核酸扩增技术、或通过将所选定的序列引入到用于重组生产的重组载体内都可以容易地制备出这些片段。
词语“基本上杂交于”指的是探针核酸序列和靶核酸序列之间的互补杂交,并包括微小错配(例如多态性),通过降低杂交和/或洗涤介质的严格性可以调节错配,以便获得所需的杂交。
在核酸杂交试验例如Southern和Northern印迹分析的上下文中,“严格性杂交条件”和“严格性杂交洗涤条件”都是序列和环境依赖的。越长的序列在越高的温度下特异杂交。在Tijssen,1993中可以找到关于核酸杂交方面的指南。一般而言,所选的高严格性杂交和洗涤条件是比特异序列在给定离子强度和pH值时的热熔点(Tm)低约5℃的温度。探针通常在“高严格性条件”下与其靶序列特异杂交,但不会与其他序列杂交。同样,所选的中等严格性杂交和洗涤条件是比特异序列在给定离子强度和pH值时的Tm低约5℃以上的温度。示例的中等严格条件包括与高严格性条件一样的杂交和洗涤,除了在一些实施方式中杂交和洗涤的温度比特异序列在给定离子强度和pH值时的Tm低8℃,在一些实施方式中低10℃,在一些实施方式中低12℃,以及在一些实施方式中低15℃。
Tm是其中有50%靶序列与优选匹配探针杂交时的温度(在给定的离子强度和pH值下)。所选的非常严格条件与特殊探针的Tm相同。对于具有约100个以上互补残基的互补核酸的Southern或Northern印迹分析的高严格性杂交条件的实例是在含有5x Denhardt试剂、0.5%十二烷基硫酸钠(SDS)、1μg/ml聚(A)、和100μg/ml鲑精DNA的6x标准柠檬酸盐水(SSC)或标准EDTA磷酸盐水中、65℃下(如果在杂交缓冲液中含有50%甲酰胺,则在42℃下)杂交过夜(50x Denhardt试剂是1%(w/v)Ficoll 400、1%(w/v)聚乙烯吡咯酮、和1%(w/v)牛血清白蛋白,见。Sambrook和Russell,2001,可以使用与此所用的条件和溶液相同的其他的杂交和洗涤条件及溶液)。高严格性洗涤条件的实例是在0.1xSSC、0.1%(w/v)SDS中、65℃下洗涤15分钟。另一个高严格性洗涤条件的实例是在0.2xSSC缓冲液、65℃下洗涤15分钟。在高严格性洗涤之前常常是较低严格的洗涤,以便去除背景探针信号。中等严格洗涤条件的实例是超过约100个核苷酸的双链在1xSSC中、45-55℃下洗涤15分钟。另一个中等严格洗涤的实例是超过约100个核苷酸的双链在4-6xSSC中、40℃下洗涤15分钟。对于短探针(例如约10到50个核苷酸)而言,严格条件通常包括盐浓度小于约1MNa+离子,通常为约0.01到1M Na+离子浓度(或其他盐)(pH值7.0-8.3),以及温度通常是至少约30℃。通过添加去稳定剂例如甲酰胺也能获得严格条件。一般而言,如果信号对噪音比值是所观察到的无关探针在特殊杂交检测中的信号噪音比值的2倍(或更高),则说明检测到了特异杂交。
下面是用于克隆与本发明的参照核苷酸序列基本上相同的同源的核苷酸序列的杂交和洗涤条件的实例:在一些实施方式中,探针和靶序列是在7%SDS、0.5MNaPO4、1mM乙二胺四乙酸(EDTA)、50℃下杂交,随后是在2xSSC、0.1%SDS中、50℃下洗涤;在一些实施方式中,探针和靶序列是在7%SDS、0.5M NaPO4、1mM EDTA、50℃下杂交,随后是在1xSSC、0.1%SDS中、50℃下洗涤;在一些实施方式中,探针和靶序列是在7%SDS、0.5MNaPO4、1mMEDTA、50℃下杂交,随后是在0.5xSSC、0.1%SDS中、50℃下洗涤;在一些实施方式中,探针和靶序列是在7%SDS、0.5M NaPO4、1mM EDTA、50℃下杂交,随后是在0.1xSSC、0.1%SDS中、50℃下洗涤;在一些实施方式中,探针和靶序列是在7%SDS、0.5MNaPO4、1mMEDTA、50℃下杂交,随后是在0.1xSSC、0.1%SDS中、55℃下洗涤;在一些实施方式中,探针和靶序列是在7%SDS、0.5M NaPO4、1mM EDTA、50℃下杂交,随后是在0.1xSSC、0.1%SDS中、60℃下洗涤;以及在一些实施方式中,探针和靶序列是在7%SDS、0.5M NaPO4、1mMEDTA、50℃下杂交,随后是在0.1xSSC、0.1%SDS中、65℃下洗涤。在一些实施方式中,杂交条件包括在旋转管中、7%SDS、0.5M NaPO4、1mMEDTA、42℃下杂交至少12个小时。
术语“前多肽”在此指的是被正常地导向细胞器例如叶绿体,并仍然包括转运肽的多肽。
当应用于核酸或多肽时,术语“纯化的”在此表示核酸或多肽基本上不含有其他的在自然状态下与其相结合的细胞组分。它可以是均质状态,尽管它可以是干粉或水溶液。通常用分析化学技术例如聚丙烯酰胺凝胶电泳或高效液相色谱法确定出纯度和均质性。作为制剂中的超优势种的多肽是基本上纯化的。术语“纯化的”表示核酸或多肽在电泳凝胶中基本上形成了单一条带。具体地,这意味着核酸或多肽在一些实施方式中为至少约50%纯的,在一些实施方式中为至少约85%纯的、以及在一些实施方式中为至少约99%纯的。
当来自两种核酸中的每种核酸的序列被组合于子代核酸时,两种核酸是“重组的”。当两种核酸都是重组的底物时,两种序列是“直接”重组的。当用中间物例如横跨寡核苷酸重组序列时,两种序列是“间接”重组的。对于间接重组,不超过一种序列是重组的实际底物,以及在一些情况中,没有一种序列是重组的底物。
术语“调节元件”在此指的是在控制核苷酸序列的表达中所包含的核苷酸序列。调节元件可以包括与相关核苷酸序列可操纵地连接的启动子以及终止信号。调节序列也包括增强子和沉默子。它们通常也包括正确翻译核苷酸序列所需的序列。
术语“转化”在此指的是用于将异源DNA引入到植物细胞、植物组织、或植物中的过程。转化植物细胞、植物组织、或植物被理解为不仅包括转化过程的终末产物,也包括其子代。
术语“转化”、“转基因”、和“重组体”在此指的是其中已经被引入异源核酸分子的宿主细胞或生物体例如细菌或植物细胞(例如植物)。核酸分子可以被稳定地整合到宿主的基因组中,或者核酸分子也可以以染色体外分子的形式存在。这样一种染色体外分子可以是自我复制的。转化细胞、组织或植物被理解为不仅包括转化过程的终末产物,还包括其转基因子代。“未转化”、“未转基因”、或“未重组的”宿主指的是野生型生物体例如细菌或植物,它不包含异源核酸分子。
当涉及到核苷酸序列(或其所编码的氨基酸序列)时,术语“异源的”在此不仅指的是源自不同于其所被引入的物种的物种的核酸或氨基酸序列,还指的是来自相同物种的核苷酸序列,其中该物种的细胞或有机体的基因组已经被加工处理,使得基因组含有一些人为的变更。
因此,术语“转基因”不仅指的是例如包括在玉蜀黍中并非天然存在的核酸分子的玉蜀黍细胞,也包括例如包括在玉蜀黍中天然存在有其全部或一部分的核酸分子的玉蜀黍细胞,但是玉蜀黍细胞已经进行了一些形式的修饰,使得转基因植物的基因组明显不同于天然存在的玉蜀黍的基因组。在一些实施方式中,修饰包括将一个或多个附加拷贝的玉蜀黍核苷酸序列引入到玉蜀黍细胞内。在一些实施方式中,修饰包括将异源核苷酸序列“敲入”到Q蛋白基因内,使得异源核苷酸序列与内源性Q蛋白基因启动子可操纵地连接。
III.核酸分子和多肽
III.A.核酸分子
本发明的实施方式包括对应于玉蜀黍谷类种子储存蛋白的谷醇溶蛋白家族成员的分离的核酸分子,以及来自这样一种家族成员的启动子区的能用于控制可操纵地连接的核苷酸序列的表达的核苷酸序列。在一些实施方式中,本发明的分离的核苷酸分子包括在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所示的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列。在一些实施方式中,本发明的分离的核苷酸分子包括与在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所示的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列基本上相同的核苷酸序列。在一些实施方式中,本发明包括分离的核酸分子,其包括与在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列相互补的核苷酸序列,或者包括作为在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列反向互补链的核苷酸序列。本发明的一些实施方式包括分离的核酸分子,其包括与基本上相同于或能杂交于在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的核苷酸序列相互补的核苷酸序列,或者包括作为基本上相同于或能杂交于在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的核苷酸序列的反向互补链的核苷酸序列。
在一些实施方式中,基本上相同的是与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征具有至少约60%相同性(例如60、63、65、67、或69%相同性),在一些实施方式中至少约70%相同性(例如70、73、75、77、或79%相同性),在一些实施方式中至少约80%相同性(例如80、83、85、87、或89%相同性),在一些实施方式中至少约90%相同性(例如90或93%相同性),在一些实施方式中至少约95%相同性,在一些实施方式中至少约97%相同性,以及在一些实施方式中至少约99%相同性。
在一些实施方式中,具有基本上相同性的核苷酸序列包括在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的等位基因变体。在一些实施方式中,具有基本上相同性的核苷酸序列包括天然存在的变体。在一些实施方式中,具有基本上相同性的核苷酸序列包括在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的多态性变体。
在一些实施方式中,具有基本上相同性的核酸包括至少一个核苷酸的缺失或插入。在一些实施方式中,缺失或插入包括少于约30个核苷酸的缺失或插入。在一些实施方式中,缺失或插入包括少于约5个核苷酸的缺失或插入。在一些实施方式中,具有基本上相同性的分离的核酸包括至少一个密码子的取代。在一些实施方式中,取代是保守取代。
在一些实施方式中,分离的核酸包括多个具有在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的区域。
在一些实施方式中,与在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列具有基本上相同性的序列来自于植物。在一些实施方式中,植物是双子叶植物。在一些实施方式中,植物是裸子植物。在一些实施方式中,植物是单子叶植物。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是水稻。
在一些实施方式中,核酸被表达于植物的特殊部位或组织。在一些实施方式中,部位或组织包括但不限定于表皮、根、维管组织、分生组织、形成层、皮层、木髓、叶、花、种子、以及它们的组合物。在一些实施方式中,部位或组织是种子。在一些实施方式中,部位或组织是种子的蛋白体。
本发明的实施方式也涉及含有多个核苷酸片段的穿梭核酸分子,其中至少一个片段对应于在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列的一个区域,以及其中多个序列片段中的至少两种片段是依序排列的,从5’到3’,该次序并不是所述多个片段天然存在的次序。在一些实施方式中,包括多个核苷酸序列片段的穿梭核酸中的所有片段都来自单个基因。在一些实施方式中,多个片段都来源于至少两种不同的基因。在一些实施方式中,穿梭核酸与启动子序列可操纵地连接。在一些实施方式中,穿梭核酸包括嵌合多肽,其包括与穿梭核酸可操纵地连接的启动子序列。在一些实施方式中,穿梭核酸被包含在宿主细胞内。
III.B.鉴定、克隆、和测序cDNA
利用本领域已知的技术可以完成本发明的cDNA的克隆和测序。通常见于,Sambrook&Russell,2001;Silhavyetal.,1984;Ausubeletal.,2002;Ausubeletal.,2003;Reiteretal.,1992;Schultzetal.,1998。
本发明的分离的核酸和多肽在多种植物中都是有用的,例如单子叶和双子叶植物,具体的单子叶植物包括蜀黍、水稻、小麦、大麦、和玉米。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是水稻。与本发明相关的其他植物种属包括,但不限定于南瓜属、玫瑰属、葡萄属、胡桃属、Gragaria、莲花属、苜蓿属、Onobrychis、胡芦巴属、Vigna、柑橘属、亚麻属、天竺葵属、木薯属、胡萝卜属、拟南芥属、芸苔属、萝卜属、芥子属、颠茄属、辣椒属、曼陀罗属、莨菪属、番茄属、烟草属、茄属、喇叭花属、洋地黄属、马约喇钠属、Ciahorium、向日葵属、莴苣属、Bromus、芦笋属、金鱼草属、异犬齿珊瑚属、Nemesis、天竺葵属、Panieum、狼尾草属、毛莨属、千里光属、喇叭舌属、黄瓜属、Browaalia、Glycine、Pisum、菜豆属、黑麦草属、稻属、燕麦属、大麦属、黑麦属、葱属、和小麦属。
本发明也提供了用于将包括本发明的核酸分子的植物或植物部分基因分型的方法。任选地,植物是单子叶植物,例如但不限定于蜀黍、水稻、玉米、或小麦。基因分型提供了用于区分染色体对的同系物的方法学,并能被用于区分植物群体中的分离子。分子标记物方法可以被用于种系发育研究、表征农作物品种中的遗传学关系、鉴定单树杂交体或体杂交体、定位实现单基因性状的染色体片段、基于基因定位的克隆、以及对数量遗传的研究(见Clark,1997;Paterson,1996)。
用于基因分型的方法可以采用任何数目的分子标记物分析技术,其包括但不限定于限制性片段长度多态性(RFLPs)。本领域公知的是,相同基因的等位基因之间的核苷酸差异所造成的DNA限制性片段长度的差异产生了RFLPs。因此,本发明提供了利用RFLP分析进行对本发明的基因或核酸或遗传学连接的染色体序列的分离的方法。所连接的染色体序列在一些实施方式中是在50厘摩(cM)本发明的核酸之内,在一些实施方式中是在40cM之内,在一些实施方式中是在30cM之内,在一些实施方式中是在20cM之内,在一些实施方式中是在10cM之内,以及在一些实施方式中是在5、3、2、或1cM之内。
本发明的实施方式也涉及包括核苷酸序列的分离的核酸分子、它的互补物(例如它的完全互补物)、或它的反向互补物(例如,它的完全反向互补物)、核苷酸序列编码的多肽(例如,生物学活性多肽或生物学活性片段)。在一些实施方式中,核苷酸序列编码多肽,多肽是包括SEQIDNO:2中所列的多肽序列、或其片段、结构域、重复、特征、或嵌合体的多肽的定向进化同源物。在一些实施方式中,核苷酸编码多肽,多肽是包括具有与SEQIDNO:2中所列的多肽序列、或其片段、结构域、重复、特征、或嵌合体的多肽基本上相同性的多肽序列的多肽的定向进化同源物。在一些实施方式中,核苷酸序列编码多肽,多肽是包括由与SEQIDNO:1中所示的核苷酸序列、或其片段、结构域、或特征、或其互补序列相同的核苷酸序列或具有与SEQIDNO:1中所示的核苷酸序列、或其片段、结构域、或特征、或其互补序列基本上相同性的核苷酸序列编码的多肽序列的多肽的定向进化同源物。在一些实施方式中,核苷酸序列编码多肽,其包括由在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其互补序列杂交的核苷酸序列所编码的多肽序列。在一些实施方式中,核苷酸序列编码本发明的多肽的功能片段。
在一些实施方式中,分离的核酸包括多肽编码序列。在一些实施方式中,多肽编码序列编码多肽,多肽是包括SEQIDNO:2中所列的多肽序列或其片段的多肽的定向进化同源物。在一些实施方式中,多肽是植物多肽。在一些实施方式中,植物是双子叶植物。在一些实施方式中,植物是蜀黍。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是玉米。
本发明的实施方式也涉及分离的核酸分子,其包括核苷酸序列,它的互补物(例如,它的完全互补物)、或其反向互补物(例如,它的完全反向互补物),所述核苷酸编码多肽,多肽选自包括下面的一种或多种多肽序列的组:
(a)在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征、或其互补序列杂交的核苷酸序列所编码的多肽序列;和
(b)(a)的功能片段。
在一些实施方式中,具有基本上相同性的多肽包括多肽的等位变体,所述多肽是具有SEQIDNO:2所列的氨基酸序列、或其片段、结构域、重复、特征、或嵌合体的多肽的定向进化同源物。在一些实施方式中,分离的核酸包括多个来自由在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征、或其互补序列杂交的核苷酸序列所编码的多肽序列的区域。
III.C.多肽
本发明还涉及分离的多肽,它是包括SEQIDNO:2所示氨基酸序列的多肽的定向进化同源物,其包括生物学活性多肽。在一些实施方式中,多肽包括SEQIDNO:2所列的多肽的定向进化同源物的多肽序列。在一些实施方式中,多肽包括包括SEQIDNO:2所列的多肽序列的多肽的定向进化同源物的功能片段或结构域。在一些实施方式中,多肽包括SEQIDNO:2所列的多肽序列的定向进化同源物的嵌合体,其中嵌合体可以包括功能性的多肽基序,所述基序包括结构域、重复、翻译后修饰位点、或其他特征。在一些实施方式中,多肽是植物多肽。在一些实施方式中,植物是双子叶植物。在一些实施方式中,植物是蜀黍。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是玉米。
在一些实施方式中,多肽被表达于植物的特殊部位或组织。在一些实施方式中,部位或组织包括但不限定于表皮、根、维管组织、分生组织、形成层、皮层、木髓、叶、花、种子、以及它们的组合物。在一些实施方式中,部位或组织是种子。在一些实施方式中,部位或组织是种子的蛋白体。
在一些实施方式中,分离的多肽包括包括SEQIDNO:2所示的氨基酸序列的多肽的定向进化同源物的氨基酸序列,以及具有保守氨基酸修饰的变体。术语“保守修饰的变体”指的是由具有简并密码子取代的核苷酸序列所编码的多肽,其中一个或多个所选(或所有)密码子中的至少一个位点被混和碱基和/或脱氧次黄苷残基所取代(Batzeretal.,1991;Ohtsukaetal.,1985;Rossolinietal.,1994)。另外,本领域人员将认识到变更、添加或删除所编码的序列中的单个氨基酸或一小部分氨基酸的对核酸、肽、多肽、或多肽序列的单个取代、删除或添加都是“保守修饰”,只要修饰造成了化学相似的氨基酸对相应氨基酸的取代。保守修饰的个体提供了与未修饰多肽相似的生物学活性。给出的功能相似氨基酸的保守取代列表在本领域是已知的,见Creighton,1984。
术语“保守修饰的变体”也指的是具有与本发明的多肽的序列基本上相同的氨基酸残基序列的肽,其中一个或多个残基已经被功能相似的残基所保守取代。保守取代的实例包括一种非极性(疏水性)残基例如异亮氨酸、缬氨酸、亮氨酸、或甲硫氨酸对另一种非极性残基的取代;一种极性(亲水性)残基对另一种极性残基的取代,例如精氨酸和赖氨酸之间、谷氨酰胺和天冬酰胺之间、甘氨酸和丝氨酸之间的取代;一种碱性残基例如赖氨酸、精氨酸或组氨酸对另一种碱性残基的取代;或一种酸性残基例如天冬酸或谷氨酸对另一种酸性残基的取代。
氨基酸取代(例如在修饰在此所述的多肽中可以采用的那些氨基酸取代)一般都依据于氨基酸侧链取代基的相对相似性,例如它们的疏水性、亲水性、电荷、大小等等。对氨基酸侧链取代基的大小、性状和类型的分析都发现精氨酸、赖氨酸和组氨酸全都是带正电荷的残基;丙氨酸、甘氨酸和丝氨酸都具有相似的大小;以及苯丙氨酸、色氨酸和酪氨酸全都具有普遍相似的性状。因此,根据这些认识,精氨酸、赖氨酸和组氨酸;丙氨酸、甘氨酸和丝氨酸;以及苯丙氨酸、色氨酸和酪氨酸在此都被定义为生物学功能等价物。本领域人员也知道其他的生物学功能等价的变化。
在进行生物学功能等价的氨基酸取代时,可以考虑氨基酸的hydropathic指数。根据每种氨基酸的疏水性和电荷特征,给每种氨基酸都指定了hydropathic指数,它们是:异亮氨酸(+4.5)、缬氨酸(+4.2)、亮氨酸(+3.8)、苯丙氨酸(+2.8)、半胱氨酸(+2.5)、甲硫氨酸(+1.9)、丙氨酸(+1.8)、甘氨酸(-0.4)、苏氨酸(-0.7)、丝氨酸(-0.8)、色氨酸(-0.9)、酪氨酸(-1.3)、脯氨酸(-1.6)、组氨酸(-3.2)、谷氨酸(-3.5)、谷氨酰胺(-3.5)、天冬酸(-3.5)、天冬酰胺(-3.5)、赖氨酸(-3.9)、和精氨酸(-4.5)。
本领域一般都了解氨基酸hydropathic指数在赋予蛋白的相互作用的生物学功能上的重要性(Kyte&Doolittle,1982,在此通过引用并入本申请)。已知某些氨基酸可以被其他的具有相似hydropathic指数或积分的氨基酸所取代,并仍保持由相似的生物学活性。在根据hydropathic指数进行改变时,对氨基酸的取代可以包括在一些实施方式中其hydropathic指数是在原始值的±2之内的氨基酸,在一些实施方式中是在原始值的±1之内的氨基酸,以及在一些实施方式中是在原始值的±0.5之内的氨基酸。
本领域也了解根据亲水性可以有效地进行相似氨基酸的取代。美国专利No.4,554,101(在此通过引用将其并入本申请)陈述了蛋白的最好的局部平均亲水性(通过其相邻氨基酸的亲水性所获得)与蛋白的免疫原性和抗原性(即蛋白的生物学性能)的相关性。已知氨基酸可以被另一种具有相似亲水性数值的氨基酸所取代并仍获得了生物学等价的蛋白。
如美国专利No.4,554,101所详细阐述的那样,给氨基酸残基指定了下面的亲水性数值:精氨酸(+3.0)、赖氨酸(+3.0)、天冬酸(+3.0±1)谷氨酸(+3.0±1)、丝氨酸(+0.3)、天冬酰胺(+0.2)、谷氨酰胺(+0.2)、甘氨酸(0)、苏氨酸(-0.4)、脯氨酸(-0.5±1)、丙氨酸(-0.5)、组氨酸(-0.5)、半胱氨酸(-1.0)、甲硫氨酸(-1.3)、缬氨酸(-1.5)、亮氨酸(-1.8)、异亮氨酸(-1.8)、酪氨酸(-2.3)、苯丙氨酸(-2.5)、色氨酸(-3.4)。
在根据相似的亲水性数值进行改变时,对氨基酸的取代可以包括在一些实施方式中其亲水性数值是在原始值的±2之内的氨基酸,在一些实施方式中是在原始值的±1之内的氨基酸,以及在一些实施方式中是在原始值的±0.5之内的氨基酸。
当讨论集中于氨基酸改变所造成的功能等价的多肽时,考虑到遗传密码子是简并的,以及两个或更多个密码子可以编码同一氨基酸,将明白通过变更编码DNA可以实现这些改变。
在一些实施方式中,具有基本上相同性的序列具有至少一个氨基酸的缺失或插入。在一些实施方式中,缺失或插入是少于约10个氨基酸的缺失或插入。在一些实施方式中,缺失或插入是少于约3个氨基酸的缺失或插入。
在一些实施方式中,具有基本上相同性的序列编码至少一个氨基酸的取代。
本发明的实施方式也提供了包括选自由下面序列构成的组的多肽序列的分离的多肽:
(a)具有与SEQIDNO:2所列的多肽序列、或其结构域或特征基本上相同的多肽序列;
(b)由与在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其外显子、结构域、或特征、或其互补序列杂交的核苷酸序列相同的或具有基本上相同性的核苷酸序列所编码的多肽;和
(c)(a)或(b)的功能片段。
在一些实施方式中,具有与SEQIDNO:2所列的多肽序列、或其结构域或特征基本上相同性的多肽是SEQIDNO:2所列的多肽序列的等位变体。在一些实施方式中,具有与SEQIDNO:2所列的多肽序列、或其结构域或特征基本上相同性的多肽是SEQIDNO:2所列的多肽序列的天然存在的变体。在一些实施方式中,具有与SEQIDNO:2所列的多肽序列、或其结构域或特征基本上相同性的多肽是SEQIDNO:2所列的多肽序列的多态性变体。
在一些实施方式中,多肽是包括SEQIDNO:2所列的氨基酸序列的多肽的定向进化同源物。在一些实施方式中,多肽是包括SEQIDNO:2所列的氨基酸序列的多肽的定向进化同源物的功能片段或结构域。在一些实施方式中,多肽是嵌合体,其中嵌合体包括功能性的多肽结构域,其包括但不限定于多肽的结构域、重复、翻译后修饰位点、以及它们的组合物。在一些实施方式中,多肽是植物多肽。在一些实施方式中,植物是双子叶植物。在一些实施方式中,植物是蜀黍。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是玉米。
在一些实施方式中,多肽被表达于植物的特殊部位或组织。在一些实施方式中,部位或组织包括但不限定于表皮、维管组织、分生组织、形成层、皮层或木髓。在一些实施方式中,部位或组织是叶或叶鞘、根、花、和发育中的胚珠或种子。在一些实施方式中,部位或组织可以是例如表皮、根、维管组织、分生组织、形成层、皮层、木髓、叶、或花。在一些实施方式中,部位或组织是种子。
在一些实施方式中,多肽序列是由在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征、或其互补序列杂交的核苷酸序列所编码的,其中核苷酸序列包括至少一个核苷酸的缺失或插入。在一些实施方式中,缺失或插入是至少约30个核苷酸的缺失或插入。在一些实施方式中,缺失或插入是少于约5个核苷酸的缺失或插入。在一些实施方式中,由在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征、或其互补序列杂交的核苷酸序列所编码的多肽序列包括至少一个密码子的取代。在一些实施方式中,取代是保守取代。在一些实施方式中,具有与SEQIDNO:2的多肽序列、或其片段、结构域、重复、特征、或其嵌合体基本上相同性的多肽序列包括至少一个氨基酸的缺失或插入。
本发明的多肽、其片段、或其变体可以包括任何数目的来自本发明的多肽的连续的氨基酸残基,其中残基的数目选自由从10个到本发明的全长多肽的残基的数目所构成的整数组。在一些实施方式中,多肽的一部分或片段是功能多肽。在一些实施方式中,本发明包括具有天然(非合成的)内源性多肽的至少20%的特异活性的活性多肽,在一些实施方式中为至少30%,在一些实施方式中为至少40%,在一些实施方式中为至少50%,在一些实施方式中为至少60%,在一些实施方式中为至少70%,在一些实施方式中为至少80%,在一些实施方式中为至少90%,以及在一些实施方式中为至少95%。此外,底物特异性(Kcat/Km)基本上等同于天然的(非合成的)、内源性多肽。在一些实施方式中,Km通常至少是天然的、内源性多肽的30%,在一些实施方式中至少是40%,在一些实施方式中至少是天然的、内源性多肽的50%,在一些实施方式中至少是60%,在一些实施方式中至少是70%,在一些实施方式中至少是80%,以及在一些实施方式中至少是天然的、内源性多肽的90%。检测并定量测定活性和底物特异性的方法对于本领域人员是公知的。
当被呈递作为免疫原时,本发明的分离的多肽可以引发产生与本发明的多肽特异性反应的抗体。因此,可以采用本发明的多肽作为用于构建与本发明的多肽免疫反应的抗体的免疫原,其用途包括但不限定于免疫检测或多肽纯化技术。用于确定结合力的免疫检测法对于本领域人员是公知的,其包括但不限定于酶联免疫吸附检测法(ELISA)和竞争性免疫检测法。
本发明的实施方式也涉及当前所阐述的分离的核酸分子所编码的嵌合多肽,其包括含有由含有选自组的核苷酸序列的分离的核酸所编码的多肽序列的嵌合多肽,所述组包括:
(a)    在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其外显子、结构域、或特征杂交的核苷酸序列;
(b)与(a)互补(例如完全互补)的核苷酸序列;和
(c)与(a)反向互补(例如完全反向互补)的核苷酸序列;
(d)或其功能片段。
IV.控制并变更核酸分子的表达
IV.A.概述
本发明的一个方面提供了用于变更(即增加或减少)植物中的本发明的核酸分子和/或多肽的水平的组合物和方法。具体地,本发明的核酸分子和多肽可以被组成地、临时地、或空间分隔地(例如在发育阶段)等表达于某些组织,和/或表达一定的数量,这不是未重组遗传加工的植物的特征。因此,本发明提供了变更上面所鉴定的特殊特征在这些实例应用中的用途。
本发明的分离的核酸分子可用于在重组遗传加工的细胞例如细菌、酵母、昆虫、哺乳动物、或植物细胞中表达本发明的多肽。表达细胞可以产生非天然条件下的多肽(例如数量、组成、部位、和/或时间),因为所述表达细胞已经被遗传学变更成如此。本领域人员知道各种可用于表达编码本发明的多肽的核酸的表达系统。
本发明的实施方式提供了表达盒,其包括与分离的核酸可操纵地连接的启动子序列,分离的核酸包括:
(a)在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列;
(b)与(a)互补(例如完全互补)的核苷酸序列;和
(c)与(a)反向互补(例如完全反向互补)的核苷酸序列;
本发明还包括包括本发明的实施方式的表达盒的重组载体。也包括包括本发明的表达盒的植物细胞,以及包括这些植物细胞的植物。在一些实施方式中,植物是双子叶植物。在一些实施方式中,植物是蜀黍。在一些实施方式中,单子叶植物是谷类植物。在一些实施方式中,谷类植物可以是例如玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、黑麦、单粒小麦、斯佩尔特小麦、双粒小麦、Teff、Milo、亚麻、格兰马草、摩擦禾属、或假蜀黍。在一些实施方式中,谷类植物是玉米。
在一些实施方式中,表达盒在整个植物中都表达。在一些实施方式中,表达盒被表达于植物的特殊部位或组织。在一些实施方式中,部位或组织包括但不限定于表皮、根、维管组织、分生组织、形成层、皮层、木髓、叶、花、种子、以及它们的组合物。在一些实施方式中,部位或组织是种子。在一些实施方式中,部位或组织是种子的蛋白体。
本发明的实施方式也涉及包括选自组的核酸分子的表达载体,所述组包括:
(a)编码SEQIDNO:2所列的多肽、或其定向进化同源物的核酸;
(b)  在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列杂交的核苷酸序列的片段、结构域、或特征区域;和
(c)  在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其片段和异源序列的组合物杂交的完整的核苷酸序列。
在一些实施方式中,表达载体包括一种或多种元件,其包括但不限定于启动子-增强子序列、选择标记序列、复制起点、表位标记编码序列、和亲和纯化标记编码序列。在一些实施方式中,启动子-增强子序列包括例如花椰菜花叶病毒(CaMV)35S启动子、CaMV19S启动子、烟草PR-1a启动子、泛素启动子、或菜豆素启动子。在一些实施方式中,启动子是植物中的操纵型启动子,以及在一些实施方式中,启动子是组成型或诱导型启动子。在一些实施方式中,选择标记序列编码耐抗生素基因。在一些实施方式中,表位标记序列编码V5表位标记(GKPIPNPLLGLDST;SEQIDNO:9;Southernetal.,1991)、肽FHHTT(SEQIDNO:10)、血凝素、或谷胱苷肽-S-转移酶。在一些实施方式中,亲和纯化标记序列编码多氨基酸序列或多肽。在一些实施方式中,多氨基酸序列包括多组氨酸。在一些实施方式中,多肽是壳多糖结合区或谷胱苷肽-S-转移酶。在一些实施方式中,亲和纯化标记序列包括内蛋白编码序列。
在一些实施方式中,表达载体包括真核表达载体,以及在一些实施方式中,表达载体包括原核表达载体。在一些实施方式中,真核表达载体包括组织特异性启动子。在一些实施方式中,表达载体在植物中是可操纵的。
本发明的实施方式也涉及包括核酸构建体的细胞,核酸构建体包括表达载体和核酸,所述核酸包括编码作为SEQIDNO:2所列的多肽的定向进化同源物的多肽的核酸,或包括在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所列的核苷酸序列、或其亚序列和异源序列的组合物杂交的核苷酸序列。
在一些实施方式中,细胞是细菌细胞、真菌细胞、植物细胞、或动物细胞。在一些实施方式中,多肽被表达于植物的特殊部位或组织中。在一些实施方式中,部位或组织包括但不限定于表皮、根、维管组织、分生组织、形成层、皮层、木髓、叶、花、种子、以及它们的组合。在一些实施方式中,部位或组织是种子。
包括但不限定于大肠杆菌以及本领域已知的其他微生物菌株的原核细胞可以被用作宿主细胞。用于在原核细胞中表达多肽的方法在本领域是公知的,并且在许多实验手册(例如Sambrook&Russell,2001)中都可以找到这些方法。本领域人员都可以得到各种控制表达的启动子、核糖体结合位点、和操纵子、以及选择标记例如抗生素耐药基因。所选的载体类型容许在所选的细胞类型中进行最优化的生长和表达。
可以获得各种真核表达系统例如酵母、昆虫细胞系、植物细胞、和哺乳动物细胞。在酵母中表达并合成异源多肽是公知的(见Sherman etal.,1982)。被广泛地用于生产真核多肽的酵母菌株是酿酒酵母和毕赤酵母,并且从商业供应商(例如InvitrogenCorp.,Carlsbad,California,UnitedStatesofAmerica)中都可得到载体、菌株和方案。
可以用用于生产多肽的表达载体转化哺乳动物细胞。本领域人员可获得的合适的宿主细胞系包括,但不限定于HEK293、BHK21、和CHO细胞系。用于这些细胞的表达载体可以包括表达控制序列,例如复制起点、启动子(例如CMV启动子、单纯疱疹病毒胸苷激酶(HSV-tk)启动子或磷酸甘油酸激酶(pgk)启动子)、增强子、以及多肽加工位点例如核糖体结合位点、RNA剪切位点、多腺苷酸化位点、和转录终止序列。其他可用于生产多肽的动物细胞系是商业化可获得的或可以来自保藏单位例如美国典型培养物保藏中心(Manassas,Virginia,United States ofAmerica)。
用于在昆虫细胞中表达多肽的表达载体一般都源自杆状病毒或本领域已知的其他病毒。可获得多种合适的昆虫细胞系,其包括但不限定于蚊幼虫、蚕、粘虫(例如Spodopterafrugiperda)、蛾、和果蝇细胞系。
转化动物和更低等真核细胞的方法是已知的。可以用多种方法将异源DNA引入到真核细胞内,方法包括但不限定于磷酸钙沉淀法、受体细胞与含有DNA的原生质体的融合、用含DNA的脂质体对受体细胞的处理、DEAE葡聚糖、电穿孔法、生物弹射击法、和将DNA直接微注射到细胞内。用本领域公知的方法培养转化细胞(见Kuchler,1997)。
一旦表达出本发明的多肽,利用本领域人员已知的方法可以将其从表达细胞中分离并纯化。可以用Western印迹技术、放射免疫检测法、或其他标准免疫检测技术监测纯化过程。本领域人员熟知并能应用多肽纯化技术(见Scopes,1982;Deutscher,1990)。
本发明的实施方式提供了一种生产重组多肽的方法,其中表达载体包括一种或多种元件,元件包括但不限定于启动子-增强子序列、选择标记序列、复制起点、表位标记编码序列、和亲和纯化标记序列。在一些实施方式中,核酸构建体包括表位标记编码序列,以及分离步骤采用了特异于该表位标记的抗体。在一些实施方式中,核酸构建体包括多氨基酸编码序列,以及分离步骤采用了包括多氨基酸结合物的树脂,在一些实施方式中,其中多氨基酸是多组氨酸以及多氨基酸结合树脂是镍-带电荷的琼脂糖树脂。在一些实施方式中,核酸构建体包括多肽编码序列,以及分离步骤采用了多肽结合物的树脂。在一些实施方式中,多肽是壳多糖结合区以及树脂含有壳多糖-琼脂糖。
利用本领域已知的非细胞的合成方法可以合成本发明的多肽。在Barany&Merrifield,1980;Merrifield etal.,1963;Stewart&Young,1984描述了固相合成技术。
本发明还提供了用于修饰植物或其器官中的本发明的多肽的浓度或组成的方法。通过增加或减少植物中的浓度和/或组成(即本发明的多肽的定额)可以实现修饰。方法包括如上所述的将包括本发明的核酸分子的表达盒引入到植物细胞内,以便获得转化植物细胞或组织,并培养转化植物细胞或组织。核酸分子可以处于组成型或诱导型启动子的调控之下。方法还可以包括诱导或抑制核酸分子序列在植物中的表达一段足以修饰植物或器官中的浓度和/或组成的时间。
用本领域人员已知的方法可以分析并选择具有本发明的核酸分子的修饰表达的植物或植物器官,所述方法包括但不限定于Southern印迹法、DNA测序、或利用特异于核酸分子的引物并检测从中所产生的扩增子的PCR分析。
一般而言,相对于缺少表达盒的天然的对照植物、植物器官、或细胞,在一些实施方式中,浓度或组成被增加或减少了至少5%,在一些实施方式中至少10%,在一些实施方式中至少20%,在一些实施方式中至少30%,在一些实施方式中至少40%,在一些实施方式中至少50%,在一些实施方式中至少60%,在一些实施方式中至少70%,在一些实施方式中至少80%,在一些实施方式中至少90%。
IV.B.同源重组
在一些实施方式中,通过同源重组(如在Paszkowski etal.,1988中进一步所述的)修饰了植物基因组中的至少一个对应于本发明的核苷酸序列的基因组拷贝。该技术利用了同源序列彼此相互识别以及通过在本领域被称作同源重组的过程交换相应核酸分子之间的核苷酸序列的能力。在细胞中的核苷酸序列的染色体拷贝和通过转化被引入到细胞内的核苷酸序列的新拷贝之间可以发生同源重组。因此,特异的修饰可以被准确地引入到核苷酸序列的染色体拷贝中。在一些实施方式中,修饰了本发明的核苷酸序列的调节序列。利用本发明的核苷酸序列或其一部分作为探针,通过筛选基因组文库可以容易地获得这些调节元件。用不同的调节元件取代现有的调节元件,因此变更了核苷酸序列表达,或者可以突变或删除现有的调节序列,因此去除了核苷酸序列的表达。在一些实施方式中,通过删除核苷酸序列的一部分或整个核苷酸序列,或通过突变可以修饰核苷酸序列。本发明也提供了突变多肽在植物细胞内的表达。已经阐述了最近对这种技术用于阻断内源性植物基因的改进方法(Kempinetal.,1997和Miao&Lam,1995)。
在一些实施方式中,通过用由连续的RNA和DNA残基链组成的在其末端具有双发夹帽结构的双链构象的嵌合寡核苷酸转化细胞可以引入核苷酸序列的染色体拷贝中的突变。寡核苷酸的附加特性是例如在RNA残基上具有2’-O-甲基化。RNA/DNA序列被设计为与本发明的核苷酸序列的染色体拷贝的序列排列比较,并含有所需的核苷酸改变。例如,在美国专利No.5,501,967和Zhuetal.,1999中进一步地阐述了这个技术。
IV.C.在植物细胞内的过度表达
在一些实施方式中,编码多肽的本发明的核苷酸序列是被过度表达的。上面阐述了用于过度表达本发明的核酸分子的核酸分子和表达盒的实例。本发明也包括本领域人员已知的过度表达核酸分子的方法。
在一些实施方式中,变更了本发明的核苷酸序列在每个植物细胞内的表达。例如通过同源重组或通过插入到染色体内都可以实现这一点。例如在每个植物细胞中通过在能表达有义或反义RNA、锌指多肽或核酶的启动子的控制下表达有义或反义RNA、锌指多肽或核酶也可以实现这一点。组成的、诱导的、组织特异的、或发育调节的表达也在本发明的范围之内,并造成了本发明的核苷酸序列在植物细胞内的表达的组成的、诱导的、组织特异的、或发育调节的变更。根据本发明的教义例如在此所阐述的教义,可以制备用于表达有义或反义RNA、锌指多肽或核酶、或用于过度表达本发明的核苷酸序列的构建体,并将其转化到植物细胞内。
IV.D.植物表达载体的构建
首先可以将预计用于在转基因植物中表达的编码序列组装到与在植物中可表达的合适的启动子可操纵地连接的表达盒内。表达盒也可以包括任何其他的表达转基因所需的或所选的序列。这些序列包括但不限定于转录终止子、增强表达的外来序列例如内含子、致病序列、和预计用于将基因产物导向特异细胞器和细胞间隔的序列。然后可以将这些表达盒容易地转移到下面所述的植物转化载体中。下面是对经典表达盒的各种组分的描述。
IV.D.1.启动子
对表达盒内所用的启动子的选择可以确定出转基因在转基因植物中的空间及时间表达模式。所选的启动子可以在特异的细胞类型(例如,叶外胚层细胞、叶肉细胞、根皮质细胞、和/或胚乳细胞)或特异的组织或器官(例如根、叶、花、和/或种子)中表达转基因,并且该选择可以反映出所需的基因产物的蓄积部位。同样,所选的启动子可以驱动在各种诱导条件下表达基因。启动子在其强度(即它们启动转录的能力)上可以有所不同。依赖于所用的宿主细胞系统,可以使用大量合适启动子中的任一种启动子,包括基因的天然启动子。下面是可以用于表达盒的启动子的非受限的实例。
IV.D.1.a.组成表达:泛素启动子
泛素是已知能蓄积在多种细胞类型中的基因产物,已经从一些用于转基因植物的物种(例如向日葵-Binetetal.,1991;玉米-Christensen&Quail,1989;和Arabidopsis-Callisetal.,1990;Norrisetal.,1993)中克隆出它的启动子。在转基因单子叶植物系统中已经研制出玉米泛素启动子,在专利文献EP0342926(Lubrizol)中阐述了它的序列以及所构建的用于单子叶植物转化的载体,在此通过引用将其并入申请。Taylor etal.,1993描述了一种载体(pAHC25),其包括玉米泛素启动子和第一内含子,并具有在多种单子叶植物的细胞悬浮液中的高活性(当经微粒轰击将其引入到细胞内时)。拟南芥泛素启动子适用于本发明的核苷酸序列。泛素启动子适用于转基因植物(单子叶和双子叶植物)中的基因表达。合适的载体是经引入适当的泛素启动子和/或内含子序列所修饰的pAHC25的衍生物或任一在此所述的转化载体。
IV.D.1.b.组成表达:CaMV35S启动子
在已发表的专利文献EP0392225(实施例23)中阐述了对质粒pCGN1761的构建,在此通过引用将其并入本申请。pCGN1761含有“双份”CaMV35S启动子和tml转录终止子,并且在启动子和终止子之间具有独特的EcoRI位点,以及具有pUC型骨架。构建出pCGN1761的衍生物,其具有经修饰的多位点接头,除了已有的EcoRI位点外,还包括NotI和XhoI位点。该衍生物被称作pCGN1761ENX。在转基因植物中,在35S启动子的控制下表达该载体的目的是,pCGN1761ENX可用于克隆其多位点接头内的cDNA序列或编码序列(包括微生物的ORF序列)。用启动子5’端的HindIII、SphI、SalI、和XbaI位点以及终止子3’端的XbaI、BamHI和BglI位点可以切割下这样一种构建体的完整的35S启动子-编码序列-tml终止子表达盒,其可用于被转移到如在下面所述的那些转化载体中。此外,通过HindIII、SphI、SalI、XbaI、或Pst1的5’切割以及任一多位点接头限制性位点(EcoRI、NotI或XhoI)的3’切割可以去除双重35S启动子片段,用另一种启动子将其取代。如果需要,通过引入能增强翻译的序列可以进行克隆位点周围的修饰。当需要过度表达时,这是特别有用的。例如,如美国专利No.5,639,949的实施例37所述的,通过优化翻译起始位点可以修饰pCGN1761ENX,在此通过引用将其并入本申请。
IV.D.l.c组成表达:肌动蛋白启动子
已知一些肌动蛋白的亚型在大多数细胞类型中都有所表达,因此肌动蛋白启动子可被用作组成型启动子。具体地,已经克隆并描述了来自水稻ActI基因的启动子(McElroyetal.,1990)。发现启动子的1.3千碱基(Kb)片段含有所有的在水稻原生质体中表达所需的调节元件。此外,已经特异地构建出用于单子叶植物的多个基于ActI启动子的表达载体(McElroyetal.,1991)。这些表达载体整合了ActI-内含子1、AdhI5’侧序列(来自玉米乙醇脱氢酶基因)和AdhI-内含子以及来自CaMV 35S启动子的序列。表现出最高表达的载体是35S和ActI内含子或ActI5’侧序列和ActI内含子的融合物。对起始ATG周围的序列(β-葡糖醛缩酶(GUS)报告基因)的优化也增强表达。可以容易地修饰用于表达的在McElroyetal.,1991中所述的启动子表达盒,它特别适用于单子叶植物宿主。例如,从McElroy构建体中取出含启动子的片段,并将其用于取代pCGN1761ENX中的双重35S启动子,这可用于插入特异的基因序列。因此,可以将所构建的融合基因转移到合适的转化载体内。在一个独立的报告中,也已经发现水稻ActI启动子及其第一内含子指导了在所培养的大麦细胞中的高表达(Chibbaretal.,1993)。
IV.D.1.d.诱导表达:PR-1启动子
可以用所选的能造成合适高表达水平的任何其他的启动子取代pCGN1761ENX中的双重35S启动子。举例说明,在美国专利中所述的其中一种化学可调节的启动子No.5,614,395例如烟草PR-1启动子可以取代双重35S启动子。同样,可以使用在Lebel等,1998中所述的拟南芥PR-1启动子。通过限制性内切酶可以从其来源中切割下所选的启动子,但是所选的启动子同样可以是利用携带有合适的末端的限制性位点的引物所PCR扩增到的。当进行PCR扩增时,在将所扩增的启动子克隆到靶载体之后,可以重新测序启动子以检查扩增错误。从质粒pCIB1004(对于其构建,见EP0332104的实施例21,在此通过引用将其并入本申请)中解离出化学地/病原体可调节的烟草PR-1a启动子,并将其转移到质粒pCGN1761ENX(Uknesetal.,1992)。用NcoI解离出pCIB1004,通过T4DNA聚合酶的处理将所形成的线性化片段的3’悬突钝化。然后用HindIII解离所述片段,凝胶纯化所形成的含PR-1a启动子片段,并将其克隆到其中已经去除了双重35S启动子的pCGN1761ENX内。通过XhoI的解离以及T4聚合酶的钝化,随后用HindIII解离,分离出含更大载体终止子的片段,并将其克隆到pCIB1004启动子片段内,可以实现这一点。这就产生了具有PR-1a启动子和tml终止子以及所插入的具有唯一的EcoRI和NotI位点的多位点接头的pCGN1761ENX衍生物。可以将所选的编码序列插入到该载体内,随后可以将融合产物(即启动子-基因-终止子)转移到任一所选的转化载体中,包括那些在此所述的转化载体。可以采用各种化学调节物以诱导所选的编码序列在本发明的转化植物中的表达,所述调节物包括苯并噻二嗪、异烟腙以及在美国专利Nos.5,523,311和5,614,395中所述的水杨酸化合物。
IV.D.1.e.诱导表达:乙醇诱导型启动子
由某些醇或酮(例如乙醇)诱导的启动子也可以被用于进行本发明的编码序列的诱导表达。这样一种启动子是例如来自构巢曲霉的alcA启动子(Caddicketal.,1998)。在构巢曲霉中,alcA基因编码乙醇脱氢酶I,化学诱导物经AlcR转录因子调节它的表达。对于本发明的目的,用本发明的编码序列取代包括alcA基因启动子的质粒palcA:CAT中的CAT编码序列,以便形成具有在alcA基因启动子控制下的编码序列的表达盒。用本领域已知的方法可以实现这一点。
IV.D.1.f.诱导表达:糖皮质激素诱导型启动子
也提供了利用基于类固醇激素的系统对本发明的核苷酸序列的表达的诱导。例如,使用了糖皮质激素介导的诱导系统,并通过施用糖皮质激素例如合成的糖皮质激素(例如地塞米松)诱导基因表达,糖皮质激素的浓度范围在一些实施方式中是从0.1mM到1mM,以及在一些实施方式中是从10mM到100mM。对于本发明的目的,用本发明的核苷酸序列取代萤光素酶基因序列(Aoyama&Chua,1997),以便形成具有在与35S最小启动子融合的6个拷贝的GAL4上游激活序列控制下的本发明的核苷酸序列的表达盒。用本领域已知的方法可以实现这一点。顺式作用因子包括与疱疹病毒多肽VP16的顺式激活区(Triezenbergetal.,1988)相融合的GAL4DNA结合区(Keeganetal.,1986),所述VP16多肽与鼠糖皮质激素受体的激素结合区(Picardetal.,1988)相融合。通过本领域已知的启动子或在此所述的启动子控制融合多肽的表达。也提供了包括表达盒的植物,所述表达盒包括与6xGAL4/最小启动子相融合的本发明的核苷酸序列。因此,实现了融合多肽的组织或器官特异性,导致了所表达的核苷酸序列的可诱导的组织或器官特异性。
IV.D.1.g.根特异性表达
基因表达的另一种模式是根表达。合适的根启动子是在deFramond,1991以及在美国专利No.5,466,785中所述的玉米金属硫蛋白样(MTL)基因的启动子,在此通过引用将每个文献的内容都并入本申请。将这个“MTL”启动子转移到用于插入所选基因的合适载体例如pCGN1761ENX中,随后将整个启动子-基因-终止子转移到相关的转化载体内。
IV.D.1.h.创伤诱导型启动子
创伤诱导型启动子也可以适用于基因表达。已经描述了多种这样的启动子(例如,Xuetal.,1993;Logemannetal.,1989;Rohrmeier&Lehle,1993;Fireketal.,1993;Warneretal.,1993),并且所有的启动子都适合用于本发明。Logemann等描述了双子叶植物马铃薯wunI基因的5’上游序列。Xu等显示了来自双子叶植物马铃薯(pin2)的创伤诱导型启动子在单子叶植物水稻中是有活性的。此外,Rohrmeier&Lehle描述了对玉米WipI cDNA的克隆,WipI cDNA是创伤诱导的,并能用于利用标准技术分离出同种启动子。同样,Firek等和Warner等已经描述了来自单子叶植物Asparagusofficinalis的创伤诱导型基因,其表达于局部创伤部位及病原体侵入部位。利用本领域公知的克隆技术,可以将这些启动子转移到合适的载体内,并与本发明的基因融合,并被用于在植物创伤的部位表达这些基因。
IV.D.1.i.木髓优选的表达
PCT国际文献WO93/07278(在此通过引用并入本申请)描述了对玉米trpA基因的分离,该基因优选地表达于木髓细胞中。显示了最大延伸到离转录起点-1726碱基对处的基因序列和启动子。利用标准的分子生物学技术,可以将该启动子或其一部分转移到载体(例如pCGN1761)中,其中它可以取代35S启动子,并被用于驱动以木髓优选的方式表达外来基因。事实上,可以将含有木髓优选的启动子或其一部分的片段转移到任一载体内,并将其修饰用于转基因植物。
IV.D.1.i.叶特异性表达
Hudspeth&Grula,1989已经描述了编码磷酸烯醇羧化酶(PEPC)的玉米基因。利用标准的分子生物学技术,该基因的启动子可以用于驱动在转基因植物中以叶特异性方式表达任一基因。
IV.D.1.k.花粉特异性表达
WO93/07278描述了对在花粉细胞中表达的玉米的钙依赖性蛋白激酶(CDPK)基因的分离。基因序列和启动子最大延伸到离转录起点1400碱基对(bp)处。利用标准的分子生物学技术,该启动子或其一部分可以被转移到载体(例如pCGN1761)中,其中它可取代35S启动子,并被用于驱动以花粉特异性方式表达本发明的核苷酸序列。
IV.D.1.1.种子特异性表达
在一些实施方式中,本发明的核酸分子可以被表达于种子内,和/或表达于种子的蛋白体内。如在此所述的,可以用从Q蛋白基因中分离处的核苷酸序列(SEQIDNO:6)指导异源序列在植物种子中的表达。利用标准的分子生物学技术,该启动子或其一部分可以被转移到载体(例如pCGN1761)中,其中它取代了35S启动子,并被用于驱动以种子特异性方式表达本发明的核苷酸序列。
IV.D.2.转录终止子
各种转录终止子都可被用于表达盒。它们作用为终止转录并纠正mRNA的多腺苷酸化。合适的转录终止子是那些已知在植物中发挥作用的转录终止子,其包括CaMV35S终止子、tml终止子、胆脂碱合酶终止子、和碗豆rbcSE9终止子。它们都可被用于单子叶植物和双子叶植物。另外,可以使用基因的天然的转录终止子。
IV.D.3.用于增强或调节表达的序列
已经发现来自转录单位内的多个序列都可增强基因表达,可以结合本发明的基因使用这些序列,以便增加所述基因在转基因植物中的表达。
各种内含子序列已经显示出增强表达,特别是在单子叶植物细胞内。例如,已经发现玉米AdhI基因的内含子显著地增强了在其同种启动子下的野生型基因的表达,当其被引入到玉米细胞内时。发现内含子1是特别有效的,并增强了具有氯霉素乙酰转移酶基因的融合构建体的表达(Callis等,1987)。在相同的试验系统中,来自玉米bronze1基因的内含子在增强表达上具有相似的作用。内含子部分已经被常规地整合到植物转化载体内,通常是在非翻译的前导部分。
也已知多种来源于病毒的非翻译的前导序列能增强表达,它们在双子叶植物中是特别有效的。具体地,来自烟草花叶病毒(TMV,“W序列”)、玉米萎黄病斑点病毒(MCMV)、和苜蓿花叶病毒(AMV)的前导序列已经显示出能有效地增强表达(见例如,Gallieetal.,1987;Skuzeskietal.,1990)。本领域已知的其他前导序列包括,但不限定于微小RNA病毒前导序列,例如脑炎心肌炎病毒(EMCV)前导序列(5’端非编码区,见Elroy-Steinetal.,1989);马铃薯Y病毒前导序列,例如来自烟草蚀纹病毒(TEV,见see Allisonetal.,1986)、玉米矮小花叶病毒(MDMV,见Kong&Steinbiss 1998)的前导序列;人免疫球蛋白重链结合多肽(BiP)前导序列(Macejak&Sarnow,1991);来自苜蓿花叶病毒的被膜多肽mRNA的非翻译的前导序列(AMV,RNA4,见Jobling&Gehrke,1987);烟草花叶病毒(TMV)前导序列(Gallieetal.,1989);和玉米萎黄病斑点病毒(MCMV)前导序列(Lommeletal.,1991)。也见Della-Cioppaetal.,1987。
除了将上面所提及的一种或多种元件整合到本发明的靶表达盒的5’调节区内以外,也可以整合其他的元件。这些元件包括,但不限定于最小启动子。最小启动子的意义是该基本启动子元件在缺少上游或下游激活的情况下是没有活性的或基本没有活性的。当不存在顺式激动剂或当增强子或应答元件结合位点都不存在时,这样一种启动子在植物中具有低的背景活性。对于植物中的靶基因特别有用的一种最小启动子是Bz1最小启动子,它是从玉米的bronze1基因中得到的。通过位于位点-53到-58的NheI位点上的解离,从“myc”突变体Bz1-萤光素酶构建体pBzlLucR98中得到了Bz1核心启动子(Roth等,1991)。因此,所形成的Bz1核心启动子片段从位点-53延伸到+227,并包括5’非翻译区的Bz1内含子1。也能用于本发明的是通过应用合成的TATA元件所产生的最小启动子。TATA元件容许RNA聚合酶因子对启动子的识别,并赋予了在没有激活情况下的基础水平的基因表达(通常见于,Mukumotoetal.,1993;Green,2000)。
IV.D.4.基因产物在细胞内的靶向作用
已知在植物中存在着各种用于靶向基因产物的机制,已经较详细地描述了控制这些机制的功能性的序列。例如,通过在各种多肽的氨基末端上所发现的信号序列控制基因产物向叶绿体内的靶向作用,在输入到叶绿体的过程中,解离出信号序列以便产生成熟的多肽(见例如Comaietal.,1988)。这些信号序列可以与异源的基因产物融合以实现异源产物向叶绿体内的输入(VandenBroecketal.,1985)。可以从编码核酮糖-1,5-二磷酸羧化酶/氧化酶(RUBISCO)多肽、叶绿素a/b结合(CAB)多肽、5-烯醇-pyruvyl莽草素-3-磷酸(EPSP)合酶、GS2多肽和许多其他的已知位于叶绿体内的多肽的cDNA的5’末端分离出编码合适的信号序列的DNA。也见于,美国专利No.5,639,949的实施例37中的题为“导向叶绿体的表达”的章节,在此通过引用并入本申请。
其他基因产物可以定位于其他的细胞器例如线粒体和过氧化物酶体(例如Ungeretal.,1989)。也可以加工处理编码这些产物的cDNA以实现将异源基因产物导向这些细胞器。这些序列的实例是导向线粒体的核编码的ATP酶和特异的天冬氨酸氨基转移酶亚型。Rogers等,1985已经描述了靶向的细胞多肽体。
另外,已经描述了控制基因产物导向其他细胞间隔的序列。氨基末端序列造成了序列导向内质网(ER)、质外体,以及aleurone细胞的细胞外分泌(Koehler&Ho,1990)。此外,氨基末端序列结合羧基末端序列造成了基因产物的空泡靶向作用(Shinshietal.,1990)。
通过上面所述的合适的靶序列与相关的转基因序列的融合,指导转基因产物导向任一细胞器或细胞间隔是有可能的。对于叶绿体的靶向作用,例如来自RUBISCO基因、CAB基因、EPSP合酶基因、或GS2基因的叶绿体信号序列与转基因的氨基末端的ATG框内融合。所选的信号序列可以包括已知的解离位点,以及所构建的融合体可以含有解离位点之后的解离所需的任何氨基酸。在一些情况中,通过在解离位点和转基因ATG之间添加少数氨基酸、或同样地取代转基因序列内的一些氨基酸都可以满足这种需要。利用Bartlettetal.,1982和Wasmann etal.,1986所阐述的技术,通过对体外转录的构建体的体外翻译以及随后的体外叶绿体摄取可以测试所构建的用于叶绿体输入的融合体的叶绿体摄取的效率。这些构建技术在本领域是公知的,并被平等地应用于线粒体和过氧化物酶体。
最后,利用包括Q蛋白启动子(SEQIDNO:6)的核苷酸序列,可以完成异源序列的种子特异性的表达。因此,包括与SEQIDNO:6可操纵地连接的异源编码序列的表达构建体可以被用于指导核苷酸序列在种子内的表达,在一些实施方式中,其可被用于生产包括异源编码序列所编码的多肽的蛋白体。
不仅可以结合它们的同种启动子使用上述的细胞靶向作用的机制,也可以结合异源启动子使用上述的细胞靶向作用的机制,以便实现在启动子的转录调节下的特异的细胞靶向作用的目的,所述启动子具有不同于靶向信号所来源的物种的启动子的表达模式。
IV.E.植物转化载体的构建
多种可用于植物转化的转化载体对于植物转化领域的一般人员都是已知的,并且可以结合任一这样的载体使用从属于本发明的基因。对载体的选择将依赖于所选的转化技术以及用于转化的靶物种。对于某些靶物种,可以采用不同的抗生素或除草剂的选择标记物。在转化中常规使用的选择标记物包括nptII基因,它赋予了对卡那霉素和相关抗生素的耐药性(Messing&Vieira,1982;Bevanetal.,1983);bar基因,它赋予了对除草剂phosphinothricin(Whiteetal.,1990;Spenceretal.,1990)的耐药性;hph基因,它赋予了对抗生素潮霉素的耐药性(Blochinger&Diggelmann,1984);dhfr基因,它赋予了对甲氨蝶呤的耐药性(Bourouis&Jarry,1983);EPSP合酶基因,它赋予对草甘膦的耐药性(美国专利Nos 4,940,935和5,188,642);和甘露糖-6-磷酸异构酶基因,它提供了代谢甘露糖的能力(美国专利Nos.5,767,378和5,994,629)。
IV.E.1.适用于土壤杆菌转化的载体
多种载体都可用于利用土壤杆菌的转化。它们通常携带有至少一个T-DNA边缘序列,并包括载体例如pBIN19(Bevan,1984)。下面,阐述了适用于土壤杆菌转化的两种常用载体的构建。
IV.E.1.a.pCIB200和pCIB2001
用二元载体pCIB200和pCIB2001构建用于土壤杆菌的重组载体,并按下面的方式进行构建。通过NarI消化pTJS75(其容许切除四环素耐药基因)以及随后插入来自携带有NPTII序列的pUC4K的AccI片段(Messing&Vieira,1982;Bevanetal.,1983;McBride&Summerfelt.1990),产生了pTJS75kan(Schmidhauser&Helinski,1985)。将XhoI连接物连接到含有左侧及右侧T-DNA边缘的PCIB7的EcoRV片段,将植物可选择的nos/nptII嵌合基因以及pUC多位点接头(Rothsteinetal.,1987)、和XhoI消化过的片段克隆到SalI消化过的pTJS75kan中,以便产生pCIB200 (也见于EP0332104,实施例19)。pCIB200含有下面的独特的多位点接头限制性位点:EcoRI、SstI、KpnI、BglII、XbaI、和SalI。pCIB2001是通过pCIB200插入到具有附加的限制性位点的多位点接头内所产生的pCIB200的衍生物。pCIB2001的多位点接头中的独特的限制性位点是EcoRI、SstI、KpnI、BglII、XbaI、SalI、MluI、BclI、AvrII、ApaI、HpaI、和StuI。pCIB2001除了含有这些独特的限制性位点外,还含有植物和细菌的卡那霉素选择基因、用于土壤杆菌介导的转化的左侧和右侧T-DNA边缘、作用为大肠杆菌和其他宿主之间的动员作用(mobilization)的RK2衍生的trfA、以及也来自RK2的OriT和OriV functions。pCIB2001多位点接头适用于克隆含有其本身的调节信号的植物表达盒。
IV.E.1.b.pCIB10及其潮霉素选择衍生物
二元载体pCIB10含有编码用于植物选择的卡那霉素耐药性的基因、T-DNA右侧及左侧边缘序列,并整合有来自广泛宿主范围性质粒pRK252的序列,这容许其在大肠杆菌和土壤杆菌内进行复制。Rothstein等,1987阐述了载体的构建。可以构建出整合有Gritz&Davies,1983所述的潮霉素B磷酸转移酶基因的pCIB10的各种衍生物。这些衍生物使得能根据单一的潮霉素(pCIB743)、或潮霉素和卡那霉素(pCIB715、pCIB717)选择转基因植物细胞。
IV.E.2.适用于非土壤杆菌转化的载体
没有使用根瘤土壤杆菌的转化避免了所选转化载体对T-DNA序列的需要,因此除了上面所阐述的含有T-DNA序列的载体外,也可以使用缺失这些序列的载体。不依赖于土壤杆菌的转化技术包括经粒子轰击、原生质体摄取(例如聚乙二醇(PEG)和电穿孔)、以及微注射而实施的转化。对载体的选择主要依赖于所转化的物种。下面,阐述了适用于非土壤杆菌转化的常用载体的构建。
IV.E.2.a.pCIB3064
pCIB3064是适用于联合除草剂
Figure S05807459320060915D000531
(glufosinate ammonium或phosphinothricin)指导基因转化技术的pUC衍生的载体。质粒pCIB246含有与大肠杆菌β-葡糖醛酸酶(GUS)基因可操纵地融合的CaMV35S启动子以及CaMV35S转录终止子,PCT国际文献WO93/07278对此进行了阐述。该载体的35S启动子含有两个起点5’端的ATG序列。利用标准的PCR技术使得这些位点发生了突变,以便去除ATG并产生了限制性位点SspI和PvuII。新的限制性位点距离独特的SalI位点有96和37bp远,距离实际的起点有101和42bp远。所形成的pCIB246的衍生物被称作pCIB3025。然后通过SalI和SacI的消化从pCIB3025中切除GUS基因,将末端钝化并重新连接,产生了质粒pCIB3060。从英格兰诺维奇的JohnInnes中心得到了质粒pJIT82,切下400bp的含有来自产绿色链霉菌的bar基因的SmaI片段,并将其插入到pCIB3060的HpaI位点内(Thompsonetal.,1987)。这就产生了pCIB3062,其包括在CaMV35S启动子控制下的bar基因和用于除草剂选择的终止子、氨苄青霉素耐药性基因(用于大肠杆菌中的选择)以及具有独特位点SphI、PstI、HindIII、和BamHI的多位点接头。该载体适用于克隆含有其本身调节信号的植物表达盒。
IV.E.2.b.pSOG19和pSOG35
pSOG35是将大肠杆菌二氢叶酸还原酶(DHFR)基因用作选择标记物的转化载体,该基因赋予了其对甲氨蝶呤的耐药性。用PCR扩增35S启动子(-800bp)、来自玉米Adh1基因的内含子6(-550bp)、和来自pSOG10的18bp的GUS的非翻译的前导序列。也用PCR扩增编码大肠杆菌II型二氢叶酸还原酶基因的250bp片段,组装这两个PCR片段和来自pB1221(BDBiosciencesClontech,PaloAlto,California,UnitedStatesofAmerica)的含有pUC19载体骨架和胆脂碱合酶终止子的SacI-PstI片段。这些片段的组装产生了pSOG19,其含有与内含子序列融合的35S启动子、GUS前导序列、DHFR基因、和胆脂碱合酶终止子。用来自玉米萎黄病花叶病毒(MCMV)的前导序列取代pSOG19中的GUS前导序列产生了载体pSOG35。pSOG19和pSOG35携带有耐氨苄青霉素的pUG基因以及具有适用于克隆外来物质的HindIII、SphI、PstI、和EcoRI位点。
IV.E.3.适用于叶绿体转化的载体
为了在植物质体中表达本发明的核苷酸序列,使用了质粒转化载体pPH143(PCT国际文献WO97/32011的实施例36)。将核苷酸序列插入到pPH143内,以取代原卟啉原氧化酶(Protox)编码序列。然后将该载体用于质粒转化以及选择壮观霉素耐药的转化体。同样,将核苷酸序列插入到pPH143内,使得其取代aadH基因。对此,选择耐Protox抑制物的转化体。
IV.F.转化
一旦已经将本发明的核苷酸序列克隆到表达系统内,其被转化到植物细胞内。可以以多种本领域已知的方式将本发明的受体和靶表达盒引入到植物细胞内。用于再生植物的方法在本领域也是公知的。例如,Ti质粒载体、以及DNA摄取、脂质体、电穿孔、微注射、和微粒都已经被用于转运外来DNA。另外,可以用来自土壤杆菌属的细菌转化植物细胞。下面描述了用于转化双子叶和单子叶植物的代表性技术以及代表性的质粒转化技术。
IV.F.1.双子叶植物的转化
用于转化双子叶植物的技术在本领域是公知的,其包括基于土壤杆菌的技术以及不需要土壤杆菌的技术。非土壤杆菌技术包括原生质体或细胞对异源遗传学物质的直接摄取。通过PEG或电穿孔介导的社却、离子轰击阶段的转运、或微注射都也可以完成这一点。在Paszkowskietal.,1984、Potrykusetal.,1985、Reichetal.,1986、和Kleinetal.,1987中阐述了这些技术的实例。在每种情况中,利用本领域已知的标准技术将转化细胞再生成了整个植物。
基于土壤杆菌的转化是转化双子叶植物的有用技术,因为其具有高的转化效率以及对多种不同物种的广泛的适用性。土壤杆菌转化通常包括携带有相关的外来DNA的二元载体(例如,pCIB200或pCIB2001)向合适的土壤杆菌菌株的转移,这依赖于共生Ti质粒上的或染色体上的宿主土壤杆菌菌株所携带的vir基因的互补物(例如,菌株CIB542对pCIB200和pCIB2001(Uknesetal.,1993))。通过三亲交配方法实现重组二元载体向土壤杆菌内的转移,所述三亲交配方法使用了携带有重组二元载体的大肠杆菌、携带有质粒例如pRK2013质粒的辅助大肠杆菌菌株,该辅助菌株能将重组二元载体动员到靶向土壤杆菌菌株中。同样,通过DNA转化可以将重组二元载体转移到土壤杆菌中(H
Figure 058074593_0
fgen&Willmitzer,1988)。
经重组体土壤杆菌对靶向植物物种的转化通常包括土壤杆菌与植物外植块的共培养,按照本领域公知的方案。在选择培养基上再生出转化组织,所述组织携带有存在于二元质粒T-DNA边缘之间的抗生素或除草剂耐药标记物。
另一种用基因转化植物细胞的方法包括往植物组织或细胞内推进惰性的或生物学活性的颗粒。在美国专利Nos.4,945,050、5,036,006、和5,100,792中阐述了这种技术,所有专利都被授权给Sanford等。一般而言,这个技术包括在足以穿透细胞的外表面并能整合到其内部的条件下,将惰性的或生物学活性的颗粒推进到细胞内。当使用惰性颗粒时,通过用含有所需基因的载体涂层颗粒可以将载体引入到细胞内。同样,用载体包绕靶细胞,通过唤醒颗粒将载体带入到细胞内。也可以将生物学活性颗粒(例如,干酵母细胞、干细菌、或噬菌体,每个都含有所需引入的DNA)推进到植物细胞组织内。
IV.F.2.单子叶植物的转化
绝大多数单子叶植物的转化现在已经成为常规。示例的技术包括用PEG或电穿孔将基因直接转移到原生质体内,以及用离子轰击将基因转移到愈伤组织内。用单一DNA物种或多DNA物种(及共转化)都可以完成转化,并且这两种技术都适用于本发明。共转化具有的优点是避免了完整载体的构建,并生成具有相关基因和选择标记物的未连锁基因座的转基因植物,这使得在之后的后代中去除了可选择标记物,这被认为是所需要的要求。但是,应用共转化的一个缺点是分离DNA物种的序列被整合到基因组中的频率小于100%(Schocheretal.,1986)。
专利申请EP0292435、EP0392225、和WO93/07278描述了用于从玉米的良种近交系中制备愈伤组织和原生质体、用PEG或电穿孔对原生质体的转化、以及从转化原生质体再生出玉米植物的技术。Gordon-Kammetal.,1990和Frommetal.,1990已经发表了利用离子轰击转化A188衍生玉米系的技术。此外,WO93/07278和Kozieletal.,1993描述了用于经离子轰击转化玉米的良种近交系的技术。这个技术利用了从传粉后14-15天的玉米穗中切下来的1.5-2.5mm长的未成熟的玉米胚芽以及用于轰击的PDS-1000/HeBiolistic粒子转运设备(Bio-RadLaboratories,Hercules,California,UnitedStatesofAmerica)。
通过利用原生质体或离子轰击的直接基因转移技术也可以进行水稻的转化。已经阐述了Japonica型水稻和Indica型水稻的原生质体介导的转化(Zhangetal.,1988;Shimamotoetal.,1989;Dattaetal.,1990)。利用离子轰击也可以常规地转化这两种类型的水稻(Christouetal.,1991)。此外,WO93/21335描述了用于经电穿孔转化水稻的技术。Casas等,1993阐述了经微粒轰击生产转基因的蜀黍植物。
欧洲专利申请EP0332581描述了用于产生、转化、和再生Pooideae原生质体的技术。这些技术容许转化Dactylis和小麦。此外,在Vasiletal.,1992中已经阐述了利用对C型长期再生性愈伤组织细胞的离子轰击所进行的小麦转化,Vasiletal.,1993和Weeksetal.,也利用对不成熟胚芽和不成熟胚芽来源的愈伤组织的离子轰击所进行的转化。
但是,用于小麦转化的代表性技术包括通过对不成熟胚芽的离子轰击所进行的小麦转化,并包括基因转运之前的高蔗糖或高麦芽糖步骤。在轰击之前,将胚芽(长度为0.75-1mm)铺板到用于体细胞胚芽诱导的具有3%蔗糖(Murashige&Skoog,1962)和3mg/l 2,4-二氯苯氧代乙酸(2,4-D)的MS培养基上,这个步骤可以在暗处进行。在选定的轰击的日子,从诱导培养基中取出胚芽,并将其放置到渗压剂(即加有所需浓度的蔗糖或麦芽糖(通常是15%)的诱导培养基)上。容许胚芽进行原浆分离2-3个小时,然后进行轰击。20个胚芽/靶板是常见的,虽然这并非关键。用标准方法将携带合适基因的质粒(例如pCIB3064或pSG35)沉淀到微米大小的金颗粒上。利用每平方英寸约1000磅的攻击压力,利用标准的80筛,用Biolistics设备轰击每个板上的胚芽。在轰击之后,将胚芽放回到暗处,进行复原约24个小时(仍在渗压剂上)。在24个小时之后,从渗压剂中取出胚芽,并放回到诱导培养基上,在再生之前,其在此被放置约1个月。在近1个月之后,将具有发育中的胚芽发生的愈伤组织的胚芽外植物转移到再生培养基(MS+1mg/LNAA,5mg/LGA)中,培养基还含有合适的选择试剂(对于pCIB3064是10mg/l以及对于pSOG35是2mg/l甲氨蝶呤)。在近1个月之后,将发育中的嫩枝转移到更大的无菌容器(称作“GA7s”)中,其中含有半浓度MS、2%蔗糖、以及相同浓度的选择试剂。
也已经阐述了利用土壤杆菌对单子叶植物的转化。见WO94/00977和美国专利No.5,591,616,通过引用将其都并入本申请。也见于Negrottoetal.,2000,在此通过引用并入本申请。Zhaoetal.,2000具体地描述了土壤杆菌对蜀黍的转化。见美国专利No.6,369,298。
可以用水稻(Oryzasativa)生成转基因植物。可以使用各种水稻培养物(Hieietal.,1994;Dongetal.,1996;Hieietal.,1997)。同样,下面所述的各种培养基组分在其数量上都可以有所不同或者可以被取代。通过在MS-CIM培养基(4.3g/升MS基本盐、5ml/l维生素B5(200x)、30g/l蔗糖、500mg/l脯氨酸、500mg/l谷氨酰胺、300mg/l酪蛋白水解物、2ml/l2,4-D(1mg/ml)、用NKOH将pH值调整到5.8with1NKOH、3g/lPhytagel)上的培养开始胚芽发生应答和/或从成熟胚芽中建立培养物。将培养应答最初阶段的成熟胚芽或所建立的培养物系都接种,并将其与含有所需的载体构建体的根瘤土壤杆菌菌株LBA4404(土壤杆菌)共培养。将来自甘油储存液中的土壤杆菌在固体YPC培养基(加有100mg/L壮观霉素和任何其他合适的抗生素)上、28℃下培养2天。将土壤杆菌重悬在液体MS-CIM培养基中。将土壤杆菌培养物稀释到OD600为0.2-0.3,并加入乙酰丁香酮(终浓度为200μM)。在混和融合和水稻培养物之前加入乙酰丁香酮,以便诱导出用于将DNA转移到植物细胞内的土壤杆菌。对于接种而言,将植物培养物浸泡在细菌悬浮液中。去除液体细菌悬浮液,将所接种的培养物放置到共培养培养基上,并在22℃下孵育2天。然后将培养物转移到含有抑制土壤杆菌生长的替卡西林(400mg/l)的MS-CIM培养基中。对于利用PMI选择标记物基因的构建体(Reed等,2001),7天后将培养物转移到甘露糖作为碳水化合物来源的选择培养基(含2%甘露糖、300mg/l替卡西林的MS)中,并在暗处培养3-4周。然后将耐药克隆转移到再生诱导培养基(无2,4-D,但含有0.5mg/lIAA、1mg/l玉米素、200mg/l2%甘露糖和3%山梨糖醇)中,并在暗处生长14天。然后将增生的克隆转移到另一轮的再生诱导培养中,并将其移到有光亮的生长屋内。然后将再生嫩枝转移到具有GA7-1培养基(不含激素、含2%山梨糖醇的MS)的GA7容器内生长2周,当其足够大并具有充分的根时,将其移到温室内,将植物移植到温室的土壤内(T0代),生长到成熟并收集T1种子。
IV.F.3.质粒转化
在1”环形检测中,将每板7粒烟草c.v.“Xanthinc”的种子在T琼脂培养基中进行发芽,并在播种后12-14天,用如所述的主要经来自质粒pPH143和pPH145涂层的1μm钨离子(M10,Bio-RadLaboratories,Hercules,California,UnitedStatesofAmerica)轰击种子。将轰击后的种子在T培养基中孵育2天,之后切下叶子并将其轴外侧向上放置在光亮处(350-500μmol光子/m2/s)的RMOP培养基板上(Svab etal.,1990),培养基含有500μg/ml盐酸壮观霉素(Sigma,St.Louis,Missouri,UnitedStatesofAmerica)。在轰击后3到8周,将出现在漂白叶之下的耐药嫩芽亚克隆到相同的选择培养基上,容许其形成愈伤组织,分离并亚克隆次级嫩芽。用Southern印迹的标准技术(Sambrook&Russell,2001)评价独立亚克隆中的转化质粒基因组拷贝(同质性)的完全分离。在1%Tris-硼酸-EDTA(TBE)琼脂糖凝胶上分离经BamHI/EcoRI消化过的细胞总DNA(Mettler,1987),将其转移到尼龙膜(Amersham Biosciences,Piscataway,New Jersey,UnitedStatesofAmerica),并用32P标记的对应于0.7kb的来自含rps7/12质粒靶向序列的一部分的pC8的BamHI/HindIIIDNA片段的随机引物DNA序列作为检测探针。同质嫩芽在含壮观霉素的MS/IBS培养基(McBrideetal.,1994)中无菌地生根,并将其转移到温室内。
V.植物、育种、及种子生成
V.A.植物
本发明也提供了包括所述组分的植物。在一些实施方式中,修饰包括富集必需氨基酸在植物的多肽部分中的比例。在一些实施方式中,多肽部分可以是例如总的种子多肽、可溶性多肽、不可溶性多肽、水可提取性多肽、和脂结合性多肽。在一些实施方式中,修饰包括基因的过度表达、表达低下、反义调控、有义抑制、诱导型表达、诱导型抑制、或诱导型调控。
V.B.育种
经本发明的核苷酸序列的转化所获得的植物可以是多种植物物种中的任一种植物,其包括单子叶和双子叶植物;但是,在一些实施方式中,在本发明的方法中所用的植物选自上面所示的农学上重要的靶向谷类植物的列表。通过育种可以将本发明的基因联合其他的对于产量和质量是重要的表征的表达整合到植物系内。育种方法和技术在本领域是已知的。见于例如Welsh,1981;Wood,1983;Mayo,1987;Singh,1986;Wricke&Weber,1986。
通过有性繁殖或赘生物生长可以传递上面所述的被遗传加工到转基因种子和植物中的遗传性状,因此其能被保持在后代植物中,并进行繁殖。一般而言,所述保持和繁殖利用了所开发的已知的农业方法,以便符合特殊的目的例如耕作、播种、或收获。也可以采用专门的方法例如水栽法或温室技术。因为生长的谷类植物易感于昆虫或感染所引起的攻击和损害以及杂草植物的竞争作用,所以实施了控制杂草、植物疾病、昆虫、线虫、和其他不利条件的措施以便提高产量。这些措施包括机械措施例如耕作土壤或清除杂草及被感染治疗,以及应用农药例如除草剂、杀真菌剂、杀配子剂、杀线虫剂、生长调节剂、成熟剂、和杀虫剂。
根据所需的性能采取不同的育种措施。相关的技术在本领域是公知的,其包括但不限定于杂交、近亲交配、回交育种、多系育种、变种混和、种间杂交、异倍体技术等等。杂交技术也可以包括通过机械的、化学的、或生物化学的方法使得植物不育以生成雄性或雌性的不育植物。用不同系的花粉对雄性不育植物的异花传粉保证了雄性不育植物的基因组始终将获得两个亲代系的性状,而雌性不育植物却没有获得。因此,本发明的转基因种子和植物都可以被用于改良植物系的育种,这例如增加了常用方法例如除草剂或杀虫剂的疗效或因为所述方法的修饰的遗传性状而容许本领域人员采用所述方法。同样,可以获得具有改良的应激耐受性的新的谷类植物,因为它们的优化的遗传“装备”,因此生成了具有比不能耐受相当的不良的发育条件(例如干旱)的产物更好质量的收获产物。
V.C.种子生成
本发明的一些实施方式也提供了来自包括表达盒的植物的种子及分离的产物,所述表达盒包括与分离的核酸可操纵地连接的启动子序列,核苷酸序列选自由下面序列构成的组:
(a)在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所示的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列;
(b) 编码作为SEQIDNO:2的定向进化同源物的多肽、或其片段、结构域或特征的核苷酸序列;
(c)与(a)或(b)互补(例如完全互补)的核苷酸序列;和
(d)作为本说明的(a)或(b)的反向互补物(例如完全互补物)的核苷酸序列。
在一些实施方式中,分离的产物包括酶、营养多肽、结构多肽、氨基酸、脂类、脂肪酸、多糖、糖、醇、生物碱、类胡萝卜素、丙醇、类固醇、色素、维生素、或植物激素。
本发明的实施方式也涉及通过分离核酸的表达所产的分离的产物,所述核酸包括选自由下面序列构成的组的核苷酸序列:
(a)在高严格性杂交条件(6xSSC,65℃)以及随后的至少15分钟的终末洗涤步骤(0.1xSSC,65℃)下与SEQIDNO:1所示的核苷酸序列、或其片段、结构域、或特征杂交的核苷酸序列;
(b)  编码作为SEQIDNO:2的定向进化同源物的多肽、或其片段、结构域或特征的核苷酸序列;
(c)与(a)或(b)互补(例如完全互补)的核苷酸序列;和
(d)作为本说明的(a)或(b)的反向互补物(例如完全互补物)的核苷酸序列。
在一些实施方式中,产物是在植物中产生的。在一些实施方式中,产物是在细胞培养物中产生的。在一些实施方式中,产物是在无细胞系统中产生的。在一些实施方式中,产物包括酶、营养多肽、结构多肽、氨基酸、脂类、脂肪酸、多糖、糖、醇、生物碱、类胡萝卜素、丙醇、类固醇、色素、维生素、或植物激素。在一些实施方式中,产物是包括SEQIDNO:2中所列的氨基酸序列或其定向分化同源物的多肽。在一些实施方式中,多肽包括酶。
在种子生成中,发芽质量及种子的均质性是主要的产物表征。因为保持谷类植物避免其他谷类植物及杂草种子的污染、控制种子生疾病、和生产具有好发芽品质的种子是困难的,在非混杂种子的生长、控制、和市场化的领域上富有经验的种子生产者已经研发出了相当广泛的和清晰的种子生产实践。因此,购买经认证的符合特殊质量标准的种子而不是使用从其本身的谷类中收获到的种子已经成为了农民的普遍习惯。用作种子的繁殖材料是常规用包括除草剂、除虫剂、杀真菌剂、杀菌剂、杀线虫剂、软体动物清除剂、或其混和物的保护剂涂层处理过的种子。常规使用的保护剂涂层包括化合物例如克菌丹、carboxin、福美双(二硫四甲秋兰姆;
Figure S05807459320060915D000621
来自R.T.Vanderbilt Company,Inc.,Norwalk,Connecticut,UnitedStates of America)、methalaxyl(APRON来自Syngenta Corp.,Wilmington,Delaware,United States of America)、和pirimiphos-methyl
Figure S05807459320060915D000623
来自Agriliance,LLC,St.Paul,Minnesota,United States ofAmerica)。如果需要,可以与其他的载体、表面活性剂、和/或在制剂领域常规采用的促施用的佐剂(提供了抗细菌、真菌、或动物害虫所引起的损害的保护作用)一起制剂这些化合物。通过用液体制剂浸泡繁殖物质或通过用组合的湿或干制剂涂层可以实现这些保护剂涂层。其他的施用方法也是可能的,例如定向于芽或果实的处理方法。
VI.其他应用
本发明也提供了用于将感兴趣的蛋白质导向植物细胞内的结构的方法。在一些实施方式中,结构选自包括但不限定于内质网(ER)和质外体的组。在一些实施方式中,方法包括(a)将编码玉蜀黍Q蛋白的信号序列的核苷酸分子与编码感兴趣的蛋白质的核苷酸序列框内融合,其中编码玉蜀黍Q蛋白的信号序列的核酸分子和编码感兴趣的蛋白质的核苷酸序列与启动子可操纵地连接,以生成植物表达构建体;和(b)用植物表达构建体转化植物细胞,其中相关蛋白被导向结构。在一些实施方式中,信号序列对应于SEQIDNO:2的前19个氨基酸。
名词“相关蛋白”在此指的是任一多肽或多肽片段,其在植物或植物细胞中的表达是必需的。实例的相关蛋白包括但不限定于糖酶、纤维素酶、半纤维素酶、果胶酶、异构酶、分解酶、蛋白酶、热休克蛋白、伴侣蛋白、植酸酶、杀虫蛋白、抗微生物蛋白、α-淀粉酶、葡萄糖糖化酶、葡聚糖酶、葡糖苷酶、木聚糖酶、阿魏酸酯酶、半乳糖苷酶、果胶酶、和凝乳酶。在一些实施方式中,虽然相关蛋白天然地出现在植物细胞内,但是提供了作为转基因的一个或多个额外拷贝的编码相关多肽的核苷酸序列。在一些实施方式中,相关蛋白异源于植物或植物细胞。
本发明也提供了用于生产营养价值增高的植物种子的方法。在一些实施方式中,方法包括(a)用包括编码SEQIDNO:2、或其片段或衍生物的核苷酸序列的表达载体转化植物细胞;(b)从转化植物细胞中再生出植物;和(c)从转化植物中分离出种子,这就生成了营养价值增高的种子。
词语“营养价值增高的种子”在此指的是已经被修饰而含有正常地在种子中所不能发现的多肽的种子,或者含有提高量的正常地在种子中所发现的多肽的种子。在一些实施方式中,正常地在种子中所不能发现的多肽是种子所正常含有的蛋白的衍生物。例如通过修饰天然存在的蛋白的氨基酸序列可以表征这样一种衍生物,当与来自相同物种的未转化植物的种子比较时,该衍生物包含更高含量的一种或多种氨基酸(例如增加一种或多种必需氨基酸的比例)、提高了的氨基酸平衡、和/或提高了的氨基酸可消化性。通过用本领域已知的技术诱变编码多肽的核苷酸序列可以实现这些氨基酸序列的修饰。
本发明也提供了用于将感兴趣的蛋白质导向植物的蛋白体内的方法。在一些实施方式中,方法包括(a)将编码SEQIDNO:2、或其片段或衍生物的核酸分子与编码感兴趣的蛋白质的核苷酸序列框内融合,其中编码SEQIDNO:2、或其片段或衍生物的核酸分子和编码感兴趣的蛋白质的核苷酸序列与启动子可操纵地连接,以产生植物表达构建体;和(b)用植物表达构建体转化植物细胞,这使得相关蛋白导向植物中的蛋白体。在一些实施方式中,与编码感兴趣的蛋白质的核苷酸序列框内融合的编码SEQIDNO:2、或其片段或衍生物的核酸分子包括编码编码SEQIDNO:2、或其片段或衍生物的核酸分子和编码感兴趣的蛋白质的核苷酸序列之间的蛋白酶解离位点的核苷酸序列。
其解离位点可以被引入到融合蛋白内的蛋白酶、和所识别的解离位点的氨基酸序列在分子生物学和蛋白表达领域是已知的,并包括但不限定于Xa、凝血酶、caspases家族、糜蛋白酶、胃蛋白酶、烟草蚀纹病毒蛋白酶、和胰蛋白酶。见Sambrook&Russell,2001,以及其中所引用的关于蛋白酶解离融合蛋白的用途的讨论的参考文献。根据它的识别序列可以选择蛋白酶,例如根据识别序列在相关蛋白内的缺失,使得当用蛋白酶处理融合蛋白时,可以从完整的Q蛋白(或其片段或衍生物)中释放出相关蛋白。然后可以用本领域熟练人员已知的附加的纯化步骤纯化相关蛋白。这些技术包括亲和纯化(如果可以得到相关蛋白的抗体)、SDS-PAGE分离、基于大小的色谱法、或任何本领域熟练人员可获得的其他方法。
实施例
用下面的实施例举例说明了本发明的代表性的和实例的模式。根据本说明书和本领域熟练人员的一般水平,本领域熟练人员明白下面的实施例只打算用于举例说明,可以采用多种变化、修饰、和变更,只要它们不脱离本发明的精神和范围。
在此所用的标准重组DNA和分子克隆技术在本领域是公知的,并在Sambrook&Russell,2001;Silhavyetal.,1984;Ausubeletal.,2002;Ausubeletal.,2003;Reiteretal.,1992;和Schultzetal.,1998中对此进行了阐述。
实施例1:对应于Q蛋白基因的启动子/基因组克隆的分离
用Q蛋白ORF(SEQIDNO:1)的核苷酸序列设计用于基因组步移的引物。利用基于GENOME WALKERTM试剂盒(BDBiosciencesClontech,PaloAlto,California,UnitedStatesofAmerica)的玉米文库作为模板,经PCR分离出对应于Q蛋白cDNA的基因组克隆。用来自玉米品种6N615的DNA构建出GENOMEWALKERTM接合体连接的玉米基因组文库。构建出5种不同的文库,通过用下面的钝化末端限制性酶:DraI、EcoRV、HincII、SspI、或StuI的消化产生了每个包括基因组DNA片段的文库。利用一种或多种基因特异性引物QP1(SEQIDNO:4)和QP2(SEQIDNO:5)及试剂盒所提供的接合体引物筛选GENOME WALKERTM文库。PCR条件是在BDBioscienceClontech的用户手册中所推荐的条件。在琼脂糖凝胶上分离PCR产物,切割下所形成的产物条带,将其亚克隆到载体(InvitrogenCorp.,Carlsbad,California,UnitedStatesofAmerica)内,并测序以确认正确的产物。从DraIGENOMEWALKERTM中克隆到了对应于Q蛋白基因的516个碱基对的基因组克隆。
实施例2:Q启动子的活性
利用土壤机介导的转化,用二元载体11037稳定地转化转基因的玉米植物。载体11037与pNOV4061(SEQIDNO:14:也见于PCT国际专利申请文献WO03/57248)相同,除了在11037中用Q启动子(SEQIDNO:6)取代了在pNOV4061的植酸酶表达盒中所见的γ-玉米醇溶蛋白启动子。SEQIDNO:12显示了载体11037中的植酸酶表达盒的基因产物,这与PCT国际专利申请文献WO03/57248的SEQIDNO:6相同。它包括来自27kDaγ-玉米醇溶蛋白的19个氨基酸的信号序列(对应于SEQIDNO:12的前19个氨基酸)、Nov9x植酸酶、和六肽SEKDEL(SEQIDNO:11)。
从经载体11037所转化的玉米组织中所再生出的植物中收获T1种子。将种子粉末化,并用提取缓冲液(50mMTris-HCl、pH值8.0、100mMNaCl、2mMEDTA)从粉末样品中提取出可溶性蛋白。通过搅拌将粉末悬浮液在室温下孵育60分钟,并通过离心去除不可溶性蛋白。
如在PCTWO03/5728的实施例3中所述的那样,通过Western印迹分析进行对植酸酶活性的测定和对Nov9x植酸酶的检测。所有试剂和反应条件都与在PCTWO03/5728中所述的一样,并按比例地调节所有试剂的体积。简单地,对植酸酶活性的测定依据于检测通过植酸酶的水解作用从植酸钠底物中所释放出的无机磷酸盐。植酸酶检测方法采用了Wyss etal.,1999和Engelen et al.,2001的方案。
在pH值5.5和37℃下测定来自单个核及混和核的粉末样品中的植酸酶活性。表1显示了从两种再生的转基因植物(植物A和B)中收获到的8种T种子样品的检测结果。样品305B-11A代表从含有Nov9x植酸酶的对照玉米粉样品种提取到的植酸酶活性。按植酸酶活性减低的顺序列出所述样品。
表1:转基因玉米粉中的植酸酶活性
a每个样品都来自有限数目的、单个种子,除了称作混和种子的样品以外,它们对应于10个混和在一起的粉末状的T1核。
如图1所示,利用纯化Nov9x植酸酶的抗血清,用Western印迹分析分析了在表1中所分析的粉末提取物。图1中所示的印迹中的第一列表示分子量标准物(标记于左侧)的位置。A188是非转基因玉米的种子的提取物。Nov9x植酸酶被鉴定为迁移到55kDa标准物区的显著条带。在A188玉米粉提取物中没有检测到Nov9x植酸酶。
实施例3:对从种子中提取的蛋白的SDS-PAGE分析
将来自Hi-IIx A188玉米的干燥核浸泡在蒸馏水中4℃下过夜。分离出胚乳和胚芽,并将其冷冻在-80℃。用KLECO组织粉碎器(KLECO,Visalia,California,UnitedStatesofAmerica)将冷冻组织粉碎。通过加入每100mg粉末500μl提取缓冲液(50mMHEPES,pH8、2mMEDTA、100mMNaCl、和4mMDTT)从胚乳粉中提取出蛋白。在室温下将样品涡旋并搅拌40分钟。通过加入每100mg组织2.5ml提取缓冲液从胚芽浆中提取出蛋白。将可溶性部分的一部分在80℃下加热20分钟,并通过离心去除聚集的蛋白。用SDS-PAGE分析在加热前(-)和加热后(+)的提取物样品(见图2)。
实施例1-3的讨论:
55kDa蛋白是胚乳粉在缓冲液和DTT中所释放出的第二丰富的蛋白。在测试用于提取玉米粉中的重组的热稳定性酶的各种条件的过程中,发现55kDa的丰富的胚乳蛋白在80℃下的加热过程中仍是可溶性蛋白(实施例3,图2)。55kDa蛋白是胚乳粉在含有100mMNaCl和4mMDTT的缓冲液中所释放出的第二丰富的蛋白。在这些提取物中最为丰富的蛋白是27kDaγ-玉米醇溶蛋白,它是一种玉米醇溶蛋白,通常占胚乳总蛋白的15%。
Vitale et al.,1982描述了相似的胚乳部分。他们将蛋白体孵育在DTT和β-ME中,并表征了可溶性部分中的蛋白。在这些条件下从蛋白体中所释放出的两种最丰富的蛋白具有的分子量是28,000和58,000。在这个部分中的蛋白被称作“可溶性降低的蛋白”或RSPs。
Figure S05807459320060915D000671
中的一种EST与55kDa蛋白的前20个密码子匹配,并 编码171个残基的多肽链。确定出了上面所讨论的27kDa和55kDa蛋白的氨基末端上的氨基酸序列。27kDa蛋白的部分序列是THTSGGXXXQPPPPVHLLPP(SEQIDNO:7)。这个序列匹配于28kDa玉米谷蛋白-2(glutelin-2)的氨基末端(γ-玉米醇溶蛋白;Pratetal.,1985;Boronatetal.,1986)。
55kDa蛋白的部分序列是TQTGGCSCGQQQSHEQQHHP(SEQ IDNO:8)。对PIR和SwissProt数据库的搜索没有鉴定出任何与该序列匹配的序列。但是,当用反向翻译的DNA序列筛选时,查询序列的每个密码子都与胚乳cDNA文库的表达序列标记(EST)编号No.AI812147)匹配。EST序列的翻译从对应于55kDa蛋白的氨基末端的密码子开始,产生了所推论的171个残基的多肽链。
对两种编码289个残基的蛋白(分子量34,000)的重叠cDNA的克隆。用针对EST序列的寡核苷酸引物扩增来自玉米cDNA文库的cDNA克隆。发现在EST序列中的预期终止密码子在新克隆中编码Leu,ORF持续到所克隆的序列的终点。从相同的文库中扩增出与第一个cDNA的3’末端重叠的第二个cDNA克隆。新的ORF编码附加的118个氨基酸,总计289个氨基酸。计算出的所推论的蛋白的分子量为34,000。所计算出的分子量(34,000)与从SDS-PAGE分析中所估计出的分子量(55,000)之间的偏差可能是因为与Gln残基的丰度相关的不同寻常的结构特性。表2显示了所推论蛋白的氨基酸组成。
表2:玉米醇溶蛋白的氨基酸组成
氨基酸 玉米醇溶蛋白-α19 玉米醇溶蛋白-α22 玉米醇溶蛋白-β15 玉米醇溶蛋白-δ10 玉米醇溶蛋白-δ18 玉米醇溶蛋白-γ27  SEQIDNO:2
A 29 34 23 7 9 10 6
C 2 1 7 5 3 15 16
D 0 0 1 1 0 0 3
E 1 2 3 0 0 2 13
F 13 8 0 5 5 2 3
G 5 2 14 4 5 13 11
H 2 3 0 3 3 16 29
I 9 11 1 3 8 4 8
K 0 0 0 0 1 0 5
L 43 42 16 15 13 19 11
M 0 5 18 29 53 1 4
N 10 13 3 3 3 0 8
P 23 22 14 20 35 51 16
Q 41 51 26 15 15 30 104
R 2 4 5 0 0 5 4
S 15 17 8 8 18 8 23
T 5 7 5 5 10 9 6
V 5 17 3 5 5 15 9
W 0 0 0 0 2 0 0
Y 8 7 14 1 2 4 10
Total 213 246 161 129 190 204 289
C末端的氨基酸序列显示出与谷醇溶蛋白同源,谷醇溶蛋白是谷类植 物的种子储存蛋白。来自成熟蛋白的残基172-289的氨基酸序列显示出与一些谷类植物的谷醇溶蛋白同源,所述谷类植物包括玉米、水稻、和大麦。58-118残基链的序列相同性的范围是从36%到53%:水稻的谷醇溶蛋白为37%(44/116个残基),玉米的玉米醇溶蛋白为38%(46/118个残基),蜀黍的谷醇溶蛋白γ-蜀黍醇溶蛋白为36%(40/115),燕麦的燕麦谷蛋白为53%(31/58),以及大麦的B-大麦醇溶蛋白为55%(33/59)。与27kDaγ-玉米醇溶蛋白(谷蛋白-2(glutelin-2))在119个残基链上的相同性为38%(46个残基匹配)。同源区限定于γ-玉米醇溶蛋白的C末端区。
表2包括了用于与55kDa蛋白比较的主要的玉米醇溶蛋白的氨基酸组成。在三种氨基酸的相对水平上,推论序列与其他的玉米醇溶蛋白相比有着明显的不同:推论序列在总共289个残基中含有106个Gln、13个Glus、和5个Lys。所有的其他玉米醇溶蛋白都含有0个Lys,除了18kDa的δ-玉米醇溶蛋白,它只含有1个Lys。
表3显示了推论蛋白和其他玉米醇溶蛋白的每种氨基酸的组成百分比。55kDa蛋白含有36%Gln。通过比较发现,α-玉米醇溶蛋白是紧接其后的最富含Gln的谷醇溶蛋白,且只含有20%Gln。在玉米醇溶蛋白中,55kDa蛋白也有着最少的Pro含量。与55kDa蛋白并列展示了Vitaleetal.,1982所表征的58kDa RSP的氨基酸组成。
表3:玉米醇溶蛋白的氨基酸组成百分比
氨基酸 玉米醇溶蛋白-α19 玉米醇溶蛋白-α22 玉米醇溶蛋白-β15 玉米醇溶蛋白-δ10 玉米醇溶蛋白-δ18 玉米醇溶蛋白-γ27 SEQIDNO:2 58kDRSP
G 2.3 0.8 8.7 3.1 2.6 6.4 3.8 4.9
A 13.6 13.8 14.3 5.4 4.7 4.9 2.1 3.5
V 2.3 6.9 1.9 3.9 2.6 7.4 3.1 5.1
L 20.2 17.1 9.9 11.6 6.8 9.3 3.8 4.7
I 4.2 4.5 0.6 2.3 4.2 2.0 2.8 2.2
M 0.0 2.0 11.2 22.5 17.9 0.5 1.4 1.3
F 6.1 3.3 0.0 3.9 2.6 1.0 1.0 1.9
W 0.0 0.0 0.0 0.0 1.1 0.0 0.0 0.0
K 0.0 0.0 0.0 0.0 0.5 0.0 1.7 2.6
P 10.8 8.9 8.7 15.5 18.4 25.0 5.5 4.7
C 0.9 0.4 4.3 3.9 1.6 7.4 5.5 4.4
S 7.0 6.9 5.0 6.2 9.5 3.9 8.0 7.3
T 2.3 2.8 3.1 3.9 5.3 4.4 2.1 2.5
Y 3.8 2.8 8.7 0.8 1.1 2.0 3.5 3.5
N 4.7 5.3 1.9 2.3 1.6 0.0 2.8 4.3
D 0.0 0.0 0.6 0.8 0.0 0.0 1.0
Q 19.2 20.7 16.1 11.6 7.9 14.7 36.0 33.6
E 0.5 0.8 1.9 0.0 0.0 1.0 4.5
H 0.9 1.2 0.0 2.3 1.6 7.8 10.0 11.0
R 0.9 1.6 3.1 0.0 0.0 2.5 1.4 2.1
SUM 100.0 100.0 100.0 100.0 100.0 100.0 100.0 99.6
实施例4:Q蛋白融合蛋白在转基因种子中的蓄积
构建体11045是编码经三肽连接物Gly-Gly-Ala连接的全长Q蛋白与T. maritima的α-半乳糖苷酶的融合蛋白的二元载体。编码融合蛋白的基因与27kDaγ-玉米醇溶蛋白蛋白(SEQIDNO:13)的启动子可操纵地连接。设计引物以便从pNOV4349(SEQIDNO:17,其中核苷酸10061-10090对应于Q蛋白编码序列)中分离出编码Q蛋白的核苷酸序列,同时在其3’末端添加编码三肽连接物的9bp序列。将3’NcoI和5’BamHI添加到PCR产物的末端。从pNOV4349中扩增出953bp的PCR片段,并用BamHI和NcoI切割,然后将其插入到pNOV4325(SEQIDNO:16;核苷酸3565-5901编码α-半乳糖苷酶多肽)的5227bp的BamHI/Nco片段内。该质粒称作pWIN010。然后用KpnI和HindIII切割构建体pWIN010,并将3489bp片段连接于二元载体pNOV2117(SEQIDNO:15;也见于PCT国际专利文献WO03/57248)的9154bp的KpnI/HindIII片段。
利用土壤杆菌介导的转化,用二元载体11045稳定地转化转基因玉米植物。收获从经载体11045所转化的玉米组织中再生出的植物的种子。将种子粉碎,并用提取缓冲液(50mMTris-HCl,pH8.0、100mMNaCl、2mMEDTA)从粉末样品中提取出可溶性蛋白。在室温下,搅拌孵育粉末悬浮液60分钟,离心去除不可溶性物质。然后分析玉米粉样品的α-半乳糖苷酶活性,表4显示了α-半乳糖苷酶活性结果。
表4:转基因玉米中的α-半乳糖苷酶活性
样品ID 构建体 α-半乳糖苷酶单位/g粉
MD9L011883 11045 4.06
MD9L011893 11045 9.31
MD9L011901 11045 8.39
MD9L011903 11045 9.28
MD9L011912 11045 7.79
阴性玉米粉 (无) -0.78
对α-半乳糖苷酶活性的测定是依据于比色测定法,其包括如Liebl等,1998所述的测定p-硝基苯基-α-d-半乳糖吡喃糖苷所释放出的p-硝基苯基。
如表4所示,含有编码Q蛋白/α-半乳糖苷酶融合蛋白的构建体11045的转基因玉米的α-半乳糖苷酶活性比阴性玉米粉对照中的α-半乳糖苷酶活性更高。水平范围从4个α-半乳糖苷酶单位/克玉米粉到9个α-半乳糖苷酶单位/克玉米粉。阴性玉米粉对照没有α-半乳糖苷酶活性。图3也显示了这些结果。
实施例5:Q蛋白信号序列指导融合蛋白在转基因种子内的蓄积
通过设计引物从pNOV4349中分离出Q蛋白信号序列(SEQIDNO:2的氨基酸1-19),并往PCR产物的末端添加3’NcoI和5’BamHI位点,制成了二元载体12173。从pNOV4349中扩增出80bp的PCR片段,并用BamHI和NcoI切割,然后将其插入到pNOV4328(SEQIDNO:18;核苷酸3621-5279编码α-半乳糖苷酶多肽)的5226bp的BamHI/Nco片段内。该质粒称作pWIN013New。然后用KpnI和HindIII切割构建体pWIN013New,并将2614bp片段连接于二元载体pNOV2117(SEQIDNO:15;也见于PCT国际专利文献WO03/57248)的9154bp的KpnI/HindIII片段。该构建体被称作二元载体12173。它在玉米27kDa伽马玉米醇溶蛋白启动子(SEQIDNO:13)的转录控制下编码含有与α-半乳糖苷酶蛋白融合的Q蛋白的19个氨基酸的信号序列(对应于SEQIDNO:2的前19个氨基酸)的融合蛋白。
利用土壤杆菌介导的转化,用二元载体12173稳定地转化转基因玉米植物。收获从经载体12173所转化的玉米组织中再生出的植物的种子。将种子粉碎,并用提取缓冲液(50mMTris-HCl,pH8.0、100mMNaCl、2mMEDTA)从粉末样品中提取出可溶性蛋白。在室温下,搅拌孵育粉末悬浮液60分钟,离心去除不可溶性物质。然后分析玉米粉样品的α-半乳糖苷酶活性,表5显示了α-半乳糖苷酶活性结果。
表5:转基因玉米的α-半乳糖苷酶活性
样品ID 构建体 α-半乳糖苷酶单位/g粉
MD9L020749 12173 70.848
MD9L02073 5 12173 68.175
MD9L03 0752 12173 52.274
MD9L02075 8 12173 43.160
MD9L019976 12173 23.976
MD9L019782 12173 11.877
MD9L019766 12173 2.566
阴性玉米粉 N/A -0.782
从含有Q蛋白信号序列的构建体12173中所得到的α-半乳糖苷酶活性结果表现出了α-半乳糖苷酶蛋白的增加。水平范围从3个α-半乳糖苷酶单位/克玉米粉到71个α-半乳糖苷酶单位/克玉米粉。阴性玉米粉对照没有α-半乳糖苷酶活性。图4也显示了这些结果。
参考文献
在此通过引用将下面所列的参考文献以及在说明书中所引用的所有参考文献的全部内容并入本申请,它们补充、解释、教导在此所采用的方法学、技术、和/或组合物,或为在此所采用的方法学、技术、和/或组合的提供了背景知识。
AllisonRF,Johnston RE & Dougherty WG (1986) The nucleotidesequence of the coding region of tobacco etch virus genomic RNA:evidenceforthe synthesis of a single polyprotein.Virology154:9-20.
AltschulSF,GishW,MillerW,MyersEW & Lipman DJ (1990) BasicLocal Alignment Search Tool.JMolBiol215:403-410.    
Aoyama T & ChuaN-H(1997) A glucocorticoid-mediated transcriptionalinduction system in transgenic plants.PlantJ11:605-612.
AusubelFM,BrentR,KingstonRE,MooreDD,SeidmanJG,SmithJA&Struhl K (2002)Short Protocols in Molecular Biology,Fifthed.Wiley,NewYork,NewYork,United States of America.
AusubelFM,BrentR,KingstonRE,MooreDD,SeidmanJG,SmithJA&StruhlK (2003)Current Protocols in Molecular Biology,JohnWylie & Sons,Inc.,NewYork,NewYork,United States of America.
Barany G & Merrifield RB(1980) Solid-Phase Peptide Synthesis,inPeptides:Analysis,Synthesis,Biology,Vol.2,Special Methods in Peptide Synthesis,PartA(GrossE & Meienhofer J,eds)Academic Press,NewYork,NewYork,United States of America,pp.3-284.
Bartlett SG. Grossman AR & ChuaN-H (1982)in Methods in ChloroplastMolecular Biology,(EdelmanM,HallickRB & ChuaN-H,eds.)ElsevierBiomedical Press,NewYork,NewYork,UnitedS tates of America,pp.1081-1091.
BatzerMA,Carlton JE & Deininger PL(1991) Enhanced evolutionaryPCRusingoligonucleotideswithinosineatthe3'-terminus.NucleicAcidRes.19:5081.
Bevan M(1984)BinaryAgrobacteriumvectorsforplanttransformation.Nucl.AcidsRes12:8711-21.
BevanM,FlavellRB&ChiltonMD(1983)Achimericantibioticresistancegeneasaselectablemarkerforplantcelltransformation.Nature304:184-187.
BinetMNWeilJH&TessierLH(1991)Structureandexpressionofsunflowerubiquitingenes.PlantMolBiol17:395-407.
BlochingerK&DiggelmannH(1984)HygromycinBphosphotransferaseasaselectablemarkerforDNAtransferexperimentswithhighereukaryoticcells.MolCellBiol4:2929-2931.
BoronatA,MartinezMC,ReinaM,PuigdomenechP&PalauJ(1986)Isolationandsequencingofa28kDglutelin-2genefrommaize.Commonelementsinthe 5'flankingregionsamongzeinandglutelingenes.PlantSci.47:95-102.
BourouisM&JarryB(1983)Vectorscontainingaprokaryoticdihydrofolate reductase gene transform Drosophila cells tomethotrexate-resistance.EMBOJ2:1099-1104.
CaddickMX,GreenlandAJ,JepsonI,KrauseKP,QuN,RiddellKV,SalterMG,SchuchW,SonnewaldU&TomsettAB.(1998)An ethanolinduciblegeneswitchforplantsusedtomanipulatecarbonmetabolism.NatBiotechnol16:177-180.    
CallisJ,FrommM&WalbotV(1987)Intronsincreasegeneexpressioninculturedmaizecells.GenesDev.1:1183-1200.
CallisJ,RaaschJA&VierstraRD(1990)UbiquitinextensionproteinsofArabidopsisthaliana.Structure,localization,andexpressionoftheirpromotersintransgenitobacco.JBiolChem265:12486-12493.
CasasAM,KononowiczAK,ZehrUB,TomesDT,AxtellJD,ButlerLG,BressanRA&HasegawaPM(1993)Transgenicsorghumplantsviamicroprojectilebombardment.ProcNatlAcadSciUSA90:11212-6.
ChibbarRN,KarthaKK,DatlaRSS,LeungN,CaswellK,MallardCS&SteinhauerL(1993)Theeffectofdifferentpromoter-sequencesontransientexpressionofgusreportergeneinculturedbarley(HordeumvulgareL.)cells.PlantCellRep12:506-509.
ChristensenAH&QuailPH(1989)Sequenceanalysisandtranscriptionalregulationbyheatshockofpolyubiquitintranscriptsfrom maize.PlantMolBiol12:619-632.
ChristouP,FordT&KofronM(1991)Productionoftransgenicrice(OryzasativaL.)plantsfromagronomicallyimportantindicaandjaponicavarietiesviaelectricdischargeparticleaccelerationofexogenousDNAintoimmaturezygoticembryos.Bio/Technology 9:957-962.
ClarkMS(ed)(1997)PlantMolecularBiologv:AIaboratorvManual.Chapter7,Springer-VerlagGmbH&Co.KG,Berlin,Germany.
ComaiL,Larson-KellyN,KiserJ,MauCJ,PokalskyAR,ShewmakerCK,McBrideK,JonesA&StalkerDM(1988)Chloroplasttransportofaribulosebisphosphatecarboxylasesmallsubunit-5-enolpyruvyl3-phosphoshikimatesynthasechimericproteinrequirespartofthematuresmallsubunitinadditiontothetransitpeptide.JBiolChem 263:15104-15109.
CreightonTE(1984)Proteins,WHFreeman&Co.,NewYork,NewYork,UnitedStatesofAmerica.
DattaSK,PeterhansA,DattaK&PotrykusI(1990)GeneticallyengineeredfertileIndica-ricerecoveredfromprotoplasts.Bio/Technology8:736-740.
deFramondAJ(1991)Ametallothionein-likegenefrommaize(Zea mays).Cloningandcharacterization.FEBSLett290:103-6.
Della-CioppaG,KishoreGM,BeachyRN&FraleyRT(1987)Proteintraffickinginplantcells.PlantPhysiol84:965-968.
DeutscherMP (1990)GuidetoProteinPurification,SimonMI&AbelsonJN(eds),MethEnzymolVolume182.    
Dong,JJ, TengWM,BuchholzWG&HallTC(1996).Agrobacterium-mediatedtransformationofjavanicarice.MolBreeding2:267-276.
Elroy-SteinO,FuerstTR&MossB(1989)Cap-IndependentTranslationofmRNAConferredbyEncephalomyocarditisVirus 5’SequenceImprovesthePerformanceoftheVaccinia Virus/BacteriophageT7HybridExpressionSystem.ProcNatlAcadSciUSA86:6126-6130.
EngeIenAJ,vanderHeeftFC,RandsdorpPH,SomersWA,SchaeferJ&vanderVatBJ(2001)Determinationofphytaseactivityinfeedbyacolorimetricenzymaticmethod:collaborativeinterlaboratorystudy.JAOACInt84:629-33.
EP0292435
EP0332104
EP0332581
EP0342926
EP0392225
FirekS,DraperJ,OwenMR,GandechaA,CockburnB&WhitelamGC(1993)Secretionofafunctionalsingle-chainFvproteinintransgenictobaccoplantsandcellsuspensioncultures.PlantMolBiol22:129-142.
FrommmE,MorrishF,ArmstrongC,WilliamsR,ThomasJ&KleinTM.(1990)Inheritanceandexpressionofchimericgenesintheprogenyoftransgenicmaizeplants.Biotechnology(NY)8:833-839.
GallieDR,KadoCI,HersheyJWB,WilsonMA&WalbotV(1989)in MolecularBiologyofRNA(CechTR,ed.),AlanR.Liss,Inc.,NewYork,NewYork,UnitedStatesofAmerica,pp.237-256.
GallieDR,Sleat DE,WattsJW,TurnerPC&WilsonTM(1987)Acomparisonofeukaryotic viral5'-leadersequencesasenhancersofmRNAexpressioninvivo.NuclAcidsRes15:8693-8711.
GoffSA,RickeD,LanTH,PrestingG,WangRL,DunnM,GlazebrookJ,SessionsA,OellerP,VarmaH,HadleyD,HutchinsonD,MartinC,KatagiriF,LangeBM,MoughamerT,XiaY,BudworthP,ZhongJP,MiguelT,PaszkowskiU,ZhangSP,ColbertM,SunWL,ChenLL,CooperB,ParkS,WoodTC,MaoL,QuailP,WingR,DeanR,YuYS,ZharkikhA,ShenR,SahasrabudheS,ThomasA,CanningsR,GutinA,PrussD,ReidJ,TavtigianS,MitchellJ,EldredgeG,SchollT,MillerRM,BhatnagarS,AdeyN,RubanoT,TusneemN,RobinsonR,FeldhausJ,MacalmaT,OliphantA&Briggs,S(2002)Adraftsequenceofthericegenome(OryzasativaLsspjaponica).Science296:92-100.
Gordon-KammWJ,SpencerTM,ManganoML,AdamsTR,DainesRJ,StartWG,O'BrienJV,ChambersSA,AdamsWRJr.,WillettsNG,RiceTB,MackeyCJ,KruegerRW,KauschAP&LemauxPG(1990)TransformationofMaizeCellsandRegenerationofFertileTransgenicPlants.PlantCell2:603-618.
GreenMR(2000)TBP-associatedfactors(TAFIIs):multiple,selectivetranscriptionalmediatorsincommoncomplexes.TrendsBiochemSci25:59-63.
GritzL&DaviesJ(1983)Plasmid-encodedhygromycinBresistance:thesequenceofhygromycinBphosphotransferasegeneanditsexpressioninEscherichiacoliandSaccharomycescerevisiae.Gene25:179-188.
Henikoff S&HenikoffJG(1992)Amino Acid Substimtion MatricesfromProtein Blocks.prOC Naf,AcaJScI USA89:10915-10919.
Hiei Y,Komari T&Kubo T(1997)Transformation of rice mediated byAgrobacterium tumefaciens.plant MolBiol35:205-18.
Hiei Y.0hta S,Komari T&KumashiroY(1994)Efficient transformationof rice(Oryza sativaL.)mediated byAgrobacterium and sequence analySlS otthe boundaries 0fthe T-DNA.plantf J6(2):271-282.Hfen R&Willmitzer L(1988)Storage of competent cellsforAgrobacterium transformation,NuclAcidsRes16:9877.
Hudspeth RL&Grula JW(1989)Structure and expression of the maizegene encoding the phosphoenolpyruvate carboxylase isozyme inVOlVed in C4photOSynthesis.Plant MolecBiol12:579-589.
Jobling SA&Gehrke L(1987)Enhanced translation of chimaericmessenger RNAs containing a plant viral untranslated leader sequence.Nature325:622-625.
Karlin S&Altschul SF(1993)Applications and Statisticsfor MultipleHigh.Scoring Segments in Molecular Sequences.Proe NatlAcad Sci USA90:5873-5877.
Keezan L, Gill G&Ptashne M(1986)Separation of DNA bindingfromthe transcription-activatingFUnction of a eukaryotic regulatory protein.Science231:699.704.
Kellogg EA(1998)Relationships of cereal crops and other grasses.ProcNatl,Acad Sci USA 95:2005-2010
Kempin SA,Lijegten SJ,Block LM,Rounsley SD,Yanoky MF&LamE(1997)Targeted disruption inArabidopsis.Nature 389:802-803.
K1ein TM,Wolf ED,Wu R&Sanfbrd JC(1987)High Velocitymicroprqiectllesfordelivering hueleic acids into liVing cells.Nature 327:70-73.
KoehlerSM&HoTM(1990)Hormonalregulation,processing,andsecretionofcysteineproteinasesinbarleyaleuronelayers.PlantCell2:769-783.
KongP&SteinbissHH(1998)CompletenucleotidesequenceandanalysisoftheputativepolyproteinofmaizedwarfmosaicvirusgenomicRNA(Bulgarianisolate).ArchVirol143:1791-1799.
KozielMG,BelandGL,BowmanC,CarozziNB,CrenshawR,CrosslandL,DawsonJ,DesaiN,HillM,KadwellS,LaunisL,LewisK,MaddoxD,McPhersonK,MeghjiMR,MerlinE,RhodesR,WarrenGW,WrightM &EvolaSV(1993)FieldperformanceofelitetransgenicmaizeplantsexpressinganinsecticidalproteinderivedfromBacillusthuringiensis.Bio/Technology11:194-200.
KuchlerRJ (1997)BiochemicalMethodsinCellCultureandVirologyDowden,HutchinsonandRoss,Inc.,Stroudsburg,Pennsylvania,UnitedStatesofAmerica.
KyteJ&DoolittleRF(1982)ASimpleMethodforDisplayingtheHydropathicCharacterofaProtein.JMolBiol157:105-132.
Lebel E,HeifetzP,ThorneL,UknesS,PyalsJ&WardE(1998)FunctionalarnalysisofregulatorysequencescontrollingPR-1geneexpressioninArabidopsis.PlantJ16:223-233.
LieblW,WagnerB&SchellhaseJ(1998)Propertiesofanalpha-galactosidase,andstructureofitsgenegalA,withinanalpha-andbeta-galactoside utilizationgeneclusterofthehyPerthermophilicbacteriumThermotogamarritima.SystApplMicrobiol21:1-11.
LogemannJ,LipphardtS,LorzH,HauserI,WillmitzerL&ScheilJ(1989)5'upstreamsequencesfromthewunlgeneareresponsibleforgeneactivationbywoundingintrarnsgenicplants.PlantCelll:151-158.
LommelSA,KendaHTL,XiongZ&NutterRC(1991)IdentificationofthemaizechloroticmottleviruscapsidproteincistronandcharacterizationofitssubgenomicmessengerRNA.Virology81:382-385.
MacejakDG&SarnowP(1991)Internalinitiationoftranslationmediatedbythe5'leaderofacellularmRNA.Nature353:90-94.
MavoO (1987)TheTheoryofPlantBreeding.SecondEdition.ClarendonPress,NewYork,NewYork,UnitedStatesofAmerica.
McBrideKE,SchaafDJ,DaleyM&StalkerDM(1994)ControlledexpressionofplastidtransgenesinplantsbasedonanuclearDNA-encodedandplastid-targetedT7RNApolymerase.ProcNatlAcadSciUSA91:7301-7305.
McBrideKE&SummerfeltKR(1990)ImprovedbinaryvectorsforAgrobacterium-mediatedplanttransformation.PlantMolBiol14:269-276.
McElroyD,BlowersAD,JenesB&WuR(1991)Constructionofexpressionvectorsbasedonthericeactin1(Act1)5'regionforuseinmonocottransformation.Mol.Gen.Genet.231:150-160.
McElroyD,ZhangW,CaoJ&WuR(1990)Isolationofanefficientactinpromoterforuseinricetransformation.PlantCell2:163-71.
MerrifieldRB(1963)SolidPhasePeptideSynthesis.I.TheSynthesisofaTetrapeptideJAmChemSoc85:2149-54.
MessingJ&VieiraJ(1982)AnewpairofM13vectorsforselectingeitherDNAstrandofdouble-digestrestrictionfragments.Gene19:259-268.
MettlerIJ(1987)AsimpleandrapidmethodforminipreparationofDNAfromtissue-culturedplantcellsPlantMolBiolReporter5:346-349.
MiaoZH&LamE(1995)TargeteddisruptionoftheTGA3locusinArabidopsisthaliana.PlantJ7:359-365.
MukumotoF,HiroseS,ImasekiH&YamazakiK(1993)DNAsequencerequirementofaTATAelement-bindingproteinfromArabidopsisfortranscriptioninvitro.PlantMMolBiol23:995-1003.
MurashigeT&SkoogF(1962)Arevisedmediumforrapidgrowthandbioassayswithtobaccotissueculture.PhysiologiaPlantarum15:473-497(1962)
NeedlemanSB&WunschCD(1970)AGeneralMethodApplicabletotheSearchforSimilaritiesintheAminoAcidSequenceofTwoproteins.JMolBiol48:443-453.
NegrottoD,JolleyM,BeerS,WenckAR&HansenG(2000)Theuseofphosphomannose-isomeraseasaselectionmarkertorecovertransgenicmaizeplant(ZeamayL.)viaAgrobacteriumtransformation.PlantCellReports19:798-803.NorrisSR,MeyerSE&Callis J(1993)TheintronofArabidopsisthalianapolyubiquitingenesisconservedinlocationandisaquantitativedeterminantofchimericgeneexpression.PlantMolBiol21:895-906.
OhtsukaE,MatsukiS,IkeharaM,TakahashiY&MatsubaraK(1985)Analternativeapproachtodeoxyoligonucleotidesashybridizationprobesbyinsertionofdeoxyinosineatambiguouscodonpositions.J.  Biol.  Chem.260:2605-2608.
PaszkowskiJ,BauerM,BoguckiA&PotrykusI(1988)Genetargetinginplants.EMBOJ7:4021-26.
Paszkowski J,ShillitoRD,SaulM,MandakV,HohnT,HohnB&PotrykusI(1984)Directgenetransfertoplants.EMBO J3:2717-2722.
PatersonAH(1996)TheDNARevolution.inGenomeMappinginPlants.Chapter2,(PatersonAH,ed.),AcademicPress/R.G.LandsCo.,Austin,Texas,UnitedStatesofAmerica.
PCTInternationalPatentApplicationPublicationWO93/07278
PCTInternationalPatentApplicationPublicationWO93/21335
PCTInternationalPatentApplicationPublicationWO94/00977
PCTInternationalPatentApplicationPublicationWO97/32011
PCTInternationalPatentApplicationPublicationWO03/57248
PearsonWR&LipmanDJ(1988)ImprovedToolsforBiologicalSequenceComparison.ProcNatlAcadSciUSA85:2444-2448.
PicardD,SalserSJ&YamamotoKR(1988)Amovableandregulableinactivationfunctionwithinthesteroidbindingdomainoftheglucocorticoidreceptor.Cell54:1073-1080.
PotrykusI,PaszkowskiJ,SaulMW,PetruskaJ&ShillitoRD(1985)Molecularandgeneralgeneticsofahybridforeigngeneintroducedintotobaccobydirectgenetransfer.MolGenGenet199:169-177.
PratS,CortadasJ,PuigdomenechP&PalauJ(1985)Nucleicacid(cDNA)andaminoacidsequencesofthemaizeendospermproteinglutelin-2.Nucl.AcidRes.13:1493-1504.
ReedJN,PrivalleLS,PowellMJ,MeghjiM,DawsonJ,Dunder EM,SuttieJ,WenckA,LaunisK,KramerC,ChangY,HansenG&WrightM(2001)Phosphomannoseisomerase:Anefficientselectablemarkerforplanttransformation.InVitroCellDevBiol-Plant37:127-132.
ReichTJ,IyerVN&MikiBL(1986)EfficienttransformationofalfalfaprotoplastsbytheintranuclearmicroinjectionofTi-plasmids.Bio/Technology4:1001-1004.
ReiterRS,YoungRM&ScolnikPA(1992)GeneticLinkageoftheArabidopsisGenome:MethodsforMappingwithRecombinantInbredsandRandomAmplifiedPolymorphicDNAs(RAPDs),inMethodsinArabidopsis Research,WorldScientificPress,RiverEdge,NewJersey,UnitedStatesofAmerica.
RogersJC,DeanD&HeckGR(1985)Aleurain:abarleythiolproteasecloselyrelatedtomammaliancathepsinH.Proc.Natl.Acad. Sci.USA82:6512-6516.    
RohrmeierT&LehleL(1993)WIP1,awound-induciblegenefrommaizewithhomologytoBowman-Birkproteinaseinhibitors.PlantMolBiol22:783-792.
RossoliniGM,CrestiS,IngianniA,CattaniP,RiccioML&SattaG(1994)Useofdeoxyinosine-containingprimersvsdegenerateprimersforpolymerasechainreactionbasedonambiguoussequenceinformation.MolCellProbes8:91-98.
RothBA,GoffSA,KleinTM&FrommME(1991)C1-andR-dependentexpressionofthemaizeBzlgenerequiressequenceswithhomologytomammalianmybandmycbindingsites.PlantCell3:317-325.
RothsteinSJ,LahnersKN,LotsteinRJ,CarozziNB,JayneSM&RiceDA(1987)Promotercassettes,antibiotic-resistancegenes,andvectorsforplanttransformation.Gene53:153-161.
SambrookJ&RllD(2001)Mo1eclarCloning:ALabortory Manual,3rded.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,UnitedStatesofAmerica.
SchmidhauserTJ&HelinskiDR(1985)Regionsofbroad-host-rangeplasmidRK2involvedinreplicationandstablemaintenance inninespeciesofgram-negativebacteria.JBacteriol164:446-455.
SchocherRJ,ShillitoRD,SaulMW,PaszkowskiJ&PotrykusI(1986)Co-transformationofforeigngenesintoplants.Bio/Technology4:1093-1096.
SchultzBetal.(1998)T-DNAtagginginArabidopsisthaliana:Cloningbygenedisruption,inPlant Molecular Biology Manual(2ndedition,GelvinSB,SchilperoortRA&VermaDPS,eds.)KluwerAcademicPublishers,NewYork,NewYork,UnitedStatesofAmerica.
ScopesR(1982)ProteinPurification:PrinciplesandPractice.Springer-Verlag,NewYork,NewYork,UnitedStatesofAmerica.
ShermanF,FinkGR&HicksJ(1982)MethodsinYeastGenetics,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,UnitedStatesofAmerica,
ShimamotoK,TeradaR,IzawaT&FujimotoH(1989)Fertiletransgenicriceplantsregeneratedfromtransformedprotoplasts.Nature338:274-276.
ShinshiH,NeuhasJM,RyalsJ&MeinsFJr.(1990)Structureofatobaccoendochitinasegene:evidencethatdifferentchitinasegenescanarisebytranspositionofsequencesencodingacysteine-richdomain.PlantMolBiol14:357-368.
SilhavyTJ,M.L.Berman,andL.W.Enquist(1984) Experimentswith GeneFusions,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,UnitedStatesofAmerica.
SinghDP(1986)BreedingforResistancetoDiseasesandInsectPests,Springer-Verlag,NewYork,NewYork,UnitedStatesofAmerica.
SkuzeskiJM,NicholsLM&GestelandRF(1990)Analysisofleakyviraltranslationterminationcodonsinvivobytransientexpressionofimprovedbeta-glucuronidasevectors.PlantMolBiol15:65-79.
SmithTF&WatermanM(1981)ComparisonofBiosequences.AdvApplMath2:482-489.
SongR,LlacaV&MessingJ(2001)Mosaicorganizationoforthologoussequencesingrassgenomes.GenomeRes12:1549-1555.
SouthernJA,YoungDF,HeaneyF,BaumgartnerWK,RandallRE(1991)IdentificationofanepitopeonthePandVproteinsofsimianvirus5thatdistinguishesbetweentwoisolateswithdifferentbiologicalcharacteristics. JGenVirol72:1551-7.
SpencerTM,Gordon-KammWJ,DainesRJ,StartW&LemauxP(1990).TheorApplGenet79:625-631.
StewartJM&YoungJD(1984)SolidPhasePeptideSynthesis,2nded.PierceChemicalCo.,Rockford,Illinois,UnitedStatesofAmerica.
SvabZ,HajdukiewiczP&MaligaP(1990)Stabletransformationofplastidsinhigherplants.ProcNatlAcadSciUSA87:8526-8530.
SvabZ&MaligaP(1993)High-frequencyplastidtransformationintobaccobyselectionforachimericaadAgene.ProcNatlAcadSciUSA90:913-917.
TaylorM,VasilV&VasilIK(1993)Enhancedgusgeneexpressionincerealgrasscellsuspensionsandimmatureembryosusingthemaizeubiquitin-basedplasmidpAHC25.PlantCellRep12:491-495.
ThompsonCJ,MovvaNR,Tizard R,Crameri R,Davies JE,LauwereysM&Botterman J(1987)Characterizationoftheherbicide-resistancegenebarfromStreptomyceshygroscopicus.EMBOJ6:2519-2523.
Tijssenp (1993)LaboratoryTechniquesinBiochemistryandMolecular Biologv-HvbridizationwithNucleicAcidProbes.Elsevier,NewYork,NewYork,UnitedStatesofAmerica.
TorrentM,AlvarezI,GeliMI,DalcolI&LudevidD(1997)Lysine-richmodifiedgamma-zeins accumulatein proteinbodiesoftransientlytransformedmaizeendosperms.PlantMolBiol34:139-149.
TriezenbergSJ,KingsburyRC&McKnightSL(1988)FunctionaldissectionofVP16,thetrans-activatorofherpessimplexvirusimmediateearlygeneexpression.GenesDev2:718-729.
UknesS,Mauch-ManiB,MoyerM,PotterS,WilliamsS,DincherS,ChandlerD,SlusarenkoA,WardE&RyalsJ(1992)AcquiredresistanceinArabidopsis.PlantCell4:645-656.
UngerEA,HandJM,CashmoreAR&VasconcelosAC(1989)IsolationofacDNAencodingmitochondrialcitratesynthasefromArabidopsisthaliana.PlantMolBiol13:411-418.
U.S.PatentNo.4,554,101
U.S.PatentNo.4,940,935
U.S.PatentNo.4,945,050
U.S.PatentNo.5,036,006
U.S.PatentNo.5,100,792
U.S.PatentNo.5,188,642
U.S.PatentNo.5,466,785
U.S.PatentNo.5,501,967
U.S.PatentNo.5,523,311
U.S.PatentNo.5,591,616
U.S.PatentNo.5,614,395
U.S.PatentNo.5,639,949
U.S.PatentNo.5,767,378
U.S.PatentNo.5,994,629
U.S.PatentNo.6,369,298
VandenBroeckG,TimkoMP,KauschAP,CashmoreAR,VanMontaguM&Herrera-EstrellaL(1985)Targetingofaforeignproteintochloroplastsbyfusiontothetransitpeptidefromthesmallsubunitofribulose 1,5-bisphosphatecarboxylase.Nature313:358-363.
VasilV,CastilloAM,FrommME&VasilIK(1992)Herbicideresistantfertiletransgenicwheatplantsobtainedbymicroprojectilebombardmentofregenerableembryogeniccallus.Bio/Technology10:667-674.
VasilV,SrivastavaV,CastilloAM,FrommMR&VasilIK(1993)Rapidproductionoftransgenicplantsbydirectbombardmentofculturedimmatureembryos.Bio/Technology11:1553-1558.
VitaleA,SmaniottoE,LonghiR&GalanteE(1982)Reducedsolubleproteins associatedwithmaizeendospermproteinbodies.J.  Exp.Bot.33:439-448.
WallaceJC,GaliliG,KawataEE,CuellarRE,ShotwellMA&LarkinsBA(1988)Aggregationoflysine-containingzeinsintoproteinbodiesinXenopusoocytes.Science240:662-664.
WarnerSA,ScottR,DraperJ(1993)IsolationofanasparagusintracellularPRgene(AoPRl)wound-responsivepromoterbytheinversepolymerasechainreactionanditscharacterizationintransgenictobacco.PlantJ3:191-201.
WasmannCC,ReissB,BartlettSG&BohnertHJ(1986)Theimportanceofthetransitpeptideandthetransportedproteinforproteinimportintochloroplasts.MolGenGenet205:446-453.
WeeksJT,AndersonOD&BlechlAE(1993)RapidProductionofMultipleIndependentLinesofFertileTransgenicWheat(Triticumaestivum).PlantPhysiol102:1077-1084.
WelshJR(1981)FundamentalsofPlantGeneticsandBreeding,JohnWiley&Sons,NewYork,NewYork,UnitedStatesofAmerica.
WhiteJ,ChangSY&BibbMJ(1990)AcassettecontainingthebargeneofStreptomyceshygroscopicus:aselectablemarkerforplanttransformation.NuclAcidsRes18:1062.
WoodDR(ed.)(1983)CropBreeding,AmericanSocietyofAgronomy,Madison,Wisconsin,UnitedStatesofAmerica.
WrickeG&WeberWE(1986)OuantitativeGeneticsandSelectionPlant Breeding,WalterdeGruyterandCo.,Berlin,Germany.
WyssM,PasamontesL,FriedleinA,RemyR,TessierM,KronenbergerA,MiddendorfA,LehmannM,SchnoebelenL,RothlisbergerU,KusznirE,WahlG,MullerF,Lahm HW,Vogel K&vanLoonAP(1999)Biophysicalcharacterizationofungalphytases(myo-inositolhexakisphosphatephosphohydrolases):molecularsize,glycosylation pattern,andengineeringofproteolyticresistance.ApplEnvironMicrobiol65:359-66.
XuD,McElroyD,ThornburgRW&WuR(1993)Systemicinductionofapotatopin2promoterbywounding,methyljasmonate,andabscisicacidintransgenicriceplants.PlantMolBiol22:573-588.
ZhangHM,YangH,RechEL,GoldsTJ,DavisAS,MulliganBJ,CockingEC&DaveyMR(1988)Transgenicriceplantsproducedbyelectroporation-mediatedplasmiduptakeintoprotoplasts.PlantCellReports7:379-384.
ZhaoZY,CaiT,TaglianiL,MillerM,WangN,PangH,RudertM,SchroederS,HondredD,SeltzerJ&PierceD(2000)Agrobacterium-mediatedsorghumtransformation.PlantMolBiol44:789-98.
ZhuT,PetersonDJ,TaglianiL,StClairG,BaszczynskiCL&BowenB(1999)TargetedmanipulationofmaizegenesinvivousingchimericRNA/DNAoligonucleotides.ProcNatlAcadSciUSA96:8768-8773.
要了解可以变化本发明的各种细节,只要不脱离本发明的范围。此外,上述的描述只是用于举例说明的目的,并非用于限制的目的。
序列表
<110>先正达合作有限公司
 
<120>富含谷氨酰胺的玉米种子蛋白质和启动子
 
<130>1392/22PCT
 
<150>US 60/551,286
<151>2004-03-08
 
<160>18
 
<170>PatentIn version 3.3
 
<210>1
<211>927
<212>DNA
<213>Zea mays
 
<220>
<221>CDS
<222>(1)..(927)
 
<400>1
atg aag ctg gtg ctt gtg gtt ctt gct ttc att gct tta gta tca agt        48
Met Lys Leu Val Leu Val Val Leu Ala Phe Ile Ala Leu Val Ser Ser
1               5                   10                  15
gtt tct tgt aca cag aca ggc ggc tgc agc tgt ggt caa caa caa agc        96
Val Ser Cys Thr Gln Thr Gly Gly Cys Ser Cys Gly Gln Gln Gln Ser
            20                  25                  30
cat gag cag caa cat cat cca caa caa cat cat cca caa aaa caa caa       144
His Glu Gln Gln His His Pro Gln Gln His His Pro Gln Lys Gln Gln
        35                  40                  45
cat caa cca cca cca caa cat cac cag cag cag caa cac caa caa caa       192
His Gln Pro Pro Pro Gln His His Gln Gln Gln Gln His Gln Gln Gln
    50                  55                  60
caa gtt cac atg caa cca caa aaa cat cag caa caa caa gaa gtt cat       240
Gln Val His Met Gln Pro Gln Lys His Gln Gln Gln Gln Glu Val His
65                  70                  75                  80
gtt caa caa caa caa caa caa ccg cag cac caa caa caa caa caa caa       288
Val Gln Gln Gln Gln Gln Gln Pro Gln His Gln Gln Gln Gln Gln Gln
                85                  90                  95
caa cag cac caa caa caa cat caa tgt gaa ggc caa caa caa cat cac       336
Gln Gln His Gln Gln Gln His Gln Cys Glu Gly Gln Gln Gln His His
            100                 105                 110
caa caa tca caa ggc cat gtg caa caa cac gaa cag agc cat gag caa       384
Gln Gln Ser Gln Gly His Val Gln Gln His Glu Gln Ser His Glu Gln
        115                 120                 125
cac caa gga cag agc cat gag caa caa cat caa caa caa ttc cag ggt       432
His Gln Gly Gln Ser His Glu Gln Gln His Gln Gln Gln Phe Gln Gly
    130                 135                 140
cat gac aag cag caa caa cca caa cag cct cag caa tat cag cag ggc    480
His Asp Lys Gln Gln Gln Pro Gln Gln Pro Gln Gln Tyr Gln Gln Gly
145                 150                 155                 160
cag gaa aaa tca caa cag caa caa tgt cat tgc cag gag cag caa cag    528
Gln Glu Lys Ser Gln Gln Gln Gln Cys His Cys Gln Glu Gln Gln Gln
                165                 170                 175
act aca agg tgc agc tat aac tac tat agc agt agc tca aat cta aaa    576
Thr Thr Arg Cys Ser Tyr Asn Tyr Tyr Ser Ser Ser Ser Asn Leu Lys
            180                 185                 190
aat tgt cat gaa ttc cta agg cag cag tgc agc cct ttg gta atg cct    624
Asn Cys His Glu Phe Leu Arg Gln Gln Cys Ser Pro Leu Val Met Pro
        195                 200                 205
ttt ctc caa tca cgt ttg ata caa cca agt agc tgc cag gta ttg cag    672
Phe Leu Gln Ser Arg Leu Ile Gln Pro Ser Ser Cys Gln Val Leu Gln
    210                 215                 220
caa caa tgt tgt cat gat ctt agg cag att gag cca caa tac att cac    720
Gln Gln Cys Cys His Asp Leu Arg Gln Ile Glu Pro Gln Tyr Ile His
225                 230                 235                 240
caa gca atc tac aac atg gtt caa tcc ata atc cag gag gag caa caa    768
Gln Ala Ile Tyr Asn Met Val Gln Ser Ile Ile Gln Glu Glu Gln Gln
                245                 250                 255
caa caa cca tgt gag tta tgt gga tct caa caa gct act caa agt gcg    816
Gln Gln Pro Cys Glu Leu Cys Gly Ser Gln Gln Ala Thr Gln Ser Ala
            260                 265                 270
gtg gca atc ttg aca gca gca caa tac cta cca tca atg tgc ggc ttg    864
Val Ala Ile Leu Thr Ala Ala Gln Tyr Leu Pro Ser Met Cys Gly Leu
        275                 280                 285
tac cac tca tac tac caa aat aat cca tgc agc agc aat gac att agt    912
Tyr His Ser Tyr Tyr Gln Asn Asn Pro Cys Ser Ser Asn Asp Ile Ser
    290                 295                 300
ggt gtt tgc aat tga                                                927
Gly Val Cys Asn
305
 
<210>2
<211>308
<212>PRT
<213>Zea mays
 
<400>2
 
Met Lys Leu Val Leu Val Val Leu Ala Phe Ile Ala Leu Val Ser Ser
1               5                   10                  15
Val Ser Cys Thr Gln Thr Gly Gly Cys Ser Cys Gly Gln Gln Gln Ser
            20                  25                  30
His Glu Gln Gln His His Pro Gln Gln His His Pro Gln Lys Gln Gln
        35                  40                  45
His Gln Pro Pro Pro Gln His His Gln Gln Gln Gln His Gln Gln Gln
    50                  55                  60
Gln Val His Met Gln Pro Gln Lys His Gln Gln Gln Gln Glu Val His
65                  70                  75                  80
Val Gln Gln Gln Gln Gln Gln Pro Gln His Gln Gln Gln Gln Gln Gln
                85                  90                  95
Gln Gln His Gln Gln Gln His Gln Cys Glu Gly Gln Gln Gln His His
            100                 105                 110
Gln Gln Ser Gln Gly His Val Gln Gln His Glu Gln Ser His Glu Gln
        115                 120                 125
His Gln Gly Gln Ser His Glu Gln Gln His Gln Gln Gln Phe Gln Gly
    130                 135                 140
His Asp Lys Gln Gln Gln Pro Gln Gln Pro Gln Gln Tyr Gln Gln Gly
145                 150                 155                 160
Gln Glu Lys Ser Gln Gln Gln Gln Cys His Cys Gln Glu Gln Gln Gln
                    165             170                 175
Thr Thr Arg Cys Ser Tyr Asn Tyr Tyr Ser Ser Ser Ser Asn Leu Lys
            180                 185                 190
Asn Cys His Glu Phe Leu Arg Gln Gln Cys Ser Pro Leu Val Met Pro
        195                 200                 205
Phe Leu Gln Ser Arg Leu Ile Gln Pro Ser Ser Cys Gln Val Leu Gln
    210                 215                 220
Gln Gln Cys Cys His Asp Leu Arg Gln Ile Glu Pro Gln Tyr Ile His
225                 230                 235                 240
Gln Ala Ile Tyr Asn Met Val Gln Ser Ile Ile Gln Glu Glu Gln Gln
                245                 250                 255
Gln Gln Pro Cys Glu Leu Cys Gly Ser Gln Gln Ala Thr Gln Ser Ala
            260                 265                 270
Val Ala Ile Leu Thr Ala Ala Gln Tyr Leu Pro Ser Met Cys Gly Leu
        275                 280                 285
Tyr His Ser Tyr Tyr Gln Asn Asn Pro Cys Ser Ser Asn Asp Ile Ser
    290                 295                 300
Gly Val Cys Asn
305
 
<210>3
<211>585
<212>DNA
<213>Zea mays
<400>3
atgaagctgg tgcttgtggt tcttgctttc attgctttag tatcaagtgt ttcttgtaca     60
cagacaggcg gctgcagctg tggtcaacaa caaagccatg agcagcaaca tcatccacaa    120
caacatcatc cacaaaaaca acaacatcaa ccaccaccac aacatcacca gcagcagcaa    180
caccaacaac aacaagttca catgcaacca caaaaacatc agcaacaaca agaagttcat    240
gttcaacaac aacaacaaca accgcagcac caacaacaac aacaacaaca acagcaccaa    300
caacaacatc aatgtgaagg ccaacaacaa catcaccaac aatcacaagg ccatgtgcaa    360
caacacgaac agagccatga gcaacaccaa ggacagagcc atgagcaaca acatcaacaa    420
caattccagg gtcatgacaa gcagcaacaa ccacaacagc ctcagcaata tcagcagggc    480
caggaaaaat cacaacagca acaatgtcat tgccaggagc agcaacagac tacaaggtgc    540
agctataact actatagcag tagctcaaat ctaaaaaatt gtcat                    585
 
<210>4
<211>30
<212>DNA
<213>Zea mays
 
<400>4
gaccacagct gcagccgcct gtctgtgtac    30
 
<210>5
<211>30
<212>DNA
<213>Zea mays
 
<400>5
gcaatgaaag caagaaccac  aagcaccagc   30
 
<210>6
<211>516
<212>DNA
<213>Zea mays
 
<400>6
gggctggtaa attacttggg agcaatggta tgcaaatcct ttgcatgtac gcaaaactag     60
ctagttgtca caagttgtat atcgattcgt cgcgtttcaa caactcatgc aacattacaa    120
acaagtaaca caatattaca aagttagttt catacaaagc aagaaaagga caataatact    180
tgacatgtaa agtgaagctt attatacttc ctaatccaac acaaaacaaa aaaaagttgc    240
acaaaggtcc aaaaatccac atcaaccatt aacctatacg taaagtgagt gatgagtcac    300
attatccaac aaatgtttat caatgtggta tcatacaagc attgacatcc cataaatgca    360
agaaattgtg ccaacaaagc tataagtaac cctcatatgt atttgcactc atgcatcaca    420
aaacatcctt ctatcagtac catcaatcat cattcatctt agtagtatag gcaccaaatc    480
aaatctgcaa catcaattat ctaactccaa aaaccc                              516
<210>7
<211>20
<212>PRT
<213>Zea mays
 
<220>
<221>MISC_FEATURE
<222>(7)..(9)
<223>Xaa is any amino acid
 
<400>7
 
Thr His Thr Ser Gly Gly Xaa Xaa Xaa Gln Pro Pro Pro Pro Val His
1               5                   10                  15
Leu Leu Pro Pro
            20
 
<210>8
<211>20
<212>PRT
<213>Zea mays
 
<400>8
 
Thr Gln Thr Gly Gly Cys Ser Cys Gly Gln Gln Gln Ser His Glu Gln
1               5                   10                  15
Gln His His Pro
            20
 
<210>9
<211>14
<212>PRT
<213>Artificial
 
<220>
<223>Artifical epitope tag sequence V5
 
<400>9
 
Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr
1               5                   10
 
<210>10
<211>5
<212>PRT
<213>Artificial
 
<220>
<223>Another artifical epitope tag sequence
 
<400>10
 
Phe His His Thr Thr
1               5
 
<210>11
<211>6
<212>PRT
<213>Artificial
<220>
<223>Artificially synthesized hexapeptide tag
 
<400>11
 
Ser Glu Lys Asp Glu Leu
1               5
 
<210>12
<211>437
<212>PRT
<213>Artificial
 
<220>
<223>gene product of the phytase expression cassette in vector 11037
 
<400>12
 
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val
            20                  25                  30
Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln
        35                  40                  45
Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys
    50                  55                  60
Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly
65                  70                  75                  80
His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys
                85                  90                  95
Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu
            100                 105                 110
Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp
        115                 120                 125
Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro
    130                 135                 140
Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn
145                 150                 155                 160
Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe
                165                 170                 175
Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn
            180                 185                 190
Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser
        195                 200                 205
Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp
    210                 215                 220
Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu
225                 230                 235                 240
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly
                245                 250                 255
Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn
            260                 265                 270
Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg
        275                 280                 285
Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro
    290                 295                 300
Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe
305                 310                 315                 320
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu
                325                 330                 335
Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
            340                 345                 350
Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp
        355                 360                 365
Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys
    370                 375                 380
Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu
385                 390                 395                 400
Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly
                405                 410                 415
Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu Ser
            420                 425                 430
Glu Lys Asp Glu Leu
        435
 
<210>13
<211>687
<212>DNA
<213>Zea mays
<220>
<221>misc_feature
<222>(1)..(6)
<223>5′Hind III recognition sequence
 
<220>
<221>misc_feature
<222>(682)..(687)
<223>3′BamH I recognition sequence
 
<400>13
aagcttcgat catccaggtg caaccgtata agtcctaaag tggtgaggaa cacgaaacaa     60
ccatgcattg gcatgtaaag ctccaagaat ttgttgtatc cttaacaact cacagaacat    120
caaccaaaat tgcacgtcaa gggtattggg taagaaacaa tcaaacaaat cctctctgtg    180
tgcaaagaaa cacggtgagt catgccgaga tcatactcat ctgatataca tgcttacagc    240
tcacaagaca ttacaaacaa ctcatattgc attacaaaga tcgtttcatg aaaaataaaa    300
taggccggac aggacaaaaa tccttgacgt gtaaagtaaa tttacaacaa aaaaaaagcc    360
atatgtcaag ctaaatctaa ttcgttttac gtagatcaac aacctgtaga aggcaacaaa    420
actgagccac gcagaagtac agaatgattc cagatgaacc atcgacgtgc tacgtaaaga    480
gagtgacgag tcatatacat ttggcaagaa accatgaagc tgcctacagc cgtctcggtg    540
gcataagaac acaagaaatt gtgttaatta atcaaagcta taaataacgc tcgcatgcct    600
gtgcacttct ccatcaccac cactgggtct tcagaccatt agctttatct actccagagc    660
gcagaagaac ccgatcgaca aggatcc                                        687
 
<210>14
<211>11357
<212>DNA
<213>Artificial
 
<220>
<223>Artificially constructed expression construct encoding a Nov9x
     phytase with a gamma zein signal sequence underthe control of
     the gamma zein promoter
 
<220>
<221>misc_feature
<222>(1)..(11357)
<223>The sequence presented is of a circular molecule
 
<400>14
gaattggccg cagcggccat ttaaatcaat tgggcgcgcc gaattcgagc tcggtacaag     60
cttcgatcat ccaggtgcaa ccgtataagt cctaaagtgg tgaggaacac gaaacaacca    120
tgcattggca tgtaaagctc caagaatttg ttgtatcctt aacaactcac agaacatcaa    180
ccaaaattgc acgtcaaggg tattgggtaa gaaacaatca aacaaatcct ctctgtgtgc    240
aaagaaacac ggtgagtcat gccgagatca tactcatctg atatacatgc ttacagctca    300
caagacatta caaacaactc atattgcatt acaaagatcg tttcatgaaa aataaaatag    360
gccggacagg acaaaaatcc ttgacgtgta aagtaaattt acaacaaaaa aaaagccata    420
tgtcaagcta aatctaattc gttttacgta gatcaacaac ctgtagaagg caacaaaact  480
gagccacgca gaagtacaga atgattccag atgaaccatc gacgtgctac gtaaagagag  540
tgacgagtca tatacatttg gcaagaaacc atgaagctgc ctacagccgt ctcggtggca  600
taagaacaca agaaattgtg ttaattaatc aaagctataa ataacgctcg catgcctgtg  660
cacttctcca tcaccaccac tgggtcttca gaccattagc tttatctact ccagagcgca  720
gaagaacccg atcgacagga tccaccatga gggtgttgct cgttgccctc gctctcctgg  780
ctctcgctgc gagcgccacc agcgctgcgc agtccgagcc ggagctgaag ctggagtccg  840
tggtgatcgt gtcccgccac ggcgtgcgcg ccccgaccaa ggccacccag ctcatgcagg  900
acgtgacccc ggacgcctgg ccgacctggc cggtgaagct cggcgagctg accccgcgcg  960
gcggcgagct gatcgcctac ctcggccact actggcgcca gcgcctcgtg gccgacggcc 1020
tcctcccgaa gtgcggctgc ccgcagtccg gccaggtggc catcatcgcc gacgtggacg 1080
agcgcacccg caagaccggc gaggccttcg ccgccggcct cgccccggac tgcgccatca 1140
ccgtgcacac ccaggccgac acctcctccc cggacccgct cttcaacccg ctcaagaccg 1200
gcgtgtgcca gctcgacaac gccaacgtga ccgacgccat cctggagcgc gccggcggct 1260
ccatcgccga cttcaccggc cactaccaga ccgccttccg cgagctggag cgcgtgctca 1320
acttcccgca gtccaacctc tgcctcaagc gcgagaagca ggacgagtcc tgctccctca 1380
cccaggccct cccgtccgag ctgaaggtgt ccgccgactg cgtgtccctc accggcgccg 1440
tgtccctcgc ctccatgctc accgaaatct tcctcctcca gcaggcccag ggcatgccgg 1500
agccgggctg gggccgcatc accgactccc accagtggaa caccctcctc tccctccaca 1560
acgcccagtt cgacctcctc cagcgcaccc cggaggtggc ccgctcccgc gccaccccgc 1620
tcctcgacct catcaagacc gccctcaccc cgcacccgcc gcagaagcag gcctacggcg 1680
tgaccctccc gacctccgtg ctcttcatcg ccggccacga caccaacctc gccaacctcg 1740
gcggcgccct ggagctgaac tggaccctcc cgggccagcc ggacaacacc ccgccgggcg 1800
gcgagctggt gttcgagcgc tggcgccgcc tctccgacaa ctcccagtgg attcaggtgt 1860
ccctcgtgtt ccagaccctc cagcagatgc gcgacaagac cccgctctcc ctcaacaccc 1920
cgccgggcga ggtgaagctc accctcgccg gctgcgagga gcgcaacgcc cagggcatgt 1980
gctccctcgc cggcttcacc cagatcgtga acgaggcccg catcccggcc tgctccctct 2040
ccgagaagga cgagctgtaa tagagctcta gatctgttct gcacaaagtg gagtagtcag 2100
tcatcgatca ggaaccagac accagacttt tattcataca gtgaagtgaa gtgaagtgca 2160
gtgcagtgag ttgctggttt ttgtacaact tagtatgtat ttgtatttgt aaaatacttc 2220
tatcaataaa atttctaatt cctaaaacca aaatccaggg gtaccagctt gcatgcctgc 2280
agtgcagcgt gacccggtcg tgcccctctc tagagataat gagcattgca tgtctaagtt 2340
ataaaaaatt accacatatt ttttttgtca cacttgtttg aagtgcagtt tatctatctt 2400
tatacatata tttaaacttt actctacgaa taatataatc tatagtacta caataatatc 2460
agtgttttag agaatcatat aaatgaacag ttagacatgg tctaaaggac aattgagtat    2520
tttgacaaca ggactctaca gttttatctt tttagtgtgc atgtgttctc cttttttttt    2580
gcaaatagct tcacctatat aatacttcat ccattttatt agtacatcca tttagggttt    2640
agggttaatg gtttttatag actaattttt ttagtacatc tattttattc tattttagcc    2700
tctaaattaa gaaaactaaa actctatttt agttttttta tttaataatt tagatataaa    2760
atagaataaa ataaagtgac taaaaattaa acaaataccc tttaagaaat taaaaaaact    2820
aaggaaacat ttttcttgtt tcgagtagat aatgccagcc tgttaaacgc cgtcgacgag    2880
tctaacggac accaaccagc gaaccagcag cgtcgcgtcg ggccaagcga agcagacggc    2940
acggcatctc tgtcgctgcc tctggacccc tctcgagagt tccgctccac cgttggactt    3000
gctccgctgt cggcatccag aaattgcgtg gcggagcggc agacgtgagc cggcacggca    3060
ggcggcctcc tcctcctctc acggcaccgg cagctacggg ggattccttt cccaccgctc    3120
cttcgctttc ccttcctcgc ccgccgtaat aaatagacac cccctccaca ccctctttcc    3180
ccaacctcgt gttgttcgga gcgcacacac acacaaccag atctccccca aatccacccg    3240
tcggcacctc cgcttcaagg tacgccgctc gtcctccccc cccccccctc tctaccttct    3300
ctagatcggc gttccggtcc atggttaggg cccggtagtt ctacttctgt tcatgtttgt    3360
gttagatccg tgtttgtgtt agatccgtgc tgctagcgtt cgtacacgga tgcgacctgt    3420
acgtcagaca cgttctgatt gctaacttgc cagtgtttct ctttggggaa tcctgggatg    3480
gctctagccg ttccgcagac gggatcgatt tcatgatttt ttttgtttcg ttgcataggg    3540
tttggtttgc ccttttcctt tatttcaata tatgccgtgc acttgtttgt cgggtcatct    3600
tttcatgctt ttttttgtct tggttgtgat gatgtggtct ggttgggcgg tcgttctaga    3660
tcggagtaga attctgtttc aaactacctg gtggatttat taattttgga tctgtatgtg    3720
tgtgccatac atattcatag ttacgaattg aagatgatgg atggaaatat cgatctagga    3780
taggtataca tgttgatgcg ggttttactg atgcatatac agagatgctt tttgttcgct    3840
tggttgtgat gatgtggtgt ggttgggcgg tcgttcattc gttctagatc ggagtagaat    3900
actgtttcaa actacctggt gtatttatta attttggaac tgtatgtgtg tgtcatacat    3960
cttcatagtt acgagtttaa gatggatgga aatatcgatc taggataggt atacatgttg    4020
atgtgggttt tactgatgca tatacatgat ggcatatgca gcatctattc atatgctcta    4080
accttgagta cctatctatt ataataaaca agtatgtttt ataattattt tgatcttgat    4140
atacttggat gatggcatat gcagcagcta tatgtggattt ttttagccc tgccttcata    4200
cgctatttat ttgcttggta ctgtttcttt tgtcgatgct caccctgttg tttggtgtta    4260
cttctgcagg gatccccgat catgcaaaaa ctcattaact cagtgcaaaa ctatgcctgg    4320
ggcagcaaaa cggcgttgac tgaactttat ggtatggaaa atccgtccag ccagccgatg    4380
gccgagctgt ggatgggcgc acatccgaaa agcagttcac gagtgcagaa tgccgccgga    4440
gatatcgttt cactgcgtga tgtgattgag agtgataaat cgactctgct cggagaggcc    4500
gttgccaaac gctttggcga actgcctttc ctgttcaaag tattatgcgc agcacagcca    4560
ctctccattc aggttcatcc aaacaaacac aattctgaaa tcggttttgc caaagaaaat    4620
gccgcaggta tcccgatgga tgccgccgag cgtaactata aagatcctaa ccacaagccg    4680
gagctggttt ttgcgctgac gcctttcctt gcgatgaacg cgtttcgtga attttccgag    4740
attgtctccc tactccagcc ggtcgcaggt gcacatccgg cgattgctca ctttttacaa    4800
cagcctgatg ccgaacgttt aagcgaactg ttcgccagcc tgttgaatat gcagggtgaa    4860
gaaaaatccc gcgcgctggc gattttaaaa tcggccctcg atagccagca gggtgaaccg    4920
tggcaaacga ttcgtttaat ttctgaattt tacccggaag acagcggtct gttctccccg    4980
ctattgctga atgtggtgaa attgaaccct ggcgaagcga tgttcctgtt cgctgaaaca    5040
ccgcacgctt acctgcaagg cgtggcgctg gaagtgatgg caaactccga taacgtgctg    5100
cgtgcgggtc tgacgcctaa atacattgat attccggaac tggttgccaa tgtgaaattc    5160
gaagccaaac cggctaacca gttgttgacc cagccggtga aacaaggtgc agaactggac    5220
ttcccgattc cagtggatga ttttgccttc tcgctgcatg accttagtga taaagaaacc    5280
accattagcc agcagagtgc cgccattttg ttctgcgtcg aaggcgatgc aacgttgtgg    5340
aaaggttctc agcagttaca gcttaaaccg ggtgaatcag cgtttattgc cgccaacgaa    5400
tcaccggtga ctgtcaaagg ccacggccgt ttagcgcgtg tttacaacaa gctgtaagag    5460
cttactgaaa aaattaacat ctcttgctaa gctgggagct cgatccgtcg acctgcagat    5520
cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg    5580
attatcatat aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg    5640
acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg    5700
atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg    5760
ttactagatc tgctagccct gcaggaaatt taccggtgcc cgggcggcca gcatggccgt    5820
atccgcaatg tgttattaag ttgtctaagc gtcaatttgt ttacaccaca atatatcctg    5880
ccaccagcca gccaacagct ccccgaccgg cagctcggca caaaatcacc actcgataca    5940
ggcagcccat cagaattaat tctcatgttt gacagcttat catcgactgc acggtgcacc    6000
aatgcttctg gcgtcaggca gccatcggaa gctgtggtat ggctgtgcag gtcgtaaatc    6060
actgcataat tcgtgtcgct caaggcgcac tcccgttctg gataatgttt tttgcgccga    6120
catcataacg gttctggcaa atattctgaa atgagctgtt gacaattaat catccggctc    6180
gtataatgtg tggaattgtg agcggataac aatttcacac aggaaacaga ccatgaggga    6240
agcgttgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca    6300
tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa    6360
gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg    6420
gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct    6480
ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc    6540
taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga    6600
gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt    6660
tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt    6720
tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga    6780
gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc    6840
gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt    6900
catacttgaa gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga    6960
tcagttggaa gaatttgttc actacgtgaa aggcgagatc accaaagtag tcggcaaata    7020
aagctctagt ggatctccgt acccggggat ctggctcgcg gcggacgcac gacgccgggg    7080
cgagaccata ggcgatctcc taaatcaata gtagctgtaa cctcgaagcg tttcacttgt    7140
aacaacgatt gagaattttt gtcataaaat tgaaatactt ggttcgcatt tttgtcatcc    7200
gcggtcagcc gcaattctga cgaactgccc atttagctgg agatgattgt acatccttca    7260
cgtgaaaatt tctcaagcgc tgtgaacaag ggttcagatt ttagattgaa aggtgagccg    7320
ttgaaacacg ttcttcttgt cgatgacgac gtcgctatgc ggcatcttat tattgaatac    7380
cttacgatcc acgccttcaa agtgaccgcg gtagccgaca gcacccagtt cacaagagta    7440
ctctcttccg cgacggtcga tgtcgtggtt gttgatctag atttaggtcg tgaagatggg    7500
ctcgagatcg ttcgtaatct ggcggcaaag tctgatattc caatcataat tatcagtggc    7560
gaccgccttg aggagacgga taaagttgtt gcactcgagc taggagcaag tgattttatc    7620
gctaagccgt tcagtatcag agagtttcta gcacgcattc gggttgcctt gcgcgtgcgc    7680
cccaacgttg tccgctccaa agaccgacgg tctttttgtt ttactgactg gacacttaat    7740
ctcaggcaac gtcgcttgat gtccgaagct ggcggtgagg tgaaacttac ggcaggtgag    7800
ttcaatcttc tcctcgcgtt tttagagaaa ccccgcgacg ttctatcgcg cgagcaactt    7860
ctcattgcca gtcgagtacg cgacgaggag gtttatgaca ggagtataga tgttctcatt    7920
ttgaggctgc gccgcaaact tgaggcagat ccgtcaagcc ctcaactgat aaaaacagca    7980
agaggtgccg gttatttctt tgacgcggac gtgcaggttt cgcacggggg gacgatggca    8040
gcctgagcca attcccagat ccccgaggaa tcggcgtgag cggtcgcaaa ccatccggcc    8100
cggtacaaat cggcgcggcg ctgggtgatg acctggtgga gaagttgaag gccgcgcagg    8160
ccgcccagcg gcaacgcatc gaggcagaag cacgccccgg tgaatcgtgg caagcggccg    8220
ctgatcgaat ccgcaaagaa tcccggcaac cgccggcagc cggtgcgccg tcgattagga    8280
agccgcccaa gggcgacgag caaccagatt ttttcgttcc gatgctctat gacgtgggca    8340
cccgcgatag tcgcagcatc atggacgtgg ccgttttccg tctgtcgaag cgtgaccgac    8400
gagctggcga ggtgatccgc tacgagcttc cagacgggca cgtagaggtt tccgcagggc    8460
cggccggcat ggccagtgtg tgggattacg acctggtact gatggcggtt tcccatctaa    8520
ccgaatccat gaaccgatac cgggaaggga agggagacaa gcccggccgc gtgttccgtc    8580
cacacgttgc ggacgtactc aagttctgcc ggcgagccga tggcggaaag cagaaagacg    8640
acctggtaga aacctgcatt cggttaaaca ccacgcacgt tgccatgcag cgtacgaaga    8700
aggccaagaa cggccgcctg gtgacggtat ccgagggtga agccttgatt agccgctaca    8760
agatcgtaaa gagcgaaacc gggcggccgg agtacatcga gatcgagcta gctgattgga    8820
tgtaccgcga gatcacagaa ggcaagaacc cggacgtgct gacggttcac cccgattact    8880
ttttgatcga tcccggcatc ggccgttttc tctaccgcct ggcacgccgc gccgcaggca    8940
aggcagaagc cagatggttg ttcaagacga tctacgaacg cagtggcagc gccggagagt    9000
tcaagaagtt ctgtttcacc gtgcgcaagc tgatcgggtc aaatgacctg ccggagtacg    9060
atttgaagga ggaggcgggg caggctggcc cgatcctagt catgcgctac cgcaacctga    9120
tcgagggcga agcatccgcc ggttcctaat gtacggagca gatgctaggg caaattgccc    9180
tagcagggga aaaaggtcga aaaggtctct ttcctgtgga tagcacgtac attgggaacc    9240
caaagccgta cattgggaac cggaacccgt acattgggaa cccaaagccg tacattggga    9300
accggtcaca catgtaagtg actgatataa aagagaaaaa aggcgatttt tccgcctaaa    9360
actctttaaa acttattaaa actcttaaaa cccgcctggc ctgtgcataa ctgtctggcc    9420
agcgcacagc cgaagagctg caaaaagcgc ctacccttcg gtcgctgcgc tccctacgcc    9480
ccgccgcttc gcgtcggcct atcgcggccg ctggccgctc aaaaatggct ggcctacggc    9540
caggcaatct accagggcgc ggacaagccg cgccgtcgcc actcgaccgc cggcgctgag    9600
gtctgcctcg tgaagaaggt gttgctgact cataccaggc ctgaatcgcc ccatcatcca    9660
gccagaaagt gagggagcca cggttgatga gagctttgtt gtaggtggac cagttggtga    9720
ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc gggaagatgc gtgatctgat    9780
ccttcaactc agcaaaagtt cgatttattc aacaaagccg ccgtcccgtc aagtcagcgt    9840
aatgctctgc cagtgttaca accaattaac caattctgat tagaaaaact catcgagcat    9900
caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg    9960
tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta   10020
tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa   10080
aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa   10140
aagctctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct   10200
cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat   10260
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga   10320
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt   10380
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt   10440
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc   10500
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa   10560
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct   10620
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta    10680
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg    10740
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc    10800
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta    10860
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg    10920
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt    10980
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg    11040
tcatgagatt atcaaaaagg atcttcacct agatccttttgatccggaat  taattcctgt    11100
ggttggcatg cacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc    11160
cgattattct aataaacgct cttttctctt aggtttaccc gccaatatat cctgtcaaac    11220
actgatagtt taaactgaag gcgggaaacg acaatctgat catgagcgga gaattaaggg    11280
agtcacgtta tgacccccgc cgatgacgcg ggacaagccg ttttacgttt ggaactgaca    11340
gaaccgcaac gctgcag                                                   11357
 
<210>15
<211>9169
<212>DNA
<213>Artificial
 
<220>
<223>Artificial Agrobacterium binary vector encoding E.coli manA
     phosphomannose isomerase under the transcriptional control of a
     maize ubiquitin promoter
 
<220>
<221>misc_feature
<222>(1)..(9169)
<223>The sequence presented is of a circular molecule
 
<400>15
aagcttggcg cgccggtacc agcttgcatg cctgcagtgc agcgtgaccc ggtcgtgccc     60
ctctctagag ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt    120
tgtcacactt gtttgaagtg cagtttatct atctttatac atatatttaa actttactct    180
acgaataata taatctatag tactacaata atatcagtgt tttagagaat catataaatg    240
aacagttaga catggtctaa aggacaattg agtattttga caacaggact ctacagtttt    300
atctttttag tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac    360
ttcatccatt ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa    420
tttttttagt acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct    480
attttagttt ttttatttaa taatttagat ataaaataga ataaaataaa gtgactaaaa    540
attaaacaaa taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag    600
tagataatgc cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc    660
agcagcgtcg cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg    720
acccctctcg agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt    780
gcgtggcgga gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc    840
accggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc    900
gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca    960
cacacacaca accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc   1020
cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt   1080
tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc   1140
cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa   1200
cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat   1260
cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt   1320
caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt   1380
gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact   1440
acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg   1500
aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt   1560
tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg   1620
ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt   1680
tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg   1740
atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac   1800
atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat   1860
aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc   1920
agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt   1980
tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcagggatcc ccgatcatgc   2040
aaaaactcat taactcagtg caaaactatg cctggggcag caaaacggcg ttgactgaac   2100
tttatggtat ggaaaatccg tccagccagc cgatggccga gctgtggatg ggcgcacatc   2160
cgaaaagcag ttcacgagtg cagaatgccg ccggagatat cgtttcactg cgtgatgtga   2220
ttgagagtga taaatcgact ctgctcggag aggccgttgc caaacgcttt ggcgaactgc   2280
ctttcctgtt caaagtatta tgcgcagcac agccactctc cattcaggtt catccaaaca   2340
aacacaattc tgaaatcggt tttgccaaag aaaatgccgc aggtatcccg atggatgccg   2400
ccgagcgtaa ctataaagat cctaaccaca agccggagct ggtttttgcg ctgacgcctt   2460
tccttgcgat gaacgcgttt cgtgaatttt ccgagattgt ctccctactc cagccggtcg   2520
caggtgcaca tccggcgatt gctcactttt tacaacagcc tgatgccgaa cgtttaagcg   2580
aactgttcgc cagcctgttg aatatgcagg gtgaagaaaa atcccgcgcg ctggcgattt   2640
taaaatcggc cctcgatagc cagcagggtg aaccgtggca aacgattcgt ttaatttctg   2700
aattttaccc ggaagacagc ggtctgttct ccccgctatt gctgaatgtg gtgaaattga   2760
accctggcga agcgatgttc ctgttcgctg aaacaccgca cgcttacctg caaggcgtgg    2820
cgctggaagt gatggcaaac tccgataacg tgctgcgtgc gggtctgacg cctaaataca    2880
ttgatattcc ggaactggtt gccaatgtga aattcgaagc caaaccggct aaccagttgt    2940
tgacccagcc ggtgaaacaa ggtgcagaac tggacttccc gattccagtg gatgattttg    3000
ccttctcgct gcatgacctt agtgataaag aaaccaccat tagccagcag agtgccgcca    3060
ttttgttctg cgtcgaaggc gatgcaacgt tgtggaaagg ttctcagcag ttacagctta    3120
aaccgggtga atcagcgttt attgccgcca acgaatcacc ggtgactgtc aaaggccacg    3180
gccgtttagc gcgtgtttac aacaagctgt aagagcttac tgaaaaaatt aacatctctt    3240
gctaagctgg gagctcgatc cgtcgacctg cagatcgttc aaacatttgg caataaagtt    3300
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt    3360
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta    3420
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa    3480
actaggataa attatcgcgc gcggtgtcat ctatgttact agatctgcta gccctgcagg    3540
aaatttaccg gtgcccgggc ggccagcatg gccgtatccg caatgtgtta ttaagttgtc    3600
taagcgtcaa tttgtttaca ccacaatata tcctgccacc agccagccaa cagctccccg    3660
accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagaa ttaattctca    3720
tgtttgacag cttatcatcg actgcacggt gcaccaatgc ttctggcgtc aggcagccat    3780
cggaagctgt ggtatggctg tgcaggtcgt aaatcactgc ataattcgtg tcgctcaagg    3840
cgcactcccg ttctggataa tgttttttgc gccgacatca taacggttct ggcaaatatt    3900
ctgaaatgag ctgttgacaa ttaatcatcc ggctcgtata atgtgtggaa ttgtgagcgg    3960
ataacaattt cacacaggaa acagaccatg agggaagcgt tgatcgccga agtatcgact    4020
caactatcag aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta    4080
catttgtacg gctccgcagt ggatggcggc ctgaagccac acagtgatat tgatttgctg    4140
gttacggtga ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg    4200
gaaacttcgg cttcccctgg agagagcgag attctccgcg ctgtagaagt caccattgtt    4260
gtgcacgacg acatcattcc gtggcgttat ccagctaagc gcgaactgca atttggagaa    4320
tggcagcgca atgacattct tgcaggtatc ttcgagccag ccacgatcga cattgatctg    4380
gctatcttgc tgacaaaagc aagagaacat agcgttgcct tggtaggtcc agcggcggag    4440
gaactctttg atccggttcc tgaacaggat ctatttgagg cgctaaatga aaccttaacg    4500
ctatggaact cgccgcccga ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc    4560
cgcatttggt acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg    4620
gcaatggagc gcctgccggc ccagtatcag cccgtcatac ttgaagctag gcaggcttat    4680
cttggacaag aagatcgctt ggcctcgcgc gcagatcagt tggaagaatt tgttcactac    4740
gtgaaaggcg agatcaccaa agtagtcggc aaataaagct ctagtggatc tccgtacccg    4800
gggatctggc tcgcggcgga cgcacgacgc cggggcgaga ccataggcga tctcctaaat    4860
caatagtagc tgtaacctcg aagcgtttca cttgtaacaa cgattgagaa tttttgtcat    4920
aaaattgaaa tacttggttc gcatttttgt catccgcggt cagccgcaat tctgacgaac    4980
tgcccattta gctggagatg attgtacatc cttcacgtga aaatttctca agcgctgtga    5040
acaagggttc agattttaga ttgaaaggtg agccgttgaa acacgttctt cttgtcgatg    5100
acgacgtcgc tatgcggcat cttattattg aataccttac gatccacgcc ttcaaagtga    5160
ccgcggtagc cgacagcacc cagttcacaa gagtactctc ttccgcgacg gtcgatgtcg    5220
tggttgttga tctagattta ggtcgtgaag atgggctcga gatcgttcgt aatctggcgg    5280
caaagtctga tattccaatc ataattatca gtggcgaccg ccttgaggag acggataaag    5340
ttgttgcact cgagctagga gcaagtgatt ttatcgctaa gccgttcagt atcagagagt    5400
ttctagcacg cattcgggtt gccttgcgcg tgcgccccaa cgttgtccgc tccaaagacc    5460
gacggtcttt ttgttttact gactggacac ttaatctcag gcaacgtcgc ttgatgtccg    5520
aagctggcgg tgaggtgaaa cttacggcag gtgagttcaa tcttctcctc gcgtttttag    5580
agaaaccccg cgacgttcta tcgcgcgagc aacttctcat tgccagtcga gtacgcgacg    5640
aggaggttta tgacaggagt atagatgttc tcattttgag gctgcgccgc aaacttgagg    5700
cagatccgtc aagccctcaa ctgataaaaa cagcaagagg tgccggttat ttctttgacg    5760
cggacgtgca ggtttcgcac ggggggacga tggcagcctg agccaattcc cagatccccg    5820
aggaatcggc gtgagcggtc gcaaaccatc cggcccggta caaatcggcg cggcgctggg    5880
tgatgacctg gtggagaagt tgaaggccgc gcaggccgcc cagcggcaac gcatcgaggc    5940
agaagcacgc cccggtgaat cgtggcaagc ggccgctgat cgaatccgca aagaatcccg    6000
gcaaccgccg gcagccggtg cgccgtcgat taggaagccg cccaagggcg acgagcaacc    6060
agattttttc gttccgatgc tctatgacgt gggcacccgc gatagtcgca gcatcatgga    6120
cgtggccgtt ttccgtctgt cgaagcgtga ccgacgagct ggcgaggtga tccgctacga    6180
gcttccagac gggcacgtag aggtttccgc agggccggcc ggcatggcca gtgtgtggga    6240
ttacgacctg gtactgatgg cggtttccca tctaaccgaa tccatgaacc gataccggga    6300
agggaaggga gacaagcccg gccgcgtgtt ccgtccacac gttgcggacg tactcaagtt    6360
ctgccggcga gccgatggcg gaaagcagaa agacgacctg gtagaaacct gcattcggtt    6420
aaacaccacg cacgttgcca tgcagcgtac gaagaaggcc aagaacggcc gcctggtgac    6480
ggtatccgag ggtgaagcct tgattagccg ctacaagatc gtaaagagcg aaaccgggcg    6540
gccggagtac atcgagatcg agctagctga ttggatgtac cgcgagatca cagaaggcaa    6600
gaacccggac gtgctgacgg ttcaccccga ttactttttg atcgatcccg gcatcggccg    6660
ttttctctac cgcctggcac gccgcgccgc aggcaaggca gaagccagat ggttgttcaa    6720
gacgatctac gaacgcagtg gcagcgccgg agagttcaag aagttctgtt tcaccgtgcg    6780
caagctgatc gggtcaaatg acctgccgga gtacgatttg aaggaggagg cggggcaggc    6840
tggcccgatc ctagtcatgc gctaccgcaa cctgatcgag ggcgaagcat ccgccggttc    6900
ctaatgtacg gagcagatgc tagggcaaat tgccctagca ggggaaaaag gtcgaaaagg    6960
tctctttcct gtggatagca cgtacattgg gaacccaaag ccgtacattg ggaaccggaa    7020
cccgtacatt gggaacccaa agccgtacat tgggaaccgg tcacacatgt aagtgactga    7080
tataaaagag aaaaaaggcg atttttccgc ctaaaactct ttaaaactta ttaaaactct    7140
taaaacccgc ctggcctgtg cataactgtc tggccagcgc acagccgaag agctgcaaaa    7200
agcgcctacc cttcggtcgc tgcgctccct acgccccgcc gcttcgcgtc ggcctatcgc    7260
ggccgctggc cgctcaaaaa tggctggcct acggccaggc aatctaccag ggcgcggaca    7320
agccgcgccg tcgccactcg accgccggcg ctgaggtctg cctcgtgaag aaggtgttgc    7380
tgactcatac caggcctgaa tcgccccatc atccagccag aaagtgaggg agccacggtt    7440
gatgagagct ttgttgtagg tggaccagtt ggtgattttg aacttttgct ttgccacgga    7500
acggtctgcg ttgtcgggaa gatgcgtgat ctgatccttc aactcagcaa aagttcgatt    7560
tattcaacaa agccgccgtc ccgtcaagtc agcgtaatgc tctgccagtg ttacaaccaa    7620
ttaaccaatt ctgattagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata    7680
tcaggattat caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca    7740
ccgaggcagt tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca    7800
acatcaatac aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca    7860
ccatgagtga cgactgaatc cggtgagaat ggcaaaagct ctgcattaat gaatcggcca    7920
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc    7980
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg    8040
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa    8100
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga    8160
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag    8220
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct    8280
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg    8340
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc    8400
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt    8460
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta    8520
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac    8580
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc    8640
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat    8700
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc    8760
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt    8820
cacctagatc cttttgatcc ggaattaatt cctgtggttg gcatgcacat acaaatggac    8880
gaacggataa accttttcac gcccttttaa atatccgatt attctaataa acgctctttt    8940
ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg    9000
aaacgacaat ctgatcatga gcggagaatt aagggagtca cgttatgacc cccgccgatg    9060
acgcgggaca agccgtttta cgtttggaac tgacagaacc gcaacgctgc aggaattggc    9120
cgcagcggcc atttaaatca attgggcgcg ccgaattcga gctcggtac                9169
 
<210>16
<211>5912
<212>DNA
<213>Artificial
 
<220>
<223>Artificial intermediate plasmid encoding gamma-zein-galA fusion
     with 9 base linker
 
<220>
<221>misc_feature
<222>(1)..(5912)
<223>The sequence presented is of a circular molecule
 
<400>16
caagatctgt tctgcacaaa gtggagtagt cagtcatcga tcaggaacca gacaccagac     60
ttttattcat acagtgaagt gaagtgaagt gcagtgcagt gagttgctgg tttttgtaca    120
acttagtatg tatttgtatt tgtaaaatac ttctatcaat aaaatttcta attcctaaaa    180
ccaaaatcca gtgggtaccg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa    240
accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta    300
atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat    360
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt    420
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa    480
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg    540
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga    600
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt    660
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt    720
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat    780
ggcgcgccgc ggccgcttaa gaatattgaa aaaggaagag tatgagtatt caacatttcc    840
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa    900
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac    960
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga   1020
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag   1080
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca   1140
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca   1200
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa    1260
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc    1320
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa    1380
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag    1440
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct    1500
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac    1560
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa    1620
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt    1680
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat    1740
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg    1800
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc    1860
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg    1920
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag    1980
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact    2040
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg    2100
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc    2160
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg    2220
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg    2280
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag    2340
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc    2400
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct    2460
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc    2520
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc    2580
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcttaag cggccgcggc    2640
gcgccgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg    2700
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta    2760
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg    2820
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct    2880
tcgatcatcc aggtgcaacc gtataagtcc taaagtggtg aggaacacga aacaaccatg    2940
cattggcatg taaagctcca agaatttgtt gtatccttaa caactcacag aacatcaacc    3000
aaaattgcac gtcaagggta ttgggtaaga aacaatcaaa caaatcctct ctgtgtgcaa    3060
agaaacacgg tgagtcatgc cgagatcata ctcatctgat atacatgctt acagctcaca    3120
agacattaca aacaactcat attgcattac aaagatcgtt tcatgaaaaa taaaataggc    3180
cggacaggac aaaaatcctt gacgtgtaaa gtaaatttac aacaaaaaaa aagccatatg    3240
tcaagctaaa tctaattcgt tttacgtaga tcaacaacct gtagaaggca acaaaactga    3300
gccacgcaga agtacagaat gattccagat gaaccatcga cgtgctacgt aaagagagtg    3360
acgagtcata tacatttggc aagaaaccat gaagctgcct acagccgtct cggtggcata    3420
agaacacaag aaattgtgtt aattaatcaa agctataaat aacgctcgca tgcctgtgca    3480
cttctccatc accaccactg ggtcttcaga ccattagctt tatctactcc agagcgcaga    3540
agaacccgat cgacaggatc caccatgagg gtgttgctcg ttgccctcgc tctcctggct    3600
ctcgctgcga gcgccacctc cacgcataca agcggcggct gcggctgcca gccaccgccg    3660
ccggttcatc taccgccgcc ggtgcatctg ccacctccgg ttcacctgcc acctccggtg    3720
catctcccac cgccggtcca cctgccgccg ccggtccacc tgccaccgcc ggtccatgtg    3780
ccgccgccgg ttcatctgcc gccgccacca tgccactacc ctactcaacc gccccggcct    3840
cagcctcatc cccagccaca cccatgcccg tgccaacagc cgcatccaag cccgtgccag    3900
ctgcagggaa cctgcggcgt tggcagcacc ccgatcctgg gccagtgcgt cgagttcctg    3960
aggcatcagt gcagcccgac ggcgacgccc tactgctcgc ctcagtgcca gtcgttgcgg    4020
cagcagtgtt gccagcagct caggcaggtg gagccgcagc accgctacca ggcgatcttc    4080
ggcttggtcc tccagtccat cctgcagcag cagccgcaaa gcggccaggt cgcggggctg    4140
ttggcggcgc agatagcgca gcaactgacg gcgatgtgcg gcctgcagca gccgactcca    4200
tgcccctacg ccgctgccgg cggtgtcccc cacggcggcg ccatggagat tttcggcaag    4260
accttccgcg agggccgctt cgtgctcaag gagaagaact tcaccgtgga gttcgccgtg    4320
gagaagatcc acctcggctg gaagatatcg ggccgcgtga agggctcgcc gggccgcctc    4380
gaggtgctcc gcaccaaggc cccggagaag gtgctcgtga acaactggca gtcctggggc    4440
ccgtgccgcg tggtggacgc cttctccttc aagccgccgg agatcgaccc gaactggcgc    4500
tacaccgcat ccgtggtgcc ggacgtgctc gagcgcaacc tgcagtccga ctacttcgtg    4560
gccgaggagg gcaaggtgta cggcttcctc tcctccaaga tcgcccaccc gttcttcgcg    4620
gtggaggacg gcgagctggt ggcctacctc gagtacttcg acgtggagtt cgacgacttc    4680
gtgccgctgg agccgctcgt ggtgctcgag gacccgaaca ccccgctcct cctcgagaag    4740
tacgccgagc tggtgggcat ggagaacaac gcccgggtgc cgaagcacac gccgaccggc    4800
tggtgctcct ggtatcacta cttcctcgac ctcacctggg aggagaccct caagaacctc    4860
aagctcgcca agaacttccc gttcgaggtg ttccagatcg acgacgccta cgagaaggac    4920
atcggcgact ggctcgtgac ccgcggcgac ttcccgtccg tggaggagat ggccaaggtg    4980
atcgccgaga acggcttcat ccccggcatc tggaccgccc cgttctccgt gtccgagact    5040
agtgacgtgt tcaacgagca cccggactgg gtggtgaagg agaacggcga gccgaagatg    5100
gcctaccgca actggaacaa gaagatttac gccctcgacc tctccaagga cgaggtgctc    5160
aactggctct tcgacctctt ctcctccctc cgcaagatgg gctaccgcta cttcaagatc    5220
gacttcctct tcgcgggcgc cgtgccgggg gagcgcaaga agaacatcac cccgatccag    5280
gccttccgca agggcatcga gaccatccgc aaggccgtgg gggaggactc cttcatcctc    5340
ggctgcggct cccccctcct cccggccgtg ggctgcgtgg atggcatgcg catcggcccg    5400
gacaccgccc cgttctgggg agagcacatc gaggacaacg gcgccccggc ggcccgctgg    5460
gccctccgca acgccatcac ccgctacttc atgcacgacc gcttctggct caacgacccg    5520
gactgcctca tcctccgcga ggagaagacc gacctcaccc agaaggagaa ggagctgtac    5580
tcctacacct gcggcgttct agacaacatg atcatcgagt ccgacgacct ctccctcgtg    5640
cgcgaccacg gcaagaaggt gctcaaggag accctcgagc tgctcggggg caggccgcgc    5700
gtgcagaaca tcatgtccga ggacctccgc tacgagatcg tgtcctcggg caccctctcc    5760
ggcaacgtga agatcgtggt ggacctcaac tcccgcgagt accacctcga gaaggagggc    5820
aagtcctccc tcaagaagcg cgtggtgaag cgggaggacg gcaggaactt ctacttctac    5880
gaggagggcg agcgcgagtg agttaacgag ct                                  5912
 
<210>17
<211>11888
<212>DNA
<213>Artificial
 
<220>
<223>Artificial Agrobacterium binary vector based on pNOV2117 into
     which a Q-protein coding sequence has been inserted
 
<220>
<221>misc_feature
<222>(1)..(11888)
<223>The sequence presented is of a circular molecule
 
<400>17
cgcgccggta ccagcttgca tgcctgcagt gcagcgtgac ccggtcgtgc ccctctctag     60
agataatgag cattgcatgt ctaagttata aaaaattacc acatattttt tttgtcacac    120
ttgtttgaag tgcagtttat ctatctttat acatatattt aaactttact ctacgaataa    180
tataatctat agtactacaa taatatcagt gttttagaga atcatataaa tgaacagtta    240
gacatggtct aaaggacaat tgagtatttt gacaacagga ctctacagtt ttatcttttt    300
agtgtgcatg tgttctcctt tttttttgca aatagcttca cctatataat acttcatcca    360
ttttattagt acatccattt agggtttagg gttaatggtt tttatagact aattttttta    420
gtacatctat tttattctat tttagcctct aaattaagaa aactaaaact ctattttagt    480
ttttttattt aataatttag atataaaata gaataaaata aagtgactaa aaattaaaca    540
aatacccttt aagaaattaa aaaaactaag gaaacatttt tcttgtttcg agtagataat    600
gccagcctgt taaacgccgt cgacgagtct aacggacacc aaccagcgaa ccagcagcgt    660
cgcgtcgggc caagcgaagc agacggcacg gcatctctgt cgctgcctct ggacccctct    720
cgagagttcc gctccaccgt tggacttgct ccgctgtcgg catccagaaa ttgcgtggcg    780
gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc tcctctcacg gcaccggcag    840
ctacggggga ttcctttccc accgctcctt cgctttccct tcctcgcccg ccgtaataaa    900
tagacacccc ctccacaccc tctttcccca acctcgtgtt gttcggagcg cacacacaca     960
caaccagatc tcccccaaat ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc    1020
ctcccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc    1080
ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc    1140
tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag    1200
tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca    1260
tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat    1320
gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat    1380
gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg    1440
gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag    1500
atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg    1560
catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg    1620
ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt    1680
ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat    1740
atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc    1800
atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt    1860
atgttttata attattttga tcttgatata cttggatgat ggcatatgca gcagctatat    1920
gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt    1980
cgatgctcac cctgttgttt ggtgttactt ctgcagggat ccccgatcat gcaaaaactc    2040
attaactcag tgcaaaacta tgcctggggc agcaaaacgg cgttgactga actttatggt    2100
atggaaaatc cgtccagcca gccgatggcc gagctgtgga tgggcgcaca tccgaaaagc    2160
agttcacgag tgcagaatgc cgccggagat atcgtttcac tgcgtgatgt gattgagagt    2220
gataaatcga ctctgctcgg agaggccgtt gccaaacgct ttggcgaact gcctttcctg    2280
ttcaaagtat tatgcgcagc acagccactc tccattcagg ttcatccaaa caaacacaat    2340
tctgaaatcg gttttgccaa agaaaatgcc gcaggtatcc cgatggatgc cgccgagcgt    2400
aactataaag atcctaacca caagccggag ctggtttttg cgctgacgcc tttccttgcg    2460
atgaacgcgt ttcgtgaatt ttccgagatt gtctccctac tccagccggt cgcaggtgca    2520
catccggcga ttgctcactt tttacaacag cctgatgccg aacgtttaag cgaactgttc    2580
gccagcctgt tgaatatgca gggtgaagaa aaatcccgcg cgctggcgat tttaaaatcg    2640
gccctcgata gccagcaggg tgaaccgtgg caaacgattc gtttaatttc tgaattttac    2700
ccggaagaca gcggtctgtt ctccccgcta ttgctgaatg tggtgaaatt gaaccctggc    2760
gaagcgatgt tcctgttcgc tgaaacaccg cacgcttacc tgcaaggcgt ggcgctggaa    2820
gtgatggcaa actccgataa cgtgctgcgt gcgggtctga cgcctaaata cattgatatt    2880
ccggaactgg ttgccaatgt gaaattcgaa gccaaaccgg ctaaccagtt gttgacccag    2940
ccggtgaaac aaggtgcaga actggacttc ccgattccag tggatgattt tgccttctcg    3000
ctgcatgacc ttagtgataa agaaaccacc attagccagc agagtgccgc cattttgttc    3060
tgcgtcgaag gcgatgcaac gttgtggaaa ggttctcagc agttacagct taaaccgggt    3120
gaatcagcgt ttattgccgc caacgaatca ccggtgactg tcaaaggcca cggccgttta    3180
gcgcgtgttt acaacaagct gtaagagctt actgaaaaaa ttaacatctc ttgctaagct    3240
gggagctcga tccgtcgacc tgcagatcgt tcaaacattt ggcaataaag tttcttaaga    3300
ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag    3360
catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga    3420
gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat    3480
aaattatcgc gcgcggtgtc atctatgtta ctagatctgc tagccctgca ggaaatttac    3540
cggtgcccgg gcggccagca tggccgtatc cgcaatgtgt tattaagttg tctaagcgtc    3600
aatttgttta caccacaata tatcctgcca ccagccagcc aacagctccc cgaccggcag    3660
ctcggcacaa aatcaccact cgatacaggc agcccatcag aattaattct catgtttgac    3720
agcttatcat cgactgcacg gtgcaccaat gcttctggcg tcaggcagcc atcggaagct    3780
gtggtatggc tgtgcaggtc gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc    3840
cgttctggat aatgtttttt gcgccgacat cataacggtt ctggcaaata ttctgaaatg    3900
agctgttgac aattaatcat ccggctcgta taatgtgtgg aattgtgagc ggataacaat    3960
ttcacacagg aaacagacca tgagggaagc gttgatcgcc gaagtatcga ctcaactatc    4020
agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg ttgctggccg tacatttgta    4080
cggctccgca gtggatggcg gcctgaagcc acacagtgat attgatttgc tggttacggt    4140
gaccgtaagg cttgatgaaa caacgcggcg agctttgatc aacgaccttt tggaaacttc    4200
ggcttcccct ggagagagcg agattctccg cgctgtagaa gtcaccattg ttgtgcacga    4260
cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg caatttggag aatggcagcg    4320
caatgacatt cttgcaggta tcttcgagcc agccacgatc gacattgatc tggctatctt    4380
gctgacaaaa gcaagagaac atagcgttgc cttggtaggt ccagcggcgg aggaactctt    4440
tgatccggtt cctgaacagg atctatttga ggcgctaaat gaaaccttaa cgctatggaa    4500
ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg cttacgttgt cccgcatttg    4560
gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc gctgccgact gggcaatgga    4620
gcgcctgccg gcccagtatc agcccgtcat acttgaagct aggcaggctt atcttggaca    4680
agaagatcgc ttggcctcgc gcgcagatca gttggaagaa tttgttcact acgtgaaagg    4740
cgagatcacc aaagtagtcg gcaaataaag ctctagtgga tctccgtacc cccgggggat    4800
ctggctcgcg gcggacgcac gacgccgggg cgagaccata ggcgatctcc taaatcaata    4860
gtagctgtaa cctcgaagcg tttcacttgt aacaacgatt gagaattttt gtcataaaat    4920
tgaaatactt ggttcgcatt tttgtcatcc gcggtcagcc gcaattctga cgaactgccc    4980
atttagctgg agatgattgt acatccttca cgtgaaaatt tctcaagcgc tgtgaacaag    5040
ggttcagatt ttagattgaa aggtgagccg ttgaaacacg ttcttcttgt cgatgacgac    5100
gtcgctatgc ggcatcttat tattgaatac cttacgatcc acgccttcaa agtgaccgcg    5160
gtagccgaca gcacccagtt cacaagagta ctctcttccg cgacggtcga tgtcgtggtt    5220
gttgatctaa atttaggtcg tgaagatggg ctcgagatcg ttcgtaatct ggcggcaaag    5280
tctgatattc caatcataat tatcagtggc gaccgccttg aggagacgga taaagttgtt    5340
gcactcgagc taggagcaag tgattttatc gctaagccgt tcagtatcag agagtttcta    5400
gcacgcattc gggttgcctt gcgcgtgcgc cccaacgttg tccgctccaa agaccgacgg    5460
tctttttgtt ttactgactg gacacttaat ctcaggcaac gtcgcttgat gtccgaagct    5520
ggcggtgagg tgaaacttac ggcaggtgag ttcaatcttc tcctcgcgtt tttagagaaa    5580
ccccgcgacg ttctatcgcg cgagcaactt ctcattgcca gtcgagtacg cgacgaggag    5640
gtttatgaca ggagtataga tgttctcatt ttgaggctgc gccgcaaact tgaggcagat    5700
ccgtcaagcc ctcaactgat aaaaacagca agaggtgccg gttatttctt tgacgcggac    5760
gtgcaggttt cgcacggggg gacgatggca gcctgagcca attcccagat ccccgaggaa    5820
tcggcgtgag cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg ctgggtgatg    5880
acctggtgga gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc gaggcagaag    5940
cacgccccgg tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa tcccggcaac    6000
cgccggcagc cggtgcgccg tcgattagga agccgcccaa gggcgacgag caaccagatt    6060
ttttcgttcc gatgctctat gacgtgggca cccgcgatag tcgcagcatc atggacgtgg    6120
ccgttttccg tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc tacgagcttc    6180
cagacgggca cgtagaggtt tccgcagggc cggccggcat ggccagtgtg tgggattacg    6240
acctggtact gatggcggtt tcccatctaa ccgaatccat gaaccgatac cgggaaggga    6300
agggagacaa gcccggccgc gtgttccgtc cacacgttgc ggacgtactc aagttctgcc    6360
ggcgagccga tggcggaaag cagaaagacg acctggtaga aacctgcatt cggttaaaca    6420
ccacgcacgt tgccatgcag cgtacgaaga aggccaagaa cggccgcctg gtgacggtat    6480
ccgagggtga agccttgatt agccgctaca agatcgtaaa gagcgaaacc gggcggccgg    6540
agtacatcga gatcgagcta gctgattgga tgtaccgcga gatcacagaa ggcaagaacc    6600
cggacgtgct gacggttcac cccgattact ttttgatcga tcccggcatc ggccgttttc    6660
tctaccgcct ggcacgccgc gccgcaggca aggcagaagc cagatggttg ttcaagacga    6720
tctacgaacg cagtggcagc gccggagagt tcaagaagtt ctgtttcacc gtgcgcaagc    6780
tgatcgggtc aaatgacctg ccggagtacg atttgaagga ggaggcgggg caggctggcc    6840
cgatcctagt catgcgctac cgcaacctga tcgagggcga agcatccgcc ggttcctaat    6900
gtacggagca gatgctaggg caaattgccc tagcagggga aaaaggtcga aaaggtctct    6960
ttcctgtgga tagcacgtac attgggaacc caaagccgta cattgggaac cggaacccgt    7020
acattgggaa cccaaagccg tacattggga accggtcaca catgtaagtg actgatataa    7080
aagagaaaaa aggcgatttt tccgcctaaa actctttaaa acttattaaa actcttaaaa    7140
cccgcctggc ctgtgcataa ctgtctggcc agcgcacagc cgaagagctg caaaaagcgc    7200
ctacccttcg gtcgctgcgc tccctacgcc ccgccgcttc gcgtcggcct atcgcggccg    7260
ctggccgctc aaaaatggct ggcctacggc caggcaatct accagggcgc ggacaagccg    7320
cgccgtcgcc actcgaccgc cggcgctgag gtctgcctcg tgaagaaggt gttgctgact    7380
cataccaggc ctgaatcgcc ccatcatcca gccagaaagt gagggagcca cggttgatga    7440
gagctttgtt gtaggtggac cagttggtga ttttgaactt ttgctttgcc acggaacggt    7500
ctgcgttgtc gggaagatgc gtgatctgat ccttcaactc agcaaaagtt cgatttattc    7560
aacaaagccg ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca accaattaac    7620
caattctgat tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg    7680
attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag    7740
gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc    7800
aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg    7860
agtgacgact gaatccggtg agaatggcaa aagctctgca ttaatgaatc ggccaacgcg    7920
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc    7980
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat    8040
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca    8100
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc    8160
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc    8220
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg    8280
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta    8340
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg    8400
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac    8460
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag    8520
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat    8580
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat    8640
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc    8700
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt    8760
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct    8820
agatcctttt gatccggaat taattcctgt ggttggcatg cacatacaaa tggacgaacg    8880
gataaacctt ttcacgccct tttaaatatc cgattattct aataaacgct cttttctctt    8940
aggtttaccc gccaatatat cctgtcaaac actgatagtt taaactgaag gcgggaaacg    9000
acaatctgat catgagcgga gaattaaggg agtcacgtta tgacccccgc cgatgacgcg    9060
ggacaagccg ttttacgttt ggaactgaca gaaccgcaac gctgcaggaa ttggccgcag    9120
cggccattta aatcaattgg gcgcgccgcc caatacgcaa accgcctctc cccgcgcgtt    9180
ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc    9240
gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc    9300
ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct    9360
atgaccatga ttacgccaag cttcgatcat ccaggtgcaa ccgtataagt cctaaagtgg    9420
tgaggaacac gaaacaacca tgcattggca tgtaaagctc caagaatttg ttgtatcctt    9480
aacaactcac agaacatcaa ccaaaattgc acgtcaaggg tattgggtaa gaaacaatca    9540
aacaaatcct ctctgtgtgc aaagaaacac ggtgagtcat gccgagatca tactcatctg    9600
atatacatgc ttacagctca caagacatta caaacaactc atattgcatt acaaagatcg    9660
tttcatgaaa aataaaatag gccggacagg acaaaaatcc ttgacgtgta aagtaaattt    9720
acaacaaaaa aaaagccata tgtcaagcta aatctaattc gttttacgta gatcaacaac    9780
ctgtagaagg caacaaaact gagccacgca gaagtacaga atgattccag atgaaccatc    9840
gacgtgctac gtaaagagag tgacgagtca tatacatttg gcaagaaacc atgaagctgc    9900
ctacagccgt ctcggtggca taagaacaca agaaattgtg ttaattaatc aaagctataa    9960
ataacgctcg catgcctgtg cacttctcca tcaccaccac tgggtcttca gaccattagc   10020
tttatctact ccagagcgca gaagaacccg atcgacagga tccaccatga agctggtgct   10080
tgtggttctt gctttcattg ctttagtatc aagtgtttct tgtacacaga caggcggctg   10140
cagctgtggt caacaacaaa gccatgagca gcaacatcat ccacaacaac atcatccaca   10200
aaaacaacaa catcaaccac caccacaaca tcaccagcag cagcaacacc aacaacaaca   10260
agttcacatg caaccacaaa aacatcagca acaacaagaa gttcatgttc aacaacaaca   10320
acaacaaccg cagcaccaac aacaacaaca acaacaacag caccaacaac aacatcaatg   10380
tgaaggccaa caacaacatc accaacaatc acaaggccat gtgcaacaac acgaacagag   10440
ccatgagcaa caccaaggac agagccatga gcaacaacat caacaacaat tccagggtca   10500
tgacaagcag caacaaccac aacagcctca gcaatatcag cagggccagg aaaaatcaca   10560
acagcaacaa tgtcattgcc aggagcagca acagactaca aggtgcagct ataactacta   10620
tagcagtagc tcaaatctaa aaaattgtca tgaattccta aggcagcagt gcagcccttt   10680
ggtaatgcct tttctccaat cacgtttgat acaaccaagt agctgccagg tattgcagca   10740
acaatgttgt catgatctta ggcagattga gccacaatac attcaccaag caatctacaa   10800
catggttcaa tccataatcc aggaggagca acaacaacaa ccatgtgagt tatgtggatc   10860
tcaacaagct actcaaagtg cggtggcaat cttgacagca gcacaatacc taccatcaat   10920
gtgcggcttg taccactcat actaccaaaa taatccatgc agcagcaatg acattagtgg   10980
tgtttgcaat tgaagaattg tgtctaccta gccgttatac tcatataacg gtgttaagca   11040
ataaagtacc atacattatg atgttaaaaa aaaaaaaaaa aaagcggccg ccaccgcggt   11100
ggagctcaag atctgttctg cacaaagtgg agtagtcagt catcgatcag gaaccagaca  11160
ccagactttt attcatacag tgaagtgaag tgaagtgcag tgcagtgagt tgctggtttt  11220
tgtacaactt agtatgtatt tgtatttgta aaatacttct atcaataaaa tttctaattc  11280
ctaaaaccaa aatccagtgg gtaccgaatt cactggccgt cgttttacaa cgtcgtgact  11340
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct  11400
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg  11460
gcgaatggcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca  11520
tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc  11580
cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac  11640
aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac  11700
gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa  11760
tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt  11820
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc  11880
ttcaatgg                                                           11888
 
<210>18
<211>5290
<212>DNA
<213>Artificial
 
<220>
<223>Artificial intermediate plasmid encoding gamma zein
     promoter-gamma zein signal sequence-galA fusion
 
<220>
<221>misc_feature
<222>(1)..(5290)
<223>The sequence presented is of a circular molecule
 
<400>18
ctagatctgt tctgcacaaa gtggagtagt cagtcatcga tcaggaacca gacaccagac     60
ttttattcat acagtgaagt gaagtgaagt gcagtgcagt gagttgctgg tttttgtaca    120
acttagtatg tatttgtatt tgtaaaatac ttctatcaat aaaatttcta attcctaaaa    180
ccaaaatcca ggggtaccga attcactggc cgtcgtttta caacgtcgtg actgggaaaa    240
ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa    300
tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg    360
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg    420
cactctcagt acaatctgct ctgatgccgc atagttaagc cagccccgac acccgccaac    480
acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt    540
gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag    600
acgaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc    660
ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt    720
ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaatg    780
gcgcgccgcg gccgcttaag aatattgaaa aaggaagagt atgagtattc aacatttccg    840
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac    900
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact    960
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat   1020
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga   1080
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac   1140
agaaaagca tcttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat   1200
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac   1260
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct   1320
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac   1380
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga   1440
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg   1500
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact   1560
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac   1620
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta   1680
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt   1740
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga   1800
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc   1860
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt   1920
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc   1980
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc   2040
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg   2100
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg   2160
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga   2220
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc   2280
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg   2340
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg   2400
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt   2460
tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc   2520
tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg   2580
aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcttaagc ggccgcggcg   2640
cgccgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagctgg   2700
cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag    2760
ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga    2820
attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt    2880
cgatcatcca ggtgcaaccg tataagtcct aaagtggtga ggaacacgaa acaaccatgc    2940
attggcatgt aaagctccaa gaatttgttg tatccttaac aactcacaga acatcaacca    3000
aaattgcacg tcaagggtat tgggtaagaa acaatcaaac aaatcctctc tgtgtgcaaa    3060
gaaacacggt gagtcatgcc gagatcatac tcatctgata tacatgctta cagctcacaa    3120
gacattacaa acaactcata ttgcattaca aagatcgttt catgaaaaat aaaataggcc    3180
ggacaggaca aaaatccttg acgtgtaaag taaatttaca acaaaaaaaa agccatatgt    3240
caagctaaat ctaattcgtt ttacgtagat caacaacctg tagaaggcaa caaaactgag    3300
ccacgcagaa gtacagaatg attccagatg aaccatcgac gtgctacgta aagagagtga    3360
cgagtcatat acatttggca agaaaccatg aagctgccta cagccgtctc ggtggcataa    3420
gaacacaaga aattgtgtta attaatcaaa gctataaata acgctcgcat gcctgtgcac    3480
ttctccatca ccaccactgg gtcttcagac cattagcttt atctactcca gagcgcagaa    3540
gaacccgatc gacaggatcc accatgaggg tgttgctcgt tgccctcgct ctcctggctc    3600
tcgctgcgag cgccacctcc atggagattt tcggcaagac cttccgcgag ggccgcttcg    3660
tgctcaagga gaagaacttc accgtggagt tcgccgtgga gaagatccac ctcggctgga    3720
agatatcggg ccgcgtgaag ggctcgccgg gccgcctcga ggtgctccgc accaaggccc    3780
cggagaaggt gctcgtgaac aactggcagt cctggggccc gtgccgcgtg gtggacgcct    3840
tctccttcaa gccgccggag atcgacccga actggcgcta caccgcatcc gtggtgccgg    3900
acgtgctcga gcgcaacctg cagtccgact acttcgtggc cgaggagggc aaggtgtacg    3960
gcttcctctc ctccaagatc gcccacccgt tcttcgcggt ggaggacggc gagctggtgg    4020
cctacctcga gtacttcgac gtggagttcg acgacttcgt gccgctggag ccgctcgtgg    4080
tgctcgagga cccgaacacc ccgctcctcc tcgagaagta cgccgagctg gtgggcatgg    4140
agaacaacgc ccgggtgccg aagcacacgc cgaccggctg gtgctcctgg tatcactact    4200
tcctcgacct cacctgggag gagaccctca agaacctcaa gctcgccaag aacttcccgt    4260
tcgaggtgtt ccagatcgac gacgcctacg agaaggacat cggcgactgg ctcgtgaccc    4320
gcggcgactt cccgtccgtg gaggagatgg ccaaggtgat cgccgagaac ggcttcatcc    4380
ccggcatctg gaccgccccg ttctccgtgt ccgagactag tgacgtgttc aacgagcacc    4440
cggactgggt ggtgaaggag aacggcgagc cgaagatggc ctaccgcaac tggaacaaga    4500
agatttacgc cctcgacctc tccaaggacg aggtgctcaa ctggctcttc gacctcttct    4560
cctccctccg caagatgggc taccgctact tcaagatcga cttcctcttc gcgggcgccg    4620
tgccggggga gcgcaagaag aacatcaccc cgatccaggc cttccgcaag ggcatcgaga    4680
ccatccgcaa ggccgtgggg gaggactcct tcatcctcgg ctgcggctcc cccctcctcc    4740
cggccgtggg ctgcgtggat ggcatgcgca tcggcccgga caccgccccg ttctggggag    4800
agcacatcga ggacaacggc gccccggcgg cccgctgggc cctccgcaac gccatcaccc    4860
gctacttcat gcacgaccgc ttctggctca acgacccgga ctgcctcatc ctccgcgagg    4920
agaagaccga cctcacccag aaggagaagg agctgtactc ctacacctgc ggcgttctag    4980
acaacatgat catcgagtcc gacgacctct ccctcgtgcg cgaccacggc aagaaggtgc    5040
tcaaggagac cctcgagctg ctcgggggca ggccgcgcgt gcagaacatc atgtccgagg    5100
acctccgcta cgagatcgtg tcctcgggca ccctctccgg caacgtgaag atcgtggtgg    5160
acctcaactc ccgcgagtac cacctcgaga aggagggcaa gtcctccctc aagaagcgcg    5220
tggtgaagcg ggaggacggc aggaacttct acttctacga ggagggcgag cgcgagtgag    5280
ttaacgagct                                                           5290

Claims (24)

1.用于在植物中表达核苷酸序列的方法,所述方法包括:
(a)将所述核苷酸序列可操纵地连接于包括SEQ ID NO:6的启动子,以产生表达盒;和
(b)生成包括所述表达盒的转基因植物,其中所述核苷酸序列在所述植物中表达。
2.权利要求1的方法,其中所述生成包括用所述表达盒转化植物细胞并从转化植物细胞中再生出植物。
3.权利要求2的方法,其中通过包括所述表达盒的载体的生物弹射击法转化(Biolistic transformation)而进行所述转化。
4.权利要求3的方法,其中所述载体是二元土壤杆菌表达载体。
5.权利要求1的方法,其中所述生成包括将所述核苷酸序列同源重组到处于包括SEQ ID NO:6的启动子的控制下的内源性基因座内。
6.权利要求1的方法,其中所述核苷酸序列编码选自由糖酶、纤维素酶、半纤维素酶、果胶酶、异构酶、裂合酶、蛋白酶、热休克蛋白、伴侣蛋白、植酸酶、杀虫蛋白、抗微生物蛋白、α-淀粉酶、葡萄糖淀粉酶、葡糖苷酶、阿魏酸酯酶、半乳糖苷酶、果胶酶和凝乳酶构成的组的多肽。
7.权利要求6的方法,其中所述糖酶选自葡聚糖酶或木聚糖酶。
8.权利要求1的方法,其中所述植物选自由水稻、玉米、小麦、大麦、燕麦、黑麦Rye、粟、蜀黍、小黑麦、埃塞俄比亚画眉草Teff、芦粟Milo、亚麻、格兰马草Gramma grass、摩擦禾和假蜀黍构成的组。
9.权利要求8的方法,其中所述小麦选自由单粒小麦、斯佩尔特小麦Spelt、双粒小麦组成的组。
10.由SEQ ID NO:6组成的分离的核酸分子。
11.包括SEQ ID NO:6的表达盒。
12.包括权利要求11的表达盒的重组载体。
13.用于在植物细胞中产生异源多肽的方法,所述方法包括:
(a)生成包括与SEQ ID NO:6可操纵地连接的编码异源多肽的核苷酸序列的植物细胞;和
(b)在所述植物细胞中表达编码异源多肽的核苷酸序列,
由此在植物细胞中产生所述异源多肽。
14.权利要求13的方法,其中所述生成包括用包括编码所述异源多肽的核苷酸序列的表达盒转化植物细胞。
15.权利要求14的方法,其中通过包括所述表达盒的载体的生物弹射击法转化而进行所述转化。
16.权利要求15的方法,其中载体是二元土壤杆菌表达载体。
17.权利要求13的方法,其中所述生成包括将所述核苷酸序列同源重组到处于包括SEQ ID NO:6的启动子的控制下的内源性基因座内,使得所述核苷酸序列与SEQ ID NO:6可操纵地连接。
18.权利要求13的方法,其中所述核苷酸序列编码选自由糖酶、纤维素酶、半纤维素酶、果胶酶、异构酶、裂合酶、蛋白酶、热休克蛋白、伴侣蛋白、植酸酶、杀虫蛋白、抗微生物蛋白、α-淀粉酶、葡萄糖淀粉酶、葡糖苷酶、阿魏酸酯酶、半乳糖苷酶、果胶酶和凝乳酶构成的组的多肽。
19.权利要求18的方法,其中所述糖酶选自葡聚糖酶或木聚糖酶。
20.权利要求13的方法,其中所述植物选自由水稻、玉米、小麦、大麦、燕麦、黑麦、粟、蜀黍、小黑麦、埃塞俄比亚画眉草Teff、芦粟Milo、亚麻、格兰马草、摩擦禾和假蜀黍构成的组。
21.权利要求20的方法,其中所述小麦选自由单粒小麦、斯佩尔特小麦Spelt、双粒小麦组成的组。
22.权利要求13的方法,还包括从所述植物细胞再生出植物。
23.权利要求22的方法,还包括从所述植物中分离所述多肽。
24.权利要求23的方法,其中所述多肽位于所述植物细胞的内质网的蛋白体内。
CN2005800074593A 2004-03-08 2005-03-08 富含谷氨酰胺的玉米种子蛋白质和启动子 Expired - Fee Related CN1950510B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US55128604P 2004-03-08 2004-03-08
US60/551,286 2004-03-08
PCT/US2005/007583 WO2005086813A2 (en) 2004-03-08 2005-03-08 Glutamine-rich maize seed protein and promoter

Publications (2)

Publication Number Publication Date
CN1950510A CN1950510A (zh) 2007-04-18
CN1950510B true CN1950510B (zh) 2011-10-05

Family

ID=34976163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800074593A Expired - Fee Related CN1950510B (zh) 2004-03-08 2005-03-08 富含谷氨酰胺的玉米种子蛋白质和启动子

Country Status (7)

Country Link
US (2) US7119255B2 (zh)
EP (2) EP1723245A4 (zh)
CN (1) CN1950510B (zh)
BR (1) BRPI0508518A (zh)
CA (1) CA2558621C (zh)
WO (1) WO2005086813A2 (zh)
ZA (1) ZA200606739B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2224792B1 (es) * 2002-06-28 2007-02-16 Era Plantech, S.L. Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas.
CA2558621C (en) * 2004-03-08 2013-04-30 Syngenta Participations Ag Promoter from maize prolamin seed storage protein and uses thereof
US20090304861A1 (en) * 2006-09-18 2009-12-10 Hamaker Bruce R Leavened products made from non-wheat cereal proteins
WO2009158694A1 (en) * 2008-06-28 2009-12-30 The Donald Danforth Plant Science Center Improved protein production and storage in plants
WO2010085705A2 (en) 2009-01-22 2010-07-29 Syngenta Participations Ag Mutant hydroxyphenylpyruvate dioxygenase polypeptides and methods of use
US9175305B2 (en) 2009-01-22 2015-11-03 Syngenta Participations Ag Mutant hydroxyphenylpyruvate dioxygenase polypeptides and methods of use
ES2555386T5 (es) * 2009-07-10 2018-12-28 Syngenta Participations Ag Nuevos polipéptidos de hidroxifenilpiruvato dioxigenasa, y métodos de uso
US8993844B1 (en) 2010-05-27 2015-03-31 University Of Wyoming Production of spider silk protein in corn
JP2014509866A (ja) * 2011-03-25 2014-04-24 モンサント テクノロジー エルエルシー 植物調節要素およびその使用
CN103620040A (zh) * 2011-04-26 2014-03-05 先正达参股股份有限公司 顽固单子叶植物的增强转化
WO2012159891A1 (en) 2011-05-20 2012-11-29 Syngenta Participations Ag Endosperm-specific plant promoters and uses therefor
WO2013152220A2 (en) * 2012-04-04 2013-10-10 Life Technologies Corporation Tal-effector assembly platform, customized services, kits and assays
CN108624600B (zh) * 2018-05-22 2021-06-18 昆明理工大学 锌指转录因子基因RkMsn4的用途
CN113151296B (zh) * 2021-03-22 2022-09-13 云南中烟工业有限责任公司 一种烟草热激蛋白相关的基因及其应用
CN116333079B (zh) * 2023-03-07 2023-09-15 中国农业科学院农产品加工研究所 一种用叶酸修饰的玉米醇溶蛋白及其制备方法和应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1284999A (zh) * 1997-12-24 2001-02-21 阿方蒂农科股份有限公司 与水稻肌动蛋白第一内含子相联的玉米h3c4启动子,含有它的嵌合基因及转化植物

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
ATE85360T1 (de) 1985-08-07 1993-02-15 Monsanto Co Glyphosat resistente pflanzen.
EP0292435B1 (en) 1987-05-20 1995-07-26 Ciba-Geigy Ag Zea mays plants and transgenic zea mays plants regenerated from protoplasts or protoplast-derived cells
ATE82668T1 (de) 1987-08-21 1992-12-15 Ciba Geigy Ag Benzothiadiazole und ihre verwendung in verfahren und mitteln gegen pflanzenkrankheiten.
EP0332581B1 (de) 1988-03-08 1996-12-11 Ciba-Geigy Ag Regeneration von fertilen Gramineen-Pflanzen aus der Unterfamilie Pooideae ausgehend von Protoplasten
PT89915B (pt) 1988-03-08 1994-10-31 Ciba Geigy Ag Processo para a preparacao de sequencias de dna regulaveis quimicamente
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
ATE241699T1 (de) 1989-03-24 2003-06-15 Syngenta Participations Ag Krankheitsresistente transgene pflanze
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US4940935A (en) 1989-08-28 1990-07-10 Ried Ashman Manufacturing Automatic SMD tester
ES2187497T3 (es) 1990-04-12 2003-06-16 Syngenta Participations Ag Promotores preferentemente en tejidos.
US5639949A (en) 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
GB9304200D0 (en) 1993-03-02 1993-04-21 Sandoz Ltd Improvements in or relating to organic compounds
US5994629A (en) 1991-08-28 1999-11-30 Novartis Ag Positive selection
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
WO1993021335A2 (en) 1992-04-15 1993-10-28 Plant Genetic Systems, N.V. Transformation of monocot cells
WO1994000977A1 (en) 1992-07-07 1994-01-20 Japan Tobacco Inc. Method of transforming monocotyledon
UA70912C2 (uk) 1996-02-28 2004-11-15 Cінгента Партісіпейшнс Аг Молекула днк, яка кодує стійку до дії інгібітора рослинну протопорфіриногеноксидазу, спосіб одержання стійких до гербіциду рослин, спосіб боротьби з ростом небажаних рослин
US6369298B1 (en) 1997-04-30 2002-04-09 Pioneer Hi-Bred International, Inc. Agrobacterium mediated transformation of sorghum
CA2370594C (en) * 1999-04-16 2007-01-09 Pioneer Hi-Bred International, Inc. Regulated expression of genes in plant seeds
US6858778B1 (en) * 2000-11-07 2005-02-22 Pioneer Hi-Bred International, Inc. Plants transformed with a DNA construct comprising a nucleic acid molecule encoding an 18 kD α-globulin
WO2002086077A2 (en) * 2001-04-18 2002-10-31 New Mexico State University Technology Transfer Corporation Co-expression of zein proteins
WO2003018766A2 (en) * 2001-08-27 2003-03-06 Syngenta Participations Ag Self-processing plants and plant parts
TW200305430A (en) 2001-12-28 2003-11-01 Syngenta Participations Ag Thermotolerant phytase for animal feed
CA2558621C (en) * 2004-03-08 2013-04-30 Syngenta Participations Ag Promoter from maize prolamin seed storage protein and uses thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1284999A (zh) * 1997-12-24 2001-02-21 阿方蒂农科股份有限公司 与水稻肌动蛋白第一内含子相联的玉米h3c4启动子,含有它的嵌合基因及转化植物

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵倩,等,.玉米19kD醇溶贮藏蛋白基因启动子种子特异性表达控制区段的分析.植物学报41 1.1999,41(1),51-54. *

Also Published As

Publication number Publication date
CA2558621C (en) 2013-04-30
EP2311965A1 (en) 2011-04-20
ZA200606739B (en) 2008-01-08
CA2558621A1 (en) 2005-09-22
CN1950510A (zh) 2007-04-18
WO2005086813A3 (en) 2006-07-27
WO2005086813A2 (en) 2005-09-22
US7119255B2 (en) 2006-10-10
BRPI0508518A (pt) 2007-08-14
EP1723245A2 (en) 2006-11-22
EP1723245A4 (en) 2010-03-03
US20050198712A1 (en) 2005-09-08
US20060288443A1 (en) 2006-12-21

Similar Documents

Publication Publication Date Title
CN1950510B (zh) 富含谷氨酰胺的玉米种子蛋白质和启动子
CN101889088B (zh) 从植物基因组中切除核酸序列的方法
CA2458514C (en) Modified cry3a toxins and nucleic acid sequences coding therefor
CN1161717A (zh) 植物基因表达的控制
KR100785946B1 (ko) 식물 형질전환 벡터
JP2011101653A (ja) 植物において導入遺伝子を発現するための方法および組成物
KR20020013489A (ko) 식물에서 조절성 형질전이 유전자 발현 및 특질 제거 방법
CN110656114B (zh) 一种烟草色素合成相关的基因及其应用
CN111171118B (zh) 一种植物抗虫基因mCry2Ab及其载体和应用
CN1114694C (zh) 赋予植物抗病性的方法和材料
CN111278849A (zh) 用于改善植物的转化效率的方法和用于转化植物的方法
CN110256549A (zh) 植物抗病蛋白GhWRKY40与编码基因及其应用
WO2009109123A1 (zh) 人工改造合成的杀虫基因及其编码的蛋白质与应用
CN111139261B (zh) 一种利用基因编辑降低小麦籽粒多酚氧化酶含量的方法
CN102656178A (zh) 用于在植物根部调节基因表达的启动子
CN104903444A (zh) 对植物赋予高产性的核酸、制备产量增加的转基因植物的方法、使植物的产量增大的方法
CN101532015A (zh) 一种花药绒毡层和花粉特异性高效启动子及其应用
CN110818784A (zh) 水稻基因OsATL15在调节农药的吸收转运中的应用
CA2532903C (en) Expression cassettes for the bi-directional transgenic expression of nucleic acids in plants
CN111154770B (zh) 水稻基因OsABCC2在调节农药的吸收转运中的应用
CN111118060B (zh) 基于基因编辑的BnALS1突变型基因、蛋白及其应用
CN112250743B (zh) 小麦旱胁迫相关蛋白TaWRKY-A及其编码基因和应用
CN1335891A (zh) 纯合成载体、质粒、包含它们的转基因植物和植物部分,以及获得它们的方法
KR20210137055A (ko) 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제
CN1954075A (zh) 可诱导启动子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111005

Termination date: 20150308

EXPY Termination of patent right or utility model