CN101210247A - 胚乳特异表达启动子、胚乳细胞特异基因及其应用 - Google Patents

胚乳特异表达启动子、胚乳细胞特异基因及其应用 Download PDF

Info

Publication number
CN101210247A
CN101210247A CNA2006101480764A CN200610148076A CN101210247A CN 101210247 A CN101210247 A CN 101210247A CN A2006101480764 A CNA2006101480764 A CN A2006101480764A CN 200610148076 A CN200610148076 A CN 200610148076A CN 101210247 A CN101210247 A CN 101210247A
Authority
CN
China
Prior art keywords
pro
ser
gene
osrrm
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101480764A
Other languages
English (en)
Other versions
CN101210247B (zh
Inventor
王宗阳
蔡秀玲
陈石燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institutes for Biological Sciences SIBS of CAS
Original Assignee
Shanghai Institutes for Biological Sciences SIBS of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institutes for Biological Sciences SIBS of CAS filed Critical Shanghai Institutes for Biological Sciences SIBS of CAS
Priority to CN2006101480764A priority Critical patent/CN101210247B/zh
Publication of CN101210247A publication Critical patent/CN101210247A/zh
Application granted granted Critical
Publication of CN101210247B publication Critical patent/CN101210247B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种能够指导目的基因在植物的胚乳中特异性表达的启动子以及含有所述启动子的载体,所述的启动子对于定点地改良植物品质是特别有用的。本发明还公开了可由所述的启动子指导表达的胚乳特异表达蛋白以及编码所述蛋白的DNA序列,含所述DNA序列的载体以及含所述载体的宿主细胞,以及利用基因工程技术制备所述蛋白的方法。

Description

胚乳特异表达启动子、胚乳细胞特异基因及其应用
技术领域
本发明涉及生物技术和植物学领域。更具体地,本发明涉及一种具有指导目的基因在植物的胚乳中特异性表达功能的启动子,以及具有调节植物生长发育功能的蛋白;本发明还涉及所述启动子或蛋白的应用。
背景技术
水稻、小麦等粮食作物是世界上30多亿人的主食,有着7千余年的种植历史,全世界每年1.52亿公顷的种植面积,全球2亿多农户安身立命的基础,亚洲20亿人口所需热量的80%从中摄取,因此对于水稻、小麦等粮食作物的品种改良具有深远的意义。
为研究一些粮食作物的生长发育,许多实验室正在大规模、系统地分离克隆这些作物中的基因。基因的启动子在控制基因表达中起着关键的作用。在启动子区,转录元件被组装,转录被起始。相对于随后的基因表达阶段,该早期步骤通常是关键的调控步骤。基因表达的组织专一性、发育阶段性、以及在环境变化时基因表达的应答反应主要受基因的启动子控制。分离、鉴别基因启动子,了解启动子的时空专一性表达特征及其作用机制已成为分子生物学研究基因表达调控的重要内容。
另外,植物基因工程研究中需要使外源目的基因能在特定的组织中高效表达,分离植物中一些具有组织专一性、不同表达水平的启动子和有关的调控元件在基因工程研究中有广泛的用途。胚乳是粮食作物营养的重要组成部分,因此分离胚乳特异的启动子对植物品质的改良有着重要的作用。
发明内容
本发明的目的在于提供一种具有指导目的基因在植物胚乳中特异性表达功能的启动子。
本发明的另一目的在于提供一种可由所述的启动子指导表达的、具有调节植物生长发育功能的蛋白。
在本发明的第一方面,提供一种胚乳特异表达启动子,所述的启动子选自下组:
(1)具有SEQ ID NO:4所示的核苷酸序列的多核苷酸;或
(2)在严格条件下能够与(1)限定的多核苷酸序列杂交且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(3)与SEQ ID NO:4有95%以上同源性且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(4)与SEQ ID NO:4所示的核苷酸序列完全互补的多核苷酸。
在本发明的第二方面,提供一种载体,所述的载体含有所述的胚乳特异表达启动子,作为启动子元件。
在本发明的另一优选例中,所述的载体还含有与所述的胚乳特异表达启动子可操作地连接的目的基因。
在本发明的另一优选例中,所述的目的基因是结构基因。
在本发明的另一优选例中,所述的目的基因可编码具有特定功能的蛋白。
在本发明的另一优选例中,所述的目的基因是外源基因。
在本发明的另一优选例中,所述的目的基因包括(但不限于):编码具有SEQ ID NO:2所示氨基酸序列的蛋白的基因、GUS基因、改善稻米品质相关的基因(如人乳铁蛋白基因、赖氨酸合成酶基因、beta胡萝卜素合成基因、直链与支链淀粉合成酶基因等)、以及种子中激素合成相关基因。
在本发明的另一优选例中,所述的目的基因位于所述胚乳特异表达启动子的下游,且与所述启动子的间隔小于2000bp。
在本发明的第三方面,提供一种遗传工程化的宿主细胞,所述的细胞含有所述的载体;或其基因组中整合有外源的所述的胚乳特异表达启动子。
在本发明的第四方面,提供所述的启动子的用途,所述的启动子用于指导目的基因在植物的胚乳中特异性表达。
在本发明的另一优选例中,所述的植物包括(但不限于):禾本科植物、豆科植物。
在本发明的另一优选例中,所述的植物包括(但不限于):水稻、小麦、大麦、玉米、高粱、大豆。
在本发明的第五方面,提供一种使目的基因在植物的胚乳中特异性表达的方法,所述的方法包括:
将构建物转化植物细胞,所述的构建物含有胚乳特异表达启动子以及与所述的胚乳特异表达启动子可操作地连接的目的基因;
筛选出转入了所述构建物或染色体中整合有所述构建物的植物细胞,和
将所述植物细胞再生成植株。
在本发明的另一优选例中,所述的方法包括:
(a)提供携带表达载体的农杆菌,所述表达载体中含有构建物,所述的构建物含有胚乳特异表达启动子以及与所述的胚乳特异表达启动子可操作地连接的目的基因;
(b)将植物细胞或组织或器官与步骤(a)中的农杆菌接触,从而使所述的构建物转入植物细胞,并且整合到植物细胞的染色体上;
(c)选择出转入了所述构建物的植物细胞、组织或器官;以及
(d)将步骤(c)中的植物细胞或组织或器官再生成植物。
在本发明的第六方面,提供一种分离的、可由所述的启动子指导表达的胚乳特异表达蛋白,该蛋白选自下组:
(a)具有SEQ ID NO:2所示的氨基酸序列的多肽;或
(b)将SEQ ID NO:2所示的氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加而形成的,且具有调节植物生长发育功能的由(a)衍生的多肽。
在本发明的另一优选例中,所述的蛋白来源于水稻。
在本发明的另一优选例中,所述的蛋白来源于水稻的胚乳细胞。
在本发明的另一优选例中,所述的调节植物生长发育是抑制植物的营养生长。
在本发明的第七方面,提供一种分离的多核苷酸,该多核苷酸选自下组:
(i)编码所述的蛋白的多核苷酸;或
(ii)与(i)中的多核苷酸互补的多核苷酸。
在本发明的另一优选例中,该多核苷酸编码具有SEQ ID NO:2所示氨基酸序列的多肽。
在本发明的另一优选例中,该多核苷酸选自下组:
(1)SEQ ID NO:1所示的核苷酸序列;或
(2)SEQ ID NO:1中104-3121位所示的核苷酸序列。
在本发明的第八方面,提供一种载体,它含有所述的多核苷酸。
在本发明的第九方面,提供一种遗传工程化的宿主细胞,
它含有所述的载体;或
它的基因组中整合有所述的多核苷酸。
另一方面,还提供所述的蛋白或其编码基因的用途,用于调节植物生长发育。
另一方面,还提供制备所述的蛋白的方法,培养所述的宿主细胞,收集获得所述的蛋白。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。
图1,107#植株中T-DNA插入OsRRM基因位置示意图;其中,
A为T-DNA的结构示意图;
B为水稻9号染色体上BAC克隆OJ1381_H04的部分DNA序列;
C为OsRRM的基因结构示意图,其中T-DNA插入在BAC克隆OJ1381_H04的第98448-98478位之间;
D为cDNA克隆J023129A05的结构示意图。
R,T-DNA右边界;L,T-DNA左边界;GUS,GUS报告基因的编码区;35S,35S启动子;HYG,抗潮霉素基因;ATG,翻译起始密码子;TGA,终止密码子;Probe A和Probe B,Southern杂交所用的探针。RRM1和RRM2,RNA识别功能域;SPOC,SPOC功能域;L-ZIP,亮氨酸拉链区。在图1C中,Box(矩形框)表示OsRRM基因外显子,线条表示内含子和非翻译区。
图2,水稻种子的GUS组织化学染色图;其中,
A为107#植株授粉后20天T1代的种子纵剖面的GUS组织化学染色图;
B为107#植株T4代(授粉后20天)的种子纵剖面的GUS组织化学染色图;
C为质粒pRMP转基因植株T0代种子纵剖面的GUS组织化学染色图;
D为质粒pRMP的T-DNA区部分结构示意图。
图3,Southern杂交分析;其中,
A,107#植株中T-DNA拷贝数的Southern杂交分析,
107#植株总DNA经限制性内切酶BamHI(B),EcoRI(E),HindIII(H)分别消化,用图1中的Probe A作探针。
B,水稻中OsRRM基因拷贝数的Southern杂交分析,
水稻中花11的总DNA经限制性内切酶BamHI(B),EcoRI(E)分别消化,用图1中的Probe B作探针。
图4,OsRRM、AtFPA和几个Spen蛋白HuSHARP、HuRBM15中RRM和SPOC区的序列结构比较;其中,
“-”表示缺失的氨基酸,阴影的氨基酸表示同源的氨基酸,数字表示蛋白中氨基酸的位置;
A,OsRRM的第1个RRM功能域与Spen家族成员的第1个RRM功能域的相似性;
B,OsRRM的第2个RRM功能域与Spen家族成员的第3个RRM功能域的相似性;
C,OsRRM的SPOC结构域与Spen家族成员中的SPOC结构域在三维空间构型上的相似性。
图5,水稻中花11各个组织中OsRRM蛋白的Western Blot分析;其中,
R,根;S,茎;L,叶;DAP(Day After Pollination)指授粉后天数;泳道0、5、10、20分别表示授粉后0、5、10、20天的种子;E,胚;En,胚乳。
图6,107#植株授粉后不同时间种子中的GUS酶活性,其中,DAP指授粉后天数,纵坐标上5、10、15、20、25、30分别代表授粉5、10、15、20、25、30天的种子。
图7,OsRRM::GFP融合蛋白的荧光显微镜观察;其中,
A为转化pA7-GFP质粒的洋葱表皮细胞在荧光背景下的图像;
B为转化pA7-GFP质粒的洋葱表皮细胞可见光背景下的图像;
C为A和B的叠加,标尺显示为20μm;
D为转化pA7-OsRRM-GFP质粒的洋葱表皮细胞在荧光背景下的图像;
E为转化pA7-OsRRM-GFP质粒的洋葱表皮细胞在可见光背景下的图像;
F为转化pA7-OsRRM-GFP质粒的洋葱表皮细胞经过DAPI核染色后在荧光背景下的图像;
G是D,E,F的叠加,标尺显示为20μm。
H为中花11转化p13U-OsRRM-GFP植株的根尖细胞在荧光背景下的图像;
I为中花11转化p13U-OsRRM-GFP植株的根尖细胞在可见光背景下的图像;
J为中花11转化p13U-OsRRM-GFP植株的根尖细胞经过DAPI染色后在荧光背景下的图像;
K是H,I,J的叠加,标尺显示为5μm。
图8,pHB-OsRRM质粒转基因水稻T1代植株的异常表型和Western检测;其中,
A,质粒pHB-OsRRM T-DNA区结构的示意图。
B,转基因植株line 7 T1代植株的异常表型(盘中,左边植株是野生型中花11,右边植株是转基因植株)。
C,转基因植株line 7 T1代植株穗子的异常表型(盘中,左边稻穗获自野生型的植株,右边稻穗获自转基因植株)。
D,OsRRM蛋白的Western blot分析;泳道S表示中花11的种子,泳道L表示中花11的叶,泳道9、6、7分别表示质粒pHB-OsRRM转基因植株lines 9、6、7的叶。
图9,107#植株中OsRRM基因的表达情况,其中,5、10、20分别表示授粉后5、10、20天的种子中OsRRM基因的表达;
A,RT-PCR分析,以Actin作为对照;
B,Western blot分析。
具体实施方式
本发明人经过广泛而深入的研究,意外地发现一种组织特异性启动子,其可指导目的基因在植物的胚乳中特异性表达,本发明人将之命名为胚乳特异表达启动子(OsRRM启动子)。将该启动子与目的基因可操作地相连接后,其可使目的基因特异性地在植物的胚乳组织中表达,而在植物的其它组织中不表达。所述的启动子对于定点地改良植物品质是特别有用的。
此外,本发明人还发现一种可调节植物生长发育的新基因,该基因的在植物中的异位表达可改变植物的表型,本发明人将之命名为胚乳特异表达基因(OsRRM基因)。试验证实,OsRRM基因在胚乳组织或细胞以外的植物组织或细胞中过量表达将使植株出现矮小、晚开花、穗小结实率少的表型,可见OsRRM基因在调节植物生长发育中起重要作用。在此基础上完成了本发明。
如本文所用,所述的“植物”包括(但不限于):禾本科植物、豆科植物等。更优选的,所述的禾本科植物包括但不限于:水稻、小麦、大麦、玉米、高粱、大豆等。
如本文所用,所述的“可操作地连接”是指两个或多个核酸区域或核酸序列的功能性的空间排列。例如:启动子区被置于相对于目的基因核酸序列的特定位置,使得核酸序列的转录受到该启动子区域的引导,从而,启动子区域被“可操作地连接”到该核酸序列上。
如本文所用,所述的“启动子”或“启动子区(域)”是指一种核酸序列,其通常存在于编码序列的上游(5’),能够引导核酸序列转录为mRNA。一般地,启动子或启动子区提供RNA聚合酶和正确起始转录所必需的其它因子的识别位点。在本文中,所述的启动子或启动子区包括启动子的变体,其通过插入或删除调控区域,进行随机或定点突变启动子等来获得。
如本文所用,“组织特异性启动子”又称“器官特异性启动子”,在这类启动子调控下,基因往往只在某些特定的器官或组织部位表达,并表现出发育调节的特性。
通常,如果在某组织或器官中mRNA以比在其它组织或器官中高至少10倍,优选至少高100倍,更优选至少高1000倍水平被表达,则该启动子被认为是组织或器官特异性的。
胚乳特异表达启动子及其指导的基因表达
本发明提供一种启动子,所述的启动子选自下组:
(1)具有SEQ ID NO:4所示的核苷酸序列的多核苷酸;或
(2)在严格条件下能够与(1)限定的多核苷酸序列杂交且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(3)与SEQ ID NO:4有95%以上同源性且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(4)与SEQ ID NO:4所示的核苷酸序列完全互补的多核苷酸。
多核苷酸的杂交是本领域技术人员熟知的技术,特定的一对核酸的杂交特性指示它们的相似性或同一性。因此,本发明还涉及与SEQ ID NO:4所示的核苷酸序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%(例如85%、90%、95%、96%、97%、98%、或99%)相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。
在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸也具有指导目的基因在植物的胚乳中特异性表达的功能。
本发明的启动子是组织或器官特异性的,更特别的,其是植物胚乳特异性的。在一个实施例中,启动子在植物胚乳中表达相关的结构基因。在更特别的实施例中,所述的启动子获自水稻胚乳,且能够在水稻胚乳组织中表达相关的结构基因。
在本发明的实例中,本发明人发现,在所述的启动子的指导下,可以使OsRRM基因特异地在水稻胚乳中表达,而采用其它的组成型启动子,则引导OsRRM基因在水稻的各种组织中表达。因此可见,本发明的启动子是一种组织或器官特异性的启动子。
在本发明的另一实例中,本发明人还分析了本发明的启动子指导下的GUS在转基因水稻中的表达情况。检测显示,在26个植株中,有13个植株在胚乳中检测到GUS的染色,而在这26个转基因植株的其它被检测部位均没有观察到GUS的染色。说明本发明的启动子能够指导基因特异性地在水稻胚乳中进行表达,且使该基因在其它组织或器官中不表达。因此,本发明的启动子对于定点地改良水稻的品质是特别有用的。
本发明的启动子可以被可操作地连接到目的基因上,该目的基因相对于启动子可以是外源(异源)的。所述的目的基因通常可以是任何核酸序列(优选结构性核酸序列),所述的目的基因优选编码具有特定功能的蛋白,例如某些在农业或植物改良上具有重要特性或功能的蛋白。
合适的目的基因包括但不限于:种子贮存基因、脂肪酸途径酶基因、人乳铁蛋白基因、赖氨酸合成酶基因、beta-胡萝卜素合成基因、淀粉(包括直链或支链淀粉)合成基因、激素合成基因、种子中激素合成相关基因等,以及它们的变体。例如,所述基因是编码具有SEQ ID NO:2所示氨基酸序列的蛋白(OsRRM蛋白)的基因、或编码GUS蛋白的基因。
本发明的启动子还可以被可操作地连接到被改进的目的基因序列上,该目的基因相对于启动子是外源(异源)的。所述的目的基因可以被改进来产生各种期望的特性。例如,目的基因可以被改进来增加必需氨基酸的含量,提高氨基酸序列的翻译,改变翻译后的修饰(如磷酸化位点),将翻译产物转运到细胞外,改善蛋白的稳定性,插入或删除细胞信号等。
此外,启动子和目的基因可以设计成下调特定基因。这一般是通过将启动子连接到目的基因序列上来实现,该序列以反义反向被引导。本领域的普通技术人员熟悉这种反义技术。任何核酸序列可以以这种方式被调节。
任何一种前述的启动子和目的基因序列可被包含在重组载体中。
所述的重组载体一般包括(从5’到3’方向):引导目的基因转录的启动子,和目的基因。如果需要,所述的重组载体还可以包括3’转录终止子,3’多聚核苷酸化信号,其它非翻译核酸序列,转运和靶向核酸序列、抗性选择标记、增强子或操作子。
用于制备重组载体的方法是本领域熟知的。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。
本领域的技术人员熟知的方法能用于构建含有本发明所述的启动子和/或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如二氢叶酸还原酶、新霉素抗性、潮霉素抗性以及绿色荧光蛋白(GFP)等。
重组载体中除了含有本发明的启动子,还可含有一种或多种其它启动子。所述的其它启动子例如是:种子特异性的、组织特异性的、组成型的或诱导型的。例如甘露氨酸合成酶的花椰菜花叶病毒19S和35S(CaMV19S CaMV35S)、增强的CaMV、烟草RB7等。
包含上述适当的启动子和目的基因的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。代表性例子有:大肠杆菌,链霉菌属、农杆菌;真菌细胞如酵母;植物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、水稻幼胚转化法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。
水稻胚乳细胞特异蛋白(OsRRM蛋白)及其编码基因
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的OsRRM蛋白或多肽”是指所述的OsRRM蛋白基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化OsRRM蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括OsRRM蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然OsRRM蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或融合蛋白)。根据本文的定义这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
在本发明中,术语“OsRRM蛋白”指具有OsRRM蛋白活性的SEQ ID NO:2序列的多肽。该术语还包括具有与OsRRM蛋白相同功能的、SEQ ID NO:2序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个,还更佳如1-8个、1-5个)氨基酸的缺失、插入和/或取代,以及在C术端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括OsRRM蛋白的活性片段和活性衍生物。
多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与OsRRM蛋白DNA杂交的DNA所编码的蛋白、以及利用抗OsRRM蛋白的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含OsRRM蛋白或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了OsRRM蛋白的可溶性片段。通常,该片段具有OsRRM蛋白序列的至少约20个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供OsRRM蛋白或多肽的类似物。这些类似物与天然OsRRM蛋白的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,“OsRRM蛋白保守性变异多肽”指与SEQ ID NO:2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个,最佳地至多3个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。例如,这些保守性变异多肽可根据表1进行氨基酸替换而产生。
表1
  氨基酸残基   代表性的取代   优选的取代
  Ala(A)   Val;Leu;Ile   Val
  Arg(R)   Lys;Gln;Asn   Lys
  Asn(N)   Gln;His;Lys;Arg   Gln
  Asp(D)   Glu   Glu
  Cys(C)   Ser   Ser
  Gln(Q)   Asn   Asn
  Glu(E)   Asp   Asp
  Gly(G)   Pro;Ala   Ala
  His(H)   Asn;Gln;Lys;Arg   Arg
  Ile(I)   Leu;Val;Met;Ala;Phe   Leu
  Leu(L)   Ile;Val;Met;Ala;Phe   Ile
  Lys(K)   Arg;Gln;Asn   Arg
  Met(M)   Leu;Phe;Ile   Leu
  Phe(F)   Leu;Val;Ile;Ala;Tyr   Leu
  Pro(P)   Ala   Ala
  Ser(S)   Thr   Thr
  Thr(T)   Ser   Ser
  Trp(W)   Tyr;Phe   Tyr
  Tyr(Y)   Trp;Phe;Thr;Ser   Phe
  Val(V)   Ile;Leu;Met;Phe;Ala   Leu
本发明还提供了编码本发明OsRRM蛋白或其保守性变异多肽的多核苷酸序列。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO:1所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:1所示的编码区序列有差别的核酸序列。
编码SEQ ID NO:2的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码OsRRM蛋白的多聚核苷酸。
应理解,虽然本发明的OsRRM基因优选得自水稻,但是得自其它植物的与水稻OsRRM基因高度同源(如具有80%以上,如85%、90%、95%、甚至98%序列相同性)的其它基因也在本发明考虑的范围之内。比对序列相同性的方法和工具也是本领域周知的,例如BLAST。
本发明的OsRRM蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或OsRRM蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的OsRRM蛋白。一般来说有以下步骤:
(1).用本发明的编码OsRRM蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,OsRRM蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含OsRRM蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的卡那霉素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。代表性例子有:大肠杆菌,链霉菌属、农杆菌;真菌细胞如酵母;植物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、水稻幼胚转化法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的OsRRM蛋白或多肽有多方面的用途。例如用于筛选促进或对抗OsRRM蛋白功能的抗体、多肽或其它配体。用表达的重组OsRRM蛋白筛选多肽库可用于寻找有价值的能抑制或刺激OsRRM蛋白功能的多肽分子,所获得的OsRRM蛋白的拮抗剂或激动剂也包括在本发明的范围内。
另一方面,本发明还包括对OsRRM DNA或是其片段编码的多肽具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于OsRRM基因产物或片段。较佳地,指那些能与OsRRM基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。较佳的,本发明中抗体是那些能够结合并抑制OsRRM功能的分子。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的OsRRM基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达OsRRM蛋白或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6:511,1976;Kohler等人,Eur.J.Immunol.6:292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.1981)。本发明的各类抗体可以利用OsRRM基因产物的片段或功能区,通过常规免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与OsRRM基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明中的抗体可用于抑制作物中OsRRM的功能。
利用本发明蛋白,通过各种常规筛选方法,可筛选出与OsRRM蛋白或基因发生相互作用的物质,如受体、抑制剂、激动剂或拮抗剂等。
本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析。用OsRRM蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测OsRRM蛋白的转录产物。
本发明还涉及一种使调节植物生长发育的方法,该方法包括调节所述植物中OsRRM基因或其同源基因的表达。
本发明的OsRRM基因还可作为基因转化植株后代的追踪标记和杂交制种过程中真杂种的指示标记。
在本发明的一个实例中,提供了一种分离的多核苷酸,它编码具有SEQ ID NO:2所示氨基酸序列的多肽。本发明的多核苷酸是利用启动子捕获方法从水稻中分离出的,其cDNA长为3455bp(SEQ ID NO:1),读码框为3018bp,编码一个由1005个氨基酸残基组成的蛋白(SEQ ID NO:2)。其基因组DNA序列见SEQ ID NO:3。
为了分离上述的基因,本发明人在水稻中建立了启动子捕获系统(PromoterTrap),获得在种子胚乳中有报告基因表达的阳性植株107#。分析证明,阳性植株107#中被标签的候选基因OsRRM确实是被捕获的基因,OsRRM所编码的蛋白具有Spen蛋白的结构特征;分析还表明,OsRRM只在水稻的胚乳组织中表达。OsRRM基因在转基因水稻植株中的异位表达,使植株出现矮小,生长迟缓甚至死亡等不正常现象,因此提示,OsRRM基因和水稻胚乳细胞的发育有关。
本发明的重要优点在于:
(1)首次发现一种可指导目的基因在植物的胚乳中特异性表达的启动子,所述的启动子对于定点地改良植物品质是特别有用的。
(2)提供一种可调节植物生长发育的的新基因,该基因的在植物中的异位表达可改变植物的表型,因此其在调节植物生长发育中具有重要的作用。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室指南(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照以下文献中公布的方法:Carl W.Dieffenbach和Gabriela S.Devksler eds.PCR Primer:A Laboratory Manual.ColdSpring Harbor Laboratory Press,1995。或按照制造厂商所建议的条件。
实施例1捕获方法获得阳性植株107#
对载体pCAMBIA1300(购自CAMBIA公司)进行改造,在其多克隆位点插入GUS基因的编码区和nos终止子,构建了基于T-DNA和无启动子GUS基因(GUS基因和nos终止子获自pBI101质粒(GenBank登录号:U12639),采用EcoRI和HindIII酶对该质粒进行酶切,从而获得GUS基因和nos终止子)[T-DNA(GUS)]结构的捕获质粒p13GUS,其部分结构见图1A。转化水稻中花11后获得许多GUS基因能在水稻不同组织中表达的阳性转基因植株。
对阳性植株之一107#株系的T0代和后代植株进行GUS组织化学染色,发现只能在它们的胚乳组织中观察到蓝色,见图2A-B,其中I所示为胚乳组织(呈现蓝色)。
采用常规的方法,对107#植株总DNA进行Southern印迹分析,结果见图3A,其中,泳道H表示107#植株总DNA用HindIII酶切后的印迹,在分子量标准5.1kb与21kb之间呈现1条条带,泳道E表示107#植株总DNA用EcoRI酶切后的印迹,在分子量标准5.1kb与21kb之间呈现1条条带,泳道B表示107#植株总DNA用BamHI酶切后的印迹,在分子量标准5.1kb与21kb之间呈现1条条带。因此可见,T-DNA以单拷贝插入在107#株系的染色体上。
对107#株系T2和T3代植株进行潮霉素抗性纯合株的筛选,抗性纯合株的纯合性经GUS染色证实,获得了T-DNA插入纯合的107-2和107-14植株。
实施例2107#植株中的候选基因OsRRM
从107#株系的T-DNA插入纯合株107-2中提取总DNA,用Inverse PCR方法分离T-DNA的左右旁邻序列。测序和BLAST结果表明:右旁邻序列800bp与水稻9号染色体上BAC克隆OJ1381_H04中的序列同源性达到99%,左旁邻序列140bp与BAC克隆OJ1381_H04中的序列同源性达到100%。由序列比较结果可以推知T-DNA以反方向插在BAC克隆的98448位和98478位碱基之间。由于T-DNA的插入,水稻染色体在插入位点发生了一段29bp序列的缺失,见图1A-B。
BLAST结果还显示T-DNA的左旁邻序列和cDNA克隆J023129A05(http://cdna01.dna.affrc.go.jp/cDNA)的5’末端序列完全同源,序列分析表明107#植株中T-DNA正插入在这一cDNA的5’非翻译区中。J023129A05 cDNA序列与基因组相应序列同源性达到100%,它编码一个类似含有RNA结合功能域的蛋白,本发明人将这一被捕获的候选基因称为OsRRM。
OsRRM cDNA长为3455bp(SEQ ID NO:1),被4个内含子分割成5个外显子,有一个3018bp的读码框,编码一个由1005个氨基酸残基组成的蛋白(SEQ ID NO:2)。其基因组DNA序列见SEQ ID NO:3,其启动子的DNA序列见SEQ ID NO:4。
蛋白功能域分析显示,在OsRRM的N-末端有2个与RNA特异结合的RRM功能域,RRM1位于51-116aa,RRM2位于183-238aa。与其它RRM蛋白相似,OsRRM蛋白的两个RRM功能域相互间有一定的同源性,它们的同源性达到39%。在它的C-端有类似亮氨酸拉链的结构,这种结构在蛋白-蛋白相互作用或形成蛋白二聚体中起作用。在OsRRM的中间部位(498-594aa)有一个结构保守的SPOC结构域,在动物中将含有SPOC结构域的一类RRM蛋白称为Spen蛋白。
分别用OsRRM中两个RRM功能域和SPOC结构域的氨基酸序列在数据库中搜索比较,如图4中所示,OsRRM与人或鼠Tial的RRM功能域的核心区同源性较好,有37%相同,70%相似。
此外,OsRRM的第1个RRM功能域与一些Spen家族成员如HuRBP15的第1个RRM功能域有较好的相似性(53%)(图4A);而OsRRM的第2个RRM功能域与一些Spen家族成员的第3个RRM功能域较为相似(图4B)。
OsRRM的中间部位的SPOC结构域与Spen家族成员中的SPOC结构域在三维空间构型上有很好的相似性(图4C),可以认为水稻中的OsRRM是Spen基因家族的成员之一。结果还显示,其除了与动物中的一些Spen基因相近之外,还与拟南芥的FPA很相似(图4)。
实施例3OsRRM在水稻中是单拷贝基因
为了解OsRRM在水稻中的拷贝数,从水稻中花11的叶片中抽提出总DNA,用限制性内切酶EcoRI和BamHI进行消化,以OsRRM基因3’端一段约1.9kb的DNA序列(见图1C,probeB)作为探针(探针长度1.9kb,采用OsRRM基因的第+5369-+7273位(基因的翻译起始密码子AT6中的A作为+1位))作为探针)进行Southern杂交。
Southern杂交结果显示,以Probe B作为探针。结果发现,采用EcoRI(E)和BamHI(B)酶切均只有一条杂交带出现(图3B),表明OsRRM在水稻基因组中是一个单拷贝基因。
实施例4OsRRM启动子指导GUS在植物胚乳组织中表达
107#植株中GUS只在水稻胚乳中表达,为了确认OsRRM候选基因是被T-DNA(GUS)捕获结构在107#植株中所标签的基因,试验了OsRRM启动子指导下的GUS在转基因水稻中是否和107#植株具有相同的GUS表达模式。具体如下:
将OsRRM候选基因ATG起始密码子上游2kb的序列和GUS基因融合的基因(见图2D)克隆入pCAMBIA1301质粒(购自CAMBIA),获得重组质粒pRMP。通过常规的根癌农杆菌介导的方法转化水稻品种中花11,对T0代转基因植株的根、茎、叶、花和种子等器官进行了组织化学染色检测。
检测显示:获得的26个植株中,有13个植株在胚乳中检测到GUS的染色,代表性的染色结果见图2C。而在这26个转基因植株的其它被检测部位均没有观察到GUS的染色,这与107#植株中GUS的表达部位是一致的。该结果证明,OsRRM启动子能够指导基因特异性地在水稻胚乳中进行表达,且使该基因在其它组织或器官中不表达,比如采用该启动子使某些基因在水稻胚乳中特异表达。上述结果说明,OsRRM启动子对于定点地改良水稻的品质是特别有用的。
试验结果还表明,候选基因OsRRM是被T-DNA(GUS)结构所捕获的基因。
此外,本发明人采用与前述相同的方法,建立了含有OsRRM候选基因ATG起始密码子上游约2kb的序列和GUS基因融合的基因的重组质粒,转化小麦,获得转基因小麦植株。结果发现,OsRRM启动子可指导GUS基因特异性地在小麦胚乳中进行表达,其它组织或器官中不表达。
实施例5OsRRM基因的表达特征
107#植株的组织化学染色检测表明,GUS只在水稻胚乳中被检测到。为了分析OsRRM基因编码的蛋白在水稻不同组织中存在的情况,用大肠杆菌中表达OsRRM基因的C端第567位至第1005位氨基酸的肽段作为抗原免疫家兔,获得OsRRM的抗体;从水稻中花11的根、茎、叶、花、胚和胚乳各个组织中抽提蛋白,经聚丙烯酰胺凝胶电泳分离后转移到膜上,Western Blot分析显示只能在水稻中花11的胚乳样品中检测到约110KD左右OsRRM蛋白的杂交条带,见图5。实验结果提示OsRRM基因是在水稻胚乳中特异表达的。
进一步研究OsRRM基因在种子发育过程中的表达特征,对107#植株授粉后不同成熟时期的种子分别进行GUS组织化学染色,结果在授粉后7天的胚乳中才开始观察到GUS染色,以后逐渐增强,到后期染色减弱且多集中在胚乳外缘,在种子发育的各个时期,胚的部分都没有观察到GUS染色。
另外,本发明人还采集了107#植株的花、开花后5天、10天、15天、20天、25天和30天的种子,进行GUS酶活性测定。结果表明,107#植株的花和开花后5天的样品中没有GUS酶活性,开花后20天的种子中GUS酶活性是最强的,见图6。
实施例6OsRRM蛋白定位在细胞核中
OsRRM编码一个RNA结合蛋白,了解编码蛋白在细胞中的位置,有利于分析OsRRM基因的功能。为此,将OsRRM基因编码区插入pA7-GFP载体(购自德国波茨坦大学,K Czempinski博士)的多克隆位点中,使它与绿色荧光蛋白GFP的编码区融合,构建成质粒pA7-OsRRM-GFP,通过基因枪将构建好的质粒导入到洋葱表皮细胞中。荧光显微镜观察结果表明,细胞内导入质粒pA7-GFP时,GFP蛋白弥散在细胞质中,见图7A-C,而导入质粒pA7-OsRRM-GFP时,OsRRM::GFP融合蛋白的荧光聚集在细胞核中,见图7D-G。
为了证实OsRRM蛋白在水稻中是否也存在于细胞核中,将OsRRM基因编码区与GFP编码区融合,并插入ubi启动子下游,克隆入pCAMBIA1300质粒的多克隆位点中,构建成质粒p13U-OsRRM-GFP,通过农杆菌介导的方法导入水稻中花11中,以转基因水稻植株的根作为观察材料。荧光显微镜观察结果表明,在根尖细胞内OsRRM::GFP融合蛋白聚集在细胞核中(图7H-K),这与洋葱细胞中的定位试验结果一致。
洋葱表皮细胞体外试验和水稻体内试验的结果都表明OsRRM蛋白存在于细胞核中。
实施例7OsRRM的超表达对水稻生长的影响
为了研究OsRRM的功能,通过改造pCAMBIA1300质粒,将2个CaMV 35S启动子克隆入该质粒的多克隆位点内,获得pHB载体,将OsRRM基因的开放阅读框序列克隆入该载体的多克隆位点,构建了双CaMV35S(35S)启动子控制下的OsRRM过量表达质粒pHB-OsRRM,其部分结构见图8A,将其通过根癌农杆菌介导的方法转化水稻中花11,获得了14株独立转基因植株,对它们T1代植株的生长进行观察,其中一些出现了矮小、晚开花、穗小结实率少的表型,见图8B,8C。
为了解这些表型异常的植株是否由于OsRRM过量表达所引起,本发明人提取了表型异常的转基因植株line9、line7和表型正常的转基因植株line6的叶片总蛋白,进行Western Blot检测。结果,在异常表型的植株中都检测到有OsRRM蛋白存在(图8D,泳道9,7);而无异常表型的植株叶片中检测不到OsRRM蛋白表达(图8D,泳道6),与转基因亲本中花11的检测结果相同。
由此可知,转基因植株中OsRRM基因的异位表达引起了转基因植株的异常表型。
实施例8107#植株中OsRRM基因仍有表达
采用常规方法从107#植株的种子中抽提RNA,进行OsRRM基因表达的RT-PCR分析。结果显示有预期的扩增条带存在,和转基因亲本中花11植株的比较显示107#植株中OsRRM的表达量比中花11有所减少(图9A)。
Western Blot分析显示,107#植株种子中能检测到OsRRM蛋白,但比中花11种子中也有所减少,见图9B。这表明107#植株中T-DNA虽然插在OsRRM的5’端,但只是干扰了基因的表达,并没有使基因完全沉默。
实施例9OsRRM蛋白的变异形式
采用常规的定点突变方法,将OsRRM蛋白(SEQ ID NO:2)第999位的Ser转变为Thr(即将TCT→ACT),形成OsRRM蛋白的变异形式I;
采用常规的基因合成方法,在SEQ ID NO:1的5’端添加对应于6组氨酸(6His)的编码序列,然后用常规的DNA重组方法表达出N端携带6组氨酸标签的OsRRM蛋白;形成OsRRM蛋白的变异形式II。
采用与实施例7类似的方法,检测上述两种OsRRM蛋白的变异形式的超表达对水稻生长的影响。结果发现,上述两种OsRRM蛋白变异形式的异位表达同样能够引起转基因植株的异常表型。
实施例9OsRRM启动子的变异形式
采用常规的基因合成方法合成OsRRM启动子的变异形式I,该变异形式将OsRRM启动子(SEQ ID NO:4)序列的第3位的G→C;
采用常规的基因合成方法合成OsRRM启动子的变异形式II,该变异形式将OsRRM启动子(SEQ ID NO:4)序列的5’端加上2个核苷酸GT。
采用与实施例4类似的方法,检测由OsRRM启动子的变异形式指导的GUS在水稻胚乳组织中的表达,结果发现,在获得的转基因植株中,仅在胚乳中检测到GUS的染色,而在其它被检测部位(包括根、叶、茎)均没有观察到GUS的染色。因此说明,上述的OsRRM启动子的变异形式也能够指导基因特异性地在水稻胚乳中进行表达。
讨论
启动子捕获是不依赖生物体表型发生突变,而仅仅依靠报告基因的表达、以及表达的模式来鉴别基因的一种方法。本发明人用启动子捕获方法获得报告基因GUS仅在胚乳中表达的阳性水稻植株107#。通过分离旁邻序列,鉴别出阳性植株107#中T-DNA插入在OsRRM基因的5’非翻译区中。对OsRRM基因的启动子分析和OsRRM蛋白的Western blot分析都证明,OsRRM基因是在水稻胚乳组织中特异表达的,这和107#阳性植株中GUS报告基因的表达特征一致,从而证实OsRRM就是在阳性植株107#中被捕获的基因。
OsRRM编码蛋白的N末端有两个RRM功能域。与其它RRM蛋白相似,OsRRM蛋白的两个RRM功能域相互间有一定的同源性,它们的同源性达到39%。RRM功能域能直接和RNA相互作用,它是由疏水氨基酸残基按一定方式组成,它的长度不固定,序列也是非保守的。RRM功能域序列和长度的可变性使得不同的RRM蛋白可以特异地和不同的RNA结合。含有RRM功能域的蛋白参与了细胞核中RNA的转录合成和RNA的转录后加工过程,以及保持mRNA的稳定性和降解mRNA等,并在蛋白翻译中起调节作用。
细胞定位试验显示OsRRM蛋白存在于细胞核中,推测它可能和RNA的转录或加工有关。OsRRM与人或鼠Tial的RRM功能域的核心区同源性最好,Tial是细胞程序性死亡的效应子,并在MYPT1转录本的替换剪接反应中调节发育转换。RNA转录本在成熟过程中,内含子的替换剪接在基因表达的调控中起重要作用,在拟南芥花发育中,FLC、FCA和FPA转录本的替换剪接调控着基因的表达,在决定拟南芥植株由营养生长向生殖生长的自律性调节途径中起了决定作用。而FCA和FPA都是编码与RNA结合的蛋白,两者不仅通过替换剪接调节自身的表达,也控制着开花抑制基因FLC转录本的积累。
Spen(Split Ends)基因最初是在果蝇胚的腹节轴突发生的隐性致死突变中被识别的,随后在小鼠、人和线虫中都找到具有类似蛋白结构的基因。Spen蛋白的特征是在它们的N端有RNA结合功能域(RNA recognition motif,RRM),在C端有一个十分保守的SPOC结构域(Spen paralog and ortholog C-termihal domain)。Spen蛋白的分子量变化很大,在90-600kD之间,其中SPOC结构域大约有165个氨基酸残基,保守结构域之间的氨基酸序列同源性很低。果蝇中的研究显示Spen突变影响了一些信号途径和转录因子之间的复杂相互作用,与细胞发育特化有关。Marikoi和John(2003)推测SPOC结构域的功能是在转录抑制复合物中介导蛋白-蛋白相互作用。Edwige等(2005)认为Spen蛋白的功能可能与mRNA的输出和剪接加工有关。Luis等(2004)通过生物信息学方法,在原虫和植物中都找到编码类似Spen蛋白的基因,并推测Spen家属调节细胞程序性死亡,并和肿瘤发生有关,这为SPOC结构域的可能功能提供了又一新的线索。Schomburg等(2001)克隆了拟南芥中控制开花时间的FPA基因,是至今在植物中唯一被研究过的具有SPOC结构域的基因,Quesada等(2005)推测在拟南芥花发育的自律性途径中,FPA控制着开花抑制基因FLC转录本的积累,从而影响开花时间。
果蝇的Split ends和人或鼠的SHARP、RBP15都是Spen家族成员,它们的N末端有三个RRM功能域。OsRRM的第1个RRM功能域与这些Spen家族成员的第1个RRM功能域有较好的相似性(53%),而OsRRM的第2个RRM功能域与这些Spen家族成员的第3个RRM功能域较为相似。此外,OsRRM的中间部位一段序列的结构与这些Spen家族成员C-末端的SPOC结构域有很好的相似性,可以认为OsRRM是水稻中含有SPOC结构域的一个Spen基因。本发明的序列比较显示,在自律性途径中启动拟南芥花发育有关的FPA基因(Schomburg等2001)也编码具有SPOC结构域的RRM蛋白,OsRRM和FPA的RRM和SPOC结构域有很好的相似性,因此也可以认为FPA基因是植物中已报道的另一个Spen基因。动物中已有的研究显示含有SPOC结构域的Spen蛋白调节一些信号途径中基因的转录,与细胞分化发育的前程有密切关系。
水稻胚乳组织由一群特化的细胞组成,在种子形成时储存碳水化合物;在种子发芽时为胚芽提供营养。本发明的研究表明,水稻中类似Spen的OsRRM基因只特异地在胚乳组织中表达,当转基因水稻中导入组成型启动子指导下的OsRRM基因,OsRRM基因在水稻的各个组织中过量表达时,使转基因植株出现异常表型,植株变的矮小、晚开花、穗小结实率少等。这些现象提示,OsRRM的异位表达会影响它本不存在的那些细胞的生长发育和/或细胞功能。这和动物中Spen蛋白调节一些信号途经中基因的转录,与细胞发育的前程有密切关系的作用是相似的。由此可知,OsRRM基因和水稻胚乳细胞的发育有关。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>中国科学院上海生命科学研究院
<120>一种水稻胚乳细胞特异基因及其应用
<130>067626
<160>4
<170>PatentIn version 3.3
<210>1
<211>3455
<212>DNA
<213>稻属(Oryza sativa L.)
<220>
<221>ORF
<222>(104)..(3121)
<400>1
ggagagagag agagcaccca tccatctccc cggaggcgaa accctaaccc acccaaccca    60
tcgccgccgg cgaaaaccct aatccatccg ccgccgaacc gaa atg ggg aga cct     115
                                            Met Gly Arg Pro
                                            1
cga ggc cgc ggc gga gga gga gga gga ggg agg ggg agg ttc ggc ggc     163
Arg Gly Arg Gly Gly Gly Gly Gly Gly Gly Arg Gly Arg Phe Gly Gly
5                   10                  15                  20
ggc ggg ggg tcc cgc ttc tcc gcc gcc cgc gat gac ccg ccg ccg cgg     211
Gly Gly Gly Ser Arg Phe Ser Ala Ala Arg Asp Asp Pro Pro Pro Arg
                25                  30                  35
cgc tcc tcc tcc ggg tgg ggg gtg gca ccg ccg tcg cgg cac ctg tgg     259
Arg Ser Ser Ser Gly Trp Gly Val Ala Pro Pro Ser Arg His Leu Trp
            40                  45                  50
gtg ggc agc ctc tcc ccg ggc gtc gcc gcg gcc gac ctc tcg gag ctc     307
Val Gly Ser Leu Ser Pro Gly Val Ala Ala Ala Asp Leu Ser Glu Leu
        55                  60                  65
ttc ctc cgg tgc ggc gac gtc gag ggc atc tcc cgt gac ccc ggc cgg     355
Phe Leu Arg Cys Gly Asp Val Glu Gly Ile Ser Arg Asp Pro Gly Arg
    70                  75                  80
agc ttc gcg ttc gtg acg ttc gcg cgg gag gag gac gcc gtg gcg gcg     403
Ser Phe Ala Phe Val Thr Phe Ala Arg Glu Glu Asp Ala Val Ala Ala
85                  90                  95                  100
gtg cgg gag ctg cag ggg atc cac ctc cgc ggg gcg ccc att agg atc     451
Val Arg Glu Leu Gln Gly Ile His Leu Arg Gly Ala Pro Ile Arg Ile
                105                 110                 115
gag ttt tcc aag ggg gat aaa gat tca agt agc tct atg gat gac aga     499
Glu Phe Ser Lys Gly Asp Lys Asp Ser Ser Ser Ser Met Asp Asp Arg
            120                 125                 130
tac tca caa cat gct gat caa aga cgt ttt act gaa cga gga agg aat     547
Tyr Ser Gln His Ala Asp Gln Arg Arg Phe Thr Glu Arg Gly Arg Asn
        135                 140                 145
cag caa tca agt cct gaa aaa tca act gat aaa tcc aaa aga agc agg     595
Gln Gln Ser Ser Pro Glu Lys Ser Thr Asp Lys Ser Lys Arg Ser Arg
    150                 155                 160
cca gca gaa cct agt gaa gta tta tgg ata ggt ttt cct gtt ggt ctg     643
Pro Ala Glu Pro Ser Glu Val Leu Trp Ile Gly Phe Pro Val Gly Leu
165                 170                 175                 180
aag gta gat gag gca act ctc tgg gaa gcc ttt tca cct ttt ggt gag     691
Lys Val Asp Glu Ala Thr Leu Trp Glu Ala Phe Ser Pro Phe Gly Glu
                185                 190                 195
gtt gtc aag ata act aca ttc cca ggg cgt act tat gca ttt gtc cag     739
Val Val Lys Ile Thr Thr Phe Pro Gly Arg Thr Tyr Ala Phe Val Gln
            200                 205                 210
tac act act att gca gcg gca tgc agg gcg aag gaa aca ctg cag gga     787
Tyr Thr Thr Ile Ala Ala Ala Cys Arg Ala Lys Glu Thr Leu Gln Gly
        215                 220                 225
aat att ttc aat aac cct cga gtt agc att tgc ttt tct cgg agt gac     835
Asn Ile Phe Asn Asn Pro Arg Val Ser Ile Cys Phe Ser Arg Ser Asp
    230                 235                 240
agt gtt tca gca gaa ttt gga aaa ggt tcc tta gat gcc cca tat tcc     883
Ser Val Ser Ala Glu Phe Gly Lys Gly Ser Leu Asp Ala Pro Tyr Ser
245                 250                 255                 260
ccc cat tta aac tct agt gtt aga cct ata ttc agg gag caa gat ttt     931
Pro His Leu Asn Ser Ser Val Arg Pro Ile Phe Arg Glu Gln Asp Phe
                265                 270                 275
gaa gat ttt cct agg gct agg cct ttt gat agt cct cca aga gat atg     979
Glu Asp Phe Pro Arg Ala Arg Pro Phe Asp Ser Pro Pro Arg Asp Met
            280                 285                 290
tac atg cca tct cca cat tat ggc cct aag aga ctt tct aga gat cat    1027
Tyr Met Pro Ser Pro His Tyr Gly Pro Lys Arg Leu Ser Arg Asp His
        295                 300                 305
gat gat gtg ggt ttc agc agg gat aat tat ttg cga tat gga cct gga    1075
Asp Asp Val Gly Phe Ser Arg Asp Asn Tyr Leu Arg Tyr Gly Pro Gly
    310                 315                 320
gta gag cct gat cct aga tct aat ttt gaa cct ttt agg ata caa gg     1123
Val Glu Pro Asp Pro Arg Ser Asn Phe Glu Pro Phe Arg Ile Gln Gly
325                 330                 335                 340
ctc ggt cca gaa aga agg atg tct gag gac cca tat gaa cag cat agg    1171
Leu Gly Pro Glu Arg Arg Met Ser Glu Asp Pro Tyr Glu Gln His Arg
                345                 350                 355
cgt agc cct gct ggt gat gca cca tgg cac aac att cca ttc gag cga    1219
Arg Ser Pro Ala Gly Asp Ala Pro Trp His Asn Ile Pro Phe Glu Arg
            360                 365                 370
tct cag gga gcc tta cca tta gag gat tct cgg tat gct agg gaa gat    1267
Ser Gln Gly Ala Leu Pro Leu Glu Asp Ser Arg Tyr Ala Arg Glu Asp
        375                 380                 385
cca tac cca ttt tca aag aag ttg agg act ggt gaa gca cat gac tct    1315
Pro Tyr Pro Phe Ser Lys Lys Leu Arg Thr Gly Glu Ala His Asp Ser
    390                 395                 400
gaa ctt cct gaa tac cct ttc tct gaa ttt gat cga ggg aag gtt ggc    1363
Glu Leu Pro Glu Tyr Pro Phe Ser Glu Phe Asp Arg Gly Lys Val Gly
405                 410                 415                 420
tct gcc tac cca agg agg ccc ttc tat ggt gtg cca gat gat gac ata    1411
Ser Ala Tyr Pro Arg Arg Pro Phe Tyr Gly Val Pro Asp Asp Asp Ile
                425                 430                 435
cac ccc aga ggc tat caa ctt gct cct atg cat ggt aga aat cat gtt    1459
His Pro Arg Gly Tyr Gln Leu Ala Pro Met His Gly Arg Asn His Val
            440                 445                 450
gat cct tta agg aat cca act cca ctt gta gat agg cat ata cca ggg    1507
Asp Pro Leu Arg Asn Pro Thr Pro Leu Val Asp Arg His Ile Pro Gly
        455                 460                 465
cat gca cag gac agc ttt tct agg cat gta gaa gtg gaa aga tca act    1555
His Ala Gln Asp Ser Phe Ser Arg His Val Glu Val Glu Arg Ser rhr
    470                 475                 480
cct gaa tac cat gaa ccc ctt ctc aag gaa gaa tgg aaa tgg gat ggt    1603
Pro Glu Tyr His Glu Pro Leu Leu Lys Glu Glu Trp Lys Trp Asp Gly
485                 490                 495                 500
aca ata gca aag gga ggc aca cca att tgc cga gcg cga tgc ttc cct    1651
Thr Ile Ala Lys Gly Gly Thr Pro Ile Cys Arg Ala Arg Cys Phe Pro
                505                 510                 515
gtt ggg aag gtt ctt aac ttc atg ctg ccc gaa ttt ttg gat tgc act     1699
Val Gly Lys Val Leu Asn Phe Met Leu Pro Glu Phe Leu Asp Cys Thr
            520                 525                 530
gct agg aca agc ctg gag atg ctc tct aag cac tat tac caa gct gcc     1747
Ala Arg Thr Ser Leu Glu Met Leu Ser Lys His Tyr Tyr Gln Ala Ala
        535                 540                 545
agc agc tgg gtg gtg ttt ttt gtt cca gaa aat gat gct gac atg gca     1795
Ser Ser Trp Val Val Phe Phe Val Pro Glu Asn Asp Ala Asp Met Ala
    550                 555                 560
gcc tat aat gaa ttc atg aat tac ctt ggt gat aag cag cgt gca gca     1843
Ala Tyr Asn Glu Phe Met Asn Tyr Leu Gly Asp Lys Gln Arg Ala Ala
565                 570                 575                 580
gtt tgt aaa ctt gga gaa agg agc agc tta ttt ctt gtt cca ccc tca     1891
Val Cys Lys Leu Gly Glu Arg Ser Ser Leu Phe Leu Val Pro Pro Ser
                585                 590                 595
gac ttc tct gaa caa gta ctg agg gtt cca ggt aaa gtc agc ata tct     1939
Asp Phe Ser Glu Gln Val Leu Arg Val Pro Gly Lys Val Ser Ile Ser
            600                 605                 610
gga gtc att ctg aag ttt gag cag tca gat cca gaa gtt tcc tcg cca     1987
Gly Val Ile Leu Lys Phe Glu Gln Ser Asp Pro Glu Val Ser Ser Pro
        615                 620                 625
act cgc aaa cca gaa aca ttt gtg agt cat ttg aac cat gat gtt cgt     2035
Thr Arg Lys Pro Glu Thr Phe Val Ser His Leu Asn His Asp Val Arg
    630                 635                 640
gct cat gag gat cta gat gca ttg aga aga atc aac cca cca gat atc     2083
Ala His Glu Asp Leu Asp Ala Leu Arg Arg Ile Asn Pro Pro Asp Ile
645                 650                 655                 660
agg cca ctt cct cag ggt tca gat tat ctc ggg ttg tcg cct gga agc     2131
Arg Pro Leu Pro Gln Gly Ser Asp Tyr Leu Gly Leu Ser Pro Gly Ser
                665                 670                 675
tat aat cca gca agt gca cat ttg gtt ccg cct tac aag ttt gga aat     2179
Tyr Asn Pro Ala Ser Ala His Leu Val Pro Pro Tyr Lys Phe Gly Asn
            680                 685                 690
gct cct tca tat cta gaa tct gaa tta gct cat caa aag cat cca cct     2227
Ala Pro Ser Tyr Leu Glu Ser Glu Leu Ala His Gln Lys His Pro Pro
        695                 700                 705
gac tcc cac agg gag ata gca cat gac aag cag cag caa cac cca gat     2275
Asp Ser His Arg Glu Ile Ala His Asp Lys Gln Gln Gln His Pro Asp
    710                 715                 720
gta ttg ccc tca aga tgg tca gat aac att tac aat cca agt cca ggt     2323
Val Leu Pro Ser Arg Trp Ser Asp Asn Ile Tyr Asn Pro Ser Pro Gly
725                 730                 735                 740
tct gga aat ttg aat tat ttg gct gag agt gcg atc cca cat aca tca     2371
Ser Gly Asn Leu Asn Tyr Leu Ala Glu Ser Ala Ile Pro His Thr Ser
                745                 750                 755
act gat agg aca cca gag gca tac tca ttt gct cct caa gga gta cca     2419
Thr Asp Arg Thr Pro Glu Ala Tyr Ser Phe Ala Pro Gln Gly Val Pro
            760                 765                 770
aaa gtg agt aca tca ggg tat gca cca gtt gca gat gag gca tca aac     2467
Lys Val Ser Thr Ser Gly Tyr Ala Pro Val Ala Asp Glu Ala Ser Asn
        775                 780                 785
atg tcc tac cct ccc atg caa cct gca tca cag cag gta gtt aga cct     2515
Met Ser Tyr Pro Pro Met Gln Pro Ala Ser Gln Gln Val Val Arg Pro
    790                 795                 800
caa caa cct cca tct ctc cca tta tcg ctt cca cca gag caa ctt gca     2563
Gln Gln Pro Pro Ser Leu Pro Leu Ser Leu Pro Pro Glu Gln Leu Ala
805                 810                 815                 820
caa ttg gcc act ctt ctt gca caa caa aac caa cca gga aaa gag cct     2611
Gln Leu Ala Thr Leu Leu Ala Gln Gln Asn Gln Pro Gly Lys Glu Pro
                825                 830                 835
gtg gac agc tta aac aaa gaa tca gga ttc ata cgg aat cca cat gga     2659
Val Asp Ser Leu Asn Lys Glu Ser Gly Phe Ile Arg Asn Pro His Gly
            840                 845                 850
cat tct tca atg atg cca cac agc tca ggt tct atc cct gtc caa aac     2707
His Ser Ser Met Met Pro His Ser Ser Gly Ser Ile Pro Val Gln Asn
        855                 860                 865
tca ttg cca cct gct ccg cca tct gca tca cag tta cag gtt cat gcg     2755
Ser Leu Pro Pro Ala Pro Pro Ser Ala Ser Gln Leu Gln Val His Ala
    870                 875                 880
cca cca gtt caa ggt tca gtg cca cca aat cca tcc att atg cat aca     2803
Pro Pro Val Gln Gly Ser Val Pro Pro Asn Pro Ser Ile Met His Thr
885                 890                 895                 900
ccg aat gct cct atg cct tct cac aac act ttg cct tta ccc cct atg     2851
Pro Asn Ala Pro Met Pro Ser His Asn Thr Leu Pro Leu Pro Pro Met
                905                 910                 915
cat cct tcg gga aat cca gct cat tct tcc atg cct ttg aga tcg ttc     2899
His Pro Ser Gly Asn Pro Ala His Ser Ser Met Pro Leu Arg Ser Phe
            920                 925                 930
gtc cct cct ctt cct gaa ggc cct cca ccc ctt agg cag cac aca tca     2947
Val Pro Pro Leu Pro Glu Gly Pro Pro Pro Leu Arg Gln His Thr Ser
        935                 940                 945
agt gct cta caa gcg caa cct gca ctt ccc tct gga cca cag act agc     2995
Ser Ala Leu Gln Ala Gln Pro Ala Leu Pro Ser Gly Pro Gln Thr Ser
    950                 955                 960
cag caa ccg tct gct cag gaa gac cat cac gga gac cct caa aag cgc     3043
Gln Gln Pro Ser Ala Gln Glu Asp His His Gly Asp Pro Gln Lys Arg
965                 970                 975                 980
ctt caa gca aca ttg caa ttg gca gca acc cta ctt cag cag ata cag     3091
Leu Gln Ala Thr Leu Gln Leu Ala Ala Thr Leu Leu Gln Gln Ile Gln
                985                 990                 995
caa caa tct aaa cct ggt ggc cag aag tag atgcgaggtt aaggaaattt       3141
Gln Gln Ser Lys Pro Gly Gly Gln Lys
            1000                1005
gcagcctgca aggatcatat ggtgatattt tctccttatt actgaagagc ctgagagtct   3201
gaaactgctg gtgggcaccc atacctatac cggatgtttt gttaacatag gttctgctat   3261
gaattagcat tgcagtttaa ttttgaaagc ttactcctag gtggcaacca cctccgttgt   3321
cttgtctgta taagattgca ccgttcatct tttctctctg tttttgtgtt aatcaatgca   3381
tagacccatg aataccactt ccctttttgc attcatacat catgcattcg tctcatcgat   3441
gtgtcgtctc tccg                                                     3455
<210>2
<211>1005
<212>PRT
<213>稻属(Oryza sativa L.)
<400>2
Met Gly Arg Pro Arg Gly Arg Gly Gly Gly Gly Gly Gly Gly Arg Gly
1               5                   10                  15
Arg Phe Gly Gly Gly Gly Gly Ser Arg Phe Ser Ala Ala Arg Asp Asp
            20                  25                  30
Pro Pro Pro Arg Arg Ser Ser Ser Gly Trp Gly Val Ala Pro Pro Ser
        35                  40                  45
Arg His Leu Trp Val Gly Ser Leu Ser Pro Gly Val Ala Ala Ala Asp
    50                  55                  60
Leu Ser Glu Leu Phe Leu Arg Cys Gly Asp Val Glu Gly Ile Ser Arg
65                  70                  75                  80
Asp Pro Gly Arg Ser Phe Ala Phe Val Thr Phe Ala Arg Glu Glu Asp
                85                  90                  95
Ala Val Ala Ala Val Arg Glu Leu Gln Gly Ile His Leu Arg Gly Ala
            100                 105                 110
Pro Ile Arg Ile Glu Phe Ser Lys Gly Asp Lys Asp Ser Ser Ser Ser
        115                 120                 125
Met Asp Asp Arg Tyr Ser Gln His Ala Asp Gln Arg Arg Phe Thr Glu
    130                 135                 140
Arg Gly Arg Asn Gln Gln Ser Ser Pro Glu Lys Ser Thr Asp Lys Ser
145                 150                 155                 160
Lys Arg Ser Arg Pro Ala Glu Pro Ser Glu Val Leu Trp Ile Gly Phe
                165                 170                 175
Pro Val Gly Leu Lys Val Asp Glu Ala Thr Leu Trp Glu Ala Phe Ser
            180                 185                 190
Pro Phe Gly Glu Val Val Lys Ile Thr Thr Phe Pro Gly Arg Thr Tyr
        195                 200                 205
Ala Phe Val Gln Tyr Thr Thr Ile Ala Ala Ala Cys Arg Ala Lys Glu
    210                 215                 220
Thr Leu Gln Gly Asn Ile Phe Asn Asn Pro Arg Val Ser Ile Cys Phe
225                 230                 235                 240
Ser Arg Ser Asp Ser Val Ser Ala Glu Phe Gly Lys Gly Ser Leu Asp
                245                 250                 255
Ala Pro Tyr Ser Pro His Leu Asn Ser Ser Val Arg Pro Ile Phe Arg
            260                 265                 270
Glu Gln Asp Phe Glu Asp Phe Pro Arg Ala Arg Pro Phe Asp Ser Pro
        275                 280                 285
Pro Arg Asp Met Tyr Met Pro Ser Pro His Tyr Gly Pro Lys Arg Leu
    290                 295                 300
Ser Arg Asp His Asp Asp Val Gly Phe Ser Arg Asp Asn Tyr Leu Arg
305                 310                 315                 320
Tyr Gly Pro Gly Val Glu Pro Asp Pro Arg Ser Asn Phe Glu Pro Phe
                325                 330                 335
Arg Ile Gln Gly Leu Gly Pro Glu Arg Arg Met Ser Glu Asp Pro Tyr
            340                 345                 350
Glu Gln His Arg Arg Ser Pro Ala Gly Asp Ala Pro Trp His Asn Ile
        355                 360                 365
Pro Phe Glu Arg Ser Gln Gly Ala Leu Pro Leu Glu Asp Ser Arg Tyr
    370                 375                 380
Ala Arg Glu Asp Pro Tyr Pro Phe Ser Lys Lys Leu Arg Thr Gly Glu
385                 390                 395                 400
Ala His Asp Ser Glu Leu Pro Glu Tyr Pro Phe Ser Glu Phe Asp Arg
                405                 410                 415
Gly Lys Val Gly Ser Ala Tyr Pro Arg Arg Pro Phe Tyr Gly Val Pro
            420                 425                 430
Asp Asp Asp Ile His Pro Arg Gly Tyr Gln Leu Ala Pro Met His Gly
        435                 440                 445
Arg Asn His Val Asp Pro Leu Arg Asn Pro Thr Pro Leu Val Asp Arg
    450                 455                 460
His Ile Pro Gly His Ala Gln Asp Ser Phe Ser Arg His Val Glu Val
465                 470                 475                 480
Glu Arg Ser Thr Pro Glu Tyr His Glu Pro Leu Leu Lys Glu Glu Trp
                485                 490                 495
Lys Trp Asp Gly Thr Ile Ala Lys Gly Gly Thr Pro Ile Cys Arg Ala
            500                 505                 510
Arg Cys Phe Pro Val Gly Lys Val Leu Asn Phe Met Leu Pro Glu Phe
        515                 520                 525
Leu Asp Cys Thr Ala Arg Thr Ser Leu Glu Met Leu Ser Lys His Tyr
    530                 535                 540
Tyr Gln Ala Ala Ser Ser Trp Val Val Phe Phe Val Pro Glu Asn Asp
545                 550                 555                 560
Ala Asp Met Ala Ala Tyr Asn Glu Phe Met Asn Tyr Leu Gly Asp Lys
                565                 570                 575
Gln Arg Ala Ala Val Cys Lys Leu Gly Glu Arg Ser Ser Leu Phe Leu
            580                 585                 590
Val Pro Pro Ser Asp Phe Ser Glu Gln Val Leu Arg Val Pro Gly Lys
        595                 600                 605
Val Ser Ile Ser Gly Val Ile Leu Lys Phe Glu Gln Ser Asp Pro Glu
    610                 615                 620
Val Ser Ser Pro Thr Arg Lys Pro Glu Thr Phe Val Ser His Leu Asn
625                 630                 635                 640
His Asp Val Arg Ala His Glu Asp Leu Asp Ala Leu Arg Arg Ile Asn
                645                 650                 655
Pro Pro Asp Ile Arg Pro Leu Pro Gln Gly Ser Asp Tyr Leu Gly Leu
            660                 665                 670
Ser Pro Gly Ser Tyr Asn Pro Ala Ser Ala His Leu Val Pro Pro Tyr
        675                 680                 685
Lys Phe Gly Asn Ala Pro Ser Tyr Leu Glu Ser Glu Leu Ala His Gln
    690                 695                 700
Lys His Pro Pro Asp Ser His Arg Glu Ile Ala His Asp Lys Gln Gln
705                 710                 715                 720
Gln His Pro Asp Val Leu Pro Ser Arg Trp Ser Asp Asn Ile Tyr Asn
                725                 730                 735
Pro Ser Pro Gly Ser Gly Asn Leu Asn Tyr Leu Ala Glu Ser Ala Ile
            740                 745                 750
Pro His Thr Ser Thr Asp Arg Thr Pro Glu Ala Tyr Ser Phe Ala Pro
        755                 760                 765
Gln Gly Val Pro Lys Val Ser Thr Ser Gly Tyr Ala Pro Val Ala Asp
    770                 775                 780
Glu Ala Ser Asn Met Ser Tyr Pro Pro Met Gln Pro Ala Ser Gln Gln
785                 790                 795                 800
Val Val Arg Pro Gln Gln Pro Pro Ser Leu Pro Leu Ser Leu Pro Pro
                805                 810                 815
Glu Gln Leu Ala Gln Leu Ala Thr Leu Leu Ala Gln Gln Asn Gln Pro
            820                 825                 830
Gly Lys Glu Pro Val Asp Ser Leu Asn Lys Glu Ser Gly Phe Ile Arg
        835                 840                 845
Asn Pro His Gly His Ser Ser Met Met Pro His Ser Ser Gly Ser Ile
    850                 855                 860
Pro Val Gln Asn Ser Leu Pro Pro Ala Pro Pro Ser Ala Ser Gln Leu
865                 870                 875                 880
Gln Val His Ala Pro Pro Val Gln Gly Ser Val Pro Pro Asn Pro Ser
                885                 890                 895
Ile Met His Thr Pro Asn Ala Pro Met Pro Ser His Asn Thr Leu Pro
            900                 905                 910
Leu Pro Pro Met His Pro Ser Gly Asn Pro Ala His Ser Ser Met Pro
        915                 920                 925
Leu Arg Ser Phe Val Pro Pro Leu Pro Glu Gly Pro Pro Pro Leu Arg
    930                 935                 940
Gln His Thr Ser Ser Ala Leu Gln Ala Gln Pro Ala Leu Pro Ser Gly
945                 950                 955                 960
Pro Gln Thr Ser Gln Gln Pro Ser Ala Gln Glu Asp His His Gly Asp
                965                 970                 975
Pro Gln Lys Arg Leu Gln Ala Thr Leu Gln Leu Ala Ala Thr Leu Leu
            980                 985                 990
Gln Gln Ile Gln Gln Gln Ser Lys Pro Gly Gly Gln Lys
        995                 1000                1005
<210>3
<211>11282
<212>DNA
<213>稻属(Oryza sativa L.)
<400>3
catttgtggt attacaatca tttagagtgg attcaacccg ttctcttata tctattgtgt     60
gtaaggattt tacaatcaca tttcttcaga tccatgattt tagtagacta cgtgtgatat    120
aattatcatt tagggtgtat acaacctatt tttttagatc tatcatatgt ttatatcttt    180
tacaagcaga ttcctttaaa cacttgattc aactagtaag attgtactgt actaaatgtg    240
ttgctatcat ttattaggga ccaaaacaga ttggtagtgt gtgcaatggc tttatttaaa    300
aaaaatatct cttttgtgtg tagatgattg ttatatctcc tcacaataca aaatattgat    360
cttaaagcca aacttgattt ggcaagaaca aataaccctt aaaacacata acacatttaa    420
ttttctatta aactaagaac ttactatata tcgcaagata tatgggcctc atatgaaaag    480
gagtattatg gatagtgtta gaagaggtgc caaaatttag ttaaaatgat taaaagagtg    540
cagccaataa atatggacta agcaagaaag aaagctcctc taaacatttt ttccgaaaat    600
gttcttttag ttgcaaaaca aattgtagca tgacaatacc aagcgtctaa ttgcgctgaa    660
tgcattcatc ttatttaact atgtgttttt ttatatgggg ttgtttgtga atttaaccct    720
cctagtggag ttttcaccgt aggctaatgg aacttgaaaa tattccacct aaaatgcacc    780
caggctgtaa aaaaaaaaat catatcttct atataattga tgctgactag ctactaaact    840
caatatatga gtgtaacaca tcatcattca gtagcaatta atgcctaaag tattttaaat    900
gttatacaag tatagtacat catctatatt ttattatatt ttagaactca acatgtaagc    960
atggcagatc atctcacatc atttgatata catatccatc atttctataa gagctctttt   1020
tccatccttg aggaagtacc atgaggtacc atgaagtact aggtaccatg aggtaccaat   1080
ctaatctagc cattgattaa gcaggggcat gattggaaaa ataagtcaat agacaagatt   1140
atcgttcatt ggtccttcca atcggcacca cccaaatcgc caatagcgat atagagcgcc   1200
gcaatccctt tccgtctgtc atgagttctc gcccaaattg ctaaaagcaa ggtgacgcca   1260
ccgctgggag tgcccgagcc caacgccgac cccttttctc agttccgctg ccgccgccgg   1320
cggatagata ttagtaagga attggtgaat acgcatgttg tgtttaggca atatggtgcc   1380
tgctattaat aattgaagtc gtgtatcttt gggtggtgat tatgcgaatt gattttatta   1440
gtaattgaag ttaaattcca gtggagccgt agctgccgcc tgatggtatg atgcaattag   1500
ctaatttcaa accaaacttg atactgtcca ttgaacagag ggagatagta taacagcaca   1560
aactgctact acatatagtt ttgacgagat tacatcaaag ggaggcagta catattacca   1620
aacaaaataa tgatgttcat cctgtcatcc atcacacaaa ttaagaacat agaccttgag   1680
actaaaatca tcagctttac ctatgtttcc tcctaaaacc atcagcttct tatagctaat   1740
tccatccgca gcagcaacga aaacatgcaa aaatatgaac ctgaagcttc ggcggtagcc   1800
tcactctcca ttcagtaggg ccctcgatct ccattattcg gcagcaccct agccgtagcg   1860
gctcgctcga cgacttatca cgatgcagca agtgacgttg accacgccaa attcacacct   1920
ccccaatccc caccccgcgt gcggccgatt cacttccaca gattgacgag aggagcaagc   1980
atgaccggat ggagggatct gaccgggagt gcttgatgaa gatatgcttt ccccctcatc   2040
tgagatggat ctgaacttgg aacgggctcc atctcttatt tgcaacgtgt gttgagaagg   2100
aagagacgca gacagatgcg ggcggaagag acgcggaaga ggagcccctt ctctcgctgc   2160
tgcgcgtggt gatgcactaa tgcggaagag aacgcgaaag tacaattcta ccctcccacc   2220
tacggtaccg cctcaatctg ggtatgcggt accacgcggt atgaataaat tccagtcgtc   2280
cgatgctacc aaatcgatgg ccatgatttg gtaccgcatg ccctcaagga tggtaaaaaa   2340
tctttttcta taatattagc atgcatgtgc ttaactctaa aatatatgga tggatatatt   2400
ctaagtttta taaatatgat agatagaaat gttgaaatat tgtggaaatg gtgttgattt   2460
gtagtattca ataaatcgta ctcccttcat ctcaaaacat aagaagtttt tgttgaatgt   2520
gacacattct aatactacga atctggataa actagtatgt gtttcatgta atcaaaactc   2580
tttatatttt gagatagatg gagtatagat atgatattgt aagcttataa gatttgatat   2640
gcattaatta ttgtccagtg ataagccatg cttgcatcca ttttctcggc aaacgaaaaa   2700
aaacacggaa tggaaaaata gtaaagggca gcaagaaaaa aaatggaaaa acaattgcag   2760
agagagagag agagagagca cccatccatc tccccggagg cgaaacccta acccacccaa   2820
cccatcgccg ccggcgaaaa ccctaatcca tccgccgccg aaccgaagta cacggtgccc   2880
tctgctccct cccacgctcg atccactacc cgctgctgtt gacgggaatg cggtttccct   2940
gacgaaatcg cggttcggct tcttggttct tgcagatggg gagacctcga ggccgcggcg   3000
gaggaggagg aggagggagg gggaggttcg gcggcggcgg ggggtcccgc ttctccgccg   3060
cccgcgatga cccgccgccg cggcgctcct cctccgggtg gggggtggca ccgccgtcgc   3120
ggcacctgtg ggtgggcagc ctctccccgg gcgtcgccgc ggccgacctc tcggagctct   3180
tcctccggtg cggcgacgtc gagggcatct cccgtgaccc cggccggagc ttcgcgttcg   3240
tgacgttcgc gcgggaggag gacgccgtgg cggcggtgcg ggagctgcag gggatccacc   3300
tccgcggggc gcccattagg atcgagtttt ccaagggggt tagtgtcgat cgtcctcctc   3360
ccgccccctt cgccacggtt tgccacgctt ttaccgaatt gttcatcata ttccctgtct   3420
caaaatcacc agtatccacc aatgaattgt gcttatcttg tcatggttgc aaacacgaat   3480
cgccgaaaaa taaagcaaaa actatgtttc acaacagacc aagtgtcgcg ataagttaaa   3540
attggtttgg agttttgctc ttagtcaaaa atcagaccaa aacaggatca acctagtatg   3600
cttgaacaat gaactataag ttctccgttc tcaggcatgc tcggataaca cagaacctta   3660
attttgttca tttatccgca tccttgctat catacgagtc tttcatacaa agagacttgt   3720
cagacctttg gtttcactga aacggatagt tcattcccac tatgtttgtt catcaccgac   3780
caataaaagg tcgaatgctc tacagagagg aagactgaca actcagattg cagatagtta   3840
ggactactat tacatggttt tcccttgtta tcccactggg aactaaagtt ctcgaactca   3900
atcaaagatt caaagttcac taattgtgat aagcacaaca gttagctgat gtctcaagtc   3960
tgtgaatcta caaggagtta acttccataa caccaaagct ccaaaaacag ggattttaga    4020
tctgatgcag tacattgctg tggcctgact gcctgagtga taaaaatttg gggaaaatat    4080
attgcatatg aaactatctg gatattcagt tttgcgcaca tataagcaaa tttaaacagc    4140
tcatgagaca tcaatgaagg ccttccgaaa tcccagaacg tcaagatcat ttaataatct    4200
tggcatgccc acattaatat ttttgggcta gtcggtaccc tttctatctt ctgcagctta    4260
tgttttaagt ttgagatgga actcaaattc tattatgaag aagataatct ctccttgctt    4320
ggttaaatag agaatgcata tgacaaccac tttgctatgg tataccggtg caggacttgg    4380
tttccataaa ttaccacagg cactcacaag agctttttgc tattattgtg caaccagaat    4440
agtctcattt aaatccttag gcattctatt aattgacaga aaataacagc actagtttag    4500
gaaatgtgat tgaaatgctc aatatttagt ttggtctgaa ggaccatgtt gaagttgcca    4560
cttgcacatg gctgaatcta acagatcaat cttcaccttt ctcacccttc atgtcatgac    4620
aagaactaac acccaaccag aataatatca tttgaatcct gatgcattct attaaatgac    4680
agaaaatgac agtggttcag caaatttgat tgaaattatc aatgtttagt ttggtctgaa    4740
ggacaaggac tacgagatgt tgccacttgc acaggcttaa tctaacagat taatcttcac    4800
ctttctcacc ctttatgtcg cgatacatgc taacaattgc aataatatat aggttcatct    4860
atatccctat taaaagcagg gtttgttact ttgttagtag tgctttggtt tatttgtggc    4920
atagaaatgc atacgtttgt cttgactagc tttgtggctt gaattcacat agtgtatgag    4980
acagttttgc aattgatcac aggttatcaa tcgagctttt tgggtagttg aattgttgta    5040
aatagctcta tttccatgaa gtttgatcag tgatacacca taccaccttg atgctaaaac    5100
tgagccaaag attcatgtca gatgatggaa ctatatctta atcaatgcag catcaatatt    5160
gaactgtctc gtgatgttgt aaatatggaa ctataccttc gtaaagtttg atacaccata    5220
caatctagtt tgatacacca tacaatctta tgttgttata ctaatattga gccaaaggtt    5280
catttcagat gatggaacta tatctcaccc aatttcatca tcaatatcaa actggcttga    5340
gttttttttc cccaaaaaaa agacttcata caaaactcct agttaaaaac ctgccattaa    5400
agatgaccca aaagtgccat aacactataa cagaagtctt gttcatgata tagaaattat    5460
agaacaaata tgatattatt acagatgata ttcacaacag cagaagtacc aaatttctac    5520
attgttgtcc ttgtgattta tgagtatcaa atgaaaaatg gattctagca cttgatagag    5580
ttgatcccaa ctctcctttt gtggccttat tccaagtttg aaacagcagg ctgtgattgc    5640
ggttctatgt ggttgtttga ctgattattt cttatcattc atattgtttt aaactgcatc    5700
tggtagggct aattgatcag aagcagcatg gacataggta gagcagacca atcttatgtc    5760
ctagagcttg tcagttaaat agcaatatga gcatacaagt acttatggta tctgtgttca    5820
tcatgatcca tttgctactc tggacctgaa atatttgaat ttacaggata aaggttcaag    5880
tagctctatg gatgacagat actcacaaca tgctgatcaa agacgtttta ctgaacgagg    5940
aaggaatcag caatcaagtc ctgaaaaatc aactgataaa tccaaaagaa gcaggccagc    6000
agaacctagt gaagtattat ggataggttt tcctgttggt ctgaaggtag atgaggcaac    6060
tctctgggaa gccttttcac cttttggtga ggttgtcaag ataactacat tcccagggcg    6120
tacttatgca tttgtccagt acactactat tgcagcggca tgcagggcga aggaaacact    6180
gcagggaaat attttcaata accctcgagt tagcatttgc ttttctcgga gtgacagtgt    6240
ttcagcagaa tttggaaaag gttccttaga tgccccatat tccccccatt taaactctag    6300
tgttagacct atattcaggg agcaagattt tgaagatttt cctagggcta ggccttttga    6360
tagtcctcca agagatatgt acatgccatc tccacattat ggccctaaga gactttctag    6420
agatcatgat gatgtgggtt tcagcaggga taattatttg cgatatggac ctggagtaga    6480
gcctgatcct agatctaatt ttgaaccttt taggatacaa gggctcggtc cagaaagaag    6540
gatgtctgag gacccatatg aacagcatag gcgtagccct gctggtgatg caccatggca    6600
caacattcca ttcgagcgat ctcagggagc cttaccatta gaggattctc ggtatgctag    6660
ggaagatcca tacccatttt caaagaagtt gaggactggt gaagcacatg actctgaact    6720
tcctgaatac cctttctctg aatttgatcg agggaaggtt ggctctgcct acccaaggag    6780
gcccttctat ggtgtgccag atgatgacat acaccccaga ggctatcaac ttgctcctat    6840
gcatggtaga aatcatgttg atcctttaag gaatccaact ccacttgtag ataggcatat    6900
accagggcat gcacaggaca gcttttctag gcatgtagaa gtggaaagat caactcctga    6960
ataccatgaa ccccttctca aggaagaatg gaaatgggat ggtacaatag caaagggagg    7020
cacaccaatt tgccgagcgc gatgcttccc tgttgggaag gttcttaact tcatgctgta    7080
agtctgggtt cttcactgta ttttcttgtt cattctgagt atcattattg acatctacaa    7140
cattagctct gcttatcgtc ttaataaaaa tcacaaaatt tccttcatgg ttcaagatat    7200
ataatacata gcaaatatat catagatatc gttttgcctt ttacatctaa tttatactgc    7260
atgcttttgt ttgcacctga tgaaggcttt tgtagagcta tgttttgttc acgttgttct    7320
tgatttaatt atatctctgc accatttgcc tctactcata atcttaataa atacagacgt    7380
ttgccttcac ggtccaaact acataatcta gttgatcaat ttctatctgc attcttttgg    7440
ttgtatctga tgagatgcct ttggtgttta tgctctgttc tattgttcta gatttgagca    7500
tctctaagtt caacatttag ttttaaaccg ctgttgattt catactttca ggcccgaatt    7560
tttggattgc actgctagga caagcctgga gatgctctct aagcactatt accaagctgc    7620
cagcagctgg gtggtgtttt ttgttccaga aaatgatgct gacatggcag cctataatga    7680
attcatgaat taccttggtg ataagcagcg tgcagcagtt tgtaaacttg gagaaaggag    7740
cagcttattt cttgttccac cctcagactt ctctgaacaa gtactgaggg ttccaggtaa    7800
agtcagcata tctggagtca ttctgaagtt tgagcagtca gatccagaag tttcctcgcc    7860
aactcgcaaa ccagaaacat ttgtgagtca tttgaaccat gatgttcgtg ctcatgagga    7920
tctagatgca ttgagaagaa tcaacccacc agatatcagg ccacttcctc agggttcaga    7980
ttatctcggg ttgtcgcctg gaagctataa tccagcaagt gcacatttgg ttccgcctta    8040
caagtttgga aatgctcctt catatctaga atctgaatta gctcatcaaa agcatccacc    8100
tgactcccac agggagatag cacatgacaa gcagcagcaa cacccagatg tattgccctc    8160
aagatggtca gataacattt acaatccaag tccaggttct ggaaatttga attatttggc    8220
tgagagtgcg atcccacata catcaactga taggacacca gaggcatact catttgctcc    8280
tcaaggagta ccaaaagtga gtacatcagg gtatgcacca gttgcagatg aggcatcaaa    8340
catgtcctac cctcccatgc aacctgcatc acagcaggta gttagacctc aacaacctcc    8400
atctctccca ttatcgcttc caccagagca acttgcacaa ttggccactc ttcttgcaca    8460
acaaaaccaa ccaggaaaag agcctgtgga cagcttaaac aaagaatcag gattcatacg    8520
gaatccacat ggacattctt caatgatgcc acacagctca ggttctatcc ctgtccaaaa    8580
ctcattgcca cctgctccgc catctgcatc acagttacag gttcatgcgc caccagttca    8640
aggttcagtg ccaccaaatc catccattat gcatacaccg aatgctccta tgccttctca    8700
caacactttg cctttacccc ctatgcatcc ttcgggaaat ccagctcatt cttccatgcc    8760
tttgagatcg ttcgtccctc ctcttcctga aggccctcca ccccttaggc agcacacatc    8820
aagtgctcta caagcgcaac ctgcacttcc ctctggacca cagactagcc agcaaccgtc    8880
tgctcaggaa gaccatcacg gagaccctca aaagcgcctt caagcaacat tgcaattggc    8940
agcaacccta cttcagcaga tacagcaaca atctaaacct ggtggccaga agtagatgcg    9000
aggtaattgt ttgcctaaag atctctttta atttctgtac catttacaca agaatatgaa    9060
tcattgtcct atttgaacca aatcgtttat gccatcaatg taattgctaa atggtttgta    9120
tattgtttag gagaaactct tgccttgtat tgttcgtttg gtcattgttt tccaaacttt    9180
tacatgataa tcaaacatca aggacattgc attatcattt ttactcttaa tgcctgtctt    9240
tacacaagtg ttgtatttct gtcacctgct agatagaatt atgtttggaa ccctggctgt    9300
caattaacca gtgaatgaaa tttcggttca aaatttcaga aacaatttca ttattttcga    9360
accccctggc cagtcattct ctcagccgaa attttccagt ttttctctct ttttttttaa    9420
tttggtaaaa gtttattcaa attcagtcaa attatgttaa ttttttcaaa aaaaaaaatc    9480
agtccaaaaa gtgccgaaaa tcctgaattt tctggaattt cagtgctacc gaaatggctg    9540
agattttaag cgaaatcaaa agtgaaaacc ctgttattaa catataaatt ttaaggggaa    9600
aagatatttg ttgaagaagc aggatgcaat ccctctctgt atgtgataca tttaattcgt    9660
ctgagtatat atatattcgt aaactagtgg gacttgggca attatgagtt ggaactattt    9720
tatttacttt ctcatgttta tgtagtaatt gtggcaaaag caggacaact ttagtgagat    9780
atatttagta tgcttgattt aaactaaaaa attttcaata catcatttgt gcttatgctg    9840
atgatatttt caaatgccat agtctgaacc cgctcttcaa tttcagcatt ccatgtcagt    9900
agtagaaaca agaaccacct ttatttgctg caatcaccac ttacaacagt tatattacct    9960
gtcatgacag gttaaggaaa tttgcagcct gcaaggatca tatggtgata ttttctcctt   10020
attactgaag agcctgagag tctgaaactg ctggtgggca cccataccta taccggatgt   10080
tttgttaaca taggttctgc tatgaattag cattgcagtt taattttgaa agcttactcc   10140
taggtggcaa ccacctccgt tgtcttgtct gtataagatt gcaccgttca tcttttctct   10200
ctgtttttgt gttaatcaat gcatagaccc atgaatacca cttccctttt tgcattcata   10260
catcatgcat tcgtctcatc gatgtgtcgt ctctctgaaa ttccttttgc atgcttccgc   10320
tgttcgcctg tatgtttttt gacagtgtgg tgtacgcctc cattcatgag gaatactagt   10380
agtgtatact accttcgtct caaaataagt ttactttgta cactgtctag attcatgtac   10440
aaaagcaaac ttattttggg actaggtagt atatctcatt gaatacaaca attttgtggg   10500
cagttattat gaactagact gtgaacagag catcccaaaa gatgtcctcc gcaggtaaga   10560
ttgaagtgca agaagaggga aatgcatatg ccattctact gtctactgta ctgaaacaag   10620
cttactgcta tggaatttgg agtactccct gggatgccta tccttcagat tttattaagg   10680
ggtttcccat gatgcagggg tgggagcttt attaaccttt gtgtgctgta aattctttca   10740
ctactttcag tgcacaccag ctttatctct ctgccatgta tggtctgtct gctaaagtgc   10800
atagcctata tatttgctgt tactgcaaac tttagcttgt taaaagtgtt catctgtagt   10860
atcagagttc agagttccat ggaacagcat tgcagcagcc aatctttctc actttccttt   10920
tttttatgta ctattgtttt aagtactctt ggtctcaacc caatgatggc cctatgtgtg   10980
gcttcagtgc tttgagattt atttaattct gctttgtttg ctgaaagcaa ggcaaattcg   11040
tacgggtgat tcaggcgatt gttgcctggt cctttttttt atgagaggat ttttatttat   11100
ttatttcttg ggtatgagag gaaacctagc agcaagccag aagttatgga tataagattc   11160
ttgcagaaat ataaaattat ggaggacatt tttcgtcctt catatactgt acaaaaccct   11220
taaaaaaaaa caaggagaac gagtagacga cacatcaacg agaagctttc ttgtacaaat   11280
tg                                                                11282
<210>4
<211>1966
<212>DNA
<213>稻属(Oryza sativa L.)
<400>4
gagctctttt tccatccttg aggaagtacc atgaggtacc atgaagtact aggtaccatg    60
aggtaccaat ctaatctagc cattgattaa gcaggggcat gattggaaaa ataagtcaat   120
agacaagatt atcgttcatt ggtccttcca atcggcacca cccaaatcgc caatagcgat   180
atagagcgcc gcaatccctt tccgtctgtc atgagttctc gcccaaattg ctaaaagcaa   240
ggtgacgcca ccgctgggag tgcccgagcc caacgccgac cccttttctc agttccgctg   300
ccgccgccgg cggatagata ttagtaagga attggtgaat acgcatgttg tgtttaggca   360
atatggtgcc tgctattaat aattgaagtc gtgtatcttt gggtggtgat tatgcgaatt   420
gattttatta gtaattgaag ttaaattcca gtggagccgt agctgccgcc tgatggtatg   480
atgcaattag ctaatttcaa accaaacttg atactgtcca ttgaacagag ggagatagta   540
taacagcaca aactgctact acatatagtt ttgacgagat tacatcaaag ggaggcagta   600
catattacca aacaaaataa tgatgttcat cctgtcatcc atcacacaaa ttaagaacat   660
agaccttgag actaaaatca tcagctttac ctatgtttcc tcctaaaacc atcagcttct   720
tatagctaat tccatccgca gcagcaacga aaacatgcaa aaatatgaac ctgaagcttc   780
ggcggtagcc tcactctcca ttcagtaggg ccctcgatct ccattattcg gcagcaccct   840
agccgtagcg gctcgctcga cgacttatca cgatgcagca agtgacgttg accacgccaa   900
attcacacct ccccaatccc caccccgcgt gcggccgatt cacttccaca gattgacgag   960
aggagcaagc atgaccggat ggagggatct gaccgggagt gcttgatgaa gatatgcttt  1020
ccccctcatc tgagatggat ctgaacttgg aacgggctcc atctcttatt tgcaacgtgt  1080
gttgagaagg aagagacgca gacagatgcg ggcggaagag acgcggaaga ggagcccctt  1140
ctctcgctgc tgcgcgtggt gatgcactaa tgcggaagag aacgcgaaag tacaattcta  1200
ccctcccacc tacggtaccg cctcaatctg ggtatgcggt accacgcggt atgaataaat  1260
tccagtcgtc cgatgctacc aaatcgatgg ccatgatttg gtaccgcatg ccctcaagga  1320
tggtaaaaaa tctttttcta taatattagc atgcatgtgc ttaactctaa aatatatgga  1380
tggatatatt ctaagtttta taaatatgat agatagaaat gttgaaatat tgtggaaatg  1440
gtgttgattt gtagtattca ataaatcgta ctcccttcat ctcaaaacat aagaagtttt  1500
tgttgaatgt gacacattct aatactacga atctggataa actagtatgt gtttcatgta  1560
atcaaaactc tttatatttt gagatagatg gagtatagat atgatattgt aagcttataa  1620
gatttgatat gcattaatta ttgtccagtg ataagccatg cttgcatcca ttttctcggc  1680
aaacgaaaaa aaacacggaa tggaaaaata gtaaagggca gcaagaaaaa aaatggaaaa  1740
acaattgcag agagagagag agagagagca cccatccatc tccccggagg cgaaacccta  1800
acccacccaa cccatcgccg ccggcgaaaa ccctaatcca tccgccgccg aaccgaagta  1860
cacggtgccc tctgctccct cccacgctcg atccactacc cgctgctgtt gacgggaatg  1920
cggtttccct gacgaaatcg cggttcggct tcttggttct tgcaga                 1966

Claims (10)

1.一种胚乳特异表达启动子,其特征在于,所述的启动子选自下组:
(1)具有SEQ ID NO:4所示的核苷酸序列的多核苷酸;或
(2)在严格条件下能够与(1)限定的多核苷酸序列杂交且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(3)与SEQ ID NO:4有95%以上同源性且具有指导目的基因在植物胚乳中特异性表达功能的多核苷酸;
(4)与SEQ ID NO:4所示的核苷酸序列完全互补的多核苷酸。
2.一种载体,其特征在于,所述的载体含有权利要求1所述的胚乳特异表达启动子,作为启动子元件。
3.如权利要求2所述的载体,其特征在于,所述的载体还含有与所述的胚乳特异表达启动子可操作地连接的目的基因。
4.一种遗传工程化的宿主细胞,其特征在于,所述的细胞:
含有权利要求2所述的载体;或
其基因组中整合有外源的权利要求1所述的胚乳特异表达启动子。
5.权利要求1所述的启动子的用途,其特征在于,所述的启动子用于指导目的基因在植物的胚乳中特异性表达。
6.一种使目的基因在植物的胚乳中特异性表达的方法,其特征在于,所述的方法包括:
将构建物转化植物细胞,所述的构建物含有胚乳特异表达启动子以及与所述的胚乳特异表达启动子可操作地连接的目的基因;
筛选出转入了所述构建物或染色体中整合有所述构建物的植物细胞;和
将所述植物细胞再生成植株。
7.一种分离的.可由权利要求1所述的启动子指导表达的胚乳特异表达蛋白,其特征在于,该蛋白选自下组:
(a)具有SEQ ID NO:2所示的氨基酸序列的多肽;或
(b)将SEQ ID NO:2所示的氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加而形成的,且具有调节植物生长发育功能的由(a)衍生的多肽。
8.一种分离的多核苷酸,其特征在于,该多核苷酸选自下组:
(i)编码权利要求7所述的蛋白的多核苷酸;或
(ii)与(i)中的多核苷酸互补的多核苷酸。
9.一种载体,其特征在于,它含有权利要求8所述的多核苷酸。
10.一种遗传工程化的宿主细胞,其特征在于,
它含有权利要求9所述的载体;或
它的基因组中整合有权利要求8所述的多核苷酸。
CN2006101480764A 2006-12-27 2006-12-27 胚乳特异表达启动子、胚乳细胞特异基因及其应用 Expired - Fee Related CN101210247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006101480764A CN101210247B (zh) 2006-12-27 2006-12-27 胚乳特异表达启动子、胚乳细胞特异基因及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101480764A CN101210247B (zh) 2006-12-27 2006-12-27 胚乳特异表达启动子、胚乳细胞特异基因及其应用

Publications (2)

Publication Number Publication Date
CN101210247A true CN101210247A (zh) 2008-07-02
CN101210247B CN101210247B (zh) 2011-12-07

Family

ID=39610503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101480764A Expired - Fee Related CN101210247B (zh) 2006-12-27 2006-12-27 胚乳特异表达启动子、胚乳细胞特异基因及其应用

Country Status (1)

Country Link
CN (1) CN101210247B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101831426B (zh) * 2009-12-28 2012-06-06 西南大学 种子胚乳特异表达的GhDET2基因启动子D6P1及其应用
CN102575249A (zh) * 2009-04-17 2012-07-11 巴斯夫植物科学有限公司 胚乳中有效的植物启动子及其用途
CN104045697A (zh) * 2013-03-15 2014-09-17 中国科学院上海生命科学研究院 调控水稻开花时间和育性的基因OsRRMh及其应用
CN110845589A (zh) * 2018-07-25 2020-02-28 中国科学院遗传与发育生物学研究所 蛋白GmRRM551在调控植物油脂代谢中的应用
CN112375128A (zh) * 2020-10-30 2021-02-19 扬州大学 一种RNA结合蛋白OsRRM及调控水稻中糖转运的应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1298021A (zh) * 1999-12-02 2001-06-06 中国科学院上海植物生理研究所 水稻胚乳组织中专-表达的启动子及其应用

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102575249A (zh) * 2009-04-17 2012-07-11 巴斯夫植物科学有限公司 胚乳中有效的植物启动子及其用途
CN102575249B (zh) * 2009-04-17 2014-11-05 巴斯夫植物科学有限公司 胚乳中有效的植物启动子及其用途
CN101831426B (zh) * 2009-12-28 2012-06-06 西南大学 种子胚乳特异表达的GhDET2基因启动子D6P1及其应用
CN104045697A (zh) * 2013-03-15 2014-09-17 中国科学院上海生命科学研究院 调控水稻开花时间和育性的基因OsRRMh及其应用
CN104045697B (zh) * 2013-03-15 2018-11-20 中国科学院上海生命科学研究院 调控水稻开花时间和育性的基因OsRRMh及其应用
CN110845589A (zh) * 2018-07-25 2020-02-28 中国科学院遗传与发育生物学研究所 蛋白GmRRM551在调控植物油脂代谢中的应用
CN110845589B (zh) * 2018-07-25 2022-03-15 中国科学院遗传与发育生物学研究所 蛋白GmRRM551在调控植物油脂代谢中的应用
CN112375128A (zh) * 2020-10-30 2021-02-19 扬州大学 一种RNA结合蛋白OsRRM及调控水稻中糖转运的应用
CN112375128B (zh) * 2020-10-30 2022-06-07 扬州大学 一种RNA结合蛋白OsRRM及调控水稻中糖转运的应用

Also Published As

Publication number Publication date
CN101210247B (zh) 2011-12-07

Similar Documents

Publication Publication Date Title
AU624329B2 (en) Sulphur-rich protein from bertholletia excelsa h.b.k.
CN101161675B (zh) 水稻大粒基因及其应用
US8461419B2 (en) Plant height regulatory gene and uses thereof
JP5158639B2 (ja) 植物の内胚乳に特異的に発現する遺伝子および該遺伝子のプロモーター、並びにそれらの利用
CN109207512A (zh) 植物调控元件及其应用
US20180010143A1 (en) New rice high temperature resistance gene and use in crop breeding resistance to high temperature thereof
CN101210247B (zh) 胚乳特异表达启动子、胚乳细胞特异基因及其应用
AU2003224789A1 (en) Generation of plants with improved drought tolerance
CN103172715B (zh) 植物表皮毛调控基因及其用途
JPH11504202A (ja) 植物における花の誘導の制御およびその使用法
US6177614B1 (en) Control of floral induction in plants and uses therefor
CN101173000A (zh) 作物籽粒灌浆基因gif1及其应用
CN101824078B (zh) 一种控制植物生长的蛋白及其编码基因与应用
CN110241130B (zh) 控制植物粒数和粒重的gsn1基因、编码蛋白及其应用
CN101575366B (zh) 水稻株型基因及其应用
CN101906154B (zh) 调节植物叶片转绿过程的蛋白、其编码基因及应用
US7179957B1 (en) Method for altering nitrogen or oil content of seeds by down regulating AGL11 expression or activity
CN100355883C (zh) 水稻抗逆相关基因-海藻糖-6-磷酸磷酸化酶基因及其应用
AU741854B2 (en) Control of floral induction in plants and uses therefor
CN1332980C (zh) 水稻抗逆相关基因-锚定序列重复蛋白基因及其应用
US20210163974A1 (en) Plants with modified lipid metabolism and methods for making the same
EP1464707B1 (en) Maize alpha-tubulin 3-18 promoter
CN114763373A (zh) 一种调控穗粒数的基因及其应用
CN101376673A (zh) 水稻脂肪合成相关基因及其应用
CN101679981A (zh) 突变植物及其生产方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111207

Termination date: 20161227

CF01 Termination of patent right due to non-payment of annual fee