CN110407921A - 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用 - Google Patents

来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用 Download PDF

Info

Publication number
CN110407921A
CN110407921A CN201810390345.0A CN201810390345A CN110407921A CN 110407921 A CN110407921 A CN 110407921A CN 201810390345 A CN201810390345 A CN 201810390345A CN 110407921 A CN110407921 A CN 110407921A
Authority
CN
China
Prior art keywords
plant
sequence
leu
protein
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810390345.0A
Other languages
English (en)
Other versions
CN110407921B (zh
Inventor
刁现民
汤沙
张丹丹
智慧
贾冠清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Dongfang Wuhua Agricultural Technology Group Co.,Ltd.
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority to CN201810390345.0A priority Critical patent/CN110407921B/zh
Publication of CN110407921A publication Critical patent/CN110407921A/zh
Application granted granted Critical
Publication of CN110407921B publication Critical patent/CN110407921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一种来源于谷子的植物籽粒发育相关蛋白SGDW1及其编码基因和应用。本发明提供的蛋白质,是由序列表中序列1所示的氨基酸序列组成的蛋白质,获自谷子,命名为SGDW1蛋白。所述蛋白质的编码基因也属于本发明的保护范围。本发明还保护所述蛋白质的应用,为如下(c1)或(c2):(c1)调控植物的籽粒大小;(c2)促进植物的籽粒增大。本发明为谷子籽粒大小发育的分子机制提供了研究基础,对于培育籽粒大小改变的植物新种质具有重大的应用推广价值。

Description

来源于谷子的植物籽粒发育相关蛋白SGDW1及其编码基因和 应用
技术领域
本发明涉及一种来源于谷子的植物籽粒发育相关蛋白SGDW1及其编码基因和应用。
背景技术
谷子(Setaria italica L.)是起源于中国的古老作物之一,是我国重要的粮食作物,并且广泛分布在世界范围内。
谷子(学名:Setaria italica),属禾本科的一种植物。古称稷、粟,亦称粱。一年生草本;秆粗壮、分蘖少,狭长披针形叶片,有明显的中脉和小脉,具有细毛;穗状圆锥花序;穗长20~30厘米;小穗成簇聚生在三级支梗上,小穗基本有刺毛。每穗结实数百至上千粒,子实极小,径约0.1cm,谷穗一般成熟后金黄色,卵圆形籽实,籽粒小、多为黄色,去皮后俗称小米。
谷子籽粒的营养价值很高,含丰富的蛋白质和脂肪和维生素。每100克小米中,含有胡萝卜素0.12毫克,维生素B1 0.66毫克和维生素B2 0.09毫克,同时含有烟酸、钙、铁等。
众所周知,籽粒大小和株高是作物高产育种的关键性状。
发明内容
本发明的目的是提供一种来源于谷子的植物籽粒发育相关蛋白SGDW1及其编码基因和应用。
本发明提供的蛋白质,是如下(a1)至(a7)中的任意一种:
(a1)由序列表中序列1所示的氨基酸序列组成的蛋白质;
(a2)含有(a1)的融合蛋白;
(a3)在(a1)的末端连接含有标签的短肽得到的融合蛋白;
(a4)在(a1)的末端连接标签得到的融合蛋白;
(a5)由序列表中序列4所示的氨基酸序列组成的蛋白质;
(a6)将(a1)或(a2)或(a3)或(a4)或(a5)经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与植物籽粒大小相关的由其衍生的蛋白质;
(a7)获自谷子的与(a1)具有98%以上同源性且与植物籽粒大小相关的由其衍生的蛋白质。
上述(a1)的蛋白质,获自谷子,命名为SGDW1蛋白。
标签具体如表1所示。
表1标签的序列
标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
HA 9 YPYDVPDYA
蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
所述蛋白质的编码基因也属于本发明的保护范围。
所述基因为如下(b1)至(b7)中任一所述的DNA分子:
(b1)编码区如序列表中序列2第412-1830位核苷酸所示的DNA分子;
(b2)编码区如序列表中序列2第412-1833位核苷酸所示的DNA分子;
(b3)序列表中序列2所示的DNA分子;
(b4)序列表中序列3所示的DNA分子;
(b5)序列表中序列5所示的DNA分子;
(b6)在严格条件下(b1)或(b2)或(b3)或(b4)或(b5)限定的DNA序列杂交且编码植物籽粒大小相关蛋白的DNA分子;
(b7)来源于谷子的与(b1)或(b2)或(b3)或(b4)或(b5)限定的DNA序列具有90%以上同源性且编码植物籽粒大小相关蛋白的DNA分子。
上述严格条件可为用0.1×SSPE(或0.1×SSC),0.1%SDS的溶液,在DNA或者RNA杂交实验中65℃下杂交并洗膜。
含有所述基因的重组表达载体、表达盒或重组微生物均属于本发明的保护范围。
可用现有的表达载体构建含有所述基因的重组表达载体。使用所述基因构建重组表达载体时,可在其转录起始核苷酸前加上任何一种增强型、组成型、组织特异型或诱导型启动子,它们可单独使用或与其它的植物启动子结合使用;此外,使用所述基因构建重组表达载体时,还可使用增强子,包括翻译增强子或转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。所述翻译控制信号和起始密码子的来源是广泛的,可以是天然的,也可以是合成的。翻译起始区域可以来自转录起始区域或结构基因。为了便于对转基因植物或转基因微生物进行鉴定及筛选,可对所用表达载体进行加工,如加入在植物或微生物中表达可产生颜色变化的酶或发光化合物的基因、具有抗性的抗生素标记物或是抗化学试剂标记基因等。从转基因安全性考虑,可不加任何选择性标记基因,直接以表型筛选转化植物或微生物。
所述重组表达载体具体可为:在载体pCAMBIA 1305的多克隆位点(例如KpnⅠ和SpeⅠ酶切位点之间)插入所述基因得到的重组质粒。
本发明还保护所述蛋白质的应用,为如下(c1)或(c2):
(c1)调控植物的籽粒大小;
(c2)促进植物的籽粒增大。
本发明还保护一种制备转基因植物的方法,包括如下步骤:在出发植物中导入所述基因,得到转基因植物;与所述出发植物相比,所述转基因植物的籽粒增大。所述基因具体可通过以上任一所述重组表达载体导入所述出发植物。携带有所述基因的重组表达载体可通过Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电导、农杆菌介导等常规生物学方法转化到出发植物中。所述出发植物为双子叶植物或单子叶植物。所述单子叶植物可为禾本科植物,具体可为谷子,例如谷子Ci846。
本发明还保护一种获得籽粒增大的植物的方法,包括如下步骤:增加目的植物中所述蛋白质的含量和/或活性,从而使植物籽粒增大。所述目的植物为双子叶植物或单子叶植物。所述单子叶植物可为禾本科植物,具体可为谷子,例如谷子Ci846。
本发明还保护所述基因在培育转基因植物中的应用;所述转基因植物为籽粒增大的植物。所述植物为双子叶植物或单子叶植物。所述单子叶植物可为禾本科植物,具体可为谷子,例如谷子Ci846。
本发明还保护所述蛋白质或所述基因或所述方法在植物育种中的应用。所述植物为双子叶植物或单子叶植物。所述单子叶植物可为禾本科植物,具体可为谷子,例如谷子Ci846。所述育种目标具体可为获得籽粒增大的植物。
以上任一所述籽粒增大体现为籽粒的长度和/或宽度增大。
本发明的发明人对谷子Yugu1进行EMS诱变,从突变体库中筛选出了一个具有小粒和矮杆表型的突变体植株-突变体sgdw1。进一步的,本发明的发明人利用图位克隆获得了SGDW1蛋白及其编码基因。进一步的,本发明的发明人对SGDW1蛋白的亚细胞定位,以及谷子Yugu1中SGDW1基因的组织表达模式进行了研究。并且,本发明的发明人对sgdw1突变体的表型及其细胞学机制进行深入的研究。更进一步的,本发明的发明人将SGDW1基因导入出发植物,得到了籽粒增大的转基因植物。
本发明为谷子籽粒大小发育的分子机制提供了研究基础,可用于培育籽粒大小改变的植物新种质,具有重大的应用推广价值。
附图说明
图1为实施例1的结果。
图2为实施例2的结果。
图3为实施例3的结果。
图4为实施例4中小花纵切的结果。
图5为实施例4中小花横切的结果。
图6为实施例4中颖壳细胞大小和数量的结果。
图7为实施例4中第二节间和穗下节间纵切以及细胞的大小的结果。
图8为实施例5中部分植株的Western blot结果。
图9为实施例5中待测种子宽度的相关结果。
图10为实施例5中待测种子长度的相关结果。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。对于谷子来说,种子也就是籽粒。
谷子SSR41记载于如下文献:Li W,Tang S,Zhang S,et al.Gene mapping andfunctional analysis of the novel leaf color gene SiYGL1in foxtail millet[Setaria italica(L.)P.Beauv][J].Physiologia Plantarum,2016,157(1):24-37.。
谷子Yugu1(即谷子豫谷1号)记载于如下文献:张文英等,豫谷1号和青狗尾草RIL群体根系变异和垂直分布,作物学报ACTA AGRONOMICA SINICA 2014,40(10):1717-1724。
载体pCAMBIA 1305记载于如下文献:Zhou S,Wang Y,Li W,et al.Pollen Semi-Sterility1Encodes a Kinesin-1–Like Protein Important for Male Meiosis,AntherDehiscence,and Fertility in Rice,The Plant Cell,Vol.23:111–129,January 2011.。
谷子Ci846记载于如下文献:Jia G,Huang X,Zhi H,et al.A haplotype map ofgenomic variations and genome-wide association studies of agronomic traits infoxtail millet(Setaria italica).Nature Genetics,2013,45(8):957.。
实施例1、SGDW1蛋白及其编码基因的发现
对谷子Yugu1进行EMS诱变,从突变体库中筛选出了一个具有小粒和矮杆表型的突变体植株,命名为突变体sgdw1。
2015-2017年6月于中国农业科学院种植基地(北纬39°54′20″,东经116°25′29″),连续3年种植谷子Yugu1和突变体sgdw1,突变体sgdw1的表型可以稳定遗传。与sgdw1相比,突变体sgdw1的种子显著变小。种子的照片见图1。图1A为未脱壳种子(显示宽度),图1B为脱壳种子(显示宽度),bar=2mm。图1C为未脱壳种子(显示长度),图1D为脱壳种子(显示长度),bar=2mm。图1E为宽度统计结果,图1F为长度统计结果,**代表p<0.01。抽穗期植株的照片见图1G,bar=30cm。突变体sgdw1的脱壳和未脱壳种子的宽度和长度均显著小于谷子Yugu1。与谷子Yugu1相比,突变体sgdw1的株高明显降低,约为谷子Yugu1的2/3左右。
突变体sgdw1和谷子SSR41分别作为母本和父本,构建图位克隆群体材料。利用42株隐性纯合株和多态性良好的分子标记进行目的基因的初步定位,结果分析显示,目的基因在b246(6,681,498)和9036(9,696,021)两对引物之间,物理距离约为3Mb。根据Yugu1和SSR41在谷子第9号染色体6,681,498-9,696,021之间的信息设计分子标记,利用242株隐性纯合株将目的基因精细定位在9号染色体的9031(7,330,400)和In7861(7,861,880)两对引物之间,物理距离约为531Kb。
进行高通量重测序。结果显示,在第9号染色体7,330,400-7,861,880区间内,仅有一个候选位点的突变位于基因的剪切位点,理论上可能是该候选位点的突变对该基因的CDS造成了影响,影响了蛋白编码。将该基因命名为SGDW1基因。将该基因编码的蛋白质命名为SGDW1蛋白。
SGDW1蛋白如序列表的序列1所示。SGDW1基因的开放阅读框如序列表的序列2第412-1833位核苷酸所示。基因组中SGDW1基因的序列如序列表的序列3所示。
实施例2、SGDW1基因定位在细胞膜上
分析SGDW1基因的表达部位:构建SGDW1基因融合GFP绿色荧光蛋白的表达载体(重组质粒SGDW1-GFP),将重组质粒SGDW1-GFP导入谷子Yugu1的原生质体。
SGDW1基因亚细胞定位的结果见图2。根据瞬时表达的结果,发现荧光信号分布在细胞膜上,说明SGDW1基因在细胞膜上表达。
实施例3、SGDW1基因组织表达特异性研究
分别检测谷子Yugu1苗期、拔节期和孕穗期不同器官(叶、根、茎、穗)中SGDW1基因的相对表达水平。具体方法为:提取总RNA,采用F1和R1组成的引物对,通过qRT-PCR检测SGDW1基因的表达情况。
F1:5’-CAAGAAAGGTTGCGTCTGGTCT-3’;
R1:5’-GCCAGGCAATTTCAACCAAACA-3’。
进行三次重复试验,结果取平均值。
结果见图3,A为苗期,B为拔节期,C为孕穗期。苗期、拔节期和孕穗期,SGDW1基因在叶片中均高表达,其次是在茎中,在根中的表达量最低。孕穗期,SGDW1基因在穗中的表达量与在茎中没有显著差异。
实施例4、突变体sgdw1表型变异的细胞学基础
一、种子变小的细胞学基础
种子变小是突变体sgdw1主要表型,然而籽粒大小与胚和胚乳的发育密切相关。因此,为了探究种子变小背后的分子机制,从细胞学水平上分析突变体sgdw1与谷子Yugu1的种皮以及胚乳的发育差异。
取材授粉3天后谷子Yugu1和突变体sgdw1的小花进行横向和纵向树脂切片。
小花纵切的结果见图4。图4中,A为谷子Yugu1(bar=200μm),B为突变体sgdw1(bar=200μm),C为谷子Yugu1(bar=100μm),D为突变体sgdw1(bar=100μm)。
小花横切的结果见图5。图5中,bar=200μm。
对颖壳细胞层进行观察统计,选取相同区域统计细胞大小和细胞数目,各取5个重复。颖壳细胞大小和数量的结果见图6。
相对于谷子Yugu1,突变体sgdw1的种子整体变小,细胞数目显著增多。
二、植株矮化的细胞学基础
分别对谷子Yugu1和突变体sgdw1的节间长度差异最明显的第二节间和穗下节间中部相同位置进行纵切。选取相同位置相同面积区域比较细胞的大小,取5个重复。
谷子Yugu1穗下节间纵切的结果见图7A(bar=100μm)。突变体sgdw1穗下节间纵切的结果见图7B(bar=100μm)。穗下节间纵切细胞的大小的结果见图7C。谷子Yugu1第二节间纵切的结果见图7D(bar=100μm)。突变体sgdw1第二节间纵切的结果见图7E(bar=100μm)。第二节间纵切细胞的大小的结果见图7F。
相对于谷子Yugu1,突变体sgdw1的穗下节间和第二节间的细胞长度明显缩短、细胞显著变小,这可能是突变体矮化的重要原因。
实施例5、转基因谷子的制备和表型检测
一、构建重组质粒
将序列表的序列2第412-1830位核苷酸所示的DNA分子插入载体pCAMBIA 1305的KpnⅠ和SpeⅠ酶切位点之间,得到重组质粒pSGDW1::SGDW1。
经测序验证,重组质粒pSGDW1::SGDW1中具有序列表的序列5所示的融合基因,表达序列表的序列4所示的融合蛋白。
序列表的序列5中,第43-1461位核苷酸编码SGDW1蛋白,第1522-2241位核苷酸编码GFP蛋白。
二、制备转基因植株
将重组质粒pSGDW1::SGDW1导入根癌农杆菌EHA105,得到重组农杆菌。采用重组农杆菌对谷子Ci846的幼穗愈伤组织进行遗传转化,得到T0代再生植株。共获得15株T0代再生植株。
15株T0代再生植株进行PCR鉴定。具体方法:以基因组DNA为模板,采用F2和R2组成的引物对进行PCR扩增,如果显示具有扩增产物(约1868bp),该植株为PCR鉴定阳性的转基因植株。15株T0代再生植株中,11株为转基因植株。
F2:5’-CCCTGCCTTCATACGCT-3’;
R2:5’-AAGATGGTGCGCTCCTG-3’。
利用Western blot检测11株转基因植株中的目的蛋白表达量。具体方法:提取总蛋白,进行蛋白电泳,然后采用GFP抗体进行Western blot。11株转基因植株中,4株植株的目的蛋白表达量很弱,7株植株的目的蛋白高表达。部分植株的Western blot结果见图8。图8中,1至7分别对应不同的转基因植株,8对应转空载体植株,9对应谷子Ci846。
将目的蛋白高表达的7株T0代植株分别进行:单株自交,获得T1代植株;T1代植株单株自交,获得T2代植株。T2代得到纯合的转基因株系。
纯合的转基因株系的T2代植株,单株自交,获得的种子为T3代种子。
三、制备转空载体植株
用载体pCAMBIA 1305代替重组质粒pSGDW1::SGDW1,按照步骤二进行操作,得到纯合的转空载体株系。得到纯合的转空载体株系的T3代种子。
四、表型鉴定
待测种子分别为:步骤二获得的纯合的转基因株系的T3代种子(10粒)、步骤三获得的纯合的转空载体株系的T3代种子(10粒)、谷子Ci846的种子(10粒)。
观察待测种子的表型,测量未脱壳种子的宽度和长度,测量脱壳种子的宽度和长度。
待测种子的照片(未脱壳)(宽度)见图9A,bar=5mm。待测种子的照片(脱壳)(宽度)见图9B,bar=5mm。待测种子(未脱壳)的宽度平均值见图9C。
待测种子的照片(未脱壳)(长度)见图10A,bar=5mm。待测种子的照片(脱壳)(长度)见图10B,bar=5mm。待测种子(未脱壳)的长度平均值见图10C。
转基因株系种子无论脱壳还是未脱壳,粒长和粒宽均显著大于谷子Ci846的种子。转空载体株系的种子无论脱壳还是未脱壳,粒长和粒宽均与谷子Ci846的种子没有显著差异。结果表明,SGDW1基因在谷子中是控制籽粒大小发育的关键基因。
SEQUENCE LISTING
<110> 中国农业科学院作物科学研究所
<120> 来源于谷子的植物籽粒发育相关蛋白SGDW1及其编码基因和应用
<130> GNCYX180857
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 473
<212> PRT
<213> Setaria italica
<400> 1
Met Gln Arg Arg Arg Gly Gln Thr Trp Ala Gly Val Gly Lys Thr Ala
1 5 10 15
Gln Ala Ala Ala Ala His Ala Ala Leu Phe Cys Phe Thr Leu Leu Leu
20 25 30
Ala Leu Arg Val Asp Gly Arg Thr Thr Tyr Ser Trp Trp Ile Ile Phe
35 40 45
Ile Pro Leu Trp Leu Phe His Gly Ile Val Ala Arg Gly Arg Phe Ser
50 55 60
Met Pro Ala Pro Ser Leu Pro His Gly Arg His Trp Ala Pro Cys His
65 70 75 80
Ser Ile Val Ala Ala Pro Leu Leu Ile Ala Phe Glu Leu Leu Leu Cys
85 90 95
Ile Tyr Leu Glu Ser Leu Arg Val Arg Asn His Pro Ser Val Asn Leu
100 105 110
Lys Ile Val Phe Leu Pro Leu Leu Ala Phe Glu Ala Ile Ile Leu Ile
115 120 125
Asp Asn Phe Arg Met Cys Arg Ala Leu Met Pro Gly Asp Glu Glu Ser
130 135 140
Met Ser Asp Glu Ala Ile Trp Glu Thr Leu Pro His Phe Trp Val Ala
145 150 155 160
Ile Ser Met Val Phe Leu Ile Ala Ala Thr Thr Phe Thr Leu Leu Lys
165 170 175
Leu Ser Gly Asp Val Gly Ala Leu Gly Trp Trp Asp Leu Phe Ile Asn
180 185 190
Tyr Gly Ile Ala Glu Cys Phe Ala Phe Leu Val Cys Thr Arg Trp Phe
195 200 205
Asn Pro Met Ile His Lys Pro Pro Thr Asn Gly Glu Ala Ser Ser Ser
210 215 220
Ser Ala Ala Ile Arg Tyr Arg Asp Trp Glu Ser Gly Leu Val Leu Pro
225 230 235 240
Ser Leu Glu Asp His Glu Gln Glu Gly Leu Cys Gly Leu Pro Asp Ile
245 250 255
Gly Gly His Val Met Lys Ile Pro Leu Val Val Phe Gln Val Phe Leu
260 265 270
Cys Met Arg Leu Glu Gly Thr Pro Pro Ser Ala Arg Tyr Ile Pro Ile
275 280 285
Phe Ala Val Phe Ser Pro Leu Phe Ile Leu Gln Gly Ala Gly Val Leu
290 295 300
Phe Ser Leu Ala Arg Leu Ala Glu Lys Val Val Leu Leu Leu Arg Asn
305 310 315 320
Gly Pro Val Ser Pro Asn Tyr Leu Thr Ala Ser Ser Lys Val Arg Asp
325 330 335
Cys Phe Ala Phe Leu His His Gly Ser Arg Leu Leu Gly Trp Trp Ser
340 345 350
Ile Asp Glu Gly Ser Lys Glu Glu Gln Ala Arg Leu Phe Tyr Ala Glu
355 360 365
Ser Thr Gly Tyr Asn Thr Phe Cys Gly Tyr Pro Pro Glu Val Val Arg
370 375 380
Lys Met Pro Lys Lys Asp Leu Ala Glu Glu Val Trp Arg Leu Gln Ala
385 390 395 400
Ala Leu Gly Glu Gln Ser Glu Ile Thr Lys Cys Thr Lys Gln Glu Tyr
405 410 415
Glu Arg Leu Gln Asn Glu Lys Val Leu Cys Arg Ile Cys Tyr Glu Gly
420 425 430
Glu Ile Cys Met Val Leu Leu Pro Cys Arg His Arg Thr Leu Cys Lys
435 440 445
Ser Cys Ser Asp Lys Cys Lys Lys Cys Pro Ile Cys Arg Val Pro Ile
450 455 460
Glu Glu Arg Met Pro Val Tyr Asp Val
465 470
<210> 2
<211> 2798
<212> DNA
<213> Setaria italica
<400> 2
gcatctgcct ccttcggtcc ctctccctcc ccaccctgtc cgacccgacc cgacccgatc 60
caatccaatc caatccattc ctcctcatga acagctcccc ggcaatagat tactgctaga 120
ttatcctact ccgatacaaa gcgcagagag agagagagag agagagagag cagaataact 180
tatcaaactc catgacaccc tttatcaaaa aaaaaactcc atgactccat catcagacta 240
gagagagaaa cccttgtccc ccctctgttc ctcgctttca tcacccattc ctccgagtct 300
ccgacccatc tccaccagcg tcaagcccaa ggaagcggcg gcggcggcgg aggaggagga 360
ggaggagggg agattcggcc ttcccgtcgg gagcctaggg aggaggagga gatgcagcgg 420
cggcgggggc aaacgtgggc gggggtgggg aagacggcgc aggcggcggc cgcgcacgcc 480
gcgctcttct gcttcacgct cctcctcgcg ctcagggtcg acggccgcac cacctactcc 540
tggtggataa tattcattcc actatggctc tttcatggga tcgttgcgcg cggaaggttt 600
tcaatgccag ccccttcttt gcctcatggt cgtcattggg cgccctgtca ttcgattgtc 660
gcagcacctc tgctaattgc gtttgagcta cttctttgca tataccttga aagcttaaga 720
gttaggaatc atccatctgt taatctgaag attgtgttcc ttcctctgct ggccttcgaa 780
gcaattatcc ttatcgataa ttttagaatg tgtagagctt taatgcctgg agatgaagaa 840
agcatgagcg atgaagctat ttgggagaca cttccccatt tttgggtggc aatttcaatg 900
gtgtttctta tagctgctac aacattcaca cttctcaagc tgtctggtga tgttggtgca 960
ttgggttggt gggatttgtt tataaattat gggattgcgg agtgttttgc atttcttgtt 1020
tgtaccagat ggtttaatcc catgattcat aagcctccca ctaatgggga agctagctcg 1080
tcatcagcag caattagata ccgtgattgg gaaagtggtc ttgttctccc atcactagaa 1140
gatcacgaac aagaggggct ttgtggtctc cctgatatcg gaggtcatgt aatgaaaata 1200
cctctggttg ttttccaagt ttttctctgt atgcggttgg agggcacacc acctagtgct 1260
cgctacatcc caatatttgc ggttttctcg ccactattta ttctgcaagg tgctggtgtc 1320
cttttctctc tagcaagatt ggcggagaag gttgttctac tattgcgtaa tggaccagtt 1380
agtcctaatt accttacagc ctcatcaaaa gttcgagatt gttttgcttt tcttcatcat 1440
ggttcaaggc ttcttggttg gtggtctatt gacgaaggga gcaaggaaga gcaagcccga 1500
ttgttttatg ctgaatctac tgggtacaat acattttgtg gctatccacc tgaggtggtt 1560
aggaaaatgc ctaaaaagga tcttgcagaa gaggtttgga ggctacaggc ggcattggga 1620
gagcaatctg aaattacaaa gtgtaccaaa caggaatatg aaaggcttca aaatgagaag 1680
gttctttgta ggatttgcta tgagggagag atatgcatgg tcctacttcc ctgccgacac 1740
agaactttat gcaagtcttg ttctgataag tgcaagaagt gtccgatctg ccgtgtgcca 1800
attgaagagc gcatgcctgt atatgatgtt taaacctcac taactcagct taacattaca 1860
aacgtgtaca tgtgggttct gtcatgccgt gcagttgggc tcgatcacaa ctttaagctg 1920
attgaggttt gcacaacatc agaaaaggtt tacagtaagc atatatgggg gaaatacaag 1980
tatatcatgt ctctaaccaa aagcatggaa aggtggctga tgagcatttt gttggttcca 2040
tccagttatc taatgtaagt atgtggtcag tgtatttccc ttcctcttgc gattgataga 2100
cgagtcaggt agtcttgttt gggtagcagc atcttctcag tgatacgcag ttgttgtcac 2160
agtgtaaata aaaacgttgc cttgtttgaa tgtagtcctc tcttggttga gaagaaagtg 2220
aaacaaaaac agactgtgaa ccacttgttg taccatctga taggataata tctgcgccca 2280
attatctgac cgagatattg ttcgttcagt aaaggggttc aggtggcttc tcacaatgtg 2340
aagggtcgcc taaggtgtgt ggaagtgtgt ctggacaaga aaggttgcgt ctggtctgtg 2400
gcaaggaatc attggtgatg tagttatatg acttgtcgag ccgtactgag gtgattggag 2460
ccaattatat gtttgtcttc ggtatcttga actaaaatag aatgaagctg ctggaagatg 2520
ttaggcagtt tggggctgtt tggttgaaat tgcctggctg cacacttgcc tggagcttgc 2580
atggtgttta gttacggtcc tggaaggaac accagcggta accatgtggc gtcggccagg 2640
gaagatctgg agatgttaaa ttttactatg tcaacctttt tggaggcgct taagtggtat 2700
gttgaacatg caatgtgccc cttaataagg atgagtccac ttgcatatct gcttacaagt 2760
cgcttaatag aagggaaaat ggtgactact ccccgttc 2798
<210> 3
<211> 7145
<212> DNA
<213> Setaria italica
<400> 3
gcatctgcct ccttcggtcc ctctccctcc ccaccctgtc cgacccgacc cgacccgatc 60
caatccaatc caatccattc ctcctcatga acagctcccc ggcaatagat tactgctaga 120
ttatcctact ccgatacaaa gcgcagagag agagagagag agagagagag cagaataact 180
tatcaaactc catgacaccc tttatcaaaa aaaaaactcc atgactccat catcagacta 240
gagagagaaa cccttgtccc ccctctgttc ctcgctttca tcacccattc ctccgagtct 300
ccgacccatc tccaccagcg tcaagcccaa ggaagcggcg gcggcggcgg aggaggagga 360
ggaggagggg agattcggcc ttcccgtcgg gagcctaggg aggaggagga gatgcagcgg 420
cggcgggggc aaacgtgggc gggggtgggg aagacggcgc aggcggcggc cgcgcacgcc 480
gcgctcttct gcttcacgct cctcctcgcg ctcagggtcg acggccgcac cacctactcc 540
tggtggtacg cactctaaac cctagacctc cccgtcccgt cccccctcgc tccgcttcga 600
ttcgatctga ttgggttggt ttgcgcgagc tgggggtttc gagttgtccg tttgtgcggt 660
gatatggggg agagtggctc ccctgcgttg cagatgcagt ttttgggatt ggtcgatcca 720
acgctatgcg tttttttttt tgcgaggaag ctttgcgtgc gattgggggt tgtttgctgg 780
actaatctgc tctactggcg tgtgattcat ctacctgtct gtgacacgaa tgtcggctag 840
tgaagatttg ctggtagcat cccttcagtt catgctgctc actgacccta gttattatta 900
tgccggccag catttccctt agttattgtt ttgggaaagt agatttcatg ccaaatttgg 960
taccttgagg cattcttccg atttgcctat gttttagcag aacttagaaa ctcttctagc 1020
tacaatttgg cctattgcgg tttactctac gacaactgct gtaatttggc aatggtaaag 1080
ctaatgtgga atgctaattt atgctacttt gatgatagga taatattcat tccactatgg 1140
ctctttcatg ggatcgttgc gcgcggaagg ttttcaatgc cagccccttc tttgcctcat 1200
ggtcgtcatg taagatttag agactgatct atctgtttgc attagcatcg ttcctttggc 1260
acccaagaag gggcctaata tgtttctgat tgcgtgcagt gggcgccctg tcattcgatt 1320
gtcgcagcac ctctgctaat tgcgtttgag ctacttcttt gcatatacct tgaaagctta 1380
agaggtaggg tcttaatcca ttgggtaaac taaaccttgt caatcacact tgagataatg 1440
ggatctctat aattatttaa tctaaactgc agttgttgct agctctttcg ttctgtgttc 1500
ttcacacttt tttcctttgt gtctacccag ttaggaatca tccatctgtt aatctgaaga 1560
ttgtgttcct tcctctgctg gccttcgaag caattatcct tatcgataat tttaggtaat 1620
caatgcgaac tatccccttt tctttccagg gaattcttag actgtgatgt tgtaagttcc 1680
tttttccaaa tatgagaatg tatttgccca tgagcgggag ttactgtcgt tttaacagtt 1740
taccatctta cattttcaat cacacgtttt gttgaaatag tttttagttc gtgttttaat 1800
attattcttc tgtcacactt tttgttgaag ctgctgtgat gtacctttgt atgtacaatt 1860
gatatgcttg gaattgctgt agacaaatga cctttctggt ttttggatgt ttaatgggcc 1920
cttagaagca gataaattca tcatcttaca acttccacag tctcaacaat tgttagctgt 1980
gtgtgctaac ttctaccagt taccacattt tgtctaggaa aggtgtatgt tgggctaaaa 2040
actatcttag taaaagatta aacaatgtgg gcatgcaaat ttacaggtgg tgtatcacaa 2100
tatgaatcaa agtgaatgtc ctattcgtag tggcccgtta tggtacttta gctttcttct 2160
gaaacaaatt ttaagtctct caattatcta tatggaggtt aaaactagtc gtgcatacag 2220
attttatcat tacttgtatt tcaattgaat catttattta tacacacatt ctaagctata 2280
aagtttgatt ttagttccaa gtaaatcttt aagttatgta ttgcttctac tgcttaagcc 2340
tatattcgtt tccattgcct aaattatatg tatcgggctt ggagaacttt ggacacctaa 2400
tcttgcgttg agggtttgtc ttccattgtg ctttggacaa catgaacata gttaattcac 2460
aagatccttc tgtccatgtt agtttgttct gcttgtgcca taacatcgtg gtgtgacttt 2520
ctttgctgca tagaagtaag attgttgcat tttagtattc taactcaaag ttatggatga 2580
tatcgttaaa tattagccat tgatcactct ttcatgtctg catgcattca ggacattgat 2640
cgatgttcga ttccttttta tcatcctcat ctgtgctaat tgtgaatccc actggccaaa 2700
gataaacaaa ttattattta tttgtacttt cagagagtaa ttatattata gttactatgg 2760
aaattgacat gcatctattt cttgccattg gttttgttgt tcagaatgtg tagagcttta 2820
atgcctggag atgaagaaag catgagcgat gaagctattt gggagacact tcccgtaagt 2880
ttctcacact agtgcatctg actaccttag gcacaatttg tccactgatt tgaatcgcag 2940
tccatttttt ttagaaaaaa taagtataga atacatcact taaccaggaa attttaagtc 3000
gtgcaatttt gtagtattca tttgatactc tttggtaatg gaatggagca ctatgtgcca 3060
tgaatcaatt gtagggttga aaactgatac aatgaactat aatgaaaact gatacaatga 3120
acaaatatat tagttcacta ttataacaga ttgaaatttg ttctaatcag agcaatcttt 3180
cacaagaact tgcagttctc caaacatgtt tgggttggtc tctgatattc tatgtggtag 3240
ctataaattt acttctttca tttcatatga gtatttagct aatgtaaagc atcacacgta 3300
ccccttataa ttagaagcat tatatgtttg cacccttttg aattttgatc ttgcgtagag 3360
atcttgctaa tagctcatat gatcttgaga atgcaccatt ttttactaac aatagaatgt 3420
tagacattta tcttatgatg tttgaccttt tttcgtaacc agcatttttg ggtggcaatt 3480
tcaatggtgt ttcttatagc tgctacaaca ttcacacttc tcaagctgtc tggtaagttt 3540
cctattacta cttacaaaac tgattgcctc attattgctg acgacatgtc ctattctctt 3600
catgattgaa catctgcaat tttctaggca gcaccttatt tatttcgatt actttaacta 3660
tgaagttaac aagagcatat gtcatgtgtt agttgtccag tttgtagaac atgatgcatt 3720
gtgaatagta ccttgcctcc ttacttgacc agttcagttc acttaggttc tttaacatga 3780
atccttagaa tttgaaaatg tatttcttcc tatcatgata ttgtttcttc tcttagatag 3840
cattttgggg gttgggagtg ggatatttct ttttgttctt aggttggaca tacccagttt 3900
ggaactattg ttctccctgc ccatgagcct ttaggaggta gttgaactat taacaatttt 3960
aagttgcgca atggtgaagt ttatattttt tcccctctca ggcctccttt gcctttattg 4020
tacaatgttt tgtaataatg tgttattgca catgacaggt gatgttggtg cattgggttg 4080
gtgggatttg tttataaatt atgggtgaga cttgtctcag tgtcattctt ccttattttt 4140
tgagatgtca aataacctaa ttcggcacct tggttatcca ggattgcgga gtgttttgca 4200
tttcttgttt gtaccagatg gtttaatccc atgattcata agcctcccac taatggggaa 4260
gctagctcgt catcagcagc aattagatac cgtgattggg aaagtggtct tgttctccca 4320
tcactagaag atcacgaaca agaggggctt tgtggtctcc ctgatatcgg aggtcatgta 4380
atgaaaatac ctctggttgt tttccaagtt tttctctgta tgcggttgga ggtatgttcc 4440
atccagaact tgtagggaaa catttgtttg ataaacagca tacagggatg aaactgcaag 4500
gaccgtgttt tttctttctt tctttctttt taaagcaacc acatcactgt tttaacacat 4560
tagaaaacaa ttagataatc actactctat atgacaacag ttttattgaa acaattgaaa 4620
cagatgcaaa caagtcaata atactggctg agttcatttt tttttctttt ttgggtaaac 4680
tctgtcccaa gaccagaaca gctggaaact agctgataac agtaattgac tgctctctat 4740
taactgatat aatcactttc atcagtagca tgactgtact atactatttt gtttcagggc 4800
acaccaccta gtgctcgcta catcccaata tttgcggttt tctcgccact atttattctg 4860
caaggtgctg gtgtcctttt ctctctagca agattggcgg agaaggttgt tctactattg 4920
cgtaatggac cagttagtcc taattacctt acagcctcat caaaagttcg agattgtttt 4980
gcttttcttc atcatggttc aaggtaccat ctgatatcta atataagcta tttttgtatt 5040
tattttagct tgtgtatttt tggccgtgtt tgaaccatat attagctttt cacctgcaca 5100
caagctttaa actgtggctt atttatccat gtgttatgca ggcttcttgg ttggtggtct 5160
attgacgaag ggagcaagga agagcaagcc cgattgtttt atgctgaatc tactgggtat 5220
cttactgctc atttgagttc tgttaatttg cccactcttt tgctattcct cattttgttt 5280
catgctttct atgctgattg tttgctcttt gtttgaaggt acaatacatt ttgtggctat 5340
ccacctgagg tggttaggaa aatgcctaaa aaggatcttg cagaagaggt tacaggatat 5400
aataattttt tttgttccat gaatttttat gtcaccacat atctgggatc attgcatgat 5460
ataatcagca aaacactgac ttcctgcttg cctgctttca ggtttggagg ctacaggcgg 5520
cattgggaga gcaatctgaa attacaaagt gtaccaaaca ggaatatgaa aggcttcaaa 5580
atgtattact ccttgctgtg tctgcattct catttttcca tttgaagtat gttgtgcctg 5640
cattagcatt tttccatttg aagtataatg gcaccatatg ccctctcaca cgtgaatcat 5700
ttagatctaa gctgtctact tgaaagacct taggcaatga aaccttgatt ctaattatac 5760
tgttttaggg aaagtgttga tgttgtaatg gggatgggtt attgccattg cctattgata 5820
attaccttct tttatatggg gcacagatta taacttgttc aattcatcat cgattctctg 5880
ttgacagtca ccttttcctc attttttcca ggagaaggtt ctttgtagga tttgctatga 5940
gggagagata tgcatggtcc tacttccctg ccgacacaga actttatgca agtatgtttc 6000
agtctctttt tttactctat catatacact cttaccagct gagcattgtt tgaaatcatt 6060
tatttacata ttgattgtga ttgcacattt cactgtatta ggtcttgttc tgataagtgc 6120
aagaagtgtc cgatctgccg tgtgccaatt gaagagcgca tgcctgtata tgatgtttaa 6180
acctcactaa ctcagcttaa cattacaaac gtgtacatgt gggttctgtc atgccgtgca 6240
gttgggctcg atcacaactt taagctgatt gaggtttgca caacatcaga aaaggtttac 6300
agtaagcata tatgggggaa atacaagtat atcatgtctc taaccaaaag catggaaagg 6360
tggctgatga gcattttgtt ggttccatcc agttatctaa tgtaagtatg tggtcagtgt 6420
atttcccttc ctcttgcgat tgatagacga gtcaggtagt cttgtttggg tagcagcatc 6480
ttctcagtga tacgcagttg ttgtcacagt gtaaataaaa acgttgcctt gtttgaatgt 6540
agtcctctct tggttgagaa gaaagtgaaa caaaaacaga ctgtgaacca cttgttgtac 6600
catctgatag gataatatct gcgcccaatt atctgaccga gatattgttc gttcagtaaa 6660
ggggttcagg tggcttctca caatgtgaag ggtcgcctaa ggtgtgtgga agtgtgtctg 6720
gacaagaaag gttgcgtctg gtctgtggca aggaatcatt ggtgatgtag ttatatgact 6780
tgtcgagccg tactgaggtg attggagcca attatatgtt tgtcttcggt atcttgaact 6840
aaaatagaat gaagctgctg gaagatgtta ggcagtttgg ggctgtttgg ttgaaattgc 6900
ctggctgcac acttgcctgg agcttgcatg gtgtttagtt acggtcctgg aaggaacacc 6960
agcggtaacc atgtggcgtc ggccagggaa gatctggaga tgttaaattt tactatgtca 7020
acctttttgg aggcgcttaa gtggtatgtt gaacatgcaa tgtgcccctt aataaggatg 7080
agtccacttg catatctgct tacaagtcgc ttaatagaag ggaaaatggt gactactccc 7140
cgttc 7145
<210> 4
<211> 747
<212> PRT
<213> Artificial sequence
<400> 4
Met Leu Thr Leu Leu Phe Gly Val Thr Ser Ala Leu Gly Thr Met Gln
1 5 10 15
Arg Arg Arg Gly Gln Thr Trp Ala Gly Val Gly Lys Thr Ala Gln Ala
20 25 30
Ala Ala Ala His Ala Ala Leu Phe Cys Phe Thr Leu Leu Leu Ala Leu
35 40 45
Arg Val Asp Gly Arg Thr Thr Tyr Ser Trp Trp Ile Ile Phe Ile Pro
50 55 60
Leu Trp Leu Phe His Gly Ile Val Ala Arg Gly Arg Phe Ser Met Pro
65 70 75 80
Ala Pro Ser Leu Pro His Gly Arg His Trp Ala Pro Cys His Ser Ile
85 90 95
Val Ala Ala Pro Leu Leu Ile Ala Phe Glu Leu Leu Leu Cys Ile Tyr
100 105 110
Leu Glu Ser Leu Arg Val Arg Asn His Pro Ser Val Asn Leu Lys Ile
115 120 125
Val Phe Leu Pro Leu Leu Ala Phe Glu Ala Ile Ile Leu Ile Asp Asn
130 135 140
Phe Arg Met Cys Arg Ala Leu Met Pro Gly Asp Glu Glu Ser Met Ser
145 150 155 160
Asp Glu Ala Ile Trp Glu Thr Leu Pro His Phe Trp Val Ala Ile Ser
165 170 175
Met Val Phe Leu Ile Ala Ala Thr Thr Phe Thr Leu Leu Lys Leu Ser
180 185 190
Gly Asp Val Gly Ala Leu Gly Trp Trp Asp Leu Phe Ile Asn Tyr Gly
195 200 205
Ile Ala Glu Cys Phe Ala Phe Leu Val Cys Thr Arg Trp Phe Asn Pro
210 215 220
Met Ile His Lys Pro Pro Thr Asn Gly Glu Ala Ser Ser Ser Ser Ala
225 230 235 240
Ala Ile Arg Tyr Arg Asp Trp Glu Ser Gly Leu Val Leu Pro Ser Leu
245 250 255
Glu Asp His Glu Gln Glu Gly Leu Cys Gly Leu Pro Asp Ile Gly Gly
260 265 270
His Val Met Lys Ile Pro Leu Val Val Phe Gln Val Phe Leu Cys Met
275 280 285
Arg Leu Glu Gly Thr Pro Pro Ser Ala Arg Tyr Ile Pro Ile Phe Ala
290 295 300
Val Phe Ser Pro Leu Phe Ile Leu Gln Gly Ala Gly Val Leu Phe Ser
305 310 315 320
Leu Ala Arg Leu Ala Glu Lys Val Val Leu Leu Leu Arg Asn Gly Pro
325 330 335
Val Ser Pro Asn Tyr Leu Thr Ala Ser Ser Lys Val Arg Asp Cys Phe
340 345 350
Ala Phe Leu His His Gly Ser Arg Leu Leu Gly Trp Trp Ser Ile Asp
355 360 365
Glu Gly Ser Lys Glu Glu Gln Ala Arg Leu Phe Tyr Ala Glu Ser Thr
370 375 380
Gly Tyr Asn Thr Phe Cys Gly Tyr Pro Pro Glu Val Val Arg Lys Met
385 390 395 400
Pro Lys Lys Asp Leu Ala Glu Glu Val Trp Arg Leu Gln Ala Ala Leu
405 410 415
Gly Glu Gln Ser Glu Ile Thr Lys Cys Thr Lys Gln Glu Tyr Glu Arg
420 425 430
Leu Gln Asn Glu Lys Val Leu Cys Arg Ile Cys Tyr Glu Gly Glu Ile
435 440 445
Cys Met Val Leu Leu Pro Cys Arg His Arg Thr Leu Cys Lys Ser Cys
450 455 460
Ser Asp Lys Cys Lys Lys Cys Pro Ile Cys Arg Val Pro Ile Glu Glu
465 470 475 480
Arg Met Pro Val Tyr Asp Val Thr Ser Leu Lys Ser Gly Ala Ser Ser
485 490 495
Arg Asp Val Ser Arg Thr Gly Pro Gly Gly Ser Met Val Ser Lys Gly
500 505 510
Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly
515 520 525
Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp
530 535 540
Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys
545 550 555 560
Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Thr Tyr Gly Val
565 570 575
Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe
580 585 590
Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe
595 600 605
Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly
610 615 620
Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu
625 630 635 640
Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His
645 650 655
Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn
660 665 670
Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp
675 680 685
His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro
690 695 700
Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn
705 710 715 720
Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly
725 730 735
Ile Thr His Gly Met Asp Glu Leu Tyr Arg Ser
740 745
<210> 5
<211> 2244
<212> DNA
<213> Artificial sequence
<400> 5
atgctcaccc tgttgtttgg tgttacttct gcactaggta ccatgcagcg gcggcggggg 60
caaacgtggg cgggggtggg gaagacggcg caggcggcgg ccgcgcacgc cgcgctcttc 120
tgcttcacgc tcctcctcgc gctcagggtc gacggccgca ccacctactc ctggtggata 180
atattcattc cactatggct ctttcatggg atcgttgcgc gcggaaggtt ttcaatgcca 240
gccccttctt tgcctcatgg tcgtcattgg gcgccctgtc attcgattgt cgcagcacct 300
ctgctaattg cgtttgagct acttctttgc atataccttg aaagcttaag agttaggaat 360
catccatctg ttaatctgaa gattgtgttc cttcctctgc tggccttcga agcaattatc 420
cttatcgata attttagaat gtgtagagct ttaatgcctg gagatgaaga aagcatgagc 480
gatgaagcta tttgggagac acttccccat ttttgggtgg caatttcaat ggtgtttctt 540
atagctgcta caacattcac acttctcaag ctgtctggtg atgttggtgc attgggttgg 600
tgggatttgt ttataaatta tgggattgcg gagtgttttg catttcttgt ttgtaccaga 660
tggtttaatc ccatgattca taagcctccc actaatgggg aagctagctc gtcatcagca 720
gcaattagat accgtgattg ggaaagtggt cttgttctcc catcactaga agatcacgaa 780
caagaggggc tttgtggtct ccctgatatc ggaggtcatg taatgaaaat acctctggtt 840
gttttccaag tttttctctg tatgcggttg gagggcacac cacctagtgc tcgctacatc 900
ccaatatttg cggttttctc gccactattt attctgcaag gtgctggtgt ccttttctct 960
ctagcaagat tggcggagaa ggttgttcta ctattgcgta atggaccagt tagtcctaat 1020
taccttacag cctcatcaaa agttcgagat tgttttgctt ttcttcatca tggttcaagg 1080
cttcttggtt ggtggtctat tgacgaaggg agcaaggaag agcaagcccg attgttttat 1140
gctgaatcta ctgggtacaa tacattttgt ggctatccac ctgaggtggt taggaaaatg 1200
cctaaaaagg atcttgcaga agaggtttgg aggctacagg cggcattggg agagcaatct 1260
gaaattacaa agtgtaccaa acaggaatat gaaaggcttc aaaatgagaa ggttctttgt 1320
aggatttgct atgagggaga gatatgcatg gtcctacttc cctgccgaca cagaacttta 1380
tgcaagtctt gttctgataa gtgcaagaag tgtccgatct gccgtgtgcc aattgaagag 1440
cgcatgcctg tatatgatgt tactagtctt aagtccggag ctagctctag agacgtctcg 1500
aggaccggtc ccgggggatc catggtgagc aagggcgagg agctgttcac cggggtggtg 1560
cccatcctgg tcgagctgga cggcgacgtg aacggccaca agttcagcgt gtccggcgag 1620
ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag 1680
ctgcccgtgc cctggcccac cctcgtgacc accttcacct acggcgtgca gtgcttcagc 1740
cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac 1800
gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg 1860
aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag 1920
gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc 1980
atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag 2040
gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc 2100
gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac 2160
gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactcacggc 2220
atggacgagc tgtacagatc ttaa 2244

Claims (10)

1.蛋白质,是如下(a1)至(a7)中的任意一种:
(a1)由序列表中序列1所示的氨基酸序列组成的蛋白质;
(a2)含有(a1)的融合蛋白;
(a3)在(a1)的末端连接含有标签的短肽得到的融合蛋白;
(a4)在(a1)的末端连接标签得到的融合蛋白;
(a5)由序列表中序列4所示的氨基酸序列组成的蛋白质;
(a6)将(a1)或(a2)或(a3)或(a4)或(a5)经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与植物籽粒大小相关的由其衍生的蛋白质;
(a7)获自谷子的与(a1)具有98%以上同源性且与植物籽粒大小相关的由其衍生的蛋白质。
2.权利要求1所述蛋白质的编码基因。
3.如权利要求2所述的基因,其特征在于:所述基因为如下(b1)至(b7)中任一所述的DNA分子:
(b1)编码区如序列表中序列2第412-1830位核苷酸所示的DNA分子;
(b2)编码区如序列表中序列2第412-1833位核苷酸所示的DNA分子;
(b3)序列表中序列2所示的DNA分子;
(b4)序列表中序列3所示的DNA分子;
(b5)序列表中序列5所示的DNA分子;
(b6)在严格条件下(b1)或(b2)或(b3)或(b4)或(b5)限定的DNA序列杂交且编码植物籽粒大小相关蛋白的DNA分子;
(b7)来源于谷子的与(b1)或(b2)或(b3)或(b4)或(b5)限定的DNA序列具有90%以上同源性且编码植物籽粒大小相关蛋白的DNA分子。
4.含有权利要求2或3所述基因的重组表达载体、表达盒或重组微生物。
5.权利要求1所述蛋白质的应用,为如下(c1)或(c2):
(c1)调控植物的籽粒大小;
(c2)促进植物的籽粒增大。
6.一种制备转基因植物的方法,包括如下步骤:在出发植物中导入权利要求2或3所述基因,得到转基因植物;与所述出发植物相比,所述转基因植物的籽粒增大。
7.如权利要求6所述的方法,其特征在于:所述出发植物为双子叶植物或单子叶植物。
8.一种获得籽粒增大的植物的方法,包括如下步骤:增加目的植物中权利要求1所述蛋白质的含量和/或活性,从而使植物籽粒增大。
9.权利要求2或3所述基因在培育转基因植物中的应用;所述转基因植物为籽粒增大的植物。
10.权利要求1所述蛋白质,或,权利要求2或3所述基因,或,权利要求6所述方法,在植物育种中的应用。
CN201810390345.0A 2018-04-27 2018-04-27 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用 Active CN110407921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810390345.0A CN110407921B (zh) 2018-04-27 2018-04-27 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810390345.0A CN110407921B (zh) 2018-04-27 2018-04-27 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用

Publications (2)

Publication Number Publication Date
CN110407921A true CN110407921A (zh) 2019-11-05
CN110407921B CN110407921B (zh) 2021-04-06

Family

ID=68345808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810390345.0A Active CN110407921B (zh) 2018-04-27 2018-04-27 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用

Country Status (1)

Country Link
CN (1) CN110407921B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113527455A (zh) * 2021-08-30 2021-10-22 山东大学 一种籽粒发育相关蛋白TaGSR1及其在小麦株型育种中的应用
CN114539369A (zh) * 2020-11-24 2022-05-27 中国农业大学 ZmEREB167基因在调控玉米籽粒发育中的应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015077904A1 (en) * 2013-11-29 2015-06-04 China Agricultural University Corn genes zmspl1 and zmspl2 and uses thereof
CN106892970A (zh) * 2015-12-18 2017-06-27 深圳市农科集团有限公司 一种玉米籽粒发育相关蛋白、编码基因及应用
CN106892971A (zh) * 2015-12-18 2017-06-27 深圳市农科集团有限公司 一种玉米开花和籽粒发育相关蛋白、编码基因及应用
CN107266544A (zh) * 2017-08-14 2017-10-20 中国农业科学院作物科学研究所 蛋白质SiNADP‑ME3及其编码基因在调控植物抗逆性中的应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015077904A1 (en) * 2013-11-29 2015-06-04 China Agricultural University Corn genes zmspl1 and zmspl2 and uses thereof
CN106062195A (zh) * 2013-11-29 2016-10-26 中国农业大学 玉米基因zmspl1和zmspl2及其用途
CN106892970A (zh) * 2015-12-18 2017-06-27 深圳市农科集团有限公司 一种玉米籽粒发育相关蛋白、编码基因及应用
CN106892971A (zh) * 2015-12-18 2017-06-27 深圳市农科集团有限公司 一种玉米开花和籽粒发育相关蛋白、编码基因及应用
CN107266544A (zh) * 2017-08-14 2017-10-20 中国农业科学院作物科学研究所 蛋白质SiNADP‑ME3及其编码基因在调控植物抗逆性中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHIRONG ZHOU等: "Pollen Semi-Sterility1 Encodes a Kinesin-1–Like Protein Important for Male Meiosis, Anther Dehiscence,and Fertility in Rice", 《THE PLANT CELL》 *
佚名: "PREDICTED: Setaria italica uncharacterized LOC101772127 (LOC101772127), transcript variant X1, mRNA", 《GENBANK》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114539369A (zh) * 2020-11-24 2022-05-27 中国农业大学 ZmEREB167基因在调控玉米籽粒发育中的应用
CN114539369B (zh) * 2020-11-24 2023-04-07 中国农业大学 ZmEREB167基因在调控玉米籽粒发育中的应用
CN113527455A (zh) * 2021-08-30 2021-10-22 山东大学 一种籽粒发育相关蛋白TaGSR1及其在小麦株型育种中的应用
CN113527455B (zh) * 2021-08-30 2023-10-13 山东大学 一种籽粒发育相关蛋白TaGSR1及其在小麦株型育种中的应用

Also Published As

Publication number Publication date
CN110407921B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN106164272B (zh) 修饰的植物
CN108239647B (zh) 一种控制油菜株型的基因、分子标记及应用
CN106998665A (zh) 单倍体植物的产生
CN108165554B (zh) 控制玉米叶宽基因ZmNL4及其应用
US10988775B2 (en) Wheat plants resistant to powdery mildew
CN106399323B (zh) 一种水稻叶色调控基因yl1及其应用
CN111153974A (zh) 玉米抗病基因和分子标记及其应用
CN109112146B (zh) 控制甘蓝型油菜角果长和粒重性状的基因qSLWA9的克隆与育种应用
US20220106607A1 (en) Gene for parthenogenesis
CN103613649A (zh) 水稻叶色控制基因OscpSRP54及其编码的蛋白质
CN115552038A (zh) 通过4号染色体上的qtl增强玉米对玉米大斑病的抗病性
CN112301039A (zh) 一种玉米叶斑马条纹叶色基因zb9以及与其连锁的InDel分子标记和应用
ZA200602822B (en) Isolated nucleotide sequences responsible for the tomato high pigment-1 mutant phenotypes (hp-1 and hp-1w) and uses thereof
CN107353332B (zh) 一种水稻叶绿体发育调控基因ahs1及其编码的蛋白质与应用
CN114990139A (zh) CsHLS1基因或其编码的蛋白在调控黄瓜植株器官大小中的应用
CN108441571B (zh) 玉米分子标记在鉴定和调控玉米粗缩病抗性性状中的应用
CN112210560A (zh) 一种玉米叶黄化基因oy2以及与其连锁的InDel分子标记和应用
CN112778407B (zh) 一种玉米幼苗黄白叶基因及其编码蛋白和应用
CN105441456B (zh) 一种甘蓝型油菜核不育基因Bnms4b及制备方法和应用
CN110407921A (zh) 来源于谷子的植物籽粒发育相关蛋白sgdw1及其编码基因和应用
CN109111511A (zh) 超长粒水稻的培育方法
CN116445446B (zh) 野生甘蓝糖基转移酶BoUGT76C2基因及应用
CN109929856B (zh) 水稻脂肪酸羟化酶基因OsFAH2的应用
WO2011046202A1 (ja) 植物の開花性/閉花性を支配する遺伝子およびその利用
CN109456396A (zh) 一种水稻叶片衰老和穗型调控基因hk73及其编码的蛋白质、分子标记与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220602

Address after: 037008 Zuo Tuan Zhen Jiang Guan Zhuang Cun, Guangling County, Datong City, Shanxi Province

Patentee after: Shanxi Dongfang Wuhua Agricultural Technology Group Co.,Ltd.

Address before: North bank 214, Germplasm Conservation Center, Chinese Academy of Agricultural Sciences, 12 Zhongguancun South Street, Haidian District, Beijing 100081

Patentee before: INSTITUTE OF CROP SCIENCES, CHINESE ACADEMY OF AGRICULTURAL SCIENCES

TR01 Transfer of patent right