CN115894644A - 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用 - Google Patents

控制高粱种子包壳性状的gc1蛋白及其编码基因的应用 Download PDF

Info

Publication number
CN115894644A
CN115894644A CN202111158546.6A CN202111158546A CN115894644A CN 115894644 A CN115894644 A CN 115894644A CN 202111158546 A CN202111158546 A CN 202111158546A CN 115894644 A CN115894644 A CN 115894644A
Authority
CN
China
Prior art keywords
sequence
protein
plant
sequence table
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111158546.6A
Other languages
English (en)
Inventor
谢旗
谢鹏
吴耀荣
唐三元
李超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Genetics and Developmental Biology of CAS
Original Assignee
Institute of Genetics and Developmental Biology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Genetics and Developmental Biology of CAS filed Critical Institute of Genetics and Developmental Biology of CAS
Priority to CN202111158546.6A priority Critical patent/CN115894644A/zh
Publication of CN115894644A publication Critical patent/CN115894644A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明公开了控制高粱种子包壳性状的GC1蛋白及其编码基因的应用。本发明所要保护的一个技术方案是蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在调控植物种子包壳性状中的应用。所述蛋白质为氨基酸序列为序列表中序列2的蛋白质或序列2的第78‑275位的蛋白质或序列表中序列5的蛋白质。实验证明,GC1蛋白负调控种子包壳性状。过表达高粱GC1蛋白N端的G蛋白γ亚基或者敲除高粱GC1蛋白的C端均可降低植物种子的颖壳长度以及包壳程度。GC1蛋白在指导作物裸粒品种的育种和分子改良上具有广泛的应用前景。

Description

控制高粱种子包壳性状的GC1蛋白及其编码基因的应用
技术领域
本发明涉及植物生物技术领域,具体涉及控制高粱种子包壳性状的GC1蛋白及其编码基因的应用。
背景技术
作物驯化过程中一个极具标志性事件之一是种子包壳程度的降低。在早期自然环境中,作物野生种的种子被颖壳所完全包裹的特性可以防止被鸟类啄食和增加对病虫害的抗性,从而在一些早期极端恶劣的条件下保持自身的繁衍,表现出对环境的适应性(Tanksley and McCouch,1997)。但这种包壳习性极大地不方便现代人类对作物种子的去壳脱粒过程。种子带壳既影响生产加工使用,同时也降低机械化脱粒和播种时的种子发芽率、以及无法进行种子包衣等,所以在漫长的进化过程当中作物的种子逐渐地被选择为颖壳包被度降低,籽粒出现裸露的特征(Feuillet et al.,2008;Tanksley and McCouch,1997)。
高粱(Sorghum bicolor L.Moench)是世界第五大粮食作物,也是人类最早栽培的重要谷类作物之一,属于禾本科,起源于非洲(Gilbert,2009)。迄今以来,由于其独特的抗旱、耐涝和耐盐碱能力仍然为非洲撒哈拉以南及亚洲的干旱和半干旱地区超过五亿人提供主要粮食来源,并被广泛地应用到饲料、酿酒和生物能源领域当中(Paterson et al.,2009;Xie and Xu,2019)。高粱种质资源的性状变异非常丰富,遗传多样性较高(Chala etal.,2011;Deu et al.,2006)。这些特点使高粱成为禾本科作物和C4植物研究的模式作物。
近一个世纪以来,高粱的包壳性状一直是育种家对高粱进行亚种分类的主要参考性状。但至今高粱包壳性状的遗传学基础和分子机制研究仍然是一个空白,因此定位克隆高粱驯化过程中的包壳基因,解析颖壳发育的分子机制对培育“裸粒”品种具有重要理论指导意义,同时也为高粱起源与驯化提供分子依据。
发明内容
本发明所要解决的技术问题是如何改良植物的种子包壳性状或如何进行植物裸粒育种。
为了解决上述技术问题,本发明首先提供了蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质的应用。所述应用可为下述任一种:
P1、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在调控植物种子包壳性状中的应用。
P2、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在抑制植物种子包壳性状中的应用。
P3、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在植物育种中的应用。
P4、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在植物种子包壳性状改良中的应用。
所述蛋白质可为如下A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)、A11)或A12)的蛋白质:
A1)氨基酸序列是序列表中序列2的蛋白质;
A2)氨基酸序列是序列表中序列2的第78-275位的蛋白质;
A3)氨基酸序列是序列表中序列5的蛋白质;
A4)氨基酸序列是序列表中序列5的第25-91位的蛋白质;
A5)氨基酸序列是序列表中序列8的蛋白质;
A6)氨基酸序列是序列表中序列10的蛋白质;
A7)氨基酸序列是序列表中序列12的蛋白质;
A8)氨基酸序列是序列表中序列14的蛋白质;
A9)氨基酸序列是序列表中序列16的蛋白质;
A10)氨基酸序列是序列表中序列24的蛋白质;
A11)氨基酸序列是序列表中序列26的蛋白质;
A12)将A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的且具有相同功能的由A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)衍生的或与A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A13)在A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)的N末端或/和C末端连接蛋白标签得到的融合蛋白质。
所述蛋白质可来源于高粱或谷子。
所述A12)具体可为含有氨基酸序列是序列表中序列1的第22-第88位氨基酸(G蛋白γ亚基结构域)并将A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的且具有相同功能的由A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)衍生的或与A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质。
上文所述一个以上氨基酸残基具体可为十个以内的氨基酸残基。
上述应用中,调控所述蛋白质活性或含量的物质可为调控所述蛋白质的编码基因表达的物质。
上述蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述蛋白质中,所述蛋白标签(protein-tag)是指利用DNA体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述蛋白标签可为Flag标签、His标签、MBP标签、HA标签、myc标签、GST标签和/或SUMO标签等。
上述蛋白质中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述蛋白质中,所述80%以上的同一性可为至少81%、82%、85%、86%、88%、90%、91%、92%、95%、96%、98%、99%或100%的同一性。
为了解决上述技术问题,本发明还提供了与上文所述蛋白质相关的生物材料的下述任一种应用:
Q1、所述生物材料在调控植物种子包壳性状中的应用,
Q2、所述生物材料在抑制植物种子包壳性状中的应用,
Q3、所述生物材料在植物育种中的应用,
Q4、所述生物材料在植物裸粒品种改良中的应用。
所述生物材料可为下述B1)至B9)中的任一种:
B1)编码上文所述蛋白质的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因植物细胞系、或含有B2)所述表达盒的转基因植物细胞系;
B6)含有B1)所述核酸分子的转基因植物组织、或含有B2)所述表达盒的转基因植物组织;
B7)含有B1)所述核酸分子的转基因植物器官、或含有B2)所述表达盒的转基因植物器官;
B8)提高或促进上文所述蛋白质的编码基因的表达或上文所述蛋白质的活性的核酸分子;
B9)含有B8)所述核酸分子的表达盒、重组载体、重组微生物或转基因植物细胞系。
上述应用中,B1)所述核酸分子可为如下b1)、b2)、b3)、b4)、b5)、b6)、b7)、b8)、b9)、b10)或b11)所示的所述蛋白质的编码基因:
b1)编码链的编码序列是序列表中序列1的核苷酸的DNA分子或序列3的cDNA分子;
b2)编码链的编码序列是序列表中序列4的核苷酸的DNA分子或序列6的cDNA分子;
b3)核苷酸是序列表中序列6的第1-372位cDNA分子;
b4)编码链的编码序列是序列表中序列7核苷酸的cDNA分子或DNA分子;
b5)编码链的编码序列是序列表中序列9核苷酸的cDNA分子或DNA分子;
b6)编码链的编码序列是序列表中序列11核苷酸的cDNA分子或DNA分子;
b7)编码链的编码序列是序列表中序列13核苷酸的cDNA分子或DNA分子;
b8)编码链的编码序列是序列表中序列15核苷酸的cDNA分子或DNA分子;
b9)编码链的编码序列是序列表中序列23核苷酸的cDNA分子或DNA分子;
b10)编码链的编码序列是序列表中序列25核苷酸的cDNA分子或DNA分子;
b11)与b1)、b2)、b3)、b4)、b5)、b6)、b7)、b8)、b9)或b10)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
上述生物材料中,B2)所述的含有核酸分子的表达盒,是指能够在宿主细胞中表达上述应用中所述蛋白质的DNA,该DNA不但可包括启动蛋白编码基因转录的启动子,还可包括终止蛋白编码基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用于本发明的启动子包括但不限于:组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。
可用现有的植物表达载体构建含有所述蛋白编码基因表达盒的重组表达载体。所述植物表达载体包括双元农杆菌载体和可用于植物微弹轰击的载体等。如pAHC25、pWMB123、pBin438、pCAMBIA1302、pCAMBIA2301、pCAMBIA1301、pCAMBIA1300、pBI121、pCAMBIA1391-Xa或pCAMBIA1391-Xb(CAMBIA公司)等。所述植物表达载体还可包含外源基因的3’端非翻译区域,即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3’端,如农杆菌冠瘿瘤诱导(Ti)质粒基因(如胭脂碱合成酶基因Nos)、植物基因(如大豆贮存蛋白基因)3’端转录的非翻译区均具有类似功能。使用本发明的基因构建植物表达载体时,还可使用增强子,包括翻译增强子或转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。
上述生物材料中,所述重组微生物具体可为酵母,细菌,藻和真菌。
为了解决上述技术问题,本发明还提供了调控基因表达的物质在培育裸粒植物中的应用。所述基因编码上文所述的蛋白质。
上文中,所述调控基因表达的物质可为进行如下6种调控中至少一种调控的物质:1)在所述基因转录水平上进行的调控;2)在所述基因转录后进行的调控(也就是对所述基因的初级转录物的剪接或加工进行的调控);3)对所述基因的RNA转运进行的调控(也就是对所述基因的mRNA由细胞核向细胞质转运进行的调控);4)对所述基因的翻译进行的调控;5)对所述基因的mRNA降解进行的调控;6)对所述基因的翻译后的调控(也就是对所述基因翻译的蛋白质的活性进行调控)。
上文中,所述调控基因表达可为提高或促进所述基因表达。所述提高或促进所述基因表达可为通过过表达所述基因实现。
上述应用中,所述调控基因表达的物质可为增强或提高所述基因表达的试剂。
为了解决上述技术问题,本发明还提供了一种培育裸粒植物的方法。所述方法包括提高或促进目的植物中上文所述蛋白质的活性或含量或/和上文所述蛋白质的编码基因的表达量或/和敲除上文中所述蛋白质的C端,从而得到裸粒植物。
上述方法中,所述提高或促进目的植物中上文所述蛋白质的活性或含量或/和上文所述蛋白质的编码基因的表达量可通过将上文所述蛋白质的编码基因导入所述目的植物实现。
上述方法中,其中所述蛋白的编码基因可先进行如下修饰,再导入目的植物中,以达到更好的表达效果:
1)与各种植物表达的启动子连接,以利于其在植物中的表达;所述启动子可包括组成型、诱导型、时序调节、发育调节、化学调节、组织优选和组织特异性启动子;启动子的选择将随着表达时间和空间需要而变化,而且也取决于靶物种;例如组织或器官的特异性表达启动子,根据需要受体在发育的什么时期而定;尽管证明了来源于双子叶植物的许多启动子在单子叶植物中是可起作用的,反之亦然,但是理想地,选择双子叶植物启动子用于双子叶植物中的表达,单子叶植物的启动子用于单子叶植物中的表达;
2)与适合的转录终止子连接,也可以提高本发明基因的表达效率;例如来源于CaMV的tml,来源于rbcS的E9;任何已知在植物中起作用的可得到的终止子都可以与本发明基因进行连接;
3)引入增强子序列,如内含子序列(例如来源于Adhl和bronzel)和病毒前导序列(例如来源于TMV,MCMV和AMV)。
上述方法中,所述裸粒植物可为转基因植物,也可为通过杂交等常规育种技术获得的植物。
上述方法中,所述转基因植物理解为不仅包含第一代到第二代转基因植物,也包括其子代。对于转基因植物,可以在该物种中繁殖该基因,也可用常规育种技术将该基因转移进入相同物种的其它品种,特别包括商业品种中。所述转基因植物包括种子、愈伤组织、完整植株和细胞。
上文中所述植物可为下述任一种:
C1)双子叶植物,
D1)单子叶植物,
D2)禾本目植物,
D3)禾本科植物,
D4)高粱属植物,
D5)高粱,
E1)狗尾草属植物,
E2)谷子。
为了解决上述技术问题,本发明还提供了检测高粱基因组中InDel-1位点的多态性、InDel-2位点的多态性、InDel-3位点的多态性和/或SNP3位点的多态性的物质的下述任一种应用:
F1)在鉴定或辅助鉴定高粱种子包壳性状中的应用;
F2)在高粱育种或品质改良中的应用。
所述InDel-1位点的多态性可对应于下述3种情况:1-1)序列表中序列1的第4158位核苷酸为G;1-2)序列表中序列1的第4157-4158位核苷酸之间插入5’-GTGGC-3’这5个核苷酸;1-3)序列1的第4158位核苷酸G缺失;
所述SNP3位点的多态性,可对应于序列表中序列1的第4243位核苷酸为A或C;
所述InDel-2位点的多态性,可对应于序列表中序列1的第4170位核苷酸为C或在序列表中序列1的第4169-4170位核苷酸之间插入核苷酸是序列表中序列13第……-……位的165bp的DNA片段的插入;
所述InDel-3位点的多态性,可对应于序列表中序列1的第4255位核苷酸为C或将序列表中序列1的第4255位核苷酸缺失。
上文中所述检测高粱基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性(或基因型)的物质可为如下H1)、H2)或H3):
H1)所述检测高粱基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性的物质含有扩增包括所述InDel-1、InDel-2、InDel-3或SNP3位点在内的高粱基因组DNA片段的PCR引物;
H2)所述检测小麦基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性的物质为含有H1)所述PCR引物的PCR试剂;
H3)含有H1)所述PCR引物或H2)所述PCR试剂的试剂盒。
上文所述PCR引物可为P1、P2或P3:
P1、所述PCR引物为由核苷酸序列是序列表中序列17的单链DNA和核苷酸序列是序列表中序列18的单链DNA组成的引物组;
P2、所述PCR引物为由核苷酸序列是序列表中序列19的单链DNA和核苷酸序列是序列表中序列20的单链DNA组成的引物组;
P3、所述PCR引物为由核苷酸序列是序列表中序列21的单链DNA和核苷酸序列是序列表中序列22的单链DNA组成的引物组。
本发明阐述了高粱控制包壳性状的关键主效基因GC1的图位克隆,检测到了GC1基因发生了五种不同类型的自然移码突变;发现将高粱和谷子GC1基因过表达发现高粱出现了更短的颖壳长度以及显著降低的包壳程度;通过对高粱和谷子的GC1基因进行编辑敲除得到的GC1-KO植株和SiGC1-KO植株进行表型观察发现,基因编辑植物的颖壳长度以及包壳程度显著增加。因此,高粱GC1基因和谷子的SiGC1基因以及G蛋白γ亚基保守结构域均负调控种子包壳性状。此外,本发明还揭示了高粱GC1基因的一个截短突变的等位基因gc1-a如何降低高粱种子包壳性状的分子机制。高粱GC1和谷子的SiGC1蛋白在指导作物裸粒品种的育种和分子改良上具有广泛的应用前景。
附图说明
图1为高粱种子包壳程度与高粱颖壳长度呈极显著的正相关性。
图2为结合GWAS和图位克隆的方法首次克隆到控制高粱种子包壳的关键主效基因GC1。
图3为GC1基因产生的五种自然变异的突变形式以及编码对应的蛋白结构示意图。
图4为GC1基因产生的五种自然变异与颖壳长度、包壳程度呈极显著性的相关。
图5为禾本科作物中GC1基因和其同源基因所编码的蛋白序列比对。
图6为基于GC1基因的近等基因系构建以及GC1基因的时空表达特性。
图7为高粱GC1基因的过表达转基因株系GC1-OE和GC1基因编辑敲除突变体株系GC1-KO的构建和鉴定。
图8为谷子SiGC1基因的过表达转基因株系SiGC1-OE和SiGC1基因编辑敲除的突变体株系SiGC1-KO的构建和鉴定。
图9为高粱GC1基因的过表达转基因株系GC1-OE和GC1基因编辑敲除突变体株系GC1-KO以及谷子SiGC1基因的过表达转基因株系SiGC1-OE和SiGC1基因编辑敲除的突变体株系SiGC1-KO的种子包壳性状相关表型。
图10为高粱的近等基因系和高粱自交系的种子包壳相关性状表型。
图11为用于参考的六种典型GC1基因单倍型在第五个外显子区域的分型。
图12为用于试测的24份高粱品种的信息。
图13为用于参考的两对SSR标记在24份试测的高粱品种的多态性鉴定。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、高粱包壳性状基因GC1的发现
1.1高粱包壳性状的GWAS分析
首先对915份高粱种质资源材料的包壳相关性状进行了的田间表型统计,发现高粱的种子包壳程度与颖壳长度呈明显的正相关性(相关性系数R2=0.9774)(图1)。同时发现我们发现野生种全部表现出非常高的包壳程度;而栽培品种中,只有大约20%的栽培品种表现出非常高的包壳程度,却有接近40%的栽培品种表现出较低或非常低包壳程度。这表明高粱栽培驯化过程中非常高的包壳程度受到了驯化选择。
接着对其中一个352份籽粒高粱的自然群体于2016年和2017年,在北京顺义区(39.5°N,116.4°E)和海南三亚市(18.3°N,108.8°E)两个地点,每个地点进行两次重复地种植在田间,并在成熟期之后统计每个高粱自交系包壳性状的表型数据。种植方式为行长4米,行宽1米。将包壳性状的表型通过与该自然群体中的82,430个高度可信的SNP标记进行全基因组关联分析(GWAS)。结果显示,在高粱的1号、2号和3号染色体上总共检测到了三个控制包壳性状的主效位点(-log10(p)>6.0)(见图2中a)。
1.2控制高粱包壳性状的主效基因GC1的图位克隆
为了深入地解析控制高粱包壳性状的遗传基础,在2016年-2018年于海南三亚佛罗镇农场种植了五个不同的人工分离群体。其中包括三个F2群体,其亲本材料分别为三个不同的、表现为非常高包壳程度的野生种和对应的三个不同的、表现为非常低包壳程度的栽培种材料。也包括一个来源于亲本材料SN010和M-81E组配的重组自交系(RIL)群体的F5代和F6代群体。通过调查其各自群体单株的颖壳长度表型和包壳性状表型,结合自己开发的SSR标记以及InDel标记构建了各自群体的分子标记遗传连锁图谱,结果显示在高粱1号、2号、3号和6号染色体上各检测到一个控制颖壳长度的QTL,分别命名为:qGL1、qGL2、qGL3和qGL4。对于包壳性状(按照质量性状),我们在1号和3号染色体上各检测到一个单主效位点,分别命名为:qGC1和qGC2。该位点与GWAS所检测到的1号染色体上的主效位点qGC1是共定位的,表明二者可能是同一个位点,因此也命名为qGC1。
在来源于双亲SN010和M-81E组配的F7代和F8代一共1678个单株当中,通过在初定位区间的基础上精细加密的34个分子标记,筛选出4种不同类型的、一共40个交换单株,最终将qGC1的区间精细定位缩小到分子标记MSR0069和MSN0013之间的一个大约58kb的区域(图2中b)。
在上述精细定位最终的58kb区域中,注释了5个候选基因。通过对高粱幼穗中进行基因表达量的检测发现,相对地后三个基因在穗部出现了不同程度的较高表达(图2中c)。另外选取了57个高粱品种中,对该候选的58kb区间的所有序列变异进行检测。最终在该区间获得到了257个SNP位点和103个InDel位点,并将其与包壳性状的表型进行相关性分析。结果表明,在第三个基因内部的第五个外显子区域有一个InDel位点InDel-62915822,其序列变异与包壳性状表型变异呈最显著的相关性(p=1.4E-33)(图2中d)。因此,我们初步预测第三个候选基因即为控制包壳性状的单主效基因GC1(Glume Coverage 1)。
1.3高粱GC1基因发生的五种不同类型的自然变异与包壳性状显著性相关
对646份高粱种质资源材料的GC1基因的五个外显子区域分别进行PCR扩增并直接进行测序,来进一步分析检测高粱GC1基因的单倍型,扩增及测序引物见表3。采用DNAMAN(v8.0)软件设计用于扩增GC1基因全长的引物共三对(表1),引物由华大基因生物科技有限公司合成,基因型分析中用于PCR扩增的Taq酶MasterMix购自康为世纪公司(货号:4×CW0682D)。PCR反应体系如表4所示,PCR反应在赛默飞世尔科技(中国)有限公司96孔快速热循环仪进行。PCR反应程序为:94℃预变性5min;94℃变性30s、58℃退火30s、72℃延伸1min30s,扩增35个循环;72℃保温10min;4℃保存。PCR产物的直接测序由睿博科技生物科技有限公司完成。
表1.GC1基因外显子区域扩增引物序列
引物名称 引物序列(5’-3’)
Primer-F1 CTGCACCCCTCCACTGTACTACTG
Primer-R1 CTCCGGGTAGTAGCATGCACAC
Primer-F2 TGCGTAACGTACCAGCTGCTAG
Primer-R2 GATAGCGTTTCAGTTCTCGGCC
Primer-F3 ACGCCTGAAAAGTTGACAGCTG
Primer-R3 GCGCGTGTGCTACTGGTAATG
表2.GC1基因分型的PCR扩增反应体系
试剂 50μL体系
<![CDATA[ddH<sub>2</sub>O]]> 19.5μL
2×Taq MasterMix Buffer 25μL
dNTP Mix(2mM) 10μL
Primer-F(10μM) 1μL
Primer-R(10μM) 1μL
DMSO 2.5μL
DNA模板(100ng) 1μL
测序结果最终检测到了高粱GC1基因的编码区发生了8处自然变异位点,包括4处单碱基突变和4处不同类型的插入缺失突变。高粱GC1基因包括5个外显子和4个内含子,GC1基因的基因组核苷酸序列见序列表中序列1所示的DNA分子。4处单碱基突变位点分别为:在第100位处的的SNP1(A-G的突变,对应序列表中序列1的第100位,对应的氨基酸突变为:丝氨酸-甘氨酸)、在第4151位处的SNP2(A-G的突变,对应序列表中序列1的第4151位,对应的氨基酸为同义突变)、在第4243位处的SNP3(C-A的突变,对应序列表中序列1的第4243位,对应的突变为翻译提前终止突变)和在第4358位处的SNP4(T-G的突变,对应序列表中序列1的第4358位,由于提前终止,不编码氨基酸)。4处不同类型的插入缺失突变分别为:在第4158位处的InDel-1(GTGGC插入突变,对应序列表中序列1的第4158位,会导致翻译提前终止;或一个碱基G的缺失,会导致翻译提前终止)、在第4170bp位的InDel-2(大片段165bp的插入突变,对应序列表中序列1的第4170位,会导致翻译的提前终止)、第4255bp位处的InDel-3(一个碱基C的缺失,对应序列表中序列1的第4255位,会导致移码突变)和在第4285位处的InDel-4(一个CGGCGGCTG的缺失,对应序列表中序列1的第4285位,会导致非移码突变)。上述8处自然变异位点中,有五处导致移码突变的变异类型,分别命名为:gc1-a单倍型(InDel-1中的5个碱基GTGGC插入突变)、gc1-b单倍型(InDel-1中的1个碱基G缺失突变)、gc1-c单倍型(SNP3中的碱基C-A替换)、gc1-d单倍型(InDel-2的165bp插入)、和gc1-e单倍型(InDel-3碱基C缺失)(图3)。即所述gc1-a单倍型包含一个InDel位点InDel-1(序列表中序列1的第4158位核苷酸后的5个碱基GTGGC的插入);所述gc1-b单倍型包含一个InDel位点InDel-1(对应序列表中序列1的第4158位核苷酸G的缺失);所述gc1-c单倍型包含一个SNP位点SNP3(对应序列表中序列1的第4243位核苷酸为A);所述gc1-d单倍型包含一个InDel位点InDel-2(对应序列表中序列3的第4170位核苷酸后的大片段165bp的插入);所述gc1-e单倍型包含一个InDel位点InDel-3(序列表中序列1的第4255位核苷酸C的缺失)。
因此,InDel-1位点的多态性对应于下述3种情况:1-1)序列表中序列1的第4158位核苷酸为G;1-2)序列表中序列1的第4157-4158位核苷酸之间插入5’-GTGGC-3’这5个核苷酸;1-3)序列1的第4158位核苷酸G缺失。SNP3位点的多态性,对应于序列表中序列1的第4243位核苷酸为A或C。InDel-2位点的多态性,对应于序列表中序列1的第4170位核苷酸为C或在序列表中序列1的第4169-4170位核苷酸之间插入核苷酸是序列表中序列27所示的165bp的DNA片段。InDel-3位点的多态性,对应于序列表中序列1的第4255位核苷酸为C或将序列表中序列1的第4255位核苷酸缺失。
gc1-a、gc1-b、gc1-c和gc1-d这前四种变异类型都是在基因的3’端发生了移码突变,并在C端造成了提前终止的截短类型;而gc1-e这种变异类型同样在基因的3’端发生了移码突变,但在C端预测了一串未知功能的氨基酸。将GC1(序列表中序列1的核苷酸序列所示的单倍型)、gc1-a、gc1-b、gc1-c、gc1-d和gc1-e这六种典型的单倍型分别与高粱品种材料的包壳性状、颖壳长度、粒长、粒宽和千粒重进行了相关性分析(图4)。结果显示在第4158位处的变异位点InDel-1与颖壳长度呈最明显的相关性(p=1.80E-23),且与包壳程度也表现出最明显的相关性(p=5.27E-14)。当把GC1单倍型和另外组合起来的五种突变单倍型(gc1-a/b/c/d/e)进一步计算包壳性状的相关性发现,组合单倍型与颖壳长度的相关性(p=9.00E-26)且与包壳程度的相关性(p=2.15E-15)比任意一种突变单倍型的相关性都要更高。然而,这些单倍型变异与产量相关性状,包括粒长、粒宽和千粒重的相关性程度并不高。以上结果表明在GC1基因中发生移码突变的这些变异位点极有可能是导致高粱包壳程度降低的关键原因。
1.4、GC1基因的基因结构和时空表达模式
高粱GC1基因编码的CDS核苷酸序列如序列表中序列3所示。GC1基因的5’端编码一个非典型的G蛋白γ亚基,GC1蛋白序列包含198个氨基酸(序列表中序列2的第78-275位所示)。GC1蛋白的N端从第22位到88位(序列表序列2的第99-165位)氨基酸位置预测了一个Gγsubunit-like的、高度保守的结构域。而GC1蛋白的C端没有预测到任何保守结构域,且在不同物种中的同源蛋白氨基酸相似度小于10%,表明GC1蛋白的C端氨基酸序列保守程度很低(图5)。
由于GC1基因发生的自然变异都是在其蛋白C端发生了不同类型的移码突变,我们首先构建了基于GC1基因的近等基因系(NIL系)材料。即在来源于双亲材料SN010和M-81E自交的第F9代群体个体中,通过侧翼选择标记MSR0069和MSN0013鉴定出候选区间qGC1位点为杂合基因型的单株,继续自交一代至F10代分离出58kb大小的qCG1位点为纯合基因型的近等基因系材料。来源于亲本SN010遗传背景的纯合GC1基因型的单株,命名为NIL-GC1;来源于亲本M-81E遗传背景的的纯合gc1-a基因型的单株,命名为NIL-gc1-a。同时通过高粱全基因组277对核心SSR分子标记鉴定这对NIL系的背景基因型,发现除58kb区间基因型不同之外,位于其余基因组位置的标记基因型均为一致。表明该NIL是一对构建成功的基于GC1/gc1-a基因等位变异的遗传材料(图6中a所示)。
利用近等基因系NIL-GC1和NIL-gc1-a材料对各自的GC1等位基因进行实时荧光定量PCR检测(引物序列见表5,定量PCR反应体系见表6),结果表明GC1和gc1-a基因均在幼穗时期呈现出特异性地高表达。其中在幼穗的3-6cm时期,表达量达到了峰值;但在开花期、灌浆期和成熟期表达量相对很小;在其它组织如根、茎和叶中几乎不表达(图6中b所示)。
表3.GC1等位基因和内参基因荧光定量PCR引物设计序列
引物名称 引物序列(5’-3’)
GC1-qPCR-F CTTCCTCGAGGGCGAAATAAG
GC1-qPCR-R CAGCTCTTTGCTCGGAACTTC
EIF-qPCR-F CAACTTTGTCACCCGCGATGA
EIF-qPCR-R TCCAGAAACCTTAGCAGCCCA
实施例2、GC1基因在转基因和基因编辑植物中的功能和应用。
首先提取处于幼穗期的高粱品种Wheatland中(来源于美国种质资源库USDA惠赠,相关文献:Population genomic and genome-wide association studies ofagroclimatic traits in sorghum.(2013).Proceedings of the National Academy ofScience of the United States of America 110:453-458.)的幼穗部位的RNA,以获得的RNA为模板反转录得到cDNA。然后以获得的cDNA为模板,采用引物F:5’-ATGGCGGCGGCGCCGAG-3’和R:5’-TCAGCCGCGGCGCGCA-3’进行PCR扩增,得到PCR扩增产物进行测序验证。
测序结果表明:PCR扩增产物的核苷酸序列为序列表中序列3,即GC1基因cDNA的CDS序列,其编码的GC1蛋白的氨基酸序列为序列表中序列2的第78-275位所示。
2.1 GC1基因过表达植株的构建
2.1.1重组表达载体pCambia2300-Myc-GC1的构建
将扩增得到的GC1基因CDS序列(序列表中序列3)通过同源重组的方式插入到目标植物表达载体pCAMBIA2300-Ubi-Myc(本实验室保存,是文献1中第2页右栏Materials andmethods中Constructs and transformation的第1-3行所述的载体,即在pCAMBIA2300商业载体上添加了Ubi启动子和OCS终止子,同时还带有Myc标签序列的重组载体,公众可从申请人处获得以重复本发明。文献1:Liu Y,Sun J,Wu Y.Arabidopsis ATAF1 enhances thetolerance to salt stress and ABA in transgenic rice.J Plant Res.2016Sep;129(5):955-962.doi:10.1007/s10265-016-0833-0.Epub 2016May 23.PMID:27216423.)中,即首先设计该载体用于同源重组通用的接头引物:酶切位点Spe1附近的接头引物和酶切位点BamH1附近的接头引物(表5)。然后以GC1基因的CDS为模板,用接头引物扩增得到含有接头引物的GC1基因的CDS序列。用限制性内切酶Spe1和BamH1(限制性酶切酶购买自NEB公司)在37℃条件下酶切2个小时(酶切体系见表4)。将PCR产物和载体酶切产物分别纯化后,采用全式金公司的无缝克隆试剂盒(CU101-01)进行同源重组。无缝克隆的反应体系:加入5μL 2×Assembly mix,将带接头的PCR基因片段与酶切后的载体按照2:1的摩尔比混合,加蒸馏水补足至10μL,混匀后50℃反应15min,4℃保存。取1μL连接产物加入到冰上即将融化的XL1-blue大肠杆菌感受态中,混匀后冰浴30min,42℃热激30s,迅速冰浴2min,加入1mL的空LB液体培养基,37℃摇1h后,涂在固体含卡那霉素抗性的固体培养基上过夜培养12-16h,挑取1-5个单克隆菌斑进行菌液测序。各过表达载体构建的接头引物如表5所示。将GC1基因连接至pCAMBIA2300-Ubi-Myc载体,得到加Myc标签的过表达融合载体pCambia2300-Myc-GC1。pCambia2300-Myc-GC1含有序列表中序列3所示的GC1基因的CDS序列,能表达序列表中序列2所示的带Myc标签的GC1蛋白Myc-GC1。
表4.酶切体系
Figure BDA0003289267990000101
Figure BDA0003289267990000111
表5.用于同源重组构建过表达载体pCambia2300-Myc-GC1的接头引物
引物名称 引物序列(5’-3’)
GC1-JT-F gaggacttgaattcgactagtATGGCGGCGGCGCCGAG
GC1-JT-R caggtcgactctagaggatccTCAGCCGCGGCGCGCA
2.1.2重组农杆菌的获得
取1μg制备的重组载体质粒pCambia2300-Myc-GC1转化农杆菌EHA105的感受态细胞,28℃条件下于YEP培养基(含卡那霉素50mg/L)上培养两天,挑选阳性克隆,利用引物F:5’-GATGGCATATGCAGCATCTATTC-3’和R:5’-ATCATAGGCGTCTCGCATATCTC-3’进行PCR鉴定(产物大小为1148bp)。将经PCR鉴定得到的阳性菌命名为重组农杆菌EHA105/pCambia2300-Myc-GC1,-80℃保存。
经鉴定,重组农杆菌EHA105/pCambia2300-Myc-GC1含有cDNA的CDS核苷酸序列为序列表中序列3的GC1基因。
2.1.3GC1基因过表达植株的获得
将重组农杆菌EHA105/pCambia2300-Myc-GC1通过农杆菌介导的方法转入到籽粒高粱的受体材料Wheatland中。
(1)高粱受体材料的准备:
在温室中种植Wheatland高粱植株,待生长至开花期15天左右,将穗子剪断,并在无菌超净台台中,尽可能地将灌浆的籽粒中的幼胚挤出,均匀地放置到愈伤培养基上进行愈伤组织的培养。
(2)侵染菌液的制备:
将保存于-80℃的2.1.2中制备得到的重组农杆菌EHA105/pCambia2300-Myc-GC1在添加Kan的YEP固体培养基中划线培养。长出的单菌落接种于10mL YEP液体培养基(含有Kan)中进行一次活化(28℃,220rpm震荡过夜)。取一次活化的菌液按1:1000的比例接种于80mL YEP液体培养基(含Kan),28℃,220rpm震荡培养至OD600nm为0.8-1.0。
(3)侵染过程:将达到所需OD值的重组农杆菌菌液转移至50mL离心管中,5000rpm离心10min以富集菌体。然后用重悬buffer将其菌体充分重悬,并将长出的愈伤组织加入到重悬的侵染液中,进行侵染转化,侵染后的愈伤转移到生根培养基(含有NPT II)上,进行生根培养,若出现培养基褐化,则需要多次转移生根培养基。
(4)将侵染后的高粱植株正常培养至成熟后,收获其成熟后的种子即为T0代转基因种子。在T0代共获得到了59株幼苗,通过PCR鉴定和基因荧光定量检测到10株为阳性转基因株系。qPCR的结果显示GC1-OE的这10个株系中的5个株系(图7中a的GC1-OE-1~GC1-OE-5)GC1基因表达量比野生型品种Wheatland高出106倍到286倍之间(图7中a)。qPCR定量引物和以EIF基因作为相对定量的内参基因序列见表3。
2.1.5表型观察:
在成熟期时,我们观察到所有的GC1-OE株系均表现出比Wheatland表现出更短的颖壳长度以及显著降低的包壳程度(图9中a-c),表明GC1是一个负调控高粱包壳程度的基因。
2.2GC1基因突变体植株的构建
2.2.1重组pYLCRISPR/Cas9Pubi-B-GC1载体的构建
利用基因编辑技术(pYLCRISPR/Cas9Pubi-B和pYLsgRNA-OsU6a/LacZ原始载体由华南农业大学刘耀光老师惠赠,Ma X,Zhang Q,Zhu Q,et al..A Robust CRISPR/Cas9System for Convenient,High-Efficiency Multiplex Genome Editing in Monocot andDicot Plants.Mol Plant.2015Aug;8(8):1274-84.doi:10.1016/j.molp.2015.04.007.Epub 2015Apr 24.PMID:25917172.)对高粱受体材料品种Wheatland中的GC1基因5’端(GC1蛋白N端)进行了敲除。该pYLCRISPR/Cas9Pubi-B的原始双元载体将设计优化后的Cas9p基因插入到含有核定位信号NLS的载体骨架pCAMBIA-1300(ACCESSION:AF234296)中。其改造后的Cas9p基因表现为5’端的GC含量较高的特征,且打靶效率更高,也能得到更多的简单突变。
具体操作方法如下:
1)菌种活化、质粒提取制备:将pYLCRISPR/Cas9Pubi-B菌种(TOP10F)和pYLsgRNA-OsU6a/LacZ菌种(DH10B)分别在含有卡那霉素(25μg/mL)和氨苄青霉素(50μg/mL)平板培养基划线培养过夜,挑取单菌落进行扩大培养用于提取质粒。
2)靶点接头制备:将设计合成的接头引物GC1-Target-F:5’-GCCGCAAGTCGCCGCCTGCCTCGC-3’和GC1-Target-R:5’-AAACGCGAGGCAGGCGGCGACTTG-3’加ddH2O溶解成100μM母液,各取左右引物混合并稀释到终浓度1μM。在PCR仪上进行加热(约90℃30s),于室温冷却完成退火从而形成双链的靶点接头。
3)sgRNA载体酶切:取pYLsgRNA-OsU6a/LacZ质粒1μg,在25μL酶切反应体系(如表4)中用10U Bsa I酶切20min,冷冻保存。
4)sgRNA表达盒连接反应:酶切过的质粒与对应接头连接反应(10μL体系):1μL 10×T4DNA ligase Buffer、10ng酶切后的质粒、0.05μM接头引物、18U T4 DNA ligase,用超纯水补足到10μL;室温连接20min。
5)第一轮扩增:15μL反应体系:取0.5μL连接产物为模板,使用正向引物U-F:5’-CTCCGTTTTACCTGTGGAATCG-3’和接头反向引物gRNA-R:5’-CGGAGGAAAATTCCATCCAC-3’,各0.2μM,1μL KOD Fx Neo酶;PCR程序为:30个循环:94℃10s,60℃15s,68℃20s。
6)第二轮扩增:取第一轮PCR产物稀释10倍后,再取1μL为第二轮PCR的模板。同样使用适量KOD Fx Neo酶,用正向引物B1’:5’-TTCAGAggtctcTctcgCACTGGAATCGGCAGCAAAGG-3’和反向引物BL:5’-AGCGTGggtctcGaccgGGTCCATCCACTCCAAGCTC-3’。扩增30个循环:95℃10s,58℃15s,68℃20s。通过跑胶检测目的条带大小(831bp),并进行乙醇沉淀纯化,得到的纯化产物即为插入GC1目标靶点序列的重组pYLsgRNA-OsU6a/LacZ载体。
7)取约2μg的pYLCRISPR/Cas9Pubi-B质粒在表4的酶切体系中(30U Bsa I)酶切2h后,用DNA胶电泳回收酶切的质粒片段。取100ng Bsa I酶切后的pYLCRISPR/Cas9Pubi-B质粒,同时加入已用Bsa I酶切好的第二轮PCR纯化产物(20ng),在10μL连接反应中加35U的T4连接酶,通过变温循环:10℃5min,20℃5min;10-15个循环)连接2-3h。
8)取1μL连接产物电激转化E.coli DH10B感受态细胞,电激后加入1mL SOC,37℃培养2h。涂板培养基为LB(25μg/mL Kan,0.5mM IPTG和适量X-gal)。挑取单克隆菌落通过菌落PCR方法,用载体引物SP1:5’-CCCGACATAGATGCAATAACTTC-3’和SP2:5’-GCGCGGTGTCATCTATGTTACT-3’对特定靶点进行测序,目的条带大小约1kb左右。获得的阳性克隆即为重组成功的pYLCRISPR/Cas9Pubi-B-GC1质粒。
9)取1μg制备的重组载体质粒pYLCRISPR/Cas9Pubi-B-GC1转化农杆菌EHA105的感受态细胞,28℃条件下于YEP培养基(含卡那霉素50mg/L)上培养两天,挑选阳性克隆,同样利用上述引物SP1和SP2进行PCR鉴定。将经PCR鉴定得到的阳性农杆菌命名为重组农杆菌EHA105/pYLCRISPR/Cas9Pubi-B-GC1,-80℃保存。
以该农杆菌进行高粱受体材料Wheatland转化的步骤同上所述。
对获得到的T0代GC1基因编辑植株首先进行打靶效果的检测:分别以基因编辑植株和Wheatland(野生型高粱)的基因组DNA为模板,PCR扩增包括剪切位点的基因组DNA片段,对扩增产物进行测序检测GC1基因目标靶点的突变情况。即对T0代的pYLCRISPR/Cas9Pubi-B-GC1基因编辑植株采用正向引物GC1-Cas9-ce-F:5’-TGCGTAACGTACCAGCTGCTAG-3’和反向引物GC1-Cas9-ce-R:5’-TGCGTAACGTACCAGCTGCTAG-3’对GC1基因的靶点基因组位置进行PCR扩增测序,选择靶点序列发生插入或缺失碱基(发生移码突变)的杂合体材料(基因编辑T0代阳性植株的目标基因靶点位置均为嵌合体)继续自交至下一代到T1代,在F1代分离个体当中,通过上述鉴定引物GC1-Cas9-ce-F和GC1-Cas9-ce-R继续检测发生移码突变的GC1基因靶点位置是否纯合。选择发生移码突变的GC1基因在靶点位置是否已纯合,同时通过载体引物SP1和SP2检测载体pYLCRISPR/Cas9Pubi-B-GC1是否分离掉。最终选择载体pYLCRISPR/Cas9Pubi-B-GC1分离掉,且在GC1基因靶点位置突变的序列已纯合的T1代纯合突变体材料,将其命名为GC1-KO(图7中b)。通过对GC1-KO植株和GC1野生型受体材料Wheatland的靶点测序序列的比对结果显示,GC1-KO植株在GC1基因组相应区域(序列表中序列1的第2464位的核苷酸)丢失一个碱基T,并造成在GC1蛋白相应区域(序列表中序列2的第43位氨基酸由异亮氨酸I突变为甲硫氨酸M,造成了后续翻译的提前终止)部分缺失了GC1蛋白5’端G蛋白γ亚基保守结构域(图7中b),从而将GC1基因敲除。GC1-KO植株表达的GC1基因的CDS核苷酸序列以及编码的蛋白质氨基酸序列如序列表中序列23和24所示。
2.2.2GC1基因突变体植株的表型观察
在成熟期时,GC1-KO植株(图8中GC1-KO表示)表现出比Wheatland颖壳长度以及包壳程度显著增加的表型(图8中a-c)。此结果也表明GC1是一个负调控高粱包壳程度的基因。
实施例3保守的G蛋白γ亚基结构域负调控种子包壳性状。
3.1G蛋白γ亚基编码基因过表达株系表型检测
通过禾本科作物数据库网站的同源性比对(BLAST)和进化树分析,预测得到了GC1基因在谷子中的一个直系同源基因SiGC1,该基因的5’端编码一个非典型的G蛋白γ亚基结构域,其基因组全长核苷酸序列如序列4所示,编码的氨基酸序列如序列5所示,以及编码的CDS核苷酸序列如序列6所示。
高粱GC1蛋白与高粱的近缘种谷子的SiGC1(GC1在谷子中的直系同源蛋白)蛋白N端的G蛋白γ亚基结构域是高度保守的,其氨基酸序列相似度达89.4%(图5所示)。因此进一步地验证G蛋白γ亚基这段蛋白的功能。人工设计合成编码谷子SiGC1蛋白N端的124个氨基酸的蛋白(名称为SiGC1124)的编码序列(序列表中序列5的第1-124位氨基酸),包含了高粱GC1的G蛋白γ亚基结构域(序列表中序列2的第99-165位氨基酸)同源对应到谷子SiGC1的G蛋白γ亚基结构域(序列表中序列5的第25-91位氨基酸),使用实施例2中2.2.1步骤中的方法,构建得到加Myc标签的G蛋白γ亚基蛋白过表达融合载体pCambia2300-SiGC1124-Myc(图8中a)(含有序列表中序列6的第1-372位所示的核苷酸序列,即SiGC1124基因序列),将pCambia2300-SiGC1124-Myc转化农杆菌EHA105感受态得到重组农杆菌EHA105/pCambia2300-SiGC1124-Myc。将所得到的重组农杆菌EHA105/pCambia2300-SiGC1124-Myc转入到谷子的受体材料Ci846(该谷子品种由中国农业科学院作物所吴传银老师惠赠,已在专利号为CN108588002A的专利中公开,见图8中c)中得到G蛋白γ亚基过表达植株SiGC1124-OE,qPCR的结果显示SiGC1124-OE的3个独立的过表达转基因阳性株系(图8中SiGC1124-OE-1、SiGC1124-OE-2和SiGC1124-OE-3)中的SiGC1基因表达量比野生型高出180倍到220倍之间(图8中b)。在成熟期时,我们观察到所有的SiGC1124-OE株系均表现出比Ci846更短的颖壳长度以及显著降低的包壳程度(图9中d和e)。表明谷子SiGC1蛋白N端的G蛋白γ亚基结构域(氨基酸序列是序列表中序列5的第25-91位氨基酸的结构域)是一个负调控其包壳程度的关键核心因子。
3.2G蛋白γ亚基编码基因突变体表型检测
使用实施例2中步骤2.2中同样的实验方法对近缘种谷子Ci846的SiGC1基因的5’端进行了敲除。设计的SiGC1基因接头靶点序列为SiGC1-Target-F:5’-GGCGTATAATGGCTGCTGCGCCGG-3’和SiGC1-Target-R:5’-AAACCCGGCGCAGCAGCCATTATA-3’。通过载体引物SP1和SP2鉴定过阳性的单克隆即为构建成功的重组pYLCRISPR/Cas9Pubi-B-SiGC1载体质粒。通过SiGC1基因靶点位置检测的正向引物SiGC1-Cas9-ce-F:5’-CTCGCTCCATCGCCATTTAATC-3’和反向引物SiGC1-Cas9-ce-R:5’-CAAGAGGAGCAGGAAGAACATTG-3’进行阳性植株的筛选,得到在SiGC1基因的5’端成功敲除的T0代嵌合体突变体植株。然后从阳性T0代植株自交一代得到T1代分离得到了pYLCRISPR/Cas9Pubi-B-SiGC1载体分离掉的、在靶点位置造成提前终止突变类型的纯合株系SiGC1-KO(图8中d)。SiGC1-KO在序列表中序列6所示的第13-14位核苷酸之间插入一个碱基T,并造成在序列表中序列5所示的第42位氨基酸位置提前终止,完全缺失了G蛋白γ亚基保守结构域(图8中d)。SiGC1-KO植株表达的SiGC1基因的CDS核苷酸序列以及编码的蛋白质氨基酸序列如序列表中序列25和26所示。
通过谷子成熟期的种子包壳表型观察发现,对比含有野生型SiGC1的植株Ci846而言,SiGC1-KO表现出颖壳长度以及包壳程度显著增加(图9中d和e)。以上结果表明SiGC1的G蛋白γ亚基的确是一个负调控谷子包壳程度的因子。
实施例4高粱GC1蛋白的C端正调控高粱种子包壳性状。
由于在高粱的自然材料中,GC1基因都是在第5个外显子区域发生自然移码突变而缺失掉了C端氨基酸(图3),我们也探索了GC1蛋白C端的功能研究。由于相对于GC1而言,gc1-a是一个自然变异的等位基因(序列表中序列7),gc1-a编码的蛋白(序列表中序列8)N端含有完整的G蛋白γ亚基结构域,但在蛋白C端发生了截短突变而丢失了62个氨基酸(图3)。因此我们对高粱近等基因系NIL-GC1和NIL-gc1-a在成熟期的包壳性状表型首先进行了比较。
相比较于野生型NIL-GC1而言,含有相同N端的G蛋白γ亚基结构域、但缺失了蛋白C端的NIL-gc1-a极显著降低了高粱的包壳程度、颖壳长度和颖壳宽度(图10a,b和d)。而在相同的机械化脱粒条件下NIL-gc1-a比NIL-GC1的种子显著提高了超过60%的脱粒效率(图10c和d)。以上结果表明高粱GC1蛋白C端的缺失造成了高粱包壳程度的降低,表明GC1蛋白的C端是一个正调控高粱包壳性状的因子。
为了进一步证明GC1蛋白C端的作用,我们统计了431份含有六种不同GC1单倍型的高粱自交系品种的颖壳长度表型。发现相对于含有野生型GC1的高粱品种而言,在含有GC1蛋白发生不同类型截短缺失突变的单倍型gc1-a、gc1-b、gc1-c和gc1-d的高粱品种中均表现出更短的颖壳长度(图10中e和f)。其中gc1-b单倍型对应的等位基因(序列表中序列9)编码的蛋白的氨基酸序列如序列表中序列10所示;gc1-c单倍型对应的等位基因(序列表中序列11)编码的蛋白的氨基酸序列如序列表中序列12所示;gc1-d单倍型对应的等位基因(序列表中序列13)编码的蛋白的氨基酸序列如序列表中序列14所示。此外gc1-e单倍型对应的等位基因(序列表中序列15)编码的蛋白的氨基酸序列如序列表中序列16所示。因此,这些结果表明高粱GC1蛋白的C端确实是正调控高粱包壳性状的因子。
综合以上高粱GC1和谷子SiGC1的转基因、基因编辑、NIL系和自交系的种子包壳性状表型验证结果表明,GC1或SiGC1蛋白N端的G蛋白γ亚基结构域是一个负调控种子包壳程度的因子,而其蛋白C端却是正调控种子包壳程度的因子。表明GC1或SiGC1蛋白N端的G蛋白γ亚基结构域与其蛋白C端可能存在相互拮抗的作用。
实施例5、用于检测GC1等位基因分型的分子标记试剂盒的设计开发。
由于上述实施例1中检测到的GC1基因有六种典型的单倍型(图3和图4中a),且均是在该基因的3’端发生的自然变异,于是我们针对GC1基因的3’端,也就是第五个外显子区域设计了一对通用的、特异的引物(序列表中序列17和序列18所示)用于检测GC1基因上InDel-1、InDel-2、InDel-3或SNP3变异位点的多态性,PCR扩增体系见表4所示,扩增的PCR产物直接进行普通的DNA片段测序,并用序列17进行单向测序即可。经过对试剂盒中所包含的该分子标记进行试用后,其第五个外显子的测序结果用软件比对如图11所示,可作为GC1基因型分型的对照。
除此之外,我们根据GC1基因的物理位置,在其侧翼5kb范围内搜寻到了两处SSR位点,并据此设计了两对SSR通用引物作为与GC1基因紧密连锁的SSR分子标记,其两对引物对序列分别如序列表中序列19和序列20、序列21和序列22所示。SSR引物用于基因型分型的PCR扩增体系分别如表7所示。SSR引物用于基因型分型的反应程序为:94℃预变性5min;94℃变性30s、55℃退火30s、72℃延伸30s,扩增38个循环;72℃保温10min;4℃保存。取4μL的PCR产物进行非变性聚丙烯酰胺(PAGE)凝胶电泳检测基因型的分型。
为了测试这两对SSR引物的序列多态性,我们选取了24份高粱种质资源材料(品种信息见图12)进行了非变性聚丙烯酰胺凝胶电泳的基因型分型鉴定,在200-500bp区域内,可见清晰、明亮的目标条带。其中序列19和序列20引物对的多态性非常高,序列21和序列22引物对的多态性也较高(图13),二者均可适用在自然群体和人工分离群体中检测与控制包壳性状基因GC1紧密连锁的分子标记。
表5.SSR引物用于GC1基因分型的PCR扩增反应体系
Figure BDA0003289267990000151
Figure BDA0003289267990000161
试剂盒中所包含的这些通用的SSR引物对可用于任意高粱种质资源中的GC1基因区域进行前景选择的基因型分型。通过在苗期进行大规模的批量鉴定,无需等待成熟期后根据表型进行选择,大大降低育种生产成本、并将精准、高效地以此进行指导高粱裸粒品种的分子遗传改良。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
                         序列表
<110>  中国科学院遗传与发育生物学研究所
<120>  控制高粱种子包壳性状的GC1蛋白及其编码基因的应用
<130>  GNCSQ211053
<160>  27
<170>  PatentIn version 3.5
<210>  1
<211>  4417
<212>  DNA
<213>  高粱(Sorghum bicolor)
<400>  1
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga ggtatgtatg     120
tatgtatgta tgtacggatc actcaatact agctaagcta gctagctacc acctgcatgc     180
cattcttcga ttctagctcg catatatatt atgctgcagt gctcgaccga tctttgcagt     240
ttgcatcacc tacctatcct cttgctgcct tgctcagctg cgtttgccat tttccttctc     300
tctctctctc tctctctctc tcttatgtgt ttcaaaaatg catatataaa caatcgcatt     360
cagaaaatga tatacaagga taaataaagt gtgcgtagtc aacgaagttc aaatttacca     420
gttgctggtg gctcctctcc atatgggccg gccggccgag aactgaaacg ctatcagcag     480
tagtagatga caccgtttaa ctttgaaagc ttaattagtt taatccatcc tagctgtgct     540
aatggtcagc agtttaatct ctctctgcct ctgggcacgt gcggatcgta ccatggattt     600
gcgcgcgtgt caagcctcaa ctctgctctt tatattccgt ttgcctacca tttttttccc     660
acgattccga ctcgtctcag agcttggatt cttcttctct tctaacctgc tgatgatgat     720
attatactac gggcgtgttt agatccaaaa tttttttgga ttttgacatt gtagcacttt     780
cgtttttatt taacaaacat tgttcaatca tggagtaact aggtttaaaa gattcgtctc     840
gcgatttaca gacaaactgt gtaattagtt tttattttta tctatattta atacttcata     900
catgtgccgc aagattcgat gtgatgggga atcttgtaaa gttttgggtt tttgagtgta     960
tctaaacaag gcctacatta cttctctcac acacacaatc tcaaataaag cactattact    1020
actactacta atgatttttt tttgtctatc tatcgatctg gctagggttt aagggatcta    1080
ggatctagta catggaagaa gatacaaggg ccggcccacg ctttgattat tgcctttgtg    1140
tcacctgcgt atatcctaaa tactactccg atcctatatc ctatcatatg gcttggaggc    1200
tttcactaca ataatataat actacaccca tgtaggcgtc agtgtgtcac tataatgcta    1260
cattagcgct aaaccatagc agctgtactt gcgaaaacat gtttcagatc agcaggctct    1320
tcctccttca aggcttcaac tcatcatgaa aaatttcgtc cagcccggcc tggcctttgc    1380
ttgccggaca ccttctcgtt ttaatgcctt gttattattt atgttatatc tgaaataata    1440
tatcagcagc acgcatactg gacataaagt tgcttctcat ggtgccacat ttccaactac    1500
tcatccctgt ccagcagcct gctcactcat cacttcatca gagctcagct acccagcaat    1560
aaaatattcc cgaaaacaga tgttaattga acactattat ttactgcccg atgagcctgc    1620
aaaaacacag ccctgcattg gtgccatgcc tacgtgccat ctcggtatgt aagagttaat    1680
taatcttaac tgacaaattt attcaaatac tccacaactg atggttctac ttcaaactga    1740
tcatgaccta ctaggctacc acaccagctt gtgtgtatgc gaatgcatgg cttccttcct    1800
tgatgcatat agtacctccc cccccttaca taataacctt aggccttgtt tagtttctaa    1860
aaatttttaa ggttctccgt cacattgaat cttgcggcac atgcatgaag cattatatat    1920
agacgaaaat aaaaactaat tacacaattt gcctgtaaat cgtgagacga atcttttgac    1980
cctagttagt ctatgattgg acaatatttg ccacaaacaa acgaaagtgc tacagtagcg    2040
aaatccaaaa aatttcgcga actgaaccag gccttattaa tttgttacaa gattgtttgt    2100
ttcttctgtt ccaacacagc aacgaagcat tatatcaaaa aaaaaaacga cgttgcattg    2160
atgccaaaat atgctggcgt acggccgttt gcatatggtt gcagactgca gtatctcgtt    2220
ctattagaat attggaaagc tcggccccca gctggggttt tcttcagtaa actcaaactt    2280
tgaatgtgct gtgtgttaaa aatatcccag acgacaacgc ctgaaaagtt gacagctgaa    2340
cacatggctt ttacttacca gcagtataca gtagtattta ctattaccaa tatgatatta    2400
ttatattata tatcctgaaa cgctcgattt aatttctttg ctgcagggcg aaataagttc    2460
cattgagggg gtccacgctg cctccagatg ctgcaaagag taagctcaac aaatactcca    2520
ttattactac tttgtgtaca ggggacctta ttacttgcag tgttttcaca agaatggctg    2580
aaaatgctag tatcagaaaa taattcatga acttaatttc tctttaattt aaactgcaaa    2640
acatattctc atccaaatgt ccatgcatcc atccattgtt cttcggaata gatactggat    2700
aactatggtt ggataactag ttttataggt ttctatatga gtaaattgaa ttgcttctct    2760
atatattgac cgatgaccat gtggatcgtc ggagaaacca aagatgattc tctgttgatt    2820
gcctctcttt aataaatctt tgcagggttg atgagtttgt tggaagtaat ccggatccat    2880
tcctaacgat gtatgaattt tcaggttgtg aatttgtctt taacttagca tgaatgctgc    2940
atttttctta ttatctcttt ttaaaaagca gtcagccaga gaaaggaagc catgatcaat    3000
ctcagcagtt tctgaagaag ttccggtact tcctttgctc ctcacaactc ttaatattgt    3060
tggttcttac cattaccagt agcacacgcg cgcatatata gtaatgttat tttgttgtac    3120
gagaaaaatt ctaccatcat tatctcctaa taataatcct aaaatcattg ttaggtagga    3180
gaatgtacac agaaagataa cagtctctgt atatcgtcac aagacataaa actaacacca    3240
gccttgttta cttctaccca aaaacctaaa attttttaag attctccgtc acgtcgaatc    3300
tttagacgca tgcatgtaat attaaatata gacgaaaata aaaactaatt acatagttag    3360
gtcagaattt acgagacgaa tcttttgagt ctagttagtc cataattaga caataattac    3420
cacaaacaaa cgaaagtgtt acagtgtcgt gaaatctttc ccatgaggaa ctaaacacgg    3480
cctaaaactg aaatgaatga cacatatatc tctccattat tactgtctac tgtcctattg    3540
agaacacaac ctgtccattt tctgaaaagt atgcaagtgc atattcattc agttcaagct    3600
gtatgaagtt tgtgatcatc tgcgagcctc agtcccacca gcgtacgttc tagcagcttc    3660
aacggctcgt atcagatctt tgctgttttt ttcctctgca gcagcctgca cccctccact    3720
gtactactgc actacaaact ttcagagcaa ttaccttgtc gtttactact ttaaactgcc    3780
atgccatcaa catcacatta tcagccagag caatcagttt gtcgatcgtt gtctgcacta    3840
acacttaatt gagcatctaa agagctactt ttcagaaccg tcacctcatt gttactataa    3900
ttgtttcaat tattcctcaa catgccgtca gaaaccatca gctactgaat atgtccgtca    3960
gtaaaccatg aaatgatgct gctgtttgtt gctagctagc tagcttgcat tgggtttttg    4020
ggtgaatgat tgacaatcga tcacggagca gatgaagttg cttactcttg tgcatgcatg    4080
cagagcaaag agctgcctga gctactacct ctcgtggatc tgctgctgcg gcggtggcgg    4140
tggcggtggc agtggcgggt ggtgcccgcc gtcgctgcag ctcaagaggc cagcggcgcc    4200
gagctgctcc tgcgcgccgc ggctgaggaa gctctgctgc tgctgttgct gctgccggtg    4260
ccgcgtggtg tacgccggcg gcgccggcgg ctgcgggtgc tgcgcgccgt gcccgcgctg    4320
ctcgtgcgac tgcacctgcg cctgcccgcg ctgctgctcc tgccccaggt gcagcgccgc    4380
gtgctgctgc gccccgcgct gctgcctgtg cctatga                             4417
<210>  2
<211>  275
<212>  PRT
<213>  人工序列(Artificial Sequence)
<400>  2
Met Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Glu Met Glu Gln
1               5                   10                  15
Lys Leu Ile Ser Glu Glu Asp Leu Asn Glu Met Glu Gln Lys Leu Ile
            20                  25                  30
Ser Glu Glu Asp Leu Asn Glu Met Glu Gln Lys Leu Ile Ser Glu Glu
        35                  40                  45
Asp Leu Asn Glu Met Glu Ser Leu Gly Asp Leu Thr Met Glu Gln Lys
    50                  55                  60
Leu Ile Ser Glu Glu Asp Leu Asn Ser Thr Ser Cys Thr Met Ala Ala
65                  70                  75                  80
Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro Cys Gly Arg
                85                  90                  95
His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu Ile Ser Phe
            100                 105                 110
Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala Ala Ser Arg
        115                 120                 125
Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro Asp Pro Phe
    130                 135                 140
Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser Gln Gln Phe
145                 150                 155                 160
Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr Leu Ser Trp
                165                 170                 175
Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly Trp Cys
            180                 185                 190
Pro Pro Ser Leu Gln Leu Lys Arg Pro Ala Ala Pro Ser Cys Ser Cys
        195                 200                 205
Ala Pro Arg Leu Arg Lys Leu Cys Cys Cys Cys Cys Cys Cys Arg Cys
    210                 215                 220
Arg Val Val Tyr Ala Gly Gly Ala Gly Gly Cys Gly Cys Cys Ala Pro
225                 230                 235                 240
Cys Pro Arg Cys Ser Cys Asp Cys Thr Cys Ala Cys Pro Arg Cys Cys
                245                 250                 255
Ser Cys Pro Arg Cys Ser Ala Ala Cys Cys Cys Ala Pro Arg Cys Cys
            260                 265                 270
Leu Cys Leu
        275
<210>  3
<211>  597
<212>  DNA
<213>  人工序列(Artificial Sequence)
<400>  3
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc agtggcgggt ggtgcccgcc gtcgctgcag     360
ctcaagaggc cagcggcgcc gagctgctcc tgcgcgccgc ggctgaggaa gctctgctgc     420
tgctgttgct gctgccggtg ccgcgtggtg tacgccggcg gcgccggcgg ctgcgggtgc     480
tgcgcgccgt gcccgcgctg ctcgtgcgac tgcacctgcg cctgcccgcg ctgctgctcc     540
tgccccaggt gcagcgccgc gtgctgctgc gccccgcgct gctgcctgtg cctatga        597
<210>  4
<211>  4434
<212>  DNA
<213>  谷子(Setaria italica)
<400>  4
atggctgctg cgccggcggc acccaggccc aagtcgccgc cggcctcgcc cgacccgtgc      60
ggccgccacc gcctgcagct cgccgtcgac gcgctccacc gggagatcgg cttcctcgag     120
gtacccggct tactacctgc catacttgca cacacttgga tgttgatcac aactgcgatg     180
catacacaac gcccgtcttc gtctttgcat cgcaccacct atctgcatgc catgtctttg     240
tcctccccgg cccggctcat ggtcctggct ggcacaccca atgttcttcc tgctcctctt     300
gctgcgccgc attttttttt cttttccttt tgtttttgtt ttcagatatg gagatgtata     360
gataattgca tactatggat aaacaaagcg tctcaggtca acgaaattac tagtaggttg     420
ttccagggac ggagagctga tgatgaactg ggattggagt tactaggagc tagcgtagcg     480
attgataaga ccgttagctt tgaaagctta gtttaatcca ggcaatctgg acagttttaa     540
ttaggccccg tttgataggg cttctcaaag tgcttctcca ccggcttttg gtgaagccct     600
accaaagggt caatttcaaa acggcttcac caccaaagtc ggggagaagc cgcaaaacgg     660
cttacactag agaggagaag ccgaaaaaag tggcttcacc ggcttctcct ccctctccaa     720
gcattaagtg atcataaaat tacatatatt gccattgaga agccgtttta ccaaatgttt     780
tgcaaaacgg cttcagcttc actaaaaaag ccactccacc gaaaaagccg aagccgaagc     840
cgttttatga gaagctgaag ctctaccaaa cgggacctta atctctctgg ctgctggctt     900
ttggttttgg ggcttccgcc tctgggcacg tgcggatcgt accatggatt tgcgcgcgcg     960
tcaaggctaa ctcatctgct cgtcttattc cttttgccta ccatttccac cgctccatct    1020
cctggaccct tcttctagct agggtttaag gggtcctatt attatcatcc cgcttgcatt    1080
tccttaatac aatatcatat ggcttgcatt gttaattaag cttgagcccc cgggcggacg    1140
gtttgactca tcatgtagta ggcgactttg accaatacac tctactagag taggtactag    1200
tatgtagtag ggtactttga ccaaaacctc ttttttataa tagcacctaa aacctttggt    1260
aggcatgcat ttgttttctc aattactagg aaactggggt gatttgaagc tctttattag    1320
gtcttattcg attaattccc ttttccaagg gattatggaa ggaatttaga gggctgtata    1380
catgatcgta ggcttgtctt ctgtaatgac gtgcttaacc agcctgtaac taagctttct    1440
tcagcttcac ctcatcatga acttccaagc tagcctttgc tagctatata ttctcgcttt    1500
aatgttctat tgttataata ttattatata tacaatgtag cagtcagcag cgcatactgg    1560
acgacataga gttgcttgtg gtggtattgg gactgctcca gatttccaac tactcatcca    1620
gcactgtcca gcctgctcgc tgggatgtat aaaataatcc tgcaaaaata tctgttaatt    1680
aacactattt actgcccgat gagactgaaa aaacacagcc ttgcatgccg gggccatgtc    1740
tacgtgccat ccatcggtac ggcagaaata attaatgtag gtgacaaatt tattcctata    1800
caagcaatcc atactcttcc actaaccgca tagtatgggc ttgtttggtt gctgcctgcc    1860
aggtagcaaa aaccaacctc aggcactcaa aatccaacac ctggggttgc tgcctgagcc    1920
aggcaggtct ccacgacctg aagcaaacaa gccctacatg ctgtgtattg atccaggaga    1980
aaaaaatgta ttgatccagg agggaaaaaa acgacagcag taaatggcct tctttgatgc    2040
ataagatcat ccctgccttc tgtttgatac caatgctgtt tccatcgacg atcttgcatt    2100
gatgccaatg ctggcgtacg gccgttagat tgcagcatct cgttagaata ttggaaagcc    2160
ctcccctgat gatttttctc cttcagtact cgactctgaa tgtgctgcgt gataaaatta    2220
tcccagacag cacctgaaaa gttgacagcc tgagaacatg gcttttactt gctgtgcagt    2280
attactgttg ccaatagccc agtataatat tactattatt ctggaacgct gaaatttaat    2340
aatttcattg cagggtgaaa taagttccat tgacggggtc cacgctgcct ccagatgctg    2400
caaagagtaa gctgcagaaa tgttactact gcgtacacgg gatcttgtat tctcacaaca    2460
aatattactg gaggctaaat taatgaattt tcttgttaca cttcaaagca tgtattctcc    2520
attcaagtgt ccatgcgtgg atgcttagga ttagatacta gatcaccata tttggtgcaa    2580
attagcgatt cacaagcaga agctcatatc gcaaactagc ttttcactgg gaattataca    2640
ggaagcaaaa ttattcagaa ttgcgccaat aatttgtgag ctgttttact gtacacaata    2700
gtatataact tgtgccaata atagcttttc acttagtagt atataagtat atgtaagatc    2760
taattgttca ttattatgga taatttagta attattacat tgtaaaaagt gatatttcaa    2820
atagaatggt ctttaaactt taaactttat gctagtgtga aaaaaataaa attatagtga    2880
tgccatttgt gtgtttttta ttgtgataac cttatactac atatactact catgtatact    2940
atccatacca caggtgaagg ttccagtagt atacaattaa tcttgatcgt cggatgtttt    3000
tatactagtc cttttcaaac actagtgtag cttagtattg tgtaccataa aagagattta    3060
atttgtatat acaattcctc aaaaatattt ttccattaat tttattttaa tcataaaaat    3120
actagttttt aagtttcttt ttgaataaac tgttgttgct aacaatttgg agaaaacgaa    3180
agaggatcta tgttgattgc ctctttgata ttttttgcag ggttgatgag tttgtgggaa    3240
gaaatcccga tccattcata acgatgtatg gattttcagg ttgagaattt gtctttagct    3300
tggcataaat gttgcatttt cttattatct ctctttaaaa gcagtcagcc agagaaacga    3360
agcaatgagc agtctcagca gtttctgaag aagttccggt actttcttag ttcccagctc    3420
ttagtattgt tggttcttgg ggcatataat tatgttattt tttgttaatt aattatcctt    3480
gagtactgtc agctcagaag aaaaaggaca aattgcatgg ccaaaaagat aatctacata    3540
ctgtcaaaca tggtaccgct cagttgatag gcatcattaa gacacataaa acacaattaa    3600
gacacaaaac taacaccagc taaattcaca cctatctgtt tagggaaaga aaacaacctg    3660
tccattttct gaaaaggaag tgcacatata ttcagttcaa tttgcgtgaa gtttctgacc    3720
aggacacctg caaatgtata tatatgattc caagctagcg ttttgtagca tcttgtatcc    3780
atcagctgat tcttttagag ctagctaata atataagatt gcattagaaa tctagaacag    3840
ctttatcaga tcatcgctct tagcttttct tatgcaacct gcaacccctc cactgtacaa    3900
acttcgacaa aacttgtcct tcttattgct ttaaatatca tctcatcagt gccacactga    3960
cagaacgatc aactcattgc taatcacctc aataattgct gaacttgtcg ttgcctgcac    4020
atctagcaat gatgcttttc agaaacatca actcattgtt accataattg gctcaataat    4080
tcctgaactt gtcgttaaca gtcaagatga tttcaatgaa ccagagccaa gagctgcctg    4140
agctacctgt cgtggatctg ctgcggcggc ggcgggtgcc cgccgttcca gctgaagacg    4200
acgatgaggc cgccgtcggc gagctgctcc tgcggcggcg cgcggctgcg gaagctctgc    4260
tcgtccccgt gctgctgctg ctgctgctgc aggtgccgcg tggtgtacgc cgggtgctgc    4320
gcgccgtgcc cgcgctgctc gtgcggctgc gcctgcccgc ggtgctcgtc gtgcgcctgc    4380
tgccccacct gcagcgacgc gtgctgcgcc ccgcgctgct gcctgtgcct atga          4434
<210>  5
<211>  193
<212>  PRT
<213>  谷子(Setaria italica)
<400>  5
Met Ala Ala Ala Pro Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser
1               5                   10                  15
Pro Asp Pro Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu
            20                  25                  30
His Arg Glu Ile Gly Phe Leu Glu Gly Glu Ile Ser Ser Ile Asp Gly
        35                  40                  45
Val His Ala Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly
    50                  55                  60
Arg Asn Pro Asp Pro Phe Ile Thr Ile Gln Pro Glu Lys Arg Ser Asn
65                  70                  75                  80
Glu Gln Ser Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu
                85                  90                  95
Ser Tyr Leu Ser Trp Ile Cys Cys Gly Gly Gly Gly Cys Pro Pro Phe
            100                 105                 110
Gln Leu Lys Thr Thr Met Arg Pro Pro Ser Ala Ser Cys Ser Cys Gly
        115                 120                 125
Gly Ala Arg Leu Arg Lys Leu Cys Ser Ser Pro Cys Cys Cys Cys Cys
    130                 135                 140
Cys Cys Arg Cys Arg Val Val Tyr Ala Gly Cys Cys Ala Pro Cys Pro
145                 150                 155                 160
Arg Cys Ser Cys Gly Cys Ala Cys Pro Arg Cys Ser Ser Cys Ala Cys
                165                 170                 175
Cys Pro Thr Cys Ser Asp Ala Cys Cys Ala Pro Arg Cys Cys Leu Cys
            180                 185                 190
Leu
<210>  6
<211>  582
<212>  DNA
<213>  人工序列(Artificial Sequence)
<400>  6
atggctgctg cgccggcggc acccaggccc aagtcgccgc cggcctcgcc cgacccgtgc      60
ggccgccacc gcctgcagct cgccgtcgac gcgctccacc gggagatcgg cttcctcgag     120
ggtgaaataa gttccattga cggggtccac gctgcctcca gatgctgcaa agaggttgat     180
gagtttgtgg gaagaaatcc cgatccattc ataacgattc agccagagaa acgaagcaat     240
gagcagtctc agcagtttct gaagaagttc cgagccaaga gctgcctgag ctacctgtcg     300
tggatctgct gcggcggcgg cgggtgcccg ccgttccagc tgaagacgac gatgaggccg     360
ccgtcggcga gctgctcctg cggcggcgcg cggctgcgga agctctgctc gtccccgtgc     420
tgctgctgct gctgctgcag gtgccgcgtg gtgtacgccg ggtgctgcgc gccgtgcccg     480
cgctgctcgt gcggctgcgc ctgcccgcgg tgctcgtcgt gcgcctgctg ccccacctgc     540
agcgacgcgt gctgcgcccc gcgctgctgc ctgtgcctat ga                        582
<210>  7
<211>  411
<212>  DNA
<213>  高粱(Sorghum bicolor)
<400>  7
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatcg gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc ggtggcggtg gcggtggtgc ccgccgtcgc     360
tgcagctcaa gaggccagcg gcgccgagct gctcctgcgc gccgcggctg a              411
<210>  8
<211>  136
<212>  PRT
<213>  高粱(Sorghum bicolor)
<400>  8
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Gly Phe Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala
        35                  40                  45
Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro
    50                  55                  60
Asp Pro Phe Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser
65                  70                  75                  80
Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr
                85                  90                  95
Leu Ser Trp Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Gly Gly
            100                 105                 110
Gly Gly Gly Gly Ala Arg Arg Arg Cys Ser Ser Arg Gly Gln Arg Arg
        115                 120                 125
Arg Ala Ala Pro Ala Arg Arg Gly
    130                 135
<210>  9
<211>  405
<212>  DNA
<213>  高粱(Sorghum bicolor)
<400>  9
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc ggtggcggtg gtgcccgccg tcgctgcagc     360
tcaagaggcc agcggcgccg agctgctcct gcgcgccgcg gctga                     405
<210>  10
<211>  134
<212>  PRT
<213>  高粱 (Sorghum bicolor)
<400>  10
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Ser Phe Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala
        35                  40                  45
Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro
    50                  55                  60
Asp Pro Phe Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser
65                  70                  75                  80
Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr
                85                  90                  95
Leu Ser Trp Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Gly Gly
            100                 105                 110
Gly Gly Ala Arg Arg Arg Cys Ser Ser Arg Gly Gln Arg Arg Arg Ala
        115                 120                 125
Ala Pro Ala Arg Arg Gly
    130
<210>  11
<211>  423
<212>  DNA
<213>  高粱 (Sorghum bicolor)
<400>  11
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc agtggcgggt ggtgcccgcc gtcgctgcag     360
ctcaagaggc cagcggcgcc gagctgctcc tgcgcgccgc ggctgaggaa gctctgctgc     420
tga                                                                   423
<210>  12
<211>  140
<212>  PRT
<213>  高粱 (Sorghum bicolor)
<400>  12
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Ser Phe Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala
        35                  40                  45
Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro
    50                  55                  60
Asp Pro Phe Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser
65                  70                  75                  80
Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr
                85                  90                  95
Leu Ser Trp Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Ser Gly
            100                 105                 110
Gly Trp Cys Pro Pro Ser Leu Gln Leu Lys Arg Pro Ala Ala Pro Ser
        115                 120                 125
Cys Ser Cys Ala Pro Arg Leu Arg Lys Leu Cys Cys
    130                 135                 140
<210>  13
<211>  768
<212>  DNA
<213>  高粱 (Sorghum bicolor)
<400>  13
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc ggtggcagtg gcgggtggtg cccgccgtcg     360
ctgcaggggc gaatctagcc tatactattg gggtcacctg accccgatga ctttgaaaaa     420
attaatggag aatttttgtt catcatagtt aaacaatggt gccgacccca ctatataaat     480
gtgatgaccc cgatgaactt catagctgga ttcgccactg cgtcgctgca gctcaagagg     540
ccagcggcgc cgagctgctc ctgcgcgccg cggctgagga agctctgctg ctgctgttgc     600
tgctgccggt gccgcgtggt gtacgccggc ggcgccggcg gctgcgggtg ctgcgcgccg     660
tgcccgcgct gctcgtgcga ctgcacctgc gcctgcccgc gctgctgctc ctgccccagg     720
tgcagcgccg cgtgctgctg cgccccgcgc tgctgcctgt gcctatga                  768
<210>  14
<211>  125
<212>  PRT
<213>  高粱 (Sorghum bicolor)
<400>  14
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Ser Phe Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala
        35                  40                  45
Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro
    50                  55                  60
Asp Pro Phe Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser
65                  70                  75                  80
Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr
                85                  90                  95
Leu Ser Trp Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Gly Gly
            100                 105                 110
Ser Gly Gly Trp Cys Pro Pro Ser Leu Gln Gly Arg Ile
        115                 120                 125
<210>  15
<211>  657
<212>  DNA
<213>  高粱 (Sorghum bicolor)
<400>  15
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccattg agggggtcca cgctgcctcc agatgctgca aagaggttga tgagtttgtt     180
ggaagtaatc cggatccatt cctaacgatt cagccagaga aaggaagcca tgatcaatct     240
cagcagtttc tgaagaagtt ccgagcaaag agctgcctga gctactacct ctcgtggatc     300
tgctgctgcg gcggtggcgg tggcggtggc ggtggcagtg gcgggtggtg cccgccgtcg     360
ctgcagctca agaggccagc ggcgccgagc tgctcctgcg cgccgcggct gaggaagctc     420
tgctgctgct gttgctgctg cggtgccgcg tggtgtacgc cggcggcgcc ggcggctgcg     480
ggtgctgcgc gccgtgcccg cgctgctcgt gcgactgcac ctgcgcctgc ccgcgctgct     540
gctcctgccc caggtgcagc gccgcgtgct gctgcgcccc gcgctgctgc ctgtgcctat     600
gatggccaca tgagaaattt tgtgtgcatg ctactacccg gagaaccgtg gttttga        657
<210>  16
<211>  218
<212>  PRT
<213>  高粱 (Sorghum bicolor)
<400>  16
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Ser Phe Leu Glu Gly Glu Ile Ser Ser Ile Glu Gly Val His Ala
        35                  40                  45
Ala Ser Arg Cys Cys Lys Glu Val Asp Glu Phe Val Gly Ser Asn Pro
    50                  55                  60
Asp Pro Phe Leu Thr Ile Gln Pro Glu Lys Gly Ser His Asp Gln Ser
65                  70                  75                  80
Gln Gln Phe Leu Lys Lys Phe Arg Ala Lys Ser Cys Leu Ser Tyr Tyr
                85                  90                  95
Leu Ser Trp Ile Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Gly Gly
            100                 105                 110
Ser Gly Gly Trp Cys Pro Pro Ser Leu Gln Leu Lys Arg Pro Ala Ala
        115                 120                 125
Pro Ser Cys Ser Cys Ala Pro Arg Leu Arg Lys Leu Cys Cys Cys Cys
    130                 135                 140
Cys Cys Cys Gly Ala Ala Trp Cys Thr Pro Ala Ala Pro Ala Ala Ala
145                 150                 155                 160
Gly Ala Ala Arg Arg Ala Arg Ala Ala Arg Ala Thr Ala Pro Ala Pro
                165                 170                 175
Ala Arg Ala Ala Ala Pro Ala Pro Gly Ala Ala Pro Arg Ala Ala Ala
            180                 185                 190
Pro Arg Ala Ala Ala Cys Ala Tyr Asp Gly His Met Arg Asn Phe Val
        195                 200                 205
Cys Met Leu Leu Pro Gly Glu Pro Trp Phe
    210                 215
<210>  17
<211>  24
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  17
ctgcacccct ccactgtact actg                                             24
<210>  18
<211>  22
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  18
ctccgggtag tagcatgcac ac                                               22
<210>  19
<211>  21
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  19
ggttaagaga catgagggca c                                                21
<210>  20
<211>  20
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  20
cccttgattt atcccatgtc                                                  20
<210>  21
<211>  20
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  21
ggaccagcat ggctttatag                                                  20
<210>  22
<211>  19
<212>  DNA
<213>  人工序列 (Artificial Sequence)
<400>  22
cacaatgcag aagctcgtc                                                   19
<210>  23
<211>  204
<212>  DNA
<213>  人工序列(Artificial Sequence)
<400>  23
atggcggcgg cgccgaggcc caagtcgccg cctgcctcgc cggacccctg cggccgccac      60
cgcctccagc tcgccgtcga cgcgctccac cgggagatca gcttcctcga gggcgaaata     120
agttccatga gggggtccac gctgcctcca gatgctgcaa agaggttgat gagtttgttg     180
gaagtaatcc ggatccattc ctaa                                            204
<210>  24
<211>  67
<212>  PRT
<213>  人工序列(Artificial Sequence)
<400>  24
Met Ala Ala Ala Pro Arg Pro Lys Ser Pro Pro Ala Ser Pro Asp Pro
1               5                   10                  15
Cys Gly Arg His Arg Leu Gln Leu Ala Val Asp Ala Leu His Arg Glu
            20                  25                  30
Ile Ser Phe Leu Glu Gly Glu Ile Ser Ser Met Arg Gly Ser Thr Leu
        35                  40                  45
Pro Pro Asp Ala Ala Lys Arg Leu Met Ser Leu Leu Glu Val Ile Arg
    50                  55                  60
Ile His Ser
65
<210>  25
<211>  126
<212>  DNA
<213>  人工序列(Artificial Sequence)
<400>  25
atggctgctg cgctcggcgg cacccaggcc caagtcgccg ccggcctcgc ccgacccgtg      60
cggccgccac cgcctgcagc tcgccgtcga cgcgctccac cgggagatcg gcttcctcga     120
gggtga                                                                126
<210>  26
<211>  41
<212>  PRT
<213>  人工序列(Artificial Sequence)
<400>  26
Met Ala Ala Ala Leu Gly Gly Thr Gln Ala Gln Val Ala Ala Gly Leu
1               5                   10                  15
Ala Arg Pro Val Arg Pro Pro Pro Pro Ala Ala Arg Arg Arg Arg Ala
            20                  25                  30
Pro Pro Gly Asp Arg Leu Pro Arg Gly
        35                  40
<210>  27
<211>  165
<212>  DNA
<213>  人工序列(Artificial Sequence)
<400>  27
ggggcgaatc tagcctatac tattggggtc acctgacccc gatgactttg aaaaaattaa      60
tggagaattt ttgttcatca tagttaaaca atggtgccga ccccactata taaatgtgat     120
gaccccgatg aacttcatag ctggattcgc cactgcgtcg ctgca                     165

Claims (10)

1.蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质的应用,其特征在于:所述应用为下述任一种:
P1、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在调控植物种子包壳性状中的应用,
P2、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在抑制植物种子包壳性状中的应用,
P3、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在植物育种中的应用,
P4、所述蛋白质或调控所述蛋白质编码基因表达的物质或调控所述蛋白质活性或含量的物质在植物种子包壳性状改良中的应用;
所述蛋白质是如下A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)、A11)或A12)的蛋白质:
A1)氨基酸序列是序列表中序列2的蛋白质;
A2)氨基酸序列是序列表中序列2的第78-275位的蛋白质;
A3)氨基酸序列是序列表中序列5的蛋白质;
A4)氨基酸序列是序列表中序列5的第25-91位的蛋白质;
A5)氨基酸序列是序列表中序列8的蛋白质;
A6)氨基酸序列是序列表中序列10的蛋白质;
A7)氨基酸序列是序列表中序列12的蛋白质;
A8)氨基酸序列是序列表中序列14的蛋白质;
A9)氨基酸序列是序列表中序列16的蛋白质;
A10)氨基酸序列是序列表中序列24的蛋白质;
A11)氨基酸序列是序列表中序列26的蛋白质;
A12)将A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的且具有相同功能的由A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)衍生的或与A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A13)在A1)、A2)、A3)、A4)、A5)、A6)、A7)、A8)、A9)、A10)或A11)的N末端或/和C末端连接蛋白标签得到的融合蛋白质。
2.根据权利要求1所述的应用,其特征在于:所述植物为下述任一种:
C1)双子叶植物,
D1)单子叶植物,
D2)禾本目植物,
D3)禾本科植物,
D4)高粱属植物,
D5)高粱,
E1)狗尾草属植物,
E2)谷子。
3.与权利要求1或2中所述蛋白质相关的生物材料的下述任一种应用:
Q1、所述生物材料在调控植物种子包壳性状中的应用,
Q2、所述生物材料在抑制植物种子包壳性状中的应用,
Q3、所述生物材料在植物育种中的应用,
Q4、所述生物材料在植物裸粒品种改良中的应用;
所述生物材料为下述B1)至B9)中的任一种:
B1)编码权利要求1中所述蛋白质的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因植物细胞系、或含有B2)所述表达盒的转基因植物细胞系;
B6)含有B1)所述核酸分子的转基因植物组织、或含有B2)所述表达盒的转基因植物组织;
B7)含有B1)所述核酸分子的转基因植物器官、或含有B2)所述表达盒的转基因植物器官;
B8)提高或促进权利要求1中所述蛋白质的编码基因的表达或权利要求1中所述蛋白质的活性的核酸分子;
B9)含有B8)所述核酸分子的表达盒、重组载体、重组微生物或转基因植物细胞系。
4.根据权利要求3所述的应用,其特征在于:B1)所述核酸分子为如下b1)、b2)、b3)、b4)、b5)、b6)、b7)、b8)、b9)、b10)或b11)所示的所述蛋白质的编码基因:
b1)编码链的编码序列是序列表中序列1的核苷酸的DNA分子或序列3的cDNA分子;
b2)编码链的编码序列是序列表中序列4的核苷酸的DNA分子或序列6的cDNA分子;
b3)核苷酸是序列表中序列6的第1-372位cDNA分子;
b4)编码链的编码序列是序列表中序列7核苷酸的cDNA分子或DNA分子;
b5)编码链的编码序列是序列表中序列9核苷酸的cDNA分子或DNA分子;
b6)编码链的编码序列是序列表中序列11核苷酸的cDNA分子或DNA分子;
b7)编码链的编码序列是序列表中序列13核苷酸的cDNA分子或DNA分子;
b8)编码链的编码序列是序列表中序列15核苷酸的cDNA分子或DNA分子;
b9)编码链的编码序列是序列表中序列23核苷酸的cDNA分子或DNA分子;
b10)编码链的编码序列是序列表中序列25核苷酸的cDNA分子或DNA分子;
b11)与b1)、b2)、b3)、b4)、b5)、b6)、b7)、b8)、b9)或b10)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
5.调控基因表达的物质在培育裸粒植物中的应用,所述基因编码权利要求1中所述蛋白质。
6.一种培育裸粒植物的方法,包括提高或促进目的植物中权利要求1中所述蛋白质的活性或含量或/和权利要求1中所述蛋白质的编码基因的表达量或敲除权利要求1中所述蛋白质的C端,从而得到裸粒植物。
7.根据权利要求6所述的方法,其特征在于:所述提高或促进目的植物中权利要求1中所述蛋白质的活性或含量或/和权利要求1中所述蛋白质的编码基因的表达量是通过将权利要求1中所述蛋白质的编码基因导入所述目的植物实现的。
8.检测高粱基因组中InDel-1位点的多态性、InDel-2位点的多态性、InDel-3位点的多态性和/或SNP3位点的多态性的物质的下述任一种应用:
F1)在鉴定或辅助鉴定高粱种子包壳性状中的应用;
F2)在高粱育种或品质改良中的应用;
所述InDel-1位点的多态性对应于下述3种情况:1-1)序列表中序列1的第4158位核苷酸为G;1-2)序列表中序列1的第4157-4158位核苷酸之间插入5’-GTGGC-3’这5个核苷酸;1-3)序列1的第4158位核苷酸G缺失;
所述SNP3位点的多态性,对应于序列表中序列1的第4243位核苷酸为A或C;
所述InDel-2位点的多态性,对应于序列表中序列1的第4170位核苷酸为C或在序列表中序列1的第4169-4170位核苷酸之间插入核苷酸是序列表中序列27所示的165bp的DNA片段;
所述InDel-3位点的多态性,对应于序列表中序列1的第4255位核苷酸为C或将序列表中序列1的第4255位核苷酸缺失。
9.根据权利要求8所述的应用,其特征在于:所述检测高粱基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性的物质为如下H1)、H2)或H3):
H1)所述检测高粱基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性的物质含有扩增包括所述InDel-1、InDel-2、InDel-3或SNP3位点在内的高粱基因组DNA片段的PCR引物;
H2)所述检测小麦基因组中InDel-1、InDel-2、InDel-3或SNP3位点的多态性的物质为含有H1)所述PCR引物的PCR试剂;
H3)含有H1)所述PCR引物或H2)所述PCR试剂的试剂盒。
10.根据权利要求9所述的应用,其特征在于:所述PCR引物为P1、P2或P3:
P1、所述PCR引物为由核苷酸序列是序列表中序列17的单链DNA和核苷酸序列是序列表中序列18的单链DNA组成的引物组;
P2、所述PCR引物为由核苷酸序列是序列表中序列19的单链DNA和核苷酸序列是序列表中序列20的单链DNA组成的引物组;
P3、所述PCR引物为由核苷酸序列是序列表中序列21的单链DNA和核苷酸序列是序列表中序列22的单链DNA组成的引物组。
CN202111158546.6A 2021-09-30 2021-09-30 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用 Pending CN115894644A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111158546.6A CN115894644A (zh) 2021-09-30 2021-09-30 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111158546.6A CN115894644A (zh) 2021-09-30 2021-09-30 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用

Publications (1)

Publication Number Publication Date
CN115894644A true CN115894644A (zh) 2023-04-04

Family

ID=86484554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111158546.6A Pending CN115894644A (zh) 2021-09-30 2021-09-30 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用

Country Status (1)

Country Link
CN (1) CN115894644A (zh)

Similar Documents

Publication Publication Date Title
CN111763682B (zh) ZmSBP12基因在调控玉米抗旱性、株高及穗位高中的用途
CN111118030B (zh) 调控玉米叶夹角的dna序列及其突变体、分子标记、检测引物和应用
CN110218810B (zh) 调控玉米雄穗构型的启动子、分子标记及其应用
CN110079534B (zh) 调控玉米开花期的基因、启动子及其应用
CN107759676B (zh) 一种植物直链淀粉合成相关蛋白Du15与其编码基因及应用
CN111153974A (zh) 玉米抗病基因和分子标记及其应用
CN108291234A (zh) 倍数孢子体形成基因
CN108642065B (zh) 一种水稻胚乳粉质相关基因OsSecY2及其编码蛋白质和应用
CN114410651B (zh) 玉米灰斑病抗性相关蛋白及其编码基因与应用
CN114369147B (zh) Bfne基因在番茄株型改良和生物产量提高中的应用
CN113832179B (zh) ZmELF3.1蛋白及其功能缺失突变体在调控作物雄穗分支数中的应用
CN112457380A (zh) 调控植物果形和/或果汁含量的蛋白质及其相关生物材料和应用
CN113322265A (zh) 西瓜ClCOMT1基因及其在调控植物内源褪黑素含量中的应用
CN109971763A (zh) 花期调控基因cmp1和相关的载体及其应用
CN113980919B (zh) 调控玉米穗腐病抗性的dna序列及其突变体、分子标记和应用
CN107446031B (zh) 一种植物谷蛋白转运储藏相关蛋白OsVHA-E1及其编码基因与应用
CN113817033B (zh) ZmELF3.1蛋白及其功能缺失突变体在调控作物气生根数目或层数的应用
CN112195187B (zh) 一种水稻分蘖角度调控基因及其编码的蛋白和应用
CN114958867A (zh) 玉米穗粒重和产量调控基因kwe2、其编码蛋白、功能标记、表达载体及应用
CN115894644A (zh) 控制高粱种子包壳性状的gc1蛋白及其编码基因的应用
CN114540375B (zh) 调控玉米开花期和光周期适应性的基因、分子标记及其应用
CN106349353B (zh) 一种调控植物淀粉合成相关蛋白OsFSE及其编码基因与应用
CN113462661B (zh) 从玉米中分离的siz1蛋白及其编码基因和在品种改良中的应用
CN113215187A (zh) 一种利用CRISPR/Cas9技术快速获得香稻材料的方法
CN112522284B (zh) 水稻抗褐飞虱基因Bph40及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination