一种茶树表儿茶素没食子酸酯含量连锁的分子标记位点及其
应用
技术领域
本发明涉及分子遗传育种技术领域,更具体地,涉及一种茶树表儿茶素没食子酸酯(epicatechin-3-gallate,ECG)含量连锁的分子标记位点及其应用。
背景技术
茶(Camellia sinensis(L.)O.Kuntze)属于山茶科山茶属茶组,起源于中国的西南地区,距今有5000多年的栽培历史。茶叶与咖啡、可可并称为世界三大无酒精饮料,有着重要的经济价值,并对社会和文化有着重要影响。
茶树新稍中的特征性次级代谢产物儿茶素类化合物是茶叶滋味的主要影响因子。儿茶素化合物是2-苯基苯并吡喃的衍生物,属类黄酮化合物中的黄烷-3-醇类,占茶叶干重的12%~24%。根据其B环的羟基数目、C环上2,3位同分异构体、C环上3位是否连接没食子基团,儿茶素类化合物可分为C(儿茶素,catec hin)、GC(没食子儿茶素,gallocatechin)、EGC(表没食子儿茶素,epigalloc atechin)、EC(表儿茶素,epicatechin)、EGCG(表没食子儿茶素没食子酸酯,epigallocatechin-3-gallate)、GCG(没食子儿茶素没食子酸酯,Gallocatechin gal late)、ECG(表儿茶素没食子酸酯,epicatechin-3-gallate)和CG(儿茶素没食子酸酯,Catechin gallate),它们与茶汤的苦涩味相关。
茶叶的次生代谢产物不仅影响茶叶品质,还具有多种生理功能。表儿茶素没食子酸酯(epicatechin-3-gallate,ECG)具有抗菌抗氧化作用,对普通变形杆菌、金葡球菌、表皮葡萄球菌、变形链球菌、肉毒杆菌、乳酸杆菌、霍乱弧菌等许多致病菌,尤其是对肠道致病菌具有不同程度的抑制和杀伤作用。同时表儿茶素没食子酸酯还能有效地防止耐抗生素的葡萄球菌感染,对于溶血素ECG和EGCG也具有抑制活性。除此以外,对能引起人体皮肤病的病原真菌,如头部白癣、斑状水泡白癣、汗状泡白癣和顽癣等寄生性真菌也具有很强的抑制作用。
目前茶树育种主要通过常规方法进行,从野生群体、杂交后代中选择优良单株进行系统选育。该方法时间长、效率低,使得新品种更新换代慢,不能快速满足大众对新产品的需求。分子标记辅助育种由于可以在苗期对育种材料进行选择,可显著提高育种效率。
发掘与茶树优良性状紧密连锁的分子标记是开展茶树分子标记辅助选择育种的基础,但是目前由于传统QTL定位研究进展的局限,一直未能找到影响表儿茶素没食子酸酯含量的SNP分子标记位点。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种茶树表儿茶素没食子酸酯含量连锁的分子标记位点及其应用。
本发明的第一个目的是提供一种茶树表儿茶素没食子酸酯含量数量性状连锁的分子标记。
本发明的第二个目的是提供所述分子标记在评价茶树表儿茶素没食子酸酯含量中的应用。
本发明的第三个目的是提供所述分子标记的引物。
本发明的第四个目的是提供所述引物在评价茶树表儿茶素没食子酸酯含量中的应用。
本发明的第五个目的是提供一种评价茶树表儿茶素没食子酸酯含量的试剂盒。
本发明的第六个目的是提供一种评价茶树表儿茶素没食子酸酯含量的方法。
本发明的第七个目的是提供所述分子标记SNP位点、所述引物、或所述试剂盒在分子辅助育种中的应用。
为了实现上述目的,本发明是通过以下技术方案予以实现的:
发明人经过长期探索性的研究发现了一个与表儿茶素没食子酸酯(epicatechin-3-gallate)连锁的SNP位点分子标记。进一步利用其建立检测该位点的检测方法,可用于评价茶树的表儿茶素没食子酸酯含量,以进一步用于资源筛选和分子育种。
因此本发明要求保护一种茶树表儿茶素没食子酸酯含量数量性状连锁的分子标记,所述分子标记为位于茶树基因组Scaffold89:479585的SNP位点,即SEQ ID NO:1所示核苷酸序列的第501个碱基。
茶树基因组Scaffold89:479585,该位点为G或者为A,其基因型与茶树干物质中表儿茶素没食子酸酯含量显著相关。
通过相关性分析和显著性验证表明,GG基因型样本对应的茶汤干物质中表儿茶素没食子酸含量与AA和GA基因型样本相比具有极显著差异。从统计学上判断,当基因型为双突变GG时,茶叶中干物质中表儿茶素没食子酸含量大概率高于正常平均水平的野生型AA或单突变基因型GA。
本发明所述茶树表儿茶素没食子酸酯含量具体为茶鲜叶干物质表儿茶素没食子酸酯的比例。
所述分子标记SNP位点在评价茶树表儿茶素没食子酸酯含量中的应用,也属于本发明的保护范围。
本发明还要求保护检测所述分子标记的引物,所述引物,其核苷酸序列如SEQ IDNO:2~3所示。
引物F:TCACAAGTGTGGAGGCATTG(SEQ ID NO:2);
引物R:CATTGGCCAGCCAACTATTG(SEQ ID NO:3)。
所述引物在评价茶树表儿茶素没食子酸酯含量中的应用,也属于本发明的保护范围。
进一步,本发明要求保护一种评价茶树表儿茶素没食子酸酯含量的试剂盒,包括检测所述分子标记SNP位点的试剂。
优选地,所述试剂为所述引物,其核苷酸序列如SEQ ID NO:2~3所示。
最优选地,所述试剂盒含有核苷酸序列如SEQ ID NO:2~3所示的引物、2×TaqPCR Master Mix、ddH2O。
其使用方法为:
(1)采用CTAB法提取茶树嫩芽总DNA,并确保每个DNA样品的A260/A280在1.8~2.0之间,浓度大于100μg/μl;
(2)PCR扩增
PCR体系(10μl)如下:
2×Taq PCR Master Mix |
5μl |
引物 |
各0.5μl |
DNA template |
1μl |
ddH<sub>2</sub>O |
3μl |
PCR扩增程序如下:
(3)产物纯化
将PCR扩增产物进行凝胶电泳,之后使用市售凝胶电泳DNA回收试剂盒进行回收纯化。
(4)测序及结果判读
将回收纯化的产物送测序公司进行Sanger法测序,在Scaffold89:479585位点,当基因型为双突变GG时,茶树中干物质中表儿茶素没食子酸含量大概率高于正常平均水平的野生型AA或单突变基因型GA。
同时,本发明要求保护一种评价茶树表儿茶素没食子酸酯含量的方法,检测所述的分子标记SNP位点的基因型。
优选地,利用所述引物检测所述的分子标记SNP位点的基因型。
所述分子标记、所述引物、所述试剂盒、或所述试剂盒在分子辅助育种中的应用,也属于本发明的保护范围。
与现有技术相比,本发明具有如下有益效果:
本发明首次发现了与茶树表儿茶素没食子酸酯含量相关的SNP分子标记位点,其位于茶树基因组Scaffold89:479585上,其基因型与表儿茶素没食子酸酯含量极显著相关,GG基因型样本对应的茶汤干物质中表儿茶素没食子酸酯含量与AA和GA基因型样本相比具有极显著差异。从统计学上判断,当基因型为双突变GG时,茶树中干物质中表儿茶素没食子酸含量大概率高于正常平均水平的野生型AA或单突变基因型GA。进一步建立检测该位点的检测方法,可用于评价茶树的表儿茶素没食子酸酯含量,以进一步用于茶树资源筛选及分子育种。这是开展茶树分子标记辅助选择育种的基础,有很大的研究价值。
附图说明
图1为全基因组关联分析所用群体在不同季节的表儿茶素没食子酸酯含量。
图2为Scaffold89:479585位点与引物示意图,N表示Scaffold89:479585位置上的待测碱基,加粗并下划线部分为上下游引物。
图3为样本2-10在Scaffold89:479585位点的基因型SNaPshot测序结果。
图4为样本2-19在Scaffold89:479585位点的基因型SNaPshot测序结果。
图5为样本2-27在Scaffold89:479585位点的基因型SNaPshot测序结果。
具体实施方式
下面结合说明书附图和具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
实施例1
采集位于广东省茶树种质资源库(广东,英德,113.3OE,24.3ON)的191份茶树材料,其中广东124份、福建20份、广西15份,浙江9份,湖南6份,云南6份,江西1份,贵州1份,台湾1份。另外8份肯尼亚茶种后代,1份格鲁吉亚种后代,所选材料具有广泛代表性。
所选用的资源随机分布在资源库中。采用双行单株种植,每行4m,行距1.5m,株距35cm。资源库进行常规水肥管理。在2016年年末对资源进行修剪并深坑施基肥,每亩4吨有机肥、0.75吨花生麸和10斤复合肥。2017年春茶及夏茶之后进行修剪并在根外追肥,每亩30斤复合肥和60斤尿素。分别在2017年的3月15日、6月25日和9月28日采摘茶树新梢一芽二叶,制作蒸青样,并按照水浸提法制备茶汤。
二、表型数据分析
1、实验步骤
利用高效液相色谱法对茶汤中与茶树滋味相关的表儿茶素没食子酸酯,[epicatechin-3-gallate](ECG)进行检测,参照国标法进行检测。
利用SPSS软件对表儿茶素没食子酸酯含量的指数大小范围、平均值、标准差和变异系数进行分析。将数量性状以0.5个标准差,将数据分为10个等级,用于计算性状的Shannon-Wiener多样性指数。使用最佳线性无偏预测(Best Liner Unbiased Prediction,BLUP)方法,采用一年多点模型估计育种值,同时估算广义遗传力。
2、实验结果
表儿茶素没食子酸酯含量见表1。
表1不同季度不同种质资源样本ECG占干物质的百分比
群体的表儿茶素没食子酸酯含量变异情况见表2和图1。
表2 ECG性状(表儿茶素没食子酸酯含量)表型变异
三、基因型和性状关联分析
1、实验步骤
采用CTAB法提取191个茶树资源嫩芽总DNA,并确保每个DNA样品的A260/A280在1.8~2.0之间,浓度大于100μg/μl。将提取好的DNA样品,检测分别位于“舒茶早”CSS栽培种茶树基因组(http://tpia.teaplant.org/index.html)的SNP位点(Scaffold89:479585)的基因型,进行性状和标记的关联分析,关联的显著性水平以P值进行判断,p值小于1.25E-05为显著性水平。
2、实验结果
该SNP位点不同季节的P值见表3。
表3不同季节Scaffold89:479585位点的P值
实施例2分子标记在另外一个群体中的验证
一、实验方法
将位于Scaffold89:479585的SNP位点在另一个含98个种质的群体中进行验证。
1、检测各样本的表儿茶素没食子酸酯含量。具体检测方法同实施例1。
2、利用SnaPShot技术平台检测各样本的Scaffold89:479585的SNP位点的基因型。
该方法针对不同突变位点设计不同长度的引物SNaPshot反应后,产物通过电泳分离、五色荧光检测、Gene mapper分析,可在一个测序反应中检测多个SNP位点。应用SNaPshot进行定点的序列分析,其基本原理遵循了DNA直接测序中的双脱氧终止法,所不同的是PCR反应中只有不同荧光标记的ddNTP。由于每个SNP位点的引物3′端都紧靠SNP点,因此每一种引物在聚合酶作用下,根据模板的的序列,只延伸一个核苷酸。然后用先进的荧光检测系统,检测延伸的那个核苷酸的种类。
(1)引物设计
根据Scaffold89:479585在基因组的位置设计引物并进行合成。其中,Scaffold89:479585上下游各延伸500bp。其核苷酸序列如SEQ ID NO:1所示(图2,其中N表示Scaffold89:479585位置上的待测碱基)。
PCR引物:
F:TCACAAGTGTGGAGGCATTG(SEQ ID NO:2);
R:CATTGGCCAGCCAACTATTG(SEQ ID NO:3)。
单碱基延伸引物:
gactgactgactTTAACATAACCCCAAAGAGTTTA。
(2)PCR扩增
PCR体系(10μl)如下:
2×Taq PCR Master Mix |
5μl |
PrimerMix(按扩增情况配比) |
1μl |
DNA template |
1μl |
ddH<sub>2</sub>O |
3μl |
PCR扩增程序如下:
(3)PCR产物纯化
(3)PCR产物纯化
使用虾碱酶纯化法进行纯化。虾碱酶MIX(EX-SAP)的主要功能成分为SAP及ExoI.SAP酶,可以将残余dNTPs去磷酸化,ExoI降解游离单链引物。取4μl的PCR产物,加入2μl的EX-SAP酶。具体反应体系如下所示:
消化体系组分 |
体积(μl) |
ddH<sub>2</sub>O |
0.75 |
SAP(1U/μl) |
0.5 |
ExoI(5U/μl) |
0.15 |
10*SAP buffer |
0.6 |
PCR产物 |
4 |
总体积 |
6 |
之后在PCR仪上进行消化温育:37℃40min,85℃5min,4℃forever。
(4)SNaPshot反应
PCR产物当做模板进行SNaPshot反应。
SNaPshot反应体系如下所示:
试剂 |
用量(μl) |
SNaPshot Mix |
0.5 |
Pooled PCR Products |
3 |
Pooled Primers |
1 |
dH<sub>2</sub>O |
0.5 |
总体积 |
5 |
SNaPshot反应程序为:
之后,对SNaPshot产物进行纯化,直接向SNaPshot反应产物中加入2μl的SAP mix,具体反应体系如下:
组分 |
体积(μl) |
水 |
0.9 |
SAP(1U/μl) |
0.5 |
10*SAP buffer |
0.6 |
总计 |
2 |
在PCR仪上进行SNaPshot产物消化反应,反应程序为:37℃40min,75℃15min,4℃forever。
(5)上机检测
取2μL消化后的SNaPshot反应产物加入到8μL含有0.4%LIZ120的去离子甲酰胺中,95℃变性5min,然后放-20℃骤冷,然后上3730XL测序。
(6)结果分析
用GeneMarker分析得到的.fsa结果,导出峰图及表格文件,并统计出每个样品的SNP突变型。
二、实验结果
各样本的表儿茶素没食子酸酯含量及Scaffold89:479585的SNP位点的基因型见表4,部分样本SNaPshot测序结果见图3到图5。
表4验证群体中资源样本ECG的占干物质的含量及基因型
显著性分析结果显示,Scaffold89:479585的基因型与表儿茶素没食子酸酯含量极显著相关,相关系数为0.32,p-value为3.65×10-3,F值(6.91/3.94)为8.89,为隐性突变,GG基因型样本对应的茶汤干物质中表儿茶素没食子酸酯含量与AA和GA基因型样本相比具有极显著差异。从统计学上判断,当基因型为双突变GG时,茶树中干物质中表儿茶素没食子酸含量大概率高于正常平均水平的野生型AA或单突变基因型GA。
实施例3一种评价茶树表儿茶素没食子酸酯含量的试剂盒
一、组成
其核苷酸序列如SEQ ID NO:2~3所示的引物、2×Taq PCR Master Mix、ddH2O。
其中,引物F:TCACAAGTGTGGAGGCATTG(SEQ ID NO:2);
引物R:CATTGGCCAGCCAACTATTG(SEQ ID NO:3)。
二、使用方法
(1)采用CTAB法提取茶树嫩芽总DNA,并确保每个DNA样品的A260/A280在1.8~2.0之间,浓度大于100μg/μl;
(2)PCR扩增
PCR体系(10μl)如下:
2×Taq PCR Master Mix |
5μl |
引物 |
各0.5μl |
DNA template |
1μl |
ddH<sub>2</sub>O |
3μl |
PCR扩增程序如下:
(3)产物纯化
将PCR扩增产物进行凝胶电泳,之后使用市售凝胶电泳DNA回收试剂盒进行回收纯化。
(4)测序及结果判读将回收纯化的产物送测序公司进行Sanger法测序,将测序结果与SEQ ID NO:1所示核苷酸序列进行比对,根据图2所示(加粗并下划线部分为上下游引物),Scaffold89:479585位点位于扩增产物的第31个碱基。从统计学上判断,当基因型为双突变GG时,茶树中干物质中表儿茶素没食子酸含量大概率高于正常平均水平的野生型AA或单突变基因型GA。
实施例4一种评价茶树表儿茶素没食子酸酯含量的试剂盒的应用
一、实验方法
用实施例3的试剂盒检测实施例2中的98个茶树样本。
二、实验结果
检测结果与实施例2采用SnaPShot技术平台检测的结果一致,本试剂盒可以用于评价茶树表儿茶素没食子酸酯含量。
序列表
<110> 广东省农业科学院茶叶研究所
<120> 一种茶树表儿茶素没食子酸酯含量连锁的分子标记位点及其应用
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1001
<212> DNA
<213> Camellia sinensis
<400> 1
aaaactagga atgtcaaaat agaaaatgtc aaaatagggc acagtctgta atataattta 60
tttatttttt aaatcatcat gatccatttc cttggattga tgacgatttc aaaaataaaa 120
aataaaaaat aaattcgagc atggaagaaa tcgaagattg ttttcaccca tttctttttc 180
tttttttttt ttttcagagg ggaaatttgt ttatataatc aaactttgtc atcttcgttc 240
atatttctta aaaaaattaa tttaatttcc cgtctacacc cagtaatagc acacagaata 300
acccaacaaa cccgcctgaa aaagatttaa aacaatgtgg tcccggaaat cccttgtcat 360
tagtgttagc aacatgttta ttgttgatac aatatgttat attaaatcac tagcggccaa 420
acctcatctg ctagtgacac attcagaaac aaagatccga actatctaaa tcacaagtgt 480
ggaggcattg aagaagatat ntaaactctt tggggttatg ttaatgagtt ttgctcgaga 540
tttgcttgat tcatgtggca ggacgctttg agtgaatctt gagattattc aagatatgcg 600
taaattaatt cggacactct gtcatcaaaa ttgaacaagg tattggttta ggacttgact 660
caaatatgca accactggaa ttcgtagaca caatagttgg ctggccaatg ccacgcctat 720
ggttccaaca cctaccaaca gatctcacga aaaagcattt ctcaactaat gcttgaacgg 780
ctcaacgata ccctcatact catccaagtg atttatgtat tggtttatct tgtcaaacta 840
catggacttg tgttaatccc agtaatgtgt gtataaatta aatgtataaa taaaataaaa 900
ataaataatt cagaaaataa ttttatgaat taaattctga attaaggctt acagaaaatt 960
taaacgttaa gacttgtgtt ggatacaatc tccttaaagt a 1001
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcacaagtgt ggaggcattg 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cattggccag ccaactattg 20