CN111534630B

CN111534630B - 与油茶种仁含油率相关的snp分子标记及其应用

Info

Publication number: CN111534630B
Application number: CN202010477542.3A
Authority: CN
Inventors: 林萍; 任华东; 王开良
Original assignee: Research Institute of Subtropical Forestry of Chinese Academy of Forestry
Current assignee: Research Institute of Subtropical Forestry of Chinese Academy of Forestry
Priority date: 2020-05-29
Filing date: 2020-05-29
Publication date: 2023-07-14
Anticipated expiration: 2040-05-29
Also published as: CN111534630A

Abstract

本发明涉及分子标记技术领域，具体涉及与油茶种仁含油率相关的SNP分子标记及其应用。本发明提供了48个与油茶种仁含油率高度关联的SNP分子标记，可以解释10.23％～32.66％的含油率表型方差。通过检测该批SNP分子标记，可在苗期进行鉴定和辅助筛选，能够大大节约生产成本，提高选择效率。在油茶育种中，选择本发明的分子标记及其检测方法鉴定出高含油率油茶进行育种，可提高油茶育种的选择效率，加快育种进程。

Description

与油茶种仁含油率相关的SNP分子标记及其应用

技术领域

本发明涉及分子标记技术领域，具体涉及与油茶种仁含油率相关的SNP分子标记及其应用。

背景技术

油茶(Camellia oleifera Abel.)隶属山茶科(Theaceae)山茶属(Camellia L.)，是木本油料树种。油茶籽油含有丰富的营养物质，是一种优质的食用油，其不饱和脂肪酸含量达90％以上，以油酸和亚油酸为主。油茶籽油具有抗氧化、抗肿瘤、降血脂等功效，具有较高的营养保健价值。目前，以选择和杂交育种为主要手段、以产果量为主要育种目的的油茶育种已取得了重要进展，但以提高种仁含油率、改良油脂品质为目的的育种研究仍较少。油茶的常规育种周期长，新品种选育缓慢，良种选育速度还不能满足产业发展的需求，这已成为限制油茶产业发展的重要因素之一。

相比于传统育种技术，分子标记辅助育种可从苗期开始选择，大幅缩短育种周期，对以果实为主要目的的经济林育种优势尤其明显。分子标记辅助育种离不开有效的分子标记，因此，开发与油茶种仁含油率、油脂品质表型相关的分子标记，对于油茶油脂产量和品质的分子标记辅助育种及相关性状的遗传改良具有重要意义。

果实产量、鲜果出籽率、种仁含油率等指标直接决定单位面积油茶产(油)量，因此，开展油茶种仁含油率研究，是提高油茶产量的重要途径之一，对油茶产业的提升和健康发展具有十分重要的意义。

发明内容

本发明的目的之一在于提供与油茶种仁含油率相关的SNP分子标记，本发明的另一目的是提供所述SNP分子标记在油茶含油率表型鉴定和育种中的应用。

本发明提供的与油茶种仁含油率关联位点的开发方法是基于油茶是典型的异交物种，连锁不平衡(LD)通常在较小范围内迅速消减，因此可以开展重要性状的LD作图。油茶的种仁全部转录本作为本发明标记开发的区域。在具备产生了大量明显的遗传变异的油茶自然群体的前提下，可有效开展与油茶种仁含油率变异显著相关的标记开发。

本发明中SNP分子标记的开发过程基本如下：

(1)在油茶全分布区内广泛收集油茶种质资源，建立种仁含油率广泛分离的油茶自然群体。

(2)采集自然群体500份油茶种质的完全成熟种子，用索氏抽提法测定种子含油率。

(3)采集自然群体500个油茶单株的油脂高速合成期的种仁，采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型，TIANGEN试剂盒Code No.DP441)提取总RNA，每样本分别构建cDNA文库，利用Illumina HiSeq^TM4000平台进行二代转录组测序。

(4)采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子，采用RNAprepPure多糖多酚植物总RNA提取试剂盒(离心柱型，TIANGEN试剂盒Code No.DP441)分别提取RNA，各组织RNA等比例混合，构建PacBio SMRTbell文库，在PacBio Sequel平台进行三代转录组测序。测序结果过滤掉低质量数据和冗余序列后，对所有转录本进行注释分析。过程中用到软件LoRDEC((http://www.atgc-montpellier.fr/lordec/)、CD-HIT v4.6(Fu L,NiuB,Zhu Z,Wu S,Li W,2012.CD-HIT:accelerated for clustering the next-generationsequencing data.Bioinformatics 28,3150-2.)、Coding Potential Calculator(CPC)(Kong L,Zhang Y,Ye Z-Q,et al.,2007.CPC:assess the protein-coding potential oftranscripts using sequence features and support vector machine.Nucleic AcidsResearch 35,W345.)和Coding-Non-Coding Index(CNCI)(https://github.com/www-bioinfo-org/CNCI)等是免费公开的。

(5)以(4)中获得的全长转录组序列为参考序列，采用多序列比对法，分析(3)中获得的500个样本转录组序列的SNP位点。SNP数据根据以下原则严格过滤：每个位点只有2个等位基因；基因型缺失率≤20％；最小等位基因频率≥5％；SNP质量值≥100；纯合基因型样本数超过10个；杂合基因型率≤70％。过程中用到软件bcftools v1.9software(http://www.htslib.org/doc/bcftools.html)是公开免费的。

(6)将群体的基因型数据输入GCTA v1.25.2(Jian Y,S Hong L,Goddard ME,Visscher PM,2011.GCTA:a tool for genome-wide complex trait analysis.AmericanJournal of Human Genetics 88,76-82.)软件，进行主成分分析(PCA)。

(7)将群体的基因型数据、前10个主成分(PC)数据、种仁含油率的表型数据以及Kinship矩阵数据输入TASSEL5.0(http://www.maizegenetics.net/tassel)软件中，采用统一混合线性模型方法(MLM)分析SNPs标记和油茶种仁含油率性状的连锁不平衡性，检测到48个位点与油茶种仁含油率极显著关联(P<10^-5，见表1)，对表型变异的贡献率为10.23％～32.66％(表1)。

利用上述技术措施，本发明最终获得了与油茶种仁含油率极显著关联的48个SNP标记，这些标记位于油茶的9个转录本内，具体参见表1。

表1 SNP分子标记信息

具体地，本发明提供如下技术方案：

第一方面，本发明提供与油茶种仁含油率相关的SNP分子标记，所述SNP分子标记选自PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166中的任一个；

其中，SNP分子标记PB.57703.1-685含有如SEQ ID NO.19所示序列第685位的多态性为C/T的核苷酸序列；

具体地，SNP分子标记PB.93518.1-182含有如SEQ ID NO.20所示序列第182位的多态性为T/C的核苷酸序列，SNP分子标记PB.93518.1-191含有如SEQ ID NO.20所示序列第191位的多态性为T/C的核苷酸序列，SNP分子标记PB.93518.1-224含有如SEQ ID NO.20所示序列第224位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-270含有如SEQ IDNO.20所示序列第270位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-284含有如SEQ ID NO.20所示序列第284位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-288含有如SEQ ID NO.20所示序列第288位的多态性为C/T的核苷酸序列；

SNP分子标记PB.103793.1-1118含有如SEQ ID NO.21所示序列第1118位的多态性为A/G的核苷酸序列，SNP分子标记PB.103793.1-1172含有如SEQ ID NO.21所示序列第1172位的多态性为G/A的核苷酸序列，SNP分子标记PB.103793.1-1175含有如SEQ ID NO.21所示序列第1175位的多态性为A/C的核苷酸序列；

SNP分子标记PB.47687.1-148含有如SEQ ID NO.22所示序列第148位的多态性为A/G的核苷酸序列，SNP分子标记PB.47687.1-215含有如SEQ ID NO.22所示序列第215位的多态性为G/T的核苷酸序列，SNP分子标记PB.47687.1-258含有如SEQ ID NO.22所示序列第258位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-264含有如SEQ ID NO.22所示序列第264位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-282含有如SEQ IDNO.22所示序列第282位的多态性为T/C的核苷酸序列，SNP分子标记PB.47687.1-297含有如SEQ ID NO.22所示序列第297位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-360含有如SEQ ID NO.22所示序列第360位的多态性为A/G的核苷酸序列，SNP分子标记PB.47687.1-366含有如SEQ ID NO.22所示序列第366位的多态性为T/C的核苷酸序列，PB.47687.1-367含有如SEQ ID NO.22所示序列第367位的多态性为G/C的核苷酸序列；

SNP分子标记PB.85097.1-125含有如SEQ ID NO.23所示序列第125位的多态性为C/G的核苷酸序列，SNP分子标记PB.85097.1-197含有如SEQ ID NO.23所示序列第197位的多态性为G/C的核苷酸序列，SNP分子标记PB.85097.1-293含有如SEQ ID NO.23所示序列第293位的多态性为A/G的核苷酸序列，SNP分子标记PB.85097.1-356含有如SEQ ID NO.23所示序列第356位的多态性为T/G的核苷酸序列，SNP分子标记PB.85097.1-532含有如SEQ IDNO.23所示序列第532位的多态性为A/T的核苷酸序列；

SNP分子标记PB.35678.1-1129含有如SEQ ID NO.24所示序列第1129位的多态性为G/C的核苷酸序列；

SNP分子标记PB.70158.1-51含有如SEQ ID NO.25所示序列第51位的多态性为G/A的核苷酸序列，SNP分子标记PB.70158.1-187含有如SEQ ID NO.25所示序列第187位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-306含有如SEQ ID NO.25所示序列第306位的多态性为C/T的核苷酸序列，SNP分子标记PB.70158.1-314含有如SEQ ID NO.25所示序列第314位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-408含有如SEQ IDNO.25所示序列第408位的多态性为T/G的核苷酸序列，SNP分子标记PB.70158.1-413含有如SEQ ID NO.25所示序列第413位的多态性为T/A的核苷酸序列，SNP分子标记PB.70158.1-419含有如SEQ ID NO.25所示序列第419位的多态性为A/T的核苷酸序列，SNP分子标记PB.70158.1-473含有如SEQ ID NO.25所示序列第473位的多态性为C/G的核苷酸序列，SNP分子标记PB.70158.1-649含有如SEQ ID NO.25所示序列第649位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-704含有如SEQ ID NO.25所示序列第704位的多态性为G/A的核苷酸序列，SNP分子标记PB.70158.1-707含有如SEQ ID NO.25所示序列第707位的多态性为A/C的核苷酸序列，SNP分子标记PB.70158.1-778含有如SEQ ID NO.25所示序列第778位的多态性为C/T的核苷酸序列，SNP分子标记PB.70158.1-854含有如SEQ ID NO.25所示序列第854位的多态性为A/C的核苷酸序列，SNP分子标记PB.70158.1-930含有如SEQ IDNO.25所示序列第930位的多态性为C/G的核苷酸序列，SNP分子标记PB.70158.1-935含有如SEQ ID NO.25所示序列第935位的多态性为T/G的核苷酸序列，SNP分子标记PB.70158.1-944含有如SEQ ID NO.25所示序列第944位的多态性为A/T的核苷酸序列，SNP分子标记PB.70158.1-1025含有如SEQ ID NO.25所示序列第1025位的多态性为C/T的核苷酸序列；

SNP分子标记PB.76391.3-1354含有如SEQ ID NO.26所示序列第1354位的多态性为A/C的核苷酸序列，SNP分子标记PB.76391.3-1385含有如SEQ ID NO.26所示序列第1385位的多态性为G/A的核苷酸序列，SNP分子标记PB.76391.3-1417含有如SEQ ID NO.26所示序列第1417位的多态性为T/C的核苷酸序列；

SNP分子标记PB.63477.1-1109含有如SEQ ID NO.27所示序列第1109位的多态性为A/G的核苷酸序列，SNP分子标记PB.63477.1-1163含有如SEQ ID NO.27所示序列第1163位的多态性为G/A的核苷酸序列，SNP分子标记PB.63477.1-1166含有如SEQ ID NO.27所示序列第1166位的多态性为A/C的核苷酸序列。

进一步地，本发明的与油茶种仁含油率相关的SNP分子标记可以分别由核苷酸序列如SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ ID NO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ ID NO.15-16、SEQ ID NO.17-18所示的引物对以油茶cDNA为模板经PCR扩增获得。

本发明的与油茶种仁含油率相关的SNP分子标记PB.57703.1-685通过核苷酸序列如SEQ ID NO.1-2所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.57703.1转录本的685bp处的碱基，其多态性为C/T。

本发明的与油茶种仁含油率相关的SNP分子标记PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288通过核苷酸序列如SEQ ID NO.3-4所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.93518.1转录本的182bp、191bp、224bp、270bp、284bp、288bp处的碱基，其多态性分别为T/C、T/C、G/A、G/A、G/A、C/T。

本发明的与油茶种仁含油率相关的SNP分子标记PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175通过核苷酸序列如SEQ ID NO.5-6所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.103793.1转录本的1118bp、1172bp、1175bp处的碱基，其多态性分别为A/G、G/A、A/C。

本发明的与油茶种仁含油率相关的SNP分子标记PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367通过核苷酸序列如SEQ ID NO.7-8所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.47687.1转录本的148bp、215bp、258bp、264bp、282bp、297bp、360bp、366bp、367bp处的碱基，其多态性分别为A/G、G/T、C/T、C/T、T/C、C/T、A/G、T/C、G/C。

本发明的与油茶种仁含油率相关的SNP分子标记PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532通过核苷酸序列如SEQ ID NO.9-10所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.85097.1转录本的125bp、197bp、293bp、356bp、532bp处的碱基，其多态性分别为C/G、G/C、A/G、T/G、A/T。

本发明的与油茶种仁含油率相关的SNP分子标记PB.35678.1-1129通过核苷酸序列如SEQ ID NO.11-12所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.35678.1转录本的1129bp处的碱基，其多态性为G/C。

本发明的与油茶种仁含油率相关的SNP分子标记PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025通过核苷酸序列如SEQ ID NO.13-14所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.70158.1转录本的51bp、187bp、306bp、314bp、408bp、413bp、419bp、473bp、649bp、704bp、707bp、778bp、854bp、930bp、935bp、944bp、1025bp处的碱基，其多态性分别为G/A、A/G、C/T、A/G、T/G、T/A、A/T、C/G、A/G、G/A、A/C、C/T、A/C、C/G、T/G、A/T、C/T。

本发明的与油茶种仁含油率相关的SNP分子标记PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417通过核苷酸序列如SEQ ID NO.15-16所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.76391.3转录本的1354bp、1385bp、1417bp处的碱基，其多态性分别为A/C、G/A、T/C。

本发明的与油茶种仁含油率相关的SNP分子标记PB.63477.1-1109、PB.63477.1-1163、PB.63477.1-1166通过核苷酸序列如SEQ ID NO.17-18所示的引物对以油茶cDNA为模板经PCR扩增获得，扩增产物含有位于油茶PB.63477.1转录本的1109bp、1163bp、1166bp处的碱基，其多态性分别为A/G、G/A、A/C。

本发明提供了上述48个SNP分子标记在鉴定油茶种仁含油率表型中的应用，各位点的基因型及其对应的油茶种仁含油率表型如表2所示。

表2

序号	SNP分子标记	高含油率基因型	低含油率基因型
				1	PB.57703.1-685	CT/TT	CC
2	PB.93518.1-182	TC/TT	CC
				3	PB.93518.1-191	TC/TT	CC
4	PB.93518.1-224	GA/GG	AA
				5	PB.93518.1-270	GA/GG	AA
6	PB.93518.1-284	GA/GG	AA
				7	PB.93518.1-288	CC/CT	TT
8	PB.103793.1-1118	AA/AG	GG
				9	PB.103793.1-1172	GA/GG	AA
10	PB.103793.1-1175	AA/AC	CC
				11	PB.47687.1-148	AG/GG	AA
12	PB.47687.1-215	GT/TT	GG
				13	PB.47687.1-258	CT/TT	CC
14	PB.47687.1-264	CT/TT	CC
				15	PB.47687.1-282	CC/CT	TT
16	PB.47687.1-297	CT	CC/TT
				17	PB.47687.1-360	AG/GG	AA
18	PB.47687.1-366	TC/CC	TT
				19	PB.47687.1-367	GC/CC	GG
20	PB.85097.1-125	GC/GG	CC
				21	PB.85097.1-197	GC/GG	CC
22	PB.85097.1-293	AA/AG	GG
				23	PB.85097.1-356	TG/TT	GG
24	PB.85097.1-532	AA/AT	TT
				25	PB.35678.1-1129	GC/GG	CC
26	PB.70158.1-51	GA/GG	AA
				27	PB.70158.1-187	AA/AG	GG
28	PB.70158.1-306	CC/CT	TT
				29	PB.70158.1-314	AA/AG	GG
30	PB.70158.1-408	TG/TT	GG
				31	PB.70158.1-413	TA/TT	AA
32	PB.70158.1-419	AA/AT	TT
				33	PB.70158.1-473	CC/CG	GG
34	PB.70158.1-649	AA/AG	GG
				35	PB.70158.1-704	GA/GG	AA
36	PB.70158.1-707	AA/AC	CC
				37	PB.70158.1-778	CC/CT	TT
38	PB.70158.1-854	AA/AC	CC
				39	PB.70158.1-930	CC/CG	GG
40	PB.70158.1-935	TT/TG	GG
				41	PB.70158.1-944	TT	AT/AA
42	PB.70158.1-1025	CC/CT	TT
				43	PB.76391.3-1354	AA/AC	CC
44	PB.76391.3-1385	GA/GG	AA
				45	PB.76391.3-1417	TT/TC	CC
46	PB.63477.1-1109	AA/AG	GG
				47	PB.63477.1-1163	GA/GG	AA
48	PB.63477.1-1166	AA/AC	CC

本发明所述的含油率为油茶种仁的含油率。

各SNP分子标记可分别单独用于或联合用于油茶种仁含油率表型的鉴定，联合使用时鉴定的准确率更高。

本发明还提供与油茶种仁含油率相关的SNP分子标记组合，其包括PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166中的至少两个。

第二方面，本发明提供用于扩增所述SNP分子标记或其组合的引物。

作为本发明的一种实施方式，所述引物包括以下引物中的一对或多对：

如SEQ ID NO.1-2所示的PB.57703.1-685的引物；

如SEQ ID NO.3-4所示的PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288的引物；

如SEQ ID NO.5-6所示的PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175的引物；

如SEQ ID NO.7-8所示的PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367的引物；

如SEQ ID NO.9-10所示的PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532的引物；

如SEQ ID NO.11-12所示的PB.35678.1-1129的引物；

如SEQ ID NO.13-14所示的PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025的引物；

如SEQ ID NO.15-16所示的PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417的引物；

如SEQ ID NO.17-18所示的PB.63477.1-1109、PB.63477.1-1163、PB.63477.1-1166的引物。

本发明还提供含有所述引物的试剂或试剂盒，所述试剂或试剂盒包含如前所述引物中的一对或多对。

第三方面，本发明提供所述的SNP分子标记或所述的SNP分子标记组合或所述的试剂或试剂盒的以下任一应用：

(1)在鉴定油茶种仁含油率表型中的应用；

(2)在油茶种质资源鉴定、改良或分子标记辅助育种中的应用，所述油茶种质资源鉴定、改良或分子标记辅助育种的性状为油茶种仁含油率；

(3)在油茶种仁含油率的早期预测中的应用；

(4)在筛选高含油率油茶中的应用。

在利用本发明提供的48个SNP分子标记进行油茶种仁中含油率表型鉴定或分子标记辅助育种时，本领域技术人员根据需要可以选择其中任意一个分子标记或多个分子标记的组合。多个标记联合使用，鉴定的准确率更高。

第四方面，本发明提供鉴定油茶种仁含油率表型的方法，包括：

(1)提取待鉴定油茶的总RNA，反转录合成cDNA；

(2)以cDNA为模板，利用上述的引物(SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ IDNO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ IDNO.15-16、SEQ ID NO.17-18)中的一对或多对进行PCR扩增；

(3)分析PCR扩增产物中上述的SNP分子标记或SNP分子标记组合的基因型，根据所述基因型判断待鉴定油茶的种仁含油率表型。

上述方法的步骤(1)中，所述待鉴定油茶可以为任何育种材料，包括自然群体个体和有性群体个体。

提取油茶总RNA采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型，TIANGEN试剂盒Code No.DP441)。反转录合成单链cDNA采用PrimeScript RT Master Mix试剂盒(TaKaRa,大连，中国)。

步骤(2)中，所述PCR扩增的反应程序为：94～95℃，3～5min；94～95℃，15～30s，65～69℃，40～60s，38～45个循环；67～70℃，3～6min。优选为，95℃，3min，1个循环预变性；95℃，15s变性，68℃，45s延伸，40个循环；68℃，5min，1个循环彻底延伸。

步骤(2)中，在所述扩增后，通过琼脂糖凝胶电泳检测并回收所得到的PCR产物。

作为一种实施方案，所述琼脂糖凝胶电泳中，琼脂糖凝胶的浓度为1.2％。胶回收使用AxyPrep DNA凝胶回收试剂盒(AxyGEN,Code No.AP-GX-50)。

步骤(3)中，分析SNP分子标记的基因型可采用本领域常规技术手段，例如测序等，可以SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ ID NO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ ID NO.15-16、SEQ ID NO.17-18为测序引物进行测序。

步骤(3)中所述判断待鉴定油茶的含油率表型的方法为：

根据表2中所示的SNP分子标记中多态性位点的基因型及油茶种仁含油率表型的对应关系中的一组或多组进行判断。以PB.57703.1-685为例，若该SNP分子标记的基因型为C/T或T/T时，待鉴定油茶为高含油率，若该SNP分子标记的基因型为C/C，则待鉴定油茶为低含油率或候选低含油率。其它位点基因型及其在油茶含油率鉴定中的应用参见表2。

作为优选方案，当扩增产物中包含48个所述SNP分子标记中的多态性位点时，若超过39个位点为高含油率基因型，则待鉴定油茶为高含油率表型；若少于等于30个位点为高含油率基因型，则待鉴定油茶为低含油率表型；更优选若少于等于28个位点为高含油率基因型，则待鉴定油茶为低含油率表型。

进一步优选的，所述的39个高含油率基因型位点中包含PB.70158.1-930、PB.70158.1-935、PB.103793.1-1118、PB.103793.1-1172和PB.103793.1-1175中的多态性位点。

本领域人员可以参照上述鉴定油茶种仁含油率表型的方法，对种仁为高含油率表型的油茶进行鉴定和筛选。

本发明的有益效果在于：本发明开发了48个与油茶种仁含油率高度关联的SNP位点，可以解释10.23％～32.66％的含油率表型方差。利用这48个标记对有性油茶群体进行了辅助选择，结果表明，在48个位点中超过39个位点为高含油率基因型的单株中，76.58％的个体其种仁含油率高于群体种仁含油率平均值；在48个位点中高含油率基因型少于等于30个位点的个体中，80％的个体其种仁含油率低于群体平均值；在48个位点中高含油率基因型少于等于28个位点的个体中，87.10％的个体其种仁含油率低于群体平均值。这表明这些标记用于辅助选择是切实有效的。

在油茶常规选择育种中，种仁含油率性状的鉴定需要幼苗造林5-6年才能鉴定，费时费力。本发明中的SNP位点位置明确，检测方法方便快速，不受环境影响，目的性更强，工作量小，效率更高，成本低。因此，通过检测该批SNP位点，可在苗期进行鉴定和辅助筛选，大大节约生产成本和提高选择效率。在油茶育种中，可选择本发明的分子标记及其检测方法鉴定高含油率油茶进行育种，可提高油茶育种的选择效率，加快育种进程。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。若未特别指明，实施例中所用的技术手段为本领域技术人员所熟知的常规手段。

以下实施例中所用的自然群体材料500份单株，均由中国林业科学研究院亚热带林业研究所木本油料育种与培育研究组收集、评价，并保存于浙江金华婺城区东方红林场种质资源圃。

实施例1油茶种仁含油率分离群体的构建及性状测定

本实施例中使用普通油茶资源收集圃内500份种质资源的自然群体，其起源地涵盖我国油茶主产区的大部分，包括浙江省、湖南省、江西省、广西区、福建省、广东省等。500个体待果实完全成熟后(5％果实开裂)，采集种子，采用索氏抽提法测定种仁含油率。其操作步骤如下：

(1)制备中速滤纸包，并放入铝盒内，105℃烘至恒质量，记录铝盒和滤纸包质量(W₁)。

(2)适量油茶种子剥去硬种皮，105℃烘至恒质量，用粉碎机粉碎后，装入滤纸包内包扎好，记下铝盒、滤纸包和试样的总质量(W₂)。

(3)采用瑞士Buchi索氏提取仪B-811LSV，将称好质量的试样滤纸包放入浸提瓶中，加入约100ml石油醚，提取6h，回收石油醚，将滤纸包(内有残渣)放入铝盒内于105℃烘至恒质量，记下铝盒、滤纸包和残渣的质量(W₃)。

种仁含油率＝[(W₂-W₃)/(W₂-W₁)]×100％

油茶种仁含油率测定结果表明：自然群体种仁含油率呈正态分布，说明该性状具有数量性状特点。

实施例2油茶三代转录组测序及注释分析

1、三代测序样本RNA的提取：

采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子，采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型，TIANGEN试剂盒Code No.DP441)分别提取RNA，具体步骤如下：

(1)首先在1.5ml离心管中加入500μl的裂解液SL(使用前检查是否已加入β-巯基乙醇)。取0.1g样本材料加入液氮充分研磨，迅速将研磨好的样本粉末加入到离心管中，立即旋涡剧烈震荡混匀。

(2)12000rpm离心2分钟。

(3)将上清液转移至过滤柱CS上(过滤柱CS放在收集管中)，12000rpm离心2分钟，小心吸取收集管中的上清至新的RNase-Free的离心管中，吸头尽量避免接触收集管中的细胞碎片沉淀。

(4)缓慢加入0.4倍上清体积的无水乙醇，混匀(此时可能会出现沉淀)，将得到的溶液和沉淀一起转入吸附柱CR3中，12000rpm离心15秒，倒掉收集管中的废液，将吸附柱CR3放回收集管中。

注意，若果上清液体积有损失，请相应调整乙醇的加量。

(5)向吸附柱CR3中加入350μl去蛋白液RW1，12000rpm离心15秒，倒掉收集管中的废液，将吸附柱CR3放回收集管中。

(6)DNase I工作液的配制：取10μl DNase I储存液放入新的RNase-Free的离心管中，加入70μl RDD缓冲液，轻柔混匀。

(7)向吸附柱CR3中央加入80μl的DNase I工作液，室温放置15分钟。

(8)向吸附柱CR3中加入350μl去蛋白液RW1，12000rpm离心15秒，倒掉收集管中的废液，将吸附柱CR3放回收集管中。

(9)向吸附柱CR3中加入500μl漂洗液RW(使用前请先检查是否已加入乙醇)，12000rpm离心15秒，倒掉收集管中的废液，将吸附柱CR3放回收集管中。

(10)重复步骤9。

(11)12000rpm离心2分钟，将吸附柱CR3放入一个新的RNase-Free的离心管中，向吸附膜的中间部位悬空滴加30-50μl RNase-Free ddH₂O，室温放置2分钟，12000rpm离心1分钟，得到RNA溶液。

2、三代转录组测序与注释分析：

通过纯度和浓度检测的五个组织样品总RNA，等比例混合，利用Clontech

PCR cDNA合成试剂盒进行反转录合成单链cDNA。利用KAPA HiFi PCR试剂盒以单链cDNA为模板进行第一轮PCR扩增，生成双链cDNA。生成的双链cDNA利用Blue Pippin分成0.5-2kb，2-3kb，3-6kb三个长度片段库。然后进行第二轮PCR扩增产生充足的cDNA，构建PacBioSMRTbell文库，在PacBio Sequel平台进行三代转录组测序。利用SMRTlink 5.0软件处理测序数据。测序结果过滤掉低质量数据和冗余序列后，生成CCS。根据序列是否含有5’primer，3’primer和polyA尾巴，将所有的CCS分为全长和非全长序列两大类。全长的CCS采用ICE算法在缺省参数条件下进行聚类分析产生CS。利用Arrow和LoRDEC(http://www.atgc-montpellier.fr/lordec/)软件进一步过滤CS，利用CD-HIT v4.6(Fu L,Niu B,Zhu Z,WuS,Li W,2012.CD-HIT:accelerated for clustering the next-generation sequencingdata.Bioinformatics 28,3150-2.)软件去除冗余序列。

利用Coding Potential Calculator(CPC)(Kong L,Zhang Y,Ye Z-Q,et al.,2007.CPC:assess the protein-coding potential of transcripts using sequencefeatures and support vector machine.Nucleic Acids Research 35,W345.)和Coding-Non-Coding Index(CNCI)(https://github.com/www-bioinfo-org/CNCI)软件在参数缺省条件下进行转录本的蛋白编码潜能预测。未通过蛋白编码潜能检测的转录本进一步在Swiss-Prot数据库中比对，若在Swiss-Prot数据库中仍无注释，则认为该转录本为长链非编码RNA。其它的转录本进一步在NR、Swiss-Prot、COG、KEGG和GO等数据库中比对，注释转录本。

实施例3油脂高速合成期种仁转录组测序及多态位点识别

1、500个油茶无性系油脂高速合成期种仁总RNA提取：

利用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型，TIANGEN试剂盒Code No.DP441)分别提取各无性系未成熟种仁的总RNA(见实施例2)。

2、二代转录组测序：

通过纯度和浓度检测的各样品总RNA，去除其中的核糖体RNA，以最大限度地保留所有coding RNA和ncRNA。得到的RNA随机打断成短片段，再以片断化后的RNA为模板，用六碱基随机引物(random hexamers)合成cDNA第一链；接着加入缓冲液、dNTPs(dUTP代替dTTP)、RNase H和DNA polymerase I合成cDNA第二链，经过QiaQuick PCR试剂盒纯化并加EB缓冲液洗脱，经末端修复、加碱基A，加测序接头，然后通过UNG(Uracil-N-Glycosylase)酶降解第二条链。用琼脂糖凝胶电泳进行片段大小选择，进行PCR扩增。最后建好的测序文库用Illumina HiSeq^TM 4000平台进行二代转录组测序。

3、多态位点识别：

为了保证数据质量，对下机后经过初步过滤得到的clean reads进行进一步更严格的过滤，得到高质量的clean reads，用于后续的信息分析。过滤的步骤如下：

(1)去除含有接头的reads；

(2)去除全部都是A碱基的reads；

(3)去除含N比例大于10％的reads；

(4)去除低质量的reads(质量值Q≤20的碱基数占整条reads的50％以上)。

采用Tophat v2.1.1(Trapnell C,Roberts A,Goff L,et al.,2012.Differential gene and transcript expression analysis of RNA-seqexperiments with TopHat and Cufflinks.Nature protocols 7,562-78.)软件将每个样本的高质量的reads比对到参考转录组序列上(见实施例2)。剔除没有比对上的序列，其余序列利用bcftools v1.9软件(http://www.htslib.org/doc/bcftools.html)识别SNP位点。识别的SNP位点经过严格过滤，获得高质量的SNPs数据。

过滤标准如下：

(1)位点上只有2个等位基因；

(2)基因型缺失率≤20％；

(3)最小等位基因频率(MAF)≥5％；

(4)SNP质量值≥100；

(5)纯合子基因型的样本数大于10个；

(6)杂合基因型样本率≤70％。

实施例4与油茶种仁含油率相关的SNP位点的筛选

1、群体结构分析：

利用GCTA v1.25.2(Jian Y,S Hong L,Goddard ME,Visscher PM,2011.GCTA:atool for genome-wide complex trait analysis.American Journal of HumanGenetics 88,76-82.)软件对油茶自然群体进行主成分分析(PCA)，利用前10个主成分(PC)作为固定效应用于后续的关联分析(表3)。

表3自然群体部分个体的前10个PC值

/>

/>

/>

/>

2、关联分析：

将所有样本的SNPs位点数据、前10个PC值数据、表型数据(见实施例1)及Kinship矩阵数据导入TASSEL5.0软件中，采用MLM法分析SNPs与种仁含油率性状的连锁不平衡性，筛选与种仁含油率显著关联的分子标记，经多重检验校正，检测到了48个跟含油率存在极显著关联的位点，这些位点位于9个转录本内，18个位于非编码区，30个位于编码区，引起21个非同义突变，9个同义突变，对含油率差异的贡献率为10.23％～32.66％(见表1)。

实施例5本发明中的48个分子标记在油茶高油育种中的应用

(1)选择一个油茶杂交F1代家系群体为材料(母本为长林53号，父本为长林40号，均为国家审定良种，良种号分别为“国S-SC-CO-012-2008”和“国S-SC-CO-011-2008”)，采集嫩叶提取总RNA(见实施例2)。以RNA为模板，采用Clontech cDNA合成试剂盒反转录生成单链cDNA，并稀释100倍，作为工作液。

(2)利用SEQ ID NO.1-18所示的引物对对单链cDNA工作液分别进行PCR扩增，反应体系如表4所示：

表4

PCR扩增程序为：

/>

(3)PCR扩增产物进行凝胶检测和纯化回收并测序、基因分型。凝胶检测和纯化回收按照AxyPrep DNA凝胶回收试剂盒(AxyGEN,Code No.AP-GX-50)说明书进行，其流程如下：

①配制1.2％的琼脂糖凝胶，将50μl扩增产物全部上样，电泳电压为5V/cm，电泳约20分钟至上样缓冲液中二甲苯青达到距离凝胶前端1cm处时停止电泳。

②在紫外灯下切下含有目的DNA的琼脂糖凝胶，用纸巾吸尽凝胶表面的液体并切碎。计算凝胶重量，该重量作为一个凝胶体积(例如100mg＝100μl体积)。

③加入3个凝胶体积的Buffer DE-A，混合均匀后于75℃加热，每2～3分钟间断混合，直至凝胶块完全熔化。

④加入0.5个Buffer DE-A体积的Buffer DE-B，混合均匀。

⑤将上述溶液转移到DNA制备管中，12000rpm离心1分钟，弃滤液。

⑥加入500μl Buffer W1，12000rpm离心30秒，弃滤液。

⑦加入700μl Buffer W2，12000rpm离心30秒，弃滤液。以同样的方法再用700μlBuffer W2洗涤一次，12000rpm离心1分钟，弃滤液。

⑧将制备管放回离心管中，12000rpm离心1分钟。

⑨将制备管置于洁净的1.5ml离心管中，在制备膜中央加25～30μl去离子水，室温静置1分钟。12000rpm离心1分钟洗脱DNA。

⑩凝胶回收DNA，以对应的扩增引物为测序引物，采用一代测序测定扩增产物核苷酸序列，用Chromas软件判读测序峰图上每个SNP位点的基因型。

(4)分别鉴定所有个体的48个位点的基因型。对照表2中各位点的基因型与含油率高低的关系，若某油茶单株在48个位点中有超过39个位点为高含油率基因型，则该油茶个体为高含油油茶；若某油茶单株在48个位点中为高含油率基因型的位点不足30个，则该油茶个体为低含油油茶；若高含油率基因型位点数在30～39个，则该油茶个体为需要进一步验证含油率的油茶。

(5)采集所有F1代个体完全成熟种子，测定其种仁的含油率(见实施例1)。结果表明，在48个位点中超过39个位点为高含油率基因型的单株中，76.58％的个体其种仁含油率高于群体种仁含油率平均值(37.79％)；在48个位点中高含油率基因型少于等于30个位点的个体中，80％的个体其种仁含油率低于群体平均值(37.79％)；在48个位点中高含油率基因型少于等于28个位点的个体中，87.10％的个体其种仁含油率低于群体平均值(37.79％)(表5)。这表明该标记用于辅助选择是切实有效的，可用于早期鉴别或辅助鉴别，可大大节约生产成本，提高选择效率，加快油茶高油育种进程。

表5 F1单株的种仁含油率及基因型数据

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

注：表中“..”表示基因型缺失。

虽然，上文中已经用一般性说明、具体实施方式及试验，对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

序列表

<110> 中国林业科学研究院亚热带林业研究所

<120> 与油茶种仁含油率相关的SNP分子标记及其应用

<130> KHP201112306.6

<160> 27

<170> SIPOSequenceListing 1.0

<210> 1

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ctgcccgagt cggttatctc 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

catgcgttct gcaactccat 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aacagcaatg gattctttct 20

<210> 4

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ctgaaatcaa tttcactctt c 21

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aaacaccaca cacacacagc 20

<210> 6

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

aaagtttttg taaacataaa 20

<210> 7

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

aatcaagttt cagctcctct 20

<210> 8

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

cgaaccgatc ttggttttaa t 21

<210> 9

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gcacaaggac ttatacatag 20

<210> 10

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ttacttattt cataattgtt 20

<210> 11

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

acagctctct ctatctctaa 20

<210> 12

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

caaacaaagg tacctcataa 20

<210> 13

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

acacacacac acagcagagg a 21

<210> 14

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

agcagcacca accaagcaat gac 23

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

gtactctgcg ttgataccac 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

acaggcacaa gattatacat 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

acacacacac agcagaggaa 20

<210> 18

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tccacttagt atggtacagc c 21

<210> 19

<211> 1748

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ctgcccgagt cggttatctc tctcgaactt caatcctaga ttgactgtgc catgtatgta 60

ccttaggatc cacttcactg cctgccagtg atcttttcct ggatcatgca tatacctgct 120

taccatactc acagcatgcg agatgtcagg tcttgtacaa accatagcat acattaatgc 180

accaactgca tttgcatatg gaacctgtgc catatgcttc cgttcttctt ctgtgcgtgg 240

agacatcgaa gcactaagct tgaaatgagg ggccaatggt gtacttacag ctttggtttt 300

cccattgatg ccaaatctgt ctaacacctt cttcagatac tgggtttgtg tcagacaaac 360

cgtgcccttc ttcctgtctc tcttgatctc catgccaaga actttctttg cttctcccaa 420

atccttcatt tcaaactccc ttgctaactg tgctttgagt ttgtcaatct ccaccttgct 480

cttagatgca attagcatat catctacata taagagcaag tagatgaagg aaccatcggg 540

aagcttacgg aaatatacac aatgatcaaa ttgacttctt gtgtattctt tctctatcat 600

gaaccgatca aatcgcttgt accactgtct cggggattgc ttcaatccgt acaacgattt 660

ggtcagctta caggcccaat tctcctttcc agcaactttg aagccatctg gctgggacat 720

gtatatctcc tcttcgagat ctccatgtaa gaaggcagtt ttgacgtcga gttgggcgag 780

ctcgagatca aactgtgcaa ccaaagctaa caggatgcga atagacgtgt gcttcacaac 840

aggtgagaat acctcattgt agtctattcc ttccttctga gcatagcctt tagctaccaa 900

tctagctttg aatctgatgt tgtcgttgcc tggaatgcct tctttcttgg tgtaaaccca 960

cttacaccca attgctttct tgccttttgg aagttgcacc aactcccaag tctggttctt 1020

gtgaagtgaa ccgatctctt catccatagc ctccttccat ttgacacttt ctggatgctg 1080

cacggcttct ttgaaagtgc acggaacatt gtcttcaatg attggaagtg cataggctac 1140

catatcggtc atccaactgg gttgcttagt aacccttttt cctttcctga ttgcaatagg 1200

ttctgactgt tgcggagcct ctggatcttc atctgaactc tcttcagagc tatcttctga 1260

gacttcttca ggatggttga ttggctgact agtctttgat ggagtctcaa actccacctg 1320

cactgacttc ttcaatgctt caacattctg ttgaggatct ggttgcttca acattgcaga 1380

ctcatcaaag gtaacatctc ttctgatgag aactttcttt gattcagggc accacagtct 1440

gtatccctta acaccgtcac cgaagcccaa gaagatggct ttcttggctc ttggatccaa 1500

cttagattct gtaacatgaa aataagccgg acatccaaag atacgtaact gatcataatc 1560

agtaactggg actcctgacc atacctccat gggagtcttc ccattcagtg ctgcagtagg 1620

tagtctgttg actagatgac gagcatagtt caatgcctcg ccccaaaacg ccttgcttaa 1680

tccagactgt gacagcatac accggacttt ctccaccaaa gtgcggttca tgcgttctgc 1740

aactccat 1748

<210> 20

<211> 1415

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

aacagcaatg gattctttct ctcctaactt ccctcccatg gcgtcctcct catcatcagc 60

taatgtcttc catctccttc atctttttca ccaaaaagtc caaaaaacca accaaccttc 120

ctccaacccc accaaccctt cccatcatcg gcaacctcca ccaactcggc aagctccctc 180

atcactcact tacccaactc tcaaagaaac acggccctgt catgctcttg agacttggcc 240

aagtcccatg ccttgtcgtt tcgtcccccg aaacagccaa acaggtccta aaaactcatg 300

atctcgaatg ttgcagtaga cccttctctc acggccccaa aagactgtct tacaatctcc 360

tagacttggc ttttgggcct tacagcgatt actggagaga aatgcgaaag ctctgcgtga 420

tcgagctttt cacagtgaaa agggttcatt catttcgaca cgttagagaa gaagagttgg 480

gtaagatgat cagacaaatc actcaaatct ctcctaataa tccactcaat ttgagcgagt 540

tggtattctc tctcacgaac tcaattattt gtaaggttgc gtttgggaag agctatgagg 600

ggaagcaatt tgagagtggt aagtttcaag agagtatgga tgaggctatg gccatgttga 660

gtagcttttg gggggcggat ttctttccgt atgtaggttg gtttgttgat gtatttacag 720

gactccattg gaggcttgag aaatgctttc gtgagtttga tttgttcttc gagagggtca 780

tgttatcctg atagtatgca tcttgtaatt tcgcccctaa caggtcaaag tctgagcatg 840

aagttattat tgacatcttg ttaggggtgt ccaaggataa aagaatactc ttttctgctt 900

accccaaatg catcattctt attaacccag gccaattctc tgacaatatt tatcctccta 960

aactgagtcg aagcagtgca cacccagttc ctagttacac atatcgtcaa aaatgaggca 1020

aattgcatac ccgtagaata gcaagaccaa gagaatgaaa caaagttaca ccagcagaga 1080

ccagaactaa ggtctagttg ctattgcgaa gaaaacagac aggtcgatga aaccgcaact 1140

agacacagct aaatgtactt aaaaatatgc tggttggtga aaggagactt ttcaggctcc 1200

acccaacacg tcacatttcc taattccccg agatgtcgcg attcgctgta caaatcagct 1260

agatcggagt gcccctacga gtttatccca aaaacagaag aataatagtc aaatgaatga 1320

gagcacattg agaagcgacc tagccaaatt atggtcaccc aactacccag aagagttcta 1380

ccaagagagg ttgagaagag tgaaattgat ttcag 1415

<210> 21

<211> 1859

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aaacaccaca cacacacagc aaggaaaaat gaaaagcatt ccagagatgt tactgtgttg 60

tagttctgat cataagccaa ttcctcttgg ggggtttgga acagctgttt atcctcttgc 120

atcctctgaa accatgaaac aatccttcct ccatgcaatc aaacttggtt acagacactt 180

cgactctgca gctttatacc agtcagagca gcctcttgga gaatcaattg ttgatgccat 240

acgcctaggc ttcattcaat ctcgccaaga cctcttcatc acctctaagc tttggtgttc 300

tgatgctcac cctcatcatg tcctccctgc tcttcaaagt tcactcaagt aattcataac 360

tgctgctctt ttaatgttat tatgctccgt aaatctttct ctttcttttt tatcagcgaa 420

agtcgcttgt tatgctccat aaatcattat ttatattctt ttgttatata ctagtttttt 480

tataaattat ttttttaatc cctctaattt gatgattttg atatacttat caatctcttg 540

gcttctatac gtaaaaaaaa taaacgaaaa tttaaacata atgatcaaat tgaaacggac 600

gtaaagtgca aggatttaag gacaaaaaat aaaaggaaga attacactga catgaatatc 660

aataaaaaaa tattatgaat gttaataatt aatgttataa actttttttt tattaattta 720

taattttttc tctctaacac cactatcagg tagttttccc aaaatataat tttgcttagt 780

tggttttttt tttttaatta ttatttatta tagaaatctt ggattggaat accttgatct 840

gtatctcatt cactggccag tgagttcaaa gccagggaaa tttgagtatc cagtgaacaa 900

gcaagagctt cttcccatgg atttcaagtc tgtttgggaa gccatggagg agtgtcagaa 960

tcttggcctc acaaaattca ttggagtcag taacttctca tgcaagaagc tccaactatt 1020

actagcaacc gcaaagatcc ctccagctgt caaccaggtc gagatgaacc cactttggca 1080

acagaagaag ctaagagagt tttgtgagaa aaaaggtatt catatcacag cttactctcc 1140

tttgggcgcc aaaggaacaa tttggggaag tgacaaagtc atggaatgtg aggtgctcaa 1200

acagattgcc aaagctagag gaaaatctgt tgcccagtca ccggttaatc tagagggaaa 1260

gaaaaaggga attaccccca attaatgccc catattagct tctctaaaat taatggatgc 1320

ttcctaagga tcaatcacgg atgagcacat tgaactattc atgtgattga gagcccacac 1380

agcccaagca caacgacgca attatcacgg cgcgctctac cactgaacta ataactcatc 1440

gtgcgagcct cctagtgggg gctcactatg ccaaaagcaa gagaaacccc catccctctc 1500

tttccttttt ttggccctca aattctatcc ttggtttgtc tcagatgggt ttatgagcaa 1560

ggggtgagtg ttttggtgaa gagcttcagt gaggagagga tgaaagagaa ccttcaaata 1620

gttgattggg agctaggcgc acaagactcc gagatgataa atcaaatttc acaatataaa 1680

ggatgtgctg gacttgattt catatcagat gaaggccctt acaaatctct ccaggattta 1740

tgggatggtg aaattgtttg atcctgtaaa cgtgtagcca aaaaccactt ggataccgtt 1800

tgataacatt ttatgcttac aacacaaatg aatgtgtgtt ttatgtttac aaaaacttt 1859

<210> 22

<211> 1668

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

aatcaagttt cagctcctct ctctctctct ccctccctct ccatggattc caaagtagaa 60

atgttcttct tacaaaatgt aatcgggaga ggccacattc tttcagctat agacacagca 120

aggctatttg cagctcaggg agccaaaatc accataataa taacacaagc atatgcccag 180

ctcttccaga aaaccttaga gagagaccag tcacgaggcc atgacatcaa cttccacatc 240

ttcaaattac ccacctccga cttcggcttg cccgacggat gtgagactct cctcgccgcc 300

tctgccggca ttatggctaa gctttacatg gccttcgaga cgctccatga acccatcgaa 360

caacttgtcc gagaacgccg ccctgattgc atcgtcagcg acatgttcca tccttggact 420

gccgaccttg gtgctcgact cggcattccg aggttcttat actatgttac aggtttgttc 480

cctctgtgtt gcgaagagag cattcgacgg aatgcaccac atgacaaagt aaattctgat 540

gcagagacat gtgctttgcc gggtctcccg atgataacat cataattacc aagagtaaaa 600

tccaatactg gtttaaggag aaaggatctg gttatggaca attacgtgac gaggttctaa 660

agtctgagct gaaaagctat ggggttataa ttaacagctt ttacgagtag gaaccagctt 720

atgctgatta tttcaataat gaaatgggca gaaagctatg tctcgtagga ccggagtgcc 780

tcttcaacaa agccttcgaa gaaaaggcgg agcggggtgc aaagaactcc attgatggaa 840

atacaatttt gaaattgctg gactccaaac aacctaagtc agtgctttat gttttcggga 900

gtcaggctag tatggctcct gaacagtacc tcgaggatgc tcatgggctc gaggcttctg 960

gttgcccatt catttgggtg gcccgagata tgtcagagta cggccaagaa gagaaagaaa 1020

agaaaggagg aaatgaaagt cgcggcaaaa agctaccaga gggatttgaa gagaggatga 1080

ccaagtccgg acaagggttg atattaaaga agtgggcacc acagttgtta attttagaac 1140

atgccaatat tggagggttc ttgacacaca gtggatggaa ctcgacgatt gagggaatag 1200

gagcgggtgt tccgatgatc acatggccgt tcatagcgga acaattcttc actgaaagcc 1260

ttgtcgtgga tgtgttgaag gttgggattc gtgtggggaa tgaggaatgg tcatcttata 1320

tttgggaacc caagttgact gtgaccagag agaaggtgga ggcggcggtg aagtggctga 1380

tgggtggtgg tgggggtgat gaagtggagg agatgagaag gcgagtaaag cagttgagtg 1440

agaaggctaa gaaagctata gaccatggtg gctcgtccaa tgctgatgtc attgctttga 1500

tcaatgaact taaatctcgc cggacatttt gcgaatattt atggtggagg aaggaggatg 1560

attctaaaat tttattaggt agttttgtta taatagcatt cttgcatttt tatcaaaatt 1620

ttagaggggg aggggcggaa gaagggaatt aaaaccaaga tcggttcg 1668

<210> 23

<211> 1564

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gcacaaggac ttatacatag tttttaacat acaattaggg aaaggcaaga gttctaccat 60

cttatttcat atagatactt tatttttatt tttaacatga gtagacaaca atgccctcct 120

ctaactttca aatccttccc aatcatattt gatagggaca agatcaagag acaacttctt 180

atgcacagtc aagccagcct cctcttccaa gctgatatct ttcctttcca tcccataagg 240

catttcccag tcaaaacagt gcaaaagatt tgccagagta aattccacag ctatggcacc 300

cattgtcaaa ccggggcaaa tcctccgacc cgctccaaat ggcaacaact cgaaattatt 360

acccctgaaa tcaatttcac tcttctcaaa cctctctggg tagaactctt ctgggttgtt 420

ccaaatttct gggtctcttc caattgccca ggcattgact aggattcttg ttttggggta 480

aacgtcgtag cctccgatct tgcaatgttg catcgactcg cggggaatta gaaatgtggc 540

tggtgggtgt agcctgaaag tctctttcac caccattttt aagtaattga gcttgtcaag 600

ttgggtttca tcgactgtct gttttcttcc aatgcaactc cttatttctg cttgaacttt 660

tttcattact cttgggttct tggctagctc ggtcattgcc catacaattg taagagaact 720

ggtgtctatt ccaccgacaa atatgtcctg aaattcaaaa tatattttat ctaaattgag 780

aaaattcgtg attgcgaaca tatgacaagt ccaataggta gcttttggtg tctacaattc 840

tttccacatg agtttggcat caacttgaaa agggtcatta cctttcattt ggttggtttt 900

caaaatttat ttttaaaaat taaaacactg tattttcaaa ggttaaaaat attttttcaa 960

attaaaatat ttatttagta aaaacccagt tccaaacaat aggaaaatat caacccatcg 1020

caaggcccta taggaaaatt ttaacccatc gtaagaccca ataagaaaat ttcagcccat 1080

cttcaggccc catgggagaa tttcaaccca ttgcaagccc aatggaaaaa tttaacttca 1140

tcagttctgc cacgtggcaa gacaccgttg agtcattttt aaattggttt taatggctct 1200

ctatatcccc ttcttggacg atgtgagaaa acaaatttta tttgccaagc aatattaaaa 1260

aggaaatgtt tggtggtcca gatttctgta gtttaaatga tttgaatgta tcaaaatgac 1320

gttattttac acttaaaatg atattatttt agatagttcg agccattcga gtcatgattt 1380

ttcaggccac ctatcattgt tgtatataaa atttaaattc ttaaatttat ttacaatgtg 1440

ggtgtttggg aattgagttt tttttgtagg ttttttagtt gtaagatatt attagaggaa 1500

tttttttttg tggttaaatg tgatgtttat gagagaaaaa atgaaacaat tatgaaataa 1560

gtaa 1564

<210> 24

<211> 1347

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

acagctctct ctatctctaa cactcttttc aacagtctct ctccgtgtag tagaagccct 60

tacaatggct gctgcgacca gtgcttcaat cgttgcttct tcggctcaaa ctctatttgc 120

agctcggtct gtttctacca acaatgctga tccctctgtc tcaaattcat atgctcgtag 180

tttcatgggg gctcgcttgt cgggatatct ccgaaagaat aggaaatcca ttaagattag 240

cggaaagata actgctgctg ctactgctgt tgaaacaact cctgtggttg aggaagtcaa 300

agagttttca cttcctactt gggctgaatt tgaccttgga agagctcctg tctattggaa 360

aaccatgaat ggtcttcctc caacttccgt aagtttgaca ctgccaatgc agctcagttt 420

tagaactaaa gcatttttaa aaaaaaaata tttcttcatt aatctttgga ttgatcatgc 480

attaacaaac tttgacaggg ggagaggctg aggattttct acaaccccac tgcaaccaaa 540

cttattccaa atgaagagtt tggaattgct tttaatggag ggtttaatca gcccatcatg 600

tgtggtggtg agccaagggc aatgctcagg aaaggtcgag gcaaagctga tctcccaata 660

tattaaatcc agatatgtat acctaagcac gccataaatt tgatcttctc attcacaaac 720

ggagtcgagt gggatggtcc ctacaggctg ctgtttcaag ttccaaagcc ttggcaaaac 780

aaaccaattg actttttcaa taagggtctt gcagacgagt tgagcaaaga tggtgcttgt 840

gacaaagcaa tatttcctga tacaaacatt gtcgtcacaa gatgtgctat gattggtaat 900

ttgaccgtcg aaggagtaag tgaaacttct cttattcttt catcgaaaga gctagtgtca 960

actagtttta acgactgcca atggtgtccc aatgcagggt gatcgctgca atcttgacct 1020

tgtaccggga tgcactgacc ctagctcaca tttgtatgac ccacttgcca acgtagatga 1080

tggatcatgt ccaattgaca cagtgtcaga ggaataacat aatcttttgg gggctgggaa 1140

gtaaaaaaat attatcgata tctcttagtg ttgataatct tttgggggct gtcaaagtca 1200

tgatatattt tcaggcactt ttttggttca tcattgcctt gttttgtaaa ttgttatatg 1260

ttgatatgcc attagaatgt tgataaacct gccttagaat tcaatattcc attaaagtca 1320

tgttatatta tgaggtacct ttgtttg 1347

<210> 25

<211> 1193

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

acacacacac acagcagagg aaaaatgaaa agcattccag agatgttact gtgttgtagt 60

tctgatcata agccaattcc tcttgtgggg tttggaacag ctgtttatcc tctttcatcc 120

tctgaaacca tgaaacaatc catcctccat gcaatcaaac ttggttacag acacttcgac 180

tctgcaactt tataccagtc agagcagcct cttggagaat caattgttga tgccatacgc 240

ctaggcttca ttcaatctcg ccaagacctc ttcatcacct ctaagctttg gtgttctgat 300

gctcaccctc atcatgtcct ccctgctctt caaaattcac tcaagaatct tggattggaa 360

taccttgatc tgtatctcat tcactggcca gtgagctcaa agccaggtaa atttgagtat 420

ccggtgaaca agcaagagct tcttcccatg gatttcaagt ctgtttggga agccatggag 480

gagtgtcaga atcttggcct cacaaaattt attggagtca gtaacttctc atgcaagaag 540

ctccaattat tactagcaac cgcaaagatc cctccagctg tcaaccaggt cgagatgaac 600

ccactttggc aacagaagaa gctaagagag ttttgtgaga aaaatggtat tcatatcaca 660

gcttactctc ctttgggcgc caaaggaaca atttggggga agtgacaaag tcatggaatg 720

tgaggtgctc aaacagattg ccaaagctag aggaaaatct gttgcccagg tttgtctcag 780

atagggttta tgagcaaggg gtgagtgttc tggtgaagag cttcagtgag gagaggatga 840

aagagaacct tcaaatattt gattgggagc taagcgcaca agactccgag atgataaatc 900

aaatttcaca gtataaagga tgtgctggac ttgatttcat atcagatgaa ggcccttaca 960

aatctctcca ggatttatgg gatggtgaaa ttgtttgatc ctgtaaacgt gtagccaaaa 1020

accacttaga taccgtttga taacatttta tgcttacaac acaaattaat gtgtgtttta 1080

tgtttacaaa aactttggaa actgtttggt tttttatttt catttatggt ttgatcattg 1140

atttcacagt tacatttcac tttattgaat gtcattgctt ggttggtgct gct 1193

<210> 26

<211> 1710

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

gtactctgcg ttgataccac tgcttaagca gtggtatcac cgcagagtac agggaaacag 60

caatggattt ctctctccaa ctccctcatg gttgctgctc ttcatcctct ccgctttctt 120

ccatctcctt cctctttttc accaaaaagt ccaaaaaacc aaccaacctt cctccaaccc 180

caccaaccct tcccatcatc ggcaacctcc accaactcgg caagctccct catcactcac 240

ttacccaact ctcaaagaaa cacggccctg tcatgctctt gagacttggc caagtcccat 300

gccttgtcgt ttcgtccccc gaaacagcca aacaggtcct aaaaactcat gatctcgaat 360

gttgcagtag acccttctct cacggcccca aaagactgtc ttacaatctc ctagacttgg 420

cttttgggcc ttacagcgat tactggagag aaatgcgaaa gctctgcgtg atcgagcttt 480

tcacagtgaa aagggttcat tcatttcgac acgttagaga agaagagttg ggtaagatga 540

tcagacacat cactcaaatc tctcctaata atccactcaa tttgagcgag ttggtattct 600

ctctcacgaa ctcaattatt tgtaaggttg cgtttgggaa gagctatgag gggaagcaat 660

ttgagagtgg taagtttcaa gagagtatgg atgaggctat ggccatgttg agtagctttt 720

ggggggcgga tttctttccg tatgtaggtt ggtttgttga tgtatttaca ggactccatt 780

ggaggcttga gaaatgcttt cgtgagtttg atgtgttctt cgagagggtg attgaagagc 840

atcttgatcc taacaggaca aagtctgagc atgaagatat tactgacatc ttgttagggt 900

tgtccaagga tgaaactgtt tcttttcatc ttaccagaaa tcatataaag gcaattctca 960

tgaacatatt tatcggtgga gtcgacacca gttctcttac aattgtatgg gcaatgaccg 1020

agctagccaa gaacccaaga gtaatgaaaa aagttcaagc agaaataagg agttgcattg 1080

gaagaaaaca gacagtcgat gaaacccaac ttgacaagct caattactta aaaatggtgg 1140

tgaaagagac tttcaggcta cacccaccag ccacatttct aattccccgc gagtcgatgc 1200

aacattgcaa gatcggaggc tacgacgttt accccaaaac aagaatccta gtcaatgcct 1260

gggcaattgg aagagaccca gaaatttgga acaacccaga agagttctac ccagagaggt 1320

ttgagaagag tgaaattgat ttcaggggta ataatttcga gttgttgcca tttggagcgg 1380

gtcggaggat ttgccccggt ttgacaatgg gtgccatagc tgtggaattt actctggcaa 1440

atcttttgca ctgttttgac tgggaaatgc cttatgggat ggaaaggaaa gatatcagct 1500

tggaagagga ggctggcttg actgtgcata agaagttgtc tcttgatctt gtccctatca 1560

aatatgattg ggaaggattt gaaacttaga ggagggcatt gttgtctact catgttaaaa 1620

ataaaaataa agtatctata tgaaataaga tggtagaact cttgcctttc cctaattgta 1680

tgttaaaaac atgtataatc ttgtgcctgt 1710

<210> 27

<211> 1302

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

acacacacac agcagaggaa aaatgaaaag cattccagag atgttactgt gttgtagttc 60

tgatcataag ccaattcctc ttgtggggtt tggaacagct gtttatcctc ttgcatcctc 120

tgaaaccatg aaacaatccc tcctccatgc aatcaaactt ggttacagac acttcgactc 180

tgcagcttta taccagtcag agcagcctct tggagaatca attgttgatg ccatacgcct 240

aggcttcatt caatctcgcc aagacctctt catcacctct aagctttggt gttctgatgc 300

tcaccctcat catgtcctcc ctgctcttca aagttcactc aagtaattca taactgctgc 360

tcttttaatg ttattatgct ccgtaaatct ttctcttctt ttttatcagc gaaagtcgct 420

tgttatgctc cataaatcat tatatttata ttcttttgtt atatactagt tttttataat 480

atttttttta atccctctaa tttgatgatt ttgatatact tatcaatctc ttggcttcta 540

tacgtaaaaa aaataaacga aaatttaaac ataatgatca aattgaaacg gacgtaaagt 600

gcaaggattt aaggacaaaa ataaaaggaa gaattacact gacatgatat caataaaaaa 660

atattatgaa tgttaataat taatgttata aacttttttt tattaattta taattttttt 720

ctctctaaca ccactatcag gtagttttcc caaaatataa ttttgcttag ttggtttttt 780

tttttaatta ttatttattt atagaaatct tggattggaa taccttgatc tgtatctcat 840

tcactggcca gtgagttcaa agccagggaa atttgagtat ccagtgaaca agcaagagct 900

tcttcccatg gatttcaagt ctgtttggga agccatggag gagtgtcaga atcttggcct 960

cacaaaattc attggagtca gtaacttctc atgcaagaag ctccaactat tactagcaac 1020

cgcaaagatc cctccagctg tcaaccaggt cgagatgaac ccactttggc aacagaagaa 1080

gctaagagag ttttgtgaga aaaaaggtat tcatatcaca gcttactctc ctttgggcgc 1140

caaaggaaca atttggggaa gtgacaaagt catggaatgt gaggtgctca aacagattgc 1200

caaagctaga ggaaaatctg ttgcccaggt aaggaggttt catcaaattt actcatctat 1260

ctagactgta tatagagtac aggctgtacc atactaagtg ga 1302

Claims

1.与油茶种仁含油率相关的SNP分子标记组合，其特征在于，所述SNP分子标记组合包括PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166；

SNP分子标记PB.93518.1-182含有如SEQ ID NO.20所示序列第182位的多态性为T/C的核苷酸序列，SNP分子标记PB.93518.1-191含有如SEQ ID NO.20所示序列第191位的多态性为T/C的核苷酸序列，SNP分子标记PB.93518.1-224含有如SEQ ID NO.20所示序列第224位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-270含有如SEQ ID NO.20所示序列第270位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-284含有如SEQ ID NO.20所示序列第284位的多态性为G/A的核苷酸序列，SNP分子标记PB.93518.1-288含有如SEQID NO.20所示序列第288位的多态性为C/T的核苷酸序列；

SNP分子标记PB.47687.1-148含有如SEQ ID NO.22所示序列第148位的多态性为A/G的核苷酸序列，SNP分子标记PB.47687.1-215含有如SEQ ID NO.22所示序列第215位的多态性为G/T的核苷酸序列，SNP分子标记PB.47687.1-258含有如SEQ ID NO.22所示序列第258位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-264含有如SEQ ID NO.22所示序列第264位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-282含有如SEQ ID NO.22所示序列第282位的多态性为T/C的核苷酸序列，SNP分子标记PB.47687.1-297含有如SEQID NO.22所示序列第297位的多态性为C/T的核苷酸序列，SNP分子标记PB.47687.1-360含有如SEQ ID NO.22所示序列第360位的多态性为A/G的核苷酸序列，SNP分子标记PB.47687.1-366含有如SEQ ID NO.22所示序列第366位的多态性为T/C的核苷酸序列，PB.47687.1-367含有如SEQ ID NO.22所示序列第367位的多态性为G/C的核苷酸序列；

SNP分子标记PB.85097.1-125含有如SEQ ID NO.23所示序列第125位的多态性为C/G的核苷酸序列，SNP分子标记PB.85097.1-197含有如SEQ ID NO.23所示序列第197位的多态性为G/C的核苷酸序列，SNP分子标记PB.85097.1-293含有如SEQ ID NO.23所示序列第293位的多态性为A/G的核苷酸序列，SNP分子标记PB.85097.1-356含有如SEQ ID NO.23所示序列第356位的多态性为T/G的核苷酸序列，SNP分子标记PB.85097.1-532含有如SEQ ID NO.23所示序列第532位的多态性为A/T的核苷酸序列；

SNP分子标记PB.70158.1-51含有如SEQ ID NO.25所示序列第51位的多态性为G/A的核苷酸序列，SNP分子标记PB.70158.1-187含有如SEQ ID NO.25所示序列第187位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-306含有如SEQ ID NO.25所示序列第306位的多态性为C/T的核苷酸序列，SNP分子标记PB.70158.1-314含有如SEQ ID NO.25所示序列第314位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-408含有如SEQ ID NO.25所示序列第408位的多态性为T/G的核苷酸序列，SNP分子标记PB.70158.1-413含有如SEQ IDNO.25所示序列第413位的多态性为T/A的核苷酸序列，SNP分子标记PB.70158.1-419含有如SEQ ID NO.25所示序列第419位的多态性为A/T的核苷酸序列，SNP分子标记PB.70158.1-473含有如SEQ ID NO.25所示序列第473位的多态性为C/G的核苷酸序列，SNP分子标记PB.70158.1-649含有如SEQ ID NO.25所示序列第649位的多态性为A/G的核苷酸序列，SNP分子标记PB.70158.1-704含有如SEQ ID NO.25所示序列第704位的多态性为G/A的核苷酸序列，SNP分子标记PB.70158.1-707含有如SEQ ID NO.25所示序列第707位的多态性为A/C的核苷酸序列，SNP分子标记PB.70158.1-778含有如SEQ ID NO.25所示序列第778位的多态性为C/T的核苷酸序列，SNP分子标记PB.70158.1-854含有如SEQ ID NO.25所示序列第854位的多态性为A/C的核苷酸序列，SNP分子标记PB.70158.1-930含有如SEQ ID NO.25所示序列第930位的多态性为C/G的核苷酸序列，SNP分子标记PB.70158.1-935含有如SEQ IDNO.25所示序列第935位的多态性为T/G的核苷酸序列，SNP分子标记PB.70158.1-944含有如SEQ ID NO.25所示序列第944位的多态性为A/T的核苷酸序列，SNP分子标记PB.70158.1-1025含有如SEQ ID NO.25所示序列第1025位的多态性为C/T的核苷酸序列；

2.根据权利要求1所述的SNP分子标记组合，其特征在于，所述SNP分子标记中多态性位点的基因型及其对应的油茶种仁含油率表型如下所示：