CN111534630B - 与油茶种仁含油率相关的snp分子标记及其应用 - Google Patents

与油茶种仁含油率相关的snp分子标记及其应用 Download PDF

Info

Publication number
CN111534630B
CN111534630B CN202010477542.3A CN202010477542A CN111534630B CN 111534630 B CN111534630 B CN 111534630B CN 202010477542 A CN202010477542 A CN 202010477542A CN 111534630 B CN111534630 B CN 111534630B
Authority
CN
China
Prior art keywords
seq
polymorphism
molecular marker
snp molecular
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010477542.3A
Other languages
English (en)
Other versions
CN111534630A (zh
Inventor
林萍
任华东
王开良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute of Subtropical Forestry of Chinese Academy of Forestry
Original Assignee
Research Institute of Subtropical Forestry of Chinese Academy of Forestry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Institute of Subtropical Forestry of Chinese Academy of Forestry filed Critical Research Institute of Subtropical Forestry of Chinese Academy of Forestry
Priority to CN202010477542.3A priority Critical patent/CN111534630B/zh
Publication of CN111534630A publication Critical patent/CN111534630A/zh
Application granted granted Critical
Publication of CN111534630B publication Critical patent/CN111534630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及分子标记技术领域,具体涉及与油茶种仁含油率相关的SNP分子标记及其应用。本发明提供了48个与油茶种仁含油率高度关联的SNP分子标记,可以解释10.23%~32.66%的含油率表型方差。通过检测该批SNP分子标记,可在苗期进行鉴定和辅助筛选,能够大大节约生产成本,提高选择效率。在油茶育种中,选择本发明的分子标记及其检测方法鉴定出高含油率油茶进行育种,可提高油茶育种的选择效率,加快育种进程。

Description

与油茶种仁含油率相关的SNP分子标记及其应用
技术领域
本发明涉及分子标记技术领域,具体涉及与油茶种仁含油率相关的SNP分子标记及其应用。
背景技术
油茶(Camellia oleifera Abel.)隶属山茶科(Theaceae)山茶属(Camellia L.),是木本油料树种。油茶籽油含有丰富的营养物质,是一种优质的食用油,其不饱和脂肪酸含量达90%以上,以油酸和亚油酸为主。油茶籽油具有抗氧化、抗肿瘤、降血脂等功效,具有较高的营养保健价值。目前,以选择和杂交育种为主要手段、以产果量为主要育种目的的油茶育种已取得了重要进展,但以提高种仁含油率、改良油脂品质为目的的育种研究仍较少。油茶的常规育种周期长,新品种选育缓慢,良种选育速度还不能满足产业发展的需求,这已成为限制油茶产业发展的重要因素之一。
相比于传统育种技术,分子标记辅助育种可从苗期开始选择,大幅缩短育种周期,对以果实为主要目的的经济林育种优势尤其明显。分子标记辅助育种离不开有效的分子标记,因此,开发与油茶种仁含油率、油脂品质表型相关的分子标记,对于油茶油脂产量和品质的分子标记辅助育种及相关性状的遗传改良具有重要意义。
果实产量、鲜果出籽率、种仁含油率等指标直接决定单位面积油茶产(油)量,因此,开展油茶种仁含油率研究,是提高油茶产量的重要途径之一,对油茶产业的提升和健康发展具有十分重要的意义。
发明内容
本发明的目的之一在于提供与油茶种仁含油率相关的SNP分子标记,本发明的另一目的是提供所述SNP分子标记在油茶含油率表型鉴定和育种中的应用。
本发明提供的与油茶种仁含油率关联位点的开发方法是基于油茶是典型的异交物种,连锁不平衡(LD)通常在较小范围内迅速消减,因此可以开展重要性状的LD作图。油茶的种仁全部转录本作为本发明标记开发的区域。在具备产生了大量明显的遗传变异的油茶自然群体的前提下,可有效开展与油茶种仁含油率变异显著相关的标记开发。
本发明中SNP分子标记的开发过程基本如下:
(1)在油茶全分布区内广泛收集油茶种质资源,建立种仁含油率广泛分离的油茶自然群体。
(2)采集自然群体500份油茶种质的完全成熟种子,用索氏抽提法测定种子含油率。
(3)采集自然群体500个油茶单株的油脂高速合成期的种仁,采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型,TIANGEN试剂盒Code No.DP441)提取总RNA,每样本分别构建cDNA文库,利用Illumina HiSeqTM4000平台进行二代转录组测序。
(4)采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子,采用RNAprepPure多糖多酚植物总RNA提取试剂盒(离心柱型,TIANGEN试剂盒Code No.DP441)分别提取RNA,各组织RNA等比例混合,构建PacBio SMRTbell文库,在PacBio Sequel平台进行三代转录组测序。测序结果过滤掉低质量数据和冗余序列后,对所有转录本进行注释分析。过程中用到软件LoRDEC((http://www.atgc-montpellier.fr/lordec/)、CD-HIT v4.6(Fu L,NiuB,Zhu Z,Wu S,Li W,2012.CD-HIT:accelerated for clustering the next-generationsequencing data.Bioinformatics 28,3150-2.)、Coding Potential Calculator(CPC)(Kong L,Zhang Y,Ye Z-Q,et al.,2007.CPC:assess the protein-coding potential oftranscripts using sequence features and support vector machine.Nucleic AcidsResearch 35,W345.)和Coding-Non-Coding Index(CNCI)(https://github.com/www-bioinfo-org/CNCI)等是免费公开的。
(5)以(4)中获得的全长转录组序列为参考序列,采用多序列比对法,分析(3)中获得的500个样本转录组序列的SNP位点。SNP数据根据以下原则严格过滤:每个位点只有2个等位基因;基因型缺失率≤20%;最小等位基因频率≥5%;SNP质量值≥100;纯合基因型样本数超过10个;杂合基因型率≤70%。过程中用到软件bcftools v1.9software(http://www.htslib.org/doc/bcftools.html)是公开免费的。
(6)将群体的基因型数据输入GCTA v1.25.2(Jian Y,S Hong L,Goddard ME,Visscher PM,2011.GCTA:a tool for genome-wide complex trait analysis.AmericanJournal of Human Genetics 88,76-82.)软件,进行主成分分析(PCA)。
(7)将群体的基因型数据、前10个主成分(PC)数据、种仁含油率的表型数据以及Kinship矩阵数据输入TASSEL5.0(http://www.maizegenetics.net/tassel)软件中,采用统一混合线性模型方法(MLM)分析SNPs标记和油茶种仁含油率性状的连锁不平衡性,检测到48个位点与油茶种仁含油率极显著关联(P<10-5,见表1),对表型变异的贡献率为10.23%~32.66%(表1)。
利用上述技术措施,本发明最终获得了与油茶种仁含油率极显著关联的48个SNP标记,这些标记位于油茶的9个转录本内,具体参见表1。
表1 SNP分子标记信息
Figure BDA0002516288880000021
Figure BDA0002516288880000031
具体地,本发明提供如下技术方案:
第一方面,本发明提供与油茶种仁含油率相关的SNP分子标记,所述SNP分子标记选自PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166中的任一个;
其中,SNP分子标记PB.57703.1-685含有如SEQ ID NO.19所示序列第685位的多态性为C/T的核苷酸序列;
具体地,SNP分子标记PB.93518.1-182含有如SEQ ID NO.20所示序列第182位的多态性为T/C的核苷酸序列,SNP分子标记PB.93518.1-191含有如SEQ ID NO.20所示序列第191位的多态性为T/C的核苷酸序列,SNP分子标记PB.93518.1-224含有如SEQ ID NO.20所示序列第224位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-270含有如SEQ IDNO.20所示序列第270位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-284含有如SEQ ID NO.20所示序列第284位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-288含有如SEQ ID NO.20所示序列第288位的多态性为C/T的核苷酸序列;
SNP分子标记PB.103793.1-1118含有如SEQ ID NO.21所示序列第1118位的多态性为A/G的核苷酸序列,SNP分子标记PB.103793.1-1172含有如SEQ ID NO.21所示序列第1172位的多态性为G/A的核苷酸序列,SNP分子标记PB.103793.1-1175含有如SEQ ID NO.21所示序列第1175位的多态性为A/C的核苷酸序列;
SNP分子标记PB.47687.1-148含有如SEQ ID NO.22所示序列第148位的多态性为A/G的核苷酸序列,SNP分子标记PB.47687.1-215含有如SEQ ID NO.22所示序列第215位的多态性为G/T的核苷酸序列,SNP分子标记PB.47687.1-258含有如SEQ ID NO.22所示序列第258位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-264含有如SEQ ID NO.22所示序列第264位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-282含有如SEQ IDNO.22所示序列第282位的多态性为T/C的核苷酸序列,SNP分子标记PB.47687.1-297含有如SEQ ID NO.22所示序列第297位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-360含有如SEQ ID NO.22所示序列第360位的多态性为A/G的核苷酸序列,SNP分子标记PB.47687.1-366含有如SEQ ID NO.22所示序列第366位的多态性为T/C的核苷酸序列,PB.47687.1-367含有如SEQ ID NO.22所示序列第367位的多态性为G/C的核苷酸序列;
SNP分子标记PB.85097.1-125含有如SEQ ID NO.23所示序列第125位的多态性为C/G的核苷酸序列,SNP分子标记PB.85097.1-197含有如SEQ ID NO.23所示序列第197位的多态性为G/C的核苷酸序列,SNP分子标记PB.85097.1-293含有如SEQ ID NO.23所示序列第293位的多态性为A/G的核苷酸序列,SNP分子标记PB.85097.1-356含有如SEQ ID NO.23所示序列第356位的多态性为T/G的核苷酸序列,SNP分子标记PB.85097.1-532含有如SEQ IDNO.23所示序列第532位的多态性为A/T的核苷酸序列;
SNP分子标记PB.35678.1-1129含有如SEQ ID NO.24所示序列第1129位的多态性为G/C的核苷酸序列;
SNP分子标记PB.70158.1-51含有如SEQ ID NO.25所示序列第51位的多态性为G/A的核苷酸序列,SNP分子标记PB.70158.1-187含有如SEQ ID NO.25所示序列第187位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-306含有如SEQ ID NO.25所示序列第306位的多态性为C/T的核苷酸序列,SNP分子标记PB.70158.1-314含有如SEQ ID NO.25所示序列第314位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-408含有如SEQ IDNO.25所示序列第408位的多态性为T/G的核苷酸序列,SNP分子标记PB.70158.1-413含有如SEQ ID NO.25所示序列第413位的多态性为T/A的核苷酸序列,SNP分子标记PB.70158.1-419含有如SEQ ID NO.25所示序列第419位的多态性为A/T的核苷酸序列,SNP分子标记PB.70158.1-473含有如SEQ ID NO.25所示序列第473位的多态性为C/G的核苷酸序列,SNP分子标记PB.70158.1-649含有如SEQ ID NO.25所示序列第649位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-704含有如SEQ ID NO.25所示序列第704位的多态性为G/A的核苷酸序列,SNP分子标记PB.70158.1-707含有如SEQ ID NO.25所示序列第707位的多态性为A/C的核苷酸序列,SNP分子标记PB.70158.1-778含有如SEQ ID NO.25所示序列第778位的多态性为C/T的核苷酸序列,SNP分子标记PB.70158.1-854含有如SEQ ID NO.25所示序列第854位的多态性为A/C的核苷酸序列,SNP分子标记PB.70158.1-930含有如SEQ IDNO.25所示序列第930位的多态性为C/G的核苷酸序列,SNP分子标记PB.70158.1-935含有如SEQ ID NO.25所示序列第935位的多态性为T/G的核苷酸序列,SNP分子标记PB.70158.1-944含有如SEQ ID NO.25所示序列第944位的多态性为A/T的核苷酸序列,SNP分子标记PB.70158.1-1025含有如SEQ ID NO.25所示序列第1025位的多态性为C/T的核苷酸序列;
SNP分子标记PB.76391.3-1354含有如SEQ ID NO.26所示序列第1354位的多态性为A/C的核苷酸序列,SNP分子标记PB.76391.3-1385含有如SEQ ID NO.26所示序列第1385位的多态性为G/A的核苷酸序列,SNP分子标记PB.76391.3-1417含有如SEQ ID NO.26所示序列第1417位的多态性为T/C的核苷酸序列;
SNP分子标记PB.63477.1-1109含有如SEQ ID NO.27所示序列第1109位的多态性为A/G的核苷酸序列,SNP分子标记PB.63477.1-1163含有如SEQ ID NO.27所示序列第1163位的多态性为G/A的核苷酸序列,SNP分子标记PB.63477.1-1166含有如SEQ ID NO.27所示序列第1166位的多态性为A/C的核苷酸序列。
进一步地,本发明的与油茶种仁含油率相关的SNP分子标记可以分别由核苷酸序列如SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ ID NO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ ID NO.15-16、SEQ ID NO.17-18所示的引物对以油茶cDNA为模板经PCR扩增获得。
本发明的与油茶种仁含油率相关的SNP分子标记PB.57703.1-685通过核苷酸序列如SEQ ID NO.1-2所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.57703.1转录本的685bp处的碱基,其多态性为C/T。
本发明的与油茶种仁含油率相关的SNP分子标记PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288通过核苷酸序列如SEQ ID NO.3-4所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.93518.1转录本的182bp、191bp、224bp、270bp、284bp、288bp处的碱基,其多态性分别为T/C、T/C、G/A、G/A、G/A、C/T。
本发明的与油茶种仁含油率相关的SNP分子标记PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175通过核苷酸序列如SEQ ID NO.5-6所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.103793.1转录本的1118bp、1172bp、1175bp处的碱基,其多态性分别为A/G、G/A、A/C。
本发明的与油茶种仁含油率相关的SNP分子标记PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367通过核苷酸序列如SEQ ID NO.7-8所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.47687.1转录本的148bp、215bp、258bp、264bp、282bp、297bp、360bp、366bp、367bp处的碱基,其多态性分别为A/G、G/T、C/T、C/T、T/C、C/T、A/G、T/C、G/C。
本发明的与油茶种仁含油率相关的SNP分子标记PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532通过核苷酸序列如SEQ ID NO.9-10所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.85097.1转录本的125bp、197bp、293bp、356bp、532bp处的碱基,其多态性分别为C/G、G/C、A/G、T/G、A/T。
本发明的与油茶种仁含油率相关的SNP分子标记PB.35678.1-1129通过核苷酸序列如SEQ ID NO.11-12所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.35678.1转录本的1129bp处的碱基,其多态性为G/C。
本发明的与油茶种仁含油率相关的SNP分子标记PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025通过核苷酸序列如SEQ ID NO.13-14所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.70158.1转录本的51bp、187bp、306bp、314bp、408bp、413bp、419bp、473bp、649bp、704bp、707bp、778bp、854bp、930bp、935bp、944bp、1025bp处的碱基,其多态性分别为G/A、A/G、C/T、A/G、T/G、T/A、A/T、C/G、A/G、G/A、A/C、C/T、A/C、C/G、T/G、A/T、C/T。
本发明的与油茶种仁含油率相关的SNP分子标记PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417通过核苷酸序列如SEQ ID NO.15-16所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.76391.3转录本的1354bp、1385bp、1417bp处的碱基,其多态性分别为A/C、G/A、T/C。
本发明的与油茶种仁含油率相关的SNP分子标记PB.63477.1-1109、PB.63477.1-1163、PB.63477.1-1166通过核苷酸序列如SEQ ID NO.17-18所示的引物对以油茶cDNA为模板经PCR扩增获得,扩增产物含有位于油茶PB.63477.1转录本的1109bp、1163bp、1166bp处的碱基,其多态性分别为A/G、G/A、A/C。
本发明提供了上述48个SNP分子标记在鉴定油茶种仁含油率表型中的应用,各位点的基因型及其对应的油茶种仁含油率表型如表2所示。
表2
序号 SNP分子标记 高含油率基因型 低含油率基因型
1 PB.57703.1-685 CT/TT CC
2 PB.93518.1-182 TC/TT CC
3 PB.93518.1-191 TC/TT CC
4 PB.93518.1-224 GA/GG AA
5 PB.93518.1-270 GA/GG AA
6 PB.93518.1-284 GA/GG AA
7 PB.93518.1-288 CC/CT TT
8 PB.103793.1-1118 AA/AG GG
9 PB.103793.1-1172 GA/GG AA
10 PB.103793.1-1175 AA/AC CC
11 PB.47687.1-148 AG/GG AA
12 PB.47687.1-215 GT/TT GG
13 PB.47687.1-258 CT/TT CC
14 PB.47687.1-264 CT/TT CC
15 PB.47687.1-282 CC/CT TT
16 PB.47687.1-297 CT CC/TT
17 PB.47687.1-360 AG/GG AA
18 PB.47687.1-366 TC/CC TT
19 PB.47687.1-367 GC/CC GG
20 PB.85097.1-125 GC/GG CC
21 PB.85097.1-197 GC/GG CC
22 PB.85097.1-293 AA/AG GG
23 PB.85097.1-356 TG/TT GG
24 PB.85097.1-532 AA/AT TT
25 PB.35678.1-1129 GC/GG CC
26 PB.70158.1-51 GA/GG AA
27 PB.70158.1-187 AA/AG GG
28 PB.70158.1-306 CC/CT TT
29 PB.70158.1-314 AA/AG GG
30 PB.70158.1-408 TG/TT GG
31 PB.70158.1-413 TA/TT AA
32 PB.70158.1-419 AA/AT TT
33 PB.70158.1-473 CC/CG GG
34 PB.70158.1-649 AA/AG GG
35 PB.70158.1-704 GA/GG AA
36 PB.70158.1-707 AA/AC CC
37 PB.70158.1-778 CC/CT TT
38 PB.70158.1-854 AA/AC CC
39 PB.70158.1-930 CC/CG GG
40 PB.70158.1-935 TT/TG GG
41 PB.70158.1-944 TT AT/AA
42 PB.70158.1-1025 CC/CT TT
43 PB.76391.3-1354 AA/AC CC
44 PB.76391.3-1385 GA/GG AA
45 PB.76391.3-1417 TT/TC CC
46 PB.63477.1-1109 AA/AG GG
47 PB.63477.1-1163 GA/GG AA
48 PB.63477.1-1166 AA/AC CC
本发明所述的含油率为油茶种仁的含油率。
各SNP分子标记可分别单独用于或联合用于油茶种仁含油率表型的鉴定,联合使用时鉴定的准确率更高。
本发明还提供与油茶种仁含油率相关的SNP分子标记组合,其包括PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166中的至少两个。
第二方面,本发明提供用于扩增所述SNP分子标记或其组合的引物。
作为本发明的一种实施方式,所述引物包括以下引物中的一对或多对:
如SEQ ID NO.1-2所示的PB.57703.1-685的引物;
如SEQ ID NO.3-4所示的PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288的引物;
如SEQ ID NO.5-6所示的PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175的引物;
如SEQ ID NO.7-8所示的PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367的引物;
如SEQ ID NO.9-10所示的PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532的引物;
如SEQ ID NO.11-12所示的PB.35678.1-1129的引物;
如SEQ ID NO.13-14所示的PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025的引物;
如SEQ ID NO.15-16所示的PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417的引物;
如SEQ ID NO.17-18所示的PB.63477.1-1109、PB.63477.1-1163、PB.63477.1-1166的引物。
本发明还提供含有所述引物的试剂或试剂盒,所述试剂或试剂盒包含如前所述引物中的一对或多对。
第三方面,本发明提供所述的SNP分子标记或所述的SNP分子标记组合或所述的试剂或试剂盒的以下任一应用:
(1)在鉴定油茶种仁含油率表型中的应用;
(2)在油茶种质资源鉴定、改良或分子标记辅助育种中的应用,所述油茶种质资源鉴定、改良或分子标记辅助育种的性状为油茶种仁含油率;
(3)在油茶种仁含油率的早期预测中的应用;
(4)在筛选高含油率油茶中的应用。
在利用本发明提供的48个SNP分子标记进行油茶种仁中含油率表型鉴定或分子标记辅助育种时,本领域技术人员根据需要可以选择其中任意一个分子标记或多个分子标记的组合。多个标记联合使用,鉴定的准确率更高。
第四方面,本发明提供鉴定油茶种仁含油率表型的方法,包括:
(1)提取待鉴定油茶的总RNA,反转录合成cDNA;
(2)以cDNA为模板,利用上述的引物(SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ IDNO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ IDNO.15-16、SEQ ID NO.17-18)中的一对或多对进行PCR扩增;
(3)分析PCR扩增产物中上述的SNP分子标记或SNP分子标记组合的基因型,根据所述基因型判断待鉴定油茶的种仁含油率表型。
上述方法的步骤(1)中,所述待鉴定油茶可以为任何育种材料,包括自然群体个体和有性群体个体。
提取油茶总RNA采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型,TIANGEN试剂盒Code No.DP441)。反转录合成单链cDNA采用PrimeScript RT Master Mix试剂盒(TaKaRa,大连,中国)。
步骤(2)中,所述PCR扩增的反应程序为:94~95℃,3~5min;94~95℃,15~30s,65~69℃,40~60s,38~45个循环;67~70℃,3~6min。优选为,95℃,3min,1个循环预变性;95℃,15s变性,68℃,45s延伸,40个循环;68℃,5min,1个循环彻底延伸。
步骤(2)中,在所述扩增后,通过琼脂糖凝胶电泳检测并回收所得到的PCR产物。
作为一种实施方案,所述琼脂糖凝胶电泳中,琼脂糖凝胶的浓度为1.2%。胶回收使用AxyPrep DNA凝胶回收试剂盒(AxyGEN,Code No.AP-GX-50)。
步骤(3)中,分析SNP分子标记的基因型可采用本领域常规技术手段,例如测序等,可以SEQ ID NO.1-2、SEQ ID NO.3-4、SEQ ID NO.5-6、SEQ ID NO.7-8、SEQ ID NO.9-10、SEQ ID NO.11-12、SEQ ID NO.13-14、SEQ ID NO.15-16、SEQ ID NO.17-18为测序引物进行测序。
步骤(3)中所述判断待鉴定油茶的含油率表型的方法为:
根据表2中所示的SNP分子标记中多态性位点的基因型及油茶种仁含油率表型的对应关系中的一组或多组进行判断。以PB.57703.1-685为例,若该SNP分子标记的基因型为C/T或T/T时,待鉴定油茶为高含油率,若该SNP分子标记的基因型为C/C,则待鉴定油茶为低含油率或候选低含油率。其它位点基因型及其在油茶含油率鉴定中的应用参见表2。
作为优选方案,当扩增产物中包含48个所述SNP分子标记中的多态性位点时,若超过39个位点为高含油率基因型,则待鉴定油茶为高含油率表型;若少于等于30个位点为高含油率基因型,则待鉴定油茶为低含油率表型;更优选若少于等于28个位点为高含油率基因型,则待鉴定油茶为低含油率表型。
进一步优选的,所述的39个高含油率基因型位点中包含PB.70158.1-930、PB.70158.1-935、PB.103793.1-1118、PB.103793.1-1172和PB.103793.1-1175中的多态性位点。
本领域人员可以参照上述鉴定油茶种仁含油率表型的方法,对种仁为高含油率表型的油茶进行鉴定和筛选。
本发明的有益效果在于:本发明开发了48个与油茶种仁含油率高度关联的SNP位点,可以解释10.23%~32.66%的含油率表型方差。利用这48个标记对有性油茶群体进行了辅助选择,结果表明,在48个位点中超过39个位点为高含油率基因型的单株中,76.58%的个体其种仁含油率高于群体种仁含油率平均值;在48个位点中高含油率基因型少于等于30个位点的个体中,80%的个体其种仁含油率低于群体平均值;在48个位点中高含油率基因型少于等于28个位点的个体中,87.10%的个体其种仁含油率低于群体平均值。这表明这些标记用于辅助选择是切实有效的。
在油茶常规选择育种中,种仁含油率性状的鉴定需要幼苗造林5-6年才能鉴定,费时费力。本发明中的SNP位点位置明确,检测方法方便快速,不受环境影响,目的性更强,工作量小,效率更高,成本低。因此,通过检测该批SNP位点,可在苗期进行鉴定和辅助筛选,大大节约生产成本和提高选择效率。在油茶育种中,可选择本发明的分子标记及其检测方法鉴定高含油率油茶进行育种,可提高油茶育种的选择效率,加快育种进程。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
以下实施例中所用的自然群体材料500份单株,均由中国林业科学研究院亚热带林业研究所木本油料育种与培育研究组收集、评价,并保存于浙江金华婺城区东方红林场种质资源圃。
实施例1油茶种仁含油率分离群体的构建及性状测定
本实施例中使用普通油茶资源收集圃内500份种质资源的自然群体,其起源地涵盖我国油茶主产区的大部分,包括浙江省、湖南省、江西省、广西区、福建省、广东省等。500个体待果实完全成熟后(5%果实开裂),采集种子,采用索氏抽提法测定种仁含油率。其操作步骤如下:
(1)制备中速滤纸包,并放入铝盒内,105℃烘至恒质量,记录铝盒和滤纸包质量(W1)。
(2)适量油茶种子剥去硬种皮,105℃烘至恒质量,用粉碎机粉碎后,装入滤纸包内包扎好,记下铝盒、滤纸包和试样的总质量(W2)。
(3)采用瑞士Buchi索氏提取仪B-811LSV,将称好质量的试样滤纸包放入浸提瓶中,加入约100ml石油醚,提取6h,回收石油醚,将滤纸包(内有残渣)放入铝盒内于105℃烘至恒质量,记下铝盒、滤纸包和残渣的质量(W3)。
种仁含油率=[(W2-W3)/(W2-W1)]×100%
油茶种仁含油率测定结果表明:自然群体种仁含油率呈正态分布,说明该性状具有数量性状特点。
实施例2油茶三代转录组测序及注释分析
1、三代测序样本RNA的提取:
采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子,采用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型,TIANGEN试剂盒Code No.DP441)分别提取RNA,具体步骤如下:
(1)首先在1.5ml离心管中加入500μl的裂解液SL(使用前检查是否已加入β-巯基乙醇)。取0.1g样本材料加入液氮充分研磨,迅速将研磨好的样本粉末加入到离心管中,立即旋涡剧烈震荡混匀。
(2)12000rpm离心2分钟。
(3)将上清液转移至过滤柱CS上(过滤柱CS放在收集管中),12000rpm离心2分钟,小心吸取收集管中的上清至新的RNase-Free的离心管中,吸头尽量避免接触收集管中的细胞碎片沉淀。
(4)缓慢加入0.4倍上清体积的无水乙醇,混匀(此时可能会出现沉淀),将得到的溶液和沉淀一起转入吸附柱CR3中,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
注意,若果上清液体积有损失,请相应调整乙醇的加量。
(5)向吸附柱CR3中加入350μl去蛋白液RW1,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
(6)DNase I工作液的配制:取10μl DNase I储存液放入新的RNase-Free的离心管中,加入70μl RDD缓冲液,轻柔混匀。
(7)向吸附柱CR3中央加入80μl的DNase I工作液,室温放置15分钟。
(8)向吸附柱CR3中加入350μl去蛋白液RW1,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
(9)向吸附柱CR3中加入500μl漂洗液RW(使用前请先检查是否已加入乙醇),12000rpm离心15秒,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
(10)重复步骤9。
(11)12000rpm离心2分钟,将吸附柱CR3放入一个新的RNase-Free的离心管中,向吸附膜的中间部位悬空滴加30-50μl RNase-Free ddH2O,室温放置2分钟,12000rpm离心1分钟,得到RNA溶液。
2、三代转录组测序与注释分析:
通过纯度和浓度检测的五个组织样品总RNA,等比例混合,利用Clontech
Figure BDA0002516288880000081
PCR cDNA合成试剂盒进行反转录合成单链cDNA。利用KAPA HiFi PCR试剂盒以单链cDNA为模板进行第一轮PCR扩增,生成双链cDNA。生成的双链cDNA利用Blue Pippin分成0.5-2kb,2-3kb,3-6kb三个长度片段库。然后进行第二轮PCR扩增产生充足的cDNA,构建PacBioSMRTbell文库,在PacBio Sequel平台进行三代转录组测序。利用SMRTlink 5.0软件处理测序数据。测序结果过滤掉低质量数据和冗余序列后,生成CCS。根据序列是否含有5’primer,3’primer和polyA尾巴,将所有的CCS分为全长和非全长序列两大类。全长的CCS采用ICE算法在缺省参数条件下进行聚类分析产生CS。利用Arrow和LoRDEC(http://www.atgc-montpellier.fr/lordec/)软件进一步过滤CS,利用CD-HIT v4.6(Fu L,Niu B,Zhu Z,WuS,Li W,2012.CD-HIT:accelerated for clustering the next-generation sequencingdata.Bioinformatics 28,3150-2.)软件去除冗余序列。
利用Coding Potential Calculator(CPC)(Kong L,Zhang Y,Ye Z-Q,et al.,2007.CPC:assess the protein-coding potential of transcripts using sequencefeatures and support vector machine.Nucleic Acids Research 35,W345.)和Coding-Non-Coding Index(CNCI)(https://github.com/www-bioinfo-org/CNCI)软件在参数缺省条件下进行转录本的蛋白编码潜能预测。未通过蛋白编码潜能检测的转录本进一步在Swiss-Prot数据库中比对,若在Swiss-Prot数据库中仍无注释,则认为该转录本为长链非编码RNA。其它的转录本进一步在NR、Swiss-Prot、COG、KEGG和GO等数据库中比对,注释转录本。
实施例3油脂高速合成期种仁转录组测序及多态位点识别
1、500个油茶无性系油脂高速合成期种仁总RNA提取:
利用RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型,TIANGEN试剂盒Code No.DP441)分别提取各无性系未成熟种仁的总RNA(见实施例2)。
2、二代转录组测序:
通过纯度和浓度检测的各样品总RNA,去除其中的核糖体RNA,以最大限度地保留所有coding RNA和ncRNA。得到的RNA随机打断成短片段,再以片断化后的RNA为模板,用六碱基随机引物(random hexamers)合成cDNA第一链;接着加入缓冲液、dNTPs(dUTP代替dTTP)、RNase H和DNA polymerase I合成cDNA第二链,经过QiaQuick PCR试剂盒纯化并加EB缓冲液洗脱,经末端修复、加碱基A,加测序接头,然后通过UNG(Uracil-N-Glycosylase)酶降解第二条链。用琼脂糖凝胶电泳进行片段大小选择,进行PCR扩增。最后建好的测序文库用Illumina HiSeqTM 4000平台进行二代转录组测序。
3、多态位点识别:
为了保证数据质量,对下机后经过初步过滤得到的clean reads进行进一步更严格的过滤,得到高质量的clean reads,用于后续的信息分析。过滤的步骤如下:
(1)去除含有接头的reads;
(2)去除全部都是A碱基的reads;
(3)去除含N比例大于10%的reads;
(4)去除低质量的reads(质量值Q≤20的碱基数占整条reads的50%以上)。
采用Tophat v2.1.1(Trapnell C,Roberts A,Goff L,et al.,2012.Differential gene and transcript expression analysis of RNA-seqexperiments with TopHat and Cufflinks.Nature protocols 7,562-78.)软件将每个样本的高质量的reads比对到参考转录组序列上(见实施例2)。剔除没有比对上的序列,其余序列利用bcftools v1.9软件(http://www.htslib.org/doc/bcftools.html)识别SNP位点。识别的SNP位点经过严格过滤,获得高质量的SNPs数据。
过滤标准如下:
(1)位点上只有2个等位基因;
(2)基因型缺失率≤20%;
(3)最小等位基因频率(MAF)≥5%;
(4)SNP质量值≥100;
(5)纯合子基因型的样本数大于10个;
(6)杂合基因型样本率≤70%。
实施例4与油茶种仁含油率相关的SNP位点的筛选
1、群体结构分析:
利用GCTA v1.25.2(Jian Y,S Hong L,Goddard ME,Visscher PM,2011.GCTA:atool for genome-wide complex trait analysis.American Journal of HumanGenetics 88,76-82.)软件对油茶自然群体进行主成分分析(PCA),利用前10个主成分(PC)作为固定效应用于后续的关联分析(表3)。
表3自然群体部分个体的前10个PC值
Figure BDA0002516288880000091
/>
Figure BDA0002516288880000101
/>
Figure BDA0002516288880000111
/>
Figure BDA0002516288880000121
/>
Figure BDA0002516288880000131
2、关联分析:
将所有样本的SNPs位点数据、前10个PC值数据、表型数据(见实施例1)及Kinship矩阵数据导入TASSEL5.0软件中,采用MLM法分析SNPs与种仁含油率性状的连锁不平衡性,筛选与种仁含油率显著关联的分子标记,经多重检验校正,检测到了48个跟含油率存在极显著关联的位点,这些位点位于9个转录本内,18个位于非编码区,30个位于编码区,引起21个非同义突变,9个同义突变,对含油率差异的贡献率为10.23%~32.66%(见表1)。
实施例5本发明中的48个分子标记在油茶高油育种中的应用
(1)选择一个油茶杂交F1代家系群体为材料(母本为长林53号,父本为长林40号,均为国家审定良种,良种号分别为“国S-SC-CO-012-2008”和“国S-SC-CO-011-2008”),采集嫩叶提取总RNA(见实施例2)。以RNA为模板,采用Clontech cDNA合成试剂盒反转录生成单链cDNA,并稀释100倍,作为工作液。
(2)利用SEQ ID NO.1-18所示的引物对对单链cDNA工作液分别进行PCR扩增,反应体系如表4所示:
表4
Figure BDA0002516288880000132
PCR扩增程序为:
Figure BDA0002516288880000133
/>
(3)PCR扩增产物进行凝胶检测和纯化回收并测序、基因分型。凝胶检测和纯化回收按照AxyPrep DNA凝胶回收试剂盒(AxyGEN,Code No.AP-GX-50)说明书进行,其流程如下:
①配制1.2%的琼脂糖凝胶,将50μl扩增产物全部上样,电泳电压为5V/cm,电泳约20分钟至上样缓冲液中二甲苯青达到距离凝胶前端1cm处时停止电泳。
②在紫外灯下切下含有目的DNA的琼脂糖凝胶,用纸巾吸尽凝胶表面的液体并切碎。计算凝胶重量,该重量作为一个凝胶体积(例如100mg=100μl体积)。
③加入3个凝胶体积的Buffer DE-A,混合均匀后于75℃加热,每2~3分钟间断混合,直至凝胶块完全熔化。
④加入0.5个Buffer DE-A体积的Buffer DE-B,混合均匀。
⑤将上述溶液转移到DNA制备管中,12000rpm离心1分钟,弃滤液。
⑥加入500μl Buffer W1,12000rpm离心30秒,弃滤液。
⑦加入700μl Buffer W2,12000rpm离心30秒,弃滤液。以同样的方法再用700μlBuffer W2洗涤一次,12000rpm离心1分钟,弃滤液。
⑧将制备管放回离心管中,12000rpm离心1分钟。
⑨将制备管置于洁净的1.5ml离心管中,在制备膜中央加25~30μl去离子水,室温静置1分钟。12000rpm离心1分钟洗脱DNA。
⑩凝胶回收DNA,以对应的扩增引物为测序引物,采用一代测序测定扩增产物核苷酸序列,用Chromas软件判读测序峰图上每个SNP位点的基因型。
(4)分别鉴定所有个体的48个位点的基因型。对照表2中各位点的基因型与含油率高低的关系,若某油茶单株在48个位点中有超过39个位点为高含油率基因型,则该油茶个体为高含油油茶;若某油茶单株在48个位点中为高含油率基因型的位点不足30个,则该油茶个体为低含油油茶;若高含油率基因型位点数在30~39个,则该油茶个体为需要进一步验证含油率的油茶。
(5)采集所有F1代个体完全成熟种子,测定其种仁的含油率(见实施例1)。结果表明,在48个位点中超过39个位点为高含油率基因型的单株中,76.58%的个体其种仁含油率高于群体种仁含油率平均值(37.79%);在48个位点中高含油率基因型少于等于30个位点的个体中,80%的个体其种仁含油率低于群体平均值(37.79%);在48个位点中高含油率基因型少于等于28个位点的个体中,87.10%的个体其种仁含油率低于群体平均值(37.79%)(表5)。这表明该标记用于辅助选择是切实有效的,可用于早期鉴别或辅助鉴别,可大大节约生产成本,提高选择效率,加快油茶高油育种进程。
表5 F1单株的种仁含油率及基因型数据
Figure BDA0002516288880000141
/>
Figure BDA0002516288880000151
/>
Figure BDA0002516288880000161
/>
Figure BDA0002516288880000171
/>
Figure BDA0002516288880000181
/>
Figure BDA0002516288880000191
/>
Figure BDA0002516288880000201
/>
Figure BDA0002516288880000211
/>
Figure BDA0002516288880000221
/>
Figure BDA0002516288880000231
/>
Figure BDA0002516288880000241
/>
Figure BDA0002516288880000251
注:表中“..”表示基因型缺失。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 中国林业科学研究院亚热带林业研究所
<120> 与油茶种仁含油率相关的SNP分子标记及其应用
<130> KHP201112306.6
<160> 27
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctgcccgagt cggttatctc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
catgcgttct gcaactccat 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aacagcaatg gattctttct 20
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ctgaaatcaa tttcactctt c 21
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaacaccaca cacacacagc 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aaagtttttg taaacataaa 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aatcaagttt cagctcctct 20
<210> 8
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
cgaaccgatc ttggttttaa t 21
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gcacaaggac ttatacatag 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ttacttattt cataattgtt 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
acagctctct ctatctctaa 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
caaacaaagg tacctcataa 20
<210> 13
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
acacacacac acagcagagg a 21
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agcagcacca accaagcaat gac 23
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gtactctgcg ttgataccac 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
acaggcacaa gattatacat 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
acacacacac agcagaggaa 20
<210> 18
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tccacttagt atggtacagc c 21
<210> 19
<211> 1748
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctgcccgagt cggttatctc tctcgaactt caatcctaga ttgactgtgc catgtatgta 60
ccttaggatc cacttcactg cctgccagtg atcttttcct ggatcatgca tatacctgct 120
taccatactc acagcatgcg agatgtcagg tcttgtacaa accatagcat acattaatgc 180
accaactgca tttgcatatg gaacctgtgc catatgcttc cgttcttctt ctgtgcgtgg 240
agacatcgaa gcactaagct tgaaatgagg ggccaatggt gtacttacag ctttggtttt 300
cccattgatg ccaaatctgt ctaacacctt cttcagatac tgggtttgtg tcagacaaac 360
cgtgcccttc ttcctgtctc tcttgatctc catgccaaga actttctttg cttctcccaa 420
atccttcatt tcaaactccc ttgctaactg tgctttgagt ttgtcaatct ccaccttgct 480
cttagatgca attagcatat catctacata taagagcaag tagatgaagg aaccatcggg 540
aagcttacgg aaatatacac aatgatcaaa ttgacttctt gtgtattctt tctctatcat 600
gaaccgatca aatcgcttgt accactgtct cggggattgc ttcaatccgt acaacgattt 660
ggtcagctta caggcccaat tctcctttcc agcaactttg aagccatctg gctgggacat 720
gtatatctcc tcttcgagat ctccatgtaa gaaggcagtt ttgacgtcga gttgggcgag 780
ctcgagatca aactgtgcaa ccaaagctaa caggatgcga atagacgtgt gcttcacaac 840
aggtgagaat acctcattgt agtctattcc ttccttctga gcatagcctt tagctaccaa 900
tctagctttg aatctgatgt tgtcgttgcc tggaatgcct tctttcttgg tgtaaaccca 960
cttacaccca attgctttct tgccttttgg aagttgcacc aactcccaag tctggttctt 1020
gtgaagtgaa ccgatctctt catccatagc ctccttccat ttgacacttt ctggatgctg 1080
cacggcttct ttgaaagtgc acggaacatt gtcttcaatg attggaagtg cataggctac 1140
catatcggtc atccaactgg gttgcttagt aacccttttt cctttcctga ttgcaatagg 1200
ttctgactgt tgcggagcct ctggatcttc atctgaactc tcttcagagc tatcttctga 1260
gacttcttca ggatggttga ttggctgact agtctttgat ggagtctcaa actccacctg 1320
cactgacttc ttcaatgctt caacattctg ttgaggatct ggttgcttca acattgcaga 1380
ctcatcaaag gtaacatctc ttctgatgag aactttcttt gattcagggc accacagtct 1440
gtatccctta acaccgtcac cgaagcccaa gaagatggct ttcttggctc ttggatccaa 1500
cttagattct gtaacatgaa aataagccgg acatccaaag atacgtaact gatcataatc 1560
agtaactggg actcctgacc atacctccat gggagtcttc ccattcagtg ctgcagtagg 1620
tagtctgttg actagatgac gagcatagtt caatgcctcg ccccaaaacg ccttgcttaa 1680
tccagactgt gacagcatac accggacttt ctccaccaaa gtgcggttca tgcgttctgc 1740
aactccat 1748
<210> 20
<211> 1415
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aacagcaatg gattctttct ctcctaactt ccctcccatg gcgtcctcct catcatcagc 60
taatgtcttc catctccttc atctttttca ccaaaaagtc caaaaaacca accaaccttc 120
ctccaacccc accaaccctt cccatcatcg gcaacctcca ccaactcggc aagctccctc 180
atcactcact tacccaactc tcaaagaaac acggccctgt catgctcttg agacttggcc 240
aagtcccatg ccttgtcgtt tcgtcccccg aaacagccaa acaggtccta aaaactcatg 300
atctcgaatg ttgcagtaga cccttctctc acggccccaa aagactgtct tacaatctcc 360
tagacttggc ttttgggcct tacagcgatt actggagaga aatgcgaaag ctctgcgtga 420
tcgagctttt cacagtgaaa agggttcatt catttcgaca cgttagagaa gaagagttgg 480
gtaagatgat cagacaaatc actcaaatct ctcctaataa tccactcaat ttgagcgagt 540
tggtattctc tctcacgaac tcaattattt gtaaggttgc gtttgggaag agctatgagg 600
ggaagcaatt tgagagtggt aagtttcaag agagtatgga tgaggctatg gccatgttga 660
gtagcttttg gggggcggat ttctttccgt atgtaggttg gtttgttgat gtatttacag 720
gactccattg gaggcttgag aaatgctttc gtgagtttga tttgttcttc gagagggtca 780
tgttatcctg atagtatgca tcttgtaatt tcgcccctaa caggtcaaag tctgagcatg 840
aagttattat tgacatcttg ttaggggtgt ccaaggataa aagaatactc ttttctgctt 900
accccaaatg catcattctt attaacccag gccaattctc tgacaatatt tatcctccta 960
aactgagtcg aagcagtgca cacccagttc ctagttacac atatcgtcaa aaatgaggca 1020
aattgcatac ccgtagaata gcaagaccaa gagaatgaaa caaagttaca ccagcagaga 1080
ccagaactaa ggtctagttg ctattgcgaa gaaaacagac aggtcgatga aaccgcaact 1140
agacacagct aaatgtactt aaaaatatgc tggttggtga aaggagactt ttcaggctcc 1200
acccaacacg tcacatttcc taattccccg agatgtcgcg attcgctgta caaatcagct 1260
agatcggagt gcccctacga gtttatccca aaaacagaag aataatagtc aaatgaatga 1320
gagcacattg agaagcgacc tagccaaatt atggtcaccc aactacccag aagagttcta 1380
ccaagagagg ttgagaagag tgaaattgat ttcag 1415
<210> 21
<211> 1859
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aaacaccaca cacacacagc aaggaaaaat gaaaagcatt ccagagatgt tactgtgttg 60
tagttctgat cataagccaa ttcctcttgg ggggtttgga acagctgttt atcctcttgc 120
atcctctgaa accatgaaac aatccttcct ccatgcaatc aaacttggtt acagacactt 180
cgactctgca gctttatacc agtcagagca gcctcttgga gaatcaattg ttgatgccat 240
acgcctaggc ttcattcaat ctcgccaaga cctcttcatc acctctaagc tttggtgttc 300
tgatgctcac cctcatcatg tcctccctgc tcttcaaagt tcactcaagt aattcataac 360
tgctgctctt ttaatgttat tatgctccgt aaatctttct ctttcttttt tatcagcgaa 420
agtcgcttgt tatgctccat aaatcattat ttatattctt ttgttatata ctagtttttt 480
tataaattat ttttttaatc cctctaattt gatgattttg atatacttat caatctcttg 540
gcttctatac gtaaaaaaaa taaacgaaaa tttaaacata atgatcaaat tgaaacggac 600
gtaaagtgca aggatttaag gacaaaaaat aaaaggaaga attacactga catgaatatc 660
aataaaaaaa tattatgaat gttaataatt aatgttataa actttttttt tattaattta 720
taattttttc tctctaacac cactatcagg tagttttccc aaaatataat tttgcttagt 780
tggttttttt tttttaatta ttatttatta tagaaatctt ggattggaat accttgatct 840
gtatctcatt cactggccag tgagttcaaa gccagggaaa tttgagtatc cagtgaacaa 900
gcaagagctt cttcccatgg atttcaagtc tgtttgggaa gccatggagg agtgtcagaa 960
tcttggcctc acaaaattca ttggagtcag taacttctca tgcaagaagc tccaactatt 1020
actagcaacc gcaaagatcc ctccagctgt caaccaggtc gagatgaacc cactttggca 1080
acagaagaag ctaagagagt tttgtgagaa aaaaggtatt catatcacag cttactctcc 1140
tttgggcgcc aaaggaacaa tttggggaag tgacaaagtc atggaatgtg aggtgctcaa 1200
acagattgcc aaagctagag gaaaatctgt tgcccagtca ccggttaatc tagagggaaa 1260
gaaaaaggga attaccccca attaatgccc catattagct tctctaaaat taatggatgc 1320
ttcctaagga tcaatcacgg atgagcacat tgaactattc atgtgattga gagcccacac 1380
agcccaagca caacgacgca attatcacgg cgcgctctac cactgaacta ataactcatc 1440
gtgcgagcct cctagtgggg gctcactatg ccaaaagcaa gagaaacccc catccctctc 1500
tttccttttt ttggccctca aattctatcc ttggtttgtc tcagatgggt ttatgagcaa 1560
ggggtgagtg ttttggtgaa gagcttcagt gaggagagga tgaaagagaa ccttcaaata 1620
gttgattggg agctaggcgc acaagactcc gagatgataa atcaaatttc acaatataaa 1680
ggatgtgctg gacttgattt catatcagat gaaggccctt acaaatctct ccaggattta 1740
tgggatggtg aaattgtttg atcctgtaaa cgtgtagcca aaaaccactt ggataccgtt 1800
tgataacatt ttatgcttac aacacaaatg aatgtgtgtt ttatgtttac aaaaacttt 1859
<210> 22
<211> 1668
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aatcaagttt cagctcctct ctctctctct ccctccctct ccatggattc caaagtagaa 60
atgttcttct tacaaaatgt aatcgggaga ggccacattc tttcagctat agacacagca 120
aggctatttg cagctcaggg agccaaaatc accataataa taacacaagc atatgcccag 180
ctcttccaga aaaccttaga gagagaccag tcacgaggcc atgacatcaa cttccacatc 240
ttcaaattac ccacctccga cttcggcttg cccgacggat gtgagactct cctcgccgcc 300
tctgccggca ttatggctaa gctttacatg gccttcgaga cgctccatga acccatcgaa 360
caacttgtcc gagaacgccg ccctgattgc atcgtcagcg acatgttcca tccttggact 420
gccgaccttg gtgctcgact cggcattccg aggttcttat actatgttac aggtttgttc 480
cctctgtgtt gcgaagagag cattcgacgg aatgcaccac atgacaaagt aaattctgat 540
gcagagacat gtgctttgcc gggtctcccg atgataacat cataattacc aagagtaaaa 600
tccaatactg gtttaaggag aaaggatctg gttatggaca attacgtgac gaggttctaa 660
agtctgagct gaaaagctat ggggttataa ttaacagctt ttacgagtag gaaccagctt 720
atgctgatta tttcaataat gaaatgggca gaaagctatg tctcgtagga ccggagtgcc 780
tcttcaacaa agccttcgaa gaaaaggcgg agcggggtgc aaagaactcc attgatggaa 840
atacaatttt gaaattgctg gactccaaac aacctaagtc agtgctttat gttttcggga 900
gtcaggctag tatggctcct gaacagtacc tcgaggatgc tcatgggctc gaggcttctg 960
gttgcccatt catttgggtg gcccgagata tgtcagagta cggccaagaa gagaaagaaa 1020
agaaaggagg aaatgaaagt cgcggcaaaa agctaccaga gggatttgaa gagaggatga 1080
ccaagtccgg acaagggttg atattaaaga agtgggcacc acagttgtta attttagaac 1140
atgccaatat tggagggttc ttgacacaca gtggatggaa ctcgacgatt gagggaatag 1200
gagcgggtgt tccgatgatc acatggccgt tcatagcgga acaattcttc actgaaagcc 1260
ttgtcgtgga tgtgttgaag gttgggattc gtgtggggaa tgaggaatgg tcatcttata 1320
tttgggaacc caagttgact gtgaccagag agaaggtgga ggcggcggtg aagtggctga 1380
tgggtggtgg tgggggtgat gaagtggagg agatgagaag gcgagtaaag cagttgagtg 1440
agaaggctaa gaaagctata gaccatggtg gctcgtccaa tgctgatgtc attgctttga 1500
tcaatgaact taaatctcgc cggacatttt gcgaatattt atggtggagg aaggaggatg 1560
attctaaaat tttattaggt agttttgtta taatagcatt cttgcatttt tatcaaaatt 1620
ttagaggggg aggggcggaa gaagggaatt aaaaccaaga tcggttcg 1668
<210> 23
<211> 1564
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gcacaaggac ttatacatag tttttaacat acaattaggg aaaggcaaga gttctaccat 60
cttatttcat atagatactt tatttttatt tttaacatga gtagacaaca atgccctcct 120
ctaactttca aatccttccc aatcatattt gatagggaca agatcaagag acaacttctt 180
atgcacagtc aagccagcct cctcttccaa gctgatatct ttcctttcca tcccataagg 240
catttcccag tcaaaacagt gcaaaagatt tgccagagta aattccacag ctatggcacc 300
cattgtcaaa ccggggcaaa tcctccgacc cgctccaaat ggcaacaact cgaaattatt 360
acccctgaaa tcaatttcac tcttctcaaa cctctctggg tagaactctt ctgggttgtt 420
ccaaatttct gggtctcttc caattgccca ggcattgact aggattcttg ttttggggta 480
aacgtcgtag cctccgatct tgcaatgttg catcgactcg cggggaatta gaaatgtggc 540
tggtgggtgt agcctgaaag tctctttcac caccattttt aagtaattga gcttgtcaag 600
ttgggtttca tcgactgtct gttttcttcc aatgcaactc cttatttctg cttgaacttt 660
tttcattact cttgggttct tggctagctc ggtcattgcc catacaattg taagagaact 720
ggtgtctatt ccaccgacaa atatgtcctg aaattcaaaa tatattttat ctaaattgag 780
aaaattcgtg attgcgaaca tatgacaagt ccaataggta gcttttggtg tctacaattc 840
tttccacatg agtttggcat caacttgaaa agggtcatta cctttcattt ggttggtttt 900
caaaatttat ttttaaaaat taaaacactg tattttcaaa ggttaaaaat attttttcaa 960
attaaaatat ttatttagta aaaacccagt tccaaacaat aggaaaatat caacccatcg 1020
caaggcccta taggaaaatt ttaacccatc gtaagaccca ataagaaaat ttcagcccat 1080
cttcaggccc catgggagaa tttcaaccca ttgcaagccc aatggaaaaa tttaacttca 1140
tcagttctgc cacgtggcaa gacaccgttg agtcattttt aaattggttt taatggctct 1200
ctatatcccc ttcttggacg atgtgagaaa acaaatttta tttgccaagc aatattaaaa 1260
aggaaatgtt tggtggtcca gatttctgta gtttaaatga tttgaatgta tcaaaatgac 1320
gttattttac acttaaaatg atattatttt agatagttcg agccattcga gtcatgattt 1380
ttcaggccac ctatcattgt tgtatataaa atttaaattc ttaaatttat ttacaatgtg 1440
ggtgtttggg aattgagttt tttttgtagg ttttttagtt gtaagatatt attagaggaa 1500
tttttttttg tggttaaatg tgatgtttat gagagaaaaa atgaaacaat tatgaaataa 1560
gtaa 1564
<210> 24
<211> 1347
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
acagctctct ctatctctaa cactcttttc aacagtctct ctccgtgtag tagaagccct 60
tacaatggct gctgcgacca gtgcttcaat cgttgcttct tcggctcaaa ctctatttgc 120
agctcggtct gtttctacca acaatgctga tccctctgtc tcaaattcat atgctcgtag 180
tttcatgggg gctcgcttgt cgggatatct ccgaaagaat aggaaatcca ttaagattag 240
cggaaagata actgctgctg ctactgctgt tgaaacaact cctgtggttg aggaagtcaa 300
agagttttca cttcctactt gggctgaatt tgaccttgga agagctcctg tctattggaa 360
aaccatgaat ggtcttcctc caacttccgt aagtttgaca ctgccaatgc agctcagttt 420
tagaactaaa gcatttttaa aaaaaaaata tttcttcatt aatctttgga ttgatcatgc 480
attaacaaac tttgacaggg ggagaggctg aggattttct acaaccccac tgcaaccaaa 540
cttattccaa atgaagagtt tggaattgct tttaatggag ggtttaatca gcccatcatg 600
tgtggtggtg agccaagggc aatgctcagg aaaggtcgag gcaaagctga tctcccaata 660
tattaaatcc agatatgtat acctaagcac gccataaatt tgatcttctc attcacaaac 720
ggagtcgagt gggatggtcc ctacaggctg ctgtttcaag ttccaaagcc ttggcaaaac 780
aaaccaattg actttttcaa taagggtctt gcagacgagt tgagcaaaga tggtgcttgt 840
gacaaagcaa tatttcctga tacaaacatt gtcgtcacaa gatgtgctat gattggtaat 900
ttgaccgtcg aaggagtaag tgaaacttct cttattcttt catcgaaaga gctagtgtca 960
actagtttta acgactgcca atggtgtccc aatgcagggt gatcgctgca atcttgacct 1020
tgtaccggga tgcactgacc ctagctcaca tttgtatgac ccacttgcca acgtagatga 1080
tggatcatgt ccaattgaca cagtgtcaga ggaataacat aatcttttgg gggctgggaa 1140
gtaaaaaaat attatcgata tctcttagtg ttgataatct tttgggggct gtcaaagtca 1200
tgatatattt tcaggcactt ttttggttca tcattgcctt gttttgtaaa ttgttatatg 1260
ttgatatgcc attagaatgt tgataaacct gccttagaat tcaatattcc attaaagtca 1320
tgttatatta tgaggtacct ttgtttg 1347
<210> 25
<211> 1193
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
acacacacac acagcagagg aaaaatgaaa agcattccag agatgttact gtgttgtagt 60
tctgatcata agccaattcc tcttgtgggg tttggaacag ctgtttatcc tctttcatcc 120
tctgaaacca tgaaacaatc catcctccat gcaatcaaac ttggttacag acacttcgac 180
tctgcaactt tataccagtc agagcagcct cttggagaat caattgttga tgccatacgc 240
ctaggcttca ttcaatctcg ccaagacctc ttcatcacct ctaagctttg gtgttctgat 300
gctcaccctc atcatgtcct ccctgctctt caaaattcac tcaagaatct tggattggaa 360
taccttgatc tgtatctcat tcactggcca gtgagctcaa agccaggtaa atttgagtat 420
ccggtgaaca agcaagagct tcttcccatg gatttcaagt ctgtttggga agccatggag 480
gagtgtcaga atcttggcct cacaaaattt attggagtca gtaacttctc atgcaagaag 540
ctccaattat tactagcaac cgcaaagatc cctccagctg tcaaccaggt cgagatgaac 600
ccactttggc aacagaagaa gctaagagag ttttgtgaga aaaatggtat tcatatcaca 660
gcttactctc ctttgggcgc caaaggaaca atttggggga agtgacaaag tcatggaatg 720
tgaggtgctc aaacagattg ccaaagctag aggaaaatct gttgcccagg tttgtctcag 780
atagggttta tgagcaaggg gtgagtgttc tggtgaagag cttcagtgag gagaggatga 840
aagagaacct tcaaatattt gattgggagc taagcgcaca agactccgag atgataaatc 900
aaatttcaca gtataaagga tgtgctggac ttgatttcat atcagatgaa ggcccttaca 960
aatctctcca ggatttatgg gatggtgaaa ttgtttgatc ctgtaaacgt gtagccaaaa 1020
accacttaga taccgtttga taacatttta tgcttacaac acaaattaat gtgtgtttta 1080
tgtttacaaa aactttggaa actgtttggt tttttatttt catttatggt ttgatcattg 1140
atttcacagt tacatttcac tttattgaat gtcattgctt ggttggtgct gct 1193
<210> 26
<211> 1710
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gtactctgcg ttgataccac tgcttaagca gtggtatcac cgcagagtac agggaaacag 60
caatggattt ctctctccaa ctccctcatg gttgctgctc ttcatcctct ccgctttctt 120
ccatctcctt cctctttttc accaaaaagt ccaaaaaacc aaccaacctt cctccaaccc 180
caccaaccct tcccatcatc ggcaacctcc accaactcgg caagctccct catcactcac 240
ttacccaact ctcaaagaaa cacggccctg tcatgctctt gagacttggc caagtcccat 300
gccttgtcgt ttcgtccccc gaaacagcca aacaggtcct aaaaactcat gatctcgaat 360
gttgcagtag acccttctct cacggcccca aaagactgtc ttacaatctc ctagacttgg 420
cttttgggcc ttacagcgat tactggagag aaatgcgaaa gctctgcgtg atcgagcttt 480
tcacagtgaa aagggttcat tcatttcgac acgttagaga agaagagttg ggtaagatga 540
tcagacacat cactcaaatc tctcctaata atccactcaa tttgagcgag ttggtattct 600
ctctcacgaa ctcaattatt tgtaaggttg cgtttgggaa gagctatgag gggaagcaat 660
ttgagagtgg taagtttcaa gagagtatgg atgaggctat ggccatgttg agtagctttt 720
ggggggcgga tttctttccg tatgtaggtt ggtttgttga tgtatttaca ggactccatt 780
ggaggcttga gaaatgcttt cgtgagtttg atgtgttctt cgagagggtg attgaagagc 840
atcttgatcc taacaggaca aagtctgagc atgaagatat tactgacatc ttgttagggt 900
tgtccaagga tgaaactgtt tcttttcatc ttaccagaaa tcatataaag gcaattctca 960
tgaacatatt tatcggtgga gtcgacacca gttctcttac aattgtatgg gcaatgaccg 1020
agctagccaa gaacccaaga gtaatgaaaa aagttcaagc agaaataagg agttgcattg 1080
gaagaaaaca gacagtcgat gaaacccaac ttgacaagct caattactta aaaatggtgg 1140
tgaaagagac tttcaggcta cacccaccag ccacatttct aattccccgc gagtcgatgc 1200
aacattgcaa gatcggaggc tacgacgttt accccaaaac aagaatccta gtcaatgcct 1260
gggcaattgg aagagaccca gaaatttgga acaacccaga agagttctac ccagagaggt 1320
ttgagaagag tgaaattgat ttcaggggta ataatttcga gttgttgcca tttggagcgg 1380
gtcggaggat ttgccccggt ttgacaatgg gtgccatagc tgtggaattt actctggcaa 1440
atcttttgca ctgttttgac tgggaaatgc cttatgggat ggaaaggaaa gatatcagct 1500
tggaagagga ggctggcttg actgtgcata agaagttgtc tcttgatctt gtccctatca 1560
aatatgattg ggaaggattt gaaacttaga ggagggcatt gttgtctact catgttaaaa 1620
ataaaaataa agtatctata tgaaataaga tggtagaact cttgcctttc cctaattgta 1680
tgttaaaaac atgtataatc ttgtgcctgt 1710
<210> 27
<211> 1302
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
acacacacac agcagaggaa aaatgaaaag cattccagag atgttactgt gttgtagttc 60
tgatcataag ccaattcctc ttgtggggtt tggaacagct gtttatcctc ttgcatcctc 120
tgaaaccatg aaacaatccc tcctccatgc aatcaaactt ggttacagac acttcgactc 180
tgcagcttta taccagtcag agcagcctct tggagaatca attgttgatg ccatacgcct 240
aggcttcatt caatctcgcc aagacctctt catcacctct aagctttggt gttctgatgc 300
tcaccctcat catgtcctcc ctgctcttca aagttcactc aagtaattca taactgctgc 360
tcttttaatg ttattatgct ccgtaaatct ttctcttctt ttttatcagc gaaagtcgct 420
tgttatgctc cataaatcat tatatttata ttcttttgtt atatactagt tttttataat 480
atttttttta atccctctaa tttgatgatt ttgatatact tatcaatctc ttggcttcta 540
tacgtaaaaa aaataaacga aaatttaaac ataatgatca aattgaaacg gacgtaaagt 600
gcaaggattt aaggacaaaa ataaaaggaa gaattacact gacatgatat caataaaaaa 660
atattatgaa tgttaataat taatgttata aacttttttt tattaattta taattttttt 720
ctctctaaca ccactatcag gtagttttcc caaaatataa ttttgcttag ttggtttttt 780
tttttaatta ttatttattt atagaaatct tggattggaa taccttgatc tgtatctcat 840
tcactggcca gtgagttcaa agccagggaa atttgagtat ccagtgaaca agcaagagct 900
tcttcccatg gatttcaagt ctgtttggga agccatggag gagtgtcaga atcttggcct 960
cacaaaattc attggagtca gtaacttctc atgcaagaag ctccaactat tactagcaac 1020
cgcaaagatc cctccagctg tcaaccaggt cgagatgaac ccactttggc aacagaagaa 1080
gctaagagag ttttgtgaga aaaaaggtat tcatatcaca gcttactctc ctttgggcgc 1140
caaaggaaca atttggggaa gtgacaaagt catggaatgt gaggtgctca aacagattgc 1200
caaagctaga ggaaaatctg ttgcccaggt aaggaggttt catcaaattt actcatctat 1260
ctagactgta tatagagtac aggctgtacc atactaagtg ga 1302

Claims (10)

1.与油茶种仁含油率相关的SNP分子标记组合,其特征在于,所述SNP分子标记组合包括PB.57703.1-685、PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288、PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175、PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367、PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532、PB.35678.1-1129、PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025、PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417、PB.63477.1-1109、PB.63477.1-1163和PB.63477.1-1166;
其中,SNP分子标记PB.57703.1-685含有如SEQ ID NO.19所示序列第685位的多态性为C/T的核苷酸序列;
SNP分子标记PB.93518.1-182含有如SEQ ID NO.20所示序列第182位的多态性为T/C的核苷酸序列,SNP分子标记PB.93518.1-191含有如SEQ ID NO.20所示序列第191位的多态性为T/C的核苷酸序列,SNP分子标记PB.93518.1-224含有如SEQ ID NO.20所示序列第224位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-270含有如SEQ ID NO.20所示序列第270位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-284含有如SEQ ID NO.20所示序列第284位的多态性为G/A的核苷酸序列,SNP分子标记PB.93518.1-288含有如SEQID NO.20所示序列第288位的多态性为C/T的核苷酸序列;
SNP分子标记PB.103793.1-1118含有如SEQ ID NO.21所示序列第1118位的多态性为A/G的核苷酸序列,SNP分子标记PB.103793.1-1172含有如SEQ ID NO.21所示序列第1172位的多态性为G/A的核苷酸序列,SNP分子标记PB.103793.1-1175含有如SEQ ID NO.21所示序列第1175位的多态性为A/C的核苷酸序列;
SNP分子标记PB.47687.1-148含有如SEQ ID NO.22所示序列第148位的多态性为A/G的核苷酸序列,SNP分子标记PB.47687.1-215含有如SEQ ID NO.22所示序列第215位的多态性为G/T的核苷酸序列,SNP分子标记PB.47687.1-258含有如SEQ ID NO.22所示序列第258位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-264含有如SEQ ID NO.22所示序列第264位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-282含有如SEQ ID NO.22所示序列第282位的多态性为T/C的核苷酸序列,SNP分子标记PB.47687.1-297含有如SEQID NO.22所示序列第297位的多态性为C/T的核苷酸序列,SNP分子标记PB.47687.1-360含有如SEQ ID NO.22所示序列第360位的多态性为A/G的核苷酸序列,SNP分子标记PB.47687.1-366含有如SEQ ID NO.22所示序列第366位的多态性为T/C的核苷酸序列,PB.47687.1-367含有如SEQ ID NO.22所示序列第367位的多态性为G/C的核苷酸序列;
SNP分子标记PB.85097.1-125含有如SEQ ID NO.23所示序列第125位的多态性为C/G的核苷酸序列,SNP分子标记PB.85097.1-197含有如SEQ ID NO.23所示序列第197位的多态性为G/C的核苷酸序列,SNP分子标记PB.85097.1-293含有如SEQ ID NO.23所示序列第293位的多态性为A/G的核苷酸序列,SNP分子标记PB.85097.1-356含有如SEQ ID NO.23所示序列第356位的多态性为T/G的核苷酸序列,SNP分子标记PB.85097.1-532含有如SEQ ID NO.23所示序列第532位的多态性为A/T的核苷酸序列;
SNP分子标记PB.35678.1-1129含有如SEQ ID NO.24所示序列第1129位的多态性为G/C的核苷酸序列;
SNP分子标记PB.70158.1-51含有如SEQ ID NO.25所示序列第51位的多态性为G/A的核苷酸序列,SNP分子标记PB.70158.1-187含有如SEQ ID NO.25所示序列第187位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-306含有如SEQ ID NO.25所示序列第306位的多态性为C/T的核苷酸序列,SNP分子标记PB.70158.1-314含有如SEQ ID NO.25所示序列第314位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-408含有如SEQ ID NO.25所示序列第408位的多态性为T/G的核苷酸序列,SNP分子标记PB.70158.1-413含有如SEQ IDNO.25所示序列第413位的多态性为T/A的核苷酸序列,SNP分子标记PB.70158.1-419含有如SEQ ID NO.25所示序列第419位的多态性为A/T的核苷酸序列,SNP分子标记PB.70158.1-473含有如SEQ ID NO.25所示序列第473位的多态性为C/G的核苷酸序列,SNP分子标记PB.70158.1-649含有如SEQ ID NO.25所示序列第649位的多态性为A/G的核苷酸序列,SNP分子标记PB.70158.1-704含有如SEQ ID NO.25所示序列第704位的多态性为G/A的核苷酸序列,SNP分子标记PB.70158.1-707含有如SEQ ID NO.25所示序列第707位的多态性为A/C的核苷酸序列,SNP分子标记PB.70158.1-778含有如SEQ ID NO.25所示序列第778位的多态性为C/T的核苷酸序列,SNP分子标记PB.70158.1-854含有如SEQ ID NO.25所示序列第854位的多态性为A/C的核苷酸序列,SNP分子标记PB.70158.1-930含有如SEQ ID NO.25所示序列第930位的多态性为C/G的核苷酸序列,SNP分子标记PB.70158.1-935含有如SEQ IDNO.25所示序列第935位的多态性为T/G的核苷酸序列,SNP分子标记PB.70158.1-944含有如SEQ ID NO.25所示序列第944位的多态性为A/T的核苷酸序列,SNP分子标记PB.70158.1-1025含有如SEQ ID NO.25所示序列第1025位的多态性为C/T的核苷酸序列;
SNP分子标记PB.76391.3-1354含有如SEQ ID NO.26所示序列第1354位的多态性为A/C的核苷酸序列,SNP分子标记PB.76391.3-1385含有如SEQ ID NO.26所示序列第1385位的多态性为G/A的核苷酸序列,SNP分子标记PB.76391.3-1417含有如SEQ ID NO.26所示序列第1417位的多态性为T/C的核苷酸序列;
SNP分子标记PB.63477.1-1109含有如SEQ ID NO.27所示序列第1109位的多态性为A/G的核苷酸序列,SNP分子标记PB.63477.1-1163含有如SEQ ID NO.27所示序列第1163位的多态性为G/A的核苷酸序列,SNP分子标记PB.63477.1-1166含有如SEQ ID NO.27所示序列第1166位的多态性为A/C的核苷酸序列。
2.根据权利要求1所述的SNP分子标记组合,其特征在于,所述SNP分子标记中多态性位点的基因型及其对应的油茶种仁含油率表型如下所示:
Figure FDA0004267211220000041
Figure FDA0004267211220000051
3.用于扩增权利要求1或2所述的SNP分子标记组合的引物,其特征在于,包括以下引物:
如SEQ ID NO.1-2所示的PB.57703.1-685的引物;
如SEQ ID NO.3-4所示的PB.93518.1-182、PB.93518.1-191、PB.93518.1-224、PB.93518.1-270、PB.93518.1-284、PB.93518.1-288的引物;
如SEQ ID NO.5-6所示的PB.103793.1-1118、PB.103793.1-1172、PB.103793.1-1175的引物;
如SEQ ID NO.7-8所示的PB.47687.1-148、PB.47687.1-215、PB.47687.1-258、PB.47687.1-264、PB.47687.1-282、PB.47687.1-297、PB.47687.1-360、PB.47687.1-366、PB.47687.1-367的引物;
如SEQ ID NO.9-10所示的PB.85097.1-125、PB.85097.1-197、PB.85097.1-293、PB.85097.1-356、PB.85097.1-532的引物;
如SEQ ID NO.11-12所示的PB.35678.1-1129的引物;
如SEQ ID NO.13-14所示的PB.70158.1-51、PB.70158.1-187、PB.70158.1-306、PB.70158.1-314、PB.70158.1-408、PB.70158.1-413、PB.70158.1-419、PB.70158.1-473、PB.70158.1-649、PB.70158.1-704、PB.70158.1-707、PB.70158.1-778、PB.70158.1-854、PB.70158.1-930、PB.70158.1-935、PB.70158.1-944、PB.70158.1-1025的引物;
如SEQ ID NO.15-16所示的PB.76391.3-1354、PB.76391.3-1385、PB.76391.3-1417的引物;
和,如SEQ ID NO.17-18所示的PB.63477.1-1109、PB.63477.1-1163、PB.63477.1-1166的引物。
4.含有权利要求3所述的引物的试剂或试剂盒。
5.权利要求1或2所述的SNP分子标记组合或权利要求3所述的引物或权利要求4所述的试剂或试剂盒的以下任一应用:
(1)在鉴定油茶种仁含油率表型中的应用;
(2)在油茶种质资源鉴定、改良或分子标记辅助育种中的应用,所述油茶种质资源鉴定、改良或分子标记辅助育种的性状为油茶种仁含油率;
(3)在油茶种仁含油率的早期预测中的应用;
(4)在筛选高含油率油茶中的应用。
6.鉴定油茶种仁含油率表型的方法,其特征在于,包括:
(1)提取待鉴定油茶的总RNA,反转录合成cDNA;
(2)以cDNA为模板,利用权利要求3所述的引物进行PCR扩增;
(3)分析PCR扩增产物中权利要求1或2所述的SNP分子标记组合的基因型,根据所述基因型判断待鉴定油茶的含油率表型。
7.根据权利要求6所述的方法,其特征在于,步骤(2)中,所述PCR扩增的反应程序为:94~95℃,3~5min;94~95℃,15~30s,65~69℃,40~60s,38~45个循环;67~70℃,3~6min。
8.根据权利要求6或7所述的方法,其特征在于,步骤(3)中所述判断待鉴定油茶的含油率表型的方法为:
根据如下所示的SNP分子标记中多态性位点的基因型及油茶种仁含油率表型的对应关系进行判断:
Figure FDA0004267211220000071
Figure FDA0004267211220000081
9.根据权利要求8所述的方法,其特征在于,若超过39个位点为高含油率基因型,则待鉴定油茶为高含油率表型;若少于等于30个位点为高含油率基因型,则待鉴定油茶为低含油率表型。
10.根据权利要求9所述的方法,其特征在于,若少于等于28个位点为高含油率基因型,则待鉴定油茶为低含油率表型。
CN202010477542.3A 2020-05-29 2020-05-29 与油茶种仁含油率相关的snp分子标记及其应用 Active CN111534630B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010477542.3A CN111534630B (zh) 2020-05-29 2020-05-29 与油茶种仁含油率相关的snp分子标记及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010477542.3A CN111534630B (zh) 2020-05-29 2020-05-29 与油茶种仁含油率相关的snp分子标记及其应用

Publications (2)

Publication Number Publication Date
CN111534630A CN111534630A (zh) 2020-08-14
CN111534630B true CN111534630B (zh) 2023-07-14

Family

ID=71979866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010477542.3A Active CN111534630B (zh) 2020-05-29 2020-05-29 与油茶种仁含油率相关的snp分子标记及其应用

Country Status (1)

Country Link
CN (1) CN111534630B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113584204B (zh) * 2021-07-23 2023-06-23 中国林业科学研究院亚热带林业研究所 与油茶种子出仁率相关的dna片段、其紧密连锁的snp分子标记及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106676102A (zh) * 2017-02-23 2017-05-17 中国林业科学研究院亚热带林业研究所 一种与油茶种子油脂中花生烯酸含量相关的snp分子标记及其应用
CN106868132A (zh) * 2017-02-23 2017-06-20 中国林业科学研究院亚热带林业研究所 一种与油茶种子油脂中软脂酸、油酸、亚麻酸含量相关的snp分子标记及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106755528B (zh) * 2017-02-23 2020-06-23 中国林业科学研究院亚热带林业研究所 一种与油茶种子含油率相关的snp分子标记及其应用
CN106834477B (zh) * 2017-04-17 2020-06-09 中国林业科学研究院亚热带林业研究所 鉴定高含油率油茶的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106676102A (zh) * 2017-02-23 2017-05-17 中国林业科学研究院亚热带林业研究所 一种与油茶种子油脂中花生烯酸含量相关的snp分子标记及其应用
CN106868132A (zh) * 2017-02-23 2017-06-20 中国林业科学研究院亚热带林业研究所 一种与油茶种子油脂中软脂酸、油酸、亚麻酸含量相关的snp分子标记及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于转录组SNP 构建油茶主要品种资源的分子身份证;林萍等;中国农业科学;第56卷(第2期);第217-235页 *

Also Published As

Publication number Publication date
CN111534630A (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
CN111455090B (zh) 与油茶种仁油中亚麻酸含量相关的关键snp分子标记及其应用
CN111534632B (zh) 与油茶种仁含油率相关的3个snp分子标记及其应用
CN111500763B (zh) 与油茶种子油脂中棕榈油酸含量相关的snp分子标记及其应用
CN111705152B (zh) 与油茶种子油中硬脂酸含量相关的snp分子标记及其应用
CN106755528B (zh) 一种与油茶种子含油率相关的snp分子标记及其应用
CN111455091B (zh) 与油茶种仁油中亚麻酸含量相关的snp分子标记及其应用
CN106834477B (zh) 鉴定高含油率油茶的方法
CN111500764B (zh) 与油茶种子油脂中油酸和亚油酸含量相关的snp分子标记及其应用
CN111534631B (zh) 与油茶种仁含油率相关的2个snp分子标记及其应用
CN113637786B (zh) 与油茶种子油脂中亚油酸含量相关的dna片段、snp分子标记及其应用
CN113637787B (zh) 一种与油茶单果质量相关的dna片段及其应用
CN111534630B (zh) 与油茶种仁含油率相关的snp分子标记及其应用
CN113584204B (zh) 与油茶种子出仁率相关的dna片段、其紧密连锁的snp分子标记及其应用
CN111518943B (zh) 与油茶种子油中二十碳烯酸含量相关的snp分子标记及其应用
CN111676307B (zh) 与油茶种子油脂中软脂酸含量相关的snp分子标记及其应用
CN113584203B (zh) 与油茶单果质量相关的dna片段、其紧密连锁的snp分子标记及其应用
CN113430298B (zh) 与油茶种子油中亚麻酸含量相关的dna片段、其紧密连锁的snp分子标记及其应用
CN107460246A (zh) 一种快速定位桃目的基因的方法
CN114015756A (zh) 凤丹耐涝差异表达基因及基于转录组测序挖掘的方法
KR101432281B1 (ko) 캡시컴 안늄의 종내집단을 이용한 ssr 마커 및 유전자 연관지도
CN113604593B (zh) 一种与油茶种子油脂中亚油酸含量相关的dna片段及其应用
CN113637785B (zh) 与油茶种子出仁率相关的dna片段、snp分子标记及其应用
CN113430297B (zh) 与油茶种子油中软脂酸含量相关的dna片段、其紧密连锁的snp分子标记及其应用
KR101432284B1 (ko) 캡시컴 안늄의 종내집단을 이용한 ssr 마커 및 유전자 연관지도
KR101432287B1 (ko) 캡시컴 안늄의 종내집단을 이용한 ssr 마커 및 유전자 연관지도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant