CN111349713A - 一套基于kasp的snp标记及其应用 - Google Patents

一套基于kasp的snp标记及其应用 Download PDF

Info

Publication number
CN111349713A
CN111349713A CN202010196452.7A CN202010196452A CN111349713A CN 111349713 A CN111349713 A CN 111349713A CN 202010196452 A CN202010196452 A CN 202010196452A CN 111349713 A CN111349713 A CN 111349713A
Authority
CN
China
Prior art keywords
cigar
seq
chromosome
physical position
amplifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010196452.7A
Other languages
English (en)
Other versions
CN111349713B (zh
Inventor
刘国祥
吕洪坤
张兴伟
李媛
向小华
刘好宝
戴培刚
佟英
杨爱国
冯全福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Co Of China National Tobacco Corp
Original Assignee
Hainan Co Of China National Tobacco Corp
Tobacco Research Institute of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Co Of China National Tobacco Corp, Tobacco Research Institute of CAAS filed Critical Hainan Co Of China National Tobacco Corp
Priority to CN202010196452.7A priority Critical patent/CN111349713B/zh
Publication of CN111349713A publication Critical patent/CN111349713A/zh
Application granted granted Critical
Publication of CN111349713B publication Critical patent/CN111349713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一套基于KASP的SNP标记及其应用,属于分子生物学、种质资源学和分子育种技术领域,所述SNP标记包括CigarSNP01‑1、CigarSNP01‑2、CigarSNP02‑1等共48个标记。采用本发明提供的SNP标记,完成雪茄烟SNP指纹图谱构建工作,能系统鉴定现有雪茄烟资源,并剔除重复收集的资源,建立雪茄烟品种知识产权保护机制。利用本发明提供的SNP标记筛选鉴定新收集的雪茄烟资源,审定新培育的雪茄烟品种,并利用到雪茄烟育种工作中。

Description

一套基于KASP的SNP标记及其应用
技术领域
本发明属于分子生物学、种质资源学和分子育种技术领域,尤其涉及一套基于KASP的SNP标记及其应用。
背景技术
雪茄烟因其独有的风格特色、深厚的文化内涵和更高的吸食安全性,吸引着越来越多的消费者,近年来国内外市场需求日益增长,产业前景广阔。但是,我国雪茄烟研究工作起步晚,基础研究落后,各研究单位引进、收集、交换的雪茄烟资源、品种众多,存在同种异名或者同名异种的现象,非常不利于雪茄烟资源的管理和利用。且雪茄烟具体遗传背景尚不清楚,不能够有效快速的进行雪茄烟常规育种和分子育种工作。因此,对这些资源构建指纹图谱,剔除重复收集、引进的资源,为每份资源赋予独有的身份信息,对雪茄烟资源收集鉴定和品种分子审定意义重大。
目前,烟草种质资源依然采用第二代分子标记来进行指纹图谱构建工作。随着分子标记技术和第二代测序技术的快速发展,SNP标记和基因组学理论、方法不断深入到种质资源多样性检测和指纹图谱构建工作中。由于SNP标记具有覆盖全基因组、通量高、位点特异、共显性遗传、错误率低、开发和检测成本低等诸多优势,未来将成为高通量种质资源检测的重要标记类型。近年来,SNP标记已经广泛应用于小麦、水稻、玉米等大宗作物的指纹图谱构建和遗传进化分析上,目前尚未见到基于 KASP技术的SNP分子标记来进行雪茄烟资源鉴定和品种审定的报导。
发明内容
有鉴于此,本发明的目的在于提供一套基于KASP的SNP标记及其应用,采用本发明提供的SNP 标记,完成雪茄烟SNP指纹图谱构建工作,能系统鉴定现有雪茄烟资源,并剔除重复收集的资源,建立雪茄烟品种知识产权保护机制。利用本发明提供的SNP标记筛选鉴定新收集的雪茄烟资源,审定新培育的雪茄烟品种,并利用到雪茄烟育种工作中。
为了实现上述发明目的,本发明提供了以下技术方案:
本发明提供了一套基于KASP的SNP标记,所述SNP标记包括CigarSNP01-1、CigarSNP01-2、 CigarSNP02-1、CigarSNP02-2、CigarSNP03-1、CigarSNP03-2、CigarSNP04-1、CigarSNP04-2、 CigarSNP05-1、CigarSNP06-1、CigarSNP06-2、CigarSNP07-1、CigarSNP07-2、CigarSNP08-1、 CigarSNP09-1、CigarSNP09-2、CigarSNP10-1、CigarSNP10-2、CigarSNP11-1、CigarSNP11-2、 CigarSNP11-3、CigarSNP12-1、CigarSNP12-2、CigarSNP12-3、CigarSNP13-1、CigarSNP13-2、 CigarSNP14-1、CigarSNP15-1、CigarSNP15-2、CigarSNP16-1、CigarSNP16-2、CigarSNP17-1、 CigarSNP17-2、CigarSNP18-1、CigarSNP18-2、CigarSNP19-1、CigarSNP19-2、CigarSNP20-1、 CigarSNP20-2、CigarSNP20-3、CigarSNP21-1、CigarSNP22-1、CigarSNP22-2、CigarSNP23-1、 CigarSNP23-2、CigarSNP23-3、CigarSNP24-1和CigarSNP24-2。
优选的,所述CigarSNP01-1位于雪茄的染色体Nt01上,物理位置为20189161;
所述CigarSNP01-2位于雪茄的染色体Nt01上,物理位置为127733497;
所述CigarSNP02-1位于雪茄的染色体Nt02上,物理位置为108245254;
所述CigarSNP02-2位于雪茄的染色体Nt02上,物理位置为87338587;
所述CigarSNP03-1位于雪茄的染色体Nt03上,物理位置为5854407;
所述CigarSNP03-2位于雪茄的染色体Nt03上,物理位置为20901328;
所述CigarSNP04-1位于雪茄的染色体Nt04上,物理位置为101426258;
所述CigarSNP04-2位于雪茄的染色体Nt04上,物理位置为44511003;
所述CigarSNP05-1位于雪茄的染色体Nt05上,物理位置为24187234;
所述CigarSNP06-1位于雪茄的染色体Nt06上,物理位置为20171212;
所述CigarSNP06-2位于雪茄的染色体Nt06上,物理位置为99243063;
所述CigarSNP07-1位于雪茄的染色体Nt07上,物理位置为59134911;
所述CigarSNP07-2位于雪茄的染色体Nt07上,物理位置为91456765;
所述CigarSNP08-1位于雪茄的染色体Nt08上,物理位置为68017703;
所述CigarSNP09-1位于雪茄的染色体Nt09上,物理位置为100690577;
所述CigarSNP09-2位于雪茄的染色体Nt09上,物理位置为96986746;
所述CigarSNP10-1位于雪茄的染色体Nt10上,物理位置为51896682;
所述CigarSNP10-2位于雪茄的染色体Nt10上,物理位置为115185980;
所述CigarSNP11-1位于雪茄的染色体Nt11上,物理位置为66259728;
所述CigarSNP11-2位于雪茄的染色体Nt11上,物理位置为23822295;
所述CigarSNP11-3位于雪茄的染色体Nt11上,物理位置为57168417;
所述CigarSNP12-1位于雪茄的染色体Nt12上,物理位置为125890111;
所述CigarSNP12-2位于雪茄的染色体Nt12上,物理位置为31687315;
所述CigarSNP12-3位于雪茄的染色体Nt12上,物理位置为25943135;
所述CigarSNP13-1位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP13-2位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP13-2位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP14-1位于雪茄的染色体Nt14上,物理位置为23358247;
所述CigarSNP15-1位于雪茄的染色体Nt15上,物理位置为86671490;
所述CigarSNP15-2位于雪茄的染色体Nt15上,物理位置为78242076;
所述CigarSNP16-1位于雪茄的染色体Nt16上,物理位置为65433447;
所述CigarSNP16-2位于雪茄的染色体Nt16上,物理位置为9110774;
所述CigarSNP17-1位于雪茄的染色体Nt17上,物理位置为72622941;
所述CigarSNP17-2位于雪茄的染色体Nt17上,物理位置为195888994;
所述CigarSNP18-1位于雪茄的染色体Nt18上,物理位置为10034161;
所述CigarSNP18-2位于雪茄的染色体Nt18上,物理位置为61973096;
所述CigarSNP19-1位于雪茄的染色体Nt19上,物理位置为137571210;
所述CigarSNP19-2位于雪茄的染色体Nt19上,物理位置为22172908;
所述CigarSNP20-1位于雪茄的染色体Nt20上,物理位置为47926589;
所述CigarSNP20-2位于雪茄的染色体Nt20上,物理位置为72837945;
所述CigarSNP20-3位于雪茄的染色体Nt20上,物理位置为31675895;
所述CigarSNP21-1位于雪茄的染色体Nt21上,物理位置为27200249;
所述CigarSNP22-1位于雪茄的染色体Nt22上,物理位置为166;
所述CigarSNP22-2位于雪茄的染色体Nt22上,物理位置为83063701;
所述CigarSNP23-1位于雪茄的染色体Nt23上,物理位置为42324361;
所述CigarSNP23-2位于雪茄的染色体Nt23上,物理位置为41108155;
所述CigarSNP23-3位于雪茄的染色体Nt23上,物理位置为63738673;
所述CigarSNP24-1位于雪茄的染色体Nt24上,物理位置为20135887;
所述CigarSNP24-2位于雪茄的染色体Nt24上,物理位置为11946597。
优选的,扩增所述SNP标记的KASP引物的核苷酸序列如SEQ ID No.1~144;
SEQ ID No.1~3扩增CigarSNP01-1;
SEQ ID No.4~6扩增CigarSNP01-2;
SEQ ID No.7~9扩增CigarSNP02-1;
SEQ ID No.10~12扩增CigarSNP02-2;
SEQ ID No.13~15扩增CigarSNP03-1;
SEQ ID No.16~18扩增CigarSNP03-2;
SEQ ID No.19~21扩增CigarSNP04-1;
SEQ ID No.22~24扩增CigarSNP04-2;
SEQ ID No.25~27扩增CigarSNP05-1;
SEQ ID No.28~30扩增CigarSNP06-1;
SEQ ID No.31~33扩增CigarSNP06-2;
SEQ ID No.34~36扩增CigarSNP07-1;
SEQ ID No.37~39扩增CigarSNP07-2;
SEQ ID No.40~42扩增CigarSNP08-1;
SEQ ID No.43~45扩增CigarSNP09-1;
SEQ ID No.46~48扩增CigarSNP09-2;
SEQ ID No.49~51扩增CigarSNP10-1;
SEQ ID No.52~54扩增CigarSNP10-2;
SEQ ID No.55~57扩增CigarSNP11-1;
SEQ ID No.58~60扩增CigarSNP11-2;
SEQ ID No.61~63扩增CigarSNP11-3;
SEQ ID No.64~66扩增CigarSNP12-1;
SEQ ID No.67~69扩增CigarSNP12-2;
SEQ ID No.70~72扩增CigarSNP12-3;
SEQ ID No.73~75扩增CigarSNP13-1;
SEQ ID No.76~78扩增CigarSNP13-2;
SEQ ID No.79~81扩增CigarSNP14-1;
SEQ ID No.82~84扩增CigarSNP15-1;
SEQ ID No.85~87扩增CigarSNP15-2;
SEQ ID No.88~90扩增CigarSNP16-1;
SEQ ID No.91~93扩增CigarSNP16-2;
SEQ ID No.94~96扩增CigarSNP17-1;
SEQ ID No.97~99扩增CigarSNP17-2;
SEQ ID No.100~102扩增CigarSNP18-1;
SEQ ID No.103~105扩增CigarSNP18-2;
SEQ ID No.106~108扩增CigarSNP19-1;
SEQ ID No.109~111扩增CigarSNP19-2;
SEQ ID No.112~114扩增CigarSNP20-1;
SEQ ID No.115~117扩增CigarSNP20-2;
SEQ ID No.118~120扩增CigarSNP20-3;
SEQ ID No.121~123扩增CigarSNP21-1;
SEQ ID No.124~126扩增CigarSNP22-1;
SEQ ID No.127~129扩增CigarSNP22-2;
SEQ ID No.130~132扩增CigarSNP23-1;
SEQ ID No.133~135扩增CigarSNP23-2;
SEQ ID No.136~138扩增CigarSNP23-3;
SEQ ID No.139~141扩增CigarSNP24-1;
SEQ ID No.142~144扩增CigarSNP24-2。
本发明还提供了上述技术方案所述的SNP标记在构建雪茄烟SNP指纹图谱中的应用。
本发明还提供了上述技术方案所述的SNP标记在检测雪茄烟资源中的应用。
优选的,包括:
提取待测雪茄烟的基因组DNA,利用上述技术方案所述的SNP标记对基因组DNA进行检测,得到待测雪茄烟的基因型数据;
将所述待测雪茄烟的基因型数据与已有的雪茄烟基因型数据比对,当存在3个以上差异位点时,待测雪茄烟为新资源。
本发明还提供了上述技术方案所述的SNP标记在雪茄烟遗传多样性分析中的应用。
本发明还提供了上述技术方案所述的SNP标记在雪茄烟类群划分中的应用。
本发明提供了一套基于KASP的SNP标记及其应用,采用本发明提供的SNP标记,完成雪茄烟 SNP指纹图谱构建工作,能系统鉴定现有雪茄烟资源,并剔除重复收集的资源,建立雪茄烟品种知识产权保护机制。利用本发明提供的SNP标记筛选鉴定新收集的雪茄烟资源,审定新培育的雪茄烟品种,并利用到雪茄烟育种工作中。
本发明具有以下优点和有益效果:
本发明从113份雪茄烟资源简化测序产生的58万个SNP中筛选设计出48个雪茄烟核心SNP标记。利用该套标记组合可以应用于构建雪茄烟SNP指纹图谱,检测雪茄烟品种的真实性,保证雪茄烟资源收集的可靠性,可以进行雪茄烟资源亲缘关系分析,并指导雪茄烟育种工作。所选择的48个 SNP标记具有很高的遗传多样性,且稳定好,均匀分布在雪茄烟24条染色体上,具有较好的可重复性,有很好的可利用性和推广价值。将SNP标记转换成KASP标记,可以提高检测的准确定和分辨率,且检测成本与SSR标记相当,检测过程更加快速、高通量,且检测过程中没有有毒化学试剂的使用。通过本发明可以实现雪茄烟资源鉴定的高通量、低成本和自动化的检测。
附图说明
图1为KASP标记Snpviewer2读取;
图2为111份雪茄烟资源聚类图;
图3为111份雪茄烟资源群组图。
具体实施方式
本发明提供了一套基于KASP的SNP标记,所述SNP标记包括CigarSNP01-1、CigarSNP01-2、 CigarSNP02-1、CigarSNP02-2、CigarSNP03-1、CigarSNP03-2、CigarSNP04-1、CigarSNP04-2、 CigarSNP05-1、CigarSNP06-1、CigarSNP06-2、CigarSNP07-1、CigarSNP07-2、CigarSNP08-1、 CigarSNP09-1、CigarSNP09-2、CigarSNP10-1、CigarSNP10-2、CigarSNP11-1、CigarSNP11-2、 CigarSNP11-3、CigarSNP12-1、CigarSNP12-2、CigarSNP12-3、CigarSNP13-1、CigarSNP13-2、 CigarSNP14-1、CigarSNP15-1、CigarSNP15-2、CigarSNP16-1、CigarSNP16-2、CigarSNP17-1、 CigarSNP17-2、CigarSNP18-1、CigarSNP18-2、CigarSNP19-1、CigarSNP19-2、CigarSNP20-1、 CigarSNP20-2、CigarSNP20-3、CigarSNP21-1、CigarSNP22-1、CigarSNP22-2、CigarSNP23-1、 CigarSNP23-2、CigarSNP23-3、CigarSNP24-1和CigarSNP24-2。
在本发明中,所述CigarSNP01-1位于雪茄的染色体Nt01上,物理位置为20189161;所述 CigarSNP01-2位于雪茄的染色体Nt01上,物理位置为127733497;所述CigarSNP02-1位于雪茄的染色体Nt02上,物理位置为108245254;所述CigarSNP02-2位于雪茄的染色体Nt02上,物理位置为 87338587;所述CigarSNP03-1位于雪茄的染色体Nt03上,物理位置为5854407;所述CigarSNP03-2 位于雪茄的染色体Nt03上,物理位置为20901328;所述CigarSNP04-1位于雪茄的染色体Nt04上,物理位置为101426258;所述CigarSNP04-2位于雪茄的染色体Nt04上,物理位置为44511003;所述 CigarSNP05-1位于雪茄的染色体Nt05上,物理位置为24187234;所述CigarSNP06-1位于雪茄的染色体Nt06上,物理位置为20171212;所述CigarSNP06-2位于雪茄的染色体Nt06上,物理位置为 99243063;所述CigarSNP07-1位于雪茄的染色体Nt07上,物理位置为59134911;所述CigarSNP07-2 位于雪茄的染色体Nt07上,物理位置为91456765;所述CigarSNP08-1位于雪茄的染色体Nt08上,物理位置为68017703;所述CigarSNP09-1位于雪茄的染色体Nt09上,物理位置为100690577;所述CigarSNP09-2位于雪茄的染色体Nt09上,物理位置为96986746;所述CigarSNP10-1位于雪茄的染色体Nt10上,物理位置为51896682;所述CigarSNP10-2位于雪茄的染色体Nt10上,物理位置为115185980;所述CigarSNP11-1位于雪茄的染色体Nt11上,物理位置为66259728;所述CigarSNP11-2 位于雪茄的染色体Nt11上,物理位置为23822295;所述CigarSNP11-3位于雪茄的染色体Nt11上,物理位置为57168417;所述CigarSNP12-1位于雪茄的染色体Nt12上,物理位置为125890111;所述 CigarSNP12-2位于雪茄的染色体Nt12上,物理位置为31687315;所述CigarSNP12-3位于雪茄的染色体Nt12上,物理位置为25943135;所述CigarSNP13-1位于雪茄的染色体Nt13上,物理位置为 86466436;所述CigarSNP13-2位于雪茄的染色体Nt13上,物理位置为86466436;所述CigarSNP13-2 位于雪茄的染色体Nt13上,物理位置为86466436;所述CigarSNP14-1位于雪茄的染色体Nt14上,物理位置为23358247;所述CigarSNP15-1位于雪茄的染色体Nt15上,物理位置为86671490;所述 CigarSNP15-2位于雪茄的染色体Nt15上,物理位置为78242076;所述CigarSNP16-1位于雪茄的染色体Nt16上,物理位置为65433447;所述CigarSNP16-2位于雪茄的染色体Nt16上,物理位置为9110774;所述CigarSNP17-1位于雪茄的染色体Nt17上,物理位置为72622941;所述CigarSNP17-2 位于雪茄的染色体Nt17上,物理位置为195888994;所述CigarSNP18-1位于雪茄的染色体Nt18上,物理位置为10034161;所述CigarSNP18-2位于雪茄的染色体Nt18上,物理位置为61973096;所述 CigarSNP19-1位于雪茄的染色体Nt19上,物理位置为137571210;所述CigarSNP19-2位于雪茄的染色体Nt19上,物理位置为22172908;所述CigarSNP20-1位于雪茄的染色体Nt20上,物理位置为 47926589;所述CigarSNP20-2位于雪茄的染色体Nt20上,物理位置为72837945;所述CigarSNP20-3 位于雪茄的染色体Nt20上,物理位置为31675895;所述CigarSNP21-1位于雪茄的染色体Nt21上,物理位置为27200249;所述CigarSNP22-1位于雪茄的染色体Nt22上,物理位置为166;所述 CigarSNP22-2位于雪茄的染色体Nt22上,物理位置为83063701;所述CigarSNP23-1位于雪茄的染色体Nt23上,物理位置为42324361;所述CigarSNP23-2位于雪茄的染色体Nt23上,物理位置为 41108155;所述CigarSNP23-3位于雪茄的染色体Nt23上,物理位置为63738673;所述CigarSNP24-1 位于雪茄的染色体Nt24上,物理位置为20135887;所述CigarSNP24-2位于雪茄的染色体Nt24上,物理位置为11946597。在本发明中,所述SNP标记的物理位置优选是基于烟草K326基因组17年染色体版(ftp://ftp.sgn.cornell.edu/genomes/Nicotiana_tabacum/edwards_et_al_2017/)+未挂载到染色体的 congtig序列为参考基因组确定的。
在本发明中,扩增所述SNP标记的KASP引物的核苷酸序列如SEQ ID No.1~144。
在本发明中,SEQ ID No.1~3扩增CigarSNP01-1,具体如下:
SEQ ID No.1:
gaaggtgaccaagttcatgcttcgaaaagatcaaacatcaaagggaaatat;
SEQ ID No.2:
gaaggtcggagtcaacggattcgaaaagatcaaacatcaaagggaaatag;
SEQ ID No.3:cgaggctggtggttgtgattgatattt。
在本发明中,SEQ ID No.4~6扩增CigarSNP01-2,具体如下:
SEQ ID No.4:
gaaggtgaccaagttcatgctactaagtagagccaatatgtgagatga;
SEQ ID No.5:
gaaggtcggagtcaacggattctaagtagagccaatatgtgagatgg;
SEQ ID No.6:tgtctccatgggtgatggtaacaaaatt。
在本发明中,SEQ ID No.7~9扩增CigarSNP02-1,具体如下:
SEQ ID No.7:
gaaggtgaccaagttcatgctgttctagattcaagctacctctcg;
SEQ ID No.8:
gaaggtcggagtcaacggattcgttctagattcaagctacctctca;
SEQ ID No.9:tgaggtcttacaaatcttagactaccaaaaa。
在本发明中,SEQ ID No.10~12扩增CigarSNP02-2,具体序列如下:
SEQ ID No.10:
gaaggtgaccaagttcatgcttgtattagcagcttatgcgtctctc;
SEQ ID No.11:
gaaggtcggagtcaacggattgtgtattagcagcttatgcgtctctt;
SEQ ID No.12:taactgctagtaatagatggacaggttataa。
在本发明中,SEQ ID No.13~15扩增CigarSNP03-1,具体如下:
SEQ ID No.13:
gaaggtgaccaagttcatgctatcatcacacaatgcaggaaaatcaattat;
SEQ ID No.14:
gaaggtcggagtcaacggattcatcacacaatgcaggaaaatcaattac;
SEQ ID No.15:ttaggaaaagtgaaagatcatagctttatctata。
在本发明中,SEQ ID No.16~18扩增CigarSNP03-2,具体如下:
SEQ ID No.16:
gaaggtgaccaagttcatgctttcaagtttcaagctttaaattgggaacta;
SEQ ID No.17:
gaaggtcggagtcaacggattcaagtttcaagctttaaattgggaactg;
SEQ ID No.18:tttcaggataatcggaataaacttggaagaa。
在本发明中,SEQ ID No.19~21扩增CigarSNP04-1,具体如下:
SEQ ID No.19:
gaaggtgaccaagttcatgctgtagtctgcgggcatatgttcg;
SEQ ID No.20:
gaaggtcggagtcaacggattaatgtagtctgcgggcatatgttca;
SEQ ID No.21:ccagggtcctgatagatggacgtt。
在本发明中,SEQ ID No.22~24扩增CigarSNP04-2,具体如下:
SEQ ID No.22:
gaaggtgaccaagttcatgctatttcctttctaggaattctttgaacaatc;
SEQ ID No.23:
gaaggtcggagtcaacggattatttcctttctaggaattctttgaacaatg;
SEQ ID No.24:cacggcagaagaactggagcagtt。
在本发明中,SEQ ID No.25~27扩增CigarSNP05-1,具体如下:
SEQ ID No.25:
gaaggtgaccaagttcatgcttgtgatgagaagagtttgtttataatgtgt;
SEQ ID No.26:
gaaggtcggagtcaacggatttgtgatgagaagagtttgtttataatgtga;
SEQ ID No.27:aagatagaaatcaagaacccaatagtctgtt。
在本发明中,SEQ ID No.28~30扩增CigarSNP06-1,具体如下:
SEQ ID No.28:
gaaggtgaccaagttcatgctccaaactcaaagttcaatcactgc;
SEQ ID No.29:
gaaggtcggagtcaacggattgccaaactcaaagttcaatcactgt;
SEQ ID No.30:tctattggttcagaggtttgtgtgaagaa。
在本发明中,SEQ ID No.31~33扩增CigarSNP06-2,具体如下:
SEQ ID No.31:
gaaggtgaccaagttcatgcttatgcagtattttgatcatttgccctataa;
SEQ ID No.32:
gaaggtcggagtcaacggatttgcagtattttgatcatttgccctatag;
SEQ ID No.33:gaacaggggtgcattgataggagtt。
在本发明中,SEQ ID No.34~36扩增CigarSNP07-1,具体如下:
SEQ ID No.34:
gaaggtgaccaagttcatgctccccaaaagcacaacattcgaaatac;
SEQ ID No.35:
gaaggtcggagtcaacggatttccccaaaagcacaacattcgaaataa;
SEQ ID No.36:cagatttagattcgcaggaagtctcttaa。
在本发明中,SEQ ID No.37~39扩增CigarSNP07-2,具体如下:
SEQ ID No.37:
gaaggtgaccaagttcatgctctcaggtcaacacataacaactcaat;
SEQ ID No.38:
gaaggtcggagtcaacggattctcaggtcaacacataacaactcaac;
SEQ ID No.39:tggtctcgtgatacaaggccactta。
在本发明中,SEQ ID No.40~42扩增CigarSNP08-1,具体如下:
SEQ ID No.40:
gaaggtgaccaagttcatgcttcatggaaatttgggacataactattcg;
SEQ ID No.41:
gaaggtcggagtcaacggattattcatggaaatttgggacataactattca;
SEQ ID No.42:acagacctcctcatttggggatcat。
在本发明中,SEQ ID No.43~45扩增CigarSNP09-1,具体如下:
SEQ ID No.43:
gaaggtgaccaagttcatgctagttggaaaacattgctccattcgc;
SEQ ID No.44:
gaaggtcggagtcaacggattaaagttggaaaacattgctccattcgt;
SEQ ID No.45:atttcggatcagagaccgggttgat。
在本发明中,SEQ ID No.46~48扩增CigarSNP09-2,具体如下;
SEQ ID No.46:
gaaggtgaccaagttcatgctctaaaggacaacaatttgatacatttgact;
SEQ ID No.47:
gaaggtcggagtcaacggattctaaaggacaacaatttgatacatttgaca;
SEQ ID No.48:tccacgtaatccatcattttgttgatatgaa。
在本发明中,SEQ ID No.49~51扩增CigarSNP10-1,具体序列如下:
SEQ ID No.49:
gaaggtgaccaagttcatgcttctgcaggtaaccagtaagaaacca;
SEQ ID No.50:
gaaggtcggagtcaacggatttgcaggtaaccagtaagaaaccg;
SEQ ID No.51:agcgaaattgctcctgctaggacaa。
在本发明中,SEQ ID No.52~54扩增CigarSNP10-2,具体如下:
SEQ ID No.52:
gaaggtgaccaagttcatgcttatataaatctcagtttctagcgaacacat;
SEQ ID No.53:
gaaggtcggagtcaacggatttataaatctcagtttctagcgaacacac;
SEQ ID No.54:tttatacgtagaaattgggaatcttcaggat。
在本发明中,SEQ ID No.55~57扩增CigarSNP11-1,具体如下:
SEQ ID No.55:
gaaggtgaccaagttcatgctgcttgtcattatatatgggagactaga;
SEQ ID No.56:
gaaggtcggagtcaacggattcttgtcattatatatgggagactagc;
SEQ ID No.57:gtaagatggacaacccagtacccaa。
在本发明中,SEQ ID No.58~60扩增CigarSNP11-2,具体如下:
SEQ ID No.58:
gaaggtgaccaagttcatgctggcatatcatcataagactaggcaaat;
SEQ ID No.59:
gaaggtcggagtcaacggattgcatatcatcataagactaggcaaac;
SEQ ID No.60:gagaggcattgatccaacttttgtttgaat。
在本发明中,SEQ ID No.61~63扩增CigarSNP11-3,具体如下:
SEQ ID No.61:
gaaggtgaccaagttcatgcttgagtaaggtaccgggtgactg;
SEQ ID No.62:
gaaggtcggagtcaacggattattgagtaaggtaccgggtgacta;
SEQ ID No.63:gataccacttttgtcacaacccaaattgat。
在本发明中,SEQ ID No.64~66扩增CigarSNP12-1,具体如下:
SEQ ID No.64:
gaaggtgaccaagttcatgctattgattattttggtcctccagttcca;
SEQ ID No.65:
gaaggtcggagtcaacggatttgattattttggtcctccagttccg;
SEQ ID No.66:acgggtggttactacgaggtgaatt。
在本发明中,SEQ ID No.67~69扩增CigarSNP12-2,具体如下:
SEQ ID No.67:
gaaggtgaccaagttcatgcttaacgccacctgggcgggt;
SEQ ID No.68:
gaaggtcggagtcaacggattacgccacctgggcgggc;
SEQ ID No.69:ttgtgttgtaatttgaattttaacctacgagata。
在本发明中,SEQ ID No.70~72扩增CigarSNP12-3,具体如下:
SEQ ID No.70:
gaaggtgaccaagttcatgctacttttgggtaaacagactcagaatca;
SEQ ID No.71:
gaaggtcggagtcaacggattcttttgggtaaacagactcagaatcg;
SEQ ID No.72:aactatacgaacctatcggaacaatcaaaat。
在本发明中,SEQ ID No.73~75扩增CigarSNP13-1,具体如下:
SEQ ID No.73:
gaaggtgaccaagttcatgcttctggccgaaatcatatgtagcact;
SEQ ID No.74:
gaaggtcggagtcaacggatttggccgaaatcatatgtagcacc;
SEQ ID No.75:gtgactatgcaagttgacgagtgtatat。
在本发明中,SEQ ID No.76~78扩增CigarSNP13-2,具体如下:
SEQ ID No.76:
gaaggtgaccaagttcatgctactctcttaaatatccccaaaagcact;
SEQ ID No.77:
gaaggtcggagtcaacggattctctcttaaatatccccaaaagcacc;
SEQ ID No.78:gaagtctcctcagggtaagtattttgaatt。
在本发明中,SEQ ID No.79~81扩增CigarSNP14-1,具体如下:
SEQ ID No.79:
gaaggtgaccaagttcatgctcgggcattgtttcatcttggtatct;
SEQ ID No.80:
gaaggtcggagtcaacggattgggcattgtttcatcttggtatcc;
SEQ ID No.81:gcctcgacccatttggtgaaatagtt。
在本发明中,SEQ ID No.82~84扩增CigarSNP15-1,具体如下:
SEQ ID No.82:
gaaggtgaccaagttcatgctgatttatatacttgttaggatgtttggacta;
SEQ ID No.83:
gaaggtcggagtcaacggattatttatatacttgttaggatgtttggactg;
SEQ ID No.84:gcagtggaattcatctaaaacaatccgaaa。
在本发明中,SEQ ID No.85~87扩增CigarSNP15-2,具体如下:
SEQ ID No.85:
gaaggtgaccaagttcatgcttgaagaacagaatggagcaagagga;
SEQ ID No.86:
gaaggtcggagtcaacggattaagaacagaatggagcaagaggg;
SEQ ID No.87:cgcggatcaggacttgcgggta。
在本发明中,SEQ ID No.88~90扩增CigarSNP16-1,具体如下:
SEQ ID No.88:
gaaggtgaccaagttcatgctatccgatgatccaatctgcatcac;
SEQ ID No.89:
gaaggtcggagtcaacggattgatccgatgatccaatctgcatcat;
SEQ ID No.90:cattataaccaatatccttccgtgatcgaa。
在本发明中,SEQ ID No.91~93扩增CigarSNP16-2,具体如下:
SEQ ID No.91:
gaaggtgaccaagttcatgctgaaggatatggcagagcttcgc;
SEQ ID No.92:
gaaggtcggagtcaacggattaagaaggatatggcagagcttcgt;
SEQ ID No.93:tcttcgcgttcgcgtaacactcttt。
在本发明中,SEQ ID No.94~96扩增CigarSNP17-1,具体如下:
SEQ ID No.94:
gaaggtgaccaagttcatgctcatatactatgacctatcaaaagctcaataat;
SEQ ID No.95:
gaaggtcggagtcaacggatttatactatgacctatcaaaagctcaataac;
SEQ ID No.96:gctaccggaggcaataagaacaatataaaa。
在本发明中,SEQ ID No.97~99扩增CigarSNP17-2,具体如下:
SEQ ID No.97:
gaaggtgaccaagttcatgctactctagatctctatagctgaggac;
SEQ ID No.98:
gaaggtcggagtcaacggattaaactctagatctctatagctgaggat;
SEQ ID No.99:gattaaagcagtgcagagttagaccata。
在本发明中,SEQ ID No.100~102扩增CigarSNP18-1,具体如下:
SEQ ID No.100:
gaaggtgaccaagttcatgcttaaacatcgttccacgttgtagcca;
SEQ ID No.101:
gaaggtcggagtcaacggattacatcgttccacgttgtagccg;
SEQ ID No.102:aaggagactaaaggaaagcctttgataattt;
在本发明中,SEQ ID No.103~105扩增CigarSNP18-2,具体如下:
SEQ ID No.103:
gaaggtgaccaagttcatgctgcggtggaacggcggatac;
SEQ ID No.104:
gaaggtcggagtcaacggattggcggtggaacggcggatat;
SEQ ID No.105:ctaaattaccttccaaacaataccttcaaattaat。
在本发明中,SEQ ID No.106~108扩增CigarSNP19-1,具体如下:
SEQ ID No.106:
gaaggtgaccaagttcatgctttttctttcgcttcctcgttttcactt;
SEQ ID No.107:
gaaggtcggagtcaacggattttctttcgcttcctcgttttcactc;
SEQ ID No.108:taaaatgtgcaccattaagcagacaatgttt。
在本发明中,SEQ ID No.109~111扩增CigarSNP19-2,具体如下:
SEQ ID No.109:
gaaggtgaccaagttcatgctacacacgtcacaaatgacaccaca;
SEQ ID No.110:
gaaggtcggagtcaacggattcacacgtcacaaatgacaccacg;
SEQ ID No.111:caaagaaaagcctctgtaaactcctgatat。
在本发明中,SEQ ID No.112~114扩增CigarSNP20-1,具体如下:
SEQ ID No.112:
gaaggtgaccaagttcatgctacctccccaactcaactgagtc;
SEQ ID No.113:
gaaggtcggagtcaacggattcacctccccaactcaactgagta;
SEQ ID No.114:gtagcactctttgattgggcggtttat。
在本发明中,SEQ ID No.115~117扩增CigarSNP20-2,具体如下:
SEQ ID No.115:
gaaggtgaccaagttcatgctccaagttcaggtccccttgcaa;
SEQ ID No.116:
gaaggtcggagtcaacggattcaagttcaggtccccttgcac;
SEQ ID No.117:tgcacgcttcatattcggccatattatt。
在本发明中,SEQ ID No.118~120扩增CigarSNP20-3,具体如下:
SEQ ID No.118:
gaaggtgaccaagttcatgctatcatcagtatcccttacattgtcaca;
SEQ ID No.119:
gaaggtcggagtcaacggattcatcagtatcccttacattgtcacg;
SEQ ID No.120:aatctatcgttgcattgttcgatatggatat。
在本发明中,SEQ ID No.121~123扩增CigarSNP21-1,具体如下:
SEQ ID No.121:
gaaggtgaccaagttcatgctcacagatattcttctcaaggaatttgaa;
SEQ ID No.122:
gaaggtcggagtcaacggattcacagatattcttctcaaggaatttgac;
SEQ ID No.123:ctcatgacttgtagaacctatgaaccta。
在本发明中,SEQ ID No.124~126扩增CigarSNP22-1,具体如下:
SEQ ID No.124:
gaaggtgaccaagttcatgctagaccttacccctacctttatgga;
SEQ ID No.125:
gaaggtcggagtcaacggattagaccttacccctacctttatggt;
SEQ ID No.126:cttgagccgagggtctatcggaaa。
在本发明中,SEQ ID No.127~129扩增CigarSNP22-2,具体如下:
SEQ ID No.127:
gaaggtgaccaagttcatgctacttgtcgaacccgccagtcta;
SEQ ID No.128:
gaaggtcggagtcaacggattacttgtcgaacccgccagtctt;
SEQ ID No.129:agatacaagaagaaagacattccgggtt。
在本发明中,SEQ ID No.130~132扩增CigarSNP23-1,具体如下:
SEQ ID No.130:
gaaggtgaccaagttcatgctacagctatagaatcccccaccg;
SEQ ID No.131:
gaaggtcggagtcaacggatttacagctatagaatcccccacca;
SEQ ID No.132:gaatccttgagtgcttctgtgcactt。
在本发明中,SEQ ID No.133~135扩增CigarSNP23-2,具体如下:
SEQ ID No.133:
gaaggtgaccaagttcatgctaagactaaaattccaggatagttggct;
SEQ ID No.134:
gaaggtcggagtcaacggattgactaaaattccaggatagttggcc;
SEQ ID No.135:tgcaccatacggacaaccctcttta。
在本发明中,SEQ ID No.136~138扩增CigarSNP23-3,具体如下:
SEQ ID No.136:
gaaggtgaccaagttcatgctaaagcggaaataacaagttcgcatcta;
SEQ ID No.137:
gaaggtcggagtcaacggattagcggaaataacaagttcgcatctg;
SEQ ID No.138:ggggtactcccatttgtgaggtaaaa。
在本发明中,SEQ ID No.139~141扩增CigarSNP24-1,具体如下:
SEQ ID No.139:
gaaggtgaccaagttcatgctaactgtgattattcccatttctgtttgtta;
SEQ ID No.140:
gaaggtcggagtcaacggattctgtgattattcccatttctgtttgttg;
SEQ ID No.141:tctgtctcccgatgaagtaagccaa。
在本发明中,SEQ ID No.142~144扩增CigarSNP24-2,具体如下:
SEQ ID No.142:
gaaggtgaccaagttcatgctcatgtgatttgtggcggtacaagt;
SEQ ID No.143:
gaaggtcggagtcaacggattatgtgatttgtggcggtacaagc;
SEQ ID No.144:tactcgaatgcctccgaataaaatcaattat。
本发明还提供了上述技术方案所述的SNP标记在构建雪茄烟SNP指纹图谱、数据库中的应用。在本发明中,所述应用优选包括:提取待测雪茄烟的基因组DNA,以所述基因组DNA为模版经上述技术方案所述的KASP引物进行扩增,得到基因型数据,根据所述基因型数据构建雪茄烟SNP指纹图谱、数据库。在本发明中,所述扩增的程序包括:94℃预变性14分钟;第一步扩增反应,94℃变性20秒,61-55℃延伸60秒,10个循环;第二步扩增反应,94℃变性20秒,55℃延伸60秒,26个循环。在本发明中,所述扩增的体系包括:1.5μl DNA模板,2.5μl 2×KASP Master mix,0.07μl KASP Primermix,水0.93μl,总反应体系是5μl。
本发明还能提供了上述技术方案所述的SNP标记在检测雪茄烟资源、品种中的应用。在本发明中,所述应用优选包括:提取待测雪茄烟的基因组DNA,利用上述技术方案所述的SNP标记对基因组DNA进行检测,得到待测雪茄烟的基因型数据;将所述待测雪茄烟的基因型数据与已有的雪茄烟基因型数据比对,当存在3个以上差异位点时,待测雪茄烟为新资源。
本发明还提供了上述技术方案所述的SNP标记在雪茄烟遗传多样性分析中的应用。本发明还提供了上述技术方案所述的SNP标记在雪茄烟类群划分中的应用。在本发明中,所述应用优选包括: (1)提取待测雪茄烟样品的基因组DNA;
(2)利用上述技术方案所述的SNP标记对待测雪茄烟样品进行检测,获得待测雪茄烟样品基因型数据;
(3)根据(2)获得的待测雪茄烟样品基因型数据,通过用Popgene32软件计算观察等位基因数 No,有效等位基因Ne,Nei’s基因多样性指数H,Shannon’s多态信息指数I。并用PIC_CALC Version 0.6软件计算多态信息量(PIC):
Figure RE-GDA0002503506430000121
其中为n该位点的等位基因数,Pi为第i个等位基因在群体中的频率,Pj为第j个等位基因在群体中的频率。材料间遗传相似系数(GS,genetic similarity coefficient)和遗传距离(Genetic Distance)按照公式:GS=m/(m+n),GD=1-GS来计算,其中,m为基因型间共有带数目,n为差异带数目。利用MEGA7.0.26软件以非加权配对法(UPGMA, unweighted pairgroup method with arithmetic mean)进行聚类分析并绘制出聚类图,从而获得待测样品的遗传背景及所在类群。
下面结合实施例对本发明提供的技术方案进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
雪茄烟核心SNP标记的筛选
前期对113份雪茄烟资源进行简化基因组测序,GBS(Genotyping-by-sequencing)技术指通过测序进行基因分型,通过选取合适的限制性内切酶结合高通量群体测序构建SNP分子标记,而GBS文库的构建,首先使用限制性内切酶对基因组DNA进行酶切,然后加上带barcode的测序接头,对样本进行混合,构建小片段文库(250-550bp),进行PE125双末端测序。
1、基因组电子酶切评估
为了检查酶切的效率和对所有标记进行分析,将基因组按照限制性内切酶的位点对参考基因组进行酶切,统计相应的情况,便于后期的评估。Effective代表符合筛选片段条件的分子标记。
表1基因组电子酶切评估
Figure BDA0002417792950000121
2、Variant分析
Variant变异指在基因组水平上由单个核苷酸或者几个核苷酸的插入或缺失所引起的的变异形成 DNA序列多态性。使用软件GATK(3.4-46)的UnifiedGenotyper模块将处理好的比对文件进行多个样本的Variant检测,检测到的变异使用VariantFiltration进行过滤,过滤参数为-Window 4,-filter"QD <4.0||FS>60.0||MQ<40.0",-G_filter"GQ<20"。使用ANNOVAR对检测出的Variant进行功能注释。
3、雪茄烟核心SNP标记初筛选
(1)基于全基因组简化测序获得的580942个SNP,筛选缺失比例小于5%的位点,共计540781 个SNP位点;
(2)为避免SNP附近区域存在拷贝数变异和重复序列,在剩下的SNP位点中筛选杂合比例小于 10%的SNP位点,共计526773个SNP位点;
(3)雪茄烟核心SNP标记要保证标记的多态性,在剩下的SNP位点中筛选最小等位基因频率 MAF>0.45的位点,共获得7061个SNP位点。
4、雪茄烟核心SNP标记获得
(1)分型比例80%以上;
(2)次要等位基因频率MAF 0.1以上;
(3)位点符合哈迪温伯格平衡;
(4)多态信息含量pic 0.35以上;
(5)衰减距离LD 0.2以上;
(6)位点前后100bp不存在其他的变异,
(7)将位点上下游100bp的序列比对到染色体水平的参考,判断其所在染色体以及位置信息。
通过筛选最终筛选到715个可靠的SNP位点,在此基础上,考虑染色体均匀分布,位点所在附近序列信息不为NNN等继续进行筛选。选定200个SNP位点进行KASP标记开发,用候选验证群体进行KASP标记验证工作,最终选定48个KASP标记作为后续进行雪茄烟SNP指纹图谱工作的SNP 标记,最终获得如表3所示的48个雪茄烟核心SNP标记。
表2 48个雪茄烟核心SNP标记
Figure BDA0002417792950000131
Figure BDA0002417792950000141
Figure BDA0002417792950000151
实施例2
利用48个雪茄烟核心SNP标记鉴定111份雪茄烟资源的方法
111份雪茄烟种质资源是国家烟草种质资源中期库近年来收集保存的雪茄烟种质资源,只进行过表型鉴定,有表型表现较一致的无法鉴别是否为同一份雪茄烟资源,还有存在资源名称相似甚至一致的现象。应用本发明的48个雪茄烟核心SNP标记及KASP引物,对以上资源进行亲缘关系鉴定,具体实验步骤如下:
(1)DNA模板的准备:111份雪茄烟在5片真叶期取样,采用CTAB法提取基因组DNA。
(2)KASP引物的设计、合成:筛选的SNP位点在设计KASP引物时需要上引物-Primer_AlleleX 的5’端添加FAM荧光标签序列5’-GAAGGTGACCAAGTTCATGCT-3’,下引物-Primer_AlleleY的5’端添加HEX荧光标签序列5’-GAAGGTCGGAGTCAACGGATT-3’。引物合成交由六合华大(北京) 基因科技有限公司合成。
表3 KASP引物序列
Figure BDA0002417792950000152
Figure BDA0002417792950000161
Figure BDA0002417792950000171
(3)反应体系:
表4反应体系
组分 384Tape
DNA模板 1.5μl
2×KASP Master mix 2.5μl
KASP Assay mix 0.07μl
0.93μl
总体积 5μl
(4)LGC反应条件:94℃预变性14分钟;第一步扩增反应,94℃变性20秒,61-55℃延伸60 秒,10个循环;第二步扩增反应,94℃变性20秒,55℃延伸60秒,26个循环。
(5)结果分析:利用karaken软件进行数据前处理和分析工作,通常以Excel文件的形式导出基因型分型数据,将基因型与参考基因组相同的条带的标记为“1”,不相同的记为“0”,缺失记为“9”,构建数列矩阵,利用MEGA7.0.26软件以非加权配对法进行聚类分析并绘制出聚类图(图2)。从聚类图来看,基本符合地域和资源名称特征,有种质名称相似或者相同的资源亲缘关系非常近(B112-印尼1号,B231-印尼1号.柬埔寨),侧面证明本次分析结果可靠。
实施例3
利用雪茄烟核心SNP标记进行雪茄烟资源群体结构分析的方法
本发明在筛选雪茄烟核心SNP标记的时候,考虑到标记的多态性和特异性,入选部分来自不同类群特异SNP位点信息,因此可以进行雪茄烟资源群体结构分析。将实施例1开发的48对KASP标记对111份来自世界各国的雪茄烟资源进行群体结构分析。111份雪茄烟资源DNA提取、上机反应和下级基因型获得及结果分析,具体方法同实施例2。群体遗传结构指遗传变异在物种或群体中的一种非随机分布。处于同一亚群内的不同个体亲缘关系较高,而亚群与亚群之间则亲缘关系稍远。群体结构分析有助于理解进化过程,并且可以通过基因型和表型的关联研究确定个体所属的亚群。根据以上分析得到的SNP信息,可以推断出样本的群体结构。采用plink和frappe软件进行群体结构分析,发现K=4时SNP structure有最小的错误率,因此将雪茄烟资源群体分成4个亚群,在亲缘关系图谱中用不同颜色代替(图3)。
结果如图3所示,从图中可以看出,4个亚群(古巴雪茄烟-蓝色、美国雪茄烟-绿色、印尼雪茄烟-紫色、中国晾晒烟-红色)能够较明显的区分开来。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 中国农业科学院烟草研究所
中国烟草总公司海南省公司
<120> 一套基于KASP的SNP标记及其应用
<160> 144
<170> SIPOSequenceListing 1.0
<210> 1
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gaaggtgacc aagttcatgc ttcgaaaaga tcaaacatca aagggaaata t 51
<210> 2
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gaaggtcgga gtcaacggat tcgaaaagat caaacatcaa agggaaatag 50
<210> 3
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgaggctggt ggttgtgatt gatattt 27
<210> 4
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gaaggtgacc aagttcatgc tactaagtag agccaatatg tgagatga 48
<210> 5
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gaaggtcgga gtcaacggat tctaagtaga gccaatatgt gagatgg 47
<210> 6
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tgtctccatg ggtgatggta acaaaatt 28
<210> 7
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gaaggtgacc aagttcatgc tgttctagat tcaagctacc tctcg 45
<210> 8
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gaaggtcgga gtcaacggat tcgttctaga ttcaagctac ctctca 46
<210> 9
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tgaggtctta caaatcttag actaccaaaa a 31
<210> 10
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gaaggtgacc aagttcatgc ttgtattagc agcttatgcg tctctc 46
<210> 11
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gaaggtcgga gtcaacggat tgtgtattag cagcttatgc gtctctt 47
<210> 12
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
taactgctag taatagatgg acaggttata a 31
<210> 13
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gaaggtgacc aagttcatgc tatcatcaca caatgcagga aaatcaatta t 51
<210> 14
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gaaggtcgga gtcaacggat tcatcacaca atgcaggaaa atcaattac 49
<210> 15
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ttaggaaaag tgaaagatca tagctttatc tata 34
<210> 16
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gaaggtgacc aagttcatgc tttcaagttt caagctttaa attgggaact a 51
<210> 17
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gaaggtcgga gtcaacggat tcaagtttca agctttaaat tgggaactg 49
<210> 18
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tttcaggata atcggaataa acttggaaga a 31
<210> 19
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gaaggtgacc aagttcatgc tgtagtctgc gggcatatgt tcg 43
<210> 20
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gaaggtcgga gtcaacggat taatgtagtc tgcgggcata tgttca 46
<210> 21
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ccagggtcct gatagatgga cgtt 24
<210> 22
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gaaggtgacc aagttcatgc tatttccttt ctaggaattc tttgaacaat c 51
<210> 23
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gaaggtcgga gtcaacggat tatttccttt ctaggaattc tttgaacaat g 51
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
cacggcagaa gaactggagc agtt 24
<210> 25
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gaaggtgacc aagttcatgc ttgtgatgag aagagtttgt ttataatgtg t 51
<210> 26
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gaaggtcgga gtcaacggat ttgtgatgag aagagtttgt ttataatgtg a 51
<210> 27
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aagatagaaa tcaagaaccc aatagtctgt t 31
<210> 28
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gaaggtgacc aagttcatgc tccaaactca aagttcaatc actgc 45
<210> 29
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gaaggtcgga gtcaacggat tgccaaactc aaagttcaat cactgt 46
<210> 30
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tctattggtt cagaggtttg tgtgaagaa 29
<210> 31
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gaaggtgacc aagttcatgc ttatgcagta ttttgatcat ttgccctata a 51
<210> 32
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gaaggtcgga gtcaacggat ttgcagtatt ttgatcattt gccctatag 49
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gaacaggggt gcattgatag gagtt 25
<210> 34
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gaaggtgacc aagttcatgc tccccaaaag cacaacattc gaaatac 47
<210> 35
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gaaggtcgga gtcaacggat ttccccaaaa gcacaacatt cgaaataa 48
<210> 36
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cagatttaga ttcgcaggaa gtctcttaa 29
<210> 37
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gaaggtgacc aagttcatgc tctcaggtca acacataaca actcaat 47
<210> 38
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gaaggtcgga gtcaacggat tctcaggtca acacataaca actcaac 47
<210> 39
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
tggtctcgtg atacaaggcc actta 25
<210> 40
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gaaggtgacc aagttcatgc ttcatggaaa tttgggacat aactattcg 49
<210> 41
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gaaggtcgga gtcaacggat tattcatgga aatttgggac ataactattc a 51
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
acagacctcc tcatttgggg atcat 25
<210> 43
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gaaggtgacc aagttcatgc tagttggaaa acattgctcc attcgc 46
<210> 44
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
gaaggtcgga gtcaacggat taaagttgga aaacattgct ccattcgt 48
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
atttcggatc agagaccggg ttgat 25
<210> 46
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gaaggtgacc aagttcatgc tctaaaggac aacaatttga tacatttgac t 51
<210> 47
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gaaggtcgga gtcaacggat tctaaaggac aacaatttga tacatttgac a 51
<210> 48
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
tccacgtaat ccatcatttt gttgatatga a 31
<210> 49
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
gaaggtgacc aagttcatgc ttctgcaggt aaccagtaag aaacca 46
<210> 50
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
gaaggtcgga gtcaacggat ttgcaggtaa ccagtaagaa accg 44
<210> 51
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
agcgaaattg ctcctgctag gacaa 25
<210> 52
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
gaaggtgacc aagttcatgc ttatataaat ctcagtttct agcgaacaca t 51
<210> 53
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gaaggtcgga gtcaacggat ttataaatct cagtttctag cgaacacac 49
<210> 54
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tttatacgta gaaattggga atcttcagga t 31
<210> 55
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gaaggtgacc aagttcatgc tgcttgtcat tatatatggg agactaga 48
<210> 56
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gaaggtcgga gtcaacggat tcttgtcatt atatatggga gactagc 47
<210> 57
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gtaagatgga caacccagta cccaa 25
<210> 58
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gaaggtgacc aagttcatgc tggcatatca tcataagact aggcaaat 48
<210> 59
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gaaggtcgga gtcaacggat tgcatatcat cataagacta ggcaaac 47
<210> 60
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gagaggcatt gatccaactt ttgtttgaat 30
<210> 61
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gaaggtgacc aagttcatgc ttgagtaagg taccgggtga ctg 43
<210> 62
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gaaggtcgga gtcaacggat tattgagtaa ggtaccgggt gacta 45
<210> 63
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
gataccactt ttgtcacaac ccaaattgat 30
<210> 64
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gaaggtgacc aagttcatgc tattgattat tttggtcctc cagttcca 48
<210> 65
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
gaaggtcgga gtcaacggat ttgattattt tggtcctcca gttccg 46
<210> 66
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
acgggtggtt actacgaggt gaatt 25
<210> 67
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gaaggtgacc aagttcatgc ttaacgccac ctgggcgggt 40
<210> 68
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gaaggtcgga gtcaacggat tacgccacct gggcgggc 38
<210> 69
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
ttgtgttgta atttgaattt taacctacga gata 34
<210> 70
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
gaaggtgacc aagttcatgc tacttttggg taaacagact cagaatca 48
<210> 71
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
gaaggtcgga gtcaacggat tcttttgggt aaacagactc agaatcg 47
<210> 72
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
aactatacga acctatcgga acaatcaaaa t 31
<210> 73
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gaaggtgacc aagttcatgc ttctggccga aatcatatgt agcact 46
<210> 74
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gaaggtcgga gtcaacggat ttggccgaaa tcatatgtag cacc 44
<210> 75
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
gtgactatgc aagttgacga gtgtatat 28
<210> 76
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
gaaggtgacc aagttcatgc tactctctta aatatcccca aaagcact 48
<210> 77
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gaaggtcgga gtcaacggat tctctcttaa atatccccaa aagcacc 47
<210> 78
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
gaagtctcct cagggtaagt attttgaatt 30
<210> 79
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
gaaggtgacc aagttcatgc tcgggcattg tttcatcttg gtatct 46
<210> 80
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
gaaggtcgga gtcaacggat tgggcattgt ttcatcttgg tatcc 45
<210> 81
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
gcctcgaccc atttggtgaa atagtt 26
<210> 82
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
gaaggtgacc aagttcatgc tgatttatat acttgttagg atgtttggac ta 52
<210> 83
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gaaggtcgga gtcaacggat tatttatata cttgttagga tgtttggact g 51
<210> 84
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
gcagtggaat tcatctaaaa caatccgaaa 30
<210> 85
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gaaggtgacc aagttcatgc ttgaagaaca gaatggagca agagga 46
<210> 86
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gaaggtcgga gtcaacggat taagaacaga atggagcaag aggg 44
<210> 87
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
cgcggatcag gacttgcggg ta 22
<210> 88
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
gaaggtgacc aagttcatgc tatccgatga tccaatctgc atcac 45
<210> 89
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
gaaggtcgga gtcaacggat tgatccgatg atccaatctg catcat 46
<210> 90
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
cattataacc aatatccttc cgtgatcgaa 30
<210> 91
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
gaaggtgacc aagttcatgc tgaaggatat ggcagagctt cgc 43
<210> 92
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
gaaggtcgga gtcaacggat taagaaggat atggcagagc ttcgt 45
<210> 93
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
tcttcgcgtt cgcgtaacac tcttt 25
<210> 94
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
gaaggtgacc aagttcatgc tcatatacta tgacctatca aaagctcaat aat 53
<210> 95
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
gaaggtcgga gtcaacggat ttatactatg acctatcaaa agctcaataa c 51
<210> 96
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
gctaccggag gcaataagaa caatataaaa 30
<210> 97
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
gaaggtgacc aagttcatgc tactctagat ctctatagct gaggac 46
<210> 98
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
gaaggtcgga gtcaacggat taaactctag atctctatag ctgaggat 48
<210> 99
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
gattaaagca gtgcagagtt agaccata 28
<210> 100
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
gaaggtgacc aagttcatgc ttaaacatcg ttccacgttg tagcca 46
<210> 101
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
gaaggtcgga gtcaacggat tacatcgttc cacgttgtag ccg 43
<210> 102
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
aaggagacta aaggaaagcc tttgataatt t 31
<210> 103
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
gaaggtgacc aagttcatgc tgcggtggaa cggcggatac 40
<210> 104
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
gaaggtcgga gtcaacggat tggcggtgga acggcggata t 41
<210> 105
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
ctaaattacc ttccaaacaa taccttcaaa ttaat 35
<210> 106
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gaaggtgacc aagttcatgc tttttctttc gcttcctcgt tttcactt 48
<210> 107
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
gaaggtcgga gtcaacggat tttctttcgc ttcctcgttt tcactc 46
<210> 108
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
taaaatgtgc accattaagc agacaatgtt t 31
<210> 109
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
gaaggtgacc aagttcatgc tacacacgtc acaaatgaca ccaca 45
<210> 110
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
gaaggtcgga gtcaacggat tcacacgtca caaatgacac cacg 44
<210> 111
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
caaagaaaag cctctgtaaa ctcctgatat 30
<210> 112
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
gaaggtgacc aagttcatgc tacctcccca actcaactga gtc 43
<210> 113
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
gaaggtcgga gtcaacggat tcacctcccc aactcaactg agta 44
<210> 114
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
gtagcactct ttgattgggc ggtttat 27
<210> 115
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
gaaggtgacc aagttcatgc tccaagttca ggtccccttg caa 43
<210> 116
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
gaaggtcgga gtcaacggat tcaagttcag gtccccttgc ac 42
<210> 117
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
tgcacgcttc atattcggcc atattatt 28
<210> 118
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
gaaggtgacc aagttcatgc tatcatcagt atcccttaca ttgtcaca 48
<210> 119
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
gaaggtcgga gtcaacggat tcatcagtat cccttacatt gtcacg 46
<210> 120
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
aatctatcgt tgcattgttc gatatggata t 31
<210> 121
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
gaaggtgacc aagttcatgc tcacagatat tcttctcaag gaatttgaa 49
<210> 122
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
gaaggtcgga gtcaacggat tcacagatat tcttctcaag gaatttgac 49
<210> 123
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
ctcatgactt gtagaaccta tgaaccta 28
<210> 124
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
gaaggtgacc aagttcatgc tagaccttac ccctaccttt atgga 45
<210> 125
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
gaaggtcgga gtcaacggat tagaccttac ccctaccttt atggt 45
<210> 126
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
cttgagccga gggtctatcg gaaa 24
<210> 127
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
gaaggtgacc aagttcatgc tacttgtcga acccgccagt cta 43
<210> 128
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
gaaggtcgga gtcaacggat tacttgtcga acccgccagt ctt 43
<210> 129
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
agatacaaga agaaagacat tccgggtt 28
<210> 130
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
gaaggtgacc aagttcatgc tacagctata gaatccccca ccg 43
<210> 131
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
gaaggtcgga gtcaacggat ttacagctat agaatccccc acca 44
<210> 132
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
gaatccttga gtgcttctgt gcactt 26
<210> 133
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
gaaggtgacc aagttcatgc taagactaaa attccaggat agttggct 48
<210> 134
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
gaaggtcgga gtcaacggat tgactaaaat tccaggatag ttggcc 46
<210> 135
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
tgcaccatac ggacaaccct cttta 25
<210> 136
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
gaaggtgacc aagttcatgc taaagcggaa ataacaagtt cgcatcta 48
<210> 137
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
gaaggtcgga gtcaacggat tagcggaaat aacaagttcg catctg 46
<210> 138
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
ggggtactcc catttgtgag gtaaaa 26
<210> 139
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
gaaggtgacc aagttcatgc taactgtgat tattcccatt tctgtttgtt a 51
<210> 140
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
gaaggtcgga gtcaacggat tctgtgatta ttcccatttc tgtttgttg 49
<210> 141
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
tctgtctccc gatgaagtaa gccaa 25
<210> 142
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
gaaggtgacc aagttcatgc tcatgtgatt tgtggcggta caagt 45
<210> 143
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
gaaggtcgga gtcaacggat tatgtgattt gtggcggtac aagc 44
<210> 144
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
tactcgaatg cctccgaata aaatcaatta t 31

Claims (8)

1.一套基于KASP的SNP标记,其特征在于,所述SNP标记包括CigarSNP01-1、CigarSNP01-2、CigarSNP02-1、CigarSNP02-2、CigarSNP03-1、CigarSNP03-2、CigarSNP04-1、CigarSNP04-2、CigarSNP05-1、CigarSNP06-1、CigarSNP06-2、CigarSNP07-1、CigarSNP07-2、CigarSNP08-1、CigarSNP09-1、CigarSNP09-2、CigarSNP10-1、CigarSNP10-2、CigarSNP11-1、CigarSNP11-2、CigarSNP11-3、CigarSNP12-1、CigarSNP12-2、CigarSNP12-3、CigarSNP13-1、CigarSNP13-2、CigarSNP14-1、CigarSNP15-1、CigarSNP15-2、CigarSNP16-1、CigarSNP16-2、CigarSNP17-1、CigarSNP17-2、CigarSNP18-1、CigarSNP18-2、CigarSNP19-1、CigarSNP19-2、CigarSNP20-1、CigarSNP20-2、CigarSNP20-3、CigarSNP21-1、CigarSNP22-1、CigarSNP22-2、CigarSNP23-1、CigarSNP23-2、CigarSNP23-3、CigarSNP24-1和CigarSNP24-2。
2.根据权利要求1所述的SNP标记,其特征在于,所述CigarSNP01-1位于雪茄的染色体Nt01上,物理位置为20189161;
所述CigarSNP01-2位于雪茄的染色体Nt01上,物理位置为127733497;
所述CigarSNP02-1位于雪茄的染色体Nt02上,物理位置为108245254;
所述CigarSNP02-2位于雪茄的染色体Nt02上,物理位置为87338587;
所述CigarSNP03-1位于雪茄的染色体Nt03上,物理位置为5854407;
所述CigarSNP03-2位于雪茄的染色体Nt03上,物理位置为20901328;
所述CigarSNP04-1位于雪茄的染色体Nt04上,物理位置为101426258;
所述CigarSNP04-2位于雪茄的染色体Nt04上,物理位置为44511003;
所述CigarSNP05-1位于雪茄的染色体Nt05上,物理位置为24187234;
所述CigarSNP06-1位于雪茄的染色体Nt06上,物理位置为20171212;
所述CigarSNP06-2位于雪茄的染色体Nt06上,物理位置为99243063;
所述CigarSNP07-1位于雪茄的染色体Nt07上,物理位置为59134911;
所述CigarSNP07-2位于雪茄的染色体Nt07上,物理位置为91456765;
所述CigarSNP08-1位于雪茄的染色体Nt08上,物理位置为68017703;
所述CigarSNP09-1位于雪茄的染色体Nt09上,物理位置为100690577;
所述CigarSNP09-2位于雪茄的染色体Nt09上,物理位置为96986746;
所述CigarSNP10-1位于雪茄的染色体Nt10上,物理位置为51896682;
所述CigarSNP10-2位于雪茄的染色体Nt10上,物理位置为115185980;
所述CigarSNP11-1位于雪茄的染色体Nt11上,物理位置为66259728;
所述CigarSNP11-2位于雪茄的染色体Nt11上,物理位置为23822295;
所述CigarSNP11-3位于雪茄的染色体Nt11上,物理位置为57168417;
所述CigarSNP12-1位于雪茄的染色体Nt12上,物理位置为125890111;
所述CigarSNP12-2位于雪茄的染色体Nt12上,物理位置为31687315;
所述CigarSNP12-3位于雪茄的染色体Nt12上,物理位置为25943135;
所述CigarSNP13-1位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP13-2位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP13-2位于雪茄的染色体Nt13上,物理位置为86466436;
所述CigarSNP14-1位于雪茄的染色体Nt14上,物理位置为23358247;
所述CigarSNP15-1位于雪茄的染色体Nt15上,物理位置为86671490;
所述CigarSNP15-2位于雪茄的染色体Nt15上,物理位置为78242076;
所述CigarSNP16-1位于雪茄的染色体Nt16上,物理位置为65433447;
所述CigarSNP16-2位于雪茄的染色体Nt16上,物理位置为9110774;
所述CigarSNP17-1位于雪茄的染色体Nt17上,物理位置为72622941;
所述CigarSNP17-2位于雪茄的染色体Nt17上,物理位置为195888994;
所述CigarSNP18-1位于雪茄的染色体Nt18上,物理位置为10034161;
所述CigarSNP18-2位于雪茄的染色体Nt18上,物理位置为61973096;
所述CigarSNP19-1位于雪茄的染色体Nt19上,物理位置为137571210;
所述CigarSNP19-2位于雪茄的染色体Nt19上,物理位置为22172908;
所述CigarSNP20-1位于雪茄的染色体Nt20上,物理位置为47926589;
所述CigarSNP20-2位于雪茄的染色体Nt20上,物理位置为72837945;
所述CigarSNP20-3位于雪茄的染色体Nt20上,物理位置为31675895;
所述CigarSNP21-1位于雪茄的染色体Nt21上,物理位置为27200249;
所述CigarSNP22-1位于雪茄的染色体Nt22上,物理位置为166;
所述CigarSNP22-2位于雪茄的染色体Nt22上,物理位置为83063701;
所述CigarSNP23-1位于雪茄的染色体Nt23上,物理位置为42324361;
所述CigarSNP23-2位于雪茄的染色体Nt23上,物理位置为41108155;
所述CigarSNP23-3位于雪茄的染色体Nt23上,物理位置为63738673;
所述CigarSNP24-1位于雪茄的染色体Nt24上,物理位置为20135887;
所述CigarSNP24-2位于雪茄的染色体Nt24上,物理位置为11946597。
3.根据权利要求1所述的SNP标记,其特征在于,扩增所述SNP标记的KASP引物的核苷酸序列如SEQ ID No.1~144所示;
SEQ ID No.1~3扩增CigarSNP01-1;
SEQ ID No.4~6扩增CigarSNP01-2;
SEQ ID No.7~9扩增CigarSNP02-1;
SEQ ID No.10~12扩增CigarSNP02-2;
SEQ ID No.13~15扩增CigarSNP03-1;
SEQ ID No.16~18扩增CigarSNP03-2;
SEQ ID No.19~21扩增CigarSNP04-1;
SEQ ID No.22~24扩增CigarSNP04-2;
SEQ ID No.25~27扩增CigarSNP05-1;
SEQ ID No.28~30扩增CigarSNP06-1;
SEQ ID No.31~33扩增CigarSNP06-2;
SEQ ID No.34~36扩增CigarSNP07-1;
SEQ ID No.37~39扩增CigarSNP07-2;
SEQ ID No.40~42扩增CigarSNP08-1;
SEQ ID No.43~45扩增CigarSNP09-1;
SEQ ID No.46~48扩增CigarSNP09-2;
SEQ ID No.49~51扩增CigarSNP10-1;
SEQ ID No.52~54扩增CigarSNP10-2;
SEQ ID No.55~57扩增CigarSNP11-1;
SEQ ID No.58~60扩增CigarSNP11-2;
SEQ ID No.61~63扩增CigarSNP11-3;
SEQ ID No.64~66扩增CigarSNP12-1;
SEQ ID No.67~69扩增CigarSNP12-2;
SEQ ID No.70~72扩增CigarSNP12-3;
SEQ ID No.73~75扩增CigarSNP13-1;
SEQ ID No.76~78扩增CigarSNP13-2;
SEQ ID No.79~81扩增CigarSNP14-1;
SEQ ID No.82~84扩增CigarSNP15-1;
SEQ ID No.85~87扩增CigarSNP15-2;
SEQ ID No.88~90扩增CigarSNP16-1;
SEQ ID No.91~93扩增CigarSNP16-2;
SEQ ID No.94~96扩增CigarSNP17-1;
SEQ ID No.97~99扩增CigarSNP17-2;
SEQ ID No.100~102扩增CigarSNP18-1;
SEQ ID No.103~105扩增CigarSNP18-2;
SEQ ID No.106~108扩增CigarSNP19-1;
SEQ ID No.109~111扩增CigarSNP19-2;
SEQ ID No.112~114扩增CigarSNP20-1;
SEQ ID No.115~117扩增CigarSNP20-2;
SEQ ID No.118~120扩增CigarSNP20-3;
SEQ ID No.121~123扩增CigarSNP21-1;
SEQ ID No.124~126扩增CigarSNP22-1;
SEQ ID No.127~129扩增CigarSNP22-2;
SEQ ID No.130~132扩增CigarSNP23-1;
SEQ ID No.133~135扩增CigarSNP23-2;
SEQ ID No.136~138扩增CigarSNP23-3;
SEQ ID No.139~141扩增CigarSNP24-1;
SEQ ID No.142~144扩增CigarSNP24-2。
4.权利要求1所述的SNP标记在构建雪茄烟SNP指纹图谱中的应用。
5.权利要求1所述的SNP标记在检测雪茄烟资源中的应用。
6.根据权利要求5所述的应用,其特征在于,包括:
提取待测雪茄烟的基因组DNA,利用权利要求1所述的SNP标记对基因组DNA进行检测,得到待测雪茄烟的基因型数据;
将所述待测雪茄烟的基因型数据与已有的雪茄烟基因型数据比对,当存在3个以上差异位点时,待测雪茄烟为新资源。
7.权利要求1所述的SNP标记在雪茄烟遗传多样性分析中的应用。
8.权利要求1所述的SNP标记在雪茄烟类群划分中的应用。
CN202010196452.7A 2020-03-19 2020-03-19 一套用于检测雪茄烟资源的kasp引物组及其应用 Active CN111349713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010196452.7A CN111349713B (zh) 2020-03-19 2020-03-19 一套用于检测雪茄烟资源的kasp引物组及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010196452.7A CN111349713B (zh) 2020-03-19 2020-03-19 一套用于检测雪茄烟资源的kasp引物组及其应用

Publications (2)

Publication Number Publication Date
CN111349713A true CN111349713A (zh) 2020-06-30
CN111349713B CN111349713B (zh) 2022-10-04

Family

ID=71192918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010196452.7A Active CN111349713B (zh) 2020-03-19 2020-03-19 一套用于检测雪茄烟资源的kasp引物组及其应用

Country Status (1)

Country Link
CN (1) CN111349713B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111411167A (zh) * 2020-04-27 2020-07-14 国家烟草质量监督检验中心 烟草品种的dna指纹图谱库及其应用
CN113846180A (zh) * 2021-11-10 2021-12-28 云南省烟草农业科学研究院 用于鉴别烟草尼古丁含量高低的分子标记nicas1及其试剂盒与应用
CN114507747A (zh) * 2021-09-16 2022-05-17 贵州省烟草科学研究院 基于全基因组重测序和kasp技术开发的烟草snp标记及其应用
CN115852032A (zh) * 2022-11-25 2023-03-28 广东省农业科学院蔬菜研究所 与豇豆豆荚颜色相关的基因、kasp标记及其应用
CN116377082A (zh) * 2023-03-09 2023-07-04 西北农林科技大学 绵羊lcorl基因单核苷酸多态性标记在生长性状选择中的应用
CN116732226A (zh) * 2023-06-16 2023-09-12 袁隆平农业高科技股份有限公司 一种快速转育瑞丰125转基因玉米自交系的方法及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107354202A (zh) * 2017-07-10 2017-11-17 中国烟草总公司郑州烟草研究院 用于鉴定烤烟k326的引物组合及试剂盒、应用及鉴定方法
CN113337636A (zh) * 2021-07-22 2021-09-03 中国农业科学院蔬菜花卉研究所 一种鉴别番茄叶脉性状的snp位点、kasp分子标记及应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107354202A (zh) * 2017-07-10 2017-11-17 中国烟草总公司郑州烟草研究院 用于鉴定烤烟k326的引物组合及试剂盒、应用及鉴定方法
CN113337636A (zh) * 2021-07-22 2021-09-03 中国农业科学院蔬菜花卉研究所 一种鉴别番茄叶脉性状的snp位点、kasp分子标记及应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
任民等: "基于RAD重测序技术开发烟草品种SNP位点", 《中国烟草科学》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112410452A (zh) * 2020-04-27 2021-02-26 国家烟草质量监督检验中心 云烟87的dna指纹图谱及其应用
CN112481403A (zh) * 2020-04-27 2021-03-12 国家烟草质量监督检验中心 中烟103的dna指纹图谱及其应用
CN112501334A (zh) * 2020-04-27 2021-03-16 国家烟草质量监督检验中心 宁乡晒烟的dna指纹图谱及其应用
CN111411167A (zh) * 2020-04-27 2020-07-14 国家烟草质量监督检验中心 烟草品种的dna指纹图谱库及其应用
CN112501334B (zh) * 2020-04-27 2022-10-11 国家烟草质量监督检验中心 宁乡晒烟的dna指纹图谱及其应用
CN111411167B (zh) * 2020-04-27 2022-10-11 国家烟草质量监督检验中心 烟草品种的dna指纹图谱库及其应用
CN112410452B (zh) * 2020-04-27 2022-10-14 国家烟草质量监督检验中心 云烟87的dna指纹图谱及其应用
CN112481403B (zh) * 2020-04-27 2022-10-14 国家烟草质量监督检验中心 中烟103的dna指纹图谱及其应用
CN115852022B (zh) * 2021-09-16 2024-08-13 贵州省烟草科学研究院 基于全基因组重测序和kasp技术开发的烟草核心snp标记及其应用
CN114507747A (zh) * 2021-09-16 2022-05-17 贵州省烟草科学研究院 基于全基因组重测序和kasp技术开发的烟草snp标记及其应用
CN114507747B (zh) * 2021-09-16 2022-11-15 贵州省烟草科学研究院 基于全基因组重测序和kasp技术开发的烟草snp标记及其应用
CN115852022A (zh) * 2021-09-16 2023-03-28 贵州省烟草科学研究院 基于全基因组重测序和kasp技术开发的烟草核心snp标记及其应用
CN113846180A (zh) * 2021-11-10 2021-12-28 云南省烟草农业科学研究院 用于鉴别烟草尼古丁含量高低的分子标记nicas1及其试剂盒与应用
CN115852032B (zh) * 2022-11-25 2023-06-23 广东省农业科学院蔬菜研究所 与豇豆豆荚颜色相关的基因、kasp标记及其应用
CN115852032A (zh) * 2022-11-25 2023-03-28 广东省农业科学院蔬菜研究所 与豇豆豆荚颜色相关的基因、kasp标记及其应用
CN116377082A (zh) * 2023-03-09 2023-07-04 西北农林科技大学 绵羊lcorl基因单核苷酸多态性标记在生长性状选择中的应用
CN116732226A (zh) * 2023-06-16 2023-09-12 袁隆平农业高科技股份有限公司 一种快速转育瑞丰125转基因玉米自交系的方法及应用

Also Published As

Publication number Publication date
CN111349713B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN111349713B (zh) 一套用于检测雪茄烟资源的kasp引物组及其应用
US11053554B2 (en) Using structural variation to analyze genomic differences for the prediction of heterosis
US9976191B2 (en) Rice whole genome breeding chip and application thereof
CN108779459B (zh) 棉花全基因组snp芯片及其应用
Wang et al. Construction of a SNP fingerprinting database and population genetic analysis of cigar tobacco germplasm resources in China
Fernandes et al. Genome-wide mutagenesis of Zea mays L. using RescueMu transposons
Zhang et al. EST-SSR marker development based on RNA-sequencing of E. sibiricus and its application for phylogenetic relationships analysis of seventeen Elymus species
US20210285063A1 (en) Genome-wide maize snp array and use thereof
CN110872633B (zh) 一种基于snp标记鉴定京科968玉米杂交种纯度的方法
CN109337997B (zh) 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法
CN110724758A (zh) 一种基于snp标记鉴定京农科728玉米杂交种纯度的方法
CN108517368B (zh) 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统
CN110541041B (zh) 与中国家马矮小性状相关的snp标记及其应用
KR102121570B1 (ko) 인삼 품종 또는 자원의 판별 및 분류를 위한 snp 기반 kasp용 프라이머 세트 및 이의 용도
CN115807122A (zh) 一种菠萝种资源鉴定的snp分子标记及应用
CN117133354B (zh) 一种高效鉴定林木关键育种基因模块的方法
Wang et al. Development of EST-SSR markers and their application in the genetic diversity of persimmon (Diospyros kaki Thunb.)
CN111944917B (zh) 一种基于转录组测序开发山茶属植物ssr引物的方法
CN108416189B (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN113249509A (zh) 用于美洲黑杨和小叶杨种间杂交子代的鉴别引物和鉴定方法
CN107447022B (zh) 一种预测玉米杂种优势的snp分子标记及应用
CN113969322B (zh) 一组鉴定玉米杂交种纯度的snp核心位点、引物和高通量鉴定纯度的方法
KR20220050296A (ko) 배추 계통 구분을 위한 단일 염기 다형성 기반 마커 및 이의 용도
CN112695098A (zh) 一种闽清毛脚鸡种的鉴定方法
CN116904639B (zh) 小麦籽粒灌浆速率相关基因TaAmy-5A分子标记及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210818

Address after: 571100 120 hongchenghu Road, Qiongshan District, Haikou City, Hainan Province

Applicant after: Hainan Co. of China National Tobacco Corp.

Address before: 266101 Shandong Province, Qingdao city Laoshan District Four Keyuan Road No. 11

Applicant before: TOBACCO Research Institute CHINESE ACADEMY OF AGRICULTURAL SCIENCES

Applicant before: Hainan Co. of China National Tobacco Corp.

GR01 Patent grant
GR01 Patent grant