CN116622881A - 一种烟草全基因组snp位点组合、探针、芯片及其应用 - Google Patents
一种烟草全基因组snp位点组合、探针、芯片及其应用 Download PDFInfo
- Publication number
- CN116622881A CN116622881A CN202310473323.1A CN202310473323A CN116622881A CN 116622881 A CN116622881 A CN 116622881A CN 202310473323 A CN202310473323 A CN 202310473323A CN 116622881 A CN116622881 A CN 116622881A
- Authority
- CN
- China
- Prior art keywords
- tobacco
- whole genome
- snp
- genotyping
- breeding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 102
- 239000000523 sample Substances 0.000 title claims abstract description 27
- 244000061176 Nicotiana tabacum Species 0.000 title claims description 89
- 238000003205 genotyping method Methods 0.000 claims abstract description 37
- 238000009395 breeding Methods 0.000 claims abstract description 33
- 230000001488 breeding effect Effects 0.000 claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000002068 genetic effect Effects 0.000 claims abstract description 17
- 241000208125 Nicotiana Species 0.000 claims abstract description 14
- 239000003147 molecular marker Substances 0.000 claims abstract description 13
- 238000012098 association analyses Methods 0.000 claims abstract description 10
- 238000010276 construction Methods 0.000 claims abstract description 9
- 239000000463 material Substances 0.000 abstract description 16
- 238000001514 detection method Methods 0.000 abstract description 9
- 108020004414 DNA Proteins 0.000 description 20
- 238000000034 method Methods 0.000 description 12
- 108090000623 proteins and genes Proteins 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 244000020518 Carthamus tinctorius Species 0.000 description 6
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 239000011325 microbead Substances 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000000206 photolithography Methods 0.000 description 3
- 108091060211 Expressed sequence tag Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 235000019506 cigar Nutrition 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000009394 selective breeding Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241000208136 Nicotiana sylvestris Species 0.000 description 1
- 241000208138 Nicotiana tomentosiformis Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000233647 Phytophthora nicotianae var. parasitica Species 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 1
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Botany (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种烟草全基因组SNP位点组合、探针、芯片及其应用,所述应用包括基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定中的任一项;所述烟草全基因组SNP位点组合包括18981个SNP位点,所述18981个SNP位点的物理位置是基于烟草品种K326基因组序列比对确定的;所述18981个SNP位点的物理位置信息见表1。本发明能够进行烟草种质资源或育种群体材料规模化、高通量、低成本的基因分型检测工作,满足烟草种质资源鉴定及进一步育种利用的需求,加快烟草种质资源利用和分子育种的选择效率。
Description
技术领域
本发明属于烟草遗传育种技术领域,具体涉及一种烟草全基因组SNP位点组合探针、芯片及其应用。
背景技术
普通烟草是重要的经济作物之一,为了培育出优质、适产、抗逆性强的烟草品种,多年来研究者们多年来坚持不懈的进行着烟草的良种培育工作,并推广出云烟87、K326和红花大金元等栽培品种。
而在烟草的育种工作中,主要经历了如下几个阶段:1)农家育种阶段:该阶段主要依赖于农民经验,有意识、偶然发现并选择品种变异的育种阶段;2)杂交育种阶段:通过配置杂交组合创造变异,利用田间试验设计和生物统计知识提高选择效率的育种阶段;3)分子育种阶段:包括分子标记辅助选择、转基因和基因编辑育种等,主要是一个综合利用遗传、基因组信息,借助分子生物学等手段加速变异产生且选择效率大幅提升的育种阶段。其中,分子辅助育种技术的关键环节即是开发遗传变异相关的DNA分子标记,并利用检测手段研究利用遗传变异,提高育种的选择效率;而SNP(Single Nucleotide Polymorphism,单核苷酸多态性)技术作为第三代分子标记,因其在全基因组范围内数量多,分布均匀,易于基因分型,适合规模化高通量检测等特点,已成为当前遗传研究中主流分子标记被开发利用。
SNP技术是借助高通量测序平台和SNP芯片是检测基因组范围内SNP变异并利用的有效途径。经过多年的技术发展,当前SNP芯片技术所采用的测序平台主要分为AffymetrixSNP基因分型平台(Affymetrix 技术)、Illumina SNP基因分型平台(包括技术和/>技术)、液相SNP基因分型平台(Genotyping by TargetedSequencing,GBTS、靶向测序技术),三类平台的技术原理存在较大差异,其中靶向测序技术主要是基于目标探针与靶向序列互补结合进行定点捕获,借助二代高通量测序平台获取序列信息,并利用基因组重测序数据分析挖掘出变异信息,该技术对数据分析水平需求较高;Illumina和Affymetrix SNP基因分型平台二者均可划为固相芯片,主要是利用光蚀刻技术,通过不同方式将探针序列固定在玻璃载体上,如Illumina采用微珠技术,将DNA探针序列偶联到微珠的表面,再将各种微珠均匀地撒在已经通过光蚀刻技术蚀刻出很多微孔的玻璃基片上,而Affymetrix的技术则是直接在玻璃载体表面通过光蚀刻的方法植上探针序列。从产品类别和应用市场规模看,Affymetrix SNP基因分型平台有较大优势,在水稻、小麦、玉米、大豆、棉花等主要作物中均有相对成熟的商业化产品,包括目录芯片和定制芯片,如中国农业科学研究院基于该平台,设计开发了660K、55K和55K等不同规格的小麦SNP芯片等。
然而在烟草SNP芯片的研究和利用上,当前国内及国际上尚无成熟的目录芯片可用,国内科研单位虽然基于EST(表达序列标签)、GBS(基因组简约法)、RAD(限制性内切酶位点标签)、RNAseq(转录组测序)等手段开发了一些SNP标记,但是这些标记在基因组覆盖度方面存在明显的不足,因此,急需开发一种适用于规模化烟草种质资源鉴定、功能基因挖掘和育种材料背景分析等方面的烟草全基因组SNP芯片,以弥补当前烟草SNP芯片的不足。
发明内容
本发明的目的在于克服现有技术中的缺陷,提供了一种烟草全基因组SNP位点组合探针、芯片及其应用,其能够进行烟草种质资源或育种群体材料规模化、高通量、低成本的基因分型检测工作,满足烟草种质资源鉴定及进一步育种利用的需求,加快了烟草种质资源利用和分子育种的选择效率。
为实现上述目的,本发明所采取的技术方案如下:
一种烟草全基因组SNP位点组合在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用,所述烟草全基因组SNP位点组合包括18981个SNP位点,所述18981个SNP位点的物理位置是基于烟草品种K326基因组序列比对确定的,所述烟草品种K326基因组序列的获取网址为:https://solgenomics.net/ftp/genomes/Nicotiana_tabacum/edwards_et_al_2017/;依据其在参考基因组物理位置及基因型进行编号,且按照参考基因组Chromosome(染色体/连锁群)和Scaffold(框架序列),以及位置顺序从小至大依次排列,编号范围为Nt01:122369:T/G~Nitab4.5_0941907:351:A/G(具体见表1,其中“:”为分割符,将每个SNP位点编号分为三部分,第一部分表示位点所在参考基因组中Chromosome或Scaffold名称,第二部分表示位点所在参考基因组中Chromosome或Scaffold中位置,第三部分表示位点变异的基因型,A、T、G、C为脱氧核糖核苷酸的缩写,分别表示腺嘌呤脱氧核苷酸(dAMP)、胸腺嘧啶脱氧核苷酸(dTMP)、鸟嘌呤脱氧核苷酸(dGMP)和胞嘧啶脱氧核苷酸(dCMP)
因此,所述18981个SNP位点的物理位置信息见表1,在表1中,所述SNP位点的物理位置采用Chromosome或Scaffold名称:位点所在参考基因组中Chromosome或Scaffold中位置:位点变异的基因型的形式表示,其中Ni为Nitab4.5的简写。
表1烟草18981个SNP位点的信息
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
作为进一步的技术方案,所述烟草为普通烟草;所述普通烟草指的是不包含烟属中烟草野生种的烟草。所述烟草野生种包括林烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)等。
一种检测所述烟草全基因组SNP位点组合的探针组合在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用。
一种检测所述烟草全基因组SNP位点组合的芯片在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用,所述芯片包含所述的探针组合。
与现有技术相比,本发明的有益效果在于:
本发明在SNP位点的筛选过程中,采用原始SNP位点来自于150个涵盖烤烟、晒烟、晾烟、白肋烟、雪茄烟、香料烟、药烟等多种类型烟草代表性品种材料;各位点多态性指数较高(平均PIC为0.34,最小为0.2);在烟草全基因组范围内,特别是非重复序列区,每200Kb区间含有1~5个SNP位点,均匀度好,且重点选择位于外显子区SNP位点,并参考了该SNP位点和临近位点连锁不平衡信息;确定的SNP位点基因组信息选择国际上公开的K326参考基因组,并兼顾了国内烟草参考基因组信息,各位点所在序列片段在参考基因组上均为唯一匹配,便于后期各位点位置信息随参考基因组优化升级而更新,此外,相较于现有技术而言,本发明不仅位点得到极大的丰富,而且检测成本实现了大幅降低,满足了烟草分子育种对育种材料规模化、大批量基因分型的需要。
本发明通过利用公开的烟草K326参考基因组,筛选获得的一批覆盖烟草全基因组,且分布均匀、多态性好、位置明确、经过试验验证确定质量可靠的SNP位点集合,可以满足烟草分子遗传研究中烟草种质资源基因型鉴定、分子指纹图谱构建、育种材料基因分型、全基因组关联分析/连锁分析、分子标记辅助选择育种等相关的研究需求。
本发明开发的检测烟草全基因组SNP位点组合的芯片(Ta-LD-SC)可进行商业化,对烟草全基因组选择育种、分子设计育种及育种芯片的开发等具有重要经济价值和良好应用前景。
附图说明
图1为18981个SNP位点在烟草品种K326参考基因组Chromosome区的分布;
图2为实施例2中1105个烟草材料的进化发育树;
图3为实施例4中烟草EigenGWAS分析的曼哈顿图。
具体实施方式
下面将结合具体实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:烟草全基因组19K SNP芯片位点筛选以及探针和芯片的设计
本发明利用150份烟草重测序数据,并选择公开的烟草品种K326参考基因组(获取网址:https://solgenomics.net/ftp/genomes/Nicotiana_tabacum/edwards_et_al_2017/)作为参考基因组序列,进行SNP位点的挑选和确定,具体步骤如下:
步骤1.数据质控:选择150份烟草基因组重测序数据(Tobacco.vcf),该数据包含有1216749个原始SNP位点;利用plink软件和perl脚本程序,按照最小等为基因频率(MAF)>0.05、确失率(MR)<0.1、杂合率<0.1、哈迪温伯格平衡校验(HWE)<0.05、多态性(PIC)>0.2作为初步挑选条件,筛选出1179154个SNP位点。
步骤2.利用perl脚本,提取各位点上下游50bp碱基序列,作为检索序列,使用Blastn方法,将各位点序列与已公开的烟草品种K326全基因组核酸序列进行比对,按照唯一匹配的原则进行筛选,获得烟草基因组非重复序列区SNP位点数,为92894个。
步骤3.研究表明烟草全基因组连锁不平衡(LD)平均衰减距离约为200Kb,据此将烟草参考基因组按照200Kb区间窗口(Bin)进行切割,统计各区间SNP位点分布。根据均匀分布原则,首先提取区间内SNP位点数目小于5的位点列表,随后按照50Kb的步长移动区间窗口,移动3次,尽可能保证位于各区间窗口SNP位点数目均匀且数目小于5,同时对区间窗口中SNP位点数目大于5的位点列表进行人工优选,重点考虑原则(1)SNP位点位于基因外显子区;(2)SNP位点PIC最大,且和临近SNP位点PIC一致;(3)SNP位点具有KASP引物设计序列;(4)已经试验验证过的SNP位点;将该步骤筛选获得的位点作为VIP位点,优先级别最高。
步骤4.对步骤3筛选获得的VIP位点在参考基因组分布进行再次分析,从原始SNP位点数据中尽可能再次挑选烟草参考基因组Uniq区的SNP位点,以满足对Chromosome区空洞(Gap)和每个Scaffold的覆盖,该步骤结束,共获得21389个VIP SNP位点。
步骤5.将烟草参考基因组Uniq区未被选择为VIP SNP的作为重要(Important)位点,其余重测序数据分析结果数据作为一般(stand)位点,按照Affymetrix 技术标准对各位点进行评估,结合上述各步骤信息,最终选择了20236个SNP位点。
步骤6.将选择的20236个SNP位点使用Affymetrix SNP基因分型平台进行探针设计及芯片定制。
步骤7.选择1007个烟草自交系样本(包含重复测试样品)进行样品检测,根据基因分型效果,最终确定了18981个SNP位点,见表1,其在烟草品种K326参考基因组Chromosome区的分布情况,见图1,其不仅准确,而且质量高;最后,将定制化芯片命名为Ta-LD-SC(烟草低密度SNP芯片)。
该Ta-LD-SC芯片可同时检测96个样品,兼顾了检测通量、效率和成本等因素,相较于其他芯片而言,更为适宜于进行种质资源基因型鉴定,基因分型检测、初步功能基因挖掘定位、分子育种材料遗传背景分型等方面的应用。
实施例2:检测烟草全基因组SNP位点组合的Ta-LD-SC芯片在烟草基因分型中的应用
本实施例选择贵州省烟草科学研究院种质资源库收集保存的1031份烟草种质样品材料(包括烟草农家种、培育品种、育种高代系、定向改良材料等,主要为烤烟、晒烟,包含少数代表性白肋烟、香料烟和雪茄烟品种材料),利用实施例1制备的Ta-LD-SC芯片,检测实施例1筛选的18981个SNP位点所在基因型,所有样品检出率(Call rate)平均为97.79%,最小等位频率(MAF)平均为0.36,对其中90份样品重复测样,检出位点一致性平均为99.31%。基因分型的具体流程如下:
步骤1.提取样本基因组DNA,质控
采用CTAB法等方法提取样本DNA,对样本DNA分别进行Picogreen精确定量,Nano检测DNA纯度,并用1%琼脂糖凝胶电泳检测DNA的完整性。检测合格样品DNA置于4℃冰箱保存,备用。
基因组DNA质量要求:
1)双链定量浓度≥10ng/ul,总量≥600ng;
2)OD260/OD280介于1.7至2.1之间,OD260/OD230≥1.4;
3)1%琼脂糖电泳90%DNA片段大小大于10Kb。
基因组DNA质检结果说明:
1)合格:完全符合质量要求。
2)风险上机:5ng/ul≤浓度<10ng/ul,300ng≤总量<600ng,DNA轻微降解,蛋白或RNA轻微污染。
3)不合格:浓度<5ng/ul,总量<300ng,DNA严重降解,蛋白或RNA污染严重。
步骤2.DNA样品片段化
对合格的DNA样本均一化,DNA扩增,然后将扩增产物片段化、沉淀,随后进行DNA干燥、重悬,用紫外吸收法检测浓度,用3%琼脂糖凝胶电泳检测DNA片段化产物质量。
质控说明:
1)100倍稀释后片段化DNA产物的浓度>80ng/uL,判定为:符合要求;片段化DNA产物浓度在60-80ng/uL,判定为:风险上机。
2)片段化产物跑3%琼脂糖凝胶电泳结果主带明显,且分布于25-125bp。
步骤3.利用Ta-LD-SC芯片进行检测
按照Affymetrix SNP基因分型平台标准操作流程,完成DNA片段杂交、清洗、染色、扫描,获得所测样品Ta-LD-SC芯片扫描结果CEL文件。
步骤4.数据分析统计
采用软件AxiomTM Analysis Suite v5.2,按照软件操作的标准化流程,对芯片扫描结果CEL文件进行处理,获得各样本基因型数据。
由于烟草(Nicotiana tabacum L.)为四倍体物种,且为常自交作物,因此,在结果分析参数选择注意Inbred Penalty(自交罚分)和Species type(物种类型)参数选择,本实施例中Inbred Penalty设置成4,Species type选择为Polyloid(多倍体)。
根据分析的基因型文件,对收集种质材料进行遗传相似性、群体进化等分析,并确定了其中485份种质材料可作为烟草核心种质资源,其中系统发育树见附图2;筛选获得485份烟草种质可以代表1031份样品95%以上的遗传多态性。
实施例3:检测烟草全基因组SNP位点组合的Ta-LD-SC芯片在烟草模块化育种定向改良材料遗传背景分析中的应用
红花大金元是国内早期栽培的一个品质优良烤烟品种,但该品种黑胫病和青枯病抗性差,近年来种植面积逐渐萎缩。为此,从红花大金元和Beninhart1000-1构建的模块化育种材料(染色体片段代换系)中选择一个田间性状抗病性好,品质优的高世代株系FY-31,利用实施例2的试验步骤进行基因分型,获得基因分型结果,然后对此株系进行遗传背景分析,结果显示:FY-31与红花大金元相比,其Ta-LD-SC芯片基因分型结果中差异位点数目为945,估计遗传背景恢复率为95.03%,其中有641个位点位于Nt01~Nt24,具体见表2;随后根据选择的候选区段,结合参考基因组注释信息,筛选获得重要候选基因;如本实施例中Nt21:65.29Mb~76.43Mb和Nt24:22.84Mb~30.96Mb候选区间可作为重要功能基因进行研究,以进一步阐明FY-31与红花大金元抗性及品质性状差异原因。
表2烟草定向改良材料FY-31与红花大金元遗传背景分析结果
实施例4:检测烟草全基因组SNP位点组合的Ta-LD-SC芯片在烟草功能基因挖掘定位中的应用
本发明检测烟草全基因组SNP位点组合的Ta-LD-SC芯片,还可以用于烟草全基因组关联分析、全基因组连锁分析等需要涉及烟草品种或材料基因分型、定位候选基因等项目的研究;例如选取实施例3中1031份烟草样品SNP基因分型结果,参考陈国波等人建立的EigenGWAS(Chen,G.B.et al.,2016),对基因组范围内育种进程中重要候选位点进行扫描,结果见图3,初步获得了Nt06、Nt01、Nt02等全基因组范围内重要候选位点,进一步为挖掘验证育种可用功能基因提供了支撑。
以上所述实施方式仅为本发明的优选实施例,而并非本发明可行实施的穷举。对于本领域一般技术人员而言,在不背离本发明原理和精神的前提下对其所作出的任何显而易见的改动,都应当被认为包含在本发明的权利要求保护范围之内。
Claims (4)
1.一种烟草全基因组SNP位点组合在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用,其特征在于,所述烟草全基因组SNP位点组合包括18981个SNP位点,所述18981个SNP位点的物理位置是基于烟草品种K326基因组序列比对确定的,所述18981个SNP位点的物理位置信息见表1。
2.根据权利要求1所述的一种烟草全基因组SNP位点组合在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用,其特征在于,所述烟草为普通烟草。
3.一种检测如权利要求1所述烟草全基因组SNP位点组合的探针组合在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用。
4.一种检测如权利要求1所述烟草全基因组SNP位点组合的芯片在基因分型、全基因组关联分析、全基因组连锁分析、分子标记辅助选择育种、分子指纹图谱构建、遗传资源基因型鉴定任一项中的应用,其特征在于,所述芯片包含权利要求3所述的探针组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310473323.1A CN116622881B (zh) | 2023-04-27 | 2023-04-27 | 一种烟草全基因组snp位点组合、探针、芯片及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310473323.1A CN116622881B (zh) | 2023-04-27 | 2023-04-27 | 一种烟草全基因组snp位点组合、探针、芯片及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116622881A true CN116622881A (zh) | 2023-08-22 |
CN116622881B CN116622881B (zh) | 2024-03-15 |
Family
ID=87591076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310473323.1A Active CN116622881B (zh) | 2023-04-27 | 2023-04-27 | 一种烟草全基因组snp位点组合、探针、芯片及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116622881B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030224394A1 (en) * | 2002-02-01 | 2003-12-04 | Rosetta Inpharmatics, Llc | Computer systems and methods for identifying genes and determining pathways associated with traits |
CN102757956A (zh) * | 2012-07-18 | 2012-10-31 | 云南省烟草农业科学研究院 | 烟草基因组分子标记探针与序列集合群及获得方法与应用 |
CN114507747A (zh) * | 2021-09-16 | 2022-05-17 | 贵州省烟草科学研究院 | 基于全基因组重测序和kasp技术开发的烟草snp标记及其应用 |
CN114959104A (zh) * | 2022-06-24 | 2022-08-30 | 贵州省烟草科学研究院 | 一组辅助选择改良烟草品种‘k326’叶宽性状的snp位点及对应kasp标记 |
-
2023
- 2023-04-27 CN CN202310473323.1A patent/CN116622881B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030224394A1 (en) * | 2002-02-01 | 2003-12-04 | Rosetta Inpharmatics, Llc | Computer systems and methods for identifying genes and determining pathways associated with traits |
CN102757956A (zh) * | 2012-07-18 | 2012-10-31 | 云南省烟草农业科学研究院 | 烟草基因组分子标记探针与序列集合群及获得方法与应用 |
CN114507747A (zh) * | 2021-09-16 | 2022-05-17 | 贵州省烟草科学研究院 | 基于全基因组重测序和kasp技术开发的烟草snp标记及其应用 |
CN114959104A (zh) * | 2022-06-24 | 2022-08-30 | 贵州省烟草科学研究院 | 一组辅助选择改良烟草品种‘k326’叶宽性状的snp位点及对应kasp标记 |
Non-Patent Citations (2)
Title |
---|
ZARQA NAWAZ等: "Genome-wide identification, evolution and expression analysis of cyclic nucleotide-gated channels in tobacco (Nicotiana tabacum L.)", 《GENOMICS》, vol. 111, no. 2, pages 142 - 158, XP085619861, DOI: 10.1016/j.ygeno.2018.01.010 * |
张剑锋等: "应用SNP 标记分析24 份烟草品种的遗传多样性", 《烟草科技》, vol. 50, no. 11, pages 1 - 8 * |
Also Published As
Publication number | Publication date |
---|---|
CN116622881B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9976191B2 (en) | Rice whole genome breeding chip and application thereof | |
CN102747138B (zh) | 一种水稻全基因组snp芯片及其应用 | |
CN107345256A (zh) | 一种基于转录组测序开发山黧豆est‑ssr引物组及方法和应用 | |
CN111485026B (zh) | 一种与绵羊出生重相关的snp位点、应用、分子标记和引物 | |
CN110747288A (zh) | 水稻大粒基因功能标记及应用 | |
CN112575116A (zh) | 一种大豆全基因组snp位点组合、基因芯片及应用 | |
CN110551844B (zh) | 一种甘蔗栽培种基因组ssr分子标记开发方法和应用 | |
CN108517368B (zh) | 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统 | |
CN117144055B (zh) | 调控番木瓜果实长度相关的单倍型分子标记的应用 | |
CN113046467B (zh) | 一组与小麦条锈病抗性显著关联的snp位点及其在遗传育种中的应用 | |
CN102181559B (zh) | 一种糙皮侧耳est-ssr分子标记特异引物体系及其应用 | |
CN113684300A (zh) | 一组与小麦穗粒数显著关联的snp位点及其在小麦遗传育种中的应用 | |
CN106755413B (zh) | 水稻氮素吸收利用位点qNUE6及其分子标记方法 | |
CN116622881B (zh) | 一种烟草全基因组snp位点组合、探针、芯片及其应用 | |
CN108416189B (zh) | 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法 | |
CN108707685B (zh) | 与谷子分蘖数性状相关的snp标记及其检测引物和应用 | |
CN110616277A (zh) | 水稻粒长基因功能标记及其应用 | |
CN111607659B (zh) | 与苎麻原麻半纤维素含量关联的snp分子标记及其应用 | |
CN113980976B (zh) | 一种与IV型烟草蔗糖酯基因qBMVSE485紧密连锁的共显性SSR标记及其应用 | |
CN111471783A (zh) | 一种与大豆抗胞囊线虫病抗性位点连锁的分子标记的筛选方法、分子标记、引物及应用 | |
CN116656867A (zh) | 用于检测西瓜全缘叶形的snp位点及应用 | |
CN117821650B (zh) | 一种芋全基因组SNP-Panel及其应用 | |
CN113005215B (zh) | 一种与杨树木材产量相关的单体型分子标记及其应用 | |
CN108642202B (zh) | 与谷子茎节数性状相关的snp标记及其检测引物和应用 | |
CN108642198B (zh) | 一种与谷子分蘖数性状相关的snp标记及其检测引物和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |