CN113789391A - 一种仿刺参育种全基因组50k snp芯片及应用 - Google Patents
一种仿刺参育种全基因组50k snp芯片及应用 Download PDFInfo
- Publication number
- CN113789391A CN113789391A CN202110824311.XA CN202110824311A CN113789391A CN 113789391 A CN113789391 A CN 113789391A CN 202110824311 A CN202110824311 A CN 202110824311A CN 113789391 A CN113789391 A CN 113789391A
- Authority
- CN
- China
- Prior art keywords
- snp
- chip
- apostichopus japonicus
- breeding
- sites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000965254 Apostichopus japonicus Species 0.000 title claims abstract description 116
- 238000009395 breeding Methods 0.000 title claims abstract description 55
- 230000001488 breeding effect Effects 0.000 title claims abstract description 55
- 239000000523 sample Substances 0.000 claims abstract description 86
- 239000003550 marker Substances 0.000 claims abstract description 42
- 238000013461 design Methods 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 239000007791 liquid phase Substances 0.000 claims abstract description 17
- 230000002068 genetic effect Effects 0.000 claims abstract description 16
- 238000010219 correlation analysis Methods 0.000 claims abstract description 6
- 108020004414 DNA Proteins 0.000 claims description 43
- 108090000623 proteins and genes Proteins 0.000 claims description 36
- 238000012163 sequencing technique Methods 0.000 claims description 31
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 27
- 238000001914 filtration Methods 0.000 claims description 16
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 claims description 14
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 11
- 239000006228 supernatant Substances 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 235000019441 ethanol Nutrition 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 108700028369 Alleles Proteins 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 239000007983 Tris buffer Substances 0.000 claims description 6
- -1 Tris saturated phenol Chemical class 0.000 claims description 6
- 239000002096 quantum dot Substances 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 238000000246 agarose gel electrophoresis Methods 0.000 claims description 5
- 239000012634 fragment Substances 0.000 claims description 5
- 239000007788 liquid Substances 0.000 claims description 5
- 210000003205 muscle Anatomy 0.000 claims description 5
- 238000000227 grinding Methods 0.000 claims description 4
- 239000012139 lysis buffer Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 3
- 108010067770 Endopeptidase K Proteins 0.000 claims description 3
- 108091029795 Intergenic region Proteins 0.000 claims description 3
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 claims description 3
- 102000005891 Pancreatic ribonuclease Human genes 0.000 claims description 3
- 241000237509 Patinopecten sp. Species 0.000 claims description 3
- 102000006382 Ribonucleases Human genes 0.000 claims description 3
- 108010083644 Ribonucleases Proteins 0.000 claims description 3
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 claims description 3
- 150000001413 amino acids Chemical class 0.000 claims description 3
- 238000012098 association analyses Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 239000012154 double-distilled water Substances 0.000 claims description 3
- 238000001035 drying Methods 0.000 claims description 3
- 239000006166 lysate Substances 0.000 claims description 3
- 108020004707 nucleic acids Proteins 0.000 claims description 3
- 102000039446 nucleic acids Human genes 0.000 claims description 3
- 150000007523 nucleic acids Chemical class 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 235000020637 scallop Nutrition 0.000 claims description 3
- 235000017281 sodium acetate Nutrition 0.000 claims description 3
- 239000001632 sodium acetate Substances 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims 1
- 239000002244 precipitate Substances 0.000 claims 1
- 238000009394 selective breeding Methods 0.000 claims 1
- 238000010008 shearing Methods 0.000 claims 1
- 238000011161 development Methods 0.000 abstract description 15
- 230000000694 effects Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 description 19
- 230000018109 developmental process Effects 0.000 description 14
- 230000012010 growth Effects 0.000 description 11
- 230000035772 mutation Effects 0.000 description 10
- 238000011160 research Methods 0.000 description 9
- 241000251511 Holothuroidea Species 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 6
- 239000003147 molecular marker Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 241000258955 Echinodermata Species 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 241000965253 Apostichopus Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 230000037406 food intake Effects 0.000 description 3
- 235000012631 food intake Nutrition 0.000 description 3
- 238000012214 genetic breeding Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000009360 aquaculture Methods 0.000 description 2
- 244000144974 aquaculture Species 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 238000009399 inbreeding Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000001376 precipitating effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000296825 Amygdalus nana Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000205407 Polygonum Species 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 241000258191 Stichopodidae Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006266 hibernation Effects 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 238000009372 pisciculture Methods 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000007958 sleep Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/124—Animal traits, i.e. production traits, including athletic performance or the like
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种仿刺参育种全基因组50KSNP芯片及应用,包括(1)仿刺参全基因组范围的50kSNP芯片的开发:通过构建仿刺参样品群体,全基因组范围的SNP分型,对仿刺参50KSNP标记筛选,HD‑marker高密度芯片的设计和开发探针的设计进而获得48K位点的液相芯片池;(2)测试芯片的准确性和分型效果,通过DNA样品质量检测,HD‑Marker芯片检测并对结果进行分析确保其具有较高的准确性和较好的分型效果,本芯片可应用于仿刺参全基因组育种芯片在不同群体仿刺参的遗传背景分析、仿刺参性状关联分析。
Description
技术领域:
涉及分子生物学、功能基因组学、生物信息学和分子育种领域,具体涉及一种与生长性状相关的SNP位点筛选,与仿刺参的基因组SNP芯片及制备方法,同时还涉及这种仿刺参SNP芯片的用途。
背景技术:
分子标记(Molecular Markers),是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,是DNA水平遗传多态性的直接的反映。与其他几种遗传标记——形态学标记、生物化学标记、细胞学标记相比,DNA分子标记具有的优越性有:大多数分子标记为共显性,对隐性的性状的选择十分便利;基因组变异极其丰富,分子标记的数量几乎是无限的;检测手段简单、迅速。随着分子生物学技术的发展,DNA分子标记技术已有数十种,广泛应用于遗传育种、基因组作图、基因定位、物种亲缘关系鉴别、基因库构建、基因克隆等方面。遗传标记经历了4个发展阶段:形态学水平;细胞学和染色体水平;蛋白质和同工酶标记水平;DNA分子水平(朱玉贤,李毅,郑晓峰,郭红卫.现代分子生物学(第5版)[J]. 生命世界,2019(07):2.)。DNA分子标记相对之前的标记具有显著的优势:以DNA的形式表现,不受发育阶段和外界环境因素的限制,在生物体的各组织均可进行检测;标记在全基因组中呈均匀分布,数目多,多态性高,且在自然界中普遍存在,不需对生物进行人为改造,不会影响物种的自然状态,DNA分子标记的检测手段快速简便(李为民,李思锋,黎斌.DNA分子标记在野生大豆遗传多样性研究中的应用进展[J].中国农学通报,2014,30(21):246-250.);DNA标记多为选择中性,不会对生物性状造成影响。
以单核苷酸多态性(SNP)标记为代表的DNA分子标记技术,是分子标记技术的一种。与已有的标记相比较,SNP标记技术的具有显著的优势(朱向博,张丽.单核苷酸多态性及其在畜牧兽医领域的研究进展[J].现代畜牧兽医,2020(07):48-51.):由于在二倍体生物中SNP位点多以二等位多态的形式存在,因而较容易估计出各位点的等位基因的频率;由于其单核苷酸突变的特性,因而其在全基因范围内大量存在,与应用较为广泛的DNA分子标记-微卫星标记相比,SNP标记在基因组中的分布更为广泛,并且更为稳定;对位于编码区内的SNP突变,可分为同义突变和非同义突变两类,非同义突变的SNP由于改变了基因转录翻译产物的蛋白质序列,可能会造成蛋白质结构或基因表达水平的改变,因此,对于编码区SNP的研究意义显得更为重大;SNP标记的筛查过程可实现快速、规模化,后续的数据分析过程基本为自动化,对缩短研究周期十分重要(方宣钧,农业,吴为人,唐纪良,生物遗传学.作物DNA标记辅助育种[M].科学出版社,2001.);SNP标记在全基因组水平呈现不均匀分布的状态,自然界内的SNP突变绝大多数发生在基因组的非编码区。随着高通量测序技术的发展,基于测序手段的SNP筛查逐渐成为研究人员关注的热点。
全基因组重测序,虽能获取最为全面的基因组变异信息,但若应用于上百乃至上千个体的大规模分析,其测序成本仍较高。简化基因组或低深度重测序技术的出现,虽较好地降低了测序成本,但由于其测序位点的随机性,难于实现对许多重要性状相关的已知基因或基因通路的全面覆盖和分型(Ruiqiang Li,Yingrui Li,Xiaodong Fang,HuanmingYang,Jian Wang,Karsten Kristiansen,Jun Wang.SNP detection for massivelyparallel whole-genome resequencing[J].Cold Spring Harbor Laboratory Press,2009,19(6).Xiangyang Xu,Guihua Bai.Whole-genome resequencing:changing theparadigms of SNP detection,molecular mapping and gene discovery[J].MolecularBreeding,2015,35(1).)。基因芯片技术是一种准确率高、重复性好的靶位点分型技术([1]Jay Shendure,Robi D.Mitra,Chris Varma,George M.Church.Advanced sequencingtechnologies:methods and goals[J].Nature Reviews Genetics,2004,5(5).),在模式生物或农作物、畜禽的育种研究中应用广泛(Andreas Kranis,Almas A Gheyas,ClarissaBoschiero,Frances Turner,Le Yu,Sarah Smith,Richard Talbot,Ali Pirani,FionaBrew,Pete Kaiser,Paul M Hocking,Mark Fife,Nigel Salmon,Janet Fulton,Tim MStrom,Georg Haberer,Steffen Weigend,Rudolf Preisinger,Mahmood Gholami,SaberQanbari,Henner Simianer,Kellie A Watson,John A Woolliams,David W Burt.Development of a high density 600K SNP genotyping array for chicken[J].BioMedCentral,2013,14(1).),但对仿刺参等养殖品种仍然缺乏成熟的商业化芯片(Shikai Liu,Luyang Sun,Yun Li,Fanyue Sun,Yanliang Jiang,Yu Zhang,Jiaren Zhang,JianbinFeng,Ludmilla Kaltenboeck,Huseyin Kucuktas,Zhanjiang Liu.Development of thecatfish 250K SNP array for genome-wide association studies[J].BioMed Central,2014,7(1).),定制费用较为昂贵,且固相芯片难以满足位点灵活选择的应用需求。HD-marker技术是基于液相分子杂交的基因分型技术。该技术通过在单个PCR管内的高集成度探针杂交-延伸-连接反应,实现对多达上万个已知基因变异位点进行高通量筛查和分析相比固相芯片平台,由于HD-Marker是基于引物池的方式进行芯片的合成,可根据实际研究需求增减位点,具有更高的使用灵活性。该技术将液相杂交反应的位点选择灵活性和高通量测序平台通量高、成本低的优势有效地结合,突破了目前固相定制芯片平台费用高昂、灵活性差、难于大规模应用等技术瓶颈,为非模式生物提供了一种兼容不同通量级别、不同标记类型的高效灵活的靶向基因分型技术。(Lv J,Jiao W,Guo H,et al. HD-Marker:a highlymultiplexed and flexible approach for targeted genotyping of more than 10,000genes in a single-tube assay.Genome Research,2018,28(12): 1919-1930.Zhu X,Wang J,Lv J,et al.Sequencing-Based Transcriptome-Wide Targeted Genotyping forEvolutionary and Ecological Studies.Evolutionary Bioinformatics, 2019,15(1176934319836074.)由于HD-Marker在靶向精准性、灵活性、和成本等具有明显的优势,在仿刺参分子育种研究中是一种具有应用潜力的高通量标记检测技术。
仿刺参(Apostichopus japonicus),又称刺参,隶属于棘皮动物门(Echinodermata)、海参纲(Holothuroideaia)、楯手目(Aspidochirotidae)、仿刺参科(Stichopodidae)、仿刺参属(Apostichopus)(廖玉麟.中国动物志:棘皮动物门.海参纲[M].科学出版社,1997.)。仿刺参养殖是世界水产养殖业中一个非常重要的组成部分,自2003年以来刺参的养殖总产量和面积一直处于持续增长的态势,到2019年,增养殖面积达到24.67万公顷,年产量达到17.17万吨,直接经济产值逾300亿元,成为我国海水养殖单品种产值较高的种类之一,刺参养殖也成为继藻、对虾、贝、鱼之后第五次新的海水养殖浪潮的主体部分,成为沿海渔业经济结构的支柱性产业。据不完全统计,目前刺参养殖业吸纳从业人员70万人,积聚了庞大的资金投入,同时也带动了加工、饲料、保健食品等相关产业的发展,为沿海经济结构调整和渔民就业、增收开辟了一条新的途径。([1]廖梅杰,王印庚,李彬,荣小军,范瑞用,刘清兵.我国海参养殖产业现状、存在问题及对策探讨(上)[J].科学养鱼,2021(02):24-25.),但伴随着这种爆炸性的养殖规模的扩增,导致由近亲繁殖造成的日渐严重的近交衰退(P A Hohenlohe等,2010),仿刺参种质资源严重衰退,严重影响了仿刺参养殖行业的发展。另外,仿刺参对温度变化极其敏感,其生理活动随水温的变化而发生改变。通常在水温较高,即当所处水体温度达到18℃时,仿刺参的摄食及运动会开始有所降低;当水温达到20℃以上时,仿刺参的生活会发生改变,它们会选择移动到水深较深处的礁石中间,摄食量和运动量会降低到很低的水平,甚至停止进食和运动,进入夏眠的状态(FLi等,1996)。夏眠是仿刺参的一个标志性的生物学特性,是个体为适应高温环境而产生的一种维持基本生存的自我保护性应激活动(F Li等,1996;Y Liu等, 1996)。2018年夏季,辽宁多地持续高温,局部地区最高气温甚至突破了40摄氏度,使得海参养殖产业遭遇了前所未有的打击。辽宁省海洋渔业厅透露,全省海参养殖面积184.4 万亩,其中池塘养殖面积98.5万亩。目前初步统计,海参受灾损失面积95万亩,损失产量6.8万吨,直接经济损失68.7亿元人民币。
针对上述,以改良种质资源为目的的分子生物学手段在棘皮动物中应用的需求显得尤为重要和急迫。然而目前仿刺参的分子育种研究中仍然缺乏稳定高效的液相芯片,本发明基于HD-Marker技术设计的液相芯片,能够为仿刺参经济性状研究、品种鉴定以及标记辅助育种提供重要的技术手段,可以满足仿刺参大规模商业化育种的需求。
发明内容:
本发明的目的就在于SNP芯片技术一直以来是经济养殖动物或农作物研究中靶位点分型便捷高效的工具,但是在仿刺参等非模式生物中尚未有可用的商业化SNP芯片。为开展仿刺参经济性状选择等相关遗传育种工作提供可靠的技术平台,促进我国仿刺参分子育种的发展,同时也为其他水产生物的芯片的设计和开发提供初步的理论参考和方法指导。本研究对仿刺参不同地域的群体进行了高通量的SNP标记的开发,进行了生长,抗高温性状的精细定位;初步设计和开发了包含50k位点数目的SNP芯片,可以快捷地对仿刺参性状遗传参数准确评估,为指导研究人员开展仿刺参的分子育种工作提供高效可靠的技术手段,满足仿刺参优良品种培育工程的要求。
本发明提供了一种仿刺参育种全基因组50K SNP芯片,所述的SNP芯片包括用于仿刺参育种的SNP标记组合以及用于仿刺参育种的液相育种芯片,所述用于仿刺参抗高温性状育种的SNP标记组合,由48755个SNP位点组成,SNP所在核苷酸序列分别为SEQ No.001-SEQ ID No.48755所示序列,长度为49bp,所述用于仿刺参育种的液相育种芯片,由48755对探针序列,每个SNP位点对应两条探针序列,分别为Forward探针和Reverse探针。
本发明同时提供了一种仿刺参育种全基因组50K SNP芯片的制备方法以及该芯片相关的应用,具体包括仿刺参全基因组育种芯片在不同群体仿刺参的遗传背景分析中的作用,仿刺参全基因组育种芯片在仿刺参性状关联分析中的应用。
一种仿刺参抗高温育种低密度12K SNP芯片的制备方法,包括以下步骤:
1、构建仿刺参样品群体
在辽宁、山东不同海域,随机选取500只仿刺参样品,取组织放置于95%乙醇中带回实验室保存备用。
2、仿刺参全基因组范围的SNP分型
2.1DNA提取
①在1.5ml的管中加入500ul STE裂解缓冲液(100mM NaCl;10mM Tris-Cl,pH8.0;1mM EDTA,pH8.0),50ul 10%SDS,3.5ul蛋白酶K(20mg/ml),16ul RNase A(100mg/ml),取扇贝闭壳肌约0.1克,加入,剪碎,研磨棒研磨,研磨至絮状,56℃处理约2h,期间每隔30mins颠倒混匀一次,最终裂解液澄清状态。
②加入500ul的Tris饱和酚,100ul氯仿/异戊醇(24:1),轻轻晃动20min,室温12000rpm离心10分钟。
③抽取上清液至新的1.5ml的EP管中,加入300ulTris饱和酚,300ul氯仿/异戊醇(24:1),轻轻晃动20mins,室温12000rpm离心10分钟。
④重复步骤③两至三遍,直至无蛋白层为止。
⑤抽取上清,加入等体积氯仿/异戊醇,约500ul,轻轻晃动20min,室温8000rpm,常温离心10分钟。
⑥取上清加入1ml的冰无水乙醇,50ul醋酸钠(3M),-20℃放置40min,12000rpm 离心10min,使核酸沉淀。
⑦弃上清,70%乙醇洗涤沉淀2次,每次8000rpm低温离心5min。
⑧干燥至乙醇全部挥发,加入30ul ddH2O溶解,再加0.75uL RNase于37℃消化RNA1.5h。
⑨利用Qubit试剂盒进行对DNA进行定量,1%琼脂糖凝胶电泳检测DNA质量。提取的 DNA放置在-20℃保存备用。
2.2建库及测序
利用Covaris破碎仪将提取的仿刺参基因组DNA进行打断处理,打断范围设置在350bp左右,利用基因组DNA建库试剂盒进行DNA片段的末端修复加A,然后两端连接上接头后进行扩增,利用带有Barcode的引物进行文库扩增,完成文库的构建。利用Qubit 2.0 进行文库定量。寄送至测序公司对文库的插入片段大小及文库的有效浓度进行定量,质检合格后在Illumina HiSeq X Ten PE150平台进行测序。
2.3重测序数据处理及比对分型
①参考基因组建立索引
使用Bwa软件的index命令、samtools的index命令、picard的CreateSequenceDictionary.jar构建参考序列的索引。
②序列比对
利用Bwa-mem命令将双末端测序reads进行比对,生成bam文件,利用samtools的sort命令进行排序,生成排序的bam文件。
③去除PCR duplicate
由于PCR过程中可能产生的偏好性,某些位置的片段会被过度扩增,从而使该位置上有大量冗余序列,造成分型的错误,因此要去除这些PCR duplicate,消除由于PCR实验过程中产生的假阳性序列。利用Picard MarkDuplicates.jar命令,通过设置参数 REMOVE_DUPLICATES=true来丢弃duplicated序列。
④建立Bam文件的索引
利用Samtools index对每个个体生成的bam文件建立索引,为后续GATK流程做好文件准备。
⑤GATK分型
使用GATK软件中适用于群体变异检测的HaplotypeCaller模块对所有的样本进行变异检测,该方法首先使每样本生成一个gvcf文件,然后再进行群体的joint-genotype,依据群体的变异信息校正个体的变异和基因型数据。
3、仿刺参50K SNP标记筛选
3.1SNP标记初步过滤
按照下述步骤对生成的原始变异位点依次进行过滤,生成高质量的SNP数据集。
①挑选出二态性SNP位点
②过滤掉SNP过于密集的区域,即10bp window内超过3的SNP位点(Bowen et al.,2011)
③根据官网推荐的hard filtering的过滤参数,过滤掉低质量SNP位点,即QD<2.0, FS>20.0,MQ<40.0,DP<6.0,DP>1000.0,MQRankSum<-12.5,ReadPosRankSum<-8.0。
④过滤最小等位基因小于0.05的位点。
⑤最后得到高质量967万SNP,进行下一步低密度SNP选择。
3.2SNP标记优化选择
估计动物个体分子育种可靠的遗传参数,需要进一步在初步过滤的SNP中筛选一组适用的SNP。一般需要两个条件:第一,筛选的SNP是该物种不同地理群体共有的SNP;第二,挑选的SNP具有较高的信息含量,可以对个体SNP基因效应及育种值进行准确评估。
①筛选出不同群体共有SNP,然后在这些共有SNP中减少或删除处于高连锁不平衡的 SNP,我们采用LD的R2>0.35作为删除SNP尺度,结果表明在保持SNP育种参数估计准确性的前提下,使用这个尺度来筛选SNP,可以明显降低所需SNP标记的数目。
②筛选高信息量的SNP可以依据不同的统计指标,根据Wright的FST、SNP基因频率的平均欧式距离、信息熵等综合指标,构建具有约束条件下SNP选择最优化模型,利用R 软件优化求解包,获得SNP基因频率含有高信息量SNP,且SNP能较均匀分布基因组上。
③根据已有文献报道的已克隆的仿刺参重要生长,抗高温性状相关基因的与功能相关的SNP位点,利用GWAS关联分析,通过GWAS Pval值得到与皮重、抗高温性状相关显著的SNP位点。
④使用SnpEff软件对高质量的SNP进行注释,确定SNP所在的基因元件,及对氨基酸的变化影响等。
最后,根据第一至第四步,选择后SNP总数控制到5万个标记左右。
4、HD-marker高密度芯片的设计和开发探针设计
4.1靶向性探针的的设计和筛选
根据HD-marker探针池的设计思路,选择SNP位点上游22bp的碱基序列及下游22bp序列作为位点的特异探针。按照以下HD-Marker探针设计原则进行侧翼探针的设计和评估:
·侧翼探针序列需要满足GC含量在40%-60%之间
·Tm值在55~65℃之间,
·侧翼探针内不能有超过5个连续碱基的区域
·侧翼序列匹配度在80%以上的区域不能大于5处
·探针侧翼序列内的变异位点个数不超过3个。
最终符合设计标准的位点数目为48755,对通过设计标准的位点信息进行整合,形成了一个包含位点信息、探针序列以及注释信息的HD-marker液相芯片池。芯片上来源于基因区上的位点22778个,覆盖的基因数目为6955个,基因间区的位点为25977个。
仿刺参液相芯片上的位点分布
4.2探针池的序列合成
为使后续的PCR扩增中有引物结合的靶位点,将上游探针的5’端和下游探针的3’端都分别连接一段22bp的Illumina平台测序通用的引物序列,形成Forward探针和Reverse探针。
以Illumina测序平台为例,侧翼杂交探针Forward的结构为:
CCTACACGACGCTCTTCCGATCTXXXXXXXXXXXXXXXXXXXXXX,侧翼杂交探针Reverse的结构为: XXXXXXXXXXXXXXXXXXXXXXAGATCGGAAGAGCACACGTCTGA。其中X和Y代表位点两侧的特异性序列。
将所有位点的F探针集合形成一个F探针池,所有位点的R探针集合形成一个R探针池,合成F探针池和R探针池获得48k位点的液相芯片池。
4.3仿刺身芯片的检测
①仿刺参DNA提取:利用天根植物基因组提取试剂盒(RT405-12)提取肌肉组织的基因组DNA,
②DNA样品质量检测:利用1%的琼脂糖凝胶电泳检测DNA条带的完整性;用NanoDrop 微量核酸定量仪检测浓度,将DNA浓度调整到100ng/ul.
③HD-Marker芯片检测:参照HD-marker标准实验流程,制备100个仿刺参DNA样品的HD-marker文库。利用Qubit4分光光度计检测文库的浓度,在8.9-10.6ng/ul之间,文库浓度均匀,质量符合测序要求。
④芯片性能检测分析:
液相芯片效能分析:芯片的效能从位点的靶向性、捕获率、准确率及均一性等几个指标进行评价。结果显示,在所有样品中位点的捕获效率均能达到97%以上,分型位点比例均在95%以上,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均能达到在0.96以上。与标准WGS文库数据相比,位点分型准确性也在90%-94%之间。结果表明仿刺参的50k液相芯片具有较好的分型效果。
一种仿刺参抗高温育种低密度12K SNP芯片的应用,包括下列步骤:
1、不同群体仿刺参的遗传背景分析:筛选群体分型率大于90%,最小等位基因频率大于0.05的位点,得到46232个高质量位点的基因型信息46232个,利用分型数据对仿刺参的个体聚类分析。
2、仿刺参性状关联分析中的应用:利用我们开发的仿刺参50KSNP芯片,对仿刺参生长、抗逆性状相关位点进行全基因组分析,进而证明了证明了50KSNP芯片覆盖了仿刺参生长、抗逆性状相关的突变位点和标记。
本发明的有益效果:
(1)本发明的液相芯片靶向性好,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均能达到在0.96以上,位点分型准确性高,具有较好的分型效果。
(2)本发明可通过筛选群体分型率大于90%,最小等位基因频率大于0.05的位点,得到46232个高质量位点的基因型信息46232个,并利用分型数据对仿刺参的个体聚类分析,其结果清楚的显示了仿刺参芯片覆盖的SNP位点在仿刺参群体中具有较好的多态性,可以应用于仿刺参材料的遗传背景分析,是一种群体通用的SNP芯片。
(3)本发明可利用仿刺参50KSNP芯片,对仿刺参生长、抗逆性状相关位点进行全基因组分析,其P<1E-07的显著位点有7个,定位于3号连锁群和11号连锁群,证明了50KSNP 芯片覆盖了仿刺参生长、抗逆性状相关的突变位点和标记。
(4)本发明可为开展仿刺参抗高温性状选择等相关遗传育种工作提供可靠的技术平台,促进我国水产养殖业的发展,同时也为其他水产生物的芯片的设计和开发提供初步的理论参考和方法指导。
附图说明:
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为本发明的仿刺参样本系统进化树;
图2为本发明的全基因组分析曼哈顿图;
具体实施方式:
实施例1:仿刺参全基因组范围的50kSNP芯片的开发
1、构建仿刺参样品群体
在辽宁、山东不同海域,随机选取500只仿刺参样品,取组织放置于95%乙醇中带回实验室保存备用。
2、仿刺参全基因组范围的SNP分型
2.1DNA提取
①在1.5ml的管中加入500ul STE裂解缓冲液(100mM NaCl;10mM Tris-Cl,pH8.0;1mM EDTA,pH8.0),50ul 10%SDS,3.5ul蛋白酶K(20mg/ml),16ul RNase A(100mg/ml),取扇贝闭壳肌约0.1克,加入,剪碎,研磨棒研磨,研磨至絮状,56℃处理约2h,期间每隔30mins颠倒混匀一次,最终裂解液澄清状态。
②加入500ul的Tris饱和酚,100ul氯仿/异戊醇(24:1),轻轻晃动20min,室温12000rpm离心10分钟。
③抽取上清液至新的1.5ml的EP管中,加入300ulTris饱和酚,300ul氯仿/异戊醇(24:1),轻轻晃动20mins,室温12000rpm离心10分钟。
④重复步骤③两至三遍,直至无蛋白层为止。
⑤抽取上清,加入等体积氯仿/异戊醇,约500ul,轻轻晃动20min,室温8000rpm,常温离心10分钟。
⑥取上清加入1ml的冰无水乙醇,50ul醋酸钠(3M),-20℃放置40min,12000rpm 离心10min,使核酸沉淀。
⑦弃上清,70%乙醇洗涤沉淀2次,每次8000rpm低温离心5min。
⑧干燥至乙醇全部挥发,加入30ul ddH2O溶解,再加0.75uL RNase于37℃消化RNA1.5h。
⑨利用Qubit试剂盒进行对DNA进行定量,1%琼脂糖凝胶电泳检测DNA质量。提取的 DNA放置在-20℃保存备用。
2.2建库及测序
利用Covaris破碎仪将提取的仿刺参基因组DNA进行打断处理,打断范围设置在350bp左右,利用基因组DNA建库试剂盒进行DNA片段的末端修复加A,然后两端连接上接头后进行扩增,利用带有Barcode的引物进行文库扩增,完成文库的构建。利用Qubit 2.0 进行文库定量。寄送至测序公司对文库的插入片段大小及文库的有效浓度进行定量,质检合格后在Illumina HiSeq X Ten PE150平台进行测序。
2.3重测序数据处理及比对分型
①参考基因组建立索引
使用Bwa软件的index命令、samtools的index命令、picard的CreateSequenceDictionary.jar构建参考序列的索引。
②序列比对
利用Bwa-mem命令将双末端测序reads进行比对,生成bam文件,利用samtools的sort命令进行排序,生成排序的bam文件。
③去除PCR duplicate
由于PCR过程中可能产生的偏好性,某些位置的片段会被过度扩增,从而使该位置上有大量冗余序列,造成分型的错误,因此要去除这些PCR duplicate,消除由于PCR实验过程中产生的假阳性序列。利用Picard MarkDuplicates.jar命令,通过设置参数 REMOVE_DUPLICATES=true来丢弃duplicated序列。
④建立Bam文件的索引
利用Samtools index对每个个体生成的bam文件建立索引,为后续GATK流程做好文件准备。
⑤GATK分型
使用GATK软件中适用于群体变异检测的HaplotypeCaller模块对所有的样本进行变异检测,该方法首先使每样本生成一个gvcf文件,然后再进行群体的joint-genotype,依据群体的变异信息校正个体的变异和基因型数据。
3、仿刺参50K SNP标记筛选
3.1SNP标记初步过滤
按照下述步骤对生成的原始变异位点依次进行过滤,生成高质量的SNP数据集。
①挑选出二态性SNP位点
②过滤掉SNP过于密集的区域,即10bp window内超过3的SNP位点(Bowen et al.,2011)
③根据官网推荐的hard filtering的过滤参数,过滤掉低质量SNP位点,即QD<2.0, FS>20.0,MQ<40.0,DP<6.0,DP>1000.0,MQRankSum<-12.5,ReadPosRankSum<-8.0。
④过滤最小等位基因小于0.05的位点。
⑤最后得到高质量967万SNP,进行下一步低密度SNP选择。
3.2SNP标记优化选择
估计动物个体分子育种可靠的遗传参数,需要进一步在初步过滤的SNP中筛选一组适用的SNP。一般需要两个条件:第一,筛选的SNP是该物种不同地理群体共有的SNP;第二,挑选的SNP具有较高的信息含量,可以对个体SNP基因效应及育种值进行准确评估。
①筛选出不同群体共有SNP,然后在这些共有SNP中减少或删除处于高连锁不平衡的 SNP,我们采用LD的R2>0.35作为删除SNP尺度,结果表明在保持SNP育种参数估计准确性的前提下,使用这个尺度来筛选SNP,可以明显降低所需SNP标记的数目。
②筛选高信息量的SNP可以依据不同的统计指标,根据Wright的FST、SNP基因频率的平均欧式距离、信息熵等综合指标,构建具有约束条件下SNP选择最优化模型,利用R 软件优化求解包,获得SNP基因频率含有高信息量SNP,且SNP能较均匀分布基因组上。
③根据已有文献报道的已克隆的仿刺参重要生长,抗高温性状相关基因的与功能相关的SNP位点,利用GWAS关联分析,通过GWAS Pval值得到与皮重、抗高温性状相关显著的SNP位点。
④使用SnpEff软件对高质量的SNP进行注释,确定SNP所在的基因元件,及对氨基酸的变化影响等。
最后,根据第一至第四步,选择后SNP总数控制到5万个标记左右。
4、HD-marker高密度芯片的设计和开发探针设计
4.1靶向性探针的的设计和筛选
根据HD-marker探针池的设计思路,选择SNP位点上游22bp的碱基序列及下游22bp序列作为位点的特异探针。按照以下HD-Marker探针设计原则进行侧翼探针的设计和评估:
·侧翼探针序列需要满足GC含量在40%-60%之间
·Tm值在55~65℃之间,
·侧翼探针内不能有超过5个连续碱基的区域
·侧翼序列匹配度在80%以上的区域不能大于5处
·探针侧翼序列内的变异位点个数不超过3个。
最终符合设计标准的位点数目为48755,对通过设计标准的位点信息进行整合,形成了一个包含位点信息、探针序列以及注释信息的HD-marker液相芯片池。芯片上来源于基因区上的位点22778个,覆盖的基因数目为6955个,基因间区的位点为25977个。
仿刺参液相芯片上的位点分布
4.2探针池的序列合成
为使后续的PCR扩增中有引物结合的靶位点,将上游探针的5’端和下游探针的3’端都分别连接一段22bp的Illumina平台测序通用的引物序列,形成Forward探针和Reverse探针。
以Illumina测序平台为例,侧翼杂交探针Forward的结构为:
CCTACACGACGCTCTTCCGATCTXXXXXXXXXXXXXXXXXXXXXX,侧翼杂交探针Reverse的结构为: XXXXXXXXXXXXXXXXXXXXXXAGATCGGAAGAGCACACGTCTGA。其中X和Y代表位点两侧的特异性序列。
将所有位点的F探针集合形成一个F探针池,所有位点的R探针集合形成一个R探针池,合成F探针池和R探针池获得48k位点的液相芯片池。
4.3仿刺身芯片的检测
①仿刺参DNA提取:利用天根植物基因组提取试剂盒(RT405-12)提取肌肉组织的基因组DNA,
②DNA样品质量检测:利用1%的琼脂糖凝胶电泳检测DNA条带的完整性;用NanoDrop 微量核酸定量仪检测浓度,将DNA浓度调整到100ng/ul.
③HD-Marker芯片检测:参照HD-marker标准实验流程,制备100个仿刺参DNA样品的HD-marker文库。利用Qubit4分光光度计检测文库的浓度,在8.9-10.6ng/ul之间,文库浓度均匀,质量符合测序要求。
④芯片性能检测分析:
液相芯片效能分析:芯片的效能从位点的靶向性、捕获率、准确率及均一性等几个指标进行评价。结果显示,在所有样品中位点的捕获效率均能达到97%以上,分型位点比例均在95%以上,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均能达到在0.96以上。与标准WGS文库数据相比,位点分型准确性也在90%-94%之间。结果表明仿刺参的50k液相芯片具有较好的分型效果。
实施例2:仿刺参50K SNP芯片在分子育种中应用
为了验证仿刺参芯片在仿刺参分子育种中应用效果,我们使用50K芯片对来自俄罗斯(30个)、大连(100个)、山东(100个)的样本进行检测,并进行分子育种中:
(1)不同地理群体遗传背景分析;(2)与生长相关的仿刺参肉刺个数进行全基因组关联分析(GWAS)
1、仿刺参全基因组育种芯片在不同群体仿刺参的遗传背景分析中的作用:
筛选群体分型率大于90%,最小等位基因频率大于0.05的位点,得到46232个高质量位点的基因型信息46232个,利用分型数据对仿刺参的个体聚类分析,如图1显示,样本中12个群体在系统进化树上的位置清晰,分类明确。该结果显示,仿刺参芯片覆盖的SNP 位点在仿刺参群体中具有较好的多态性,可以应用于仿刺参材料的遗传背景分析,是一种群体通用的SNP芯片。
2、仿刺参全基因组育种芯片在仿刺参性状关联分析中的应用:
利用本技术方案的仿刺参50KSNP芯片,对仿刺参生长、抗逆性状相关位点进行全基因组分析,结果如图2所示,P<1E-07的显著位点有7个,定位于3号连锁群和11号连锁群,证明了50KSNP芯片覆盖了仿刺参生长、抗逆性状相关的突变位点和标记。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书及其等效物界定。
序列表
Claims (5)
1.一种仿刺参育种全基因组50K SNP芯片,其特征在于:所述的SNP芯片包括用于仿刺参育种的SNP标记组合以及用于仿刺参育种的液相育种芯片,所述用于仿刺参抗高温性状育种的SNP标记组合,由48755个SNP位点组成,SNP所在核苷酸序列分别为SEQ No.001-SEQID No.48755所示序列,长度为49bp,所述用于仿刺参育种的液相育种芯片,由48755对探针序列,每个SNP位点对应两条探针序列,分别为Forward探针和Reverse探针。
2.根据权利要求1所述的一种仿刺参育种全基因组50K SNP芯片,其特征在于:所述的仿刺参全基因组育种芯片在不同群体仿刺参的遗传背景分析中的作用。
3.根据权利要求1所述的一种仿刺参育种全基因组50K SNP芯片,其特征在于:所述的仿刺参全基因组育种芯片在仿刺参性状关联分析中的应用。
4.根据权利要求1所述的一种仿刺参抗高温育种低密度12K SNP芯片,其特征在于:所述一种仿刺参抗高温育种低密度12K SNP芯片在抗高温性状的全基因组选择育种值分析中的应用。
5.根据权利要求1-4所述的一种仿刺参育种全基因组50K SNP芯片的制备方法,其特征在于,包括以下步骤:
S1、在1.5ml的管中加入500ul STE裂解缓冲液,50ul 10%SDS,3.5ul浓度为20mg/ml的蛋白酶K,16ul浓度为100mg/ml的RNase A,所述裂解缓冲液包括100mM NaCl、pH8.0的10mMTris-Cl以及pH8.0的1mM EDTA,取扇贝闭壳肌0.1克,加入,剪碎,研磨棒研磨,研磨至絮状,56℃处理2h,期间每隔30mins颠倒混匀一次,最终裂解液澄清状态,加入500ul的Tris饱和酚,100ul体积比例为24:1的氯仿/异戊醇,轻轻晃动20min,室温12000rpm离心10分钟;
S2、抽取上清液至新的1.5ml的EP管中,加入300ulTris饱和酚,300ul体积比例为24:1氯仿/异戊醇,轻轻晃动20mins,室温12000rpm离心10分钟,重复步骤S2两至三遍,直至无蛋白层为止;
S3、抽取上清,加入等体积500ul氯仿/异戊醇,轻轻晃动20min,室温8000rpm,常温离心10分钟,取上清加入1ml的冰无水乙醇,50ul醋酸钠(3M),-20℃放置40min,12000rpm离心10min,使核酸沉淀,弃上清,浓度为70%乙醇洗涤沉淀2次,每次8000rpm低温离心5min,干燥至乙醇全部挥发,加入30ul ddH2O溶解,再加0.75uL RNase于37℃消化RNA 1.5h,利用Qubit试剂盒进行对DNA进行定量,浓度为1%琼脂糖凝胶电泳检测DNA质量,提取的DNA放置在-20℃保存备用;
S4、利用Covaris破碎仪将提取的仿刺参基因组DNA进行打断处理,打断范围设置在350bp,利用基因组DNA建库试剂盒进行DNA片段的末端修复加A,然后两端连接上接头后进行扩增,利用带有Barcode的引物进行文库扩增,完成文库的构建,利用Qubit 2.0进行文库定量,在Illumina HiSeq X Ten PE150平台进行测序,使用Bwa软件的index命令、samtools的index命令、picard的CreateSequenceDictionary.jar构建参考序列的索引,利用Bwa-mem命令将双末端测序reads进行比对,生成bam文件,利用samtools的sort命令进行排序,生成排序的bam文件,利用Picard MarkDuplicates.jar命令,通过设置参数REMOVE_DUPLICATES=true来丢弃duplicated序列,利用Samtools index对每个个体生成的bam文件建立索引,使用GATK软件中适用于群体变异检测的HaplotypeCaller模块对所有的样本进行变异检测,所述GATK软件中适用于群体变异检测的HaplotypeCaller模块对所有的样本进行变异检测具体包括使每样本生成一个gvcf文件,然后再进行群体的joint-genotype,依据群体的变异信息校正个体的变异和基因型数据;
S5、挑选出二态性SNP位点,过滤掉10bp window内超过3的SNP位点;过滤QD<2.0,FS>20.0,MQ<40.0,DP<6.0,DP>1000.0,MQRankSum<-12.5,ReadPosRankSum<-8.0的低质量SNP位点;过滤最小等位基因小于0.05的位点。最后得到高质量967万SNP,进行下一步低密度SNP选择;
S6、筛选出不同群体共有SNP,然后在这些共有SNP中减少或删除处于高连锁不平衡的SNP,采用LD的R2>0.35作为删除SNP尺度,根据Wright的FST、SNP基因频率的平均欧式距离以及信息熵,构建具有约束条件下SNP选择最优化模型,利用R软件优化求解包,获得SNP基因频率含有高信息量SNP,且SNP能较均匀分布基因组上,对已克隆的仿刺参重要生长,抗高温性状相关基因的与功能相关的SNP位点,利用GWAS关联分析,通过GWAS Pval值得到与皮重、抗高温性状相关显著的SNP位点,使用SnpEff[179]软件对高质量的SNP进行注释,确定SNP所在的基因元件,及对氨基酸的变化影响;
S7、选择SNP位点上游22bp的碱基序列及下游22bp序列作为位点的特异探针,按照以下HD-Marker探针设计原则进行侧翼探针的设计和评估:
·侧翼探针序列需要满足GC含量在40%-60%之间
·Tm值在55~65℃之间
·侧翼探针内不能有超过5个连续碱基的区域
·侧翼序列匹配度在80%以上的区域不能大于5处
·探针侧翼序列内的变异位点个数不超过3
选取符合设计标准的位点数目为48755,对通过设计标准的位点信息进行整合,形成了一个包含位点信息、探针序列以及注释信息的HD-marker液相芯片池。芯片上来源于基因区上的位点22778个,覆盖的基因数目为6955个,基因间区的位点为25977个,将上游探针的5’端和下游探针的3’端都分别连接一段22bp的Illumina平台测序通用的引物序列,形成Forward探针和Reverse探针,将所有位点的Forward探针集合形成一个Forward探针池,所有位点的Reverse探针集合形成一个Reverse探针池,合成Forward探针池和Reverse探针池获得48k位点的液相芯片池。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110824311.XA CN113789391A (zh) | 2021-07-07 | 2021-07-07 | 一种仿刺参育种全基因组50k snp芯片及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110824311.XA CN113789391A (zh) | 2021-07-07 | 2021-07-07 | 一种仿刺参育种全基因组50k snp芯片及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113789391A true CN113789391A (zh) | 2021-12-14 |
Family
ID=79181218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110824311.XA Pending CN113789391A (zh) | 2021-07-07 | 2021-07-07 | 一种仿刺参育种全基因组50k snp芯片及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113789391A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115232881A (zh) * | 2022-05-16 | 2022-10-25 | 厦门大学 | 一种鲍基因组育种芯片及其应用 |
CN115992265A (zh) * | 2023-03-22 | 2023-04-21 | 中山大学 | 一种石斑鱼全基因组液相芯片及其应用 |
CN116516029A (zh) * | 2023-06-30 | 2023-08-01 | 中国海洋大学三亚海洋研究院 | 一种金鲳全基因组育种芯片及应用 |
CN117363744A (zh) * | 2023-11-01 | 2024-01-09 | 中国海洋大学 | 一种仿刺参性别分子标记、引物及其应用 |
CN117701722A (zh) * | 2024-01-16 | 2024-03-15 | 佛山科学技术学院 | 一种牛高原适应育种10k液相芯片及应用 |
CN117802249A (zh) * | 2024-03-01 | 2024-04-02 | 中国海洋大学三亚海洋研究院 | 一种东星斑全基因组snp芯片的制备方法及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101845488A (zh) * | 2009-12-03 | 2010-09-29 | 中国海洋大学 | 一种快速分离鉴定仿刺参微卫星标记方法 |
CN101845487A (zh) * | 2009-12-03 | 2010-09-29 | 中国海洋大学 | 一种仿刺参标准微卫星标记的构建方法 |
CN101935692A (zh) * | 2009-12-03 | 2011-01-05 | 中国海洋大学 | 一种适用于仿刺参家系鉴定的微卫星标记方法 |
CN102140522A (zh) * | 2011-01-26 | 2011-08-03 | 中国科学院南海海洋研究所 | 一种仿刺参AjE101微卫星DNA标记的检测方法 |
CN105567814A (zh) * | 2015-12-31 | 2016-05-11 | 中国标准化研究院 | 快速区分仿刺参来源地的随机扩增多态性dna方法及实现所述方法的引物 |
-
2021
- 2021-07-07 CN CN202110824311.XA patent/CN113789391A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101845488A (zh) * | 2009-12-03 | 2010-09-29 | 中国海洋大学 | 一种快速分离鉴定仿刺参微卫星标记方法 |
CN101845487A (zh) * | 2009-12-03 | 2010-09-29 | 中国海洋大学 | 一种仿刺参标准微卫星标记的构建方法 |
CN101935692A (zh) * | 2009-12-03 | 2011-01-05 | 中国海洋大学 | 一种适用于仿刺参家系鉴定的微卫星标记方法 |
CN102140522A (zh) * | 2011-01-26 | 2011-08-03 | 中国科学院南海海洋研究所 | 一种仿刺参AjE101微卫星DNA标记的检测方法 |
CN105567814A (zh) * | 2015-12-31 | 2016-05-11 | 中国标准化研究院 | 快速区分仿刺参来源地的随机扩增多态性dna方法及实现所述方法的引物 |
Non-Patent Citations (3)
Title |
---|
HUIXIA DUET AL.: "Development of 101 gene-based single nucleotide polymorphism markers in sea cucumber, Apostichopus japonicus", 《INT J MOL SCI》, vol. 13, no. 6, pages 7080 - 7097 * |
刘安然 等: "刺参SNP标记与生长性状的关联分析", 《渔业科学进展》, vol. 40, no. 1, pages 101 - 109 * |
董玉 等: "刺参SNP标记与生长性状的关联分析", 《海洋湖沼通报》, no. 2, pages 49 - 58 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115232881A (zh) * | 2022-05-16 | 2022-10-25 | 厦门大学 | 一种鲍基因组育种芯片及其应用 |
CN115992265A (zh) * | 2023-03-22 | 2023-04-21 | 中山大学 | 一种石斑鱼全基因组液相芯片及其应用 |
CN115992265B (zh) * | 2023-03-22 | 2023-07-14 | 中山大学 | 一种石斑鱼全基因组液相芯片及其应用 |
CN116516029A (zh) * | 2023-06-30 | 2023-08-01 | 中国海洋大学三亚海洋研究院 | 一种金鲳全基因组育种芯片及应用 |
CN117363744A (zh) * | 2023-11-01 | 2024-01-09 | 中国海洋大学 | 一种仿刺参性别分子标记、引物及其应用 |
CN117701722A (zh) * | 2024-01-16 | 2024-03-15 | 佛山科学技术学院 | 一种牛高原适应育种10k液相芯片及应用 |
CN117802249A (zh) * | 2024-03-01 | 2024-04-02 | 中国海洋大学三亚海洋研究院 | 一种东星斑全基因组snp芯片的制备方法及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113789391A (zh) | 一种仿刺参育种全基因组50k snp芯片及应用 | |
Hoshino et al. | Microsatellites as tools for genetic diversity analysis | |
CN105624310B (zh) | 一种影响猪肌内脂肪性状的分子标记及应用 | |
CN109055571B (zh) | 黄鳍棘鲷微卫星标记的特异性引物及应用 | |
CN105506162B (zh) | 长牡蛎快速生长相关的snp标记及其鉴定方法和应用 | |
CN109554486A (zh) | 与草鱼性状相关的snp分子标记及其应用 | |
CN109486961B (zh) | 一种拟穴青蟹高密度遗传图谱的构建方法 | |
CN107988424B (zh) | 与大豆种子蛋氨酸含量相关的分子标记、区间、引物及应用 | |
CN102876777B (zh) | 鮸鱼est微卫星标记的特异引物及筛选方法 | |
CN111057784B (zh) | 一种与核桃黑斑病相关的ssr分子标记引物及其应用 | |
CN110564867B (zh) | 一种秦川牛cfl1基因的snp分子标记及其检测方法 | |
CN113684280A (zh) | 一种仿刺参抗高温育种低密度12k snp芯片及应用 | |
CN111979341A (zh) | 一种基于罗氏沼虾转录组序列开发的引物组及其应用 | |
CN113604587B (zh) | 一种快速鉴定日本对虾低温耐受品种的分子标记t5198及其应用 | |
Wu et al. | Development of polymorphic microsatellites for Sillago sihama based on next-generation sequencing and transferability to Sillago japonica | |
CN111826449B (zh) | 获得雌核发育鳙畸形性状相关分子标记的方法及其应用 | |
Wang et al. | Development of EST-SSRs from the ark shell (Scapharca broughtonii) transcriptome and their application in genetic analysis of four populations | |
CN111378765B (zh) | 速生草鱼个体的snp标记及其应用 | |
Yu et al. | Transcriptome analysis of the grass carp (Ctenopharyngodon idella) using 454 pyrosequencing methodology for gene and marker discovery | |
CN108588242B (zh) | 一种长牡蛎ahr基因的snp位点 | |
CN113584188A (zh) | 一种日本对虾耐低温的分子标记c6101及应用 | |
CN102776184A (zh) | 猪 ckm 5,侧翼启动子区 snp 作为猪胴体性状的遗传标记及应用 | |
CN117683911B (zh) | 一种检测与棕点石斑鱼饲料蛋白利用性状相关snp分子标记的引物及其应用 | |
CN113789392B (zh) | 一种与斑点叉尾鮰生长相关的snp标记及其应用 | |
Liu et al. | Chromosome-scale assembly and quantitative trait locus mapping for major economic traits of the Culter alburnus genome using Illumina and PacBio sequencing with Hi-C mapping information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |