CN116814805A - 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 - Google Patents
一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 Download PDFInfo
- Publication number
- CN116814805A CN116814805A CN202310730572.4A CN202310730572A CN116814805A CN 116814805 A CN116814805 A CN 116814805A CN 202310730572 A CN202310730572 A CN 202310730572A CN 116814805 A CN116814805 A CN 116814805A
- Authority
- CN
- China
- Prior art keywords
- chip
- snp
- density
- whole genome
- duroc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002360 preparation method Methods 0.000 title claims description 10
- 238000012214 genetic breeding Methods 0.000 claims abstract description 13
- 241000282887 Suidae Species 0.000 claims description 26
- 238000012098 association analyses Methods 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 13
- 230000002068 genetic effect Effects 0.000 abstract description 13
- 238000009395 breeding Methods 0.000 abstract description 12
- 230000001488 breeding effect Effects 0.000 abstract description 12
- 238000011156 evaluation Methods 0.000 abstract description 3
- 108090000623 proteins and genes Proteins 0.000 description 22
- 239000003550 marker Substances 0.000 description 13
- 238000009826 distribution Methods 0.000 description 11
- 102000054766 genetic haplotypes Human genes 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 9
- 230000037308 hair color Effects 0.000 description 9
- 239000003147 molecular marker Substances 0.000 description 9
- 210000002268 wool Anatomy 0.000 description 9
- 238000000034 method Methods 0.000 description 8
- 101000625226 Homo sapiens Melanoregulin Proteins 0.000 description 7
- 102100024976 Melanoregulin Human genes 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000003908 quality control method Methods 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000037396 body weight Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 108091092878 Microsatellite Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000003205 genotyping method Methods 0.000 description 3
- 210000004209 hair Anatomy 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000000018 DNA microarray Methods 0.000 description 2
- -1 IFG1 Proteins 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 102100030310 5,6-dihydroxyindole-2-carboxylic acid oxidase Human genes 0.000 description 1
- 102100030461 Alpha-ketoglutarate-dependent dioxygenase FTO Human genes 0.000 description 1
- 102100024506 Bone morphogenetic protein 2 Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 102100028072 Fibroblast growth factor 4 Human genes 0.000 description 1
- 101000773083 Homo sapiens 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101001062620 Homo sapiens Alpha-ketoglutarate-dependent dioxygenase FTO Proteins 0.000 description 1
- 101000762366 Homo sapiens Bone morphogenetic protein 2 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001060274 Homo sapiens Fibroblast growth factor 4 Proteins 0.000 description 1
- 101000978418 Homo sapiens Melanocortin receptor 4 Proteins 0.000 description 1
- 101001134060 Homo sapiens Melanocyte-stimulating hormone receptor Proteins 0.000 description 1
- 101001023043 Homo sapiens Myoblast determination protein 1 Proteins 0.000 description 1
- 101000958866 Homo sapiens Myogenic factor 6 Proteins 0.000 description 1
- 101001131829 Homo sapiens P protein Proteins 0.000 description 1
- 102100023724 Melanocortin receptor 4 Human genes 0.000 description 1
- 102100034216 Melanocyte-stimulating hormone receptor Human genes 0.000 description 1
- 102100035077 Myoblast determination protein 1 Human genes 0.000 description 1
- 102100038379 Myogenic factor 6 Human genes 0.000 description 1
- 102100034574 P protein Human genes 0.000 description 1
- 241000255969 Pieris brassicae Species 0.000 description 1
- 102000004913 RYR1 Human genes 0.000 description 1
- 108060007240 RYR1 Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 235000021051 daily weight gain Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008266 hair spray Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/124—Animal traits, i.e. production traits, including athletic performance or the like
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一个杜洛克猪全基因组低密度SNP芯片,包括11258个SNP位点。所述杜洛克猪全基因组低密度SNP芯片上的SNP位点在杜洛克猪基因组上均匀分布,可以有效地覆盖基因组效应区域,保证了低密度芯片的基因组预测效力,更能保证利用所述杜洛克猪全基因组低密度SNP芯片填充后的高密度芯片具有同等的遗传评估能力,对于产业化应用低密度SNP芯片,全面发展猪基因组遗传育种具有推动型作用,大幅度提高猪选育的准确性,加快杜洛克种猪育种的遗传进展。
Description
技术领域
本发明涉及基因检测技术领域,具体地,涉及一个杜洛克猪全基因组低密度SNP芯片及其制备方法和应用。
背景技术
单核苷酸多态性(single nucleotide polymorphism,SNP)是指存在于基因组水平上单个核苷酸的变异,由碱基的转换或颠换引起。与微卫星等重复序列多态性标记相比,SNP在基因组上分布广泛,数量多,遗传稳定性高,更适用于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究。同时,由于SNP具有二态性,且单个SNP位点突变率低,易于通过芯片技术实现自动化和规模化检测。因此,SNP成为继限制性酶切片段长度多态性标记(RFLP)、DNA重复序列的多态性标记(包括小卫星、微卫星DNA重复序列)之后的第三代主流基因遗传标记。SNP在基因组中具有高密度和高保守型,在猪基因组27亿个碱基中,每300~400个碱基会出现一个SNP位点,整个基因组中会出现超过6400万个位点。
基于SNP的新型高通量分子标记技术主要由两大类:一类是基于测序技术的高通量分子标记技术;另一类是基于基因芯片技术的分子标记技术。
基于测序技术的分子标记技术虽然具有通量高和灵活性高等优点,但是短片段测序依赖于参考基因组序列。位于重复序列区域或者在参考基因组上没有的区域很难检测和分析,并且测序数据的处理、序列基因组定位和基因分型的计算等复杂过程对于数据分析的要求较高,这些缺点在一定程度上限制了该方法的广泛使用,特别是在分子育种中大规模使用。
基因芯片(gene chip)又称DNA芯片或生物芯片。基因芯片的基本原理使用杂交测序法,将已知序列的核苷酸作为探针与标记的靶核苷酸序列进行杂交,通过对信号的检测进行定性与定量分析。基因芯片可在一个微小的基片(硅片、玻片等)表面集成大量的分子识别探针,能够在同一时间内平行分析大量基因,进行大信息量的检测分析。由于其快速、高通量的优点,芯片在精华、基因定位、分子育种中得到广泛应用。尤其在以基因组选择为核心的动植物分子育种领域,芯片更易于标准化、通用化、流程化,从而得到大规模应用。目前,用于猪的商用SNP芯片主要包括基于Illumina平台的PorcineSNP60芯片、GeneSeek研发的PorcineSNP80芯片、国产的“中芯一号”KPS-PorcineBreeding芯片以及Affymetrix平台开发的70K芯片。
国内商品猪三元杂交体系以杜洛克猪×长白猪×大白猪为主,占据了90%以上的市场份额。在该杂交体系中,杜洛克猪作为终端父本,为商品猪提供50%的遗传贡献,父系杜洛克猪的生产性能和遗传资质,直接影响后代商品猪的生产价值和经济效益。因此,基因组育种对父系杜洛克具有重要的应用价值。当前市场上商业芯片的使用率较高,但对于分子育种实际应用而言,其价格仍然较高,限制了在猪场中的大规模使用。而低密度芯片则可以在降低价格的前提下,保证分子育种的使用效果,但目前开发的低密度芯片的准确性问题有待商榷。因此,需要提供一种准确性高的猪SNP低密度芯片,才能满足大规模猪育种的需要。
发明内容
本发明的目的是为了克服现有技术的上述不足,提供一个杜洛克猪全基因组低密度SNP芯片及其制备方法和应用。
本发明的第一目的是提供一个杜洛克猪全基因组低密度SNP芯片。
本发明的第二目的是提供检测上述SNP芯片中的SNP位点的试剂在杜洛克猪遗传育种中的应用。
本发明的第三目的是提供检测上述SNP芯片中的SNP位点的装置在杜洛克猪遗传育种中的应用。
本发明的第四目的是提供一种杜洛克猪全基因组低密度SNP芯片的制备方法。
本发明的第五目的是提供上述制备方法制备得到的杜洛克猪全基因组低密度SNP芯片。
本发明的第六目的是提供上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪遗传育种中的应用。
本发明的第七目的是提供上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪毛色选择中的应用。
本发明的第八目的是提供上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪全基因组关联分析中的应用。
本发明的第九目的是提供上述杜洛克猪全基因组低密度SNP芯片在填充至高密度芯片中的应用。
为了实现上述目的,本发明是通过以下方案予以实现的:
一个杜洛克猪全基因组低密度SNP芯片,包括11258个SNP标记位点,所述SNP位点如表1所示。
本发明还请求保护上述SNP位点在制备杜洛克猪全基因组低密度芯片中的应用。
本发明还请求保护检测上述SNP位点的试剂在杜洛克猪遗传育种中的应用。
本发明还请求保护检测上述SNP位点的装置在杜洛克猪遗传育种中的应用。
优选地,所述装置为SNP芯片。
一种杜洛克猪全基因组低密度SNP芯片的制备方法,所述制备方法为利用上述SNP位点形成SNP芯片。
本发明还请求保护上述制备方法制备得到的杜洛克猪全基因组低密度SNP芯片。
优选地,所述杜洛克猪全基因组低密度SNP芯片中相邻SNP标记位点之间的平均物理距离为201kb。
优选地,所述杜洛克猪全基因组低密度SNP芯片中相邻SNP标记位点之间的连锁不平衡程度r2为0.37。
优选地,所述杜洛克猪全基因组低密度SNP芯片的平均次等位基因频率(MAF)为0.30。
本发明还请求保护上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪遗传育种中的应用。
本发明还请求保护上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪毛色选择中的应用。
本发明还请求保护上述杜洛克猪全基因组低密度SNP芯片在杜洛克猪全基因组关联分析中的应用。
本发明还请求保护上述杜洛克猪全基因组低密度SNP芯片在填充至高密度芯片中的应用。
与现有技术相比,本发明具有以下有益效果:
本发明提供了一个杜洛克猪全基因组低密度SNP芯片,包括11258个SNP位点。所述杜洛克猪全基因组低密度SNP芯片上的SNP位点在杜洛克猪基因组上均匀分布,可以有效地覆盖基因组效应区域,保证了低密度芯片的基因组预测效力,更能保证利用所述杜洛克猪全基因组低密度SNP芯片填充后具有同等的遗传评估能力,对于产业化应用低密度SNP芯片,全面发展猪基因组遗传育种具有推动型作用,大幅度提高猪选育的准确性,加快杜洛克种猪育种的遗传进展。
附图说明
图1为杜洛克猪全基因组低密度SNP芯片(10K芯片)的构建流程图;
图2为10K芯片中SNP标记位点在每条染色体上的数量分布情况图;
图3为10K芯片中SNP标记位点在染色体上的物理位置分布图;
图4为10K芯片中相邻SNP位点的距离间隔分布频率图;
图5为10K芯片中SNP标记位点的次等位基因频率(MAF)分布图;
图6为10K芯片中相邻SNP位点的连锁不平衡程度(r2)频率图;
图7为10K芯片填充至60K芯片的填充验证流程图。
具体实施方式
下面结合说明书附图及具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
实施例1杜洛克猪全基因组低密度SNP芯片的构建
本实施例所述杜洛克猪全基因组低密度SNP芯片(10K芯片)的构建流程图如图1所示。
1、性状关联SNP位点的筛选
(1)性状的测定及候选群挑选
基于广东河源兴泰农牧股份有限公司杜洛克种猪核心群(出生于2015~2022年),对其父系特征性状进行测定,包括校正100公斤日龄、校正100公斤日增重、背膘厚、眼肌面积、体长、体高、管围和毛色性状,挑选其中的453头杜洛克种猪作为候选群;
所述校正方式源于《全国生猪遗传改良计划工作手册》。
(2)基因分型及位点质量控制
对步骤(1)挑选的453头杜洛克猪候选群进行耳组织样品采集,并提取DNA样品。DNA样品通过KPS-PorcineBreeding芯片进行基因型分型,获得覆盖全基因组的57466个SNP分子标记位点。
对57466个SNP分子标记位点进行质控,得到质控后的SNP位点;
质控标准为:去除SNP检出率<95%、次等位基因频率<1%以及位于性染色体上或缺少染色体位置信息的SNP位点;
通过Beagle软件填充质控后的SNP位点的缺失基因型,填充后按照相同的质控标准进行二次质控,得到用于关联分析的SNP分子标记位点。
(3)全基因组关联分析以及关联SNP位点的筛选
对步骤(1)测定的父系特征性状进行分析,对毛色性状采用广义线性模型进行分析;对除毛色性状之外的其他性状使用混合线性模型进行GWAS分析。
混合线性模型为:y=Wα+Xβ+u+ε;
其中,y是表型观察值向量;W为固定效应矩阵;α为固定效应系数矩阵,包括群体截距系数;X为基因型矩阵,以0,1,2的形式编码;β为SNP的效应矩阵;u为服从正态分布(0,λr- 1K)的随机效应,r-1为残差方差,λ为遗传加性方差与残差方差的比例,K为遗传亲缘关系矩阵;ε为服从正态分布(0,r-1I)的残差效应,I为单位向量矩阵。
广义混合线性模型表示为:logit(μ)=Wα+Xβ+u+ε;
其中,u为个体毛色变异时的后验概率向量,表示为μi=P(yi=1|Wi,Xi,ui),i表示为有毛色记录的个体数,y表示毛色变异-对照的二分变量观察值;W为固定效应矩阵;α为固定效应系数矩阵,包括群体截距系数;X为基因型矩阵,以0(显性纯合子),1(杂合子),2(隐性纯合子)的形式编码;β为SNP的效应矩阵。
分析结束后,使用Bonferroni校正方法,设计统计显著性水平(包括基因组水平和提示性水平),其中基因组水平设置为0.05/50000,提示性水平设置为1/50000,-log10(P)高于检验阈值的SNP分子标记位点判定为具有显著关联性的SNP分子标记位点。
整合具有显著的关联性的SNP分子标记位点,去重,得到149个性状关联SNP位点。
2、功能基因SNP位点的筛选
使用KPS-PorcineBreeding芯片对步骤(1)中挑选的453头杜洛克猪进行测定,得到60K芯片SNP标记位点。
根据NCBI数据库和猪参考基因组Sscrofa11.1,确定和步骤(1)中性状相关的功能基因的物理位置,筛选60K芯片中处于功能基因的物理位置范围内的SNP位点,得到587个功能基因SNP位点。
其中,功能基因包括BMP2、MC4R、ESR1、FTO、FGF4、IFG1、RYR1、MYF6、MYOD1、MC1R、KIT、OCA2、MREG、TYRP1。
3、单倍型标签SNP位点的筛选
将步骤1中质控后的位点数据作为待选位点集,利用Haploview软件对1~18号常染色体进行单倍型分析,根据软件的默认参数,共划分出4499个单倍型块;计算各个单倍型块的SNP多态信息量(PIC),以PIC值最高的SNP位点作为该单倍型块的标签SNP。
多态信息量表示为:PIC=1–(MAF2+(1-MAF)2)–(2×MAF2×(1-MAF)2);PIC取值范围在[0:0.375];
经分析计算,共挑选4499个单倍型标签SNP位点。
4、结构优化SNP位点的筛选
经步骤3单倍型分析,从相邻两个单倍型块之间的非单倍型SNP位点中,根据位点的物理位置,按照每6个位点挑选1个的规律,选取出6410个SNP结构位点;将其中3451个低PIC的SNP位点,替换成与其连锁程度高且PIC更高的位点,替换位点源于自建数据库。
5、杜洛克猪全基因组低密度SNP芯片的组合构建
将步骤1的性状关联位点、步骤2的功能基因位点、步骤3的单倍型标签位点以及步骤4的结构优化位点进行合并、去重,构建成分布于1~18号常染色体的11258个分子标记位点的杜洛克猪全基因组低密度SNP芯片;杜洛克猪全基因组低密度SNP芯片及构建SNP芯片的目标SNP位点的上下游序列长度的具体信息如表1所示,所述位点信息皆基于猪参考基因组Sscrofa11.1。
表1杜洛克猪全基因组低密度SNP芯片及构建SNP芯片的目标SNP位点的上下游序列长度的具体信息
6、实验结果
杜洛克猪全基因组低密度SNP芯片(包含11258个SNP位点,简称10K芯片)的SNP位点数相当于KPS-PorcineBreeding芯片(包含57466个SNP位点,简称60K芯片)位点数的20%;10K芯片中SNP标记位点在每条染色体上的数量分布情况如图2所示,结果显示:10K芯片中SNP位点分布频率随染色体长度变化而变化,染色体越长,分布在染色体上的SNP频率越高;10K芯片中SNP标记位点在染色体上的物理位置分布如图3所示,结果表明:SNP位点在染色体上分布均匀;10K芯片中相邻SNP位点的距离间隔分布频率如图4所示,结果显示:10K芯片的相邻位点平均间隔为203kb;10K芯片中SNP标记位点的次等位基因频率(MAF)分布图如图5所示,结果显示:10K芯片的MAF均值为0.30;10K芯片中相邻SNP位点的连锁不平衡程度(r2)频率如图6所示,结果显示:连锁不平衡程度(r2)的均值为0.37。
10K芯片和60K芯片的各参数对比如表2所示。
表2 10K芯片和60K芯片的各参数对比
芯片名称 | 位点数 | 平均间隔 | MAF均值 | r2均值 |
10K芯片 | 11258 | 201kb | 0.30 | 0.37 |
60K芯片 | 57466 | 47kb | 0.27 | 0.42 |
结果显示:10K芯片上相邻位点之间的平均距离从60K芯片的47kb增加到了201kb,但其SNP标记位点的次等位基因频率以及相邻位点之间的平均连锁不平衡程度与60K芯片没有显著区别。
实施例2 10K芯片填充准确性的验证
1、实验方法
实施例1制备得到的10K芯片填充至60K芯片的填充验证流程图如图7所示。
以广东河源兴泰农牧股份有限公司种猪核心群的453头杜洛克猪作为实验群体,将实验群体全部检测60K芯片,得到453头杜洛克猪的60K芯片数据。
从453头实验群体中按照表1所示SNP位点信息提取10K芯片位点,得到10K芯片数据,即实验群体同时具有60K芯片数据和10K芯片数据,60K芯片数据作为验证集,10K芯片数据作为填充集。
另选取5223头美系杜洛克猪的60K芯片数据作为参考集。
通过Beagle软件将填充集的10K芯片数据按照参考集中5223头杜洛克猪的60K芯片数据进行填充至60K,得到填充后的60K芯片数据。
将填充后的60K芯片与验证集的60K芯片进行基因型一致性对比,评估填充后的60K芯片的填充准确性;其中基因型一致性评表示为:将3种基因型AA、Aa、aa分别编码为0、1、2,计算基因型正确填充的位点占60K芯片数据所有位点的比例。
2、实验结果
基因型一致性评估结果为97.68%,结果说明:实施例1得到的10K芯片的填充准确性较高,位点选取合理性较高。
实施例3 10K芯片、60K芯片和填充后的60K芯片的基因组选择准确性测定
1、实验方法
以广东河源兴泰农牧股份有限公司种猪核心群的453头杜洛克猪(出生于2015~2022年)作为实验群体,对实验群体进行基因组检测得到60K芯片,并收集实验群体的6组表型值用于估计基因组育种值(GEBV)的估计;6组表型分别为:达100KG体重日龄、达100KG体重背膘厚、达100KG体重眼肌面积、体高、体长和管围。
按照5-fold交叉验证的方法,将453头杜洛克猪随机分成5个子群体(4个子群体为90头杜洛克猪,1个子群体为93头杜洛克猪),将其中任一子群体作为测试集,剩余四个个子群体作为训练集。训练集通过GBLUP模型计算60K芯片SNP标记位点的效应值,测试集根据训练集得到的SNP标记位点的效应值估计得到GEBV,计算GEBV和表型残差值的皮尔逊相关性,得出基因组选择准确性。依次将5个子群体都作为验证群进行基因组选择准确性计算为完成1个循环实验,共进行20次循环实验,每个循环实验均对453头杜洛克猪进行重新分组,统计20次循环实验的结果并计算平均值作为60K芯片数据最终的准确值。
通过GBLUP模型计算实验群体(453头杜洛克猪)的GEBV值,并根据Pearson’s相关性:r(GEBV,y*)/h,得到预测准确性数值,其中y*表示剔除固定效应的表型残差值,h表示性状遗传力的开平方根。
其中,准确性的取值范围在0~1之间,0代表GEBV和表型残差值无相关性,1代表GEBV和表型残差值有相关性;准确性越接近1,说明SNP芯片对表型的预测性能越佳。
利用实施例1得到的10K芯片检测453头杜洛克猪得到10K芯片,将10K芯片按照上述60K芯片的基因组选择准确性的计算方法计算其基因组选择准确性;利用实施例1制备得到的10K芯片检测453头杜洛克猪得到10K芯片,按照实施例2所述方法将10K芯片填充至60K,得到填充后的60K芯片,将填充后的60K芯片按照上述60K芯片的基因组选择准确性的计算方法计算其基因组选择准确性。
2、实验结果
10K芯片、60K芯片和填充后的60K芯片的基因组选择准确性如表3所示。
表3 10K芯片、60K芯片和填充后的60K芯片的基因组选择准确性
结果显示:除达100KG体重日龄和体长性状外,10K芯片的基因组选择准确性相较于60K芯片均有提升,其中达100KG体重背膘厚、达100KG体重眼肌面积、体高和管围性状的准确性分别提高了2%、2%、10.7%和47.1%。结果说明实施例1制备得到的杜洛克猪全基因组低密度芯片(10K芯片)具有较好的基因组选择准确性,部分性状的预测性能优于60K芯片。
并且从杜洛克猪全基因组低密度SNP芯片(10K芯片)填充至60K后得到的填充后60K芯片的基因组选择准确性也与60K芯片的基因组选择准确性相当,在体高和体长性状的评估中,填充后60K芯片的准确性也优于60K芯片。说明实施例1制备得到的杜洛克猪全基因组低密度芯片(10K芯片)具有较好的填充后预测性能。
实施例4 10K芯片在杜洛克猪遗传育种中的应用
1、实验方法
以广东河源兴泰农牧股份有限公司核心群有毛色记录的350头杜洛克猪作为实验样本,记录其毛色表型。
在实施例1制备得到的杜洛克猪全基因组低密度SNP芯片(10K芯片)中加入MREG毛色基因控制位点CNC10152359,得到带有MREG毛色基因控制位点的10K芯片,对实验样本进行检测,得到实验样本的10K芯片(350头杜洛克猪的10K芯片),参照实施例1步骤(3)中所示的全基因组关联分析,得到MREG毛色基因控制位点与杜洛克猪毛色性状之间的关系。
其中,实施例1表1所示SNP位点中NO:1~NO:15所示SNP位点信息为与杜洛克注毛色性状相关的SNP位点,且包含于10K芯片上。
2、实验结果
MREG毛色基因控制位点的基因型与杜洛克猪毛色性状之间的关系如表4所示。
表4MREG毛色基因控制位点的基因型与杜洛克猪毛色性状之间的关系
0_AA(显性纯合子) | 1_Aa(杂合子) | 2_aa(隐性纯合子) | |
黑毛色 | 71 | 62 | 10 |
红毛色 | 157 | 47 | 3 |
结果显示:在MREG控制位点中,显性纯合子个体黑毛色和红毛色个体的比例接近1:2,杂合子比例接近4:3,隐性纯合子比例为10:3。
在杜洛克猪的遗传育种过程中,早期选择时,应尽量避免选留基因型为显性纯合子的子代。而杂合子和隐性纯合子的个体为黑毛色的概率更大,在选留时,首选黑毛色隐性纯合子个体,其次为杂合子个体。同时,尽量选择隐性纯合子个体作为选配对象,以更高的概率确保后代的毛色为黑色。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,对于本领域的普通技术人员来说,在上述说明及思路的基础上还可以做出其它不同形式的变化或变动,这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一个杜洛克猪全基因组低密度SNP芯片,其特征在于,包括11258个SNP位点,所述SNP位点如下表所示,
2.检测权利要求1中所述SNP位点的试剂在杜洛克猪遗传育种中的应用。
3.检测权利要求1中所述SNP位点的装置在杜洛克猪遗传育种中的应用。
4.根据权利要求3所述的应用,其特征在于,所述装置为SNP芯片。
5.一种杜洛克猪全基因组低密度SNP芯片的制备方法,其特征在于,所述制备方法为利用权利要求1中所述的11258个SNP位点形成SNP芯片。
6.权利要求5所述制备方法制备得到的杜洛克猪全基因组低密度SNP芯片。
7.权利要求6所述杜洛克猪全基因组低密度SNP芯片在杜洛克猪遗传育种中的应用。
8.权利要求6所述杜洛克猪全基因组低密度SNP芯片在杜洛克猪毛色选择中的应用。
9.权利要求6所述杜洛克猪全基因组低密度SNP芯片在杜洛克猪全基因组关联分析中的应用。
10.权利要求6所述杜洛克猪全基因组低密度SNP芯片在填充至高密度芯片中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310730572.4A CN116814805A (zh) | 2023-06-19 | 2023-06-19 | 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310730572.4A CN116814805A (zh) | 2023-06-19 | 2023-06-19 | 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116814805A true CN116814805A (zh) | 2023-09-29 |
Family
ID=88114015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310730572.4A Pending CN116814805A (zh) | 2023-06-19 | 2023-06-19 | 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116814805A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117965760A (zh) * | 2024-03-29 | 2024-05-03 | 中山大学 | 一种猪肉质性状选育的snp芯片及其制备方法和应用 |
-
2023
- 2023-06-19 CN CN202310730572.4A patent/CN116814805A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117965760A (zh) * | 2024-03-29 | 2024-05-03 | 中山大学 | 一种猪肉质性状选育的snp芯片及其制备方法和应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110191965B (zh) | 猪全基因组50k snp芯片及应用 | |
CN115029451B (zh) | 一种绵羊液相芯片及其应用 | |
Fan et al. | Development and application of high-density SNP arrays in genomic studies of domestic animals | |
CN107967409B (zh) | 一种猪全基因组低密度snp芯片及其制作方法和应用 | |
WO2023201950A1 (zh) | 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 | |
CN115198023B (zh) | 一种海南黄牛液相育种芯片及其应用 | |
CN116814805A (zh) | 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 | |
CN117095746A (zh) | 一种用于水牛的gbs全基因组关联分析方法 | |
CN110438242B (zh) | 一种三疣梭子蟹微卫星标记的引物及其应用 | |
CN116516029A (zh) | 一种金鲳全基因组育种芯片及应用 | |
CN117778588A (zh) | 一种基于靶向捕获测序的绵羊1k液相芯片的制备方法及应用 | |
CN108085400A (zh) | 白来航鸡红羽致因突变基因型的鉴定及专用标记 | |
CN117431324A (zh) | 一种奶牛全基因组中高密度snp芯片及其应用 | |
CN114875157B (zh) | 与黄颡鱼个体生长性状相关的snp标记及应用 | |
CN110144414A (zh) | 与公猪精子畸形率相关的分子遗传标记及其应用和获取方法 | |
CN118109605B (zh) | 与尼里-拉菲水牛生长性状相关的snp分子标记组合及应用 | |
CN117106936B (zh) | 分析山羊毛色性状的分子标记组合及应用 | |
CN110396548A (zh) | 一种蒙古牛不同群体鉴定的snp分子标记组合 | |
CN117701727B (zh) | 基于全基因组测序筛选的与摩拉水牛体尺、初生重相关的snp分子标记组合及应用 | |
CN117025786B (zh) | 一种基于靶向捕获测序的细毛羊50k snp液相芯片及其应用 | |
CN118064638B (zh) | 玉米耐旱性相关的snp分子标记位点及其应用 | |
CN117004739A (zh) | 一种判断红罗非鱼越冬期黑斑性状的方法 | |
CN118581233A (zh) | 一种商品猪液相芯片及其制备方法和应用 | |
CN118581275A (zh) | 一种与橡胶树农艺性状相关的snp位点组合及液相基因芯片和应用 | |
CN118547078A (zh) | 一种黑山羊多胎性状分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |