CN117500943A - 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 - Google Patents
一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 Download PDFInfo
- Publication number
- CN117500943A CN117500943A CN202280003541.2A CN202280003541A CN117500943A CN 117500943 A CN117500943 A CN 117500943A CN 202280003541 A CN202280003541 A CN 202280003541A CN 117500943 A CN117500943 A CN 117500943A
- Authority
- CN
- China
- Prior art keywords
- snp
- beijing black
- chip
- pig
- beijing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003147 molecular marker Substances 0.000 title claims abstract description 27
- 238000003205 genotyping method Methods 0.000 title claims abstract description 19
- 238000002360 preparation method Methods 0.000 title claims abstract description 8
- 241000282887 Suidae Species 0.000 claims abstract description 90
- 238000009395 breeding Methods 0.000 claims abstract description 51
- 230000001488 breeding effect Effects 0.000 claims abstract description 51
- 230000002068 genetic effect Effects 0.000 claims abstract description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 7
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 7
- 241000282898 Sus scrofa Species 0.000 claims description 121
- 239000000523 sample Substances 0.000 claims description 40
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 17
- 238000012098 association analyses Methods 0.000 claims description 16
- 238000012163 sequencing technique Methods 0.000 claims description 16
- 235000013372 meat Nutrition 0.000 claims description 14
- 238000003908 quality control method Methods 0.000 claims description 14
- 108700028369 Alleles Proteins 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 9
- 238000007918 intramuscular administration Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 235000015277 pork Nutrition 0.000 claims description 5
- 235000016299 Canarium odontophyllum Nutrition 0.000 claims description 4
- 244000001582 Canarium odontophyllum Species 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 102000008186 Collagen Human genes 0.000 claims description 3
- 108010035532 Collagen Proteins 0.000 claims description 3
- 235000008730 Ficus carica Nutrition 0.000 claims description 3
- 210000001766 X chromosome Anatomy 0.000 claims description 3
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 230000002759 chromosomal effect Effects 0.000 claims description 3
- 229920001436 collagen Polymers 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000036541 health Effects 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 3
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 230000003234 polygenic effect Effects 0.000 claims description 3
- 238000003307 slaughter Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 2
- 210000000349 chromosome Anatomy 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- 210000002593 Y chromosome Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 239000011325 microbead Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 108020003215 DNA Probes Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000255969 Pieris brassicae Species 0.000 description 1
- 238000001772 Wald test Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
涉及分子生物学、功能基因组学、生物信息学、基因组育种技术领域,具体公开了一种用于北京黑猪基因分型的SNP分子标记组合、芯片及其制备方法与应用。涉及用于北京黑猪基因分型的SNP分子标记组合,由49,963个SNP分子标记组成,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1‑49,963所示。应用该分子标记组合可制备北京黑猪分子育种芯片,并可进一步应用于特异性鉴定北京黑猪与其他猪种(欧洲商业猪种、中国地方猪种)、目标性状QTL、关联位点及候选基因鉴定、亲缘关系鉴定和家系划分等方面。
Description
交叉引用
本申请要求2022年4月22日提交的专利名称为“一种用于北京黑猪基因分型的SNP分子标记组合、芯片及其制备方法与应用”的第202210433080.4号中国专利申请的优先权,其全部公开内容通过引用整体并入本文。
本发明涉及基因组学、生物信息学、分子生物学和基因组育种技术领域,具体地说,涉及一种用于北京黑猪基因分型的SNP分子标记组合、芯片及其制备方法与应用。
北京黑猪是利用大白猪、巴克夏猪、苏联大白猪与高加索猪等国外猪种,与本地猪种杂交产生大量后代的基础上培育而成。该品种于1982年正式命名为“北京黑猪”,之后还被定为母系原种猪。北京黑猪融合了国内外猪种的优良种性,将猪种的耐粗饲、早熟多产、肉质香嫩的特点,和体大快长、多肉的特性结合起来。
然而,当前北京黑猪核心群群体规模过小,难以实施有效的育种选育,群体生产性能亟需进一步提高。开发一款北京黑猪分子育种专门化芯片,实现北京黑猪特色品种的合理开发利用,培育专门化北京黑猪优良品种及优质猪配套系,发展北京黑猪的种质资源,并基于该品种开发优质高档的猪肉产品,对于加速北京黑猪的选育改良,促进特色畜牧业发展有重大意义。
SNP是指基因组水平上单个核苷酸的变异,包括单碱基的缺失、插入、转换及颠换等形成的分子标记,具有数量大分布广的特点。SNP作为遗传标记,对复杂性状的遗传变异具有贡献,因此被广泛应用于遗传研究中。SNP芯片是将带有荧光标记的DNA探针固定在硅片上制作而成,再通过探针DNA与基因组DNA杂交进行SNP分型。SNP与硅片表面的探针结合而不是基因组序列,这样可以将大量个体的DNA固定到一张芯片上分析。
Illumina公司的Infinium SNP芯片技术是目前比较成熟和应用广泛的全基因 SNP检测平台。首先将变性的DNA与芯片微珠上的探针进行杂交,然后去除未杂交结合的DNA,并将获得的DNA进行特殊标记碱基的延伸反应;最后通过标记和荧光基团的免疫结合将SNP信息转化为可视的荧光信息。
目前,猪上成熟的商用SNP芯片主要基于illumina平台的geneseek公司开发的PorcineSNP60芯片、GGP-Porcine HD芯片、康普森公司设计的compass porcineSNP55芯片。另一个平台是Affymetrix平台,目前猪上主要有Affymetrix开发的高密度芯片,含大约650,000个SNP,价格高昂,使用量很少。
然而,当前的商业化芯片由于SNP位点来源具有一定的局限性,且大多针对于大白猪、长白猪、杜洛克等国外猪种设计,对于北京黑猪这一品种适应性较差。因此,有必要针对性地对适用于北京黑猪的芯片进行研发。
发明内容
本发明的目的是提供一种北京黑猪基因分型的SNP分子标记组合、芯片及其制备方法与应用。
具体地,本发明的技术方案如下:
第一方面,本发明提供一种用于北京黑猪基因分型的SNP分子标记组合,其由49,963个SNP分子标记组成,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-49,963所示。
第二方面,本发明提供上述SNP分子标记组合在制备北京黑猪分子育种芯片中的应用。
第三方面,本发明提供一种北京黑猪分子育种50K SNP芯片,其包含1-49,963个SNP分子标记,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-49,963所示。
上述用于北京黑猪基因分型的SNP分子标记组合或北京黑猪分子育种50K SNP芯片,其中,所述SNP分子标记的SNP位点位于SEQ ID NO.1-49,963所示的核苷酸序列的第71位。
本发明提供的北京黑猪分子育种50K SNP芯片,其中,每条序列第71位碱基为SNP位点。所述SNP分子标记主要来自于五类SNP位点:第一类,来源于中芯一号PLUS猪育种芯片在北京黑猪群体中多态性良好和检出率高的位点,包 含23,299个SNP位点;第二类,来源于已有文献和公开数据库报道的与现有重要经济性状(特别是肉质性状)显著相关的位点(外显子区和调控区优先),包含937个SNP位点;第三类,来源于由北京黑猪与商业猪种重测序数据进行SNP变异检测的结果中,绝对等位基因频率差异较大的位点,包含2,536个SNP位点;第四类,来源于由北京黑猪全基因组关联分析结果中,与肉质性状显著相关的位点,包含31个SNP位点;第五类,来源于由北京黑猪重测序数据进行SNP变异检测的位点,包含23,160个SNP位点。以上5类探针共计包含49,963个SNP位点。
第四方面,本发明提供一种制备上述北京黑猪分子育种50K SNP芯片的方法,其包括以下步骤:
步骤①:第一类探针的获得:使用
中芯一号PLUS猪育种芯片(可购自北京康普森生物技术有限公司)检测北京黑猪群体,对芯片数据进行质控,质控标准为:剔除SNP检出率<95%、最小等位基因频率<0.1、哈代-温伯格平衡检验P值<10
-6以及没有染色体位置信息的SNP位点;中芯一号PLUS猪育种芯片位置信息从Sus scrofa 10.2版本转为Sus scrofa 11.1版本参考基因组,得到第一类备选SNP;
步骤②:第二类探针的获得:结合公共数据库NCBI和QTLdatabase获得与猪肉质性状、生长性状、繁殖性状及健康性状相关候选基因内部及上下游SNP位点、全基因组关联分析和QTL结果显著SNP,并基于北京黑猪重测序数据,剔除MAF<0.05的位点,得到第二类备选SNP;
步骤③:第三类探针的获得:基于北京黑猪、大白猪与长白猪的重测序数据,筛选北京黑猪与大白猪、长白猪的绝对等位基因频率差异均大于等于0.6的位点,并基于北京黑猪重测序数据,剔除MAF<0.05的位点,得到第三类备选SNP;
步骤④:第四类探针的获得:使用中芯一号PLUS猪育种芯片检测北京黑猪群体,基于北京黑猪的芯片数据和肉质表型数据进行全基因组关联分析,肉质表型数据包括肌内脂肪、蛋白含量、水分含量、胶原蛋白含量、滴水损失、肉色和屠宰后24小时pH值(共7个性状);由全基因组关联分析鉴定到的与肉质性状显著相关的位点,作为第四类备选SNP;
步骤⑤:第五类探针的获得:基于北京黑猪重测序数据,保留MAF≥0.1 的SNP,得到第五类备选SNP;
步骤⑥:为了使SNP位点在全基因组水平上均匀分布,将常染色体与X染色体分为48kb一个窗口,每个窗口按照第一类至第五类探针的优先级,选择1个SNP填充;
步骤⑦:将筛选好的SNP位点由Infmium iSelect打分系统(http://www.ill umina.com/)打分,将基因内分值<0.7和基因间分值<0.9的位点去掉;对于删掉的不合格的SNP位点,选取距离其最近的SNP位点进行补充,并且再次进行打分,直至全部位点合格,之后将获得的标签序列用于SNP芯片的制作。
本发明中利用Infmium芯片制造技术制作SNP芯片,具体可将获得的标签序列交由Illumina公司设计制作Infmium SNP芯片。
第五方面,本发明提供上述用于北京黑猪基因分型的SNP分子标记组合或北京黑猪分子育种50K SNP芯片在北京黑猪全基因组关联分析中的应用。
本发明在进行北京黑猪全基因组关联分析中,应用上述北京黑猪分子育种50K SNP芯片对北京黑猪进行基因型检测,并测定相关表型性状,基于线性混合模型进行全基因组关联分析,线性混合模型的表达式为:
y=Xα+Yβ+Zγ+e
y是表型向量,α为SNP标记效应向量,X是对应于α的关联矩阵,编码为0、1、2,β为非遗传固定效应向量,Y是对应于β的关联矩阵,γ是剩余多基因效应向量,服从正态分布
G是基因组亲缘关系矩阵,
是加性遗传方差,Z是对应于γ的关联矩阵,e为残差向量,服从
I为单位矩阵,
是随机残差。
第六方面,本发明提供上述用于北京黑猪基因分型的SNP分子标记组合或北京黑猪分子育种50K SNP芯片在北京黑猪品种鉴定中的应用。
本发明在进行未知品种的猪的鉴定时,应用上述北京黑猪分子育种50K SNP芯片对所述未知品种的猪进行基因型检测,与已知确定为北京黑猪的芯片数据进行合并,使用PLINK软件对芯片数据质控和计算个体间的IBS距离矩阵,并基于IBS距离矩阵,使用PHYLIP软件的邻接法构建系统发育树,最后通过Figtree软件可视化系统发育树,判断所述未知品种的猪是否为北京黑猪,从而进行品种鉴定。
质控标准为①个体基因型频率>0.95;②SNP检出率(SNP call rate)>0.95;③最小等位基因频率(MAF)>0.05;④哈代-温伯格平衡检验P值>10
-6。
应用本发明芯片可实现北京黑猪与其他猪种(欧洲商业猪种、中国地方猪种)品种鉴定。
第七方面,本发明提供上述用于北京黑猪基因分型的SNP分子标记组合或北京黑猪分子育种50K SNP芯片在北京黑猪育种中的应用。
本发明的有益效果至少在于:
本发明的北京黑猪分子育种专门化SNP芯片结合自身需要进行设计,SNP位点来源更加符合群体特征,且通过选择有效的SNP数目降低了芯片密度,从而最大程度地节约成本。本发明芯片检测费用为150元/张,成本较中芯一号PLUS猪育种芯片降低了50元/张。
此外,与当前猪主流50k SNP芯片——中芯一号PLUS猪育种芯片相比,以本发明SNP分子标记组合制作的芯片位点分布更均匀:将中芯一号PLUS猪育种芯片位置信息从Sus scrofa 10.2版本转为Sus scrofa 11.1版本参考基因组,相邻SNP距离的标准差为50.4kb,说明相邻SNP距离的离散程度较大;而本发明芯片相邻SNP距离的标准差为9.4kb,远低于中芯一号PLUS猪育种芯片,说明相邻SNP距离的离散程度更小,在全基因组分布更均匀。
从多态性角度,本发明芯片的SNP位点在北京黑猪群体中的多态性更好,中芯一号PLUS猪育种芯片在北京黑猪群体中的最小等位基因频率平均为0.220,而本发明芯片为0.276。
本发明提供的SNP分子标记组合具有SNP位点分布均匀,全基因组覆盖率高的特点,利用这些SNP标记进行全基因组育种,能有效地通过连锁不平衡提高与性状的关联程度,保证了育种值估计的准确性。本发明筛选位点时基于北京黑猪的重测序数据,所选位点在北京黑猪群体中有较高的多态性,保证了芯片位点的高质量。本款芯片增加了与猪经济性状(特别是肉质性状)相关的显著SNP位点,提高了芯片的实用性。本发明筛选SNP位点时使用北京黑猪和商业猪种的重测序数据,筛选出品种间绝对等位基因频率差异大的位点,可用于北京黑猪的品种鉴定,有利于保护北京黑猪种质资源。此外,该款芯片还可用于北京黑猪全基因组选择育种、北京黑猪目标性状QTL、关联位点及候选基因鉴定,亲缘 关系鉴定、家系划分等方面,具有广阔的应用前景。
图1为本发明实施例1中SNP位点的最小等位基因频率(MAF)频数(Frequency)分布直方图。
图2为本发明实施例1中相邻SNP位点距离的箱线图(单位:kb),纵坐标为SNP间隔(Interval),横坐标为染色体(CHR)编号。
图3为本发明实施例2中北京黑猪肌内脂肪性状全基因组关联分析结果的曼哈顿图,纵坐标为各SNP位点的p值,并进行-log10转换,横坐标为染色体编号。
图4为本发明实施例3中北京黑猪与欧洲商业猪种、中国地方猪种系统发育树图。其中字母缩写代表品种信息,数字编号为每个品种的个体编号,BJB代表北京黑猪,DU代表杜洛克猪,LW代表大白猪,LD代表长白猪,MS代表马身猪,HN代表淮南猪,LT代表蓝塘猪,LC代表陆川猪,MIN代表民猪。
下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。若未特别指明,实施例均按照常规实验条件,如Sambrook等分子克隆实验手册(Sambrook J&Russell DW,Molecular Cloning:a Laboratory Manual,2001),或按照制造厂商说明书建议的条件。若未特别指明,各实施例中所用的设备和试剂均常规市售可得。
实施例1北京黑猪分子育种50K SNP芯片的制备方法
SNP位点筛选流程:为了使SNP位点在全基因组水平上均匀分布,将常染色体与X染色体分为48kb一个窗口,每个窗口按照第一类至第五类探针的优先级,选择1个SNP填充。
1、第一类探针的获得:
使用中芯一号PLUS猪育种芯片检测北京黑猪群体,对芯片数据进行质控,质控标准为:剔除SNP检出率<95%、最小等位基因频率<0.1、哈代-温伯格平 衡检验P值<10
-6以及没有染色体位置信息的SNP位点。
中芯一号PLUS猪育种芯片位置信息为Sus scrofa 10.2(https://www.ncbi.nlm.nih.gov/assembly/GCF_000003025.5/)版本参考基因组,通过UCSC在线网站(http://genome.ucsc.edu/cgi-bin/hgLiftOver)将位置信息转为Sus scrofa 11.1版本(https://www.ncbi.nlm.nih.gov/assembly/GCF_000003025.6/)参考基因组,得到第一类备选SNP。
猪的全基因组(不含Y染色体)长度约为2.4Gb,为了保证这些SNP在全基因组水平上尽可能均匀分布,本发明将猪全基因组全长以每48kb划分为一个窗口。具体确定SNP的方法:1)若该窗口里有大于等于2个的备选SNP,选取距离该窗口中点最近的SNP;2)若该窗口里的备选SNP数为1个,则备选SNP直接成为最终目标SNP;3)若该窗口无第一类探针的备选SNP,则保留该窗口,等待第二类探针的备选SNP填充。4)设置20k≤相邻SNP的间距/其窗口间隔≤75k这一过滤标准,不符合该标准的SNP进行剔除。最终确定了23,299个第一类探针的SNP。
2、第二类探针的获得:
结合公共数据库NCBI(https://www.ncbi.nlm.nih.gov/pubmed/)、QTLdatabase(https://www.animalgenome.org/cgi-bin/QTLdb/index/)获得与猪肉质性状、生长性状、繁殖性状及健康形状等经济性状相关候选基因内部及上下游SNP位点(外显子区和调控区优先)、全基因组关联分析和QTL结果显著SNP。并基于北京黑猪重测序数据,剔除MAF<0.05的位点,得到第二类备选SNP。
完成第一类探针筛选后,对于尚无SNP的窗口,填充第二类探针,具体方法如下:1)若该窗口里有大于等于2个的备选SNP,选取距离该窗口中点最近的SNP;2)若该窗口里的备选SNP数为1个,则备选SNP直接成为最终目标SNP;3)若该窗口无第二类探针的备选SNP,则保留该窗口,等待第三类探针的备选SNP填充。4)设置20k≤相邻SNP的间距/其窗口间隔≤75k这一过滤标准,不符合该标准的SNP进行剔除。最终确定了937个第二类探针的SNP。
3、第三类探针的获得:
基于北京黑猪、大白猪与长白猪的重测序数据,筛选北京黑猪与大白猪、长白猪的绝对等位基因频率差异均大于等于0.6的位点。并基于北京黑猪重测序数 据,剔除MAF<0.05的位点,得到第三类备选SNP。
完成第二类探针筛选后,对于尚无SNP的窗口,填充第三类探针,具体方法如下:1)若该窗口里有大于等于2个的备选SNP,选取距离该窗口中点最近的SNP;2)若该窗口里的备选SNP数为1个,则备选SNP直接成为最终目标SNP;3)若该窗口无第三类探针的备选SNP,则保留该窗口,等待第四类探针的备选SNP填充。4)设置20k≤相邻SNP的间距/其窗口间隔≤75k这一过滤标准,不符合该标准的SNP进行剔除。最终确定了2,536个第三类探针的SNP。
4、第四类探针的获得:
基于北京黑猪的芯片数据和肉质表型数据进行全基因组关联分析。肉质表型数据包括肌内脂肪、蛋白含量、水分含量、胶原蛋白含量、滴水损失、肉色、屠宰后24小时pH共7个性状。全基因组关联分析鉴定到的与肉质性状显著相关的位点,全部保留作为第四类探针。最终确定了31个第四类探针的SNP。
5、第五类探针的获得:
基于北京黑猪重测序数据,保留MAF≥0.1的SNP,得到第五类备选SNP。
对于尚无SNP的窗口,填充第五类探针,具体方法如下:1)若该窗口里有大于等于2个的备选SNP,选取距离该窗口中点最近的SNP;2)若该窗口只有1个SNP,则该SNP直接成为目标SNP。3)若该窗口无第五类探针的备选SNP,则放宽标准,使用MAF≥0.05的SNP进行填充。
最后,基于北京黑猪重测序数据,在考虑均匀的基础上,挑选位于Y染色体非同源区域MAF≥0.05的SNP,共计挑选了15个SNP。这些SNP仅用于当表型的性别信息未知时,对北京黑猪进行性别鉴定。
综上,最终确定23,160个第五类探针的SNP。
将筛选好的SNP位点交给Illumina公司由Infmium iSelect打分系统(http://www.illumina.com/)打分,将基因内分值<0.7和基因间<0.9的位点去掉。对于删掉的不合格的SNP位点,选取距离其最近的SNP位点进行补充,并且再次进行打分。按照以上步骤鉴定和筛选,最后共获得49,963个SNP位点。按照Illumina Infmium iSelect HD设计要求需要49,963种微珠(beads)。所有49,963个SNP位点为SEQ ID NO:1-49,963所示的49,963条DNA序列。将这些标签序列交由Illumina公司设计制作Infmium SNP芯片。芯片位点在各染色体分布数量见 表1。
该款50K SNP芯片具有三个优点:一是具有经济性状的功能相关性。芯片搜集并确定了大量与猪肉质性状、生长性状、繁殖性状及健康性状等相关的显著位点,增加了芯片的实用性;二是筛选位点时基于北京黑猪重测序数据,保证所选位点有较高的多态性(SNP位点的MAF分布见图1),且位点分布均匀(相邻SNP位点的距离见图2),保证了育种值估计的准确性;三是具有特异性,芯片位点专门针对于北京黑猪这一品种进行设计,选取了北京黑猪与商业猪种有较大差异的位点,可以特异性鉴定北京黑猪与其他猪种。
表1芯片位点在各染色体分布数量
染色体 | SNP位点数量 | 染色体 | SNP位点数量 | 染色体 | SNP位点数量 |
1 | 5,736 | 8 | 2,906 | 15 | 2,936 |
2 | 3,176 | 9 | 2,917 | 16 | 1,671 |
3 | 2,777 | 10 | 1,448 | 17 | 1,328 |
4 | 2,731 | 11 | 1,654 | 18 | 1,170 |
5 | 2,184 | 12 | 1,291 | X | 2,595 |
6 | 3,569 | 13 | 4,352 | Y | 15 |
7 | 2,543 | 14 | 2,964 | 总计 | 49,963 |
实施例2北京黑猪分子育种50K SNP芯片在全基因组关联分析中的应用
使用本发明实施例1提供的北京黑猪分子育种50K SNP芯片对北京黑猪做基因型检测,获取基因型数据。对北京黑猪肌内脂肪性状和北京黑猪的胴体重性状进行测定,获取表型数据。
利用Beagle软件对芯片数据进行自身填充,再利用PLINK软件对其进行质量控制,质控标准为①个体基因型频率>0.95;②SNP检出率(SNP call rate)>0.95;③最小等位基因频率(MAF)>0.05;④哈代-温伯格平衡检验P值>10
-6;质控后得到的SNP位点信息,用于后续全基因组关联分析。
使用四分位检验法剔除肌内脂肪性状和胴体重表型性状的异常值。
使用GEMMA软件基于线性混合模型进行全基因组关联分析。线性混合模型的表达式为:
y=Xα+Yβ+Zγ+e
y是肌内脂肪表型向量,α为SNP标记效应向量,X是对应于α的关联矩阵,编码为0、1、2,β为非遗传固定效应向量,包含群体均值、性别、胴体重,Y 是对应于β的关联矩阵,γ是剩余多基因效应向量,服从正态分布
G是基因组亲缘关系矩阵,
是加性遗传方差,Z是对应于γ的关联矩阵,e为残差向量,服从
I为单位矩阵,
是随机残差。
显著性检验采用Wald检验,以p<1×10
-5作为潜在全基因组显著水平的阈值,得到的曼哈顿结果如图3所示。结果显示,位于1号染色体上的全基因组显著关联位点可能是肌内脂肪这一性状的调控位点。
实施例3北京黑猪分子育种50K SNP芯片进行品种鉴定
使用本发明实施例1提供的北京黑猪分子育种50K SNP芯片对22头北京黑猪(BJB)、22头杜洛克猪(DU)、16头大白猪(LW)、5头长白猪(LD)、5头马身猪(MS)、5头淮南猪(HN)、5头蓝塘猪(LT)、5头陆川猪(LC)和5头民猪(MIN)共计9个品种90头猪提取的DNA进行基因型检测。
使用PLINK软件对芯片数据进行质量控制,质控标准为①个体基因型频率>0.95;②SNP检出率(SNP call rate)>0.95;③最小等位基因频率(MAF)>0.05;④哈代-温伯格平衡检验P值>10
-6;质控后得到的SNP位点信息,用于后续品种鉴定分析。
使用PLINK软件计算两两个体间的Identity by State(IBS)值,得到IBS距离矩阵。并基于IBS距离矩阵,使用PHYLIP软件的邻接法构建系统发育树,最后通过Figtree软件可视化系统发育树。系统发育树结果如图4所示。结果显示,各个猪种可以明显的区分开,可以用于品种鉴定。此外,3个商业猪种(杜洛克猪、大白猪和长白猪)处于一个大的进化枝,而所有中国地方品种处于另一个大的进化枝,北京黑猪位于这两个主要进化枝之间的中间位置,这与北京黑猪的培育历史一致。该结果表明,本发明提供的芯片能够很好地应用于北京黑猪的遗传分类和进化分析,鉴定结果准确可靠。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
本发明提供一种用于北京黑猪基因分型的SNP分子标记组合、芯片及其制备方法与应用。本发明用于北京黑猪基因分型的SNP分子标记组合,由49,963个SNP分子标记组成,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-49,963所示。应用该分子标记组合可制备北京黑猪分子育种芯片,并可进一步应用于特异性鉴定北京黑猪与其他猪种(欧洲商业猪种、中国地方猪种)、目标性状QTL、关联位点及候选基因鉴定、亲缘关系鉴定和家系划分等方面,具有较好的经济价值和应用前景。
Claims (10)
- 用于北京黑猪基因分型的SNP分子标记组合,其特征在于,由49,963个SNP分子标记组成,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-49,963所示。
- 权利要求1所述的SNP分子标记组合在制备北京黑猪分子育种芯片中的应用。
- 一种北京黑猪分子育种50K SNP芯片,其特征在于,包含1-49,963个SNP分子标记,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-49,963所示。
- 如权利要求1所述的用于北京黑猪基因分型的SNP分子标记组合或权利要求3所述的北京黑猪分子育种50K SNP芯片,其特征在于,所述SNP分子标记的SNP位点位于SEQ ID NO.1-49,963所示的核苷酸序列的第71位。
- 一种制备权利要求3所述的北京黑猪分子育种50K SNP芯片的方法,其特征在于,包括以下步骤:步骤①:第一类探针的获得:使用中芯一号PLUS猪育种芯片检测北京黑猪群体,对芯片数据进行质控,质控标准为:剔除SNP检出率<95%、最小等位基因频率<0.1、哈代-温伯格平衡检验P值<10 -6以及没有染色体位置信息的SNP位点;将中芯一号PLUS猪育种芯片位置信息从Sus scrofa 10.2版本转为Sus scrofa 11.1版本参考基因组,得到第一类备选SNP;步骤②:第二类探针的获得:结合公共数据库NCBI和QTLdatabase获得与猪肉质性状、生长性状、繁殖性状及健康性状相关候选基因内部及上下游SNP位点、全基因组关联分析和QTL结果显著SNP,并基于北京黑猪重测序数据,剔除MAF<0.05的位点,得到第二类备选SNP;步骤③:第三类探针的获得:基于北京黑猪、大白猪与长白猪的重测序数据,筛选北京黑猪与大白猪、长白猪的绝对等位基因频率差异均大于等于0.6的位点,并基于北京黑猪重测序数据,剔除MAF<0.05的位点, 得到第三类备选SNP;步骤④:第四类探针的获得:使用中芯一号PLUS猪育种芯片检测北京黑猪群体,基于北京黑猪的芯片数据和肉质表型数据进行全基因组关联分析,肉质表型数据包括肌内脂肪、蛋白含量、水分含量、胶原蛋白含量、滴水损失、肉色和屠宰后24小时pH值;由全基因组关联分析鉴定到的与肉质性状显著相关的位点,作为第四类备选SNP;步骤⑤:第五类探针的获得:基于北京黑猪重测序数据,保留MAF≥0.1的SNP,得到第五类备选SNP;步骤⑥:将常染色体与X染色体分为48kb一个窗口,每个窗口按照第一类至第五类探针的优先级,选择1个SNP填充;步骤⑦:将筛选好的SNP位点由Infmium iSelect打分系统打分,将基因内分值<0.7和基因间分值<0.9的位点去掉;对于删掉的不合格的SNP位点,选取距离其最近的SNP位点进行补充,并且再次进行打分,直至全部位点合格,之后将获得的标签序列用于SNP芯片的制作。
- 权利要求1所述的用于北京黑猪基因分型的SNP分子标记组合或权利要求3所述的北京黑猪分子育种50K SNP芯片在北京黑猪全基因组关联分析中的应用。
- 如权利要求6所述的应用,其特征在于,在进行北京黑猪全基因组关联分析中,应用权利要求3所述的北京黑猪分子育种50K SNP芯片对北京黑猪进行基因型检测,并测定相关表型性状,基于线性混合模型进行全基因组关联分析,线性混合模型的表达式为:y=Xα+Yβ+Zγ+ey是表型向量,α为SNP标记效应向量,X是对应于α的关联矩阵,编码为0、1、2,β为非遗传固定效应向量,Y是对应于β的关联矩阵,γ是剩余多基因效应向量,服从正态分布 G是基因组亲缘关系矩阵, 是加性遗传方差,Z是对应于γ的关联矩阵,e为残差向量,服从 I为单位矩阵, 是随机残差。
- 权利要求1所述的用于北京黑猪基因分型的SNP分子标记组合或权利要求3所述的北京黑猪分子育种50K SNP芯片在北京黑猪品种鉴定中的应用。
- 如权利要求8所述的应用,其特征在于,在进行未知品种的猪的鉴定时,应用权利要求3所述的北京黑猪分子育种50K SNP芯片对所述未知品种的猪进行基因型检测,与已知确定为北京黑猪的芯片数据进行合并,使用PLINK软件对芯片数据质控和计算个体间的IBS距离矩阵,并基于IBS距离矩阵,使用PHYLIP软件的邻接法构建系统发育树,最后通过Figtree软件可视化系统发育树,判断所述未知品种的猪是否为北京黑猪,从而进行品种鉴定。
- 权利要求1所述的用于北京黑猪基因分型的SNP分子标记组合或权利要求3所述的北京黑猪分子育种50K SNP芯片在北京黑猪育种中的应用。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022104330804 | 2022-04-22 | ||
CN202210433080 | 2022-04-22 | ||
PCT/CN2022/115226 WO2023201950A1 (zh) | 2022-04-22 | 2022-08-26 | 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117500943A true CN117500943A (zh) | 2024-02-02 |
Family
ID=88419026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280003541.2A Pending CN117500943A (zh) | 2022-04-22 | 2022-08-26 | 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117500943A (zh) |
WO (1) | WO2023201950A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117965760A (zh) * | 2024-03-29 | 2024-05-03 | 中山大学 | 一种猪肉质性状选育的snp芯片及其制备方法和应用 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117802249A (zh) * | 2024-03-01 | 2024-04-02 | 中国海洋大学三亚海洋研究院 | 一种东星斑全基因组snp芯片的制备方法及应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170159122A1 (en) * | 2014-03-28 | 2017-06-08 | Kunming Institute of Zoology, Chinese Acadermy of Sciences | Methods and kits for detecting genetic markers for litter size in pigs |
KR101941893B1 (ko) * | 2016-11-15 | 2019-01-25 | 대한민국(농촌진흥청장) | 돼지의 육질 형질 판단용 유전자 마커 및 이의 이용 |
WO2019113818A1 (zh) * | 2017-12-13 | 2019-06-20 | 中国农业大学 | 猪全基因组50k snp芯片及应用 |
CN110106261B (zh) * | 2019-05-30 | 2020-11-24 | 浙江大学 | 嘉兴黑猪及生肉制品的snp标记组合和鉴定方法 |
CN110229914B (zh) * | 2019-06-17 | 2022-04-26 | 中国农业科学院北京畜牧兽医研究所 | 一种影响猪肌纤维直径的snp分子标记及其应用 |
CN113981109A (zh) * | 2021-12-03 | 2022-01-28 | 北京康普森农业科技有限公司 | 用于猪亲缘关系鉴定的snp分子标记组合、应用及方法 |
-
2022
- 2022-08-26 WO PCT/CN2022/115226 patent/WO2023201950A1/zh active Application Filing
- 2022-08-26 CN CN202280003541.2A patent/CN117500943A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117965760A (zh) * | 2024-03-29 | 2024-05-03 | 中山大学 | 一种猪肉质性状选育的snp芯片及其制备方法和应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2023201950A1 (zh) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110191965B (zh) | 猪全基因组50k snp芯片及应用 | |
CN113039288B (zh) | 一种蛋鸡全基因组snp芯片及其应用 | |
WO2019071407A1 (zh) | 一种鸡全基因组snp芯片及其应用 | |
CN117500943A (zh) | 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 | |
CN104561367B (zh) | 一种影响猪脂肪沉积性状的snp及其应用 | |
Wang et al. | Genome-wide association study of 8 carcass traits in Jinghai Yellow chickens using specific-locus amplified fragment sequencing technology | |
CN108410994A (zh) | 一种影响湖羊产羔性状的snp标记及其应用 | |
CN106906303B (zh) | 一个影响猪肉品质性状的snp标记及其应用 | |
CN111910008A (zh) | 一种鸡生长发育相关的分子标记及其应用 | |
CN111926086B (zh) | 一种影响鸡体斜长的分子标记及其应用 | |
Liu et al. | Design and evaluation of a custom 50K Infinium SNP array for egg-type chickens | |
CN114292928A (zh) | 一种与母猪繁殖性状有关的分子标记及筛选方法和应用 | |
CN114941033A (zh) | 一种基于snp位点辅助培育地方优质白羽鸡高产蛋品系的方法 | |
CN114150070A (zh) | 与鸡生长及屠宰性状相关的snp分子标记、检测引物、试剂盒及育种方法 | |
CN113699246B (zh) | 一种影响猪饲料转化效率性状的snp分子标记及其用途 | |
CN110295236A (zh) | 猪饲料转化率的snp分子遗传标记 | |
US20240043912A1 (en) | Genomic selection (gs) breeding chip of huaxi cattle and use thereof | |
CN116814805A (zh) | 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用 | |
Flórez et al. | Genome-wide association study using the Bayes C method for important traits in dairy yield in Colombian Holstein Cattle | |
CN114350818B (zh) | 与番鸭产蛋性状相关的催乳素基因snp分子标记及其应用 | |
CN114292927B (zh) | 与母猪产仔均匀度相关的分子标记及其获得方法和应用 | |
CN114752678B (zh) | 与猪达115公斤体重背膘厚相关的snp分子标记及其应用 | |
CN116144792A (zh) | 一种与猪背膘厚相关的snp分子标记及应用 | |
CN113699247B (zh) | 一种猪1号染色体上与猪剩余采食量相关的snp分子标记及其用途 | |
CN114317772A (zh) | 一种用于鉴定鸡高产性能的分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |