一种与猪总乳头数性状相关的分子标记及应用
技术领域
本发明属于猪分子标记筛选技术领域,具体涉及一种与猪总乳头数性状相关的分子标记及应用。所述的分子标记可用于猪总乳头数性状的标记辅助选择。
背景技术
乳头数性状是影响母猪繁殖性能和仔猪生存的重要性状(Wang L,etal.Genotyping by sequencing reveals a new locus for pig teat number[J].Animalgenetics,2017,48(4):470-472.)。在传统的猪育种中,对性状的选择多集中于产仔数性状,如窝总产仔数、产活仔数、5天存活仔猪数和21天断奶仔猪数等。在过去的十几年中,传统的选育方法持续对产仔数进行高强度选择,已经使产仔数得到了显著增加。截止2013年,丹麦纯种大白的平均窝产仔数已达到14头(Nielsen B,et al.Selection for increasednumber of piglets at d 5after farrowing has increased litter size and reducedpiglet mortality[J].Journal of animal science,2013,91(6):2575-2582.)。然而,产仔数的提高并没有使乳头数得到相应的提高,乳头数的不足可能会影响仔猪的存活率和健康状况,因而有研究者提出,现阶段遗传改良应着力提升猪乳头数性状,以充分满足仔猪的营养需求(Chalkias H.Genetic and clinical studies of teat traits in the pig[M].2013.)。对美系大白猪总乳头数性状遗传参数估计的研究表明,该性状遗传力多在0.40~0.43之间,属于中等遗传力的性状。中等的遗传力表明通过选育对美系大白猪总乳头数性状进行改良具有较大的空间,可以得到比较理想的育种效果。随着高通量测序技术的不断发展,在家畜的全基因组范围内已经检测出大量的遗传标记,这使得以表型数据和基因型数据关联为基础的全基因组关联分析(Genomic wide association study,简称GWAS)在家畜经济性状、疾病抗性等复杂性状遗传研究中得到广泛的应用(王继英等,全基因组关联分析在畜禽中的研究进展[D],2013;尹建良等,猪全基因组关联分析研究进展及展望[J],中国猪业,2017,12(10):32-36.;乔贤等,全基因组关联分析在畜禽重要经济性状中的研究进展[J].家畜生态学报,2017,38(10):1-9.;赵德胜等,家畜全基因组关联分析研究进展[J],中国畜牧兽医,2018,45(02):463-470)。GWAS分析在全基因组范围内寻找与目标性状显著关联的SNP位点,并通过连锁不平衡分析进一步确定候选基因,为解析复杂数量性状的遗传基础提供了有效的分析手段。
目前,对于美系大白猪总乳头数性状的GWAS分析的研究缺失,仅有少量的非美系大白猪乳头数的GWAS研究(Tang J,et al.Identification of loci affecting teatnumber by genome-wide association studies on three pig populations[J].Asian-Australasian journal of animal sciences,2017,30(1):1.;Rohrer G A,etal.Genetic analysis of teat number in pigs reveals some developmentalpathways independent of vertebra number and several loci which only affect aspecific side[J].Genetics Selection Evolution,2017,49(1):4.;Tan C,etal.Genome-wide association study and accuracy of genomic prediction for teatnumber in Duroc pigs using genotyping-by-sequencing[J].Genetics SelectionEvolution,2017,49(1):35.;Lopes M S,et al.A genome-wide association studyreveals dominance effects on number of teats in pigs[J].PloS one,2014,9(8):e105867.;Duijvesteijn N,et al.High-resolution association mapping of numberof teats in pigs reveals regions controlling vertebral development[J].BMCgenomics,2014,15(1):542.)。美系大白猪群体与其他品系大白猪群体由于驯化历史差异等,其遗传背景可能与其他品系群体存在较大差异,因而影响其总乳头数性状的重要数量遗传位点(QTL)的分布和频率也可能与其他品系大白猪群体不同。对于美系大白猪总乳头数性状进行全基因组关联分析,将是实现关键基因的定位,有助于解析美系大白猪总乳头数性状的遗传基础和分子机制提供研究基础。
发明内容
本发明的目的在于克服现有技术的缺陷,筛选得到一种与猪乳头数性状(或称总乳头数性状)相关的分子标记及其应用,利用50K的基因芯片对SNP进行分型,并使用GWAS方法筛选与猪(优选为美系大白猪)总乳头数关联的SNP标记(H3GA0022648),为猪的遗传育种提供了新的分子标记资源和标记辅助选择应用基础。
具体地,本发明利用MVP软件(X Liu et al.Iterative Usage of Fixed andRandom Effect Models for Powerful and Efficient Genome-Wide AssociationStudies[J].Plos Genetics,2016,12(2):e1005767.)和混合线性模型(Mixed linearmodel,MLM)进行GWAS分析,筛选出与总乳头数显著关联的SNP位点,为美系大白猪乳头数性状DNA标记辅助选择和全基因组选择的开展提供了新的遗传基础。
本发明的技术方案如下所述:
申请人通过基因分型技术并参阅Ensembl数据库,得到登陆号为H3GA0022648基因(片段)上下游100bp的核苷酸序列,该序列与猪总乳头数性状关联,可作为分子标记的核苷酸序列如下所示:
ATAATCTATGCAGTTTATTTTATTTATTCATAACCTGTTTATGTGATGTATATTTAACTACAGCTAAAAAACTGGCCCATTAAAAGAGGTCCATTAGGGCR(A/G)TTCCCTGGTCATCCAGTGCTTCAGATTTGGCACTTTCACCACTGTGCCTGGGAACTGAATTTCCACATTAAGCTGCTGCATACTGCTGCCAAAAAAAAAA,
上述序列中第101位碱基处的R是A或G,该等位基因的突变导致上述序列产生了核苷酸多态性。
进一步,当所述序列的第101位的核苷酸为A时,判定猪比核苷酸为G时的序列具有更多的总乳头数。
作为优选方案,所述的猪品种为美系大白猪。
本发明筛选的分子标记可在猪总乳头数性状标记辅助选择中的应用。优选应用的猪品种为美系大白猪。
一种筛选与猪总乳头数性状相关SNP分子标记的方法,包括如下步骤:
①提取美系大白组织样总DNA,并对DNA进行质量检测;
②利用基因芯片技术进行分型;
③美系大白总乳头数性状需要利用传统的最佳线性无偏估计方法(Best LinearUnbiased Prediction,BLUP),采用场别、年份和季节的联合效应、性别、出生胎次作固定效应,个体作随机效应,计算个体随机效应与残差效应之和,作为校正后表型(Correctedphenotypes,)用于后续GWAS分析。
④利用R统计环境下MVP软件包中的MLM模型进行全基因组关联分析(GWAS)。
⑤对MLM模型筛选出来的显著SNP位点与美系大白总乳头数进行关联分析。
本发明筛选的分子标记可用于非诊断目的对猪(优选品种为美系大白猪)相关基因或基因型与美系大白猪总乳头数的关联分析中。
本发明提供了一个新的分子标记,可用于猪,优选为美系大白猪总乳头数性状的分子标记辅助选择。
与现有技术相比本发明具有的有益效果:
本发明可通过在体外采用基因芯片技术检测猪的基因型,作为非诊断目的的评价猪的乳头数,与目前的PCR-RFLP等方法相比,本发明具有简单、快捷、灵敏度高和特异性好等突出优点。
更详细的技术方案参见《具体实施方式》。
附图说明
图1:本发明的总体技术流程示意图。
图2:是本发明克隆的H3GA0022648上下游100bp核苷酸序列和本发明分子标记的核苷酸序列。附图标记说明:在图2显示核苷酸序列长度为201bp,在该序列的第101位碱基处存在一个A/G等位基因突变(101bp处的英文字母“R”为突变位点)。
图3:是本发明曼哈顿图。附图标记说明:研究的是美系大白总乳头数性状,黑色圆圈及箭头指向标记的为本发明筛选的分子标记,该标记位于猪第7号染色体上。
具体实施方式
本发明中的序列信息和全基因组关联分析结果,基于猪基因组11.2版本。
序列表SEQ ID NO:1是本发明筛选的用于猪总乳头数性状检测的分子标记的核苷酸序列(序列表中序列的第101bp处是突变后的碱基G,如图2所显示序列有差异,但是是同一段序列,其表述形式有不同),在该序列的第101bp处存在一个等位基因的突变(即101A到101G的突变),该突变导致该分子标记所示的核苷酸序列产生了多态性。
实施例1:基因分型检测
(1)利用磁珠法基因组提取试剂盒自动提取美系大白猪(来源于华中农业大学实验猪场)组织样总DNA,具体步骤为:
(1)取适量组织样至1.5mL离心管中;
(2)向离心管中加入500μL裂解液和5μL蛋白酶K(20mg/mL),振荡混匀30秒后,置于65℃烘箱或金属浴中,裂解30分钟~1小时;
(3)裂解完成后,取全部上清转移至深孔板(标记为①号),并向每个样孔中加入350μL异丙醇;
(4)将①号深孔板,置于核酸提取仪工位1上,将装有磁珠、洗涤液①、洗涤液②和③以及洗脱液的深孔板分别置于工位2~6上。打开仪器电源,待仪器完成自检后,按表1所示,设置仪器参数;
表1参数设计
(5)运行程序,程序结束后,仪器会自动停止,并且工位6会进入4℃保存程序,暂时保存样品;
(6)DNA样品可以直接用于下游试验,或封装后于4℃短暂保存数日。若要长时间保存,可以封装或转移至新的容器中,并置于-20℃冰箱中做长期保存。
(2)SNP基因型的判定及质量控制
使用GeneSeek Porcine 50K SNP芯片进行分型,用PLINK v1.9对获得的基因型数据进行质量控制,剔除检出率<90%、次等位基因频率(minor allele frequency,MAF)<0.05、偏离哈代温伯格(Hardy-Weinberg Equilibrium,HWE)<10-7的SNP标记和检出率<90%的个体,最终获得1793个个体和34613个SNP用于GWAS。
实施例2:H3GA0022648分子标记分型方法在美系大白猪总乳头数性状关联分析中的应用
(1)美系大白总乳头数性状表型预处理
美系大白猪总乳头性状需要利用混合线性模型(Mixed Linear Model,MLM),具体步骤为:采用场别、出生年份和出生季节的联合效应以及性别、出生胎次作固定效应,个体效应作随机效应,将模型估计出的有表型记录个体的估计育种值(Estimated breedingvalues,EBV)与对应的估计残差(residuals)加和,作为这些个体的校正后表型值(Corrected phenotypes,),用于后续GWAS分析。利用DMU统计环境下DMUAI模块进行约束最大似然估计(Restricted Maximum Likelihood,REML)和BLUP分析,系谱中包含10060个个体。具体模型如下:
yijklm=μ+HYSi+Sexj+Parityk+IDl+εijklm#
其中,yijklm是第个个体总乳头数性状原始表型值;μ是群体均值;HYSi是出生场别、出生年份和出生季节联合效应(固定效应);Sexj是性别效应(固定效应);Parityk是出生胎次效应(固定效应);IDl是个体加性效应(随机效应),模型有如下假定:个体效应服从正态分布:,表示个体加性遗传效应方差,表示个体间亲缘关系矩阵;εijklm是模型残差效应,假定服从正态分布:,表示残差方差,为相应的单位关联矩阵。
(2)美系大白猪总乳头数全基因组关联分析(GWAS)
用于基因型与总乳头数性状关联分析所用的试验猪群是美系大白猪(来源于华中农业大学实验猪场)。基因分型所用的DNA由纯种美系大白猪组织样中提取。基于多标记关联模型的方法,利用R统计环境下MVP软件包中的MLM模型进行GWAS分析。具体的模型如下:
其中,是根据混合线性模型计算出的有基因型个体的校正后表型;1表示元素为1的向量;是整体均数;表示SNP含量矩阵(0表示AA型,1表示AB型,2表示BB型);表示SNP标记加性效应向量;表示多基因效应关联矩阵;表示多基因效应,假定服从正态分布:,表示个体加性效应方差,表示基于基因型信息的基因组关系矩阵;是残差效应,假定服从正态分布:,
表示残差方差,为单位关联矩阵。
(3)H3GA0022648分子标记分型结果与总乳头数关联分析
使用混合线性模型(MLM)进行H3GA0022648分子标记与美系大白猪总乳头数的关联分析。具体模型如下:
yijlmn=μ+Gi+HYSj+Sexk+Parityl+IDm+9ijklmn
其中,y
ijklmm是第个个体总乳头数性状原始表型值;μ是群体均值;G
i是H3GA0022648分子标记基因型效应(固定效应);HYS
k是出生场别、出生年份和出生季节联合效应(固定效应);Sex
k是性别效应(固定效应);ID
m是个体加性效应(随机效应),假定服从正态分布:
表示个体效应方差,A表示个体间亲缘关系矩阵;ε
ijklmno是模型残差效应,服从正态分布:
表示残差方差,I为相应的单位关联矩阵。使用F检验对总乳头数性状在三种基因型个体间的差异进行显著性分析,分析结果见表2。
表2 H3GA0022648的多态性以及不同基因型对美系大白猪总乳头数性状的影响
表2说明:P<0.05为差异显著;P<0.01为差异极显著。
由表2可知,对于美系大白猪总乳头性状,基因型为AA的个体总乳头数性状极显著高于AG个体,基因型为AA的个体总乳头数性状显著高于GG个体,基因型为AG的个体总乳头数显著高于GG个体。
因此可以认为,A基因是有利于猪(优选为美系大白猪)总乳头数性状增加的等位基因。
主要参考文献:
1.Wang L,Zhang Y,Zhang T,et al.Genotyping by sequencing reveals a newlocus for pig teat number[J].Animal genetics,2017,48(4):470-472。
2.Nielsen B,Su G,Lund M S,et al.Selection for increased number ofpiglets at d 5after farrowing has increased litter size and reduced pigletmortality[J].Journal of animal science,2013,91(6):2575-2582。
3.Chalkias H.Genetic and clinical studies of teat traits in the pig[M].2013。
4.王继英等,全基因组关联分析在畜禽中的研究进展[D],2013。
5.乔贤等,全基因组关联分析在畜禽重要经济性状中的研究进展[J],家畜生态学报,2017,38(10):1-9。
6.赵德胜等,家畜全基因组关联分析研究进展[J],中国畜牧兽医,2018,45(02):463-470。
7.Tang J,et al.Identification of loci affecting teat number bygenome-wide association studies on three pig populations[J].Asian-Australasian journal of animal sciences,2017,30(1):1。
8.Rohrer G A,et al.Genetic analysis of teat number in pigs revealssome developmental pathways independent of vertebra number and several lociwhich only affect a specific side[J].Genetics Selection Evolution,2017,49(1):4。
9.Tan C,et al.Genome-wide association study and accuracy of genomicprediction for teat number in Duroc pigs using genotyping-by-sequencing[J].Genetics Selection Evolution,2017,49(1):35。
10.Lopes M S,et al.A genome-wide association study reveals dominanceeffects on number of teats in pigs[J].PloS one,2014,9(8):e105867。
11.Duijvesteijn N,et al.High-resolution association mapping of numberof teats in pigs reveals regions controlling vertebral development[J].BMCgenomics,2014,15(1):542。
12.Liu X,Huang M,Fan B,et al.Iterative Usage of Fixed and RandomEffect Models for Powerful and Efficient Genome-Wide Association Studies[J].Plos Genetics,2016,12(2):e1005767.v。
序列表
<110> 华中农业大学
<120> 一种与猪总乳头数性状相关的分子标记及应用
<141> 2019-09-04
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 201
<212> DNA
<213> 猪(sus scrofa)
<220>
<221> gene
<222> (1)..(201)
<220>
<221> mutation
<222> (101)..(101)
<400> 1
ataatctatg cagtttattt tatttattca taacctgttt atgtgatgta tatttaacta 60
cagctaaaaa actggcccat taaaagaggt ccattagggc gttccctggt catccagtgc 120
ttcagatttg gcactttcac cactgtgcct gggaactgaa tttccacatt aagctgctgc 180
atactgctgc caaaaaaaaa a 201