一种与猪初配日龄性状相关的SNP分子标记
技术领域
本发明属于猪分子标记筛选技术领域,具体涉及一种与猪初配日龄性状相关的SNP分子标记及其应用。本发明的分子标记可用于猪初配日龄性状的辅助预测与选择。
背景技术
繁殖性状是猪场的重要经济性状之一,直接影响规模化猪场的经济效益,而母猪的初配日龄是一个影响繁殖性状的重要因素(简运华等2017)。有研究表明,配种过早,后背母猪体成熟及性成熟程度不高,不仅影响其自身的发育,而且还会造成产仔数少,仔猪弱小,母猪难产几率增加;配种过晚则会造成后备母猪躁动不安,影响其正常的生理活动(舒邓群等1995)。因此,为了提高母猪的繁殖性能,掌握合适的配种日期是非常重要的工作。而且张文博等(2001)报道,淘汰1~2胎的母猪比7胎后淘汰的母猪所产每头仔猪成本分别增加21%和10%。李俊柱(2001)报道,初配日龄低于230天的年死淘率为35%,初配日龄在230~269天的年死淘率为26%,初配日龄大于269天的年死淘率为32%。刘德武等(2006)研究结果表明,初配日龄小于209天的母猪使用寿命较长,初配日龄在240~269天的母猪容易发生繁殖疾病而过早淘汰。为了猪场的效益,提高对猪初配日龄的研究是十分重要的一项工作。
全基因组关联分析(Genome-wide Association Study,GWAS)是利用高通量基因分型技术,分析数以万计的单核苷酸多态性(single nucleotide polymorphism,SNP)以及这些SNP与临床表现和可测性状的相关性。在全基因组层面上开展大样本的、多中心的、重复验证技术,并对相关基因与复杂性状进行关联分析,从而揭示出不同复杂性状的遗传机制和基础(宋志芳等2018)。全基因组关联分析已经被广泛应用于各类研究其中包括人类疾病以及家畜重要经济性状等(Visscher P M et al.,2012)。
本发明通过采集来自中国南部某种猪场的786头丹系大白猪耳组织,提取基因组DNA并进行质量检测,由GeneSeek Porcine 50K SNP高密度芯片进行基因分型后得到基因型数据和其对应表型数据,使用R语言的MVP包,采用FarmCPU模型(Liu X et al.,2016),筛选出与大白猪初配日龄相关的SNP分子标记,为大白猪初配日龄性状的预测提供了新的分子标记基础,对猪的育种与繁殖具有重要意义。
本发明筛选的SNP分子标记与大白猪的初配日龄的相关性达到显著水平,为猪的初配日龄性状的相关研究提供新的资源。
发明内容
本发明的目的在于克服现有技术的缺陷,筛选一种与猪初配日龄性状相关的分子标记,通过GeneSeek Porcine 50K SNP高密度芯片进行基因分型得到SNP分型数据,使用全基因组关联分析(GWAS)筛选得到与猪初配日龄性状显著相关的SNP,为猪初配日龄性状的预测提供新的方法。
本发明的技术方案如下所述:
申请人通过采集来自中国南部某种猪场的大白猪耳样,提取基因组DNA并进行质量检测,再用GeneSeek Porcine 50K SNP高密度芯片进行基因分型,得到的SNP分型数据,参阅Ensembl数据库,得到登陆号为rs81253440片段上、下游各50bp的核苷酸序列,该片段的核苷酸序列如序列表SEQ ID NO:1所示。具体如下所述:
TGGGCATTTTTCAAGTAAACGGATCTTCACTGCTTCATCTCTTTTTTTCCK(G/T)ACTTCCTCTCTTGACTTCTCAGCCAGGCTCTTGCTCTTTATTTCCAGCTG,
在上述序列的第51位碱基处的K为G/T的等位基因突变(碱基替换),该突变(替换)使上述序列即SEQ ID NO:1所述的序列产生核苷酸多态性。
该分子标记可以作为预测丹系大白猪初配日龄的分子标记,当SEQ ID NO:1上的第51位核苷酸为T时,则猪的初配日龄可能会增加。
上述序列可以作为选育猪初配日龄性状的分子标记。
申请人提供了一种筛选猪初配日龄性状相关的SNP分子标记的方法,所述的方法包括如下步骤:
申请人筛选得到一种与猪的初配日龄性状相关的SNP分子标记,该分子标记的核苷酸序列如下所示:
TGGGCATTTTTCAAGTAAACGGATCTTCACTGCTTCATCTCTTTTTTTCCK(G/T)ACTTCCTCTCTTGACTTCTCAGCCAGGCTCTTGCTCTTTATTTCCAGCTG,
上述序列的第51位碱基处的K为G或T的碱基替换,该替换(突变)引起所述序列的多态性。
基于一种与猪初配日龄相关的SNP分子标记,当SEQ ID NO:1所示序列的第51位核苷酸为T时,判定猪初配日龄性状为增加。
本发明的SNP分子标记可用于猪初配日龄性状的检测分析中。
本发明的具体步骤为:
①通过采集来自中国南部某种猪场的丹系大白猪耳样,提取基因组DNA并进行质量检测,由GeneSeek Porcine 50K SNP高密度芯片进行基因分型得到SNP分型数据。
②统计来自中国南部某种猪场786头丹系大白猪的表型数据,并将初配日龄作为表型。
③采用FarmCPU模型,利用R语言下的MVP包中的FarmCPU模型进行全基因组关联分析(GWAS)。具体模型如下:yi=Mi1b1+Mi2b2+...+Mitbt+Sijdj+ei(1)其中yi是第i个个体的性状观测值;Mi1,Mi2,...,Mit是t个加入到模型的可能关联位点的基因型,第一个迭代的时候这部分为空;b1,b2,...,bt是加入到模型中的可能关联位点的相应效应值;Sij是第i个个体第j个遗传标记的基因型;dj是Sij的相应效应值;ei是残差向量;yi=ui+ei(2)yi是第i个个体的性状观测值;ui是第i个个体的总遗传效应;ei是残差向量模型(2)产生可能的关联位点作为协变量加在模型(1)中进行迭代运算直至停止。
本发明筛选的分子标记可应用于非诊断目的的对猪初配日龄相关基因的基因型或相关性状的关联分析中,为猪初配日龄的分子标记辅助选择提供新的分子标记资源。
本发明与现有技术相比具有的有益效果:
本发明可通过在体外采用基因芯片技术检测猪的基因型,作为非诊断目的缩短猪初配日龄,与目前常规的PCR-RFLP等方法相比,本发明具有简单、快捷和灵敏度高等优点。
更为详细的技术方案请参见《具体实施方式》。
附图说明
图1:本发明的总体技术流程示意图。
图2:本发明筛选的分子标记即登陆号为rs81253440片段上下游各50bp核苷酸序列和本发明分子标记的核苷酸序列。附图标记说明:图2所示核苷酸标记的第51位碱基处存在一个G/T的等位基因突变(碱基替换)(片段中51bp处的英文字母“K”为突变位点)
图3:本发明全基因组关联分析的曼哈顿图。附图标记说明:研究对象是猪初配日龄性状,黑色圆圈及箭头指向的标记为本发明筛选的分子标记,该标记位于猪第9号染色体上。
具体实施方式
对序列表的说明:
SEQ ID NO:1是本发明筛选的与丹系大白猪初配日龄性状相关联的分子标记的核苷酸序列,序列长度为101bp,在该序列的第51bp处存在一个等位基因突变(即G/T,序列表SEQ ID NO:1中51bp处的碱基是突变后的碱基T),该突变(替换)引起SEQ ID NO:1所示的核苷酸序列产生多态性。
实施例1:基因分型及检测
(1)通过采集来自中国南部某种猪场的丹系大白猪耳样,提取基因组DNA(按常规方法货采用商购试剂盒)并进行质量检测,由GeneSeek Porcine 50K SNP高密度芯片进行基因分型得到SNP分型数据。
使用Plink1.9软件将原始数据转换为VCF格式,随后使用该软件对VCF格式文件进行质控,具体为:
1)maf 0.01:去除最小等位基因频率小于1%的SNP位点;
2)geno 0.1:剔除基因型检出率小于90%的SNP位点;
3)mind 0.1:剔除基因型缺失率大于10%的个体;
4)hwe le-6:剔除哈代温伯格平衡检验P值小于10-6的SNP位点,
5)使用beagle 4.1软件对质控后的芯片数据进行缺失基因型填充,件命令如下:
java-jar-Xmx8g beagle.jar gt=qc.file.vcf out=example.impute
(2)对基因型数据进行检测分析,最终有786个个体和34590个SNP用于全基因组关联分析。
实施例2:猪初配日龄性状进行全基因组关联分析中的方法
用于与基因型关联分析的丹系大白猪初配日龄的表型数据来自中国南部某种猪场,总计786个个体。采用FarmCPU模型,利用R语言下的MVP包中的FarmCPU模型进行全基因组关联分析(GWAS)。具体模型如下:yi=Mi1b1+Mi2b2+...+Mitbt+Sijdj+ei(1)其中yi是第i个个体的性状观测值;Mi1,Mi2,...,Mit是t个加入到模型的可能关联位点的基因型,第一个迭代的时候这部分为空;b1,b2,...,bt是加入到模型中的可能关联位点的相应效应值;Sij是第i个个体第j个遗传标记的基因型;dj是Sij的相应效应值;ei是残差向量;yi=ui+ei(2)yi是第i个个体的性状观测值;ui是第i个个体的总遗传效应;ei是残差向量
模型(2)产生可能的关联位点作为协变量加在模型(1)中进行迭代运算直至停止。
本发明全基因组关联分析显著水平见表1。
表1登陆号为rs81253440片段的全基因组关联分析显著水平
表1说明:显著标记水平为P值<0.05/34590(Bonferroni校正)
实施例3:登陆号rs81253440片段的分子标记分型方法在猪初配日龄性状关联分析中的应用
/rs81253440分子标记(序列表SWQ ID NO:1)与猪初配日龄性状关联分析:
使用混合线性模型(MLM)进行rs81253440分子标记与猪初配日龄性状的关联分析。具体模型如下:
yijklmn=μ+Gi+HYSj+IDm+εijklmn
其中,yijklmn是第m个个体初配日龄性状表型值;μ是群体均值;Gi是基因型效应、HYSk是出生场别、出生年份和出生季节联合效应(固定效应);IDm是个体加性效应(随机效应),εijklmno是模型残差效应,使用F检验对初配日龄性状在三种基因型个体间的差异进行显著性分析,分析结果见表2。
表2登陆号rs81253440片段的多态性
表2说明:P<0.05为差异显著;P<0.01为差异极显著。
由表2可知,对于基因型为GG的个体来说,其初配日龄越小;而对于基因型为TT的个体而言,其初配日龄可能越大。在采用FarmCPU模型的全基因组关联分析中,rs81253440标记达到了全基因组显著水平,说明该标记不仅与猪的初配日龄性状显著相关,且当该标记突变(替换)为T时,不利于猪拥有较小的初配日龄,会对生产效益造成影响。
序列表SEQ ID NO:1是本发明分子标记rs81253440片段上下游各50bp的核苷酸序列。该片段就是本发明筛选的分子标记。序列长度为101bp,在该序列的第51位碱基处存在一个G/T的等位基因突变。
主要参考文献:
[1]简运华,李结,谢水华.初配日龄对丹系种猪繁殖性能的影响[J].养猪,2017(3):39-40.
[2]舒邓群,黄爱民,姚文海,等.初配月龄对长白母猪头胎繁殖性能的影响[J].养猪,1995(3):22.
[3]张文博,韩建春译,郗伟斌校.猪舍环境及管理因素对后备母猪发育和利用年限的影响[J].养猪,2001(3):8-11.
[4]李俊柱.母猪初配日龄对其生产性能影响的分析[J].养猪,2001(3):14.
[5]刘德武,吴珍芳,欧阳明明.二元杂母猪初配年龄与繁殖性能和使用寿命的关系[J].养猪,2006(1):20-22.
[6]宋志芳,石岗,赵海燕.基于SNP芯片技术对猪性状的应用及其研究进展[J].猪业科学,2018,35(04):116-117.
[7]Visscher P M,Brown M A,McCarthy M I,et al.Five years of GWASdiscovery[J].The American Journal of Human Genetics,2012,90(1):7-24.
[8]Yuan Wang,Xiangdong Ding,Zhen Tan,et al.Genome-Wide AssociationStudy of Piglet Uniformity and Farrowing Interval[J].Frontiers in Genetics,2017.00194。
序列表
<110> 华中农业大学
<120> 一种与猪初配日龄性状相关的SNP分子标记
<141> 2019-12-27
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 101
<212> DNA
<213> 猪(Sus scrofa)
<220>
<221> gene
<222> (1)..(101)
<220>
<221> mutation
<222> (51)..(51)
<400> 1
tgggcatttt tcaagtaaac ggatcttcac tgcttcatct ctttttttcc tacttcctct 60
cttgacttct cagccaggct cttgctcttt atttccagct g 101