CN107287330B - 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法 - Google Patents

一种预测待测猪的初生窝重遗传性能的snp位点组合及方法 Download PDF

Info

Publication number
CN107287330B
CN107287330B CN201710630307.3A CN201710630307A CN107287330B CN 107287330 B CN107287330 B CN 107287330B CN 201710630307 A CN201710630307 A CN 201710630307A CN 107287330 B CN107287330 B CN 107287330B
Authority
CN
China
Prior art keywords
locus
pig
nucleotide
snp
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710630307.3A
Other languages
English (en)
Other versions
CN107287330A (zh
Inventor
郑华
苗泽圃
魏强
蒙小云
杨漫漫
陈茜
李勇
方铭
陈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Agriculture And Animal Husbandry Industry Co ltd
BGI Shenzhen Co Ltd
Original Assignee
Shenzhen Agriculture And Animal Husbandry Industry Co ltd
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Agriculture And Animal Husbandry Industry Co ltd, BGI Shenzhen Co Ltd filed Critical Shenzhen Agriculture And Animal Husbandry Industry Co ltd
Priority to CN201710630307.3A priority Critical patent/CN107287330B/zh
Publication of CN107287330A publication Critical patent/CN107287330A/zh
Application granted granted Critical
Publication of CN107287330B publication Critical patent/CN107287330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种预测待测猪的初生窝重遗传性能的SNP位点组合及方法。本发明所提供的SNP位点组合,由猪基因组中序列表中序列1自5’末端起第501位核苷酸、序列表中序列2自5’末端起第501位核苷酸、序列表中序列3自5’末端起第501位核苷酸、序列表中序列4自5’末端起第501位核苷酸和序列表中序列5自5’末端起第501位核苷酸组成。实验证明,采用本发明筛选的5个SNP位点预测可靠性值为0.033,相比BLUP方法提高了129.7%。因此,利用5个SNP位点来预测待测大白猪的初生窝重的遗传值,可以加快遗传进展,为育种者带来经济效益,具有重要的应用价值。

Description

一种预测待测猪的初生窝重遗传性能的SNP位点组合及方法
技术领域
本发明涉及生物信息学领域及家畜育种领域,具体涉及一种预测待测猪的初生窝重遗传性能的SNP位点组合及方法。
背景技术
在猪产业中,初生窝重是一个重要的经济指标,但初生窝重遗传力较低,表型选择、单标记选择都难以取得良好的选择效果。近年来,有研究者采用全基因组选择的方法来提高初生窝重性状的选择准确性,但全基因组选择需要覆盖整个基因组的遗传标记。目前在群体中进行大规模的全基因组遗传标记检测仍是一笔较大的开支。
标记辅助最佳线性无偏预测(marker-assisted best linear unbiasedprediction,MBLUP)是对动物实施标记辅助选择(marker-assisted selection,MAS)的一种重要方法,其可以利用较少数量的遗传标记来提高传统的最佳线性无偏预测(BestLinear Unbiased Prediction,BLUP)选择的准确性,在家畜育种中更具成本优势和推广前景。MBLUP的实施首先要获得目标性状关联位点。
发明内容
本发明所要解决的技术问题是如何预测待测猪的初生窝重的遗传性能。
1、为解决上述技术问题,本发明首先提供了与猪的初生窝重的遗传性能相关的SNP位点组合。
本发明所提供的与猪的初生窝重的遗传性能相关的SNP位点组合,可由SNP1位点、SNP2位点、SNP3位点、SNP4位点和SNP5位点组成;
所述SNP1位点可为猪基因组中序列表中序列1自5’末端起第501位核苷酸;
所述SNP2位点可为猪基因组中序列表中序列2自5’末端起第501位核苷酸;
所述SNP3位点可为猪基因组中序列表中序列3自5’末端起第501位核苷酸;
所述SNP4位点可为猪基因组中序列表中序列4自5’末端起第501位核苷酸;
所述SNP5位点可为猪基因组中序列表中序列5自5’末端起第501位核苷酸。
2、为解决上述技术问题,本发明还提供了预测待测猪的初生窝重遗传性能的系统,该系统可包括检测待测猪的所述SNP位点组合中各个SNP位点的基因型的试剂。
上述预测待测猪的初生窝重遗传性能的系统中,所述系统还可包括将待测猪的所述SNP位点组合中各个SNP位点的基因型转换为待测猪的所述SNP位点组合的效应值的系统。
所述SNP位点组合在预测待测猪的初生窝重遗传性能中的应用也属于本发明的保护范围。
上述任一所述系统在预测待测猪的初生窝重遗传性能中的应用也属于本发明的保护范围。
本发明还保护如序列表中的序列1所示的分子标记甲、或、如序列表中的序列2所示的分子标记乙、如序列表中的序列3所示的分子标记丙、或、如序列表中的序列4所示的分子标记丁、或、如序列表中的序列5所示的分子标记戊。
所述分子标记甲和/或所述分子标记乙和/或所述分子标记丙和/或所述分子标记丁和/或所述分子标记戊在预测待测猪的初生窝重遗传性能中的应用也属于本发明的保护范围。
所述SNP位点组合、或、上述任一所述预测待测猪的初生窝重遗传性能的系统、或、所述分子标记甲、或、所述分子标记乙、或、所述分子标记丙、或、所述分子标记丁、或、所述分子标记戊在猪育种中的应用也属于本发明的保护范围。
3、为解决上述技术问题,本发明还提供了一种预测待测猪的初生窝重遗传性能的方法,可依次包括如下步骤:
(1)检测待测猪所述SNP位点组合中各个SNP位点的基因型;
(2)采用MBLUP模型估计待测猪SNP位点组合的效应值,SNP位点组合的效应值越大,其初生窝重的遗传性能越高;SNP位点组合的效应值越小,其初生窝重的遗传性能越低。
4、本发明还保护筛选与猪的初生窝重遗传性能相关的SNP位点的方法,可依次包括如下步骤:
(1)获得猪初生窝重的估计育种值;
(2)获得覆盖猪全基因组的遗传标记;
(3)获得各个SNP位点的效应值;取效应值较大的SNP位点,并计算其贝叶斯因子,贝叶斯因子值较大的SNP位点即为与猪初生窝重遗传性能相关的SNP位点。
所述步骤(1)中,获得猪的初生窝重的估计育种值具体可采用BLUP方法。
所述步骤(2)中,获得覆盖猪的全基因组的遗传标记具体可采用限制酶切位点相关DNA测序技术(restriction-site associated DNA sequencing,RAD-seq)。
所述步骤(3)中,可采用BayesB模型筛选与猪初生窝重遗传性能相关的SNP位点。在本发明的实施例中,筛选与猪初生窝重遗传性能相关的SNP位点时,综合考虑SNP位点效应值及贝叶斯因子,且SNP位点效应值优先级更高。
上述任一所述猪具体可为大白猪。
5、模型解释
5.1所述MBLUP模型如下:
y=Xb+Z1p+Z2u+Z3w+e
y表示初生窝重性状向量,X表示固定效应关联矩阵,b表示固定效应向量,固定效应包括场—年、胎次效应,Z1表示永久环境效应关联矩阵、p表示永久环境效应向量,Z2表示加性遗传效应关联矩阵、u表示个体加性遗传效应向量,Z3表示标记效应关联矩阵、w表示标记效应向量,e表示残差。
Figure BDA0001363704080000031
I表示单位矩阵,A表示基于系谱的亲缘关系矩阵,
Figure BDA0001363704080000032
分别为永久环境效应方差、加性遗传效应方差、残差。
所述混合模型方程组可为:
Figure BDA0001363704080000033
M=[X Z3]
Figure BDA0001363704080000034
M′为M的转置矩阵,
Figure BDA0001363704080000035
为n的估计值,X′、Z′2、Z′1分别表示X、Z2、Z1的转置矩阵,
Figure BDA0001363704080000036
Figure BDA0001363704080000037
分别为b、u、p的估计值。
5.2所述bayesB模型如下:
Figure BDA0001363704080000038
yd表示逆回归育种值向量,μ表示初生窝重性状(逆回归育种值)的平均值向量,n表示SNP位点个数,xi表示第i个SNP位点的基因型(基因型的数字表示,比如CC、CT、TT基因型分别表示为0、1、2),gi表示第i个SNP位点的效应值,e表示残差向量,
Figure BDA0001363704080000039
w为权重向量,gi服从混合分布,
Figure BDA00013637040800000310
gi效应值为0的概率为1-π0
Figure BDA0001363704080000041
的概率为π0
所述逆回归育种值向量和所述权重向量是根据估计育种值,采用Dorian JGarrick等的方法(Genetics Selection Evolution,2009,41(1):1-8)计算得到的。
所述估计育种值可采用BLUP模型计算,、首先采用AIREML算法对方差组分进行估计,然后求解混合模型方程组,求出u的估计值即为估计育种值。
5.3所述BLUP模型如下:
y=Xb+Z1p+Z2u+e
模型中y表示初生窝重性状向量,X表示固定效应关联矩阵,b表示固定效应向量,固定效应包括场—年、胎次效应,Z1表示永久环境效应关联矩阵、p表示永久环境效应向量,Z2表示加性遗传效应关联矩阵、u表示个体加性遗传效应向量,e表示残差,
Figure BDA0001363704080000042
I表示单位矩阵,A表示基于系谱的亲缘关系矩阵,
Figure BDA0001363704080000043
分别为永久环境效应方差、加性遗传效应方差、残差。
混合模型方程组为:
Figure BDA0001363704080000044
X′、Z′2、Z′1分别表示X、Z2、Z1的转置矩阵,
Figure BDA0001363704080000045
Figure BDA0001363704080000046
分别为b、u、p的估计值。
实验证明,采用BLUP方法预测的可靠性(rc)值为0.014,而采用本发明筛选的5个SNP位点预测的可靠性值为0.033,相比BLUP方法提高了129.7%。因此可以利用本发明提供的5个SNP位点来预测待测大白猪的初生窝重的遗传值,可以加快遗传进展,为育种者带来经济效益,具有重要的应用价值。
具体实施方式
以下的实例仅便于更好地理解本发明,但并不限定本发明。下述实例中的实验方法,如无特殊说明,均为常规方法;同样,所用的试验材料,如无特殊说明,也均为常规生化试剂。
下述实例中的618头雌性大白猪分别来自广东潼湖核心种猪场(225头)和广东紫金核心种猪场(393头)。
实例1、与大白猪群体初生窝重性状相关的5个SNP位点的获得
一、估计大白猪群体初生窝重性状的育种值
1、对618头大白猪不同胎次的初生窝重进行记录,获得原始记录。例如,编号为133和94的大白猪的原始记录见表1。
表1
编号 被查个体号 胎次 配种日期 分娩日期 初生窝重(kg)
133 YYNMZC210027402 1 2011/8/21 / /
133 YYNMZC210027402 1 2011/9/12 2012/1/8 9.6
133 YYNMZC210027402 2 2012/2/4 2012/5/31 14.7
133 YYNMZC210027402 3 2012/6/27 / /
133 YYNMZC210027402 3 2012/9/7 2013/1/4 12.4
133 YYNMZC210027402 4 2013/2/1 / /
133 YYNMZC210027402 4 2013/2/21 / /
133 YYNMZC210027402 4 2013/7/12 2013/11/7 17.2
133 YYNMZC210027402 5 2013/11/30 2014/3/29 19.9
133 YYNMZC210027402 6 2014/4/25 2014/8/21 16.2
133 YYNMZC210027402 7 2014/9/19 2015/1/18 12.9
94 YYNMZC210027704 1 2011/5/30 / /
94 YYNMZC210027704 1 2011/10/22 2012/2/15 9.7
94 YYNMZC210027704 2 2012/3/6 2012/6/30 12.8
94 YYNMZC210027704 3 2012/7/20 2012/11/14 12.2
94 YYNMZC210027704 4 2012/12/11 / /
94 YYNMZC210027704 4 2013/2/6 2013/6/1 11.2
94 YYNMZC210027704 5 2013/6/28 2013/10/23 9.6
94 YYNMZC210027704 6 2013/11/15 2014/3/14 7.9
94 YYNMZC210027704 7 2014/4/12 / /
注:“/”表示不存在,即配种不成功或记录缺失。
2、对步骤1得到的原始记录进行质量控制(如去除个体编号重复、胎次记录重复及异常值),并保留前10个胎次,剩余2566条记录。结合系谱数据(共包含1899个个体)采用如下模型(BLUP模型)估计育种值:
y=Xb+Z1p+Z2u+e
模型中y表示初生窝重性状向量,X表示固定效应关联矩阵,b表示固定效应向量,固定效应包括场—年、胎次效应,Z1表示永久环境效应关联矩阵、p表示永久环境效应向量,Z2表示加性遗传效应关联矩阵、u表示个体加性遗传效应向量,e表示残差,
Figure BDA0001363704080000051
I表示单位矩阵,A表示基于系谱的亲缘关系矩阵,
Figure BDA0001363704080000061
分别为永久环境效应方差、加性遗传效应方差、残差。
采用AIREML(average information restricted maximum likelihood)算法对方差组分进行估计,
Figure BDA0001363704080000062
的值分别为1.11、1.31、13.03。再将
Figure BDA0001363704080000063
的值代入混合模型方程组,求出u的估计值即为估计育种值。
Henderson线性方程组为:
Figure BDA0001363704080000064
X′、Z′2、Z′1分别表示X、Z2、Z1的转置矩阵,
Figure BDA0001363704080000065
Figure BDA0001363704080000066
分别为b、u、p的估计值。
二、逆回归育种值及权重的计算
根据步骤一得到的估计育种值,采用Garrick等的方法(Genetics SelectionEvolution,2009,41(1):1-8)计算逆回归育种值及权重。
三、检测与大白猪群体初生窝重性状相关的SNP位点
1、采用限制性内切酶TaqI和MspI对大白猪基因组DNA进行双酶切,添加个体识别序列后,取等量DNA混合(平均包含22个大白猪样本),选取长度在400-500bp之间的片段,在Hiseq 4000平台进行双端测序(PE100)。根据个体识别序列对原始测序数据进行拆分,平均每个个体测序短片段数为6.17×106条。对测序数据进行质控,过滤掉低质量值的测序片段(质量值小于20的碱基比例超过30%),平均每个个体剩余测序片段数为5.66×106条。
2、完成步骤1后,采用BWA软件(http://bio-bwa.sourceforge.net/bwa.shtml)将过滤后的片段比对到参考基因组(assembly Sscrofa10.2),然后采用SAMtools软件(http://samtools.sourceforge.net/)进行变异位点检测,结果共得到200588个原始单核苷酸多态性标记,即200588个SNP位点。
3、完成步骤2后,将200588个SNP位点进行过滤(过滤条件:群体检出率大于0.7,SNP位点质量值大于20,最小等位基因频率大于0.01,杂合度小于0.9),剩余80270个SNP位点。
4、完成步骤3后,采用fastphase软件对基因型进行填补,然后过滤(过滤条件:群体检出率大于0.7,最小等位基因频率大于0.01,杂合度小于0.9),共得到79725个高质量的SNP位点。
fastphase软件的网址为http://stephenslab.uchicago.edu/software.html。
四、SNP位点的筛选
以步骤二得到的逆回归育种值为因变量,采用bayesB模型计算每个SNP位点的效应值。bayesB模型如下:
Figure BDA0001363704080000071
模型中yd表示逆回归育种值向量,μ表示平均值向量,n表示SNP位点个数,xi表示第i个SNP位点的基因型(基因型的数字表示,比如CC、CT、TT基因型分别表示为0、1、2),gi表示第i个SNP位点的效应值,e表示残差向量,
Figure BDA0001363704080000072
w为步骤二得到的权重向量,gi服从混合分布,
Figure BDA0001363704080000073
gi效应值为0的概率为1-π0
Figure BDA0001363704080000074
的概率为π0
随着SNP位点的效应值(绝对值)降低,SNP位点对表型(即初生窝重性状)方差的贡献一般也呈降低趋势,当然还受到等位基因频率的影响。为了以较少数量的SNP对初生窝重性状进行较好的预测,选取效应值最大的5个SNP位点,将这5个SNP位点分别命名为SNP1、SNP2、SNP3、SNP4和SNP5位点,基本信息见表2。
表2中贝叶斯因子(BF)采用如下公式进行计算:
Figure BDA0001363704080000075
p为SNP位点效应值不为0的后验概率,π0为SNP位点效应值不为0的先验概率。当BF<3时,该SNP位点与初生窝重性状不相关;当3<BF<20时,该SNP位点与初生窝重性状相关性较弱;当BF>20时,该SNP位点与表型(即初生窝重性状)有比较强的相关性(Robert E.Kass,Adrian E.Raftery.Journal of the American Statistical Association,Vol.90,No.430,773-795.)
结果表明,SNP1位点、SNP2位点、SNP3位点、SNP4位点和SNP5位点均与初生窝重性状相关。
SNP1位点为大白猪基因组中序列表中序列1自5’末端起第501位核苷酸。
SNP2位点为大白猪基因组中序列表中序列2自5’末端起第501位核苷酸。
SNP3位点为大白猪基因组中序列表中序列3自5’末端起第501位核苷酸。
SNP4位点为大白猪基因组中序列表中序列4自5’末端起第501位核苷酸。
SNP5位点为大白猪基因组中序列表中序列5自5’末端起第501位核苷酸。
表2
SNP位点 所在染色体 在染色体上的位置 等位基因基因型 贝叶斯因子
SNP1 1 28561604 CC、TT、CT 17.6
SNP2 2 88137636位 GG、TT、GT 81.0
SNP3 7 118104654 CC、TT、CT 25.4
SNP4 18 55035460 CC、TT、CT 30.7
SNP5 18 55035763 CC、TT、CT 96.4
实例2、采用5个SNP位点预测待测大白猪的初生窝重性状
为更加符合育种实践(即用出生早的性状记录完备的个体,对后代性状行早期预测),将618头大白猪按出生日期先后进行分组,出生日期靠前的495头大白猪作为参考群,出生日期靠后的123头大白猪作为验证群。参考群和验证群中,初生窝重性状均已知,5个SNP位点的基因型也已知。
采用SNP位点的基因型信息及系谱信息预测初生窝重性状,并评估预测的准确性。具体方法为:将验证群中的初生窝重性状设定为未知,然后根据验证群中的SNP位点的基因型信息及系谱信息对初生窝重遗传值进行预测;将该预测结果与验证群初生窝重性状的估计育种值进行比较,进而评估预测的准确性。
在没有初生窝重性状记录情况下,采用如下模型预测验证群的育种值:
y=Xb+Z1p+Z2u+Z3w+e
模型中y表示初生窝重性状向量,X表示固定效应关联矩阵,b表示固定效应向量,固定效应包括场—年、胎次效应,Z1表示永久环境效应关联矩阵、p表示永久环境效应向量,Z2表示加性遗传效应关联矩阵、u表示个体加性遗传效应向量,Z3表示标记效应关联矩阵、w表示标记效应向量,e表示残差,
Figure BDA0001363704080000081
I表示单位矩阵,A表示基于系谱的亲缘关系矩阵,
Figure BDA0001363704080000082
分别为永久环境效应方差、加性遗传效应方差、残差。
采用AIREML(average information restricted maximum likelihood)算法对方差组分进行估计(取618个个体的初生窝重性状记录),
Figure BDA0001363704080000083
的值分别为1.02、0.44、13.02。求解混合线性模型方程组(495个个体有初生窝重性状记录),进而得到没有初生窝重性状记录情况下123头大白猪(验证群)初生窝重性状的估计育种值。
混合线性模型方程组为:
Figure BDA0001363704080000091
M=[X Z3]
Figure BDA0001363704080000092
其中,M′为M的转置矩阵,为n的估计值,X′、Z′2、Z′1分别表示X、Z2、Z1的转置矩阵,
Figure BDA0001363704080000094
Figure BDA0001363704080000095
分别为b、u、p的估计值。
按照实施例1步骤一的方法,获得有初生窝重性状记录情况下123头大白猪(验证群)初生窝重性状的估计育种值。
验证群育种值的预测可靠性采用验证群育种值与校正表型值的相关性(Guo etal.Journal of Animal Science,2015,93(2):503-12;Guosheng Su et al.PLoSOne.2012,7(9):e45293)来进行评价,r2=cor2(EBV,yc)/h2,r2为预测可靠性,
Figure BDA0001363704080000096
EBV为验证群体的育种值,
Figure BDA0001363704080000097
为基于全部数据计算的育种值,
Figure BDA0001363704080000098
为残差,n为记录胎次数,h2为遗传力。由于h2为常数,因此不同方法预测准确性的比较可以简化为比较rc=cor(EBV,yc)的大小。
结果表明,BLUP预测可靠性(rc)值为0.014,而采用本发明筛选的5个SNP位点预测的可靠性值为0.033,相比BLUP提高了129.7%。
因此,利用本发明提供的5个SNP位点可以预测待测大白猪的初生窝重遗传性能,且具有成本低、准确性高的特点,可进一步加快大白猪的初生窝重性状的遗传进展,为育种者带来经济效益。本发明具有重要的应用价值。
<110> 深圳华大基因研究院 深圳市农牧实业有限公司
<120> 一种预测待测猪的初生窝重遗传性能的SNP位点组合及方法
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 1001
<212> DNA
<213> 人工序列
<220>
<221>
<222> (501)..(501)
<223> n为c或t
<400> 1
ttatgccaag atttttcacc agtggacagt ttaatctcat aaccacacgt gtacggctac 60
ataattgttt ggtttttggt ttttggtttt tgggtttttt tttttttttt tttttgtctt 120
tttgtctttt ctagggccgc tcccgcagca tatggaggtt cccaggctag gggtttaatc 180
ggagctgtag ccaccggcct acgccagagc cacagccacg tgggatccga gctgcgtctg 240
caacctacac cacagctcac ggcaacgccg gaacctaacc cactgagcaa agccagggat 300
caaacccgca acctcatggt tcctagtcgg attcgttaac cactgagcca ctacgggaac 360
tccagttgtt tgttaaataa tatctttttc ttgtttagca ttttggtttt cagtagtaaa 420
attaaagtag tctggaacaa atgaagcttt acacaaaatt cagtagcacc agtagatcca 480
atgctagtca atgaccagta nggtcttagc agaatggatt gttcgagaat gagtttgggg 540
tatattttag tcaggctgca tcttcatctt gactctaggt ttatgttcct cttattggag 600
ttcatttgat ttccagaaat gtgtctcctt accctaccaa acttggagca gagtttggct 660
acaaaaatcg taaattgcag gctgacttgg gattcacaag ctcattctga aggggccact 720
tgcctttctg gtgggcagag ttcactctct gcttagtcag ttactattaa acttgggctt 780
tgcacaaaag ggcagattct ggaaaattca gacatgtcct ccagagactc agccatagac 840
atgcaaactg caagtcatat gcatcaaaat tggtgactcc tttttccaga gggctctgtg 900
gttcttgagc ttggggaggc ccagcaaagg gaagtgactg ggaacctggg ctcagtcctc 960
ctgcccagct ggagtttccc acctgtactc cttgagcaaa t 1001
<210> 2
<211> 1001
<212> DNA
<213> 人工序列
<220>
<221>
<222> (501)..(501)
<223> r为g或t
<400> 2
cactgggaca gcgactgtgc catggcttgc tgcctgccca gtgccggcgg cagcggcagc 60
tgcgacacgc ccggcatggc tgccgccgcc cagcgggtgt cgttggcgtg gaaagagcac 120
aggctgtcgc ccatggcggc ggcggcggcg gcggcggccg acgggaactg tggaaggcct 180
ggcgtgggca gcagcgtgcc aggagcgcgg aacacgttgg tagtcttctt gcgcttcttc 240
cacttcgcgc gccgattctg gaaccagacc tgcagcgggc ggggcaggag acacacacag 300
ggcgttgtta gcaggggtgg ggtgccggct tgagcctggg aaacccgcgg caggtccacc 360
ccactcagcc ccaggcccaa gtgccagaga ccctggtcct ccaccagctc gtgtcagtcg 420
gtgtccctcg cacccactgg gcaccagctc ccggggtcct gagggattgt cccccagagc 480
gcttacaaac agttcagaca racgtcgcgc gcagtgttca ccccgcccct gcacgctggc 540
acattgtgtg cgcggcttag atgcacaggt ctacaggcag gcaggtgtca aggcttggac 600
cctcaggtgt acaaatgaag ataaacatgt gtacccagga ggcttaatag cgtgccttat 660
aacactgatg gggtatagaa ttttcagaaa cactggaaat ttggaaattg atgaagggcc 720
gtggatgaca tagccagttt caaaatcgaa agacaaagga aaacccctaa cgccaccaga 780
tgacagagcg gagcggttaa tatagtgatc cgcatgggaa agcgagcgcc atgagctaca 840
gttatttggg tcgccaaacc gtgacttctg attcttagcg attggtacta ctgccacaat 900
tttggatact tcattctcaa ggccttctaa gagcaccttt atctgggcta tgcagatgtg 960
ctggaacctg ctgccagagc cctgagcctc aggaccttca a 1001
<210> 3
<211> 1001
<212> DNA
<213> 人工序列
<220>
<221>
<222> (501)..(501)
<223> n为c或t
<400> 3
tgcaaatcag gttggtctat gctcactctg atgaataact tatgtgaaaa gaacttgaag 60
atagcaaatg aatttaatta tcagtgaaaa ttaccaaaga agaactaatg tttgcaaatg 120
ctaatatttt attataaaat acactgttat tgtttctact atctaacact ttaccaaatt 180
tgaagcagat ttagcaattt gccttatgca caaaaaagta cttaggtctg catagtgtta 240
taccttcttt tttcttcagt tagtgctaaa cataaaacca ttattttcag atccttgatc 300
tagctttcag aatttatcct ctactcttca ccatgtgaaa taaaagttct gttttgacac 360
cagggaaaaa tacagaaaca cacatattta cacacaaata taaattatat gatcatttgc 420
ccaacacaat tacatttcca agtgaaaaag tatgtgaaag tggctttcta agagatgaag 480
cattccggca aaatgcaaaa naaaaaagtt ccaagtgaat gatcctttag ggtagaaaaa 540
ggttagctgt gaatacgctt gtgaaatata ctgtggagga ttctcattct gagattatga 600
tcgttcttgc ctccaggttc aagtgttgct caatcagcaa ggtgctcaat tcacagtgat 660
tgcggcgcat ttcctcgttg atcaggaaaa tgcgtaatct cagcctagac acatttacca 720
taaaaatgaa tatacgaaat aggatttttg atttaaattt tccagttgca gcatatcgag 780
aaaaatatat gcaagagaag attctgtttg aaaagctcta attcaaataa gtccaaaaag 840
aacacatctc tatgtaccta acgctgtctt gccattagat agcaagcttt tctcgctcag 900
agcccttgtc aatttgatta aactcacaaa cacgtggctg actccgcccc ttttaaaaat 960
actctctagc cgagccggag gatgactgag aagcatgtgg c 1001
<210> 4
<211> 1001
<212> DNA
<213> 人工序列
<220>
<221>
<222> (501)..(501)
<223> n为c或t
<400> 4
ggagcaaagg aggaaggcgg gctgtcctgg caatggatga cttgaggaag gctgaggcac 60
gggcacggga tgggtgaaca gggcgaggga ggtcacagcc aggaacaccc cggaagtcta 120
ccctgacacc ttgagctcaa ggtcatcagg aagcgtgggg gccaggaggg ggagtggcac 180
cgacaggaga ttctgtgtct ggatccgggg cagctccggc ccccagacct cctcctgtac 240
ccagacaaca ggcacctggg caagccgctt acccaaaggc aaagccagag gattcttcct 300
tgaagaaatg gagattcctg ggagttccga ggtctccaga ctggtactgg tacccagcat 360
tagccccacc ccttctggaa tgtggcccag gaccggacct gcctgttggc ccactgccac 420
acccacacca tcacagcgag gtcagggagg ggaccctgcc aaaggagccg agtgaggcca 480
ctccgggacc ccaggggagg ngggcagggg agcacaggcg gaaagtcggc agcagggggg 540
taatgagacg ggagagtcac gtgggccctg gggggctgat catcctgcaa cagaagagcc 600
ccttcatgca ggacctgagt ttgtattttc agagtgattc aggaagatgt cacagacgta 660
aaaataggag accacaacaa agaaacacaa cactggagaa caagaaagac tcttcagaaa 720
cgaaatcagc cattttaaaa tatggagctg aggagttcct gtagtggcgc agtggttaac 780
gaatccgact aggaaccatg aggcgggagg ttcgatccct ggcctcgctc agtgggttaa 840
ggatctggca ttgccatgag ctgtggtgta ggtcaaagat gtggccccga tctggcattg 900
ctgtggttgt ggtacagacc ggcggttaca gctccaattt gatccctagc ctgggaaact 960
ctttatgccc cgggtgtggc cctaaaaaga caaaagaaga c 1001
<210> 5
<211> 1001
<212> DNA
<213> 人工序列
<220>
<221>
<222> (501)..(501)
<223> n为c或t
<400> 5
agaaatggag attcctggga gttccgaggt ctccagactg gtactggtac ccagcattag 60
ccccacccct tctggaatgt ggcccaggac cggacctgcc tgttggccca ctgccacacc 120
cacaccatca cagcgaggtc agggagggga ccctgccaaa ggagccgagt gaggccactc 180
cgggacccca ggggaggtgg gcaggggagc acaggcggaa agtcggcagc aggggggtaa 240
tgagacggga gagtcacgtg ggccctgggg ggctgatcat cctgcaacag aagagcccct 300
tcatgcagga cctgagtttg tattttcaga gtgattcagg aagatgtcac agacgtaaaa 360
ataggagacc acaacaaaga aacacaacac tggagaacaa gaaagactct tcagaaacga 420
aatcagccat tttaaaatat ggagctgagg agttcctgta gtggcgcagt ggttaacgaa 480
tccgactagg aaccatgagg ngggaggttc gatccctggc ctcgctcagt gggttaagga 540
tctggcattg ccatgagctg tggtgtaggt caaagatgtg gccccgatct ggcattgctg 600
tggttgtggt acagaccggc ggttacagct ccaatttgat ccctagcctg ggaaactctt 660
tatgccccgg gtgtggccct aaaaagacaa aagaagacaa aaaaataaaa aaacattata 720
aaataaaata tggagctgaa acacaagaca acataaggaa gaaaaagtta aaaagagaca 780
gatgatcaaa gcaggatgac catcatttgc ctaaaaggga atgatctggt tgatccagga 840
aacaatgaga aatcttcagt ttctaaggcc gctaagaatt ccccacacag ctcccaacat 900
gacacaacag gatcagtggc atctctgaag cactgggatg aaatttcaat ccccaacccg 960
gcacagcgag ttaaaggatc tggcactgct gcagctgtgg c 1001

Claims (5)

1.预测待测猪的初生窝重遗传性能的系统,包括检测待测猪的SNP位点组合中各个SNP位点的基因型的试剂;
所述SNP位点组合由SNP1位点、SNP2位点、SNP3位点、SNP4位点和SNP5位点组成;
所述SNP1位点为猪基因组中序列表中SEQ ID No:1自5’末端起第501位核苷酸;
所述SNP2位点为猪基因组中序列表中SEQ ID No:2自5’末端起第501位核苷酸;
所述SNP3位点为猪基因组中序列表中SEQ ID No:3自5’末端起第501位核苷酸;
所述SNP4位点为猪基因组中序列表中SEQ ID No:4自5’末端起第501位核苷酸;
所述SNP5位点为猪基因组中序列表中SEQ ID No:5自5’末端起第501位核苷酸。
2.如权利要求1所述的系统,其特征在于:所述系统还可包括将待测猪的所述SNP位点组合中各个SNP位点的基因型转换为待测猪的所述SNP位点组合的效应值的系统。
3.检测与猪的初生窝重遗传性能相关的 SNP位点组合中各个SNP位点基因型的物质在预测待测猪的初生窝重遗传性能中的应用;
所述SNP位点组合由SNP1位点、SNP2位点、SNP3位点、SNP4位点和SNP5位点组成;
所述SNP1位点为猪基因组中序列表中SEQ ID No:1自5’末端起第501位核苷酸;
所述SNP2位点为猪基因组中序列表中SEQ ID No:2自5’末端起第501位核苷酸;
所述SNP3位点为猪基因组中序列表中SEQ ID No:3自5’末端起第501位核苷酸;
所述SNP4位点为猪基因组中序列表中SEQ ID No:4自5’末端起第501位核苷酸;
所述SNP5位点为猪基因组中序列表中SEQ ID No:5自5’末端起第501位核苷酸。
4.权利要求1或2所述系统在预测待测猪的初生窝重遗传性能中的应用。
5.一种预测待测猪的初生窝重遗传性能的方法,依次包括如下步骤:
(1)检测待测猪的SNP位点组合中各个SNP位点的基因型;
(2)采用MBLUP模型估计待测猪SNP位点组合的效应值,SNP位点组合的效应值越大,其初生窝重的遗传性能越高;SNP位点组合的效应值越小,其初生窝重的遗传性能越低;
所述SNP位点组合由SNP1位点、SNP2位点、SNP3位点、SNP4位点和SNP5位点组成;
所述SNP1位点为猪基因组中序列表中SEQ ID No:1自5’末端起第501位核苷酸;
所述SNP2位点为猪基因组中序列表中SEQ ID No:2自5’末端起第501位核苷酸;
所述SNP3位点为猪基因组中序列表中SEQ ID No:3自5’末端起第501位核苷酸;
所述SNP4位点为猪基因组中序列表中SEQ ID No:4自5’末端起第501位核苷酸;
所述SNP5位点为猪基因组中序列表中SEQ ID No:5自5’末端起第501位核苷酸。
CN201710630307.3A 2017-07-28 2017-07-28 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法 Active CN107287330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710630307.3A CN107287330B (zh) 2017-07-28 2017-07-28 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710630307.3A CN107287330B (zh) 2017-07-28 2017-07-28 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法

Publications (2)

Publication Number Publication Date
CN107287330A CN107287330A (zh) 2017-10-24
CN107287330B true CN107287330B (zh) 2020-10-09

Family

ID=60103552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710630307.3A Active CN107287330B (zh) 2017-07-28 2017-07-28 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法

Country Status (1)

Country Link
CN (1) CN107287330B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110400597A (zh) * 2018-04-23 2019-11-01 成都二十三魔方生物科技有限公司 一种基于深度学习的基因型预测方法
CN112941197A (zh) * 2019-12-10 2021-06-11 中国农业科学院深圳农业基因组研究所 一种基于snp标记评估母猪泌乳力的方法
CN112980962B (zh) * 2019-12-12 2022-05-31 深圳华大生命科学研究院 一种与猪初生重性状相关的snp标记及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102943112A (zh) * 2012-11-22 2013-02-27 中国农业科学院北京畜牧兽医研究所 辅助评价仔猪初生重和断奶重的方法及其专用引物
CN105821037A (zh) * 2015-01-04 2016-08-03 深圳华大基因研究院 Snp标记及其应用
CN106755355A (zh) * 2016-12-05 2017-05-31 中国农业科学院作物科学研究所 一种与小麦千粒重和茎秆可溶性糖含量相关的分子标记TaSnRK2.3B及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102943112A (zh) * 2012-11-22 2013-02-27 中国农业科学院北京畜牧兽医研究所 辅助评价仔猪初生重和断奶重的方法及其专用引物
CN105821037A (zh) * 2015-01-04 2016-08-03 深圳华大基因研究院 Snp标记及其应用
CN106755355A (zh) * 2016-12-05 2017-05-31 中国农业科学院作物科学研究所 一种与小麦千粒重和茎秆可溶性糖含量相关的分子标记TaSnRK2.3B及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
an open source genome-wide association data;J MY Yeung等;《BMC Genomics》;20081231;第9卷;全文 *

Also Published As

Publication number Publication date
CN107287330A (zh) 2017-10-24

Similar Documents

Publication Publication Date Title
Matukumalli et al. Development and characterization of a high density SNP genotyping assay for cattle
Peripolli et al. Runs of homozygosity: current knowledge and applications in livestock
Pryce et al. A validated genome-wide association study in 2 dairy cattle breeds for milk production and fertility traits using variable length haplotypes
Lee et al. Genome-wide association study identifies major loci for carcass weight on BTA14 in Hanwoo (Korean cattle)
Park et al. Genome sequencing of the extinct Eurasian wild aurochs, Bos primigenius, illuminates the phylogeography and evolution of cattle
Boitard et al. Uncovering adaptation from sequence data: lessons from genome resequencing of four cattle breeds
Barendse Haplotype analysis improved evidence for candidate genes for intramuscular fat percentage from a genome wide association study of cattle
Fortes et al. Gene network analyses of first service conception in Brangus heifers: use of genome and trait associations, hypothalamic-transcriptome information, and transcription factors
Kukekova et al. Sequence comparison of prefrontal cortical brain transcriptome from a tame and an aggressive silver fox (Vulpes vulpes)
Pariset et al. Use of microsatellites for genetic variation and inbreeding analysis in Sarda sheep flocks of central Italy
Van der Spek et al. Genome-wide association study for claw disorders and trimming status in dairy cattle
Gurgul et al. The application of genome-wide SNP genotyping methods in studies on livestock genomes
Lopes et al. Using markers with large effect in genetic and genomic predictions
Raphaka et al. Genomic regions underlying susceptibility to bovine tuberculosis in Holstein-Friesian cattle
CN107287330B (zh) 一种预测待测猪的初生窝重遗传性能的snp位点组合及方法
Schulman et al. Mapping of fertility traits in Finnish Ayrshire by genome‐wide association analysis
Karimi et al. Comparison of linkage disequilibrium levels in Iranian indigenous cattle using whole genome SNPs data
Jardim et al. Association analysis for udder index and milking speed with imputed whole-genome sequence variants in Nordic Holstein cattle
Wiener et al. Testing for the presence of previously identified QTL for milk production traits in new populations
Shay et al. Fine-mapping and construction of a bovine contig spanning the ovine callipyge locus
Pausch et al. Validation of 4 candidate causative trait variants in 2 cattle breeds using targeted sequence imputation
CN107287329B (zh) 一种预测待测猪的窝产活仔数遗传性能的snp位点组合及方法
Lashmar et al. Genomic diversity and autozygosity within the SA Drakensberger beef cattle breed
DeAtley et al. Genetic analyses involving microsatellite ETH10 genotypes on bovine chromosome 5 and performance trait measures in Angus-and Brahman-influenced cattle
Sim et al. Heritability of horn size in Thinhorn sheep

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 523 Shenzhen City Agricultural Company Jintian road 518118 Guangdong province Pingshan New District

Applicant after: Shenzhen agriculture and animal husbandry industry Co., Ltd.

Applicant after: BGI-Shenzhen

Address before: 518083, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen, 11

Applicant before: BGI-Shenzhen

Applicant before: Shenzhen agriculture and animal husbandry industry Co., Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant