CN111128306B - 一种罗非鱼基因组选择育种方法 - Google Patents

一种罗非鱼基因组选择育种方法 Download PDF

Info

Publication number
CN111128306B
CN111128306B CN202010008261.3A CN202010008261A CN111128306B CN 111128306 B CN111128306 B CN 111128306B CN 202010008261 A CN202010008261 A CN 202010008261A CN 111128306 B CN111128306 B CN 111128306B
Authority
CN
China
Prior art keywords
tilapia
genome
disease
breeding
family
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010008261.3A
Other languages
English (en)
Other versions
CN111128306A (zh
Inventor
陈松林
卢昇
朱佳杰
孟亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Original Assignee
Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences filed Critical Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Priority to CN202010008261.3A priority Critical patent/CN111128306B/zh
Publication of CN111128306A publication Critical patent/CN111128306A/zh
Application granted granted Critical
Publication of CN111128306B publication Critical patent/CN111128306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Abstract

本发明提供一种基于基因组选择技术培育抗病罗非鱼良种的方法,通过比较GBLUP和BayesCπ在不同标记密度下的预测准确性来选定最适的SNP标记密度;其次,在选定的标记密度下评估其他基因组选择方法的预测准确性。最后综合考虑计算时间和预测准确性,选出适用于罗非鱼抗病育种的基因组估计育种值方法。本发明提供了一种快速、准确估算罗非鱼抗病性状基因组估计育种值的方法,使用该方法获得的子代抗病力高于对照组。通过该方法可加速培育抗病的罗非鱼品种、提高罗非鱼养殖产量、推动罗非鱼养殖产业健康发展。

Description

一种罗非鱼基因组选择育种方法
技术领域
本发明属于水产遗传育种技术领域,具体涉及一种基于全基因组选择的罗非鱼抗病良种培育方法。
背景技术
我国自上世纪50年代开始引进罗非鱼,经几十年努力,先后攻克了远缘杂交、人工繁育、规模化养殖和商品鱼加工等一系列难题,使得我国成为全球罗非鱼产量和出口量最大的国家。目前,罗非鱼产区主要位于广东、海南、广西、云南和福建等地,年产量约180万吨,出口量约40万吨。其中,吉富罗非鱼为我国罗非鱼养殖的主导品种,养殖面积约占全国总面积的60%。然而,随着罗非鱼养殖业的迅速发展,由规模化养殖引发的病害以及药物残留高导致的产品质量问题日益严重。养殖高温季节病害频发,以无乳链球菌引起的细菌性疾病危害最为突出。这种疾病死亡率高且传播速度极快,对罗非鱼养殖业造成了巨大的经济损失。面对高致病率和高死亡率,广大养殖户在养殖过程中使用和投喂大量抗生素,不仅导致药物残留超标,影响商品鱼品质和食品安全,阻碍商品鱼出口,还会污染水体,破坏生态环境平衡。因此,亟待开展针对吉富罗非鱼抗无乳链球菌病的选育研究,从种源上提高鱼类机体自身的抗病力。
迄今为止,鱼类良种选育主要通过群体选育、家系选育、杂交选育和基于系谱信息的BLUP选育等手段。鱼类抗病选育中常常通过人工感染实验测定不同家系或不同群体的抗病能力,为了避免病原垂直传播的风险,感染实验中存活的个体通常不用作亲本繁育后代,而是从高存活率或者高育种值(传统BLUP估算)家系中挑选健康、壮硕的个体进行繁育,因此选择准确性低,每年可获得的遗传进展十分有限。随着分子生物学的发展,利用分子标记信息对经济性状进行选育的分子标记辅助选育技术逐渐兴起。传统分子标记辅助选育所用的标记数量有限,对质量性状或包含主效位点的性状具有较好的选择效果,而对由微效多基因控制的数量性状选择效果欠佳。鱼类抗病性状,尤其是抗细菌病,往往由多个基因控制,呈现微效多基因的遗传结构,因此传统的分子标记辅助选育的选择效果也不理想。为了能够提高吉富罗非鱼抗病良种选育的进展,发展吉富罗非鱼抗病新品种的培育进程,本发明建立了一种基于全基因组选择技术的吉富罗非鱼抗无乳链球菌病的良种培育方法,旨在为吉富罗非鱼抗无乳链球菌病良种培育提供一种新的育种技术。
发明内容
本发明的目的是建立一种基于基因组选择技术培育抗病罗非鱼良种的方法,以改善传统选育手段中存在的准确性低、进展缓慢的问题,为培育抗病罗非鱼提供分子育种方法,推动罗非鱼抗病选育的快速发展,保障罗非鱼养殖业平稳、健康发展。
本发明首先通过构建抗病参考群体,进行参考群体全基因组重测序,获得大量SNP位点,然后比较GBLUP和BayesCπ两种方法在不同标记密度下估算育种值的准确性,从而选择最适的SNP标记密度;在选定的标记密度下评估其他估算方法的预测准确性;综合考虑计算时间和预测准确性,选出适用于罗非鱼抗病育种的基因组估计育种值方法,最终建立罗非鱼抗病性状的基因组选择技术。
本发明首先提供一种获得罗非鱼抗病育种用的基因组估计育种值的方法,包括如下步骤:
1)罗非鱼抗病表型测定及参考群体建立
构建罗非鱼家系,待家系鱼苗生长至50-60克时,从每个家系随机选取100-200尾鱼使用病原菌进行人工感染,每3小时观察感染鱼苗状况并收集死亡鱼苗,记录死亡时间、家系信息,采集鳍条样品保存于无水乙醇中备用;待各家系中不再出现死亡个体时结束实验;将各罗非鱼家系在感染中的表现作为抗病表型,用于后续的分析、估算;依据各家系的存活率、死亡时间和拟建参考群体规模,从中选取一组能够代表各家系抗病表现的集合作为参考群体;其中,使用二分类性状(0和1)作为抗病表型,即:0表示在感染实验中死亡的个体,1表示在感染实验结束后仍存活的个体。
2)参考群体全基因组重测序、基因型采集及分析处理
提取参考群体的基因组DNA并建库、测序,对下机的原始数据进行过滤,再将过滤后的reads比对至罗非鱼参考基因组上进行SNP calling并生成VCF文件;使用PLINK软件读取VCF文件中的基因型信息并统计包含未缺失基因型的位点,再利用VCFtools进行质量控制,最后生成一个包含高质量SNP且不含缺失位点的VCF文件用于基因组选择的计算;
3)最适标记密度分析和基因组选择方法评估
首先,评估GBLUP和BayesCπ两种方法在不同SNP密度下估算育种值准确性的变化趋势,从而选择最适标记密度。再使用该密度SNP评估加权GBLUP方法的准确性并将该准确性与GBLUP和BayesCπ的准确性进行比较;综合考虑计算时间和预测准确性,选出最优的育种值估算方法;准确性评估方法采用基于随机分组的5倍交叉验证。
4)参考群体基因组估计育种值GEBV的计算
选用步骤3)中确定的最适标记密度和预测准确性最高的方法,估算参考群体中每个个体的GEBV并将同一家系中所有个体GEBV均值作为该家系GEBV。
通过比较感染存活率前10名和后10名的家系GEBV,以验证GEBV估算的有效性。若同一年里进行了多次人工感染实验,为排除不同批次之间可能存在误差,需将实验批次作为效应,利用线性模型对不同批次的感染存活率进行校正。校正后,将均值与残差之和作为校正感染存活率进行分析比较。
经验证,罗非鱼家系感染后的存活率与其基因组估计育种值(GEBV)呈正相关,存活率高的家系的GEBV值也高。因此,可根据个体或家系GEBV的高低为留种及育种方案定制提供参考。
本发明还提供一种罗非鱼抗病良种培育方法,是使用上述方法获得的基因组估计育种值GEBV作为抗病良种选育的标准,从GEBV高的家系中选留优质(生长快等)个体繁育后代,可获得抗病力提高的苗种。
本发明还基于均匀覆盖基因组的原则,从步骤2)获得的中高质量的SNP中提取SNP并使用加权GBLUP进行全基因组关联分析(GWAS);以单个标记解释的方差百分比绘制Manhattan图并将解释了1%以上方差的SNP视为与抗病性状相关的位点,解释了2%以上的SNP视为与抗病显著相关的位点;对GWAS分析检测到的与性状显著相关的位点进行卡方检验确定显著性水平,寻找在抗病个体和不抗病个体间出现频率存在显著差异的SNP标记,发现基因组估计育种值排名前30(抗病个体)和排名后30(易感个体)的个体在2个SNP位点上存在显著差异,这2个SNP标记可辅助筛选抗病家系。
其中一个SNP位点是位于罗非鱼第6号染色体31387284bp处,其碱基为C或T;包含该SNP位点的一种核苷酸序列如下:
TTCTTTTCTGTAGAGAAACAGAGAGTGAGTTTGTGTTTAGGCCAGAATTTTGTGCATATCC(SEQ IDNO:1);
另一个SNP位点是位于罗非鱼第7号染色体51326072bp处,其碱基为T或C;包含该SNP位点的一种核苷酸序列如下:
ACCTCAAACTGTTGAACAAGATGAGTTACTCGAATACTAGAAAGGTGCCCAGTGAATGCTC(SEQ IDNO:2)。
本发明提供了一种快速、准确估算罗非鱼抗病性状基因组估计育种值的方法,使用该方法获得的子代抗病力高于对照组。通过该方法可加速培育抗病的罗非鱼品种、提高罗非鱼养殖成活率和产量、推动罗非鱼养殖产业绿色健康发展。
附图说明
图1:3.7M高质量SNP标记最小等位基因频率箱线图
图2:各SNP子集最小等位基因频率箱线图,其中标记密度从a至f依次为5k、10k、50k、100k、500k和1M;
图3:吉富罗非鱼抗无乳链球菌Manhattan图
图4:不同标记密度下GBLUP和BayesCπ预测准确性变化曲线图;
图5:BLUP、GBLUP、加权GBLUP(wGBLUP)和BayesCπ预测准确性图;
图6:GBLUP、加权GBLUP和BayesCπ预测准确性提高百分比图;
图7:2014年40个吉富罗非鱼家系人工感染无乳链球菌实验存活率图;
图8:2015年49个吉富罗非鱼家系人工感染无乳链球菌实验存活率图;
图9:2014年和2015年吉富罗非鱼家系校正后感染存活率前10名和后10名家系平均GEBV图。
具体实施方式
下面以吉富罗非鱼抗无乳链球菌病为例,结合附图对基于基因组选择技术的罗非鱼抗病良种培育方法进行详述:
1)吉富罗非鱼抗无乳链球菌病表型测定及参考群体建立
选用2014年和2015年建立的吉富罗非鱼家系为研究材料,其中,2014年家系40个,2015年家系49个。当各家系鱼苗平均体重达到50-60克时,从每个家系中随机选取150尾幼鱼进行无乳链球菌人工感染实验。将注射病原菌的时间视为零点,每三小时观察一次各家系幼鱼的存活情况,若发现死亡个体,及时将其捞出并记录该个体的家系信息、死亡时间、体长(全长)、体重和体宽等表型数据并剪取尾鳍鳍条存于无水乙醇中。待各家系中不再出现死亡个体时结束实验,同时采集存活个体尾鳍鳍条并记录每个个体的家系信息、体长(全长)、体重和体宽数据。将各罗非鱼家系在感染实验中的表现作为抗病表型,用于后续的分析、估算。使用二分类性状(0表示在感染实验中死亡的个体;1表示存活率)作为表型。
依据2014年和2015年吉富罗非鱼注射无乳链球菌后各家系的存活率、死亡时间和拟建参考群体规模,从中选取了776尾鱼构建参考群体(表1),该参考群体中各家系死亡率和死亡时间的分布与整个实验群体中各家系死亡率和死亡时间的分布基本保持一致。
表1:吉富罗非鱼抗无乳链球菌参考群体信息
2)参考群体全基因组重测序、基因型采集及分析处理
从感染实验中收集的尾鳍鳍条中提取参考群体的基因组DNA并建库、测序。对下机的原始数据进行过滤,再将过滤后各样品的reads比对至罗非鱼参考基因组上,参考基因组使用版本:Oreochromis niloticus O_niloticus_UMD_NMBU(NCBI RefSeq assemblyaccession:GCF_001858045.2)。基于各个样品比对结果,利用GATK 4.0 Tools对群体进行SNP检测扫描。通过VQSR多重校正等方法和基础过滤参数“QD<2.0||MQ<40.0||ReadPosRankSum<-8.0||FS>60.0||MQRankSum<-12.5”进行过滤,最后得到12.8M(12,873,624)高质量SNP标记并将结果保存至VCF文件中。
使用PLINK软件读取上述VCF文件中的基因型信息并统计未包含缺失基因型的位点,再利用VCFtools进行质量控制,最后生成一个含有3.7M(3,759,557)高质量SNP且不含缺失位点的VCF文件用于基因组选择的计算。具体方法为(所有命令均运行于Linux环境):
A.原始基因型处理
B.准备基因组选择所需基因型文件
质量控制后,最终得到3.7M(3,759,557)满足基因组选择的高质量SNP(表2、图1)。基于均匀分布整个基因组的原则,从3.7M个SNP标记中提取了6组不同密度(5k、10k、50k、100k、500k和1M)的标记用于后续分析(图2)。
表2:罗非鱼3.7M高质量SNP标记信息表
3)全基因组关联分析及抗病相关SNP筛选
利用步骤2)中已准备好的“geno_oni_776_subset_6.csv”文件进行全基因组关联分析,分析方法采用加权GBLUP。用单个标记解释的方差百分比作Manhattan图并将解释了1%以上方差的SNP视为与吉富罗非鱼抗无乳链球菌相关位点,解释了2%以上的SNP视为显著相关位点。对所有方差百分比高于2%的位点进行卡方检验,比较抗病个体(基因组估计育种值排名前30)和易感个体(排名后30)间抗病力的差异是否与这些位点基因型的差异有关。具体方法如下(所有命令均运行于R):
经分析,共检测到17个与吉富罗非鱼抗无乳链球菌病相关的SNP位点,其中有4个SNP与该性状显著相关(图3、表3)。经卡方检验,6号和7号染色体上与性状显著相关位点上基因型的差异与抗病个体和易感个体间抗病力的差异显著相关(表4)。6号染色体上等位基因上的基因型C出现的频率在抗病个体中(0.52)高于易感个体(0.18),7号染色体上等位基因基因型T的出现频率在抗病个体中(0.05)低于易感个体(0.25),这2个SNP标记可辅助用于筛选吉富罗非鱼抗病家系。
表3:吉富罗非鱼抗无乳链球菌显著相关SNP位点信息
注:加粗下划线字体为吉富罗非鱼抗无乳链球菌显著相关SNP所在位置
表4:吉富罗非鱼抗无乳链球菌显著相关SNP位点卡方检验
** 表明抗病个体和易感个体间抗病力的差异与该位点基因型的差异显著相关
4)最适标记密度分析和基因组选择方法评估
探究GBLUP和BayesCπ两种方法在SNP密度为5k、10k、50k、100k、500k和1M下估算育种值准确性的变化趋势。综合考虑计算时间和准确性,选定50k为最适标记密度。之后,再使用密度为50k的SNP评估GBLUP、BayesCπ和加权GBLUP三种方法估算育种值的准确性并与传统基于系谱的BLUP方法进行比较。评估方法采用基于随机分组的5倍交叉验证。经比较,最终选定加权GBLUP计算基因组估计育种值GEBV。具体方法如下(所有命令均运行于Linux环境):
A.构建不同标记密度下的G矩阵
利用6组已生成好的.csv文件构建G矩阵,G矩阵构建公式为:0.95*((ZZ′)/(2∑pj(1-pj)))+0.05*A22。其中,矩阵Z定义为矩阵M减去矩阵P;矩阵M为一个n×m含有基因型信息的矩阵,n表示具有个体数,m表示SNP位点数,Mij表示第i个个体在第j位点的基因型;矩阵P为含有等位基因频率信息的矩阵,该矩阵中元素的值为2pj表示第j个位点的最小等位基因频率。矩阵A22是所有测序个体基于系谱估算的亲缘关系矩阵。G矩阵在R中构建,代码如下:
/>
执行完上述代码后就会得到6个用不同标记密度构建的G矩阵的逆矩阵,该矩阵可在ASReml中使用。
B.最适标记密度筛选
在R中,利用ASReml和BGLR两个package分别实现GBLUP和BayesCπ方法估算基因组估计育种值。采用5倍交叉验证评估GBLUP和BayesCπ的预测准确性,即:将整个表型数据随机分为5个部分,从中挑选1部分作为验证集,剩余4组作为训练集;计算时,将验证集中表型设置为缺失;之后,利用r((G)EBVs,y)/h作为指标衡量以比较不同基因组选择方法的预测准确性;其中,r((G)EBVs,y)为验证集中个体的基因组估计育种值及其表型的相关系数。为了减少随机分组的误差,共进行50次交叉验证,计算代码如下:
/>
/>
将50次准确性的均值作为最终比较GBLUP和BayesCπ的指标并绘制折线图(图4、表5)。从图中可以看出,随着标记密度的增加,GBLUP和BayesCπ的预测准确性呈上升趋势。当标记密度增加值50k时,GBLUP的预测准确性接近峰值(0.426)(表5),继续增加标记数量,GBLUP的准确性基本不再发生明显变化;与GBLUP不同,BayesCπ的预测准确性随着标记密度增加呈现持续上升的趋势达到500k后接近峰值(0.439)(表5)。综合考虑计算时间,认为50k是计算基因组估计育种值较为合适的SBP密度,计算时间也较为适中。
表5:GBLUP和BayesCπ不同标记密度下50次交叉验证预测准确性表
C.GBLUP、BayesCπ和加权GBLUP预测准确性比较
使用密度为50k的SNP比较GBLUP、BayesCπ和加权GBLUP三种方法估算育种值的准确性。评价方法采用50次基于随机分组的5倍交叉验证,由于GBLUP和BayesCπ的准确性已在上一步骤中得出。因此,该部分主要评估加权GBLUP方法的预测准确性,计算代码如下:
/>
/>
统计GBLUP、BayesCπ和加权GBLUP(wGBLUP)在标记密度为50k时的预测准确性,结果表明,wGBLUP的准确性最高(0.488)(表6),BayesCπ次之(0.430)(表5),GBLUP最低(0.426)(表5);BayesCπ和GBLUP的预测准确性很接近(图5);三种基因组选择方法的预测准确性均高于传统基于系谱的BLUP方法(0.253)(图5)。相比传统BLUP方法,wGBLUP的准确性提高了76.79%,BayesCπ提高了69.94%,GBLUP提高了68.12%(图6)。
表6:加权GBLUP50次交叉验证结果表
5)参考群体基因组估计育种值(GEBV)分析
选用50k SNP标记和加权GBLUP估算参考群体中每个个体的GEBV并将同一家系中所有个体GEBV均值作为该家系GEBV。再比较感染存活率前10名和后10名的家系GEBV,作为验证GEBV估算的有效性的一种方法。由于同一年里进行了多次人工感染实验,为排除不同批次之间可能存在的误差,将实验批次作为效应,利用线性模型分别校正2014年和2015年家系感染存活率,再将均值与残差之和作为校正感染存活率。GEBV估算和存活率校正方法如下:
/>
/>
经计算,2014年共有40个家系,校正后平均感染存活率为71.9%,共有24个家系超过均值(图7、表7)。2015年共有48个家系,校正后平均感染存活率为43.9%,共有24个家系超过均值(图8、表7)。2014年校正后感染存活率前10名家系存活率均值为82.0%,GEBV均值为0.173;后10名家系存活率均值为57.6%,GEBV均值为-0.018。2015年校正后感染存活率前10名家系存活率均值为62.3%,GEBV均值为0.190;后10名家系存活率均值为22.1%,GEBV均值为0.011(图9)。由此可见,罗非鱼家系感染后的存活率与其基因组估计育种值(GEBV)呈正相关,存活率高的家系的GEBV值也高。因此,可根据个体或家系GEBV的高低为留种及育种方案定制提供参考。
表7:吉富罗非鱼抗无乳链球菌病参考群体各家系基因组估计育种值(GEBV)表
/>
6)基因组估计育种值(GEBV)在罗非鱼抗病育种中的应用方法
在步骤D中验证了GEBV的有效性后,将上述排名前10的家系作为重点留种家系。根据育种计划,结合家系GEBV和存活率筛选候选家系并从中挑选出优质个体进行亲鱼培育和抗病苗种繁育。经计算,子代家系感染存活率排名前10的家系中有77%的家系的父本或母本来自2014年重点家系,这些家系的平均感染存活率为63.1%,显著高于对照组(41.0%)。下面以2014年和2015年吉富罗非鱼家系为例进行详细说明:
2014年家系为吉富罗非鱼抗无乳链球菌F3家系;2015年为F4家系,其亲本均来自2014年选育家系。2014年和2015年家系均进行了无乳链球菌人工感染实验,在此基础上完成了吉富罗非鱼抗无乳链球菌参考群体的构建及GEBV的估算。待2015年家系进行人工感染实验后,结合2014年参考群体GEBV计算结果对2015年感染存活率前10名的家系进行分析。
经计算,2015年感染存活率前10名的家系共13个,平均存活率为62.3%(表7),其中有10个家系(平均感染存活率为63.1%)的父本或(和)母本来自2014年排名10的家系。相比对照组(150C)的感染存活率,2015年感染存活率前10的家系的感染存活率提高了15.0%~38.5%(表7)。
综上所述,本发明提供了一种快速、准确估算罗非鱼抗病性状基因组估计育种值GEBV的方法,使用该方法获得的子代抗病力高于对照组。进一步,本发明提供了一种罗非鱼抗无乳链球菌病良种选育方法,是使用上述方法获得的基因组估计育种值GEBV作为抗病良种选育的标准,从GEBV高的家系中选留优质(生长快等)个体繁育后代,可获得抗抗无乳链球菌病力提高的苗种,为培育抗无乳链球菌吉富罗非鱼优良品种提供有效的分子育种方法;通过该方法可加速培育抗病的罗非鱼品种、提高罗非鱼养殖成活率和产量、推动罗非鱼养殖产业绿色健康发展。
序列表
<110> 中国水产科学研究院黄海水产研究所
<120> 一种罗非鱼基因组选择育种方法
<160> 2
<170> SIPOSequenceListing 1.0
<210> 1
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttcttttctg tagagaaaca gagagtgagt ttgtgtttag gccagaattt tgtgcatatc 60
c 61
<210> 2
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
acctcaaact gttgaacaag atgagttact cgaatactag aaaggtgccc agtgaatgct 60
c 61

Claims (2)

1.一种获得罗非鱼抗病育种用的基因组估计育种值的方法,其特征在于,所述的方法包括如下步骤:
1)罗非鱼抗病表型测定及参考群体建立
将建立的罗非鱼家系使用致病菌进行人工感染,将各罗非鱼家系在感染中的表现作为抗病表型,用于后续的分析、估算;依据各家系的存活率、死亡时间和拟建参考群体规模,从中选取出一组能够代表各家系抗病表现的子集作为参考群体;
2)参考群体全基因组重测序、基因型采集及分析处理
提取参考群体的基因组DNA并建库、测序,对原始数据进行过滤,再将过滤后的reads比对至罗非鱼参考基因组上进行SNP calling并生成VCF文件;使用PLINK软件读取VCF文件中的基因型信息并统计包含未缺失基因型的位点,再利用VCFtools进行质量控制,最后生成一个包含高质量SNP且不含缺失位点的VCF文件用于基因组选择的计算;其中一个SNP位点是位于罗非鱼第6号染色体31387284bp处,其碱基为C或T;包含该SNP位点的一种核苷酸序列为SEQ ID NO:1;另一个SNP位点是位于罗非鱼第7号染色体51326072bp处,其碱基为T或C;包含该SNP位点的一种核苷酸序列为SEQ ID NO:2;
3)最适标记密度分析和基因组选择方法评估
将GBLUP和BayesCπ作为两类基因组选择方法的代表,再使用该密度的标记对GBLUP、BayesCπ和加权GBLUP三种基因组选择方法的预测准确性进行评估并与传统基于系谱的BLUP方法进行比较,评估方法采用5倍交叉验证;
4)参考群体基因组估计育种值GEBV
选用步骤3)中确定的最适标记密度和预测准确性最高的基因组选择方法,估算参考群体中每个个体的GEBV并将同一家系中所有个体GEBV均值作为该家系GEBV。
2.如权利要求1所述的方法,其特征在于,所述的步骤1)中抗病表型使用二项性状作为表型,0表示在感染实验中死亡的个体;1表示存活率。
CN202010008261.3A 2020-01-06 2020-01-06 一种罗非鱼基因组选择育种方法 Active CN111128306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010008261.3A CN111128306B (zh) 2020-01-06 2020-01-06 一种罗非鱼基因组选择育种方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010008261.3A CN111128306B (zh) 2020-01-06 2020-01-06 一种罗非鱼基因组选择育种方法

Publications (2)

Publication Number Publication Date
CN111128306A CN111128306A (zh) 2020-05-08
CN111128306B true CN111128306B (zh) 2023-09-22

Family

ID=70486873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010008261.3A Active CN111128306B (zh) 2020-01-06 2020-01-06 一种罗非鱼基因组选择育种方法

Country Status (1)

Country Link
CN (1) CN111128306B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112877446B (zh) * 2021-03-26 2022-06-07 中国水产科学研究院珠江水产研究所 一种与罗非鱼耐碱性相关的snp标记及其应用
CN113373245A (zh) * 2021-07-14 2021-09-10 广东海洋大学 基于全基因组选择的马氏珠母贝金黄壳色性状良种培育方法
CN113678767B (zh) * 2021-08-10 2022-08-23 中国水产科学研究院黄海水产研究所 一种对虾抗病性状的选育方法
CN114015789A (zh) * 2021-12-06 2022-02-08 中国水产科学研究院黄海水产研究所 一种东星斑抗病良种培育的基因组选择方法
CN115553234B (zh) * 2022-03-17 2023-09-29 南通龙洋水产有限公司 一种广谱抗菌罗非鱼优良品种的选育方法
CN114410746B (zh) * 2022-03-29 2022-07-12 中国海洋大学三亚海洋研究院 一种东星斑分子溯源选择育种方法及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010020252A1 (en) * 2008-08-19 2010-02-25 Viking Genetics Fmba Methods for determining a breeding value based on a plurality of genetic markers
CN106480189A (zh) * 2016-10-18 2017-03-08 中国水产科学研究院黄海水产研究所 一种基于全基因组选择的鱼类抗病良种培育方法
CN107338321A (zh) * 2017-08-29 2017-11-10 集美大学 一种确定最佳snp数量及其通过筛选标记对大黄鱼生产性能进行基因组选择育种的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010020252A1 (en) * 2008-08-19 2010-02-25 Viking Genetics Fmba Methods for determining a breeding value based on a plurality of genetic markers
CN106480189A (zh) * 2016-10-18 2017-03-08 中国水产科学研究院黄海水产研究所 一种基于全基因组选择的鱼类抗病良种培育方法
CN107338321A (zh) * 2017-08-29 2017-11-10 集美大学 一种确定最佳snp数量及其通过筛选标记对大黄鱼生产性能进行基因组选择育种的方法

Also Published As

Publication number Publication date
CN111128306A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111128306B (zh) 一种罗非鱼基因组选择育种方法
CN106480189B (zh) 一种基于全基因组选择的鱼类抗病良种培育方法
AU2011261447B2 (en) Methods and compositions for predicting unobserved phenotypes (PUP)
WO2023103303A1 (zh) 东星斑抗病良种培育的基因组选择方法
CN105010233A (zh) 一种应用snp辅助选择育种技术培育高繁殖性能种兔的方法
CN112410435A (zh) 一种大黄鱼基因组育种芯片及应用
CN110867208A (zh) 一种提高水产动物全基因组选择育种效率的方法
US20210269887A1 (en) Method and application for rapid and accurate chromosomal location of economic traits in laver
CN105925698A (zh) 早期筛选中间球海胆良种的snp引物及筛选方法
CN116469466B (zh) 一种高效预测菊花耐涝性的方法及其应用
Zhao et al. A public mid-density genotyping platform for alfalfa (Medicago sativa L.)
CN114410746B (zh) 一种东星斑分子溯源选择育种方法及其应用
CN110468226B (zh) 杨树抗叶锈病的分子标记及其应用
CN101565744B (zh) 一种三疣梭子蟹多元高通量遗传标记系统及遗传分析方法
CN107937569A (zh) 一种用于刺参生长性状辅助选择育种的分子标记及其应用
CN114752683A (zh) 一种与多鳞鱚性别性状相关的qtl位点的构建方法
CN108588242B (zh) 一种长牡蛎ahr基因的snp位点
CN109136392B (zh) 多代减数分裂雌核发育团头鲂的遗传多样性鉴定方法及试剂
CN113073143B (zh) 利用三种单倍型检测水稻产量性状的方法
CN111354417B (zh) 一种基于admixture-mcp模型估计水产动物基因组品种组成的新方法
Zhai Application of Various Genomic Selection Models in Cotton Fiber Quality
CN108300797B (zh) 陆地棉25号染色体与纤维强度相关的单体型
Dussault Applications of low and high density SNP arrays to Atlantic salmon breeding: Parameters affecting parentage assignment accuracy and mapping quantitative trait loci for infectious salmon anemia resistance
CN117637023A (zh) 一种整合基因组和根际微生物组学数据的玉米杂交种表型预测方法
Falaknaz et al. Evaluation and comparison of SSR, ISSR, and retrotransposon molecular markers in the study of genetic diversity of Aegilops tauschii as wild ancestor of wheat

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant