CN112391479A - 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法 - Google Patents

基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法 Download PDF

Info

Publication number
CN112391479A
CN112391479A CN202010386434.5A CN202010386434A CN112391479A CN 112391479 A CN112391479 A CN 112391479A CN 202010386434 A CN202010386434 A CN 202010386434A CN 112391479 A CN112391479 A CN 112391479A
Authority
CN
China
Prior art keywords
genes
fat deposition
sequencing
analysis
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010386434.5A
Other languages
English (en)
Inventor
鲁云风
张博
王力园
张雅文
张�浩
雷霆
邵亚伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanyang Normal University
Original Assignee
Nanyang Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanyang Normal University filed Critical Nanyang Normal University
Priority to CN202010386434.5A priority Critical patent/CN112391479A/zh
Publication of CN112391479A publication Critical patent/CN112391479A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于多组学的南阳黑猪脂肪沉积性状基因挖掘方法,本发明为了解决现有方法对猪脂肪沉积性状基因挖掘识别准确率低的问题,通过运用高通量测序技术对六对全同胞或半同胞个体的6月龄具有极端背膘厚、肌内脂肪含量的南阳黑猪个体的背最长肌的转录组测序,并在表型测定的基础上和生物信息学分析的帮助下,寻找鉴定重要的脂肪沉积候选基因,同时对2组南阳黑猪进行基因组重测序,找出重要的脂肪沉积候选差异基因,通过整合转录组数据、重测序数据及QTL数据库信息以及生物信息学和功能基因组学方法,筛选组间显著差异表达基因,并预测其基因功能和信号通路。

Description

基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法
技术领域
本发明属于猪遗传(分子)标记辅助选择技术领域,涉及猪脂肪沉积性状基因的定位 分析、基因相关功能分析、猪脂肪沉积性状相关基因突变位点的分析等,具体为一种基于 多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法。
背景技术
筛选和挖掘影响猪肉质性状的功能基因是猪分子育种研究的热点。目前评价猪肉品质 的指标主要有背膘厚、肉色、pH、嫩度、滴水损失、蒸煮损失和肌内脂肪含量等。研究表明,背膘厚度与许多肉质性状有着显著的表型相关和遗传相关。Suzuki等(2005)对543 头杜洛克猪肉质性状进行分析发现,背膘厚度与肌内脂肪含量、肉色L*值、pH和导电性 呈正相关,与嫩度、滴水损失、蒸煮损失、肉色评分和总的胶原蛋白量呈负相关;Schwab 等(2010)分析了145头杜洛克猪的生长性状和肉质性状,发现背膘厚度与肌内脂肪含量 有着较强的正相关,与肉色、嫩度和风味有着弱的正相关,与眼肌面积有较强的负相关, 与生长速度、pH、多汁性有着较弱的负相关。肌内脂肪含量是猪肉食用品质的主要决定因 素,测定脂肪酸组成,可以作为评价猪脂肪品质的标准(Hugo and Roodt,2007),因此背 膘厚、肌内脂肪含量等脂肪沉积性状是决定猪肉品质的重要内容和评价指标。
随着猪肌内脂肪主基因和候选基因的发现,为我们进一步认识肌内脂肪的遗传机制奠 定了基础,同时也为加快猪肉品质的遗传改良提供了新途径。然而脂质的沉积与代谢是受 多基因控制的复杂数量性状(Fontanesi et al.,2010),控制猪肉质性状的主效基因不止 一个,采用候选基因法不仅工作量巨大,而且即使通过此方法发现了候选基因具有较大效 应,仍不能确认候选基因本身就是脂质等肉质性状的主效基因,而可能只是一种遗传标记。
建立在高通量测序基础上的转录组研究已逐步取代基因芯片技术成为目前从全基因 组水平研究基因表达的主流方法,对同一样品深度测序可以捕获低表达的基因,而对大量 样品同时测序可以获得样品之间的表达差异。此外,研究人员还可以获得转录本表达丰度、 转录发生位点、可变剪切、新转录本和SNP等重要信息,因此转录组测序越来越多地用于 各种生物的差异表达基因的筛选及可变剪切的鉴定等方面。
基因组的重测序是高通量测序在基因组水平上的另一个重要的方面。根据全基因组重 测序的结果,科研人员能够快速的找出测序样本和参考基因组序列之间的差异信息,预测 出与重要性状显著相关的候选基因。因此,全基因组测序已经逐步发展为家畜研究中的一 种快速、有效地手段。
转录组测序虽然能产生更多的信息,比如基因表达水平和剪接模式,但这种方法无疑 将错过一些低表达基因(Elizabeth et al.,2010),因此整合转录组测序和基因组测序 信息以挖掘出关键差异表达基因成为当前的研究热点。
南阳黑猪是分布于我国河南省南阳地区的优良地方猪种,属于早熟易肥、体型中等的 肉脂兼用型猪,腰平直,背宽平,腹大,四肢粗壮,耳根较硬,耳大盖眼,性情温和,耐粗饲,抗病力强,性成熟早,繁殖力强,耐近交,肉质鲜美,是豫西南一个重要的地方猪 种,于1986年收录于《河南地方优良畜禽品种志》,2014年更进一步获国家地理标志证 明商标证书,是研究我国地方猪肉质和遗传基础的良好实验材料。
近年来,种质资源的利用逐渐受到重视,遗传资源评估和开发利用的相关研究层出不 穷,南阳黑猪作为我国的重要国家地理标志,其遗传资源情况尤其是基因水平的遗传资源 情况需要做进一步的研究分析。
现有的猪脂肪沉积性状基因挖掘方法普遍存在识别准确率低的问题,需要一种高效准 确的基因挖掘方法。
发明内容
(一)解决的技术问题
本发明为了解决现有方法对猪脂肪沉积性状基因挖掘识别准确率低的问题,提供一种 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法。
(二)技术方案
为实现上述目的,本发明以六对全同胞或半同胞个体的6月龄南阳黑猪为研究对象, 根据背膘厚、脂肪酸等指标把6对南阳黑猪分为高脂肪性状组和低脂肪性状组,进行转录 组测序和全基因组重测序,基于不同性状的组学测序数据,应用特定生物信息学分析方法,筛选出与南阳黑猪脂肪沉积性状相关联的基因和变异,将转录组测序结果与基因组重测序结果进行联合分析,寻找在转录组组间差异基因和基因组组间差异基因的交集基因,最后通过信息整合从中挖掘基于多组学的南阳黑猪脂肪沉积性状相关关键基因,具体技术方案为:一种基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,包括以下步骤:
(1)黑猪表型测定:选取12头190日龄南阳黑猪,取黑猪背最长肌中段最后肋与第一腰椎间肌肉组织放入冻存管中并迅速投入液氮罐中冻存;
(2)转录组测序:以cDNA文库构建方法构建cDNA文库,构建好的文库使用Illumina-HiSeq平台和双末端各150bp的PE150进行测序;
(3)全基因组重测序;
(4)转录组测序结果与基因组重测序结果进行联合分析。
进一步的,所述步骤(1)黑猪表型测定还包括以下步骤:
1)取黑猪鲜肉样本测定肉质指标,所述肉质指标包括pH值、肉色、大理石纹、24h滴水损失、48h滴水损失、蒸煮损失、剪切力;
2)取新鲜的黑猪背最长肌样品20g,切碎剔除结缔组织和筋膜,匀浆机中搅碎,测定 肌肉组织中肌内脂肪含量和含水量;
3)对匀浆后的肌肉组织进行烘干,继续搅碎成粉末状,测定并计算脂肪酸含量、十八种必需氨基酸含量;
4)根据步骤1)至步骤3)获得的数据和脂肪沉积能力选择样品并分组,进行后续的转录组测序分析;
5)对12头黑猪背最长肌肌肉组织进行组织切片和油红O染色分析,验证分组的准确 性。
进一步的,所述步骤(2)转录组测序还包括以下步骤:
1)对转录组原始数据进行过滤得到可用于分析的数据,进行基因组序列比对分析、 表达定量分析、差异分析;
2)以Q值小于0.01,fold-change大于2或者小于-2为筛选标准,对所有的阳性共表达基因进行差异表达分析获得差异表达基因的个数;
3)对差异表达基因进行GO和KEGG富集分析,判定差异表达基因主要影响肌内脂肪沉积的生物学功能或者通路;
4)选择ACACA、GK、SQLE、FASN、SCD、DHCR24、ACSL4、CAT、PPARA、UCP3、SP1、 DUSP4和IRX3共13个基因进行qRT-PCR验证。
进一步的,所述步骤(3)全基因组重测序具体步骤如下:
1)取样同转录组,用液氮保存组织样品;
2)取10mg(绿豆粒大小)黑猪背最长肌组织样进行全基因组DNA提取;
3)获取全基因组重测序数据;
4)对全基因组脂肪沉积进行GO富集分析和KEGG通路富集分析,判定差异基因主要影响肌内脂肪沉积的生物学功能或者通路。
进一步的,所述步骤(4)中转录组组间差异基因和基因组组间差异基因的交集基因 有CTNNA3、FASTKD1、HAT1、COMMD4、PLP1、CREB5、NHSL2、ITGA6、BBS5。
进一步的,所述差异表达基因主要影响肌内脂肪沉积的通路有:Steroidbiosynthesis、PPAR signaling pathway、Notch signaling pathway、Fatty acidmetabolism、Fatty acid biosynthesis、AMPK signaling pathway。
进一步的,所述主要影响肌内脂肪沉积的生物学功能的差异基因有:PDPK1、BBS9、GPR174、LRP2、MID1IP1、PDZD11、ACAT2、AOAH、CADPS2、CERS6、ESYT2、IPPK、LMF1、 NRG4、OSBPL3、PCCA、PLP1、ITGA6、COMMD4。
(三)有益效果
与现有技术相比,本发明提供了一种基于多组学的南阳黑猪脂肪沉积性状关键基因挖 掘方法,基于转录组测序和全基因组重测序技术,以背膘厚和肌内脂肪含量等指标为南阳 黑猪脂肪沉积性状表型,筛选具有极端表型的2组南阳黑猪个体(全同胞或半同胞)对背 最长肌组织进行测序,整合测序结果,检测出两组间的差异表达基因和基因变异,在表型 测定的基础上和生物信息学分析的帮助下,准确高效地挖掘鉴定重要的脂肪沉积候选基 因,进一步揭示种质特性形成的分子机制,为辅助后期保种、育种工作奠定了基础。
附图说明
图1为本发明的黑猪背最长肌肌肉组织油红O染色结果图;
图2为本发明的黑猪背最长肌肌肉组织油红O染色及脂肪含量分析图表;
图3为本发明转录组数据在基因组中比对信息图表;
图4为本发明序列比对及差异分析中FPKM值的密度分布图及基因表达的箱线图;
图5为本发明基因表达组内及组间相关性分析示意图;
图6为本发明差异基因分析及聚类情况分析图;
图7为本发明DEGs KEGG信号通路富集分析结果图;
图8为本发明qRT-PCR验证候选基因表达趋势分析结果图表;
图9为本发明全基因组脂肪沉积功能富集分析的GO term图;
图10为本发明全基因组脂肪沉积功能富集分析的KEGG PATHWAY图;
图11为本发明转录组和重测序联合分析结果图。
具体实施方式
下面将结合本发明具体实施方式及附图,对本发明的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
请参阅图1-11,本发明提供以下技术方案:
1.南阳黑猪表型测定
12头190日龄南阳黑猪采自南阳内乡顺发黑猪场,全部猪均在同一自然条件下生长, 试验期间实验猪均自由采食及饮水,定期对猪舍进行清理、消毒,防疫等均按照猪场常规 免疫程序进行。试验日粮以玉米、杂粕为主,适当添加碎米、蔬菜、落果和细糠。屠宰在龙大牧原公司进行。取南阳黑猪背最长肌中段最后肋与第一腰椎间肌肉组织放入冻存管中并迅速投入液氮罐中冻存。切片样品尽量取完整的肌肉组织,同样置于液氮中保存。
取南阳黑猪鲜肉样本分别测定各项肉质指标,包括屠宰一小时后pH值、屠宰24小时 后pH值、肉色、大理石纹、24h滴水损失、48h滴水损失、蒸煮损失、剪切力等。同时取 新鲜的南阳黑猪背最长肌样品20g左右,切碎后仔细剔除结缔组织和筋膜,匀浆机中搅碎, 运用索氏抽提法测定肌肉组织中肌内脂肪含量和含水量。同时对匀浆后的肌肉组织进行烘 干后,继续搅碎成粉末状,送中国农业科学院农产品加工所进行脂肪酸含量测定,以气相 色谱法测定,采用面积归一化法,依据峰面积计算每种脂肪酸和十八种必需氨基酸的相对 百分含量。十二头190日龄南阳黑猪屠宰数据如表1、2所示,胴体重平均值为50.65kg, 平均背膘厚为34mm。胴体重与背膘厚度没有明显的关系如表1所示,表2为检测南阳黑猪 背最长肌组织肉质情况,全同胞半同胞个体内差异较明显。
表1南阳黑猪屠宰数据
Figure BDA0002484157280000061
表2南阳黑猪肉质数据
Figure BDA0002484157280000062
Figure BDA0002484157280000071
总脂肪酸和总氨基酸含量及肌内脂肪(IMF)含量、含水量等结果见表3。在同一组全 同胞或半同胞内,除全同胞组3、4外,总脂肪酸含量和总氨基酸含量呈相反趋势,而且总脂肪酸与总氨基酸总水分的加和为98.89±1.6659。
表3南阳黑猪肉肌肉脂肪酸和氨基酸含量
Figure BDA0002484157280000072
在以上表型信息分析中,本专利发现在半同胞组1和全同胞组1、2中,两个个体均呈现明显的不同脂肪沉积能力,背膘厚越厚,IMF含量越高,剪切力越小,总脂肪酸量/ 干物质越高,而总氨基酸/干物质越低。因此,本专利选择NB01-06样品进行后续的转录 组测序分析,其中分别编号为HF01(NB01)、LF01(NB02)、HF02(NB03)、LF02(NB04)、 HF03(NB05)、LF03(NB06)。
为了验证分组的准确性,本专利对所有的12个南阳黑猪背最长肌肌肉组织进行了组 织切片和油红O染色分析。具体方法为在液氮中取出后切成1cm方块样置于30%蔗糖溶液 中置换3h,之后将样品放入-80℃冰箱中冻存,之后按照冰冻切片的方法对肌肉样品进行 冰冻切片操作,切片厚度为10μm;切片完成后将切片放入10%甲醛溶液中固定,然后依次进行油红O染色和苏木精-伊红染色,在低倍显微镜下拍照保存;运用ImageJ软件对肌 内脂肪面积占肌肉总面积的比值进行了进一步的分析。根据表型信息,本专利在12头南 阳黑猪个体中挑选了3组全同胞共6个个体的南阳黑猪进行下一步分析,其中每组全同胞 内包括一个高脂肪沉积组和低脂肪沉积组。
其中对HF01-03,LF01-03六个个体本专利进行了进一步的肌内脂肪含量分析,在放 大倍数:10×100下观察结果如图1及图2所示。高脂肪组油红O显色面积明显大于低脂肪组,肌内脂肪含量高于低脂肪组,除HF02与LF02差异不显著外,其余两组均差异显著。 该结果说明,以上分组情况是科学而可靠的,全同胞半同胞个体在遗传背景相似的情况下 表现出明显的表型差异,基因的表达情况是影响表型的重要因素,在此基础上进行转录组 和基因组重测序分析,能够帮助本专利精准的确定猪肌内脂肪沉积相关候选基因。图2中 不同字母表示差异显著(p<0.05)。
2.转录组测序
Trizol法提取南阳黑猪背最长肌肌肉组织总RNA,并对总RNA添加RNase-freeDNase 处理以去除DNA污染。RNA的完整性检验由1%的琼脂糖凝胶电泳来检测,RNA的质量和总 RNA量由Nanodrop 2000(Thermo Fisher Scientific.USA)测定。所有样品RNAintegrity number(RIN)值均在7以上。cDNA文库的构建总共使用了2ug的总RNA,按照通用的cDNA 文库构建方法构建本次实验的cDNA文库。构建好的文库使用Illumina-HiSeq平台和双末 端各150bp的PE150进行测序。
2.1序列比对及差异分析
对得到的转录组学Raw data进行数据过滤得到clean data,过滤包括含有接头序列 的序列、含有poly-N结构的序列和Q<20的低质量序列。将得到的clean data通过hisat2软件与猪Sus scrofa.Sscrofa11.1基因组序列进行比对分析,参数设置采用默认设置, 即只允许不超过2bp的错配。进而通过FPKM(Fragments per Kilobase Millon MappedReads)方法用HTSeq2进行表达定量分析。DESeq2是检测两组有重复的样品间基因差异表达情况良好的软件,本专利这里用DESeq2对两组南阳黑猪样品进行差异分析。多重检验 中FDR(False discovery rate)是衡量差异显著性的重要指标。在这里,本专利采用了 FDR<0.01和fold-change>2或<-2为检测阈值,确定显著差异表达基因情况。
RAW DATA经过滤后,本专利总共获得了359G的RAW DATA,经过滤后共获得339G的Clean Data,Clean Reads占比均在92%以上,Clean Q30 Bases Rate均在93%以上。与 猪基因组Sus Scrofa 11.1比对率均在94%以上,其中83%以上的比对序列在外显子区内,内含子区和基因间区占比均在8%以下(如图3所示)。因此,本专利的转录组数据量较大,质量较好,可信度较高,可以进行下一步分析。
通过引用FPKM值的方法计算了猪25,879个基因的表达量,在去除所有六组数据均不 表达的基因外,本专利总共获得了16,597个阳性共表达基因,FPKM值的密度分布图显示六组转录组数据的FPKM值分布一致(如图4所示,图中A为密度分布图,B为基因表达箱 线图),均有两个峰存在,而基因表达的箱线图中,中位数数值分布也相一致,因此本专 利的数据是可靠的,阳性共表达基因的确定也是合理的,可以进行后续的差异表达基因分 析。
为了确定本专利对高脂肪沉积组(HF组)和低脂肪沉积组(LF组)分组的准确性,本专利分别在FPKM值和Count数的角度对六组基因表达进行了组内和组间相关分析,具 体结果如图5所示(图5中,A:以FPKM值为分组依据;B:以基因Count数为分组依据)。 无论从FPKM值还是基因Count数的角度分析,高脂肪沉积组(HF01、HF02、HF03)都聚 集在一起,和低脂肪沉积组(LF01、LF02、LF03)明显分开,而且组内相关系数也高于组 间的相关系数。基因表达相关分析说明,本专利的分组是合理的,而猪表型上的差异也相 应的体现在了猪的基因表达上,因此,本专利采用转录组分析的方法研究相似遗传背景下 的猪脂肪沉积相关基因是可靠的,得到的候选基因也是合理的。
2.2差异基因功能分析
由于组间重复的存在,本专利采用了DESeq方法对所有的阳性共表达基因进行了差异 表达分析,以Q值小于0.01,fold-change大于2或者小于-2为筛选标准,本专利共确定了481个显著差异表达(DEG)的基因,其中150个基因在高脂肪沉积组中下调表达,331 个基因在高脂肪沉积组中上调表达,差异基因聚类情况如图5B、图6所示。在高脂肪组中 上调表达基因数目大于下调表达基因数目,这也与先前的研究相一致。另外,包括SCD、 ACSL4、PPARA等脂肪代谢重要相关基因均在本专利的显著差异表达基因中,这也与之前的 很多相关研究相一致。总之显著差异基因分析情况说明,差异分析方法可靠,结果可信, 可以进行后续功能分析。
2.3DEGs功能及富集分析
为了更好的阐释DEGs的功能,并分析DEGs与肌内脂肪沉积的相关性,本专利对481个DEG分别进行了GO和KEGG分析。以gene number≥2,Pvalue<0.1为筛选标准,本专 利在GO的三个主要部分Biological Process(BP),Cell Component(CC),Molecular Function(MF)中分别注释了47个、16个和14个GO条目。481个DEG主要参与的GO条 目功能为基因表达的转录调控和细胞活动的供能。
同时,以Pvalue<0.05,gene number≥3为筛选标准,本专利确定了20条显著富集的KEGG信号通路。其中包括多条与脂肪的形成和代谢相关的信号通路,包括Steroidbiosynthesis、PPAR signaling pathway、Notch signaling pathway、Fatty acidmetabolism、Fatty acid biosynthesis、AMPK signaling pathway等,与脂肪的形成和 代谢相关的信号通路占总显著富集通路的50%以上如图10所示。
2.4定量PCR验证转录组测序结果
为了验证转录组测序结果的可靠性,本专利选择了包括ACACA、GK、SQLE、FASN、SCD、 DHCR24、ACSL4、CAT、PPARA、UCP3、SP1、DUSP4和IRX3等共13个基因进行了qRT-PCR 验证,这其中既有在高脂肪组中上调表达的基因(ACACA、GK、SQLE、FASN、SCD、DHCR24、 PPARA、SP1、DUSP4、IRX3),也有下调表达的基因(ACSL4、CAT、USP3),既有相对高 丰度表达基因(basemean>1000,ACSL4,CAT,SCD,UCP3,IRX3),又有相对低丰度表达 基因(basemean<200,SQLE,GK,PPARA),跨内含子引物设计均由PRIMER5软件完成。 反转录反应及定量PCR反应均由北京天根生物科技公司试剂盒完成(货号KR116,FP215)。 基因相对表达量通过HPRT内参校正而来,计算方法采用2-ΔΔCt。QRT-PCR的结果计算 由SAS9.2中的ANOVO程序完成,结果以means±SE(n=6)显示。
针对本专利得到的14个重要的肌内脂肪沉积相关候选基因,本专利采用了实施荧光 定量PCR的方法对这14个基因在背最长肌(LD)及背部脂肪(BF)的表达情况进行了分析。所有14个基因在LD组织中的表达趋势和转录组分析的结果都是相一致的,而除ACACA基因外,另外13个基因在BF组织中的表达趋势也和转录组的结果相一致,如图8所示。 结果说明,转录组测序的结果是可靠的。
3.全基因组重测序
3.1实验动物及样品采集
取样同转录组,用液氮保存组织样品。具体重测序样品信息如表4。
表4全基因组重测序实验个体信息
Figure BDA0002484157280000111
3.2全基因组DNA提取方法
(1)取约10mg(绿豆粒大小)猪背最长肌组织样尽力剪碎加入600ul组织DNA提 取液(裂解液)混匀;
(2)加入蛋白酶K 20mg/ml 4ul-5ul至终浓度150-200ug/ml,50-55度消化过夜;
(3)加入等体积(600ul)的Tris饱和酚(pH8.0),快速颠倒离心管10min,12000rpm离心10min,用大口径的枪头小心吸取上清液至干净的离心管;
(4)加入等体积酚:氯仿(1:1)(各300ul),缓慢颠倒离心管10min,12000rpm离 心10min,用大口径的枪头小心吸取上清液至干净的离心管;
(5)加入等体积氯仿(500ul),缓慢颠倒离心管10min,12000rpm离心10min, 吸取上清液至干净的离心管;
(6)加入2倍体积冰冻的无水乙醇(850ul)沉淀DNA,室温旋转(上下颠倒)1min 左右至致密的絮状DNA出现,12000rpm离心10min,倒掉液体,注意不要把DNA倒掉;
(7)加入70%的乙醇1000ul洗涤DNA沉淀,12000rpm离心5min,倒掉液体后再3000rpm离心1min,将剩余的70%的乙醇用枪吸出来,放在干燥箱里10秒加,取出加入适 量TE(50-100ul)(pH8.0)溶解DNA;
(8)待DNA完全溶解后用再离心3000rpm离心1min;
(9)分光光度计检测浓度和纯度;
(10)质量由核酸纯度A260/280(1.8-2.2)和凝胶电泳(单一条带,无降解)进行 控制。
3.3全基因组重测序数据的获取
检测合格的DNA样品被打断成300~500bp片段,接着进行末端修饰,加上Illumina测序接头,通过2%的凝胶电泳选择400~500bp的产物,接着进行LM-PCR扩增,进行测 序文库制备。文库测序采用的是Illumina HiSeq 2500进行双末端(pair-end)测序,每 个个体获得10x基因组的覆盖度、不低于28G的测序数据量,由Illumina HiSeq Control Software软件控制整个流程。基因组重测序由北京安诺优达有限公司(中国北京)完成。
将测序获得的片段进行质量检测,把末端质量值小于20,长度小于35的片段过滤掉。 将剩下的通过质量检测的片段用BWA软件(Li et al,2009)将之比对到猪的最新参考基 因组上,接着用samtools软件(Li and Durbin,2011)对比对的bam文件进行排序和过滤。为了获得高质量的变异信息,采用GATK工具集进行SNP calling(McKenna,et al.,2010)。首先利用GATK的HaplotypeCaller包来得到每个个体包含每个位点比对信息的g.vcf文件。接着利用GenotypeGVCFs包,合并所有个体的g.vcf并获得原始的变异信息。 最后用VariantFiltration过滤掉低质量的SNP,用python脚本过滤缺失值,保留缺失率 小于0.1的SNP数据。然后从Ensemble上下载猪基因组gff文件,用ANNOVAR软件(Wang et al.,2010)进行SNP注释。注释后的SNP,统计其在基因组各区间的分布情况,结果 见表5。
表5 SNP统计分布
Figure BDA0002484157280000131
利用GATK软件采用HaplotypeCaller模式和GVCF文件进行个体InDel检测,过滤得到InDel的VCF文件,使用ANNOVAR软件及已有的基因组注释文件(gff)对每个样本检 测到的InDel进行相应的注释,统计其在基因组各区间的分布情况,结果见表6。
表6 InDel分布统计
Figure BDA0002484157280000141
3.4全基因组脂肪沉积选择信号及功能富集分析
新一代测序技术能够筛选全基因组区域的正选择基因。基于FST选择信号分析,Fst 分析主要使用的是Vcftools(Danecek et al.,2011)软件,窗口设为10kb,步长设为5kb,高-低脂肪沉积组共6个样品的猪进行两两之间的比较,其前1%的窗口被设为潜在的候选窗口,使用Ensemble网站(http://asia.ensembl.org/biomart/martview/)提取窗 口相关基因作为候选基因。对Fst分析候选基因分别使用在线数据库DAVID (https://david.ncifcrf.gov/)进行GO富集分析和KEGG通路富集分析。
如图9所示,对SNP和InDel变异所在全部基因进行功能注释,将含每个组中特异性的含有这种突变的基因找出来,进行功能聚类分析,以便鉴定出对表型有意义的基因及其变异。通过生物信息学分析,共找到有功能注释的组间差异基因209个,这些基因GO富 集主要集中在RNA聚合酶启动子的调控、磷酸化、ATP酶的活性、DNA酶的活性、蛋白酶 的活性等;如图10所示,KEGG信号分析主要集中在mTOR信号通路,甲状腺信号通路,神 经营养蛋白分子信号通路以及ABC转运蛋白信号通路等,其中涉及脂质代谢及转运、脂肪 酸合成与代谢等脂肪性状相关基因19个(PDPK1、BBS9、GPR174、LRP2、MID1IP1、PDZD11、 ACAT2、AOAH、CADPS2、CERS6、ESYT2、IPPK、LMF1、NRG4、OSBPL3、PCCA、PLP1、ITGA6、 COMMD4)。
4.转录组和重测序联合分析
将转录组测序结果与基因组重测序结果进行联合分析,在480个转录组组间差异基因 和389个基因组组间差异基因的交集中,如图11所示,两组的显著差异表达基因交集有9 个基因(CTNNA3、FASTKD1、HAT1、COMMD4、PLP1、CREB5、NHSL2、ITGA6、BBS5),其中 3个基因(COMMD4、PLP1、BBS5)涉及脂肪细胞分化,具体表达信息如表7所示。
表7转录组和重测序交集差异基因
Figure BDA0002484157280000151
Figure BDA0002484157280000161
通过对比重测序数据与转录组的差异表达基因,在上面发现很多的基因组变异。表7 显示出现在一些关键基因上的可能影响到表达的突变。
综上,本发明通过运用高通量测序技术对六对全同胞或半同胞个体的6月龄具有极端 背膘厚、肌内脂肪含量的南阳黑猪个体的背最长肌的转录组测序,并在表型测定的基础上 和生物信息学分析的帮助下,寻找鉴定重要的脂肪沉积候选基因,同时对2组南阳黑猪进 行基因组重测序,找出重要的脂肪沉积候选差异基因,通过整合转录组数据、重测序数据 及QTL数据库信息以及生物信息学和功能基因组学方法,筛选组间显著差异表达基因, 并预测其基因功能和信号通路,有效解决了现有方法对猪脂肪沉积性状基因挖掘识别准确 率低的问题。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽 管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以 对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡 在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,包括以下步骤:
(1)黑猪表型测定:选取12头190日龄南阳黑猪,取黑猪背最长肌中段最后肋与第一腰椎间肌肉组织放入冻存管中并迅速投入液氮罐中冻存;
(2)转录组测序:以cDNA文库构建方法构建cDNA文库,构建好的文库使用Illumina-HiSeq平台和双末端各150bp的PE150进行测序;
(3)全基因组重测序;
(4)转录组测序结果与基因组重测序结果进行联合分析。
2.根据权利要求1所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,所述步骤(1)黑猪表型测定还包括以下步骤:
1)取黑猪鲜肉样本测定肉质指标,所述肉质指标包括pH值、肉色、大理石纹、24h滴水损失、48h滴水损失、蒸煮损失、剪切力;
2)取新鲜的黑猪背最长肌样品20g,切碎剔除结缔组织和筋膜,匀浆机中搅碎,测定肌肉组织中肌内脂肪含量和含水量;
3)对匀浆后的肌肉组织进行烘干,继续搅碎成粉末状,测定并计算脂肪酸含量、十八种必需氨基酸含量;
4)根据步骤1)至步骤3)获得的数据和脂肪沉积能力选择样品并分组,进行后续的转录组测序分析;
5)对12头黑猪背最长肌肌肉组织进行组织切片和油红O染色分析,验证分组的准确性。
3.根据权利要求1所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,所述步骤(2)转录组测序还包括以下步骤:
1)对转录组原始数据进行过滤得到可用于分析的数据,进行基因组序列比对分析、表达定量分析、差异分析;
2)以Q值小于0.01,fold-change大于2或者小于-2为筛选标准,对所有的阳性共表达基因进行差异表达分析获得差异表达基因的个数;
3)对差异表达基因进行GO和KEGG富集分析,判定差异表达基因主要影响肌内脂肪沉积的生物学功能或者通路;
4)选择ACACA、GK、SQLE、FASN、SCD、DHCR24、ACSL4、CAT、PPARA、UCP3、SP1、DUSP4和IRX3共13个基因进行qRT-PCR验证。
4.根据权利要求1所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,所述步骤(3)全基因组重测序具体步骤如下:
1)取样同转录组,用液氮保存组织样品;
2)取10mg(绿豆粒大小)黑猪背最长肌组织样进行全基因组DNA提取;
3)获取全基因组重测序数据;
4)对全基因组脂肪沉积进行GO富集分析和KEGG通路富集分析,判定差异基因主要影响肌内脂肪沉积的生物学功能或者通路。
5.根据权利要求1所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,步骤(4)中转录组组间差异基因和基因组组间差异基因的交集基因有CTNNA3、FASTKD1、HAT1、COMMD4、PLP1、CREB5、NHSL2、ITGA6、BBS5。
6.根据权利要求3所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,所述差异表达基因主要影响肌内脂肪沉积的通路有:Steroid biosynthesis、PPAR signaling pathway、Notch signaling pathway、Fatty acid metabolism、Fattyacid biosynthesis、AMPK signaling pathway。
7.根据权利要求4所述的基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法,其特征在于,所述主要影响肌内脂肪沉积的生物学功能的差异基因有:PDPK1、BBS9、GPR174、LRP2、MID1IP1、PDZD11、ACAT2、AOAH、CADPS2、CERS6、ESYT2、IPPK、LMF1、NRG4、OSBPL3、PCCA、PLP1、ITGA6、COMMD4。
CN202010386434.5A 2020-05-09 2020-05-09 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法 Pending CN112391479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010386434.5A CN112391479A (zh) 2020-05-09 2020-05-09 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010386434.5A CN112391479A (zh) 2020-05-09 2020-05-09 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法

Publications (1)

Publication Number Publication Date
CN112391479A true CN112391479A (zh) 2021-02-23

Family

ID=74603781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010386434.5A Pending CN112391479A (zh) 2020-05-09 2020-05-09 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法

Country Status (1)

Country Link
CN (1) CN112391479A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151274A (zh) * 2021-04-15 2021-07-23 贵州省畜牧兽医研究所 一种调控猪脂肪沉积性能的新LncRNA应用、挖掘及鉴定方法
CN114451353A (zh) * 2022-02-24 2022-05-10 山东春藤食品有限公司 一种提高枣庄黑盖猪猪肉品质的饲养方法
CN115478113A (zh) * 2022-10-26 2022-12-16 中国农业科学院北京畜牧兽医研究所 一种肉牛脂肪酸组分候选标记多组学筛选方法及其应用
CN115579066A (zh) * 2022-12-09 2023-01-06 青岛兴牧畜牧科技发展有限公司 基于机器学习寻找影响猪脂肪沉积的候选基因的方法
CN116590435A (zh) * 2023-07-17 2023-08-15 中国农业大学 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
CN116705175A (zh) * 2023-06-08 2023-09-05 南京农业大学 一种跨物种比较基因组学数据库及其构建和分析方法
CN117373530A (zh) * 2023-10-26 2024-01-09 广州精检生物技术有限公司 一种生物信息分析方法、系统及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636638A (zh) * 2015-01-23 2015-05-20 安徽省农业科学院畜牧兽医研究所 不同品种猪背最长肌差异表达基因的筛选与注释方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636638A (zh) * 2015-01-23 2015-05-20 安徽省农业科学院畜牧兽医研究所 不同品种猪背最长肌差异表达基因的筛选与注释方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KAI XING: "Integration of Transcriptome and Whole Genomic Resequencing Data to Identify Key Genes Affecting Swine Fat Deposition" *
苗志国: "南阳黑猪与长白猪肉品质差异的机制研究" *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151274A (zh) * 2021-04-15 2021-07-23 贵州省畜牧兽医研究所 一种调控猪脂肪沉积性能的新LncRNA应用、挖掘及鉴定方法
CN113151274B (zh) * 2021-04-15 2024-01-19 贵州省畜牧兽医研究所 一种调控猪脂肪沉积性能的新LncRNA应用、挖掘及鉴定方法
CN114451353A (zh) * 2022-02-24 2022-05-10 山东春藤食品有限公司 一种提高枣庄黑盖猪猪肉品质的饲养方法
CN115478113A (zh) * 2022-10-26 2022-12-16 中国农业科学院北京畜牧兽医研究所 一种肉牛脂肪酸组分候选标记多组学筛选方法及其应用
CN115579066A (zh) * 2022-12-09 2023-01-06 青岛兴牧畜牧科技发展有限公司 基于机器学习寻找影响猪脂肪沉积的候选基因的方法
CN115579066B (zh) * 2022-12-09 2023-04-18 青岛兴牧畜牧科技发展有限公司 基于机器学习寻找影响猪脂肪沉积的候选基因的方法
CN116705175A (zh) * 2023-06-08 2023-09-05 南京农业大学 一种跨物种比较基因组学数据库及其构建和分析方法
CN116705175B (zh) * 2023-06-08 2023-12-29 南京农业大学 一种跨物种比较基因组学数据库及其构建和分析方法
CN116590435A (zh) * 2023-07-17 2023-08-15 中国农业大学 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
CN116590435B (zh) * 2023-07-17 2023-09-29 中国农业大学 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
CN117373530A (zh) * 2023-10-26 2024-01-09 广州精检生物技术有限公司 一种生物信息分析方法、系统及电子设备

Similar Documents

Publication Publication Date Title
CN112391479A (zh) 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法
Micheletti et al. Selection at a genomic region of major effect is responsible for evolution of complex life histories in anadromous steelhead
Buggiotti et al. Demographic history, adaptation, and NRAP convergent evolution at amino acid residue 100 in the world northernmost cattle from Siberia
Wang et al. Large-scale genomic analysis reveals the genetic cost of chicken domestication
Wang et al. Predictive ability of genomic selection models for breeding value estimation on growth traits of Pacific white shrimp Litopenaeus vannamei
Nanaei et al. Whole-genome resequencing reveals selection signatures associated with milk production traits in African Kenana dairy zebu cattle
Stone et al. Identification of genetic markers for fat deposition and meat tenderness on bovine chromosome 5: development of a low-density single nucleotide polymorphism map
Greminger et al. Generation of SNP datasets for orangutan population genomics using improved reduced-representation sequencing and direct comparisons of SNP calling algorithms
Pichler et al. Short tandem repeat (STR) based genetic diversity and relationship of domestic sheep breeds with primitive wild Punjab Urial sheep (Ovis vignei punjabiensis)
Naderi et al. Assessing selection signatures within and between selected lines of dual‐purpose black and white and German Holstein cattle
CN103937790B (zh) 一种与油菜种子硫苷含量紧密相关的分子标记及应用
Huang et al. Genome-wide association study reveals the genetic basis of growth trait in yellow catfish with sexual size dimorphism
CN109321665B (zh) 金湖乌凤鸡分子标记的筛选方法及其应用
Yang et al. Novel copy number variation of the BAG4 gene is associated with growth traits in three Chinese sheep populations
Rafiepour et al. Whole-genome resequencing reveals adaptation prior to the divergence of buffalo subspecies
Zheng et al. Genomic signatures reveal selection in Lingxian white goose
Ono et al. Quantitative trait loci mapping for the shear force value in breast muscle of F2chickens
CN113174441B (zh) 一种鸭剩余采食量相关的lncRNA及其应用
Piórkowska et al. Transcript variants of a region on SSC15 rich in QTLs associated with meat quality in pigs
CN113322333B (zh) 基于全基因组测序筛选的与广西麻鸡体尺和屠宰性状相关的cnv分子标记组合及应用
CN112921104B (zh) 一种辅助选择绵羊尾脂重量的可变剪切标志物及其检测引物和应用
CN116179714A (zh) 一种与鸡屠宰和肉质性状相关的分子标记及优质、屠宰加工型新品系选育方法
Wang et al. Association of growth traits with a structural variation downstream of the KCNJ11 gene: a large population-based study in chickens
Wang et al. Development of EST-SSRs from the ark shell (Scapharca broughtonii) transcriptome and their application in genetic analysis of four populations
CN113528675A (zh) 一种基于肌抑制素基因mstn鉴定鸭屠宰性状的分子标记及其鉴定方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination