CN116590435A - 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用 - Google Patents

一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用 Download PDF

Info

Publication number
CN116590435A
CN116590435A CN202310868459.2A CN202310868459A CN116590435A CN 116590435 A CN116590435 A CN 116590435A CN 202310868459 A CN202310868459 A CN 202310868459A CN 116590435 A CN116590435 A CN 116590435A
Authority
CN
China
Prior art keywords
snp
sequencing
rna
backfat thickness
pig
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310868459.2A
Other languages
English (en)
Other versions
CN116590435B (zh
Inventor
王楚端
刘华涛
丁向东
马福平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN202310868459.2A priority Critical patent/CN116590435B/zh
Publication of CN116590435A publication Critical patent/CN116590435A/zh
Application granted granted Critical
Publication of CN116590435B publication Critical patent/CN116590435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P60/00Technologies relating to agriculture, livestock or agroalimentary industries
    • Y02P60/80Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
    • Y02P60/87Re-use of by-products of food processing for fodder production

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用,本发明涉及动物基因工程领域,一种与猪背膘厚相关的因果候选基因,其特征在于:与猪背膘厚相关的因果候选基因的显著信号位点为SSC9:15828911,所述信号位点对应的调控基因为RAB30。本发明的有益效果为通过联合多组学数据能够快速、低成本、有效的对猪脂肪沉积的因果候选基因进行精细定位,其方法和结果能够为猪脂肪沉积的遗传解析和猪肉质改良的分子育种提供理论依据和重要参考。

Description

一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
技术领域
本发明涉及动物基因工程领域,具体为一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用。
背景技术
猪脂肪沉积性状作为一个复杂的数量性状,是猪生产及育种中最为重要的经济性状指标之一,也是现代猪育种工作的重要研究方向,最近十年里随着 GWAS 的广泛开展,大量的与猪脂肪沉积性状相关的 QTL 及候选基因被挖掘出来,但是鉴别其中的因果基因及致因突变成为后GWAS 时代的重要挑战。另外猪脂肪沉积的过程也是动态复杂的,是由多种分子和通路在多个维度共同调控,单一组学的研究方法是不足以推测与还原出猪脂肪沉积过程的调控机制。综合目前情况,使用多组学方法研究猪的复杂性状已逐渐成为趋势。
国内有多个公司或机构在这方面进行了研究,例如,公开号为CN114908056A,公开了一种表达猪PRV gDFc或gBFc融合蛋白的重组CHO细胞系及其构建方法和应用,其提供了一种表达猪伪狂犬病病毒gDFc或gBFc融合蛋白的重组CHO细胞系及其构建方法和应用,属于疫苗技术领域。本发明提供的重组CHO细胞系表达PRVgDFc或gBFc用于制备亚单位疫苗,免疫小鼠后能够产生较强的针对PRV的特异性免疫反应。利用本发明制备的重组CHO细胞系能够获得二聚体形态的gDFc和/或gBFc蛋白抗原,制备的亚单位疫苗能够激起机体产生强烈的体液免疫和细胞免疫反应,并对小鼠产生很好的保护效果,可作为一种很有前景的候选基因工程疫苗来预防猪伪狂犬病。还有公开号为CN114521533A,公开了一种黑盖猪核心群再选育方法。利用SNP芯片数据进行黑盖猪群体内个体间亲缘关系确定,提取所有种猪的基因组DNA,获得群体中黑盖猪的65000个SNPs位点信息;对黑盖猪群体的肉质相关基因和分子标记基因型分析;利用SNP芯片数据和分子标记的MBLUP育种值估计模型的确定;黑盖猪综合选择指数法确定和核心群个体的选择;本发明采用新的科学技术,利用SNP芯片数据进行黑盖猪群体内个体间亲缘关系确定,提取所有种猪的基因组DNA,通过数据建模以及利用PLINK软件对结果数据进行质控,大大提高了选育的精准性,使得黑盖猪繁育无论从数量还是肉类品质大大提高。
随着研究的深入,除了将不同的组学结果进行整合以探究复杂性状的调控机制,还发展了联合不同组学共同分析的方法。eQTL(Expression quantitative trait locus)分析是基因组和转录组数据联合分析中最常用的方法。不同于QTL 分析,eQTL分析通过测定基因组中数量性状基因的表达丰度,将基因表达丰度视作是数量表型,利用连锁分析或关联定位的方法来确定调控转录的基因组区域以及确定影响基因调控的遗传变异。而eQTL与复杂性状GWAS的联合分析有助于解释 SNP 对于性状的调控机制,从而进行更精细的定位。基本策略是基于 eQTL 和GWAS 信号的共定位分析,共定位信号提供了 eQTL 的靶基因与复杂性状之间可能存在因果关系的证据。
为了精细定位影响猪脂肪沉积的因果基因,本研究基于猪的背膘厚表型,同时利用基因组和转录组数据,通过GWAS和eQTL的共定位分析鉴定与脂肪沉积性状相关的候选基因,为猪脂肪沉积的遗传解析和猪肉质改良的分子育种提供理论依据和重要参考。
发明内容
为了克服现有技术的上述缺点与不足,本发明的目的在于提供一种与猪背膘厚相关的因果候选基因,以找到与猪的背膘厚表型相关的基因及其信息号位点。
本发明的另一个目的在于提供一种与猪背膘厚相关的因果候选基因的应用,为猪脂肪沉积的遗传解析和猪肉质改良的分子育种提供理论依据和重要参考。
本发明的另一个目的在于提供一种与猪背膘厚相关的因果候选基因的鉴定方法,可快速准确的鉴定与猪背膘厚相关的因果候选基因。
为了达到上述目的,本发明采用以下技术方案实现的。
一种与猪背膘厚相关的因果候选基因,其特征在于:与猪背膘厚相关的因果候选基因的显著信号位点为SSC9:15828911,所述信号位点对应的调控基因为RAB30。
一种与猪背膘厚相关的因果候选基因的应用,其特征在于:根据实施例1的一种与猪背膘厚相关的因果候选基因应用于猪的脂肪沉积的遗传解析。
一种与猪背膘厚相关的因果候选基因的应用,其特征在于:根据实施例1的一种与猪背膘厚相关的因果候选基因应用于猪肉质改良的分子育种。
一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:具体实施的步骤如下:
S101:样品采集及表型的测定,所有试验猪均有表型记录和系谱信息,且处于同样的饲养条件,于屠宰现场测定脂肪沉积表型,所述脂肪沉积表型为背膘厚,并割取背最长肌500g用以后续测序;
S102:基因型数据的获取,采集所有试验猪的背最长肌组织,利用高通量DNA提取试剂盒进行样品DNA的提取,提取后的DNA样品进行2种检测:
(1) 使用1%琼脂糖凝胶电泳方法分析DNA的纯度和完整性;
(2)使用Qubit对DNA浓度进行准确定量。将合格DNA样品浓度稀释至50ng/µl,使用猪50K液相芯片进行扫描和分型,该芯片包含全基因组范围内52,000个SNP;
通过DNA样品检测获得SNP进行质控处理,之后进行基因型数据填充,以上述试验猪群体的GenoBaits Porcine SNP50K Panel基因分型结果为基础,所述GenoBaitsPorcine SNP50K Panel为液相50K芯片,含核心SNP和区段SNP位点共108923个,以一千头以上含多个品种猪的全基因组测序数据作为参考群,将芯片数据填充至测序数据水平;
填充后SNP位点数为42523218个,对填充后的基因型数据按照进行质量控制;最终保留15389322个SNP;
S103:组织总RNA提取与测序,随机挑选所述试验猪中的四分之一以上的个体作为测序试验猪,对测序试验猪背最长肌进行mRNA建库测序,利用Trizol法提取36个样本的总RNA,并取2μL新提的RNA分别进行1%琼脂糖凝胶电泳检测RNA样品是否有降解及杂质,并用紫外分光光度计测定吸光度,通过评价方法对所得 RNA的质量进行评价获得高质量的RNA,之后对于高质量的RNA进行进一步测序。
S104:eQTL分析,利用MatrixEQTL v2.1.0建立基因组信息与基因表达之间的关系,通过利用最小二乘和 ANOVA 模型,将基因型的影响建模为加性线性或分类,检验每个单核苷酸多态性和每个转录本之间的关联关系,通过异方差和相关误差来解释样本的相关性, 并检测出基因型和协变量的相互作用,对样本中的17024个基因的表达谱和测序水平基因型数据进行关联分析,对每个基因-SNP对执行单独测试,并通过计算错误发现率来纠正多重比较,将校正后的 P 值小于0.05的SNPs认为是显著的,确定eQTL-eGene对,最终通过eQTL分析鉴定到了49131个cis SNP-gene,所述cis SNP-gene涉及33756个cis-SNPs和1041个cis-genes;
S105:GWAS分析,采用单性状线性混合模型,利用填充后的测序数据,所述的测序数据有15389322个SNP位点,对459个个体的平均背膘厚进行了全基因组的关联分析,采用FDR多重校正方法,发现312个显著SNP;
S106:GWAS与eQTL 的共定位分析,采用基于贝叶斯方法的coloc软件利用eQTL分析结果与平均背膘厚的GWAS分析结果进行共定位,找到可能参与调控基因表达以及表型变异的共同QTL,以SNP为桥梁确定影响对应表型的表达基因,结果显示9号染色体上存在比较多的显著位点,其中SSC9:15828911与显著eQTL重叠,SSC9:15828911与RAB30在eQTL分析中为显著cis SNP-gene调控对,且该位点共定位的后验概率为0.99993。
进一步,所述步骤S102中基因数据的质控标准依次如下:
1)过滤复等位基因;
2)去除性染色体和位置未知的位点;
3)去除检出率低于95%的SNP;
4)去除SNP位点的最小等位基因频率低于0.01的SNP;
5)去除严重偏离哈代-温伯格平衡(P<10-6)的SNP;
6)去除检出率低于90%的个体。
进一步,所述步骤S102中质量控制的原则如下:
1)去除MAF小于0.01的SNP位点;
2)去除哈代-温伯格平衡P<1×10-6的SNP位点;
3)去除分型缺失数大于5%的SNP位点;
4)根据填充准确性再次进行过滤,保留平均DR2大于0.9的位点。
进一步,所述步骤S103的评价方法具体如下:
凝胶电泳结果若显示每个样品 RNA 的三个条带均清晰可见,所述的三个条带分别为28S、18S 和 5S,无弥散拖尾,且上样孔附近无杂质,说明 RNA 无污染无降,接着使用BioAnalyzer 2100 生物分析仪系统检测 RNA 的质量和完整性,若每个样品RNA 的 RIN值均大于 7.1,28S/18S 的比值在 1.51-1.94 之间,说明 RNA 质量和完整性较好;最后使用超微量紫外分光光度计 NanoDrop2000 检测 RNA 样品在波长230 nm,260 nm 和 280nm 处的吸光度值,并计算 OD260/280 和 OD260/230 的值,O若D260/280均大于 1.94,OD260/230 在 1.68-2.09 之间,且每个样品 RNA 浓度均大于 175.84 ng/μL,则表明RNA的纯度和浓度均满足后续高通量测序的要求。
进一步,所述高质量的RNA具体测序步骤如下:
Oligo磁珠吸附纯化mRNA,利用Oligo引物引导逆转录合成双链cDNA;
使用核酸外切酶和聚合酶,将核苷酸“A”添加到 DNA 片段的 3' 端,连接特定的双端 (PE) 接头,将带有接头的 cDNA 片段分离并添加以进行回收;
使用 PCR 引物混合物进行扩增以浓缩 cDNA,并使用 AMPure XP 系统纯化 PCR产物;
使用 Agilent Bioanalyzer 2100测试转录组测序文库的质量;
利用TruSeq PE Cluster kit V3-C Bot-HS用于Index序列拆分,使用IlluminaHiseq 2000测序平台用于双末端测序,生成的测序读数长 为110bp;
利用Trimmomatic对raw reads数据进行过滤,使用 IlluQC.pl对测序读数进行质量控制,去除未知序列大于10%且质量分数小于20的读段;
利用Hisat2建立索引用于快速准确的序列比对;
利用Samtools和featureCounts转换转录组基因表达计数文件,以获得每个样本中的基因表达谱,利用stringtie对猪 11.1 版本参考基因组的35670个基因进行了表达量丰度评估。当基因的 TPM 小于 0.01 时,判定该基因不表达。在保证基因在所有样本中的表达率大于 30%的情况下,最终本研究获得了17024个表达基因。
其有益效果为:基于猪的背膘厚表型,同时利用基因组和转录组数据,通过GWAS和eQTL的共定位分析鉴定与脂肪沉积性状相关的候选基因,该方法能够联合多组学数据精细定位影响猪脂肪沉积的因果基因。通过该方法对461头大白猪进行分析,最终定位到一个显著信号位点SSC9:15828911,对应的因果候选基因为RAB30,通过基因注释和文献检索,发现该基因作为一种高尔基体驻留的GTP酶,是一种新型的抗菌自噬调节剂,能够起到调控PI4KB(磷脂酰肌醇 4-激酶 β)的作用,进而影响脂质的形成和转运,通过调控该基因能够改变猪的脂肪沉积量。
本发明通过联合多组学数据能够快速、低成本、有效的对猪脂肪沉积的因果候选基因进行精细定位,其方法和结果能够为猪脂肪沉积的遗传解析和猪肉质改良的分子育种提供理论依据和重要参考。
附图说明
图1 eQTL分析结果概况
图2 平均背膘厚GWAS位点的曼哈顿图
图3为9号染色体区域内SNP与背膘厚表型关联的GWAS结果,作为共定位分析中表型1的关联分析;
图4为9号染色体区域内SNP与基因表达量关联的eQTL分析结果,作为共定位分析中表型2的关联分析;
图5为依据GWAS与eQTL分析结果进行共定位的先验概率;
图6为依据GWAS与eQTL分析结果进行共定位的后验概率;
图7为RAB30基因上下游1Mb的所有SNP与背膘厚表型关联的GWAS结果;
图8为RAB30基因上下游1Mb的所有SNP与基因表达量关联的eQTL分析结果;
图9为RAB30基因上下游1Mb的所有SNP的GWAS与eQTL共定位结果。
具体实施方式
实施例1
对同一猪场相同日龄和体重的461头大白猪进行基因分型,并将芯片数据填充至测序水平,然后对其中132个个体进行背最长肌mRNA测序,根据基因表达水平和包含15389322个SNP的测序数据进行eQTL分析鉴定cis-eQTL。之后基于猪的背膘厚表型利用测序数据进行GWAS鉴定与猪脂肪沉积性状显著相关的SNP分子标记。最后通过GWAS与eQTL的共定位分析定位到一个显著信号位点为SSC9:15828911,对应的调控基因为RAB30,且有研究表明其会参与脂肪的合成和代谢,可以作为影响猪脂肪沉积的候选基因。
实施例2
一种与猪背膘厚相关的因果候选基因的显著信号位点为SSC9:15828911,对应的调控基因为RAB30,其可以作为影响猪脂肪沉积的候选基因。
实施例3
一种与猪背膘厚相关的因果候选基因的鉴定方法,具体实施的步骤如下:
S101样品采集及表型的测定:
试验选取北京顺鑫农业股份有限公司小店畜禽良种场前后五个批次,共461头大白猪种猪(公猪289头,母猪172头),体重在90kg左右,日龄在170天左右。所有大白猪均有表型记录和系谱信息,且处于同样的饲养条件,于屠宰现场测定脂肪沉积表型(背膘厚),并割取背最长肌500g用以后续测序,具体的统计行描述见表1。
表1样本表型描述性统计
S102基因型数据的获取:
采集所有试验猪(461头)的背最长肌组织,利用高通量DNA提取试剂盒进行样品DNA的提取。提取后的DNA样品进行2种检测:(1)使用1%琼脂糖凝胶电泳方法分析DNA的纯度和完整性;(2)使用Qubit对DNA浓度进行准确定量。将合格DNA样品浓度稀释至50ng/µl,使用GenoBaits Porcine SNP50K Panel(猪50K液相芯片)进行扫描和分型,该芯片包含全基因组范围内52,000个SNP。
为了筛选高质量的SNP,对数据进行质控,质控标准依次如下:
1)过滤复等位基因;
2)去除性染色体和位置未知的位点;
3)去除检出率(call rate)低于95%的SNP;
4)去除SNP位点的最小等位基因频率(MAF,Minor allele frequency)低于0.01的SNP;
5)去除严重偏离哈代-温伯格平衡(P<10-6)的SNP;
6)去除检出率低于90%的个体。
之后进行基因型数据填充,以上述试验猪群体的GenoBaits Porcine SNP50KPanel(液相50K芯片,含核心SNP和区段SNP位点共108923个)基因分型结果为基础,以1602头含多个品种猪的全基因组测序数据作为参考群,将芯片数据填充至测序数据水平。填充后SNP位点数为42523218个。对填充后的基因型数据按照以下原则进行质量控制:
(1)去除MAF小于0.01的SNP位点;
(2)去除哈代-温伯格平衡P<1×10-6的SNP位点;
(3)去除分型缺失数大于5%的SNP位点。
(4)根据填充准确性再次进行过滤,保留平均DR2(Dosage R-squared)大于0.9的位点。最终保留15389322个SNP。
S103组织总RNA提取与测序:
随机挑选上述461个个体中的132个,对其背最长肌进行mRNA建库测序,利用Trizol法提取36个样本的总RNA,并取2μL新提的RNA分别进行1%琼脂糖凝胶电泳检测RNA样品是否有降解及杂质,并用紫外分光光度计测定吸光度,评价所得 RNA的质量。之后对于高质量的RNA进行进一步测序,具体测序步骤如下:Oligo(dT)磁珠吸附纯化mRNA,Oligo(dT)引物引导逆转录合成双链cDNA。然后,使用核酸外切酶和聚合酶,将核苷酸“A”添加到 DNA片段的 3' 端,连接特定的双端 (PE) 接头,将带有接头的 cDNA 片段分离并添加以进行回收。使用 PCR 引物混合物(10个循环)进行扩增以浓缩 cDNA,并使用AMPure XP 系统(Beckman Coulter,Beverly,MA,USA)纯化 PCR 产物。然后使用 Agilent Bioanalyzer2100(Agilent,USA)测试转录组测序文库的质量。TruSeq PECluster kit V3-C Bot-HS(Illumina)用于Index序列拆分,Illumina Hiseq 2000测序平台用于双末端(pair-end,PE)测序,生成的测序读数长为110 bp。
之后利用Trimmomatic对raw reads数据进行过滤,使用 IlluQC.pl(NGSQC 工具包)对测序读数进行质量控制,去除未知序列大于10%且质量分数小于20的读段。然后利用Hisat2建立索引用于快速准确的序列比对。最后利用Samtools和featureCounts转换转录组基因表达计数文件,以获得每个样本中的基因表达谱。
S104eQTL分析:
利用MatrixEQTL v2.1.0(R工具)建立基因组信息与基因表达之间的关系。MatrixEQT是一个快速有效的cis/trans eQTL mapping分析工具,被Genotype-TissueExpression (GTEx)数据库用于eQTL分析。通过利用最小二乘和 ANOVA 模型,将基因型的影响建模为加性线性或分类,检验每个单核苷酸多态性(SNP)和每个转录本之间的关联关系。支持异方差和相关误差来解释样本的相关性,并能检测出基因型和协变量的相互作用。本发明实施将132个样本17024个基因的表达谱和测序水平基因型数据进行关联分析(图1)。对每个基因-SNP对执行单独测试,并通过计算错误发现率来纠正多重比较,将校正后的P 值小于0.05的SNPs认为是显著的,确定eQTL-eGene(eGene即受eQTL调控的基因)对。最终通过eQTL分析鉴定到了49131个cis SNP-gene(涉及33756个cis-SNPs和1041个cis-genes)。
S105 GWAS:
采用单性状线性混合模型(LMM),利用填充后的测序数据(15389322个SNP位点),对459个个体的平均背膘厚进行了全基因组的关联分析,采用FDR多重校正方法,如图2所示,发现312个显著SNP。
S106GWAS与eQTL的共定位分析:
采用基于贝叶斯方法的coloc软件利用eQTL结果4与平均背膘厚的GWAS结果进行共定位,找到可能参与调控基因表达以及表型变异的共同QTL,以SNP为桥梁确定影响对应表型的表达基因。结果显示9号染色体上存在比较多的显著位点,其中SSC9:15828911与显著eQTL重叠,SSC9:15828911与RAB30在eQTL分析中为显著cis SNP-gene调控对,且该位点共定位的后验概率为0.99993(图3)。
通过近似贝叶斯因子可以计算特征共享其配置的后验概率,利用coloc评估 5 种情况发生的后验概率包含四种假设:
第一种假设H0: 表型1(GWAS)和表型2(eQTL)与某个基因组区域的所有SNP位点无显著相关,即既不存在GWAS显著位点调控对应表型又不存在eQTL的位点显著调控基因表达(PP0);
第二种假设 H1/H2: 表型1(GWAS)或表型2(eQTL)与某个基因组区域的SNP位点显著相关;即只存在 GWAS显著位点调控对应表型不存在 eQTL的位点显著调控基因表达(PP1);或不存在GWAS显著位点调控对应表型但存在eQTL的位点显著调控基因表达(PP2);
第三种设想 H3: 表型1(GWAS)和表型2(eQTL)与某个基因组区域的SNP位点显著相关,但由不同的因果变异位点驱动;即既存在 GWAS显著位点调控对应表型又存在eQTL的位点显著调控基因表达,但两者信号独立(PP3);
第四种设想 H4: 表型1(GWAS)和 表型2 (eQTL)与某个基因组区域的SNP位点显著相关,且由同一个因果变异位点驱动;即既存在GWAS显著位点调控对应表型又存在eQTL共同的位点显著调控基因表达,且两者信号相同(PP4)。
如图3-7所示,为对于9号染色体区域内SNP的GWAS与eQTL共定位分析的结果,共定位分析本质上是在检验第四种假设的后验概率。其中,当 PP3 + PP4 ≥ 0.99 和PP4/PP3≥ 5 时,才认为GWAS与eQTL具有强的共定位信号。本发明筛选了 eQTL与 GWAS 共有的SNP 进行分析,将 PP4(两种性状与相同因果变异相关联的后验概率)>0.8 的基因座确定为GWAS与eQTL共定位的位点。为了更精细的可视化共定位结果,提取RAB30基因上下游1Mb的所有SNP的GWAS和eQTL分析结果。如图7-9所示,为对于RAB30基因上下游1Mb的所有SNP进行共定位分析结果的可视化,最后通过改写R包locuscomparer代码来进行猪物种共定位结果的可视化绘图以直观的展示共定位的结果。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种与猪背膘厚相关的因果候选基因,其特征在于:与猪背膘厚相关的因果候选基因的显著信号位点为SSC9:15828911,所述信号位点对应的调控基因为RAB30。
2.一种与猪背膘厚相关的因果候选基因的应用,其特征在于:根据权利要求1所述的一种与猪背膘厚相关的因果候选基因应用于猪的脂肪沉积的遗传解析。
3.一种与猪背膘厚相关的因果候选基因的应用,其特征在于:根据权利要求1所述的一种与猪背膘厚相关的因果候选基因应用于猪肉质改良的分子育种。
4.一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:具体实施的步骤如下:
S101:样品采集及表型的测定,所有试验猪均有表型记录和系谱信息,且处于同样的饲养条件,于屠宰现场测定脂肪沉积表型,所述脂肪沉积表型为背膘厚,并割取背最长肌500g用以后续测序;
S102:基因型数据的获取,采集所有试验猪的背最长肌组织,利用高通量DNA提取试剂盒进行样品DNA的提取,提取后的DNA样品进行2种检测:
(1) 使用1%琼脂糖凝胶电泳方法分析DNA的纯度和完整性;
(2)使用Qubit对DNA浓度进行准确定量,将合格DNA样品浓度稀释至50ng/µl,使用猪50K液相芯片进行扫描和分型,该芯片包含全基因组范围内52,000个SNP;
通过DNA样品检测获得SNP进行质控处理,之后进行基因型数据填充,以上述试验猪群体的GenoBaits Porcine SNP50K Panel基因分型结果为基础,所述GenoBaits PorcineSNP50K Panel为液相50K芯片,含核心SNP和区段SNP位点共108923个,以一千头以上含多个品种猪的全基因组测序数据作为参考群,将芯片数据填充至测序数据水平;
填充后SNP位点数为42523218个,对填充后的基因型数据按照进行质量控制;最终保留15389322个SNP;
S103:组织总RNA提取与测序,随机挑选所述试验猪中的四分之一以上的个体作为测序试验猪,对测序试验猪背最长肌进行mRNA建库测序,利用Trizol法提取36个样本的总RNA,并取2μL新提的RNA分别进行1%琼脂糖凝胶电泳检测RNA样品是否有降解及杂质,并用紫外分光光度计测定吸光度,通过评价方法对所得 RNA的质量进行评价获得高质量的RNA,之后对于高质量的RNA进行进一步测序;
S104:eQTL分析,利用MatrixEQTL v2.1.0建立基因组信息与基因表达之间的关系,通过利用最小二乘和 ANOVA 模型,将基因型的影响建模为加性线性或分类,检验每个单核苷酸多态性和每个转录本之间的关联关系,通过异方差和相关误差来解释样本的相关性, 并检测出基因型和协变量的相互作用,对样本中的17024个基因的表达谱和测序水平基因型数据进行关联分析,对每个基因-SNP对执行单独测试,并通过计算错误发现率来纠正多重比较,将校正后的 P 值小于0.05的SNPs认为是显著的,确定eQTL-eGene对,最终通过eQTL分析鉴定到了49131个cis SNP-gene,所述cis SNP-gene涉及33756个cis-SNPs和1041个cis-genes;
S105:GWAS分析,采用单性状线性混合模型,利用填充后的测序数据,所述的测序数据有15389322个SNP位点,对459个个体的平均背膘厚进行了全基因组的关联分析,采用FDR多重校正方法,发现312个显著SNP;
S106:GWAS与eQTL 的共定位分析,采用基于贝叶斯方法的coloc软件利用eQTL分析结果与平均背膘厚的GWAS分析结果进行共定位,找到可能参与调控基因表达以及表型变异的共同QTL,以SNP为桥梁确定影响对应表型的表达基因,结果显示9号染色体上存在比较多的显著位点,其中SSC9:15828911与显著eQTL重叠,SSC9:15828911与RAB30在eQTL分析中为显著cis SNP-gene调控对,且该位点共定位的后验概率为0.99993。
5.根据权利要求4所述的一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:所述步骤S102中基因数据的质控标准依次如下:
1)过滤复等位基因;
2)去除性染色体和位置未知的位点;
3)去除检出率低于95%的SNP;
4)去除SNP位点的最小等位基因频率低于0.01的SNP;
5)去除严重偏离哈代-温伯格平衡(P<10-6)的SNP;
6)去除检出率低于90%的个体。
6.根据权利要求4所述的一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:所述步骤S102中质量控制的原则如下:
1)去除MAF小于0.01的SNP位点;
2)去除哈代-温伯格平衡P < 1×10-6的SNP位点;
3)去除分型缺失数大于5%的SNP位点;
4)根据填充准确性再次进行过滤,保留平均DR2大于0.9的位点。
7.根据权利要求4所述的一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:所述步骤S103的评价方法具体如下:
凝胶电泳结果若显示每个样品 RNA 的三个条带均清晰可见,所述的三个条带分别为28S、18S 和 5S,无弥散拖尾,且上样孔附近无杂质,说明 RNA 无污染无降,接着使用BioAnalyzer 2100 生物分析仪系统检测 RNA 的质量和完整性,若每个样品RNA 的 RIN值均大于 7.1,28S/18S 的比值在 1.51-1.94 之间,说明 RNA 质量和完整性较好;最后使用超微量紫外分光光度计 NanoDrop2000 检测 RNA 样品在波长230 nm,260 nm 和 280nm 处的吸光度值,并计算 OD260/280 和 OD260/230 的值,O若D260/280均大于 1.94,OD260/230 在 1.68-2.09 之间,且每个样品 RNA 浓度均大于 175.84 ng/μL,则表明RNA的纯度和浓度均满足后续高通量测序的要求。
8.根据权利要求4所述的一种与猪背膘厚相关的因果候选基因的鉴定方法,其特征在于:所述步骤S103中高质量的RNA具体测序步骤如下:
Oligo磁珠吸附纯化mRNA,利用Oligo引物引导逆转录合成双链cDNA;
使用核酸外切酶和聚合酶,将核苷酸“A”添加到 DNA 片段的 3' 端,连接特定的双端(PE) 接头,将带有接头的 cDNA 片段分离并添加以进行回收;
使用 PCR 引物混合物进行扩增以浓缩 cDNA,并使用 AMPure XP 系统纯化 PCR 产物;
使用 Agilent Bioanalyzer 2100测试转录组测序文库的质量;
利用TruSeq PE Cluster kit V3-C Bot-HS用于Index序列拆分,使用Illumina Hiseq2000测序平台用于双末端测序,生成的测序读数长 为110 bp;
利用Trimmomatic对raw reads数据进行过滤,使用 IlluQC.pl对测序读数进行质量控制,去除未知序列大于10%且质量分数小于20的读段;
利用Hisat2建立索引用于快速准确的序列比对;
利用Samtools和featureCounts转换转录组基因表达计数文件,以获得每个样本中的基因表达谱,利用stringtie对猪 11.1 版本参考基因组的35670个基因进行了表达量丰度评估,当基因的 TPM 小于 0.01 时,判定该基因不表达,在保证基因在所有样本中的表达率大于 30%的情况下,最终本研究获得了17024个表达基因。
CN202310868459.2A 2023-07-17 2023-07-17 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用 Active CN116590435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310868459.2A CN116590435B (zh) 2023-07-17 2023-07-17 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310868459.2A CN116590435B (zh) 2023-07-17 2023-07-17 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用

Publications (2)

Publication Number Publication Date
CN116590435A true CN116590435A (zh) 2023-08-15
CN116590435B CN116590435B (zh) 2023-09-29

Family

ID=87608523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310868459.2A Active CN116590435B (zh) 2023-07-17 2023-07-17 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用

Country Status (1)

Country Link
CN (1) CN116590435B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103409440A (zh) * 2013-07-02 2013-11-27 江西农业大学 Phkg1 基因及其在种猪肉质性状遗传改良中的应用
CN103911373A (zh) * 2014-03-18 2014-07-09 江西农业大学 影响猪肉脂肪酸组分的主效snp标记及其在种猪肉质性状遗传改良中的应用
CN105063021A (zh) * 2015-06-18 2015-11-18 中国农业大学 与猪脂肪沉积相关的snp分子标记及其应用
KR20170055818A (ko) * 2015-11-12 2017-05-22 대한민국(농촌진흥청장) 돼지의 등지방두께 저감 판단용 snp 마커 및 이의 용도
CN112391479A (zh) * 2020-05-09 2021-02-23 南阳师范学院 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103409440A (zh) * 2013-07-02 2013-11-27 江西农业大学 Phkg1 基因及其在种猪肉质性状遗传改良中的应用
CN103911373A (zh) * 2014-03-18 2014-07-09 江西农业大学 影响猪肉脂肪酸组分的主效snp标记及其在种猪肉质性状遗传改良中的应用
CN105063021A (zh) * 2015-06-18 2015-11-18 中国农业大学 与猪脂肪沉积相关的snp分子标记及其应用
KR20170055818A (ko) * 2015-11-12 2017-05-22 대한민국(농촌진흥청장) 돼지의 등지방두께 저감 판단용 snp 마커 및 이의 용도
CN112391479A (zh) * 2020-05-09 2021-02-23 南阳师范学院 基于多组学的南阳黑猪脂肪沉积性状关键基因挖掘方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HANIEL C. OLIVEIRA等: "Fine Mapping of a Major Backfat QTL Reveals a Causal Regulatory Variant Affecting the CCND2 Gene", FRONTIERS IN GENETICS, vol. 13, pages 1 - 11 *
JIN ZHANG等: "Apolipoprotein D, apolipoprotein R and ST6GalNAc4 genes respond to clenbuterol administration in pig adipose tissue", AFRICAN JOURNAL OF BIOTECHNOLOGY, vol. 10, no. 39, pages 7577 - 7584 *
侍玉梅,等: "利用配对RNA-seq数据筛选显著差异背膘厚度松辽黑猪背最长肌差异表达基因", 中国畜牧杂志, vol. 59, no. 4, pages 118 - 124 *

Also Published As

Publication number Publication date
CN116590435B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN110218798B (zh) 位于猪7号染色体上与眼肌面积、眼肌厚度相关的snp分子标记及应用
CN111705140B (zh) 体重性状相关的SNPs分子标记及其在湖羊辅助育种中的应用
CN109929935B (zh) 一种基于rs80995809位点基因分型鉴定猪背膘厚的方法及其应用
CN105506111B (zh) 一种检测南阳牛mapk10基因cnv标记的方法及其应用
CN117385045B (zh) 山羊amhr2基因作为产羔数关联分子标记的应用
CN110846429A (zh) 一种玉米全基因组InDel芯片及其应用
CN101818195A (zh) 猪miR-27a前体侧翼序列SNP作为猪产仔数性状的遗传标记及应用
CN111647649A (zh) 一种基于ccdc39基因cnv检测辅助选择黄牛生长性状的方法
CN116590435B (zh) 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
CN111088327B (zh) 一种sike1基因cnv标记辅助检测黄牛体尺性状的方法及其应用
CN106701930B (zh) 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用
CN114875157A (zh) 与黄颡鱼个体生长性状相关的snp标记及应用
CN109439768B (zh) 一种鸡mh7基因cnv标记辅助选育产蛋量的方法
CN112458183B (zh) 一种猪3号染色体上与猪日增重和上市体重日龄相关的拷贝数变异分子标记及应用
CN114574598B (zh) 鉴定或辅助鉴定猪5/6肋眼肌面积的方法
CN117265139B (zh) 一种萨福克羊体重相关snp标记及其筛选方法与应用
CN114622020B (zh) 一种与鸡生长性状相关的klhl31基因分子标记及应用
CN117778594B (zh) 一种与藏绵羊免疫性状相关的snp分子标记、检测方法及其应用
CN116083600A (zh) 双峰驼乳脂率相关基因card11及其作为分子标记的应用
CN118834960A (zh) 一种用于筛选抗病苏氏圆腹鲶的分子标记及产品
CN115948569A (zh) 位于mc4r-ccbe1基因座的分子标记及其在猪背膘厚性状遗传改良中的应用
CN118562966A (zh) 一种与苏氏圆腹鲶抗细菌性败血症性状相关的snp分子标记及其应用
CN116042855A (zh) 双峰驼产奶性状相关基因evx2及其作为分子标记的应用
CN117535419A (zh) 双峰驼乳脂率相关基因palm2akap2及其作为分子标记的应用
CN116814802A (zh) 双峰驼产奶量相关基因myrip及其作为分子标记的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant