CN112342302B - 鉴定水牛产奶性状候选基因标记的方法及应用 - Google Patents

鉴定水牛产奶性状候选基因标记的方法及应用 Download PDF

Info

Publication number
CN112342302B
CN112342302B CN202011362674.8A CN202011362674A CN112342302B CN 112342302 B CN112342302 B CN 112342302B CN 202011362674 A CN202011362674 A CN 202011362674A CN 112342302 B CN112342302 B CN 112342302B
Authority
CN
China
Prior art keywords
buffalo
milk
gene
milk production
buffalos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011362674.8A
Other languages
English (en)
Other versions
CN112342302A (zh
Inventor
邓廷贤
陆杏蓉
段安琴
马小娅
梁莎莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGXI ZHUANG AUTONOMOUS REGION BUFFALO INSTITUTE
Original Assignee
GUANGXI ZHUANG AUTONOMOUS REGION BUFFALO INSTITUTE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGXI ZHUANG AUTONOMOUS REGION BUFFALO INSTITUTE filed Critical GUANGXI ZHUANG AUTONOMOUS REGION BUFFALO INSTITUTE
Priority to CN202011362674.8A priority Critical patent/CN112342302B/zh
Publication of CN112342302A publication Critical patent/CN112342302A/zh
Application granted granted Critical
Publication of CN112342302B publication Critical patent/CN112342302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及分子标记技术领域,本发明公开了与水牛产奶性状相关候选基因分子标记的鉴定方法,该方法具体步骤为:(1)用dd‑RAD法获得45头水牛个体的SNP基因型;(2)基于群体遗传多样性和群体结构进行分组,进而用Fst和XP‑CLR策略进行选择信号分析,鉴定出与产奶性状相关的候选基因;(3)用比较转录组策略辅助验证候选基因与水牛产奶性状的关联性;(4)用标记‑性状关联分析策略鉴定影响水牛产奶性状相关的分子标记。本发明首次利用该方法鉴定出与水牛产奶性状相关的候选基因SCLO3A1以及影响乳蛋白率的分子标记g.54621870G>T。该分子标记可用于选育高乳蛋白水牛群体。

Description

鉴定水牛产奶性状候选基因标记的方法及应用
【技术领域】
本发明涉及生物技术领域,具体涉及鉴定水牛产奶性状候选基因标记的方法及应用。
【背景技术】
水牛是我国南方地区重要的特色奶用畜种,具有奶质优良,营养丰富,具有“奶中之王”值美称,深受消费者的喜爱。水牛可分为河流型和沼泽型水牛两个亚种,其中河流型水牛以乳肉兼用为主,是高产水牛群体的代表,而沼泽型水牛以役用为主,是低产水牛群体的代表。然而,较低的产奶性能已成为了影响水牛产业发展的重大科学问题。挖掘与影响水牛产奶性状相关致因基因已成为当前水牛科学研究的热点,对提高水牛的产奶性能具有重要的意义。
在自然和人工的干预下,选择通常视为生物群体在世代传递过程中,某种基因型个体的比例发生变化的群体遗传学现象。选择信号则是选择作用在基因组上留下的明显特征,对物种的适应性具有重要的意义。因此,通过选择信号分析可以鉴定出物种中与目标性状相关的在基因组上留下的印记。基于这一原理,选择信号分析已成为家畜重要经济性状遗传解析的手段。当前选择信号检测方法主要基于研究群体的基因频率估计值以及与其相关的统计量进行基因组选择信号的推断,而复杂的群体背景可能对选择信号的推断造成影响(马云龙,2015),从而产生较多的假阳性。地理隔离是群体分化的重要因素,群体间的基因型频率差异则是促进群体分化的内在因素。选择作用能够加速群体分化,这种作用在同种不同亚群间等位基因同时受到选择压力时极为明显。当前,Fst和XP-CLR法均属于适合群体分化研究的选择信号分析策略,而Fst的工作原理时比较两个亚群体间的Pi值和亚群体内的Pi值的差异,XP-CLR法则利用了两个群体之间的多基因座等位基因频率差异建立模型,使用布朗运动来模拟中性下的遗传漂移,并使用确定性模型来近似地对附近的单核苷酸多态性(SNPs)进行选择性扫描。显然,选择信号技术侧重于从DNA水平鉴定出与目标性状相关的基因。
比较转录组策略则是另外一种挖掘畜种重要经济性状相关基因的手段。该策略主要利用了基因表达在不同物种,不同组织和不同生理状态下存在差异表达的原理,可鉴定出影响目标性状相关的候选基因。比较转录组则是注重基因序列层面的变化,注重不同物种间基因的进化学关系、分歧时间和表达的比较等。显然,该技术则从mRNA水平鉴定候选基因,是一种快速、全面解析不同品系,不同亚种进化关系以及特定组织表达情况和关系的生物学方法,以期从序列水平和基因表达水平发掘。
鉴于此,本发明整合了选择信号分析和比较转录组策略的各自优势,对水牛产奶性状相关基因的进行挖掘,可大大提高候选基因鉴定的可靠性。同时,可整合标记-性状关联分析方法鉴定出候选基因中影响产奶性状的分子标记,为今后水牛的分子育种提供了有效的技术支撑。
【发明内容】
本发明的发明目的在于:针对上述存在的问题,提供一种与水牛产奶性状相关候选基因分子标记的鉴定方法,即通过基于Fst和XP-CLR的选择信号分析策略共同鉴定出与水牛产奶性状相关的候选基因,进而利用比较转录组策略辅助验证候选基因与产奶性状的关联性,接着利用标记-性状关联分析方法鉴定出候选基因中影响水牛产奶性状的分子标记,为选育具有优良性状的水牛品种提供技术支撑。
为了实现上述目的,本发明采用的技术方案如下:
与水牛产奶性状相关的SNP分子标记,所述水牛产奶性状具体是指奶中的乳蛋白率,所述与奶中的乳蛋白率相关的分子遗传标记位于第20号染色体的第54621870核酸位点,该位点的碱基为G或T,对应位于核酸序列表SEQ ID NO.1的第51位核酸位点。
一种应用如上所述的SNP分子标记在选育或辅助选育与水牛产奶性状相关的水牛品种或品系的用途,具体是选育或辅助选育奶中的乳蛋白率高/低的水牛。
一种应用如上所述的SNP分子标记选育或辅助选育与水牛产奶性状相关的水牛品种或品系的方法,具体步骤为:提取水牛DNA,检测水牛的第20号染色体的第54621870位核苷酸,检测出第54621870位核苷酸的序列为G或T,确定待测水牛的基因型是GG或TT型,根据需要选择GG或TT型基因的水牛进行下一步选种和/或育种;所述TT型基因水牛的奶中的乳蛋白率高于GG型基因水牛。
进一步说明,所述水牛产奶性状的相关候选基因为SCLO3A1基因。
一种鉴定如上所述候选基因分子标记的方法,具体步骤为:
(1)针对45头水牛个体dd-RAD数据,用GATK软件进行SNP基因型分析,在此基础上用Beagle v5.0软件进行基因型填充,然后用plink2.0软件进行质控,质控标准为:SNP检出率<90%,个体检出率<95%,最小等位基因频率<0.02以及哈迪-温伯格平衡的p值<10-6;此外,染色体未知或重复的SNPs也被去除;最后,共有45头水牛个体157523SNPs通过质控,并用于后续的分析;
(2)用R语言hierfstat包计算水牛群体的观测杂合度、期望杂合度、等位基因丰度;用自编的脚本计算水牛群体多态性信息含量;用GCTA v1.93.2beta软件进行河流型和沼泽型水牛群体的主成分分析;用MEGA-X软件构建河流型和沼泽型水牛群体的进化树,再用Admixture 1.3.0软件分析这两个群体的群体结构;
(3)基于选择信号分析鉴定出与产奶性状相关的候选基因:
1)Fst法:用VCFtools v0.1.16软件计算两组中每个SNP的期望Fst值;
2)XP-CLR法:用XP-CLR v1.1.1软件检测两组中的选择信号;
3)候选基因的筛选:用TBtools v1.051软件确定基于Fst和XP-CLR法共同筛选的选择信号,即为最后认定的选择信号,位于该区域的基因视为候选基因;
(4)基于比较转录组策略辅助验证与产奶性状相关的候选基因:
S1、OAT基因家族成员鉴定:从公共数据库下载人、奶牛、河流型水牛、沼泽型水牛、山羊、绵羊和马等哺乳动物基因组序列;以已知的OAT基因蛋白序列为起点,用HMMER和BLAST法鉴定上述物种中OAT基因蛋白序列,用于后续分析;
S2、OAT基因家族基因复制分析:针对河流型和沼泽型水牛OAT蛋白序列,用TBtools进行OAT蛋白序列的染色体定位、基因复制分析、共线性分析、Ka/Ks以及歧化时间等;
S3、转录组数据下载:从公共数据库下载河流型和沼泽型水牛不同组织的转录组数据,同时水牛乳样转录组数据也被下载,用探究OAT基因在不同泌乳期的表达分析;
S4、基因表达分析:用TrimGalore v0.6.6软件对原始数据进行质控,用HISATv2.2.1软件对质控后的数据进行水牛参考基因组比对;用StringTie v2.1.3软件和DESeq2v3.11 R包进行每一个基因的Count矩阵和表达值的计算;
S5、用TBtools v1.051筛选出OAT基因家族每一个成员的表达值,并进行可视化,分析OAT基因的组织表达情况,发现候选基因在乳腺组织和不同泌乳期中均属于高表达;此外,用定量PCR的法进一步发现候选基因在河流型乳腺组织中高表达,辅助验证出该基因与产奶性状有关;
(6)用标记性状-关联分析法鉴定出候选基因中影响产奶性状的分子标记
S11、根据90K水牛SNP芯片的注释信息,结合候选基因所在染色体和物理位置信息,筛选出位于该基因上的分子标记;
S12、从已发表的数据中下载了935头地中海水牛的SNP基因型数据及其表型数据;利用SAS软件GLM程序对水牛个体的SNP分型结果以及产奶性状数据进行关联分析,获得与水牛产奶性状显著相关的SNP位点。
进一步说明,步骤1)中的分析参数为:50kb为一个滑动窗口,20kb为一个步长,选择信号的阈值为:Fst值的经验分布排名前0.5%的区域视为选择信号,即Fst>0.76。
进一步说明,步骤2)中的分析参数为:50kb为一个滑动窗口,SNPs最大个数<600以及SNPs最小个数>2,选择阈值水平:标准化的XP-CLR值的经验分布排名前0.5%的区域视为选择信号,即XP-CLR>4.06。
进一步说明,在S1中,所述人、奶牛、河流型水牛、沼泽型水牛、山羊、绵羊和马等哺乳动物基因组序列版本号分别为:GRCh38.p12,ARS-UCD1.2,UOA_WB_1,GWHAAJZ00000000,ARS1,Oar_rambouillet_v1.0和EquCab3.0
进一步说明,在S2中,所述的歧化时间计算公式为:T=Ks/2λ×10-6million yearsago(Mya),其中λ为1.26×10-8(Sun et al.,2020)
进一步说明,在S3中,所述河流型和沼泽型水牛不同组织的转录组数据下载的登入号为:BioProject:PRJEB4351 and BIGD:CRA002325;水牛乳样转录组数据下载的登入号为:BioProject:PRJNA453843。
进一步说明,所述OAT基因为有机阴离子转运蛋白基因.
进一步说明,所述SNP基因型的基本步骤为:用Trimmomatic v0.39软件对原始数据进行SNP质控,然后用BWA-0.7.17(r1188)软件将质控后的数据比对到水牛参考基因组(UOA_WB_1)上,最后用GATK流程进行SNP分型;所述SNP硬过滤的标准为:经过深度校正的质量值<10.0,所有样本中比对质量的均方根<55.0,Fisher精确检验评估值>50.0,Phred质量值<40,综合评估链偏倚可能性值>5,变异在read位置评估可信度值<-2.0以及REF和ALT的read比对质量评估值>-12.5。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明首次通过基于Fst和XP-CLR的选择信号分析鉴定与水牛产奶性状相关的候选基因,同时基于比较转录组策略进一步辅助验证候选基因的功能性。该策略大大提高了与目标性状相关候选基因鉴定的可靠性。本发明首次研究发现了与水牛产奶性状相关的候选基因-SCLO3A1基因,为选育具有优良性状的水牛品种提供技候选基因。同时,本发明利用标记-性状关联分析方法鉴定出SLCO3A1中的g.54621870G>T位点为影响水牛乳蛋白率的分子标记,这对于组建高产奶水牛核心群具有重要意义。简而言之,本发明也为其他畜种重要经济性状相关候选基因的鉴定提供了新思路,并且通过对奶水牛产奶性状相关的基因型进行全基因组关联分析,为选育具有育或辅助选育与奶水牛产奶性状相关的奶水牛品种或品系--奶中的乳蛋白率高/低的优良的奶水牛提供技术支撑和奠定理论基础。
【附图说明】
图1为中国沼泽和埃及河流型水牛种群分析。其中,(A)种群之间成对的Nei D遗传距离的邻居连接表示;(B)主成分分析图显示了45头水牛的个体关系,PC=主成分;(C)使用Admixture通过基于模型的聚类推断出的45头水牛的种群结构,K=聚类编号。
图2为埃及河流型水牛与沼泽型水牛之间的全基因组关联分析图。其中,(A)河流和沼泽型水牛种群之间Fst值的全基因组分布的曼哈顿图;对应于Fst最高0.5%的阈值用水平线标记;重要信号用黑色标记;(B)河流和沼泽型水牛种群之间标准化XP-CLR值的全基因组分布的曼哈顿图;对应于标准化XP-CLR值的前0.5%的阈值用水平线标记;重要信号用黑色标记;(C)维恩图显示了Fst和XP-CLR显着选择区之间的基因重叠;(D)气泡图说明了XP-CLR和Fst显着选择区中这些基因的主要GO和KEGG富集途径。
图3七种哺乳动物OAT蛋白的系统进化树。
图4河流型和沼泽型水牛OAT的基因重复分析(A)和共线分析(B)。红线表示串联重复,#号表示大片段复制。
图5为OAT基因在河水和沼泽型水牛之间的不同组织(5A和5B),不同泌乳期的牛奶组织(5C)以及乳腺组织(5D)中的表达模式。
【具体实施方式】
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
实施例:
一、研究步骤:
1、数据下载和SNP分型
从NCBI公共数据库下载水牛简化基因组测序(dd-RAD)数据,共116.00Gb,数据下载登录号为PRJNA554744。这批数据包括了两个群体,一个群体是沼泽型水牛,共25头个体,另一群体为河流型埃及水牛,共20头个体。
SNP分型:针对这45头个体的dd-RAD数据,本研究采用了GATK v4.1.8.1软件进行SNP分型分型。
基本步骤为:用Trimmomatic v0.39软件对原始数据进行质控,然后用BWA-0.7.17(r1188)软件将质控后的数据比对到水牛参考基因组(UOA_WB_1)上,最后用GATK流程进行SNP分型,其中质控参数为:经过深度校正的质量值<10.0,所有样本中比对质量的均方根<55.0,Fisher精确检验评估值>50.0,Phred质量值<40,综合评估链偏倚可能性值>5,变异在read位置评估可信度值<-2.0以及REF和ALT的read比对质量评估值>-12.5。
针对上述获得的SNP利用Beagle v5.0软件进行填充,然后用plink2.0软件进行质控,质控标准为:SNP call rate<90%,individual call rate<95%,minor allelefrequency(MAF)<0.02,and the P-value for Hardy-Weinberg equilibrium(HWE)<10-6,染色体未知或者重复的SNP也被删除。
最后,共有45头水牛个体157523SNPs通过质控,并用于后续的分析。
2.遗传多样性和群体结构分析
用R语言hierfstat包计算水牛群体的观测杂合度、期望杂合度、等位基因富含度。用自编的脚本计算水牛群体多态性信息含量(Polymorphic information content,PIC)。用GCTA v1.93.2beta软件的默认参数进行河流型和沼泽型水牛群体的主成分分析(PCA分析);MEGA-X软件构件河流型和沼泽型水牛群体的进化树,再用Admixture 1.3.0软件分析这两个群体的群体结构。
3.基于选择信号分析鉴定候选基因
1)Fst法:用VCFtools v0.1.16软件计算两个群体中每一个SNP的期望Fst值,参数为:a 50kb window size at an interval of 20kb steps.选择阈值为:The top 0.5%ofthe empirical distributions of Fst values(Fst>0.76)were considered ascandidate selection regions,as described by Alshawi et al.
2)XP-CLR法:用XP-CLR v1.1.1软件检测两个群体中的选择信号,其参数为:a50kb sliding windows,the maximum number of SNPs<600,and the minimum number ofSNPs>2.选择阈值水平:The normalized XP-CLR values in the top 0.5%of theempirical distribution(XP-CLR>4.06)are designated as candidate selectionregions that in those window regions are defined as potential candidategenes,as previously described by Shen et al.
3)候选基因的筛选:用TBtools v1.051软件确定基于Fst和XP-CLR法共同筛选的选择信号,即为最后认定的选择信号,位于该区域的基因视为候选基因。与此同时,TBtoolsv1.051软件也进一步对候选基因进行GO和KEGG功能注释和富集分析。
4、基于比较转录组学分析鉴定候选基因
1)OAT基因家族成员鉴定:从公共数据库下载人(GRCh38.p12)、奶牛(ARS-UCD1.2)、河流型水牛(UOA_WB_1)、沼泽型水牛(GWHAAJZ00000000)、山羊(ARS1)、绵羊(Oar_rambouillet_v1.0)和马(EquCab3.0)等哺乳动物基因组序列。以已知的OAT基因蛋白序列为起点,用HMMER和BLAST法鉴定上述物种中OAT基因蛋白序列,用于后续分析。
2)OAT基因家族基因复制分析:针对河流型和沼泽型水牛OAT蛋白序列,用TBtools进行OAT蛋白序列的染色体定位、基因复制分析、共线性分析、Ka/Ks以及歧化时间等。
3)转录组数据下载:从公共数据库下载河流型和沼泽型水牛不同组织的转录组数据(BioProject:PRJEB4351 and BIGD:CRA002325),同时水牛乳样转录组数据(PRJNA453843)也被下载,用探究OAT基因在不用泌乳期的表达分析。
4)基因表达分析:用TrimGalore v0.6.6软件对原始数据进行质控,用HISATv2.2.1软件对质控后的数据进行水牛参考基因组(UOA_WB_1)比对。用StringTie v2.1.3软件和DESeq2v3.11 R包进行每一个基因的Count矩阵和表达值(transcripts per million,TPM)的计算。
5)用TBtools v1.051筛选出OAT基因家族每一个成员的TPM值,并进行可视化,分析OAT基因的组织表达情况,发现SCLO3A1在乳腺组织和不同泌乳期中均属于高表达。此外,用定量PCR的法进一步发现SCLO3A1基因在河流型乳腺组织中高表达,辅助验证出该基因与产奶性状有关。
5.SLCO3A1与水牛产奶性状的关联分析
首先从已发表的文章(Deng et al.2019)中下载了935头地中海水牛的基因型数据及其表型数据用于后续分析。随后根据SLCO3A1基因的染色体及其物理位置信息,本研究筛选出11个SNP,分别是AX-85062424,AX-85103372,AX-85110337,AX-85059808,AX-85063332,AX-85091953,AX-85085575,AX-85046365,AX-85174465,AX-85081391和AX-85064228。针对这些SNP,本研究进一步探究了它们与水牛产奶性状的关联分析。其中,性状-标记关联分析的模型为:Yijklm=μ+hysi+Pj+Gk+eijk,其中Yijk为性状观察值;μ为均值,hysi为场年季效应,Pj为胎次效应,Gm为基因型效应,eijk为随机误差。分析结果采用Bonferroni多重比较进行验证。分析软件为SAS9.4。
二,研究结果:
1、选择信号方法鉴定出SLCO3A1(OATP3A1)为水牛产奶性状相关的候选基因1.1水牛群体SNP鉴定
使用dd-RAD分析,表1展示45头水牛个体的157523个SNP的分布情况,这些SNP覆盖了约2.62Gb的水牛基因组,平均6.3K SNP/染色体,平均密度为1个SNP/16647bp。每条染色体的SNP数量从3620(在ChrX上)到11914(在Chr3上)不等。本研究水牛群体中共检测到13779单倍型模块,其中Chr3的单倍型数最多(1042;7.56%),而ChrX的单倍型最少(301;2.18%)。此外,本研究群体中每条染色体的平均MAF为0.171。
表1基于dd-RAD数据的水牛SNP分布情况
Figure BDA0002804449000000071
Figure BDA0002804449000000081
1.2水牛遗传多样性和群体结构
表2展示了河流和沼泽型水牛群体之间的遗传多样性,其中这两个群体的平均等位基因频率分别为0.200和0.148。与沼泽型水牛群体(观测杂合度:0.162;期望杂合度:0.174)相比,河流型水牛群体(观测杂合度:0.205;期望杂合度:0.223)具有更高的杂合度。河流型水牛群体(等位基因丰度=1.675)的等位基因丰度高于沼泽型水牛群体(等位基因丰度=1.547)。河流和沼泽型水牛群体的多态信息含量分别为0.175和0.138。
河流和沼泽型水牛种群体遗传关系如图1所示。系统发育分析表明,这45头个体分为两组,即河流和沼泽型(图1A)。主成分分析(图1B)和群体遗传结构分析(图1C)结果也支撑上述观点。
表2河流型和沼泽型水牛群体遗传多样性
Figure BDA0002804449000000082
1.3选择信号方法鉴定出SLCO3A1(OATP3A1)为水牛产奶性状相关的候选基因
基于Fst的经验分布,共有365个候选区域处于选择信号区域,其中共有327个基因位于这些选择信号区域内或附近(图2A)。使用XP-CLR方法,我们观察到总共215个候选区域(包含205个基因)视为选择信号区域(图2B)。有趣的是,六个基因均被XP-CLR和Fst方法检测到(图2C),视为与水牛产奶性状相关的候选基因,分别是信号转导和转录激活因子3(STAT3),溶质载体有机阴离子转运蛋白家族成员3A1(SLCO3A1),丛蛋白A4(PLXNA4),转移RNA半胱氨酸(anticodon ACA)(TRNAC-ACA),转移RNA半胱氨酸(anticodon GCA)(TRNAC-GCA)和RNA谷氨酸(anticodon CUC)(TRNAE-CUC)。图2D则展示了所选基因功能注释和富集分析结果。
2、比较转录组分析鉴定出SLCO3A1影响水牛的产奶性状
2.1 OAT基因家族的鉴定
从河流和沼泽型水牛基因组鉴定出17个OAT基因编码的非冗余蛋白序列(表2),其中蛋白序列的长度介于644到1222之间,分子量大小的最大值为133.66KDa,而最小值为70.20KDa。有趣的是,基于系统发育分析,这些OAT基因分为三类(图3)。Group1由五个OAT基因组成(SLCO1C1,SLCO1A2,SCLO1B3,SCLO3A1和SCLO2B1),而Group3仅具有SCLO5A1基因。Group2包含SCLO4C1,SCLO4A1和SCLO6A1基因。所构建的树状图进一步表明,水牛OAT基因家族与其他五个代表性哺乳动物关系最密切。
表2水牛OAT基因蛋白序列特性分析结果
Figure BDA0002804449000000091
S2、水牛OAT基因的基因复制分析:在河流型水牛中发现10个OAT基因,并随机分布在7条染色体上,而沼泽型水牛的7个OAT基因随机分布在4条染色体上(图4A)。基因重复分析发现,河流型和沼泽型水牛存在4对串联重复的OAT基因,分别为河流型水牛中的SLCO1B3-SLCO1A2和SLCO6A1-SLCO4C1,以及沼泽型水牛中的SLCO1C1-SLCO1A2和SLCO4C1-SLCO6A1。重要的是,在河流型水牛中发现2对大片段复制的OAT基因(SLCO3A1-SLCO4C1和SLCO4A1-SLCO5A1)。水牛正选择分析进一步表明,这些发生基因复制事件的OAT基因对的Ka/Ks比值均小于1,表明它们在进化过程历经了纯化选择,其歧化时间为为41.545至96.155Mya(表S6)。对于OAT基因家族,研究发现河流型和沼泽型水牛之间有5个OAT基因对直系同源(图4B),包括SLC2A1,SLCO3A1-SLCO4C1,SLCO4A1,SLCO5A1和SLCO6A1-SLCO4C1。所有直系同源基因对的歧化时间在0.063至55.210Mya之间。更重要的是,我们发现SLCO3A1和SLCO4C1基因对在两个亚种之间是直系同源的(图4B),唯有河流型水牛发生了大片段复制事件(图4A)。该直系同源基因对的歧化时间发生在46.857Mya(表4),而大片段复制事件始于61.032Mya(表3)。这些结果说明,SLCO3A1基因在河流型水牛出现了复制事件,而在沼泽型水牛中出现了丢失事件。
表3发生复制事件的水牛OAT基因的Ka/Ks比率和歧化时间分析
Figure BDA0002804449000000101
表4水牛直系同源的OAT基因的Ka/Ks比率和歧化时间分析
Figure BDA0002804449000000102
2.3水牛OAT基因家族的表达模式分析
使用来自不同组织的RNA-seq数据,我们发现大多数OAT基因具有广谱表达模式(图5A和5B)。同时,同一组中的不同OTA基因在河流型水牛(图5A)和沼泽型水牛(图5B)之间具有相似的表达模式。在聚类组中,除SLCO1C1外,Group1 OAT基因的表达水平高于Group2和SLCO5A1(图5A和5B)。此外,我们进一步发现在河流型水牛的牛奶组织中仅检测到四个OAT基因的表达模式(图5C)。三个Group1 OAT基因,包括SLCO2B1,SLCO3A1和SLCO4A1,表现出比SLCO4C1基因更高的mRNA表达水平。此外,在哺乳期的早期和中期观察到较高的SLCO2B1和SLCO3A1基因表达水平,而在哺乳后期发现较高的SLCO4A1基因表达水平。这些结果表明,不同的Group1 OAT基因可能具有阶段特异性的表达模式。与沼泽型水牛相比,河流型水牛特异性重复的SLCO3A1基因在乳腺组织中的表达水平更高(图5D和表5)。同时,与沼泽型水牛相比,在水牛中选择的其他三个OAT基因的表达水平也更高(图5D和表5)。
表5四种基因在不同种水牛的乳腺组织表达量(均值±标准误)
Figure BDA0002804449000000111
结合上述基因复制事件,在进化过程中,SLCO3A1在河流型水牛发生了大片段复制,同时SLCO3A1在乳腺组织也属于高表达,从而说明该基因在对河流型水牛的产奶性能具有正向效应,而SLCO3A1在沼泽型中发生了基因丢失事件,进一步说明SLCO3A1的存在与否可能是造成河流型水牛和沼泽型水牛产奶性状高低的原因之一。显然,比较转录组策略进一步说明了SLCO3A1可视为水牛产奶性状相关的候选基因。
3、SLCO3A1中的g.54621870G>T鉴定为影响水牛乳蛋白率的分子标记
试验水牛群的品种是地中海水牛群,含有406头个体。水牛SLCO3A1中的g.54621870G>T位点的关联分析结果见表6所示。
表6 g.54621870G>T与水牛产奶性状的关联分析
Figure BDA0002804449000000112
由表6中可以得出基因型与水牛产乳蛋白率显著相关(P<0.05)。对于该位点,携带TT基因型的地中海水牛个体的乳蛋白率高于GG型个体。综上,而基于G54621870T-TT基因型进行判定和选育高乳蛋白率的奶水牛。这对于组建高产奶水牛核心群具有重要意义。
综上所述,本发明首次通过基于Fst和XP-CLR的选择信号分析鉴定与水牛产奶性状相关的候选基因,同时基于比较转录组策略进一步辅助验证候选基因的功能性。该策略大大提高了与目标性状相关候选基因鉴定的可靠性。本发明首次研究发现了与水牛产奶性状相关的候选基因-SCLO3A1基因,为选育具有优良性状的水牛品种提供技候选基因。同时,本发明利用标记-性状关联分析方法鉴定出SLCO3A1中的g.54621870G>T位点为影响水牛乳蛋白率的分子标记,这对于组建高产奶水牛核心群具有重要意义。简而言之,本发明也为其他畜种重要经济性状相关候选基因的鉴定提供了新思路,并且通过对奶水牛产奶性状相关的基因型进行全基因组关联分析,为选育具有育或辅助选育与奶水牛产奶性状相关的奶水牛品种或品系--奶中的乳蛋白率高/低的优良的奶水牛提供技术支撑和奠定理论基础。
以上所述实施例仅表达了本发明的几种实施方式其描述较为具体和详细但并不能因此而理解为对本发明范围的限制。应当指出的是对于本领域的普通技术人员来说在不脱离本发明构思的前提下还可以做出若干变形和改进这些都属于本发明的保护范围。因此本发明的保护范围应以所附权利要求为准。
序列表
<110> 广西壮族自治区水牛研究所
<120> 鉴定水牛产奶性状候选基因标记的方法及应用
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 101
<212> DNA
<213> 水牛属(bubalus)
<220>
<221> misc_feature
<222> (51 )..( 51)
<223> n is t or g
<220>
<221> misc_feature
<222> (51)..(51)
<223> n is a, c, g, t or u
<400> 1
tctatggtta gtgttaaatg ccaggagtct gatgatagca ttgtggtcat ntcttcatct 60
tttaaagata gatcttgaaa taattatgga caaaatgagg t 101

Claims (3)

1.一种检测与奶水牛产奶性状相关的SNP分子标记的试剂在选育或辅助选育与水牛产奶性状相关的水牛品种或品系的用途,其特征在于:具体是选育或辅助选育奶中的乳蛋白率高/低的水牛;
与奶中的乳蛋白率相关的分子遗传标记位于第20号染色体的第54621870核酸位点,该位点的碱基为G或T,对应位于核酸序列表SEQ ID NO.1的第51位核酸位点。
2.一种检测与奶水牛产奶性状相关的SNP分子标记的试剂在选育或辅助选育与水牛产奶性状相关的水牛品种或品系的方法,其特征在于:具体步骤为:提取水牛基因组DNA,检测水牛的第20号染色体的第54621870位核苷酸,检测出第54621870位核苷酸的序列为G或T,确定待测水牛的基因型是GG或TT型,根据需要选择GG或TT型基因的水牛进行下一步选种和/或育种;所述TT型基因水牛的奶中的乳蛋白率高于GG型基因水牛。
3.根据权利要求1所述的用途,其特征在于,水牛产奶性状的相关候选基因为SCLO3A1基因。
CN202011362674.8A 2020-11-27 2020-11-27 鉴定水牛产奶性状候选基因标记的方法及应用 Active CN112342302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011362674.8A CN112342302B (zh) 2020-11-27 2020-11-27 鉴定水牛产奶性状候选基因标记的方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011362674.8A CN112342302B (zh) 2020-11-27 2020-11-27 鉴定水牛产奶性状候选基因标记的方法及应用

Publications (2)

Publication Number Publication Date
CN112342302A CN112342302A (zh) 2021-02-09
CN112342302B true CN112342302B (zh) 2023-01-03

Family

ID=74366102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011362674.8A Active CN112342302B (zh) 2020-11-27 2020-11-27 鉴定水牛产奶性状候选基因标记的方法及应用

Country Status (1)

Country Link
CN (1) CN112342302B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113311166B (zh) * 2021-04-28 2022-10-28 新疆农垦科学院 一种用于绵羊早期妊娠诊断的蛋白生物标志物及其用于绵羊早期妊娠检测的方法
CN113265472B (zh) * 2021-06-02 2022-02-22 华中农业大学 与地中海水牛优良泌乳性状相关的分子标记与应用
CN113481307B (zh) * 2021-08-11 2022-12-06 广西壮族自治区水牛研究所 与水牛泌乳相关基因ntng1及其作为分子标记的应用
CN114255822B (zh) * 2022-01-24 2023-04-07 广东省林业科学研究院 一种马尾松高产脂功能snp标记的筛选方法及其应用
CN114717330B (zh) * 2022-04-13 2023-09-22 中国农业科学院北京畜牧兽医研究所 与绵羊单胎产羔数相关的snp分子标记、引物组、试剂盒及检测方法和应用
CN117095746A (zh) * 2023-08-28 2023-11-21 广西壮族自治区水牛研究所 一种用于水牛的gbs全基因组关联分析方法
CN117701727B (zh) * 2023-12-04 2024-06-07 广西壮族自治区水牛研究所 基于全基因组测序筛选的与摩拉水牛体尺、初生重相关的snp分子标记组合及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103898106A (zh) * 2014-04-11 2014-07-02 广西壮族自治区水牛研究所 与水牛产奶性状相关的snp标记及其应用
CN110289048A (zh) * 2019-07-05 2019-09-27 广西壮族自治区水牛研究所 与水牛产奶性状相关的qtl及其筛选方法和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103898106A (zh) * 2014-04-11 2014-07-02 广西壮族自治区水牛研究所 与水牛产奶性状相关的snp标记及其应用
CN110289048A (zh) * 2019-07-05 2019-09-27 广西壮族自治区水牛研究所 与水牛产奶性状相关的qtl及其筛选方法和应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Genomic Identification, Evolution, and Expression Analysis of Collagen Genes Family in Water Buffalo during Lactation;Xingrong Lu等;《Genes》;20200506;第11卷(第5期);第2节材料和方法 *
High density genome wide genotyping-by-sequencing and association identifies common and low frequency SNPs, and novel candidate genes influencing cow milk traits;Eveline M. Ibeagha-Awemu等;《Scientific Reports》;20160810;第6卷;全文 *
Mediterranean river buffalo CSN1S1 gene: search for polymorphisms and association studies;G. Cosenza等;《Animal Production Science》;20140520;第55卷;全文 *
Osteopontin gene polymorphism association with milk traits and its expression analysis in milk of riverine buffalo;Sidra Manzoor等;《Trop Anim Health Prod》;20170930;第50卷;全文 *

Also Published As

Publication number Publication date
CN112342302A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN112342302B (zh) 鉴定水牛产奶性状候选基因标记的方法及应用
CN111225986B (zh) 一种鸡全基因组snp芯片及其应用
Saravanan et al. Selection signatures in livestock genome: A review of concepts, approaches and applications
Fan et al. Development and application of high-density SNP arrays in genomic studies of domestic animals
CN115029451B (zh) 一种绵羊液相芯片及其应用
WO2020122507A1 (ko) 토종닭의 유전적 배경 또는 품종을 판별하기 위한 snp 마커 세트 및 이의 용도
CN110289048A (zh) 与水牛产奶性状相关的qtl及其筛选方法和应用
Gutiérrez-Gil et al. High-resolution analysis of selection sweeps identified between fine-wool Merino and coarse-wool Churra sheep breeds
Gutiérrez-Gil et al. Detection of quantitative trait loci and putative causal variants affecting somatic cell score in dairy sheep by using a 50K SNP chip and whole-genome sequencing
CN106755371B (zh) 利用pcr-rflp检测绵羊pcnp基因单核苷酸多态性的方法及其应用
Lu et al. Genome-wide analysis reveals genetic diversity, linkage disequilibrium, and selection for milk production traits in Chinese buffalo breeds
CN118186103A (zh) 一种大口黑鲈100k液相芯片及其应用
ES2637292A1 (es) MÉTODO DE DETECCIÓN DEL MARCADOR NCAPG_c.1754C&gt;T PARA LA EVALUACIÓN DEL MÉRITO GENÉTICO PARA EL CARÁCTER ANCHURA DE LA GRUPA EN OVINOS
Hu et al. Identification of genomic diversity and selection signatures in Luxi cattle using whole-genome sequencing data
CN106701930B (zh) 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用
CN106929570B (zh) 一种利用普通牛y染色体单核苷酸遗传标记鉴定公牛品种的方法
Lim et al. Analysis of extended haplotype in Korean cattle (Hanwoo) population
CN110452990B (zh) 用于选择母鸡产蛋后期产蛋率的snp分子标记及其应用
CN113481307B (zh) 与水牛泌乳相关基因ntng1及其作为分子标记的应用
CN113897443B (zh) 一个与南方荷斯坦奶牛乳脂率相关的snp分子标记、试剂盒及应用和选育方法
CN116254356B (zh) 一种用于结核分枝杆菌谱系2.3亚型菌株进行鉴定的方法及其应用
CN115820872B (zh) 一种与麻黄鸡繁殖性状相关的分子标记及其应用
CN116716410A (zh) 一种黄斑篮子鱼性别相关的分子标记及引物与其性别鉴定方法与应用
CN114277157A (zh) 一个与南方荷斯坦奶牛乳蛋白率相关的snp分子标记和选育方法
이원석 Detection of Adaptive Signatures in the Livestock Genomes and Estimate of Connectedness

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210209

Assignee: Cenxi Qiliao Agricultural Development Co.,Ltd.

Assignor: GUANGXI ZHUANG AUTONOMOUS REGION BUFFALO INSTITUTE

Contract record no.: X2023980045747

Denomination of invention: Method and application of identifying candidate gene markers for milk production traits in water buffaloes

Granted publication date: 20230103

License type: Common License

Record date: 20231106