CN117265139B - 一种萨福克羊体重相关snp标记及其筛选方法与应用 - Google Patents
一种萨福克羊体重相关snp标记及其筛选方法与应用 Download PDFInfo
- Publication number
- CN117265139B CN117265139B CN202311569332.7A CN202311569332A CN117265139B CN 117265139 B CN117265139 B CN 117265139B CN 202311569332 A CN202311569332 A CN 202311569332A CN 117265139 B CN117265139 B CN 117265139B
- Authority
- CN
- China
- Prior art keywords
- sheep
- seq
- weight
- sequence shown
- chr7
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001494479 Pecora Species 0.000 title claims abstract description 126
- 239000003550 marker Substances 0.000 title claims abstract description 48
- 238000012216 screening Methods 0.000 title claims abstract description 21
- 239000002773 nucleotide Substances 0.000 title claims description 30
- 125000003729 nucleotide group Chemical group 0.000 title claims description 30
- 238000000034 method Methods 0.000 title abstract description 24
- 230000037396 body weight Effects 0.000 claims description 23
- 210000000349 chromosome Anatomy 0.000 claims description 5
- 238000003205 genotyping method Methods 0.000 claims description 4
- 238000012408 PCR amplification Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 206010033307 Overweight Diseases 0.000 claims 2
- 230000003321 amplification Effects 0.000 claims 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims 2
- 238000003752 polymerase chain reaction Methods 0.000 claims 2
- 238000009395 breeding Methods 0.000 abstract description 17
- 230000001488 breeding effect Effects 0.000 abstract description 17
- 241001465754 Metazoa Species 0.000 abstract description 7
- 239000003147 molecular marker Substances 0.000 abstract description 7
- 238000012214 genetic breeding Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 108090000623 proteins and genes Proteins 0.000 description 22
- 238000012098 association analyses Methods 0.000 description 19
- 238000012163 sequencing technique Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 10
- 238000003908 quality control method Methods 0.000 description 8
- 238000013517 stratification Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000010219 correlation analysis Methods 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010171 animal model Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 230000003234 polygenic effect Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 description 2
- 241001647091 Saxifraga granulata Species 0.000 description 2
- 238000012097 association analysis method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 101710146120 Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 1
- 101100013695 Caenorhabditis elegans fut-8 gene Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 102000006471 Fucosyltransferases Human genes 0.000 description 1
- 108010019236 Fucosyltransferases Proteins 0.000 description 1
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 1
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical group C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011990 functional testing Methods 0.000 description 1
- 101150023212 fut8 gene Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000020997 lean meat Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/124—Animal traits, i.e. production traits, including athletic performance or the like
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P60/00—Technologies relating to agriculture, livestock or agroalimentary industries
- Y02P60/80—Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
- Y02P60/87—Re-use of by-products of food processing for fodder production
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Wood Science & Technology (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物技术与动物遗传育种领域,具体涉及一种萨福克羊体重相关SNP标记及其筛选方法与应用。本发明提供的分子标记不受萨福克羊的年龄等限制,可用于具有更优质萨福克羊的早期育种,甚至刚出生即可进行准确地进行体重筛选,为今后优质萨福克羊新品种选育提供支撑,能大大加快萨福克羊的育种进程。
Description
技术领域
本发明涉及生物技术与动物遗传育种领域,具体涉及一种萨福克羊体重相关SNP标记及其筛选方法与应用。
背景技术
萨福克是世界公认的优质绵羊品种,体型壮硕,肉质好、瘦肉率高,具有良好的肉用饲养价值。世界上多个国家和地区引进萨福克羊,不仅作为纯种繁育进行饲养生产,同时还用作杂交育种的优质父本。
随着单核苷酸多态性(single nucleotide polymorphism SNP)第三代分子标记的不断完善,利用分子育种提高绵羊的育种效率成了热点。而全基因组关联分析凭借其高效、快速的优点,迅速成为了分子育种的有效手段。现有技术中缺少与萨福克羊体重相关的SNP标记。
发明内容
本发明提供一种萨福克羊体重相关SNP标记及其筛选方法与应用,为今后优质萨福克羊的选育提供支撑。
本发明提供与绵羊体重相关的SNP标记,包括以下分子标记中一种或多种:
1)chr7:76314472位点的SNP标记:位于绵羊第7号染色体第76314472位,该处碱基为A或G;
2)chr7:76314515位点的SNP标记:位于绵羊第7号染色体第76314515位,该处碱基为T或C。
根据所述与绵羊体重相关的SNP标记,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.1所示的核苷酸序列;多态性位点位于如SEQ ID NO.1所示序列的第31位。
或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.2所示的核苷酸序列;多态性位点位于如SEQ ID NO.2所示序列的第40位。
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.3所示的核苷酸序列;多态性位点位于如SEQ ID NO.3所示序列的第60位。
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.4所示的核苷酸序列;多态性位点位于如SEQ ID NO.4所示序列的第80位。
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.5所示的核苷酸序列;多态性位点位于如SEQ ID NO.5所示序列的第100位。
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.6所示的核苷酸序列;多态性位点位于如SEQ ID NO.6所示序列的第34位。
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.7所示的核苷酸序列;多态性位点位于如SEQ ID NO.7所示序列的第40位。
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.8所示的核苷酸序列;多态性位点位于如SEQ ID NO.8所示序列的第60位。
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.9所示的核苷酸序列;多态性位点位于如SEQ ID NO.9所示序列的第78位。
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.10所示的核苷酸序列;多态性位点位于如SEQ ID NO.10所示序列的第100位。
根据所述与绵羊体重相关的SNP标记, chr7:76314472位点的SNP标记,GG基因型对应的绵羊具有更高的体重,GA基因型对应的绵羊具有较高的体重,AA基因型对应的绵羊具有较低的体重;
和/或,chr7:76314515位点的SNP标记,TT基因型对应的绵羊具有更高的体重,TC基因型对应的绵羊具有较高的体重,CC基因型对应的绵羊具有较低的体重。
本发明还提供一种引物,用于扩增所述SNP标记。
本发明还提供含有所述引物的检测产品,所述检测产品为检测试剂、试剂盒或基因芯片。
本发明还提供所述SNP标记、所述引物、或所述检测产品在以下任一项中的应用:
(1)在检测或辅助检测绵羊体重中的应用;
(2)在绵羊体重的早期预测中的应用;
(3)在绵羊分子标记辅助育种中的应用;
(4)在绵羊种质资源改良中的应用;
(5)在筛选高体重绵羊中的应用;
(6)在绵羊体重基因分型中的应用;
(7)在鉴定和/或筛选绵羊体重性状中的应用。
根据所述应用,鉴定和/或筛选高体重绵羊;
和/或,所述绵羊为萨福克羊;
和/或,chr7:76314472位点的SNP标记,GG基因型对应的绵羊具有更高的体重,GA基因型对应的绵羊具有较高的体重,AA基因型对应的绵羊具有较低的体重;
和/或,chr7:76314515位点的SNP标记,TT基因型对应的绵羊具有更高的体重,TC基因型对应的绵羊具有较高的体重,CC基因型对应的绵羊具有较低的体重;
和/或,所述SNP位点参考基因组版本号为Ovis aries (assembly ARS-UI_Ramb_v2.0);
和/或,包括以下步骤:
1)提取待测绵羊的基因组DNA;
2)以待测绵羊的基因组DNA为模板,利用所述引物进行PCR扩增反应;
3)分析PCR扩增产物。
本发明还提供了一种分子标记辅助选育大体重的萨福克羊的方法:利用chr7:76314472分子标记的多态性,不同基因型对体重的影响为GG>GA>AA,故保留G/G基因型的萨福克羊个体;利用chr7:76314515分子标记的多态性,不同基因型对体重的影响为TT>TC>CC,故保留T/T基因型的萨福克羊个体。
本发明还提供一种基于全基因组关联分析筛选绵羊体重性状相关候选标记方法,所述方法包含以下步骤:
采集多头绵羊的DNA样品,进行全基因组重测序进行基因分型检测,并统计绵羊不同个体的体重性状,将得到的数据基于GMAT全基因组关联分析方法进行分析,筛选与体重性状显著关联的单核苷酸多态SNPs及候选基因,整合基因功能注释筛选绵羊体重性状相关的SNP分子标记。
根据所述基于全基因组关联分析筛选绵羊体重性状相关候选标记方法,全基因组关联测序数据经过质控后,利用GMAT软件基于LMM模型进行关联分析,挖掘出与绵羊体重性状显著相关的SNPs,其中LMM模型为,式中Y为表型向量,/>为固定效应或协变量,/>为/>的关联矩阵,/>为待检验标记效应,/>为/>的关联矩阵,/>为多基因效应,e为残差效应;
和/或,基于注释获得全基因组关联分析的显著SNPs后,下载该位点上下游500bp的序列后,通过NCBI和Ensembl数据库进行比对,对显著SNPs进行候选基因注释;
和/或,用琼脂糖凝胶电泳检测DNA的质量,用Nanodrop检测DNA的纯度,用Qubit精确定量DNA浓度。
根据所述基于全基因组关联分析筛选绵羊体重性状相关候选标记方法,所述绵羊为萨福克羊;
和/或,采集绵羊的耳组织提取DNA;
和/或,记录绵羊的体重;
和/或,群体分层对绵羊体重性状的指标绘制Q-Q图,来判断关联分析中是否出现偏差和样本群体的分层现象;
和/或,适用R语言绘制QQ plot图以及曼哈顿图;
和/或,只保留常染色上的位点,剔除缺失率大于10%的位点,剔除次等位基因品类小于0.05的位点,剔除哈代-温伯格平衡检验P值小于10-6的位点;
和/或,将质量合格的DNA稀释至45-55ng/ul;进一步优选为48-52ng/ul;更优选为50ng/ul。
本发明还提供一种萨福克羊体重性状候选标记的筛选方法,主要目的是为其在培育优质萨福克羊的分子育种中的应用。
开展分子育种的前提是筛选某一性状的有效遗传标记,方可对其进行进一步的功能试验及群体验证。因此本发明通过对萨福克羊体重性状的全基因组关联分析,以其获得与体重性状显著相关的重要SNPs位点及候选基因。
本发明提供一种基于全基因组关联分析筛选萨福克羊体重性状相关候选标记的方法,所述方法包含以下步骤:
步骤1、实验动物的养殖及样本采集
实验选用的动物是萨福克羊,来自新疆康普森生物技术有限公司羊场,从该群体中根据系谱挑选300只作为全基因组测序对象并采集耳组织提取全基因组DNA。
步骤3、生长性能数据记录
对300只羊的体重数据进行收集记录。
步骤4、基因组DNA的提取及检测
基因组DNA的提取采用DNA试剂盒,按照说明说方法提取基因组DNA,并对其进行完整性、纯度以及浓度的检测,符合要求的样本保留,不符合的重新提取,仍不合格的样本则淘汰。
步骤5、测序数据质控及参考基因组比对
实验按照华大基因提供的标准protocol执行,对检测合格的基因组DNA样品,通过凝胶电泳的方法选择合适的大小片段,通过PCR扩增建库,再对建好的文库进行质量检测,合格的文库再用MGISEQ-T7测序,该测序由北京康普森生物技术有限公司完成。为保证信息分析质量,在测序时,要进行碱基测序质量分布分析、碱基含量分布分析及将高通量测序得到的原始图像数据(Raw reads)文件进行过滤。
步骤6、数据处理和统计分析,具体包括
(1)使用EXCEL对体重数据进行分析,分析的结果为有效记录数、极大值、极小值、平均值、方差及标准差。
(2)全基因组关联分析:测序数据经过质控后,使用GMAT软件基于LMM模型进行关联分析,挖掘与萨福克羊体重性状相关的SNPs,其中LMM模型为,式中Y为表型向量,/>为固定效应或协变量,/>为/>的关联矩阵,/>为待检验标记效应,/>为/>的关联矩阵,/>为多基因效应,e为残差效应。
(3)在进行关联分析时,运用置换检验计算全基因组关联分析结果P值,使用1000次置换检验,提取千分之一的位置为每一次置换检验的P值,最后提取5%的位置作为最终阈值,来检测到有效SNP是否达到显著水平。
(4)群体分层:群体分层是指由于祖先不同导致的等位基因频率差异,已被证实是一个混杂因素,可能会导致假阳性结果,因此对萨福克羊的体重指标绘制Q-Q图,来判断关联分析中是否出现偏差样本和本群体的群体分层现象。
(5)显著SNPs基因注释:在获得全基因组关联分析的显著SNPs位点后,下载该位点上下游500kb的碱基序列,通过NCBI和Ensembl等数据库进行序列比对,确定显著SNPs附近的基因,并筛选出与该位点距离最近的基因。
进一步,步骤3中,关联分析了萨福克羊体重性状。
进一步,步骤5中,将测序获得的最终的序列重新比对到参考基因组上,再进行后续分析。参考基因物种为绵羊,参考基因组链接为:Ovis aries genome assembly ARS-UI_Ramb_v2.0 - NCBI - NLM (nih.gov)。
有益效果
本发明提供的分子标记不受萨福克羊的年龄等限制,可用于具有更优质萨福克羊的早期育种,甚至刚出生即可进行准确地进行体重筛选,能大大加快萨福克羊的育种进程。
萨福克羊作为肉用绵羊,对其生长、肉质等重要形状的遗传改良进展直接影响企业的经济效益,而GWAS在鉴定这些重要性状的遗传标记或主效基因上具有强大优势,可显著促进遗传育种进展,本研究通过GWAS技术筛选与萨福克羊体重性状相关主效基因及SNP,本发明方法方便快捷,准确性高,为后续选育优质萨福克羊提供理论支撑。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。
图1为本发明实施例1提供的萨福克羊体重全基因组关联分析曼哈顿图。
图2为本发明实施例1提供的萨福克羊体重的Q-Q图结果。
图3为本发明实施例1提供的萨福克羊体重性状SNPs基因型间差异显著性分析箱线图。
图4为本发明实施例1提供的萨福克羊体重显著SNPs候选基因的GO功能富集图。
图5为本发明实施例1筛选萨福克羊体重性状相关SNP的技术路线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明目的在于提出了一种萨福克羊体重相关的全基因组关联分析方法,根据系谱选取300只萨福克羊作为关联分析实验对象,对体重数据进行记录,提取基因组DNA,经过检测所提取到的基因组DNA完整性、纯度和浓度,最终300只羊DNA样品全部合格,然后和体重指标进行全基因组关联分析,筛选候选基因,为今后优质萨福克羊的选育提供支撑。
实施例1
1.材料与方法
1.1实验动物和样本采集
本研究中的300只萨福克羊来自新疆康普森生物技术有限公司羊场,其中2022年出生个体142只(公羊44只、母羊98只),2023年出生个体158只(公羊73只、母羊85只),采集该群体的耳组织,对体重数据进行记录。
1.2全基因组重测序
基因组DNA的提取采取磁珠法,按照常规提取步骤提取基因组DNA,提取到的DNA要进行完整性及纯度检测,符合要求的DNA保留,不符合要求的重新提取,重新提取后仍不符合要求的样本则舍弃。实验按照华大基因提供的标准protocol执行,对检测合格的基因组DNA样品,通过凝胶电泳的方法选择合适大小的片段,然后通过PCR富集构建建库,文库构建完成后,使用 Qubit 进行定量质控,合格的文库用DNBSEQ-T7进行测序,该测序由北京康普森生物科技有限公司(北京,中国)完成。在DNBSEQ-T7测序后,要进行碱基测序质量分布分析、碱基含量分布分析及将高通量测序得到的原始图像数据(Raw reads)文件进行过滤。
将测序获得的最终的序列重新比对到参考基因组上,再进行后续分析。参考基因物种为绵羊,参考基因组链接为:Ovis aries genome assembly ARS-UI_Ramb_v2.0 -NCBI - NLM (nih.gov)。
1.3全基因组关联分析
测序数据经过质控后,使用GMAT软件基于LMM模型展开与体重的关联分析,筛选出显著效应的SNP。LMM模型如下:
式中Y为表型向量,为固定效应或协变量,/>为/>的关联矩阵,/>为待检验标记效应,/>为/>的关联矩阵,/>为多基因效应,e为残差效应。
1.4群体分层
群体分层是指由于祖先不同导致的等位基因频率差异,已被证实是一个混杂因素,可能会导致假阳性结果,因此对萨福克羊的体重指标绘制Q-Q图,来判断关联分析中是否出现偏差样本和本群体的群体分层现象。
1.5显著SNPs基因注释
在获得全基因组关联分析的显著SNPs标记后,在ENSEMBL网站上下载对应物种的参考基因组信息,使用ANNOVAR软件注释显著SNP附近的基因。并使用clusterProfiler包将注释到的候选基因根据GO数据库进行基因功能富集分析。
2.结果与分析
2.1测序数据质控及与参考基因组比对结果
样品测序质控数据见表1。碱基类型分布检测主要用于检查有无AT、CG分离现象,由表1可知,样品G和C的含量占总碱基的百分比平均为42.89%,质量值大于等于20的碱基数占总碱基数的98.79%,质量值大于30的碱基数占总碱基数的95.7%。样品DNA和基因组DNA的比对平均效率99.7%。说明该群体样品的文库构建和测序正常。
表1 样品测序数据质控统计
2.2萨福克羊不同体重性状统计
由表2可知,对300只萨福克羊的体重的极大值、极小值、平均值、标准差、变异系数进行统计,体重极大值、极小值和均值分别为84kg、30.15kg和53.06kg;300只羊的平均体重为53.06kg。
表2 萨福克羊体重数据统计
2.3萨福克羊体重性状全基因组关联分析
基于重测序的筛选出25510198个SNPs用于进一步分析,使用GWAS常用模型LMM统计分析,发现了373个SNPs与萨福克羊体重显著相关,通过NCBI和Ensembl序列比对,注释到57个基因上。通过文献查阅及多重比较,锚定chr7:76314472和chr7:76314515位点,被注释到FUT8基因上。两个位点的详细信息见表3。
表3 萨福克羊两个显著相关SNPs位点信息
2.4 萨福克羊体重相关候选基因及GO功能注释
为进一步鉴定萨福克羊体重性状相关基因,chr7:76314472和chr7:76314515位点都注释到岩藻糖基转移酶8(FUT8)基因上。FUT8位于绵羊7号染色体上,是岩藻糖基转移酶家族成员之一,是负责产生核心岩藻糖结构的唯一酶,在于哺乳动物组织中广泛表达,对动物正常生长发育有重要的作用。
实施例2
1.材料与方法
1.1实验动物和样品采集
用于验证的138萨福克羊群体采自于呼和浩特某羊场,其中公羊2只,母羊136只,采集该群体的血液样本,记录了体重数据。通过液相捕获技术进行基因型检测,验证上述2个与萨福克羊体重性状相关的SNP位点。
1.2显著位点与性状关联分析及多重比较
使用R4.2软件进行标记基因型与表型的关联性检验。模型如下:
y为表型向量,β为固定效应或协变量(性别、测定天数),X为β的关联矩阵,γ为待检验标记效应,Z为γ的关联矩阵,为残差效应。采用LSD法对不同基因型之间进行多重比较。
2.显著位点与性状关联分析及多重比较结果
对2个SNP标记,通过标记基因型与表型的关联性检验,及LSD法进行不同基因型间的多重比较,结果发现:chr7:76314472位点在萨福克群体中存在三种基因型(GG、GA和AA),其中GG型萨福克羊体重的平均值比GA大5.407,比基因型为AA的萨福克羊体重平均体值大8.68(差异显著)。chr7:76314515位点在萨福克羊群体中有三种基因型(TT、TC和CC),其中基因型为TT的萨福克羊体重的平均值比基因型为TC的大3.618,比基因型为CC的萨福克羊体重平均值大8.475(差异显著)。具体分析结果见表4。
表4 萨福克羊SNPs位点与体重相关检验
注:同一性状的数字上标小写字母相同的数据间差异不显著,标有不同小写字母的数据间差异显著。
本发明根据系谱选择300只萨福克羊作为全基因组关联分析的实验对象,记录羊的体重数据,采集该群体样本的耳组织,提取基因组DNA,并检测DNA的浓度、完整性及纯度,并对合格样本进行重测序,然后对萨福克羊的体重指标进行全基因组关联分析,筛选到候选基因与SNP位点。通过液相捕获技术对138只萨福克羊进行基因分型,对全基因组关联分析筛选到的2个体重相关位点进行了验证,为今后优质萨福克羊新品种选育提供了支撑。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.与萨福克羊体重相关的SNP标记,其特征在于,包括以下分子标记中一种或多种:
1)chr7:76314472位点的SNP标记:位于萨福克羊第7号染色体第76314472位,该处碱基为A或G;
2)chr7:76314515位点的SNP标记:位于萨福克羊第7号染色体第76314515位,该处碱基为T或C;
所述SNP标记参考基因组版本号为Ovis aries assembly ARS-UI_Ramb_v2.0;
chr7:76314472位点的SNP标记,GG基因型对应的萨福克羊具有更高的体重,GA基因型对应的萨福克羊具有较高的体重,AA基因型对应的萨福克羊具有较低的体重;
和/或,chr7:76314515位点的SNP标记,TT基因型对应的萨福克羊具有更高的体重,TC基因型对应的萨福克羊具有较高的体重,CC基因型对应的萨福克羊具有较低的体重。
2.根据权利要求1所述与萨福克羊体重相关的SNP标记,其特征在于,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.1所示的核苷酸序列;多态性位点位于如SEQ IDNO.1所示序列的第31位;
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.2所示的核苷酸序列;多态性位点位于如SEQ ID NO.2所示序列的第40位;
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.3所示的核苷酸序列;多态性位点位于如SEQ ID NO.3所示序列的第60位;
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.4所示的核苷酸序列;多态性位点位于如SEQ ID NO.4所示序列的第80位;
和/或,所述chr7:76314472位点的SNP标记含有如SEQ ID NO.5所示的核苷酸序列;多态性位点位于如SEQ ID NO.5所示序列的第101位;
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.6所示的核苷酸序列;多态性位点位于如SEQ ID NO.6所示序列的第34位;
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.7所示的核苷酸序列;多态性位点位于如SEQ ID NO.7所示序列的第40位;
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.8所示的核苷酸序列;多态性位点位于如SEQ ID NO.8所示序列的第60位;
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.9所示的核苷酸序列;多态性位点位于如SEQ ID NO.9所示序列的第78位;
和/或,所述chr7:76314515位点的SNP标记含有如SEQ ID NO.10所示的核苷酸序列;多态性位点位于如SEQ ID NO.10所示序列的第101位。
3.权利要求1或2所述SNP标记在以下任一项中的应用:
(1)在检测或辅助检测萨福克羊体重中的应用;
(2)在萨福克羊体重的早期预测中的应用;
(3)在萨福克羊种质资源改良中的应用;
(4)在筛选高体重萨福克羊中的应用;
(5)在萨福克羊体重基因分型中的应用;
(6)在鉴定和/或筛选萨福克羊体重性状中的应用。
4.根据权利要求3所述应用,其特征在于,鉴定和/或筛选高体重萨福克羊;
和/或,chr7:76314472位点的SNP标记,GG基因型对应的萨福克羊具有更高的体重,GA基因型对应的萨福克羊具有较高的体重,AA基因型对应的萨福克羊具有较低的体重;
和/或,chr7:76314515位点的SNP标记,TT基因型对应的萨福克羊具有更高的体重,TC基因型对应的萨福克羊具有较高的体重,CC基因型对应的萨福克羊具有较低的体重;
和/或,包括以下步骤:
1)提取待测萨福克羊的基因组DNA;
2)以待测萨福克羊的基因组DNA为模板,利用权利要求1或2所述分子标记的扩增引物进行PCR扩增反应;
3)分析PCR扩增产物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311569332.7A CN117265139B (zh) | 2023-11-23 | 2023-11-23 | 一种萨福克羊体重相关snp标记及其筛选方法与应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311569332.7A CN117265139B (zh) | 2023-11-23 | 2023-11-23 | 一种萨福克羊体重相关snp标记及其筛选方法与应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117265139A CN117265139A (zh) | 2023-12-22 |
CN117265139B true CN117265139B (zh) | 2024-02-20 |
Family
ID=89203120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311569332.7A Active CN117265139B (zh) | 2023-11-23 | 2023-11-23 | 一种萨福克羊体重相关snp标记及其筛选方法与应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117265139B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106367502A (zh) * | 2016-08-31 | 2017-02-01 | 甘肃农业大学 | Spp1基因作为绵羊生长性状的分子标记及其应用 |
CN109234404A (zh) * | 2018-10-09 | 2019-01-18 | 石河子大学 | 一种鉴定绵羊产肉性状的方法及专用引物 |
CN111485026A (zh) * | 2020-04-20 | 2020-08-04 | 天津奥群牧业有限公司 | 一种与绵羊出生重相关的snp位点、应用、分子标记和引物 |
CN111705140A (zh) * | 2020-06-28 | 2020-09-25 | 浙江省农业科学院 | 体重性状相关的SNPs分子标记及其在湖羊辅助育种中的应用 |
CN115109856A (zh) * | 2022-06-20 | 2022-09-27 | 兰州大学 | 与绵羊阶段体重相关的分子标记、其检测方法及应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1643162A (zh) * | 2002-03-15 | 2005-07-20 | 衣阿华州立大学研究基金公司 | 新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用 |
CA2497570A1 (en) * | 2002-08-02 | 2004-02-12 | Orchid Biosciences, Inc. | Methods and compositions for genotyping |
-
2023
- 2023-11-23 CN CN202311569332.7A patent/CN117265139B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106367502A (zh) * | 2016-08-31 | 2017-02-01 | 甘肃农业大学 | Spp1基因作为绵羊生长性状的分子标记及其应用 |
CN109234404A (zh) * | 2018-10-09 | 2019-01-18 | 石河子大学 | 一种鉴定绵羊产肉性状的方法及专用引物 |
CN111485026A (zh) * | 2020-04-20 | 2020-08-04 | 天津奥群牧业有限公司 | 一种与绵羊出生重相关的snp位点、应用、分子标记和引物 |
CN111705140A (zh) * | 2020-06-28 | 2020-09-25 | 浙江省农业科学院 | 体重性状相关的SNPs分子标记及其在湖羊辅助育种中的应用 |
CN115109856A (zh) * | 2022-06-20 | 2022-09-27 | 兰州大学 | 与绵羊阶段体重相关的分子标记、其检测方法及应用 |
Non-Patent Citations (4)
Title |
---|
GenBank.NC_056060.1.2023,全文. * |
Whole-genome resequencing of the native sheep provides insights into the microevolution and identifies genes associated with reproduction traits;Mengting Zhu;《BMC Genomics》;第24卷(第1期);第1-16页 * |
全基因组SNP分型技术在畜禽遗传育种研究中的应用;刘继强等;《畜牧兽医学报》;第53卷(第12期);第4123-4137页 * |
多胎萨福克羊在新疆不同地域适应性研究;魏巧兰;《硕士学位论文》;第1-29页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117265139A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105648077B (zh) | 一种影响猪日增重性状的分子标记及其应用 | |
CN107760789B (zh) | 一种用于牦牛亲子鉴定和个体识别的基因分型检测试剂盒 | |
CN110846429A (zh) | 一种玉米全基因组InDel芯片及其应用 | |
CN111534602A (zh) | 一种基于高通量测序分析人类血型基因型的方法及其应用 | |
CN111485026A (zh) | 一种与绵羊出生重相关的snp位点、应用、分子标记和引物 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
Duffy et al. | Evidentiary evaluation of single cells renders highly informative forensic comparisons across multifarious admixtures | |
CN107988385B (zh) | 一种检测肉牛PLAG1基因Indel标记的方法及其专用试剂盒 | |
CN117265139B (zh) | 一种萨福克羊体重相关snp标记及其筛选方法与应用 | |
CN113564266B (zh) | Snp分型遗传标记组合、检测试剂盒及用途 | |
CN113481303B (zh) | 一种黄牛actr3基因cnv标记辅助检测生长性状的方法及其应用 | |
CN112501320B (zh) | 一种蛇源成分快速检测试剂盒及其应用 | |
CN109182505A (zh) | 奶牛乳腺炎关键SNPs位点rs75762330及2b-RAD基因分型和分析方法 | |
CN114875118A (zh) | 确定细胞谱系的方法、试剂盒和装置 | |
KR20220064951A (ko) | 인간 배아에서의 복제 수 변이의 확인을 위한 단일 뉴클레오티드 변이의 밀도를 사용하는 시스템 및 방법(systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos) | |
US20200190567A1 (en) | Method For Detecting Activity Change Of Transposon In Plant Before And After Stress Treatment | |
CN105543235B (zh) | 基因及其应用 | |
JP7444488B2 (ja) | 混入検出法 | |
CN116590435B (zh) | 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用 | |
CN109112194A (zh) | 半滑舌鳎性别标签piR-mmu-72274的应用 | |
CN110819721B (zh) | 一种鉴定高产伊犁鹅的分子标记及其应用 | |
CN116622862B (zh) | 棉鼠微卫星分子标记及其引物对与应用、棉鼠遗传检测的方法 | |
CN108300789A (zh) | 与猪多个重要经济性状相关的snp分子标记及其应用 | |
CN116083600A (zh) | 双峰驼乳脂率相关基因card11及其作为分子标记的应用 | |
CN117925860A (zh) | 一种与绿鳍马面鲀生长性状相关的snp分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |