CN112735515A - 一种筛选种母鸡贮精能力性状候选位点的方法和应用 - Google Patents
一种筛选种母鸡贮精能力性状候选位点的方法和应用 Download PDFInfo
- Publication number
- CN112735515A CN112735515A CN202011564361.0A CN202011564361A CN112735515A CN 112735515 A CN112735515 A CN 112735515A CN 202011564361 A CN202011564361 A CN 202011564361A CN 112735515 A CN112735515 A CN 112735515A
- Authority
- CN
- China
- Prior art keywords
- site
- candidate
- breeding
- trait
- hen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000009395 breeding Methods 0.000 title claims abstract description 48
- 230000001488 breeding effect Effects 0.000 title claims abstract description 48
- 230000009303 sperm storage Effects 0.000 title claims abstract description 34
- 238000012216 screening Methods 0.000 title claims abstract description 23
- 238000003860 storage Methods 0.000 claims abstract description 13
- 210000000582 semen Anatomy 0.000 claims abstract description 12
- 108090000623 proteins and genes Proteins 0.000 claims description 25
- 230000004720 fertilization Effects 0.000 claims description 22
- 210000000349 chromosome Anatomy 0.000 claims description 18
- 230000017448 oviposition Effects 0.000 claims description 15
- 108700028369 Alleles Proteins 0.000 claims description 14
- 230000035772 mutation Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 8
- 210000004369 blood Anatomy 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 claims description 5
- 101000690100 Homo sapiens U1 small nuclear ribonucleoprotein 70 kDa Proteins 0.000 claims description 4
- 101100029173 Phaeosphaeria nodorum (strain SN15 / ATCC MYA-4574 / FGSC 10173) SNP2 gene Proteins 0.000 claims description 4
- 101100236128 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) LSM2 gene Proteins 0.000 claims description 4
- 101100094821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SMX2 gene Proteins 0.000 claims description 4
- 102100024121 U1 small nuclear ribonucleoprotein 70 kDa Human genes 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 4
- 101000576898 Homo sapiens C-type mannose receptor 2 Proteins 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 101000657326 Homo sapiens Protein TANC2 Proteins 0.000 claims description 2
- 210000003746 feather Anatomy 0.000 claims description 2
- 230000035558 fertility Effects 0.000 claims 2
- 230000002068 genetic effect Effects 0.000 abstract description 4
- 239000003147 molecular marker Substances 0.000 abstract description 4
- 244000144977 poultry Species 0.000 abstract description 4
- 238000011160 research Methods 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 abstract description 3
- 230000006872 improvement Effects 0.000 abstract description 2
- 230000004069 differentiation Effects 0.000 description 10
- 239000002244 precipitate Substances 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 6
- 235000013601 eggs Nutrition 0.000 description 5
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012098 association analyses Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000007664 blowing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001079 digestive effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- ZADWXFSZEAPBJS-JTQLQIEISA-N 1-methyl-L-tryptophan Chemical compound C1=CC=C2N(C)C=C(C[C@H](N)C(O)=O)C2=C1 ZADWXFSZEAPBJS-JTQLQIEISA-N 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000012097 association analysis method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 230000036750 egg laying performance Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012247 phenotypical assay Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- ZADWXFSZEAPBJS-UHFFFAOYSA-N racemic N-methyl tryptophan Natural products C1=CC=C2N(C)C=C(CC(N)C(O)=O)C2=C1 ZADWXFSZEAPBJS-UHFFFAOYSA-N 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/124—Animal traits, i.e. production traits, including athletic performance or the like
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种筛选种母鸡贮精能力性状候选位点的方法和应用,属于家禽分子标记筛选鉴定技术领域,本发明结合重测序技术和极端群体表型信息,通过计算每个位点的群体分化统计量并与全基因组关联分析相结合,对种母鸡贮精能力性状候选位点和候选基因进行筛选。通过人工构建表型梯度差异群体的方法,使实验样本的数目大幅度降低,有效缩减了研究成本;该筛选方法具有数据量丰富,检测精度高的优点。本发明基于该方法筛选得到了5个种母鸡贮精能力性状候选位点,从而有效提高了种母鸡遗传改良的效率,降低育种工作的成本,为实际的蛋鸡种禽育种工作提供理论依据。
Description
技术领域
本发明属于家禽分子标记筛选鉴定技术领域,具体涉及一种筛选种母鸡贮精能力性状候选位点的方法和应用。
背景技术
鸡蛋是人们日常生活中必备的食物和消费品,我国是禽蛋消费和生产大国,2019年禽蛋产量为3308万吨且保持着持续增长的趋势,所以如何快速培育产蛋性能好、产受精蛋强的优质蛋鸡成为目前国内家禽种禽行业育种工作者亟待解决的问题。其中种母鸡贮精能力与高产受精蛋高度正相关,因此贮精能力性状的筛选是种禽(种母鸡)育种的思路之一。
“京红1号”蛋鸡作为我国自主培育的蛋鸡配套系,具有生产性能优越,繁殖性能突出等多项优势。“京红1号”蛋鸡的种母鸡繁殖性能受到高强度人工选择,其贮精能力在此过程中是否受到选择以及哪些基因控制着贮精能力的高低,这些问题都没有准确的答案。所以一些常用的筛选候选基因的方法(例如选择信号的方法)不适用于这类性状,而用大群体的重测序数据做全基因组关联分析(GWAS)的方法成本又比较高,基因芯片的方法也不够精确,因此通过人工构建具有表型梯度差异来计算不同群体的分化程度来与目标性状进行关联,并利用GWAS作为辅助方法进一步确定候选位点的方法是一个很好的突破点。虽然群体规模比较小会对GWAS结果造成一定影响,但是我们利用梯度的分化来与目标性状关联的方法在一定程度上弥补了这种影响,并且得到的结果相较于单一的GWAS更具准确性,因此这种挖掘蛋鸡种母鸡贮精能力候选位点和候选基因的方法对于蛋鸡种母鸡培育具有重要的理论意义和经济价值,并对肉鸡和地方品种鸡种母鸡的贮精能力性状筛选具有一定的参考和指导意义。
发明内容
本发明的目的在于提供一种筛选种母鸡贮精能力性状候选位点的方法和应用,该方法运用群体全基因组SNP位点标记的群体分化统计量与GWAS联合分析来评估蛋鸡种母鸡贮精能力性状候选位点和候选基因,具体为:结合重测序技术和极端群体表型信息,通过计算每个位点的群体分化统计量并与GWAS联合分析,用于挖掘影响蛋鸡种母鸡贮精能力性状的候选位点和基因,采用该方法可以有效提高蛋鸡种母鸡遗传改良的效率,降低育种工作的成本,为实际的蛋鸡种禽育种工作提供理论依据。
为实现上述目的,本发明采用的技术方案是:
一种筛选种母鸡贮精能力性状候选位点的方法,包括:
步骤1、饲养同一品种且日龄相同的产蛋种母鸡,从初产期开始每月统计每只种母鸡的最长受精天数表型数据,获得不少于250羽产蛋种母鸡的有效表型数据,并于统计的最后一天提取所述产蛋种母鸡的全部血样;
步骤2、对步骤1统计的最长受精天数表型数据进行分析,根据表型数据差异划分3对梯度亚群,包括最高差异梯度对、中等差异梯度对、普通差异梯度对群体,具体为:按最长受精天数进行秩排序,选取前50个样本与后50个样本组成普通差异梯度对,在此基础上取最长受精天数值最大的35个样本与最长受精天数值最小的35个样本组成中等差异梯度对,再在中等差异梯度对的基础上取最长受精天数值最大的20个样本与最长受精天数值最小的20个样本组成最高差异梯度对;
步骤3、提取步骤2所述的普通差异梯度对的100个产蛋种母鸡的血液样品DNA并进行重测序,去除缺失率大于20%的位点及最小等位基因频率小于0.05的位点,获得SNP位点数据,并基于所述SNP位点数据分别计算步骤2中三个梯度对的FST统计量和AFD统计量;
步骤4、对步骤3计算的FST统计量和AFD统计量中每个位点呈梯度变化的统计量进行秩排序,其中FST统计量和AFD统计量中前1%统计量对应的重叠SNP位点定义为目标性状关联位点;
步骤5、对步骤3获得的100个样品的重测序数据进行全基因组关联分析,取P值最小的10个位点作为候选位点;
步骤6、对步骤4获得的目标性状关联位点和步骤5获得的候选位点进行注释,取所述目标性状关联位点和所述候选位点的的重叠位点作为种母鸡贮精能力性状候选位点,所述贮精能力性状候选位点注释到的基因为贮精能力性状候选基因。
进一步的,步骤1中收集至少5个月的表型数据,并去除饲养过程中死亡或者表型缺失的产蛋种母鸡。
进一步的,所述方法还包括:将筛选得到的贮精能力性状的候选位点的基因型与表型数据进行关联分析,进行基因型效应估计。
本发明还提供了上述方法在筛选种母鸡贮精能力性状候选位点和/或种母鸡贮精能力性状候选基因中的应用。
本发明还提供了采用上述方法筛选得到的种母鸡贮精能力性状候选位点,包括:
SNP1位点:1号染色体的第65489499位点存在一个G>A碱基突变;
SNP2位点:1号染色体的第87998885位点存在一个A>G碱基突变;
SNP3位点:27号染色体的第4889482位点存在一个G>A碱基突变;
SNP4位点:27号染色体的第4898241位点存在一个T>A碱基突变;
SNP5位点:27号染色体的第4898269位点存在一个C>T碱基突变。
进一步的,所述种母鸡贮精能力性状候选位点注释的贮精能力性状候选基因包括:ENSGALG00000052327基因、ENSGALG00000052718基因、ENSGALG00000052321基因、MRC2基因和TANC2基因。
进一步的,所述SNP1位点和SNP2位点的碱基突变与种母鸡贮精能力性状呈正相关。
进一步的,所述SNP3位点、SNP4位点和SNP5位点的碱基突变与种母鸡贮精能力性状呈负相关。
本发明还提供了上述种母鸡贮精能力性状候选位点在种母鸡贮精能力性状辅助选择中的应用。
与现有技术相比,本发明的有益效果是:
(1)本发明通过人工构建表型梯度差异群体的方法,使实验样本的数目相比常规的全基因组关联分析的方法大幅度降低,从而有效缩减了研究成本。
(2)本发明通过将群体分化与全基因组关联分析相结合的方法对种母鸡贮精能力性状候选位点和候选基因进行筛选,相比于传统的使用基因芯片技术的全基因组关联分析方法,该筛选方法具有数据量丰富,检测精度高的优点,且该方法适用范围广泛,包括但不限于已明确受到人工选择的表型性状。
(3)本发明基于群体分化与全基因组关联分析相结合的方法,筛选得到了5个种母鸡贮精能力性状候选位点及其注释的候选基因,可将其用于种母鸡贮精能力性状的辅助选择。
附图说明
图1为本发明实施例3中“京红1号”蛋鸡种母鸡贮精能力性状关联位点的分布图,其中等位基因频率差方法具有选择指示作用,大于0代表参考等位基因在贮精能力高的亚群受到选择,小于0代表突变的等位基因在贮精能力高的亚群受到选择;
图2为本发明实施例4中“京红1号”蛋鸡种母鸡贮精能力性状极端梯度群体连锁不平衡衰减图,其中high_3/low_3代表最高差异梯度对,high_2/low_2代表中等差异梯度对,high_1/low_1代表普通差异梯度对;
图3为本发明实施例4中“京红1号”种母鸡贮精能力与SNP关联的曼哈顿图及QQ图;
图4为本发明实施例5中位于“京红1号”种母鸡基因组27号染色体上三个候选位点间的连锁不平衡图。
具体实施方式
下面将结合本发明中的实施例,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动条件下所获得的所有其它实施例,都属于本发明保护的范围。
以下实施例以“京红1号”蛋鸡的贮精能力性状为例用于说明本发明,但不用来限制本发明的范围。
实施例1表型测定
饲养同一品种的300只日龄相同的“京红1号”产蛋种母鸡,全部鸡在相同条件下,饲养于北京市华都峪口禽业有限责任公司祖代厂。从初产期每个月收集“京红1号”产蛋种母鸡的最长受精天数的表型数据,收集5个月的表型数据,去除饲养过程中死亡或者表型缺失的蛋鸡种母鸡个体,共获得251只种母鸡的有效表型数据,并在最后一次统计的同一天提取试验群京红1号”产蛋种母鸡的全部血样。
按照最长受精天数(DN)值对上述251只种母鸡进行秩排序,选取前50个样本与后50个样本组成普通差异梯度对,在此基础上取最长受精天数值最大的35个样本与最长受精天数值最小的35个样本组成中等差异梯度对,再在中等差异梯度对的基础上取最长受精天数值最大的20个样本与最长受精天数值最小的20个样本组成最高差异梯度对。在本实施例中根据表型变化划分梯度对,相邻梯度对的样本数目差值是15,即公差为15,表型描述性统计量如表1所示,其中H.1和L.1为普通差异梯度对,H.2和L.2为中等差异梯度对,H.3和L.3为最高差异梯度对。
表1最长受精天数(DN)分梯度表型数据
实施例2基因分型检测
(1)根据实施例1的结果,利用SDS-蛋白酶K消化法提取100只差异梯度群体样本的血液样品DNA,具体为:
a)室温解冻血样,取100μl血样于洁净的1.5ml离心管中,加入500μl的灭菌水,静置10min,8000r/min离心5min,弃上清;
b)加入500μl SET溶液重悬沉淀,用枪头将沉淀吹打破碎,8000r/min离心10min,弃上清;
c)重复上一步;
d)配制消化液(500μl SET+30μl SDS+10μl蛋白酶K),每管加入540μl消化液,将沉淀吹打重悬;
e)将含带消化样品的离心管插入浮漂中,于55℃水浴锅中消化过夜(直到样品完全被消化);
f)消化好的样品加5-20μl 10mg/ml的RNA酶,37℃水浴或烘箱中1.5-2h;
g)加入等体积的苯酚/氯仿/异戊醇(25:24:1)混合液560μl,缓慢颠倒离心管10次,静置15min,10000rpm室温离心15min,用黄枪头少量多次的吸上清至另一洁净离心管;
h)加入等体积的苯酚/氯仿/异戊醇(25:24:1)混合液及上述上清液,重复上述抽提步骤,将上清转移至1.5ml的EP管中;
i)在上清中加入1/10体积的3M NaAC和2-2.5倍体积预冷的无水乙醇,轻轻翻转至DNA聚集成团,呈白色丝状悬浮沉淀,用枪头直接挑出沉淀至新的EP管中;
j)加入500μl 75%乙醇洗涤沉淀,6000rpm离心5min,离心后倒掉残留液体,再重复洗涤一次,洗涤时彻底悬浮沉淀(悬浮时间与沉淀大小有关),短暂离心,吸出残留液体,于室温下让酒精挥发干净;
k)加入20-100μl TE溶解后测定DNA的浓度,根据测定浓度稀释分装完毕后于-20℃或-80℃长期保存,原液避免反复冻融。
(2)使用全基因组重测序技术检测SNP位点及其基因型,并去除缺失值大于20%的位点,去除最小等位基因频率小于0.05的位点,共获得了1744595个高质量的SNP位点。
实施例3种母鸡贮精能力性状SNP位点群体分化统计量的计算
(1)根据实施例2获得的SNP位点,分别计算实施例1中所述的3个差异梯度对群体的FST统计量与AFD统计量,并以此来评估群体位点分化程度。
FST指数是衡量群体分化程度的一种指标,FST指数可以评估由于选择作用造成的不同群体基因组上同一位点等位基因频率的差异程度。目前用于计算FST指数的方法有很多,现在应用最广泛的是Weir和Cockerman(Weir,B.S.and C.C.Cockerham(1984)."Estimating F-Statistics for the Analysis of Population Structure."Evolution;international journal of organic evolution 38(6):1358.)提出的方法,基本公式如下:
其中pAi是第i个群体等位基因A的频率,ni是第i个群体的样本数目,s是群体数目。FST的取值范围为[0,1],数值越大表明等位基因在各自亚群中越固定(频率越高),群体间分化程度越大。
AFD统计量是一种最直观体现群体分化程度的统计量,其计算公式为:
其中n代表在多态位点处观察到的不同等位基因的总数,fi代表等位基因i在一个群体中的基因频率。本实验中1代表贮精能力高的亚群,2代表贮精能力低的亚群。AFD统计量的正负具有指向性,正值表明等位基因i在高组亚群受到选择,负值表明等位基因i在低组亚群受到选择.
(2)在上述步骤的基础上计算实施例1所述的3个梯度对中每个SNP位点的FST值,首先筛选得到具有梯度差异的FST统计量,然后按最高差异梯度对的FST值进行秩排序,前1%的值对应的位点定义为显著位点。基于FST方法共检测到1782个符合上述条件的SNP分子标记位点(如图1所示),其占全部使用分子标记的0.1%。同时计算3个梯度对中每个SNP位点的AFD值,我们选择计算参考等位基因(ref)的频率,在3组极端表型差异梯度对中分别计算AFD统计量,在本研究中,AFD正值代表ref等位基因在贮精能力高的群体中受到选择,AFD负值代表突变等位基因在贮精能力高的群体中受到选择。首先筛选得到具有梯度差异正负统计量进行秩排序,统计量分别按最高差异梯度对的正值前0.5%和负值后0.5%的统计量对应的位点定义为显著位点。基于AFD方法共检测到2663个符合上述条件的SNP分子标记位点(如图1所示),占所有使用分子标记的0.15%。采用FST统计量方法和AFD统计量方法同时检测到的有梯度变化统计量的前1%的统计量对应的SNP位点定义为“京红1号”蛋鸡贮精能力关联位点。本发明共检测到了1070个关联位点,注释到170个基因,如表2所示。
表2“京红1号”蛋鸡种母鸡贮精能力性状关联位点及注释基因
实施例4贮精能力性状与SNP位点之间的GWAS分析
(1)对实施例2得到的100个重测序数据进行全基因组关联分析(GWAS),其作为辅助方法寻找与目标性状相关联的位点。
GWAS是在全基因组层面上通过对大规模的群体DNA样本进行全基因组高密度遗传标记(如SNP或CNV等)分型,从而寻找与目标性状相关的遗传因素的研究方法。使用GEMMA软件进行GWAS分析,常用混合线性模型,该模型如下:
y=wα+xβ+Zu+ε
u~MVNm(0,λτ-1K)
ε~MVNn(0,τ-1In)
其中n是个体数量,m是家系或群体的数量,y是n×1个数量性状向量,W=(w1,w2...wc)是n×c矩阵包括1的列向量的协变量(固定效应),α是包括截距在内的相应系数的c×1向量,x是标记基因型的n×1向量,β是标记的效应大小,Z是n×m荷载矩阵,u是随机效应的m×1向量,ε是误差的n×1向量,τ-1是残余误差的方差,λ是两个方差组分之间的比率,K是已知的m×m相关性矩阵,In是n×n单位矩阵,MVN表示多元正态分布。
(2)在上述步骤的基础上对100个个体的SNP重测序数据进行GWAS分析,在数据分析过程中,采用GEMMA软件进行无协变量的混合线性模型分析,应用simpleM方法确定全基因组显著临界值,当p<0.05/Meff时(Meff是指simpleM方法计算出的一个数据集中SNP的有效数量),就认为SNP达到了全基因组显著水平。本研究中全基因组显著水平阈值为0.05/135206=3.7E-07,共有一个SNP位点呈显著水平(如图3所示),本发明选择峰值两侧包括峰值,即P值最小的10个SNP位点作为候选位点,其位置和P值如表3所示:
表3基于GWAS鉴定的“京红1号”种母鸡贮精能力性状候选位点
(3)确定所有的候选SNP位点后,其中同时被FST与AFD及GWAS检测到的SNP位点,被认定为极其可靠的目标性状关联位点。共筛选到5个目标性状显著关联位点(如表4所示),通过注释发现在“京红1号”蛋鸡种母鸡中具备选择潜力的基因组功能区域有5个,并根据变异文件中每个个体的基因型信息对这五个位点进行基因分型(如表5所示)。同时使用plink软件计算各种梯度表型差异群体中连锁不平衡衰减程度(如图2所示),所有子种群中的LD曲线以相似的速率衰减,表明对群体的梯度划分不会影响对性状关联位点的识别。
表4“京红1号”种母鸡贮精能力性状显著关联位点梯度统计量结果
表5“京红1号”种母鸡贮精能力性状显著关联位点基因分型结果
实施例5基因型效应估计
通过将基因型和表型数据联系起来的方法,评估每个SNP性状关联位点的基因型效应(如表6所示),结果显示,1号染色体的两个突变碱基的出现会使个体的表型值升高,表明突变碱基在这两个位点出现对种母鸡贮精能力是有益的影响(呈正相关),而27号染色体的三个突变碱基的出现会使个体的表型值降低,表明突变碱基在这三个位点的出现会对贮精能力是负面的影响(呈负相关)。因为27号染色体的4889482位点是与种母鸡贮精能力相关性最显著的位点,该位点注释到的基因MRC2在文献中被报道与子宫内膜异位症的调节有关(Wei,C.,et al.,1-Methyl-tryptophan attenuates regulatory T cellsdifferentiation due to the inhibition of estrogen-IDO1-MRC2 axis inendometriosis.Cell Death Dis,2016.7(12):p.e2489.),表明该结果作为候选位点具有可信度。我们通过haploview软件绘制了它与27号染色体的另外两个位点之间的连锁不平衡关系(如图4所示),结果表明27号染色体上的这三个位点是强连锁关系,因此在选育种母鸡贮精能力高的个体的时候,应尽可能选择27号染色体4889482bp位点是GG、4898241bp位点是TT、4898269bp位点是CC的基因型,这为加快优质蛋鸡的育种进程提供帮助。
表6“京红1号”种母鸡最长受精天数的关联位点基因型效应估计
上述研究仅以“京红1号”蛋鸡种母鸡的贮精能力性状为实施例,并不用以限制本发明,对于二倍体生物的数量性状均适用,实施的方法均可按照实施例进行。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种筛选种母鸡贮精能力性状候选位点的方法,其特征在于,所述方法包括:
步骤1、饲养同一品种且日龄相同的产蛋种母鸡,从初产期开始每月统计每只种母鸡的最长受精天数表型数据,获得不少于250羽产蛋种母鸡的有效表型数据,并于统计的最后一天提取所述产蛋种母鸡的全部血样;
步骤2、对步骤1统计的最长受精天数表型数据进行分析,根据表型数据差异划分3对梯度亚群,包括最高差异梯度对、中等差异梯度对、普通差异梯度对群体,具体为:按最长受精天数进行秩排序,选取前50个样本与后50个样本组成普通差异梯度对,在此基础上取最长受精天数值最大的35个样本与最长受精天数值最小的35个样本组成中等差异梯度对,再在中等差异梯度对的基础上取最长受精天数值最大的20个样本与最长受精天数值最小的20个样本组成最高差异梯度对;
步骤3、提取步骤2所述的普通差异梯度对的100个产蛋种母鸡的血液样品DNA并进行重测序,去除缺失率大于20%的位点及最小等位基因频率小于0.05的位点,获得SNP位点数据,并基于所述SNP位点数据分别计算步骤2中三个梯度对的FST统计量和AFD统计量;
步骤4、对步骤3计算的FST统计量和AFD统计量中每个位点呈梯度变化的统计量进行秩排序,其中FST统计量和AFD统计量中前1%统计量对应的重叠SNP位点定义为目标性状关联位点;
步骤5、对步骤3获得的100个样品的重测序数据进行全基因组关联分析,取P值最小的10个位点作为候选位点;
步骤6、对步骤4获得的目标性状关联位点和步骤5获得的候选位点进行注释,取所述目标性状关联位点和所述候选位点的的重叠位点作为种母鸡贮精能力性状候选位点,所述贮精能力性状候选位点注释到的基因为贮精能力性状候选基因。
2.根据权利要求1所述的方法,其特征在于,步骤1中收集至少5个月的表型数据,并去除饲养过程中死亡或者表型缺失的产蛋种母鸡。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:将筛选得到的贮精能力性状的候选位点的基因型与表型数据进行关联分析,进行基因型效应估计。
4.如权利要求1-3任一项所述的方法在筛选种母鸡贮精能力性状候选位点和/或种母鸡贮精能力性状候选基因中的应用。
5.采用权利要求1-3任一项所述的方法筛选得到的种母鸡贮精能力性状候选位点,其特征在于,包括:
SNP1位点:1号染色体的第65489499位点存在一个G>A碱基突变;
SNP2位点:1号染色体的第87998885位点存在一个A>G碱基突变;
SNP3位点:27号染色体的第4889482位点存在一个G>A碱基突变;
SNP4位点:27号染色体的第4898241位点存在一个T>A碱基突变;
SNP5位点:27号染色体的第4898269位点存在一个C>T碱基突变。
6.根据权利要求5所述的种母鸡贮精能力性状候选位点,其特征在于,其注释的贮精能力性状候选基因包括:ENSGALG00000052327基因、ENSGALG00000052718基因、ENSGALG00000052321基因、MRC2基因和TANC2基因。
7.根据权利要求5所述的种母鸡贮精能力性状候选位点,其特征在于,所述SNP1位点和SNP2位点的碱基突变与种母鸡贮精能力性状呈正相关。
8.根据权利要求5所述的种母鸡贮精能力性状候选位点,其特征在于,所述SNP3位点、SNP4位点和SNP5位点的碱基突变与种母鸡贮精能力性状呈负相关。
9.如权利要求5所述的种母鸡贮精能力性状候选位点在种母鸡贮精能力性状辅助选择中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011564361.0A CN112735515B (zh) | 2020-12-25 | 2020-12-25 | 一种筛选种母鸡贮精能力性状候选位点的方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011564361.0A CN112735515B (zh) | 2020-12-25 | 2020-12-25 | 一种筛选种母鸡贮精能力性状候选位点的方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112735515A true CN112735515A (zh) | 2021-04-30 |
CN112735515B CN112735515B (zh) | 2024-02-02 |
Family
ID=75617038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011564361.0A Active CN112735515B (zh) | 2020-12-25 | 2020-12-25 | 一种筛选种母鸡贮精能力性状候选位点的方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112735515B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935910A (zh) * | 2024-01-26 | 2024-04-26 | 华中农业大学 | 玉米snp位点的筛选方法、装置、电子设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109680078A (zh) * | 2019-02-22 | 2019-04-26 | 华中农业大学 | 利用snp位点选择信号梯度变化指数评估经济性状候选基因的方法 |
CN110551824A (zh) * | 2018-05-31 | 2019-12-10 | 华中农业大学 | 与母鸡储精能力相关的snp分子标记及其应用 |
CN110551823A (zh) * | 2018-05-31 | 2019-12-10 | 华中农业大学 | 与母鸡储精能力相关的snp分子标记及其应用 |
-
2020
- 2020-12-25 CN CN202011564361.0A patent/CN112735515B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110551824A (zh) * | 2018-05-31 | 2019-12-10 | 华中农业大学 | 与母鸡储精能力相关的snp分子标记及其应用 |
CN110551823A (zh) * | 2018-05-31 | 2019-12-10 | 华中农业大学 | 与母鸡储精能力相关的snp分子标记及其应用 |
CN109680078A (zh) * | 2019-02-22 | 2019-04-26 | 华中农业大学 | 利用snp位点选择信号梯度变化指数评估经济性状候选基因的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935910A (zh) * | 2024-01-26 | 2024-04-26 | 华中农业大学 | 玉米snp位点的筛选方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112735515B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qanbari | On the extent of linkage disequilibrium in the genome of farm animals | |
CN110191965B (zh) | 猪全基因组50k snp芯片及应用 | |
Druet et al. | Fine mapping of quantitative trait loci affecting female fertility in dairy cattle on BTA03 using a dense single-nucleotide polymorphism map | |
US20160153056A1 (en) | Rice whole genome breeding chip and application thereof | |
CN104561367B (zh) | 一种影响猪脂肪沉积性状的snp及其应用 | |
CN117385049B (zh) | 一种与山羊生长性状相关的SNP分子标记rs655589732的应用 | |
WO2023201950A1 (zh) | 一种用于北京黑猪基因分型的snp分子标记组合、芯片及其制备方法与应用 | |
CN109207606A (zh) | 用于亲权鉴定的ssr位点的筛选方法和应用 | |
CN114941033A (zh) | 一种基于snp位点辅助培育地方优质白羽鸡高产蛋品系的方法 | |
CN116334248A (zh) | 一种地方鸡遗传资源保护与品种鉴定的液相芯片及其应用 | |
CN118480613A (zh) | 一种猪全基因组低密度5k snp芯片及应用 | |
CN117385046B (zh) | 一种与山羊生长性状相关的SNP分子标记rs669481944的应用 | |
CN117385047B (zh) | 一种与山羊生长性状相关的SNP分子标记rs642525408的应用 | |
CN112735515A (zh) | 一种筛选种母鸡贮精能力性状候选位点的方法和应用 | |
CN109295239B (zh) | 边鸡分子标记的筛选方法及其应用 | |
CN117385048A (zh) | 一种与山羊生长性状相关的SNP分子标记rs645505906的应用 | |
CN114317772A (zh) | 一种用于鉴定鸡高产性能的分子标记及其应用 | |
CN113699247A (zh) | 一种猪1号染色体上与猪剩余采食量相关的snp分子标记及其用途 | |
CN114250307A (zh) | 一种评价猪达100kg体重日龄的分子标记及其应用 | |
CN118441073B (zh) | 与绒山羊胸宽相关的单倍型分子标记及其应用 | |
CN117925820B (zh) | 一种用于胚胎植入前变异检测的方法 | |
CN113005215B (zh) | 一种与杨树木材产量相关的单体型分子标记及其应用 | |
CN117230207B (zh) | 一种山羊8号染色体上与繁殖性状相关的snp分子标记及应用 | |
CN118460736A (zh) | 仿刺参多刺性状snp分子标记组合及其应用 | |
CN117625797A (zh) | 鲤鱼耐低氧性状相关的snp分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |