CN117431324A - 一种奶牛全基因组中高密度snp芯片及其应用 - Google Patents
一种奶牛全基因组中高密度snp芯片及其应用 Download PDFInfo
- Publication number
- CN117431324A CN117431324A CN202311218327.1A CN202311218327A CN117431324A CN 117431324 A CN117431324 A CN 117431324A CN 202311218327 A CN202311218327 A CN 202311218327A CN 117431324 A CN117431324 A CN 117431324A
- Authority
- CN
- China
- Prior art keywords
- snp
- chip
- cows
- genome
- cow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000013365 dairy product Nutrition 0.000 title claims abstract description 27
- 241000283690 Bos taurus Species 0.000 claims abstract description 113
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 230000009395 genetic defect Effects 0.000 claims abstract description 12
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 7
- 238000009394 selective breeding Methods 0.000 claims abstract description 3
- 230000002068 genetic effect Effects 0.000 claims description 20
- 238000009395 breeding Methods 0.000 claims description 19
- 230000001488 breeding effect Effects 0.000 claims description 19
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 239000000523 sample Substances 0.000 claims description 13
- 238000003205 genotyping method Methods 0.000 claims description 10
- 230000036541 health Effects 0.000 claims description 5
- 239000007791 liquid phase Substances 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 2
- 238000009396 hybridization Methods 0.000 claims description 2
- 239000003147 molecular marker Substances 0.000 claims description 2
- 235000020247 cow milk Nutrition 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 27
- 238000012098 association analyses Methods 0.000 abstract description 12
- 238000012360 testing method Methods 0.000 abstract description 11
- 238000011160 research Methods 0.000 abstract description 7
- 238000009826 distribution Methods 0.000 abstract description 6
- 238000005065 mining Methods 0.000 abstract description 6
- 235000013336 milk Nutrition 0.000 description 30
- 239000008267 milk Substances 0.000 description 30
- 210000004080 milk Anatomy 0.000 description 30
- 235000021243 milk fat Nutrition 0.000 description 15
- 238000000034 method Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 102000014171 Milk Proteins Human genes 0.000 description 12
- 108010011756 Milk Proteins Proteins 0.000 description 12
- 235000021239 milk protein Nutrition 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 102000054766 genetic haplotypes Human genes 0.000 description 6
- 230000006651 lactation Effects 0.000 description 6
- 210000002966 serum Anatomy 0.000 description 6
- 230000000996 additive effect Effects 0.000 description 5
- 244000309464 bull Species 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 208000026681 Paratuberculosis Diseases 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 210000000481 breast Anatomy 0.000 description 4
- 210000003022 colostrum Anatomy 0.000 description 4
- 235000021277 colostrum Nutrition 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 244000144972 livestock Species 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000002445 nipple Anatomy 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 235000018102 proteins Nutrition 0.000 description 3
- YWWVWXASSLXJHU-AATRIKPKSA-N (9E)-tetradecenoic acid Chemical compound CCCC\C=C\CCCCCCCC(O)=O YWWVWXASSLXJHU-AATRIKPKSA-N 0.000 description 2
- 102100027211 Albumin Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 210000000003 hoof Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000011325 microbead Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102100021834 3-hydroxyacyl-CoA dehydrogenase Human genes 0.000 description 1
- 102100029103 3-ketoacyl-CoA thiolase Human genes 0.000 description 1
- 102100023247 60S ribosomal protein L23a Human genes 0.000 description 1
- YWWVWXASSLXJHU-UHFFFAOYSA-N 9E-tetradecenoic acid Natural products CCCCC=CCCCCCCCC(O)=O YWWVWXASSLXJHU-UHFFFAOYSA-N 0.000 description 1
- 102100031786 Adiponectin Human genes 0.000 description 1
- 102100030942 Apolipoprotein A-II Human genes 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 102100037322 Apolipoprotein C-IV Human genes 0.000 description 1
- 206010058298 Argininosuccinate synthetase deficiency Diseases 0.000 description 1
- 201000011297 Citrullinemia Diseases 0.000 description 1
- 102100036444 Clathrin interactor 1 Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108010081668 Cytochrome P-450 CYP3A Proteins 0.000 description 1
- 102100029368 Cytochrome P450 2C18 Human genes 0.000 description 1
- 102100039208 Cytochrome P450 3A5 Human genes 0.000 description 1
- 102100038637 Cytochrome P450 7A1 Human genes 0.000 description 1
- 102100029145 DNA damage-inducible transcript 3 protein Human genes 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102100036869 Diacylglycerol O-acyltransferase 1 Human genes 0.000 description 1
- 101100365539 Drosophila melanogaster Sesn gene Proteins 0.000 description 1
- 238000008157 ELISA kit Methods 0.000 description 1
- 102100030695 Electron transfer flavoprotein subunit alpha, mitochondrial Human genes 0.000 description 1
- 102100030808 Elongation factor 1-delta Human genes 0.000 description 1
- 102100030892 Fructose-1,6-bisphosphatase isozyme 2 Human genes 0.000 description 1
- 102100034013 Gamma-glutamyl phosphate reductase Human genes 0.000 description 1
- 102100039611 Glutamine synthetase Human genes 0.000 description 1
- 102100020948 Growth hormone receptor Human genes 0.000 description 1
- -1 HSD B2 Proteins 0.000 description 1
- 101000896020 Homo sapiens 3-hydroxyacyl-CoA dehydrogenase Proteins 0.000 description 1
- 101000841262 Homo sapiens 3-ketoacyl-CoA thiolase Proteins 0.000 description 1
- 101001115494 Homo sapiens 60S ribosomal protein L23a Proteins 0.000 description 1
- 101000598552 Homo sapiens Acetyl-CoA acetyltransferase, mitochondrial Proteins 0.000 description 1
- 101000775469 Homo sapiens Adiponectin Proteins 0.000 description 1
- 101000793406 Homo sapiens Apolipoprotein A-II Proteins 0.000 description 1
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 1
- 101000806780 Homo sapiens Apolipoprotein C-IV Proteins 0.000 description 1
- 101000851951 Homo sapiens Clathrin interactor 1 Proteins 0.000 description 1
- 101000919360 Homo sapiens Cytochrome P450 2C18 Proteins 0.000 description 1
- 101000957672 Homo sapiens Cytochrome P450 7A1 Proteins 0.000 description 1
- 101000927974 Homo sapiens Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 1
- 101001010541 Homo sapiens Electron transfer flavoprotein subunit alpha, mitochondrial Proteins 0.000 description 1
- 101000920062 Homo sapiens Elongation factor 1-delta Proteins 0.000 description 1
- 101000930766 Homo sapiens Far upstream element-binding protein 2 Proteins 0.000 description 1
- 101001063910 Homo sapiens Fructose-1,6-bisphosphatase isozyme 2 Proteins 0.000 description 1
- 101001133924 Homo sapiens Gamma-glutamyl phosphate reductase Proteins 0.000 description 1
- 101000888841 Homo sapiens Glutamine synthetase Proteins 0.000 description 1
- 101001075287 Homo sapiens Growth hormone receptor Proteins 0.000 description 1
- 101001083553 Homo sapiens Hydroxyacyl-coenzyme A dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101001090713 Homo sapiens L-lactate dehydrogenase A chain Proteins 0.000 description 1
- 101001051207 Homo sapiens L-lactate dehydrogenase B chain Proteins 0.000 description 1
- 101000588448 Homo sapiens N-acetylglucosamine-6-phosphate deacetylase Proteins 0.000 description 1
- 101001109518 Homo sapiens N-acetylneuraminate lyase Proteins 0.000 description 1
- 101000978937 Homo sapiens Nuclear receptor subfamily 0 group B member 2 Proteins 0.000 description 1
- 101000833899 Homo sapiens Peroxisomal acyl-coenzyme A oxidase 2 Proteins 0.000 description 1
- 101000734572 Homo sapiens Phosphoenolpyruvate carboxykinase, cytosolic [GTP] Proteins 0.000 description 1
- 101000617296 Homo sapiens Protein SEC13 homolog Proteins 0.000 description 1
- 101001091536 Homo sapiens Pyruvate kinase PKLR Proteins 0.000 description 1
- 101000798007 Homo sapiens RAC-gamma serine/threonine-protein kinase Proteins 0.000 description 1
- 101000947881 Homo sapiens S-adenosylmethionine synthase isoform type-2 Proteins 0.000 description 1
- 101000915806 Homo sapiens Serine/threonine-protein phosphatase 2A 55 kDa regulatory subunit B beta isoform Proteins 0.000 description 1
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 description 1
- 101000661446 Homo sapiens Succinate-CoA ligase [ADP-forming] subunit beta, mitochondrial Proteins 0.000 description 1
- 101000994496 Homo sapiens cAMP-dependent protein kinase catalytic subunit alpha Proteins 0.000 description 1
- 102100030358 Hydroxyacyl-coenzyme A dehydrogenase, mitochondrial Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 102100034671 L-lactate dehydrogenase A chain Human genes 0.000 description 1
- 102100024580 L-lactate dehydrogenase B chain Human genes 0.000 description 1
- 239000005639 Lauric acid Substances 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- 102000013013 Member 2 Subfamily G ATP Binding Cassette Transporter Human genes 0.000 description 1
- 108010090306 Member 2 Subfamily G ATP Binding Cassette Transporter Proteins 0.000 description 1
- 102100031324 N-acetylglucosamine-6-phosphate deacetylase Human genes 0.000 description 1
- 102100022686 N-acetylneuraminate lyase Human genes 0.000 description 1
- 102100026873 N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Human genes 0.000 description 1
- 101710175474 N-fatty-acyl-amino acid synthase/hydrolase PM20D1 Proteins 0.000 description 1
- 108091008638 NR4A Proteins 0.000 description 1
- 108010032605 Nerve Growth Factor Receptors Proteins 0.000 description 1
- 102100023172 Nuclear receptor subfamily 0 group B member 2 Human genes 0.000 description 1
- 241001400033 Omia Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 102100026795 Peroxisomal acyl-coenzyme A oxidase 2 Human genes 0.000 description 1
- 102100034796 Phosphoenolpyruvate carboxykinase, cytosolic [GTP] Human genes 0.000 description 1
- 102100021725 Protein SEC13 homolog Human genes 0.000 description 1
- 102100024924 Protein kinase C alpha type Human genes 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 102100034909 Pyruvate kinase PKLR Human genes 0.000 description 1
- 102100032314 RAC-gamma serine/threonine-protein kinase Human genes 0.000 description 1
- 102100035947 S-adenosylmethionine synthase isoform type-2 Human genes 0.000 description 1
- 108091006738 SLC22A7 Proteins 0.000 description 1
- 102100029014 Serine/threonine-protein phosphatase 2A 55 kDa regulatory subunit B beta isoform Human genes 0.000 description 1
- 102100034492 Serine/threonine-protein phosphatase 4 catalytic subunit Human genes 0.000 description 1
- 101710139668 Serine/threonine-protein phosphatase 4 catalytic subunit Proteins 0.000 description 1
- 102100035270 Solute carrier family 22 member 7 Human genes 0.000 description 1
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 description 1
- 102100037811 Succinate-CoA ligase [ADP-forming] subunit beta, mitochondrial Human genes 0.000 description 1
- 108010057666 Transcription Factor CHOP Proteins 0.000 description 1
- 102100033725 Tumor necrosis factor receptor superfamily member 16 Human genes 0.000 description 1
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 1
- FOGRQMPFHUHIGU-UHFFFAOYSA-N Uridylic acid Natural products OC1C(OP(O)(O)=O)C(CO)OC1N1C(=O)NC(=O)C=C1 FOGRQMPFHUHIGU-UHFFFAOYSA-N 0.000 description 1
- BOPGDPNILDQYTO-NDOGXIPWSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3r,4r,5r)-5-(3-carbamoyl-4h-pyridin-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl hydrogen phosphate Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NDOGXIPWSA-N 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001746 atrial effect Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000550 effect on aging Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 231100000640 hair analysis Toxicity 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000001269 time-of-flight mass spectrometry Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/124—Animal traits, i.e. production traits, including athletic performance or the like
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P60/00—Technologies relating to agriculture, livestock or agroalimentary industries
- Y02P60/80—Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
- Y02P60/87—Re-use of by-products of food processing for fodder production
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种中高密度奶牛全基因组126K SNP芯片,其包含检测120,155个SNP位点的试剂,所述SNP位点来自:第一类,发明人团队前期研究挖掘与鉴定的奶牛重要经济性状显著相关的SNP位点,包含5,363个SNP位点;第二类,奶牛主要遗传缺陷基因位点和亲子鉴定基因位点,包含223个SNP个位点;第三类,基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有商业化奶牛基因组芯片挑选的SNP位点,包含114,569个SNP位点。本发明的芯片,可用于进行中国荷斯坦牛的全基因组关联分析、全基因组选择育种、亲子鉴定和常见牛遗传缺陷鉴定等方面。
Description
技术领域
本发明涉及分子生物学和生物芯片领域,具体地,本申请提供了一种中高密度奶牛全基因组126K SNP芯片及其应用。
背景技术
SNP(单核苷酸多态性)分析是目前挖掘与鉴定重要复杂性状关键基因以及基因组选择(Genome selection,GS)的重要分析手段。基于芯片的SNP基因分型技术可以实现同时对大量SNP位点进行检测,具有快速、高通量的优势,显著提高了检测效率。作为基因组选择的信息载体,目前奶牛通用商业化芯片品类繁多,且大多是基于微珠阵列的固相芯片。自2009年,美国illumina公司陆续开发出2款牛基因组芯片,Bovine SNP 50K芯片(含54,000SNPs)和Bovine HD(含777,962SNPs);自2014年,美国纽勤公司陆续开发了GeneSeek80K、GeneSeek 150K、GeneSeek 100K、GeneSeek 9K牛基因组SNP芯片。目前,我国的奶牛育种工作所用芯片全部依赖进口。这些芯片广泛应用于国内外奶牛基因组评估及基因挖掘,但存在以下几点不足:(1)芯片研发基于欧美国家荷斯坦奶牛群体(荷斯坦奶牛在世界大多数国家的奶业生产中都占有主导地位),我国荷斯坦奶牛群体重要性状相关的SNP效应位点未纳入芯片(中国荷斯坦牛占我国奶牛存栏的90%)。因此,针对我国荷斯坦奶牛群体遗传背景的基因组评估和基因挖掘效率较低;(2)芯片检测技术受限于人,奶牛生物样本需送至国外检测基因信息,导致我国奶牛个体遗传资源信息安全无法得到保障;(3)现国际奶牛通用芯片为固相芯片,该技术基于微珠阵列检测量化荧光标记来检测基因型,其探针分子固定在支持物上形成规则排列的点阵,位点更新升级周期长和成本高。
设计和开发一款针对我国荷斯坦奶牛群体的中高密度SNP育种芯片用于全基因组选择很有必要的,不仅可以实现奶牛育种关键技术摆脱进口依赖,提高我国优秀种牛自主培育能力,加快种牛育种效率;同时可保障我国奶牛遗传资源基因信息安全;还可以降低检测成本,方便增加新的重要性状相关SNP位点以维持芯片持续迭代升级。综合考虑以上因素,发明人提出一款基于目标区域基因组序列液相捕获和高深度测序分型技术的中高密度奶牛全基因组126K SNP芯片。
发明内容
本申请提供了一种中高密度奶牛全基因组126K SNP芯片,所述126K SNP芯片包含检测与奶牛产奶、体型和健康性状相关的SNP位点的试剂。
进一步地,所述的126K SNP芯片包含检测说明书表3所示的SNP位点的试剂。
进一步地,所述试剂为探针。
进一步地,所述126K SNP芯片为液相探针杂交芯片。
进一步地,所述126K SNP芯片包含序列如SEQ ID NO.1-12所示的探针。
另一方面,本申请提供了上述126K SNP芯片在奶牛育种中的应用。
进一步地,所述育种为分子标记辅助育种,具体指基因组选择育种。
另一方面,本申请提供了上述126K SNP芯片在奶牛基因分型检测中的应用。
另一方面,本申请提供了上述126K SNP芯片在奶牛中的亲缘关系鉴定中的应用。
另一方面,本申请提供了上述126K SNP芯片在奶牛中的遗传缺陷病诊断中的应用。
进一步地,所述奶牛为荷斯坦奶牛。
所述SNP分子标记主要来自于3类SNP位点:第一类,发明人团队前期研究挖掘与鉴定的奶牛重要经济性状显著相关的SNP位点,包含5,363个SNP位点;第二类,奶牛主要遗传缺陷基因位点和亲子鉴定基因位点,包含223个SNP位点;第三类,基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有商业化奶牛基因组芯片挑选的SNP位点,包含114,569个SNP位点。以上3类共计包含120,155个SNP位点。
由于篇幅原因,本申请中仅列举了部分探针序列。在已知SNP位点的情况下,本领域技术人员可以根据芯片种类,检测方法等需求常规设计相应的检测探针,并对其准确性进行验证。
本申请的奶牛126K SNP芯片具有三个优点:(1)添加了针对我国荷斯坦奶牛群体遗传背景的重要性状相关功能基因遗传变异位点,发明人团队前期通过多组学研究挖掘和鉴定了大量产奶、体型和健康性状显著相关的功能基因SNP效应位点,使得该款芯片更适用于我国荷斯坦奶牛的基因组选择和遗传分析;(2)SNP位点在我国奶牛群体中多态性高,而且在全基因组范围内分布均匀,保证了基因组选择的准确性;(3)相比国际通用奶牛50K、80K、100K、150K芯片,其检测成本有一定幅度降低,更适合大规模基因组参考群扩建和种牛育种价值评价。为提高优秀种牛选育效率,考虑到分型成本和基因组选择准确性,本专利设计了126K SNP(120,155SNPs)芯片。这对我国摆脱奶牛生物育种芯片进口依赖,快速扩大基因组参考群规模以及培育优秀种公牛、种母牛以加快群体遗传改良具有重要意义。
附图说明
图1为本发明芯片和设计和制备流程图。
图2为本发明SNP位点在全基因组水平分布。
图3为本发明SNP芯片的实物图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实例仅为了阐述本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术邻域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
芯片设计过程如图1所示。
实施例1第一类SNP位点的获得
研究表明,在SNP芯片中添加与目标性状显著相关的SNP位点,能够提高基因组选择的准确性,因此,在芯片添加我国荷斯坦奶牛群体遗传背景的位点是必要的。发明人团队前期全基因组关联分析、重测序、转录组和代谢组等多组学技术挖掘和鉴定到与我国荷斯坦奶牛重要性状(包含产奶、体型和健康性状)显著相关的5,363个SNP位点。
第一类位点位于表3的第1-5,363个SNP位点。其中,各性状相关SNP位点获得的详细过程如下:
1、产奶性状
产奶性状是奶牛最重要的经济性状,包括产奶量、乳脂量、乳蛋白量、乳脂率、乳蛋白率和乳脂肪酸含量。
(1)候选基因遗传效应分析
目前研究发现的影响奶牛产奶性状的主效基因有DGAT1、GHR、ABCG2和EEF1D。同时,发明人团队前期基于iTRAQ技术对中国荷斯坦牛不同泌乳阶段(干奶期、泌乳初期和泌乳高峰期)肝脏组织进行转录组和蛋白质组分析,一共鉴定到3252个蛋白质(FDR≤0.01),其中差异表达蛋白一共鉴定到905个(P30.05,FCE1.2),在三个比较组中(干奶期vs.乳初期、干奶期vs.乳高峰期、泌乳初期vs.乳高峰期)分别为523个、337个和458个。随后通过功能富集分析,经过与奶牛产奶性状OTL和前人GWAS结果中与产奶性状显著相关的SNPs进行物理位置比对,发现在73个差异表达蛋白中有41个关键功能基因与产奶性状OTL峰值和GWAS结果中与产奶性状显著关联的SNPs位置临近,包括AKT3、PKLR、SEC13、ACAT1、ACOX2、ADIPOQ、ALDH18A1、AMDHD2、APOA2、APOB、APOC4、CLINT1、CYP2C18、CYP3A5、CYP7A1、DH1、EHHADH、ETFA、FBP2、GLUL、HADH、HADHB、HSD17B2、IDH2、LDHA、MAT2A、NPL、PCK1、PM20D1、PP4C、PRKACA、SUCLA2、APOP4、APOP5、GYS2、LDHB、NGFR、NR0B2、PC、PPP2R2B和SLC22A7。
进一步基于北京首农畜牧22个牛场、45个公牛家系的共计947头中国荷斯坦母牛为试验群体进行遗传效应分析。通过冻精DNA混池测序,共鉴定到135个SNP位点,利用靶向测序基因型分型技术(Genotyping By Target Sequencing,GBTS)进行个体基因分型检测。利用SAS软件MIXED过程及动物模型(模型如下)对SNP位点与5个产奶性状(产奶量、乳脂量、乳脂率、乳蛋白量和乳蛋白率)进行单标记和单倍型关联分析。
y=μ+hys+b×M+G+a+e
其中y为产奶性状表型值(个体305天产奶量、乳脂量、乳蛋白量、乳脂率和乳蛋白率)、μ为总体均值、hys为产年季效用、b为协变量M的回归系数、M为产犊月龄效应、G为基因型/单倍型组合效应、a为个体随机加性遗传效应及e为随机残差效应。
根据单标记和单倍型关联分析结果发现,上述135个SNP位点均与一个或多个产奶性状显著关联(P<0.05、P<0.01),等位基因替代效应或加性遗传效应(P<0.05、P<0.01)。
发明人团队前期通过极端高低乳脂率/乳蛋白率的泌乳期奶牛乳腺上皮组织进行转录组研究鉴定到了DDIT3、RPL23A、SESN2和NR4A14个产奶性状候选基因。基于北京首农畜牧的中国荷斯坦母牛群体,选择1093头系谱完整、DHI记录规范的母牛为试验群体,首先利用40头荷斯坦公牛(1093头母牛的父亲)的基因组DNA,采用基因组DNA混池测序方法对上述4个候选基因的全部编码区及上、下游调控区各3000bp进行分段PCR扩增和测序。根据混池DNA测序结果,共发现35个SNP位点。进一步通过飞行时间质谱技术进行个体基因型检测,单标记关联分析结果显示:35个SNP位点均至少与一个产奶性状关联显著(P≤0.0001~0.0493),等位基因替代效应或加性遗传效应(P<0.05、P<0.01)。
(2)全基因组关联分析
研究采用女儿设计,试验群体是来自北京首农畜牧14头公牛家系的2,093头母牛。采用个体的估计育种值(EBV)作为分析的表型值。利用Bovine SNP50K芯片分型,基因型数据经过严格的质量控制后,利用两种统计分析方法,即单标记传递不平衡检验(L1-TDT)和单标记回归分析(MMRA)方法分别对产奶量、乳脂量、乳蛋白量、乳脂率、乳蛋白率五个产奶性状进行关联分析。分析共发现105个SNP位点达到了基因组显著水平(P<1.27E-06),其中有38个SNP位点同时被两种方法检测到,其他4个和63个SNP位点分别单独被L1-TDT方法和MMRA方法检测到。L1-TDT和MMRA方法共定位到20个、9个、21个、65个和28个显著的SNP位点影响产奶量、乳脂量、乳蛋白量、乳脂率和乳蛋白率性状。
以北京首农畜牧18个牛场的21头公牛家系的784头中国荷斯坦母牛为研究群体,以BovineSNP50芯片分型获得基因型数据,利用气相色谱法检测牛奶样品中的乳脂肪酸含量,获得了月桂酸、豆蔻油酸、棕榈酸、亚油酸等22个乳脂肪酸含量性状的表型。首先利用SAS9.1广义线性模型过程进行固定效应分析,对乳脂肪酸表型值进行校正;然后,采用PLINK软件(v1.07)中的数量性状加性效应模型进行全基因组关联分析,在全基因组水平上共鉴定83个SNP位点与22个乳脂肪酸含量性状显著相关(P<1.23E-06)。
(3)基因组重测序
利用Illumina二代测序平台对8头具有极端高/低乳蛋白率、乳脂率育种值(EBV)的荷斯坦公牛(来自4个全同胞/半同胞:高/低组〉进行了全基因组重测序(10×)。通过与牛参考基因组(UMD3.1)比对,共检测到10,961,243个SNP位点,其中4个高、低组间等位基因方向一致的共有SNP位点57,451个(基于后续所述均匀分布,有4,840个SNP位点被纳入芯片)。
2、体型性状
利用Bovine SNP50牛全基因SNP芯片对来自北京首农畜牧的1,314头中国荷斯坦牛进行个体基因型检测;采用LASSO模型(模型具体如下)对29个体型性状(包括大小、体高、前段、胸宽、体深、腰强度、尻宽、尻角度、骨质地、蹄角度、后肢侧视、乳房深度、乳房质地、中央悬韧带、前房附着、前乳头位置、乳头长度、后附着高度、后附着宽度、后乳头位置以及棱角性,以及8个功能评分性状包括总分、容量、乳用特征、尻部、肢蹄、前乳房、后乳房和泌乳系统)进行了全基因组关联分析。
首先,利用单性状混合模型分析(SMMA)估计每个SNP的效应值。然后选取500个P值最低的SNP进行LASSO分析。SMMA模型为y=1μ+xjβj+Zg+e,其中,y为各体型性状表型值,1是单位向量,μ是群体均值,xj是第j个标记的基因型,βj是SNP效应,g是微效多基因效应,Z是g的相关矩阵,e是随机残差。g~N(0,Aσg 2),e~N(0,Iσe 2),其中A是基于系谱的加性遗传相关矩阵,σg 2是残差方差。
其次,利用改进的LASSO对SMMA模型检测到的SNP进行效应值估计,其模型为y=1μ+Xβ+Zg+e,X是500个SNP基因型协变量矩阵,β是SNP效应向量。
全基因组关联分析在基因组水平上检测到59个显著SNP位点与26个体型性状显著关联(P<0.01)。
3、健康性状
(1)免疫球蛋白
以北京首农畜牧的588头中国荷斯坦牛群体为研究对象,产犊后24小时内采集初乳、血清以及牛毛样品。利用ELISA试剂盒检测初乳和血清中免疫球蛋白及白蛋白浓度,并用GeneSeek 150K芯片进行基因型分型。基于GCTA软件,初乳和血清IgG、IgA IgM和白蛋白浓度遗传力估计值为0.08~0.48,除血清IgG1、IgG2浓度外,大部分免疫球蛋白浓度为中高遗传力(0.12~0.48)。利用GCTA软件基于混合线性模型进行全基因组关联分析,结果在全基因组水平上检测到36个SNP位点与初乳和血清IgG、IgG2和IgM浓度显著关联(P<3.08E-6)。
(2)副结核病易感性/抗性
选取北京首农畜牧的945头奶牛为研究群体,采用Case-control策略对副结核病易感性/抗性进行全基因组关联分析。利用Bovine 50K芯片和GeneSeek 150K芯片进行个体基因分型,以血清副结核抗体OD值为表型(阳性185头,阴性760头),利用GRAMMAR-GC和ROADTRIPS软件对两个数据集(50K和150K两种芯片交集数据vs.将低密度填充到高密度后的数据集)分别进行全基因组关联分析,两种方法分别检测到14和18个全基因组水平显著的SNP位点与荷斯坦奶牛副结核病易感性/抗性显著关联(P<5×10-5)。
实施例2第二类SNP位点的获得
1、遗传缺陷
奶牛遗传缺陷主要包括脊柱畸形综合征CVM、白细胞黏附缺陷症BLAD、尿苷酸合酶缺乏症和瓜氨酸血症等,会导致母牛早期流产、犊牛死亡,存活率降低,对奶牛养殖业造成了巨大的经济损失。通过在SNP芯片中添加遗传缺陷基因位点,可实现简便、快速和准确鉴定与筛查奶牛个体是否携带遗传缺陷隐性有害基因,从而通过早期淘汰或科学的选种选配降低群体的有害基因频率,提高我国奶牛群体的质量。因此,在本芯片中添加了19种常见牛遗传缺陷致因突变位点,共25个SNP位点,位点信息来自OMIA数据库收录的主要牛遗传缺陷位点。
表1常见牛遗传缺陷致因突变位点
2、亲子鉴定
在奶牛育种工作中,正确的系谱记录是准确估计个体育种值、加快群体遗传进展的重要基础。系谱错误是奶牛养殖场中的常见现象,通过遗传标记进行亲子鉴定和系谱校正具有重要意义。国际动物遗传学学会(ISAG)研究并推荐了198个SNP位点用于牛亲子鉴定(以便各国实验室之间进行研究和交流),因此将其添加进本芯片。
第二类位点位于表3的第5,364-5,586个SNP位点。
实施例3第三类SNP位点的获得
大规模、高质量的参考群体是基因组选择的重要基础和必要环节,发明人团队自2008年至今,构建了我国唯一的奶牛基因组选择参考群体,目前规模已达2.3万头,参考群个体的基因型检测所使用的SNP芯片均来自国外,包含50K 5,811头、80K 1,535头、100K 5,000头、150K 10,591头。因此,本芯片需要与该参考群体的芯片数据之间具有较高的基因型填充准确性,从而对母牛群体进行准确的基因组评估。
基因组选择的前提假设是标记与QTL之间紧密连锁,因此标记在基因组分布均匀,能在最大限度捕获影响性状的QTL,从而提高基因组片段基因型推断及基因组评估的准确性。基因型填充方法是基于推断单倍型(指同一染色体上临近标记之间连锁遗传的等位基因组合)对缺失基因型进行填充。基本过程为:首先,利用具有高密度标记的个体以及家系信息和群体间的连锁不平衡信息构建单倍型;然后,然将待填充芯片中的标记与单倍型中的标记进行配比填充。
影响芯片基因型填充准确性的因素包括:最小等位基因频率、标记密度、参考群体规模和填充方法等因素。鉴于上述参考群体的基因型芯片数据包括50K、80K、100K和150KSNP三种类型芯片,因此,发明人基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有50K、80K、100K和150K商业化牛基因组芯片中挑选部分SNP位点。
1、质量控制
基于2.3万头中国荷斯坦牛的基因型数据,根据检出率、最小等位基因频率、哈代温伯格平衡检验,挑选出适合我国荷斯坦奶牛群体中的有效SNP位点。利用PLINK软件进行质量控制:(1)剔除SNP检出率小于0.95的SNP位点;(2)剔除最小等位基因频率小于0.01的SNP位点;(3)剔除不符合哈代温伯格平衡的SNP位点(P-value<1×10-6)。经过质量控制后,对四者的共有位点去重后获得154,363个SNP位点。
2、SNP位点分布
为确保SNP位点均匀覆盖奶牛全基因组,捕获全基因组范围内的重要性状遗传变异,实现准确的基因组评估。在染色体上设置24Kb滑动窗口在前述位点集合中进行筛选。最终确定114,569个第三类SNP位点。
第三类位点位于表3的第5,587-120,155个SNP位点。
表2芯片中所用的SNP位点列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
所述SNP位点的变异信息采用染色体编号_物理位置参考基因型>等位基因型的形式表示。实施例中所述的表2中SNP位点的编号为按照横行依次排列,即Chr1_1277227A>C为第1个,Chr1_3249057G>T为第2个,Chr1_8437530T>G为第3个,依次类推。
实施例4芯片的制备
上述三类SNP位点的集合如表1所示,其在染色体上的分布如图2所示。
为确保SNP位点在全基因组上的物理位置唯一,将上述三类SNP进行位点核对和评估。
首先,基于目前主要应用的2个牛参考基因组序列(UMD3.1.1和ARS-UCD1.2),利用blastn软件将111,991个SNP位点的侧翼序列分别进行比对,默认参数为-evalue 1e-5、-dust yes、identical>=98%,对于符合要求的SNP位点保留,最终共计111,991个SNP位点。
然后,基于SNP位点在奶牛参考基因组上的物理位置和侧翼序列,均成功进行了探针设计(部分实例如SEQ ID NO.1-13所示)。实物如图3所示。
表3部分探针序列列表
目标SNP | 染色体号 | 物理位置 | 突变点 | 探针序列 |
Chr1:41768691G>T | Chr1 | 41768691 | G>T | SEQ ID NO.1 |
Chr1:109550832G>A | Chr1 | 109550832 | G>A | SEQ ID NO.2 |
Chr1:127318739C>A | Chr1 | 127318739 | C>A | SEQ ID NO.3 |
Chr1:144659141A>C | Chr1 | 144659141 | A>C | SEQ ID NO.4 |
Chr1:144762379T>G | Chr1 | 144762379 | T>G | SEQ ID NO.5 |
Chr1:144833882A>G | Chr1 | 144833882 | A>G | SEQ ID NO.6 |
Chr10:49904259G>A | Chr10 | 49904259 | G>A | SEQ ID NO.7 |
Chr10:53840143T>A | Chr10 | 53840143 | T>A | SEQ ID NO.8 |
Chr10:6988001T>C | Chr10 | 6988001 | T>C | SEQ ID NO.9 |
Chr11:103963998C>T | Chr11 | 103963998 | C>T | SEQ ID NO.10 |
Chr11:14189221A>G | Chr11 | 14189221 | A>G | SEQ ID NO.11 |
Chr11:4671286C>T | Chr11 | 4671286 | C>T | SEQ ID NO.12 |
Chr11:506778G>A | Chr11 | 506778 | G>A | SEQ ID NO.13 |
由于序列表格式的限制,SEQ ID NO.1-13仅表示未变化的原始序列,突变序列本领域技术人员可以从表2中记载的突变位点和突变方式获得。
实施例5本申请芯片的实用效果
为验证本芯片的实用效果,发明人设计了(1)实验一:从北京首农畜牧所属奶牛场选择近5000头健康的荷斯坦奶牛检测126K芯片进行SNP位点检出率、多态性检测;(2)实验二:从北京首农畜牧所属奶牛场选择33头荷斯坦奶牛同时检测126K和50K芯片,23头荷斯坦奶牛同时检测126K和GGP 85K芯片,93头荷斯坦奶牛同时检测126K和GGP 100K芯片,93头荷斯坦奶牛同时检测126K和GGP 150K芯片,进行个体基因型检出率及比较验证分析。
首先,利用PLINK软件对所有奶牛的芯片基因型数据进行质量分析:(1)实验一:5000头奶牛的126K芯片检测结果,SNP检出率为98.12%~99.86%,平均检出率为99.54%,位点多态信息含量平均为0.401;(2)实验二:126K与50K、85K、100K、150K芯片的基因分型一致性为98.46%、98.89%、99.25%和99.39%。结果说明,126K芯片与现有奶牛商业化芯片检测性能一致,且位点多态性表现更好,更符合我国奶牛遗传背景。
然后,针对实验二验证群体,基于实施例3所述的基因组选择参考群体(2.3万头),利用Beagle5.2软件,将126K、50K、85K、100K、150K基因型数据依次填充到50K、85K、100K、150K水平,计算不同类型芯片的填充准确性。结果表明,126K芯片填充准确性为98.53%,与现有奶牛芯片性能一致(96.11%~99.81%),满足基因组评估及基因挖掘工作的需要。
Claims (11)
1.一种低密度奶牛全基因组126K SNP芯片,其特征在于,所述126K SNP芯片包含检测与奶牛产奶、体型、繁殖和健康性状相关的SNP位点的试剂。
2.根据权利要求1所述的126K SNP芯片,其中所述的126K SNP芯片包含检测说明书表3所示的SNP位点的试剂。
3.根据权利要求2所述的126K SNP芯片,其中所述试剂为探针。
4.根据权利要求3所述的126K SNP芯片,其中所述126K SNP芯片为液相探针杂交芯片。
5.根据权利要求4所述的126K SNP芯片,其中所述126K SNP芯片包含序列如SEQ IDNO.1-13所示的探针。
6.根据权利要求1-5任一项所述的126K SNP芯片在奶牛育种中的应用。
7.根据权利要求6所述的应用,其中所述育种为分子标记辅助育种,具体指基因组选择育种。
8.根据权利要求1-5任一项所述的126K SNP芯片在奶牛基因分型检测中的应用。
9.根据权利要求1-5任一项所述的126K SNP芯片在奶牛中的亲缘关系鉴定中的应用。
10.根据权利要求1-5任一项所述的126K SNP芯片在奶牛中的遗传缺陷病诊断中的应用。
11.根据权利要求6-9任一项所述的应用,其中所述奶牛为荷斯坦奶牛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311218327.1A CN117431324A (zh) | 2023-09-20 | 2023-09-20 | 一种奶牛全基因组中高密度snp芯片及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311218327.1A CN117431324A (zh) | 2023-09-20 | 2023-09-20 | 一种奶牛全基因组中高密度snp芯片及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117431324A true CN117431324A (zh) | 2024-01-23 |
Family
ID=89552410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311218327.1A Pending CN117431324A (zh) | 2023-09-20 | 2023-09-20 | 一种奶牛全基因组中高密度snp芯片及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117431324A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746979A (zh) * | 2024-02-21 | 2024-03-22 | 中国科学院遗传与发育生物学研究所 | 一种动物品种的鉴定方法 |
-
2023
- 2023-09-20 CN CN202311218327.1A patent/CN117431324A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117746979A (zh) * | 2024-02-21 | 2024-03-22 | 中国科学院遗传与发育生物学研究所 | 一种动物品种的鉴定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111225986B (zh) | 一种鸡全基因组snp芯片及其应用 | |
CN110791574B (zh) | 与山羊产羔数、生长性状关联的分子标记及其应用 | |
CN110191965A (zh) | 猪全基因组50k snp芯片及应用 | |
CN115029451B (zh) | 一种绵羊液相芯片及其应用 | |
CN110484636B (zh) | 一种与猪总乳头数性状相关的分子标记及应用 | |
WO2019153294A1 (zh) | 牦牛全基因组snp位点的应用及检测用引物组和试剂盒 | |
CN112609009B (zh) | 基于全基因组测序筛选的与广西三黄鸡体重、体尺相关的snp分子标记组合及应用 | |
CN112746110B (zh) | 基于全基因组测序筛选的与广西麻鸡体尺相关的snp分子标记组合及应用 | |
CN106498078B (zh) | 一种检测绵羊kitlg基因的单核苷酸多态性的方法及其应用 | |
CN108998541B (zh) | 一种与苏淮猪腿臀围性状相关的snp标记引物对及其应用 | |
CN117431324A (zh) | 一种奶牛全基因组中高密度snp芯片及其应用 | |
CN110734983A (zh) | 一种与苏淮猪肌内脂肪性状相关的snp标记及检测方法和应用 | |
CN110438242B (zh) | 一种三疣梭子蟹微卫星标记的引物及其应用 | |
CN104862388B (zh) | 与猪有效乳头对数性状相关的snp分子标记及应用 | |
CN106755371A (zh) | 利用pcr‑rflp检测绵羊pcnp基因单核苷酸多态性的方法及其应用 | |
CN110484629B (zh) | 一种与三疣梭子蟹生长性状相关的微卫星标记、其引物及应用 | |
CN106701930B (zh) | 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用 | |
CN116083592A (zh) | 一种与绵羊生长性状相关的分子标记及其应用 | |
CN105368941B (zh) | 一种用于奶牛生产寿命辅助选择的分子标记检测方法 | |
CN113832240A (zh) | 一个与中国南方荷斯坦奶牛305天产奶量显著相关的snp分子标记及应用和选育方法 | |
CN116356041A (zh) | 低密度奶牛全基因组30k snp芯片及其应用 | |
CN106755370B (zh) | 利用pcr-rflp检测绵羊fth-1基因单核苷酸多态性的方法及其应用 | |
CN117701727B (zh) | 基于全基因组测序筛选的与摩拉水牛体尺、初生重相关的snp分子标记组合及应用 | |
CN110760593A (zh) | 肉用西门塔尔牛6号染色体上与脾脏重相关的snp位点及应用 | |
CN104988238B (zh) | 一种预示和鉴定绵羊超数排卵性状的分子标记方法及其分子标记引物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |