CN117757952A - 一种绵羊全基因组45k snp液相芯片及其应用 - Google Patents
一种绵羊全基因组45k snp液相芯片及其应用 Download PDFInfo
- Publication number
- CN117757952A CN117757952A CN202311765850.6A CN202311765850A CN117757952A CN 117757952 A CN117757952 A CN 117757952A CN 202311765850 A CN202311765850 A CN 202311765850A CN 117757952 A CN117757952 A CN 117757952A
- Authority
- CN
- China
- Prior art keywords
- sheep
- snp
- genobaits
- probe
- liquid phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241001494479 Pecora Species 0.000 title claims abstract description 89
- 239000007791 liquid phase Substances 0.000 title claims abstract description 43
- 239000000523 sample Substances 0.000 claims abstract description 60
- 239000000203 mixture Substances 0.000 claims abstract description 18
- 230000002068 genetic effect Effects 0.000 claims abstract description 12
- 238000012098 association analyses Methods 0.000 claims abstract description 6
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 108020004414 DNA Proteins 0.000 claims description 38
- 108090000623 proteins and genes Proteins 0.000 claims description 20
- 239000011534 wash buffer Substances 0.000 claims description 16
- 239000011324 bead Substances 0.000 claims description 15
- 238000009396 hybridization Methods 0.000 claims description 13
- 238000009395 breeding Methods 0.000 claims description 12
- 230000001488 breeding effect Effects 0.000 claims description 12
- 239000000872 buffer Substances 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 11
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 10
- 210000000349 chromosome Anatomy 0.000 claims description 10
- 239000007788 liquid Substances 0.000 claims description 8
- 239000011259 mixed solution Substances 0.000 claims description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 6
- 239000003623 enhancer Substances 0.000 claims description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 5
- 229960002685 biotin Drugs 0.000 claims description 5
- 235000020958 biotin Nutrition 0.000 claims description 5
- 239000011616 biotin Substances 0.000 claims description 5
- 230000006872 improvement Effects 0.000 claims description 2
- 238000012986 modification Methods 0.000 claims description 2
- 230000004048 modification Effects 0.000 claims description 2
- 230000004807 localization Effects 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 15
- 210000002593 Y chromosome Anatomy 0.000 abstract description 4
- 210000003205 muscle Anatomy 0.000 abstract description 3
- 230000020509 sex determination Effects 0.000 abstract description 2
- 238000009394 selective breeding Methods 0.000 abstract 1
- 238000012163 sequencing technique Methods 0.000 description 14
- 238000000034 method Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 11
- 238000007918 intramuscular administration Methods 0.000 description 10
- 239000008280 blood Substances 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 238000012165 high-throughput sequencing Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000008021 deposition Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 244000144972 livestock Species 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 210000003899 penis Anatomy 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 239000007790 solid phase Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007614 genetic variation Effects 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 235000021050 feed intake Nutrition 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 235000013372 meat Nutrition 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 210000001596 intra-abdominal fat Anatomy 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 210000002747 omentum Anatomy 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000012257 pre-denaturation Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 210000004706 scrotum Anatomy 0.000 description 2
- 238000003307 slaughter Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001400033 Omia Species 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000004731 jugular vein Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Abstract
本发明提供了一种绵羊全基因组45K SNP液相芯片及应用,该绵羊全基因组45K SNP液相芯片用于检测包括以下定位于绵羊参考基因组Oar_rambouillet_v1.0上的45052个SNP位点,这些位点与生长性状、胴体性状、体组成、肌肉品质和其他等性状显著相关。液相芯片还包括用于检测Y染色体的片段的探针,用于性别的鉴定。本发明提供的液相芯片可用于在绵羊遗传多样性分析、品种鉴定、性别判定、亲缘关系鉴定、全基因组关联分析以及基因组选择育种中的应用。
Description
技术领域
本发明属于全基因组基因芯片技术领域,具体涉及一种绵羊全基因组45K SNP液相芯片及其应用。
背景技术
基因组序列中的遗传变异,即遗传标记,主要包括单核苷酸多态(single-nucleotide polymorphism,SNP),微卫星(Short Tandem Repeat,STR)、拷贝数变异(CNV,Copy Number Variations)、插入/缺失(INDEL,insertion deletion)、结构变异(SV,Structural Variation)等,其中SNP是数量最多(数百万到数千万)、分布最广、最主要和最常用的标记,SNP标记可以高密度地覆盖基因组,而且成本低廉。SNP标记是发生在生物体基因组DNA序列中的可遗传的单碱基对变化,在人类基因组中发生频率很高,是一种生物体中最常见的遗传变异。在遗传学研究中,SNP通常被用作基因组区域的标记,其中绝大多数对生物系统的影响较小。然而,SNP可能具有功能性,可以引起氨基酸变化、mRNA转录稳定性变化和转录因子结合亲和力变化。SNP是迄今为止人类基因组中最丰富的遗传变异形式,每1000个碱基就会有一个SNP出现。SNP以其密度高,特异性强,稳定性好和易分析等特性,在畜禽动物遗传育种中被广泛应用。
目前,用于SNP位点分型的基因芯片技术主要包括固相芯片和液相芯片。固相芯片是一种基于固相杂交原理的芯片技术。它通过将一系列特定的DNA探针固定在芯片表面,然后将待测样品中的DNA片段与这些探针进行杂交,从而检测样品中的SNP位点。液相芯片是一种基于液相杂交原理的芯片技术。它通过将一系列特定的DNA探针溶解在液相中,然后将待测样品中的DNA片段与这些探针进行杂交,从而检测样品中的SNP位点。液相SNP芯片具有低成本、高通量、高灵敏度和高特异性等优点,同时还具有更广泛的适用范围,可以用于分子标记辅助选择、全基因组选择等多种应用场景。
在家畜育种中,全基因组关联分析研究已成为育种工作者研究畜禽复杂性状的重要手段,为畜禽品种的选育提供了重要的分子理论基础。这种方法已经成为一种有效的策略来确定牲畜重要经济性状的候选基因。全基因组关联分析筛选的SNP标记已被育种家用来寻找与经济性状高度相关,并给予很大权重。同时利用SNP标记预测与经济性状相关的候选基因、基因组水平标记间的连锁不平衡程度以及家畜遗传多样性,甚至揭示物种的系统发育关系。然而,在实际育种中我们发现现有的只有少数SNP标记对经济性状的遗传变异有贡献,甚至有些SNP效应大但却不显著,有些SNP显著但效应相对较小。因此选择显著及效应大SNP添加进液相芯片,对于有效的动物育种计划极为重要。
发明内容
本发明的目的在于提供一种绵羊全基因组45K SNP液相芯片及其应用。
为实现上述目的,本发明采用以下的技术方案为:
一种绵羊全基因组45KSNP液相芯片,其包括独立包装的绵羊45K探针混合液和杂交捕获试剂,45K探针混合液包括针对下述表1中的SNP位点设计并合成的探针,其为DNA双链探针,探针长度110bp、探针GC含量在30%-70%之间、同源性区域个数(Hom)≤5,选取区域最大限度地不包含SSRX域和GAP区域;根据筛选获得的SNP位点设计两条有60-70%重叠且覆盖所述SNP位点的核苷酸序列,针对每个SNP位点合成的两条探针的长度为110bp;且每条探针的5’端带有生物素基团修饰。
表1 SNP位点在染色体的序号位置及该位点参考基因的碱基
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
其中,表中下划线前面的数字/字母表示染色体标号,后面的数字组表示在该染色体上的位置,最后的字母表示该位点参考基因的碱基。
如上所述的液相芯片,优选地,针对所述每个SNP位点合成的两条探针等摩尔质量混合,利用EDTA和Tris-HC1混合液定容为3pmol/mL的绵羊45K探针混合液,其中EDTA的浓度为1mM,TirsHcl的浓度为10mM,每条探针的浓度均为3pmol/mL。
如上所述的液相芯片,优选地,所述杂交捕获试剂包括独立包装的GenoBaitsBlock I、GenoBaits Block II、GenoBaits 2×Hyb Buffer、GenoBaits Hyb BufferEnhancer、GenoBaits 2×Beads Wash Buffer、GenoBaits 10×Wash Buffer I、GenoBaits10×Wash BufferII、GenoBaits 10×Wash Buffer III、GenoBaits 10×Stringent WashBuffer。
如上所述的液相芯片,优选地,所述芯片还包括如SEQ ID NO.1-SEQ ID NO.8所示的探针,探针的5’端带有生物素基团修饰。
SEQ ID NO.1-SEQ ID NO.8的探针用于检测的基因分型对象为定位于绵羊Y染色体上的SEQ ID NO.9所示的DNA区域。
在实际检测中,将探针与基因组DNA进行液相杂交,对目标区域序列进行捕获并富集后通过测序平台进行高通量测序,可以对该区域片段进行检测,从而用于对待测样本的性别进行判定,或对性别进行二次确认。
如上所述的绵羊全基因组45K液相芯片在绵羊育种中的应用。
进一步地,所述应用为如上所述的绵羊全基因组45K液相芯片在绵羊基因组选择、绵羊性状相关基因的定位、绵羊遗传多样性分析、绵羊全基因组关联分析、绵羊亲缘关系鉴定或绵羊种质资源改良与保护中的应用。
上述液相芯片的检测方法为基于液相芯片的目标DNA片段捕获方法或基于液相芯片的SNP位点分型方法。
本发明的有益效果在于:
本发明提供的绵羊全基因组45K SNP液相芯片基于靶向捕获测序技术,不仅可以对目标位点进行分型,同时目标位点周围一定范围内的SNP也可以被准确分型,因此可以得到比标记位点更多的SNP分型信息。与传统固相芯片相比,灵活性较高,可以根据应用需要随时添加标记位点;同时,液相芯片可依托二代测序平台,分型成本较低,为大规模分型提供技术手段。
本发明提供的绵羊45K液相芯片的优点如下:
(1)与具有相同数目探针的传统固相芯片相比,本发明的液相芯片可以检测出更多的SNP位点。此外,本发明的芯片设计灵活,可以随时添加感兴趣的标记位点。
(2)与全基因组重测序相比,本发明具有明显的价格优势,可用于进行绵羊的大规模分型,从而促进绵羊的育种工作。
(3)本发明的45K液相芯片涵盖了大量与绵羊功能基因相关的位点,这些位点与体重、体尺、生长速度、采食量、剩余采食量、饲料转化率、屠宰率、眼肌面积、肋骨数目、尾椎数目、腰椎数目、GR值、背膘厚、体组成、内脏脂肪沉积、内脏脂肪沉积、大网膜脂肪沉积、尾部脂肪沉积、内外尾长、内外尾宽、尾脂周长、肉色、肌内蛋白、肌内盐分、肌内水分、肌内胶原、肌内脂肪、熟肉率、滴水损失、失水率、阴囊周长、阴茎长度、阴茎周长、阴茎重量和血液生理生化指标等性状显著相关。这些位点的加入提高了芯片在基础研究中的准确性。
附图说明
图1为实施例中的绵羊45K液相芯片中涉及的45052个SNP位点在全基因组上的分布情况(基因组上每1M的窗口内所包含SNP的个数)。
具体实施方式
以下实施例用于进一步说明本发明,但不应理解为对本发明的限制。在不背离本发明精神和实质的前提下,对本发明所作的修饰或者替换,均属于本发明的范畴。
若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
实施例1
绵羊45K液相芯片的设计和制备,其包括如下步骤:
(1)先筛选的SNP位点,利用2074只中国当家品种湖羊的全基因组重测序数据、ChIP-seq、ATAC-seq和CUT&Tag测序数据,首先进行了SNP分析,对位点进行过滤后共获得23409311个高质量SNP位点用于后续的筛选。SNP位点筛选原则包括以下步骤:
1.测定2074只湖羊生长、饲料效率、机体组成、产肉、繁殖等主要经济性状的表型值,利用基因组重测序技术鉴定对应个体的基因组遗传变异的基因型;
2.整理表型、系谱和固定效应文件;
3.利用表型、系谱和固定效应进行育种值估计,并计算校正表型;
4.对重测序数据进行质控,质控标准为:去除SNP检出率<30%、最小等位基因频率<0.05、最小平均测序深度<5以及没有染色体位置信息的SNP位点;
5.挑选具有重测序个体的校正表型和重测序数据进行全基因组关联分析(GWAS);利用混合线性模型(MLM),对体重、体尺、生长速度、采食量、剩余采食量、饲料转化率、屠宰率、眼肌面积、肋骨数目、尾椎数目、腰椎数目、GR值、背膘厚、体组成、内脏脂肪沉积、内脏脂肪沉积、大网膜脂肪沉积、尾部脂肪沉积、内外尾长、内外尾宽、尾脂周长、肉色、肌内蛋白、肌内盐分、肌内水分、肌内胶原、肌内脂肪、熟肉率、滴水损失、失水率、阴囊周长、阴茎长度、阴茎周长、阴茎重量和血液生理生化指标等250个性状指标进行全基因组关联分析,使用Bonferroni方法设定基因组水平显著的统计检验阈值,判定与各性状关联的显著SNPs;最后,选择每个性状显著性排名前0.0005%的SNP位点作为与性状显著相关的候选SNP位点;
6.利用rrBLUP方法对参考数群体(n=2074)对SNP标记的效应值进行估计,分别检测解释上述250个性状加性遗传方差较大比例的SNP位点;计算得到相应性状的SNP标记的效应值,选取解释加性遗传方差比例排名前0.0005%的SNP位点作为候选位点;
7.对重测序数据进行滑动窗口筛选;使用Oar_rambouillet_v1.0绵羊基因组组装结果在常染色体上定义500Kb长度的窗口在染色体上滑动,并筛选窗口中具有最高MAF的信息SNP位点,这些SNP能在基因组上均匀间隔分布;具体的筛选标准如下:1)选择500Kb滑动窗口中的具有最高MAF的SNP位点;2)具有80%的检出率的SNP位点以确保位点具有稳定的重复性;最后,为了避免在每条染色体的开始/结束端缺少侧翼标记信息,每条染色体的第一个和最后一个SNP必须选择;因此,对于每条常染色,选择每个500Kb窗口中MAF最高的SNP位点,并将每条染色体开始和结束端的SNP包括在内;
8.从Ensemble数据库中下载Oar_rambouillet_v1.0绵羊基因组注释文件,并根据标记的物理位置将高质量SNP位点注释到相应的基因区域,其中基因包括蛋白编码基因和非蛋白编码基因以及部分假基因;同时,基于ChIP-seq、ATAC-seq和CUT&Tag等技术鉴定湖羊基因组启动子、增强子、染色质开放区域等调控元件及活性区域;对于每个基因区域、基因组启动子、增强子、染色质开放区域等调控元件及活性区域,注释到该区域的SNP将形成一个单独的SNPs集合,并从该集合中选取MAF最高的SNP位点;
9.品种间特异位点筛选:利用收集到的352份世界范围收集的32个绵羊品种资源材料的多平台基因分型数据,在全基因组范围内分别计算湖羊和其他品种绵羊之间的群体固定指数(Fst),选取全基因组范围内Fst最高的前1‰的窗口取交集,作为显著受选择区域;
10.对于OMIA数据库(https://www.omia.org/home/)和Isheep QTLdb数据库已报道的与绵羊经济性状相关的重要SNP位点;
11.将以上四种方法筛选的SNP位点合并在一起(去除重复筛选位点),SNP位点具体见表1,可用于形成一个绵羊45K液相芯片SNP集合用于湖羊全基因组选择芯片;
12.对功能SNP位点芯片进行相邻SNP位点间的间隔、连锁不平衡和最小等位基因频率计算,剔除异常位点后,生成最终绵羊45K液相芯片位点集合,这些SNP位点集合在染色体的序号及位置及参考基因的碱基具体见表1。
(2)按表1中的SNP为位点,筛选满足绵羊45K液相芯片的探针长度110bp、探针GC含量在30%-70%之间、同源性区域个数≤5,选取区域最大限度地不包含SSRX域和GAP区域:根据筛选获得的每个SNP位点设计两条有60-70%重叠且覆盖所述SNP位点的核苷酸序列;该核苷酸序列要覆盖SNP位点,根据上述设计的核酸序列进行单链核苷酸合成,合成的两条长度为110bp;5’端带有生物素基团修饰的DNA核苷酸序列,将上述针对每个SNP位点的合成后的两条探针进行等摩尔质量混合,利用EDTA和Tris-HC1混合液定容为每个探针为3pmol/mL的绵羊45K探针混合液;其中,EDTA的浓度为1mM和Tris-HC1的浓度是10mM),绵羊45K探针混合液和杂交捕获试剂分别独立包装而得到所述基于靶向捕获测序的绵羊45K液相芯片。其中,杂交捕获试剂为来自石家庄博瑞迪生物技术有限公司的GenoBaits DNAseq LibraryPrep试剂盒,包括独立包装的GenoBaits Block I、GenoBaits Block II、GenoBaits 2×Hyb Buffer、GenoBaits Hyb Buffer Enhancer、GenoBaits 2×Beads Wash Buffer、GenoBaits 10×Wash Buffer I、GenoBaits 10×Wash BufferII、GenoBaits 10×WashBuffer III、GenoBaits 10×Stringent Wash Buffer。
本实施例中绵羊参考基因组为Oar_rambouillet 1.0版本。
本实施例共针对45052个SNP位点和Y染色体DNA区域进行了绵羊45K探针的设计,获得的绵羊45K液相芯片覆盖的SNP如图1所示,表明本发明的绵羊45K液相芯片筛选的SNP标记覆盖每条常染色体,基本上按照芯片设计原则来设计,无基因组定义gap区域。
实施例2利用实施例1获得的绵羊45K液相芯片对绵羊DNA样品进行检测的流程
一、利用待测绵羊的血液基因组DNA构建绵羊DNA高通量测序文库
1)绵羊基因组DNA的提取:从绵羊颈静脉采血,使用酚氯仿法或血液基因组提取试剂盒(天根生物科技有限公司,北京)进行DNA的提取。具体地,从2个全国规模化羊场选取湖羊276个,采集对应个体血液进行基因组DNA的提取。采用石家庄博瑞迪生物技术有限公司研发的血液DNA快速提取试剂盒(磁珠法)对样本DNA进行提取。并将测试样品DNA,用QubitFluorometric Quantitation(Thermo Fisher)对DNA浓度进行测定,用1%琼脂糖凝胶电泳检测DNA的完整性。检测合格的样品放入4℃冰箱,保存、备用。
2)构建绵羊DNA高通量测序文库
(1)取12μL质检合格的DNA放置于0.2μL PCR管中,将管置于超声波破碎仪中对DNA进行随机物理破碎,片段破碎至200~400bp。
(2)向管中加入4μL GenoBaits End Repair Buffer(GenoBaits,即石家庄博瑞迪生物科技有限公司)和2.7μL GenoBaits End Repair Enzyme,补水至20μL,放入ABI9700PCR仪中37℃温育20分钟,完成破碎片段的末端修复和加A过程。
(3)从PCR仪中取出小管加入2μL GenoBaits Ultra DNA ligase、8μL GenoBaitsUltra DNA Ligase Buffer和2μL GenoBaits Adapter,补超纯水至40μL,然后放置于ABI9700 PCR仪上22℃反应30分钟,完成测序接头的连接。
(4)向连接产物中加入48μL的Beackman AMPure XP Beads(Beackman公司)对连接产物进行纯化,纯化后采用磁珠进行片段筛选,保留插入片段在200~300bp的连接产物。
(5)向上一步的PCR管中加入5μL带有Barcode序列的测序接头、1μL P5接头、10μLGenoBaits PCR Master Mix,并用纯水补至20μL;用ABI 9700PCR仪进行扩增,扩增程序为:95℃预变性5min,95℃变性30s,60℃退火30s,72℃延伸30s;重复2-4步,共8个循环;72℃延伸5min。不同的Barcode用于区分不同的样品。
(6)向第二轮PCR产物中加入24μL Beckmen AMPure XP Beads(Beackman公司),用移液器上下吸打均匀后,将0.2μL的PCR管置于磁力架上至溶液澄清,弃去上清并用75%乙醇洗涤磁珠一次,用pH值为8.0的Tris-HCl将文库DNA洗脱下来。
二、将实施例1制备的绵羊45K液相芯片与上述构建的绵羊DNA高通量测序文库混合,捕获绵羊DNA高通量测序文库中包含目标位点的DNA片段。
1)DNA杂交
取500ng已完成构建的基因组DNA测序文库,加入5μL GenoBaits Block I和2μLGenoBaits Block II,置于Eppendorf Concentrator plus(Eppendorf公司)真空浓缩仪上,在≤70℃的温度下蒸干至干粉。向干粉管中加入8.5μL GenoBaits 2x Hyb Buffer、2.7μL GenoBaits Hyb Buffer Enhancer、2.8μL Nuclease-Free Water,用移液器吸打混匀后放置于ABI 9700PCR仪上95℃温育10分钟,然后取出PCR管加入3μL已经合成的探针(探针的浓度为60ng/μL),旋涡震荡混匀后放置于ABI 9700PCR仪上65℃温育2小时,完成探针杂交反应。
2)DNA捕获
向上一步杂交完成的反应体系中加入100μL GenoBaits DNA Probe Beads,上下吸打10次,放入ABI 9700PCR仪上65℃温育45分钟,使磁珠与探针结合。用100μL GenoBaitsWash Buffer I、150μL GenoBaits Wash BufferII分别对结合探针后的磁珠进行65℃热洗,然后再用100μL GenoBaits Wash Buffer I、150μL GenoBaits Wash Buffer II(和150μL GenoBaits Wash Buffer III分别对磁珠进行常温洗涤。洗涤完成的磁珠用20μLNuclease-Free Water进行重悬。
取13μL重悬后的DNA(带磁珠)加入到新的0.2mL PCR管中,然后加入15μLGenoBaits PCR Master Mix、2μL GenoBaits Primer Mix配置post-PCR体系,用ABI9700PCR仪进行文库扩增,扩增程序为:95℃预变性5min,95℃变性30s,60℃退火30s,72℃延伸30s;重复2-4步,共15个循环;72℃延伸5min。
向post-PCR产物中加入45μL Beckmen AMPure XP Beads(Beackman公司)并用移液器上下吸打均匀,然后将0.2mL PCR管置于磁力架上至溶液澄清,弃去上清并用75%乙醇洗涤磁珠两次,用pH为8.0的Tris-HCl将文库DNA洗脱下来。完成探针的杂交捕获工作。
3)DNA杂交捕获文库质检
用Qubit Fluorometric Quantitation(Thermo Fisher)对文库的DNA浓度进行测定,然后用琼脂糖凝胶电泳检测文库DNA的片段大小是否在300~400bp之间。
三、对上述获得的DNA片段进行扩增和纯化,产物经过高通量测序(华大MGISEQ2000测序仪)后,利用测序结果回帖到绵羊参考基因组上进行比对,从而获取待测绵羊的基因组基因分型。
SNP检出率是衡量芯片质量的重要指标,一般用常染色体和X染色体的位点进行衡量。实施例1的绵羊45K液相芯片SNP检出率很高,SNP平均检出率为99.21%,说明使用实施例1的绵羊45K液相芯片基因型检测质量很好。
实施例3绵羊45K液相芯片在绵羊全基因组选择中的应用
本发明还研究采用rrBLUP(VanRaden,2008)、BayesA(Meuwissen et al.,2001)、BayesB(Meuwissen et al.,2001)和BayesCπ(Habier et al.,2011)四种方法,对使用10K液相芯片的估计的基因组育种值的准确性进行评估。将上述2074只绵羊群体中所有个体随机分成5个独立的子集。每个子集依次作为验证群体,并假定其表型未知,同时其余四个子集则作为参考群体。这个过程随机重复10次。最后,将校正表型与基因组估计育种值(GEBV)的间Pearson相关系数除以相应性状遗传力的算术平方根作为GEBV准确性的评价指标。结果表明,使用低密度SNP集合计算的35个性状的GEBV准确性在0.25-0.54之间,如表2所示。
表2使用rrBLUP、BayesA、BayesB和BayesC方法估计密度的SNP集合在各性状中的GEBV估计准确性
在已经设计的芯片基础上,结合靶向捕获测序(无需进行填充就可以获得比标记位点更多的SNP),能够进行全基因组选择工作。相比于绵羊Illumina OvineSNP50固相芯片,可以以更低的成本开展绵羊育种工作。
实施例4绵羊45K液相芯片在性别判定中的应用
45K液相芯片中还包括有如SEQ ID NO.1-SEQ ID NO.8所示的探针,具体地其核苷酸序列如下:SEQ ID NO.1:TCCAGTTCAGTTATTAACTACTGGAATACCTACATAGATTTTTCAGCTGTTTTTTAAGCCTAAGTGGAGAAGCAGGGAGAGTGATTAGCATGGATTCGGTATCCTGTGTA;SEQ ID NO.2:AAGCCTAAGTGGAGAAGCAGGGAGAGTGATTAGCATGGATTCGGTATCCTGTGTATTCAGCTATATAACAGGATCGGGCTGTTTTTCATCTTTTTTTTTAAATATAACAT;SEQ ID NO.3:TTCAGCTATATAACAGGATCGGGCTGTTTTTCATCTTTTTTTTTAAATATAACATTCTCTTTCATTCATAACCATAAACAATTTGTTAGTATGTCTGCTGCACCTTCATC;SEQ ID NO.4:TCTCTTTCATTCATAACCATAAACAATTTGTTAGTATGTCTGCTGCACCTTCATCCTTTAAATAAGTATATGAAAATAACTTCACAATGACACCGGTTGTATTTTTAAGC;SEQ ID NO.5:CTTTAAATAAGTATATGAAAATAACTTCACAATGACACCGGTTGTATTTTTAAGCAGGTATTAGCGCCTTCACAAATTCTGATTAGATGTAAACAAAGAAGAAAGCAGAG;SEQ ID NO.6:AGGTATTAGCGCCTTCACAAATTCTGATTAGATGTAAACAAAGAAGAAAGCAGAGCGTTAATATCCTGTTAAGCACCTTTGGTGGGTTTGGGCTGGCTGCCAGGAGGTAT;SEQ ID NO.7:CGTTAATATCCTGTTAAGCACCTTTGGTGGGTTTGGGCTGGCTGCCAGGAGGTATTGAGGGGAGGTATTGGGGGCGGAGAAATAAATATTTCACTGCAAATTTTGCACCA;SEQ ID NO.8:GAGGTATTGAGGGGAGGTATTGGGGGCGGAGAAATAAATATTTCACTGCAAATTTTGCACCAAGTCAGTCTCTGGTAAGAACAACTTATGAATAGAACGGTGCAATCGTA。
探针的5’端带有生物素基团修饰,这些探针选取定位于绵羊Y染色体,其对应DNA片段如SEQ ID NO.9所示。将核苷酸序列如SEQ ID NO.1-SEQ ID NO.8所示的探针与基因组DNA进行液相杂交,对目标区域序列进行捕获并富集后通过测序平台进行高通量测序,可以对候选区域SEQ ID NO.9进行检测,通过对比结果如有该片段,则为雄性,否则为雌性。
SEQ ID NO.9:TGTGTTTTCTTTTAATGGAACAGTTTTTATGTCAAAGTTTTGTTGTATCTGAGATTGACCATTAAATATGTATTAGTATATATTAGCATTCTGAAAGTCGTCAGCATATATCCAGTTCAGTTATTAACTACTGGAATACCTACATAGATTTTTCAGCTGTTTTTTAAGCCTAAGTGGAGAAGCAGGGAGAGTGATTAGCATGGATTCGGTATCCTGTGTATTCAGCTATATAACAGGATCGGGCTGTTTTTCATCTTTTTTTTTAAATATAACATTCTCTTTCATTCATAACCATAAACAATTTGTTAGTATGTCTGCTGCACCTTCATCCTTTAAATAAGTATATGAAAATAACTTCACAATGACACCGGTTGTATTTTTAAGCAGGTATTAGCGCCTTCACAAATTCTGATTAGATGTAAACAAAGAAGAAAGCAGAGCGTTAATATCCTGTTAAGCACCTTTGGTGGGTTTGGGCTGGCTGCCAGGAGGTATTGAGGGGAGGTATTGGGGGCGGAGAAATAAATATTTCACTGCAAATTTTGCACCAAGTCAGTCTCTGGTAAGAACAACTTATGAATAGAACGGTGCAATCGTA。
在对未知品种的绵羊进行品种鉴定时,从规模化羊场(于2022年7月在浙江省长兴县长兴永盛牧业有限公司采集)中随机采集已知性别的30只绵羊的血液样本,公母各15只左右,连同待测绵羊一起,采用绵羊45K液相芯片进行目标DNA片段捕获。
根据该SEQ ID NO.9所示的DNA片段的有无分析判定待测绵羊性别,最终判定准确度为100%。
Claims (6)
1.一种绵羊全基因组45K SNP液相芯片,其特征在于,包括独立包装的绵羊45K探针混合液和杂交捕获试剂,45K探针混合液包括针对下表1中SNP位点设计并合成的探针,其为DNA双链探针,探针长度110bp、探针GC含量在30%-70%之间、同源性区域个数≤5,选取区域最大限度地不包含SSRX域和GAP区域;根据筛选获得的SNP位点设计两条有60-70%重叠且覆盖所述SNP位点的核苷酸序列,针对每个SNP位点合成的两条探针的长度为110bp;且每条探针的5’端带有生物素基团修饰,
表1SNP位点在染色体的序号、位置及该位点参考基因的碱基。
2.根据权利要求1所述的液相芯片,其特征在于,针对所述每个SNP位点合成的两条探针等摩尔质量混合,利用EDTA和Tris-HC1混合液定容为3pmol/mL的绵羊45K探针混合液,其中EDTA的浓度为1mM,TirsHcl的浓度为10mM,每条探针的浓度均为3pmol/mL。
3.根据权利要求1所述的液相芯片,其特征在于,所述杂交捕获试剂包括独立包装的GenoBaits Block I、GenoBaits Block II、GenoBaits 2×Hyb Buffer、GenoBaits HybBuffer Enhancer、GenoBaits 2×Beads Wash Buffer、GenoBaits 10×Wash Buffer I、GenoBaits 10×Wash BufferII、GenoBaits 10×Wash Buffer III、GenoBaits 10×Stringent Wash Buffer。
4.根据权利要求1所述的液相芯片,其特征在于,所述液相芯片还包括如SEQ ID NO.1-SEQ ID NO.8所示的探针,探针的5’端带有生物素基团修饰。
5.根据权利要求1-4中任一项所述的绵羊全基因组45KSNP液相芯片在绵羊育种中的应用。
6.根据权利要求4所述的应用,其特征在于,所述应用为在绵羊基因组选择、绵羊性状相关基因的定位、绵羊遗传多样性分析、绵羊全基因组关联分析、绵羊亲缘关系鉴定或绵羊种质资源改良与保护中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311765850.6A CN117757952A (zh) | 2023-12-21 | 2023-12-21 | 一种绵羊全基因组45k snp液相芯片及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311765850.6A CN117757952A (zh) | 2023-12-21 | 2023-12-21 | 一种绵羊全基因组45k snp液相芯片及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117757952A true CN117757952A (zh) | 2024-03-26 |
Family
ID=90323243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311765850.6A Pending CN117757952A (zh) | 2023-12-21 | 2023-12-21 | 一种绵羊全基因组45k snp液相芯片及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117757952A (zh) |
-
2023
- 2023-12-21 CN CN202311765850.6A patent/CN117757952A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113046444B (zh) | 用于肉牛个体及肉品溯源鉴定的snp标记组合及其应用 | |
CN109929935B (zh) | 一种基于rs80995809位点基因分型鉴定猪背膘厚的方法及其应用 | |
CN110273010B (zh) | 一种mc1r基因单倍型的鉴定与应用方法 | |
CN109825598B (zh) | 一种与澳洲白绵羊毛发粗细极显著相关的snp标记、分子标记及应用 | |
CN109234404B (zh) | 一种鉴定绵羊产肉性状的方法及专用引物 | |
WO2018218857A1 (zh) | 改善猪肉质的myh4基因分子标记及在猪遗传改良中的应用 | |
CN110468217B (zh) | 与猪肌肉pH和滴水损失性状相关的SNP分子标记及其应用 | |
CN101818195A (zh) | 猪miR-27a前体侧翼序列SNP作为猪产仔数性状的遗传标记及应用 | |
CN117144017B (zh) | 与鸡生长性状相关的分子标记及其应用 | |
CN110564867B (zh) | 一种秦川牛cfl1基因的snp分子标记及其检测方法 | |
KR20190045957A (ko) | 돼지의 고급육 선발을 위한 일당증체량 판별용 단일염기다형성 마커 및 이의 용도 | |
CN111926086A (zh) | 一种影响鸡体斜长的分子标记及其应用 | |
CN114921568B (zh) | 一种秦川牛体尺及肉质性状相关的snp分子标记及其应用 | |
US20220228225A1 (en) | Snp marker combination and identification method for pudong white pigs and raw meat products | |
CN106701930B (zh) | 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用 | |
CN105331696B (zh) | 一种鉴定猪肋骨数相关性状的方法及专用引物 | |
CN117757952A (zh) | 一种绵羊全基因组45k snp液相芯片及其应用 | |
CN107574234B (zh) | 一种检测黄牛acvr1基因单核苷酸多态性的方法及其应用 | |
CN115341035A (zh) | 用于选择母鸡产蛋蛋重的snp分子标记 | |
CN106755370B (zh) | 利用pcr-rflp检测绵羊fth-1基因单核苷酸多态性的方法及其应用 | |
CN105219873B (zh) | 一种鉴定猪脊椎数相关性状的方法及专用引物 | |
CN117721217A (zh) | 一种绵羊全基因组10k snp液相芯片及其应用 | |
CN116769931B (zh) | 一种与猪胴体直长有关的snp标记及应用 | |
CN115807100B (zh) | 一种与肉鸡腹脂率相关的snp分子标记及其应用 | |
CN114107520B (zh) | 一种猪肌内脂肪snp分子标记及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |