CN106566872B - 基于测序基因分型技术的猪snp标记位点的分析方法 - Google Patents
基于测序基因分型技术的猪snp标记位点的分析方法 Download PDFInfo
- Publication number
- CN106566872B CN106566872B CN201510669935.3A CN201510669935A CN106566872B CN 106566872 B CN106566872 B CN 106566872B CN 201510669935 A CN201510669935 A CN 201510669935A CN 106566872 B CN106566872 B CN 106566872B
- Authority
- CN
- China
- Prior art keywords
- seq
- bar code
- added
- pig
- connector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 19
- 239000003550 marker Substances 0.000 title claims abstract description 11
- 238000004458 analytical method Methods 0.000 title claims abstract description 10
- 238000003205 genotyping method Methods 0.000 title claims abstract description 6
- 230000029087 digestion Effects 0.000 claims abstract description 35
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 13
- 238000009826 distribution Methods 0.000 claims abstract description 11
- 108010005054 Deoxyribonuclease BamHI Proteins 0.000 claims abstract description 10
- 238000012408 PCR amplification Methods 0.000 claims abstract description 9
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 9
- 239000000047 product Substances 0.000 claims description 28
- 239000011324 bead Substances 0.000 claims description 24
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 20
- 239000006228 supernatant Substances 0.000 claims description 16
- 238000004321 preservation Methods 0.000 claims description 14
- 238000000137 annealing Methods 0.000 claims description 13
- 238000005352 clarification Methods 0.000 claims description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 11
- 235000019441 ethanol Nutrition 0.000 claims description 10
- 108020004414 DNA Proteins 0.000 claims description 9
- 238000005119 centrifugation Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 239000012264 purified product Substances 0.000 claims description 8
- 239000000872 buffer Substances 0.000 claims description 7
- 238000011534 incubation Methods 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 102000012410 DNA Ligases Human genes 0.000 claims description 5
- 108010061982 DNA Ligases Proteins 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 4
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000010009 beating Methods 0.000 claims description 4
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 230000026731 phosphorylation Effects 0.000 claims description 4
- 238000006366 phosphorylation reaction Methods 0.000 claims description 4
- 238000001556 precipitation Methods 0.000 claims description 4
- 238000007169 ligase reaction Methods 0.000 claims description 2
- 239000007788 liquid Substances 0.000 claims description 2
- 102000053602 DNA Human genes 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 claims 2
- 241000282898 Sus scrofa Species 0.000 abstract description 29
- 102000004190 Enzymes Human genes 0.000 abstract description 14
- 108090000790 Enzymes Proteins 0.000 abstract description 14
- 238000011160 research Methods 0.000 abstract description 7
- 238000012098 association analyses Methods 0.000 abstract description 2
- 239000000243 solution Substances 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 241000255969 Pieris brassicae Species 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- JAWMENYCRQKKJY-UHFFFAOYSA-N [3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-ylmethyl)-1-oxa-2,8-diazaspiro[4.5]dec-2-en-8-yl]-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]methanone Chemical compound N1N=NC=2CN(CCC=21)CC1=NOC2(C1)CCN(CC2)C(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F JAWMENYCRQKKJY-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 235000015277 pork Nutrition 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000553739 Aconitum carmichaelii var. truppelianum Species 0.000 description 1
- 101710148289 DNA ligase 2 Proteins 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 235000015241 bacon Nutrition 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001035 methylating effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于测序基因分型技术的猪SNP标记位点的分析方法,包括以下步骤:(1)预测用EcoRI与MspI的双酶切猪基因组所获得的酶切片段分布情况;(2)根据EcoRI与MspI的酶切识别序列设计通用接头、条形码接头及PCR扩增引物;(3)构建简化基因组测序文库;(4)利用步骤(3)构建的文库进行上机测序;(5)根据测序结果获得SNP标记位点。本发明提供的方法中所使用的酶切组合适用于所有的猪品种,利用该组合进行简化基因组测序,能够得到高于目前市场已有芯片上的SNP数目,能够用于全基因关联分析研究和基因组选择研究,同时还能保证单个个体的分型成本低于目前流行的芯片。
Description
技术领域
本发明涉及生物技术领域,具体的,涉及一种基于测序基因分型技术的猪SNP标记位点的分析方法。
背景技术
单核苷酸多态性(Single nucleotide polymorphisms,SNP)作为第三代分子标记,具有数量多、分布广、遗传稳定等特点,被广泛应用于连锁分析、全基因组关联分析和基因组选择等遗传育种领域。目前Illumina公司和GeneSeek公司均推出了猪全基因组SNP芯片,其中Illumina推出的PorcineSNP60v2芯片含64,232SNPs,GeneSeek推出的PorcineSNP80芯片含有68,528SNPs,然而这些芯片主要是根据国外瘦肉型猪种(如长白猪、大白猪、杜洛克猪、皮特兰猪等)的基因组测序数据而设计的,很多并不适用于我国地方品种;而且芯片一旦设计好,其所含的SNP位点便很难去改变以适应不同的猪品种或品系。因此,我们需要一种能够快速的从特定品种中鉴定并分型SNP的方法。
简化基因组测序技术利用限制性内切酶对基因组DNA进行酶切,通过稳定地回收部分酶切片段进行深度测序,从而获得覆盖全基因组的高密度SNP。该技术具有效率高、成本低等特点,所获得的SNP 标记通常是目标群体中多态性较好的位点,而不像高密度SNP那样只能固定地检测特定的位点。这一特点使得该技术非常适合在中国地方品种或高度纯化的品系中进行分型,从而获得更大的信息量。利用该技术获得与高密度SNP芯片相等的标记密度的前提下,所需成本只有高密度SNP芯片的二分之一。因此,利用简化基因组测序获得覆盖猪全基因组SNP信息,是一种经济适用的方法。
我国是世界上最大的生猪养殖国和猪肉消费国,养殖量和猪肉产量均占世界总量的50%左右。目前,猪遗传育种研究领域的两个重大课题就是利用全基因组选择技术鉴定重要经济性状的候选基因,以及利用基因组选择技术快速增加遗传进展。这些研究都需要利用覆盖全基因组的SNP标记信息。因此,开发一种新的使用于猪的全基因组 SNP分型方法,将极大推动功能基因定位以及基因组选择技术在猪科学养殖中的应用。
发明内容
本发明的目的在于提供一种使用于猪的全基因组SNP分型技术。
为此本发明提供了一种基于测序基因分型技术的猪SNP标记位点的分析方法,其特征在于,包括以下步骤:
(1)预测用EcoRI与MspI的双酶切猪基因组所获得的酶切片段分布情况;
(2)根据EcoRI与MspI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;
(3)构建简化基因组测序文库;
(4)利用步骤(3)构建的文库进行上机测序;
(5)根据测序结果获得SNP标记位点。
其中,步骤(2)中所述的通用接头带有与限制性内切酶MspI 相同的粘性末端序列,所述的条形码接头带有与限制性内切酶EcoRI 相同的粘性末端序列。
其中,所述通用接头是由SEQ ID NO:1和SEQ ID NO:2所示序列退火形成的双链DNA,其中SEQ ID NO:1经过5’磷酸化修饰。
其中,所述条形码接头是由SEQ ID NO:3和SEQ ID NO:4 所示序列退火形成的双链DNA;其中SEQ ID NO:4经过5’磷酸化修饰,SEQ ID NO:3和SEQ ID NO:4中的n和m表示长度为5-9bp 的任意短核苷酸条形码序列。
其中,步骤(2)所述的PCR扩增引物如SEQ ID NO:5和SEQ ID NO:6所示。
其中,步骤(3)中包括以下步骤:
(a)利用限制性内切酶组合EcoRI-MspI对猪基因组进行酶切;
(b)制备通用接头和条形码接头;
(c) 将通用接头和条形码接头按一定比例混合以形成接头混合物,然后将其与酶切产物进行连接反应,获得连接产物 ”
(d)将连接产物等比例进行混池,获得混池后的连接产物;
(e)在混池后的连接产物中加入1.2-1.4倍体积的磁珠进行第一纯化获得第一纯化产物;
(f)在所述第一纯化产物中加入0.8-0.9倍体积的磁珠进行第二纯化获得第二纯化产物;
(g)对第二纯化产物进行PCR扩增获得PCR产物;
(h)在PCR产物中加入1.2-1.4倍体积的磁珠进行第三纯化获得第三纯化产物;
(i)在第三纯化产物中加入0.8-0.9倍体积的磁珠进行第四纯化获得简化基因组测序文库。
其中,所述第一纯化和第三纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育18-22min获得孵育后体系;孵育结束后在孵育后体系中加入0.9-1.1倍体积的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,再重复此步骤一次获得沉淀;其中,相对于100μL所述孵育后体系,每次添加的70%乙醇的量为90-110μL;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为140-160μL。
其中,第二纯化和第四纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育13-16min;孵育结束后加入0.9-1.1倍体积的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为30-50μL。
其中,步骤(c)中所述的通用接头的退火体系为:100μM SEQ ID NO:15μL;100μMSEQ ID NO:25μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min 的速度降温至25℃,25℃保温30min后于4℃保存。
条形码接头的退火体系为:100μM SEQ ID NO:35μL;100μM SEQ ID NO:45μL,5×Annealing Buffer 10μL,无核酸酶水30μL;反应程序为:95℃3min,以1℃/min的速度降温,直至降到25℃, 25℃保温30min后于4℃保存。
其中,步骤(c)中所述的连接反应的体系为:酶切产物20μL, 5×DNA LigaseReaction Buffer 8μL,DNA连接酶2μL,无核酸酶水 5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃保温1h,65℃保温30min,降温至4℃保存。
本发明所提供的方法在PCR前通过上述磁珠纯化的方式进行片段选择,使得过大或者过小的片段都在PCR前被去除,从而提高测序数据质量。
发明人在研究中发现,当进行SNP标记位点分析时,单酶切不利于后续试验中酶切片段的筛选,而部分双酶切组合存在着酶切片段过多或过少的缺点,酶切片段过多会增加实验成本,酶切片段过少将降低SNP挖掘的密度,进而影响后续生物学分析,还有的酶切组合会由于基因组的甲基化影响酶切效率。综上诸多原因,对任何需要研究的物种,酶切组合优选的实验是必不可少的。本发明所提供的方法确定了针对目的猪基因组的特定酶切组合。该酶切组合具有适中的酶切密度,SNP在基因组分布均匀,SNP密度适中,酶切不受到DNA修饰的影响等优点,而且EcoRI-MspI酶切组合可以获得比PorcineSNP60芯片更高的标记密度(≈200k)。
本发明所开发的方法提供了对任意猪品种进行测序分型的最有效实验方案,可以在保证准确度的前提下,使现有的分型成本降低一个数量级,具有较大应用前景。
附图说明
图1为Agilent 2100对测序文库的质控。
具体实施方式
下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
实施例1预测EcoRI-MspI双酶切猪基因组效果
本实施例用于说明EcoRI-MspI双酶切组合所获得的酶切片段数目和大小分布。通过生物信息学分析方法模拟酶切猪基因组,统计长度在100-300bp范围内的双酶切片段数目,结果显示, EcoRI-MspI双酶切猪基因组时可以获得的约135,495个大小在 100-300bp双酶切片段,这些片段适合简化基因组测序文库构建被利用。
对比例1-8
对比例1-8用于说明其他双酶切组合能获得的酶切片段数目和大小分布。考虑酶切位点识别特点(如识别碱基数、GC含量)等,共设计8个双酶切组合,通过生物信息学分析方法模拟酶切猪基因组,统计长度在100-300bp范围内的双酶切片段数目,结果如表1 所示。与实施例1的结果相比,各酶切组合产生的双酶切片段过多,会增加测序成本,降低本发明的实用性。
表1不同酶切组合在猪基因组中模拟酶切结果
编号 | 酶切组合 | 100-300bp双酶切片段数目 |
1 | Pst-ApekI | 469,676 |
2 | PstI-MseI | 824,055 |
3 | PstI-MspI | 319,631 |
4 | HinP1l-ApekI | 520,898 |
5 | HinP1l-MseI | 554,822 |
6 | HinP1l-MspI | 338,444 |
7 | Bgl-II-ApekI | 300,848 |
8 | EcoRI-MseI | 421,353 |
实施例2利用EcoRI-MspI酶切对多个猪品种进行简化基因组测序
本实施例用于说明利用EcoRI-MspI酶切猪基因组能够获得覆盖于全基因组SNP信息。
1、实验材料
采集长白猪、大白猪、二花脸猪、沙乌头猪、梅山猪、米猪的耳组织样品,每个品种4头,共计24头猪耳组织样品。用DNeasy Blood& Tissue Kit提取基因组DNA,并将基因组浓度稀释至50ng/μL备用。
2、根据EcoRI与MspI的酶切识别序列设计通用接头(包括oligo1 和oligo2)、条形码接头(包括oligo1和oligo2)、PCR扩增引物(包括 oligo1和oligo2),其中条形码接头共有24个,用于区分24个样品,使得它们可以在一起被测序。按照表2合成序列。
表2简化基因组测序文库构建所需序列
引物名称 | 序列(5'至3') |
条形码接头01_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACAGT |
条形码接头02_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCAGTA |
条形码接头03_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGCAC |
条形码接头04_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGTTCA |
条形码接头05_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACGTC |
条形码接头06_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCAAGT |
条形码接头07_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGCAGC |
条形码接头08_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGTTCGT |
条形码接头09_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAACAAT |
条形码接头10_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTACGC |
条形码接头11_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTGCC |
条形码接头12_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTAGGCTT |
条形码接头13_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAATAGC |
条形码接头14_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTCACGT |
条形码接头15_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTTGGC |
条形码接头16_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGAGGTCT |
条形码接头17_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAGAACTC |
条形码接头18_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTTCAGT |
条形码接头19_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCCTTCGC |
条形码接头20_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGAGGTGC |
条形码接头21_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAAGATGGC |
条形码接头22_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTCCACGC |
条形码接头23_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTTCGCC |
条形码接头24_oligo1 | ACACTCTTTCCCTACACGACGCTCTTCCGATCTTAGCGGTTC |
条形码接头01_oligo2 | AATTACTGTTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头02_oligo2 | AATTTACTGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头03_oligo2 | AATTGTGCAAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头04_oligo2 | AATTTGAACCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头05_oligo2 | AATTGACGTTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头06_oligo2 | AATTACTTGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头07_oligo2 | AATTGCTGCAAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头08_oligo2 | AATTACGAACTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头09_oligo2 | AATTATTGTTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头10_oligo2 | AATTGCGTAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头11_oligo2 | AATTGGCAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头12_oligo2 | AATTAAGCCTAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头13_oligo2 | AATTGCTATTCCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头14_oligo2 | AATTACGTGAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头15_oligo2 | AATTGCCAAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头16_oligo2 | AATTAGACCTCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头17_oligo2 | AATTGAGTTCTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头18_oligo2 | AATTACTGAAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头19_oligo2 | AATTGCGAAGGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头20_oligo2 | AATTGCACCTCCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头21_oligo2 | AATTGCCATCTTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头22_oligo2 | AATTGCGTGGAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头23_oligo2 | AATTGGCGAAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
条形码接头24_oligo2 | AATTGAACCGCTAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT |
通用接头oligo1 | CGAGATCGGAAGAGCGGGGACTTTAAGC |
通用接头oligo2 | GATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT |
PCR引物oligo1 | AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT |
PCR引物oligo2 | CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAA |
3、接头的退火与混合
将oligo1序列和oligo2序列退火,即制成条形码接头和通用接头。退火体系为:100μM oligo15μL,100μM oligo25μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃ /min的速度降温,直至降到25℃,25℃保温30min。
按照如下体系制备接头混合物:通用接头3.6μL,条形码接头1.2 μL,无核酸酶水195.2μL,总体系200μL。
4、DNA酶切
采用EcoRI酶和MspI酶对基因组进行双酶切,酶切体系如下:基因组DNA 200ng,EcoRI酶0.5μL,MspI酶0.5μL,10×CutSmart Buffer 2μL,无核酸酶水13μL,总体系为20μL。酶切体系经混匀后,置于PCR 仪中反应,PCR程序为:37℃90min,65℃30min,4℃forever。
5、连接接头
连接体系如下:酶切产物20μL,5×DNA Ligase Reaction Buffer 8μL,DNA连接酶2μL,无核酸酶水5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃1hour,65℃30min,4℃forever。
6、连接产物混合
从每个个体的连接产物中分别取出5μL,共120μL,混匀。
7、连接产物纯化
(1)向连接产物中加入1.2-1.4倍体积的AMPure XP Beads,置于旋转仪上,室温孵育20min;
(2)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;
(3)重复步骤(2)一次;
(4)加入150μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;
(5)向连接产物中加入0.8-0.9倍体积的AMPure XP Beads,置于旋转仪上,室温孵育15min;
(6)加入500μL70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;
(7)重复步骤(6)一次;
(8)加入50μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;
8、PCR扩增
PCR反应体系为:高保真PCR预混液50μL,连接产物0.5μL,10μM PCR引物oligo11.2μL,10μM PCR引物oligo21.2μL,无核酸酶水 7.1μL;PCR反应程序为:95℃5min,17cycles×(95℃30s,62℃ 30s,68℃30s),72℃5min,4℃forever。
9、PCR产物纯化
(1)向连接产物中加入1.2-1.4倍体积的AMPure XP Beads,置于旋转仪上,室温孵育20min;
(2)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;
(3)重复(2)一次;
(4)加入150μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;
(5)向连接产物中加入0.8-0.9倍体积的AMPure XP Beads,置于旋转仪上,室温孵育15min;
(6)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;
(7)重复(6)一次;
(8)加入50μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;
10、文库质检
文库通过2100检测片段大小(图1),文库大小为280bp-1000bp,通过对大片段和小片段DNA去除的干净程度判断该文库合格,适用于上机测序。
11、文库测序
本发明利用Illumina二代测序平台的Hiseq2000进行测序,采用单端100bp测序试剂盒。
12、实验结果
测序共得到56,960,040条reads,每个个体平均3.5M reads;利用Tassel软件包(版本4,所有参数为默认参数)分析,共得到238,344 个SNP,高于目前的商业化芯片Porcine60K上的SNP数目,可见本发明具有很大的商业优势。表3为本发明所获得SNP在每条染色体上的分布情况,由表中可知,SNP在各个染色体上的分布相对均匀,平均分布距离为11.89kb。
表3SNP在染色体上的分布统计
染色体号 | 染色体长度 | SNP数目 | SNP间平均距离(kb) |
1 | 315,321,322 | 20078 | 15.70 |
2 | 162,569,375 | 14009 | 11.60 |
3 | 144,787,322 | 14826 | 9.77 |
4 | 143,465,943 | 13978 | 10.26 |
5 | 111,506,441 | 10905 | 10.23 |
6 | 157,765,593 | 16554 | 9.53 |
7 | 134,764,511 | 15220 | 8.85 |
8 | 148,491,826 | 12956 | 11.46 |
9 | 153,670,197 | 14996 | 10.25 |
10 | 79,102,373 | 11436 | 6.92 |
11 | 87,690,581 | 9961 | 8.80 |
12 | 63,588,571 | 9318 | 6.82 |
13 | 218,635,234 | 14669 | 14.90 |
14 | 153,851,969 | 14846 | 10.36 |
15 | 157,681,621 | 11591 | 13.60 |
16 | 86,898,991 | 8334 | 10.43 |
17 | 69,701,581 | 8511 | 8.19 |
18 | 61,220,071 | 7932 | 7.72 |
X | 144,288,218 | 8224 | 17.54 |
Y | 1,637,716 | 47 | 34.85 |
总计 | 2,596,656,069 | 238,344 | 11.89 |
实验结果表明本发明所提供的方法中所使用的EcoRI-MspI酶切组合适用于所有的猪品种,利用该组合进行简化基因组测序,能够得到高于目前市场已有芯片上的SNP数目,能够用于全基因关联分析研究和基因组选择研究,同时还能保证单个个体的分型成本低于目前流行的芯片。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (1)
1.一种基于测序基因分型技术的猪SNP标记位点的分析方法,其特征在于,包括以下步骤:
(1)预测用EcoRI与MspI的双酶切猪基因组所获得的酶切片段分布情况;
(2)根据EcoRI与MspI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;
(3)构建简化基因组测序文库;
(4)利用步骤(3)构建的文库进行上机测序;
(5)根据测序结果获得SNP标记位点;
步骤(2)中所述的通用接头带有与限制性内切酶MspI相同的粘性末端序列,所述的条形码接头带有与限制性内切酶EcoRI相同的粘性末端序列;
所述通用接头是由SEQ ID NO:1和SEQ ID NO:2所示序列退火形成的双链DNA,其中SEQID NO:1经过5’磷酸化修饰;
所述条形码接头是由SEQ ID NO:3和SEQ ID NO:4所示序列退火形成的双链DNA;其中SEQ ID NO:4经过5’磷酸化修饰,SEQ ID NO:3和SEQ ID NO:4中的n和m表示长度为5-9bp的任意短核苷酸条形码序列;
步骤(2)所述的PCR扩增引物如SEQ ID NO:5和SEQ ID NO:6所示;
步骤(3)中包括以下步骤:
(a)利用限制性内切酶组合EcoRI-MspI对猪基因组进行酶切;
(b)制备通用接头和条形码接头;
(c)将通用接头和条形码接头按一定比例混合以形成接头混合物,然后将其与酶切产物进行连接反应,获得连接产物;
(d)将连接产物等比例进行混池,获得混池后的连接产物;
(e)在混池后的连接产物中加入1.2-1.4倍体积的磁珠进行第一纯化获得第一纯化产物;
(f)在所述第一纯化产物中加入0.8-0.9倍体积的磁珠进行第二纯化获得第二纯化产物;
(g)对第二纯化产物进行PCR扩增获得PCR产物;
(h)在PCR产物中加入1.2-1.4倍体积的磁珠进行第三纯化获得第三纯化产物;
(i)在第三纯化产物中加入0.8-0.9倍体积的磁珠进行第四纯化获得简化基因组测序文库;
所述第一纯化和第三纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育18-22min获得孵育后体系;孵育结束后在孵育后体系中加入0.9-1.1倍体积的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,再重复此步骤一次获得沉淀;其中,相对于100μL所述孵育后体系,每次添加的70%乙醇的量为90-110μL;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为140-160μL;
第二纯化和第四纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育13-16min;孵育结束后加入0.9-1.1倍体积的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为30-50μL;
步骤(b)中所述的通用接头的退火体系为:100μM SEQ ID NO:1 5μL;100μM SEQ IDNO:2 5μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min的速度降温至25℃,25℃保温30min后于4℃保存;
条形码接头的退火体系为:100μM SEQ ID NO:3 5μL;100μM SEQ ID NO:4 5μL,5×Annealing Buffer 10μL,无核酸酶水30μL;反应程序为:95℃3min,以1℃/min的速度降温,直至降到25℃,25℃保温30min后于4℃保存;
步骤(c)中所述的连接反应的体系为:酶切产物20μL,5×DNA Ligase ReactionBuffer 8μL,DNA连接酶2μL,无核酸酶水5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃保温1h,65℃保温30min,降温至4℃保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510669935.3A CN106566872B (zh) | 2015-10-13 | 2015-10-13 | 基于测序基因分型技术的猪snp标记位点的分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510669935.3A CN106566872B (zh) | 2015-10-13 | 2015-10-13 | 基于测序基因分型技术的猪snp标记位点的分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106566872A CN106566872A (zh) | 2017-04-19 |
CN106566872B true CN106566872B (zh) | 2018-08-14 |
Family
ID=58508384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510669935.3A Active CN106566872B (zh) | 2015-10-13 | 2015-10-13 | 基于测序基因分型技术的猪snp标记位点的分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106566872B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108559743A (zh) * | 2017-08-21 | 2018-09-21 | 上海派森诺生物科技股份有限公司 | 一种新型gbs的建库接头结构 |
CN108130323A (zh) * | 2017-12-20 | 2018-06-08 | 奥明(杭州)基因科技有限公司 | 一种适用于植物转座酶可接近性染色质分析的建库方法 |
CN111961707B (zh) * | 2020-10-14 | 2021-01-15 | 苏州贝康医疗器械有限公司 | 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102877136A (zh) * | 2012-09-24 | 2013-01-16 | 上海交通大学 | 基于基因组简化与二代测序dna文库构建方法及试剂盒 |
-
2015
- 2015-10-13 CN CN201510669935.3A patent/CN106566872B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102877136A (zh) * | 2012-09-24 | 2013-01-16 | 上海交通大学 | 基于基因组简化与二代测序dna文库构建方法及试剂盒 |
Non-Patent Citations (10)
Title |
---|
A Robust, Simple Genotyping-by-Sequencing (GBS) Approach for High Diversity Species;Robert J. Elshire等;《PLOS ONE》;20110504;第6卷(第5期);e19379 * |
Agencourt AMPure XP Information For Use Guide;Beckman Coulter;《www.beckmancoulter.com》;20130831;第3-6页 * |
An Efficient Genotyping Method in Chicken Based on Genome Reducing and Sequencing;Rongrong Liao等;《PLOS ONE》;20150827;第10卷(第8期);e0137010,摘要,第2页最后1段至第4页第4段 * |
Design of a High Density SNP Genotyping Assay in the Pig Using SNPs Identified and Characterized by Next Generation Sequencing Technology;Antonio M. Ramos等;《PLoS ONE》;20090805;第4卷(第8期);e6524 * |
Development of High-Density Genetic Maps for Barley and Wheat Using a Novel Two-Enzyme Genotyping-by-Sequencing Approach;Jesse A. Poland等;《PLoS ONE》;20120228;第7卷(第2期);e32253,摘要,第1页右栏最后1段,第2页图1、左栏第1段、右栏第1段,"Text S1 Genotyping-by-sequencing protocol for PstI-MspI" * |
Genome-wide genetic marker discovery and genotyping using next-generation sequencing;John W. Davey等;《NATURE REVIEWS》;20110731;第12卷;499-509 * |
Genotyping by Genome Reducing and Sequencing for Outbred Animals;Qiang Chen等;《PLOS ONE》;20130718;第8卷(第7期);e67500 * |
Genotyping-by-Sequencing (GBS): A Novel, Efficient and Cost-Effective Genotyping Method for Cattle Using Next-Generation Sequencing;Marcos De Donato等;《PLOS ONE》;20130517;第8卷(第5期);e62137 * |
Inexpensive Multiplexed Library Preparation for Megabase-Sized Genomes;Michael Baym等;《PLOS ONE》;20150522;第10卷(第5期);e0128036,第3页图2,第5页"Module 4",第6页第3-4段 * |
Mining conifers’ mega-genome using rapid and efficient multiplexed high-throughput genotyping-by-sequencing (GBS) SNP discovery platform;Charles Chen等;《Tree Genetics & Genomes》;20130914;第9卷;1537-1544 * |
Also Published As
Publication number | Publication date |
---|---|
CN106566872A (zh) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104805099B (zh) | 一种安全编码Cas9蛋白的核酸分子及其表达载体 | |
Sucher et al. | DNA fingerprinting, DNA barcoding, and next generation sequencing technology in plants | |
CN105238859B (zh) | 一种获取鸡全基因组高密度snp标记位点的方法 | |
CN102877136B (zh) | 基于基因组简化与二代测序dna文库构建方法及试剂盒 | |
CN105368930B (zh) | 测序基因分型技术中测序酶切组合的确定方法 | |
CN101696452A (zh) | 一种鸡隐性白羽基因的分子鉴定方法 | |
WO2020118883A1 (zh) | 一种梅花垂枝性状紧密连锁的snp分子标记及其检测方法与应用 | |
CN105256035B (zh) | 用于鉴别金华两头乌和杜洛克猪遗传背景的分子标记及其应用 | |
CN104561306B (zh) | 一种与猪眼肌面积性状有关的猪unc13b基因snp标志物 | |
CN106520943A (zh) | 一种与加系杜洛克背膘厚相关的snp位点及其应用 | |
CN108624670A (zh) | 一种快速鉴定三疣梭子蟹遗传性别的分子标记Marker Sex 1及鉴定方法 | |
CN106566872B (zh) | 基于测序基因分型技术的猪snp标记位点的分析方法 | |
CN107267627A (zh) | 与猪生产性状相关的Six1基因分子标记的制备与应用 | |
CN106906303A (zh) | 一个影响猪肉品质性状的snp标记及其应用 | |
CN112695125B (zh) | 一种卡特兰属ssr分子标记引物组合物及其应用 | |
CN110541041A (zh) | 与中国家马矮小性状相关的snp标记及其应用 | |
CN106636346A (zh) | 与加系杜洛克猪日增重相关的snp分子标记及其应用 | |
CN109825600A (zh) | 一种与苏淮猪肌肉滴水损失相关的snp标记及检测方法 | |
CN106191253B (zh) | 基于gbs技术的北京鸭简化基因测序方法 | |
CN107779517A (zh) | 一种影响杜洛克种猪瘦肉率性状的分子标记及其应用 | |
CN107254542A (zh) | 西瓜肉色性状主效基因位点及其InDel分子标记和应用 | |
CN115852033B (zh) | 提高稻米品质的gs3基因和gw5基因的分子标记 | |
CN109439763B (zh) | 一种鉴定817肉鸡和黄脚土鸡的分子标记及应用 | |
CN108642209B (zh) | 一种小麦植株千粒重判断标记及其应用 | |
CN104109669B (zh) | 猪ampd1基因启动子区域snp作为猪胴体性状的遗传标记及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240621 Address after: 511466 1205, Floor 12, Building 9 (Building 8), No. 6, Nanjiang Second Road, the Pearl River Street, Nansha District, Guangzhou, Guangdong Patentee after: Guangzhou Tian Derivatives Technology Co.,Ltd. Country or region after: China Address before: 100193 No. 2 Old Summer Palace West Road, Beijing, Haidian District Patentee before: CHINA AGRICULTURAL University Country or region before: China |