CN112522382A - 一种基于液相探针捕获的y染色体测序方法 - Google Patents
一种基于液相探针捕获的y染色体测序方法 Download PDFInfo
- Publication number
- CN112522382A CN112522382A CN202011530843.4A CN202011530843A CN112522382A CN 112522382 A CN112522382 A CN 112522382A CN 202011530843 A CN202011530843 A CN 202011530843A CN 112522382 A CN112522382 A CN 112522382A
- Authority
- CN
- China
- Prior art keywords
- dna
- probe
- sequencing
- fragments
- chromosome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000523 sample Substances 0.000 title claims abstract description 65
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 46
- 210000002593 Y chromosome Anatomy 0.000 title claims abstract description 38
- 239000007791 liquid phase Substances 0.000 title claims abstract description 13
- 239000012634 fragment Substances 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims abstract description 22
- 238000009396 hybridization Methods 0.000 claims abstract description 9
- 230000003321 amplification Effects 0.000 claims abstract description 7
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 7
- 230000008439 repair process Effects 0.000 claims abstract description 5
- 108020004414 DNA Proteins 0.000 claims description 111
- 239000011324 bead Substances 0.000 claims description 44
- 239000000203 mixture Substances 0.000 claims description 9
- 238000013467 fragmentation Methods 0.000 claims description 5
- 238000006062 fragmentation reaction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 4
- 238000003776 cleavage reaction Methods 0.000 claims description 4
- 230000007017 scission Effects 0.000 claims description 4
- 108010090804 Streptavidin Proteins 0.000 claims description 3
- 102000053602 DNA Human genes 0.000 claims description 2
- 102000008579 Transposases Human genes 0.000 claims description 2
- 108010020764 Transposases Proteins 0.000 claims description 2
- 229960002685 biotin Drugs 0.000 claims description 2
- 235000020958 biotin Nutrition 0.000 claims description 2
- 239000011616 biotin Substances 0.000 claims description 2
- 108091008146 restriction endonucleases Proteins 0.000 claims description 2
- 230000035772 mutation Effects 0.000 abstract description 9
- 238000012360 testing method Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 6
- 210000001182 human Y chromosome Anatomy 0.000 abstract description 3
- 239000000243 solution Substances 0.000 description 24
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- 239000006228 supernatant Substances 0.000 description 16
- 108091092878 Microsatellite Proteins 0.000 description 14
- 238000013461 design Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 239000000047 product Substances 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 238000002156 mixing Methods 0.000 description 6
- 230000008775 paternal effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000010009 beating Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1003—Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
- C12N15/1006—Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
- C12N15/1013—Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers by using magnetic beads
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种基于液相探针捕获的Y染色体测序方法,包括如下步骤:S1.提取基因组DNA并片段化;S2.对片段化的DNA进行末端修复;S3.在DNA片段两端加上测序接头并纯化连接产物;S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化;S5.文库质量控制;S6.探针区域的挑选及优化,并设计局部密集式探针;S7.将DNA文库和探针进行文库杂交反应,捕获目标DNA片段;S8.将捕获的目标DNA片段进行分离;S9.对分离后的目标DNA片段进行高通量测序。本发明利用液相探针捕获技术,通过对探针区域进行挑选与优化,对Y染色体的测序长度更长,就能够测试到更多的突变,实现了人类Y染色体20M区域的捕获测序。
Description
技术领域
本发明涉及生物技术领域,更具体地,涉及一种基于液相探针捕获的Y染色体测序方法。
背景技术
Y染色体为男性特有,具有父系遗传的特点。Y染色体特异性区(非重组区)由于不会和X染色体发生重组,所以呈现出稳定的单倍型父系遗传,具有高度的保守性和特异性,遗传过程中的序列改变仅由突变引起,因此,进行Y染色体全序列测试,可以获得以下信息:1)发现父系家族特有的Y-SNP标记位点;2)精确计算父系家族内近几百年以来的精确分化时间;3)确定宗亲关系,明确家族内各支系的脉络,解决家谱中的模糊或错误描述,完善家谱信息,还原家族历史上迁徙与发展历史。因此,对Y染色体进行测序,可应用于与男性相关的司法鉴定,如家系排查,父系追溯等,具有非常重要的法医学应用的价值。
当前法医Y染色体检测主要为已知的STR(短串联重复序列)和SNP(单核苷酸多态性)分型:具体包括(1)基于Sanger测序的STR和SNP分型,其原理是在DNA合成过程中掺入ddNTP,产生一系列末端终止的DNA链,之后通过凝胶电泳分离大小不同的片段,最后可用X-光胶片放射自显影或非同位素标记进行检测。(2)基于二代测序的STR和SNP分型,其主要原理为:①STR和SNP位点捕获。二代测序法目前主要采用多重PCR的方法同时对多个位点进行捕获,同时对≤1000位点进行分型,从而实现对目标STR和SNP位点的特异性捕获。②样本标签的添加。在多重PCR完成第一轮多位点捕获扩增后,需要在第一轮PCR产物的基础上添加样本标签及测序接头,而后进行第二轮PCR。③测序和结果判读。上机测序后,每个样本的同一个STR和SNP位置可以读到数百条reads,并且能够清晰看到每条序列的具体信息,通过对于位点的聚类分析,实现位点基因型的判断。还有一些基于二代测序的Y染色体商业化服务。其中,Family Tree DNA(ftDNA)提供的“Big Y”测试服务,约检测Y染色体11-14M bp的区域,测试深度为55-80X。FGC提供“Y-Elite”测试服务,约测12-16M bp的区域,测试深度为40-80X。
由于当前法医Y染色体检测主要是基于已知的STR和SNP分型,并不能满足实际检测的精度要求。具有以下缺点:①没有考虑到其他具有区分能力的STR和SNP位点,无法探寻未知信息。检测结果虽然可以给出已知的、上游的单倍群的判断,但无法得知更加精细的下游未知的位点的信息,因此只能得到非常粗糙的父系类型信息。②随着学术和商业研究不断发现新的位点,基于之前检测得到的结果与信息就需要再次更新,芯片也要不断重新升级;③检测过程中,设计进去的位点过多,可能会出现彼此干扰的现象,导致测试结果自相矛盾。例如专利CN106399543A公开了基于74个Y染色体SNP遗传标记的法医学二代测序试剂盒,专利CN110846420A公开了一种快速突变Y染色体STR分型系统、下一代测序分型试剂盒及分型方法和应用等,所述的Y染色体测序均主要是基于已知的STR和SNP分型,测序所包含的区域较小,无法达到法医学精细谱系研究的目的,且检测成本高。而目前基于二代测序的商业化试剂盒,具有以下缺点:①测序的区域较小,不能发现更多属于自身家族独有的私有位点,无法区分家族内部的不同分支,世代估计的误差较大,无法满足实际的精度要求。②检测成本高,高度依赖于进口的测序平台及相关试剂,价格昂贵。
因此,亟需开发一种对Y染色体的测序长度更长,能发现更多具有区分能力的STR和Y-SNP位点,测序所包含的区域更大,以满足法医学精细谱系研究的需求的Y染色体测序方法。
发明内容
本发明的目的在于克服现有技术中存在的上述缺陷和不足,提供一种基于液相探针捕获的Y染色体测序方法。
本发明的上述目的是通过以下技术方案给予实现的:
一种基于液相探针捕获的Y染色体测序方法,包括如下步骤:
S1.提取基因组DNA,将基因组DNA进行片段化;
S2.对片段化的双链DNA进行末端修复,DNA片段的3’末端加碱基A;
S3.在DNA片段两端加上测序接头并纯化连接产物以除去未连接的接头序列;
S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化;
S5.文库质量控制;
S6.探针区域的挑选及优化,并设计局部密集式探针;
S7.将步骤S5的DNA文库和步骤S6的探针进行文库杂交反应,捕获目标DNA片段;
S8.将捕获的目标DNA片段进行分离;
S9.对分离后的目标DNA片段进行高通量测序;
其中,步骤S6所述探针区域的挑选及优化为获得hg38版本的Y染色体参考序列,以70bp为截取长度,35bp为滑动窗口,获得重叠覆盖整个NRY区域的70bp单位片段,然后分别用BWA-backtrack、BWA-SW、BWA-MEM和bowtie2四种方法,将所有片段mapping回hg38的参考基因组,接着根据所有片段mapping到Y染色体的唯一性、质量和使用不同mapping方法的一致性,对片段进行评分分级,最后剔除评分最差的片段,把剩余片段进行拼接,得到用于捕获测序的候选区域;
所述局部密集式探针为交错式设计。
本发明首先对探针区域进行挑选和优化,探针区域的设计去掉了Y染色体的重组区,但是对于剩下的20M区域,还有某些区域为高GC、自我重复和回文、插入和缺失区域,传统的探针设计采用的叠瓦式设计,为2X探针平铺,而本发明采用交错设计探针,对于这些复杂结构,针对性增加了探针密度,使最终捕获产物的均一性和覆盖度达到最优,再利用探针和DNA文库杂交,杂交过程中,通过核酸序列的互补结合的原理,探针会和目标DNA片段进行结合,最后将捕获的目标DNA片段分离出来,进行测序,获得测序长度更长,近20M的Y染色体区域。所获得的测序的长度接近于Y染色体上可以利用的区域的极限,能够测试到更多的突变,从而能更精确地计算不同分支之间的分化时间。粗略估计,大约可以检测到每2~3代人之间发生的突变,相当于每70年左右发生的突变,这已经是接近Y染色体突变速率的极限。本发明的关键在于获得用于捕获测序的候选区域,在获得候选区域后,按照交错设计探针的原则,设计探针即可,对于具体的探针序列不做限制。
具体地,步骤S1所述基因组DNA来源于人类。
优选地,步骤S1所述DNA片段化为超声随机打断、转座酶酶切或限制性内切酶酶切。
进一步优选地,所述DNA片段化为超声随机打断。
优选地,步骤S6所述密集式探针带有生物素标记。
优选地,步骤S7所述捕获目标DNA片段为将结合了链霉亲和素的磁珠与杂交混合液进行混合,将要捕获的目标片段通过探针间接地结合到磁珠上。
优选地,步骤S8所述分离为将目标DNA片段洗脱下来。
优选地,在分离得到目标DNA片段后,还包括对捕获后的文库进行扩增,再进行高通量测序。
优选地,所述探针包括SEQ ID NO:1~SEQ ID NO:68。
优选地,步骤S9所述高通量测序为DNB测序技术。
与现有技术相比,本发明具有以下有益效果:
本发明基于液相探针捕获技术,首先对探针区域进行挑选和优化,再采用新的探针引物设计方式设计捕获探针,实现了人类Y染色体近20M区域的捕获测序,本发明测序的长度接近于Y染色体上可以利用的区域的极限,能够测试到更多的突变,能发现更多具有区分能力的STR和Y-SNP位点,从而能更精确地计算不同分支之间的分化时间,为法医学研究中关于新的遗传标记筛选和实现样本间的世代推算提供了新的思路和方案。
附图说明
图1为本发明基于基于DNB技术的Y染色体液相探针捕获测序方法的流程示意图。
图2为本发明探针设计示意图。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下实施例所用试剂和材料均为市购。
实施例1
一种基于DNB技术的Y染色体液相探针捕获测序方法,其操作流程如图1所示。主要步骤如下:
一、方法
1)基因组DNA片段化-Covaris打断仪
1.检查Covaris水槽中注入新的去离子水的液面在12刻度水平,确保水面没过打断管玻璃部分。
2.设置冷却温度在2℃~5℃之间,确保使用时温度显示水温在5℃。
3.使用前最少30min打开控制面板上的排气按钮,参考Covaris仪器使用说明进行实验操作。
4.在1.5mL的PCR管中将样品使用1×Low TE Buffer稀释为35μL(200ng)。
5.将稀释好的样品小心的加入打断管中,避免过程中出现气泡,将打断管放入打断仪中,推荐参数设定如下表所示,(也可根据仪器型号调整)。
6.取1μL样品使用Agilent 2100(DNA1000 Assay)进行片段检测正常打断后样品检测主峰约在150bp-200bp。
2)DNA文库构建
Step 1末端修复/dA尾添加
1.将下表中各试剂解冻后,颠倒混匀,置于冰上备用。
2.于无菌PCR管中配制如下反应体系:
3.使用移液器轻轻吹打或振荡混匀,并短暂离心将反应液离心至管底。
4.将上述PCR管置于PCR仪,设置表5所示反应程序,进行末端修复/dA尾添加反应(热盖105℃)。
Step 2接头连接
1.根据Input DNA量,稀释Adapter至合适浓度。
2.将下表中各试剂解冻后颠倒混匀,置于冰上备用。
3.于Step 1步骤产物PCR管中配制下表所示反应体系。
4.使用移液器轻轻吹打或振荡混匀,并短暂离心将反应液收集至管底。
5.将PCR管置于PCR仪中,设置下表所示反应程序,进行接头连接反应(热盖105℃)。
Step 3连接产物纯化
注意:在开始操作前,请确认Agencourt AMPure XP磁珠已平衡至室温。
1.配置0.8X磁珠纯化体系。
2.轻轻吸打混匀6次室温静置孵育5min将PCR管置于磁力架上3min使溶液澄清。
3.移除上清,PCR管继续放置在磁力架上向PCR管内加入200μL 80%乙醇溶液,静置30s。
4.移除上清,再向PCR管内加入200μL 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μL移液器移除底部残留乙醇溶液)。
5.室温静置35min,使残留乙醇彻底挥发。
6.加入22μL的Nuclease-free water把PCR管从磁力架取下,轻轻吸打重悬磁珠,避免产生气泡,室温静置2min。
7.将PCR管置于磁力架上2min使溶液澄清。
8.用移液器吸取20μL上清液,转移到新的PCR管中(置于冰盒上),在反应管上标记样本编号,准备下一步反应。
Step 4文库扩增
1.配置如下反应体系
2.使用移液器轻轻吹打10次混匀反应液,并短暂瞬时离心将反应液收集至管底。
3.按下表所示程序,进行PCR反应(热盖105℃)。
Step 5扩增产物磁珠纯化
注意:在开始操作前,请确认Agencourt AMPure XP磁珠已平衡至室温。
1.配置0.9X磁珠纯化体系。
2.充分涡旋混匀混有连接产物和磁珠的0.2mL离心管,室温孵育5min。
3.将0.2mL离心管至于磁力架上孵育,直至溶液澄清,并小心移除上清。
4.保持0.2mL离心管始终置于磁力架中,加入100μL 80%乙醇漂洗磁珠,室温孵育30sec后,小心移除80%乙醇。
5.重复1次80%乙醇清洗磁珠。
6.保持0.2mL离心管始终置于磁力架中,室温干燥磁珠3-5min。
7.从磁力架上取下0.2mL离心管,加入22μL Nuclease-Free Water充分重悬磁珠,室温静置5min。
8.将0.2mL离心管置于磁力架中静置,待溶液澄清后,小心移取20μL上清至新0.2mL离心管中。纯化后的DNA文库可在4℃条件下放置一周,或在-20℃条件下长期保存。
Step 6文库质量控制
通常情况下,构建好的文库可通过浓度检测和长度分布检测来进行质量评价。
3)DNA文库杂交捕获
Step 1探针区域的挑选及优化
为了获得最优的测序区域,本发明重新评估了Y染色体非重组区(NRY区域)。首先,获得hg38版本的Y染色体参考序列,以70bp为截取长度,35bp为滑动窗口,获得重叠覆盖整个NRY区域的70bp单位片段。然后,分别用BWA-backtrack、BWA-SW、BWA-MEM和bowtie2四种方法,将所有片段mapping回hg38的参考基因组。接着,根据所有片段mapping到Y染色体的唯一性、质量和使用不同mapping方法的一致性,对片段进行评分分级。最后,剔除评分最差的片段,把剩余片段进行拼接,就得到了用于捕获测序的候选区域。
Step 2局部密集式探针设计方案:基于液相探针捕获技术
相比传统探针的设计为叠瓦式设计,本发明采用交错设计,如图2所示。针对上述获得的候选区域进行探针设计,针对某些高GC、高重复和回文结构等区域,重点增加探针,提高捕获效率。其中,所述探针包括SEQ ID NO:1~SEQ ID NO:68;
Step 3进行文库杂交反应
1.将下述试剂在0.2mL离心管混合。
2.漩涡混匀上述封闭反应体系,瞬时离心,将所有名称收集到管底。
3.将离心管冷冻浓缩,蒸干反应液。
4.向含有已干燥DNA的管中依次加入以下试剂。
5.涡旋振荡器振荡混匀,室温孵育5-10min,涡旋振荡器振荡混匀并瞬时离心。
6.将0.2mL离心管放置于PCR仪上,按如下程序进行孵育。
7.立即将0.2mL离心管放置于一台热盖温度已经达到75℃的PCR仪中,4h或者过夜杂交。
Step 4清洗链霉亲和素磁珠
注意:清洗磁珠前确认DynabeadsTM M-270Streptavidin(ProbeCap SA Beads)磁珠已经平衡至室温。
1.涡旋振荡15sec充分混匀磁珠。
2.转移100μL的ProbeCap SA Beads至新的1.5mL的离心管中。
3.将离心管放置在磁力架上,使磁珠与溶液彻底分离。
4.去除上清,保留磁珠。
5.进行如下清洗:
①向磁珠中加150μL的1X BWB,涡旋振荡10sec。
②离心管转移至磁力架上,磁珠与溶液完全分离。
③小心去上清。
6.重复上述第5步,共清洗两次。
7.然后加入100μL的1X BWB溶液,涡旋混匀30s。
8.将磁珠、1X BWB混合液转移至新的0.2mL离心管中。
9.用磁力架吸附磁珠,去除上清保留磁珠,马上进行Step3,避免磁珠在空气中过度暴露。
Step 5进行磁珠捕获
1.将Step2.9的0.2mL离心管放于已经预热到65℃的PCR仪中。
2.将Step1.8中在65度杂交的杂交液16μL全部转移至Step2.9制备的0.2mL离心管中。
3.用移液器反复吸打溶液10次,充分混匀。
4.按如下程序进行孵育。
5.每10min从PCR仪取出0.2mL离心管振荡5sec,温和重悬反应液,再放入PCR仪器进行反应。
Step 6清洗
注意:确保足量的1X W I,1X W II,1X W III已平衡至室温。
1.提前至少30min将PCR仪加热至65℃,取300μL/反应的1X S-W和125μL/反应的1XWI分别装进新的0.2mL离心管中,这两样清洗液在65℃PCR仪上放置至少10min。
2.向Step3.5的0.2mL离心管中加入120μL 65℃预热的1X WI,涡旋振荡混匀3sec。
3.将0.2mL离心管放在磁力架上,磁珠与溶液完全分离。
4.将0.2mL离心管中放入PCR仪器预热:65℃,10~20sec。
5.迅速放回磁力架,澄清后,尽快去上清。
6.热清洗。
①向0.2mL离心管中中加入140μL 65℃预热的1X S-W,缓慢吸打10次,避免产生气泡。
②将0.2mL离心管中放置于PCR仪进行温浴并准确定时:65℃,5min。
③将0.2mL离心管中放置于磁力架上2min,用移液器迅速去上清。
7.重复步骤6一次,总共热清洗磁珠两次。
8.室温清洗。
①取140μL室温的1X WI,加入将0.2mL离心管中。漩涡30s间隔4次共振荡2min,充分悬浮磁珠。
②将0.2mL离心管中放置于磁力架上1min,用移液器迅速去上清。
③加140μL室温的1X WII,加入将0.2mL离心管中,漩涡30s间隔2次共振荡1min,充分悬浮磁珠。
④将0.2mL离心管中置于磁力架上2min,快速去除上清。
⑤加入140μL室温的1X WIII,加入将0.2mL离心管中,漩涡振荡30s,将磁珠充分悬浮。
⑥将混匀悬液转移至新0.2mL离心管中,置于磁力架上,使磁珠与溶液完全分离,去上清。
9.重悬磁珠
①加25μL Nuclease-Free Water,将0.2mL离心管中从磁力架上移开。
②使用移液器反复吸打10次,保证所有磁珠充分重悬。
Step 7捕获后文库扩增
1.按下表所示配制PCR反应体系。
2.涡旋振荡3sec,轻甩或瞬时离心,保证磁珠仍悬浮于溶液中。
3.将0.2mL离心管放入PCR仪中,热盖温度105℃,按照如下程序进行PCR扩增。
Step 8纯化捕获后PCR产物
1.配置1.0X磁珠纯化体系。
2.充分涡旋混匀混有PCR产物和磁珠的0.2mL离心管,室温孵育5min。
3.将0.2mL离心管至于磁力架上孵育,直至溶液澄清,并小心移除上清.
4.保持0.2mL离心管始终置于磁力架中,加入100μL 80%乙醇漂洗磁珠,室温孵育30sec后,小心移除80%乙醇。
5.保持0.2mL离心管始终置于磁力架中,室温干燥磁珠3-5min。
6.从磁力架上取下0.2mL离心管,加入30μL Nuclease-Free Water充分重悬磁珠,室温静置5min。
7.将0.2mL离心管置于磁力架中静置,待溶液澄清后,小心移取28μL上清至新0.2mL离心管中。纯化后的DNA文库可在4℃条件下放置一周,或在-20℃条件下长期保存。
4)利用二代测序(华大二代测序仪的DNB测序技术)平台进测序,进行结果分析。
二、结果
本发明通过上述方法,通过对Y染色体的探针区域进行挑选和优化,再采用新的探针引物设计方式设计捕获探针,实现了人类Y染色体近20M区域的捕获测序,所述探针位置与和测序结果如表1所示:
本发明测序的长度接近于Y染色体上可以利用的区域的极限,能够测试到更多的突变,能发现更多具有区分能力的STR和Y-SNP位点。
表1
序列表
<110> 广州深晓基因科技有限公司
<120> 一种基于液相探针捕获的Y染色体测序方法
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 75
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 1
gttggacatt taggttggtt ccaagtcttt gctattgtga ataatgccgc aataaacata 60
catgtgcatg tgtct 75
<210> 2
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 2
ttgggcagta tggccatttt cacgatattg attcttccta cccatgagca tggaatgttc 60
ttccatttgt ttgtatcctc ttttatttcc ttgagcagtc gtttgtagtt ctccttgaag 120
<210> 3
<211> 89
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 3
ttccatttgt ttgtatcctc ttttatttcc ttgagcagtc gtttgtagtt ctccttgaag 60
aggtccttca catctcttgt aagttggat 89
<210> 4
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 4
gaataccctt tatttccttc tcctgcctaa ttgccctggc cagaacttcc aacactatgt 60
tgaataggag tggtgagaga gggcatccct gtcttttgcc agttttcaaa gggaatgctt 120
<210> 5
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 5
tgaataggag tggtgagaga gggcatccct gtcttttgcc agttttcaaa gggaatgctt 60
ccagtttttg cccattcagt atgatattgg ctgtgggttt gtaatagata gctcttatta 120
<210> 6
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 6
ccagtttttg cccattcagt atgatattgg ctgtgggttt gtaatagata gctcttatta 60
ttttgaaata cgtcccatca atacctaatt tattgagagt ttttagcata aagtgctgtt 120
<210> 7
<211> 99
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 7
ttttgaaata cgtcccatca atacctaatt tattgagagt ttttagcata aagtgctgtt 60
gaattttgtc aaaggccttt tctgcatcta ttgagataa 99
<210> 8
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 8
attcaggaaa tacagagaac gccacaaaga tactgctcga gaagagcaac tccaagacac 60
ataattgtca gattcaccaa agttgagatg atgttactct ttttccttgg tgttttccta 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 9
ataattgtca gattcaccaa agttgagatg atgttactct ttttccttgg tgttttccta 60
aggaagcctt gtgacatatc tcaggaccca gcaccgaggt gatgtggccc ttttgcctgg 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 10
aggaagcctt gtgacatatc tcaggaccca gcaccgaggt gatgtggccc ttttgcctgg 60
tttcttccca tgtgttagac tgtgacatat acctaaagaa acacctaggt gatgccactc 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 11
tttcttccca tgtgttagac tgtgacatat acctaaagaa acacctaggt gatgccactc 60
tcttcttctt cttgagtcct gcttcaggac atagtgactc tatatacaca cctaggtaac 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 12
tcttcttctt cttgagtcct gcttcaggac atagtgactc tatatacaca cctaggtaac 60
agttaaaggt gccaccctca aagatgagca gattgtgtca tatcactggg cctagtaccc 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 13
agttaaaggt gccaccctca aagatgagca gattgtgtca tatcactggg cctagtaccc 60
agttgttaaa acttttgctt aaattatttc ttgtgtgtat tgtgacatat catgtcagaa 120
<210> 14
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 14
agttgttaaa acttttgctt aaattatttc ttgtgtgtat tgtgacatat catgtcagaa 60
tcataataat gtgacacttt tgccctggcc ctgccaacaa gagatatcat cacatatctc 120
<210> 15
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 15
tcataataat gtgacacttt tgccctggcc ctgccaacaa gagatatcat cacatatctc 60
tgagcctaac tggtaggtga tttgtctttt tcttgtgctt tgcccccaag aaatattgtg 120
<210> 16
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 16
tgagcctaac tggtaggtga tttgtctttt tcttgtgctt tgcccccaag aaatattgtg 60
atatttttgt atgtagcatc taggaaatgt atctcttctc tcttgcctag gacctcccta 120
<210> 17
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 17
atatttttgt atgtagcatc taggaaatgt atctcttctc tcttgcctag gacctcccta 60
ctaaaggaat tgtgccatac agctgagtgc aaaaccttgg tagtgcaact ttccccttta 120
<210> 18
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 18
ctaaaggaat tgtgccatac agctgagtgc aaaaccttgg tagtgcaact ttccccttta 60
ttctggagtt tgttacgaga ggggattatg acatattgct gagcccagca cctaggtgat 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 19
ttctggagtt tgttacgaga ggggattatg acatattgct gagcccagca cctaggtgat 60
gtgagtttcc tgtttttttc aaccctgtct acagtggaca tggtgccata ttacttgtgg 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 20
gtgagtttcc tgtttttttc aaccctgtct acagtggaca tggtgccata ttacttgtgg 60
ctgtatccag gtgatgtgac tctccttgct tgcccctgcc agcaaaggag ttgatagtgt 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 21
ctgtatccag gtgatgtgac tctccttgct tgcccctgcc agcaaaggag ttgatagtgt 60
atcaggagct cagcatcaag gtgatgagac tctccttcct tgtttttgcc cacaggtgaa 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 22
atcaggagct cagcatcaag gtgatgagac tctccttcct tgtttttgcc cacaggtgaa 60
attatgtcat atgcctggga tcatctcaca tgcacaatta taaccatcaa actgggaccc 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 23
attatgtcat atgcctggga tcatctcaca tgcacaatta taaccatcaa actgggaccc 60
agaaaggaga gagattttga ttcttatagc tagtcttatt gccataagta aaataatggg 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 24
agaaaggaga gagattttga ttcttatagc tagtcttatt gccataagta aaataatggg 60
tctcctaatt gtataaagtt cacagaggat tatgacactc agacatatca tataaagcct 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 25
tctcctaatt gtataaagtt cacagaggat tatgacactc agacatatca tataaagcct 60
cagtggtaaa aagagtgtca tgatagggaa gaacaacctg gggtgattgc aaatcatgga 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 26
cagtggtaaa aagagtgtca tgatagggaa gaacaacctg gggtgattgc aaatcatgga 60
ggcacaccca gctagcttga ttgtcattct tacacaagaa catggcctac aagtagggta 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 27
ggcacaccca gctagcttga ttgtcattct tacacaagaa catggcctac aagtagggta 60
ctaaatttca cacaaaagag cagtcaaagg ttgaaatttt tcccctcata cacggttcaa 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 28
ctaaatttca cacaaaagag cagtcaaagg ttgaaatttt tcccctcata cacggttcaa 60
ccccatgggt agtgtggtga tgcaatattc agcccaactg tgagattgtg actttcctac 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 29
ccccatgggt agtgtggtga tgcaatattc agcccaactg tgagattgtg actttcctac 60
tggaacataa tcttcaagtg gaactggaca acttatgcat ggatcctgtt aagactgtga 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 30
tggaacataa tcttcaagtg gaactggaca acttatgcat ggatcctgtt aagactgtga 60
gtcctcagct ttgactcaac tcacaggaga tgttgactca catgcacaaa gccaggactt 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 31
gtcctcagct ttgactcaac tcacaggaga tgttgactca catgcacaaa gccaggactt 60
gtgtagggct gtggaactta tttctgaata tttccaagtg tgtgattaga atgtagaagt 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 32
gtgtagggct gtggaactta tttctgaata tttccaagtg tgtgattaga atgtagaagt 60
tagcccagct cctgaataat ttgactctcc tttttaggcc atgaccacag ataaaattgt 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 33
tagcccagct cctgaataat ttgactctcc tttttaggcc atgaccacag ataaaattgt 60
gacatatgtg gacagtacac ctaagcaaag cttcctgggc ctgactacca aggatacttt 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 34
gacatatgtg gacagtacac ctaagcaaag cttcctgggc ctgactacca aggatacttt 60
tacatatcat tgggactagc atcaaggtga ggtgaattct ttgtcttttc cctgcctaca 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 35
tacatatcat tgggactagc atcaaggtga ggtgaattct ttgtcttttc cctgcctaca 60
aaaggcattg tggcttacag ttaagtccat catataagtt catataagtg atgtcactcc 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 36
aaaggcattg tggcttacag ttaagtccat catataagtt catataagtg atgtcactcc 60
cttctagtgc cttggccctg ctatttcagt tcattgtgac acataactgg gtactgcacc 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 37
cttctagtgc cttggccctg ctatttcagt tcattgtgac acataactgg gtactgcacc 60
caggtgatat gactctctgt ttagggttct gccagcagga agctttgtaa catatcactt 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 38
caggtgatat gactctctgt ttagggttct gccagcagga agctttgtaa catatcactt 60
agctcagcac ctagctaatg cttcttctct cttgccttgc tgtgatcaga ggggagactg 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 39
agctcagcac ctagctaatg cttcttctct cttgccttgc tgtgatcaga ggggagactg 60
tttcatattg ctaaccctag tgctgaagtc atgtcacttt cataccgtgg ttctgaacat 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 40
tttcatattg ctaaccctag tgctgaagtc atgtcacttt cataccgtgg ttctgaacat 60
agtgaacatt gtgacatgtc taggccaatt ccttaggtaa agtgagtctc ctcatcctct 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 41
agtgaacatt gtgacatgtc taggccaatt ccttaggtaa agtgagtctc ctcatcctct 60
taagatttgc tcacaggggg aattttgatt tatcactaaa accagtatcc agctgatgtg 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 42
taagatttgc tcacaggggg aattttgatt tatcactaaa accagtatcc agctgatgtg 60
agtcttattc cagggtcctg cccacaagaa agattgtgac atctcactgg accagcaccc 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 43
agtcttattc cagggtcctg cccacaagaa agattgtgac atctcactgg accagcaccc 60
acccaaatga tgtgacattt ctgtttgttc tctgcccaca ggtcatattg tgccatatac 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 44
acccaaatga tgtgacattt ctgtttgttc tctgcccaca ggtcatattg tgccatatac 60
ctaacaccac ttaagatgac taatcatgaa tttttttttt tttttttttt tttttttttt 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 45
ctaacaccac ttaagatgac taatcatgaa tttttttttt tttttttttt tttttttttt 60
ttttttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg cgggatctcg 120
<210> 46
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 46
ttttttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg cgggatctcg 60
gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc ctcccgagta 120
<210> 47
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 47
gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc ctcccgagta 60
gctgggacta caggcacccg ctaccacgcc cggctaattt tttgtatttt tagtagagac 120
<210> 48
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 48
gctgggacta caggcacccg ctaccacgcc cggctaattt tttgtatttt tagtagagac 60
ggggtttcac cgtgttagcc aggatggtct cgatctcctg acctcgtgat ccgcccgcct 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 49
ggggtttcac cgtgttagcc aggatggtct cgatctcctg acctcgtgat ccgcccgcct 60
cggcctccca aagtgctggg attacaggca tgagccactg cgcccagcct aatcatgact 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 50
cggcctccca aagtgctggg attacaggca tgagccactg cgcccagcct aatcatgact 60
tttaaacctg gatcctggtc atatgcaaga tggaaactcc cattcctgga actttccacc 120
<210> 51
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 51
tttaaacctg gatcctggtc atatgcaaga tggaaactcc cattcctgga actttccacc 60
agtgttattg tgacatatac ctttgcccgg ctcctgagtg atttaataat actgcctaat 120
<210> 52
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 52
agtgttattg tgacatatac ctttgcccgg ctcctgagtg atttaataat actgcctaat 60
tgtagccctc aaattcgatt tagacatata gttcatgtga tcacctttat gatttcactc 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 53
tgtagccctc aaattcgatt tagacatata gttcatgtga tcacctttat gatttcactc 60
tcctgtttta acaatatctt gcagaaggat tgtaacagat ttctggaccc aacatctagt 120
<210> 54
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 54
tcctgtttta acaatatctt gcagaaggat tgtaacagat ttctggaccc aacatctagt 60
tacctgacac tcctctctta cctggaccct gcttccacta tggattgtag catttctaag 120
<210> 55
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 55
tacctgacac tcctctctta cctggaccct gcttccacta tggattgtag catttctaag 60
cactacctcc aaattatatg aatctcttgc ctggtccttt caagaggaga ccttgtgaca 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 56
cactacctcc aaattatatg aatctcttgc ctggtccttt caagaggaga ccttgtgaca 60
tatctctggg cttaccattt aggtgatatg agtctcctct tctgcctgga cactgcctac 120
<210> 57
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 57
tatctctggg cttaccattt aggtgatatg agtctcctct tctgcctgga cactgcctac 60
aaggggtatt gtgttataca tgttgatgta acccctgagt tatgcaactt ttctgcccag 120
<210> 58
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 58
aaggggtatt gtgttataca tgttgatgta acccctgagt tatgcaactt ttctgcccag 60
aacatgccta caaggagaat attggaaaat ttctggctca gtatttaggt gacttgtctg 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 59
aacatgccta caaggagaat attggaaaat ttctggctca gtatttaggt gacttgtctg 60
tcatgcctgt ttcattacca cagactgaat tgtgatatat acccaagcac agctcacagg 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 60
tcatgcctgt ttcattacca cagactgaat tgtgatatat acccaagcac agctcacagg 60
catgataatg actttcttat gtggatccca caaatagaag taattttgac tctcataact 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 61
catgataatg actttcttat gtggatccca caaatagaag taattttgac tctcataact 60
tgctttagag acatgagtga ttaaatctct atctggcacc aaaaaaaaaa aaaaaaaaca 120
<210> 62
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 62
tgctttagag acatgagtga ttaaatctct atctggcacc aaaaaaaaaa aaaaaaaaca 60
aacaaaaggt caaagaagat tataatggcc tcacatattt tataaagcct ttggcttgta 120
<210> 63
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 63
aacaaaaggt caaagaagat tataatggcc tcacatattt tataaagcct ttggcttgta 60
cagagtgtca taacagaacc cagcagagag gtgaaattgt gagtctcaaa tgcacaccca 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 64
cagagtgtca taacagaacc cagcagagag gtgaaattgt gagtctcaaa tgcacaccca 60
gctgtcacta aggtctaatc accatctcac ctatatgaag ctaactgtca ctaatgaaaa 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 65
gctgtcacta aggtctaatc accatctcac ctatatgaag ctaactgtca ctaatgaaaa 60
cagcacacac gtgatactgt acacctcatc aggggaattt tctgatagtg ttattgtgat 120
<210> 66
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 66
cagcacacac gtgatactgt acacctcatc aggggaattt tctgatagtg ttattgtgat 60
ataaatcttt gttgagcacc tgtgtgattt aattctccat aattgttcca gcccacatat 120
<210> 67
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 67
ataaatcttt gttgagcacc tgtgtgattt aattctccat aattgttcca gcccacatat 60
gttattgtca tatctacctg ggccaaactc tacatgatgt gactctcctg cctaggccct 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列(Synthetic sequences)
<400> 68
gttattgtca tatctacctg ggccaaactc tacatgatgt gactctcctg cctaggccct 60
gctctcagta agaatcatga cttattacta catccagcac ctaggtcatg ttacatcttt 120
Claims (10)
1.一种基于液相探针捕获的Y染色体测序方法,其特征在于,包括如下步骤:
S1.提取基因组DNA,将基因组DNA进行片段化;
S2.对片段化的双链DNA进行末端修复,DNA片段的3’末端加碱基A;
S3.在DNA片段两端加上测序接头并纯化连接产物以除去未连接的接头序列;
S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化;
S5.文库质量控制;
S6.探针区域的挑选及优化,并设计局部密集式探针;
S7.将步骤S5的DNA文库和步骤S6的探针进行文库杂交反应,捕获目标DNA片段;
S8.将捕获的目标DNA片段进行分离;
S9.对分离后的目标DNA片段进行高通量测序;
其中,步骤S6所述探针区域的挑选及优化为获得hg38版本的Y染色体参考序列,以70bp为截取长度,35bp为滑动窗口,获得重叠覆盖整个NRY区域的70bp单位片段,然后分别用BWA-backtrack、BWA-SW、BWA-MEM和bowtie2四种方法,将所有片段mapping回hg38的参考基因组,接着根据所有片段mapping到Y染色体的唯一性、质量和使用不同mapping方法的一致性,对片段进行评分分级,最后剔除评分最差的片段,把剩余片段进行拼接,得到用于捕获测序的候选区域;
所述局部密集式探针为交错式设计。
2.根据权利要求1所述的方法,其特征在于,步骤S1所述基因组DNA来源于人类。
3.根据权利要求1所述的方法,其特征在于,步骤S1所述DNA片段化为超声随机打断、转座酶酶切或限制性内切酶切。
4.根据权利要求4所述的方法,其特征在于,步骤S1所述DNA片段化为超声随机打断。
5.根据权利要求1所述的方法,其特征在于,步骤S6所述密集式探针带有生物素标记。
6.根据权利要求5所述的方法,其特征在于,步骤S7所述捕获目标DNA片段为将结合了链霉亲和素的磁珠与杂交混合液进行混合,将要捕获的目标片段通过探针间接地结合到磁珠上。
7.根据权利要求6所述的方法,其特征在于,步骤S8所述分离为将目标DNA片段洗脱下来。
8.根据权利要求1所述的方法,其特征在于,所述探针包括SEQ ID NO:1~SEQ ID NO:68。
9.根据权利要求1所述的方法,其特征在于,步骤S8所述分离得到目标DNA片段后,还包括对捕获后的文库进行扩增,再进行高通量测序。
10.根据权利要求1所述的方法,其特征在于,步骤S9所述高通量测序为DNB测序技术。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011530843.4A CN112522382B (zh) | 2020-12-22 | 2020-12-22 | 一种基于液相探针捕获的y染色体测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011530843.4A CN112522382B (zh) | 2020-12-22 | 2020-12-22 | 一种基于液相探针捕获的y染色体测序方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112522382A true CN112522382A (zh) | 2021-03-19 |
CN112522382B CN112522382B (zh) | 2024-03-22 |
Family
ID=75002358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011530843.4A Active CN112522382B (zh) | 2020-12-22 | 2020-12-22 | 一种基于液相探针捕获的y染色体测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112522382B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113930490A (zh) * | 2021-09-27 | 2022-01-14 | 江汉大学 | 二代测序平台中利用分子特异性条形码评估str滑脱的方法及其应用 |
CN114464261A (zh) * | 2022-04-12 | 2022-05-10 | 天津诺禾致源生物信息科技有限公司 | 组装延长性染色体的方法及装置 |
CN116904583A (zh) * | 2023-09-08 | 2023-10-20 | 北京贝瑞和康生物技术有限公司 | 动态突变str和vntr基因位点的检测探针组、试剂盒及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016000267A1 (zh) * | 2014-07-04 | 2016-01-07 | 深圳华大基因股份有限公司 | 确定探针序列的方法和基因组结构变异的检测方法 |
CN105861700A (zh) * | 2016-05-17 | 2016-08-17 | 湖州昂朴医学检验有限公司 | 一种针对神经肌肉病的高通量检测方法 |
CN110714066A (zh) * | 2019-10-22 | 2020-01-21 | 福州福瑞医学检验实验室有限公司 | 一种检测诊断角膜营养不良致病基因的dna文库及其应用 |
CN111778562A (zh) * | 2020-07-08 | 2020-10-16 | 复旦大学附属华山医院 | 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用 |
-
2020
- 2020-12-22 CN CN202011530843.4A patent/CN112522382B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016000267A1 (zh) * | 2014-07-04 | 2016-01-07 | 深圳华大基因股份有限公司 | 确定探针序列的方法和基因组结构变异的检测方法 |
CN105861700A (zh) * | 2016-05-17 | 2016-08-17 | 湖州昂朴医学检验有限公司 | 一种针对神经肌肉病的高通量检测方法 |
CN110714066A (zh) * | 2019-10-22 | 2020-01-21 | 福州福瑞医学检验实验室有限公司 | 一种检测诊断角膜营养不良致病基因的dna文库及其应用 |
CN111778562A (zh) * | 2020-07-08 | 2020-10-16 | 复旦大学附属华山医院 | 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用 |
Non-Patent Citations (2)
Title |
---|
M. J. ALVAREZ-CUBERO等: "Methodology for Y Chromosome Capture: A complete genome sequence of Y chromosome using fow cytometry, laser microdissection and magnetic streptavidin-beads", SCIENTIFIC REPORTS, vol. 9436, no. 8, pages 1 - 13 * |
刘菲菲;孙明明;胡昌明;欧小华;赵薇薇;: "三种人全外显子组捕获探针的性能比较", 中华临床实验室管理电子杂志, no. 01 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113930490A (zh) * | 2021-09-27 | 2022-01-14 | 江汉大学 | 二代测序平台中利用分子特异性条形码评估str滑脱的方法及其应用 |
CN114464261A (zh) * | 2022-04-12 | 2022-05-10 | 天津诺禾致源生物信息科技有限公司 | 组装延长性染色体的方法及装置 |
CN114464261B (zh) * | 2022-04-12 | 2022-07-01 | 天津诺禾致源生物信息科技有限公司 | 组装延长性染色体的方法及装置 |
CN116904583A (zh) * | 2023-09-08 | 2023-10-20 | 北京贝瑞和康生物技术有限公司 | 动态突变str和vntr基因位点的检测探针组、试剂盒及方法 |
CN116904583B (zh) * | 2023-09-08 | 2024-02-02 | 北京贝瑞和康生物技术有限公司 | 动态突变str和vntr基因位点的检测探针组、试剂盒及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112522382B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112522382B (zh) | 一种基于液相探针捕获的y染色体测序方法 | |
CN109797436B (zh) | 一种测序文库构建方法 | |
Zhong et al. | Detection of fetal Rhesus D and sex using fetal DNA from maternal plasma by multiplex polymerase chain reaction | |
Van der Aa et al. | Preimplantation genetic diagnosis guided by single-cell genomics | |
KR102398465B1 (ko) | 종양의 심층 서열분석 프로파일링 | |
WO2018112806A1 (zh) | 将线性测序文库转换为环状测序文库的方法 | |
CN113308562A (zh) | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 | |
JPH03504324A (ja) | 遺伝子の検査方法 | |
CN111440896A (zh) | 一种新型β冠状病毒变异检测方法、探针和试剂盒 | |
CN107488725A (zh) | 适用于单细胞基因组甲基化测序的文库建立方法及其应用 | |
CN110853708B (zh) | 用于hla分型的核酸捕获探针的设计方法 | |
WO2002077286A1 (en) | Mutation detection using muts and reca | |
WO2023001212A1 (zh) | 分析绵羊产奶性能的基因芯片、分子探针组合、试剂盒及应用 | |
KR20190019049A (ko) | 대량 평행 서열분석을 위한 dna 라이브러리의 생성 방법 및 이를 위한 키트 | |
CN113249439A (zh) | 一种简化dna甲基化文库及转录组共测序文库的构建方法 | |
Kauppi et al. | Analysis of meiotic recombination products from human sperm | |
KR101735075B1 (ko) | Dmr를 이용한 돼지의 산자수 예측용 조성물 및 예측방법 | |
WO2017185758A1 (zh) | 用于微嵌合检测和个体识别的引物、探针、试剂盒及方法 | |
CN115612746A (zh) | 一种用于肉鸡亲缘关系鉴定的靶向捕获测序芯片 | |
CN110600082B (zh) | 用于hla分型的核酸捕获探针及其设计方法 | |
CN112858693A (zh) | 一种生物分子检测方法 | |
CN108707684B (zh) | 一种与谷子旗叶长性状相关的snp标记及其检测引物和应用 | |
Kiefer | Genome-wide analysis of methylation in bovine clones by methylated DNA immunoprecipitation (MeDIP) | |
CN116445478B (zh) | 一种构建ighv基因文库的引物组合及其应用 | |
CN116024324B (zh) | 基因编辑细胞脱靶检测的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |