CN112522382A

CN112522382A - 一种基于液相探针捕获的y染色体测序方法

Info

Publication number: CN112522382A
Application number: CN202011530843.4A
Authority: CN
Inventors: 文少卿; 王凌翔; 徐旭鼎; 雷波
Original assignee: Guangzhou Shenxiao Gene Technology Co ltd
Current assignee: Guangzhou Shenxiao Gene Technology Co ltd
Priority date: 2020-12-22
Filing date: 2020-12-22
Publication date: 2021-03-19
Anticipated expiration: 2040-12-22
Also published as: CN112522382B

Abstract

一种基于液相探针捕获的Y染色体测序方法，包括如下步骤：S1.提取基因组DNA并片段化；S2.对片段化的DNA进行末端修复；S3.在DNA片段两端加上测序接头并纯化连接产物；S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化；S5.文库质量控制；S6.探针区域的挑选及优化，并设计局部密集式探针；S7.将DNA文库和探针进行文库杂交反应，捕获目标DNA片段；S8.将捕获的目标DNA片段进行分离；S9.对分离后的目标DNA片段进行高通量测序。本发明利用液相探针捕获技术，通过对探针区域进行挑选与优化，对Y染色体的测序长度更长，就能够测试到更多的突变，实现了人类Y染色体20M区域的捕获测序。

Description

一种基于液相探针捕获的Y染色体测序方法

技术领域

本发明涉及生物技术领域，更具体地，涉及一种基于液相探针捕获的Y染色体测序方法。

背景技术

Y染色体为男性特有，具有父系遗传的特点。Y染色体特异性区(非重组区)由于不会和X染色体发生重组，所以呈现出稳定的单倍型父系遗传，具有高度的保守性和特异性，遗传过程中的序列改变仅由突变引起，因此，进行Y染色体全序列测试，可以获得以下信息：1)发现父系家族特有的Y-SNP标记位点；2)精确计算父系家族内近几百年以来的精确分化时间；3)确定宗亲关系，明确家族内各支系的脉络，解决家谱中的模糊或错误描述，完善家谱信息，还原家族历史上迁徙与发展历史。因此，对Y染色体进行测序，可应用于与男性相关的司法鉴定，如家系排查，父系追溯等，具有非常重要的法医学应用的价值。

当前法医Y染色体检测主要为已知的STR(短串联重复序列)和SNP(单核苷酸多态性)分型：具体包括(1)基于Sanger测序的STR和SNP分型，其原理是在DNA合成过程中掺入ddNTP，产生一系列末端终止的DNA链，之后通过凝胶电泳分离大小不同的片段，最后可用X-光胶片放射自显影或非同位素标记进行检测。(2)基于二代测序的STR和SNP分型，其主要原理为：①STR和SNP位点捕获。二代测序法目前主要采用多重PCR的方法同时对多个位点进行捕获，同时对≤1000位点进行分型，从而实现对目标STR和SNP位点的特异性捕获。②样本标签的添加。在多重PCR完成第一轮多位点捕获扩增后，需要在第一轮PCR产物的基础上添加样本标签及测序接头，而后进行第二轮PCR。③测序和结果判读。上机测序后，每个样本的同一个STR和SNP位置可以读到数百条reads，并且能够清晰看到每条序列的具体信息，通过对于位点的聚类分析，实现位点基因型的判断。还有一些基于二代测序的Y染色体商业化服务。其中，Family Tree DNA(ftDNA)提供的“Big Y”测试服务，约检测Y染色体11-14M bp的区域，测试深度为55-80X。FGC提供“Y-Elite”测试服务，约测12-16M bp的区域，测试深度为40-80X。

由于当前法医Y染色体检测主要是基于已知的STR和SNP分型，并不能满足实际检测的精度要求。具有以下缺点：①没有考虑到其他具有区分能力的STR和SNP位点，无法探寻未知信息。检测结果虽然可以给出已知的、上游的单倍群的判断，但无法得知更加精细的下游未知的位点的信息，因此只能得到非常粗糙的父系类型信息。②随着学术和商业研究不断发现新的位点，基于之前检测得到的结果与信息就需要再次更新，芯片也要不断重新升级；③检测过程中，设计进去的位点过多，可能会出现彼此干扰的现象，导致测试结果自相矛盾。例如专利CN106399543A公开了基于74个Y染色体SNP遗传标记的法医学二代测序试剂盒，专利CN110846420A公开了一种快速突变Y染色体STR分型系统、下一代测序分型试剂盒及分型方法和应用等，所述的Y染色体测序均主要是基于已知的STR和SNP分型，测序所包含的区域较小，无法达到法医学精细谱系研究的目的，且检测成本高。而目前基于二代测序的商业化试剂盒，具有以下缺点：①测序的区域较小，不能发现更多属于自身家族独有的私有位点，无法区分家族内部的不同分支，世代估计的误差较大，无法满足实际的精度要求。②检测成本高，高度依赖于进口的测序平台及相关试剂，价格昂贵。

因此，亟需开发一种对Y染色体的测序长度更长，能发现更多具有区分能力的STR和Y-SNP位点，测序所包含的区域更大，以满足法医学精细谱系研究的需求的Y染色体测序方法。

发明内容

本发明的目的在于克服现有技术中存在的上述缺陷和不足，提供一种基于液相探针捕获的Y染色体测序方法。

本发明的上述目的是通过以下技术方案给予实现的：

一种基于液相探针捕获的Y染色体测序方法，包括如下步骤：

S1.提取基因组DNA，将基因组DNA进行片段化；

S2.对片段化的双链DNA进行末端修复，DNA片段的3’末端加碱基A；

S3.在DNA片段两端加上测序接头并纯化连接产物以除去未连接的接头序列；

S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化；

S5.文库质量控制；

S6.探针区域的挑选及优化，并设计局部密集式探针；

S7.将步骤S5的DNA文库和步骤S6的探针进行文库杂交反应，捕获目标DNA片段；

S8.将捕获的目标DNA片段进行分离；

S9.对分离后的目标DNA片段进行高通量测序；

其中，步骤S6所述探针区域的挑选及优化为获得hg38版本的Y染色体参考序列，以70bp为截取长度，35bp为滑动窗口，获得重叠覆盖整个NRY区域的70bp单位片段，然后分别用BWA-backtrack、BWA-SW、BWA-MEM和bowtie2四种方法，将所有片段mapping回hg38的参考基因组，接着根据所有片段mapping到Y染色体的唯一性、质量和使用不同mapping方法的一致性，对片段进行评分分级，最后剔除评分最差的片段，把剩余片段进行拼接，得到用于捕获测序的候选区域；

所述局部密集式探针为交错式设计。

本发明首先对探针区域进行挑选和优化，探针区域的设计去掉了Y染色体的重组区，但是对于剩下的20M区域，还有某些区域为高GC、自我重复和回文、插入和缺失区域，传统的探针设计采用的叠瓦式设计，为2X探针平铺，而本发明采用交错设计探针，对于这些复杂结构，针对性增加了探针密度，使最终捕获产物的均一性和覆盖度达到最优，再利用探针和DNA文库杂交，杂交过程中，通过核酸序列的互补结合的原理，探针会和目标DNA片段进行结合，最后将捕获的目标DNA片段分离出来，进行测序，获得测序长度更长，近20M的Y染色体区域。所获得的测序的长度接近于Y染色体上可以利用的区域的极限，能够测试到更多的突变，从而能更精确地计算不同分支之间的分化时间。粗略估计，大约可以检测到每2～3代人之间发生的突变，相当于每70年左右发生的突变，这已经是接近Y染色体突变速率的极限。本发明的关键在于获得用于捕获测序的候选区域，在获得候选区域后，按照交错设计探针的原则，设计探针即可，对于具体的探针序列不做限制。

具体地，步骤S1所述基因组DNA来源于人类。

优选地，步骤S1所述DNA片段化为超声随机打断、转座酶酶切或限制性内切酶酶切。

进一步优选地，所述DNA片段化为超声随机打断。

优选地，步骤S6所述密集式探针带有生物素标记。

优选地，步骤S7所述捕获目标DNA片段为将结合了链霉亲和素的磁珠与杂交混合液进行混合，将要捕获的目标片段通过探针间接地结合到磁珠上。

优选地，步骤S8所述分离为将目标DNA片段洗脱下来。

优选地，在分离得到目标DNA片段后，还包括对捕获后的文库进行扩增，再进行高通量测序。

优选地，所述探针包括SEQ ID NO:1～SEQ ID NO:68。

优选地，步骤S9所述高通量测序为DNB测序技术。

与现有技术相比，本发明具有以下有益效果：

本发明基于液相探针捕获技术，首先对探针区域进行挑选和优化，再采用新的探针引物设计方式设计捕获探针，实现了人类Y染色体近20M区域的捕获测序，本发明测序的长度接近于Y染色体上可以利用的区域的极限，能够测试到更多的突变，能发现更多具有区分能力的STR和Y-SNP位点，从而能更精确地计算不同分支之间的分化时间，为法医学研究中关于新的遗传标记筛选和实现样本间的世代推算提供了新的思路和方案。

附图说明

图1为本发明基于基于DNB技术的Y染色体液相探针捕获测序方法的流程示意图。

图2为本发明探针设计示意图。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明，但实施例并不对本发明做任何形式的限定。除非特别说明，本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。

除非特别说明，以下实施例所用试剂和材料均为市购。

实施例1

一种基于DNB技术的Y染色体液相探针捕获测序方法，其操作流程如图1所示。主要步骤如下：

一、方法

1)基因组DNA片段化-Covaris打断仪

1.检查Covaris水槽中注入新的去离子水的液面在12刻度水平，确保水面没过打断管玻璃部分。

2.设置冷却温度在2℃～5℃之间，确保使用时温度显示水温在5℃。

3.使用前最少30min打开控制面板上的排气按钮，参考Covaris仪器使用说明进行实验操作。

4.在1.5mL的PCR管中将样品使用1×Low TE Buffer稀释为35μL(200ng)。

5.将稀释好的样品小心的加入打断管中，避免过程中出现气泡，将打断管放入打断仪中，推荐参数设定如下表所示，(也可根据仪器型号调整)。

6.取1μL样品使用Agilent 2100(DNA1000 Assay)进行片段检测正常打断后样品检测主峰约在150bp-200bp。

2)DNA文库构建

Step 1末端修复/dA尾添加

1.将下表中各试剂解冻后，颠倒混匀，置于冰上备用。

2.于无菌PCR管中配制如下反应体系：

3.使用移液器轻轻吹打或振荡混匀，并短暂离心将反应液离心至管底。

4.将上述PCR管置于PCR仪，设置表5所示反应程序，进行末端修复/dA尾添加反应(热盖105℃)。

Step 2接头连接

1.根据Input DNA量，稀释Adapter至合适浓度。

2.将下表中各试剂解冻后颠倒混匀，置于冰上备用。

3.于Step 1步骤产物PCR管中配制下表所示反应体系。

4.使用移液器轻轻吹打或振荡混匀，并短暂离心将反应液收集至管底。

5.将PCR管置于PCR仪中，设置下表所示反应程序，进行接头连接反应(热盖105℃)。

Step 3连接产物纯化

注意：在开始操作前，请确认Agencourt AMPure XP磁珠已平衡至室温。

1.配置0.8X磁珠纯化体系。

2.轻轻吸打混匀6次室温静置孵育5min将PCR管置于磁力架上3min使溶液澄清。

3.移除上清，PCR管继续放置在磁力架上向PCR管内加入200μL 80％乙醇溶液，静置30s。

4.移除上清，再向PCR管内加入200μL 80％乙醇溶液，静置30s后彻底移除上清(建议使用10μL移液器移除底部残留乙醇溶液)。

5.室温静置35min，使残留乙醇彻底挥发。

6.加入22μL的Nuclease-free water把PCR管从磁力架取下，轻轻吸打重悬磁珠，避免产生气泡，室温静置2min。

7.将PCR管置于磁力架上2min使溶液澄清。

8.用移液器吸取20μL上清液，转移到新的PCR管中(置于冰盒上)，在反应管上标记样本编号，准备下一步反应。

Step 4文库扩增

1.配置如下反应体系

2.使用移液器轻轻吹打10次混匀反应液，并短暂瞬时离心将反应液收集至管底。

3.按下表所示程序，进行PCR反应(热盖105℃)。

Step 5扩增产物磁珠纯化

1.配置0.9X磁珠纯化体系。

2.充分涡旋混匀混有连接产物和磁珠的0.2mL离心管，室温孵育5min。

3.将0.2mL离心管至于磁力架上孵育，直至溶液澄清，并小心移除上清。

4.保持0.2mL离心管始终置于磁力架中，加入100μL 80％乙醇漂洗磁珠，室温孵育30sec后，小心移除80％乙醇。

5.重复1次80％乙醇清洗磁珠。

6.保持0.2mL离心管始终置于磁力架中，室温干燥磁珠3-5min。

7.从磁力架上取下0.2mL离心管，加入22μL Nuclease-Free Water充分重悬磁珠，室温静置5min。

8.将0.2mL离心管置于磁力架中静置，待溶液澄清后，小心移取20μL上清至新0.2mL离心管中。纯化后的DNA文库可在4℃条件下放置一周，或在-20℃条件下长期保存。

Step 6文库质量控制

通常情况下，构建好的文库可通过浓度检测和长度分布检测来进行质量评价。

3)DNA文库杂交捕获

Step 1探针区域的挑选及优化

为了获得最优的测序区域，本发明重新评估了Y染色体非重组区(NRY区域)。首先，获得hg38版本的Y染色体参考序列，以70bp为截取长度，35bp为滑动窗口，获得重叠覆盖整个NRY区域的70bp单位片段。然后，分别用BWA-backtrack、BWA-SW、BWA-MEM和bowtie2四种方法，将所有片段mapping回hg38的参考基因组。接着，根据所有片段mapping到Y染色体的唯一性、质量和使用不同mapping方法的一致性，对片段进行评分分级。最后，剔除评分最差的片段，把剩余片段进行拼接，就得到了用于捕获测序的候选区域。

Step 2局部密集式探针设计方案：基于液相探针捕获技术

相比传统探针的设计为叠瓦式设计，本发明采用交错设计，如图2所示。针对上述获得的候选区域进行探针设计，针对某些高GC、高重复和回文结构等区域，重点增加探针，提高捕获效率。其中，所述探针包括SEQ ID NO:1～SEQ ID NO:68；

Step 3进行文库杂交反应

1.将下述试剂在0.2mL离心管混合。

2.漩涡混匀上述封闭反应体系，瞬时离心，将所有名称收集到管底。

3.将离心管冷冻浓缩，蒸干反应液。

4.向含有已干燥DNA的管中依次加入以下试剂。

5.涡旋振荡器振荡混匀，室温孵育5-10min，涡旋振荡器振荡混匀并瞬时离心。

6.将0.2mL离心管放置于PCR仪上，按如下程序进行孵育。

7.立即将0.2mL离心管放置于一台热盖温度已经达到75℃的PCR仪中，4h或者过夜杂交。

Step 4清洗链霉亲和素磁珠

注意：清洗磁珠前确认Dynabeads^TM M-270Streptavidin(ProbeCap SA Beads)磁珠已经平衡至室温。

1.涡旋振荡15sec充分混匀磁珠。

2.转移100μL的ProbeCap SA Beads至新的1.5mL的离心管中。

3.将离心管放置在磁力架上，使磁珠与溶液彻底分离。

4.去除上清，保留磁珠。

5.进行如下清洗：

①向磁珠中加150μL的1X BWB，涡旋振荡10sec。

②离心管转移至磁力架上，磁珠与溶液完全分离。

③小心去上清。

6.重复上述第5步，共清洗两次。

7.然后加入100μL的1X BWB溶液，涡旋混匀30s。

8.将磁珠、1X BWB混合液转移至新的0.2mL离心管中。

9.用磁力架吸附磁珠，去除上清保留磁珠，马上进行Step3，避免磁珠在空气中过度暴露。

Step 5进行磁珠捕获

1.将Step2.9的0.2mL离心管放于已经预热到65℃的PCR仪中。

2.将Step1.8中在65度杂交的杂交液16μL全部转移至Step2.9制备的0.2mL离心管中。

3.用移液器反复吸打溶液10次，充分混匀。

4.按如下程序进行孵育。

5.每10min从PCR仪取出0.2mL离心管振荡5sec，温和重悬反应液，再放入PCR仪器进行反应。

Step 6清洗

注意：确保足量的1X W I，1X W II，1X W III已平衡至室温。

1.提前至少30min将PCR仪加热至65℃，取300μL/反应的1X S-W和125μL/反应的1XWI分别装进新的0.2mL离心管中，这两样清洗液在65℃PCR仪上放置至少10min。

2.向Step3.5的0.2mL离心管中加入120μL 65℃预热的1X WI，涡旋振荡混匀3sec。

3.将0.2mL离心管放在磁力架上，磁珠与溶液完全分离。

4.将0.2mL离心管中放入PCR仪器预热：65℃，10～20sec。

5.迅速放回磁力架，澄清后，尽快去上清。

6.热清洗。

①向0.2mL离心管中中加入140μL 65℃预热的1X S-W，缓慢吸打10次，避免产生气泡。

②将0.2mL离心管中放置于PCR仪进行温浴并准确定时：65℃，5min。

③将0.2mL离心管中放置于磁力架上2min，用移液器迅速去上清。

7.重复步骤6一次，总共热清洗磁珠两次。

8.室温清洗。

①取140μL室温的1X WI，加入将0.2mL离心管中。漩涡30s间隔4次共振荡2min，充分悬浮磁珠。

②将0.2mL离心管中放置于磁力架上1min，用移液器迅速去上清。

③加140μL室温的1X WII，加入将0.2mL离心管中，漩涡30s间隔2次共振荡1min，充分悬浮磁珠。

④将0.2mL离心管中置于磁力架上2min，快速去除上清。

⑤加入140μL室温的1X WIII，加入将0.2mL离心管中，漩涡振荡30s，将磁珠充分悬浮。

⑥将混匀悬液转移至新0.2mL离心管中，置于磁力架上，使磁珠与溶液完全分离，去上清。

9.重悬磁珠

①加25μL Nuclease-Free Water，将0.2mL离心管中从磁力架上移开。

②使用移液器反复吸打10次，保证所有磁珠充分重悬。

Step 7捕获后文库扩增

1.按下表所示配制PCR反应体系。

2.涡旋振荡3sec，轻甩或瞬时离心，保证磁珠仍悬浮于溶液中。

3.将0.2mL离心管放入PCR仪中，热盖温度105℃，按照如下程序进行PCR扩增。

Step 8纯化捕获后PCR产物

1.配置1.0X磁珠纯化体系。

2.充分涡旋混匀混有PCR产物和磁珠的0.2mL离心管，室温孵育5min。

3.将0.2mL离心管至于磁力架上孵育，直至溶液澄清，并小心移除上清.

5.保持0.2mL离心管始终置于磁力架中，室温干燥磁珠3-5min。

6.从磁力架上取下0.2mL离心管，加入30μL Nuclease-Free Water充分重悬磁珠，室温静置5min。

7.将0.2mL离心管置于磁力架中静置，待溶液澄清后，小心移取28μL上清至新0.2mL离心管中。纯化后的DNA文库可在4℃条件下放置一周，或在-20℃条件下长期保存。

4)利用二代测序(华大二代测序仪的DNB测序技术)平台进测序，进行结果分析。

二、结果

本发明通过上述方法，通过对Y染色体的探针区域进行挑选和优化，再采用新的探针引物设计方式设计捕获探针，实现了人类Y染色体近20M区域的捕获测序，所述探针位置与和测序结果如表1所示：

本发明测序的长度接近于Y染色体上可以利用的区域的极限，能够测试到更多的突变，能发现更多具有区分能力的STR和Y-SNP位点。

表1

序列表

<110> 广州深晓基因科技有限公司

<120> 一种基于液相探针捕获的Y染色体测序方法

<160> 68

<170> SIPOSequenceListing 1.0

<210> 1

<211> 75

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 1

gttggacatt taggttggtt ccaagtcttt gctattgtga ataatgccgc aataaacata 60

catgtgcatg tgtct 75

<210> 2

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 2

ttgggcagta tggccatttt cacgatattg attcttccta cccatgagca tggaatgttc 60

ttccatttgt ttgtatcctc ttttatttcc ttgagcagtc gtttgtagtt ctccttgaag 120

<210> 3

<211> 89

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 3

ttccatttgt ttgtatcctc ttttatttcc ttgagcagtc gtttgtagtt ctccttgaag 60

aggtccttca catctcttgt aagttggat 89

<210> 4

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 4

gaataccctt tatttccttc tcctgcctaa ttgccctggc cagaacttcc aacactatgt 60

tgaataggag tggtgagaga gggcatccct gtcttttgcc agttttcaaa gggaatgctt 120

<210> 5

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 5

tgaataggag tggtgagaga gggcatccct gtcttttgcc agttttcaaa gggaatgctt 60

ccagtttttg cccattcagt atgatattgg ctgtgggttt gtaatagata gctcttatta 120

<210> 6

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 6

ccagtttttg cccattcagt atgatattgg ctgtgggttt gtaatagata gctcttatta 60

ttttgaaata cgtcccatca atacctaatt tattgagagt ttttagcata aagtgctgtt 120

<210> 7

<211> 99

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 7

ttttgaaata cgtcccatca atacctaatt tattgagagt ttttagcata aagtgctgtt 60

gaattttgtc aaaggccttt tctgcatcta ttgagataa 99

<210> 8

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 8

attcaggaaa tacagagaac gccacaaaga tactgctcga gaagagcaac tccaagacac 60

ataattgtca gattcaccaa agttgagatg atgttactct ttttccttgg tgttttccta 120

<210> 9

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 9

ataattgtca gattcaccaa agttgagatg atgttactct ttttccttgg tgttttccta 60

aggaagcctt gtgacatatc tcaggaccca gcaccgaggt gatgtggccc ttttgcctgg 120

<210> 10

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 10

aggaagcctt gtgacatatc tcaggaccca gcaccgaggt gatgtggccc ttttgcctgg 60

tttcttccca tgtgttagac tgtgacatat acctaaagaa acacctaggt gatgccactc 120

<210> 11

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 11

tttcttccca tgtgttagac tgtgacatat acctaaagaa acacctaggt gatgccactc 60

tcttcttctt cttgagtcct gcttcaggac atagtgactc tatatacaca cctaggtaac 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 12

tcttcttctt cttgagtcct gcttcaggac atagtgactc tatatacaca cctaggtaac 60

agttaaaggt gccaccctca aagatgagca gattgtgtca tatcactggg cctagtaccc 120

<210> 13

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 13

agttaaaggt gccaccctca aagatgagca gattgtgtca tatcactggg cctagtaccc 60

agttgttaaa acttttgctt aaattatttc ttgtgtgtat tgtgacatat catgtcagaa 120

<210> 14

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 14

agttgttaaa acttttgctt aaattatttc ttgtgtgtat tgtgacatat catgtcagaa 60

tcataataat gtgacacttt tgccctggcc ctgccaacaa gagatatcat cacatatctc 120

<210> 15

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 15

tcataataat gtgacacttt tgccctggcc ctgccaacaa gagatatcat cacatatctc 60

tgagcctaac tggtaggtga tttgtctttt tcttgtgctt tgcccccaag aaatattgtg 120

<210> 16

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 16

tgagcctaac tggtaggtga tttgtctttt tcttgtgctt tgcccccaag aaatattgtg 60

atatttttgt atgtagcatc taggaaatgt atctcttctc tcttgcctag gacctcccta 120

<210> 17

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 17

atatttttgt atgtagcatc taggaaatgt atctcttctc tcttgcctag gacctcccta 60

ctaaaggaat tgtgccatac agctgagtgc aaaaccttgg tagtgcaact ttccccttta 120

<210> 18

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 18

ctaaaggaat tgtgccatac agctgagtgc aaaaccttgg tagtgcaact ttccccttta 60

ttctggagtt tgttacgaga ggggattatg acatattgct gagcccagca cctaggtgat 120

<210> 19

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 19

ttctggagtt tgttacgaga ggggattatg acatattgct gagcccagca cctaggtgat 60

gtgagtttcc tgtttttttc aaccctgtct acagtggaca tggtgccata ttacttgtgg 120

<210> 20

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 20

gtgagtttcc tgtttttttc aaccctgtct acagtggaca tggtgccata ttacttgtgg 60

ctgtatccag gtgatgtgac tctccttgct tgcccctgcc agcaaaggag ttgatagtgt 120

<210> 21

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 21

ctgtatccag gtgatgtgac tctccttgct tgcccctgcc agcaaaggag ttgatagtgt 60

atcaggagct cagcatcaag gtgatgagac tctccttcct tgtttttgcc cacaggtgaa 120

<210> 22

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 22

atcaggagct cagcatcaag gtgatgagac tctccttcct tgtttttgcc cacaggtgaa 60

attatgtcat atgcctggga tcatctcaca tgcacaatta taaccatcaa actgggaccc 120

<210> 23

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 23

attatgtcat atgcctggga tcatctcaca tgcacaatta taaccatcaa actgggaccc 60

agaaaggaga gagattttga ttcttatagc tagtcttatt gccataagta aaataatggg 120

<210> 24

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 24

agaaaggaga gagattttga ttcttatagc tagtcttatt gccataagta aaataatggg 60

tctcctaatt gtataaagtt cacagaggat tatgacactc agacatatca tataaagcct 120

<210> 25

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 25

tctcctaatt gtataaagtt cacagaggat tatgacactc agacatatca tataaagcct 60

cagtggtaaa aagagtgtca tgatagggaa gaacaacctg gggtgattgc aaatcatgga 120

<210> 26

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 26

cagtggtaaa aagagtgtca tgatagggaa gaacaacctg gggtgattgc aaatcatgga 60

ggcacaccca gctagcttga ttgtcattct tacacaagaa catggcctac aagtagggta 120

<210> 27

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 27

ggcacaccca gctagcttga ttgtcattct tacacaagaa catggcctac aagtagggta 60

ctaaatttca cacaaaagag cagtcaaagg ttgaaatttt tcccctcata cacggttcaa 120

<210> 28

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 28

ctaaatttca cacaaaagag cagtcaaagg ttgaaatttt tcccctcata cacggttcaa 60

ccccatgggt agtgtggtga tgcaatattc agcccaactg tgagattgtg actttcctac 120

<210> 29

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 29

ccccatgggt agtgtggtga tgcaatattc agcccaactg tgagattgtg actttcctac 60

tggaacataa tcttcaagtg gaactggaca acttatgcat ggatcctgtt aagactgtga 120

<210> 30

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 30

tggaacataa tcttcaagtg gaactggaca acttatgcat ggatcctgtt aagactgtga 60

gtcctcagct ttgactcaac tcacaggaga tgttgactca catgcacaaa gccaggactt 120

<210> 31

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 31

gtcctcagct ttgactcaac tcacaggaga tgttgactca catgcacaaa gccaggactt 60

gtgtagggct gtggaactta tttctgaata tttccaagtg tgtgattaga atgtagaagt 120

<210> 32

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 32

gtgtagggct gtggaactta tttctgaata tttccaagtg tgtgattaga atgtagaagt 60

tagcccagct cctgaataat ttgactctcc tttttaggcc atgaccacag ataaaattgt 120

<210> 33

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 33

tagcccagct cctgaataat ttgactctcc tttttaggcc atgaccacag ataaaattgt 60

gacatatgtg gacagtacac ctaagcaaag cttcctgggc ctgactacca aggatacttt 120

<210> 34

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 34

gacatatgtg gacagtacac ctaagcaaag cttcctgggc ctgactacca aggatacttt 60

tacatatcat tgggactagc atcaaggtga ggtgaattct ttgtcttttc cctgcctaca 120

<210> 35

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 35

tacatatcat tgggactagc atcaaggtga ggtgaattct ttgtcttttc cctgcctaca 60

aaaggcattg tggcttacag ttaagtccat catataagtt catataagtg atgtcactcc 120

<210> 36

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 36

aaaggcattg tggcttacag ttaagtccat catataagtt catataagtg atgtcactcc 60

cttctagtgc cttggccctg ctatttcagt tcattgtgac acataactgg gtactgcacc 120

<210> 37

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 37

cttctagtgc cttggccctg ctatttcagt tcattgtgac acataactgg gtactgcacc 60

caggtgatat gactctctgt ttagggttct gccagcagga agctttgtaa catatcactt 120

<210> 38

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 38

caggtgatat gactctctgt ttagggttct gccagcagga agctttgtaa catatcactt 60

agctcagcac ctagctaatg cttcttctct cttgccttgc tgtgatcaga ggggagactg 120

<210> 39

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 39

agctcagcac ctagctaatg cttcttctct cttgccttgc tgtgatcaga ggggagactg 60

tttcatattg ctaaccctag tgctgaagtc atgtcacttt cataccgtgg ttctgaacat 120

<210> 40

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 40

tttcatattg ctaaccctag tgctgaagtc atgtcacttt cataccgtgg ttctgaacat 60

agtgaacatt gtgacatgtc taggccaatt ccttaggtaa agtgagtctc ctcatcctct 120

<210> 41

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 41

agtgaacatt gtgacatgtc taggccaatt ccttaggtaa agtgagtctc ctcatcctct 60

taagatttgc tcacaggggg aattttgatt tatcactaaa accagtatcc agctgatgtg 120

<210> 42

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 42

taagatttgc tcacaggggg aattttgatt tatcactaaa accagtatcc agctgatgtg 60

agtcttattc cagggtcctg cccacaagaa agattgtgac atctcactgg accagcaccc 120

<210> 43

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 43

agtcttattc cagggtcctg cccacaagaa agattgtgac atctcactgg accagcaccc 60

acccaaatga tgtgacattt ctgtttgttc tctgcccaca ggtcatattg tgccatatac 120

<210> 44

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 44

acccaaatga tgtgacattt ctgtttgttc tctgcccaca ggtcatattg tgccatatac 60

ctaacaccac ttaagatgac taatcatgaa tttttttttt tttttttttt tttttttttt 120

<210> 45

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 45

ctaacaccac ttaagatgac taatcatgaa tttttttttt tttttttttt tttttttttt 60

ttttttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg cgggatctcg 120

<210> 46

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 46

ttttttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg cgggatctcg 60

gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc ctcccgagta 120

<210> 47

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 47

gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc ctcccgagta 60

gctgggacta caggcacccg ctaccacgcc cggctaattt tttgtatttt tagtagagac 120

<210> 48

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 48

gctgggacta caggcacccg ctaccacgcc cggctaattt tttgtatttt tagtagagac 60

ggggtttcac cgtgttagcc aggatggtct cgatctcctg acctcgtgat ccgcccgcct 120

<210> 49

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 49

ggggtttcac cgtgttagcc aggatggtct cgatctcctg acctcgtgat ccgcccgcct 60

cggcctccca aagtgctggg attacaggca tgagccactg cgcccagcct aatcatgact 120

<210> 50

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 50

cggcctccca aagtgctggg attacaggca tgagccactg cgcccagcct aatcatgact 60

tttaaacctg gatcctggtc atatgcaaga tggaaactcc cattcctgga actttccacc 120

<210> 51

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 51

tttaaacctg gatcctggtc atatgcaaga tggaaactcc cattcctgga actttccacc 60

agtgttattg tgacatatac ctttgcccgg ctcctgagtg atttaataat actgcctaat 120

<210> 52

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 52

agtgttattg tgacatatac ctttgcccgg ctcctgagtg atttaataat actgcctaat 60

tgtagccctc aaattcgatt tagacatata gttcatgtga tcacctttat gatttcactc 120

<210> 53

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 53

tgtagccctc aaattcgatt tagacatata gttcatgtga tcacctttat gatttcactc 60

tcctgtttta acaatatctt gcagaaggat tgtaacagat ttctggaccc aacatctagt 120

<210> 54

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 54

tcctgtttta acaatatctt gcagaaggat tgtaacagat ttctggaccc aacatctagt 60

tacctgacac tcctctctta cctggaccct gcttccacta tggattgtag catttctaag 120

<210> 55

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 55

tacctgacac tcctctctta cctggaccct gcttccacta tggattgtag catttctaag 60

cactacctcc aaattatatg aatctcttgc ctggtccttt caagaggaga ccttgtgaca 120

<210> 56

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 56

cactacctcc aaattatatg aatctcttgc ctggtccttt caagaggaga ccttgtgaca 60

tatctctggg cttaccattt aggtgatatg agtctcctct tctgcctgga cactgcctac 120

<210> 57

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 57

tatctctggg cttaccattt aggtgatatg agtctcctct tctgcctgga cactgcctac 60

aaggggtatt gtgttataca tgttgatgta acccctgagt tatgcaactt ttctgcccag 120

<210> 58

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 58

aaggggtatt gtgttataca tgttgatgta acccctgagt tatgcaactt ttctgcccag 60

aacatgccta caaggagaat attggaaaat ttctggctca gtatttaggt gacttgtctg 120

<210> 59

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 59

aacatgccta caaggagaat attggaaaat ttctggctca gtatttaggt gacttgtctg 60

tcatgcctgt ttcattacca cagactgaat tgtgatatat acccaagcac agctcacagg 120

<210> 60

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 60

tcatgcctgt ttcattacca cagactgaat tgtgatatat acccaagcac agctcacagg 60

catgataatg actttcttat gtggatccca caaatagaag taattttgac tctcataact 120

<210> 61

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 61

catgataatg actttcttat gtggatccca caaatagaag taattttgac tctcataact 60

tgctttagag acatgagtga ttaaatctct atctggcacc aaaaaaaaaa aaaaaaaaca 120

<210> 62

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 62

tgctttagag acatgagtga ttaaatctct atctggcacc aaaaaaaaaa aaaaaaaaca 60

aacaaaaggt caaagaagat tataatggcc tcacatattt tataaagcct ttggcttgta 120

<210> 63

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 63

aacaaaaggt caaagaagat tataatggcc tcacatattt tataaagcct ttggcttgta 60

cagagtgtca taacagaacc cagcagagag gtgaaattgt gagtctcaaa tgcacaccca 120

<210> 64

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 64

cagagtgtca taacagaacc cagcagagag gtgaaattgt gagtctcaaa tgcacaccca 60

gctgtcacta aggtctaatc accatctcac ctatatgaag ctaactgtca ctaatgaaaa 120

<210> 65

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 65

gctgtcacta aggtctaatc accatctcac ctatatgaag ctaactgtca ctaatgaaaa 60

cagcacacac gtgatactgt acacctcatc aggggaattt tctgatagtg ttattgtgat 120

<210> 66

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 66

cagcacacac gtgatactgt acacctcatc aggggaattt tctgatagtg ttattgtgat 60

ataaatcttt gttgagcacc tgtgtgattt aattctccat aattgttcca gcccacatat 120

<210> 67

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 67

ataaatcttt gttgagcacc tgtgtgattt aattctccat aattgttcca gcccacatat 60

gttattgtca tatctacctg ggccaaactc tacatgatgt gactctcctg cctaggccct 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列(Synthetic sequences)

<400> 68

gttattgtca tatctacctg ggccaaactc tacatgatgt gactctcctg cctaggccct 60

gctctcagta agaatcatga cttattacta catccagcac ctaggtcatg ttacatcttt 120

Claims

1.一种基于液相探针捕获的Y染色体测序方法，其特征在于，包括如下步骤：

S1.提取基因组DNA，将基因组DNA进行片段化；

S4.PCR扩增连有接头的片段DNA进行文库扩增并纯化；

S5.文库质量控制；

S6.探针区域的挑选及优化，并设计局部密集式探针；

S8.将捕获的目标DNA片段进行分离；

S9.对分离后的目标DNA片段进行高通量测序；

所述局部密集式探针为交错式设计。

2.根据权利要求1所述的方法，其特征在于，步骤S1所述基因组DNA来源于人类。

3.根据权利要求1所述的方法，其特征在于，步骤S1所述DNA片段化为超声随机打断、转座酶酶切或限制性内切酶切。

4.根据权利要求4所述的方法，其特征在于，步骤S1所述DNA片段化为超声随机打断。

5.根据权利要求1所述的方法，其特征在于，步骤S6所述密集式探针带有生物素标记。

6.根据权利要求5所述的方法，其特征在于，步骤S7所述捕获目标DNA片段为将结合了链霉亲和素的磁珠与杂交混合液进行混合，将要捕获的目标片段通过探针间接地结合到磁珠上。

7.根据权利要求6所述的方法，其特征在于，步骤S8所述分离为将目标DNA片段洗脱下来。

8.根据权利要求1所述的方法，其特征在于，所述探针包括SEQ ID NO:1～SEQ ID NO:68。

9.根据权利要求1所述的方法，其特征在于，步骤S8所述分离得到目标DNA片段后，还包括对捕获后的文库进行扩增，再进行高通量测序。

10.根据权利要求1所述的方法，其特征在于，步骤S9所述高通量测序为DNB测序技术。