CN113889187A

CN113889187A - 单样本等位基因拷贝数变异检测方法、探针组和试剂盒

Info

Publication number: CN113889187A
Application number: CN202111123593.7A
Authority: CN
Inventors: 杨晓霞; 王丹丹; 陈阅军; 庄昆; 徐小红; 曹建军
Original assignee: Suzhou Rendong Bioengineering Co ltd; Shanghai Rendong Medical Laboratory Co ltd
Current assignee: Suzhou Rendong Bioengineering Co ltd; Shanghai Rendong Medical Laboratory Co ltd
Priority date: 2021-09-24
Filing date: 2021-09-24
Publication date: 2022-01-04
Anticipated expiration: 2041-09-24
Also published as: CN113889187B

Abstract

本发明公开了一种用于等位基因拷贝数变异检测的探针组，该探针组覆盖的基因组区域包括表1中的15个同源重组修复相关基因的305个外显子区域。本发明还公开了包含所述探针组的试剂盒以及应用所述探针组进行单样本特定基因组区域等位基因拷贝数变异检测的方法，该方法将待测样本目标基因序列的测序数据比对到参考基因上，以线性回归聚类的样本数据为背景集，利用训练集优化的软件参数，检测同源重组修复通路上关键基因的DNA外显子水平以上的拷贝数变化，并综合等位基因频率和肿瘤纯度信息，预测拷贝数变异类型。该方法不仅可以一次检查多个基因的外显子水平的拷贝数变异，而且灵敏度、准确性和特异性高，成本低。

Description

单样本等位基因拷贝数变异检测方法、探针组和试剂盒

技术领域

本发明涉及基因检测领域，特别是涉及等位基因拷贝数变异检测，更具体地说，是涉及同源重组修复基因DNA外显子水平以上的拷贝数纯合缺失、杂合缺失、拷贝数扩增和拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失突变检测。

背景技术

近年来，伴随着二代测序技术(NGS，又称高通量测序技术)的发展，测序成本和时间不断下降，二代测序的应用领域逐渐扩展，促进了生命科学领域的飞速发展。测序技术从诞生之初就是为了进行癌症领域方面的研究，二代测序技术在癌症领域的研究也越来越广泛。基于二代测序技术，识别各种癌症相关的生物信号，能够辅助癌症的诊断、治疗和预后。

拷贝数变异(Copy Number Vairant，CNV)是指会引起1kb以上DNA片段拷贝数变化的结构变异，包括基因扩增(拷贝数增加)和基因缺失(拷贝数减少)。拷贝数变异按照大小可以分为显微水平和亚显微水平，显微水平指显微镜下可见的染色体畸变；亚显微水平指1kb～3Mb的DNA片段改变。拷贝数变异大部分发生在蛋白编码区域，是肿瘤细胞生长常见的生物学现象，与肿瘤细胞的生长、耐药性和敏感性相关。赫赛汀是最早的靶向精准抗癌药物之一，用于治疗肿瘤中存在ERBB2(HER2)基因扩增的乳腺癌患者。

同源重组修复(Homologous recombination repair，HRR)是一种利用相同或者相近的序列为模板，精确地进行DNA双链修复的DNA修复机制。除了比较有名的BRCA1和BRCA2基因外，同源重组修复通路还包含上下游调控的基因，一般认为同源重组修复通路大致包含如下15个基因：BRCA1、BRCA2、ATM、BARD1、BRIP1、CDK12、CHEK1、CHEK2、FANCL、PALB2、RAD51B、RAD51C、RAD51D、RAD54L以及FANCA。同源重组缺陷正是由于这些基因的失活而导致的一系列基因组改变。一般存在这些基因的失活的患者，对于PARP抑制剂或者DNA损伤试剂敏感。截止2021年5月4日，COSMIC数据库中，收录的BRCA1和BRCA2突变中，乳腺癌患者BRCA1发生拷贝数缺失的频率为0.13％(1492个测试样本)，BRCA2发生拷贝数缺失频率为0.4％(1492个测试样本)。

拷贝数变异的检测方法大致有三种：荧光原位杂交(fluorescence in situhybridization，FISH)、微阵列比较基因组杂交(array comparative genomichybridization，aCGH)和二代测序方法(Next-generation sequencing，NGS)。FISH利用荧光分子基团与DNA片段结合，然后与待测样本进行杂交，最后在荧光显微镜下观察基因序列的改变。微阵列比较基因组杂交技术是一种分子细胞遗传技术，能在基因组范围内高分辨率地检测染色体的拷贝数变化(可以检测5-10kb水平的拷贝数变化)。FISH和aCGH技术受限于拷贝数变异区域大小和肿瘤样本纯度，识别分辨率和准确性均有待提高。二代测序技术，相比荧光原位杂交和微阵列比较基因组杂交技术，具有以下优势：高覆盖度与高分辨率、拷贝数检测更加精确、断点识别更加准确，并且能够识别新的拷贝数变异。

专利号为ZL201510744574.4的中国发明专利披露了一种检测基因组拷贝数变异的方法，该方法采用滑动窗口进行拷贝数检测，并通过GC校正，降低GC含量对于覆盖度的影响，通过确定拷贝数正常的阈值，来确定拷贝数变异的具体区间。但是该方法未利用对照组构建背景库，来排查不同的建库方法、测序过程中引入的系统偏差，因而检测结果可能存在一定的系统偏差，无法准确识别拷贝数缺失突变是纯合还是杂合。

申请号为CN202010771902.0的中国发明专利申请披露了一种检测HER2基因扩增的试剂盒及方法，该方法采用数字微滴PCR技术检测HER2基因拷贝数变异，但该方法的缺点是仅能检测HER2基因扩增，无法涵盖多个基因的拷贝数变异检测。

申请号为CN202010880479.8的中国发明专利申请披露了一种检测特定区域的等位基因拷贝数的方法，该方法采用机器学习方法利用肿瘤样本和对照样本完成体细胞等位基因拷贝数变异检测，但该方法的缺点是必须要用对照样本完成检测，无法针对单样本进行检测。

发明内容

本发明要解决的技术问题之一是提供一组探针，该探针组覆盖的基因组区域包括表1中的15个基因的305个外显子区域。

上述探针组优选为包括SEQ ID NO:1～214所示序列的探针。

本发明要解决的技术问题之二是提供一种包含有上述探针组的试剂盒。

本发明要解决的技术问题之三是提供上述探针组和试剂盒的用途。所述探针组和试剂盒可用于等位基因的拷贝数变异检测。所述探针组和试剂盒也可应用于制备等位基因拷贝数变异检测试剂。所述的等位基因优选为同源重组修复基因，特别是优选为与前列腺癌相关的同源重组修复基因。

本发明要解决的技术问题之四是提供一种单样本等位基因拷贝数变异检测系统，该系统主要包括：

比对数据获取模块，用于权利要求1或2所述探针组捕获的基因组区域的测序以及测序数据与参考基因组的比对去重，获取样本的细胞比对数据；

存储模块，用于存储BAF潜在SNP位点集，背景库，以及背景集样本、阳性样本、阴性样本的测序数据和比对数据；

计算模块，用于根据bin参数划分目标区域和非目标区域，计算每个区域的覆盖度、拷贝数比值、覆盖度的log2值、拷贝数比值的log2值，筛选次等位基因频率信息，计算肿瘤总拷贝数和次等位基因拷贝数；

注释模块，用于拷贝数变异注释。

本发明要解决的技术问题之五是提供一种单样本等位基因拷贝数变异检测系统的构建方法，该方法主要包括BAF潜在SNP位点筛选步骤和背景集样本筛选步骤；

所述BAF潜在SNP位点筛选步骤包括：对SNP筛选样本进行胚系变异检测和硬过滤，筛选出突变频率为0.4～0.6和0.9以上且出现次数在2次以上的SNP位点；在SNP公共数据集(例如dbsnp)中筛选出上述探针组覆盖的基因组区域对应的SNP位点；将筛选出的所有SNP位点合并去重，获得BAF潜在SNP位点；

所述背景集样本筛选步骤包括：提取背景集候选样本的DNA，扩增，建库，用上述探针组捕获目标基因，测序并将测序数据与参考基因组进行比对去重，获得背景集候选样本的细胞比对数据；计算探针覆盖度并归一化；线性回归聚类，选择样本数目最大的子集作为背景集样本。

进一步的，所述构建方法还可以包括阳性样本集筛选步骤和bin参数、片段化方法、拷贝数比值阈值筛选步骤。

所述阳性样本集筛选步骤包括：对潜在阳性样本，分别用不同的软件进行拷贝数变异检测，有2款以上软件检测出拷贝数变异的样本为阳性样本。

所述bin参数、片段化方法、拷贝数比值阈值筛选步骤包括：

1)按照不同的bin参数划分目标区域和非目标区域，分别计算每个样本目标区域和非目标区域bin的覆盖度和覆盖度的log2值；

2)校正背景集样本的覆盖度和覆盖度的log2值，以及目标区域和非目标区域bin的GC含量和重复性，构建背景库；

3)利用所述背景库，针对阴性样本和阳性样本的覆盖度数据，进行GC偏好性、重复性和探针偏好性校正，获得目标区域和非目标区域bin的拷贝数比值的log2值，利用默认的片段化方法延长每个bin至拷贝数状态相同的区域，计算每个区域的拷贝数比值，按照默认的拷贝数比值阈值筛选阴性样本和阳性样本的拷贝数缺失变异和拷贝数扩增变异；

4)重复上述步骤1)～3)，利用阴性样本和阳性样本的拷贝数筛选结果，统计分析二分类评价指标，确定bin参数；

5)用不同的片段化方法和阈值，重复上述步骤3)，利用阴性样本和阳性样本的拷贝数筛选结果，统计分析二分类评价指标，确定优化后的片段化方法和拷贝数比值阈值。

所述bin参数的优选值为目标区域bin参数199bp，非目标区域bin参数500000bp。

所述片段化方法优选采用环状二元分割方法。

所述拷贝数比值阈值优选为：拷贝数缺失突变判断阈值0.6，拷贝数扩增突变判断阈值1.5。

本发明要解决的技术问题之六是提供一种单样本等位基因拷贝数变异检测方法，该方法的步骤包括：

1)提取待测样本DNA，扩增，建库，用上述探针组捕获目标基因，富集，测序，测序数据比对到参考基因组上，去重，获得待测样本的细胞比对数据；

2)划分目标区域和非目标区域，计算每个区域的覆盖度、覆盖度的log2值和拷贝数比值的log2值；

3)利用片段化方法计算每个区域的拷贝数比值，获得拷贝数比值变异区域；

4)对BAF潜在SNP位点进行深度检测和变异检测，并筛选得到次等位基因频率信息；

5)针对拷贝数状态相同的区域，结合次等位基因频率信息，计算每个区域的肿瘤总拷贝数和次等位基因拷贝数；

6)对每个基因进行拷贝数变异区域的外显子注释，获得每个基因的注释拷贝数结果；

7)按照检测基因列表和拷贝数比值阈值筛选拷贝数变异区域，并根据肿瘤总拷贝数和次等位基因拷贝数进行纯合缺失、杂合缺失、拷贝数扩增、拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失的注释。

上述步骤5)，肿瘤总拷贝数TCN、主等位基因拷贝数MCN、次等位基因拷贝数BCN的计算公式分别为：

TCN＝ref_copy×2^log2ratio

MCN＝TCN×(|tumor_baf-0.5|+0.5)

BCN＝TCN-MCN

其中，肿瘤次等位基因频率tumor_baf等于SNP频率信息obs_baf。

当肿瘤纯度大于40％时，可以将肿瘤纯度信息纳入肿瘤总拷贝数和次等位基因拷贝数的计算，肿瘤总拷贝数TCN的计算公式和肿瘤次等位基因频率tumor_baf的校正公式分别为：

本发明利用杂交捕获探针组合获取目标基因序列，利用高通量测序平台，进行单样本同源重组修复通路上关键基因的DNA外显子水平以上的拷贝数纯合、杂合缺失、拷贝数扩增、拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失等突变的检测。与现有拷贝数变异检测技术相比，本发明的拷贝数变异检测方法，具有以下优点和有益效果：

1.本发明采用杂交捕获和NGS测序方式，可一次检测多个基因的外显子水平的拷贝数变异，且检测速度快，效率高，成本低；

2.本发明采用线性回归聚类的方法筛选背景集样本，并利用MAD方法综合多个样本的探针覆盖度，完成背景库勾选，如此降低了背景噪音，可实现对单样本特定区域等位基因的拷贝数分析；

3.本发明利用投票的方式构建阳性样本集，并通过构建训练集，优化了拷贝数变异bin参数、片段化方法和阈值；

4.本发明利用特有的人群SNP(单核苷酸多态性)位点，可准确识别拷贝数缺失突变为纯合还是杂合。

5.本发明对拷贝数变异检测的灵敏度、准确性和特异性高，灵敏度可达94％，特异性可达100％。

附图说明

图1是本发明实施例3的单样本等位基因拷贝数变异检测系统构建流程示意图；

图2是从1000例胚系变异检测样本的胚系突变数据集中筛选出的与表1的外显子区域对应的SNP位点的数目分布图；

图3是从dbsnp b151版本的公共SNP位点数据中筛选出的与表1的外显子区域对应的公共SNP位点，在与图2的SNP位点合并去重后，获得的SNP位点的数目分布图；

图4是本发明实施例4的单样本等位基因拷贝数变异检测方法流程示意图。

具体实施方式

为对本发明的技术内容、特点与功效有更具体的了解，现结合附图及具体实施例，对本发明的技术方案做进一步详细的说明。

实施例1探针制备

根据表1中的15个HRR基因的305个外显子区域，设计捕获探针的序列，针对BRCA1和BRCA2重点关注基因，采用叠瓦式设计，增加这些区域的覆盖度。然后由美国探针合成公司Integrated DNA Technologies,Inc.(IDT)按照单条DNA探针合成并质控的

Probes系列产品，合成HRR基因DNA序列捕获探针(序列如SEQ ID NO:1～214所示)，并配套相应的杂交捕获试剂。

表1捕获探针组覆盖的基因组区域

实施例2比对数据获取

1.DNA样本制备

组织样本的切片经病理检测后，如肿瘤细胞含量大于20％，则切片可直接用于DNA抽提；如果肿瘤细胞含量小于20％，则需要经过富集后再进行DNA抽提。

FFPE样本先经病理检测确认肿瘤细胞含量在20％以上，然后使用QIAGEN QIAampDNA FFPE Tissue Kit进行抽提，将FFPE样本进行脱蜡、蛋白酶K消化、高温逆转交联，最后通过硅胶膜离心柱纯化出DNA。

白细胞对照样本使用Blood-Genomic-DNA-Mini-Kit(CW2087M)进行抽提，蛋白酶K消化、裂解缓冲液裂解、无水乙醇沉降，最后通过硅胶膜离心柱纯化出DNA。

提取的DNA使用Qubit定量，总量在500ng以上的样本继续实验，并用毛细管电泳确认降解程度。

2.DNA扩增和建库

1)对提取的样本DNA进行酶切打断，主峰在200bp左右。

2)打断结束后，加入10μl末端修复体系，末端修复条件为65℃30min。

3)末端修复结束后，进行连接反应。连接反应体系包括：末端修复产物60μl，无核酸酶水5μl，连接缓冲液30μl，DNA连接酶10μl，MGI UDI接头5μl。连接反应条件为20℃15min。

4)加入0.8x纯化磁珠进行纯化。

5)配制表2所示PCR反应体系，涡旋混匀并短暂离心后，进行PCR反应，PCR反应程序如表3所示。

表2 PCR反应体系

组分	体积(μl)
		KAPA HiFi HotStart ReadyMix(2X)	25
MGI双端标签引物	5
		接头连接纯化产物	20
总体积	50

表3 PCR反应程序

6)使用1x纯化磁珠纯化PCR反应产物。

3.文库杂交捕获及目标基因富集

1)在0.2ml低吸附离心管中加入表4所示试剂，47℃抽干，抽干后的样品可以继续杂交或者室温放置过夜。

表4

组分	量
		混合文库	500ng/文库
Cot Human DNA封闭液	5μg
		Universal Blocker通用接头封闭序列	2μl

2)将表5所示试剂加入到抽干的离心管中，室温放置5～10min，置于PCR仪上95℃30s，65℃杂交孵育4～16小时，热盖温度设为100℃。

表5杂交反应试剂

3)杂交捕获产物清洗后，进行PCR富集。PCR反应体系如表6所示。PCR反应程序如表7所示。PCR反应产物用1.5X纯化磁珠进行纯化。

表6捕获后扩增反应体系

组分	体积(μl)
		2×KAPA HiFi HotStart ReadyMix	25
Dual Barcode PCR Primer Mix	2.5
		含有捕获DNA的磁珠	22.5
总体积	50

表7捕获后扩增反应程序

4.文库测序和数据拆分

捕获文库定量稀释并混合后，在MGISEQ-2000高通量测序仪上进行双端测序，测序结束后根据样本的barcode信息，用splitBarcode v2.0.0软件提取对应的测序数据。提取的原始fastq数据，Q30≥85％时，定义为合格下机数据。

5.获取比对数据

对于质控合格的下机数据，使用fastp去除建库过程中引入的接头序列、引物以及低质量碱基片段。然后使用BWA将质控后数据与hg19人类参考基因组进行比对，使用sambamba对比对后的bam文件进行去重，分别获得待测样本细胞比对数据和正常白细胞比对数据。

实施例3单样本等位基因拷贝数变异检测系统构建

对166例阴性样本(即正常白细胞样本)、100例背景集候选样本、100例潜在阳性样本，用实施例2的方法，获得细胞比对数据，按照如下步骤构建本发明的单样本等位基因拷贝数变异检测系统(参见图1)：

1.SNP位点筛选

针对166例阴性样本、100例背景集候选样本以及其他正常白细胞样本，共计1000例的胚系变异检测样本(即SNP筛选样本)，利用HaplotypeCaller进行胚系变异检测，按照HaplotypeCaller的硬指标：QD≥2、FS≤60、SOR≤3、MQ≥40、MQRankSum≥-12.5和ReadPosRankSum≥-8，完成胚系变异硬过滤，并筛选突变频率在0.4～0.6之间以及0.9以上并且在这些样本中的出现次数≥2的SNP位点，得到样本的SNP筛选位点。统计筛选出的SNP位点在15个HRR基因中的分布(见图2)。

由于上述SNP位点数目相对于部分基因来说较少，因而利用bedtools软件的intersect对dbsnp b151版本的公共数据集进行筛选，获得表1的探针捕获区域对应的公共数据SNP位点，与图2的SNP筛选位点进行合并去重，获得BAF(次等位基因频率)潜在SNP位点的集合，其数目分布如图3所示。

由图2、3可知，BRCA2和FANCA两个基因对应的SNP位点最多，补充之后ATM的SNP位点数目有了很大提高。

2.背景集样本筛选

利用100例背景集候选样本的比对数据，利用picard计算每个探针区域的覆盖度。利用每个样本的平均覆盖度对探针覆盖度进行归一化，即，用探针覆盖度除以样本平均覆盖度，得到探针归一化覆盖度。

然后进行线性回归聚类，分别以每个样本为中心，通过探针归一化覆盖度计算该样本与其他样本的线性相关性。具体方法如下：假设y＝αx+β，x和y分别对应每个探针的一对样本覆盖度，当截距项β估计值小于0.1、斜率项α估计值在0.94和1.05之间、校正后线性相关性R²大于0.85时，认为两个样本相关，为同类样本。

选择样本数目最大的子集作为拷贝数变异检测的背景集样本，共计19例。

3.阳性样本集构建

针对100例潜在阳性样本，分别利用cnvkit、GATK CNV和facets三款软件进行优化分析，通过投票的方式筛选阳性样本，即，有2款以上软件检测出拷贝数变异的样本即为阳性样本。共计筛选出74例阳性样本，构成阳性样本集。

4.bin划分及覆盖度计算

探针捕获区域对应的基因组坐标称为目标区域，除探针捕获区域以外的基因组区域称为非目标区域，分别按照不同的bin参数划分目标区域和非目标区域。

分别计算每个样本目标区域bin的覆盖度depth和非目标区域bin的覆盖度depth，同时计算覆盖度log2值，即log2＝log₂depth。

5.背景库构建

利用步骤4计算得到的每个背景集样本的覆盖度统计文件，用绝对中位差方法(MAD)计算目标区域bin和非目标区域bin的校正后的覆盖度depth和覆盖度log2值，以及覆盖度log2值的偏差，同时计算目标区域bin和非目标区域bin的GC含量以及重复性，构建检测拷贝数所需的背景库。

6.片段化及拷贝数变异筛选

利用步骤5构建的背景库，针对步骤4获得的166例阴性样本和74例阳性样本的覆盖度统计文件，完成GC偏好性、重复性以及探针偏好性校正，获得目标区域bin和非目标区域bin的拷贝数比值log2。利用片段化方法延长每个bin至拷贝数状态相同的区域。计算每个区域的拷贝数比值，即ratio＝2log2，这里的log2是拷贝数比值的log2。按照默认的阈值筛选阴性样本和阳性样本的拷贝数缺失和拷贝数扩增变异。

7.参数确定

针对bin参数，重复步骤4到步骤6，针对片段化方法和拷贝数比值阈值，重复步骤6，利用阴性样本和阳性样本的拷贝数筛选结果，统计分析二分类评价指标完成参数确定。

所述bin参数的确定方法如下：

利用74例阳性样本集，对比目标区域划分参数266bp、非目标区域划分参数150000bp，以及目标区域划分参数199bp、非目标区域划分参数500000bp，利用背景集评估样本的拷贝数变化，统计灵敏度和阳性预测值，得到前者灵敏度为0.83，后者灵敏度为0.91，因此，确定目标区域划分参数199bp、非目标区域划分参数500000bp为最优。

所述片段化方法，通过如下方法确定：

对比不同的片段化方法，环状二元分割方法(cbs)、基于小波方法(haar)和3阶隐马尔科夫模型(hmm)，利用74例阳性样本集，统计灵敏度和阳性预测值，得到cbs方法的灵敏度是0.90，haar方法的灵敏度是0.78，hmm方法的灵敏度是0.84，因此cbs方法最优，确定片段化方法采用cbs方法。

所述拷贝数比值阈值的确定方法如下：

利用74例阳性样本集和166例阴性样本构建训练集，根据灵敏度和特异性确定拷贝数比值阈值，灵敏度和阳性预测值统计见表8，特异性统计见表9，综合表8和表9来看，按照拷贝数比值≤0.6(拷贝数缺失)和拷贝数比值≥1.5(拷贝数扩增)进行筛选最优。因此，拷贝数比值的阈值采用0.6(拷贝数缺失突变判断阈值)和1.5(拷贝数扩增突变判断阈值)。

表8 HRR基因的阳性样本集分析结果统计

表9 HRR基因的阴性样本集分析结果统计

拷贝数比值	阴性个数(N)	检测真阴性个数(TN)	特异性(TNR)
				0.8\|1.2	2372	2333	0.98
0.8\|1.5	2372	2333	0.98
				0.8\|2.0	2372	2333	0.98
0.6\|1.2	2372	2372	1
				0.6\|1.5	2372	2372	1
0.6\|2.0	2372	2372	1
				0.4\|1.2	2372	2372	1
0.4\|1.5	2372	2372	1
				0.4\|2.0	2372	2372	1

实施例4单样本等位基因拷贝数变异检测

提取待测样本DNA，用实施例2的方法，获得该待测样本的比对数据，然后基于实施例3构建的单样本等位基因拷贝数变异检测系统，按照以下步骤进行单样本拷贝数变异检测(参见图4)。

1.统计目标区域和非目标区域bin覆盖度

根据实施例3确定的bin参数(目标区域划分参数199bp、非目标区域划分参数500000bp)划分目标区域和非目标区域，将参考基因组划分为不同的bin区间，利用待测样本的比对数据，用cnvkit v9.8.0软件的coverage统计每个bin区域的覆盖度depth以及覆盖度log2值。

2.计算bin拷贝数比值

利用实施例3构建的背景库，针对每个bin区域，采用cnvkit的fix方法校正目标区域bin的GC含量、重复性以及探针偏好性，比对背景库，计算得到每个bin区域的拷贝数比值log2。

3.获取拷贝数变异区域

利用环状二元分割方法，延长每个bin至拷贝数状态相同的区域，计算每个区域的拷贝数比值ratio＝2^log2，获得拷贝数比值变异片段区域。

4.SNP位点变异检测

利用待测样本的比对数据，用bcftools v1.11软件的mpileup进行SNP位点的深度检测，获取每个BAF潜在SNP位点样本的pileup深度数据，然后利用bcftools软件的call进行SNP位点的变异检测，利用bcftools软件的view进行SNP位点变异的筛选，按照碱基质量≥10，read比对质量≥5，最小read支持数为5，最小覆盖度为5，突变频率为0.4到0.6，筛选得到次等位基因频率(BAF)信息。

5.肿瘤总拷贝数和次等位基因拷贝数注释

针对拷贝数状态相同的区域(即步骤3利用环状二元分割方法分析得到的cns文件)，综合步骤4获取的次等位基因频率信息，获得每个区域的肿瘤总拷贝数(Total CopyNumber，TCN)和次等位基因拷贝数(B-allele Copy Number，BCN)。如果通过病理切片镜检确定了肿瘤纯度信息，并且肿瘤纯度大于40％，则将肿瘤纯度信息也纳入肿瘤拷贝数注释程序进行计算。

次等位基因拷贝数的具体计算方法如下：

获得每个区域的参考拷贝数ref_copy(常染色体拷贝数为2，如果是男性，X染色体是2，Y染色体是1；如果是女性，X染色体是2)，根据检测到的拷贝数比值log2(log2ratio)，按照以下计算公式获得肿瘤总拷贝数TCN：

TCN＝ref_copy×2^log2ratio。

肿瘤次等位基因频率tumor_baf默认等于检测到的SNP频率信息obs_baf。

如果提供了肿瘤纯度(purity)信息，并且肿瘤纯度大于0.4，则肿瘤总拷贝数TCN计算方法如下：

并且对SNP频率信息obs_baf进行校正，校正公式如下：

主等位基因拷贝数(MCN)计算公式如下：

MCN＝TCN×(|tumor_baf-0.5|+0.5)：

MCN的范围为0到TCN。

次等位基因拷贝数(BCN)计算公式如下：

BCN＝TCN-MCN。

利用cnvkit软件的scatter综合SNP位点变异信息和拷贝数变异信息，可视化展示拷贝数变异片段，该图形包含每个划分区域的拷贝数比值及次等位基因频率信息散点信息。

6.拷贝数变异结果及注释

利用NCBI Assembly的GRCh37.p13得到基因的外显子区域，利用bedtools软件的intersect进行拷贝数区域基因注释，完成变异区域的外显子注释。如果CNV变异区域覆盖基因的80％以上的外显子区域，则定义为是整个基因区域的覆盖，注释为整个基因；否则按照外显子水平进行注释，获得每个基因的注释拷贝数结果(包括TCN、BCN、拷贝数比值、BAF等信息)。

7.筛选拷贝数变异基因并注释其等位基因拷贝数

按照检测基因列表和拷贝数比值阈值筛选拷贝数变异区域(拷贝数比值≤0.6为拷贝数缺失突变，拷贝数比值≥1.5为拷贝数扩增突变)，根据TCN和BCN的数值，分别注释纯合缺失、杂合缺失、拷贝数扩增和拷贝数扩增杂合性缺失等。

注释方法如下：针对常染色体的变异区域，如果TCN和BCN均为0，则表示该突变为纯合缺失(DELL)；如果TCN为1(常染色体和女性x染色体)，并且BCN为0，则认为该突变为杂合缺失(HEMIZYG)；如果TCN大于2，并且BCN≥1，则认为该突变为拷贝数扩增(DUP)；如果TCN大于2，并且BCN等于0，则认为该突变为拷贝数扩增杂合性缺失(DUP-LOH)；如果TCN为2(常染色体和女性X染色体是2，男性性染色体是1)，并且BCN为0，则认为该突变为拷贝数中性杂合性缺失(Copy Neutral LOH)。

实施例5 RAD51B纯合缺失标准品的等位基因拷贝数变异检测

本实施例用RAD51B纯合缺失标准品来验证实施例4的等位基因拷贝数变异检测方法的准确性。

提取RAD51B纯合缺失标准品的DNA，利用实施例1的探针，按照实施例4的等位基因拷贝数变异检测方法，对该RAD51B纯合缺失标准品的基因拷贝数变异情况进行检测。

获得的cns文件如表10所示。

表10 RAD51B纯合缺失标准品的cns文件结果

变异区域筛选及纯合、杂合注释最终结果如表11所示。表中，BAF是归一化后的次等位基因频率。表11显示的注释结果与RAD51B纯合缺失标准品的实际拷贝数变异情况相符，验证了本发明实施例4的拷贝数变异检测方法的准确性。

表11 RAD51B纯合缺失标准品的拷贝数变异检测结果

拷贝数比值

基因

范围

转录本编号

BAF

TCN

BCN

拷贝数注释

纯合杂合注释

0.001827

RAD51B

EX2-EX10

NM_133509.4

0

缺失

纯合

实施例6 BRCA2杂合缺失模拟样本的拷贝数变异检测

利用室内软件模拟BRCA2杂合缺失，用实施例4的方法，获得BRCA2杂合缺失模拟样本的拷贝数变异检测结果，参见表12所示，TCN为1，BCN为0，该突变为杂合缺失(HEMIZYG)，与实际一致，验证了本发明实施例4的拷贝数变异检测方法的准确性。

表12 BRCA2杂合缺失检测结果

拷贝数比值

基因

范围

转录本编号

BAF

TCN

BCN

拷贝数注释

纯合杂合注释

0.498046

BRCA2

全基因

NM_000059.3

0.167435

1

0

缺失

杂合

实施例7 FANCL和FANCA拷贝数变异检测

利用实施例1的捕获探针，使用实施例4的拷贝数变异检测方法，对FANCL和FANCA基因的拷贝数变异进行检测。这两个基因的cns文件结果如表13所示，拷贝数变异检测结果如表14所示。

表13 FANCL和FANCA的cns文件结果

表14 FANCL和FANCA的拷贝数变异检测结果

实施例8不同肿瘤纯度下拷贝数变异检测的准确性

利用室内软件模拟BRCA2纯合和杂合缺失，肿瘤纯度从0.1逐渐增加到0.5，参见表15，可以看出在纯度为0.1时，BRCA2纯合缺失检测结果和真实值较为接近，在肿瘤纯度为0.2时，BRCA2杂合缺失检测值和真实值较为接近。综合来说，在极低肿瘤纯度10％时，本发明检测的拷贝数比值仍比较精确。

表15模拟BRCA2缺失突变检测结果

上述实施例仅为本发明的可行或较佳实施例而已，是用来说明本发明的，并非用以限制本发明申请专利的范围，因此，凡依本发明申请专利范围所作的均等变化与修饰，均应属于本发明专利涵盖的范围。

序列表

<110> 上海仁东医学检验所有限公司

苏州仁东生物工程有限公司

<120> 单样本等位基因拷贝数变异检测方法、探针组和试剂盒

<130> LHJ-NP-21-100979

<160> 214

<170> SIPOSequenceListing 1.0

<210> 1

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

tttggtcttc tgttttgcag acttatttac caagcattgg aggaatatcg taggtaaaaa 60

tgcctattgg atccaaagag aggccaacat tttttgaaat ttttaagaca cgctgcaaca 120

<210> 2

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ttaccaagca ttggaggaat atcgtaggta aaaatgccta ttggatccaa agagaggcca 60

acattttttg aaatttttaa gacacgctgc aacaaagcag gtattgacaa attttatata 120

<210> 3

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ggccaacatt ttttgaaatt tttaagacac gctgcaacaa agcaggtatt gacaaatttt 60

atataacttt ataaattaca ccgagaaagt gttttctaaa aaatgcttgc taaaaaccca 120

<210> 4

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

tcatgcagtg attatttgga agatagtggt gttctgaatt atacaaagtt tccaaatatt 60

gataaattgc attaaactat tttaaaaatc tcattcatta ataccaccat ggatgtcaga 120

<210> 5

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

tatacaaagt ttccaaatat tgataaattg cattaaacta ttttaaaaat ctcattcatt 60

aataccacca tggatgtcag aaaagtcttt taagattggg tagaaatgag ccactggaaa 120

<210> 6

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

aaagtctttt aagattgggt agaaatgagc cactggaaat tctaattttc atttgaaagt 60

tcacattttg tcattgacaa caaactgttt tccttgcagc aacaagatca cttcattgat 120

<210> 7

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gatctttaac tgttctgggt cacaaatttg tctgtcactg gttaaaacta aggtgggatt 60

ttttttttaa atagatttag gaccaataag tcttaattgg tttgaagaac tttcttcaga 120

<210> 8

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gggatttttt ttttaaatag atttaggacc aataagtctt aattggtttg aagaactttc 60

ttcagaagct ccaccctata attctgaacc tgcagaagaa tctgaacata aaaacaacaa 120

<210> 9

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tgaacctgca gaagaatctg aacataaaaa caacaattac gaaccaaacc tatttaaaac 60

tccacaaagg aaaccatctt ataatcagct ggcttcaact ccaataatat tcaaagagca 120

<210> 10

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tcagctggct tcaactccaa taatattcaa agagcaaggg ctgactctgc cgctgtacca 60

atctcctgta aaagaattag ataaattcaa attagactta ggtaagtaat gcaatatggt 120

<210> 11

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

gaattattgt actgtttcag gaaggaatgt tcccaatagt agacataaaa gtcttcgcac 60

agtgaaaact aaaatggatc aagcagatga tgtttcctgt ccacttctaa attcttgtct 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ttcccaatag tagacataaa agtcttcgca cagtgaaaac taaaatggat caagcagatg 60

atgtttcctg tccacttcta aattcttgtc ttagtgaaag gtatgatgaa gctattatat 120

<210> 13

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

actattttct ttcctcccag ggtcgtcaga caccaaaaca tatttctgaa agtctaggag 60

ctgaggtgga tcctgatatg tcttggtcaa gttctttagc tacaccaccc acccttagtt 120

<210> 14

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

aaacatattt ctgaaagtct aggagctgag gtggatcctg atatgtcttg gtcaagttct 60

ttagctacac cacccaccct tagttctact gtgctcatag gtaataatag caaatgtgta 120

<210> 15

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

cataaatttt tatcttacag tcagaaatga agaagcatct gaaactgtat ttcctcatga 60

tactactgct gtaagtaaat atgacattga 90

<210> 16

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

tgctgtaagt aaatatgaca ttgattagac tgttgaaatt gctaacaatt ttggaatgcc 60

ttgttaaatt atttatctta catttttaat ttcctaatct gtaatttatc taagcctttg 120

<210> 17

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

ttaaactata atttttgcag aatgtgaaaa gctatttttc caatcatgat gaaagtctga 60

agaaaaatga tagatttatc gcttctgtga cagacagtga aaacacaaat caaagagaag 120

<210> 18

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tatttttcca atcatgatga aagtctgaag aaaaatgata gatttatcgc ttctgtgaca 60

gacagtgaaa acacaaatca aagagaagct gcaagtcatg gtaagtcctc tgtttagttg 120

<210> 19

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

tctgttttat actttaacag gatttggaaa aacatcaggg aattcattta aagtaaatag 60

ctgcaaagac cacattggaa agtcaatgcc aaatgtccta gaagatgaag tatatgaaac 120

<210> 20

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gaaacagttg tagatacctc tgaagaagat agtttttcat tatgtttttc taaatgtaga 60

acaaaaaatc tacaaaaagt aagaactagc aagactagga aaaaaatttt ccatgaagca 120

<210> 21

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aagcaaacgc tgatgaatgt gaaaaatcta aaaaccaagt gaaagaaaaa tactcatttg 60

tatctgaagt ggaaccaaat gatactgatc cattagattc aaatgtagca aatcagaagc 120

<210> 22

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gaagcccttt gagagtggaa gtgacaaaat ctccaaggaa gttgtaccgt ctttggcctg 60

tgaatggtct caactaaccc tttcaggtct aaatggagcc cagatggaga aaatacccct 120

<210> 23

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cccctattgc atatttcttc atgtgaccaa aatatttcag aaaaagacct attagacaca 60

gagaacaaaa gaaagaaaga ttttcttact tcagagaatt ctttgccacg tatttctagc 120

<210> 24

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ctagcctacc aaaatcagag aagccattaa atgaggaaac agtggtaaat aagagagatg 60

aagagcagca tcttgaatct catacagact gcattcttgc agtaaagcag gcaatatctg 120

<210> 25

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

atctggaact tctccagtgg cttcttcatt tcagggtatc aaaaagtcta tattcagaat 60

aagagaatca cctaaagaga ctttcaatgc aagtttttca ggtcatatga ctgatccaaa 120

<210> 26

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ccaaacttta aaaaagaaac tgaagcctct gaaagtggac tggaaataca tactgtttgc 60

tcacagaagg aggactcctt atgtccaaat ttaattgata atggaagctg gccagccacc 120

<210> 27

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

ccaccaccac acagaattct gtagctttga agaatgcagg tttaatatcc actttgaaaa 60

agaaaacaaa taagtttatt tatgctatac atgatgaaac atcttataaa ggaaaaaaaa 120

<210> 28

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

aaaaataccg aaagaccaaa aatcagaact aattaactgt tcagcccagt ttgaagcaaa 60

tgcttttgaa gcaccactta catttgcaaa tgctgattca ggtacctctg tctttttttt 120

<210> 29

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

aggcatgagc cactgtgccc aaacactacc tttttaactt agtgaaaaat atttagtgaa 60

tgtgattgat ggtactttaa ttttgtcact ttgtgttttt atgtttaggt ttattgcatt 120

<210> 30

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ctttgtgttt ttatgtttag gtttattgca ttcttctgtg aaaagaagct gttcacagaa 60

tgattctgaa gaaccaactt tgtccttaac tagctctttt gggacaattc tgaggaaatg 120

<210> 31

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

tgttctagaa atgaaacatg ttctaataat acagtaatct ctcaggatct tgattataaa 60

gaagcaaaat gtaataagga aaaactacag ttatttatta ccccagaagc tgattctctg 120

<210> 32

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

tgtcatgcct gcaggaagga cagtgtgaaa atgatccaaa aagcaaaaaa gtttcagata 60

taaaagaaga ggtcttggct gcagcatgtc acccagtaca acattcaaaa gtggaataca 120

<210> 33

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

cagtgatact gactttcaat cccagaaaag tcttttatat gatcatgaaa atgccagcac 60

tcttatttta actcctactt ccaaggatgt tctgtcaaac ctagtcatga tttctagagg 120

<210> 34

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

ggcaaagaat catacaaaat gtcagacaag ctcaaaggta acaattatga atctgatgtt 60

gaattaacca aaaatattcc catggaaaag aatcaagatg tatgtgcttt aaatgaaaat 120

<210> 35

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

attataaaaa cgttgagctg ttgccacctg aaaaatacat gagagtagca tcaccttcaa 60

gaaaggtaca attcaaccaa aacacaaatc taagagtaat ccaaaaaaat caagaagaaa 120

<210> 36

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

aactacttca atttcaaaaa taactgtcaa tccagactct gaagaacttt tctcagacaa 60

tgagaataat tttgtcttcc aagtagctaa tgaaaggaat aatcttgctt taggaaatac 120

<210> 37

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

actaaggaac ttcatgaaac agacttgact tgtgtaaacg aacccatttt caagaactct 60

accatggttt tatatggaga cacaggtgat aaacaagcaa cccaagtgtc aattaaaaaa 120

<210> 38

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

aagatttggt ttatgttctt gcagaggaga acaaaaatag tgtaaagcag catataaaaa 60

tgactctagg tcaagattta aaatcggaca tctccttgaa tatagataaa ataccagaaa 120

<210> 39

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

aaaaaataat gattacatga acaaatgggc aggactctta ggtccaattt caaatcacag 60

ttttggaggt agcttcagaa cagcttcaaa taaggaaatc aagctctctg aacataacat 120

<210> 40

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

attaagaaga gcaaaatgtt cttcaaagat attgaagaac aatatcctac tagtttagct 60

tgtgttgaaa ttgtaaatac cttggcatta gataatcaaa agaaactgag caagcctcag 120

<210> 41

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

agtcaattaa tactgtatct gcacatttac agagtagtgt agttgtttct gattgtaaaa 60

atagtcatat aacccctcag atgttatttt ccaagcagga ttttaattca aaccataatt 120

<210> 42

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

tttaacacct agccaaaagg cagaaattac agaactttct actatattag aagaatcagg 60

aagtcagttt gaatttactc agtttagaaa accaagctac atattgcaga agagtacatt 120

<210> 43

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

tttgaagtgc ctgaaaacca gatgactatc ttaaagacca cttctgagga atgcagagat 60

gctgatcttc atgtcataat gaatgcccca tcgattggtc aggtagacag cagcaagcaa 120

<210> 44

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

aatttgaagg tacagttgaa attaaacgga agtttgctgg cctgttgaaa aatgactgta 60

acaaaagtgc ttctggttat ttaacagatg aaaatgaagt ggggtttagg ggcttttatt 120

<210> 45

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

ttctgctcat ggcacaaaac tgaatgtttc tactgaagct ctgcaaaaag ctgtgaaact 60

gtttagtgat attgagaata ttagtgagga aacttctgca gaggtacatc caataagttt 120

<210> 46

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

ttatcttcaa gtaaatgtca tgattctgtt gtttcaatgt ttaagataga aaatcataat 60

gataaaactg taagtgaaaa aaataataaa tgccaactga tattacaaaa taatattgaa 120

<210> 47

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

aaatgactac tggcactttt gttgaagaaa ttactgaaaa ttacaagaga aatactgaaa 60

atgaagataa caaatatact gctgccagta gaaattctca taacttagaa tttgatggca 120

<210> 48

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

cagtgattca agtaaaaatg atactgtttg tattcataaa gatgaaacgg acttgctatt 60

tactgatcag cacaacatat gtcttaaatt atctggccag tttatgaagg agggaaacac 120

<210> 49

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

actcagatta aagaagattt gtcagattta acttttttgg aagttgcgaa agctcaagaa 60

gcatgtcatg gtaatacttc aaataaagaa cagttaactg ctactaaaac ggagcaaaat 120

<210> 50

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

atataaaaga ttttgagact tctgatacat tttttcagac tgcaagtggg aaaaatatta 60

gtgtcgccaa agagtcattt aataaaattg taaatttctt tgatcagaaa ccagaagaat 120

<210> 51

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

attgcataac ttttccttaa attctgaatt acattctgac ataagaaaga acaaaatgga 60

cattctaagt tatgaggaaa cagacatagt taaacacaaa atactgaaag aaagtgtccc 120

<210> 52

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

ccagttggta ctggaaatca actagtgacc ttccagggac aacccgaacg tgatgaaaag 60

atcaaagaac ctactctatt gggttttcat acagctagcg ggaaaaaagt taaaattgca 120

<210> 53

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

caaaggaatc tttggacaaa gtgaaaaacc tttttgatga aaaagagcaa ggtactagtg 60

aaatcaccag ttttagccat caatgggcaa agaccctaaa gtacagagag gcctgtaaag 120

<210> 54

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

agaccttgaa ttagcatgtg agaccattga gatcacagct gccccaaagt gtaaagaaat 60

gcagaattct ctcaataatg ataaaaacct tgtttctatt gagactgtgg tgccacctaa 120

<210> 55

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

aagctcttaa gtgataattt atgtagacaa actgaaaatc tcaaaacatc aaaaagtatc 60

tttttgaaag ttaaagtaca tgaaaatgta gaaaaagaaa cagcaaaaag tcctgcaact 120

<210> 56

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

cttgttacac aaatcagtcc ccttattcag tcattgaaaa ttcagcctta gctttttaca 60

caagttgtag tagaaaaact tctgtgagtc agacttcatt acttgaagca aaaaaatggc 120

<210> 57

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

gcttagagaa ggaatatttg atggtcaacc agaaagaata aatactgcag attatgtagg 60

aaattatttg tatgaaaata attcaaacag tactatagct gaaaatgaca aaaatcatct 120

<210> 58

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ctctccgaaa aacaagatac ttatttaagt aacagtagca tgtctaacag ctattcctac 60

cattctgatg aggtatataa tgattcagga tatctctcaa aaaataaact tgattctggt 120

<210> 59

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

gtattgagcc agtattgaag aatgttgaag atcaaaaaaa cactagtttt tccaaagtaa 60

tatccaatgt aaaagatgca aatgcatacc cacaaactgt aaatgaagat atttgcgttg 120

<210> 60

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

tgaggaactt gtgactagct cttcaccctg caaaaataaa aatgcagcca ttaaattgtc 60

catatctaat agtaataatt ttgaggtagg gccacctgca tttaggatag ccagtggtaa 120

<210> 61

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

aaaatcgttt gtgtttcaca tgaaacaatt aaaaaagtga aagacatatt tacagacagt 60

ttcagtaaag taattaagga aaacaacgag aataaatcaa aaatttgcca aacgaaaatt 120

<210> 62

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ttatggcagg ttgttacgag gcattggatg attcagagga tattcttcat aactctctag 60

ataatgatga atgtagcacg cattcacata aggtttttgc tgacattcag agtgaagaaa 120

<210> 63

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

aattttacaa cataaccaaa atatgtctgg attggagaaa gtttctaaaa tatcaccttg 60

tgatgttagt ttggaaactt cagatatatg taaatgtagt atagggaagc ttcataagtc 120

<210> 64

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

tcagtctcat ctgcaaatac ttgtgggatt tttagcacag caagtggaaa atctgtccag 60

gtatcagatg cttcattaca aaacgcaaga caagtgtttt ctgaaataga agatagtacc 120

<210> 65

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

ccaagcaagt cttttccaaa gtattgttta aaagtaacga acattcagac cagctcacaa 60

gagaagaaaa tactgctata cgtactccag aacatttaat atcccaaaaa ggcttttcat 120

<210> 66

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

atataatgtg gtaaattcat ctgctttctc tggatttagt acagcaagtg gaaagcaagt 60

ttccatttta gaaagttcct tacacaaagt taagggagtg ttagaggaat ttgatttaat 120

<210> 67

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

atcagaactg agcatagtct tcactattca cctacgtcta gacaaaatgt atcaaaaata 60

cttcctcgtg ttgataagag aaacccagag cactgtgtaa actcagaaat ggaaaaaacc 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

cctgcagtaa agaatttaaa ttatcaaata acttaaatgt tgaaggtggt tcttcagaaa 60

ataatcactc tattaaagtt tctccatatc tctctcaatt tcaacaagac aaacaacagt 120

<210> 69

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

gttggtatta ggaaccaaag tgtcacttgt tgagaacatt catgttttgg gaaaagaaca 60

ggcttcacct aaaaacgtaa aaatggaaat tggtaaaact gaaacttttt ctgatgttcc 120

<210> 70

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

cctgtgaaaa caaatataga agtttgttct acttactcca aagattcaga aaactacttt 60

gaaacagaag cagtagaaat tgctaaagct tttatggaag atgatgaact gacagattct 120

<210> 71

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

ctaaactgcc aagtcatgcc acacattctc tttttacatg tcccgaaaat gaggaaatgg 60

ttttgtcaaa ttcaagaatt ggaaaaagaa gaggagagcc ccttatctta gtgggtaagt 120

<210> 72

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

tatgaaatat ttctttttag gagaaccctc aatcaaaaga aacttattaa atgaatttga 60

caggataata gaaaatcaag aaaaatcctt aaaggcttca aaaagcactc cagatggtaa 120

<210> 73

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

ttaggagaac cctcaatcaa aagaaactta ttaaatgaat ttgacaggat aatagaaaat 60

caagaaaaat ccttaaaggc ttcaaaaagc actccagatg gtaaaattag ctttttattt 120

<210> 74

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

gaaataatgg aagaatcatg aaagttccca gaatacagaa taaaatgaaa aaaggtatga 60

aaagtcaatt ctgtggatct atcatctgaa aatacagagt ttgagaagga aggcacagaa 120

<210> 75

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

aaggcacaga agagaaatga agaaagaaat tttaaaataa atacataatt ttaaaagttc 60

tactagtact gaaggacatg agtttcctta attaaaaggg cccactgagt gagcacacaa 120

<210> 76

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

aaataagatt ggtgttttag aagtatacca aagcaaaact gttgcaagga gattagtaaa 60

tacaggtctt aacctagcag aggaggtaga gggtagagaa tgattgagat agaaattcag 120

<210> 77

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

ctagcagagg aggtagaggg tagagaatga ttgagataga aattcagtag atttggccag 60

atagtgataa gttgagactg gcaaattatt tccacttaga tttaaataga tatcttgagc 120

<210> 78

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

atattttctc cccattgcag cacaactaag gaacgtcaag agatacagaa tccaaatttt 60

accgcacctg gtcaagaatt tctgtctaaa tctcatttgt atgaacatct gactttggaa 120

<210> 79

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

ggaaaaatct tcaagcaatt tagcagtttc aggacatcca ttttatcaag tttctgctac 60

aagaaatgaa aaaatgagac acttgattac tacaggcaga ccaaccaaag tctttgttcc 120

<210> 80

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

ttccaccttt taaaactaaa tcacattttc acagagttga acagtgtgtt aggaatatta 60

acttggagga aaacagacaa aagcaaaaca ttgatggaca tggctctgat gatagtaaaa 120

<210> 81

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

aaaaataaga ttaatgacaa tgagattcat cagtttaaca aaaacaactc caatcaagca 60

gtagctgtaa ctttcacaaa gtgtgaagaa gaacctttag gtattgtatg acaatttgtg 120

<210> 82

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

cctttaggta ttgtatgaca atttgtgtga tgaatttttg cctttcagtt agatatttcc 60

gttgttaaat aatgtcctga tggttttccc cctttggtgg tggtaatttt aaagcccttt 120

<210> 83

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

aagtatttat tctttgatag atttaattac aagtcttcag aatgccagag atatacagga 60

tatgcgaatt aagaagaaac aaaggcaacg cgtctttcca cagccaggca gtctgtatct 120

<210> 84

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

gccaggcagt ctgtatcttg caaaaacatc cactctgcct cgaatctctc tgaaagcagc 60

agtaggaggc caagttccct ctgcgtgttc tcataaacag gtatgtgttt gtctacaata 120

<210> 85

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

tgtgtgttta ttttgtgtag ctgtatacgt atggcgtttc taaacattgc ataaaaatta 60

acagcaaaaa tgcagagtct tttcagtttc acactgaaga ttattttggt aaggaaagtt 120

<210> 86

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

gtaaggaaag tttatggact ggaaaaggaa tacagttggc tgatggtgga tggctcatac 60

cctccaatga tggaaaggct ggaaaagaag aattttatag gtactctatg caaaaagatt 120

<210> 87

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

aatagttgta gttgttgaat tcagtatcat cctatgtggt ttttatgata atattctact 60

tttatttgtt cagggctctg tgtgacactc caggtgtgga tccaaagctt atttctagaa 120

<210> 88

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

ttctactttt atttgttcag ggctctgtgt gacactccag gtgtggatcc aaagcttatt 60

tctagaattt gggtttataa tcactataga tggatcatat ggaaactggc agctatggaa 120

<210> 89

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

ggatcatatg gaaactggca gctatggaat gtgcctttcc taaggaattt gctaatagat 60

gcctaagccc agaaagggtg cttcttcaac taaaatacag gcaagtttaa agcattacat 120

<210> 90

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

atttttgttt tcacttttag atatgatacg gaaattgata gaagcagaag atcggctata 60

aaaaagataa tggaaaggga tgacacagct gcaaaaacac ttgttctctg tgtttctgac 120

<210> 91

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

aaaaacactt gttctctgtg tttctgacat aatttcattg agcgcaaata tatctgaaac 60

ttctagcaat aaaactagta gtgcagatac ccaaaaagtg gccattattg aacttacaga 120

<210> 92

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

aaaaagtggc cattattgaa cttacagatg ggtggtatgc tgttaaggcc cagttagatc 60

ctcccctctt agctgtctta aagaatggca gactgacagt tggtcagaag attattcttc 120

<210> 93

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

ctgacagttg gtcagaagat tattcttcat ggagcagaac tggtgggctc tcctgatgcc 60

tgtacacctc ttgaagcccc agaatctctt atgttaaagg taaattaatt tgcactctt 119

<210> 94

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

atatttatta atttgtccag atttctgcta acagtactcg gcctgctcgc tggtatacca 60

aacttggatt ctttcctgac cctagacctt ttcctctgcc cttatcatcg cttttcagtg 120

<210> 95

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

tgaccctaga ccttttcctc tgcccttatc atcgcttttc agtgatggag gaaatgttgg 60

ttgtgttgat gtaattattc aaagagcata ccctatacag gtatgatgta ttcttgaaac 120

<210> 96

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

tgtgtaacac attattacag tggatggaga agacatcatc tggattatac atatttcgca 60

atgaaagaga ggaagaaaag gaagcagcaa aatatgtgga ggcccaacaa aagagactag 120

<210> 97

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

agagaggaag aaaaggaagc agcaaaatat gtggaggccc aacaaaagag actagaagcc 60

ttattcacta aaattcagga ggaatttgaa gaacatgaag gtaaaattag ttatatggta 120

<210> 98

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

taatcctttt gttttcttag aaaacacaac aaaaccatat ttaccatcac gtgcactaac 60

aagacagcaa gttcgtgctt tgcaagatgg tgcagagctt tatgaagcag tgaagaatgc 120

<210> 99

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

accatcacgt gcactaacaa gacagcaagt tcgtgctttg caagatggtg cagagcttta 60

tgaagcagtg aagaatgcag cagacccagc ttaccttgag gtgagagagt aagaggacat 120

<210> 100

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

ttaaccacac ccttaagatg agctctaatt ttgttgtatt tgtcctgttt aaagccatct 60

agttacaata gatggaactt ttttgttctg attgcttttt attccaatat cttaaatggt 120

<210> 101

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

aatatcttaa atggtcacag ggttatttca gtgaagagca gttaagagcc ttgaataatc 60

acaggcaaat gttgaatgat aagaaacaag ctcagatcca gttggaaatt aggaaggcca 120

<210> 102

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

atggaatctg ctgaacaaaa ggaacaaggt ttatcaaggg atgtcacaac cgtgtggaag 60

ttgcgtattg taagctattc aaaaaaagaa aaagattcag gtaagtatgt aaatgctttg 120

<210> 103

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

tctcatcttt ctccaaacag ttatactgag tatttggcgt ccatcatcag atttatattc 60

tctgttaaca gaaggaaaga gatacagaat ttatcatctt gcaacttcaa aatctaaaag 120

<210> 104

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

cagaatttat catcttgcaa cttcaaaatc taaaagtaaa tctgaaagag ctaacataca 60

gttagcagcg acaaaaaaaa ctcagtatca acaactaccg gtacaaacct ttcattgtaa 120

<210> 105

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

ttttgttttg ttttctgtag gtttcagatg aaattttatt tcagatttac cagccacggg 60

agccccttca cttcagcaaa tttttagatc cagactttca gccatcttgt tctgaggtgg 120

<210> 106

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

gagccccttc acttcagcaa atttttagat ccagactttc agccatcttg ttctgaggtg 60

gacctaatag gatttgtcgt ttctgttgtg aaaaaaacag gtaatgcaca atatagttaa 120

<210> 107

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

agtaaaagaa tgtgttgtca tattggtatt gaaattttag cactgtaagc aacaggtcat 60

tttggaaaac ctgagctttc gccaaattca gctattttga tttgctttta ttattagcat 120

<210> 108

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

ttcgccaaat tcagctattt tgatttgctt ttattattag catataccaa aataaatagg 60

catattagag tttcctttct tgcatcttaa aattcatcta acacatctat aataacattc 120

<210> 109

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

ttcttttttt tccattctag gacttgcccc tttcgtctat ttgtcagacg aatgttacaa 60

tttactggca ataaagtttt ggatagacct taatgaggac attattaagc ctcatatgtt 120

<210> 110

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

atagacctta atgaggacat tattaagcct catatgttaa ttgctgcaag caacctccag 60

tggcgaccag aatccaaatc aggccttctt actttatttg ctggagattt ttctgtgttt 120

<210> 111

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

gccttcttac tttatttgct ggagattttt ctgtgttttc tgctagtcca aaagagggcc 60

actttcaaga gacattcaac aaaatgaaaa atactgttga ggtaaggtta cttttcagca 120

<210> 112

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

ttttccactt attttcttag aatattgaca tactttgcaa tgaagcagaa aacaagctta 60

tgcatatact gcatgcaaat gatcccaagt ggtccacccc aactaaagac tgtacttcag 120

<210> 113

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

actgcatgca aatgatccca agtggtccac cccaactaaa gactgtactt cagggccgta 60

cactgctcaa atcattcctg gtacaggaaa caagcttctg gtaagttaat gtaaactcaa 120

<210> 114

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

cgttttcatt tttttatcag atgtcttctc ctaattgtga gatatattat caaagtcctt 60

tatcactttg tatggccaaa aggaagtctg tttccacacc tgtctcagcc cagatgactt 120

<210> 115

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

tcaaagtctt gtaaagggga gaaagagatt gatgaccaaa agaactgcaa aaagagaaga 60

gccttggatt tcttgagtag actgccttta cctccacctg ttagtcccat ttgtacattt 120

<210> 116

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 116

tgtttctccg gctgcacaga aggcatttca gccaccaagg agttgtggca ccaaatacga 60

aacacccata aagaaaaaag aactgaattc tcctcagatg actccattta aaaaattcaa 120

<210> 117

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 117

atgaaatttc tcttttggaa agtaattcaa tagctgacga agaacttgca ttgataaata 60

cccaagctct tttgtctggt tcaacaggag aaaaacaatt tatatctgtc agtgaatcca 120

<210> 118

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 118

actaggactg ctcccaccag ttcagaagat tatctcagac tgaaacgacg ttgtactaca 60

tctctgatca aagaacagga gagttcccag gccagtacgg aagaatgtga gaaaaataag 120

<210> 119

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 119

gcaggacaca attacaacta aaaaatatat ctaagcattt gcaaaggcga caataaatta 60

ttgacgctta acctttccag tttataagac tggaatataa tttcaaacca cacattagta 120

<210> 120

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 120

actgaagagt gagaggagct cccagggcct ggaaaggcca ctttgtaagc tcattcttgg 60

ggtcctgtgg ctctgtacct gtggctggct gcagtcagta gtggctgtgg gggatctggg 120

<210> 121

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 121

ggtatcaggt aggtgtccag ctcctggcac tggtagagtg ctacactgtc caacacccac 60

tctcgggtca ccacaggtgc ctcacacatc tgcccaattg ctggagacag agaacacaag 120

<210> 122

<211> 114

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 122

acagggcacc caatacttac tgtgccaagg gtgaatgatg aaagctcctt caccacagaa 60

gcaccacaca gctgtaccat ccattccagt tgatctaaaa tggacattta gatg 114

<210> 123

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 123

agctgtacca tccattccag ttgatctaaa atggacattt agatgtaaaa tcactgcagt 60

aatctgcata cttaacccag gccctctacc ctacactctc cggatgaagg cttatagcaa 120

<210> 124

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 124

acacccacct tccttccctc ccttcctccc ttcatcctaa ttctgtgttg gtaactgata 60

atcacggcca ctgaaaatac catacttggt ggtaattact gtaaatgtca agagatggga 120

<210> 125

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 125

tactgtaaat gtcaagagat gggaagataa ttcatccagt caaaaaaata catgttatcc 60

tggttagaga ctcagcaggg aaaggctaca tgctgagctg gaatccatat actcagggga 120

<210> 126

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 126

agataattca tccagtcaaa aaaatacatg ttatcctggt tagagactca gcagggaaag 60

gctacatgct gagctggaat ccatatactc aggggaataa aaatcagaag agactgtgga 120

<210> 127

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 127

aaaaaaaaga aaaaaaaaaa gaaatgttca ccgagaatct tcccctgctc tgggcccgtc 60

cgtggtgggc cagctgctgt gctttcttct atgtaagtaa attaagatgg tttaggaaga 120

<210> 128

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 128

aaaagaaaaa aaaaaagaaa tgttcaccga gaatcttccc ctgctctggg cccgtccgtg 60

gtgggccagc tgctgtgctt tcttctatgt aagtaaatta agatggttta ggaagaggag 120

<210> 129

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 129

ggagaactcc tccttgattt ttacctatcc aaagatattt tctcactaac atgttggcac 60

taacagcagc tcaacgccat ctgaacacat aacatactga atcctaacta ttaaccacct 120

<210> 130

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 130

tgaggaaccc ccatcgtggg atcttgctta taatactcca ctatgtaaga caaaggctgg 60

tgctggaact ctggggttct cccaggctct tacctgtggg catgttggtg aagggcccat 120

<210> 131

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 131

gggttctccc aggctcttac ctgtgggcat gttggtgaag ggcccatagc aacagatttc 60

tagccccctg aagatctgga agaagagagg aagag 95

<210> 132

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 132

cccatagcaa cagatttcta gccccctgaa gatctggaag aagagaggaa gagagaggga 60

caggggaatg gagagaagga aaatctagtt ataaaagaat attggctttt attcaaaaaa 120

<210> 133

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 133

cagactttca aaaaggaaga gcttttcttt ttcttctgtt caccacctga tgatttctgc 60

tgctacttcc cagggacaag cagtccaatg tccagaacac tactggattt cagaagatct 120

<210> 134

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 134

acctgatgat ttctgctgct acttcccagg gacaagcagt ccaatgtcca gaacactact 60

ggatttcaga agatcttctt gaagtgcata tgtagttgac ctgcactcta caggcattct 120

<210> 135

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 135

tcttgaagtg catatgtagt tgacctgcac tctacaggca ttctttgtca ttcaaggact 60

gagcatctca cttttgtcac caatcaggcc aaggctcctc cctaatgatc tctgcaggtg 120

<210> 136

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 136

ctttaacttg ttagatgcaa gggaaaaaag gtccttctgt atgtttaata agaggcttgg 60

atggctagaa actcaaagtt attggctgaa gtttgatgtt tatccagact tggtacctca 120

<210> 137

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 137

actcaaagtt attggctgaa gtttgatgtt tatccagact tggtacctca agtactcact 60

atgaccccat caacagaggg gtctatgttg attttaggtg tacatgctcc ttgtctcctc 120

<210> 138

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 138

gtcttaaaaa aaaaaaaaaa gaaatttgaa gtttcacctc tacatataca tttctcttcc 60

agagaaaaat actatggtga catttagtat tttcagaatg tcattacttt gaccacatac 120

<210> 139

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 139

aaaaagaaat ttgaagtttc acctctacat atacatttct cttccagaga aaaatactat 60

ggtgacattt agtattttca gaatgtcatt actttgacca catactttcc atcattgcta 120

<210> 140

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 140

tttccatcat tgctattctg catggaggaa aaaatccaaa gcactagaat ttctttttaa 60

agaggggaag aatctggtgc taatactgcc tagcatacag tggaggaaaa acagaggact 120

<210> 141

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 141

aaaatgaagc ggcccatctc tgcaaagggg agtggaatac agagtggtgg ggtgagattt 60

ttgtcaactt gagggaggga gctttacctt tctgtcctgg gattctcttg ctcgctttgg 120

<210> 142

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 142

cttgagggag ggagctttac ctttctgtcc tgggattctc ttgctcgctt tggaccttgg 60

tggtttcttc cattgaccac atctcctctg acttcaaaat catgctgaaa gaaaccaaac 120

<210> 143

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 143

agggagggag ctttaccttt ctgtcctggg attctcttgc tcgctttgga ccttggtggt 60

ttcttccatt gaccacatct cctctgactt caaaatcatg ctgaaagaaa ccaaacacaa 120

<210> 144

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 144

acaattaaag accttttggt aactcagact cagcatcagc aaaaacctta ggtgttaaac 60

gttaggtgta aaaatgcaat tctgaggtgt taaagggagg aggggagaaa tagtattata 120

<210> 145

<211> 118

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 145

agaaatagta ttatacttac agaaatagct aactacccat tttcctcccg caattcctag 60

aaaatatttc agtgtccgtt cacacacaaa ctcagcatct gcagaatgaa aaacactc 118

<210> 146

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 146

ttcagtgtcc gttcacacac aaactcagca tctgcagaat gaaaaacact caaaggatta 60

gaagttgaaa acaaaatcag gaagtgctgt cctaagaagc taaagagcct cagtttttta 120

<210> 147

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 147

cactcccaag atcaatctgg atttatgatt ctaaaacccc tggtgacaga atcagaggct 60

gaaaacacca ctaattataa ccagcaggta tggatatttg gaagtctagg ggaggctgat 120

<210> 148

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 148

tatggatatt tggaagtcta ggggaggctg atatgaagtt aagaccagag gaaatatctg 60

tccactccct cttctcaaca cccatcttct agacgccaag gctagctata gatctccatt 120

<210> 149

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 149

atgaagttaa gaccagagga aatatctgtc cactccctct tctcaacacc catcttctag 60

acgccaaggc tagctataga tctccattat agtgttcaag gaattaggaa ttatccatgt 120

<210> 150

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 150

ccagagaact aattttgtta gaaagatttt agagttgagc cacacaatct gcatcttctg 60

cgtcctccat gcactcgtct gctttctgga gccccatgag tgagtcttaa tcctgttcca 120

<210> 151

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 151

tctgctttct ggagccccat gagtgagtct taatcctgtt ccagataaca gttctcttcc 60

gggtaacggt tcttcagata cttgaagaca gtgtcttatt tccttaaatc ttctcatttc 120

<210> 152

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 152

gataacagtt ctcttccggg taacggttct tcagatactt gaagacagtg tcttatttcc 60

ttaaatcttc tcatttcttc ttcaaaagac agtatttcaa gttactttta tgtatcttta 120

<210> 153

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 153

cacccagagg tctcctgtat tacacaagtt ataattaaaa ccttaaaaga gaaaggtata 60

ggacaaatga tctgtctcct cccttttttg ctttttcata tgttaagact atctcggagc 120

<210> 154

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 154

tataggacaa atgatctgtc tcctcccttt tttgcttttt catatgttaa gactatctcg 60

gagctgttat cagacttttt tcctgaaaaa ctctcaacaa tactcaaact aggtgttaca 120

<210> 155

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 155

tgttatcaga cttttttcct gaaaaactct caacaatact caaactaggt gttacatgaa 60

gctggggtct ccaggttttg cctcacttgt tctttctttt gttgttgttg agacagagtc 120

<210> 156

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 156

ttactgatgc gagccaccgc gtccagctgc ctcacttgtt gttttaggac ttaggctcca 60

cctcaccagt gtagtcccag caggtagata ggagttaata gttgactatc tcagctcacc 120

<210> 157

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 157

tgcgagccac cgcgtccagc tgcctcactt gttgttttag gacttaggct ccacctcacc 60

agtgtagtcc cagcaggtag ataggagtta atagttgact atctcagctc accaccctcc 120

<210> 158

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 158

tgcgattaca ggcatgcgcc accgtgcctc gcctcatgtg gttttatgca gcagatgcaa 60

ggtattctgt aaaggttctt ggtatacctg ttttcataac aacatgagta gtctcttcag 120

<210> 159

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 159

atgcgccacc gtgcctcgcc tcatgtggtt ttatgcagca gatgcaaggt attctgtaaa 60

ggttcttggt atacctgttt tcataacaac atgagtagtc tcttcagtaa ttagattagt 120

<210> 160

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 160

tgtaaaggtt cttggtatac ctgttttcat aacaacatga gtagtctctt cagtaattag 60

attagttaaa gtgatgtggt gttttctggc aaacttgtac acgagcatct gaaattaaat 120

<210> 161

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 161

ttcttggtat acctgttttc ataacaacat gagtagtctc ttcagtaatt agattagtta 60

aagtgatgtg gtgttttctg gcaaacttgt acacgagcat ctgaaattaa atcaaatatt 120

<210> 162

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 162

tgttttctgg caaacttgta cacgagcatc tgaaattaaa tcaaatattc cattatcatg 60

agttacctct agcacacagc tcagaatact agttattcca ccatggcata tgtttacct 119

<210> 163

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 163

atacatatgg atacactcac aaattcttct ggggtcaggc cagacaccac catggacatt 60

cttttgttga ccctttctgt tgaagctgtc aattctggct tctccctgct cacactttct 120

<210> 164

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 164

ttcttccatt gcattatacc cagcagtatc agtagtatga gcagcagctg gactctgggc 60

agattctgca actttcaatt ggggaacttt caatgcagag gttgaagatg gtatgttgcc 120

<210> 165

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 165

tgccaacacg agctgactct ggggctctgt cttcagaagg atcagattca gggtcatcag 60

agaagaggct gattccagat tccaggtaag gggttccctc tgaaaggaat gggagaagt 119

<210> 166

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 166

tacagcagat gaaatattac ctagatcttg ccttggcaag taagatgttt ccgtcaaatc 60

gtgtggccca gactcttcca gctgttgctc ctccacatca acaaccttaa tgagctcctc 120

<210> 167

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 167

gagctcctct tgagatgggt agtttctatt ctgaagactc ccagagcaac tgtgcatgta 60

ccacctatca tctaatgatg ggcatttaga aggggatgac ctagaaagat aaatggaagg 120

<210> 168

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 168

gaaagataaa tggaaggaga aaaccatcgc caccaattgt gaaaggacaa atcatacttg 60

ctgggcagcc aaagcataaa tgaaacagct catgtcagag agatcagaaa tgactggcaa 120

<210> 169

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 169

cataaatgaa acagctcatg tcagagagat cagaaatgac tggcaaaaaa gagcccgcaa 60

gacagcctag aagtctggat tcatgttgcc tgccaatatg tcagggttga catataacat 120

<210> 170

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 170

tttacattga tgtttcttac ctttccactc ctggttcttt atttttactg gtagaactat 60

ctgcagacac ctcaaacttg tcagcagaaa ggccttctgg attctggctt atagggtatt 120

<210> 171

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 171

ctggtagaac tatctgcaga cacctcaaac ttgtcagcag aaaggccttc tggattctgg 60

cttatagggt attcactact tttctgtgaa gttaatactg ctttaaatgg aatgagaaaa 120

<210> 172

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 172

tctggcttat agggtattca ctacttttct gtgaagttaa tactgcttta aatggaatga 60

gaaaacaaat ctactttact gctttgttct gatagtgata attcaggtta gaatactgat 120

<210> 173

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 173

catgcctggc caaggcggaa atatttaata agtaaaaaca aatagttaaa aattgcaaaa 60

gtcttctatt cattaaaaag tcactgatga ctgtaattca ttttgagctt ttattagaaa 120

<210> 174

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 174

aagtaaaaac aaatagttaa aaattgcaaa agtcttctat tcattaaaaa gtcactgatg 60

actgtaattc attttgagct tttattagaa aagctaaaag ccataaatat aggtagaaaa 120

<210> 175

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 175

ttggactgta aaaaaaaaga aaagtcattc tatcaccaga acatttagca tataaattcc 60

tcttcttact acaatgggcc tcatgcaatg aagcaaataa gataacttgt tagaagttaa 120

<210> 176

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 176

aagaaaagtc attctatcac cagaacattt agcatataaa ttcctcttct tactacaatg 60

ggcctcatgc aatgaagcaa ataagataac ttgttagaag ttaacaactc aatagaacct 120

<210> 177

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 177

caactcaata gaacctgaaa aacagagcaa aacctttctg cttttttttc tccttaatcc 60

ttaattcatt ctctgaacag caagcccaac ctaagccttg tgacatgatg atctacttgc 120

<210> 178

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 178

catgaatgac tgccttgggt ccctctgact ggtatattag ttgtgagcag ggacaagaac 60

caaggctcca taattaccca tgtgctgagc aaggatcata aaatgttgga gctaggtcct 120

<210> 179

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 179

gtccctctga ctggtatatt agttgtgagc agggacaaga accaaggctc cataattacc 60

catgtgctga gcaaggatca taaaatgttg gagctaggtc cttactcttc agaaggagat 120

<210> 180

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 180

tactcttcag aaggagataa aggggaagga aagaattttg cttaagatat cagtgtttgg 60

ccaacaatac acaccttttt ctgatgtgct ttgttctgga tttcgcaggt cctcaagggc 120

<210> 181

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 181

gtttggccaa caatacacac ctttttctga tgtgctttgt tctggatttc gcaggtcctc 60

aagggcagaa gagtcactta tgatggaagg gtagctgtta gaaggctggc tcccatgctg 120

<210> 182

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 182

agctgttaga aggctggctc ccatgctgtt ctaacacagc ttctagttca gccatttcct 60

gctggagctt tatcaggtta tgttgcatgg tatccctctg cttcaaaaac gataaatggc 120

<210> 183

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 183

tccatctcaa aaaaaaaaat taggagaaag agcctggttc tatgatgaag atgatattca 60

tttttagacg ttgtgataca gaatgttttt tctagactat tctgccttta gtacataaac 120

<210> 184

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 184

acataaacat ttcatattac attatcaaat ggtcatatat atggtaaagc ttttatttat 60

ttcataggtg accaaattat tggccttgac cattaggtcc agaaagtaaa attgtgtact 120

<210> 185

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 185

cacacacaca cgctttttac ctgagtggtt aaaatgtcac tctgagagga tagccctgag 60

cagtcttcag agacgcttgt ttcactctca cacccagatg ctgcttcacc ttaaataaca 120

<210> 186

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 186

acgcttttta cctgagtggt taaaatgtca ctctgagagg atagccctga gcagtcttca 60

gagacgcttg tttcactctc acacccagat gctgcttcac cttaaataac aaaaacagag 120

<210> 187

<211> 117

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 187

ttggcaaact ttgccattac ccttttttgc agaatccaaa ctgatttcat ccctggttcc 60

ttgaggggtg atttgtaaca attcttgatc tcccacacta tagggaaaag acagagt 117

<210> 188

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 188

aactgatttc atccctggtt ccttgagggg tgatttgtaa caattcttga tctcccacac 60

tatagggaaa agacagagtc ctaataagaa acactagtta catgtatgca gaactgtcaa 120

<210> 189

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 189

cttaatatta actaaatagg aaaataccag cttcatagac aaaggttctc tttgactcac 60

ctgcaataag ttgccttatt aacggtatct tcagaagaat cagatcctaa aaaatttccc 120

<210> 190

<211> 86

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 190

aaaggttctc tttgactcac ctgcaataag ttgccttatt aacggtatct tcagaagaat 60

cagatcctaa aaaatttccc cccaaa 86

<210> 191

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 191

ttcagaagaa tcagatccta aaaaatttcc ccccaaaaaa taaatcaata aaagttttct 60

taattaaaag ggttaaaaaa atgtacttgt tgaaaaacag atattcaact agaaatattt 120

<210> 192

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 192

aggaatttat gatcataagg ggggaaaaca gtaagtgtta tgataaatag atggtggtgc 60

ctgggagctc aaaagatggc tatccttttt aattataaat atattctaaa agaaaatcca 120

<210> 193

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 193

tgggagctca aaagatggct atccttttta attataaata tattctaaaa gaaaatccaa 60

tttgagagcc cagtttgaat tctgagctca gcagctcttt tttttttttt tttggaggt 119

<210> 194

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 194

gagccaccat gcctggcctc ttttgctccc tttttaaagt aagattcttc aaggtgggaa 60

ctgcgtcttt tacatttttt ataactcacc atagggctca taaaattcac ttcccaaagc 120

<210> 195

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 195

ctcttttgct ccctttttaa agtaagattc ttcaaggtgg gaactgcgtc ttttacattt 60

tttataactc accatagggc tcataaaatt cacttcccaa agctgcctac cacaaataca 120

<210> 196

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 196

tgcctaccac aaatacaaat tatgaccaag atttttggca aaactataag ataaggaatc 60

cagcaattat tattaaatac ttaaaaaacc tgagaccctt acccaattca atgtagacag 120

<210> 197

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 197

aaaaaacctg agacccttac ccaattcaat gtagacagac gtcttttgag gttgtatccg 60

ctgctttgtc ctcagagttc tcacagttcc aaggttagag agttggacac tgagactggt 120

<210> 198

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 198

caatgtagac agacgtcttt tgaggttgta tccgctgctt tgtcctcaga gttctcacag 60

ttccaaggtt agagagttgg acactgagac tggtttcctg ctaaacagta tggtaaagaa 120

<210> 199

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 199

agttggacac tgagactggt ttcctgctaa acagtatggt aaagaacagt caagcaattg 60

ttggccagtt ctgtgctttt cctcctgaag agaaacttga caccatggac aaaataaatt 120

<210> 200

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 200

aagaaaacaa atggttttac caaggaagga ttttcgggtt cactctgtag aagtcttttg 60

gcacggtttc tgtagcccat actttggatg atagaaactt catcttttag atgttcagga 120

<210> 201

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 201

gcacggtttc tgtagcccat actttggatg atagaaactt catcttttag atgttcagga 60

gagttatttt ccttttttgc aaaattatag ctgtttgcat ctgtaaaata caagggaaaa 120

<210> 202

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 202

ttgggatatt caacacttac actccaaacc tgtgtcaagc tgaaaagcac aaatgatttt 60

caatagctct tcaacaagtt gactaaatct cgtactttct tgtaggctcc tgaaattaaa 120

<210> 203

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 203

tcaacactta cactccaaac ctgtgtcaag ctgaaaagca caaatgattt tcaatagctc 60

ttcaacaagt tgactaaatc tcgtactttc ttgtaggctc ctgaaattaa attgtttgag 120

<210> 204

<211> 94

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 204

cataacacat tcaaacttac ttgcaaaata tgtggtcaca ctttgtggag acaggttcct 60

tgatcaactc cagactagca gggtaggggg ggag 94

<210> 205

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 205

ggttccttga tcaactccag actagcaggg taggggggga gaaaaagaaa ataaatgagg 60

ctcaataatt tatttaaaaa taaagctatt cttagtgaat aagttcaact ttgagctgtt 120

<210> 206

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 206

tgcacatctc atctttaagc tccataaaga caaaattttc tgcttatatt tcttttgaat 60

tccttcctag aacttttttt tgtttactgt aaatgccttt ttaacttaat atggaaaat 119

<210> 207

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 207

tgcacatctc atctttaagc tccataaaga caaaattttc tgcttatatt tcttttgaat 60

tccttcctag aacttttttt tgtttactgt aaatgccttt ttaacttaat atggaaaatt 120

<210> 208

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 208

ataagccacc gccctcggcc tcatccatga ttttattttg ccatttcaag tgatggagct 60

tgttttagag ctggaagaaa agccaaaatg ccagttaatc taaactagat tcctgcccca 120

<210> 209

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 209

gatggagctt gttttagagc tggaagaaaa gccaaaatgc cagttaatct aaactagatt 60

cctgccccag tgcagaacca atcaagacag agtccctgtc tttcccggac cacaggattt 120

<210> 210

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 210

catgtctttt cttccctagt atgtaaggtc aattctgttc atttgcatag gagataatca 60

taggaatccc aaattaatac actcttgtgc tgacttacca gatgggacac tctaagattt 120

<210> 211

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 211

acactcttgt gctgacttac cagatgggac actctaagat tttctgcata gcattaatga 60

cattttgtac ttcttcaacg cgaagagcag ataaatccat ttctttctgt tccaatgaac 120

<210> 212

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 212

ccagatggga cactctaaga ttttctgcat agcattaatg acattttgta cttcttcaac 60

gcgaagagca gataaatcca tttctttctg ttccaatgaa ctttaacaca ttagaaaaac 120

<210> 213

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 213

acaacttcat tttatcattt taaaataaag taaatttaag atttggaagg ttttagaata 60

atacaaacca aagaactaat gacaacgtcc tttattttta aagattctag aagttgcttt 120

<210> 214

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 214

agattctaga agttgctttt tgtaattaga caacataaat tctgaatttt ttcacatatt 60

gctgccaacc ccttgggtct tttcctttct ccaagaaaga gaaagctaca gaggagtgac 120

Claims

1.探针组，其特征在于，所述探针组覆盖的基因组区域包括表1中的15个基因的305个外显子区域。

2.根据权利要求1所述的探针组，其特征在于，所述探针组包括SEQ ID NO:1～214所示序列的探针。

3.试剂盒，其特征在于，所述试剂盒包含有权利要求1或2所述的探针组。

4.权利要求1或2所述探针组的非疾病诊断治疗目的用途，其特征在于，用于等位基因的拷贝数变异检测。

5.权利要求3所述试剂盒的非疾病诊断治疗目的的用途，其特征在于，用于等位基因的拷贝数变异检测。

6.权利要求1或2所述探针组在制备等位基因拷贝数变异检测试剂中的应用。

7.权利要求3所述试剂盒在制备等位基因拷贝数变异检测试剂中的应用。

8.单样本等位基因拷贝数变异检测系统，其特征在于，包括：

注释模块，用于拷贝数变异注释。

9.单样本等位基因拷贝数变异检测系统的构建方法，其特征在于，包括：BAF潜在SNP位点筛选步骤和背景集样本筛选步骤；

所述BAF潜在SNP位点筛选步骤包括：对SNP筛选样本进行胚系变异检测和硬过滤，筛选出突变频率为0.4～0.6和0.9以上且出现次数在2次以上的SNP位点；在SNP公共数据集中筛选出权利要求1或2所述探针组覆盖的基因组区域对应的SNP位点；将筛选出的所有SNP位点合并去重，获得BAF潜在SNP位点；

所述背景集样本筛选步骤包括：提取背景集候选样本的DNA，扩增，建库，用权利要求1或2所述探针组捕获目标基因，测序并将测序数据与参考基因组进行比对去重，获得背景集候选样本的细胞比对数据；计算探针覆盖度并归一化；线性回归聚类，选择样本数目最大的子集作为背景集样本。

10.根据权利要求9所述的方法，其特征在于，还包括阳性样本集筛选步骤：对潜在阳性样本，分别用不同的软件进行拷贝数变异检测，有2款以上软件检测出拷贝数变异的样本为阳性样本。

11.根据权利要求9或10所述的方法，其特征在于，还包括bin参数、片段化方法、拷贝数比值阈值筛选步骤：

12.根据权利要求11所述的方法，其特征在于，所述目标区域的bin参数为199bp，非目标区域的bin参数为500000bp；所述片段化方法采用环状二元分割方法；所述拷贝数比值阈值包括拷贝数缺失突变判断阈值和拷贝数扩增突变判断阈值，所述拷贝数缺失突变判断阈值为0.6，所述拷贝数扩增突变判断阈值为1.5。

13.单样本等位基因拷贝数变异检测方法，所述方法为非疾病诊断治疗目的，其特征在于，步骤包括：

1)提取待测样本DNA，扩增，建库，用权利要求1或2所述探针组捕获目标基因，富集，测序，测序数据比对到参考基因组上，去重，获得待测样本的细胞比对数据；

14.根据权利要求13所述的方法，其特征在于，步骤2)，目标区域的bin参数为199bp，非目标区域的bin参数为500000bp；步骤3)所述片段化方法为环状二元分割方法；步骤7)所述拷贝数比值阈值为：拷贝数缺失突变判断阈值0.6，拷贝数扩增突变判断阈值1.5。

15.根据权利要求13所述的方法，其特征在于，步骤5)，当肿瘤纯度大于40％时，将肿瘤纯度信息纳入肿瘤总拷贝数和次等位基因拷贝数的计算。