CN113889187A - 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 - Google Patents
单样本等位基因拷贝数变异检测方法、探针组和试剂盒 Download PDFInfo
- Publication number
- CN113889187A CN113889187A CN202111123593.7A CN202111123593A CN113889187A CN 113889187 A CN113889187 A CN 113889187A CN 202111123593 A CN202111123593 A CN 202111123593A CN 113889187 A CN113889187 A CN 113889187A
- Authority
- CN
- China
- Prior art keywords
- copy number
- artificial sequence
- dna
- sample
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
Landscapes
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于等位基因拷贝数变异检测的探针组,该探针组覆盖的基因组区域包括表1中的15个同源重组修复相关基因的305个外显子区域。本发明还公开了包含所述探针组的试剂盒以及应用所述探针组进行单样本特定基因组区域等位基因拷贝数变异检测的方法,该方法将待测样本目标基因序列的测序数据比对到参考基因上,以线性回归聚类的样本数据为背景集,利用训练集优化的软件参数,检测同源重组修复通路上关键基因的DNA外显子水平以上的拷贝数变化,并综合等位基因频率和肿瘤纯度信息,预测拷贝数变异类型。该方法不仅可以一次检查多个基因的外显子水平的拷贝数变异,而且灵敏度、准确性和特异性高,成本低。
Description
技术领域
本发明涉及基因检测领域,特别是涉及等位基因拷贝数变异检测,更具体地说,是涉及同源重组修复基因DNA外显子水平以上的拷贝数纯合缺失、杂合缺失、拷贝数扩增和拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失突变检测。
背景技术
近年来,伴随着二代测序技术(NGS,又称高通量测序技术)的发展,测序成本和时间不断下降,二代测序的应用领域逐渐扩展,促进了生命科学领域的飞速发展。测序技术从诞生之初就是为了进行癌症领域方面的研究,二代测序技术在癌症领域的研究也越来越广泛。基于二代测序技术,识别各种癌症相关的生物信号,能够辅助癌症的诊断、治疗和预后。
拷贝数变异(Copy Number Vairant,CNV)是指会引起1kb以上DNA片段拷贝数变化的结构变异,包括基因扩增(拷贝数增加)和基因缺失(拷贝数减少)。拷贝数变异按照大小可以分为显微水平和亚显微水平,显微水平指显微镜下可见的染色体畸变;亚显微水平指1kb~3Mb的DNA片段改变。拷贝数变异大部分发生在蛋白编码区域,是肿瘤细胞生长常见的生物学现象,与肿瘤细胞的生长、耐药性和敏感性相关。赫赛汀是最早的靶向精准抗癌药物之一,用于治疗肿瘤中存在ERBB2(HER2)基因扩增的乳腺癌患者。
同源重组修复(Homologous recombination repair,HRR)是一种利用相同或者相近的序列为模板,精确地进行DNA双链修复的DNA修复机制。除了比较有名的BRCA1和BRCA2基因外,同源重组修复通路还包含上下游调控的基因,一般认为同源重组修复通路大致包含如下15个基因:BRCA1、BRCA2、ATM、BARD1、BRIP1、CDK12、CHEK1、CHEK2、FANCL、PALB2、RAD51B、RAD51C、RAD51D、RAD54L以及FANCA。同源重组缺陷正是由于这些基因的失活而导致的一系列基因组改变。一般存在这些基因的失活的患者,对于PARP抑制剂或者DNA损伤试剂敏感。截止2021年5月4日,COSMIC数据库中,收录的BRCA1和BRCA2突变中,乳腺癌患者BRCA1发生拷贝数缺失的频率为0.13%(1492个测试样本),BRCA2发生拷贝数缺失频率为0.4%(1492个测试样本)。
拷贝数变异的检测方法大致有三种:荧光原位杂交(fluorescence in situhybridization,FISH)、微阵列比较基因组杂交(array comparative genomichybridization,aCGH)和二代测序方法(Next-generation sequencing,NGS)。FISH利用荧光分子基团与DNA片段结合,然后与待测样本进行杂交,最后在荧光显微镜下观察基因序列的改变。微阵列比较基因组杂交技术是一种分子细胞遗传技术,能在基因组范围内高分辨率地检测染色体的拷贝数变化(可以检测5-10kb水平的拷贝数变化)。FISH和aCGH技术受限于拷贝数变异区域大小和肿瘤样本纯度,识别分辨率和准确性均有待提高。二代测序技术,相比荧光原位杂交和微阵列比较基因组杂交技术,具有以下优势:高覆盖度与高分辨率、拷贝数检测更加精确、断点识别更加准确,并且能够识别新的拷贝数变异。
专利号为ZL201510744574.4的中国发明专利披露了一种检测基因组拷贝数变异的方法,该方法采用滑动窗口进行拷贝数检测,并通过GC校正,降低GC含量对于覆盖度的影响,通过确定拷贝数正常的阈值,来确定拷贝数变异的具体区间。但是该方法未利用对照组构建背景库,来排查不同的建库方法、测序过程中引入的系统偏差,因而检测结果可能存在一定的系统偏差,无法准确识别拷贝数缺失突变是纯合还是杂合。
申请号为CN202010771902.0的中国发明专利申请披露了一种检测HER2基因扩增的试剂盒及方法,该方法采用数字微滴PCR技术检测HER2基因拷贝数变异,但该方法的缺点是仅能检测HER2基因扩增,无法涵盖多个基因的拷贝数变异检测。
申请号为CN202010880479.8的中国发明专利申请披露了一种检测特定区域的等位基因拷贝数的方法,该方法采用机器学习方法利用肿瘤样本和对照样本完成体细胞等位基因拷贝数变异检测,但该方法的缺点是必须要用对照样本完成检测,无法针对单样本进行检测。
发明内容
本发明要解决的技术问题之一是提供一组探针,该探针组覆盖的基因组区域包括表1中的15个基因的305个外显子区域。
上述探针组优选为包括SEQ ID NO:1~214所示序列的探针。
本发明要解决的技术问题之二是提供一种包含有上述探针组的试剂盒。
本发明要解决的技术问题之三是提供上述探针组和试剂盒的用途。所述探针组和试剂盒可用于等位基因的拷贝数变异检测。所述探针组和试剂盒也可应用于制备等位基因拷贝数变异检测试剂。所述的等位基因优选为同源重组修复基因,特别是优选为与前列腺癌相关的同源重组修复基因。
本发明要解决的技术问题之四是提供一种单样本等位基因拷贝数变异检测系统,该系统主要包括:
比对数据获取模块,用于权利要求1或2所述探针组捕获的基因组区域的测序以及测序数据与参考基因组的比对去重,获取样本的细胞比对数据;
存储模块,用于存储BAF潜在SNP位点集,背景库,以及背景集样本、阳性样本、阴性样本的测序数据和比对数据;
计算模块,用于根据bin参数划分目标区域和非目标区域,计算每个区域的覆盖度、拷贝数比值、覆盖度的log2值、拷贝数比值的log2值,筛选次等位基因频率信息,计算肿瘤总拷贝数和次等位基因拷贝数;
注释模块,用于拷贝数变异注释。
本发明要解决的技术问题之五是提供一种单样本等位基因拷贝数变异检测系统的构建方法,该方法主要包括BAF潜在SNP位点筛选步骤和背景集样本筛选步骤;
所述BAF潜在SNP位点筛选步骤包括:对SNP筛选样本进行胚系变异检测和硬过滤,筛选出突变频率为0.4~0.6和0.9以上且出现次数在2次以上的SNP位点;在SNP公共数据集(例如dbsnp)中筛选出上述探针组覆盖的基因组区域对应的SNP位点;将筛选出的所有SNP位点合并去重,获得BAF潜在SNP位点;
所述背景集样本筛选步骤包括:提取背景集候选样本的DNA,扩增,建库,用上述探针组捕获目标基因,测序并将测序数据与参考基因组进行比对去重,获得背景集候选样本的细胞比对数据;计算探针覆盖度并归一化;线性回归聚类,选择样本数目最大的子集作为背景集样本。
进一步的,所述构建方法还可以包括阳性样本集筛选步骤和bin参数、片段化方法、拷贝数比值阈值筛选步骤。
所述阳性样本集筛选步骤包括:对潜在阳性样本,分别用不同的软件进行拷贝数变异检测,有2款以上软件检测出拷贝数变异的样本为阳性样本。
所述bin参数、片段化方法、拷贝数比值阈值筛选步骤包括:
1)按照不同的bin参数划分目标区域和非目标区域,分别计算每个样本目标区域和非目标区域bin的覆盖度和覆盖度的log2值;
2)校正背景集样本的覆盖度和覆盖度的log2值,以及目标区域和非目标区域bin的GC含量和重复性,构建背景库;
3)利用所述背景库,针对阴性样本和阳性样本的覆盖度数据,进行GC偏好性、重复性和探针偏好性校正,获得目标区域和非目标区域bin的拷贝数比值的log2值,利用默认的片段化方法延长每个bin至拷贝数状态相同的区域,计算每个区域的拷贝数比值,按照默认的拷贝数比值阈值筛选阴性样本和阳性样本的拷贝数缺失变异和拷贝数扩增变异;
4)重复上述步骤1)~3),利用阴性样本和阳性样本的拷贝数筛选结果,统计分析二分类评价指标,确定bin参数;
5)用不同的片段化方法和阈值,重复上述步骤3),利用阴性样本和阳性样本的拷贝数筛选结果,统计分析二分类评价指标,确定优化后的片段化方法和拷贝数比值阈值。
所述bin参数的优选值为目标区域bin参数199bp,非目标区域bin参数500000bp。
所述片段化方法优选采用环状二元分割方法。
所述拷贝数比值阈值优选为:拷贝数缺失突变判断阈值0.6,拷贝数扩增突变判断阈值1.5。
本发明要解决的技术问题之六是提供一种单样本等位基因拷贝数变异检测方法,该方法的步骤包括:
1)提取待测样本DNA,扩增,建库,用上述探针组捕获目标基因,富集,测序,测序数据比对到参考基因组上,去重,获得待测样本的细胞比对数据;
2)划分目标区域和非目标区域,计算每个区域的覆盖度、覆盖度的log2值和拷贝数比值的log2值;
3)利用片段化方法计算每个区域的拷贝数比值,获得拷贝数比值变异区域;
4)对BAF潜在SNP位点进行深度检测和变异检测,并筛选得到次等位基因频率信息;
5)针对拷贝数状态相同的区域,结合次等位基因频率信息,计算每个区域的肿瘤总拷贝数和次等位基因拷贝数;
6)对每个基因进行拷贝数变异区域的外显子注释,获得每个基因的注释拷贝数结果;
7)按照检测基因列表和拷贝数比值阈值筛选拷贝数变异区域,并根据肿瘤总拷贝数和次等位基因拷贝数进行纯合缺失、杂合缺失、拷贝数扩增、拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失的注释。
上述步骤5),肿瘤总拷贝数TCN、主等位基因拷贝数MCN、次等位基因拷贝数BCN的计算公式分别为:
TCN=ref_copy×2log2ratio
MCN=TCN×(|tumorbaf-0.5|+0.5)
BCN=TCN-MCN
其中,肿瘤次等位基因频率tumorbaf等于SNP频率信息obsbaf。
当肿瘤纯度大于40%时,可以将肿瘤纯度信息纳入肿瘤总拷贝数和次等位基因拷贝数的计算,肿瘤总拷贝数TCN的计算公式和肿瘤次等位基因频率tumorbaf的校正公式分别为:
本发明利用杂交捕获探针组合获取目标基因序列,利用高通量测序平台,进行单样本同源重组修复通路上关键基因的DNA外显子水平以上的拷贝数纯合、杂合缺失、拷贝数扩增、拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失等突变的检测。与现有拷贝数变异检测技术相比,本发明的拷贝数变异检测方法,具有以下优点和有益效果:
1.本发明采用杂交捕获和NGS测序方式,可一次检测多个基因的外显子水平的拷贝数变异,且检测速度快,效率高,成本低;
2.本发明采用线性回归聚类的方法筛选背景集样本,并利用MAD方法综合多个样本的探针覆盖度,完成背景库勾选,如此降低了背景噪音,可实现对单样本特定区域等位基因的拷贝数分析;
3.本发明利用投票的方式构建阳性样本集,并通过构建训练集,优化了拷贝数变异bin参数、片段化方法和阈值;
4.本发明利用特有的人群SNP(单核苷酸多态性)位点,可准确识别拷贝数缺失突变为纯合还是杂合。
5.本发明对拷贝数变异检测的灵敏度、准确性和特异性高,灵敏度可达94%,特异性可达100%。
附图说明
图1是本发明实施例3的单样本等位基因拷贝数变异检测系统构建流程示意图;
图2是从1000例胚系变异检测样本的胚系突变数据集中筛选出的与表1的外显子区域对应的SNP位点的数目分布图;
图3是从dbsnp b151版本的公共SNP位点数据中筛选出的与表1的外显子区域对应的公共SNP位点,在与图2的SNP位点合并去重后,获得的SNP位点的数目分布图;
图4是本发明实施例4的单样本等位基因拷贝数变异检测方法流程示意图。
具体实施方式
为对本发明的技术内容、特点与功效有更具体的了解,现结合附图及具体实施例,对本发明的技术方案做进一步详细的说明。
实施例1探针制备
根据表1中的15个HRR基因的305个外显子区域,设计捕获探针的序列,针对BRCA1和BRCA2重点关注基因,采用叠瓦式设计,增加这些区域的覆盖度。然后由美国探针合成公司Integrated DNA Technologies,Inc.(IDT)按照单条DNA探针合成并质控的Probes系列产品,合成HRR基因DNA序列捕获探针(序列如SEQ ID NO:1~214所示),并配套相应的杂交捕获试剂。
表1捕获探针组覆盖的基因组区域
实施例2比对数据获取
1.DNA样本制备
组织样本的切片经病理检测后,如肿瘤细胞含量大于20%,则切片可直接用于DNA抽提;如果肿瘤细胞含量小于20%,则需要经过富集后再进行DNA抽提。
FFPE样本先经病理检测确认肿瘤细胞含量在20%以上,然后使用QIAGEN QIAampDNA FFPE Tissue Kit进行抽提,将FFPE样本进行脱蜡、蛋白酶K消化、高温逆转交联,最后通过硅胶膜离心柱纯化出DNA。
白细胞对照样本使用Blood-Genomic-DNA-Mini-Kit(CW2087M)进行抽提,蛋白酶K消化、裂解缓冲液裂解、无水乙醇沉降,最后通过硅胶膜离心柱纯化出DNA。
提取的DNA使用Qubit定量,总量在500ng以上的样本继续实验,并用毛细管电泳确认降解程度。
2.DNA扩增和建库
1)对提取的样本DNA进行酶切打断,主峰在200bp左右。
2)打断结束后,加入10μl末端修复体系,末端修复条件为65℃30min。
3)末端修复结束后,进行连接反应。连接反应体系包括:末端修复产物60μl,无核酸酶水5μl,连接缓冲液30μl,DNA连接酶10μl,MGI UDI接头5μl。连接反应条件为20℃15min。
4)加入0.8x纯化磁珠进行纯化。
5)配制表2所示PCR反应体系,涡旋混匀并短暂离心后,进行PCR反应,PCR反应程序如表3所示。
表2 PCR反应体系
组分 | 体积(μl) |
KAPA HiFi HotStart ReadyMix(2X) | 25 |
MGI双端标签引物 | 5 |
接头连接纯化产物 | 20 |
总体积 | 50 |
表3 PCR反应程序
6)使用1x纯化磁珠纯化PCR反应产物。
3.文库杂交捕获及目标基因富集
1)在0.2ml低吸附离心管中加入表4所示试剂,47℃抽干,抽干后的样品可以继续杂交或者室温放置过夜。
表4
组分 | 量 |
混合文库 | 500ng/文库 |
Cot Human DNA封闭液 | 5μg |
Universal Blocker通用接头封闭序列 | 2μl |
2)将表5所示试剂加入到抽干的离心管中,室温放置5~10min,置于PCR仪上95℃30s,65℃杂交孵育4~16小时,热盖温度设为100℃。
表5杂交反应试剂
3)杂交捕获产物清洗后,进行PCR富集。PCR反应体系如表6所示。PCR反应程序如表7所示。PCR反应产物用1.5X纯化磁珠进行纯化。
表6捕获后扩增反应体系
组分 | 体积(μl) |
2×KAPA HiFi HotStart ReadyMix | 25 |
Dual Barcode PCR Primer Mix | 2.5 |
含有捕获DNA的磁珠 | 22.5 |
总体积 | 50 |
表7捕获后扩增反应程序
4.文库测序和数据拆分
捕获文库定量稀释并混合后,在MGISEQ-2000高通量测序仪上进行双端测序,测序结束后根据样本的barcode信息,用splitBarcode v2.0.0软件提取对应的测序数据。提取的原始fastq数据,Q30≥85%时,定义为合格下机数据。
5.获取比对数据
对于质控合格的下机数据,使用fastp去除建库过程中引入的接头序列、引物以及低质量碱基片段。然后使用BWA将质控后数据与hg19人类参考基因组进行比对,使用sambamba对比对后的bam文件进行去重,分别获得待测样本细胞比对数据和正常白细胞比对数据。
实施例3单样本等位基因拷贝数变异检测系统构建
对166例阴性样本(即正常白细胞样本)、100例背景集候选样本、100例潜在阳性样本,用实施例2的方法,获得细胞比对数据,按照如下步骤构建本发明的单样本等位基因拷贝数变异检测系统(参见图1):
1.SNP位点筛选
针对166例阴性样本、100例背景集候选样本以及其他正常白细胞样本,共计1000例的胚系变异检测样本(即SNP筛选样本),利用HaplotypeCaller进行胚系变异检测,按照HaplotypeCaller的硬指标:QD≥2、FS≤60、SOR≤3、MQ≥40、MQRankSum≥-12.5和ReadPosRankSum≥-8,完成胚系变异硬过滤,并筛选突变频率在0.4~0.6之间以及0.9以上并且在这些样本中的出现次数≥2的SNP位点,得到样本的SNP筛选位点。统计筛选出的SNP位点在15个HRR基因中的分布(见图2)。
由于上述SNP位点数目相对于部分基因来说较少,因而利用bedtools软件的intersect对dbsnp b151版本的公共数据集进行筛选,获得表1的探针捕获区域对应的公共数据SNP位点,与图2的SNP筛选位点进行合并去重,获得BAF(次等位基因频率)潜在SNP位点的集合,其数目分布如图3所示。
由图2、3可知,BRCA2和FANCA两个基因对应的SNP位点最多,补充之后ATM的SNP位点数目有了很大提高。
2.背景集样本筛选
利用100例背景集候选样本的比对数据,利用picard计算每个探针区域的覆盖度。利用每个样本的平均覆盖度对探针覆盖度进行归一化,即,用探针覆盖度除以样本平均覆盖度,得到探针归一化覆盖度。
然后进行线性回归聚类,分别以每个样本为中心,通过探针归一化覆盖度计算该样本与其他样本的线性相关性。具体方法如下:假设y=αx+β,x和y分别对应每个探针的一对样本覆盖度,当截距项β估计值小于0.1、斜率项α估计值在0.94和1.05之间、校正后线性相关性R2大于0.85时,认为两个样本相关,为同类样本。
选择样本数目最大的子集作为拷贝数变异检测的背景集样本,共计19例。
3.阳性样本集构建
针对100例潜在阳性样本,分别利用cnvkit、GATK CNV和facets三款软件进行优化分析,通过投票的方式筛选阳性样本,即,有2款以上软件检测出拷贝数变异的样本即为阳性样本。共计筛选出74例阳性样本,构成阳性样本集。
4.bin划分及覆盖度计算
探针捕获区域对应的基因组坐标称为目标区域,除探针捕获区域以外的基因组区域称为非目标区域,分别按照不同的bin参数划分目标区域和非目标区域。
分别计算每个样本目标区域bin的覆盖度depth和非目标区域bin的覆盖度depth,同时计算覆盖度log2值,即log2=log2depth。
5.背景库构建
利用步骤4计算得到的每个背景集样本的覆盖度统计文件,用绝对中位差方法(MAD)计算目标区域bin和非目标区域bin的校正后的覆盖度depth和覆盖度log2值,以及覆盖度log2值的偏差,同时计算目标区域bin和非目标区域bin的GC含量以及重复性,构建检测拷贝数所需的背景库。
6.片段化及拷贝数变异筛选
利用步骤5构建的背景库,针对步骤4获得的166例阴性样本和74例阳性样本的覆盖度统计文件,完成GC偏好性、重复性以及探针偏好性校正,获得目标区域bin和非目标区域bin的拷贝数比值log2。利用片段化方法延长每个bin至拷贝数状态相同的区域。计算每个区域的拷贝数比值,即ratio=2log2,这里的log2是拷贝数比值的log2。按照默认的阈值筛选阴性样本和阳性样本的拷贝数缺失和拷贝数扩增变异。
7.参数确定
针对bin参数,重复步骤4到步骤6,针对片段化方法和拷贝数比值阈值,重复步骤6,利用阴性样本和阳性样本的拷贝数筛选结果,统计分析二分类评价指标完成参数确定。
所述bin参数的确定方法如下:
利用74例阳性样本集,对比目标区域划分参数266bp、非目标区域划分参数150000bp,以及目标区域划分参数199bp、非目标区域划分参数500000bp,利用背景集评估样本的拷贝数变化,统计灵敏度和阳性预测值,得到前者灵敏度为0.83,后者灵敏度为0.91,因此,确定目标区域划分参数199bp、非目标区域划分参数500000bp为最优。
所述片段化方法,通过如下方法确定:
对比不同的片段化方法,环状二元分割方法(cbs)、基于小波方法(haar)和3阶隐马尔科夫模型(hmm),利用74例阳性样本集,统计灵敏度和阳性预测值,得到cbs方法的灵敏度是0.90,haar方法的灵敏度是0.78,hmm方法的灵敏度是0.84,因此cbs方法最优,确定片段化方法采用cbs方法。
所述拷贝数比值阈值的确定方法如下:
利用74例阳性样本集和166例阴性样本构建训练集,根据灵敏度和特异性确定拷贝数比值阈值,灵敏度和阳性预测值统计见表8,特异性统计见表9,综合表8和表9来看,按照拷贝数比值≤0.6(拷贝数缺失)和拷贝数比值≥1.5(拷贝数扩增)进行筛选最优。因此,拷贝数比值的阈值采用0.6(拷贝数缺失突变判断阈值)和1.5(拷贝数扩增突变判断阈值)。
表8 HRR基因的阳性样本集分析结果统计
表9 HRR基因的阴性样本集分析结果统计
拷贝数比值 | 阴性个数(N) | 检测真阴性个数(TN) | 特异性(TNR) |
0.8|1.2 | 2372 | 2333 | 0.98 |
0.8|1.5 | 2372 | 2333 | 0.98 |
0.8|2.0 | 2372 | 2333 | 0.98 |
0.6|1.2 | 2372 | 2372 | 1 |
0.6|1.5 | 2372 | 2372 | 1 |
0.6|2.0 | 2372 | 2372 | 1 |
0.4|1.2 | 2372 | 2372 | 1 |
0.4|1.5 | 2372 | 2372 | 1 |
0.4|2.0 | 2372 | 2372 | 1 |
实施例4单样本等位基因拷贝数变异检测
提取待测样本DNA,用实施例2的方法,获得该待测样本的比对数据,然后基于实施例3构建的单样本等位基因拷贝数变异检测系统,按照以下步骤进行单样本拷贝数变异检测(参见图4)。
1.统计目标区域和非目标区域bin覆盖度
根据实施例3确定的bin参数(目标区域划分参数199bp、非目标区域划分参数500000bp)划分目标区域和非目标区域,将参考基因组划分为不同的bin区间,利用待测样本的比对数据,用cnvkit v9.8.0软件的coverage统计每个bin区域的覆盖度depth以及覆盖度log2值。
2.计算bin拷贝数比值
利用实施例3构建的背景库,针对每个bin区域,采用cnvkit的fix方法校正目标区域bin的GC含量、重复性以及探针偏好性,比对背景库,计算得到每个bin区域的拷贝数比值log2。
3.获取拷贝数变异区域
利用环状二元分割方法,延长每个bin至拷贝数状态相同的区域,计算每个区域的拷贝数比值ratio=2log2,获得拷贝数比值变异片段区域。
4.SNP位点变异检测
利用待测样本的比对数据,用bcftools v1.11软件的mpileup进行SNP位点的深度检测,获取每个BAF潜在SNP位点样本的pileup深度数据,然后利用bcftools软件的call进行SNP位点的变异检测,利用bcftools软件的view进行SNP位点变异的筛选,按照碱基质量≥10,read比对质量≥5,最小read支持数为5,最小覆盖度为5,突变频率为0.4到0.6,筛选得到次等位基因频率(BAF)信息。
5.肿瘤总拷贝数和次等位基因拷贝数注释
针对拷贝数状态相同的区域(即步骤3利用环状二元分割方法分析得到的cns文件),综合步骤4获取的次等位基因频率信息,获得每个区域的肿瘤总拷贝数(Total CopyNumber,TCN)和次等位基因拷贝数(B-allele Copy Number,BCN)。如果通过病理切片镜检确定了肿瘤纯度信息,并且肿瘤纯度大于40%,则将肿瘤纯度信息也纳入肿瘤拷贝数注释程序进行计算。
次等位基因拷贝数的具体计算方法如下:
获得每个区域的参考拷贝数ref_copy(常染色体拷贝数为2,如果是男性,X染色体是2,Y染色体是1;如果是女性,X染色体是2),根据检测到的拷贝数比值log2(log2ratio),按照以下计算公式获得肿瘤总拷贝数TCN:
TCN=ref_copy×2log2ratio。
肿瘤次等位基因频率tumorbaf默认等于检测到的SNP频率信息obsbaf。
如果提供了肿瘤纯度(purity)信息,并且肿瘤纯度大于0.4,则肿瘤总拷贝数TCN计算方法如下:
并且对SNP频率信息obsbaf进行校正,校正公式如下:
主等位基因拷贝数(MCN)计算公式如下:
MCN=TCN×(|tumorbaf-0.5|+0.5):
MCN的范围为0到TCN。
次等位基因拷贝数(BCN)计算公式如下:
BCN=TCN-MCN。
利用cnvkit软件的scatter综合SNP位点变异信息和拷贝数变异信息,可视化展示拷贝数变异片段,该图形包含每个划分区域的拷贝数比值及次等位基因频率信息散点信息。
6.拷贝数变异结果及注释
利用NCBI Assembly的GRCh37.p13得到基因的外显子区域,利用bedtools软件的intersect进行拷贝数区域基因注释,完成变异区域的外显子注释。如果CNV变异区域覆盖基因的80%以上的外显子区域,则定义为是整个基因区域的覆盖,注释为整个基因;否则按照外显子水平进行注释,获得每个基因的注释拷贝数结果(包括TCN、BCN、拷贝数比值、BAF等信息)。
7.筛选拷贝数变异基因并注释其等位基因拷贝数
按照检测基因列表和拷贝数比值阈值筛选拷贝数变异区域(拷贝数比值≤0.6为拷贝数缺失突变,拷贝数比值≥1.5为拷贝数扩增突变),根据TCN和BCN的数值,分别注释纯合缺失、杂合缺失、拷贝数扩增和拷贝数扩增杂合性缺失等。
注释方法如下:针对常染色体的变异区域,如果TCN和BCN均为0,则表示该突变为纯合缺失(DELL);如果TCN为1(常染色体和女性x染色体),并且BCN为0,则认为该突变为杂合缺失(HEMIZYG);如果TCN大于2,并且BCN≥1,则认为该突变为拷贝数扩增(DUP);如果TCN大于2,并且BCN等于0,则认为该突变为拷贝数扩增杂合性缺失(DUP-LOH);如果TCN为2(常染色体和女性X染色体是2,男性性染色体是1),并且BCN为0,则认为该突变为拷贝数中性杂合性缺失(Copy Neutral LOH)。
实施例5 RAD51B纯合缺失标准品的等位基因拷贝数变异检测
本实施例用RAD51B纯合缺失标准品来验证实施例4的等位基因拷贝数变异检测方法的准确性。
提取RAD51B纯合缺失标准品的DNA,利用实施例1的探针,按照实施例4的等位基因拷贝数变异检测方法,对该RAD51B纯合缺失标准品的基因拷贝数变异情况进行检测。
获得的cns文件如表10所示。
表10 RAD51B纯合缺失标准品的cns文件结果
变异区域筛选及纯合、杂合注释最终结果如表11所示。表中,BAF是归一化后的次等位基因频率。表11显示的注释结果与RAD51B纯合缺失标准品的实际拷贝数变异情况相符,验证了本发明实施例4的拷贝数变异检测方法的准确性。
表11 RAD51B纯合缺失标准品的拷贝数变异检测结果
拷贝数比值 | 基因 | 范围 | 转录本编号 | BAF | TCN | BCN | 拷贝数注释 | 纯合杂合注释 |
0.001827 | RAD51B | EX2-EX10 | NM_133509.4 | 0 | 0 | 缺失 | 纯合 |
实施例6 BRCA2杂合缺失模拟样本的拷贝数变异检测
利用室内软件模拟BRCA2杂合缺失,用实施例4的方法,获得BRCA2杂合缺失模拟样本的拷贝数变异检测结果,参见表12所示,TCN为1,BCN为0,该突变为杂合缺失(HEMIZYG),与实际一致,验证了本发明实施例4的拷贝数变异检测方法的准确性。
表12 BRCA2杂合缺失检测结果
拷贝数比值 | 基因 | 范围 | 转录本编号 | BAF | TCN | BCN | 拷贝数注释 | 纯合杂合注释 |
0.498046 | BRCA2 | 全基因 | NM_000059.3 | 0.167435 | 1 | 0 | 缺失 | 杂合 |
实施例7 FANCL和FANCA拷贝数变异检测
利用实施例1的捕获探针,使用实施例4的拷贝数变异检测方法,对FANCL和FANCA基因的拷贝数变异进行检测。这两个基因的cns文件结果如表13所示,拷贝数变异检测结果如表14所示。
表13 FANCL和FANCA的cns文件结果
表14 FANCL和FANCA的拷贝数变异检测结果
实施例8不同肿瘤纯度下拷贝数变异检测的准确性
利用室内软件模拟BRCA2纯合和杂合缺失,肿瘤纯度从0.1逐渐增加到0.5,参见表15,可以看出在纯度为0.1时,BRCA2纯合缺失检测结果和真实值较为接近,在肿瘤纯度为0.2时,BRCA2杂合缺失检测值和真实值较为接近。综合来说,在极低肿瘤纯度10%时,本发明检测的拷贝数比值仍比较精确。
表15模拟BRCA2缺失突变检测结果
上述实施例仅为本发明的可行或较佳实施例而已,是用来说明本发明的,并非用以限制本发明申请专利的范围,因此,凡依本发明申请专利范围所作的均等变化与修饰,均应属于本发明专利涵盖的范围。
序列表
<110> 上海仁东医学检验所有限公司
苏州仁东生物工程有限公司
<120> 单样本等位基因拷贝数变异检测方法、探针组和试剂盒
<130> LHJ-NP-21-100979
<160> 214
<170> SIPOSequenceListing 1.0
<210> 1
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tttggtcttc tgttttgcag acttatttac caagcattgg aggaatatcg taggtaaaaa 60
tgcctattgg atccaaagag aggccaacat tttttgaaat ttttaagaca cgctgcaaca 120
<210> 2
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ttaccaagca ttggaggaat atcgtaggta aaaatgccta ttggatccaa agagaggcca 60
acattttttg aaatttttaa gacacgctgc aacaaagcag gtattgacaa attttatata 120
<210> 3
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ggccaacatt ttttgaaatt tttaagacac gctgcaacaa agcaggtatt gacaaatttt 60
atataacttt ataaattaca ccgagaaagt gttttctaaa aaatgcttgc taaaaaccca 120
<210> 4
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcatgcagtg attatttgga agatagtggt gttctgaatt atacaaagtt tccaaatatt 60
gataaattgc attaaactat tttaaaaatc tcattcatta ataccaccat ggatgtcaga 120
<210> 5
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tatacaaagt ttccaaatat tgataaattg cattaaacta ttttaaaaat ctcattcatt 60
aataccacca tggatgtcag aaaagtcttt taagattggg tagaaatgag ccactggaaa 120
<210> 6
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aaagtctttt aagattgggt agaaatgagc cactggaaat tctaattttc atttgaaagt 60
tcacattttg tcattgacaa caaactgttt tccttgcagc aacaagatca cttcattgat 120
<210> 7
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gatctttaac tgttctgggt cacaaatttg tctgtcactg gttaaaacta aggtgggatt 60
ttttttttaa atagatttag gaccaataag tcttaattgg tttgaagaac tttcttcaga 120
<210> 8
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggatttttt ttttaaatag atttaggacc aataagtctt aattggtttg aagaactttc 60
ttcagaagct ccaccctata attctgaacc tgcagaagaa tctgaacata aaaacaacaa 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tgaacctgca gaagaatctg aacataaaaa caacaattac gaaccaaacc tatttaaaac 60
tccacaaagg aaaccatctt ataatcagct ggcttcaact ccaataatat tcaaagagca 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcagctggct tcaactccaa taatattcaa agagcaaggg ctgactctgc cgctgtacca 60
atctcctgta aaagaattag ataaattcaa attagactta ggtaagtaat gcaatatggt 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gaattattgt actgtttcag gaaggaatgt tcccaatagt agacataaaa gtcttcgcac 60
agtgaaaact aaaatggatc aagcagatga tgtttcctgt ccacttctaa attcttgtct 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ttcccaatag tagacataaa agtcttcgca cagtgaaaac taaaatggat caagcagatg 60
atgtttcctg tccacttcta aattcttgtc ttagtgaaag gtatgatgaa gctattatat 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
actattttct ttcctcccag ggtcgtcaga caccaaaaca tatttctgaa agtctaggag 60
ctgaggtgga tcctgatatg tcttggtcaa gttctttagc tacaccaccc acccttagtt 120
<210> 14
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaacatattt ctgaaagtct aggagctgag gtggatcctg atatgtcttg gtcaagttct 60
ttagctacac cacccaccct tagttctact gtgctcatag gtaataatag caaatgtgta 120
<210> 15
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cataaatttt tatcttacag tcagaaatga agaagcatct gaaactgtat ttcctcatga 60
tactactgct gtaagtaaat atgacattga 90
<210> 16
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tgctgtaagt aaatatgaca ttgattagac tgttgaaatt gctaacaatt ttggaatgcc 60
ttgttaaatt atttatctta catttttaat ttcctaatct gtaatttatc taagcctttg 120
<210> 17
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ttaaactata atttttgcag aatgtgaaaa gctatttttc caatcatgat gaaagtctga 60
agaaaaatga tagatttatc gcttctgtga cagacagtga aaacacaaat caaagagaag 120
<210> 18
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tatttttcca atcatgatga aagtctgaag aaaaatgata gatttatcgc ttctgtgaca 60
gacagtgaaa acacaaatca aagagaagct gcaagtcatg gtaagtcctc tgtttagttg 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tctgttttat actttaacag gatttggaaa aacatcaggg aattcattta aagtaaatag 60
ctgcaaagac cacattggaa agtcaatgcc aaatgtccta gaagatgaag tatatgaaac 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gaaacagttg tagatacctc tgaagaagat agtttttcat tatgtttttc taaatgtaga 60
acaaaaaatc tacaaaaagt aagaactagc aagactagga aaaaaatttt ccatgaagca 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aagcaaacgc tgatgaatgt gaaaaatcta aaaaccaagt gaaagaaaaa tactcatttg 60
tatctgaagt ggaaccaaat gatactgatc cattagattc aaatgtagca aatcagaagc 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gaagcccttt gagagtggaa gtgacaaaat ctccaaggaa gttgtaccgt ctttggcctg 60
tgaatggtct caactaaccc tttcaggtct aaatggagcc cagatggaga aaatacccct 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cccctattgc atatttcttc atgtgaccaa aatatttcag aaaaagacct attagacaca 60
gagaacaaaa gaaagaaaga ttttcttact tcagagaatt ctttgccacg tatttctagc 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ctagcctacc aaaatcagag aagccattaa atgaggaaac agtggtaaat aagagagatg 60
aagagcagca tcttgaatct catacagact gcattcttgc agtaaagcag gcaatatctg 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atctggaact tctccagtgg cttcttcatt tcagggtatc aaaaagtcta tattcagaat 60
aagagaatca cctaaagaga ctttcaatgc aagtttttca ggtcatatga ctgatccaaa 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ccaaacttta aaaaagaaac tgaagcctct gaaagtggac tggaaataca tactgtttgc 60
tcacagaagg aggactcctt atgtccaaat ttaattgata atggaagctg gccagccacc 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ccaccaccac acagaattct gtagctttga agaatgcagg tttaatatcc actttgaaaa 60
agaaaacaaa taagtttatt tatgctatac atgatgaaac atcttataaa ggaaaaaaaa 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aaaaataccg aaagaccaaa aatcagaact aattaactgt tcagcccagt ttgaagcaaa 60
tgcttttgaa gcaccactta catttgcaaa tgctgattca ggtacctctg tctttttttt 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
aggcatgagc cactgtgccc aaacactacc tttttaactt agtgaaaaat atttagtgaa 60
tgtgattgat ggtactttaa ttttgtcact ttgtgttttt atgtttaggt ttattgcatt 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ctttgtgttt ttatgtttag gtttattgca ttcttctgtg aaaagaagct gttcacagaa 60
tgattctgaa gaaccaactt tgtccttaac tagctctttt gggacaattc tgaggaaatg 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgttctagaa atgaaacatg ttctaataat acagtaatct ctcaggatct tgattataaa 60
gaagcaaaat gtaataagga aaaactacag ttatttatta ccccagaagc tgattctctg 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tgtcatgcct gcaggaagga cagtgtgaaa atgatccaaa aagcaaaaaa gtttcagata 60
taaaagaaga ggtcttggct gcagcatgtc acccagtaca acattcaaaa gtggaataca 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
cagtgatact gactttcaat cccagaaaag tcttttatat gatcatgaaa atgccagcac 60
tcttatttta actcctactt ccaaggatgt tctgtcaaac ctagtcatga tttctagagg 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ggcaaagaat catacaaaat gtcagacaag ctcaaaggta acaattatga atctgatgtt 60
gaattaacca aaaatattcc catggaaaag aatcaagatg tatgtgcttt aaatgaaaat 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
attataaaaa cgttgagctg ttgccacctg aaaaatacat gagagtagca tcaccttcaa 60
gaaaggtaca attcaaccaa aacacaaatc taagagtaat ccaaaaaaat caagaagaaa 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
aactacttca atttcaaaaa taactgtcaa tccagactct gaagaacttt tctcagacaa 60
tgagaataat tttgtcttcc aagtagctaa tgaaaggaat aatcttgctt taggaaatac 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
actaaggaac ttcatgaaac agacttgact tgtgtaaacg aacccatttt caagaactct 60
accatggttt tatatggaga cacaggtgat aaacaagcaa cccaagtgtc aattaaaaaa 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
aagatttggt ttatgttctt gcagaggaga acaaaaatag tgtaaagcag catataaaaa 60
tgactctagg tcaagattta aaatcggaca tctccttgaa tatagataaa ataccagaaa 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
aaaaaataat gattacatga acaaatgggc aggactctta ggtccaattt caaatcacag 60
ttttggaggt agcttcagaa cagcttcaaa taaggaaatc aagctctctg aacataacat 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
attaagaaga gcaaaatgtt cttcaaagat attgaagaac aatatcctac tagtttagct 60
tgtgttgaaa ttgtaaatac cttggcatta gataatcaaa agaaactgag caagcctcag 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
agtcaattaa tactgtatct gcacatttac agagtagtgt agttgtttct gattgtaaaa 60
atagtcatat aacccctcag atgttatttt ccaagcagga ttttaattca aaccataatt 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tttaacacct agccaaaagg cagaaattac agaactttct actatattag aagaatcagg 60
aagtcagttt gaatttactc agtttagaaa accaagctac atattgcaga agagtacatt 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tttgaagtgc ctgaaaacca gatgactatc ttaaagacca cttctgagga atgcagagat 60
gctgatcttc atgtcataat gaatgcccca tcgattggtc aggtagacag cagcaagcaa 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
aatttgaagg tacagttgaa attaaacgga agtttgctgg cctgttgaaa aatgactgta 60
acaaaagtgc ttctggttat ttaacagatg aaaatgaagt ggggtttagg ggcttttatt 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ttctgctcat ggcacaaaac tgaatgtttc tactgaagct ctgcaaaaag ctgtgaaact 60
gtttagtgat attgagaata ttagtgagga aacttctgca gaggtacatc caataagttt 120
<210> 46
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ttatcttcaa gtaaatgtca tgattctgtt gtttcaatgt ttaagataga aaatcataat 60
gataaaactg taagtgaaaa aaataataaa tgccaactga tattacaaaa taatattgaa 120
<210> 47
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
aaatgactac tggcactttt gttgaagaaa ttactgaaaa ttacaagaga aatactgaaa 60
atgaagataa caaatatact gctgccagta gaaattctca taacttagaa tttgatggca 120
<210> 48
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
cagtgattca agtaaaaatg atactgtttg tattcataaa gatgaaacgg acttgctatt 60
tactgatcag cacaacatat gtcttaaatt atctggccag tttatgaagg agggaaacac 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
actcagatta aagaagattt gtcagattta acttttttgg aagttgcgaa agctcaagaa 60
gcatgtcatg gtaatacttc aaataaagaa cagttaactg ctactaaaac ggagcaaaat 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
atataaaaga ttttgagact tctgatacat tttttcagac tgcaagtggg aaaaatatta 60
gtgtcgccaa agagtcattt aataaaattg taaatttctt tgatcagaaa ccagaagaat 120
<210> 51
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
attgcataac ttttccttaa attctgaatt acattctgac ataagaaaga acaaaatgga 60
cattctaagt tatgaggaaa cagacatagt taaacacaaa atactgaaag aaagtgtccc 120
<210> 52
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ccagttggta ctggaaatca actagtgacc ttccagggac aacccgaacg tgatgaaaag 60
atcaaagaac ctactctatt gggttttcat acagctagcg ggaaaaaagt taaaattgca 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
caaaggaatc tttggacaaa gtgaaaaacc tttttgatga aaaagagcaa ggtactagtg 60
aaatcaccag ttttagccat caatgggcaa agaccctaaa gtacagagag gcctgtaaag 120
<210> 54
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
agaccttgaa ttagcatgtg agaccattga gatcacagct gccccaaagt gtaaagaaat 60
gcagaattct ctcaataatg ataaaaacct tgtttctatt gagactgtgg tgccacctaa 120
<210> 55
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aagctcttaa gtgataattt atgtagacaa actgaaaatc tcaaaacatc aaaaagtatc 60
tttttgaaag ttaaagtaca tgaaaatgta gaaaaagaaa cagcaaaaag tcctgcaact 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
cttgttacac aaatcagtcc ccttattcag tcattgaaaa ttcagcctta gctttttaca 60
caagttgtag tagaaaaact tctgtgagtc agacttcatt acttgaagca aaaaaatggc 120
<210> 57
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gcttagagaa ggaatatttg atggtcaacc agaaagaata aatactgcag attatgtagg 60
aaattatttg tatgaaaata attcaaacag tactatagct gaaaatgaca aaaatcatct 120
<210> 58
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ctctccgaaa aacaagatac ttatttaagt aacagtagca tgtctaacag ctattcctac 60
cattctgatg aggtatataa tgattcagga tatctctcaa aaaataaact tgattctggt 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gtattgagcc agtattgaag aatgttgaag atcaaaaaaa cactagtttt tccaaagtaa 60
tatccaatgt aaaagatgca aatgcatacc cacaaactgt aaatgaagat atttgcgttg 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
tgaggaactt gtgactagct cttcaccctg caaaaataaa aatgcagcca ttaaattgtc 60
catatctaat agtaataatt ttgaggtagg gccacctgca tttaggatag ccagtggtaa 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
aaaatcgttt gtgtttcaca tgaaacaatt aaaaaagtga aagacatatt tacagacagt 60
ttcagtaaag taattaagga aaacaacgag aataaatcaa aaatttgcca aacgaaaatt 120
<210> 62
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ttatggcagg ttgttacgag gcattggatg attcagagga tattcttcat aactctctag 60
ataatgatga atgtagcacg cattcacata aggtttttgc tgacattcag agtgaagaaa 120
<210> 63
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
aattttacaa cataaccaaa atatgtctgg attggagaaa gtttctaaaa tatcaccttg 60
tgatgttagt ttggaaactt cagatatatg taaatgtagt atagggaagc ttcataagtc 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
tcagtctcat ctgcaaatac ttgtgggatt tttagcacag caagtggaaa atctgtccag 60
gtatcagatg cttcattaca aaacgcaaga caagtgtttt ctgaaataga agatagtacc 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ccaagcaagt cttttccaaa gtattgttta aaagtaacga acattcagac cagctcacaa 60
gagaagaaaa tactgctata cgtactccag aacatttaat atcccaaaaa ggcttttcat 120
<210> 66
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
atataatgtg gtaaattcat ctgctttctc tggatttagt acagcaagtg gaaagcaagt 60
ttccatttta gaaagttcct tacacaaagt taagggagtg ttagaggaat ttgatttaat 120
<210> 67
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
atcagaactg agcatagtct tcactattca cctacgtcta gacaaaatgt atcaaaaata 60
cttcctcgtg ttgataagag aaacccagag cactgtgtaa actcagaaat ggaaaaaacc 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
cctgcagtaa agaatttaaa ttatcaaata acttaaatgt tgaaggtggt tcttcagaaa 60
ataatcactc tattaaagtt tctccatatc tctctcaatt tcaacaagac aaacaacagt 120
<210> 69
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gttggtatta ggaaccaaag tgtcacttgt tgagaacatt catgttttgg gaaaagaaca 60
ggcttcacct aaaaacgtaa aaatggaaat tggtaaaact gaaacttttt ctgatgttcc 120
<210> 70
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
cctgtgaaaa caaatataga agtttgttct acttactcca aagattcaga aaactacttt 60
gaaacagaag cagtagaaat tgctaaagct tttatggaag atgatgaact gacagattct 120
<210> 71
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
ctaaactgcc aagtcatgcc acacattctc tttttacatg tcccgaaaat gaggaaatgg 60
ttttgtcaaa ttcaagaatt ggaaaaagaa gaggagagcc ccttatctta gtgggtaagt 120
<210> 72
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
tatgaaatat ttctttttag gagaaccctc aatcaaaaga aacttattaa atgaatttga 60
caggataata gaaaatcaag aaaaatcctt aaaggcttca aaaagcactc cagatggtaa 120
<210> 73
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
ttaggagaac cctcaatcaa aagaaactta ttaaatgaat ttgacaggat aatagaaaat 60
caagaaaaat ccttaaaggc ttcaaaaagc actccagatg gtaaaattag ctttttattt 120
<210> 74
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gaaataatgg aagaatcatg aaagttccca gaatacagaa taaaatgaaa aaaggtatga 60
aaagtcaatt ctgtggatct atcatctgaa aatacagagt ttgagaagga aggcacagaa 120
<210> 75
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
aaggcacaga agagaaatga agaaagaaat tttaaaataa atacataatt ttaaaagttc 60
tactagtact gaaggacatg agtttcctta attaaaaggg cccactgagt gagcacacaa 120
<210> 76
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
aaataagatt ggtgttttag aagtatacca aagcaaaact gttgcaagga gattagtaaa 60
tacaggtctt aacctagcag aggaggtaga gggtagagaa tgattgagat agaaattcag 120
<210> 77
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
ctagcagagg aggtagaggg tagagaatga ttgagataga aattcagtag atttggccag 60
atagtgataa gttgagactg gcaaattatt tccacttaga tttaaataga tatcttgagc 120
<210> 78
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
atattttctc cccattgcag cacaactaag gaacgtcaag agatacagaa tccaaatttt 60
accgcacctg gtcaagaatt tctgtctaaa tctcatttgt atgaacatct gactttggaa 120
<210> 79
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
ggaaaaatct tcaagcaatt tagcagtttc aggacatcca ttttatcaag tttctgctac 60
aagaaatgaa aaaatgagac acttgattac tacaggcaga ccaaccaaag tctttgttcc 120
<210> 80
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ttccaccttt taaaactaaa tcacattttc acagagttga acagtgtgtt aggaatatta 60
acttggagga aaacagacaa aagcaaaaca ttgatggaca tggctctgat gatagtaaaa 120
<210> 81
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
aaaaataaga ttaatgacaa tgagattcat cagtttaaca aaaacaactc caatcaagca 60
gtagctgtaa ctttcacaaa gtgtgaagaa gaacctttag gtattgtatg acaatttgtg 120
<210> 82
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cctttaggta ttgtatgaca atttgtgtga tgaatttttg cctttcagtt agatatttcc 60
gttgttaaat aatgtcctga tggttttccc cctttggtgg tggtaatttt aaagcccttt 120
<210> 83
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
aagtatttat tctttgatag atttaattac aagtcttcag aatgccagag atatacagga 60
tatgcgaatt aagaagaaac aaaggcaacg cgtctttcca cagccaggca gtctgtatct 120
<210> 84
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
gccaggcagt ctgtatcttg caaaaacatc cactctgcct cgaatctctc tgaaagcagc 60
agtaggaggc caagttccct ctgcgtgttc tcataaacag gtatgtgttt gtctacaata 120
<210> 85
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tgtgtgttta ttttgtgtag ctgtatacgt atggcgtttc taaacattgc ataaaaatta 60
acagcaaaaa tgcagagtct tttcagtttc acactgaaga ttattttggt aaggaaagtt 120
<210> 86
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gtaaggaaag tttatggact ggaaaaggaa tacagttggc tgatggtgga tggctcatac 60
cctccaatga tggaaaggct ggaaaagaag aattttatag gtactctatg caaaaagatt 120
<210> 87
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
aatagttgta gttgttgaat tcagtatcat cctatgtggt ttttatgata atattctact 60
tttatttgtt cagggctctg tgtgacactc caggtgtgga tccaaagctt atttctagaa 120
<210> 88
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ttctactttt atttgttcag ggctctgtgt gacactccag gtgtggatcc aaagcttatt 60
tctagaattt gggtttataa tcactataga tggatcatat ggaaactggc agctatggaa 120
<210> 89
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
ggatcatatg gaaactggca gctatggaat gtgcctttcc taaggaattt gctaatagat 60
gcctaagccc agaaagggtg cttcttcaac taaaatacag gcaagtttaa agcattacat 120
<210> 90
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
atttttgttt tcacttttag atatgatacg gaaattgata gaagcagaag atcggctata 60
aaaaagataa tggaaaggga tgacacagct gcaaaaacac ttgttctctg tgtttctgac 120
<210> 91
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
aaaaacactt gttctctgtg tttctgacat aatttcattg agcgcaaata tatctgaaac 60
ttctagcaat aaaactagta gtgcagatac ccaaaaagtg gccattattg aacttacaga 120
<210> 92
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
aaaaagtggc cattattgaa cttacagatg ggtggtatgc tgttaaggcc cagttagatc 60
ctcccctctt agctgtctta aagaatggca gactgacagt tggtcagaag attattcttc 120
<210> 93
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
ctgacagttg gtcagaagat tattcttcat ggagcagaac tggtgggctc tcctgatgcc 60
tgtacacctc ttgaagcccc agaatctctt atgttaaagg taaattaatt tgcactctt 119
<210> 94
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
atatttatta atttgtccag atttctgcta acagtactcg gcctgctcgc tggtatacca 60
aacttggatt ctttcctgac cctagacctt ttcctctgcc cttatcatcg cttttcagtg 120
<210> 95
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
tgaccctaga ccttttcctc tgcccttatc atcgcttttc agtgatggag gaaatgttgg 60
ttgtgttgat gtaattattc aaagagcata ccctatacag gtatgatgta ttcttgaaac 120
<210> 96
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
tgtgtaacac attattacag tggatggaga agacatcatc tggattatac atatttcgca 60
atgaaagaga ggaagaaaag gaagcagcaa aatatgtgga ggcccaacaa aagagactag 120
<210> 97
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
agagaggaag aaaaggaagc agcaaaatat gtggaggccc aacaaaagag actagaagcc 60
ttattcacta aaattcagga ggaatttgaa gaacatgaag gtaaaattag ttatatggta 120
<210> 98
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
taatcctttt gttttcttag aaaacacaac aaaaccatat ttaccatcac gtgcactaac 60
aagacagcaa gttcgtgctt tgcaagatgg tgcagagctt tatgaagcag tgaagaatgc 120
<210> 99
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
accatcacgt gcactaacaa gacagcaagt tcgtgctttg caagatggtg cagagcttta 60
tgaagcagtg aagaatgcag cagacccagc ttaccttgag gtgagagagt aagaggacat 120
<210> 100
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ttaaccacac ccttaagatg agctctaatt ttgttgtatt tgtcctgttt aaagccatct 60
agttacaata gatggaactt ttttgttctg attgcttttt attccaatat cttaaatggt 120
<210> 101
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
aatatcttaa atggtcacag ggttatttca gtgaagagca gttaagagcc ttgaataatc 60
acaggcaaat gttgaatgat aagaaacaag ctcagatcca gttggaaatt aggaaggcca 120
<210> 102
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
atggaatctg ctgaacaaaa ggaacaaggt ttatcaaggg atgtcacaac cgtgtggaag 60
ttgcgtattg taagctattc aaaaaaagaa aaagattcag gtaagtatgt aaatgctttg 120
<210> 103
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
tctcatcttt ctccaaacag ttatactgag tatttggcgt ccatcatcag atttatattc 60
tctgttaaca gaaggaaaga gatacagaat ttatcatctt gcaacttcaa aatctaaaag 120
<210> 104
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
cagaatttat catcttgcaa cttcaaaatc taaaagtaaa tctgaaagag ctaacataca 60
gttagcagcg acaaaaaaaa ctcagtatca acaactaccg gtacaaacct ttcattgtaa 120
<210> 105
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
ttttgttttg ttttctgtag gtttcagatg aaattttatt tcagatttac cagccacggg 60
agccccttca cttcagcaaa tttttagatc cagactttca gccatcttgt tctgaggtgg 120
<210> 106
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gagccccttc acttcagcaa atttttagat ccagactttc agccatcttg ttctgaggtg 60
gacctaatag gatttgtcgt ttctgttgtg aaaaaaacag gtaatgcaca atatagttaa 120
<210> 107
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
agtaaaagaa tgtgttgtca tattggtatt gaaattttag cactgtaagc aacaggtcat 60
tttggaaaac ctgagctttc gccaaattca gctattttga tttgctttta ttattagcat 120
<210> 108
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ttcgccaaat tcagctattt tgatttgctt ttattattag catataccaa aataaatagg 60
catattagag tttcctttct tgcatcttaa aattcatcta acacatctat aataacattc 120
<210> 109
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ttcttttttt tccattctag gacttgcccc tttcgtctat ttgtcagacg aatgttacaa 60
tttactggca ataaagtttt ggatagacct taatgaggac attattaagc ctcatatgtt 120
<210> 110
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
atagacctta atgaggacat tattaagcct catatgttaa ttgctgcaag caacctccag 60
tggcgaccag aatccaaatc aggccttctt actttatttg ctggagattt ttctgtgttt 120
<210> 111
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
gccttcttac tttatttgct ggagattttt ctgtgttttc tgctagtcca aaagagggcc 60
actttcaaga gacattcaac aaaatgaaaa atactgttga ggtaaggtta cttttcagca 120
<210> 112
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ttttccactt attttcttag aatattgaca tactttgcaa tgaagcagaa aacaagctta 60
tgcatatact gcatgcaaat gatcccaagt ggtccacccc aactaaagac tgtacttcag 120
<210> 113
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
actgcatgca aatgatccca agtggtccac cccaactaaa gactgtactt cagggccgta 60
cactgctcaa atcattcctg gtacaggaaa caagcttctg gtaagttaat gtaaactcaa 120
<210> 114
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
cgttttcatt tttttatcag atgtcttctc ctaattgtga gatatattat caaagtcctt 60
tatcactttg tatggccaaa aggaagtctg tttccacacc tgtctcagcc cagatgactt 120
<210> 115
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
tcaaagtctt gtaaagggga gaaagagatt gatgaccaaa agaactgcaa aaagagaaga 60
gccttggatt tcttgagtag actgccttta cctccacctg ttagtcccat ttgtacattt 120
<210> 116
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
tgtttctccg gctgcacaga aggcatttca gccaccaagg agttgtggca ccaaatacga 60
aacacccata aagaaaaaag aactgaattc tcctcagatg actccattta aaaaattcaa 120
<210> 117
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
atgaaatttc tcttttggaa agtaattcaa tagctgacga agaacttgca ttgataaata 60
cccaagctct tttgtctggt tcaacaggag aaaaacaatt tatatctgtc agtgaatcca 120
<210> 118
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
actaggactg ctcccaccag ttcagaagat tatctcagac tgaaacgacg ttgtactaca 60
tctctgatca aagaacagga gagttcccag gccagtacgg aagaatgtga gaaaaataag 120
<210> 119
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
gcaggacaca attacaacta aaaaatatat ctaagcattt gcaaaggcga caataaatta 60
ttgacgctta acctttccag tttataagac tggaatataa tttcaaacca cacattagta 120
<210> 120
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
actgaagagt gagaggagct cccagggcct ggaaaggcca ctttgtaagc tcattcttgg 60
ggtcctgtgg ctctgtacct gtggctggct gcagtcagta gtggctgtgg gggatctggg 120
<210> 121
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
ggtatcaggt aggtgtccag ctcctggcac tggtagagtg ctacactgtc caacacccac 60
tctcgggtca ccacaggtgc ctcacacatc tgcccaattg ctggagacag agaacacaag 120
<210> 122
<211> 114
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
acagggcacc caatacttac tgtgccaagg gtgaatgatg aaagctcctt caccacagaa 60
gcaccacaca gctgtaccat ccattccagt tgatctaaaa tggacattta gatg 114
<210> 123
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
agctgtacca tccattccag ttgatctaaa atggacattt agatgtaaaa tcactgcagt 60
aatctgcata cttaacccag gccctctacc ctacactctc cggatgaagg cttatagcaa 120
<210> 124
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
acacccacct tccttccctc ccttcctccc ttcatcctaa ttctgtgttg gtaactgata 60
atcacggcca ctgaaaatac catacttggt ggtaattact gtaaatgtca agagatggga 120
<210> 125
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
tactgtaaat gtcaagagat gggaagataa ttcatccagt caaaaaaata catgttatcc 60
tggttagaga ctcagcaggg aaaggctaca tgctgagctg gaatccatat actcagggga 120
<210> 126
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
agataattca tccagtcaaa aaaatacatg ttatcctggt tagagactca gcagggaaag 60
gctacatgct gagctggaat ccatatactc aggggaataa aaatcagaag agactgtgga 120
<210> 127
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
aaaaaaaaga aaaaaaaaaa gaaatgttca ccgagaatct tcccctgctc tgggcccgtc 60
cgtggtgggc cagctgctgt gctttcttct atgtaagtaa attaagatgg tttaggaaga 120
<210> 128
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
aaaagaaaaa aaaaaagaaa tgttcaccga gaatcttccc ctgctctggg cccgtccgtg 60
gtgggccagc tgctgtgctt tcttctatgt aagtaaatta agatggttta ggaagaggag 120
<210> 129
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
ggagaactcc tccttgattt ttacctatcc aaagatattt tctcactaac atgttggcac 60
taacagcagc tcaacgccat ctgaacacat aacatactga atcctaacta ttaaccacct 120
<210> 130
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
tgaggaaccc ccatcgtggg atcttgctta taatactcca ctatgtaaga caaaggctgg 60
tgctggaact ctggggttct cccaggctct tacctgtggg catgttggtg aagggcccat 120
<210> 131
<211> 95
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
gggttctccc aggctcttac ctgtgggcat gttggtgaag ggcccatagc aacagatttc 60
tagccccctg aagatctgga agaagagagg aagag 95
<210> 132
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
cccatagcaa cagatttcta gccccctgaa gatctggaag aagagaggaa gagagaggga 60
caggggaatg gagagaagga aaatctagtt ataaaagaat attggctttt attcaaaaaa 120
<210> 133
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
cagactttca aaaaggaaga gcttttcttt ttcttctgtt caccacctga tgatttctgc 60
tgctacttcc cagggacaag cagtccaatg tccagaacac tactggattt cagaagatct 120
<210> 134
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
acctgatgat ttctgctgct acttcccagg gacaagcagt ccaatgtcca gaacactact 60
ggatttcaga agatcttctt gaagtgcata tgtagttgac ctgcactcta caggcattct 120
<210> 135
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
tcttgaagtg catatgtagt tgacctgcac tctacaggca ttctttgtca ttcaaggact 60
gagcatctca cttttgtcac caatcaggcc aaggctcctc cctaatgatc tctgcaggtg 120
<210> 136
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
ctttaacttg ttagatgcaa gggaaaaaag gtccttctgt atgtttaata agaggcttgg 60
atggctagaa actcaaagtt attggctgaa gtttgatgtt tatccagact tggtacctca 120
<210> 137
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
actcaaagtt attggctgaa gtttgatgtt tatccagact tggtacctca agtactcact 60
atgaccccat caacagaggg gtctatgttg attttaggtg tacatgctcc ttgtctcctc 120
<210> 138
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
gtcttaaaaa aaaaaaaaaa gaaatttgaa gtttcacctc tacatataca tttctcttcc 60
agagaaaaat actatggtga catttagtat tttcagaatg tcattacttt gaccacatac 120
<210> 139
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
aaaaagaaat ttgaagtttc acctctacat atacatttct cttccagaga aaaatactat 60
ggtgacattt agtattttca gaatgtcatt actttgacca catactttcc atcattgcta 120
<210> 140
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
tttccatcat tgctattctg catggaggaa aaaatccaaa gcactagaat ttctttttaa 60
agaggggaag aatctggtgc taatactgcc tagcatacag tggaggaaaa acagaggact 120
<210> 141
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
aaaatgaagc ggcccatctc tgcaaagggg agtggaatac agagtggtgg ggtgagattt 60
ttgtcaactt gagggaggga gctttacctt tctgtcctgg gattctcttg ctcgctttgg 120
<210> 142
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
cttgagggag ggagctttac ctttctgtcc tgggattctc ttgctcgctt tggaccttgg 60
tggtttcttc cattgaccac atctcctctg acttcaaaat catgctgaaa gaaaccaaac 120
<210> 143
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
agggagggag ctttaccttt ctgtcctggg attctcttgc tcgctttgga ccttggtggt 60
ttcttccatt gaccacatct cctctgactt caaaatcatg ctgaaagaaa ccaaacacaa 120
<210> 144
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
acaattaaag accttttggt aactcagact cagcatcagc aaaaacctta ggtgttaaac 60
gttaggtgta aaaatgcaat tctgaggtgt taaagggagg aggggagaaa tagtattata 120
<210> 145
<211> 118
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 145
agaaatagta ttatacttac agaaatagct aactacccat tttcctcccg caattcctag 60
aaaatatttc agtgtccgtt cacacacaaa ctcagcatct gcagaatgaa aaacactc 118
<210> 146
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 146
ttcagtgtcc gttcacacac aaactcagca tctgcagaat gaaaaacact caaaggatta 60
gaagttgaaa acaaaatcag gaagtgctgt cctaagaagc taaagagcct cagtttttta 120
<210> 147
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 147
cactcccaag atcaatctgg atttatgatt ctaaaacccc tggtgacaga atcagaggct 60
gaaaacacca ctaattataa ccagcaggta tggatatttg gaagtctagg ggaggctgat 120
<210> 148
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 148
tatggatatt tggaagtcta ggggaggctg atatgaagtt aagaccagag gaaatatctg 60
tccactccct cttctcaaca cccatcttct agacgccaag gctagctata gatctccatt 120
<210> 149
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 149
atgaagttaa gaccagagga aatatctgtc cactccctct tctcaacacc catcttctag 60
acgccaaggc tagctataga tctccattat agtgttcaag gaattaggaa ttatccatgt 120
<210> 150
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 150
ccagagaact aattttgtta gaaagatttt agagttgagc cacacaatct gcatcttctg 60
cgtcctccat gcactcgtct gctttctgga gccccatgag tgagtcttaa tcctgttcca 120
<210> 151
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 151
tctgctttct ggagccccat gagtgagtct taatcctgtt ccagataaca gttctcttcc 60
gggtaacggt tcttcagata cttgaagaca gtgtcttatt tccttaaatc ttctcatttc 120
<210> 152
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 152
gataacagtt ctcttccggg taacggttct tcagatactt gaagacagtg tcttatttcc 60
ttaaatcttc tcatttcttc ttcaaaagac agtatttcaa gttactttta tgtatcttta 120
<210> 153
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 153
cacccagagg tctcctgtat tacacaagtt ataattaaaa ccttaaaaga gaaaggtata 60
ggacaaatga tctgtctcct cccttttttg ctttttcata tgttaagact atctcggagc 120
<210> 154
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 154
tataggacaa atgatctgtc tcctcccttt tttgcttttt catatgttaa gactatctcg 60
gagctgttat cagacttttt tcctgaaaaa ctctcaacaa tactcaaact aggtgttaca 120
<210> 155
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 155
tgttatcaga cttttttcct gaaaaactct caacaatact caaactaggt gttacatgaa 60
gctggggtct ccaggttttg cctcacttgt tctttctttt gttgttgttg agacagagtc 120
<210> 156
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 156
ttactgatgc gagccaccgc gtccagctgc ctcacttgtt gttttaggac ttaggctcca 60
cctcaccagt gtagtcccag caggtagata ggagttaata gttgactatc tcagctcacc 120
<210> 157
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 157
tgcgagccac cgcgtccagc tgcctcactt gttgttttag gacttaggct ccacctcacc 60
agtgtagtcc cagcaggtag ataggagtta atagttgact atctcagctc accaccctcc 120
<210> 158
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 158
tgcgattaca ggcatgcgcc accgtgcctc gcctcatgtg gttttatgca gcagatgcaa 60
ggtattctgt aaaggttctt ggtatacctg ttttcataac aacatgagta gtctcttcag 120
<210> 159
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 159
atgcgccacc gtgcctcgcc tcatgtggtt ttatgcagca gatgcaaggt attctgtaaa 60
ggttcttggt atacctgttt tcataacaac atgagtagtc tcttcagtaa ttagattagt 120
<210> 160
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 160
tgtaaaggtt cttggtatac ctgttttcat aacaacatga gtagtctctt cagtaattag 60
attagttaaa gtgatgtggt gttttctggc aaacttgtac acgagcatct gaaattaaat 120
<210> 161
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 161
ttcttggtat acctgttttc ataacaacat gagtagtctc ttcagtaatt agattagtta 60
aagtgatgtg gtgttttctg gcaaacttgt acacgagcat ctgaaattaa atcaaatatt 120
<210> 162
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 162
tgttttctgg caaacttgta cacgagcatc tgaaattaaa tcaaatattc cattatcatg 60
agttacctct agcacacagc tcagaatact agttattcca ccatggcata tgtttacct 119
<210> 163
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 163
atacatatgg atacactcac aaattcttct ggggtcaggc cagacaccac catggacatt 60
cttttgttga ccctttctgt tgaagctgtc aattctggct tctccctgct cacactttct 120
<210> 164
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 164
ttcttccatt gcattatacc cagcagtatc agtagtatga gcagcagctg gactctgggc 60
agattctgca actttcaatt ggggaacttt caatgcagag gttgaagatg gtatgttgcc 120
<210> 165
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 165
tgccaacacg agctgactct ggggctctgt cttcagaagg atcagattca gggtcatcag 60
agaagaggct gattccagat tccaggtaag gggttccctc tgaaaggaat gggagaagt 119
<210> 166
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 166
tacagcagat gaaatattac ctagatcttg ccttggcaag taagatgttt ccgtcaaatc 60
gtgtggccca gactcttcca gctgttgctc ctccacatca acaaccttaa tgagctcctc 120
<210> 167
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 167
gagctcctct tgagatgggt agtttctatt ctgaagactc ccagagcaac tgtgcatgta 60
ccacctatca tctaatgatg ggcatttaga aggggatgac ctagaaagat aaatggaagg 120
<210> 168
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 168
gaaagataaa tggaaggaga aaaccatcgc caccaattgt gaaaggacaa atcatacttg 60
ctgggcagcc aaagcataaa tgaaacagct catgtcagag agatcagaaa tgactggcaa 120
<210> 169
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 169
cataaatgaa acagctcatg tcagagagat cagaaatgac tggcaaaaaa gagcccgcaa 60
gacagcctag aagtctggat tcatgttgcc tgccaatatg tcagggttga catataacat 120
<210> 170
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 170
tttacattga tgtttcttac ctttccactc ctggttcttt atttttactg gtagaactat 60
ctgcagacac ctcaaacttg tcagcagaaa ggccttctgg attctggctt atagggtatt 120
<210> 171
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 171
ctggtagaac tatctgcaga cacctcaaac ttgtcagcag aaaggccttc tggattctgg 60
cttatagggt attcactact tttctgtgaa gttaatactg ctttaaatgg aatgagaaaa 120
<210> 172
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 172
tctggcttat agggtattca ctacttttct gtgaagttaa tactgcttta aatggaatga 60
gaaaacaaat ctactttact gctttgttct gatagtgata attcaggtta gaatactgat 120
<210> 173
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 173
catgcctggc caaggcggaa atatttaata agtaaaaaca aatagttaaa aattgcaaaa 60
gtcttctatt cattaaaaag tcactgatga ctgtaattca ttttgagctt ttattagaaa 120
<210> 174
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 174
aagtaaaaac aaatagttaa aaattgcaaa agtcttctat tcattaaaaa gtcactgatg 60
actgtaattc attttgagct tttattagaa aagctaaaag ccataaatat aggtagaaaa 120
<210> 175
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 175
ttggactgta aaaaaaaaga aaagtcattc tatcaccaga acatttagca tataaattcc 60
tcttcttact acaatgggcc tcatgcaatg aagcaaataa gataacttgt tagaagttaa 120
<210> 176
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 176
aagaaaagtc attctatcac cagaacattt agcatataaa ttcctcttct tactacaatg 60
ggcctcatgc aatgaagcaa ataagataac ttgttagaag ttaacaactc aatagaacct 120
<210> 177
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 177
caactcaata gaacctgaaa aacagagcaa aacctttctg cttttttttc tccttaatcc 60
ttaattcatt ctctgaacag caagcccaac ctaagccttg tgacatgatg atctacttgc 120
<210> 178
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 178
catgaatgac tgccttgggt ccctctgact ggtatattag ttgtgagcag ggacaagaac 60
caaggctcca taattaccca tgtgctgagc aaggatcata aaatgttgga gctaggtcct 120
<210> 179
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 179
gtccctctga ctggtatatt agttgtgagc agggacaaga accaaggctc cataattacc 60
catgtgctga gcaaggatca taaaatgttg gagctaggtc cttactcttc agaaggagat 120
<210> 180
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 180
tactcttcag aaggagataa aggggaagga aagaattttg cttaagatat cagtgtttgg 60
ccaacaatac acaccttttt ctgatgtgct ttgttctgga tttcgcaggt cctcaagggc 120
<210> 181
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 181
gtttggccaa caatacacac ctttttctga tgtgctttgt tctggatttc gcaggtcctc 60
aagggcagaa gagtcactta tgatggaagg gtagctgtta gaaggctggc tcccatgctg 120
<210> 182
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 182
agctgttaga aggctggctc ccatgctgtt ctaacacagc ttctagttca gccatttcct 60
gctggagctt tatcaggtta tgttgcatgg tatccctctg cttcaaaaac gataaatggc 120
<210> 183
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 183
tccatctcaa aaaaaaaaat taggagaaag agcctggttc tatgatgaag atgatattca 60
tttttagacg ttgtgataca gaatgttttt tctagactat tctgccttta gtacataaac 120
<210> 184
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 184
acataaacat ttcatattac attatcaaat ggtcatatat atggtaaagc ttttatttat 60
ttcataggtg accaaattat tggccttgac cattaggtcc agaaagtaaa attgtgtact 120
<210> 185
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 185
cacacacaca cgctttttac ctgagtggtt aaaatgtcac tctgagagga tagccctgag 60
cagtcttcag agacgcttgt ttcactctca cacccagatg ctgcttcacc ttaaataaca 120
<210> 186
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 186
acgcttttta cctgagtggt taaaatgtca ctctgagagg atagccctga gcagtcttca 60
gagacgcttg tttcactctc acacccagat gctgcttcac cttaaataac aaaaacagag 120
<210> 187
<211> 117
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 187
ttggcaaact ttgccattac ccttttttgc agaatccaaa ctgatttcat ccctggttcc 60
ttgaggggtg atttgtaaca attcttgatc tcccacacta tagggaaaag acagagt 117
<210> 188
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 188
aactgatttc atccctggtt ccttgagggg tgatttgtaa caattcttga tctcccacac 60
tatagggaaa agacagagtc ctaataagaa acactagtta catgtatgca gaactgtcaa 120
<210> 189
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 189
cttaatatta actaaatagg aaaataccag cttcatagac aaaggttctc tttgactcac 60
ctgcaataag ttgccttatt aacggtatct tcagaagaat cagatcctaa aaaatttccc 120
<210> 190
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 190
aaaggttctc tttgactcac ctgcaataag ttgccttatt aacggtatct tcagaagaat 60
cagatcctaa aaaatttccc cccaaa 86
<210> 191
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 191
ttcagaagaa tcagatccta aaaaatttcc ccccaaaaaa taaatcaata aaagttttct 60
taattaaaag ggttaaaaaa atgtacttgt tgaaaaacag atattcaact agaaatattt 120
<210> 192
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 192
aggaatttat gatcataagg ggggaaaaca gtaagtgtta tgataaatag atggtggtgc 60
ctgggagctc aaaagatggc tatccttttt aattataaat atattctaaa agaaaatcca 120
<210> 193
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 193
tgggagctca aaagatggct atccttttta attataaata tattctaaaa gaaaatccaa 60
tttgagagcc cagtttgaat tctgagctca gcagctcttt tttttttttt tttggaggt 119
<210> 194
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 194
gagccaccat gcctggcctc ttttgctccc tttttaaagt aagattcttc aaggtgggaa 60
ctgcgtcttt tacatttttt ataactcacc atagggctca taaaattcac ttcccaaagc 120
<210> 195
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 195
ctcttttgct ccctttttaa agtaagattc ttcaaggtgg gaactgcgtc ttttacattt 60
tttataactc accatagggc tcataaaatt cacttcccaa agctgcctac cacaaataca 120
<210> 196
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 196
tgcctaccac aaatacaaat tatgaccaag atttttggca aaactataag ataaggaatc 60
cagcaattat tattaaatac ttaaaaaacc tgagaccctt acccaattca atgtagacag 120
<210> 197
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 197
aaaaaacctg agacccttac ccaattcaat gtagacagac gtcttttgag gttgtatccg 60
ctgctttgtc ctcagagttc tcacagttcc aaggttagag agttggacac tgagactggt 120
<210> 198
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 198
caatgtagac agacgtcttt tgaggttgta tccgctgctt tgtcctcaga gttctcacag 60
ttccaaggtt agagagttgg acactgagac tggtttcctg ctaaacagta tggtaaagaa 120
<210> 199
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 199
agttggacac tgagactggt ttcctgctaa acagtatggt aaagaacagt caagcaattg 60
ttggccagtt ctgtgctttt cctcctgaag agaaacttga caccatggac aaaataaatt 120
<210> 200
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 200
aagaaaacaa atggttttac caaggaagga ttttcgggtt cactctgtag aagtcttttg 60
gcacggtttc tgtagcccat actttggatg atagaaactt catcttttag atgttcagga 120
<210> 201
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 201
gcacggtttc tgtagcccat actttggatg atagaaactt catcttttag atgttcagga 60
gagttatttt ccttttttgc aaaattatag ctgtttgcat ctgtaaaata caagggaaaa 120
<210> 202
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 202
ttgggatatt caacacttac actccaaacc tgtgtcaagc tgaaaagcac aaatgatttt 60
caatagctct tcaacaagtt gactaaatct cgtactttct tgtaggctcc tgaaattaaa 120
<210> 203
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 203
tcaacactta cactccaaac ctgtgtcaag ctgaaaagca caaatgattt tcaatagctc 60
ttcaacaagt tgactaaatc tcgtactttc ttgtaggctc ctgaaattaa attgtttgag 120
<210> 204
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 204
cataacacat tcaaacttac ttgcaaaata tgtggtcaca ctttgtggag acaggttcct 60
tgatcaactc cagactagca gggtaggggg ggag 94
<210> 205
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 205
ggttccttga tcaactccag actagcaggg taggggggga gaaaaagaaa ataaatgagg 60
ctcaataatt tatttaaaaa taaagctatt cttagtgaat aagttcaact ttgagctgtt 120
<210> 206
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 206
tgcacatctc atctttaagc tccataaaga caaaattttc tgcttatatt tcttttgaat 60
tccttcctag aacttttttt tgtttactgt aaatgccttt ttaacttaat atggaaaat 119
<210> 207
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 207
tgcacatctc atctttaagc tccataaaga caaaattttc tgcttatatt tcttttgaat 60
tccttcctag aacttttttt tgtttactgt aaatgccttt ttaacttaat atggaaaatt 120
<210> 208
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 208
ataagccacc gccctcggcc tcatccatga ttttattttg ccatttcaag tgatggagct 60
tgttttagag ctggaagaaa agccaaaatg ccagttaatc taaactagat tcctgcccca 120
<210> 209
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 209
gatggagctt gttttagagc tggaagaaaa gccaaaatgc cagttaatct aaactagatt 60
cctgccccag tgcagaacca atcaagacag agtccctgtc tttcccggac cacaggattt 120
<210> 210
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 210
catgtctttt cttccctagt atgtaaggtc aattctgttc atttgcatag gagataatca 60
taggaatccc aaattaatac actcttgtgc tgacttacca gatgggacac tctaagattt 120
<210> 211
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 211
acactcttgt gctgacttac cagatgggac actctaagat tttctgcata gcattaatga 60
cattttgtac ttcttcaacg cgaagagcag ataaatccat ttctttctgt tccaatgaac 120
<210> 212
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 212
ccagatggga cactctaaga ttttctgcat agcattaatg acattttgta cttcttcaac 60
gcgaagagca gataaatcca tttctttctg ttccaatgaa ctttaacaca ttagaaaaac 120
<210> 213
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 213
acaacttcat tttatcattt taaaataaag taaatttaag atttggaagg ttttagaata 60
atacaaacca aagaactaat gacaacgtcc tttattttta aagattctag aagttgcttt 120
<210> 214
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 214
agattctaga agttgctttt tgtaattaga caacataaat tctgaatttt ttcacatatt 60
gctgccaacc ccttgggtct tttcctttct ccaagaaaga gaaagctaca gaggagtgac 120
Claims (15)
1.探针组,其特征在于,所述探针组覆盖的基因组区域包括表1中的15个基因的305个外显子区域。
2.根据权利要求1所述的探针组,其特征在于,所述探针组包括SEQ ID NO:1~214所示序列的探针。
3.试剂盒,其特征在于,所述试剂盒包含有权利要求1或2所述的探针组。
4.权利要求1或2所述探针组的非疾病诊断治疗目的用途,其特征在于,用于等位基因的拷贝数变异检测。
5.权利要求3所述试剂盒的非疾病诊断治疗目的的用途,其特征在于,用于等位基因的拷贝数变异检测。
6.权利要求1或2所述探针组在制备等位基因拷贝数变异检测试剂中的应用。
7.权利要求3所述试剂盒在制备等位基因拷贝数变异检测试剂中的应用。
8.单样本等位基因拷贝数变异检测系统,其特征在于,包括:
比对数据获取模块,用于权利要求1或2所述探针组捕获的基因组区域的测序以及测序数据与参考基因组的比对去重,获取样本的细胞比对数据;
存储模块,用于存储BAF潜在SNP位点集,背景库,以及背景集样本、阳性样本、阴性样本的测序数据和比对数据;
计算模块,用于根据bin参数划分目标区域和非目标区域,计算每个区域的覆盖度、拷贝数比值、覆盖度的log2值、拷贝数比值的log2值,筛选次等位基因频率信息,计算肿瘤总拷贝数和次等位基因拷贝数;
注释模块,用于拷贝数变异注释。
9.单样本等位基因拷贝数变异检测系统的构建方法,其特征在于,包括:BAF潜在SNP位点筛选步骤和背景集样本筛选步骤;
所述BAF潜在SNP位点筛选步骤包括:对SNP筛选样本进行胚系变异检测和硬过滤,筛选出突变频率为0.4~0.6和0.9以上且出现次数在2次以上的SNP位点;在SNP公共数据集中筛选出权利要求1或2所述探针组覆盖的基因组区域对应的SNP位点;将筛选出的所有SNP位点合并去重,获得BAF潜在SNP位点;
所述背景集样本筛选步骤包括:提取背景集候选样本的DNA,扩增,建库,用权利要求1或2所述探针组捕获目标基因,测序并将测序数据与参考基因组进行比对去重,获得背景集候选样本的细胞比对数据;计算探针覆盖度并归一化;线性回归聚类,选择样本数目最大的子集作为背景集样本。
10.根据权利要求9所述的方法,其特征在于,还包括阳性样本集筛选步骤:对潜在阳性样本,分别用不同的软件进行拷贝数变异检测,有2款以上软件检测出拷贝数变异的样本为阳性样本。
11.根据权利要求9或10所述的方法,其特征在于,还包括bin参数、片段化方法、拷贝数比值阈值筛选步骤:
1)按照不同的bin参数划分目标区域和非目标区域,分别计算每个样本目标区域和非目标区域bin的覆盖度和覆盖度的log2值;
2)校正背景集样本的覆盖度和覆盖度的log2值,以及目标区域和非目标区域bin的GC含量和重复性,构建背景库;
3)利用所述背景库,针对阴性样本和阳性样本的覆盖度数据,进行GC偏好性、重复性和探针偏好性校正,获得目标区域和非目标区域bin的拷贝数比值的log2值,利用默认的片段化方法延长每个bin至拷贝数状态相同的区域,计算每个区域的拷贝数比值,按照默认的拷贝数比值阈值筛选阴性样本和阳性样本的拷贝数缺失变异和拷贝数扩增变异;
4)重复上述步骤1)~3),利用阴性样本和阳性样本的拷贝数筛选结果,统计分析二分类评价指标,确定bin参数;
5)用不同的片段化方法和阈值,重复上述步骤3),利用阴性样本和阳性样本的拷贝数筛选结果,统计分析二分类评价指标,确定优化后的片段化方法和拷贝数比值阈值。
12.根据权利要求11所述的方法,其特征在于,所述目标区域的bin参数为199bp,非目标区域的bin参数为500000bp;所述片段化方法采用环状二元分割方法;所述拷贝数比值阈值包括拷贝数缺失突变判断阈值和拷贝数扩增突变判断阈值,所述拷贝数缺失突变判断阈值为0.6,所述拷贝数扩增突变判断阈值为1.5。
13.单样本等位基因拷贝数变异检测方法,所述方法为非疾病诊断治疗目的,其特征在于,步骤包括:
1)提取待测样本DNA,扩增,建库,用权利要求1或2所述探针组捕获目标基因,富集,测序,测序数据比对到参考基因组上,去重,获得待测样本的细胞比对数据;
2)划分目标区域和非目标区域,计算每个区域的覆盖度、覆盖度的log2值和拷贝数比值的log2值;
3)利用片段化方法计算每个区域的拷贝数比值,获得拷贝数比值变异区域;
4)对BAF潜在SNP位点进行深度检测和变异检测,并筛选得到次等位基因频率信息;
5)针对拷贝数状态相同的区域,结合次等位基因频率信息,计算每个区域的肿瘤总拷贝数和次等位基因拷贝数;
6)对每个基因进行拷贝数变异区域的外显子注释,获得每个基因的注释拷贝数结果;
7)按照检测基因列表和拷贝数比值阈值筛选拷贝数变异区域,并根据肿瘤总拷贝数和次等位基因拷贝数进行纯合缺失、杂合缺失、拷贝数扩增、拷贝数扩增杂合性缺失、拷贝数中性杂合性缺失的注释。
14.根据权利要求13所述的方法,其特征在于,步骤2),目标区域的bin参数为199bp,非目标区域的bin参数为500000bp;步骤3)所述片段化方法为环状二元分割方法;步骤7)所述拷贝数比值阈值为:拷贝数缺失突变判断阈值0.6,拷贝数扩增突变判断阈值1.5。
15.根据权利要求13所述的方法,其特征在于,步骤5),当肿瘤纯度大于40%时,将肿瘤纯度信息纳入肿瘤总拷贝数和次等位基因拷贝数的计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111123593.7A CN113889187B (zh) | 2021-09-24 | 2021-09-24 | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111123593.7A CN113889187B (zh) | 2021-09-24 | 2021-09-24 | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113889187A true CN113889187A (zh) | 2022-01-04 |
CN113889187B CN113889187B (zh) | 2022-12-06 |
Family
ID=79006620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111123593.7A Active CN113889187B (zh) | 2021-09-24 | 2021-09-24 | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113889187B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116230082A (zh) * | 2022-12-06 | 2023-06-06 | 序科码医学检验实验室(广州)有限公司 | 基于样品基因型的数据拆分的无标记多样品混合单细胞测序技术 |
CN117265069A (zh) * | 2023-09-21 | 2023-12-22 | 北京安智因生物技术有限公司 | 基于半导体测序平台检测brca1/2基因拷贝数变异 |
CN117409856A (zh) * | 2023-10-25 | 2024-01-16 | 北京博奥医学检验所有限公司 | 基于单个待测样本靶向基因区域二代测序数据的变异检测方法、系统及可存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104428425A (zh) * | 2012-05-04 | 2015-03-18 | 考利达基因组股份有限公司 | 测定复杂肿瘤全基因组绝对拷贝数变异的方法 |
CN106834502A (zh) * | 2017-03-06 | 2017-06-13 | 明码(上海)生物科技有限公司 | 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法 |
CN108884491A (zh) * | 2016-02-03 | 2018-11-23 | 维里纳塔健康公司 | 使用无细胞dna片段尺寸以确定拷贝数变异 |
CN108977542A (zh) * | 2018-07-27 | 2018-12-11 | 拓普基因科技(广州)有限责任公司 | 监控乳腺癌实时复发的寡核苷酸探针组和检测方法及应用 |
CN110129450A (zh) * | 2019-06-14 | 2019-08-16 | 上海仁东医学检验所有限公司 | 探针组合及其含有探针组合的试剂盒在检测ttn单基因突变情况的应用 |
US20190371428A1 (en) * | 2017-01-20 | 2019-12-05 | Sequenom, Inc. | Methods for non-invasive assessment of copy number alterations |
CN111334568A (zh) * | 2020-02-27 | 2020-06-26 | 柳州市妇幼保健院 | 一种先天性心脏病基因拷贝数变异及易感者筛选的多重连接探针扩增探针组合及试剂盒 |
CN111676277A (zh) * | 2020-08-12 | 2020-09-18 | 臻和(北京)生物科技有限公司 | 一种基于二代测序技术测定基因组不稳定的方法及试剂盒 |
CN111755068A (zh) * | 2020-06-19 | 2020-10-09 | 深圳吉因加医学检验实验室 | 基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置 |
CN111968701A (zh) * | 2020-08-27 | 2020-11-20 | 北京吉因加科技有限公司 | 检测指定基因组区域体细胞拷贝数变异的方法和装置 |
CN112802548A (zh) * | 2021-01-07 | 2021-05-14 | 深圳吉因加医学检验实验室 | 单样本全基因组预测等位基因特异性拷贝数变异的方法 |
CN112885406A (zh) * | 2020-04-16 | 2021-06-01 | 深圳裕策生物科技有限公司 | 检测hla杂合性缺失的方法及系统 |
-
2021
- 2021-09-24 CN CN202111123593.7A patent/CN113889187B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104428425A (zh) * | 2012-05-04 | 2015-03-18 | 考利达基因组股份有限公司 | 测定复杂肿瘤全基因组绝对拷贝数变异的方法 |
CN108884491A (zh) * | 2016-02-03 | 2018-11-23 | 维里纳塔健康公司 | 使用无细胞dna片段尺寸以确定拷贝数变异 |
US20190371428A1 (en) * | 2017-01-20 | 2019-12-05 | Sequenom, Inc. | Methods for non-invasive assessment of copy number alterations |
CN106834502A (zh) * | 2017-03-06 | 2017-06-13 | 明码(上海)生物科技有限公司 | 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法 |
CN108977542A (zh) * | 2018-07-27 | 2018-12-11 | 拓普基因科技(广州)有限责任公司 | 监控乳腺癌实时复发的寡核苷酸探针组和检测方法及应用 |
CN110129450A (zh) * | 2019-06-14 | 2019-08-16 | 上海仁东医学检验所有限公司 | 探针组合及其含有探针组合的试剂盒在检测ttn单基因突变情况的应用 |
CN111334568A (zh) * | 2020-02-27 | 2020-06-26 | 柳州市妇幼保健院 | 一种先天性心脏病基因拷贝数变异及易感者筛选的多重连接探针扩增探针组合及试剂盒 |
CN112885406A (zh) * | 2020-04-16 | 2021-06-01 | 深圳裕策生物科技有限公司 | 检测hla杂合性缺失的方法及系统 |
CN111755068A (zh) * | 2020-06-19 | 2020-10-09 | 深圳吉因加医学检验实验室 | 基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置 |
CN111676277A (zh) * | 2020-08-12 | 2020-09-18 | 臻和(北京)生物科技有限公司 | 一种基于二代测序技术测定基因组不稳定的方法及试剂盒 |
CN111968701A (zh) * | 2020-08-27 | 2020-11-20 | 北京吉因加科技有限公司 | 检测指定基因组区域体细胞拷贝数变异的方法和装置 |
CN112802548A (zh) * | 2021-01-07 | 2021-05-14 | 深圳吉因加医学检验实验室 | 单样本全基因组预测等位基因特异性拷贝数变异的方法 |
Non-Patent Citations (2)
Title |
---|
WEI SHEN ET AL.: "Genome-Wide Copy Number Variation Detection Using NGS:Data Analysis and Interpretation", 《TUMOR PROFILING》 * |
秦谦 等: "基于高通量测序技术的拷贝数变异筛选分析流程的建立及应用", 《中国循症儿科杂志》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116230082A (zh) * | 2022-12-06 | 2023-06-06 | 序科码医学检验实验室(广州)有限公司 | 基于样品基因型的数据拆分的无标记多样品混合单细胞测序技术 |
CN116230082B (zh) * | 2022-12-06 | 2024-05-14 | 序科码医学检验实验室(广州)有限公司 | 基于样品基因型的数据拆分的无标记多样品混合单细胞测序方法 |
CN117265069A (zh) * | 2023-09-21 | 2023-12-22 | 北京安智因生物技术有限公司 | 基于半导体测序平台检测brca1/2基因拷贝数变异 |
CN117265069B (zh) * | 2023-09-21 | 2024-05-14 | 北京安智因生物技术有限公司 | 基于半导体测序平台检测brca1/2基因拷贝数变异 |
CN117409856A (zh) * | 2023-10-25 | 2024-01-16 | 北京博奥医学检验所有限公司 | 基于单个待测样本靶向基因区域二代测序数据的变异检测方法、系统及可存储介质 |
CN117409856B (zh) * | 2023-10-25 | 2024-03-29 | 北京博奥医学检验所有限公司 | 基于单个待测样本靶向基因区域二代测序数据的变异检测方法、系统及可存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113889187B (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6664025B2 (ja) | まれな変異およびコピー数多型を検出するためのシステムおよび方法 | |
CN113889187B (zh) | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 | |
AU2022203184A1 (en) | Sequencing controls | |
KR101850437B1 (ko) | 차세대 염기서열 분석기법을 이용한 장기 이식 거부 반응 예측 방법 | |
KR20180039629A (ko) | 염색체 상호작용의 검출 | |
CN110628880B (zh) | 一种同步使用信使rna与基因组dna模板检测基因变异的方法 | |
KR20150090246A (ko) | 암을 위한 분자 진단 테스트 | |
CN106978480A (zh) | 用于癌症的分子诊断试验 | |
CN111662983B (zh) | 一种用于检测淋巴瘤基因变异的试剂盒及其应用 | |
CN107312861B (zh) | 一种b-all患者预后风险评估标记物 | |
CN113355332B (zh) | Heg1基因突变体及其应用 | |
KR101985864B1 (ko) | 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도 | |
WO2024001404A1 (zh) | 检测脆性x综合征突变的方法和试剂盒 | |
CN112442530B (zh) | 检测cah相关真假基因的方法 | |
CN104178487A (zh) | Atm基因突变体及其应用 | |
CN113564162B (zh) | 同源重组修复基因捕获探针组、试剂盒及其应用 | |
CN114875148A (zh) | 一种家族性多发性脂肪瘤检测试剂盒及引物组的应用 | |
CN114507738A (zh) | 甲基化位点、检测甲基化水平的产品的用途及试剂盒 | |
CN110878346B (zh) | 基因突变体及其应用 | |
CN110468201B (zh) | Escc频繁突变基因的靶向测序及其在获得判断escc预后的生物标记物中的应用 | |
CN112029833A (zh) | 一种用于肿瘤类器官培养条件选择的ctnnb1基因突变的快速鉴定方法 | |
CN112522275A (zh) | Myo15a基因突变体及其应用 | |
CN113403316A (zh) | Slc26a4基因突变体及其应用 | |
CN112442503A (zh) | Kcnq1基因突变体及其应用 | |
CN113265409B (zh) | Timm21突变基因、检测其的引物、试剂盒和方法以及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |