CN105132407B - 一种脱落细胞dna低频突变富集测序方法 - Google Patents

一种脱落细胞dna低频突变富集测序方法 Download PDF

Info

Publication number
CN105132407B
CN105132407B CN201510488017.0A CN201510488017A CN105132407B CN 105132407 B CN105132407 B CN 105132407B CN 201510488017 A CN201510488017 A CN 201510488017A CN 105132407 B CN105132407 B CN 105132407B
Authority
CN
China
Prior art keywords
probe
sequencing
enrichment
variation
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510488017.0A
Other languages
English (en)
Other versions
CN105132407A (zh
Inventor
管彦芳
吕小星
易鑫
赵美茹
刘涛
杨玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gene+ Technology Co Ltd
Original Assignee
Beijing Gene+ Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gene+ Technology Co Ltd filed Critical Beijing Gene+ Technology Co Ltd
Priority to CN201510488017.0A priority Critical patent/CN105132407B/zh
Publication of CN105132407A publication Critical patent/CN105132407A/zh
Application granted granted Critical
Publication of CN105132407B publication Critical patent/CN105132407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种脱落细胞DNA的低频突变富集测序方法,包括脱落细胞DNA的提取与DNA的打断,样品DNA文库构建、通用文库TT‑COLD PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析步骤,具体为基于接头通用引物进行TT COLD PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测,可以对0.01%低频变异具有高特异性检测。

Description

一种脱落细胞DNA低频突变富集测序方法
技术领域
本发明属于生物信息学高通量测序技术领域,具体涉及一种脱落细胞DNA低频突变富集测序方法。
背景技术
脱落细胞是指自然管腔器官内表面粘膜正常情况下,人体器官粘膜上皮细胞经常有脱落更新,一般分为3大类:鼻咽部、口腔、食肠管、阴道等的自然脱落细胞以及部分人工刷洗所得细胞;体腔抽出液(胸腔积液,脑脊液,心包腔积液等);针吸细胞。由于其具有安全性,设备操作简便性,以及基于其组织病理特性,逐渐发展出一门新兴学科,脱落细胞病理学,广泛应用于相关肿瘤早筛检测诊断中。但传统检测存在一定的误诊率,约有10-40%假阴性,主要原因一方面是由于细胞学检查局限性,只看单个或一小堆细胞,不能全面观察病变组织结构。另一方面脱落细胞学诊断难度较大,需要有经验的医生复验。遇到可疑或无把握病例应重复取材,需仔细观察。此外整体的传统临床检测诊断过程依然费时,费力,急需要一种更高精准实用性的检测手段。
目前随着分子生物学以及测序技术的飞速发展,基于高通量测序技术的脱落细胞检测正逐步走入临床,尤其是基于宫颈脱落细胞的HPV分型的高通量测序技术以其简便,快速,高通量,高准确性等特点,正逐步取代传统的宫颈巴氏涂片法,但是目前常规测序技术本身存在有一定的错误率,且由于个体差异,肿瘤发生发展时期,取材操作等原因,脱落细胞中的肿瘤细胞丰度往往存在很大波动,甚至0.1%左右的低丰度水平,从而导致基于常规测序技术仍然存在一定的假阴性以及假阳性。因此亟需一种准确率高、操作简便的测序技术用于脱落细胞DNA的检测,为疾病的早期筛查提供可信赖的检测手段。
发明内容
本发明提供一种脱落细胞DNA低频突变富集测序方法以克服现有技术的不足。
本发明提供的一种脱落细胞DNA低频突变富集测序方法,包括以下步骤:
(1)脱落细胞的DNA提取与打断;
(2)打断后的脱落细胞DNA文库构建;
(3)通用文库TT-COLD PCR扩增富集;
(4)探针富集捕获、杂交捕获产物的扩增与上机测序;
(5)正反双链纠错低频信息分析。
本发明方法的流程图见图1。
其中,步骤(1)所述的脱落细胞来自人类,步骤(2)的文库构建方法按照3步酶促反应,即末端修复,加“A”和文库接头连接。
文库接头使用的引物为:
接头第一链:TACACTCTTTCCCTACACGACGCTCTTCCGATCT,
接头第二链:GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。
本发明方法中,步骤(3)通用文库TT-COLD PCR扩增富集包括以下步骤:
1)确定文库的Tm值;
2)绕过每个插入片段存在的特异Tc值,基于1对通用引物,在1个系列的循环条件下,对文库中所有片段上的各种突变类型进行富集;设定Tc min≈TM-2.5,之后Tc以0.5℃逐步递增,在每个Tc条件下分别进行FULL COLD PCR;所述插入片段是指文库中与接头连接的DNA片段。
进一步地,文库Tm值通过以下方法来确定,对正常人脱落细胞DNA的文库采用一对引物使用荧光定量PCR,根据溶解曲线分析获得文库Tm值;所述引物的序列为:
上游引物:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
下游引物:
CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中xxxxxxxx为index标签。
上述步骤2)中,所述1对通用引物为通用文库TT-COLD PCR引物,其核苷酸序列为:
上游引物:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
下游引物:
CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中xxxxxxxx为index标签。
上述步骤2)中,所述1个系列循环条件为:
本发明方法中,步骤(4)所述探针富集捕获是将扩增后的文库质控合格后,采用富集探针芯片进行杂交捕获,并对杂交捕获产物进行PCR扩增,然后进行上机测序;
富集探针芯片的设计方法为:基于目的基因的用途确定芯片捕获区间,参考目标DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例;针对热点变异,将基于人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,同时热点变异探针总覆盖度与其他区域正常探针覆盖度的差异比例不少于3:1,从而实现捕获时对热点变异的富集。
本发明方法中,步骤(5)正反双链纠错低频信息分析(RealSeq Pipeline)具体方法为:
1)基于测序结果,截取成对测序序列中的测序序列一的前12bp碱基和测序序列二的前12bp碱基作为标签,且根据字母序排列以较小的标签在前连接成24bp的一条索引,同时根据标签的排列组合方式,选定正链和反链
2)对索引进行外部排序,以达到将同一个DNA模板的所有测序重复测序序列聚集到一起的目的;
3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序列数都达到2对以上,则进行后续分析;
5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列中的一致率也达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序列;
7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率;
8)Call SNV/InDel/SV/CNV:根据患者样品与对照样品信息的比对,用mutect流程call somatic SNV变异;用gatk流程call somatic InDel变异;用contra.py流程callCNV;用somVar流程call SV;
所使用的筛选参数为:对照位点变异率≤2%;纠错后变异测序序列条数≥2;突变预测p值≤0.05;
9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
进一步地,上述步骤1)中,基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段将形成一对成对测序序列;将成对测序序列的测序序列1的前12bp碱基和测序序列2的前12bp碱基作为标签,字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链。
本发明提供了一种脱落细胞DNA低频突变富集测序试剂盒,其含有富集探针芯片,所述芯片上探针是将基于人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1;
基于目标DNA突变碱基设计探针的原则为:基于目的基因的用途确定芯片捕获区间,参考目标DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。
本发明提供了一种脱落细胞DNA低频突变富集测序系统,包括以下操作单元:
(1)脱落细胞DNA提取与DNA打断单元;
(2)脱落细胞DNA文库构建单元;
(3)通用文库TT-COLD PCR扩增富集单元;
(4)探针富集捕获单元、杂交捕获产物的扩增与上机测序单元;
(5)正反双链纠错低频信息分析单元。
其中,操作单元(1)血浆ctDNA的提取与文库构建具体操作为:抽取早期患者外周血5-10mL,常温或4℃存于EDTA抗凝管中,在4-6小时内对外周血进行分离,得到血浆和白细胞,白细胞提取的DNA之后将作为对照用于体细胞突变的检出;血浆cfDNA/ctDNA的提取与定量;按照常规建库方法进行3步酶促反应:末端修复,加“A”和文库接头连接。
操作单元(2)通用文库TT-COLD PCR扩增富集的具体操作为:
基于相同的仪器和试剂,对正常人血浆连接文库采用通用文库引物使用荧光定量PCR,从溶解曲线分析,获得文库的TM值;
绕过每个插入片段存在的特异Tc值,基于1对通用引物,在1个系列的循环条件下,对文库中所有片段上的各种突变类型进行富集。该方法具体为由经验公式给出Tc min≈TM-2.5,之后Tc以0.5℃逐步递增,在每个Tc条件下分别进行FULL COLD PCR。PCR反应程序设置,程序设置如下:
操作单元(3)的通用文库TT-COLD PCR扩增富集单元基于通用引物对所有类型变异实现第一级突变富集扩增;通用引物的核苷酸序列为:
上游引物:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
下游引物:CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中xxxxxxxx为index标签。
本发明提供的一种脱落细胞DNA低频突变富集测序系统中,操作单元(4)的探针富集捕获单元是针对热点变异进行第二次富集捕获,操作单元(4)的探针富集捕获是采用自行设计的肿瘤富集探针芯片实现的,之后进行杂交捕获产物的扩增与上机测序。所述肿瘤富集探针芯片的设计方法为:
1)基于TCGA、ICGC、COSMIC等数据库和相关文献参考,参考常规芯片捕获探针设计原则,确定芯片捕获区间;
2)在捕获区间内,参考TCGA、COSMIC等相关数据库,在每200bp范围内,确定1个最重要的热点变异位点(SNV>3);同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于其相应的发生频率作为其在该位点总探针覆盖水平上所占的比例;
3)芯片设计时,针对相关热点变异,将基于人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1,从而实现捕获时对热点变异的富集。
本发明提供的一种脱落细胞DNA低频突变富集测序系统中,操作单元(5)的正反双链纠错低频信息分析单元是通过以下步骤完成的:
1)将成对测序序列的测序序列1的前12bp碱基和测序序列2的前12bp碱基作为标签,字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链。
2)对索引进行外部排序,以达到将同一个DNA模板的复制聚集到一起的目的;
3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
4)对步骤3)中获得的同一个DNA模板的复制簇进行筛选,若正链和反链的测序序列数都达到2对以上,则进行后续分析;
5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列中的一致率也达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序列;
7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率等;
8)Call SNV/InDel/SV/CNV:根据患者样品与对照样品信息的比对,用mutect流程call somatic SNV变异;用gatk流程call somatic InDel变异;用contra.py流程callCNV;用somVar流程call SV;
所使用的筛选参数为:对照位点变异率≤2%;纠错后变异测序序列条数≥2;突变预测p值≤0.05;
9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
本发明的脱落细胞DNA低频突变富集测序方法或本发明提供的脱落细胞DNA低频突变富集测序系统在制备疾病早期筛查试剂盒中的应用属于本发明的保护范围。
所述的疾病为肿瘤。
本发明还提供了一种针对肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌的早期筛查芯片,命名为ONCOcare—ZS,该芯片包括了常见高发癌症的相关Driver Gene、高频突变基因、癌症相关12条信号通路中重要基因,共计228个基因,680Kb,总共5220个热点变异,该芯片含有的探针所对应的基因分别为:
在本发明的一个实施例中,通过本发明前述的脱落细胞DNA低频突变富集测序方法利用上述芯片可以实现对肿瘤(肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等)的早期筛查,筛查结果准确,灵敏度高,可以对0.01%低频变异具有高特异性检测。
本发明提供一种肿瘤早期筛查试剂盒,其含有上述肿瘤富集探针芯片ONCOcare—ZS。本领域技术人员应当理解,对该芯片中目标肿瘤基因的增加、删除或替换也应当属于本发明保护的范围。
进一步地,本发明的肿瘤早期筛查试剂盒的工作程序为:
(1)脱落细胞的DNA提取与打断;
(2)打断后的脱落细胞DNA文库构建;
(3)通用文库TT-COLD PCR扩增富集;
(4)采用肿瘤富集探针早筛芯片对步骤(3)扩增富集后的文库进行富集探针捕获,之后进行杂交捕获产物的扩增与上机测序;
(5)正反双链纠错低频信息分析。
本发明提供的一种脱落细胞DNA的低频突变富集测序方法,是将通用文库TT-COLDPCR,探针富集捕获以及独特的正反链纠错信息分析技术(RealSeq Pipeline)3种技术相融合,实现高效,简便,实用的脱落细胞DNA低频变异精确检测,相对于其他细胞检测技术,本发明具有以下优异效果:(1)高灵敏度:本发明方法采用独有的通用文库TT-COLD PCR,探针富集捕获技术可以分别实现对所有突变类型以及热点变异进行不同程度的富集,从而可以仅仅只需要1-2mL脱落细胞混合液样本,并能够高效的对0.01%的稀有突变进行检测;(2)高特异性:基于突变富集以及低频正反链纠错分析策略,可以更有效的实现低频变异的精确检测,其特异性平均在98%以上;(3)高通量性:结合高通量测序技术(NGS)的目标区域捕获测序,不仅可以对相关感兴趣的基因,一次性扫描,获取更全面的受检者信息,以得出更准确的相关预测,而且能够在很短的时间内同时进行多例样本检测,从而压缩成本,有利于临床的推广;(4)多维度应用性:该方法可以高效利用所有脱落细胞类型,如尿液,粪便,口腔,宫颈等脱落细胞,可以作为多种相关肿瘤(肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等)的早期筛查工具,同时该技术也可以应用到基于脱落细胞的肿瘤术后监控以及精准医疗检测。
附图说明
图1为本发明方法的流程图。
图2为正常人脱落细胞连接文库的Tm值。
具体实施方式
以下实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明的范围。
若未特别指明,实施例中所用的化学试剂均为常规市售试剂,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。本发明实施例中采用的测序装置为IlluminaHiSeq2500,本发明测序步骤中,不限于该测序装置。
本发明实施例中,基因名称均采用NCBI-Gene里的官方命名(Official Symbol)。
实施例1宫颈脱落细胞DNA低频突变富集测序方法的建立
1、宫颈脱落细胞的DNA的提取与打断:
吸取患者宫颈脱落细胞混合液1-2ml.在4℃条件下16000g离心10分钟,除去上清。分离出来的沉淀细胞,基于QIAamp DNA Mini Kit(QIAGEN)提取试剂说明书,进行脱落细胞DNA提取,按照试剂盒Qubit(Invitrogen,the Quant-iT TM dsDNA BR Assay Kit)提取DNA。取1μg DNA,按照100μL打断体系,基于Bioruptor Pico打断仪使用说明书,打断为200-400bp范围片段,打断条件为:10min/H,ON=30s;OFF=30s;循环=10。
2、样品文库的制备:打断后的脱落细胞DNA,之后按照KAPA LTP LibraryPreparation Kit建库说明书,进行3步酶促反应。
2.1末端修复
表1
之后,加入Agencourt AMPure XP reagent 120μL,进行磁珠纯化,最后回溶42μLddH2O,带磁珠进行下一步反应。
2.2加A体系见表2。
表2
之后加入PEG/NaCl SPRI溶液90μL,充分混合,进行磁珠纯化,最后回溶(35-接头)μL ddH2O,带磁珠进行下一步反应。
2.3接头(Adapter)连接
接通引物序列为:
接头第一链 TACACTCTTTCCCTACACGACGCTCTTCCGATCT
接头第二链 GATCGGAAGAGCACACGTCTGAACTCCAGTCAC
反应体系为:
表3
之后分别加入PEG/NaCl SPRI溶液50μL 2次,进行2次磁珠纯化,最后回溶25μLddH2O。
3、通用文库TT COLD PCR:
3.1基于相同的仪器和试剂,对正常人脱落细胞Adapter连接文库采用通用文库引物,使用荧光定量PCR仪(ABI 7500),反应试剂包括:KAPA HiFi HotStart ReadyMix以及SYBR染料进行溶解曲线分析,获得正常脱落细胞文库的Tm值(DNA解链温度),如图2所示。
3.2通用文库TT COLD PCR:
通用文库上游 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACAC
引物 GACGCTCTTCCGATCT
通用文库下游 CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGT
引物 TCAGACGTGTGCTCTTCCGATCT
注:xxxxxxxx:index标签
表4
通用文库TT COLD PCR反应程序:
表5
4、探针富集捕获与上机测序
4.1扩增后文库质控合格后并采用发明人设计的富集探针早筛芯片ONCOcare—ZS,参照芯片制造商(Roche)提供的说明书进行杂交捕获。最后洗脱回溶21μL ddH2O带杂交洗脱磁珠。
该富集探针早筛芯片包括了常见高发癌症的相关Driver Gene、高频突变基因、癌症相关12条信号通路中重要基因,共计228个基因,680Kb,总共5220个热点变异。基因列表详见表6。
表6 ONCOcare—ZS早筛芯片基因列表
杂交捕获产物的扩增体系见表7:
表7
杂交捕获产物 20μL
2x KAPA HiFi HotStart Ready Mix 25μL
FellowCell Primer 1 2.5μL
FellowCell Primer 2 2.5μL
总体积 50μL
PCR反应条件:初始变性98℃45sec;变性98℃15sec,退火65℃30sec,延伸72℃30sec,共10个循环;72℃延伸60sec,4℃保存。
FellowCell Primer 1、Primer 2为Hiseq上机测试平台自带的引物,以用于将捕获后的DNA模板进行扩增,得到足够产量满足上机要求。
4.3先除去上一步磁珠,然后重新加入Agencourt AMPure XP reagent 50μL,进行磁珠纯化,最后回溶25μL ddH2O,进行QC及上机
4.4采用Illumina HiSeq2500PE101+8+101程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
5.正反双链纠错低频信息分析(RealSeq Pipeline)具体方法为:
1)基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段形成一对成对测序序列;将成对测序序列的测序序列1的前12bp碱基和测序序列2的前12bp碱基作为标签,字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链;
2)对索引进行外部排序,以达到将同一个DNA模板的复制聚集到一起的目的;
3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
4)对步骤3)中获得的同一个DNA模板的复制簇进行筛选,若正链和反链的测序序列数都达到2对以上,则进行后续分析;
5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列中的一致率也达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序列;
7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率;
8)Call SNV/InDel/SV/CNV:根据患者样品与对照样品信息的比对,用mutect流程call somatic SNV变异;用gatk流程call somatic InDel变异;用contra.py流程callCNV;用somVar流程call SV;
所使用的筛选参数为:对照位点变异率≤2%;纠错后变异测序序列条数≥2;突变预测p值≤0.05;
9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
6.测序结果分析
测序数据统计结果如下表8所示:
表8
注释:正反链互配率:基于3条测序序列以上正反链均有的簇/3条测序序列上总的簇的比值,以评估可用数据中正反链互配情况;有效数据利用率:基于至少满足2+/2-簇的测序序列纠错后的个数与总测序测序序列数的比值;低频纠错深度:基于有效数据纠错后,对目标区域碱基的平均覆盖情况。
结果分析:总共检出13个Exon区非同义突变,参考宫颈癌COSMIC数据库,TOP20基因一致的变异总共2个:PIK3CA p.R38H;KMT2D p.Q4014*;预示患者存在癌症高风险。后续临床病理确认为:患者为宫颈CINⅡ级
此外相应组织常规高通量测序分析以及血浆数字PCR验证结果:
表9
以上的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明的技术方案做出的各种变型和改进,均应落入本发明的权利要求书确定的保护范围内。

Claims (8)

1.一种脱落细胞DNA低频突变富集测序试剂盒,其特征在于,含有富集探针芯片,芯片上探针是将基于人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1;
基于目标DNA突变碱基设计探针的方法为:根据目的基因的用途确定芯片捕获区间,参考目标DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。
2.一种脱落细胞DNA低频突变富集测序产品,包括:
(1)脱落细胞DNA提取与DNA打断单元;
(2)脱落细胞DNA文库构建单元;
(3)通用文库TT-COLD PCR扩增富集单元;
(4)探针富集捕获单元、杂交捕获产物的扩增与上机测序单元;
(5)正反双链纠错低频信息分析单元。
3.如权利要求2所述的产品,其特征在于,单元(3)的通用文库TT-COLD PCR扩增富集单元是基于通用引物对所有类型变异实现第一级突变富集扩增;所述通用引物的核苷酸序列为:
上游引物:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
下游引物:
CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中xxxxxxxx为index标签。
4.如权利要求2所述的产品,其特征在于,单元(4)的探针富集捕获单元是针对热点变异通过富集探针芯片实现第二次富集捕获,所述富集探针芯片上探针是将原先基于人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,且热点变异探针总覆盖度与其他区域正常探针覆盖度的差异至少为3:1;
基于ctDNA突变碱基设计探针的原则为:基于TCGA、ICGC、COSMIC数据库确定芯片捕获区间,参考TCGA、ICGC、COSMIC数据库,在每200bp碱基范围内,确定至少1个最重要的热点变异位点,同时针对该位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位点总探针覆盖水平所占的比例。
5.如权利要求4所述的产品,其特征在于,所述的基因数据库为肿瘤基因数据库;所述的富集探针芯片针对228个基因,共5220个热点变异,228个基因如下:
6.如权利要求2-5任一所述的产品,其特征在于,单元(5)的正反双链纠错低频信息分析单元是:
1)基于插入片段两端的序列碱基作为标签,所述插入片段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段将形成一对成对测序序列;将成对测序序列的测序序列1的前12bp碱基和测序序列2的前12bp碱基作为标签,字母序排列以较小的标签在前连接成24bp的一条索引,并且以这24bp作为成对测序序列的索引,测序序列1的标签在前就标记成正链;测序序列2的标签在前就标记为反链;
2)对索引进行外部排序,以达到将同一个DNA模板的所有测序序列聚集到一起的目的;
3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的;
4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序列数都达到2对以上,则进行后续分析;
5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序序列中的一致率也达到80%,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便得到了代表原始DNA模板序列的新测序序列;
6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测序序列;
7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布,统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率;
8)Call SNV/InDel/SV/CNV:根据患者样品与对照样品信息的比对,用mutect流程callsomatic SNV变异;用gatk流程call somatic InDel变异;用contra.py流程call CNV;用somVar流程call SV;
所使用的筛选参数为:对照位点变异率≤2%;纠错后变异测序序列条数≥2;突变预测p值≤0.05;
9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已有变异数据库中的该变异的情况。
7.权利要求2-5任一所述的产品在制备疾病早期筛查试剂盒中的应用。
8.如权利要求7所述的应用,其特征在于,所述的疾病为肿瘤。
CN201510488017.0A 2015-08-10 2015-08-10 一种脱落细胞dna低频突变富集测序方法 Active CN105132407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510488017.0A CN105132407B (zh) 2015-08-10 2015-08-10 一种脱落细胞dna低频突变富集测序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510488017.0A CN105132407B (zh) 2015-08-10 2015-08-10 一种脱落细胞dna低频突变富集测序方法

Publications (2)

Publication Number Publication Date
CN105132407A CN105132407A (zh) 2015-12-09
CN105132407B true CN105132407B (zh) 2017-12-12

Family

ID=54717977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510488017.0A Active CN105132407B (zh) 2015-08-10 2015-08-10 一种脱落细胞dna低频突变富集测序方法

Country Status (1)

Country Link
CN (1) CN105132407B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106048008A (zh) * 2016-06-03 2016-10-26 人和未来生物科技(长沙)有限公司 一种egfr基因超低频突变检测试剂盒
CN106192022B (zh) * 2016-08-08 2018-07-03 中国科学院北京基因组研究所 16SrRNA多重测序文库的构建方法
CN106570349B (zh) * 2016-10-28 2019-05-14 深圳华大基因科技服务有限公司 用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针
SG11201909697TA (en) * 2017-05-01 2019-11-28 Illumina Inc Optimal index sequences for multiplex massively parallel sequencing
CN107523563A (zh) * 2017-09-08 2017-12-29 杭州和壹基因科技有限公司 一种用于循环肿瘤dna分析的生物信息处理方法
CN108823312A (zh) * 2018-07-05 2018-11-16 苏州科诺医学检验所有限公司 快速检测alk融合基因的方法及富集探针和探测引物
CN111383717B (zh) * 2018-12-29 2024-10-18 北京安诺优达医学检验实验室有限公司 一种构建生物信息分析参照数据集的方法及系统
CN110387438A (zh) * 2019-07-08 2019-10-29 广东省公共卫生研究院 用于肠道病毒高通量测序的多重引物、试剂盒和方法
CN114093428B (zh) * 2021-11-08 2023-04-14 南京世和基因生物技术股份有限公司 一种ctDNA超高测序深度下低丰度突变的检测系统和方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102409049A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 一种基于pcr的dna标签文库构建方法
CN102560688A (zh) * 2010-12-15 2012-07-11 深圳华大基因科技有限公司 一种新的基于illumina测序平台的文库构建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102409049A (zh) * 2010-09-21 2012-04-11 深圳华大基因科技有限公司 一种基于pcr的dna标签文库构建方法
CN102560688A (zh) * 2010-12-15 2012-07-11 深圳华大基因科技有限公司 一种新的基于illumina测序平台的文库构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
COLD-PCR Enrichment of Rare Cancer Mutations prior to Targeted Amplicon Resequencing;Coren A等;《Clinical Chemistry》;20120331;第58卷(第3期);580-589页 *
TaqMan探针结合COLD-PCR原理定量检测JAK2 V617F突变率研究;梁国威等;《中国实验诊断学》;20120331;第16卷(第3期);398-401页 *

Also Published As

Publication number Publication date
CN105132407A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN105132407B (zh) 一种脱落细胞dna低频突变富集测序方法
AU2021202149B2 (en) Detecting repeat expansions with short read sequencing data
CN111662958B (zh) 基于纳米孔测序平台的文库的构建方法、鉴定微生物的方法及应用
JP6480591B2 (ja) 癌の検出のための血漿dna中のサイズ及び数異常の使用
CN105087789B (zh) 一种检测血浆cfDNA中BCR和TCR免疫组库的方法
WO2022032429A1 (zh) 用于肝癌检测和诊断的甲基化标志物
JP7299169B2 (ja) 体細胞突然変異のクローン性を決定するための方法及びシステム
CN110291212A (zh) 使用核酸片段的诊断应用
CN107475375A (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN105063209B (zh) 一种外泌体miRNA的定量检测方法
AU2016293025A1 (en) System and methodology for the analysis of genomic data obtained from a subject
CN107423534A (zh) 基因组拷贝数变异的检测方法和系统
CN107475403A (zh) 从外周血游离dna中检测循环肿瘤dna的方法、试剂盒及其测序结果的分析方法
CN108004304A (zh) 一种检测淋巴细胞相关基因重排的克隆性的方法
CN109295230A (zh) 一种基于ctDNA的多基因联合突变检测评估肿瘤动态变化的方法
CN110241215A (zh) 一种用于检测甲状腺结节良恶性相关基因变异的引物、试剂盒及检测方法
CN107760783A (zh) 基于108个基因的胃癌腹膜转移预测模型及其应用
CN104073569A (zh) 用于诊断手足口病极重症的分子标记物及其检测方法与试剂盒
CN105950709A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN109251980A (zh) 膀胱癌组织t细胞图谱模型及其构建方法和构建系统
Valle-Inclan et al. Rapid identification of genomic structural variations with nanopore sequencing enables blood-based cancer monitoring
WO2019129200A1 (zh) 一种c位点提取方法及装置
CN113710818A (zh) 病毒相关联的癌症风险分层
CN110408702A (zh) 一组染色体不稳定变异在制备诊断乳腺癌、评估预后的试剂或试剂盒中的应用
Gurry et al. Assessing the Microbiome—Current and Future Technologies and Applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for low-frequency mutant-enriched sequencing of DNA of exfoliative cells

Effective date of registration: 20181203

Granted publication date: 20171212

Pledgee: Beijing first financing Company limited by guarantee

Pledgor: BEIJING GENE+ TECHNOLOGY CO., LTD.

Registration number: 2018990001134

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20200214

Granted publication date: 20171212

Pledgee: Beijing first financing Company limited by guarantee

Pledgor: Geneplus - Beijing

Registration number: 2018990001134

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for low-frequency mutant-enriched sequencing of DNA of exfoliative cells

Effective date of registration: 20200311

Granted publication date: 20171212

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: Geneplus - Beijing

Registration number: Y2020990000163

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20201217

Granted publication date: 20171212

Pledgee: Zhongguancun Beijing technology financing Company limited by guarantee

Pledgor: Beijing Jiyingjia Technology Co.,Ltd.

Registration number: Y2020990000163