一种用于利用循环肿瘤DNA样本检测体细胞突变的装置
技术领域
本发明涉及低频突变检测领域,具体涉及一种用于利用循环肿瘤DNA样本检测体细胞突变的装置及方法。
背景技术
肿瘤细胞会向血液中释放基因组DNA,这些变异DNA也随之释放到外周血中,被称为循环肿瘤DNA(circulating tumor DNA,ctDNA)。肿瘤细胞的基因组DNA突变是一种体细胞突变(SNV)。有文献报道称,癌变人群血浆中游离100~400bp大小的DNA片段浓度明显高于正常人,可以作为筛查的标志物。又有研究发现,循环肿瘤DNA在早期原位癌(primarycancer)患者血液中就已经开始出现。由于外周血循环DNA半衰期短,因此循环肿瘤DNA能够真实反映患者病变组织基因突变的真实情况。循环肿瘤DNA在恶性肿瘤诊疗中的应用越来越受到关注和重视,作为研究的热点和突破口将有可能为临床肿瘤的早期诊断、预后判定及疗效监测等提供一系列方便、快捷、特异、无创的分子生物学检测手段。
另一方面,二代测序的主流平台一般均采用边合成边测序(Sequencing BySynthesis,SBS)技术进行核酸测序。测序前,需要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进行片段的末端修复,之后在修复后的片段3'端加“A”碱基,然后将上述DNA片段与含有测序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。
但是,血浆中游离DNA含量极微,片段化严重,且循环肿瘤DNA仅占血浆游离DNA总量的0.02%~50%,如何区分真正的SNV与二代测序中发生的PCR错误、测序假阳性及比对不准确等带来的噪音是当前面临的一大难题。
发明内容
本发明所要解决的技术问题
正如前述,基于现有的平台,使用循环肿瘤DNA样本进行SNV预测的难点在于将测序错误与真实的SNV进行准确的区分。
因此,本发明的目的在于提供一种能够更准确地区分测序错误与真实SNV、从而更准确地利用循环肿瘤DNA样本检测SNV的装置及方法。
本发明人经过深入研究发现,通过收集大量的健康人样本进行平行试验,能够确定基因组每一个位置的错误率,从而更准确地区分测序错误与SNV,同时降低假阳性与假阴性。
即,本发明包括:
一种用于利用循环肿瘤DNA样本检测体细胞突变(SNV)的装置,其包括:
数据获取模块,用于获取循环肿瘤DNA样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述循环肿瘤DNA样本DNA各位点的突变频率、以及与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述循环肿瘤DNA样本DNA的测序数据可以来自对待测循环肿瘤DNA样本DNA进行测序而获得的数据;所述健康人群DNA的测序数据可以来自已经建立的健康人群DNA数据库,或者来自对健康人群生物样本DNA进行测序(测序方法应与针对所述待测循环肿瘤DNA样本DNA的测序方法相同,即平行测序)而获得的数据;
突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述循环肿瘤DNA样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定模块,其与所述对比模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为无显著差异时,判定结果为非体细胞突变(包括系统错误及一部分胚系突变);当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;当所述对比结果为有显著差异、且突变频率大于或等于设定值时,判定结果为胚系突变;所述设定值可以根据测序的实际情况进行合理设定,例如,在测序深度在100×时,优选的设定值可以为35%;以及
检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。
优选地,所述数据获取模块包括循环肿瘤DNA样本DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及
统计子模块,其与所述预处理子模块相连接,用于统计循环肿瘤DNA样本DNA各位点的突变频率。
优选地,所述统计子模块筛选出循环肿瘤DNA样本DNA各位点中的可信度值(LOD值)大于设定值(例如100)的位点并进行突变频率统计。针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},
而对于每条read i(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。
优选地,所述数据获取模块包括与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及
统计子模块,其与所述预处理子模块相连接,用于统计与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
优选地,所述突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。
优选地,所述判定模块包括下述子模块:
突变显著性判定子模块,其与所述对比模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的突变的显著性;以及
突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
优选地,所述突变显著性判定子模块判定所述循环肿瘤DNA样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异(例如判据为正态分布,P<0.05),有显著差异则为真实突变,无显著差异则为假阳性突变。
优选地,检测结果输出模块输出循环肿瘤DNA样本DNA各位点的具有显著性的突变的位置和突变类型。
优选地,所述循环肿瘤DNA样本是血浆或血清。
此外,本发明还提供:
一种用于利用循环肿瘤DNA样本检测体细胞突变(SNV)的方法,其包括:
数据获取步骤,获取循环肿瘤DNA样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述循环肿瘤DNA样本DNA各位点的突变频率、以及与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述循环肿瘤DNA样本DNA的测序数据可以来自对待测循环肿瘤DNA样本DNA进行测序而获得的数据;所述健康人群DNA的测序数据可以来自已经建立的健康人群DNA数据库,或者来自对健康人群生物样本DNA进行测序(测序方法应与针对所述待测循环肿瘤DNA样本DNA的测序方法相同,即平行测序)而获得的数据;
突变频率统计步骤,统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比步骤,将所述循环肿瘤DNA样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定步骤,判定所述循环肿瘤DNA样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为无显著差异时,判定结果为非体细胞突变(包括系统错误及一部分胚系突变);当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;当所述对比结果为有显著差异、且突变频率大于或等于设定值时,判定结果为胚系突变;所述设定值可以根据测序的实际情况进行合理设定,例如,在测序深度在100×时,优选的设定值可以为35%;以及
检测结果输出步骤,输出所述判定步骤的所述判定结果。
优选地,所述数据获取步骤包括循环肿瘤DNA样本DNA各位点的突变频率获取步骤,该步骤进一步包括下述子步骤:
过滤子步骤,对测序数据进行质检,过滤去除低质量的测序数据;
比对子步骤,将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子步骤,去除重复的测序片段;以及
统计子步骤,统计循环肿瘤DNA样本DNA各位点的突变频率。
优选地,所述统计子步骤筛选出循环肿瘤DNA样本DNA各位点中的可信度值(LOD值)大于设定值(例如100)的位点并进行突变频率统计。针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},
而对于每条read i(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。
优选地,所述数据获取步骤包括与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取步骤,该步骤进一步包括下述子步骤:
过滤子步骤,对测序数据进行质检,过滤去除低质量的测序数据;
比对子步骤,将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子步骤,去除重复的测序片段;以及
统计子步骤,统计与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
优选地,所述突变频率统计步骤包括模型校正子步骤,所述模型校正子步骤用于利用得到的健康人群突变频率统计模型,对与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。
优选地,所述判定步骤包括下述子步骤:
突变显著性判定子步骤,判定所述循环肿瘤DNA样本DNA各位点的突变的显著性;以及
突变类型判定子步骤,判定所述循环肿瘤DNA样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
优选地,所述突变显著性判定子步骤判定所述循环肿瘤DNA样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异(例如判据为正态分布,P<0.05),有显著差异则为真实突变,无显著差异则为假阳性突变。
优选地,检测结果输出步骤输出循环肿瘤DNA样本DNA各位点的具有显著性的突变的位置和突变类型。
优选地,所述循环肿瘤DNA样本是血浆或血清。
根据本发明,能够更准确地将系统错误与真实的SNV进行区分,不仅提高了灵敏度,而且降低了假阳性与假阴性。
附图说明
图1是本发明的用于检测体细胞突变的装置的一例的示意图。
发明的具体实施方式
本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
一般而言,本说明书中采用的术语具有如下含义。
贝塔分布:Beta分布是一个连续分布,是描述概率p的分布,取值范围为0到1。Beta分布有α和β两个参数,其中α为成功次数加1,β为失败次数加1。
亚克隆:对培养的细胞来说,从原有的克隆中,再筛选出具有某种特性的细胞进行培养,就是亚克隆。
目标序列捕获测序:是将感兴趣的基因组区域定制成特异性探针与基因组DNA在序列捕获芯片(或溶液)进行杂交,将目标基因组区域的DNA片段进行富集后再利用第二代测序技术进行测序的研究策略。
体细胞突变(SNV):是指除性细胞外的体细胞发生的突变。不会造成后代的遗传改变,却可以引起当代某些细胞的遗传结构发生改变。
胚系突变(SNP):遗传性基因缺陷是通过卵子或精子传递的,所有的胚胎细胞都含有同样的遗传缺陷,这种缺陷存在于生殖细胞内,代代相传。
正链:与RNA序列相同的那一个DNA单链;复制中,正链就是与新链序列相同的原单链,非模板链。
实施例
以下给出实施例,对本发明进行更具体的说明,但本发明不限于这些实施例。
实施例1 本发明的用于利用循环肿瘤DNA样本检测体细胞突变的装置
实施例1的用于利用循环肿瘤DNA样本检测体细胞突变的装置具备:
数据获取模块,用于获取循环肿瘤DNA样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述循环肿瘤DNA样本DNA各位点的突变频率、以及与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述循环肿瘤DNA样本DNA的测序数据来自对待测循环肿瘤DNA样本DNA进行测序而获得的数据,所述健康人群DNA的测序数据来自已经建立的健康人群DNA数据库;
突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述循环肿瘤DNA样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定模块,其与所述对比模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;以及
检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。
所述数据获取模块包括循环肿瘤DNA样本DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据(小于Q30),得到clean fastq data;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段(reads)在基因组中对应的位置;具体而言,用BWA软件对cleanfastq data进行比对得到sam格式文件,用samtools将sam格式文件转为bam格式(其中包含reads在基因组中对应的位置的信息),节省内存空间;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;具体而言,预处理模块处理所述bam文件,去除重复的reads,得到unique bam文件;
统计子模块,其与所述预处理子模块相连接,用于统计循环肿瘤DNA样本DNA各位点的突变频率;
具体而言,所述统计子模块针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},而对于每条read i(i=1…d)
覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。最终,筛选LOD>100的位点,获取突变频率。
所述数据获取模块还包括与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取模块,该模块与所述循环肿瘤DNA样本DNA各位点的突变频率获取模块的区别在于:其统计子模块不筛选LOD值大于设定值的位点,而是获取所有与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
所述突变频率统计模块用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率的分布情况,得到健康人群突变频率统计模型。该突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述循环肿瘤DNA样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离(正态分布,P>0.05)的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,直至没有明显偏离的点,得到新的健康人群突变频率统计模型。
所述判定模块包括下述子模块:
突变显著性判定子模块,其与所述对比模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的突变的显著性;以及
突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述循环肿瘤DNA样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
所述突变显著性判定子模块判定所述循环肿瘤DNA样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异,例如判据为正态分布、P<0.05,有显著差异则为真实突变,无显著差异则为假阳性突变。对于有显著差异的真实突变,当突变频率小于35%时,判定为真实的体细胞突变;当突变频率大于或等于35%时,判定为胚系突变。
检测结果输出模块输出的信息包括:真实突变位置(例如12号染色体上1444444绝对位置,参考基因组为HG19)、突变类型(例如体细胞突变)及突变碱基(例如A->T,R172K),突变频率(如12.34%),详情(例如包括基因,转录本,外显子,碱基突变情况,氨基酸突变情况等)。
实施例2
对一例男性非小细胞肺癌患者的外周血样本进行体细胞突变检测。
1.1提取外周血样本的cfDNA
采用MagMAX Cell-Free DNA Isolation Kit试剂盒(Life公司)提取血液cfDNA,得到提取的cfDNA,提取方法参照使用手册。
1.2末端修复(End Repair)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表1。
表1
(2)末端修复反应:加入DNA样本后将1.5mL离心管置于Thermomixer中20℃温浴30分钟。反应结束后使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于32μL EB。
1.3末端加“A”(A-Tailing)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表2:
表2
(2)末端加“A”反应:加入32μL上一步纯化回收的DNA后将1.5mL离心管置于Thermomixer中37℃温浴30分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于18μL EB中。
1.4接头的连接(Adapter Ligation)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表3:
表3
(2)接头的连接反应:加入18μL上一步纯化回收的DNA后将样本管置于Thermomixer中20℃温浴15分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于30μL的EB中。
1.5PCR反应
(1)从-20℃保存的试剂盒中取出所需试剂,2mL的PCR管中配制PCR反应体系:
表4
(2)设定PCR程序,PCR反应的程序设定如下:
反应结束及时将样品取出放入4℃冰箱保存并按要求退出或关闭仪器。
(3)用0.9×核酸纯化磁珠回收纯化反应体系中的DNA,纯化后的文库溶于20μL的ddH2O中。对文库进行Qubit检测,将文库送检安捷伦2100。
1.6肺癌目标区域捕获芯片文库杂交
(1)本实验中,用于提供杂交捕获反应的离子环境的缓冲液、以及用于洗脱物理吸附或非特异性杂交的清洗液、漂洗液均可从商业途径获得。
(2)准备杂交文库:将待杂交的DNA文库在冰上融化,取总质量1μg(在后续操作步骤中将此DNA文库称为样本文库)。
(3)制备Ann引物Pool:将样本文库Index对应的标签引物In1(100μM)及公共引物(1000μM)各取1000pmol混合,(在后续操作步骤中将此混合物称为Ann引物pool)。
(4)杂交样本的制备:向1.5mL EP管中加入5μL COT DNA(Human Cot-1DNA,Lifetechnologies,1mg/mL)、1μg样本文库、Ann引物pool。用封口膜密封制备好的杂交样本EP管,将盛有样本文库pool/COT DNA/Ann引物pool的EP管置于真空装置中直到完全干燥。
(5)杂交样本的溶液:向样本文库pool/COT DNA/Ann引物pool的干粉中加入:
7.5μL 2×杂交缓冲液
3μL 杂交组分A
(6)充分混匀后将上述混合物置于预先准备好的95℃加热模块上变性10分钟。
(7)将上述混合物转移至含有4.5μL捕获芯片的0.2mL平盖PCR管中。充分涡旋震荡3秒,将杂交样品混合物置于47℃加热模块上16小时。加热模块的热盖温度需设定为57℃,杂交后产物需进行后续洗脱回收操作。
(8)将10×清洗液(Ⅰ,Ⅱ与Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。
表5
(9)将下列试剂在47℃加热模块中预热:
400μL 1×漂洗液
100μL 1×清洗液I
1.7制备亲和吸附磁珠
(1)将链霉亲和素磁珠(Dynabeads M-280Streptavidin,以下简称磁珠)在室温下平衡30分钟后,将磁珠充分涡旋混匀15秒。
(2)向1.5mL离心管中分装100μL磁珠,将盛有100μL磁珠的离心管置于磁力架上,约5分钟后小心吸弃上清,加两倍于磁珠初始体积的1×磁珠清洗液,涡旋混匀10秒。将盛有磁珠的离心管放回磁力架,吸附磁珠。待溶液澄清,吸弃上清。重复次步骤,共洗涤两次。
(3)洗涤完毕后吸弃磁珠清洗液,用磁珠初始体积的1×磁珠清洗液涡旋重悬磁珠转入0.2mL的PCR管中。将PCR管置于磁力架上吸附磁珠澄清后吸弃上清。
1.8DNA与亲和吸附磁珠的结合及漂洗
(1)将杂交的样本文库转入盛有亲和吸附磁珠的0.2mL PCR管中,涡旋振荡混匀。
(2)将0.2mL PCR管置于47℃加热模块45分钟,每隔15分钟涡旋混匀一次,使DNA与磁珠结合。
(3)45分钟孵育后,向15μL捕获的DNA样本中加入47℃预热的1×清洗液I 100μL。涡旋混匀10秒。将0.2mL PCR管中的全部组分转入1.5mL离心管中。将1.5mL离心管置于磁力架上吸附磁珠,弃上清。
(4)将1.5mL离心管从磁力架上取下,加入200μL预热47℃的1×漂洗液。吸打混匀10次(需迅速操作,防止试剂、样品温度低于47℃)。混匀后样本置于47℃加热模块上5分钟。重复此步骤,用47℃的1×漂洗液共洗涤两次。将1.5mL的离心管置于磁力架上,吸附磁珠,弃上清。
(5)向上述1.5mL离心管中加入200μL室温的1×清洗液I,涡旋混匀2分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅱ,涡旋混匀1分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅲ,涡旋混匀30秒。将离心管置于磁力架上,吸附磁珠,弃上清。
(6)1.5mL离心管从磁力架上取下,加入45μL PCR水,溶解洗脱磁珠捕获样本。
1.9捕获DNA的PCR扩增
(1)按下表制备捕获后PCR mix,制备好后涡旋震荡混匀。富集引物F和富集引物R均购自英潍捷基公司。
(2)磁珠吸附DNA PCR的扩增程序设定如下:
(3)杂交捕获DNA PCR产物的回收纯化:用核酸纯化磁珠回收纯化反应体系中的DNA,磁珠使用量为0.9×,纯化后的文库溶于30μL的ddH2O中。
1.10文库定量
对文库进行2100Bio Analyzer(Agilent)/LabChip GX(Caliper)及QPCR检测,记录文库浓度。
1.11文库上机测序
构建好的文库采用NextSeq 550AR进行测序(PE75)。
1.12数据处理及分析
将获得的测序数据输入实施例1的装置,检测体细胞突变。检测结果如下表所示。
1.13结果验证
采用数字PCR方法对同一患者的剩余cfDNA样本是否发生上述体细胞突变进行验证,检测结果表明,EGFR基因发生exon21:c.2573T>G突变,突变频率约2.93%验证结果与1.12检测结果一致。本发明的检测装置能够成功检出循环肿瘤DNA样本的体细胞突变。
工业实用性
根据本发明,提供了一种能够更准确地区分测序错误与真实SNV、从而更准确地利用循环肿瘤DNA样本检测SNV的装置及方法。