CN106874710A - 一种用于利用肿瘤ffpe样本检测体细胞突变的装置 - Google Patents

一种用于利用肿瘤ffpe样本检测体细胞突变的装置 Download PDF

Info

Publication number
CN106874710A
CN106874710A CN201710067031.2A CN201710067031A CN106874710A CN 106874710 A CN106874710 A CN 106874710A CN 201710067031 A CN201710067031 A CN 201710067031A CN 106874710 A CN106874710 A CN 106874710A
Authority
CN
China
Prior art keywords
mutation
frequency
site
module
tumour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710067031.2A
Other languages
English (en)
Inventor
陈玥茏
侯光远
刘卉
陈玉洁
王旺
玄兆伶
李大为
梁峻彬
陈重建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Annoroad Genetic Technology (Beijing) Co., Ltd.
Annuo uni-data (Yiwu) Medical Inspection Co. Ltd.
Zhejiang Annuo uni-data Biotechnology Co. Ltd.
Original Assignee
ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd filed Critical ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Publication of CN106874710A publication Critical patent/CN106874710A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于利用肿瘤FFPE样本检测体细胞突变的装置,其包括数据获取模块、突变频率统计模块、对比模块、判定模块以及检测结果输出模块。本发明的用于利用肿瘤FFPE样本检测体细胞突变的装置能够更准确地将系统错误与真实的体细胞突变进行区分,不仅提高了灵敏度,而且降低了假阳性与假阴性。

Description

一种用于利用肿瘤FFPE样本检测体细胞突变的装置
技术领域
本发明涉及低频突变检测领域,具体涉及一种用于利用肿瘤FFPE样本检测体细胞突变的装置及方法。
背景技术
福尔马林固定石蜡包埋(Formalin-fixed and Paraffin-embedded,FFPE)方法制备的组织标本称为福尔马林固定石蜡包埋组织样本,简称FFPE样本。FFPE样本能够长时间保存,其常用于临床病理检验、肿瘤基因检测和医学科学研究,是一个可靠的分子生物学研究的材料来源。
在世界范围内,大约有数十亿份组织样品保存在医院或者组织样品库中。其中绝大多数是FFPE样本。FFPE样本通常代表了珍贵且来源广泛的生物医学研究材料,数量巨大的归档FFPE样本为回顾性研究、阐明疾病机制、发现治疗靶标和指示预后等方面提供了宝贵的资源。特别是,有大量的肿瘤组织切片被以FFPE样本的形式保存。
另一方面,大量研究表明,癌症的产生是与体细胞突变(SNV)密切相关,并且这种突变往往仅出现在某一种肿瘤的亚克隆之中。亚克隆突变的研究为癌症病程发展及预后分层提供了新的方向。当前,二代测序技术已经广泛应用于肿瘤基因检测,高深度的二代测序可以检测亚克隆变异。
但是,通过二代测序检测亚克隆变异在文库构建、上机测序及序列比对的过程中将不可避免地发生PCR错误、测序假阳性及比对不准确的情况,如何区分真正的亚克隆变异与以上噪音是当前面临的一大难题。特别是在使用肿瘤FFPE样本进行检测的情况下,因为FFPE样本特殊的制作方法和保存过程都会使样本中的核酸受到损伤,所以这一问题尤为突出。
发明内容
本发明所要解决的技术问题
正如前述,基于现有的平台,使用肿瘤FFPE样本进行SNV预测的难点在于将测序错误与真实的SNV进行准确的区分。
因此,本发明的目的在于提供一种能够更准确地区分测序错误与真实SNV、从而更准确地利用肿瘤FFPE样本检测SNV的装置及方法。
本发明人经过深入研究发现,通过收集大量的健康人样本进行平行试验,能够确定基因组每一个位置的错误率,从而更准确地区分测序错误与SNV,同时降低假阳性与假阴性。
即,本发明包括:
一种用于利用肿瘤FFPE样本检测体细胞突变(SNV)的装置,其包括:
数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述肿瘤FFPE样本DNA的测序数据可以来自对待测肿瘤FFPE样本DNA进行测序而获得的数据;所述健康人群DNA的测序数据可以来自已经建立的健康人群DNA数据库,或者来自对健康人群生物样本DNA进行测序(测序方法应与针对所述待测肿瘤FFPE样本DNA的测序方法相同,即平行测序)而获得的数据;
突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为无显著差异时,判定结果为非体细胞突变(包括系统错误及一部分胚系突变);当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;当所述对比结果为有显著差异、且突变频率大于或等于设定值时,判定结果为胚系突变;所述设定值可以根据测序的实际情况进行合理设定,例如,在测序深度在100×时,优选的设定值可以为35%;以及
检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。
优选地,所述数据获取模块包括肿瘤FFPE样本DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及
统计子模块,其与所述预处理子模块相连接,用于统计肿瘤FFPE样本DNA各位点的突变频率。
优选地,所述统计子模块筛选出肿瘤FFPE样本DNA各位点中的可信度值(LOD值)大于设定值(例如100)的位点并进行突变频率统计。针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model 表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},
而对于每条read i(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。
优选地,所述数据获取模块包括与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及
统计子模块,其与所述预处理子模块相连接,用于统计与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
优选地,所述突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。
优选地,所述判定模块包括下述子模块:
突变显著性判定子模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变的显著性;以及
突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
优选地,所述突变显著性判定子模块判定所述FFPE样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异(例如判据为正态分布,P<0.05),有显著差异则为真实突变,无显著差异则为假阳性突变。
优选地,检测结果输出模块输出肿瘤FFPE样本DNA各位点的具有显著性的突变的位置和突变类型。
此外,本发明还提供:
一种用于利用肿瘤FFPE样本检测体细胞突变(SNV)的方法,其包括:
数据获取步骤,获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述肿瘤FFPE样本DNA的测序数据可以来自对待测肿瘤FFPE样本DNA进行测序而获得的数据;所述健康人群DNA的测序数据可以来自已经建立的健康人群DNA数据库,或者来自对健康人群生物样本DNA进行测序(测序方法应与针对所述待测肿瘤FFPE样本DNA的测序方法相同,即平行测序)而获得的数据;
突变频率统计步骤,统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比步骤,将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定步骤,判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为无显著差异时,判定结果为非体细胞突变(包括系统错误及一部分胚系突变);当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;当所述对比结果为有显著差异、且突变频率大于或等于设定值时,判定结果为胚系突变;所述设定值可以根据测序的实际情况进行合理设定,例如,在测序深度在100×时,优选的设定值可以为35%;以及
检测结果输出步骤,输出所述判定步骤的所述判定结果。
优选地,所述数据获取步骤包括肿瘤FFPE样本DNA各位点的突变频率获取步骤,该步骤进一步包括下述子步骤:
过滤子步骤,对测序数据进行质检,过滤去除低质量的测序数据;
比对子步骤,将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子步骤,去除重复的测序片段;以及
统计子步骤,统计肿瘤FFPE样本DNA各位点的突变频率。
优选地,所述统计子步骤筛选出肿瘤FFPE样本DNA各位点中的可信度值(LOD值)大于设定值(例如100)的位点并进行突变频率统计。针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model 表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},
而对于每条read i(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。
优选地,所述数据获取步骤包括与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取步骤,该步骤进一步包括下述子步骤:
过滤子步骤,对测序数据进行质检,过滤去除低质量的测序数据;
比对子步骤,将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子步骤,去除重复的测序片段;以及
统计子步骤,统计与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
优选地,所述突变频率统计步骤包括模型校正子步骤,所述模型校正子步骤用于利用得到的健康人群突变频率统计模型,对与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。
优选地,所述判定步骤包括下述子步骤:
突变显著性判定子步骤,判定所述肿瘤FFPE样本DNA各位点的突变的显著性;以及
突变类型判定子步骤,判定所述肿瘤FFPE样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
优选地,所述突变显著性判定子步骤判定所述FFPE样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异(例如判据为正态分布,P<0.05),有显著差异则为真实突变,无显著差异则为假阳性突变。
优选地,检测结果输出步骤输出肿瘤FFPE样本DNA各位点的具有显著性的突变的位置和突变类型。
根据本发明,能够更准确地将系统错误与真实的SNV进行区分,不仅提高了灵敏度,而且降低了假阳性与假阴性。
附图说明
图1是本发明的用于利用肿瘤FFPE样本检测体细胞突变的装置的一例的示意图。
发明的具体实施方式
本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
一般而言,本说明书中采用的术语具有如下含义。
贝塔分布:Beta分布是一个连续分布,是描述概率p的分布,取值范围为0到1。Beta分布有α和β两个参数,其中α为成功次数加1,β为失败次数加1。
亚克隆:对培养的细胞来说,从原有的克隆中,再筛选出具有某种特性的细胞进行培养,就是亚克隆。
目标序列捕获测序:是将感兴趣的基因组区域定制成特异性探针与基因组DNA在序列捕获芯片(或溶液)进行杂交,将目标基因组区域的DNA片段进行富集后再利用第二代测序技术进行测序的研究策略。
体细胞突变(SNV):是指除性细胞外的体细胞发生的突变。不会造成后代的遗传改变,却可以引起当代某些细胞的遗传结构发生改变。
胚系突变(SNP):遗传性基因缺陷是通过卵子或精子传递的,所有的胚胎细胞都含有同样的遗传缺陷,这种缺陷存在于生殖细胞内,代代相传。
正链:与RNA序列相同的那一个DNA单链;复制中,正链就是与新链序列相同的原单链,非模板链。
实施例
以下给出实施例,对本发明进行更具体的说明,但本发明不限于这些实施例。
实施例1 本发明的用于利用肿瘤FFPE样本检测体细胞突变的的装置
实施例1的用于利用肿瘤FFPE样本检测体细胞突变的装置具备:
数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述FFPE样本DNA的测序数据来自对待测FFPE样本DNA进行测序而获得的数据,所述健康人群DNA的测序数据来自已经建立的健康人群DNA数据库;
突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;以及
检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。
所述数据获取模块包括肿瘤FFPE样本DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据(小于Q30),得到clean fastq data;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段(reads)在基因组中对应的位置;具体而言,用BWA软件对cleanfastq data进行比对得到sam格式文件,用samtools将sam格式文件转为bam格式(其中包含reads在基因组中对应的位置的信息),节省内存空间;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;具体而言,预处理模块处理所述bam文件,去除重复的reads,得到unique bam文件;
统计子模块,其与所述预处理子模块相连接,用于统计肿瘤FFPE样本DNA各位点的突变频率;
具体而言,所述统计子模块针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:
公式中的各个部分又是由下列公式获得:
以下面两种模式来描述数据:
model M0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;
model表示在该位点有真实的m突变,并且等位基因频率为f。
M0就相当于是f=0时的
参考位点为r∈{A,T,C,G},而对于每条read i(i=1…d)
覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。最终,筛选LOD>100的位点,获取突变频率。
所述数据获取模块还包括与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取模块,该模块与所述肿瘤FFPE样本DNA各位点的突变频率获取模块的区别在于:其统计子模块不筛选LOD值大于设定值的位点,而是获取所有与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。
所述突变频率统计模块用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率的分布情况,得到健康人群突变频率统计模型。该突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离(正态分布,P>0.05)的位点,并统计余下的各位点中的每一个位点的突变频率的情况,直至没有明显偏离的点,得到新的健康人群突变频率统计模型。
所述判定模块包括下述子模块:
突变显著性判定子模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变的显著性;以及
突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。
所述突变显著性判定子模块判定所述FFPE样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异,例如判据为正态分布、P<0.05,有显著差异则为真实突变,无显著差异则为假阳性突变。对于有显著差异的真实突变,当突变频率小于35%时,判定为真实的体细胞突变;当突变频率大于或等于35%时,判定为胚系突变。
检测结果输出模块输出的信息包括:真实突变位置(例如12号染色体上1444444绝对位置,参考基因组为HG19)、突变类型(例如体细胞突变)及突变碱基(例如A->T,R172K),突变频率(如12.34%),详情(例如包括基因,转录本,外显子,碱基突变情况,氨基酸突变情况等)。
实施例2
对一例女性非小细胞肺癌患者的组织FFPE样本进行体细胞突变检测。
1.1提取FFPE样本的DNA
采用GeneRead DNA FFPE Kit(QIAGEN公司),按照手册说明进行提取操作,得到FFPE样本DNA。
1.2样本打断
使用Biorupter打断仪器进行打断,设定打断条件30个循环,30s ON/30s OFF,将FFPE样本DNA打断成200bp左右的片段,得到打断后的DNA片段。
1.3末端修复(End Repair)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表1。
表1
(2)末端修复反应:加入DNA样本后将1.5mL离心管置于Thermomixer中20℃温浴30分钟。反应结束后使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于32μLEB。
1.4末端加“A”(A-Tailing)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表2:
表2
(2)末端加“A”反应:加入32μL上一步纯化回收的DNA后将1.5mL离心管置于Thermomixer中37℃温浴30分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于18μL EB中。
1.5接头的连接(Adapter Ligation)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表3:
表3
(2)接头的连接反应:加入18μL上一步纯化回收的DNA后将样本管置于Thermomixer中20℃温浴15分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于30μL的EB中。
1.6 PCR反应
(1)从-20℃保存的试剂盒中取出所需试剂,2mL的PCR管中配制PCR反应体系:
表4
(2)设定PCR程序,PCR反应的程序设定如下:
反应结束及时将样品取出放入4℃冰箱保存并按要求退出或关闭仪器。
(3)用0.9×核酸纯化磁珠回收纯化反应体系中的DNA,纯化后的文库溶于20μL的ddH2O中。对文库进行Qubit检测,将文库送检安捷伦2100。
1.7肺癌目标区域捕获芯片文库杂交
(1)本实验中,用于提供杂交捕获反应的离子环境的缓冲液、以及用于洗脱物理吸附或非特异性杂交的清洗液、漂洗液均可从商业途径获得。
(2)准备杂交文库:将待杂交的DNA文库在冰上融化,取总质量1μg(在后续操作步骤中将此DNA文库称为样本文库)。
(3)制备Ann引物Pool:将样本文库Index对应的标签引物In1(100μM)及公共引物(1000μM)各取1000pmol混合,(在后续操作步骤中将此混合物称为Ann引物pool)。
(4)杂交样本的制备:向1.5mL EP管中加入5μL COT DNA(Human Cot-1DNA,Lifetechnologies,1mg/mL)、1μg样本文库、Ann引物pool。用封口膜密封制备好的杂交样本EP管,将盛有样本文库pool/COT DNA/Ann引物pool的EP管置于真空装置中直到完全干燥。
(5)杂交样本的溶液:向样本文库pool/COT DNA/Ann引物pool的干粉中加入:
7.5μL 2×杂交缓冲液
3μL 杂交组分A
(6)充分混匀后将上述混合物置于预先准备好的95℃加热模块上变性10分钟。
(7)将上述混合物转移至含有4.5μL捕获芯片的0.2mL平盖PCR管中。充分涡旋震荡3秒,将杂交样品混合物置于47℃加热模块上16小时。加热模块的热盖温度需设定为57℃,杂交后产物需进行后续洗脱回收操作。
(8)将10×清洗液(Ⅰ,Ⅱ与Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。
表5
(9)将下列试剂在47℃加热模块中预热:
400μL 1×漂洗液
100μL 1×清洗液I
1.8制备亲和吸附磁珠
(1)将链霉亲和素磁珠(Dynabeads M-280Streptavidin,以下简称磁珠)在室温下平衡30分钟后,将磁珠充分涡旋混匀15秒。
(2)向1.5mL离心管中分装100μL磁珠,将盛有100μL磁珠的离心管置于磁力架上,约5分钟后小心吸弃上清,加两倍于磁珠初始体积的1×磁珠清洗液,涡旋混匀10秒。将盛有磁珠的离心管放回磁力架,吸附磁珠。待溶液澄清,吸弃上清。重复次步骤,共洗涤两次。
(3)洗涤完毕后吸弃磁珠清洗液,用磁珠初始体积的1×磁珠清洗液涡旋重悬磁珠转入0.2mL的PCR管中。将PCR管置于磁力架上吸附磁珠澄清后吸弃上清。
1.9 DNA与亲和吸附磁珠的结合及漂洗
(1)将杂交的样本文库转入盛有亲和吸附磁珠的0.2mL PCR管中,涡旋振荡混匀。
(2)将0.2mL PCR管置于47℃加热模块45分钟,每隔15分钟涡旋混匀一次,使DNA与磁珠结合。
(3)45分钟孵育后,向15μL捕获的DNA样本中加入47℃预热的1×清洗液I 100μL。涡旋混匀10秒。将0.2mL PCR管中的全部组分转入1.5mL离心管中。将1.5mL离心管置于磁力架上吸附磁珠,弃上清。
(4)将1.5mL离心管从磁力架上取下,加入200μL预热47℃的1×漂洗液。吸打混匀10次(需迅速操作,防止试剂、样品温度低于47℃)。混匀后样本置于47℃加热模块上5分钟。重复此步骤,用47℃的1×漂洗液共洗涤两次。将1.5mL的离心管置于磁力架上,吸附磁珠,弃上清。
(5)向上述1.5mL离心管中加入200μL室温的1×清洗液I,涡旋混匀2分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅱ,涡旋混匀1分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅲ,涡旋混匀30秒。将离心管置于磁力架上,吸附磁珠,弃上清。
(6)1.5mL离心管从磁力架上取下,加入45μL PCR水,溶解洗脱磁珠捕获样本。
1.10捕获DNA的PCR扩增
(1)按下表制备捕获后PCR mix,制备好后涡旋震荡混匀。富集引物F和富集引物R均购自英潍捷基公司。
(2)磁珠吸附DNA PCR的扩增程序设定如下:
(3)杂交捕获DNA PCR产物的回收纯化:用核酸纯化磁珠回收纯化反应体系中的DNA,磁珠使用量为0.9×,纯化后的文库溶于30μL的ddH2O中。
1.11文库定量
对文库进行2100Bio Analyzer(Agilent)/LabChip GX(Caliper)及QPCR检测,记录文库浓度。
1.12文库上机测序
构建好的文库采用NextSeq 550AR进行测序(PE75)。
1.13数据处理及分析
将获得的测序数据输入实施例1的装置,检测体细胞突变。检测结果如下表所示。
1.14结果验证
采用一代测序方法对同一患者的剩余FFPE样本是否发生体细胞突变进行验证,验证结果表明,EGFR发生exon21:c.2573T>G突变,突变频率约30%。验证结果与1.13检测结果一致。本发明的检测装置能够成功检出肿瘤FFPE样本等低频突变样本的体细胞突变。
工业实用性
根据本发明,提供了一种能够更准确地区分测序错误与真实SNV、从而更准确地利用肿瘤FFPE样本检测SNV的装置及方法。

Claims (7)

1.一种用于利用肿瘤FFPE样本检测体细胞突变的装置,其包括:
数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;
突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;
对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;
判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;以及
检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。
2.根据权利要求1所述的装置,其中,所述数据获取模块包括肿瘤FFPE样本DNA各位点的突变频率获取模块,该肿瘤FFPE样本DNA各位点的突变频率获取模块进一步包括下述子模块:
过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;
比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;
预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及
统计子模块,其与所述预处理子模块相连接,用于统计肿瘤FFPE样本DNA各位点的突变频率。
3.根据权利要求2所述的装置,其中,所述统计子模块筛选出肿瘤FFPE样本DNA各位点中的可信度值大于设定值的位点并进行突变频率统计。
4.根据权利要求1~3中任一项所述的装置,其中,所述突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。
5.根据权利要求1~4中任一项所述的装置,其中,所述判定模块包括下述子模块:
突变显著性判定子模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变的显著性;以及
突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的具有显著性的突变的类型是否为体细胞突变。
6.根据权利要求5所述的装置,其中,所述突变显著性判定子模块判定所述FFPE样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异的判据为正态分布P<0.05,有显著差异则为真实突变。
7.根据权利要求1~6中任一项所述的装置,其中,检测结果输出模块输出肿瘤FFPE样本DNA各位点的具有显著性的突变的位置和突变类型。
CN201710067031.2A 2016-12-29 2017-02-07 一种用于利用肿瘤ffpe样本检测体细胞突变的装置 Pending CN106874710A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2016112462119 2016-12-29
CN201611246211 2016-12-29

Publications (1)

Publication Number Publication Date
CN106874710A true CN106874710A (zh) 2017-06-20

Family

ID=59165796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710067031.2A Pending CN106874710A (zh) 2016-12-29 2017-02-07 一种用于利用肿瘤ffpe样本检测体细胞突变的装置

Country Status (1)

Country Link
CN (1) CN106874710A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491666A (zh) * 2017-09-01 2017-12-19 深圳裕策生物科技有限公司 异常组织中单样本体细胞突变位点检测方法、装置和存储介质
CN108733975A (zh) * 2018-03-29 2018-11-02 深圳裕策生物科技有限公司 基于二代测序的肿瘤克隆变异检测方法、装置和存储介质
CN109536588A (zh) * 2018-12-26 2019-03-29 北京优迅医学检验实验室有限公司 检测ffpe样本氧化状态的方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1982471A (zh) * 2005-12-14 2007-06-20 北京华安佛医药研究中心有限公司 多态性位点基因型预测血管紧张素转换酶抑制剂类药物作用效果的用途、方法和试剂盒
CN101248182A (zh) * 2005-05-16 2008-08-20 孟山都技术有限公司 天冬酰胺和蛋白被增强的玉米植株和种子
CN101306002A (zh) * 2007-05-17 2008-11-19 首都医科大学宣武医院 人参皂苷在制备α-分泌酶活性增强剂药物中的应用
CN101930009A (zh) * 2009-11-19 2010-12-29 首都医科大学附属北京朝阳医院 一种血清钙标准物质
CN103525920A (zh) * 2013-09-29 2014-01-22 新疆农业大学 一种用于选育阿勒泰羊产肉性能的分子标记方法及其应用
US20140143188A1 (en) * 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
CN103930785A (zh) * 2011-08-11 2014-07-16 詹森药业有限公司 用于癌症治疗的预测物
CN104462869A (zh) * 2014-11-28 2015-03-25 天津诺禾致源生物信息科技有限公司 检测体细胞单核苷酸突变的方法和装置
CN104619843A (zh) * 2012-05-24 2015-05-13 A.B.种子有限公司 用于使基因表达沉默的组合物和方法
CN104662168A (zh) * 2012-06-21 2015-05-27 香港中文大学 用于癌症检测的血浆dna突变分析
CN105420351A (zh) * 2015-10-16 2016-03-23 深圳华大基因研究院 确定个体基因突变的方法和系统
CN105734070A (zh) * 2016-04-11 2016-07-06 苏州大学 Corin基因变异体及其用途

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101248182A (zh) * 2005-05-16 2008-08-20 孟山都技术有限公司 天冬酰胺和蛋白被增强的玉米植株和种子
CN1982471A (zh) * 2005-12-14 2007-06-20 北京华安佛医药研究中心有限公司 多态性位点基因型预测血管紧张素转换酶抑制剂类药物作用效果的用途、方法和试剂盒
CN101306002A (zh) * 2007-05-17 2008-11-19 首都医科大学宣武医院 人参皂苷在制备α-分泌酶活性增强剂药物中的应用
CN101930009A (zh) * 2009-11-19 2010-12-29 首都医科大学附属北京朝阳医院 一种血清钙标准物质
CN103930785A (zh) * 2011-08-11 2014-07-16 詹森药业有限公司 用于癌症治疗的预测物
CN104619843A (zh) * 2012-05-24 2015-05-13 A.B.种子有限公司 用于使基因表达沉默的组合物和方法
CN104662168A (zh) * 2012-06-21 2015-05-27 香港中文大学 用于癌症检测的血浆dna突变分析
US20140143188A1 (en) * 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
CN103525920A (zh) * 2013-09-29 2014-01-22 新疆农业大学 一种用于选育阿勒泰羊产肉性能的分子标记方法及其应用
CN104462869A (zh) * 2014-11-28 2015-03-25 天津诺禾致源生物信息科技有限公司 检测体细胞单核苷酸突变的方法和装置
CN105420351A (zh) * 2015-10-16 2016-03-23 深圳华大基因研究院 确定个体基因突变的方法和系统
CN105734070A (zh) * 2016-04-11 2016-07-06 苏州大学 Corin基因变异体及其用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"线粒体DNA突变与乳腺癌风险相关性研究": ""线粒体DNA突变与乳腺癌风险相关性研究"", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491666A (zh) * 2017-09-01 2017-12-19 深圳裕策生物科技有限公司 异常组织中单样本体细胞突变位点检测方法、装置和存储介质
CN107491666B (zh) * 2017-09-01 2020-11-10 深圳裕策生物科技有限公司 异常组织中单样本体细胞突变位点检测方法、装置和存储介质
CN108733975A (zh) * 2018-03-29 2018-11-02 深圳裕策生物科技有限公司 基于二代测序的肿瘤克隆变异检测方法、装置和存储介质
CN109536588A (zh) * 2018-12-26 2019-03-29 北京优迅医学检验实验室有限公司 检测ffpe样本氧化状态的方法及装置

Similar Documents

Publication Publication Date Title
CN106845153A (zh) 一种用于利用循环肿瘤dna样本检测体细胞突变的装置
CN107475375B (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN109887548B (zh) 基于捕获测序的ctDNA占比的检测方法及检测装置
CN106544407B (zh) 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN106650312B (zh) 一种用于循环肿瘤dna拷贝数变异检测的装置
CN109477138A (zh) 肺癌检测方法
CN107893116A (zh) 用于检测基因突变的引物对组合、试剂盒以及构建文库的方法
CN106480170B (zh) 确定供体和受体差异snp的方法及应用
CN112397151A (zh) 基于靶向捕获测序的甲基化标志物筛选与评价方法及装置
CN107034301A (zh) 一种检测肺结节为良性或恶性的试剂盒及其应用
CN115786459B (zh) 一种应用于高通量测序检测实体瘤微小残留病的方法
CN113096728B (zh) 一种微小残余病灶的检测方法、装置、存储介质及设备
CN110392740A (zh) 确定人群样本生物指标集、预测生物学年龄的方法及其应用
CN106845154B (zh) 一种用于ffpe样本拷贝数变异检测的装置
CN112029842B (zh) 一种基于高通量测序进行abo血型基因分型的试剂盒和方法
CN114317762B (zh) 用于检测早期肝癌的三标记物组合物及其试剂盒
CN106845155A (zh) 一种用于检测内部串联重复的装置
CN106874710A (zh) 一种用于利用肿瘤ffpe样本检测体细胞突变的装置
CN107541561A (zh) 提高母体外周血中胎儿游离dna浓度的试剂盒、装置及方法
Arıkan et al. Integrated multi-omics analyses of microbial communities: a review of the current state and future directions
AU2020364225A1 (en) Fragment size characterization of cell-free DNA mutations from clonal hematopoiesis
Batool et al. Extrinsic and intrinsic preanalytical variables affecting liquid biopsy in cancer
CN110358820A (zh) 检测ldlr基因突变的方法、引物和试剂盒
CN106778075A (zh) 一种用于检测血液病相关体细胞突变的装置
CN106815491B (zh) 一种用于检测ffpe样本基因融合的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180119

Address after: 100176 Beijing branch of Beijing economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant after: Annoroad Genetic Technology (Beijing) Co., Ltd.

Applicant after: Zhejiang Annuo uni-data Biotechnology Co. Ltd.

Applicant after: Annuo uni-data (Yiwu) Medical Inspection Co. Ltd.

Address before: 100176 Beijing branch of Daxing District economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant before: Annoroad Genetic Technology (Beijing) Co., Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination