一种评估肿瘤负荷变化的方法和系统
技术领域
本发明属于生物技术领域,更具体而言本发明涉及评估肿瘤负荷的方法和系统。
背景技术
肿瘤负荷,是指肿瘤细胞个数、肿瘤大小或体内肿瘤病灶个数,通常被用来表示肿瘤对人体的危害程度。准确评估肿瘤负荷的变化,是评估肿瘤药物临床疗效的关键。
目前,临床上通常采用影像学的方法对晚期肿瘤负荷进行评估。该方法的实施需按照RECIST1.1标准(Eisenhauer E A,Therasse P,Bogaerts J,et al.New responseevaluation criteria in solid tumours:revised RECIST guideline(version 1.1).European journal of cancer,2009,45(2):228-247),根据肿瘤患者在治疗过程中影像学观察到的目标病灶的变化,将疗效和肿瘤负荷评价标准定义为:(1)完全缓解(CR):所有靶病灶完全消失,全部病理淋巴结(包括靶结节和非靶结节)短直径减小至<10毫米;(2)部分缓解(PR):靶病灶直径之和比基线水平(治疗前)减少至少30%;(3)疾病进展(PD):以整个研究过程中所有测量的靶病灶直径之和的最小值为参照,直径和相对增加至少20%(如果基线测量值最小就以基线值为参照);除此之外,必须满足直径的绝对值增加至少5毫米(出现一个或多个新病灶也视为疾病进展);(4)疾病稳定(SD):靶病灶减小的程度没达到PR,增加的程度也没达到PD水平,介于两者之间,研究时可以以直径之和的最小值作为参考。
影像学的方法具有以下三个方面的问题(Sharma M R,Maitland M L,Ratain MJ.RECIST:no longer the sharpest tool in the oncology clinical trialstoolbox—point.Cancer research,2012,72(20):5145-5149;Tie J,Kinde I,Wang Y,etal.Circulating tumor DNA as an early marker of therapeutic response inpatients with metastatic colorectal cancer.Annals of Oncology.2015;26(8):1715-1722):(1)该方法主要采用影像学评估肿瘤外部形态大小,缺乏对肿瘤细胞内部生物学活性的准确评估;(2)该方法对不可测量的病灶,如胸腔积液、腹腔积液等,缺少客观的评估体系;(3)该方法进行临床评估采用的时间节点通常固定为治疗过程中的6-8周,或治疗后每3-4个月,缺乏评估时间节点的灵活性。
发明内容
本发明的目的在于提供一种全新的评估晚期患者肿瘤负荷的方法,可以准确、灵活地评估肿瘤负荷,并同时提供肿瘤细胞的分子生物学特征。
本发明的计算分子肿瘤负荷指数(mTBI,molecular tumor burden index)的方法采用的检测样品为多个时间节点的游离DNA样本,通过游离DNA变异的检测,以变异的频率计算分子肿瘤负荷指数,并比较多个时间节点的分子肿瘤负荷指数的变化趋势,用以反映肿瘤负荷的变化趋势。
因此,在第一方面,本发明提供了一种评估肿瘤负荷的变化的方法,所述方法包括步骤:
1)对多个时间节点的游离DNA样本分别进行测序,获得测序读段(reads);
2)对于每个时间节点的游离DNA样本:
a)得到该时间节点的游离DNA样本中检出的变异(所述变异选自SNV、InDel和SV)及其位点的CNV,并获得所述多个时间节点的游离DNA样本中检出的全部变异(所述变异选自SNV、InDel和SV)及其位点的CNV;
b)统计每个所述变异的等位基因频率;
c)对每个所述变异的等位基因频率用所述变异位点的CNV进行校正;
d)对所述变异进行聚类,获得变异簇;
e)计算每个所述变异簇中所有变异的平均等位基因频率,得到具有最大平均等位基因频率的变异簇,该最大平均等位基因频率即为该时间节点的游离DNA样本的分子肿瘤负荷指数mTBI;
3)对所述多个时间节点的游离DNA样本的分子肿瘤负荷指数mTBI进行比较,反映肿瘤负荷的变化趋势。
在一个实施方案中,所述方法还包括步骤:
4)对患者治疗疗效或者肿瘤负荷变化进行评估,
将第一时间节点的游离DNA样本的mTBI的值作为基线mTBI0,对其他时间节点j的游离DNA样本的分子肿瘤负荷指数mTBIj的值进行标准化mTBIj’,
对于所述患者治疗疗效或者肿瘤负荷变化,包括:
a)部分缓解(mPR):相对于治疗前的mTBI’,被评估时间点的mTBI’降低≥25%;
b)疾病进展(mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,并且绝对增加值>1%;
c)疾病稳定(mSD):mTBI’的降低没有达到a)中的部分缓解标准,升高也没有达到b)中的疾病进展的标准。
在一个实施方案中,本发明的方法的步骤1)中利用捕获探针捕获游离DNA,然后对捕获的游离DNA片段进行测序。例如,捕获探针设计:基于TCGA、ICGC、COSMIC等数据库和相关文献参考,参考常规芯片捕获探针设计原则,确定芯片捕获区间;检索已报道的实体肿瘤(例如肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等),将高频发生的基因的所有外显子全部设计进入捕获探针芯片。在优选的实施方案中,也可以仅基于单一或者某几种肿瘤的捕获探针芯片设计;或者仅考虑热点位置的捕获探针芯片设计。
在一个实施方案中,本发明的方法的步骤1)中的游离DNA样本类型可以是血液(血浆)、唾液、胸腹腔积液、尿液、粪便等。
在一个实施方案中,本发明的方法的步骤2)的a)中的测序获得测序读段(reads)采用BWA软件比对到参考基因组,得到每个游离DNA样本中检出的变异。
在一个实施方案中,本发明的方法的步骤2)的a)中,用Mutect软件进行体细胞SNV变异(单核苷酸变异)检出;用GATK软件进行体细胞InDel(短的插入缺失)变异检出;用CONTRA软件CNV变异(拷贝数变异)检出;用ForestSV软件进行SV变异(结构变异)检出;所使用的筛选参数为:normal变异率≤2%;变异测序读段数≥5;p值≤0.05。
在一个实施方案中,本发明的方法的步骤2)的a)中,采用ANNOVAR软件对检出变异进行注释,注释内容包括碱基突变、氨基酸突变、突变功能等。
在一个实施方案中,本发明的方法的步骤2)的b)中,测序读段的支持结果和频率信息的统计过程采用SAMtools mpileup进行,参数设置为:比对质量=30,碱基质量=30,最少测序读段支持为4。
在一个实施方案中,本发明的方法的步骤2)的b)中,根据步骤1)中的测序结果,获得变异V(变异V选自SNV、InDel和SV)(Vi,i=1,…,n)的参考等位测序深度(Ri)、变异等位测序深度(Mi),并计算变异等位基因频率(Variant Allele Fraction,VAFi),
其中,参考等位测序深度(Ri)是测序结果中在相应位点未发生该变异的正常序列的条数;变异等位测序深度(Mi)是测序结果中在相应位点发生该变异的变异序列的条数。
在一个实施方案中,本发明的方法的步骤2)的c)中,利用变异Vi所在区域的CNV(CNVi,i=1,…,n),计算变异Vi所在区域的参考拷贝数(rCNi)和实际总拷贝数(CNi),
如果在步骤1)中使用精确的CNV检测方法(如使用SNP芯片检测),对于不在男性性染色体上的变异,会得到两条染色体上的等位特异的拷贝数变异(CNVi,major,CNVi,minor,CNVi,major≥CNVi,minor)信息,从而获取实际的等位特异的拷贝数(CNi,major,CNi,minor),
在一个实施方案中,本发明的方法的步骤2)的d)中,对每个所述变异所在细胞群占所有肿瘤细胞的比例进行预测,例如采用PyClone软件,软件参数可以设定如下:总体肿瘤细胞比例(CTF)=变异等位基因频率的最高值;迭代次数=20000;其他参数为默认。
在一个实施方案中,本发明的方法的步骤2)的d)中,通过预测的变异细胞比例,对变异进行聚类,例如采用PyClone软件。
在一个实施方案中,本发明的方法的步骤2)的d)中,使用PyClone v0.13(当前最新版本)对检出的n个变异V(SNV/indel/SV)进行聚类,除以下几个参数外,均采用默认参数:
(a)--tumour_contentsCTF;
(b)--num_iters 20000;
(c)--prior total_copy_number,当采用等位特异的CNV数据作为输入
时,该参数设置为parental_copy_number;
(d)--density pyclone_beta_binomial,当步骤1)采用的是测序深度较低的全基因组测序技术时,该参数设置为pyclone_binomial。
在一个实施方案中,本发明的方法采用单个变异的频率计算分子肿瘤负荷指数mTBI,该变异可以是SNV、InDel或SV。
在第二方面,本发明提供了一种评估肿瘤负荷的变化的系统,所述系统包括:
1)用于高通量测序多个时间点的游离DNA样本的模块;
2)对于每个所述时间节点的游离DNA样本执行如下步骤的模块:
a)接收来自模块1)的测序信息;
b)通过与正常基因序列的序列比较,得到该时间节点的游离DNA样本中检出的变异(所述变异选自SNV、InDel和SV)及其位点的CNV,并获得所述多个时间节点的游离DNA样本中检出的全部变异(所述变异选自SNV、InDel和SV)及其位点的CNV;
c)统计每个所述变异的等位基因频率;
d)对每个所述变异的等位基因频率用所述变异位点的CNV进行校正;
e)对所述变异进行聚类,获得变异簇;
f)计算每个所述变异簇中所有变异的平均等位基因频率,得到最大平均等位基因频率的变异簇,该最大平均等位基因频率即为该时间节点的游离DNA样本的分子肿瘤负荷指数mTBI;
3)对所述多个时间节点的游离DNA样本的分子肿瘤负荷指数mTBI进行比较的模块。
在一个实施方案中,所述系统还包括以下模块:
4)对患者治疗疗效或者肿瘤负荷变化进行评估的模块,所述模块执行如下步骤:
将第一时间节点的游离DNA样本的mTBI的值作为基线mTBI0,对其他时间节点j的游离DNA样本的分子肿瘤负荷指数mTBIj的值进行标准化mTBIj’,
对于所述患者治疗疗效或者肿瘤负荷变化,包括:
a)部分缓解(mPR):相对于治疗前的mTBI’,被评估时间点的mTBI’降低≥25%;
b)疾病进展(mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,且绝对增加值>1%;
c)疾病稳定(mSD):mTBI’的降低没有达到a)中的部分缓解标准,升高也没有达到b)中的疾病进展的标准。
在本发明第二方面的一个实施方案中,模块2)-4)中的任1个、2个模块或者全部3个模块为执行所述模块的步骤的多条指令的计算机可读介质。
在一个实施方案中,本发明的系统的模块1)中包括进行如下步骤的模块:利用捕获探针捕获游离DNA,然后对捕获的游离DNA片段进行测序。例如,捕获探针设计:基于TCGA、ICGC、COSMIC等数据库和相关文献参考,参考常规芯片捕获探针设计原则,确定芯片捕获区间;检索已报道的实体肿瘤(例如肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等),将高频发生的基因的所有外显子全部设计进入捕获探针芯片。在优选的实施方案中,也可以仅基于单一或者某几种肿瘤的捕获探针芯片设计;或者仅考虑热点位置的捕获探针芯片设计。
在一个实施方案中,本发明的系统的模块1)中的游离DNA样本类型可以是血液(血浆)、唾液、胸腹腔积液、尿液、粪便等。
在一个实施方案中,本发明的系统的模块2)的步骤b)中的测序获得测序读段(reads)采用BWA软件比对到参考基因组,得到每个游离DNA样本中检出的变异。
在一个实施方案中,本发明的系统的模块2)的步骤b)中,用Mutect软件进行体细胞SNV变异(单核苷酸变异)检出;用GATK软件进行体细胞InDel(短的插入缺失)变异检出;用CONTRA软件CNV变异(拷贝数变异)检出;用ForestSV软件进行SV变异(结构变异)检出;所使用的筛选参数为:normal变异率≤2%;变异测序读段数≥5;p值≤0.05。
在一个实施方案中,本发明的系统的模块2)的步骤b)中,采用ANNOVAR软件对检出变异进行注释,注释内容包括碱基突变、氨基酸突变、突变功能等。
在一个实施方案中,本发明的系统的模块2)的步骤c)中,测序读段的支持结果和频率信息的统计过程采用SAMtools mpileup进行,参数设置为:比对质量=30,碱基质量=30,最少测序读段支持为4。
在一个实施方案中,本发明的系统的模块2)的步骤c)中,根据模块1)获得的测序结果,获得变异V(变异V选自SNV、InDel和SV)(Vi,i=1,…,n)的参考等位测序深度(Ri)、变异等位测序深度(Mi),并计算变异等位基因频率(Variant Allele Fraction,VAFi),
其中,参考等位测序深度(Ri)是测序结果中在相应位点未发生该变异的正常序列的条数;变异等位测序深度(Mi)是测序结果中在相应位点发生该变异的变异序列的条数。
在一个实施方案中,本发明的系统的模块2)的步骤d)中,利用变异Vi所在区域的CNV(CNVi,i=1,…,n),计算变异Vi所在区域的参考拷贝数(rCNi)和实际总拷贝数(CNi),
如果在模块1)中使用精确的CNV检测方法(如使用SNP芯片检测),对于不在男性性染色体上的变异,会得到两条染色体上的等位特异的拷贝数变异(CNVi,major,CNVi,minor,CNVi,major≥CNVi,minor)信息,从而获取实际的等位特异的拷贝数(CNi,major,CNi,minor),
在一个实施方案中,本发明的系统的模块2)的步骤e)中,对每个所述变异所在细胞群占所有肿瘤细胞的比例进行预测,例如采用PyClone软件,软件参数可以设定如下:总体肿瘤细胞比例(CTF)=变异等位基因频率的最高值;迭代次数=20000;其他参数为默认。
在一个实施方案中,本发明的系统的模块2)的步骤e)中,通过预测的变异细胞比例,对变异进行聚类,例如采用PyClone软件。
在一个实施方案中,本发明的系统的模块2)的步骤e)中,使用PyClone v0.13(当前最新版本)对检出的n个变异V(SNV/indel/SV)进行聚类,除以下几个参数外,均采用默认参数:
(a)--tumour_contentsCTF;
(b)--num_iters 20000;
(c)--prior total_copy_number,当采用等位特异的CNV数据作为输入
时,该参数设置为parental_copy_number;
(d)--density pyclone_beta_binomial,当模块1)中采用的是测序深度较低的全基因组测序技术时,该参数设置为pyclone_binomial。
在一个实施方案中,本发明的系统采用单个变异的频率计算分子肿瘤负荷指数mTBI,该变异可以是SNV、InDel或SV。
本发明是一个开创性的发明,采用mTBI的方法可以评估所有实体瘤肿瘤负荷的变化情况,可以灵活地、实时地监测肿瘤负荷的进展,可以提供详尽的肿瘤分子生物学变异特征。
相对于其他评估方法,本发明的优势如下:
1)高覆盖度:肿瘤发生是由细胞内变异导致的,mTBI技术基于游离DNA变异检出结果,可以反映每个患有实体肿瘤的患者体内突变情况,并给出客观的负荷指数,克服了影像学在不可测量病灶检测中的主观因素,也可将无靶病灶患者纳入检测范围内;
2)高灵活性:mTBI评估肿瘤负荷的周期取决于游离DNA的取样时间节点,可以克服影像学方法以用药周期或随访月份为评估节点的长周期缺点,监测灵活,可以实时反映肿瘤负荷的动态变化;
3)高通量:结合高通量测序技术(例如下一代测序技术,NGS)的目标区域捕获测序,不仅可以对相关感兴趣的基因一次性扫描,获取更全面的分子突变信息,以得出更准确的相关预测,而且能够在很短的时间内同时进行多例样本检测,从而压缩成本,有利于临床的推广;
4)指示性:mTBI过程中检出的变异信息,存在部分信息可对应临床肿瘤患者的用药靶点,在提示肿瘤负荷变化的同时,提示受试者进一步的治疗方案。
附图说明
通过以下附图对本发明进行说明:
图1是mTBI计算示意图,图中基线期为治疗前的时间节点。
图2中示出了本发明的方法获得的结果与临床影像学结果进行比较的结果。
具体实施方式
在本发明中,基因名称均采用NCBI-Gene里的官方命名(Official Symbol),并采用本领域通用表示法表示基因突变和蛋白质突变。例如,c.1634C>T(p.S545L)表示错义突变,表示编码区第1634位的C碱基改变为T碱基,从而导致545位的氨基酸由S突变为L;c.672+1G>T表示剪切突变,表示编码区第672位所在外显子3端紧连内含子的第一个碱基由G改变为T;c.351_364delGACAGCCAAGTCTG(p.T118Dfs*26)表示小片段缺失,表示编码区第351位到364位的碱基GACAGCCAAGTCTG缺失,从而导致氨基酸序列的118位氨基酸T由于读码框的改变突变成为D,新的读码框持续翻译了26个新的氨基酸。
在本发明中,数学符号ceil是指向上取整。
在本发明中,所述肿瘤选自但不限于:肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。在一个具体的实施方案中,所述肿瘤是乳腺癌,所述变异是实施例5.1节的表中列出的变异。
本发明的方法流程图如图1所示,对每位受试患者,采用的检测样品为多个时间节点的游离DNA样本,通过游离DNA变异的检测,以变异的频率计算分子肿瘤负荷指数,并比较多个时间节点的分子肿瘤负荷指数的变化趋势,用以反映肿瘤负荷的变化趋势。
本发明人发现,对于乳腺癌而言,发明人通过试验并追踪患者疾病进展情况证明了,对于所述患者治疗疗效或者肿瘤负荷变化,包括:
a)部分缓解(mPR):相对于治疗前的mTBI’,被评估时间点的mTBI’降低≥25%;
b)疾病进展(mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,且绝对增加值>1%;
c)疾病稳定(mSD):mTBI’的降低没有达到a)中的部分缓解标准,升高也没有达到b)中的疾病进展的标准。
以下为本发明的方法的主要技术流程与原理介绍:
1.高通量测序检测ctDNA变异
首先,进行变异检测和参数计算:
1)通过全基因组、全外显子组或探针捕获测序等高通量测序技术及相应的信息学分析方法,对受试者cfDNA进行测序,获取ctDNA中包含的变异,包括SNV、indel、SV、CNV等;
2)根据步骤1)中的测序结果,获得变异V(所述变异V选自SNV、InDel和SV)(Vi,i=1,…,n)的参考等位测序深度(Ri)、变异等位测序深度(Mi),并计算变异等位基因频率(Variant Allele Fraction,VAFi),
其中,参考等位测序深度(Ri)是测序结果中在相应位点未发生该变异的正常序列的条数;变异等位测序深度(Mi)是测序结果中在相应位点发生该变异的变异序列的条数;
3)利用变异Vi所在区域的CNV(CNVi,i=1,…,n),计算变异Vi所在区域的参考拷贝数(rCNi)和实际总拷贝数(CNi),
如果在步骤1)中使用精确的CNV检测方法(如使用SNP芯片检测),对于不在男性性染色体上的变异,会得到两条染色体上的等位特异的拷贝数变异(CNVi,major,CNVi,minor,CNVi,major≥CNVi,minor)信息,从而获取实际的等位特异的拷贝数(CNi,major,CNi,minor),
精确的CNV检测是指获得两条染色体的等位特异的拷贝数变异,例如使用SNP芯片检测。
2.变异聚类
然后,对每位患者,依据步骤1中得到的参数,将检测到的变异进行聚类分析和克隆层级计算:
1)ctDNA比例评估:以最大的变异等位频率来评估cfDNA中ctDNA所占比例(CTF),
CTF=max(VAFi),i=1,…,n (公式5)
2)变异聚类:
对变异进行聚类:是利用例如PyClone软件或其他基于贝叶斯聚类方法,将具有相似细胞比例的变异聚类到一类中。
对于任一变异(SNV/indel/SV)而言,cfDNA的来源细胞被分为三类:正常细胞(N)、不携带该变异的肿瘤细胞(C0)、携带该变异的肿瘤细胞(C1),携带该变异的肿瘤细胞(C1)占所有肿瘤细胞(C1+C0)的比例称为变异肿瘤细胞比例,如果两个或以上变异的变异肿瘤细胞比例相当,那么它们发生的时间近似,会被赋予相同的簇标签,聚类成一簇,即一个分子克隆。
因此,对变异聚类需要用到以下数据:
a)变异Vi(SNV/indel/SV)的参考和变异等位深度数据(Ri,Mi):用于与CTF和CNV一块评估变异肿瘤细胞比例;
b)步骤1.3)中的参考拷贝数(rCNi)和实际总拷贝数(CNi)或实际的等位特异的拷贝数(CNi,major,CNi,minor):对于某一变异,该变异等位的拷贝数扩增或缺失会造成变异肿瘤细胞比例估计值的假性升高或假性降低,因此加入拷贝数变化数据会更准确的判断C1细胞的基因型,校正变异频率,正确评估变异肿瘤细胞比例;
c)CTF:用以估计cfDNA来源细胞的构成,即所有细胞(N+C0+C1)中肿瘤细胞(C0+C1)所占的比例,该参数的准确设置有助于正确计算来自正常细胞的参考等位和来自肿瘤细胞的参考等位的数量比例。
例如使用PyClone v0.13(当前最新版本)对检出的n个变异V(SNV/indel/SV)进行聚类,除以下几个参数外,均采用默认参数:
(a)--tumour_contentsCTF;
(b)--num_iters 20000;
(c)--prior total_copy_number,当采用等位特异的CNV数据作为输入
时,该参数设置为parental_copy_number;
(d)--density pyclone_beta_binomial,当步骤1.1)采用的是测序深度
较低的全基因组测序技术时,该参数设置为pyclone_binomial。
PyClone(Roth,A.et al.PyClone:statistical inference of clonalpopulation structure in cancer.Nature methods 11,396-398,doi:10.1038/nmeth.2883(2014).)根据变异V(SNV/indel/SV)和CNV信息估计Vi所在的细胞占所有肿瘤细胞的比例,并依此对每个变异赋予一个变异簇标签(Ci,i=1,…,n,Ci∈{1,…,c},c为变异簇的个数)。
对变异聚类还可以采用例如PyClone的其他版本或其他变异聚类软件。
3)对mTBI进行计算:是通过计算聚类得到的每个变异簇的平均频率,采用最大的变异簇平均频率表示分子肿瘤负荷指数mTBI。
3.评估肿瘤负荷变化
对所述多个时间节点的游离DNA样本的mTBI进行比较,mTBI的值增加或降低到一定程度反映肿瘤在治疗过程中具体状态,例如部分缓解(mPR)、疾病进展(mPD)、疾病稳定(mSD)。
优选地,将第一时间节点的游离DNA样本的mTBI的值作为基线mTBI0,对其他时间节点j的游离DNA样本的分子肿瘤负荷指数mTBIj的值进行标准化mTBIj’,
对于所述患者治疗疗效或者肿瘤负荷变化,包括:
a)部分缓解(mPR):相对于治疗前的mTBI’,被评估时间点的mTBI’降低≥25%;
b)疾病进展(mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,且绝对增加值>1%;
c)疾病稳定(mSD):mTBI’的降低没有达到a)中的部分缓解标准,升高也没有达到b)中的疾病进展的标准。
下面结合图1对本发明的方法的主要技术流程与原理进行介绍。
本发明可以按照如下进行捕获探针设计:
1)基于TCGA、ICGC、COSMIC等数据库和相关文献参考,参考常规芯片捕获探针设计原则,确定芯片捕获区间;
2)检索已报道的实体肿瘤(肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等),将高频发生的基因的所有外显子全部设计进入芯片。
本发明还可以仅涉及单一或者某几种肿瘤的捕获芯片设计;非全部外显子或者仅考虑热点位置的芯片设计。
本发明可以按照如下进行外周血血浆分离及DNA提取:
采取多个时间节点的血,使用EDTA抗凝管采血,不可使用肝素抗凝。采血量不低于8ml,采血后立即上下颠倒混匀,4小时内完成血浆分离。
1)血浆分离流程如下:(1)将采血管在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5mL或者2.0mL的离心管中,在吸取血浆过程中不能吸到中间白细胞层,下层淋巴细胞和血细胞作为对照样品进行保存;(2)将分装好的血浆样本进行二次分离,在4℃条件下16000g离心10min,将上清转移到新的1.5mL或者2.0mL的离心管中,弃去残余白细胞,两次分离后血浆和对照样品标记清楚,保存在-80℃冰箱备用。
2)血浆游离DNA提取:血浆游离DNA的提取采用QIAamp Circulating NucleicAcid Kit(QIAGEN)游离DNA提取试剂盒并依照厂商说明书完成。
本发明还可以使用其他可提取游离DNA的样本类型,如唾液、胸腹腔积液、尿液、粪便等;其他采血管进行的外周血采集;其他试剂盒进行的DNA提取。
本发明可以按照如下进行文库构建:
采用KAPA文库构建试剂盒进行文库构建,或者采用其他试剂盒进行文库构建。
本发明可以按照如下进行探针捕获与上机测序:
文库构建、质控合格后进行液体芯片捕获,之后进行捕获产物的扩增与Hiseq3000上机测序,或者使用其他测序仪进行测序。
本发明可以按照如下进行变异检出:
1)将测序下机数据进行过滤,剔除低质量的测序读段;
2)将测序下机数据采用BWA软件比对到参考基因组;
3)比对bam文件采用Picard进行重复序列的标记;
4)去重复后的bam文件采用GATK进行InDelRealigner和BaseRecalibrator的处理;
5)用Mutect软件进行体细胞SNV变异(单核苷酸变异)检出;用GATK软件进行体细胞InDel(短的插入缺失)变异检出;用CONTRA软件CNV变异(拷贝数变异)检出;用ForestSV软件进行SV变异(结构变异)检出;所使用的筛选参数为:normal变异率≤2%;变异测序读段数≥5;p值≤0.05;
6)采用ANNOVAR软件对检出变异进行注释,注释内容包括碱基突变、氨基酸突变、突变功能等;
本发明还可以使用其他现有软件或者个人编写脚本进行的bam文件生成、变异检出、变异注释。
本发明可以按照如下进行变异聚类与mTBI计算:
1)检出变异测序读段和变异等位基因频率统计:将各个时间节点样品检出的变异V(SNV/InDel/SV)合并为一个集合,并对集合中的变异统计其在多个时间节点样品中的测序读段支持结果和频率信息,统计过程可以采用SAMtools mpileup进行,参数设置为:比对质量=30,碱基质量=30,最少测序读段支持为4;
2)预测每个变异所在细胞群所占的细胞比例:对连续时间节点的变异合并集合采用例如PyClone软件对细胞比例进行预测,优选将每个变异位点的拷贝数变异用于对变异等位基因频率进行校正,例如软件参数设定如下:总体肿瘤细胞比例=变异等位基因频率的最高值,迭代次数=20000,其他参数为默认;
3)变异的聚类分析:采用例如PyClone软件,通过预测的变异细胞比例,对变异进行聚类得到变异簇,并经过变异簇的平均等位基因频率进行排序,得到最大平均频率的变异簇;
4)mTBI的计算:对于第j个时间节点的样品,取上述对其确定的最大平均频率的变异簇的平均频率作为mTBIj。
本发明还可以采用其他软件或者脚本进行的测序读段支持结果和等位基因频率统计;采用其他软件进行的细胞比例预测;采用的其他软件进行的变异聚类分析;采用单个变异的频率计算mTBI,该变异可以SNV、InDel或SV。
本发明可以按照如下进行肿瘤负荷的评估:
采用基线期(第一个时间节点)的mTBI0值作为标准,对任意第j个时间节点的mTBIj值进行标准化mTBIj’,公式为
在对患者治疗疗效或者肿瘤负荷进行评估中,通过被评估时间点的mTBI’与基线的mTBI’比较,评估肿瘤负荷。
例如,对患者疗效给出3种不同的定义,分别为:
部分缓解(molecular Partial Response,mPR):相对于治疗前基线的mTBI’,被评估时间点的mTBI’降低≥25%;
疾病进展(molecular Progressive Disease,mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,且绝对增加值>1%;
疾病稳定(molecular Stable Disease mSD):mTBI’降低没有达到部分缓解标准,但是也没有升高达到疾病进展的标准。
本发明中使用的工具软件可以通过如下途径获得:
1.BWA:http://bio-bwa.sourceforge.net/
2.Picard:https://broadinstitute.github.io/picard/
3.GATK:https://www.broadinstitute.org/gatk/
4.Mutect:http://www.broadinstitute.org/cancer/cga/mutect
5.CONTRA:http://contra-cnv.sourceforge.net/
6.ForestSV:http://sebatlab.ucsd.edu/index.php/software-data
7.ANNOVAR:http://annovar.openbioinformatics.org/en/latest/
8.SAMtools:http://samtools.sourceforge.net/
9.PyClone:http://compbio.bccrc.ca/software/pyclone/。
在本发明的方法中,除了测序步骤之外,其他步骤可以以指令的形式存在于计算机可读介质中,只需要将所述测序结果输入计算设备,所述计算设备就可以读取所述计算机可读介质中的指令,完成本发明方法的其他步骤。。所述计算设备包括但不限于计算机、便携式计算机、PAD、智能手机、智能手腕等。
实施例
下面通过具体的乳腺癌腹膜转移患者的血浆游离DNA检测结果实施例,对本发明进行说明,需要说明的是该实施例仅仅是为了说明目的,而不能以任何方式解释成对本申请的限制。
1.外周血浆分离和游离DNA提取:
使用EDTA抗凝管采血,不可使用肝素抗凝。采血量不低于8ml,采血后立即上下颠倒混匀,4小时内完成血浆分离。
1.1血浆分离流程:(1)将采血管在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5mL或者2.0mL的离心管中,在吸取血浆过程中不能吸到中间白细胞层,下层淋巴细胞和血细胞作为对照样品进行保存;(2)将分装好的血浆样本进行二次分离,在4℃条件下16000g离心10min,将上清转移到新的1.5mL或者2.0mL的离心管中,弃去残余白细胞,两次分离后血浆和对照样品标记清楚,保存在-80℃冰箱备用。
1.2血浆游离DNA提取
血浆游离DNA的提取采用QIAamp Circulating Nucleic Acid Kit
(QIAGEN)游离DNA提取试剂盒并依照厂商说明书完成。
2.样品文库的制备
提取后的游离DNA后,按照KAPA LTP Library Preparation Kit建库说明书,进行3步酶促反应。
2.1末端修复
然后加入Agencourt AMPure XP reagent 120μL,进行磁珠纯化,最后回溶42μLddH2O,带磁珠进行下一步反应。
2.2加A反应
然后加入PEG/NaCl SPRI溶液90μL,充分混合,进行磁珠纯化,最后回溶20μLddH2O,带磁珠进行下一步反应。
然后,分别加入PEG/NaCl SPRI溶液50μL 2次,进行2次磁珠纯化,最后回溶25μLddH2O。
2.3连接文库的富集
对连接文库进行富集,使用荧光定量PCR仪(ABI 7500),按照KAPA LTP LibraryPreparation Kit试剂盒说明进行操作。
3.探针捕获与上机测序
3.1扩增后文库质控合格后并采用发明人设计的捕获探针(中国专利申请CN105063208A中实施例5的ONCOcare-JK),参照芯片制造商(Roche)提供的说明书进行杂交捕获。最后洗脱回溶21μL ddH2O带杂交洗脱磁珠。
3.2杂交捕获产物的扩增
3.3先除去上一步磁珠,然后重新加入Agencourt AMPure XP reagent 50μL,进行磁珠纯化,最后回溶25μL ddH2O,进行QC及上机。
3.4采用Illumina HiSeq3000PE151程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
4.正反双链纠错低频信息分析:
4.1下机数据进行过滤,剔除低质量的测序读段;
4.2下机数据采用BWA软件比对到参考基因组;
4.3比对bam文件采用Picard进行重复序列的标记;
4.4去重复后的bam文件采用GATK进行IndelRealigner和BaseRecalibrator的处理。
4.5变异检出:用Mutect软件进行体细胞SNV变异检出;用GATK软件进行体细胞InDel变异检出;用CONTRA软件CNV检出;用ForestSV软件进行SV变异检出;所使用的筛选参数为:normal变异率≤2%;变异测序读段数≥5;p值≤0.05。
4.6变异注释:采用ANNOVAR软件对检出变异进行注释,注释内容包括碱基突变、氨基酸突变、突变功能等。
5.测序结果分析
5.1变异检出结果
患者变异检出结果如下表所示:
5.2测序读段统计结果
5.3Pyclone聚类结果
使用PyClone v0.13对检出的变异进行聚类,除以下几个参数外,均采用默认参数:
a)--tumour_contents 0.01,0.01,0.012,0.026,0.067
b)--num_iters 20000
c)--prior total_copy_number
d)--density pyclone_beta_binomial
6.m TBI计算及肿瘤负荷监测
第j个时间节点的mTBIj为该时间节点SNV簇的平均频率最高值。计算各时间节点的mTBI,并按照第一节点的mTBI0值进行标准化校正后得到各时间节点的mTBI’,计算结果和负荷评估结果如下图:
时间节点 |
01 |
02 |
03 |
04 |
05 |
mTBI(%) |
0.94 |
0.21 |
0.23 |
1.99 |
6.68 |
mTBI'(%) |
100 |
22 |
24 |
212 |
712 |
负荷评估结果 |
- |
mPR |
mSD |
mPD |
mPD |
7.与影像学比较
与临床影像学结果对比后,发现本方法可以通过mTBI的值的变化客观反映乳腺癌原发灶和腹膜转移灶的整体负荷变化,并相较于影像学,可以更早地发现疾病进展(提前一个节点),比较结果如图2。
因此,mTBI的值变化代表了肿瘤负荷变化。mTBI的值增加或降低到一定程度反映肿瘤在治疗过程中具体状态,例如部分缓解(mPR)、疾病进展(mPD)、疾病稳定(mSD)。
发明人将第一时间节点的游离DNA样本的mTBI的值作为基线mTBI0,对其他时间节点j的游离DNA样本的分子肿瘤负荷指数mTBIj的值进行标准化mTBIj’,
发明人通过试验并追踪患者疾病进展情况证明了,对于所述患者治疗疗效或者肿瘤负荷变化,包括:
a)部分缓解(mPR):相对于治疗前的mTBI’,被评估时间点的mTBI’降低≥25%;
b)疾病进展(mPD):与治疗过程中出现的最小mTBI’相比,所评估时间节点的mTBI’相对增加值≥25%,且绝对增加值>1%;
c)疾病稳定(mSD):mTBI’的降低没有达到a)中的部分缓解标准,升高也没有达到b)中的疾病进展的标准。