CN111223526B - 基于二代测序血液样本的微卫星不稳定检测方法和装置 - Google Patents

基于二代测序血液样本的微卫星不稳定检测方法和装置 Download PDF

Info

Publication number
CN111223526B
CN111223526B CN201911119050.0A CN201911119050A CN111223526B CN 111223526 B CN111223526 B CN 111223526B CN 201911119050 A CN201911119050 A CN 201911119050A CN 111223526 B CN111223526 B CN 111223526B
Authority
CN
China
Prior art keywords
microsatellite
blood sample
detected
instability
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911119050.0A
Other languages
English (en)
Other versions
CN111223526A (zh
Inventor
朱嘉麒
李淼
陈超
聂新华
高志博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuce Biotechnology Co ltd
Original Assignee
Shenzhen Yuce Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuce Biotechnology Co ltd filed Critical Shenzhen Yuce Biotechnology Co ltd
Priority to CN201911119050.0A priority Critical patent/CN111223526B/zh
Publication of CN111223526A publication Critical patent/CN111223526A/zh
Application granted granted Critical
Publication of CN111223526B publication Critical patent/CN111223526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于二代测序血液样本的微卫星不稳定检测方法和装置,其中方法包括:获取待测血液样本和对照样本的目标区域捕获二代测序数据;从基因组中找到微卫星位点;过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;统计微卫星位点的各重复次数以及相应支持测序序列数;对各重复次数以及相应支持测序序列数进行标准化;计算每个微卫星位点上待测血液样本与对照样本各重复次数标准化结果的差值的绝对值并求各绝对值之和,作为每个微卫星位点的微卫星不稳定性;计算所有微卫星位点的微卫星不稳定性的平均值作为样本的微卫星不稳定性。本发明解决了无法获取组织的情况下难以检测微卫星不稳定的问题。

Description

基于二代测序血液样本的微卫星不稳定检测方法和装置
技术领域
本发明涉及生物信息学技术领域,具体涉及一种基于二代测序血液样本的微卫星不稳定检测方法和装置。
背景技术
癌症是全球最主要的非传染性疾病之一,也是死亡率很高的一种病种,在我国,每年有接近430万人被诊断为癌症,有超过280万人死于癌症。
抗肿瘤靶向药物和免疫检查点抑制剂是目前治疗癌症较为有效的手段,目前比较公认的免疫检查点抑制剂PD-1疗效评估潜在指标是MSI(微卫星不稳定),MSI的计算是基于肿瘤中的串联重复序列在体细胞相对于血液白细胞对照的分布情况。一般临床上建议这些药物在用于肿瘤治疗前进行基因检测以确定是否适合用药,以及用哪种药物。
目前常见的检测MSI的方法都在组织中实现。有PCR法直接检测少数微卫星位点稳定情况,IHC法检测错配修复基因的表达情况间接得到微卫星稳定性。也有二代测序的方法检测微卫星稳定情况,该方法类似PCR法,不过检测的微卫星位点多于PCR法,准确性得到提升。
然而,以上方法都是基于可以获取患者组织样本的情况下进行的,如果无法获得患者组织样本,就不能检测微卫星不稳定情况。如果强行检测血液DNA,可能会由于血液样本中肿瘤纯度较低而无法区分稳定/不稳定情况。
发明内容
本发明的目的在于提供一种基于二代测序血液样本的微卫星不稳定检测方法和装置,解决了无法获取组织的情况下难以检测微卫星不稳定的问题。
根据第一方面,一种实施例中提供一种基于二代测序血液样本的微卫星不稳定检测方法,包括:
获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;
从上述待测血液样本和对照样本的基因组中找到微卫星位点;
过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;
统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;
计算上述待测血液样本的每个微卫星位点的各重复次数标准化结果与上述对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;
计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
在优选实施例中,上述微卫星位点包括单碱基/多碱基重复次数在5-15之间的重复序列。
在优选实施例中,上述设定的覆盖度阈值是150;上述设定的比对质量阈值是50。
在优选实施例中,上述设定的微卫星不稳定性阈值为20%。
在优选实施例中,上述方法还包括:上述待测血液样本的微卫星不稳定性低于微卫星不稳定性阈值时,计算待测血液样本中的体细胞突变的突变频率平均值,作为肿瘤纯度;将肿瘤纯度低于设定的肿瘤纯度阈值的待测血液样本判断为可能的微卫星稳定假阴性以进一步验证。
在优选实施例中,上述肿瘤纯度阈值为1%。
在优选实施例中,上述方法还包括:上述待测血液样本的微卫星不稳定性等于或高于微卫星不稳定性阈值时,根据体细胞突变个数确定待测血液样本中的肿瘤突变负荷;将肿瘤突变负荷低于肿瘤突变负荷阈值的待测血液样本判断为可能的微卫星不稳定假阳性以进一步验证。
在优选实施例中,上述肿瘤突变负荷阈值为10。
根据第二方面,一种实施例中提供一种基于二代测序血液样本的微卫星不稳定检测装置,包括:
数据获取单元,用于获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;
微卫星位点寻找单元,用于从上述待测血液样本和对照样本的基因组中找到微卫星位点;
微卫星位点过滤单元,用于过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;
标准化处理单元,用于统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;
位点不稳定性计算单元,用于计算上述待测血液样本的每个微卫星位点的各重复次数标准化结果与上述对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;
样本不稳定性计算单元,用于计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
根据第三方面,一种实施例中提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现如第一方面的方法。
本发明的方法,对现有基于二代测序检测组织微卫星不稳定的方法进行改进,充分利用目前血液检测的高覆盖度优势,去除低覆盖度微卫星不稳定位点,去掉噪音,更高精度计算样本微卫星不稳定程度。
另外,现有方法都是计算微卫星不稳定位点个数,本发明的方法充分考虑血液样本中肿瘤纯度比组织样本低,避免由于信号不足导致大部分位点都有信号但是没有达到阈值导致的假阴性情况,通过计算所有微卫星不稳定位点的平均值来计算样本整体微卫星不稳定。最后,考虑到血液样本确实有信号偏低的问题,通过体细胞突变计算肿瘤纯度,如果肿瘤纯度确实过低,那么即使检测出来微卫星稳定这个结果也可能不可靠,提示需要进一步验证,避免造成假阴性问题。通过肿瘤突变负荷验证微卫星不稳定的结果,避免假阳性情况。从多个角度利用尽量多的信息最大限度检测血液样本中的微卫星不稳定结果,避免假阴/假阳结果。
附图说明
图1为本发明实施例中一种基于二代测序血液样本的微卫星不稳定检测方法流程图;
图2为本发明实施例中一种基于二代测序血液样本的微卫星不稳定检测装置结构框图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
目前二代测序的成本越来越低,覆盖区域和深度都越来越大,本发明利用高测序深度和大覆盖区域优势准确检测覆盖区域内微卫星位点情况,有效得到微卫星稳定性。利用血液样本中体细胞突变计算肿瘤纯度,从而判断微卫星稳定性结果的准确性。
如图1所示,本发明的一种实施例中提供一种基于二代测序血液样本的微卫星不稳定检测方法,包括如下步骤:
S101:获取二代测序数据
获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据。
本发明实施例中,需要同时检测同一受检个体的待测血液样本和对照样本。受检个体,例如可以是已经通过临床方法确诊为肿瘤患者的个体。待测血液样本,一般是指来源于肿瘤患者的血液样本。对照样本,一般是指来源于同一个肿瘤患者的非病患部位或组织的正常样本,例如外周血分离的白细胞样本。
需要说明的是,本发明的方法针对肿瘤患者等受检个体,但该方法本身并不以获取受检个体的患病信息作为直接目的。事实上,受检个体的患病信息在进行本发明的检测方法之前已经确认。本发明的方法的目的在于得到肿瘤患者等受检个体的微卫星不稳定性(microsatellite instability,MSI)。因此,本发明的方法不是疾病的治疗方法的范畴。
S102:寻找微卫星位点
从上述待测血液样本和对照样本的基因组中找到微卫星位点。
在本发明的一个实施例中,微卫星位点包括单碱基/多碱基重复次数在5-15之间的重复序列。例如,在本发明的一个实施例中,基因组上某个位置序列为CGAAAAACG,这里有5次单碱基A的重复,被称作一个微卫星位点。在本发明的一个实施例中,多碱基ACACACACAC,这里有5次双碱基AC的重复,被称作一个微卫星位点。
在本发明的一个实施例中,是先遍历参考基因组,找到参考基因组上的微卫星位点,然后将待测血液样本和对照样本的目标区域捕获二代测序数据比对到参考基因组上,通过比对结果寻找待测血液样本和对照样本的微卫星位点。
S103:过滤微卫星位点
过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点。
由于捕获等原因,有些位点的覆盖度和比对质量偏低,在后面检测微卫星不稳定时会造成不利影响,特别是血液样本中的微卫星不稳定由于血液样本中肿瘤纯度低会被这种不稳定因素严重影响。本发明的方法,充分利用目前血液检测的高覆盖度优势,去除低覆盖度微卫星不稳定位点,去掉噪音,更高精度计算样本微卫星不稳定程度。
在本发明的一个实施例中,设定的覆盖度阈值是150,即在某个微卫星位点上,如果测序序列数(测序深度)低于150,则过滤掉该微卫星位点。在其他实施例中,设定的覆盖度阈值可以是其他数值,一般而言,设定的覆盖度阈值越大,过滤掉的微卫星位点越多,保留的微卫星位点越少;相反设定的覆盖度阈值越小,过滤掉的微卫星位点越少,保留的微卫星位点越多。
在本发明的一个实施例中,设定的比对质量阈值是50,比对质量是平均比对质量,即在某个微卫星位点上,如果平均比对质量低于50,则过滤掉该微卫星位点。在其他实施例中,设定的比对质量阈值可以是其他数值,一般而言,设定的比对质量阈值越大,过滤掉的微卫星位点越多,保留的微卫星位点越少;相反设定的比对质量阈值越小,过滤掉的微卫星位点越少,保留的微卫星位点越多。
S104:统计重复次数和测序序列数并进行标准化
统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果。
在本发明的一个实施例中,从待测血液样本和对照样本中过滤后保留的高质量微卫星位点中统计每个位点支持的重复个数,以及分别统计每种重复个数的支持测序序列数。例如,基因组上某个位置序列为CGAAAAACG,这里有5个(次)A碱基的重复。比对上这个区域的测序序列有多种情况,可能是CGAAAAACG有10个测序序列,也可能是CGAAACG有2个测序序列,那么统计结果是这个微卫星位点5A(重复次数为5)有10个测序序列支持,3A(重复次数为3)有2个测序序列支持。
对上述待测血液样本和对照样本中的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数进行标准化。
在本发明的一个实施例中,标准化处理过程中,对待测血液样本和对照样本相对应的每个微卫星位点的每种重复次数分别计算其支持测序序列数相对于该微卫星位点的总支持测序序列数(位点覆盖度)的比例。例如,基因组上某个位置序列为CGAAAAACG,这里有5个(次)A碱基的重复。对照样本的测序数据比对上这个区域的测序序列有多种情况,其中CGAAAAACG有10个测序序列,而CGAAACG有2个测序序列,那么统计对照样本在这个微卫星位点的结果是5A(A的重复次数为5)有10个测序序列支持,3A(A的重复次数为3)有2个测序序列支持,该微卫星位点总共有12个测序序列支持;标准化处理后的结果为5A有10/12的序列支持,3A有2/12的序列支持。
类似地,待测血液样本的测序数据比对上这个区域的测序序列有多种情况,其中CGAAAAACG有15个测序序列,CGAAAACG有10个测序序列,CGAAACG有5个测序序列,那么统计待测血液样本在这个微卫星位点的结果是5A(A的重复次数为5)有15个测序序列支持,4A(A的重复次数为4)有10个测序序列支持,3A(A的重复次数为3)有5个测序序列支持,该微卫星位点总共有30个测序序列支持;标准化处理后的结果为5A有15/30的序列支持,4A有10/30序列支持,3A有5/30序列支持。
本发明的方法,对每个微卫星位点分别统计待测血液样本和对照样本中该微卫星位点的重复次数以及相应支持测序序列数,以便计算所有微卫星不稳定位点的平均值来计算待测血液样本整体微卫星不稳定。该方法充分考虑血液样本中肿瘤纯度比组织样本低,避免由于信号不足导致大部分位点都有信号但是没有达到阈值导致的微卫星稳定假阴性情况。
S105:计算位点不稳定性
计算待测血液样本的每个微卫星位点的各重复次数标准化结果与对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和(即每个微卫星位点内部所有差的绝对值求和),作为待测血液样本的每个微卫星位点的微卫星不稳定性。
例如,上述步骤S104的实施例中,上面待测血液样本和对照样本在微卫星位点CGAAAAACG上,计算待测血液样本的各重复次数标准化结果与对照样本的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,即:|15/30-10/12|+|10/30-0|+|5/30-2/12|,该值作为上述微卫星位点的微卫星不稳定性,表示待测血液样本和对照样本的在上述微卫星位点的差异。
S106:计算样本不稳定性
通过步骤S105得到每个微卫星位点的微卫星不稳定性后,计算所有微卫星位点的微卫星不稳定性的平均值作为样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的样本判定为微卫星不稳定,低于阈值的样本判定为微卫星稳定。
在本发明的一个实施例中,设定的微卫星不稳定性阈值为20%,即如果某样本的微卫星不稳定性数值等于或高于20%,那么该样本就被判定为微卫星不稳定;低于20%,那么该样本就被判定为微卫星稳定。需要说明的是,20%的微卫星不稳定性阈值是比较常用的数值,在其他实施例中微卫星不稳定性阈值可以是其他合适的数值,具体以根据需要设置。
考虑到血液样本存在信号偏低的问题,通过体细胞突变计算肿瘤纯度,如果肿瘤纯度确实过低,那么即使检测出来微卫星稳定这个结果也可能不可靠,提示需要进一步验证,避免造成微卫星稳定假阴性问题。因此,在本发明的一个优选实施例中,上述方法还包括:计算待测血液样本中的体细胞突变的突变频率平均值,作为肿瘤纯度,例如,在一个实施例中,使用体细胞突变的突变频率平均值当作肿瘤纯度,将肿瘤纯度低于设定的肿瘤纯度阈值的样本判断为可能的微卫星稳定假阴性样本以进一步验证。在本发明的一个优选实施例中,肿瘤纯度阈值为1%,即如果样本的肿瘤纯度低于1%,则样本被判断为可能是微卫星稳定假阴性,需要进一步验证。
在本发明的另一个实施例中,在微卫星不稳定性为小于20%时,从体细胞突变检测结果中平均所有结果的突变频率得到血液样本中的肿瘤纯度,如果肿瘤纯度在1%以下,这种情况可能是微卫星稳定假阴性,需要进一步进行其他实验验证;如果肿瘤纯度在1%及以上,这种情况输出微卫星稳定(microsatellite stability,MSS)的结果。
考虑到单纯使用血液样本检测微卫星不稳定可能存在假阳性问题,因此需要从多个角度利用尽量多的信息最大限度检测血液样本中的微卫星不稳定结果。因此,在本发明的一个优选实施例中,上述方法还包括:根据体细胞突变个数确定待测血液样本中的肿瘤突变负荷(TMB);将肿瘤突变负荷低于肿瘤突变负荷阈值的样本判断为可能的微卫星不稳定假阳性样本以进一步验证。肿瘤突变负荷为每兆检测位点的体细胞突变个数,即体细胞突变个数除以检测区域大小乘以兆。在本发明的一个优选实施例中,肿瘤突变负荷阈值为10,即如果样本的肿瘤突变负荷低于10,则样本被判断为可能是微卫星不稳定假阳性样本,需要进一步验证。由于微卫星不稳定一般会导致肿瘤突变负荷变高,通过本发明的方法判定的微卫星不稳定样本,如果肿瘤突变负荷低于10,说明肿瘤突变负荷不高,提示微卫星不稳定可能是假阳性。需要说明的是,肿瘤突变负荷阈值为10是比较常用的数值,在其他实施例中肿瘤突变负荷阈值可以是其他合适的数值,具体以根据需要设置。因为微卫星不稳定一般是由于错配修复基因的问题导致的,那么理论上来说也会导致样本中的体细胞突变个数变多,DNA在体内复制的时候不可避免会产生错误,导致全靠错配修复基因处理这些错误DNA,如果这些基因出问题,那么会造成这些错误DNA存活,测序结果中体现为体细胞突变。那么提示需要进一步验证避免造成假阳性问题。
在本发明的一个优选实施例中,在微卫星不稳定性为等于或高于20%时,体细胞突变个数除以覆盖区间大小乘以兆得到的肿瘤突变负荷小于10,这种情况可能是微卫星稳定假阳性,需要进一步进行其他实验验证;如果肿瘤突变负荷在10及以上,这种情况输出血液样本检测结果为微卫星不稳定。
对应于本发明的基于二代测序血液样本的微卫星不稳定检测方法,本发明的一种实施例中提供一种基于二代测序血液样本的微卫星不稳定检测装置,如图2所示,包括:数据获取单元201,用于获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;微卫星位点寻找单元202,用于从上述待测血液样本和对照样本的基因组中找到微卫星位点;微卫星位点过滤单元203,用于过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;标准化处理单元204,用于统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;位点不稳定性计算单元205,用于计算上述待测血液样本的每个微卫星位点的各重复次数标准化结果与对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;样本不稳定性计算单元206,用于计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
因此,本发明的一种实施例中提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现如下的方法:获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;从上述待测血液样本和对照样本的基因组中找到微卫星位点;过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;计算上述待测血液样本的每个微卫星位点的各重复次数标准化结果与上述对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
以下通过具体实施例详细说明本发明的技术方案,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例1
本实施例中,使用的样本是已采用PCR方法验证的微卫星不稳定组织样本Q2,和对应的未验证血液样本Q1,以及它们的对照样本Q0。本实施例成对样本检测的具体步骤如下:
(1)对基因组微卫星位点进行扫描,得到待检测的微卫星不稳定位点。
(2)分别过滤Q2、Q0和Q1、Q0两组数据中平均比对质量值低于50的低质量位点和覆盖度低于150的低覆盖度位点。
(3)计算Q2相对于Q0和Q1相对于Q0的微卫星不稳定性。
(4)通过Q2对Q0和Q1对Q0的体细胞突变计算肿瘤纯度和肿瘤突变负荷,与步骤(3)中的微卫星不稳定性一起输出到结果中,如表1所示,这里判断为MSI-h(组织样本)和bMSI-h(血液样本),即通过本发明方法检测出血液样本为微卫星不稳定,检测出组织样本也为微卫星不稳定,血液样本检测结果和组织样本检测结果一致,且都与组织样本的PCR结果一致,即都显示微卫星不稳定。
表1
Figure BDA0002274910120000101
实施例2
本实施例中,使用的样本是已使用PCR方法验证的微卫星稳定(MSS)组织样本K2,和对应的未验证血液样本K1,以及它们的对照样本K0。本实施例成对样本检测的具体步骤如下:
(1)对基因组微卫星位点进行扫描,得到待检测的微卫星不稳定位点。
(2)分别过滤K2、K0和K1、K0两组数据中平均比对质量值低于50的低质量位点和覆盖度低于150的低覆盖度位点。
(3)计算K2相对于K0和K1相对于K0的微卫星不稳定性。
(4)通过K2对K0和K1对K0的体细胞突变计算肿瘤纯度和肿瘤突变负荷,与步骤(3)中的微卫星不稳定性一起输出到结果中,如表2所示,这里判断为MSS(组织样本)和bMSS(血液样本),即通过本发明方法检测出血液样本为微卫星稳定,检测出组织样本也为微卫星稳定,血液样本检测结果和组织样本检测结果一致,且都与组织样本的PCR结果一致,即都显示微卫星稳定。
表2
Figure BDA0002274910120000102
Figure BDA0002274910120000111
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种基于二代测序血液样本的微卫星不稳定检测方法,其特征在于,所述方法包括:
获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;
从所述待测血液样本和对照样本的基因组中找到微卫星位点;
过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;
统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;
计算所述待测血液样本的每个微卫星位点的各重复次数标准化结果与所述对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;
计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
2.根据权利要求1所述的方法,其特征在于,所述微卫星位点包括单碱基/多碱基重复次数在5-15之间的重复序列。
3.根据权利要求1所述的方法,其特征在于,所述设定的覆盖度阈值是150;所述设定的比对质量阈值是50。
4.根据权利要求1所述的方法,其特征在于,所述设定的微卫星不稳定性阈值为20%。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述待测血液样本的微卫星不稳定性低于微卫星不稳定性阈值时,计算待测血液样本中的体细胞突变的突变频率平均值,作为肿瘤纯度;将肿瘤纯度低于设定的肿瘤纯度阈值的待测血液样本判断为可能的微卫星稳定假阴性以进一步验证。
6.根据权利要求5所述的方法,其特征在于,所述肿瘤纯度阈值为1%。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述待测血液样本的微卫星不稳定性等于或高于微卫星不稳定性阈值时,根据体细胞突变个数确定待测血液样本中的肿瘤突变负荷;将肿瘤突变负荷低于肿瘤突变负荷阈值的待测血液样本判断为可能的微卫星不稳定假阳性以进一步验证。
8.根据权利要求7所述的方法,其特征在于,所述肿瘤突变负荷阈值为10。
9.一种基于二代测序血液样本的微卫星不稳定检测装置,其特征在于,所述装置包括:
数据获取单元,用于获取同一受检个体的待测血液样本和对照样本的目标区域捕获二代测序数据;
微卫星位点寻找单元,用于从所述待测血液样本和对照样本的基因组中找到微卫星位点;
微卫星位点过滤单元,用于过滤掉覆盖度低于设定的覆盖度阈值的微卫星位点以及比对质量低于设定的比对质量阈值的微卫星位点;
标准化处理单元,用于统计待测血液样本和对照样本中过滤后保留的每个微卫星位点的不同重复次数以及各重复次数的支持测序序列数,并进行标准化,获得待测血液样本的每个微卫星位点的各重复次数标准化结果和对照样本的每个微卫星位点的各重复次数标准化结果;
位点不稳定性计算单元,用于计算所述待测血液样本的每个微卫星位点的各重复次数标准化结果与所述对照样本的相对应的微卫星位点的相同重复次数的标准化结果的差值的绝对值并求各绝对值之和,作为待测血液样本的每个微卫星位点的微卫星不稳定性;
样本不稳定性计算单元,用于计算所有微卫星位点的微卫星不稳定性的平均值作为待测血液样本的微卫星不稳定性,并根据设定的微卫星不稳定性阈值将等于或高于阈值的待测血液样本判定为微卫星不稳定,低于阈值的待测血液样本判定为微卫星稳定。
10.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-8中任一项所述的方法。
CN201911119050.0A 2019-11-15 2019-11-15 基于二代测序血液样本的微卫星不稳定检测方法和装置 Active CN111223526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911119050.0A CN111223526B (zh) 2019-11-15 2019-11-15 基于二代测序血液样本的微卫星不稳定检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911119050.0A CN111223526B (zh) 2019-11-15 2019-11-15 基于二代测序血液样本的微卫星不稳定检测方法和装置

Publications (2)

Publication Number Publication Date
CN111223526A CN111223526A (zh) 2020-06-02
CN111223526B true CN111223526B (zh) 2022-05-20

Family

ID=70827526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911119050.0A Active CN111223526B (zh) 2019-11-15 2019-11-15 基于二代测序血液样本的微卫星不稳定检测方法和装置

Country Status (1)

Country Link
CN (1) CN111223526B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037859B (zh) * 2020-09-02 2023-12-19 迈杰转化医学研究(苏州)有限公司 一种微卫星不稳定性的分析方法和分析装置
KR102529641B1 (ko) * 2020-11-20 2023-05-08 국립암센터 종양세포충실도 보정을 통한 현미부수체 불안정성의 판정방법
CN114708916B (zh) * 2022-03-15 2023-11-10 至本医疗科技(上海)有限公司 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105256057A (zh) * 2015-11-19 2016-01-20 湖南宏雅基因技术有限公司 基于二代测序平台的结肠癌微卫星不稳定性检测试剂盒
CN107299139A (zh) * 2017-07-25 2017-10-27 北京鑫诺美迪基因检测技术有限公司 一种用于检测微卫星不稳定性的组合物及其应用
CN107526944A (zh) * 2017-09-06 2017-12-29 南京世和基因生物技术有限公司 一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质
CN109055509A (zh) * 2018-09-10 2018-12-21 元码基因科技(北京)股份有限公司 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途
CN109637590A (zh) * 2018-12-29 2019-04-16 西安交通大学 一种基于基因组测序的微卫星不稳定性检测系统及方法
CN109988838A (zh) * 2019-03-28 2019-07-09 厦门艾德生物医药科技股份有限公司 一种可对肿瘤靶向治疗相关靶点和免疫治疗相关tmb及msi同时进行检测的体系

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140235456A1 (en) * 2012-12-17 2014-08-21 Virginia Tech Intellectual Properties, Inc. Methods and Compositions for Identifying Global Microsatellite Instability and for Characterizing Informative Microsatellite Loci
WO2019108807A1 (en) * 2017-12-01 2019-06-06 Personal Genome Diagnositics Inc. Process for microsatellite instability detection
PT110722B (pt) * 2018-05-03 2021-08-17 Instituto De Patologia E Imunologia Molecular Da Univ Do Porto Ipatimup Uso de anticorpos para o antigénio thomsen-friedenreich num método e estojo para avaliação de instabilidade de microsatelites

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105256057A (zh) * 2015-11-19 2016-01-20 湖南宏雅基因技术有限公司 基于二代测序平台的结肠癌微卫星不稳定性检测试剂盒
CN107299139A (zh) * 2017-07-25 2017-10-27 北京鑫诺美迪基因检测技术有限公司 一种用于检测微卫星不稳定性的组合物及其应用
CN107526944A (zh) * 2017-09-06 2017-12-29 南京世和基因生物技术有限公司 一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质
CN109055509A (zh) * 2018-09-10 2018-12-21 元码基因科技(北京)股份有限公司 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途
CN109637590A (zh) * 2018-12-29 2019-04-16 西安交通大学 一种基于基因组测序的微卫星不稳定性检测系统及方法
CN109988838A (zh) * 2019-03-28 2019-07-09 厦门艾德生物医药科技股份有限公司 一种可对肿瘤靶向治疗相关靶点和免疫治疗相关tmb及msi同时进行检测的体系

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Robust Triangular-electrode Based Capacitive;Yiyu Lin 等;《IEEE-NEMS 2017 Conference Paper》;20170412;第226-230页 *
单肿瘤组织微卫星不稳定探测方法;赵丹 等;《计算机系统应用》;20190915;第50-57页 *
尿路肿瘤细胞多重荧光PCR检测微卫星不稳定;吴晓斌 等;《现代肿瘤医学》;20110825;第1614-1616页 *
血浆DNA定量测定及p16基因异常甲基化分析在肺癌诊断中的意义;谢广顺;《中国博士学位论文全文数据库 医药卫生科技辑》;20061215;第E072-115页 *

Also Published As

Publication number Publication date
CN111223526A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN111223526B (zh) 基于二代测序血液样本的微卫星不稳定检测方法和装置
EP3481966B1 (en) Methods for fragmentome profiling of cell-free nucleic acids
US20180202003A1 (en) Sequence variant analysis of cell-free dna for cancer screening
CN107423578B (zh) 检测体细胞突变的装置
Ivakhno et al. CNAseg—a novel framework for identification of copy number changes in cancer from second-generation sequencing data
CN109411015B (zh) 基于循环肿瘤dna的肿瘤突变负荷检测装置及存储介质
Wang et al. Decoding tumor mutation burden and driver mutations in early stage lung adenocarcinoma using CT‐based radiomics signature
CN110299185B (zh) 一种基于新一代测序数据的插入变异检测方法及系统
US20190287645A1 (en) Methods for fragmentome profiling of cell-free nucleic acids
WO2018054254A1 (zh) 一种鉴定样本中肿瘤负荷的方法和系统
CN113674803B (zh) 一种拷贝数变异的检测方法、装置、存储介质及其应用
US20190352695A1 (en) Methods for fragmentome profiling of cell-free nucleic acids
CN110556164B (zh) 用于目标区域捕获测序检测msi的方法、装置和存储介质
CN116356001B (zh) 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法
KR20180092395A (ko) 종양 치료를 위한 표적 유전자 판별 방법
Muralidharan et al. Detecting mutations in mixed sample sequencing data using empirical Bayes
CN116543835B (zh) 一种检测血浆样本微卫星状态的方法和装置
Lee et al. Target-enhanced whole-genome sequencing (TE-WGS) shows clinical validity equivalent to commercially available targeted oncology panel
Tang et al. P087 TNM Staging Inversely Correlates with Age in ALK-positive Lung Cancer
Petersen Activity-by-Contact Model to Predict Enhancer-Gene Connections: A Tool to Increase our Understanding of Cancer
CN114672562A (zh) 一种针对parp抑制剂耐药性监测的方法、装置、设备及介质
WO2022051618A1 (en) ASSESSMENT AND QUANTIFICATION OF IMPERFECT dsDNA BREAK REPAIR FOR CANCER DIAGNOSIS AND TREATMENT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant