CN111785324A - 一种微卫星不稳定分析方法及装置 - Google Patents

一种微卫星不稳定分析方法及装置 Download PDF

Info

Publication number
CN111785324A
CN111785324A CN202010632301.1A CN202010632301A CN111785324A CN 111785324 A CN111785324 A CN 111785324A CN 202010632301 A CN202010632301 A CN 202010632301A CN 111785324 A CN111785324 A CN 111785324A
Authority
CN
China
Prior art keywords
microsatellite
sample
value
locus
unstable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010632301.1A
Other languages
English (en)
Other versions
CN111785324B (zh
Inventor
周衍庆
陈实富
王周阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haplox Biotechnology Shenzhen Co ltd
Original Assignee
Haplox Biotechnology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haplox Biotechnology Shenzhen Co ltd filed Critical Haplox Biotechnology Shenzhen Co ltd
Priority to CN202010632301.1A priority Critical patent/CN111785324B/zh
Publication of CN111785324A publication Critical patent/CN111785324A/zh
Application granted granted Critical
Publication of CN111785324B publication Critical patent/CN111785324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种微卫星不稳定分析方法及装置,该方法包括;数据获取步骤,微卫星位点初次筛选步骤,样本训练步骤,微卫星位点再次筛选步骤,微卫星位点三次筛选步骤,微卫星稳定判断步骤。本发明能够基于现有的NGS检测数据分析结果挑选微卫星位点,直接分析样本的MSI状态,使用多个微卫星位点来分析MSI的状态,克服了PCR方法检测连续性差、容易误判的缺陷。

Description

一种微卫星不稳定分析方法及装置
技术领域
本发明涉及基因检测领域,尤其涉及一种微卫星不稳定分析方法及装置。
背景技术
微卫星(Microsatellite)是遍布于人类基因组中的短串联重复序列,有单核苷酸、双核苷酸或多核苷酸的重复,重复次数10-50次甚至更多。与正常细胞相比,肿瘤细胞内的微卫星由于重复单位的插入或缺失而导致微卫星长度的改变,就叫做微卫星不稳定性(Microsatellite Instability,MSI)。大量研究表明,MSI是由错配修复(MMR)基因发生缺陷引起的,与肿瘤的发生密切相关。据文献报道,大约15%的结直肠癌中存在MSI-H(微卫星高度不稳定)现象,与MSS(微卫星稳定)特征的结直肠癌相比,其发病机制、预后和对药物的敏感性均不同。在非结直肠癌的实体瘤中,也存在着不同比例的MSI-H现象,MSI状态不同的实体瘤在对Keytruda响应率方面存在显著性差异,MSI-H不适用单独的5-FU化疗。临床上已将MSI作为结直肠癌及其他实体瘤预后和制定辅助治疗方案的重要分子标志物,并应用于协助林奇综合征筛查。
目前多重荧光PCR-毛细管电泳法检测MSI状态是国际公认的金标准,NCCN、ASCO等国际知名机构联合推荐。同时提取同一患者的正常组织和肿瘤样本DNA,采用多重荧光PCR的方法对检测位点进行扩增,再通过毛细管电泳对扩增产物进行检测,并利用专业软件对两种组织来源检测结果进行对比分析,能准确的给患者MSI状态进行分型。目前常见的PCR方法只检测5个MSI位点,当2个以上位点发生不稳定,则判定为MSI-H,一个位点不稳定判定为MSI-L,否则判断为MSS。但是现有的方法中,由于检测位点较少,判定值的连续性差,很容易发生MSS和MSI-L以及MSI-H和MSI-L之间的误判。
随着精准医学的兴起,肿瘤患者在确诊以及用药指导时,常需要检测相应的基因突变等标志物。随着高通量测序技术(High-Throughput Sequencing,也称Next-Generation Sequencing,NGS)的崛起,在肿瘤精准治疗相关领域的应用也趋近成熟,以其能够一次进行多个基因位点的检测,能够同时评估肿瘤相关突变负荷,以及通量高等特点,应用越来越广泛。在患者同时需要评估基因突变肿瘤突变负荷以及MSI状态时,在NGS检测之外,再去收集临床样本进行PCR检测会对样本量有较高的要求,同时成本相对也较高,实验步骤也相应增多。
发明内容
本发明主要解决现有技术在检测微卫星不稳定时存在的需要重新收集临床样本、成本高、实验步骤多等问题。
根据第一方面,一种实施例中提供一种微卫星不稳定分析方法,包括:
数据获取步骤,分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练步骤,选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选步骤,计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选步骤,在微卫星稳定的肿瘤样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断步骤,获取同一个体来源的待测样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
该方法相对于其他NGS方法,在探针设计中不需要对特定MSI位点设计探针,普适性强,仅利用检测范围内已经覆盖的探针。检测范围越大,MSI位点越多,检测准确度更高。
根据第二方面,一种实施例中提供一种微卫星不稳定分析装置,包括:
数据获取装置,用于分别获取同一个体来源的肿瘤样本、正常对照样本的测序数据,筛选微卫星数据获取模块,用于分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,用于从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练模块,用于选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选模块,用于计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选模块,用于在微卫星稳定的肿瘤样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断模块,用于获取来源于同一受试者的待测样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
根据第三方面,一种实施例中提供本发明提供一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
本发明能够基于现有的NGS检测数据分析结果挑选微卫星位点,直接分析样本的MSI状态。同时,本发明使用多个微卫星位点来分析MSI的状态,克服了PCR方法检测连续性差、容易误判的缺陷。该方法具有高灵敏度、高特异性、简易方便、无需多余的实验步骤等特点。与现有的基于NGS的MSI检测方法相比,该方法无需特意设计微卫星位点的捕获探针,灵敏度和特异性有显著提高,对比MSIsensor,本发明的分析准确度更高。
附图说明
图1为本发明实施例的流程图;
图2为实施例1的方法与金标准方法的结果比对ROC曲线图。
图3为NGS MSI分析方法MSIsensor与与金标准方法的结果比对ROC曲线图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
由于NGS检测有覆盖范围广的特点,尤其是在大Panel捕获测序、全外显子测序、全基因组测序等检测中,都会覆盖几百到几百万和微卫星位点,使得直接使用NGS的结果数据分析MSI的状态成为可能。
本发明提供一种新方法,能够基于现有的NGS检测数据分析结果挑选微卫星位点,直接分析样本的MSI状态。同时,本发明使用多个微卫星位点来分析MSI的状态,解决了PCR方法检测连续性差、容易误判的特点。该方法具有高灵敏度、高特异性、简易方便、无需多余的实验步骤等特点。与现有的基于NGS的MSI检测方法相比,该方法无需特意设计微卫星位点的捕获探针,灵敏度和特异性有显著提高。
术语解释
MS:微卫星(Microsatellite)是遍布于人类基因组中的短串联重复序列,有单核苷酸、双核苷酸或多核苷酸的重复,重复次数10-50次甚至更多。
MSI:即microsatellite instability,微卫星不稳定性。
MSI-H:微卫星高度不稳定。
MSS:微卫星稳定。
MSI-L:微卫星低度不稳定。
Panel:指一堆检测基因和位点的集合。
Bam:NGS测序数据与参考基因组比对后的文件格式,存储每一条read比对的信息。
PCR:聚合酶链式反应,是一种用于放大扩增特定的DNA片段的分子生物学技术。PCR的过程需要有引物的参与。
NGS:Next-Generation Sequencing,即二代测序或者高通量测序。
Read:即读段,由测序产生的一条连续的DNA序列,由A、T、C、G四个不同的碱基组成,比如ATCCGTAGCTCACGGACG。二代测序中的双端测序模式下,一条DNA的前后都会测序,所得到两条read互为配对read。
EMD:推土机距离,即Earth Mover’s Distance,简写为EMD。如果把概率分布形象化地看作为一堆土,该距离表示从概率分布P1挪动成概率分布P2所需要做的功为多少。该指标可以用来量化两个概率分布之间的差异。
FDR(False discovery rate):衡量错误发现率的指标,是指所有检验中假阳性的概率。
Cut-off:即临界值或阳性判断值,是判断检测结果阴阳性的标准。
第一方面,在一些实施方案中,本发明提供一种微卫星不稳定分析方法,包括:
数据获取步骤,分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练步骤,选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选步骤,计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选步骤,在微卫星稳定的肿瘤样本中,根据所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断步骤,获取同一受试者的待测肿瘤样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
在一些实施方案中,数据获取步骤中肿瘤样本、正常对照样本的测序数据,微卫星稳定判断步骤的待测样本、正常对照样本的测序数据均可以通过现有的测序方法获得,所述测序方法包括但不限于全基因组测序、外显子测序、靶向捕获测序、扩增子测序等等。
在一些实施方案中,微卫星稳定判断步骤,每个微卫星位点的EMD值计算方法与训练样本一致。
在一些实施方案中,微卫星稳定判断步骤,所述待测样本和正常对照样本来源于同一受试者,此处的受试者与微卫星位点初次筛选前数据获取步骤的个体为不同的个体(也即是说,如果是待检测样本,不能与训练样本来源于同一个个体),受试者可以是已经通过临床方法确诊为肿瘤患者的个体,也可以是未确诊的个体。肿瘤样本,一般是指来源于肿瘤患者的病患部位、组织或体液的样本,例如结直肠癌患者的患癌组织样本。正常对照样本,也可称为对照样本,一般是指来源于同一肿瘤患者的非病患部位、组织或体液的样本,例如,可以为外周血分离的白细胞样本、癌旁正常组织、唾液等等。
在一些实施方案中,本发明适用于所有癌症的检测。优选地,本发明所适用的癌症类型包括但不限于肠癌、肺癌、胃癌、食道癌、肝癌、肾癌、黑色素瘤、脑癌、胰腺癌、泌尿系统肿瘤、白血病、淋巴癌。
在一些实施方案中,本发明适用于循环肿瘤DNA、血液肿瘤MSI检测,也适用于胸水、脑脊液等样本的检测。
在一些实施方案中,本发明适用于癌症相关基因检测中高通量测序数据分析微卫星不稳定,用于临床诊断、预后和临床治疗指导等等。
本发明所针对的样本为离体样品,不是以有生命的人或者动物体为直接实施对象,微卫星不稳定分析结果为中间结果,不是最终的疾病诊断结果,因此,本发明不属于疾病的诊断、治疗方法范畴。
在一些实施方案中,本发明还可用于其他非诊断、非治疗目的,例如,用于科研实验中筛选治疗癌症的现有药物、新药候选物等等。
在一些实施方案中,正常对照样本可以是全血,更优选是外周血或外周血细胞部分。如本领域技术人员将理解的,血液样本可以包含但不限于T细胞、单核细胞、嗜中性粒细胞、红细胞、血小板和微泡(例如外来体和外来体样囊泡)的血液的任何部分或组分。在本披露的上下文中,包含在血液样本中的血细胞涵盖任何有核细胞并且不限于全血的组分。因此,血细胞包含,例如白细胞(WBC)。在一些实施方案中,正常对照样本也可称为正常样本、对照样本。
在一些实施方案中,对各样本的测序方法包括但不限于全基因组测序、全外显子组测序或捕获探针测序等高通量测序方法。在一优选的实施方案中,所有样本的测序数据可以是通过全外显子组测序得到。
在一些实施方案中,肿瘤样本和正常对照样本的基因组二代测序数据一般首先比对到参考基因组上。因此,优选实施方案中,在数据获取步骤获取的是肿瘤样本、正常对照样本的基因组二代测序数据比对到参考基因组的比对文件。
参考基因组,例如可以是物种(例如,人)的参考的标准基因组序列,例如,在一个实施方案中,以hg19作为人类参考基因组的其中一个版本,在另一个实施方案中,以hg38作为人类参考基因组的其中一个版本。
在一些实施方案中,肿瘤样本的测序深度>200×,在另一些实施方案中,肿瘤样本的测序深度>300×,在另一些实施方案中,肿瘤样本的测序深度>400×,在另一些实施方案中,肿瘤样本的测序深度>500×。
在一些实施方案中,正常对照样本的测序深度>50×,在另一些实施方案中,正常对照样本的测序深度>100×,在另一些实施方案中,正常对照样本的测序深度>200×。
在一些实施方案中,初次筛选所述微卫星位点时,所述微卫星位点满足如下条件中的至少一种:
1)该位点的单碱基重复次数≥6次;
2)该位点的2-4个碱基的重复次数≥5次。
此处没有限定使用微卫星位点集,可以根据不同检测范围搜索。
在一些实施方案中,筛选所述候选微卫星位点集S1的方法包括:
根据所述肿瘤样本、正常对照样本的测序数据,计算每个微卫星位点的有效深度和样本平均深度的比值的均值R1,计算每个微卫星位点比对质量值MAPQ<X或者存在多比对现象的读段占该位点总覆盖读段的比例均值R2,去除R1<第二阈值或者R2>第三阈值的微卫星位点,得到所述候选微卫星位点集S1。
每个微卫星位点的有效深度是指去重PCR重复后,该位点覆盖read数。
样本平均深度的比值的均值R1是指多个样本该位点比值的算术平均值。
比对质量值MAPQ是指NGS比对中衡量比对结果准确的质量值,该值越大越好,该值来自于比对软件计算,比对软件包括但不限于BWA、bowtie等等。
在一些实施方案中,所述X为30。
在一些实施方案中,所述第二阈值为33%。
在一些实施方案中,所述第三阈值为5%。
在一些实施方案中,初次筛选得到所述候选微卫星位点集S1后,在参考基因组上,取微卫星位点所在起点位置左边的短序列作为左引物LPrimer,终点位置右边的短序列作为右引物RPrimer。
在一优选的实施方案中,左引物LPrimer、右引物RPrimer的长度≥5bp,可以包括但不限于6bp以上、8bp以上、10bp以上、15bp以上、20bp以上、25bp以上、30bp以上、40bp以上、50bp以上,更优选为5bp。
在一些实施方案中,左引物LPrimer、右引物RPrimer的长度可以相同,也可以不相同,优选为相同。
在一些实施方案中,从所述候选微卫星位点集S1中筛选微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本时,样本稳定性的检测方法可以是现有的方法,包括但不限于多重荧光PCR-毛细管电泳法、免疫组织化学(IHC)染色法等等。
在一些实施方案中,采用多重荧光PCR-毛细管电泳法检测样本的微卫星稳定状态时,将检测结果为PCR MSS(微卫星稳定)的样本作为微卫星稳定样本,将检测结果为PCRMSI-H(高度微卫星不稳定)的样本作为微卫星不稳定样本。训练集不考虑MSI-L样本,NGS检测中PCR MSI-L样本结果为MSS。
在另一些实施方案中,免疫组织化学(IHC)染色法检测样本的微卫星稳定状态时,将检测结果为pMMR(MMR基因正常)的样本作为微卫星稳定样本,将检测结果为dMMR(MMR基因缺失)的样本作为微卫星不稳定样本。
在一些实施方案中,计算所述训练集中每个微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj之前,先进行如下步骤:
从各肿瘤样本的测序数据中提取覆盖微卫星位点Si及其左引物LPrimer、右引物RPrimer的读段,根据比对位置拼接,得到还原的DNA序列SEQ,若肿瘤样本中该微卫星位点的序列SEQ数量小于第四阈值,则不纳入后续统计,跳过插入长度分布计算步骤。
在一些实施方案中,所述第四阈值为30。也即是说,要求微卫星位点DNA分子覆盖为第四阈值以上,在一些实施方案中,可以是要求微卫星位点DNA分子覆盖为30以上。如果SEQ<第四阈值,那么,该位点深度不够,不纳入计算。
在一些实施方案中,计算所述训练集中每个微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj的方法包括:
对拼接得到的序列SEQ,计算左引物LPrimer、右引物RPrimer之间的距离,即为插入长度L,得到归一化之后的插入长度的统计分布,即为微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qi,计算这两个分布之间的推土距离EMD值(Earth MoveDistance),EMD值越大,该位点不稳定概率越大。
在一些实施方案中,所述推土距离EMD值的计算公式如下:
Figure BDA0002566125510000081
P=(p1,wp1),...,(pm,wpm),P有m个长度,wpi为长度的占比;
Q=(q1,wq1),...,(qn,wqn),Q有n个长度,wqj为长度的占比;
矩阵[dij]每一项dij代表pi和qj的长度差距,矩阵[fij]每一项fij代表从pi到qj的移动的数量,找到[fij]的最优解[f* ij],然后计算得到EMD值。
在一些实施方案中,使用匈牙利算法(Hungarian Algorithm),找到[fij]的最优解[f* ij]。
在一些实施方案中,计算所述训练集中每个微卫星位点在微卫星稳定的样本和微卫星不稳定的样本中的EMD值差异显著性P值之前,删除训练集样本中,不满足SEQ≥第四阈值的样本超过第五阈值的微卫星不稳定位点。
在一些实施方案中,所述第五阈值为10%。也即是说,删除在10%以上样本中是低覆盖MSI位点。
在一些实施方案中,使用T检验计算所述训练集中每个微卫星位点在微卫星稳定的样本和微卫星不稳定的样本中EMD值的显著性值,T检验筛选MSI-H,有效鉴别分析位点。在一些实施方案中,使用配对T检验计算所述显著性值。
在一些实施方案中,所述显著性值可以为P值。
在一些实施方案中,所述第一阈值为0.05。
在一些实施方案中,在微卫星稳定样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,对该微卫星位点的EMD值进行降序排序,以第Y%(FDR<Y%)的EMD值作为判断该位点是否不稳定的Cut-off值,将EMD值>所述Cut-off值的微卫星位点判定为微卫星不稳定位点,将EMD值≤所述Cut-off值的微卫星位点判定为微卫星稳定位点。
在一些实施方案中,所述Y为5。
在一些实施方案中,筛选得到稳定的微卫星位点和不稳定的微卫星位点,计算所述训练集中每个样本的不稳定位点百分比,即MSIratio。
在一些实施方案中,所述MSIratio的计算方法包括:统计单个样本的候选微卫星位点集S2中满足SEQ≥第四阈值的不稳定位点百分比。
SEQ为是指去重后,一对read pair通过基因组位置和序列拼接得到的DNA模板序列。
在一些实施方案中,通过调整不稳定位点百分比,获得判断样本微卫星不稳定的最佳Cut-off值。
在一些实施方案中,判断所述待测样本每个微卫星位点的不稳定状态后,计算所述待测样本的不稳定位点百分比,即MSIratio,也可称为总体MSIratio值。
在一些实施方案中,通过调整所述待测样本的不稳定位点百分比,获得判断样本微卫星不稳定最佳的Cut-off值。此处通过训练集得到MSIratio的cut-off值,而非给出固定的cut-off值。
在一些实施方案中,所述肿瘤样本包括肿瘤组织样本、体液样本,优选地,所述体液样本包括但不限于血液、胸水、脑脊液。
在一些实施方案中,所述待测样本包括肿瘤组织样本、体液样本,优选地,所述体液样本包括但不限于血液、胸水、脑脊液。
第二方面,在一些实施方案中,本发明提供一种微卫星不稳定分析装置,包括:
数据获取模块,用于分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,用于从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练模块,用于选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选模块,用于计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选模块,用于在微卫星稳定的肿瘤样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断模块,用于获取来源于同一受试者的待测样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
第三方面,本发明提供一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
本领域技术人员可以理解,上述实施方案中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方案中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方案中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方案中全部或部分功能。
在一些实施方案中,本发明的流程图如图1所示,本发明的基于高通量测序的微卫星不稳定分析方法包括以下步骤:
1.在检测区间范围内,筛选单碱基重复次数超过6次或者2到4个碱基的重复超过5次的MS候选位点,得到候选MS位点集S1。
在一些实施方案中,筛选MS位点集S1的具体方法包括:
以10例正常对照样本的测序数据Bam文件,计算每个MS位点的有效深度和样本平均深度的比值均值R1。计算每个MS位点比对质量值MAPQ<30的read或者存在多比对现象的read占该位点总覆盖read的比例均值R2。去除R1<33%或者R2>5%的MS位点,得到候选MS位点集S1。在参考基因组上,取MS位点所在起点位置左边5bp短序列作为左引物LPrimer,终点位置右边5bp短序列作为右引物RPrimer。参考基因组可以是hg19。
2.使用100例微卫星稳定(PCR MSS或IHC pMMR)和30例微卫星不稳定(PCR MSI-H或IHC dMMR)的肿瘤样本为训练集。
对训练集中每个样本MS位点集S1每个位点Si进行以下操作:
2.1从输入的NGS比对结果文件(通常为BAM格式),提取出覆盖位点Si以及SiLPrimer和Si RPrimer的reads。并将这些reads中配对的read根据比对位置进行拼接,以还原DNA的序列SEQ,若样本中该位点SEQ数量小于30,则该样本中该位点不纳入统计,跳过步骤2.2-2.3。
2.2对每一条以上方式拼接得到的序列SEQ,计算LPrimer和RPrimer两个位置之间的距离,称为插入长度L,得到归一化之后的插入长度的一个统计分布,称为PL,PL的总概率为1。
2.3对于每一个肿瘤样本和正常的配对样本,分别使用以上方法获得该位点的肿瘤样本插入长度分布P,以及正常对照样本插入长度分布Q,计算这两个分布之间的推土距离EMD值,EMD值越大,该位点不稳定概率越大。
EMD计算方法如下:
P=(p1,wp1),...,(pm,wpm)P有m个长度,wpi为长度的占比;
Q=(q1,wq1),...,(qn,wqn)Q有n个长度,wqj为长度的占比;
矩阵[dij]中的每一项dij代表pi和qj的长度差距,矩阵[fij]中的每一项fij代表从pi到qj的移动的数量。
使用匈牙利算法(Hungarian Algorithm),找到[fij]的最优解[f*ij],然后计算得到EMD值:
Figure BDA0002566125510000111
如BAT26 MS位点,在肿瘤样本中插入长度分布P和正常对照样本中插入长度分布Q为:
P=(16,0.0056),(17,0),(18,0.0056),(19,0.0056),(20,0.0281),(21,0.0225),(22,0.1517),(23,0.2640),(25,0.3876),(26,0.0899),(27,0.0225),(28,0.0112),(29,0.0056);
Q=(16,0),(17,0.0015),(18,0.0104),(19,0.0074),(20,0.0357),(21,0.0610),(22,0.1161),(23,0.2560),(25,0.3631),(26,0.1116),(27,0.0312),(28,0.0060),(29,0)。带入上述公式计算EMD值为EMD=0.1279。
3.删除训练集样本中,不满足SEQ≥30的样本超过10%的MSI位点。使用T检验计算每个MS位点在稳定样本和不稳定样本中的EMD值差异显著性P value。保留P value<0.05的MS位点,得到候选微卫星位点集S2。
如BAT25 MS位点,在130个训练集肿瘤样本中,不满足SEQ≥30条件的样本仅有5个,比例为3.8%,小于10%,该位点保留。计算训练集微卫星稳定样本和不稳定样本EMD之间的p value得到p-value=3.747e-13,该值小于0.05,因此BAT25位点保留在S2中。
4.对于候选微卫星位点集S2的位点,在MSS样本中对该位点EMD值进行降序排序,以第5%(FDR<5%)的EMD值作为判断该位点是否不稳定的Cut-off值(即临界值,也称阈值)。大于该值,该位点判定为不稳定,小于或者等于该值,微卫星位点稳定。
例如,对训练集微卫星稳定样本中BAT25位点EMD值进行降序排序,第5%位样本EMD值为0.64,因此BAT25位点EMD值大于0.64为位点不稳定,小于等于0.64为稳定。
5.计算训练集中每个样本的MSIratio(不稳定位点百分比),计算方法为,统计单个样本位点集合S2中满足SEQ≥30的不稳定位点百分比。
6.通过调整MSIratio获得判断样本微卫星不稳定最佳的Cut-off值。
在训练集样本中,通过变化MSIratio值作为样本微卫星不稳定判断cut-off。
例如,当样本MSIratio≥20%,认为样本微卫星不稳定,MSIratio<20%认为样本稳定,此时与已知答案比较,灵敏度为96.6%,特异性为100%,达到一个最佳值。
7.对于一个新的待检测样本中位点集S2,重复步骤2.1到2.3,得到每个位点的EMD值,然后根据步骤4得到的每个位点EMD cut-off值判断位点微卫星不稳定状态,根据步骤5计算得到样本总体MSIratio值。使用步骤6得到的cut-off值判断样本MSI状态。
实施例1
采用599例(泛实体瘤样本,包括肠癌、肺癌、胰腺癌、子宫癌、乳腺癌、卵巢癌、胃癌等30种癌症)已知PCR检测结果的海普洛斯WESplus检测试剂盒(具体为HapOncoTM WESPlus肿瘤全外显子组基因检测试剂盒,深圳市海普洛斯生物科技有限公司)检测样本进行分析,其中MSI-H样本22例,MSS样本577例,本方法与常用NGS MSI分析方法MSIsensor(BeifangNiu,Kai Ye,Qunyuan Zhang,Charles Lu,Mingchao Xie,Michael D.McLellan,MichaelC.Wendl and Li Ding.MSIsensor:microsatellite instability detection usingpaired tu-mor-normal sequence data.Bioinformatics 30,1015–1016(2014))对比,检测灵敏度和特异性都有显著优势。尤其是在样本阴阳性比例接近真实临床样本MSI-H阳性比例(1-10%)情况下,本方法较其他NGS MSI分析方法仍然能够保持较高的灵敏度和特异性,并且有着较高的阳性预测值。
本方法与金标准(Nouri Nojadeh J,Hashemzadeh S,Samadi Kafil H,etal.Evaluation of microsatellite instability in tumor and tumor marginalsamples of sporadic colorectal cancer using mononucleotide markers.EXCLIJ.2018;17:945-951.Published 2018Sep 24.doi:10.17179/excli2018-1455)比对结果如图2所示,AUC=0.97。
表1本方法与金标准方法的检测结果统计表(单位:例)
Figure BDA0002566125510000121
当一个样本不稳定微卫星位点比例MSIratio大于等于20%时,认为该样本不稳定,本方法检测灵敏度和特异性分别为95.45%和99.82%,本方法阳性预测值为95.45%。MSIsensor与金标准(Nouri Nojadeh J,Hashemzadeh S,Samadi Kafil H,etal.Evaluation of microsatellite instability in tumor and tumor marginalsamples of sporadic colorectal cancer using mononucleotide markers.EXCLIJ.2018;17:945-951.Published 2018Sep 24.doi:10.17179/excli2018-1455)对比如图3所示,AUC=0.952。
表2 MSIsensor与金标准方法的检测结果统计表(单位:例)
Figure BDA0002566125510000122
MSIsensor软件分析结果中,当一个样本MSIscore大于等于30%时,认为该样本不稳定,MSIsensor检测灵敏度和特异性分别为86.36%和95.14%,阳性预测值仅约为40.43%。
上述金标准是指多重荧光PCR-毛细管电泳法检测MSI状态。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种微卫星不稳定分析方法,其特征在于,包括:
数据获取步骤,分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练步骤,选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选步骤,计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选步骤,在微卫星稳定的肿瘤样本中,根据所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断步骤,获取来源于同一受试者的待测样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
2.如权利要求1所述的微卫星不稳定分析方法,其特征在于,初次筛选所述微卫星位点时,所述微卫星位点满足如下条件中的至少一种:
1)该位点的单碱基重复次数≥6次;
2)该位点的2-4个碱基的重复次数≥5次;
和/或,微卫星位点再次筛选步骤中,所述第一阈值为0.05。
3.如权利要求1所述的微卫星不稳定分析方法,其特征在于,初次筛选得到所述候选微卫星位点集S1的方法包括:
根据所述正常对照样本的测序数据,计算每个微卫星位点的有效深度和样本平均深度的比值均值R1,计算每个微卫星位点比对质量值MAPQ<X或者存在多比对现象的读段占该位点总覆盖读段的比例均值R2,去除R1<第二阈值或者R2>第三阈值的微卫星位点,得到所述候选微卫星位点集S1。
4.如权利要求3所述的微卫星不稳定分析方法,其特征在于,所述X为30;
和/或,所述第二阈值为33%;
和/或,所述第三阈值为5%。
5.如权利要求1所述的微卫星不稳定分析方法,其特征在于,初次筛选得到所述候选微卫星位点集S1后,在参考基因组上,取微卫星位点所在起点位置左边的短序列作为左引物LPrimer,终点位置右边的短序列作为右引物RPrimer,优选地,所述左引物LPrimer、右引物RPrimer的长度≥5bp,更优选为5bp;
和/或,样本训练步骤,选择微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本时,样本微卫星是否稳定的检测方法选自多重荧光PCR-毛细管电泳法、免疫组织化学染色法中的至少一种。
6.如权利要求1所述的微卫星不稳定分析方法,其特征在于,计算所述训练集中每个微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj之前,先进行如下步骤:
从各肿瘤样本的测序数据中提取覆盖微卫星位点Si及其左引物LPrimer、右引物RPrimer的读段,根据比对位置拼接,得到还原的DNA序列SEQ,若样本中该微卫星位点的序列SEQ数量<第四阈值,则不纳入统计,跳过插入长度分布计算步骤,若样本中该微卫星位点的序列SEQ数量≥第四阈值,则计算插入长度分布,优选地,所述第四阈值为30。
7.如权利要求6所述的微卫星不稳定分析方法,其特征在于,计算所述训练集中每个微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj的方法包括:
对拼接得到的序列SEQ,计算左引物LPrimer、右引物RPrimer之间的距离,即为插入长度L,得到归一化之后的插入长度的统计分布,即为微卫星位点Si的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qi,计算这两个分布之间的推土距离EMD值;
和/或,所述推土距离EMD值的计算公式如下:
Figure FDA0002566125500000021
P=(p1,wp1),...,(pm,wpm),P有m个长度,wpi为长度的占比;
Q=(q1,wq1),...,(qn,wqn),Q有n个长度,wqj为长度的占比;
矩阵[dij]中的每一项dij代表pi和qj的长度差距,矩阵[fij]中的每一项fij代表从pi到qj的移动的数量,找到[fij]的最优解[f* ij],然后计算得到EMD值;
和/或,使用匈牙利算法,找到[fij]的最优解[f* ij];
和/或,计算所述训练集中每个微卫星位点在微卫星稳定的样本和微卫星不稳定的样本中的EMD值差异显著性值之前,删除训练集样本中,不满足SEQ≥所述第四阈值的样本超过第五阈值的微卫星不稳定位点;
和/或,所述第五阈值为10%;
和/或,使用T检验计算所述训练集中每个微卫星位点在微卫星稳定的样本和微卫星不稳定的样本中EMD的显著性值;
和/或,所述显著性值为P值;
和/或,在微卫星稳定样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,对该微卫星位点的EMD值进行降序排序,以第Y%的EMD值作为判断该位点是否不稳定的Cut-off值,将EMD值>所述Cut-off值的微卫星位点判定为微卫星不稳定位点,将EMD值≤所述Cut-off值的微卫星位点判定为微卫星稳定位点;
和/或,所述Y为5;
和/或,筛选得到稳定的微卫星位点和不稳定的微卫星位点,计算所述训练集中每个样本的不稳定位点百分比,即MSIratio;
和/或,所述不稳定位点百分比的计算方法包括:统计单个样本的候选微卫星位点集S2中满足SEQ≥第四阈值的不稳定位点百分比;
和/或,通过调整不稳定位点百分比,获得判断样本微卫星是否稳定的最佳Cut-off值;
和/或,所述肿瘤样本包括肿瘤组织样本、体液样本,优选地,所述体液样本包括血液、胸水、脑脊液;
和/或,所述待测样本包括肿瘤组织样本、体液样本,优选地,所述体液样本包括血液、胸水、脑脊液。
8.一种微卫星不稳定分析装置,其特征在于,包括:
数据获取模块,用于分别获取至少一个个体的肿瘤样本、正常对照样本的测序数据;
微卫星位点初次筛选步骤,用于从至少一个所述正常对照样本的测序数据中筛选微卫星位点,得到候选微卫星位点集S1;
样本训练模块,用于选择微卫星稳定的肿瘤样本以及微卫星不稳定的肿瘤样本作为训练集,分别计算所述训练集中每个样本微卫星位点集S1的每个微卫星位点的肿瘤样本插入长度分布Pi、正常对照样本插入长度分布Qj,计算两个分布之间的推土距离EMD值;
微卫星位点再次筛选模块,用于计算所述训练集中每个微卫星位点在微卫星稳定的肿瘤样本和微卫星不稳定的肿瘤样本中的EMD值的显著性值,保留所述显著性值小于第一阈值的微卫星位点Si,得到候选微卫星位点集S2;
微卫星位点三次筛选模块,用于在微卫星稳定的肿瘤样本中,根据对所述候选微卫星位点集S2中微卫星位点的EMD值,设定用于判断微卫星位点的Cut-off值,筛选得到稳定的微卫星位点和不稳定的微卫星位点;
微卫星稳定判断模块,用于获取来源于同一受试者的待测样本、正常对照样本的测序数据,参照所述训练集中每个微卫星位点Si的插入长度分布计算方法,计算每个微卫星位点的EMD值,根据所述Cut-off值判断每个微卫星位点稳定或不稳定。
9.一种装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-7任意一项所述的方法。
CN202010632301.1A 2020-07-02 2020-07-02 一种微卫星不稳定分析方法及装置 Active CN111785324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010632301.1A CN111785324B (zh) 2020-07-02 2020-07-02 一种微卫星不稳定分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010632301.1A CN111785324B (zh) 2020-07-02 2020-07-02 一种微卫星不稳定分析方法及装置

Publications (2)

Publication Number Publication Date
CN111785324A true CN111785324A (zh) 2020-10-16
CN111785324B CN111785324B (zh) 2021-02-02

Family

ID=72758961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010632301.1A Active CN111785324B (zh) 2020-07-02 2020-07-02 一种微卫星不稳定分析方法及装置

Country Status (1)

Country Link
CN (1) CN111785324B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365922A (zh) * 2021-01-13 2021-02-12 臻和(北京)生物科技有限公司 用于检测msi的微卫星位点、其筛选方法及应用
CN112725446A (zh) * 2021-01-13 2021-04-30 杭州瑞普基因科技有限公司 微卫星位点标志物及其应用
CN113488105A (zh) * 2021-09-08 2021-10-08 臻和(北京)生物科技有限公司 基于扩增子二代测序msi检测的微卫星位点、其筛选方法及应用
CN116543835A (zh) * 2023-04-21 2023-08-04 苏州吉因加生物医学工程有限公司 一种检测血浆样本微卫星状态的方法和装置
CN116705157A (zh) * 2022-03-28 2023-09-05 北京吉因加医学检验实验室有限公司 一种基于二代测序检测血浆样本微卫星状态的方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105874082A (zh) * 2013-10-07 2016-08-17 塞昆纳姆股份有限公司 用于非侵入性评估染色体改变的方法和过程
US20170032082A1 (en) * 2015-10-12 2017-02-02 Nantomics, Llc Systems, Compositions, And Methods For Discovery Of MSI And Neoepitopes That Predict Sensitivity To Checkpoint Inhibitors
US20170213008A1 (en) * 2016-01-22 2017-07-27 Grail, Inc. Variant based disease diagnostics and tracking
CN107526944A (zh) * 2017-09-06 2017-12-29 南京世和基因生物技术有限公司 一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质
WO2019074963A1 (en) * 2017-10-09 2019-04-18 Strata Oncology, Inc. CHARACTERIZATION OF THE INSTABILITY OF MICROSATELLITES
WO2019204208A1 (en) * 2018-04-16 2019-10-24 Memorial Sloan Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER VIA cfDNA SCREENING
CN110556164A (zh) * 2019-09-09 2019-12-10 深圳裕策生物科技有限公司 用于目标区域捕获测序检测msi的方法、装置和存储介质
CN110570907A (zh) * 2019-09-04 2019-12-13 北京橡鑫生物科技有限公司 建立检测微卫星不稳定的基线及模型的方法与应用
CN110570904A (zh) * 2019-08-27 2019-12-13 深圳百诺精准医疗科技有限公司 一种肿瘤突变分析方法、系统、终端及可读存储介质
CN110797078A (zh) * 2020-01-06 2020-02-14 北京吉因加科技有限公司 微卫星不稳定位点筛选、分析模型的构建方法及装置
US20200118644A1 (en) * 2018-10-15 2020-04-16 Tempus Labs, Inc. Microsatellite instability determination system and related methods
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105874082A (zh) * 2013-10-07 2016-08-17 塞昆纳姆股份有限公司 用于非侵入性评估染色体改变的方法和过程
US20170032082A1 (en) * 2015-10-12 2017-02-02 Nantomics, Llc Systems, Compositions, And Methods For Discovery Of MSI And Neoepitopes That Predict Sensitivity To Checkpoint Inhibitors
US20170213008A1 (en) * 2016-01-22 2017-07-27 Grail, Inc. Variant based disease diagnostics and tracking
CN107526944A (zh) * 2017-09-06 2017-12-29 南京世和基因生物技术有限公司 一种微卫星不稳定性的测序数据分析方法、装置及计算机可读介质
WO2019074963A1 (en) * 2017-10-09 2019-04-18 Strata Oncology, Inc. CHARACTERIZATION OF THE INSTABILITY OF MICROSATELLITES
WO2019204208A1 (en) * 2018-04-16 2019-10-24 Memorial Sloan Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER VIA cfDNA SCREENING
US20200118644A1 (en) * 2018-10-15 2020-04-16 Tempus Labs, Inc. Microsatellite instability determination system and related methods
CN110570904A (zh) * 2019-08-27 2019-12-13 深圳百诺精准医疗科技有限公司 一种肿瘤突变分析方法、系统、终端及可读存储介质
CN110570907A (zh) * 2019-09-04 2019-12-13 北京橡鑫生物科技有限公司 建立检测微卫星不稳定的基线及模型的方法与应用
CN110556164A (zh) * 2019-09-09 2019-12-10 深圳裕策生物科技有限公司 用于目标区域捕获测序检测msi的方法、装置和存储介质
CN110797078A (zh) * 2020-01-06 2020-02-14 北京吉因加科技有限公司 微卫星不稳定位点筛选、分析模型的构建方法及装置
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JASON WILLIS等: "Validation of Microsatellite Instability Detection Using a Comprehensive Plasma-Based Genotyping Panel", 《2019 AMERICAN ASSOCIATION FOR CANCER RESEARCH》 *
KAI ZHENG等: "A novel NGS‑based microsatellite instability (MSI) status classifier with 9 loci for colorectal cancer patients", 《JOURNAL OF TRANSLATIONAL MEDICINE》 *
赵丹等: "单肿瘤组织微卫星不稳定探测方法", 《计算机系统应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365922A (zh) * 2021-01-13 2021-02-12 臻和(北京)生物科技有限公司 用于检测msi的微卫星位点、其筛选方法及应用
CN112725446A (zh) * 2021-01-13 2021-04-30 杭州瑞普基因科技有限公司 微卫星位点标志物及其应用
CN113488105A (zh) * 2021-09-08 2021-10-08 臻和(北京)生物科技有限公司 基于扩增子二代测序msi检测的微卫星位点、其筛选方法及应用
CN116705157A (zh) * 2022-03-28 2023-09-05 北京吉因加医学检验实验室有限公司 一种基于二代测序检测血浆样本微卫星状态的方法和装置
CN116705157B (zh) * 2022-03-28 2024-01-30 北京吉因加医学检验实验室有限公司 一种基于二代测序检测血浆样本微卫星状态的方法和装置
CN116543835A (zh) * 2023-04-21 2023-08-04 苏州吉因加生物医学工程有限公司 一种检测血浆样本微卫星状态的方法和装置
CN116543835B (zh) * 2023-04-21 2024-02-06 苏州吉因加生物医学工程有限公司 一种检测血浆样本微卫星状态的方法和装置

Also Published As

Publication number Publication date
CN111785324B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN111785324B (zh) 一种微卫星不稳定分析方法及装置
Beltran et al. Circulating tumor DNA profile recognizes transformation to castration-resistant neuroendocrine prostate cancer
Ding et al. Expanding the computational toolbox for mining cancer genomes
KR102521842B1 (ko) 암 검출을 위한 혈장 dna의 돌연변이 분석
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
TWI798718B (zh) Dna混合物中組織之單倍型甲基化模式分析
Kurihara et al. Circulating free DNA as non-invasive diagnostic biomarker for childhood solid tumors
Liu et al. Next generation sequencing-based molecular profiling of lung adenocarcinoma using pleural effusion specimens
US11929148B2 (en) Systems and methods for enriching for cancer-derived fragments using fragment size
JP2021516962A (ja) バリアント検出の改善
US20210065842A1 (en) Systems and methods for determining tumor fraction
Pisapia et al. Next generation sequencing in cytopathology: focus on non-small cell lung cancer
WO2023115662A1 (zh) 一种变体核酸的检测方法
Al-Obaidy et al. EWSR1-PATZ1 fusion renal cell carcinoma: a recurrent gene fusion characterizing thyroid-like follicular renal cell carcinoma
KR20190085667A (ko) 무세포 dna를 포함하는 샘플에서 순환 종양 dna를 검출하는 방법 및 그 용도
WO2019211418A1 (en) Surrogate marker and method for tumor mutation burden measurement
EP3580360A1 (en) Non-invasive test to predict response to therapy in colorectal cancer patients
CN113544288A (zh) 用于预测肝癌复发的dna甲基化标志物及其用途
US20230002831A1 (en) Methods and compositions for analyses of cancer
CN112592976B (zh) 一种检测met基因扩增的方法及装置
Ye et al. Concordance between microsatellite instability and mismatch repair protein expression in colorectal cancer and their clinicopathological characteristics: a retrospective analysis of 502 cases
Li et al. Circulating tumor DNA as liquid biopsy in lung cancer: Biological characteristics and clinical integration
Wilmott et al. Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes
JP7274504B2 (ja) 多様度指数を確立することで腫瘍バリアント多様度を評価することによるがん予後診断の方法
Denninghoff Molecular Pathology in the New Age of Personalized Medicine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Zhou Yanqing

Inventor after: Chen Shifu

Inventor after: Wang Zhouyang

Inventor before: Zhou Yanqing

Inventor before: Chen Shifu

Inventor before: Wang Zhouyang

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant