CN112442540A - 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 - Google Patents

微卫星不稳定性检测方法、标志物组合、试剂盒及应用 Download PDF

Info

Publication number
CN112442540A
CN112442540A CN202110106959.3A CN202110106959A CN112442540A CN 112442540 A CN112442540 A CN 112442540A CN 202110106959 A CN202110106959 A CN 202110106959A CN 112442540 A CN112442540 A CN 112442540A
Authority
CN
China
Prior art keywords
sample
microsatellite
unstable
evaluated
allele
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110106959.3A
Other languages
English (en)
Other versions
CN112442540B (zh
Inventor
金鸽
孙晓濛
习朝文
曹建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Rendong Medical Laboratory Co ltd
Original Assignee
Shanghai Rendong Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Rendong Medical Laboratory Co ltd filed Critical Shanghai Rendong Medical Laboratory Co ltd
Priority to CN202110106959.3A priority Critical patent/CN112442540B/zh
Publication of CN112442540A publication Critical patent/CN112442540A/zh
Application granted granted Critical
Publication of CN112442540B publication Critical patent/CN112442540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Primary Health Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一组微卫星位点标志物、含有该微卫星位点标志物组合的试剂盒,以及所述微卫星位点标志物组合和所述试剂盒的用途。本发明还公开了所述微卫星位点标志物组合的筛选方法以及利用该微卫星位点标志物组合对待测样本进行微卫星不稳定性检测的方法。本发明利用二代测序技术筛选出可以明显区分微卫星稳定性状态的微卫星位点标志物组合,并用其评估泛癌实体瘤患者的组织或液体活检DNA样本的微卫星稳定性状态,在保证检测灵敏度和特异性的前提下,扩大了检测范围,实现了对患者疾病状态的动态监控,以及对患者治疗响应状态和预后风险的实时评估。

Description

微卫星不稳定性检测方法、标志物组合、试剂盒及应用
技术领域
本发明涉及基因测序领域,特别是涉及微卫星不稳定性检测。
背景技术
根据2019年《结直肠癌及其他相关实体瘤微卫星不稳定性检测中国专家共识》(以下简称《共识》)的定义:“微卫星(Microsatellite,MS)是指真核细胞基因组中以少数几个核苷酸(多为1-6个)为单位串联重复(重复次数一般为5-50次,少数情况下可达70次)的DNA序列,又称为短串联重复(Short tandem repeats,STR)。”这类DNA序列经常发生核苷酸重复单元的插入或缺失而导致微卫星序列的整体长度变化,从而表现出比其他基因组区域更高的突变率和多态性。在整个人类基因组中,广泛分布着超过3000000个单核苷酸重复微卫星,二、三、四、五核苷酸重复微卫星的数目比之较少。它们大部分出现在不直接参与蛋白质合成的非编码区域,因而较少受到进化选择的影响,可以作为DNA指纹和个体鉴别的遗传标记;而少数存在于基因内含子、侧翼调控区域,甚至是编码区域的微卫星,其变异则可能引起基因表达的变化并引发疾病。微卫星长度的高度可变性,目前普遍认为可能是由于在真核细胞减数分裂复制过程中发生的DNA聚合酶滑移而引起,这种错误通常会被DNA错配修复(DNA mismatch repair,MMR)体系发现并予以校正。但当DNA错配修复功能也发生缺陷(Deficient MMR,dMMR)时(如在一部分肿瘤细胞中),微卫星出现的复制错误得不到纠正并不断累积,使得微卫星序列长度或碱基组成发生改变,即称为发生了微卫星不稳定性(Microsatellite instability,MSI),同时导致基因组呈现高突变表型。
《共识》指出:“MSI根据程度可以被分成3类:微卫星高度不稳定性(MSI-high,MSI-H)、微卫星低度不稳定性(MSI-low,MSI-L)、微卫星稳定(Microsatellite stability,MSS)。” MSI-H在不同实体瘤类型中的发生率存在较大差异,目前已知MSI-H发生率较高的实体瘤包括:子宫内膜癌(20-30%)、胃腺癌(15-20%)、结直肠癌(12-15%)等。另外,在许多遗传性肿瘤综合症中有着极高的微卫星不稳定性发生率,如Lynch综合征(Lynch syndrome,LS)患者中的90%都会表现出MSI-H性状。目前已有多项证据表明,MSI-L与MSS癌症患者的微卫星变异分布与频率大体相似,在对治疗的响应中也倾向于被认为是同一种分子亚型,而MSI-H患者则具有明显不同的响应机制和预后差异。例如,近年来成为抗肿瘤治疗领域热点的免疫检查点抑制剂PD-1/PD-L1和CTLA-4单克隆抗体类药物,就在MSI-H/dMMR患者中有着很好的客观应答率(30-80%),而在MSI-L/MSS患者中则鲜有疗效。因此检测和评估癌症患者的微卫星稳定性状态将有助于对患者人群进行精细分层,进而辅助临床医生选择更精准的治疗方案,具有十分重要的临床意义。
常用的微卫星检测方法包括:直接检测MS位点的多重荧光PCR结合毛细管电泳法、检测MMR蛋白表达的免疫组织化学方法(Immunohistochemistry,IHC)、基于二代测序(Nextgeneration sequencing,NGS)的MSI算法等。
1.多重荧光PCR结合毛细管电泳法被公认为是MSI检测的金标准,目前国内外常用且有权威指南推荐的MS位点检测组合有两种:其一是美国国家癌症研究院(NCI)公布的Bethesda Panel,包括2个单核苷酸重复位点(BAT-25、BAT-26)与3个双核苷酸重复位点(D2S123、D5S346、D17S250),该组合在《中国临床肿瘤学会(CSCO)结直肠癌诊疗指南2019版》等国内临床指南中也有推荐;其二是美国Promega公司生产的5个单核苷酸重复位点(BAT-25、BAT-26、NR-21、NR-24、MONO-27)检测组合。评价标准均为:5个位点全部稳定的判定为MSS,出现1个位点不稳定时为MSI-L,大于等于2个位点不稳定时为MSI-H。
2.IHC可以通过检查肿瘤组织中4种MMR蛋白(MLH1、MSH2、MSH6、PMS2)的表达水平来判定是否存在错配修复功能的缺陷:如果所有四个蛋白均呈阳性表达,则为错配修复功能完整(Proficient mismatch repair,pMMR);任何一个蛋白表达缺失则为dMMR。一般而言,dMMR对应于MSI-H,pMMR对应于MSI-L/MSS。由于IHC方法学的简易性和可行性,根据《遗传性结直肠癌临床诊治和家系管理中国专家共识》(2018)推荐,基于肿瘤组织样本的IHC检测为我国临床MMR/MSI检测的基本推荐。
3.NGS技术结合生物信息学分析手段,可以同时评估大量微卫星序列的插入或缺失状态,具有高通量和高灵敏度的特点。已有报道并有较广泛应用的NGS平台MSI算法包括:MSIsensor、mSINGS、MANTIS、MSI-ColonCore等;每种算法均基于对大量样本的验证结果设定有不同的判定阈值。根据实施测序时所采用平台和具体算法的不同,上述方法对肿瘤细胞百分比大于20%的组织样本MSI状态的判定准确率约为95-99%。欧洲肿瘤内科学会精准医学工作组(ESMO Precision Medicine Working Group)在2018年ESMO年会上将NGS作为MSI的二线检测方法。
虽然上述方法已经能在一定程度上满足一部分患者的检测要求,但其方法学通常需要依赖于肿瘤细胞百分比高于20%的肿瘤组织样本,导致大量肿瘤组织样本取样量不足甚至取样困难的患者无法进行该项检测,使一批潜在的免疫获益人群错失了治疗良机。并且由于组织取样通常是侵入性和局限性的,因此基于组织样本的检测方法通常不容易实现对患者疾病状态的动态监控,也就无法积极开展对患者治疗响应状态和预后风险的实时评估。为了突破此种限制,检测体液样本中包括循环肿瘤细胞(Circulating tumor cells,CTCs)、循环游离DNA(Circulating cell-free DNA,cfDNA)、细胞外囊泡(Extracellularvesicles,EVs)及循环游离RNA(Circulating cell-free RNA, cfRNA)等在内的液体活检(Liquid biopsy)技术应运而生。在MSI检测领域,已有一些国内外研究机构和二代测序服务公司的先行者,对肿瘤患者的体液样本实施二代测序技术和优化的MSI判别算法,能在更低频的突变丰度检测下限时,仍能达到与组织检测同等的检测效果。随着液体活检技术和肿瘤免疫治疗的进一步普及和推广,基于体液cfDNA样本的二代测序数据分析、直接提供可靠的微卫星稳定性评价将在精准筛选免疫获益人群、基于检测结果为患者推荐最合适的治疗方案等应用场景中发挥极大效用。
美国Guardant Health公司推出的Guardant360检测方案基于对90个微卫星位点的数字测序(Digital sequencing)技术,可以对0.1%以上ctDNA含量的血浆cfDNA样本实现准确的MSI检测(灵敏度:87%,特异性:99.5%,准确率:98.4%)。美国Foundation Medicine公司提供的FoundationOne Liquid液体活检服务能对突变等位基因频率(Mutant allelefrequency,MAF)大于2%的cfDNA样本实现灵敏度92%、特异性100%的微卫星不稳定性状态判断。美国Grail公司的US 20190206513A1号专利则通过对微卫星位点的可靠性评分、显著性评分、熵评分和分布散度评分,综合评价泛癌种患者cfDNA样本的微卫星稳定状态。在国内,广州燃石医学检验所有限公司在2019年提交申请并已获授权的CN109182525B号专利,通过对8个微卫星标志物组合的稳定性状态评价,能够对MAF大于0.2%(约对应ctDNA含量高于0.4%)的结直肠癌、胃癌或子宫内膜癌患者的血浆样本实现灵敏度93.8%、特异性100%的MSI检测。但燃石公司的应用多侧重于优选癌种如结直肠癌、胃癌或子宫内膜癌,这在免疫治疗日益普及和普遍的今天还是远远不够的,亟需有更多优质的液体活检MSI检测方法被开发和投入到实践中去,一方面在行业内部增强论证,以促进现有方法的进步和标准操作规程的发展;另一方面能为更广大的癌症患者提供一种非侵入性的,能帮助实现患者分子分型、治疗方案优化、预后风险评估等应用的临床辅助解决方案。
发明内容
本发明要解决的技术问题之一是提供一组微卫星位点标志物,该微卫星位点标志物组合包括表3中所示的91个微卫星位点。
本发明要解决的技术问题之二是提供上述微卫星位点标志物组合的用途,该微卫星位点标志物组合可用于微卫星不稳定性检测,特别是用于组织DNA样本或液体活检DNA样本(包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本)中的微卫星不稳定性检测,并可在微卫星不稳定性检测结果基础上进一步评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
本发明要解决的技术问题之三是提供一种包含有上述微卫星位点标志物组合的试剂盒。
本发明要解决的技术问题之四是提供上述试剂盒的用途,该试剂盒可用于微卫星不稳定性检测,特别是用于组织DNA样本或液体活检DNA样本(包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本)中的微卫星不稳定性检测,并可在微卫星不稳定性检测结果基础上进一步评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
所述泛癌实体瘤包括鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌中的一种或多种。
本发明要解决的技术问题之五是提供一种筛选微卫星位点标志物组合的方法,该方法的步骤包括:
1)估算所需最小的阳性样本量和阴性样本量;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计每个微卫星位点的测序深度;
4)从阴性样本集中筛选出平均测序深度大于20的微卫星位点,从阳性样本集中筛选出平均测序深度大于50的微卫星位点;
5)对步骤4)筛选出的微卫星位点,统计每个等位基因在阳性样本集和阴性样本集中的测序总深度和发生频率,并计算每个等位基因在两个样本集间的频率变化倍数;所述频率变化倍数小于1且在阴性样本集中的发生频率大于1%的等位基因为稳定型等位基因,所述频率变化倍数大于20且在阳性样本集中的发生频率大于1%的等位基因为不稳定型等位基因;所述发生频率同时高于比其核苷酸重复单元的重复次数少一次和多一次的两个等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型;同时在阳性样本集和阴性样本集中被选为相对优势基因型的等位基因为该微卫星位点的绝对优势基因型;
6)预筛选微卫星位点标志物:
61)筛选出至少有一个稳定型等位基因和一个不稳定型等位基因的微卫星位点;
62)筛选出相对测序深度在10%以上的微卫星位点;
63)筛选出在阳性样本集中超过50%以上的样本中均有检出的微卫星位点;
64)筛选出有且只有一个绝对优势基因型的位点;
65)筛选出不稳定型等位基因在阴性样本集中的发生频率小于0.5%的位点;
66)筛选出不稳定型等位基因在阳性样本集中的发生频率大于10%的位点;
7)使用超几何分布检验,对步骤6)预筛选出的微卫星位点分别进行稳定性评价,超几何分布P统计值的计算公式为:
Figure 968040DEST_PATH_IMAGE001
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
对超几何分布的P统计值进行多重检验校正,获得校正后的q统计值,计算该微卫星位点在待评估样本中的稳定性评分MSlocus_Msscore,计算公式为:
Figure 623143DEST_PATH_IMAGE002
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
设定MSlocus_MSscore>3的微卫星位点在待评估样本中的状态为不稳定型;MSlocus_MSscore≤3的微卫星位点在待评估样本中的状态为稳定型;
8)删除在阴性样本集中反复被判定为不稳定型的位点,最终筛选出的多个微卫星位点即为微卫星位点标志物组合。
本发明要解决的技术问题之六是提供一种利用上述微卫星位点标志物组合对待测样本进行微卫星不稳定性检测的方法,该方法检测灵敏度和特异性高,适用癌症范围广。该方法的具体步骤包括:
1)提取待检测患者的组织DNA样本或液体活检DNA样本;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计所述标志物组合中每个微卫星位点的测序深度,以及所有稳定型等位基因的总测序深度和所有不稳定型等位基因的总测序深度;
4)假设该样本属于阴性样本,计算超几何分布的P统计值并进行多重检验校正,并基于校正后的q统计值,计算所述标志物组合中每个微卫星位点在该样本中的稳定性评分MSlocus_Msscore;根据P统计值和MSlocus_MSscore评分判断假设是否成立;所述P统计值和MSlocus_Msscore评分的计算公式同上;
5)统计该样本中各个微卫星位点标志物的测序深度,筛选出测序深度大于200×的可评估微卫星位点;
6)将步骤5)筛选出的所有可评估微卫星位点的MSlocus_MSscore分值累加,作为该样本的微卫星稳定性评分Sample_MSscore;同时计算该样本中不稳定位点计数与可评估位点计数的比例,记为不稳定位点比例Unstable_ratio;若该样本同时满足Unstable_ratio>20%且Sample_MSscore>270分,则判定该样本为微卫星不稳定型;若该样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该样本为微卫星稳定型。
所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本。
本发明通过二代测序技术对癌症患者的血浆循环游离DNA(Circulating cell-free DNA, cfDNA)样本进行642个与癌症发生、发展、用药、预后相关的基因的测序,实现了对基因靶向区域的微卫星位点的准确检测,并通过分析测序数据,筛选出一组可以明显区分微卫星稳定(MSS)和不稳定(MSI-H)状态的微卫星位点标志物。与现有MSI检测技术相比,本发明具有以下优点和有益效果:
1.本发明利用基于液体活检的二代测序技术实现了对泛癌实体瘤患者的微卫星稳定性状态判定,与利用肿瘤组织进行检测的技术相比,可以克服因组织取样量不足甚至无法取样而导致的检测范围局限性。同时,液体活检作为一种相对侵入性较小的采样手段,可以在患者的疾病进程中实现多次采样,从而实现对患者疾病状态的动态监控,有利于对患者治疗响应状态和预后风险的实时评估。
2.本发明通过对279例恶性肿瘤样本(MSI-H_FFPE样本29例,MSS_WBC样本250例)的数据预处理和微卫星不稳定性标志物评估,共识别出91个可以明显区分微卫星稳定性状态的标志物组合。同时建立了微卫星位点水平和患者样本水平的微卫星稳定性评价方法Super-MSI。
3.通过对已有组织Promega金标准检测验证的646例配对血浆cfDNA样本进行Super-MSI算法计算,证明本发明在所涉及恶性肿瘤中的总体检测灵敏度为50%,特异性为100%;并且,当待评价样本在满足ctDNA含量大于1%的最低检测限要求时,本发明的检测灵敏度可以达到87.5%,特异性100%。
4.本发明适用范围广,可适用于鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌等癌症患者的微卫星稳定性状态评价。
附图说明
图1是位于第3号染色体、起始位置坐标为52621586、两端序列分别为ATCAC和AAAGA、重复模式为20个T的微卫星位点的21个等位基因在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序深度分布示意图。
具体实施方式
为对本发明的技术内容、特点与功效有更具体的了解,现结合附图及具体实施例,对本发明的技术方案做进一步详细的说明。
实施例1微卫星位点标志物筛选和血浆cfDNA样本微卫星稳定性评价的Super-MSI算法
一、最小样本量估算
为确保一定的灵敏度和特异性要求,需要先估算方法所需的最小样本量。最小样本量的计算与以下几个因素相关:MSI-H总体发生率、检测所需达到的灵敏度、特异性和统计功效。
由于本发明的Super-MSI算法将适用于泛癌实体瘤的微卫星检测,根据TCGA(TheCancer Genome Atlas Program)公共数据集提供的信息,在来自于39种实体瘤类型的11139例肿瘤患者中,有425例被判定为微卫星不稳定性表型,即:在泛癌实体瘤中,MSI-H发生的概率约为3.82%。综合同类研究的相关证据,本发明采用3-5%为泛癌实体瘤中的MSI-H总体发生率。
本发明的MSI检测需达到的灵敏度、特异性和统计功效分别确定为:灵敏度90%以上,特异性95%以上,统计效能90%。
在保证上述检测性能的前提下,经计算,本发明的Super-MSI算法所需的最小样本量为:阳性样本量12例以上,总样本量243例以上。
本发明在筛选微卫星位点标志物组合阶段所使用的样本集为:29例已经过Promega金标准检测确认为MSI-H的肿瘤组织样本(阳性样本集,以下简称MSI-H_FFPE样本)、250例散发性恶性肿瘤患者的白细胞样本(阴性样本集,以下简称MSS_WBC样本)。
二、测序及数据预处理
对上述279例样本,采用仁东医学检验所的肿瘤个性化诊疗基因检测产品642-genepanel,利用杂交捕获技术,进行靶区域的DNA建库、杂交捕获和测序,获得靶基因全部外显子和部分内含子区域测序的原始数据。
利用BWA MEM算法将DNA测序的原始数据与人类参考基因组序列(hg19版本)进行序列比对,利用Picard-2.0.1算法中的MarkDuplicates功能对比对后的序列进行去重,产生患者肿瘤组织样本的去重后测序文件Tissue.bam和患者白细胞正常对照样本的去重后测序文件WBC.bam。利用GATK 3.7标准流程中的BaseRecalibrator功能对去重后测序文件中部分区域的碱基进行质量分数重校准,生成重校准后测序文件。
以重校准后的测序文件为输入文件,运行牛北方研究室开发的MSIsensor(v0.6)软件,以该软件的中间运算结果(即微卫星位点测序深度统计的中间结果)作为微卫星位点的测序深度,统计每个微卫星位点的测序深度(read counts)。
三、微卫星位点的识别
对于MSS_WBC样本,筛选平均测序深度大于20的微卫星位点,对于MSI-H_FFPE样本,筛选平均测序深度大于50的微卫星位点。共有5500个微卫星位点入选。其中:来自MSS_WBC样本集的总计有2973个微卫星位点,来自MSI-H_FFPE样本集的总计有5484个微卫星位点。
四、筛选微卫星位点标志物
1.微卫星位点的特征基因型定义
(1)微卫星位点的测序深度统计和等位基因频率变化倍数计算
对于每个满足测序深度基本要求的微卫星位点,定义核苷酸重复单元的重复次数不同的基因型为等位基因,统计每个等位基因分别在MSI-H_FFPE样本集和MSS_WBC样本集中测序的深度总和。
将某等位基因在MSI-H_FFPE样本集或MSS_WBC样本集中的测序总深度与该微卫星位点在MSI-H_FFPE样本集或MSS_WBC样本集中的测序总深度的比值定义为该等位基因在MSI-H_FFPE样本集或MSS_WBC样本集的发生频率。
将某等位基因在MSI-H_FFPE样本集的发生频率与该等位基因在MSS_WBC样本集的发生频率的比值定义为该等位基因的频率变化倍数(Fold Change,FC)。
另外,为了保证微卫星位点在所用二代测序检测组合中的覆盖度,定义某个微卫星位点在所有样本中的平均测序深度占所有样本在642个基因中的整体平均测序深度的比值为该微卫星位点的相对测序深度。
(2)微卫星位点的稳定型和不稳定型基因型定义
对于每个满足测序深度基本要求的微卫星位点,定义频率变化倍数小于1且在MSS_WBC样本集中的发生频率大于1%的等位基因为稳定型等位基因(Reference,REF),频率变化倍数大于20且在MSI-H_FFPE样本集中的发生频率大于1%的等位基因为不稳定型等位基因(Alternative,ALT)。
(3)微卫星位点的相对优势基因型和绝对优势基因型定义
对于每个满足测序深度基本要求的微卫星位点,在MSI-H_FFPE阳性样本集和MSS_WBC阴性样本集中,分别根据等位基因发生频率,挑选发生频率同时高于比该等位基因的核苷酸重复单元的重复次数少一次的等位基因的发生频率和比该等位基因的核苷酸重复单元的重复次数多一次的等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型。
将同时在MSI-H_FFPE阳性样本集和MSS_WBC阴性样本集中被选为相对优势基因型的等位基因定义为该微卫星位点的绝对优势基因型。
以位于第3号染色体、起始位置坐标为52621586、两端序列分别为ATCAC和AAAGA、重复模式为20个T的微卫星位点为例,首先统计该位点的每个等位基因(R9~R29,分别对应核苷酸重复单元T的重复次数从9次至29次)在MSI-H_FFPE阳性样本集与MSS_WBC阴性样本集中的测序深度总和,计算每个等位基因在两个样本集间的频率变化倍数。
以核苷酸重复单元T重复20次的等位基因R20为例,该基因型在MSI-H_FFPE阳性集中的发生频率为1086/5447=19.938%,在MSS_WBC阴性集中的发生频率为8633/17249=50.049%,则该等位基因R20的频率变化倍数为19.937%÷50.049%=0.40倍。其他基因型的频率变化倍数计算同理。该微卫星位点的21个等位基因的在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序深度、发生频率和频率变化倍数统计结果参见表1、图1所示。
表1示例微卫星位点各基因型的测序深度和频率变化倍数
Figure 956036DEST_PATH_IMAGE003
Figure 583457DEST_PATH_IMAGE004
根据前述微卫星位点的稳定型和不稳定型基因型定义,由表1的统计结果可知,R9~R15(即核苷酸重复单元T的重复次数为9~15次的等位基因)为ALT基因型;R19~R23(即核苷酸重复单元T的重复次数为19~23的等位基因)为REF基因型。
该微卫星位点的REF和ALT基因型在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序总深度及对应的发生频率统计参见表2所示。
表2示例微卫星位点的REF和ALT基因型的测序深度和发生频率
Figure 216040DEST_PATH_IMAGE005
另外,根据前述微卫星位点的相对优势基因型和绝对优势基因型定义,该示例微卫星位点在MSI-H_FFPE阳性集中的相对优势基因型为T重复13次的R13、T重复16次的R16和T重复20次的R20,而在MSS_WBC阴性集中的相对优势基因型仅有T重复20次的R20一个。因此,T重复20次的R20基因型为该微卫星位点的绝对优势基因型。
2.预筛选微卫星位点标志物
微卫星位点标志物的预筛选步骤如下:
(1)在前述入选的5500个微卫星位点中,筛选出至少有一个REF基因型和一个ALT基因型的微卫星位点,得到1047个微卫星位点;
(2)在上述1047个微卫星位点中,筛选出相对测序深度在10%以上的微卫星位点,得到381个微卫星位点;
(3)在上述381个微卫星位点中,筛选出在MSI-H_FFPE样本集中超过50%以上的样本中均有检出的微卫星位点,得到376个微卫星位点;
(4)在上述376个微卫星位点中,筛选出有且只有一个绝对优势基因型的位点,得到341个微卫星位点;
(5)在上述341个微卫星位点中,筛选出ALT基因型在MSS_WBC样本集中发生频率小于0.5%的位点,得到286个微卫星位点;
(6)在上述286个微卫星位点中,筛选出ALT基因型在MSI-H_FFPE样本集中发生频率大于10%的位点,得到107个微卫星位点。
3.确定微卫星标志物组合
(1)单个微卫星位点的稳定性评价
使用超几何分布检验,对上述预筛选出来的107个微卫星位点分别进行稳定性评价。
超几何分布P统计值的计算公式为:
Figure 233805DEST_PATH_IMAGE001
其中:
N为MSS_WBC阴性样本集在该微卫星位点的总体测序深度;
M为MSS_WBC阴性样本集在ALT区的总体测序深度;
n为待评价样本在该微卫星位点的测序深度;
k为待评价样本在ALT区的测序深度。
由于需要在每个待评估样本中对多个微卫星位点进行统计学评估,因此本发明采用FDR校正法对上述超几何分布的P统计值进行多重检验校正,并基于校正后的q统计值,计算该微卫星位点在待评估样本中稳定性检验的Z统计值,作为该微卫星位点的稳定性评分MSlocus_Msscore。
Figure 578763DEST_PATH_IMAGE006
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名。
根据-log(0.05)=2.996,设定3为判断微卫星位点稳定性的阈值。当MSlocus_MSscore>3时,判定该微卫星位点在待评估样本中的状态为不稳定;当MSlocus_MSscore≤3时,判定该微卫星位点在待评估样本中的状态为稳定型。
(2)筛选微卫星位点标志物
应用上述微卫星位点的稳定性评价方法,统计所有MSS_WBC阴性样本中所有可评价微卫星位点的稳定性状态,删除在MSS_WBC阴性样本集中反复被判定为不稳定型的位点,最终筛选出91个微卫星位点,即为本发明的微卫星位点标志物组合,如表3所示。
表3 微卫星位点标志物组合
Figure 123007DEST_PATH_IMAGE007
Figure 867104DEST_PATH_IMAGE008
Figure 369236DEST_PATH_IMAGE009
Figure 919297DEST_PATH_IMAGE010
Figure 190485DEST_PATH_IMAGE011
Figure 371062DEST_PATH_IMAGE012
前述示例微卫星位点满足前述微卫星位点标志物筛选的全部标准,是本发明91个微卫星位点标志物之一,即表3中编号为MS_90的微卫星位点。
五、待评价血浆cfDNA样本的稳定性评价
1.血浆cfDNA样本的预处理和642个基因组合的二代测序
提取待检测患者的血浆cfDNA样本,并采用杂交捕获的方法对样本中642个基因的靶区域进行DNA建库、杂交捕获和测序,获得642个基因靶向区域测序的原始数据。
2.测序数据预处理
利用BWA MEM算法将DNA测序的原始数据与人类参考基因组序列(hg19版本)进行序列比对,利用Picard-2.0.1算法中的MarkDuplicates功能对比对后的序列进行去重,产生患者血浆cfDNA样本的去重后测序文件cfDNA.bam。利用GATK 3.7标准流程中的BaseRecalibrator功能对去重后测序文件中部分区域的碱基进行质量分数重校准,生成重校准后测序文件。
以重校准后的测序文件为输入文件,运行牛北方研究室开发的MSIsensor(v0.6)软件,以该软件对91个微卫星位点标志物的测序深度统计的中间结果作为相应微卫星位点的测序深度(即待评价血浆cfDNA样本稳定性评估的数据来源)。
3.血浆cfDNA样本中单个微卫星位点的稳定性评价
以编号为MS_90的微卫星位点为例,使用超几何分布检验,对待评估的血浆cfDNA样本在编号MS_90的微卫星位点的稳定性进行评价。
如表4所示,编号MS_90的微卫星位点在待评价血浆cfDNA样本中总计测序深度279×,其中206×分布于REF区,56×分布于ALT区。
表4 编号MS_90的微卫星位点在MSS_WBC阴性样本集和待评估血浆cfDNA样本中的测序深度统计
Figure 422807DEST_PATH_IMAGE013
假设该待评价血浆cfDNA样本属于MSS_WBC阴性样本,根据前述超几何分布的P统计值的计算公式,N=17249,M=21,n=279,k=56,则P统计值为:
Figure 448663DEST_PATH_IMAGE014
采用FDR校正法对上述超几何分布的P统计值进行多重检验校正,得到q统计值,并基于校正后的q统计值,计算该微卫星位点在待评估血浆cfDNA样本中稳定性检验的Z统计值,得到该微卫星位点的稳定性评分MSlocus_Msscore。
MSlocus_MSscore=-log(q)=-log(P×evaluable(P)/rank(P))=194.5965 > 3
通过与MSS_WBC阴性样本集在该微卫星位点的REF和ALT区中测序深度分布的超几何分布检验,并在该待评价样本中进行所有可评估微卫星位点的多重检验矫正,得到待评价血浆cfDNA样本属于MSS_WBC的概率仅有1.80E-85,因此原假设不成立,该血浆cfDNA样本在该MS_90微卫星位点表现为不稳定。
4.待评价血浆cfDNA样本的微卫星稳定性评价
(1)待评价血浆cfDNA样本的微卫星稳定性定义
统计待评价血浆cfDNA样本中91个微卫星位点标志物的测序深度,并仅将91个微卫星位点标志物中测序深度大于200×的纳入评估。
将所有可评估微卫星位点的MSlocus_MSscore分值累加,即为该待评价血浆cfDNA样本的微卫星稳定性评分,该值用Sample_MSscore表示。同时计算该待评价血浆cfDNA样本中不稳定位点计数Nunstable_loci与可评估位点计数Nevaluable_loci的比例,记为不稳定位点比例Unstable_ratio。
Figure 839936DEST_PATH_IMAGE015
Figure 988152DEST_PATH_IMAGE016
当待评价血浆cfDNA样本同时满足Unstable_ratio>20%且Sample_MSscore>270分时,判定该血浆cfDNA样本为微卫星不稳定型;当待评价血浆cfDNA样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该血浆cfDNA样本为微卫星稳定型。
(2)待评价血浆cfDNA样本的微卫星稳定性评价
在待评价血浆cfDNA样本(样本编号:1925743)中,总计有90个微卫星位点标志物的测序深度满足大于200×的要求,是符合Super-MSI分析要求的可评估位点,按照本实施例中对单个微卫星位点的稳定性评价方法,在90个可评估位点中总计有72个微卫星位点在与MSS_WBC阴性集的超几何分布检验中q值小于0.05(即MSlocus_MSscore>3),因此有72个微卫星位点的状态被评估为不稳定。据此得出,待评价血浆cfDNA样本中的不稳定位点比例Unstable_ratio为72/90=80%,所有90个可评估位点的稳定性评分总和Sample_MSscore为948.305分,远高于稳定性评估阈值Unstable_ratio 20%和Sample_MSscore 270分,因此该血浆cfDNA样本为典型的微卫星不稳定型样本。
实施例2 Super-MSI算法的检测性能确认
为了对本发明的Super-MSI算法在多癌种中的检测性能进行评估和验证,本实施例收集了来源于同一患者的组织样本进行金标准Promega检测,对有同一患者组织Promega金标准验证的646例配对血浆cfDNA样本进行基于642个基因组合二代测序数据的Super-MSI微卫星稳定性评价,与金标准结果进行比较,比较两种方法对同一位患者微卫星状态评价的一致性,并评估Super-MSI在所有验证集样本中和在满足ctDNA含量大于1%检测限的样本中的准确性。
评价结果显示,在616例组织金标准Promega检测为MSS的配对血浆cfDNA样本中,全部616例同样被Super-MSI判定为MSS,Super-MSI检测的特异性为100%(616/616);另外,在30例组织金标准Promega检测为MSI-H的配对血浆cfDNA样本中,有15例同样被Super-MSI算法判定为MSI-H,Super-MSI在所有验证集样本中的敏感性为50%(15/30)。
表5统计了参比方法mSINGS(v0.6)、MSIsensor(v0.6)和本发明的Super-MSI算法对30例拟阳性血浆cfDNA样本的检测结果。由于MSIsensor没有推荐的稳定性判定阈值,故仅与参比方法mSINGS进行检测敏感性的比较。如表5所示,参比方法mSINGS仅能将4例拟阳性样本判定为MSI-H(样本编号分别为1929585、1920515、1925567、1922127),敏感性仅有13.33%(4/30),与本发明相比在ctDNA含量低的血浆样本中存在明显的漏检,这与之前的研究证据也是相符的。
另外,在15例被金标准Promega检测为组织阳性、Super-MSI判定为血浆阴性的样本中,有12例样本的ctDNA含量均在1%以下,2例样本的ctDNA含量在检测线附近,仅有1例样本的ctDNA含量水平较高,上述样本在参比方法mSINGS中同样也被判定为MSS。综上所述,Super-MSI在满足ctDNA含量大于1%检测限的验证集样本中,检测敏感性为83.33%(15/18),远高于参比方法mSINGS的22.22%(4/18)。证明本发明的算法在血浆cfDNA样本中极大提升了对微卫星状态判定的灵敏度,在免疫治疗日渐普及的当下有很高的应用价值,有利于帮助肿瘤组织质量不达标、取样难实现的患者进行微卫星稳定性状态的评估,以辅助临床医生做出最适合患者的临床治疗决策。
表5 30例拟阳性血浆cfDNA样本的Super-MSI鉴定结果
Figure 467806DEST_PATH_IMAGE017
Figure 356740DEST_PATH_IMAGE018
上述实施例仅为本发明的较佳实施例,是用来说明本发明的,并非用以限制本发明,因此,凡依本发明申请专利范围所作的均等变化与修饰,均应属于本发明专利涵盖的范围。

Claims (11)

1.微卫星位点标志物组合,其特征在于,包括如下表中所示的91个微卫星位点:
Figure 406857DEST_PATH_IMAGE001
Figure 323997DEST_PATH_IMAGE002
Figure 369314DEST_PATH_IMAGE003
Figure 764523DEST_PATH_IMAGE004
Figure 985420DEST_PATH_IMAGE005
Figure 807882DEST_PATH_IMAGE006
2.权利要求1所述标志物组合的用途,其特征在于,用于微卫星不稳定性检测。
3.试剂盒,其特征在于,所述试剂盒包含有权利要求1所述的标志物组合。
4.权利要求3所述试剂盒的用途,其特征在于,用于微卫星不稳定性检测。
5.根据权利要求2或4所述的用途,其特征在于,用于组织DNA样本或液体活检DNA样本的微卫星不稳定性检测。
6.根据权利要求5所述的用途,其特征在于,所述微卫星不稳定性检测的结果用于评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
7.根据权利要求6所述的用途,其特征在于,所述泛癌实体瘤包括鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌中的一种或多种。
8.微卫星位点标志物组合的筛选方法,其特征在于,步骤包括:
1)估算所需最小的阳性样本量和阴性样本量;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计每个微卫星位点的测序深度;
4)从阴性样本集中筛选出平均测序深度大于20的微卫星位点,从阳性样本集中筛选出平均测序深度大于50的微卫星位点;
5)对步骤4)筛选出的微卫星位点,统计每个等位基因在阳性样本集和阴性样本集中的测序总深度和发生频率,并计算每个等位基因在两个样本集间的频率变化倍数;所述频率变化倍数小于1且在阴性样本集中的发生频率大于1%的等位基因为稳定型等位基因,所述频率变化倍数大于20且在阳性样本集中的发生频率大于1%的等位基因为不稳定型等位基因;所述发生频率同时高于比其核苷酸重复单元的重复次数少一次和多一次的两个等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型;同时在阳性样本集和阴性样本集中被选为相对优势基因型的等位基因为该微卫星位点的绝对优势基因型;
6)预筛选微卫星位点标志物:
61)筛选出至少有一个稳定型等位基因和一个不稳定型等位基因的微卫星位点;
62)筛选出相对测序深度在10%以上的微卫星位点;
63)筛选出在阳性样本集中超过50%以上的样本中均有检出的微卫星位点;
64)筛选出有且只有一个绝对优势基因型的位点;
65)筛选出不稳定型等位基因在阴性样本集中的发生频率小于0.5%的位点;
66)筛选出不稳定型等位基因在阳性样本集中的发生频率大于10%的位点;
7)使用超几何分布检验,对步骤6)预筛选出的微卫星位点分别进行稳定性评价;
超几何分布P统计值的计算公式为:
Figure 74915DEST_PATH_IMAGE007
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
对超几何分布的P统计值进行多重检验校正,获得校正后的q统计值,计算该微卫星位点在待评估样本中的稳定性评分MSlocus_Msscore,计算公式为:
Figure 273816DEST_PATH_IMAGE008
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
若MSlocus_MSscore>3,则该微卫星位点在待评估样本中的状态为不稳定型;若MSlocus_MSscore≤3,则该微卫星位点在待评估样本中的状态为稳定型;
8)删除在阴性样本集中反复被判定为不稳定型的位点,最终筛选出的多个微卫星位点即为微卫星位点标志物组合。
9.利用权利要求1所述标志物组合对待测样本进行微卫星不稳定性检测的方法,其特征在于,步骤包括:
1)提取待检测患者的组织DNA样本或液体活检DNA样本;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计所述标志物组合中每个微卫星位点的测序深度,以及所有稳定型等位基因的总测序深度和所有不稳定型等位基因的总测序深度;
4)假设该样本属于阴性样本,计算超几何分布的P统计值并进行多重检验校正,并基于校正后的q统计值,计算所述标志物组合中每个微卫星位点在该样本中的稳定性评分MSlocus_Msscore;根据P统计值和MSlocus_MSscore评分判断假设是否成立;
Figure 896689DEST_PATH_IMAGE007
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
所述MSlocus_Msscore评分的计算公式为:
Figure 890053DEST_PATH_IMAGE009
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
5)统计该样本中各个微卫星位点标志物的测序深度,筛选出测序深度大于200×的可评估微卫星位点;
6)将步骤5)筛选出的所有可评估微卫星位点的MSlocus_MSscore分值累加,作为该样本的微卫星稳定性评分Sample_MSscore;同时计算该样本中不稳定位点计数与可评估位点计数的比例,记为不稳定位点比例Unstable_ratio;若该样本同时满足Unstable_ratio>20%且Sample_MSscore>270分,则判定该样本为微卫星不稳定型;若该样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该样本为微卫星稳定型。
10.根据权利要求5所述的用途,其特征在于,所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本。
11.根据权利要求9所述的方法,其特征在于,所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本。
CN202110106959.3A 2021-01-27 2021-01-27 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 Active CN112442540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110106959.3A CN112442540B (zh) 2021-01-27 2021-01-27 微卫星不稳定性检测方法、标志物组合、试剂盒及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110106959.3A CN112442540B (zh) 2021-01-27 2021-01-27 微卫星不稳定性检测方法、标志物组合、试剂盒及应用

Publications (2)

Publication Number Publication Date
CN112442540A true CN112442540A (zh) 2021-03-05
CN112442540B CN112442540B (zh) 2021-05-14

Family

ID=74739760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110106959.3A Active CN112442540B (zh) 2021-01-27 2021-01-27 微卫星不稳定性检测方法、标志物组合、试剂盒及应用

Country Status (1)

Country Link
CN (1) CN112442540B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151476A (zh) * 2021-05-07 2021-07-23 北京泛生子基因科技有限公司 一种基于二代测序数据鉴别微卫星不稳定的位点组合、方法及其应用
CN117198399A (zh) * 2023-09-21 2023-12-08 杭州链康医学检验实验室有限公司 预测msi状态的微卫星位点、系统及试剂盒
CN117877574A (zh) * 2023-12-26 2024-04-12 深圳市海普洛斯生物科技有限公司 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用
WO2024119425A1 (zh) * 2022-12-08 2024-06-13 何中良 侦测生物样本中微卫星不稳定性的检测套组及其检测方法
WO2024140093A1 (zh) * 2022-12-29 2024-07-04 广州万孚生物技术股份有限公司 用于筛选多癌肿相关生物标记物的基因位点组合及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109182525A (zh) * 2018-09-29 2019-01-11 广州燃石医学检验所有限公司 一种微卫星生物标志物组合、检测试剂盒及其用途
CN109207594A (zh) * 2018-09-29 2019-01-15 广州燃石医学检验所有限公司 一种基于二代测序的通过血浆检测微卫星稳定状态和基因组变化的方法
CN109593847A (zh) * 2017-09-29 2019-04-09 傅新晖 检测微卫星nr24位点稳定性的引物对、试剂盒及方法
CN110951878A (zh) * 2019-12-20 2020-04-03 北京优迅医学检验实验室有限公司 与基因组稳定性相关的微卫星位点的筛选方法、筛选装置及应用
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109593847A (zh) * 2017-09-29 2019-04-09 傅新晖 检测微卫星nr24位点稳定性的引物对、试剂盒及方法
CN109182525A (zh) * 2018-09-29 2019-01-11 广州燃石医学检验所有限公司 一种微卫星生物标志物组合、检测试剂盒及其用途
CN109207594A (zh) * 2018-09-29 2019-01-15 广州燃石医学检验所有限公司 一种基于二代测序的通过血浆检测微卫星稳定状态和基因组变化的方法
CN110951878A (zh) * 2019-12-20 2020-04-03 北京优迅医学检验实验室有限公司 与基因组稳定性相关的微卫星位点的筛选方法、筛选装置及应用
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ISIDRO CORTES-CIRIANO等: "A molecular portrait of microsatellite instability across multiple cancers", 《NATURE COMMUNICATIONS》 *
LIZHEN ZHU等: "A Novel and Reliable Method to Detect Microsatellite Instability in Colorectal Cancer by Next-Generation Sequencing", 《THE JOURNAL OF MOLECULAR DIAGNOSTICS》 *
赵丹等: "单肿瘤组织微卫星不稳定探测方法", 《计算机系统应用》 *
陈玮等: "肿瘤微卫星不稳定检测方法综述", 《计算机系统应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151476A (zh) * 2021-05-07 2021-07-23 北京泛生子基因科技有限公司 一种基于二代测序数据鉴别微卫星不稳定的位点组合、方法及其应用
WO2024119425A1 (zh) * 2022-12-08 2024-06-13 何中良 侦测生物样本中微卫星不稳定性的检测套组及其检测方法
WO2024140093A1 (zh) * 2022-12-29 2024-07-04 广州万孚生物技术股份有限公司 用于筛选多癌肿相关生物标记物的基因位点组合及其应用
CN117198399A (zh) * 2023-09-21 2023-12-08 杭州链康医学检验实验室有限公司 预测msi状态的微卫星位点、系统及试剂盒
CN117198399B (zh) * 2023-09-21 2024-07-19 杭州链康医学检验实验室有限公司 预测msi状态的微卫星位点、系统及试剂盒
CN117877574A (zh) * 2023-12-26 2024-04-12 深圳市海普洛斯生物科技有限公司 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用

Also Published As

Publication number Publication date
CN112442540B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN112442540B (zh) 微卫星不稳定性检测方法、标志物组合、试剂盒及应用
US12002544B2 (en) Determining progress of chromosomal aberrations over time
JP7022758B2 (ja) マイクロサテライト座の安定性およびゲノム変化を同時に検出する次世代シークエンシングに基づく方法
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
CN113284554B (zh) 一种筛查结直肠癌术后微小残留病灶及预测复发风险的循环肿瘤dna检测系统及应用
CN107475375A (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
AU2020201081B2 (en) Detection of genetic or molecular aberrations associated with cancer
CN110656168B (zh) 一种copd早期诊断标志物及其应用
CN108342483B (zh) 一组用于非超突变型结直肠癌分子分型的基因及其应用
CN110564851A (zh) 一组用于非超突变型直肠癌分子分型的基因及其应用
CN115725589A (zh) 一种胃神经内分泌癌化疗疗效评估标志物及其应用
KR102723107B1 (ko) 암과 연관된 유전적 또는 분자적 이상들의 검출
EP3887549A1 (en) Molecular signature
CN114634982A (zh) 一种检测多核苷酸变异的方法
CN117877574A (zh) 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Methods, biomarker combinations, reagent kits, and applications for detecting microsatellite instability

Granted publication date: 20210514

Pledgee: Industrial Commercial Bank of China Ltd. Shanghai Zhangjiang science and Technology Branch

Pledgor: SHANGHAI RENDONG MEDICAL LABORATORY CO.,LTD.

Registration number: Y2024980017952