CN112442540A - 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 - Google Patents
微卫星不稳定性检测方法、标志物组合、试剂盒及应用 Download PDFInfo
- Publication number
- CN112442540A CN112442540A CN202110106959.3A CN202110106959A CN112442540A CN 112442540 A CN112442540 A CN 112442540A CN 202110106959 A CN202110106959 A CN 202110106959A CN 112442540 A CN112442540 A CN 112442540A
- Authority
- CN
- China
- Prior art keywords
- sample
- microsatellite
- unstable
- evaluated
- allele
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 57
- 239000003550 marker Substances 0.000 title claims abstract description 33
- 208000032818 Microsatellite Instability Diseases 0.000 title claims description 35
- 108091092878 Microsatellite Proteins 0.000 claims abstract description 226
- 238000012163 sequencing technique Methods 0.000 claims abstract description 98
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 47
- 238000012216 screening Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 26
- 201000011510 cancer Diseases 0.000 claims abstract description 23
- 108020004414 DNA Proteins 0.000 claims abstract description 22
- 238000011528 liquid biopsy Methods 0.000 claims abstract description 16
- 108700028369 Alleles Proteins 0.000 claims description 64
- 210000000265 leukocyte Anatomy 0.000 claims description 35
- 210000001519 tissue Anatomy 0.000 claims description 24
- 238000011156 evaluation Methods 0.000 claims description 18
- 108090000623 proteins and genes Proteins 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 15
- 239000002773 nucleotide Substances 0.000 claims description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000033607 mismatch repair Effects 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 9
- 206010009944 Colon cancer Diseases 0.000 claims description 8
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 8
- 238000009169 immunotherapy Methods 0.000 claims description 6
- 108091092584 GDNA Proteins 0.000 claims description 5
- 206010017758 gastric cancer Diseases 0.000 claims description 5
- 210000002700 urine Anatomy 0.000 claims description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 3
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 claims description 3
- 206010061306 Nasopharyngeal cancer Diseases 0.000 claims description 3
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 3
- 206010060862 Prostate cancer Diseases 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 201000011216 nasopharynx carcinoma Diseases 0.000 claims description 3
- 238000013517 stratification Methods 0.000 claims description 3
- 210000001635 urinary tract Anatomy 0.000 claims description 3
- 206010044412 transitional cell carcinoma Diseases 0.000 claims 2
- 208000023747 urothelial carcinoma Diseases 0.000 claims 2
- 206010004593 Bile duct cancer Diseases 0.000 claims 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 claims 1
- 208000010667 Carcinoma of liver and intrahepatic biliary tract Diseases 0.000 claims 1
- 206010073069 Hepatic cancer Diseases 0.000 claims 1
- 201000007180 bile duct carcinoma Diseases 0.000 claims 1
- 201000010989 colorectal carcinoma Diseases 0.000 claims 1
- 201000005619 esophageal carcinoma Diseases 0.000 claims 1
- 208000010749 gastric carcinoma Diseases 0.000 claims 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims 1
- 201000002250 liver carcinoma Diseases 0.000 claims 1
- 201000005296 lung carcinoma Diseases 0.000 claims 1
- 201000001514 prostate carcinoma Diseases 0.000 claims 1
- 201000000498 stomach carcinoma Diseases 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 17
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000004393 prognosis Methods 0.000 abstract description 6
- 230000004044 response Effects 0.000 abstract description 6
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 128
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000003364 immunohistochemistry Methods 0.000 description 5
- 238000007430 reference method Methods 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 201000009030 Carcinoma Diseases 0.000 description 4
- 208000005718 Stomach Neoplasms Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 201000011549 stomach cancer Diseases 0.000 description 4
- 206010014733 Endometrial cancer Diseases 0.000 description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- JEOQACOXAOEPLX-WCCKRBBISA-N (2s)-2-amino-5-(diaminomethylideneamino)pentanoic acid;1,3-thiazolidine-4-carboxylic acid Chemical compound OC(=O)C1CSCN1.OC(=O)[C@@H](N)CCCN=C(N)N JEOQACOXAOEPLX-WCCKRBBISA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 2
- 206010051922 Hereditary non-polyposis colorectal cancer syndrome Diseases 0.000 description 2
- 201000005027 Lynch syndrome Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 208000006990 cholangiocarcinoma Diseases 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000013112 stability test Methods 0.000 description 2
- 102220473489 Alpha-1B-glycoprotein_D17S_mutation Human genes 0.000 description 1
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 1
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 229910015837 MSH2 Inorganic materials 0.000 description 1
- 241000258241 Mantis Species 0.000 description 1
- 102000008071 Mismatch Repair Endonuclease PMS2 Human genes 0.000 description 1
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 208000020603 familial colorectal cancer Diseases 0.000 description 1
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000021991 hereditary neoplastic syndrome Diseases 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002558 medical inspection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229940125645 monoclonal antibody drug Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Primary Health Care (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Biomedical Technology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一组微卫星位点标志物、含有该微卫星位点标志物组合的试剂盒,以及所述微卫星位点标志物组合和所述试剂盒的用途。本发明还公开了所述微卫星位点标志物组合的筛选方法以及利用该微卫星位点标志物组合对待测样本进行微卫星不稳定性检测的方法。本发明利用二代测序技术筛选出可以明显区分微卫星稳定性状态的微卫星位点标志物组合,并用其评估泛癌实体瘤患者的组织或液体活检DNA样本的微卫星稳定性状态,在保证检测灵敏度和特异性的前提下,扩大了检测范围,实现了对患者疾病状态的动态监控,以及对患者治疗响应状态和预后风险的实时评估。
Description
技术领域
本发明涉及基因测序领域,特别是涉及微卫星不稳定性检测。
背景技术
根据2019年《结直肠癌及其他相关实体瘤微卫星不稳定性检测中国专家共识》(以下简称《共识》)的定义:“微卫星(Microsatellite,MS)是指真核细胞基因组中以少数几个核苷酸(多为1-6个)为单位串联重复(重复次数一般为5-50次,少数情况下可达70次)的DNA序列,又称为短串联重复(Short tandem repeats,STR)。”这类DNA序列经常发生核苷酸重复单元的插入或缺失而导致微卫星序列的整体长度变化,从而表现出比其他基因组区域更高的突变率和多态性。在整个人类基因组中,广泛分布着超过3000000个单核苷酸重复微卫星,二、三、四、五核苷酸重复微卫星的数目比之较少。它们大部分出现在不直接参与蛋白质合成的非编码区域,因而较少受到进化选择的影响,可以作为DNA指纹和个体鉴别的遗传标记;而少数存在于基因内含子、侧翼调控区域,甚至是编码区域的微卫星,其变异则可能引起基因表达的变化并引发疾病。微卫星长度的高度可变性,目前普遍认为可能是由于在真核细胞减数分裂复制过程中发生的DNA聚合酶滑移而引起,这种错误通常会被DNA错配修复(DNA mismatch repair,MMR)体系发现并予以校正。但当DNA错配修复功能也发生缺陷(Deficient MMR,dMMR)时(如在一部分肿瘤细胞中),微卫星出现的复制错误得不到纠正并不断累积,使得微卫星序列长度或碱基组成发生改变,即称为发生了微卫星不稳定性(Microsatellite instability,MSI),同时导致基因组呈现高突变表型。
《共识》指出:“MSI根据程度可以被分成3类:微卫星高度不稳定性(MSI-high,MSI-H)、微卫星低度不稳定性(MSI-low,MSI-L)、微卫星稳定(Microsatellite stability,MSS)。” MSI-H在不同实体瘤类型中的发生率存在较大差异,目前已知MSI-H发生率较高的实体瘤包括:子宫内膜癌(20-30%)、胃腺癌(15-20%)、结直肠癌(12-15%)等。另外,在许多遗传性肿瘤综合症中有着极高的微卫星不稳定性发生率,如Lynch综合征(Lynch syndrome,LS)患者中的90%都会表现出MSI-H性状。目前已有多项证据表明,MSI-L与MSS癌症患者的微卫星变异分布与频率大体相似,在对治疗的响应中也倾向于被认为是同一种分子亚型,而MSI-H患者则具有明显不同的响应机制和预后差异。例如,近年来成为抗肿瘤治疗领域热点的免疫检查点抑制剂PD-1/PD-L1和CTLA-4单克隆抗体类药物,就在MSI-H/dMMR患者中有着很好的客观应答率(30-80%),而在MSI-L/MSS患者中则鲜有疗效。因此检测和评估癌症患者的微卫星稳定性状态将有助于对患者人群进行精细分层,进而辅助临床医生选择更精准的治疗方案,具有十分重要的临床意义。
常用的微卫星检测方法包括:直接检测MS位点的多重荧光PCR结合毛细管电泳法、检测MMR蛋白表达的免疫组织化学方法(Immunohistochemistry,IHC)、基于二代测序(Nextgeneration sequencing,NGS)的MSI算法等。
1.多重荧光PCR结合毛细管电泳法被公认为是MSI检测的金标准,目前国内外常用且有权威指南推荐的MS位点检测组合有两种:其一是美国国家癌症研究院(NCI)公布的Bethesda Panel,包括2个单核苷酸重复位点(BAT-25、BAT-26)与3个双核苷酸重复位点(D2S123、D5S346、D17S250),该组合在《中国临床肿瘤学会(CSCO)结直肠癌诊疗指南2019版》等国内临床指南中也有推荐;其二是美国Promega公司生产的5个单核苷酸重复位点(BAT-25、BAT-26、NR-21、NR-24、MONO-27)检测组合。评价标准均为:5个位点全部稳定的判定为MSS,出现1个位点不稳定时为MSI-L,大于等于2个位点不稳定时为MSI-H。
2.IHC可以通过检查肿瘤组织中4种MMR蛋白(MLH1、MSH2、MSH6、PMS2)的表达水平来判定是否存在错配修复功能的缺陷:如果所有四个蛋白均呈阳性表达,则为错配修复功能完整(Proficient mismatch repair,pMMR);任何一个蛋白表达缺失则为dMMR。一般而言,dMMR对应于MSI-H,pMMR对应于MSI-L/MSS。由于IHC方法学的简易性和可行性,根据《遗传性结直肠癌临床诊治和家系管理中国专家共识》(2018)推荐,基于肿瘤组织样本的IHC检测为我国临床MMR/MSI检测的基本推荐。
3.NGS技术结合生物信息学分析手段,可以同时评估大量微卫星序列的插入或缺失状态,具有高通量和高灵敏度的特点。已有报道并有较广泛应用的NGS平台MSI算法包括:MSIsensor、mSINGS、MANTIS、MSI-ColonCore等;每种算法均基于对大量样本的验证结果设定有不同的判定阈值。根据实施测序时所采用平台和具体算法的不同,上述方法对肿瘤细胞百分比大于20%的组织样本MSI状态的判定准确率约为95-99%。欧洲肿瘤内科学会精准医学工作组(ESMO Precision Medicine Working Group)在2018年ESMO年会上将NGS作为MSI的二线检测方法。
虽然上述方法已经能在一定程度上满足一部分患者的检测要求,但其方法学通常需要依赖于肿瘤细胞百分比高于20%的肿瘤组织样本,导致大量肿瘤组织样本取样量不足甚至取样困难的患者无法进行该项检测,使一批潜在的免疫获益人群错失了治疗良机。并且由于组织取样通常是侵入性和局限性的,因此基于组织样本的检测方法通常不容易实现对患者疾病状态的动态监控,也就无法积极开展对患者治疗响应状态和预后风险的实时评估。为了突破此种限制,检测体液样本中包括循环肿瘤细胞(Circulating tumor cells,CTCs)、循环游离DNA(Circulating cell-free DNA,cfDNA)、细胞外囊泡(Extracellularvesicles,EVs)及循环游离RNA(Circulating cell-free RNA, cfRNA)等在内的液体活检(Liquid biopsy)技术应运而生。在MSI检测领域,已有一些国内外研究机构和二代测序服务公司的先行者,对肿瘤患者的体液样本实施二代测序技术和优化的MSI判别算法,能在更低频的突变丰度检测下限时,仍能达到与组织检测同等的检测效果。随着液体活检技术和肿瘤免疫治疗的进一步普及和推广,基于体液cfDNA样本的二代测序数据分析、直接提供可靠的微卫星稳定性评价将在精准筛选免疫获益人群、基于检测结果为患者推荐最合适的治疗方案等应用场景中发挥极大效用。
美国Guardant Health公司推出的Guardant360检测方案基于对90个微卫星位点的数字测序(Digital sequencing)技术,可以对0.1%以上ctDNA含量的血浆cfDNA样本实现准确的MSI检测(灵敏度:87%,特异性:99.5%,准确率:98.4%)。美国Foundation Medicine公司提供的FoundationOne Liquid液体活检服务能对突变等位基因频率(Mutant allelefrequency,MAF)大于2%的cfDNA样本实现灵敏度92%、特异性100%的微卫星不稳定性状态判断。美国Grail公司的US 20190206513A1号专利则通过对微卫星位点的可靠性评分、显著性评分、熵评分和分布散度评分,综合评价泛癌种患者cfDNA样本的微卫星稳定状态。在国内,广州燃石医学检验所有限公司在2019年提交申请并已获授权的CN109182525B号专利,通过对8个微卫星标志物组合的稳定性状态评价,能够对MAF大于0.2%(约对应ctDNA含量高于0.4%)的结直肠癌、胃癌或子宫内膜癌患者的血浆样本实现灵敏度93.8%、特异性100%的MSI检测。但燃石公司的应用多侧重于优选癌种如结直肠癌、胃癌或子宫内膜癌,这在免疫治疗日益普及和普遍的今天还是远远不够的,亟需有更多优质的液体活检MSI检测方法被开发和投入到实践中去,一方面在行业内部增强论证,以促进现有方法的进步和标准操作规程的发展;另一方面能为更广大的癌症患者提供一种非侵入性的,能帮助实现患者分子分型、治疗方案优化、预后风险评估等应用的临床辅助解决方案。
发明内容
本发明要解决的技术问题之一是提供一组微卫星位点标志物,该微卫星位点标志物组合包括表3中所示的91个微卫星位点。
本发明要解决的技术问题之二是提供上述微卫星位点标志物组合的用途,该微卫星位点标志物组合可用于微卫星不稳定性检测,特别是用于组织DNA样本或液体活检DNA样本(包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本)中的微卫星不稳定性检测,并可在微卫星不稳定性检测结果基础上进一步评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
本发明要解决的技术问题之三是提供一种包含有上述微卫星位点标志物组合的试剂盒。
本发明要解决的技术问题之四是提供上述试剂盒的用途,该试剂盒可用于微卫星不稳定性检测,特别是用于组织DNA样本或液体活检DNA样本(包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本)中的微卫星不稳定性检测,并可在微卫星不稳定性检测结果基础上进一步评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
所述泛癌实体瘤包括鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌中的一种或多种。
本发明要解决的技术问题之五是提供一种筛选微卫星位点标志物组合的方法,该方法的步骤包括:
1)估算所需最小的阳性样本量和阴性样本量;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计每个微卫星位点的测序深度;
4)从阴性样本集中筛选出平均测序深度大于20的微卫星位点,从阳性样本集中筛选出平均测序深度大于50的微卫星位点;
5)对步骤4)筛选出的微卫星位点,统计每个等位基因在阳性样本集和阴性样本集中的测序总深度和发生频率,并计算每个等位基因在两个样本集间的频率变化倍数;所述频率变化倍数小于1且在阴性样本集中的发生频率大于1%的等位基因为稳定型等位基因,所述频率变化倍数大于20且在阳性样本集中的发生频率大于1%的等位基因为不稳定型等位基因;所述发生频率同时高于比其核苷酸重复单元的重复次数少一次和多一次的两个等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型;同时在阳性样本集和阴性样本集中被选为相对优势基因型的等位基因为该微卫星位点的绝对优势基因型;
6)预筛选微卫星位点标志物:
61)筛选出至少有一个稳定型等位基因和一个不稳定型等位基因的微卫星位点;
62)筛选出相对测序深度在10%以上的微卫星位点;
63)筛选出在阳性样本集中超过50%以上的样本中均有检出的微卫星位点;
64)筛选出有且只有一个绝对优势基因型的位点;
65)筛选出不稳定型等位基因在阴性样本集中的发生频率小于0.5%的位点;
66)筛选出不稳定型等位基因在阳性样本集中的发生频率大于10%的位点;
7)使用超几何分布检验,对步骤6)预筛选出的微卫星位点分别进行稳定性评价,超几何分布P统计值的计算公式为:
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
对超几何分布的P统计值进行多重检验校正,获得校正后的q统计值,计算该微卫星位点在待评估样本中的稳定性评分MSlocus_Msscore,计算公式为:
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
设定MSlocus_MSscore>3的微卫星位点在待评估样本中的状态为不稳定型;MSlocus_MSscore≤3的微卫星位点在待评估样本中的状态为稳定型;
8)删除在阴性样本集中反复被判定为不稳定型的位点,最终筛选出的多个微卫星位点即为微卫星位点标志物组合。
本发明要解决的技术问题之六是提供一种利用上述微卫星位点标志物组合对待测样本进行微卫星不稳定性检测的方法,该方法检测灵敏度和特异性高,适用癌症范围广。该方法的具体步骤包括:
1)提取待检测患者的组织DNA样本或液体活检DNA样本;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计所述标志物组合中每个微卫星位点的测序深度,以及所有稳定型等位基因的总测序深度和所有不稳定型等位基因的总测序深度;
4)假设该样本属于阴性样本,计算超几何分布的P统计值并进行多重检验校正,并基于校正后的q统计值,计算所述标志物组合中每个微卫星位点在该样本中的稳定性评分MSlocus_Msscore;根据P统计值和MSlocus_MSscore评分判断假设是否成立;所述P统计值和MSlocus_Msscore评分的计算公式同上;
5)统计该样本中各个微卫星位点标志物的测序深度,筛选出测序深度大于200×的可评估微卫星位点;
6)将步骤5)筛选出的所有可评估微卫星位点的MSlocus_MSscore分值累加,作为该样本的微卫星稳定性评分Sample_MSscore;同时计算该样本中不稳定位点计数与可评估位点计数的比例,记为不稳定位点比例Unstable_ratio;若该样本同时满足Unstable_ratio>20%且Sample_MSscore>270分,则判定该样本为微卫星不稳定型;若该样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该样本为微卫星稳定型。
所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本等,优选为血浆cfDNA样本。
本发明通过二代测序技术对癌症患者的血浆循环游离DNA(Circulating cell-free DNA, cfDNA)样本进行642个与癌症发生、发展、用药、预后相关的基因的测序,实现了对基因靶向区域的微卫星位点的准确检测,并通过分析测序数据,筛选出一组可以明显区分微卫星稳定(MSS)和不稳定(MSI-H)状态的微卫星位点标志物。与现有MSI检测技术相比,本发明具有以下优点和有益效果:
1.本发明利用基于液体活检的二代测序技术实现了对泛癌实体瘤患者的微卫星稳定性状态判定,与利用肿瘤组织进行检测的技术相比,可以克服因组织取样量不足甚至无法取样而导致的检测范围局限性。同时,液体活检作为一种相对侵入性较小的采样手段,可以在患者的疾病进程中实现多次采样,从而实现对患者疾病状态的动态监控,有利于对患者治疗响应状态和预后风险的实时评估。
2.本发明通过对279例恶性肿瘤样本(MSI-H_FFPE样本29例,MSS_WBC样本250例)的数据预处理和微卫星不稳定性标志物评估,共识别出91个可以明显区分微卫星稳定性状态的标志物组合。同时建立了微卫星位点水平和患者样本水平的微卫星稳定性评价方法Super-MSI。
3.通过对已有组织Promega金标准检测验证的646例配对血浆cfDNA样本进行Super-MSI算法计算,证明本发明在所涉及恶性肿瘤中的总体检测灵敏度为50%,特异性为100%;并且,当待评价样本在满足ctDNA含量大于1%的最低检测限要求时,本发明的检测灵敏度可以达到87.5%,特异性100%。
4.本发明适用范围广,可适用于鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌等癌症患者的微卫星稳定性状态评价。
附图说明
图1是位于第3号染色体、起始位置坐标为52621586、两端序列分别为ATCAC和AAAGA、重复模式为20个T的微卫星位点的21个等位基因在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序深度分布示意图。
具体实施方式
为对本发明的技术内容、特点与功效有更具体的了解,现结合附图及具体实施例,对本发明的技术方案做进一步详细的说明。
实施例1微卫星位点标志物筛选和血浆cfDNA样本微卫星稳定性评价的Super-MSI算法
一、最小样本量估算
为确保一定的灵敏度和特异性要求,需要先估算方法所需的最小样本量。最小样本量的计算与以下几个因素相关:MSI-H总体发生率、检测所需达到的灵敏度、特异性和统计功效。
由于本发明的Super-MSI算法将适用于泛癌实体瘤的微卫星检测,根据TCGA(TheCancer Genome Atlas Program)公共数据集提供的信息,在来自于39种实体瘤类型的11139例肿瘤患者中,有425例被判定为微卫星不稳定性表型,即:在泛癌实体瘤中,MSI-H发生的概率约为3.82%。综合同类研究的相关证据,本发明采用3-5%为泛癌实体瘤中的MSI-H总体发生率。
本发明的MSI检测需达到的灵敏度、特异性和统计功效分别确定为:灵敏度90%以上,特异性95%以上,统计效能90%。
在保证上述检测性能的前提下,经计算,本发明的Super-MSI算法所需的最小样本量为:阳性样本量12例以上,总样本量243例以上。
本发明在筛选微卫星位点标志物组合阶段所使用的样本集为:29例已经过Promega金标准检测确认为MSI-H的肿瘤组织样本(阳性样本集,以下简称MSI-H_FFPE样本)、250例散发性恶性肿瘤患者的白细胞样本(阴性样本集,以下简称MSS_WBC样本)。
二、测序及数据预处理
对上述279例样本,采用仁东医学检验所的肿瘤个性化诊疗基因检测产品642-genepanel,利用杂交捕获技术,进行靶区域的DNA建库、杂交捕获和测序,获得靶基因全部外显子和部分内含子区域测序的原始数据。
利用BWA MEM算法将DNA测序的原始数据与人类参考基因组序列(hg19版本)进行序列比对,利用Picard-2.0.1算法中的MarkDuplicates功能对比对后的序列进行去重,产生患者肿瘤组织样本的去重后测序文件Tissue.bam和患者白细胞正常对照样本的去重后测序文件WBC.bam。利用GATK 3.7标准流程中的BaseRecalibrator功能对去重后测序文件中部分区域的碱基进行质量分数重校准,生成重校准后测序文件。
以重校准后的测序文件为输入文件,运行牛北方研究室开发的MSIsensor(v0.6)软件,以该软件的中间运算结果(即微卫星位点测序深度统计的中间结果)作为微卫星位点的测序深度,统计每个微卫星位点的测序深度(read counts)。
三、微卫星位点的识别
对于MSS_WBC样本,筛选平均测序深度大于20的微卫星位点,对于MSI-H_FFPE样本,筛选平均测序深度大于50的微卫星位点。共有5500个微卫星位点入选。其中:来自MSS_WBC样本集的总计有2973个微卫星位点,来自MSI-H_FFPE样本集的总计有5484个微卫星位点。
四、筛选微卫星位点标志物
1.微卫星位点的特征基因型定义
(1)微卫星位点的测序深度统计和等位基因频率变化倍数计算
对于每个满足测序深度基本要求的微卫星位点,定义核苷酸重复单元的重复次数不同的基因型为等位基因,统计每个等位基因分别在MSI-H_FFPE样本集和MSS_WBC样本集中测序的深度总和。
将某等位基因在MSI-H_FFPE样本集或MSS_WBC样本集中的测序总深度与该微卫星位点在MSI-H_FFPE样本集或MSS_WBC样本集中的测序总深度的比值定义为该等位基因在MSI-H_FFPE样本集或MSS_WBC样本集的发生频率。
将某等位基因在MSI-H_FFPE样本集的发生频率与该等位基因在MSS_WBC样本集的发生频率的比值定义为该等位基因的频率变化倍数(Fold Change,FC)。
另外,为了保证微卫星位点在所用二代测序检测组合中的覆盖度,定义某个微卫星位点在所有样本中的平均测序深度占所有样本在642个基因中的整体平均测序深度的比值为该微卫星位点的相对测序深度。
(2)微卫星位点的稳定型和不稳定型基因型定义
对于每个满足测序深度基本要求的微卫星位点,定义频率变化倍数小于1且在MSS_WBC样本集中的发生频率大于1%的等位基因为稳定型等位基因(Reference,REF),频率变化倍数大于20且在MSI-H_FFPE样本集中的发生频率大于1%的等位基因为不稳定型等位基因(Alternative,ALT)。
(3)微卫星位点的相对优势基因型和绝对优势基因型定义
对于每个满足测序深度基本要求的微卫星位点,在MSI-H_FFPE阳性样本集和MSS_WBC阴性样本集中,分别根据等位基因发生频率,挑选发生频率同时高于比该等位基因的核苷酸重复单元的重复次数少一次的等位基因的发生频率和比该等位基因的核苷酸重复单元的重复次数多一次的等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型。
将同时在MSI-H_FFPE阳性样本集和MSS_WBC阴性样本集中被选为相对优势基因型的等位基因定义为该微卫星位点的绝对优势基因型。
以位于第3号染色体、起始位置坐标为52621586、两端序列分别为ATCAC和AAAGA、重复模式为20个T的微卫星位点为例,首先统计该位点的每个等位基因(R9~R29,分别对应核苷酸重复单元T的重复次数从9次至29次)在MSI-H_FFPE阳性样本集与MSS_WBC阴性样本集中的测序深度总和,计算每个等位基因在两个样本集间的频率变化倍数。
以核苷酸重复单元T重复20次的等位基因R20为例,该基因型在MSI-H_FFPE阳性集中的发生频率为1086/5447=19.938%,在MSS_WBC阴性集中的发生频率为8633/17249=50.049%,则该等位基因R20的频率变化倍数为19.937%÷50.049%=0.40倍。其他基因型的频率变化倍数计算同理。该微卫星位点的21个等位基因的在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序深度、发生频率和频率变化倍数统计结果参见表1、图1所示。
表1示例微卫星位点各基因型的测序深度和频率变化倍数
根据前述微卫星位点的稳定型和不稳定型基因型定义,由表1的统计结果可知,R9~R15(即核苷酸重复单元T的重复次数为9~15次的等位基因)为ALT基因型;R19~R23(即核苷酸重复单元T的重复次数为19~23的等位基因)为REF基因型。
该微卫星位点的REF和ALT基因型在MSI-H_FFPE阳性集和MSS_WBC阴性集中的测序总深度及对应的发生频率统计参见表2所示。
表2示例微卫星位点的REF和ALT基因型的测序深度和发生频率
另外,根据前述微卫星位点的相对优势基因型和绝对优势基因型定义,该示例微卫星位点在MSI-H_FFPE阳性集中的相对优势基因型为T重复13次的R13、T重复16次的R16和T重复20次的R20,而在MSS_WBC阴性集中的相对优势基因型仅有T重复20次的R20一个。因此,T重复20次的R20基因型为该微卫星位点的绝对优势基因型。
2.预筛选微卫星位点标志物
微卫星位点标志物的预筛选步骤如下:
(1)在前述入选的5500个微卫星位点中,筛选出至少有一个REF基因型和一个ALT基因型的微卫星位点,得到1047个微卫星位点;
(2)在上述1047个微卫星位点中,筛选出相对测序深度在10%以上的微卫星位点,得到381个微卫星位点;
(3)在上述381个微卫星位点中,筛选出在MSI-H_FFPE样本集中超过50%以上的样本中均有检出的微卫星位点,得到376个微卫星位点;
(4)在上述376个微卫星位点中,筛选出有且只有一个绝对优势基因型的位点,得到341个微卫星位点;
(5)在上述341个微卫星位点中,筛选出ALT基因型在MSS_WBC样本集中发生频率小于0.5%的位点,得到286个微卫星位点;
(6)在上述286个微卫星位点中,筛选出ALT基因型在MSI-H_FFPE样本集中发生频率大于10%的位点,得到107个微卫星位点。
3.确定微卫星标志物组合
(1)单个微卫星位点的稳定性评价
使用超几何分布检验,对上述预筛选出来的107个微卫星位点分别进行稳定性评价。
超几何分布P统计值的计算公式为:
其中:
N为MSS_WBC阴性样本集在该微卫星位点的总体测序深度;
M为MSS_WBC阴性样本集在ALT区的总体测序深度;
n为待评价样本在该微卫星位点的测序深度;
k为待评价样本在ALT区的测序深度。
由于需要在每个待评估样本中对多个微卫星位点进行统计学评估,因此本发明采用FDR校正法对上述超几何分布的P统计值进行多重检验校正,并基于校正后的q统计值,计算该微卫星位点在待评估样本中稳定性检验的Z统计值,作为该微卫星位点的稳定性评分MSlocus_Msscore。
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名。
根据-log(0.05)=2.996,设定3为判断微卫星位点稳定性的阈值。当MSlocus_MSscore>3时,判定该微卫星位点在待评估样本中的状态为不稳定;当MSlocus_MSscore≤3时,判定该微卫星位点在待评估样本中的状态为稳定型。
(2)筛选微卫星位点标志物
应用上述微卫星位点的稳定性评价方法,统计所有MSS_WBC阴性样本中所有可评价微卫星位点的稳定性状态,删除在MSS_WBC阴性样本集中反复被判定为不稳定型的位点,最终筛选出91个微卫星位点,即为本发明的微卫星位点标志物组合,如表3所示。
表3 微卫星位点标志物组合
前述示例微卫星位点满足前述微卫星位点标志物筛选的全部标准,是本发明91个微卫星位点标志物之一,即表3中编号为MS_90的微卫星位点。
五、待评价血浆cfDNA样本的稳定性评价
1.血浆cfDNA样本的预处理和642个基因组合的二代测序
提取待检测患者的血浆cfDNA样本,并采用杂交捕获的方法对样本中642个基因的靶区域进行DNA建库、杂交捕获和测序,获得642个基因靶向区域测序的原始数据。
2.测序数据预处理
利用BWA MEM算法将DNA测序的原始数据与人类参考基因组序列(hg19版本)进行序列比对,利用Picard-2.0.1算法中的MarkDuplicates功能对比对后的序列进行去重,产生患者血浆cfDNA样本的去重后测序文件cfDNA.bam。利用GATK 3.7标准流程中的BaseRecalibrator功能对去重后测序文件中部分区域的碱基进行质量分数重校准,生成重校准后测序文件。
以重校准后的测序文件为输入文件,运行牛北方研究室开发的MSIsensor(v0.6)软件,以该软件对91个微卫星位点标志物的测序深度统计的中间结果作为相应微卫星位点的测序深度(即待评价血浆cfDNA样本稳定性评估的数据来源)。
3.血浆cfDNA样本中单个微卫星位点的稳定性评价
以编号为MS_90的微卫星位点为例,使用超几何分布检验,对待评估的血浆cfDNA样本在编号MS_90的微卫星位点的稳定性进行评价。
如表4所示,编号MS_90的微卫星位点在待评价血浆cfDNA样本中总计测序深度279×,其中206×分布于REF区,56×分布于ALT区。
表4 编号MS_90的微卫星位点在MSS_WBC阴性样本集和待评估血浆cfDNA样本中的测序深度统计
假设该待评价血浆cfDNA样本属于MSS_WBC阴性样本,根据前述超几何分布的P统计值的计算公式,N=17249,M=21,n=279,k=56,则P统计值为:
采用FDR校正法对上述超几何分布的P统计值进行多重检验校正,得到q统计值,并基于校正后的q统计值,计算该微卫星位点在待评估血浆cfDNA样本中稳定性检验的Z统计值,得到该微卫星位点的稳定性评分MSlocus_Msscore。
MSlocus_MSscore=-log(q)=-log(P×evaluable(P)/rank(P))=194.5965 > 3
通过与MSS_WBC阴性样本集在该微卫星位点的REF和ALT区中测序深度分布的超几何分布检验,并在该待评价样本中进行所有可评估微卫星位点的多重检验矫正,得到待评价血浆cfDNA样本属于MSS_WBC的概率仅有1.80E-85,因此原假设不成立,该血浆cfDNA样本在该MS_90微卫星位点表现为不稳定。
4.待评价血浆cfDNA样本的微卫星稳定性评价
(1)待评价血浆cfDNA样本的微卫星稳定性定义
统计待评价血浆cfDNA样本中91个微卫星位点标志物的测序深度,并仅将91个微卫星位点标志物中测序深度大于200×的纳入评估。
将所有可评估微卫星位点的MSlocus_MSscore分值累加,即为该待评价血浆cfDNA样本的微卫星稳定性评分,该值用Sample_MSscore表示。同时计算该待评价血浆cfDNA样本中不稳定位点计数Nunstable_loci与可评估位点计数Nevaluable_loci的比例,记为不稳定位点比例Unstable_ratio。
当待评价血浆cfDNA样本同时满足Unstable_ratio>20%且Sample_MSscore>270分时,判定该血浆cfDNA样本为微卫星不稳定型;当待评价血浆cfDNA样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该血浆cfDNA样本为微卫星稳定型。
(2)待评价血浆cfDNA样本的微卫星稳定性评价
在待评价血浆cfDNA样本(样本编号:1925743)中,总计有90个微卫星位点标志物的测序深度满足大于200×的要求,是符合Super-MSI分析要求的可评估位点,按照本实施例中对单个微卫星位点的稳定性评价方法,在90个可评估位点中总计有72个微卫星位点在与MSS_WBC阴性集的超几何分布检验中q值小于0.05(即MSlocus_MSscore>3),因此有72个微卫星位点的状态被评估为不稳定。据此得出,待评价血浆cfDNA样本中的不稳定位点比例Unstable_ratio为72/90=80%,所有90个可评估位点的稳定性评分总和Sample_MSscore为948.305分,远高于稳定性评估阈值Unstable_ratio 20%和Sample_MSscore 270分,因此该血浆cfDNA样本为典型的微卫星不稳定型样本。
实施例2 Super-MSI算法的检测性能确认
为了对本发明的Super-MSI算法在多癌种中的检测性能进行评估和验证,本实施例收集了来源于同一患者的组织样本进行金标准Promega检测,对有同一患者组织Promega金标准验证的646例配对血浆cfDNA样本进行基于642个基因组合二代测序数据的Super-MSI微卫星稳定性评价,与金标准结果进行比较,比较两种方法对同一位患者微卫星状态评价的一致性,并评估Super-MSI在所有验证集样本中和在满足ctDNA含量大于1%检测限的样本中的准确性。
评价结果显示,在616例组织金标准Promega检测为MSS的配对血浆cfDNA样本中,全部616例同样被Super-MSI判定为MSS,Super-MSI检测的特异性为100%(616/616);另外,在30例组织金标准Promega检测为MSI-H的配对血浆cfDNA样本中,有15例同样被Super-MSI算法判定为MSI-H,Super-MSI在所有验证集样本中的敏感性为50%(15/30)。
表5统计了参比方法mSINGS(v0.6)、MSIsensor(v0.6)和本发明的Super-MSI算法对30例拟阳性血浆cfDNA样本的检测结果。由于MSIsensor没有推荐的稳定性判定阈值,故仅与参比方法mSINGS进行检测敏感性的比较。如表5所示,参比方法mSINGS仅能将4例拟阳性样本判定为MSI-H(样本编号分别为1929585、1920515、1925567、1922127),敏感性仅有13.33%(4/30),与本发明相比在ctDNA含量低的血浆样本中存在明显的漏检,这与之前的研究证据也是相符的。
另外,在15例被金标准Promega检测为组织阳性、Super-MSI判定为血浆阴性的样本中,有12例样本的ctDNA含量均在1%以下,2例样本的ctDNA含量在检测线附近,仅有1例样本的ctDNA含量水平较高,上述样本在参比方法mSINGS中同样也被判定为MSS。综上所述,Super-MSI在满足ctDNA含量大于1%检测限的验证集样本中,检测敏感性为83.33%(15/18),远高于参比方法mSINGS的22.22%(4/18)。证明本发明的算法在血浆cfDNA样本中极大提升了对微卫星状态判定的灵敏度,在免疫治疗日渐普及的当下有很高的应用价值,有利于帮助肿瘤组织质量不达标、取样难实现的患者进行微卫星稳定性状态的评估,以辅助临床医生做出最适合患者的临床治疗决策。
表5 30例拟阳性血浆cfDNA样本的Super-MSI鉴定结果
上述实施例仅为本发明的较佳实施例,是用来说明本发明的,并非用以限制本发明,因此,凡依本发明申请专利范围所作的均等变化与修饰,均应属于本发明专利涵盖的范围。
Claims (11)
2.权利要求1所述标志物组合的用途,其特征在于,用于微卫星不稳定性检测。
3.试剂盒,其特征在于,所述试剂盒包含有权利要求1所述的标志物组合。
4.权利要求3所述试剂盒的用途,其特征在于,用于微卫星不稳定性检测。
5.根据权利要求2或4所述的用途,其特征在于,用于组织DNA样本或液体活检DNA样本的微卫星不稳定性检测。
6.根据权利要求5所述的用途,其特征在于,所述微卫星不稳定性检测的结果用于评估泛癌实体瘤患者的错配修复状态、免疫治疗疗效及预后分层。
7.根据权利要求6所述的用途,其特征在于,所述泛癌实体瘤包括鼻咽癌、肺癌、胃癌、肝癌、食管癌、结直肠癌、胆管癌、前列腺癌、上尿路尿路上皮癌和膀胱尿路上皮癌中的一种或多种。
8.微卫星位点标志物组合的筛选方法,其特征在于,步骤包括:
1)估算所需最小的阳性样本量和阴性样本量;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计每个微卫星位点的测序深度;
4)从阴性样本集中筛选出平均测序深度大于20的微卫星位点,从阳性样本集中筛选出平均测序深度大于50的微卫星位点;
5)对步骤4)筛选出的微卫星位点,统计每个等位基因在阳性样本集和阴性样本集中的测序总深度和发生频率,并计算每个等位基因在两个样本集间的频率变化倍数;所述频率变化倍数小于1且在阴性样本集中的发生频率大于1%的等位基因为稳定型等位基因,所述频率变化倍数大于20且在阳性样本集中的发生频率大于1%的等位基因为不稳定型等位基因;所述发生频率同时高于比其核苷酸重复单元的重复次数少一次和多一次的两个等位基因的发生频率的等位基因为该微卫星位点在相应样本集中的相对优势基因型;同时在阳性样本集和阴性样本集中被选为相对优势基因型的等位基因为该微卫星位点的绝对优势基因型;
6)预筛选微卫星位点标志物:
61)筛选出至少有一个稳定型等位基因和一个不稳定型等位基因的微卫星位点;
62)筛选出相对测序深度在10%以上的微卫星位点;
63)筛选出在阳性样本集中超过50%以上的样本中均有检出的微卫星位点;
64)筛选出有且只有一个绝对优势基因型的位点;
65)筛选出不稳定型等位基因在阴性样本集中的发生频率小于0.5%的位点;
66)筛选出不稳定型等位基因在阳性样本集中的发生频率大于10%的位点;
7)使用超几何分布检验,对步骤6)预筛选出的微卫星位点分别进行稳定性评价;
超几何分布P统计值的计算公式为:
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
对超几何分布的P统计值进行多重检验校正,获得校正后的q统计值,计算该微卫星位点在待评估样本中的稳定性评分MSlocus_Msscore,计算公式为:
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
若MSlocus_MSscore>3,则该微卫星位点在待评估样本中的状态为不稳定型;若MSlocus_MSscore≤3,则该微卫星位点在待评估样本中的状态为稳定型;
8)删除在阴性样本集中反复被判定为不稳定型的位点,最终筛选出的多个微卫星位点即为微卫星位点标志物组合。
9.利用权利要求1所述标志物组合对待测样本进行微卫星不稳定性检测的方法,其特征在于,步骤包括:
1)提取待检测患者的组织DNA样本或液体活检DNA样本;
2)对样本中与癌症相关的所有基因的靶区域进行二代测序;
3)对步骤2)测序所得原始数据进行序列比对、去重、质量分数重校准,统计所述标志物组合中每个微卫星位点的测序深度,以及所有稳定型等位基因的总测序深度和所有不稳定型等位基因的总测序深度;
4)假设该样本属于阴性样本,计算超几何分布的P统计值并进行多重检验校正,并基于校正后的q统计值,计算所述标志物组合中每个微卫星位点在该样本中的稳定性评分MSlocus_Msscore;根据P统计值和MSlocus_MSscore评分判断假设是否成立;
其中:
N为所有阴性样本在微卫星位点的总体测序深度;
M为所有阴性样本在不稳定型等位基因区的总体测序深度;
n为待评价样本在微卫星位点的测序深度;
k为待评价样本在不稳定型等位基因区的测序深度;
所述MSlocus_Msscore评分的计算公式为:
其中:
evaluable(P)为待评价样本中所有可评价微卫星位点的总个数;
rank(P)为该微卫星位点在待评价样本中所有可评价微卫星位点的P统计值从小到大排序列表中的排名;
5)统计该样本中各个微卫星位点标志物的测序深度,筛选出测序深度大于200×的可评估微卫星位点;
6)将步骤5)筛选出的所有可评估微卫星位点的MSlocus_MSscore分值累加,作为该样本的微卫星稳定性评分Sample_MSscore;同时计算该样本中不稳定位点计数与可评估位点计数的比例,记为不稳定位点比例Unstable_ratio;若该样本同时满足Unstable_ratio>20%且Sample_MSscore>270分,则判定该样本为微卫星不稳定型;若该样本的Unstable_ratio≤20%或Sample_MSscore≤270分,则判定该样本为微卫星稳定型。
10.根据权利要求5所述的用途,其特征在于,所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本。
11.根据权利要求9所述的方法,其特征在于,所述液体活检DNA样本包括血浆cfDNA样本、白细胞gDNA样本或尿液utDNA样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110106959.3A CN112442540B (zh) | 2021-01-27 | 2021-01-27 | 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110106959.3A CN112442540B (zh) | 2021-01-27 | 2021-01-27 | 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112442540A true CN112442540A (zh) | 2021-03-05 |
CN112442540B CN112442540B (zh) | 2021-05-14 |
Family
ID=74739760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110106959.3A Active CN112442540B (zh) | 2021-01-27 | 2021-01-27 | 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112442540B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113151476A (zh) * | 2021-05-07 | 2021-07-23 | 北京泛生子基因科技有限公司 | 一种基于二代测序数据鉴别微卫星不稳定的位点组合、方法及其应用 |
CN117198399A (zh) * | 2023-09-21 | 2023-12-08 | 杭州链康医学检验实验室有限公司 | 预测msi状态的微卫星位点、系统及试剂盒 |
CN117877574A (zh) * | 2023-12-26 | 2024-04-12 | 深圳市海普洛斯生物科技有限公司 | 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用 |
WO2024119425A1 (zh) * | 2022-12-08 | 2024-06-13 | 何中良 | 侦测生物样本中微卫星不稳定性的检测套组及其检测方法 |
WO2024140093A1 (zh) * | 2022-12-29 | 2024-07-04 | 广州万孚生物技术股份有限公司 | 用于筛选多癌肿相关生物标记物的基因位点组合及其应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109182525A (zh) * | 2018-09-29 | 2019-01-11 | 广州燃石医学检验所有限公司 | 一种微卫星生物标志物组合、检测试剂盒及其用途 |
CN109207594A (zh) * | 2018-09-29 | 2019-01-15 | 广州燃石医学检验所有限公司 | 一种基于二代测序的通过血浆检测微卫星稳定状态和基因组变化的方法 |
CN109593847A (zh) * | 2017-09-29 | 2019-04-09 | 傅新晖 | 检测微卫星nr24位点稳定性的引物对、试剂盒及方法 |
CN110951878A (zh) * | 2019-12-20 | 2020-04-03 | 北京优迅医学检验实验室有限公司 | 与基因组稳定性相关的微卫星位点的筛选方法、筛选装置及应用 |
CN111304303A (zh) * | 2020-02-18 | 2020-06-19 | 福建和瑞基因科技有限公司 | 微卫星不稳定的预测方法及其应用 |
-
2021
- 2021-01-27 CN CN202110106959.3A patent/CN112442540B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109593847A (zh) * | 2017-09-29 | 2019-04-09 | 傅新晖 | 检测微卫星nr24位点稳定性的引物对、试剂盒及方法 |
CN109182525A (zh) * | 2018-09-29 | 2019-01-11 | 广州燃石医学检验所有限公司 | 一种微卫星生物标志物组合、检测试剂盒及其用途 |
CN109207594A (zh) * | 2018-09-29 | 2019-01-15 | 广州燃石医学检验所有限公司 | 一种基于二代测序的通过血浆检测微卫星稳定状态和基因组变化的方法 |
CN110951878A (zh) * | 2019-12-20 | 2020-04-03 | 北京优迅医学检验实验室有限公司 | 与基因组稳定性相关的微卫星位点的筛选方法、筛选装置及应用 |
CN111304303A (zh) * | 2020-02-18 | 2020-06-19 | 福建和瑞基因科技有限公司 | 微卫星不稳定的预测方法及其应用 |
Non-Patent Citations (4)
Title |
---|
ISIDRO CORTES-CIRIANO等: "A molecular portrait of microsatellite instability across multiple cancers", 《NATURE COMMUNICATIONS》 * |
LIZHEN ZHU等: "A Novel and Reliable Method to Detect Microsatellite Instability in Colorectal Cancer by Next-Generation Sequencing", 《THE JOURNAL OF MOLECULAR DIAGNOSTICS》 * |
赵丹等: "单肿瘤组织微卫星不稳定探测方法", 《计算机系统应用》 * |
陈玮等: "肿瘤微卫星不稳定检测方法综述", 《计算机系统应用》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113151476A (zh) * | 2021-05-07 | 2021-07-23 | 北京泛生子基因科技有限公司 | 一种基于二代测序数据鉴别微卫星不稳定的位点组合、方法及其应用 |
WO2024119425A1 (zh) * | 2022-12-08 | 2024-06-13 | 何中良 | 侦测生物样本中微卫星不稳定性的检测套组及其检测方法 |
WO2024140093A1 (zh) * | 2022-12-29 | 2024-07-04 | 广州万孚生物技术股份有限公司 | 用于筛选多癌肿相关生物标记物的基因位点组合及其应用 |
CN117198399A (zh) * | 2023-09-21 | 2023-12-08 | 杭州链康医学检验实验室有限公司 | 预测msi状态的微卫星位点、系统及试剂盒 |
CN117198399B (zh) * | 2023-09-21 | 2024-07-19 | 杭州链康医学检验实验室有限公司 | 预测msi状态的微卫星位点、系统及试剂盒 |
CN117877574A (zh) * | 2023-12-26 | 2024-04-12 | 深圳市海普洛斯生物科技有限公司 | 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN112442540B (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112442540B (zh) | 微卫星不稳定性检测方法、标志物组合、试剂盒及应用 | |
US12002544B2 (en) | Determining progress of chromosomal aberrations over time | |
JP7022758B2 (ja) | マイクロサテライト座の安定性およびゲノム変化を同時に検出する次世代シークエンシングに基づく方法 | |
CN112805563A (zh) | 用于评估和/或治疗癌症的无细胞dna | |
CN113284554B (zh) | 一种筛查结直肠癌术后微小残留病灶及预测复发风险的循环肿瘤dna检测系统及应用 | |
CN107475375A (zh) | 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒 | |
AU2020201081B2 (en) | Detection of genetic or molecular aberrations associated with cancer | |
CN110656168B (zh) | 一种copd早期诊断标志物及其应用 | |
CN108342483B (zh) | 一组用于非超突变型结直肠癌分子分型的基因及其应用 | |
CN110564851A (zh) | 一组用于非超突变型直肠癌分子分型的基因及其应用 | |
CN115725589A (zh) | 一种胃神经内分泌癌化疗疗效评估标志物及其应用 | |
KR102723107B1 (ko) | 암과 연관된 유전적 또는 분자적 이상들의 검출 | |
EP3887549A1 (en) | Molecular signature | |
CN114634982A (zh) | 一种检测多核苷酸变异的方法 | |
CN117877574A (zh) | 一种基于单肿瘤样本检测微卫星不稳定性的微卫星位点组合及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Methods, biomarker combinations, reagent kits, and applications for detecting microsatellite instability Granted publication date: 20210514 Pledgee: Industrial Commercial Bank of China Ltd. Shanghai Zhangjiang science and Technology Branch Pledgor: SHANGHAI RENDONG MEDICAL LABORATORY CO.,LTD. Registration number: Y2024980017952 |