CN111826447B - 一种检测肿瘤突变负荷的方法及预测模型 - Google Patents
一种检测肿瘤突变负荷的方法及预测模型 Download PDFInfo
- Publication number
- CN111826447B CN111826447B CN202010991706.4A CN202010991706A CN111826447B CN 111826447 B CN111826447 B CN 111826447B CN 202010991706 A CN202010991706 A CN 202010991706A CN 111826447 B CN111826447 B CN 111826447B
- Authority
- CN
- China
- Prior art keywords
- mutation
- tumor
- data
- sample
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- Public Health (AREA)
- Microbiology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Oncology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Hospice & Palliative Care (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物医学技术领域,特别涉及一种检测肿瘤突变负荷的方法及预测模型;包括以下步骤:S1:对待测的肿瘤组织和血液样品进行DNA提取;S2:针对肿瘤相关基因,构建目标区域靶向捕获测序文库;S3:利用高通量测序平台,获得原始下机数据;S4:通过检出流程得到样本的肿瘤突变负荷。本发明的目的在于提供一种检测肿瘤突变负荷的方法及预测模型,通过该方法和预测模型对基因突变进行检测和计算,可以达到和全外显子测序的TMB检测相等同的结果,以提高肿瘤突变负荷评估的准确性。
Description
技术领域
本发明涉及生物医学技术领域,特别涉及一种检测肿瘤突变负荷的方法及预测模型。
背景技术
近年来,免疫治疗受到医疗界的广泛关注,其已在多种肿瘤治疗中获得显著的临床疗效,被称为第四种癌症治疗方法(除了手术、化疗和放疗之外),并获得美国食品药品监督管理局(FDA)批准和美国国家综合癌症网络(NCCN)指南推荐,成为晚期非小细胞肺癌(NSCLC)一线治疗的选择。肿瘤免疫治疗方法主要是通过激活人体的免疫系统,达到识别、控制和清除肿瘤的疗效,而研究最多的为单克隆抗体类免疫检查点抑制剂如细胞毒性T淋巴细胞相关蛋白4(CTLA-4)单抗、程序性死亡抑制因子蛋白及其配体(PD-1/PD-L1)单抗,至此,国内已有7款PD-1/PD-L1免疫检查点抑制剂上市。
肿瘤免疫治疗作为一线治疗方案之一,生物标志物的选择便显得非常重要。PD-L1、肿瘤突变负荷(TMB)、DNA错配修复缺陷型(dMMR)和微卫星不稳定性(MSI)均是临床和专家共识普遍认可和接受的标志物,其中肿瘤突变负荷(TMB)作为关注度最热的生物标志物,不仅被写入2019年NCCN非小细胞肺癌V1版指南,而且在近期研究中显示数十种癌症类型包括黑色素瘤、肾细胞癌、膀胱癌、头颈癌等在内,TMB水平越高,患者接受免疫检查点抑制剂治疗后的生存率越高(Robert M. Samstein,et al.Tumor mutational load predictssurvival after immunotherapy across multiple cancer types.Nature Genetics.14January 2019).
由于TMB可以有效的预测免疫检查点治疗的疗效和预后,所以TMB检测对于临床免疫治疗已变得越来越重要。目前检测TMB的方法主要为基于二代测序技术(NGS)的全外显子(WES)测序。但由于WES成本较高、操作繁琐等,很难作为检测TMB的常规临床方法。基于NGS的靶向基因套餐(panel)越来越多的被设计用于TMB检测,例如FoundationOne CDx NGS、MSK-IMPACT NGS平台。靶向基因测序不仅可以大大降低测序成本,并且一些研究显示TMB的panel检测与WES具有很好的一致性。
为此,提出一种检测肿瘤突变负荷的方法及预测模型。
发明内容
本发明的目的在于提供一种检测肿瘤突变负荷的方法及预测模型,通过该方法和预测模型对基因突变进行检测和计算,可以达到和全外显子测序的TMB检测相等同的结果,以提高肿瘤突变负荷评估的准确性。
为了实现上述目的,本发明的技术方案如下:
一种检测肿瘤突变负荷的方法,包括以下步骤:
S1:对待测的肿瘤组织和血液样品进行DNA提取;
S2:针对肿瘤相关基因,构建目标区域靶向捕获测序文库;
S3:利用高通量测序平台,获得原始下机数据;
S4:通过检出流程得到样本的肿瘤突变负荷。
具体的,所述肿瘤相关基因中的外显子区域的基因包括:ABL1、ABL2、ACVR1B、AKT1、AKT2、AKT3、ALK、AMER1、APC、AR、ARAF、ARFRP1、ARID1A、ARID1B、ARID2、ASXL1、ATM、ATR、ATRX、AURKA、AURKB、AXIN1、AXL、BAP1、BARD1、BCL2、BCL2L1、BCL2L2、BCL6、BCOR、BCORL1、BLM、BRAF、BRCA1、BRCA2、BRD4、BRIP1、BTG1、BTK、C11orf30、CARD11、CBFB、CBL、CCND1、CCND2、CCND3、CCNE1、CD274、CD79A、CD79B、CDC73、CDH1、CDK12、CDK4、CDK6、CDK8、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHD2、CHD4、CHEK1、CHEK2、CIC、CREBBP、CRKL、CRLF2、CSF1R、CTCF、CTNNA1、CTNNB1、CUL3、CYLD、DAXX、DDR2、DICER1、DNMT3A、DOT1L、EGFR、EP300、EPHA3、EPHA5、EPHA7、EPHB1、ERBB2、ERBB3、ERBB4、ERG、ERRFI1、ESR1、EZH2、FAM46C、FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG、FANCL、FAS、FAT1、FBXW7、FGF10、FGF14、FGF19、FGF23、FGF3、FGF4、FGF6、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT1、FLT3、FLT4、FOXL2、FOXP1、FRS2、FUBP1、GABRA6、GATA1、GATA2、GATA3、GATA4、GATA6、GID4、GLI1、GNA11、GNA13、GNAQ、GNAS、GPR124、GRIN2A、GRM3、GSK3B、H3F3A、HGF、HNF1A、HRAS、HSD3B1、HSP90AA1、IDH1、IDH2、IGF1R、IGF2、IKBKE、IKZF1、IL7R、INHBA、INPP4B、IRF2、IRF4、IRS2、JAK1、JAK2、JAK3、JUN、KAT6A、KDM5A、KDM5C、KDM6A、KDR、KEAP1、KEL、KIT、KLHL6、KMT2A、KMT2C、KMT2D、KRAS、LMO1、LRP1B、LYN、LZTR1、MAGI2、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MCL1、MDM2、MDM4、MED12、MEF2B、MEN1、MET、MITF、MLH1、MPL、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYC、MYCL、MYCN、MYD88、NF1、NF2、NFE2L2、NFKBIA、NKX2-1、NOTCH1、NOTCH2、NOTCH3、NPM1、NRAS、NSD1、NTRK1、NTRK2、NTRK3、NUP93、PAK3、PALB2、PARK2、PAX5、PBRM1、PDCD1LG2、PDGFRA、PDGFRB、PDK1、PIK3C2B、PIK3CA、PIK3CB、PIK3CG、PIK3R1、PIK3R2、PLCG2、PMS2、POLD1、POLE、PPP2R1A、PRDM1、PREX2、PRKAR1A、PRKCI、PRKDC、PRSS8、PTCH1、PTEN、PTPN11、QKI、RAC1、RAD50、RAD51、RAF1、RANBP2、RARA、RB1、RBM10、RET、RICTOR、RNF43、ROS1、RPTOR、RUNX1、RUNX1T1、SDHA、SDHB、SDHC、SDHD、SETD2、SF3B1、SLIT2、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SNCAIP、SOCS1、SOX10、SOX2、SOX9、SPEN、SPOP、SPTA1、SRC、STAG2、STAT3、STAT4、STK11、SUFU、SYK、TAF1、TBX3、TET2、TGFBR2、TNFAIP3、TNFRSF14、TOP1、TOP2A、TP53、TSC1、TSC2、TSHR、U2AF1、VEGFA、VHL、WISP3、WT1、XPO1、ZBTB2、ZNF217、ZNF703。
具体的,所述检出流程具体包括:
(a)测序数据拆分,用于对高通量测序平台Illumina的下机数据进行拆分,获得原始测序数据;
(b)低质量数据过滤及质控,用于对高通量测序的原始数据进行过滤、质控和处理;
(c)数据对比,将数据比对到参考基因组上;
(d)变异检测,获得肿瘤样本的相关突变信息;
(e)注释,用于对捕获区域内突变位点进行相关疾病信息进行注释;
(f)成对样本质控,检验肿瘤组织与对照是否来自于同一样本;
(g)位点过滤与统计,对原始体细胞变异结果进行过滤,得到真实突变结果,并统计其中的单碱基变异SNV同义突变个数、SNV非同义突变个数、移码插入突变个数、非移码插入突变个数、移码缺失突变个数以及非移码缺失突变个数;
(h)将(g)中计算的结果输入基于高通量靶向测序技术检测肿瘤突变负荷的预测模型中,得到样本的肿瘤突变负荷。
优选的,所述低质量数据过滤及质控的具体过程为去除含有接头的序列、去除N含量>5个的序列和去除平均质量低于15的序列,选择符合设定阈值的数据进行后续分析。
优选的,所述数据对比的具体过程为使用比对软件BWA-mem比对到参考基因组,并对比对上的数据进行平均测序深度>1000X,100X覆盖率筛选>90%,选择符合设定阈值的数据进行后续分析。
优选的,所述变异检测的具体过程为使用变异检测软件mutect2、vardict和varScan,对肿瘤组织和对照样本的数据同时进行变异检测,得到原始体细胞变异检测结果。
优选的,所述注释的具体过程为使用ANNOVAR、SNPEFF和VEP软件对突变位点进行注释,得到基因名称、转录本编号、位点信息、人群频率以及相关疾病信息。
优选的,所述成对样本质控的具体过程为根据设计的单核苷酸多态性SNP位点,计算肿瘤组织和对照样本是否来自于同一患者;当肿瘤组织和对照样本质控位点不同,则表示二者来自于不同个体,质控不通过;当肿瘤组织和对照样本质控位点相同,则表示二者来自于相同个体,质控通过。
优选的,所述对原始体细胞变异结果进行过滤的具体过程包括:
1)保留蛋白编码区域的突变;
2)过滤突变频率<5%的突变;
3)过滤由于比对造成的假阳性突变;
4)过滤黑名单中存在的位点;
5)过滤cosmic数据库中出现次数≥2的位点;
6)过滤人群数据库中出现频率>5%的位点。
一种检测肿瘤突变负荷的预测模型,包括以下步骤:
(1)统计SNV同义突变个数Nsys、SNV非同义突变个数Nnon、移码插入突变个数Nis、非移码插入突变个数Nns、移码缺失突变个数Nds和非移码缺失突变个数Ndn;
(2)以全外的TMB值作为金标准,按照多元线性模型计算靶向目标区域的肿瘤突变负荷TMB,TMB=a0+a1× Nsys+a2× Nnon+a3× Nis+a4× Nns+a5× Nds+a6× Ndn,其中,a0、a1、a2、a3、a4、a5和a6是通过1453例ChosenOne599Ⓡ靶向测序数据进行拟合得到。
本发明的有益效果为:
(1)本发明利用目标区域捕获技术进行高通量测序来检测肿瘤突变负荷,提供了一种高特异性、高灵敏的流程;
(2)与使用全外显子组检测的方法相比,本方法的测序深度更高,不仅能够检测到肿瘤样本的低频突变,还能够节约成本;
(3)本发明中提供的方法,大大简化了分析步骤,能够过滤掉假阳性突变,可以获得和WES等同的检测效果;
(4)本发明中提供的方法主要是收集中国人群的突变频率,能够为中国人群的肿瘤免疫治疗用药奠定基础,建立中国人群的TMB相关免疫治疗数据库。
附图说明
图1为本发明实施例1的流程图;
图2为本发明实施例2的训练集中预测TMB(Panel)与真实TMB(全外显子)的比较图;
图3为本发明实施例2的训练集中预测TMB(Panel与真实TMB(全外显子)的相关性图;
图4为本发明实施例2的测试集中预测TMB(Panel)与真实TMB(全外显子)的比较图;
图5为本发明实施例2的训练集中预测TMB(Panel与真实TMB(全外显子)的相关性图;
图6为本发明实施例3的靶向测序结果的TMB预测值和金标准(全外显子)的TMB比较图;
图7为本发明实施例4的靶向测序结果的TMB预测值与患者生存期的关系图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
在实施例中,待测的样本是已知高肿瘤突变负荷的石蜡包埋组织样本及相对应血液对照样本。
试验步骤如下:
1、样本的提取及片段化:从血液样本和石蜡包埋组织样本中使用核酸提取试剂盒(Magen或Promega)提取基因组DNA,利用Qubit进行定量;利用Covaris M220仪器对样品DNA进行片段化,使DNA片段大小在100~500bp之间,利用QIAxcel(QIAGEN)仪器检测片段大小是否符合要求。
2、双UMI文库构建:
1)末端修复和加“A”:将片段化的样本DNA进行末端修复和加“A”,反应体系见下表1,涡旋混匀后离心,放置在热循环仪上,反应体系为20℃反应30min,然后65℃反应30min。
表1 反应体系
2)接头连接并纯化:将上述末修后的DNA进行接头连接(ABclonal试剂盒),接头连接体系见表2,在室温孵育15min;
表2 接头连接体系
待反应结束后,加入56ulAgencourt AMPure XP磁珠进行常规纯化,纯化结束后,加入21ul 0.1X TE buffer,吹打混匀,室温放置5min;将反应管放回磁力架,直到溶液澄清,吸20ul上清放入新的0.2ml反应管中。
3)DNA文库扩增并纯化:在上述纯化后产物中,按照下面扩增体系见表3加入PCR反应试剂,进行PCR扩增以得到足量的带双端UMI的DNA片段;扩增步骤见表4;
表3 扩增体系
表4 扩增步骤
将得到的PCR扩增产物进行磁珠纯化,然后利用Qubit测定浓度,利用QIAxcel进行片段大小检测。
4)目标区域杂交:取出500ng扩增产物,加入5ul 快速封闭试剂和2ul P5、P7封闭试剂,使用浓缩仪将扩增产物浓缩到干粉状态,然后加入杂交试剂,室温孵育10min,充分震荡混匀后放置在热循环仪上;杂交反应体系如表5所示,杂交反应条件如表6所示;
表5 杂交反应体系
试剂 | 体积 |
杂交缓冲液 | 8.5ul |
杂交增强剂 | 2.7ul |
无核酶水 | 1.8ul |
总体积 | 13ul |
表6 杂交反应条件
步骤 | 温度 | 时间 |
1 | 95℃ | 10min |
2 | 65℃ | ∞ |
等步骤1结束后,65℃条件下暂停,1min内在PCR仪上加入4ul捕获探针,使用移液器混匀后,计时4h。
5)目标区域捕获:使用链霉亲和素磁珠对探针结合的样品进行捕获,步骤如下:将1mg磁珠加入1.5ml离心管,至于磁力架上,弃上清液,用200ul磁珠清洗试剂清洗两遍后,使用100ul磁珠清洗试剂重悬磁珠,转移到0.2mlPCR管内,等65℃反应4h结束后,将其置于磁力架上,待溶液澄清后,弃上清液,然后将磁珠置于65℃热循环仪上,在1min内将杂交反应液转移至含有链霉亲和素磁珠的PCR管中,迅速震荡混匀,放回65℃热循环仪,计时45min,每隔8min震荡混匀一次,保持磁珠处于悬浮状态。
6)洗脱非杂交片段:65℃清洗:先使用预热到65℃的清洗液1清洗一遍,再使用预热到65℃的增强清洗液清洗两遍;室温清洗:一次使用清洗液1,清洗液2和清洗液3各清洗一遍;最后至于磁力架上,弃上清液,加入22.5ul无核酶水重悬磁珠。
7)捕获后产物扩增:将磁珠捕获到的DNA片段进行PCR扩增(采用Illumina P5、P7接头引物),扩增体系见表7,扩增条件见表8;
表7 扩增体系
试剂 | 体积 |
2x热启动酶混合物 | 25ul |
P5接头引物 | 1.25ul |
P7接头引物 | 1.25ul |
磁珠上的目标区域DNA | 22.5ul |
总体积 | 50ul |
表8 扩增条件
将得到的PCR扩增产物进行磁珠纯化,使用Qubit检测浓度,利用2100进行片段大小检测。
8)上机测序:在高通量测序仪(Illumina)上完成测序,测序实验操作按照生产商提供地操作说明书进行;测序平台将得到的光信号转化为碱基序列,下机数据为fq文件,存储所有测序片段结果。
9)参见附图1,检出流程包括以下步骤:
(a)将下机数据进行拆分,获得原始测序数据;
(b)对高通量测序的原始数据进行低质量过滤、质控和处理;
(c)将数据比对到参考基因组上;
(d)变异检测,获得肿瘤样本的相关突变信息;
(e)对捕获区域内突变位点进行相关疾病信息进行注释;
(f)成对样本质控,检验肿瘤组织于对照是否来自于同一样本;
(g)位点过滤与统计,对原始体细胞变异结果进行过滤,得到真实突变结果,并统计其中的单碱基变异SNV同义突变个数、SNV非同义突变个数、移码插入突变个数、非移码插入突变个数、移码缺失突变个数以及非移码缺失突变个数;
(h)将(g)中计算的结果输入基于高通量靶向测序技术检测肿瘤突变负荷的预测模型中,得到样本的肿瘤突变负荷。
实施例2
对1453例肺癌样本做全外显子测序和ChosenOne599Ⓡ靶向测序,按照上述流程进行分析,统计出ChosenOne599Ⓡ中的SNV同义突变个数、SNV非同义突变个数、移码插入突变个数、非移码插入突变个数、移码缺失突变个数以及非移码缺失突变个数,以全外的TMB值作为金标准,按照多元线性模型计算panel的TMB。
通过检出流程得到待测样本的突变数据,计算ChosenOne599Ⓡ中的SNV同义突变个数Nsys、SNV非同义突变个数Nnon、移码插入突变个数Nis、非移码插入突变个数Nns、移码缺失突变个数Nds以及非移码缺失突变个数Ndn;
建立多元线性模型:取2/3的样本作为训练集,1/3的样本作为测试集,按照多元线性模型计算靶向目标区域的肿瘤突变负荷TMB,训练模型:TMB=a0+a1×Nsys+a2×Nnon+a3×Nis+a4×Nns+a5×Nds+a6×Ndn,得到最终TMB预测模型为:Y=-0.0245430620120464+0.485239516817346×Nsys +0.317176595471986×Nnon+0.161795438846549×Nis-0.135320109728243×Nns+0.342599588065429× Nds +0.0281390455362945×Ndn;其中,训练集预测TMB(Panel)与真实TMB(全外显子)结果见图2所示,预测TMB值(Panel)与真实TMB值(全外显子)相关性0.96结果见图3所示,测试集预测TMB(Panel)与真实TMB结果见图4所示,预测TMB值(Panel)与真实TMB值(全外显子)相关性0.96结果见图5所示;由此可知,本发明预测模型具有准确性。
实施例3
本实施例对6例TMB标准品进行ChosenOne599Ⓡ靶向区域测序,根据TMB模型进行结果预测,与金标准比较结果如下表9和图6所示。
表9 结果预测与金标准比较结果
实施例4
本实施例对9例入组PD-1免疫检查点阻断治疗的非小细胞肺癌患者进行ChosenOne599Ⓡ靶向区域测序,根据TMB模型进行结果预测,结合病人的临床诊断和生存信息,评定肿瘤突变负荷在非小细胞肺癌PD-1免疫检查点阻断治疗中的药物疗效评估和预后判定应用价值,TMB预测结果见下表10和图7所示。
表10 TMB预测结果
Sample | TMB | 生存时间 |
TF1900001 | 9.4 | 82 |
TF1900002 | 6.5 | 42 |
TF1900003 | 3.6 | 127 |
TF1900004 | 3.9 | 114 |
TF1900005 | 10.9 | 141 |
TF1900006 | 10.2 | 62 |
TF1900007 | 3.5 | 85 |
TF1900008 | 10 | 169 |
TF1900009 | 11.4 | 189 |
由表10和图7可知,TMB高组的生存时间明显高于TMB低组的生存时间,其中P值为0.018。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,包括以下步骤:
S1:对待测的肿瘤组织和血液样品进行DNA提取;
S2:针对肿瘤相关基因,构建目标区域靶向捕获测序文库;
S3:利用高通量测序平台,获得原始下机数据;
S4:通过检出流程得到样本的肿瘤突变负荷;所述检出流程具体包括:
(a)测序数据拆分,用于对高通量测序平台Illumina的下机数据进行拆分,获得原始测序数据;
(b)低质量数据过滤及质控,用于对高通量测序的原始数据进行过滤、质控和处理;所述低质量数据过滤及质控的具体过程为去除含有接头的序列、去除N含量>5个的序列和去除平均质量低于15的序列,选择符合设定阈值的数据进行后续分析;
(c)数据对比,将数据比对到参考基因组上;所述数据对比的具体过程为使用比对软件BWA-mem比对到参考基因组,并对比对上的数据进行平均测序深度>1000X,100X覆盖率筛选>90%,选择符合设定阈值的数据进行后续分析;
(d)变异检测,获得肿瘤样本的相关突变信息;
(e)注释,用于对捕获区域内突变位点进行相关疾病信息进行注释;
(f)成对样本质控,检验肿瘤组织与对照是否来自于同一样本;
(g)位点过滤与统计,对原始体细胞变异结果进行过滤,得到真实突变结果,并统计其中的单碱基变异SNV同义突变个数Nsys、SNV非同义突变个数Nnon、移码插入突变个数Nis、非移码插入突变个数Nns、移码缺失突变个数Nds以及非移码缺失突变个数Ndn;
将(g)中计算的结果输入基于高通量靶向测序技术检测肿瘤突变负荷的预测模型中,得到样本的肿瘤突变负荷;所述预测模型为TMB=a0+a1× Nsys+a2× Nnon+a3× Nis+a4×Nns+a5× Nds+a6× Ndn,其中,a0、a1、a2、a3、a4、a5和a6是通过1453例ChosenOne599Ⓡ靶向测序数据进行拟合得到。
2.根据权利要求1所述的一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,所述肿瘤相关基因中的外显子区域的基因包括:ABL1、ABL2、ACVR1B、AKT1、AKT2、AKT3、ALK、AMER1、APC、AR、ARAF、ARFRP1、ARID1A、ARID1B、ARID2、ASXL1、ATM、ATR、ATRX、AURKA、AURKB、AXIN1、AXL、BAP1、BARD1、BCL2、BCL2L1、BCL2L2、BCL6、BCOR、BCORL1、BLM、BRAF、BRCA1、BRCA2、BRD4、BRIP1、BTG1、BTK、C11orf30、CARD11、CBFB、CBL、CCND1、CCND2、CCND3、CCNE1、CD274、CD79A、CD79B、CDC73、CDH1、CDK12、CDK4、CDK6、CDK8、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHD2、CHD4、CHEK1、CHEK2、CIC、CREBBP、CRKL、CRLF2、CSF1R、CTCF、CTNNA1、CTNNB1、CUL3、CYLD、DAXX、DDR2、DICER1、DNMT3A、DOT1L、EGFR、EP300、EPHA3、EPHA5、EPHA7、EPHB1、ERBB2、ERBB3、ERBB4、ERG、ERRFI1、ESR1、EZH2、FAM46C、FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG、FANCL、FAS、FAT1、FBXW7、FGF10、FGF14、FGF19、FGF23、FGF3、FGF4、FGF6、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT1、FLT3、FLT4、FOXL2、FOXP1、FRS2、FUBP1、GABRA6、GATA1、GATA2、GATA3、GATA4、GATA6、GID4、GLI1、GNA11、GNA13、GNAQ、GNAS、GPR124、GRIN2A、GRM3、GSK3B、H3F3A、HGF、HNF1A、HRAS、HSD3B1、HSP90AA1、IDH1、IDH2、IGF1R、IGF2、IKBKE、IKZF1、IL7R、INHBA、INPP4B、IRF2、IRF4、IRS2、JAK1、JAK2、JAK3、JUN、KAT6A、KDM5A、KDM5C、KDM6A、KDR、KEAP1、KEL、KIT、KLHL6、KMT2A、KMT2C、KMT2D、KRAS、LMO1、LRP1B、LYN、LZTR1、MAGI2、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MCL1、MDM2、MDM4、MED12、MEF2B、MEN1、MET、MITF、MLH1、MPL、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYC、MYCL、MYCN、MYD88、NF1、NF2、NFE2L2、NFKBIA、NKX2-1、NOTCH1、NOTCH2、NOTCH3、NPM1、NRAS、NSD1、NTRK1、NTRK2、NTRK3、NUP93、PAK3、PALB2、PARK2、PAX5、PBRM1、PDCD1LG2、PDGFRA、PDGFRB、PDK1、PIK3C2B、PIK3CA、PIK3CB、PIK3CG、PIK3R1、PIK3R2、PLCG2、PMS2、POLD1、POLE、PPP2R1A、PRDM1、PREX2、PRKAR1A、PRKCI、PRKDC、PRSS8、PTCH1、PTEN、PTPN11、QKI、RAC1、RAD50、RAD51、RAF1、RANBP2、RARA、RB1、RBM10、RET、RICTOR、RNF43、ROS1、RPTOR、RUNX1、RUNX1T1、SDHA、SDHB、SDHC、SDHD、SETD2、SF3B1、SLIT2、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SNCAIP、SOCS1、SOX10、SOX2、SOX9、SPEN、SPOP、SPTA1、SRC、STAG2、STAT3、STAT4、STK11、SUFU、SYK、TAF1、TBX3、TET2、TGFBR2、TNFAIP3、TNFRSF14、TOP1、TOP2A、TP53、TSC1、TSC2、TSHR、U2AF1、VEGFA、VHL、WISP3、WT1、XPO1、ZBTB2、ZNF217、ZNF703。
3.根据权利要求1所述的一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,所述变异检测的具体过程为使用变异检测软件mutect2、vardict和varScan,对肿瘤组织和对照样本的数据同时进行变异检测,得到原始体细胞变异检测结果。
4.根据权利要求1所述的一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,所述注释的具体过程为使用ANNOVAR、SNPEFF和VEP软件对突变位点进行注释,得到基因名称、转录本编号、位点信息、人群频率以及相关疾病信息。
5.根据权利要求1所述的一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,所述成对样本质控的具体过程为根据设计的单核苷酸多态性SNP位点,计算肿瘤组织和对照样本是否来自于同一患者;当肿瘤组织和对照样本质控位点不同,则表示二者来自于不同个体,质控不通过;当肿瘤组织和对照样本质控位点相同,则表示二者来自于相同个体,质控通过。
6.根据权利要求1所述的一种非诊断目的的检测肿瘤突变负荷的方法,其特征在于,所述对原始体细胞变异结果进行过滤的具体过程包括:
1)保留蛋白编码区域的突变;
2)过滤突变频率<5%的突变;
3)过滤由于比对造成的假阳性突变;
4)过滤黑名单中存在的位点;
5)过滤cosmic数据库中出现次数≥2的位点;
过滤人群数据库中出现频率>5%的位点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010991706.4A CN111826447B (zh) | 2020-09-21 | 2020-09-21 | 一种检测肿瘤突变负荷的方法及预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010991706.4A CN111826447B (zh) | 2020-09-21 | 2020-09-21 | 一种检测肿瘤突变负荷的方法及预测模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111826447A CN111826447A (zh) | 2020-10-27 |
CN111826447B true CN111826447B (zh) | 2021-01-05 |
Family
ID=72918516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010991706.4A Active CN111826447B (zh) | 2020-09-21 | 2020-09-21 | 一种检测肿瘤突变负荷的方法及预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111826447B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112342296A (zh) * | 2020-11-16 | 2021-02-09 | 至本医疗科技(上海)有限公司 | 用于实体瘤免疫检查点抑制剂疗法预测的kmt2家族基因变异标志物和试剂盒 |
CN114540488B (zh) * | 2020-11-26 | 2024-04-30 | 福建和瑞基因科技有限公司 | 一种用于高通量靶向测序检测肿瘤突变负荷的基因组合、检测装置、检测试剂盒及应用 |
CN113106157B9 (zh) * | 2021-05-24 | 2023-08-25 | 温州医科大学附属第二医院(温州医科大学附属育英儿童医院) | 一种肿瘤免疫治疗的预后生存期预测用试剂盒及其用途 |
CN114203261A (zh) * | 2021-10-26 | 2022-03-18 | 昂凯生命科技(苏州)有限公司 | 一种用于基因检测Panel临床诊断指标算法开发的方法 |
CN114854861A (zh) * | 2022-05-20 | 2022-08-05 | 北京大学第一医院 | 基因组合制备人肿瘤同源重组缺陷、肿瘤突变负荷和微卫星不稳定性分级检测产品的用途 |
CN115294129B (zh) * | 2022-10-08 | 2023-02-07 | 北京肿瘤医院(北京大学肿瘤医院) | 肿瘤免疫治疗预后评估方法、装置、电子设备及存储介质 |
CN115679000B (zh) * | 2022-12-30 | 2023-03-21 | 臻和(北京)生物科技有限公司 | 微小残留病灶的检测方法、装置、设备和存储介质 |
CN117935914A (zh) * | 2024-03-22 | 2024-04-26 | 北京求臻医学检验实验室有限公司 | 一种意义未明的克隆性造血识别及其应用方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151524A1 (en) * | 2016-02-29 | 2017-09-08 | Foundation Medicine, Inc. | Methods and systems for evaluating tumor mutational burden |
CN108588194A (zh) * | 2018-05-28 | 2018-09-28 | 北京诺禾致源科技股份有限公司 | 利用高通量测序数据检测肿瘤突变负荷的方法及装置 |
CN109033749A (zh) * | 2018-06-29 | 2018-12-18 | 深圳裕策生物科技有限公司 | 一种肿瘤突变负荷检测方法、装置和存储介质 |
CN109767811A (zh) * | 2018-11-29 | 2019-05-17 | 北京优迅医学检验实验室有限公司 | 用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置 |
-
2020
- 2020-09-21 CN CN202010991706.4A patent/CN111826447B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151524A1 (en) * | 2016-02-29 | 2017-09-08 | Foundation Medicine, Inc. | Methods and systems for evaluating tumor mutational burden |
CN108588194A (zh) * | 2018-05-28 | 2018-09-28 | 北京诺禾致源科技股份有限公司 | 利用高通量测序数据检测肿瘤突变负荷的方法及装置 |
CN109033749A (zh) * | 2018-06-29 | 2018-12-18 | 深圳裕策生物科技有限公司 | 一种肿瘤突变负荷检测方法、装置和存储介质 |
CN109767811A (zh) * | 2018-11-29 | 2019-05-17 | 北京优迅医学检验实验室有限公司 | 用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置 |
Non-Patent Citations (2)
Title |
---|
A novel tumor mutational burden estimation model as a predictive and prognostic biomarker in NSCLC patients;Tian,Y.H.等;《BMC Medicine》;20200826;1-11 * |
肿瘤突变负荷在肿瘤免疫检查点抑制剂疗效预测中的作用研究进展;万凌红等;《现代医药卫生》;20200630;1834-1837 * |
Also Published As
Publication number | Publication date |
---|---|
CN111826447A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111826447B (zh) | 一种检测肿瘤突变负荷的方法及预测模型 | |
CN106755501B (zh) | 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法 | |
CN107475375B (zh) | 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒 | |
CN109207594B (zh) | 一种基于二代测序的通过血浆检测微卫星稳定状态和基因组变化的方法 | |
US10998084B2 (en) | Sequencing data analysis method, device and computer-readable medium for microsatellite instability | |
CN108753967A (zh) | 一种用于肝癌检测的基因集及其panel检测设计方法 | |
CN107475370A (zh) | 用于肺癌诊断的基因群和试剂盒及诊断方法 | |
KR20180033587A (ko) | 제자리 증폭에 의한 세포-유리 핵산 분자의 제조 방법 | |
EP3564391A1 (en) | Method, device and kit for detecting fetal genetic mutation | |
CN113278611B (zh) | 捕获测序探针及其用途 | |
CN110055331B (zh) | 一种用于膀胱癌辅助诊断或筛查的试剂盒及其应用 | |
WO2020191521A1 (zh) | 核酸序列、rna目标区域测序文库的构建方法及应用 | |
CN111690748B (zh) | 使用高通量测序检测微卫星不稳定的探针组、试剂盒及微卫星不稳定的检测方法 | |
CN111424087A (zh) | 基于二代测序的用于泛癌种检测或靶向用药的检测Panel、试剂盒及应用 | |
CN114480660A (zh) | 一种用于检测泛癌种的基因Panel、探针及应用 | |
JP2022503916A (ja) | 血漿サンプル中のマイクロサテライトの安定性およびゲノム変化を検出する次世代シークエンシングに基く方法 | |
CN112980961A (zh) | 联合检测snv、cnv和fusion变异的方法和装置 | |
CN109161543B (zh) | 用于富集低频dna突变的dna探针及其应用 | |
CN105950709A (zh) | 试剂盒、建库方法以及检测目标区域变异的方法及系统 | |
CN108588201B (zh) | 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置 | |
CN116445621A (zh) | 同时检测肺癌和结直肠癌的dna和rna流程引物组和试剂盒 | |
CN114525344A (zh) | 一种用于检测或辅助检测肿瘤相关基因变异的试剂盒及其应用 | |
CN112251512B (zh) | 用于非小细胞肺癌患者基因检测的目标基因组以及相关的评估方法、用途和试剂盒 | |
CN112391474A (zh) | 一种基于瘤内具核梭杆菌预测食管鳞癌转移的方法 | |
WO2022126938A1 (zh) | 一种检测多核苷酸变异的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: Room 135, Floor 1, Building 3, No. 96, Longchuanwu Road, Donghu Street, Linping District, Hangzhou City, Zhejiang Province, 310000 Patentee after: Qiuzhen Medical Technology (Zhejiang) Co.,Ltd. Address before: 101, 1 / F, building 3, 156 Jinghai 4th Road, Daxing Economic and Technological Development Zone, Beijing Patentee before: CHOSENMED TECHNOLOGY (BEIJING) Co.,Ltd. |
|
CP03 | Change of name, title or address |