CN108021789B - 一种鉴定体细胞突变的综合策略 - Google Patents

一种鉴定体细胞突变的综合策略 Download PDF

Info

Publication number
CN108021789B
CN108021789B CN201711355434.3A CN201711355434A CN108021789B CN 108021789 B CN108021789 B CN 108021789B CN 201711355434 A CN201711355434 A CN 201711355434A CN 108021789 B CN108021789 B CN 108021789B
Authority
CN
China
Prior art keywords
snv
identification
mutation
indel
reliable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711355434.3A
Other languages
English (en)
Other versions
CN108021789A (zh
Inventor
张仕坚
严建龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Predatum Biomedicine Suzhou Co ltd
Original Assignee
Predatum Biomedicine Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Predatum Biomedicine Suzhou Co ltd filed Critical Predatum Biomedicine Suzhou Co ltd
Priority to CN201711355434.3A priority Critical patent/CN108021789B/zh
Publication of CN108021789A publication Critical patent/CN108021789A/zh
Application granted granted Critical
Publication of CN108021789B publication Critical patent/CN108021789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种鉴定体细胞突变的综合策略,以比对结果作为基础数据,使用SNV鉴定工具组和Indel鉴定工具组同时对基础数据进行SNV和Indel鉴定,使用SNV鉴定工具组得到的所有SNV数据与设定的条件进行对比过滤,取出符合条件的可靠SNV数据,使用Indel鉴定工具组得到的所有Indel数据与设定的条件进行对比过滤,取出符合条件的可靠Indel数据,将可靠SNV数据与可靠Indel数据组合得到可靠体细胞突变结果。本发明综合运用多个突变鉴定工具同时降低鉴定突变时的假阳性和假阴性实现体细胞突变的精确鉴定,将鉴定体细胞突变的综合策略运用到工具中用于生产,应用价值高。

Description

一种鉴定体细胞突变的综合策略
技术领域
本发明涉及一种鉴定体细胞突变的方法,尤其涉及一种鉴定体细胞突变的综合策略。
背景技术
本发明所指的“体细胞突变”是肿瘤组织中发生突变而正常对照中没发生的突变,类型包括SNV(Single Nucleotide Variation,单核苷酸变异)和Indel(Insertion andDeletion,插入与删除)。
当前有众多进行体细胞突变鉴定的工具,包括进行SNV鉴定的MuTect2、VarScan2、Radia、SomaticSniper、Strelka、MuSE等,以及进行Indel鉴定的VarScan2、MuTect2、Strelka、Pindel、Indelocator等。这些软件各有优势劣势,单独使用的时候都不能得尽善尽美的突变结果。下面列举其中使用较为广泛的两个软件,对单个软件的优劣势进行介绍。
MuTect2是突变鉴定领域内最出名的软件套装GATK(Genome Analysis Toolkit)的一部分。其优势在于使用了贝叶斯分类器,以已知突变为背景知识,对肿瘤组织中的突变为体细胞突变的可能性以及正常组织中没有发生相应突变的可能性进行统计检验,使得对体细胞的判断有较高的准确度。另外,其能对突变位点局部序列进行重新拼接,使得Indel及Indel附近的SNV的鉴定更加准确。其缺点在于没有经过大范围的实践应用,可能存在假阴性或假阳性。另外,软件还处于beta版(测试版),可能存在bug(程序缺陷),还不推荐用于生产环境。
VarScan2是领域内鉴定突变的常用软件。其优势在于运行速度快,突变鉴定相对准确。其缺点在于使用了Fisher’s Exact Test(费希尔精确检验)对突变是否为体细胞进行统计检验,这种检验方法较为简单,是一种纯数学的方法,不像MuTect2那样基于已有知识。另外,其存在有些突变被无故遗漏。
上述这些单个工具在鉴定体细胞突变时都存在假阳性和假阴性的问题。本发明在“肿瘤-正常对照”成对样本中,控制当前领域内单个软件工具在鉴定突变时的假阳性的同时减少假阴性,从而同时提高特异度和敏感度,准确地鉴定体细胞突变,最终得到最接近肿瘤真实体细胞突变的(染色体)位置、突变形式(野生型及突变型)。目前无成型、成文的方法或工具可以直接实现此功能。
发明内容
本发明目的在于解决现有技术中的上述问题,提供一种鉴定体细胞突变的综合策略,在控制假阴性的同时控制假阳性,通过这两方面的组合,实现体细胞突变的精确鉴定。
本发明为达到上述目的,所采用的技术手段是:一种鉴定体细胞突变的综合策略,以比对结果作为基础数据,使用SNV鉴定工具组和Indel鉴定工具组同时对基础数据进行SNV和Indel鉴定,使用SNV鉴定工具组得到的所有SNV数据与设定的条件进行对比过滤,取出符合条件的可靠SNV数据,使用Indel鉴定工具组得到的所有Indel数据与设定的条件进行对比过滤,取出符合条件的可靠Indel数据,将可靠SNV数据与可靠Indel数据组合得到可靠体细胞突变结果。
进一步的,所述比对结果使用BAM(Binary Alignment/Map)格式存储。
更进一步的,所述比对结果由BWA比对软件比对得到,并使用GATK的Re-align(重新比对)模块对比对结果进行重新比对获得。
进一步的,所述SNV鉴定工具组由MuSE、MuTect2、Radia、SomaticSniper和VarScan2,五个体细胞突变鉴定工具组成。
进一步的,所述Indel鉴定工具组由Pindel、Strelka和VarScan2,三个体细胞突变鉴定工具组成。
进一步的,所述对比过滤是指:针对SNV,至少在五个工具中的两个中鉴定出SNV;针对Indel,至少在三个工具中的两个中鉴定出Indel;针对这两类突变,正常样本中的测序覆盖深度不小于8,肿瘤样本中的测序覆盖深度不小于10。
进一步的,所述组合得到可靠体细胞突变结果是指:将经过对比过滤得到的SNV及Indel合并即得到最终的可靠突变。
本发明有益效果在于:由于使用SNV鉴定工具组和Indel鉴定工具组同时鉴定,综合运用多个突变鉴定工具达到同时降低鉴定突变时的假阳性和假阴性的目的,从而实现体细胞突变的精确鉴定,将鉴定体细胞突变的综合策略运用到测试工具中,能用于生产,应用价值高。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的体细胞突变鉴定流程图。
具体实施方式
如图1所示,一种鉴定体细胞突变的综合策略,以比对结果作为基础数据,使用SNV鉴定工具组和Indel鉴定工具组同时对基础数据进行SNV和Indel鉴定,使用SNV鉴定工具组得到的所有SNV数据与设定的条件进行对比过滤,取出符合条件的可靠SNV数据,使用Indel鉴定工具组得到的所有Indel数据与设定的条件进行对比过滤,取出符合条件的可靠Indel数据,将可靠SNV数据与可靠Indel数据组合得到可靠体细胞突变结果。
所述比对结果使用BAM(Binary Alignment/Map)格式存储。
所述比对结果由BWA比对软件比对得到,并使用GATK的Re-align(重新比对)模块对比对结果进行重新比对获得。
所述SNV鉴定工具组由MuSE、MuTect2、Radia、SomaticSniper和VarScan2,五个体细胞突变鉴定工具组成。
所述Indel鉴定工具组由Pindel、Strelka和VarScan2,三个体细胞突变鉴定工具组成。
所述对比过滤是指:针对SNV,至少在五个工具中的两个中鉴定出SNV;针对Indel,至少在三个工具中的两个中鉴定出Indel;针对这两类突变,正常样本中的测序覆盖深度不小于8,肿瘤样本中的测序覆盖深度不小于10。
所述组合得到可靠体细胞突变结果是指:将经过对比过滤得到的SNV及Indel合并即得到最终的可靠突变。
应用举例
将上述方法利用Bash(Bourne-Again SHell)语言进行流程开发,所得工具由以下模块组成:
主控制模块:为bash脚本。主要功能是调用各突变鉴定模块进行突变鉴定,对突变结果进行整合。在调用各突变鉴定模块时,会根据各突变鉴定工具的运行时间按比例分配计算资源(线程),尽可能使得多个工具在邻近的时间运行完成(因为只要有任何一个工具没运行完成,就无法继续下游步骤)。本程序可指定的参数包括:输出目录、总线程数、是否为全基因组测序。本程序需要的输入文件包括:参考基因组序列、dbSNP位点文件、COSMIC位点文件、GATK工具包文件路径、VarScan2工具包文件路径和样本信息文件。其中,样本信息文件为表格文件,包括5列:肿瘤样本名、肿瘤样本比对结果BAM文件、正常对照样本名、正常对照样本比对结果BAM文件和测序时用的捕获区域文件(全基因组测序时可不指定)。
突变鉴定模块:突变鉴定模块指的是各个突变鉴定工具对应的bash脚本。以MuSE工具为例进行展开说明。“MuSE鉴定SNV模块”包括MuSE标准分析流程、测序深度过滤(vcfFilter.pl脚本)、突变频率绘图(hist.R脚本)。其中,标准分析流程在各个突变鉴定工具中各有不同,测序深度过滤和突变频率绘图在各工具中的过滤条件和绘图样式保持一致。
突变整合模块:突变整合模块指的是使用integrate.pl将突变鉴定模块中各工具得到的突变进行整合,设置过滤条件进行突变筛选,最终得到VCF(Variant Call Format)和TSV(Tab-separated Values)格式的可靠体细胞突变列表。
本发明由于使用SNV鉴定工具组和Indel鉴定工具组同时鉴定,综合运用多个突变鉴定工具达到同时降低鉴定突变时的假阳性和假阴性的目的,从而实现体细胞突变的精确鉴定,将鉴定体细胞突变的综合策略运用测试工具中能用于生产,应用价值高。
以上所述,仅为本发明的具体实施方式,并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (1)

1.一种鉴定体细胞突变的方法,其特征在于:以比对结果作为基础数据,使用SNV鉴定工具组和Indel鉴定工具组同时对基础数据进行SNV和Indel鉴定,使用SNV鉴定工具组得到的所有SNV数据与设定的条件进行对比过滤,取出符合条件的可靠SNV数据,使用Indel鉴定工具组得到的所有Indel数据与设定的条件进行对比过滤,取出符合条件的可靠Indel数据,将可靠SNV数据与可靠Indel数据组合得到可靠体细胞突变结果,所述SNV鉴定工具组由MuSE、MuTect2、Radia、SomaticSniper和VarScan2,五个体细胞突变鉴定工具组成,所述Indel鉴定工具组由Pindel、Strelka和VarScan2,三个体细胞突变鉴定工具组成;在调用各个突变鉴定工具对应的bash脚本时,根据各个突变鉴定工具的运行时间按照比例分配计算资源或线程,使得多个体细胞突变鉴定工具在邻近的时间运行完成;对突变结果进行整合,使用integrate.pl将各工具得到的突变进行整合,设置过滤条件进行突变筛选;所述对比过滤是指:针对SNV,至少在五个工具中的两个中鉴定出SNV;针对Indel,至少在三个工具中的两个中鉴定出Indel,最终得到VCF和TSV格式的可靠体细胞突变列表;针对这两类突变,正常样本中的测序覆盖深度不小于8,肿瘤样本中的测序覆盖深度不小于10,所述组合得到可靠体细胞突变结果是指:将经过对比过滤得到的SNV及Indel合并即得到最终的可靠突变;所述比对结果使用BAM格式存储;所述比对结果由BWA比对软件比对得到,并使用GATK的Re-align模块对比对结果进行重新比对获得。
CN201711355434.3A 2017-12-16 2017-12-16 一种鉴定体细胞突变的综合策略 Active CN108021789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711355434.3A CN108021789B (zh) 2017-12-16 2017-12-16 一种鉴定体细胞突变的综合策略

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711355434.3A CN108021789B (zh) 2017-12-16 2017-12-16 一种鉴定体细胞突变的综合策略

Publications (2)

Publication Number Publication Date
CN108021789A CN108021789A (zh) 2018-05-11
CN108021789B true CN108021789B (zh) 2022-06-07

Family

ID=62074080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711355434.3A Active CN108021789B (zh) 2017-12-16 2017-12-16 一种鉴定体细胞突变的综合策略

Country Status (1)

Country Link
CN (1) CN108021789B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109337957A (zh) * 2018-12-25 2019-02-15 江苏医联生物科技有限公司 检测基因组多突变类型的方法
CN109698011B (zh) * 2018-12-25 2020-10-23 人和未来生物科技(长沙)有限公司 基于短序列比对的Indel区域校正方法及系统
CN110846411B (zh) * 2019-11-21 2020-09-18 上海仁东医学检验所有限公司 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法
CN111793678A (zh) * 2020-07-30 2020-10-20 臻悦生物科技江苏有限公司 一种基于二代测序技术检测同源重组通路基因突变的方法及试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106282320A (zh) * 2015-05-20 2017-01-04 广州华大基因医学检验所有限公司 检测体细胞突变的方法和装置
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090220507A1 (en) * 2005-07-22 2009-09-03 Sucharov Carmen C Inhibition of extracellular signal-regulated kinase 1/2 as a treatment for cardiac hypertrophy and heart failure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106282320A (zh) * 2015-05-20 2017-01-04 广州华大基因医学检验所有限公司 检测体细胞突变的方法和装置
CN106611106A (zh) * 2016-12-06 2017-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置

Also Published As

Publication number Publication date
CN108021789A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108021789B (zh) 一种鉴定体细胞突变的综合策略
CN106909806B (zh) 定点检测变异的方法和装置
Fan et al. BreakDancer: Identification of genomic structural variation from paired‐end read mapping
AU2018374207A1 (en) Detecting intratumor heterogeneity of molecular subtypes in pathology slide images using deep-learning
CN106201502B (zh) 一种跨主机应用程序部署方法及装置
WO2019169760A1 (zh) 测试用例范围确定方法、装置及存储介质
CN107480470B (zh) 基于贝叶斯与泊松分布检验的已知变异检出方法和装置
CN109725013B (zh) X射线衍射数据分析系统
CN106407743B (zh) 一种基于集群的高通量数据分析方法
CN111192630B (zh) 一种宏基因组数据挖掘方法
CN107944228A (zh) 一种基因测序变异位点的可视化方法
Russo et al. Comparative study of aCGH and Next Generation Sequencing (NGS) for chromosomal microdeletion and microduplication screening
CN113948154A (zh) 一种基于铁死亡相关基因的胰腺癌预后分析方法、系统和装置
CN105161439A (zh) 晶圆测试管理系统及方法
CN117253539B (zh) 基于胚系突变检测高通量测序中样本污染的方法和系统
Kim et al. Cell lineage analysis with somatic mutations reveals late divergence of neuronal cell types and cortical areas in human cerebral cortex
CN105389201B (zh) 一种基于高性能计算集群的进程管理方法及其系统
CN110176276B (zh) 生物信息分析流程化管理方法及系统
CN105420374B (zh) 一种诱导全能干细胞应用前期突变检测方法
CN115954052A (zh) 一种实体瘤微小残留病灶监控位点筛选方法及系统
WO2016197028A1 (en) Determining the limit of detection of rare targets using digital pcr
CN112365928B (zh) 生物信息数据分析和结果质控自动化方法和系统
Higo et al. Correlation analysis between code clone metrics and project data on the same specification projects
CN110751982B (zh) 一种智能并行化敲除策略筛选的方法及系统
CN110021342B (zh) 用于加速变异位点的识别的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190425

Address after: 215129 No. 66 Wangmi Street, Suzhou High-tech Zone, Jiangsu Province

Applicant after: Predatum Biomedicine (Suzhou) Co.,Ltd.

Address before: Room 2166, 2nd floor, 23 Building, 72 Sanjie, Qinghe, Haidian District, Beijing

Applicant before: PRECISION SCIENTIFIC TECHNOLOGY (BEIJING) CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Comprehensive Strategy for Identifying Somatic Mutations

Effective date of registration: 20231030

Granted publication date: 20220607

Pledgee: Zhongguancun Technology Leasing Co.,Ltd.

Pledgor: Predatum Biomedicine (Suzhou) Co.,Ltd.

Registration number: Y2023980063358

PE01 Entry into force of the registration of the contract for pledge of patent right