CN106022001B - 一种肿瘤突变位点筛选及互斥基因挖掘的系统 - Google Patents

一种肿瘤突变位点筛选及互斥基因挖掘的系统 Download PDF

Info

Publication number
CN106022001B
CN106022001B CN201610319437.0A CN201610319437A CN106022001B CN 106022001 B CN106022001 B CN 106022001B CN 201610319437 A CN201610319437 A CN 201610319437A CN 106022001 B CN106022001 B CN 106022001B
Authority
CN
China
Prior art keywords
site
mutational site
mutator
mutation
experimental group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610319437.0A
Other languages
English (en)
Other versions
CN106022001A (zh
Inventor
薛成海
李连硕
刘婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wankangyuan (tianjin) Gene Technology Co Ltd
Original Assignee
Wankangyuan (tianjin) Gene Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wankangyuan (tianjin) Gene Technology Co Ltd filed Critical Wankangyuan (tianjin) Gene Technology Co Ltd
Priority to CN201610319437.0A priority Critical patent/CN106022001B/zh
Publication of CN106022001A publication Critical patent/CN106022001A/zh
Application granted granted Critical
Publication of CN106022001B publication Critical patent/CN106022001B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种肿瘤突变位点筛选及互斥基因挖掘的系统,包括过滤模块,用于外显子组处理流程中的vcf文件以及ANNOVAR注释软件的输出文件;分析模块,用于进行不同实验组突变位点的描述性分析;汇总模块,用于对每个样本的突变基因进行汇总,依据实验组突变基因列表构建突变基因矩阵;挖掘模块,用于对生成的突变基因矩阵进行依据Fisher精确检验的互斥以及共突变分析,确定互斥与共突变基因。本发明通过使用突变位点的注释信息以及测序read数、位点测序深度等基本参数对突变位点进行过滤,然后对于得到的突变位点进行不同实验组突变模式的描述性分析以及共突变、互斥突变基因集合的挖掘。

Description

一种肿瘤突变位点筛选及互斥基因挖掘的系统
技术领域
本发明属于基因信息数据处理领域,特别是涉及到一种肿瘤突变位点筛选及互斥基因挖掘的系统。
背景技术
肿瘤是由环境因素与遗传因素共同诱发的恶性疾病,其中遗传诱因涉及到大量基因的功能异常(突变、甲基化改变)。而基因突变认为是肿瘤发生发展的最主要驱动因素。最近一些以二代测序为主要手段的研究项目成功地在多种肿瘤类型中揭示了大量的潜在肿瘤驱动基因。因此,对二代测序数据的有效分析是进一步了解肿瘤病理生理学特性、实现对肿瘤的早期诊断、靶向治疗的关键。
对肿瘤病人基因突变进行全局性描述,主要的二代测序技术手段有全基因组测序以及全外显子组测序两种方法。虽然对于每个碱基而言,二代测序的成本在快速下降,但是对大量样本进行全基因组测序仍然是一个耗费巨大的工作。已有研究证实有约85%的肿瘤相关突变坐落于蛋白质编码区。因此,外显子组测序是一种经济成本相对较低,同时基本可以完整反应肿瘤突变模式的测序手段。
在肿瘤突变基因中,存在互斥突变基因以及共突变基因两种特殊情况。互斥突变基因指的是两个基因在同一样本中倾向不同时突变,而共突变基因倾向于两个基因在一定数量样本中同时突变。通常认为互斥突变基因更加倾向于肿瘤的驱动基因,这些互斥突变基因往往负责同一生物学通路的功能行使。而共突变基因往往涉及到肿瘤需要影响的多个生物学过程。因此鉴别肿瘤个体样本中具有互斥以及共突变关系的基因集合对于理解肿瘤的发病机制以及生物学表现具有重要作用。
目前挖掘肿瘤突变位点的方法以及软件工具往往筛选条件不够直观。筛选过程对于使用者呈现一种“黑箱子”状态。这样不利于使用者对于找到的突变位点进行进一步的生物学解读。
发明内容
有鉴于此,本发明提出一种肿瘤突变位点筛选及互斥基因挖掘的系统,通过使用突变位点的注释信息以及测序read数、位点测序深度等基本参数对突变位点进行过滤,然后对于得到的突变位点进行不同实验组突变模式的描述性分析以及共突变、互斥突变基因集合的挖掘。
为达到上述目的,本发明的技术方案是这样实现的:一种肿瘤突变位点筛选及互斥基因挖掘的系统,包括:
过滤模块,用于外显子组处理流程中的vcf文件以及ANNOVAR注释软件的输出文件,得到感兴趣组织和对照组织的突变位点的突变read数、位点测序深度、突变频率;
分析模块,用于进行不同实验组突变位点的描述性分析,找到实验组间的交叠突变位点以及特异性的突变位点,所述特异性的突变位点是指该突变位点在一个实验组出现而不在另外一个实验组中出现;
汇总模块,用于对每个样本的突变基因进行汇总,依据实验组突变基因列表构建突变基因矩阵;
挖掘模块,用于对生成的突变基因矩阵进行依据Fisher精确检验的互斥以及共突变分析,确定互斥与共突变基因;
所述过滤模块、分析模块、汇总模块、挖掘模块依次连接。
进一步的,所述过滤模块包括vcf文件过滤单元和ANNOVAR注释软件输出文件过滤单元;
所述vcf文件过滤单元用于根据vcf文件过滤标准进行过滤,所述vcf文件过滤标准为:对于感兴趣组织的突变read数>=3,位点测序深度>=8,突变频率>=0.1;对于对照组织要求突变read数<3,位点测序深度>=8,突变频率<0.1;
所述ANNOVAR注释软件输出文件过滤单元的过滤标准为:突变位于外显子区域;突变位点不能位于染色体高度重复区域;esp数据库中的群体变异频率低于5%;在千人基因组计划中的变异频率低于5%。
进一步的,所述分析模块包括突变位点发现单元和制图单元,所述突变位点发现单元用于找到实验组之间特异性的突变位点以及实验组之间共同的突变位点,所述制图单元用于将突变位点通过Venn图的方式进行展示。
更进一步的,所述突变位点发现单元包括交叠突变位点子单元和特异突变位点子单元、以及统计子单元;所述交叠突变位点子单元用于发现出现在两个实验组同一病人样本中的突变位点集合;所述特异突变位点子单元用于发现在一实验组中病人样本中出现而不在另一实验组同一病人样本中出现的突变位点;所述统计子单元对经过交叠或特异性分析的病人突变位点文件进行个数统计。
更进一步的,所述制图单元包括集合子单元和可视化子单元;所述集合子单元用于将每个病人通过一些列运算得到的最终突变位点集合汇总成实验组群体样本的突变位点集合;所述可视化子单元用于通过韦恩图对集合汇总子单元的数据进行可视化关系分析。
进一步的,所述汇总模块包括基因汇总单元和矩阵构成单元;所述基因汇总单元用于对每个样本的突变基因进行汇总,所述矩阵构成单元用于构建突变基因矩阵信息,输出结果每一行对应一个实验组突变基因,每一列对应一个样本,0表示未突变,1表示突变。
相对于现有技术,本发明所述的肿瘤突变位点筛选及互斥基因挖掘的系统具有以下优势:
本发明结合外显子组处理流程中的vcf文件以及ANNOVAR注释软件的输出文件对样本基因突变位点进行基于突变read数、位点测序深度、突变频率以及突变对蛋白质影响等方面的过滤。同时可以对不同组病人突变位点进行描述性分析以及获得同一实验组中共突变以及互斥突变的基因集合,筛选条件以及筛选过程对于使用者直观呈现。有利于使用者对于找到的突变位点进行进一步的生物学解读。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的分析流程示意图。
图2为本发明实施例中G1样本生成的频率文件局部截图。
图3为本发明实施例中样本群体随过滤频率变化的曲线。
图4为本发明实施例中肿瘤组织与正常组织的突变位点韦恩图。
图5为本发明实施例中案例样本群体中突变部分基因列表。
图6为本发明实施例中突变基因矩阵示例。
图7为本发明实施例中互斥与共突变基因关系展示。
具体实施方式
需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
本发明的方法原理如下:
基因突变的发生是肿瘤发生的前提条件,通过外显子组测序数据对突变基因(基因位点)进行鉴定是生物医学研究的重要手段之一。对细胞生理状态影响较大的是那些对基因所翻译蛋白质具有一定影响的基因,故为了鉴别出肿瘤相关突变基因(基因位点),我们首先对常用注释软件ANNOVAR生成的注释文件进行蛋白质功能过滤。
接下来由于二代测序技术存在一定的测序错误可能性,因此需要对测序错误导致的假阳性突变位点进行甄别。大量研究证实通过校正突变位点read改变个数、突变位点测序深度、突变位点的突变频率以及对照组织的此位点的read改变个数、测序深度以及突变频率可以较好的控制假阳性突变位点的数量,从而更有利于发现具有生物学意义的突变基因。结合注释文件里面突变对蛋白质翻译的影响以及突变频率信息可以得到较为可信的疾病相关突变基因。
Fisher精确检验是统计互斥突变以及共表达基因的常用手段,本软件通过此方法计算得到的互斥与突变基因具有较高的可信度。
依据上述原理,构建系统软件如下:
运行平台:Windows,Linux
编程语言:Perl,R
软件依赖:需安装R软件包Vennerable
本软件设有过滤模块、分析模块、汇总模块、挖掘模块,共包含:Filter_anno.pl、Extract_frequency.pl、Make_R_fre.R、FRE_FILTER.R、Process_format.pl、Setdiff_SNV.pl、Intersect_SNV.pl、Stat_snv_number.pl、Pool_group_SNV.R、Visualize_group_raltaions.R、Test_different_frequncy.R、SNV2Gene.pl、Make_snv_matrix.pl、Ex_Co_mutation.R共14个子程序。
其中过滤模块中,对注释文件进行过滤的程序(ANNOVAR注释软件输出文件过滤单元)为Filter_anno.pl;
对vcf文件进行过滤的程序(vcf文件过滤单元)有Extract_frequency.pl、Make_R_fre.R、FRE_FILTER.R、Process_format.pl;
分析模块中有特异突变位点子单元Setdiff_SNV.pl、交叠突变位点子单元Intersect_SNV.pl、统计子单元Stat_snv_number.pl、集合子单元Pool_group_SNV.R、可视化子单元Visualize_group_raltaions.R、测试子单元Test_different_frequncy.R;
汇总模块中,基因汇总单元的程序有SNV2Gene.pl,矩阵构成单元的程序有Make_snv_matrix.pl;
挖掘模块有程序Ex_Co_mutation.R。
1对上述程序详细说明
1.1过滤注释文件
对ANNOVAR生成的注释结果进行过滤需使用Filter_anno.pl函数。Filter_anno.pl的输入参数有两个。第一个输入参数为存放同一实验组注释文件的文件夹路径,第二个输入参数为过滤结果的输出路径。每一个注释文件需以“anno.txt”为文件结尾,否则将会报错。输入文件的列应按表1进行排列。
表1Filter_anno.pl输入文件列信息
过滤指标有ExonicFunc.refGene、genomicSuperDups、esp6500siv2_all、1000g2014oct_all几项,具体条件可以在函数内部更改。
1.2过滤vcf文件
对vcf文件的过滤需要顺序使用多个函数。第一个函数Extract_frequency.pl需要4个参数。第一个参数为存放vcf文件的文件夹路径。第二个参数为得到的下一个函数可以处理文件的输出目录。第三个参数为感兴趣组织的样本标签后缀。最后一个参数为对照组织样本标签后缀。结果文件对于每一个样本输出一个7列的文件。每一列对应的意义见表2。
表2Extract_frequency.pl输出文件的列信息
生成好频率文件需要使用Make_R_fre.R函数读入到R语言中,进行下一步处理。Make_R_fre.R需要输入的参数为Extract_frequency.pl结果所在文件目录。输出结果为R语言中类型为list的数据,其中包含n个(n=样本个数)子list,每个子list为此样本的频率等信息。
接下来使用FRE_FILTER.R程序对符合我们条件的突变位点进行过滤。FRE_FILTER.R输入的6个参数分别为:fre(Make_R_fre.R中生成的数据)、vcf_folder(存放vcf文件的文件夹路径)、outfolder(过滤后文件的存放文件夹)、blood_filter(对照组织的过滤参数)、tumor_filter(目标组织的过滤参数)。此函数输出结果为每个样本符合对照组织以及目标组织过滤条件的突变位点。Process_format.pl为将FRE_FILTER.R输出结果进行处理的函数。其输入参数为FRE_FILTER.R的outfolder文件夹路径。
经过对ANNOVAR注释文件的过滤以及vcf文件的过滤我们分别得到了对应的过滤结果。想要找到同时复合两个过滤条件的病人突变位点需使用Intersect_SNV.pl函数。由于Intersect_SNV.pl会在下一小结提及,故此处不再赘述。
通常突变频率对过滤结果影响较大,这里可以通过Test_different_frequncy.R函数辅助使用者进行频率阈值的选择。其输入参数分别为Make_R_fre.R读入的样本突变位点频率文件以及过滤得到的注释文件。
1.3进行不同实验组突变位点的描述性分析
生物学研究中往往检测了同意样本不同组织,进行对比分析。对于两个以及多个实验组样本间的突变位点的描述性分析,最主要的分析操作就是找到实验组间的交叠突变位点以及特异性(在一个实验组而不在另外一个实验组中出现)的突变位点。
Intersect_SNV.pl用来发现出现在两个实验组(A1,A2)同一病人a中的突变位点集合。输入参数为A1实验组过滤后文件路径和A2实验组过滤后路径。
Setdiff_SNV.pl用来发现在A1实验组中病人a中出现而不在A2实验组a病人样本中出现的突变位点。Setdiff_SNV.pl输入的参数1为A1实验组病人过滤得到的突变位点文件,输入参数2为A2实验组病人过滤得到的突变位点文件。
函数Stat_snv_number.pl可以对经过交叠或特异性分析的病人突变位点文件进行个数统计。输入参数为存储过滤文件的文件夹路径。
当我们要探讨群体间突变位点集合的时候,可以使用Pool_group_SNV.R函数,以及Visualize_group_reltaions.R函数。其中Pool_group_SNV.R函数可以将每个病人通过一些列运算得到的最终突变位点集合汇总成实验组群体样本的突变位点集合。其输入参数为存放每个样本突变位点文件的文件夹路径。生成R语言中群体突变位点信息,格式为“chr1 10000G T”。使用Visualize_group_relations.R函数可以通过韦恩图对实验组之间突变位点的可视化关系分析。输入参数为不同组间Pool_group_SNV.R生成的数据。
1.4互斥与共突变基因的确定
为了确定互斥与共突变基因,首先需要使用SNV2Gene.pl对每个样本的突变基因进行汇总。SNV2Gene.pl的参数有:输入过滤后的突变位点文件夹;--eachSample选项如果选择on则输出每个病人的突变基因集合,反之off则不输出。接下来使用Make_snv_matrix.pl依据实验组突变基因列表构建突变基因矩阵信息。输出结果每一行对应一个实验组突变基因,每一列对应一个样本,0表示未突变,1表示突变。之后通过Ex_Co_mutation.R对生成的突变基因矩阵进行依据Fisher精确检验的互斥以及共突变分析。输入参数为突变基因矩阵文件。输出结果为统计学显著的互斥以及突变基因对。
2运行实例数据描述
本发明的具体分析步骤如图1所示。
实例中包含了3例胃癌组织外显子组测序数据以及对应样本的癌旁正常组织的外显子组测序数据。胃癌组织数据和正常组织数据均以配对血液样本作为参考得到vcf文件。胃癌组织和正常组织的突变位点文件经过ANNOVAR注释软件进行注释。
2.1注释文件过滤
3例胃癌组织以及对应的癌旁正常组织的注释文件进行过滤分别得到对应样本的突变信息见表3。
表3Filter_anno.pl的过滤效能
2.2Vcf文件过滤
依次使用Extract_frequency.pl、Make_R_fre.R、FRE_FILTER.R、Process_format.pl几个函数对vcf文件进行过滤。图2为G1样本生成的频率截图。
经过FRE_FILTER.R过滤后的vcf文件中突变位点数量见表4。突变频率为衡量突变可靠性的重要指标,可以通过Test_different_frequncy.R函数进行变化频率对突变位点个数的分析。其中Test_different_frequncy.R输入参数为Make_R_fre.R读入的频率文件,以及过滤的注释文件。根据图3的输出图形可以选择合适的频率阈值。
表4FRE_FILTER.R的过滤效能
使用Intersect_SNV.pl取FRE_FILTER.R和Filter_anno.pl过滤结果的交叠突变位点数量见表5。
表5注释与vcf双重过滤突变位点个数
2.3进行不同实验组突变位点的描述性分析
使用Pool_group_SNV.R对肿瘤组织以及正常组织进行突变位点的汇总。对于肿瘤组织得到了722个突变位点,对于正常组织得到了507个突变位点。通过Visualize_group_relations.R对两种组织交叠突变位点进行韦恩图绘制得到结果(图4)。
2.4互斥与共突变分析
首先通过SNV2Gene.pl得到实验组突变基因的总和,前10个基因结果如图5所示。
接下来分别使用Make_snv_matrix.pl依照突变基因列表生成突变基因矩阵,如图6所示。
接下来使用Ex_Co_mutation.R函数进行基因与基因之间互斥关系的判断。这一步由于每一个基因对子需要使用fisher精确检验进行一次比较,故计算时间往往较长。本例中由于样本量较少,故计算出的统计P值较大。图7为部分结果展示。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,包括:
过滤模块,用于外显子组处理流程中的vcf文件以及ANNOVAR注释软件的输出文件,得到感兴趣组织和对照组织的突变位点的突变read数、位点测序深度、突变频率;
分析模块,用于进行不同实验组突变位点的描述性分析,找到实验组间的交叠突变位点以及特异性的突变位点,所述特异性的突变位点是指该突变位点在一个实验组出现而不在另外一个实验组中出现,所述交叠突变位点是指出现在两个实验组同一病人样本中的突变位点;
汇总模块,用于对每个样本的突变基因进行汇总,依据实验组突变基因列表构建突变基因矩阵;
挖掘模块,用于对生成的突变基因矩阵进行依据Fisher精确检验的互斥以及共突变分析,确定互斥与共突变基因;
所述过滤模块、分析模块、汇总模块、挖掘模块依次连接。
2.根据权利要求1所述的一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,所述过滤模块包括vcf文件过滤单元和ANNOVAR注释软件输出文件过滤单元;
所述 vcf文件过滤单元用于根据vcf文件过滤标准进行过滤,所述vcf文件过滤标准为:对于感兴趣组织的突变read数 >= 3, 位点测序深度 >= 8, 突变频率 >= 0.1;对于对照组织要求突变read数 < 3, 位点测序深度 >= 8, 突变频率 < 0.1;
所述ANNOVAR注释软件输出文件过滤单元的过滤标准为:突变位于外显子区域;突变位点不能位于染色体高度重复区域;esp数据库中的群体变异频率低于5%;在千人基因组计划中的变异频率低于5%。
3.根据权利要求1所述的一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,所述分析模块包括突变位点发现单元和制图单元,所述突变位点发现单元用于找到实验组之间特异性的突变位点以及实验组之间的交叠突变位点,所述制图单元用于将突变位点通过Venn图的方式进行展示。
4.根据权利要求3所述的一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,所述突变位点发现单元包括交叠突变位点子单元和特异突变位点子单元、以及统计子单元;所述交叠突变位点子单元用于发现出现在两个实验组同一病人样本中的突变位点集合;所述特异突变位点子单元用于发现在一实验组中病人样本中出现而不在另一实验组同一病人样本中出现的突变位点;所述统计子单元对经过交叠或特异性分析的病人突变位点文件进行个数统计。
5.根据权利要求3所述的一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,所述制图单元包括集合子单元和可视化子单元;所述集合子单元用于将每个病人通过一些列运算得到的最终突变位点集合汇总成实验组群体样本的突变位点集合;所述可视化子单元用于通过韦恩图对集合子单元的数据进行可视化关系分析。
6.根据权利要求1所述的一种肿瘤突变位点筛选及互斥基因挖掘的系统,其特征在于,所述汇总模块包括基因汇总单元和矩阵构成单元;所述基因汇总单元用于对每个样本的突变基因进行汇总,所述矩阵构成单元用于构建突变基因矩阵信息,输出结果每一行对应一个实验组突变基因,每一列对应一个样本,0表示未突变,1表示突变。
CN201610319437.0A 2016-05-13 2016-05-13 一种肿瘤突变位点筛选及互斥基因挖掘的系统 Expired - Fee Related CN106022001B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610319437.0A CN106022001B (zh) 2016-05-13 2016-05-13 一种肿瘤突变位点筛选及互斥基因挖掘的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610319437.0A CN106022001B (zh) 2016-05-13 2016-05-13 一种肿瘤突变位点筛选及互斥基因挖掘的系统

Publications (2)

Publication Number Publication Date
CN106022001A CN106022001A (zh) 2016-10-12
CN106022001B true CN106022001B (zh) 2018-09-18

Family

ID=57100763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610319437.0A Expired - Fee Related CN106022001B (zh) 2016-05-13 2016-05-13 一种肿瘤突变位点筛选及互斥基因挖掘的系统

Country Status (1)

Country Link
CN (1) CN106022001B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980763B (zh) * 2017-03-30 2020-04-28 大连理工大学 一种基于基因突变频率的癌症驱动基因的筛选方法
CN108647496B (zh) * 2018-04-18 2019-07-02 成都仕康美生物科技有限公司 动态搜索变异基因的方法、装置及计算机可读存储介质
CN109727644B (zh) * 2018-11-12 2021-09-07 山东省医学科学院基础医学研究所 基于微生物基因组二代测序数据的Venn图制作方法及系统
CN110010197B (zh) * 2019-03-29 2021-07-20 深圳裕策生物科技有限公司 基于血液循环肿瘤dna的单核苷酸变异检测方法、装置和存储介质
CN109943637A (zh) * 2019-04-12 2019-06-28 福建医科大学孟超肝胆医院(福州市传染病医院) 一种基于循环肿瘤dna突变检测的肝癌诊断及预后评估系统
CN112735594B (zh) * 2020-12-29 2024-04-16 北京优迅医疗器械有限公司 一种筛选疾病表型相关突变位点的方法及其应用
CN117558342A (zh) * 2023-10-19 2024-02-13 上海生物芯片有限公司 基于分子遗传标记多样性的品种鉴定分析系统、方法、终端及云平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103290137A (zh) * 2013-06-26 2013-09-11 北京迈基诺基因科技有限责任公司 一种肿瘤易感基因的筛查方法
CN104160391A (zh) * 2011-09-16 2014-11-19 考利达基因组股份有限公司 确定异质样本的基因组中的变异
CN105512509A (zh) * 2014-09-24 2016-04-20 中国科学院上海高等研究院 互斥性转录因子调控网络下的肿瘤标识物挖掘系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8859198B2 (en) * 2006-06-06 2014-10-14 Abl Sa Detection and use of antiviral resistance mutations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160391A (zh) * 2011-09-16 2014-11-19 考利达基因组股份有限公司 确定异质样本的基因组中的变异
CN103290137A (zh) * 2013-06-26 2013-09-11 北京迈基诺基因科技有限责任公司 一种肿瘤易感基因的筛查方法
CN105512509A (zh) * 2014-09-24 2016-04-20 中国科学院上海高等研究院 互斥性转录因子调控网络下的肿瘤标识物挖掘系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Small CGG repeat expansion alleles of FMR1 gene are associated with parkinsonism";DZ Loesch et al;《Clinical Genetics》;20091130;第76卷(第5期);471-476 *
"Using expression profiling data to identify human microRNA targets";Jim C Huang et al;《NATURE METHODS》;20071231;第4卷(第12期);1045-1049 *
"全基因组关联分析在乳腺癌易感位点筛选中的应用";王丽 等;《癌症进展》;20110531;第9卷(第3期);298-301 *

Also Published As

Publication number Publication date
CN106022001A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106022001B (zh) 一种肿瘤突变位点筛选及互斥基因挖掘的系统
CN106021994B (zh) 一种肿瘤突变位点筛选及互斥基因挖掘的方法
Ding et al. Expanding the computational toolbox for mining cancer genomes
CN106909806B (zh) 定点检测变异的方法和装置
CN113257350B (zh) 基于液体活检的ctDNA突变程度分析方法和装置、ctDNA性能分析装置
US20040241730A1 (en) Visualizing expression data on chromosomal graphic schemes
Chen et al. GeneFuse: detection and visualization of target gene fusions from DNA sequencing data
Pisapia et al. Next generation sequencing in cytopathology: focus on non-small cell lung cancer
CN112088220B (zh) 替代标志物及用于肿瘤突变负荷测定的方法
CN110093417A (zh) 一种检测肿瘤单细胞体细胞突变的方法
CN106778066A (zh) 一种非小细胞肺癌相关癌基因筛选与功能分析方法
CN110021346A (zh) 基于RNAseq数据的基因融合与突变检测方法及系统
CN109943637A (zh) 一种基于循环肿瘤dna突变检测的肝癌诊断及预后评估系统
CN110603594A (zh) 用于基因组删减和处置选择的交互式精确医学探查器
EP4315340A1 (en) A precision medicine portal for human diseases
Smith et al. Assessment of latent factors contributing to error: addressing surgical pathology error wisely
CN107451422A (zh) 一种基因序列数据分析与在线交互可视化的方法
CN112292730B (zh) 具有用于解释和可视化数据的改进的用户界面的计算设备
CN108229100A (zh) Dna重排区域及相应rna产物检测方法、设备以及存储介质
CN105528532A (zh) 一种rna编辑位点的特征分析方法
CN116312807A (zh) 一种预测非小细胞肺癌免疫治疗疗效的早期预测评估方法
Luthra et al. Computational methods and translational applications for targeted next‐generation sequencing platforms
Vats et al. Case study: Systematic detection and prioritization of gene fusions in cancer by RNA-Seq: A DIY toolkit
Depuydt et al. Pan-genome de Bruijn graph using the bidirectional FM-index
Hou et al. Stratification of estrogen receptor-negative breast cancer patients by integrating the somatic mutations and transcriptomic data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180918