CN105861696B - 一种基于转录组的肿瘤转移基因检测系统 - Google Patents

一种基于转录组的肿瘤转移基因检测系统 Download PDF

Info

Publication number
CN105861696B
CN105861696B CN201610318603.5A CN201610318603A CN105861696B CN 105861696 B CN105861696 B CN 105861696B CN 201610318603 A CN201610318603 A CN 201610318603A CN 105861696 B CN105861696 B CN 105861696B
Authority
CN
China
Prior art keywords
genes
gene
primary
expression
metastasis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610318603.5A
Other languages
English (en)
Other versions
CN105861696A (zh
Inventor
薛成海
马熹
俞丽佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wan Kangyuan (tianjin) Gene Technology Co Ltd
Original Assignee
Wan Kangyuan (tianjin) Gene Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wan Kangyuan (tianjin) Gene Technology Co Ltd filed Critical Wan Kangyuan (tianjin) Gene Technology Co Ltd
Priority to CN201610318603.5A priority Critical patent/CN105861696B/zh
Publication of CN105861696A publication Critical patent/CN105861696A/zh
Application granted granted Critical
Publication of CN105861696B publication Critical patent/CN105861696B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明提供了一种基于转录组的肿瘤转移基因检测系统,包括整合模块,用于整合Read计数矩阵,得到每个基因的差异表达程度的统计量文件;识别模块,用于识别差异表达基因,比较肿瘤原发和转移条件下的功能的差异程度;分析模块,用于分析基因表达模式,进行表达模式的分类及分析;标记模块,用于标记肿瘤转移基因;所述整合模块、识别模块、分析模块、标记模块依次连接。本发明用于解决从高通量的数据中挖掘肿瘤转移相关的基因,分析原发与转移癌症中转录组的异常变化以及转移过程中肿瘤转移标记基因表达模式的动态改变。

Description

一种基于转录组的肿瘤转移基因检测系统
技术领域
本发明属于基因信息数据处理领域,特别是涉及到一种基于转录组的肿瘤转移基因检测系统。
背景技术
癌症相关的死亡个体中,90%都是由于肿瘤转移造成的。这就强调了肿瘤转移对于病人的巨大危害性,同时也说明了通过预测肿瘤转移的风险以及提早预防肿瘤转移来降低癌症的死亡率的重要性。但是我们目前对于癌症转移的分子机制了解还是很少的。基于芯片的研究表明通过分析标志基因的表达(gene expression signatures)可以在肿瘤的早期诊断中预测病人的临床表型。同样利用标志基因的表达可以帮助分析病人的转移风险。这些标志基因可以作为转移的标记(metastatic signature)。但是人们对于肿瘤转移的机制和肿瘤转移相关的基因的了解还不够深入。
转录组测序是近些年开发的高通量测序技术的方法,用于刻画特定条件下的转录组。通过转录组分析,可以精确地识别可变剪切、发现新的启动子、识别基因的融合、检测和定量新颖的转录本及亚型等。因此,通过转录组分析刻画肿瘤的转录组的异常,可以帮助人们理解肿瘤的发病机制。目前转录组分析已经广泛的应用于肿瘤相关领域的分析。所以通过刻画原发癌症与转移癌症的转录组的差异可以帮我们寻找转移的标记基因,进而用于预测肿瘤的转移。相比于基因芯片和EST技术用于研究基因的表达,转录组分析覆盖的基因更多、更全面,可以发现与肿瘤转移相关的新基因,并且同时可以精确的定量肿瘤转移基因的表达水平的改变。但是现在还没有专门的方法用于基于高通量测序技术的产生的海量数据中来挖掘肿瘤转移相关的标记基因并且刻画这些基因在肿瘤转移过程中表达水平的改变。
发明内容
有鉴于此,本发明提出一种基于转录组的肿瘤转移基因检测系统,用于解决从高通量的数据中挖掘肿瘤转移相关的基因,分析原发与转移癌症中转录组的异常变化以及转移过程中肿瘤转移标记基因表达模式的动态改变。
为达到上述目的,本发明的技术方案是这样实现的:一种基于转录组的肿瘤转移基因检测系统,包括:
整合模块,用于整合Read计数矩阵,得到每个基因的差异表达程度的统计量文件;
识别模块,用于识别差异表达基因,比较肿瘤原发和转移条件下的功能的差异程度;
分析模块,用于分析基因表达模式,进行表达模式的分类及分析;
标记模块,用于标记肿瘤转移基因;
所述整合模块、识别模块、分析模块、标记模块依次连接。
进一步的,所述整合模块包括DESeq2.r单元和readcount.r单元;
所述DESeq2.r单元用于合并HTseq输出的每个基因在一个样本中的read计数矩阵,并且进行基因在肿瘤与正常状态下的表达改变的程度的计算;输入读取转录组组测序数据处理流程的结果文件,将每个样本read计数文件合并,得到read计数矩阵文件和基因表达的差异;
所述readcount.r单元用于以单个样本的read计数文件为输入,首先针对每个基因合并其在所有样本中的read计数,得到样本-基因read计数矩阵,随后对矩阵进行过滤,最终完成数据整合,并且进行肿瘤转录组的分类统计。
更进一步的,所述DESeq2.r单元包括count_matrix子单元和DEGseq子单元,所述count_matrix子单元用来构建所有样本的全部基因的read计数矩阵,所述DEGseq子单元基于上述的read计数矩阵文件进行基因表达改变程度的计算。
进一步的,所述识别模块包括diffGene_analysis.r单元、diffExp_analysis.r单元、diffExp_function.r单元;所述diffGene_analysis.r单元用于执行基因表达差异的计算,得到基因差异程度列表筛选差异表达的基因,并且随后对差异基因进行分类和可视化其差异程度;所述diffExp_analysis.r单元用于得到基因在肿瘤与正常状态下的基因差异程度列表,并且给出差异表达基因在样本中的热图;所述diffExp_function.r单元用于进行差异表达的功能的富集分析,以及比较肿瘤原发和转移条件下的功能的差异程度。
更进一步的,所述diffGene_analysis.r单元包括diffExpGene子单元和diffExpAnalysis子单元,所述diffExpGene子单元用于执行基因表达差异的计算,所述diffExpAnalysis子单元用于利用上述得到的每个基因的差异表达程度的统计量文件,从中筛选出具有统计学意义的差异表达的基因,并且基于已知的基因注释对差异表达基因进行分类和表达改变程度的可视化。
相对于现有技术,本发明所述的一种基于转录组的肿瘤转移基因检测系统具有以下优势:
本发明以常见转录组测序流程处理的输出结果(例如read计数文件)作为输入,完成数据read计数的整合,差异基因的筛选,分析基因表达模式,比较原发与转移的转录组差异,给出潜在肿瘤转移基因候选集。本发明基于转录组的肿瘤转移基因检测结果,承接转录组测序流程处理,输出潜在肿瘤转移基因候选集,完成肿瘤转移标记基因挖掘工作中重要的一环,用于解决从高通量的数据中挖掘肿瘤转移相关的基因,分析原发与转移癌症中转录组的异常变化以及转移过程中肿瘤转移标记基因表达模式的动态改变。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的流程示意图。
图2为本发明实施例的乳腺癌转录组基因的分类柱状图。
图3为本发明实施例的乳腺癌不同差异表达基因的交集的韦恩图。
图4为本发明实施例的乳腺癌不同差异表达基因的功能富集分析比较。
图5为本发明实施例的不同类别的基因富集到的功能的共享热图。
图6为本发明实施例的肿瘤转移的标记基因在样本中的表达值。
图7为本发明实施例的上调的肿瘤转移的标记基因富集到的GO功能和KEGG通路。
具体实施方式
需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
图1所示为本软件系统的算法流程,本发明架构如下:
1、Read计数矩阵的整合模块
整合模块设有DESeq2.r单元,是用来合并HTseq输出read计数矩阵,并且进行基因表达改变计算。主要包括两个子单元count_matrix,DEGseq。
整合模块还设有readcount.r单元用于以单个样本的read计数文件为输入,首先针对每个基因合并其在所有样本中的read计数,得到样本-基因read计数矩阵,随后对矩阵进行过滤,最终完成数据整合,并且进行肿瘤转录组的分类统计。
其中count_matrix用来构建所有样本的全部基因的read计数矩阵,共有6个参数:
参数1为测序流程处理结果的目录,即每个样本的read计数文件地址,命名格式为.trans.readcount,该文件包含基因名称及相应的存储结构,每行记录一个基因及其在该样本中对应的read计数。
参数2为样本列表,一行一个样本,第一列为样本的名字。格式为:
Sample1
Sample2
Sample3
参数3为结果输出目录,参数4是每个样本的read计数文件所在的子目录,参数5表示每个样本的read计数文件的后缀名,参数6表示每个样本的read计数文件中,基因的的开头的名字,例如ENSEMBL基因为“ENSG”。
该函数返回来所有样本的read计数矩阵文件和Rdata文件。值得注意的是,read计数矩阵文件中有些基因的表达在所有样本都是0,这种在后续的差异表达计算的过程中需要过滤。
DEGseq主要是基于上述的read计数矩阵文件进行基因表达改变程度的计算。主要包括3个参数:
参数1是read计数矩阵文件所在的地址。文件的格式要求行为每个基因在所有样本中的read计数;
参数2表示样本的表形矩阵。注意,该文件每一行代表一个样本,行名需要与read计数矩阵的列名一致;第二列为每个样本的类标签(切记类标签必须为因子类型,且第一个因子必须为对照组,这样方便后期解释结果。
参数3是结果文件的输出。该函数返回计算的每个基因的差异表达程度的统计量文件,每个基因的read计数经过文库标准化以后的表达值文件以及过滤了在所有样本read计数都是0的基因的新的read计数文件。
2、差异表达基因的识别模块
识别模块设有diffExp_analysis.r单元,是为了识别在肿瘤与正常状态下的差异基因列表,并且给出差异表达基因在样本中的热图。该脚本主要是调用识别模块中的diffGene_analysis.r单元中计算差异程度的函数diffExpGene子单元和diffExpAnalysis子单元。diffExpAnalysis子单元主要是利用上述得到的每个基因的差异表达程度的统计量文件,从中筛选出具有统计学意义的差异表达的基因,并且基于已知的基因注释对差异表达基因进行分类和表达改变程度的可视化。其主要包括4个参数:
参数1表示要求差异表达的基因在肿瘤组与对照组中fc(fold change)值改变的最小值。
参数2表示差异表达基因的最小fdr值
参数3表示是否进行热图的展示。
参数4表示差异表达的diffResults.RData的所在的目录,以及结果的输出路径。
该函数返回差异表达的基因列表,不同类别的差异表达基因,差异程度的可视化热图。
识别模块还设有diffExp_function.r单元,主要是利用上述得到的差异表达基因列表进行功能的富集分析,以及比较肿瘤原发和转移条件下的功能的差异程度,即肿瘤原发和转移的差异基因共享和特异的GO功能和通路。
3、基因表达模式的分析模块
所述分析模块设有exp_pattern.r单元,主要是利用肿瘤原发和转移条件下的差异的编码基因的并集进行表达模式的分类,并且对每一类基因进行功能富集分析。函数的输入为上述产生的差异表达的编码基因文件,标准化以后的基因的表达值,以及基因在原发和转移过程中的差异改变的程度。函数返回每一类别的基因在肿瘤原发与转移中fc,每一类基因在样本中的表达水平,每一类基因富集到的功能和通路,以及功能之间的比较和聚类图。
具体原理及说明:
原发肿瘤到转移的过程中涉及到复杂的基因表达的改变,但是通过比较原发肿瘤和转移的异常的转录组可以刻画不同基因的表达模式的改变,进而分析转移过程中基因的动态的表达。表达模式的动态性刻画可以分为以下几个步骤来完成:
首先获原发的差异基因的fc和转移与原发的差异基因的fc。在筛选差异表达基因的过程中要求基因在正常和肿瘤状态下的fc大于2,差异的显著性fdr小于0.05。此外,还需要获得转移肿瘤与原发肿瘤的基因表达的改变的fc值。
其次,合并原发和转移的差异表达基因,按照基因在原发中的fc和转移肿瘤与原发肿瘤的基因表达的改变的fc值将基因分成9类,分别为:up_up,up_invar,up_down,down_up,down_invar,down_down,invar_up,invar_down,invar_invar。每种类别的基因的意义如下:
up_up:表示在转移过程中呈现出持续上调的基因。这些基因在原发与转移中持续上调,是致癌基因,并且在转移中表达更加强烈,是转移的强促癌基因。
up_invar:这种类型的基因在原发与转移中都上调,但是二者的上调幅度相当,是中度的癌基因;
up_down:这些基因在原发中上调,在转移中下调,应该是原发中具有促进的功能,但是转移中不需要高表达的基因;
down_up:类别的基因在原发中下调,转移中上调;
down_invar:这种基因在原发与转移中都呈现出下调趋势;
down_down:这些基因在原发与转移过程中持续下调,是抑制癌基因
invar_up:这些基因在转移中呈现上调模式。
invar_down:这些基因在转移中呈现下调模式。
invar_invar:是只在转移中呈现出差异,而原发中不差异的基因。
然后,获得每一类别中所有基因的表达值,可视化这些类别的基因在肿瘤转移过程中的表达水平的动态性改变。
最后,对每一类基因分别进行功能的分析,主要是利用类内的基因进行GO功能和KEGG富集分析,进而从功能层面证明每一类别的基因在肿瘤的转移过程中的功能上的改变。
4、肿瘤转移的基因标记模块
所述基因标记模块设有M_signature.r单元,主要通过标胶转移肿瘤和原发肿瘤中,转移肿瘤独有的差异表达基因来进行筛选转移中的标记基因。函数的出入文件为原发肿瘤和转移肿瘤的差异表达基因的列表以及基因标准化以后的表达值。
具体原理及说明:
为了找出肿瘤转移相关的标记基因,从而探索肿瘤转移的过程,这里借助于利用原发肿瘤和转移肿瘤的数据进行分析。
首先分别获得肿瘤原发和转移肿瘤相对于正常组织的差异基因的列表。
其次,要求肿瘤转移相关的标记基因不在原发样本差异,只在转移肿瘤中呈现出差异的基因。
随后,根据这些候选的肿瘤转移的标记基因在转移肿瘤中的表达改变的fc分成上调的肿瘤转移标记基因和下调的标记基因。并且获得这些基因在原发肿瘤,和转移肿瘤中的表达值。可视化这些基因的表达的动态性改变。
最后,分别对上下调的肿瘤转移基因进行GO功能和KEGG富集分析。
下面通过一个乳腺癌病人的癌旁,原发,以及转移样本的转录组数据测序数据为应用实例,展示本发明的软件系统运行结果。这里使用Normal表示病人的癌旁组织,Primary表示病人的原发肿瘤,Metastatic表示病人的转移肿瘤。该数据的测序流程处理结果统计表4.1。
表4.1转录组测序流程处理结果统计
在本发明的系统中,测序流程处理结果共包含4个文件,依次按照函数的参数运行readcount.r,diffExp_analysis.r,diffExp_function.r,exp_pattern.r和M_signature.r,,得到如下结果:
(1)将所有的样本的合在一起分析乳腺癌组织的转录组,要求基因上面至少具有一个read。乳腺癌组织的转录组共包括31948个基因,其中,编码基因占据最大的比例57%,其次是lncRNA 23%。值得注意的是,1415个smRNA也呈现出表达(有可能是smRNA的前体,因为smRNA的长度较短)。对于lncRNA来说,基因间区的比例最大43%。图2展示了乳腺癌转录组基因的分类柱状图;
(2)对于原发肿瘤与转移肿瘤分别与癌旁组织进行差异表达,这里统一要求foldchange大于等于2。图3展示了不同癌症部位之间的差异因交集展示;图4不同癌症部位之间的差异因的富集到的GO功能的展示;可以发现这些部位的差异表达基因具有很大的交集,但是同时他们都有自己独特表达的基因。功能的分析也是类似的结论,转移肿瘤中具有独特的功能。这暗示了转移具有自己独特的标记基因的表达。
(3)分析转移过程中基因表达的模式。使用原发与转移所有的差异基因,利用原发的差异基因的fc和转移与原发的差异基因的fc进行分类。同一类基因在不同的样本中具有动态的表达。图5展示不同类别的基因富集到的功能的共享热图,白色表示该类别的基因没有富集到该功能,深色的表示富集到该功能。
(4)识别肿瘤转移的标记基因,这里共找到了47个肿瘤转移的候选标记基因。图6展示的是找到的肿瘤转移的标记基因在样本中的表达值,左边是上调的基因,右边是下调的基因;图7展示的是上调的肿瘤转移的标记基因富集到的GO功能和KEGG通路。
由表达可知,这些转移相关的基因在转移的样本中呈现出高度的失调。
对这些差异基因进行功能富集分析,上调基因富集到迁移粘附的功能和通路,下调的基因富集到免疫等功能。这说明了这些肿瘤转移的标记基因在肿瘤转移的过程中具有很重要的功能。也证明了他们在转移过程中的动态的表达模式以及其与转移的密切关系。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于转录组的肿瘤转移基因检测系统,其特征在于,包括:
整合模块,用于整合Read计数矩阵,得到每个基因的差异表达程度的统计量文件;
识别模块,用于识别差异表达基因,比较肿瘤原发和转移条件下的功能的差异程度;
分析模块,用于分析基因表达模式,进行表达模式的分类及分析;
标记模块,用于标记肿瘤转移基因;
所述整合模块、识别模块、分析模块、标记模块依次连接;
所述整合模块包括DESeq2.r单元和readcount.r单元;
所述DESeq2.r单元用于合并HTseq输出的每个基因在一个样本中的read计数矩阵,并且进行基因在肿瘤与正常状态下的表达改变的程度的计算;输入读取转录组组测序数据处理流程的结果文件,将每个样本read计数文件合并,得到read计数矩阵文件和基因表达的差异;
所述readcount.r单元用于以单个样本的read计数文件为输入,首先针对每个基因合并其在所有样本中的read计数,得到样本-基因read计数矩阵,随后对矩阵进行过滤,最终完成数据整合,并且进行肿瘤转录组的分类统计;
所述识别模块包括diffGene_analysis.r单元、diffExp_analysis.r单元、diffExp_function.r单元;所述diffGene_analysis.r单元用于执行基因表达差异的计算,得到基因差异程度列表筛选差异表达的基因,并且随后对差异基因进行分类和可视化其差异程度;所述diffExp_analysis.r单元用于得到基因在肿瘤与正常状态下的基因差异程度列表,并且给出差异表达基因在样本中的热图;所述diffExp_function.r单元用于进行差异表达的功能的富集分析,以及比较肿瘤原发和转移条件下的功能的差异程度;
所述分析模块包括exp_pattern.r单元,主要是利用肿瘤原发和转移条件下的差异的编码基因的并集进行表达模式的分类,并且对每一类基因进行功能富集分析;函数的输入为上述产生的差异表达的编码基因文件,标准化以后的基因的表达值,以及基因在原发和转移过程中的差异改变的程度;函数返回每一类别的基因在肿瘤原发与转移中fc,每一类基因在样本中的表达水平,每一类基因富集到的功能和通路,以及功能之间的比较和聚类图:
首先获原发的差异基因的fc和转移与原发的差异基因的fc;在筛选差异表达基因的过程中要求基因在正常和肿瘤状态下的fc大于2,差异的显著性fdr小于0.05;此外,还需要获得转移肿瘤与原发肿瘤的基因表达的改变的fc值;
其次,合并原发和转移的差异表达基因,按照基因在原发中的fc和转移肿瘤与原发肿瘤的基因表达的改变的fc值将基因分成9类,分别为:up_up,up_invar,up_down,down_up,down_invar,down_down,invar_up,invar_down,invar_invar;每种类别的基因的意义如下:
up_up:表示在转移过程中呈现出持续上调的基因;这些基因在原发与转移中持续上调,是致癌基因,并且在转移中表达更加强烈,是转移的强促癌基因;
up_invar:这种类型的基因在原发与转移中都上调,但是二者的上调幅度相当,是中度的癌基因;
up_down:这些基因在原发中上调,在转移中下调,是原发中具有促进的功能,但是转移中不需要高表达的基因;
down_up:类别的基因在原发中下调,转移中上调;
down_invar:这种基因在原发与转移中都呈现出下调趋势;
down_down:这些基因在原发与转移过程中持续下调,是抑制癌基因;
invar_up:这些基因在转移中呈现上调模式;
invar_down:这些基因在转移中呈现下调模式;
invar_invar:是只在转移中呈现出差异,而原发中不差异的基因;
然后,获得每一类别中所有基因的表达值,可视化这些类别的基因在肿瘤转移过程中的表达水平的动态性改变;
最后,对每一类基因分别进行功能的分析,主要是利用类内的基因进行GO功能和KEGG富集分析,进而从功能层面证明每一类别的基因在肿瘤的转移过程中的功能上的改变。
2.根据权利要求1所述的一种基于转录组的肿瘤转移基因检测系统,其特征在于,所述DESeq2.r单元包括count_matrix子单元和DEGseq子单元,所述count_matrix子单元用来构建所有样本的全部基因的read计数矩阵,所述DEGseq子单元基于上述的read计数矩阵文件进行基因表达改变程度的计算。
3.根据权利要求1所述的一种基于转录组的肿瘤转移基因检测系统,其特征在于,所述diffGene_analysis.r单元包括diffExpGene子单元和diffExpAnalysis子单元,所述diffExpGene子单元用于执行基因表达差异的计算,所述diffExpAnalysis子单元用于利用上述得到的每个基因的差异表达程度的统计量文件,从中筛选出具有统计学意义的差异表达的基因,并且基于已知的基因注释对差异表达基因进行分类和表达改变程度的可视化。
CN201610318603.5A 2016-05-13 2016-05-13 一种基于转录组的肿瘤转移基因检测系统 Expired - Fee Related CN105861696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610318603.5A CN105861696B (zh) 2016-05-13 2016-05-13 一种基于转录组的肿瘤转移基因检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610318603.5A CN105861696B (zh) 2016-05-13 2016-05-13 一种基于转录组的肿瘤转移基因检测系统

Publications (2)

Publication Number Publication Date
CN105861696A CN105861696A (zh) 2016-08-17
CN105861696B true CN105861696B (zh) 2019-12-06

Family

ID=56632094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610318603.5A Expired - Fee Related CN105861696B (zh) 2016-05-13 2016-05-13 一种基于转录组的肿瘤转移基因检测系统

Country Status (1)

Country Link
CN (1) CN105861696B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709275A (zh) * 2017-02-04 2017-05-24 上海喆之信息科技有限公司 一种限制型心肌病基因数据处理装置
CN107203703A (zh) * 2017-05-22 2017-09-26 人和未来生物科技(长沙)有限公司 一种转录组测序数据计算解读方法
CN113345526B (zh) * 2021-03-22 2023-10-17 中山大学 肿瘤转录组多模式信息分析平台PipeOne及其构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101336300A (zh) * 2005-12-16 2008-12-31 健泰科生物技术公司 神经胶质瘤的诊断、预后和治疗方法
CN104657628A (zh) * 2015-01-08 2015-05-27 深圳华大基因科技服务有限公司 基于Proton的转录组测序数据的比较分析方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6825320B1 (en) * 1995-03-29 2004-11-30 Millenium Pharmaceuticals, Inc. FOHY03 polypeptides

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101336300A (zh) * 2005-12-16 2008-12-31 健泰科生物技术公司 神经胶质瘤的诊断、预后和治疗方法
CN104657628A (zh) * 2015-01-08 2015-05-27 深圳华大基因科技服务有限公司 基于Proton的转录组测序数据的比较分析方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肺腺癌及其脑转移肿瘤组织的转录组测序研究;时景伟 等;《中华实验外科杂志》;20150930;第32卷(第9期);第2267-2268页 *

Also Published As

Publication number Publication date
CN105861696A (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
Eulenberg et al. Reconstructing cell cycle and disease progression using deep learning
US11636288B2 (en) Platform, device and process for annotation and classification of tissue specimens using convolutional neural network
Yuan et al. Quantitative image analysis of cellular heterogeneity in breast tumors complements genomic profiling
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
Kumar et al. Automated analysis of immunohistochemistry images identifies candidate location biomarkers for cancers
AU2018374207A1 (en) Detecting intratumor heterogeneity of molecular subtypes in pathology slide images using deep-learning
CN105861696B (zh) 一种基于转录组的肿瘤转移基因检测系统
Gong et al. lncRNA-screen: an interactive platform for computationally screening long non-coding RNAs in large genomics datasets
Targonski et al. Uncovering biomarker genes with enriched classification potential from Hallmark gene sets
CN111180013B (zh) 检测血液病融合基因的装置
CN112397153A (zh) 一种用于预测食管鳞癌预后的生物标志物的筛选方法
Feng et al. An accurate regression of developmental stages for breast cancer based on transcriptomic biomarkers
Sung et al. The expression pattern of 19 genes predicts the histology of endometrial carcinoma
Faust et al. Integrating morphologic and molecular histopathological features through whole slide image registration and deep learning
CN114974432A (zh) 一种生物标志物的筛选方法及其相关应用
CN105975812A (zh) 一种基于转录组的肿瘤转移基因检测方法
Jang et al. Identification of cancer-driver genes in focal genomic alterations from whole genome sequencing data
Baheti et al. Prognostic stratification of glioblastoma patients by unsupervised clustering of morphology patterns on whole slide images furthering our disease understanding
Yang et al. SMART: reference-free deconvolution for spatial transcriptomics using marker-gene-assisted topic models
Osher et al. SPARTIN: a Bayesian method for the quantification and characterization of cell type interactions in spatial pathology data
US20230282353A1 (en) Multitier classification scheme for comprehensive determination of cancer presence and type based on analysis of genetic information and systems for implementing the same
CN112037854B (zh) 一种基于甲基化芯片数据获取肿瘤甲基化标记物的方法及系统
US10867208B2 (en) Unbiased feature selection in high content analysis of biological image samples
US11935627B2 (en) System and method for text-based biological information processing with analysis refinement
Ghaleb et al. Bladder Cancer Microarray Analysis and Biomarker Discovery Using Machine Learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191206