CN109063415A - 一种定义功能子通路扰动程度的方法 - Google Patents

一种定义功能子通路扰动程度的方法 Download PDF

Info

Publication number
CN109063415A
CN109063415A CN201810588800.8A CN201810588800A CN109063415A CN 109063415 A CN109063415 A CN 109063415A CN 201810588800 A CN201810588800 A CN 201810588800A CN 109063415 A CN109063415 A CN 109063415A
Authority
CN
China
Prior art keywords
channel
function
sub
disruption
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810588800.8A
Other languages
English (en)
Inventor
刘文斌
鮑振申
昝乡镇
沈良忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201810588800.8A priority Critical patent/CN109063415A/zh
Publication of CN109063415A publication Critical patent/CN109063415A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种定义功能子通路扰动程度的方法,其特点是:所述功能子通路是指信号通路中,能够将上游信号传递到一个具体的生物功能节点的所有基因构成的路径,定义功能子通路的扰动程度的方法包括如下步骤:①构建一个通路中所有特定功能子通路;②确定相关的差异基因;③将所述差异基因映射到每个功能子通路,并利用超几何检验确定差异基因的显著性p值;④计算每个功能子通路的扰动程度;⑤计算所有子通路中对于特定功能f的扰动程度。本发明提出了功能扰动程度的概念,并提出了量化了功能子通路及功能的扰动程度的方法。在此基础上,对研究各种功能不平衡与疾病的关系起到重要作用。

Description

一种定义功能子通路扰动程度的方法
技术领域
本发明涉及基因检测技术领域,尤其涉及一种定义功能子通路扰动程度的方法。
背景技术
疾病的产生是由于信号通路异常引起的功能异常、功能不平衡,例如细胞增殖和细胞凋亡的平衡打破,就有可能导致相应疾病的发生。所谓功能失衡,可以理解为,一个功能的异常与疾病相关,单功能之间往往有制约关系,如常见的细胞增生与凋亡是二个相反的功能,他们之间的不平衡更是疾病参数的重要原因。在已有的研究中,多数疾病相关通路的识别主要专注于信号通路异常,以及相关的子通路异常。
KEGG(京都基因与基因组百科全书)是一个由基因组、生物途径、药物和化学物质等信息的数据库。KEGG常用于生物信息学研究和教育研究,其中基因组学、元基因组学、代谢组学等相关的数据库主要用于癌症分类相关研究。在KEGG数据库中,一个信号通路的下游节点往往导致多个不同的细胞功能,如MAPK通路,其中包括细胞增生,发炎,分化和凋亡等功能。为了研究差异基因导致的通路信号异常,信号传导异常导致的功能异常及失衡,发明人提出了功能子通路的概念。
在KEGG数据库中,通路上的功能包括约300个具体功能,这些功能往往与细胞完成的各种细胞过程密切相关,它们的异常及失衡是疾病产生的主要原因。一个子通路的异常往往与该子通路上的差异基因的个数有关,简单说,差异基因越多,该功能子通路的扰动程度越大。通过确定功能子通路的扰动程度,我们可以研究功能扰动程度与疾病的关系。
发明内容
本发明的目的在提出一种定义功能子通路扰动程度的方法,通过量化功能子通路的扰动程度,已达到更准确地研究扰动程度与相关疾病的关系。
一种定义功能子通路扰动程度的方法。所述功能子通路是指信号通路中,能够将上游信号传递到一个具体的生物功能节点的所有基因构成的路径,定义功能子通路的扰动程度的方法包括如下步骤:
①构建所述功能子通路;
②确定相关的差异基因;
③将所述差异基因映射到每个功能子通路,并利用超几何检验确定差异基因的显著性p值;
④计算每个功能子通路的扰动程度,扰动程度PT=-log10p;
⑤计算对于所述功能子通路的特定功能f而言所述功能子通路的扰动程度,扰动程度其中k是指总的功能f所对应的子通路的数量。
本发明进一步设置为,步骤①中所述构建功能子通路的方法,包括有根据KEGG数据库构建功能子通路,在所述KEGG数据库中,一个功能对应至少一个子通路。
本发明进一步设置为,步骤③中确定相关的差异基因的方法包括有根据Limma包确定差异基因。
采用这样的方法,发明人提出的功能子通路及其扰动程度的概念,可以对差异基因与单个功能上的功能扰动,功能间的功能失衡(功能间)以及疾病间关系进行系统的研究。研究人员能够通过量化功能子通路的扰动程度,判断信号传导异常导致的功能异常与失衡情况,并借此来确定其对相关疾病的影响。
附图说明
图1为定义功能子通路扰动程度的步骤示意图;
图2为功能A功能B功能C的功能子通路示例;
图3为相关功能子通路的扰动程度结果;
图4为细胞增殖与凋亡的扰动程度对比示意图,其中apoptosis是指细胞凋亡,cell proliferation是指细胞增殖,而图中的GSE4107,GSE4183.GSE18842,GSE15471.GSE16515是指不同的数据集。
具体实施方式
下面,通过示例性的实施方式对本发明具体描述。然而应当理解,在没有进一步叙述的情况下,本具体实例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。
一种定义功能子通路扰动程度的方法。所述功能子通路是指信号通路中,能够将上游信号传递到一个具体的生物功能节点的所有基因构成的路径,定义功能子通路的扰动程度的方法包括如下步骤:
S1:构建所述功能子通路;从KEGG数据库中下载212条信号通路,使用本构建子通路方法构建子通路后得到3055条子通路。构建方法如下:
(1)使用KEGGgraph包将从KEGG下载的通路从.XML格式转换为R语言可识别的格式;
(2)将转换后的通路通过igraph包转换为有向图格式,随后使用igraph包根据转换好的有向图得到对应的邻接矩阵;
(3)根据邻接矩阵确定对应通路的叶节点;
(4)根据对应叶节点找到能够到达该叶节点的其他点,该叶节点以及能到达该叶节点的点即为一条子通路上的所有点。
S2:确定相关的差异基因;使用limma包计算每个基因对应的经过校正的p值。校正后的p值小于0.05的基因即为差异基因。
S3:将所述差异基因映射到每个功能子通路,并利用超几何检验确定差异基因的显著性p值;如果整个基因组中总共有m个基因,我们用来分析的某个子通路包含的基因有t个,我们从表达谱数据中挑选出的差异表达基因有n个,该子通路中包含的差异表达基因有r个,那么给定子通路的p值就可以根据这些信息通过富集分析计算得到。具体公式如下:
S4:计算每个功能子通路的扰动程度,扰动程度PT=-log10p;
S5:计算对于所述功能子通路的特定功能f而言所述功能子通路的扰动程度,扰动程度其中k是指总的功能子通路的数量。
在此,发明人提出了功能扰动程度的概念。研究人员可以借由此概念量化功能子通路及功能的扰动程度,并在此基础上研究各种功能不平衡与疾病的关系。
优选的,步骤S1中所述构建功能子通路的方法,包括有根据KEGG数据库构建功能子通路,在所述KEGG数据库中,一个功能对应至少一个子通路。
优选的,步骤S3中确定相关的差异基因的方法包括有根据Limma包确定差异基因。
此处,提供一个实施例1,示例性地阐述功能子通路的构建方式。
实施例1:功能子通路与最终蛋白质产物及相关反应A、B、C
如图2所示,任一功能子通路中的任一反应对于其他功能子通路而言,都可以被看做是一种特定的功能和信号.对于A而言,包含两种上游信号,即PortA和PortB,这两种上游信号通过三种途径将信号传输给A。信号传输途径如下所示:
PortA→PortB→PortD→PortF→PortH,
PortA→PortB→PortD→PortG→PortH
PortI→PortJ→PortK→PortM→PortG→PortH
以上所有的蛋白质产物节点构成了传输网络,并以此构成了A的功能子通路。同样的,如图1所示,也存在形成B的两条信号传输途径,和存在形成C的一条信号传输途径,并以此为基础构成相应的功能子通路。
此处,提供一个实施例2,示例性地阐述步骤S1和步骤S2中功能子通路的构成与差异基因的确定,并计算步骤S3中的p值。
实施例2:构建信号通路的基因网络
分析6个数据集上的信息,包含有2个结肠癌数据集,2个肺癌数据集和2个胰腺癌。使用limma包中提供的功能计算两个数据集之间的基因表达上的差异,将所述差异基因映射到每个功能子通路,并利用超几何检验确定差异基因的显著性p值。P小于0.05为有显著性差异。
一个通路中的节点往往指向多种具体的生物学功能,或是接受来自其他通路的信号。所述的功能子通路就是能够将上游信号传递到一个具体的生物功能节点的所有基因,所构成的路径。
数据集从KEGG数据库中下载194种信号通路,KEGG数据库为每个通路提供一个文件。而通路中的节点通常对应多种基因产物和化合物,将基因产物分为蛋白质复合物和包含替代基因的基因组,并以此为基础重建基因网络。
此处提供一个实施例3,根据实施例2中计算得到的p值,求得扰动程度PT(f)的结果
实施例3:扰动程度的结果
如图3所示,在结肠癌,肺癌和胰腺癌的6个数据集上,根据KEGG数据库构建功能子通路并根据Limma包确定差异基因。通过超几何检验确定差异基因的显著性p值,并计算其PT(f)值。
在不同数据集上,不同功能子通路收到的扰动程度是不一样的,有些功能如细胞增生的扰动程度,在6个数据集上总是排在前6,验证了该功能异常与疾病的密切关系。此外,由于功能与子通路的多对一的关系,导致在不同的数据集上,导致一个功能扰动的原因可能来自不同的子通路,从而可以进一步研究扰动的原因,进而分析疾病的分子机制。
此处提供一个实施例4,根据对细胞增殖和细胞凋亡相对应的功能子通路的分析,可以对功能子通路及其扰动程度量化,从而方便研究系统功能的异常及失衡。
实施例4:细胞增殖与凋亡的具体扰动情况。
增殖和凋亡的知识有助于理解病理状况和开发新的治疗策略。图3为6个数据集中,功能细胞增殖和凋亡的扰动程度。细胞增殖在每个数据集中总是属于高度扰动,而细胞凋亡只在三个数据集中有扰动。这表明与增殖相对应的这些功能子通路所发生的异常扰动,在不受控的细胞增殖中起到关键作用;而对应于细胞凋亡的功能子通路而言,仅经起到次要作用。
本发明提出了功能扰动程度的概念,并提出了量化了功能子通路及功能的扰动程度的方法。在此基础上,对研究各种功能不平衡与疾病的关系起到重要作用。在细胞通路中,有很多相反的功能如:细胞入侵和细胞入侵抑制,细胞存活和细胞存活抑制,细胞迁移细胞迁移抑制。这些功能的异常及不平衡都和各种疾病的发生发展密切相关。

Claims (3)

1.一种定义功能子通路扰动程度的方法,其特征在于:所述功能子通路是指信号通路中能够将上游信号传递到一个具体的生物功能节点的所有基因构成的路径;
该定义功能子通路扰动程度的方法包括如下步骤:
①构建所述功能子通路;
②确定相关的差异基因;
③将所述差异基因映射到每个功能子通路,并利用超几何检验确定差异基因的显著性p值;
④计算每个功能子通路的扰动程度,扰动程度PT=-log10p;
⑤计算对于所述功能子通路的特定功能f而言所述功能子通路的扰动程度,该扰动程度其中k是指与功能f对应的子通路的数量。
2.根据权利要求1所述的一种定义功能子通路扰动程度的方法,其特征在于:步骤①中所述构建功能子通路的方法,包括有根据KEGG数据库构建功能子通路,在所述KEGG数据库中,一个功能至少对应一个子通路。
3.根据权利要求1所述的一种定义功能子通路扰动程度的方法,其特征在于:步骤③中确定相关的差异基因的方法包括有根据Limma包确定差异基因。
CN201810588800.8A 2018-06-08 2018-06-08 一种定义功能子通路扰动程度的方法 Pending CN109063415A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810588800.8A CN109063415A (zh) 2018-06-08 2018-06-08 一种定义功能子通路扰动程度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810588800.8A CN109063415A (zh) 2018-06-08 2018-06-08 一种定义功能子通路扰动程度的方法

Publications (1)

Publication Number Publication Date
CN109063415A true CN109063415A (zh) 2018-12-21

Family

ID=64820074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810588800.8A Pending CN109063415A (zh) 2018-06-08 2018-06-08 一种定义功能子通路扰动程度的方法

Country Status (1)

Country Link
CN (1) CN109063415A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006217866A (ja) * 2005-02-10 2006-08-24 Tohoku Univ 光感受性を新たに賦与した神経細胞
CN102086473A (zh) * 2010-05-12 2011-06-08 天津市泌尿外科研究所 人类多基因疾病关键基因的无向网络筛选方法
CN105524897A (zh) * 2014-09-30 2016-04-27 深圳华大基因研究院 转录激活因子样效应因子核酸酶及其应用
CN107133492A (zh) * 2017-05-02 2017-09-05 温州大学 一种基于pagis识别基因通路的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006217866A (ja) * 2005-02-10 2006-08-24 Tohoku Univ 光感受性を新たに賦与した神経細胞
CN102086473A (zh) * 2010-05-12 2011-06-08 天津市泌尿外科研究所 人类多基因疾病关键基因的无向网络筛选方法
CN105524897A (zh) * 2014-09-30 2016-04-27 深圳华大基因研究院 转录激活因子样效应因子核酸酶及其应用
CN107133492A (zh) * 2017-05-02 2017-09-05 温州大学 一种基于pagis识别基因通路的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHENSHEN BAO 等: "Signalling pathway impact analysis based on the strength of interaction between genes", 《IET SYSTEMS BIOLOGY》 *
鲍振申: "癌症相关信号通路分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Similar Documents

Publication Publication Date Title
CN109637588B (zh) 一种基于全转录组高通量测序构建基因调控网络的方法
Thennavan et al. Molecular analysis of TCGA breast cancer histologic types
Santolini et al. A personalized, multiomics approach identifies genes involved in cardiac hypertrophy and heart failure
US20170277826A1 (en) System, method and software for robust transcriptomic data analysis
Cheng et al. Risk stratification by long non‐coding RNAs profiling in COVID‐19 patients
ArunKumar et al. Population differentiation of southern Indian male lineages correlates with agricultural expansions predating the caste system
CN107463796A (zh) 基于基因共表达网络传播分析的早期致病因子探测方法
Ruaño et al. Physiogenomics: integrating systems engineering and nanotechnology for personalized medicine
CN109971862A (zh) C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法
Yu et al. RNA‐Seq‐Based Breast Cancer Subtypes Classification Using Machine Learning Approaches
Rustagi et al. Extremely low-coverage whole genome sequencing in South Asians captures population genomics information
Liu et al. Weighted gene co-expression network analysis identifies FCER1G as a key gene associated with diabetic kidney disease
Nersisyan et al. Gene set-and pathway-centered knowledge discovery assigns transcriptional activation patterns in brain, blood, and colon cancer: a bioinformatics perspective
Ma et al. Comprehensive expression-based isoform biomarkers predictive of drug responses based on isoform co-expression networks and clinical data
Zhao et al. BIRC5, GAJ5, and lncRNA NPHP3-AS1 are correlated with the development of atrial fibrillation-valvular heart disease
Chen et al. Integrating multiple omics data for the discovery of potential Beclin-1 interactions in breast cancer
Xie et al. DNF: a differential network flow method to identify rewiring drivers for gene regulatory networks
Sun et al. Predicting embryonic aneuploidy rate in IVF patients using whole-exome sequencing
Zhao et al. Cancer mutations converge on a collection of protein assemblies to predict resistance to replication stress
Speyer et al. Differential pathway dependency discovery associated with drug response across cancer cell lines
Suresh et al. Multi-scale top-down approach for modelling epileptic protein-protein interaction network analysis to identify driver nodes and pathways
Li et al. Intrinsic entropy model for feature selection of scRNA-seq data
CN109063415A (zh) 一种定义功能子通路扰动程度的方法
US20190287644A1 (en) Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease
Karimnezhad et al. Incorporating prior knowledge about genetic variants into the analysis of genetic association data: An empirical Bayes approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221

RJ01 Rejection of invention patent application after publication