CN102184346A - 组织特异性相互作用拓扑网络构建与分析方法 - Google Patents

组织特异性相互作用拓扑网络构建与分析方法 Download PDF

Info

Publication number
CN102184346A
CN102184346A CN2011101185957A CN201110118595A CN102184346A CN 102184346 A CN102184346 A CN 102184346A CN 2011101185957 A CN2011101185957 A CN 2011101185957A CN 201110118595 A CN201110118595 A CN 201110118595A CN 102184346 A CN102184346 A CN 102184346A
Authority
CN
China
Prior art keywords
network
tissue
interaction
specific
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101185957A
Other languages
English (en)
Inventor
田彬
宫秀军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN2011101185957A priority Critical patent/CN102184346A/zh
Publication of CN102184346A publication Critical patent/CN102184346A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种组织特异性相互作用拓扑网络构建与分析方法,有:集成的相互作用网络节点相似性度量;组织特异性相互作用网络的构建模块,包括组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;相互作用网络的拓扑分析模块,包括统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;组织特异性功能模块的辨识模块,包括从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识。本发明提供了从遗传信息出发构建相互作用网络的理想方法,并是研究组织特异性内在机制比较理想的分析工具。

Description

组织特异性相互作用拓扑网络构建与分析方法
技术领域
本发明涉及一种拓扑网络的构建与分析。特别是涉及一种组织特异性相互作用拓扑网络构建与分析方法。
背景技术
组织特异性基因(tissue-specific genes),是指不同的细胞类型进行特异性表达的基因,其产物赋予各种类型细胞特异的形态结构特征与特异的生理功能,在特别细胞类型中大量(通常)表达并编码特殊功能产物。
转录因子(transcription factor)是一群能与基因5端上有特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子又称为序列特异性DNA绑定因子(sequence-specific DNA-binding factor),绑定到特定的DNA序列,从而控制着遗传信息从DNA向mRNA的传递。转录因子独立或者与其它蛋白质以一种复杂的模式发挥作用,对特定基因向RNA聚合酶的转录起到增强或者抑制的作用。转录因子绑定到DNA序列的增强子(enhancer)区域或者启动子(promoter)区域。
组织特异性编码蛋白(Tissue-specific proteins)就是由组织特异性基因指导合成的一类蛋白质,是组织特异性基因表达的结果,例如表皮的角蛋白、肌肉细胞的肌动蛋白和肌球蛋白、红细胞的血红蛋白等。这类蛋白与细胞的特殊性有着直接的关系,从而导致了组织的特殊性。而且,组织特异性编码蛋白往往能够揭示出关于DNA相关功能的丰富信息,在组织特异性方面起着决定性的作用。
随着计算生物学的发展和人类基因组等相关的基因组计划的完成,为我们提供了大量的基因表达与调控关系的数据,为研究组织特异性基因、转录因子以及编码蛋白相互作用的关系提供了丰富的信息资源。
利用现在的计算生物学技术发现基因表达与组织特异性的内在机制,成为现代生物信息学中具有挑战性的任务之一。其中组织特异性表现在组织特异性基因、组织特异性转录因子以及组织特异性编码蛋白三个方面。虽然,已经存在的组织特异性基因、组织特异性转录因子以及编码蛋白的数据量比较丰富,但是这些数据复杂而又分散,不能为我们在研究组织特异性的内在机制提供准确而又全面的信息。目前大部分工作还是集中在如何更加精确的获得组织特异性基因、转录因子和编码蛋白上,未能考虑到生物现象产生的多因素原因。
在国内目前还不存在构建组织特异性基因、转录因子和编码蛋白的拓扑网络方面的技术专利。但是国际上存在一些相关领域的技术专利。
LEMISCHKAIHOR【US】和PRITSKER MOSHE【US】的专利名称“基因相互作用的分析方法”,专利申请号:US20060524043,优先权:US20060524043、US20050718533P。该发明提供了一种孤立的互动多核苷酸序列,其中包含一个标签和两个或更多的遗传因素。该发明还提供了识别两个或更多的遗传因素相互作用的方法。该发明实施提供了一种分析和确定在不同培养条件下或作为或病理分化细胞发育,结果两个或两个以上,其中遗传因素相互作用的遗传因素相互作用,刺激或抑制细胞生长的方法。
MYRIAD GENETICS INC【US】的专利名称“蛋白质的相互作用”,专利申请号:US20020105959,优先权:US20020105958、US20010278428P。该发明涉及的新型蛋白质相互作用的发现,在哺乳动物的生理途径,包括生理疾病或疾病有关。生理紊乱和疾病的例子包括非胰岛素依赖型糖尿病(NIDDM),神经退行性疾病如阿尔茨海默氏病(AD),等等。因此,该发明是针对这些蛋白质复合物和/或他们的片段,以配合物的抗体,生殖生理疾病(包括诊断,以倾向和存在的障碍诊断),药物筛选诊断为代理商的调节蛋白质相互作用的描述外,并在共同的途径额外的蛋白质鉴定蛋白质所述。
系统生物学认为,任何生物现象的产生是多种因素综合作用的结果。组织特异性基因及其转录产物与转录因子之间相互作用关系是理解组织特异性形成机制及其生物标志物发现的一个重要线索。
发明内容
本发明所要解决的技术问题是,提供一种通过已经辨识的组织特异性基因,获取其转录因子及编码蛋白,构建组织特异性基因、转录因子、编码蛋白三种相互作用网络,并分析其网络结构特性,辨识出具有组织特异性的功能模块的组织特异性相互作用拓扑网络构建与分析方法。
本发明所采用的技术方案是:一种组织特异性相互作用拓扑网络构建与分析方法,包括:集成的相互作用网络节点相似性度量、组织特异性相互作用网络的构建模块、相互作用网络的拓扑分析模块和组织特异性功能模块的辨识模块;其中,
所述的组织特异性相互作用网络的构建模块,包括:组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;
所述的相互作用网络的拓扑分析模块,包括:统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;
所述的组织特异性功能模块的辨识模块,包括:从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识,即相关的组织特异性基因、转录因子和编码蛋白;通过比较目标集合与Gene Ontology和KEGG生物领域知识库的拟合程度,从而实现组织特异性功能分析,对结构组织特异性分析,是通过统计相互作用网络中相似结构的子网来实现。
所述的集成的相互作用网络节点相似性度量是:
假设相互作用网络中的两个节点n1,n2,存在m个证据E1,E2,L,Em支持他们之间的相互作用,采用下面的公式来度量n1,n2的相似性:
Sim ( n 1 , n 2 ) = Σ i = 1 m log Prob ( n 1 , n 2 | E i ) Π j ≠ i Prob ( n 1 , n 2 | E j ) = Σ i = 1 m ( log Prob ( n 1 , n 2 | E i ) - Σ j ≠ i log Prob ( n 1 , n 2 | E j ) )
其中Prob(n1,n2|Ei)表示证据Ei支持n1,n2相互作用的概率。因而下面的网络构建中,就是找到支持这种相互作用的证据并估计相应的概率。
所述的组织特异性基因相互作用的网络构建,包括:利用文献挖掘的形式在生物学文献数据库中抽取出组织特异性基因;获取支持组织特异性基因相互作用的证据,所述的相关的证据包括:基因表达数据、转录因子绑定以及启动子序列模式相似性;通过距离计算转化为概率,从而得到表达数据的证据;通过统计两个基因绑定的共同转录因子计算得到转录因子绑定的证据;
所述的启动子序列的模式相似性是通过如下公式计算得到:
BL = log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | different _ source ) + log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | same _ background )
其中,Prob(m1,m2|common_source)表示m1与m2来自相同分布源的概率,类似的,Prob(m1,m2|different_source)则表示m1与m2来自不同分布源的概率,Prob(m1,m2|same_background)则表示m1与m2都来自背景分布的概率。
所述的组织特异性转录因子相互作用的网络构建,对候选的组织特异性基因,利用TRANSFACT等数据库获取其转录因子,通过分析组织特异性基因promoter区域与转录因子的绑定位点出发,研究转录因子之间的相互作用关系,首先统计转录因子在同一绑定位点共现的频度,根据这些频度数据构建转录因子之间的相互作用网络,然后通过已知的蛋白质相互作用网络及它们调控的目标基因的共表达关系来修正网络的结构。
所述的组织特异性编码蛋白相互作用网络构建是,对候选的组织特异性基因,获取其编码蛋白;选取编码蛋白之间相互作用的证据,所述证据包括:基因表达数据、蛋白表达数据、DIP相互作用数据;通过直接计算距离转化为概率得到前两个证据,即基因表达数据和蛋白表达数据;根据数据库的描述项来计算DIP相互作用数据;根据上面得到的三个证据来构建编码蛋白之间相互作用的网络。
本发明的组织特异性相互作用拓扑网络构建与分析方法,提出了一种新的度量网络节点相似性的方法,综合了基因表达数据、转录因子绑定、启动子序列模式(motifs)、绑定位点、蛋白表达数据、DIP相互作用数据以及已知网络等证据,从而成为从遗传信息出发构建相互作用网络的理想方法。提出了一种网络拓扑分析的方法,以及组织特异性功能模块辨识的方法。本发明还提出了融合网络构建、拓扑分析与功能辨识的架构,从而成为研究组织特异性内在机制比较理想的分析工具。
附图说明
图1给出了融合组织特异性基因、转录因子和编码蛋白的相互作用网络的构建与拓扑分析以及功能验证的基础架构;
图2(同构子图与超图)给出了一个相互作用网络(也称为超图)以及寻找同构子网的示意图,
其中a)是G1是通过拓扑分析辨识的某组织中的功能单位(也称为参考图),b)是G2是任意组织中的一个相互作用网络(也称为超图)。
具体实施方式
下面结合实施例和附图对本发明的组织特异性相互作用拓扑网络构建与分析方法做出详细说明。
如图1所示,本发明的组织特异性相互作用拓扑网络构建与分析方法,提出了一种新的相互作用网络节点之间相似度的度量方法;提出了一种新的组织特异性基因、转录因子和编码蛋白相互作用的拓扑网络的基础架构,集成了组织特异性基因、转录因子和编码蛋白的相互作用的信息;提出了针对组织特异性基因、转录因子和编码蛋白的三种相互作用网络中支持节点间相互作用的证据;提出了一种相互作用网络拓扑分析方法;提出了组织特异性功能模块的辨识方法;提出了融合拓扑网络构建、拓扑分析与功能模块辨识的架构。
本发明的组织特异性相互作用拓扑网络构建与分析方法,分为三个模块,第一个模块是组织特异性相互作用网络的构建,第二个模块是相互作用网络的拓扑分析,第三个模块是组织特异性功能模块的辨识。其中:
1.组织特异性相互作用网络的构建。众所周知,在一个复杂的系统中,起主要支配作用的不是单个组成元素的性质和功能,而是它们之间的相互作用。同样,组织特异性相互作用网络是研究组织特异性内在机制的关键。所述的组织特异性相互作用网络的构建具体包括:
1.1首先给出了集成的相互作用网络节点之间相似性度量的计算。具体计算公式如下:
假设相互作用网络中的两个节点n1,n2,存在m个证据E1,E2,L,Em支持他们之间的相互作用,利用前面提到的两个motif相似性度量的思路,我们采用下面的公是来度量n1,n2的相似性:
Sim ( n 1 , n 2 ) = Σ i = 1 m log Prob ( n 1 , n 2 | E i ) Π j ≠ i Prob ( n 1 , n 2 | E j ) = Σ i = 1 m ( log Prob ( n 1 , n 2 | E i ) - Σ j ≠ i log Prob ( n 1 , n 2 | E j ) )
(公式1)
其中Prob(n1,n2|Ei)表示证据Ei支持n1,n2相互作用的概率。因而下面的网络构建中,就是找到支持这种相互作用的证据并估计相应的概率(假定各证据之间是相互独立的)。
1.2组织特异性基因相互作用网络构建:
利用文献挖掘的形式在生物学文献数据库中抽取出组织特异性基因;
对于组织特异性基因,系统开发者利用文献挖掘的形式在Pubmed(美国国立医学图书馆的医学文献数据库)文献数据库中查找组织特异性基因;然后利用基因的名字在Genebank(美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列)、NCBI(美国国立卫生院建设的关于生物医学网站,提供文献、基因序列、蛋白质序列等的功能性数据库)以及EMBL(欧洲分子生物学实验室EMBL(The European Molecular Biology Laboratory),成立于1974年,当时由欧洲的14个国家再加上亚洲的以色列共同发起而建立的DNA数据库)中检索基因的信息;最后,从Transfac(Transfac是关于转录因子以及它们在基因组上的结合位点和与DNA结合的profiles的数据库)、EPD((Eukaryotic Promoter Database,EPD)真核生物启动子数据库,可在其中检索真核生物的启动子序列信息)以及compel(复合原件数据库)等数据库中查找基因的调控信息;这些调控因子信息包括转录起始点的类型(single、multiple、region)以及其在基因核酸序列中的位置、转录因子绑定位点(TFBS)及其在此基因核酸序列中的位置、转录因子(TF)及其功能描述、启动子序列模式特征以及转录因子对基因转录的调控机制。
组织特异性基因相互作用网络的构建:获取组织特异性基因。并选取支持组织特异性基因相互作用(此处可以成为关联)的证据。相关的证据包括:基因表达数据、转录因子绑定、启动子序列模式。其中表达数据的证据可以通过距离计算转化为概率,从而得到表达数据的证据;转录因子证据通过统计两个基因绑定的共同转录因子计算,启动子序列的模式相似性则通过下面公式计算。
BL = log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | different _ source ) + log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | same _ background )
(公式2)
其中,Prob(m1,m2|common_source)表示m1与m2来自相同分布源的概率,类似的,Prob(m1,m2|different_source)则表示m1与m2来自不同分布源的概率,Prob(m1,m2|same_background)则表示m1与m2都来自背景分布的概率。上面公式有一个重要的假设,那就是所有的分布的计算都是基于位置独立性的。更确切的说,该基于似然比的评分标准计算的是在给定源分布的情况下基因在不同位置上的概率。
而启动子序列的模式相似性则通过公式2来计算得到;
通过上述的三种证据构建组织特异性基因之间的相互作用网络。
1.3组织特异性转录因子相互作用网络构建:
对候选的组织特异性基因,利用TRANSFACT等数据库获取其转录因子。通过分析组织特异性基因promoter区域与转录因子的绑定位点出发,研究转录因子之间的相互作用关系。
首先统计转录因子在同一绑定位点共现(co-occurrence)的频度,根据这些频度数据构建转录因子之间的相互作用网络。
然后通过已知的蛋白质相互作用网络及它们调控的目标基因的共表达关系来修正网络的结构。
1.4组织特异性编码蛋白相互作用网络构建:
对候选的组织特异性基因,获取其编码蛋白。
选取编码蛋白之间相互作用的证据。相关证据包括:基因表达数据、蛋白表达数据、DIP相互作用数据(DIP(蛋白质相互作用数据库)收集了由实验验证的蛋白质-蛋白质相互作用。数据库包括蛋白质的信息、相互作用的信息和检测相互作用的实验技术三个部分。用户可以根据蛋白质、生物物种、蛋白质超家族、关键词、实验技术或引用文献来查询DIP数据库)。
对于前两种数据我们可以直接通过直接计算距离转化为概率得到前两个证据,即基因表达数据和蛋白表达数据。
对DIP数据则可以根据数据库的描述项来计算DIP相互作用数据。
根据上面得到的三个证据来构建编码蛋白之间相互作用的网络。
2.相互作用网络的拓扑分析:
网络中大部分节点具有很少的连接度而只有少部分节点具有较多的连接度是生物网络(例如蛋白质相互作用网络、代谢网络以及基因相互作用网络)的主要特征之一。这一特性也被称为网络连接度的指数分布定律。网络的拓扑分析即为辨识出密集连接的集团(clique)及其密集集团之间的连接节点(hub)。
由于网络拓扑分析的工具现已都比较成熟,如NeAT(NeAT(Network Analysis Tool),是一款专门为了解决生物网络(比如蛋白质相互作用网络、基因相互作用网络等)数据的网络与集合分析工具)。本课题不再单独开发这些工具。本发明是利用已有的分析工具对上述三种网络进行拓扑分析。具体包括:
统计网络中各个节点的连接度(Degree)。连接度deg(v)的具体操作就是统计与各个节点相关连的边的条数。
统计网络中各个节点的中介度(Betweenness)。中介度是评估网络中节点向心性的一个度量。出现在短边中的节点相较于其它的节点拥有更高的中介度。中介度CB(v)的计算如下:
C B ( v ) = Σ s ≠ v ≠ t ∈ V σ st ( v ) σ st (公式3)
其中,σst是从节点s到t的最短路径的数量,σst(v)是从节点s到t并且经过节点v的最短路径的数量。
计算网络中各个节点的紧密性(Closeness)。在图论中,图中节点的紧密性也是向心性的一个度量,那些相对其它节点来说较浅的(shallow)节点(也就是在图中与其它节点距离较近的节点)拥有更高的紧密性。节点的紧密性CC(v)定义为一个节点v到其它所有可达节点的距离之和的倒数。具体计算公式如下:
C C ( v ) = 1 Σ t ∈ V \ v d G ( v , t ) (公式4)
其中,dG(v,t)是从节点v出发到节点t的距离。注:紧密性没有统一的定义,因此计算公式有很多种,但是具体效果相差不大。
计算相互作用网络中的最大集团(Max Clique)。最大集团就是拥有最多可能节点的团(Clique)。
统计出相互作用网络中的Hub节点(就是图中少数的具有较大连接度的节点)。
3.组织特异性功能模块的辨识:
验证相互作用网络中获得功能模块(Max Clique)的组织特异性包括功能分析和结构分析两方面。我们将利用开源软件GSEA(Gene Set Enrichment Analysis),功能分析和结构分析具体包括:
从基因本体数据库(Gene Ontology)和KEGG等生物领域知识库中获取相关的组织特异性知识,即相关的组织特异性基因、转录因子和编码蛋白。
通过比较目标集合与Gene Ontology和KEGG等生物领域知识库的拟合程度,从而实现组织特异性功能分析。
对结构组织特异性分析,我们通过统计相互作用网络中相似结构的子网来实现。因而,相似子网的查询成为关键问题之一。为此,我们设计了一个基于子网打分的同构子网查询算法。
开源软件GSEA(GSEA(Gene Set Enrichment Analysis)是一个判断一个已经定义的基因的先验分布是否具有统计意义上的显著性,以及判断两个生物集之间是否具有一致性的计算方法),通过对比目标集合与Gene Ontology(GO是生物信息学里的一个创举,其主要目标就是规范化不同物种和数据库中的基因和基因编码产物。GO主要包括三个领域:细胞成分(cellular component),细胞的组成成分或者细胞外环境;分子作用(molecular function),在分子水平上的基因产物的基本活动,比如绑定或者催化作用;生物过程(biological process),具有确定开始和结束时间的分子事件的操作或者集合,生物整体单元(包括细胞、组织、器官和有机体)的的相关作用)、KEGG(KEGG(Kyoto Encryclopedia of Genes and Genomes)是一个包含基因组信息、酶途径以及生物化学的在线数据库,关联着已知的分子相互作用网络的信息、关于由基因组计划产生的基因和蛋白质的信息以及生物化合物和反应的信息)等生物领域知识库的拟合程度,实现组织特异性功能分析。对结构组织特异性分析,我们通过统计相互作用网络中相似结构的子网来实现。因而,相似子网的查询是该子课题解决的关键问题之一。为此,设计了一个基于子网打分的同构子网查询算法,具体描述如下:
在附图2中,G1是通过拓扑分析辨识的某组织中的功能单位(也称为参考图),G2是任意组织中的一个相互作用网络(也称为超图)。我们的目标是在G2中找到一个与G1同构的子图,并且要求子图在G2中关联更多的边,以保证更强的关联。

Claims (6)

1.一种组织特异性相互作用拓扑网络构建与分析方法,其特征在于,包括:集成的相互作用网络节点相似性度量、组织特异性相互作用网络的构建模块、相互作用网络的拓扑分析模块和组织特异性功能模块的辨识模块;其中,
所述的组织特异性相互作用网络的构建模块,包括:组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;
所述的相互作用网络的拓扑分析模块,包括:统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;
所述的组织特异性功能模块的辨识模块,包括:从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识,即相关的组织特异性基因、转录因子和编码蛋白;通过比较目标集合与Gene Ontology和KEGG生物领域知识库的拟合程度,从而实现组织特异性功能分析,对结构组织特异性分析,是通过统计相互作用网络中相似结构的子网来实现。
2.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的集成的相互作用网络节点相似性度量是:
假设相互作用网络中的两个节点n1,n2,存在m个证据E1,E2,L,Em支持他们之间的相互作用,采用下面的公式来度量n1,n2的相似性:
Sim ( n 1 , n 2 ) = Σ i = 1 m log Prob ( n 1 , n 2 | E i ) Π j ≠ i Prob ( n 1 , n 2 | E j ) = Σ i = 1 m ( log Prob ( n 1 , n 2 | E i ) - Σ j ≠ i log Prob ( n 1 , n 2 | E j ) )
其中Prob(n1,n2|Ei)表示证据Ei支持n1,n2相互作用的概率。因而下面的网络构建中,就是找到支持这种相互作用的证据并估计相应的概率。
3.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性基因相互作用的网络构建,包括:利用文献挖掘的形式在生物学文献数据库中抽取出组织特异性基因;获取支持组织特异性基因相互作用的证据,所述的相关的证据包括:基因表达数据、转录因子绑定以及启动子序列模式相似性;通过距离计算转化为概率,从而得到表达数据的证据;通过统计两个基因绑定的共同转录因子计算得到转录因子绑定的证据;
4.根据权利要求3所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的启动子序列的模式相似性是通过如下公式计算得到:
BL = log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | different _ source ) + log Prob ( m 1 , m 2 | common _ source ) Prob ( m 1 , m 2 | same _ background )
其中,Prob(m1,m2|common_source)表示m1与m2来自相同分布源的概率,类似的,Prob(m1,m2|different_source)则表示m1与m2来自不同分布源的概率,Prob(m1,m2|same_background)则表示m1与m2都来自背景分布的概率。
5.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性转录因子相互作用的网络构建,对候选的组织特异性基因,利用TRANSFACT等数据库获取其转录因子,通过分析组织特异性基因promoter区域与转录因子的绑定位点出发,研究转录因子之间的相互作用关系,首先统计转录因子在同一绑定位点共现的频度,根据这些频度数据构建转录因子之间的相互作用网络,然后通过已知的蛋白质相互作用网络及它们调控的目标基因的共表达关系来修正网络的结构。
6.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性编码蛋白相互作用网络构建是,对候选的组织特异性基因,获取其编码蛋白;选取编码蛋白之间相互作用的证据,所述证据包括:基因表达数据、蛋白表达数据、DIP相互作用数据;通过直接计算距离转化为概率得到前两个证据,即基因表达数据和蛋白表达数据;根据数据库的描述项来计算DIP相互作用数据;根据上面得到的三个证据来构建编码蛋白之间相互作用的网络。
CN2011101185957A 2011-05-09 2011-05-09 组织特异性相互作用拓扑网络构建与分析方法 Pending CN102184346A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101185957A CN102184346A (zh) 2011-05-09 2011-05-09 组织特异性相互作用拓扑网络构建与分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101185957A CN102184346A (zh) 2011-05-09 2011-05-09 组织特异性相互作用拓扑网络构建与分析方法

Publications (1)

Publication Number Publication Date
CN102184346A true CN102184346A (zh) 2011-09-14

Family

ID=44570521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101185957A Pending CN102184346A (zh) 2011-05-09 2011-05-09 组织特异性相互作用拓扑网络构建与分析方法

Country Status (1)

Country Link
CN (1) CN102184346A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246828A (zh) * 2013-02-04 2013-08-14 中国人民解放军军事医学科学院放射与辐射医学研究所 一种检测待测蛋白网络的功能的方法
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
CN103870720A (zh) * 2014-03-19 2014-06-18 中国人民解放军国防科学技术大学 蛋白质信号转导子网的预测方法和装置
CN104699997A (zh) * 2015-03-24 2015-06-10 江南大学 一种基因组代谢网络模型自动化修正方法
CN105512509A (zh) * 2014-09-24 2016-04-20 中国科学院上海高等研究院 互斥性转录因子调控网络下的肿瘤标识物挖掘系统及方法
CN106599609A (zh) * 2017-01-13 2017-04-26 景德镇陶瓷大学 一种新的基于ChEBI描述的药物分子相似性计算方法
CN107194203A (zh) * 2017-06-09 2017-09-22 西安电子科技大学 基于miRNA数据和组织特异性网络的药物重定位方法
CN108877953A (zh) * 2018-06-06 2018-11-23 中南大学 一种基于多相似性网络的药物敏感性预测方法
CN109616210A (zh) * 2012-10-09 2019-04-12 凡弗3基因组有限公司 用于生物路径中的调控互动的学习和识别的系统和方法
CN110853703A (zh) * 2019-10-16 2020-02-28 天津大学 一种对蛋白质二级结构进行半监督学习预测方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109616210A (zh) * 2012-10-09 2019-04-12 凡弗3基因组有限公司 用于生物路径中的调控互动的学习和识别的系统和方法
CN103246828A (zh) * 2013-02-04 2013-08-14 中国人民解放军军事医学科学院放射与辐射医学研究所 一种检测待测蛋白网络的功能的方法
CN103246828B (zh) * 2013-02-04 2016-06-22 中国人民解放军军事医学科学院放射与辐射医学研究所 一种检测待测蛋白网络的功能的方法
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
CN103870720A (zh) * 2014-03-19 2014-06-18 中国人民解放军国防科学技术大学 蛋白质信号转导子网的预测方法和装置
CN103870720B (zh) * 2014-03-19 2017-02-08 中国人民解放军国防科学技术大学 蛋白质信号转导子网的预测方法和装置
CN105512509B (zh) * 2014-09-24 2018-03-02 中国科学院上海高等研究院 互斥性转录因子调控网络下的肿瘤标识物挖掘系统及方法
CN105512509A (zh) * 2014-09-24 2016-04-20 中国科学院上海高等研究院 互斥性转录因子调控网络下的肿瘤标识物挖掘系统及方法
CN104699997A (zh) * 2015-03-24 2015-06-10 江南大学 一种基因组代谢网络模型自动化修正方法
CN104699997B (zh) * 2015-03-24 2017-05-10 江南大学 一种基因组代谢网络模型自动化修正方法
CN106599609A (zh) * 2017-01-13 2017-04-26 景德镇陶瓷大学 一种新的基于ChEBI描述的药物分子相似性计算方法
CN107194203A (zh) * 2017-06-09 2017-09-22 西安电子科技大学 基于miRNA数据和组织特异性网络的药物重定位方法
CN108877953A (zh) * 2018-06-06 2018-11-23 中南大学 一种基于多相似性网络的药物敏感性预测方法
CN108877953B (zh) * 2018-06-06 2021-09-03 中南大学 一种基于多相似性网络的药物敏感性预测方法
CN110853703A (zh) * 2019-10-16 2020-02-28 天津大学 一种对蛋白质二级结构进行半监督学习预测方法

Similar Documents

Publication Publication Date Title
CN102184346A (zh) 组织特异性相互作用拓扑网络构建与分析方法
Ohler et al. Identification and analysis of eukaryotic promoters: recent computational approaches
Pouyan et al. Random forest based similarity learning for single cell RNA sequencing data
Georgiev et al. Evidence-ranked motif identification
Mahony et al. Transcription factor binding site identification using the self-organizing map
US10347359B2 (en) Method and system for network modeling to enlarge the search space of candidate genes for diseases
CN108121896B (zh) 一种基于miRNA的疾病间关系分析方法和装置
Cheng et al. Advantages of CEMiTool for gene co-expression analysis of RNA-seq data
Yang et al. Continuous-trait probabilistic model for comparing multi-species functional genomic data
Li et al. HSM6AP: a high-precision predictor for the Homo sapiens N6-methyladenosine (m^ 6 A) based on multiple weights and feature stitching
Allen et al. Assessing the state of substitution models describing noncoding RNA evolution
Ji et al. Computational biology: toward deciphering gene regulatory information in mammalian genomes
González-Álvarez et al. Comparing multiobjective swarm intelligence metaheuristics for DNA motif discovery
Mitra et al. Gene interaction–an evolutionary biclustering approach
Reddy et al. Binding site graphs: a new graph theoretical framework for prediction of transcription factor binding sites
Hamilton et al. RNA localization signals: deciphering the message with bioinformatics
Zhou et al. Coupling hidden Markov models for the discovery of cis-regulatory modules in multiple species
Prohaska et al. The use and abuse of-omes
Lindlöf et al. Could correlation-based methods be used to derive genetic association networks?
Sandve et al. Compo: composite motif discovery using discrete models
Wu et al. Computation-based discovery of cis-regulatory modules by hidden Markov model
Singh Inferring interaction networks from transcriptomic data: methods and applications
Ernst et al. Large-scale epigenome imputation improves data quality and disease variant enrichment
El Menshawy et al. A New Algorithm For Ssr Detection (Ssrs Finder)
Sahu et al. Computational approaches, databases and tools for in silico motif discovery

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110914