CN108520171B - 一种蛋白质相互作用网络中关键蛋白质发现方法 - Google Patents
一种蛋白质相互作用网络中关键蛋白质发现方法 Download PDFInfo
- Publication number
- CN108520171B CN108520171B CN201810312728.6A CN201810312728A CN108520171B CN 108520171 B CN108520171 B CN 108520171B CN 201810312728 A CN201810312728 A CN 201810312728A CN 108520171 B CN108520171 B CN 108520171B
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- network
- key
- protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 52
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000006916 protein interaction Effects 0.000 title abstract description 19
- 230000001419 dependent effect Effects 0.000 claims abstract description 7
- 230000003993 interaction Effects 0.000 claims abstract description 4
- 230000009471 action Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 abstract description 3
- 230000003190 augmentative effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000003596 drug target Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000003012 network analysis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 208000037273 Pathologic Processes Diseases 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009054 pathological process Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000007180 physiological regulation Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种节点相互作用网络中关键节点发现方法。方法包括:以节点相关作用网络G(V,E)构造二分图B(Vin,Vout,E);计算二分图的最大匹配M,Vin和Vout的未匹配节点分别为Uin和Uout;从Uin的所有未匹配节点出发寻找交错路径集合P1,P1上的节点集合为M;从Uout的所有未匹配节点出发寻找交错路径集合P2,P2上节点集合为N;Uin’=Uin‑M‑N;Uout’=Uout‑M‑N;对于Uout’中任一节点iout,若iin在Uin’中且iin不在从iout出发的交错路径上,则i为关键节点。上述方法应用在蛋白质相互作用网络,能够找出网络所有的关键蛋白质节点,提高了计算效率。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种蛋白质相互作用网络中关 键蛋白质发现方法。
背景技术
蛋白质是组成人体一切细胞、组织的重要成分,在几乎所有的生命 系统、调控各种生理/病理进程中发挥重要的作用,是生命活动的主要承 担者。然而,蛋白质功能的发挥不是凭借单个蛋白质独立执行,而是依 靠蛋白质与蛋白质相互作用(protein-proteininteraction,PPI)执行其功 能。因此,蛋白质互作网络的研究已经成为蛋白质研究的热点。蛋白相 互作用网络可以通过一些高通量的实验方法得到,如酵母双杂交、免疫 沉淀串联质谱分析等。
生物系统中蛋白质发挥的作用不是等同的,少量关键蛋白质在维持 生物体正常生理过程中起着至关重要的作用。已有工作表明,一旦移除 这些关键蛋白,可能会造成相关功能模块的生物功能丧失,导致生物体 无法完成正常的生理活动。这些在生物过程中起关键作用的蛋白质的异 常可能引发许多疾病,如神经退行性疾病、癌症等。因此,发现并找到 这些在生物过程中起关键作用的蛋白质对研究细胞的生理调控机制具有 非常重要的生物意义,对药物靶标设计也具有很重要的实际价值。
在生物学领域,一般采取基因敲除、RNA干扰等生物实验的方法控 制相关蛋白质,通过观察生物体能否正常执行生命活动,来判别一个蛋白 质是否是关键蛋白。利用生物实验的方法预测关键蛋白质的方法虽然比 较准确,但是生物实验周期长而且代价高。
另一种方法是采用网络分析方法,利用蛋白质相互作用网络找出起 关键作用的蛋白质。Vinayagam等给出了一种基于控制理论计算关键节 点的方法。该方法首先计算网络的最小输入节点集合,然后将节点从网 络中删除,重新计算新网络的最小输入节点集合。如果新网络的MIS大 于原网络的MIS,则该节点是关键节点。这种方法的缺点在于需要逐个 判断网络中的节点,复杂度很高。
发明内容
(一)要解决的技术问题
本发明提出一种蛋白质相互作用网络中关键蛋白质发现方法,基于 蛋白质节点间的交错连通性,能够找出网络所有的关键蛋白质节点,极 大的提高了计算效率。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种节点相互作用网络中关键节点发现方法,其特征在于,所述方 法,包括:
S10、基于节点相关作用网络G(V,E),构造二分图B(Vin,Vout,E);其 中,V为节点集合,E为边集合;
S20、计算二分图B(Vin,Vout,E)的最大匹配M,令Vin和Vout中的未 匹配节点分别为集合Uin和Uout;
S30、从Uin的所有未匹配节点出发寻找交错路径集合P1,令交错路 径集合P1上的所有节点集合为M;
S40、从Uout的所有未匹配节点出发寻找交错路径集合P2,令交错 路径集合P2上的所有节点集合为N;
S50、令Uin’=Uin-M-N;Uout’=Uout-M-N;构造子图B’(Uin’,Uout’,E’);
S60、对于Uout’中任一节点iout,如果iin在Uin’中且in不在从iout出 发的任何交错路径上,那么则iin,iout在网络G中的对应节点i为关键节 点。
可选地,所述步骤S10包括:
针对蛋白质相关作用网络G的节点集合V中的任意节点n,将节点n拆分成nout,nin两个节点,得到两个节点集合Vin,Vout;对于n的连边, 将该连边中所有出边连接至nout节点,所有入边连接至nin节点,得到二 分图B(Vin,Vout,E)。
可选地,所述交错路径集合P1和所述交错路径集合P2均为匹配边 和非匹配边交替出现的路径。
可选地,所述关键节点为影响所述节点相关作用网络的最小输入节 点集MDS规模的节点。
可选地,若所述节点相关作用网络G(V,E)为蛋白质相关作用网络, 则所述步骤S60中的关键节点为关键蛋白质节点。
另外,还提供一种电子设备,包括存储器、处理器、总线以及存储 在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程 序时实现如上方法任意一项的步骤。
一种计算机存储介质,其上存储有计算机程序,所述程序被处理器 执行时实现如上方法任意一项的步骤。
(三)有益效果
本发明在实际应用于蛋白质交互网络中用于关键蛋白质的判定具有 切实的实际意义,通过搜索节点在交错路径中的连通关系找出关键蛋白 值,不仅提高了判定的效率,避免了逐个删除节点比较最小输入节点集 大小的复杂运算,而且也为关键蛋白质之间的关联提供了明确的图形化 解释。除了蛋白质相互作用网络外,本算法也适合于任意种类的大规模 网络中关键节点的判定。
附图说明
图1为本发明一个实施例提供的一种人类蛋白质相互作用网络的示 意图;
图2为本发明一个实施例提供的一种二分图匹配的示意图;
图3为本发明一个实施例提供的一种n+和n-之间有交错路径的例子 示意图;
图4为本发明一个实施例提供的基于可控性方法的节点分类示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面通过具体实施方式,对 本发明作详细描述。
现有技术中的另一种方法是从网络分析的角度,基于蛋白质相互作 用网络来进行预测和发现关键蛋白质。复杂网络控制理论是分析蛋白质 相互作用网络的有力工具,从网络控制的角度可以找出在生物过程中起 关键作用的蛋白质。为了控制复杂网络,需要向网络中的部分节点输入 控制信号,通过节点间边的连接,驱动网络的所有节点达到期望的状 态,这些用来输入控制信号的节点称为输入节点。为了完全控制网络所 有节点的状态,所需的最少的输入节点集合称为最小输入节点集 (MIS)。如果在网络中删除一个蛋白质及其交互作用后,控制网络所需 的MIS集合大小增加,那么该蛋白质就称为关键蛋白质。现有工作已经 发现,采用控制理论发现的关键蛋白,大多与癌症相关、或者是病毒和 药物的靶点。
考虑网络G(V,E),其中V为节点集合,E为边集合。匹配边集M是 一个独立的边集,即边与边之间不共享节点。对于一个节点,如果它是 一条匹配边的终点,那么该节点为匹配节点;否则,为非匹配节点。边 数最多的匹配边集被称为图的一个最大匹配。如果图中所有的节点都是 匹配节点,那么该图中的最大匹配就称为完美匹配。
将网络G(V,E)的最大匹配边集的大小记作|M*|,那么最小输入定理 可以描述为:如果网络G(V,E)中存在一个完美匹配,则要控制网络 G(V,E)所需的最小输入节点数NI或最小输入节点数ND为1;否则,等于 网络中最大匹配对应的非匹配节点的数量。即:
N1=ND=max{N-|M*|,1}
也就是说,对于非匹配节点数不为0的网络,输入节点数即为非匹 配节点数,且非匹配节点即为输入节点的一种情况。对于非匹配节点数 为0的完美匹配的网络,输入节点数为1,网络中任一节点均可定义为 输入节点。
为了完全地控制一个网络,需要的最少输入是由网络的最大匹配决 定的。匹配节点由它的前驱节点控制,而未匹配节点则必须由一个外部 输入来控制,故未匹配节点即为网络的输入节点。一旦为每个输入节点 进行输入,那么网络中的节点均拥有了自己的前驱,即网络是完全可控 的。
下面给出关于最大匹配的若干概念。
定义1给定一个二分图G=(V,E),在G的一个子图M中,M的边集 中的任意两条边都不依附于同一个顶点,则称M是二分图的一个匹配。
二分图的最大匹配,如图2所示,即是在给定的二分图G=(V,E)的所 有匹配中,把其中包含的边数最多的匹配找出来。如果一个匹配中,图 中的每个顶点都和图中某条边相关联,则称此匹配为完全匹配,也称作 完美匹配。
图2(a)为一个二分图,图2(b)表示该二分图的一个匹配,但非其最大 匹配,图2(c)为二分图的一个最大匹配,图2(d)表示一个完美匹配,图中 的每个顶点均被匹配上了。
定义2未匹配点:设Vi是图G的一个顶点,如果Vi不与任意一条 属于匹配M的边相关联,就称Vi是一个未匹配点。
交错路径:如果G中存在这样一条路径,该路径上匹配边和非匹配 边交替出现,那么这个路径称为交错路径。增广路径是端点均为非匹配 点的交错路径。一条交错路径上的两节点i,j,称i和j是交错连通的。
关键节点:如果从网络中移除一个节点后,最小输入节点集MDS的 规模(|MDS|)增大,则称该节点是关键节点。
如图4所示,(a)显示了一个简单有向网络,根据结构可控性的计 算结果,MDS是{1,2,6},|MDS|=3。(b)、(c)和(d)分别表示移除 一个节点后,|MDS|的变化情况;(b)表示移除节点4后,|MDS|增加 了1,节点4是关键节点;
控制可达集:节点n的控制可达集是连接n的交错路径上所有节点 的集合。
邻接定理:
(1)对于任意的MDS,每个输入节点的控制可达集包含着所有可 能成为驱动节点的节点;
(2)如果一个节点不属于任何输入节点的控制可达集,则该节点一 定不属于任何最小输入节点集,即不会作为网络G的输入节点。
实施例1
考虑有向蛋白质相互作用网络G(V,E),其中V为节点集合,表示蛋 白质;E为边集合,表示蛋白质之间的相互作用。现有工作发现,网络 控制理论可以用来发现关键蛋白质节点,即删除该节点后使控制网络所 需的最小输入节点集大小增加的节点。这些蛋白质节点已经被证实与癌 症相关,并且是药物或病毒的靶点。本发明提出一种关键蛋白质的判定方法,具体过程如下:
1、首先基于蛋白质相关作用网络G(V,E),构造二分图 B(Vin,Vout,E)。具体过程为,将网络G的节点集合V中的任意节点n, 将其拆分成nout,nin两个节点,这样会得到两个节点集合Vin,Vout;对于n 的连边,将其所有出边连接至nout节点,所有入边连接至nin节点,这样 得到二分图B(Vin,Vout,E);
2、计算二分图B的最大匹配M,令Vin和Vout中的未匹配节点分 别为集合Uin和Uout;
3、从Uin的所有未匹配节点出发寻找第一类交错路径集合P1,令交 错路径集合P1上的所有节点集合为M;
4、从Uout的所有未匹配节点出发寻找第二类交错路径集合P2,令 交错路径集合P2上的所有节点集合为N;
5、令Uin’=Uin-M-N;Uout’=Uout-M-N;构造子图B’(Uin’,Uout’,E’);
6、对于Uout’中任一节点iout,如果iin在Uin’中且iin不在从iout出发的 任何交错路径上,那么则iin,iout在网络G中的对应节点i为关键蛋白质 节点。
7、对于Uout’中的所有节点,重复上述步骤6,使得Uout’中的所有节 点遍历完成。
本实施例中通过搜索节点在交错路径中的连通关系找出关键蛋白 值,不仅提高了判定的效率,避免了逐个删除节点比较最小输入节点集 大小的复杂运算,而且也为关键蛋白质之间的关联提供了明确的图形化 解释。除了蛋白质相互作用网络外,上述方法也适合于任意种类的大规 模网络中关键节点的判定。
验证例
为了说明本发明的有效性,在人类蛋白质相互作用网络上进行了验 证。蛋白质交互网络的数据选取自论文“A.Vinayagam et al.,“A directed protein interactionnetwork for investigating intracellular signal transduction,”Sci.Signal.,vol.4,no.189,2011”。该网络包括6339 个蛋白质,34813条相互作用有向边。
本发明在该网络上运行本发明给出的算法即方法,共找出1330个关 键蛋白质。网络结构与关键蛋白质如图1所示。将这些蛋白质与其他数 据库进行比较,包括OnlineMendelian Inheritance in Man(OMIM) (https://www.omim.org/),DrugBank(https://www.drugbank.ca/),结果表明 本发明方法找出的关键蛋白质大多与疾病基因、药物靶点相关,说明了 本发明方法的有效性。部分关键蛋白质列表如表1所示,图1中黑色节 点表示本发明方法找出的关键蛋白质节点。
表1.部分关键蛋白质列表
下面证明本发明的算法即方法的正确性。如图3所示,首先证明引 理1。
引理1:G(V,E)对应的二分图B(V+,V-,E)中,删除n+和n-后,若形 成至少1条增广路径,则n一定不是关键节点。
证明:反证法,假设节点n是关键节点,并且删除节点n会形成一 条增广路径。节点n至多有1条匹配入边和匹配出边,删除后最大匹配 数最多减少2,发现增广路径匹配数再加1,总的最大匹配最多减少1, 与删除关键节点最大匹配数减2的特征不相符。
关键节点判定定理:对于有向图G(V,E),令其对应的二分图为 G(V+,V-,E),最大匹配为M*,令节点n在二分图中的对应节点为n+和 n-,节点n是关键节点,当且仅当同时满足如下条件:
(1)n+和n-均有匹配边;
(2)n+到V+中的未匹配节点、n-到V-中的未匹配节点之间均不存在 交错路径;
(3)从n+匹配边出发到n-不存在交错路径。
证明:
对于二分图G(V+,V-,E)中的n+和n-,
首先证明条件1:a)根据关键节点的定义,删除n+和n-,匹配数应 减少2。如果n+和n-均无匹配边,则删除节点后没有匹配边被移除,匹 配数不变;如果n+或n-有一个没有匹配边,删除节点后至多有一条匹配 边被移除,匹配数减少1或不变。因此n+和n-均有匹配边。条件(1)证 毕。
然后证明条件2:b)反证法。假设n+到V+中的未匹配节点、n-到V-中的未匹配节点不存在交错路径,分为以下两种情况:(1)n-与V-中的 未匹配节点存在交错路径。此情况下,V-中的未匹配节点是输入节点, n-在输入节点的控制可达集中。根据邻接定理,n有可能成为输入节 点,而输入节点没有匹配入边,与条件1不相符,n不可能是输入节 点。(2)n+到V+中的未匹配节点存在交错路径。此情况下,V+中的未匹 配节点是未饱和节点,n+在未饱和节点的未饱和可达集中。根据邻接定 理,n有可能成为未饱和节点,而未饱和节点没有匹配出边,与条件1 不相符,n不可能是输入节点。条件(2)证毕。
证明条件3:c)n+到未饱和节点之间不存在交错路径且n-到未匹配节 点之间存在交错路径。可以分为2种情况:i)n+和n-在同1条匹配交错 路径上,ii)n+和n-不在同1条交错路径上。在情况i)的条件下,n+和 n-之间若存在交错路径,n+到n-的路径长度一定是奇数的。交错路径的 特点,这段路径的两端均是匹配边或非匹配边。如果两端是匹配的,删 除n+和n-之后,会形成1条增广路径,根据引理,n不可能是关键节点, 条件(3)证毕。如图3所示,(a)是一个简单的有向图和它的二分图, 其中输入节点和匹配边均已标出,可以看到节点2+和2-之间有匹配路径 {2-,1+,4-,5+,3-,2+},且2+和2-的匹配边(2+,3-)和(1+,2-)均在该路径上;(b) 表示对(a)中的图删除节点2,在其二分图中,两条匹配边均被删除, 形成增广路径,所以节点2不是关键节点。.
如果n+到n-的交错路径两端是非匹配的,删除n+和n-后不会形成增 广路径,n是关键节点。在ii)的情况下,从n+匹配边出发的交错路径, 另一个端点可能是V-中的匹配节点,或V-中的未匹配节点,也可能交错 路径是一个偶数边的环,路径回到了n+本身。这三种情况下,删除n+, 该路径不会形成增广路径。从n+非匹配边出发的匹配交错路径,由于删 除n+会移除一条非匹配边,一定不会形成增广路径。同理,删除n-也不 会形成增广路径。如图3所示,(c)也是一个简单的有向图和它的二分 图,可以看到节点3+和3-之间有匹配路径{3-,5+,4-,3+},且2+和2-的匹配 边不在该路径上;(d)表示对(c)中的图删除节点3,在其二分图中, 节点和边被删除后,并没有形成增广路径,所以节点3是关键节点,如 图4所示。
另外,本发明实施例还提供一种电子设备,包括存储器、处理器、 总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理 器执行所述程序时实现如上述方法任意一项的步骤。
此外,本发明实施例还提供一种计算机存储介质,其上存储有计算 机程序,所述程序被处理器执行时实现如上述方法任意一项的步骤。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方 案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明, 本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技 术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这 些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方 案的范围。
Claims (6)
1.一种节点相互作用网络中关键节点发现方法,其特征在于,所述方法,包括:
S10、基于节点相关作用网络G(V,E),构造二分图B(Vin,Vout,E);其中,V、Vin、Vout均为节点集合,E为边集合;
S20、计算二分图B(Vin,Vout,E)的最大匹配M,令Vin和Vout中的未匹配节点分别为集合Uin和Uout;
S30、从Uin的所有未匹配节点出发寻找交错路径集合P1,令交错路径集合P1上的所有节点集合为M;
S40、从Uout的所有未匹配节点出发寻找交错路径集合P2,令交错路径集合P2上的所有节点集合为N;
S50、令Uin’=Uin-M-N;Uout’=Uout-M-N;构造子图B’(Uin’,Uout’,E’);
其中,所述E’为所述Uin’和所述Uout’的边集合;
S60、对于Uout’中任一节点iout,如果iin在Uin’中且iin不在从iout出发的任何交错路径上,那么则iin,iout在网络G中的对应节点i为关键节点;
其中,所述步骤S10包括:
针对蛋白质相关作用网络G的节点集合V中的任意节点n,将节点n拆分成nout、nin两个节点,得到两个节点集合Vin、Vout;对于n的连边,将该连边中所有出边连接至nout节点,所有入边连接至nin节点,得到二分图B(Vin,Vout,E)。
2.根据权利要求1所述的方法,其特征在于,所述交错路径集合P1和所述交错路径集合P2均为匹配边和非匹配边交替出现的路径。
3.根据权利要求2所述的方法,其特征在于,所述关键节点为影响所述节点相关作用网络的最小输入节点集MDS规模的节点。
4.根据权利要求1至2任一所述的方法,其特征在于,若所述节点相关作用网络G(V,E)为蛋白质相关作用网络,则所述步骤S60中的关键节点为关键蛋白质节点。
5.一种电子设备,其特征在于,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-4任意一项的步骤。
6.一种计算机存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现如权利要求1-4任意一项的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810312728.6A CN108520171B (zh) | 2018-04-09 | 2018-04-09 | 一种蛋白质相互作用网络中关键蛋白质发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810312728.6A CN108520171B (zh) | 2018-04-09 | 2018-04-09 | 一种蛋白质相互作用网络中关键蛋白质发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108520171A CN108520171A (zh) | 2018-09-11 |
CN108520171B true CN108520171B (zh) | 2020-07-17 |
Family
ID=63432110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810312728.6A Expired - Fee Related CN108520171B (zh) | 2018-04-09 | 2018-04-09 | 一种蛋白质相互作用网络中关键蛋白质发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108520171B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110706740B (zh) * | 2019-09-29 | 2022-03-22 | 长沙理工大学 | 基于模块分解的蛋白质功能预测的方法、装置、设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156603A (zh) * | 2014-08-14 | 2014-11-19 | 中南大学 | 基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法 |
CN107229677A (zh) * | 2017-05-07 | 2017-10-03 | 东北大学 | 一种枚举控制网络所需的所有最小输入节点集合的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070185868A1 (en) * | 2006-02-08 | 2007-08-09 | Roth Mary A | Method and apparatus for semantic search of schema repositories |
-
2018
- 2018-04-09 CN CN201810312728.6A patent/CN108520171B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156603A (zh) * | 2014-08-14 | 2014-11-19 | 中南大学 | 基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法 |
CN107229677A (zh) * | 2017-05-07 | 2017-10-03 | 东北大学 | 一种枚举控制网络所需的所有最小输入节点集合的方法 |
Non-Patent Citations (2)
Title |
---|
Emergence of bimodality in controlling;Tao Jia et al;《Nature communications》;20130430;第1-6页 * |
复杂网络控制交错连通分支及模式转换方法研究;蒲圆圆;《中国优秀硕士学位论文全文数据库信息科技辑》;20160815;第1-72页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108520171A (zh) | 2018-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xiao et al. | iPSW (2L)-PseKNC: A two-layer predictor for identifying promoters and their strength by hybrid features via pseudo K-tuple nucleotide composition | |
Cai et al. | Covariate-adjusted precision matrix estimation with an application in genetical genomics | |
US10347359B2 (en) | Method and system for network modeling to enlarge the search space of candidate genes for diseases | |
Czeizler et al. | Structural target controllability of linear networks | |
CN108520171B (zh) | 一种蛋白质相互作用网络中关键蛋白质发现方法 | |
CN113299338A (zh) | 基于知识图谱的合成致死基因对预测方法、系统、终端及介质 | |
JP2019532421A (ja) | 薬物介入前および薬物介入後の生体分子ネットワークのモジュール変化を定量的に分析する方法 | |
Meng et al. | IGLOO: Integrating global and local biological network alignment | |
JPWO2007116787A1 (ja) | Rnaの二次構造予測方法、予測装置及び予測プログラム | |
Weighill et al. | Gene regulatory network inference as relaxed graph matching | |
CN115394376A (zh) | 一种预测环状rna ires的方法 | |
Bartlett et al. | Two-way sparsity for time-varying networks with applications in genomics | |
Machkour et al. | False discovery rate control for fast screening of large-scale genomics biobanks | |
Baake et al. | Single-crossover recombination and ancestral recombination trees | |
Lim et al. | A multi-species functional embedding integrating sequence and network structure | |
Bustamam et al. | Analysis of protein-protein interaction network using Markov clustering with pigeon-inspired optimization algorithm in HIV (human immunodeficiency virus) | |
CN110838342A (zh) | 基于相似性的病毒-受体相互作用关系预测方法和装置 | |
Ding et al. | Supervised biological network alignment with graph neural networks | |
Huang et al. | Reveel: large-scale population genotyping using low-coverage sequencing data | |
Li et al. | Nonnegative matrix factorization for dynamic modules in cancer attribute temporal networks | |
KR102361615B1 (ko) | 약물 반응 유전자 발현 특성을 이용한 약물 재창출 방법 | |
Reddy et al. | Planted (l, d)-motif finding using particle swarm optimization | |
Sarkar et al. | A new algorithm for counting independent motifs in probabilistic networks | |
Wang et al. | Network insights into improving drug target inference algorithms | |
Li et al. | Inferring DTIs based on similarity clustering and CaGCN-DTI model from heterogeneous network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200717 |
|
CF01 | Termination of patent right due to non-payment of annual fee |