CN101719194B - 人工基因调控网络的模拟方法 - Google Patents
人工基因调控网络的模拟方法 Download PDFInfo
- Publication number
- CN101719194B CN101719194B CN2009101998495A CN200910199849A CN101719194B CN 101719194 B CN101719194 B CN 101719194B CN 2009101998495 A CN2009101998495 A CN 2009101998495A CN 200910199849 A CN200910199849 A CN 200910199849A CN 101719194 B CN101719194 B CN 101719194B
- Authority
- CN
- China
- Prior art keywords
- node
- network
- new
- limit
- back bone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种人工基因调控网络的模拟方法,该方法步骤如下:A、根据真实基因调控网络的拓扑特性,构建具有全局稳定不动点的骨架网络;B、将骨架网络中的节点和边进行随机拆分;C、在骨架网络上增加新的节点:D、在新的节点的上产生新的边;E、设定模拟的网络规模,网络中包含R个节点,重复步骤C-D,产生新的节点和新的边,使人工基因调控网络增大,每重复一次,统计一次网络的节点数,直到网络增大到设定的网络规模为止。该方法具有很强的针对性和生物信息学应用性;模拟产生的人工基因调控网络具有动力学稳定性;为基因调控网络构建算法的性能测试提供了多样化人工基因调控网络,为系统生物领域的研究人员提供了新的基因网络模拟工具。
Description
技术领域
本发明涉及计算机技术领域,具体地说是涉及提出了一种人工基因调控网络的模拟方法。
背景技术
随着大通量基因芯片数据的产生,基因调控机制的网络化研究需求日趋迫切。模拟人工基因调控网络是了解基因调控机制、研究基因调控网络结构、网络模块和动力学性质的一项重要手段。
在实际应用中,由于许多构建基因调控网络的算法需要得到详细全面的测试,虽然在真实基因调控网络上可以进行直接而简单的测试实验,但由于已知真实网络的规模有限,类型很少,动力学机制不明等缺点,很容易对特定算法产生偏袒,那么由人工基因调控网络的模拟方法产生的大规模、多类型、参数可控的高可信度基因调控网络就成为公平系统地验证算法的金标准。
现有的人工基因调控网络的模拟方法通过使用随机网络模型来描述基因调控网络的结构,没有将复杂网络模型与经过大量实验证明的真实基因调控网络特征结合起来,因此这些方法产生的人工基因调控网络在拓扑特性上与真实的基因调控网络有很大差距,造成了这些方法在实际应用方面的局限性。
在构建人工基因调控网络的过程中,仅关注网络的整体拓扑结构是不够的,还需要研究基因调控网络的结构性质和整体动力学性质,如动力学稳定。而现有的模拟方法仅仅考虑了网络的拓扑结构,并没有进一步考虑网络的度分布、网络的鲁棒性和稳定性,从而使其产生的人工基因调控网络可信度较低。
目前流行的复杂网络分析方法虽然也能产生人工网络,但产生的网络不具备生物网络的特性,尤其不能呈现出动力学稳定性,因此在生物信息学方面的应用性较差。
发明内容
针对上述现有技术存在的不足和缺点,本发明提供一种人工基因调控网络的模拟方法,该方法能模拟与特定生物网络相似的人工基因调控网络,人工基因调控网络具有动力学稳定性,在拓扑结构上与真实基因调控网络具有高度相似性;通过模拟在拓扑结构上和动力学性质上与真实基因调控网络高度相似的大规模人工网络,为系统生物学领域的研究人员提供了很好的基因网络模拟工具。
为达到上述目的,本发明采用下述技术方案:
上述一种人工基因调控网络的模拟方法,其步骤包括如下:
A、根据真实基因调控网络的拓扑特性,构建具有全局稳定不动点的骨架网络;
B、将骨架网络中的节点和边进行随机拆分:
将骨架网络中的节点和边进行随机拆分为m0个节点随机分为1个子集,每个子集中均有m01,m02,...,m0l个节点和e01,e02,...,e0l条边;
C、在骨架网络上增加新的节点:
将一个新节点被随机分配到1个子集中的其中一个子集中,随着新节点的加入,子集中将产生m条边,其中m≤Min(m01,m02,...,m0l);
D、在新的节点上产生新的边;
E、设定模拟的网络规模为,网络中包含R个节点,重复步骤C~D,在骨架网络上产生新的节点和新的边,使人工基因调控网络增大,每重复一次,统计一次网络的节点数,网络增大到设定的网络规模为止。
本发明与已有技术相比较,具有如下面显而易见的突出实质性特点和显著优点:
l、该方法具有很强的针对性和生物信息学应用性,通过根据无标度网络特性构建人工基因调控网络的拓扑结构,它可以模拟拓扑结构上与真实基因调控网络具有高度相似性的人工基因调控网络;
2、该方法模拟产生的人工基因调控网络具有动力学稳定性,使用具有全局稳定不动点的骨架网络的设计,使该骨架网络具有最少的边数且对整个网络的整体动力学性质起决定性作用,模拟产生人工基因调控网络在经历微小的扰动后逐渐趋于稳定;
3、该方法为基因调控网络构建算法的性能测试提供了多样化、大规模的人工基因调控网络,为系统生物领域的研究人员提供了很好的基因网络模拟工具。
附图说明
图1是本发明的人工基因调控网络的模拟方法的流程图;
图2是图1中步骤A所述的构建具有全局稳定不动点的骨架网络的具体流程图;
图3是图3中步骤A3所述的构建具有稳定全局不动点的骨架网的具体流程图;
图4是图l中步骤D所述的在新的节点上产生新的边的具体流程图;
图5是采用本发明的方法所产生的人工基因调控网络的动力学稳定性评估结果图。
具体实施方案:
以下结合附图对本发明的实施例作进一步详细说明。
本实施例中,本发明的人工基因调控网络的模拟方法的实验在上海大学系统生物研究所的集群计算机上运行,该集群由14台IBM HS21刀片服务器和2台x3650服务器组成计算和管理节点,网络连接采用千兆以太网和infiniband 2.5G网。
如图1所示,一种人工基因调控网络的模拟方法,其特征在于:包括以下步骤:
A、根据真实基因调控网络的拓扑特性,构建具有全局稳定不动点的骨架网络;
B、将骨架网络中的节点和边进行随机拆分,
将骨架网络中的节点和边进行随机拆分为m0个节点随机均分为1个子集,每个子集中均有m01,m02,...,m0l个节点和e01,e02,...,e0l条边;
C、在骨架网络上增加新的节点;
将一个新节点被随机分配到1个子集中的其中一个子集中,随着新节点的加入,子集中将产生m条边,其中m≤Min(m01,m02,...,m0l);
D、在新的节点上产生新的边;
E、设定模拟的网络规模为,网络中包含R个节点,重复步骤C~D,在骨架网络上产生新的节点和新的边,使人工基因调控网络增大,每重复一次,统计一次网络的节点数,网络增大到设定的网络规模为止。
上述步骤A所述根据真实基因调控网络的拓扑特性,构建为人工基因调控网络构建骨架网络,真实基因调控网络通常具有无标度的拓扑特性,即,越重要的节点,与其连接的节点数越多,因此步骤A中根据无标度拓扑特性构建骨架网络,如图2所示,其具体步骤如下:
A1.设定人工基因调控网络的数学模型,
人工基因调控网络的模型表达式为:
其中:
Xi代表第i个节点的状态,1为激活状态,0为抑制状态;
t代表时间;
aij为第j个节点对第i个节点的作用系数。
A2、统计骨架网络的规模,即,骨架网络包含m0个节点和e0条边;
A3.构建具有稳定全局不动点的骨架网络。
上述步骤A3中所述的构建具有稳定全局不动点的骨架网络,如图3所示,其步骤如下:
A30、构建的骨架网络的拓扑结构;
A31、骨架网络中最少的抑制调控关系是N-1条,即最少的具有抑制作用的边是N-1条。确定骨架网络中最少的抑制调控关系是否是N-1条,若抑制调控关系不是N-1条,则转步骤A30,若抑制调控关系是N-1条,则转步骤A32;
A32.确定骨架网络中第2节点是否抑制其它所有节点,
若第2节点是抑制其它所有节点,则转步骤A30,若抑制调控关系不是抑制其它所有节点,则转步骤A33;
A33.确定骨架网络中每个节点是否均激活第2节点,
若其它所有节点没有全部激活节点2,则转步骤A30,若其它所有节点均激活节点2,则转步骤A34;
A34.设定激活作用线共有N-1条,N为骨架网络中的节点总数,构建成具有全局稳定不动点的骨架网络;
参照图4所示,本发明中在新的节点上产生新的边的步骤包括,
上述步骤D所述的在新的节点上产生新的边,其具体步骤如下:
D1.对新节点以概率p产成新的入边
在新节点以概率p产生m条新的入边时,首先随机为新节点在初始的骨架网络中选择一个子集,然后在该子集中择优选择m-1个节点与新节点相连,产生新的入边;
子集择优选择的原则为:连接节点i的概率pi取决于该节点的入度。与此同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连。
连接节点i的概率pi的计算公式如下:
D2.对新节点以概率q产生新的出边。
在新节点以概率q产生m条新的出边时,首先随机为新节点在初始的骨架网络中选择一个子集,然后在该子集中择优选择m-1个节点与新节点相连,产生新的出边。
子集择优选择的原则为:连接节点j的概率qj取决于该节点的出度,与此同时新节点的另一条边也与另一个子集的节点相连。
连接节点j的概率qj的计算公式如下:
试验1:对本发明人工基因调控网络的模拟方法所产生的人工基因调控网络进行动力学稳定性评估实验,在实验中产生了10个具有不同连接度的人工基因调控网络样本,其平均连接度k=3.9,抑制作用关系与激活作用关系之比为r=0.7,网络规模为节点数n=100,网络拓扑为具有小世界特性的无标度结构。对这10个网络进行动力学稳定性测试,取其平均值作为代表值。施加给系统一个微小的扰动后,整个系统在10个时间步长内迅速收敛并达到平衡状态,其具体估计结果,如图5所示。从图5可以说明:本发明产生的人工基因调控网络具有很好的动力学稳定性。
试验2:本发明人工基因调控网络的模拟方法所产生的人工基因调控网络与真实基因调控网络的参数比较。本实验通过从著名的基因调控和基因组数据库KEGG中收集了人类转录因子调控网络和酵母基因调控网络,将这两种真实基因调控网络的拓扑性质与本发明模拟的网络进行对比,分别比较了网络的平均度、群集系数、平均路径长度和相配混合度,其具体参考表如下:
网络参数 | 本发明中产生的人工基因调控网络 | HTFN | Yeast |
平均度 | 3 | 3.7 | 3.7 |
群集系数 | 0.13 | 0.17 | 0.15 |
平均路径长度 | 4.7 | 4.5 | 4.15 |
相配混合度 | -0.16 | -0.18 | -0.05 |
以上比较结果表明,本文模拟的基因调控网络与真实基因调控网络相比具有高度相似性。
试验3:本发明人工基因调控网络的模拟方法所产生的人工基因调控网络与现有技术的几种方法所产生的人工基因调控网络的参数对比,其对比表如下:
由上述对比表可知:本发明产生的人工基因调控网络的规模和不同类型网络的数量均多于其它方法产生的人工基因调控网络。
本发明所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出的其它的实施方式,同样属于本发明的技术创新范围。
Claims (1)
1.一种人工基因调控网络的模拟方法,其特征在于,该方法步骤包括如下:
A、构建具有全局稳定不动点的骨架网络;
B、将骨架网络中的节点和边进行随机拆分:将骨架网络中的节点和边进行随机拆分为m0个节点和随机均分为l个子集,每个子集中均有m01,m02,...,m0l个节点和e01,e02,...,e0l条边;
C、在骨架网络上增加新的节点:
将一个新节点被随机分配到l个子集中的其中一个子集中,随着新节点的加入,子集中将产生m条边,其中m≤Min(m01,m02,...,m0l);
D、在新的节点的基础上产生新的边;
E、设定模拟的网络规模为,网络中包含R个节点,重复步骤C-D,在骨架网络上产生新的节点和新的边,使人工基因调控网络增大,每重复一次,统计一次网络的节点数,网络增大到设定的网络规模为止;
所述步骤A的构建具有全局稳定不动点的骨架网络的具体步骤如下:
A1、设定人工基因调控网络的数学模型
人工基因调控网络的模型表达式为:
其中:Xi代表第i个节点的状态,1为激活状态,0为抑制状态;t代表时间;aij为第j个节点对第i个节点的作用系数;
A2、统计骨架网络的规模,即,骨架网络包含m0个节点和e0条边;
A3、构建具有稳定全局不动点的骨架网其步骤如下:
A30、构建的骨架网络的拓扑结构;
A31、骨架网络中最少的抑制调控关系是N-1条,即最少的具有抑制作用的边是N-1条;确定骨架网络中最少的抑制调控关系是否是N-1条,若抑制调控关系不是N-1条,则转步骤A30,若抑制调控关系是N-1条,则转步骤A32;
A32、确定骨架网络中第2节点是否抑制其它所有节点;
若第2节点是抑制其它所有节点,则转步骤A30,若抑制调控关系不是抑制其它所有节点,则转步骤A33;
A33、确定骨架网络中每个节点是否均激活第2节点,
若其它所有节点没有全部激活节点2,则转步骤A30,若其它所有节点均激活节点2,则转步骤A34;
A34、设定激活作用线共有N-1条,N为骨架网络中的节点总数,构建成具有全局稳定不动点的骨架网络;
上述步骤D的在新的节点的基础上产生新的边的具体步骤如下:
D1、对新节点以概率p产成新的入边:在新节点以概率p产生m条新的入边时,首先随机为新节点在初始的骨架网络中选择一个子集,然后在该子集中择优选择m-1个节点与新节点相连,产生新的入边,子集择优选择的原则为:连接节点i的概率pi取决于该节点的入度,与此同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连,连接节点i的概率pi的计算公式如下:
D2、对新节点以概率q产生新的出边:在新节点以概率q产生m条新的出边时,首先随机为新节点在初始的骨架网络中选择一个子集,然后在该子集中择优选择m-1个节点与新节点相连,产生新的出边,子集择优选择的原则为:连接节点j的概率qj取决于该节点的出度,与此同时新节点的另一条边也与另一个子集的节点相连,连接节点j的概率qj的计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101998495A CN101719194B (zh) | 2009-12-03 | 2009-12-03 | 人工基因调控网络的模拟方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101998495A CN101719194B (zh) | 2009-12-03 | 2009-12-03 | 人工基因调控网络的模拟方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101719194A CN101719194A (zh) | 2010-06-02 |
CN101719194B true CN101719194B (zh) | 2011-08-10 |
Family
ID=42433768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101998495A Expired - Fee Related CN101719194B (zh) | 2009-12-03 | 2009-12-03 | 人工基因调控网络的模拟方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101719194B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306251B (zh) * | 2011-09-20 | 2015-01-07 | 东南大学 | 新型生物网络模型的构建方法 |
CN106874704B (zh) * | 2017-01-04 | 2019-02-19 | 湖南大学 | 一种基于线性模型的基因共调控网络中关键调控子识别方法 |
CN107220435A (zh) * | 2017-05-26 | 2017-09-29 | 西北工业大学 | 意象驱动的产品形态基因网络模型构建方法 |
CN109409522B (zh) * | 2018-08-29 | 2022-04-12 | 浙江大学 | 一种基于集成学习的生物网络推理算法 |
CN109378030A (zh) * | 2018-09-27 | 2019-02-22 | 南京师范大学 | 基于基因调控网络的逻辑信号处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1560271A (zh) * | 2004-02-18 | 2005-01-05 | 中国科学院计算技术研究所 | 由连续的基因表达谱构建基因调控网络方法 |
US7430475B2 (en) * | 2001-09-26 | 2008-09-30 | Gni Kk | Biological discovery using gene regulatory networks generated from multiple-disruption expression libraries |
-
2009
- 2009-12-03 CN CN2009101998495A patent/CN101719194B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7430475B2 (en) * | 2001-09-26 | 2008-09-30 | Gni Kk | Biological discovery using gene regulatory networks generated from multiple-disruption expression libraries |
CN1560271A (zh) * | 2004-02-18 | 2005-01-05 | 中国科学院计算技术研究所 | 由连续的基因表达谱构建基因调控网络方法 |
Non-Patent Citations (1)
Title |
---|
王丽琴等.构建基因调控布尔网络及其动态分析.《现代电子技术》.2008,第31卷(第7期),151-153. * |
Also Published As
Publication number | Publication date |
---|---|
CN101719194A (zh) | 2010-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A BP neural network model optimized by mind evolutionary algorithm for predicting the ocean wave heights | |
CN101719194B (zh) | 人工基因调控网络的模拟方法 | |
CN102063339B (zh) | 基于云计算系统的资源负载均衡的方法和设备 | |
CN107862411A (zh) | 一种大规模柔性作业车间调度优化方法 | |
Zhou et al. | A combined forecasting system based on modified multi-objective optimization and sub-model selection strategy for short-term wind speed | |
CN107609650B (zh) | 基于时间负载均衡的粒子遗传算法优化方法、装置及系统 | |
Hardiansyah et al. | Solving economic load dispatch problem using particle swarm optimization technique | |
CN103996074A (zh) | 基于cfd和改进pso的复杂地形风电场微观选址方法 | |
CN103870474A (zh) | 一种新闻话题组织方法及装置 | |
CN106779177A (zh) | 基于粒子群优化的多分辨率小波神经网络用电量预测方法 | |
CN107609141A (zh) | 一种对大规模可再生能源数据进行快速概率建模方法 | |
CN113422695A (zh) | 一种提高物联网拓扑结构鲁棒性能的优化方法 | |
Liu et al. | Parameter calibration in wake effect simulation model with stochastic gradient descent and stratified sampling | |
CN103020709A (zh) | 一种基于人工蜂群算法和量子粒子群算法的优化计算方法 | |
Sadeghian et al. | A clustering‐based technoeconomic analysis for wind farm and shunt capacitor allocation in radial distribution systems | |
CN106022936B (zh) | 适用论文合作网络的基于社团结构的影响最大化算法 | |
Hui et al. | Short-term load forecasting model based on deep neural network | |
CN104331738B (zh) | 基于博弈和遗传算法的网络重构算法 | |
CN109885401B (zh) | 基于lpt局部优化的结构化网格负载平衡方法 | |
CN110336332B (zh) | 一种基于出力曲线聚合的区间潮流典型场景构造方法 | |
Radicchi et al. | Renormalization flows in complex networks | |
CN104268639A (zh) | 一种基于森林模型与改进遗传算法的船舶引航排班方法 | |
Yang et al. | Forecasting the production abilities of recycling systems: A DEA based research | |
Zhu et al. | Community mining in complex network based on parallel genetic algorithm | |
Garbea et al. | Clustering-Using Data Mining-based Application to Identify the Hourly Loading Patterns of the Generation Units from the Hydropower Plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110810 Termination date: 20141203 |
|
EXPY | Termination of patent right or utility model |