CN101719194B

CN101719194B - 人工基因调控网络的模拟方法

Info

Publication number: CN101719194B
Application number: CN2009101998495A
Authority: CN
Inventors: 张武; 张律文; 张轶雯; 宋安平; 谢江; 封卫兵
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2009-12-03
Filing date: 2009-12-03
Publication date: 2011-08-10
Anticipated expiration: 2029-12-03
Also published as: CN101719194A

Abstract

本发明公开了一种人工基因调控网络的模拟方法，该方法步骤如下：A、根据真实基因调控网络的拓扑特性，构建具有全局稳定不动点的骨架网络；B、将骨架网络中的节点和边进行随机拆分；C、在骨架网络上增加新的节点：D、在新的节点的上产生新的边；E、设定模拟的网络规模，网络中包含R个节点，重复步骤C-D，产生新的节点和新的边，使人工基因调控网络增大，每重复一次，统计一次网络的节点数，直到网络增大到设定的网络规模为止。该方法具有很强的针对性和生物信息学应用性；模拟产生的人工基因调控网络具有动力学稳定性；为基因调控网络构建算法的性能测试提供了多样化人工基因调控网络，为系统生物领域的研究人员提供了新的基因网络模拟工具。

Description

人工基因调控网络的模拟方法

技术领域

本发明涉及计算机技术领域，具体地说是涉及提出了一种人工基因调控网络的模拟方法。

背景技术

随着大通量基因芯片数据的产生，基因调控机制的网络化研究需求日趋迫切。模拟人工基因调控网络是了解基因调控机制、研究基因调控网络结构、网络模块和动力学性质的一项重要手段。

在实际应用中，由于许多构建基因调控网络的算法需要得到详细全面的测试，虽然在真实基因调控网络上可以进行直接而简单的测试实验，但由于已知真实网络的规模有限，类型很少，动力学机制不明等缺点，很容易对特定算法产生偏袒，那么由人工基因调控网络的模拟方法产生的大规模、多类型、参数可控的高可信度基因调控网络就成为公平系统地验证算法的金标准。

现有的人工基因调控网络的模拟方法通过使用随机网络模型来描述基因调控网络的结构，没有将复杂网络模型与经过大量实验证明的真实基因调控网络特征结合起来，因此这些方法产生的人工基因调控网络在拓扑特性上与真实的基因调控网络有很大差距，造成了这些方法在实际应用方面的局限性。

在构建人工基因调控网络的过程中，仅关注网络的整体拓扑结构是不够的，还需要研究基因调控网络的结构性质和整体动力学性质，如动力学稳定。而现有的模拟方法仅仅考虑了网络的拓扑结构，并没有进一步考虑网络的度分布、网络的鲁棒性和稳定性，从而使其产生的人工基因调控网络可信度较低。

目前流行的复杂网络分析方法虽然也能产生人工网络，但产生的网络不具备生物网络的特性，尤其不能呈现出动力学稳定性，因此在生物信息学方面的应用性较差。

发明内容

针对上述现有技术存在的不足和缺点，本发明提供一种人工基因调控网络的模拟方法，该方法能模拟与特定生物网络相似的人工基因调控网络，人工基因调控网络具有动力学稳定性，在拓扑结构上与真实基因调控网络具有高度相似性；通过模拟在拓扑结构上和动力学性质上与真实基因调控网络高度相似的大规模人工网络，为系统生物学领域的研究人员提供了很好的基因网络模拟工具。

为达到上述目的，本发明采用下述技术方案：

上述一种人工基因调控网络的模拟方法，其步骤包括如下：

A、根据真实基因调控网络的拓扑特性，构建具有全局稳定不动点的骨架网络；

B、将骨架网络中的节点和边进行随机拆分：

将骨架网络中的节点和边进行随机拆分为m₀个节点随机分为1个子集，每个子集中均有m₀₁，m₀₂，...，m_0l个节点和e₀₁，e₀₂，...，e_0l条边；

C、在骨架网络上增加新的节点：

将一个新节点被随机分配到1个子集中的其中一个子集中，随着新节点的加入，子集中将产生m条边，其中m≤Min(m₀₁，m₀₂，...，m_0l)；

D、在新的节点上产生新的边；

E、设定模拟的网络规模为，网络中包含R个节点，重复步骤C~D，在骨架网络上产生新的节点和新的边，使人工基因调控网络增大，每重复一次，统计一次网络的节点数，网络增大到设定的网络规模为止。

本发明与已有技术相比较，具有如下面显而易见的突出实质性特点和显著优点：

l、该方法具有很强的针对性和生物信息学应用性，通过根据无标度网络特性构建人工基因调控网络的拓扑结构，它可以模拟拓扑结构上与真实基因调控网络具有高度相似性的人工基因调控网络；

2、该方法模拟产生的人工基因调控网络具有动力学稳定性，使用具有全局稳定不动点的骨架网络的设计，使该骨架网络具有最少的边数且对整个网络的整体动力学性质起决定性作用，模拟产生人工基因调控网络在经历微小的扰动后逐渐趋于稳定；

3、该方法为基因调控网络构建算法的性能测试提供了多样化、大规模的人工基因调控网络，为系统生物领域的研究人员提供了很好的基因网络模拟工具。

附图说明

图1是本发明的人工基因调控网络的模拟方法的流程图；

图2是图1中步骤A所述的构建具有全局稳定不动点的骨架网络的具体流程图；

图3是图3中步骤A3所述的构建具有稳定全局不动点的骨架网的具体流程图；

图4是图l中步骤D所述的在新的节点上产生新的边的具体流程图；

图5是采用本发明的方法所产生的人工基因调控网络的动力学稳定性评估结果图。

具体实施方案：

以下结合附图对本发明的实施例作进一步详细说明。

本实施例中，本发明的人工基因调控网络的模拟方法的实验在上海大学系统生物研究所的集群计算机上运行，该集群由14台IBM HS21刀片服务器和2台x3650服务器组成计算和管理节点，网络连接采用千兆以太网和infiniband 2.5G网。

如图1所示，一种人工基因调控网络的模拟方法，其特征在于：包括以下步骤：

B、将骨架网络中的节点和边进行随机拆分，

将骨架网络中的节点和边进行随机拆分为m₀个节点随机均分为1个子集，每个子集中均有m₀₁，m₀₂，...，m_0l个节点和e₀₁，e₀₂，...，e_0l条边；

C、在骨架网络上增加新的节点；

D、在新的节点上产生新的边；

上述步骤A所述根据真实基因调控网络的拓扑特性，构建为人工基因调控网络构建骨架网络，真实基因调控网络通常具有无标度的拓扑特性，即，越重要的节点，与其连接的节点数越多，因此步骤A中根据无标度拓扑特性构建骨架网络，如图2所示，其具体步骤如下：

A1.设定人工基因调控网络的数学模型，

人工基因调控网络的模型表达式为：

X_{i} (t + 1) = \{\begin{matrix} 1 & Σ_{j = 1}^{N} a_{ij} X_{j} (t) > 0 \\ 0 & Σ_{j = 1}^{N} a_{ij} X_{j} (t) < 0 \\ X_{i} (t) & Σ_{j = 1}^{N} a_{ij} X_{j} (t) = 0 \end{matrix}

其中：

X_i代表第i个节点的状态，1为激活状态，0为抑制状态；

t代表时间；

a_ij为第j个节点对第i个节点的作用系数。

A2、统计骨架网络的规模，即，骨架网络包含m₀个节点和e₀条边；

A3.构建具有稳定全局不动点的骨架网络。

上述步骤A3中所述的构建具有稳定全局不动点的骨架网络，如图3所示，其步骤如下：

A30、构建的骨架网络的拓扑结构；

A31、骨架网络中最少的抑制调控关系是N-1条，即最少的具有抑制作用的边是N-1条。确定骨架网络中最少的抑制调控关系是否是N-1条，若抑制调控关系不是N-1条，则转步骤A30，若抑制调控关系是N-1条，则转步骤A32；

A32.确定骨架网络中第2节点是否抑制其它所有节点，

若第2节点是抑制其它所有节点，则转步骤A30，若抑制调控关系不是抑制其它所有节点，则转步骤A33；

A33.确定骨架网络中每个节点是否均激活第2节点，

若其它所有节点没有全部激活节点2，则转步骤A30，若其它所有节点均激活节点2，则转步骤A34；

A34.设定激活作用线共有N-1条，N为骨架网络中的节点总数，构建成具有全局稳定不动点的骨架网络；

参照图4所示，本发明中在新的节点上产生新的边的步骤包括，

上述步骤D所述的在新的节点上产生新的边，其具体步骤如下：

D1.对新节点以概率p产成新的入边

在新节点以概率p产生m条新的入边时，首先随机为新节点在初始的骨架网络中选择一个子集，然后在该子集中择优选择m-1个节点与新节点相连，产生新的入边；

子集择优选择的原则为：连接节点i的概率p_i取决于该节点的入度。与此同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连。

连接节点i的概率p_i的计算公式如下：

p_{i} = \frac{k_{in}^{i}}{Σ_{k}^{n_{l}} k_{in}^{j}}

上式中：k_in ⁱ表示连接节点i的入度，

表示对有新节点添加的子集中的所有入度进行求和。

D2.对新节点以概率q产生新的出边。

在新节点以概率q产生m条新的出边时，首先随机为新节点在初始的骨架网络中选择一个子集，然后在该子集中择优选择m-1个节点与新节点相连，产生新的出边。

子集择优选择的原则为：连接节点j的概率q_j取决于该节点的出度，与此同时新节点的另一条边也与另一个子集的节点相连。

连接节点j的概率q_j的计算公式如下：

q_{j} = \frac{k_{out}^{j}}{Σ_{j}^{n_{l}} k_{out}^{i}}

上式中：k_out ^j表示连接节点j的出度，

表示对有新节点添加的子集中的所有出度进行求和。

试验1：对本发明人工基因调控网络的模拟方法所产生的人工基因调控网络进行动力学稳定性评估实验，在实验中产生了10个具有不同连接度的人工基因调控网络样本，其平均连接度k＝3.9，抑制作用关系与激活作用关系之比为r＝0.7，网络规模为节点数n＝100，网络拓扑为具有小世界特性的无标度结构。对这10个网络进行动力学稳定性测试，取其平均值作为代表值。施加给系统一个微小的扰动后，整个系统在10个时间步长内迅速收敛并达到平衡状态，其具体估计结果，如图5所示。从图5可以说明：本发明产生的人工基因调控网络具有很好的动力学稳定性。

试验2：本发明人工基因调控网络的模拟方法所产生的人工基因调控网络与真实基因调控网络的参数比较。本实验通过从著名的基因调控和基因组数据库KEGG中收集了人类转录因子调控网络和酵母基因调控网络，将这两种真实基因调控网络的拓扑性质与本发明模拟的网络进行对比，分别比较了网络的平均度、群集系数、平均路径长度和相配混合度，其具体参考表如下：

网络参数

本发明中产生的人工基因调控网络

HTFN

Yeast

平均度	3	3.7	3.7
				群集系数	0.13	0.17	0.15
平均路径长度	4.7	4.5	4.15
				相配混合度	-0.16	-0.18	-0.05

以上比较结果表明，本文模拟的基因调控网络与真实基因调控网络相比具有高度相似性。

试验3：本发明人工基因调控网络的模拟方法所产生的人工基因调控网络与现有技术的几种方法所产生的人工基因调控网络的参数对比，其对比表如下：

由上述对比表可知：本发明产生的人工基因调控网络的规模和不同类型网络的数量均多于其它方法产生的人工基因调控网络。

本发明所述的方法并不限于具体实施方式中所述的实施例，本领域技术人员根据本发明的技术方案得出的其它的实施方式，同样属于本发明的技术创新范围。

Claims

1.一种人工基因调控网络的模拟方法，其特征在于，该方法步骤包括如下：

A、构建具有全局稳定不动点的骨架网络；

B、将骨架网络中的节点和边进行随机拆分：将骨架网络中的节点和边进行随机拆分为m₀个节点和随机均分为l个子集，每个子集中均有m₀₁，m₀₂，...，m_0l个节点和e₀₁，e₀₂，...，e_0l条边；

C、在骨架网络上增加新的节点：

将一个新节点被随机分配到l个子集中的其中一个子集中，随着新节点的加入，子集中将产生m条边，其中m≤Min(m₀₁，m₀₂，...，m_0l)；

D、在新的节点的基础上产生新的边；

E、设定模拟的网络规模为，网络中包含R个节点，重复步骤C-D，在骨架网络上产生新的节点和新的边，使人工基因调控网络增大，每重复一次，统计一次网络的节点数，网络增大到设定的网络规模为止；

所述步骤A的构建具有全局稳定不动点的骨架网络的具体步骤如下：

A1、设定人工基因调控网络的数学模型

人工基因调控网络的模型表达式为：

其中：X_i代表第i个节点的状态，1为激活状态，0为抑制状态；t代表时间；a_ij为第j个节点对第i个节点的作用系数；

A3、构建具有稳定全局不动点的骨架网其步骤如下：

A30、构建的骨架网络的拓扑结构；

A31、骨架网络中最少的抑制调控关系是N-1条，即最少的具有抑制作用的边是N-1条；确定骨架网络中最少的抑制调控关系是否是N-1条，若抑制调控关系不是N-1条，则转步骤A30，若抑制调控关系是N-1条，则转步骤A32；

A32、确定骨架网络中第2节点是否抑制其它所有节点；

A33、确定骨架网络中每个节点是否均激活第2节点，

A34、设定激活作用线共有N-1条，N为骨架网络中的节点总数，构建成具有全局稳定不动点的骨架网络；

上述步骤D的在新的节点的基础上产生新的边的具体步骤如下：

D1、对新节点以概率p产成新的入边：在新节点以概率p产生m条新的入边时，首先随机为新节点在初始的骨架网络中选择一个子集，然后在该子集中择优选择m-1个节点与新节点相连，产生新的入边，子集择优选择的原则为：连接节点i的概率p_i取决于该节点的入度，与此同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连，连接节点i的概率p_i的计算公式如下：

上式中：

表示连接节点i的入度，

表示对有新节点添加的子集中的所有入度进行求和；

D2、对新节点以概率q产生新的出边：在新节点以概率q产生m条新的出边时，首先随机为新节点在初始的骨架网络中选择一个子集，然后在该子集中择优选择m-1个节点与新节点相连，产生新的出边，子集择优选择的原则为：连接节点j的概率q_j取决于该节点的出度，与此同时新节点的另一条边也与另一个子集的节点相连，连接节点j的概率q_j的计算公式如下：

式中：

表示连接节点j的出度，

表示对有新节点添加的子集中的所有出度进行求和。