CN107330302A - 联合Memetic算法和S系统的生物模体重构方法 - Google Patents
联合Memetic算法和S系统的生物模体重构方法 Download PDFInfo
- Publication number
- CN107330302A CN107330302A CN201710557453.8A CN201710557453A CN107330302A CN 107330302 A CN107330302 A CN 107330302A CN 201710557453 A CN201710557453 A CN 201710557453A CN 107330302 A CN107330302 A CN 107330302A
- Authority
- CN
- China
- Prior art keywords
- biological
- reconstructing
- combining
- die body
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 25
- 230000014509 gene expression Effects 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 4
- 238000009396 hybridization Methods 0.000 claims description 15
- 230000035772 mutation Effects 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 8
- 238000000547 structure data Methods 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 230000009194 climbing Effects 0.000 claims description 2
- 238000002939 conjugate gradient method Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 5
- 239000002245 particle Substances 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000007321 biological mechanism Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Physiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:(1)生成数据;(2)编码;(3)产生初始群体;(4)交叉;(5)变异;(6)计算适应度函数;(7)选择;(8)局部搜索;(9)寻全局最优值。优点:本发明以基因表达响应输出估计标准差为适应度函数,通过个体间的交叉和变异增加了粒子的多样性,利用个体的择优选取和局部搜索来提高优化搜索效率,综合考虑计算复杂度等方面性能,以获得生物模体加权矩阵模体的全局最优结构;在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
Description
技术领域
本发明涉及一种联合Memetic算法和S系统的生物模体重构方法,属于生物网络和智能优化领域。
背景技术
基因表达网络和代谢路径这样的复杂调控系统大都是由大量的各种组件组成的,并且这些组件间互相作用的分子生物机制都是非线性的;因此,建模这样复杂的过程需要一个可以足够捕捉系统动态性和揭示实验现象本质的模型表示方法,现有描述基因调控系统的数学方法和模型有很多,如微分方程模型、布尔模型、加权矩阵模型等;S系统作为一种非线性微分方程模型十分适合进行基因调控网络的分析和建模,利用这种结构可以有效判别基因模体的调控作用是否有问题,同时以权值的形式简单描述出基因间相互作用的强度,在系统分析和控制设计方面有一定的优势。
发明内容
本发明提出的是一种联合Memetic算法和S系统的生物模体重构方法,其目的在于综合应用S系统和Memetic优化算法推断基因模体中基因之间的相互关系,提出一种联合Memetic算法和S系统的生物模体重构方法,寻优过程中以基因表达响应输出误差为优化算法的评价函数,充分利用基于种群的全局搜索和基于个体的局部启发式搜索,利用个体的择优选取和局部搜索来提高优化搜索效率,加快算法的求解速度,在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
本发明的技术解决方案:联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:
(1)生成数据:由生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max ;
(4)交叉:按照杂交概率p c 在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:将变异后的新群体作用于S系统获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数;
其中,u i (t)、分别表示基因i在t时刻真实与预测的基因表达水平;
(7)选择;
(8)局部搜索;
(9)寻全局最优值。
本发明与已有粒子群优化算法相比具有以下优点:本发明基于Memetic算法和S系统的生物模体重构方法结合了群体算法搜索的广度优点和局部搜索算法的深度优点,以基因表达响应输出估计标准差为适应度函数,通过个体间的交叉和变异增加了粒子的多样性,利用个体的择优选取和局部搜索来提高优化搜索效率,综合考虑计算复杂度、快速收敛性、高效搜索能力、全局性等方面性能,以获得生物模体加权矩阵模体的全局最优结构;在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
附图说明
附图1是基于本发明方案的生物模体重构方法流程图。
附图2是基于本发明方案的实施例中系统重构参数集。
具体实施方式
一种联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:
(1)生成数据:由真实生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =2n + 2n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max ;
(4)交叉:按照杂交概率p c 在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:对变异后的新群体作用于S系统获得基因表达的预测序列,再根据适应度函数计算每个个体的适应度函数;
(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体;
(8)局部搜索:对种群中的所有个体采用拟牛顿法进行局部搜索;
(9)寻全局最优值:如果满足停止条件或达到最大迭代次数(k = K max ),则寻优结束,所得到的全局最优值,即为估计生物模体的结构参数值;否则,k:= k + 1, 转步骤(4)。
所述步骤(2)中搜索空间为解空间。
所述步骤(5)中若干指p v M个。
含有n个基因的基因表达状态用n维空间中的向量u(t)表示,u(t)代表一个基因在时刻t的表达水平。
所述S系统是一组由幂率函数构成的生物模体微分方程:
(1)
其中,u i 表示基因i时刻t的表达水平, g ij 和h ij 是动力学序数,g ij 和h ij 表示基因i对基因j的影响,表示所有增强u i 影响的作用,表示所有减少u i 影响的作用,α i 和β i 是速率常数,其中α i >0,β i >0。
所述适应度函数:为了实现基因模体的重构(即估计系统参数α i 、β i 、g ij 和h ij ,通常将时间窗t = (1,2,…,t f )上的真实生物模体的调控输出(即基因表达)与估计S系统预测输出的差的标准差作为适应度函数,即
(2)
其中,u i (t)、分别表示基因i在t时刻真实与预测的基因表达水平,当E = 0时,说明真实与预测的生物模体结构一致。
所述步骤(8)中,局部搜索策略可采用爬山法、单纯形优化法、共轭梯度法、牛顿法中的任意一种,本发明为了提高局部收敛速度,优选采用拟牛顿法。
本发明以基因表达响应输出标准差为优化算法的评价函数,结合了S系统和具有高效搜索的Memetic算法,通过个体间的交叉和变异增加了粒子的多样性,利用最小化评价函数来确定基因模体模型的最优结构及参数,从而推测出与实验数据相吻合的S系统基因模体结构。
为了更好地理解本发明的技术方案,以下对实施方式作进一步的详细描述,并结合一个应用实例来说明具体实施方式,但不限于此。
实施例1
一种联合Memetic算法和S系统的生物模体重构方法,考察一个含两个状态变量的简化S系统:
(3)
可知,生物模体的基因个数n = 2;假设系统结构已知,但参数未知,从而解空间维数大小简化为D = 12,待估计参数变量为 (1.3,2.2,2.4,1.6, 0,2,2,0,1,0,0,3)。
生物模体重构分为以下几步:
(1)生成数据:由真实生物模体微分方程演化中产生所有基因表达的t f =500个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解;
(3)产生初始群体:确定搜索种群规模M = 10,解空间维数大小D = 12,取杂交概率p c = 0.95,变异概率p v = 0.1,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max = 8;
(4)交叉:按照杂交概率p c 在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:对变异后的新群体按公式(3)获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数:
其中, u i (t)、分别表示基因i在t时刻真实与预测的基因表达水平;
(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体;
(8)局部搜索:对种群中的所有个体采用拟牛顿法进行局部搜索;
(9)如果满足停止条件或达到最大迭代次数(k = K max ),则寻优结束,所得到的全局最优值,即为估计生物模体的结构参数值;否则,k:= k + 1, 转步骤(4)。
图2显示了基于本发明方案对实施例生物模体S系统的重构参数结果,由图可见,即使进化代数较少的情况下,本发明方案也能得到近似最优S系统结构,表现出较好的优化性能。
Claims (7)
1.联合Memetic算法和S系统的生物模体重构方法,其特征是所述方法包括如下步骤:
(1)生成数据:由生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i= 1,2,…,n, t = 1,2,…,t f );
(2)编码;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max ;
(4)交叉:按照杂交概率p c 在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:将变异后的新群体作用于S系统获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数;
其中,u i (t)、分别表示基因i在t时刻真实与预测的基因表达水平;
(7)选择;
(8)局部搜索;
(9)寻全局最优值。
2.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解。
3.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体。
4.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(8)局部搜索:采用爬山法、单纯形优化法、共轭梯度法、牛顿法中的任意一种。
5.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(9)寻全局最优值:如果满足停止条件或达到最大迭代次数,k = K max ,则寻优结束,所得到的全局最优值,即为基因模体的加权矩阵模型权值;否则,k:= k + 1, 转步骤(4)。
6.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述S系统是一组由幂率函数构成的生物模体微分方程:
(1)
其中,u i 表示基因i时刻t的表达水平, g ij 和h ij 是动力学序数,g ij 和h ij 表示基因i对基因j的影响,表示所有增强u i 影响的作用,表示所有减少u i 影响的作用,α i 和β i 是速率常数,其中α i >0,β i >0。
7.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述适应度函数:为了实现基因模体的重构,通常将时间窗t = (1,2,…,t f )上的真实生物模体的调控输出与估计S系统预测输出的差的标准差作为适应度函数,即
(2)
其中,u i (t)、分别表示基因i在t时刻真实与预测的基因表达水平,当E = 0时,说明真实与预测的生物模体结构一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710557453.8A CN107330302A (zh) | 2017-07-10 | 2017-07-10 | 联合Memetic算法和S系统的生物模体重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710557453.8A CN107330302A (zh) | 2017-07-10 | 2017-07-10 | 联合Memetic算法和S系统的生物模体重构方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107330302A true CN107330302A (zh) | 2017-11-07 |
Family
ID=60197435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710557453.8A Pending CN107330302A (zh) | 2017-07-10 | 2017-07-10 | 联合Memetic算法和S系统的生物模体重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330302A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107612016A (zh) * | 2017-08-08 | 2018-01-19 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN113095467A (zh) * | 2021-04-29 | 2021-07-09 | 清华大学 | 一种量子化生物种群数量估计方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598657A (zh) * | 2013-10-30 | 2015-05-06 | 江南大学 | 一种基于memetic算法的基因模体重构技术 |
CN104834822A (zh) * | 2015-05-15 | 2015-08-12 | 无锡职业技术学院 | 一种基于文化基因算法的传递函数辨识方法 |
CN104866514A (zh) * | 2014-02-26 | 2015-08-26 | 江南大学 | 一种基于Memetic算法的氩原子团簇结构优化技术 |
-
2017
- 2017-07-10 CN CN201710557453.8A patent/CN107330302A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598657A (zh) * | 2013-10-30 | 2015-05-06 | 江南大学 | 一种基于memetic算法的基因模体重构技术 |
CN104866514A (zh) * | 2014-02-26 | 2015-08-26 | 江南大学 | 一种基于Memetic算法的氩原子团簇结构优化技术 |
CN104834822A (zh) * | 2015-05-15 | 2015-08-12 | 无锡职业技术学院 | 一种基于文化基因算法的传递函数辨识方法 |
Non-Patent Citations (1)
Title |
---|
应文豪: "基于软计算的基因调控网络应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107612016A (zh) * | 2017-08-08 | 2018-01-19 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN107612016B (zh) * | 2017-08-08 | 2020-01-14 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN113095467A (zh) * | 2021-04-29 | 2021-07-09 | 清华大学 | 一种量子化生物种群数量估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | LLR: Learning learning rates by LSTM for training neural networks | |
Agrawal et al. | Abcd-strategy: Budgeted experimental design for targeted causal structure discovery | |
CN103345657B (zh) | 云计算环境下基于遗传和蚁群的任务调度方法 | |
CN107330902B (zh) | 基于Arnold变换的混沌遗传BP神经网络图像分割方法 | |
Huang et al. | Particle swarm optimization for compact neural architecture search for image classification | |
CN112132469B (zh) | 一种基于多种群协作粒子群算法的水库群调度方法和系统 | |
CN112163671A (zh) | 一种新能源场景生成方法及系统 | |
CN107330302A (zh) | 联合Memetic算法和S系统的生物模体重构方法 | |
CN116644804A (zh) | 分布式训练系统、神经网络模型训练方法、设备和介质 | |
Ong et al. | Special issue on emerging trends in soft computing: memetic algorithms | |
CN104598657B (zh) | 一种基于memetic算法的基因模体重构方法 | |
CN109408896A (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 | |
Babichev et al. | A hybrid model of gene expression profiles reducing based on the complex use of fuzzy inference system and clustering quality criteria | |
CN103761567A (zh) | 一种基于贝叶斯估计的小波神经网络权值初始化方法 | |
CN110851257A (zh) | 一种基于前期灾变策略的遗传与差分混合进化云计算任务调度算法 | |
CN109711543A (zh) | 一种可重构的深度置信网络实现系统 | |
CN102323983B (zh) | 一种自动提供优化的合成射流参数的方法 | |
CN104021563B (zh) | 基于多目标模糊聚类和反对学习的噪声图像分割方法 | |
Jiang et al. | A parallel based evolutionary algorithm with primary-auxiliary knowledge | |
CN104866514A (zh) | 一种基于Memetic算法的氩原子团簇结构优化技术 | |
Lou et al. | Leveraging Joint-action Embedding in Multi-agent Reinforcement Learning for Cooperative Games | |
Wang et al. | Generating new protein sequences by using dense network and attention mechanism | |
CN111738432A (zh) | 一种支持自适应并行计算的神经网络处理电路 | |
Tien et al. | Hybrid taguchi-chaos of artificial bee colony algorithm for global numerical optimization | |
US20220343162A1 (en) | Method for structure learning and model compression for deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171107 |
|
RJ01 | Rejection of invention patent application after publication |