CN107330302A - 联合Memetic算法和S系统的生物模体重构方法 - Google Patents

联合Memetic算法和S系统的生物模体重构方法 Download PDF

Info

Publication number
CN107330302A
CN107330302A CN201710557453.8A CN201710557453A CN107330302A CN 107330302 A CN107330302 A CN 107330302A CN 201710557453 A CN201710557453 A CN 201710557453A CN 107330302 A CN107330302 A CN 107330302A
Authority
CN
China
Prior art keywords
biological
gene
motif
search
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710557453.8A
Other languages
English (en)
Inventor
叶倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Institute of Technology
Original Assignee
Wuxi Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Institute of Technology filed Critical Wuxi Institute of Technology
Priority to CN201710557453.8A priority Critical patent/CN107330302A/zh
Publication of CN107330302A publication Critical patent/CN107330302A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:(1)生成数据;(2)编码;(3)产生初始群体;(4)交叉;(5)变异;(6)计算适应度函数;(7)选择;(8)局部搜索;(9)寻全局最优值。优点:本发明以基因表达响应输出估计标准差为适应度函数,通过个体间的交叉和变异增加了粒子的多样性,利用个体的择优选取和局部搜索来提高优化搜索效率,综合考虑计算复杂度等方面性能,以获得生物模体加权矩阵模体的全局最优结构;在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。

Description

联合Memetic算法和S系统的生物模体重构方法
技术领域
本发明涉及一种联合Memetic算法和S系统的生物模体重构方法,属于生物网络和智能优化领域。
背景技术
基因表达网络和代谢路径这样的复杂调控系统大都是由大量的各种组件组成的,并且这些组件间互相作用的分子生物机制都是非线性的;因此,建模这样复杂的过程需要一个可以足够捕捉系统动态性和揭示实验现象本质的模型表示方法,现有描述基因调控系统的数学方法和模型有很多,如微分方程模型、布尔模型、加权矩阵模型等;S系统作为一种非线性微分方程模型十分适合进行基因调控网络的分析和建模,利用这种结构可以有效判别基因模体的调控作用是否有问题,同时以权值的形式简单描述出基因间相互作用的强度,在系统分析和控制设计方面有一定的优势。
发明内容
本发明提出的是一种联合Memetic算法和S系统的生物模体重构方法,其目的在于综合应用S系统和Memetic优化算法推断基因模体中基因之间的相互关系,提出一种联合Memetic算法和S系统的生物模体重构方法,寻优过程中以基因表达响应输出误差为优化算法的评价函数,充分利用基于种群的全局搜索和基于个体的局部启发式搜索,利用个体的择优选取和局部搜索来提高优化搜索效率,加快算法的求解速度,在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
本发明的技术解决方案:联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:
(1)生成数据:由生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max
(4)交叉:按照杂交概率p c M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:将变异后的新群体作用于S系统获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数;
其中,u i (t)、分别表示基因it时刻真实与预测的基因表达水平;
(7)选择;
(8)局部搜索;
(9)寻全局最优值。
本发明与已有粒子群优化算法相比具有以下优点:本发明基于Memetic算法和S系统的生物模体重构方法结合了群体算法搜索的广度优点和局部搜索算法的深度优点,以基因表达响应输出估计标准差为适应度函数,通过个体间的交叉和变异增加了粒子的多样性,利用个体的择优选取和局部搜索来提高优化搜索效率,综合考虑计算复杂度、快速收敛性、高效搜索能力、全局性等方面性能,以获得生物模体加权矩阵模体的全局最优结构;在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
附图说明
附图1是基于本发明方案的生物模体重构方法流程图。
附图2是基于本发明方案的实施例中系统重构参数集。
具体实施方式
一种联合Memetic算法和S系统的生物模体重构方法,该方法包括如下步骤:
(1)生成数据:由真实生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =2n + 2n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max
(4)交叉:按照杂交概率p c M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:对变异后的新群体作用于S系统获得基因表达的预测序列,再根据适应度函数计算每个个体的适应度函数;
(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体;
(8)局部搜索:对种群中的所有个体采用拟牛顿法进行局部搜索;
(9)寻全局最优值:如果满足停止条件或达到最大迭代次数(k = K max ),则寻优结束,所得到的全局最优值,即为估计生物模体的结构参数值;否则,k:= k + 1, 转步骤(4)。
所述步骤(2)中搜索空间为解空间。
所述步骤(5)中若干指p v M个。
含有n个基因的基因表达状态用n维空间中的向量u(t)表示,u(t)代表一个基因在时刻t的表达水平。
所述S系统是一组由幂率函数构成的生物模体微分方程:
(1)
其中,u i 表示基因i时刻t的表达水平, g ij h ij 是动力学序数,g ij h ij 表示基因i对基因j的影响,表示所有增强u i 影响的作用,表示所有减少u i 影响的作用,α i β i 是速率常数,其中α i >0,β i >0。
所述适应度函数:为了实现基因模体的重构(即估计系统参数α i β i g ij h ij ,通常将时间窗t = (1,2,…,t f )上的真实生物模体的调控输出(即基因表达)与估计S系统预测输出的差的标准差作为适应度函数,即
(2)
其中,u i (t)、分别表示基因it时刻真实与预测的基因表达水平,当E = 0时,说明真实与预测的生物模体结构一致。
所述步骤(8)中,局部搜索策略可采用爬山法、单纯形优化法、共轭梯度法、牛顿法中的任意一种,本发明为了提高局部收敛速度,优选采用拟牛顿法。
本发明以基因表达响应输出标准差为优化算法的评价函数,结合了S系统和具有高效搜索的Memetic算法,通过个体间的交叉和变异增加了粒子的多样性,利用最小化评价函数来确定基因模体模型的最优结构及参数,从而推测出与实验数据相吻合的S系统基因模体结构。
为了更好地理解本发明的技术方案,以下对实施方式作进一步的详细描述,并结合一个应用实例来说明具体实施方式,但不限于此。
实施例1
一种联合Memetic算法和S系统的生物模体重构方法,考察一个含两个状态变量的简化S系统:
(3)
可知,生物模体的基因个数n = 2;假设系统结构已知,但参数未知,从而解空间维数大小简化为D = 12,待估计参数变量为 (1.3,2.2,2.4,1.6, 0,2,2,0,1,0,0,3)。
生物模体重构分为以下几步:
(1)生成数据:由真实生物模体微分方程演化中产生所有基因表达的t f =500个离散时间序列u i (t) (i = 1,2,…,n, t = 1,2,…,t f );
(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解;
(3)产生初始群体:确定搜索种群规模M = 10,解空间维数大小D = 12,取杂交概率p c = 0.95,变异概率p v = 0.1,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max = 8;
(4)交叉:按照杂交概率p c M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:对变异后的新群体按公式(3)获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数:
其中, u i (t)、分别表示基因it时刻真实与预测的基因表达水平;
(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体;
(8)局部搜索:对种群中的所有个体采用拟牛顿法进行局部搜索;
(9)如果满足停止条件或达到最大迭代次数(k = K max ),则寻优结束,所得到的全局最优值,即为估计生物模体的结构参数值;否则,k:= k + 1, 转步骤(4)。
图2显示了基于本发明方案对实施例生物模体S系统的重构参数结果,由图可见,即使进化代数较少的情况下,本发明方案也能得到近似最优S系统结构,表现出较好的优化性能。

Claims (7)

1.联合Memetic算法和S系统的生物模体重构方法,其特征是所述方法包括如下步骤:
(1)生成数据:由生物模体微分方程演化中产生所有基因表达的t f 个离散时间序列u i (t) (i= 1,2,…,n, t = 1,2,…,t f );
(2)编码;
(3)产生初始群体:确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D =n 2,杂交概率p c ,变异概率p v ,随机产生M个初始个体,进化代数变量k = 1,最大进化代数K max
(4)交叉:按照杂交概率p c M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
(5)变异:在杂交运算杂生的新群体中,按照变异概率p v 从中选取若干个体,进行变异操作;
(6)计算适应度函数:将变异后的新群体作用于S系统获得基因表达的预测序列,再根据下述公式计算每个个体的适应度函数;
其中,u i (t)、分别表示基因it时刻真实与预测的基因表达水平;
(7)选择;
(8)局部搜索;
(9)寻全局最优值。
2.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(2)编码:根据生物模体的S系统参数变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解。
3.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(7)选择:从当前群体中选择个适应度最高的个体,舍弃个适应度最低的个体。
4.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(8)局部搜索:采用爬山法、单纯形优化法、共轭梯度法、牛顿法中的任意一种。
5.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述步骤(9)寻全局最优值:如果满足停止条件或达到最大迭代次数,k = K max ,则寻优结束,所得到的全局最优值,即为基因模体的加权矩阵模型权值;否则,k:= k + 1, 转步骤(4)。
6.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述S系统是一组由幂率函数构成的生物模体微分方程:
(1)
其中,u i 表示基因i时刻t的表达水平, g ij h ij 是动力学序数,g ij h ij 表示基因i对基因j的影响,表示所有增强u i 影响的作用,表示所有减少u i 影响的作用,α i β i 是速率常数,其中α i >0,β i >0。
7.根据权利要求1所述的联合Memetic算法和S系统的生物模体重构方法,其特征是所述适应度函数:为了实现基因模体的重构,通常将时间窗t = (1,2,…,t f )上的真实生物模体的调控输出与估计S系统预测输出的差的标准差作为适应度函数,即
(2)
其中,u i (t)、分别表示基因it时刻真实与预测的基因表达水平,当E = 0时,说明真实与预测的生物模体结构一致。
CN201710557453.8A 2017-07-10 2017-07-10 联合Memetic算法和S系统的生物模体重构方法 Pending CN107330302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710557453.8A CN107330302A (zh) 2017-07-10 2017-07-10 联合Memetic算法和S系统的生物模体重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710557453.8A CN107330302A (zh) 2017-07-10 2017-07-10 联合Memetic算法和S系统的生物模体重构方法

Publications (1)

Publication Number Publication Date
CN107330302A true CN107330302A (zh) 2017-11-07

Family

ID=60197435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710557453.8A Pending CN107330302A (zh) 2017-07-10 2017-07-10 联合Memetic算法和S系统的生物模体重构方法

Country Status (1)

Country Link
CN (1) CN107330302A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107612016A (zh) * 2017-08-08 2018-01-19 西安理工大学 基于电压最大相关熵的配电网中分布式电源的规划方法
CN113095467A (zh) * 2021-04-29 2021-07-09 清华大学 一种量子化生物种群数量估计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598657A (zh) * 2013-10-30 2015-05-06 江南大学 一种基于memetic算法的基因模体重构技术
CN104834822A (zh) * 2015-05-15 2015-08-12 无锡职业技术学院 一种基于文化基因算法的传递函数辨识方法
CN104866514A (zh) * 2014-02-26 2015-08-26 江南大学 一种基于Memetic算法的氩原子团簇结构优化技术

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598657A (zh) * 2013-10-30 2015-05-06 江南大学 一种基于memetic算法的基因模体重构技术
CN104866514A (zh) * 2014-02-26 2015-08-26 江南大学 一种基于Memetic算法的氩原子团簇结构优化技术
CN104834822A (zh) * 2015-05-15 2015-08-12 无锡职业技术学院 一种基于文化基因算法的传递函数辨识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
应文豪: "基于软计算的基因调控网络应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107612016A (zh) * 2017-08-08 2018-01-19 西安理工大学 基于电压最大相关熵的配电网中分布式电源的规划方法
CN107612016B (zh) * 2017-08-08 2020-01-14 西安理工大学 基于电压最大相关熵的配电网中分布式电源的规划方法
CN113095467A (zh) * 2021-04-29 2021-07-09 清华大学 一种量子化生物种群数量估计方法

Similar Documents

Publication Publication Date Title
CN109461475B (zh) 一种基于人工神经网络的分子属性预测方法
Li et al. Development and investigation of efficient artificial bee colony algorithm for numerical function optimization
CN104866904B (zh) 一种基于spark的遗传算法优化的BP神经网络并行化方法
Koutnik et al. Evolving neural networks in compressed weight space
CN110168576A (zh) 信息处理设备、方法和计算机可读存储介质
JP2017509953A5 (zh)
CN104516785B (zh) 一种云计算资源调度系统及方法
CN108776820A (zh) 一种利用宽度神经网络改进的随机森林集成方法
CN103593703A (zh) 基于遗传算法的神经网络优化系统及方法
CN104715124B (zh) 一种基于云模型差分演化算法的桁架尺寸优化设计方法
Suganthan Differential evolution algorithm: recent advances
CN103886396A (zh) 一种人工鱼群与粒子群混合优化的确定方法
Buzdalov et al. Generation of tests for programming challenge tasks using multi-objective optimization
CN107330302A (zh) 联合Memetic算法和S系统的生物模体重构方法
CN115829024A (zh) 一种模型训练方法、装置、设备及存储介质
CN104598657B (zh) 一种基于memetic算法的基因模体重构方法
Satapathy et al. Teaching learning based optimization for neural networks learning enhancement
Chen et al. A Spark-based Ant Lion algorithm for parameters optimization of random forest in credit classification
CN111831955B (zh) 一种锂离子电池剩余寿命预测方法及系统
KR102059902B1 (ko) 교통 속도 추정 방법 및 시스템
CN104834822A (zh) 一种基于文化基因算法的传递函数辨识方法
Shieh et al. An efficient method for estimating cluster radius of subtractive clustering based on genetic algorithm
CN113253989B (zh) 基于嵌入式系统的软硬件协同一体化集成架构方法
Shin et al. A surrogate model-based genetic algorithm for the optimal policy in cart-pole balancing environments
Zhao et al. An improved extreme learning machine with adaptive growth of hidden nodes based on particle swarm optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171107