CN104598657B - 一种基于memetic算法的基因模体重构方法 - Google Patents

一种基于memetic算法的基因模体重构方法 Download PDF

Info

Publication number
CN104598657B
CN104598657B CN201310525115.8A CN201310525115A CN104598657B CN 104598657 B CN104598657 B CN 104598657B CN 201310525115 A CN201310525115 A CN 201310525115A CN 104598657 B CN104598657 B CN 104598657B
Authority
CN
China
Prior art keywords
gene
die body
mrow
individual
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310525115.8A
Other languages
English (en)
Other versions
CN104598657A (zh
Inventor
楼旭阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhitao Science & Technology Co ltd
Shanghai Genomics Inc
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201310525115.8A priority Critical patent/CN104598657B/zh
Publication of CN104598657A publication Critical patent/CN104598657A/zh
Application granted granted Critical
Publication of CN104598657B publication Critical patent/CN104598657B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于memetic算法的基因模体重构技术,结合了群体算法搜索的广度优点和局部搜索算法的深度优点,以基因表达响应输出误差为优化算法的评价函数,通过个体间的交叉和变异增加了粒子的多样性,利用最小化评价函数来确定基因模体加权矩阵模型的最优结构及参数,从而推测出与实验数据相吻合的基因模体结构。

Description

一种基于memetic算法的基因模体重构方法
技术领域
本发明涉及生物网络和智能优化领域,具体地说是一种基于memetic算法的基因模体重构方法。
背景技术
基因网络研究是当前国内外研究的前沿课题,其主要目的是通过建立基因转录调控网络模型对某个物种或组织中全部基因的表达关系进行整体的模拟分析和研究。量化方法是基因调控网络研究中一种有效的策略,可以从一个侧面对基因表达过程中的信息进行挖掘,通过信息提取、分析,了解基因功能,理解遗传网络来弄清疾病发病机制。基因从表达中展示其功能,基因的表达是彼此相互作用和调控的过程。基因调控网络中出现频率非常高的连接子图被称为网络模体,它是基于网络的拓扑连接特征提出来的,是网络中具有简单结构的单元,它表示的是转录因子和靶基因之间相互调控关系的特定小规模模式,通常由少量的基因按照一定的拓扑结构构成。
描述基因调控系统的数学方法和模型有很多,如微分方程模型、布尔模型等。加权矩阵模型是其中一种建模基因调控网络的方法,利用这种结构可以有效判别基因模体的调控作用是否有问题,同时以权值的形式简单描述出基因间相互作用的强度,在系统分析和控制设计方面有一定的优势。
发明内容
本发明的目的在于综合应用加权矩阵模型和memetic优化算法推断基因模体中基因之间的相互关系,提出一种基于memetic算法的基因模体重构方法,寻优过程中以基因表达响应输出误差为优化算法的评价函数,充分利用基于种群的全局搜索和基于个体的局部启发式搜索,通过优化种群分布,及早剔除不良个体,加快算法的求解速度,在保证较高收敛性能的基础上,提高全局搜索能力,获得高质量的解,以推测出与实验数据最符合的基因模体结构。
在基因网络模体的加权矩阵模型中,一个基因的表达值是其他基因表达值的函数。含有个基因的基因表达状态用n维空间中的向量u(t)表示,u(t)代表一个基因在时刻t的表达水平。以一个加权矩阵W=(wij)n×n表示基因之间的相互调控作用,wij代表基因j的表达水平对基因i的影响。基因i的总调控输入ri(t)为
若wij为正值,则基因j激发基因i的表达;若wij为负值表示基因j抑制基因i的表达;若wij为0,则表示基因j对基因i没有作用。基因i的下一时刻表达水平可以用非线性映射表示:
为了实现基因模体的重构,将时间窗t=(1,2,…,tf)上的真实基因模体的调控输出(即基因表达)与估计加权矩阵模型得到的预测输出的均方差作为适应度函数,即
其中,ui(t)、分别表示基因i在t时刻真实与预测的基因表达水平。当E=0时,说明真实与预测的基因模体结构一致。
本发明采用的技术方案包含如下步骤:
步骤1:生成数据。由真实基因模体调控作用中产生所有基因表达的tf个离散时间序列ui(t),i=(1,2,…,n),t=(1,2,…,tf)。
步骤2:编码。根据基因模体中加权模型权值变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解。
步骤3:产生初始群体。确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D=n2,杂交概率pc,变异概率pv,随机产生M个初始个体,进化代数变量k=1,最大进化代数Kmax
步骤4:交叉。按照杂交概率pc在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体。
步骤5:变异。在杂交运算杂生的新群体中,按照变异概率pv从中选取若干个体,进行变异操作。
步骤6:计算适应度函数。对变异后的新群体按公式(1)、(2)获得基因表达的预测序列再根据基因表达响应输出误差分别计算每个个体的适应度函数,其公式为:
步骤7:选择。从当前群体中选择M个适应度高的个体,选择概率与其适应度成正比,舍弃适应度低的个体。
步骤8:局部搜索。对种群中的所有个体采用拟牛顿法进行局部搜索。
步骤9:如果满足停止条件或达到最大迭代次数(k=Kmax),则寻优结束,所得到的全局最优值,即为基因模体的加权矩阵模型权值;否则,k:=k+1,转步骤4。
本发明与已有粒子群优化算法相比具有以下优点:本发明基于memetic算法的基因模体重构方法结合了群体算法搜索的广度优点和局部搜索算法的深度优点,以基因表达响应输出估计均方差为适应度函数,通过个体间的交叉和变异增加了粒子的多样性,利用个体的择优选取和局部搜索来提高优化搜索效率,综合考虑计算复杂度、快速收敛性、高效搜索能力、全局性等方面性能,以获得基因模体加权矩阵模体的全局最优结构。
附图说明
图1是基于本发明方案的基因模体重构方法流程图。
图2是三个需要重构的基因模体。
图3是基于本发明方案对三个基因模体的重构结果。
具体实施方式
为了更好地理解本发明的技术方案,以下对实施方式作进一步的详细描述,并结合一个应用实例来说明具体实施方式,但不限于此。
实施例:以图2所示三个基因模体为例,采用种群规模M=10,最大进化代数Kmax=16。
本发明方法工作流程如图1所示,具体实施方式可以分为以下几步:
(1)生成数据。由三个真实基因模体分别产生所有基因表达的tf=5个离散时间序列。
(2)编码。根据基因模体中加权模型权值变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,其中D表示解空间维数大小,这些串结构数据不同组合构成不同可行解。
(3)产生初始群体。根据不同模体中基因个数n(n=2,3,4),确定解空间维数大小D=n2,设置搜索种群规模M=10,取杂交概率pc=0.95,变异概率pv=0.1,随机产生M个初始个体,确定进化代数变量k=1,最大进化代数Kmax
(4)交叉。按照杂交概率pc在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体。
(5)变异。在杂交运算杂生的新群体中,按照变异概率pv从中选取若干个体,进行变异操作。
(6)计算适应度函数。对变异后的新群体根据基因表达响应输出误差分别计算每个个体的适应度函数,其公式为:
其中,ui(t)、分别表示基因i在t时刻真实与预测的基因表达水平。
(7)选择。从当前群体中选择M个适应度高的个体,选择概率取为
舍弃适应度低的个体。
(8)局部搜索。对种群中的所有个体采用拟牛顿法进行局部搜索。
(9)如果满足停止条件或达到最大迭代次数(k=Kmax),则寻优结束,所得到的全局最优值,即为氩原子团簇中原子的最优结构分布;否则,k:=k+1,转(4)。
图3显示了基于本发明方案对三个基因模体的重构结果。由图可见,对三个不同基因模体,即使进化代数较少的情况下,本发明方案都能得到近似最优加权矩阵模型结构,表现出较好的优化性能。
上面对本发明所述基于memetic算法的基因模体重构方法进行了详细的说明,但本发明的具体实现形式并不局限于此。对本技术领域的一般技术人员来说,在不背离本发明所述方法的精神和权利要求范围的情况下对它进行的各种显而易见的改变都在本发明的保护范围之内。

Claims (2)

1.一种基于memetic算法的基因模体重构方法,其特征是所述方法包括如下步骤:
步骤1:生成数据,由真实基因模体调控作用中产生所有基因表达的tf个离散时间序列ui(t),i=(1,2,…,n),t=(1,2,…,tf);
步骤2:编码,根据基因模体中加权模型权值变量的解空间,将可行解数据表示成搜索空间的浮点型串结构数据,这些串结构数据不同组合构成不同可行解;
步骤3:产生初始群体,确定网络模体的基因个数n,搜索种群规模M,解空间维数大小D=n2,杂交概率pc,变异概率pv,随机产生M个初始个体,进化代数变量k=1,最大进化代数Kmax
步骤4:交叉,按照杂交概率pc在M个个体中任意选取两个进行杂交运算,产生新一代群体的两个新个体;
步骤5:变异,在杂交运算杂生的新群体中,按照变异概率pv从中选取若干个体,进行变异操作;
步骤6:计算适应度函数,对变异后的新群体根据基因表达响应输出误差分别计算每个个体的适应度函数,其公式为:
<mrow> <mi>E</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>t</mi> <mi>f</mi> </msub> </munderover> <msqrt> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>-</mo> <msub> <mover> <mi>u</mi> <mo>^</mo> </mover> <mi>i</mi> </msub> <mo>(</mo> <mi>t</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow>
其中,ui(t)、分别表示基因i在t时刻真实与预测的基因表达水平;
步骤7:选择,从当前群体中选择M个适应度高的个体,选择概率与其适应度成正比,舍弃适应度低的个体;
步骤8:局部搜索,对种群中的所有个体采用拟牛顿法进行局部搜索;
步骤9:如果满足停止条件或达到最大进化代数,即当进化代数变量k=Kmax时,则寻优结束,所得到的全局最优值,即为基因模体的加权矩阵模型权值;否则,k:=k+1,转步骤4。
2.根据权利要求1所述的一种基于memetic算法的基因模体重构方法,其特征在于:所述步骤8中,局部搜索可采用爬山法、单纯形优化法或共轭梯度法。
CN201310525115.8A 2013-10-30 2013-10-30 一种基于memetic算法的基因模体重构方法 Active CN104598657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310525115.8A CN104598657B (zh) 2013-10-30 2013-10-30 一种基于memetic算法的基因模体重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310525115.8A CN104598657B (zh) 2013-10-30 2013-10-30 一种基于memetic算法的基因模体重构方法

Publications (2)

Publication Number Publication Date
CN104598657A CN104598657A (zh) 2015-05-06
CN104598657B true CN104598657B (zh) 2017-11-03

Family

ID=53124441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310525115.8A Active CN104598657B (zh) 2013-10-30 2013-10-30 一种基于memetic算法的基因模体重构方法

Country Status (1)

Country Link
CN (1) CN104598657B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834832B (zh) * 2015-05-26 2017-12-12 哈尔滨工业大学深圳研究生院 代谢物ms/ms质谱计算机仿真方法
CN107330302A (zh) * 2017-07-10 2017-11-07 无锡职业技术学院 联合Memetic算法和S系统的生物模体重构方法
CN108197432B (zh) * 2017-11-29 2021-04-02 东北电力大学 一种基于基因表达数据的基因调控网络重构方法
CN109919356B (zh) * 2019-01-27 2023-07-21 河北工程大学 一种基于bp神经网络区间需水预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7418690B1 (en) * 2005-04-29 2008-08-26 Altera Corporation Local searching techniques for technology mapping
CN101651982A (zh) * 2009-08-07 2010-02-17 重庆邮电大学 一种基于New-Memetic算法的波束成型方法
CN103164631A (zh) * 2013-04-16 2013-06-19 东华大学 一种智能协同表达基因分析仪

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7418690B1 (en) * 2005-04-29 2008-08-26 Altera Corporation Local searching techniques for technology mapping
CN101651982A (zh) * 2009-08-07 2010-02-17 重庆邮电大学 一种基于New-Memetic算法的波束成型方法
CN103164631A (zh) * 2013-04-16 2013-06-19 东华大学 一种智能协同表达基因分析仪

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种混合自适应多目标Memetic算法;郭秀萍等;《控制与决策》;20061130;第21卷(第11期);第1234-1238页 *
基于Memetic优化的智能DNA序列数据压缩算法;周家锐等;《电子学报》;20130330;第41卷(第3期);第513-518页 *

Also Published As

Publication number Publication date
CN104598657A (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
Chen et al. Solving the traveling salesman problem based on the genetic simulated annealing ant colony system with particle swarm optimization techniques
Amjadi et al. Estimation of electricity demand of Iran using two heuristic algorithms
Zhang et al. Optimum design of fractional order PID controller for an AVR system using an improved artificial bee colony algorithm
CN104598657B (zh) 一种基于memetic算法的基因模体重构方法
CN105974799A (zh) 一种基于差分进化-局部单峰采样算法的模糊控制系统优化方法
CN104392283A (zh) 基于人工鱼群算法的交通路径搜索方法
CN112036512A (zh) 基于网络裁剪的图像分类神经网络架构搜索方法和装置
CN105978732A (zh) 一种基于粒子群优化最简回声状态网络参数的方法和系统
CN104050505A (zh) 一种基于带学习因子蜂群算法的多层感知器训练方法
CN106991442A (zh) 混合蛙跳算法的自适应核k‑means方法与系统
CN106779177A (zh) 基于粒子群优化的多分辨率小波神经网络用电量预测方法
CN102902772A (zh) 一种基于多目标优化的Web社区发现方法
CN109582985A (zh) 一种改进的遗传退火的片上网络映射方法
Shang et al. Production scheduling optimization method based on hybrid particle swarm optimization algorithm
CN108448659B (zh) 一种基于hacs算法求解电力系统无功优化的方法
CN112819192A (zh) 一种基于蜂群算法优化的rf_gru网络短期电力负荷预测方法
Roeva et al. Description of simple genetic algorithm modifications using generalized nets
Zhang et al. A novel genetic ant colony algorithm
CN104392317A (zh) 一种基于遗传文化基因算法的项目调度方法
CN107330302A (zh) 联合Memetic算法和S系统的生物模体重构方法
CN107315902A (zh) 基于维度区分的团队进步算法改进方案
CN104200073A (zh) 一种基于局部Lipschitz估计的自适应群体全局优化方法
D’Ambrosio et al. Optimizing cellular automata through a meta-model assisted memetic algorithm
CN116207797A (zh) 一种配电网多串并联设备协调优化控制方法
Aydın et al. A configurable generalized artificial bee colony algorithm with local search strategies

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200810

Address after: Room 302-37, 3 / F, building 1, No. 400 Fangchun Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Patentee after: SHANGHAI GENOMICS, Inc.

Address before: 1302-1, 13th floor, no.6, Zhongguancun South Street, Haidian District, Beijing

Patentee before: BEIJING ZHITAO SCIENCE & TECHNOLOGY Co.,Ltd.

Effective date of registration: 20200810

Address after: 1302-1, 13th floor, no.6, Zhongguancun South Street, Haidian District, Beijing

Patentee after: BEIJING ZHITAO SCIENCE & TECHNOLOGY Co.,Ltd.

Address before: 214122 Jiangsu city of Wuxi Province Li Lake Road No. 1800 Networking Engineering College

Patentee before: Jiangnan University