CN109390057B - 一种基于多目标优化的疾病模块检测方法 - Google Patents

一种基于多目标优化的疾病模块检测方法 Download PDF

Info

Publication number
CN109390057B
CN109390057B CN201810946395.2A CN201810946395A CN109390057B CN 109390057 B CN109390057 B CN 109390057B CN 201810946395 A CN201810946395 A CN 201810946395A CN 109390057 B CN109390057 B CN 109390057B
Authority
CN
China
Prior art keywords
disease
gene
genes
individual
disease module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810946395.2A
Other languages
English (en)
Other versions
CN109390057A (zh
Inventor
苏延森
苏晓春
张兴义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN201810946395.2A priority Critical patent/CN109390057B/zh
Publication of CN109390057A publication Critical patent/CN109390057A/zh
Application granted granted Critical
Publication of CN109390057B publication Critical patent/CN109390057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于多目标优化的疾病模块检测方法,包括:结合基因表达数据和蛋白质—蛋白质相互作用数据构造综合PPI网络;将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题:对疾病模块多目标优化问题进行问题优化,得到疾病模块集合;计算疾病模块集合中各疾病模块的分数,并根据各疾病模块的分数从疾病模块集合中选择目标疾病模块。

Description

一种基于多目标优化的疾病模块检测方法
技术领域
本发明涉及复杂疾病研究技术领域,尤其涉及一种基于多目标优化的疾病模块检测方法。
背景技术
在对人类复杂疾病的研究中,疾病模块的检测占据着重要的地位,准确而有效的检测出疾病模块有利于人们对疾病分子机制的深入了解,从而提高疾病诊断的准确率,甚至能做到有效的病前诊断,疾病模块的检测还可以促进复杂疾病的有效治疗方法以及药物的发展。现如今,越来越多的疾病模块检测方法被提出,疾病相关的先验知识也日益积累,但复杂疾病的研究对人类来说仍是一大挑战。生物网络以及疾病相关先验知识的不完备性仍会对复杂疾病的研究形成阻碍,尤其是对先验知识要求比较高的方法,在缺少先验知识的情况下将无法准确运行。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于多目标优化的疾病模块检测方法;
本发明提出的一种基于多目标优化的疾病模块检测方法,包括:
S1、结合基因表达数据和蛋白质—蛋白质相互作用数据构造综合PPI网络;
S2、将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题;
S3、对疾病模块多目标优化问题进行问题优化,得到疾病模块集合;
S4、计算疾病模块集合中各疾病模块的分数,并根据各疾病模块的分数从疾病模块集合中选择目标疾病模块。
优选地,步骤S1,具体包括:
S11、获取基因表达数据中的正常样本,根据基因在正常样本中的表达值计算各个基因间的person相关系数取绝对值,记为PCCn,其中,n为所用正常样本的个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到参考网络;
S12、在正常样本数据中加入一个疾病样本构成新的样本数据,计算各样本间基因的person相关系数取绝对值,记为PCCn+1,其中n+1为所用样本个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到疾病样本对应的扰动网络;
S13、重复执行步骤S12,直到所有疾病样本都得到对应的扰动网络;
S14、将各个疾病样本对应的扰动网络分别与参考网络做差,对应边权相减取绝对值即ΔPCCn=|PCCn+1-PCCn|,利用z-检验计算ΔPCC的显著性值
Figure GDA0003156199770000021
其中,设定阈值p-value<0.05,得到各疾病样本对应的个体特异性差网络;
S15、将个体特异性差网络结合成综合PPI网络,统计每条边在所有个体特异性差网络中出现的概率pij、平均权值avg(ΔPCCij),计算最终综合PPI网络的边权值wij=pij*avg(ΔPCCij),将PPI网络表征为G=(V,W),V={v1,v2,…,vi,…,vm}表示所述网络中基因的集合,vi表示第i个基因,m为基因的总数,W={wij|i=1,2,…,n;j=1,2,…,n}表示任意两个基因之间的相互作用的集合,wij表示第i个基因vi与第j个基因vj之间的相互作用,其值表示疾病样本中基因的突变对参考网络中基因间相互作用的扰动程度,若wij=0表示基因vi与基因vj之间无边相连,即疾病样本未对该基因间的相互作用产生显著扰动。
优选地,步骤S2,具体包括:
将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题:min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W,其中f1(x)表示疾病样本对正常样本的扰动程度,且
Figure GDA0003156199770000031
Figure GDA0003156199770000032
表示当前进化种群中权值和最大的个体所对应的权值和,
Figure GDA0003156199770000033
表示当前进化种群中权值和最小的个体所对应的权值和,∑i<jwijvivj表示所要计算的当前个体所对应的权值和,f2(x)表示疾病模块的稀疏程度,且
Figure GDA0003156199770000034
||V||0表示当前个体包含的基因数,∑i<jvivj表示当前个体包含的边数。
优选地,步骤S3,具体包括:
S301、根据构造的综合PPI网络G中所有基因数目,采用二进制编码方式对网络G中基因位进行编码,疾病模块表示为X={v1,v2,…vi,…vn},vi表示疾病模块X中第i个基因位,若vi=1表示疾病模块X中第i个基因被选择,若vi=0表示疾病模块X中未选择第i个基因;
S302、定义最大迭代次数为maxgen,初始化迭代次数t=1,种群个体的数目为pop,个体长度为k;
S303、分别计算G中各基因的节点度D={d1,d2,…di,…dn}和节点介数B={b1,b2,…bi,…bn},其中,di表示G中基因i的节点度,bi表示G中基因i的节点介数,分别依据节点度和节点介数对G中的基因进行排序,分别从两个序列中选取排名前1%的基因形成并集M={m1,m2,…mi,…mk},其中mi表示集合M中的第i个基因,k表示集合M中基因总数;
S304、随机产生一个1~m之间的整数u作为个体选择的基因数,使用二元联赛选择方法从集合M中随机选取两个基因,以0.5的概率随机选择节点度或节点介数作为依据选择一个基因位置1;
S305、重复执行步骤S304,直至个体中选择了u个基因;
S306、重复执行pop次步骤S304、S305,得到pop个个体;
S307、采用锦标赛选择策略对种群进行选择,得到交配池,作为第t次迭代的种群;
S308、从交配池中选取两个个体记为p1,p2,由p1-p2得存在于父代个体p1而不存在于父代个体p2的基因位作为待减基因位集合,由p2-p1得存在于父代个体p2而不存在于父代个体p1的基因位作为待加基因位集合,以0.5的概率随机选择对父代个体p1进行加操作或减操作,在确定执行加或减操作之后,再以0.5的概率随机选择节点度或节点介数作为依据对待加或减基因位进行降序排序,从排名前一半的基因位中随机选取若干个基因位对父代个体p1进行加或减操作,即置1或0;
S309、重复执行步骤S308,直到交配池中的个体选取完毕;
S310、对每个个体pi,由个体pi所有基因位形成待减基因位集合,由个体pi基因位的邻居基因位集合形成待加基因位集合,以0.5的概率选择对个体pi进行加或减操作,在确定执行加或减操作之后,对待加或减基因位集合计算各个基因位与个体pi所有基因位集合的边数,并依据边数进行降或升序排序,选择排名第一位的基因位对个体pi进行加或减操作,即置1或0,产生第t+1次迭代的种群;
S311、遍历种群个体,通过min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W计算得到第t+1迭代的种群中的所有个体的相应目标函数值;
S312、利用非支配排序对所述第t+1次迭代的种群进行排序,得到排序后的第t+1次迭代的具有多个前沿面的种群;
S313、计算排序后的第t+1次迭代的具有多个前沿面的种群的拥挤距离,并根据拥挤距离对其进行降序排序,得到根据拥挤距离降序排序后的第t+1次迭代的具有多个前沿面的种群;
S314、令t=t+1,并重复执行步骤S303-S313,直至达到执行次数达到maxgen,得到疾病模块集合。
优选地,步骤S4,具体包括:
计算疾病模块集合中各疾病模块的分数
Figure GDA0003156199770000051
其中,
Figure GDA0003156199770000052
表示G中权值和的样本均值,
Figure GDA0003156199770000053
表示G中权值和的标准偏差,对疾病模块集合中各疾病模块的分数进行降序排序,选择排名第一的个体作为目标疾病模块并输出。
本发明将疾病模块的检测问题转换为基于多目标优化的子网络挖掘问题,通过利用多目标进化算法来解决疾病模块检测问题,通过正确的定义目标函数以及进化策略的合理改进,获得一组最优的疾病模块集合,再利用设定的模块分数选择出最优疾病模块,在疾病模块的获得过程中利用多目标进化算法实现了疾病模块的多样性预选,该方法不需要疾病相关基因方面先验知识的参考,可以解决相关先验知识十分缺少的复杂疾病的疾病模块检测问题,从而很大程度上提高了疾病模块检测算法的有效性,利用多目标进化算法解决疾病模块检测问题,和目前的疾病模块检测算法相比大大降低了时间消耗。
附图说明
图1为本发明提出的一种基于多目标优化的疾病模块检测方法的流程示意图;
图2为本发明中疾病模块的检测问题转换为疾病模块多目标优化问题及种群编码的示意图。
具体实施方式
参照图1,本发明提出的一种基于多目标优化的疾病模块检测方法,包括:
步骤S1,结合基因表达数据和蛋白质—蛋白质相互作用数据构造综合PPI网络,具体包括:S11、获取基因表达数据中的正常样本,根据基因在正常样本中的表达值计算各个基因间的person相关系数取绝对值,记为PCCn,其中,n为所用正常样本的个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到参考网络;
S12、在正常样本数据中加入一个疾病样本构成新的样本数据,计算各样本间基因的person相关系数取绝对值,记为PCCn+1,其中n+1为所用样本个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到疾病样本对应的扰动网络;
S13、重复执行步骤S12,直到所有疾病样本都得到对应的扰动网络;
S14、将各个疾病样本对应的扰动网络分别与参考网络做差,对应边权相减取绝对值即ΔPCCn=|PCCn+1-PCCn|,利用z-检验计算ΔPCC的显著性值
Figure GDA0003156199770000061
其中,设定阈值p-value<0.05,得到各疾病样本对应的个体特异性差网络;
S15、将个体特异性差网络结合成综合PPI网络,统计每条边在所有个体特异性差网络中出现的概率pij、平均权值avg(ΔPCCij),计算最终综合PPI网络的边权值wij=pij*avg(ΔPCCij),将PPI网络表征为G=(V,W),V={v1,v2,…,vi,…,vm}表示所述网络中基因的集合,vi表示第i个基因,m为基因的总数,W={wij|i=1,2,…,n;j=1,2,…,n}表示任意两个基因之间的相互作用的集合,wij表示第i个基因vi与第j个基因vj之间的相互作用,其值表示疾病样本中基因的突变对参考网络中基因间相互作用的扰动程度,若wij=0表示基因vi与基因vj之间无边相连,即疾病样本未对该基因间的相互作用产生显著扰动。
在具体方案中,用特异性样本差网络的构建方法构造带权蛋白质—蛋白质相互作用网络,通过权值表示疾病样本对基因间相互作用的干扰程度,识别出的疾病模块更有利于准确的疾病诊断。
步骤S2,将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题,具体包括:
将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题:min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W,其中f1(x)表示疾病样本对正常样本的扰动程度,且
Figure GDA0003156199770000071
Figure GDA0003156199770000072
表示当前进化种群中权值和最大的个体所对应的权值和,
Figure GDA0003156199770000073
表示当前进化种群中权值和最小的个体所对应的权值和,∑i<jwijvivj表示所要计算的当前个体所对应的权值和,f2(x)表示疾病模块的稀疏程度,且
Figure GDA0003156199770000074
||V||0表示当前个体包含的基因数,∑i<jvivj表示当前个体包含的边数。
参照图2,通过,min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W及
Figure GDA0003156199770000075
Figure GDA0003156199770000076
将疾病模块的检测问题转换为疾病模块多目标优化问题,在疾病模块的获得过程中利用多目标进化算法实现了疾病模块的多样性预选,该方法不需要疾病相关基因方面先验知识的参考。
步骤S3,对疾病模块多目标优化问题进行问题优化,得到疾病模块集合,,具体包括:
S301、根据构造的综合PPI网络G中所有基因数目,采用二进制编码方式对网络G中基因位进行编码,疾病模块表示为X={v1,v2,…vi,…vn},vi表示疾病模块X中第i个基因位,若vi=1表示疾病模块X中第i个基因被选择,若vi=0表示疾病模块X中未选择第i个基因;
S302、定义最大迭代次数为maxgen,初始化迭代次数t=1,种群个体的数目为pop,个体长度为k;
S303、分别计算G中各基因的节点度D={d1,d2,…di,…dn}和节点介数B={b1,b2,…bi,…bn},其中,di表示G中基因i的节点度,bi表示G中基因i的节点介数,分别依据节点度和节点介数对G中的基因进行排序,分别从两个序列中选取排名前1%的基因形成并集M={m1,m2,…mi,…mk},其中mi表示集合M中的第i个基因,k表示集合M中基因总数;
S304、随机产生一个1~m之间的整数u作为个体选择的基因数,使用二元联赛选择方法从集合M中随机选取两个基因,以0.5的概率随机选择节点度或节点介数作为依据选择一个基因位置1;
S305、重复执行步骤S304,直至个体中选择了u个基因;
S306、重复执行pop次步骤S304、S305,得到pop个个体;
S307、采用锦标赛选择策略对种群进行选择,得到交配池,作为第t次迭代的种群;
S308、从交配池中选取两个个体记为p1,p2,由p1-p2得存在于父代个体p1而不存在于父代个体p2的基因位作为待减基因位集合,由p2-p1得存在于父代个体p2而不存在于父代个体p1的基因位作为待加基因位集合,以0.5的概率随机选择对父代个体p1进行加操作或减操作,在确定执行加或减操作之后,再以0.5的概率随机选择节点度或节点介数作为依据对待加或减基因位进行降序排序,从排名前一半的基因位中随机选取若干个基因位对父代个体p1进行加或减操作,即置1或0;
S309、重复执行步骤S308,直到交配池中的个体选取完毕;
S310、对每个个体pi,由个体pi所有基因位形成待减基因位集合,由个体pi基因位的邻居基因位集合形成待加基因位集合,以0.5的概率选择对个体pi进行加或减操作,在确定执行加或减操作之后,对待加或减基因位集合计算各个基因位与个体pi所有基因位集合的边数,并依据边数进行降或升序排序,选择排名第一位的基因位对个体pi进行加或减操作,即置1或0,产生第t+1次迭代的种群;
S311、遍历种群个体,通过min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W计算得到第t+1迭代的种群中的所有个体的相应目标函数值;
S312、利用非支配排序对所述第t+1次迭代的种群进行排序,得到排序后的第t+1次迭代的具有多个前沿面的种群;
S313、计算排序后的第t+1次迭代的具有多个前沿面的种群的拥挤距离,并根据拥挤距离对其进行降序排序,得到根据拥挤距离降序排序后的第t+1次迭代的具有多个前沿面的种群;
S314、令t=t+1,并重复执行步骤S303-S313,直至达到执行次数达到max gen,得到疾病模块集合。
步骤S4,计算疾病模块集合中各疾病模块的分数,并根据各疾病模块的分数从疾病模块集合中选择目标疾病模块,具体包括:
计算疾病模块集合中各疾病模块的分数
Figure GDA0003156199770000101
其中,
Figure GDA0003156199770000102
表示G中权值和的样本均值,
Figure GDA0003156199770000103
表示G中权值和的标准偏差,对疾病模块集合中各疾病模块的分数进行降序排序,选择排名第一的个体作为目标疾病模块并输出。
在具体方案中,通过前期的数据处理及网络构造,利用多目标进化算法解决疾病模块检测问题,和目前的疾病模块检测算法相比大大降低了时间消耗,不需要疾病相关基因的先验知识,避免了先验知识的不确定性和有限性带来的干扰问题,从而降低了算法的数据需求并提高算法的有效性和准确性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (1)

1.一种基于多目标优化的疾病模块检测方法,其特征在于,包括:
S1、结合基因表达数据和蛋白质—蛋白质相互作用数据构造综合PPI网络;
S2、将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题;
S3、对疾病模块多目标优化问题进行问题优化,得到疾病模块集合;
S4、计算疾病模块集合中各疾病模块的分数,并根据各疾病模块的分数从疾病模块集合中选择目标疾病模块;
所述的基于多目标优化的疾病模块检测方法,步骤S1,具体包括:
S11、获取基因表达数据中的正常样本,根据基因在正常样本中的表达值计算各个基因间的person相关系数取绝对值,记为PCCn,其中,n为所用正常样本的个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到参考网络;
S12、在正常样本数据中加入一个疾病样本构成新的样本数据,计算各样本间基因的person相关系数取绝对值,记为PCCn+1,其中n+1为所用样本个数,作为基因间的边权,与PPI网络数据对照,仅保留存在于PPI网络数据中的边,得到疾病样本对应的扰动网络;
S13、重复执行步骤S12,直到所有疾病样本都得到对应的扰动网络;
S14、将各个疾病样本对应的扰动网络分别与参考网络做差,对应边权相减取绝对值即ΔPCCn=|PCCn+1-PCCn|,利用z-检验计算ΔPCC的显著性值
Figure FDA0003284656960000011
其中,设定阈值p-value<0.05,得到各疾病样本对应的个体特异性差网络;
S15、将个体特异性差网络结合成综合PPI网络,统计每条边在所有个体特异性差网络中出现的概率pij、平均权值avg(ΔPCCij),计算最终综合PPI网络的边权值wij=pij*avg(ΔPCCij),将PPI网络表征为G=(V,W),V={v1,v2,…,vi,…,vm}表示所述网络中基因的集合,vi表示第i个基因,m为基因的总数,W={wij|i=1,2,…,m;j=1,2,…,m}表示任意两个基因之间的相互作用的集合,wij表示第i个基因vi与第j个基因vj之间的相互作用,其值表示疾病样本中基因的突变对参考网络中基因间相互作用的扰动程度,若wij=0表示基因vi与基因vj之间无边相连,即疾病样本未对该基因间的相互作用产生显著扰动;
所述的基于多目标优化的疾病模块检测方法,步骤S2,具体包括:
将综合PPI网络中疾病模块的检测问题转换为疾病模块多目标优化问题:min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W,其中f1(x)表示疾病样本对正常样本的扰动程度,且f1(x)=max∑i<jwijvivj+min∑i<jwijvivj-∑i<jwijvivj,max∑i<jwijvivj表示当前进化种群中权值和最大的个体所对应的权值和,min∑i<jwijvivj表示当前进化种群中权值和最小的个体所对应的权值和,∑i<jwijvivj表示所要计算的当前个体所对应的权值和,f2(x)表示疾病模块的稀疏程度,且
Figure FDA0003284656960000021
||V||0表示当前个体包含的基因数,∑i<jvivj表示当前个体包含的边数;
所述的基于多目标优化的疾病模块检测方法,步骤S3,具体包括:
S301、根据构造的综合PPI网络G中所有基因数目,采用二进制编码方式对网络G中基因位进行编码,疾病模块表示为X={v1,v2,…vi,…vm},vi表示疾病模块X中第i个基因位,若vi=1表示疾病模块X中第i个基因被选择,若vi=0表示疾病模块X中未选择第i个基因;
S302、定义最大迭代次数为max gen,初始化迭代次数t=1,种群个体的数目为pop,个体长度为k;
S303、分别计算G中各基因的节点度D={d1,d2,…di,…dm}和节点介数B={b1,b2,…bi,…bm},其中,di表示G中基因i的节点度,bi表示G中基因i的节点介数,分别依据节点度和节点介数对G中的基因进行排序,分别从两个序列中选取排名前1%的基因形成并集M={m1,m2,…mi,…mk},其中mi表示集合M中的第i个基因,k表示集合M中基因总数;
S304、随机产生一个1~m之间的整数u作为个体选择的基因数,使用二元联赛选择方法从集合M中随机选取两个基因,以0.5的概率随机选择节点度或节点介数作为依据选择一个基因位置1;
S305、重复执行步骤S304,直至个体中选择了u个基因;
S306、重复执行pop次步骤S304、S305,得到pop个个体;
S307、采用锦标赛选择策略对种群进行选择,得到交配池,作为第t次迭代的种群;
S308、从交配池中选取两个个体记为p1,p2,由p1-p2得存在于父代个体p1而不存在于父代个体p2的基因位作为待减基因位集合,由p2-p1得存在于父代个体p2而不存在于父代个体p1的基因位作为待加基因位集合,以0.5的概率随机选择对父代个体p1进行加操作或减操作,在确定执行加或减操作之后,再以0.5的概率随机选择节点度或节点介数作为依据对待加或减基因位进行降序排序,从排名前一半的基因位中随机选取若干个基因位对父代个体p1进行加或减操作,即置1或0;
S309、重复执行步骤S308,直到交配池中的个体选取完毕;
S310、对每个个体pi,由个体pi所有基因位形成待减基因位集合,由个体pi基因位的邻居基因位集合形成待加基因位集合,以0.5的概率选择对个体pi进行加或减操作,在确定执行加或减操作之后,对待加或减基因位集合计算各个基因位与个体pi所有基因位集合的边数,并依据边数进行降或升序排序,选择排名第一位的基因位对个体pi进行加或减操作,即置1或0,产生第t+1次迭代的种群;
S311、遍历种群个体,通过min(f1(x),f2(x)),s.t.x=(vij,wij),vij∈V,wij∈W计算得到第t+1迭代的种群中的所有个体的相应目标函数值;
S312、利用非支配排序对所述第t+1次迭代的种群进行排序,得到排序后的第t+1次迭代的具有多个前沿面的种群;
S313、计算排序后的第t+1次迭代的具有多个前沿面的种群的拥挤距离,并根据拥挤距离对其进行降序排序,得到根据拥挤距离降序排序后的第t+1次迭代的具有多个前沿面的种群;
S314、令t=t+1,并重复执行步骤S303-S313,直至达到执行次数达到max gen,得到疾病模块集合;
所述的基于多目标优化的疾病模块检测方法,步骤S4,具体包括:
计算疾病模块集合中各疾病模块的分数
Figure FDA0003284656960000041
其中,
Figure FDA0003284656960000042
表示G中权值和的样本均值,
Figure FDA0003284656960000043
表示G中权值和的标准偏差,对疾病模块集合中各疾病模块的分数进行降序排序,选择排名第一的个体作为目标疾病模块并输出。
CN201810946395.2A 2018-08-20 2018-08-20 一种基于多目标优化的疾病模块检测方法 Active CN109390057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810946395.2A CN109390057B (zh) 2018-08-20 2018-08-20 一种基于多目标优化的疾病模块检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810946395.2A CN109390057B (zh) 2018-08-20 2018-08-20 一种基于多目标优化的疾病模块检测方法

Publications (2)

Publication Number Publication Date
CN109390057A CN109390057A (zh) 2019-02-26
CN109390057B true CN109390057B (zh) 2021-12-14

Family

ID=65418493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810946395.2A Active CN109390057B (zh) 2018-08-20 2018-08-20 一种基于多目标优化的疾病模块检测方法

Country Status (1)

Country Link
CN (1) CN109390057B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115148330B (zh) * 2022-05-24 2023-07-25 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205344A (zh) * 2015-05-18 2015-12-30 上海交通大学 基于多目标蚁群优化算法的基因位点挖掘方法
CN106952168A (zh) * 2017-03-09 2017-07-14 西安电子科技大学 基于多目标进化的带属性社交网络社区划分方法
CN106991295A (zh) * 2017-03-31 2017-07-28 安徽大学 一种基于多目标优化的蛋白质网络模块挖掘方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070188A1 (en) * 2008-08-08 2010-03-18 Neal Solomon Intelligent medical device system for on-demand diagnostics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205344A (zh) * 2015-05-18 2015-12-30 上海交通大学 基于多目标蚁群优化算法的基因位点挖掘方法
CN106952168A (zh) * 2017-03-09 2017-07-14 西安电子科技大学 基于多目标进化的带属性社交网络社区划分方法
CN106991295A (zh) * 2017-03-31 2017-07-28 安徽大学 一种基于多目标优化的蛋白质网络模块挖掘方法
CN108009403A (zh) * 2017-11-24 2018-05-08 中国地质大学(武汉) 基于多源数据融合及多目标优化的蛋白质复合物识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Discovering disease-genes by topological features in human protein-protein interaction network;Xu, JZ (Xu, Jianzhen); Li, YJ (Li, Yongjin);《BIOINFORMATICS 》;20061115;第22卷(第22期);2800-2805 *
基于结构域信息的蛋白质复合物识别与疾病基因预测;易阳;《中国优秀硕士学位论文全文数据库 基础科学辑》;20170615(第06期);A006-76 *
基于静态网络的蛋白质复合物预测方法综述;于杨;《软件工程与应用》;20180731(第3期);151-159 *
蛋白质相互作用网络中复合物识别算法研究;于杨;《中国博士学位论文全文数据库 基础科学辑》;20160315(第3期);A006-34 *

Also Published As

Publication number Publication date
CN109390057A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
Rasmussen et al. A Bayesian approach for fast and accurate gene tree reconstruction
Edwards et al. High-resolution genetic mapping with pooled sequencing
Kentzoglanakis et al. A swarm intelligence framework for reconstructing gene networks: searching for biologically plausible architectures
CN106682454B (zh) 一种宏基因组数据分类方法和装置
CN110111840B (zh) 一种体细胞突变检测方法
Archer et al. Diagnosability of mt DNA with random forests: using sequence data to delimit subspecies
CN112863599B (zh) 一种病毒测序序列的自动化分析方法及系统
EP3435264B1 (en) Method and system for identification and classification of operational taxonomic units in a metagenomic sample
CN112084877A (zh) 基于nsga-net的遥感图像识别方法
KR20230004566A (ko) 머신 러닝 모델을 사용한 로컬 조상 추론
CN109390057B (zh) 一种基于多目标优化的疾病模块检测方法
Mo et al. Applications of machine learning in phylogenetics
Vimaladevi et al. A microarray gene expression data classification using hybrid back propagation neural network
Maulik et al. Finding multiple coherent biclusters in microarray data using variable string length multiobjective genetic algorithm
CN114093426B (zh) 基于基因调控网络构建的标志物筛选方法
CN111755074B (zh) 一种酿酒酵母菌中dna复制起点的预测方法
Cho et al. Fuzzy Bayesian validation for cluster analysis of yeast cell-cycle data
Murdock et al. Identifying species by genetic clustering.
CN115769300A (zh) 变体致病性评分和分类及其用途
CN114334168A (zh) 结合协同学习策略的粒子群混合优化的特征选择算法
Bao et al. A deep embedded clustering algorithm for the binning of metagenomic sequences
Mazidi et al. PSPGA: A New Method for Protein Structure Prediction based on Genetic Algorithm
Budiarto et al. Explainable supervised method for genetics ancestry estimation
Jojic et al. Joint discovery of haplotype blocks and complex trait associations from SNP sequences
Jacob et al. A fuzzy-driven genetic algorithm for sequence segmentation applied to genomic sequences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant