CN113160890A - 一种自适应基因调控网格构建方法及装置 - Google Patents

一种自适应基因调控网格构建方法及装置 Download PDF

Info

Publication number
CN113160890A
CN113160890A CN202110272063.2A CN202110272063A CN113160890A CN 113160890 A CN113160890 A CN 113160890A CN 202110272063 A CN202110272063 A CN 202110272063A CN 113160890 A CN113160890 A CN 113160890A
Authority
CN
China
Prior art keywords
gene
data set
moth
adaptive
flame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110272063.2A
Other languages
English (en)
Inventor
窦运乔
黄光宇
耿磊
陈冬生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Normal University
Original Assignee
Anhui Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Normal University filed Critical Anhui Normal University
Priority to CN202110272063.2A priority Critical patent/CN113160890A/zh
Publication of CN113160890A publication Critical patent/CN113160890A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自适应基因调控网格构建方法及装置,对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。

Description

一种自适应基因调控网格构建方法及装置
技术领域
本发明涉及生物信息学领域,特别涉及一种自适应基因调控网格构建方法及装置。
背景技术
基因调控网络模型的分析和构建,作为生物信息学领域中的非常重要的研究方向之一,同时也是基因表达数据分析的一个重要手段。基因网络研究通过建立基因转录调控网络模型对某一个物种或组织中的全部基因的表达关系进行整体的模拟分析和研究,从系统层面认识生命现象,特别是其中涉及的复杂的分子调控过程,支配基因表达和功能的基本规则,信息流动的规律和在整体的框架下研究基因的功能。
开展基因调控网络领域的相关研究,可以更好的理解基因表达过程中的信息传输规律。通过信息提取、数据分析、了解基因功能,深入开展基因调控网络的研究,可以系统性地研究基因的功能。这样,我们不仅可以从结构层次上研究基因的功能,还能够从网络层次上挖掘基因的潜在功能。
现阶段人工智能算法开始用于基因调控网格的辅助构建,为基因调控网格构建提供了一种新的思路,然后,现有人工智能算法针对某一特定工程问题建模后,其模型参数大多固定不变,导致模型的鲁棒性较差,不能很好的进行推广应用。因此,开发针对基因调控网格的自适应构建方法是必要且重要的,其能够是现在信息流动的规律和在整体的框架下研究基因的功能。
发明内容
本发明的目的在于提供一种自适应基因调控网格构建方法,针对基因调控网格构建的难题,提出一种自适应基因调控网格构建方法及装置,实现基因调控网格的准确构建。
本发明提供了一种自适应基因调控网格构建方法,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述基因表达数据集Data1为:
Figure RE-GDA0003088756200000021
作为一种可选的实施方式,所述对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果,包括:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3
作为一种可选的实施方式,所述基于所述评估结果对所述基因表达数据集 Data1中的基因特征进行排序,得到基因特征的自适应排序结果,包括:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述基因特征自适应排序结果A为:
A=αA1+βA2+χA3
其中,α、β和χ分别表示权值系数。
作为一种可选的实施方式,所述利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,包括:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-GDA0003088756200000041
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
作为本发明的第二个方面,提供了一种自适应基因调控网格构建装置,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集 Data1
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集 Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的 Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3
作为一种可选的实施方式,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-GDA0003088756200000051
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
与现有技术相比,本发明具有如下显著优点:
本申请提供了一种自适应基因调控网格构建方法及装置,对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。
附图说明
图1为本发明提供的基因调控网格构建的流程图;
图2为本发明提供的MFO筛选最优的调控者子集的流程图。
具体实施方式
下面结合本发明中的附图,对本发明实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
为了实现上述发明目的,本发明提供了一种自适应基因调控网格构建方法,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
本发明实施例中,首先对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。
为了便于理解和说明,如附图1-2所示,本发明提供了一种自适应基因调控网格构建方法,包括:
S1:构建基因表达数据集:基于目标基因网络中的基因特征,建立基因表达数据集Data1
可选的,S1中,所述基因表达数据集Data1为:
Figure RE-GDA0003088756200000071
S2:基因特征自适应排序:利用Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法为目标基因网络中的每个目标基因的所有潜在调控者进行重要性评估,随后根据Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法的自适应权值系数进行加权,得到基因特征的自适应排序结果;
可选的,S2中,对于所述基因表达数据集Data1中的每个基因特征,通过公式
Figure RE-GDA0003088756200000072
计算Pearson 相关系数并排序得到基因特征排序A1
可选的,S2中,对于所述基因表达数据集Data1中的每个基因特征,通过公式
Figure RE-GDA0003088756200000081
计算互信息和最大信息系数并排序得到基因特征排序A2
可选的,S2中,对于所述基因表达数据集Data1中的每个基因特征,借助递归特征消除算法得到基因特征排序A3
为了更好的对基因特征进行排序增加模型鲁棒性,分别给Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法得到特征排序结果定义一个自适应权值系数α、β和χ,则基因特征自适应排序的结果可以表示为:
A=αA1+βA2+χA3
S3:飞蛾扑火优化筛选:将得到的重要性较高的调控者利用飞蛾扑火优化 (Moth-Flame Optimization,MFO)算法筛选出最优的调控者子集,建立基因调控网络。
较佳地,所述步骤S3中,利用MFO算法筛选出最优的调控者子集,包括:
S31:初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N 及最大迭代次数T,当前迭代数为l=1;
S32:初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
S33:更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-GDA0003088756200000082
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
S34:更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
S35:终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
作为一种可选的实施方式,所述自适应基因调控网格构建方法还包括:
S4:逆向工程验证:在逆向工程评估与方法对话数据集Data2上进行实验,验证该基因调控网络的有效性。
在逆向工程评估与方法对话数据集Data2上进行实验,验证该基因调控网络的有效性的过程中,采用Fβ分数作为评价指标:
Figure RE-GDA0003088756200000091
其中,β取值为0.5、1或者2,precision表示精确率,recall表示召回率。
与所述方法相对应的,本发明提供了一种自适应基因调控网格构建装置,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集 Data1
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集 Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的 Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3
作为一种可选的实施方式,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-GDA0003088756200000101
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种自适应基因调控网格构建方法,其特征在于,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
2.如权利要求1所述的一种自适应基因调控网格构建方法,其特征在于,所述基因表达数据集Data1为:
Figure RE-FDA0003088756190000011
3.如权利要求1所述的一种自适应基因调控网格构建方法,其特征在于,所述对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果,包括:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3
4.如权利要求3所述的一种自适应基因调控网格构建方法,其特征在于,所述基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果,包括:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
5.如权利要求4所述的一种自适应基因调控网格构建方法,其特征在于,所述基因特征自适应排序结果A为:
A=αA1+βA2+χA3
其中,α、β和χ分别表示权值系数。
6.如权利要求5所述的一种自适应基因调控网格构建方法,其特征在于,所述利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,包括:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-FDA0003088756190000021
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
7.一种自适应基因调控网格构建装置,其特征在于,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集Data1
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
8.如权利要求7所述的一种自适应基因调控网格构建装置,其特征在于,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3
9.如权利要求8所述的一种自适应基因调控网格构建装置,其特征在于,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
10.如权利要求9所述的一种自适应基因调控网格构建装置,其特征在于,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用
Figure RE-FDA0003088756190000041
更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
CN202110272063.2A 2021-03-13 2021-03-13 一种自适应基因调控网格构建方法及装置 Pending CN113160890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110272063.2A CN113160890A (zh) 2021-03-13 2021-03-13 一种自适应基因调控网格构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110272063.2A CN113160890A (zh) 2021-03-13 2021-03-13 一种自适应基因调控网格构建方法及装置

Publications (1)

Publication Number Publication Date
CN113160890A true CN113160890A (zh) 2021-07-23

Family

ID=76886937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110272063.2A Pending CN113160890A (zh) 2021-03-13 2021-03-13 一种自适应基因调控网格构建方法及装置

Country Status (1)

Country Link
CN (1) CN113160890A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308934A (zh) * 2018-08-20 2019-02-05 唐山照澜海洋科技有限公司 一种基于集成特征重要性和鸡群算法的基因调控网络构建方法
CN109799269A (zh) * 2019-01-24 2019-05-24 山东工商学院 基于动态特征重要度的电子鼻气体传感器阵列优化方法
CN110059755A (zh) * 2019-04-22 2019-07-26 中国石油大学(华东) 一种多特征评价准则融合的地震属性优选方法
CN110222873A (zh) * 2019-05-14 2019-09-10 重庆邮电大学 一种基于大数据的地铁站客流量预测方法
CN110675912A (zh) * 2019-09-17 2020-01-10 东北大学 一种基于结构预测的基因调控网络构建方法
CN111414579A (zh) * 2020-02-19 2020-07-14 深圳市儿童医院 基于多角度相关关系获取脑区关联信息的方法和系统
CN111428786A (zh) * 2020-03-23 2020-07-17 电子科技大学 基于PageRank的数据特征集降维方法
CN112215259A (zh) * 2020-09-17 2021-01-12 温州大学 基因选择方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308934A (zh) * 2018-08-20 2019-02-05 唐山照澜海洋科技有限公司 一种基于集成特征重要性和鸡群算法的基因调控网络构建方法
CN109799269A (zh) * 2019-01-24 2019-05-24 山东工商学院 基于动态特征重要度的电子鼻气体传感器阵列优化方法
CN110059755A (zh) * 2019-04-22 2019-07-26 中国石油大学(华东) 一种多特征评价准则融合的地震属性优选方法
CN110222873A (zh) * 2019-05-14 2019-09-10 重庆邮电大学 一种基于大数据的地铁站客流量预测方法
CN110675912A (zh) * 2019-09-17 2020-01-10 东北大学 一种基于结构预测的基因调控网络构建方法
CN111414579A (zh) * 2020-02-19 2020-07-14 深圳市儿童医院 基于多角度相关关系获取脑区关联信息的方法和系统
CN111428786A (zh) * 2020-03-23 2020-07-17 电子科技大学 基于PageRank的数据特征集降维方法
CN112215259A (zh) * 2020-09-17 2021-01-12 温州大学 基因选择方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方铭: "群智能优化算法识别关键蛋白质及其复合物", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Similar Documents

Publication Publication Date Title
CN109243538B (zh) 一种预测疾病与LncRNA关联关系的方法及系统
CN104751842B (zh) 深度神经网络的优化方法及系统
US20060229852A1 (en) Zeta statistic process method and system
CN106060008B (zh) 一种网络入侵异常检测方法
CN112818690B (zh) 结合知识图谱实体信息的语义识别方法、装置及相关设备
CN110232444B (zh) 地质监测bp神经网络的优化方法、装置、设备及存储介质
CN110993113B (zh) 基于MF-SDAE的lncRNA-疾病关系预测方法及系统
CN111062036A (zh) 恶意软件识别模型构建、识别方法及介质和设备
CN109918304B (zh) 一种快速高路径覆盖率测试用例生成方法
CN112488183A (zh) 一种模型优化方法、装置、计算机设备及存储介质
CN114330715A (zh) 一种智能弹药协同进化任务分配方法
CN109767034B (zh) 继电保护的定值优化方法、装置、计算机设备和存储介质
CN107516020B (zh) 序列位点重要度的确定方法、装置、设备及存储介质
CN116258357B (zh) 一种基于多基因遗传算法的异构无人机协同目标分配方法
CN113160890A (zh) 一种自适应基因调控网格构建方法及装置
CN113223622B (zh) 基于元路径的miRNA-疾病关联预测方法
CN114154847A (zh) 一种工程施工方案的确定方法、装置、客户端和存储介质
CN115345303A (zh) 卷积神经网络权重调优方法、装置、存储介质和电子设备
CN115640427A (zh) 一种社交网络中基于人格信息的网络结构隐藏方法、装置
CN113642226A (zh) 基于多目标进化算法的公平机器学习模型的训练方法
CN113205185A (zh) 网络模型优化方法、装置、计算机设备和存储介质
WO2022106863A1 (en) Method and system for accelerating the convergence of an iterative computation code of physical parameters of a multi-parameter system
CN113627513A (zh) 一种训练数据生成方法、系统、电子设备及存储介质
CN111582446A (zh) 用于神经网络剪枝的系统和神经网络的剪枝处理方法
CN110738318A (zh) 网络结构运行时间评估及评估模型生成方法、系统和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210723

RJ01 Rejection of invention patent application after publication