CN113160890A - 一种自适应基因调控网格构建方法及装置 - Google Patents
一种自适应基因调控网格构建方法及装置 Download PDFInfo
- Publication number
- CN113160890A CN113160890A CN202110272063.2A CN202110272063A CN113160890A CN 113160890 A CN113160890 A CN 113160890A CN 202110272063 A CN202110272063 A CN 202110272063A CN 113160890 A CN113160890 A CN 113160890A
- Authority
- CN
- China
- Prior art keywords
- gene
- data set
- moth
- adaptive
- flame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 174
- 230000033228 biological regulation Effects 0.000 title claims abstract description 36
- 238000010276 construction Methods 0.000 title claims abstract description 18
- 230000003044 adaptive effect Effects 0.000 title claims description 17
- 230000014509 gene expression Effects 0.000 claims abstract description 66
- 238000012163 sequencing technique Methods 0.000 claims abstract description 35
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 230000001629 suppression Effects 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000001105 regulatory effect Effects 0.000 claims description 10
- 230000008030 elimination Effects 0.000 claims description 9
- 238000003379 elimination reaction Methods 0.000 claims description 9
- 230000004547 gene signature Effects 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 claims 1
- 208000011580 syndromic disease Diseases 0.000 claims 1
- 238000011160 research Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种自适应基因调控网格构建方法及装置,对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。
Description
技术领域
本发明涉及生物信息学领域,特别涉及一种自适应基因调控网格构建方法及装置。
背景技术
基因调控网络模型的分析和构建,作为生物信息学领域中的非常重要的研究方向之一,同时也是基因表达数据分析的一个重要手段。基因网络研究通过建立基因转录调控网络模型对某一个物种或组织中的全部基因的表达关系进行整体的模拟分析和研究,从系统层面认识生命现象,特别是其中涉及的复杂的分子调控过程,支配基因表达和功能的基本规则,信息流动的规律和在整体的框架下研究基因的功能。
开展基因调控网络领域的相关研究,可以更好的理解基因表达过程中的信息传输规律。通过信息提取、数据分析、了解基因功能,深入开展基因调控网络的研究,可以系统性地研究基因的功能。这样,我们不仅可以从结构层次上研究基因的功能,还能够从网络层次上挖掘基因的潜在功能。
现阶段人工智能算法开始用于基因调控网格的辅助构建,为基因调控网格构建提供了一种新的思路,然后,现有人工智能算法针对某一特定工程问题建模后,其模型参数大多固定不变,导致模型的鲁棒性较差,不能很好的进行推广应用。因此,开发针对基因调控网格的自适应构建方法是必要且重要的,其能够是现在信息流动的规律和在整体的框架下研究基因的功能。
发明内容
本发明的目的在于提供一种自适应基因调控网格构建方法,针对基因调控网格构建的难题,提出一种自适应基因调控网格构建方法及装置,实现基因调控网格的准确构建。
本发明提供了一种自适应基因调控网格构建方法,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1;
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述基因表达数据集Data1为:
作为一种可选的实施方式,所述对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果,包括:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1;
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2;
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3。
作为一种可选的实施方式,所述基于所述评估结果对所述基因表达数据集 Data1中的基因特征进行排序,得到基因特征的自适应排序结果,包括:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述基因特征自适应排序结果A为:
A=αA1+βA2+χA3
其中,α、β和χ分别表示权值系数。
作为一种可选的实施方式,所述利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,包括:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
作为本发明的第二个方面,提供了一种自适应基因调控网格构建装置,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集 Data1;
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集 Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的 Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1;
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2;
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3。
作为一种可选的实施方式,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
与现有技术相比,本发明具有如下显著优点:
本申请提供了一种自适应基因调控网格构建方法及装置,对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。
附图说明
图1为本发明提供的基因调控网格构建的流程图;
图2为本发明提供的MFO筛选最优的调控者子集的流程图。
具体实施方式
下面结合本发明中的附图,对本发明实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
为了实现上述发明目的,本发明提供了一种自适应基因调控网格构建方法,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1;
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
本发明实施例中,首先对基因特征的所有潜在调控者进行重要性评估,基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,再利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络,从而实现了高精度、强鲁棒性的自适应基因调控网络的构建。
为了便于理解和说明,如附图1-2所示,本发明提供了一种自适应基因调控网格构建方法,包括:
S1:构建基因表达数据集:基于目标基因网络中的基因特征,建立基因表达数据集Data1。
可选的,S1中,所述基因表达数据集Data1为:
S2:基因特征自适应排序:利用Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法为目标基因网络中的每个目标基因的所有潜在调控者进行重要性评估,随后根据Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法的自适应权值系数进行加权,得到基因特征的自适应排序结果;
可选的,S2中,对于所述基因表达数据集Data1中的每个基因特征,借助递归特征消除算法得到基因特征排序A3;
为了更好的对基因特征进行排序增加模型鲁棒性,分别给Pearson相关系数、互信息和最大信息系数和递归特征消除这三种方法得到特征排序结果定义一个自适应权值系数α、β和χ,则基因特征自适应排序的结果可以表示为:
A=αA1+βA2+χA3
S3:飞蛾扑火优化筛选:将得到的重要性较高的调控者利用飞蛾扑火优化 (Moth-Flame Optimization,MFO)算法筛选出最优的调控者子集,建立基因调控网络。
较佳地,所述步骤S3中,利用MFO算法筛选出最优的调控者子集,包括:
S31:初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N 及最大迭代次数T,当前迭代数为l=1;
S32:初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
S33:更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
S34:更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
S35:终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
作为一种可选的实施方式,所述自适应基因调控网格构建方法还包括:
S4:逆向工程验证:在逆向工程评估与方法对话数据集Data2上进行实验,验证该基因调控网络的有效性。
在逆向工程评估与方法对话数据集Data2上进行实验,验证该基因调控网络的有效性的过程中,采用Fβ分数作为评价指标:
其中,β取值为0.5、1或者2,precision表示精确率,recall表示召回率。
与所述方法相对应的,本发明提供了一种自适应基因调控网格构建装置,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集 Data1;
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集 Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
作为一种可选的实施方式,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的 Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1;
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2;
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3。
作为一种可选的实施方式,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
作为一种可选的实施方式,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用 S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种自适应基因调控网格构建方法,其特征在于,包括:
基于目标基因网络中的基因特征,建立基因表达数据集Data1;
对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
3.如权利要求1所述的一种自适应基因调控网格构建方法,其特征在于,所述对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果,包括:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1;
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2;
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3。
4.如权利要求3所述的一种自适应基因调控网格构建方法,其特征在于,所述基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果,包括:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
5.如权利要求4所述的一种自适应基因调控网格构建方法,其特征在于,所述基因特征自适应排序结果A为:
A=αA1+βA2+χA3
其中,α、β和χ分别表示权值系数。
6.如权利要求5所述的一种自适应基因调控网格构建方法,其特征在于,所述利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,包括:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
7.一种自适应基因调控网格构建装置,其特征在于,包括:
建立模块,用于基于目标基因网络中的基因特征,建立基因表达数据集Data1;
评估模块,用于对于所述基因表达数据集Data1中的每个基因特征,对所述基因特征的所有潜在调控者进行重要性评估,获得评估结果;
排序模块,用于基于所述评估结果对所述基因表达数据集Data1中的基因特征进行排序,得到基因特征的自适应排序结果;
筛选模块,用于利用飞蛾扑火优化算法从自适应排序后的基因表达数据集Data1中筛选出最优的调控者子集,基于所述调控者子集建立基因调控网络。
8.如权利要求7所述的一种自适应基因调控网格构建装置,其特征在于,所述评估模块用于:
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的Pearson相关系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A1;
对于所述基因表达数据集Data1中的每个基因特征,计算该基因特征的计算互信息和最大信息系数,并基于计算结果,将所述基因表达数据集Data1中的基因特征进行排序,得到基因特征排序A2;
借助递归特征消除算法对所述基因表达数据集Data1中的每个基因特征进行排序,得到基因特征排序A3。
9.如权利要求8所述的一种自适应基因调控网格构建装置,其特征在于,所述排序模块用于:
对基因特征排序A1、基因特征排序A2以及基因特征排序A3加权计算,得到基因特征自适应排序结果A。
10.如权利要求9所述的一种自适应基因调控网格构建装置,其特征在于,所述筛选模块,用于:
初始化参数:设置飞蛾种群规模n、搜索空间维度d、最大火焰数N及最大迭代次数T,当前迭代数为l=1;
初始化飞蛾位置和火焰矩阵:将自适应排序后的基因表达数据集Data1作为搜索空间,并在搜索空间中随机初始化n个飞蛾位置,计算每个飞蛾个体的适应度值,并将结果置于火焰矩阵中;
更新飞蛾位置与火焰数量:计算飞蛾与火焰间的距离,利用S(Mi,Fj)=Di·ebt·cos(2πt)+Fj更新飞蛾位置,其中Di表示第i只飞蛾到第j个火焰的距离,b表示螺旋常数,t为[-1,1]区间的随机数;利用更新火焰数量,其中l表示当前迭代次数,N表示火焰的最大数目,T表示最大迭代次数;
更新火焰矩阵:计算每个飞蛾个体适应度值同当代的火焰种群合并,将合并后的种群按照适应度从高到低排序,取前Nflames个为火焰位置,并将其置于火焰矩阵中;
终止判断:若运算达到收敛或者最大迭代次数,则停止运算,否则返回执行更新飞蛾位置与火焰数量的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110272063.2A CN113160890A (zh) | 2021-03-13 | 2021-03-13 | 一种自适应基因调控网格构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110272063.2A CN113160890A (zh) | 2021-03-13 | 2021-03-13 | 一种自适应基因调控网格构建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113160890A true CN113160890A (zh) | 2021-07-23 |
Family
ID=76886937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110272063.2A Pending CN113160890A (zh) | 2021-03-13 | 2021-03-13 | 一种自适应基因调控网格构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113160890A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308934A (zh) * | 2018-08-20 | 2019-02-05 | 唐山照澜海洋科技有限公司 | 一种基于集成特征重要性和鸡群算法的基因调控网络构建方法 |
CN109799269A (zh) * | 2019-01-24 | 2019-05-24 | 山东工商学院 | 基于动态特征重要度的电子鼻气体传感器阵列优化方法 |
CN110059755A (zh) * | 2019-04-22 | 2019-07-26 | 中国石油大学(华东) | 一种多特征评价准则融合的地震属性优选方法 |
CN110222873A (zh) * | 2019-05-14 | 2019-09-10 | 重庆邮电大学 | 一种基于大数据的地铁站客流量预测方法 |
CN110675912A (zh) * | 2019-09-17 | 2020-01-10 | 东北大学 | 一种基于结构预测的基因调控网络构建方法 |
CN111414579A (zh) * | 2020-02-19 | 2020-07-14 | 深圳市儿童医院 | 基于多角度相关关系获取脑区关联信息的方法和系统 |
CN111428786A (zh) * | 2020-03-23 | 2020-07-17 | 电子科技大学 | 基于PageRank的数据特征集降维方法 |
CN112215259A (zh) * | 2020-09-17 | 2021-01-12 | 温州大学 | 基因选择方法和装置 |
-
2021
- 2021-03-13 CN CN202110272063.2A patent/CN113160890A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308934A (zh) * | 2018-08-20 | 2019-02-05 | 唐山照澜海洋科技有限公司 | 一种基于集成特征重要性和鸡群算法的基因调控网络构建方法 |
CN109799269A (zh) * | 2019-01-24 | 2019-05-24 | 山东工商学院 | 基于动态特征重要度的电子鼻气体传感器阵列优化方法 |
CN110059755A (zh) * | 2019-04-22 | 2019-07-26 | 中国石油大学(华东) | 一种多特征评价准则融合的地震属性优选方法 |
CN110222873A (zh) * | 2019-05-14 | 2019-09-10 | 重庆邮电大学 | 一种基于大数据的地铁站客流量预测方法 |
CN110675912A (zh) * | 2019-09-17 | 2020-01-10 | 东北大学 | 一种基于结构预测的基因调控网络构建方法 |
CN111414579A (zh) * | 2020-02-19 | 2020-07-14 | 深圳市儿童医院 | 基于多角度相关关系获取脑区关联信息的方法和系统 |
CN111428786A (zh) * | 2020-03-23 | 2020-07-17 | 电子科技大学 | 基于PageRank的数据特征集降维方法 |
CN112215259A (zh) * | 2020-09-17 | 2021-01-12 | 温州大学 | 基因选择方法和装置 |
Non-Patent Citations (1)
Title |
---|
方铭: "群智能优化算法识别关键蛋白质及其复合物", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104751842B (zh) | 深度神经网络的优化方法及系统 | |
US20060229852A1 (en) | Zeta statistic process method and system | |
CN110991568A (zh) | 目标识别方法、装置、设备和存储介质 | |
CN110993113B (zh) | 基于MF-SDAE的lncRNA-疾病关系预测方法及系统 | |
CN110232444B (zh) | 地质监测bp神经网络的优化方法、装置、设备及存储介质 | |
CN112488183A (zh) | 一种模型优化方法、装置、计算机设备及存储介质 | |
CN111062036A (zh) | 恶意软件识别模型构建、识别方法及介质和设备 | |
CN112818690A (zh) | 结合知识图谱实体信息的语义识别方法、装置及相关设备 | |
CN114330715A (zh) | 一种智能弹药协同进化任务分配方法 | |
CN115310664A (zh) | 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 | |
CN116258357A (zh) | 一种基于多基因遗传算法的异构无人机协同目标分配方法 | |
CN108683534A (zh) | 一种面向社区发现的网络薄弱节点搜索方法 | |
CN109767034B (zh) | 继电保护的定值优化方法、装置、计算机设备和存储介质 | |
CN107516020B (zh) | 序列位点重要度的确定方法、装置、设备及存储介质 | |
CN114676292A (zh) | 一种超网络高影响力节点排序方法 | |
CN113627513A (zh) | 一种训练数据生成方法、系统、电子设备及存储介质 | |
CN113160890A (zh) | 一种自适应基因调控网格构建方法及装置 | |
CN109977030B (zh) | 一种深度随机森林程序的测试方法及设备 | |
CN109308934A (zh) | 一种基于集成特征重要性和鸡群算法的基因调控网络构建方法 | |
CN113223622B (zh) | 基于元路径的miRNA-疾病关联预测方法 | |
CN115345303A (zh) | 卷积神经网络权重调优方法、装置、存储介质和电子设备 | |
CN114943866A (zh) | 基于进化神经网络结构搜索的图像分类方法 | |
CN114996829A (zh) | 近接隧道施工条件下新建隧道设计优化方法及设备 | |
CN113962295A (zh) | 武器装备体系效能评估方法、系统及装置 | |
CN113642226A (zh) | 基于多目标进化算法的公平机器学习模型的训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210723 |
|
RJ01 | Rejection of invention patent application after publication |