CN112102881A - 基于改进盒维数法的基因健康分形维数获取方法及系统 - Google Patents
基于改进盒维数法的基因健康分形维数获取方法及系统 Download PDFInfo
- Publication number
- CN112102881A CN112102881A CN202011095415.3A CN202011095415A CN112102881A CN 112102881 A CN112102881 A CN 112102881A CN 202011095415 A CN202011095415 A CN 202011095415A CN 112102881 A CN112102881 A CN 112102881A
- Authority
- CN
- China
- Prior art keywords
- network
- node
- gene
- box
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000036541 health Effects 0.000 title claims abstract description 29
- 230000007717 exclusion Effects 0.000 claims abstract description 44
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 238000004040 coloring Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 74
- 238000012545 processing Methods 0.000 claims description 8
- 230000004186 co-expression Effects 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000003012 network analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Physiology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提出了基于改进盒维数法的基因健康分形维数获取系统,包括:盒子数计算模块,被配置为:将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;改进盒维数模块,被配置为:从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;基因健康分形维数获取模块,被配置为:基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。其计算精度高,稳定性好,计算量低。
Description
技术领域
本公开属于计算机处理技术领域,尤其涉及基于改进盒维数法的基因健康分形维数获取方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
现实生活中的复杂网络具有分形特征,分形理论被广泛应用于复杂网络分析领域。分形维数是分形理论应用在复杂网络分析领域的重要工具,分形维数即为分形体的维数。
随着计算机技术的发展,利用计算机技术实现对生理的评估越来越普遍,准确的生理的评估进行便于提前进行预防及调整。
目前计算分形维数时,例如计算基因健康分形维数时存在一些问题:所需盒子数存在随机性。复杂网络中节点的序号是随机的,而该算法的计算结果和节点的序号有关,因此节点序号不同时会计算出不同的所需盒子数,从而得到不同的分形维数,这导致了该算法在复杂网络的分形维数计算时存在随机性。
另外,算法计算量大。为了降低该算法的随机性,在计算覆盖网络所需盒子数时会对该网络进行多次计算,即多次改变节点序号后进行计算(如1000次),并对计算结果取平均值。这导致为求得网络的分形维数,需要进行大量的计算过程。
发明内容
为克服上述现有技术的不足,本公开提供了基于改进盒维数法的基因健康分形维数获取系统,便于快速的获取基因健康分形维数。
为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
第一方面,公开了基于改进盒维数法的基因健康分形维数获取系统,包括:
样本-基因矩阵处理模块,被配置为:接收样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵;
基因的复杂网络模型构建模块,被配置为:基于邻接矩阵,结合节点拓扑重叠相异度度量形成拓扑重叠矩阵即基因共表达网络;
盒子数计算模块,被配置为:将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;
改进盒维数模块,被配置为:从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;
基因健康分形维数获取模块,被配置为:基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。
第二方面,公开了基于改进盒维数法的基因健康分形维数获取方法,包括:
接收样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵;
基于邻接矩阵,结合节点拓扑重叠相异度度量形成拓扑重叠矩阵即基因共表达网络;
将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;
从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;
基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。
以上一个或多个技术方案存在以下有益效果:
本公开技术方案充分利用节点的度和hub节点互斥性为基因网络分形维数的计算服务,首先用节点间的互斥距离代替节点间的距离,并按照度从高到低的顺序对节点进行着色,从而增加了拟合数据点并加快了节点入盒的速度;其次改变相同度的节点的顺序,得到所需最小的颜色数目,从而降低了覆盖网络所需的盒子数,得到最优结果,计算精度得到提高,且不存在随机性,无需多次重复计算后取平均值,进而大大降低了计算量。本发明计算的基因健康分形指标,其计算精度高,稳定性好,计算量低。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例子的方法流程图;
图2为本公开实施例子分形维数计算的的示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了基于改进盒维数法的基因健康分形维数获取系统,包括:
样本-基因矩阵处理模块,被配置为:接收样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵;
基因的复杂网络模型构建模块,被配置为:基于邻接矩阵,结合节点拓扑重叠相异度度量形成拓扑重叠矩阵即基因共表达网络;
盒子数计算模块,被配置为:将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;
改进盒维数模块,被配置为:从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;
基因健康分形维数获取模块,被配置为:基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。
更为具体的,样本-基因矩阵处理模块中,输入样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵。利用权重函数对相关性矩阵进行整定,在保证网络信息完整性的同时将节点相似性关联度转化为连接强度,形成邻接矩阵A=[aij]。
需要进行解释说明的是,把每一列作为一个向量,计算该列与其他列的Pearson相关系数,计算的结果即表示这两个基因之间的相关性。若计算样本-基因矩阵中的m列的基因与n列的基因的相关关系数,那么对应这两个基因的相关性计算结果即为相似性矩阵的m行n列和n行m列的位置。相似性矩阵是一个对角线为1的对称矩阵。
邻接矩阵即基因和基因之间的加权相关性值构成的矩阵。邻接矩阵通过权重函数实现,A为形成的邻接矩阵,aij代表所生成邻接矩阵中i行j列的数据。
其中,lij=∑uaiuauj,ki=∑uaiu是第i个节点与其他节点的直接连接数目,aij为邻接矩阵中i行j列的数据,kj=∑uauj是第j个节点与其他节点的直接连接数目。选择一个合适的硬阈值,进一步处理拓扑重叠矩阵得到基因网络G1。即,将每个基因看做一个网络节点,如果对应两组基因的拓扑重叠矩阵值大于该硬阈值,那么基因的复杂网络中对应该两组基因的度设为1,反之则为0。
盒子数计算模块中,将原始基因网络(基因网络G1)转换为带节点互斥力的网络G2。计算原始网络中各个节点间的互斥力fij,如果节点i,j之间有连边,则可依据式(1)计算两节点的互斥力:
fij=ki×kj, (1)
其中,ki,kj分别表示节点i,j的度。
如果节点i,j之间没有连边,那么两个节点间的互斥力为0(fij=0)。
计算原始基因网络中各个节点间的互斥距离flij,并构建新的网络G3。节点i,j间的互斥距离flij定义为两节点路径所经过连边的互斥力之和的最小值,即:
其中fij代表两个相连节点i,j的边eij上的互斥力,jn(n=1,2,…)代表连接节点i,j的中间节点。
假设给定盒子大小lB,计算原始基因网络中各个节点间的互斥距离,构建一个新的网络G3,如果原始基因网络中两个节点间的互斥距离大于或等于给定盒子大小lB,那么在新的网络G3中两个节点间将添加一条连边,否则两个节点间没有连边。
节点着色。选择网络中度最大的节点,并将该节点的颜色值设置为1。在满足要求:每个节点与其相连邻居节点具有不同颜色值的前提下,按照节点度从高到低的顺序对所有节点进行着色。交换度相同的节点的顺序,并重新进行节点着色,从而得到一个所需颜色数目最小的节点排列顺序。
计算盒子数。一种颜色可以代表一个盒子,网络G3中所用的颜色数目就是覆盖网络G2所需的盒子个数。
改进盒维数模块,从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小lB,重复利用盒子数计算模块,计算不同盒子大小对应的覆盖网络所需要的盒子数。
基因健康分形维数获取模块中,计算网络的分形维数DdB。覆盖网络所需的盒子数与盒子大小之间满足幂律关系,如下所示:
对log(NB)和log(lB)进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数,记为DdB。lB为盒子的大小(尺寸),NB为给定盒子大小下覆盖整个网络所需的盒子数。
实施例子二
如图1和图2所示,本发明提供了基于改进盒维数法的基因健康分形维数获取方法,该方法的具体实现过程包括以下步骤:
步骤1、输入样本-基因矩阵,计算基因之间的相似性矩阵。在样本-基因矩阵中,行为样本,列为基因。把样本-基因矩阵中的每一列作为一个向量,计算该向量与其他向量的Pearson相关系数,该结果即为两个基因间的相关性。若要计算样本-基因矩阵中的m列基因与n列基因间的相关性系数,那么该计算结果会存储在相似性矩阵的m行n列与n行m列的位置。
步骤2、将相似性矩阵转化为邻接矩阵。利用权重函数对相关性矩阵进行整定,在保证网络信息完整性的同时将节点相似性关联度转化为连接强度,形成邻接矩阵A=[aij]。
其中,lij=∑uaiuauj,ki=∑uaiu是第i个节点与其他节点的直接连接数目,kj=∑uauj是第j个节点与其他节点的直接连接数目。选择一个合适的硬阈值,进一步处理拓扑重叠矩阵得到基因网络G1。即,将每个基因看做一个网络节点,如果对应两组基因的拓扑重叠矩阵值大于该硬阈值,那么基因的复杂网络中对应该两组基因的度设为1,反之则为0。
步骤4、将原始的基因网络转换为带节点互斥力的网络G2。在真实的分形网络中,度大的节点更偏向于与度(节点的度是指和该节点相连节点的个数)小的节点相连,而不是与度大的节点直接相连。这种hub节点(度很大的节点,即有很多与该节点直接相连的节点)倾向于连接度小的节点而不是与其他Hub节点相连的现象定义为hub节点互斥性。科学家经过一系列试验得出结论,hub节点互斥性是产生分形网络的重要机制。在本发明中,互斥力存在于连接节点的边上,并且互斥力的大小取决于连边两端的节点的度。原始的基因复杂网络中各个基因节点间的互斥力fij计算如下:
如果节点i,j之间有连边,则可依据式(1)计算两节点的互斥力:
fij=ki×kj, (1)
其中,ki,kj分别表示节点i,j的度。
如果节点i,j之间没有连边,那么两个节点间的互斥力为0(fij=0)。
每个节点都和与其有边相连的节点间存在非零互斥力,并且这两个节点的度越大,节点间的互斥力越大。
步骤5、计算原始基因网络中各个节点间的互斥距离flij,并构建新的网络G3。节点i,j间的互斥距离flij定义为两节点路径所经过连边的互斥力之和的最小值,即:
其中fij代表两个相连节点i,j的边eij上的互斥力,jn(n=1,2,…)代表连接节点i,j的中间节点,min(x,y)表示取x,y中较小的一个值。网络的互斥力直径为
fd=max(flij) (3)
假设给定盒子大小lB,计算原始基因网络中各个节点间的互斥距离,构建一个新的网络G3,如果原始网络中两个节点间的互斥距离大于或等于给定盒子大小lB,那么在新的网络G3中两个节点间将添加一条连边,否则两个节点间没有连边。
步骤6、节点着色。选择网络中度最大的节点,并将该节点的颜色值设置为1。在满足要求:每个节点与其相连邻居节点有不同的颜色值的前提下,按照节点度从高到低的顺序对所有节点进行着色。交换度相同的节点的顺序,并重新进行节点着色,从而得到一个所需颜色数目最小的节点排列顺序。
步骤7、计算盒子数。如果网络G3中的两节点i,j的颜色值不同,那么在网络G2中的互斥距离flij≥lB,则两个节点不能被一个盒子覆盖,即网络G3中颜色值不同的节点不能被同一盒子覆盖。而网络G3中颜色值相同的节点没有直接相连,他们在网络G2中的互斥距离小于给定盒子大小,因此可以被同一个盒子覆盖,即网络G3中颜色值相同的节点可以被同一盒子覆盖。一种颜色可以代表一个盒子,网络G3中所用的颜色数目就是覆盖网络G2所需的盒子个数。
步骤8、改变盒子大小lB,重复步骤5、步骤6、步骤7。从网络中任意节点对间最短的互斥距离到任意节点对间次短的互斥距离直到网络的互斥直径,依次改为盒子大小lB,重复步骤5、步骤6、步骤7,计算不同盒子大小对应的覆盖网络所需要的盒子数。值得注意的是:盒子大小并非是依次增加1,而是从最短的互斥距离长度到次短的互斥距离长度
步骤9、计算基因网络的分形维数DdB。覆盖网络所需的盒子数与盒子大小之间满足幂律关系,如下所示:
对log(NB)和log(lB)进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数,记为DdB。
计算所得的分形维数是评估健康状态的重要指标,分形维数越大,健康状态越好。本发明可以快速计算基因健康分形指标,进而评估身体健康状态。
本公开技术方案解决了传统盒维数算法在计算基因健康分形指标上计算量大的问题,同时与现有技术相比,本方法对盒子数目的统计更加准确计算精度高,稳定性好,不存在随机性,计算量低。
实施例三
本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述例子方法中的具体步骤。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述例子方法中的具体步骤。
以上实施例的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。
本领域技术人员应该明白,上述本公开的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本公开不限制于任何特定的硬件和软件的结合。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (10)
1.基于改进盒维数法的基因健康分形维数获取系统,其特征是,包括:
样本-基因矩阵处理模块,被配置为:接收样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵;
基因的复杂网络模型构建模块,被配置为:基于邻接矩阵,结合节点拓扑重叠相异度度量形成拓扑重叠矩阵即基因共表达网络;
盒子数计算模块,被配置为:将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;
改进盒维数模块,被配置为:从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;
基因健康分形维数获取模块,被配置为:基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。
2.如权利要求1所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,所述样本-基因矩阵处理模块中,利用权重函数对相关性矩阵进行整定,在保证网络信息完整性的同时将节点相似性关联度转化为连接强度,形成邻接矩阵。
3.如权利要求1所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,所述基因的复杂网络模型中,将每个基因看做一个网络节点,如果对应两组基因的拓扑重叠矩阵值大于设定的硬阈值,那么基因的复杂网络中对应该两组基因的度设为1,反之则为0。
4.如权利要求1所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,所述盒子数计算模块中,假设给定盒子大小,计算原始基因网络中各个节点间的互斥距离,构建一个新的网络,如果原始基因网络中两个节点间的互斥距离大于或等于给定盒子大小,那么在新的网络中两个节点间将添加一条连边,否则两个节点间没有连边。
5.如权利要求1所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,所述盒子数计算模块中对节点着色:选择网络中度最大的节点,并将该节点的颜色值设置为1,在满足要求:每个节点与其相连邻居节点具有不同颜色值的前提下,按照节点度从高到低的顺序对所有节点进行着色。
6.如权利要求5所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,交换度相同的节点的顺序,并重新进行节点着色,从而得到一个所需颜色数目最小的节点排列顺序。
7.如权利要求6所述的基于改进盒维数法的基因健康分形维数获取系统,其特征是,所述盒子数计算模块中,盒子数计算时:按照一种颜色代表一个盒子,网络中所用的颜色数目就是覆盖网络所需的盒子个数。
8.基于改进盒维数法的基因健康分形维数获取方法,其特征是,包括:
接收样本-基因矩阵,计算基因之间的相似性矩阵,将相似性矩阵转化为邻接矩阵;
基于邻接矩阵,结合节点拓扑重叠相异度度量形成拓扑重叠矩阵即基因共表达网络;
将原始基因网络转换为带节点互斥力的网络,计算原始基因网络中各个节点间的互斥距离,对节点着色并计算盒子数;
从网络中任意节点对间最短的互斥距离到次短的任意节点对间最短的互斥距离直到网络的互斥直径,依次改变盒子大小,计算不同盒子大小对应的覆盖网络所需要的盒子数;
基于覆盖网络所需的盒子数与盒子大小之间的幂律关系,进行回归拟合,所得拟合直线斜率的绝对值即为网络的分形维数。
9.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现上述权利要求1-7任一所述系统对应的具体步骤,或者权利要求8所述方法中的具体步骤。
10.一种计算机可读存储介质,其特征是,其上存储有计算机程序,该程序被处理器执行时执行上述权利要求1-7任一所述系统对应的具体步骤,或者权利要求8所述方法中的具体步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095415.3A CN112102881B (zh) | 2020-10-14 | 2020-10-14 | 基于改进盒维数法的基因健康分形维数获取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095415.3A CN112102881B (zh) | 2020-10-14 | 2020-10-14 | 基于改进盒维数法的基因健康分形维数获取方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112102881A true CN112102881A (zh) | 2020-12-18 |
CN112102881B CN112102881B (zh) | 2023-11-24 |
Family
ID=73783305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011095415.3A Active CN112102881B (zh) | 2020-10-14 | 2020-10-14 | 基于改进盒维数法的基因健康分形维数获取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102881B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011008562A (ja) * | 2009-06-26 | 2011-01-13 | Kyoto Univ | プラント制御情報生成装置及び方法、並びにそのためのコンピュータプログラム |
CN107992720A (zh) * | 2017-12-14 | 2018-05-04 | 浙江工业大学 | 基于共表达网络的癌症靶向标志物测绘方法 |
CN108920678A (zh) * | 2018-07-10 | 2018-11-30 | 福州大学 | 一种基于谱聚类与模糊集的重叠社区发现方法 |
CN109872772A (zh) * | 2019-02-14 | 2019-06-11 | 辽宁省肿瘤医院 | 利用权重基因共表达网络挖掘结直肠癌放疗特异性基因的方法 |
WO2020093291A1 (zh) * | 2018-11-08 | 2020-05-14 | 深圳大学 | 一种网络拓扑重构方法、装置及终端设备 |
-
2020
- 2020-10-14 CN CN202011095415.3A patent/CN112102881B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011008562A (ja) * | 2009-06-26 | 2011-01-13 | Kyoto Univ | プラント制御情報生成装置及び方法、並びにそのためのコンピュータプログラム |
CN107992720A (zh) * | 2017-12-14 | 2018-05-04 | 浙江工业大学 | 基于共表达网络的癌症靶向标志物测绘方法 |
CN108920678A (zh) * | 2018-07-10 | 2018-11-30 | 福州大学 | 一种基于谱聚类与模糊集的重叠社区发现方法 |
WO2020093291A1 (zh) * | 2018-11-08 | 2020-05-14 | 深圳大学 | 一种网络拓扑重构方法、装置及终端设备 |
CN109872772A (zh) * | 2019-02-14 | 2019-06-11 | 辽宁省肿瘤医院 | 利用权重基因共表达网络挖掘结直肠癌放疗特异性基因的方法 |
Non-Patent Citations (3)
Title |
---|
付饶;孟凡荣;邢艳;: "基于节点重要性与相似性的重叠社区发现算法", 计算机工程, no. 09 * |
刘国华;王鲁;李万龙;李岩;: "医学影像分形压缩技术", 中国医疗前沿, no. 17 * |
郑巍;邓宇凡;潘倩;: "基于模块度的社交网络分形维度计算方法", 传感器与微系统, no. 10 * |
Also Published As
Publication number | Publication date |
---|---|
CN112102881B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111242282B (zh) | 基于端边云协同的深度学习模型训练加速方法 | |
CN109948029B (zh) | 基于神经网络自适应的深度哈希图像搜索方法 | |
CN110209825A (zh) | 一种基于宽度学习系统的快速网络表征学习算法 | |
CN110929873A (zh) | 一种量子程序的处理方法、装置、存储介质和电子装置 | |
CN113780436B (zh) | 一种基于综合度的复杂网络关键节点识别方法 | |
CN112766315B (zh) | 一种用于测试人工智能模型鲁棒性的方法和系统 | |
CN113850389B (zh) | 一种量子线路的构建方法及装置 | |
CN105978711B (zh) | 一种基于最小生成树的最佳交换边查找方法 | |
CN113422695B (zh) | 一种提高物联网拓扑结构鲁棒性能的优化方法 | |
CN114819163B (zh) | 量子生成对抗网络的训练方法、装置、介质及电子装置 | |
CN109919172A (zh) | 一种多源异构数据的聚类方法及装置 | |
CN110136017A (zh) | 一种基于数据增强和非负矩阵稀疏分解的群组发现方法 | |
Traganitis et al. | Network topology inference via elastic net structural equation models | |
CN107451617B (zh) | 一种图转导半监督分类方法 | |
CN106874931B (zh) | 用户画像分群方法和装置 | |
CN104915714A (zh) | 一种基于回声状态网络的预测方法及装置 | |
CN116611527B (zh) | 量子电路处理方法、装置及电子设备 | |
CN108712278A (zh) | 一种基于集成学习的网络社区发现方法 | |
CN109255433B (zh) | 一种基于相似性的社区检测的方法 | |
CN112102881A (zh) | 基于改进盒维数法的基因健康分形维数获取方法及系统 | |
CN115544307A (zh) | 基于关联矩阵的有向图数据特征提取与表达方法和系统 | |
CN111415265A (zh) | 生成式对抗网络的社交关系数据生成方法 | |
CN106296747A (zh) | 基于结构决策图的鲁棒多模型拟合方法 | |
CN110727569B (zh) | 一种多因素综合环境下的系统性能评估方法 | |
CN114972695A (zh) | 一种点云生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |