CN112382414B - 基于复杂网络的生物活动时间序列分析方法和装置 - Google Patents

基于复杂网络的生物活动时间序列分析方法和装置 Download PDF

Info

Publication number
CN112382414B
CN112382414B CN202110028187.6A CN202110028187A CN112382414B CN 112382414 B CN112382414 B CN 112382414B CN 202110028187 A CN202110028187 A CN 202110028187A CN 112382414 B CN112382414 B CN 112382414B
Authority
CN
China
Prior art keywords
network
biological activity
activity time
time sequence
state transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110028187.6A
Other languages
English (en)
Other versions
CN112382414A (zh
Inventor
李泽朋
马元巍
顾徐波
宋怡然
潘正颐
侯大为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Weiyizhi Technology Co Ltd
Original Assignee
Changzhou Weiyizhi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Weiyizhi Technology Co Ltd filed Critical Changzhou Weiyizhi Technology Co Ltd
Priority to CN202110028187.6A priority Critical patent/CN112382414B/zh
Publication of CN112382414A publication Critical patent/CN112382414A/zh
Application granted granted Critical
Publication of CN112382414B publication Critical patent/CN112382414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种基于复杂网络的生物活动时间序列分析方法和装置,所述方法包括:获取生物活动时间序列数据;通过复杂网络将生物活动时间序列数据转换为状态转移网络;获取状态转移网络的网络特征,其中,状态转移网络的网络特征包括:motif图;对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。本发明的分析方法,通过对生物活动时间时序数据进行分析,得到生物的长程相关性,对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。

Description

基于复杂网络的生物活动时间序列分析方法和装置
技术领域
本发明涉及复杂网络技术领域,具体涉及一种基于复杂网络的生物活动时间序列分析方法、一种基于复杂网络的生物活动时间序列分析装置、一种计算机设备和一种非临时性计算机可读存储介质。
背景技术
现有的对于生物(如小鼠)活动规律分析的研究大多基于时序领域做时间序列分析,揭示小白鼠在时域上的规律。然而这种规律已经不太能满足医学上用在生物上进行试药,来判断该药效在不同的年龄、身体健康程度的效果。
发明内容
本发明为解决上述技术问题,提供了一种基于复杂网络的生物活动时间序列分析方法,通过利用复杂网络将生物活动时间序列数据转换为状态转移网络,并根据状态转移网络的网络特征确定生物活动时间序列数据是否具有长程相关性,对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
本发明采用的技术方案如下:
一种基于复杂网络的生物活动时间序列分析方法,包括以下步骤:获取生物活动时间序列数据;通过复杂网络将所述生物活动时间序列数据转换为状态转移网络;获取所述状态转移网络的网络特征;,其中,所述状态转移网络的网络特征包括:motif图;对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性。
根据本发明的一个实施例,通过复杂网络将所述生物活动时间序列数据转换为状态转移网络,包括:通过长度为第一预设值的滑动窗口沿时间序列数据从前向后滑动,以获取多个第一预设值的滑动窗口大小的时间序列片段;将每个时间序列片段中的每个数据作为一个节点,并将彼此可见的两个节点相互连接,构成邻接矩阵序列;将所述邻接矩阵序列中状态相邻的邻接矩阵相连,构成邻接矩阵状态链;遍历所述邻接矩阵状态链,当存在任意两个状态的邻接矩阵相同时,用前者状态对应的邻接矩阵代替后者状态对应的邻接矩阵,以构成状态转移网络。
根据本发明的一个实施例,通过下述公式确定两个节点x a x b 彼此可见:
Figure 70334DEST_PATH_IMAGE001
其中,x c 表示处于节点x a 和节点x b 之间的每个节点,abc分别表示所述生物活动时间序列数据中数据的位置。
根据本发明的一个实施例,所述状态转移网络的网络特征,包括:获取所述状态转移网络中每个节点的度;当某一个节点的度大于其余节点的度时,将该节点记为中心节点;随机重组所述生物活动时间序列数据的顺序,并将重组后的所述生物活动时间序列数据转换为状态转移网络;如果所述中心节点的度与重组后的状态转移网络中的该节点的度之间的比值大于预设阈值,则所述中心节点为motif图。
根据本发明的一个实施例,对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性,包括:将每个motif图对应的生物活动时间序列数据作为一个序列;通过长度为第二预设值的滑动窗口沿时间序列滑动,以获取多个第二预设值滑动窗口大小的时间序列片段;对每个时间序列片段进行多项式拟合,以获取对应的拟合曲线值;将多个所述时间序列片段中的每个时间序列片段减去对应的拟合曲线值,以获得去趋势时间序列;根据所述去趋势时间序列获取标度指数。
根据本发明的一个实施例,通过下述公式进行多项式拟合:
Figure 921396DEST_PATH_IMAGE002
其中,
Figure 699035DEST_PATH_IMAGE003
为拟合参数,β=0,1,…,qq为正整数,
Figure 228499DEST_PATH_IMAGE004
表示每个时间 序列片段的趋势,即拟合曲线值,j=1,2,…,MM为正整数,n=1,2,…,M-w+1M-w+1为正整 数,w表示所述第二预设值;
通过下述公式获取所述标度指数:
Figure 849229DEST_PATH_IMAGE005
Figure 676720DEST_PATH_IMAGE006
其中,Y n+t-1 表示多个第二预设值滑动窗口大小的时间序列片段,t=1,2,…,M-w+1M为每个motif图对应的生物活动时间序列数据的序列长度,F(t,n)表示对应的拟合曲线值,用最小二乘法对双对数坐标(lnw,ln(DFA(w)))中的数据进行拟合,拟合后直线的斜率记为标度指数H
根据本发明的一个实施例,其中,当所述标度指数大于第三预设值且小于第四预设值时,确定所述生物活动时间序列数据具有长程相关性。
本发明还提出了一种基于复杂网络的生物活动时间序列分析装置,包括:第一获取模块,用于获取生物活动时间序列数据;转换模块,用于通过复杂网络将所述生物活动时间序列数据转换为状态转移网络;第二获取模块,用于获取所述状态转移网络的网络特征,其中,所述状态转移网络的网络特征包括:motif图;确定模块,用于对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性。
本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述的基于复杂网络的生物活动时间序列分析方法。
本发明还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于复杂网络的生物活动时间序列分析方法。
本发明的有益效果:
本发明通过利用复杂网络将生物活动时间序列数据转换为状态转移网络,并根据状态转移网络的网络特征确定生物活动时间序列数据是否具有长程相关性,对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
附图说明
图1为本发明实施例的基于复杂网络的生物活动时间序列分析方法的流程图;
图2为本发明一个实施例的基于复杂网络的生物活动时间序列的可见图;
图3A-图3F为本发明一个实施例基于复杂网络的生物活动时间序列分析方法的示意图;
图4A-图4F为本发明另一个实施例基于复杂网络的生物活动时间序列分析方法的示意图;
图5为本发明实施例的基于复杂网络的生物活动时间序列分析装置的方框示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例的基于复杂网络的生物活动时间序列分析方法的流程图。
如图1所示,本发明实施例的基于复杂网络的生物活动时间序列分析方法可包括以下步骤:
S1,获取生物活动时间序列数据。
具体而言,获取生物活动的作息时间(白天和夜晚),以小鼠为例,有6只小鼠,获取每只小鼠每分钟活动的次数,观察小鼠一个月活动次数,构成小鼠的活动时间序列数据。
S2,通过复杂网络将生物活动时间序列数据转换为状态转移网络。
根据本发明的一个实施例,通过复杂网络将生物活动时间序列数据转换为状态转移网络,包括:通过长度为第一预设值的滑动窗口沿时间序列数据从前向后滑动,以获取多个第一预设值的滑动窗口大小的时间序列片段;将每个时间序列片段中的每个数据作为一个节点,并将彼此可见的两个节点相互连接,构成邻接矩阵序列;将邻接矩阵序列中状态相邻的邻接矩阵相连,构成邻接矩阵状态链;遍历邻接矩阵状态链,当存在任意两个状态的邻接矩阵相同时,用前者状态对应的邻接矩阵代替后者状态对应的邻接矩阵,以构成状态转移网络。其中,第一预设值可根据实际情况进行标定,例如,第一预设值可以为5。需要说明的是,一般情况下滑动窗口的大小为5时,其对应的可见图的种类为25种,而在滑动窗口的大小为6或者其他数值时,可见图的种类是不确定的。
具体而言,利用复杂网络中的可见图方法,提取生物活动时间序列数据的信息,并能准确描述出相应的时间序列的结构特征。可见图方法的主要思想是利用图论来表达时间序列的特征,可见图理论构造的网络继承了时间序列的某些动力学特征,在研究时间序列的结构中具有重要的意义,该方法在对时间序列分析与复杂网络理论之间建立起了连接的桥梁,下面简要介绍该方法。
假设生物活动时间序列为{x 1 x 2 ,...,x N },其中,N为时间序列长度。首先,假设窗 口大小s为5,由大小为5的滑动窗口沿时间序列从前向后滑动,得到一系列滑动窗口大小的 时间序列片段:
Figure 953373DEST_PATH_IMAGE007
,其中,Z 1 包括(x 1 ,x 2 ,x 3 ,x 4 ,x 5 ),Z 2 包括 (x 2 ,x 3 ,x 4 ,x 5 ,x 6 ),…,Z m 包括(x N-s-3 ,x N-s-2 ,x N-s-1 ,x N-s ,x N-s+1 )。将各个时间序列片段Z m 映射为 可见图,时间序列片段中的每一个数据均看作一个节点,如果两个节点可以互相看见彼此, 则这两个节点相连接,即这两个节点之间存在一条可见的直线,例如,在本发明的一个实施 例中,通过下述公式确定两个节点x a x b 彼此可见:
Figure 381468DEST_PATH_IMAGE008
其中,x c 表示处于节点x a 和节点x b 之间的每个节点,abc分别表示所述生物活动时间序列数据中数据的位置。也就是说,当满足上述不等式时,则证明节点x a x b 彼此可见,从而能够形成由5个数据组成的可见图,其中,每5个数据组成一个可见图,假如有300组数据,那么就组成了300个可见图,当滑动窗口的大小为5时,不论有多少个可见图,发现可见图的种类只有25种,如图2所示,但是每一个种类中对应有很多个可见图。
在图2中,每个图可用该图对应的邻接矩阵表示,假设图的顶点集为V(G),边集为E(G),该图的邻接矩阵为A(G),则A(G)的矩阵元素a ij =1,v ij ∈E(G);否则a ij =0,其中,a ij 表示邻接矩阵A(G)中第i行,第j列的矩阵元素,v ij 表示顶点集为V(G)中第i行,第j列的点。用g k 表示邻接矩阵,并用之代表某一个滑动窗口内的数据构成的可见图,其中,k表示邻接矩阵序列中的第k个邻接矩阵,k为正整数。如果该滑动窗口内的数据点x a x b 相连,则邻接矩阵元素g k (a-k+1,b-k+1)的值为1;否则,邻接矩阵元素g k (a-k+1,b-k+1)的值为0。由此方式可将原生物活动时间序列为{x 1 x 2 ,...,x N }映射为邻接矩阵序列G={g 1 ,g 2 ,…,g N-s+1 },邻接矩阵序列G中的每一个元素代表一个可见图结构,由此我们利用可见图方法将整个生物活动时间序列映射为许多个可见图。
利用可见图方法得到邻接矩阵序列G,其中,该序列中的每一个元素代表一个可见图,同时也代表原生物活动时间序列为{x 1 x 2 ,...,x N }在滑动窗口内的局部状态结构,由可见图构成的状态转移网络可以描述不同局部状态之间的转移特征。在邻接矩阵序列G={g 1 ,g 2 ,…,g N-s+1 }中,如果状态a毗邻状态b,则邻接矩阵g a g b 相连,基于此连接方式可以得到一条状态链:g 1 -g 2 -g 3 -…-g N-s+1 ,遍历邻接矩阵状态链,如果任意两种状态的邻接矩阵相同,则用前者状态代替后者状态。举例说明,如果g 1 =g 3 ,则用g 1 替代g 3 ,则此时状态链变为g 1 -g 2 - g 1 -…-g N-s+1 。该遍历过程去除了状态链中重复的局部状态,将剩余的局部状态定义为网络节点,如图3A-图3F所示,从而将原生物活动时间序列映射成为状态转移网络,其中,图3A-图3F中的a1-f1为状态转移网络示意图,a2-f2为去掉重复链接的状态转移网络,a3-f3为重组并去掉重复链接的状态转移网络。
S3,获取状态转移网络的网络特征,其中,状态转移网络的网络特征包括:motif图。
根据本发明的一个实施例,获取状态转移网络的网络特征,包括:获取状态转移网络中每个节点的度;当某一个节点的度大于其余节点的度时,将该节点记为中心节点;随机重组生物活动时间序列数据的顺序,并将重组后的生物活动时间序列数据转换为状态转移网络;如果中心节点的度与重组后的状态转移网络中的该节点的度之间的比值大于预设阈值,则中心节点为motif图。其中,预设阈值可根据实际情况进行标定。
其中,需要说明的是,网络节点的度为局部状态g k 的出现次数,网络节点之间连边的权重则是不同的局部状态之间的转移次数,节点之间连边的方向为局部状态的转移方向。在网络图中,用网络节点的大小区分网络节点的度,用网络连边的粗细区分网络节点之间连边的权重。
具体而言,在状态转移过程中,节点的出现频率记为网络节点的度,当网络中某个节点的度远大于其他节点,则该节点被称为中心节点。从度的分布图中很容易发现中心节点,但该中心节点的结构也有可能出现在随机网络中,即完全用中心节点代表原时间序列的特征是不准确的。因此,随机打乱原始生物活动时间序列数据,并将该序列也按上述方法构成状态转移网络,如果原始时间序列对应的状态转移网络中的某个节点的度远大于随机打乱次序构成的状态转移网络中该节点的度,则该节点被称为motif图,如图4A-图4F所示,由图4A-图4F中可以看出,a1-f1表示的是原始状态转移网络中节点的度和重组状态转移网络中的节点的度,a2-f2表示的是原始状态转移网络中节点的度与对应的重组状态转移网络中的节点的度之间的比值,a3-f3表示的是通过去趋势波动分析法对motif图在原始生物活动时间序列数据中出现状态的标度行为。
S4,对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。
根据本发明的一个实施例,对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性,包括:将每个motif图对应的生物活动时间序列数据作为一个序列;通过长度为第二预设值的滑动窗口沿时间序列滑动,以获取多个第二预设值滑动窗口大小的时间序列片段;对每个时间序列片段进行多项式拟合,以获取对应的拟合曲线值;将多个时间序列片段中的每个时间序列片段减去对应的拟合曲线值,以获得去趋势时间序列;根据去趋势时间序列获取标度指数。其中,第二预设值可根据实际情况进行标定。
进一步地,根据本发明的一个实施例,通过下述公式进行多项式拟合:
Figure 190461DEST_PATH_IMAGE009
其中,
Figure 865549DEST_PATH_IMAGE010
为拟合参数,β=0,1,…,qq为正整数,
Figure 816450DEST_PATH_IMAGE011
表示每个时间序 列片段的趋势,即拟合曲线值,j=1,2,…,MM为正整数,n=1,2,…,M-w+1M-w+1为正整数,w 表示第二预设值;
通过下述公式获取标度指数:
Figure 678927DEST_PATH_IMAGE012
Figure 385502DEST_PATH_IMAGE013
其中,Y n+t-1 表示多个第二预设值滑动窗口大小的时间序列片段,t=1,2,…,M-w+1M为每个motif图对应的生物活动时间序列数据的序列长度,F(t,n)表示对应的拟合曲线值,用最小二乘法对双对数坐标(lnw,ln(DFA(w)))中的数据进行拟合,拟合后直线的斜率记为标度指数H
其中,当标度指数大于第三预设值且小于第四预设值时,确定生物活动时间序列数据具有长程相关性。第三预设值和第四预设值分别为0.5和1。
具体而言,由于motif图不止有一个,有很多个,且每个motif图中对应很多个生物 活动时间序列数据,将这些数据作为一个序列。假设序列为y j ,其中j=1,2,3,…,MM表示序 列长度。首先,由长度为w的滑动窗口沿时间序列滑动,可得到一系列时间序列片段Y n Y n = {Y n+1 ,Y n+2 ,..,Y n+w-1 },n=1,2,3…,M-w+1。其次,对每个时间序列片段用q阶多项式进行拟合, 例如,可通过公式
Figure 369507DEST_PATH_IMAGE014
进行拟合,得到对应的拟合曲线值。
将原序列片段中的每个时间序列片段减去相应的拟合曲线值,即可得到去趋势时间序列Z n Z n ={Y n -F(1,n),Y n+1 -F(2,n),…, Y n+w-1 -F(w,n)},其中,n=1,2,3…,M-w+1,根据上述公式判断原时间序列是否存在长程相关性,用最小二乘法对双对数坐标(lnw,ln(DFA(w)))中的数据进行拟合,拟合后直线的斜率记为标度指数H。其中,当H=0.5时,表明时间序列可用随机游走进行表示,该时间序列没有意义,换句话说,表明该时间序列不相关,是一个独立的随机过程,即当前状态不会影响下一个状态;当0.5<H<1时,表明时间序列为长期持续的记忆性过程,即为必然特征,换句话说,该时间序列具有长程相关性,呈现出趋势不断增强的状态,即在某一个时间段是递增(递减)趋势,下一个时间段也会是递增(递减)趋势,且H越接近于1,相关性越强;当0<H<0.5时,表明时间序列为持续的反记忆性过程,换句话说,该时间序列只存在负的相关性,呈现反持久性的状态,即该时间序列在某一个时间段是递增(递减)趋势,在下一个时间段是递减(递增)的趋势。如图4A-图4F所示,a3-f3可以看出,H值越大,相关性越强。
需要说明的是,多次试验证明,当q值取2的多项式对序列片段进行拟合,能使每个标度范围内的数据点数目几乎相同,提高了结果的准确性,因此,多项式拟合函数中的阶数q取2,即用最小二乘法拟合序列片段趋势。
另外,假设该分析方法用在医学领域,在试验药物时,可以对不同年龄段或者不同健康程度的生物进行注射试验药物,通过对生物活动时间序列数据进行分析,可以分析得到生物相同年龄,且身体健康程度不同的药性,也可以分析得到生物不同年龄,相同身体健康程度的药性等,对医学领域上的帮助是非常之大的。
综上所述,本发明实施例的基于复杂网络的生物活动时间序列分析方法,首先获取生物活动时间序列数据,并通过复杂网络将生物活动时间序列数据转换为状态转移网络,然后获取状态转移网络的网络特征,并对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
对应上述实施例的基于复杂网络的生物活动时间序列分析方法,本发明还提出一种基于复杂网络的生物活动时间序列分析装置。
图5为本发明实施例的基于复杂网络的生物活动时间序列分析装置的方框示意图。
如图5所示,本发明实施例的基于复杂网络的生物活动时间序列分析装置可包括:第一获取模块10、转换模块20、第二获取模块30和确定模块40。
其中,第一获取模块10用于获取生物活动时间序列数据。转换模块20用于通过复杂网络将生物活动时间序列数据转换为状态转移网络。第二获取模块30用于获取状态转移网络的网络特征,其中,状态转移网络的网络特征包括:motif图。确定模块40用于对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。
根据本发明的一个实施例,转换模块20通过复杂网络将生物活动时间序列数据转换为状态转移网络,具体用于,通过长度为第一预设值的滑动窗口沿时间序列数据从前向后滑动,以获取多个第一预设值的滑动窗口大小的时间序列片段;将每个时间序列片段中的每个数据作为一个节点,并将彼此可见的两个节点相互连接,构成邻接矩阵序列;将邻接矩阵序列中状态相邻的邻接矩阵相连,构成邻接矩阵状态链;遍历邻接矩阵状态链,当存在任意两个状态的邻接矩阵相同时,用前者状态对应的邻接矩阵代替后者状态对应的邻接矩阵,以构成状态转移网络。
根据本发明的一个实施例,转换模块20还用于通过下述公式确定两个节点x a x b 彼此可见:
Figure 429210DEST_PATH_IMAGE015
其中,x c 表示处于节点x a 和节点x b 之间的每个节点,abc分别表示所述生物活动时间序列数据中数据的位置。
根据本发明的一个实施例,第二获取模块30获取状态转移网络的网络特征,具体用于,获取状态转移网络中每个节点的度;当某一个节点的度大于其余节点的度时,将该节点记为中心节点;随机重组生物活动时间序列数据的顺序,并将重组后的生物活动时间序列数据转换为状态转移网络;如果中心节点的度与重组后的状态转移网络中的该节点的度之间的比值大于预设阈值,则中心节点为motif图。
根据本发明的一个实施例,确定模块40对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性,具体用于,将每个motif图对应的生物活动时间序列数据作为一个序列;通过长度为第二预设值的滑动窗口沿时间序列滑动,以获取多个第二预设值滑动窗口大小的时间序列片段;对每个时间序列片段进行多项式拟合,以获取对应的拟合曲线值;将多个时间序列片段中的每个时间序列片段减去对应的拟合曲线值,以获得去趋势时间序列;根据去趋势时间序列获取标度指数。
根据本发明的一个实施例,确定模块40通过下述公式进行多项式拟合:
Figure 543315DEST_PATH_IMAGE016
其中,
Figure 868510DEST_PATH_IMAGE017
为拟合参数,β=0,1,…,qq为正整数,
Figure 513163DEST_PATH_IMAGE018
表示每个时间 序列片段的趋势,即拟合曲线值,i=1,2,…,MM为正整数,n=1,2,…,M-w+1M-w+1为正整 数,w表示第二预设值;
确定模块40通过下述公式获取标度指数:
Figure 48443DEST_PATH_IMAGE019
Figure 681419DEST_PATH_IMAGE020
其中,Y n+t-1 表示多个第二预设值滑动窗口大小的时间序列片段,t=1,2,…,M-w+1M为每个motif图对应的生物活动时间序列数据的序列长度,F(t,n)表示对应的拟合曲线值,用最小二乘法对双对数坐标(lnw,ln(DFA(w)))中的数据进行拟合,拟合后直线的斜率记为标度指数H
根据本发明的一个实施例,确定模块40还用于,当标度指数大于第三预设值且小于第四预设值时,确定生物活动时间序列数据具有长程相关性。
需要说明的是,本发明实施例的基于复杂网络的生物活动时间序列分析装置中未披露的细节,请参照本发明实施例的基于复杂网络的生物活动时间序列分析方法中所披露的细节,具体这里不再赘述。
本发明实施例的基于复杂网络的生物活动时间序列分析装置,通过利用复杂网络将生物活动时间序列数据转换为状态转移网络,并根据状态转移网络的网络特征确定生物活动时间序列数据是否具有长程相关性,对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
对应上述实施例,本发明还提出一种计算机设备。
本发明实施例的计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该计算机程序时,可实现根据本发明上述实施例所述的基于复杂网络的生物活动时间序列分析方法。
根据本发明实施例的计算机设备,处理器执行存储在存储器上的计算机程序时,首先获取生物活动时间序列数据,并通过复杂网络将生物活动时间序列数据转换为状态转移网络,然后获取状态转移网络的网络特征,并对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
对应上述实施例,本发明还提出一种非临时性计算机可读存储介质。
本发明实施例的非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现根据本发明上述实施例所述的基于复杂网络的生物活动时间序列分析方法。
根据本发明实施例的非临时性计算机可读存储介质,处理器执行存储在其上的计算机程序时,首先获取生物活动时间序列数据,并通过复杂网络将生物活动时间序列数据转换为状态转移网络,然后获取状态转移网络的网络特征,并对网络特征进行分析,确定生物活动时间序列数据是否具有长程相关性。对例如医药领域中对生物注射药物进行试药时,能够根据生物的长程相关性判断药物的效果。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种基于复杂网络的生物活动时间序列分析方法,其特征在于,包括以下步骤:
获取生物活动时间序列数据;
通过复杂网络将所述生物活动时间序列数据转换为状态转移网络;
获取所述状态转移网络的网络特征,其中,所述状态转移网络的网络特征包括:motif图,所述获取所述状态转移网络的网络特征,包括:
获取所述状态转移网络中每个节点的度,其中,节点的度表示在状态转移过程中,节点的出现频率;
当某一个节点的度大于其余节点的度时,将该节点记为中心节点;
随机重组所述生物活动时间序列数据的顺序,并将重组后的所述生物活动时间序列数据转换为状态转移网络;
如果所述中心节点的度与重组后的状态转移网络中的该节点的度之间的比值大于预设阈值,则所述中心节点为motif图;
对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性。
2.根据权利要求1所述的基于复杂网络的生物活动时间序列分析方法,其特征在于,通过复杂网络将所述生物活动时间序列数据转换为状态转移网络,包括:
通过长度为第一预设值的滑动窗口沿时间序列数据从前向后滑动,以获取多个第一预设值的滑动窗口大小的时间序列片段;
将每个时间序列片段中的每个数据作为一个节点,并将彼此可见的两个节点相互连接,构成邻接矩阵序列;
将所述邻接矩阵序列中状态相邻的邻接矩阵相连,构成邻接矩阵状态链;
遍历所述邻接矩阵状态链,当存在任意两个状态的邻接矩阵相同时,用前者状态对应的邻接矩阵代替后者状态对应的邻接矩阵,以构成状态转移网络。
3.根据权利要求2所述的基于复杂网络的生物活动时间序列分析方法,其特征在于,通过下述公式确定两个节点x a x b 彼此可见:
Figure 249539DEST_PATH_IMAGE001
其中,x c 表示处于节点x a 和节点x b 之间的每个节点,abc分别表示所述生物活动时间序列数据中数据的位置。
4.根据权利要求1所述的基于复杂网络的生物活动时间序列分析方法,其特征在于,对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性,包括:
将每个motif图对应的生物活动时间序列数据作为一个序列;
通过长度为第二预设值的滑动窗口沿时间序列滑动,以获取多个第二预设值滑动窗口大小的时间序列片段;
对每个时间序列片段进行多项式拟合,以获取对应的拟合曲线值;
将多个所述时间序列片段中的每个时间序列片段减去对应的拟合曲线值,以获得去趋势时间序列;
根据所述去趋势时间序列获取标度指数。
5.根据权利要求4所述的基于复杂网络的生物活动时间序列分析方法,其特征在于,通过下述公式进行多项式拟合:
Figure DEST_PATH_IMAGE002
其中,
Figure 643043DEST_PATH_IMAGE003
为拟合参数,β=0,1,…,qq为正整数,
Figure 547414DEST_PATH_IMAGE004
表示每个时间序列片段 的趋势,即拟合曲线值,j=1,2,…,MM为正整数,n=1,2,…,M-w+1M-w+1为正整数,w表示所 述第二预设值;
通过下述公式获取所述标度指数:
Figure 303143DEST_PATH_IMAGE005
Figure 979499DEST_PATH_IMAGE006
其中,Y n+t-1 表示多个第二预设值滑动窗口大小的时间序列片段,t=1,2,…,M-w+1M为每个motif图对应的生物活动时间序列数据的序列长度,F(t,n)表示对应的拟合曲线值,用最小二乘法对双对数坐标(lnw,ln(DFA(w)))中的数据进行拟合,拟合后直线的斜率记为标度指数H
6.根据权利要求5所述的基于复杂网络的生物活动时间序列分析方法,其特征在于,其中,
当所述标度指数大于第三预设值且小于第四预设值时,确定所述生物活动时间序列数据具有长程相关性。
7.一种基于复杂网络的生物活动时间序列分析装置,其特征在于,包括:
第一获取模块,用于获取生物活动时间序列数据;
转换模块,用于通过复杂网络将所述生物活动时间序列数据转换为状态转移网络,其中,所述状态转移网络的网络特征包括:motif图;
第二获取模块,用于获取所述状态转移网络的网络特征,其中,所述第二获取模块获取所述状态转移网络的网络特征包括:
获取所述状态转移网络中每个节点的度,其中,节点的度表示在状态转移过程中,节点的出现频率;
当某一个节点的度大于其余节点的度时,将该节点记为中心节点;
随机重组所述生物活动时间序列数据的顺序,并将重组后的所述生物活动时间序列数据转换为状态转移网络;
如果所述中心节点的度与重组后的状态转移网络中的该节点的度之间的比值大于预设阈值,则所述中心节点为motif图;
确定模块,用于对所述网络特征进行分析,确定所述生物活动时间序列数据是否具有长程相关性。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现根据权利要求1-6中任一项所述的基于复杂网络的生物活动时间序列分析方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现根据权利要求1-6中任一项所述的基于复杂网络的生物活动时间序列分析方法。
CN202110028187.6A 2021-01-11 2021-01-11 基于复杂网络的生物活动时间序列分析方法和装置 Active CN112382414B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110028187.6A CN112382414B (zh) 2021-01-11 2021-01-11 基于复杂网络的生物活动时间序列分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110028187.6A CN112382414B (zh) 2021-01-11 2021-01-11 基于复杂网络的生物活动时间序列分析方法和装置

Publications (2)

Publication Number Publication Date
CN112382414A CN112382414A (zh) 2021-02-19
CN112382414B true CN112382414B (zh) 2021-05-11

Family

ID=74590049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110028187.6A Active CN112382414B (zh) 2021-01-11 2021-01-11 基于复杂网络的生物活动时间序列分析方法和装置

Country Status (1)

Country Link
CN (1) CN112382414B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102086473A (zh) * 2010-05-12 2011-06-08 天津市泌尿外科研究所 人类多基因疾病关键基因的无向网络筛选方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN110070909A (zh) * 2019-03-21 2019-07-30 中南大学 一种基于深度学习的融合多特征的蛋白质功能预测方法
CN112069398A (zh) * 2020-08-24 2020-12-11 腾讯科技(深圳)有限公司 一种基于图网络的信息推送方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411591B (zh) * 2016-09-30 2019-06-21 山东省计算中心(国家超级计算济南中心) 一种基于Hurst指数的网络安全态势预测方法
CN111027473B (zh) * 2019-12-09 2023-05-26 山东省科学院自动化研究所 一种基于人体关节运动实时预测的目标识别方法及系统
CN111917712A (zh) * 2020-06-17 2020-11-10 深圳市金城保密技术有限公司 一种针对多协议攻击数据的流量监测方法及监测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102086473A (zh) * 2010-05-12 2011-06-08 天津市泌尿外科研究所 人类多基因疾病关键基因的无向网络筛选方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN110070909A (zh) * 2019-03-21 2019-07-30 中南大学 一种基于深度学习的融合多特征的蛋白质功能预测方法
CN112069398A (zh) * 2020-08-24 2020-12-11 腾讯科技(深圳)有限公司 一种基于图网络的信息推送方法及装置

Also Published As

Publication number Publication date
CN112382414A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
Vidaurre et al. Brain network dynamics are hierarchically organized in time
Rostaghi et al. Dispersion entropy: A measure for time-series analysis
Azami et al. Two-dimensional dispersion entropy: An information-theoretic method for irregularity analysis of images
Wang et al. Comparison of different generalizations of clustering coefficient and local efficiency for weighted undirected graphs
Calce A new method to estimate adult age‐at‐death using the acetabulum
Arbour et al. Incomplete specimens in geometric morphometric analyses
Davies et al. Evolutionary origins of ultrasonic hearing and laryngeal echolocation in bats inferred from morphological analyses of the inner ear
Ruxton et al. Improving the reporting of P-values generated by randomization methods.
Saeb et al. Voodoo machine learning for clinical predictions
Hlinka et al. Small-world bias of correlation networks: From brain to climate
Dale et al. A new method for characterizing point patterns in plant ecology
Smith et al. Accounting for the complex hierarchical topology of EEG phase-based functional connectivity in network binarisation
Liang et al. Structure-function network mapping and its assessment via persistent homology
Feranchuk et al. Evaluating the use of diversity indices to distinguish between microbial communities with different traits
Kuznetsov et al. Power considerations for the application of detrended fluctuation analysis in gait variability studies
Van den Berg et al. A crowding model of visual clutter
Chun et al. Disentangling the local-scale drivers of taxonomic, phylogenetic and functional diversity in woody plant assemblages along elevational gradients in South Korea
Ma Measuring microbiome diversity and similarity with Hill numbers
Abazid et al. A comparative study of functional connectivity measures for brain network analysis in the context of AD detection with EEG
CN112382414B (zh) 基于复杂网络的生物活动时间序列分析方法和装置
Aflaki et al. Part II: A step-by-step guide to latent class analysis
Zhou et al. Quartet-based computations of internode certainty provide accurate and robust measures of phylogenetic incongruence
Tucker et al. Updating Markov models to integrate cross-sectional and longitudinal studies
Fossion et al. Criticality, adaptability and early-warning signals in time series in a discrete quasispecies model
Thuraisingham Estimating electroencephalograph network parameters using mutual information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant