CN113300897A - 因果关系的识别方法、终端设备及存储介质 - Google Patents

因果关系的识别方法、终端设备及存储介质 Download PDF

Info

Publication number
CN113300897A
CN113300897A CN202110670524.1A CN202110670524A CN113300897A CN 113300897 A CN113300897 A CN 113300897A CN 202110670524 A CN202110670524 A CN 202110670524A CN 113300897 A CN113300897 A CN 113300897A
Authority
CN
China
Prior art keywords
time sequence
rate time
prediction error
determining
joint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110670524.1A
Other languages
English (en)
Other versions
CN113300897B (zh
Inventor
张娜
陈庆彪
潘阳
郑烽
陈宜洁
陈威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110670524.1A priority Critical patent/CN113300897B/zh
Publication of CN113300897A publication Critical patent/CN113300897A/zh
Application granted granted Critical
Publication of CN113300897B publication Critical patent/CN113300897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种因果关系的识别方法,终端设备及计算机可读存储介质,所述方法包括:获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。本发明旨在达成提高宽带测速结果分析的全面性的效果。

Description

因果关系的识别方法、终端设备及存储介质
技术领域
本发明涉及通信技术领域,尤其涉及因果关系的识别方法、终端设备及计算机可读存储介质。
背景技术
由于网络环境十分复杂,影响宽带上传和下载速率的因素很多,如实际的物理带宽、当前的网络环境、实际使用的应用软件等。而在计算机网络中,传输的资源需要收到资源的确认消息回复,才能决定后续的传输速率,并决定是否重新传输丢失的资源。而上行的带宽一部分就是用来传输这些确认信息的。因此当出现上行负载过大的时候,上传队列就会出现拥塞,确认数据无法发出,很明显会影响确认消息的传送速度,进而影响到下载速率。
但是,相关技术中,仅能分析确定带宽和应用软件等对宽带测速结果的影响,而无法确定上传速率和下载速率之间的因果关系。这样导致相关技术中的宽带测速结果分析存在分析不全面的缺陷。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种因果关系的识别方法、终端设备及计算机可读存储介质,旨在达成提高宽带测速结果分析的全面性的效果。
为实现上述目的,本发明提供一种因果关系的识别方法,所述因果关系的识别方法包括以下步骤:
S10:获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
S20:基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
S30:根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
可选地,所述S20步骤之前,还包括:
对所述宽带传输数据进行基线校正处理;
在进行基线校正处理后的所述宽带传输数据满足单根检验要求时,执行所述S20步骤。
可选地,所述对所述宽带传输数据进行基线校正处理的步骤之后,还包括:
在进行基线校正处理后的所述宽带传输数据不满足所述单根检验要求时,对进行基线校正处理后的所述宽带传输数据进行一阶差分处理;
在对所述宽带传输数据进行一阶差分处理后,执行所述S20步骤。
可选地,所述S20步骤之前,还包括:
基于赤池信息准则或者贝叶斯信息准则确定所述自回归模型对应的目标阶数;
根据所述目标阶数对所述自回归模型进行线性拟合;
所述S20步骤包括:
基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差。
可选地,所述S20步骤之前,还包括:
对所述所述上传速率时间序列及所述下载速率时间序列进行一致性检验,以基于满足一致性检验要求的所述上传速率时间序列及所述下载速率时间序列执行所述S20步骤。
可选地,丢弃不满所述一致性检验要求的上传速率时间序列或者所述下载速率时间序列。
可选地,所述根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值的步骤包括:
根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的初始因果值;
对所述初始因果值进行邦费罗尼检验;
将满足预设邦费罗尼检验检验要求的所述初始因果值作为所述上传速率及下载速率之间的因果值。
此外,为实现上述目的,本发明还提供一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的因果关系的识别程序,所述因果关系的识别程序被所述处理器执行时实现如上所述的因果关系的识别方法的步骤。
此外,为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:
获取模块,用于获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
计算模块,用于基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
确定模块,用于根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有因果关系的识别程序,所述因果关系的识别程序被处理器执行时实现如上所述的因果关系的识别方法的步骤。
本发明实施例提出的一种因果关系的识别方法、终端设备及计算机可读存储介质,先获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列,然后基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差,进而根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。由于可以确定上传速率及下载速率之间的因果值,从而达成了提高宽带测速结果分析的全面性的效果。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明因果关系的识别方法一实施例的流程示意图;
图3为本发明实施例中一示例方案的流程示意图;
图4为本发明实施例中另一示例方案的流程示意图;
图5为本发明实施例中又一示例方案的流程示意图;
图6为本发明实施例涉及的服务器的模块化示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是服务器等终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1003,存储器1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。网络接口1003可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1004可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块以及因果关系的识别程序。
在图1所示的终端中,处理器1001可以用于调用存储器1004中存储的因果关系的识别程序,并执行以下操作:
S10:获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
S20:基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
S30:根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
进一步地,处理器1001可以调用存储器1004中存储的因果关系的识别程序,还执行以下操作:
对所述宽带传输数据进行基线校正处理;
在进行基线校正处理后的所述宽带传输数据满足单根检验要求时,执行所述S20步骤。
进一步地,处理器1001可以调用存储器1004中存储的因果关系的识别程序,还执行以下操作:
在进行基线校正处理后的所述宽带传输数据不满足所述单根检验要求时,对进行基线校正处理后的所述宽带传输数据进行一阶差分处理;
在对所述宽带传输数据进行一阶差分处理后,执行所述S20步骤。
进一步地,处理器1001可以调用存储器1004中存储的因果关系的识别程序,还执行以下操作:
基于赤池信息准则或者贝叶斯信息准则确定所述自回归模型对应的目标阶数;
根据所述目标阶数对所述自回归模型进行线性拟合;
所述S20步骤包括:
基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差。
进一步地,处理器1001可以调用存储器1004中存储的因果关系的识别程序,还执行以下操作:
对所述所述上传速率时间序列及所述下载速率时间序列进行一致性检验,以基于满足一致性检验要求的所述上传速率时间序列及所述下载速率时间序列执行所述S20步骤。
进一步地,处理器1001可以调用存储器1004中存储的因果关系的识别程序,还执行以下操作:
根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的初始因果值;
对所述初始因果值进行邦费罗尼检验;
将满足预设邦费罗尼检验检验要求的所述初始因果值作为所述上传速率及下载速率之间的因果值。
由于网络环境十分复杂,影响宽带上传和下载速率的因素很多,如实际的物理带宽、当前的网络环境、实际使用的应用软件等。而在计算机网络中,传输的资源需要收到资源的确认消息回复,才能决定后续的传输速率,并决定是否重新传输丢失的资源。而上行的带宽一部分就是用来传输这些确认信息的。因此当出现上行负载过大的时候,上传队列就会出现拥塞,确认数据无法发出,很明显会影响确认消息的传送速度,进而影响到下载速率。
但是,相关技术中,仅能分析确定带宽和应用软件等对宽带测速结果的影响,而无法确定上传速率和下载速率之间的因果关系。这样导致相关技术中的宽带测速结果分析存在分析不全面的缺陷。为解决相关技术存在的上述缺陷,达成提高宽带测速结果分析的全面性的效果,本发明实施例提出一种基于格兰杰因果关系(Granger Causality,GC)的因果关系的识别方法。
参照图2,在本发明因果关系的识别方法的一实施例中,所述因果关系的识别方法包括以下步骤:
步骤S10、获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
步骤S20、基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
步骤S30、根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
在计算机网络中进行下载时一般基于TCP(Transmission Control Protocol,传输控制协议)连接。因此而在下载期间,上行方向会产生大量的请求确认报文。也就是说,数据发送端向接收端发送资源时,发送端传输的资源需要接收到资源的确认消息回复,才能决定后续的传输速率,并决定是否重新传输丢失的资源。可见,在TCP传输过程中,上行的带宽一部分就是用来传输这些确认信息的。
当出现上行负载过大的时候,上传队列就会出现拥塞,确认数据无法发出,很明显会影响确认消息的传送速度,进而影响到下载速率。为了确定宽带传输过程中,上行速率(即上传速率)对下载速率的影响程度,可以确定两者之间的因果值。
在本实施例中,可以先利用一时间序列X(t)的过去数据来预测其自身的将来数据(通过过去下载速率预测来下载速率),此时可以将产生自的预测误差记为ε1(构成自回归过程),构成自回归过程。然后可以引入对应的另一个时间序列Y(t),进而联合X(t)和Y(t)对应的过去数据,预测时间序列X(t)的将来数据,并记录产生的联合预测误差ε2,即联合回归过程。进而,基于自预测误差ε1和联合预测误差ε2确定Y(t)对X(t)的影响程度(通过因果值量化描述)。其中,X(t)和Y(t)可以为下载速率和上传数量对应的时间序列,使得确定的结果即为上传速率对下载数量的影响程度。
需要说明的是,当需要确定下载速率对上传速率的影响程度时,也可以将X(t)和Y(t)分别设置为上传速率和下载速率对应的时间序列。以确定下载速率对上传速率的影响程度。
示例性地,在一实施方案中可以先获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列。
可选地,测速服务系统可以分时段,分别在忙时、闲时及全天对宽带上传速率和下载速率进采集,然后将其整合成.mat的数据后,导入MATLAB中。从而基于MATLAB获取上传速率时间序列及下载速率时间序列。当上传速率时间序列及下载速率时间序列后,可以基于自回归模型确定所述上传速率时间序列或者所述下载速率时间序列对应的自预测误差。
作为一种可选实施方案,当获取到上传速率时间序列及下载速率时间序列后,可以基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差,进而根据所述根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。可以理解的是,在本实施方案中,所述因果值表征下载速率对上传速率的影响程度。
作为另一种可选实施方案,获取到上传速率时间序列及下载速率时间序列后,可以基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差,然后根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。可以理解的是,在本实施方案中,所述因果值表征上传速率对下载速率的影响程度。
需要说明的是,于自回归模型(Auto regressive model,AR)而言,若采集的下载速率时间序列或者上传速率时间序列为Xt(t=1,2,3…,N)时,其中N表示测速时序是速率的总点数,m阶自回归模型可以记作AR(m)。其表示序列Xt是由前m个信号的误差项和线性组合构成的函数,即:
Figure BDA0003117972590000081
其中,,εt为误差项即均值为0的白噪声,aj表示AR模型系数。
另外,实现AR模型时首先应该确定模型的系数。一般在确定模型系数时,可以使用最小二乘法(又称最小平方法)来对模型系数进行求解。
下面将式(1)用矩阵的形式进行表示,如下所示:
Figure BDA0003117972590000091
在式(2)有:
Figure BDA0003117972590000092
其中,
Figure BDA0003117972590000093
为X的求逆矩阵,A为模型需要求解的所有系数的集合。
可选地,由于矩阵X有可能不可逆,所以求系数矩阵A如式(3):
Figure BDA0003117972590000094
其中,
Figure BDA0003117972590000095
是对称正矩阵且可逆。因此存在可逆矩阵
Figure BDA0003117972590000096
并得到如下(4)系数矩阵A。
Figure BDA0003117972590000097
因此基于式(1)可以得到AR模型的误差项εt,如式(5)所示:
Figure BDA0003117972590000098
基于上述自回归模型,当确定所述上传速率时间序列或者所述下载速率时间序列之后,可以基于上述公式确定上传速率时间序列或者所述下载速率时间序列对应的自预测误差。
另外,当时序数据序列不止一个时,即包括上传速率时间序列及下载速率时间序列时,可以使用联合回归模型对上传速率或者下载速率进行预测。以下通过具体示例说明联合回归模型的预存逻辑。
设存在下载速率时间序列X1,t(t=0,1,2,…,N),以及上传速率时间序列X2,t(t=0,1,2,…,N),且最优滞后阶数为m,则联合回归模型,如(6)所示:
Figure BDA0003117972590000099
其中,a为构建的模型系数,η1,t和η2,t分别表示X1,t和X2,t的线性拟合时产生的误差项,且同样可以使用最小二乘方法求模型系数。
假设有n个时间序列Xi(i=1,2,...,n),它们的联合回归模型如(7)式:
Figure BDA0003117972590000101
式中,t=1,2,...,N,aij(i,j=1,2,...,n)是联合回归模型系数,误差项为ηi(i=1,2,...,n),误差的方差为
Figure BDA0003117972590000102
由(7)式可知,对Xk,t的贡献项包括:
Figure BDA0003117972590000103
和η1,t,以两个变量为例,在第一个等式中的这些贡献项中,每个贡献项对X1都起着重要的作用,所以每一项都不能忽略。若
Figure BDA0003117972590000104
占所有贡献项的比例较大,那么时间序列X2对X1有较强的因果影响,反之亦然。因此,时间序列X2在这些贡献项中所占的比例可以描述从时间序列X2,t到X1,t的因果关系,基于这个原则,从X2到X1的新型因果关系被定义为:
Figure BDA0003117972590000105
基于式(8,)当N足够大时,
Figure BDA0003117972590000106
经过(9)式的估计可以将(8)式化简为(10)式:
Figure BDA0003117972590000107
同理,可以得出从X1到X2的新型因果关系被定义为(11)式:
Figure BDA0003117972590000108
可选地,参照图3,作为一种实施方案,所述步骤S20之前,还包括:
步骤S40、对所述宽带传输数据进行基线校正处理。
基于GC计算上下行家庭宽带速率的因果值之前,要求处理的上下行速率值必须满足平稳性要求,而获取的上下行速率数据很可能是非平稳序列,而对于非平稳速率序列会在因果回归分析中出现伪回归现象。因此,可以先对获取到的上传速率时间序列及下载速率时间序列进行基线矫正(即去趋势去均值)。进而基于基线矫正后的上传速率时间序列及下载速率时间序列执行步骤S20。
可选地,在一实施方式中,在对上传速率时间序列及下载速率时间序列进行基线矫正后,还可以对其进行单根检测,其中单根检测是验证一个基于时间速率序列中是否存在单位根,若存在单根则该速率序列不平稳,反之为平稳数据序列。在本实施方式中,可以基于增强型迪基福勒(Augmented Dickey-Fuller,ADF)检验或科夫斯基·菲利普斯·施密特·申(Kowski-Phillips-Schmidt-Shin,KPSS)检验进行单根检测。以验证经过基线校正后的上传速率时间序列及下载速率时间序列是否已经达到平稳状态。如果是,则基于基线校正后的上传速率时间序列及下载速率时间序列执行步骤S20。否则对进行基线校正处理后的所述宽带传输数据进行一阶差分处理,来尽量保证数据达到平稳性要求。进而在对所述宽带传输数据进行一阶差分处理后,再执行所述S20步骤。
可选地,参照图4,所述步骤S20之前,还包括:
步骤S50、基于赤池信息准则或者贝叶斯信息准则确定所述自回归模型对应的目标阶数,并根据所述目标阶数对所述自回归模型进行线性拟合。
示例性地,可以利用赤池信息准则(Akaike Information Criterion,AIC)或贝叶斯信息准则(Bayesian Information Criterion,BIC)对多变量AR模型求滞后阶数,从而确保选择最佳阶数对模型进行线性拟合。以避免因滞后阶数选择的过大而带来的计算复杂度增加,或滞后阶数过小可能会导致信息损失过大。
示例1,AIC的计算如下式(12)所示:
Figure BDA0003117972590000111
其中,N表示时间序列的数据总点数,取AIC达到最小的m值作为最终的滞后阶数。当数据量达到非常大时,对于一定范围内的m值并不能使AIC方程达到最小值,此时可以参考BIC,其计算如式(13)所示:
Figure BDA0003117972590000121
进一步地,在本实施方式中,还可以在执行步骤S20之前,对对所述所述上传速率时间序列及所述下载速率时间序列进行一致性检验,以基于满足一致性检验要求的所述上传速率时间序列及所述下载速率时间序列执行所述S20步骤。
示例性地,可以利用Durbin-Watson(德宾—瓦特逊)测试即一种统计学方法,来检测原数据和近似模拟值之间的残差是否服从正态分布。由于在运用GC方法进行回归系数估计时,需要用到最小二乘法对模型系数进行求解,而使用最小二乘法之前需要假定模型的残差符合正态分布,若不成正态分布,则估计的模型和实际信号之间可能会出现较大的差异,即模型的解释能力将会变得很弱。因此可以选择保留通过一致性检验的数据,丢弃不满所述一致性检验要求的上传速率时间序列或者所述下载速率时间序列。来确保下一步GC的计算获取到的是有效值。
进一步地,以下通过示例进一步解释基于联合回归模型,并混合GC和因果关系的计算方法获取上传速率对下载速率的因果影响,和获取下载速率对上传速率的因果值的具体过程。
GC是基于上述两种线性回归模型构建的,假设经处理后的上传速率时间序列Xt和下载速率时间序列Yt(以下将Xt和Yt分别描述为且X1,t和X2,t)满足联合平稳的条件,则其AR模型如下:
Figure BDA0003117972590000122
Figure BDA0003117972590000123
其中,∑1和∑2分别用于表示自预测误差ε1和ε2的方差,且X1,t和X2,t的预测误差仅仅与其本身的过去速率值有关。
上述两个时间速率序列的联合回归模型如下:
Figure BDA0003117972590000124
Figure BDA0003117972590000131
Figure BDA0003117972590000132
其中,Γ1和Γ2分别作为误差项η1t和η2t的方差,且相互之间存在时间上的独立性,并将其同期协方差构成的矩阵定义如下:
Figure BDA0003117972590000133
其中,协方差τ2=cov(ε2t2t),若时序信号X1,t和X21,j满足各自独立性,则系数集合{a12,j}和{a21,j}的值均为0,且Σ1=Γ1,Σ2=Γ2,τ2=Γ2,基于式(14)可以确定在自回归模型中,方差∑1由X1,t本身的过去时刻来预测自身将来时刻时产生的误差ε1决定,而基于表达式(16)可以确定方差Γ1的值不仅与X1,t的过去时刻有关还和X2,t的过去时间速率数据序列有关。因此,基于统计学,若Γ1<∑1,则说明在预测X1,t时加入X2,t的历史数据后,预测的精确度变高,则表明X2,t对X1,t有因果影响。同理如果Γ1=∑1,则表明X2,t对X1,t没有因果影响。
下面给出时间速率序列间的GC计算公式:
Figure BDA0003117972590000134
基于以上理论可知,当
Figure BDA0003117972590000135
时,则说明X2,t到X1,t存在因果影响,若
Figure BDA0003117972590000136
则说明X2,t到X1,t没有因果影响。同理X1,t对X2,t的因果值定义如下:
Figure BDA0003117972590000137
Figure BDA0003117972590000138
则表明X1,t到X2,t存在因果影响,若
Figure BDA0003117972590000139
则表明X1,t到X2,t不存在因果影响。
可选地,参照图5,在本实施例中,所述步骤S30可以包括以下步骤:
步骤S31、根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的初始因果值;
步骤S32、对所述初始因果值进行邦费罗尼检验;
步骤S33、将满足预设邦费罗尼检验检验要求的所述初始因果值作为所述上传速率及下载速率之间的因果值。
需要说明的是,可以对得到的GC值进行邦费罗尼(Bonferroni)检验,即一种显著性检方法。在显著性阈值小于0.05或0.01的条件下,选出通过Bonferroni检验的GC值作为最终的有效因果值,否则判定为无效因果值。
在本实施例公开的技术方案中,先获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列,然后基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差,进而根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。由于可以确定上传速率及下载速率之间的因果值,从而达成了提高宽带测速结果分析的全面性的效果。
此外,本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的因果关系的识别程序,所述因果关系的识别程序被所述处理器执行时实现如上各个实施例所述的因果关系的识别方法的步骤。
此外,本发明实施例还提出一种终端设备100,所述终端设备100包括
获取模块101,用于获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
计算模块102,用于基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
确定模块103,用于根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有因果关系的识别程序,所述因果关系的识别程序被处理器执行时实现如上各个实施例所述的因果关系的识别方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是服务器等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种因果关系的识别方法,其特征在于,所述因果关系的识别方法包括:
S10:获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
S20:基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
S30:根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
2.如权利要求1所述的因果关系的识别方法,其特征在于,所述S20步骤之前,还包括:
对所述宽带传输数据进行基线校正处理;
在进行基线校正处理后的所述宽带传输数据满足单根检验要求时,执行所述S20步骤。
3.如权利要求2所述的因果关系的识别方法,其特征在于,所述对所述宽带传输数据进行基线校正处理的步骤之后,还包括:
在进行基线校正处理后的所述宽带传输数据不满足所述单根检验要求时,对进行基线校正处理后的所述宽带传输数据进行一阶差分处理;
在对所述宽带传输数据进行一阶差分处理后,执行所述S20步骤。
4.如权利要求1所述的因果关系的识别方法,其特征在于,所述S20步骤之前,还包括:
基于赤池信息准则或者贝叶斯信息准则确定所述自回归模型对应的目标阶数;
根据所述目标阶数对所述自回归模型进行线性拟合;
所述S20步骤包括:
基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于根据所述目标阶数进行线性拟合的所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差。
5.如权利要求4所述的因果关系的识别方法,其特征在于,所述S20步骤之前,还包括:
对所述所述上传速率时间序列及所述下载速率时间序列进行一致性检验,以基于满足一致性检验要求的所述上传速率时间序列及所述下载速率时间序列执行所述S20步骤。
6.如权利要求5所述的因果关系的识别方法,其特征在于,丢弃不满所述一致性检验要求的上传速率时间序列或者所述下载速率时间序列。
7.如权利要求1所述的因果关系的识别方法,其特征在于,所述根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值的步骤包括:
根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的初始因果值;
对所述初始因果值进行邦费罗尼检验;
将满足预设邦费罗尼检验检验要求的所述初始因果值作为所述上传速率及下载速率之间的因果值。
8.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的因果关系的识别程序,所述因果关系的识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的因果关系的识别方法的步骤。
9.一种终端设备,其特征在于,所述终端设备包括:
获取模块,用于获取宽带传输数据,其中,所述宽带传输数据包括上传速率时间序列及下载速率时间序列;
计算模块,用于基于自回归模型确定所述上传速率时间序对应的自预测误差,并基于联合回归模型及所述下载速率时间序列确定所述上传速率时间序对应的联合预测误差;或者基于所述自回归模型确定所述下载速率时间序对应的所述自预测误差,并基于所述联合回归模型及所述上传速率时间序列确定所述下载速率时间序对应的所述联合预测误差;
确定模块,用于根据所述自预测误差及所述联合预测误差确定上传速率及下载速率之间的因果值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有因果关系的识别程序,所述因果关系的识别程序被处理器执行时实现如权利要求1至7中任一项所述的因果关系的识别方法的步骤。
CN202110670524.1A 2021-06-16 2021-06-16 因果关系的识别方法、终端设备及存储介质 Active CN113300897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110670524.1A CN113300897B (zh) 2021-06-16 2021-06-16 因果关系的识别方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110670524.1A CN113300897B (zh) 2021-06-16 2021-06-16 因果关系的识别方法、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN113300897A true CN113300897A (zh) 2021-08-24
CN113300897B CN113300897B (zh) 2022-10-18

Family

ID=77328661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110670524.1A Active CN113300897B (zh) 2021-06-16 2021-06-16 因果关系的识别方法、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN113300897B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017199362A (ja) * 2016-04-29 2017-11-02 富士通株式会社 非定常時系列データの予測に用いる方法及び装置
CN108684051A (zh) * 2018-05-11 2018-10-19 广东南方通信建设有限公司 一种基于因果诊断的无线网络性能优化方法、电子设备及存储介质
CN108959188A (zh) * 2018-05-03 2018-12-07 西安交通大学 基于量化最小误差熵准则的格兰杰因果判辨方法
CN109993281A (zh) * 2019-03-28 2019-07-09 北京工业大学 一种基于深度学习的因果关系挖掘方法
CN110059294A (zh) * 2019-03-28 2019-07-26 西安交通大学 基于核递归最大互相关熵算法的非线性格兰杰因果性检测方法
CN110365708A (zh) * 2019-08-05 2019-10-22 山东浪潮人工智能研究院有限公司 一种基于向量自回归模型的交换机数据异常检测方法
CN111147327A (zh) * 2019-12-23 2020-05-12 中国联合网络通信集团有限公司 网络质量的评估方法及装置
WO2021001958A1 (ja) * 2019-07-03 2021-01-07 日本電信電話株式会社 サービス品質制御装置、サービス品質制御方法、及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017199362A (ja) * 2016-04-29 2017-11-02 富士通株式会社 非定常時系列データの予測に用いる方法及び装置
CN108959188A (zh) * 2018-05-03 2018-12-07 西安交通大学 基于量化最小误差熵准则的格兰杰因果判辨方法
CN108684051A (zh) * 2018-05-11 2018-10-19 广东南方通信建设有限公司 一种基于因果诊断的无线网络性能优化方法、电子设备及存储介质
CN109993281A (zh) * 2019-03-28 2019-07-09 北京工业大学 一种基于深度学习的因果关系挖掘方法
CN110059294A (zh) * 2019-03-28 2019-07-26 西安交通大学 基于核递归最大互相关熵算法的非线性格兰杰因果性检测方法
WO2021001958A1 (ja) * 2019-07-03 2021-01-07 日本電信電話株式会社 サービス品質制御装置、サービス品質制御方法、及びプログラム
CN110365708A (zh) * 2019-08-05 2019-10-22 山东浪潮人工智能研究院有限公司 一种基于向量自回归模型的交换机数据异常检测方法
CN111147327A (zh) * 2019-12-23 2020-05-12 中国联合网络通信集团有限公司 网络质量的评估方法及装置

Also Published As

Publication number Publication date
CN113300897B (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
US20200310898A1 (en) Information processing method and information processing apparatus
CN112148557B (zh) 一种性能指标实时预测方法、计算机设备及存储介质
JP2008269215A (ja) 特異パターン検出システム、モデル学習装置、特異パターン検出方法、及び、コンピュータプログラム
WO2013147226A1 (ja) 利用者体感品質推定装置、端末ボトルネック判定装置、類似操作抽出装置、及び方法、並びにプログラム
GB2528792A (en) Detection device, detection method, and recording medium
CN110851333B (zh) 根分区的监控方法、装置和监控服务器
CN113300897B (zh) 因果关系的识别方法、终端设备及存储介质
Gago-Benítez et al. Log-logistic modeling of sensory flow delays in networked telerobots
US11392437B1 (en) Cold start and adaptive server monitor
US11206274B2 (en) Method and apparatus for calibrating a system for recognizing attempts to penetrate a computer network
US10165037B2 (en) Method and apparatus for determining bandwidth required for a page feature
CN108521435B (zh) 一种用户网络行为画像的方法及系统
US20170255707A1 (en) Method and apparatus for determining bandwidth required for a page feature
Bektemyssova et al. Time series forecasting by the arima method
CN108900865B (zh) 服务器、转码任务的调度方法及执行方法
CN108881275B (zh) 一种用户访问合规性分析的方法及系统
US10782656B2 (en) Method and device for influencing a vehicle behavior
CN109660423A (zh) 应用系统负载预测方法、可读存储介质和终端
CN112423032B (zh) 基于智能电视的数据监控方法、装置、电子设备及介质
JP2008165412A (ja) 性能演算装置
CN115016444A (zh) 一种车辆远程诊断方法及相关组件
CN111130933B (zh) 页面流量的预估方法、装置及计算机可读存储介质
CN114938339A (zh) 一种数据处理方法和相关装置
CN114629583A (zh) 估计车辆的不同控制器之间的通信响应时间的装置和方法
CN113204411A (zh) 一种数据处理方法、中间处理设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant