CN114092269A - 基于改进广义网络向量模型的时序数据预测方法及装置 - Google Patents

基于改进广义网络向量模型的时序数据预测方法及装置 Download PDF

Info

Publication number
CN114092269A
CN114092269A CN202210061307.7A CN202210061307A CN114092269A CN 114092269 A CN114092269 A CN 114092269A CN 202210061307 A CN202210061307 A CN 202210061307A CN 114092269 A CN114092269 A CN 114092269A
Authority
CN
China
Prior art keywords
network vector
generalized network
model
time sequence
sequence data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210061307.7A
Other languages
English (en)
Inventor
蓝科
吕宗明
张国兵
颜怀柏
马华均
印龙兵
刘智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sefon Software Co Ltd
Original Assignee
Chengdu Sefon Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sefon Software Co Ltd filed Critical Chengdu Sefon Software Co Ltd
Priority to CN202210061307.7A priority Critical patent/CN114092269A/zh
Publication of CN114092269A publication Critical patent/CN114092269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于改进广义网络向量模型的时序数据预测方法及装置,主要解决现有技术中存在的现有对离散型因变量分析预测的广义网络向量自回归模型研究大型社交网络时,样本的接受率很低,马尔科夫链会出现大量停滞的问题。该发明输入带有网络结构的时序数据,建立离散型因变量和状态变量之间的连接函数,然后通过状态变量构建广义网络向量自回归模型,然后通过标准马尔科夫链蒙特卡洛算法的MH算法得到多条马尔科夫链,然后通过花朵授粉算法得出最优的1条马尔科夫链,进而得到改进的广义网络向量模型,对带网络结构的时序数据进行预测;本发明可以有效提高新样本的接受率,同时降低修正参数的相对误差。

Description

基于改进广义网络向量模型的时序数据预测方法及装置
技术领域
本发明涉及具有网络结构的时间序列数据分析预测技术领域,具体地说,是涉及一种基于改进广义网络向量模型的时序数据预测方法及装置。
背景技术
网络数据中节点间具有网络关系,从每个节点收集的变量可能会随时间发生变化,实际应用中经常需要对这些具有网络结构的时间序列数据进行分析预测;社交网络数据就是一种典型的具有网络结构的时序数据,社交网络数据的统计分析在各个领域中都有广泛的应用,比如在人口学中研究移民特点,在组织管理方面研究同伴效应;特别是随着互联网技术的高速发展,社交网络数据越来越丰富,挖掘网络中用户的特点,预测其行为特征,对企业和社会都极具价值。
现有专门用于研究动态社交行为的网络向量自回归模型,但其研究的都是连续型因变量;而在对网络时序数据的实际研究中,经常面临因变量是离散的情况,比如在分析社交网络中的用户活跃度时,网络平台上的发帖数是计数变量,用户的决策行为常被记录为0-1变量;对于离散型因变量的情况常采用基于标准的马尔科夫链蒙特卡洛算法的广义网络向量自回归模型来分析预测,然而当我们研究大型社交网络时,节点数目很多,从每个节点获取的信息通常是高维向量,对这样的数据建立广义网络向量自回归模型,待估参数维度很高,后验分布复杂;在这种情况下,用标准的马尔科夫链蒙特卡洛算法采样,样本的接受率很低,马尔科夫链会出现大量停滞的阶段。
发明内容
本发明的目的在于提供一种基于改进广义网络向量模型的时序数据预测方法及装置,以解决现有对离散型因变量分析预测的广义网络向量自回归模型研究大型社交网络时,样本的接受率很低,马尔科夫链会出现大量停滞的问题。
为了解决上述问题,本发明提供如下技术方案:
一种基于改进广义网络向量模型的时序数据预测方法包括以下步骤:
S1、输入带有网络结构的时序数据,确定其中的离散型因变量,然后确定因变量与 状态变量
Figure 413983DEST_PATH_IMAGE001
的连接函数;
S2、用步骤S1的状态变量
Figure 144172DEST_PATH_IMAGE001
代替因变量构建广义网络向量自回归模型;
S3、计算状态变量
Figure 986226DEST_PATH_IMAGE001
和参数
Figure 18704DEST_PATH_IMAGE002
的完全条件分布;
S4、选取m个不同的初始值初始化步骤S3的状态变量
Figure 895393DEST_PATH_IMAGE001
和参数
Figure 530905DEST_PATH_IMAGE003
,用MH算法迭 代n次生成m条马尔科夫链;
S5、在步骤S4的m条马尔科夫链中采用花朵授粉算法得出最优的1条马尔科夫链;
S6、通过步骤S5的最优的1条马尔科夫链,计算各个参数的后验均值,标准差,置信区间的估计结果得到改进的广义网络向量模型;
S7、通过步骤S6的改进的广义网络向量模型,对带有网络结构的时序数据进行统计分析和预测。
上述方案中输入带有网络结构的时序数据,建立离散型因变量和状态变量之间的连接函数,然后通过状态变量构建广义网络向量自回归模型,然后通过标准马尔科夫链蒙特卡洛算法(MCMC)的MH算法得到多条马尔科夫链,然后通过花朵授粉算法(FPA)得出最优的1条马尔科夫链,进而得到改进的广义网络向量模型,对带网络结构的时序数据进行预测;本发明引入花朵授粉算法(Flower Pollination Algorithm,FPA)与标准马尔科夫链蒙特卡洛算法(Metropolis Hastings-within-Gibbs MCMC)算法融合的优化算法采样,可以有效提高新样本的接受率,同时降低修正参数的相对误差,解决了网络向量自回归模型中的待估参数维度很高,后验分布复杂的问题。
进一步的,步骤S1的具体过程为:确定网络时序数据中的节点数N,邻接矩阵
Figure 860255DEST_PATH_IMAGE004
和在时间 t 搜集到的离散型因变量
Figure 872204DEST_PATH_IMAGE005
,设定因变量
Figure 603400DEST_PATH_IMAGE006
由一个连续的状态变量
Figure 409813DEST_PATH_IMAGE001
决定;
若因变量
Figure 226459DEST_PATH_IMAGE006
是0-1型变量,则其条件概率可为:
Figure 776520DEST_PATH_IMAGE007
Figure 362223DEST_PATH_IMAGE007
若因变量
Figure 792067DEST_PATH_IMAGE006
是计数变量,考虑其条件分布为泊松分布:
Figure 846742DEST_PATH_IMAGE008
其中,
Figure 184182DEST_PATH_IMAGE009
进一步的,步步骤S2得到的广义网络向量自回归模型为:
Figure 640702DEST_PATH_IMAGE010
其中,
Figure 38186DEST_PATH_IMAGE011
表示节点i的出度,
Figure 767107DEST_PATH_IMAGE012
是对应于节点i 的p维自变量其不随时间变化,噪声项
Figure 658971DEST_PATH_IMAGE013
,参数
Figure 219265DEST_PATH_IMAGE014
是基准效应,
Figure 803962DEST_PATH_IMAGE015
代表 网络效应,
Figure 816917DEST_PATH_IMAGE016
代表自回归效应,
Figure 699422DEST_PATH_IMAGE017
刻画了不随时间变动的变量产生的影响。
进一步的,广义网络向量自回归模型的向量形式为:
Figure 661693DEST_PATH_IMAGE018
,其中,
Figure 869821DEST_PATH_IMAGE019
是对
Figure 120805DEST_PATH_IMAGE020
行标准化后的邻接矩 阵,
Figure 541422DEST_PATH_IMAGE021
Figure 76308DEST_PATH_IMAGE022
进一步的,步骤S3中参数
Figure 2807DEST_PATH_IMAGE023
进一步的,步骤S5的具体过程为:
S501、以对数似然函数作为目标函数,求解步骤S4中m条马尔科夫链在每次迭代样本中的最优解;
S502、根据步骤S501的最优解通过花朵授粉算法判断转换概率p>0.8是否成立,是则进行全局寻优产生候选点,否则进行局部寻优产生候选点;
S503、根据MH算法计算接受率更新
Figure 990355DEST_PATH_IMAGE024
在t+1次迭代的样本值,判 断广义网络向量自回归模型是否收敛,是则产生1条马尔科夫链,否则重复执行步骤S501至 步骤S503。
一种基于改进广义网络向量模型的时序数据预测装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现基于改进广义网络向量模型的时序数据预测方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明支持具有大型网络结构的时序数据建模;针对具有网络结构的时序数据,通过引入广义网络向量自回归模型,同时拟合数据的网络结构和动态变化,针对随时间变化的离散型因变量、高维自变量以及大型的网络结构,本模型方法都有很强的适用性。
(2)本发明结合花朵授粉算法(FPA)和标准马尔科夫链蒙特卡洛算法(MCMC)的广义网络向量模型,即FPA-MCMC算法估计模型,从m条马尔科夫链中寻出最优的一条,提高寻优效率,提高样本接受率和样本多样性;针对该网络向量模型中参数维度大,后验分布复杂,使用MH算法采样的样本接受率低,采样可能出现大量停滞阶段等问题,在参数估计阶段引入基于花朵授粉算法与MCMC算法融合的优化算法采样,利用花朵授粉算法FPA全局寻优和局部寻优的特性,提高寻优效率,通过FPA-MCMC算法抽样提高了采样接受率,同时增加了样本多样性,且保证样本收敛在合适的范围。
(3)本发明中模型方法有很好的解释性,可用于网络时序数据的统计分析和预测;本方法建立的网络向量模型同时考虑了邻接节点的影响,自身滞后期的影响以及不随时间改变的属性变量的影响,便于阐释网络中包含的信息,如个体间的影响和目标变量的动态变化,此模型方法适用于对信息丰富的社交网络数据进行分析和预测。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明的流程架构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
实施例1
如图1所示,一种基于改进广义网络向量模型的时序数据预测方法是针对具有网络结构的时间序列数据的分析和预测,在网络节点数目很大,信息维度很高的背景下,提供了一种结合花朵授粉算法和马尔科夫链蒙特卡洛算法的广义网络向量自回归方法;该方法包括以下步骤:
1. 数据预处理
S1:输入带有网络结构的时序数据,确定网络中的节点数N,邻接矩阵
Figure 27712DEST_PATH_IMAGE025
和在时间t搜集到的离散型目标变量
Figure 151526DEST_PATH_IMAGE026
;假设因变 量
Figure 248926DEST_PATH_IMAGE027
由一个连续的状态变量
Figure 661453DEST_PATH_IMAGE028
决定,根据
Figure 751768DEST_PATH_IMAGE027
的取值特点,假定
Figure 746400DEST_PATH_IMAGE027
Figure 998390DEST_PATH_IMAGE028
之间的连接函数. 若
Figure 898213DEST_PATH_IMAGE027
是0-1型变量,则其条件概率可为:
Figure 277373DEST_PATH_IMAGE029
Figure 641358DEST_PATH_IMAGE030
是计数变量,考虑其条件分布为泊松分布:
Figure 803263DEST_PATH_IMAGE031
其中,
Figure 252699DEST_PATH_IMAGE032
。此外,还可以考虑别的合适的连接函数,比如负二项分布等。
构建广义网络向量模型
S2:用状态变量
Figure 622500DEST_PATH_IMAGE033
代替
Figure 326145DEST_PATH_IMAGE030
建立广义网络向量自回归模型,
Figure 185517DEST_PATH_IMAGE034
其中,
Figure 607402DEST_PATH_IMAGE035
表示节点i的出度,
Figure 843211DEST_PATH_IMAGE036
是对应于节点i的p 维自变量,这部分变量不随时间变化,噪声项
Figure 853893DEST_PATH_IMAGE037
,参数
Figure 634898DEST_PATH_IMAGE038
是基准效应,
Figure 793347DEST_PATH_IMAGE039
代表网络效应,
Figure 318000DEST_PATH_IMAGE040
代表自回归效应,
Figure 245505DEST_PATH_IMAGE041
刻画了不随时间变动的变量产生的影 响;得到其向量形式:
Figure 384362DEST_PATH_IMAGE042
其中,
Figure 780840DEST_PATH_IMAGE043
是对
Figure 92872DEST_PATH_IMAGE044
行标准化后的邻接矩阵,
Figure 891195DEST_PATH_IMAGE045
Figure 263270DEST_PATH_IMAGE046
基于FPA-MCMC算法的参数估计
接下来S3-S5,估计参数
Figure 333995DEST_PATH_IMAGE047
,并对潜在状态
Figure 200451DEST_PATH_IMAGE048
进行推断。
S3:计算每个状态变量和每个参数的完全条件分布,步骤如下:
(1)
Figure 102548DEST_PATH_IMAGE033
的完全条件分布
Figure 396257DEST_PATH_IMAGE049
:
Figure 751015DEST_PATH_IMAGE051
其中,
Figure 608112DEST_PATH_IMAGE052
Figure 115448DEST_PATH_IMAGE053
Figure 829326DEST_PATH_IMAGE054
Figure 687692DEST_PATH_IMAGE055
(2)
Figure 145218DEST_PATH_IMAGE056
的完全条件分布
Figure 694011DEST_PATH_IMAGE057
(假设
Figure 595102DEST_PATH_IMAGE056
的先验分布为
Figure 924452DEST_PATH_IMAGE058
):
Figure 936402DEST_PATH_IMAGE059
其中,
Figure 402018DEST_PATH_IMAGE060
Figure 660961DEST_PATH_IMAGE061
,则
Figure 228340DEST_PATH_IMAGE056
的完全 条件分布是正态分布
Figure 27669DEST_PATH_IMAGE062
,其中
Figure 364103DEST_PATH_IMAGE063
Figure 856264DEST_PATH_IMAGE064
(3)
Figure 832311DEST_PATH_IMAGE065
的完全条件分布
Figure 186063DEST_PATH_IMAGE066
(假设
Figure 891851DEST_PATH_IMAGE065
的先验分布为
Figure 51785DEST_PATH_IMAGE067
):
Figure 843024DEST_PATH_IMAGE068
Figure 921838DEST_PATH_IMAGE065
的完全条件分布是带尺度的逆
Figure 232865DEST_PATH_IMAGE069
分布,即
Figure 801249DEST_PATH_IMAGE070
,其中
Figure 830516DEST_PATH_IMAGE071
S4:对于状态变量
Figure 775339DEST_PATH_IMAGE072
和参数
Figure 127823DEST_PATH_IMAGE073
,选取m个不同的初始值, 用Metropolis Hastings-within-Gibbs MCMC抽样算法(后文称MH算法)迭代n次,产生m条 马尔科夫链。每次迭代的具体步骤如下:
(1)使用Metropolis Hastings-within-Gibbs MCMC抽样算法,根据后验分布
Figure 883420DEST_PATH_IMAGE049
和正态分布作为提议分布更新
Figure 383672DEST_PATH_IMAGE072
(2)从完全条件分布
Figure 617338DEST_PATH_IMAGE062
中抽样更新参数
Figure 152224DEST_PATH_IMAGE056
(3)从完全条件分布
Figure 95DEST_PATH_IMAGE070
中抽样更新参数
Figure 738375DEST_PATH_IMAGE065
S5:在m条马尔科夫链中采用花朵授粉算法(FPA)再次寻优更新候选值
Figure 25000DEST_PATH_IMAGE074
和参数
Figure 165125DEST_PATH_IMAGE073
,经过n次迭代生成l条马尔科夫链。具体步骤如下:
(1)以对数似然函数
Figure 511793DEST_PATH_IMAGE075
作为目标函数,求解S4中m条马 尔科夫链在每次迭代样本中的最优解
Figure 924320DEST_PATH_IMAGE076
(2)在S4中所述MH算法的基础上,每次迭代计算接受率之前,通过FPA寻优迭代产 生候选点
Figure 499789DEST_PATH_IMAGE077
(a)当转换概率
Figure 743688DEST_PATH_IMAGE078
时,进行全局寻优计算产生候选点:
Figure 11989DEST_PATH_IMAGE079
其中
Figure 974129DEST_PATH_IMAGE080
表示第i条马尔科夫链第
Figure 540240DEST_PATH_IMAGE081
次的迭代样本,
Figure 389378DEST_PATH_IMAGE082
是当前生成的所有样本中 的最佳样本点,L为授粉强度,这里即为迭代步长,从levy分布中提取
Figure 77849DEST_PATH_IMAGE083
Figure 278017DEST_PATH_IMAGE084
其中p是(0,1)上的随机数,
Figure 444556DEST_PATH_IMAGE085
,
Figure 600731DEST_PATH_IMAGE086
是标准的Gamma函数,取
Figure 210835DEST_PATH_IMAGE087
时,
Figure 881988DEST_PATH_IMAGE088
Figure 868529DEST_PATH_IMAGE089
Figure 941528DEST_PATH_IMAGE090
(b)当转换概率
Figure 909484DEST_PATH_IMAGE091
时,进行局部寻优产生候选点:
Figure 818665DEST_PATH_IMAGE092
其中
Figure 327007DEST_PATH_IMAGE093
是[0,1]上的随机数,
Figure 270823DEST_PATH_IMAGE094
是S4中第t次迭代样本的第j、k条马尔科夫 链的值。
(3)在确定候选
Figure 471997DEST_PATH_IMAGE095
后,根据接受概率分别更新
Figure 55425DEST_PATH_IMAGE096
Figure 118190DEST_PATH_IMAGE097
次迭代的样本值,后续步骤同MH算法,直至收敛,得到l条平稳的马尔科夫链。
估计模型,分析预测
S6:计算各个参数的后验均值,标准差,置信区间等估计结果,得到最终的广义网络向量模型;此过程为成熟的现有技术再次不做累述。
S7:基于S6中得到的模型,对该网络时序数据进行统计分析和预测。
实施例2
一种基于改进广义网络向量模型的时序数据预测装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现基于改进广义网络向量模型的时序数据预测方法。
本发明针对具有网络结构的时间序列数据,提出的一种结合花朵授粉算法(FPA)和标准马尔科夫链蒙特卡洛算法(MCMC)的广义网络向量模型,该模型方法可广泛应用于研究网络结构中的动态离散型数据,对于社交网络等数据的分析和预测颇具意义。
本发明通过花朵授粉算法对MCMC抽样的样本进行再次寻优,加快收敛速度,有效提高新样本接受率,同时降低修正参数的相对误差,增加样本多样性,有效解决了网络向量模型中高维参数的估计问题。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种基于改进广义网络向量模型的时序数据预测方法,其特征在于,包括以下步骤:
S1、输入带有网络结构的时序数据,确定其中的离散型因变量,然后确定因变量与状态 变量
Figure 968336DEST_PATH_IMAGE001
的连接函数;
S2、用步骤S1的状态变量
Figure 383136DEST_PATH_IMAGE001
代替因变量构建广义网络向量自回归模型;
S3、计算状态变量
Figure 873155DEST_PATH_IMAGE001
和参数
Figure 638985DEST_PATH_IMAGE002
的完全条件分布;
S4、选取m个不同的初始值初始化步骤S3的状态变量
Figure 636766DEST_PATH_IMAGE001
和参数
Figure 906074DEST_PATH_IMAGE003
,用MH算法迭代n次 生成m条马尔科夫链;
S5、在步骤S4的m条马尔科夫链中采用花朵授粉算法得出最优的1条马尔科夫链;
S6、通过步骤S5的最优的1条马尔科夫链,计算各个参数的后验均值,标准差,置信区间的估计结果得到改进的广义网络向量模型;
S7、通过步骤S6的改进的广义网络向量模型,对带有网络结构的时序数据进行统计分析和预测。
2.根据权利要求1所述的基于改进广义网络向量模型的时序数据预测方法,其特征在 于,步骤S1的具体过程为:确定网络时序数据中的节点数N,邻接矩阵
Figure 832572DEST_PATH_IMAGE004
和在时 间 t 搜集到的离散型因变量
Figure 554541DEST_PATH_IMAGE005
,设定因变量
Figure 358942DEST_PATH_IMAGE006
由一个连续的状态变 量
Figure 748335DEST_PATH_IMAGE001
决定;
若因变量
Figure 580156DEST_PATH_IMAGE006
是0-1型变量,则其条件概率可为:
Figure 55000DEST_PATH_IMAGE007
Figure 129004DEST_PATH_IMAGE007
若因变量
Figure 638483DEST_PATH_IMAGE006
是计数变量,考虑其条件分布为泊松分布:
Figure 641205DEST_PATH_IMAGE008
其中,
Figure 603345DEST_PATH_IMAGE009
3.根据权利要求2所述的基于改进广义网络向量模型的时序数据预测方法,其特征在 于,步骤S2得到的广义网络向量自回归模型为:
Figure 749548DEST_PATH_IMAGE010
其中,
Figure 582375DEST_PATH_IMAGE011
表示节点i的出度,
Figure 21578DEST_PATH_IMAGE012
是对应于节点i的p维自变 量其不随时间变化,噪声项
Figure 471014DEST_PATH_IMAGE013
,参数
Figure 152400DEST_PATH_IMAGE014
是基准效应,
Figure 370892DEST_PATH_IMAGE015
代表网络效应,
Figure 980996DEST_PATH_IMAGE016
代表自回归效应,
Figure 917728DEST_PATH_IMAGE017
刻画了不随时间变动的变量产生的影响。
4.根据权利要求3所述的基于改进广义网络向量模型的时序数据预测方法,其特征在 于,广义网络向量自回归模型的向量形式为:
Figure 128436DEST_PATH_IMAGE018
,其中,
Figure 201434DEST_PATH_IMAGE019
是对
Figure 982440DEST_PATH_IMAGE020
行标准化后的邻接矩阵,
Figure 140889DEST_PATH_IMAGE021
Figure 164077DEST_PATH_IMAGE022
5.根据权利要求4所述的基于改进广义网络向量模型的时序数据预测方法,其特征在 于,步骤S3中参数
Figure 357161DEST_PATH_IMAGE023
6.根据权利要求5所述的基于改进广义网络向量模型的时序数据预测方法,其特征在于,步骤S5的具体过程为:
S501、以对数似然函数作为目标函数,求解步骤S4中m条马尔科夫链在每次迭代样本中的最优解;
S502、根据步骤S501的最优解通过花朵授粉算法判断转换概率p>0.8是否成立,是则进行全局寻优产生候选点,否则进行局部寻优产生候选点;
S503、根据MH算法计算接受率更新
Figure 309068DEST_PATH_IMAGE024
在t+1次迭代的样本值,判断广 义网络向量自回归模型是否收敛,是则产生1条马尔科夫链,否则重复执行步骤S501至步骤 S503。
7.一种基于改进广义网络向量模型的时序数据预测装置,其特征在于:包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-6任一项所述的基于改进广义网络向量模型的时序数据预测方法。
CN202210061307.7A 2022-01-19 2022-01-19 基于改进广义网络向量模型的时序数据预测方法及装置 Pending CN114092269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210061307.7A CN114092269A (zh) 2022-01-19 2022-01-19 基于改进广义网络向量模型的时序数据预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210061307.7A CN114092269A (zh) 2022-01-19 2022-01-19 基于改进广义网络向量模型的时序数据预测方法及装置

Publications (1)

Publication Number Publication Date
CN114092269A true CN114092269A (zh) 2022-02-25

Family

ID=80308762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210061307.7A Pending CN114092269A (zh) 2022-01-19 2022-01-19 基于改进广义网络向量模型的时序数据预测方法及装置

Country Status (1)

Country Link
CN (1) CN114092269A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542045A (zh) * 2023-05-05 2023-08-04 天津大学 一种基于MixSIAR的排水管道三源外水比例计算方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542045A (zh) * 2023-05-05 2023-08-04 天津大学 一种基于MixSIAR的排水管道三源外水比例计算方法
CN116542045B (zh) * 2023-05-05 2024-01-23 天津大学 一种基于MixSIAR的排水管道三源外水比例计算方法

Similar Documents

Publication Publication Date Title
CN111079931A (zh) 一种基于图神经网络的状态空间概率性多时间序列预测方法
US9390383B2 (en) Method for an optimizing predictive model using gradient descent and conjugate residuals
Hassan et al. A hybrid of multiobjective Evolutionary Algorithm and HMM-Fuzzy model for time series prediction
CN110138595A (zh) 动态加权网络的时间链路预测方法、装置、设备及介质
US7421380B2 (en) Gradient learning for probabilistic ARMA time-series models
Yang et al. A probabilistic model for truth discovery with object correlations
Huang et al. Achieving counterfactual fairness for causal bandit
Tsiligkaridis Information aware max-norm Dirichlet networks for predictive uncertainty estimation
CN117035073B (zh) 一种基于分层事件发展模式归纳的未来气象事件预测方法
Khajenezhad et al. A distributed density estimation algorithm and its application to naive Bayes classification
Ling et al. An intelligent sampling framework for multi-objective optimization in high dimensional design space
CN111950611A (zh) 基于随机梯度追踪技术的大数据二分类分布式优化方法
Pu et al. Stochastic mirror descent for low-rank tensor decomposition under non-euclidean losses
CN114092269A (zh) 基于改进广义网络向量模型的时序数据预测方法及装置
El-Laham et al. Policy gradient importance sampling for Bayesian inference
Liao et al. Probabilistic wind power forecasting for newly-built wind farms based on multi-task Gaussian process method
He et al. Stationary-Sparse Causality Network Learning.
Mortazavi et al. Efficient mobile cellular traffic forecasting using spatial-temporal graph attention networks
Asaduzzaman et al. A Novel Salary Prediction System Using Machine Learning Techniques
Salman et al. Nifty method for prediction dynamic features of online social networks from users’ activity based on machine learning
Cherifi et al. An incremental evidential conflict resolution method for data stream fusion in IoT
Silva Generalized autoregressive neural network models
Zhang et al. The time dependency predictive model on the basis of community detection and long‐short term memory
Li et al. A Bayesian model averaging method for software reliability modeling and assessment
Velegkas et al. Reinforcement learning with logarithmic regret and policy switches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220225

RJ01 Rejection of invention patent application after publication