CN114092269A - 基于改进广义网络向量模型的时序数据预测方法及装置 - Google Patents
基于改进广义网络向量模型的时序数据预测方法及装置 Download PDFInfo
- Publication number
- CN114092269A CN114092269A CN202210061307.7A CN202210061307A CN114092269A CN 114092269 A CN114092269 A CN 114092269A CN 202210061307 A CN202210061307 A CN 202210061307A CN 114092269 A CN114092269 A CN 114092269A
- Authority
- CN
- China
- Prior art keywords
- network vector
- generalized network
- model
- time sequence
- sequence data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 230000001419 dependent effect Effects 0.000 claims abstract description 23
- 230000010152 pollination Effects 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 abstract description 3
- 238000005070 sampling Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/18—Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于改进广义网络向量模型的时序数据预测方法及装置,主要解决现有技术中存在的现有对离散型因变量分析预测的广义网络向量自回归模型研究大型社交网络时,样本的接受率很低,马尔科夫链会出现大量停滞的问题。该发明输入带有网络结构的时序数据,建立离散型因变量和状态变量之间的连接函数,然后通过状态变量构建广义网络向量自回归模型,然后通过标准马尔科夫链蒙特卡洛算法的MH算法得到多条马尔科夫链,然后通过花朵授粉算法得出最优的1条马尔科夫链,进而得到改进的广义网络向量模型,对带网络结构的时序数据进行预测;本发明可以有效提高新样本的接受率,同时降低修正参数的相对误差。
Description
技术领域
本发明涉及具有网络结构的时间序列数据分析预测技术领域,具体地说,是涉及一种基于改进广义网络向量模型的时序数据预测方法及装置。
背景技术
网络数据中节点间具有网络关系,从每个节点收集的变量可能会随时间发生变化,实际应用中经常需要对这些具有网络结构的时间序列数据进行分析预测;社交网络数据就是一种典型的具有网络结构的时序数据,社交网络数据的统计分析在各个领域中都有广泛的应用,比如在人口学中研究移民特点,在组织管理方面研究同伴效应;特别是随着互联网技术的高速发展,社交网络数据越来越丰富,挖掘网络中用户的特点,预测其行为特征,对企业和社会都极具价值。
现有专门用于研究动态社交行为的网络向量自回归模型,但其研究的都是连续型因变量;而在对网络时序数据的实际研究中,经常面临因变量是离散的情况,比如在分析社交网络中的用户活跃度时,网络平台上的发帖数是计数变量,用户的决策行为常被记录为0-1变量;对于离散型因变量的情况常采用基于标准的马尔科夫链蒙特卡洛算法的广义网络向量自回归模型来分析预测,然而当我们研究大型社交网络时,节点数目很多,从每个节点获取的信息通常是高维向量,对这样的数据建立广义网络向量自回归模型,待估参数维度很高,后验分布复杂;在这种情况下,用标准的马尔科夫链蒙特卡洛算法采样,样本的接受率很低,马尔科夫链会出现大量停滞的阶段。
发明内容
本发明的目的在于提供一种基于改进广义网络向量模型的时序数据预测方法及装置,以解决现有对离散型因变量分析预测的广义网络向量自回归模型研究大型社交网络时,样本的接受率很低,马尔科夫链会出现大量停滞的问题。
为了解决上述问题,本发明提供如下技术方案:
一种基于改进广义网络向量模型的时序数据预测方法包括以下步骤:
S5、在步骤S4的m条马尔科夫链中采用花朵授粉算法得出最优的1条马尔科夫链;
S6、通过步骤S5的最优的1条马尔科夫链,计算各个参数的后验均值,标准差,置信区间的估计结果得到改进的广义网络向量模型;
S7、通过步骤S6的改进的广义网络向量模型,对带有网络结构的时序数据进行统计分析和预测。
上述方案中输入带有网络结构的时序数据,建立离散型因变量和状态变量之间的连接函数,然后通过状态变量构建广义网络向量自回归模型,然后通过标准马尔科夫链蒙特卡洛算法(MCMC)的MH算法得到多条马尔科夫链,然后通过花朵授粉算法(FPA)得出最优的1条马尔科夫链,进而得到改进的广义网络向量模型,对带网络结构的时序数据进行预测;本发明引入花朵授粉算法(Flower Pollination Algorithm,FPA)与标准马尔科夫链蒙特卡洛算法(Metropolis Hastings-within-Gibbs MCMC)算法融合的优化算法采样,可以有效提高新样本的接受率,同时降低修正参数的相对误差,解决了网络向量自回归模型中的待估参数维度很高,后验分布复杂的问题。
进一步的,步骤S5的具体过程为:
S501、以对数似然函数作为目标函数,求解步骤S4中m条马尔科夫链在每次迭代样本中的最优解;
S502、根据步骤S501的最优解通过花朵授粉算法判断转换概率p>0.8是否成立,是则进行全局寻优产生候选点,否则进行局部寻优产生候选点;
一种基于改进广义网络向量模型的时序数据预测装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现基于改进广义网络向量模型的时序数据预测方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明支持具有大型网络结构的时序数据建模;针对具有网络结构的时序数据,通过引入广义网络向量自回归模型,同时拟合数据的网络结构和动态变化,针对随时间变化的离散型因变量、高维自变量以及大型的网络结构,本模型方法都有很强的适用性。
(2)本发明结合花朵授粉算法(FPA)和标准马尔科夫链蒙特卡洛算法(MCMC)的广义网络向量模型,即FPA-MCMC算法估计模型,从m条马尔科夫链中寻出最优的一条,提高寻优效率,提高样本接受率和样本多样性;针对该网络向量模型中参数维度大,后验分布复杂,使用MH算法采样的样本接受率低,采样可能出现大量停滞阶段等问题,在参数估计阶段引入基于花朵授粉算法与MCMC算法融合的优化算法采样,利用花朵授粉算法FPA全局寻优和局部寻优的特性,提高寻优效率,通过FPA-MCMC算法抽样提高了采样接受率,同时增加了样本多样性,且保证样本收敛在合适的范围。
(3)本发明中模型方法有很好的解释性,可用于网络时序数据的统计分析和预测;本方法建立的网络向量模型同时考虑了邻接节点的影响,自身滞后期的影响以及不随时间改变的属性变量的影响,便于阐释网络中包含的信息,如个体间的影响和目标变量的动态变化,此模型方法适用于对信息丰富的社交网络数据进行分析和预测。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明的流程架构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
实施例1
如图1所示,一种基于改进广义网络向量模型的时序数据预测方法是针对具有网络结构的时间序列数据的分析和预测,在网络节点数目很大,信息维度很高的背景下,提供了一种结合花朵授粉算法和马尔科夫链蒙特卡洛算法的广义网络向量自回归方法;该方法包括以下步骤:
1. 数据预处理
S1:输入带有网络结构的时序数据,确定网络中的节点数N,邻接矩阵 和在时间t搜集到的离散型目标变量 ;假设因变
量由一个连续的状态变量 决定,根据 的取值特点,假定 与 之间的连接函数.
若是0-1型变量,则其条件概率可为:
构建广义网络向量模型
基于FPA-MCMC算法的参数估计
S3:计算每个状态变量和每个参数的完全条件分布,步骤如下:
S4:对于状态变量 和参数 ,选取m个不同的初始值,
用Metropolis Hastings-within-Gibbs MCMC抽样算法(后文称MH算法)迭代n次,产生m条
马尔科夫链。每次迭代的具体步骤如下:
估计模型,分析预测
S6:计算各个参数的后验均值,标准差,置信区间等估计结果,得到最终的广义网络向量模型;此过程为成熟的现有技术再次不做累述。
S7:基于S6中得到的模型,对该网络时序数据进行统计分析和预测。
实施例2
一种基于改进广义网络向量模型的时序数据预测装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现基于改进广义网络向量模型的时序数据预测方法。
本发明针对具有网络结构的时间序列数据,提出的一种结合花朵授粉算法(FPA)和标准马尔科夫链蒙特卡洛算法(MCMC)的广义网络向量模型,该模型方法可广泛应用于研究网络结构中的动态离散型数据,对于社交网络等数据的分析和预测颇具意义。
本发明通过花朵授粉算法对MCMC抽样的样本进行再次寻优,加快收敛速度,有效提高新样本接受率,同时降低修正参数的相对误差,增加样本多样性,有效解决了网络向量模型中高维参数的估计问题。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种基于改进广义网络向量模型的时序数据预测方法,其特征在于,包括以下步骤:
S5、在步骤S4的m条马尔科夫链中采用花朵授粉算法得出最优的1条马尔科夫链;
S6、通过步骤S5的最优的1条马尔科夫链,计算各个参数的后验均值,标准差,置信区间的估计结果得到改进的广义网络向量模型;
S7、通过步骤S6的改进的广义网络向量模型,对带有网络结构的时序数据进行统计分析和预测。
7.一种基于改进广义网络向量模型的时序数据预测装置,其特征在于:包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-6任一项所述的基于改进广义网络向量模型的时序数据预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210061307.7A CN114092269A (zh) | 2022-01-19 | 2022-01-19 | 基于改进广义网络向量模型的时序数据预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210061307.7A CN114092269A (zh) | 2022-01-19 | 2022-01-19 | 基于改进广义网络向量模型的时序数据预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114092269A true CN114092269A (zh) | 2022-02-25 |
Family
ID=80308762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210061307.7A Pending CN114092269A (zh) | 2022-01-19 | 2022-01-19 | 基于改进广义网络向量模型的时序数据预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114092269A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116542045A (zh) * | 2023-05-05 | 2023-08-04 | 天津大学 | 一种基于MixSIAR的排水管道三源外水比例计算方法 |
-
2022
- 2022-01-19 CN CN202210061307.7A patent/CN114092269A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116542045A (zh) * | 2023-05-05 | 2023-08-04 | 天津大学 | 一种基于MixSIAR的排水管道三源外水比例计算方法 |
CN116542045B (zh) * | 2023-05-05 | 2024-01-23 | 天津大学 | 一种基于MixSIAR的排水管道三源外水比例计算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
US9390383B2 (en) | Method for an optimizing predictive model using gradient descent and conjugate residuals | |
Hassan et al. | A hybrid of multiobjective Evolutionary Algorithm and HMM-Fuzzy model for time series prediction | |
CN110138595A (zh) | 动态加权网络的时间链路预测方法、装置、设备及介质 | |
US7421380B2 (en) | Gradient learning for probabilistic ARMA time-series models | |
Yang et al. | A probabilistic model for truth discovery with object correlations | |
Huang et al. | Achieving counterfactual fairness for causal bandit | |
Tsiligkaridis | Information aware max-norm Dirichlet networks for predictive uncertainty estimation | |
CN117035073B (zh) | 一种基于分层事件发展模式归纳的未来气象事件预测方法 | |
Khajenezhad et al. | A distributed density estimation algorithm and its application to naive Bayes classification | |
Ling et al. | An intelligent sampling framework for multi-objective optimization in high dimensional design space | |
CN111950611A (zh) | 基于随机梯度追踪技术的大数据二分类分布式优化方法 | |
Pu et al. | Stochastic mirror descent for low-rank tensor decomposition under non-euclidean losses | |
CN114092269A (zh) | 基于改进广义网络向量模型的时序数据预测方法及装置 | |
El-Laham et al. | Policy gradient importance sampling for Bayesian inference | |
Liao et al. | Probabilistic wind power forecasting for newly-built wind farms based on multi-task Gaussian process method | |
He et al. | Stationary-Sparse Causality Network Learning. | |
Mortazavi et al. | Efficient mobile cellular traffic forecasting using spatial-temporal graph attention networks | |
Asaduzzaman et al. | A Novel Salary Prediction System Using Machine Learning Techniques | |
Salman et al. | Nifty method for prediction dynamic features of online social networks from users’ activity based on machine learning | |
Cherifi et al. | An incremental evidential conflict resolution method for data stream fusion in IoT | |
Silva | Generalized autoregressive neural network models | |
Zhang et al. | The time dependency predictive model on the basis of community detection and long‐short term memory | |
Li et al. | A Bayesian model averaging method for software reliability modeling and assessment | |
Velegkas et al. | Reinforcement learning with logarithmic regret and policy switches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220225 |
|
RJ01 | Rejection of invention patent application after publication |