CN114386602B - 一种面向多路服务器负载数据的htm预测分析方法 - Google Patents

一种面向多路服务器负载数据的htm预测分析方法 Download PDF

Info

Publication number
CN114386602B
CN114386602B CN202210036096.1A CN202210036096A CN114386602B CN 114386602 B CN114386602 B CN 114386602B CN 202210036096 A CN202210036096 A CN 202210036096A CN 114386602 B CN114386602 B CN 114386602B
Authority
CN
China
Prior art keywords
load data
server
htm
sequence
server load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210036096.1A
Other languages
English (en)
Other versions
CN114386602A (zh
Inventor
朱博
袁云燕
左翌
张雨钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Ruixiang Technology Group Co ltd
Original Assignee
Jiangsu Ruixiang Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Ruixiang Technology Group Co ltd filed Critical Jiangsu Ruixiang Technology Group Co ltd
Priority to CN202210036096.1A priority Critical patent/CN114386602B/zh
Publication of CN114386602A publication Critical patent/CN114386602A/zh
Application granted granted Critical
Publication of CN114386602B publication Critical patent/CN114386602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向多路服务器负载数据的HTM预测分析方法,使得HTM能够对多路服务器负载数据进行并行训练,扩展了系统能够处理的数据序列类型。系统通过编码散列了服务器负载数据的空间特征,通过空间池训练形成了服务器负载数据的微柱稀疏分布表征,借助于序列状态缓存模块,能够正确获取负载数据所属服务器的上下文环境,通过时间池训练的对每一个服务器负载数据模式进行抽取和记忆,为后续的预测分析提供所属的上下文环境支持。本发明提出的序列状态缓存机制,记录了每一个服务器负载数据序列的上下文环境信息,能为每一个负载数据提供上一时刻正确的上下文环境,使得HTM可以对多路服务器负载数据进行并行训练。

Description

一种面向多路服务器负载数据的HTM预测分析方法
技术领域
本发明涉及人工智能深度学习领域,尤其涉及一种面向多路服务器负载数据的HTM预测分析方法。
背景技术
随着Internet的快速发展和业务量的不断提高,基于网络的数据访问流量迅速增长,特别是对数据中心、大型企业以及门户网站等的访问,其访问流量甚至达到了10Gb/s的级别;同时,服务器网站借助HTTP、FTP、SMTP等应用程序,为访问者提供了越来越丰富的内容和信息,服务器逐渐被数据淹没;另外,大部分网站(尤其电子商务等网站)都需要提供不间断24小时服务,若服务器负载过重引起的任何服务中断或通信中的关键数据丢失都会造成直接的商业损失。因此有效地对服务器负载数据进行预测分析,并根据预测结构及时进行负载均衡,是保证系统服务性能稳定的重要手段之一。
近年来,深度学习算法在图像处理、语音处理、自然语言处理等多个领域得到广泛的应用并产生巨大的影响,这在很大程度上归功于各种新型神经网络模型以及高效的模型训练方法。随着生物神经科学的进步,越来越多的新型神经网络正在被研究。HTM(Hierarchical Temporal Memory)是一种模仿人脑中处理高级认知功能的新皮质部分运作原理的新型人工神经网络,其将接受到的各种模式与记忆中的模式进行匹配,并根据匹配的模式对下一刻将会出现的信息作出预测分析。
现有的HTM在训练时,只会在相邻的服务器负载数据之间建立时间上的关联,对稳定模式形成记忆。当系统面对多个服务器的负载数据时,这些负载数据会因为传输的延迟而混合在一起,每一个数据尽管可以在混合的数据序列中向前找到由某一个服务器所产生的数据前驱,但通常该前驱数据不与当前数据相邻,这使得HTM无法对混合在一起的数据序列进行正确的学习。为此本发明的系统通过增加序列状态缓存机制,可以让每一个负载数据都能够通过序列状态缓存模块找到正确的前驱以及对应的上下文信息,进而对混合序列中的每一个子序列形成有效训练结果,扩展系统可以训练的数据序列类型。
发明内容
本发明的目的在于提供一种面向多路服务器负载数据的HTM预测分析系统,使得HTM能够对多路服务器负载数据进行并行训练,扩展了系统能够处理的数据序列类型。
本发明的技术方案为:一种面向多路服务器负载数据的HTM预测分析方法,包括如下步骤:
步骤1,在线采集服务器负载分段统计数据,使其包含服务器负载和时间两方面的特性,对每一个服务器构成具有时序特征的服务器负载据流;
步骤2,利用编码器对服务器负载数据进行编码,通过HTM空间池训练算法形成服务器负载数据的微柱稀疏分布表征Wt
步骤3,使用负载数据所属服务器id通过序列状态缓存模块查询获取该服务器上一时刻的上下文环境信息;
步骤4,利用多路输入的时间池训练算法对当前负载数据进行训练和记忆;
步骤5,将当前负载数据产生的上下文环境更新至序列状态缓存模块;
步骤6,利用当前负载数据产生的上下文环境对后续内容进行预测分析。
进一步,构建序列状态缓存模块SSCM,记录了HTM学习过程中负载数据所对应的上下文环境,具体内容为多个<key,value>键值对,其中key取服务器的id,value取id为服务器p对应的负载数据所产生的活跃细胞集Alast_p、和预测细胞集Πlast_p
进一步,步骤3中获取该服务器上一时刻的上下文环境信息的计算方式如下:
{Alast_p、Πlast_p}=SSCM.get(id)
其中SSCM模块中的get函数可以根据子序列id获取该序列上一时刻的训练状态。
进一步,所述的多路输入的时间池训练算法中的时间池的训练规则如下:
步骤4.1,根据步骤2计算出的活跃微柱Wt,生成t时刻活跃微柱上的活跃细胞集At,计算方法如下:
其中表示t时刻第j个微柱上第i个细胞是否被激活,/>表示第j个微柱上的第i个细胞是否在t-1时刻被预测激活;
步骤4.2,生成t时刻的预测细胞集Πt,计算方法如下:
其中表示第j个微柱上第i个细胞上由p服务器中的序列模式所生成的第d个树突分支所对应的连通矩阵,如果树突分支中突触持久值大于阈值,该矩阵中对应位置的值被置为1,否则置为0,θ为树突分支的激活阈值,°表示矩阵内积运算;
步骤4.3,更新活跃细胞上的树突分支的持久值。
进一步,步骤4.3中树突分支更新只对p服务器对应的序列所产生的树突分支进行突触持久值进行,更新方法如下:
其中表示第j个微柱上第i个细胞上由p服务器中的序列模式所生成的第k个树突分支所对应的突触持久值矩阵,/>为p+为树突分支中突触调整的奖赏增量值,p-为树突分支中突触调整的惩罚减少值。
进一步,步骤5中更新序列状态缓存模块的计算方法如下:
SSCM.put(id,{At、Πt})
其中SSCM模块中的put函数可以根据子序列id将该序列当前时刻的训练状态存入序列状态缓存模块,为下一时刻的数据训练提供上下文环境信息。
进一步,步骤6利用当前负载数据产生的上下文环境通过分类器可还原成为预测内容。
本发明的有益效果:
1、本发明的目的在于提供一种面向多路服务器负载数据的HTM预测分析系统,使得HTM能够对多路服务器负载数据进行并行训练,扩展了系统能够处理的数据序列类型。
2、本发明在HTM模型中增加了序列状态缓存模块,记录了不同子序列上一时刻的上下文信息,可以让系统在训练多个子序列混合在一起的数据序列时,能够为数据建立正确的时序关联关系,分别记忆每一个子序列的稳定模式。
3、本发明使用多路输入的HTM时间池训练算法,改进了HTM细胞上树突分支的生长和更新规则,并以此调整了预测细胞的计算规则,避免多个子序列中的稳定模式相互干扰。
附图说明
图1面向服务器负载分析的HTM高效异常检测系统的结构图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
实施例1:
如图1展示了面向多路服务器负载数据的HTM预测分析系统的结构图,该系统可以对多路服务器负载数据进行训练和预测分析。每一个服务器负载数据通过编码将数据特征分散到一个二值一维向量中的不同有效位中,增加了系统对数据噪声的抗干扰能力;数据的编码通过空间池训练,形成了HTM微柱的系数分布表征,利用系数分布的数学特征,可以很方便地区分不同、相似和相同的输入数据;借助于序列缓存模块和多路输入的时间池训练算法,在HTM中能够并行记忆每一个服务器负载数据所形成的稳定序列模式,为后续的输入提供历史规律的场景支持,生成对下一时刻内容的预测。
实施例2:
以一个具体面向两路服务器负载数据的HTM预测分析过程为例说明系统的工作流程。假设系统对两个服务器的负载数据进行预测分析,;两个服务器的id分别时1和2,服务器1产生的序列为{……,<1,at-1>,<1,at>,……},服务器2产生的序列为{……,<2,bt-1>,<2,bt>,……},则两个服务器数据混合在一起时,可能产生的数据序列为{……,<1,at-1>,<2,bt-1>,<1,at>,<2,bt>,……}。
假设某个t时刻,服务器负载数据<2,bt>进入系统训练,bt通过编码器编散列了数据的特征,通过HTM空间池训练算法形成服务器负载数据的微柱稀疏分布表征Wt
接下来通过服务器id从序列状态缓存模块中获取该服务器产生的序列的t-1时刻的上下文信息,包括活跃细胞集和预测细胞集。
{At-1、Πt-1}={Alast_2、Πlast_2}
获取该服务器上一时刻的上下文环境信息的计算方式如下:
{Alast_p、Πlast_p}=SSCM.get(id)
其中SSCM模块中的get函数可以根据子序列id获取该序列上一时刻的训练状态。
接下来利用t-1时刻的预测细胞集和t时刻的活跃微柱集Wt,生成t时刻的活跃细胞集At,计算方式如下:
接下来根据t时刻的活跃细胞集,利用2号服务器在细胞上生成的树突分支计算t时刻的预测细胞集Πt。计算方法如下:
这种预测的方式,避免了其他服务器负载数据序列所产生的训练结果对当前服务器负载数据序列训练的影响。
接下来更新活跃细胞上的活跃树突分支的持久值。其中树突分支更新只对2号服务器对应的序列所产生的树突分支进行突触持久值进行,更新方法如下:
接下来更新序列状态缓存模块的计算方法如下:
SSCM.put(2,{At、Πt})
接下来利用当前服务器负载数据产生的预测细胞集Πt通过分类器可还原成为预测内容。
综上,本发明提供一种面向多路服务器负载数据的HTM预测分析系统,使得HTM能够对多路服务器负载数据进行并行训练,扩展了系统能够处理的数据序列类型。系统在HTM模型中增加了序列状态缓存模块,记录了不同子序列上一时刻的上下文信息,可以让系统在训练多个子序列混合在一起的数据序列时,能够为数据建立正确的时序关联关系,分别记忆每一个子序列的稳定模式。其次使用多路输入的HTM时间池训练算法,改进了HTM细胞上树突分支的生长和更新规则,并以此调整了预测细胞的计算规则,避免多个子序列中的稳定模式相互干扰。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围。

Claims (6)

1.一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,包括如下步骤:
步骤1,在线采集服务器负载分段统计数据,使其包含服务器负载和时间两方面的特性,对每一个服务器构成具有时序特征的服务器负载据流;
步骤2,利用编码器对服务器负载数据进行编码,通过HTM空间池训练算法形成服务器负载数据的微柱稀疏分布表征Wt
步骤3,使用负载数据所属服务器id通过序列状态缓存模块查询获取该服务器上一时刻的上下文环境信息;
步骤4,利用多路输入的时间池训练算法对当前负载数据进行训练和记忆;
步骤5,将当前负载数据产生的上下文环境更新至序列状态缓存模块;
步骤6,利用当前负载数据产生的上下文环境对后续内容进行预测分析。
2.根据权利要求1所述的一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,构建序列状态缓存模块SSCM,记录了HTM学习过程中负载数据所对应的上下文环境,具体内容为多个<key,value>键值对,其中key取服务器的id,value取id为服务器p对应的负载数据所产生的活跃细胞集Alast_p、和预测细胞集Πlast_p
3.根据权利要求2所述的一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,步骤3中获取该服务器上一时刻的上下文环境信息的计算方式如下:
{Alast_p、Πlast_p}=SSCM.get(id)
其中SSCM模块中的get函数可以根据子序列id获取该序列上一时刻的训练状态。
4.根据权利要求2所述的一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,所述的多路输入的时间池训练算法中的时间池的训练规则如下:
步骤4.1,根据步骤2计算出的活跃微柱Wt,生成t时刻活跃微柱上的活跃细胞集At,计算方法如下:
其中表示t时刻第j个微柱上第i个细胞是否被激活,/>表示第j个微柱上的第i个细胞是否在t-1时刻被预测激活;
步骤4.2,生成t时刻的预测细胞集Πt,计算方法如下:
其中表示第j个微柱上第i个细胞上由p服务器中的序列模式所生成的第d个树突分支所对应的连通矩阵,如果树突分支中突触持久值大于阈值,该矩阵中对应位置的值被置为1,否则置为0,θ为树突分支的激活阈值,°表示矩阵内积运算;
步骤4.3,更新活跃细胞上的树突分支的持久值。
5.根据权利要求4所述的一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,步骤4.3中树突分支更新只对p服务器对应的序列所产生的树突分支进行突触持久值进行,更新方法如下:
其中表示第j个微柱上第i个细胞上由p服务器中的序列模式所生成的第k个树突分支所对应的突触持久值矩阵,/>为p+为树突分支中突触调整的奖赏增量值,p-为树突分支中突触调整的惩罚减少值。
6.根据权利要求4所述的一种面向多路服务器负载数据的HTM预测分析方法,其特征在于,步骤5中更新序列状态缓存模块的计算方法如下:
SSCM.put(id,{At、Πt})
其中SSCM模块中的put函数可以根据子序列id将该序列当前时刻的训练状态存入序列状态缓存模块,为下一时刻的数据训练提供上下文环境信息。
CN202210036096.1A 2022-01-13 2022-01-13 一种面向多路服务器负载数据的htm预测分析方法 Active CN114386602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210036096.1A CN114386602B (zh) 2022-01-13 2022-01-13 一种面向多路服务器负载数据的htm预测分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210036096.1A CN114386602B (zh) 2022-01-13 2022-01-13 一种面向多路服务器负载数据的htm预测分析方法

Publications (2)

Publication Number Publication Date
CN114386602A CN114386602A (zh) 2022-04-22
CN114386602B true CN114386602B (zh) 2024-02-20

Family

ID=81201977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210036096.1A Active CN114386602B (zh) 2022-01-13 2022-01-13 一种面向多路服务器负载数据的htm预测分析方法

Country Status (1)

Country Link
CN (1) CN114386602B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917031A (zh) * 2012-09-25 2013-02-06 浙江图讯科技有限公司 一种用于面向工矿企业的安全生产云服务平台的数据计算系统
CN111612125A (zh) * 2020-04-13 2020-09-01 江苏大学 一种面向在线学习的新型htm时间池方法及其系统
CN111695717A (zh) * 2019-03-15 2020-09-22 辉达公司 自主机器应用中的时间信息预测
CN112269729A (zh) * 2020-11-04 2021-01-26 江苏瑞祥科技集团有限公司 面向网络购物平台大规模服务器集群的负载智能分析方法
CN112330362A (zh) * 2020-11-04 2021-02-05 江苏瑞祥科技集团有限公司 用于互联网商城用户行为习惯的快速数据智能分析方法
CN112561063A (zh) * 2020-12-21 2021-03-26 江苏大学 一种基于微柱激活程度的htm时间池训练方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130253898A1 (en) * 2012-03-23 2013-09-26 Power Analytics Corporation Systems and methods for model-driven demand response

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917031A (zh) * 2012-09-25 2013-02-06 浙江图讯科技有限公司 一种用于面向工矿企业的安全生产云服务平台的数据计算系统
CN111695717A (zh) * 2019-03-15 2020-09-22 辉达公司 自主机器应用中的时间信息预测
CN111612125A (zh) * 2020-04-13 2020-09-01 江苏大学 一种面向在线学习的新型htm时间池方法及其系统
CN112269729A (zh) * 2020-11-04 2021-01-26 江苏瑞祥科技集团有限公司 面向网络购物平台大规模服务器集群的负载智能分析方法
CN112330362A (zh) * 2020-11-04 2021-02-05 江苏瑞祥科技集团有限公司 用于互联网商城用户行为习惯的快速数据智能分析方法
CN112561063A (zh) * 2020-12-21 2021-03-26 江苏大学 一种基于微柱激活程度的htm时间池训练方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Detecting performance anomalies in scientific workflows using hierarchical temporal memory;Maria A. Rodriguez 等;《Future Generation Computer Systems》;第88卷;624–635 *
集群服务器晌应延时预侧及其负载调度控制;于国防 等;《计算机系统应用》(第7期);26-29 *
面向移动互联网的开放服务技术架构及若干关键技术研究;马琳;《中国博士学位论文全文数据库 信息科技辑》(第1期);I139-24 *

Also Published As

Publication number Publication date
CN114386602A (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
Zhu et al. Deep reinforcement learning for mobile edge caching: Review, new features, and open issues
CN113905391B (zh) 集成学习网络流量预测方法、系统、设备、终端、介质
CN113191484A (zh) 基于深度强化学习的联邦学习客户端智能选取方法及系统
CN111414461A (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN108876044B (zh) 一种基于知识增强神经网络的线上内容流行度预测方法
CN113344615A (zh) 一种基于gbdt和dl融合模型的营销活动预测方法
CN112766603A (zh) 一种交通流量预测方法、系统、计算机设备及存储介质
CN114819143A (zh) 一种适用于通信网现场维护的模型压缩方法
Wang et al. Deep joint source-channel coding for multi-task network
CN116346837A (zh) 一种基于深度强化学习的物联网边缘协同缓存方法
CN115510322A (zh) 一种基于深度学习的多目标优化推荐方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN118134017A (zh) 一种采用脉冲神经网络预测社交网络链路的方法
CN114360503A (zh) 一种语音识别方法、系统及存储介质和终端设备
CN114386602B (zh) 一种面向多路服务器负载数据的htm预测分析方法
CN113128666A (zh) 基于Mo-S-LSTMs模型的时间序列多步预测方法
CN117349748A (zh) 一种基于云边协同的主动学习故障诊断方法
CN116151366A (zh) 一种基于在线蒸馏的噪声标签鲁棒性学习方法
CN114116692B (zh) 一种基于mask和双向模型的缺失POI轨迹补全方法
CN115965078A (zh) 分类预测模型训练方法、分类预测方法、设备及存储介质
CN112581177B (zh) 结合自动特征工程及残差神经网络的营销预测方法
US20220277186A1 (en) Dialog system with adaptive recurrent hopping and dual context encoding
Bi et al. Multi-indicator water time series imputation with autoregressive generative adversarial networks
CN118069717B (zh) 基于循环神经网络的时序数据特征预测方法
CN113408709B (zh) 基于单元重要度的条件计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Zhu Bo

Inventor after: Yuan Yunyan

Inventor after: Zuo Yi

Inventor before: Zhu Bo

Inventor before: Yuan Yunyan

Inventor before: Zuo Yi

Inventor before: Zhang Yuzhao