CN116048910A - 一种数据中心设备运行数据双尺度预测方法 - Google Patents
一种数据中心设备运行数据双尺度预测方法 Download PDFInfo
- Publication number
- CN116048910A CN116048910A CN202211574534.6A CN202211574534A CN116048910A CN 116048910 A CN116048910 A CN 116048910A CN 202211574534 A CN202211574534 A CN 202211574534A CN 116048910 A CN116048910 A CN 116048910A
- Authority
- CN
- China
- Prior art keywords
- scale
- sequence
- data
- prediction
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 230000007774 longterm Effects 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 39
- 238000000354 decomposition reaction Methods 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 3
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011166 aliquoting Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种数据中心设备运行数据双尺度预测方法,包括如下步骤:设读入数据中心设备运行所产生的时间序列数据;得到大尺度波动序列和小尺度波动序列;在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;使用AR预测模型进行小尺度预测;基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。本申请降低计算复杂度,预测设备状态长期变化趋势,实现在保持预测性能的同时降低预测算法的开销。
Description
技术领域
本申请涉及数据预测领域,涉及一种数据中心设备运行数据双尺度预测方法。
背景技术
由于计算机技术、物联网技术和人工智能的迅猛发展,每天都会产生大量的信息数据,这些数据都需要由数据中心中的设备进行处理。对设备的运行数据进行精准预测有助于分析设备的未来工作状态,从而保障数据中心业务的稳定运行。
为保障数据中心各设备的稳定运行,需要对设备的运行数据进行预测,然而实现这一目标面临如下挑战:第一,基于设备运行数据的突变性,单一时刻的数据突变并不能作为有效参考,因此需要预测较长时间的数据变化,但如何从设备运行数据中提取出长期变化是一个问题。第二,预测长期的数据变化会增加预测误差,而小尺度波动序列反映了数据高频的复杂波动,能够提高短期数据预测的准确度,因此在大尺度预测之后,将预测小尺度波动序列,并将两者结合形成对设备运行数据的预测结果。
发明内容
本申请实施例的目的在于提供一种数据中心设备运行数据双尺度预测方法,降低计算复杂度,预测设备状态长期变化趋势,实现在保持预测性能的同时降低预测算法的开销。
为实现上述目的,本申请提供如下技术方案:
本申请实施例提供一种数据中心设备运行数据双尺度预测方法,包括如下步骤:
步骤1:设备的运行数据在一段时间T内为一个时间序列,读入数据中心设备运行所产生的时间序列数据,记为h(t);
步骤2:依据经验模态分解,设计一种不完全分解策略,得到最优的分解次数,进而得到大尺度波动序列和小尺度波动序列;
步骤3:在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;
步骤4:使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;
步骤5:使用AR预测模型进行小尺度预测;
步骤6:基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。
所述步骤2中为了获得设备运行数据的大尺度波动序列和小尺度波动序列,设计了一种不完全分解策略:
对于设备运行数据h(t),进行经验模态分解为:
其中,Ne是分解次数,yi(t)是第i次分解得到的固有模态函数,r(t)是残余序列,
每个子序列仅反映特定时间尺度变化,并且对所有子序列预测会导致计算复杂度过大,为了获得大尺度和小尺度的设备运行数据变化,将子序列合并成两部分,
第a次分解后剩余的低频序列为:
za(t)既需要反应大尺度变化、有一定的平滑性,又与原序列相似,因此构建目标函数:
argmaxαa
αa=Sa(fm)*R(za(t),h(t))
其中,R(za(t),h(t))是za(t)与原序列h(t)的皮尔逊相关系数,反映za(t)与原序列的相似性,Sa(fm)表示将za(t)的频谱等分后,低频部分能量所占的比例,反应序列za(t)的平滑性。找到使αa最大的分解次数am作为不完全分解次数,
皮尔逊相关系数R(za(t),h(t)):
Sa(fm)计算如下:
选取第am次分解后剩余的低频序列作为大尺度波动序列:
小尺度波动序列:
所述步骤3中为了降低计算复杂度,预测设备运行数据长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并的方法:
大尺度波动序列经过时隙τ的平均运行数据变化为:
其中,Ss是取样数目。
计算平均运行数据变化小于阈值Dt所需的时隙数目为Nlarge,将其作为大尺度时段的长度。Nlarge满足:
所述步骤4中基于滑动窗口k近邻和预匹配机制的大尺度预测方法为:
训练向量及其标签为:
其中,n表示滑动窗口的长度,通过此滑动窗口对HL进行截取获得训练向量。经过截取后,得到训练集Y=[Sn,Sn+1,…,Su-v]
先进行预匹配筛除与测试向量差距较大的训练向量:
求得训练向量和测试向量第n个元素的差距,若差距大于阈值Dh,则过滤掉此训练向量。
计算预匹配后剩余的训练向量Si和Su间的距离:
最后,大尺度预测值为:
所述步骤5中基于AR预测模型的小尺度预测方法为:
小尺度波动序列的预测采用AR模型:
与现有技术相比,本发明的有益效果是:
经验模态分解能够将序列分解成反映不同时间尺度波动特征的固有模态函数和剩余项,然而每个子序列仅反映特定时间尺度的变化,并且对所有子序列预测会导致较大计算复杂度。为了获得大尺度和小尺度的波动序列,设计了一种不完全分解策略。
在大尺度预测时,依据大尺度波动序列构建大尺度设备运行状态序列,以此降低计算复杂度,预测设备状态长期变化趋势。采用滑动窗口k近邻算法进行预测时,利用预匹配的方法来降低计算复杂度,以此实现在保持预测性能的同时降低预测算法的开销。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请实施例方法的架构图;
图2是本申请实施例方法的具体流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1为本发明方法的架构图,图2是本发明方法的具体流程图;
下面结合图1和图,介绍本发明的具体实施方式为一种基于双尺度设备运行状态预测的方法,包括以下具体步骤:
步骤1:设备的运行数据在一段时间T内为一个时间序列,读入数据中心设备运行所产生的时间序列数据,记为h(t),在此处导入的是设备的CPU利用率;
步骤2:对时间序列h(t)进行Ne次的经验模态分解:
其中,Ne是分解次数,yi(t)是第i次分解得到的固有模态函数,r(t)是残余序列;
步骤3:为了获得大尺度和小尺度的设备运行数据变化,求取最佳的分解次数,进而得到大尺度波动序列和小尺度波动序列。
第a次分解后剩余的低频序列为:
目标函数:
argmaxαa
αa=Sa(fm)*R(za(t),h(t))
其中,R(za(t),h(t))是za(t)与原序列h(t)的皮尔逊相关系数,反映za(t)与原序列的相似性,Sa(fm)表示将za(t)的频谱等分后,低频部分能量所占的比例,反应序列za(t)的平滑性。
皮尔逊相关系数R(za(t),h(t)):
Sa(fm)计算如下:
初始化分解次数am=1,以步长为1进行增加,直到am小于分解次数阈值A,依次计算αa,找到使其最大的分解次数am作为最佳分解次数;
选取第am次分解后剩余的低频序列作为大尺度波动序列:
小尺度波动序列:
步骤4:将大尺度波动序列中的各个时隙数据进行合并形成各个时段即大尺度设备运行状态序列。
大尺度波动序列经过时隙τ的平均运行数据变化为:
其中,Ss是取样数目。
初始化时段所包含的时隙数目Nlarge=1,以1为步长,依次带入δ(Nlarge),找到满足δ(Nlarge)≥Dt,δ(Nlarge-1)<Dt的Nlarge作为一个时段的长度;
Dt代表平均运行数据变化的阈值
步骤5:依据大尺度设备运行状态序列构建大尺度预测的训练集和测试集
训练向量及其标签为:
其中,n表示滑动窗口的长度,通过此滑动窗口对HL进行截取获得训练向量。经过截取后,得到训练集Y=[Sn,Sn+1,…,Su-v]
步骤6:预匹配筛除与测试向量差距较大的训练向量
求得训练向量和测试向量第n个元素的差距,若差距大于阈值Dh,则过滤掉此训练向量。
步骤7:使用滑动窗口k近邻预测方法进行大尺度预测
计算训练向量Si和Su间的距离:
最后,大尺度预测值为:
步骤8:使用AR预测模型进行小尺度预测
小尺度波动序列的预测采用AR模型:
通过最小二乘法计算AR模型的系数
步骤9:基于大尺度预测值和小尺度预测值计算下一个时刻的设备运行数据。
相较于现有技术,本发明提出一种数据中心设备运行数据双尺度预测方法。本发明通过基于经验模态分解,设计一种不完全分解策略,获得时间序列的大尺度波动序列和小尺度波动序列;在大尺度波动序列中,为了降低计算复杂度,预测设备运行数据长期变化趋势,构建大尺度设备运行状态序列,以时段为尺度对大尺度状态序列进行预测;通过使用滑动窗口k近邻预测方法和预匹配的方式进行大尺度预测;通过使用AR预测模型进行小尺度预测;最后基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (5)
1.一种数据中心设备运行数据双尺度预测方法,其特征在于,包括如下步骤:
步骤1:设备的运行数据在一段时间T内为一个时间序列,读入数据中心设备运行所产生的时间序列数据,记为h(t);
步骤2:依据经验模态分解,设计一种不完全分解策略,得到最优的分解次数,进而得到大尺度波动序列和小尺度波动序列;
步骤3:在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;
步骤4:使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;
步骤5:使用AR预测模型进行小尺度预测;
步骤6:基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。
2.根据权利要求1所述的一种数据中心设备运行数据双尺度预测方法,其特征在于,所述步骤2中为了获得设备运行数据的大尺度波动序列和小尺度波动序列,设计了一种不完全分解策略:
对于设备运行数据h(t),进行经验模态分解为:
其中,Ne是分解次数,yi(t)是第i次分解得到的固有模态函数,r(t)是残余序列,
每个子序列仅反映特定时间尺度变化,并且对所有子序列预测会导致计算复杂度过大,为了获得大尺度和小尺度的设备运行数据变化,将子序列合并成两部分,
第a次分解后剩余的低频序列为:
za(t)既需要反应大尺度变化、有一定的平滑性,又与原序列相似,因此构建目标函数:
argmaxαa
αa=Sa(fm)*R(za(t),h(t))
其中,R(za(t),h(t))是za(t)与原序列h(t)的皮尔逊相关系数,反映za(t)与原序列的相似性,Sa(fm)表示将za(t)的频谱等分后,低频部分能量所占的比例,反应序列za(t)的平滑性。找到使αa最大的分解次数am作为不完全分解次数,
皮尔逊相关系数R(za(t),h(t)):
Sa(fm)计算如下:
选取第am次分解后剩余的低频序列作为大尺度波动序列:
小尺度波动序列:
4.根据权利要求1所述的一种数据中心设备运行数据双尺度预测方法,其特征在于,所述步骤4中基于滑动窗口k近邻和预匹配机制的大尺度预测方法为:
训练向量及其标签为:
其中,n表示滑动窗口的长度,通过此滑动窗口对HL进行截取获得训练向量。经过截取后,得到训练集Y=[Sn,Sn+1,…,Su-v]
先进行预匹配筛除与测试向量差距较大的训练向量:
求得训练向量和测试向量第n个元素的差距,若差距大于阈值Dh,则过滤掉此训练向量。
计算预匹配后剩余的训练向量Si和Su间的距离:
最后,大尺度预测值为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211574534.6A CN116048910A (zh) | 2022-12-08 | 2022-12-08 | 一种数据中心设备运行数据双尺度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211574534.6A CN116048910A (zh) | 2022-12-08 | 2022-12-08 | 一种数据中心设备运行数据双尺度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116048910A true CN116048910A (zh) | 2023-05-02 |
Family
ID=86119079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211574534.6A Pending CN116048910A (zh) | 2022-12-08 | 2022-12-08 | 一种数据中心设备运行数据双尺度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116048910A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111027672A (zh) * | 2019-11-13 | 2020-04-17 | 浙江大学 | 一种基于交互式多尺度循环神经网络的时间序列预测方法 |
WO2020188637A1 (ja) * | 2019-03-15 | 2020-09-24 | 三菱電機株式会社 | 需要予測装置および需要予測方法 |
CN113836823A (zh) * | 2021-10-29 | 2021-12-24 | 武汉大学 | 一种基于负荷分解和优化双向长短期记忆网络的负荷组合预测方法 |
CN114168419A (zh) * | 2021-12-09 | 2022-03-11 | 同济大学 | 负载预测方法、系统、设备及计算机可读存储介质 |
-
2022
- 2022-12-08 CN CN202211574534.6A patent/CN116048910A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020188637A1 (ja) * | 2019-03-15 | 2020-09-24 | 三菱電機株式会社 | 需要予測装置および需要予測方法 |
CN111027672A (zh) * | 2019-11-13 | 2020-04-17 | 浙江大学 | 一种基于交互式多尺度循环神经网络的时间序列预测方法 |
CN113836823A (zh) * | 2021-10-29 | 2021-12-24 | 武汉大学 | 一种基于负荷分解和优化双向长短期记忆网络的负荷组合预测方法 |
CN114168419A (zh) * | 2021-12-09 | 2022-03-11 | 同济大学 | 负载预测方法、系统、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232480B (zh) | 利用变分的正则化流实现的项目推荐方法及模型训练方法 | |
US8341158B2 (en) | User's preference prediction from collective rating data | |
Reddi et al. | Stochastic negative mining for learning with large output spaces | |
US10387768B2 (en) | Enhanced restricted boltzmann machine with prognosibility regularization for prognostics and health assessment | |
Cao et al. | Tempo: Prompt-based generative pre-trained transformer for time series forecasting | |
CN106709588B (zh) | 预测模型构建方法和设备以及实时预测方法和设备 | |
KR20210017342A (ko) | 과거 데이터에 기초한 시계열 예측 방법 및 장치 | |
CN114399021A (zh) | 一种基于多尺度信息的概率风速预测方法和系统 | |
US20220012538A1 (en) | Compact representation and time series segment retrieval through deep learning | |
CN111753209A (zh) | 一种基于改进时序卷积网络的序列推荐列表生成方法 | |
Zhou et al. | Jump: A joint predictor for user click and dwell time | |
US8386249B2 (en) | Compressing feature space transforms | |
CN114663798A (zh) | 一种基于强化学习的单步视频内容识别方法 | |
CN115049113A (zh) | 基于时间窗口和超参数自适应选择的s2s电力负荷预测系统 | |
CN117237733A (zh) | 一种结合自监督和弱监督学习的乳腺癌全切片图像分类方法 | |
Henze et al. | Representation learning in power time series forecasting | |
CN117494898A (zh) | 一种结合注意力机制的时间序列预测方法 | |
CN116048910A (zh) | 一种数据中心设备运行数据双尺度预测方法 | |
CN116306606A (zh) | 一种基于增量学习的金融合同条款提取方法和系统 | |
Xu et al. | Dadu river runoff forecasting via Seq2Seq | |
CN111461416B (zh) | 风速预测方法、系统、电子设备及存储介质 | |
CN115544890A (zh) | 一种短期电力负荷预测方法及系统 | |
CN112865898A (zh) | 一种对抗式无线通信信道模型估计和预测方法 | |
CN117591662B (zh) | 基于人工智能的数字化企业服务数据挖掘方法及系统 | |
CN117292307B (zh) | 一种基于粗时间粒度的时序动作提名生成方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |