CN117171517B - 一种数据中心运营故障风险动态预警方法 - Google Patents

一种数据中心运营故障风险动态预警方法 Download PDF

Info

Publication number
CN117171517B
CN117171517B CN202311442989.7A CN202311442989A CN117171517B CN 117171517 B CN117171517 B CN 117171517B CN 202311442989 A CN202311442989 A CN 202311442989A CN 117171517 B CN117171517 B CN 117171517B
Authority
CN
China
Prior art keywords
data
outlier
reference temperature
temperature data
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311442989.7A
Other languages
English (en)
Other versions
CN117171517A (zh
Inventor
刘杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Shanghang Data Co ltd
Original Assignee
Wuxi Shanghang Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Shanghang Data Co ltd filed Critical Wuxi Shanghang Data Co ltd
Priority to CN202311442989.7A priority Critical patent/CN117171517B/zh
Publication of CN117171517A publication Critical patent/CN117171517A/zh
Application granted granted Critical
Publication of CN117171517B publication Critical patent/CN117171517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Temperature Or Quantity Of Heat (AREA)

Abstract

本发明涉及数据预测处理技术领域,具体涉及一种数据中心运营故障风险动态预警方法,该方法包括:获取数据中心对应的历史温度数据序列集合,对历史温度数据序列集合进行预处理;从参考温度数据序列集合中每个参考温度数据序列中筛选出极值数据和离群数据;确定每个离群数据对应的数据偏离度和目标离群度;根据每个离群数据对应的目标离群度,对每个离群数据进行修正;根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测;根据预测温度数据和获取的待预警温度数据,对预设时刻下的数据中心进行故障风险预警。本发明通过对历史温度数据序列集合进行数据处理,提高了温度预测的准确度和数据中心运营故障风险预警的准确度。

Description

一种数据中心运营故障风险动态预警方法
技术领域
本发明涉及数据预测处理技术领域,具体涉及一种数据中心运营故障风险动态预警方法。
背景技术
随着数字经济的飞速发展,数据中心作为大数据产业的核心设备,在规模和性能上都取得了长足的发展。总体来说数据中心是一个复杂且高度自动化的IT(InformationTechnology,信息技术)基础设施,用于集中存储、处理和管理数据。数据中心中通常需要放置大量的存储机柜、服务器、散热器等多种设备,所以为了数据中心的稳定运行,降低潜在风险在运营过程中通常需要对数据中心的故障风险进行动态检测。
由于数据中心中的设备通常是一天24小时不间断运行的,设备在运行过程中可能会产生热耦合导致数据中心的温度升高。过高的温度往往会影响设备的使用寿命,并且可能使其发生故障,所以往往需要采取全天候的制冷设备来对数据中心的温度进行调控。因此,在对数据中心进行故障风险检测的过程中,往往需要对数据中心的温度进行预测,其中,数据中心的温度数据为时间序列类型的数据。目前,对时间序列类型的数据进行预测时,通常采用的方式为:根据采集的历史数据,通过ARMA模型进行数据预测。
然而,当根据历史温度数据,通过ARMA模型进行温度预测时,经常会存在如下技术问题:
在过去时间段内采集的数据中心的历史温度数据中可能会包含一些由于设备产生热耦合或者液冷设备故障造成的异常温度数据,因此,直接基于历史温度数据,通过ARMA模型进行温度预测,可能导致预测结果出现偏差,从而导致温度预测的准确度较差,进而产生错误或延迟的预警,从而导致数据中心运营故障风险预警的准确度较低。
发明内容
本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
为了解决由于温度预测的准确度较差而导致的数据中心运营故障风险预警的准确度较低的技术问题,本发明提出了一种数据中心运营故障风险动态预警方法。
本发明提供了一种数据中心运营故障风险动态预警方法,该方法包括:
获取数据中心对应的历史温度数据序列集合,并对所述历史温度数据序列集合进行预处理,得到参考温度数据序列集合;
从所述参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将所述参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据;
根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度;
根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度;
根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据;
根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测,得到预设时刻对应的预测温度数据;
获取预设时刻下的数据中心对应的待预警温度数据,根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警。
可选地,所述从所述参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,包括:
对所述参考温度数据序列中的参考温度数据进行曲线拟合,得到温度变化曲线,其中,温度变化曲线的横坐标为采集时刻,温度变化曲线的纵坐标为参考温度数据;
将所述温度变化曲线中的每个极值,确定为极值数据;
通过K-means聚类算法,从所述参考温度数据序列中筛选出离群数据。
可选地,所述根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度,包括:
从与所述离群数据相邻的极值数据中筛选出采集时刻最早的极值数据,作为所述离群数据对应的候选数据;
根据所述离群数据对应的候选数据,确定所述离群数据对应的数据偏离度。
可选地,离群数据对应的数据偏离度对应的公式为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据偏离度;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的变化速率;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的采集时刻;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据对应的采集时刻。
可选地,所述根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度,包括:
根据在所有参考温度数据序列中与所述离群数据相同位置处的所有参考温度数据,构建所述离群数据对应的温度折线图,其中,温度折线图的横坐标为采集时刻,温度折线图的纵坐标为参考温度数据;
根据所述温度折线图中线段的斜率,确定所述离群数据对应的数据离群程度;
根据所述离群数据对应的数据偏离度和数据离群程度,确定所述离群数据对应的目标离群度。
可选地,离群数据对应的数据离群程度对应的公式为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据离群程度;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的分散程度;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处的所有参考温度数据的数量;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的线段的斜率;参考温度数据对应的线段是温度折线图中以该参考温度数据对应的坐标点为终端点的线段;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据对应的线段的斜率;/>是取绝对值函数;a是第i个参考温度数据序列中第j个离群数据相同位置处的参考温度数据的序号;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的温度偏差;/>是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最大的参考温度数据;/>是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最小的参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a-1个参考温度数据;/>是预先设置的大于0的因子。
可选地,所述离群数据对应的数据偏离度和数据离群程度均与其对应的目标离群度呈正相关。
可选地,离群数据对应的目标离群度与其对应的修正数据呈正相关。
可选地,离群数据对应的修正数据对应的公式为:
;/>;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的修正数据;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的调整程度;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据均值;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的目标离群度;m是参考温度数据序列集合中除了离群数据之外的参考温度数据的数量;/>是参考温度数据序列集合中除了离群数据之外的第d个参考温度数据;d是参考温度数据序列集合中除了离群数据之外的参考温度数据的序号。
可选地,所述根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警,包括:
将所述待预警温度数据与所述预测温度数据的差值的绝对值,确定为待预警差异;
当所述待预警差异大于预设差异阈值时,判定预设时刻下的数据中心存在故障风险,发送故障风险预警信息。
本发明具有如下有益效果:
本发明的一种数据中心运营故障风险动态预警方法,通过对历史温度数据序列集合进行数据处理,解决了由于温度预测的准确度较差而导致的数据中心运营故障风险预警的准确度较低的技术问题,提高了温度预测的准确度和数据中心运营故障风险预警的准确度。首先,由于数据预测时往往需要采集历史数据,因此获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,可以便于后续进行温度预测。接着,由于极值数据可以表征参考温度数据的变化情况,因此基于与每个离群数据相邻的极值数据,可以量化每个离群数据对应的数据偏离度。然后,综合考虑每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,可以提高每个离群数据对应的目标离群度确定的准确度。再者,由于离群数据往往可能是发生了异常的温度数据,并且当目标离群度越大,往往说明其对应的离群数据的异常程度往往越大,因此,基于每个离群数据对应的目标离群度,对每个离群数据进行修正,可以提高每个离群数据对应的修正数据确定的准确度。之后,基于所有目标温度数据和所有修正数据,采用ARMA模型进行预测,可以得到相对比较准确的预测温度数据,预测温度数据往往更加可以表示为当数据中心在预设时刻未发生故障时的温度。最后,基于预测温度数据和获取的待预警温度数据,对预设时刻下的数据中心进行故障风险预警,实现了对数据中心运营的故障风险预警,并且本发明综合考虑了多个与温度异常相关的指标,比如,数据偏离度和目标离群度等,量化了每个离群数据的异常偏离情况,使得后续对每个离群数据的修正更加准确。其次,相较于直接基于历史温度数据序列集合,采用ARMA模型进行预测,本发明对每个可能为异常温度的离群数据进行了修正,基于所有目标温度数据和所有修正数据,采用ARMA模型进行预测,在一定程度上提高了温度预测的准确度,从而提高了数据中心运营故障风险预警的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明的一种数据中心运营故障风险动态预警方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
一种数据中心运营故障风险动态预警方法实施例:
本发明提供了一种数据中心运营故障风险动态预警方法,该方法包括以下步骤:
获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,得到参考温度数据序列集合;
从参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据;
根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度;
根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度;
根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据;
根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测,得到预设时刻对应的预测温度数据;
获取预设时刻下的数据中心对应的待预警温度数据,根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警。
下面对上述各个步骤进行详细展开:
参考图1,示出了根据本发明的一种数据中心运营故障风险动态预警方法的一些实施例的流程。该数据中心运营故障风险动态预警方法,包括以下步骤:
步骤S1,获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,得到参考温度数据序列集合。
在一些实施例中,可以获取数据中心对应的历史温度数据序列集合,并对上述历史温度数据序列集合进行预处理,得到参考温度数据序列集合。
其中,历史温度数据序列集合中的历史温度数据可以是在历史时间段内采集的数据中心的温度。数据中心的温度往往大于0。历史时间段可以是过去的一段时间。各个历史温度数据序列对应的时长可以相等。历史温度数据序列可以是时序数据。每相邻两个历史温度数据之间的时间间隔可以相同。预处理可以是最近邻插值。参考温度数据序列集合中的参考温度数据可以是进行预处理后的历史温度数据。
需要说明的是,由于数据预测时往往需要采集历史数据,因此获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,可以便于后续进行温度预测。
作为示例,本步骤可以包括以下步骤:
第一步,获取数据中心对应的历史温度数据序列集合。
例如,若历史温度数据序列对应的时长为1天,历史温度数据序列集合对应的时长为1个月,则可以通过温度传感器,采集历史一个月内的数据中心的温度,并将采集的每个数据中心温度,作为历史温度数据,并将每天采集的历史温度数据组合为历史温度数据序列,将所有历史温度数据序列组合为历史温度数据序列集合。
第二步,对上述历史温度数据序列集合进行预处理,得到参考温度数据序列集合。
例如,可以对历史温度数据序列集合中的每个历史温度数据序列进行最近邻插值,并将进行最近邻插值后的每个历史温度数据序列,作为参考温度数据序列,得到参考温度数据序列集合。
步骤S2,从参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据。
在一些实施例中,可以从上述参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将上述参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据。
需要说明的是,由于极值数据可以表征参考温度数据的变化情况,离群数据往往可能是发生了异常的温度数据,因此筛选出极值数据和离群数据,可以便于后续对每个离群数据进行修正。
作为示例,本步骤可以包括以下步骤:
第一步,对上述参考温度数据序列中的参考温度数据进行曲线拟合,得到温度变化曲线。
其中,温度变化曲线的横坐标可以为采集时刻。温度变化曲线的纵坐标可以为参考温度数据。可以通过多项式拟合实现曲线拟合。
例如,可以对参考温度数据序列中的参考温度数据进行多项式拟合,并将拟合得到的曲线作为温度变化曲线。
第二步,将上述温度变化曲线中的每个极值,确定为极值数据。
第三步,通过K-means聚类算法,从上述参考温度数据序列中筛选出离群数据。
其中,K-means聚类算法又称K均值聚类算法。离群数据又称离群点。
第四步,将上述参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据。
步骤S3,根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度。
在一些实施例中,可以根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度。
其中,与离群数据相邻的极值数据可以有两个。与离群数据相邻的两个极值数据对应的获取方法可以为:从所有极值数据中筛选出采集时刻在该离群数据的采集时刻之前,并且与该离群数据之间的时间间隔最短的极值数据,作为与该离群数据相邻的一个极值数据;从所有极值数据中筛选出采集时刻在该离群数据的采集时刻之后,并且与该离群数据之间的时间间隔最短的极值数据,作为与该离群数据相邻的另一个极值数据。
需要说明的是,由于极值数据可以表征参考温度数据的变化情况,因此基于与每个离群数据相邻的极值数据,可以量化每个离群数据对应的数据偏离度。
作为示例,本步骤可以包括以下步骤:
第一步,从与上述离群数据相邻的极值数据中筛选出采集时刻最早的极值数据,作为上述离群数据对应的候选数据。
第二步,根据上述离群数据对应的候选数据,确定上述离群数据对应的数据偏离度对应的公式可以为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据偏离度。i是参考温度数据序列集合中参考温度数据序列的序号。j是第i个参考温度数据序列中离群数据的序号,可以是按照采集时刻从早到晚的时间顺序进行排列得到的序号。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的变化速率。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的采集时刻。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据对应的采集时刻。
需要说明的是,当为负值时,往往说明第j个离群数据可能是低温数据,同理,当/>为正值时,往往说明第j个离群数据可能是高温数据。当/>为正值,并且其值越大时,往往说明第j个离群数据的变化速率越大。当/>为负值,并且其值越小时,往往说明第j个离群数据的变化速率越大。当/>越大时,往往说明第j个离群数据的相对偏离程度越大,往往说明第j个离群数据的异常程度越大,往往说明第j个离群数据需要被修正的程度越大。一般情况下,在正常运行过程中,数据中心的温度往往相对比较稳定,因此,当/>越大时,往往说明第j个离群数据的相对偏离程度越大,并且变化速率越大,往往说明相对越不稳定,往往说明第j个离群数据的异常程度越大,往往说明第j个离群数据需要被修正的程度越大。
步骤S4,根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度。
在一些实施例中,可以根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度。
其中,与离群数据相同位置处的参考温度数据可以是在所有参考温度数据序列中与该离群数据相同序号的参考温度数据。例如,若上述参考温度数据序列对应的时长为1天,某个离群数据对应的采集时刻为2023年10月08日10时49分26秒,则与该离群数据相同位置处的所有参考温度数据可以包括:每个参考温度数据序列中采集时刻为10时49分26秒的参考温度数据。
需要说明的是,综合考虑每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,可以提高每个离群数据对应的目标离群度确定的准确度。其次,由于各个历史温度数据序列对应的时长可以相等,历史温度数据序列可以是时序数据,并且每相邻两个历史温度数据之间的时间间隔可以相同,所以各个参考温度数据序列对应的时长可以相等,参考温度数据序列可以是时序数据,并且每相邻两个参考温度数据之间的时间间隔可以相同,因此采集时刻为10时49分26秒的参考温度数据在各自所属参考温度数据序列中的序号可以相同。
作为示例,本步骤可以包括以下步骤:
第一步,根据在所有参考温度数据序列中与上述离群数据相同位置处的所有参考温度数据,构建上述离群数据对应的温度折线图。
其中,温度折线图的横坐标为采集时刻,温度折线图的纵坐标为参考温度数据。
例如,可以根据在所有参考温度数据序列中与某个离群数据相同位置处的所有参考温度数据,以采集时刻为横坐标,以参考温度数据为纵坐标,作折线图,并将得到的折线图作为该离群数据对应的温度折线图。
第二步,根据上述温度折线图中线段的斜率,确定上述离群数据对应的数据离群程度对应的公式可以为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据离群程度。i是参考温度数据序列集合中参考温度数据序列的序号。j是第i个参考温度数据序列中离群数据的序号。是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的分散程度。是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处的所有参考温度数据的数量。/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的线段的斜率。参考温度数据对应的线段是温度折线图中以该参考温度数据对应的坐标点为终端点的线段。参考温度数据对应的线段的起始端点可以是参考温度数据的前一个参考温度数据对应的坐标点。是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据对应的线段的斜率。/>是取绝对值函数。a是第i个参考温度数据序列中第j个离群数据相同位置处的参考温度数据的序号,可以是按照采集时刻从早到晚的时间顺序进行排列得到的序号。/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的温度偏差。/>是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最大的参考温度数据。/>是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最小的参考温度数据。是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据。/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据。/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a-1个参考温度数据。/>是预先设置的大于0的因子,主要用于防止分母为0,例如,/>可以为0.01。
需要说明的是,一般情况下,在正常运行过程中,数据中心的温度往往相对比较稳定。当越大时,往往说明温度折线图中的温度变化越大,往往说明温度折线图中温度的分散程度越大,往往说明越不稳定,往往说明在第j个离群数据相同位置处越可能经常发生温度突变,往往说明第j个离群数据的发生异常的可能性越大,往往说明第j个离群数据需要被修正的程度越大。当/>越大时,往往说明温度折线图中线段斜率的变化程度越大,往往说明在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处的参考温度数据之间的变化程度越大。当/>越大时,往往说明第a个参考温度数据与相邻参考温度数据之间的差异越大,往往说明第a个参考温度数据越可能发生了异常,往往说明第a个参考温度数据对第j个离群数据的重要性越低。所以/>可以表示对/>的修正,因此当越大时,往往说明第j个离群数据对应的温度折线图中的温度异常离散程度越大,往往说明越不稳定,往往说明在第j个离群数据相同位置处越可能经常发生温度突变,往往说明第j个离群数据的发生异常的可能性越大,往往说明第j个离群数据需要被修正的程度越大。因此,当/>越大时,往往说明在第j个离群数据相同位置处越可能经常发生温度突变,往往说明第j个离群数据的发生异常的可能性越大,往往说明第j个离群数据需要被修正的程度越大。
第三步,根据上述离群数据对应的数据偏离度和数据离群程度,确定上述离群数据对应的目标离群度。
其中,上述离群数据对应的数据偏离度和数据离群程度均可以与其对应的目标离群度呈正相关。
例如,确定离群数据对应的目标离群度对应的公式可以为:
;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的目标离群度。i是参考温度数据序列集合中参考温度数据序列的序号。j是第i个参考温度数据序列中离群数据的序号。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据偏离度。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据离群程度。
需要说明的是,当越大时,往往说明第j个离群数据的相对偏离程度越大,并且变化速率越大,往往说明第j个离群数据的异常程度越大,往往说明第j个离群数据需要被修正的程度越大。当/>越大时,往往说明在第j个离群数据相同位置处越可能经常发生温度突变,往往说明第j个离群数据的发生异常的可能性越大,往往说明第j个离群数据需要被修正的程度越大。因此,当/>越大时,往往说明第j个离群数据需要被修正的程度越大。
步骤S5,根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据。
在一些实施例中,可以根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据。
其中,离群数据对应的目标离群度可以与其对应的修正数据呈正相关。
需要说明的是,由于离群数据往往可能是发生了异常的温度数据,并且当目标离群度越大,往往说明其对应的离群数据的异常程度往往越大,因此,基于每个离群数据对应的目标离群度,对每个离群数据进行修正,可以提高每个离群数据对应的修正数据确定的准确度。
作为示例,离群数据对应的修正数据对应的公式可以为:
;/>;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的修正数据。i是参考温度数据序列集合中参考温度数据序列的序号。j是第i个参考温度数据序列中离群数据的序号。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的调整程度。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据均值。/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的目标离群度。m是参考温度数据序列集合中除了离群数据之外的参考温度数据的数量。/>是参考温度数据序列集合中除了离群数据之外的第d个参考温度数据。d是参考温度数据序列集合中除了离群数据之外的参考温度数据的序号。
需要说明的是,由于当越大时,往往说明第j个离群数据需要被修正的程度越大,所以当/>越大时,往往说明第j个离群数据需要被修正的程度越大。由于/>表示相对未发生异常的参考温度数据的均值。当/>为负值,并且其值越小时,往往说明第j个离群数据越可能是高温异常点,往往说明第j个离群数据需要被降温修正的程度越大。当为正值,并且其值越大时,往往说明第j个离群数据越可能是低温异常点,往往说明第j个离群数据需要被升温修正的程度越大。因此/>可以表示第j个离群数据进行修正后的温度。
步骤S6,根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测,得到预设时刻对应的预测温度数据。
在一些实施例中,可以根据所有目标温度数据和所有修正数据,采用ARMA(Auto-Regressive Moving Average,自回归滑动平均)模型进行预测,得到预设时刻对应的预测温度数据。
其中,预设时刻可以是预先设置的需要进行温度预警判断的时刻。预设时刻可以是历史时间段的结束时刻的下一个时刻。预设时刻对应的预测温度数据可以是预测的当数据中心在预设时刻未发生故障时的温度。
需要说明的是,基于所有目标温度数据和所有修正数据,采用ARMA模型进行预测,可以得到相对比较准确的预测温度数据,预测温度数据往往更加可以表示为当数据中心在预设时刻未发生故障时的温度。
作为示例,可以根据所有目标温度数据和所有修正数据,采用ARMA模型,对数据中心在预设时刻下的温度进行预测,并将预测得到的温度,作为预测温度数据。
步骤S7,获取预设时刻下的数据中心对应的待预警温度数据,根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警。
在一些实施例中,可以获取预设时刻下的数据中心对应的待预警温度数据,根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警,实现了对数据中心运营的故障风险预警。
作为示例,本步骤可以包括以下步骤:
第一步,获取数据中心在预设时刻下的温度数据,作为待预警温度数据。
例如,可以通过温度传感器,采集数据中心在预设时刻下的温度,作为待预警温度数据。
第二步,将上述待预警温度数据与上述预测温度数据的差值的绝对值,确定为待预警差异。
第三步,当上述待预警差异大于预设差异阈值时,判定预设时刻下的数据中心存在故障风险,发送故障风险预警信息。
其中,预设差异阈值可以是预先设置的阈值。例如,预设差异阈值可以是5。故障风险预警信息可以表征数据中心在预设时刻下存在故障风险。例如,故障风险预警信息可以是“数据中心在该时刻下可能发生了故障,建议对数据中心进行检查”。
例如,当上述待预警差异大于预设差异阈值时,可以判定数据中心在预设时刻下的温度异常,往往说明预设时刻下的数据中心存在故障风险,并且很可能已经发生了故障,此时发送表征数据中心在预设时刻下存在故障风险的故障风险预警信息,以实现温度异常预警。
需要说明的是,当上述待预警差异大于预设差异阈值,并且待预警温度数据大于预测温度数据时,往往说明数据中心可能在预设时刻下发生了高温异常,此时制冷设备可能发生了故障,比如不再制冷。当上述待预警差异大于预设差异阈值,并且待预警温度数据小于预测温度数据时,往往说明数据中心可能在预设时刻下发生了低温异常,此时可能需要适当调小制冷强度或关闭制冷设备。
综上,本发明综合考虑了多个与温度异常相关的指标,比如,数据偏离度和目标离群度等,量化了每个离群数据的异常偏离情况,使得后续对每个离群数据的修正更加准确。其次,相较于直接基于历史温度数据序列集合,采用ARMA模型进行预测,本发明对每个可能为异常温度的离群数据进行了修正,基于所有目标温度数据和所有修正数据,采用ARMA模型进行预测,在一定程度上提高了温度预测的准确度,在一定程度上避免了由于温度预测的不准确而导致的预警结果的延迟或不准确,从而提高了数据中心运营故障风险预警的准确度。
至此,本发明完成。
一种数据中心的温度数据预测方法实施例:
随着数字经济的飞速发展,数据中心作为大数据产业的核心设备,在规模和性能上都取得了长足的发展。由于数据中心中的设备通常是一天24小时不间断运行的,设备在运行过程中可能会产生热耦合导致数据中心的温度升高。过高的温度往往会影响设备的使用寿命,因此,往往需要对数据中心的温度进行预测,其中,数据中心的温度数据为时间序列类型的数据。目前,对时间序列类型的数据进行预测时,通常采用的方式为:根据采集的历史数据,通过ARMA模型进行数据预测。
然而,当根据历史温度数据,通过ARMA模型进行温度预测时,经常会存在如下技术问题:
在过去时间段内采集的数据中心的历史温度数据中可能会包含一些由于设备产生热耦合或者液冷设备故障造成的异常温度数据,因此,直接基于历史温度数据,通过ARMA模型进行温度预测,可能导致预测结果出现偏差,从而导致温度预测的准确度较差。
为了解决温度预测的准确度较差的技术问题,本发明的目的在于提供一种数据中心的温度数据预测方法,所采用的技术方案具体如下:
步骤S1,获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,得到参考温度数据序列集合。
步骤S2,从参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据。
步骤S3,根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度。
步骤S4,根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度。
步骤S5,根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据。
步骤S6,根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测,得到预设时刻对应的预测温度数据。
本发明实施例提供的一种数据中心的温度数据预测方法具有如下技术效果:
本发明通过对历史温度数据序列集合进行数据处理,解决了温度预测的准确度较差的技术问题,提高了温度预测的准确度。首先,由于数据预测时往往需要采集历史数据,因此获取数据中心对应的历史温度数据序列集合,并对历史温度数据序列集合进行预处理,可以便于后续进行温度预测。接着,由于极值数据可以表征参考温度数据的变化情况,因此基于与每个离群数据相邻的极值数据,可以量化每个离群数据对应的数据偏离度。然后,综合考虑每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,可以提高每个离群数据对应的目标离群度确定的准确度。再者,由于离群数据往往可能是发生了异常的温度数据,并且当目标离群度越大,往往说明其对应的离群数据的异常程度往往越大,因此,基于每个离群数据对应的目标离群度,对每个离群数据进行修正,可以提高每个离群数据对应的修正数据确定的准确度。最后,基于所有目标温度数据和所有修正数据,采用ARMA模型进行预测,可以得到相对比较准确的预测温度数据,实现了对温度数据的预测,并且本发明综合考虑了多个与温度异常相关的指标,比如,数据偏离度和目标离群度等,量化了每个离群数据的异常偏离情况,使得后续对每个离群数据的修正更加准确。其次,相较于直接基于历史温度数据序列集合,采用ARMA模型进行预测,本发明对每个可能为异常温度的离群数据进行了修正,通过所有目标温度数据和所有修正数据,采用ARMA模型进行预测,在一定程度上提高了温度预测的准确度。
其中,步骤S1-S6在上述一种数据中心运营故障风险动态预警方法实施例中已给出了详细说明,不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,均应包含在本发明的保护范围之内。

Claims (3)

1.一种数据中心运营故障风险动态预警方法,其特征在于,包括以下步骤:
获取数据中心对应的历史温度数据序列集合,并对所述历史温度数据序列集合进行预处理,得到参考温度数据序列集合;
从所述参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,并将所述参考温度数据序列集合中除了离群数据之外的每个参考温度数据,确定为目标温度数据;
根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度;
根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度;
根据每个离群数据对应的目标离群度,对每个离群数据进行修正,得到每个离群数据对应的修正数据;
根据所有目标温度数据和所有修正数据,采用ARMA模型进行预测,得到预设时刻对应的预测温度数据;
获取预设时刻下的数据中心对应的待预警温度数据,根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警;
所述根据与每个离群数据相邻的极值数据,确定每个离群数据对应的数据偏离度,包括:
从与所述离群数据相邻的极值数据中筛选出采集时刻最早的极值数据,作为所述离群数据对应的候选数据;
根据所述离群数据对应的候选数据,确定所述离群数据对应的数据偏离度;
离群数据对应的数据偏离度对应的公式为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据偏离度;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的变化速率;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的采集时刻;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的候选数据对应的采集时刻;
所述根据每个离群数据对应的数据偏离度,以及在所有参考温度数据序列中与每个离群数据相同位置处的所有参考温度数据,确定每个离群数据对应的目标离群度,包括:
根据在所有参考温度数据序列中与所述离群数据相同位置处的所有参考温度数据,构建所述离群数据对应的温度折线图,其中,温度折线图的横坐标为采集时刻,温度折线图的纵坐标为参考温度数据;
根据所述温度折线图中线段的斜率,确定所述离群数据对应的数据离群程度;
根据所述离群数据对应的数据偏离度和数据离群程度,确定所述离群数据对应的目标离群度;
离群数据对应的数据离群程度对应的公式为:
;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据离群程度;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的分散程度;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处的所有参考温度数据的数量;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的线段的斜率;参考温度数据对应的线段是温度折线图中以该参考温度数据对应的坐标点为终端点的线段;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据对应的线段的斜率;/>是取绝对值函数;a是第i个参考温度数据序列中第j个离群数据相同位置处的参考温度数据的序号;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据对应的温度偏差;是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最大的参考温度数据;/>是第i个参考温度数据序列中第j个离群数据对应的温度折线图中最小的参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a+1个参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a个参考温度数据;/>是在所有参考温度数据序列中,与第i个参考温度数据序列中第j个离群数据相同位置处,第a-1个参考温度数据;/>是预先设置的大于0的因子;
所述离群数据对应的数据偏离度和数据离群程度均与其对应的目标离群度呈正相关;
离群数据对应的目标离群度与其对应的修正数据呈正相关;
离群数据对应的修正数据对应的公式为:
;/>;/>;其中,/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的修正数据;i是参考温度数据序列集合中参考温度数据序列的序号;j是第i个参考温度数据序列中离群数据的序号;是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的调整程度;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的数据均值;/>是参考温度数据序列集合中第i个参考温度数据序列中第j个离群数据对应的目标离群度;m是参考温度数据序列集合中除了离群数据之外的参考温度数据的数量;/>是参考温度数据序列集合中除了离群数据之外的第d个参考温度数据;d是参考温度数据序列集合中除了离群数据之外的参考温度数据的序号。
2.根据权利要求1所述的一种数据中心运营故障风险动态预警方法,其特征在于,所述从所述参考温度数据序列集合中的每个参考温度数据序列中筛选出极值数据和离群数据,包括:
对所述参考温度数据序列中的参考温度数据进行曲线拟合,得到温度变化曲线,其中,温度变化曲线的横坐标为采集时刻,温度变化曲线的纵坐标为参考温度数据;
将所述温度变化曲线中的每个极值,确定为极值数据;
通过K-means聚类算法,从所述参考温度数据序列中筛选出离群数据。
3.根据权利要求1所述的一种数据中心运营故障风险动态预警方法,其特征在于,所述根据预测温度数据和待预警温度数据,对预设时刻下的数据中心进行故障风险预警,包括:
将所述待预警温度数据与所述预测温度数据的差值的绝对值,确定为待预警差异;
当所述待预警差异大于预设差异阈值时,判定预设时刻下的数据中心存在故障风险,发送故障风险预警信息。
CN202311442989.7A 2023-11-02 2023-11-02 一种数据中心运营故障风险动态预警方法 Active CN117171517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311442989.7A CN117171517B (zh) 2023-11-02 2023-11-02 一种数据中心运营故障风险动态预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311442989.7A CN117171517B (zh) 2023-11-02 2023-11-02 一种数据中心运营故障风险动态预警方法

Publications (2)

Publication Number Publication Date
CN117171517A CN117171517A (zh) 2023-12-05
CN117171517B true CN117171517B (zh) 2024-01-26

Family

ID=88937816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311442989.7A Active CN117171517B (zh) 2023-11-02 2023-11-02 一种数据中心运营故障风险动态预警方法

Country Status (1)

Country Link
CN (1) CN117171517B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108827643A (zh) * 2018-06-21 2018-11-16 哈尔滨工业大学 一种考虑排温温度场旋转的燃气轮机高温部件故障预警方法
CN109491289A (zh) * 2018-11-15 2019-03-19 国家计算机网络与信息安全管理中心 一种用于数据中心动力环境监控的动态预警方法及装置
CN109949550A (zh) * 2019-02-28 2019-06-28 成都派沃特科技股份有限公司 分布式数据中心设备状态的云监控系统
CN111882833A (zh) * 2020-07-21 2020-11-03 华润电力唐山丰润有限公司 基于离群参数的设备故障预警方法、装置、设备及介质
CN112232366A (zh) * 2020-09-09 2021-01-15 国网上海市电力公司 一种基于rfid监测的电气设备故障预警方法及系统
CN116955091A (zh) * 2023-09-20 2023-10-27 深圳市互盟科技股份有限公司 基于机器学习的数据中心故障检测系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108827643A (zh) * 2018-06-21 2018-11-16 哈尔滨工业大学 一种考虑排温温度场旋转的燃气轮机高温部件故障预警方法
CN109491289A (zh) * 2018-11-15 2019-03-19 国家计算机网络与信息安全管理中心 一种用于数据中心动力环境监控的动态预警方法及装置
CN109949550A (zh) * 2019-02-28 2019-06-28 成都派沃特科技股份有限公司 分布式数据中心设备状态的云监控系统
CN111882833A (zh) * 2020-07-21 2020-11-03 华润电力唐山丰润有限公司 基于离群参数的设备故障预警方法、装置、设备及介质
CN112232366A (zh) * 2020-09-09 2021-01-15 国网上海市电力公司 一种基于rfid监测的电气设备故障预警方法及系统
CN116955091A (zh) * 2023-09-20 2023-10-27 深圳市互盟科技股份有限公司 基于机器学习的数据中心故障检测系统

Also Published As

Publication number Publication date
CN117171517A (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
US10877863B2 (en) Automatic prediction system for server failure and method of automatically predicting server failure
KR101713985B1 (ko) 예지 정비 방법 및 장치
CN110874674B (zh) 一种异常检测方法、装置及设备
CN113383282A (zh) 校正离子注入半导体制造工具中的部件故障
CN117193164B (zh) 一种数控机床的故障监测方法及系统
CN112188531A (zh) 异常检测方法、装置、电子设备及计算机存储介质
CN113590429B (zh) 一种服务器故障诊断方法、装置及电子设备
CN107104848B (zh) 信息技术系统监控方法及装置
CN116772285B (zh) 一种智能楼宇供暖负载安全实时监控方法
JP2005180997A (ja) プラント保全管理方法および保全管理装置
CN102930178B (zh) 一种负荷数据异常检测方法
US20230034061A1 (en) Method for managing proper operation of base station and system applying the method
CN115796610A (zh) 一种支管成型系统运行综合监测方法、系统及存储介质
CN117171517B (zh) 一种数据中心运营故障风险动态预警方法
CN111176226A (zh) 一种基于运行工况的设备特征参数报警阈值自动分析方法
Maqbool et al. An efficient fault-prediction mechanism for improving yield in industry 5.0
RU2703874C1 (ru) Способ контроля и прогнозирования работы газотурбинной установки с использованием матрицы дефектов
JP2022540407A (ja) 診断回路を有する真空システム及びそのような真空システムの健全性をモニタする方法及びコンピュータプログラム
CN117131391A (zh) 基于智慧能源平台的企业能耗分析与告警方法
CN108920310B (zh) 接口数据的异常值检测方法及系统
CN113806615B (zh) 一种智能it运维系统的kpi异常预警方法
CN113221324B (zh) 停车场设备的生命周期预测方法及系统
CN115901004A (zh) 一种热镀锌生产线锌锅感应加热器健康监测系统及方法
CN118017504B (zh) 一种变电站gis调节方法及系统
CN118242633B (zh) 一种锅炉炉外承压部件应力强度在线监控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant