CN113238714A - 基于历史监测数据的磁盘容量预测方法及系统、存储介质 - Google Patents

基于历史监测数据的磁盘容量预测方法及系统、存储介质 Download PDF

Info

Publication number
CN113238714A
CN113238714A CN202110591054.XA CN202110591054A CN113238714A CN 113238714 A CN113238714 A CN 113238714A CN 202110591054 A CN202110591054 A CN 202110591054A CN 113238714 A CN113238714 A CN 113238714A
Authority
CN
China
Prior art keywords
disk
data
capacity
time
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110591054.XA
Other languages
English (en)
Inventor
王妙玉
周亮
黄宇航
吴宁泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Hotata Smart Home Co Ltd
Original Assignee
Guangdong Hotata Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Hotata Smart Home Co Ltd filed Critical Guangdong Hotata Smart Home Co Ltd
Priority to CN202110591054.XA priority Critical patent/CN113238714A/zh
Publication of CN113238714A publication Critical patent/CN113238714A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0652Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于历史监测数据的磁盘容量预测方法及系统、存储介质,所述方法包括:获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;根据所述样本数据,得到第一时间序列数据;构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;根据所述第二时间序列数据,得到未来时间点磁盘的使用容量信息。本发明通过构建自回归滑动平均模型进行预测,有效监控到磁盘容量的使用状态,可使磁盘的利用率最大化,降低因磁盘容量不够带来的风险和资源浪费。

Description

基于历史监测数据的磁盘容量预测方法及系统、存储介质
技术领域
本发明涉及磁盘监控技术领域,具体涉及一种基于历史监测数据的磁盘容量预测方法及系统、存储介质。
背景技术
随着互联网大数据的飞速发展,大规模的数据中心越来越成为现代社会发展的需要。国内外的互联网供应商都会关注自身服务集群整体的磁盘容量。通过对磁盘容量的监控,可以在合适的时间对磁盘容量进行增加或者缩减,进而可以节省大量成本,带来巨大的经济效益。
传统的磁盘监控方式通常是在磁盘已经接近装满时,才发出预警,不能够有效监控到磁盘的使用状态,往往造成某些磁盘长时间空闲、而另一些磁盘资源耗费殆尽,无法实现对磁盘容量的充分利用,使整个数据中心的存储无法真正达到最充分、合理的使用,从而拉高了磁盘的使用成本,并造成资源的浪费。
发明内容
鉴于以上技术问题,本发明的目的在于提供一种基于历史监测数据的磁盘容量预测方法及存储介质,解决传统的磁盘监控方式不能有效监控到磁盘容量的使用状态,造成无法充分合理使用磁盘的问题。
本发明采用以下技术方案:
第一方面,本发明实施例公开了一种基于历史监测数据的磁盘容量预测方法,包括以下步骤:
获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
根据所述第二时间序列数据,得到未来时间点磁盘的使用容量信息。
可选的,所述根据所述样本数据,得到第一时间序列数据,包括:
对所述样本数据进行预处理,对预处理后的样本数据进行属性合并,得到第一时间序列;所述预处理后的样本数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;所述属性合并包括将磁盘使用容量信息和时间点信息组成时间序列数据。
可选的,所述对所述样本数据进行预处理,包括:
对所述样本数据进行周期性分析和数据清洗。
可选的,所述周期性分析包括:
从磁盘容量使用情况的数据源中,选取若干个时间点,其中,各个时间点之间相隔预定的时间长度;获取所述各个时间点关联的磁盘使用容量信息;将所述若干个时间点和所述各个时间点关联的磁盘使用容量信息组成时序图,分析所述时序图的平稳性。
可选的,所述获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据,包括:
从磁盘容量的历史使用情况的数据源中选择性抽取数据,作为磁盘容量使用情况的样本数据。
可选的,所述根据所述第二时间序列,得到未来时间点磁盘的使用容量信息步骤之后,还包括:
获取磁盘的总容量;根据未来某时间点磁盘的使用容量信息和磁盘的总容量信息,得到未来某时间点磁盘的使用率;
在未来某时间点磁盘的使用率大于预设阈值时,进行预警。
可选的,所述根据所述第二时间序列,得到未来时间点磁盘的使用容量信息步骤之前,还包括:
调整自回归滑动平均模型;
通过调整后的回归滑动平均模型进行时序预测;
所述调整自回归滑动平均模型包括:
每隔设定时间,调整自回归滑动平均模型的建模样本,根据调整后的建模样本,重新构建自回归滑动平均模型;
可选的,所述构建自回归滑动平均模型步骤之后,所述调整自回归滑动平均模型步骤之前,还包括:
根据所述样本数据,得到第三时间序列数据;将所述第三时间序列数据作为验证样本,对构建的自回归滑动平均模型进行验证。
第二方面,本发明实施例公开了一种基于历史监测数据的磁盘容量预测系统,包括:
样本获取单元,用于获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
第一时间序列形成单元,用于根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
模型构建单元,用于构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
预测单元,用于通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
容量匹配单元,用于根据所述第二时间序列,得到未来某时间点磁盘的使用容量信息。
第三方面,本发明实施例公开了一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现所述的基于历史监测数据的磁盘容量预测方法。
相比现有技术,本发明的有益效果在于:
本发明通过获取磁盘容量使用情况的数据源,得到第一时间序列数据,通过构建自回归滑动平均模型进行预测,可预测磁盘未来的负载情况,可有效监控到磁盘容量的使用状态,避免应用系统因出现存储容量耗尽的情况而导致应用系统负载率过高,最终引发系统故障的问题;而且,通过预测磁盘未来的负载情况,可使磁盘的利用率最大化,降低因磁盘容量不够带来的风险和资源浪费。
附图说明
图1为本发明一实施例提供的一种基于历史监测数据的磁盘容量预测方法的流程示意图;
图2为本发明另一实施例提供的构建自回归滑动平均模型的流程示意图;
图3为本发明另一实施例提供的一种基于历史监测数据的磁盘容量预测系统结构示意图;
图4为本发明另一实施例提供的一种电子设备的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:
实施例一:
请参照图1所示,示出了本发明一实施例提供的一种基于历史监测数据的磁盘容量预测方法,包括以下步骤:
步骤S1:获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
在具体实施中,可通过从磁盘容量的历史使用情况的数据源中提取设定时间段的数据,作为磁盘容量使用情况的样本数据。
或,定时抽取磁盘容量的使用情况的数据源中的数据,得到磁盘容量使用情况的样本数据。
例如,每天抽取磁盘容量的使用情况的数据源中的当天使用情况数据,汇总每天抽取磁盘容量的使用情况的数据源中的当天使用情况数据,得到磁盘容量使用情况的样本数据。
步骤S2:根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
具体的,所述步骤S2可包括:
对所述样本数据进行预处理,对预处理后的样本数据进行属性合并,得到第一时间序列数据;
可选的,所述对所述样本数据进行预处理,包括:
对所述样本数据进行周期性分析和数据清洗。
所述周期性分析包括:
从磁盘容量使用情况的数据源中,选取若干个时间点,其中,各个时间点之间相隔预定的时间长度;获取所述各个时间点关联的磁盘使用容量信息;将所述若干个时间点和所述各个时间点关联的磁盘使用容量信息组成时序图,分析所述时序图的平稳性。
在所述时序图不为平稳序列时,对磁盘容量使用情况的样本数据组成的时间序列进行平稳化处理。
在实际实施中,监控系统会每天定时对磁盘的信息进行收集,但是一般情况下,磁盘容量数据都是一个定制(不考虑中途扩容的情况),因此磁盘原始数据中会存在磁盘容量的重复数据。在数据清洗过程中,剔除出磁盘容量的重复数据,并且将所有服务器的磁盘容量作为一个固定值。
每天定时对磁盘的信息进行收集后,剔除出磁盘容量中的重复数据,如下表1:
表1:磁盘容量信息表
Figure BDA0003089570370000071
Figure BDA0003089570370000081
所述预处理后的样本数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;所述属性合并包括将磁盘使用容量信息和时间点信息组成时间序列信息。如下表2,将磁盘使用容量信息的属性和时间点信息的属性进行属性合并,得到时间序列信息。
表2:属性合并表
Figure BDA0003089570370000082
Figure BDA0003089570370000091
步骤S3:构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
需要说明的是,自回归滑动平均模型,简称ARMA模型(英语:Autoregressivemoving average model),是研究时间序列的重要方法,由自回归模型(简称AR模型)与移动平均模型(简称MA模型)为基础“混合”构成,旨在解释事件序列内在的自相关性从而预测未来。
在具体实施中,构建自回归滑动平均模型的流程可参照图2所示,先对时间序列进行平稳性检验,在检验为平稳性时间序列时,基于平稳性的时间序列构建自回归滑动平均模型;模型确定后,进行白噪声的检验,然和进行模型预测,并在预测后进行误差分析,在误差大的时候,进行重新估计。
步骤S4:通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
步骤S5:根据所述第二时间序列数据,得到未来时间点磁盘的使用容量信息。
具体的,所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息,
可选的,在步骤S5后,还包括:
步骤S6:获取磁盘的总容量;根据未来某时间点磁盘的使用容量信息和磁盘的总容量信息,得到未来某时间点磁盘的使用率;在未来某时间点磁盘的使用率大于预设阈值时,进行预警。
具体的,将预测值与磁盘的总容量进行比较,获得预测的磁盘使用率,如果某一天预测的使用率达到业务设置的预警级别,就会以预警的方式提醒系统管理员。其中预警等级的设定需要结合实际应用,根据业务的应用一般设置的阈值如下表3:
表3:预警等级表
预测已使用空间率 预警等级
85% I
90% II
95% III
在具体实施中,可根据管理员要求进行预警等级的调整,调整预设阈值。如果预测的磁盘使用容量的使用率达到某一预警等级以上,可以发布预警信息,提醒管理员注意,需要清理磁盘或者准备扩容,保证应用系统的健康运行。
可选的,所述步骤S5之前,还包括:
步骤S41:调整自回归滑动平均模型;
步骤S42:通过调整后的回归滑动平均模型进行时序预测。
可选的,所述构建自回归滑动平均模型步骤后,还包括:
根据所述样本数据,得到第三时间序列数据;将所述第三时间序列数据作为验证样本,对构建的自回归滑动平均模型进行验证。
在具体实施中,通过建模样本对构建的自回归滑动平均模型进行训练,通过验证样本对构建的自回归滑动平均模型进行验证。在构建的自回归滑动平均模型的预测结果误差比较大时,调整自回归滑动平均模型;通过调整后的回归滑动平均模型进行时序预测,根据调整后的回归滑动平均模型预测的结果,得到第二时间序列。
所述调整自回归滑动平均模型包括:
每隔设定时间,调整自回归滑动平均模型的建模样本,重新构建自回归滑动平均模型;
在具体实施中,还可根据实际业务情况调整自回归滑动平均模型。因为自回归滑动平均模型采用历史数据进行建模,随着时间的变化,每天会定时地将新增数据加入初始建模数据中,在正常情况下,自回归滑动平均模型需要重新调整。但考虑到建模的复杂度高,且磁盘已使用大小每天的变化量相对很少,对于整个模型影响较小。因此,结合实际业务情况,可以选择每半个月对模型进行一次调整。
本发明的基于历史监测数据的磁盘容量预测方法,通过获取磁盘容量使用情况的数据源,得到第一时间序列数据,通过构建自回归滑动平均模型进行预测,可预测磁盘未来的负载情况,避免应用系统因出现存储容量耗尽的情况而导致应用系统负载率过高,最终引发系统故障;而且,通过预测磁盘未来的负载情况,可使磁盘的利用率最大化,降低因磁盘容量不够带来的风险和资源浪费。
实施例二:
请参照图3所示,示出了本发明另一实施例提供的一种基于历史监测数据的磁盘容量预测系统,包括:
样本获取单元10,用于获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
第一时间序列形成单元20,用于根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
模型构建单元30,用于构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
预测单元40,用于通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
容量匹配单元50,用于根据所述第二时间序列,得到未来某时间点磁盘的使用容量信息。
实施例三:
图4为本申请实施例提供的一种电子设备的结构示意图,在本申请中可以通过图4所示的示意图来描述用于实现本申请实施例的本发明的一种基于历史监测数据的磁盘容量预测方法的电子设备100。
如图4所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104,这些组件通过总线系统和/或其它形式的连接机构(未示出)互连。应当注意,图4所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备可以具有图4示出的部分组件,也可以具有图4未示出的其他组件和结构。
所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (10)

1.基于历史监测数据的磁盘容量预测方法,其特征在于,包括以下步骤:
获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
根据所述第二时间序列数据,得到未来时间点磁盘的使用容量信息。
2.根据权利要求1所述的基于历史监测数据的磁盘容量预测方法,所述根据所述样本数据,得到第一时间序列数据,包括:
对所述样本数据进行预处理,对预处理后的样本数据进行属性合并,得到第一时间序列数据;所述预处理后的样本数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;所述属性合并包括将磁盘使用容量信息和时间点信息组成时间序列数据。
3.根据权利要求2所述的基于历史监测数据的磁盘容量预测方法,所述对所述样本数据进行预处理,包括:
对所述样本数据进行周期性分析和数据清洗。
4.根据权利要求3所述的基于历史监测数据的磁盘容量预测方法,所述周期性分析包括:
从磁盘容量使用情况的数据源中,选取若干个时间点,其中,各个时间点之间相隔预定的时间长度;获取所述各个时间点关联的磁盘使用容量信息;将所述若干个时间点和所述各个时间点关联的磁盘使用容量信息组成时序图,分析所述时序图的平稳性。
5.根据权利要求1所述的基于历史监测数据的磁盘容量预测方法,所述获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据,包括:
从磁盘容量的历史使用情况的数据源中提取设定时间段的数据,作为磁盘容量使用情况的样本数据。
6.根据权利要求1所述的基于历史监测数据的磁盘容量预测方法,所述根据所述第二时间序列,得到未来时间点磁盘的使用容量信息步骤之后,还包括:
获取磁盘的总容量;根据未来某时间点磁盘的使用容量信息和磁盘的总容量信息,得到未来某时间点磁盘的使用率;
在未来某时间点磁盘的使用率大于预设阈值时,进行预警。
7.根据权利要求1所述的基于历史监测数据的磁盘容量预测方法,所述根据所述第二时间序列,得到未来时间点磁盘的使用容量信息步骤之前,还包括:
调整自回归滑动平均模型;通过调整后的回归滑动平均模型进行时序预测;
所述调整自回归滑动平均模型包括:
每隔设定时间,调整自回归滑动平均模型的建模样本;根据调整后的建模样本,重新构建自回归滑动平均模型。
8.根据权利要求7所述的基于历史监测数据的磁盘容量预测方法,所述构建自回归滑动平均模型步骤之后,所述调整自回归滑动平均模型步骤之前,还包括:
根据所述样本数据,得到第三时间序列数据;将所述第三时间序列数据作为验证样本,对构建的自回归滑动平均模型进行验证。
9.基于历史监测数据的磁盘容量预测系统,其特征在于,包括:
样本获取单元,用于获取磁盘容量使用情况的数据源,从所述数据源中提取样本数据;
第一时间序列形成单元,用于根据所述样本数据,得到第一时间序列数据;所述第一时间序列数据包括时间点信息以及与所述时间点信息关联的磁盘使用容量信息;
模型构建单元,用于构建自回归滑动平均模型,将所述第一时间序列作为所述自回归滑动平均模型的建模样本;
预测单元,用于通过所述回归滑动平均模型进行时序预测,得到第二时间序列数据;所述第二时间序列数据包括未来时间点信息以及与所述未来时间点信息关联的磁盘的使用容量信息;
容量匹配单元,用于根据所述第二时间序列,得到未来某时间点磁盘的使用容量信息。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时,实现如权利要求1至8任一项所述的基于历史监测数据的磁盘容量预测方法。
CN202110591054.XA 2021-05-28 2021-05-28 基于历史监测数据的磁盘容量预测方法及系统、存储介质 Pending CN113238714A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110591054.XA CN113238714A (zh) 2021-05-28 2021-05-28 基于历史监测数据的磁盘容量预测方法及系统、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110591054.XA CN113238714A (zh) 2021-05-28 2021-05-28 基于历史监测数据的磁盘容量预测方法及系统、存储介质

Publications (1)

Publication Number Publication Date
CN113238714A true CN113238714A (zh) 2021-08-10

Family

ID=77135562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110591054.XA Pending CN113238714A (zh) 2021-05-28 2021-05-28 基于历史监测数据的磁盘容量预测方法及系统、存储介质

Country Status (1)

Country Link
CN (1) CN113238714A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240395A (zh) * 2021-12-24 2022-03-25 中国建设银行股份有限公司 一种资源交付方法、装置、计算机设备及存储介质
CN114490650A (zh) * 2022-01-17 2022-05-13 成都飞机工业(集团)有限责任公司 一种预测数据库空间的系统、装置、设备及存储介质
CN115145494A (zh) * 2022-08-11 2022-10-04 江苏臻云技术有限公司 一种基于大数据时间序列分析的磁盘容量预测系统及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130041644A1 (en) * 2010-04-15 2013-02-14 Caplan Software Development S.R.L. Automated upgrading method for capacity of it system resources
CN105094698A (zh) * 2015-07-08 2015-11-25 浪潮(北京)电子信息产业有限公司 一种基于历史监测数据的磁盘容量预测方法
CN109766234A (zh) * 2018-12-11 2019-05-17 国网甘肃省电力公司信息通信公司 基于时间序列模型的磁盘存储容量预测方法
CN109800483A (zh) * 2018-12-29 2019-05-24 北京城市网邻信息技术有限公司 一种预测方法、装置、电子设备和计算机可读存储介质
CN109976975A (zh) * 2019-03-26 2019-07-05 北京大道云行科技有限公司 一种磁盘容量预测方法、装置、电子设备及存储介质
CN110865928A (zh) * 2019-11-26 2020-03-06 上海新炬网络技术有限公司 基于arima预测模型和灰色预测模型实现容量预测的方法
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111427753A (zh) * 2020-03-23 2020-07-17 上海新炬网络信息技术股份有限公司 基于arima模型的容量预测装置及其控制方法
CN112001116A (zh) * 2020-07-17 2020-11-27 新华三大数据技术有限公司 一种云资源容量预测方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130041644A1 (en) * 2010-04-15 2013-02-14 Caplan Software Development S.R.L. Automated upgrading method for capacity of it system resources
CN105094698A (zh) * 2015-07-08 2015-11-25 浪潮(北京)电子信息产业有限公司 一种基于历史监测数据的磁盘容量预测方法
CN109766234A (zh) * 2018-12-11 2019-05-17 国网甘肃省电力公司信息通信公司 基于时间序列模型的磁盘存储容量预测方法
CN109800483A (zh) * 2018-12-29 2019-05-24 北京城市网邻信息技术有限公司 一种预测方法、装置、电子设备和计算机可读存储介质
CN109976975A (zh) * 2019-03-26 2019-07-05 北京大道云行科技有限公司 一种磁盘容量预测方法、装置、电子设备及存储介质
CN110865928A (zh) * 2019-11-26 2020-03-06 上海新炬网络技术有限公司 基于arima预测模型和灰色预测模型实现容量预测的方法
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111427753A (zh) * 2020-03-23 2020-07-17 上海新炬网络信息技术股份有限公司 基于arima模型的容量预测装置及其控制方法
CN112001116A (zh) * 2020-07-17 2020-11-27 新华三大数据技术有限公司 一种云资源容量预测方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240395A (zh) * 2021-12-24 2022-03-25 中国建设银行股份有限公司 一种资源交付方法、装置、计算机设备及存储介质
CN114490650A (zh) * 2022-01-17 2022-05-13 成都飞机工业(集团)有限责任公司 一种预测数据库空间的系统、装置、设备及存储介质
CN115145494A (zh) * 2022-08-11 2022-10-04 江苏臻云技术有限公司 一种基于大数据时间序列分析的磁盘容量预测系统及方法
CN115145494B (zh) * 2022-08-11 2023-09-15 江苏臻云技术有限公司 一种基于大数据时间序列分析的磁盘容量预测系统及方法

Similar Documents

Publication Publication Date Title
CN113238714A (zh) 基于历史监测数据的磁盘容量预测方法及系统、存储介质
US20060200546A9 (en) Reporting of abnormal computer resource utilization data
WO2020125929A1 (en) Apparatus and method for detecting an anomaly among successive events and computer program product therefor
CN112148561A (zh) 业务系统的运行状态预测方法、装置及服务器
CN114490078A (zh) 一种微服务的动态缩扩容方法、装置及设备
CN116258484A (zh) 设备的预测性运维方案生成方法、装置、终端设备和介质
CN113992602B (zh) 一种电缆监测数据上传方法、装置、设备以及存储介质
CN111626498A (zh) 设备运行状态预测方法、装置、设备及存储介质
CN112905732A (zh) 电表抄读成功率的获取方法、装置
CN114338348A (zh) 一种智能告警方法、装置、设备及可读存储介质
CN115794369A (zh) 内存占用数值的预测方法及装置、存储介质、终端
CN112150033A (zh) 一种快递柜系统管理方法、装置及电子设备
CN112949697A (zh) 一种管道异常的确认方法、装置及计算机可读存储介质
CN114528179B (zh) 数据采集程序状态监控方法、装置、设备及存储介质
CN116827950A (zh) 云资源的处理方法、装置、设备及存储介质
CN107748711B (zh) 自动优化Storm并行度的方法、终端设备及存储介质
CN113703974A (zh) 一种预测服务器容量的方法及装置
CN114201369A (zh) 一种服务器集群管理方法、装置、电子设备及存储介质
CN113177060A (zh) 一种管理sql语句的方法、装置及设备
CN114281658A (zh) 一种集群资源使用率预测方法、装置、设备及存储介质
CN114860563A (zh) 应用程序测试方法、装置、计算机可读存储介质及设备
CN112395167A (zh) 一种作业故障预测方法、装置及电子设备
CN113138896A (zh) 一种应用运行情况的监控方法、装置和设备
CN111311086A (zh) 一种容量监控方法、装置及计算机可读存储介质
CN116127149B (zh) 图数据库集群健康度的量化方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210810