CN102981939A - 磁盘监控方法 - Google Patents

磁盘监控方法 Download PDF

Info

Publication number
CN102981939A
CN102981939A CN2012104415974A CN201210441597A CN102981939A CN 102981939 A CN102981939 A CN 102981939A CN 2012104415974 A CN2012104415974 A CN 2012104415974A CN 201210441597 A CN201210441597 A CN 201210441597A CN 102981939 A CN102981939 A CN 102981939A
Authority
CN
China
Prior art keywords
disk
module
file system
supervising
alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104415974A
Other languages
English (en)
Other versions
CN102981939B (zh
Inventor
郭庆
徐学辉
谢莹莹
苗艳超
刘新春
邵宗有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Tenglong Information Technology Co.,Ltd.
Original Assignee
Dawning Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Co Ltd filed Critical Dawning Information Industry Co Ltd
Priority to CN201210441597.4A priority Critical patent/CN102981939B/zh
Publication of CN102981939A publication Critical patent/CN102981939A/zh
Application granted granted Critical
Publication of CN102981939B publication Critical patent/CN102981939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种磁盘监控方法,包括:步骤S1:采集磁盘的文件系统运行参数;以及步骤S2:如果文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。通过本发明所述公开的磁盘监控方法,能够更全面、更直接地对磁盘进行监控。

Description

磁盘监控方法
技术领域
本发明基本上涉及网络领域,更具体地来说,涉及一种磁盘监控方法。
背景技术
随着用户数据量的与日剧增,存储设备的容量也日趋增大。磁盘作为存储设备的基本介质与存储单元,其运行状态直接关系到数据的稳定与安全性。在大规模存储系统中,磁盘数量成千上万,如果管理员不能及时发现磁盘状态的异常或者故障进行及时修复,磁盘数量损坏到一定程度后,将无法恢复用户的数据,给用户带来巨大的损失。
现有磁盘监控技术主要针对单个磁盘进行监控,而用户的存储设备通常是多台,具有数量众多的磁盘;另外,磁盘监控目前主要针对硬件层次的监控,而很多时候在硬件状态显示正常时,可能存在软件无法正常写入数据的现象。
发明内容
为了克服上述缺陷,本发明提出了一种磁盘监控方法,解决了如何更全面地进行磁盘监控的技术问题。
本发明公开了一种磁盘监控方法,包括:步骤S1:采集所述磁盘的文件系统运行参数;以及步骤S2:如果所述文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。
优选地,所述步骤S1包括:磁盘信息采集模块通过文件系统监控模块采集所述磁盘的文件系统运行参数。
优选地,所述步骤S1还包括:所述磁盘信息采集模块采集所述磁盘的硬件指标参数,并且其中,所述步骤S2包括:如果所述文件系统运行参数超出预定文件系统运行阈值或者所述硬件指标参数超出预定硬件指标阈值,则通过告警模块告警。
优选地,所述文件系统运行参数包括:写入速度、读取速度或者单位时间I/O请求数。
优选地,所述硬件指标参数包括:容量、转速或者缓存大小。
优选地,所述方法还包括:将文件系统监控模块作为插件嵌入所述磁盘所在的系统,并且通过插件管理模块对所述文件系统监控模块进行初始化、合法性验证或者配制信息管理。
优选地,所述方法还包括:通过插件调度模块控制相应插件来采集相应的所述文件系统运行参数;通过磁盘指标处理模块处理所述磁盘指标参数;通过参数汇总模块将经过处理的磁盘指标参数汇总;以及将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。
优选地,所述方法还包括:通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过所述告警模块告警。
优选地,所述方法还包括:当有新节点加入或者有新磁盘插入节点中时,通过磁盘加载模块加载所述新节点的磁盘或者所述新磁盘,并将所述新节点的磁盘或者所述新磁盘的配置参数和指标参数存储在内存中。
优选地,所述方法还包括:当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。
通过本发明所述公开的磁盘监控方法,能够更全面地进行磁盘监控。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明的一种磁盘监控方法的总体实施例的流程图;
图2是根据本发明的一种磁盘监控方法的一个优选实施例的流程图;
图3和图4分别示出了实现本发明的磁盘监控方法的磁盘监控系统的实例。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据本发明的一种磁盘监控方法的总体实施例的流程图。在图1中:
步骤S100:采集存储系统中磁盘的文件系统运行参数。该文件系统运行参数指的是磁盘的各种软件指标。其中,该文件系统运行参数包括但不限于写入速度、读取速度或者单位时间I/O请求数。由于造成硬盘无法正常使用的原因不仅有硬件问题,很多时候无法检测到磁盘的硬件出现问题,而硬盘仍无法进行正常读写,因此,通过对于磁盘软件指标进行监控,可以更全面、更直接地监控到磁盘故障。
步骤S102:如果文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。其中,该预定文件系统运行阈值可以预先存储在存储模块中,包括但不限于最高写入速度、最低写入速度、最高读取速度、最低读取速度、最高单位时间I/O请求数和/或最低单位时间I/O请求数。
通过本实施例所描述的磁盘监控方法,可以更全面、更直接地监控磁盘,从而更好地保证了存储系统的正常运行。
此外,本发明所描述的磁盘监控系统还可以包括其他附加功能。以下将列举多个优选实施例,但这只是列举,而并不限于此。
文件系统监控模块可以作为插件嵌入所监控的磁盘所在的系统,通过插件管理模块对该文件系统监控模块进行初始化、合法性验证或者配制信息管理。通过该优选实施例,可以通过插件管理模块对于文件系统监控模块进行统一管理,从而提高了监控系统的稳定性。
可以通过插件调度模块控制相应插件来采集相应的文件系统运行参数,通过磁盘指标处理模块处理磁盘指标参数,通过参数汇总模块将经过处理的磁盘指标参数汇总,并且将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。通过该优选实施例,可以针对不同的文件系统运行参数嵌入不同的插件,增强了该监控系统的灵活性。
此外,还可以通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过告警模块告警。由于有时所检测出磁盘的读写故障并非是磁盘本身造成的,例如是由于磁盘所在的存储系统的网络不畅通造成的,因此,通过检测网络状态可以更好地定位故障原因。
当有新节点加入或者有新磁盘插入节点中时,可以通过磁盘加载模块加载新节点的磁盘或者新磁盘,并将新节点的磁盘或者新磁盘的配置参数和指标参数存储在内存中。本优选实施例针对的是整个存储系统中的磁盘增加的情况,比如系统中加入了新服务器,或者在服务器中插入了新磁盘。通过本优选实施例可以更好地应对多磁盘存储系统进行监控。
当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。通过本优选实施例,可以随时保持存储系统内的磁盘数量等信息保持最新状态,从而能够更好地应对多硬盘存储系统的运行及维护。
图2是根据本发明的一种磁盘监控方法的一个优选实施例的流程图。在图2中:
步骤S200:磁盘信息采集模块通过文件系统监控模块采集磁盘的文件系统运行参数,并且磁盘信息采集模块采集磁盘的硬件指标参数。与上述实施例相同,该文件系统运行参数包括但不限于写入速度、读取速度或者单位时间I/O请求数。由于造成硬盘无法正常使用的原因不仅有硬件问题,很多时候无法检测到磁盘的硬件出现问题,而硬盘仍无法进行正常读写,因此,通过对于磁盘软件指标进行监控,可以更全面、更直接地监控到磁盘故障。与上述实施例不同的是,本优选实施例不仅监控了磁盘的软件指标,还监控了磁盘的硬件指标,从而更全面地对磁盘进行监控。其中,该硬件指标参数包括但不限于磁盘的容量、转速或者缓存大小。
步骤S202:如果文件系统运行参数超出预定文件系统运行阈值或者硬件指标参数超出预定硬件指标阈值,则通过告警模块告警。其中,该预定文件系统运行阈值可以预先存储在存储模块中,包括但不限于最高写入速度、最低写入速度、最高读取速度、最低读取速度、最高单位时间I/O请求数和/或最低单位时间I/O请求数。该预定硬件阈值包括但不限于最高容量、最低容量、最高转速、最低转速、最高缓存和/或最低缓存。
通过本实施例所描述的磁盘监控方法,可以从软件、硬件两个方面对磁盘进行监控,从而更全面、更直接地监控磁盘,从而更好地保证了存储系统的正常运行。
与上述实施例相同,本实施例所描述的磁盘监控系统还可以包括其他附加功能。以下将列举多个优选实施例,但这只是列举,而并不限于此。
文件系统监控模块可以作为插件嵌入所监控的磁盘所在的系统,通过插件管理模块对该文件系统监控模块进行初始化、合法性验证或者配制信息管理。通过该优选实施例,可以通过插件管理模块对于文件系统监控模块进行统一管理,从而提高了监控系统的稳定性。
可以通过插件调度模块控制相应插件来采集相应的文件系统运行参数,通过磁盘指标处理模块处理磁盘指标参数,通过参数汇总模块将经过处理的磁盘指标参数汇总,并且将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。通过该优选实施例,可以针对不同的文件系统运行参数嵌入不同的插件,增强了该监控系统的灵活性。
此外,还可以通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过告警模块告警。由于有时所检测出磁盘的读写故障并非是磁盘本身造成的,例如是由于磁盘所在的存储系统的网络不畅通造成的,因此,通过检测网络状态可以更好地定位故障原因。
当有新节点加入或者有新磁盘插入节点中时,可以通过磁盘加载模块加载新节点的磁盘或者新磁盘,并将新节点的磁盘或者新磁盘的配置参数和指标参数存储在内存中。本优选实施例针对的是整个存储系统中的磁盘增加的情况,比如系统中加入了新服务器,或者在服务器中插入了新磁盘。通过本优选实施例可以更好地应对多磁盘存储系统进行监控。
当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。通过本优选实施例,可以随时保持存储系统内的磁盘数量等信息保持最新状态,从而能够更好地应对多硬盘存储系统的运行及维护。
图3和图4分别示出了实现本发明的磁盘监控方法的磁盘监控系统的实例。
在图3中,包括:
1)资源加载模块(磁盘加载模块),用于加载资源、资源配置参数、指标等信息,并对其进行处理,放入相应的缓冲区。
2)资源更新模块(磁盘更新模块),用于根据实际采集到的资源,对数据库资源表和资源配置参数表进行更新。
3)网络状态检测模块,用于进行网络状态的检测,是否可以ping通。
4)指标处理模块,用于将需要采集的指标按照一定逻辑关系进行处理
5)采集调度模块,用于调度插件进行信息采集。
6)信息汇总接收模块,用于收集采集代理发送来的采集信息,进行汇总。
7)数据存储模块,用于将采集的数据存储到数据库中。
8)插件管理模块,用于对采集插件进行管理的模块,比如初始化、合法性验证、配置信息管理等。
9)磁盘信息采集模块,用于按照系统框架要求实现的磁盘采集插件,获取所需的磁盘信息。
10)文件系统监控模块,用于从文件系统角度监控相关状态、性能数据。
在图4中,包括:
1)资源加载模块(磁盘加载模块)加载资源配置及指标信息,即需要监控哪些节点,以及节点上的哪些信息。
2)指标调度从资源加载的缓冲区获取指标,进行初始化排序。
3)采集调度调用指标调度模块接口,获取本轮需要采集的指标,根据指标从插件管理模块获取相应插件,并查询网络状态检测模块的检测结果,调度插件并采集信息。
4)磁盘信息采集模块,作为一个插件,调用文件系统监控模块,获取需要的磁盘信息,并交由框架统一处理。
5)采集到新的资源,则由资源更新模块调用数据存储模块进行资源更新。
6)主动采集到的数据或者由信息汇总接收模块接收到的数据,由告警产生模块进行告警和恢复的判断,并将告警和恢复信息发送至告警管理系统。
7)信息汇总接收模块接收采集代理发送来的数据,并调用存储模块进行存储。
8)配置更新模块会更新各个采集代理节点的配置信息。
9)数据采样模块会定期扫描数据库,对数据表进行抽样平均。
10)同时系统采用分区存储策略,当系统规模较大时,将系统划分成若干个分区,分区内的磁盘信息汇总至一台机器,不同分区的所有信息最终汇总到一台总的机器,从而实现大规模磁盘监控系统。
本实例从文件系统(软件指标)的角度实现了对磁盘的监控,可以在系统真实无法写入数据时及时获取故障信息,为用户准确报警;同时,本发明针对大规模存储系统设计实现了对应的磁盘监控系统和方法,能有效监控大规模磁盘。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种磁盘监控方法,其特征在于,包括:
步骤S1:采集所述磁盘的文件系统运行参数;以及
步骤S2:如果所述文件系统运行参数超出预定文件系统运行阈值,则通过告警模块告警。
2.根据权利要求1所述的磁盘监控方法,其特征在于,所述步骤S1包括:磁盘信息采集模块通过文件系统监控模块采集所述磁盘的文件系统运行参数。
3.根据权利要求2所述的磁盘监控方法,其特征在于,所述步骤S1还包括:所述磁盘信息采集模块采集所述磁盘的硬件指标参数,
并且其中,所述步骤S2包括:如果所述文件系统运行参数超出预定文件系统运行阈值或者所述硬件指标参数超出预定硬件指标阈值,则通过告警模块告警。
4.根据权利要求1-3中任一项所述的磁盘监控方法,其特征在于,所述文件系统运行参数包括:写入速度、读取速度或者单位时间I/O请求数。
5.根据权利要求4所述的磁盘监控方法,其特征在于,所述硬件指标参数包括:容量、转速或者缓存大小。
6.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括:将文件系统监控模块作为插件嵌入所述磁盘所在的系统,并且通过插件管理模块对所述文件系统监控模块进行初始化、合法性验证或者配制信息管理。
7.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括:
通过插件调度模块控制相应插件来采集相应的所述文件系统运行参数;
通过磁盘指标处理模块处理所述磁盘指标参数;
通过参数汇总模块将经过处理的磁盘指标参数汇总;以及
将汇总后的经过处理的磁盘指标参数存储在数据存储模块中。
8.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括:通过网络状态检测模块检测网络状态是否能够Ping通,如果无法Ping通,则通过所述告警模块告警。
9.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括:当有新节点加入或者有新磁盘插入节点中时,通过磁盘加载模块加载所述新节点的磁盘或者所述新磁盘,并将所述新节点的磁盘或者所述新磁盘的配置参数和指标参数存储在内存中。
10.根据权利要求1-3所述的磁盘监控方法,其特征在于,所述方法还包括:当减少磁盘或者替换磁盘时,通过磁盘更新模块对数据库磁盘表和数据库配置参数表进行更新。
CN201210441597.4A 2012-11-07 2012-11-07 磁盘监控方法 Active CN102981939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210441597.4A CN102981939B (zh) 2012-11-07 2012-11-07 磁盘监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210441597.4A CN102981939B (zh) 2012-11-07 2012-11-07 磁盘监控方法

Publications (2)

Publication Number Publication Date
CN102981939A true CN102981939A (zh) 2013-03-20
CN102981939B CN102981939B (zh) 2016-07-20

Family

ID=47855994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210441597.4A Active CN102981939B (zh) 2012-11-07 2012-11-07 磁盘监控方法

Country Status (1)

Country Link
CN (1) CN102981939B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260140A (zh) * 2015-10-21 2016-01-20 浪潮(北京)电子信息产业有限公司 磁盘容量监控方法及装置
CN105528274A (zh) * 2015-12-01 2016-04-27 上海爱数信息技术股份有限公司 一种优化加速的磁盘监控方法及系统
CN106339297A (zh) * 2016-09-14 2017-01-18 郑州云海信息技术有限公司 一种存储系统故障实时告警的方法及系统
WO2017125014A1 (zh) * 2016-01-18 2017-07-27 中兴通讯股份有限公司 硬盘监控方法及装置
CN108763026A (zh) * 2018-05-31 2018-11-06 郑州云海信息技术有限公司 一种磁盘监控告警方法、系统、设备及计算机存储介质
CN111008114A (zh) * 2019-11-30 2020-04-14 北京浪潮数据技术有限公司 一种磁盘分区监控方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005094245A (ja) * 2003-09-16 2005-04-07 Victor Co Of Japan Ltd 動き検出装置
CN1929410A (zh) * 2006-09-04 2007-03-14 曙光信息产业(北京)有限公司 一种智能化机群监控系统
CN101533366A (zh) * 2009-03-09 2009-09-16 浪潮电子信息产业股份有限公司 一种服务器性能数据采集与分析的方法
CN102147960A (zh) * 2011-03-22 2011-08-10 曙光信息产业股份有限公司 一种超大规模业务集群监控系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005094245A (ja) * 2003-09-16 2005-04-07 Victor Co Of Japan Ltd 動き検出装置
CN1929410A (zh) * 2006-09-04 2007-03-14 曙光信息产业(北京)有限公司 一种智能化机群监控系统
CN101533366A (zh) * 2009-03-09 2009-09-16 浪潮电子信息产业股份有限公司 一种服务器性能数据采集与分析的方法
CN102147960A (zh) * 2011-03-22 2011-08-10 曙光信息产业股份有限公司 一种超大规模业务集群监控系统和方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260140A (zh) * 2015-10-21 2016-01-20 浪潮(北京)电子信息产业有限公司 磁盘容量监控方法及装置
CN105528274A (zh) * 2015-12-01 2016-04-27 上海爱数信息技术股份有限公司 一种优化加速的磁盘监控方法及系统
CN105528274B (zh) * 2015-12-01 2018-07-13 上海爱数信息技术股份有限公司 一种优化加速的磁盘监控方法及系统
WO2017125014A1 (zh) * 2016-01-18 2017-07-27 中兴通讯股份有限公司 硬盘监控方法及装置
CN106339297A (zh) * 2016-09-14 2017-01-18 郑州云海信息技术有限公司 一种存储系统故障实时告警的方法及系统
CN108763026A (zh) * 2018-05-31 2018-11-06 郑州云海信息技术有限公司 一种磁盘监控告警方法、系统、设备及计算机存储介质
CN111008114A (zh) * 2019-11-30 2020-04-14 北京浪潮数据技术有限公司 一种磁盘分区监控方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN102981939B (zh) 2016-07-20

Similar Documents

Publication Publication Date Title
CN102981939A (zh) 磁盘监控方法
TWI595760B (zh) 伺服器資源之管理系統及其管理方法
US9760468B2 (en) Methods and arrangements to collect data
CN107544832B (zh) 一种虚拟机进程的监控方法、装置和系统
US11093349B2 (en) System and method for reactive log spooling
CN106789377B (zh) 网元集群的服务参数更新方法
CN105224888B (zh) 一种基于安全预警技术的磁盘阵列数据保护系统
CN102937930A (zh) 应用程序监控系统及方法
CN104699807A (zh) 一种oracle数据表空间的自动监控扩容方法
CN101010669A (zh) 应用服务器的健康监视和控制的技术
CN109871392B (zh) 一种分布式应用系统下的慢sql实时数据采集方法
US10936386B2 (en) Method, device and computer program product for monitoring access request
CN103713981A (zh) 一种数据库服务器性能检测和预警方法
CN105760240A (zh) 分布式任务处理方法及装置
CN105610648A (zh) 一种运维监控数据的采集方法及服务器
CN105955662A (zh) 一种k-db数据表空间的扩容方法与系统
CN111857592A (zh) 基于对象存储系统的数据存储方法及装置、电子设备
CN107453932B (zh) 一种分布式存储系统管理方法及其装置
CN105607973B (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
CN110727508A (zh) 一种任务调度系统和调度方法
CN102508760A (zh) 独立磁盘冗余阵列预警方法和系统
CN109218401A (zh) 日志采集方法、系统、计算机设备和存储介质
CN104679623A (zh) 一种服务器硬盘的维护方法、系统及服务器监控设备
CN105138447A (zh) 一种Reboot测试过程中监测硬盘和内存的实现方法
CN114610567A (zh) 容器监控方法、网络设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220325

Address after: Room 111-1, first floor, building 23, yard 8, Dongbeiwang West Road, Haidian District, Beijing 100089

Patentee after: Zhongke Tenglong Information Technology Co.,Ltd.

Address before: 300384 Xiqing District, Tianjin Huayuan Industrial Zone (outside the ring) 15 1-3, hahihuayu street.

Patentee before: DAWNING INFORMATION INDUSTRY Co.,Ltd.