CN106648470A - 一种监控数据服务系统中磁盘阵列的方法和装置 - Google Patents

一种监控数据服务系统中磁盘阵列的方法和装置 Download PDF

Info

Publication number
CN106648470A
CN106648470A CN201611249996.5A CN201611249996A CN106648470A CN 106648470 A CN106648470 A CN 106648470A CN 201611249996 A CN201611249996 A CN 201611249996A CN 106648470 A CN106648470 A CN 106648470A
Authority
CN
China
Prior art keywords
disk array
strategy
battery
read
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611249996.5A
Other languages
English (en)
Inventor
刘臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201611249996.5A priority Critical patent/CN106648470A/zh
Publication of CN106648470A publication Critical patent/CN106648470A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Abstract

本发明公开了一种监控数据服务系统中磁盘阵列的方法和装置。所述方法包括:监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;将报警信息发送到预设地址。上述技术方案可以实时监控磁盘阵列的运行状态,以便出现问题时得到及时解决,避免影响整个数据服务系统的正常运行,保持其运行的稳定性。

Description

一种监控数据服务系统中磁盘阵列的方法和装置
技术领域
本发明涉及计算机技术领域,具体涉及一种监控数据服务系统中磁盘阵列的方法和装置。
背景技术
在计算机技术领域中,为保证数据服务系统的正常运行,必须保证服务系统中的各个硬件的状态的稳定性,特别是磁盘阵列的性能状态,要防止因硬件出现故障而影响整个服务器系统。磁盘阵列是由很多磁盘组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统性能。磁盘阵列的硬件的状态的好坏直接影响到整个数据服务系统的读写速度和稳定性。因此,急需一种能够监控磁盘阵列的方法,防止磁盘阵列的硬件出现故障影响整个服务器系统的情况的出现。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的监控数据服务系统中磁盘阵列的方法和装置。
依据本发明的一个方面,提供了一种监控数据服务系统中磁盘阵列的方法,其中,该方法包括:
监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
将报警信息发送到预设地址。
可选地,所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列是否缺失电池;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
可选地,所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列的读写策略是否发生变化;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
可选地,判断磁盘阵列的读写策略是否发生变化包括:
判断磁盘阵列的读写策略是否从策略二变化为策略一;
其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
可选地,该方法进一步包括:
将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
可选地,所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列中的各磁盘的磨损率是否大于预设值
所述对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息包括:对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
可选地,该方法进一步包括:
监控各服务器中的磁盘阵列的电池充放电状态;
当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。
可选地,
可选地
根据本发明的另一方面,提供了一种监控数据服务系统中磁盘阵列的装置,其中,该装置包括:
监控单元,适于监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
报警生成单元,适于对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
报警发送单元,适于将报警信息发送到预设地址。
可选地,所述监控单元,适于判断磁盘阵列是否缺失电池;
所述报警生成单元,适于对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
可选地,所述监控单元,适于判断磁盘阵列的读写策略是否发生变化;
所述报警生成单元,适于对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
可选地,所述监控单元,适于判断磁盘阵列的读写策略是否从策略二变化为策略一;
其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
可选地,该装置进一步包括:
报警处理单元,适于将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
可选地,所述监控单元,适于判断磁盘阵列中的各磁盘的磨损率是否大于预设值;
所述报警生成单元,适于对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
可选地,该装置进一步包括:日志记录单元;
所述监控单元,进一步适于监控各服务器中的磁盘阵列的电池充放电状态;
所述日志记录单元,适于当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。
根据本发明的技术方案事先预设有磁盘阵列报警条件,然后实时监控数据服务系统中的各服务器中的磁盘阵列,并判断磁盘阵列是否满足预设报警条件;如果不满足,则说明磁盘阵列运行状态良好;如果满足,则对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;将报警信息发送到预设地址,以便相关人员及时获知该报警信息,然后进行相应的处理。可见,本发明可以实时监控磁盘阵列的运行状态,以便出现问题时得到及时解决,避免影响整个数据服务系统的正常运行,保持其运行的稳定性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种监控数据服务系统中磁盘阵列的方法的流程示意图;
图2示出了根据本发明一个实施例的一种监控数据服务系统中磁盘阵列的装置的结构示意图;
图3示出了根据本发明另一个实施例的一种监控数据服务系统中磁盘阵列的装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种监控数据服务系统中磁盘阵列的方法的流程示意图。如图1所示,该方法包括:
步骤S110,监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件。
磁盘阵列使用过程中会出现各种各样的问题,首先根据已知的磁盘阵列会出现的问题预设一些报警条件。例如,报警条件中包括缺失电池、磁盘阵列的读写策略发生变化等。然后监控数据服务系统中的各服务器中的磁盘阵列是否出现了报警条件中所包含的磁盘阵列的状态条件。如果没有出现,则说明该磁盘阵列不会出现问题。例如,监控发现磁盘阵列中缺失电池了,那么就属于满足预设报警条件的情况。
步骤S120,对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息。
当磁盘阵列出现满足预设报警条件的状况的时候,需要进行报警,该报警信息根据预设报警条件进行生成。例如,磁盘阵列出现的是磁盘阵列缺失电池,那么根据该报警条件,就生成一个“需要添加电池”的报警信息。该报警信息的形式不作具体的限制,可以对应每种报警条件事先设定报警信息的一种格式或多种格式,当出现满足报警条件的时候,根据设定的报警信息的格式进行报警信息的生成。
步骤S130,将报警信息发送到预设地址。
当报警信息生成后,为了让相关人员获知,以便进行相应的处理操作,需要将报警信息发送到预设地址中。该预设地址可以是邮件地址、微信号、飞信号等,不作具体限定。
可见,本发明可以实时监控磁盘阵列的运行状态,以便出现问题时得到及时解决,避免影响整个数据服务系统的正常运行,保持其运行的稳定性。
磁盘阵列在写入数据的时候,是首先将数据写入其内部的缓存中,然后从缓存中根据数据的存储策略写入相应的磁盘中。但是这个缓存需要有电源为其供电,这个电源通常是通过系统电源进行供电的,而且会有电池作为备用电源,但是如果电池缺失或者电池没电,特别是断电的时候,缓存无法从电池中获得电量,会导致缓存的数据不能写入磁盘,最终使得数据丢失。为了监控磁盘阵列中的电池的状态,在本发明的一个实施例中,步骤S110中的判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列是否缺失电池。当判断磁盘阵列满足该报警条件中的磁盘阵列缺失电池的情况,那么就会生成相应的报警信息。
这里的电池缺失可能是电池电量耗尽或者没有电池的情况,那么,步骤S120中的对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
磁盘阵列在写入数据的时候,首先将数据写入缓存,然后再将数据从缓存中写入磁盘。这就会有两种读写策略,第一种是,当数据写入缓存后就认为该条数据写入成功,就进行下一条数据的写入任务;第二种是,数据写入缓存后,等到数据从缓存中写入磁盘中,才认为数据写入成功,再进行下一条的数据的写入任务。但是,对于第一种策略来说,数据容易丢失,如果是非常重要的数据,在没有确定数据是否写入磁盘就认为数据写入成功,容易造呈数据的丢失。所以针对不同的数据使用的额策略是不同的饿,非重要的数据使用第一种即可,而对于重要的数据需要使用第二种策略。
但是当磁盘阵列出现异常情况后,会导致上述策略发生变化,重要的数据的写入可能会由第二种策略变成第一种策略。为了防止读写策略发生变化,导致数据丢失,在本发明的一个实施例中,判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列的读写策略是否发生变化。当判断磁盘阵列满足该报警条件中的磁盘阵列的读写策略发生变化的情况,那么就会生成相应的报警信息。
那么步骤S120中的对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
具体地,上述实施例中判断磁盘阵列的读写策略是否发生变化包括:
判断磁盘阵列的读写策略是否从策略二变化为策略一;其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
在判断磁盘阵列的读写策略是否发生变化的时候可以不需要实时进行,可以设定一个预设时段,在该预设时段内读写数据时需要使用策略二,那么就在该预设时段内进行判断磁盘阵列的读写策略是否发生变化的操作,例如,一天中的10:00到15:00。或者,已经确定某些重要的数据是在固定的时间段内进行读写的,那么就可以根据该重要信息的读写时间设定一个预设时段;例如,某业务的重要数据是在16:00到18:00进行读写的,那么就在设定预设时段为16:00到18:00,在该时段内判断磁盘阵列的读写策略是否发生变化。
当判断到读写策略发生变化,那么,就可以不需要人工操作处理,直接自动重置读写策略的操作。所以,上述方法进一步包括:将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
磁盘阵列是有很多磁盘组合起来的,当磁盘阵列在读写数据的时候,磁盘阵列的磁盘中的某些存储空间会存在失效或不可用的问题(即磨损),虽然磁盘中会有备用的存储空间,但是一旦备用空间均开始使用,不可用的存储空间不停的增加,即磨损率不停的增加,那么就会导致磁盘的性能下降,最终使得磁盘阵列整体性能下降,所以,需要进行监控磁盘阵列中各磁盘的磨损情况。在本发明的一个实施例中,判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列中的各磁盘的磨损率是否大于预设值。这里的磨损率就是磁盘的存储空间中不可用的占总空间的比例。当判断磁盘阵列的磁盘满足该报警条件中的磨损率大于预设值的情况,那么就会生成相应的报警信息。
步骤S130中的对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息包括:对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
上文中指出磁盘阵列的缓存需要有电源为其供电,这个电源通常是通过系统电源进行供电的,而且会有电池作为备用电源,为了保证电池在突然断电的情况下可使用性,需要定期的对电池检测,即对电池进行充电放电的操作。但是,电池的充电或放电会影响磁盘阵列的服务性能。在监控到服务器的服务性能突然下降的状时,为了判断该状况是否是电池充电或放电引起的,在本发明的一个实施例中,该方法进一步包括:
监控各服务器中的磁盘阵列的电池充放电状态。
当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。根据该日志,相关人员就可以判断磁盘阵列相应时间的异常状况是由于电池的充电和放电引起的,避免不必要的盲目的问题排查,提高工作效率。
图2示出了根据本发明一个实施例的一种监控数据服务系统中磁盘阵列的装置的结构示意图。如图2所示,该监控数据服务系统中磁盘阵列的装置200包括:
监控单元210,适于监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件。
磁盘阵列使用过程中会出现各种各样的问题,首先根据已知的磁盘阵列会出现的问题预设一些报警条件。例如,报警条件中包括缺失电池、磁盘阵列的读写策略发生变化等。然后监控数据服务系统中的各服务器中的磁盘阵列是否出现了报警条件中所包含的磁盘阵列的状态条件。如果没有出现,则说明该磁盘阵列不会出现问题。例如,监控发现磁盘阵列中缺失电池了,那么就属于满足预设报警条件的情况。
报警生成单元220,适于对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息。
当磁盘阵列出现满足预设报警条件的状况的时候,需要进行报警,该报警信息根据预设报警条件进行生成。例如,磁盘阵列出现的是磁盘阵列缺失电池,那么根据该报警条件,就生成一个“需要添加电池”的报警信息。该报警信息的形式不作具体的限制,可以对应每种报警条件事先设定报警信息的一种格式或多种格式,当出现满足报警条件的时候,根据设定的报警信息的格式进行报警信息的生成。
报警发送单元230,适于将报警信息发送到预设地址。
当报警信息生成后,为了让相关人员获知,以便进行相应的处理操作,需要将报警信息发送到预设地址中。该预设地址可以是邮件地址、微信号、飞信号等,不作具体限定。
可见,本发明可以实时监控磁盘阵列的运行状态,以便出现问题时得到及时解决,避免影响整个数据服务系统的正常运行,保持其运行的稳定性。
磁盘阵列在写入数据的时候,是首先将数据写入其内部的缓存中,然后从缓存中根据数据的存储策略写入相应的磁盘中。但是这个缓存需要有电源为其供电,这个电源通常是通过系统电源进行供电的,而且会有电池作为备用电源,但是如果电池缺失或者电池没电,特别是断电的时候,缓存无法从电池中获得电量,会导致缓存的数据不能写入磁盘,最终使得数据丢失。为了监控磁盘阵列中的电池的状态,在本发明的一个实施例中,监控单元210,适于判断磁盘阵列是否缺失电池。当判断磁盘阵列满足该报警条件中的磁盘阵列缺失电池的情况,那么就会生成相应的报警信息。
这里的电池缺失可能是电池电量耗尽或者没有电池的情况,那么,报警生成单元220,适于对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
磁盘阵列在写入数据的时候,首先将数据写入缓存,然后再将数据从缓存中写入磁盘。这就会有两种读写策略,第一种是,当数据写入缓存后就认为该条数据写入成功,就进行下一条数据的写入任务;第二种是,数据写入缓存后,等到数据从缓存中写入磁盘中,才认为数据写入成功,再进行下一条的数据的写入任务。但是,对于第一种策略来说,数据容易丢失,如果是非常重要的数据,在没有确定数据是否写入磁盘就认为数据写入成功,容易造呈数据的丢失。所以针对不同的数据使用的额策略是不同的饿,非重要的数据使用第一种即可,而对于重要的数据需要使用第二种策略。
但是当磁盘阵列出现异常情况后,会导致上述策略发生变化,重要的数据的写入可能会由第二种策略变成第一种策略。为了防止读写策略发生变化,导致数据丢失,在本发明的一个实施例中,监控单元210,适于判断磁盘阵列的读写策略是否发生变化。当判断磁盘阵列满足该报警条件中的磁盘阵列的读写策略发生变化的情况,那么就会生成相应的报警信息。
报警生成单元220,适于对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
具体地,上述实施例中监控单元210,适于判断磁盘阵列的读写策略是否从策略二变化为策略一;其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
在判断磁盘阵列的读写策略是否发生变化的时候可以不需要实时进行,可以设定一个预设时段,在该预设时段内读写数据时需要使用策略二,那么就在该预设时段内进行判断磁盘阵列的读写策略是否发生变化的操作,例如,一天中的10:00到15:00。或者,已经确定某些重要的数据是在固定的时间段内进行读写的,那么就可以根据该重要信息的读写时间设定一个预设时段;例如,某业务的重要数据是在16:00到18:00进行读写的,那么就在设定预设时段为16:00到18:00,在该时段内判断磁盘阵列的读写策略是否发生变化。
图3示出了根据本发明另一个实施例的一种监控数据服务系统中磁盘阵列的装置的结构示意图。如图3所示,该监控数据服务系统中磁盘阵列的装置300包括:监控单元310、报警生成单元320、报警发送单元330和报警处理单元340。其中,监控单元310、报警生成单元320、报警发送单元330和图2所示的监控单元210、报警生成单元220、报警发送单元230具有对应相同的功能,相同的部分在此不再赘述。
当判断到读写策略发生变化,那么,就可以不需要人工操作处理,直接自动重置读写策略的操作。报警处理单元340,适于将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
磁盘阵列是有很多磁盘组合起来的,当磁盘阵列在读写数据的时候,磁盘阵列的磁盘中的某些存储空间会存在失效或不可用的问题(即磨损),虽然磁盘中会有备用的存储空间,但是一旦备用空间均开始使用,不可用的存储空间不停的增加,即磨损率不停的增加,那么就会导致磁盘的性能下降,最终使得磁盘阵列整体性能下降,所以,需要进行监控磁盘阵列中各磁盘的磨损情况。在本发明的一个实施例中,监控单元310,适于判断磁盘阵列中的各磁盘的磨损率是否大于预设值。这里的磨损率就是磁盘的存储空间中不可用的占总空间的比例。当判断磁盘阵列的磁盘满足该报警条件中的磨损率大于预设值的情况,那么就会生成相应的报警信息。
报警生成单元320,适于对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
上文中指出磁盘阵列的缓存需要有电源为其供电,这个电源通常是通过系统电源进行供电的,而且会有电池作为备用电源,为了保证电池在突然断电的情况下可使用性,需要定期的对电池检测,即对电池进行充电放电的操作。但是,电池的充电或放电会影响磁盘阵列的服务性能。在监控到服务器的服务性能突然下降的状时,为了判断该状况是否是电池充电或放电引起的,在本发明的一个实施例中,监控单元310,进一步适于监控各服务器中的磁盘阵列的电池充放电状态。
日志记录单元350,适于当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。根据该日志,相关人员就可以判断磁盘阵列相应时间的异常状况是由于电池的充电和放电引起的,避免不必要的盲目的问题排查,提高工作效率。
综上所述,根据本发明的技术方案事先预设有磁盘阵列报警条件,然后实时监控数据服务系统中的各服务器中的磁盘阵列,并判断磁盘阵列是否满足预设报警条件;如果不满足,则说明磁盘阵列运行状态良好;如果满足,则对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;将报警信息发送到预设地址,以便相关人员及时获知该报警信息,然后进行相应的处理。可见,本发明可以实时监控磁盘阵列的运行状态,以便出现问题时得到及时解决,避免影响整个数据服务系统的正常运行,保持其运行的稳定性。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的监控数据服务系统中磁盘阵列的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种监控数据服务系统中磁盘阵列的方法,包括:
监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
将报警信息发送到预设地址。
A2、如A1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列是否缺失电池;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
A3、如A1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列的读写策略是否发生变化;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
A4、如A3所述的方法,其中,判断磁盘阵列的读写策略是否发生变化包括:
判断磁盘阵列的读写策略是否从策略二变化为策略一;
其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
A5、如A4所述的方法,其中,该方法进一步包括:
将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
A6、如A1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列中的各磁盘的磨损率是否大于预设值
所述对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息包括:对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
A7、如A1-A6中任一项所述的方法,其中,该方法进一步包括:
监控各服务器中的磁盘阵列的电池充放电状态;
当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。
本发明公开了B8、一种监控数据服务系统中磁盘阵列的装置,包括:
监控单元,适于监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
报警生成单元,适于对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
报警发送单元,适于将报警信息发送到预设地址。
B9、如B8所述的装置,其中,
所述监控单元,适于判断磁盘阵列是否缺失电池;
所述报警生成单元,适于对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
B10、如B8所述的装置,其中,
所述监控单元,适于判断磁盘阵列的读写策略是否发生变化;
所述报警生成单元,适于对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
B11、如B10所述的装置,其中,
所述监控单元,适于判断磁盘阵列的读写策略是否从策略二变化为策略一;
其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
B12、如B11所述的装置,其中,该装置进一步包括:
报警处理单元,适于将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
B13、如B8所述的装置,其中,
所述监控单元,适于判断磁盘阵列中的各磁盘的磨损率是否大于预设值;
所述报警生成单元,适于对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
B14、如B8-B13中任一项所述的装置,其中,该装置进一步包括:日志记录单元;
所述监控单元,进一步适于监控各服务器中的磁盘阵列的电池充放电状态;
所述日志记录单元,适于当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。

Claims (10)

1.一种监控数据服务系统中磁盘阵列的方法,包括:
监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
将报警信息发送到预设地址。
2.如权利要求1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列是否缺失电池;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
3.如权利要求1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列的读写策略是否发生变化;
所述对于满足预设报警条件的磁盘阵列,发出与所满足的预设报警条件相应的报警信息包括:对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
4.如权利要求3所述的方法,其中,判断磁盘阵列的读写策略是否发生变化包括:
判断磁盘阵列的读写策略是否从策略二变化为策略一;
其中,策略一为:当数据写入磁盘阵列对应的缓存时即确认数据写入成功;策略二为:当数据写入磁盘阵列对应的缓存,又从缓存写入磁盘阵列时确认数据写入成功。
5.如权利要求4所述的方法,其中,该方法进一步包括:
将读写策略从策略二变化为策略一的磁盘阵列的读写策略重置为策略二。
6.如权利要求1所述的方法,其中,
所述判断磁盘阵列是否满足预设报警条件包括:判断磁盘阵列中的各磁盘的磨损率是否大于预设值
所述对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息包括:对于磨损率大于预设值的磁盘,生成磨损率过大需要更换磁盘的报警信息。
7.如权利要求1-6中任一项所述的方法,其中,该方法进一步包括:
监控各服务器中的磁盘阵列的电池充放电状态;
当磁盘阵列的电池充电或放电时,如果磁盘阵列的性能产生异常状况,则在日志中对应记录电池充电或放电事件与磁盘阵列的性能产生异常状况的事件。
8.一种监控数据服务系统中磁盘阵列的装置,包括:
监控单元,适于监控数据服务系统中的各服务器中的磁盘阵列,判断磁盘阵列是否满足预设报警条件;
报警生成单元,适于对于满足预设报警条件的磁盘阵列,生成与其所满足的预设报警条件相应的报警信息;
报警发送单元,适于将报警信息发送到预设地址。
9.如权利要求8所述的装置,其中,
所述监控单元,适于判断磁盘阵列是否缺失电池;
所述报警生成单元,适于对于缺失电池的磁盘阵列,生成磁盘阵列缺失电池需要更换磁盘阵列的报警信息,或者生成磁盘阵列缺失电池需要添加电池的报警信息。
10.如权利要求8所述的装置,其中,
所述监控单元,适于判断磁盘阵列的读写策略是否发生变化;
所述报警生成单元,适于对于读写策略发生变化的磁盘阵列,生成读写策略发生变化需要重置该磁盘阵列的读写策略的报警信息。
CN201611249996.5A 2016-12-29 2016-12-29 一种监控数据服务系统中磁盘阵列的方法和装置 Pending CN106648470A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611249996.5A CN106648470A (zh) 2016-12-29 2016-12-29 一种监控数据服务系统中磁盘阵列的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611249996.5A CN106648470A (zh) 2016-12-29 2016-12-29 一种监控数据服务系统中磁盘阵列的方法和装置

Publications (1)

Publication Number Publication Date
CN106648470A true CN106648470A (zh) 2017-05-10

Family

ID=58835990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611249996.5A Pending CN106648470A (zh) 2016-12-29 2016-12-29 一种监控数据服务系统中磁盘阵列的方法和装置

Country Status (1)

Country Link
CN (1) CN106648470A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114675791A (zh) * 2022-05-27 2022-06-28 苏州浪潮智能科技有限公司 一种磁盘处理方法、系统及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101682093A (zh) * 2008-03-27 2010-03-24 Lsi公司 改进的电池状况学习周期的设备和方法
CN101713805A (zh) * 2008-10-08 2010-05-26 纬创资通股份有限公司 检测一电源储存装置运作情形的方法及其电源储存装置
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN102508620A (zh) * 2011-12-01 2012-06-20 浪潮电子信息产业股份有限公司 一种处理raid5坏扇区的方法
US20130159561A1 (en) * 2011-12-20 2013-06-20 Hon Hai Precision Industry Co., Ltd. System and method for monitoring hard disk drives
US20150339203A1 (en) * 2013-01-03 2015-11-26 International Business Machines Corporation False power failure alert impact mitigation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101682093A (zh) * 2008-03-27 2010-03-24 Lsi公司 改进的电池状况学习周期的设备和方法
CN101713805A (zh) * 2008-10-08 2010-05-26 纬创资通股份有限公司 检测一电源储存装置运作情形的方法及其电源储存装置
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN102508620A (zh) * 2011-12-01 2012-06-20 浪潮电子信息产业股份有限公司 一种处理raid5坏扇区的方法
US20130159561A1 (en) * 2011-12-20 2013-06-20 Hon Hai Precision Industry Co., Ltd. System and method for monitoring hard disk drives
US20150339203A1 (en) * 2013-01-03 2015-11-26 International Business Machines Corporation False power failure alert impact mitigation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114675791A (zh) * 2022-05-27 2022-06-28 苏州浪潮智能科技有限公司 一种磁盘处理方法、系统及电子设备

Similar Documents

Publication Publication Date Title
US8108179B2 (en) End of life prediction of flash memory
CN111480147B (zh) 用于针对纠错码功能的联机功能测试的系统和方法
US8134471B2 (en) Alert protocol for indicating a failure condition in a distributed system
CN102928690B (zh) 用于电子器件的异常检测方法
CN103354503A (zh) 一种可自动检测及替换故障节点的云存储系统及其方法
CN102279775A (zh) 一种Linux系统下的硬盘故障处理方法
WO2004092955A2 (en) Error management
CN111104283B (zh) 一种分布式存储系统的故障检测方法、装置、设备及介质
CN104156297A (zh) 告警方法和装置
CN109117322A (zh) 一种服务器主备冗余的控制方法、系统、设备及存储介质
CN112737800A (zh) 服务节点故障定位方法、调用链生成方法及服务器
CN112462920A (zh) 一种电源控制的方法、装置、服务器及存储介质
CN111722690B (zh) 服务器电源模块监控方法、装置、服务器和存储介质
US11455223B2 (en) Using system errors and manufacturer defects in system components causing the system errors to determine a quality assessment value for the components
CN104361713A (zh) 一种指标数据的监测方法、装置及服务器
CN106648470A (zh) 一种监控数据服务系统中磁盘阵列的方法和装置
CN109032320B (zh) 电池备份单元测试方法及相关设备
CN203289491U (zh) 一种故障节点可自动修复的集群存储系统
CN110968456B (zh) 分布式存储系统中故障磁盘的处理方法及装置
CN110377450A (zh) 一种硬件异常处理方法、系统及相关组件
CN113835961B (zh) 告警信息监控方法、装置、服务器及存储介质
US11467936B2 (en) Predicting motherboard connector failures
CN115174129A (zh) 异常节点检测方法、装置、计算机设备和存储介质
CN100334558C (zh) 监控仿真芯片内部eeprom的方法
CN113127239A (zh) 页面状态监控方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510