CN102638378B - 一种集成异构存储设备的海量存储系统监控方法 - Google Patents

一种集成异构存储设备的海量存储系统监控方法 Download PDF

Info

Publication number
CN102638378B
CN102638378B CN201210041078.9A CN201210041078A CN102638378B CN 102638378 B CN102638378 B CN 102638378B CN 201210041078 A CN201210041078 A CN 201210041078A CN 102638378 B CN102638378 B CN 102638378B
Authority
CN
China
Prior art keywords
information
event
monitoring
alarm event
safe class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210041078.9A
Other languages
English (en)
Other versions
CN102638378A (zh
Inventor
李琼
魏登萍
宋振龙
蒋句平
黄金锋
郑明玲
张鹤颖
张晓明
田宝华
李小芳
邢建英
屈婉霞
李宝峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201210041078.9A priority Critical patent/CN102638378B/zh
Publication of CN102638378A publication Critical patent/CN102638378A/zh
Application granted granted Critical
Publication of CN102638378B publication Critical patent/CN102638378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种集成异构存储设备的海量存储系统监控方法,要解决的技术问题是解决大规模计算机系统中众多异构存储设备的统一监控问题。技术方案是构建由存储设备信息表、系统配置信息表、监控信息框架、监控客户端、事件获取模块、告警信息映射模块和告警信息过滤模块组成的异构存储设备统一监控系统,该监控系统通过事件获取模块对海量存储系统中异构存储设备进行并行监控,获取各存储设备的监控结果,告警信息映射模块和告警信息过滤模块分别对监控结果进行映射和过滤,监控客户端以统一的格式展示异构存储设备的告警事件信息。采用本发明能保障存储设备的正常运行,减少维护成本,提高监控大规模存储系统中异构存储设备的效率。

Description

一种集成异构存储设备的海量存储系统监控方法
技术领域:
本发明涉及计算机系统中存储系统的监控方法,特别是大规模计算机系统的海量存储系统中异构存储设备的监控方法。
背景技术:
随着高性能计算机技术的发展,其在各行各业的广泛应用使得数据存储规模越来越大,海量存储技术得以飞速发展。作为大规模计算机系统中输入输出分系统的核心,海量存储系统在提供正常数据存取服务的基础上,还应该保证数据信息的不丢失,避免因灾难、突发事件、设备故障等造成数据损失。而实现这一保证的必要前提是确保海量存储系统中异构存储设备的正常运行。只有能够准确、及时、有效地监控存储设备的运行状态,才能及早发现故障或者故障可能,为排除故障以及故障存储设备的数据恢复和迁移提供保障。
大规模计算机系统通常由计算阵列、服务阵列、存储阵列、高速通信互联网络、高速I/O网络和系统管理网络组成。大规模计算机系统中存储阵列组成的存储系统通常具有存储设备的多样性和存储体系结构的异构性,磁盘阵列的规模和设备样数随着应用的需要不断增长,这给海量存储系统的管理和维护带来了困难。大规模异构存储设备的监控是能够快速地检测与隔离设备故障,提高系统运行的可用性与可靠性的基本前提。因此,高效的大规模异构存储设备的监控方法对于大规模计算机系统是非常重要的,受到用户(特别是超大规模计算机系统的管理人员、维护人员)的高度重视。
大规模计算机系统中的存储阵列监控系统一般通过大规模计算机系统中的系统管理网络与大规模计算机系统相连,存储设备的状态通常可以通过访问其存储控制器得到。通常,存储设备控制器都提供了外部可访问的存储设备事件获取接口,调用该接口可获取存储设备的状态信息。但是,不同类型的存储控制器提供了不同的访问接口或者监控客户端来获取或访问存储设备的监控状态。对于大规模存储系统中众多异构的存储设备,如果采用单个存储设备单独监控的方式将会使得监控效率极低、遍历监控所有存储设备的耗时也长。因此,迫切需要寻找一个统一的监控方法,使管理员能够在统一的环境下获知不同厂商、不同类型的存储设备的状态。目前还没有异构存储设备的统一监控方法的技术方案的公开报导。
发明内容:
本发明要解决的技术问题是针对大规模计算机系统中海量存储系统缺乏统一监控的问题,提出一种支持异构存储设备的统一监控方法,解决大规模计算机系统中众多异构存储设备的统一监控问题,保障存储设备的正常运行,减少维护成本,提高监控大规模存储系统中异构存储设备的效率。
本发明的技术方案是:
第一步,构建异构存储设备统一监控系统,异构存储设备统一监控系统通过系统管理网络与大规模计算机系统存储阵列、计算阵列和服务阵列相连;服务阵列中的监控管理结点通过访问异构存储设备统一监控系统获取大规模计算机系统中存储设备的监控信息。异构存储设备统一监控系统从监控管理结点获取用户监控请求信息(包括用户请求监控的存储设备名称列表、用户请求约束、预警形式),通过系统管理网络访问存储阵列中的各个异构存储设备控制器并获取存储设备的状态,最后统一汇总并将所请求监控的所有存储设备的监控信息返回给监控管理结点。监控信息包括存储设备的IP地址、告警事件的时间、告警事件名称、事件安全等级、相关描述和建议操作。异构存储设备统一监控系统由存储设备信息表、系统配置信息表、监控信息框架、监控客户端、事件获取模块、告警信息映射模块和告警信息过滤模块组成。
存储设备信息表记录异构存储设备统一监控系统支持的各种异构存储设备的配置信息,通过监控客户端进行更新和维护;系统配置信息表记录异构存储设备统一监控系统支持的各种异构存储设备的事件获取接口名称,通过监控客户端进行更新和维护;监控信息框架定义了系统中监控信息的描述结构,通过监控客户端进行更新和维护;监控客户端是实现监控管理结点对异构存储设备统一监控的软件模块,从监控管理结点接收用户的访问请求,生成用户请求监控的存储设备名称列表并发送给事件获取模块,对异构存储设备监控结果进行展示,并对存储设备信息表、系统配置信息表和监控信息框架进行维护与更新;事件获取模块是负责从监控客户端接收用户请求监控的存储设备名称列表,并获取存储设备运行状态的软件模块;告警信息映射模块负责将告警事件信息与监控信息框架进行映射,使得所有的告警事件信息都具备相同描述框架;告警信息过滤模块负责将告警信息映射模块输出的告警事件信息根据用户请求约束进行过滤,使得监控结果符合用户的要求。
存储设备信息表中每一项包括存储设备IP地址、设备类型、设备厂商、存储设备控制器类型ID。其中存储设备IP地址是指该存储设备在整个计算机系统中分配得到的地址,计算机系统的其他组成部分通过该地址对其进行访问;设备类型指存储设备的类型;设备厂商指存储设备的生产厂商;存储设备控制器类型ID是唯一标识存储设备控制器类型的标识,存储设备控制器是负责管理相应存储设备的控制器,由生产厂商销售存储设备时一并提供。
系统配置信息表的每一项包括存储设备控制器类型ID和事件获取接口名称。事件获取接口是存储设备控制器中提供的访问告警事件信息的接口的名称。不同类型、不同厂商的存储设备控制器具有不同的驱动程序,因而其获取存储设备告警事件信息的接口也不一样。因此,在系统配置信息表中记录每个存储设备控制器类型对于异构存储设备统一监控系统针对异构的存储设备调用正确的事件获取接口至关重要。
监控信息框架由告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表组成。告警事件信息元属性表中存放异构存储设备统一监控系统返回的告警事件信息的元属性信息,包括存储设备名称、IP地址、时间、告警事件名称、事件安全等级、事件描述、建议操作七类属性。事件安全等级库中存放异构存储设备统一监控系统返回的告警事件信息的事件安全等级属性的值,这些值按紧急程度排序分为紧急的、严重的、重要的、警告、通知五类。告警事件信息映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的告警事件信息元属性与告警事件信息元属性表中的元属性的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的告警事件信息的元属性与告警事件信息元属性表中的元属性的映射规则。例如,某个存储设备控制器A返回的告警事件信息的元属性包括IP Address、Level和Description三类,该异构存储设备在告警事件映射规则表中的相应表项的告警事件信息映射规则包括“IP Address<->IP地址”、“Level<->事件安全等级”和“Description<->事件描述”,分别表示A中的“IP Address”与监控信息框架中的“IP地址”等价、A中的“Level”与监控信息框架中的“事件安全等级”等价、A中的“Description”与监控信息框架中的“事件描述”等价。事件安全等级映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则。例如,某类存储设备A中使用的事件安全等级为I、II、III三类,该类异构存储设备在事件安全等级映射规则表中的相应表项的事件安全等级映射规则有“I<->紧急的”、“II<->重要的”和“III<->警告”三条,分别表示A中的“I”级与监控信息框架中“紧急的”等价、A中的“II”级与监控信息框架中的“重要的”等价、A中的“III”级与监控信息框架中的“警告”等价。
监控客户端是接收从监控管理结点发出的访问请求,生成监控请求信息并展现异构存储设备监控结果的软件模块,是监控管理结点与异构存储设备统一监控系统进行交互的桥梁。监控客户端由用户监控请求信息生成模块、存储设备信息维护模块、系统配置信息维护模块、监控信息框架维护模块和监控信息展现模块组成,与事件获取模块、告警信息过滤模块、系统配置信息表、存储设备信息表和监控信息框架、监控管理结点相连。用户监控请求信息生成模块从监控管理结点获取用户监控请求信息(包括存储设备名称(ID)列表、用户请求约束和预警形式),并将用户选定的要监控的存储设备名称列表发送给事件获取模块,将用户请求约束发送给告警信息过滤模块,将预警形式发送给监控信息展现模块。存储设备名称列表由一个或者多个存储设备的名称组成,且每个存储设备由大规模计算机系统中一个唯一的ID来标识;用户请求约束包括事件安全等级约束和时间约束。事件安全等级约束指定用户感兴趣的告警事件信息的事件安全等级,具有事件安全等级的集合(例如,{“紧急的”,“严重的”})和紧急程度高于某个事件安全等级(例如,紧急程度>“重要的”)两种形式。时间约束为一段时间间隔,时间单位为秒,用于用户指定需要监控的在某个时间段内发生的告警事件;预警形式指定监控信息的展现形式,主要分为警报、亮灯、弹出对话框、邮件等形式。监控信息展现模块从告警信息过滤模块接收过滤后的满足用户请求约束的告警事件信息,通过用户界面按照预警形式展示告警事件信息。系统配置信息维护模块是对系统配置信息表进行添加、删除和修改的软件模块。存储设备信息维护模块是对存储设备信息表进行添加、删除和修改的软件模块。监控信息框架维护模块是对监控信息框架进行维护与更新的软件模块,实现对监控信息框架中的告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表的添加、删除和修改操作。
事件获取模块与监控客户端、大规模计算机系统中的存储阵列、系统配置信息表、存储设备信息表和告警信息映射模块相连。事件获取模块由一个主进程、若干子进程和告警访问接口应用程序组成,主进程从监控客户端的用户监控请求信息生成模块获取需要监控的存储设备名称列表,根据存储设备名称列表的项数(即存储设备名称列表中存储设备的个数)创建相应数目的子进程,每个子进程负责一个存储设备监控信息的获取。每个子进程查找存储设备信息表获得存储设备的IP地址和存储设备控制器类型ID,若存储设备信息表中不存在请求的存储设备表项,则表示异构存储设备统一监控系统不支持对该存储设备的监控,将监控失败信息返回给监控客户端的监控信息展现模块;若存储设备信息表中存在请求的存储设备表项,表示异构存储设备统一监控系统支持该存储设备的监控,则从存储设备信息表中取出请求监控的存储设备的IP地址,再查找系统配置信息表获得存储设备控制器中的事件获取接口名称,并调用告警访问接口应用程序获取告警事件信息。告警访问接口应用程序是负责获取具体存储设备告警事件信息的软件模块,它根据存储设备的IP地址访问存储设备中的事件获取接口获取相应存储设备的告警事件信息,将告警事件信息返回给子进程。主进程将所有子进程获得的存储设备的告警事件信息返回给告警信息映射模块。
告警信息映射模块与事件获取模块、监控信息框架和告警信息过滤模块相连,它从事件获取模块获取从存储设备获取的告警事件信息,将告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,使得所有的告警事件信息都具备相同的描述框架,并将映射后的告警事件信息返回给告警信息过滤模块。告警信息映射模块由告警事件信息映射模块和事件安全等级映射模块组成。告警事件信息映射模块按照告警事件信息映射规则表中的告警事件信息映射规则将异构存储设备返回的不同告警事件信息体系下的告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,将异构存储设备返回的告警事件信息转化为元属性信息表示的告警事件信息,即转化后的告警事件信息由存储设备名称、IP地址、时间、告警事件名称、事件安全等级、事件描述、建议操作七类属性表示,输出给事件安全等级映射模块。事件安全等级映射模块按照事件安全等级映射规则表中的事件安全等级映射规则将异构存储设备返回的告警事件信息中的不同事件安全等级体系下的事件安全等级与事件安全等级库中的事件安全等级进行映射,将异构存储设备返回的所有告警事件信息的事件安全等级的值转换为事件安全等级属性的值,即紧急的、严重的、重要的、警告、通知五类,输出给告警信息过滤模块。
告警信息过滤模块与告警信息映射模块和监控客户端相连,告警信息过滤模块收到告警信息映射模块输出的映射后的告警事件信息后,从监控客户端获取用户监控请求中的用户请求约束,主要包括事件安全等级约束和时间约束,依次针对这两类约束信息对告警事件信息进行过滤。告警信息过滤模块过滤出满足事件安全等级约束的告警事件信息。若事件安全等级约束为事件安全等级的集合时,告警信息过滤模块过滤出具有事件安全等级约束中列举的相应事件安全等级的告警事件信息,例如,若事件安全等级约束为“紧急的”和“严重的”的集合,则告警信息过滤模块返回具有这两类事件安全等级的告警事件信息;若事件安全等级约束为紧急程度高于某个事件安全等级时,告警信息过滤模块首先根据事件安全等级的紧急程度排序获取高于某个事件安全等级所有事件安全等级的集合,再过滤出具有该集合中包含的相应事件安全等级的告警事件信息,例如,当监控请求中的事件安全等级约束为紧急程度高于“重要的”时,告警信息过滤模块将按照事件安全等级的紧急程度排序返回事件安全等级为“紧急的”和“严重的”两类告警事件信息。告警信息过滤模块只将时间约束间隔内的告警事件信息返回给监控客户端。
第二步,异构存储设备统一监控系统对海量存储系统中异构存储设备进行统一监控,具体方法为:
2.1.启动异构存储设备统一监控系统,由监控客户端的存储设备信息维护模块提取海量存储系统中所有存储设备的配置信息,并初始化存储设备信息表,表中的每一项初始化为一个存储设备的配置信息。若某个存储设备对应的存储设备信息表项中的某些元素为空,由监控客户端的存储设备信息维护模块提示对该存储设备进行配置,直到所有存储设备对应的存储设备信息表项都不为空。监控客户端的系统配置信息维护模块检查是否每类存储设备都在系统配置信息表中找到相应的表项,若未找到,则由监控客户端的系统配置信息维护模块对相应类型的存储设备的相关信息进行配置,即添加相应存储设备类型的系统配置信息,直到每类存储设备都在系统配置信息表中找到相应的表项,且对应表项中的所有元素都不为空。监控客户端的监控信息框架维护模块检查监控信息框架中的事件安全等级映射规则表和告警事件信息映射规则表是否为系统配置信息表中出现的每类存储设备都定义了相应的映射规则,若不是,则由监控信息框架维护模块对相应存储设备类型的事件安全等级映射规则表和告警事件信息映射规则表进行配置,即添加相应存储设备类型的事件安全等级映射规则和告警信息映射规则,直到每类存储设备都在事件安全等级映射规则表和告警事件信息映射规则表中找到相应的表项,且对应表项中的所有元素都不为空。
2.2.监控客户端的用户监控请求信息生成模块判断是否有监控管理结点发送过来的用户请求,若有,执行步骤2.3,否则转步骤2.2继续等待。
2.3.监控客户端的用户监控请求信息生成模块判断用户请求的类型,若为用户监控请求,执行步骤2.4;若为退出异构存储设备统一监控系统请求,执行步骤2.3.1;若为维护存储设备信息表请求,执行步骤2.3.2;若为维护系统配置信息表请求,执行步骤2.3.3;若为维护监控信息框架请求,执行步骤2.3.4。
2.3.1.退出异构存储设备统一监控系统,结束。
2.3.2.存储设备信息维护模块根据用户的输入对存储设备信息表中的信息进行添加、删除和修改,转步骤2.2。
2.3.3.系统配置信息维护模块根据用户的输入对系统配置信息表中的信息进行添加、删除和修改,转步骤2.2。
2.3.4.监控信息框架维护模块根据用户的输入对监控信息框架中的告警事件信息元属性表、事件安全等级库进行添加、删除和修改,并对每类存储设备的事件安全等级映射规则和告警事件信息映射规则进行添加、删除和修改,转步骤2.2。
2.4.监控客户端的用户监控请求信息生成模块读取存储设备信息表,获取所监控海量存储系统中的存储设备名称列表,供用户选择。
2.5.用户监控请求信息生成模块获取用户从存储设备名称列表中选择的需要监控的存储设备和用户指定的用户请求约束和预警形式,生成需要监控的请求信息,将需要监控的存储设备名称列表发送给事件获取模块,将预警形式发送给监控信息展现模块,并将用户请求约束发送给告警信息过滤模块,执行步骤2.6。
2.6.事件获取模块从监控客户端的用户监控请求信息生成模块获取需要监控的存储设备名称列表,主进程根据需要监控的存储设备名称列表中存储设备的数目创建相应数目的子进程,每个子进程对应一个存储设备,负责获取该存储设备的监控信息。所有子进程获取相应的监控信息后,主进程收集各子进程获得的监控信息,并将获取的监控信息发送给告警信息映射模块。子进程获取存储设备监控信息的操作是并行完成的,子进程之间没有任何的通信。事件获取模块的流程是:
2.6.1.主进程从需要监控的存储设备名称列表中读取需要监控的存储设备,并为表中每一个存储设备创建一个子进程。如果需要监控的存储设备名称列表为空,主进程发送监控失败的信息给监控客户端的监控信息展现模块,主进程结束,转步骤2.9。若需要监控的存储设备名称列表不为空,则根据需要监控的存储设备名称列表中存储设备的数目创建相应数目的子进程,执行步骤2.6.2。
2.6.2.子进程根据请求监控的存储设备的名称,查找存储设备信息表获取存储设备的IP地址和存储设备控制器类型ID。判断存储设备信息表中的IP地址、存储设备控制器类型ID是否为空,若有一个属性为空,则将存储设备信息不全的信息返回给主进程,转步骤2.6.6;若全部不为空,则执行步骤2.6.3。
2.6.3.子进程查找系统配置信息表获取对应存储设备控制器类型的事件获取接口名称。若事件获取接口名称为空,则将异构存储设备统一监控系统不支持该类存储设备的监控信息返回给主进程,转步骤2.6.6;若不为空,则执行步骤2.6.4。
2.6.4.子进程调用告警访问接口应用程序,并将存储设备控制器的IP地址和步骤2.6.3获取的事件获取接口名称作为参数发送给告警访问接口应用程序。若告警访问接口应用程序启动成功,转步骤2.6.5;若启动不成功,则将监控失败的信息返回子进程,转步骤2.6.6。
2.6.5.告警访问接口应用程序通过访问存储设备控制器访问接口获取存储设备的监控信息,具体步骤如下:
2.6.5.1.根据存储设备控制器的IP地址,远程登录到该存储设备控制器。
2.6.5.2.调用该存储设备控制器中相应的事件获取接口,判断该接口获取告警事件信息是否成功,若成功则执行步骤2.6.5.3;否则重新执行步骤2.6.5.2,直到获取成功或超时,超时时间阈值为10分钟。若超时,则将监控失败的信息返回子进程,转步骤2.6.6。
2.6.5.3.解析步骤2.6.5.2获取的告警事件信息,抽取告警事件信息中每个属性的值,形成由抽取出的各个属性及其值的二元组组成的告警事件信息。
2.6.5.4.告警访问接口应用程序将步骤2.6.5.3获取的告警事件信息返回给子进程,执行步骤2.6.5.5。
2.6.5.5.告警访问接口应用程序结束,执行步骤2.6.6。
2.6.6.子进程将对应存储设备的监控结果发送给主进程,执行步骤2.6.7。
2.6.7.子进程结束,执行步骤2.6.8。
2.6.8.主进程获取各个子进程返回的监控结果,若还存在某个子进程未返回监控结果,则主进程等待,直到所有子进程都返回监控结果;主进程获取所有子进程返回的监控结果后将其发送给告警信息映射模块,主进程结束,执行步骤2.7。
2.7.告警信息映射模块接收到事件获取模块返回的告警事件信息后,向告警事件信息映射模块导入告警事件信息元属性表中的告警事件信息元属性,向事件安全等级映射模块导入事件安全等级库中的事件安全等级。告警信息映射模块依次对每条告警事件信息进行映射后,将映射后的告警事件信息发送给告警信息过滤模块。告警信息映射模块对每条告警事件信息的映射流程是:
2.7.1.告警事件信息映射模块查找告警事件信息映射规则表,获取存储设备类型对应的告警事件信息映射规则,执行步骤2.7.2。
2.7.2.告警事件信息映射模块根据步骤2.7.1获取的告警事件信息映射规则将告警事件信息中各个二元组的属性映射成告警事件信息元属性表中告警事件信息的相应属性,属性的值不变,即映射后的告警事件信息由告警事件信息元属性表中告警事件信息的七类属性表示,将映射后的告警事件信息发送给事件安全等级映射模块,执行步骤2.7.3。
2.7.3.事件安全等级映射模块查找事件安全等级映射规则表,获取存储设备类型对应的事件安全等级映射规则,执行步骤2.7.4。
2.7.4.事件安全等级映射模块根据步骤2.7.3获取的事件安全等级映射规则将每条告警事件信息中的事件安全等级的值映射成事件安全等级库中的事件安全等级,即映射后的告警事件信息的事件安全等级为紧急的、严重的、重要的、警告、通知五类。
2.8.告警信息过滤模块从告警信息映射模块获取映射后的告警事件信息,并根据用户请求约束对其进行过滤,流程是:
2.8.1.告警信息过滤模块按照事件安全等级约束对告警事件信息进行过滤。若事件安全等级约束为事件安全等级的集合时,告警信息过滤模块过滤出具有事件安全等级约束中列举的相应事件安全等级的告警事件信息,例如,若事件安全等级约束为“紧急的”和“严重的”的集合,则告警信息过滤模块返回具有这两类事件安全等级的告警事件信息;若事件安全等级约束为紧急程度高于某个事件安全等级,告警信息过滤模块首先根据事件安全等级的紧急程度排序获取高于某个事件安全等级所有事件安全等级的集合,再过滤出具有该集合中包含的相应事件安全等级的告警事件信息,例如,当监控请求中的事件安全等级约束为紧急程度高于“重要的”时,告警信息过滤模块将按照事件安全等级的紧急程度排序返回事件安全等级为“紧急的”和“严重的”两类告警事件信息,执行步骤2.8.2。
2.8.2.告警信息过滤模块过滤出时间约束间隔内的步骤2.8.1返回的告警事件信息。
2.8.3.告警信息过滤模块将过滤后的满足用户请求约束的告警事件信息返回给监控客户端的监控信息展现模块,执行步骤2.9。
2.9.监控信息展现模块监听告警信息过滤模块发送的过滤后的告警事件信息和事件获取模块发送的监控失败信息,若有,执行步骤2.10,若无,转步骤2.9继续监听。
2.10.监控客户端的监控信息展现模块判断接收到信息的类型,若为监控失败的信息,则在监控界面上显示“本次请求的监控失败”;若为告警信息过滤模块发送的过滤后的告警事件信息,则在监控界面上显示本次监控请求获取的告警事件信息。一次监控请求处理结束,执行步骤2.2。
异构存储设备统一监控系统启动后,只有当接收到监控管理结点发送过来的退出异构存储设备统一监控系统请求后,才结束系统运行并退出,否则将循环等待用户的监控请求和系统维护请求。
采用本发明设计的异构存储设备统一监控方法,可以达到以下技术效果:
1)与目前业界存储设备监控技术相比,本发明在各种存储设备单独监控的基础上,构造并实现了一个支持异构存储设备统一监控系统,通过该异构存储设备统一监控系统实现了对不同存储设备的同时监控,使得对异构存储设备的监控可以在同一个系统下进行,保证了大规模计算机系统中异构存储设备监控的有效性,为存储子系统的可靠运行提供了基本保证。
2)采用本发明进行异构存储设备监控时,存储设备的异构性与监控客户端无关,可以任意扩展支持对不同厂商、不同存储体系结构的存储设备的监控,只需向系统配置信息表增加相应存储设备的控制器类型及事件获取接口名称并维护存储设备信息表即可,不会影响系统的正常运行,相互之间也没有任何约束关系。大大提高了异构存储设备监控的可扩展性,特别是对于大规模计算机系统在各个应用领域的应用带来了方便。
3)本发明异构存储设备统一监控系统中所选的所有存储设备的监控都是同时进行的,当系统规模非常大时,采用本发明的监控效率得到了十分明显的提高。例如对于具有128个需监控的存储设备时,假设对每个存储设备的监控信息获取所需的时间是T,如果采用逐个访问的方法,获取全部存储设备的监控状态的时间是128T。而采用本发明对所有存储设备进行监控的时间为T。因此,整个存储系统的监控具有良好的并行性,特别有利于对大规模计算机系统中海量存储系统的监控。
附图说明:
图1是异构存储设备统一监控系统在大规模计算机系统中所处的位置示意图。
图2为本发明总体流程图。
图3为本发明第一步构建的异构存储设备统一监控系统的具体结构图。
图4为本发明第二步单个子进程获取监控信息的流程图。
具体实施方式:
下面结合说明书附图来说明本发明的具体实施方式。
图1是本发明异构存储设备统一监控系统在大规模计算机系统中所处的位置示意图,大规模计算机系统由计算阵列、服务阵列、存储阵列、高速通信互联网络、高速I/O网络和系统管理网络组成。异构存储设备统一监控系统通过系统管理网路与大规模计算机系统相连,实现对存储阵列的监控。异构存储设备统一监控系统的输入为服务阵列中监控管理结点发送的用户请求信息(包括存储设备名称列表、用户请求约束、预警形式),输出为请求监控的存储设备的告警事件信息。
图2本发明总体流程图。本发明包括以下步骤:
第一步,设计异构存储设备统一监控系统。
第二步,异构存储设备统一监控系统对海量存储系统中异构存储设备进行统一监控,监控客户端首先从监控管理结点获取用户请求信息,生成请求监控的存储设备名称列表、用户请求约束和预警形式,并将需要监控的存储设备名称列表发送给事件获取模块,将用户请求约束发送给告警信息过滤模块。事件获取模块主进程根据用户请求的需要监控的存储设备名称列表创建相应数目的子进程,各个子进程对每一个存储设备进行并行监控,分别获取每个异构存储设备的监控信息,详细流程详见附图4所示。然后,主进程将子进程返回的各个异构存储设备的监控信息进行汇总并发送给告警信息映射模块。告警信息映射模块将每个存储设备的告警事件信息映射到监控信息框架,形成具有统一格式的告警事件信息。告警信息过滤模块根据用户请求约束对映射后的告警事件信息进行过滤后返回给监控客户端。最后,监控客户端按照用户请求中指定的预警形式向用户展现异构存储设备的告警事件信息。
图3为本发明第一步构建的异构存储设备统一监控系统的具体结构图。异构存储设备统一监控系统由存储设备信息表、系统配置信息表、监控信息框架、监控客户端、事件获取模块、告警信息映射模块和告警信息过滤模块组成。
存储设备信息表记录异构存储设备统一监控系统支持的各种异构存储设备的配置信息,通过监控客户端进行更新和维护;系统配置信息表记录异构存储设备统一监控系统支持的各种异构存储设备的事件获取接口名称,通过监控客户端进行更新和维护;监控信息框架定义了系统中监控信息的描述框架,即统一表示方法,通过监控客户端进行更新和维护;监控客户端是实现监控管理结点对异构存储设备统一监控的软件模块,从监控管理结点接收用户的访问请求,生成用户请求监控的存储设备名称列表并发送给事件获取模块,对异构存储设备监控结果进行展示,并对存储设备信息表、系统配置信息表和监控信息框架进行维护与更新;事件获取模块是负责从监控客户端接收用户请求监控的存储设备名称列表,并获取存储设备运行状态的软件模块;告警信息映射模块负责将告警事件信息与监控信息框架进行映射,使得所有的告警事件信息都具备相同描述框架;告警信息过滤模块负责将告警信息映射模块输出的告警事件信息根据用户请求约束进行过滤,使得监控结果符合用户的要求。
存储设备信息表中每一项包括存储设备IP地址、设备类型、设备厂商、存储设备控制器类型ID。其中存储设备IP地址是指该存储设备在整个计算机系统中分配得到的地址,计算机系统的其他组成部分通过该地址对其进行访问;设备类型指存储设备的类型;设备厂商指存储设备的生产厂商;存储设备控制器类型ID是唯一标识存储设备控制器类型的标识,存储设备控制器是负责管理相应存储设备的控制器,由生产厂商销售存储设备时一并提供。
系统配置信息表的每一项包括存储设备控制器类型ID和事件获取接口名称。事件获取接口是存储设备控制器中提供的访问告警事件信息的接口的名称。
监控信息框架由告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表组成。告警事件信息元属性表中存放异构存储设备统一监控系统返回的告警事件信息的元属性信息,包括存储设备名称、IP地址、时间、告警事件名称、事件安全等级、事件描述、建议操作七类属性。事件安全等级库中存放异构存储设备统一监控系统返回的告警事件信息的事件安全等级属性的值,这些值按紧急程度排序分为紧急的、严重的、重要的、警告、通知五类。告警事件信息映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的告警事件信息元属性与告警事件信息元属性表中的元属性的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的告警事件信息的元属性与告警事件信息元属性表中的元属性的映射规则。事件安全等级映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则。
监控客户端是接收从监控管理结点发出的访问请求,生成监控请求信息并展现异构存储设备监控结果的软件模块,是监控管理结点与异构存储设备统一监控系统进行交互的桥梁。监控客户端由用户监控请求信息生成模块、存储设备信息维护模块、系统配置信息维护模块、监控信息框架维护模块和监控信息展现模块组成,与事件获取模块、告警信息过滤模块、系统配置信息表、存储设备信息表和监控信息框架、监控管理结点相连。用户监控请求信息生成模块从监控管理结点获取用户监控请求信息(包括存储设备名称(ID)列表、用户请求约束和预警形式),并将用户选定的要监控的存储设备名称列表发送给事件获取模块,将用户请求约束发送给告警信息过滤模块,将预警形式发送给监控信息展现模块。存储设备名称列表由一个或者多个存储设备的名称组成,且每个存储设备由大规模计算机系统中一个唯一的ID来标识;用户请求约束包括事件安全等级约束和时间约束。事件安全等级约束指定用户感兴趣的告警事件信息的事件安全等级,具有事件安全等级的集合(例如,{“紧急的”,“严重的”})和紧急程度高于某个事件安全等级(例如,紧急程度>“重要的”)两种形式。时间约束为一段时间间隔,时间单位为秒,用于用户指定需要监控的在某个时间段内发生的告警事件;预警形式指定监控信息的展现形式,主要分为警报、亮灯、弹出对话框、邮件等形式。监控信息展现模块从告警信息过滤模块接收过滤后的满足用户请求约束的告警事件信息,通过用户界面按照预警形式展示告警事件信息。系统配置信息维护模块是对系统配置信息表进行添加、删除和修改的软件模块。存储设备信息维护模块是对存储设备信息表进行添加、删除和修改的软件模块。监控信息框架维护模块是对监控信息框架进行维护与更新的软件模块,实现对监控信息框架中的告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表的添加、删除和修改操作。
事件获取模块与监控客户端、大规模计算机系统中的存储阵列、系统配置信息表、存储设备信息表和告警信息映射模块相连。事件获取模块由一个主进程、若干子进程和告警访问接口应用程序组成,主进程从监控客户端的用户监控请求信息生成模块获取需要监控的存储设备名称列表,根据存储设备名称列表的项数(即存储设备名称列表中存储设备的个数)创建相应数目的子进程,每个子进程负责一个存储设备监控信息的获取。每个子进程查找存储设备信息表获得存储设备的IP地址和存储设备控制器类型ID,若存储设备信息表中不存在请求的存储设备表项,则表示异构存储设备统一监控系统不支持对该存储设备的监控,将监控失败信息返回给监控客户端的监控信息展现模块;若存储设备信息表中存在请求的存储设备表项,表示异构存储设备统一监控系统支持该存储设备的监控,则从存储设备信息表中取出请求监控的存储设备的IP地址,再查找系统配置信息表获得存储设备控制器中的事件获取接口名称,并调用告警访问接口应用程序获取告警事件信息。告警访问接口应用程序是负责获取具体存储设备告警事件信息的软件模块,它根据存储设备的IP地址访问存储设备中的事件获取接口获取相应存储设备的告警事件信息,将告警事件信息返回给子进程。主进程将所有子进程获得的存储设备的告警事件信息返回给告警信息映射模块。
告警信息映射模块与事件获取模块、监控信息框架和告警信息过滤模块相连,它从事件获取模块获取从存储设备获取的告警事件信息,将告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,使得所有的告警事件信息都具备相同的描述框架,并将映射后的告警事件信息返回给告警信息过滤模块。告警信息映射模块由告警事件信息映射模块和事件安全等级映射模块组成。告警事件信息映射模块按照告警事件信息映射规则表中的告警事件信息映射规则将异构存储设备返回的不同告警事件信息体系下的告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,将异构存储设备返回的告警事件信息转化为元属性信息表示的告警事件信息,即转化后的告警事件信息由存储设备名称、IP地址、时间、告警事件名称、事件安全等级、事件描述、建议操作七类属性表示,输出给事件安全等级映射模块。事件安全等级映射模块按照事件安全等级映射规则表中的事件安全等级映射规则将异构存储设备返回的告警事件信息中的不同事件安全等级体系下的事件安全等级与事件安全等级库中的事件安全等级进行映射,将异构存储设备返回的所有告警事件信息的事件安全等级的值转换为事件安全等级属性的值,即紧急的、严重的、重要的、警告、通知五类,输出给告警信息过滤模块。
告警信息过滤模块与告警信息映射模块和监控客户端相连,告警信息过滤模块收到告警信息映射模块输出的映射后的告警事件信息后,从监控客户端获取用户监控请求中的用户请求约束,主要包括事件安全等级约束和时间约束,依次针对这两类约束信息对告警事件信息进行过滤。告警信息过滤模块过滤出满足事件安全等级约束的告警事件信息。若事件安全等级约束为事件安全等级的集合时,告警信息过滤模块过滤出具有事件安全等级约束中列举的相应事件安全等级的告警事件信息;若事件安全等级约束为紧急程度高于某个事件安全等级时,告警信息过滤模块首先根据事件安全等级的紧急程度排序获取高于某个事件安全等级所有事件安全等级的集合,再过滤出具有该集合中包含的相应事件安全等级的告警事件信息。告警信息过滤模块只将时间约束间隔内的告警事件信息返回给监控客户端。
图4为本发明第二步单个子进程获取监控信息的流程图,子进程获取某个存储设备的监控信息的流程如下:
1.子进程根据请求监控的存储设备的名称,查找存储设备信息表获取存储设备的IP地址和存储设备控制器类型ID。判断存储设备信息表中的IP地址、存储设备控制器类型ID是否为空,若有一个属性为空,则将存储设备信息不全的信息返回给主进程,转步骤5;若全部不为空,则执行步骤2。
2.子进程查找系统配置信息表获取对应存储设备控制器类型的事件获取接口名称。若事件获取接口名称为空,则将异构存储设备统一监控系统不支持该类存储设备的监控信息返回给主进程,转步骤5;若不为空,则执行步骤3。
3.子进程调用告警访问接口应用程序,并将存储设备控制器的IP地址和步骤2获取的事件获取接口名称作为参数发送给告警访问接口应用程序。若告警访问接口应用程序启动成功,执行步骤4;若启动不成功,则将监控失败的信息返回子进程,转步骤5。
4.告警访问接口应用程序通过访问存储设备控制器访问接口获取存储设备的监控信息,具体步骤如下:
4.1.根据存储设备控制器的IP地址,远程登录到该存储设备控制器。
4.2.调用该存储设备控制器中相应的事件获取接口,判断该接口获取告警事件是否成功,若成功则执行步骤4.3;否则重新执行步骤4.2,直到获取成功或超时,超时时间阈值为10分钟。若超时,则将监控失败的信息返回子进程,转步骤5。
4.3.解析步骤4.2获取的告警事件信息,抽取告警事件信息中每个属性的值,形成由抽取出的各个属性及其值的二元组组成的告警事件信息。
4.4.告警访问接口应用程序将步骤4.3获取的告警事件信息返回给子进程,执行步骤4.5。
4.5.告警访问接口应用程序结束,执行步骤5。
5.子进程将存储设备对应的监控结果发送给主进程,执行步骤6。
6.子进程结束。

Claims (7)

1.一种集成异构存储设备的海量存储系统监控方法,其特征在于包括以下步骤:
第一步,构建异构存储设备统一监控系统,异构存储设备统一监控系统通过系统管理网络与大规模计算机系统存储阵列、计算阵列和服务阵列相连;异构存储设备统一监控系统从服务阵列中的监控管理结点获取用户监控请求信息,通过系统管理网络访问存储阵列中的各个异构存储设备控制器并获取存储设备的状态,最后统一汇总并将所请求监控的所有存储设备的监控信息返回给监控管理结点;用户监控请求信息包括用户请求监控的存储设备名称列表、用户请求约束、预警形式;监控信息包括存储设备的IP地址、告警事件的时间、告警事件名称、事件安全等级、相关描述和建议操作;异构存储设备统一监控系统由存储设备信息表、系统配置信息表、监控信息框架、监控客户端、事件获取模块、告警信息映射模块和告警信息过滤模块组成;
存储设备信息表记录异构存储设备统一监控系统支持的各种异构存储设备的配置信息,通过监控客户端进行更新和维护;系统配置信息表记录异构存储设备统一监控系统支持的各种异构存储设备的事件获取接口名称,通过监控客户端进行更新和维护;监控信息框架定义了系统中监控信息的描述结构,通过监控客户端进行更新和维护;监控客户端是实现监控管理结点对异构存储设备统一监控的软件模块,从监控管理结点接收用户的访问请求,生成用户请求监控的存储设备名称列表并发送给事件获取模块,对异构存储设备监控结果进行展示,并对存储设备信息表、系统配置信息表和监控信息框架进行维护与更新;事件获取模块是负责从监控客户端接收用户请求监控的存储设备名称列表,并获取存储设备运行状态的软件模块;告警信息映射模块负责将告警事件信息与监控信息框架进行映射,使得所有的告警事件信息都具备相同描述框架;告警信息过滤模块负责将告警信息映射模块输出的告警事件信息根据用户请求约束进行过滤,使得监控结果符合用户的要求;
存储设备信息表中每一项包括存储设备IP地址、设备类型、设备厂商、存储设备控制器类型ID,存储设备IP地址是指该存储设备在整个计算机系统中分配得到的地址;设备类型指存储设备的类型;设备厂商指存储设备的生产厂商;存储设备控制器类型ID是唯一标识存储设备控制器类型的标识;
系统配置信息表的每一项包括存储设备控制器类型ID和事件获取接口名称,事件获取接口是存储设备控制器提供的访问告警事件信息的接口的名称;
监控信息框架由告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表组成;告警事件信息元属性表中存放异构存储设备统一监控系统返回的告警事件信息的元属性信息;事件安全等级库中存放异构存储设备统一监控系统返回的告警事件信息的事件安全等级属性的值;告警事件信息映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的告警事件信息元属性与告警事件信息元属性表中的元属性的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的告警事件信息的元属性与告警事件信息元属性表中的元属性的映射规则;事件安全等级映射规则表记录异构存储设备统一监控系统支持的各种异构存储设备中使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则,表中每一项包括存储设备控制器类型ID和该类存储设备使用的不同的事件安全等级到监控信息框架中的事件安全等级的映射规则;
监控客户端是接收从监控管理结点发出的访问请求,生成监控请求信息并展现异构存储设备监控结果的软件模块,是监控管理结点与异构存储设备统一监控系统进行交互的桥梁;监控客户端由用户监控请求信息生成模块、存储设备信息维护模块、系统配置信息维护模块、监控信息框架维护模块和监控信息展现模块组成,与事件获取模块、告警信息过滤模块、系统配置信息表、存储设备信息表和监控信息框架、监控管理结点相连;用户监控请求信息生成模块从监控管理结点获取用户监控请求信息,并将用户选定的要监控的存储设备名称列表发送给事件获取模块,将用户请求约束发送给告警信息过滤模块,将预警形式发送给监控信息展现模块,用户监控请求信息包括存储设备名称ID列表、用户请求约束和预警形式;存储设备名称列表由一个或者多个存储设备的名称组成,且每个存储设备由大规模计算机系统中一个唯一的ID来标识;用户请求约束包括事件安全等级约束和时间约束;事件安全等级约束指定用户感兴趣的告警事件信息的事件安全等级,具有事件安全等级的集合和紧急程度高于某个事件安全等级两种形式;时间约束为一段时间间隔,时间单位为秒;预警形式指定监控信息的展现形式;监控信息展现模块从告警信息过滤模块接收过滤后的满足用户请求约束的告警事件信息,通过用户界面按照预警形式展示告警事件信息;系统配置信息维护模块是对系统配置信息表进行添加、删除和修改的软件模块;存储设备信息维护模块是对存储设备信息表进行添加、删除和修改的软件模块;监控信息框架维护模块是对监控信息框架进行维护与更新的软件模块,实现对监控信息框架中的告警事件信息元属性表、事件安全等级库、告警事件信息映射规则表和事件安全等级映射规则表的添加、删除和修改操作;
事件获取模块与监控客户端、大规模计算机系统中的存储阵列、系统配置信息表、存储设备信息表和告警信息映射模块相连;事件获取模块由一个主进程、若干子进程和告警访问接口应用程序组成,主进程从监控客户端的用户监控请求信息生成模块获取需要监控的存储设备名称列表,根据存储设备名称列表的项数创建相应数目的子进程,每个子进程负责一个存储设备监控信息的获取;每个子进程查找存储设备信息表获得存储设备的IP地址和存储设备控制器类型ID,若存储设备信息表中不存在请求的存储设备表项,则表示异构存储设备统一监控系统不支持对该存储设备的监控,将监控失败信息返回给监控客户端的监控信息展现模块;若存储设备信息表中存在请求的存储设备表项,表示异构存储设备统一监控系统支持该存储设备的监控,则从存储设备信息表中取出请求监控的存储设备的IP地址,再查找系统配置信息表获得存储设备控制器中的事件获取接口名称,并调用告警访问接口应用程序获取告警事件信息;告警访问接口应用程序是负责获取具体存储设备告警事件信息的软件模块,它根据存储设备的IP地址访问存储设备中的事件获取接口获取相应存储设备的告警事件信息,将告警事件信息返回给子进程;主进程将所有子进程获得的存储设备的告警事件信息返回给告警信息映射模块;
告警信息映射模块与事件获取模块、监控信息框架和告警信息过滤模块相连,它从事件获取模块获取从存储设备获取的告警事件信息,将告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,使得所有的告警事件信息都具备相同的描述框架,并将映射后的告警事件信息返回给告警信息过滤模块;告警信息映射模块由告警事件信息映射模块和事件安全等级映射模块组成;告警事件信息映射模块按照告警事件信息映射规则表中的告警事件信息映射规则将异构存储设备返回的不同告警事件信息体系下的告警事件信息与告警事件信息元属性表中的元属性表示的告警事件信息进行映射,将异构存储设备返回的告警事件信息转化为元属性信息表示的告警事件信息,输出给事件安全等级映射模块;事件安全等级映射模块按照事件安全等级映射规则表中的事件安全等级映射规则将异构存储设备返回的告警事件信息中的不同事件安全等级体系下的事件安全等级与事件安全等级库中的事件安全等级进行映射,将异构存储设备返回的所有告警事件信息的事件安全等级的值转换为事件安全等级属性的值,输出给告警信息过滤模块;
告警信息过滤模块与告警信息映射模块和监控客户端相连,告警信息过滤模块收到告警信息映射模块输出的映射后的告警事件信息后,从监控客户端获取用户监控请求中的用户请求约束,包括事件安全等级约束和时间约束,依次针对这两类约束信息对告警事件信息进行过滤;告警信息过滤模块过滤出满足事件安全等级约束的告警事件信息;若事件安全等级约束为事件安全等级的集合时,告警信息过滤模块过滤出具有事件安全等级约束中列举的相应事件安全等级的告警事件信息;若事件安全等级约束为紧急程度高于某个事件安全等级时,告警信息过滤模块首先根据事件安全等级的紧急程度排序获取高于某个事件安全等级所有事件安全等级的集合,再过滤出具有该集合中包含的相应事件安全等级的告警事件信息;告警信息过滤模块只将时间约束间隔内的告警事件信息返回给监控客户端;
第二步,异构存储设备统一监控系统对海量存储系统中异构存储设备进行统一监控,具体方法为:
2.1.启动异构存储设备统一监控系统,由监控客户端的存储设备信息维护模块提取海量存储系统中所有存储设备的配置信息,并初始化存储设备信息表,表中的每一项初始化为一个存储设备的配置信息;若某个存储设备对应的存储设备信息表项中的某些元素为空,由监控客户端的存储设备信息维护模块提示对该存储设备进行配置,直到所有存储设备对应的存储设备信息表项都不为空;监控客户端的系统配置信息维护模块检查是否每类存储设备都在系统配置信息表中找到相应的表项,若未找到,则由监控客户端的系统配置信息维护模块对相应类型的存储设备的相关信息进行配置,即添加相应存储设备类型的系统配置信息,直到每类存储设备都在系统配置信息表中找到相应的表项,且对应表项中的所有元素都不为空;监控客户端的监控信息框架维护模块检查监控信息框架中的事件安全等级映射规则表和告警事件信息映射规则表是否为系统配置信息表中出现的每类存储设备都定义了相应的映射规则,若不是,则由监控信息框架维护模块对相应存储设备类型的事件安全等级映射规则表和告警事件信息映射规则表进行配置,即添加相应存储设备类型的事件安全等级映射规则和告警信息映射规则,直到每类存储设备都在事件安全等级映射规则表和告警事件信息映射规则表中找到相应的表项,且对应表项中的所有元素都不为空;
2.2.监控客户端的用户监控请求信息生成模块判断是否有监控管理结点发送过来的用户请求,若有,执行步骤2.3,否则转步骤2.2继续等待;
2.3.监控客户端的用户监控请求信息生成模块判断用户请求的类型,若为用户监控请求,执行步骤2.4;若为退出异构存储设备统一监控系统请求,执行步骤2.3.1;若为维护存储设备信息表请求,执行步骤2.3.2;若为维护系统配置信息表请求,执行步骤2.3.3;若为维护监控信息框架请求,执行步骤2.3.4;
2.3.1.退出异构存储设备统一监控系统,结束;
2.3.2.存储设备信息维护模块根据用户的输入对存储设备信息表中的信息进行添加、删除和修改,转步骤2.2;
2.3.3.系统配置信息维护模块根据用户的输入对系统配置信息表中的信息进行添加、删除和修改,转步骤2.2;
2.3.4.监控信息框架维护模块根据用户的输入对监控信息框架中的告警事件信息元属性表、事件安全等级库进行添加、删除和修改,并对每类存储设备的事件安全等级映射规则和告警事件信息映射规则进行添加、删除和修改,转步骤2.2;
2.4.监控客户端的用户监控请求信息生成模块读取存储设备信息表,获取所监控海量存储系统中的存储设备名称列表,供用户选择;
2.5.用户监控请求信息生成模块获取用户从存储设备名称列表中选择的需要监控的存储设备和用户指定的用户请求约束和预警形式,生成需要监控的请求信息,将需要监控的存储设备名称列表发送给事件获取模块,将预警形式发送给监控信息展现模块,并将用户请求约束发送给告警信息过滤模块,执行步骤2.6;
2.6.事件获取模块从监控客户端的用户监控请求信息生成模块获取需要监控的存储设备名称列表,收集监控信息,并将获取的监控信息发送给告警信息映射模块,流程是:
2.6.1.主进程从需要监控的存储设备名称列表中读取需要监控的存储设备,并为表中每一个存储设备创建一个子进程:如果需要监控的存储设备名称列表为空,主进程发送监控失败的信息给监控客户端的监控信息展现模块,主进程结束,转步骤2.9;若需要监控的存储设备名称列表不为空,则根据需要监控的存储设备名称列表中存储设备的数目创建相应数目的子进程,执行步骤2.6.2;
2.6.2.子进程根据请求监控的存储设备的名称,查找存储设备信息表获取存储设备的IP地址和存储设备控制器类型ID;判断存储设备信息表中的IP地址、存储设备控制器类型ID是否为空,若有一个属性为空,则将存储设备信息不全的信息返回给主进程,转步骤2.6.6;若全部不为空,则执行步骤2.6.3;
2.6.3.子进程查找系统配置信息表获取对应存储设备控制器类型的事件获取接口名称,若事件获取接口名称为空,则将异构存储设备统一监控系统不支持该类存储设备的监控信息返回给主进程,转步骤2.6.6;若不为空,则执行步骤2.6.4;
2.6.4.子进程调用告警访问接口应用程序,并将存储设备控制器的IP地址和步骤2.6.3获取的事件获取接口名称作为参数发送给告警访问接口应用程序;若告警访问接口应用程序启动成功,转步骤2.6.5;若启动不成功,则将监控失败的信息返回子进程,转步骤2.6.6;
2.6.5.告警访问接口应用程序通过访问存储设备控制器访问接口获取存储设备的监控信息,具体步骤如下:
2.6.5.1.根据存储设备控制器的IP地址,远程登录到该存储设备控制器;
2.6.5.2.调用该存储设备控制器中相应的事件获取接口,判断该接口获取告警事件信息是否成功,若成功则执行步骤2.6.5.3;否则重新执行步骤2.6.5.2,直到获取成功或超时;若超时,则将监控失败的信息返回子进程,转步骤2.6.6;
2.6.5.3.解析步骤2.6.5.2获取的告警事件信息,抽取告警事件信息中每个属性的值,形成由抽取出的各个属性及其值的二元组组成的告警事件信息;
2.6.5.4.告警访问接口应用程序将步骤2.6.5.3获取的告警事件信息返回给子进程,执行步骤2.6.5.5;
2.6.5.5.告警访问接口应用程序结束,执行步骤2.6.6;
2.6.6.子进程将对应存储设备的监控结果发送给主进程,执行步骤2.6.7;
2.6.7.子进程结束,执行步骤2.6.8;
2.6.8.主进程获取各个子进程返回的监控结果,若还存在某个子进程未返回监控结果,则主进程等待,直到所有子进程都返回监控结果;主进程获取所有子进程返回的监控结果后将其发送给告警信息映射模块,主进程结束,执行步骤2.7;
2.7.告警信息映射模块接收到事件获取模块返回的告警事件信息后,向告警事件信息映射模块导入告警事件信息元属性表中的告警事件信息元属性,向事件安全等级映射模块导入事件安全等级库中的事件安全等级;告警信息映射模块依次对每条告警事件信息进行映射后,将映射后的告警事件信息发送给告警信息过滤模块;
2.8.告警信息过滤模块从告警信息映射模块获取映射后的告警事件信息,并根据用户请求约束对其进行过滤;
2.9.监控信息展现模块监听告警信息过滤模块发送的过滤后的告警事件信息和事件获取模块发送的监控失败信息,若有,执行步骤2.10,若无,转步骤2.9继续监听;
2.10.监控客户端的监控信息展现模块判断接收到信息的类型,若为监控失败的信息,则在监控界面上显示“本次请求的监控失败”;若为告警信息过滤模块发送的过滤后的告警事件信息,则在监控界面上显示本次监控请求获取的告警事件信息;一次监控请求处理结束,执行步骤2.2。
2.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述预警形式分为警报、亮灯、弹出对话框、邮件形式。
3.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述告警访问接口应用程序调用存储设备控制器中相应的事件获取接口获取告警事件信息时超时时间阈值为10分钟。
4.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述告警信息映射模块对每条告警事件信息的映射流程是:
4.1.告警事件信息映射模块查找告警事件信息映射规则表,获取存储设备类型对应的告警事件信息映射规则,执行步骤4.2;
4.2.告警事件信息映射模块根据步骤4.1获取的告警事件信息映射规则将告警事件信息中各个二元组的属性映射成告警事件信息元属性表中告警事件信息的相应属性,属性的值不变,即映射后的告警事件信息由告警事件信息元属性表中告警事件信息的七类属性表示,将映射后的告警事件信息发送给事件安全等级映射模块,执行步骤4.3;
4.3.事件安全等级映射模块查找事件安全等级映射规则表,获取存储设备类型对应的事件安全等级映射规则,执行步骤4.4;
4.4.事件安全等级映射模块根据步骤4.3获取的事件安全等级映射规则将每条告警事件信息中的事件安全等级的值映射成事件安全等级库中的事件安全等级,即映射后的告警事件信息的事件安全等级为紧急的、严重的、重要的、警告、通知五类。
5.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述告警信息过滤模块根据用户请求约束对告警事件信息进行过滤的流程是:
5.1.告警信息过滤模块按照事件安全等级约束对告警事件信息进行过滤;若事件安全等级约束为事件安全等级的集合,告警信息过滤模块过滤出具有事件安全等级约束中列举的相应事件安全等级的告警事件信息;若事件安全等级约束为紧急程度高于某个事件安全等级,告警信息过滤模块首先根据事件安全等级的紧急程度排序获取高于某个事件安全等级所有事件安全等级的集合,再过滤出具有该集合中包含的相应事件安全等级的告警事件信息,执行步骤5.2;
5.2.告警信息过滤模块过滤出时间约束间隔内的步骤5.1返回的告警事件信息;
5.3.告警信息过滤模块将过滤后的满足用户请求约束的告警事件信息返回给监控客户端的监控信息展现模块。
6.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述告警事件信息的元属性信息包括存储设备名称、IP地址、时间、告警事件名称、事件安全等级、事件描述、建议操作七类属性。
7.如权利要求1所述的一种集成异构存储设备的海量存储系统监控方法,其特征在于所述告警事件信息的事件安全等级属性的值按紧急程度排序分为紧急的、严重的、重要的、警告、通知五类。
CN201210041078.9A 2012-02-22 2012-02-22 一种集成异构存储设备的海量存储系统监控方法 Active CN102638378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210041078.9A CN102638378B (zh) 2012-02-22 2012-02-22 一种集成异构存储设备的海量存储系统监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210041078.9A CN102638378B (zh) 2012-02-22 2012-02-22 一种集成异构存储设备的海量存储系统监控方法

Publications (2)

Publication Number Publication Date
CN102638378A CN102638378A (zh) 2012-08-15
CN102638378B true CN102638378B (zh) 2014-05-21

Family

ID=46622631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210041078.9A Active CN102638378B (zh) 2012-02-22 2012-02-22 一种集成异构存储设备的海量存储系统监控方法

Country Status (1)

Country Link
CN (1) CN102638378B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546343B (zh) * 2013-10-18 2017-03-29 中国南方电网有限责任公司 网络流量分析系统的网络流量展示方法和系统
CN104932978B (zh) * 2015-06-29 2018-04-13 北京宇航时代科技发展有限公司 一种系统运行故障自检测及自修复的方法和系统
CN105450739B (zh) * 2015-11-13 2018-08-17 国网天津市电力公司 存储双活环境下存储资源异地同步共享的监测与管理方法
CN109257232A (zh) * 2018-11-01 2019-01-22 郑州云海信息技术有限公司 网络存储设备的告警信息监控管理方法、装置及设备
TWI803628B (zh) * 2019-04-29 2023-06-01 安圖斯科技股份有限公司 警示燈控制方法與電子裝置
CN110516089A (zh) * 2019-08-29 2019-11-29 四川东方网力科技有限公司 图片存储和读取服务的实现方法、装置、设备和存储介质
CN110557283B (zh) * 2019-08-29 2022-06-17 海南电网有限责任公司 配电通信网管控方法、服务器、系统及可读存储介质
CN111049881B (zh) * 2019-10-30 2022-07-22 烽火通信科技股份有限公司 一种云平台节点资源监控方法、系统及计算机可读介质
CN112887667B (zh) * 2021-01-08 2023-03-24 浙江大华技术股份有限公司 视频信号的传输方法、监控终端、传输系统及存储介质
CN114697325A (zh) * 2022-03-15 2022-07-01 浪潮云信息技术股份公司 一种集群虚拟化资源管理平台缓存设备的自动化部署方法及运维装置
CN117075919B (zh) * 2023-10-17 2023-12-26 江苏鑫业智慧技术有限公司 一种基于roso模型的异构信息系统集成方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719785A (zh) * 2005-08-08 2006-01-11 清华大学 基于存域网的海量存储系统的性能监控方法及系统
CN102110041A (zh) * 2011-03-15 2011-06-29 浪潮(北京)电子信息产业有限公司 实现分布式文件系统存储空间监控的系统及方法
CN102222090A (zh) * 2011-06-02 2011-10-19 清华大学 一种云环境下海量数据资源管理框架

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719785A (zh) * 2005-08-08 2006-01-11 清华大学 基于存域网的海量存储系统的性能监控方法及系统
CN102110041A (zh) * 2011-03-15 2011-06-29 浪潮(北京)电子信息产业有限公司 实现分布式文件系统存储空间监控的系统及方法
CN102222090A (zh) * 2011-06-02 2011-10-19 清华大学 一种云环境下海量数据资源管理框架

Also Published As

Publication number Publication date
CN102638378A (zh) 2012-08-15

Similar Documents

Publication Publication Date Title
CN102638378B (zh) 一种集成异构存储设备的海量存储系统监控方法
CN107886238B (zh) 一种基于海量数据分析的业务流程管理系统及方法
CN100465919C (zh) 应用服务器的健康监视和控制的技术
CN102123042B (zh) 系统配置智能管理系统及其管理方法
US9262248B2 (en) Log configuration of distributed applications
CN1959717B (zh) 订单驱动的海量遥感数据集群化预处理系统及其方法
CN108365985A (zh) 一种集群管理方法、装置、终端设备及存储介质
CN109495308A (zh) 一种基于管理信息系统的自动化运维系统
CN102932195B (zh) 一种基于网络协议分析的业务分析监控方法及系统
CN104506348A (zh) 一种自动化发现并配置监控对象的方法
CN102597966B (zh) 运行管理装置以及运行管理方法
CN102231673B (zh) 用于监控业务服务器的系统和方法
CN104022903A (zh) 一站式自动化运维系统
CN101916507A (zh) 桥梁健康监测系统
CN1549969A (zh) 关联并确定系统和企业事件的根本原因的方法和系统
CN108156225B (zh) 基于容器云平台的微应用监控系统和方法
CN100514962C (zh) 大型网络中主机性能采集代理系统
CN105302697B (zh) 一种密集数据模型数据库的运行状态监控方法及系统
CN107807872A (zh) 一种输变电系统运行状态监测方法
US20130346367A1 (en) Offloading Collection of Application Monitoring Data
CN108108445A (zh) 一种智能数据处理方法和系统
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN109213658A (zh) 一种巡检方法和装置
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及系统
CN103036952A (zh) 一种企业级异构融合存储管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant