CN106202535A - 一种rrd数据库的检测的方法及系统 - Google Patents

一种rrd数据库的检测的方法及系统 Download PDF

Info

Publication number
CN106202535A
CN106202535A CN201610590887.3A CN201610590887A CN106202535A CN 106202535 A CN106202535 A CN 106202535A CN 201610590887 A CN201610590887 A CN 201610590887A CN 106202535 A CN106202535 A CN 106202535A
Authority
CN
China
Prior art keywords
abnormal
data base
rrd
rrd data
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610590887.3A
Other languages
English (en)
Other versions
CN106202535B (zh
Inventor
张保林
刘成平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610590887.3A priority Critical patent/CN106202535B/zh
Publication of CN106202535A publication Critical patent/CN106202535A/zh
Application granted granted Critical
Publication of CN106202535B publication Critical patent/CN106202535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了RRD数据库的检测的方法及系统,该方法包括按照预定周期轮询检测各RRD数据库确定未按时更新的异常RRD数据库,将异常RRD数据库记录到更新异常文件中;利用异常分析程序分析更新异常文件中的异常RRD数据库确定异常原因,执行异常原因对应的异常处理操作;确定更新异常文件未有异常原因的异常RRD数据库查找监控插件中对应异常RRD数据库的日志信息,根据日志信息进行分析确定异常RRD数据库的异常原因,执行异常原因对应的异常处理操作;确定更新异常文件未有异常原因的异常RRD数据库,并发送给用户;该方法解决RRD数据库不能持续更新的原因,修复大部分问题使其能够持续更新。

Description

一种RRD数据库的检测的方法及系统
技术领域
本发明涉及数据库检测领域,特别涉及一种RRD数据库的检测的方法及系统。
背景技术
随着云数据中心管理平台(例如浪潮云海·云数据中心管理平台)中检测项数量的剧增,监测范围增广,产生的RRD(Round Robin Database tool,存储数据的方式)数据库个数日益增多,RRD数据库不能够持续更新的个数也相应增多,因此确定RRD数据库不能够持续更新的原因和时间工作量急剧增加,由于传统的依赖手工检测与修复的方法,费时费力又乏味,准确性很大程度上依赖检测人员的工作情况;因此,如何方便快速了解RRD数据库不能够持续更新的原因和时间,同时能够智能快速解决不能持续更新的问题,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种RRD数据库的检测的方法及系统,轮询检测和智能修复功能能够快速、智能解决RRD数据库不能持续更新的原因,以及了解中断更新的时间段,智能修复大部分问题使其能够持续更新。
为解决上述技术问题,本发明提供一种RRD数据库的检测的方法,包括:
按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
其中,按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中,包括:
按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中。
其中,利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作,包括:
依次利用异常分析程序分析所述更新异常文件中的事件条目,判断所述事件条目对应的资源是否删除,若删除,则删除所述事件条目对应的异常RRD数据库,并删除所述事件条目;
若未删除,则判断所述事件条目对应的监控插件是否停止工作;若停止工作,则重启对应的监控插件,并记录所述事件条目对应的异常原因和异常处理时间;
若未停止工作,则判断所述事件条目对应的资源是否停止监控;若停止监控,则记录所述事件条目对应的异常原因和异常处理时间;
若未停止监控,则判断所述事件条目对应的资源是否断开连接;若断开连接,则扫描并连接对应的资源,并对该资源进行监控,记录所述事件条目对应的异常原因和异常处理时间。
其中,确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作,包括:
确定所述更新异常文件中未记录异常原因的异常RRD数据库;
查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并记录所述事件条目对应的异常原因;
查找异常处理文件中是否存在所述异常原因对应的解决方法,若存在,则根据所述解决方法进行异常处理操作,并记录所述事件条目对应的异常处理时间。
其中,确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户,包括:
确定所述更新异常文件未记录异常原因的异常RRD数据库;
将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
将已记录异常原因且未记录异常处理时间的异常RRD数据库对应的事件条目作为告警信息发送给用户;
将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
其中,将未有异常原因的异常RRD数据库发送给用户之后,还包括:
将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;
将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
本发明提供一种RRD数据库的检测的系统,包括:
轮询检测模块,用于按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
原因分析模块,用于利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
智能修复模块,用于确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
通知告警模块,用于确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
其中,所述轮询检测模块具体为按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中的模块。
其中,所述通知告警模块包括:
错误信息发送单元,用于确定所述更新异常文件未记录异常原因的异常RRD数据库;将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
告警信息发送单元,用于确定所述更新异常文件已记录异常原因且未记录异常处理时间的异常RRD数据库作为告警信息发送给用户;
通知信息发送单元,用于将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
其中,所述通知告警模块还包括:
更新单元,用于将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
本发明所提供的RRD数据库的检测的方法,通过轮询检测和智能修复机制,能够解决大部分不能持续更新的问题,及时的把极少部分不能解决的问题,以告警的方式把异常RRD数据库通知给用户,以便用户可以及时解决异常RRD数据库不能及时更新的问题;这种机制可以解决掉大部分问题,并把不能解决的问题定位后通知用户;进一步,该方法还能使用户了解RRD数据库不能持续更新的时间段。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的RRD数据库的检测的方法的流程图;
图2为本发明实施例所提供的RRD数据库的检测的方法的处理机制示意图;
图3为本发明实施例所提供的RRD数据库的检测的系统的构架示意图。
具体实施方式
本发明的核心是提供一种RRD数据库的检测的方法及系统,轮询检测和智能修复功能能够快速、智能解决RRD数据库不能持续更新的原因,以及了解中断更新的时间段,智能修复大部分问题使其能够持续更新。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的RRD数据库的检测的方法的流程图;该方法可以包括:
S100、按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
其中,该步骤通过轮询机制主要是为了能够及时获取各RRD数据库更新状态,以便及时发现未能及时更新的RRD数据库。预定周期的设置可以根据用户的需求进行,该预定周期也短则发现异常RRD数据库越及时,例如实时进行轮询,或者实时对每个RRD数据库进行检测。未按时更新的判断是根据轮询获取的RRD数据库的更新时间进行判断。后续可以将RRD数据库简称为数据库;例如一个数据库上次记录的更新时间为2016.07.11.13.12.12,这次轮询记录的更新时间仍为2016.07.11.13.12.12,则说明该数据库为异常数据库。
记录到更新异常文件中表征异常数据库的标识信息,例如可以是数据库的名称等。具体的,该步骤按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中。
即可以定时轮询检测每个RRD数据库的更新时间,如果发现某个数据库没有实时更新,则把轮询时间和RRD数据库名称作为一个事件条目也成为条目记录到更新异常文件(如rrdException.log文件)中,继续检测下一个RRD文件以及按时启动下一次轮询。
S110、利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
其中,该方法分两次对异常数据库进行异常分析处理,第一次依次或者并行分析更新异常文件中的数据库,分析过程中将能够确认其异常原因的数据库叫做第一异常数据库,并按照异常原因对应的异常处理操作对该数据库进行操作。这里的原因是一些较为简单的异常原因,因此对应的异常处理操作也比较简单。即可以将较为好处理的异常在该步骤进行处理。且为了之后的处理更加简洁,可以将异常处理过的数据库进行标记,以避免对其进行再次操作,浪费时间。标记可以根据用户的需要进行,这里并不对具体的标记方式进行限定;例如可以是将异常处理完成的数据库从更新异常文件中删除,或者在更新异常文件中标记已经处理过从异常数据库,例如记录处理过的异常数据库的处理时间或异常原因或处理标识设置为已处理等。
具体的,依次利用异常分析程序分析所述更新异常文件中的事件条目,判断所述事件条目对应的资源是否删除,若删除,则删除所述事件条目对应的异常RRD数据库,并删除所述事件条目;
若未删除,则判断所述事件条目对应的监控插件是否停止工作;若停止工作,则重启对应的监控插件,并记录所述事件条目对应的异常原因和异常处理时间;
若未停止工作,则判断所述事件条目对应的资源是否停止监控;若停止监控,则记录所述事件条目对应的异常原因和异常处理时间;
若未停止监控,则判断所述事件条目对应的资源是否断开连接;若断开连接,则扫描并连接对应的资源,并对该资源进行监控,记录所述事件条目对应的异常原因和异常处理时间。
即逐条查看rrdException.log文件,对每条信息查找原因。首先查看该资源是否已删除,如果是,则删除该RRD数据库且删除该条目。然后查看监控插件是不是已经挂掉,如果是则重新启动监控服务,并把这条原因和时间追加到rrdException.log文件中对应的信息条目中。如果以上两种原因皆不是,则查看是否该资源已停止监控,如果已经对该资源停止监控,在这条信息后追加原因及时间;如果不是,则用插件扫描一下是否能扫描到该资源,如果能够扫描到该资源,尝试重新连接该资源,并对其继续监控,并追加修复时间和原因为资源连接为断开状态,并继续监控。
S120、确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
其中,对于步骤S110并没有检测出异常原因的异常数据进行异常分析处理;这里可以借助监控插件中对应异常RRD数据库的日志信息进行分析,以便能够确认数据库异常原因,将分析之后能够确认异常原因的异常数据库称为第二异常RRD数据库,根据异常原因执行异常原因对应的异常处理操作。这里可以将这种情况下可能会出现的异常原因进行列表,并对应设置异常处理操作方式;则根据异常原因即可以映射找到对应的异常处理操作。其中,异常处理操作可以放置于异常处理文件(例如learner.log)中。
同样为了之后的处理更加简洁,可以将异常处理过的数据库进行标记,以避免对其进行再次操作,浪费时间。标记可以根据用户的需要进行,这里并不对具体的标记方式进行限定;例如可以是将异常处理完成的数据库从更新异常文件中删除,或者在更新异常文件中标记已经处理过从异常数据库,例如记录处理过的异常数据库的处理时间或异常原因或处理标识设置为已处理等。
具体的,确定所述更新异常文件中未记录异常原因的异常RRD数据库;
查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并记录所述事件条目对应的异常原因;
查找异常处理文件中是否存在所述异常原因对应的解决方法,若存在,则根据所述解决方法进行异常处理操作,并记录所述事件条目对应的异常处理时间。
即查看rrdException.log文件中,找出没有列出原因的条目。对于这些条目,查找监控插件的记录日志,找到与该RRD数据库有关的日志信息,分析出原因,追加到该条目的原因栏。分析出原因后,该模块首先查找learner.log文件,查看是否有这种原因的解决方案,如果有,则按这种方案去解决,然后追加修复时间到相应条目。
S130、确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
其中,对于步骤S110和步骤S120都没有检测出异常原因的异常数据,说明其异常原因系统未能学习到,这里可以将这些数据库发送给用户,由用户进行处理。相比与现有技术全部由人工进行数据库异常监控,异常原因确定到异常处理;这里仅仅将一小部分处理不了的数据库信息发送给用户,即将不能解决的问题定位后通知用户,使用户进行及时解决,极大的提高了系统的效率,保证异常处理的准确性。
具体的,确定所述更新异常文件未记录异常原因的异常RRD数据库;
将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
将已记录异常原因且未记录异常处理时间的异常RRD数据库对应的事件条目作为告警信息发送给用户;
其中,即将不能解决的问题定位后作为错误信息发送给用户。
将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
即查看rrdException.log文件中,把这些条目中列出错误原因和修复时间的,把整个条目信息作为通知信息发给用户;列出异常原因但未记录异常处理时间的,把整个条目信息作为告警信息发送给用户;没有找出列出异常原因的条目作为,作为错误信息发给用户。这里将所有信息发送给用户分成三种类型发送给用户,即使用户能够及时了解到数据库检测的和修复的过程,又能够使用户快速、简明的知道那些是未解决问题,需要由用户进行处理的。分别发送,防止出现用户遗漏的情况,提高系统的可靠性。
进一步,为了随着时间的增长,提高系统的异常数量能力,可以根据用户的处理过程是系统具有学习能力,提高系统的适用性。可选的,将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;
将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
即对于这些错误信息,待用户查找出原因后,手动补充到rrdException.log文件中对应条目的原因列,最后由用户解决这个问题,并把解决方案记录到learner.log文件中;对于注明原因,没有注明修复时间的,作为告警信息发给用户,对于这些告警信息,由用户解决这个问题,并把解决方案记录到learner.log文件中。对于用户手动解决的问题,由用户把修复时间追加到对应条目。
通过这样的处理,步骤S120的处理能力会随着时间的增长,越来越强大,对人工的依赖会越来越低,自动化程度越来越高,效率也会进一步提高,保证了系统的可靠性。
上述的具体处理过程可以参考图2,在图2中在原因分析模块中查找到原因后应查看rrdException.log文件中的下一条目信息;在智能修复模块中,解决问题后应查看rrdException.log文件中的下一条目信息;通知告警模块中,发完相应信息后应查看rrdException.log文件中的下一条目信息。
基于上述技术方案,本发明实施例提供的RRD数据库的检测的方法,在轮询检测过程中,如果没有定时更新RRD数据库,首先查看该资源有没有被删除或者停止监控,如果没有,查看该资源是否是处于被连通的状态,以及查看日志文件,分析出RRD数据库不能继续更新的原因。然后根据不同的原因,找出对应的解决方案,并把不同的原因和对应的解决方法保存到指定文件,方便以后根据原因找到对应的解决方案;如果某些原因不能智能的自动解决,则发送告警信息给用户,这时,需要用户手动解决。该机制采用了轮询检测机制定时查看每个RRD数据库的是否能够持续更新,并自动分析原因,智能的解决问题的方法,可以大大的提高RRD数据库的持续更新度,尽可能使保存的监测项的历史性能值能够在时间上连续,并且能够把每个RRD数据库不能持续更新的时间及原因记录到指定文件,方便用户查阅。
下面对本发明实施例提供的RRD数据库的检测的系统进行介绍,下文描述的RRD数据库的检测的系统与上文描述的RRD数据库的检测的方法可相互对应参照。
请参考图3,图3为本发明实施例所提供的RRD数据库的检测的系统的构架示意图,包括:轮询检测模块100、原因分析模块200、智能修复模块300、通知告警模块400四种模块。另外,还用到两个文件,保存RRD检测异常的rrdException.log文件和保存异常原因及对应解决方案的learner.log文,该图还注明了每个文件的文件结构以及各个模块与这两个文件的读写关系。包括:
轮询检测模块100,用于按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
原因分析模块200,用于利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
智能修复模块300,用于确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
通知告警模块400,用于确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
其中,本实施例的结构包括轮询检测模块,该模块定时轮询检测每个RRD数据库是否持续更新。设计原因分析模块,该模块能够排查是不是因为资源已删除,监控服务是否已停止,资源是否已手动停止监控,资源是否已断开连接等原因,并相应的解决这些问题。设计智能修复模块,当读取监控插件的日志文件后并找出原因后,能够智能的解决相应问题。设计通知告警模块,该模块能够将不能智能解决的以及检测不出原因的异常情况,及时的通知用户进行处理;能够智能解决的,也会作为通知信息发给用户,以便用户确认RRD数据库中断的时间。
可选的,所述轮询检测模块100具体为按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中的模块。
可选的,所述通知告警模块400包括:
错误信息发送单元,用于确定所述更新异常文件未记录异常原因的异常RRD数据库;将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
告警信息发送单元,用于确定所述更新异常文件已记录异常原因且未记录异常处理时间的异常RRD数据库作为告警信息发送给用户;
通知信息发送单元,用于将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
可选的,所述通知告警模块400还包括:
更新单元,用于将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
基于上述技术方案,该系统通过轮询检测和智能修复机制,能够解决大部分不能持续更新的问题,及时的把极少部分不能解决的问题,以告警的方式把数据库名字和检测时间通知给用户。这种机制可以解决掉大部分问题,并把不能解决的问题定位后通知用户,同时,还能使用户了解RRD数据库不能持续更新的时间段。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的RRD数据库的检测的方法及系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种RRD数据库的检测的方法,其特征在于,包括:
按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
2.根据权利要求1所述的RRD数据库的检测的方法,其特征在于,按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中,包括:
按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中。
3.根据权利要求2所述的RRD数据库的检测的方法,其特征在于,利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作,包括:
依次利用异常分析程序分析所述更新异常文件中的事件条目,判断所述事件条目对应的资源是否删除,若删除,则删除所述事件条目对应的异常RRD数据库,并删除所述事件条目;
若未删除,则判断所述事件条目对应的监控插件是否停止工作;若停止工作,则重启对应的监控插件,并记录所述事件条目对应的异常原因和异常处理时间;
若未停止工作,则判断所述事件条目对应的资源是否停止监控;若停止监控,则记录所述事件条目对应的异常原因和异常处理时间;
若未停止监控,则判断所述事件条目对应的资源是否断开连接;若断开连接,则扫描并连接对应的资源,并对该资源进行监控,记录所述事件条目对应的异常原因和异常处理时间。
4.根据权利要求3所述的RRD数据库的检测的方法,其特征在于,确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作,包括:
确定所述更新异常文件中未记录异常原因的异常RRD数据库;
查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并记录所述事件条目对应的异常原因;
查找异常处理文件中是否存在所述异常原因对应的解决方法,若存在,则根据所述解决方法进行异常处理操作,并记录所述事件条目对应的异常处理时间。
5.根据权利要求4所述的RRD数据库的检测的方法,其特征在于,确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户,包括:
确定所述更新异常文件未记录异常原因的异常RRD数据库;
将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
将已记录异常原因且未记录异常处理时间的异常RRD数据库对应的事件条目作为告警信息发送给用户;
将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
6.根据权利要求5所述的RRD数据库的检测的方法,其特征在于,将未有异常原因的异常RRD数据库发送给用户之后,还包括:
将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;
将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
7.一种RRD数据库的检测的系统,其特征在于,包括:
轮询检测模块,用于按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库,将所述异常RRD数据库记录到更新异常文件中;
原因分析模块,用于利用异常分析程序分析所述更新异常文件中的异常RRD数据库,确定第一异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
智能修复模块,用于确定所述更新异常文件未有异常原因的异常RRD数据库,查找监控插件中对应异常RRD数据库的日志信息,并根据所述日志信息进行分析,确定第二异常RRD数据库的异常原因,并执行异常原因对应的异常处理操作;
通知告警模块,用于确定所述更新异常文件未有异常原因的异常RRD数据库,并将未有异常原因的异常RRD数据库发送给用户。
8.根据权利要求7所述的RRD数据库的检测的系统,其特征在于,所述轮询检测模块具体为按照预定周期轮询检测各RRD数据库的更新时间,确定未按时更新的异常RRD数据库的名称,将所述名称和对应的轮询时间作为一个事件条目记录到更新异常文件中的模块。
9.根据权利要求8所述的RRD数据库的检测的系统,其特征在于,所述通知告警模块包括:
错误信息发送单元,用于确定所述更新异常文件未记录异常原因的异常RRD数据库;将未记录异常原因的异常RRD数据库对应的事件条目作为错误信息发送给用户;
告警信息发送单元,用于确定所述更新异常文件已记录异常原因且未记录异常处理时间的异常RRD数据库作为告警信息发送给用户;
通知信息发送单元,用于将所述更新异常文件中整个异常原因和异常处理时间作为通知信息发送给用户。
10.根据权利要求9所述的RRD数据库的检测的系统,其特征在于,所述通知告警模块还包括:
更新单元,用于将用户确认的未有异常原因的异常RRD数据库对应的异常原因及异常处理时间记录到事件条目对应的异常原因和异常处理时间中;将用户确认的未有异常原因的异常RRD数据库对应的解决方法记录到所述异常处理文件中,并注明对应的异常原因。
CN201610590887.3A 2016-07-25 2016-07-25 一种rrd数据库的检测的方法及系统 Active CN106202535B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610590887.3A CN106202535B (zh) 2016-07-25 2016-07-25 一种rrd数据库的检测的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610590887.3A CN106202535B (zh) 2016-07-25 2016-07-25 一种rrd数据库的检测的方法及系统

Publications (2)

Publication Number Publication Date
CN106202535A true CN106202535A (zh) 2016-12-07
CN106202535B CN106202535B (zh) 2020-03-27

Family

ID=57495269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610590887.3A Active CN106202535B (zh) 2016-07-25 2016-07-25 一种rrd数据库的检测的方法及系统

Country Status (1)

Country Link
CN (1) CN106202535B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN109508245A (zh) * 2017-09-15 2019-03-22 西安中兴新软件有限责任公司 一种实现异常分析的方法及终端
CN110908855A (zh) * 2018-09-18 2020-03-24 深圳市鸿合创新信息技术有限责任公司 一种微服务运行维护装置及方法、电子设备
CN111552566A (zh) * 2020-04-26 2020-08-18 北京奇艺世纪科技有限公司 一种数据处理系统、方法、电子设备及存储介质
CN112486714A (zh) * 2019-09-12 2021-03-12 曙光信息产业(北京)有限公司 数据库异常捕获处理方法、装置和计算机设备
CN112632030A (zh) * 2020-12-04 2021-04-09 贝壳技术有限公司 数据异常定位方法及装置
CN113688006A (zh) * 2017-10-16 2021-11-23 创新先进技术有限公司 一种日志数据的校验方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104392A (ja) * 2007-10-23 2009-05-14 Fujitsu Ltd ファイル管理システム、ファイル管理方法、及び、ファイル管理プログラム
CN103596208A (zh) * 2013-11-15 2014-02-19 大唐移动通信设备有限公司 一种网元故障判断方法及系统
CN103605753A (zh) * 2013-11-22 2014-02-26 中国技术交易所有限公司 集中竞价系统数据存储系统及存储方法
CN104038373A (zh) * 2014-05-30 2014-09-10 国家电网公司 信息预警与自修复系统及方法
CN104363129A (zh) * 2014-12-10 2015-02-18 国家电网公司 一种网络事件关联分析和动态预警方法
CN104639352A (zh) * 2013-11-12 2015-05-20 株式会社日立制作所 监控装置以及监控方法
CN105357069A (zh) * 2015-11-04 2016-02-24 浪潮(北京)电子信息产业有限公司 分布式节点服务状态监测的方法、装置及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104392A (ja) * 2007-10-23 2009-05-14 Fujitsu Ltd ファイル管理システム、ファイル管理方法、及び、ファイル管理プログラム
CN104639352A (zh) * 2013-11-12 2015-05-20 株式会社日立制作所 监控装置以及监控方法
CN103596208A (zh) * 2013-11-15 2014-02-19 大唐移动通信设备有限公司 一种网元故障判断方法及系统
CN103605753A (zh) * 2013-11-22 2014-02-26 中国技术交易所有限公司 集中竞价系统数据存储系统及存储方法
CN104038373A (zh) * 2014-05-30 2014-09-10 国家电网公司 信息预警与自修复系统及方法
CN104363129A (zh) * 2014-12-10 2015-02-18 国家电网公司 一种网络事件关联分析和动态预警方法
CN105357069A (zh) * 2015-11-04 2016-02-24 浪潮(北京)电子信息产业有限公司 分布式节点服务状态监测的方法、装置及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508245A (zh) * 2017-09-15 2019-03-22 西安中兴新软件有限责任公司 一种实现异常分析的方法及终端
CN113688006A (zh) * 2017-10-16 2021-11-23 创新先进技术有限公司 一种日志数据的校验方法及装置
CN113688006B (zh) * 2017-10-16 2024-03-29 创新先进技术有限公司 一种日志数据的校验方法及装置
CN107729217A (zh) * 2017-10-30 2018-02-23 郑州云海信息技术有限公司 一种数据库异常处理方法和终端
CN110908855A (zh) * 2018-09-18 2020-03-24 深圳市鸿合创新信息技术有限责任公司 一种微服务运行维护装置及方法、电子设备
CN112486714A (zh) * 2019-09-12 2021-03-12 曙光信息产业(北京)有限公司 数据库异常捕获处理方法、装置和计算机设备
CN111552566A (zh) * 2020-04-26 2020-08-18 北京奇艺世纪科技有限公司 一种数据处理系统、方法、电子设备及存储介质
CN111552566B (zh) * 2020-04-26 2024-04-23 北京奇艺世纪科技有限公司 一种数据处理系统、方法、电子设备及存储介质
CN112632030A (zh) * 2020-12-04 2021-04-09 贝壳技术有限公司 数据异常定位方法及装置
CN112632030B (zh) * 2020-12-04 2023-04-14 贝壳技术有限公司 数据异常定位方法及装置

Also Published As

Publication number Publication date
CN106202535B (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN106202535A (zh) 一种rrd数据库的检测的方法及系统
CN108445410B (zh) 一种监测蓄电池组运行状态的方法及装置
US6973415B1 (en) System and method for monitoring and modeling system performance
CN110287081A (zh) 一种服务监控系统和方法
EP2141595B1 (en) System and method for detecting combinations of performance indicators associated with a root cause
CN107612779B (zh) 调度数据网二次安全防护网络设备及业务运行监视系统
CN115118581B (zh) 一种基于5g的物联网数据全链路监控和智能保障系统
CN104268061A (zh) 一种适用于虚拟机的存储状态监控机制
CN115598559A (zh) 一种智能ups电池健康状态监测系统
CN105989140B (zh) 一种数据块处理方法和设备
CN100555952C (zh) 甄别相关告警的实现方法
US7369967B1 (en) System and method for monitoring and modeling system performance
CN107766208A (zh) 一种监控业务系统的方法、系统及装置
CN105531680A (zh) 远程监视系统、远程监视方法以及程序
US20240272975A1 (en) Method and system for upgrading cpe firmware
CN116345699B (zh) 一种基于互联网的输电电路信息采集系统及采集方法
CN108809734A (zh) 网络告警根源分析方法、系统、存储介质及计算机设备
CN106487597A (zh) 一种基于Zookeeper的服务监控系统和方法
CN112817814A (zh) 异常监控方法、系统、存储介质及电子装置
CN117214719A (zh) 一种基于大数据的新能源车辆电池健康评估系统
CN104579737A (zh) 一种分布式web系统的运行维护的方法及系统
CN107968727A (zh) 一种cifs服务的检测方法、装置及介质
CN110611715A (zh) 一种服务链路集合云监控信息的系统和方法
CN204463278U (zh) 一种点巡检终端、标识设备和点巡检系统
CN116381419B (zh) 输电线路故障处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant