CN111371574A - 一种机房监控的运维管理系统平台 - Google Patents

一种机房监控的运维管理系统平台 Download PDF

Info

Publication number
CN111371574A
CN111371574A CN201811593073.0A CN201811593073A CN111371574A CN 111371574 A CN111371574 A CN 111371574A CN 201811593073 A CN201811593073 A CN 201811593073A CN 111371574 A CN111371574 A CN 111371574A
Authority
CN
China
Prior art keywords
maintenance management
data
maintenance
module
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811593073.0A
Other languages
English (en)
Inventor
魏长柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Chuanji Electrical Technology Co ltd
Original Assignee
Guangzhou Chuanji Electrical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Chuanji Electrical Technology Co ltd filed Critical Guangzhou Chuanji Electrical Technology Co ltd
Priority to CN201811593073.0A priority Critical patent/CN111371574A/zh
Publication of CN111371574A publication Critical patent/CN111371574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种基于视频监控的机房监控运维管理平台,由于实际上网络监控与处理故障时分开进行的,即网络监控虽然可以发现故障,但是无法提供有效的解决方法,针对现实中存在的这个问题,本发明实现了视频监控自动巡检功能,能够自动地检测出故障,报警模块启动工作,并将指令传送到管理运维服务模块,最后通过数据维护模块和权限分配模块提供解决方案,同时启动处理故障功能,能够高效率地实现计算机机房的自动化运维,提高运维管理的效率。

Description

一种机房监控的运维管理系统平台
技术领域
本发明属于网络监控、管理技术领域和网络监控及管理技术领域,具体涉及一种计算机机房监控运维管理系统。
背景技术
通常每个公司或企业都会用到由各种基础设备和业务流程组成的网络系统,这个网络系统的运行管理是对生产业务系统进行监控和管理,在统一的监控管理界面下,实现运行数据的实时收集、归纳、分析以及运行状态的实时监控、业务属性管理、系统设置管理等功能,成为了提供统一管理和系统优化的参考数据和决策依据。
目前,对于普通的网络系统而言,其常常是由多台不同生产商家生产的基础设备及多项业务流程组成的,为了使该网络系统中各种设备和业务流程正常运行,通常都需要对该网络系统进行网络监控和网络维护管理,而目前的网络监控和网络维护管理是两码事。网络监控是通过计算机提供的自动化监控平台即网络监控系统来实现的,而网络维护管理则是技术人员针对网络系统的一系列的人工处理活动。网络监控系统,实时监控网络系统的运行状态,当发现问题时给予报警提示,然后网络维护管理的技术人员查看报警提示,诊断故障原因,对网络系统做相应的故障排除处理。在网络系统的规模不是很大,设备种类不是很多,业务流程不是很复杂的情况下,这种运营模式没有太大的矛盾。
但是,实际情况是,能够使用网络监控系统的网络系统,往往网络系统的规模比较大,其组成设备和业务流程常常非常多和复杂,因为技术管理员短时间内很难了解整个网络系统的网络运行环境,才使用网络监控系统。设备种类很多,而且经常是不同厂家的设备;业务流程也很复杂,技术管理员很难对网络系统中的每一个设备都精通,即使某些优秀的技术管理员精通了系统中所有的设备,网络系统故障排除的时间仍然依靠技术管理员的经验和技能,因而网络系统的正常运行对这些技术管理员依赖性比较高。
监控系统的监控功能高度集成在网络系统的核心应用功能中,监控系统可以对工作区的使用率、网络带宽使用、用户权限、工作流程等内容进行实时监控;支持在设备级及用户级的深层监控;可以实时的对系统中单台机器以及按照人员名称进行跟踪监控,监控信息实时提交具有特定权限的管理者手中,并可以按照监控系统的数据接口定义要求,实时提交网络中的全部监控项目信息。
不同应用领域的监控系统,其组成基本是相同的,通常由监控设备、信号传输设备、主机设备、显示设备,报警模块,监控系统的数据库等组成,监控系统的数据库中均设有故障报警表格,故障报警表格为故障报警条目清单,这样可以使得报警模块及时报警。监控系统实时展现网络系统目前的状态,包括网络中的设备状态和每条业务的进展阶段,所以常用的数据源为:业务数据源、服务模块、网络、交换机、服务器、中间键、数据库、存储、终端设备等。数据采集为:业务数据、报警数据、性能数据、配置数据等,这些数据均会实时的进入到监控系统的数据库。数据处理后有下面功能表现:括扑/状态处理、故障处理、性能处理、配置处理。从而表现为:括扑/状态监控、故障监控、性能监控、系统配置监控。当监控系统发现网络运行系统中的任何设备或业务流程出现故障时,报警模块即会给出报警信息,提醒管理人员网络存在故障,然后再由管理人员人工进行排障处理。
正是由于上述监控系统虽有强大的监控功能,却只能监控,无法为整个网络系统的维护提供问题解决方案,因此怎样才能解决上述问题成为大家日益关注的焦点。网络系统中的网络监控系统监而不管,有问题我可以报告给你,如何处理就是技术管理员的事了,这种“不负责”的网络监控系统应该改进了。网络监控和网络维护管理实际上做的是同一件事。网络监控的目的就是为了更好更快的维护管理系统的,将系统监控和系统维护管理成为整体的一个系统成为目前人们追求的目标。
发明内容
针对现有技术中存在的缺陷,本发明的目的是提供一种基于机房视频监控的监控运维管理系统,该系统不仅能够对网络系统的正常运营实时监控,并且能够在发现故障的同时自动给出故障解决方案,将网络监控和网络的维护管理关联起来,从而能够实现网络维护资源的共享,以及网络知识和经验的共享。
为了实现上述发明目的,本发明采用的技术方案是:一种监控运维管理系统,该系统包括监控系统和运维管理系统,监控系统中设有报警模块、监控系统数据库;运维管理系统包括管理运维服务模块和运维管理数据库;其中,报警模块与管理运维服务模块相连接;
所述的监控系统用于实时监控网络系统中各种设备和/或业务流程的运行情况,当发现有故障时通知报警模块;
所述的报警模块,接收到监控系统发送的故障通知后,给出报警信息;并且将报警信息同时发送给管理运维服务模块;
所述的监控系统数据库用于实时存储监控系统采集的设备和/或业务流程的运行数据;并且监控系统数据库中设有故障报警条目清单,供报警模块使用;
所述的管理运维服务模块,能够接受报警模块发送来的报警信息,并能够根据报警信息在运维管理数据库中检索相应的故障处理信息,如果检索到相应的故障处理信息,则给出故障处理信息;如果没有检索到故障处理信息,则提示无相应的故障处理信息;
所述的运维管理数据库用于存储故障处理信息,供管理运维服务模块检索之用;
进一步,所述的管理运维服务模块如果没有检索到故障处理信息时,能够支持管理人员手工在运维管理数据库中检索相应的故障处理信息;
进一步,所述的运维管理系统还设有数据维护模块,该模块与运维管理数据库相连接,所述的数据维护模块能够让管理人员对运维管理数据库中的数据进行维护,即能够输入新数据,编辑、修改运维管理数据库中已有的数据;
更进一步,所述的运维管理系统还设有权限分配模块,该模块能够给予管理人员不同的权限,不同权限的管理人员能够维护运维管理数据库中的不同数据,该模块与数据维护模块相连接;
本发明的效果在于:采用本发明所述的系统能够使得网络监控系统在发现问题报警的同时提供故障的解决办法,将故障造成的损失和影响控制在最小范围内,这样将网络系统的监控和维护管理高效的合而为一,大大提高了网络系统故障排除的效率,减少了对管理人员的人工依赖,并且网络系统运行越久,管理运维系统的信息和监控系统的信息越匹配,提供问题解决办法的准确率也越高。
附图说明
图1是本发明所述系统的结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细的说明。
如图1所示,一种监控运维管理系统,该系统包括监控系统和运维管理系统,监控系统中设有报警模块、监控系统数据库;运维管理系统包括管理运维服务模块、运维管理数据库、数据维护模块和权限分配模块;其中,报警模块与管理运维服务模块相连接,管理运维服务模块、运维管理数据库、数据维护模块、权限分配模块依次相连;
当上述系统工作时,首先由监控系统实时监控网络系统中各种设备和/或业务流程的运行情况,当发现有故障时通知报警模块,本实施例中以发现“业务流程中断”为例,当监控系统发现业务流程中断这个故障时通知报警模块;报警模块接收到监控系统发送来的故障通知后,给出报警信息即“业务流程中断”,并且将该报警信息同时发送给管理运维服务模块;管理运维服务模块接受报警模块发送来的报警信息后,根据该报警信息在运维管理数据库中检索相应的故障处理信息为:“重新开始业务”,检索的方式有多种:如关键词、标题等;本实施例中检索到相应的故障处理信息,则给出故障处理信息;当然,有时在实际操作中没有检索到故障处理信息,则提示无相应的故障处理信息,此时,管理运维服务模块能够支持管理人员手工在运维管理数据库中通过关键词或标题等方式检索相应的故障处理信息;
管理人员根据管理运维服务模块给出的故障处理信息(或人工检索得到的故障处理信息)进行故障的排除工作;故障排除后工作也没有完全结束,为了保证运维管理数据库中存储的故障处理信息的准确性,管理人员还需要通过数据维护模块对运维管理数据库进行维护,即输入新数据,编辑、修改运维管理数据库中的已有数据,如果运维管理数据库没有相应的故障处理信息,则管理人员需要将该次故障排除的正确操作信息输入运维管理数据库;如果运维管理数据库已存在相应的故障处理信息,则管理人员需要核实或者修改为正确的故障处理信息;实际操作过程中,通常都会通过权限分配模块给予管理人员不同的数据维护权限,权限越高能够维护的数据越多;例如常会将管理人员分为两种级别即一般级别和高级级别,一般级别的管理人员只能将故障处理信息输入到数据池中,并可以对数据池中的数据编辑,然后再由高级级别的管理人员根据故障报警条目清单的文字内容设定关键词,然后将数据池内存储的相关故障处理信息按关键字方式输入运维管理数据库,高级级别的管理人员也可以对运维管理数据库内的数据进行编辑修改;
一般而言,运维管理数据库初始存储的故障处理信息来源于设备生产厂家、已有的常见故障处理方法等,基本故障处理信息也是由管理人员通过关键词的方式输入运维管理数据库的,随时网络系统的持续运营,时间越久,故障处理的信息会越来越多,这样管理运维数据库中的故障处理信息与监控系统的信息越匹配,提供问题解决办法的准确率越高。
当然,实际操作过程中,管理运维数据库中提供的故障处理信息有可能不完全正确,有时可能是错误的,有时可能根本没有相应的故意处理信息,这就需要管理人员在实际故障处理完成后将相应的处理情况核实或输入数据库,对正确的故障处理信息不准确的改正过来,没有的补充进去,这样随着运行时间的越久,网络系统的监控和维护会越来越完善,对同一个故障也可能会提供多个故障处理办法,这样没有经过长期培训的技术人员也可以管理网络系统,给熟悉系统的技术人员提供参考,以便快速、全面的解决问题,大大减少了对技术管理人员的依赖,提供了自动化处理的高效系统。
以上技术特征构成了本发明的实施例,其具有较强的适应性和实施效果,可根据实际需要增减非必要的技术特征,来满足不同情况的需求。

Claims (6)

1.一种机房监控的运维管理系统平台,包括监控系统和运维管理系统,监控系统由报警模块、监控系统数据库组成;而运维管理系统则包括了管理运维服务模块和运维管理数据库。
2.当管理运维服务模块没有检测到故障信息时,支持人工手工进行人为的检测以及处理。
3.运维管理模块还设有数据维护模块,它与运维管理数据库相连,该数据维护模块可以让机房管理人员对运维管理数据库进行维护,拥有输入新数据、编辑、修改运维管理数据库中已有的数据。
4.运维管理模块HIA设有权限分配模块,它可以给予机房计算机使用者不同的权限,不同权限的拥有者拥有不同的维护运维管理数据库中的不同的数据,适用于高校的计算机课程的教学,教师与学生分别属于不同的权限,其中,教师的权限高于学生的权限。
5.运维管理模块中的自动巡视单元采用通信协议完成网络探测,能够对视频流进行采集、分解、分析,完成自动巡视和故障原因上报。
6.运维管理系统中的数据维护模块中的数据分析单元可以对视频监控设备完整周期的正常数据、故障数据和在线数据进行处理,并且以图表的形式展现出来。
CN201811593073.0A 2018-12-25 2018-12-25 一种机房监控的运维管理系统平台 Pending CN111371574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811593073.0A CN111371574A (zh) 2018-12-25 2018-12-25 一种机房监控的运维管理系统平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811593073.0A CN111371574A (zh) 2018-12-25 2018-12-25 一种机房监控的运维管理系统平台

Publications (1)

Publication Number Publication Date
CN111371574A true CN111371574A (zh) 2020-07-03

Family

ID=71211488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811593073.0A Pending CN111371574A (zh) 2018-12-25 2018-12-25 一种机房监控的运维管理系统平台

Country Status (1)

Country Link
CN (1) CN111371574A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022262629A1 (zh) * 2021-06-17 2022-12-22 青岛海尔空调电子有限公司 基于物联网空调的远程监控系统及其控制方法
CN116708157A (zh) * 2023-08-07 2023-09-05 北京鹰速光电科技有限公司 一种计算机安全运维服务系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022262629A1 (zh) * 2021-06-17 2022-12-22 青岛海尔空调电子有限公司 基于物联网空调的远程监控系统及其控制方法
CN116708157A (zh) * 2023-08-07 2023-09-05 北京鹰速光电科技有限公司 一种计算机安全运维服务系统

Similar Documents

Publication Publication Date Title
CN101582812A (zh) 一种监控运维管理系统
CN107302466B (zh) 一种动环监控系统大数据分析平台及方法
CN110855473B (zh) 一种监控方法、装置、服务器及存储介质
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
CN109409678B (zh) 一种应用于电网的高效多功能技术标准信息系统
CN110505102B (zh) 电力信息通信融合监控与服务标准化管理平台系统及方法
CN107958337A (zh) 一种信息资源可视化移动管理系统
CN112152830A (zh) 一种智能的故障根因分析方法及系统
CN101582811A (zh) 一种建立网络监控和运维管理一体化的方法
CN108052358B (zh) 一种分布式部署的系统和方法
CN104021195A (zh) 基于知识库的告警关联分析方法
CN107332722A (zh) 一种故障信息的排除方法及系统
CN101345661A (zh) 通信设备的故障诊断方法及装置
CN111371574A (zh) 一种机房监控的运维管理系统平台
CN105207797A (zh) 故障定位方法和装置
CN103986607A (zh) 一种智能数据中心语音声光报警监控系统
US20230090132A1 (en) State-based detection of anomalous api calls within a real-time data stream
CN102571424A (zh) 一种工程事件处理方法、装置和系统
CN112270490A (zh) 一种基于物联网知识图谱的园区智能设施管理系统
CN115810158A (zh) 一种基于巡检机器人的实时机柜u位占用情况检测方法
CN116843168A (zh) 一种公司级监控系统及应用
CN109981319A (zh) 一种机房监控的运维管理系统平台
CN210724863U (zh) 基于私有云的终端网络关联关系展示平台
CN113886378A (zh) 一种大数据治理系统
CN114118454A (zh) 一种基于5g网络的设备管理方法、装置、设备及可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200703