CN103475502B - 一种it运维管理系统及其拥塞处理方法 - Google Patents

一种it运维管理系统及其拥塞处理方法 Download PDF

Info

Publication number
CN103475502B
CN103475502B CN201310249092.2A CN201310249092A CN103475502B CN 103475502 B CN103475502 B CN 103475502B CN 201310249092 A CN201310249092 A CN 201310249092A CN 103475502 B CN103475502 B CN 103475502B
Authority
CN
China
Prior art keywords
module
management system
equipment
congestion
congested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310249092.2A
Other languages
English (en)
Other versions
CN103475502A (zh
Inventor
孙伟力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SHENGSHI GUANGMING SOFTWARE Co Ltd
Original Assignee
BEIJING SHENGSHI GUANGMING SOFTWARE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SHENGSHI GUANGMING SOFTWARE Co Ltd filed Critical BEIJING SHENGSHI GUANGMING SOFTWARE Co Ltd
Priority to CN201310249092.2A priority Critical patent/CN103475502B/zh
Publication of CN103475502A publication Critical patent/CN103475502A/zh
Application granted granted Critical
Publication of CN103475502B publication Critical patent/CN103475502B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种IT运维管理系统及其拥塞处理方法,包括监控模块、数据存储模块、拥塞条件数据库、控制模块和执行模块,通过监控模块对IT运维管理系统中的设备的运行状态进行监测,并将运行的实时状态参数存储到数据存储模块中;通过控制模块将数据存储模块中的状态参数与拥塞条件数据库中的发生拥塞的条件进行分析和判断;当控制模块判断存在拥塞时,通过执行模块发送操作指令到相应的设备上进行远程自动复位操作。解决了现有技术中网络设备发生拥塞时,需要人工处理,费时费力且容易产生误操作的技术问题。特别适用于网络管理系统。

Description

一种IT运维管理系统及其拥塞处理方法
技术领域
本发明涉及数据通信,具体地说是一种数据通信中的拥塞处理方法。
背景技术
随着计算机网络技术的发展,网络结构越来越复杂,网络流量越来越大,当网络中的负载过度增加导致网络性能下降时,会发生网络拥塞。网络设备一旦出现拥塞现象,将会严重影响网络的正常工作,造成局部网络甚至整个网络的信息流通不畅。
IT运维管理系统是运用在企业内部对各种网络设备和业务流程进行维护管理的系统,该系统能为企业降低运维成本,提高工作效率。交换机、路由器、服务器等是组成企业网络系统必不可少的重要设备,它们的正常运行是信息化时代下公司运营的重要保障。当网络发生拥塞时,可以采取减小传输速率、更换链路、随机性地丢包等方法,但是这些方法运用在交换机、路由器、服务器等设备上的效果并不理想。由于数据通信故障发生时,数据量可能骤然变大,缓冲区或内存区长期被占用不能得到释放,即使采用减小传输或者丢包的方式,也无法缓解当前的数据拥塞。但是如果采用复位方式时,则需要人工对设备进行操作,而且操作人员也很难判断设备内部到底处于何种状态,进行人工复位是不是合适。
如中国专利申请CN202143098U公开了一种IT运维管理监控系统,包括运维管理系统和监控系统,监控系统包括数据库监控模块和报警模块,运维管理模块包括配置管理模块、整合管理模块、业务管理模块和流程管理模块,该系统通过网络监控模块能够及时发现问题并快速报警,且提供相应的解决方法。该系统的不足在于网络设备发生拥塞时只能报告问题,却不能主动对设备进行复位。对网络问题报警并提供相应的解决方法后,仍需要维护人员先找到问题设备再进行手工修复。由于维护人员不可避免地会出现疏忽或者判断失误,很容易产生误操作,并且寻找问题和解决问题会消耗一定时间,给企业人员造成等待而无法办公等不良后果,降低了办公效率。目前还没有产品能在发生拥塞时对拥塞的设备提供有效的自动技术支持。
发明内容
为此,本发明所要解决的技术问题在于现有技术中网络设备发生拥塞时,需要人工处理,费时费力且容易产生误操作,从而提出一种可以自动进行拥塞处理的IT运维管理系统及其拥塞处理方法。
为解决上述技术问题,本发明提供一种IT运维管理系统及其拥塞处理方法。IT运维管理系统包括:
监控模块:发送轮询指令,监控设备运行时的状态参数;
数据存储模块:与所述监控模块连接,存储监控模块监控的状态参数;
拥塞条件数据库:存储有判断是否发生拥塞的条件;
控制模块:与所述数据存储模块连接,通过对数据存储模块中的状态参数进行分析,并与拥塞条件数据库中存储的条件进行比较,判断当前状态是否存在拥塞;
执行模块:与所述控制模块连接,根据控制模块的判断,当发生拥塞时发送操作指令到相应的设备上进行远程复位操作。
所述IT运维管理系统还包括复位记录模块,与所述执行模块连接,记录执行模块的复位操作。
所述IT运维管理系统还包括报警模块,与所述执行模块连接,在执行复位操作后进行报警提示。
所述IT运维管理系统还包括拥塞条件设置模块,与所述拥塞条件数据库连接,对拥塞条件数据库进行管理,设置和调整认定拥塞产生的条件。
所述IT运维管理系统对应的拥塞处理方法包括如下步骤:
(1)通过监控模块对所述IT运维管理系统中的设备的运行状态进行监测,并将运行的实时状态参数存储到数据存储模块中;
(2)通过控制模块将所述数据存储模块中的状态参数与拥塞条件数据库中的发生拥塞的条件进行分析和判断;
(3)当控制模块判断存在拥塞时,通过执行模块发送操作指令到相应的设备上进行远程自动复位操作。
所述拥塞处理方法中的状态参数包括:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化。
所述步骤(3)中,远程自动复位操作为,利用网络协议向拥塞设备发送复位指令,实现设备的自动复位。
在所述步骤(3)中,进行远程自动复位操作前还包括向设备发送数据备份指令将设备中的数据备份的步骤。
所述拥塞处理方法还包括步骤(4),当对设备进行远程自动复位后,通过报警模块报告对设备所采取的复位操作,并通过复位记录模块记录复位操作。
在所述步骤(2)之前,还包括通过拥塞条件设置模块对所述拥塞条件数据库进行设置和调整的步骤。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明所述的IT运维管理系统包括监控模块、数据存储模块、拥塞条件数据库、控制模块以及执行模块,其对应拥塞处理方法为通过监控模块监控各个设备运行时的状态参数,存储在数据存储模块内,通过控制模块进行拥塞判断,发生拥塞时通过执行模块发送操作指令对相应的设备进行远程复位。这样就实现了当运行的网络出现拥塞时,通过对设备运行状态的监控找到产生拥塞的设备,然后利用网络协议向拥塞设备发送指令进行远程自动复位,无需人工操作,解决了现有技术中发生拥塞需要复位时需要人工判断和人工处理的问题,省时省力,且避免了人工操作容易产生误操作的问题,提高了整个系统的运行稳定性以及各个设备的运行效率。此外,由于设备复位,一方面清空了设备的缓存区,另一方面取消了设备之间的锁定等待,从而使得设备进入一个初始的工作状态,使得设备的工作效率大大提高,提升了整个网络的传输效率。
(2)本发明所述的IT运维管理系统,还包括复位记录模块,与所述执行模块连接,记录所述执行模块的复位操作,在对拥塞设备进行远程复位操作后,将记录执行模块的复位操作,便于技术人员及时准确地了解网络的运行状态以及后续对设备运行状况的分析和管理,合理地分配网络资源。此外,IT运维管理系统还包括报警模块,复位后进行报警提示,便于管理人员及时了解各个设备的工作状态,出现问题可以及时发现。
(3)本发明所述的IT运维管理系统,还包括拥塞条件设置模块,可以设置和调整所述拥塞条件数据库中认定拥塞产生的条件,不同的设备可以根据自身的特点单独设置产生拥塞的条件,有效提高了该系统对拥塞判断的准确性,扩大了该系统的适用范围。
(4)本发明所述的IT运维管理系统的拥塞处理方法,在监控设备的运行状态时,采用的状态参数包括:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化,利用这些参数对设备进行综合判断,有效提高了拥塞判断的准确性。
(5)本发明中所述的IT运维管理系统的拥塞处理方法,利用网络协议向拥塞设备发送复位命令,实现设备的自动复位,不仅操作简单,而且实现了自动复位,提高了网络的利用效率和拥塞处理效率。
(6)本发明中所述的IT运维管理系统的拥塞处理方法,在对设备进行远程自动复位操作前,向设备发送数据备份指令将设备中的数据备份,避免设备中所存储的数据因复位而丢失,确保了该系统对设备复位操作的安全性。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明实施例1提供的IT运维管理系统的结构框图;
图2是本发明实施例2提供的IT运维管理系统的结构框图。
具体实施方式
下面给出本发明所述的IT运维管理系统及其拥塞处理方法的具体实施方式。
实施例1
本实施例提供一种IT运维管理系统,如图1所示,包括监控模块、数据存储模块、拥塞条件数据库、控制模块和执行模块。监控模块与所述待监测的系统中的设备连接,如连接路由器或交换机,并向其发送轮询指令,监控这些设备运行时的状态参数,此处的运行状态参数为平均队列长度L。数据存储模块与监控模块连接,存储监控模块监控的状态参数,在本实施例中平均队列的长度会不断存储在此处的数据存储模块中。拥塞条件数据库与控制模块连接,存储有判断是否发生拥塞的条件,在本实施例中设置了平均队列长度大于阈值A时,认为发生拥塞。此处的A需要根据不同系统中的设备来进行设置,本领域的技术人员根据当前的运行环境可以设置。控制模块与数据存储模块连接,通过对数据存储模块中的平均队列长度L进行分析,并与拥塞条件数据库中存储的条件进行比较,当平均队列长度L大于阈值A时,则判断当前状态已经存在拥塞,否则认为不存在拥塞。执行模块与控制模块连接,根据控制模块的判断,当发生拥塞时发送操作指令到相应的设备上进行远程复位操作,本实施例中利用网络协议向拥塞设备发送复位命令,实现设备的自动复位,如利用TELNET协议(远程访问协议)向拥塞设备发送REBOOT命令,实现设备的自动复位。
本实施例所述的IT运维管理系统对应的拥塞处理方法包括以下步骤:
(1)通过监控模块对管理系统中的设备的运行状态进行监测,并将运行的实时状态参数存储到数据存储模块中,本实施例中所述状态参数为平均队列长度L;
(2)通过控制模块将数据存储模块中的状态参数与拥塞条件数据库中的发生拥塞的条件进行分析和判断,当平均队列长度L大于阈值A时,认为存在拥塞,否则,认为不存在拥塞;
(3)当控制模块判断存在拥塞时,通过执行模块发送操作指令到相应的设备上进行远程自动复位操作,此处为利用TELNET协议(远程访问协议)向拥塞设备发送REBOOT命令,实现设备的自动复位。
作为可以变换的其他实施方式,设备运行时的所述状态参数可以包括下列中的一种或几种:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化。
实施例2
本实施例在实施例1的基础上进一步扩展,如图2所示,增加复位记录模块、报警模块和拥塞条件设置模块。复位记录模块与执行模块连接,记录执行模块的复位操作。报警模块与执行模块连接,在执行复位操作后进行报警提示。拥塞条件设置模块与拥塞条件数据库连接,对拥塞条件数据库进行管理,设置和调整认定拥塞产生的条件。
本实施例对应的拥塞处理方法包括以下步骤:
(1)通过监控模块对管理系统中的设备的运行状态进行监测,并将运行的实时状态参数存储到数据存储模块中,其中,所述状态参数包括:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化。
(2)通过拥塞条件设置模块对所述拥塞条件数据库进行设置和调整。此处通过拥塞条件设置模块对所述拥塞条件数据库进行设置包括对针对上述五个状态参数设置产生拥塞的条件,本领域的技术人员根据整个系统的运行环境来设置上述五个状态参数产生拥塞的条件,这些本领域的技术人员都可以根据需要来设置。当运行环境发生变化时,通过拥塞条件设置模块对所述拥塞条件数据库进行调整,使其更好的适应当前运行环境。
(3)通过控制模块将数据存储模块中的状态参数与拥塞条件数据库中的发生拥塞的条件进行分析和判断,此处的控制模块中设置有判断规则,判断规则包括上述五个状态参数需要全部满足产生拥塞的条件还是部分满足产生拥塞的条件则判断存在拥塞,这些规则本领域的技术人员根据系统运行环境以及各个设备的功能来进行个性化的设置。
(4)当控制模块判断存在拥塞时,执行模块向设备发送数据备份指令将设备中的数据进行备份,这样就进一步提高了设备运行时的安全性,将数据丢失的风险尽量降低。
(5)将设备中的数据备份后,执行模块利用网络协议TELNET协议(远程访问协议)向拥塞设备发送REBOOT命令,实现设备的自动复位。作为可以变换的实施方式,此处可以采用其他网络协议,以及其协议对应的复位操作指令来实现远程自动复位。
(6)当对设备进行远程自动复位后,通过报警模块报告对设备所采取的复位操作,此处的报警模块可以采用报警声、闪烁灯或者提示界面的方式实现。同时,通过复位记录模块记录该次复位操作。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (9)

1.一种IT运维管理系统,其特征在于,包括:
监控模块:发送轮询指令,监控设备运行时的状态参数,所述状态参数包括:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化;
数据存储模块:与所述监控模块连接,存储所述监控模块监控的状态参数;
拥塞条件数据库:存储有判断是否发生拥塞的条件;
控制模块:与所述数据存储模块连接,通过对数据存储模块中的所述状态参数进行分析,并与所述拥塞条件数据库中存储的条件进行比较,判断当前状态是否存在拥塞;
执行模块:与所述控制模块连接,根据所述控制模块的判断,当发生拥塞时发送操作指令到相应的设备上进行远程复位操作。
2.根据权利要求1所述的IT运维管理系统,其特征在于:还包括复位记录模块,与所述执行模块连接,记录所述执行模块的复位操作。
3.根据权利要求1或2所述的IT运维管理系统,其特征在于:还包括报警模块,与所述执行模块连接,在执行复位操作后进行报警提示。
4.根据权利要求3所述的IT运维管理系统,其特征在于:还包括拥塞条件设置模块,与所述拥塞条件数据库连接,对所述拥塞条件数据库进行管理,设置和调整认定拥塞产生的条件。
5.一种IT运维管理系统的拥塞处理方法,其特征在于,包括如下步骤:
(1)通过监控模块对所述IT运维管理系统中的设备的运行状态进行监测,并将运行的实时状态参数存储到数据存储模块中;其中所述状态参数包括:1)缺乏缓冲区造成的丢包率;2)平均队列长度;3)超时重传的包的数目;4)平均包延迟;5)包延迟变化;
(2)通过控制模块将所述数据存储模块中的状态参数与拥塞条件数据库中的发生拥塞的条件进行分析和判断;
(3)当控制模块判断存在拥塞时,通过执行模块发送操作指令到相应的设备上进行远程自动复位操作。
6.根据权利要求5所述的IT运维管理系统的拥塞处理方法,其特征在于,步骤(3)中,远程自动复位操作为,利用网络协议向拥塞设备发送复位指令,实现设备的自动复位。
7.根据权利要求5或6所述的IT运维管理系统的拥塞处理方法,其特征在于,在所述步骤(3)中,进行远程自动复位操作前还包括向设备发送数据备份指令将设备中的数据备份的步骤。
8.根据权利要求7所述的IT运维管理系统的拥塞处理方法,其特征在于,还包括步骤(4),当对设备进行远程自动复位后,通过报警模块报告对设备所采取的复位操作,并通过复位记录模块记录复位操作。
9.根据权利要求8所述的IT运维管理系统的拥塞处理方法,其特征在于:在所述步骤(2)之前,还包括通过拥塞条件设置模块对所述拥塞条件数据库进行设置和调整的步骤。
CN201310249092.2A 2013-06-21 2013-06-21 一种it运维管理系统及其拥塞处理方法 Expired - Fee Related CN103475502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310249092.2A CN103475502B (zh) 2013-06-21 2013-06-21 一种it运维管理系统及其拥塞处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310249092.2A CN103475502B (zh) 2013-06-21 2013-06-21 一种it运维管理系统及其拥塞处理方法

Publications (2)

Publication Number Publication Date
CN103475502A CN103475502A (zh) 2013-12-25
CN103475502B true CN103475502B (zh) 2016-06-29

Family

ID=49800214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310249092.2A Expired - Fee Related CN103475502B (zh) 2013-06-21 2013-06-21 一种it运维管理系统及其拥塞处理方法

Country Status (1)

Country Link
CN (1) CN103475502B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789323A (zh) * 2017-01-05 2017-05-31 深圳奇迹智慧网络有限公司 一种通信网络管理方法及其装置
CN110110037A (zh) * 2018-01-19 2019-08-09 北京盛世光明软件股份有限公司 一种硬件设备信息的处理方法和查询方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582852A (zh) * 2009-06-10 2009-11-18 中兴通讯股份有限公司 一种网络拥塞管理的方法及系统
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统
CN101582852A (zh) * 2009-06-10 2009-11-18 中兴通讯股份有限公司 一种网络拥塞管理的方法及系统

Also Published As

Publication number Publication date
CN103475502A (zh) 2013-12-25

Similar Documents

Publication Publication Date Title
US10733037B2 (en) STAB: smart triaging assistant bot for intelligent troubleshooting
US10805185B2 (en) Detecting bug patterns across evolving network software versions
US10691082B2 (en) Dynamically adjusting sample rates based on performance of a machine-learning based model for performing a network assurance function in a network assurance system
CN107124315B (zh) 基于snmp及ipmi协议的多服务器监测系统及监测方法
EP3518467B1 (en) Dynamic selection of models for hybrid network assurance architectures
US11856425B2 (en) Automatic characterization of AP behaviors
CN107070726A (zh) 一种基于mdc的综合管理方法
US11070441B2 (en) Model training for on-premise execution in a network assurance system
CN102905299B (zh) 一种模拟用户行为对无线ap自动监测与异常告警的方法
CN105790990B (zh) 一种监管配用电通信业务的方法及其系统
US9298583B2 (en) Network traffic based power consumption estimation of information technology systems
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN112291075B (zh) 网络故障定位方法、装置、计算机设备及存储介质
US11049033B2 (en) Deriving highly interpretable cognitive patterns for network assurance
CN102331751A (zh) 一种实时工业控制系统的监控方法及系统
CN106383770A (zh) 一种服务器监控管理的方法及服务器
CN102143011B (zh) 一种实现网络保护的装置及方法
US20140047260A1 (en) Network management system, network management computer and network management method
CN103475502B (zh) 一种it运维管理系统及其拥塞处理方法
JP2012039529A (ja) 電力特性利用通信網設定方法及びネットワーク装置
US10547518B2 (en) Detecting transient vs. perpetual network behavioral patterns using machine learning
CN103248505B (zh) 基于视图的网络监控方法及装置
CN103117888A (zh) 通过网络事件进行应用性能评估的方法、装置及系统
JP2010130113A (ja) ネットワーク管理システム、ネットワーク管理方法、マネージャおよびエージェント
CN104052665A (zh) 一种流量转发路径的确定方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160629

Termination date: 20210621