CN1485737A - 基于双向信息流的分布式监控方法 - Google Patents

基于双向信息流的分布式监控方法 Download PDF

Info

Publication number
CN1485737A
CN1485737A CNA031472559A CN03147255A CN1485737A CN 1485737 A CN1485737 A CN 1485737A CN A031472559 A CNA031472559 A CN A031472559A CN 03147255 A CN03147255 A CN 03147255A CN 1485737 A CN1485737 A CN 1485737A
Authority
CN
China
Prior art keywords
monitoring
information
control
control command
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA031472559A
Other languages
English (en)
Other versions
CN100403273C (zh
Inventor
范中磊
许鲁
韩月
王敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Blue Whale Information Technology Co Ltd
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB031472559A priority Critical patent/CN100403273C/zh
Publication of CN1485737A publication Critical patent/CN1485737A/zh
Application granted granted Critical
Publication of CN100403273C publication Critical patent/CN100403273C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Multi Processors (AREA)

Abstract

一种基于双向信息流的分布式监控方法,包括:位于监控方上的监测(5)从被监控方接收监测信息;位于监控方上的中心控制与分析(7)从监测(5)接收监测信息并对接收的监测信息进行分析决策;位于被监控方上的控制信息通道接口(9),接收来自中心控制与分析(7)的文件数据和控制命令数据。当监控方发现被监控方出现故障或存在潜在的故障时,便根据不同的故障确定相应的处理方案,然后通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群系统的性能和可用性,而且为系统的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。

Description

基于双向信息流的分布式监控方法
技术领域
本发明涉及信息技术领域,特别涉及一种基于双向信息流的分布式监控方法。
背景技术
随着网络技术的迅速发展,基于网络互联的各种分布式应用系统也逐渐增多。如提供WWW服务的Web服务器机群、提供数据库服务的数据库服务器机群、提供计算服务的计算服务器机群等。在很多应用场合,如数据中心、电子商务、科学计算等,机群中包含大量的服务器节点和网络设备,往往是少则几十个,多则成百上千个,而且这些服务器节点和设备的物理位置的分布范围也可能是很广的。如何对上述这样的分布式系统进行有效地监测和控制,以能够及时地发现并排除系统中已存在的和潜在的故障,保证系统高效可靠的运行,便成为分布式监控系统需要解决的问题。
传统的分布式监控系统大多集中在信息获取方面,也就是监测方面,而在对系统的控制能力上相对是比较弱的,特别是在自动控制能力上就更加薄弱了。比较有代表性的就是基于简单网络管理协议(SNMP)的监控系统,其大多数系统都是利用SNMP来获取所需的信息,加以显示和分析,当发现一些可能的问题时便通知管理员,通过人工干预进行故障发现和排除。这种人工控制方式往往会导致系统的故障不能及时得到处理,影响整个系统的工作。在有大量节点,而且节点物理位置分布广泛的机群应用中,这个问题会更加突出,同时导致人力、物力和财力的花费。
对传统的分布式监控系统结构进行分析,我们发现,导致上述问题的一个重要原因就是其信息流大多是单向的,即信息大多是从被监控方流向监控方,而缺乏一个有效的从监控方到被监控方的控制信息流。尽管像SNMP协议也提供了从监控方到被监控方的信息流功能,但其功能很弱,一般只能通过其进行字符型或整型数据的传送,很难满足一些复杂控制的需求。例如监控方远程下载某个故障处理程序到被监控方并运行,排除故障。
图1为传统的分布式监控系统结构示意图。被监控方1通过其上的监控代理2传送监测信息3到监控方4,监控方4上的监测、显示和报警5接受其所需的监测信息3,进行显示或报警等;监控方4上的监测、显示和报警5也可以通过被监控方1上的监控代理2向其传送字符型或整型数据信息6,进行一些阈值的设定等。
发明内容
本发明的目的是提出一种基于双向信息流的分布式监控系统结构和方法。
为实现上述目的,一种基于双向信息流的分布式监控方法,包括:
位于监控方上的监测5从被监控方接收监测信息;
位于监控方上的中心控制与分析7从监测5接收监测信息并对接收的监测信息进行分析决策;
位于被监控方上的控制信息通道接口9,接收来自中心控制与分析7的文件数据和控制命令数据并执行来自中心控制与分析7的控制命令,然后,返回结果给中心控制与分析7。
采用这种结构,当监控方发现被监控方出现故障或存在潜在的故障时,便根据不同的故障确定相应的处理方案,然后通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群系统的性能和可用性,而且为系统的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。
具体实施方式
图2为基于双向信息流的分布式监控系统结构示意图。与图1所示的传统分布式监控系统结构相比,其不同在于,监控方4上的监测、显示和报警5接受到监测信息3之后,将其传送到中心分析和控制7,中心控制与分析7对接受的监测信息3进行分析决策,通过其上的控制信息通道接口8和被监控方上1的控制信息通道接口9传送文件数据或控制命令数据10到被监控方1,并控制被监控方1执行所需的处理程序或控制命令。
采用基于双向信息流的分布式监控系统,当监控方的分析控制软件发现被监控方出现故障或存在潜在的故障时,便可以根据需要,主动地、有针对性地、动态地下载一些故障检测程序到被监控方,改变被监控方的监测信息(如增加或减少监视信息的节点种类和上报频率、提高监视信息密度等),为其提供分析控制所需的监测信息;在获取充分的监测信息之后,通过故障原因分析,最终定位故障原因;针对其故障,确定相应的处理方案,并通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群系统的性能和可用性,而且为系统的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。
图3给出了基于双向信息流分布式监控系统结构的一种实施方式。其工作流程描述如下:
(1)监控方4上的中心控制与分析7通过其上SNMP程序5定购其所需的监测信息,SNMP程序5将定购信息转化为SNMP SET信息6传送到被监控方1上的SNMP程序2;
(2)被监控方1上的SNMP程序2根据收到的定购信息进行处理,将监控方4所需的监测信息转化为SNMP GET信息3传送到监控方4上的SNMP程序5,监控方4上的SNMP程序5对收到的监测信息进行整理和预处理之后,将其传给监控方4上的中心分析和控制7;
(3)中心控制与分析7对接受到的监测信息进行分析、处理和决策,如有必要,决定动态增加监视信息节点,进一步收集系统信息;(这一步骤有可能被多次重复)
(4)中心控制与分析7对接受到的监测信息进行分析、处理和决策,从文件和控制命令库13中获取所需的文件和控制命令属性信息14,转化为相应的控制命令,通过其上的控制命令发送接口8传送控制命令数据10到被监控方上1的控制命令接受和执行程序9;
(5)被监控方上1的控制命令接受和执行程序9根据所接受的控制命令,采取相应的处理。如果是运行已经下载的程序或系统命令,则直接控制执行;如果是需要下载文件,则调用被监控方1上的FTP客户端程序11下载文件;
(6)被监控方1上的FTP客户端程序11接受来自控制命令接受和执行程序9的下载命令17后,发送文件访问请求15到监控方4上的FTP服务器程序12,FTP服务器程序12从文件和控制命令库13中取得文件数据16,将其传递给FTP客户端程序11,FTP客户端程序11在完成文件传输后,返回结果给控制命令接受和执行程序9;
(7)控制命令接受和执行程序9接受FTP客户端程序11的返回结果以及其直接控制运行程序的返回结果,通过监控方4上的控制命令发送接口8返回结果给中心分析和控制7。
这样,就实现了从信息的定购、采集、分析处理、故障发现到故障排除的自动化。当然,这只是一种实施方式,根据具体的应用环境还会有其它的实施方式。如不采用FTP协议传递文件等。

Claims (5)

1.一种基于双向信息流的分布式监控方法,包括:
位于监控方上的监测(5)从被监控方接收监测信息;
位于监控方上的中心控制与分析(7)从监测(5)接收监测信息并对接收的监测信息进行分析决策;
位于被监控方上的控制信息通道接口(9),接收来自中心控制与分析(7)的文件数据和控制命令数据并执行来自中心控制与分析(7)的控制命令,然后,返回结果给中心控制与分析(7)。
2.按权利要求1所述的方法,其特征在于:所述监测(5)包括显示和报警。
3.按权利要求1所述的方法,其特征在于:所述文件数据包括诸如故障监测程序和故障处理程序的各种可执行程序和配置文件。
4.按权利要求1所述的方法,其特征在于:所述控制命令数据包括下载文件命令、运行程序命令和系统命令。
5.按权利要求1所述的方法,其特征在于还包括位于监控方的存储文件和控制命令的数据库。
CNB031472559A 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法 Expired - Fee Related CN100403273C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031472559A CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031472559A CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Publications (2)

Publication Number Publication Date
CN1485737A true CN1485737A (zh) 2004-03-31
CN100403273C CN100403273C (zh) 2008-07-16

Family

ID=34156127

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031472559A Expired - Fee Related CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Country Status (1)

Country Link
CN (1) CN100403273C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811208A (zh) * 2011-06-03 2012-12-05 深圳市汇川控制技术有限公司 通信桥接系统及方法
CN102833216A (zh) * 2011-06-16 2012-12-19 深圳市汇川控制技术有限公司 通信桥接装置
CN101529795B (zh) * 2006-11-02 2013-03-13 皇家飞利浦电子股份有限公司 分布式设备撤销
CN104991528A (zh) * 2015-05-14 2015-10-21 福州福大自动化科技有限公司 Dcs信息安全控制方法及控制站
CN106464696A (zh) * 2014-06-27 2017-02-22 西门子公司 用于分布式网络‑物理系统的弹性控制设计

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187498A (ja) * 1996-12-20 1998-07-21 Nec Corp 障害通知方式
US5905855A (en) * 1997-02-28 1999-05-18 Transmeta Corporation Method and apparatus for correcting errors in computer systems
FR2762695B1 (fr) * 1997-04-29 1999-05-28 Bull Sa Procede et dispositif de connexion de l'unite centrale d'un systeme de traitement de donnees a un sous-systeme de stockage de donnees a redondance
CN1142495C (zh) * 1999-12-22 2004-03-17 浙江南望图像信息产业有限公司 远程图像监控服务器
CN1241437C (zh) * 2001-05-28 2006-02-08 中兴通讯股份有限公司 分布式phs基站系统本地程序下载方法
CN1175350C (zh) * 2001-12-04 2004-11-10 上海复旦光华信息科技股份有限公司 主机性能监测及自动反应系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101529795B (zh) * 2006-11-02 2013-03-13 皇家飞利浦电子股份有限公司 分布式设备撤销
CN102811208A (zh) * 2011-06-03 2012-12-05 深圳市汇川控制技术有限公司 通信桥接系统及方法
CN102811208B (zh) * 2011-06-03 2016-08-03 深圳市汇川控制技术有限公司 通信桥接系统及方法
CN102833216A (zh) * 2011-06-16 2012-12-19 深圳市汇川控制技术有限公司 通信桥接装置
CN102833216B (zh) * 2011-06-16 2017-05-03 深圳市汇川控制技术有限公司 通信桥接装置
CN106464696A (zh) * 2014-06-27 2017-02-22 西门子公司 用于分布式网络‑物理系统的弹性控制设计
CN106464696B (zh) * 2014-06-27 2020-04-07 西门子公司 用于分布式网络-物理系统的弹性控制设计
CN104991528A (zh) * 2015-05-14 2015-10-21 福州福大自动化科技有限公司 Dcs信息安全控制方法及控制站
CN104991528B (zh) * 2015-05-14 2018-02-13 福州福大自动化科技有限公司 Dcs信息安全控制方法及控制站

Also Published As

Publication number Publication date
CN100403273C (zh) 2008-07-16

Similar Documents

Publication Publication Date Title
CN112929187B (zh) 网络切片管理方法、装置和系统
CN105631026A (zh) 一种安全数据分析系统
CN113242153B (zh) 一种基于网络流量监控的面向应用的监控分析方法
CN109962792A (zh) 一种基于大数据的全链路监控系统
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN101877618A (zh) 基于无代理方式进行监控的方法、服务器及系统
CN116980284B (zh) 一种基于物联网的光缆分纤箱运维信息传输方法和系统
CN109460829A (zh) 基于大数据处理及云传输下的智能监测方法及平台
CN115733762A (zh) 具有大数据分析能力的监控系统
CN107463490B (zh) 一种应用于平台开发中的集群日志集中收集方法
CN113760634A (zh) 一种数据处理方法和装置
KR102028342B1 (ko) 데이터 처리 솔루션을 활용한 실시간 금융 비즈니스 제공 및 의사결정 지원 시스템 및 방법
CN118170538A (zh) 任务处理方法、物联网系统及计算机程序产品
CN101242314B (zh) 一种实现违例预警的方法及装置
CN100403273C (zh) 基于双向信息流的分布式监控方法
CN117729576A (zh) 告警监控方法、装置、设备及存储介质
CN112235164A (zh) 一种基于控制器的神经网络流量预测装置
CN105187490B (zh) 一种物联网数据的中转处理方法
CN108989116B (zh) 大数据收集分析系统及方法
US20070101017A1 (en) System and method for routing information
CN113794646B (zh) 能源行业的监控数据传输系统及方法
CN213126061U (zh) 一种基于控制器的神经网络流量预测装置
CN112487050A (zh) 基于大数据挖掘的雷电预警方法及系统
CN112019524A (zh) 3d打印云服务的通信协议结构、数据包处理方法和系统
CN111399971A (zh) 一种网元状态解析方法、装置和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: TIANJIN ZHONGKE BLUE WHALE INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: INST. OF COMPUTING TECHN. ACADEMIA SINICA

Effective date: 20091204

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20091204

Address after: Tianjin New Technology Industrial Park Huayuan Industrial Park Haitai development 6 Road 6 green industrial base F 5 gate 201.

Patentee after: Tianjin Branch Blue Whale Information Technology Co., Ltd.

Address before: No. 6 South Road, Zhongguancun Academy of Sciences, Beijing

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

ASS Succession or assignment of patent right

Owner name: BEIJING ZHONGKE BLUEWHALE INFORMATION TECHNOLOGY C

Effective date: 20140813

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140813

Address after: 300384 Tianjin Huayuan Industrial Park New Technology Industrial Park Development Road No. 6 6 Haitai green industry base building F 5 door No. 201

Patentee after: Tianjin Branch Blue Whale Information Technology Co., Ltd.

Patentee after: Beijing Zhongke blue whale Information Technology Co., Ltd.

Address before: 300384 Tianjin Huayuan Industrial Park New Technology Industrial Park Development Road No. 6 6 Haitai green industry base building F 5 door No. 201

Patentee before: Tianjin Branch Blue Whale Information Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080716

Termination date: 20210710

CF01 Termination of patent right due to non-payment of annual fee