CN107291595A - 分布式应用系统监控管理方法 - Google Patents

分布式应用系统监控管理方法 Download PDF

Info

Publication number
CN107291595A
CN107291595A CN201710546711.2A CN201710546711A CN107291595A CN 107291595 A CN107291595 A CN 107291595A CN 201710546711 A CN201710546711 A CN 201710546711A CN 107291595 A CN107291595 A CN 107291595A
Authority
CN
China
Prior art keywords
message
monitoring
application
class
managing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710546711.2A
Other languages
English (en)
Inventor
徐建兵
白慧生
杨磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Win Technology Co Ltd
Original Assignee
Chengdu Win Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Win Technology Co Ltd filed Critical Chengdu Win Technology Co Ltd
Priority to CN201710546711.2A priority Critical patent/CN107291595A/zh
Publication of CN107291595A publication Critical patent/CN107291595A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种分布式应用系统监控管理方法,采用ActiveMQ作为消息处理服务器,监控系统间以消息的方式进行数据传递;所述消息分为三类:监控类消息、系统消息和带宽消息;包括以下步骤:被监控应用程序发送ObjectMessage到ActiveMQ的队列中;由ActiveMQ维护队列:logQueue、systemQueue和bandwidthQueue;监控类消息的收发通过logQueue,系统类消息的收发通过systemQueue,带宽类消息的收发通过bandwidthQueue。本发明可保证计算机应用系统平稳运行,并为系统维护和升级提供可视化依据。使用户可以从任何地方通过Web浏览器对相关系统和服务实行应变式管理和控制,从而保证网络和计算机应用系统上的资源处于最佳运营状态,并保持网络和计算机应用系统的可用性和可靠性。

Description

分布式应用系统监控管理方法
技术领域
本发明涉及分布式应用监控管理技术领域,具体涉及一种分布式应用系统监控管理方法。
背景技术
CA系统是一个复杂的分布式应用部署,对于企业来说,一个标准的应用管理机制用来更好的管理和监控应用的需求非常迫切。需要一种基于标准的实现手段来管理应用系统,进而管理各式各样的企业应用就成为管理领域内的现实需求。
发明内容
本发明克服了现有技术的不足,提供一种分布式应用系统监控管理方法。
为解决上述的技术问题,本发明采用以下技术方案:
一种分布式应用系统监控管理方法,采用ActiveMQ作为消息处理服务器,监控系统间以消息的方式进行数据传递;所述消息分为三类:监控类消息、系统消息和带宽消息;包括以下步骤:
步骤1,被监控应用程序发送ObjectMessage到ActiveMQ的队列中;由ActiveMQ维护队列:logQueue、systemQueue和bandwidthQueue;监控类消息的收发通过logQueue,系统类消息的收发通过systemQueue,带宽类消息的收发通过bandwidthQueue;
步骤2,通过消息监听器监听队列消息,接收到消息后直接存储消息到数据库中;
步骤3,当某个应用运行不正常,电脑发出报警声音并自动向告警联系人发送邮件提醒;
步骤4,界面实时呈现各应用及应用监控类的状态、日志信息、CPU、内存、磁盘、带宽的负载情况。
更进一步的技术方案是所述的监控类消息是指各应用的监控子项。
更进一步的技术方案是每个监控子项有四种日志级别:正常、警告、错误以及普通消息。
更进一步的技术方案是所述的系统消息是指服务器系统以及各子应用的CPU、内存以及磁盘使用情况。
更进一步的技术方案是所述的带宽消息是指服务器系统以及各子应用的带宽使用情况。
与现有技术相比,本发明实施例的有益效果之一是:本发明基于Apache ActiveMQ技术对分布式应用系统进行监控的体系架构提供一套系统管理解决方案,从而保证计算机应用系统平稳运行,并为系统维护和升级提供可视化依据。它针对分布式IP网络进行有效资源管理,采用B/S结构,使用户可以从任何地方通过Web浏览器对相关系统和服务实行应变式管理和控制,从而保证网络和计算机应用系统上的资源处于最佳运营状态,并保持网络和计算机应用系统的可用性和可靠性。它以一种直观的图形格式提供准确连接视图,有助于计算机系统管理员评价网络性能,抢在网络和计算机应用系统故障之前采取措施。
附图说明
图1为本发明一个实施例的方法流程示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
下面结合附图及实施例对本发明的具体实施方式进行详细描述。
在下面的详细描述中,出于解释的目的描述了许多具体描述以便能够彻底理解所公开的实施方案,然而,很明显一个或多个实施方式可以在不使用这些具体描述的情况下实施,在其他实例中,示意性地显示已知结构和装置,以便简化附图。
根据本发明的一个实施例,本实施例公开一种分布式应用系统监控管理方法,从而保证计算机应用系统平稳运行,并为系统维护和升级提供可视化依据。它针对分布式IP网络进行有效资源管理,采用B/S结构,使用户可以从任何地方通过Web浏览器对相关系统和服务实行应变式管理和控制,从而保证网络和计算机应用系统上的资源处于最佳运营状态,并保持网络和计算机应用系统的可用性和可靠性。它以一种直观的图形格式提供准确连接视图,有助于计算机系统管理员评价网络性能,抢在网络和计算机应用系统故障之前采取措施。
具体的,本实施例分布式应用系统监控管理方法,采用ActiveMQ作为消息处理服务器,ActiveMQ是Apache出品,最流行的,能力强劲的开源消息总线。
ActiveMQ有如下特性:
1.多种语言和协议编写客户端。语言:Java,C,C++,C#,Ruby,Perl,Python,PHP。应用协议:OpenWire,Stomp REST,WS Notification,XMPP,AMQP;
2.不用开发人员因并发消息而维护多线程,也不需要维护各应用之间的连接;
3.自动重连功能,断线重连机制是ActiveMQ的高可用性具体体现之一。使用failover方式,使得连接断开之后,可以不断的重试连接到一个或多个brokerURL;
4.封装简单。对ActiveMQ的封装是很轻松的事情,对于系统集成管理来说,降低了很大的成本;
5.支持消息持久化。
本实施例分布式应用系统监控管理方法,在监控系统间以消息的方式进行数据传递。发送的消息分为三类:监控类消息、系统消息、带宽消息。
监控类消息:指各应用的监控子项,比如Notification Manager应用的network;Control Service应用的ETCD;SMSG应用的database,memorycahe。每个监控子项有四种日志级别:1:正常2:警告3:错误4:普通消息。
系统消息:服务器系统以及各子应用的CPU、内存、磁盘使用情况。
带宽消息:服务器系统以及各子应用的带宽使用情况。
如图1所示,具体流程如下:
1.被监控应用程序发送ObjectMessage到ActiveMQ的队列中。由ActiveMQ维护队列:logQueue、systemQueue和bandwidthQueue。监控类消息的收发通过“logQueue”,系统类消息的收发通过“systemQueue”,带宽类消息的收发通过“bandwidthQueue”。
2.监控程序,通过消息监听器监听队列消息,接收到消息后直接存储消息到数据库中。
3.告警通知,当某个应用运行不正常,电脑发出报警声音并自动向告警联系人发送邮件提醒。
4.界面实时呈现各应用及应用监控类的状态、日志信息、CPU、内存、磁盘、带宽的负载情况。
本实施例分布式应用系统监控管理方法所采用的分布式应用监控系统的管理系统的UI界面,相比其他工控后台设计风格的刚硬来讲,这款设计更加的柔和,以蓝白灰为主色调,界面风格扁平化,简洁沉稳。色彩和形状的对比丰富画面,线描和扁平化icon的设计,让整个设计脱离了“工业”的束缚,彰显现代与活力。界面开发工具使用ZEPLIN。CMS的每个页面都由美工进行专门设计,由产品经理负责对页面进行审核,最后美工将设计好的页面上传到ZEPLIN上,并将页面所需的图片素材提供给开发人员。开发人员通过ZEPLIN从页面中提取CSS样式。
典型页面列举:
1.登录页面
此页面以蓝色作为背景色调,上边部分为公司LOGO和官网链接。下边部分为版权信息。左边部分为自行设计的隐含本系统概念的图片,右边部分为登录框。如果勾选了记住密码,下次登录时,页面会记住登录用户名和密码,便于快速登录。
2.系统主页
主页的上边部分为一级导航菜单栏,以蓝色为背景颜色,导航以ICON+标题横向排列方式。点击一级菜单后,左边显示对应的子菜单项。点击右上方的管理员名字,在管理员名字的下方弹出管理菜单。左边部分为二级或三级导航菜单,当光标移动到菜单上或选中菜单时会显示不同的背景颜色。中间部分为页面主体部分,用于显示各菜单页面。主体部分支持同时显示多个页面,点击TAB标签头进行页面的切换。
3.系统监控界面
包括实时查看应用的运行状态,监控子项的查看,监控日志查看,系统运行时长查看。
1.1)应用的运行状态查看
通过系统监控界面,可查看系统的应用架构。可查看各子应用的运行状态。采用四种颜色以示区分。灰色:子应用未启用时;绿色:子应用正常;橙色:警告;红色:发生错误。
1.2)监控子项的查看
光标移动到某个子应用的图标上时,显示操控菜单,选择"监控类型",弹出监控类型的查看对话框。采用三种颜色以示区分。绿色:监控类型正常;橙色:监控类型产生警告;红色:监控类型发生错误。
1.3)监控日志的查看
从页面上可实时查看各子应用最近的两条日志记录。也可手动点击“监控类型”查看监控类型的日志记录。
1.4)系统运行时长查看
4.系统状态
通过环状图查看当前系统和各子应用的CPU使用率、内存使用率。通过折线图按分钟、小时、天查看CPU、内存使用的走势图。以此监控系统的负载情况。当环状图占比50%以下为绿色,51%~80%为橙色,81%以上为红色。
5.带宽状态
通过折线图显示四种优先级别最近24小时的带宽使用情况。四种级别为:实时优先级、高优先级、普通优先级、低优先级。通过饼状图查看四种优先级别最近24小时的平均使用占比。
左边为折线图,右上方为各优先级别的带宽使用占比数据表格,右下方为使用带宽的饼状图。
6.基础配置页面
上边部分为配置项,中间为操作按钮,下边部分为发送包信息列表。当保存后在下边的发送包信息列表中显示操作的记录。
在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”等,指的是结合该实施例描述的具体特征、结构或者特点包括在本申请概括性描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说,结合任一个实施例描述一个具体特征、结构或者特点时,所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发明的范围内。
尽管这里参照发明的多个解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在本申请公开权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变型和改进外,对于本领域技术人员来说,其他的用途也将是明显的。

Claims (5)

1.一种分布式应用系统监控管理方法,其特征在于:采用ActiveMQ作为消息处理服务器,监控系统间以消息的方式进行数据传递;所述消息分为三类:监控类消息、系统消息和带宽消息;包括以下步骤:
步骤1,被监控应用程序发送ObjectMessage到ActiveMQ的队列中;由ActiveMQ维护队列:logQueue、systemQueue和bandwidthQueue;监控类消息的收发通过logQueue,系统类消息的收发通过systemQueue,带宽类消息的收发通过bandwidthQueue;
步骤2,通过消息监听器监听队列消息,接收到消息后直接存储消息到数据库中;
步骤3,当某个应用运行不正常,电脑发出报警声音并自动向告警联系人发送邮件提醒;
步骤4,界面实时呈现各应用及应用监控类的状态、日志信息、CPU、内存、磁盘、带宽的负载情况。
2.根据权利要求1所述的分布式应用系统监控管理方法,其特征在于所述的监控类消息是指各应用的监控子项。
3.根据权利要求2所述的分布式应用系统监控管理方法,其特征在于每个监控子项有四种日志级别:正常、警告、错误以及普通消息。
4.根据权利要求1所述的分布式应用系统监控管理方法,其特征在于所述的系统消息是指服务器系统以及各子应用的CPU、内存以及磁盘使用情况。
5.根据权利要求1所述的分布式应用系统监控管理方法,其特征在于所述的带宽消息是指服务器系统以及各子应用的带宽使用情况。
CN201710546711.2A 2017-07-06 2017-07-06 分布式应用系统监控管理方法 Pending CN107291595A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710546711.2A CN107291595A (zh) 2017-07-06 2017-07-06 分布式应用系统监控管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710546711.2A CN107291595A (zh) 2017-07-06 2017-07-06 分布式应用系统监控管理方法

Publications (1)

Publication Number Publication Date
CN107291595A true CN107291595A (zh) 2017-10-24

Family

ID=60100448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710546711.2A Pending CN107291595A (zh) 2017-07-06 2017-07-06 分布式应用系统监控管理方法

Country Status (1)

Country Link
CN (1) CN107291595A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086189A (zh) * 2018-07-23 2018-12-25 郑州云海信息技术有限公司 一种物理基础设施管理器pim告警处理方法及设备
CN114070712A (zh) * 2021-07-14 2022-02-18 北京天元创新科技有限公司 消息不落地的网管告警处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104009883A (zh) * 2014-05-09 2014-08-27 烽火通信科技股份有限公司 计算机资源集中式远程实时监控的系统及方法
CN104731580A (zh) * 2015-01-12 2015-06-24 上海新炬网络信息技术有限公司 基于Karaf与ActiveMQ的自动化运维系统及其实现方法
CN105208098A (zh) * 2015-08-24 2015-12-30 用友网络科技股份有限公司 云监控系统的实现装置和方法
CN105323111A (zh) * 2015-11-17 2016-02-10 南京南瑞集团公司 一种运维自动化系统及方法
US9396031B2 (en) * 2013-09-27 2016-07-19 International Business Machines Corporation Distributed UIMA cluster computing (DUCC) facility
CN105933175A (zh) * 2016-07-14 2016-09-07 微额速达(上海)金融信息服务有限公司 实时监控预警系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396031B2 (en) * 2013-09-27 2016-07-19 International Business Machines Corporation Distributed UIMA cluster computing (DUCC) facility
CN104009883A (zh) * 2014-05-09 2014-08-27 烽火通信科技股份有限公司 计算机资源集中式远程实时监控的系统及方法
CN104731580A (zh) * 2015-01-12 2015-06-24 上海新炬网络信息技术有限公司 基于Karaf与ActiveMQ的自动化运维系统及其实现方法
CN105208098A (zh) * 2015-08-24 2015-12-30 用友网络科技股份有限公司 云监控系统的实现装置和方法
CN105323111A (zh) * 2015-11-17 2016-02-10 南京南瑞集团公司 一种运维自动化系统及方法
CN105933175A (zh) * 2016-07-14 2016-09-07 微额速达(上海)金融信息服务有限公司 实时监控预警系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086189A (zh) * 2018-07-23 2018-12-25 郑州云海信息技术有限公司 一种物理基础设施管理器pim告警处理方法及设备
CN114070712A (zh) * 2021-07-14 2022-02-18 北京天元创新科技有限公司 消息不落地的网管告警处理方法及装置
CN114070712B (zh) * 2021-07-14 2024-05-24 北京天元创新科技有限公司 消息不落地的网管告警处理方法及装置

Similar Documents

Publication Publication Date Title
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
US11627053B2 (en) Continuous data sensing of functional states of networked computing devices to determine efficiency metrics for servicing electronic messages asynchronously
US20200250024A1 (en) High-volume distributed script error handling
US20230039566A1 (en) Automated system and method for detection and remediation of anomalies in robotic process automation environment
US7680918B2 (en) Monitoring and management of assets, applications, and services using aggregated event and performance data thereof
CN109492952B (zh) 审核数据处理方法、装置、电子设备及存储介质
Ligus Effective monitoring and alerting
US7685475B2 (en) System and method for providing performance statistics for application components
US20070150581A1 (en) System and method for monitoring system performance levels across a network
US8694625B2 (en) Selective registration for remote event notifications in processing node clusters
US20090313562A1 (en) Outage management portal leveraging back-end resources to create a role and user tailored front-end interface for coordinating outage responses
US11297023B2 (en) Distributed messaging aggregation and response
US20090164289A1 (en) Call center schedule compliance management
US20100250310A1 (en) Monitoring organizational information for fast decision making
CN110995532A (zh) 用于资源位的数据处理方法及系统、服务器
CN107291595A (zh) 分布式应用系统监控管理方法
CN110648105B (zh) 基于数据处理的推荐方法、装置、电子设备及存储介质
CN103442212A (zh) 网络安防综合预警式管理系统平台
WO2012029289A1 (ja) 表示処理システム、表示処理方法、およびプログラム
CN103414717A (zh) 一种关于c/s结构业务系统的仿真监控方法和系统
US8424019B1 (en) Managing channel instances in a messaging-middleware environment
US8424002B2 (en) Method, system and program of outputting information
Kuziemsky et al. A systems model of HIT-induced complexity
CN111538773A (zh) 一种基于多级管理结构的涉核设施数据管理系统
US20130046572A1 (en) Computer-Implemented Method for Auditing Media Content

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Wen Yi

Inventor after: Bai Huisheng

Inventor after: Yang Lei

Inventor after: Wu Jianjun

Inventor before: Xu Jianbing

Inventor before: Bai Huisheng

Inventor before: Yang Lei

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171024