CN104678868B - 一种业务及设备运维监控系统 - Google Patents

一种业务及设备运维监控系统 Download PDF

Info

Publication number
CN104678868B
CN104678868B CN201510036868.1A CN201510036868A CN104678868B CN 104678868 B CN104678868 B CN 104678868B CN 201510036868 A CN201510036868 A CN 201510036868A CN 104678868 B CN104678868 B CN 104678868B
Authority
CN
China
Prior art keywords
monitoring
parameter
monitored
platform
monitoring device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510036868.1A
Other languages
English (en)
Other versions
CN104678868A (zh
Inventor
贾新勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510036868.1A priority Critical patent/CN104678868B/zh
Publication of CN104678868A publication Critical patent/CN104678868A/zh
Application granted granted Critical
Publication of CN104678868B publication Critical patent/CN104678868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Alarm Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出了一种业务及设备运维监控系统,包括:监控设备用于对被监控对象的通信参数和监控参数进行配置,根据监控参数对交互信息进行分析以判断被监控对象是否出现异常,如果出现异常则发出异常通知;服务平台用于在接收到来自监控设备的交互信息和异常通知后,判断监控设备是否为单机工作模式,如果否,则判断监控设备为联网工作模式,服务平台以预设异常通知方式向消息通知平台推送异常通知;消息通知平台用于与服务平台进行通信,发出异常通知以提醒用户。本发明可以由监控设备直接与被监控对象进行信息交互,实现任何时间任何地点的监控服务,及时掌握被监控对象的运行状态,从而及时的了解和反馈业务系统的运行情况。

Description

一种业务及设备运维监控系统
技术领域
本发明涉及系统监控技术领域,特别涉及一种业务及设备运维监控系统。
背景技术
目前市场上的监控软件系统或者设备都是针对运行业务的服务器、网络设备进行系统级的监控,包括服务器上操作系统(Window、Linux、AIX、Solaris等)及其典型专业软件(数据库、应用服务器等)、网络设备(路由器、防火墙、交换机等)的资源监控。具体包括对CPU、内存、存储容量、网络路由,网络流量、磁盘阵列、进程、数据库、应用服务器、邮件服务器等的监控,主要是系统级的全局监控。但是,真正的业务系统是运行在这些服务器或者设备上,目前仅能通过对系统级的监控情况来间接反馈目前业务系统的运行情况,现实中业务系统的问题出现都是慢慢积累形成的,等到要出现故障的时候已经需要花一定的时间或者代价才能恢复。
此外,目前中小企业的系统运维的现状基本都是内部加外包实现,本来技术人员并不充裕,系统也没有上一定规模,所以在设计系统的时候,对该业务系统的相关监控相对比较薄弱,基本都是靠人工进行维护和处理,这样加大了企业的运营成本和人力成本,也不能实时有效的进行系统的运行情况掌控。
特别是长假对于运营的中小企业是个头疼的问题,尤其是运维值班的问题上尤为突出。具体中小企业在运维上存在一下现状:
(1)人员较少,排班问题受阻;
(2)如果是假期,值班人员的值班质量大打折扣;
(3)系统一旦出问题,及时修复可能受阻(由于技术外包或者兼职等因素);
(4)业务监护方式比较单一,监护能力比较薄弱;
(5)系统维护人员较少,维护能力低下,责任心不强;
(6)维护方式比较单一,以人工监护居多,人力成本较大,企业支出性价比不高;
(7)系统属于外包开发或者购买方式获取,技术支撑实力较弱;
(8)系统技术维护外包或者个人兼职等方式进行,维护质量难以评定。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的目的在于提出一种业务及设备运维监控系统,该系统可以对各类被监控对象进行直接交互和标准化监控。
为了实现上述目的,本发明的实施例提供一种业务及设备运维监控系统,包括:监控设备、服务平台和消息通知平台,其中,所述监控设备用于对被监控对象的通信参数和监控参数进行配置,其中,所述通信参数包括:IP地址、通信协议、端口、通信周期、交互内容、交互数据规则;所述监控参数包括:匹配规则、用户的联系方式、异常通知方式、业务优先级,其中,所述匹配规则包括关键字、监控内容和信息格式;
所述监控设备根据所述通信参数与所述被监控对象进行通信交互以启动对所述被监控对象的监控,获取对应的交互信息,以及根据所述监控参数对所述交互信息进行分析以判断所述被监控对象是否出现异常,如果出现异常,则发出异常通知,所述监控设备在向所述服务平台发出异常通知的同时,进一步根据所述监控参数中的用户的联系方式向对应的终端设备发出所述异常通知,所述监控设备向所述终端设备发出的异常通知为语音信息或短信信息,其中,所述被监控对象包括:操作系统、业务平台、通讯端口、网站应用、服务应用、存储设备和工业设备;针对不同类型的被监控对象的监控内容如下:
(1)端口类监控:被监控端口的通讯是否正常、端口的并发数量/阈值、端口发送接收的逻辑及内容是否正常;
(2)网站类监控:被监控网站是否能够打开、网站内容是否被篡改、网站的响应时间;
(3)服务类监控:被监控服务是否工作、交互的信息是否正确、服务的响应时间;
(4)存储类监控:被监控存储的工作模式、设备状态、存储容量、剩余容量、阈值、响应速度;
(5)设备类监控:被监控设备的参数指标及业务参数指标,串口/总线包括能否打开、交互是否及时和正确,开关量判断开路或者闭路,模拟量为取值及其范围;
(5.1)对于工业和工控类设备:被监控设备的串口/工业总线/网络;
(5.2)对于门禁、阀门、电路类设备:被监控设备的开关量;
(5.3)对于电压、电流的计量类设备:被监控设备的模拟量;
所述监控设备还用于通过以下两种方式对所述被监控对象的异常进行处理:
(1)所述服务平台还用于接收由用户通过终端设备发出的异常处理指令,并将异常处理指令转发至所述监控设备,由所述监控设备根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题;
(2)所述监控设备还用于内置异常处理指令,在判断所述被监控对象出现异常时,根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题;
其中,上述两种异常处理方式为互补且不冲突的;
并且,所述监控设备的参数配置流程,包括如下步骤:
步骤S101,检查监控参数;
步骤S102,判断监控参数是否已设置,如果是,则执行步骤S103,否则执行步骤S104;
步骤S103,判断监控参数是否已经更新,如果是,则执行步骤S105,否则执行步骤S106;
步骤S104,设置监控参数,然后执行步骤S105;
步骤S105,装载监控参数;
步骤S106,定时休眠;
步骤S107,判断是否为单机工作模式,如果是,则返回步骤S106,否则判断为联网工作模式,执行步骤S108;
步骤S108,向服务平台上传预置的平台参数;
步骤S109,更新服务平台的平台参数;
步骤S110,用户通过终端设备的APP/WEB应用设置服务平台的平台参数以及被监控对象的设备参数;用户可以在收到服务平台的异常通知后,获知被监控对象的异常情形,然后做出对应的异常处理指令,其中异常处理指令中包括用以调整被监控对象执行动作的设备参数,以解决异常问题;
步骤S111,判断是否设置被监控对象的设备参数,如果是,则执行步骤S113,否则执行步骤S112;
步骤S112,定时休眠;
步骤S113,下发设备参数:监控设备向各个被监控对象下发设备参数,用以调整各个被监控对象的执行动作,解决异常问题;
步骤S114,更新被监控对象的设备参数;
所述服务平台用于在接收到来自所述监控设备的交互信息和异常通知后,判断所述监控设备是否为单机工作模式,如果否,则判断所述监控设备为联网工作模式,所述服务平台与所述监控设备进行通信交互,并在进一步判断所述服务平台为通用平台后,以预设异常通知方式向所述消息通知平台推送异常通知,其中,所述服务平台包括通用平台和专属的第三方平台两种类型;所述消息通知平台用于与所述服务平台进行通信,发出所述异常通知以提醒用户。
在本发明的一个实施例中,所述监控设备对所述交互信息进行分析以判断所述被监控对象是否出现异常,包括:所述监控设备根据所述监控参数中的匹配规则对所述交互信息从语义、语法和内容进行比对和分析,形成分析结果,根据所述分析结果判断所述被监控对象是否出现异常。
在本发明的一个实施例中,所述服务平台还用于在判断为通用平台后,进行业务处理,对所述交互信息进行数据挖掘和分析。
在本发明的一个实施例中,所述匹配规则包括关键字、监控内容和信息格式。
在本发明的一个实施例中,所述服务平台对所述交互信息进行数据挖掘和分析,包括:对所述交互信息的数据进行抽取、清洗、转换、计算、分析和总结,形成所述被监控对象的异常发生条件、规律及舆情趋势报告。
在本发明的一个实施例中,所述监控设备还用于通过以下两种方式对所述被监控对象的异常进行处理:
(1)所述服务平台还用于接收由用户通过终端设备发出的异常处理指令,并将异常处理指令转发至所述监控设备,由所述监控设备根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题;
(2)所述监控设备还用于内置异常处理指令,在判断所述被监控对象出现异常时,根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题。
根据本发明实施例的业务及设备运维监控系统,可以由监控设备直接与被监控对象进行信息交互,实现对被监控对象的标准化监控服务,实现任何时间任何地点的监控服务,及时掌握被监控对象的运行状态,从而及时了解和反馈业务系统的运行情况。此外,本发明可以减少维护人员的开支,又能及时掌控被监控对象的情况,及时反馈系统的运行状态,能够及时方便的进行调整和处理,满足和稳定企业的日常经营和服务,减轻了值班人员的压力。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的业务及设备运维监控系统的结构框图;
图2为根据本发明实施例的业务及设备运维监控系统的示意图;
图3为根据本发明实施例的监控设备的配置流程图;
图4为根据本发明实施例的业务及设备运维监控系统的监控流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明提供一种业务及设备运维监控系统,可以实现对程序、业务和端口等的监控交互和服务通知。
如图1和图2所示,本发明实施例的业务及设备运维监控系统,包括:监控设备1、服务平台2和消息通知平台3。
具体地,监控设备1用于通过配置解密对被监控对象4的通信参数和监控参数进行配置。其中,通信参数包括:IP地址、通信协议、端口、通信周期、交互内容、交互数据规则。其中,交互数据规则包括语义、格式、编码、匹配方式。
然后,监控设备1根据通信参数周期性的与被监控对象4进行通信和数据交互。其中,监控设备1和被监控对象4可以是本地或者异地进行通讯。其中,通讯方式包括网络、蓝牙、串口、工业总线、模拟量、开关量等。
监控设备1启动对被监控对象4的监控,获取对应的交互信息,根据监控参数对交互信息进行分析,判断被监控对象4是否出现异常。如果出现,则监控设备1发出异常通知。
监控设备1根据监控参数中的匹配规则对交互信息从语义、语法和内容等几个方面进行比对和分析,形成分析结果。然后,根据系统设定的流程进行信息通知并记录。具体地,根据上述分析结果判断被监控对象4是否出现异常。如果出现,则监控设备1向用户的终端设备和服务平台2均发出异常通知。在本发明的一个实施例中,监控设备1根据监控参数中的用户的联系方式向对应终端设备发出的异常通知。其中,异常通知的形式可以为语音信息或文本短信信息。
监控设备1还用于通过以下两种方式对被监控对象4的异常进行处理:
(1)服务平台2还用于接收由用户通过终端设备发出的异常处理指令,并将异常处理指令转发至监控设备1,由监控设备1根据异常处理指令控制对应的被监控对象4执行异常处理动作,以消除异常问题。
(2)监控设备1还用于内置异常处理指令,在判断被监控对象4出现异常时,根据异常处理指令控制对应的被监控对象4执行异常处理动作,以消除异常问题。其中,异常处理指令可以存储于预先配置的监控参数中。
例如,以被监控对象4为空调为例进行说明。当监控设备1判断空调出现无法关闭的异常时,自动调用预存的异常处理指令控制空调,其中异常处理指令可以为强制关闭等,从而根据空调的具体异常状况进行处理,排除异常。当监控设备1判断空调出现制冷温度异常时,会向服务平台2发出异常通知。服务平台2将该异常通知进一步通知给用户,用户利用终端设备上的APP/WEB发出异常处理指令。其中,异常处理指令可以为设置温度为20~22摄氏度。服务平台2接收到用户的异常处理指令,进一步转发给监控设备1,由监控设备1控制空调执行动作,调整制冷温度至20~22摄氏度,从而解除异常。
需要说明的是,上述两种异常处理方式可以理解为互补且不冲突的。例如,监控设备1内置的异常处理指令可以包括开启、关闭、休眠等简单控制指令。而对于温度调节等具体的控制,可以由用户通过APP/WEB等进行调整,达到排除异常的目的。
下面结合图3对监控设备1的参数配置流程进行说明。
步骤S101,检查监控参数。
步骤S102,判断监控参数是否已设置,如果是,则执行步骤S103,否则执行步骤S104。
其中,监控参数包括:匹配规则、用户的联系方式、异常通知方式、业务优先级、异常处理指令等。具体来说,由于每个用户的匹配规则是千变万化和个性的,但是也有一定的通用描述格式,例如通过文字、数字,正则表达式,数值或者指令等。其中,匹配规则可以包括关键字、监控内容和信息格式。
步骤S103,判断监控参数是否已经更新,如果是,则执行步骤S105,否则执行步骤S106。
步骤S104,设置监控参数,然后执行步骤S105。
步骤S105,装载监控参数。
步骤S106,定时休眠。
步骤S107,判断是否为单机工作模式,如果是,则返回步骤S106,,否则判断为联网工作模式,执行步骤S108。
步骤S108,向服务平台上传预置的平台参数。
步骤S109,更新服务平台的平台参数。
步骤S110,用户通过终端设备的APP/WEB应用设置服务平台的平台参数以及被监控对象的设备参数。
具体地,用户可以在收到服务平台的异常通知后,获知被监控对象的异常情形,然后做出对应的异常处理指令,其中异常处理指令中包括用以调整被监控对象执行动作的设备参数,以解决异常问题。
步骤S111,判断是否设置被监控对象的设备参数,如果是,则执行步骤S113,否则执行步骤S112。
步骤S112,定时休眠。
步骤S113,下发设备参数。
具体地,监控设备1向各个被监控对象4下发设备参数,用以调整各个被监控对象的执行动作,从而解决异常问题。
步骤S114,更新被监控对象的设备参数。
在本发明的一个实施例中,被监控对象4包括:操作系统、业务平台、通讯端口、网站应用、服务应用、存储设备和工业设备。由于每个被监控对象4的使用场景、业务种类、方向、功能等不同,所以针对每个被监控对象4的内容和规则也就不同,例如:监控端口并发数、服务准确性、高电平有效,数值的区间范围,内容的正确性等。
下面就针对不同类型的被监控对象4的监控内容进行说明:
(1)端口类监控:被监控端口的通讯是否正常、端口的并发数量/阈值、端口发送接收的逻辑及内容是否正常;
(2)网站类监控:被监控网站是否能够打开、网站内容是否被篡改、网站的响应时间;
(3)服务类监控:被监控服务是否工作、交互的信息是否正确、服务的响应时间等;
(4)存储类监控:被监控存储的工作模式、设备状态、存储容量/剩余容量/阈值、响应速度等;
(5)设备类监控:被监控设备的参数指标(CPU、内存、磁盘、网络、进程等)及业务参数指标,串口/总线包括能否打开、交互是否及时和正确,开关量主要判断开路或者闭路,模拟量主要是取值及其范围等。
(5.1)对于工业和工控类设备:被监控设备的串口/工业总线/网络;
(5.2)对于门禁、阀门、电路类设备:被监控设备的开关量;
(5.3)对于电压、电流的计量类设备:被监控设备的模拟量;
下面以充值网关服务和具有特定温度要求的设备的监控过程进行说明。
充值网关服务:中间业务平台的充值网关是连接上下游客户的关键通道,下游客户的充值请求的接收和充值平台的对接,一旦充值网关发生异常,整体的充值业务会受到很大的影响。因此会在充值网关服务内部增加保护机制和规则,但是这些机制和规则很难及时传递到业务维护人员,都是维护人员通过网站、日志或者定期通讯进行探测,不具备实时性,一旦网关服务病态积累到一定程度,系统风险将会加大,甚至系统瘫痪的风险。
采用本发明监控设备1,首先配置完成通讯参数及,包括实现对通讯交互内容及交互数据规则的配置。例如:网络参数[114.112.112.114:8900,TCP,字符型,20秒],发送内容[max(代表并发数)],接收匹配规则[>2000]。监控设备1定期20秒交互一次,发送内容max,如果接收到1500,系统正常,如果接收到2001,超过匹配规则中的2000,则监控设备1按照预设的通知方式立即报警,设备继续监控,若有异常,继续报警,否则,静默工作。
具有特定温度要求的设备:某些产品(比如药品、肉类等)必须在一定的温度来存储,超过一定温度,产品可能损坏。目前采用温控设备进行温度调节和控制,存贮设备地点一般离市区或者工作区域较远,设备的存储空间一般都是密闭的(诸如仓库等),维护人员一般很难及时了解仓库的温度实时状态,只有定期去检查(这里排除带有网络模式的温度设备)。
采用本发明的监控设备1通过模拟接口对接温度设备,设定通讯模式(>10℃,30秒),设备定期30秒采集一次数据,如果接收到5℃,则判断温度设备正常;如果接收到11℃,高于10℃,则监控设备1按照预设的通知方式立即报警,设备继续监控,若有异常,继续报警,否则,静默工作。
由此,监控设备1将上述异常通知以及交互信息发送至服务平台2,服务平台2在接收到来自监控设备1的交互信息和异常通知后,判断监控设备1是否为单机工作模式。如果不是,则服务平台可以判断监控设备1为联网工作模式。
需要说明的是,用户可以预先对监控设备1的工作模式进行配置。即,用户可以根据需要预先配置监控设备1为单机工作模式或联网工作模式。
在联网工作模式下,监控设备1与服务平台2进行通信交互,并在进一步判断服务平台2为通用平台后,以预设异常通知方式向消息通知平台3推送异常通知。
需要说明的是,服务平台2包括通用平台和第三方平台两种类型。其中,对于不具备平台研发能力或资金紧张的企业,可以采用公共的通用平台。通用平台可以适用于多个不同用户,为多个用户提供服务,具备参数配置、数据浏览、数据统计、分析汇总及数据挖掘等功能。对于具备独立平台研发能力的企业,可以自己设计搭建专属的第三方平台,设备提供标准的通讯协议进行对接。第三方平台相对于通用平台可以实现个性化定制。
监控设备1可以设置不同的通知方式和服务,包括电话、短信、数据、APP、WEB及微信等,服务平台2提供随时浏览被监控对象4的实时交互情况。监控设备1对每次交互信息根据预设的匹配规则进行匹配。当发现有异常情况出现时,第一时间按照预设的通知号码进行语音/短信/文本等通知,并及时上报服务平台2。其中,服务平台2可以为监控公共服务平台(通用平台)或者用户自定义的服务平台(第三方平台)。服务平台2及时进行相应处置和管理,如用户配置了其它的通知方式或通知人,服务平台2将按照预先设定的通知方式(微信或者APP)向消息通知平台3进行相关通知。
消息通知平台3用于与服务平台2进行通信,发出异常通知以提醒用户。例如,可以通过微信服务平台和客户端展现方式(WEB方式、APP方式和微信方式),提醒用户被监控对象出现异常。
此外,被监控对象4一般都是长时间工作的,监控设备1经过一段时间的监控,可以积累该被监控对象4的日常状态数据。服务平台2在接收到来自监控设备1的上述监控数据后,可以对上述监控数据进行数据挖掘和分析。具体地,针对这些数据按照被监控对象的特性进行各种维度(时间维度、类型维度、规则维度、内容维度等)的统计和分析。例如:数据内容/格式异常、开路/断路、数据超界、服务超载等,包括数据抽取、清洗、转换、计算及分析和总结,形成针对单个被监控对象发生异常的特定条件、规律及舆情趋势的报告总结,为客户技术人员及维护人员进行分析和改造提供依据。
图4为根据本发明实施例的业务及设备运维监控系统的监控流程图。其中,步骤S201至步骤S207为单机工作流程,步骤S208至步骤S213为联网工作流程。
步骤S201,监控设备1设置被监控对象4的通信参数和监控参数,例如:通讯方式、通讯内容和通讯周期。步骤S202,监控设备1开始对被监控对象4进行监控。
监控设备1根据步骤S201中设置的通信参数,然后周期性的与被监控对象4进行通信和数据交互。其中,监控设备1和被监控对象4可以是本地或者异地进行通讯。其中,通讯方式包括网络、蓝牙、串口、工业总线、模拟量、开关量等。
步骤S203,监控设备1判断是否达到交互时间,如果是,则执行步骤S205,否则执行步骤S204。
其中,交互时间为预先设置,只有在到达交互时间后,再开启对被监控对象的监控,否则执行步骤S204,处于休眠状态,不进行监控。
步骤S204,休眠,返回步骤S202。
步骤S205,监控设备1与被监控对象4进行通讯交互,得到交互信息。
监控设备1在判断到达交互时间后,启动对被监控对象4的监控,获取对应的交互信息。
步骤S206,监控设备1对交互信息进行分析,判断是否异常,如果异常,则执行步骤S207。
根据监控参数对交互信息进行分析,根据监控参数中的匹配规则对交互信息从语义、语法和内容等几个方面进行比对和分析,形成分析结果。然后,根据系统设定的流程进行信息通知并记录。具体地,根据上述分析结果判断被监控对象4是否出现异常。
步骤S207,监控设备1向用户语音或短信通知异常情形。
如果出现,则监控设备1向用户的终端设备和服务平台2均发出异常通知。具体地,监控设备1根据监控参数中的用户的联系方式向对应终端设备发出的异常通知。其中,异常通知的形式可以为语音信息或短信信息。
并且,监控设备1内置有异常处理指令,在判断被监控对象4出现异常时,根据异常处理指令控制对应的被监控对象4执行异常处理动作,以消除异常问题。其中,异常处理指令可以存储于预先配置的监控参数中。
步骤S208,监控设备1判断是否为单机工作模式,如果是,则结束本次监控,否则执行步骤S209。
参考图3中的配置流程,监控设备1根据预先配置的参数判断其工作模式为单机工作模式或者联网工作模式。
(1)单机工作模式:监控设备1不与服务平台2进行通信交互,仅将异常通知发送给预存联系方式的终端设备。
(2)联网工作模式:监控设备1与服务平台2进行通信交互,将异常通知同时发送给预存联系方式的终端设备,以及服务平台2。
步骤S209,服务平台2与监控设备1进行交互,成功后执行步骤S210。
具体地,服务平台2接收来自监控设备1的异常通知以及交互信息。
步骤S210,监控设备1判断服务平台2是否为通用平台,如果是则执行步骤S211,否则结束。
需要说明的是,在监控设备1中预先设置有服务平台2是否为通用平台的参数,通过查询该参数即可获知服务平台2是否为通用平台。其中,通用平台可以适用于多个不同用户,为多个用户提供服务平台。步骤S211,业务处理,然后执行步骤S213。
服务平台2在判断为通用平台后,进行业务处理,对步骤S209接收到的交互信息进行数据挖掘和分析。步骤S212,服务平台2通过预设的APP、WEB或微信等方式向消息通知平台3通知被监控对象4的异常情形。
具体地,服务平台2将步骤S209中接收到的异常通知发送给消息通知平台3。由消息通知平台3通过微信服务平台和客户端展现方式(WEB方式、APP方式和微信方式),提醒用户被监控对象出现异常。
用户利用终端设备上的APP发出异常处理指令。服务平台2接收到用户的异常处理指令,进一步转发给监控设备1。由监控设备1控制被监控对象4根据上述异常处理指令执行相应的动作以解除异常。
步骤S213,数据挖掘及分析。
具体地,服务平台2对交互信息的数据进行抽取、清洗、转换、计算、分析和总结,形成被监控对象的异常发生条件、规律及舆情趋势报告。
根据本发明实施例的业务及设备运维监控系统,可以由监控设备直接与被监控对象进行信息交互,实现对被监控对象的标准化监控服务,实现任何时间任何地点的监控服务,及时掌握被监控对象的运行状态,从而及时的了解和反馈业务系统的运行情况。此外,本发明既可以减少维护人员的开支,又能及时掌控被监控对象的情况,并及时反馈系统的运行状态,能够及时方便的进行调整和处理,满足和稳定的企业的日常经营和服务,减少了值班人员的压力。
本发明在现有系统监控的基础上实现了业务和设备的监控、异常告警、挖掘分析、趋势预测等整个监控服务过程,为企业节约了人力成本、提高了异常判断的精准度和及时性。具体地,本发明可以实现以下几点:
(1)节约和减少了监控客户端设备和通知设备成本;
(2)实现了7x24小时的实时监控;
(3)实现本地和/或远程的监控服务;
(4)减少了维护值班人员的数量,减轻了维护人员的压力,缩短了维护人员处理故障的时间;
(5)提高业务异常判断的精度和时效,增强了运营维护的质量;
(6)采用监控设备的自动监控方式,节约了企业的人力和设备成本,提高了企业业务运行的质量:
(7)提供了兼具单机、联网、通知和异常反控处理的监控方式,提高了监控能力;
(8)为企业提供个性化且独立自主的监控方式,具有较强的技术支撑实力和维护质量。本发明的业务运维监控对各类被监控对象具有普适性,可以根据不同的被监控对象和用户需求对通信参数和监控参数进行调整,具有通用性,广泛适用于各类程序、操作平台、设备等被监控对象。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求极其等同限定。

Claims (4)

1.一种业务及设备运维监控系统,其特征在于,包括:监控设备、服务平台和消息通知平台,其中,
所述监控设备用于对被监控对象的通信参数和监控参数进行配置,其中,所述通信参数包括:IP地址、通信协议、端口、通信周期、交互内容、交互数据规则;所述监控参数包括:匹配规则、用户的联系方式、异常通知方式、业务优先级,其中,所述匹配规则包括关键字、监控内容和信息格式;
所述监控设备根据所述通信参数与所述被监控对象进行通信和数据交互以启动对所述被监控对象的监控,获取对应的交互信息,以及根据所述监控参数对所述交互信息进行分析以判断所述被监控对象是否出现异常,如果出现异常,则发出异常通知,所述监控设备在向所述服务平台发出异常通知的同时,进一步根据所述监控参数中的用户的联系方式向对应的终端设备发出所述异常通知,所述监控设备向所述终端设备发出的异常通知为语音信息或短信信息,其中,所述被监控对象包括:操作系统、业务平台、通讯端口、网站应用、服务应用、存储设备和工业设备;
针对不同类型的被监控对象的监控内容如下:
(1)端口类监控:被监控端口的通讯是否正常、端口的并发数量/阈值、端口发送接收的逻辑及内容是否正常;
(2)网站类监控:被监控网站是否能够打开、网站内容是否被篡改、网站的响应时间;
(3)服务类监控:被监控服务是否工作、交互的信息是否正确、服务的响应时间;
(4)存储类监控:被监控存储的工作模式、设备状态、存储容量、剩余容量、阈值、响应速度;
(5)设备类监控:被监控设备的参数指标及业务参数指标,串口/总线包括能否打开、交互是否及时和正确,开关量判断开路或者闭路,模拟量为取值及其范围;
(5.1)对于工业和工控类设备:被监控设备的串口/工业总线/网络;
(5.2)对于门禁、阀门、电路类设备:被监控设备的开关量;
(5.3)对于电压、电流的计量类设备:被监控设备的模拟量;
所述监控设备还用于通过以下两种方式对所述被监控对象的异常进行处理:
(1)所述服务平台还用于接收由用户通过终端设备发出的异常处理指令,并将异常处理指令转发至所述监控设备,由所述监控设备根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题;
(2)所述监控设备还用于内置异常处理指令,在判断所述被监控对象出现异常时,根据所述异常处理指令控制对应的被监控对象执行异常处理动作,以消除异常问题;
其中,上述两种异常处理方式为互补且不冲突的;
并且,所述监控设备的参数配置流程,包括如下步骤:
步骤S101,检查监控参数;
步骤S102,判断监控参数是否已设置,如果是,则执行步骤S103,否则执行步骤S104;
步骤S103,判断监控参数是否已经更新,如果是,则执行步骤S105,否则执行步骤S106;
步骤S104,设置监控参数,然后执行步骤S105;
步骤S105,装载监控参数;
步骤S106,定时休眠;
步骤S107,判断是否为单机工作模式,如果是,则返回步骤S106,否则判断为联网工作模式,执行步骤S108;
步骤S108,向服务平台上传预置的平台参数;
步骤S109,更新服务平台的平台参数;
步骤S110,用户通过终端设备的APP/WEB应用设置服务平台的平台参数以及被监控对象的设备参数;用户可以在收到服务平台的异常通知后,获知被监控对象的异常情形,然后做出对应的异常处理指令,其中异常处理指令中包括用以调整被监控对象执行动作的设备参数,以解决异常问题;
步骤S111,判断是否设置被监控对象的设备参数,如果是,则执行步骤S113,否则执行步骤S112;
步骤S112,定时休眠;
步骤S113,下发设备参数:监控设备向各个被监控对象下发设备参数,用以调整各个被监控对象的执行动作,解决异常问题;
步骤S114,更新被监控对象的设备参数;
所述服务平台用于在接收到来自所述监控设备的交互信息和异常通知后,判断所述监控设备是否为单机工作模式,如果否,则判断所述监控设备为联网工作模式,所述服务平台与所述监控设备进行通信交互,并在进一步判断所述服务平台为通用平台后,以预设异常通知方式向所述消息通知平台推送异常通知,其中,所述服务平台包括通用平台和专属的第三方平台两种类型;
所述消息通知平台用于与所述服务平台进行通信,发出所述异常通知以提醒用户。
2.如权利要求1所述的业务及设备运维监控系统,其特征在于,所述监控设备对所述交互信息进行分析以判断所述被监控对象是否出现异常,包括:
所述监控设备根据所述监控参数中的匹配规则对所述交互信息从语义、语法和内容进行比对和分析,形成分析结果,根据所述分析结果判断所述被监控对象是否出现异常。
3.如权利要求1所述的业务及设备运维监控系统,其特征在于,所述服务平台还用于在判断为通用平台后,进行业务处理,对所述交互信息进行数据挖掘和分析。
4.如权利要求3所述的业务及设备运维监控系统,其特征在于,所述服务平台对所述交互信息进行数据挖掘和分析,包括:对所述交互信息的数据进行抽取、清洗、转换、计算、分析和总结,形成所述被监控对象的异常发生条件、规律及舆情趋势报告。
CN201510036868.1A 2015-01-23 2015-01-23 一种业务及设备运维监控系统 Active CN104678868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510036868.1A CN104678868B (zh) 2015-01-23 2015-01-23 一种业务及设备运维监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510036868.1A CN104678868B (zh) 2015-01-23 2015-01-23 一种业务及设备运维监控系统

Publications (2)

Publication Number Publication Date
CN104678868A CN104678868A (zh) 2015-06-03
CN104678868B true CN104678868B (zh) 2017-11-10

Family

ID=53314107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510036868.1A Active CN104678868B (zh) 2015-01-23 2015-01-23 一种业务及设备运维监控系统

Country Status (1)

Country Link
CN (1) CN104678868B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547501A (zh) * 2015-09-18 2017-03-29 北京国双科技有限公司 信息的显示方法及装置
CN105893223A (zh) * 2016-04-29 2016-08-24 乐视控股(北京)有限公司 异常显示方法及装置
CN106409283B (zh) * 2016-08-31 2020-01-10 上海交通大学 基于音频的人机混合交互系统及方法
CN106789935B (zh) * 2016-11-29 2021-03-09 上海辰锐信息科技公司 一种终端异常检测方法
CN108234161A (zh) * 2016-12-14 2018-06-29 福建星网视易信息系统有限公司 用于线上线下多层网络架构的通路检测方法及系统
CN108182643A (zh) * 2017-12-29 2018-06-19 深圳春沐源控股有限公司 基于天气预测的种植推荐方法和装置
CN108923996B (zh) * 2018-05-11 2021-01-05 中国银联股份有限公司 一种容量分析方法及装置
CN110620799A (zh) * 2018-06-20 2019-12-27 深圳市从晶科技有限公司 一种数据处理方法和系统
CN111176868A (zh) * 2018-11-13 2020-05-19 北京嘀嘀无限科技发展有限公司 异常信息的监控方法、装置、设备和计算机可读存储介质
CN110348839A (zh) * 2019-05-31 2019-10-18 口碑(上海)信息技术有限公司 设备状态数据的监控处理方法、装置及系统
CN110311818A (zh) * 2019-06-29 2019-10-08 浪潮卓数大数据产业发展有限公司 一种基于netty的异常数据告警方法
CN110471824A (zh) * 2019-08-19 2019-11-19 中国工商银行股份有限公司 监控方法、装置、系统、电子设备和计算机可读存储介质
CN113064797B (zh) * 2021-04-22 2023-02-03 平安国际智慧城市科技股份有限公司 前端监控方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202218244U (zh) * 2011-08-10 2012-05-09 广东商学院 用于业务系统监控的it运维系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4557121B2 (ja) * 2001-09-04 2010-10-06 栗田工業株式会社 操作監視システム
CN1175351C (zh) * 2001-12-04 2004-11-10 上海复旦光华信息科技股份有限公司 Solaris进程自动保护系统
CN101047574A (zh) * 2007-05-08 2007-10-03 中国移动通信集团福建有限公司 工作流中流程工单的监控装置
CN101582811A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种建立网络监控和运维管理一体化的方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN102313333B (zh) * 2010-07-05 2014-12-24 珠海格力电器股份有限公司 空调异常信息提示方法及装置
CN102546771A (zh) * 2011-12-27 2012-07-04 西安博构电子信息科技有限公司 基于特征模型的云挖掘网络舆情监测系统
CN102930393A (zh) * 2012-10-25 2013-02-13 海南电网公司 一种电网信息综合展示可视化系统
CN103186134A (zh) * 2013-04-11 2013-07-03 南京御水科技有限公司 基于物联网的循环水智能监控系统
CN103268350B (zh) * 2013-05-29 2017-02-08 安徽雷越网络科技有限公司 一种互联网舆情信息监测系统及监测方法
CN104283967B (zh) * 2014-10-23 2018-07-13 武汉华大优能信息有限公司 一种基于物联网数据采集的第三方数据服务系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202218244U (zh) * 2011-08-10 2012-05-09 广东商学院 用于业务系统监控的it运维系统

Also Published As

Publication number Publication date
CN104678868A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
CN104678868B (zh) 一种业务及设备运维监控系统
JP5388337B2 (ja) 機器監視システム
CN105871605A (zh) 一种基于电力营销大数据的运维监控平台
CN109660380A (zh) 服务器运行状态的监控方法、平台、系统及可读存储介质
CN100388693C (zh) 根据服务水平协议对服务质量进行监测的方法和系统
Mori et al. Remote monitoring and maintenance system for CNC machine tools
US8825508B2 (en) Method and apparatus for automated staff assignment
CN101621816B (zh) 一种监控移动终端后台服务器的系统和方法
CN107483268A (zh) 一种告警处理方法及系统
US20100085182A1 (en) Method for processing alarm data to generate security reports
US9860906B2 (en) Method, computer-readable storage device and apparatus for processing machine-to-machine communications
CN107918366A (zh) 一种基于物联网的安全监控方法和系统
CN103440190A (zh) 设备故障报警方法,装置与cim系统
US20240223656A1 (en) Internet of things distribution system and method of implementing the same
CN102694671A (zh) 一种实现故障告警的方法及装置
CN108345527A (zh) 一种接口入参的分析监控方法及系统
CN106287225A (zh) 一种燃气在线监测预警系统及其检测控制方法
CN100581144C (zh) 邮件过滤系统和邮件过滤方法
CN112330934A (zh) 一种火警信息人工智能识别研判算法
CN107302456A (zh) 一种数据处理的方法及装置
CN104571057B (zh) 一种告警系统数据库的设计方法
CN102148692B (zh) 一种告警信息的二次过滤监控方法和系统
US20240071202A1 (en) Agricultural alarm system with geofence features
CN207748684U (zh) 一种基于物联网智能远程监控故障诊断管理系统
CN109474473A (zh) 一种面向感知数据监测预警的通用告警系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant