CN105847083A - 一种业务集中监控方法及系统 - Google Patents

一种业务集中监控方法及系统 Download PDF

Info

Publication number
CN105847083A
CN105847083A CN201610166670.XA CN201610166670A CN105847083A CN 105847083 A CN105847083 A CN 105847083A CN 201610166670 A CN201610166670 A CN 201610166670A CN 105847083 A CN105847083 A CN 105847083A
Authority
CN
China
Prior art keywords
service
data
business
monitoring
abnormality processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610166670.XA
Other languages
English (en)
Inventor
杨佳浩
鲍大磊
王孝庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Cloud Computing Co Ltd
Original Assignee
LeTV Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Cloud Computing Co Ltd filed Critical LeTV Cloud Computing Co Ltd
Priority to CN201610166670.XA priority Critical patent/CN105847083A/zh
Publication of CN105847083A publication Critical patent/CN105847083A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/062Generation of reports related to network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种业务集中监控方法及系统,所述方法包括:采集业务系统的业务相关数据;根据预设的数据清洗规则对业务相关数据进行清洗,生成预定格式的监控数据;分析监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与业务异常相匹配的异常处理流程并执行与异常处理流程相对应的操作。本发明的业务集中监控方法及系统,将业务系统的业务执行环节与监控重试反馈等环节进行解耦,能够独立地针对不同的业务异常情况进行监控并进行异常处理操作,并可以针对不同数据来源进行不同的异常处理规则配置,实现业务运行的稳定性并保证业务执行环节的成功率。

Description

一种业务集中监控方法及系统
技术领域
本发明涉及网络监控技术领域,特别涉及一种业务集中监控方法及系统。
背景技术
业务或生产系统,例如视频播放系统、电子商务系统等,除了能完成系统应有的业务功能之外,还需要有针对系统内部所有过程进行重试、监控、报警、反馈的环节。针对失败环节进行监控,超过阈值报警;对失败环节数据进行筛查展示反馈;针对不同的失败环节进行最大努力的重试,保证比较高的成功率。目前,在业务系统中进行有限不可调控的简单的重试,最终返回失败结果;针对现有环节进行简单监控报警,很难做到全面的、全流程的监控;重试模块融合在生产系统中,过多的重试可能会影响正常生产,重试不够,不能保证比较高的成功率,且不可控。而且生产与监控部分融合在一个系统中,耦合性太高,可扩展性差,不可复用。
发明内容
有鉴于此,本发明的目的在于提出一种业务集中监控方法及系统,实现针对不同的业务异常情况进行监控和异常处理操作。
基于上述目的本发明提供的一种业务集中监控方法,包括:采集业务系统的业务相关数据;根据预设的数据清洗规则对业务相关数据进行清洗,生成预定格式的监控数据;分析所述监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程并执行与所述异常处理流程相对应的操作。
根据本发明的一个实施例,进一步的,所述采集业务系统的业务相关数据包括:基于设置的监听IP地址和监听端口建立套接字Socket连接;对于所述Socket连接启动一个或多个监听线程,通过所述Socket连接接收所述业务系统发送的业务相关数据。
根据本发明的一个实施例,进一步的,所述采集业务系统的业务相关数据包括:监听设置的消息队列并从所述消息队列中获取所述业务相关数据;其中,所述消息队列用于存储所述业务系统发送的业务相关数据。
根据本发明的一个实施例,进一步的,所述采集业务系统的业务相关数据包括:从所述业务系统的业务数据库中提取所述业务相关数据。
根据本发明的一个实施例,进一步的,所述根据预设的数据清洗规则对所述业务相关数据进行清洗、生成预定格式的监控数据包括:配置数据清洗规则文件,所述数据清洗规则文件中至少包括一条数据清洗规则;遍历全部的数据清洗规则依次对所述业务相关数据进行筛选处理;将通过所述筛选处理的所述业务相关数据基于预定格式进行格式转换,生成所述监控数据;将所述监控数据存储在监控数据库中。
根据本发明的一个实施例,进一步的,所述分析所述监控数据、判断是否出现业务异常包括:从所述监控数据中提取业务状态信息,基于所述业务状态信息判断是否出现业务异常。
根据本发明的一个实施例,进一步的,所述根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程并执行与所述异常处理流程相对应的操作包括:当判断出现业务异常时,则从所述监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于所述业务节点信息和失败原因码统计此业务异常发生的次数;将所述业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,其中,所述执行的操作包括:重试、报警、反馈操作。
根据本发明的一个实施例,进一步的,所述确定异常处理流程和执行的操作包括:所述规则包括:报警次数阈值;当业务异常的次数超过所述报警次数阈值时,则向发送报警信息。
根据本发明的一个实施例,进一步的,所述确定异常处理流程和异常处理包括:所述规则包括:第一业务状态、重传原因码、重传次数阈值;当所述业务状态信息与所述业务状态匹配、所述失败原因码与所述重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,则调用业务系统提供的接口进行重试处理。
根据本发明的一个实施例,进一步的,所述确定异常处理流程和异常处理包括:所述规则包括:第二业务状态、反馈原因码;当所述业务状态信息与所述业务状态匹配、所述失败原因码与所述反馈原因码匹配时,则向设定的反馈接收人或业务系统发送反馈信息,其中,发送反馈信息的方式包括:邮件、短信。
根据本发明的一个实施例,进一步的,包括:通过配置管理界面配置异常处理规则引擎中的规则,并在所述配置管理界面上显示信息,包括:异常业务信息、报警信息、重试信息、反馈信息。
一种业务集中监控系统,包括:数据采集模块,用于采集业务系统的业务相关数据;数据清洗模块,用于根据预设的数据清洗规则对所述业务相关数据进行清洗,生成预定格式的监控数据;分析适配模块,用于分析所述监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程;执行操作单元,用于所述异常处理流程相对应的操作。
根据本发明的一个实施例,进一步的,所述数据采集模块,用于基于设置的监听IP地址和监听端口建立套接字Socket连接;对于所述Socket连接启动一个或多个监听线程,通过所述Socket连接接收所述业务系统发送的业务相关数据。
根据本发明的一个实施例,进一步的,所述数据采集模块,用于监听设置的消息队列并从所述消息队列中获取所述业务相关数据;其中,所述消息队列用于存储所述业务系统发送的业务相关数据。
根据本发明的一个实施例,进一步的,所述数据采集模块,用于从所述业务系统的业务数据库中提取所述业务相关数据。
根据本发明的一个实施例,进一步的,所述数据清洗模块,用于配置数据清洗规则文件,所述数据清洗规则文件中至少包括一条数据清洗规则;遍历全部的数据清洗规则依次对所述业务相关数据进行筛选处理;将通过所述筛选处理的所述业务相关数据基于预定格式进行格式转换,生成所述监控数据;将所述监控数据存储在监控数据库中。
根据本发明的一个实施例,进一步的,所述分析适配模块,用于从所述监控数据中提取业务状态信息,基于所述业务状态信息判断是否出现业务异常。
根据本发明的一个实施例,进一步的,所述分析适配模块,还用于当判断出现业务异常时,从所述监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于所述业务节点信息和失败原因码统计此业务异常发生的次数;将所述业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,其中,所述执行的操作包括:重试、报警、反馈操作。
根据本发明的一个实施例,进一步的,所述规则包括:报警次数阈值;当所述分析适配模块判断业务异常的次数超过所述报警次数阈值时,确定执行报警操作;所述执行操作单元包括:报警模块,用于发送报警信息。
根据本发明的一个实施例,进一步的,所述规则包括:第一业务状态、重传原因码、重传次数阈值;当所述分析适配模块判断所述业务状态信息与所述业务状态匹配、所述失败原因码与所述重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,确定执行重试操作;所述执行操作单元包括:重试模块,用于调用业务系统提供的接口进行重试处理。
根据本发明的一个实施例,进一步的,所述规则包括:第二业务状态、反馈原因码;当所述分析适配模块判断所述业务状态信息与所述业务状态匹配、所述失败原因码与所述反馈原因码匹配时,确定执行反馈操作;所述执行操作单元包括:反馈模块,用于向设定的反馈接收人或业务系统发送反馈信息,其中,发送反馈信息的方式包括:邮件、短信。
根据本发明的一个实施例,进一步的,配置管理模块,用于通过配置管理界面配置异常处理规则引擎中的规则,并在所述配置管理界面上显示信息,包括:异常业务信息、报警信息、重试信息、反馈信息。
本发明的业务集中监控方法及系统,将业务系统的业务执行环节与监控重试反馈等环节进行解耦,能够独立地针对不同的业务异常情况进行监控并进行异常处理操作,并可以针对不同数据来源进行不同的异常处理规则配置。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的业务集中监控方法的一个实施例的流程示意图;
图2为根据本发明的业务集中监控系统的一个实施例的模块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
图1为根据本发明的业务集中监控方法的一个实施例的流程示意图,如图1所示:
步骤101,采集业务系统的业务相关数据,可以采集多个业务系统的业务相关数据,例如,视频播放系统、电子商务系统等。
步骤102,根据预设的数据清洗规则对所述业务相关数据进行清洗,生成预定格式的监控数据。
步骤103,分析所述监控数据,判断是否出现业务异常。
步骤104,如果否,则不进行处理。如果是,则根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程并执行与所述异常处理流程相对应的操作,在操作执行后,将执行的信息存放在监控数据库中。
在一个实施例中,基于设置的监听IP地址和监听端口建立套接字Socket连接,对于所述Socket连接启动一个或多个监听线程,通过所述Socket连接接收所述业务系统发送的业务相关数据。
例如,在配置文件中配置了业务系统中执行业务的服务器的IP地址作为监听IP地址,监听IP地址也可以配置为执行监控功能的服务器的IP地址,在配置文件中可以配置监听端口,例如,监听端口可以为80端口。监听IP地址和监听端口可以为一对或多对。
基于监听IP地址和监听端口建立套接字Socket连接,例如,使用JAVA的socket类建立连接。对于Socket连接启动一个或多个监听线程,通过建立的Socket连接接收业务系统发送的业务相关数据,可以实现单线程接收或多线程接收业务相关数据。
可以监听设置的消息队列并从消息队列中获取业务相关数据;消息队列用于存储业务系统发送的业务相关数据。消息队列可以为多种消息队列,例如,配置JAVA消息队列服务JMS,业务系统中执行业务的服务器作为JMS的提供者,业务系统中执行业务的服务器向消息队列中发送业务相关数据,执行业务集中监控的服务器为JMS的消费者,从消息队列中接收消息。
从业务系统的业务数据库中提取业务相关数据,例如,间隔固定的时间周期从业务数据库中提取业务相关数据,在下一次提取数据时提取在间隔时间周期内的增量数据。上述采集业务相关数据的方法可以根据需要进行配置,使用其中的一种或多种,并可以通过去重的方法保证获取数据的唯一性。
在一个实施例中,业务相关数据为业务系统在执行多个业务环节时产生的信息,包括业务日志、运行状态、trace、异常信息、告警信息等等。可以根据预设的数据清洗规则对业务相关数据进行清洗,删除掉与监控关联不大的信息。
配置数据清洗规则文件,数据清洗规则文件中至少包括一条数据清洗规则。例如,设置的一条数据清洗规则为数据中必须有业务状态信息,即业务执行为成功或失败状态,业务为正常或异常状态。遍历全部的数据清洗规则依次对业务相关数据进行筛选处理,将通过筛选处理的业务相关数据基于预定格式进行格式转换,生成监控数据,将监控数据存储在监控数据库中。监控数据的格式可以根据具体的需要进行设置,能够存储在监控数据库中,监控数据库可以为oracle、mysql等数据库。
从监控数据中提取业务状态信息,基于业务状态信息判断是否出现业务异常。例如,业务状态信息为下载失败、转码失败等,则判断出现了业务异常。当判断出现业务异常时,则从监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于业务节点信息和失败原因码统计此业务异常发生的次数。
业务节点可以为执行业务的服务器的ID等,业务状态可以为上载文件、下载文件、转码等,失败原因码标识出现失败的原因,例如网络故障为0001,格式不匹配为0002等。可以从监控数据库中统计针对同一服务器的ID和失败原因码统计此业务异常发生的次数。
将业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,执行的操作包括:重试、报警、反馈等操作,重试、报警、反馈等操作可以进行随意组合完成不同的异常处理流程。
异常处理规则引擎可以是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
在多个规则配置好之后,只需要将相关的数据输入即可完成异常分析并制订异常处理的流程。可以从经过清洗后的数据中提取相关的数据输入到异常处理规则引擎,也可以从监控数据库中提取相关的数据输入异常处理规则引擎。
例如,异常处理规则引擎中的针对报警的规则包括:报警次数阈值。当业务异常的次数超过报警次数阈值时,则向发送报警信息。例如,报警次数阈值为一小时内某一节点上传失败数量为100,当异常处理规则引擎判断在一小时内此节点上传失败数量大于100时,则进行报警。
异常处理规则引擎中的针对重传的规则包括:第一业务状态、重传原因码、重传次数阈值等。当业务状态信息与业务状态匹配、失败原因码与重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,则调用业务系统提供的接口进行重试处理。
例如,针对重传的规则为:第一业务状态=40,重传原因码=1002010056,重传次数阈值=3。当异常处理规则引擎判断接收某一节点的业务状态信息为40,即下载失败;失败原因码=1002010056,从监控数据库中统计此节点已经进行的重传次数为3,则不进行重传,并执行反馈操作。
反馈是指将监控结果反馈给目标对象进行处理,目标对象可以是工作人员或其它系统。通过策略配置实现不同业务场景下的信息反馈,如由于片源不规范导致的转码失败视频,反馈给上传人员。
异常处理规则引擎中的针对反馈的规则包括:业务状态、反馈原因码。当业务状态信息与业务状态匹配、失败原因码与反馈原因码匹配时,则向设定的反馈接收人或业务系统发送反馈信息,发送反馈信息的方式包括:邮件、短信等。例如,当异常处理规则引擎判断某一节点的业务状态为40,下载失败,而失败原因码为1043010056,即片源不规范,则通过邮件将异常信息反馈给相关的业务人员。
可以通过配置管理界面配置异常处理规则引擎中的规则,并在配置管理界面上显示信息,包括:异常业务信息、报警信息、重试信息、反馈等信息。
上述实施例中的业务集中监控方法,将业务系统的业务执行环节与监控重试反馈等环节进行解耦,能够独立地针对不同的业务异常情况进行监控并进行异常处理操作,可以保证业务执行环节的成功率,并且不影响正常的业务执行环节,可实现反馈进行友好提醒,针对不同数据来源进行不同的异常处理规则配置,对突发异常做到快速反应,实现业务运行的稳定性。
在一个实施例中,本发明提供一种业务集中监控系统。如图2所示,数据采集模块21采集业务系统的业务相关数据。数据清洗模块22根据预设的数据清洗规则对业务相关数据进行清洗,生成预定格式的监控数据。分析适配模块23分析监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与业务异常相匹配的异常处理流程。执行操作单元24异常处理流程相对应的操作。
数据采集模块21可以基于设置的监听IP地址和监听端口建立套接字Socket连接。对于Socket连接启动一个或多个监听线程,通过Socket连接接收业务系统发送的业务相关数据。数据采集模块21可以监听设置的消息队列并从消息队列中获取业务相关数据;其中,消息队列用于存储业务系统发送的业务相关数据。数据采集模块21可以从业务系统的业务数据库中提取业务相关数据。
数据清洗模块22配置数据清洗规则文件,数据清洗规则文件中至少包括一条数据清洗规则,遍历全部的数据清洗规则依次对业务相关数据进行筛选处理。数据清洗模块22将通过筛选处理的业务相关数据基于预定格式进行格式转换,生成监控数据,将监控数据存储在监控数据库25中。
在一个实施例中,分析适配模块23从监控数据中提取业务状态信息,基于业务状态信息判断是否出现业务异常。当判断出现业务异常时,分析适配模块23从监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于业务节点信息和失败原因码统计此业务异常发生的次数。
分析适配模块23将业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,执行的操作包括:重试、报警、反馈等操作。
异常处理规则引擎中的规则包括:报警次数阈值。当分析适配模块23判断业务异常的次数超过报警次数阈值时,确定执行报警操作。执行操作单元24包括:报警模块241,报警模块241发送报警信息。
异常处理规则引擎中的规则包括:第一业务状态、重传原因码、重传次数阈值等。当分析适配模块23判断业务状态信息与第一业务状态匹配、失败原因码与重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,确定执行重试操作。执行操作单元24包括:重试模块242,重试模块242调用业务系统提供的接口进行重试处理。
异常处理规则引擎中的规则包括:第二业务状态、反馈原因码等;当分析适配模块23判断业务状态信息与第二业务状态匹配、失败原因码与反馈原因码匹配时,确定执行反馈操作。执行操作单元24包括:反馈模块243,反馈模块243向设定的反馈接收人或业务系统发送反馈信息,发送反馈信息的方式包括:邮件、短信等。
配置管理模块26通过配置管理界面27配置异常处理规则引擎中的规则,并在配置管理界面27上显示信息,包括:异常业务信息、报警信息、重试信息、反馈信息等。
上述实施例提供的业务集中监控方法及系统,将业务系统的业务执行环节与监控重试反馈等环节进行解耦,能够独立地针对不同的业务异常情况进行监控并进行异常处理操作,并可以针对不同数据来源进行不同的异常处理规则配置,实现业务运行的稳定性并保证业务执行环节的成功率。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种业务集中监控方法,其特征在于,包括:
采集业务系统的业务相关数据;
根据预设的数据清洗规则对所述业务相关数据进行清洗,生成预定格式的监控数据;
分析所述监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程并执行与所述异常处理流程相对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述采集业务系统的业务相关数据包括:
基于设置的监听IP地址和监听端口建立套接字Socket连接;
对于所述Socket连接启动一个或多个监听线程,通过所述Socket连接接收所述业务系统发送的业务相关数据。
3.根据权利要求1所述的方法,其特征在于,所述采集业务系统的业务相关数据包括:
监听设置的消息队列并从所述消息队列中获取所述业务相关数据;
其中,所述消息队列用于存储所述业务系统发送的业务相关数据。
4.根据权利要求1所述的方法,其特征在于,所述采集业务系统的业务相关数据包括:
从所述业务系统的业务数据库中提取所述业务相关数据。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的数据清洗规则对所述业务相关数据进行清洗、生成预定格式的监控数据包括:
配置数据清洗规则文件,所述数据清洗规则文件中至少包括一条数据清洗规则;
遍历全部的数据清洗规则依次对所述业务相关数据进行筛选处理;
将通过所述筛选处理的所述业务相关数据基于预定格式进行格式转换,生成所述监控数据;
将所述监控数据存储在监控数据库中。
6.根据权利要求5所述的方法,其特征在于,所述分析所述监控数据、判断是否出现业务异常包括:
从所述监控数据中提取业务状态信息,基于所述业务状态信息判断是否出现业务异常。
7.根据权利要求6所述的方法,其特征在于,所述根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程并执行与所述异常处理流程相对应的操作包括:
当判断出现业务异常时,则从所述监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于所述业务节点信息和失败原因码统计此业务异常发生的次数;
将所述业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,其中,所述执行的操作包括:重试、报警、反馈操作。
8.根据权利要求7所述的方法,其特征在于,所述确定异常处理流程和执行的操作包括:
所述规则包括:报警次数阈值;当业务异常的次数超过所述报警次数阈值时,则向发送报警信息。
9.根据权利要求8所述的方法,其特征在于,所述确定异常处理流程和异常处理包括:
所述规则包括:第一业务状态、重传原因码、重传次数阈值;当所述业务状态信息与所述第一业务状态匹配、所述失败原因码与所述重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,则调用业务系统提供的接口进行重试处理。
10.根据权利要求9所述的方法,其特征在于,所述确定异常处理流程和异常处理包括:
所述规则包括:第二业务状态、反馈原因码;
当所述业务状态信息与所述第二业务状态匹配、所述失败原因码与所述反馈原因码匹配时,则向设定的反馈接收人或业务系统发送反馈信息,其中,发送反馈信息的方式包括:邮件、短信。
11.根据权利要求10所述的方法,其特征在于,包括:
通过配置管理界面配置异常处理规则引擎中的规则,并在所述配置管理界面上显示信息,包括:异常业务信息、报警信息、重试信息、反馈信息。
12.一种业务集中监控系统,其特征在于,包括:
数据采集模块,用于采集业务系统的业务相关数据;
数据清洗模块,用于根据预设的数据清洗规则对所述业务相关数据进行清洗,生成预定格式的监控数据;
分析适配模块,用于分析所述监控数据,判断是否出现业务异常,如果是,则根据预设的异常处理策略确定与所述业务异常相匹配的异常处理流程;
执行操作单元,用于所述异常处理流程相对应的操作。
13.根据权利要求12所述的系统,其特征在于:
所述数据采集模块,用于基于设置的监听IP地址和监听端口建立套接字Socket连接;对于所述Socket连接启动一个或多个监听线程,通过所述Socket连接接收所述业务系统发送的业务相关数据。
14.根据权利要求12所述的系统,其特征在于:
所述数据采集模块,用于监听设置的消息队列并从所述消息队列中获取所述业务相关数据;其中,所述消息队列用于存储所述业务系统发送的业务相关数据。
15.根据权利要求12所述的系统,其特征在于:
所述数据采集模块,用于从所述业务系统的业务数据库中提取所述业务相关数据。
16.根据权利要求12所述的系统,其特征在于:
所述数据清洗模块,用于配置数据清洗规则文件,所述数据清洗规则文件中至少包括一条数据清洗规则;遍历全部的数据清洗规则依次对所述业务相关数据进行筛选处理;将通过所述筛选处理的所述业务相关数据基于预定格式进行格式转换,生成所述监控数据;将所述监控数据存储在监控数据库中。
17.根据权利要求16所述的系统,其特征在于:
所述分析适配模块,用于从所述监控数据中提取业务状态信息,基于所述业务状态信息判断是否出现业务异常。
18.根据权利要求17所述的系统,其特征在于:
所述分析适配模块,还用于当判断出现业务异常时,从所述监控数据中提取与此业务异常相关的业务节点信息和失败原因码,基于所述业务节点信息和失败原因码统计此业务异常发生的次数;将所述业务节点信息、业务状态信息、失败原因码以及业务异常发生的次数输入异常处理规则引擎进行规则匹配,确定异常处理流程和执行的操作,其中,所述执行的操作包括:重试、报警、反馈操作。
19.根据权利要求18所述的系统,其特征在于:
所述规则包括:报警次数阈值;
当所述分析适配模块判断业务异常的次数超过所述报警次数阈值时,确定执行报警操作;
所述执行操作单元包括:
报警模块,用于发送报警信息。
20.根据权利要求19所述的系统,其特征在于:
所述规则包括:第一业务状态、重传原因码、重传次数阈值;
当所述分析适配模块判断所述业务状态信息与所述第一业务状态匹配、所述失败原因码与所述重传原因码匹配并且出现此业务异常的次数未超过预设的重传次数阈值时,确定执行重试操作;
所述执行操作单元包括:
重试模块,用于调用业务系统提供的接口进行重试处理。
21.根据权利要求20所述的方法,其特征在于:
所述规则包括:第二业务状态、反馈原因码;
当所述分析适配模块判断所述业务状态信息与所述业务状态匹配、所述失败原因码与所述反馈原因码匹配时,确定执行反馈操作;
所述执行操作单元包括:
反馈模块,用于向设定的反馈接收人或业务系统发送反馈信息,其中,发送反馈信息的方式包括:邮件、短信。
22.根据权利要求21所述的系统,其特征在于,包括:
配置管理模块,用于通过配置管理界面配置异常处理规则引擎中的规则,并在所述配置管理界面上显示信息,包括:异常业务信息、报警信息、重试信息、反馈信息。
CN201610166670.XA 2016-03-22 2016-03-22 一种业务集中监控方法及系统 Pending CN105847083A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610166670.XA CN105847083A (zh) 2016-03-22 2016-03-22 一种业务集中监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610166670.XA CN105847083A (zh) 2016-03-22 2016-03-22 一种业务集中监控方法及系统

Publications (1)

Publication Number Publication Date
CN105847083A true CN105847083A (zh) 2016-08-10

Family

ID=56582979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610166670.XA Pending CN105847083A (zh) 2016-03-22 2016-03-22 一种业务集中监控方法及系统

Country Status (1)

Country Link
CN (1) CN105847083A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484425A (zh) * 2016-10-19 2017-03-08 济南浪潮高新科技投资发展有限公司 一种基于策略配置的异常处理方法
CN106777022A (zh) * 2016-12-08 2017-05-31 浪潮电子信息产业股份有限公司 一种基于对比模式实现服务器硬件资源智能化分配的方法
CN106921539A (zh) * 2017-02-06 2017-07-04 上海斐讯数据通信技术有限公司 一种基于云ac的关键业务模块监听方法及系统
CN107948744A (zh) * 2017-12-13 2018-04-20 深圳市雷鸟信息科技有限公司 接口检测方法、接口检测设备及计算机可读存储介质
CN107992398A (zh) * 2017-12-22 2018-05-04 宜人恒业科技发展(北京)有限公司 一种业务系统的监控方法和监控系统
CN108809673A (zh) * 2017-04-28 2018-11-13 北京微影时代科技有限公司 一种故障报警的方法及装置
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN109783210A (zh) * 2018-12-13 2019-05-21 平安科技(深圳)有限公司 多任务处理方法、装置、计算机设备及存储介质
CN110348839A (zh) * 2019-05-31 2019-10-18 口碑(上海)信息技术有限公司 设备状态数据的监控处理方法、装置及系统
CN110928716A (zh) * 2019-10-24 2020-03-27 江苏苏宁物流有限公司 调度任务异常处理方法及装置
CN111125230A (zh) * 2019-12-30 2020-05-08 中电工业互联网有限公司 一种基于规则引擎的物联网平台的数据处理方法及系统
CN111475495A (zh) * 2020-03-19 2020-07-31 深圳市酷开网络科技有限公司 基于大数据的质量分析方法、系统及存储介质
CN113722173A (zh) * 2020-12-29 2021-11-30 京东数字科技控股股份有限公司 一种业务流程监控方法、系统、设备及可读存储介质
CN114049065A (zh) * 2021-11-11 2022-02-15 北京京东振世信息技术有限公司 一种数据处理方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447997A (zh) * 2008-12-31 2009-06-03 中国建设银行股份有限公司 一种数据处理方法、服务器及数据处理系统
CN102457893A (zh) * 2010-10-26 2012-05-16 中国移动通信集团公司 一种数据处理方法和设备
CN102609346A (zh) * 2012-01-16 2012-07-25 深信服网络科技(深圳)有限公司 基于业务操作的监控方法和装置
US20140086102A1 (en) * 2012-09-25 2014-03-27 Ashok Babu Doddapaneni Intelligent feedback loop to iteratively reduce incoming network data for analysis
CN105224435A (zh) * 2015-10-16 2016-01-06 北京锐安科技有限公司 数据运维监控方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447997A (zh) * 2008-12-31 2009-06-03 中国建设银行股份有限公司 一种数据处理方法、服务器及数据处理系统
CN102457893A (zh) * 2010-10-26 2012-05-16 中国移动通信集团公司 一种数据处理方法和设备
CN102609346A (zh) * 2012-01-16 2012-07-25 深信服网络科技(深圳)有限公司 基于业务操作的监控方法和装置
US20140086102A1 (en) * 2012-09-25 2014-03-27 Ashok Babu Doddapaneni Intelligent feedback loop to iteratively reduce incoming network data for analysis
CN105224435A (zh) * 2015-10-16 2016-01-06 北京锐安科技有限公司 数据运维监控方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484425A (zh) * 2016-10-19 2017-03-08 济南浪潮高新科技投资发展有限公司 一种基于策略配置的异常处理方法
CN106484425B (zh) * 2016-10-19 2019-11-12 浪潮通用软件有限公司 一种基于策略配置的异常处理方法
CN106777022A (zh) * 2016-12-08 2017-05-31 浪潮电子信息产业股份有限公司 一种基于对比模式实现服务器硬件资源智能化分配的方法
CN106777022B (zh) * 2016-12-08 2018-08-14 浪潮电子信息产业股份有限公司 一种基于对比模式实现服务器硬件资源智能化分配的方法
CN106921539A (zh) * 2017-02-06 2017-07-04 上海斐讯数据通信技术有限公司 一种基于云ac的关键业务模块监听方法及系统
CN108809673A (zh) * 2017-04-28 2018-11-13 北京微影时代科技有限公司 一种故障报警的方法及装置
CN107948744A (zh) * 2017-12-13 2018-04-20 深圳市雷鸟信息科技有限公司 接口检测方法、接口检测设备及计算机可读存储介质
CN107992398A (zh) * 2017-12-22 2018-05-04 宜人恒业科技发展(北京)有限公司 一种业务系统的监控方法和监控系统
CN109783210A (zh) * 2018-12-13 2019-05-21 平安科技(深圳)有限公司 多任务处理方法、装置、计算机设备及存储介质
CN109783210B (zh) * 2018-12-13 2023-10-20 平安科技(深圳)有限公司 多任务处理方法、装置、计算机设备及存储介质
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN109660402B (zh) * 2018-12-25 2021-11-30 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN110348839A (zh) * 2019-05-31 2019-10-18 口碑(上海)信息技术有限公司 设备状态数据的监控处理方法、装置及系统
CN110928716A (zh) * 2019-10-24 2020-03-27 江苏苏宁物流有限公司 调度任务异常处理方法及装置
CN110928716B (zh) * 2019-10-24 2022-09-06 江苏苏宁物流有限公司 调度任务异常处理方法及装置
CN111125230A (zh) * 2019-12-30 2020-05-08 中电工业互联网有限公司 一种基于规则引擎的物联网平台的数据处理方法及系统
CN111475495A (zh) * 2020-03-19 2020-07-31 深圳市酷开网络科技有限公司 基于大数据的质量分析方法、系统及存储介质
CN113722173A (zh) * 2020-12-29 2021-11-30 京东数字科技控股股份有限公司 一种业务流程监控方法、系统、设备及可读存储介质
CN114049065A (zh) * 2021-11-11 2022-02-15 北京京东振世信息技术有限公司 一种数据处理方法、装置及系统

Similar Documents

Publication Publication Date Title
CN105847083A (zh) 一种业务集中监控方法及系统
CN105159964B (zh) 一种日志监控方法及系统
CN105791279B (zh) 一种拟态化sdn控制器构建方法
US6115743A (en) Interface system for integrated monitoring and management of network devices in a telecommunication network
EP1279211B1 (en) Topology-based reasoning apparatus for root-cause analysis of network faults
CN106992877B (zh) 基于sdn架构的网络故障检测与修复方法
US7971106B2 (en) Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
US8799722B2 (en) Business to business network management event detection and response system and method
US7069480B1 (en) Method and apparatus for identifying problems in computer networks
WO2007143943A1 (fr) Procédé, système et dispositif réseau de maintenance centralisée de dispositifs multiples
CN108429629A (zh) 设备故障恢复方法和装置
CN106953747B (zh) 一种基于深度学习的sdn网络自愈方法
CN106407030A (zh) 一种存储集群系统故障处理方法及系统
CN103944746A (zh) 一种双机热备的方法及装置
WO2012041555A1 (en) Method for determining a severity of a network incident
CN110224865A (zh) 一种基于流式处理的日志告警系统
US7523015B2 (en) Field device
CN112468592A (zh) 一种基于电力信息采集的终端在线状态侦测方法及系统
US9132550B2 (en) Apparatus and method for managing robot components
CN107528705A (zh) 故障处理方法及装置
CN103368909B (zh) 一种通信设备控制平面保护装置及方法
CN106685087B (zh) 一种用于配电自动化系统的配网管理设备
Varga et al. Integration of service-level monitoring with fault management for end-to-end multi-provider ethernet services
JPH11243424A (ja) 障害発生の電子メール自動送信ルータ
CN110830327B (zh) 一种过程层网络全链路监控和告警的实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160810

WD01 Invention patent application deemed withdrawn after publication