CN105978728B - 智能监控系统及业务指标的监控方法 - Google Patents
智能监控系统及业务指标的监控方法 Download PDFInfo
- Publication number
- CN105978728B CN105978728B CN201610446928.1A CN201610446928A CN105978728B CN 105978728 B CN105978728 B CN 105978728B CN 201610446928 A CN201610446928 A CN 201610446928A CN 105978728 B CN105978728 B CN 105978728B
- Authority
- CN
- China
- Prior art keywords
- module
- operational indicator
- journal file
- service module
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/566—Grouping or aggregating service requests, e.g. for unified processing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及智能监控系统及业务指标的监控方法,该系统中调度模块用于在接收到采集模块发送的分配请求后,为该采集模块分配服务模块;采集模块用于发送分配请求,及与分配的服务模块建立连接,且采集日志文件,将采集到的日志文件发送给服务模块;服务模块用于在接收到日志文件后,基于预置的日志过滤及计算规则对日志文件进行处理,得到目标日志信息并发送给处理模块;处理模块用于接收多个服务模块发送的目标日志信息,并基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。本发明还提供一种业务指标监控方法,使得能够对多个主机上的日志文件进行统一处理,有效实现对业务指标的监控。
Description
技术领域
本发明涉及计算机通信领域,尤其涉及智能监控系统及业务指标的监控方法。
背景技术
业务指标监控是运维监控体系的重要部分,且业务指标是业务运行情况的最直观体现,通过对业务指标进行监控,能够有效的确定各项业务的运行情况。其中,业务指标可以是某个产品开户交易的每分钟交易量、业务交易成功率等等。
目前,在银行系统中,一笔业务交易往往需要经过多个系统的众多子系统的协同处理才能最终完成,然而由于该多个系统的众多子系统是分布在多台主机上,且该多台主机互相独立,无法实现有效的业务指标监控。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种智能监控系统,旨在解决现有技术中由于众多子系统分布在多台主机上,且该多台主机互相独立,无法实现有效的业务指标监控的技术问题。
为实现上述目的,本发明提供的一种智能监控系统,所述智能监控系统包括:
多个采集模块、多个服务模块、调度模块及处理模块;
所述多个采集模块分别部署在多个主机上,所述多个服务模块均与所述处理模块连接;
所述调度模块用于在接收到所述采集模块发送的分配请求后,基于所述多个服务模块的负载信息选择一个服务模块,将选择的服务模块分配给所述采集模块;
所述采集模块用于发送所述分配请求,及与分配的服务模块建立连接,在建立连接后,采集日志文件,并将采集到的日志文件发送给与其连接的服务模块;
所述服务模块用于在接收到日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块;
所述处理模块用于接收所述多个服务模块发送的目标日志信息,并基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
优选地,所述智能监控系统还包括阀值检测模块;
所述阀值检测模块用于基于预先设置的业务指标阀值对所述处理模块得到的各业务指标的值进行检测,以确定是否需要进行告警。
优选地,所述智能监控系统还包括配置模块,所述配置模块用于自定义配置所述智能监控系统的配置信息;所述配置信息包括所述日志过滤及计算规则、所述业务指标配置规则、及所述业务指标阀值。
优选地,所述智能监控系统还包括:缓存模块;
所述缓存模块用于缓存所述配置模块自定义配置的所述配置信息,及用于缓存预置时间段内所述服务模块的状态数据。
优选地,所述服务模块还用于将其负载信息发送给所述调度模块,使得所述调度模块基于所述服务模块的负载信息确定分配所述服务模块的策略。
优选地,所述智能监控系统还包括:
转发模块,用于接收所述服务模块发送的日志文件,并将接收到的日志文件转发至其他设备。
为了解决上述问题,本发明还提供一种业务指标的监控方法,该方法应用于上述的系统,所述方法包括:
所述采集模块向所述调度模块发送分配请求;
所述调度模块接收到所述分配请求后,基于所述多个服务模块的负载信息选择一个服务模块,将选择的服务模块分配给所述采集模块;
所述采集模块建立与分配的服务模块之间的连接,在建立连接后,采集日志文件,将采集到的日志文件发送给与其连接的服务模块;
所述服务模块接收到所述日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块;
所述处理模块基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
优选地,所述方法还包括:
在所述处理模块确定各业务指标的值之后,阀值检测模块基于预先设置的业务指标阀值对所述各业务指标的值进行检测,以确定是否需要进行告警。
优选地,所述方法还包括:
配置模块自定义配置所述智能监控系统的配置信息,所述配置信息包括所述日志过滤及计算规则、所述业务指标配置规则、及所述业务指标阀值。
优选地,所述方法还包括:
所述服务模块接收到所述日志文件之后,将所述日志文件发送给所述转发模块,由所述转发模块将所述日志文件转发至其他设备。
本发明提供一种智能监控系统(Intelligent Monitor System,IMS),该智能监控系统包括:多个采集模块、多个服务模块、调度模块及处理模块,该多个采集模块分别部署在多个主机上,该多个服务模块均与处理模块连接,其中,该调度模块用于在接收到采集模块发送的分配请求后,基于该多个服务模块的负载信息选择一个服务模块,将选择的服务模块分配给发送分配请求的采集模块,该采集模块用于在发送分配请求后,与分配的服务模块建立连接,在建立连接后,采集日志文件,并将采集到的日志文件发送给与其连接的服务模块,该服务模块用于在接收到日志文件之后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将该目标日志信息发送给处理模块,该处理模块用于接收上述多个服务模块发送的目标日志信息,并基于预置的业务指标配置规则对所有接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。在该智能监控系统中,由于将处理模块与多个服务模块连接,及多个采集模块分别部署在多个主机上,且采集模块采集的日志文件都将在与其连接的服务模块处理后发送给处理模块,使得处理模块能够对多个主机上的日志文件进行统一处理,有效实现对业务指标的监控,且由于调度模块能够基于该多个服务模块的负载信息为采集模块分配连接的服务模块,使得能够有效的实现基于服务模块的分布式日志文件采集及负载均衡。
附图说明
图1为本发明第一实施例中智能监控系统的结构图;
图2为本发明第二实施例中智能监控系统的结构图;
图3为本发明第三实施例中智能监控方法的流程示意图;
图4为本发明第四实施例中智能监控方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于现有技术中众多子系统分布在多台主机上,且该多台主机互相独立,无法实现有效的业务指标监控的技术问题。
为解决上述问题,本发明提出一种智能监控系统,在该智能监控系统中,由于将处理模块与多个服务模块连接,及多个采集模块分别部署在多个主机上,且采集模块采集的日志文件都将在与其连接的服务模块处理后发送给处理模块,使得处理模块能够对多个主机上的日志文件进行统一处理,有效实现对业务指标的监控,且由于调度模块能够基于该多个服务模块的负载信息为采集模块分配连接的服务模块,使得能够有效的实现基于服务模块的分布式日志文件采集及负载均衡。
请参阅图1,为本发明第一实施例中智能监控系统的结构图,该智能监控系统包括:多个采集模块101、多个服务模块102、调度模块103及处理模块104;
所述多个采集模块101分别部署在多个主机上,所述多个服务模块102均与所述处理模块104连接;
所述调度模块103用于在接收到所述采集模块101发送的分配请求后,基于所述多个服务模块102的负载信息选择一个服务模块102,将选择的服务模块102分配给所述采集模块101;
所述采集模块101用于发送所述分配请求,及与分配的服务模块102建立连接,在建立连接后,采集日志文件,并将采集到的日志文件发送给与其连接的服务模块102;
所述服务模块102用于在接收到日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块104;
所述处理模块104用于接收所述多个服务模块102发送的目标日志信息,并基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
在本发明实施例中,图1中仅以设置四个采集模块101及两个服务模块102为例,在实际应用中,可根据具体的需要设置采集模块101及服务模块102的个数,此处并不做限定。且在图1中,实线连接表示可以传输数据,虚线连接表示可以传输请求、指令及读取配置参数等。
在本发明实施例中,通过设置智能监控系统,使得能够获取多台主机上的日志文件,以实现对业务指标的监控,具体的,在该智能监控系统中,由于将处理模块104与多个服务模块102连接,及多个采集模块101分别部署在多个主机上,且采集模块101采集的日志文件都将在与其连接的服务模块102处理后发送给处理模块104,使得处理模块104能够对多个主机上的日志文件进行统一处理,有效实现对业务指标的监控。此外,由于调度模块103能够基于该多个服务模块102的负载信息为采集模块101分配连接的服务模块102,使得能够有效的实现基于服务模块102的分布式日志文件采集及负载均衡。
基于图1所示第一实施例,请参阅图2,为本发明第二实施例中智能监控系统的结构图,该智能监控系统包含如图1所示第一实施例中的采集模块101、服务模块102、调度模块103及处理模块104。且与图1所示第一实施例中描述的内容相似,此处不做赘述。
在本发明实施例中,所述智能监控系统还包括阀值检测模块105;所述阀值检测模块105用于在所述基于预先设置的业务指标阀值对所述处理模块104得到的各业务指标的值进行检测,以确定是否需要进行告警。
所述智能监控系统还包括配置模块106,所述配置模块106用于自定义配置所述智能监控系统的配置信息;所述配置信息包括所述日志过滤及计算规则、所述业务指标配置规则、及所述业务指标阀值。
所述智能监控系统还包括:缓存模块107;所述缓存模块107用于缓存所述配置模块106自定义配置的所述配置信息,及用于缓存预置时间段内所述服务模块102的状态数据。
在本发明实施例中,所述服务模块102还用于将其负载信息发送给所述调度模块103,使得所述调度模块103基于所述服务模块102的负载信息确定分配所述服务模块102的策略。
在本发明实施例中,所述智能监控系统还包括:
转发模块108,用于接收所述服务模块102发送的日志文件,并将接收到的日志文件转发至其他设备。
为了更好地理解本发明实施例中的技术方案,下面将分别对该智能监控系统中的各个模块的连接关系及实现的功能进行详细的介绍。
在本发明实施例中,配置模块106用于对该智能监控系统进行自定义配置,是支持多系统自定义指标计算规则的核心,且操作人员可以在智能监控系统的web界面上通过调用该配置模块106实现对智能监控系统的配置信息的自定义配置。其中,该配置信息包括服务模块102使用的日志过滤及计算规则、处理模块104使用的业务指标配置规则、及阀值检测模块105使用的业务指标阀值。可以理解的是,若未调用配置模块106进行配置,智能监控系统在进行业务指标进行监控时,可以采用默认的配置信息。
1)日志过滤及计算规则
上述日志过滤及计算规则包括日志文件配置、日志文件字段定义配置、及业务指标计算公式配置。
在本发明实施例中,各个子系统可以参考银行业界已有的《日志管理规范》,通过标准的日志格式输出每笔交易记录,其中,日志格式如下:
[日志级别][时间戳][线程号][模块名称][业务流水号][系统流水号][LOG-POINT][统计文本][消息文本]
其中,统计文本中输出一笔交易的交易码、返回码、耗时、渠道号、合作伙伴、返回状态等,智能监控系统基于该统计文本中包含的数据内容计算和汇总各业务场景的交易量、成功率等业务指标。
其中,日志文件配置是以子系统为单位,每个子系统可以配置一个或多个日志文件,并为每个日志文件单独配置过滤规则,符合过滤规则的日志信息将被过滤出。
由于不同业务的过滤得到的日志信息不同,包含的有效信息也不同,因此,对日志文件字段的定义配置包括以下几类:
交易码:可以用来区分一个日志文件属于哪一个业务指标;
返回码:用来记录业务交易流水是否成功,且该返回码还可以细分为包括系统返回码及业务返回码。通过返回码可以计算出成功量、失败量、系统和业务成功率、失败率等业务指标;
耗时:此类字段用于表示一条业务流水请求服务所消耗的时间。
需要说明的是,配置日志文件中的字段定义后,日志文件中只有配置了字段的信息才会被过滤出来。
其中,业务指标计算公式配置主要是对服务模块102在基于上述的日志文件配置及日志文件字段定义实现日志信息的过滤之后,所需要使用到的业务指标计算公式进行配置,该业务指标计算公式是一个类SQL的模板,模板中的变量包含“交易码”“返回码”“耗时”等字段,在计算业务指标时,模板会被实例化,以得到目标日志信息。
需要说明的是,业务指标计算公式有一个缺省的通用模板,通常不需要修改业务指标计算的公式,但是对于一些比较特殊的场景,比如“交易码”又细分为“请求交易码”和“响应交易码”,此时需要对于业务指标计算公式进行适当的调整,且可以理解的是,调整的方式为现有技术,此处不做赘述。
在本发明实施例中,服务模块102基于上述的日志过滤及计算规则对接收到的日志文件进行处理,得到目标日志信息。
2)业务指标配置规则
在本发明实施例中,业务指标配置规则具体包括业务指标配置及业务指标汇总。
其中,业务指标配置主要包含配置业务指标的名称、需要计算的属性值,以及区分业务指标的交易码和返回码的配置。
其中,交易码是从日志文件中过滤出来的,由一个字段或多个字段组成,即从日志文件中通过这个交易码字段可以区分出一个业务指标。如:serviceld=“B00001”且scenld=“001”表示“账户信息查询”指标。
其中,返回码是从日志文件中过滤出来的,用于判断一个交易是否成功,如sysret=“0000”表示系统成功,sysret=“0001”表示系统失败,r=“0000”表示业务成功,r=“0001”表示业务失败。
在本发明实施例中,业务指标汇总是指配置业务指标汇总的维度,该维度可以是空间维度,也可以是业务分类和场景维度,且可以同时配置空间维度、及业务分类和场景维度。
其中,空间维度是指以数据中心节点(Data Center Node,DCN)或整个系统为维度,将同一业务指标汇总。
其中,业务分类和场景维度是指按业务所属的分类和场景进行业务指标汇总,例如:金融、非金融;查询、开户、存款、借款等。
3)业务指标阀值
配置业务指标阀值主要是便于对处理模块104得到的业务指标进行判断,以确定是否需要告警,即该业务指标阀值是告警阀值,该业务指标阀值可以设置为组合阀值,即包含两个以上的判断条件,例如:若交易量小于10且成功率小于80%时进行告警。且该业务指标阀值还可以设置为同环比阀值,例如:对于同一个业务指标,比较该业务指标在预置的7个时间周期内的业务指标的平均值,并与当前得到的该业务指标的值进行比较,若满足预设条件,则进行告警。
可以理解的是,由于在智能监控系统中可以配置业务指标阀值以确定是否告警,因此,还可以进行告警配置,以配置告警的具体方式,如web页面的突出显示、播放告警音乐、将告警信息发送给指定邮箱等等。
需要说明的是,为了更好的对业务指标进行监控,避免对不需要的日志文件的采集,还可以基于配置模块106实现主机和业务子系统对应关系的配置。在进行主机和业务子系统对应关系的配置时,主要是根据业务子系统的负载及业务子系统的负载均衡策略将该子系统部署到一台或多台主机上,子系统中的每一台主机都可以作为该子系统的节点,且将配置每一个节点与指定类型的日志文件的关联,使得部署在该主机上的采集模块101,仅对已经关联的指定类型的日志文件进行采集,并将采集到的日志文件发送给与该采集模块101连接的服务模块102,使得能够有效的实现特定日志文件的采集。
以上即为对配置模块106的介绍,通过使用配置模块106对智能监控系统进行配置,使得能够支持不同业务场景的不同系统自定义配置,从而能够灵活的对业务指标进行配置。
在本发明实施例中,采集模块101部署在主机上,且若需要对该主机上的日志文件进行监控,采集模块101将向调度模块103发送分配请求,以请求分配服务模块102。
其中,调度模块103用于在接收到采集模块101发送的分配请求后,基于该多个服务模块102的负载信息选择一个服务模块102,将该选择的服务模块102分配给发送分配请求的采集模块101。
其中,该多个服务模块102会定时或者实时向调度模块103上报其负载信息,使得调度模块103能够获取到智能监控系统中多个服务模块102的负载信息,并在接收到任意一个采集模块101的分配请求时,基于多个服务模块102的负载信息为该采集模块101分配服务模块102,其中,调度模块103在分配服务模块102时,是将负载最小的服务模块102分配给采集模块101,且将该负载最小的服务模块102的连接地址发送给采集模块101。
采集模块101在接收到调度模块103分配的服务模块102的连接地址之后,将按照该连接地址向分配的服务模块102发送连接请求,建立与分配的服务模块102之间的连接。其中,一个服务模块102可以与多个采集模块101连接,且服务模块102与采集模块101建立的是socket通讯连接。
可以理解的是,若已经基于配置模块106配置了部署该采集模块101的主机,则该采集模块101在建立与服务模块102之间的连接之后,将向调度模块103发送采集类型请求消息,调度模块103在接收到该采集类型请求消息之后,将从缓存模块107中查找已缓存的该主机所需的日志文件目录和名称,并将该所需的日志文件目录和名称反馈给该采集模块101,其中,包含与该主机关联的日志文件的指定类型,采集模块101将采集该指定类型的日志文件,并将采集到的日志文件发送给与其连接的服务模块102。
通过部署在主机上的采集模块101采集日志文件,使得能够有效实现日志文件的采集。
在本发明实施例中,智能监控系统中部署有多个服务模块102,通过分布式部署方式,便于进行服务模块102的扩展及满足系统的使用需求,使得能够通过多个服务模块102协同合作完成对日志文件的处理。
在本发明实施例中,对于智能监控系统中的任意一个服务模块102,在建立与采集模块101之间的连接之后,将接收该采集模块101发送的日志文件,并基于配置模块106配置的日志过滤及计算规则对接收到的日志文件进行处理,得到目标日志信息,将目标日志信息发送给处理模块104。
其中,基于日志过滤及计算规则对接收到的日志文件进行处理具体包括:利用日志文件配置过滤出日志信息,并基于日志文件字段定义过滤出所需要的有效信息,并将该有效信息缓存在服务模块102上,此外,该服务模块102还将定时利用配置的业务指标计算公式对该有效信息进行处理,将处理后的数据即目标日志信息发送给处理模块104。
可以理解的是,为了便于调度模块103进行调度,各服务模块102将实时或者定时将自身的负载信息发送给调度模块103,使得调度模块103能够基于各服务模块102的负载信息确定负载最小的服务模块102,保证发送请求的采集模块101总能够连接到负载最小的服务模块102。
可以理解的是,若一个服务模块102在处理的过程中出现故障,该服务模块102与采集模块101之间的连接将断开,该采集模块101将再次向调度模块103发送分配请求,以请求分配服务模块102,调度模块103在接收到该分配请求之后,将为该采集模块101重新分配一个服务模块102,使得能够将出现故障的服务模块102的任务转移到其他服务模块102上,保证业务指标监控的健壮性及稳定性。此外,调度模块还将各服务模块的是否能够提供正常服务的信息存储在缓存模块107中,其中服务模块102能够提供正常的服务的信息属于服务模块的状态数据,且该状态数据还包括缓存的各服务模块102的负载信息。
可以理解的是,智能监控系统中的服务模块102还可以将接收到的日志文件发送给外部设备,使得外部设备能够将接收到的日志文件作为数据源进行处理。
在本发明实施例中,处理模块104能够接收到智能监控系统中所有服务模块102发送的目标日志信息,且基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对业务指标的监控。
通过上述的采集模块101、服务模块102及处理模块104,能够有效的实现对分布式部署的业务系统日志文件的采集、计算及汇总,使得能够有效的实现业务指标监控。
在本发明实施例中,处理模块104在得到各业务指标的值之后,将该各业务指标的值发送给阀值检测模块105,阀值检测模块105将基于预先设置的业务指标阀值对该各业务指标的值进行检测,以确定是否需要告警。
且需要说明的是,处理模块104在进行阀值检测时使用的业务指标阀值可以是组合阀值也可以是同环比阀值。
在本发明实施例中,通过在智能监控系统中设置配置模块106,使得智能监控系统能够支持不同业务场景的不同自定义配置,从而能够灵活的对业务指标进行配置。且通过设置采集模块101、服务模块102及处理模块104,使得能够有效的实现对日志文件的采集、计算及汇总,实现对业务指标的监控。此外,通过在智能监控系统中设置阀值检测模块105,使得能够基于监控得到的业务指标的值确定是否告警,有效提升系统的性能。
基于图1所示的第一实施例及图2所示的第二实施例,下面将介绍本发明中的业务指标监控方法,请参阅图3,为本发明第三实施例中业务指标监控方法的流程示意图,该业务指标监控方法包括:
步骤301、所述采集模块101向所述调度模块103发送分配请求;
步骤302、所述调度模块103接收到所述分配请求后,基于所述多个服务模块102的负载信息选择一个服务模块102,将选择的服务模块102分配给所述采集模块101;
步骤303、所述采集模块101建立与分配的服务模块102之间的连接,在建立连接后,采集日志文件,将采集到的日志文件发送给与其连接的服务模块102;
步骤304、所述服务模块102接收到所述日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块104;
步骤305、所述处理模块104基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
在本发明实施例中,通过设置智能监控系统,使得能够获取多台主机上的日志文件,以实现对业务指标的监控,具体的,在该智能监控系统中,由于将处理模块104与多个服务模块102连接,及多个采集模块101分别部署在多个主机上,且采集模块101采集的日志文件都将在与其连接的服务模块102处理后发送给处理模块104,使得处理模块104能够对多个主机上的日志文件进行统一处理,有效实现对业务指标的监控。此外,由于调度模块103能够基于该多个服务模块102的负载信息为采集模块101分配连接的服务模块102,使得能够有效的实现基于服务模块102的分布式日志文件采集及负载均衡。
基于图3所示的第三实施例,请参阅图4,为本发明第四实施例中的业务指标监控方法的流程示意图,该业务指标监控方法包括:
步骤401、所述采集模块101向所述调度模块103发送分配请求;
在本发明实施例中,在执行步骤401之前,需要由配置模块106对智能监控系统进行配置,其中配置模块106用于对该智能监控系统进行自定义配置,是支持多系统自定义指标计算规则的核心,且操作人员可以在智能监控系统的web界面上通过调用该配置模块106实现对智能监控系统的配置信息的自定义配置。其中,该配置信息包括服务模块102使用的日志过滤及计算规则、处理模块104使用的业务指标配置规则、及阀值检测模块105使用的业务指标阀值。
1)日志过滤及计算规则
上述日志过滤及计算规则包括日志文件配置、日志文件字段定义配置、及业务指标计算公式配置。
在本发明实施例中,各个子系统可以参考银行业界已有的《日志管理规范》,通过标准的日志格式输出每笔交易记录,其中,日志格式如下:
[日志级别][时间戳][线程号][模块名称][业务流水号][系统流水号][LOG-POINT][统计文本][消息文本]
其中,统计文本中输出一笔交易的交易码、返回码、耗时、渠道号、合作伙伴、返回状态等,智能监控系统基于该统计文本中包含的数据内容计算和汇总各业务场景的交易量、成功率等业务指标。
其中,日志文件配置是以子系统为单位,每个子系统可以配置一个或多个日志文件,并为每个日志文件单独配置过滤规则,符合过滤规则的日志信息将被过滤出。
由于不同业务的过滤得到的日志信息不同,包含的有效信息也不同,因此,对日志文件字段的定义配置包括以下几类:
交易码:可以用来区分一个日志文件属于哪一个业务指标;
返回码:用来记录业务交易流水是否成功,且该返回码还可以细分为包括系统返回码及业务返回码。通过返回码可以计算出成功量、失败量、系统和业务成功率、失败率等业务指标;
耗时:此类字段用于表示一条业务流水请求服务所消耗的时间。
需要说明的是,配置日志文件中的字段定义后,日志文件中只有配置了字段的信息才会被过滤出来。
其中,业务指标计算公式配置主要是对服务模块102在基于上述的日志文件配置及日志文件字段定义实现日志信息的过滤之后,所需要使用到的业务指标计算公式进行配置,该业务指标计算公式是一个类SQL的模板,模板中的变量包含“交易码”“返回码”“耗时”等字段,在计算业务指标时,模板会被实例化,以得到目标日志信息。
需要说明的是,业务指标计算公式有一个缺省的通用模板,通常不需要修改业务指标计算的公式,但是对于一些比较特殊的场景,比如“交易码”又细分为“请求交易码”和“响应交易码”,此时需要对于业务指标计算公式进行适当的调整,且可以理解的是,调整的方式为现有技术,此处不做赘述。
在本发明实施例中,服务模块102基于上述的日志过滤及计算规则对接收到的日志文件进行处理,得到目标日志信息。
2)业务指标配置规则
在本发明实施例中,业务指标配置规则具体包括业务指标配置及业务指标汇总。
其中,业务指标配置主要包含配置业务指标的名称、需要计算的属性值,以及区分业务指标的交易码和返回码的配置。
其中,交易码是从日志文件中过滤出来的,由一个字段或多个字段组成,即从日志文件中通过这个交易码字段可以区分出一个业务指标。如:serviceld=“B00001”且scenld=“001”表示“账户信息查询”指标。
其中,返回码是从日志文件中过滤出来的,用于判断一个交易是否成功,如sysret=“0000”表示系统成功,sysret=“0001”表示系统失败,r=“0000”表示业务成功,r=“0001”表示业务失败。
在本发明实施例中,业务指标汇总是指配置业务指标汇总的维度,该维度可以是空间维度,也可以是业务分类和场景维度,且可以同时配置空间维度、及业务分类和场景维度。
其中,空间维度是指以DCN或整个系统为维度,将同一业务指标汇总。
其中,业务分类和场景维度是指按业务所属的分类和场景进行业务指标汇总,例如:金融、非金融;查询、开户、存款、借款等。
3)业务指标阀值
配置业务指标阀值主要是便于对处理模块104得到的业务指标进行判断,以确定是否需要告警,即该业务指标阀值是告警阀值,该业务指标阀值可以设置为组合阀值,即包含两个以上的判断条件,例如:若交易量小于10且成功率小于80%时进行告警。且该业务指标阀值还可以设置为同环比阀值,例如:对于同一个业务指标,比较该业务指标在预置的7个时间周期内的业务指标的平均值,并与当前得到的该业务指标的值进行比较,若满足预设条件,则进行告警。
可以理解的是,由于在智能监控系统中可以配置业务指标阀值以确定是否告警,因此,还可以进行告警配置,以配置告警的具体方式,如web页面的突出显示、播放告警音乐、将告警信息发送给指定邮箱等等。
需要说明的是,为了更好的对业务指标进行监控,避免对不需要的日志文件的采集,还可以基于配置模块106实现主机和业务子系统对应关系的配置。在进行主机和业务子系统对应关系的配置时,主要是根据业务子系统的负载及业务子系统的负载均衡策略将该子系统部署到一台或多台主机上,子系统中的每一台主机都可以作为该子系统的节点,且将配置每一个节点与指定类型的日志文件的关联,使得部署在该主机上的采集模块101,仅对已经关联的指定类型的日志文件进行采集,并将采集到的日志文件发送给与该采集模块101连接的服务模块102,使得能够有效的实现特定日志文件的采集。
以上即为对配置模块106的介绍,通过使用配置模块106对智能监控系统进行配置,使得能够支持不同业务场景的不同系统自定义配置,从而能够灵活的对业务指标进行配置。
在本发明实施例中,采集模块101部署在主机上,且若需要对该主机上的日志文件进行监控,采集模块101将向调度模块103发送分配请求,以请求分配服务模块102。
步骤402、所述调度模块103接收到所述分配请求后,基于所述多个服务模块102的负载信息选择一个服务模块102,将选择的服务模块102分配给所述采集模块101;
在本发明实施例中,调度模块103在接收到采集模块101发送的分配请求后,基于该多个服务模块102的负载信息选择一个服务模块102,将该选择的服务模块102分配给发送分配请求的采集模块101。
其中,该多个服务模块102会定时或者实时向调度模块103上报其负载信息,使得调度模块103能够获取到智能监控系统中多个服务模块102的负载信息,并在接收到任意一个采集模块101的分配请求时,基于多个服务模块102的负载信息为该采集模块101分配服务模块102,其中,调度模块103在分配服务模块102时,是将负载最小的服务模块102分配给采集模块101,且将该负载最小的服务模块102的连接地址发送给采集模块101。
步骤403、所述采集模块101建立与分配的服务模块102之间的连接,在建立连接后,采集日志文件,将采集到的日志文件发送给与其连接的服务模块102;执行步骤404及步骤405;
采集模块101在接收到调度模块103分配的服务模块102的连接地址之后,将按照该连接地址向分配的服务模块102发送连接请求,建立与分配的服务模块102之间的连接。其中,一个服务模块102可以与多个采集模块101连接,且服务模块102与采集模块101建立的是socket通讯连接。
可以理解的是,若已经基于配置模块106配置了部署该采集模块101的主机,则该采集模块101在建立与服务模块102之间的连接之后,将向调度模块103发送采集类型请求消息,调度模块103在接收到该采集类型请求消息之后,将从缓存模块107中查找已缓存的该主机所需的日志文件目录和名称,并将该所需的日志文件目录和名称反馈给该采集模块101,其中,包含与该主机关联的日志文件的指定类型,采集模块101将采集该指定类型的日志文件,并将采集到的日志文件发送给与其连接的服务模块102。
通过部署在主机上的采集模块101采集日志文件,使得能够有效实现日志文件的采集。
步骤404、所述服务模块102接收到所述日志文件之后,将所述日志文件发送给所述转发模块108,由所述转发模块108将所述日志文件转发至其他设备;
步骤405、所述服务模块102接收到所述日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块104;继续执行步骤406;
步骤406、所述处理模块104基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控;
在本发明实施例中,智能监控系统中部署有多个服务模块102,通过分布式部署方式,便于进行服务模块102的扩展及满足系统的使用需求,使得能够通过多个服务模块102协同合作完成对日志文件的处理。
在本发明实施例中,对于智能监控系统中的任意一个服务模块102,在建立与采集模块101之间的连接之后,将接收该采集模块101发送的日志文件,并基于配置模块106配置的日志过滤及计算规则对接收到的日志文件进行处理,得到目标日志信息,将目标日志信息发送给处理模块104。
其中,基于日志过滤及计算规则对接收到的日志文件进行处理具体包括:利用日志文件配置过滤出日志信息,并基于日志文件字段定义过滤出所需要的有效信息,并将该有效信息缓存在服务模块102上,此外,该服务模块102还将定时利用配置的业务指标计算公式对该有效信息进行处理,将处理后的数据即目标日志信息发送给处理模块104。
可以理解的是,为了便于调度模块103进行调度,各服务模块102将实时或者定时将自身的负载信息发送给调度模块103,使得调度模块103能够基于各服务模块102的负载信息确定负载最小的服务模块102,保证发送请求的采集模块101总能够连接到负载最小的服务模块102。
可以理解的是,若一个服务模块102在处理的过程中出现故障,该服务模块102与采集模块101之间的连接将断开,该采集模块101将再次向调度模块103发送分配请求,以请求分配服务模块102,调度模块103在接收到该分配请求之后,将为该采集模块101重新分配一个服务模块102,使得能够将出现故障的服务模块102的任务转移到其他服务模块102上,保证业务指标监控的健壮性及稳定性。
可以理解的是,智能监控系统中的服务模块102还可以将接收到的日志文件发送给外部设备,使得外部设备能够将接收到的日志文件作为数据源进行处理。
在本发明实施例中,处理模块104能够接收到智能监控系统中所有服务模块102发送的目标日志信息,且基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对业务指标的监控。
步骤407、在所述处理模块104确定各业务指标的值之后,阀值检测模块105基于预先设置的业务指标阀值对所述各业务指标的值进行检测,以确定是否需要进行告警。
在本发明实施例中,处理模块104在得到各业务指标的值之后,将该各业务指标的值发送给阀值检测模块105,阀值检测模块105将基于预先设置的业务指标阀值对该各业务指标的值进行检测,以确定是否需要告警。
且需要说明的是,处理模块104在进行阀值检测时使用的业务指标阀值可以是组合阀值也可以是同环比阀值。
在本发明实施例中,通过在智能监控系统中设置配置模块106,使得智能监控系统能够支持不同业务场景的不同自定义配置,从而能够灵活的对业务指标进行配置。且通过设置采集模块101、服务模块102及处理模块104,使得能够有效的实现对日志文件的采集、计算及汇总,实现对业务指标的监控。此外,通过在智能监控系统中设置阀值检测模块105,使得能够基于监控得到的业务指标的值确定是否告警,有效提升系统的性能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种智能监控系统,其特征在于,所述智能监控系统包括:
多个采集模块、多个服务模块、调度模块及处理模块;
所述多个采集模块分别部署在多个主机上,所述多个服务模块均与所述处理模块连接;
所述调度模块用于在接收到所述采集模块发送的分配请求后,基于所述多个服务模块的负载信息选择一个负载最小的服务模块,将选择的负载最小的服务模块分配给所述采集模块;
所述采集模块用于发送所述分配请求,及与分配的负载最小的服务模块建立连接,在建立连接后,采集日志文件,并将采集到的日志文件发送给与其连接的服务模块;
所述服务模块用于在接收到日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块;
所述处理模块用于接收所述多个服务模块发送的目标日志信息,并基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
2.根据权利要求1所述的智能监控系统,其特征在于,所述智能监控系统还包括阀值检测模块;
所述阀值检测模块用于基于预先设置的业务指标阀值对所述处理模块得到的各业务指标的值进行检测,以确定是否需要进行告警。
3.根据权利要求2所述的智能监控系统,其特征在于,所述智能监控系统还包括配置模块,所述配置模块用于自定义配置所述智能监控系统的配置信息;所述配置信息包括所述日志过滤及计算规则、所述业务指标配置规则、及所述业务指标阀值。
4.根据权利要求3所述的智能监控系统,其特征在于,所述智能监控系统还包括:缓存模块;
所述缓存模块用于缓存所述配置模块自定义配置的所述配置信息,及用于缓存预置时间段内所述服务模块的状态数据。
5.根据权利要求1所述的智能监控系统,其特征在于,所述服务模块还用于将其负载信息发送给所述调度模块,使得所述调度模块基于所述服务模块的负载信息确定分配所述服务模块的策略。
6.根据权利要求1-5任意一项所述的智能监控系统,其特征在于,所述智能监控系统还包括:
转发模块,用于接收所述服务模块发送的日志文件,并将接收到的日志文件转发至其他设备。
7.一种业务指标的监控方法,其特征在于,所述方法应用于权利要求1至6任意一项所述的系统,所述方法包括:
所述采集模块向所述调度模块发送分配请求;
所述调度模块接收到所述分配请求后,基于所述多个服务模块的负载信息选择一个负载最小的服务模块,将选择的负载最小的服务模块分配给所述采集模块;
所述采集模块建立与分配的负载最小的服务模块之间的连接,在建立连接后,采集日志文件,将采集到的日志文件发送给与其连接的服务模块;
所述服务模块接收到所述日志文件后,基于预置的日志过滤及计算规则对所述日志文件进行处理,得到目标日志信息,将所述目标日志信息发送给所述处理模块;
所述处理模块基于预置的业务指标配置规则对接收到的目标日志信息进行汇总计算,以确定各业务指标的值,实现对各业务指标的监控。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述处理模块确定各业务指标的值之后,阀值检测模块基于预先设置的业务指标阀值对所述各业务指标的值进行检测,以确定是否需要进行告警。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
配置模块自定义配置所述智能监控系统的配置信息,所述配置信息包括所述日志过滤及计算规则、所述业务指标配置规则、及所述业务指标阀值。
10.根据权利要求7至9任意一项所述的方法,其特征在于,所述方法还包括:
所述服务模块接收到所述日志文件之后,将所述日志文件发送给转发模块,由所述转发模块将所述日志文件转发至其他设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610446928.1A CN105978728B (zh) | 2016-06-20 | 2016-06-20 | 智能监控系统及业务指标的监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610446928.1A CN105978728B (zh) | 2016-06-20 | 2016-06-20 | 智能监控系统及业务指标的监控方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105978728A CN105978728A (zh) | 2016-09-28 |
CN105978728B true CN105978728B (zh) | 2019-09-03 |
Family
ID=57021450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610446928.1A Active CN105978728B (zh) | 2016-06-20 | 2016-06-20 | 智能监控系统及业务指标的监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105978728B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106020986A (zh) * | 2016-05-26 | 2016-10-12 | 中国建设银行股份有限公司 | 一种数据处理方法及装置 |
CN106534257B (zh) * | 2016-09-29 | 2019-09-27 | 国家电网公司 | 一种多层次集群式架构的多源安全日志采集系统及方法 |
CN106971254A (zh) * | 2017-02-13 | 2017-07-21 | 上海瀚之友信息技术服务有限公司 | 一种业务监控系统及方法 |
CN109787850B (zh) * | 2017-11-10 | 2022-12-16 | 阿里巴巴集团控股有限公司 | 监控系统、监控方法及计算节点 |
CN108512689B (zh) * | 2017-12-15 | 2021-08-27 | 中国平安财产保险股份有限公司 | 微服务业务监控方法及服务器 |
CN109033404B (zh) * | 2018-08-03 | 2022-03-11 | 北京百度网讯科技有限公司 | 日志数据处理方法、装置和系统 |
CN109858868B (zh) * | 2018-12-17 | 2022-02-25 | 中体彩科技发展有限公司 | 体彩业务风险监控系统 |
CN109740934A (zh) * | 2018-12-29 | 2019-05-10 | 深圳前海微众银行股份有限公司 | 运维作业控制方法、装置、设备及计算机可读存储介质 |
CN109885453B (zh) * | 2019-02-18 | 2023-02-28 | 国家计算机网络与信息安全管理中心 | 基于流数据处理的大数据平台监控系统 |
CN111654408B (zh) * | 2020-04-24 | 2023-08-22 | 平安科技(深圳)有限公司 | 设备监控方法、装置、计算机设备和存储介质 |
CN112737821B (zh) * | 2020-12-22 | 2022-05-27 | 新华三大数据技术有限公司 | 数据采集方法及装置 |
CN113141403B (zh) * | 2021-04-21 | 2023-10-17 | 北京天空卫士网络安全技术有限公司 | 一种日志传输方法和装置 |
CN113282464A (zh) * | 2021-06-11 | 2021-08-20 | 中国农业银行股份有限公司 | 日志监控方法及系统 |
CN114666209A (zh) * | 2022-04-29 | 2022-06-24 | 中国银行股份有限公司 | 一种基于多中心的日志监控方法及装置 |
CN115827391A (zh) * | 2023-02-06 | 2023-03-21 | 北京仁科互动网络技术有限公司 | 运行状态监控方法、装置、监控平台以及软件服务系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008154003A3 (en) * | 2007-06-09 | 2009-02-19 | Sensormatic Electronics Corp | System and method for integrating video analytics and data analytics/mining |
CN102984018A (zh) * | 2011-09-02 | 2013-03-20 | 华为技术有限公司 | 以太网丢包测试方法、设备及系统 |
CN104156850A (zh) * | 2014-07-16 | 2014-11-19 | 通联支付网络服务股份有限公司 | 一种实时交易监控系统 |
CN104391781A (zh) * | 2014-10-24 | 2015-03-04 | 苏州阔地网络科技有限公司 | 一种日志信息的处理方法及系统 |
CN104573904A (zh) * | 2014-09-29 | 2015-04-29 | 同济大学 | 网络交易中用户与软件行为监控数据可视化系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8255971B1 (en) * | 2008-03-03 | 2012-08-28 | Jpmorgan Chase Bank, N.A. | Authentication system and method |
-
2016
- 2016-06-20 CN CN201610446928.1A patent/CN105978728B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008154003A3 (en) * | 2007-06-09 | 2009-02-19 | Sensormatic Electronics Corp | System and method for integrating video analytics and data analytics/mining |
CN102984018A (zh) * | 2011-09-02 | 2013-03-20 | 华为技术有限公司 | 以太网丢包测试方法、设备及系统 |
CN104156850A (zh) * | 2014-07-16 | 2014-11-19 | 通联支付网络服务股份有限公司 | 一种实时交易监控系统 |
CN104573904A (zh) * | 2014-09-29 | 2015-04-29 | 同济大学 | 网络交易中用户与软件行为监控数据可视化系统 |
CN104391781A (zh) * | 2014-10-24 | 2015-03-04 | 苏州阔地网络科技有限公司 | 一种日志信息的处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105978728A (zh) | 2016-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105978728B (zh) | 智能监控系统及业务指标的监控方法 | |
CN106453125B (zh) | 一种基于实时负载率的远程服务调用负载均衡系统 | |
CN105281981B (zh) | 网络服务的数据流量监控方法和装置 | |
CN101741615B (zh) | 基于服务器的告警过滤系统及方法 | |
CN108322345A (zh) | 一种故障修复数据包的发布方法及服务器 | |
CN109819057A (zh) | 一种负载均衡方法及系统 | |
CN101098469A (zh) | 图像处理系统及其服务器和图像处理方法 | |
CN108805704A (zh) | 区块链业务实现方法、监听设备、存储介质及系统 | |
CN108399114A (zh) | 一种系统性能测试方法、装置及存储介质 | |
CN109067597A (zh) | 一种分布式系统动态智能服务治理方法 | |
CN106161135B (zh) | 业务交易故障分析方法及装置 | |
CN107168853A (zh) | 一种服务器性能信息获取方法、系统和基板控制管理器 | |
CN101715192B (zh) | 滤除垃圾电话的方法、装置和系统 | |
CN105554320B (zh) | 呼叫中心话务量的监控方法及系统 | |
CN109669835A (zh) | MySQL数据库监控方法、装置、设备及可读存储介质 | |
CN108021485A (zh) | 应用程序运行状态的监控方法及装置 | |
CN106802864A (zh) | 一种基于金融系统的测试方法及装置 | |
CN106095638A (zh) | 一种服务器资源告警的方法、装置及系统 | |
CN115914539A (zh) | 音视频设备资源调度的方法及系统 | |
CN106603467A (zh) | 网络应用管理方法、装置及终端 | |
CN107317862A (zh) | 连锁终端系统、分布式管理方法及管理共享设备的系统 | |
CN103188730B (zh) | 系统资源负荷调节系统、方法及装置、调节服务器设备 | |
CN106682813A (zh) | 一种用户工作状态的确定方法及终端 | |
CN100518343C (zh) | 对点对点短消息话单处理速度进行动态调整的方法 | |
CN109657893A (zh) | 业务数据分配方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |