CN112269727A - 一种基于日志信息的监控告警方法及系统 - Google Patents
一种基于日志信息的监控告警方法及系统 Download PDFInfo
- Publication number
- CN112269727A CN112269727A CN202011158011.4A CN202011158011A CN112269727A CN 112269727 A CN112269727 A CN 112269727A CN 202011158011 A CN202011158011 A CN 202011158011A CN 112269727 A CN112269727 A CN 112269727A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- logs
- log
- log information
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 8
- 238000013480 data collection Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000006872 improvement Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种基于日志信息的监控告警的方法及系统,涉及系统数据监控技术领域,包括监控系统、统计单元以及存储单元,所述监控系统、统计单元以及存储单元之间电性连接,所述统计单元用于收集统计各个应用服务器的日志,所述存储单元用于存储完成统计的日志,所述监控系统用于监控存储单元内的日志并实现告警,本发明支持短信、企业微信以及邮箱等多种告警方式,确保及时准确通知到系统所属负责人员,及时告警,部分风险可实现事前预警,及时处理便能避免风险事故发生。
Description
技术领域
本发明涉及系统数据监控技术领域,具体来说,涉及一种基于日志信息的监控告警方法及系统。
背景技术
软件系统在生产运营使用过程中,难免会出现突发的系统异常,业务阻塞,性能瓶颈,应用服务宕机等高风险事故,依赖传统的运维监控手段,只能监控到应用端口可用,流量冲击,网络攻击等基础监控项,且可能需依赖多种服务设施才能实现多维度的监控,无法精准的实现对软件系统本身缺陷、异常、服务交互情况、交易失败情况等的统计,只能在风险发生后通过业务、市场或者运维人员等其他渠道反馈至开发人员,再通过开发人员去查看软件运行日志定位风险来源,会存在定位过程耗时长,定位不够全面等问题,扩大了异常事件对整个市场的影响,增加了使用者的风险,容易对使用者的市场信誉造成不良影响。
发明内容
为了克服现有技术的不足,本发明的一种基于日志信息的监控告警方法及系统,能够及时捕捉到系统的运行日志情况并通知运维人员。
本发明解决其技术问题所采用的技术方案是:一种基于日志信息的监控告警方法,其改进之处在于,包括下列步骤:
步骤一:采集应用服务器运行的日志并输出日志至统计模块;
步骤二:统计模块接收日志,并将统计后的日志存储于存储单元;
步骤三:监控系统监控存储单元存储的日志,按照日志格式进行监控内容格式化并分类汇总,展示各个监控维度下监控结果并项目配置通知联系人,实现告警。
作为上述技术方案的改进,采集日志时采用异步处理方式进行采集和输出日志。
作为上述技术方案的进一步改进,所述采集应用服务器运行的日志前,编写用于支持对常用内容进行监控的工具包。
作为上述技术方案的进一步改进,常用内容包括sql耗时和异常、url耗时以及dubbo服务调用耗时。
作为上述技术方案的进一步改进,工具包需对sql耗时和异常、url耗时以及dubbo服务调用耗时进行标记。
作为上述技术方案的进一步改进,标记的方法包括java中的切面和拦截器的任意一种。
作为上述技术方案的进一步改进,标记后需要对监控的内容按照统一格式进行日志输出。
作为上述技术方案的进一步改进,步骤二中,统计单元通过filbeat采集各个应用服务器的监控日志并发送到消息队列kafaka,然后用logstash去获取,利用filter功能过滤分析,然后将日志存储到存储单元中,实现对监控内容的数据收集。
作为上述技术方案的进一步改进,存储内容包括监控内容的统计报表和监控日志详情。
一种基于日志信息的监控告警系统,其改进之处在于,包括监控系统、统计单元以及存储单元,所述监控系统、统计单元以及存储单元之间电性连接;
所述统计单元用于收集统计各个应用服务器的日志;
所述存储单元用于存储完成统计的日志;
所述监控系统用于监控存储单元内的日志并实现告警。
本发明的有益效果是:
1、监控内容精准,监控力度足够细,支持自由定制监控内容,可以对所有可能的业务及系统风险点进行监控统计;
2、支持短信、企业微信以及邮箱等多种告警方式,确保及时准确通知到系统所属负责人员,及时告警,部分风险可实现事前预警,及时处理便能避免风险事故发生;
3、准实时监控,监控信息在业务运行过程中即能触发写入,并且及时对日志信息进行异步化处理,基本不影响业务的执行,对现有系统的入侵较小,避免因为监控而带来其他风险;
4、高可用性,不依赖于应用所在服务器运行,即使应用所在环境发生硬件损坏,不会影响整个监控系统的使用。
附图说明
图1为本发明的监控系统日志采集流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。另外,专利中涉及到的所有联接/连接关系,并非单指构件直接相接,而是指可根据具体实施情况,通过添加或减少联接辅件,来组成更优的联接结构。本发明创造中的各个技术特征,在不互相矛盾冲突的前提下可以交互组合。
参考图1,本发明揭示了一种基于日志信息的监控告警方法,包括下列步骤:
步骤一:采集应用服务器运行的日志并输出日志至统计模块;
步骤二:统计模块接收日志,并将统计后的日志存储于存储单元;
步骤三:监控系统监控存储单元存储的日志,按照日志格式进行监控内容格式化并分类汇总,展示各个监控维度下监控结果并项目配置通知联系人,实现告警。
在上述实施例中,本发明先对各个应用服务器进行日志采集,采集后的日志经过统计单元进行统计分析,分析后的日志存储于存储单元,监控系统对存储进存储单元的日志进行分类汇总,展示各个监控维度下监控结果并项目配置通知联系人,实现告警,本发明监控内容精准,监控力度足够细,支持自由定制监控内容,可以对所有可能的业务及系统风险点进行监控统计,而且支持短信、企业微信以及邮箱等多种告警方式,确保及时准确通知到系统所属负责人员,及时告警,部分风险可实现事前预警,及时处理便能避免风险事故发生。
进一步的,所述采集应用服务器运行的日志前,编写用于支持对常用内容进行监控的工具包。常用内容包括sql耗时和异常、url耗时以及dubbo服务调用耗时。工具包需对sql耗时和异常、url耗时以及dubbo服务调用耗时进行标记。标记的方法包括java中的切面和拦截器的任意一种。标记后需要对监控的内容按照统一格式进行日志输出。url为统一资源定位符,是对可以从互联网上得到资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。sql是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
在上述实施例中,监控的日志内容应该具备针对性,应与正常业务日志内容做区分。因此编写统一的监控日志采集工具包在项目中引用,工具包默认支持对常用内容的监控,如url耗时、sql耗时及异常、dubbo服务调用耗时等进行拦截标记,标记实现原理为通过编程语言的特性,如java中的切面,拦截器等机制,对监控的内容按照统一格式进行日志输出(如对url监控,则输出监控类型、URL地址、来源ip、当前ip、耗时、异常、当前应用名、备注信息等),通过利用logback开源日志组件等日志框架的特性,将监控内容输出至单独文件,与业务日志做区分,本发明准实时监控,监控信息在业务运行过程中即能触发写入,并且及时对日志信息进行异步化处理,基本不影响业务的执行,对现有系统的入侵较小,避免因为监控而带来其他风险。
监控包中包含工具方法,可支持开发人员自定义控制监控内容,对各个返回码进行监控,则可在接口出入口调用监控方法,自定义监控类型:返回码监控,并个性化编辑监控项详情,如拼接交易流水号等详情内容,便于后期告警时定位具体交易。为了尽可能减少对业务的影响,采集日志时需要对消息进行异步处理。即业务线程采集及输出日志,利用线程本地变量进行高并发下的日志输出,以达到在线程安全的前提下尽可能的资源低消耗以及低延时。
再进一步的,步骤二中,统计单元通过filbeat采集各个应用服务器的监控日志并发送到消息队列kafaka,然后用logstash去获取,利用filter功能过滤分析,然后将日志存储到存储单元中,实现对监控内容的数据收集。
在上述实施例中,当对应用引入监控日志采集后,各应用服务器,伴随正常业务进行均会不断输出监控文件,需有单独监控系统管理端,对应用输出的监控日志进行集中分析,并做界面化,图形化等展示。日志采集,需将客户端应用日志,采集至监控系统的服务端,为了达到实时的目的以及适应高并发的情况,用日志采集工具filbeat即可,filebeat更轻量,占用资源更少,通过filbeat采集各服务器监控日志发送到消息队列kafaka,然后用logstash去获取,利用filter功能过滤分析,然后存储到文件系统中,实现对监控内容的数据收集,
另外,存储内容包括监控内容的统计报表和监控日志详情。
监控内容的统计报表:报表是根据logview实时运算出来的给业务分析用的报表,默认报表支持按小时模式、按天、按周、按月。
监控日志详情:详情存储涉及系统请求较大,日志量多的情况,为了进行监控记录的收集,采用文件存储系统形式,每个消息产生时都对应一个唯一的消息id,在写数据一份是Index文件,一份是Data文件,Data文件用分段GZIP进行压缩。读取消息的时候,首先根据消息的唯一索引文件(在文件中随机存取记录,需要知道记录的地址。例如,一个客户想要查询银行账户,客户和出纳员都不知道客户记录的地址,客户只能给出纳员自己的帐号(键)。这里,索引文件可以把帐号和记录地址关联起来),然后将数据文件进行GZIP解压,再读取出真正的消息内容。本发明的系统具有高可用性,不依赖于应用所在服务器运行,即使应用所在环境发生硬件损坏,不会影响整个监控系统的使用。
一种基于日志信息的监控告警系统,包括监控系统、统计单元以及存储单元,所述监控系统、统计单元以及存储单元之间电性连接;
所述统计单元用于收集统计各个应用服务器的日志;
所述存储单元用于存储完成统计的日志;
所述监控系统用于监控存储单元内的日志并实现告警。
在上述实施例中,本发明先对各个应用服务器进行日志采集,采集后的日志经过统计单元进行统计分析,分析后的日志存储于存储单元,监控系统对存储进存储单元的日志进行分类汇总,展示各个监控维度下监控结果并项目配置通知联系人,实现告警,本发明监控内容精准,监控力度足够细,支持自由定制监控内容,可以对所有可能的业务及系统风险点进行监控统计,而且支持短信、企业微信以及邮箱等多种告警方式,确保及时准确通知到系统所属负责人员,及时告警,部分风险可实现事前预警,及时处理便能避免风险事故发生。
本发明的有益效果是:
1、监控内容精准,监控力度足够细,支持自由定制监控内容,可以对所有可能的业务及系统风险点进行监控统计;
2、支持短信、企业微信以及邮箱等多种告警方式,确保及时准确通知到系统所属负责人员,及时告警,部分风险可实现事前预警,及时处理便能避免风险事故发生;
3、准实时监控,监控信息在业务运行过程中即能触发写入,并且及时对日志信息进行异步化处理,基本不影响业务的执行,对现有系统的入侵较小,避免因为监控而带来其他风险;
4、高可用性,不依赖于应用所在服务器运行,即使应用所在环境发生硬件损坏,不会影响整个监控系统的使用。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围。
Claims (10)
1.一种基于日志信息的监控告警方法,其特征在于,包括下列步骤:
步骤一:采集应用服务器运行的日志并输出日志至统计模块;
步骤二:统计模块接收日志,并将统计后的日志存储于存储单元;
步骤三:监控系统监控存储单元存储的日志,按照日志格式进行监控内容格式化并分类汇总,展示各个监控维度下监控结果并项目配置通知联系人,实现告警。
2.根据权利要求1所述的一种基于日志信息的监控告警方法,其特征在于,采集日志时采用异步处理方式进行采集和输出日志。
3.根据权利要求1所述的一种基于日志信息的监控告警方法,其特征在于,所述采集应用服务器运行的日志前,编写用于支持对常用内容进行监控的工具包。
4.根据权利要求3所述的一种基于日志信息的监控告警方法,其特征在于,常用内容包括sql耗时和异常、url耗时以及dubbo服务调用耗时。
5.根据权利要求4所述的一种基于日志信息的监控告警方法,其特征在于,工具包需对sql耗时和异常、url耗时以及dubbo服务调用耗时进行标记。
6.根据权利要求5所述的一种基于日志信息的监控告警方法,其特征在于,标记的方法包括java中的切面和拦截器的任意一种。
7.根据权利要求6所述的一种基于日志信息的监控告警方法,其特征在于,标记后需要对监控的内容按照统一格式进行日志输出。
8.根据权利要求1所述的一种基于日志信息的监控告警方法,其特征在于,步骤二中,统计单元通过filbeat采集各个应用服务器的监控日志并发送到消息队列kafaka,然后用logstash去获取,利用filter功能过滤分析,然后将日志存储到存储单元中,实现对监控内容的数据收集。
9.根据权利要求8所述的一种基于日志信息的监控告警方法,其特征在于,存储内容包括监控内容的统计报表和监控日志详情。
10.一种基于日志信息的监控告警系统,其特征在于,包括监控系统、统计单元以及存储单元,所述监控系统、统计单元以及存储单元之间电性连接;
所述统计单元用于收集统计各个应用服务器的日志;
所述存储单元用于存储完成统计的日志;
所述监控系统用于监控存储单元内的日志并实现告警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158011.4A CN112269727A (zh) | 2020-10-26 | 2020-10-26 | 一种基于日志信息的监控告警方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158011.4A CN112269727A (zh) | 2020-10-26 | 2020-10-26 | 一种基于日志信息的监控告警方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112269727A true CN112269727A (zh) | 2021-01-26 |
Family
ID=74341440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011158011.4A Withdrawn CN112269727A (zh) | 2020-10-26 | 2020-10-26 | 一种基于日志信息的监控告警方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112269727A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051138A (zh) * | 2021-04-30 | 2021-06-29 | 中国银行股份有限公司 | 基于Dubbo服务接口的日志分析装置及方法 |
CN113190415A (zh) * | 2021-05-27 | 2021-07-30 | 北京京东拓先科技有限公司 | 互联网医院系统监控方法、设备、存储介质及程序产品 |
CN116228248A (zh) * | 2023-05-09 | 2023-06-06 | 建信金融科技有限责任公司 | 一种金融业务的风险控制方法和装置 |
-
2020
- 2020-10-26 CN CN202011158011.4A patent/CN112269727A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051138A (zh) * | 2021-04-30 | 2021-06-29 | 中国银行股份有限公司 | 基于Dubbo服务接口的日志分析装置及方法 |
CN113190415A (zh) * | 2021-05-27 | 2021-07-30 | 北京京东拓先科技有限公司 | 互联网医院系统监控方法、设备、存储介质及程序产品 |
CN116228248A (zh) * | 2023-05-09 | 2023-06-06 | 建信金融科技有限责任公司 | 一种金融业务的风险控制方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112269727A (zh) | 一种基于日志信息的监控告警方法及系统 | |
CN107992398B (zh) | 一种业务系统的监控方法和监控系统 | |
US7778979B2 (en) | Method and apparatus for compressing log record information | |
US20050060372A1 (en) | Techniques for filtering data from a data stream of a web services application | |
CN108197261A (zh) | 一种智慧交通操作系统 | |
CN111581054A (zh) | 一种基于elk的日志埋点的业务分析告警系统及方法 | |
CN111339175B (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
US10007571B2 (en) | Policy based dynamic data collection for problem analysis | |
CN107229556A (zh) | 基于elastic组件的日志分析系统 | |
WO2007036932A2 (en) | Data table management system and methods useful therefor | |
CN109542750A (zh) | 分布式日志系统 | |
CN111752808A (zh) | 一种用于数据共享交换业务运行监控系统的实现方法 | |
CN115988028A (zh) | 基于物联网技术的lng加气站实时安全监控系统 | |
US20020026433A1 (en) | Knowledge system and methods of business alerting and business analysis | |
CN114090529A (zh) | 一种日志管理方法、装置、系统和存储介质 | |
CN116010190A (zh) | 一种esb服务监控管理系统及方法 | |
CN111143304B (zh) | 一种基于请求链路的微服务系统异常日志分析方法 | |
CN115766527A (zh) | 信创环境下基于api网关进出流量的业务化分析系统及其方法 | |
CN110113208A (zh) | 报警信息处理方法、装置、设备及计算机可读存储介质 | |
CN115185710A (zh) | 一种交易接口耗时统计与预警的方法 | |
CN113434366A (zh) | 一种事件处理方法和系统 | |
CN113342619A (zh) | 日志监控方法、系统、电子设备及可读介质 | |
CN113760669A (zh) | 问题数据的告警方法及装置、电子设备、存储介质 | |
CN110413496B (zh) | 一种实现电子证照运行数据组件化收集的方法 | |
CN114020893A (zh) | 一种基于分布式存储的日志检索方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210126 |
|
WW01 | Invention patent application withdrawn after publication |