CN105574205A - 分布式计算环境的日志动态分析系统 - Google Patents

分布式计算环境的日志动态分析系统 Download PDF

Info

Publication number
CN105574205A
CN105574205A CN201610030483.9A CN201610030483A CN105574205A CN 105574205 A CN105574205 A CN 105574205A CN 201610030483 A CN201610030483 A CN 201610030483A CN 105574205 A CN105574205 A CN 105574205A
Authority
CN
China
Prior art keywords
daily record
log
copy
real
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610030483.9A
Other languages
English (en)
Other versions
CN105574205B (zh
Inventor
蒋破荒
卢波
陈毅波
陈乾
林蓉
徐建明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hunan Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201610030483.9A priority Critical patent/CN105574205B/zh
Publication of CN105574205A publication Critical patent/CN105574205A/zh
Application granted granted Critical
Publication of CN105574205B publication Critical patent/CN105574205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/183Provision of network file services by network file servers, e.g. by using NFS, CIFS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/161Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields
    • H04L69/162Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields involving adaptations of sockets based mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种分布式计算环境的日志动态分析系统,包括网关-日志生成代理服务、日志传输服务、日志收集控制器、实时流处理服务和日志数据分析接口;网关-日志生成代理服务用于日志定位、生成副本并传输给日志传输服务;日志传输服务将副本传输给日志收集控制器;日志收集控制器将接收的日志副本进行存储;实施流处理服务将日志信息进行实时计算和特征匹配,生成流式处理的数据信息和异常统计信息;日志数据分析接口用于对用户提供实时数据分析结果的查询接口。本发明为分布式计算环境中的每个节点提供数据追踪、监控、用户行为轨迹、功能测试覆盖率等服务,能够处理各类日志文件,并且利用实时数据进行实时日志分析、处理和监控。

Description

分布式计算环境的日志动态分析系统
技术领域
本发明具体涉及一种分布式计算环境的日志动态分析系统。
背景技术
电力领域中应用的计算机系统在运行会产生大量的系统日志,其中包括了设备固件中的运行日志、数据库日志、应用软件日志、监控平台日志等,这些日志在不断持续增长并以各自不同的形式定义其日志结构和描述信息。如果计算机系统发生异常,会产生上述各种日志文件中的联动记录,造成海量日志难以快速定位分析,诊断信息千丝万缕,难以定位故障源头,造成故障修复困难,导致生产服务失效的风险。为了提高运维质量,满足运维工作中稳定高效技术保障的要求,通常需要运维人员具备较高的日志分析水平。由于传统日志处理技术适用面窄,日志处理内容数据量大,导致面对持续增长的日志内容无法进行快速有效的日志分析处理。
日志动态分析技术是日志处理技术中的一个高级实现,是用于将海量的、持续增长的日志内容进行实时计算、动态处理、异步数据分析的一种方法,它适用于分布式计算环境中通用的应用服务集群、数据库集群等常见部署架构中,它能够识别并捕获应用软件日志、数据库日志、文件型日志等,并采用专门的方法对持续增长的日志内容中进行实时流式处理、并提供针对用户行为日志等非结构化日志的异步离线分析处理,形成一个适用面广、处理海量日志的数据分析架构。但是现有的日志动态分析技术大部分采用顺序批处理方式进行,这种处理方式无法适用各种类型日志文件,其处理分析机制属于事后分析,在实时性方面无法得到保障,在事前预警需求方面无法满足需求。
发明内容
本发明的目的在于提供一种能够处理各种类型日志文件、并且利用实时数据进行实时日志分析、处理和监控的分布式计算环境的日志动态分析系统。
本发明提供的这种分布式计算环境的日志动态分析系统,包括网关-日志生成代理服务、日志传输服务、日志收集控制器、实时流处理服务和日志数据分析接口;网关-日志生成代理服务用于计算机系统的日志定位以及重新生成日志副本,并将日志副本传输给日志传输服务;日志传输服务用于将网关-日志生成代理服务生成的日志副本传输给日志收集控制器;日志收集控制器用于将接收的日志副本进行存储;实施流处理服务将日志收集控制器收集的日志信息进行实时计算和特征匹配,生成流式处理的数据信息和异常统计信息;日志数据分析接口用于对分布式计算环境的日志动态分析系统的用户提供实时数据分析结果的查询接口。
所述的网关-日志生成代理服务包括代理通讯协议模块和日志收集压缩模块;代理通讯协议模块为支持TCP/IP网络协议、Socket安全套接字和IPX数据交换协议的通讯接口,日志收集压缩部分包含用于获取日志的重定向模块和日志压缩模块:获取日志的重定向模块将日志发生计算机上的日志源进行重定向输出,形成日志副本,将此日志副本传输给日志压缩模块。
所述的重定向输出包括如下步骤:
S1.日志定位:通过扫描日志发生计算机上的文件系统、系统注册表信息,获取日志的文件路径、通过注册表匹配机制确认日志类型,定位日志文件所在的位置;
S2.重定向生成日志副本:当步骤S1完成日志定位后,对日志发生对象进行日志文件获取、并构建生成日志副本的发生器进程,副本的生成方式与日志发生对象的日志类型对应。
所述的副本的生成方式包括文件型日志副本生成方式、设备日志副本生成方式、应用软件日志副本生成方式和数据库日志的副本生成方式;文件型日志副本通过文件复制的方式完成副本生成,设备日志副本通过单独的进程获取设备固件的日志数据提取方式生成,应用软件日志副本生成方式通过开源日志工具log4j开发者工具、Verbose调试开关接口的输出文件提取生成,数据库日志副本生成方式为通过代理程序读取数据库DML日志记录和数据表进行行记录连续读取、抄送给副本的方式生成。
所述的日志传输服务包括如下步骤:
S1.若日志副本为文件型日志副本和应用软件日志副本,则建立异步消息处理机制:将重定向生成日志副本文件按照消息队列的方式进行封装、并通过设置包括消息队列深度、消息分段在内的参数将副本文件截取为每一个消息控制在4M大小的消息段,通过消息传输队列的JMS进程连接日志收集控制器的消息接收队列进程中;传输过程采用消息压缩、分段提交、接收解压三个步骤完成;
S2.若日志副本为数据库型日志副本,则建立连续数据捕获机制:读取日志副本行记录,记录每一个增删改和事务操作,将每一个记录封装为一个SQL指令,通过TCP/IP协议将这些指令传递给日志收集控制器,日志收集控制器收到SQL指令后,进行解析处理。
所述的实时流处理服务包括实时计算控制器、通知服务、异常统计、实时结果展示、时间戳、日志解析器和日志搜索器;实时计算控制器用于处理消息并完成实时计算,通过实时计算实现对不断增长的日志信息的业务数据进行统计与分析;通知服务通过配置日志解析器中的通知触发器进行监控警告服务,并能够提供符合SNMPv3协议的MIB库进行通知服务;异常统计用于对日志中的错误、警告信息进行标记,并对错误类型和范围通过数据字典进行标记分类,根据分类号和标记编号对日志错误和警告进行统计、排序;实时结果展示通过对实时计算的日志信息和异常统计信息进行实时显示;时间戳是实时计算过程中,为了对日志事件进行时间定义的一个有效方法,时间戳用于通过同步位于实时流处理服务的时间服务进程来统一各个计算资源组的系统时间,保证日志动态分析过程中的时间一致性;日志解析器用于将实时计算结果按照配置解析规则进行筛选,并对日志副本中包含的代码字符利用数据字典功能进行自定义的对应转换;日志搜索器用于动态分析过程中进行日志搜索。
本发明采用软件嵌入分布式计算环境实现,为分布式计算环境中的每个计算节点提供访问日志、系统日志、业务数据日志的收集、并针对这三种日志类型分别应用不同的处理方式来满足日志结构差异化和海量增长的数据量,同时将日志动态收集后的数据进行集中处理、通过封装了日志收集层在分布式计算环境的各个节点的通讯协议和处理方法,来执行数据分级、异常统计、通知服务、实时结果展示,然后利用实时数据分析层的处理结果结合外部业务系统提供的日志密集型应用功能实现的功能通用接口,提供数据动态追踪、系统监控、用户行为轨迹、功能测试覆盖率等能力,为改进业务系统的精准日志数据多源性、建立全面统计模型提供参考依据。本发明能够处理各种类型日志文件,并且利用实时数据进行实时日志分析、处理和监控。
附图说明
图1为本发明的系统结构示意图。
图2为本发明的日志收集的实现流程示意图。
具体实施方式
如图1所示为本发明的系统结构示意图:本发明提供的这种分布式计算环境的日志动态分析系统,基于分布式测试环境建立的,所述分布式计算环境是基于TCP/IP协议连接的分布在多个计算机组的提供网关、计算服务、存储服务、业务应用逻辑服务的服务器资源组。该系统包括网关-日志生成代理服务、日志传输服务、日志收集控制器、实时流处理服务和日志数据分析接口。
其中,其中网关-日志生成代理服务是一个运行在日志发生计算机上的代理服务程序,该服务程序由代理通讯协议和日志收集压缩两个部分组成。代理通讯协议部分被设计为能够支持TCP/IP网络协议,Socket安全套接字,IPX数据交换协议的通讯接口。日志收集压缩部分包含两个主要模块,分别是用于获取日志的重定向模块和日志压缩模块。获取日志的重定向模块是将日志发生计算机上的日志源进行重定向输出,形成日志副本,将此日志副本传输给代理服务的日志压缩模块,重定向输出过程包括对代理服务所在计算机的网络访问日志、操作系统日志、应用软件日志、网关设备日志、数据库DML操作日志等进行日志定位、重定向生成日志副本两个步骤;
步骤1)日志定位,代理服务程序通过扫描日志发生计算机上的文件系统、系统注册表信息,获取日志的文件路径、通过注册表匹配机制确认日志类型,定位日志文件所在的位置。
步骤2)重定向生成日志副本,当步骤1)完成日志定位后,通过依赖性服务注入、渗透测试、进程监控等系统级编程技术对日志发生对象进行日志文件获取、并构建生成日志副本的发生器进程,副本的生成方式根据日志发生对象的日志类型来对应不同的生成方式,文件型日志通过文件复制的方式完成副本生成,设备日志的副本生成方式通过单独的进程获取设备固件的日志数据提取方式,应用软件日志的副本生成方式通过开源日志工具log4j开发包、Verbose调试开关等调试接口的输出文件提取而成,数据库日志的副本生成方式通过代理程序读取数据库DML日志记录和数据表进行行记录连续读取、抄送给副本的方式完成。
日志传输服务,是将网关-日志生成代理服务中步骤2)的重定向生成的日志副本传输给日志收集控制器。由于日志副本有多种类型及数据结构,无法采用直接文件复制的方式让日志收集控制器获取日志副本,需要一种特殊的传输方法来完成各种日志副本的统一传输,日志传输服务通过网络连接,在TCP/IP网络协议,Socket安全套接字,IPX数据交换协议的基础上封装日志文件副本,采用两种传输步骤来完成日志传输服务功能。
步骤1)建立异步消息处理机制,该步骤将日志副本通过消息处理机制来实现日志传输,消息处理机制主要处理文件型日志副本、应用软件日志副本,将重定向生成日志副本文件按照消息队列的方式进行封装、并通过设置消息队列深度、消息分段等参数将副本文件截取为每一个消息控制在4M大小的消息段,通过消息传输队列的JMS进程连接日志收集控制器的消息接收队列进程中,传输采用消息压缩、分段提交、接收解压三个动作完成。由于消息处理机制是异步通信模式、消息压缩可以减小副本文件大小、分段提交能够减缓网络带宽占用、接收解压能够保证消息的完整性和一致性。从而解决日志副本文件传输网络带宽占用高、传输过程防篡改、异步处理对网关-日志生成服务性能冲击的难题。
步骤2)建立连续数据捕获机制,该步骤主要面向数据库型的日志副本,连续数据捕获机制是准实时型的、延迟低、吞吐量大的日志传输服务方法。数据库日志是线性日志类型,会不断增长,日志文件较大。数据库日志中记录了数据库DML语句的各种数据增删改信息以及事务操作信息。当网关-日志生成服务定位了数据库日志后,并生成日志副本,由于该日志副本是关系型数据库的日志格式,需要一种数据传输服务来将代理服务捕获的日志变化情况应用到日志收集控制器中,建立连续数据捕获机制的方法是读取日志副本行记录,由于数据库日志副本是持续增长的,我们记录每一个增删改和事务操作,将每一个记录封装为一个SQL指令,通过TCP/IP协议将这些指令传递给日志收集控制器,日志收集控制器收到SQL指令后,进行解析处理。数据库日志副本尽管持续增长,但连续数据捕获机制也持续进行记录和SQL指令转换,并发送SQL指令到日志收集控制器,SQL指令封装的是文本类型,数据包较小、占用网络带宽资源少,日志收集控制器根据SQL指令进行处理解析,重新在日志收集控制器中的数据库日志分析模块中执行该SQL指令,从而达到数据传输完成的目的。
日志收集控制器是日志动态分析方法的数据来源,它通过网关-日志生成服务收集各种类型的日志,通过日志传输服务将不同数据结构的日志以一种统一的数据格式提交给位于日志收集控制器的存储空间中,日志收集控制器定义该存储空间的使用规则,并形成文件型日志控制器、消息型日志控制器和数据库型日志控制器。日志收集的实现流程如图2所示,用开源数据采集工具Fluentd的方式收集日志,通过Fluentd实时采集到日志收集控制器,将实时采集数据存放位于日志收集控制器中MongoDB的CappedCollection中。通过调用开源日志处理库Log4jAppend采集系统应用层的数据和非结构化的一些实时数据(比如页面的点击数)。部分行为日志会将实时数据采集到MongoDB的CappedCollection。接下来是Schedule,线程定时扫描收集到得日志进行分析统计,在同一个Schedule里面会存三份数据,一份存到Result作为统计结果,一份数据存到分布式文件系统,主要作为离线的数据预演,还有一份保存到日志搜索器主要用来实时查数据、统计数据和验证数据。
实时流处理服务,是系统日志动态分析方法的核心部分,它将日志收集控制器收集的日志信息进行实时计算与特征匹配,以XML格式统一生成流式处理的数据信息,并定义触发器形成日志特征驱动的异常统计信息,通过各个功能模块将日志动态分析的过程完整实现。它包含7个功能模块,分别是实时计算控制器、通知服务、异常统计、实时结果展示、时间戳、日志解析器和日志搜索器。
实时计算控制器可以用来处理源源不断流进来的消息并完成实时计算,通过实时计算实现对不断增长的日志信息中关心的业务数据进行统计与分析,并通过实时结果展示进行日志展示,由于处理的日志增长量是持续的,数据量巨大,在设计实时计算控制器的时候需要充分考虑计算资源均衡的特点。
Spout将每条原始日志标准化,按照URL分组(fieldsGrouping,为保持每台服务器计算量的均匀),派发到对应的Stat_bolt上;
Stat_bolt是主要的计算Bolt,将每个业务的URL梳理并计算,如PV、UV、总响应时间、后端响应时间、HTTP状态码统计、URL排序、流量统计等;
Merge_bolt将每个业务的数据合并,如PV数,UV数等。当然,这里的UV合并就用到了前面提到的基数计数;
构建一个Coordinator协调类,将流式处理StreamID标记为“coordinator”,作用是为了进行时间协调(切分batch)、检查任务完成度、超时处理。
实现一个Scheduler通过日志收集控制器(3)获取参数,动态调整Spout、Bolt在各服务器的分布,以便灵活分配计算资源。
通知服务是实时流处理服务的重要功能,它通过配置日志解析器中的通知触发器进行监控警告服务,并能够提供符合SNMP协议的MIB库进行通知服务,通知方式包括邮件通知和消息通知。
异常统计按照日志解析器中对日志内容进行批处理,对日志中的错误、警告信息进行标记,并对错误类型和范围通过数据字典进行标记分类,根据分类号和标记编号对日志错误和警告进行统计、排序。提供统计和排序查询接口供实时结果展示进行日志展示。
实时结果展示通过对实时计算的日志信息和异常统计信息进行实时显示,通过调用操作系统GDI绘制函数进行结果展示,展示方式有表格视图、统计视图和仪表盘方式。
时间戳是实时计算过程中,为了对日志事件进行时间定义的一个有效方法,时间戳被应用于分布式环境中的时间服务进程中,在整个日志动态分析环境的所有计算资源的时间均以时间服务器为准,在分布式环境中,时间戳精确到毫秒,通过同步位于实时流处理服务的时间服务进程来统一分布式环境中的各个计算资源组的系统时间,保证日志动态分析过程中的时间一致性。
日志解析器将实时计算控制器所描述的实时计算结果按照配置解析规则进行筛选,并对日志副本中包含的大量具有特殊意义的代码字符,利用数据字典功能进行自定义的对应转换,使日志更易读,分析更容易。日志解析器被设计为数据字典匹配模式,通过定义数据字典中的日志特征与解析方式的对应关系,让日志解析器能够解决海量持续增长的的日志内容带来的日志特征解析问题。
日志搜索器是为了用于动态分析过程中进行日志搜索,日志搜索器提供了四种方式检索日志,可以快速过滤并找到相关的结果,日志搜索器的四种方式包括范围查询、正则表达式、布尔值和字段过滤。范围查询,可快速发现满足一定条件参数的事件,例如检索Web服务器响应时间大于200ms的事件。正则表达式:可以定义查询模版来简化你的搜索输入,假如你有一批名为app01至app99机器,如果你只想搜索前30台,你可以输入“/app[0-2][0-9]/”来简化搜索输入。布尔值3):利用AND、OR、NOT和()的组合,您可以自由构造各种复杂的组合查询语句。字段过滤快速显示您所有结构化/半结构化特殊字段的统计聚合,点击其中的字段值进行过滤操作,可快速缩小事件的查询范围。结构化日志如JSON,可自动解析日志中相关字段和对应值;对主流非结构化日志通过日志解析器实现了自动解析和全文检索。
日志数据分析接口是系统日志动态分析方法中实时数据分析层将数据分析的内部方法暴露给日志分析平台层的应用程序接口。日志分析平台层通过应用程序接口对结构化和非结构话的日志进行实时流处理和异步离线SQL处理,将其处理结果通过外部应用系统的形式提供给所需的动态分析结果,包括唯一值,中间数据,统计指标,模型。

Claims (6)

1.一种分布式计算环境的日志动态分析系统,其特征在于包括网关-日志生成代理服务、日志传输服务、日志收集控制器、实时流处理服务和日志数据分析接口;网关-日志生成代理服务用于计算机系统的日志定位以及重新生成日志副本,并将日志副本传输给日志传输服务;日志传输服务用于将网关-日志生成代理服务生成的日志副本传输给日志收集控制器;日志收集控制器用于将接收的日志副本进行存储;实施流处理服务将日志收集控制器收集的日志信息进行实时计算和特征匹配,生成流式处理的数据信息和异常统计信息;日志数据分析接口用于对分布式计算环境的日志动态分析系统的用户提供实时数据分析结果的查询接口。
2.根据权利要求1所述的分布式计算环境的日志动态分析系统,其特征在于所述的网关-日志生成代理服务包括代理通讯协议模块和日志收集压缩模块;代理通讯协议模块为支持TCP/IP网络协议、Socket安全套接字和IPX数据交换协议的通讯接口,日志收集压缩部分包含用于获取日志的重定向模块和日志压缩模块:获取日志的重定向模块将日志发生计算机上的日志源进行重定向输出,形成日志副本,将此日志副本传输给日志压缩模块。
3.根据权利要求2所述的分布式计算环境的日志动态分析系统,其特征在于所述的重定向输出包括如下步骤:
S1.日志定位:通过扫描日志发生计算机上的文件系统、系统注册表信息,获取日志的文件路径、通过注册表匹配机制确认日志类型,定位日志文件所在的位置;
S2.重定向生成日志副本:当步骤S1完成日志定位后,对日志发生对象进行日志文件获取、并构建生成日志副本的发生器进程,副本的生成方式与日志发生对象的日志类型对应。
4.根据权利要求3所述的分布式计算环境的日志动态分析系统,其特征在于所述的副本的生成方式包括文件型日志副本生成方式、设备日志副本生成方式、应用软件日志副本生成方式和数据库日志的副本生成方式;文件型日志副本通过文件复制的方式完成副本生成,设备日志副本通过单独的进程获取设备固件的日志数据提取方式生成,应用软件日志副本生成方式通过开源日志工具log4j开发者工具、Verbose调试开关接口的输出文件提取生成,数据库日志副本生成方式为通过代理程序读取数据库DML日志记录和数据表进行行记录连续读取、抄送给副本的方式生成。
5.根据权利要求1所述的分布式计算环境的日志动态分析系统,其特征在于所述的日志传输服务包括如下步骤:
S1.若日志副本为文件型日志副本和应用软件日志副本,则建立异步消息处理机制:将重定向生成日志副本文件按照消息队列的方式进行封装、并通过设置包括消息队列深度、消息分段在内的参数将副本文件截取为每一个消息控制在4M大小的消息段,通过消息传输队列的JMS进程连接日志收集控制器的消息接收队列进程中;传输过程采用消息压缩、分段提交、接收解压三个步骤完成;
S2.若日志副本为数据库型日志副本,则建立连续数据捕获机制:读取日志副本行记录,记录每一个增删改和事务操作,将每一个记录封装为一个SQL指令,通过TCP/IP协议将这些指令传递给日志收集控制器,日志收集控制器收到SQL指令后,进行解析处理。
6.根据权利要求1所述的分布式计算环境的日志动态分析系统,其特征在于所述的实时流处理服务包括实时计算控制器、通知服务、异常统计、实时结果展示、时间戳、日志解析器和日志搜索器;实时计算控制器用于处理消息并完成实时计算,通过实时计算实现对不断增长的日志信息的业务数据进行统计与分析;通知服务通过配置日志解析器中的通知触发器进行监控警告服务,并能够提供符合SNMP协议的MIB库进行通知服务;异常统计用于对日志中的错误、警告信息进行标记,并对错误类型和范围通过数据字典进行标记分类,根据分类号和标记编号对日志错误和警告进行统计、排序;实时结果展示通过对实时计算的日志信息和异常统计信息进行实时显示;时间戳是实时计算过程中,为了对日志事件进行时间定义的一个有效方法,时间戳用于通过同步位于实时流处理服务的时间服务进程来统一各个计算资源组的系统时间,保证日志动态分析过程中的时间一致性;日志解析器用于将实时计算结果按照配置解析规则进行筛选,并对日志副本中包含的代码字符利用数据字典功能进行自定义的对应转换;日志搜索器用于动态分析过程中进行日志搜索。
CN201610030483.9A 2016-01-18 2016-01-18 分布式计算环境的日志动态分析系统 Active CN105574205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610030483.9A CN105574205B (zh) 2016-01-18 2016-01-18 分布式计算环境的日志动态分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610030483.9A CN105574205B (zh) 2016-01-18 2016-01-18 分布式计算环境的日志动态分析系统

Publications (2)

Publication Number Publication Date
CN105574205A true CN105574205A (zh) 2016-05-11
CN105574205B CN105574205B (zh) 2019-03-19

Family

ID=55884336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610030483.9A Active CN105574205B (zh) 2016-01-18 2016-01-18 分布式计算环境的日志动态分析系统

Country Status (1)

Country Link
CN (1) CN105574205B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933163A (zh) * 2016-06-24 2016-09-07 微梦创科网络科技(中国)有限公司 一种实时分布式调试跟踪方法及系统
CN106326355A (zh) * 2016-08-09 2017-01-11 武汉深之度科技有限公司 一种lfs系统中的日志处理方法及装置
CN106406858A (zh) * 2016-08-30 2017-02-15 国电南瑞科技股份有限公司 一种基于配置文件的流式统计定义及运行方法
CN106407113A (zh) * 2016-09-09 2017-02-15 扬州大学 一种基于Stack Overflow和commit库的bug定位方法
CN106528423A (zh) * 2016-11-10 2017-03-22 北京百家互联科技有限公司 动态日志记录方法及装置
CN107193910A (zh) * 2017-05-14 2017-09-22 四川盛世天成信息技术有限公司 一种应用于数据安全类产品的数据库防篡改方法及系统
CN107231352A (zh) * 2017-05-27 2017-10-03 郑州云海信息技术有限公司 一种面向Xen虚拟化环境的系统日志监控方法及装置
CN107506422A (zh) * 2017-08-17 2017-12-22 北京理工大学 一种多数据源的分布式日志处理系统及方法
CN107835080A (zh) * 2017-11-09 2018-03-23 成都国盛天丰网络科技有限公司 一种分布式系统数据收集方法及数据签名生成方法
CN108259240A (zh) * 2018-01-11 2018-07-06 国电南瑞科技股份有限公司 一种电网调度控制系统体检信息的日志采集与传输方法
CN108459919A (zh) * 2018-03-29 2018-08-28 中信百信银行股份有限公司 一种分布式事务处理方法及装置
CN108734433A (zh) * 2018-05-29 2018-11-02 广州亿程交通信息集团有限公司 车辆日志数据分析系统
CN108959374A (zh) * 2018-05-24 2018-12-07 北京三快在线科技有限公司 数据存储方法、装置及电子设备
CN109359484A (zh) * 2018-08-22 2019-02-19 北京中测安华科技有限公司 云平台的安全审计终端日志的处理方法、装置、设备和介质
CN110008695A (zh) * 2018-01-05 2019-07-12 中国信息通信研究院 一种基于分布式记账的混合型用户行为审计方法及系统
CN110083626A (zh) * 2019-03-29 2019-08-02 北京奇安信科技有限公司 流式事件序列匹配方法及装置
CN110569274A (zh) * 2019-08-02 2019-12-13 福建星网智慧软件有限公司 一种分布式实时日志分析方法和计算机可读存储介质
CN111049684A (zh) * 2019-12-12 2020-04-21 闻泰通讯股份有限公司 数据分析方法、装置、设备和存储介质
CN111162932A (zh) * 2019-12-12 2020-05-15 苏州博纳讯动软件有限公司 一种基于日志分析的api网关监控方法
CN111241049A (zh) * 2020-01-06 2020-06-05 深圳市同洲电子股份有限公司 一种基于微服务架构分布式操作日志实现系统
CN111355572A (zh) * 2018-12-24 2020-06-30 国网信息通信产业集团有限公司 电力架空环境中qkd快偏设备运行日志的获取方法及装置
CN111459986A (zh) * 2020-04-07 2020-07-28 中国建设银行股份有限公司 数据计算系统及方法
CN111541645A (zh) * 2020-03-24 2020-08-14 国家计算机网络与信息安全管理中心 一种VoIP服务知识库构建方法及系统
CN111654410A (zh) * 2020-04-28 2020-09-11 长沙证通云计算有限公司 网关请求监控方法、装置、设备及介质
US10785127B1 (en) 2019-04-05 2020-09-22 Nokia Solutions And Networks Oy Supporting services in distributed networks
CN111752980A (zh) * 2020-07-01 2020-10-09 浪潮云信息技术股份公司 一种执法监管智能预警系统及方法
CN111817867A (zh) * 2019-04-11 2020-10-23 普天信息技术有限公司 分布式环境下进行多日志协同分析的方法及系统
CN112231479A (zh) * 2020-10-23 2021-01-15 新华三信息安全技术有限公司 一种安全审计方法及装置
CN112380105A (zh) * 2020-11-23 2021-02-19 华人运通(上海)云计算科技有限公司 日志收集方法、装置、系统、设备、存储介质及插件
CN113098942A (zh) * 2021-03-25 2021-07-09 网易(杭州)网络有限公司 一种分布式系统的数据处理方法及装置
CN113141393A (zh) * 2021-03-25 2021-07-20 杭州博联智能科技股份有限公司 动态边缘网关日志采集和管理方法、系统、设备及介质
CN113176771A (zh) * 2021-04-16 2021-07-27 重庆长安新能源汽车科技有限公司 车辆域控制器运行状态监控方法
CN115730020A (zh) * 2022-11-22 2023-03-03 哈尔滨工程大学 基于MySQL数据库日志分析的自动驾驶数据监测方法及监测系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254920A1 (en) * 2003-06-16 2004-12-16 Brill Eric D. Systems and methods that employ a distributional analysis on a query log to improve search results
CN101022396A (zh) * 2007-03-15 2007-08-22 上海交通大学 网格数据副本管理系统
CN101192227A (zh) * 2006-11-30 2008-06-04 阿里巴巴公司 一种基于分布式计算网络的日志文件分析方法和系统
CN103839003A (zh) * 2012-11-22 2014-06-04 腾讯科技(深圳)有限公司 恶意文件检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254920A1 (en) * 2003-06-16 2004-12-16 Brill Eric D. Systems and methods that employ a distributional analysis on a query log to improve search results
CN101192227A (zh) * 2006-11-30 2008-06-04 阿里巴巴公司 一种基于分布式计算网络的日志文件分析方法和系统
CN101022396A (zh) * 2007-03-15 2007-08-22 上海交通大学 网格数据副本管理系统
CN103839003A (zh) * 2012-11-22 2014-06-04 腾讯科技(深圳)有限公司 恶意文件检测方法及装置

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933163A (zh) * 2016-06-24 2016-09-07 微梦创科网络科技(中国)有限公司 一种实时分布式调试跟踪方法及系统
CN105933163B (zh) * 2016-06-24 2019-08-27 微梦创科网络科技(中国)有限公司 一种实时分布式调试跟踪方法及系统
CN106326355A (zh) * 2016-08-09 2017-01-11 武汉深之度科技有限公司 一种lfs系统中的日志处理方法及装置
CN106326355B (zh) * 2016-08-09 2019-10-18 武汉深之度科技有限公司 一种lfs系统中的日志处理方法及装置
CN106406858A (zh) * 2016-08-30 2017-02-15 国电南瑞科技股份有限公司 一种基于配置文件的流式统计定义及运行方法
CN106406858B (zh) * 2016-08-30 2019-08-16 国电南瑞科技股份有限公司 一种基于配置文件的流式统计定义及运行方法
CN106407113B (zh) * 2016-09-09 2018-12-11 扬州大学 一种基于Stack Overflow和commit库的bug定位方法
CN106407113A (zh) * 2016-09-09 2017-02-15 扬州大学 一种基于Stack Overflow和commit库的bug定位方法
CN106528423A (zh) * 2016-11-10 2017-03-22 北京百家互联科技有限公司 动态日志记录方法及装置
CN106528423B (zh) * 2016-11-10 2019-03-15 北京百家互联科技有限公司 动态日志记录方法及装置
CN107193910A (zh) * 2017-05-14 2017-09-22 四川盛世天成信息技术有限公司 一种应用于数据安全类产品的数据库防篡改方法及系统
CN107231352A (zh) * 2017-05-27 2017-10-03 郑州云海信息技术有限公司 一种面向Xen虚拟化环境的系统日志监控方法及装置
CN107506422A (zh) * 2017-08-17 2017-12-22 北京理工大学 一种多数据源的分布式日志处理系统及方法
CN107835080A (zh) * 2017-11-09 2018-03-23 成都国盛天丰网络科技有限公司 一种分布式系统数据收集方法及数据签名生成方法
CN110008695A (zh) * 2018-01-05 2019-07-12 中国信息通信研究院 一种基于分布式记账的混合型用户行为审计方法及系统
CN108259240A (zh) * 2018-01-11 2018-07-06 国电南瑞科技股份有限公司 一种电网调度控制系统体检信息的日志采集与传输方法
CN108459919A (zh) * 2018-03-29 2018-08-28 中信百信银行股份有限公司 一种分布式事务处理方法及装置
CN108459919B (zh) * 2018-03-29 2022-04-15 中信百信银行股份有限公司 一种分布式事务处理方法及装置
CN108959374A (zh) * 2018-05-24 2018-12-07 北京三快在线科技有限公司 数据存储方法、装置及电子设备
CN108959374B (zh) * 2018-05-24 2020-12-29 北京三快在线科技有限公司 数据存储方法、装置及电子设备
CN108734433A (zh) * 2018-05-29 2018-11-02 广州亿程交通信息集团有限公司 车辆日志数据分析系统
CN109359484A (zh) * 2018-08-22 2019-02-19 北京中测安华科技有限公司 云平台的安全审计终端日志的处理方法、装置、设备和介质
CN111355572A (zh) * 2018-12-24 2020-06-30 国网信息通信产业集团有限公司 电力架空环境中qkd快偏设备运行日志的获取方法及装置
CN110083626A (zh) * 2019-03-29 2019-08-02 北京奇安信科技有限公司 流式事件序列匹配方法及装置
US10785127B1 (en) 2019-04-05 2020-09-22 Nokia Solutions And Networks Oy Supporting services in distributed networks
CN111817867A (zh) * 2019-04-11 2020-10-23 普天信息技术有限公司 分布式环境下进行多日志协同分析的方法及系统
CN110569274A (zh) * 2019-08-02 2019-12-13 福建星网智慧软件有限公司 一种分布式实时日志分析方法和计算机可读存储介质
CN111049684A (zh) * 2019-12-12 2020-04-21 闻泰通讯股份有限公司 数据分析方法、装置、设备和存储介质
CN111162932A (zh) * 2019-12-12 2020-05-15 苏州博纳讯动软件有限公司 一种基于日志分析的api网关监控方法
CN111241049A (zh) * 2020-01-06 2020-06-05 深圳市同洲电子股份有限公司 一种基于微服务架构分布式操作日志实现系统
CN111541645B (zh) * 2020-03-24 2022-06-17 国家计算机网络与信息安全管理中心 一种VoIP服务知识库构建方法及系统
CN111541645A (zh) * 2020-03-24 2020-08-14 国家计算机网络与信息安全管理中心 一种VoIP服务知识库构建方法及系统
CN111459986A (zh) * 2020-04-07 2020-07-28 中国建设银行股份有限公司 数据计算系统及方法
CN111654410A (zh) * 2020-04-28 2020-09-11 长沙证通云计算有限公司 网关请求监控方法、装置、设备及介质
CN111752980A (zh) * 2020-07-01 2020-10-09 浪潮云信息技术股份公司 一种执法监管智能预警系统及方法
CN111752980B (zh) * 2020-07-01 2024-01-30 浪潮云信息技术股份公司 一种执法监管智能预警系统及方法
CN112231479A (zh) * 2020-10-23 2021-01-15 新华三信息安全技术有限公司 一种安全审计方法及装置
CN112231479B (zh) * 2020-10-23 2023-03-31 新华三信息安全技术有限公司 一种安全审计方法及装置
CN112380105A (zh) * 2020-11-23 2021-02-19 华人运通(上海)云计算科技有限公司 日志收集方法、装置、系统、设备、存储介质及插件
CN113141393A (zh) * 2021-03-25 2021-07-20 杭州博联智能科技股份有限公司 动态边缘网关日志采集和管理方法、系统、设备及介质
CN113098942B (zh) * 2021-03-25 2022-07-12 网易(杭州)网络有限公司 一种分布式系统的数据处理方法及装置
CN113141393B (zh) * 2021-03-25 2023-04-07 杭州博联智能科技股份有限公司 动态边缘网关日志采集和管理方法、系统、设备及介质
CN113098942A (zh) * 2021-03-25 2021-07-09 网易(杭州)网络有限公司 一种分布式系统的数据处理方法及装置
CN113176771A (zh) * 2021-04-16 2021-07-27 重庆长安新能源汽车科技有限公司 车辆域控制器运行状态监控方法
CN113176771B (zh) * 2021-04-16 2023-04-14 重庆长安新能源汽车科技有限公司 车辆域控制器运行状态监控方法
CN115730020A (zh) * 2022-11-22 2023-03-03 哈尔滨工程大学 基于MySQL数据库日志分析的自动驾驶数据监测方法及监测系统
CN115730020B (zh) * 2022-11-22 2023-10-10 哈尔滨工程大学 基于MySQL数据库日志分析的自动驾驶数据监测方法及监测系统

Also Published As

Publication number Publication date
CN105574205B (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN105574205A (zh) 分布式计算环境的日志动态分析系统
CN106294091B (zh) 一种无侵入式日志拦截性能分析方法及系统
CN110457190B (zh) 一种基于区块链的全链路监控方法、装置及系统
CN106371986A (zh) 一种日志处理运维监控系统
CN107577588A (zh) 一种海量日志数据智能运维系统
CN106571960B (zh) 日志收集管理系统及方法
US20050216241A1 (en) Method and apparatus for gathering statistical measures
CN106774220A (zh) 一种火电厂分布式控制系统在线运行状态监测平台
CN108964995A (zh) 基于时间轴事件的日志关联分析方法
CN110750377A (zh) 一种故障定位方法及装置
CN108762738B (zh) 平台化的数据采集系统
CN103488558A (zh) 一种基于log4j日志框架自动采集应用异常的装置及方法
CN111259073A (zh) 基于日志、流量和业务访问的业务系统运行状态智能研判系统
CN107846016A (zh) 一种基于贝叶斯和复杂事件处理的配网故障定位方法及设备
CN104104734A (zh) 日志分析方法和装置
CN105843936A (zh) 一种业务数据报表方法与系统
CN109151464A (zh) 基于大数据流处理的iptv机顶盒故障实时检测方法
CN110929896A (zh) 一种系统设备的安全分析方法及装置
CN109117526A (zh) 一种适用于机械系统设备维修指引数据记录及分析系统
CN112559634A (zh) 一种基于计算机云计算大数据用数据管理系统
Cinque et al. Advancing monitoring in microservices systems
CN106649765A (zh) 基于大数据技术的智能电网全景数据分析方法
CN113868248A (zh) 指标数据预聚合方法
CN206907024U (zh) 一种基于云服务的交通设备运维监测和数据分析系统
WO2010005154A1 (ko) 원자력발전소의 신뢰도 데이터를 생산하는 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant