CN111209258A - 税务端系统日志实时分析方法、设备、介质及系统 - Google Patents

税务端系统日志实时分析方法、设备、介质及系统 Download PDF

Info

Publication number
CN111209258A
CN111209258A CN201911408600.0A CN201911408600A CN111209258A CN 111209258 A CN111209258 A CN 111209258A CN 201911408600 A CN201911408600 A CN 201911408600A CN 111209258 A CN111209258 A CN 111209258A
Authority
CN
China
Prior art keywords
log
log data
real
time
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911408600.0A
Other languages
English (en)
Inventor
王梦蕾
彭勇钊
年洪旭
李鹏程
谢宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201911408600.0A priority Critical patent/CN111209258A/zh
Publication of CN111209258A publication Critical patent/CN111209258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/10Tax strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种税务端系统日志实时分析方法、设备、介质及系统。方法包括:对税务端系统业务操作产生的日志数据进行多线程分布式实时采集;将采集的日志数据缓存至消息队列集群中,同时将采集的日志数据作为原始日志数据进行分布式存储;提取消息队列集群中的日志数据并基于流计算工具对日志数据进行实时分析处理,同时将分析结果进行实时存储;提供操作界面,通过操作界面基于大数据计算引擎对原始日志数据进行查询、查询结果展示以及离线分析处理,或通过操作界面根据查询条件对实时存储的分析结果进行实时查询和查询结果展示。实现快速、准确的获取到相关信息,快速定位系统问题。

Description

税务端系统日志实时分析方法、设备、介质及系统
技术领域
本发明涉及数据处理领域,更具体地,涉及一种税务端系统日志实时分析方法、设备、介质及系统。
背景技术
防伪税控系统税务局端在运行过程中会产生大量的日志,会记录每一个纳税人的每一个操作等日志数据,这些日志以文件的形式存储在本地。当发现问题后,开发人员或者运维人员在排查问题时,需要逐个排查每个文件,从中查找与问题相关的日志数据,有时需要统计一个纳税人识别号在某一个时间段内做了多少个操作,或者某个业务如主机分退票业务在某一时间段内一共被执行了多少次。有时这些日志数据是杂乱无序的,也可能并不在一个文件中,这就需要工作人员逐个排查日志文件去分析统计,花费了大量时间,严重影响了工作效率。
因此需要提出一种新的税务端日志分析方法,能够快速准确的获取到相关日志数据信息,从而快速定位系统问题、提高工作效率。
发明内容
本发明的目的是提出一种税务端系统日志实时分析方法、设备、介质及系统,实现快速准确的获取到相关日志数据信息,从而快速定位系统问题、提高工作效率。
为实现上述目的,本发明提出了一种税务端系统日志实时分析方法,包括:
步骤1:对税务端系统业务操作产生的日志数据进行多线程分布式实时采集;
步骤2:将采集的所述日志数据缓存至消息队列集群中,同时将采集的所述日志数据作为原始日志数据进行分布式存储;
步骤3:提取所述消息队列集群中的所述日志数据并基于流计算工具对所述日志数据进行实时分析处理,同时将分析结果进行实时存储;
步骤4:提供操作界面,通过所述操作界面基于大数据计算引擎对所述原始日志数据进行查询、查询结果展示以及离线分析处理,或通过所述操作界面根据查询条件对实时存储的所述分析结果进行实时查询和查询结果展示。
可选地,所述步骤1包括:在税务端服务器上部署至少一个Flume日志采集客户端,所述Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集。
可选地,所述步骤2包括:通过Kafka消息队列集群对实时采集的所述日志数据进行缓存,同时将采集的所述日志数据存储至Hadoop分布式文件系统中,作为原始日志数据进行持久化保持;
对所述Kafka消息队列集群设置自动清理机制,以对过期的日志数据进行清理。
可选地,所述通过Kafka消息队列集群对采集的所述日志数据进行缓存包括:通过所述Kafka消息队列集群创建的分区以及与日志数据关联的消息类别对所述日志数据进行缓存。
可选地,所述步骤3包括:通过Spark流实时计算程序拉取所述Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果,同时将所述分析结果进行存储。
可选地,在所述步骤4中,所述基于大数据计算引擎对所述原始日志数据进行离线分析处理包括:通过所述操作界面利用Spark计算引擎对所述原始日志数据进行离线分析处理。
本发明还提出一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的税务端系统日志实时分析方法。
本发明还提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行上述的税务端系统日志实时分析方法。
本发明还提出一种税务端系统日志实时分析系统,包括:
日志采集模块,用于多线程实时采集税务端系统每个业务操作的产生的日志数据;
日志缓存模块,用于将采集的所述日志数据缓存至消息队列集群中;
日志存储模块,用于将采集的所述日志数据作为原始日志数据进行分布式存储;
日志分析模块,用于提取所述消息队列集群中的所述日志数据并基于流计算工具对所述日志数据进行实时分析处理,同时将分析结果进行实时存储;
日志展示模块,用于提供操作界面,通过所述操作界面基于大数据计算引擎对所述原始日志数据进行查询、查询结果展示以及离线分析处理,或通过所述操作界面根据查询条件对实时存储的所述分析结果进行实时查询和查询结果展示。
可选地,所述日志采集模块包括至少一个Flume日志采集客户端,所述Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集;
所述日志缓存模块包括Kafka消息队列集群,所述Kafka消息队列集群用于对实时采集的所述日志数据进行缓存;
所述日志存储模块包括Hadoop分布式文件系统,所述Hadoop分布式文件系统用于将采集的所述日志数据作为原始日志数据进行持久化的分布式存储;
所述日志分析模块包括Spark流实时计算程序和Spark计算引擎,其中,所述Spark流实时计算程序用于拉取所述Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果;所述Spark计算引擎用于对所述原始日志数据进行离线分析处理。
本发明的有益效果在于:
通过多线程的目标日志读取,并将读取到的日志数据传输至消息队列集群进行日志数据的缓存,基于基于流计算工具对缓存的日志数据进行提取分析,实时输出日志分析结果并将分析结果进行存储,能够将每个业务的完整信息获取并存储;利用大数据计算引擎分析原始日志数据,以及根据不同的查询条件进行日志分析结果实时查询,能够准确快速的获取到相关信息,从而快速定位系统问题。
本发明的装置具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的一种税务端系统日志实时分析方法的步骤图。
图2示出了根据本发明的一个实施例的一种税务端系统日志实时分析系统架构图。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
图1示出了根据本发明的一种税务端系统日志实时分析方法的步骤图。
如图1所示,根据本发明的一种税务端系统日志实时分析方法,包括:
步骤1:对税务端系统业务操作产生的日志数据进行多线程分布式实时采集;
步骤2:将采集的日志数据缓存至消息队列集群中,同时将采集的日志数据作为原始日志数据进行分布式存储;
步骤3:提取消息队列集群中的日志数据并基于流计算工具对日志数据进行实时分析处理,同时将分析结果进行实时存储;
步骤4:提供操作界面,通过操作界面基于大数据计算引擎对原始日志数据进行查询、查询结果展示以及离线分析处理,或通过操作界面根据查询条件对实时存储的分析结果进行实时查询和查询结果展示。
具体地,通过多线程的目标日志读取,并将读取到的日志数据传输至消息队列集群进行日志数据的缓存,基于基于流计算工具对缓存的日志数据进行提取分析,实时输出日志分析结果并将分析结果进行存储,能够将每个业务的完整信息获取并存储;利用大数据计算引擎分析原始日志数据,以及根据不同的查询条件进行日志分析结果实时查询,能够准确快速的获取到相关信息,从而快速定位系统问题。
本实施例中,在税务端服务器上部署至少一个Flume日志采集客户端,Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集。通过Kafka消息队列集群对实时采集的日志数据进行缓存,同时将采集的日志数据存储至Hadoop分布式文件系统中,作为原始日志数据进行持久化保持。其中,通过Kafka消息队列集群创建的分区以及与日志数据关联的消息类别对日志数据进行缓存。并对Kafka消息队列集群设置自动清理机制,以对过期的日志数据进行清理。
具体地,在税务端服务器上部署多个Flume客户端,Kafka集群等。通过配置Flume配置文件,进行多线程的目标日志读取,并将读取到的日志数据传输至Kafka集群,Kafka集群通过创建的分区以及与日志数据关联的消息类别(Topic)进行日志数据的缓存;并配置了Kafka自动清理机制,清理过期的日志数据。在日志存储模块中,日志数据被持久化存储到Hadoop分布式文件系统(HDFS)中,并且设置HDFS存储的日志是原始日志信息。
本实施例中,步骤3包括:通过Spark流实时计算程序拉取Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果,同时将分析结果进行存储。
具体地,日志数据被传输至Kafka消息队列中,通过Spark流(Spark Streaming)实时计算程序拉取Kafka中日志信息进行分析处理,实时输出日志处理信息,并将处理结果进行存储。
本实施例中,在步骤4中,基于大数据计算引擎对原始日志数据进行离线分析处理包括:通过操作界面利用Spark计算引擎对原始日志数据进行离线分析处理。
具体地,在日志展示模块中,可以利用Spark对这些原始数据进行离线分析处理,得到工作人员想要得到的相关结果,同时支持工作人员实时的根据不同条件进行查询数据,并通过不同的展示方法将结果展示给工作人员。
本发明实施例还提出一种电子设备,电子设备包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的税务端系统日志实时分析方法。
本发明实施例还提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行上述的税务端系统日志实时分析方法。
图2示出了根据本发明的一个实施例的一种税务端系统日志实时分析系统架构图。
如图2所示,本发明实施例还提出一种税务端系统日志实时分析系统,包括:
日志采集模块,用于多线程实时采集税务端系统每个业务操作的产生的日志数据;
日志缓存模块,用于将采集的日志数据缓存至消息队列集群中;
日志存储模块,用于将采集的日志数据作为原始日志数据进行分布式存储;
日志分析模块,用于提取消息队列集群中的日志数据并基于流计算工具对日志数据进行实时分析处理,同时将分析结果进行实时存储;
日志展示模块,用于提供操作界面,通过操作界面基于大数据计算引擎对原始日志数据进行查询、查询结果展示以及离线分析处理,或通过操作界面根据查询条件对实时存储的分析结果进行实时查询和查询结果展示。
本实施例中,日志采集模块包括至少一个Flume日志采集客户端,Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集;
日志缓存模块包括Kafka消息队列集群,Kafka消息队列集群用于对实时采集的日志数据进行缓存;
日志存储模块包括Hadoop分布式文件系统,Hadoop分布式文件系统用于将采集的日志数据作为原始日志数据进行持久化的分布式存储;
日志分析模块包括Spark流实时计算程序和Spark计算引擎,其中,Spark流实时计算程序用于拉取Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果;Spark计算引擎用于对原始日志数据进行离线分析处理。
具体地,Flume是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中所有动作流数据。Kafka的目的是通过Hadoop并行加载机制统一线上和离线消息处理,并通过集群提供实时消息。Kafka架构包括:类别(Topic)、分区(Partition)、消息生产者(Producer)、消息消费者(Consumer);通常,一个普通的工作流程是Kafka的producer向topic写入消息,consumer从topic中读取消息。topic与日志相关联,日志是存储在系统磁盘上的数据结构,Kafka将producer的记录附加到topic日志的末尾。topic日志由分布在多个文件上的许多分区组成,这些文件可以分布在多个Kafka集群节点上。Kafka在集群的不同节点上分发topic日志分区,以实现具有水平可伸缩性的高性能。Spreading分区有助于快速写入数据,Kafka将分区复制到许多节点以提供故障转移。
Spark是专为大规模数据处理而设计的快速通用的计算引擎,SparkStreaming为构建在Spark上处理流数据的框架,基本的原理是将流数据分成小的时间片段(几秒),以类似batch批量处理的方式来处理这小部分数据,是对于Spark核心API的拓展,从而支持对于实时数据流的可拓展,高吞吐量和容错性流处理。
同时系统还需配套使用分布式应用程序协调服务组件(Zookeeper),Zookeeper是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
Flume、Kafka、Spark和Zookeeper均为现有技术,此处不再赘述。
综上,本发明利用大数据技术,通过实时分析日志,获取每一个业务相关的全部日志信息,并可以按照不同条件进行过滤、存储;利用Spark分析历史数据,根据不同的查询条件进行查询,如某一个纳税人在时间范围内执行纸质发票申领等业务的总次数等信息;还可以通过页面展示给开发人员或运维人员。不仅能够使运维人员可以及时定位到系统问题,也能够在发生异常时,及时做出相关措施。很大程度上节约了工作人员的时间和精力,提高了企业的工作效率。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims (10)

1.一种税务端系统日志实时分析方法,其特征在于,包括:
步骤1:对税务端系统业务操作产生的日志数据进行多线程分布式实时采集;
步骤2:将采集的所述日志数据缓存至消息队列集群中,同时将采集的所述日志数据作为原始日志数据进行分布式存储;
步骤3:提取所述消息队列集群中的所述日志数据并基于流计算工具对所述日志数据进行实时分析处理,同时将分析结果进行实时存储;
步骤4:提供操作界面,通过所述操作界面基于大数据计算引擎对所述原始日志数据进行查询、查询结果展示以及离线分析处理,或通过所述操作界面根据查询条件对实时存储的所述分析结果进行实时查询和查询结果展示。
2.根据权利要求1所述的税务端系统日志实时分析方法,其特征在于,所述步骤1包括:
在税务端服务器上部署至少一个Flume日志采集客户端,所述Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集。
3.根据权利要求1所述的税务端系统日志实时分析方法,其特征在于,所述步骤2包括:
通过Kafka消息队列集群对实时采集的所述日志数据进行缓存,同时将采集的所述日志数据存储至Hadoop分布式文件系统中,作为原始日志数据进行持久化保持;
对所述Kafka消息队列集群设置自动清理机制,以对过期的日志数据进行清理。
4.根据权利要求3所述的税务端系统日志实时分析方法,其特征在于,所述通过Kafka消息队列集群对采集的所述日志数据进行缓存包括:
通过所述Kafka消息队列集群创建的分区以及与日志数据关联的消息类别对所述日志数据进行缓存。
5.根据权利要求1所述的税务端系统日志实时分析方法,其特征在于,所述步骤3包括:
通过Spark流实时计算程序拉取所述Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果,同时将所述分析结果进行存储。
6.根据权利要求1所述的税务端系统日志实时分析方法,其特征在于,在所述步骤4中,所述基于大数据计算引擎对所述原始日志数据进行离线分析处理包括:
通过所述操作界面利用Spark计算引擎对所述原始日志数据进行离线分析处理。
7.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6任一所述的税务端系统日志实时分析方法。
8.一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-6任一所述的税务端系统日志实时分析方法。
9.一种税务端系统日志实时分析系统,其特征在于,包括:
日志采集模块,用于多线程实时采集税务端系统每个业务操作的产生的日志数据;
日志缓存模块,用于将采集的所述日志数据缓存至消息队列集群中;
日志存储模块,用于将采集的所述日志数据作为原始日志数据进行分布式存储;
日志分析模块,用于提取所述消息队列集群中的所述日志数据并基于流计算工具对所述日志数据进行实时分析处理,同时将分析结果进行实时存储;
日志展示模块,用于提供操作界面,通过所述操作界面基于大数据计算引擎对所述原始日志数据进行查询、查询结果展示以及离线分析处理,或通过所述操作界面根据查询条件对实时存储的所述分析结果进行实时查询和查询结果展示。
10.根据权利要求9所述的税务端系统日志实时分析系统,其特征在于,
所述日志采集模块包括至少一个Flume日志采集客户端,所述Flume日志采集客户端基于配置文件对税务端系统进行多线程的日志数据采集;
所述日志缓存模块包括Kafka消息队列集群,所述Kafka消息队列集群用于对实时采集的所述日志数据进行缓存;
所述日志存储模块包括Hadoop分布式文件系统,所述Hadoop分布式文件系统用于将采集的所述日志数据作为原始日志数据进行持久化的分布式存储;
所述日志分析模块包括Spark流实时计算程序和Spark计算引擎,其中,所述Spark流实时计算程序用于拉取所述Kafka消息队列集群中缓存的日志数据进行分析以获取每个业务操作的完整信息,并实时输出分析结果;所述Spark计算引擎用于对所述原始日志数据进行离线分析处理。
CN201911408600.0A 2019-12-31 2019-12-31 税务端系统日志实时分析方法、设备、介质及系统 Pending CN111209258A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408600.0A CN111209258A (zh) 2019-12-31 2019-12-31 税务端系统日志实时分析方法、设备、介质及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408600.0A CN111209258A (zh) 2019-12-31 2019-12-31 税务端系统日志实时分析方法、设备、介质及系统

Publications (1)

Publication Number Publication Date
CN111209258A true CN111209258A (zh) 2020-05-29

Family

ID=70784161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408600.0A Pending CN111209258A (zh) 2019-12-31 2019-12-31 税务端系统日志实时分析方法、设备、介质及系统

Country Status (1)

Country Link
CN (1) CN111209258A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949633A (zh) * 2020-08-03 2020-11-17 杭州电子科技大学 一种基于并行流处理的ict系统运行日志分析方法
CN111984433A (zh) * 2020-07-31 2020-11-24 五八有限公司 业务数据处理方法、展示方法、装置、电子设备及介质
CN112115112A (zh) * 2020-08-10 2020-12-22 上海金仕达软件科技有限公司 日志信息处理方法、装置及电子设备
CN112202607A (zh) * 2020-09-28 2021-01-08 中移(杭州)信息技术有限公司 日志消息的统计计算方法、服务器及存储介质
CN112269808A (zh) * 2020-11-17 2021-01-26 携程旅游网络技术(上海)有限公司 引擎查询控制方法、系统、设备及存储介质
CN112860195A (zh) * 2021-03-26 2021-05-28 中国工商银行股份有限公司 日志存储方法及装置
CN113190524A (zh) * 2021-04-21 2021-07-30 武汉卓尔信息科技有限公司 一种工业大数据采集方法及系统
WO2021151315A1 (zh) * 2020-06-29 2021-08-05 平安科技(深圳)有限公司 应用系统日志数据的处理方法、应用系统、设备及介质
CN113282611A (zh) * 2021-06-29 2021-08-20 深圳平安智汇企业信息管理有限公司 一种流数据同步的方法、装置、计算机设备及存储介质
CN113852664A (zh) * 2021-08-19 2021-12-28 天津市普迅电力信息技术有限公司 一种基于分布式实时计算的能源商品及能源需求的精准推送方法
CN114168624A (zh) * 2021-12-08 2022-03-11 掌阅科技股份有限公司 数据分析方法、计算设备及存储介质
CN114490744A (zh) * 2021-12-13 2022-05-13 中企云链(北京)金融信息服务有限公司 一种数据缓存方法、存储介质、电子装置
CN114969083A (zh) * 2022-06-24 2022-08-30 在线途游(北京)科技有限公司 一种实时数据分析方法及系统
CN115391429A (zh) * 2022-09-14 2022-11-25 武汉奋进智能机器有限公司 基于大数据云计算的时序数据处理方法及装置
CN115714718A (zh) * 2022-09-23 2023-02-24 上海芯赛云计算科技有限公司 基于内存的日志预警方法、系统、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105207826A (zh) * 2015-10-26 2015-12-30 南京联成科技发展有限公司 一种基于Tachyou的Spark大数据平台的安全攻击告警定位系统
CN105893628A (zh) * 2016-05-17 2016-08-24 中国农业银行股份有限公司 一种数据实时收集系统及方法
CN106709003A (zh) * 2016-12-23 2017-05-24 长沙理工大学 基于Hadoop的海量日志数据处理方法
US20180129579A1 (en) * 2016-11-10 2018-05-10 Nec Laboratories America, Inc. Systems and Methods with a Realtime Log Analysis Framework
US20180341956A1 (en) * 2017-05-26 2018-11-29 Digital River, Inc. Real-Time Web Analytics System and Method
CN109542733A (zh) * 2018-12-05 2019-03-29 焦点科技股份有限公司 一种高可靠的实时日志收集及可视化检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105207826A (zh) * 2015-10-26 2015-12-30 南京联成科技发展有限公司 一种基于Tachyou的Spark大数据平台的安全攻击告警定位系统
CN105893628A (zh) * 2016-05-17 2016-08-24 中国农业银行股份有限公司 一种数据实时收集系统及方法
US20180129579A1 (en) * 2016-11-10 2018-05-10 Nec Laboratories America, Inc. Systems and Methods with a Realtime Log Analysis Framework
CN106709003A (zh) * 2016-12-23 2017-05-24 长沙理工大学 基于Hadoop的海量日志数据处理方法
US20180341956A1 (en) * 2017-05-26 2018-11-29 Digital River, Inc. Real-Time Web Analytics System and Method
CN109542733A (zh) * 2018-12-05 2019-03-29 焦点科技股份有限公司 一种高可靠的实时日志收集及可视化检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨立鹏等: "基于Storm实时流式计算框架的网络日志分析方法" *
陈斌: "大数据支持下的网络日志分析技术研究" *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021151315A1 (zh) * 2020-06-29 2021-08-05 平安科技(深圳)有限公司 应用系统日志数据的处理方法、应用系统、设备及介质
CN111984433A (zh) * 2020-07-31 2020-11-24 五八有限公司 业务数据处理方法、展示方法、装置、电子设备及介质
CN111949633A (zh) * 2020-08-03 2020-11-17 杭州电子科技大学 一种基于并行流处理的ict系统运行日志分析方法
CN112115112A (zh) * 2020-08-10 2020-12-22 上海金仕达软件科技有限公司 日志信息处理方法、装置及电子设备
CN112202607A (zh) * 2020-09-28 2021-01-08 中移(杭州)信息技术有限公司 日志消息的统计计算方法、服务器及存储介质
CN112202607B (zh) * 2020-09-28 2022-06-14 中移(杭州)信息技术有限公司 日志消息的统计计算方法、服务器及存储介质
CN112269808A (zh) * 2020-11-17 2021-01-26 携程旅游网络技术(上海)有限公司 引擎查询控制方法、系统、设备及存储介质
CN112269808B (zh) * 2020-11-17 2024-03-19 携程旅游网络技术(上海)有限公司 引擎查询控制方法、系统、设备及存储介质
CN112860195A (zh) * 2021-03-26 2021-05-28 中国工商银行股份有限公司 日志存储方法及装置
CN113190524A (zh) * 2021-04-21 2021-07-30 武汉卓尔信息科技有限公司 一种工业大数据采集方法及系统
CN113282611B (zh) * 2021-06-29 2024-04-23 深圳平安智汇企业信息管理有限公司 一种流数据同步的方法、装置、计算机设备及存储介质
CN113282611A (zh) * 2021-06-29 2021-08-20 深圳平安智汇企业信息管理有限公司 一种流数据同步的方法、装置、计算机设备及存储介质
CN113852664A (zh) * 2021-08-19 2021-12-28 天津市普迅电力信息技术有限公司 一种基于分布式实时计算的能源商品及能源需求的精准推送方法
CN114168624A (zh) * 2021-12-08 2022-03-11 掌阅科技股份有限公司 数据分析方法、计算设备及存储介质
CN114168624B (zh) * 2021-12-08 2022-09-20 掌阅科技股份有限公司 数据分析方法、计算设备及存储介质
CN114490744A (zh) * 2021-12-13 2022-05-13 中企云链(北京)金融信息服务有限公司 一种数据缓存方法、存储介质、电子装置
CN114490744B (zh) * 2021-12-13 2024-04-26 中企云链股份有限公司 一种数据缓存方法、存储介质、电子装置
CN114969083A (zh) * 2022-06-24 2022-08-30 在线途游(北京)科技有限公司 一种实时数据分析方法及系统
CN115391429A (zh) * 2022-09-14 2022-11-25 武汉奋进智能机器有限公司 基于大数据云计算的时序数据处理方法及装置
CN115714718A (zh) * 2022-09-23 2023-02-24 上海芯赛云计算科技有限公司 基于内存的日志预警方法、系统、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN111209258A (zh) 税务端系统日志实时分析方法、设备、介质及系统
CN109542733B (zh) 一种高可靠的实时日志收集及可视化检索方法
CN105824744B (zh) 一种基于b2b平台的实时日志采集分析方法
US9590880B2 (en) Dynamic collection analysis and reporting of telemetry data
CN104426713B (zh) 网络站点访问效果数据的监测方法和装置
CN113360554B (zh) 一种数据抽取、转换和加载etl的方法和设备
CN108985981B (zh) 数据处理系统及方法
CN106815254B (zh) 一种数据处理方法和装置
CN109918349A (zh) 日志处理方法、装置、存储介质和电子装置
CN103838867A (zh) 日志处理方法和装置
CN106940677A (zh) 一种应用日志数据告警方法及装置
CN103729446A (zh) 一种用户操作数据的处理方法、处理装置及服务器
CN109885453B (zh) 基于流数据处理的大数据平台监控系统
US10044820B2 (en) Method and system for automated transaction analysis
CN109190025B (zh) 信息监控方法、装置、系统和计算机可读存储介质
CN107169143B (zh) 一种高效的海量舆情数据信息集群匹配方法
CN109167672B (zh) 一种回源错误定位方法、装置、存储介质以及系统
CN110888985A (zh) 一种报警信息处理方法、装置、电子设备及存储介质
CN105069029B (zh) 一种实时etl系统及方法
CN113778810A (zh) 一种日志收集方法、装置及系统
JP7412938B2 (ja) 情報分析装置、情報分析方法、情報分析システムおよびプログラム
Liu et al. System anomaly detection in distributed systems through MapReduce-Based log analysis
CN110019045B (zh) 日志落地方法及装置
CN110019152A (zh) 一种大数据清洗方法
CN103916463A (zh) 一种网络访问统计分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination