CN110232054A - 日志传输系统及流式日志传输方法 - Google Patents

日志传输系统及流式日志传输方法 Download PDF

Info

Publication number
CN110232054A
CN110232054A CN201910533263.1A CN201910533263A CN110232054A CN 110232054 A CN110232054 A CN 110232054A CN 201910533263 A CN201910533263 A CN 201910533263A CN 110232054 A CN110232054 A CN 110232054A
Authority
CN
China
Prior art keywords
log
message
daily record
record data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910533263.1A
Other languages
English (en)
Other versions
CN110232054B (zh
Inventor
邢越
赵得润
詹洋
汪婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910533263.1A priority Critical patent/CN110232054B/zh
Publication of CN110232054A publication Critical patent/CN110232054A/zh
Application granted granted Critical
Publication of CN110232054B publication Critical patent/CN110232054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请的实施例公开了日志传输系统和日志传输方法。日志传输系统包括:日志采集模块,被配置为获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;消息系统,被配置为从日志采集模块接收日志数据并发布至对应的主题,向日志落盘模块传输其订阅的日志数据;日志落盘模块,被配置为从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。该日志传输系统实现了准确的日志数据落盘。

Description

日志传输系统及流式日志传输方法
技术领域
本申请实施例涉及计算机技术领域,具体涉及数据处理技术领域,尤其涉及日志传输系统及流式日志传输方法。
背景技术
在流式计算的场景中,水位标志系统中未完成的数据的最早的时间戳。水位落盘是指按照窗口大小(例如1小时)把来自流式传输系统中的数据落盘到该窗口对应的文件夹中。
日志传输系统用于将从前端机收集到的日志传输至存储系统中。在机器学习的场景中,要求对产生的日志进行严格的水位落盘。例如对于1小时的窗口大小,发生在1小时之内的日志必须落在对应的窗口中。如果日志落入错误的窗口会导致机器学习模型错误。并且,分布式系统的环境复杂,前端机产生的日志可能异常,网络可能抖动,分布式服务可能重启,由此为日志的水位落盘带来了困难。
发明内容
本申请实施例提出了日志传输系统及流式日志传输方法。
第一方面,本公开的实施例提供了一种日志传输系统,包括:日志采集模块,被配置为获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;消息系统,被配置为从日志采集模块接收日志数据并发布至对应的主题,向日志落盘模块传输其订阅的日志数据;日志落盘模块,被配置为从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
可选地,上述日志采集模块的日志发布进度信息包括消息序列号,消息序列号用于标识日志数据在消息系统的一个消息分片中的位置;日志采集模块还被配置为:在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。
可选地,上述消息系统还被配置为:根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重。
可选地,上述日志落盘进度信息包括文件写进度信息;日志落盘模块还被配置为:在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。
可选地,上述系统还包括:水位计算模块,被配置为:获取日志落盘模块上报的写入成功的日志数据的时间信息,并根据写入成功的日志数据的时间信息确定系统中尚未写入的日志数据的最早产出时间;响应于确定系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示目标时间窗口的文件目录数据写入完成的通知消息,向日志传输系统的下游数据处理系统发送通知消息。
可选地,上述水位计算模块还被配置为:获取日志采集模块上报的发布成功的日志数据的时间信息,并根据发布成功的日志数据的时间信息确定出系统中尚未发布的日志数据的最早产出时间。
第二方面,本公开的实施例提供了一种日志传输方法,包括:通过日志采集进程获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;通过日志落盘进程从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
可选地,上述日志发布进度信息包括消息序列号,消息序列号用于标识日志数据在消息系统的一个消息分片中的位置;方法还包括:在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。
可选地,上述消息系统接收日志数据并发布至对应的主题,并根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重。
可选地,上述日志落盘进度信息包括文件写进度信息;方法还包括:在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。
可选地,上述方法还包括:获取日志落盘进程上报的写入成功的日志数据的时间信息,并根据写入成功的日志数据的时间信息确定日志传输系统中尚未写入的日志数据的最早产出时间;响应于确定系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示目标时间窗口的文件目录数据写入完成的通知消息,向日志传输系统的下游数据处理系统发送通知消息。
可选地,上述方法还包括:获取日志采集进程上报的发布成功的日志数据的时间信息,并根据发布成功的日志数据的时间信息确定出日志传输系统中尚未发布的日志数据的最早产出时间。
第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第二方面提供的日志传输方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现第二方面提供的日志传输方法。
本公开的上述实施例的日志传输系统及流式日志传输方法,通过日志采集模块获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息,消息系统从日志采集模块接收日志数据并发布至对应的主题,向日志落盘模块传输其订阅的日志,日志落盘模块从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息,实现了准确的日志数据落盘。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的日志传输系统的一个实施例的结构示意图;
图3是根据本申请的日志传输方法的一个实施例的流程图;
图4是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本公开的日志传输系统或日志传输方法的示例性系统架构。
如图1所示,系统架构100可以包括生产者系统101、流式计算系统102以及消费者系统103。其中,生产者系统101、流式计算系统102以及消息者系统103依次通信连接。
生产者系统101用于生产待处理的数据,在实践中可以是业务系统,例如电商平台的业务系统,搜索引擎的业务系统、财务系统,等等。生产者系统101可以具有多个节点,各个节点上产生需要被处理的数据,然后传输至流式计算系统102进行处理。
流式计算系统102用于对生产者系统101产生的数据进行实时的传输和处理。流式计算系统102可以是分布式系统,在多个节点上部署有数据采集进程、数据接入进程、数据处理进程和数据查询进程。流式计算系统102可以将处理完成的数据实时传输至下游的消费者系统103。
在本公开的实施例中,流式计算系统102可以作为日志传输系统,在上游的生产者系统101和下游的消费者系统103之间进行日志数据的传输。
消费者系统103可以是利用经过流式计算系统102处理的数据进行数据分析或数据展示的系统。消费者系统103可以接收流式计算系统102传输的实时数据,并进行进一步的数据分析等处理。
在本公开的应用场景中,流式计算系统102可以实时地获取数据并将数据按照时间顺序落盘存储,以保证传输至下游消费者系统103的数据的有序性和完备性。
需要说明的是,上述生产者系统101、流式计算系统102、消费者系统103可以是实现相应功能的硬件或软件系统。当生产者系统101、流式计算系统102、消费者系统103为硬件系统时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当生产者系统101、流式计算系统102、消费者系统103时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的生产者系统、流式计算系统、消费者系统的数目仅仅是示意性的。根据实现需要,可以具有任意数目的生产者系统、流式计算系统、消费者系统。
继续参考图2,其示出了根据本申请的日志系统的一个实施例的结构示意图。该日志传输系统200包括:日志采集模块201、消息系统202以及日志落盘模块203。
在本实施例中,日志采集模块201可以被配置为采集日志产出端产出的日志数据,将日志数据发送至消息系统202。日志产出端可以是生产日志的物理机、虚拟机或者容器,其可以是业务系统中的一个节点。在具体的实现中,日志产出端可以是业务系统前端的设备。或者,日志产出端还可以实现为部署在业务系统前端设备上的日志产出进程agent,该日志产出进程获取日志前端机运行中产生的日志数据。
日志采集模块201可以是用于收集日志数据的模块,可以通过部署在前端机上的日志采集进程来收集日志数据。并且,日志采集模块201可以将收集到的日志数据发往消息系统203中。
消息系统202可以是在消息发送者和消息接收者之间存放消息的中间件。消息系统202以消息队列的方式将接收到的数据进行有序、分片存储。
在本实施例中,消息系统202被配置为将日志采集模块201传输的日志数据存储在消息队列中。在这里,每个消息分片中的消息可以是按照接收到的时间排序的,这样,可以确保日志采集模块201采集到的数据被有序地存储在消息系统中。
消息系统202可以是分布式的消息传输集群,例如可以采用基于发布-订阅模式的kafka集群架构,该kafka集群可以发布消息主题,订阅主题的消息接收者可以接收相应的消息。
消息系统202在成功将日志数据写入消息队列后,可以以预定的主题发布写入消息队列的日志数据,以供订阅该主题的日志落盘模块获取日志数据并落盘。在发布成功后,消息系统202向日志采集模块返回发布成功消息,以告知日志采集模块日志数据已成功写入消息队列并发布。这时,日志采集模块201可以响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息。日志发布进度信息可以表征日志被消息系统成功存入队列并发布的进度,可以是日志采集模块201本地的日志发布进度信息,在实践中日志发布进度信息可以是日志数据的编号、发布时间、在消息队列中的位置标识或序号,等等。
通过在日志数据发布成功后更新本地的日志发布进度信息,可以准确记录日志的发布进度,以确保系统中日志发布进度可查,在异常情况时可以根据日志发布进度信息确定系统中日志数据的传输进度,进而基于日志发布进度信息对系统进行修复和维护。
上述日志采集模块201可以部署并运行在前端的日志产出端,其更新的日志发布进度信息可以是日志产出端的日志发布进度信息。
日志落盘模块203可以从消息系统202中获取订阅的日志数据。在本实施例中,日志落盘模块203可以从消息系统的一个分区中订阅日志数据,消息系统202在以预定的主题发布日志数据之后,日志落盘模块203查询订阅的主题列表,若日志落盘模块203在订阅的主题列表中查找到消息系统202发布的主题,消息系统202可以向日志落盘模块203传输其订阅的日志数据。日志落盘模块203可以根据预设的时间窗口和接收到的日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中。
在这里,预设的时间窗口可以是预先划分的时间窗口,例如以1小时为单位,时间窗口为[0:00,1:00],[1:00,2:00],[2:00,3:00],…。在分布式存储系统中为每个时间窗口设置一个对应的文件目录,不同的时间窗口对应不同的文件目录。
日志数据中包含日志产出时间,也即消息系统发布的消息的消息时间,例如为16:01,则该日志数据例如对应于时间窗口[16:00,17:00]。可以将该日志数据写入分布式存储系统中对应于时间窗口[16:00,17:00]的文件目录中。这样保证分布式存储系统写入文件的有序性。分布式存储系统可以存储日志数据,在写入日志数据后保证日式数据不丢失。例如可以采用HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)等。
分布式存储系统在写入日志数据后,可以向日志落盘模块203返回写入成功消息,这时,日志落盘模块203还可以响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。在这里,日志落盘进度信息表征日志写入分布式存储系统的进度,可以例如是表征消息订阅位置的消息订阅点,或者是表征文件写入位置的文件写进度信息,等等。
通过日志落盘模块更新日志落盘进度信息,使得日志传输系统的日志落盘进度可查询,在异常情况下可以根据日志落盘进度信息确定已写入存储系统的日志的位置,进而基于该位置对系统进行运维,确保日志传输系统的稳定性。
本公开上述实施例的日志传输系统,通过日志采集模块获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息,消息系统从日志采集模块接收日志数据并发布至对应的主题,向日志落盘模块传输其订阅的日志,日志落盘模块从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息,实现了准确的日志数据落盘,并且可以提供准确的发布和落盘进度信息来帮助进行系统运维,提升系统的可靠性和稳定性。
在一些实施例中,上述日志采集模块201的日志发布进度信息包括消息序列号,消息序列号用于标识日志数据在消息系统的一个消息分片中的位置,具体可以是日志数据在消息分片中的偏移(offset)。上述日志采集模块201还被配置为:在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。
当出现异常重启时,可以根据日志发布进度信息中的消息序列号找到上一条成功发布的消息的位置,从这个位置开始重新订阅日志数据来保证日志数据不丢失。
进一步地,消息系统202可以采用多副本机制,保存多个消息副本。在异常重启时,消息系统202也可以根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重,进而保证整个系统中日志数据不重复也不会丢失。
在一些实施例中,上述日志落盘进度信息包括文件写进度信息,文件写进度信息可以是日志数据写入分布式存储系统的位置信息。这时,上述日志落盘模块203还可以被配置为:在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。即在异常重启后,可以对根据文件写进度信息确定出的已经写入成功的日志数据之后的日志数据进行重写,覆盖之后可能重复的日志数据,从而保证写入分布式存储系统中的日志数据不会重复。
在一些实施例中,上述日志传输系统还可以包括水位计算模块。水位计算模块被配置为:获取日志落盘模块上报的写入成功的日志数据的时间信息,并根据写入成功的日志数据的时间信息确定系统中尚未写入的日志数据的最早产出时间。
日志落盘模块203可以向水位计算模块上报写入成功的日志数据的时间信息,即上报日志落盘模块的水位。水位计算模块可以根据系统中各日志落盘模块上报的水位计算出全局最小水位,即确定出系统中所有尚未写入的日志数据的最早产出时间,作为全局最小水位。该最早产出时间代表上位写入分布式存储系统的最久的日志数据的产出时间。例如,当全局最小水位为16:00时,表示系统中不存在未被写入的16:00之前的日志数据,也即16:00之前的数据已被成功写入分布式存储系统。
水位模块还被配置为:响应于确定系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示目标时间窗口的文件目录数据写入完成的通知消息,向日志传输系统的下游数据处理系统发送通知消息。
在确定系统的水位达到预定的目标时间窗口的最大时间边界,例如水位为16:00时,达到目标时间窗口[15:00,16:00]的最大时间边界16:00,表示该时间窗口内的日志数据已成功落盘,可以生成用于指示该目标时间窗口[15:00,16:00]的文件目录数据写入完成的通知消息并向日志传输系统的下游数据处理系统发送通知消息,以告知下游数据处理系统对该目标时间窗口内的数据进行处理。
上述目标时间窗口可以是与分布式存储系统的文件目录一一对应的,例如可以是以一小时为单位的多个时间窗口,各目标时间窗口之间是连续的,即相邻的目标时间窗口之间不存在时间差。这样可以确保各个时间窗口内的日志数据完备后及时向下游数据处理系统发送通知,及时触发下游数据处理系统消费数据。
可选地,上述日志采集模块也可以向水位计算模块上报发布成功的日志数据的最早产出时间,上述水位计算模块还被配置为:获取日志采集模块上报的发布成功的日志数据的时间信息,并根据发布成功的日志数据的时间信息确定出系统中尚未发布的日志数据的最早产出时间。
上述水位计算模块还可以提供水位查询接口,供运维人员查询日志采集模块和全局水位和日志落盘模块的全局水位,从而实现日志传输进度的可视化。
本公开的实施例还提供了一种日志传输方法。该日志传输方法应用于流式计算系统。继续参考图3,其示出了日志传输方法的一个实施例的流程图。该日志传输方法可以应用于流式计算系统的任意一个或多个计算节点中。
如图3所示,日志传输方法的流程300,可以包括以下步骤:
步骤301,通过日志采集进程获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息。
在本实施例中,上述日志传输方法的执行主体可以通过日志采集进程采集日志产出端的日志数据,将日志数据发送至消息系统。或者,上述执行主体可以从运行在日志产出端的日志采集进程中获取其采集的日志数据并发送至消息系统。
消息系统以消息队列的方式将接收到的数据存储至相应的分片中,实现日志数据的有序存储。消息系统202可以是分布式的消息传输集群,例如可以采用基于发布-订阅模式的kafka集群架构,该kafka集群可以发布消息主题,订阅主题的消息接收者可以接收相应的消息。
在本实施例中,消息系统在成功将日志数据写入消息队列后,可以以预定的主题发布写入消息队列的日志数据,以供该主题的订阅者获取日志数据并落盘。在发布成功后,消息系统可以返回发布成功消息,以告知日志数据已成功写入消息队列并发布。这时,可以响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息。日志发布进度信息可以表征日志被消息系统成功存入队列并发布的进度,在实践中日志发布进度信息可以是日志数据的编号、发布时间、在消息队列中的位置标识或序号,等等。
步骤302,通过日志落盘进程从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
上述执行主体可以在日志落盘进程中执行步骤302。日志落盘进程可以从消息系统的一个分片中订阅数据,在监测到以订阅的主题发布的日志数据时,获取订阅的日志数据,将日志数据中包含的日志产出时间作为消息时间,将日志数据写入该消息时间所落入的预设时间窗口对应的文件目录中。例如将消息时间为16:01的日志数据写入分布式存储系统中对应于时间窗口[16:00,17:00]的文件目录中。
分布式存储系统将日志数据写入对应的文件目录之后,可以返回写入成功消息。这时,上述执行主体可以更新日志落盘进程的日志落盘进度信息,例如可以将写入成功的文件位置或写入成功的日志数据的时间作为日志落盘进度信息。
本公开上述实施例的日志传输方法,通过获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息,从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息,实现了准确的日志数据落盘,并且可以提供准确的发布和落盘进度信息来帮助系统运维,提升系统的可靠性和稳定性。
在一些实施例中,上述日志发布进度信息包括消息序列号,消息序列号用于标识日志数据在消息系统的一个消息分片中的位置,消息序列号例如为消息在队列中的偏移(offset)。
这时,上述日志传输方法的流程还可以包括:在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。也即在异常重启后,可以根据日志发布进度信息中的消息序列号找到上一条成功发布的消息的位置,从这个位置开始重新订阅日志数据来保证日志数据不丢失。
进一步地,上述消息系统可以接收日志数据并发布至对应的主题,并根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重。在这里,消息系统可以基于多副本机制,根据日志发布进度信息对消息进行去重。
在一些实施例中,上述日志落盘进度信息可以包括文件写进度信息,文件写进度信息可以是日志数据写入分布式存储系统的位置信息。这时,上述日志传输方法还可以包括:在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。则在异常重启后,重新写入文件写进度信息所标识的位置之后的日志数据,可以覆盖异常重启之前的相应位置的数据,在确保日志数据不丢失的情况下避免日志数据重复写入存储系统。
在一些实施中,上述日志传输方法还可以包括:获取日志落盘进程上报的写入成功的日志数据的时间信息,并根据写入成功的日志数据的时间信息确定日志传输系统中尚未写入的日志数据的最早产出时间;以及响应于确定系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示目标时间窗口的文件目录数据写入完成的通知消息,向日志传输系统的下游数据处理系统发送通知消息。
在这里,可以获取日志传输系统中部署于不同节点的日志落盘进程上报的写入成功的日志数据的时间信息,确定出尚未写入分布式存储系统的日志数据的最早产出时间,作为日志传输系统中日志落盘端的最小全局水位。在日志落盘端的最小全局水位达到预定的目标时间窗口的最大时间边界时,可以生成用于指示目标时间窗口的文件目录数据写入完成的通知消息并发送至下游数据处理系统,以告知下游数据处理系统对已经写入完成的目标时间窗口的日志数据进行处理。
进一步地,上述日志传输方法的流程还可以包括:获取日志采集进程上报的发布成功的日志数据的时间信息,并根据发布成功的日志数据的时间信息确定出日志传输系统中尚未发布的日志数据的最早产出时间。这样,可以准确地计算出日志采集端的全局水位,帮助运维人员查询日志传输进度。
需要说明的是,上述日志传输方法可以是由前述日志传输系统中的相应模块实现的,上文针对日志传输系统描述的操作和特征同样适用于日志传输方法,在此不再赘述。
下面参考图4,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的流式计算系统中的节点)400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图4中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所描述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:通过日志采集进程获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;通过日志落盘进程从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,日志采集模块还可以被描述为“获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息的模块”。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种日志传输系统,包括:
日志采集模块,被配置为获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;
消息系统,被配置为从日志采集模块接收日志数据并发布至对应的主题,向日志落盘模块传输其订阅的日志数据;
日志落盘模块,被配置为从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于所述消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
2.根据权利要求1所述的系统,其中,所述日志采集模块的日志发布进度信息包括消息序列号,所述消息序列号用于标识日志数据在消息系统的一个消息分片中的位置;
所述日志采集模块还被配置为:在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。
3.根据权利要求2所述的系统,其中,所述消息系统还被配置为:根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重。
4.根据权利要求1所述的系统,其中,所述日志落盘进度信息包括文件写进度信息;
所述日志落盘模块还被配置为:在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。
5.根据权利要求1所述的系统,其中,所述系统还包括:
水位计算模块,被配置为:
获取日志落盘模块上报的写入成功的日志数据的时间信息,并根据所述写入成功的日志数据的时间信息确定系统中尚未写入的日志数据的最早产出时间;
响应于确定所述系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示所述目标时间窗口的文件目录数据写入完成的通知消息,向所述日志传输系统的下游数据处理系统发送所述通知消息。
6.根据权利要求5所述的系统,所述水位计算模块还被配置为:
获取日志采集模块上报的发布成功的日志数据的时间信息,并根据所述发布成功的日志数据的时间信息确定出系统中尚未发布的日志数据的最早产出时间。
7.一种日志传输方法,包括:
通过日志采集进程获取日志数据,并将日志数据发送至消息系统中,响应于获取到消息系统返回的发布成功消息,更新日志发布进度信息;
通过日志落盘进程从消息系统中获取订阅的日志数据,并根据预设的时间窗口和日志数据中包含的消息时间,将日志数据写入分布式存储系统对应于所述消息时间所在时间窗口的文件目录中,响应于接收到分布式存储系统返回的写入成功消息,更新日志落盘进度信息。
8.根据权利要求7所述的方法,其中,所述日志发布进度信息包括消息序列号,所述消息序列号用于标识日志数据在消息系统的一个消息分片中的位置;
所述方法还包括:
在异常重启后,根据日志发布进度信息中的消息序列号找到最近一条成功发送的日志数据的位置,从最近一条成功发送的日志的位置开始重新发布日志数据。
9.根据权利要求8所述的方法,其中,所述消息系统接收日志数据并发布至对应的主题,并根据日志发布进度信息中的消息序列号对消息分片中的日志数据进行去重。
10.根据权利要求7所述的方法,其中,所述日志落盘进度信息包括文件写进度信息;
所述方法还包括:
在异常重启后,根据文件写进度信息确定最近一次写成功的位置,重新向分布式存储系统写入最近一次写成功的位置之后的日志数据。
11.根据权利要求7所述的方法,其中,所述方法还包括:
获取日志落盘进程上报的写入成功的日志数据的时间信息,并根据所述写入成功的日志数据的时间信息确定日志传输系统中尚未写入的日志数据的最早产出时间;
响应于确定所述系统中尚未写入的日志数据的最早产出时间到达目标时间窗口的最大时间边界,生成用于指示所述目标时间窗口的文件目录数据写入完成的通知消息,向所述日志传输系统的下游数据处理系统发送所述通知消息。
12.根据权利要求11所述的方法,所述方法还包括:
获取日志采集进程上报的发布成功的日志数据的时间信息,并根据所述发布成功的日志数据的时间信息确定出日志传输系统中尚未发布的日志数据的最早产出时间。
13.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求7-12中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求7-12中任一所述的方法。
CN201910533263.1A 2019-06-19 2019-06-19 日志传输系统及流式日志传输方法 Active CN110232054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910533263.1A CN110232054B (zh) 2019-06-19 2019-06-19 日志传输系统及流式日志传输方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910533263.1A CN110232054B (zh) 2019-06-19 2019-06-19 日志传输系统及流式日志传输方法

Publications (2)

Publication Number Publication Date
CN110232054A true CN110232054A (zh) 2019-09-13
CN110232054B CN110232054B (zh) 2021-07-20

Family

ID=67856337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910533263.1A Active CN110232054B (zh) 2019-06-19 2019-06-19 日志传输系统及流式日志传输方法

Country Status (1)

Country Link
CN (1) CN110232054B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111030836A (zh) * 2019-10-25 2020-04-17 苏州浪潮智能科技有限公司 一种snmp trap接收日志消息的方法、设备及介质
CN111064610A (zh) * 2019-12-10 2020-04-24 广州品唯软件有限公司 日志文件的订阅方法、终端设备及存储介质
CN112422412A (zh) * 2020-11-09 2021-02-26 北京百度网讯科技有限公司 信息处理方法、装置、设备和介质
CN112882992A (zh) * 2019-11-29 2021-06-01 北京百度网讯科技有限公司 用于显示信息的方法和装置
CN113590602A (zh) * 2021-07-30 2021-11-02 上海微盟企业发展有限公司 一种消息去重方法、装置、设备及存储介质
CN113641640A (zh) * 2021-08-23 2021-11-12 北京百度网讯科技有限公司 用于流式计算系统的数据处理方法、装置、设备和介质
CN113746685A (zh) * 2021-11-02 2021-12-03 深圳市明源云科技有限公司 基于pulsar日志采集流处理方法、处理装置及可读存储介质
CN114722014A (zh) * 2022-06-09 2022-07-08 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统
WO2022242716A1 (en) * 2021-05-19 2022-11-24 Huawei Cloud Computing Technologies Co., Ltd. Compaction policies for append-only stores
US20230214305A1 (en) * 2022-01-03 2023-07-06 Microsoft Technology Licensing, Llc Diagnostic data collection for kubernetes

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890631A (zh) * 2012-09-13 2013-01-23 新浪网技术(中国)有限公司 基于持久化消息队列传输消息的方法及消息传输装置
CN104036025A (zh) * 2014-06-27 2014-09-10 蓝盾信息安全技术有限公司 一种基于分布式的海量日志采集系统
CN105224445A (zh) * 2015-10-28 2016-01-06 北京汇商融通信息技术有限公司 分布式跟踪系统
CN106354434A (zh) * 2016-08-31 2017-01-25 中国人民大学 日志数据的存储方法及系统
CN108769099A (zh) * 2018-04-02 2018-11-06 武汉斗鱼网络科技有限公司 一种消息中间件的消息去重的实现方法
CN108965355A (zh) * 2017-05-18 2018-12-07 北京京东尚科信息技术有限公司 用于数据传输的方法、装置及计算机可读存储介质
US20180367370A1 (en) * 2015-07-15 2018-12-20 Tupl Inc. Automatic customer complaint resolution
CN109460339A (zh) * 2018-10-16 2019-03-12 北京趣拿软件科技有限公司 日志的流式计算系统
US20190146960A1 (en) * 2017-11-15 2019-05-16 Sumo Logic Data enrichment and augmentation
US20190182101A1 (en) * 2017-12-07 2019-06-13 Cisco Technology, Inc. Log file processing for root cause analysis of a network fabric

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890631A (zh) * 2012-09-13 2013-01-23 新浪网技术(中国)有限公司 基于持久化消息队列传输消息的方法及消息传输装置
CN104036025A (zh) * 2014-06-27 2014-09-10 蓝盾信息安全技术有限公司 一种基于分布式的海量日志采集系统
US20180367370A1 (en) * 2015-07-15 2018-12-20 Tupl Inc. Automatic customer complaint resolution
CN105224445A (zh) * 2015-10-28 2016-01-06 北京汇商融通信息技术有限公司 分布式跟踪系统
CN106354434A (zh) * 2016-08-31 2017-01-25 中国人民大学 日志数据的存储方法及系统
CN108965355A (zh) * 2017-05-18 2018-12-07 北京京东尚科信息技术有限公司 用于数据传输的方法、装置及计算机可读存储介质
US20190146960A1 (en) * 2017-11-15 2019-05-16 Sumo Logic Data enrichment and augmentation
US20190182101A1 (en) * 2017-12-07 2019-06-13 Cisco Technology, Inc. Log file processing for root cause analysis of a network fabric
CN108769099A (zh) * 2018-04-02 2018-11-06 武汉斗鱼网络科技有限公司 一种消息中间件的消息去重的实现方法
CN109460339A (zh) * 2018-10-16 2019-03-12 北京趣拿软件科技有限公司 日志的流式计算系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111030836A (zh) * 2019-10-25 2020-04-17 苏州浪潮智能科技有限公司 一种snmp trap接收日志消息的方法、设备及介质
CN112882992A (zh) * 2019-11-29 2021-06-01 北京百度网讯科技有限公司 用于显示信息的方法和装置
CN111064610A (zh) * 2019-12-10 2020-04-24 广州品唯软件有限公司 日志文件的订阅方法、终端设备及存储介质
CN111064610B (zh) * 2019-12-10 2023-01-03 广州品唯软件有限公司 日志文件的订阅方法、终端设备及存储介质
CN112422412A (zh) * 2020-11-09 2021-02-26 北京百度网讯科技有限公司 信息处理方法、装置、设备和介质
CN112422412B (zh) * 2020-11-09 2023-03-24 北京百度网讯科技有限公司 信息处理方法、装置、设备和介质
WO2022242716A1 (en) * 2021-05-19 2022-11-24 Huawei Cloud Computing Technologies Co., Ltd. Compaction policies for append-only stores
US11681456B2 (en) 2021-05-19 2023-06-20 Huawei Cloud Computing Technologies Co., Ltd. Compaction policies for append-only stores
CN113590602A (zh) * 2021-07-30 2021-11-02 上海微盟企业发展有限公司 一种消息去重方法、装置、设备及存储介质
CN113641640A (zh) * 2021-08-23 2021-11-12 北京百度网讯科技有限公司 用于流式计算系统的数据处理方法、装置、设备和介质
CN113641640B (zh) * 2021-08-23 2023-07-07 北京百度网讯科技有限公司 用于流式计算系统的数据处理方法、装置、设备和介质
CN113746685B (zh) * 2021-11-02 2022-02-25 深圳市明源云科技有限公司 基于pulsar日志采集流处理方法、处理装置及可读存储介质
CN113746685A (zh) * 2021-11-02 2021-12-03 深圳市明源云科技有限公司 基于pulsar日志采集流处理方法、处理装置及可读存储介质
US20230214305A1 (en) * 2022-01-03 2023-07-06 Microsoft Technology Licensing, Llc Diagnostic data collection for kubernetes
US11709749B1 (en) * 2022-01-03 2023-07-25 Microsoft Technology Licensing, Llc Diagnostic data collection for kubernetes
CN114722014B (zh) * 2022-06-09 2022-09-02 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统
CN114722014A (zh) * 2022-06-09 2022-07-08 杭银消费金融股份有限公司 基于数据库日志文件的批量数据时间序列传输方法及系统

Also Published As

Publication number Publication date
CN110232054B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN110232054A (zh) 日志传输系统及流式日志传输方法
CN104520815B (zh) 一种任务调度的方法及装置
CN109523187A (zh) 任务调度方法、装置和设备
CN109815028A (zh) 数据同步的系统、方法、装置和计算机存储介质
CN110019279A (zh) 在线文档的协同更新方法、装置、设备及存储介质
CN109871388A (zh) 数据缓存方法、装置、终电子设备及存储介质
CN109981785A (zh) 用于推送信息的方法和装置
JP2021010156A (ja) 情報を生成する方法および装置
CN109960686A (zh) 数据库的日志处理方法和装置
CN109819048A (zh) 数据同步方法、装置、终端及存储介质
CN109144785A (zh) 用于备份数据的方法和装置
CN113282611B (zh) 一种流数据同步的方法、装置、计算机设备及存储介质
CN109887505A (zh) 用于唤醒设备的方法和装置
JP2024504529A (ja) 欠陥検出方法及びその装置、モデルトレーニング方法及びその装置、及び電子デバイス
CN110399253A (zh) 宕机处理方法和装置
CN109828980A (zh) 数据缓存方法、装置、终端及存储介质
CN113076186B (zh) 任务处理的方法、装置、电子设备和存储介质
CN109766392A (zh) 数据处理方法和装置
CN109697034A (zh) 一种数据写入方法、装置、电子设备及存储介质
CN110232000A (zh) 数据存储管理方法及装置
CN110245120A (zh) 流式计算系统及流式计算系统的日志数据处理方法
WO2021218626A1 (zh) 数据存储方法、装置、设备及存储介质
CN110083657A (zh) 数据互通方法、装置、终端及存储介质
CN110263004A (zh) 日志记录方法、装置、电子设备和存储介质
CN110060477A (zh) 用于推送信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant