CN110460495B - 一种水位推进方法、装置、计算节点及存储介质 - Google Patents

一种水位推进方法、装置、计算节点及存储介质 Download PDF

Info

Publication number
CN110460495B
CN110460495B CN201910708627.5A CN201910708627A CN110460495B CN 110460495 B CN110460495 B CN 110460495B CN 201910708627 A CN201910708627 A CN 201910708627A CN 110460495 B CN110460495 B CN 110460495B
Authority
CN
China
Prior art keywords
computing node
data packet
downstream
upstream
low watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910708627.5A
Other languages
English (en)
Other versions
CN110460495A (zh
Inventor
汪婷
邢越
赵得润
石然
孙英富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910708627.5A priority Critical patent/CN110460495B/zh
Publication of CN110460495A publication Critical patent/CN110460495A/zh
Application granted granted Critical
Publication of CN110460495B publication Critical patent/CN110460495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps

Landscapes

  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Pipeline Systems (AREA)

Abstract

本发明实施例公开了一种水位推进方法、装置、计算节点及存储介质。所述方法包括:上游计算节点检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理。本发明实施例可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性。

Description

一种水位推进方法、装置、计算节点及存储介质
技术领域
本发明实施例涉及流式计算技术领域,尤其涉及一种水位推进方法、装置、计算节点及存储介质。
背景技术
在传统的数据处理流程中,总是先收集数据,然后将数据放到数据库中。当人们需要的时候通过数据库对数据做询问,得到答案或进行相关的处理。这样看起来虽然非常合理,但是结果却非常的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构:流式计算。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。
在流式计算中,Low Watermark(低水位时间戳)用于标记数据流(data pipeline)中最早没有完成的数据的Eventime(事件时间),它承诺不会有早于该时间戳的数据到达,Low Watermark被广泛地应用在窗口计算的场景,比如多流拼接,聚合计算,水位落盘等。在实际场景中,连接上游计算节点和下游计算节点的某个连通管道pipeline中,在一段时间内不产生数据包,称之为流idle。流idle会导致整体水位无法推进,从而导致水位阻塞。在现有技术中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。
发明内容
有鉴于此,本发明实施例提供一种水位推进方法、装置、计算节点及存储介质,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性。
第一方面,本发明实施例提供了一种水位推进方法,应用于上游计算节点,所述方法包括:
检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;
若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理。
在上述实施例中,所述在不存在数据包的各个连通管道内插入Heartbeat数据包,包括:
确定所述上游计算节点在所述当前时刻的低水位时间戳Low Watermark;
根据所述上游计算节点在所述当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,所述Heartbeat数据包携带所述上游计算节点在所述当前时刻的Low Watermark。
第二方面,本发明实施例还提供了一种水位推进方法,应用于下游计算节点,所述方法包括:
检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包;
若与所述上游计算节点之间的各个连通管道在所述预设时间段内存在所述Heartbeat数据包,根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。
在上述实施例中,所述根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理,包括:
根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出所述下游计算节点最久未被处理的数据包的时间戳;
根据所述下游计算节点最久未被处理的数据包的时间戳和预先确定的所述上游计算节点在所述当前时刻的Low Watermark,确定出所述下游计算节点在所述当前时刻的Low Watermark;
根据所述下游计算节点在所述当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
在上述实施例中,所述下游计算节点按照以下公式确定出所述下游计算节点在所述当前时刻的Low Watermark:
Low Watermark B=min(oldest work of B,Low Watermark of A);其中,A为所述上游计算节点;B为所述下游计算节点;Low Watermark of A为所述上游计算节点在所述当前时刻的低水位时间戳;Low Watermark of B为所述下游计算节点在所述当前时刻的低水位时间戳;oldest work of B为所述下游计算节点最久未被处理的数据包的时间戳。
第三方面,本发明实施例提供了一种水位推进装置,所述装置包括:第一检测模块和插入模块;其中,
所述第一检测模块,用于检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;
所述插入模块,用于若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理。
在上述实施例中,所述插入模块包括:第一确定子模块和插入子模块;其中,
所述第一确定子模块,用于确定所述上游计算节点在所述当前时刻的低水位时间戳Low Watermark;
所述插入子模块,用于根据所述上游计算节点在所述当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,所述Heartbeat数据包携带所述上游计算节点在所述当前时刻的Low Watermark。
第四方面,本发明实施例还提供了一种水位推进装置,所述装置包括:第二检测模块和处理模块;其中,
所述第二检测模块,用于检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包;
所述处理模块,用于若与所述上游计算节点之间的各个连通管道在所述预设时间段内存在所述Heartbeat数据包,根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。
在上述实施例中,所述处理模块包括:第二确定子模块和处理子模块;其中,
所述第二确定子模块,用于根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出所述下游计算节点最久未被处理的数据包的时间戳;根据所述下游计算节点最久未被处理的数据包的时间戳和预先确定的所述上游计算节点在所述当前时刻的Low Watermark,确定出所述下游计算节点在所述当前时刻的Low Watermark;
所述处理子模块,用于根据所述下游计算节点在所述当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
在上述实施例中,所述第二确定子模块,具体用于按照以下公式确定出所述下游计算节点在所述当前时刻的Low Watermark:Low Watermark B=min(oldest work of B,Low Watermark of A);其中,A为所述上游计算节点;B为所述下游计算节点;LowWatermark of A为所述上游计算节点在所述当前时刻的低水位时间戳;Low Watermark ofB为所述下游计算节点在所述当前时刻的低水位时间戳;oldest work of B为所述下游计算节点最久未被处理的数据包的时间戳。
第五方面,本发明实施例提供了一种计算节点,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的水位推进方法。
第六方面,本发明实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的水位推进方法。
本发明实施例提出了一种水位推进方法、装置、计算节点及存储介质,上游计算节点先检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。也就是说,在本发明的技术方案中,下游计算节点在检测到与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包时,可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。而在现有的水位推进方法中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。因此,和现有技术相比,本发明实施例提出的水位推进方法、装置、计算节点及存储介质,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
附图说明
图1为本发明实施例一提供的水位推进方法的流程示意图;
图2为本发明实施例二提供的水位推进方法的流程示意图;
图3为本发明实施例三提供的水位推进方法的流程示意图;
图4为本发明实施例四提供的水位推进方法的流程示意图;
图5为本发明实施例五提供的水位推进装置的第一结构示意图;
图6为本发明实施例五提供的水位推进装置的第二结构示意图;
图7为本发明实施例六提供的水位推进装置的第一结构示意图;
图8为本发明实施例六提供的水位推进装置的第二结构示意图;
图9为本发明实施例七提供的计算节点的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1为本发明实施例一提供的水位推进方法的流程示意图,该方法可以由水位推进装置或者上游计算节点来执行,该装置或者上游计算节点可以由软件和/或硬件的方式实现,该装置或者上游计算节点可以集成在任何具有网络通信功能的智能设备中。如图1所示,水位推进方法可以包括以下步骤:
S101、检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包。
在本发明的具体实施例中,上游计算节点可以检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包。具体地,上游计算节点与下游计算节点之间可以设置N个连通管道,分别为:连通管道1、连通管道2、…、连通管道N;其中,N为大于等于1的自然数。在本步骤中,上游计算节点可以检测与下游计算节点之间的连通管道1在预设时间段内是否存在数据包;同时还可以检测与下游计算节点之间的连通管道2在预设时间段内是否存在数据包;同时还可以检测与下游计算节点之间的连通管道3在预设时间段内是否存在数据包;以此类推。需要说明的是,这里的预设时间段是上游计算节点预先设定的一个时间长度,例如,预设时间段可以是1分钟。
S102、若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。
在本发明的具体实施例中,若上游计算节点与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,上游计算节点在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点可以对各个连通管道中的数据包进行处理。例如,假设上游计算节点与下游计算节点之间存在三个连通管道,分别为:连通管道1、连通管道2和连通管道3;假设连通管道1在预设时间段内不存在数据包;连通管道2和连通管道3在预设时间段内存在数据包;在本步骤中,上游计算节点可以在连通管道1内插入Heartbeat数据包,使得下游计算节点可以对连通管道1、连通管道2和连通管道3中的数据包进行处理。
本发明实施例提出的水位推进方法,上游计算节点先检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。也就是说,在本发明的技术方案中,下游计算节点在检测到与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包时,可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。而在现有的水位推进方法中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。因此,和现有技术相比,本发明实施例提出的水位推进方法,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例二
图2为本发明实施例二提供的水位推进方法的流程示意图。如图2所示,水位推进方法可以包括以下步骤:
S201、检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包。
在本发明的具体实施例中,上游计算节点可以检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包。具体地,上游计算节点与下游计算节点之间可以设置N个连通管道,分别为:连通管道1、连通管道2、…、连通管道N;其中,N为大于等于1的自然数。在本步骤中,上游计算节点可以检测与下游计算节点之间的连通管道1在预设时间段内是否存在数据包;同时还可以检测与下游计算节点之间的连通管道2在预设时间段内是否存在数据包;同时还可以检测与下游计算节点之间的连通管道3在预设时间段内是否存在数据包;以此类推。需要说明的是,这里的预设时间段是上游计算节点预先设定的一个时间长度,例如,预设时间段可以是1分钟。
S202、若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,确定上游计算节点在当前时刻的Low Watermark。
在本发明的具体实施例中,若上游计算节点与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,上游计算节点可以确定上游计算节点在当前时刻的LowWatermark。Low Watermark是一个时间戳,上游计算节点和下游计算节点都会维护这样一个时间戳作为Low Watermark,将Low Watermark作为窗口Window的触发源。Low Watermark机制是流式系统中解决数据的完整性以及时效性问题的一种较好的方案,即为每个计算节点设立低水位值,确保了不存在比当前时刻还晚到达的数据。
S203、根据上游计算节点在当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,Heartbeat数据包携带上游计算节点在当前时刻的Low Watermark。
在本发明的具体实施例中,上游计算节点可以根据上游计算节点在当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,Heartbeat数据包携带上游计算节点在当前时刻的Low Watermark。具体地,上游计算节点可以先确定出该Low Watermark在Heartbeat数据包中的存放位置;然后根据该存放位置将Low Watermark存放在Heartbeat数据包中。
本发明实施例提出的水位推进方法,上游计算节点先检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。也就是说,在本发明的技术方案中,下游计算节点在检测到与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包时,可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。而在现有的水位推进方法中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。因此,和现有技术相比,本发明实施例提出的水位推进方法,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例三
图3为本发明实施例三提供的水位推进方法的流程示意图,该方法可以由水位推进装置或者下游计算节点来执行,该装置或者下游计算节点可以由软件和/或硬件的方式实现,该装置或者下游计算节点可以集成在任何具有网络通信功能的智能设备中。如图3所示,水位推进方法可以包括以下步骤:
S301、检测与上游计算节点之间的各个连通管道在预设时间段内是否存在Heartbeat数据包。
在本发明的具体实施例中,下游计算节点可以检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包。具体地,上游计算节点与下游计算节点之间可以设置N个连通管道,分别为:连通管道1、连通管道2、…、连通管道N;其中,N为大于等于1的自然数。在本步骤中,下游计算节点可以检测与上游计算节点之间的连通管道1在预设时间段内是否存在Heartbeat数据包;同时还可以检测与上游计算节点之间的连通管道2在预设时间段内是否存在Heartbeat数据包;同时还可以检测与上游计算节点之间的连通管道3在预设时间段内是否存在Heartbeat数据包;以此类推。需要说明的是,这里的预设时间段是上游计算节点预先设定的一个时间长度,例如,预设时间段可以是1分钟。
S302、若与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包,根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。
在本发明的具体实施例中,若下游计算节点与游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包,根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。例如,假设上游计算节点与下游计算节点之间存在三个连通管道,分别为:连通管道1、连通管道2和连通管道3;假设连通管道1在预设时间段内存在Heartbeat数据包;连通管道2和连通管道3在预设时间段内不存在Heartbeat数据包;在本步骤中,下游计算节点根据Heartbeat数据包以及连通管道2和连通管道3中的数据包携带的时间戳,对连通管道2和连通管道3中的数据包进行处理。
本发明实施例提出的水位推进方法,上游计算节点先检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。也就是说,在本发明的技术方案中,下游计算节点在检测到与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包时,可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。而在现有的水位推进方法中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。因此,和现有技术相比,本发明实施例提出的水位推进方法,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例四
图4为本发明实施例四提供的水位推进方法的流程示意图。如图4所示,水位推进方法可以包括以下步骤:
S401、检测与上游计算节点之间的各个连通管道在预设时间段内是否存在Heartbeat数据包。
在本发明的具体实施例中,下游计算节点可以检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包。具体地,上游计算节点与下游计算节点之间可以设置N个连通管道,分别为:连通管道1、连通管道2、…、连通管道N;其中,N为大于等于1的自然数。在本步骤中,下游计算节点可以检测与上游计算节点之间的连通管道1在预设时间段内是否存在Heartbeat数据包;同时还可以检测与上游计算节点之间的连通管道2在预设时间段内是否存在Heartbeat数据包;同时还可以检测与上游计算节点之间的连通管道3在预设时间段内是否存在Heartbeat数据包;以此类推。需要说明的是,这里的预设时间段是上游计算节点预先设定的一个时间长度,例如,预设时间段可以是1分钟。
S402、若与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包,根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出下游计算节点最久未被处理的数据包的时间戳。
在本发明的具体实施例中,若下游计算节点与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包,下游计算节点可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出下游计算节点最久未被处理的数据包的时间戳。
S403、根据下游计算节点最久未被处理的数据包的时间戳和预先确定的上游计算节点在当前时刻的Low Watermark,确定出下游计算节点在当前时刻的Low Watermark。
在本发明的具体实施例中,下游计算节点可以根据下游计算节点最久未被处理的数据包的时间戳和预先确定的上游计算节点在当前时刻的Low Watermark,确定出下游计算节点在当前时刻的Low Watermark。具体地,下游计算节点可以按照以下公式确定出下游计算节点在当前时刻的Low Watermark:Low Watermark B=min(oldest work of B,LowWatermark of A);其中,A为上游计算节点;B为下游计算节点;Low Watermark of A为上游计算节点在当前时刻的低水位时间戳;Low Watermark of B为下游计算节点在当前时刻的低水位时间戳;oldest work of B为下游计算节点最久未被处理的数据包的时间戳。
S404、根据下游计算节点在当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
在本发明的具体实施例中,下游计算节点可以根据下游计算节点在当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
本发明实施例提出的水位推进方法,上游计算节点先检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;若与下游计算节点之间的各个连通管道在预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入Heartbeat数据包,使得下游计算节点对各个连通管道中的数据包进行处理。也就是说,在本发明的技术方案中,下游计算节点在检测到与上游计算节点之间的各个连通管道在预设时间段内存在Heartbeat数据包时,可以根据Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。而在现有的水位推进方法中,下游计算节点会容忍上游计算节点的延迟,直到上游计算节点开始产生数据包,才能推进水位前进。因此,和现有技术相比,本发明实施例提出的水位推进方法,可以有效地解决水位阻塞的问题,从而可以提高数据处理的及时性和可靠性;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例五
图5为本发明实施例五提供的水位推进装置的第一结构示意图。如图5所示,本发明实施例所述的水位推进装置可以包括:第一检测模块501和插入模块502;其中,
所述第一检测模块501,用于检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;
所述插入模块502,用于若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理。
图6为本发明实施例五提供的水位推进装置的第二结构示意图。如图6所示,所述插入模块502包括:第一确定子模块5021和插入子模块5022;其中,
所述第一确定子模块5021,用于确定所述上游计算节点在所述当前时刻的低水位时间戳Low Watermark;
所述插入子模块5022,用于根据所述上游计算节点在所述当前时刻的LowWatermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,所述Heartbeat数据包携带所述上游计算节点在所述当前时刻的Low Watermark。
上述水位推进装置可执行本发明实施例一和实施例二所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例一和实施例二提供的水位推进方法。
实施例六
图7为本发明实施例六提供的水位推进装置的第一结构示意图。如图7所示,本发明实施例所述的水位推进装置可以包括:第二检测模块701和处理模块702;其中,
所述第二检测模块701,用于检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包;
所述处理模块702,用于若与所述上游计算节点之间的各个连通管道在所述预设时间段内存在所述Heartbeat数据包,根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理。
图8为本发明实施例六提供的水位推进装置的第二结构示意图。如图8所示,所述处理模块702包括:第二确定子模块7021和处理子模块7022;其中,
所述第二确定子模块7021,用于根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出所述下游计算节点最久未被处理的数据包的时间戳;根据所述下游计算节点最久未被处理的数据包的时间戳和预先确定的所述上游计算节点在所述当前时刻的Low Watermark,确定出所述下游计算节点在所述当前时刻的Low Watermark;
所述处理子模块7022,用于根据所述下游计算节点在所述当前时刻的LowWatermark,对各个连通管道中的数据包进行处理。
进一步的,所述第二确定子模块7021,具体用于按照以下公式确定出所述下游计算节点在所述当前时刻的Low Watermark:Low Watermark B=min(oldest work of B,LowWatermark of A);其中,A为所述上游计算节点;B为所述下游计算节点;Low Watermark ofA为所述上游计算节点在所述当前时刻的低水位时间戳;Low Watermark of B为所述下游计算节点在所述当前时刻的低水位时间戳;oldest work of B为所述下游计算节点最久未被处理的数据包的时间戳。
上述水位推进装置可执行本发明实施例三和实施例四所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例三和实施例四提供的水位推进方法。
实施例七
图9为本发明实施例七提供的计算节点的结构示意图。图9示出了适于用来实现本发明实施方式的示例性计算节点的框图。图9显示的计算节点12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算节点12以通用计算设备的形式表现。计算节点12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算节点12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算节点12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算节点12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算节点12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算节点12交互的设备通信,和/或与使得该计算节点12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算节点12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算节点12的其它模块通信。应当明白,尽管图9中未示出,可以结合计算节点12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的水位推进方法。
实施例八
本发明实施例八提供了一种计算机存储介质。
本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种水位推进方法,其特征在于,应用于上游计算节点,所述方法包括:
检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;
若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理;其中,所述在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,包括:确定所述上游计算节点在当前时刻的低水位时间戳LowWatermark;根据所述上游计算节点在所述当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,所述Heartbeat数据包携带所述上游计算节点在所述当前时刻的Low Watermark。
2.一种水位推进方法,其特征在于,应用于下游计算节点,所述方法包括:
检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包;
若与所述上游计算节点之间的各个连通管道在所述预设时间段内存在所述Heartbeat数据包,根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理;其中,所述根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理,包括:根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出所述下游计算节点最久未被处理的数据包的时间戳;根据所述下游计算节点最久未被处理的数据包的时间戳和预先确定的所述上游计算节点在当前时刻的Low Watermark,确定出所述下游计算节点在所述当前时刻的LowWatermark;根据所述下游计算节点在所述当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
3.根据权利要求2所述的方法,其特征在于,所述下游计算节点按照以下公式确定出所述下游计算节点在所述当前时刻的Low Watermark:
Low Watermark B=min(oldest work of B,Low Watermark of A);其中,A为所述上游计算节点;B为所述下游计算节点;Low Watermark of A为所述上游计算节点在所述当前时刻的低水位时间戳;Low Watermark of B为所述下游计算节点在所述当前时刻的低水位时间戳;oldest work of B为所述下游计算节点最久未被处理的数据包的时间戳。
4.一种水位推进装置,其特征在于,所述装置包括:第一检测模块和插入模块;其中,
所述第一检测模块,用于检测与下游计算节点之间的各个连通管道在预设时间段内是否存在数据包;
所述插入模块,用于若与所述下游计算节点之间的各个连通管道在所述预设时间段内不存在数据包,在不存在数据包的各个连通管道内插入心跳Heartbeat数据包,使得所述下游计算节点对各个连通管道中的数据包进行处理;其中,所述插入模块包括:第一确定子模块和插入子模块;其中,所述第一确定子模块,用于确定上游计算节点在当前时刻的低水位时间戳Low Watermark;所述插入子模块,用于根据所述上游计算节点在所述当前时刻的Low Watermark,在不存在数据包的各个连通管道内插入Heartbeat数据包;其中,所述Heartbeat数据包携带所述上游计算节点在所述当前时刻的Low Watermark。
5.一种水位推进装置,其特征在于,所述装置包括:第二检测模块和处理模块;其中,
所述第二检测模块,用于检测与上游计算节点之间的各个连通管道在预设时间段内是否存在心跳Heartbeat数据包;
所述处理模块,用于若与所述上游计算节点之间的各个连通管道在所述预设时间段内存在所述Heartbeat数据包,根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,对各个连通管道中的数据包进行处理;其中,所述处理模块包括:第二确定子模块和处理子模块;其中,所述第二确定子模块,用于根据所述Heartbeat数据包和各个连通管道中的数据包携带的时间戳,确定出下游计算节点最久未被处理的数据包的时间戳;根据所述下游计算节点最久未被处理的数据包的时间戳和预先确定的所述上游计算节点在当前时刻的Low Watermark,确定出所述下游计算节点在所述当前时刻的Low Watermark;所述处理子模块,用于根据所述下游计算节点在所述当前时刻的Low Watermark,对各个连通管道中的数据包进行处理。
6.根据权利要求5所述的装置,其特征在于,所述第二确定子模块,具体用于按照以下公式确定出所述下游计算节点在所述当前时刻的Low Watermark:Low Watermark B=min(oldest work of B,Low Watermark of A);其中,A为所述上游计算节点;B为所述下游计算节点;Low Watermark of A为所述上游计算节点在所述当前时刻的低水位时间戳;LowWatermark of B为所述下游计算节点在所述当前时刻的低水位时间戳;oldest work of B为所述下游计算节点最久未被处理的数据包的时间戳。
7.一种计算节点,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至3中任一项所述的水位推进方法。
8.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至3中任一项所述的水位推进方法。
CN201910708627.5A 2019-08-01 2019-08-01 一种水位推进方法、装置、计算节点及存储介质 Active CN110460495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910708627.5A CN110460495B (zh) 2019-08-01 2019-08-01 一种水位推进方法、装置、计算节点及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910708627.5A CN110460495B (zh) 2019-08-01 2019-08-01 一种水位推进方法、装置、计算节点及存储介质

Publications (2)

Publication Number Publication Date
CN110460495A CN110460495A (zh) 2019-11-15
CN110460495B true CN110460495B (zh) 2024-02-23

Family

ID=68484554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910708627.5A Active CN110460495B (zh) 2019-08-01 2019-08-01 一种水位推进方法、装置、计算节点及存储介质

Country Status (1)

Country Link
CN (1) CN110460495B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127512B (zh) * 2020-01-15 2023-09-29 百度在线网络技术(北京)有限公司 多数据流的数据拼接触发方法、装置、电子设备和介质
CN111478949B (zh) * 2020-03-25 2022-05-24 中国建设银行股份有限公司 数据处理方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102064962A (zh) * 2010-12-06 2011-05-18 南京恩瑞特实业有限公司 基于命名管道通信的列车自动监控系统输入输出组件的实现方法
EP2592890A1 (en) * 2011-11-11 2013-05-15 Itron, Inc. Traffic load management for uplink network traffic
CN104270790A (zh) * 2014-10-23 2015-01-07 湘潭大学 基于信道公平分配的拥塞控制方法
CN105791016A (zh) * 2016-03-09 2016-07-20 浪潮通信信息系统有限公司 一种基于流式计算的分布式故障管理告警处理系统
CN106060029A (zh) * 2016-05-24 2016-10-26 杭州华三通信技术有限公司 一种虚拟桌面的访问控制方法及装置
CN106464960A (zh) * 2014-05-30 2017-02-22 高通股份有限公司 用于在对回放用户体验有最小影响的情况下减少对多媒体流送数据的预获取的方法
CN107124329A (zh) * 2017-04-25 2017-09-01 济南大学 基于低水位滑动时间窗口的离群数据发现方法及系统
CN107491359A (zh) * 2016-06-12 2017-12-19 山东商务职业学院 一种分布式海量实时数据流灾难恢复系统及方法
CN107526631A (zh) * 2017-09-01 2017-12-29 百度在线网络技术(北京)有限公司 一种任务监控方法、装置、设备和介质
CN109145023A (zh) * 2018-08-30 2019-01-04 北京百度网讯科技有限公司 用于处理数据的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706914B2 (en) * 2007-04-23 2014-04-22 David D. Duchesneau Computing infrastructure
US20120284392A1 (en) * 2011-05-03 2012-11-08 General Electric Company Mesh data network data management system, node, and computer program product
US10057382B2 (en) * 2015-09-24 2018-08-21 Amrita Vishwa Vidyapeetham Intelligent “IoT gateway”
EP3491775A4 (en) * 2016-07-27 2020-02-26 Akamai Technologies, Inc. SHARING OF CRYPTOGRAPHIC MATERIAL BETWEEN ENTITIES WITHOUT CONNECTIVITY OR RELATIONSHIP OF DIRECT TRUST

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102064962A (zh) * 2010-12-06 2011-05-18 南京恩瑞特实业有限公司 基于命名管道通信的列车自动监控系统输入输出组件的实现方法
EP2592890A1 (en) * 2011-11-11 2013-05-15 Itron, Inc. Traffic load management for uplink network traffic
CN106464960A (zh) * 2014-05-30 2017-02-22 高通股份有限公司 用于在对回放用户体验有最小影响的情况下减少对多媒体流送数据的预获取的方法
CN104270790A (zh) * 2014-10-23 2015-01-07 湘潭大学 基于信道公平分配的拥塞控制方法
CN105791016A (zh) * 2016-03-09 2016-07-20 浪潮通信信息系统有限公司 一种基于流式计算的分布式故障管理告警处理系统
CN106060029A (zh) * 2016-05-24 2016-10-26 杭州华三通信技术有限公司 一种虚拟桌面的访问控制方法及装置
CN107491359A (zh) * 2016-06-12 2017-12-19 山东商务职业学院 一种分布式海量实时数据流灾难恢复系统及方法
CN107124329A (zh) * 2017-04-25 2017-09-01 济南大学 基于低水位滑动时间窗口的离群数据发现方法及系统
CN107526631A (zh) * 2017-09-01 2017-12-29 百度在线网络技术(北京)有限公司 一种任务监控方法、装置、设备和介质
CN109145023A (zh) * 2018-08-30 2019-01-04 北京百度网讯科技有限公司 用于处理数据的方法和装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Roadmap Toward the Resilient Internet of Things for Cyber-Physical Systems;Denise Ratasich等;《IEEE Access》;全文 *
一种基于信息熵的WSN节点拥塞避免机制;褚红玉;陈光;;现代电子技术(10);全文 *
基于心跳包的Socket通信在危险源无线监测中的应用研究;朱建淼;贾波;华金晶;汪圣华;;安全(04);全文 *
节点位置无关的无线传感器网络连通性部分覆盖协议;毛莺池;王志坚;陈力军;陈道蓄;;微电子学与计算机(10);全文 *
面向大数据的分布式流处理技术综述;张鹏等;《计算机研究与发展》;全文 *

Also Published As

Publication number Publication date
CN110460495A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN110457277B (zh) 业务处理性能分析方法、装置、设备及存储介质
US10755052B2 (en) Semantic disambiguation method, device, server and storage medium
US8756269B2 (en) Monitoring a path of a transaction across a composite application
CN110460495B (zh) 一种水位推进方法、装置、计算节点及存储介质
CN103822097A (zh) 在流体输送管道中估计负压波的波速的方法及装置
CN111259022B (zh) 一种信息同步方法、同步系统、计算机设备和介质
CN111061740B (zh) 一种数据同步方法、设备和存储介质
WO2017070349A1 (en) System and method for annotating client-server transactions
US8223136B2 (en) Error detection and prevention inacoustic data
CN111814033A (zh) 用于投放的媒介信息确定方法、装置、设备和存储介质
CN107817962B (zh) 一种远程控制方法、装置、控制服务器及存储介质
CN114266170B (zh) 一种燃气输配管网中气源供应范围识别方法和装置
CN109151033B (zh) 基于分布式系统的通信方法、装置、电子设备及存储介质
CN108399128A (zh) 一种用户数据的生成方法、装置、服务器及存储介质
CN101594305A (zh) 一种报文处理方法及装置
CN111930385A (zh) 数据采集方法、装置、设备及存储介质
CN109189332A (zh) 一种磁盘挂载方法、装置、服务器及存储介质
CN115865753A (zh) 数据处理方法、装置、电子设备
CN109800361A (zh) 一种兴趣点名称的挖掘方法、装置、电子设备及存储介质
CN111862052B (zh) 检测缝隙的方法、装置、设备及介质
CN113760988A (zh) 一种无界流数据关联处理方法、装置、设备及存储介质
CN112364268A (zh) 资源获取方法、装置、电子设备及存储介质
CN110085237B (zh) 交互过程的恢复方法、装置及设备
CN112667614A (zh) 一种数据处理方法、装置及计算机设备
CN111581173A (zh) 日志系统分布式存储的方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant