CN112448858B - 网络通信控制方法及装置、电子设备和可读存储介质 - Google Patents

网络通信控制方法及装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN112448858B
CN112448858B CN202110134036.9A CN202110134036A CN112448858B CN 112448858 B CN112448858 B CN 112448858B CN 202110134036 A CN202110134036 A CN 202110134036A CN 112448858 B CN112448858 B CN 112448858B
Authority
CN
China
Prior art keywords
node
management
control
operating
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110134036.9A
Other languages
English (en)
Other versions
CN112448858A (zh
Inventor
胡伟煌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110134036.9A priority Critical patent/CN112448858B/zh
Publication of CN112448858A publication Critical patent/CN112448858A/zh
Application granted granted Critical
Publication of CN112448858B publication Critical patent/CN112448858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提供一种网络通信控制方法、装置以及电子设备和计算机可读存储介质,应用于管控节点,管控节点中部署有管控代理组件,包括:通过管控代理组件获取第一运行节点发送的心跳消息,以便根据第一运行节点发送的心跳消息向第一运行节点提供服务;当第一运行节点的心跳消息延迟、且第一运行节点启动节点自治模式时,获取由管控代理组件代理第一运行节点产生的虚拟心跳消息;根据管控代理组件代理第一运行节点产生的虚拟心跳消息维持向第一运行节点提供的服务;当管控代理组件再次检测到第一运行节点发送的心跳信息时,管控节点与第一运行节点建立通信信道;将管控节点中针对第一运行节点的管控数据通过通信信道同步至第一运行节点。

Description

网络通信控制方法及装置、电子设备和可读存储介质
技术领域
本公开涉及计算机与互联网技术领域,尤其涉及一种网络通信控制方法及装置、电子设备和计算机可读存储介质。
背景技术
随着互联网的发展,通过服务节点(例如服务器)向用户提供网络服务越来越普及,用户对网络应用中的网络通信质量的要求也越来越高。
一般来说,网络应用涉及的通信可以包括提供服务的节点与用户所在设备之间的通信,而同一服务又可以由管控节点控制运行节点完成,例如云服务可以由云端节点(一种管控节点)控制边缘端节点(一种运行节点)协作完成。
由于上述管控节点和运行节点可以在不同的地理位置处,因此管控节点和运行节点之间网络不稳定(例如述管控节点和运行节点经常发生断网)对管控节点和运行节点之间的信号传输影响非常大。
本公开实施例针对管控节点和运行节点网络不稳定这一场景(包括网络信号弱或者断网等)提供了一种网络通信控制方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开实施例提供一种网络通信控制方法及装置、电子设备和计算机可读存储介质,能够在网络不稳定的情况下使管控节点维持向第一运行节点提供的服务,以便在网络恢复时继续向第一运行节点提供服务,实现了在网络不稳定的场景下管控节点对第一运行节点的控制。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供了一种网络通信控制方法,该方法应用于管控节点,所述管控节点中部署有管控代理组件,所述方法包括:通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
本公开实施例提供了一种网络通信控制方法,所述方法应用于第一运行节点,所述第一运行节点属于运行节点单元,所述运行节点单元被管控节点控制,所述第一运行节点部署有边缘代理组件、边缘信道组件以及本地数据库,所述方法包括:通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;当所述心跳消息发送超时,所述第一运行节点启动节点自治模式;在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行;当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的所述管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据;基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行;关闭所述节点自治模式。
本公开实施例提供了一种网络通信控制装置,该装置可以应用于管控节点,所述管控节点中部署有管控代理组件,所述装置可以包括:心跳消息获取模块、虚拟心跳消息生成模块、服务维持模块、通信信道建立模块以及数据同步模块。
其中,所述心跳消息获取模块可以配置为通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;所述虚拟心跳消息生成模块可以配置为当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;所述服务维持模块可以配置为根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;所述通信信道建立模块可以配置为当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;所述数据同步模块可以配置为将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
在一些实施例中,所述管控节点中还部署有边缘控制组件。其中,所述虚拟心跳消息生成模块可以包括:心跳健康数据获取单元、未宕机确定单元、节点自治模式启动单元以及虚拟心跳消息产生单元。
其中,所述心跳健康数据获取单元可以配置为当所述第一运行节点的心跳消息延迟,则通过所述管控代理组件获取第二运行节点发送的针对所述第一运行节点的心跳健康数据,所述针对所述第一运行节点的心跳健康数据是根据所述第二运行节点从所述第一运行节点接收到的心跳消息生成的;所述未宕机确定单元可以配置为所述边缘控制组件根据所述第二运行节点发送的所述针对所述第一运行节点的心跳健康数据确定所述第一运行节点未宕机;所述节点自治模式启动单元可以配置为所述边缘控制组件确定所述第一运行节点启动节点自治模式;所述虚拟心跳消息产生单元可以配置为所述管控代理组件代理所述第一运行节点产生虚拟心跳消息。
在一些实施例中,所述第二运行节点的个数大于或者等于1个;其中,所述未宕机确定单元可以包括:心跳健康数据获取子单元、个数确定子单元以及未宕机判断子单元。
其中,所述心跳健康数据获取子单元可以配置为所述边缘控制组件从所述管控代理组件获取所述第二运行节点发送的针对所述第一运行节点的心跳健康数据;所述个数确定子单元可以配置为确定心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数;所述未宕机判断子单元可以配置为若心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数大于或者等于目标个数阈值,则确定所述第一运行节点未宕机。
在一些实施例中,所述网络通信控制装置还可以包括:宕机确定子单元、和告警信息生成子单元。
其中,所述宕机确定子单元可以配置为若所述第一运行节点与所述管控节点失联,且心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数小于所述目标个数阈值,则确定所述第一运行节点宕机;所述告警信息生成子单元可以配置为生成告警提示信息,以用于通知目标对象对所述第一运行节点对应的设备进行维修。
在一些实施例中,所述管控节点还部署有管控信道组件,所述第一运行节点部署有边缘信道组件,所述通信信道是通过所述管控信道组件与所述边缘信道组件建立的;其中,所述网络通信控制装置还可以包括:失联原因确定请求发送模块、失联原因确定数据接收模块以及失联原因确定模块。
其中,所述失联原因确定请求发送模块可以配置为所述管控节点通过所述管控信道组件,经由所述通信信道向所述第一运行节点发送失联原因确定请求;所述失联原因确定数据接收模块可以配置为接收所述第一运行节点通过所述边缘信道组件,经由所述通信信道返回的失联原因确定数据;所述失联原因确定模块可以配置为根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因。
在一些实施例中,所述失联原因确定请求包括服务日志获取请求;其中,所述失联原因确定模块可以包括:目标服务日志接收单元和失联目标服务日志分析单元。
其中,所述目标服务日志接收单元可以配置为所述管控节点通过所述通信信道接收所述第一运行节点针对所述服务日志获取请求返回的目标服务日志;所述目标服务日志分析单元可以配置为根据所述目标服务日志确定所述第一运行节点与所述管控节点失联的原因。
在一些实施例中,所述失联原因确定请求包括针对所述第一运行节点中的目标容器组的登录操作请求;其中,所述失联原因确定模块可以包括:长连接建立单元、目标操作数据获取单元以及目标操作数据分析单元。
其中,所述长连接建立单元可以配置为通过所述通信信道,所述管控节点与所述第一运行节点的目标容器组建立长连接;所述目标操作数据获取单元可以配置为通过所述长连接,所述管控节点从所述目标容器组获取目标操作数据;所述目标操作数据分析单元可以配置为根据所述目标操作数据确定所述第一运行节点与所述管控节点失联的原因。
本公开实施例提供了一种网络通信控制装置,所述装置可以应用于第一运行节点,所述第一运行节点属于运行节点单元,所述运行节点单元被管控节点控制,所述第一运行节点部署有边缘代理组件、边缘信道组件以及本地数据库。所述装置可以包括:心跳消息发送模块、节点自治模块、本地数据获取模块、管控数据获取模块、数据更新模块以及节点自治模式关闭模块。
其中,所述心跳消息发送模块可以配置为通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;所述节点自治模块可以配置为当所述心跳消息发送超时,所述第一运行节点启动节点自治模式;所述本地数据获取模块可以配置为在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行;所述管控数据获取模块可以配置为当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的所述管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据;所述数据更新模块可以配置为基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行;所述节点自治模式关闭模块可以配置为关闭所述节点自治模式。
在一些实施例中,所述数据更新模块可以包括:差别数据确定单元、数据更新单元以及运行单元。
其中,所述差别数据确定单元可以配置为确定所述管控数据中相对于所述本地数据库中的本地数据的差别数据;所述数据更新单元可以配置为根据所述管控数据中相对于所述本地数据的差别数据对所述本地数据库中的本地数据进行更新;所述运行单元可以配置为所述第一运行节点根据所述管控数据中相对于所述本地数据的差别数据运行。
在一些实施例中,所述第一运行节点中还部署有第一心跳探测组件,所述网络通信控制装置可以包括:发送心跳消息单元。
其中,所述发送心跳消息单元可以配置为所述第一运行节点通过所述第一心跳探测组件向第二运行节点的第二心跳探测组件发送心跳消息,以便所述第二运行节点根据所述第一运行节点发送的心跳消息确定所述第一运行节点的心跳健康数据,便于所述管控节点根据所述第一运行节点的心跳健康数据确定所述第一运行节点是否宕机。
本公开实施例提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一项所述的网络通信控制方法。
本公开实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述任一项所述的网络通信控制方法。
本公开实施例提出一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述网络通信控制方法。
本公开实施例提供的网络通信控制方法、装置及电子设备和计算机可读存储介质,一方面通过第一运行节点发送的心跳消息准确地确定了第一运行节点与管控节点之间失联、且第一运行节点开启了节点自治模式;另一方面,在第一运行节开启节点自治的情况下,管控节点维持了向第一运行节点提供的服务,以便在通信重新建立后管控节点能够继续对第一运行节点进行控制和管理,维持了管控节点向第一运行节点提供 服务的连续性,提高了管控节点在网络不稳定场景下对第一运行节点的控制;另外,通过在管控节点中设置管控代理组件、边缘控制组件、管控信道组件等,使得本公开实施例提供的方法与管控节点中其它的功能模块进行解耦,复用性高、可扩展性强。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用于本公开实施例的网络通信控制方法或网络通信控制装置的示例性系统架构的示意图。
图2是根据一示例性实施例示出的一种应用于网络通信控制装置的计算机系统的结构示意图。
图3是根据一示例性实施例示出的一种网络通信控制方法的流程图。
图4是图3中步骤S2在一示例性实施例中的流程图。
图5是根据一示例性实施例示出的一种断网原因确定方法。
图6是根据一示例性实施例示出的一种网络通信控制方法的流程图。
图7是根据一示例性实施例示出的一种网络通信控制架构图。
图8是根据一示例性实施例示出的一种网络通信架构布置方法。
图9是结合图7示出的一种网络通信控制方法。
图10是根据一示例性实施例示出的一种网络通信控制装置的框图。
图11是根据一示例性实施例示出的一种网络通信控制装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
本公开所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和步骤,也不是必须按所描述的顺序执行。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本说明书中,用语“一个”、“一”、“该”、“所述”和“至少一个”用以表示存在一个或多个要素/组成部分/等;用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”、“第二”和“第三”等仅作为标记使用,不是对其对象的数量限制。
在一些应用场景中,当用户通过某终端设备向某服务提供节点请求目标服务时,该服务提供节点会根据终端设备的请求向该终端设备提供目标服务。其中,该服务提供节点可以是分布式的云服务器,也可以是中心机房服务器,本公开对此不做限制。
在一些实施例中,对于一些重复性较高、周期性较强或者时限要求较高的工作服务等,该服务提供节点可以将其定义为一个任务,然后控制其它服务器自动运行完成。为了便于说明,本公开将上述主控的服务提供节点称之为管控节点,将被管控节点控制并向终端设备提供服务的节点称之为运行节点。
在一些实施例中,运行节点与终端设备可以不同也可以相同(例如该终端设备可以就是运行节点),本公开对此不做限制。
图1示出了可以应用于本公开实施例的网络通信控制方法或网络通信控制装置的示例性系统架构的示意图。
下面,将结合图1解释本公开实施例的应用场景。
如图1所示,系统架构100可以包括:管控节点101、第一运行节点102、第二运行节点103(为方便理解,本实施例仅以两个运行节点为例,但本公开并不限制于此)以及终端设备104。管控节点101与第一运行节点102(第二运行节点103)之间或者第一运行节点(第二运行节点103)与终端设备104之间可以通过网络进行通信,该网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端104向管控节点101发出请求(例如下载目标视频的请求),以请求管控节点101提供目标服务(例如提供目标视频的下载服务等);当管控节点101接收到终端104的请求后,会根据该请求向第一运行节点发出控制指令以控制第一运行节点102运行完成该目标服务(例如控制第一运行节点102下载目标视频);第一运行节点102会根据管控节点101下发的控制指令运行以完成指定目标服务。
在本公开中,管控节点101可以指的是一种云端控制节点,该云端可以是公有云、私有云、中心云、边缘云等任意云,本公开对此不做限制;该管控节点还可以指的是一种中心机房(例如),本公开对此不做限制。
可以理解的是,管控节点101中对应的设备可以包括任意具有计算能力的设备,例如服务器、终端设备,其中终端设备可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、智能家居等等。
在本公开中,管控节点101可例如完成以下功能:通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
在本公开中,第一运行节点102或第二运行节点103可以指的是被管控节点101控制的向终端设备104提供服务的服务节点。可以理解的是,该第一运行节点102或第二运行节点103可以包括一个机器,也可以包括一个机房中的多个机器,还可以包括是分布在多个地方的多个机器,本公开对此不做限制。
在本公开中,第一运行节点102或第二运行节点103可例如完成以下功能:通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;当所述心跳消息发送超时,所述第一运行节点启动节点自治模式;在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行;当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的所述管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据;基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行;关闭所述节点自治模式。
可以理解的是,第一运行节点102或第二运行节点103中对应的设备可以包括任意具有计算能力的设备,例如服务器、终端设备,其中终端设备可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、智能家居等等。
在本公开中,终端设备104可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、智能家居等等,本公开对此不做限制。
本公开中涉及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器等,本公开对此不做限制。
应该理解,图1中的运行节点、终端设备的数目仅仅是示意性的,运行节点或终端设备的个数可以是一个还可以是多个,根据实际需要,可以具有任意数目的终端、运行节点等。
另外,如本申请所公开的网络通信控制方法或装置,其中管控节点、运行节点以及终端设备可以组成一区块链,而管控节点、运行节点以及终端设备均可以为区块链上的节点,由该管控节点或者运行节点向终端设备提供的服务数据、终端数设备向管控节点或者运行节点返回的数据等均可以上链至该区块链以进行存储和共享,本公开对此不做限制。
例如,管控节点从各个运行节点接收到的心跳系信息、心跳健康数据以及由管控代理组件代理产生的虚拟心跳消息等可以共享至目标区块链以供后续查看;管控节点控制各个运行节点的也管控数据可以上传至目标区块链中;各个运行节点在运行过程中产生的数据可以上传至目标区块链中;目标终端在运行过程中产生的数据等也可以上传至目标区块链,以实现数据的存储和共享;本公开对此不做限制。
下面参考图2,其示出了适于用来实现本申请实施例的管控节点、各个运行节点所对应的设备(例如终端设备或服务器)的计算机系统200的结构示意图。图2示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统200操作所需的各种程序和数据。CPU 201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块和/或单元和/或子单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元和/或子单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些模块和/或单元和/或子单元的名称在某种情况下并不构成对该模块和/或单元和/或子单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备可实现功能包括:管控节点通过管控代理组件获取针对第一运行节点的心跳消息;所述管控节点的边缘控制组件根据所述针对第一运行节点的心跳消息确定所述第一运行节点处于与所述管控节点断网状态;所述管控节点的边缘控制组件控制所述管控节点保留所述第一运行节点;通过所述管控节点的管控信道组件接收所述第一运行节点的发送的通信建立请求;响应所述通信建立请求,所述管控节点建立与所述第一运行节点之间的通信信道;通过所述通信信道,所述管控节点将针对所述第一运行节点的第一控制指令数据同步至所述第一运行节点,以对所述第一运行节点进行管理。
在介绍本公开提供的技术方案之前,可以对本公开实施例涉及的各个组件进行介绍。
在一些实施例中,可以在管控节点中部署:
管控控制中心,可以用来为各个运行节点提供服务;
管控代理组件,可以用来接收各个运行节点上传的心跳信息,并在运行节点的心跳信息发生延迟时,替代运行节点做心跳上报,使得管控节点的管控控制中心不会主动驱逐、删除及重复创建该运行节点的服;
管控信道组件,可以用来与运行节点的边缘信道组件建立通信,来实现管控节点与运行节点之间的数据传输;
边缘控制组件,当运行节点处于节点自治模式下,边缘控制组件控制管控控制中心不对该运行节点进行驱逐或重建等操作。
在一些实施例中,可以在运行节点中部署:
边缘代理组件,可以用来向管控节点接发心跳信息,并在节点自治时代理管控节点的控制功能,通过本地数据直接管理运行节点的服务;
边缘信道组件,可以用来与管控节点的管控信道组件建立通信,来实现管控节点与运行节点之间的数据传输;
心跳探测组件,用来探测其它运行节点对应的设备的心跳健康数据;
本地数据库,存储跟当前运行节点相关的数据、证书等内容,用于在节点自治模式下,运行节点可以直接读取本地数据来对运行节点的本地服务进行管理。当网络恢复的情况下,则同步管控节点的数据到本地数据,保障管控节点的数据与本地数据的一致性。
可以理解的是,本实施例中提到的每个组件都有相应的功能,当将一个节点中的某些组件进行拆分或者合并来实现对应的功能时,仍然属于本公开涉及的内容。例如将管控节点中的管控代理组件和边缘控制组件合成一个统一的组件以实现两者的功能等也属于本公开的保护范围。
另外,本公开的组件命名是基于组件的功能特点来命名的,如果以其他的命名方式来实现相同或者类似的功能,仍然属于本公开保护的范围。例如,管控代理组件也可以叫做云端代理组件Cloud Hub等,本公开对此不做限制。
在一些实施例中,管控节点与运行节点通常需要通过网络进行通信,该网络可以是有线网也可以是无线网。但是,在一些网络场景下,管控节点与运行节点经常会出现网络不稳定(例如断网或者弱网)等情形。在相关技术中,一旦发生网络不稳定的情况,管控节点会将发生断网或者网络不稳定的运行节点驱逐(即不再通过该运行节点向终端设备提供服务,转而为其它运行节点构建服务以重新向终端设备提供服务)。
但是,管控节点将发生断网或者网络不稳定的运行节点驱逐,并为其它节点重建服务以向终端设备重新提供目标服务的情况,经常会导致管控节点向终端设备提供的服务发生中断、或者服务不连续等问题,极大的影响了用户体验。
在另外一些技术中,可以通过添加网络稳定的通信渠道来规避网络不稳定的场景,忽略对网络不稳定场景的处理,或者重构运行节点的管控组件(例如云边计算中边缘端的kubelet(一种节点代理组件))来集成对运行节点在网络不稳定场景下的管理能力。
如果通过增加网络稳定的通信渠道(例如VPN)来规避网络不稳定的情景,那么部署和维护该通信渠道过于复杂及繁琐,且部分运行节点的设备资源不支持部署额外的通信的渠道。
如果是重构运行节点的管控组件来集成对运行节点在网络不稳定下的管理能力,该过程过于复杂且可维护性差,无法跟随开源社区的产品迭代及bug修复;可扩展性差,一旦重构无法复用于其他应用场景,导致重构后组件过于耦合于某一类边缘设备的场景。
因此,本公开提供了一种网络通信控制方法,可以简单、有效地解决网络通信不稳定的情况下不同节点之间的通信问题。
图3是根据一示例性实施例示出的一种网络通信控制方法的流程图。本公开实施例所提供的方法可以由管控节点执行,该管控节点可以指的是一种云端节点(一种分布式计算节点)也可是一种中心节点(一种中心计算节点,例如中心机房),本公开对此不做限制。在下面的实施例中,以云端节点为执行主体为例进行举例说明,但本公开并不限定于此。
在一种应用场景中,管控节点可以通过控制指令数据对多个运行节点进行控制,以向目标终端设备提供服务。其中,运行节点可以设置在目标终端设备中,也可以设置在目标终端设备附近,还可以设置在目标终端的远方,本公开对运行节点与目标终端之间的距离和惯性不做限制。
参照图3,本公开实施例提供的网络通信控制方法可以包括以下步骤。
在步骤S1中,通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务。
心跳消息是一种发送方发送到接收方的消息,这种消息可以让接收方确定发送方是否以及何时出现故障、终止等。
在本公开中,管控节点与运行节点之间、各个运行节点之间可以互相收发心跳消息,以互相探测对方设备或者通信网络是否正常运行。
在一些实施例中,可以在管控节点中布置一个管控代理组件,以接收各个运行节点(包括第一运行节点、第二运行节点、第三运行节点……)发送的心跳消息。
在一些实施例中,管控节点中的管控控制中心组件可以根据第一运行节点上传的心跳消息向第一运行节点提供服务的(具体来说,当管控节点正常接收到第一运行节点上传的心跳信息时,管控节点会向第一运行提供控制指令数据,以控制第一运行节点向终端设备提供目标服务)。
在相关技术中,管控节点中的管控控制中心组件只有在正常接收到第一运行节点上传的心跳消息时,才会向第一运行节点发送数据,以控制第一运行节点向终端设备提供服务;一旦第一运行节点上传的心跳消息不正常(例如心跳消息延迟),管控节点的管控控制中心组件会将第一运行节点驱逐,并通过其它运行节点重建服务,以继续向终端设备提供目标服务。
在步骤S2中,当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息。
在一些实施例中,当边缘控制组件判断第一运行节点的心跳消息延迟时,则可以第一运行节点与管控节点之间的通信终端,并认为第一运行节点启动了节点自治模式。
在一些实施例中,当判断第一运行节点的心跳消息延迟、且第一运行节点启动节点自治模式时,可以由管控代理组件代理第一运行节点产生虚拟心跳消息,以使得管控控制中心组件认为第一运行节点当前正在正常运行,不对第一运行节点进行驱逐。
可以理解的是,管控节点中的管控控制中心组件只有在正常接收到第一运行节点的心跳消息时,才会向第一运行节点正常提供服务。在本实施例中,虽然第一运行节点已经不能正常发送心跳消息了,但是管控代理组件代理第一运行节点生成了虚拟心跳消息,“欺骗”管控节点的管控控制中心“第一运行节点当前正在正常运行”。
在步骤S3中,根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务。
当收到管控代理组件上传的虚拟心跳消息时,管控节点的管控控制中心会认为第一运行节点正在正常运行,就不会对第一运行节点进行驱逐。换句话说,管控节点就会保留针对第一运行节点的服务,例如保留针对第一运行节点的控制指令数据、存储的资源等,本公开对此不做限制。
可以理解的是,在管控节点的管控控制中心维持向所述第一运行节点提供的服务期间,管控节点依然可以针对第一运行节点生成控制指令数据。
在步骤S4中,当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道。
在一些实施例中,在第一运行节点与管控节点断网期间,第一运行节点会通过边缘信道组件不断地向管控节点发送通信建立请求,以便与管控节点重新建立通信,该通信建立请求可以包括第一运行节点的标识信息、第一运行节点的边缘信道组件信息以及其它一些组件的地址信息。
在一些实施例中,当管控节点接收到第一运行节点发送的通信建立请求后,会与第一运行节点建立通信,并通过边缘信道组件的地址信息建立起管控信道组件与边缘信道组件之间的通信信道,以保证管控节点与第一运行节点之间能够进行tcp(TransmissionControl Protocol,传输控制协议)、http(s)(超文本传输协议)、stream(流)、控制指令等数据的收发。可以理解的是,本公开对上述通信信道中传输的数据不进行限制。
在步骤S5中,将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
本实施例提供的技术方案,一方面通过第一运行节点发送的心跳消息准确地确定了第一运行节点与管控节点之间失联、且第一运行节点开启了节点自治模式;另一方面,在第一运行节开启节点自治的情况下,管控节点维持了向第一运行节点提供的服务,以便在通信重新建立后管控节点能够继续对第一运行节点进行控制和管理,维持了管控节点向第一运行节点提供 服务的连续性,提高了管控节点在网络不稳定场景下对第一运行节点的控制;另外,通过在管控节点中设置管控代理组件、边缘控制组件、管控信道组件等,使得本公开实施例提供的方法与管控节点中其它的功能模块进行解耦,复用性高、可扩展性强。
图4是图3中步骤S2在一示例性实施例中的流程图。
在一些实施例中,如果第一运行节点的心跳消息发生延迟,那么导致延迟的原因会有很多,例如第一运行节点与管控节点之间断网或者第一运行节点宕机等均会导致第一运行节点的心跳消息的延迟。若第一运行节点发生宕机,而恢复时间不确定时,在管控节点中维持向第一运行节点提供的服务的意义不大,只有在断网或者网络质量差的情况下,可以考虑维持管控节点中针对第一运行节点的服务。
因此,本公开实施例提供了以下方法判断第一运行节点是否并未发生宕机,是否启动了节点自治等。
在一些实施例中,各个运行节点(例如第一运行节点和第二运行节点)之间也可以通过心跳探测组件互相探测心跳,以互相确定对方设备或者二者之间的通信网络是否正常。
在本实施例中,第二运行节点可以根据接收到的第一运行节点的心跳消息确定第二运行节点与第一运行节点是否能够正常通信,以生成针对第一运行节点的心跳健康数据。
其中,若第二运行节点在目标时间阈值没有收到第一运行节点的心跳消息,则该心跳健康数据可以指示第一运行节点与第二运行节点通信异常;若第二运行节点在目标时间阈值正常收到第一运行节点的心跳消息,则该心跳健康数据可以指示第一运行节点与第二运行节点通信正常。
在步骤S21中,当所述第一运行节点的心跳消息延迟,则通过所述管控代理组件获取第二运行节点发送的针对所述第一运行节点的心跳健康数据,所述针对所述第一运行节点的心跳健康数据是根据所述第二运行节点从所述第一运行节点接收到的心跳消息生成的。
在一些实施例中,管控节点的边缘控制组件可以根据第一运行节点上传的第一心跳信息确定管控节点与第一运行节点是否失联。例如,边缘控制组件可以判断管控节点接收第一运行节点的第一心跳信息的时间差值是否超过目标阈值,若超过目标阈值(即第一运行节点的心跳消息延迟),则可以认为管控节点与第一运行节点失联。
在一些实施例中,若第一运行节点与管控节点失联,则管控节点会进一步的获取第二运行节点的心跳消息,该第二运行节点的心跳消息中可以包括针对第一运行节点的心跳健康数据,该心跳健康数据是第二运行节点根据第一运行节点发送的心跳信息生成的。
在步骤S22中,所述边缘控制组件根据所述第二运行节点发送的所述针对所述第一运行节点的心跳健康数据确定所述第一运行节点未宕机。
在一些实施例中,管控节点的边缘控制组件会根据第二运行节点上传的针对第一运行节点的心跳健康数据确定第二运行节点与第一运行节点是否正常通信,其中第二运行节点的个数大于等于1个。
在一些实施例中,边缘控制组件确定第一运行节点是否发生宕机的过程可以包括:所述边缘控制组件从所述管控代理组件获取所述第二运行节点发送的针对所述第一运行节点的心跳健康数据;确定心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数;若心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数大于或者等于目标个数阈值,则确定所述第一运行节点未宕机。或者,若所述第一运行节点与所述管控节点失联,且心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数小于所述目标个数阈值(即大部分第二运行节点均探测不到第一运行节点的心跳消息),则确定所述第一运行节点宕机;生成告警提示信息,以用于通知目标对象对所述第一运行节点对应的设备进行维修。其中,目标个数阈值可以根据第二运行节点的个数进行设置,本公开对此不做限制。
在步骤S23中,所述边缘控制组件确定所述第一运行节点启动节点自治模式。
在一些实施例中,当第一运行节点未发生宕机,并且与管控节点的失联时,该第一运行节点会开启节点自治模式。
在步骤S24中,所述管控代理组件代理所述第一运行节点产生虚拟心跳消息。
本实施例提供的技术方案,一方面能够通过第一运行节点发送的心跳消息确定第一运行节点与管控节点是否失联;另一方面,能够通过第二运行节点上传的针对第一运行节点的心跳健康数据准确地确定第一运行节点是否宕机,以确定是否需要维持向第一运行节点提供的服务。本公开实施例提供的方案,可以准确地判断第一运行节点与管控节点是否失联、在失联过程中第一运行节点是否宕机,避免误判。
图5是根据一示例性实施例示出的一种断网原因确定方法。
在一些实施例中,当第一运行节点与管控节点发生断网(失联但未宕机)后,管控节点可能需要确定第一运行节点与管控节点发生断网的原因。
本实施例提供了一种断网原因确定方法,具体包括以下步骤。
在步骤S7中,所述管控节点通过所述管控信道组件,经由所述通信信道向所述第一运行节点发送失联原因确定请求。
在一些实施例中,当第一运行节点与管控节点重新建立通信信道后,管控节点可以通过上述通信信道向第一运行节点发送断网原因确定请求,该断网原因确定请求可以指的是断网期间服务日志获取请求,也可以指的是针对第一运行节点中的目标容器组的登录操作请求。其中,目标容器组可以指的是第一运行节点中的某一容器,或者由多个容器组成的容器组(例如云边通信中的通信组pod),本公开对此不做限制。
其中,容器是一种轻量级、灵活的虚拟化处理方式,它可以将一个应用程序所需要的一切打包在一起。容器组可以由一组(一个或多个)容器组成,该一个或多个容器共享存储、网络以及怎样运行这些容器的声明。
在步骤S8中,接收所述第一运行节点通过所述边缘信道组件,经由所述通信信道返回的失联原因确定数据。
在一些实施例中,第一运行节点会对管控节点发送的断网原因确定请求进行响应,以返回对应的断网原因确定数据。该断网原因确定数据可以指的是服务日志,还可以是通过第一运行节点和管控节点之间的长连接向管控节点返回的针对目标容器组的操作数据。
在步骤S9中,根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因。
在一些实施例中,管控节点可以根据第一运行节点返回的断网原因确定数据分析出第一运行节点断网的原因,并将断网原因向目标对象反馈,以便目标对象结合断网原因对第一运行节点和管控节点的通信进行优化。
例如,管控节点可以通过所述通信信道接收第一运行节点针对断网原因确定请求返回的目标服务日志,以便根据目标服务日志确定所述第一运行节点与所述管控节点断网的原因。
再例如,管控节点可以通过管控节点与第一运行节点之间的通信信道与第一运行节点的目标容器组建立长连接;通过该长连接,管控节点可以从目标容器组获取目标操作数据,该目标操作数据可以用来确定第一运行节点与管控节点断网的原因。
本公开实施例提供的方法,通过通信信道可以使得管控节点获取第一运行节点断网原因。
图6是根据一示例性实施例示出的一种网络通信控制方法的流程图。本公开实施例所提供的方法可以由第一运行节点执行,该第一运行节点可以属于运行节点单元,该运行节点单元可以被管控节点控制,其中运行节点单元可以是有至少一个运行节点组成的运行单元,本公开对此不做限制。
在一些实施例汇总,第一运行节点可以指的是一个设备也可以指的是一组设备,该一组设备可以是某云中的一组设备,也可是一个中心机房中的设备,本公开对此不做限制。
参考图6,上述网络通信控制方法可以包括以下步骤。
在步骤S01中,通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务。
在一些实施例中,可以提前在各个运行节点中布置边缘代理组件,该边缘代理组件可以使得管控节点与运行节点之间、各个运行节点之家互相收发心跳消息,以互相探测对方设备或者通信网络是否正常运行。例如,第一运行节点可以通过边缘代理组件将第一运行节点的心跳消息发送给管控节点,以便管控节点确定是否与第一运行节点失联。
在一些实施例中,当管控节点正常接收到第一运行节点发送的心跳信息时,会向第一运行节点下发指令,以控制第一运行节点运行。
在另外一些实施例中,第一运行节点还会部署有第一心跳探测组件,第一运行节点还会通过该第一心跳探测组件向第二运行节点的第二心跳探测组件发送心跳消息,以便第二运行节点根据第一运行节点发送的心跳消息确定针对第一运行节点的心跳健康数据,便于管控节点根据针对第一运行节点的心跳健康数据确定所述第一运行节点是否宕机。
在一些实施例中,第一运行节点的边缘代理组件可以根据管控节点下发的心跳数据以及第二运行节点发送的针对管控节点的心跳健康数据,以确定第一运行节点与管控节点是否断网。具体判断过程与上文类似,本实施例不再赘述。
在步骤S02中,当所述心跳消息发送超时,所述第一运行节点启动节点自治模式。
在一些实施例中,当发送心跳消息超时,第一运行节点会启动节点自治模式。
在步骤S03中,在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行。
在一些实施例中,第一运行节点的本地数据库中的本地数据可以是在断网之前管控节点发送给第一运行节点的控制指令数据。
在一些实施例中,在与管控节点断网期间,第一运行节点可以根据本地数据库中的本地数据进行节点自治以使第一运行节点正常运行。
例如,在断网之前管控节点向第一运行节点下发指令以控制第一运行节点向用户提供视频下载服务。若在视频下载期间第一运行节点与管控节点断网,那么第一运行节点会从本地数据库中获取管控节点之前下发的视频下载指令,以使第一运行节点向用户继续提供视频下载服务,避免因为断网行为导致的服务停止,以提高用户体验。
在步骤S04中,当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的所述管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据。
在步骤S05中,基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行。
在断网期间,管控节点维持向第一运行节点提供的服务,在维持期间可能会继续产生针对第一运行节点的控制指令。那么在网络恢复后,管控节点会将断网期间产生的数据同步给第一运行节点,以便第一运行节点执行断网期间应该执行的操作。
在步骤S06中,关闭所述节点自治模式。
本实施例提供的技术方案,通过在第一运行节点的本地数据库存储管控节点下发的控制指令数据,确保了第一运行节点在断网期间仍可以正常运行并提供服务以进行实现节点自治,保证了向用户提供服务的连续性。
接下来,将在云边计算场景下实现本公开提供的技术方案。
首先,对本公开实施例提到的云技术、云边通信进行介绍。
云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
云计算(cloud computing)指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算是网格计算(Grid Computing)、分布式计算(DistributedComputing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network StorageTechnologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
随着互联网、实时数据流、连接设备多样化的发展,以及搜索服务、社会网络、移动商务和开放协作等需求的推动,云计算迅速发展起来。不同于以往的并行分布式计算,云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。
随着技术的发展,越来越多的行业对实时性、可靠性与安全性等有了越来越严格的要求,而物联网作为一种便携可移动的装置,有其区别与传统互联网设施的特点。受限于接入带宽和流量以及成本、能耗等条件的限制,在通过云端对设备提供服务时,可以对数据进行合理的处理,特别是进行预处理,以便能够进行“物尽其用”,避免资源的浪费。因此,在云技术领域内就衍生出了边缘计算(Edge computing)。
边缘计算是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供前端服务。其应用程序在边缘侧发起,产生更快的网络服务响应,满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。简而言之,边缘计算是一种在物理上靠近数据生成的位置处理数据的方法。边缘计算可以对一些简单的问题进行自行处理并将结果处理后的结果传输给云端。因此,边缘计算可以就是种“微云”,云计算的缩小加持版本,靠近设备的小型数据中心。
在本公开中,可以将提供云计算的一端(例如由云服务器组成的云端)称之为云端,将提供边缘计算的一端称之为边缘端,将云端与边缘端之间的通信称之为云边通信。
接下来将以边缘计算应用场景为例解释本公开实施例提供的技术方案。在边缘计算场景下,管控节点可以为云端,各个运行节点可以为边缘端。该边缘计算应用场景可例如是通过边缘计算管理高速公路上的各类摄像头等边缘设备、小区内的视频监控、各类人脸识别设备等边缘设备、各类CDN(Content Delivery Network,内容分发网络)及PCDN(P2P,内容分发网络)边缘设备等。
在一些实施例中,云技术经常借助于Kubernetes(一种容器管理工具,简称k8s)进行云边协同结算。k8s是一个编排容器的工具,其实也是管理应用的全生命周期的一个工具,从创建应用,应用的部署,应用提供服务,扩容缩容应用,应用更新,都非常的方便,而且可以做到故障自愈,例如一个服务器挂了,可以自动将这个服务器上的服务调度到另外一个主机上进行运行,无需进行人工干涉。
本实施例将以k8s系统为例,解释如何在云边协同计算中实现本公开提供的技术方案。
图7是根据一示例性实施例示出的一种网络通信控制架构图。
参考图7,在上述网络通信架构中可以包括目标云端(可以是上述实施例中的管控节点)和边缘端(可以是上述实施例中的运行节点),该边缘端可以包括第一边缘节点、第二边缘节点、第三边缘节点……。在用户向目标云端请求服务时,目标云端可以通过指令数据控制靠近用户的边缘节点(例如第一边缘节点)以向用户提供服务。
如图7所示,可以在目标云端中可以部署以下组件以实现本方案:
1、云端代理组件CloudHub(用以实现上述管控代理组件的功能):
CloudHub组件部署在目标云端,代理边缘端的服务,当目标云端与第一边缘节点节点网络不稳定的情况下,可以替代第一边缘节点做心跳上报功能,使得目标云端的控制中心不会主动驱逐、删除及重复创建针对边缘端的服务。
2、云端信道组件TunnelServer(用以实现上述管控信道组件的功能):
TunnelServer组件部署在目标云端,与边缘端的边缘代理组件(可命名为EdgeTunnel)建立通信信道,来实现目标云端向边缘端的服务发送tcp、http(s)、stream流等数据,使得可以通过目标云端的控制组件来对边缘端的服务执行日志查询,登录等操作。
3、边缘控制组件EdgeController(用以实现上述边缘控制组件中的功能):
EdgeController部署在目标云端,可作为云端控制中心(例如CloudCore)的一个插件,当边缘端进行节点自治时(即目标云端与边缘端的通信断网时),EdgeController确保云端控制中心不对该边缘端上的服务进行驱逐或重建等操作。
4. 探测控制组件ObserverController(用以实现上述断网判断功能(即判断第一运行节点的心跳消息发生延迟是由断网导致的还是由第一运行节点宕机导致的额))
ObserverController部署在目标云端,可以根据针对第一边缘节点的心跳消息确定所述第一边缘节点处于与所述管控节点断网状态;
其它组件,例如数据库Etcd(一种数据存储仓库)、元集群控制组件Meta k8smaster、托管集群控制组件k8s master pod等都是k8s系统中常用组件及技术,本公开对此不再赘述。
参考图7,可以在边缘端的各个边缘节点EdgeNode中部署以下组件:
1、边缘代理组件EdgeHub(用以实现上述边缘代理组件的功能):
EdgeHub组件部署在边缘端,代理目标云端的控制节点功能,通过边缘端的本地数据库存储的数据直接管理边缘端的kubelet(一种节点agent代理组件,管理节点上的容器服务)服务。
2、边缘信道组件EdgeTunnel(用来实现上述边缘信道组件的功能):
EdgeTunnel部署在边缘端,与目标云端的TunnelServer组件建立通信,来实现目标云端向边缘端的服务发送tcp、http(s)、stream流等数据,使得可以通过目标云端的控制组件来对边缘端的服务执行日志查询,登录等操作。
3、边缘探测组件EdgeObserver(用来实现上述心跳探测组件的功能):
在边缘端的各个边缘节点中部署边缘探测组件EdgeObserver,用来探测各个边缘节点的节点设备是否真正宕机,通过EdgeObserver组件互相探测并投票的机制来决策一个节点是否宕机,并将探测结果上报到云端。当探测结果是边缘节点没有宕机,但是网络断联则执行节点自治逻辑,当探测结果是边缘节点宕机,则触发告警机制,自动通知相关人员维修设备。
其中,边缘节点心跳探测可以包括以下流程:边缘端各个边缘节点的EdgeObserver互相探测心跳;将EdgeObserver集群(由多个边缘节点的边缘探测组件EdgeObserver构成的集群)内其他节点的心跳消息通过EdgeHub上报到云端控制中心。云端控制中心收集各个节点的心跳消息来判断每个节点是否宕机;当所有上报心跳消息的节点都判断某个边缘节点心跳探测失败,则认为该节点宕机,否则该节点非宕机。
3、节点本地数据库(Local Data):
存储跟当前边缘节点对应设备相关的数据、证书等内容,用于边缘节点的自治功能,当网络不稳定的情况下,可以直接读取本地数据来对边缘节点的本地服务进行管理。当网络恢复的情况下,则同步目标云端的数据到本地数据库,保障目标云端数据与本地数据的一致性。
其它组件,例如节点管理组件Kubelet、节点网络管理组件Kube-proxy、集群网络代理组件Flannel、节点证书、容器组Pod等涉及的都是k8s中常见的技术和组件,本公开对此不做赘述。
可以理解的是,本公开中涉及到的每个组件都有相应的功能,当将某些组件合成一个组件来实现对应的功能时,仍然属于本发明专利中涉及的内容。例如将CloudHub和TunnelServer合成一个统一的组件实现两者的功能特性,将EdgeHub和EdgeTunnel合成一个组件来实现两者的功能特性。
本发明专利中的组件命名基于组件的功能特点来命名,如果以其他的命名方式来实现相同或类似的功能,仍然属于本公开中涉及的内容。
图8是根据一示例性实施例示出的一种网络通信架构布置方法。
结合图7,上述网络通信架构布置方法可以包括以下步骤。
1)部署云边通信组件
步骤801:部署k8s元集群组件Meta k8s master及托管集群组件k8s master pod。
元集群:一个完整独立的k8s集群,包括k8s master(主程序)节点和k8s node(节)节点。k8s node节点可以横向快速扩展添加。其中node节点上运行托管k8s集群的master组件。
托管集群:托管的k8s集群用来注册和管理边缘设备节点,托管的k8s集群主要部署master部分的组件,其中包括kube-apiserver(k8s通过kube-apiserver进程提供服务)、kube-controller-manager(一种pod控制器)、kube-scheduler(一种调度器)、Etcd等组件。托管集群的master以pod的方式运行在元集群的node节点上。
步骤802:在目标云端部署边缘控制组件EdgeController,自定义边缘节点自治模式下对应的节点逻辑,包括不执行驱逐或重建服务的操作。
步骤803:在目标云端部署云端代理组件CloudHub,在边缘端部署边缘代理组件EdgeHub。
步骤804:在CloudHub组件和EdgeHub组件之间建立通信。
步骤805:在云端部署云端信道组件TunnelServer,在边缘端部署边缘信道组件EdgeTunnel。
步骤806:在TunnelServer和EdgeTunnel两个组件之间建立通信。
步骤807:在边缘端部署边缘探测组件EdgeObserver集群,各个边缘节点通过边缘探测组件互相探测心跳消息,并上报心跳探测结果到云端。
步骤808,在边缘端部署节点管理套件,其中包括节点管理组件Kubelet、节点网络代理组件Kube-proxy、集群网络组件Flannel、或其他网络插件等组件。
步骤809:在每个边缘节点部署本地的轻量级节点本地数据库LocalData,存储与该节点相关的数据资源。
总之,在云端部署CloudHub和TunnelServer组件,在边缘端部署EdgeHub、EdgeTunnel、EdgeObserver组件。其中CloudHub与EdgeHub组件直接通信;TunnelServer与EdgeTunnel直接通信;各个边缘节点的EdgeObserver形成一个集群,互相探测心跳,通过投票机制来判断一个边缘节点的设备是否真正宕机。CloudHub和EdgeHub在云边通信网络不稳定的情况下实现边缘节点自治功能,当处于边缘自治模式下,云端控制中心不对该节点上的服务执行驱逐或重建操作,并且该边缘节点上的服务可以正常运行提供服务。
在步骤S810,部署完成。
图9是结合图7示出的一种网络通信控制方法。
参考图9,上述网络通信控制方法可以包括以下步骤。
步骤901,边缘端的各个边缘节点的边缘代理组件EdgeHub定期向目标云端的云端代理组件CloudHub上报心跳。
步骤902,目标云端通过边缘控制组件EdgeController(也可以是通过探测控制组件ObserverController)判断第一边缘节点是否上报心跳超时。
步骤903,若第一边缘节点心跳上报未超时,则认为第一边缘节点服务正常。
步骤904,若第一边缘节点心跳上报超时,则根据其他边缘节点上报的针对第一边缘节点的心跳消息,确定第一边缘节点是否宕机。
步骤905,若第一边缘节点已经宕机,则告警并通知相关人对第一边缘节点进行维修。
步骤906,若第一边缘节点未宕机,则认为第一边缘节点与目标云端之间的通信发生了断网,则第一边缘节点启动边缘节点自治流程。
步骤907,第一边缘节点不断探测与目标云端的网络是否连通。
当第一边缘节点与目标云端的网络未连通时,则执行步骤908~步骤910。
步骤908,第一边缘节点上的云端代理组件CloudHub代理边缘节点服务上报虚拟心跳给云端控制中心,即告知云端控制中心第一边缘节点当前处于断网状态。
步骤909,第一边缘节点上的边缘控制组件EdgeController控制云端控制中心不对该网络不稳定的节点(即第一边缘节点)执行驱逐或重建服务的操作务的操作。
步骤910,第一边缘节点上的边缘代理组件EdgeHub读取节点本地数据库LocalData中的数据,进行边缘节点自治以维护第一边缘节点上的服务,使其正常运行。
当第一边缘节点与目标云端的网络连通时,则执行步骤911~913。
步骤911,将目标云端中针对第一边缘节点的相关数据同步云端数据到第一边缘节点的节点本地数据库LocalData。
步骤912,第一边缘节点上的边缘代理组件EdgeHub监测节点本地数据库,如有目标云端相对于第一边缘节点的本地数据库有更新,则根据目标云端中针对第一边缘节点的数据更新本地服务。
步骤913,结束边缘节点自治,恢复正常流程。
在一些实施例中,当网络重新连接后,目标云端还会查看边缘端日志或执行登录操作流程以确定断网原因,具体可以包括以下过程:在云端控制台执行查看边缘节点服务日志或远程登录边缘容器组服务的操作;云端的TunnelServer与边缘端的EdgeTunnel建立网络连接;边缘端的EdgeTunnel根据TunnelServer下发的命令对相关的pod执行命令操作;如果是数据类操作,则将操作后的数据传输到云端的TunnelServer,例如将日志信息传输到云端等;如果是登录命令操作,则保持长连接来传输命令相关数据和返回结果。
本公开提供了一种解决云边通信网络不稳定的控制方法。本公开实施例通过在云端和边缘端分别部署CloudHub和EdgeHub的代理通信组件替换原先云端与边缘端的直接通信。CloudHub和EdgeHub组件之间的通信可以通过私有协议来增加网络通信的安全性。其中EdgeHub组件部署在边缘端,代理云端的控制节点功能,通过边缘端的本地数据存储直接管理边缘端的kubelet服务。CloudHub组件部署在云端,代理边缘端的服务,当云端与边缘端网络不稳定的情况下,可以替代边缘端做心跳上报,与云端EdgeController组件搭配,使得云端的控制中心不会主动驱逐边缘端的服务。
同时,在云端和边缘端分别部署TunnelServer和EdgeTunnel的消息通信组件,来实现云端向边缘端的服务发送tcp、http(s)、stream流(查看日志,需要云层查看日志)等数据,使得可以通过云端的控制组件来对边缘端的服务执行日志查询,登录等操作。
在边缘端部署EdgeObserver集群组件,用来探测边缘的节点设备是否真正宕机,通过EdgeObserver集群互相探测并投票的机制来决策一个节点是否宕机,并将探测结果上报到云端控制组件。当探测结果是边缘节点没有宕机,但是网络断联则执行节点自治逻辑,当探测结果是边缘节点宕机,则触发告警机制,自动通知相关人员维修设备。
本公开实施例通过引入云端及边缘端的代理组件,从而与原有的系统解耦,对开源社区的kubelet服务无侵入,可跟随开源社区的版本迭代升级及bug修复。扩展性强,可根据各种边缘场景的需要,定制代理组件,扩展更多的功能。且代理组件的开发及升级是独立的,无需与原有系统耦合。
图10是根据一示例性实施例示出的一种网络通信控制装置的框图。所述网络通信控制装置可以应用于管控节点,所述管控节点中部署有管控代理组件。参照图10,本公开实施例提供的网络通信控制装置1000可以包括:心跳消息获取模块1001、虚拟心跳消息生成模块1002、服务维持模块1003、通信信道建立模块1004以及数据同步模块1005。
其中,所述心跳消息获取模块1001可以配置为通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;所述虚拟心跳消息生成模块1002可以配置为当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;所述服务维持模块1003可以配置为根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;所述通信信道建立模块1004可以配置为当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;所述数据同步模块1005可以配置为将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
在一些实施例中,所述管控节点中还部署有边缘控制组件。其中,所述虚拟心跳消息生成模块1002可以包括:心跳健康数据获取单元、未宕机确定单元、节点自治模式启动单元以及虚拟心跳消息产生单元。
其中,所述心跳健康数据获取单元可以配置为当所述第一运行节点的心跳消息延迟,则通过所述管控代理组件获取第二运行节点发送的针对所述第一运行节点的心跳健康数据,所述针对所述第一运行节点的心跳健康数据是根据所述第二运行节点从所述第一运行节点接收到的心跳消息生成的;所述未宕机确定单元可以配置为所述边缘控制组件根据所述第二运行节点发送的所述针对所述第一运行节点的心跳健康数据确定所述第一运行节点未宕机;所述节点自治模式启动单元可以配置为所述边缘控制组件确定所述第一运行节点启动节点自治模式;所述虚拟心跳消息产生单元可以配置为所述管控代理组件代理所述第一运行节点产生虚拟心跳消息。
在一些实施例中,所述第二运行节点的个数大于或者等于1个;其中,所述未宕机确定单元可以包括:心跳健康数据获取子单元、个数确定子单元以及未宕机判断子单元。
其中,所述心跳健康数据获取子单元可以配置为所述边缘控制组件从所述管控代理组件获取所述第二运行节点发送的针对所述第一运行节点的心跳健康数据;所述个数确定子单元可以配置为确定心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数;所述未宕机判断子单元可以配置为若心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数大于或者等于目标个数阈值,则确定所述第一运行节点未宕机。
在一些实施例中,所述网络通信控制装置还可以包括:宕机确定子单元、和告警信息生成子单元。
其中,所述宕机确定子单元可以配置为若所述第一运行节点与所述管控节点失联,且心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数小于所述目标个数阈值,则确定所述第一运行节点宕机;所述告警信息生成子单元可以配置为生成告警提示信息,以用于通知目标对象对所述第一运行节点对应的设备进行维修。
在一些实施例中,所述管控节点还部署有管控信道组件,所述第一运行节点部署有边缘信道组件,所述通信信道是通过所述管控信道组件与所述边缘信道组件建立的;其中,所述网络通信控制装置还可以包括:失联原因确定请求发送模块、失联原因确定数据接收模块以及失联原因确定模块。
其中,所述失联原因确定请求发送模块可以配置为所述管控节点通过所述管控信道组件,经由所述通信信道向所述第一运行节点发送失联原因确定请求;所述失联原因确定数据接收模块可以配置为接收所述第一运行节点通过所述边缘信道组件,经由所述通信信道返回的失联原因确定数据;所述失联原因确定模块可以配置为根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因。
在一些实施例中,所述失联原因确定请求包括服务日志获取请求;其中,所述失联原因确定模块可以包括:目标服务日志接收单元和失联目标服务日志分析单元。
其中,所述目标服务日志接收单元可以配置为所述管控节点通过所述通信信道接收所述第一运行节点针对所述服务日志获取请求返回的目标服务日志;所述目标服务日志分析单元可以配置为根据所述目标服务日志确定所述第一运行节点与所述管控节点失联的原因。
在一些实施例中,所述失联原因确定请求包括针对所述第一运行节点中的目标容器组的登录操作请求;其中,所述失联原因确定模块可以包括:长连接建立单元、目标操作数据获取单元以及目标操作数据分析单元。
其中,所述长连接建立单元可以配置为通过所述通信信道,所述管控节点与所述第一运行节点的目标容器组建立长连接;所述目标操作数据获取单元可以配置为通过所述长连接,所述管控节点从所述目标容器组获取目标操作数据;所述目标操作数据分析单元可以配置为根据所述目标操作数据确定所述第一运行节点与所述管控节点失联的原因。
由于本公开的示例实施例的网络通信控制装置1000的各个功能模块与上述网络通信控制方法的示例实施例的步骤对应,因此在此不再赘述。
图11是根据一示例性实施例示出的一种网络通信控制装置的框图。所述第一运行节点属于运行节点单元,所述运行节点单元被管控节点控制,所述第一运行节点部署有边缘代理组件、边缘信道组件以及本地数据库。参照图11,本公开实施例提供的网络通信控制装置1100可以包括:心跳消息发送模块1101、节点自治模块1102、本地数据获取模块1103、管控数据获取模块1104、数据更新模块1105以及节点自治模式关闭模块1106。
其中,所述心跳消息发送模块1101可以配置为通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;所述节点自治模块1102可以配置为当所述心跳消息发送超时,所述第一运行节点启动节点自治模式;所述本地数据获取模块1103可以配置为在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行;所述管控数据获取模块1104可以配置为当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的所述管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据;所述数据更新模块1105可以配置为基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行;所述节点自治模式关闭模块1106可以配置为关闭所述节点自治模式。
在一些实施例中,所述数据更新模块1105可以包括:差别数据确定单元、数据更新单元以及运行单元。
其中,所述差别数据确定单元可以配置为确定所述管控数据中相对于所述本地数据库中的本地数据的差别数据;所述数据更新单元可以配置为根据所述管控数据中相对于所述本地数据的差别数据对所述本地数据库中的本地数据进行更新;所述运行单元可以配置为所述第一运行节点根据所述管控数据中相对于所述本地数据的差别数据运行。
在一些实施例中,所述第一运行节点中还部署有第一心跳探测组件,所述网络通信控制装置1100可以包括:发送心跳消息单元。
其中,所述发送心跳消息单元可以配置为所述第一运行节点通过所述第一心跳探测组件向第二运行节点的第二心跳探测组件发送心跳消息,以便所述第二运行节点根据所述第一运行节点发送的心跳消息确定所述第一运行节点的心跳健康数据,便于所述管控节点根据所述第一运行节点的心跳健康数据确定所述第一运行节点是否宕机。
由于本公开的示例实施例的网络通信控制装置1100的各个功能模块与上述网络通信控制方法的示例实施例的步骤对应,因此在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者智能设备等)执行根据本公开实施例的方法,例如图3的一个或多个所示的步骤。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不限于这里已经示出的详细结构、附图方式或实现方法,相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims (13)

1.一种网络通信控制方法,其特征在于,应用于管控节点,所述管控节点中部署有管控代理组件,所述方法包括:
通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;
当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;
根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;
当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;
将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
2.根据权利要求1所述方法,其特征在于,所述管控节点中还部署有边缘控制组件;其中,当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息,包括:
当所述第一运行节点的心跳消息延迟,则通过所述管控代理组件获取第二运行节点发送的针对所述第一运行节点的心跳健康数据,所述针对所述第一运行节点的心跳健康数据是根据所述第二运行节点从所述第一运行节点接收到的心跳消息生成的;
所述边缘控制组件根据所述第二运行节点发送的所述针对所述第一运行节点的心跳健康数据确定所述第一运行节点未宕机;
所述边缘控制组件确定所述第一运行节点启动节点自治模式;
所述管控代理组件代理所述第一运行节点产生虚拟心跳消息。
3.根据权利要求2所述方法,其特征在于,所述第二运行节点的个数大于或者等于1个;其中,所述边缘控制组件根据所述第二运行节点发送的所述针对所述第一运行节点的心跳健康数据确定所述第一运行节点未宕机,包括:
所述边缘控制组件从所述管控代理组件获取所述第二运行节点发送的针对所述第一运行节点的心跳健康数据;
确定心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数;
若心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数大于或者等于目标个数阈值,则确定所述第一运行节点未宕机。
4.根据权利要求3所述方法,其特征在于,所述方法还包括:
若所述第一运行节点与所述管控节点失联,且心跳健康数据指示所述第一运行节点未失联的第二运行节点的个数小于所述目标个数阈值,则确定所述第一运行节点宕机;
生成告警提示信息,以用于通知目标对象对所述第一运行节点对应的设备进行维修。
5.根据权利要求1所述方法,其特征在于,所述管控节点还部署有管控信道组件,所述第一运行节点部署有边缘信道组件,所述通信信道是通过所述管控信道组件与所述边缘信道组件建立的;其中,在所述管控节点与所述运行节点建立通信信道之后,所述方法还包括:
所述管控节点通过所述管控信道组件,经由所述通信信道向所述第一运行节点发送失联原因确定请求;
接收所述第一运行节点通过所述边缘信道组件,经由所述通信信道返回的失联原因确定数据;
根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因。
6.根据权利要求5所述方法,其特征在于,所述失联原因确定请求包括服务日志获取请求;其中,根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因,包括:
所述管控节点通过所述通信信道接收所述第一运行节点针对所述服务日志获取请求返回的目标服务日志;
根据所述目标服务日志确定所述第一运行节点与所述管控节点失联的原因。
7.根据权利要求5所述方法,其特征在于,所述失联原因确定请求包括针对所述第一运行节点中的目标容器组的登录操作请求;其中,根据所述失联原因确定数据确定所述第一运行节点与所述管控节点失联的原因,包括;
通过所述通信信道,所述管控节点与所述第一运行节点的目标容器组建立长连接;
通过所述长连接,所述管控节点从所述目标容器组获取目标操作数据;
根据所述目标操作数据确定所述第一运行节点与所述管控节点失联的原因。
8.一种网络通信控制方法,其特征在于,应用于第一运行节点,所述第一运行节点属于运行节点单元,所述运行节点单元被管控节点控制,所述第一运行节点部署有边缘代理组件、边缘信道组件以及本地数据库,所述方法包括:
通过部署于所述第一运行节点中的边缘代理组件向所述管控节点的管控代理组件发送心跳消息,以便所述管控节点根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;
当所述心跳消息发送超时,所述第一运行节点启动节点自治模式,以便所述管控代理组件代理所述第一运行节点产生虚拟心跳消息,所述管控节点根据所述虚拟心跳消息维持向所述第一运行节点提供的服务;
在所述节点自治模式下,所述第一运行节点从所述本地数据库读取节点本地数据以进行运行;
当检测到所述第一运行节点的所述边缘信道组件与所述管控节点的管控信道组件再次建立通信信道时,所述第一运行节点通过所述通信信道从所述管控节点获取针对所述第一运行节点的管控数据;
基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行;
关闭所述节点自治模式。
9.根据权利要求8所述方法,其特征在于,基于所述管控数据对所述本地数据库中的本地数据进行更新,并根据更新后的本地数据进行运行,包括:
确定所述管控数据中相对于所述本地数据库中的本地数据的差别数据;
根据所述管控数据中相对于所述本地数据的差别数据对所述本地数据库中的本地数据进行更新;
所述第一运行节点根据所述管控数据中相对于所述本地数据的差别数据运行。
10.根据权利要求8所述方法,其特征在于,所述第一运行节点中还部署有第一心跳探测组件,所述方法还包括:
所述第一运行节点通过所述第一心跳探测组件向第二运行节点的第二心跳探测组件发送心跳消息,以便所述第二运行节点根据所述第一运行节点发送的心跳消息确定所述第一运行节点的心跳健康数据,便于所述管控节点根据所述第一运行节点的心跳健康数据确定所述第一运行节点是否宕机。
11.一种网络通信控制装置,其特征在于,应用于管控节点,所述管控节点中部署有管控代理组件,所述装置包括:
心跳消息获取模块,配置为通过所述管控代理组件获取第一运行节点发送的心跳消息,以便根据所述第一运行节点发送的心跳消息向所述第一运行节点提供服务;
虚拟心跳消息生成模块,配置为当所述第一运行节点的心跳消息延迟、且所述第一运行节点启动节点自治模式时,获取由所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息;
服务维持模块,配置为根据所述管控代理组件代理所述第一运行节点产生的虚拟心跳消息维持向所述第一运行节点提供的服务;
通信信道建立模块,配置为当所述管控代理组件再次检测到所述第一运行节点发送的心跳信息时,所述管控节点与所述第一运行节点建立通信信道;
数据同步模块,配置为将所述管控节点中针对所述第一运行节点的管控数据通过所述通信信道同步至所述第一运行节点,以使所述运行节点根据所述管控数据运行。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-10中任一项所述的方法。
CN202110134036.9A 2021-02-01 2021-02-01 网络通信控制方法及装置、电子设备和可读存储介质 Active CN112448858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110134036.9A CN112448858B (zh) 2021-02-01 2021-02-01 网络通信控制方法及装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110134036.9A CN112448858B (zh) 2021-02-01 2021-02-01 网络通信控制方法及装置、电子设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN112448858A CN112448858A (zh) 2021-03-05
CN112448858B true CN112448858B (zh) 2021-04-23

Family

ID=74740175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110134036.9A Active CN112448858B (zh) 2021-02-01 2021-02-01 网络通信控制方法及装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN112448858B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726843B (zh) * 2021-07-13 2024-03-12 阿里巴巴新加坡控股有限公司 边缘云系统、数据传输方法、设备及存储介质
US11665258B2 (en) 2021-09-03 2023-05-30 Cisco Technology, Inc. Seamless connectivity between network functions deployed on edge and in the cloud
CN113722077B (zh) * 2021-11-02 2022-03-15 腾讯科技(深圳)有限公司 数据处理方法、系统、相关设备、存储介质及产品
CN114157683B (zh) * 2022-02-10 2022-05-13 华谱科仪(北京)科技有限公司 一种在线色谱仪数据存储方法、装置、存储介质
CN115314363B (zh) * 2022-02-22 2024-04-12 网宿科技股份有限公司 服务恢复方法、服务部署方法、服务器及存储介质
CN114844693B (zh) * 2022-04-27 2024-03-26 深圳云创数安科技有限公司 轻量级的通信数据加密方法、装置、设备及存储介质
US11916809B2 (en) 2022-04-29 2024-02-27 Microsoft Technology Licensing, Llc Autonomous operation of edge-based deployments
US12081553B2 (en) * 2022-05-27 2024-09-03 Microsoft Technology Licensing, Llc Establishment of trust for disconnected edge-based deployments

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073756A (zh) * 2020-07-30 2020-12-11 视联动力信息技术股份有限公司 业务控制方法、装置、电子设备及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104426692A (zh) * 2013-08-26 2015-03-18 联想(北京)有限公司 一种信息处理方法,一种装置及网络服务器
CN109905259B (zh) * 2017-12-08 2022-02-15 中国电信股份有限公司 通信连接维持方法、系统和相关设备
TWI686696B (zh) * 2018-08-14 2020-03-01 財團法人工業技術研究院 計算節點及其失效偵測方法與雲端資料處理系統
WO2020104988A1 (en) * 2018-11-21 2020-05-28 Telefonaktiebolaget Lm Ericsson (Publ) Fast session restoration for latency sensitive middleboxes
CN111800281B (zh) * 2019-04-08 2023-08-04 阿里巴巴集团控股有限公司 网络系统、管控方法、设备及存储介质
CN111800516B (zh) * 2020-08-09 2021-01-08 物鼎安全科技(武汉)有限公司 一种基于p2p的物联网设备管理方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073756A (zh) * 2020-07-30 2020-12-11 视联动力信息技术股份有限公司 业务控制方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN112448858A (zh) 2021-03-05

Similar Documents

Publication Publication Date Title
CN112448858B (zh) 网络通信控制方法及装置、电子设备和可读存储介质
CN109951331B (zh) 用于发送信息的方法、装置和计算集群
CN113742031B (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
CN104021078B (zh) 软件监控装置及方法
CN109783151B (zh) 规则变更的方法和装置
CN113296903A (zh) 边缘云系统、边缘管控方法、管控节点及存储介质
US20090063650A1 (en) Managing Collections of Appliances
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN111611054B (zh) 一种应用部署方法及装置
CN109245908B (zh) 一种主从集群切换的方法和装置
CN111064626B (zh) 配置更新方法、装置、服务器及可读存储介质
CN111865632B (zh) 分布式数据存储集群的切换方法及切换指令发送方法和装置
CN114089974B (zh) 云端代码开发系统、方法、装置、设备及存储介质
CN114679380B (zh) 边缘集群的创建方法和相关装置
CN111338893A (zh) 进程日志处理方法、装置、计算机设备以及存储介质
CN114363154A (zh) 节点选举方法、装置、电子设备及存储介质
CN113626002A (zh) 一种服务执行方法及装置
CN111510480B (zh) 一种请求发送方法、装置以及第一服务器
CN113467873A (zh) 虚拟机的调度方法、装置、电子设备及存储介质
CN114900449A (zh) 一种资源信息管理方法、系统及装置
Galov et al. Fault tolerance support of Smart-M3 application on the software infrastructure level
US11290318B2 (en) Disaster recovery of cloud resources
CN114968636A (zh) 一种故障处理的方法和装置
CN114153655A (zh) 容灾系统创建方法、容灾方法、装置、设备及介质
CN111538932B (zh) 一种跨平台、终端及内外网的外事管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040740

Country of ref document: HK