CN113132176A - 一种控制边缘节点的方法、节点及边缘计算系统 - Google Patents

一种控制边缘节点的方法、节点及边缘计算系统 Download PDF

Info

Publication number
CN113132176A
CN113132176A CN201911425840.1A CN201911425840A CN113132176A CN 113132176 A CN113132176 A CN 113132176A CN 201911425840 A CN201911425840 A CN 201911425840A CN 113132176 A CN113132176 A CN 113132176A
Authority
CN
China
Prior art keywords
edge node
edge
node
nodes
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911425840.1A
Other languages
English (en)
Other versions
CN113132176B (zh
Inventor
张琦
齐飞
疏官胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201911425840.1A priority Critical patent/CN113132176B/zh
Priority to EP20910742.4A priority patent/EP4068717A4/en
Priority to PCT/CN2020/141209 priority patent/WO2021136335A1/zh
Publication of CN113132176A publication Critical patent/CN113132176A/zh
Priority to US17/852,724 priority patent/US20220329650A1/en
Application granted granted Critical
Publication of CN113132176B publication Critical patent/CN113132176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例公开了一种控制边缘节点的方法、节点及边缘计算系统,用于当边缘节点集群处于离线或弱网场景时,对边缘节点集群中的边缘节点进行控制。本申请实施例方法包括:控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点;控制节点从第一边缘节点集合内选择M个第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个;控制节点向M个第二边缘节点发送控制规则,使得第二边缘节点根据该控制规则对第一边缘节点进行故障检测,因此,当控制节点无法对第一边缘节点进行故障检测时,可以通过第二边缘节点对第一边缘节点进行故障检测。

Description

一种控制边缘节点的方法、节点及边缘计算系统
技术领域
本申请实施例涉及边缘计算技术领域,尤其涉及一种控制边缘节点的方法、节点及边缘计算系统。
背景技术
当前,边缘计算已成功落地并应用于智慧城市、工业制造、物流等多个领域。在常见的边缘计算场景中,终端层将大量用户数据传输至边缘计算层进行初步处理,而后边缘计算层将初步处理后的相对少量的数据同步至云计算层实现进一步处理,从而可以提升数据的处理效率。
在上述边缘计算场景中,云计算层除了用于对来自边缘计算层的数据进行处理外,还用于控制边缘计算层。但当云计算层无法对边缘计算层进行控制时,可能会影响边缘结算层的正常工作。
因此,需要一种控制方法,用于当云计算层无法对边缘计算层进行控制时,对边缘计算层进行控制。
发明内容
本申请实施例提供了一种控制边缘节点的方法、节点及边缘计算系统,能够在控制节点无法对边缘节点集群中的边缘节点进行控制时,对边缘节点集群中的边缘节点进行控制。
本申请实施例第一方面提供了一种控制边缘节点的方法,应用于控制节点,包括:
控制节点先将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,其中两个边缘点集合可以包括相同的边缘节点,N为正整数;
控制节点然后从第一边缘节点集合内选择M个第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,M为正整数;
控制节点最后向M个第二边缘节点发送控制规则,控制规则指示第二边缘节点对第一边缘节点进行故障检测,第一边缘节点属于第一边缘节点集合。
控制节点将边缘节点集群中的多个边缘节点划分为N个边缘节点集合,并在每个边缘节点集合中选择第二边缘节点,然后向第二边缘节点发送控制规则,使得第二边缘节点对所在边缘节点集合中的第一边缘节点进行故障检测,这样,即使控制节点不能对边缘节点集群中的第一边缘节点进行故障检测,也可以通过边缘节点集群中的第二边缘节点对第一边缘节点进行故障检测,从而可以及时感知第一边缘节点的故障状况。
基于第一方面,本申请实施例还提供了第一方面的第一种实施方式,控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合包括:
控制节点根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合,K为大于M的正整数。
控制节点根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像划分边缘节点集合,考虑了应用镜像之间的亲和性和反亲和性,使得边缘节点集合划分得更合理。
基于第一方面的第一种实施方式,本申请实施例还提供了第一方面的第二种实施方式,在控制节点根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合之后,控制节点将K个边缘节点组成哈希环。
哈希环限定了K个边缘节点间的相对位置关系,使得K个边缘节点可以通过该相对位置关系形成一定的映射关系。
基于第一方面的第二种实施方式,本申请实施例还提供了第一方面的第三实施方式,第一边缘节点和至少一个第二边缘节点在哈希环内相邻。
该实施方式提供了第一边缘节点与第二边缘节点的其中一种映射关系,即第一边缘节点与至少一个第二边缘节点相邻。
基于第一方面,或第一方面的第一种实施方式,或第一方面的第二种实施方式,或第一方面的第三种实施方式,本申请实施例还提供了第一方面的第四种实施方式,在控制节点将边缘节点集群中包括的多个边缘节点划分为N个边缘节点集合之后,控制节点为N个边缘节点集合部署待部署的应用镜像,其中,待部署的应用镜像与边缘节点集合一一对应。
该实施方式提供了一种部署应用镜像的可行方案,即每个边缘节点集合对应部署一个应用镜像。
基于第一方面的第四种实施方式,本申请实施例还提供了第一方面的第五种实施方式,控制节点为N个边缘节点集合部署待部署的应用镜像包括:
控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上,L个边缘节点中的每个边缘节点部署有至少一个分层镜像,L和X均为大于1的正整数。
在第一边缘节点集合中的部分边缘节点上部署至少一个分层镜像,而不是在每个边缘节点上部署完整的应用镜像,能够节省边缘节点的存储空间。
基于第一方面的第五种实施方式,本申请实施例还提供了第一方面的第六种实施方式,控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上包括:
控制节点先建立为N个边缘节点集合部署应用镜像的目标函数;
控制节点再根据预置的寻优算法和目标函数确定镜像部署方案;
控制节点最后根据镜像部署方案将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上。
在该实施方式中,控制节点通过建立目标函数并对目标函数寻优求解的方法得到镜像部署方案。
基于第一方面的第六种实施方式,本申请实施例还提供了第一方面的第七种实施方式,控制节点建立为N个边缘节点集合部署应用镜像的目标函数包括:
控制节点先建立第一指标和第二指标,第一指标表示为N个边缘节点集合部署应用镜像的可靠程度,第二指标表示为N个边缘节点集合部署应用镜像的均衡程度;
控制节点然后根据第一指标和第二指标建立目标函数。
控制节点根据第一指标和第二指标建立目标函数,保证了部署应用的均衡程度和可靠性。
基于第一方面的第五种实施方式,或第一方面的第六种实施方式,或第一方面的第七种实施方式,本申请实施例还提供了第一方面的第八种实施方式,在控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上后,控制节点将待部署的应用镜像的部署信息发送至第一边缘节点集合中的边缘节点,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署待部署的应用镜像的分层镜像的部署情况。
控制节点将应用镜像的部署信息发送至第一边缘节点集合中的每个边缘节点,使得未部署有X个分层镜像的边缘节点可以根据该部署信息从其他边缘节点处获取到分层镜像,以组成完整的应用镜像。
本申请实施例第二方面提供了一种控制边缘节点的方法,应用于边缘节点集群,边缘节点集群包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,第二边缘节点上存储有控制规则,N为正整数;
基于上述边缘节点集群,第二边缘节点根据控制规则从第一边缘节点集合中确定第一边缘节点,控制规则指示第二边缘节点对第一边缘节点进行故障检测;
第二边缘节点对第一边缘节点进行故障检测。
当控制节点不能对第一边缘节点集合中的第一边缘节点进行故障检测时,第二边缘节点可以根据控制规则对该第一边缘节点进行故障检测,从而可以及时感知第一边缘节点的故障状况。
基于第二方面,本申请实施例还提供了第二方面的第一种实施方式,第一边缘节点集合中的边缘节点组成哈希环;
第一边缘节点和第二边缘节点在哈希环内相邻。
哈希环限定了K个边缘节点间的相对位置关系,使得K个边缘节点可以通过该相对位置关系形成一定的映射关系,作为其中一种映射关系,第一边缘节点与至少一个第二边缘节点相邻。
基于第二方面,或第二方面的第一种实施方式,本申请实施例还提供了第二方面的第二种实施方式,第二边缘节点对第一边缘节点进行故障检测包括:
第二边缘节点向第一边缘节点发送请求消息,该请求消息中可以携带第二边缘节点的相关信息,其中相关信息可以包括第二边缘节点的IP地址;
若第二边缘节点在预设时间段内未接收到对应请求消息的响应消息,则可以确定第一边缘节点故障。
第二边缘节点通过心跳检测的方式检测第一边缘节点是故障。
基于第二方面,或第二方面的第一种实施方式,或第二方面的第二种实施方式,本申请实施例还提供了第二方面的第三种实施方式,第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,L和X均为大于1的正整数;
第一边缘节点集合中的每个边缘节点存储有应用镜像的部署信息,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署应用镜像的分层镜像的部署情况;
基于上述应用镜像的部署情况,若第二边缘节点上部署有H个分层镜像,则第二边缘节点根据应用镜像的部署信息从L个边缘节点中的其他边缘节点,获取(X-H)个分层镜像组成应用镜像,H为正整数,X为大于H的正整数;
第二边缘节点运行应用镜像以执行相应的任务。
第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,能够节省第一边缘节点集合中边缘节点的存储空间,并且,未部署X个分层镜像的边缘节点可以根据应用镜像的部署信息从其他边缘节点处获取分层镜像,以组成应用镜像,然后运行应用镜像以执行相应任务。
此外,若第二边缘节点上部署有X个分层镜像,则第二边缘节点运行本地存储的X个分层镜像组成的应用镜像,以执行相应的任务。
基于第二方面的第三种实施方式,本申请实施例还提供了第二方面的第四种实施方式,若第一边缘节点故障,则第二边缘节点根据应用镜像的部署信息确定第一边缘节点部署应用镜像的分层镜像的部署情况,该应用镜像的分层镜像的部署情况可以为第一边缘节点上部署有应用镜像的至少一个分层镜像,也可以为第一边缘节点上未部署应用镜像的至少一个分层镜像;
若第一边缘节点上部署有至少一个分层镜像,则第二边缘节点从第一边缘节点集合中选择一个满足预设条件的边缘节点执行第一边缘节点的任务。
第一边缘节点上部署有至少一个分层镜像,说明第一边缘节点上在故障前运行应用镜像并执行响应的任务,第二边缘节点从第一边缘节点集合中重新选择一个边缘节点执行第一边缘节点的任务,实现对第一边缘节点上任务的调度。
基于第二方面的第四种实施方式,本申请实施例还提供了第二方面的第五种实施方式,第二边缘节点从第一边缘节点集合中选择一个满足预设条件的边缘节点执行第一边缘节点的任务包括:
第二边缘节点计算第二边缘节点的部署权重;
第二边缘节点接收第一边缘节点集合中其他边缘节点的部署权重;
第二边缘节点根据第二边缘节点的部署权重和第一边缘节点集合中其他边缘节点的部署权重选择一个边缘节点执行第一边缘节点的任务。
第二边缘节点通过计算各个边缘节点的部署权重,该部署权重可以是在考虑多种因素的情况下计算得到的,最终根据部署权重选择一个边缘节点执行第一边缘节点的任务,从而保证选择出来的边缘节点为最适合执行第一边缘节点的任务的边缘节点。
基于第二方面的第四种实施方式,或第二方面的第五种实施方式,本申请实施例还提供了第二方面的第六种实施方式,若第一边缘节点集合中不存在满足预设条件的边缘节点,则第二边缘节点从其他边缘节点集合中选择满足预设条件的一个边缘节点执行第一边缘节点的任务。
该实施方式提供了另一种重新选择边缘节点执行第一边缘节点的任务的方案。
基于第二方面的第四种实施方式,或第二方面的第五种实施方式,本申请实施例还提供了第二方面的第七种实施方式,在第二边缘节点从第一边缘节点集合中选择一个边缘节点执行第一边缘节点的任务之后,若第二边缘节点被选择执行第一边缘节点的任务,且第二边缘节点上未部署分层镜像,则第二边缘节点根据应用镜像的部署信息从L个边缘节点,获取X个分层镜像组成应用镜像;
第二边缘节点运行应用镜像以执行第一边缘节点的任务。
作为备选边缘节点,第二边缘节点上未部署分层镜像,当被选择执行第一边缘节点的任务时,第二边缘节点根据应用镜像的部署信息从L个边缘节点获取应用镜像。
基于第二方面,或第二方面的第一种实施方式,或第二方面的第二种实施方式,或第二方面的第三种实施方式,或第二方面的第四种实施方式,或第二方面的第五种实施方式,或第一方面的第六种实施方式,或第一方面的第七种实施方式,本申请实施例还提供了第二方面的第八种实施方式,若第一边缘节点故障,则第二边缘节点对由第一边缘节点负责故障检测的边缘节点进行故障检测。
由于第一边缘节点故障自身负责对一部分边缘节点进行故障检测,所以当第一边缘节点故障后,由第二边缘节点对这一部分边缘节点进行故障检测。
本申请实施例第三方面提供了一种控制节点,包括:
调度模块,用于将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,N为正整数;
调度模块,还用于从第一边缘节点集合内选择M个第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,M为正整数;
发送模块,用于向M个第二边缘节点发送控制规则,控制规则指示第二边缘节点对第一边缘节点进行故障检测,第一边缘节点属于第一边缘节点集合。
基于第三方面,本申请实施例还提供了第三方面的第一种实施方式,调度模块用于:
根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合,K为大于M的正整数。
基于第三方面的第一种实施方式,本申请实施例还提供了第三方面的第二种实施方式,调度模块还用于:将K个边缘节点组成哈希环。
基于第三方面的第二种实施方式,本申请实施例还提供了第三方面的第三种实施方式,第一边缘节点和至少一个第二边缘节点在哈希环内相邻。
基于第三方面,或第三方面的第一种实施方式,或第三方面的第二种实施方式,或第三方面的第三种实施方式,本申请实施例还提供了第三方面的第四种实施方式,控制节点还包括镜像部署模块;
镜像部署模块用于将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上,L个边缘节点中的每个边缘节点部署有至少一个分层镜像,L和X均为大于1的正整数。
基于第三方面的第四种实施方式,本申请实施例还提供了第三方面的第五种实施方式,发送模块,还用于将待部署的应用镜像的部署信息发送至第一边缘节点集合中的边缘节点,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署待部署的应用镜像的分层镜像的部署情况。
本申请实施例第四方面提供了一种边缘节点,边缘节点为第一边缘节点集合中的第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,N个边缘节点集合由边缘节点集群包括的多个边缘节点划分得到的,其中,每个边缘节点集合包括至少两个边缘节点,第二边缘节点上存储有控制规则,N为正整数;
第二边缘节点包括:
调度模块,用于根据控制规则从第一边缘节点集合中确定第一边缘节点,控制规则指示第二边缘节点对第一边缘节点进行故障检测;
检测模块,用于对第一边缘节点进行故障检测。
基于第四方面,本申请实施例还提供了第四方面的第一种实施方式,第一边缘节点集合中的边缘节点组成哈希环;
第一边缘节点和第二边缘节点在哈希环内相邻。
基于第四方面,或第四方面的第一种实施方式,本申请实施例还提供了第四方面的第二种实施方式,第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,L和X均为大于1的正整数;
第一边缘节点集合中的每个边缘节点存储有应用镜像的部署信息,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署应用镜像的分层镜像的部署情况;
边缘节点还包括:
镜像获取模块,用于当第二边缘节点上部署有H个分层镜像时,根据应用镜像的部署信息从L个边缘节点中的其他边缘节点,获取(X-H)个分层镜像组成应用镜像,H为正整数,X为大于H的正整数;
镜像运行模块,用于运行应用镜像以执行相应的任务。
基于第四方面的第二种实施方式,本申请实施例还提供了第四方面的第三种实施方式,调度模块,用于当第一边缘节点故障时,根据应用镜像的部署信息确定第一边缘节点部署应用镜像的分层镜像的部署情况;
调度模块,还用于当第一边缘节点上部署有至少一个分层镜像,从第一边缘节点集合中选择一个边缘节点执行第一边缘节点的任务。
基于第四方面的第三种实施方式,本申请实施例还提供了第四方面的第四种实施方式,调度模块,还用于当第二边缘节点被选择执行第一边缘节点的任务,且第二边缘节点上未部署分层镜像时,根据应用镜像的部署信息从L个边缘节点,获取X个分层镜像组成应用镜像;
镜像运行模块,还用于运行应用镜像以执行第一边缘节点的任务。
本申请实施例第五方面提供一种控制节点,包括:至少一个处理器和存储器,存储器存储有可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述控制节点执行如上述第一方面或第一方面任意一种可能的实现方式所述的控制边缘节点的方法。
本申请实施例第六方面提供一种边缘节点,包括:至少一个处理器和存储器,存储器存储有可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述边缘节点执行如上述第二方面或第二方面任意一种可能的实现方式所述的控制边缘节点的方法。
本申请实施例第七方面提供一种边缘计算系统,包括控制节点和边缘节点集群;
边缘节点集群包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,第二边缘节点上存储有控制规则,N为正整数;
控制节点用于执行如上述第一方面或第一方面任意一种可能的实现方式所述的控制边缘节点的方法;
第二边缘节点用于执行如上述第二方面或第二方面任意一种可能的实现方式所述的控制边缘节点的方法。
本申请实施例第八方面提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行如上述第一方面中任意一种实施方式所述的控制节点的方法。
本申请实施例第九方面提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行如上述第二方面中任意一种实施方式所述的边缘节点的方法。
本申请实施例第十方面提供了一种计算机存储介质,该计算机存储介质用于储存为上述所述控制节点或边缘节点所用的计算机软件指令,其包括用于执行为所述控制节点或边缘节点所设计的程序。
该控制节点可以如前述第三方面所描述的控制节点;
该边缘节点可以如前述第四方面所描述的边缘节点。
本申请实施例第十一方面提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,该计算机软件指令可通过处理器进行加载来实现如上述第一方面或第二方面中任意一项所述的控制边缘节点的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,N为正整数;控制节点从第一边缘节点集合内选择M个第二边缘节点,向M个第二边缘节点发送控制规则,控制规则指示第二边缘节点对第一边缘节点进行故障检测,第一边缘节点属于第一边缘节点集合,第一边缘节点集合为N个边缘节点集合中的一个,M为正整数;这样,当控制节点无法对边缘节点集群中的第一边缘节点进行控制时,可以通过第二边缘节点对第一边缘节点的故障状况进行检测。
附图说明
图1为本申请实施例中边缘计算系统的架构示意图;
图2为本申请实施例中控制边缘节点的方法的一个实施例示意图;
图3为本申请实施例中边缘节点集群中边缘节点集合的示意图;
图4为本申请实施例中哈希环的实施例示意图;
图5为本申请实施例中待部署的应用镜像的一个实施例示意图;
图6为本申请实施例中待部署的应用镜像的部署实施例示意图;
图7为本申请实施例部署应用镜像的实施例示意图;
图8为本申请实施例中控制边缘节点的方法的另一个实施例示意图;
图9为本申请实施例中调度过程的实施例示意图;
图10为本申请实施例中第一边缘节点对应的哈希环的实施例示意图;
图11为本申请实施例中控制节点的一个实施例示意图;
图12为本申请实施例中边缘节点的一个实施例示意图;
图13为本申请实施例中控制节点的另一个实施例示意图;
图14为本申请实施例中边缘节点的另一个实施例示意图;
图15为本申请实施例中边缘计算系统的实施例示意图。
具体实施方式
本申请实施例提供了一种控制边缘节点的方法、节点及边缘计算系统,用于当边缘节点集群处于离线或弱网场景时,对边缘节点集群中的边缘节点进行控制。
请参阅图1,本申请实施例中边缘计算系统的架构示意图。如图1所示,该边缘计算系统包括终端层、边缘计算层和云计算层,边缘计算层通过通信网络分别与终端层、云计算层通信连接;其中,终端层包括多种终端设备,以图1为例,终端层具体可以包括车载终端、笔记本电脑、智能手表、智能手机、平板电脑及智能电视等终端设备;边缘计算层包括至少一个边缘节点集群,一个边缘节点集群包含至少两个边缘节点,边缘节点可以为边缘网关、边缘控制器和边缘服务器等;云计算层包括至少一个云服务器集群。
边缘计算层与终端层之间的通信网络可以是有线的通信网络,也可以是无线的通信网络,例如:第五代移动通信技术(5th-Generation,5G)系统,长期演进(long termevolution,LTE)系统、全球移动通信系统(global system for mobile communication,GSM)或码分多址(code division multiple access,CDMA)网络、宽带码分多址(widebandcode division multiple access,WCDMA)网络等,还可以无线保真(wireless fidelity,WiFi)等其他通信网络或通信系统。
边缘计算层与云计算层的通信网络一般为城域网。
在该边缘计算系统中,云计算层用于对经过边缘计算层初步处理后的数据进行进一步处理,除此之外,云计算层还用于对边缘计算层进行控制,具体包括对边缘节点集群进行管理和调度。通常情况下,会在云计算层设置一个控制节点,该控制节点用于对边缘节点集群中的边缘节点进行集中式状态管理、任务分配和任务调度等。
然而,存在控制节点无法对边缘节点集群进行控制的情况。例如,当控制节点故障时,控制节点则无法对边缘节点集群中的边缘节点进行控制。
再例如,由于边缘计算层与云计算层的通信网络一般为城域网,城域网的的稳定性较差,容易受各类不确定因素影响断开,所以会导致边缘计算层处于离线或弱网场景;当边缘计算层处于离线或弱网场景时,控制节点也无法对缘节点集群中的边缘节点进行控制。
为此,本申请实施例提供了一种控制边缘节点的方法,当控制节点无法对边缘计算集群中的边缘节点进行控制时,该方法能够实现对边缘节点集群中的边缘节点进行控制,需要说明的是,当控制节点能够对边缘计算集群中的边缘节点进行控制时,也可以采用本申请实施例的方法辅助控制节点,对边缘计算集群中的边缘节点进行控制。
为了更好地理解本申请实施例提供的控制边缘节点的方法,下面对该方法进行具体介绍。该方法的应用场景包括两个,一个是控制节点对边缘节点集群中的边缘节点进行控制,另一个是边缘节点集群对内部的边缘节点进行控制,接下来先从控制节点侧对该方法进行介绍。
请参阅图2,本申请实施例中控制边缘节点的方法的一个实施例示意图。如图2所示,本申请实施例提供了控制边缘节点的方法的一个实施例,应用于控制节点,该实施例包括:
步骤101,控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合。
其中,每个边缘节点集合包括至少两个边缘节点,N为正整数;两个边缘节点集合中边缘节点的数量可以相同,也可以不同;并且两个边缘节点集合可以包括相同边缘节点。
下面结合图3对两个边缘节点集合的关系进行说明。如图3所示,本申请实施例中边缘节点集群中边缘节点集合的示意图,该边缘节点集群包括边缘节点P1、P2、P3、P4和P5,并被划分为2个边缘节点集合,其中一个边缘节点集合包含边缘节点P1、P2和P3,另一个边缘节点集合包含边缘节点P2、P3、P4和P5,两个边缘节点集合包括相同的边缘节点P2和P3。
需要说明的是,控制节点将边缘节点集群划分为N个边缘节点集合的方法有多种,可以根据实际需要进行选择,本申请实施例对此不做限定。
例如,可以根据各个边缘节点的实际情况将边缘节点集群划分成N个边缘节点集合,该实际情况包括但不限于边缘节点的状态、边缘节点的资源、边缘节点的存储空间(包括内存和磁盘空间)、边缘节点的CPU使用率和边缘节点的内存使用率,其中边缘节点的状态可以为故障状态和非故障状态。具体地,以N个边缘节点集合中的第一边缘节点集合为例,可以从边缘节点集群中选择资源、存储空间、CPU使用率均满足预设条件的非故障边缘节点,组成第一边缘节点集合。
除此之外,为了使边缘节点集群执行相应的任务,该任务可以是图像预处理和数据脱敏处理等任务,需要在边缘节点集群中部署多个应用镜像,因此控制节点还可以根据待部署的应用镜像将边缘节点集群划分成N个边缘节点集合。
示例性地,控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合包括:
先根据待部署的应用镜像的数量确定边缘节点集合的数量,例如一个应用镜像对应一个边缘节点集合,然后再根据应用镜像的种类从边缘节点集群中选择合适的边缘节点组成边缘节点集合。
示例性地,控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合包括:
控制节点根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合,K为正整数。
具体地,假设待部署的应用镜像为第一应用镜像,边缘节点集群包括的多个边缘节点中的部分边缘节点上已部署有第二应用镜像,则在划分第一应用镜像对应的第一边缘节点集合时,可以考虑第一应用镜像和第二应用镜像的亲和性和反亲和性,例如,若第一应用镜像和第二应用镜像之间具有亲和性,那么可以尽可能地选择已部署有第二应用镜像的边缘节点组成边第一缘节点集合,若第一应用镜像与第二应用镜像之间具有反亲和性,那么可以尽可能地选择未部署第二应用镜像的边缘节点组成边第一缘节点集合。
步骤102,控制节点从第一边缘节点集合内选择M个第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,M为正整数。
在将边缘节点集群中的多个边缘节点划分为N个边缘节点集合后,控制节点会从第一边缘节点集合中选择M个第二边缘节点,具体地,可以按照一定规则选择M个第二边缘节点,也可以随机选择M个第二边缘节点,其中,第一边缘节点集合中的边缘节点数量K大于M。
下面以一示例对按照一定规则选择M个第二边缘节点的过程进行介绍。
在控制节点根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合之后,控制节点将K个边缘节点组成哈希环。
如图4所示,本申请实施例中哈希环的实施例示意图,该哈希环中包括6个边缘节点,这6个边缘节点在哈希环中形成了相对位置关系,这样,控制节点便可以根据哈希环从第一边缘节点集合中选择M个第二边缘节点对第一边缘节点进行故障检测。
可以理解的是,M个第二边缘节点与第一边缘节点在哈希环中可以存在多种相对位置关系。示例性地,第一边缘节点和至少一个第二边缘节点在哈希环内相邻。
具体地,当M等于1时,第一边缘节点和第二边缘节点相邻;当M等于2时,以图4为例,2个第二边缘节点可以均与第一边缘节点相邻,也可以其中一个第二边缘节点与第一边缘节点相邻,另一个第二边缘节点与第一边缘节点相对分布;当M大于2时,只能有一个第二边缘节点或两个第二边缘节点与第一边缘节点相邻。
另外,在将K个边缘节点组成哈希环后,控制节点还可以将该哈希环的信息下发到K个边缘节点中的每个边缘节点,使得每个边缘节点可以根据哈希环的信息确定其他边缘节点在哈希环上的位置。
步骤103,控制节点向M个第二边缘节点发送控制规则,控制规则指示第二边缘节点对第一边缘节点进行故障检测,第一边缘节点属于第一边缘节点集合。
控制节点在选择M个第二边缘节点后,会向M个第二边缘节点发送控制规则,使得第二边缘节点对第一边缘节点进行故障检测。
其中M可以有多种取值。当M为1时,只有一个第二边缘节点对第一边缘节点进行故障检测,为了更好地对第一边缘节点进行故障检测,可以将M设置为大于或等于2,这样,则存在至少两个第二边缘节点对第一边缘节点进行故障检测。然而,若要对第一边缘节点集合中每个边缘节点进行故障检测,当M大于或等于2时,意味着第一边缘节点集合中存在第二边缘节点,该第二边缘节点需要对至少两个第一边缘节点进行故障检测,并且随着M的增大,第二边缘节点需要检测的第一边缘节点的数量会进一步增大,这无疑会增加第二边缘节点的负载。所以为了降低第二边缘节点的负载,可以将M设置地较小,例如M可以取2或3。
不同的第一边缘节点,对应的M个第二边缘节点可以相同,也可以不同。当M大于或等于2时,若不同的第一边缘节点对应的M个第二边缘节点不同,存在两种情况,第一种情况是,不同的第一边缘节点对应的M个第二边缘节点相比,存在相同的第二边缘节点,第二种情况是,不同的第一边缘节点对应的M个第二边缘节点相比,不存在相同的第二边缘节点。以M等于2为例,一个第一边缘节点对应的2个第二边缘节点,与另一个第一边缘节点对应的2个第二边缘节点相比,可以存在1个相同的第二边缘节点,存在1个不同的第二边缘节点,也可以不存在相同的第二边缘节点;除此之外,不同的第一边缘节点对应的第二边缘节点的数量也可以不同,例如,一个第一边缘节点对应2个第二边缘节点,另一个第一边缘节点对应3个第二边缘节点。
由于第一边缘节点不同,对应的M个第二边缘节点可以相同,也可以不同,所以在第一边缘节点集合中,每个边缘节点负责故障检测的边缘节点的数量可能不同,例如,假设第一边缘节点集合中包括4个边缘节点,可能其中1个边缘节点需要对其他3边缘节点进行故障检测,其中2个边缘节点需要对其他两个边缘节点进行故障检测,另外1个边缘节点不需要对其他边缘节点进行故障检测。
所以,为了更好的平衡第一边缘节点集合中各个边缘节点的负载,可以合理选择第二边缘节点和配置控制规则,使得第一边缘节点集合中的每个边缘节点都对其他边缘节点进行故障检测,进一步地,可以使得每个边缘节点需要对相同数量的其他边缘节点进行检测,例如,当M等于2时,可以配置控制规则使得每个边缘节点都需要对其他2个边缘节点进行故障检测。
在本申请实施例中,控制节点将边缘节点集群中的多个边缘节点划分为N个边缘节点集合,并在每个边缘节点集合中选择第二边缘节点,然后向第二边缘节点发送控制规则,使得第二边缘节点对所在边缘节点集合中的第一边缘节点进行故障检测,这样,即使控制节点不能对边缘节点集群中的第一边缘节点进行故障检测,也可以通过边缘节点集群中的第二边缘节点对第一边缘节点进行故障检测,从而可以及时感知第一边缘节点的故障状况;并且,不同第一边缘节点对应的第二边缘节点可以不同,所以在边缘节点集群中,不会由一个边缘节点负责对其他所有边缘节点进行故障检测,从而避免负责故障检测的边缘节点故障而导致其他边缘节点的故障状况无法感知;另外,第二边缘节点对应的第一边缘节点可以只是边缘节点集群中的部分边缘节点,相比于第二边缘节点需要对边缘节点集群中除第二边缘节点外的所有边缘节点进行故障检测,本申请实施例能够降低第二边缘节点的负载。
上面介绍了控制节点指示第二边缘节点对第一边缘节点进行故障检测,下面介绍控制节点在边缘节点集群中部署应用镜像,部署应用镜像的方法有多种,本申请实施例对此不做限定。
示例性地,在控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合之后,控制节点为N个边缘节点集合部署待部署的应用镜像,其中,待部署的应用镜像与边缘节点集合一一对应。
由于不同边缘节点集合可以包含相同的边缘节点,所以同一边缘节点上可能部署有两种或两种以上的应用镜像。
以图3所示的边缘节点集群为例,该边缘节点集群中的边缘节点P2和边缘节点P3同时存在两个边缘节点集合中,若在这两个边缘节点集合中各部署一种应用镜像,那么边缘节点P2和边缘节点P3则可以同时部署有两种应用镜像。
需要说明的是,在一个边缘节点集合部署一种应用镜像的方法也有多种,例如,可以在边缘节点集合中的每个边缘节点上都部署一个应用镜像,这样,每个边缘节点均可以运行应用镜像以执行相应的任务;也可以在边缘节点集合中的部分边缘节点上部署一个应用镜像,具体地,先将边缘节点集合中的边缘节点分为初始边缘节点和备选边缘节点两类,例如,如图3所示,可以将图3所示的哈希环上左侧2个黑色的边缘节点作为备选边缘节点,而将其余的4个边缘节点作为初始边缘节点,然后在每个初始边缘节点上部署一个应用镜像,但在备选边缘节点上不部署应用镜像,这样,初始边缘节点可以运行应用镜像以执行相应的任务,当初始边缘节点故障或初始边缘节点需要处理的任务量较大时,采用备选边缘节点进行调度。
然而,对于边缘节点集群中每个边缘节点来说,存储空间都是有限的,若在每个边缘节点上都部署完整的应用镜像,则会占用边缘节点较大的存储空间,使得边缘节点可用的存储空间变小。对于这个问题,发明人在研究中发现,一个应用镜像可以分为基础镜像和上层软件包镜像,并且,上层软件包镜像又可以分成多个部分。因此,可以在一个边缘节点上仅部署基础镜像或上层软件包镜像中的一部分,以节省该边缘节点的存储空间,当该边缘节点需要执行任务时,可以从其他边缘节点处获取其他部分的镜像以组成应用镜像。
示例性地,在控制节点将边缘节点集群中包括的多个边缘节点划分为N个边缘节点集合之后,控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上,L个边缘节点中的每个边缘节点部署有至少一个分层镜像,L和X均为大于1的正整数。
其中,每个边缘节点上部署的至少一个分层镜像可以包括待部署的应用镜像中的基础镜像,也可以包括上层软件包镜像中的一部分。如图5所示,本申请实施例中待部署的应用镜像的一个实施例示意图,该应用镜像包括4个分层镜像,每个边缘节点上可以部署有这4个分层镜像中的至少一个。
在第一边缘节点集合中,不同边缘节点上部署分层镜像的数量可以相同,也可以不同。
当L小于第一边缘节点集合中边缘节点的个数K时,说明第一边缘节点集合中存在备选边缘节点,该备选边缘节点上未部署有分层镜像。
为了保证分层镜像部署的可靠性,可以将同一个分层镜像部署在多个边缘节点上,即同一个分层镜像对应多个副本。例如,同一个分层镜像同时被部署在3个边缘节点上,那么该分层镜像则对应3个副本。为了保证分层镜像之间的均衡性,可以将每一个分层镜像对应的副本数量设置为相同。
为了便于理解,下面举例对控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上的过程进行进一步说明。请参阅图6,本申请实施例中待部署的应用镜像的部署实施例示意图。
如图6所示,假设第一边缘节点集合中包含边缘节点A、B、C、D,待部署的应用镜像包括分层镜像a、b、c、d,每个分层镜像对应3个副本,边缘节点A上部署有分层镜像b、d,边缘节点B上部署有分层镜像a、b、c、d,边缘节点C上部署有分层镜像a、b、c,边缘节点D上部署有分层镜像a、c、d。以分层镜像b为例,分层镜像b分别被部署在边缘节点A、B、C上。由此可以看出,图6所示的4个边缘节点中,仅有边缘节点B上部署有分层镜像a、b、c、d,即边缘节点B上部署有完整的应用镜像,因此边缘节点B可以不需要从其他边缘节点处获取分层镜像,可以直接运行存储的应用镜像以执行相应的任务。对于边缘节点A来说,其上部署有分层镜像b、d,因此边缘节点A需要从其他边缘节点处获取分层镜像a、c以组成完整的应用镜像,例如,可以从边缘节点B、C、D中的任意一个边缘节点处获取分层镜像a、c。边缘节点C和边缘节点D的情况与边缘节点A类似,具体可参照边缘节点A的相关说明进行理解。
需要说明的是,第一边缘节点集合为N个边缘节点集合中的一个,对于N个边缘节点集合中的其他边缘节点集合来说,可以采用与第一边缘节点集合相同的方法进行镜像部署,即在多个边缘节点上分别部署分层镜像,也可以在多个边缘节点上直接部署完整的应用镜像,本申请实施例对此不做限定。
上面对在第一边缘节点集合中部署应用镜像的过程进行了说明,可以理解的是,实现在L个边缘节点中的每个边缘节点上部署至少一个分层镜像的方案有很多,为了获得较好的部署方案,以在L个边缘节点中的每个边缘节点上进行分层镜像部署,本申请实施例提供了一种部署方法,具体请参阅图7,本申请实施例部署应用镜像的实施例示意图,如图7所示,控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上包括:
步骤201,控制节点建立为N个边缘节点集合部署应用镜像的目标函数。
需要说明的是,建立目标函数的方法有多种,本申请实施例对此不做限定。
步骤202,控制节点根据预置的寻优算法和目标函数确定镜像部署方案。
在步骤201中,控制节点建立了目标函数,步骤202中,控制节点则根据寻优算法对目标函数进行寻优求解,从而得到可以将待部署的应用镜像包括的X个分层镜像部署到第一边缘节点集合中的L个边缘节点上的镜像部署方案,其中,得到的镜像部署方案可以是最优的镜像部署方案,但由于部署方案数量较多,因此得到的也可以是次优的镜像部署方案。
步骤203,控制节点根据镜像部署方案将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上。
在本申请实施例中,控制节点先建立为N个边缘节点集合部署应用镜像的目标函数,然后通过对该目标函数寻优求解得到镜像部署方案,最终控制节点根据该寻优求解得到的镜像部署方案,可以在L个边缘节点中的每个边缘节点上部署至少一个分层镜像。
需要说明的是,在上述实施例中,控制节点建立目标函数的方法可以有多种,目标函数也可以有多种,作为一种可实现的方式,控制节点建立为N个边缘节点集合部署应用镜像的目标函数包括:
控制节点先建立第一指标和第二指标,第一指标表示为N个边缘节点集合部署应用镜像的可靠程度,第二指标表示为N个边缘节点集合部署应用镜像的均衡程度。
需要说明的是,第一指标和第二指标有多种选择,相应地,建立第一指标和第二指标的方法也有多种。例如,第一指标可以为U=∑1≤i≤Z,1≤j≤Xi,1≤r≤CG(Fi,j,r),Z表示在边缘节点集群中部署的应用镜像的总数,Xi表示第i个应用镜像包括的分层镜像的数量,C表示第i个应用镜像的第j个分层镜像的副本数量,Fi,j,r表示第i个应用镜像的第j个分层镜像的第r个副本所部署的边缘节点,G(Fi,j,r)=1-c*MF,c为常数,G(Fi,j,r)表示第i个应用镜像的第j个分层镜像的第r个副本部署在边缘节点Fi,j,r上的可靠程度,MF表示边缘节点Fi,j,r所在的边缘节点集合的数量;第二指标可以为
Figure BDA0002352665860000141
其中
Figure BDA0002352665860000142
W表示边缘节点集群中边缘节点的数量,μ表示Q的平均值,RW表示第W个边缘节点剩余的存储空间,TW=∑1≤i≤Z,1≤j≤XiSi,j,Si,j表示部署第i个应用镜像的第j个分层镜像所需的存储空间。
控制节点然后根据第一指标和第二指标建立目标函数。对应上述第一指标和第二指标,目标函数可以为O(Fi,j,r)=αU-βD(Q),限制条件为边缘节点Fi,j,r的数量大于或等于1且小于或等于Z,0≤TW≤RW
示例性地,控制节点将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上后,控制节点将待部署的应用镜像的部署信息发送至第一边缘节点集合中的边缘节点,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署待部署的应用镜像的分层镜像的部署情况。
这样,第一边缘节点集合中的每个边缘节点,根据部署信息可以确定L个边缘节点中的每个边缘节点上部署的分层镜像,当需要运行应用镜像以执行任务时,边缘节点便可以根据部署信息从其他边缘节点中获取相应的分层镜像以组成应用镜像。
上面从控制节点侧对本申请实施例提供中控制边缘节点的方法包进行了介绍,下面从边缘节点集群侧对本申请实施例提供的控制边缘节点的方法进行介绍。
请参阅图8,本申请实施例中控制边缘节点的方法的另一个实施例示意图。本申请实施例提供了一种控制边缘节点的方法的另一个实施例,应用于边缘节点集群。
基于前述实施例可知,控制节点对边缘节点集群进行了划分,具体地,边缘节点集群包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,第二边缘节点上存储有控制规则,第二边缘节点的数量可以为M个,M和N均为正整数。
基于上述边缘节点集群,方法包括:
步骤301,第二边缘节点根据控制规则从第一边缘节点集合中确定第一边缘节点。
由于控制规则指示第二边缘节点对第一边缘节点进行故障检测,所以第二边缘节点根据控制规则可以确定第一边缘节点,其中,控制规则中可以包括第二边缘节点和第一边缘节点的映射关系。
第二边缘节点和第一边缘节点的映射关系有多种,作为一种示例,第一边缘节点集合中的边缘节点组成哈希环,根据前述实施例可知,控制节点会将哈希环的信息下发到第一边缘节点集合中的每个边缘节点,使得每个边缘节点可以根据哈希环的信息确定其他边缘节点在哈希环上的位置,因此第二边缘节点可以根据哈希环的信息以及第二边缘节点与第一边缘节点在哈希环上的相对位置关系确定第一边缘节点,例如,如图4所示,第一边缘节点和第二边缘节点在哈希环内相邻,即第二边缘节点可以将哈希环内相邻的边缘节点确定为第一边缘节点;如图4所示,第一边缘节点和第二边缘节点在哈希环内还可以相对分布,即第二边缘节点可以将哈希环内与之相对的边缘节点确定为第一边缘节点。
步骤302,第二边缘节点对第一边缘节点进行故障检测。
第二边缘节点在确定第一边缘节点后,会对第一边缘节点进行故障检测,该故障检测可以是周期性地,具体的故障检测方法有多种,本申请实施例对此不做限定。
示例性地,第二边缘节点可以通过心跳检测来实现对第一边缘节点的故障检测,具体地,第二边缘节点向第一边缘节点发送请求消息,该请求消息中可以携带第二边缘节点的相关信息,其中相关信息可以包括第二边缘节点的IP地址,若第二边缘节点在预设时间段内未接收到对应请求消息的响应消息,则可以确定第一边缘节点故障。
在本申请实施例中,当控制节点不能对第一边缘节点集合中的第一边缘节点进行故障检测时,第二边缘节点可以根据控制规则对该第一边缘节点进行故障检测,从而可以及时感知第一边缘节点的故障状况;并且,不同第一边缘节点对应的第二边缘节点可以不同,所以在边缘节点集群中,不会由一个边缘节点负责对其他所有边缘节点进行故障检测,从而避免负责故障检测的边缘节点故障而导致其他边缘节点的故障状况无法感知;另外,第二边缘节点对应的第一边缘节点可以只是边缘节点集群中的部分边缘节点,相比于第二边缘节点需要对边缘节点集群中除第二边缘节点外的所有边缘节点进行故障检测,本申请实施例能够降低第二边缘节点的负载。
应理解,边缘节点集群需要运行应用镜像来执行相应的任务,而应用镜像在边缘节点集群中部署的情况有多种。
示例性地,N个边缘节点集合中的每个边缘节点集合中均部署有一种应用镜像。一种应用镜像在一个边缘节点集合中部署的情况也有多种,以第一边缘节点集合为例,假设第一边缘节点集合中部署有一个应用镜像,第一边缘节点集合中的每个边缘节点上都可以部署该应用镜像,或者第一边缘节点集合中的部分边缘节点上部署有该应用镜像。
基于前述实施例可知,一个应用镜像包括基础镜像和上层软件包镜像,并且,上层软件包镜像又可以分成多个部分。因此,在本申请实施例提供的控制边缘节点的方法的另一个实施例中,第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,L和X均为大于1的正整数。
其中,每个边缘节点上部署的至少一个分层镜像可以包括应用镜像中的基础镜像,也可以包括上层软件包镜像中的一部分。
第一边缘节点集合中的每个边缘节点存储有应用镜像的部署信息,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署应用镜像的分层镜像的部署情况。
基于上述部署情况,在该实施例中,方法还包括:
若第二边缘节点上部署有H个分层镜像,则第二边缘节点根据应用镜像的部署信息从L个边缘节点中的其他边缘节点,获取(X-H)个分层镜像组成应用镜像,H为正整数,X为大于H的正整数。
仍以图6为例,假设应用镜像包括a、b、c、d四个分层镜像,即X=4,假设第二边缘节点为边缘节点A,其上部署有分层镜像b、d,即H=2,第二边缘节点根据应用镜像的部署信息可以确定,边缘节点B上部署有分层镜像a、b、c、d,边缘节点C上部署有分层镜像a、b、c,边缘节点D上部署有分层镜像a、c、d,所以第二边缘节点可以从边缘节点B、C、D中的任意一个边缘节点处获取分层镜像a、c,从而组成应用镜像;在得到应用镜像后,第二边缘节点可以运行应用镜像以执行相应的任务。
若第二边缘节点上部署有X个分层镜像,则第二边缘节点不需从其他边缘节点处获取分层镜像,可以直接运行本地存储的X个分层镜像组成的应用镜像,以执行相应的任务。
若第二边缘节点上未部署有分层镜像,则第二边缘节点可以作为用于调度的备选边缘节点。
上面介绍了第二边缘节点对第一边缘节点进行故障检测,并且介绍了应用镜像在第一边缘节点集合中的部署情况,基于该部署情况,下面对第一边缘节点故障后的调度过程进行介绍。
在本申请实施例提供的一种控制边缘节点的方法的另一个实施例中,请参参阅图9,本申请实施例中调度过程的实施例示意图。在该实施例中,方法还包括:
步骤401,若第一边缘节点故障,则第二边缘节点根据应用镜像的部署信息确定第一边缘节点部署应用镜像的分层镜像的部署情况。
需要说明的是,判定第一边缘节点故障的方式有多种。具体地,在第一边缘节点集合中,第二边缘节点的数量可以为一个,也可以为多个;当第二边缘节点的数量为一个时,若当前第二边缘节点检测到第一边缘节点故障,则可以判定第一边缘节点故障;当第二边缘节点的数量为多个时,可以设置相应的规则,使得至少E个第二边缘节点检测到第一边缘节点故障时,才可以判定第一边缘节点故障,其中E的取值可以为1,也可以大于或等于2。
其中,应用镜像的分层镜像的部署情况可以为第一边缘节点上部署有应用镜像的至少一个分层镜像,也可以为第一边缘节点上未部署应用镜像的至少一个分层镜像。
步骤402,若第一边缘节点上部署有至少一个分层镜像,则第二边缘节点从第一边缘节点集合中选择一个边缘节点执行第一边缘节点的任务。
若第一边缘节点上部署有至少一个分层镜像,则表示该第一边缘节点运行应用镜像以执行相应的任务,所以需要重新选择一个边缘节点来代替第一边缘节点执行任务。
需要说明的是,第二边缘节点在从第一边缘节点集合中选择边缘节点时,可以考虑多种因素,该多种因素可以包括边缘节点的状态、边缘节点的资源、边缘节点的内存、边缘节点的磁盘空间、边缘节点的CPU使用率、边缘节点的内存使用率、边缘节点上应用镜像与第一边缘节点上的分层镜像对应的应用镜像之间的亲和性、边缘节点上应用镜像与第一边缘节点上的分层镜像对应的应用镜像之间的反亲和性、边缘节点上应用镜像的种类数、边缘节点与第一边缘节点上的分层镜像对应的应用镜像的排斥程度和边缘节点上应用镜像所占的存储空间等。
第二边缘节点可以根据上述多种因素计算第二边缘节点本身的部署权重,并接收第一边缘节点集合中其他边缘节点的部署权重,最后根据第二边缘节点本身的部署权重和第一边缘节点集合中其他边缘节点的部署权重选择一个边缘节点来代替第一边缘节点执行任务,从而保证选择出来的边缘节点为最适合执行第一边缘节点的任务的边缘节点。
在考虑上述因素的情况下,第二边缘节点在从第一边缘节点集合中选择边缘节点代替第一边缘节点执行任务的方法也有很多。
首先,当第二边缘节点的数量为一个时,当前第二边缘节点可以自行选择一个边缘节点代替第一边缘节点执行任务;当第二边缘节点的数量为多个时,若第一边缘节点故障,通常情况下,所有第二边缘节点都可以检测到该第一边缘节点故障,所以当前第二边缘节点可以与其他第二边缘节点协商选择一个边缘节点代替第一边缘节点执行任务。
另外,第二边缘节点在从第一边缘节点集合中选择边缘节点的过程中,可以直接从第一边缘节点集合中除第一边缘节点外的其他所有边缘节点进行选择,也可以按照一定的规则依次进行选择。
具体地,由于当第一边缘节点故障时,所有第二边缘节点都可以检测到该第一边缘节点故障,而第一边缘节点集合中除第二边缘节点外的其他边缘节点无法检测到第一边缘节点故障,所以可以先从所有第二边缘节点中选择一个满足预设条件的第二边缘节点代替第一边缘节点执行任务,这样,第二边缘节点不需将向第一边缘节点集合中除第二边缘节点外的其他边缘节点发送故障消息,该故障消息用于指示第一边缘节点故障,因此能够减少边缘节点之间的交互,从而降低边缘节点的负载。
若所有第二边缘节点中不存在满足预设条件的第二边缘节点,那么可以从第一边缘节点集合中除第二边缘节点外的其他边缘节点中选择一个边缘节点代替第一边缘节点执行任务。具体地,可以从第一边缘节点集合中除第二边缘节点外的其他边缘节点中选择部分边缘节点,然后判断该部分边缘节点中是否存在满足预设条件的边缘节点,若存在,则选择满足预设条件的边缘节点代替第一边缘节点执行任务,若不存在,则继续从剩余的边缘节点中选择。
例如,请参阅图10,本申请实施例中第一边缘节点对应的哈希环的实施例示意图。如图10所示,在该哈希环中,包括一个边缘节点V1、两个边缘节点V2、三个边缘节点V3和一个边缘节点V4,假设第一边缘节点为边缘节点V1,第二边缘节点为边缘节点V2。若边缘节点V1故障,则两个边缘节点V2可以先协商从两个边缘节点V2内部选择一个边缘节点V2代替边缘节点V1执行任务,若两个边缘节点V2均不满足预设条件,则可以从两个边缘节点V2相邻的两个边缘节点V3中选择一个边缘节点代替边缘节点V1执行任务,若两个边缘节点V3也不满足预设条件,则再判断边缘节点V4是否满足预设条件,若边缘节点V4满足预设条件,则边缘节点V4代替边缘节点V1执行任务。
由上述内容可知,当第一边缘节点故障,第二边缘节点会从第一边缘节点集合中选择一个边缘节点代替第一边缘节点执行任务,需要说明的是,当第一边缘节点集合中不存在满足预设条件的边缘节点时,即第一边缘节点集合中不存在能够代替第一边缘节点执行任务的边缘节点时,第二边缘节点还可以从其他边缘节点集合中选择一个边缘节点代替第一边缘节点执行任务,具体选择过程在此不做详述。
可以理解的是,第二边缘节点也可能被选择执行第一边缘节点的任务,因此在本申请实施例提供的一种控制边缘节点的方法的另一个实施例中,方法还包括:
步骤403,若第二边缘节点被选择执行第一边缘节点的任务,且第二边缘节点上未部署分层镜像,则第二边缘节点根据应用镜像的部署信息从L个边缘节点,获取X个分层镜像组成应用镜像。
第二边缘节点上未部署分层镜像,说明第二边缘节点为备选部署节点,所以第二边缘节点需要根据应用镜像的部署信息获取X个分层镜像组成应用镜像。
步骤404,第二边缘节点运行应用镜像以执行第一边缘节点的任务。
在获取应用镜像后,第二边缘节点通过运行该应用镜像即可执行第一边缘节点的任务。
可以理解的是,若第二边缘节点被选择执行第一边缘节点的任务,且第二边缘节点上部署有分层镜像,根据前述实施例可知,第二边缘节点预先会根据应用镜像的部署信息获取分层镜像以组成应用镜像,因此第二边缘节点不需重新获取分层镜像,可以直接执行第一边缘节点的任务。
在上述内容中,若第一边缘节点故障,第二边缘节点会重新选择一个边缘节点执行第一边缘节点的任务,除此之外,由于第一边缘节点故障自身负责对一部分边缘节点进行故障检测,所以当第一边缘节点故障后,第二边缘节点还会对这一部分边缘节点进行故障检测。以图10所示的哈希环为例,假设第二边缘节点和第一边缘节点在哈希环中相邻,对于边缘节点V1来说,两个边缘节点V2与该边缘节点V1相邻,所以在将边缘节点V2作为第一边缘节点时,边缘节点V1需要对两个边缘节点V2进行故障检测,在将边缘节点V1作为第一边缘节点时,两个边缘节点V2需要对边缘节点V1进行故障检测;当边缘节点V1故障时,则两个边缘节点V2会相互进行故障检测。
下面对本申请实施例中的控制节点和边缘节点进行介绍。
请阅图11,本申请实施例中控制节点的一个实施例示意图。如图11所示,本申请实施例提供了一种控制节点的一个实施例,包括:
调度模块501,用于将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,N为正整数;
调度模块501,还用于从第一边缘节点集合内选择M个第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,M为正整数;
发送模块502,用于向M个第二边缘节点发送控制规则,控制规则指示第二边缘节点对第一边缘节点进行故障检测,第一边缘节点属于第一边缘节点集合。
在本申请实施例提供的一种控制节点的另一个实施例中,调度模块501用于:
根据待部署的应用镜像及边缘节点集群包括的多个边缘节点上已部署的应用镜像,从多个边缘节点中选择K个边缘节点组成第一边缘节点集合,K为大于M的正整数。
在本申请实施例提供的一种控制节点的另一个实施例中,调度模块501还用于:将K个边缘节点组成哈希环。
在本申请实施例提供的一种控制节点的另一个实施例中,第一边缘节点和至少一个第二边缘节点在哈希环内相邻。
在本申请实施例提供的一种控制节点的另一个实施例中,控制节点还包括镜像部署模块503;
镜像部署模块503用于将待部署的应用镜像包括的X个分层镜像部署在第一边缘节点集合中的L个边缘节点上,L个边缘节点中的每个边缘节点部署有至少一个分层镜像,L和X均为大于1的正整数。
在本申请实施例提供的一种控制节点的另一个实施例中,发送模块502,还用于将待部署的应用镜像的部署信息发送至第一边缘节点集合中的边缘节点,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署待部署的应用镜像的分层镜像的部署情况。
请参阅图12,本申请实施例中边缘节点的一个实施例示意图,如图12所示,本申请实施例提供了一种边缘节点,边缘节点为第一边缘节点集合中的第二边缘节点,第一边缘节点集合为N个边缘节点集合中的一个,N个边缘节点集合由边缘节点集群包括的多个边缘节点划分得到的,其中,每个边缘节点集合包括至少两个边缘节点,第二边缘节点上存储有控制规则,N为正整数;
第二边缘节点包括:
调度模块601,用于根据控制规则从第一边缘节点集合中确定第一边缘节点,控制规则指示第二边缘节点对第一边缘节点进行故障检测;
检测模块602,用于对第一边缘节点进行故障检测。
在本申请实施例提供的一种边缘节点的另一个实施例中,第一边缘节点集合中的边缘节点组成哈希环;
第一边缘节点和第二边缘节点在哈希环内相邻。
在本申请实施例提供的一种边缘节点的另一个实施例中,第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,L和X均为大于1的正整数;
第一边缘节点集合中的每个边缘节点存储有应用镜像的部署信息,应用镜像的部署信息包括L个边缘节点中的每个边缘节点部署应用镜像的分层镜像的部署情况;
边缘节点还包括:
镜像获取模块603,用于当第二边缘节点上部署有H个分层镜像时,根据应用镜像的部署信息从L个边缘节点中的其他边缘节点,获取(X-H)个分层镜像组成应用镜像,H为正整数,X为大于H的正整数;
镜像运行模块604,用于运行应用镜像以执行相应的任务。
在本申请实施例提供的一种边缘节点的另一个实施例中,调度模块601,用于当第一边缘节点故障时,根据应用镜像的部署信息确定第一边缘节点部署应用镜像的分层镜像的部署情况;
调度模块601,还用于当第一边缘节点上部署有至少一个分层镜像,从第一边缘节点集合中选择一个边缘节点执行第一边缘节点的任务。
在本申请实施例提供的一种边缘节点的另一个实施例中,镜像获取模块603,还用于当第二边缘节点被选择执行第一边缘节点的任务,且第二边缘节点上未部署分层镜像时,根据应用镜像的部署信息从L个边缘节点,获取X个分层镜像组成应用镜像;
镜像运行模块604,还用于运行应用镜像以执行第一边缘节点的任务。
请参阅图13,本申请实施例中控制节点一个实施例可以包括一个或一个以上处理器701,存储器702,通信接口703。
存储器702可以是短暂存储或持久存储。更进一步地,处理器701可以配置为与存储器702通信,在控制设备上执行存储器702中的一系列指令操作。
本实施例中,处理器701可以执行前述图11所示实施例中控制节点所执行的操作,具体此处不再赘述。
本实施例中,处理器701中的具体功能模块划分可以与前述图11中所描述的调度模块、发送模块、镜像部署模块等模块的功能模块划分方式类似,此处不再赘述。
请参阅图14,本申请实施例中边缘节点一个实施例可以包括一个或一个以上处理器801,存储器802,通信接口803。
存储器802可以是短暂存储或持久存储。更进一步地,处理器801可以配置为与存储器802通信,在控制设备上执行存储器802中的一系列指令操作。
本实施例中,处理器801可以执行前述图12所示实施例中边缘节点所执行的操作,具体此处不再赘述。
本实施例中,处理器801中的具体功能模块划分可以与前述图12中所描述的调度模块、检测模块、镜像获取模块、镜像运行模块等模块的功能模块划分方式类似,此处不再赘述。
请参阅图15,本申请实施例中边缘计算系统的实施例示意图。如图15所示,本申请实施例还提供一种边缘计算系统,包括控制节点100和边缘节点集群200;
边缘节点集群200包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,第二边缘节点上存储有控制规则,N为正整数;
控制节点100用于执行如上述第一方面或第一方面任意一种可能的实现方式所述的控制边缘节点的方法;
第二边缘节点用于执行如上述第二方面或第二方面任意一种可能的实现方式所述的控制边缘节点的方法。
本申请实施例还提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行前述图2和图7所示实施例中控制节点所执行的操作,具体此处不再赘述。
其中,芯片中的通信接口可以为输入/输出接口、管脚或电路等。
本申请实施例还提供了芯片或者芯片系统的第一种实施方式,本申请中上述描述的芯片或者芯片系统还包括至少一个存储器,该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元,例如,寄存器、缓存等,也可以是该芯片的存储单元(例如,只读存储器、随机存取存储器等)。
本申请实施例还提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以执行前述图8和图9所示实施例中边缘节点所执行的操作,具体此处不再赘述。
其中,芯片中的通信接口可以为输入/输出接口、管脚或电路等。
本申请实施例还提供了芯片或者芯片系统的第一种实施方式,本申请中上述描述的芯片或者芯片系统还包括至少一个存储器,该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元,例如,寄存器、缓存等,也可以是该芯片的存储单元(例如,只读存储器、随机存取存储器等)。
本申请实施例还提供了一种计算机存储介质,该计算机存储介质用于储存为上述所述控制节点或边缘节点所用的计算机软件指令,其包括用于执行为控制节点或边缘节点所设计的程序。
该控制节点可以如前述图11所描述的控制节点。
该边缘节点可以如前述图12所描述的边缘节点。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,该计算机软件指令可通过处理器进行加载来实现上述图2、图7至图9中方法的流程。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (17)

1.一种控制边缘节点的方法,其特征在于,包括:
控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,N为正整数;
所述控制节点从第一边缘节点集合内选择M个第二边缘节点,所述第一边缘节点集合为所述N个边缘节点集合中的一个,M为正整数;
所述控制节点向所述M个第二边缘节点发送控制规则,所述控制规则指示所述第二边缘节点对第一边缘节点进行故障检测,所述第一边缘节点属于所述第一边缘节点集合。
2.根据权利要求1所述的方法,其特征在于,所述控制节点将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合包括:
控制节点根据待部署的应用镜像及所述边缘节点集群包括的多个边缘节点上已部署的应用镜像,从所述多个边缘节点中选择K个边缘节点组成所述第一边缘节点集合,K为大于M的正整数。
3.根据权利要求2所述的方法,其特征在于,在所述控制节点根据待部署的应用镜像及所述边缘节点集群包括的多个边缘节点上已部署的应用镜像,从所述多个边缘节点中选择K个边缘节点组成所述第一边缘节点集合之后,所述方法还包括:
所述控制节点将所述K个边缘节点组成哈希环。
4.根据权利要求3所述的方法,其特征在于,所述第一边缘节点和至少一个第二边缘节点在所述哈希环内相邻。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,在所述控制节点将边缘节点集群中包括的多个边缘节点划分为N个边缘节点集合之后,所述方法还包括:
所述控制节点将所述待部署的应用镜像包括的X个分层镜像部署在所述第一边缘节点集合中的L个边缘节点上,所述L个边缘节点中的每个边缘节点部署有至少一个分层镜像,L和X均为大于1的正整数。
6.根据权利要求5所述的方法,其特征在于,在所述控制节点将所述待部署的应用镜像包括的X个分层镜像部署在所述第一边缘节点集合中的L个边缘节点上后,所述方法还包括:
所述控制节点将所述待部署的应用镜像的部署信息发送至所述第一边缘节点集合中的边缘节点,所述应用镜像的部署信息包括所述L个边缘节点中的每个边缘节点部署所述待部署的应用镜像的分层镜像的部署情况。
7.一种控制边缘节点的方法,其特征在于,应用于边缘节点集群,所述边缘节点集群包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,所述N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,所述第二边缘节点上存储有控制规则,N为正整数;
所述方法包括:
所述第二边缘节点根据所述控制规则从所述第一边缘节点集合中确定第一边缘节点,所述控制规则指示所述第二边缘节点对所述第一边缘节点进行故障检测;
所述第二边缘节点对所述第一边缘节点进行故障检测。
8.根据权利要求7所述的方法,其特征在于,所述第一边缘节点集合中的边缘节点组成哈希环;
所述第一边缘节点和所述第二边缘节点在所述哈希环内相邻。
9.根据权利要求7或8所述的方法,其特征在于,所述第一边缘节点集合中的L个边缘中的每个边缘节点,部署有应用镜像包括的X个分层镜像中的至少一个分层镜像,L和X均为大于1的正整数;
所述第一边缘节点集合中的每个边缘节点存储有所述应用镜像的部署信息,所述应用镜像的部署信息包括所述L个边缘节点中的每个边缘节点部署所述应用镜像的分层镜像的部署情况;
所述方法还包括:
若所述第二边缘节点上部署有H个分层镜像,则所述第二边缘节点根据所述应用镜像的部署信息从所述L个边缘节点中的其他边缘节点,获取(X-H)个分层镜像组成所述应用镜像,H为正整数,X为大于H的正整数;
所述第二边缘节点运行所述应用镜像以执行相应的任务。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
若所述第一边缘节点故障,则所述第二边缘节点根据所述应用镜像的部署信息确定所述第一边缘节点部署所述应用镜像的分层镜像的部署情况;
若所述第一边缘节点上部署有至少一个分层镜像,则所述第二边缘节点从所述第一边缘节点集合中选择一个边缘节点执行所述第一边缘节点的任务。
11.根据权利要求10所述的方法,其特征在于,在所述第二边缘节点从所述第一边缘节点集合中选择一个边缘节点执行所述第一边缘节点的任务之后,所述方法还包括:
若所述第二边缘节点被选择执行所述第一边缘节点的任务,且所述第二边缘节点上未部署分层镜像,则所述第二边缘节点根据所述应用镜像的部署信息从所述L个边缘节点,获取所述X个分层镜像组成所述应用镜像;
所述第二边缘节点运行所述应用镜像以执行所述第一边缘节点的任务。
12.一种控制节点,其特征在于,包括:
调度模块,用于将边缘节点集群包括的多个边缘节点划分为N个边缘节点集合,每个边缘节点集合包括至少两个边缘节点,N为正整数;
所述调度模块,还用于从第一边缘节点集合内选择M个第二边缘节点,所述第一边缘节点集合为所述N个边缘节点集合中的一个,M为正整数;
发送模块,用于向所述M个第二边缘节点发送控制规则,所述控制规则指示所述第二边缘节点对第一边缘节点进行故障检测,所述第一边缘节点属于所述第一边缘节点集合。
13.一种边缘节点,其特征在于,所述边缘节点为第一边缘节点集合中的第二边缘节点,所述第一边缘节点集合为N个边缘节点集合中的一个,所述N个边缘节点集合由边缘节点集群包括的多个边缘节点划分得到的,其中,每个边缘节点集合包括至少两个边缘节点,所述第二边缘节点上存储有控制规则,N为正整数;
所述第二边缘节点包括:
确定模块,用于根据所述控制规则从所述第一边缘节点集合中确定第一边缘节点,所述控制规则指示所述第二边缘节点对所述第一边缘节点进行故障检测;
检测模块,用于对所述第一边缘节点进行故障检测。
14.一种控制节点,其特征在于,包括:至少一个处理器和存储器,存储器存储有可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述控制节点执行如上述权利要求1-6中任意一项所述的方法。
15.一种边缘节点,其特征在于,包括:至少一个处理器和存储器,存储器存储有可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述边缘节点执行如上述权利要求7-11中任意一项所述的方法。
16.一种边缘计算系统,其特征在于,包括控制节点和边缘节点集群;
所述边缘节点集群包括的多个边缘节点被划分为N个边缘节点集合,其中,每个边缘节点集合包括至少两个边缘节点,所述N个边缘节点集合中的第一边缘节点集合包括第二边缘节点,所述第二边缘节点上存储有控制规则,N为正整数;
所述控制节点用于执行如权利要求1-6中任意一项所述的方法;
所述第二边缘节点用于执行如权利要求7-11中任意一项所述的方法。
17.一种存储一个或多个计算机执行指令的计算机可读存储介质,其特征在于,当所述计算机执行指令被处理器执行时,所述处理器执行如上述权利要求1-11任一所述的方法。
CN201911425840.1A 2019-12-31 2019-12-31 一种控制边缘节点的方法、节点及边缘计算系统 Active CN113132176B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911425840.1A CN113132176B (zh) 2019-12-31 2019-12-31 一种控制边缘节点的方法、节点及边缘计算系统
EP20910742.4A EP4068717A4 (en) 2019-12-31 2020-12-30 END NODE CONTROL METHOD, NODE, AND END CALCULATION SYSTEM
PCT/CN2020/141209 WO2021136335A1 (zh) 2019-12-31 2020-12-30 一种控制边缘节点的方法、节点及边缘计算系统
US17/852,724 US20220329650A1 (en) 2019-12-31 2022-06-29 Method for Controlling Edge Node, Node, and Edge Computing System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911425840.1A CN113132176B (zh) 2019-12-31 2019-12-31 一种控制边缘节点的方法、节点及边缘计算系统

Publications (2)

Publication Number Publication Date
CN113132176A true CN113132176A (zh) 2021-07-16
CN113132176B CN113132176B (zh) 2024-02-02

Family

ID=76686547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911425840.1A Active CN113132176B (zh) 2019-12-31 2019-12-31 一种控制边缘节点的方法、节点及边缘计算系统

Country Status (4)

Country Link
US (1) US20220329650A1 (zh)
EP (1) EP4068717A4 (zh)
CN (1) CN113132176B (zh)
WO (1) WO2021136335A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112910981B (zh) * 2021-01-27 2022-07-26 联想(北京)有限公司 一种控制方法及装置
CN115079935A (zh) * 2021-03-15 2022-09-20 伊姆西Ip控股有限责任公司 用于存储和查询数据的方法、电子设备和计算机程序产品
CN115695419A (zh) * 2021-07-27 2023-02-03 华为技术有限公司 通信系统、方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101390321A (zh) * 2006-01-17 2009-03-18 思科技术公司 用于检测跨路由信息边界的无回路路径的技术
CN105637805A (zh) * 2013-05-02 2016-06-01 瑞典爱立信有限公司 增强移动备用信道以解决有线线路网络中的节点故障
CN107872823A (zh) * 2016-09-28 2018-04-03 维布络有限公司 识别移动边缘计算环境中通信操作模式的方法和系统
CN108521461A (zh) * 2018-04-04 2018-09-11 平安科技(深圳)有限公司 基于边缘计算的健康监测方法、装置、设备及存储介质
CN108769214A (zh) * 2018-05-31 2018-11-06 北京百度网讯科技有限公司 用于控制边缘计算设备、用于更新数据的方法和装置
CN109491790A (zh) * 2018-11-02 2019-03-19 中山大学 基于容器的工业物联网边缘计算资源分配方法及系统
CN110399225A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 监测信息处理方法、系统和计算机系统
CN110581782A (zh) * 2019-09-17 2019-12-17 中国联合网络通信集团有限公司 一种容灾数据的处理方法、装置及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017176431A1 (en) * 2016-04-05 2017-10-12 Wellaware Holdings, Inc. A device for monitoring and controlling industrial equipment
US10454758B2 (en) * 2016-08-31 2019-10-22 Nicira, Inc. Edge node cluster network redundancy and fast convergence using an underlay anycast VTEP IP
US11836576B2 (en) * 2018-04-13 2023-12-05 International Business Machines Corporation Distributed machine learning at edge nodes
CN110430069A (zh) * 2019-07-09 2019-11-08 北京资信物联科技有限公司 低功耗物联网分层计算系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101390321A (zh) * 2006-01-17 2009-03-18 思科技术公司 用于检测跨路由信息边界的无回路路径的技术
CN105637805A (zh) * 2013-05-02 2016-06-01 瑞典爱立信有限公司 增强移动备用信道以解决有线线路网络中的节点故障
CN107872823A (zh) * 2016-09-28 2018-04-03 维布络有限公司 识别移动边缘计算环境中通信操作模式的方法和系统
CN108521461A (zh) * 2018-04-04 2018-09-11 平安科技(深圳)有限公司 基于边缘计算的健康监测方法、装置、设备及存储介质
CN108769214A (zh) * 2018-05-31 2018-11-06 北京百度网讯科技有限公司 用于控制边缘计算设备、用于更新数据的方法和装置
CN109491790A (zh) * 2018-11-02 2019-03-19 中山大学 基于容器的工业物联网边缘计算资源分配方法及系统
CN110399225A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 监测信息处理方法、系统和计算机系统
CN110581782A (zh) * 2019-09-17 2019-12-17 中国联合网络通信集团有限公司 一种容灾数据的处理方法、装置及系统

Also Published As

Publication number Publication date
CN113132176B (zh) 2024-02-02
US20220329650A1 (en) 2022-10-13
EP4068717A4 (en) 2022-11-23
WO2021136335A1 (zh) 2021-07-08
EP4068717A1 (en) 2022-10-05

Similar Documents

Publication Publication Date Title
WO2021136335A1 (zh) 一种控制边缘节点的方法、节点及边缘计算系统
CN108965485B (zh) 容器资源的管理方法、装置和云平台
EP2493118B1 (en) Information processing system
CN105979007B (zh) 加速资源处理方法、装置及网络功能虚拟化系统
EP3451727B1 (en) Access scheduling method and device for terminal, and computer storage medium
CN107251486B (zh) 一种扩展联动的方法、装置及系统
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN109802986B (zh) 设备管理方法、系统、装置及服务器
CN110933178B (zh) 调整集群系统内的节点配置的方法及服务器
CN111880936A (zh) 资源调度方法、装置、容器集群、计算机设备和存储介质
CN109189552B (zh) 虚拟网络功能扩容与缩容方法及系统
US11102284B2 (en) Service processing methods and systems based on a consortium blockchain network
CN109254876A (zh) 云计算系统中数据库的管理方法和装置
CN116225679A (zh) 算力网络调度方法、装置及存储介质
US11695856B2 (en) Scheduling solution configuration method and apparatus, computer readable storage medium thereof, and computer device
CN108459926B (zh) 数据异地备份方法、装置及计算机可读介质
CN112118314B (zh) 负载均衡方法和装置
Kang et al. Fault-tolerant resource allocation model for service function chains with joint diversity and redundancy
CN109587218B (zh) 一种集群选举的方法和装置
CN114328036A (zh) 一种硬件故障检测方法、系统及相关设备
CN110704382A (zh) 文件部署方法、装置、服务器及存储介质
CN117114091B (zh) 基于联邦学习的计算图处理方法、计算机设备和存储介质
CN110636091A (zh) 云存储集群的数据均衡方法、装置、设备和存储介质
CN117009060B (zh) 资源调度方法、装置、设备及存储介质
CN114237875A (zh) 一种集群管理方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220215

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Applicant after: Huawei Cloud Computing Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Applicant before: HUAWEI TECHNOLOGIES Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant