CN116566805B - 一种面向体系容灾抗毁的节点跨域调度方法、装置 - Google Patents

一种面向体系容灾抗毁的节点跨域调度方法、装置 Download PDF

Info

Publication number
CN116566805B
CN116566805B CN202310833525.2A CN202310833525A CN116566805B CN 116566805 B CN116566805 B CN 116566805B CN 202310833525 A CN202310833525 A CN 202310833525A CN 116566805 B CN116566805 B CN 116566805B
Authority
CN
China
Prior art keywords
domain
node
available
task
service directory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310833525.2A
Other languages
English (en)
Other versions
CN116566805A (zh
Inventor
姚锋
张忠山
王涛
沈大勇
闫俊刚
王沛
陈英武
吕济民
何磊
陈宇宁
陈盈果
刘晓路
杜永浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202310833525.2A priority Critical patent/CN116566805B/zh
Publication of CN116566805A publication Critical patent/CN116566805A/zh
Application granted granted Critical
Publication of CN116566805B publication Critical patent/CN116566805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种面向体系容灾抗毁的节点跨域调度方法、装置,其中,该方法包括:在域A服务目录检测到域A中存在异常域A节点时,向域B服务目录发送连接域B节点的请求;获取域B服务目录向域A服务目录返回的可用域B节点,以及可用域B节点的状态信息;根据可用域B节点的状态信息,以及异常域A节点的待处理任务的资源需求信息,生成决策依据向量;根据决策依据向量,采用强化学习策略从可用域B节点中选择接替异常域A节点的目标域B节点。本申请采用强化学习策略选择替换节点,能够选择适合应用场景的调度策略,提高节点选择的准确度。

Description

一种面向体系容灾抗毁的节点跨域调度方法、装置
技术领域
本申请涉及计算机技术领域,尤其是涉及一种面向体系容灾抗毁的节点跨域调度方法、装置。
背景技术
随着计算机技术的不断进步,分布式系统和云计算已经成为现代计算机应用领域的重要组成部分,被广泛的应用于各种场景,如电子商务、社交媒体、大数据分析、人工智能等。在这些场景中,系统的可用性和性能尤为重要,因此容错、负载均衡、容灾备份、跨域传输和调度等技术成为广泛研究和应用的对象。
节点接替和调度技术是指在分布式系统中,当一个节点失效时,系统能够自动将其它节点替换为新的主节点,以保证系统的正常运行。节点跨域接替和调度技术是指系统能够跨越系统域来寻找新的接替节点。
尽管节点接替和调度技术已经得到广泛的应用,但仍然存在一些问题和挑战,节点调度通常基于固定的规则或启发式方法进行决策,决策方式难以适应复杂、动态变化的环境和需求,从而导致资源分配不均和系统性能低下的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种面向体系容灾抗毁的节点跨域调度方法、装置,采用强化学习策略选择替换节点,能够选择适合应用场景的调度策略,提高节点选择的准确度。
第一方面,本申请实施例提供了一种面向体系容灾抗毁的节点跨域调度方法,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,所述方法包括:
在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求;
获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息;
根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量;
根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
在一种可能的实施方式中,所述域A服务目录通过如下方式检测所述域A节点是否异常:
若所述域A服务目录未在预设时间范围内接收到所述域A节点发送的反馈信号,则将所述域A节点确定为异常域A节点;并将待分配给所述异常域A节点的任务,或所述异常域A节点正在处理的任务确定为所述待处理任务。
在一种可能的实施方式中,所述域A中还布置有域A网关,所述域B中还布置有域B网关;所述域A节点、所述域A服务目录,通过所述域A网关和所述域B网关,与所述域B节点、所述域B服务目录相互通信。
在一种可能的实施方式中,所述可用域B节点的状态信息包括可用CPU数量、可用GPU数量、可用内存容量、磁盘使用率、能耗、任务间数据依赖性,所述待处理任务的资源需求信息包括需要CPU数量、需要GPU数量、需要内存容量;其中,所述可用域B节点同时执行多个任务,计算每个任务的数据接收量与数据输出量的第一和值,将每个任务的第一和值的第二和值确定为所述任务间数据依赖性。
在一种可能的实施方式中,所述决策依据向量包括决策依据元素,所述根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量,包括:
对于可用CPU数量、可用GPU数量、可用内存容量中的任一可用数量,计算总量与可用数量的第一差值,将所述第一差值与所述总量的第一比值,确定为所述可用数量对应的决策依据元素;
将磁盘使用率、能耗确定为对应的决策依据元素;
计算各个所述可用域B节点的任务间数据依赖性的第三和值,将所述可用域B节点的任务间数据依赖性与所述第三和值的第二比值,确定为所述任务间数据依赖性对应的决策依据元素;
对于需要CPU数量、需要GPU数量、需要内存容量中的任一需要数量,计算所述域A中最大数量与需要数量的第二差值,将所述第二差值与所述域A中最大数量的第三比值,确定为所述需要数量对应的决策依据元素。
在一种可能的实施方式中,所述强化学习策略设置有奖励函数R:
其中,w 1 w 2 w 3 为权重参数;r为资源利用率,所述可用域B节点的资源利用率等于所述可用域B节点的各个状态信息对应的决策依据元素的第五和值;t为时间效率,计算所述待处理任务的完成时间与预期完成时间的第四比值,所述可用域B节点的时间效率等于1与所述第四比值的第三差值;为负载均衡指标,所述可用域B节点的负载均衡指标等于所述可用域B节点的负载的标准差。
在一种可能的实施方式中,所述方法还包括:
所述域A服务目录将所述待处理任务以及所述异常域A节点的历史信息发送给所述目标域B节点;
所述异常域A节点接收所述目标域B节点返回的处理结果,并将所述处理结果发送给请求执行所述待处理任务的请求方。
第二方面,本申请实施例提供了一种面向体系容灾抗毁的节点跨域调度装置,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,所述装置包括:
节点请求发送模块,用于在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求;
状态信息获取模块,用于获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息;
决策依据向量生成模块,用于根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量;
节点选择模块,用于根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行第一方面所述的面向体系容灾抗毁的节点跨域调度方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面所述的面向体系容灾抗毁的节点跨域调度方法的步骤。
本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度方法、装置,采用强化学习策略选择替换节点,能够选择适合应用场景的调度策略,提高节点选择的准确度。选择替换节点时,采用任务间数据依赖性的归一化值作为判断依据,通过优化数据依赖关系的调度,可以减少跨域节点数据传输的开销,从而提高整体系统性能。在强化学习策略的奖励函数中全方位考虑了资源利用率、时间效率和负载均衡指标,可以提高模型的鲁棒性和可解释性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度方法的流程图;
图2示出了本申请实施例提供的一种节点跨域调度的示意图;
图3示出了本申请实施例提供的一种节点跨域框架流程图;
图4示出了本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度装置的结构示意图;
图5示出了本申请实施例提供的一种电子设备的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
节点接替和调度技术是指在分布式系统中,当一个节点失效时,系统能够自动将其它节点替换为新的主节点,以保证系统的正常运行。节点跨域接替和调度技术是指系统能够跨越系统域来寻找新的接替节点。具体来说,节点跨域接替技术通过将主节点的状态信息和任务传递给其他域的备用节点来实现节点的替换,从而使备用节点成为新的主节点,继续运行系统中的任务。
尽管节点接替和调度技术已经得到广泛的应用,但仍然存在一些问题和挑战,网络延迟、节点状态同步等因素会影响节点跨域接替和调度的准确率和效率,另外,节点调度通常基于固定的规则或启发式方法进行决策,决策方式难以适应复杂、动态变化的环境和需求,从而导致资源分配不均和系统性能低下的问题。
基于上述问题,本申请实施例提供了一种面向体系容灾抗毁的节点跨域调度方法、装置,采用强化学习策略选择替换节点,能够选择适合应用场景的调度策略,提高节点选择的准确度。选择替换节点时,采用任务间数据依赖性的归一化值作为判断依据,通过优化数据依赖关系的调度,可以减少跨域节点数据传输的开销,从而提高整体系统性能。在强化学习策略的奖励函数中全方位考虑了资源利用率、时间效率和负载均衡指标,可以提高模型的鲁棒性和可解释性。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种面向体系容灾抗毁的节点跨域调度方法进行详细介绍。
参见图1所示,图1为本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度方法的流程图,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,该方法包括:
S101、在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求。
本申请实施例中,采用节点跨域接替和调度技术,实现体系容灾抗毁,提高系统运行的稳定性,“跨域”会涉及两个系统域,为了方便描述,分别用域A、域B表示两个不同的系统域。参见图2所示,图2为本申请实施例提供的一种节点跨域调度的示意图,在图2中,左侧的椭圆表示域A,右侧的椭圆表示域B。在域中布置有多个节点,在节点上运行服务(如影像、矢量、高程、三维等),每个服务独占一台服务器(也就是节点),在域中还布置有网关和服务目录,网关和服务目录占有一台服务器。为了对域A和域B进行区分,将域A中的节点、网关、服务目录称为域A节点、域A网关、域A服务目录,将域B中的节点、网关、服务目录称为域B节点、域B网关、域B服务目录。
由于安全策略的限制,域A和域B之间无法直接进行通信,域A节点、域A服务目录,通过域A网关和域B网关,与域B节点、域B服务目录相互通信。比如,域A服务目录向域B服务目录发送服务请求时,服务请求的发送过程为:域A服务目录→域A网关→域B网关→域B服务目录。
域A服务目录能够检测域A中任一域A节点是否异常,若检测到当前存在异常域A节点,域A服务目录通过域A网关、域B网关向域B服务目录发送请求,请求连接域B节点,使域B节点完成异常域A节点的待处理任务。这里,当检测到域A节点无法完成分配给域A节点的待处理任务时,将域A节点确定为异常域A节点。
S102、获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息。
服务目录是一个中央注册表,以域B服务目录为例,域B服务目录中以列表形式记录可用域B节点,以及可用域B节点的状态信息,可用域B节点是指当前具备任务处理能力的域B节点,状态信息是用来表示可用域B节点任务处理能力强弱的信息。
域B服务目录在接收到域A服务目录发送的连接域B节点的请求后,将可用域B节点以及可用域B节点的状态信息通过域B网关、域A网关发送给域A服务目录。
S103、根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量。
待处理任务的资源需求信息是用来表示处理待处理任务的节点应该具备的处理能力的信息。由于可用域B节点的状态信息,待处理任务的资源需求信息并未采用统一的衡量标准,需要对状态信息、资源需求信息进行归一化处理,得到统一衡量标准的决策依据元素,由多个决策依据元素组成一个决策依据向量。
比如,域B服务目录返回3个可用域B节点,每个可用域B节点有2种状态信息,2种状态信息对应的决策依据元素分别为a、b,资源需求信息对应的决策依据元素分别为c、d,采用下标1、2对不同的可用域B节点进行区分,决策依据向量为(a1,b1,a2,b2,c,d)。
S104、根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
采用状态信息对应的决策依据元素表示可用域B节点具备的任务处理能力,采用资源需求信息对应的决策依据元素表示处理待处理任务需要的任务处理能力,根据决策依据向量从多个可用域B节点中选择处理待处理任务的目标可用域B节点,具体的,采用强化学习策略进行选择,提高节点选择的准确度。
本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法,采用强化学习策略从多个可用域B节点中选择替换异常域A节点的目标可用域B节点,能够适应复杂应用场景,在不同应用场景下找到合适的调度策略,提高节点选择的准确度。
进一步的,本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法中,所述域A服务目录通过如下方式检测所述域A节点是否异常:
若所述域A服务目录未在预设时间范围内接收到所述域A节点发送的反馈信号,则将所述域A节点确定为异常域A节点;并将待分配给所述异常域A节点的任务,或所述异常域A节点正在处理的任务确定为所述待处理任务。
本申请实施例中,域A节点在正常运行时,每隔预设时间长度向域A服务目录发送一个反馈信号,比如,心跳信号,域A节点异常时,不再向域A服务目录发送反馈信号。如果域A服务目录每隔预设时间长度接收到域A节点发送的反馈信号,则域A服务目录将发送反馈信号的域A节点记录为可用域A节点,如果域A服务目录在接收到域A节点发送的一个反馈信号后,在预设时间范围内未接收到域A节点发送的新的反馈信号,则确定未发送反馈信号的域A节点为异常域A节点,这里,预设时间范围的时间间隔大于预设时间长度,比如,正常域A节点每隔10s发送一个反馈信号,域A服务目录20s内未接收到新的反馈信号,则确定域A节点异常。
可选的,在域A服务目录上设置一个HTTP接口“/health”,域A节点定期向该接口发送请求,以使域A服务目录检测域A节点是否可用。如果域A节点正常响应,域A服务目录发送信号令域A节点运行服务,如果域A节点无法响应,则认为该域A节点已经发生故障,需进入节点接替和调度流程。
实际中,请求方向域A服务目录发送携带有待处理任务的请求,域A服务目录在接收到请求方的请求后,将待处理任务分配给某个域A节点,如果这个域A节点恰好为异常域A节点,需要把待处理任务发送给接替异常域A节点的可用域B节点;或者,如果域A节点在处理任务的过程中发生了异常,需要将域A节点正在处理的任务作为待处理任务发送给接替异常域A节点的可用域B节点。
进一步的,本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法中,所述可用域B节点的状态信息包括可用CPU数量、可用GPU数量、可用内存容量、磁盘使用率、能耗、任务间数据依赖性,所述待处理任务的资源需求信息包括需要CPU数量、需要GPU数量、需要内存容量;其中,所述可用域B节点同时执行多个任务,计算每个任务的数据接收量与数据输出量的第一和值,将每个任务的第一和值的第二和值确定为所述任务间数据依赖性。
其中,采用公式(1)、公式(2)计算第i个可用域B节点的任务间数据依赖性DDi
DDj=datainputj+dataoutputj (1)
DDi=∑jDDj (2)
其中,每个可用域B节点同时执行j个任务,datainputj表示任务j的数据接收量,dataoutputj表示任务j的数据输出量,采用公式(1)计算每个任务的第一和值,采用公式(2)计算多个任务的第二和值。假设可用域B节点执行M个任务,∑jDDj表示M个DDj的第二和值。
进一步的,本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法中,所述决策依据向量包括决策依据元素,所述根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量,包括:
对于可用CPU数量、可用GPU数量、可用内存容量中的任一可用数量,计算总量与可用数量的第一差值,将所述第一差值与所述总量的第一比值,确定为所述可用数量对应的决策依据元素。
生成决策依据向量(决策依据元素)的过程就是对信息进行归一化处理的过程,采用公式(3)、公式(4)对第i个可用域B节点的可用CPU数量Ci、可用GPU数量Gi、可用内存容量Mi进行归一化处理:
Xtotal=∑iXi (3)
Xi1=(Xtotal-Xi)/Xtotal (4)
其中,任一可用数量X∈(C,G,M),采用公式(3)计算总量Xtotal,采用公式(4)计算可用数量Xi对应的决策依据元素Xi1,即得到Ci1、Gi1、Mi1。假设共有N个可用域B节点,∑iXi表示N个可用域B节点的可用数量的和值。
将磁盘使用率、能耗确定为对应的决策依据元素。
由于磁盘使用率、能耗已归一化处理,是百分数,所以直接将磁盘使用率、能耗作为决策依据向量中的两个决策依据元素。
计算各个所述可用域B节点的任务间数据依赖性的第三和值,将所述可用域B节点的任务间数据依赖性与所述第三和值的第二比值,确定为所述任务间数据依赖性对应的决策依据元素。
采用公式(5)对第i个可用域B节点的任务间数据依赖性DDi对应的决策依据元素DDi1
DDi1=DDi/∑iDDi (5)
采用∑iDDi计算第三和值。假设共有N个可用域B节点,∑iDDi 表示N个可用域B节点的DDi 的第三和值。
对于需要CPU数量、需要GPU数量、需要内存容量中的任一需要数量,计算所述域A中最大数量与需要数量的第二差值,将所述第二差值与所述域A中最大数量的第三比值,确定为所述需要数量对应的决策依据元素。
采用公式(6)对异常域A节点的待处理任务的需要CPU数量Creq、需要GPU数量Greq、需要内存容量Mreq进行归一化处理:
Xreq1=(Xmax-Xreq)/Xmax (4)
其中,任一需要数量X∈(C,G,M),Xmax是指域A系统中最大的CPU数量、GPU数量、内存容量,采用公式(4)计算需要数量Xreq对应的决策依据元素Xreq1,即得到Creq1、Greq1、Mreq1
本申请实施例中,可用域B节点的状态信息中包含任务间数据依赖性,相应的,选择接替异常域A节点的可用域B 节点时,采用任务间数据依赖性的归一化值作为判断依据,通过优化数据依赖关系的调度,可以减少跨域节点数据传输的开销,从而提高整体系统性能。
进一步的,本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法中,所述强化学习策略设置有奖励函数R:
其中,w 1 w 2 w 3 为权重参数;r为资源利用率,所述可用域B节点的资源利用率等于所述可用域B节点的各个状态信息对应的决策依据元素的第五和值;t为时间效率,计算所述待处理任务的完成时间与预期完成时间的第四比值,所述可用域B节点的时间效率等于1与所述第四比值的第三差值;为负载均衡指标,所述可用域B节点的负载均衡指标等于所述可用域B节点的负载的标准差。
本申请实施例中,不同的可用域B节点采用不同的奖励函数,第i个可用域B节点对应第i个奖励函数R。w 1 w 2 w 3 这三个权重参数可以根据用户实际需求进行设置,w 1 w 2 w 3 的和值等于1。第i个可用域B节点的资源利用率ri=Ci1+Gi1+Mi1+Di1+Ei1+DDi1,其中,Di1为第i个可用域B节点的磁盘使用率对应的决策依据元素,Ei1为第i个可用域B节点的能耗对应的决策依据元素。待处理任务的时间效率t=1-任务完成时间/预期完成时间,其中,任务完成时间可直接获取,预期完成时间根据历史数据确定,比如,将其他节点处理同一待处理任务所需要的时间的平均值(或中位数)作为预期完成时间。根据ui=u/utotal计算第i个可用域B节点的负载,这里,负载是一个归一化值,将实际负载u与总负载utotal的比值确定为负载,根据各个可用域B节点的负载,计算第i个可用域B节点负载的标准差。
本申请实施例中,在奖励函数中全方位考虑了资源利用率、时间效率和负载均衡指标,可以提高模型的鲁棒性和可解释性。具体的,整合多个指标有助于提高调度策略的鲁棒性,使其在面对复杂、变化的系统环境时仍能保持较好的性能。包含多个指标的奖励函数有助于提高调度策略的可解释性,帮助研究者和工程师理解算法的行为。
需要说明的是,本申请实施例的强化学习策略,使用 DQN 算法训练强化学习代理,以便在给定系统状态(可用域B节点的状态信息以及待处理任务的资源需求信息)下选择最佳的调度动作。DQN 算法通过结合深度神经网络和 Q-learning 算法,可以有效地处理具有高维状态空间和离散动作空间的问题。
DQN 需要初始化三部分。一是初始化参数,包括ε-greedy 策略的参数ε(用于控制探索和利用之间的平衡)、训练回合数N、每次训练的样本数、更新目标网络的时间步间隔。二是初始化Q-Network和Target Network的网络参数。三是初始化经验回放缓冲区。
在训练过程中,强化学习代理会根据当前状态选择动作,并观察到下一个状态和奖励。然后,代理使用这些经验(状态、动作、奖励、下一个状态)更新其神经网络。通过重复这个过程,代理将学会在不同系统状态下做出最佳的调度决策。
在训练完成后,将训练好的 DQN 模型部署到调度器中。当新任务到达时,调度器可以根据当前系统状态使用 DQN 模型选择最佳的节点来运行任务。即输入决策依据向量,调度器输出接替异常域A节点的目标可用域B节点。
进一步的,本申请实施例提供的面向体系容灾抗毁的节点跨域调度方法中,所述方法还包括:
所述域A服务目录将所述待处理任务以及所述异常域A节点的历史信息发送给所述目标域B节点;所述异常域A节点接收所述目标域B节点返回的处理结果,并将所述处理结果发送给请求执行所述待处理任务的请求方。
其中,异常域A节点的历史信息为异常域A节点处理待处理任务的成果,以使目标可用域B节点在异常域A节点处理成果的基础上将待处理任务全部处理,以减少数据处理量。如果异常域A节点还未对待处理任务进行处理,异常域A节点的历史信息可以为空。
作为一种可能的实施方式,参见图3所示,图3为本申请实施例提供的一种节点跨域框架流程图,在图3中,包括以下处理步骤:
步骤1、请求方向域A服务目录发送携带有待处理任务的请求,域A服务目录将该任务分配给域A节点。
步骤2、故障检测和恢复模块对域A节点的工作状态进行判断,如果无故障或恢复信号,则由域A节点处理待处理任务,如果域A节点出现故障,将故障信号发送给节点接替和调度框架;这里,域A节点是否发生故障的判断主体是域A服务目录。
步骤3、在出现异常域A节点时,域A服务目录向域B服务目录发送请求,请求由域B节点接替异常域A节点处理待处理任务。
步骤4、域B服务目录在接收到请求后,向域A服务目录返回可用节点列表,可用节点列表中包括多个可用域B节点,并返回可用域B节点的状态信息,以基于状态信息对可用域B节点进行筛选。
步骤5、采用强化学习机制(强化学习策略)挑选接替异常域A节点的目标可用域B节点,并向目标可用域B节点发送执行待处理任务的请求。
步骤6、目标可用域B节点运行服务,并将待处理任务的处理结果发送给域A节点,并由域A节点转发给请求方。
基于同一发明构思,本申请实施例中还提供了与面向体系容灾抗毁的节点跨域调度方法对应的面向体系容灾抗毁的节点跨域调度装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述面向体系容灾抗毁的节点跨域调度方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图4所示,图4为本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度装置的结构示意图,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,该装置包括:
节点请求发送模块401,用于在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求;
状态信息获取模块402,用于获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息;
决策依据向量生成模块403,用于根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量;
节点选择模块404,用于根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
在一种可能的实施方式中,所述装置还包括:
异常节点检测模块,用于若所述域A服务目录未在预设时间范围内接收到所述域A节点发送的反馈信号,则将所述域A节点确定为异常域A节点;并将待分配给所述异常域A节点的任务,或所述异常域A节点正在处理的任务确定为所述待处理任务。
在一种可能的实施方式中,所述域A中还布置有域A网关,所述域B中还布置有域B网关;所述域A节点、所述域A服务目录,通过所述域A网关和所述域B网关,与所述域B节点、所述域B服务目录相互通信。
在一种可能的实施方式中,所述可用域B节点的状态信息包括可用CPU数量、可用GPU数量、可用内存容量、磁盘使用率、能耗、任务间数据依赖性,所述待处理任务的资源需求信息包括需要CPU数量、需要GPU数量、需要内存容量;其中,所述可用域B节点同时执行多个任务,计算每个任务的数据接收量与数据输出量的第一和值,将每个任务的第一和值的第二和值确定为所述任务间数据依赖性。
在一种可能的实施方式中,所述决策依据向量包括决策依据元素,所述决策依据向量生成模块403,在根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量时,包括:
对于可用CPU数量、可用GPU数量、可用内存容量中的任一可用数量,计算总量与可用数量的第一差值,将所述第一差值与所述总量的第一比值,确定为所述可用数量对应的决策依据元素;
将磁盘使用率、能耗确定为对应的决策依据元素;
计算各个所述可用域B节点的任务间数据依赖性的第三和值,将所述可用域B节点的任务间数据依赖性与所述第三和值的第二比值,确定为所述任务间数据依赖性对应的决策依据元素;
对于需要CPU数量、需要GPU数量、需要内存容量中的任一需要数量,计算所述域A中最大数量与需要数量的第二差值,将所述第二差值与所述域A中最大数量的第三比值,确定为所述需要数量对应的决策依据元素。
在一种可能的实施方式中,所述装置还包括奖励函数确定模块,所述奖励函数确定模块,用于为强化学习策略设置奖励函数R:
其中,w 1 w 2 w 3 为权重参数;r为资源利用率,所述可用域B节点的资源利用率等于所述可用域B节点的各个状态信息对应的决策依据元素的第五和值;t为时间效率,计算所述待处理任务的完成时间与预期完成时间的第四比值,所述可用域B节点的时间效率等于1与所述第四比值的第三差值;为负载均衡指标,所述可用域B节点的负载均衡指标等于所述可用域B节点的负载的标准差。
在一种可能的实施方式中,所述装置还包括:
任务信息发送模块,用于所述域A服务目录将所述待处理任务以及所述异常域A节点的历史信息发送给所述目标域B节点;
处理结果接收模块,用于所述异常域A节点接收所述目标域B节点返回的处理结果;
处理结果发送模块,用于将所述处理结果发送给请求执行所述待处理任务的请求方。
本申请实施例提供的一种面向体系容灾抗毁的节点跨域调度装置,采用强化学习策略选择替换节点,能够选择适合应用场景的调度策略,提高节点选择的准确度。选择替换节点时,采用任务间数据依赖性的归一化值作为判断依据,通过优化数据依赖关系的调度,可以减少跨域节点数据传输的开销,从而提高整体系统性能。在强化学习策略的奖励函数中全方位考虑了资源利用率、时间效率和负载均衡指标,可以提高模型的鲁棒性和可解释性。
参见图5所示,图5为本申请实施例提供的一种电子设备的示意图,该电子设备500包括:处理器501、存储器502和总线503,所述存储器502存储有所述处理器501可执行的机器可读指令,当电子设备运行时,所述处理器501与所述存储器502之间通过总线503通信,所述处理器501执行所述机器可读指令,以执行如上述面向体系容灾抗毁的节点跨域调度方法的步骤。
具体地,上述存储器502和处理器501能够为通用的存储器和处理器,这里不做具体限定,当处理器501运行存储器502存储的计算机程序时,能够执行上述面向体系容灾抗毁的节点跨域调度方法。
对应于上述面向体系容灾抗毁的节点跨域调度方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述面向体系容灾抗毁的节点跨域调度方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种面向体系容灾抗毁的节点跨域调度方法,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,所述域A和所述域B均为系统域,其特征在于,所述方法包括:
在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求;
获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息;
根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量;
根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
2.根据权利要求1所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述域A服务目录通过如下方式检测所述域A节点是否异常:
若所述域A服务目录未在预设时间范围内接收到所述域A节点发送的反馈信号,则将所述域A节点确定为异常域A节点;并将待分配给所述异常域A节点的任务,或所述异常域A节点正在处理的任务确定为所述待处理任务。
3.根据权利要求1所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述域A中还布置有域A网关,所述域B中还布置有域B网关;所述域A节点、所述域A服务目录,通过所述域A网关和所述域B网关,与所述域B节点、所述域B服务目录相互通信。
4.根据权利要求1所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述可用域B节点的状态信息包括可用CPU数量、可用GPU数量、可用内存容量、磁盘使用率、能耗、任务间数据依赖性,所述待处理任务的资源需求信息包括需要CPU数量、需要GPU数量、需要内存容量;其中,所述可用域B节点同时执行多个任务,计算每个任务的数据接收量与数据输出量的第一和值,将每个任务的第一和值的第二和值确定为所述任务间数据依赖性。
5.根据权利要求4所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述决策依据向量包括决策依据元素,所述根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量,包括:
对于可用CPU数量、可用GPU数量、可用内存容量中的任一可用数量,计算总量与可用数量的第一差值,将所述第一差值与所述总量的第一比值,确定为所述可用数量对应的决策依据元素;
将磁盘使用率、能耗确定为对应的决策依据元素;
计算各个所述可用域B节点的任务间数据依赖性的第三和值,将所述可用域B节点的任务间数据依赖性与所述第三和值的第二比值,确定为所述任务间数据依赖性对应的决策依据元素;
对于需要CPU数量、需要GPU数量、需要内存容量中的任一需要数量,计算所述域A中最大数量与需要数量的第二差值,将所述第二差值与所述域A中最大数量的第三比值,确定为所述需要数量对应的决策依据元素。
6.根据权利要求5所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述强化学习策略设置有奖励函数R:
其中,w 1 w 2 w 3 为权重参数;r为资源利用率,所述可用域B节点的资源利用率等于所述可用域B节点的各个状态信息对应的决策依据元素的第五和值;t为时间效率,计算所述待处理任务的完成时间与预期完成时间的第四比值,所述可用域B节点的时间效率等于1与所述第四比值的第三差值;为负载均衡指标,所述可用域B节点的负载均衡指标等于所述可用域B节点的负载的标准差。
7.根据权利要求1所述的面向体系容灾抗毁的节点跨域调度方法,其特征在于,所述方法还包括:
所述域A服务目录将所述待处理任务以及所述异常域A节点的历史信息发送给所述目标域B节点;
所述异常域A节点接收所述目标域B节点返回的处理结果,并将所述处理结果发送给请求执行所述待处理任务的请求方。
8.一种面向体系容灾抗毁的节点跨域调度装置,域A中布置有域A节点和域A服务目录,域B中布置有域B节点和域B服务目录,所述域A和所述域B均为系统域,其特征在于,所述装置包括:
节点请求发送模块,用于在所述域A服务目录检测到所述域A中存在异常域A节点时,向所述域B服务目录发送连接所述域B节点的请求;
状态信息获取模块,用于获取所述域B服务目录向所述域A服务目录返回的可用域B节点,以及所述可用域B节点的状态信息;
决策依据向量生成模块,用于根据所述可用域B节点的状态信息,以及所述异常域A节点的待处理任务的资源需求信息,生成决策依据向量;
节点选择模块,用于根据所述决策依据向量,采用强化学习策略从所述可用域B节点中选择接替所述异常域A节点的目标域B节点。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一项所述的面向体系容灾抗毁的节点跨域调度方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一项所述的面向体系容灾抗毁的节点跨域调度方法的步骤。
CN202310833525.2A 2023-07-10 2023-07-10 一种面向体系容灾抗毁的节点跨域调度方法、装置 Active CN116566805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310833525.2A CN116566805B (zh) 2023-07-10 2023-07-10 一种面向体系容灾抗毁的节点跨域调度方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310833525.2A CN116566805B (zh) 2023-07-10 2023-07-10 一种面向体系容灾抗毁的节点跨域调度方法、装置

Publications (2)

Publication Number Publication Date
CN116566805A CN116566805A (zh) 2023-08-08
CN116566805B true CN116566805B (zh) 2023-09-26

Family

ID=87486517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310833525.2A Active CN116566805B (zh) 2023-07-10 2023-07-10 一种面向体系容灾抗毁的节点跨域调度方法、装置

Country Status (1)

Country Link
CN (1) CN116566805B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117834642B (zh) * 2024-03-04 2024-05-17 中国人民解放军国防科技大学 一种海量二维码分布式生成方法、系统及存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860559A (zh) * 2009-04-08 2010-10-13 中兴通讯股份有限公司 基于对等网络的资源信息备份操作方法及对等网络
CN104243496A (zh) * 2014-10-11 2014-12-24 北京邮电大学 一种软件定义网跨域安全代理方法和系统
US9413685B1 (en) * 2012-06-28 2016-08-09 Emc Corporation Method and apparatus for cross domain and cross-layer event correlation
WO2017032223A1 (zh) * 2015-08-24 2017-03-02 华为技术有限公司 虚拟机部署方法及装置
CN106686102A (zh) * 2017-01-03 2017-05-17 北京奇虎科技有限公司 一种服务节点的切换方法和装置
CN108123826A (zh) * 2017-09-25 2018-06-05 珠海许继芝电网自动化有限公司 一种跨区数据的交互系统及方法
CN110581782A (zh) * 2019-09-17 2019-12-17 中国联合网络通信集团有限公司 一种容灾数据的处理方法、装置及系统
WO2021057198A1 (zh) * 2019-09-27 2021-04-01 北京市天元网络技术股份有限公司 基于大数据的跨域业务全程路由贯穿方法以及装置
CN113535391A (zh) * 2021-06-28 2021-10-22 北京东方国信科技股份有限公司 跨域大数据平台的分布式集群状态信息管理方法及系统
CN113709250A (zh) * 2021-08-31 2021-11-26 中国电子科技集团公司第二十八研究所 一种基于订阅发送模式的跨域用户数据同步方法
WO2022105675A1 (zh) * 2020-11-20 2022-05-27 华为技术有限公司 一种跨域故障分析的方法及系统
CN114629782A (zh) * 2022-04-01 2022-06-14 西安超越申泰信息科技有限公司 一种多个云平台间抗毁接替方法
CN114757352A (zh) * 2022-06-14 2022-07-15 中科链安(北京)科技有限公司 智能体训练方法、跨域异构环境任务调度方法及相关装置
CN115967611A (zh) * 2021-10-13 2023-04-14 中移物联网有限公司 跨域的切换处理方法、装置、设备和存储介质
CN116034361A (zh) * 2021-08-27 2023-04-28 京东方科技集团股份有限公司 跨域授权处理方法及跨域调用处理方法
WO2023093379A1 (zh) * 2021-11-26 2023-06-01 中兴通讯股份有限公司 容灾倒换方法、系统、电子设备和存储介质
CN116204494A (zh) * 2023-04-28 2023-06-02 深圳竹云科技股份有限公司 活动目录数据迁移的方法和装置、电子设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1713233A1 (en) * 2005-04-14 2006-10-18 Alcatel Interconnection of domains in a peer to peer network
CN102521163B (zh) * 2011-12-08 2014-12-10 华为技术有限公司 目录替换方法及设备
CN103580904A (zh) * 2012-08-08 2014-02-12 中兴通讯股份有限公司 域间故障信息的发送方法及装置
US11102053B2 (en) * 2017-12-05 2021-08-24 Cisco Technology, Inc. Cross-domain assurance
CN111698152B (zh) * 2019-03-15 2021-09-14 华为技术有限公司 一种故障保护方法、节点及存储介质
US12086547B2 (en) * 2021-05-28 2024-09-10 Paypal, Inc. Cross-domain named entity recognition using knowledge graph

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860559A (zh) * 2009-04-08 2010-10-13 中兴通讯股份有限公司 基于对等网络的资源信息备份操作方法及对等网络
US9413685B1 (en) * 2012-06-28 2016-08-09 Emc Corporation Method and apparatus for cross domain and cross-layer event correlation
CN104243496A (zh) * 2014-10-11 2014-12-24 北京邮电大学 一种软件定义网跨域安全代理方法和系统
WO2017032223A1 (zh) * 2015-08-24 2017-03-02 华为技术有限公司 虚拟机部署方法及装置
CN106686102A (zh) * 2017-01-03 2017-05-17 北京奇虎科技有限公司 一种服务节点的切换方法和装置
CN108123826A (zh) * 2017-09-25 2018-06-05 珠海许继芝电网自动化有限公司 一种跨区数据的交互系统及方法
CN110581782A (zh) * 2019-09-17 2019-12-17 中国联合网络通信集团有限公司 一种容灾数据的处理方法、装置及系统
WO2021057198A1 (zh) * 2019-09-27 2021-04-01 北京市天元网络技术股份有限公司 基于大数据的跨域业务全程路由贯穿方法以及装置
WO2022105675A1 (zh) * 2020-11-20 2022-05-27 华为技术有限公司 一种跨域故障分析的方法及系统
CN113535391A (zh) * 2021-06-28 2021-10-22 北京东方国信科技股份有限公司 跨域大数据平台的分布式集群状态信息管理方法及系统
CN116034361A (zh) * 2021-08-27 2023-04-28 京东方科技集团股份有限公司 跨域授权处理方法及跨域调用处理方法
CN113709250A (zh) * 2021-08-31 2021-11-26 中国电子科技集团公司第二十八研究所 一种基于订阅发送模式的跨域用户数据同步方法
CN115967611A (zh) * 2021-10-13 2023-04-14 中移物联网有限公司 跨域的切换处理方法、装置、设备和存储介质
WO2023093379A1 (zh) * 2021-11-26 2023-06-01 中兴通讯股份有限公司 容灾倒换方法、系统、电子设备和存储介质
CN114629782A (zh) * 2022-04-01 2022-06-14 西安超越申泰信息科技有限公司 一种多个云平台间抗毁接替方法
CN114757352A (zh) * 2022-06-14 2022-07-15 中科链安(北京)科技有限公司 智能体训练方法、跨域异构环境任务调度方法及相关装置
CN116204494A (zh) * 2023-04-28 2023-06-02 深圳竹云科技股份有限公司 活动目录数据迁移的方法和装置、电子设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Using Configuration Semantic Features and Machine Learning Algorithms to Predict Build Result in Cloud-Based Container Environment;王涛等;ICPADS;248-255 *
基于退化数据与marker数据综合的产品可靠性建模分析;郑龙;杜永浩;邢立宁;彭宝华;周忠宝;文龙;;控制与决策(第02期);461-468 *
郑龙 ; 杜永浩 ; 邢立宁 ; 彭宝华 ; 周忠宝 ; 文龙 ; .基于退化数据与marker数据综合的产品可靠性建模分析.控制与决策.2020,35(第02期),461-468. *

Also Published As

Publication number Publication date
CN116566805A (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN110908667B (zh) 神经网络联合编译的方法、装置和电子设备
CN110869909B (zh) 应用机器学习算法来计算健康分数以进行工作负载调度的系统和方法
US10353764B1 (en) Automated identification of device status and resulting dynamic modification of device operations
Aswini et al. An efficient cloud‐based healthcare services paradigm for chronic kidney disease prediction application using boosted support vector machine
CN114218012A (zh) 用于在集群系统中备份和恢复数据的方法和系统
CN116566805B (zh) 一种面向体系容灾抗毁的节点跨域调度方法、装置
CN104885059A (zh) 云系统管理装置、云系统、重新配置方法、及程序
Qiu et al. Reinforcement learning for resource management in multi-tenant serverless platforms
US9612890B2 (en) Method and apparatus for workflow based high availability analysis
Golshani et al. Proactive auto-scaling for cloud environments using temporal convolutional neural networks
CN112118314A (zh) 负载均衡方法和装置
Sedlak et al. Controlling data gravity and data friction: from metrics to multidimensional elasticity strategies
Hsu et al. A proactive, cost-aware, optimized data replication strategy in geo-distributed cloud datastores
Gowri et al. An energy efficient and secure model using chaotic levy flight deep Q-learning in healthcare system
CN111935026B (zh) 一种数据传输方法、装置、处理设备及介质
Zilic et al. EFPO: Energy efficient and failure predictive edge offloading
CN112953781A (zh) 网络切片下基于粒子群的虚拟业务故障恢复方法及装置
Marin et al. Reaching for the clouds: contextually enhancing smartphones for energy efficiency
Awad et al. Utilization prediction-based VM consolidation approach
CN116880996A (zh) 虚拟计算资源的调度方法及控制面组件
CN113535346A (zh) 线程数量调整的方法、装置、设备及计算机存储介质
CN110233763A (zh) 一种基于时序差分学习的虚拟网络嵌入算法
Banicescu et al. Towards the robustness of dynamic loop scheduling on large-scale heterogeneous distributed systems
CN108933834A (zh) 一种调度方法及调度装置
CN113918345A (zh) 一种配置硬件的容量计算方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant