云计算任务跟踪处理方法、装置、云计算系统及服务器
技术领域
本申请涉及云计算技术领域,具体而言,涉及一种云计算任务跟踪处理方法、装置、云计算系统及服务器。
背景技术
在通过云计算集群执行云计算任务的过程中,需要实时跟踪云计算任务的任务状态,以便于后续针对某些异常情况的进一步处理。然而,传统方案中,通常是针对云计算任务中每个任务进程节点进行独立跟踪监测,但是实际上各个任务进程节点通常并不是作为独立业务存在的,而是相互之间存在一定的业务关联关系,因此传统跟踪监测方案中针对一些关联的云计算业务的跟踪处理效果不佳,并且通常仅仅是在确认任务进程节点已经无法及时完成相应任务的情况进行进一步处理,无法提前处理,进而导致云计算任务的完成时间可能会产生一定程度的滞后。
发明内容
有鉴于此,本申请的目的在于提供一种云计算任务跟踪处理方法、装置、云计算系统及服务器,能够提高针对一些关联的云计算业务的跟踪处理效果,并且能够提前针对任务达标置信度小于设定置信度的关联节点组合进行进一步处理,从一定程度上缩短云计算任务的完成时间,从而减少业务等待时间。
第一方面,本申请提供一种云计算任务跟踪处理方法,应用于服务器,所述服务器与多个云计算节点通信连接,所述方法包括:
确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并确定所述任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息,其中,所述任务状态监测信息至少包括任务执行进度、任务调度时间以及任务达标要求;
根据所述任务状态监测信息计算所述任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合,其中,所述关联节点组合包括至少两个存在所述目标任务进程关联关系的任务进程节点;
按照预设任务跟踪处理策略对所述目标关联节点组合进行跟踪处理,并根据跟踪处理结果对所述目标关联节点组合进行重调度处理。
在第一方面的一种可能的设计中,所述确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列的步骤,包括:
从目标云计算任务中获取多个任务进程节点,并从所述多个任务进程节点分别提取对应的任务进程特征,其中,所述任务进程特征用于表示所述任务进程节点所对应的计算资源所对应的业务特征;
根据提取的任务进程特征确定各个任务进程节点之间的任务进程关联关系,其中,当任务进程节点之间的任务进程关联关系为空时,表示不满足任何的任务进程关联关系;
根据确定的各个任务进程节点之间的任务进程关联关系确定所述目标云计算任务中满足任务进程关联关系的任务进程节点序列。
在第一方面的一种可能的设计中,所述服务器中预先配置有时间差与任务调度滞后参数之间的对应关系,所述根据所述任务状态监测信息计算所述任务进程节点序列中每个关联节点组合的任务达标置信度的步骤,包括:
计算每个关联节点组合中各个任务进程节点的任务调度时间与当前时间之间的时间差,并根据所述时间差获取与所述时间差对应的任务调度滞后参数;
根据所述任务调度滞后参数与所述任务执行进度,计算每个关联节点组合的任务达标特征信息,并根据所述任务达标特征信息确定所述关联节点组合对应的第一任务达标训练模型,所述任务达标特征信息的特征向量的倒数用于表征在所述每个关联节点组合的各个任务进程节点中满足所述任务达标要求的任务达标置信度;
获取所述每个关联节点组合所对应的计算业务的预设计算业务特征,并根据所述第一任务达标训练模型计算所述任务达标特征信息与所述预设计算业务特征之间的特征比对结果;
根据所述任务达标特征信息与所述预设计算业务特征之间的特征比对结果更新所述第一任务达标训练模型得到对应的第二任务达标训练模型;
计算所述每个关联节点组合中每个任务进程节点在所述第二任务达标训练模型的任务达标置信度,并将每个任务进程节点所对应的任务达标置信度进行求和得到每个关联节点组合的任务达标置信度。
在第一方面的一种可能的设计中,所述根据所述任务调度滞后参数与所述任务执行进度,计算每个关联节点组合的任务达标特征信息,并根据所述任务达标特征信息确定所述关联节点组合对应的第一任务达标训练模型的步骤,包括:
获取所述任务调度滞后参数所对应的理论任务执行进度;
计算所述理论任务执行进度与所述任务执行进度之间的进度差距;
根据得到的预设时间段内的进度差距序列得到每个关联节点组合的任务达标特征信息,并根据所述任务达标特征信息确定所述关联节点组合对应的第一任务达标训练模型,其中,所述任务达标特征信息的特征向量为所述预设时间段内的进度差距序列中的进度差距之和。
在第一方面的一种可能的设计中,所述获取所述每个关联节点组合所对应的计算业务的预设计算业务特征,并根据所述第一任务达标训练模型计算所述任务达标特征信息与所述预设计算业务特征之间的特征比对结果的步骤,包括:
获取所述每个关联节点组合所对应的计算业务的索引信息;
根据所述索引信息从预设的计算业务特征库中获取包含所述计算业务的预设计算业务特征,其中,所述预设的计算业务特征库中包括索引信息与预设计算业务特征之间的对应关系;
根据所述第一任务达标训练模型计算所述任务达标特征信息与所述预设计算业务特征之间的特征比对结果。
在第一方面的一种可能的设计中,所述按照预设任务跟踪处理策略对所述目标关联节点组合进行跟踪处理,并根据跟踪处理结果对所述目标关联节点组合进行重调度处理的步骤,包括:
对所述目标关联节点组合进行跟踪处理,获取所述目标关联节点组合的最快达标所需时间;
当所述最快达标所需时间大于目标关联节点组合所对应的计算业务的最大时间阈值时,对所述目标关联节点组合进行重调度处理。
在第一方面的一种可能的设计中,所述对所述目标关联节点组合进行重调度处理的步骤,包括:
为所述目标关联节点组合分配节点空闲率大于设定空闲率的候选云计算节点和所述预设任务跟踪处理策略所确定与所述目标关联节点组合所对应的业务类别的多个调度参数,对所述候选云计算节点的任务状态信息进行预处理得到下一预设时间段内的任务计算信息;
从所述任务计算信息中提取出第一待计算进程节点序列,对所述第一待计算进程节点序列按照预设规则进行筛选,得到第二待计算进程节点序列,所述预设规则根据预存的多个调度参数中的业务类别序列制定;
计算所述第二待计算进程节点序列的特征向量,确定出与所述第二待计算进程节点序列的特征向量之差最小的目标调度参数;
按照特征向量之差从小到大的顺序,将所述第二待计算进程节点序列与目标调度参数中的第一调度参数中的业务类别序列进行比对时,按照优先级从大到小的顺序从所述第二待计算进程节点序列中的第一个待计算进程节点开始,根据判定规则判定第一个待计算进程节点是否与所述业务类别序列中的第一个业务类别对应,所述判定规则为:第一个待计算进程节点与第一个业务类别的优先级偏移不大于M个优先级层级,且第一个待计算进程节点与第一个业务类别的业务重合度不大于设定重合度;
若判定第一个待计算进程节点与第一个业务类别对应,则关联参数增加设定固定值,继续比对第二个待计算进程节点和第二个业务类别,直到所述第二待计算进程节点序列中所有待计算进程节点比对完成,得到最终关联参数;
若所述最终关联参数与所述第二待计算进程节点序列中的待计算进程节点总数之比大于设定总数,则确定所述第一调度参数为相似度最高的调度参数,否则从所述第二待计算进程节点序列中的第二个待计算进程节点开始,继续上述比对过程,直到所述第二待计算进程节点序列中的前设定比例的待计算进程节点都被比对完成;
若比对第一调度参数失败,则进行下一个调度参数的比对过程,直到目标调度参数比对完毕;
根据匹配出的调度参数中的业务类别序列对候选云计算节点中相应优先级的待计算进程节点进行筛选;
根据筛选结束后剩余的待计算进程节点对所述目标关联节点组合进行重调度处理。
第二方面,本申请实施例还提供一种云计算任务跟踪处理装置,应用于服务器,所述服务器与多个云计算节点通信连接,所述装置包括:
确定模块,用于确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并确定所述任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息阵,其中,所述任务状态监测信息至少包括任务执行进度、任务调度时间以及任务达标要求;
计算模块,用于根据所述任务状态监测信息计算所述任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合,其中,所述关联节点组合包括至少两个存在所述目标任务进程关联关系的任务进程节点;
跟踪模块,用于按照预设任务跟踪处理策略对所述目标关联节点组合进行跟踪处理,并根据跟踪处理结果对所述目标关联节点组合进行重调度处理。
第三方面,本申请实施例还提供一种云计算系统,所述云计算系统包括服务器以及与所述服务器通信连接的多个云计算节点;
所述服务器用于确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并确定所述任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息阵,其中,所述任务状态监测信息至少包括任务执行进度、任务调度时间以及任务达标要求;
所述服务器用于根据所述任务状态监测信息计算所述任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合,其中,所述关联节点组合包括至少两个存在所述目标任务进程关联关系的任务进程节点;
所述服务器用按照预设任务跟踪处理策略对所述目标关联节点组合进行跟踪处理,并根据跟踪处理结果对所述目标关联节点组合进行重调度处理。
第四方面,本申请实施例还提供一种服务器,所述服务器包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个云计算节点通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行第一方面或者第一方面中任意一个可能的设计中的云计算任务跟踪处理方法。
第五方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上检测时,使得计算机执行上述第一方面或者第一方面中任意一个可能的设计中的云计算任务跟踪处理方法。
根据上述任意一个方面,本申请通过确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并根据任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息计算任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合。如此,能够提高针对一些关联的云计算业务的跟踪处理效果,并且通过对目标关联节点组合进行跟踪处理,并根据跟踪处理结果对目标关联节点组合进行重调度处理,从一定程度上缩短云计算任务的完成时间,从而减少业务等待时间。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的云计算系统的应用场景示意图;
图2为本申请实施例提供的云计算任务跟踪处理方法的流程示意图;
图3为本申请实施例提供的云计算任务跟踪处理装置的功能模块示意图;
图4为本申请实施例提供的用于实现上述的云计算任务跟踪处理方法的服务器的结构示意框图。
具体实施方式
下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。在本申请的描述中,除非另有说明,“至少一个”包括一个或多个。“多个”是指两个或两个以上。例如,A、B和C中的至少一个,包括:单独存在A、单独存在B、同时存在A和B、同时存在A和C、同时存在B和C,以及同时存在A、B和C。在本申请中,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
图1是本申请一种实施例提供的云计算系统10的交互示意图。云计算系统10可以包括服务器100以及与所述服务器100通信连接的云计算节点200,服务器100中可以包括执行指令操作的处理器。图1所示的云计算系统10仅为一种可行的示例,在其它可行的实施例中,该云计算系统10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。
在一些实施例中,服务器100可以是单个服务器,也可以是一个服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器100可以是分布式系统)。在一些实施例中,服务器100相对于云计算节点200,可以是本地的、也可以是远程的。例如,服务器100可以经由网络访问存储在云计算节点200以及数据库、或其任意组合中的信息。作为另一示例,服务器100可以直接连接到云计算节点200和数据库中的至少一个,以访问其中存储的信息和/或数据。在一些实施例中,服务器100可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。
在一些实施例中,服务器100可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit, CPU)、专用集成电路(Application Specific IntegratedCircuit, ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor, ASIP)、图形处理单元(Graphics Processing Unit, GPU)、物理处理单元(Physics Processing Unit, PPU)、数字信号处理器 (Digital Signal Processor,DSP)、现场可编程门阵列( Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device, PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing, RISC)、或微处理器等,或其任意组合。
网络可以用于信息和/或数据的交换。在一些实施例中,云计算系统10中的一个或多个组件(例如,服务器100,云计算节点200和数据库)可以向其他组件发送信息和/或数据。在一些实施例中,网络可以是任何类型的有线或者无线网络,或者是他们的结合。仅作为示例,网络130可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched Telephone Network,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication, NFC)网络等,或其任意组合。在一些实施例中,网络可以包括一个或多个网络接入点。例如,网络可以包括有线或无线网络接入点,例如基站和/或网络交换节点,云计算系统10的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。
前述的数据库可以存储数据和/或指令。在一些实施例中,数据库可以存储向云计算节点200分配的数据。在一些实施例中,数据库可以存储在本申请中描述的示例性方法的数据和/或指令。在一些实施例中,数据库可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory, ROM)等,或其任意组合。作为举例,大容量存储器可以包括磁盘、光盘、固态驱动器等;可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等;易失性读写存储器可以包括随机存取存储器(Random AccessMemory, RAM);RAM可以包括动态RAM(Dynamic Random Access Memory, DRAM),双倍数据速率同步动态RAM(Double Date-Rate Synchronous RAM, DDR SDRAM);静态RAM(StaticRandom-Access Memory, SRAM),晶闸管RAM(Thyristor-Based Random Access Memory,T-RAM)和零电容器RAM(Zero-RAM)等。作为举例,ROM可以包括掩模ROM(Mask Read-OnlyMemory, MROM)、可编程ROM( Programmable Read-Only Memory, PROM)、可擦除可编程ROM(Programmable Erasable Read-only Memory , PEROM)、电可擦除可编程ROM(Electrically Erasable Programmable read only memory, EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。在一些实施例中,数据库可以在云平台上实现。仅作为示例,云平台可以包括私有云、公有云、混合云、社区云、分布式云、跨云、多云或者其它类似的等,或其任意组合。
在一些实施例中,数据库可以连接到网络以与云计算系统10(例如,服务器100,云计算节点200等)中的一个或多个组件通信。云计算系统10中的一个或多个组件可以经由网络访问存储在数据库中的数据或指令。在一些实施例中,数据库可以直接连接到云计算系统10中的一个或多个组件(例如,服务器100,云计算节点200等;或者,在一些实施例中,数据库也可以是服务器100的一部分。
本实施例中,云计算节点200可以是用于执行云计算任务的各种计算设备,例如服务器、高性能计算机等,本实施例在此不作具体限定。
为了解决前述背景技术中的技术问题,图2为本申请实施例提供的云计算任务跟踪处理方法的流程示意图,本实施例提供的云计算任务跟踪处理方法可以由图1中所示的服务器100执行,下面对该云计算任务跟踪处理方法进行详细介绍。
步骤S110,确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并确定任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息。
步骤S120,根据任务状态监测信息计算任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合。
步骤S130,按照预设任务跟踪处理策略对目标关联节点组合进行跟踪处理,并根据跟踪处理结果对目标关联节点组合进行重调度处理。
本实施例中,针对步骤S110,任务状态监测信息至少可以包括任务执行进度、任务调度时间以及任务达标要求。其中,任务执行进度可以是指该任务进程节点当前处于何种进度,以总进度为100%为例,如果任务执行进度为50%,那么则说明该任务进程节点当前云计算过程已经完成一半。任务调度时间可以是在该任务进程节点被服务器100调度到云计算节点200进行计算时的时间。任务达标要求可以是指该任务进程节点在何种要求(例如渲染资源计算完毕,或者渲染资源计算其中的两个目录等)下完成任务。
本实施例中,关联节点组合可以包括至少两个存在目标任务进程关联关系的任务进程节点,其中,存在目标任务进程关联关系可以是指这些任务进程节点并不是作为独立任务存在的,而是协调完成某个任务某个系列的任务。
基于上述设计,本实施例通过确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并根据任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息计算任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合。如此,能够提高针对一些关联的云计算业务的跟踪处理效果,并且通过对目标关联节点组合进行跟踪处理,并根据跟踪处理结果对目标关联节点组合进行重调度处理,从一定程度上缩短云计算任务的完成时间,从而减少业务等待时间。
在一种可能的设计中,针对步骤S110,给下来本实施例给出一种可能的示例以有效确定各个任务进程节点之间的任务进程关联关系。详细地,本实施例首先可以从目标云计算任务中获取多个任务进程节点,并从多个任务进程节点分别提取对应的任务进程特征。
其中,任务进程特征可以用于表示任务进程节点所对应的待计算资源所对应的业务特征。例如,待计算资源可以是3D建模基础数据,那么3D建模基础数据所对应的业务特征可以是动画渲染业务的业务特征,在此不作具体限定。
接下来,可以根据提取的任务进程特征确定各个任务进程节点之间的任务进程关联关系,其中,当任务进程节点之间的任务进程关联关系为空时,表示不满足任何的任务进程关联关系。由此,可以根据确定的各个任务进程节点之间的任务进程关联关系确定目标云计算任务中满足任务进程关联关系的任务进程节点序列。
其中,在一种可能的示例中,在提取任务进程特征的过程中,为了减少冗余特征,提高后续任务进程关联关系的准确性和可靠性,本实施例可以对多个任务进程节点所对应的各任务进程业务信息进行业务分类处理,得到各任务进程业务信息的业务分类表项,接着确定业务分类处理得到的业务分类表项的业务等级,并将各业务分类表项按相应业务等级进行降序排名,之后从业务分类处理得到的各业务分类表项中,选取设定排序内的业务分类表项。
例如,业务分类表项可以预先按照各任务进程业务信息所述的分类类型进行确定,针对一个分类类型可能会对应多个业务分类表项。
在此基础上,可以根据预设的针对业务分类表项的任务进程特征提取策略,确定由任务进程特征提取策略所指定的任务进程特征的业务分类表项。当同一任务进程业务信息包括属于不同任务进程特征的多个业务分类表项时,则统计同一任务进程业务信息中各任务进程特征的业务分类表项的数量。由此,可以确定统计的业务分类表项的数量最大的任务进程特征,并为同一任务进程业务信息添加确定的任务进程特征的特征属性,以及为不包括任务进程特征的业务分类表项的任务进程业务信息添加非任务进程特征的特征属性。
本实施例中,任务进程特征提取策略可以指定任务进程特征的业务分类表项,具体可以根据业务等级和业务重要性预先确定,在此不作具体限定。此外,特征属性可以是指该任务进程特征所对应的云计算类型,例如大数据处理、云渲染等。
而后,根据待特征提取的任务进程业务信息和所添加的特征属性进行融合,得到第一网络模型,并将各业务分类表项输入第一网络模型中,输出各业务分类表项对于各任务进程特征的置信度。
接着,可以将对于各任务进程特征的置信度大于或等于第一置信度阈值的业务分类表项重新确定为该任务进程特征的业务分类表项,并返回为同一任务进程业务信息添加确定的任务进程特征的特征属性并继续处理,直至满足迭代停止条件时得到待特征提取的任务进程业务信息的特征属性。
值得说明的是,在满足迭代停止条件后,获取通过相应的网络模型所确定的待特征提取的任务进程业务信息对于各任务进程特征的置信度,并筛选对于各任务进程特征的置信度大于或等于第二置信度阈值。
在上述基础上,可以按照筛选的任务进程业务信息和相应的特征属性进行融合,得到第二网络模型,然后通过第二网络模型确定待特征提取的任务进程业务信息对于各任务进程特征的置信度,并按照待特征提取的任务进程业务信息对于各任务进程特征的置信度更新相应任务进程业务信息的特征属性。
在按照待特征提取的任务进程业务信息对于各任务进程特征的置信度更新相应任务进程业务信息的特征属性后,返回筛选对于各任务进程特征的置信度大于或等于第二置信度阈值的任务进程业务信息的步骤继续执行,直至满足更新停止条件时,得到待特征提取的任务进程业务信息更新后的特征属性。
接下来,可以获取更新特征属性后通过第二网络模型确定的各待特征提取的任务进程业务信息对于各任务进程特征的置信度和属于非任务进程特征的置信度,并挑选在更新特征属性后确定的对于各任务进程特征的置信度大于或等于第三置信度阈值的任务进程业务信息,并按挑选的任务进程业务信息和相应特征属性进行融合,得到第三网络模型。接着,通过第三网络模型确定各待特征提取的任务进程业务信息对于各任务进程特征的置信度,并按通过第三网络模型确定的对于各任务进程特征的置信度确定相应任务进程业务信息的任务进程特征后,获取不同于待特征提取的任务进程业务信息的目标任务进程业务信息,并通过第三网络模型确定目标任务进程业务信息对于各任务进程特征的置信度,而后根据目标任务进程业务信息对于各任务进程特征的置信度确定目标任务进程业务信息所对应的任务进程特征。
由此,可以根据各个确定的任务进程业务信息的任务进程特征进行汇总得到各个任务进程节点分别提取对应的任务进程特征。
如此,基于上述设计,本实施例通过上述一系列的数据筛选和网络模型的分类处理,能够有效减少冗余特征,提高后续任务进程关联关系的准确性和可靠性。
在一种可能的设计中,针对步骤S120,在确定各个任务进程节点之间的任务进程关联关系的过程中,为了避免一部分冗余或者存在过多层级的任务进程关联关系被确定的情况,导致后续调度分配不合理,本实施例可以根据提取的任务进程特征确定每至少两个任务进程节点所对应的任务特征向量的第一向量集合。本实施例中,任务特征向量可以包括多种任务特征向量元素,例如决策关联元素(在决策条件满足的情况下关联另一个任务进程节点)、判断关联元素(在判断结果满足的情况下关联另一个任务进程节点)等,在此不作具体限定。
接下来,可以选取第一初始任务关联网络序列。其中,第一初始任务关联网络序列对应的任务关联网络组包括预设的第一预测节点以及待组合的融合节点和深度提取节点。在此需要说明的是,该预设的第一预测节点以及待组合的融合节点和深度提取节点可以根据实际需求选择现有通用的特征网络结构,本实施例在此不作具体限定。
在此基础上,对于每一种任务特征向量元素对应的第一向量集合,将第一初始任务关联网络模型的第一预测节点和每个阶数的融合节点进行组合,得到多个组合节点序列。然后,按照多个组合节点序列分别映射第一向量集合,得到多种不同组合节点序列的序列对。
在此值得进一步说明的是,上述的组合节点序列中融合节点的输入参数为该第一向量集合对应的任务进程节点的任务进程特征,第一预测节点的输出参数为该第一向量集合对应的任务进程节点的任务进程关联参数。
而后,可以根据前述确定的序列对以及第一初始任务关联网络序列的多个不同阶数的深度提取节点,对第一初始任务关联网络序列进行更新,确定预测损失函数值最小对应的任务关联网络组的第一节点组合,得到包括第一节点组合的第一任务关联网络模型。
在此值得进一步说明的是,第一初始任务关联网络序列对应的任务关联网络组包括预设的第一预测节点以及待组合的融合节点和深度提取节点。
由此,在确定更新得到的第一任务关联网络模型的模型参数符合预设条件后,将第一任务关联网络模型基于第一向量集合中的任务进程关联参数输出的任务进程节点的预测参数与任务进程节点的任务进程关联参数进行比较,根据多个预测参数与任务进程关联参数之间的置信度大于预设的第二阈值所确定的置信范围,确定第一任务关联网络模型的第一置信程度。
同时,可以根据损失任务进程关联参数和第一任务关联网络模型的预测参数的参数比较结果,对预设的第二初始任务关联网络序列进行更新,确定预测损失函数值最小对应的任务关联网络组的第二节点组合,得到包括第二节点组合的第二任务关联网络模型,并基于更新得到的多个第二任务关联网络序列,确定第一向量集合的第二置信程度。
在此值得进一步说明的是,第二初始任务关联网络模型中的任务关联网络组包括预设的融合节点、第二预测节点以及待组合的深度提取节点,第二预测节点和第一预测节点的阶数相同但输出参数不同,第一预测节点的输出参数为任务进程关联参数,第二预测节点的输出参数为第一任务关联网络模型的预测参数与任务进程关联参数的参数比较结果。
由此,可以根据第一置信程度和第二置信程度,确定第一任务关联网络模型的预测参数对应的预测向量,并基于任务特征向量的向量集合中多种任务特征向量元素之间的制约关系,生成基于多种任务特征向量元素的关系特征图谱,并计算关系特征图谱中每一级关联关系的关联值。而后,根据关系特征图谱中每一级关联关系的关联值确定该至少两个任务进程节点之间的任务进程关联关系。
其中,第一置信程度和第二置信程度可以通过各自对应的权重参数确定第一任务关联网络模型的预测参数对应的预测向量。例如,第一置信度为A,第二置信程度为B,各自对应的权重参数为a1和b1,那么可以根据A*a1+B*b1的结果与第一任务关联网络模型的预测参数进行计算得到对应的预测向量。
其中,可以理解的是,当关联值大于设定关联值时,确定该至少两个任务进程节点之间存在该级关联关系,否则确定该至少两个任务进程节点之间不存在该级关联关系。如此,能够有效避免一部分冗余或者存在过多层级的任务进程关联关系被确定的情况,提高后续调度分配时的合理性。
示例性地,上述的第一初始任务关联网络序列的多个不同阶数的融合节点可以通过以下方式确定:
对于第一向量集合对应的任务进程关联参数,对任务进程关联参数以及对应的任务进程特征进行分析,得到与任务进程关联参数的相关度大于预设的第一阈值的目标任务进程特征,并根据目标任务进程特征的数量,确定第一初始任务关联网络序列的融合节点阶数。
在一种可能的设计中,针对步骤S120,本实施例可以计算每个关联节点组合中各个任务进程节点的任务调度时间与当前时间之间的时间差,并根据时间差获取与时间差对应的任务调度滞后参数。
例如,所述服务器100中可以预先配置有时间差与任务调度滞后参数之间的对应关系,由此根据对应关系来确定与时间差对应的任务调度滞后参数。
接下来,可以进一步根据任务调度滞后参数与任务执行进度,计算每个关联节点组合的任务达标特征信息,并根据任务达标特征信息确定关联节点组合对应的第一任务达标训练模型。其中,任务达标特征信息的特征向量的倒数用于表征在每个关联节点组合的各个任务进程节点中满足任务达标要求的任务达标置信度。即,任务达标特征信息的特征向量的值越大,对应的任务达标置信度越小,任务达标特征信息的特征向量的值越小,对应的任务达标置信度越大。
例如,可以获取任务调度滞后参数所对应的理论任务执行进度,并计算理论任务执行进度与任务执行进度之间的进度差距,从而根据得到的预设时间段内的进度差距序列得到每个关联节点组合的任务达标特征信息,并根据任务达标特征信息确定关联节点组合对应的第一任务达标训练模型。其中,任务达标特征信息的特征向量为预设时间段内的进度差距序列中的进度差距之和。
比如,假设任务达标特征信息所对应的预设时间段内的进度差距序列包括进度差距序列A、进度差距序列B以及进度差距序列C,那么可以将进度差距序列A、进度差距序列B以及进度差距序列C分别对应的值进行求和,即可得到任务达标特征信息的特征向的值。
在此基础上,本实施例为了提高任务达标判定的准确性,进一步考虑到每个关联节点组合所对应的计算业务,由此获取每个关联节点组合所对应的计算业务的预设计算业务特征,并根据第一任务达标训练模型计算任务达标特征信息与预设计算业务特征之间的特征比对结果。
例如,可以获取每个关联节点组合所对应的计算业务的索引信息,并根据索引信息从预设的计算业务特征库中获取包含计算业务的预设计算业务特征,其中,预设的计算业务特征库中包括索引信息与预设计算业务特征之间的对应关系。由此,可以根据第一任务达标训练模型计算任务达标特征信息与预设计算业务特征之间的特征比对结果。
而后,可以根据任务达标特征信息与预设计算业务特征之间的特征比对结果更新第一任务达标训练模型得到对应的第二任务达标训练模型,接着计算每个关联节点组合中每个任务进程节点在第二任务达标训练模型的任务达标置信度,并将每个任务进程节点所对应的任务达标置信度进行求和得到每个关联节点组合的任务达标置信度。
在一种可能的设计中,针对步骤S130,对于任务达标置信度小于设定置信度的目标关联节点组合,可以进一步对目标关联节点组合进行跟踪处理,获取目标关联节点组合的最快达标所需时间,当最快达标所需时间大于目标关联节点组合所对应的计算业务的最大时间阈值时,对目标关联节点组合进行重调度处理。
例如,可以为目标关联节点组合分配节点空闲率大于设定空闲率的候选云计算节点和预设任务跟踪处理策略所确定与目标关联节点组合所对应的业务类别的多个调度参数,对候选云计算节点的任务状态信息进行预处理得到下一预设时间段内的任务计算信息。
接着,可以从任务计算信息中提取出第一待计算进程节点序列,对第一待计算进程节点序列按照预设规则进行筛选,得到第二待计算进程节点序列,预设规则根据预存的多个调度参数中的业务类别序列制定。
而后,计算第二待计算进程节点序列的特征向量,确定出与第二待计算进程节点序列的特征向量之差最小的目标调度参数,并按照特征向量之差从小到大的顺序,将第二待计算进程节点序列与目标调度参数中的第一调度参数中的业务类别序列进行比对时,按照优先级从大到小的顺序从第二待计算进程节点序列中的第一个待计算进程节点开始,根据判定规则判定第一个待计算进程节点是否与业务类别序列中的第一个业务类别对应,判定规则为:第一个待计算进程节点与第一个业务类别的优先级偏移不大于M个优先级层级,且第一个待计算进程节点与第一个业务类别的业务重合度不大于设定重合度。
若判定第一个待计算进程节点与第一个业务类别对应,则关联参数增加设定固定值,继续比对第二个待计算进程节点和第二个业务类别,直到第二待计算进程节点序列中所有待计算进程节点比对完成,得到最终关联参数。
若最终关联参数与第二待计算进程节点序列中的待计算进程节点总数之比大于设定总数,则确定第一调度参数为相似度最高的调度参数,否则从第二待计算进程节点序列中的第二个待计算进程节点开始,继续上述比对过程,直到第二待计算进程节点序列中的前设定比例的待计算进程节点都被比对完成。
或者,若比对第一调度参数失败,则进行下一个调度参数的比对过程,直到目标调度参数比对完毕。
由此,可以根据匹配出的调度参数中的业务类别序列对候选云计算节点中相应优先级的待计算进程节点进行筛选,并根据筛选结束后剩余的待计算进程节点对目标关联节点组合进行重调度处理。
如此,基于上述设计,在重调度的过程中进一步考虑到候选云计算节点在下一预设时间段内的任务计算信息,而后基于业务类别进行筛选,减少在重调度过程中对原有的部分业务计算产生的影响,且能够以目标关联节点组合为单位进行整体的调度处理,减少业务等待时间。
图3为本申请实施例提供的云计算任务跟踪处理装置300的功能模块示意图,本实施例可以根据上述方法实施例对该云计算任务跟踪处理装置300进行功能模块的划分。例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。比如,在采用对应各个功能划分各个功能模块的情况下,图3示出的云计算任务跟踪处理装置300只是一种装置示意图。其中,云计算任务跟踪处理装置300可以包括确定模块310、计算模块320以及跟踪模块330,下面分别对该云计算任务跟踪处理装置300的各个功能模块的功能进行详细阐述。
确定模块310,用于确定目标云计算任务中多个任务进程节点的满足任务进程关联关系的任务进程节点序列,并确定任务进程节点序列中多个存在目标任务进程关联关系的任务进程节点分别对应的任务状态监测信息阵,其中,任务状态监测信息至少包括任务执行进度、任务调度时间以及任务达标要求。
计算模块320,用于根据任务状态监测信息计算任务进程节点序列中每个关联节点组合的任务达标置信度,并将任务达标置信度小于设定置信度的关联节点组合确定目标关联节点组合,其中,关联节点组合包括至少两个存在目标任务进程关联关系的任务进程节点。
跟踪模块330,用于按照预设任务跟踪处理策略对目标关联节点组合进行跟踪处理,并根据跟踪处理结果对目标关联节点组合进行重调度处理。
进一步地,图4为本申请实施例提供的用于执行上述云计算任务跟踪处理方法的服务器100的结构示意图。如图4所示,该服务器100可包括网络接口110、机器可读存储介质120、处理器130以及总线140。处理器130可以是一个或多个,图4中以一个处理器130为例。网络接口110、机器可读存储介质120以及处理器130可以通过总线140或其他方式连接,图4中以通过总线140连接为例。
机器可读存储介质120作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的云计算任务跟踪处理方法对应的程序指令/模块(例如图3中所示的确定模块310、计算模块320以及跟踪模块330)。处理器130通过检测存储在机器可读存储介质120中的软件程序、指令以及模块,从而执行终端设备的各种功能应用以及数据处理,即实现上述的云计算任务跟踪处理方法,在此不再赘述。
机器可读存储介质120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的诊断项目;存储数据区可存储根据终端的使用所创建的数据等。此外,机器可读存储介质120可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合发布节点的存储器。在一些实例中,机器可读存储介质120可进一步包括相对于处理器130远程设置的存储器,这些远程存储器可以通过网络连接至服务器100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器130可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器130中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器130可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。
服务器100可以通过网络接口110和其它设备(例如云计算节点200)进行信息交互。网络接口110可以是电路、总线、收发器或者其它任意可以用于进行信息交互的装置。处理器130可以利用网络接口110收发信息。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本申请实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请实施例的这些表达和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。