WO2020119649A1

WO2020119649A1 - 一种任务调度模拟系统

Info

Publication number: WO2020119649A1
Application number: PCT/CN2019/124086
Authority: WO
Inventors: 喻之斌; 李乐乐
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2018-12-14
Filing date: 2019-12-09
Publication date: 2020-06-18
Also published as: CN111324445A; US11455189B2; CN111324445B; US20210224110A1

Abstract

一种任务调度模拟系统，包括数据预处理子系统和任务调度子系统；数据预处理子系统，对输入的云计算日志信息进行数据异常过滤和提取每一个任务的运行时长；任务调度子系统，从每个节点的批处理和实时任务运行队列中入或出队任务，保持当前集群运行的任务与实际生产环境一致；根据每个任务的资源需求情况，更新每个节点的CPU核数和内存容量的已使用量和可使用量。实现批处理任务和在线任务的混布调度模拟，同时也可进行集群节点异构的CPU核数和内存容量的资源模拟。

Description

一种任务调度模拟系统

技术领域

本申请属于云计算技术领域，特别是涉及一种任务调度模拟系统。

背景技术

云计算平台上的任务调度模拟系统能够按照生产环境中任务运行的日志记录，使用远小于生产环境机器数量的若干个机器节点，真实地反映在某时刻资源管理调度系统所要处理的任务的数量，以及集群机器节点的宕机和添加等变化，为研究人员的调度算法的研究提供一个与真实生产环境高度吻合的实验环境，从而为调度算法的有效性证明提供支持。另一方面，与生产环境缺乏最坏任务调度考量的记录相比，任务调度模拟系统能够通过一些特殊的设置，模拟出任务数量提交峰值或整个集群资源利用率达到临界值的实验场景，从而能够为测试新设计的调度算法在最坏情况下的运行效率提供运行环境。

大数据处理系统Hadoop中的Yarn模拟系统(Scheduler Load Simulator，SLS)，它模拟运行的是基于Map-Reduce的批处理任务。SLS运行的输入是批处理任务的运行日志，包含每个任务的运行时间以及它所需求的CPU和内存资源。而在有的云计算公布的数据中心24小时日志记录中，有的云计算数据中心上是批处理任务和在线任务的混布调度和运行。而SLS只能针对Hadoop中Map-Reduce单一批处理任务的模拟系统。

发明内容

1.要解决的技术问题

基于大数据处理系统Hadoop中的Yarn模拟系统(Scheduler Load Simulator，SLS)，它模拟运行的是基于Map-Reduce的批处理任务。SLS运行的输入是批处理任务的运行日志，包含每个任务的运行时间以及它所需求的CPU和内存资源。而在有的云计算公布的数据中心24小时日志记录中，有的云计算数据中心上是批处理任务和在线任务的混布调度和运行。而SLS只能针对Hadoop中Map-Reduce单一批处理任务的模拟系统的问题，本申请提供了一种任务调度模拟系统。

2.技术方案

为了达到上述的目的，本申请提供了一种任务调度模拟系统，所述系统包括数据预处理子系统和任务调度子系统；

所述数据预处理子系统，用于对输入的云计算日志信息进行数据异常过滤和提取每一个任务的运行时长；

所述任务调度子系统，用于从每个节点的批处理和实时任务运行队列中入队或出队任务，保持当前集群运行的任务数量和状态与实际生产环境一致；同时根据每个任务的资源需求情况，更新每个节点的CPU核数和内存容量的已使用量和可使用量，得出最新的整个集群资源利用拓扑图。

可选地，所述数据预处理子系统包括数据异常和缺失处理模块、任务信息统计模块、资源需求统计模块和运行时长统计模块；

所述数据异常和缺失处理模块，用于读取原生的云计算集群运行日志对异常数据进行剔除；

所述任务信息统计模块，用于统计每个提交作业的任务信息以及任务实例数量；

所述资源需求统计模块，用于统计出每个作业的CPU总需求核数和内存总需求容量；

运行时长统计模块，用于计算每个任务实例运行时长；统计每个作业预计运行时长。

可选地，所述任务信息统计模块、所述资源需求统计模块和所述运行时长统计模块可同时开启3个线程并行处理。

可选地，所述任务调度子系统包括任务运行信息处理单元、控制单元和机器节点事件处理单元；

所述任务运行信息处理单元包括任务运行信息加载模块、任务事件驱动模块和任务调度算法模块；

所述控制单元包括模拟器运行控制模块和机器节点资源信息统计收集模块；

所述机器节点事件处理单元包括机器节点事件信息模块和机器节点事件驱动模块。

可选地，所述任务事件驱动模块包括批处理任务事件驱动子模块和在线任务事件驱动子模块。

可选地，所述机器节点事件信息模块包括添加节点子模块和删除节点子模块。

可选地，所述机器节点事件驱动模块包括哈希表。

3.有益效果

与现有技术相比，本申请提供的一种任务调度模拟系统的有益效果在于：

本申请提供的任务调度模拟系统，通过设置数据预处理子系统和任务调度子系统，实现批处理任务和在线任务的混布调度模拟，同时也可进行集群节点异构的CPU核数和内存容量的资源模拟。

附图说明

图1是本申请的一种任务调度模拟系统的数据预处理子系统工作流程图；

图2是本申请的一种任务调度模拟系统的任务调度子系统工作流程图。

具体实施方式

在下文中，将参考附图对本申请的具体实施例进行详细地描述，依照这些详细的描述，所属领域技术人员能够清楚地理解本申请，并能够实施本申请。在不违背本申请原理的情况下，各个不同的实施例中的特征可以进行组合以获得新的实施方式，或者替代某些实施例中的某些特征，获得其它优选的实施方式。

集群是一组相互独立的、通过高速网络互联的计算机，它们构成了一个组，并以单一系统的模式加以管理。一个客户与集群相互作用时，集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。和传统的高性能计算机技术相比，集群技术可以利用各档次的服务器作为节点，系统造价低，可以实现很高的运算速度，完成大运算量的计算，具有较高的响应能力，能够满足当今日益增长的信息服务的需求。而集群技术是一种通用的技术，其目的是为了解决单机运算能力的不足、IO能力的不足、提高服务的可靠性、获得规模可扩展能力，降低整体方案的运维成本(运行、升级、维护成本)。只要在其他技术不能达到以上的目的，或者虽然能够达到以上的目的，但是成本过高的情况下，就可以考虑采用集群技术。

在现代云计算平台的数据中心中，集群机器的数量成千上万，如2011年谷歌公布的集群节点规模可达12500台，2016年微软的数据中心的机器数量超过了5万台。同时，在这些大型的数据中心中，每天都有上万个作业和任务被调度和运行。一个有效的作业调度算法能把作业合理地分配到满足它运行资源需求的机器节点上，显著提高集群资源利用率和单位时间内任务吞吐量。然而，与企业生产环境大规模的集群节点相比，相关研究团队的机器节点规模较小，一般在几百台以下，不足以真实并准确地还原出企业生产环境的任务调度实际状况。因此，为了验证新型的调度算法在实际生产环境中的有效性，寻找一种能充分模拟生产环境中任务真实调度并且能在少数机器上即可运行的系统，尤为重要。

SLS的输入并不包含集群节点的硬件资源信息和运行期间内集群节点的动态增删日志，并且，SLS运行的输出是JVM层次上的内存使用情况和整个集群全局上的CPU核数使用情况，缺乏对单个机器节点上的资源利用统计信息进行记录。SLS对集群中节点资源的模拟只是把它们当作拥有相同CPU核数和内存大小的同质机器。

API就是操作系统留给应用程序的一个调用接口，应用程序通过调用操作系统的API而使操作系统去执行应用程序的命令。

散列表(Hash table，也叫哈希表)，是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

逗号分隔值(Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号)，其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条记录由字段组成，字段间的分隔符是其它字符或字符串，最常见的是逗号或制表符。

本申请提供一种任务调度模拟系统，所述系统包括数据预处理子系统和任务调度子系统；

数据预处理子系统的输入为原生的云计算任务运行日志，输出为原生的云计算任务日志信息加上上述的统计信息。用户可以通过系统提供的API获取上述的统计信息，返回格式为json，加上第三方图表可视化工具可以将任务的硬件需求资源展示到网页上面。

所述任务调度子系统包括任务运行信息处理单元、控制单元和机器节点事件处理单元；

所述任务事件驱动模块包括批处理任务事件驱动子模块和在线任务事件驱动子模块。

任务运行信息加载模块用于：

S101：批处理任务和在线任务的分类。

S102：按照任务记录中的时间戳为key值，任务记录为value值加入到模拟器支持顺序读写性能较高的Leveldb数据库中。

S103：机器节点的数据信息加载到模拟器在内存中的map无序集合，key为机器节点事件的时间戳，value为机器节点的数据记录。

机器节点事件驱动模块用于：

S201：采用事件驱动模型，根据当前模拟器的挂钟时间，针对相关机器节点的增加或故障事件，模拟器实现对集群全局可用机器节点进行更新。

S202：采用Google日志记录模块，可以把机器节点的更新信息输出到相关目录。

批处理任务事件驱动模块用于：

S301：采用事件驱动模型，根据当前模拟器的挂钟时间，针对批处理任务实例的运行事件状态(准备、等待、终止、失败、取消、中断)，执行事件处理。如果批处理任务实例处于等待状态，则触发S5任务算法调度模块，执行相关算法，作任务调度；如果任务实例处于失败或终止或取消状态，则更新所运行节点上的资源信息。

在线任务事件驱动模块用于：

S401：采用事件驱动模型，根据当前模拟器的挂钟时间。如果在线任务的事件状态处于生成状态，则触发触发S5任务算法调度模块，进行任务调度；如果在线任务的事件状态处于移除状态，则更新相关的机器节点资源使用情况。

任务调度算法模块用于：

S501：采用插件的软件设计模式，将不同的任务调度算法整合到模拟器的调度算法库中。用户可以通过配置文件xml指定本次模拟器运行所采用的调度算法。

机器节点资源信息统计收集模块用于：

S601：根据每个节点上运行的任务数量和任务的资源消耗情况，动态计算出某一时刻上每个节点的CPU核数和内存容量使用情况。

S602：如果用户需要实时分析每一时刻集群的资源使用率，机器节点资源信息统计收集模块收到用户指令后，可按每隔一个时间段(如5秒)把节点上的资源利用情况输出到CSV文件中。

模拟器运行控制模块用于：

S701：设置模拟器运行的挂钟的开始时间和结束时间，这两个时间点与阿里云日志中的某两个时间点相对应。

S702：可以设置模拟器运行的加速比。

可选地，所述机器节点事件驱动模块包括哈希表。

任务调度子系统首先通过模拟器运行控制模块设定模拟器所需要模拟云计算数据中心的任务调度时间段，启动模拟器运行，然后任务运行信息加载模块从数据预处理子系统的输出数据中加载需要模拟的任务信息，通过机器节点事件驱动模块实时加载新的机器节点信息，通过批处理任务事件驱动模块和在线任务事件驱动模块对任务的运行状态进行管理，通过任务调度算法模块加载指定的调度算法并实现对处于等待状态的任务进行调度，通过机器节点资源信息统计收集模块实时计算每个节点的CPU核数和内存使用情况，并输出到指定的输出目录中。

实施例

本申请是针对集群环境的任务调度模拟系统，以阿里云为对象进行详细说明：

参见图1～2，首先是数据预处理子系统。如图1所示，数据预处理子系统的输入部分为阿里云公布的24小时运行日志，输出为经预处理之后的的CSV文件，作为后续的的模拟器系统的输入数据。预处理共分为4个模块。数据异常处理模块读取原生的阿里云集群4个运行日志作异常处理。异常处理操作主要包括剔除结束时间小于开始时间的任务实例记录和在线任务记录。而针对批处理任务实例资源需求的信息缺失情况，采用统一任务实例的资源需求的平均值来填补。举例来说，若某个批处理任务实例的CPU核数申请记录缺失，则计算和该任务账号相同的所有其他任务实例的CPU申请核数的平均值，并把这个平均值替换缺失值。

任务信息统计模块是统计每个提交作业的任务信息，包括统计每个任务拥有的任务的数量，并形成一个作业ID和任务ID集合相映射的map，其key为作业的ID，value为任务的ID集合。

资源需求统计模块是首先根据单个任务下每个任务实例的所需CPU核数和内存容量记录求和，统计出这个任务的总CPU需求核数和内存需求容量。然后根据单个作业下每个任务的CPU需求核数和内存需求容量求和，统计出这个作业的CPU总需求核数和内存总需求容量。

运行时长统计模块是从日志记录中计算出每个批处理或在线任务实例的运行时长。由于任务实例的开始运行时间可能早于阿里云日志采样的起始时间，任务实例的结束时间也可能晚于24小时，因此，需要分两种情况。第一，任务实例早于零点零分开始运行，则修改任务实例的开始运行时间为0秒；第二，任务实例结束时间晚于24小时，则修改任务实例的结束时间为int整型的最大值。最后，每个任务实例的运行时长的计算为该任务实例的结束时间减去开始时间，单位为秒。

最后，任务信息、资源需求和运行时长统计模块生成的新的日志记录输出到中间数据CSV文件中。以上三个模块的可以同时开启3个线程并行处理。

2.任务调度子系统

任务调度子系统的具体工作流程如图2所示。首先由用户输入模拟器需要模拟云平台中任务运行的时间段，如0点0分到12点59分。这个时间段信息用作模拟器运行控制模块的初始化。初始化结束后，模拟时钟启动运行。第二步，模拟器运行控制模块启动机器节点事件驱动模块和任务事件驱动模块，然后根据当前模拟时钟，逐行读取数据预处理子系统输出的中间数据CSV文件。若读取的信息属于机器节点事件文件，则把该信息发送给机器节点事件驱动模块，由机器节点事件驱动模块负责解析。机器节点事件信息模块可分为添加节点子模块和删除节点子模块两种。机器节点事件驱动模块利用哈希表记录当前集群中的机器节点信息。因此，当添加和删除节点事件信息需要被处理时，机器节点事件驱动模块操作哈希表，添加或删除集群节点，以模拟当前的集群机器节点个数、资源状况与实际生产环境日志一致。另一方面，任务运行信息加载模块负责从中间数据CSV文件中加载数据到内存map数据结构中，模拟器运行控制模块从该map中把当前时钟的任务事件信息发送给任务事件驱动模块进行处理。任务事件驱动模块解析这些任务事件信息，获取每一个任务的CPU和内存需求情况，生成任务的有向无环图，提交给任务调度算法模块进行资源分配和任务调度。

在运行任务调度算法之前，模拟器运行控制模块通知机器节点资源信息统计收集模块，收集各个节点的资源利用情况，包括剩余的CPU核数以及可分配的内存容量，最后更新整个集群的资源利用拓扑图。任务算法调度模块把这个资源利用拓扑图作为输入数据，从算法调度库中加载用户指定的调度算法代码，运行任务调度程序。同时，模拟器运行控制模块记录该调度程序的运行开始时间和运行结束时间，计算出该调度程序的运行时间，作为该调度算法的运行效率，返回给用户。任务调度程序运行结束后，得到任务和节点的匹配信息。根据这些信息，任务事件驱动模块更新它所维护的节点任务排队表，即从每个节点的批处理和实时任务运行队列中入队或出队任务，从而保持当前集群运行的任务数量和状态与实际生产环境一致。另一方面，机器节点资源信息统计收集模块重新扫描每个节点中任务运行队列，根据每个任务的资源需求情况，更新每个节点的CPU核数和内存容量的已使用量和可使用量，最后，更新整个集群的资源利用拓扑图。

阿里云的数据中心中，机器节点因为更新换代的原因，呈现出CPU核数和内存容量的异构性。基于这个原因，阿里云数据中心公布的日志信息中不仅记录了机器节点的CPU核数、内存容量和磁盘容量，还记录了每个机器节点的加入或宕机时间戳。因此，某一时刻上集群的任务调度会受到每台机器节点上可用的CPU核数和内存容量约束。由于SLS没有考量实际机器节点的硬件资源，它把所有的机器节点的CPU和内存资源视为同一类型，因此，SLS不能够准确和充分地模拟阿里云任务的调度。基于阿里云公布的24小时云计算平台集群任务运行日志，本系统实现了在单个机器节点上模拟出阿里云集群节点上的任务提交、调度、运行和结束的过程。并且，在24小时内某个时刻，该系统能够根据每台机器节点上的任务运行的数量和其生命周期状态，模拟出每个机器节点上CPU和内存资源利用情况。

尽管在上文中参考特定的实施例对本申请进行了描述，但是所属领域技术人员应当理解，在本申请公开的原理和范围内，可以针对本申请公开的配置和细节做出许多修改。本申请的保护范围由所附的权利要求来确定，并且权利要求意在涵盖权利要求中技术特征的等同物文字意义或范围所包含的全部修改。

Claims

一种任务调度模拟系统，其特征在于：所述系统包括数据预处理子系统和任务调度子系统；

所述数据预处理子系统，用于对输入的云计算日志信息进行数据异常过滤和提取每一个任务的运行时长；

所述任务调度子系统，用于从每个节点的批处理和实时任务运行队列中入队或出队任务，保持当前集群运行的任务数量和状态与实际生产环境一致；同时根据每个任务的资源需求情况，更新每个节点的CPU核数和内存容量的已使用量和可使用量，得出最新的整个集群资源利用拓扑图。
如权利要求1所述的任务调度模拟系统，其特征在于：所述数据预处理子系统包括数据异常和缺失处理模块、任务信息统计模块、资源需求统计模块和运行时长统计模块；

所述数据异常和缺失处理模块，用于读取原生的云计算集群运行日志对异常数据进行剔除；

所述任务信息统计模块，用于统计每个提交作业的任务信息以及任务实例数量；

所述资源需求统计模块，用于统计出每个作业的CPU总需求核数和内存总需求容量；

运行时长统计模块，用于计算每个任务实例运行时长；统计每个作业预计运行时长。
如权利要求2所述的任务调度模拟系统，其特征在于：所述任务信息统计模块、所述资源需求统计模块和所述运行时长统计模块可同时开启3个线程并行处理。
如权利要求1所述的任务调度模拟系统，其特征在于：所述任务调度子系统包括任务运行信息处理单元、控制单元和机器节点事件处理单元；

所述任务运行信息处理单元包括任务运行信息加载模块、任务事件驱动模块和任务调度算法模块；

所述控制单元包括模拟器运行控制模块和机器节点资源信息统计收集模块；

所述机器节点事件处理单元包括机器节点事件信息模块和机器节点事件驱动模块。
如权利要求4所述的任务调度模拟系统，其特征在于：所述任务事件驱动模块包括批处理任务事件驱动子模块和在线任务事件驱动子模块。
如权利要求4所述的任务调度模拟系统，其特征在于：所述机器节点事件信息模块包括添加节点子模块和删除节点子模块。
如权利要求4所述的任务调度模拟系统，其特征在于：所述机器节点事件驱动模块包括哈希表。