WO2019062077A1

WO2019062077A1 - 计算任务的资源监测方法、装置、设备及可读存储介质

Info

Publication number: WO2019062077A1
Application number: PCT/CN2018/083016
Authority: WO
Inventors: 蒋英明; 万书武; 贺波
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-09-28
Filing date: 2018-04-13
Publication date: 2019-04-04
Also published as: CN108255665A; WO2019062077A9; CN108255665B

Abstract

本申请实施例提供一种计算任务的资源监测方法、装置、设备及计算机可读存储介质。所述计算任务的资源监测方法包括：利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；根据所述页面的数据解析出所述运行任务执行单元的数量；根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；统计预设时间段内的资源使用数量；通过视图展示统计的资源使用数量。

Description

计算任务的资源监测方法、装置、设备及可读存储介质

本申请要求于2017年9月28日提交中国专利局、申请号为201710900536.2、发明名称为“计算任务的资源监测方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息处理技术领域，尤其涉及一种计算任务的资源监测方法、装置、设备及计算机可读存储介质。

背景技术

分布式计算系统(Spark)是专为大规模数据处理而设计的快速通用的计算引擎。在大数据处理中，Spark执行一个计算任务时，会对该计算任务涉及的常驻服务(持续运行的服务)，如spark thriftserver(提供数据库连接的服务)，spark streaming(处理数据量的服务)等，对应分配所使用的资源，如所需要使用的CPU核的数量。然而针对计算任务中常驻服务的资源使用状态难以统计，导致计算任务中常驻服务存在以下问题：1、计算任务中常驻服务的资源使用率难以获取，资源使用率存在“黑盒”现象；2、由于计算任务中常驻服务的资源分配难以预估，所以在开始分配常驻服务使用的资源时，尽量多的分配以保证应用可以正常的运行，然而这样会导致资源分配过多，存在资源浪费的现象。

发明内容

本申请实施例提供了一种计算任务的资源监测方法、装置、设备及计算机可读存储介质，可视化的展示了计算任务中常驻服务的资源使用状态，可以实现计算任务中常驻服务的资源监测，同时可以合理的分配常驻服务使用的资源。

第一方面，本申请实施例提供了一种计算任务的资源监测方法，该方法包括：

利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；

根据所述页面的数据解析出所述运行任务执行单元的数量；

根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；

统计预设时间段内的资源使用数量；

通过视图展示统计的资源使用数量。

第二方面，本申请实施例提供了一种计算任务的资源监测装置，该装置包括：页面获取单元，用于利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；解析单元，用于根据所述页面的数据解析出所述运行任务执行单元的数量；计算单元，用于根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；统计单元，用于统计预设时间段内的资源使用数量；以及展示单元，用于通过视图展示统计的资源使用数量。

第三方面，本申请实施例还提供了一种设备，所述设备包括存储器，以及与所述存储器相连的处理器；

所述存储器用于存储实现计算任务的资源监测的程序数据，所述处理器用于运行所述存储器中存储的程序数据，以执行上述第一方面所述的计算任务的资源监测方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者一个以上程序数据，所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行，以实现上述第一方面所述的计算任务的资源监测方法。

本申请实施例可视化的展示了计算任务中常驻服务的资源使用状态，可以实现计算任务中常驻服务的资源监测，同时可以合理的分配常驻服务使用的资源。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种分布式计算系统的结构组成示意图；

图2是本申请实施例提供的一种计算任务的资源监测方法的流程示意图；

图3是本申请实施例提供的图2方法中的一子流程示意图；

图4是本申请实施例提供的图2方法中的另一子流程示意图；

图5是本申请实施例提供的图2方法中的另一子流程示意图；

图6是本申请另一实施例提供的一种计算任务的资源监测方法的流程示意图；

图7是本申请施例提供的一种计算任务的资源监测装置的示意性框图；

图8是本申请实施例提供的页面获取单元的示意性框图；

图9是本申请实施例提供的解析单元的示意性框图；

图10是本申请实施例提供的统计单元的示意性框图；

图11是本申请另一实施例提供的一种计算任务的资源监测装置的示意性框图；

图12是本申请实施例提供的一种计算任务的资源监测设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

图1是分布式计算系统(Apache Spark，简称Spark)的架构组成示意图。现通过图1简单介绍分布式计算系统中的计算任务的运行原理。当在分布式计算系统中提交一个计算任务后，这个计算任务会启动一个对应的主控进程(Driver Program)。主控进程本身会根据设置的参数，占有一定数量的内存和CPU核。而主控进程要做的一件事情，就是向集群资源管理器(Cluster Manager，具体可以是Spark Standalone集群，Spark Standalone集群的部署方式是集群方式中最为精简的一种，也可以是其他的资源管理集群，如YARN资源管理集群)申请运行该计算任务需要使用的执行进程(Executor)。集群资源管理器会根据为该计算任务申请设置的资源参数，其中，资源参数包括常驻服务的资源使用数量，在各个工作节点(Worker Node，可理解为物理节点)上，启动一定数量的执行进程(Executor)，每个执行进程都占有一定数量的内存和CPU核。

该计算任务申请到了执行所需的资源之后，主控进程就会开始调度和执行计算任务的代码了。主控进程会将编写的计算任务代码分拆为多个阶段(stage)，每个阶段执行一部分代码片段，并为每个阶段创建一批任务执行单元(task)，然后将这些任务执行单元分配到各个执行进程中执行。任务执行单元(task)是最小的计算单元。任务执行单元的执行速度是跟每个执行进程的CPU核的数量有直接关系。一个CPU核同一时间只能执行一个线程。而每个执行进程上分配到的多个任务执行单元，都是以一个任务执行单元一条线程的方式，多线程并发运行的。可以理解为，一个任务执行单元执行时，需要一个CPU核。如果CPU核数量比较充足，而且分配到的任务执行单元的数量比较合理，那么通常来说，可以比较快速和高效地执行完这些任务执行单元线程。

然而实际情况是，对于计算任务中的资源使用状态，如常驻服务的资源使用状态难以统计，因此很难统计一个计算任务中的常驻服务的资源使用率。由于一个计算任务中的常驻服务的资源使用率难以统计，所以在开始分配常驻服务使用的资源时，只有尽可能多的分配以保证应用可以正常的运行，这样就可能会导致资源分配过多，存在资源浪费的现象。

需要注意的是，无特别说明，本申请中涉及到的分布式计算系统指的是Spark，主控进程指的是Driver Program，集群资源管理器指的是Cluster Manager，工作节点指的是Worker Node，执行进程指的是Executor，阶段指的是stage，任务执行单元指的是task，运行任务执行单元，指的是运行中的任务执行单元，即running task。常驻服务指的是打开后一直持续运行的服务，一直有占用资源。在分布式计算系统中，如包括spark thriftserver(提供数据库连接的服务)，spark streaming(处理数据量的服务)等。

图2为本申请实施例提供的一种计算任务的资源监测方法的流程示意图。该方法的前提是：分布式计算系统启动时，也会启动分布式计算系统所对应的web UI服务，而任务调度的运行任务执行单元在web UI服务提供的页面(网页用户界面)上显示。该方法运行在安装有分布式计算系统的服务器中。如图1所示，该方法包括以下步骤S201-S205。

S201，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。其中，网页爬虫技术是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本的技术。网页爬虫技术被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面内容，以获取或更新这些网站的内容和检索方式。在网页爬虫的系统框架中，主过程由控制器，解析器，资源库三部分组成。控制器的主要工作是负责给多线程中的各个爬虫线程分配工作任务。解析器的主要工作是下载网页，进行页面的处理，主要是将一些JS脚本标签、CSS代码内容、空格字符、HTML标签等内容处理掉，抽取特殊HTML标签的内容，分析HTML中的数据，爬虫的基本工作是由解析器完成。资源库是用来存放下载到的网页资源，一般都采用大型的数据库存储，如Oracle数据库，并对其建立索引。在本申请申请中，主要使用的是网页爬虫技术中的解析器的功能。

具体地，如图3所示，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据，即步骤S201包括子步骤S301-S302。S301，获取计算任务中网页用户界面的统一资源定位符参数。其中，网页用户界面指的是通过分布式计算系统的web UI服务打开的页面；统一资源定位符指的是URL，如http：//www.xxxx.com：80/yyyy；统一资源定位符参数指的是URL参数。其中，URL参数包括静态字符参数和动态字符参数。静态字符参数可以是IP加端口的形式，如http：//IP：端口；或者是域名加端口的形式，如http：//www.xxx.com：端口。其中，端口可以是默认的端口80(一般默认端口不显示)，也可以是自定义的其他的可用端口如8080、8088等。如http：//hdp.app.paic.com.cn：8088。动态字符参数包括计算任务的名称等，如jdbc_hduser0102_400。S302，根据统一资源定位符参数，利用网页爬虫技术，获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。在使用网页爬虫技术时，通常借助网页爬虫工具来实现，如网页爬虫工具python urllib，在python urllib工具中提供了很多网页爬虫中需要使用的方法。使用python urllib工具可以使我们像读取本地文件一样读取万维网www和ftp上的数据，它可以将URL定位到的html文件下载到本地的硬盘中或者存储为临时文件。利用python urllib工具，根据获取的统一资源定位符参数，输入计算任务中常驻服务的运行任务执行单元所在的页面的名称，其中，计算任务中常驻服务的运行任务执行单元所在的页面的名称为stages(也可以为其他的名称)，如http：//www.xxx.com：8088/yyy/xyxy/stages/页面，来获取该页面的数据。利用python urllib工具获取计算任务中常驻服务的运行任务执行单元所在的stages页面的数据，具体可包括：导入urllib库；调用urllib库中的方法来获取stages页面的数据，如http：//www.xxx.com：8088/yyy/xyxy/stages/页面；将获取的stages页面的数据保存。若想进一步查看获取的该stages页面的数据，可以将获取到的该stages页面的数据输出。

S202，根据该页面的数据解析出常驻服务的运行任务执行单元的数量。

具体地，如图4所示，根据该页面的数据解析出常驻服务的运行任务执行单元的数量，即步骤S202包括子步骤S401-S402。S401，从获取常驻服务的运行任务执行单元所在的页面的数据中，获取常驻服务的所有运行任务执行单元的标签。即获取页面中running task所在的标签。其中，标签包括标签名称和标签名称所对应的值。S402，统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。如统计id＝“running task”的标签中相对应的值，0+30＝30。将计算得出的30作为运行任务执行单元的数量。如此，就获取了计算任务中常驻服务的运行任务执行单元的数量。

S203，根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存常驻服务的资源使用数量。优选地，资源指的是CPU核，如果一台设备对应的CPU核为一个，常驻服务使用的CPU核可以理解为占用的设备的数量。常驻服务的运行任务执行单元的数量与资源使用数量之间是线性的关系，该线性的关系已经提前预知。如一个运行任务执行单元对应一个CPU核，可以理解为，一个运行任务执行单元对应一个线程，一个线程在一个CPU核上运行。在其他实施例中，一台设备对应的CPU核多有个，如有两个，那么一个运行任务执行单元对应两个CPU核。一个计算任务中，通常有多个运行任务执行单元在同时执行。

通过步骤S201-S203可以获取长时间内的常驻应用的资源使用数量。

S204，统计预设时间段内的资源使用数量。

具体地，如图5所示，统计预设时间段内的资源使用数量，即S204包括子步骤S501-S502。S501，接收查询指令，该查询指令中包括有对应的预设时间段。其中，预设时间段可以是一个小时、一天、一个星期、一个月、三个月、半年等等。该预设时间段包括任意一个起点和任意一个截止时间点之间的时间段，如可以是以当前时间为截止时间点的预设时间段，也可以是以早于当前时间为截止时间段的预设时间段。该查询指令中对应的预设时间段有一个默认值，如为一个月。其中，查询指令中还包括对应的查询对象，如CPU核等。S502，根据查询指令对应的预设时间段，统计常驻服务的资源使用数量。可以理解为，获取预设时间段内对应的多个时刻的资源使用数量。在其他实施例中，统计常驻服务的资源使用数量还包括根据统计的资源使用数量计算资源使用率。如根据统计的CPU核使用数量计算CPU核使用率等。

S205，通过视图展示统计的资源使用数量。可以通过分布式系统监视及网络监视工具展示待展示资源使用数量。其中，分布式系统监视及网络监视工具包括zabbix。zabbix能监视各种网络参数，保证系统的安全运营。具体地，以曲线的形式展示，以使用户一目了然的看到预设时间段内对应的资源使用情况。如在以时间为x轴，资源使用数量为y轴的坐标系上，展示预设时间段内的资源使用数量的情况。也可以通过其他合适的工具或者合适的方式来展示待展示资源使用数量。如当使用zabbix来展示统计的资源使用数量时，步骤S204中的查询指令可通过zabbix中用户选择/输入的时间条，以及选择的查询对象来得到，其中，时间条上对应的时间即为预设时间段，选择对象包括有CPU核等。若步骤204中统计的是资源使用率，可以理解地，该步骤中展示的也是资源使用率。

在其他实施例中，步骤S204中还包括设置时间间隔，通过视图根据时间间隔展示统计的资源使用数量(资源使用率)。可以理解为，若预设时间段为1 年，那么在视图中展示1年的资源使用数量(资源使用率)。由于一年中对应的时间点有很多个，而在视图中只需展示资源使用数量(资源使用率)的情况即可；另一方面连续获取的资源使用数量(资源使用率)的数值从理论上来讲相差不是特别大；而且统计1年中每时每刻的资源使用数量本身也需要占用一些资源。从实用性上来讲，可以在视图中设置时间间隔来展示1年中的资源使用数量(资源使用率)。如间隔1分钟等。

上述实施例通过利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；根据所述页面的数据解析出所述运行任务执行单元的数量；根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；统计预设时间段内的资源使用数量；通过视图展示统计的资源使用数量。本申请实施例根据计算任务中常驻服务的运行任务执行单元的数量与资源使用数量之间的线性关系，实现计算任务中常驻服务的资源监测，以可视化的方式展示了计算任务中常驻服务的资源使用状态；通过展示在预设时间段内的资源使用状态，展示了计算任务中常驻服务的资源使用饱和度，为计算任务中常驻服务的资源分配提供了可靠的依据，可以更合理的分配计算任务中常驻服务使用的资源，避免资源多分配而存在的资源浪费；而且通过展示的资源使用状态，可以为计算常驻服务的性能优化提供依据，也更方便了分析计算任务中常驻服务出现的问题，如展示的资源使用状态突然大幅升高，那么可能有问题存在。

图6为本申请另一实施例提供的一种计算任务的资源监测方法的流程示意图。该方法实施例包括S601-S606。该实施例与图1所示的实施例的区别在于：增加了S601。其他步骤的详细内容请参看图1实施例中对应步骤的描述，在此不再赘述。

S601，设置时间间隔。时间间隔如1分钟，5分钟等。

S602，根据该时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。

由于一个计算任务在执行时，一般不会出现资源使用突然的大幅增加或者突然的大幅减少，因此连续获取的多个资源使用数量在数值上可能相差不大。如果每时每刻都获取资源使用数量，一方面获取资源使用数量本身需要占用一些资源，如CPU资源、内存资源等；另一方面，连续获取的多个资源使用数量由于数值上相差不大，参考意义有限。因此设置时间间隔，以根据时间间隔获取计算任务中常驻服务的运行任务执行单元的数量，进一步提高资源监测的效率。可以理解地，根据时间间隔获取计算任务中常驻服务的运行任务执行单元的数量，那么在视图中展示的统计的资源使用数量也是根据该时间间隔来展示的。

图7是本申请实施例提供的一种计算任务的资源监测装置的示意性框图。该装置执行的前提是：分布式计算系统启动时，也会启动分布式计算系统所对应的web UI服务，而任务调度的运行任务执行单元在web UI服务提供的页面(网页用户界面)上显示。该装置70包括页面获取单元701、解析单元702、计算单元703、统计单元704、展示单元705。

页面获取单元701用于利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。其中，网页爬虫技术是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本的技术。网页爬虫技术被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面内容，以获取或更新这些网站的内容和检索方式。具体地，如图8所示，页面获取单元包括参数获取单元801、页面数据获取单元802。参数获取单元801用于获取计算任务中网页用户界面的统一资源定位符参数。页面数据获取单元802用于根据统一资源定位符参数，利用网页爬虫技术，获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。

解析单元702用于根据该页面的数据解析出常驻服务的运行任务执行单元的数量。具体地，如图9所示，解析单元包括标签获取单元901、标签值统计单元902。标签获取单元901用于从获取常驻服务的运行任务执行单元所在的页面的数据中，获取常驻服务的所有运行任务执行单元的标签。即获取页面中running task所在的标签。标签值统计单元902用于统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。

计算单元703用于根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存常驻服务的资源使用数量。

统计单元704用于统计预设时间段内的资源使用数量资源使用数量。具体地，如图10所示，统计单元包括接收单元101、资源统计单元102。接收单元101用于接收查询指令，该查询指令中包括有对应的预设时间段。资源统计单元102用于根据查询指令对应的预设时间段，统计常驻服务的资源使用数量。

展示单元705用于通过视图展示统计的资源使用数量。可以通过分布式系统监视及网络监视工具展示待展示资源使用数量。

在其他实施例中，统计单元中还包括设置时间间隔，展示单元通过视图根据时间间隔展示统计的资源使用数量(资源使用率)。

图11为本申请另一实施例提供的一种计算任务的资源监测装置的示意性框图。该装置110包括设置单元111、页面获取单元112、解析单元113、计算单元114、统计单元115、展示单元116。该实施例与图7实施例的区别在于：增加了设置单元111。其他单元的详细内容请参看图6实施例中相对应单元的描述，在此不再赘述。

设置单元111，用于设置时间间隔。时间间隔如1分钟，5分钟等。

页面获取单元112，还用于根据该时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。

上述装置实施例的具体实现过程和达到的有益效果可参看对应方法实施例的对应部分，在此不再赘述。

上述装置可以实现为一种计算机程序数据的形式，该程序数据可以在如图12所示的设备上运行。

图12为本申请实施例提供的一种计算任务的资源监测设备的示意性框图。该设备120可以是终端，如服务器等。该设备120包括通过系统总线121连接的处理器122、存储器和网络接口123，其中，存储器可以包括非易失性存储介质124和内存储器125。该非易失性存储介质124可存储操作系统1241和程序数据1242。该程序数据1242被执行时，可使得处理器122执行一种计算任务的资源监测方法。该处理器122用于提供计算和控制能力，支撑整个设备120的运行。该内存储器125中为程序数据的运行提供环境，该程序数据被处理器122执行时，可使得处理器122执行一种计算任务的资源监测方法。该网络接口123用于进行网络通信，如接收指令等。本领域技术人员可以理解，图12中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的设备120的限定，具体的设备120可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器122用于运行存储在存储器中的程序数据，以执行前述计算任务的资源监测方法的任一实施例。

应当理解，在本申请实施例中，处理器122可以是中央处理单元(Central Processing Unit，CPU)，该处理器122还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者一个以上程序数据，所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行，以实现前述计算任务的资源监测方法的任一实施例。

所述计算机可读存储介质可以是设备的内部存储单元，例如设备的硬盘或内存。所述计算机可读存储介质也可以是设备的外部存储设备，例如所述设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡等。进一步地，所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种计算任务的资源监测方法，其特征在于，所述方法包括：

利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；

根据所述页面的数据解析出所述运行任务执行单元的数量；

根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；

统计预设时间段内的资源使用数量；

通过视图展示统计的资源使用数量。
如权利要求1所述的方法，其特征在于，所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据，包括：

获取计算任务中网页用户界面的统一资源定位符参数；

根据所述统一资源定位符参数，利用网页爬虫技术，获取计算任务中所述常驻服务的运行任务执行单元所在的页面的数据。
如权利要求1所述的方法，其特征在于，所述根据所述页面的数据解析出所述运行任务执行单元的数量，包括：

从所述页面的数据中，获取所述常驻服务的所有运行任务执行单元的标签；

统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。
如权利要求1所述的方法，其特征在于，所述统计预设时间段内的资源使用数量，包括：

接收查询指令，所述查询指令中包括有预设时间段；

根据所述查询指令对应的预设时间段，统计所述常驻服务的资源使用数量。
如权利要求1所述的方法，其特征在于，所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据之前，所述方法还包括：

设置时间间隔；

所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据，包括：根据所述时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。
一种计算任务的资源监测装置，其特征在于，所述装置包括：

页面获取单元，用于利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；

解析单元，用于根据所述页面的数据解析出所述运行任务执行单元的数量；

计算单元，用于根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；

统计单元，用于统计预设时间段内的资源使用数量；

展示单元，用于通过视图展示统计的资源使用数量。
如权利要求6所述的装置，其特征在于，所述页面获取单元，包括：

参数获取单元，用于获取计算任务中网页用户界面的统一资源定位符参数；

页面数据获取单元，用于根据所述统一资源定位符参数，利用网页爬虫技术，获取计算任务中所述常驻服务的运行任务执行单元所在的页面的数据。
如权利要求6所述的装置，其特征在于，所述解析单元，包括：

标签获取单元，用于从所述页面的数据中，获取常驻服务的所有运行任务执行单元的标签；

标签值统计单元，用于统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。
如权利要求6所述的装置，其特征在于，所述统计单元，包括：

接收单元，用于接收查询指令，所述查询指令中包括有对应的预设时间段；

资源统计单元，用于根据所述查询指令对应的预设时间段，统计所述常驻服务的资源使用数量。
如权利要求6所述的装置，其特征在于，所述装置还包括：

设置单元，用于设置时间间隔；

所述页面获取单元，还用于根据所述时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。
一种计算任务的资源监测设备，其特征在于，所述设备包括存储器，以及与所述存储器相连的处理器；

所述存储器用于存储实现计算任务的资源监测的程序数据；所述处理器用于运行所述存储器中存储的程序数据，以执行如下步骤：

利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；

根据所述页面的数据解析出所述运行任务执行单元的数量；

根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；

统计预设时间段内的资源使用数量；

通过视图展示统计的资源使用数量。
如权利要求11所述的设备，其特征在于，所述处理器在执行所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据时，具体执行如下步骤：

获取计算任务中网页用户界面的统一资源定位符参数；

根据所述统一资源定位符参数，利用网页爬虫技术，获取计算任务中所述常驻服务的运行任务执行单元所在的页面的数据。
如权利要求11所述的设备，其特征在于，所述处理器在执行所述根据所述页面的数据解析出所述运行任务执行单元的数量时，具体执行如下步骤：

从所述页面的数据中，获取所述常驻服务的所有运行任务执行单元的标签；

统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。
如权利要求11所述的设备，其特征在于，所述处理器在执行所述统计预设时间段内的资源使用数量时，具体执行如下步骤：

接收查询指令，所述查询指令中包括有预设时间段；

根据所述查询指令对应的预设时间段，统计所述常驻服务的资源使用数量。
如权利要求11所述的设备，其特征在于，所述处理器还执行如下步骤：

设置时间间隔；

所述处理器在执行所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据时，具体执行：根据所述时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者一个以上程序数据，所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行，以实现如下步骤：

利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据；

根据所述页面的数据解析出所述运行任务执行单元的数量；

根据运行任务执行单元的数量与资源使用数量的线性关系，计算并保存所述常驻服务的资源使用数量；

统计预设时间段内的资源使用数量；

通过视图展示统计的资源使用数量。
如权利要求16所述的计算机可读存储介质，其特征在于，所述处理器在执行所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据时，具体实现如下步骤：

获取计算任务中网页用户界面的统一资源定位符参数；

根据所述统一资源定位符参数，利用网页爬虫技术，获取计算任务中所述常驻服务的运行任务执行单元所在的页面的数据。
如权利要求16所述的计算机可读存储介质，其特征在于，所述处理器在执行所述根据所述页面的数据解析出所述运行任务执行单元的数量时，具体实现如下步骤：

从所述页面的数据中，获取所述常驻服务的所有运行任务执行单元的标签；

统计所有运行任务执行单元的标签中相对应的值作为运行任务执行单元的数量。
如权利要求16所述的计算机可读存储介质，其特征在于，所述处理器在执行所述统计预设时间段内的资源使用数量时，具体实现如下步骤：

接收查询指令，所述查询指令中包括有预设时间段；

根据所述查询指令对应的预设时间段，统计所述常驻服务的资源使用数量。
如权利要求16所述的计算机可读存储介质，其特征在于，所述处理器还实现如下步骤：

设置时间间隔；

所述处理器在执行所述利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据时，具体实现：根据所述时间间隔，利用网页爬虫技术获取计算任务中常驻服务的运行任务执行单元所在的页面的数据。