CN109995862A - 一种资源调度方法及终端 - Google Patents

一种资源调度方法及终端 Download PDF

Info

Publication number
CN109995862A
CN109995862A CN201910248676.5A CN201910248676A CN109995862A CN 109995862 A CN109995862 A CN 109995862A CN 201910248676 A CN201910248676 A CN 201910248676A CN 109995862 A CN109995862 A CN 109995862A
Authority
CN
China
Prior art keywords
network node
card number
goal task
task request
gpu card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910248676.5A
Other languages
English (en)
Other versions
CN109995862B (zh
Inventor
曾李志
刘传秀
张恒华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910248676.5A priority Critical patent/CN109995862B/zh
Publication of CN109995862A publication Critical patent/CN109995862A/zh
Application granted granted Critical
Publication of CN109995862B publication Critical patent/CN109995862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种资源调度方法及终端,该方法包括:接收目标任务请求;确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;从第二网络节点中选取N个第三网络节点执行所述目标任务请求;其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。本发明减少了GPU资源碎片的产生。

Description

一种资源调度方法及终端
技术领域
本发明涉及通信技术领域,尤其涉及一种资源调度方法及终端。
背景技术
众所周知,计算机集群中大量采用英伟达nvidia的中央处理器(CentralProcessing Unit,CPU)-图像处理器(Graphics Processing Unit,GPU)异构计算资源,目前已经进行了资源池化管理,在实际调度中会出现当多个部门共享一个队列的GPU资源,但是不同部门提交任务请求的资源特点有巨大差异的时候,容易导致计算机集群容易产生GPU资源碎片。
发明内容
本发明实施例提供一种资源调度方法及终端,以解决计算机集群容易产生GPU资源碎片的问题。
第一方面,本发明实施例提供了一种资源调度方法,包括:
接收目标任务请求;
确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
第二方面,本发明实施例还提供了一种终端,其特征在于,包括:
接收模块,用于接收目标任务请求;
确定模块,用于确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
选取模块,用于从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
第三方面,本发明实施例还提供了一种终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述资源调度方法的步骤。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述资源调度方法的步骤。
本发明实施例通过接收确定所述目标任务请求的需求参数,从第二网络节点中选取对应的N个第三网络节点执行所述目标任务请求。这样,选择执行目标任务请求的第三网络节点为可用GPU卡数大于目标任务请求所需的GPU卡数,且是可用GPU卡数最小的网络节点,因此减少了GPU资源碎片的产生。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的资源调度方法的流程图;
图2是本发明实施例提供的终端的结构图之一;
图3是本发明实施例提供的终端的结构图之二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种资源调度方法的流程图,如图1所示,包括以下步骤:
步骤101,接收目标任务请求。
本发明实施例提供的资源调度方法主要应用在计算机集群中,用于对各部门提交的任务请求选择网络节点执行相应的操作。
具体的,在计算机集群中包括多个计算机,每个计算机接入网络均有对应的IP,该网络节点是指计算机集群中不同IP地址对应的计算机。
本发明实施例中,上述资源调度方法应用的终端包括但不限于手机、平板电脑、笔记本电脑和掌上电脑等,用户可以通过该终端提供的操作界面输入上述目标任务请求,也可以通过其他终端向该终端发送该目标任务请求,具体形式在此不做进一步的限定。
应当说明的是,在本实施例中,可以根据执行任务请求所需的网络节点的数量将上述目标任务请求划分为单机任务请求和多机任务请求。其中,单机任务请求用于请求单个网络节点执行任务,多机任务请求用于请求至少两个网络节点执行任务。同时还可以根据执行任务请求所需的GUP卡数确定为整机任务请求和非整机任务请求。其中,整机任务请求是指目标任务请求GUP卡数等于网络节点总的GPU卡数。
具体的,上述目标任务请求可以为整机的单机任务请求、非整机的单机任务请求、整机的多机任务请求和非整机的多机任务请求中的任一项。
步骤102,确定所述目标任务请求的需求参数。
上述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
当上述目标任务请求为整机的单机任务请求和非整机的单机任务请求时,上述N为1,当上述目标任务请求为整机的多机任务请求和非整机的多机任务请求时,上述N大于1。具体的,用于在设置目标任务请求时,可以设定需求参数,也可以是终端根据任务请求和需求参数的对应关系自动识别目标任务请求的需求参数。
具体的,当N大于1时,多个第一网络节点的第一GPU卡数可以相同也可以不同,在此不做进一步的限定。
步骤103,从第二网络节点中选取N个第三网络节点执行所述目标任务请求。
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
例如,网络中的网络节点包括a、b、c、d、e、f和g,其中,网络节点a可用的GPU卡数为2,网络节点b可用的GPU卡数为4,网络节点c可用的GPU卡数为5,网络节点d可用的GPU卡数为5,网络节点e可用的GPU卡数为8,网络节点f可用的GPU卡数为8,网络节点g可用的GPU卡数为8。
在实例1中,当上述需求参数中包括1个第一网络节点,且第一网络节点的第一GPU卡数为3时,则上述第二网络节点包括b、c、d、e、f和g,上述第三网络节点为b,上述第四网络节点包括c、d、e、f和g。由于采用网络节点b作为第三网络节点,这样可以使得执行目标任务请求的网络节点b仅产生一个GPU资源碎片。
在实例2中,当上述需求参数中包括两个第一网络节点,且每个第一网络节点的第一GPU卡数为5时,则上述第二网络节点包括c、d、e、f和g,一个第三网络节点为c,另一个第三网络节点为d,上述第四网络节点包括e、f和g。由于采用网络节点c和d作为第三网络节点,这样可以充分利用网络节点c和d终端额GPU资源碎片,防止在其他网络节点中执行目标任务请求所带来的新的GPU资源碎片。在本实施例中,若再次接收到包括两个第一网络节点,且每个第一网络节点的第一GPU卡数为8的目标任务请求,可以直接在网络节点e、f和d中选择2个执行即可。如现有技术未进行资源调度,在第一次接收到目标任务请求时占用了网络节点e和f中的资源,则第二次接收到目标任务请求时,将会进入待定pending阶段。
本发明实施例通过接收确定所述目标任务请求的需求参数,从第二网络节点中选取对应的N个第三网络节点执行所述目标任务请求。这样,选择执行目标任务请求的第三网络节点为可用GPU卡数大于目标任务请求所需的GPU卡数,且是可用GPU卡数最小的网络节点,因此减少了GPU资源碎片的产生。
进一步的,基于上述实施例,本实施例中,所述步骤103包括:
根据所述第一GPU卡数,确定所述目标任务请求是否为整机任务请求;
当所述目标任务请求为整机任务请求时,从所述第二网络节点中选取带宽最优的N个第三网络节点执行所述目标任务请求。
应当说明的是,上述网络节点的GPU卡数的总量可以是4卡,也可以是8卡。以8卡为例,若上述目标任务请求所需的GPU卡数为8卡时,确定目标任务请求为整机任务请求;上述目标任务请求所需的GPU卡数为1-7卡时,确定目标任务请求为非整机任务请求。
本实施例中,当目标任务请求为整机任务请求时,可以根据带宽选择通信最优的网络节点执行上述目标任务请求。
在一可选实施例中,可以进行动态网络感知得到各第二网络节点的带宽信息,具体的,所述方法还包括:
每隔第一预设时长获取所述第二网络节点的带宽信息;
根据所述带宽信息统计预设时间段内所述第二网络节点的平均带宽值作为所述第二网络节点当前的带宽。
上述第一预设时长的时间长度可以根据实际需要进行设置,例如本实施例中,该第一预时长可以为6秒。也就是每隔6秒获取各第二网络节点的带宽信息。该带宽信息具体的表现形式可以根据实际需要进行设置,例如可以在各第二网络节点中部署机器监视MachineMonitor模块,该机器监视模块可以采集第二网络节点的ip、子网掩码mask和带宽信息等。该带宽信息可以理解为第一预设时长的带宽,具体的,带宽的计算可以根据实际需要进行设置,例如在一可选实施例中,在每个第二网络节点记录了读的字节和转发的字节,根据预设时间间隔(如1秒)前后两次查询获得的读字节数之间的差值和转发字节数之间的差值确定网络节点当前使用的读带宽和写带宽,然后计算网络节点空闲读带宽和写带宽,最后选择两者中最小的确定为网络节点的可用带宽。具体的编写代码可以如下:
1.network_interface=`ifconfig|grep Ethernet|awk'{print$1}'`;
2.R1=`cat/sys/class/net/$network_interface/statistics/rx_bytes`;
3.T1=`cat/sys/class/net/$network_interface/statistics/tx_bytes`;
4.sleep 1;
5.R2=`cat/sys/class/net/$network_interface/statistics/rx_bytes`;
6.T2=`cat/sys/class/net/$network_interface/statistics/tx_bytes`;
7.TBPS=`expr$T2-$T1`;
8.RBPS=`expr$R2-$R1`;
9.TMBPS=`expr$TBPS/1024/1024`;
10.RMBPS=`expr$RBPS/1024/1024`;
11.echo$TMBPS Mb/s$RMBPS Mb/s;
12.fullBandwidth=`ethtool$network_interface|grep Speed|awk-F:'{print$2}'`;
13.useBandwidth=max(TMBPS,RMBPS);
14.remainBandwidth=`expr$fullBandwidth-$useBandwidth`;
在本实施例中,上述带宽信息可以为每1秒计算获得的带宽也可以为第一预设时长计算获得的平均带宽,在此不做进一步的限定。
上述预设时间段的时间长度可以根据实际需要进行设置,例如可以为1分钟。在本实施例中,由于将整机任务请求放在带宽最优的N个网络节点执行,从而提高了整机任务请求执行的效率。
进一步的,上述步骤103还包括:
当所述目标任务请求为非整机任务时,从所述第二网络节点的同一子网内选取N个第三网络节点执行所述目标任务请求。
具体的,可以通过IP和子网掩码mask做相与运算,划分出子网(计算方法10.255.79.12&255.255.255.0=10.255.79.0)。
内存中为每一个子网维护如下数据结构,ip为key,value为长度为10的bandwidth列表,列表中的bandwidth都是最新的带宽信息。
本实施例中,由于多机的情况下,将目标任务请求中分配在一个子网内,从而可以减少网络延迟。
需要说明的是,为了获知网络中各网络节点可用的GPU卡数,还需要对各网络节点可用的GPU卡数进行遍历,具体的,在一可选实施例中,可以在接收到目标任务请求时,进行遍历。在另一可选实施例中,可以间隔一定时间进行遍历,具体的,上述方法还包括:
每隔第二预设时长遍历网络中各网络节点可用的GPU卡数。
本实施例中,该第二预设时长可以为第一预设时长的整数倍,具体时间长度可以根据实际需要进行设置。由于每隔第二预设时长进行一次遍历,从而在接收到目标任务请求时,可以直接选择网络节点,从而提高了目标任务请求执行的速度。
需要说明的是,本发明实施例中介绍的多种可选的实施方式,彼此可以相互结合实现,也可以单独实现,对此本发明实施例不作限定。
参见图2,图2是本发明实施例提供的终端的结构图,如图2所示,终端200包括:
接收模块201,用于接收目标任务请求;
确定模块202,用于确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
选取模块203,用于从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
可选的,所述选取模块203包括:
确定单元,用于根据所述第一GPU卡数,确定所述目标任务请求是否为整机任务请求;
选取单元,用于当所述目标任务请求为整机任务请求时,从所述第二网络节点中选取带宽最优的N个第三网络节点执行所述目标任务请求。
可选的,所述选取单元还用于:当所述目标任务请求为非整机任务时,从所述第二网络节点的同一子网内选取N个第三网络节点执行所述目标任务请求。
可选的,所述终端200还包括:
获取模块,用于每隔第一预设时长获取所述第二网络节点的带宽信息;
处理模块,用于根据所述带宽信息统计预设时间段内所述第二网络节点的平均带宽值作为所述第二网络节点当前的带宽。
可选的,所述终端200还包括:
遍历模块,用于每隔第二预设时长遍历网络中各网络节点可用的GPU卡数。
本发明实施例通过接收确定所述目标任务请求的需求参数,从第二网络节点中选取对应的N个第三网络节点执行所述目标任务请求。这样,选择执行目标任务请求的第三网络节点为可用GPU卡数大于目标任务请求所需的GPU卡数,且是可用GPU卡数最小的网络节点,因此减少了GPU资源碎片的产生。
本发明实施例提供的终端能够实现图1的方法实施例中终端实现的各个过程,为避免重复,这里不再赘述。
图3为实现本发明各个实施例的一种终端的硬件结构示意图。
该终端300包括但不限于:射频单元301、网络模块302、音频输出单元303、输入单元304、传感器305、显示单元306、用户输入单元307、接口单元308、存储器309、处理器310、以及电源311等部件。本领域技术人员可以理解,图3中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,处理器310,用于接收目标任务请求;确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
可选的,处理器310,具体用于根据所述第一GPU卡数,确定所述目标任务请求是否为整机任务请求;当所述目标任务请求为整机任务请求时,从所述第二网络节点中选取带宽最优的N个第三网络节点执行所述目标任务请求。
可选的,处理器310,具体用于当所述目标任务请求为非整机任务时,从所述第二网络节点的同一子网内选取N个第三网络节点执行所述目标任务请求。
可选的,处理器310,还用于每隔第一预设时长获取所述第二网络节点的带宽信息;根据所述带宽信息统计预设时间段内所述第二网络节点的平均带宽值作为所述第二网络节点当前的带宽。
可选的,处理器310,还用于每隔第二预设时长遍历网络中各网络节点可用的GPU卡数。
本发明实施例通过接收确定所述目标任务请求的需求参数,从第二网络节点中选取对应的N个第三网络节点执行所述目标任务请求。这样,选择执行目标任务请求的第三网络节点为可用GPU卡数大于目标任务请求所需的GPU卡数,且是可用GPU卡数最小的网络节点,因此减少了GPU资源碎片的产生。
应理解的是,本发明实施例中,射频单元301可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器310处理;另外,将上行的数据发送给基站。通常,射频单元301包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元301还可以通过无线通信系统与网络和其他设备通信。
终端通过网络模块302为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元303可以将射频单元301或网络模块302接收的或者在存储器309中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元303还可以提供与终端300执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元303包括扬声器、蜂鸣器以及受话器等。
输入单元304用于接收音频或视频信号。输入单元304可以包括图形处理器(Graphics Processing Unit,GPU)3041和麦克风3042,图形处理器3041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元306上。经图形处理器3041处理后的图像帧可以存储在存储器309(或其它存储介质)中或者经由射频单元301或网络模块302进行发送。麦克风3042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元301发送到移动通信基站的格式输出。
终端300还包括至少一种传感器305,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板3061的亮度,接近传感器可在终端300移动到耳边时,关闭显示面板3061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器305还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元306用于显示由用户输入的信息或提供给用户的信息。显示单元306可包括显示面板3061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板3061。
用户输入单元307可用于接收输入的数字或字符信息,以及产生与终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元307包括触控面板3071以及其他输入设备3072。触控面板3071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板3071上或在触控面板3071附近的操作)。触控面板3071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器310,接收处理器310发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板3071。除了触控面板3071,用户输入单元307还可以包括其他输入设备3072。具体地,其他输入设备3072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板3071可覆盖在显示面板3061上,当触控面板3071检测到在其上或附近的触摸操作后,传送给处理器310以确定触摸事件的类型,随后处理器310根据触摸事件的类型在显示面板3061上提供相应的视觉输出。虽然在图3中,触控面板3071与显示面板3061是作为两个独立的部件来实现终端的输入和输出功能,但是在某些实施例中,可以将触控面板3071与显示面板3061集成而实现终端的输入和输出功能,具体此处不做限定。
接口单元308为外部装置与终端300连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元308可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端300内的一个或多个元件或者可以用于在终端300和外部装置之间传输数据。
存储器309可用于存储软件程序以及各种数据。存储器309可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器309可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器310是终端的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器309内的软件程序和/或模块,以及调用存储在存储器309内的数据,执行终端的各种功能和处理数据,从而对终端进行整体监控。处理器310可包括一个或多个处理单元;优选的,处理器310可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器310中。
终端300还可以包括给各个部件供电的电源311(比如电池),优选的,电源311可以通过电源管理系统与处理器310逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,终端300包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种终端,包括处理器310,存储器309,存储在存储器309上并可在所述处理器310上运行的计算机程序,该计算机程序被处理器310执行时实现上述资源调度方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述资源调度方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种资源调度方法,其特征在于,包括:
接收目标任务请求;
确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
2.根据权利要求1所述的方法,其特征在于,所述从第二网络节点中选取N个第三网络节点执行所述目标任务请求包括:
根据所述第一GPU卡数,确定所述目标任务请求是否为整机任务请求;
当所述目标任务请求为整机任务请求时,从所述第二网络节点中选取带宽最优的N个第三网络节点执行所述目标任务请求。
3.根据权利要求2所述的方法,其特征在于,所述从第二网络节点中选取N个第三网络节点执行所述目标任务请求还包括:
当所述目标任务请求为非整机任务时,从所述第二网络节点的同一子网内选取N个第三网络节点执行所述目标任务请求。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
每隔第一预设时长获取所述第二网络节点的带宽信息;
根据所述带宽信息统计预设时间段内所述第二网络节点的平均带宽值作为所述第二网络节点当前的带宽。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
每隔第二预设时长遍历网络中各网络节点可用的GPU卡数。
6.一种终端,其特征在于,包括:
接收模块,用于接收目标任务请求;
确定模块,用于确定所述目标任务请求的需求参数,所述需求参数包括执行所述目标任务请求的N个第一网络节点,以及每一所述第一网络节点的第一图像处理器GPU卡数,N为正整数;
选取模块,用于从第二网络节点中选取N个第三网络节点执行所述目标任务请求;
其中,所述第二网络节点可用的第二GPU卡数大于或等于所述第一GPU卡数的最小值;每一所述第三网络节点可用的GPU卡数大于或等于对应的第一网络节点的第一GUP卡数,且小于或等于第四网络节点的GPU卡数,所述第四网络节点为所述第二网络节点中除所述第三网络节点之外的网络节点。
7.根据权利要求6所述的终端,其特征在于,所述选取模块包括:
确定单元,用于根据所述第一GPU卡数,确定所述目标任务请求是否为整机任务请求;
选取单元,用于当所述目标任务请求为整机任务请求时,从所述第二网络节点中选取带宽最优的N个第三网络节点执行所述目标任务请求。
8.根据权利要求7所述的终端,其特征在于,所述选取单元还用于:当所述目标任务请求为非整机任务时,从所述第二网络节点的同一子网内选取N个第三网络节点执行所述目标任务请求。
9.根据权利要求7所述的终端,其特征在于,所述终端还包括:
获取模块,用于每隔第一预设时长获取所述第二网络节点的带宽信息;
处理模块,用于根据所述带宽信息统计预设时间段内所述第二网络节点的平均带宽值作为所述第二网络节点当前的带宽。
10.根据权利要求6至9中任一项所述的终端,其特征在于,所述终端还包括:
遍历模块,用于每隔第二预设时长遍历网络中各网络节点可用的GPU卡数。
11.一种终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的资源调度方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-5中任一项所述的资源调度方法的步骤。
CN201910248676.5A 2019-03-29 2019-03-29 一种资源调度方法及终端 Active CN109995862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910248676.5A CN109995862B (zh) 2019-03-29 2019-03-29 一种资源调度方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910248676.5A CN109995862B (zh) 2019-03-29 2019-03-29 一种资源调度方法及终端

Publications (2)

Publication Number Publication Date
CN109995862A true CN109995862A (zh) 2019-07-09
CN109995862B CN109995862B (zh) 2021-10-15

Family

ID=67131707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910248676.5A Active CN109995862B (zh) 2019-03-29 2019-03-29 一种资源调度方法及终端

Country Status (1)

Country Link
CN (1) CN109995862B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413412A (zh) * 2019-07-19 2019-11-05 苏州浪潮智能科技有限公司 一种基于gpu集群资源分配的方法和装置
CN111694648A (zh) * 2020-06-09 2020-09-22 北京百度网讯科技有限公司 一种任务调度方法、装置以及电子设备
CN113296921A (zh) * 2020-04-07 2021-08-24 阿里巴巴集团控股有限公司 云资源调度方法、节点、系统及存储介质
WO2022001086A1 (zh) * 2020-06-29 2022-01-06 苏州浪潮智能科技有限公司 一种高效的gpu资源分配优化方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140033215A1 (en) * 2011-03-29 2014-01-30 Fujitsu Limited Scheduling method and scheduling system
CN105893140A (zh) * 2015-12-17 2016-08-24 乐视移动智能信息技术(北京)有限公司 一种用于分配动态内存资源的方法及装置
CN107729126A (zh) * 2016-08-12 2018-02-23 中国移动通信集团浙江有限公司 一种容器云的任务调度方法和装置
CN107766148A (zh) * 2017-08-31 2018-03-06 北京百度网讯科技有限公司 一种异构集群及任务处理方法和装置
CN108234581A (zh) * 2016-12-22 2018-06-29 腾讯科技(深圳)有限公司 一种资源的调度方法和服务器
CN109033001A (zh) * 2018-07-17 2018-12-18 北京百度网讯科技有限公司 用于分配gpu的方法和装置
CN109408215A (zh) * 2018-11-07 2019-03-01 郑州云海信息技术有限公司 一种计算节点的任务调度方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140033215A1 (en) * 2011-03-29 2014-01-30 Fujitsu Limited Scheduling method and scheduling system
CN105893140A (zh) * 2015-12-17 2016-08-24 乐视移动智能信息技术(北京)有限公司 一种用于分配动态内存资源的方法及装置
CN107729126A (zh) * 2016-08-12 2018-02-23 中国移动通信集团浙江有限公司 一种容器云的任务调度方法和装置
CN108234581A (zh) * 2016-12-22 2018-06-29 腾讯科技(深圳)有限公司 一种资源的调度方法和服务器
CN107766148A (zh) * 2017-08-31 2018-03-06 北京百度网讯科技有限公司 一种异构集群及任务处理方法和装置
CN109033001A (zh) * 2018-07-17 2018-12-18 北京百度网讯科技有限公司 用于分配gpu的方法和装置
CN109408215A (zh) * 2018-11-07 2019-03-01 郑州云海信息技术有限公司 一种计算节点的任务调度方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林彦宇: ""异构计算集群调度系统的研究与实现"", 《中国优秀硕士论文全文数据库》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413412A (zh) * 2019-07-19 2019-11-05 苏州浪潮智能科技有限公司 一种基于gpu集群资源分配的方法和装置
CN110413412B (zh) * 2019-07-19 2022-03-25 苏州浪潮智能科技有限公司 一种基于gpu集群资源分配的方法和装置
CN113296921A (zh) * 2020-04-07 2021-08-24 阿里巴巴集团控股有限公司 云资源调度方法、节点、系统及存储介质
CN113296921B (zh) * 2020-04-07 2022-05-27 阿里巴巴集团控股有限公司 云资源调度方法、节点、系统及存储介质
CN111694648A (zh) * 2020-06-09 2020-09-22 北京百度网讯科技有限公司 一种任务调度方法、装置以及电子设备
CN111694648B (zh) * 2020-06-09 2023-08-15 阿波罗智能技术(北京)有限公司 一种任务调度方法、装置以及电子设备
WO2022001086A1 (zh) * 2020-06-29 2022-01-06 苏州浪潮智能科技有限公司 一种高效的gpu资源分配优化方法和系统

Also Published As

Publication number Publication date
CN109995862B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN109995862A (zh) 一种资源调度方法及终端
CN107734179A (zh) 一种消息提示方法、移动终端
CN110149552A (zh) 一种视频流帧数据的处理方法及终端
CN107483836B (zh) 一种拍摄方法及移动终端
CN108459815A (zh) 一种显示控制方法及移动终端
CN108897473A (zh) 一种界面显示方法及终端
CN110213440A (zh) 一种图像分享方法及终端
CN110519512A (zh) 一种对象处理方法及终端
CN109560591A (zh) 充电方法、装置和终端
CN109862172A (zh) 一种屏幕参数的调节方法及终端
CN109413264A (zh) 一种背景图片调整方法及终端设备
CN109739300A (zh) 一种天线控制方法及终端
CN108519847A (zh) 一种录屏方法及终端
CN110191426A (zh) 一种信息共享的方法及终端
CN109802945A (zh) 一种数据传输方法和终端设备
CN109147746A (zh) 一种k歌方法及终端
CN109164908A (zh) 一种界面控制方法及移动终端
CN109117037A (zh) 一种图像处理的方法及终端设备
CN109889568A (zh) 一种数据导出方法、服务器、客户端及系统
CN108196744B (zh) 一种任务界面的调整方法及移动终端
CN110442408A (zh) 一种助力信息统计方法、装置
CN109922256A (zh) 拍摄方法及终端设备
CN109286414A (zh) 一种天线确定方法和终端
CN109819188A (zh) 视频的处理方法和终端设备
CN109960557A (zh) 一种显示方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant