CN111597052B - 芯片管控方法、装置、服务器及可读存储介质 - Google Patents

芯片管控方法、装置、服务器及可读存储介质 Download PDF

Info

Publication number
CN111597052B
CN111597052B CN202010445692.6A CN202010445692A CN111597052B CN 111597052 B CN111597052 B CN 111597052B CN 202010445692 A CN202010445692 A CN 202010445692A CN 111597052 B CN111597052 B CN 111597052B
Authority
CN
China
Prior art keywords
partition
chip
task
processed
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010445692.6A
Other languages
English (en)
Other versions
CN111597052A (zh
Inventor
张发恩
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Chuangxin Qizhi Technology Group Co ltd
Original Assignee
Qingdao Chuangxin Qizhi Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Chuangxin Qizhi Technology Group Co ltd filed Critical Qingdao Chuangxin Qizhi Technology Group Co ltd
Priority to CN202010445692.6A priority Critical patent/CN111597052B/zh
Publication of CN111597052A publication Critical patent/CN111597052A/zh
Application granted granted Critical
Publication of CN111597052B publication Critical patent/CN111597052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供一种芯片管控方法、装置、服务器及可读存储介质,涉及计算机数据处理技术领域。方法包括:根据获取的待处理任务的分区参数,确定待处理任务的目标分区;根据分区与芯片类型的绑定关系,确定与目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与分区所对应的处理芯片的运算资源相匹配;从多个处理芯片中确定至少一个目标芯片,用于执行待处理任务,能够改善集群中运算资源分配不平衡的问题,其中,目标芯片的芯片类型与目标类型相同。

Description

芯片管控方法、装置、服务器及可读存储介质
技术领域
本发明涉及计算机数据处理技术领域,具体而言,涉及一种芯片管控方法、装置、服务器及可读存储介质。
背景技术
处理芯片集群是一个计算机集群,其中每个计算节点配备有处理芯片。通过处理芯片上的通用计算能力,可以使处理芯片集群执行大量的运算,实现快速运算。例如,处理芯片为图形处理器(Graphics Processing Unit,GPU)时,利用多个GPU可以实现GPU集群,GUP集群可以用于实现机器训练与学习。
目前,在处理芯片集群中,存在运算资源分配不平衡的情况。例如,在利用处理芯片集群执行任务期间,若有成员占用高运算力的处理芯片执行对运算要求较低的任务,而实际需要高运算力的用户将无法利用高运算力的处理芯片执行相应的任务。
发明内容
本申请提供一种芯片管控方法、装置、服务器及可读存储介质,能够改善运算资源分配不平衡的问题。
为了实现上述目的,本申请实施例所提供的技术方案如下所示:
第一方面,本申请实施例提供一种芯片管控方法,所述方法包括:
根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区;
根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配;
从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同。
在上述的实施方式中,通过建立的分区与芯片类型的绑定关系,当在处理分区对应的任务时,可以自动基于该绑定关系确定用于执行该任务的目标芯片,使得所执行的任务所需运算资源与处理芯片的运算资源相匹配,改善集群中运算资源分配不平衡的问题。
结合第一方面,在一些可选的实施方式中,在确定所述待处理任务的目标分区之前,所述方法还包括:
基于接收的操作指令创建待处理任务;
对所述待处理任务添加指定分区,其中,所述指定分区与对应的芯片类型相绑定。
在上述的实施方式中,通过预先将分区与芯片类型进行绑定,可以得到芯片类型与分区的绑定关系,在得到该绑定关系后,便于后续操作过程中基于该绑定关系自动选择与分区对应的处理芯片。
结合第一方面,在一些可选的实施方式中,对所述待处理任务添加指定分区,包括:
根据所述操作指令中携带的用户信息,确定与所述用户信息对应的用户权限及与所述用户权限对应的分区集合;
从所述分区集合中确定所述指定分区;
将所述指定分区添加于所述待处理任务中。
在上述的实施方式中,通过为待处理任务添加指定分区,方便在后续处理该待处理任务时,基于添加的指定分区确定分区,进而基于所确定的分区匹配目标芯片。
结合第一方面,在一些可选的实施方式中,从所述分区集合中确定所述指定分区,包括:
根据所述待处理任务的所需运算资源,从所述分区集合中确定与所述所需运算资源匹配的处理芯片所绑定的分区作为所述指定分区。
在上述的实施方式中,基于待处理任务的所需运算资源,确定指定分区,使得指定分区对应的处理芯片的运算资源能够与待处理任务的所需运算资源相匹配,改善运算资源分配不平衡的问题。
结合第一方面,在一些可选的实施方式中,所述方法还包括:
基于接收的更改指令,在与用户权限对应的分区集合中添加指定分区,或者,在与所述用户权限对应的分区集合中删除对应的分区。
在上述的实施方式中,通过更改指令,方便对用户权限对应的分区集合进行灵活变动。
结合第一方面,在一些可选的实施方式中,在确定所述待处理任务的目标分区之前,所述方法还包括:
建立并存储处理芯片的芯片类型与分区的绑定关系。
在上述的实施方式中,通过存储芯片类型与分区的绑定关系,方便后续利用该绑定关系确定用于执行任务的目标芯片。
结合第一方面,在一些可选的实施方式中,所述处理芯片包括图形处理器。
第二方面,本申请实施例还提供一种芯片管控装置,所述装置包括:
分区确定单元,用于根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区;
芯片类型确定单元,用于根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配;
目标确定单元,用于从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同。
第三方面,本申请实施例还提供一种服务器,所述服务器包括相互耦合的存储器、处理器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述服务器执行上述的方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的服务器、管理终端、用户终端的通信连接示意图。
图2为本申请实施例提供的服务器的方框示意图。
图3为本申请实施例提供的芯片管控方法的流程示意图。
图4为本申请实施例提供的芯片类型与分区的绑定关系的示意图。
图5为本申请实施例提供的芯片管控装置的功能框图。
图标:10-服务器;11-处理模块;12-存储模块;13-通信模块;20-用户终端;30-管理终端;100-芯片管控装置;110-分区确定单元;120-芯片类型确定单元;130-目标确定单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。需要说明的是,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
目前,本申的申请人发现在处理芯片集群中,存在运算资源分配不平衡的情况。例如,对于GPU集群,分区(Zone)只是逻辑概念,且分区未与GPU卡的类型绑定,GPU卡类型的选择是在创建任务时候,由人工选择用于执行任务的GPU卡的类型。在人工选择执行任务的GPU卡的类型期间,需要依赖操作人员的工作经验,才能使得所选择的GPU卡的运算资源与任务所需的运算资源相匹配,因此,人工选择GUP容易导致运算资源分配不平衡,从而影响任务的进展。比如,若有成员占用高运算力的GUP执行对运算要求较低的任务,而实际需要高运算力的用户将无法利用高运算力的GUP执行相应的任务。
鉴于上述问题,本申的请申请人经过长期研究探索,提出以下实施例以解决上述问题。下面结合附图,对本申请实施例作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,本申请提供的服务器10可以通过网络与用户终端20、管理终端30建立通信连接,以进行数据交互。其中,服务器10可以为处理芯片集群中的管理设备,可以用于对处理芯片集群中的各个处理芯片进行管控。处理芯片集群可以包括多个处理芯片,可以用于执行大数据的运算、处理。例如,处理芯片集群可以用于执行深度学习的训练。处理芯片可以为中央处理器(Central Processing Unit,CPU)、图形处理器(GraphicsProcessing Unit,GPU)中的一种或两种,可以根据实际情况进行确定。
其中,待处理芯片的种类与所执行的任务类型相对应。比如,待处理任务为基于机器学习中的训练任务时,用户执行该待处理任务的集群通常为GPU集群。此时,处理芯片可以为该GPU集群中所包括的GPU芯片。又比如,当待处理任务为用于进行大量的数学公式运算,且可以并行运算时,该处理芯片可以CPU集群中所包括的CPU芯片。
在本实施例中,服务器10可以包括相互耦合的存储模块12、处理模块11,存储模块12内存储计算机程序,当计算机程序被处理模块11执行时,使得服务器10执行下述的芯片管控方法中的各步骤。
当然,服务器10还可以包括其他模块,例如,服务器10还可以包括通信模块13,用于建立服务器10与用户终端20、管理终端30之间的通信连接。网络可以是,但不限于,有线网络或无线网络。
在本实施例中,处理模块11、通信模块13、存储模块12以及芯片管控装置100各个元件之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
在本实施例中,用户终端20可理解为普通用户使用的终端设备,管理终端30可理解为管理员持有的终端设备。通常而言,管理终端30对应的用户权限高于用户终端20对应的用户权限。用户终端20\管理终端30可以是,但不限于,个人电脑(Personal Computer,PC)、平板电脑、个人数字助理(Personal Digital Assistant,PDA)等。
请参照图3,本申请还提供一种芯片管控方法,可以应用于上述的服务器10,由服务器10执行或实现芯片管控方法中的各步骤。方法可以包括步骤S210至S230,如下:
步骤S210,根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区;
步骤S220,根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配;
步骤S230,从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同。
在本实施例中,通过建立的分区与芯片类型的绑定关系,当在执行分区对应的任务时,可以自动基于该绑定关系确定用于执行该任务的目标芯片,使得所执行的任务所需运算资源与处理芯片的运算资源相匹配,改善集群中运算资源分配不平衡的问题。
下面将对方法中的各步骤进行详细阐述:
步骤S210,根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区。
在本实施例中,待处理任务可以为需要利用处理芯片集群进行运算处理的任务。例如,待处理任务可以是但不限于对深度学习模型进行训练的任务、利用经过训练的深度学习模型进行数据处理的任务。其中,深度学习模型为包括但不限于循环神经网络(Recurrent Neural Network,RNN)模型、深度卷积神经网络模型(比如,AlexNet模型)。
待处理任务可以根据实际情况进行设置。例如,待处理任务可以为利用神经网络模型,对图像识别进行训练、测试的任务。图像识别可以为对图像中的物体的类别进行分类,或者对图像中的指定目标进行检测。指定目标可以根据实际情况进行设置,例如,指定目标可以为人、猫、狗,或其他物品等。
在本实施例中,待处理任务中可以预先添加有相应的分区参数,分区参数用于确定该待处理任务的目标分区。其中,分区(zone)的功能作用与k8s(一种开源的容器编排系统)中的namespace(命名空间)相类似。可理解地,命名空间为一个由程序设计者命名的内存区域,程序设计者可以根据需要指定一些有名字的空间域,将一些全局实体分别放在各个命名空间中,从而与其他全局实体分隔开来。同样地,分区可以建立一些互相分隔的作用域,并把一些全局实体分隔开来。
待处理任务可以由用户(研发人员)根据实际任务需求而创建。用户在创建了待处理任务后,可以将待处理任务发送至服务器10,服务器10便可以基于待处理任务中的分区参数确定与待处理任务对应的目标分区。其中,在创建待处理任务期间,服务器10可以记录创建该待处理任务的用户的用户信息。该用户信息可以包括但不限于用户的用户账号、用户的身份标识号码(Identity Document)等信息,以便于服务器10基于用户信息确定用户的权限。
可理解地,在步骤S210之前,可以已经存在完成建立的待处理任务。若在执行步骤S210时,当前不存在待处理任务,则在执行步骤S210之前,方法还可以包括:基于接收的操作指令创建待处理任务;对所述待处理任务添加指定分区,其中,所述指定分区与对应的芯片类型相绑定。
在本实施例中,操作指令为用户通过用户终端20向服务器10发送的操作指令。可理解地,该操作指令为用户根据需要创建的任务需求,由用户操作用户终端20,并由用户终端20生成的用于创建待处理任务的指令。服务器10在接收到该操作指令后,便可以基于该操作指令创建得到待处理任务。另外,在创建得到待处理任务后,用户可以通过用户终端20为该待处理任务添加相应的分区参数。其中,分区参数可理解为分区的标识或分区名称。为该待处理任务添加相应的分区参数即为对待处理任务指定相应的分区。在为该待处理任务添加相应的分区参数后,服务器10在执行该任务时,便可以基于分区参数确定该任务的目标分区。
其中,对所述待处理任务添加指定分区时,需要结合与分区绑定的处理芯片的额定运算资源,以使待处理任务的所需运算资源与待处理任务的分区对应的处理芯片的运算资源相匹配。处理芯片的运算资源即为处理芯片的额定运算资源,或者称为处理芯片在满载下的运算能力。芯片类型与处理芯片的额定运算资源相对应。处理芯片的额定运算资源可理解为处理芯片在满负荷时的运算能力。
在本实施例中,处理芯片的芯片类型与该处理芯片的额定运算资源相对应,分区与芯片类型可以预先建立有绑定关系。分区与芯片类型之间的绑定关系可理解为分区与处理芯片之间建立有绑定关系。在对待处理任务添加分区参数时,与分区绑定的处理芯片的额定运算资源,与选择该分区的待处理任务的运算资源相匹配。基于此,可以使得执行该待处理任务期间,所选择的处理芯片的额定运算资源与待处理任务所需的运算资源相匹配,从而改善运算资源分配不均衡的问题。
其中,处理芯片的额定运算资源与选择该分区的待处理任务的运算资源相匹配,可理解为处理芯片的额定运算能力(该额定运算能力可以简称为S0)与执行该待处理任务所需要的运算能力(该运算能力简称为S1)的比值在指定范围内。该指定范围可以根据实际情况进行设置,例如的取值范围可以为大于或等于1的一个取值范围,例如,指定范围为1至2之间(包括1、2)的任意一比值。当/>的取值范围为指定范围内时,即表示处理芯片的额定运算资源与选择该分区的待处理任务的运算资源相匹配。当然,该指定范围还可以为其他取值范围,这里不再赘述。
在本实施例中,对所述待处理任务添加指定分区,可以包括:根据所述操作指令中携带的用户信息,确定与所述用户信息对应的用户权限及与所述用户权限对应的分区集合;从所述分区集合中确定所述指定分区;将所述指定分区添加于所述待处理任务中。
在创建待处理任务时,操作指令中可以携带用户的用户信息,服务器10可以预先存储有用户信息与用户权限之间的映射关系,不同的用户信息对应有相应的用户权限,其对应关系可以根据实际情况进行设置,这里不做具体限定。其中,用户权限为管理员基于用户的类型或用户的实际需求,为用户分配的用户权限。用户权限与用户能够选择的分区集合对应。
可理解地,在创建待处理任务期间,在对待处理任务指定分区时,每个用户仅能从自身的用户权限对应的分区集合中,选择相应的分区/分区参数,以为待处理任务指定相应的分区。对每个用户而言,若与分区集合绑定的处理芯片的运算资源无法满足待处理任务的所需运算资源,用户可以向管理员申请与当前所需运算资源匹配的分区,由管理员为该用户更改用户权限。基于此,有利于保证在用户在创建待处理任务期间,管理员能够灵活更改用户权限,以使服务器10能够自动为待处理任务指定与所需运算资源匹配的分区。
在本实施例中,从所述分区集合中确定所述指定分区,包括:根据所述待处理任务的所需运算资源,从所述分区集合中确定与所述所需运算资源匹配的处理芯片所绑定的分区作为所述指定分区。
待处理任务的所需运算资源可理解为处理芯片执行该待处理任务时所需的运算力,该所需运算资源可以由用户人工估计,或者由用户终端20/服务器10根据待处理任务的内容运算得到。在确定出待处理任务的所需运算资源后,服务器10便可以自动从分区集合中选择与该所需运算资源相匹配的分区,并将所选择的分区的分区参数添加在待处理任务中。其中,不同的分区的分区参数不相同,分区参数可以是但不限于分区的名称、标识等,用于供服务器10基于分区参数确定相应的目标分区。
可理解地,通过服务器10基于待处理任务的所需运算资源,自动为待处理任务添加相应的分区参数,从而使得后续在执行该待处理任务期间,可以基于分区参数确定目标分区,进而确定与目标分区绑定的目标芯片。基于此,无需人工为待处理任务手动添加分区,从而有利于提高添加分区的效率,简化处理流程。其中,目标芯片即为用于执行该待处理任务,且额定运算资源与待处理任务的所需运算资源相匹配的处理芯片。
在本实施例中,在步骤S210之前,所述方法还包括:建立并存储处理芯片的芯片类型与分区的绑定关系。
处理芯片的芯片类型与处理芯片的额定运算资源相对应。建立分区与芯片类型之间的绑定关系,即为建立分区与处理芯片的额定运算资源之间的绑定关系,以便于基于服务器10基于待处理任务的分区确定与待处理任务的所需运算资源匹配的目标芯片。
请参照图4,建立的绑定关系的芯片类型与分区可以如图4所示。该绑定关系可以理解为映射关系,图4可理解为分区与芯片类型之间的映射表的示意图。另外,图4中所示的分区与芯片类型为示例,在其他方式中,分区与芯片类型还可以为不同于图4中所示的分区与芯片类型。其中,一个分区通常与一个芯片类型相绑定,用于对该分区的待处理任务的运算资源进行限额。可理解地,通过将待处理任务与分区关联,分区与处理芯片关联,便可以使得待处理任务与处理芯片相绑定,从而达到运算资源限额的目的,避免运算资源较大的处理芯片被用于执行所需运算量较小的任务,从而使得运算资源无法得到充分利用。
在图4中,分区包括A、B、C、…。芯片类型包括类型I、类型II、类型III、…。其中,分区A与类型I相绑定,分区B与类型II相绑定,分区C与类型III相绑定,从而建立得到分区与芯片类型之间的绑定关系。可理解地,分区A、B、C、…,为对分区的示例性描述。类型I、类型II、类型III、…,为对芯片类型的示例性描述。在其他实施方式中,分区A、B、C、…,类型I、类型II、类型III、…,还可以以其他方式进行定义,对分区、芯片类型的定义方式可以根据实际情况进行定义,这里不再赘述。
可理解地,服务器10可以基于已有的分区、芯片类型,自动对分区、芯片类型进行绑定,然后得到如图4所示的绑定关系,并存储在服务器10中,以便于服务器10基于绑定关系为待处理任务选择相应的目标芯片。
步骤S220,根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配。
可理解地,服务器10预先存储有如图4所示的分区与芯片类型的绑定关系。当确定出待处理任务的分区后,便可以确定用于执行该待处理任务的处理芯片的芯片类型。例如,待处理任务的分区参数为A,即表示待处理任务的指定分为为分区A。在确定出待处理任务的分区为分区A时,便可以基于绑定关系,确定出于分区A对应的芯片类型为类型I。
步骤S230,从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同。
可理解地,目标芯片的数量可以为一个或多个,可以根据实际情况进行选择。在确定出芯片类型后,便可以基于芯片类型从处理芯片集群中,选择与芯片类型相同的一个或多个处理芯片作为目标芯片。例如,若确定出用于执行待处理任务的芯片类型为类型I时,类型I的处理芯片为用于执行待处理任务的候选芯片,服务器10在选择目标芯片时,可以直接从候选芯片中选择一个或多个处理芯片以作为目标芯片。
在本实施例中,所述方法还包括:基于接收的更改指令,在与用户权限对应的分区集合中添加指定分区,或者,在与所述用户权限对应的分区集合中删除对应的分区。
在本实施例中,管理员可以通过管理终端30对用户权限对应的分区集合进行更改。例如,管理终端30可以向服务器10发送更改指令,更改指令包括用于对相应用户权限对应的分区集合添加新的指定分区的第一指令,或者从相应用户权限对应的分区集合中删除相应的分区的第二指令。服务器10在接收到更改指令后,便可以对更改指令进行解析。例如,更改指令为第一指令,则服务器10可以在与用户权限对应的分区集合中添加指定分区。若更改指令为第二指令,则服务器10可以在与用户权限对应的分区集合中删除对应的分区。
可理解地,若在用户的用户权限管理范围内,分区集合中各个分区所绑定的处理芯片的运算资源无法满足当前待处理任务时,该用户可以向管理员申请与当前待处理任务的所需运算资源相匹配的处理芯片的分区,然后由管理员通过管理终端30对该用户权限对应的分区集合进行更改,以将所申请的分区添加在该分区集合中。当用户所申请的分区添加在该用户的分区集合中之后,服务器10便可以为当前待处理任务匹配到与所需运算资源相匹配的处理芯片。
基于上述设计,在企业拥有多种类型的处理芯片的情况下,在对运算资源进行额度管理期间,可以保证高算力卡的运算资源能够得到充分利用,从而改善运算资源分配不均衡的管理漏洞,使集群运算资源的利用率得到更大的提高。
请参照图5,本申请实施例还提供一种芯片管控装置100,可以应用于上述的服务器10中,用于执行或实现上述的芯片管控方法中的各步骤。该芯片管控装置100包括至少一个可以软件或固件(Firmware)的形式存储于存储模块12中或固化在服务器10操作系统(Operating System,OS)中的软件功能模块。该芯片管控装置100可以包括分区确定单元110、芯片类型确定单元120及目标确定单元130。
分区确定单元110,用于根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区。
芯片类型确定单元120,用于根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配。
目标确定单元130,用于从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同。
可选地,芯片管控装置100还可以包括:创建单元及分区指定单元。在分区确定单元110确定所述待处理任务的目标分区之前,创建单元用于基于接收的操作指令创建待处理任务;分区指定单元用于对所述待处理任务添加指定分区,其中,所述指定分区与对应的芯片类型相绑定。
在本实施例中,分区指定单元还用于:根据所述操作指令中携带的用户信息,确定与所述用户信息对应的用户权限及与所述用户权限对应的分区集合;从所述分区集合中确定所述指定分区;将所述指定分区添加于所述待处理任务中。
在本实施例中,分区指定单元还可以用于:
根据所述待处理任务的所需运算资源,从所述分区集合中确定与所述所需运算资源匹配的处理芯片所绑定的分区作为所述指定分区。
可选地,芯片管控装置100还可以包括分区更改单元,用于基于接收的更改指令,在与用户权限对应的分区集合中添加指定分区,或者,在与所述用户权限对应的分区集合中删除对应的分区。
可选地,芯片管控装置100还可以包括关系建立单元,用于在分区确定单元110确定所述待处理任务的目标分区之前,建立并存储处理芯片的芯片类型与分区的绑定关系。
需要说明的是,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的服务器10、芯片管控方法的具体工作过程,可以参考前述方法中的各步骤对应过程,在此不再过多赘述。
另外,图2所示的结构仅为服务器10的一种结构示意图,服务器10还可以包括比图2所示更多的组件。图2中所示的各组件可以采用硬件、软件或其组合实现。
在本实施例中,处理模块11可以是一种集成电路芯片,具有信号的处理能力。上述处理模块11可以是通用处理器。例如,该处理器可以是中央处理器(Central ProcessingUnit,CPU)、图形处理器(Graphics Processing Unit,GPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。
存储模块12可以是,但不限于,随机存取存储器,只读存储器,可编程只读存储器,可擦除可编程只读存储器,电可擦除可编程只读存储器等。在本实施例中,存储模块12可以用于存储分区与芯片类型之间的绑定关系。当然,存储模块12还可以用于存储程序,处理模块11在接收到执行指令后,执行该程序。
通信模块13用于通过网络建立服务器10与用户终端20、管理终端30的通信连接,并通过网络收发数据。
本申请实施例还提供一种计算机可读存储介质。可读存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行如上述实施例中所述的芯片管控方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现,基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
综上所述,本申请提供一种芯片管控方法、装置、服务器及可读存储介质。方法包括:根据获取的待处理任务的分区参数,确定待处理任务的目标分区;根据分区与芯片类型的绑定关系,确定与目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与分区所对应的处理芯片的运算资源相匹配;从多个处理芯片中确定至少一个目标芯片,用于执行待处理任务,其中,目标芯片的芯片类型与目标类型相同。在本方案中,通过建立的分区与芯片类型的绑定关系,当在处理分区对应的任务时,可以自动基于该绑定关系确定用于执行该任务的目标芯片,使得所执行的任务所需运算资源与处理芯片的运算资源相匹配,改善集群中运算资源分配不平衡的问题。
在本申请所提供的实施例中,应该理解到,所揭露的装置、系统和方法,也可以通过其它的方式实现。以上所描述的装置、系统和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种芯片管控方法,其特征在于,所述方法包括:
根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区;
根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配;
从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同;
所述方法还包括:
基于接收的更改指令,在与用户权限对应的分区集合中添加指定分区,其中,所述更改指令通过管理终端在同意用户发出的申请后生成,用户发出申请的条件为:用户权限对应分区集合各个分区所绑定的处理芯片的运算资源无法满足当前待处理任务,所述用户权限与用户选择的分区集合对应。
2.根据权利要求1所述的方法,其特征在于,在确定所述待处理任务的目标分区之前,所述方法还包括:
基于接收的操作指令创建待处理任务;
对所述待处理任务添加指定分区,其中,所述指定分区与对应的芯片类型相绑定。
3.根据权利要求2所述的方法,其特征在于,对所述待处理任务添加指定分区,包括:
根据所述操作指令中携带的用户信息,确定与所述用户信息对应的用户权限及与所述用户权限对应的分区集合;
从所述分区集合中确定所述指定分区;
将所述指定分区添加于所述待处理任务中。
4.根据权利要求3所述的方法,其特征在于,从所述分区集合中确定所述指定分区,包括:
根据所述待处理任务的所需运算资源,从所述分区集合中确定与所述所需运算资源匹配的处理芯片所绑定的分区作为所述指定分区。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于接收的更改指令,在与所述用户权限对应的分区集合中删除对应的分区。
6.根据权利要求1所述的方法,其特征在于,在确定所述待处理任务的目标分区之前,所述方法还包括:
建立并存储处理芯片的芯片类型与分区的绑定关系。
7.根据权利要求1-6中任意一项所述的方法,其特征在于,所述处理芯片包括图形处理器。
8.一种芯片管控装置,其特征在于,所述装置包括:
分区确定单元,用于根据获取的待处理任务的分区参数,确定所述待处理任务的目标分区;
芯片类型确定单元,用于根据分区与芯片类型的绑定关系,确定与所述目标分区对应的芯片类型作为目标类型,其中,在具有绑定关系的分区与芯片类型中,分区对应的任务的所需运算资源与所述分区所对应的处理芯片的运算资源相匹配;
目标确定单元,用于从多个处理芯片中确定至少一个目标芯片,用于执行所述待处理任务,其中,所述目标芯片的芯片类型与所述目标类型相同;
还包括分区更改单元,用于基于接收的更改指令,在与用户权限对应的分区集合中添加指定分区,或者,在与所述用户权限对应的分区集合中删除对应的分区,其中,所述更改指令通过管理终端在同意用户发出的申请后生成,用户发出申请的条件为:用户权限对应分区集合各个分区所绑定的处理芯片的运算资源无法满足当前待处理任务,所述用户权限与用户选择的分区集合对应。
9.一种服务器,其特征在于,所述服务器包括相互耦合的存储器、处理器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述服务器执行如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-6中任意一项所述的方法。
CN202010445692.6A 2020-05-22 2020-05-22 芯片管控方法、装置、服务器及可读存储介质 Active CN111597052B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010445692.6A CN111597052B (zh) 2020-05-22 2020-05-22 芯片管控方法、装置、服务器及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010445692.6A CN111597052B (zh) 2020-05-22 2020-05-22 芯片管控方法、装置、服务器及可读存储介质

Publications (2)

Publication Number Publication Date
CN111597052A CN111597052A (zh) 2020-08-28
CN111597052B true CN111597052B (zh) 2024-03-01

Family

ID=72186399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010445692.6A Active CN111597052B (zh) 2020-05-22 2020-05-22 芯片管控方法、装置、服务器及可读存储介质

Country Status (1)

Country Link
CN (1) CN111597052B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797866A (zh) * 2016-05-31 2018-03-13 广东欧珀移动通信有限公司 处理器资源的分配方法及移动终端和介质产品
CN110489232A (zh) * 2019-08-12 2019-11-22 新华三技术有限公司成都分公司 资源隔离方法、装置、电子设备及存储介质
CN110569129A (zh) * 2019-09-12 2019-12-13 北京明略软件系统有限公司 资源分配方法及装置、存储介质、电子装置
CN111124476A (zh) * 2018-10-31 2020-05-08 阿里巴巴集团控股有限公司 业务规则配置和创建方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109729106B (zh) * 2017-10-27 2021-07-16 伊姆西Ip控股有限责任公司 处理计算任务的方法、系统和计算机程序产品

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797866A (zh) * 2016-05-31 2018-03-13 广东欧珀移动通信有限公司 处理器资源的分配方法及移动终端和介质产品
CN111124476A (zh) * 2018-10-31 2020-05-08 阿里巴巴集团控股有限公司 业务规则配置和创建方法及装置
CN110489232A (zh) * 2019-08-12 2019-11-22 新华三技术有限公司成都分公司 资源隔离方法、装置、电子设备及存储介质
CN110569129A (zh) * 2019-09-12 2019-12-13 北京明略软件系统有限公司 资源分配方法及装置、存储介质、电子装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cheng-Liang Hsieh ,.High performance multi-field packet classification using bucket filtering and GPU processing.《ANCS '14: Proceedings of the tenth ACM/IEEE symposium on Architectures for networking and communications systems》.2014,233-234. *
于炯 ; 蒲勇霖 ; 鲁亮 ; 刘粟 ; .分布式处理平台节能计算研究综述.新疆大学学报(自然科学版).2018,(第04期),15-27. *

Also Published As

Publication number Publication date
CN111597052A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN113243005A (zh) 按需网络代码执行系统中的基于性能的硬件仿真
WO2016090946A1 (zh) 一种虚拟数据中心资源映射方法和设备
US8572621B2 (en) Selection of server for relocation of application program based on largest number of algorithms with identical output using selected server resource criteria
CN109729106B (zh) 处理计算任务的方法、系统和计算机程序产品
CN110908770A (zh) 虚拟机的运行及创建方法、虚拟机及虚拟机化管理平台
CN108255707B (zh) 测试用例的开发角色创建方法、装置、设备及存储介质
CN112035238A (zh) 任务调度处理方法、装置、集群系统及可读存储介质
CN104980454A (zh) 一种资源数据共享方法、服务器及系统
US20230153158A1 (en) Method, apparatus, system, and storage medium for performing eda task
CN109189572B (zh) 一种资源预估方法及系统、电子设备和存储介质
CN111782383A (zh) 任务分配方法、服务器、电子终端及计算机可读存储介质
CN109933430B (zh) 分配图形处理器的方法和装置
CN111885184A (zh) 高并发场景下热点访问关键字处理方法和装置
CN110661828A (zh) 一种资源分配方法、装置、服务器及可读存储介质
CN113626173A (zh) 调度方法、装置及存储介质
CN111597052B (zh) 芯片管控方法、装置、服务器及可读存储介质
CN113467931A (zh) 算力任务的处理方法、装置及系统
CN112860421B (zh) 用于作业处理的方法、设备和计算机程序产品
CN112631994A (zh) 数据迁移方法及系统
CN110502343B (zh) 一种资源分配方法、系统、装置及计算机可读存储介质
CN115629951B (zh) 一种任务全链路追踪方法、第一节点、链路系统及介质
CN111709723A (zh) Rpa业务流程智能处理方法、装置、计算机设备和存储介质
CN111988429A (zh) 算法调度方法以及系统
CN116881003A (zh) 资源分配方法、装置、服务设备及存储介质
JPWO2016084327A1 (ja) 資源予測装置、資源予測方法、資源予測プログラムおよび分散処理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 501, block a, Haier International Plaza, 939 Zhenwu Road, Jimo Economic Development Zone, Qingdao, Shandong 266200

Applicant after: Qingdao Chuangxin Qizhi Technology Group Co.,Ltd.

Address before: Room 04, 02 / F, building 4, software industry base, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN AINNOVATION TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 501, block a, Haier International Plaza, 939 Zhenwu Road, Jimo Economic Development Zone, Qingdao, Shandong 266200

Applicant after: Qingdao Chuangxin Qizhi Technology Group Co.,Ltd.

Address before: Room 501, block a, Haier International Plaza, 939 Zhenwu Road, Jimo Economic Development Zone, Qingdao, Shandong 266200

Applicant before: Qingdao Chuangxin Qizhi Technology Group Co.,Ltd.

GR01 Patent grant
GR01 Patent grant