CN115220916B - 视频智能分析平台的自动算力调度方法、装置及系统 - Google Patents

视频智能分析平台的自动算力调度方法、装置及系统 Download PDF

Info

Publication number
CN115220916B
CN115220916B CN202210845011.4A CN202210845011A CN115220916B CN 115220916 B CN115220916 B CN 115220916B CN 202210845011 A CN202210845011 A CN 202210845011A CN 115220916 B CN115220916 B CN 115220916B
Authority
CN
China
Prior art keywords
task
calculation
computing
target
hardware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210845011.4A
Other languages
English (en)
Other versions
CN115220916A (zh
Inventor
林政涛
刘涛
王芸
孙光宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Tongjian Technology Co ltd
Original Assignee
Zhejiang Tongjian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Tongjian Technology Co ltd filed Critical Zhejiang Tongjian Technology Co ltd
Priority to CN202210845011.4A priority Critical patent/CN115220916B/zh
Publication of CN115220916A publication Critical patent/CN115220916A/zh
Application granted granted Critical
Publication of CN115220916B publication Critical patent/CN115220916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及视频智能分析平台技术领域,解决了目前智能分析平台无法充分调用网络内各设备算力的技术问题,尤其涉及一种视频智能分析平台的自动算力调度方法,该方法包括以下步骤:S1、根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备;S2、获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列;S3、获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求;S4、根据计算任务目标定义计算任务模型的计算等级。本发明达到了根据最优选择快速调度网络内各设备算力资源的目的,能够根据用户上传的计算任务自动分配算力匹配度最高的硬件设备。

Description

视频智能分析平台的自动算力调度方法、装置及系统
技术领域
本发明涉及视频智能分析平台技术领域,尤其涉及一种视频智能分析平台的自动算力调度方法、装置及系统。
背景技术
目前城市监控成熟度高,社会面有很多的摄像头,并且摄像头每年都在更新发展和替换,配合视频智能分析平台能够对社会环境进行安全防控,而但是,市面上的视频智能分析平台有云端计算的、边缘计算的、边缘和中心结合的,例如市一级的视频智能分析任务,需要计算几十万个社会面的摄像头,如果只使用中心来计算,那么设备的网络建设成本会大幅度提高。
而且在智能分析平台的应用当中,很多时候都会有重复建设和资源浪费的情况,导致视频智能分析不能很好的普及和提升社会环境,因为没有一个很好的自动调度算力的视频智能分析平台,无法充分利用网络内的各个设备,而导致算力不能充分得到利用。
发明内容
针对现有技术的不足,本发明提供了一种视频智能分析平台的自动算力调度方法、装置及系统,解决了目前智能分析平台无法充分调用网络内各设备算力的技术问题,达到了根据最优选择快速调度网络内各设备算力资源的目的,能够根据用户上传的计算任务自动分配算力匹配度最高的硬件设备。
为解决上述技术问题,本发明提供了如下技术方案:一种视频智能分析平台的自动算力调度方法,该方法包括以下步骤:
S1、根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备;
S2、获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列;
S3、获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求;
S4、根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务;
S5、根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备;
S6、从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备进行计算任务目标。
进一步地,在步骤S2中,任务执行状态包括各中心设备和边缘设备是否为空闲状态以及执行当前任务直到结束的总时长;
得出中心设备和边缘设备执行当前任务直到结束总时长的方法包括以下步骤:
S21、获取完成当前计算任务关键节点的有序集合;
S22、从起始节点A1出发,遍历相邻关键节点中起始节点A1与关键节点A2间的各个任务所需计算时长完成时长最小值中的最大值D;
S23、设置最大值D为起始节点A1和关键节点A2路径的目标截止时长,并根据硬件设备的负载情况和关键节点资源,以最小代价Cost对应的关键节点进行计算所需完成时长;
S24、返回步骤S22,依次执行有序集合中的相邻关键节点的计算所需完成时长,直至An任务完成;
S25、计算Di即为执行当前任务直到结束的总时长。
进一步地,有序集合为起始节点至终点节点上所包含的所有关键节点,其中关键节点为当前计算任务所包含的所需要计算的各个子任务,当前计算任务A中包含A1、A2、A3…An所需要计算的各个子任务,其中A1、A2、A3…An为关键节点,A1为起始节点,An为终点节点。
进一步地,在步骤S5中,根据计算等级选取与算力相匹配的硬件设备集合的方法包括以下步骤:
S51、根据多个硬件设备相对应的设备信息列表将已有的算力数据取最大和最小值,在最大值与最小值的区间内进而划分等级;
S52、对各硬件设备对应的算力数据进行定级,并转化为优序数;
S53、计算得出与正、负理想解对应的向量;
S54、分别计算出每个硬件设备对应的投影值;
S55、根据计算得出每个硬件设备的相对贴近度;
S56、根据相对贴近度的值进行大小排序,并据相对贴近度的值对每个硬件设备进行星级评定,最终得出结论;
S57、选取星级评定与计算等级相匹配的多个硬件设备构成集合。
进一步地,设备信息列表包括核心处理器的型号、核心处理器核数、核心处理器频率、特殊计算机载体型号、计算设备显存、操作系统、除操作系统外存储空间、设备网口数量、设备网口宽带大小、设备功率。
进一步地,任务模型的定义包括模型功能、模型输入数据、模型阶段数、模型算力、模型显存要求、模型体积、模型拆分层名。
进一步地,任务计算要求为定义任务,包括任务功能、任务内存需求、任务存储需求、任务网络需求、任务分析频率要求、任务角色、任务周期、工作时间、工作时长。
本发明还提供了一种用于实现上述自动算力调度方法的装置,包括:
硬件设备定义模块,所述硬件设备定义模块用于根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备;
第一获取模块,所述第一获取模块用于获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列;
第二获取模块,所述第二获取模块用于获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求;
计算等级定义模块,所述计算等级定义模块用于根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务;
硬件设备集合选取模块,所述硬件设备集合选取模块用于根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备;
调取模块,所述调取模块用于从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备进行计算任务目标。
本发明还提供了一种用于实现上述自动算力调度方法的系统,包括:处理器、存储器以及输入输出接口,
所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行上述的自动算力调度方法。
借由上述技术方案,本发明提供了一种视频智能分析平台的自动算力调度方法、装置及系统,至少具备以下有益效果:
1、本发明达到了根据最优选择快速调度网络内各设备算力资源的目的,能够根据用户上传的计算任务自动分配算力匹配度最高的硬件设备。
2、本发明能够管理和自动分配所有连接在此平台的设备,不论设备是CPU设备\GPU设备\特殊AI边缘计算设备等能都最大程度的分配计算任务,使得资源利用最大化和最优。
3、本发明能够对局域网内的所有硬件设备进行星级评定,并根据星级去选取与计算等级相应的硬件设备,由此构成硬件设备集合,该集合中所包含的硬件设备都与计算等级相应,能够为智能分析平台提供多个选择方案,并根据集合中各个硬件设备的状态进行择优分配,从而能够提高智能分析平台对于待计算任务的合理分配,提高对于局域网内各设备相应算力的调度能力。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明自动算力调度方法的流程图;
图2为本发明得出执行当前任务直到结束总时长的流程图;
图3为本发明执行当前任务直到结束总时长方法的示意图;
图4为本发明根据计算等级选取与算力相匹配的硬件设备集合方法的流程图;
图5为本发明硬件设备的定义参考示例图;
图6为本发明任务模型的定义参考示例图;
图7为本发明任务计算要求的定义参考示例图;
图8为本发明自动算力调度装置的原理框图。
图中:100、硬件设备定义模块;200、第一获取模块;300、第二获取模块;400、计算等级定义模块;500、硬件设备集合选取模块;600、调取模块。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。借此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
请参照图1-图8,示出了根据本发明实施例的一种实施方式,达到了根据最优选择快速调度网络内各设备算力资源的目的,能够根据用户上传的计算任务自动分配算力匹配度最高的硬件设备,能够管理和自动分配所有连接在此平台的设备,不论设备是CPU设备\GPU设备\特殊AI边缘计算设备等能都最大程度的分配计算任务,使得资源利用最大化和最优。
请参照图1,一种视频智能分析平台的自动算力调度方法,该方法包括以下过程:
S1、根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备,设备信息列表中包含各中心设备和边缘设备的各项参数,请参照图5,主要参数为核心处理器的型号、核心处理器核数、核心处理器频率、特殊计算机载体型号、计算设备显存、操作系统、除操作系统外存储空间、设备网口数量、设备网口宽带大小、设备功率等参数,智能分析平台根据这些信息定义局域网中的各设备,并根据各设备的定义进行统计和登录,用于后续的任务分配和调度。
S2、获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列,在当前局域网内的各个中心设备和边缘设备之间均与智能分析平台建立通信,并作为其之间数据通信的载体,当某一个中心或边缘设备连接入局域网络时会自动访问智能分析平台,智能分析平台获取当前网络域内各个中心或边缘设备的情况以及自身需要计算的任务,而中心或边缘设备利用多线程实时的将自身当前的当前计算任务状态、计算任务队列、硬件信息、设备带宽占用、文件存储占用内存使用情况、人工智能算力利用率等信息上传给智能分析平台。
各个设备的任务执行状态主要为设备是否处于空闲状态,或者设备执行当前任务直到结束的总时长,设备是否处于空闲状态较为容易判定,通过相应设备所上传至智能分析平台的信息即可知晓,在此处主要为需要清楚设备执行当前任务直到结束的总时长,若处于空闲状态或者当前计算任务结束预计时间短,则能够作为优先分配任务模型的依据。
综合考虑该设备相应的待计算任务队列,因为在日常分配过程中,计算任务过多则会导致出现排队的现象,待计算任务队列包含该设备所需要处理的计算任务总数,根据任务模型的优先度进行排列,若待计算任务的数量多则会进行标记,随后将新的任务模型分配至另外的设备任务队列中。
请参照图2,在步骤S2中,任务执行状态包括各中心设备和边缘设备是否为空闲状态以及执行当前任务直到结束的总时长,其中,得出中心设备和边缘设备执行当前任务直到结束总时长的方法包括以下步骤:
S21、获取完成当前计算任务关键节点的有序集合,有序集合为起始节点至终点节点上所包含的所有关键节点,其中关键节点为当前计算任务所包含的所需要计算的各个子任务,以当前计算任务A为例,A中包含A1、A2、A3…An所需要计算的各个子任务,其中A1、A2、A3…An即为关键节点,A1为起始节点,An为终点节点。
S22、从起始节点A1出发,遍历相邻关键节点中起始节点A1与关键节点A2间的各个任务所需计算时长完成时长最小值中的最大值D。
S23、设置最大值D为起始节点A1和关键节点A2路径的目标截止时长,并根据硬件设备的负载情况和关键节点资源,以最小代价Cost对应的关键节点进行计算所需完成时长。
S24、返回步骤S22,依次执行有序集合中的相邻关键节点的计算所需完成时长,直至An任务完成。
S25、计算Di即为执行当前任务直到结束的总时长,Di为与关键节点An-1与An间的各个任务进行计算所需完成时长最小值中的最大值,其中,最大值Di的计算公式为:
该方法流程中首先是找出n个关键路径节点所需要的计算时长,再基于关键路径节点的截止时间寻找e条弧路径上代价最低的计算完成时长,该算法的时间复杂度为O(n+e)。
请参照图3,为执行当前任务直到结束总时长的方法的示意图,从关键节点A1到A6是一个具有先后完成各关键节点计算时长顺序的工作示例图,每个任务框后数字代表为当前设备提供计算服务的具体任务副本数量(即相邻关键节点间对应的弧数量),每个任务完成时长和所在关键节点部署的代价如表1所示,该表中任务1与实例1组成的有序对<6,8>表示选择关键节点A1计算的完成时长为6,需要消耗的代价为8。
任务 实例1 实例2 实例3
任务1 <6,8> <6,7> <7,8>
任务2 <6,7> <4,6> <4,4>
任务3 <5,7> <6,7> -
任务4 <8,9> <7,8> -
任务5 <4,6> <5,6> -
任务6 <9,8> <7,7> <9,8>
任务7 <9,7> - -
任务8 <6,8> - -
表1有序对数值的参考表
在得出中心设备和边缘设备执行当前任务直到结束总时长的方法中,需要定义每个子任务的开始时间为ST,结束时间为ET。对于每一个非入口任务An而言,它的最早开始时间必须在它的所有前驱任务全部完成之后。定义ST(An)为An的开始时间,计算公式为:
其中,pre(An)是An的前驱任务的集合,ET(Aj)表示的是最后一个子任务Aj的完成时间,故An的最早开始执行时间是其所有前驱任务完成时间的最大值。
而任务An的结束时间可由一下公式计算得出:
ET(An)=ST(An)+runtime(An)
其中,runtime(An)表示实例为任务An执行需要的时长。
而最终所需要得出的是最后一个出口子任务Aj完成时间ET(Aj)的最小化,可通过下述公式完成:
minET(Aj)=min{ST(Aj)+runtime(An)}
此外,考虑到同一设备可能会对应着多个不同数量的实例(即待计算任务),负载情况不同的实例在完成子任务计算时的代价也会存在区别。因此,在最迟完成时间最小化的约束下,完成当前计算任务还需要尽可能择优选取负载低的实例进行计算。
该方法能够对硬件设备执行当前任务直到结束的总时长进行计算,并能够在出现特殊计算任务时选择相应的硬件设备,同时在能够预知当前任务计算所需的剩余时长,能够选择最快结束当前任务的硬件设备,从而能够便于智能分析平台更加合理的分派至该硬件设备,使待计算任务能够快速完成,同时提高智能分析平台对于网络内各硬件设备的充分利用,提升对于算力资源利用度。
S3、获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求,任务模型由用户通过外设端口将待计算的任务上传至智能分析平台中,请参照图6,任务模型的定义参数主要包括模型功能、模型输入数据、模型阶段数、模型算力、模型显存要求、模型体积、模型拆分层名等定义信息,以上各种定义信息需要用户在创建待计算任务时进行对应填写,这些定义信息用于计算任务模型的特征记录,同样用于后续智能分析平台的任务分配和管理。
请参照图7,任务计算要求由用户同任务模型同时上传至智能分析平台中,任务计算要求是用户根据待计算任务的需求进行定义任务,其中包括任务功能、任务内存需求、任务存储需求、任务网络需求、任务分析频率要求、任务角色、任务周期、工作时间、工作时长等定义信息。
S4、根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务,任务目标分为三个等级,一级、二级、三级目标任务对应待计算任务的优先等级,若是需要加快完成处理的任务,其中对应定义任务中的任务周期、工作时间和工作时长,智能分析平台在获得任务模型以及任务计算要求中的定义信息后,能够对待计算任务进行优先度判断,并结合待计算任务的复杂度、特定计算需求等信息分配各相应的中心设备或者边缘设备,一级目标任务对应最高的优先度,二级目标任务次之、三级目标任务为普通待计算任务。
S5、根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备,由于硬件设备是根据设备信息列表进行定义的,在设备信息列表中包含该中心设备或者边缘设备的各项参数,其中能够体现该设备的算力,因此能够根据计算任务目标去选取相应的硬件设备,并且能够满足对计算任务目标的计算要求。
算力是中心设备或者边缘设备通过对数据进行处理后实现结果输出的一种能力,是衡量中心设备或者边缘设备计算能力的一个综合指标,数值越大代表综合计算能力越强。在服务器主板上,数据传输的顺序依次为中央处理器(Central Processing Unit,CPU)、内存、硬盘和网卡,若针对图形则需要图形处理器(Graphics Processing Unit,GPU)。所以,从广义上讲,中心设备或者边缘设备算力是一个包含计算、存储、传输(网络)等多个内涵的综合概念,是衡量数据中心计算能力的一个综合指标。
中心设备或者边缘设备由数据处理能力、数据存储能力和数据流通能力三项指标决定。其中,数据处理能力,在应对以大数据、AI人工智能为代表的新一代数字化技术产业趋势过程中,又可以区分为以CPU为代表的通用计算能力,和以GPU、AI芯片为代表的智能计算能力。前者主要用作执行一般任务,后者主要承担图形显示、大数据分析、信号处理、人工智能和物理模拟等计算密集型任务。综上,本实施例选取5个指标进行算力评估,分别为:通用算力、智能算力、算效能力、网络能力、存储能力。
通用算力:通用算力主要指由CPU为代表的通用计算能力,本实施例使用平均单机架“每秒浮点运算次数”来评估数据中心的通用算力,单位采用TFLOPS(FP32,单精度浮点算力)。
智能算力:智能算力主要指由GPU、AI芯片为代表的智能计算能力,本实施例使用平均单机架“每秒浮点运算次数”来评估数据中心的智能算力,单位采用TFLOPS(FP32,单精度浮点算力)。
算效能力:数据中心算效(CE)为数据中心算力与所有IT设备功耗的比值,是同时考虑数据中心计算性能与功率的一种效率,即“数据中心IT设备每瓦功耗所产生的算力”,本实施例算效的单位采用GFLOPS/W(FP32),其中数据中心指代本实施例中的中心设备或者边缘设备。
其中,CP表示算力,为通用算力与智能算力的加和。
网络能力:网络能力有很多衡量指标,本实施例主要采用网络带宽速度来衡量网络的性能,单位为Mbit/s(兆比特每秒),即每秒传输的比特位数。
存储能力:存储能力主要由存储容量、存储性能、存储安全3方面共同决定,本实施例采用每秒读写次数(Input/Output Operatiobs Per Second,IOPS)来衡量存储的性能,即每秒的读写次数。
请参照图4,在步骤S5中,根据计算等级选取与算力相匹配的硬件设备集合的方法包括以下步骤:
S51、根据多个硬件设备相对应的设备信息列表将已有的算力数据取最大和最小值,在最大值与最小值的区间内进而划分等级,一般越理想的一端标记等级数越高。
S52、对各硬件设备对应的算力数据进行定级,并转化为优序数,优序数为0-1之间的实数,具体按步骤S51划分的等级对各硬件设备对应的算力数据对号入座,确定相应的等级数,每个指标下,将不同的硬件设备两两对比,判断出一硬件设备在某指标下优于或劣于另一硬件设备的等级数,并通过优序数计算公式将各等级数转变到0-1之间,方便接下来处理。
S53、计算得出与正、负理想解对应的向量。
设Xp=[r-pj,rpj]和Xq=[r-qj,rqj]为集合X上的两个不确定等级变量,如果将Xp和Xq通过广义优序数转变为Xp=[ξ(r-pj),ξ(rpj)]和Xq=[ξ(r-qj),ξ(rqj)],其中ξ(r-pj)为r-pj经广义优序数化转化的值,ξ(rpj)为rpj经广义优序数化转化的值,ξ(r-qj)为r-qj经广义优序数化转化的值,ξ(rqj)为rqj经广义优序数化转化的值,Xp和Xq形成的向量定义为:
XpXq=[minξ(r-pj),maxξ(rpj)]
minξ(r-pj)=min(|ξ(r-qj)-ξ(r-pj)|,|ξ(rqj)-ξ(rpj)|)
maxξ(r-pj)=max(|ξ(r-qj)-ξ(r-pj)|,|ξ(rqj)-ξ(rpj)|)
令A=(a1,a1,…am}为方案集,C=(c1,c1,…cn}为属性集,将属性集cl(1≤l≤n)划分为5个等级,有等级比较集R={ri|i=-4,…,0,…,4,?},其中?表示两方案优劣关系不明的情况,i=4,已知两个等级变量分别为Xp=[r2,r3],Xq=[r3,r4];
借助等级优序数可以将Xp=[r2,r3],Xq=[r3,r4]转化为:
进而计算出Xp和Xq形成的向量为:
根据上述公式则能够计算得出与正、负理想解对应的向量。
S54、分别计算出每个硬件设备对应的投影值。
每个硬件设备对应投影值的计算,现以某一个硬件设备进行举例,其投影值的计算过程如下:
假设是第j个属性cj下备选方案Xi等级转换的信息。
首先,在j个属性下,将正负理想方案表示为:
其中,n为整体备选方案的数量。
其中,的值越大,说明备案方案Xi越接近正理想方案X+,反之则相反,据此可以对每个备选方案,通过各自投影值的计算进行相对应的优劣判断。
S55、根据计算得出每个硬件设备的相对贴近度。
通过步骤S54的计算,描述了备选方案与正、负理想方案之间的相似性,同时考虑了备选方案与正、负理想方案的距离(数值)和方向。为了使结果更加准确合理,需要将备选方案Xi与正、负理性方案X+、X-的投影相结合,用相对贴近度C(Xi)进行表示,通过下述公式进行计算:
其中,分别表示向量X-Xi到向量X-X+到向量XiX+的投影值。
S56、根据相对贴近度的值进行大小排序,并据相对贴近度的值对每个硬件设备进行星级评定,最终得出结论。
S57、选取星级评定与计算等级相匹配的多个硬件设备构成集合。
在该方法中,能够对局域网内的所有硬件设备进行星级评定,并根据星级去选取与计算等级相应的硬件设备,由此构成硬件设备集合,该集合中所包含的硬件设备都与计算等级相应,能够为智能分析平台提供多个选择方案,并根据集合中各个硬件设备的状态进行择优分配,从而能够提高智能分析平台对于待计算任务的合理分配,提高对于局域网内各设备相应算力的调度能力。
S6、从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备进行计算任务目标。
该步骤通过粒子群优化算法实现,在PSO模型中,任务空间可以用m维向量表示,对空间中的所有元素进行资源搜索,每次搜索执行一次PSO迭代,元素本身在这些迭代中不断更新其个体最优值,以此作为动态置信度,而在每次在硬件设备集合中不断更新每个硬件设备的最优值,选取最优值最大的或者最接近的硬件设备来完成计算任务目标。
请参照图8,本实施例还提供了一种用于实现自动算力调度方法的装置,包括:
硬件设备定义模块100,硬件设备定义模块100用于根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备。
第一获取模块200,第一获取模块200用于获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列。
第二获取模块300,第二获取模块300用于获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求。
计算等级定义模块400,计算等级定义模块400用于根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务。
硬件设备集合选取模块500,硬件设备集合选取模块500用于根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备。
调取模块600,调取模块600用于从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备进行计算任务目标。
本实施例还提供了一种用于实现自动算力调度方法的系统,包括:处理器、存储器以及输入输出接口,
处理器、存储器和输入输出接口相互连接,其中,输入输出接口用于输入或输出数据,存储器用于存储程序代码,处理器用于调用所述程序代码,执行自动算力调度的方法。
本发明能够管理和自动分配所有连接在此平台的设备,不论设备是CPU设备\GPU设备\特殊AI边缘计算设备等能都最大程度的分配计算任务,使得资源利用最大化和最优。
本发明达到了根据最优选择快速调度网络内各设备算力资源的目的,能够根据用户上传的计算任务自动分配算力匹配度最高的硬件设备。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同或相似的部分互相参见即可。对于以上各实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上实施方式对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种视频智能分析平台的自动算力调度方法,其特征在于,该方法包括以下步骤:
S1、根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备;
S2、获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列;
在步骤S2中,任务执行状态包括各中心设备和边缘设备是否为空闲状态以及执行当前任务直到结束的总时长;
得出中心设备和边缘设备执行当前任务直到结束总时长的方法包括以下步骤:
S21、获取完成当前计算任务关键节点的有序集合;
S22、从起始节点A1出发,遍历相邻关键节点中起始节点A1与关键节点A2间的各个任务进行计算所需完成时长最小值中的最大值D;
S23、设置最大值D为起始节点A1和关键节点A2路径的目标截止时长,并根据硬件设备的负载情况和关键节点资源,以最小代价Cost对应的关键节点进行计算所需完成时长;
S24、返回步骤S22,依次执行有序集合中的相邻关键节点的计算所需完成时长,直至An任务完成;
S25、计算Di即为执行当前任务直到结束的总时长;
S3、获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求;
S4、根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务;
S5、根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备;
S6、从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备执行计算任务目标。
2.根据权利要求1所述的自动算力调度方法,其特征在于:有序集合为起始节点至终点节点上所包含的所有关键节点,其中关键节点为当前计算任务所包含的所需要计算的各个子任务,当前计算任务A中包含A1、A2、A3…An所需要计算的各个子任务,其中A1、A2、A3…An为关键节点,A1为起始节点,An为终点节点。
3.根据权利要求1所述的自动算力调度方法,其特征在于:在步骤S5中,根据计算等级选取与算力相匹配的硬件设备集合的方法包括以下步骤:
S51、根据多个硬件设备相对应的设备信息列表将已有的算力数据取最大和最小值,在最大值与最小值的区间内进而划分等级;
S52、对各硬件设备对应的算力数据进行定级,并转化为优序数;
S53、计算得出与正、负理想解对应的向量;
S54、分别计算出每个硬件设备对应的投影值;
S55、根据计算得出每个硬件设备的相对贴近度;
S56、根据相对贴近度的值进行大小排序,并据相对贴近度的值对每个硬件设备进行星级评定,最终得出结论;
S57、选取星级评定与计算等级相匹配的多个硬件设备构成集合。
4.根据权利要求1所述的自动算力调度方法,其特征在于:设备信息列表包括核心处理器的型号、核心处理器核数、核心处理器频率、预设计算机载体型号、计算设备显存、操作系统、除操作系统外存储空间、设备网口数量、设备网口宽带大小、设备功率。
5.根据权利要求1所述的自动算力调度方法,其特征在于:任务模型的定义包括模型功能、模型输入数据、模型阶段数、模型算力、模型显存要求、模型体积、模型拆分层名。
6.根据权利要求1所述的自动算力调度方法,其特征在于:任务计算要求为定义任务,包括任务功能、任务内存需求、任务存储需求、任务网络需求、任务分析频率要求、任务角色、任务周期、工作时间、工作时长。
7.一种用于实现上述权利要求1-6任一项所述的自动算力调度方法的装置,其特征在于,包括:
硬件设备定义模块(100),所述硬件设备定义模块(100)用于根据当前局域网内的若干个中心设备和边缘设备的设备信息列表定义硬件设备;
第一获取模块(200),所述第一获取模块(200)用于获取当前局域网内若干个中心设备和边缘设备的任务执行状态以及待计算任务队列;
第二获取模块(300),所述第二获取模块(300)用于获取需要完成的计算任务目标,计算任务目标包括任务模型以及任务计算要求;
计算等级定义模块(400),所述计算等级定义模块(400)用于根据计算任务目标定义计算任务模型的计算等级,计算等级为一级目标任务、二级目标任务或三级目标任务;
硬件设备集合选取模块(500),所述硬件设备集合选取模块(500)用于根据计算等级选取与算力相匹配的硬件设备集合,硬件设备集合包含多个能够执行计算任务目标的硬件设备;
调取模块(600),所述调取模块(600)用于从硬件设备集合中调取一个或多个与计算等级相匹配的硬件设备执行计算任务目标。
8.一种用于实现上述权利要求1-6任一项所述的自动算力调度方法的系统,其特征在于,包括:处理器、存储器以及输入输出接口,
所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1-6任一项所述的方法。
CN202210845011.4A 2022-07-19 2022-07-19 视频智能分析平台的自动算力调度方法、装置及系统 Active CN115220916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210845011.4A CN115220916B (zh) 2022-07-19 2022-07-19 视频智能分析平台的自动算力调度方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210845011.4A CN115220916B (zh) 2022-07-19 2022-07-19 视频智能分析平台的自动算力调度方法、装置及系统

Publications (2)

Publication Number Publication Date
CN115220916A CN115220916A (zh) 2022-10-21
CN115220916B true CN115220916B (zh) 2023-09-26

Family

ID=83612367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210845011.4A Active CN115220916B (zh) 2022-07-19 2022-07-19 视频智能分析平台的自动算力调度方法、装置及系统

Country Status (1)

Country Link
CN (1) CN115220916B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116167599B (zh) * 2023-04-26 2023-08-01 河北省水利工程局集团有限公司 基于bim数据及现场数据的信息平台管理方法及系统
CN116863408B (zh) * 2023-09-04 2023-11-21 成都智慧城市信息技术有限公司 基于监控摄像头ai算法的并行加速和动态调度实现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905333A (zh) * 2021-01-23 2021-06-04 招商新智科技有限公司 用于分布式视频智能分析平台的算力负载调度方法及装置
US11132224B2 (en) * 2020-08-17 2021-09-28 Essence Information Technology Co., Ltd Fine granularity real-time supervision system based on edge computing
CN114205420A (zh) * 2021-12-14 2022-03-18 深圳Tcl新技术有限公司 任务调度方法、装置、存储介质及电子设备
CN114528092A (zh) * 2022-01-04 2022-05-24 中国神华能源股份有限公司神朔铁路分公司 边缘节点任务调度方法、装置、计算机设备和存储介质
CN114595049A (zh) * 2022-03-15 2022-06-07 国网智能电网研究院有限公司 一种云边协同任务调度方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11132224B2 (en) * 2020-08-17 2021-09-28 Essence Information Technology Co., Ltd Fine granularity real-time supervision system based on edge computing
CN112905333A (zh) * 2021-01-23 2021-06-04 招商新智科技有限公司 用于分布式视频智能分析平台的算力负载调度方法及装置
CN114205420A (zh) * 2021-12-14 2022-03-18 深圳Tcl新技术有限公司 任务调度方法、装置、存储介质及电子设备
CN114528092A (zh) * 2022-01-04 2022-05-24 中国神华能源股份有限公司神朔铁路分公司 边缘节点任务调度方法、装置、计算机设备和存储介质
CN114595049A (zh) * 2022-03-15 2022-06-07 国网智能电网研究院有限公司 一种云边协同任务调度方法及装置

Also Published As

Publication number Publication date
CN115220916A (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN115220916B (zh) 视频智能分析平台的自动算力调度方法、装置及系统
CN110096349B (zh) 一种基于集群节点负载状态预测的作业调度方法
CN110287245B (zh) 用于分布式etl任务调度执行的方法及系统
CN105718479B (zh) 跨idc大数据处理架构下执行策略生成方法、装置
US20050177833A1 (en) Method and apparatus for reassigning objects to processing units
CN110308967B (zh) 一种基于混合云的工作流成本-延迟最优化任务分配方法
CN113110914A (zh) 一种基于微服务架构的物联网平台构建方法
CN113806018B (zh) 基于神经网络和分布式缓存的Kubernetes集群资源混合调度方法
CN110221920B (zh) 部署方法、装置、存储介质及系统
Malik et al. Comparison of task scheduling algorithms in cloud environment
CN115562870B (zh) 一种集群的任务节点资源构建方法
WO2020134133A1 (zh) 一种资源配置方法、变电站及计算机可读存储介质
CN116467076A (zh) 一种基于集群可用资源的多集群调度方法及系统
CN114429195A (zh) 混合专家模型训练的性能优化方法和装置
CN110084507A (zh) 云计算环境下分级感知的科学工作流调度优化方法
CN112491742B (zh) 一种边缘计算终端资源调度方法及装置
CN116896591A (zh) 网络数据分析模型调度方法、装置和计算机设备
CN115665157B (zh) 一种基于应用资源类型的均衡调度方法和系统
CN116708446A (zh) 基于网络性能综合权值决策的算网调度服务方法及系统
CN116954905A (zh) 一种面向Flink大数据的任务编排与迁移方法
CN114860449B (zh) 数据处理方法、装置、设备和存储介质
WO2023066035A1 (zh) 资源分配方法以及资源分配装置
CN114978913B (zh) 一种基于切链的服务功能链跨域部署方法及系统
Li et al. On scheduling of high-throughput scientific workflows under budget constraints in multi-cloud environments
Megahed et al. A stochastic optimization approach for cloud elasticity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant