CN116016539B - 业务请求的处理方法、装置、服务器及存储介质 - Google Patents
业务请求的处理方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN116016539B CN116016539B CN202211608601.1A CN202211608601A CN116016539B CN 116016539 B CN116016539 B CN 116016539B CN 202211608601 A CN202211608601 A CN 202211608601A CN 116016539 B CN116016539 B CN 116016539B
- Authority
- CN
- China
- Prior art keywords
- service request
- computing
- determining
- node
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000004044 response Effects 0.000 claims abstract description 3
- 230000005540 biological transmission Effects 0.000 claims description 165
- 230000000875 corresponding effect Effects 0.000 claims description 80
- 230000008569 process Effects 0.000 claims description 21
- 230000002596 correlated effect Effects 0.000 claims description 6
- 238000013461 design Methods 0.000 description 15
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明提供一种业务请求的处理方法、装置、服务器及存储介质,该方法包括:响应于算力系统接收到待处理的第一业务请求,算力系统包括多个算力节点;确定第一业务请求到达每个算力节点的松弛时间;基于每个算力节点对应的松弛时间,从多个算力节点中确定能够处理第一业务请求的至少一个可行算力节点;基于Wardrop平衡原理,从至少一个可行算力节点中确定处理第一业务请求的目标算力节点,目标算力节点为传输第一业务请求用时最短的算力节点;基于目标算力节点处理第一业务请求。由于能够通过传输业务请求用时最短的最优算力节点来处理业务请求,因此提高了业务请求的处理效率。
Description
技术领域
本发明涉及物联网技术领域,尤其涉及一种业务请求的处理方法、装置、服务器及存储介质。
背景技术
随着物联网技术的发展,业务请求的数量越来越多,当算力系统的资源一定时,如何处理接收到的业务请求,以实现算力系统的负载均衡变得愈发重要。
现有技术中,当接收到业务请求时,确定算力系统中每个计算节点的闲置算力,将业务请求分配给闲置算力最多的计算节点进行处理。其中,每个计算节点包括多个设备集群,每个计算节点的闲置算力与多个设备集群的CUP使用率、内存占用率等影响业务请求处理速度的参数负相关。
其中,发明人发现现有技术至少存在如下技术问题:业务请求与闲置算力最多的计算节点之间的传输距离可能较大,导致业务请求到达计算节点的传输时间较长。这样,当传输时间较长的业务请求的数量较多时,算力系统处理多个业务请求的整体时间也较长,导致该算力系统不易达到负载均衡。
发明内容
本发明提供一种业务请求的处理方法、装置、服务器及存储介质,能够提高业务请求的处理效率,以使算力系统易达到负载均衡。
第一方面,本发明提供一种业务请求的处理方法,包括:
响应于算力系统接收到待处理的第一业务请求,所述算力系统包括多个算力节点;
确定所述第一业务请求到达每个算力节点的松弛时间;
基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点;
基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,所述目标算力节点为传输所述第一业务请求用时最短的算力节点;
基于所述目标算力节点处理所述第一业务请求。
在一种可能的设计中,所述基于所述目标算力节点处理所述第一业务请求,包括:将所述第一业务请求添加到所述目标算力节点的业务请求列表内,所述业务请求列表内包括多个待处理的第二业务请求;确定所述多个待处理的第二业务请求的执行顺序;所述目标算力节点基于所述多个待处理的第二业务请求的执行顺序,处理所述多个第二业务请求。
在一种可能的设计中,所述确定所述多个待处理的第二业务请求的执行顺序,包括:对于每个第二业务请求,基于所述第二业务请求的松弛时间,确定所述第二业务请求的优先级等级;基于所述优先级等级,确定所述第二业务请求对应的平均时延;获取所述第二业务请求的时延阈值和执行时间,基于所述时延阈值、所述执行时间和所述平均时延,确定所述第二业务请求的优先因子;基于每个第二业务请求对应的优先因子,确定所述多个待处理的第二业务请求的执行顺序。
在一种可能的设计中,所述确定所述第一业务请求到达每个算力节点的松弛时间,包括:确定接收所述第一业务请求的接收时间、完成所述第一业务请求的截止时间、处理所述第一业务请求的处理时间、所述第一业务请求的数据量和每个算力节点对应的数据传输速率;对于每个算力节点,确定所述第一业务请求的数据量与所述算力节点对应的数据传输速率的比值;基于所述截止时间、所述接收时间、所述处理时间和所述比值,确定所述第一业务请求到达每个算力节点的松弛时间。
在一种可能的设计中,所述基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点,包括:对于每个算力节点,确定所述第一业务请求所占用的第一算力资源参数和所述算力节点当前闲置的第二算力资源参数;若所述第一算力资源参数小于第二算力资源参数,且所述算力节点对应的松弛时间不小于0,则确定所述算力节点为可行算力节点。
在一种可能的设计中,所述基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,包括:确定所述第一业务请求传输到至少一个可行算力节点对应的至少一个传输路径;基于Wardrop平衡原理,确定每个传输路径传输所述第一业务请求对应的传输时间;从所述至少一个传输路径中选取传输时间最小的目标传输路径,确定所述目标传输路径对应的目标算力节点。
在一种可能的设计中,所述算力系统内包括待传输的多个第三业务请求,每个第三业务请求对应至少一个可行算力节点;所述基于Wardrop平衡原理,确定每个传输路径传输所述第一业务请求对应的传输时间,包括:基于每个第三业务请求对应至少一个可行算力节点,确定所述多个第三业务请求对应的多个传输类别,每个传输类别对应至少一条传输路径;确定所述多个传输类别对应的多个传输路径;基于Wardrop平衡原理,确定每个传输路径上的目标传输流量,所述目标传输流量用于使所述多个传输路径传输所述多个第三业务请求的总传输时间最小;基于每个传输路径上的目标传输流量,确定每个传输路径传输所述第一业务请求的传输时间,所述目标传输流量与所述传输时间正相关。
第二方面,本发明提供一种业务请求的处理装置,包括:
接收模块,用于算力系统接收到待处理的第一业务请求,所述算力系统包括多个算力节点;
第一确定模块,用于确定所述第一业务请求到达每个算力节点的松弛时间;
第二确定模块,用于基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点;
第三确定模块,用于基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,所述目标算力节点为传输所述第一业务请求用时最短的算力节点;
处理模块,用于基于所述目标算力节点处理所述第一业务请求。
第三方面,本发明提供一种服务器,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的业务请求的处理方法。
第四方面,本发明提供一种计算机存储介质,所述计算机存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的业务请求的处理方法。
第五方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,其存储在计算机可读存储介质中,至少一个处理器可以从计算机可读存储介质读取计算机程序,至少一个处理器执行计算机程序时,实现如上第一方面以及第一方面各种可能的设计所述的业务请求的处理方法。
本发明提供的业务请求的处理方法、装置、服务器及存储介质,当接收到业务请求时,先确定能够处理业务请求的至少一个可行算力节点,之后通过平衡原理,从至少一个可行算力节点中确定目标算力节点,最后通过目标算力节点处理业务请求,而目标算力节点是传输业务请求用时最短的最优算力节点。由此可见,本申请在确保能够处理业务请求的基础上,进一步确定传输业务请求用时最短的最优算力节点来处理业务请求,从而提高了业务请求的处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的业务请求的处理方法的应用场景示意图;
图2为本发明实施例提供的业务请求的处理方法流程示意图一;
图3为本发明实施例提供的业务请求的处理方法流程示意图二;
图4为本发明实施例提供的业务请求的处理方法流程示意图三;
图5为本发明实施例提供的第1类业务请求的传输子图的示意图;
图6为本发明实施例提供的业务请求的处理方法流程示意图四;
图7为本发明实施例提供的业务请求的处理装置的结构示意图;
图8为本发明实施例提供的服务器的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着物联网技术的发展,业务请求的数量越来越多,当算力系统的资源一定时,如何处理接收到的业务请求,以实现算力系统的负载均衡变得愈发重要。示例性的,物联网在医疗、交通、工业自动化等领域的业务应用越来越多,应用对应的业务请求的数量也越来越多。
现有技术中,当接收到业务请求时,确定算力系统中每个计算节点的闲置算力,将业务请求分配给闲置算力最多的计算节点进行处理。其中,每个计算节点包括多个设备集群,每个计算节点的闲置算力与多个设备集群的CUP使用率、内存占用率等影响业务请求处理速度的参数负相关。但是,业务请求与闲置算力最多的计算节点之间的传输距离可能较大,导致业务请求到达计算节点的传输时间较长。这样,当传输时间较长的业务请求的数量较多时,算力系统处理多个业务请求的整体时间也较长,导致该算力系统不易达到负载均衡。
因此,根据业务请求的延迟需求合理调度业务请求以实现算力系统的负载均衡,成为目前亟待解决的技术问题。
为了解决上述技术问题,本发明实施例提出以下技术构思:本发明将各区域算力统一管理,形成算力网络系统,该算力网络系统包括多个算力节点,每个算力节点内有若干个集群,组成算力资源池。每个算力节点的算力资源池的闲置算力实时更新。当算力网络系统接收到业务请求时,先确定能够处理业务请求的至少一个可行算力节点,之后通过平衡原理,从至少一个可行算力节点中确定目标算力节点,最后通过目标算力节点处理业务请求,而目标算力节点是传输业务请求用时最短的最优算力节点。本申请在确保能够处理业务请求的基础上,进一步确定传输业务请求用时最短的最优算力节点来处理业务请求,从而提高了业务请求的处理效率。下面采用详细的实施例进行详细说明。
图1是本发明实施例提供的业务请求的处理方法的应用场景示意图。如图1所示,显示终端101接收用户基于应用程序触发的业务请求,将业务请求通过无线网络传输至服务器102。服务器102接收业务请求,确定处理该业务请求的目标算力节点,并通过目标算力节点处理该业务请求,得到处理结果。服务器102将处理结果返回显示终端101。
图2为本发明实施例提供的业务请求的处理方法流程示意图一,本实施例的执行主体可以为图1所示实施例中的服务器,本实施例此处不做特别限制。如图2所示,该方法包括:
S201、响应于算力系统接收到待处理的第一业务请求,算力系统包括多个算力节点。
在本发明实施例中,算力系统可以为处理业务请求的服务器。服务器可以接收终端发送的第一业务请求。算力系统包括多个算力节点均能处理第一业务请求。示例性的,第一业务请求可以是信息查询请求、登录请求、信息传输请求等。在本发明实施例中对多个算力节点的数量不作具体要求。例如,多个算力节点的数量为m个。
S202、确定第一业务请求到达每个算力节点的松弛时间。
在本发明实施例中,第一业务请求对应一个最晚的截止时间,算力节点需要在截止时间之前完成第一业务请求的处理。其中,松弛时间用于表示第一业务请求能否传输至算力节点并在截止时间之前完成第一业务请求。
S203、基于每个算力节点对应的松弛时间,从多个算力节点中确定能够处理第一业务请求的至少一个可行算力节点。
可选地,本步骤为:对于每个算力节点,确定第一业务请求所占用的第一算力资源参数和算力节点当前闲置的第二算力资源参数;若第一算力资源参数小于第二算力资源参数,且算力节点对应的松弛时间不小于0,则确定算力节点为可行算力节点。此时,第一业务请求能传输至可行算力节点并在截止时间之前完成第一业务请求。若算力节点对应的松弛时间小于0,则表示第一业务请求不能传输至算力节点或者在截止时间之前算力节点无法完成第一业务请求。
S204、基于Wardrop平衡原理,从至少一个可行算力节点中确定处理第一业务请求的目标算力节点,目标算力节点为传输第一业务请求用时最短的算力节点。
Wardrop平衡原理是指交通量平衡分配的理论假设之一,在该原则下,所有业务请求试图选择传输时间最小的路线。也即是,目标算力节点是可行算力节点中传输第一业务请求用时最短的算力节点。
S205、基于目标算力节点处理第一业务请求。
本发明提供的业务请求的处理方法,当接收到业务请求时,先确定能够处理业务请求的至少一个可行算力节点,之后通过平衡原理,从至少一个可行算力节点中确定目标算力节点,最后通过目标算力节点处理业务请求,而目标算力节点是传输业务请求用时最短的最优算力节点。由此可见,本申请在确保能够处理业务请求的基础上,进一步确定传输业务请求用时最短的最优算力节点来处理业务请求,从而提高了业务请求的处理效率。
图3为本发明实施例提供的业务请求的处理方法流程示意图二。在本发明实施例中,在图2提供的实施例的基础上,S202中确定第一业务请求到达每个算力节点的松弛时间的具体实现方法进行了详细说明。如图3所示,该方法包括:
S301、确定接收第一业务请求的接收时间、完成第一业务请求的截止时间、处理第一业务请求的处理时间、第一业务请求的数据量和每个算力节点对应的数据传输速率。
在本发明实施例中,接收时间为当前时间,可以用ct表示。截止时间为完成第一业务请求的最后期限,可以用da表示。处理第一业务请求的处理时间为算计节点执行第一业务请求所需的时间上限,可以用etupa表示。第一业务请求的数据量可以用dsa表示,数据传输到算力节点m的传输速率可以用vm表示。
S302、对于每个算力节点,确定第一业务请求的数据量与算力节点对应的数据传输速率的比值。
示例性的,对于算力节点m,第一业务请求的数据量与算力节点m对应的数据传输速率的比值为:dsa/vm。
S303、基于截止时间、接收时间、处理时间和比值,确定第一业务请求到达每个算力节点的松弛时间。
可选地,本步骤为:基于截止时间、接收时间、处理时间和比值,通过以下公式一,确定第一业务请求到达每个算力节点的松弛时间。
公式一:
其中,表示算力节点m的松弛时间,da表示截止时间,ct表示接收时间,etupa表示处理时间,/>表示比值。
图4为本发明实施例提供的业务请求的处理方法流程示意图三。在本发明实施例中,在图2提供的实施例的基础上,S204中基于Wardrop平衡原理,从至少一个可行算力节点中确定处理第一业务请求的目标算力节点的具体实现方法进行了详细说明。如图4所示,该方法包括:
S401、确定第一业务请求传输到至少一个可行算力节点对应的至少一个传输路径。
在本发明实施例中,第一业务请求与一个可行算力节点组合为一个OD对。可选地,第一业务请求所在的位置区域对应传输路径的起点,可行算力节点对应传输路径的终点,传输路径的数量与可行算力节点的数量相同。
S402、基于Wardrop平衡原理,确定每个传输路径传输第一业务请求对应的传输时间。
可选地,传输时间与该传输路径的传输流量正相关。在本发明实施例中,算力系统内包括待传输的多个第三业务请求,每个第三业务请求对应至少一个可行算力节点。其中,第三业务请求对应至少一个可行算力节点可以通过步骤S201至步骤S203来确定。
相应的,基于Wardrop平衡原理,确定每个传输路径传输第一业务请求对应的传输时间可以包括以下步骤(1)至(4):
(1)基于每个第三业务请求对应至少一个可行算力节点,确定多个第三业务请求对应的多个传输类别,每个传输类别对应至少一条传输路径。
在本发明实施例中,对于任意算力节点m,任意的第三业务请求a都可以分为2类,可处理(Cam=1,此时算力节点m为可行算力节点)和不可处理(Cam=0,此时算力节点m不是可行算力节点)。可选地,本步骤为:基于每个第三业务请求对应至少一个可行算力节点,按照可行算力节点的数量,对多个第三业务请求进行分类,得到多个第三业务请求对应的多个传输类别。
示例性的,多个传输类别总共可分为K类。其中,K=2m-1。m表示算力节点的数量。
(2)确定多个传输类别对应的多个传输路径。
在本发明实施例中,每个类别包括至少一个第三业务请求。每个类别的业务请求对应一个传输子图gk;其中,k∈{1、2、……、2m-1},m表示算力节点的数量。可选地,本步骤为:确定每个类别的业务请求对应的传输子图,所述传输子图内包括的至少一个传输路径;将每个类别的业务请求对应的至少一个传输路径进行合并,得到多个传输类别对应的多个传输路径。
需要说明的是,同一类别的业务请求,若业务请求所在的位置区域不同,则业务请求的起点不同。示例性的,第1类别的业务请求对应的传输子图g1如图5所示。其中,第1类别的业务请求为可传输到除了第1个算力节点以外的其他算力节点处理的业务请求。
示例性的,第1类别的业务请求对应的可行算力节点包括{2、3、……、m}。第1类别的业务请求所在的位置区域包括n个区域,则第1类别的业务请求对应的传输路径包括(m-1)*n个。例如,m=3,n=3,则第1类别的业务请求对应的传输路径包括6个,分别为C12、C13、C22、C23、C32、C33。
(3)基于Wardrop平衡原理,确定每个传输路径上的目标传输流量,目标传输流量用于使多个传输路径传输多个第三业务请求的总传输时间最小。
可选的,本步骤为:基于多个传输路径的数量,通过以下公式二,确定每个传输路径上的目标传输流量。
公式二:
其中,min F(f)多个传输路径传输多个第三业务请求的最小总传输时间,r表示第r个传输路径,w表示多个传输路径的数量,表示第r个传输路径的传输时间,fr表示第r个传输路径对应的总流量。
在本发明实施例中,业务请求传输到算力节点的时间函数只与传输路段的流量有关,且传输时间是传输路径的总流量的严格递增的凸函数。也即是,传输时间与传输路径的总流量正相关。示例性的,其中,Wardrop平衡原理,第k类业务请求在其传输子图上的平衡条件为:
表示传输子图gk中第k类业务请求在传输路径r上的最小传输时间;/>表示第k类业务请求对应的传输子图gk中的传输路径r的流量。
需要说明的是,第r个传输路径对应的总流量是每类业务请求在第r个传输路径的流量之和,也即是:
其中,k表示业务请求的类别,k∈K,K=2m-1,表示第k类业务请求对应的传输子图gk中的传输路径r的流量。
(4)基于每个传输路径上的目标传输流量,确定每个传输路径传输第一业务请求的传输时间,目标传输流量与传输时间正相关。
S403、从至少一个传输路径中选取传输时间最小的目标传输路径,确定目标传输路径对应的目标算力节点。
在本申请实施例中,通过Wardrop平衡原理,从至少一个可行算力节点中确定目标算力节点,而目标算力节点是传输业务请求用时最短的最优算力节点,这样,减少了传输第一业务请求的时间,从而提高了第一业务请求的处理效率。
图6为本发明实施例提供的业务请求的处理方法流程示意图四。在本发明实施例中,在图2提供的实施例的基础上,S205中基于目标算力节点处理第一业务请求的具体实现方法进行了详细说明。如图6所示,该方法包括:
S601、将第一业务请求添加到目标算力节点的业务请求列表内,业务请求列表内包括多个待处理的第二业务请求。
在本申请实施例中,业务请求列表内包括的多个待处理的第二业务请求可以在预设时长t内以速率λ成批到达。多个第二业务请求在预设时长t内服从均值为λ的泊松分布。其中,目标算力节点处理第二业务请求的速率为μ,目标算力节点处理第二业务请求的服务时间符合均值为μ的指数分布。需要说明的是,第一业务请求是未添加到业务请求列表内的业务请求,第二业务请求是已添加到业务请求列表内的业务请求。
S602、确定多个待处理的第二业务请求的执行顺序。
在本申请实施例中,本步骤为可以通过包括步骤(a)至(d):
(a)对于每个第二业务请求,基于第二业务请求的松弛时间,确定第二业务请求的优先级等级。
可选地,松弛时间最小,第二业务请求的优先级等级越高。服务器内存储有松弛时间与优先级等级之间的对应关系。相应的,本步骤为:对于每个第二业务请求,基于第二业务请求的松弛时间,从已存储的松弛时间与优先级等级之间的对应关系中,确定所述第二业务请求的优先级等级。
(b)基于优先级等级,确定第二业务请求对应的平均时延。
可选地,第二业务请求的平均时延包括等待更高优先级等级的业务请求的处理时间以及同一优先级等级内等待处理第二业务请求所需要的时间。
可选地,第二业务请求的优先级等级为k,等待更高优先级等级的业务请求的处理时间为:
其中,Mi为第i优先级等级的任务总数,且i<k。
同一优先级等级内等待处理第二业务请求所需要的时间为:
其中,为第二业务请求在本优先级等级中排在第j位的概率,Mk表示第k优先级等级(本优先级等级)的任务总数,μ表示目标算力节点处理业务请求的速率。
第二业务请求对应的平均时延:
(c)获取第二业务请求的时延阈值和执行时间,基于时延阈值、执行时间和优先级等级对应的平均时延,确定第二业务请求的优先因子。
可选地,第二业务请求内携带该业务请求的时延阈值。服务器在接收第二业务请求时,获取该第二业务请求的时延阈值。示例性的,第二业务请求的时延阈值为tk,0。
在本申请实施例中,参照排队打水问题,按照桶的大小从小到大进行排序,桶小的打水时间短排在前面,可以使队伍的总体等待时间最小。相应的,基于时延阈值和优先级等级对应的平均时延,确定第二业务请求的优先因子的步骤为:确定平均时延与时延阈值的比值,基于该比值和执行时间,通过以下公式三,确定第二业务请求的优先因子;
公式三:
其中,θk表示第二业务请求的优先因子,dk表示时延阈值和平均时延的比值,ek表示第二业务请求的执行时间。
可选地,
其中,tk表示平均时延,tk,0表示时延阈值。
(d)基于每个第二业务请求对应的优先因子,确定多个待处理的第二业务请求的执行顺序。
可选地,第二业务请求的优先因子越大,该第二业务请求的优先级最高,执行的紧迫性越强。相应的,本步骤为:基于每个第二业务请求对应的优先因子,按照优先因子从大到小的训练,确定多个待处理的第二业务请求的执行顺序。
S603、目标算力节点基于多个待处理的第二业务请求的执行顺序,处理多个第二业务请求。
在本发明实施例中,基于排队论模型,以最小化系统总体等待时间为目标,根据客户时延要求及任务执行时间比值确定业务请求的优先级,按优先级从高到低的顺序处理业务请求,降低了目标执行节点处理业务请求的时间,从而进一步提高了业务请求的处理效率。
图7为本发明实施例提供的业务请求的处理装置的结构示意图。如图7所示,该业务请求的处理装置包括:接收模块701、第一确定模块702、第二确定模块703、第三确定模块704以及处理模块705。
接收模块701,用于算力系统接收到待处理的第一业务请求,算力系统包括多个算力节点;
第一确定模块702,用于确定第一业务请求到达每个算力节点的松弛时间;
第二确定模块703,用于基于每个算力节点对应的松弛时间,从多个算力节点中确定能够处理第一业务请求的至少一个可行算力节点;
第三确定模块704,用于基于Wardrop平衡原理,从至少一个可行算力节点中确定处理第一业务请求的目标算力节点,目标算力节点为传输第一业务请求用时最短的算力节点;
处理模块705,用于基于目标算力节点处理第一业务请求。
在一种可能的设计中,处理模块705基于目标算力节点处理第一业务请求,具体包括:将第一业务请求添加到目标算力节点的业务请求列表内,业务请求列表内包括多个待处理的第二业务请求;确定多个待处理的第二业务请求的执行顺序;目标算力节点基于多个待处理的第二业务请求的执行顺序,处理多个第二业务请求。
在一种可能的设计中,处理模块705确定多个待处理的第二业务请求的执行顺序,具体包括:对于每个第二业务请求,基于第二业务请求的松弛时间,确定第二业务请求的优先级等级;基于优先级等级,确定第二业务请求对应的平均时延;获取第二业务请求的时延阈值和执行时间,基于时延阈值、执行时间和平均时延,确定第二业务请求的优先因子;基于每个第二业务请求对应的优先因子,确定多个待处理的第二业务请求的执行顺序。
在一种可能的设计中,第一确定模块702确定第一业务请求到达每个算力节点的松弛时间,具体包括:确定接收第一业务请求的接收时间、完成第一业务请求的截止时间、处理第一业务请求的处理时间、第一业务请求的数据量和每个算力节点对应的数据传输速率;对于每个算力节点,确定第一业务请求的数据量与算力节点对应的数据传输速率的比值;基于截止时间、接收时间、处理时间和比值,确定第一业务请求到达每个算力节点的松弛时间。
在一种可能的设计中,第二确定模块703基于每个算力节点对应的松弛时间,从多个算力节点中确定能够处理第一业务请求的至少一个可行算力节点,具体包括:对于每个算力节点,确定第一业务请求所占用的第一算力资源参数和算力节点当前闲置的第二算力资源参数;若第一算力资源参数小于第二算力资源参数,且算力节点对应的松弛时间不小于0,则确定算力节点为可行算力节点。
在一种可能的设计中,第三确定模块704基于Wardrop平衡原理,从至少一个可行算力节点中确定处理第一业务请求的目标算力节点,具体包括:确定第一业务请求传输到至少一个可行算力节点对应的至少一个传输路径;基于Wardrop平衡原理,确定每个传输路径传输第一业务请求对应的传输时间;从至少一个传输路径中选取传输时间最小的目标传输路径,确定目标传输路径对应的目标算力节点。
在一种可能的设计中,算力系统内包括待传输的多个第三业务请求,每个第三业务请求对应至少一个可行算力节点;
第三确定模块704基于Wardrop平衡原理,确定每个传输路径传输第一业务请求对应的传输时间,具体包括:基于每个第三业务请求对应至少一个可行算力节点,确定多个第三业务请求对应的多个传输类别,每个传输类别对应至少一条传输路径;确定多个传输类别对应的多个传输路径;基于Wardrop平衡原理,确定每个传输路径上的目标传输流量,目标传输流量用于使多个传输路径传输多个第三业务请求的总传输时间最小;基于每个传输路径上的目标传输流量,确定每个传输路径传输第一业务请求的传输时间,目标传输流量与传输时间正相关。
本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图8为本发明实施例提供的服务器的硬件结构示意图。如图8所示,本实施例的服务器包括:处理器801以及存储器802;其中
存储器802,用于存储计算机执行指令;
处理器801,用于执行存储器存储的计算机执行指令,以实现上述实施例中服务器所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,存储器802既可以是独立的,也可以跟处理器801集成在一起。
当存储器802独立设置时,该服务器还包括总线803,用于连接存储器802和处理器801。
本发明实施例还提供一种计算机存储介质,计算机存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一种可能的实现方式中的业务请求的处理方法。
本发明实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,实现如上任一种可能的实现方式中的业务请求的处理方法。本发明实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,实现如上任一种可能的实现方式中的业务请求的处理方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例方法的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外部设备互连(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种业务请求的处理方法,其特征在于,包括:
响应于算力系统接收到待处理的第一业务请求,所述算力系统包括多个算力节点;
确定接收所述第一业务请求的接收时间、完成所述第一业务请求的截止时间、处理所述第一业务请求的处理时间、所述第一业务请求的数据量和每个算力节点对应的数据传输速率;
对于每个算力节点,确定所述第一业务请求的数据量与所述算力节点对应的数据传输速率的比值;
基于所述截止时间、所述接收时间、所述处理时间和所述比值,确定所述第一业务请求到达每个算力节点的松弛时间;
基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点;
基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,所述目标算力节点为传输所述第一业务请求用时最短的算力节点;
基于所述目标算力节点处理所述第一业务请求;
所述基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点,包括:
对于每个算力节点,确定所述第一业务请求所占用的第一算力资源参数和所述算力节点当前闲置的第二算力资源参数;
若所述第一算力资源参数小于第二算力资源参数,且所述算力节点对应的松弛时间不小于0,则确定所述算力节点为可行算力节点。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标算力节点处理所述第一业务请求,包括:
将所述第一业务请求添加到所述目标算力节点的业务请求列表内,所述业务请求列表内包括多个待处理的第二业务请求;
确定所述多个待处理的第二业务请求的执行顺序;
所述目标算力节点基于所述多个待处理的第二业务请求的执行顺序,处理所述多个第二业务请求。
3.根据权利要求2所述的方法,其特征在于,所述确定所述多个待处理的第二业务请求的执行顺序,包括:
对于每个第二业务请求,基于所述第二业务请求的松弛时间,确定所述第二业务请求的优先级等级;
基于所述优先级等级,确定所述第二业务请求对应的平均时延;
获取所述第二业务请求的时延阈值和执行时间,基于所述时延阈值、所述执行时间和所述平均时延,确定所述第二业务请求的优先因子;
基于每个第二业务请求对应的优先因子,确定所述多个待处理的第二业务请求的执行顺序。
4.根据权利要求1所述的方法,其特征在于,所述基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,包括:
确定所述第一业务请求传输到至少一个可行算力节点对应的至少一个传输路径;
基于Wardrop平衡原理,确定每个传输路径传输所述第一业务请求对应的传输时间;
从所述至少一个传输路径中选取传输时间最小的目标传输路径,确定所述目标传输路径对应的目标算力节点。
5.根据权利要求4所述的方法,其特征在于,所述算力系统内包括待传输的多个第三业务请求,每个第三业务请求对应至少一个可行算力节点;
所述基于Wardrop平衡原理,确定每个传输路径传输所述第一业务请求对应的传输时间,包括:
基于每个第三业务请求对应的至少一个可行算力节点,确定所述多个第三业务请求对应的多个传输类别,每个传输类别对应至少一条传输路径;
确定所述多个传输类别对应的多个传输路径;
基于Wardrop平衡原理,确定每个传输路径上的目标传输流量,所述目标传输流量用于使所述多个传输路径传输所述多个第三业务请求的总传输时间最小;
基于每个传输路径上的目标传输流量,确定每个传输路径传输所述第一业务请求的传输时间,所述目标传输流量与所述传输时间正相关。
6.一种业务请求的处理装置,其特征在于,包括:
接收模块,用于算力系统接收到待处理的第一业务请求,所述算力系统包括多个算力节点;
第一确定模块,用于确定接收所述第一业务请求的接收时间、完成所述第一业务请求的截止时间、处理所述第一业务请求的处理时间、所述第一业务请求的数据量和每个算力节点对应的数据传输速率;
对于每个算力节点,确定所述第一业务请求的数据量与所述算力节点对应的数据传输速率的比值;
基于所述截止时间、所述接收时间、所述处理时间和所述比值,确定所述第一业务请求到达每个算力节点的松弛时间;
第二确定模块,用于基于所述每个算力节点对应的松弛时间,从所述多个算力节点中确定能够处理所述第一业务请求的至少一个可行算力节点;
第三确定模块,用于基于Wardrop平衡原理,从所述至少一个可行算力节点中确定处理所述第一业务请求的目标算力节点,所述目标算力节点为传输所述第一业务请求用时最短的算力节点;
处理模块,用于基于所述目标算力节点处理所述第一业务请求;
所述第三确定模块,具体用于对于每个算力节点,确定所述第一业务请求所占用的第一算力资源参数和所述算力节点当前闲置的第二算力资源参数;
若所述第一算力资源参数小于第二算力资源参数,且所述算力节点对应的松弛时间不小于0,则确定所述算力节点为可行算力节点。
7.一种服务器,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至5任一项所述的业务请求的处理方法。
8.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至5任一项所述的业务请求的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211608601.1A CN116016539B (zh) | 2022-12-14 | 2022-12-14 | 业务请求的处理方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211608601.1A CN116016539B (zh) | 2022-12-14 | 2022-12-14 | 业务请求的处理方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116016539A CN116016539A (zh) | 2023-04-25 |
CN116016539B true CN116016539B (zh) | 2024-05-17 |
Family
ID=86025834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211608601.1A Active CN116016539B (zh) | 2022-12-14 | 2022-12-14 | 业务请求的处理方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116016539B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111352731A (zh) * | 2020-02-19 | 2020-06-30 | 宜通世纪物联网研究院(广州)有限公司 | 在边缘计算网络中分配任务的方法、系统、装置及介质 |
CN113590282A (zh) * | 2021-07-19 | 2021-11-02 | 海宁奕斯伟集成电路设计有限公司 | 算力调度方法、系统、电子设备及计算机可读存储介质 |
WO2022028418A1 (zh) * | 2020-08-04 | 2022-02-10 | 中国移动通信有限公司研究院 | 算力处理的网络系统、业务处理方法及设备 |
WO2022037360A1 (zh) * | 2020-08-17 | 2022-02-24 | 华为技术有限公司 | 一种计算任务的处理方法、通信装置及无线网络架构 |
CN114360086A (zh) * | 2021-12-09 | 2022-04-15 | 北京汽车研究总院有限公司 | 数据处理方法、数据处理装置、车机装置和存储介质 |
CN115208812A (zh) * | 2022-07-08 | 2022-10-18 | 中国电信股份有限公司 | 业务处理方法及装置、设备、计算机可读存储介质 |
-
2022
- 2022-12-14 CN CN202211608601.1A patent/CN116016539B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111352731A (zh) * | 2020-02-19 | 2020-06-30 | 宜通世纪物联网研究院(广州)有限公司 | 在边缘计算网络中分配任务的方法、系统、装置及介质 |
WO2022028418A1 (zh) * | 2020-08-04 | 2022-02-10 | 中国移动通信有限公司研究院 | 算力处理的网络系统、业务处理方法及设备 |
WO2022037360A1 (zh) * | 2020-08-17 | 2022-02-24 | 华为技术有限公司 | 一种计算任务的处理方法、通信装置及无线网络架构 |
CN113590282A (zh) * | 2021-07-19 | 2021-11-02 | 海宁奕斯伟集成电路设计有限公司 | 算力调度方法、系统、电子设备及计算机可读存储介质 |
CN114360086A (zh) * | 2021-12-09 | 2022-04-15 | 北京汽车研究总院有限公司 | 数据处理方法、数据处理装置、车机装置和存储介质 |
CN115208812A (zh) * | 2022-07-08 | 2022-10-18 | 中国电信股份有限公司 | 业务处理方法及装置、设备、计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
基于区块链的虚拟电厂模型研究;邵炜晖;许维胜;徐志宇;王宁;农静;;计算机科学;20180215(第02期);全文 * |
平面交叉口交通容量的计算;颜健民;;长安大学学报(自然科学版);19820815(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116016539A (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11637889B2 (en) | Configuration recommendation for a microservice architecture | |
CN109451002B (zh) | 一种cdn节点的选择方法及设备 | |
US11210131B2 (en) | Method and apparatus for assigning computing task | |
CN109714797B (zh) | 一种基于拍卖理论的移动边缘网络资源分配方法 | |
CN108173905B (zh) | 一种资源配置方法、装置及电子设备 | |
CN109152061B (zh) | 通道调配方法、装置、服务器及存储介质 | |
CN105791381A (zh) | 访问控制的方法及装置 | |
CN114816738A (zh) | 算力节点的确定方法、装置、设备及计算机可读存储介质 | |
WO2014146441A1 (en) | Method, server and system for processing task data | |
CN111026552B (zh) | 资源的调度方法、装置、电子设备和计算机可读存储介质 | |
CN104158860A (zh) | 一种作业调度方法及作业调度系统 | |
CN112102063B (zh) | 数据请求方法、装置、设备、平台及计算机存储介质 | |
CN116016539B (zh) | 业务请求的处理方法、装置、服务器及存储介质 | |
CN109729008B (zh) | 路由选择方法、装置及计算机设备 | |
CN114285906B (zh) | 报文处理方法、装置、电子设备及存储介质 | |
CN107707383B (zh) | 放通处理方法、装置、第一网元及第二网元 | |
CN114168279B (zh) | 海量数据的任务调度方法及系统 | |
CN116684980B (zh) | 基于多卫星处理数据的方法、装置及存储介质 | |
CN111381956B (zh) | 一种任务处理的方法、装置及云分析系统 | |
US20090299628A1 (en) | Method and system for positional communication | |
CN115474222B (zh) | 一种终端的通信方法、系统、电子设备及存储介质 | |
CN115361285B (zh) | 实现离在线业务混合部署的方法、装置、设备及介质 | |
CN117251256A (zh) | 作业调度方法、装置、设备及计算机可读存储介质 | |
CN116112336A (zh) | 一种告警数据处理方法及装置 | |
CN118018416A (zh) | 网络切片分配方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |