WO2022062981A1 - 资源调度方法和系统、电子设备及计算机可读存储介质 - Google Patents

资源调度方法和系统、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
WO2022062981A1
WO2022062981A1 PCT/CN2021/118436 CN2021118436W WO2022062981A1 WO 2022062981 A1 WO2022062981 A1 WO 2022062981A1 CN 2021118436 W CN2021118436 W CN 2021118436W WO 2022062981 A1 WO2022062981 A1 WO 2022062981A1
Authority
WO
WIPO (PCT)
Prior art keywords
proxy server
proxy
resource
server
resources
Prior art date
Application number
PCT/CN2021/118436
Other languages
English (en)
French (fr)
Inventor
童遥
王海新
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Priority to KR1020237013946A priority Critical patent/KR20230073315A/ko
Priority to JP2023518479A priority patent/JP2023543744A/ja
Priority to US18/027,664 priority patent/US20230379268A1/en
Publication of WO2022062981A1 publication Critical patent/WO2022062981A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/82Miscellaneous aspects
    • H04L47/822Collecting or measuring resource availability data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • H04L47/781Centralised allocation of resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold

Definitions

  • FIG. 1 is a schematic flowchart of a resource scheduling method.
  • FIG. 6 is a schematic structural diagram of an electronic device.
  • the remaining first proxy servers are reclaimed. Since the first proxy server is a proxy server with a low resource occupancy rate, recycling the remaining first proxy servers can reduce the number of proxy servers and save virtual resources. Optionally, the remaining first proxy servers may also be migrated and used in other tenants.
  • the resource scheduling method in the first embodiment further includes: sorting the first proxy servers in order of the resource occupancy rate of the first proxy server from low to high;
  • using the first proxy server to share the resource occupation of the second proxy server includes: selecting the top n first proxy servers in the sorting result to share the resource occupation of the second proxy server, where n is a positive integer.
  • the resource occupancy rate fluctuates at any time.
  • the proxy server can more fully cope with the resource occupancy and ensure the service quality. quality.
  • the top n first proxy servers in the selection sorting result may include the first n first proxy servers in the preferential selection sorting result, that is, when selecting the first proxy server for sharing, the top n first proxy servers in the sorting result are preferentially selected.
  • the server when the top n first proxy servers in the sorting result are not enough to share the resource occupation of the second proxy server, may select a first proxy server other than the top n first proxy servers in the sorting result to share the resources.
  • step S201 the resource occupancy rate of each proxy server is obtained, and the proxy server is a server deployed on a virtual machine.
  • Step S201 is the same as step S101 in the first embodiment. For details, reference may be made to the relevant description in the first embodiment, which will not be repeated here.
  • step S202 the resource occupation requirement of each second proxy server is predicted.
  • the resource occupancy requirement refers to the possible resource occupancy ratio of the proxy server. For example, the resource occupancy rate of a proxy server is 90% during peak hours and 20% during off-peak hours, then the resource occupancy requirement of the proxy server is 20%-90%.
  • the resource occupancy requirements can be predicted according to the historical data of the resource occupancy rate of each second proxy server, for example, the historical data of the resource occupancy rate within one month is selected for prediction, and the time range of the historical data specifically selected can be based on actual data. Settings are required, and there are no specific restrictions here.
  • step S203 the second proxy servers are sorted in descending order of the resource difference value of the second proxy server, and the resource difference value is the difference between the maximum resource occupation requirement and the average resource occupation requirement.
  • the maximum value of the resource occupancy requirement can be the maximum value in the historical data, or the average value of the historical data at the peak, or it can be obtained after certain modifications according to the historical data; the average value of the resource occupancy requirement can be the historical data. It can also be the weighted average of historical data during peak hours and historical data during off-peak hours, which can be specifically set according to actual needs, and there is no specific limitation here.
  • step S204 the first proxy server is used to share the resource occupation of the top m second proxy servers in the sorting result, where m is a positive integer.
  • the second proxy server may have a high resource occupancy rate, and it is necessary to ensure that the resource occupancy of these second proxy servers is effectively shared.
  • the first proxy server may be used to preferentially share the resource occupation of the top m second proxy servers in the sorting result;
  • the proxy server may also be used to share the resource occupation of other second proxy servers.
  • a proxy server whose average resource occupation requirement is greater than the second threshold may be used as the second proxy server, so that the division of the second proxy server is more stable.
  • the second proxy servers may be sorted according to the maximum resource occupation requirement, and the first proxy server is used to preferentially share the resource occupation of the second proxy server with the larger resource occupation requirement.
  • resources can be classified according to the resources, and then resources can be scheduled according to the classified proxy server using the method in the first embodiment and/or the second embodiment.
  • the following description is given by dividing the proxy servers into six categories, and the application scenario is cloud video service (ie, focusing on bandwidth resources).
  • the proxy server bandwidth resource occupancy rate is too low and the processing resource occupancy rate is normal (the bandwidth resource occupancy rate is less than 20%, and the average resource occupancy rate of CPU, memory, and storage is 20%-80%), which can be used as the first proxy server , as the resource pool shared by other proxy servers.
  • Scheduling method Arrange the proxy servers in ascending order of bandwidth resource occupancy, and give priority to proxy servers with low bandwidth resource occupancy for sharing.
  • the proxy server bandwidth resource occupancy rate is normal and the processing resource occupancy rate is stable (the bandwidth resource occupancy rate is 20%-80%, and the average resource occupancy rate of CPU, memory, and storage is 20%-80%).
  • the proxy server bandwidth resource occupancy rate is too high and the processing resource occupancy rate is normal (the bandwidth resource occupancy rate exceeds 80%, and the average resource occupancy rate of CPU, memory, and storage is 20%-80%), which can be used as the second proxy server .
  • the proxy server resource occupancy rate is too high and the processing resource occupancy rate is too high (the bandwidth resource occupancy rate exceeds 80%, and the average resource occupancy rate of CPU, memory, and storage exceeds 80%), which can be used as the second proxy server.
  • Scheduling method increase the bandwidth resources of the proxy server within the allowable range of the quota, so that the resource occupancy of the proxy server after the allocation is close to the proxy server in queue 6. If the resource occupancy rate of the proxy server is still too high after the bandwidth resources are increased, the bandwidth, CPU, memory, and storage resource occupancy requirements of each proxy server are predicted according to historical data, and the proxy server is calculated according to the predicted maximum value (maximum resource occupancy demand). value) and the predicted average value (average resource occupancy demand) in descending order, and then select the proxy server with the lowest resource occupancy rate from queue 1 for sharing, still aiming to be close to the resource occupancy situation of the proxy server in queue 6. If there is no suitable proxy server in queue 1, apply to establish a new proxy server near the proxy server for sharing, add the new proxy server after sharing to queue 1, and add the original proxy server to queue 6.
  • the proxy server resource occupancy rate is too low and the processing resource occupancy rate is too high (the bandwidth resource occupancy rate is less than 20%, and the average resource occupancy rate of CPU, memory, and storage exceeds 80%), which can be used as the first proxy server.
  • Scheduling method Arrange in descending order the proxy servers with the maximum predicted bandwidth demand higher than the actual occupancy value, and add the rest of the proxy servers to queue 1. Select the proxy server that is physically close to the proxy server from the tail of queue 1 to share the proxy server at the head of queue 1. If there are insufficient resources in queue 5, select a proxy server from queue 1 for allocation.
  • the proxy server resource occupancy rate is normal and the processing resource occupancy rate is too high (that is, the bandwidth resource occupancy rate is 20%-80%, and the average resource occupancy rate of CPU, memory, and storage exceeds 80%).
  • Scheduling method Predict the bandwidth occupancy demand of each proxy server based on historical data, sort the proxy servers in ascending order according to the difference between the maximum bandwidth resource occupancy demand and the average bandwidth resource occupancy demand, and select the bandwidth in queue 1 in turn. Proxy servers with low resource occupancy share these proxy servers. If the resources in queue 1 are insufficient, apply for establishing a new proxy server at a position adjacent to at least one proxy server at the end of the queue to share the load, and join queue 1 to continue the allocation. After the allocation is complete, if there are still remaining resources for the proxy servers in queue 1, these remaining resources can be associated with the proxy servers in queues 4 and 6 as backup. The remaining proxy servers can be configured to reduce virtual resources, or perform operations such as migration and shutdown of the remaining proxy servers.
  • the resource scheduling method in the second embodiment by predicting the resource occupancy requirements of the second proxy server, and using the first proxy server to share the resource occupancy of the second proxy server with a larger resource difference in the sorting result, the resource occupancy can be guaranteed.
  • the resources of the second proxy server which may change greatly, further optimize the scheduling of resources and improve the stability of the service quality of the proxy server.
  • the third implementation of the embodiments of the present disclosure relates to a resource scheduling system 300, as shown in FIG. 3, including a scheduling server 301 and multiple proxy servers 302, where the proxy server 302 is a server deployed on a virtual machine.
  • the scheduling server 301 is configured to: obtain the resource occupancy rate of each proxy server; and use the first proxy server to share the resource occupancy of the second proxy server, the first proxy server is a proxy server whose resource occupancy rate is less than the first threshold, and the first proxy server is a proxy server whose resource occupancy rate is less than a first threshold.
  • the second proxy server is a proxy server whose resource occupancy rate is greater than the second threshold, and the first threshold is less than the second threshold.
  • the scheduling server 301 is further configured to: sort the first proxy servers in order of the resource occupancy rate of the first proxy servers from low to high, and select the top n first proxy servers in the sorting result for sharing Occupation of resources of the second proxy server, n is a positive integer.
  • the scheduling server 301 is further configured to: predict the resource occupation requirements of each second proxy server, and sort the second proxy servers in descending order of the resource difference value of the second proxy server, and the resource difference value is The difference between the maximum resource occupancy requirement and the average resource occupancy requirement is used to share the resource occupancy of the top m second proxy servers in the sorting result by the first proxy server, where m is a positive integer.
  • the resources are bandwidth resources
  • the proxy server is a server for providing cloud video services.
  • FIG. 4 is an example diagram of applying the resource scheduling system provided by the third embodiment to a cloud video service, wherein the scheduling server 301 is the monitoring server in FIG. 4 .
  • the scheduling server 301 monitoring server
  • the proxy server of the resource scheduling system 300 in addition to the scheduling server 301 (monitoring server) and the proxy server of the resource scheduling system 300, it also includes a client, an access server, a directory server, a content server, and a transcoding server.
  • a physical server farm hosts a virtual server farm.
  • the client can be a digital terminal such as a computer, a TV, or a mobile phone, and is connected to the access server through a wireless network, a cable TV network, or the Internet, and is used to obtain video services from the cloud network.
  • the central cloud consists of a directory server and a content server.
  • the directory server provides the proxy cloud with video object search services, and the content server stores a complete backup of all video objects.
  • the near-client proxy cloud consists of access server, monitoring server, proxy server and transcoding server.
  • the access server acts as the interface for the client to request services from the proxy cloud, receives the service request from the client, obtains the list of proxy servers that can provide services and their respective operating status from the monitoring server, and selects the appropriate proxy server to establish a connection with the client and provide services.
  • the monitoring server is used to collect the distribution information of video resources in each proxy server, and provide the client with a video resource search service.
  • the resource scheduling method provided by the first embodiment and the second embodiment of the present disclosure is used to collect the operation status information of each proxy server.
  • the transcoding server is performed by a dedicated physical server, which is used to upload the data uploaded by the provider or user.
  • Video objects of different code systems are converted into video objects conforming to the code system of the cloud network video service platform.
  • FIG. 5 is a schematic flowchart of FIG. 4 when the client obtains video services; the specific process is: 1.
  • the client connects to an access server in the cloud through the Internet, and submits a video service request (including video objects); 2.
  • the access server obtains the list of proxy servers that can provide services for clients from the monitoring server; 3.
  • the monitoring server searches for proxy servers that can provide services for clients.
  • the directory server queries resources, otherwise go to step 6; 4.
  • the directory server of the central cloud searches and selects a content server that stores the data required by the customer; 5.
  • the content server transmits the required resources to the proxy server in the proxy cloud (for example, it can be is the first proxy server); 6.
  • the monitoring server selects the first proxy server to serve the client according to the proxy server resources and operating status information it has mastered, and balances the resource occupancy rate of each proxy server at the same time, and after completing the selection, will serve
  • the information is returned to the access server; 7.
  • the access server establishes a connection between the proxy server and the client; 8.
  • the proxy server responds to the client's data request; 9.
  • the client receives and buffers part of the data and starts playing, and continues to request the remaining data.
  • the third embodiment is a system embodiment corresponding to the first embodiment and the second embodiment, and the third embodiment can be implemented in cooperation with the first embodiment and the second embodiment.
  • the related technical details mentioned in the first embodiment and the second embodiment are still valid in the third embodiment, and are not repeated here in order to reduce repetition.
  • the relevant technical details mentioned in the third embodiment can also be applied to the first embodiment and the second embodiment.
  • modules involved in the third embodiment are all logical modules.
  • a logical unit may be a physical unit, a part of a physical unit, or multiple A composite implementation of physical units.
  • the third embodiment does not introduce units that are not so closely related to solving the technical problems raised by the present disclosure, but this does not mean that there are no other units in the third embodiment. .
  • the fourth implementation of the embodiments of the present disclosure relates to an electronic device, as shown in FIG. 6 , comprising: at least one processor 402 ; and a memory 401 communicatively connected to the at least one processor 402 ; Instructions executed by one processor 402, the instructions are executed by at least one processor 402, so that at least one processor 402 can execute the above-mentioned resource scheduling method.
  • the memory 401 and the processor 402 are connected by a bus.
  • the bus may include any number of interconnected buses and bridges.
  • the bus connects one or more processors 402 and various circuits of the memory 401 together.
  • the bus may also connect together various other circuits, such as peripherals, voltage regulators, and power management circuits, which are well known in the art and therefore will not be described further herein.
  • the bus interface provides the interface between the bus and the transceiver.
  • a transceiver may be a single element or multiple elements, such as multiple receivers and transmitters, providing a means for communicating with various other devices over a transmission medium.
  • the data processed by the processor 402 is transmitted on the wireless medium through the antenna, and further, the antenna also receives the data and transmits the data to the processor 402 .
  • the fifth implementation of the embodiments of the present disclosure relates to a computer-readable storage medium on which a computer program is stored.
  • the computer program is executed by the processor, any one of the resource scheduling methods provided by the present disclosure is implemented.
  • the aforementioned storage medium includes: U disk, mobile hard disk, read-only memory (Read-Only Memory, ROM), random access memory (Random Access Memory, RAM), magnetic disk or optical disk and other media that can store program codes .

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开涉及通信技术领域,并提供了一种资源调度方法,包括:获取多个代理服务器的资源占用率,多个代理服务器部署在虚拟机上;以及,利用至少一个第一代理服务器分担至少一个第二代理服务器的资源的占用,至少一个第一代理服务器中的每个第一代理服务器的资源占用率小于第一阈值,至少一个第二代理服务器中的每个第二代理服务器的资源占用率大于第二阈值,且第一阈值小于第二阈值。本公开还公开了一种资源调度系统、电子设备及计算机可读存储介质。

Description

资源调度方法和系统、电子设备及计算机可读存储介质
本公开要求在2020年9月22日提交中国专利局、申请号为202011001012.8的中国专利申请的优先权,该申请的全部内容通过引用结合在本公开中。
技术领域
本公开实施例涉及通信技术领域。
背景技术
随着互联网的普及和宽带基础设施建设的发展,用户对网络视频的需求也有很大增长。各网络视频网站已经覆盖94%以上的互联网用户,与资讯、邮箱、即时通信(Instant Messaging,IM)等成为互联网的基础应用之一。
发明内容
本公开实施例的一个方面提供一种资源调度方法,包括:获取多个代理服务器的资源占用率,其中,多个代理服务器部署在虚拟机上;以及,利用至少一个第一代理服务器分担至少一个第二代理服务器的资源的占用;其中,至少一个第一代理服务器中的每个第一代理服务器的资源占用率小于第一阈值,至少一个第二代理服务器中的每个第二代理服务器的资源占用率大于第二阈值,且第一阈值小于第二阈值。
本公开实施例的另一个方面提供一种资源调度系统,包括调度服务器和多个代理服务器,多个代理服务器部署在虚拟机上;其中,调度服务器被配置为:获取多个代理服务器的资源占用率;以及,利用至少一个第一代理服务器分担至少一个第二代理服务器的资源的占用;其中,至少一个第一代理服务器中的每个第一代理服务器的资源占用率小于第一阈值,至少一个第二代理服务器中的每个第二代理服务器的资源占用率大于第二阈值,且第一阈值小于第二阈值。
本公开实施例的再一个方面提供一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例提供的资源调度方法。
本公开实施例的又一个方面提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本公开实施例提供的资源调度方法。
附图说明
图1为资源调度方法的流程示意图。
图2为资源调度方法的流程示意图。
图3为资源调度系统的模块结构示意图。
图4为资源调度系统应用在云视频服务的示例图。
图5为图4对应的流程示意图。
图6为电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合附图对本公开的实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本公开实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本公开的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
传统的网络视频网站的视频服务都是基于物理机部署的,通过前端业务代理服务器进行负载调度。然而,各网络视频网站的资源(如带宽、中央处理器(Central Processing Unit,CPU)、内存等)使用情况是波动的,高峰时可能存在部分物理机的资源被占用过多的情况,导致网站的服务质量无法得到有效保证,影响用户体验。
本公开实施例的第一实施方式涉及一种资源调度方法,通过获取各个代理服务器的资源占用率,其种,代理服务器为部署在虚拟机上的服务器;利用第一代理服务器分担第二代理服务器的资源的占用,第一代理服务器为资源占用率小于第一阈值的代理服务器,第二代理服务器为资源占用率大于第二阈值的代理服务器,第一阈值小于第二阈值。通过虚拟化技术重新组合代理服务器的资源,利用资源占用率较低的代理服务器分担资源占用率较高的代理服务器,可以实现资源的灵活分配,从而保证每个代理服务器的资源占用率保持在合理范围内,有效保证网站的服务质量,提高用户体验。
应当说明的是,第一实施方式提供的资源调度方法的执行主体可以为各个代理服务器连接的服务端,服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。可选地,服务端可以与接入服务器连接,接入服务器与客户端连接,用于处理客户端发起的请求。
第一实施方式提供的资源调度方法的具体流程如图1所示,具体包括以下步骤S101和步骤S102。
在步骤S101中,获取各个代理服务器的资源占用率,代理服务器为部署在虚拟机上的服务器。
代理服务器是虚拟机通过虚拟化技术从物理服务器中虚拟出来的服务器,物理服务器为代理服务器的宿主机,一台物理服务器可以对应一台以上虚拟出来的代理服务器。
资源可以包括代理服务器的带宽、计算(包括CPU或图形处理器(Graphics Processing Unit,GPU))、存储(包括内存)资源等,而资源占用率是指资源被占用的比例。计算资源和存储资源可统称为处理资源,表示代理服务器的处理能力。应当说明的是,在第一实施方式中,代理服务器的资源可以指以上资源中至少一个资源。
可选地,代理服务器的资源为带宽资源,代理服务器为用于提供云视频服务的服务器。
在步骤S102中,利用第一代理服务器分担第二代理服务器的资源的占用,第一代理服务器为资源占用率小于第一阈值的代理服务器, 第二代理服务器为资源占用率大于第二阈值的代理服务器,第一阈值小于第二阈值。
第一阈值和第二阈值可以根据实际经验或实际情况进行设置,例如第一阈值可以为20%、30%或40%等,第二阈值可以为70%、80%或90%等。
在一个具体的例子中,在利用第一代理服务器分担第二代理服务器的资源的占用后,若还存在剩余的第一代理服务器,则回收剩余的第一代理服务器。由于第一代理服务器为资源占用率较低的代理服务器,因此回收剩余的第一代理服务器,可以减少代理服务器的数量,节省虚拟资源。可选地,也可以将剩余的第一代理服务器进行迁移,用到其它租户中。
可选地,对资源占用率在第一阈值与第二阈值之间的代理服务器可不作处理,亦可以在第一代理服务器不足以分担第二代理服务器的资源的占用时,使用该部分代理服务器分担第二代理服务器的资源。可选地,若在利用第一代理服务器分担第二代理服务器资源的占用后,仍存在部分第二代理服务器的资源的占用未被分担,则新建至少一个代理服务器,利用新建的代理服务器分担该部分第二代理服务器的资源的占用。在新建代理服务器时,可以优先在第二代理服务器的临近位置进行新建,例如优先在与第二代理服务器同一宿主(物理服务器)进行新建,或者在与第二代理服务器宿主附近的物理服务器进行新建。
可选地,在利用第一代理服务器分担第二代理服务器的资源的占用之前,还可以先增加第二代理服务器的资源;而利用第一代理服务器分担第二代理服务器的资源的占用,则包括若增加后的第二代理服务器的资源占用率仍大于第二阈值,再利用第一代理服务器分担增加资源后的第二代理服务器的资源的占用。
具体地,可以通过虚拟化技术在租户配额允许的范围内先增加第二代理服务器的资源。例如,若某一第二代理服务器的配额为20M的带宽,但当前只有10M,则可以先将该第二代理服务器带宽配置为20M的带宽,再获取增加资源后该第二代理服务器的资源占用率;若增加资源后的资源占用率小于或等于第二阈值,则将该代理服务器从 第二代理服务器的列表中去除;若增加资源后的资源占用率仍大于第二阈值,则利用第一代理服务器分担该第二代理服务器的资源的占用。
可选地,在利用第一代理服务器分担第二代理服务器的资源的占用时,可以随机选取一个第一代理服务器分担第二代理服务器的资源的占用。
在一个具体的例子中,在步骤S102之前,第一实施方式中的资源调度方法还包括:以第一代理服务器的资源占用率从低到高的顺序,对各第一代理服务器进行排序;在步骤S102中,利用第一代理服务器分担第二代理服务器的资源的占用,包括:选择排序结果中前n个第一代理服务器用于分担第二代理服务器的资源占用,n为正整数。
例如,将第一代理服务器的资源占用率从低到高排成一个队列,从队列的头部(即资源占用率较低)选取第一代理服务器分担第二代理服务器的资源的占用。
可以理解的是,资源占用率是随时波动的,通过选择资源占用率较低的第一代理服务器分担第二代理服务器的资源的占用,可以使代理服务器更加充分地应对资源的占用,保证服务的质量。另外,选择排序结果中前n个第一代理服务器可以包括优先选择排序结果前n个第一代理服务器,即在选择用于分担的第一代理服务器时,优先选择排序结果前n个第一代理服务器,在排序结果前n个第一代理服务器不足以分担第二代理服务器的资源的占用时,可以选择除排序结果前n个第一代理服务器之外的第一代理服务器来分担。
同样地,还可以以第二代理服务器的资源占用率从高到低的顺序,对各个第二代理服务器进行排序,利用第一代理服务器优先分担资源占用率较高的第二代理服务器的资源的占用。
根据第一实施方式中的资源调度方法,通过获取虚拟机上代理服务器的资源占用率,利用资源占用率较低的代理服务器分担资源占用率较高的代理服务器,通过虚拟化技术重新组合代理服务器的资源,可以实现整体资源的灵活分配,从而保证每个代理服务器的资源占用率保持在一个合理的范围内,有效保证服务器(网站)的服务质量,提高用户体验。
本公开实施例的第二实施方式涉及一种资源调度方法,第二实施方式与第一实施方式大致相同,主要区别在于:在第二实施方式中,还对第二代理服务器的资源占用需求进行预测,根据资源占用需求的情况进行代理服务器资源占用的分担。
第二实施方式提供的资源调度方法的具体流程如图2所示,具体包括以下步骤S201-步骤S204。
在步骤S201中,获取各个代理服务器的资源占用率,代理服务器为部署在虚拟机上的服务器。
步骤S201与第一实施方式中的步骤S101相同,具体可参见第一实施方式中的相关描述,这里不再赘述。
在步骤S202中,预测每一第二代理服务器的资源占用需求。
资源占用需求是指代理服务器可能出现的资源占用比例,例如某一代理服务器在高峰时的资源占用率为90%,非高峰时的资源占用率为20%,则该代理服务器的资源占用需求为20%-90%。
可选地,可以根据各第二代理服务器的资源占用率的历史数据预测其资源占用需求,例如选取一个月内的资源占用率的历史数据进行预测,具体选取的历史数据的时间范围可以根据实际需要进行设置,此处不做具体限制。
在步骤S203中,以第二代理服务器的资源差值从大到小的顺序,对各第二代理服务器进行排序,资源差值为资源占用需求最大值与资源占用需求平均值的差值。
可选地,资源占用需求最大值可以为历史数据中的最大值,亦可以为历史数据在高峰时的平均值,还可以根据历史数据作一定修改后得到;资源占用需求平均值可以为历史数据的平均值,亦可以为高峰时的历史数据和非高峰时的历史数据的加权平均,具体可以根据实际需要进行具体设置,此处不做具体限制。
在步骤S204中,利用第一代理服务器分担排序结果中前m个第二代理服务器的资源的占用,m为正整数。
应当理解的是,当资源差值较大时,表示第二代理服务器可能会出现较高的资源占用率,需要保证这些第二代理服务器的资源的占 用被有效分担。在利用第一代理服务器分担排序结果中前m个第二代理服务器的资源的占用时,可以是利用第一代理服务器优先分担排序结果中前m个第二代理服务器的资源的占用;在第一代理服务器足于分担排序结果中前m个第二代理服务器的资源的占用时,也可以利用第一代理服务器分担其它第二代理服器的资源的占用。
在一个具体的例子中,可以将资源占用需求的平均值大于第二阈值的代理服务器作为第二代理服务器,从而使第二代理服务器的划分更加稳定。
可选地,可以根据资源占用需求最大值对第二代理服务器进行排序,利用第一代理服务器优先分担资源占用需求最大值较大的第二代理服务器的资源的占用。
应当说明的是,由于资源可以是多种,因此实际应用中可以根据资源进行分类,再根据分类后的代理服务器运用第一实施方式和/或第二实施方式中的方法进行资源的调度。为了更加清楚地说明本公开提供的资源调度方法,以下以将代理服务器分为六类、应用场景为云视频服务(即注重带宽资源)为例进行说明。
队列1:代理服务器带宽资源占用率过低且处理资源占用率正常(带宽资源占用率小于20%,且CPU、内存、存储平均资源占用率在20%-80%),可作为第一代理服务器,作为其它代理服务器分担的资源池。
调度方法:将代理服务器按带宽资源占用率升序排列,优先选择带宽资源占用率低的代理服务器进行分担。
队列2:代理服务器带宽资源占用率正常且处理资源占用率稳定(带宽资源占用率在20%-80%,且CPU、内存、存储平均资源占用率在20%-80%)。
调度方法:对此队列不做处理。
队列3:代理服务器带宽资源占用率过高且处理资源占用率正常(带宽资源占用率超过80%,且CPU、内存、存储平均资源占用率在20%-80%),可作为第二代理服务器。
调度方法:可选择队列1中的代理服务器为其分担,否则尝试 在允许范围增加代理服务器的带宽资源,或者,向服务端申请实施虚拟机迁移,或者,在队列3代理服务器的临近位置创建新的代理服务器进行分担。
队列4:代理服务器资源占用率过高且处理资源占用率过高(带宽资源占用率超过80%,且CPU、内存、存储平均资源占用率超过80%),可作为第二代理服务器。
调度方法:在配额允许范围内增加代理服务器的带宽资源,使分配结束后代理服务器的资源占用情况接近队列6中代理服务器。若带宽资源增加后代理服务器的资源占用率仍过高,则根据历史数据对每个代理服务器的带宽、CPU、内存、存储资源占用需求进行预测,将代理服务器按预测最大值(资源占用需求最大值)与预测平均值(资源占用需求平均值)的差值降序排列,然后从队列1中选择资源占用率最低的代理服务器进行分担,仍以接近队列6中代理服务器的资源占用情况为目标。如队列1中无合适的代理服务器,则申请在代理服务器的临近位置建立新的代理服务器进行分担,将分担后的新代理服务器加入队列1,原代理服务器加入队列6。
队列5:代理服务器资源占用率过低且处理资源占用率过高(带宽资源占用率小于20%,且CPU、内存、存储平均资源占用率超过80%),可作为第一代理服务器。
调度方法:将带宽预测需求最大值高于实际占有值的代理服务器进行降序排列,其余代理服务器加入队列1,从队列1尾部选择物理位置临近的代理服务器对队列1头的代理服务器进行分担。如队列5中资源不足,从队列1中选择代理服务器进行分配。
队列6:代理服务器资源占用率正常且处理资源占用率过高(即带宽资源占用率在20%-80%,且CPU、内存、存储平均资源占用率超过80%)。
调度方法:根据历史数据对每个代理服务器的带宽占用需求进行预测,将代理服务器按带宽资源占用需求最大值和带宽资源占用需求平均值的差值进行升序排列,在队列1中依次选出带宽资源占用率低的代理服务器对这些代理服务器进行分担。如队列1中资源不足, 则申请在队列尾的至少一个代理服务器临近位置建立新的代理服务器分担负载,加入队列1继续分配。分配完毕后,如队列1中代理服务器仍有剩余资源,可将这些剩余资源与队列4和6中的代理服务器关联起来作为备用。对其余代理服务器可通过配置减少虚拟资源,或者对其余代理服务器进行迁移、关闭等操作。
根据第二实施方式中的资源调度方法,通过预测第二代理服务器的资源占用需求,利用第一代理服务器分担排序结果中资源差值较大的第二代理服务器的资源的占用,可以保证资源占用可能出现较大变化的第二代理服务器的资源,进一步优化了资源的调度,提高了代理服务器服务质量的稳定性。
此外,本领域技术人员可以理解,上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本公开实施例的第三实施方式涉及一种资源调度系统300,如图3所示,包括调度服务器301和多个代理服务器302,代理服务器302为部署于虚拟机上的服务器。
调度服务器301被配置为:获取各个代理服务器的资源占用率;以及,利用第一代理服务器分担第二代理服务器的资源的占用,第一代理服务器为资源占用率小于第一阈值的代理服务器,第二代理服务器为资源占用率大于第二阈值的代理服务器,第一阈值小于第二阈值。
进一步地,调度服务器301还被配置为:以第一代理服务器的资源占用率从低到高的顺序,对各第一代理服务器进行排序,选择排序结果中前n个第一代理服务器用于分担第二代理服务器的资源的占用,n为正整数。
进一步地,调度服务器301还被配置为:在存在剩余的第一代理服务器时,回收剩余的第一代理服务器。
进一步地,调度服务器301还被配置为:预测各第二代理服务 器的资源占用需求,以第二代理服务器的资源差值从大到小的顺序,对第二代理服务器进行排序,资源差值为资源占用需求最大值与资源占用需求平均值的差值,利用第一代理服务器分担排序结果中前m个第二代理服务器的资源的占用,m为正整数。
进一步地,调度服务器301还被配置为:在存在第二代理服务器的资源的占用未被分担时,新建至少一个代理服务器,利用新建的代理服务器分担第二代理服务器的资源的占用。
进一步地,调度服务器301还被配置为:增加第二代理服务器的资源,若增加后的第二代理服务器的资源占用率仍大于第二阈值,则利用第一代理服务器分担增加资源后的第二代理服务器的资源的占用。
进一步地,资源为带宽资源,代理服务器为用于提供云视频服务的服务器。
进一步地,资源为处理资源,处理资源包括计算资源和存储资源。
请参考图4,其为第三实施方式提供的资源调度系统应用在云视频服务的示例图,其中调度服务器301为图4中的监控服务器。具体地,在图4中,除了资源调度系统300的调度服务器301(监控服务器)和代理服务器外,还包括客户端、接入服务器、目录服务器、内容服务器和编码转换服务器。物理服务器群为虚拟服务器群的宿主。客户端可以是计算机、电视机或手机等数字终端,通过无线网络、有线电视网络或互联网与接入服务器连接,用于获取云网络的视频服务。中心云由目录服务器和内容服务器组成,目录服务器为代理云提供视频对象的查找服务,内容服务器存有所有视频对象的完整备份。近客户端代理云由接入服务器、监控服务器、代理服务器和编码转换服务器组成。接入服务器作为客户端向代理云请求服务的接口,接收客户端的服务请求,向监控服务器获取可提供服务的代理服务器列表及各自运行状态,选择合适的代理服务器与客户端建立连接并提供服务。监控服务器用于收集各代理服务器中视频资源的分布信息,为客户端提供查找视频资源服务,利用本公开第一实施方式和第二实施方式提 供的资源调度方法,在收集各代理服务器运行状态信息的同时,为各代理服务器平衡负载,调度资源分配,即选择为客户端数据请求提供服务的服务器和调度相关虚拟资源;编码转换服务器由专门的物理服务器担当,用于将提供商或用户上传的不同码制的视频对象转换成符合云网络视频服务平台的码制的视频对象。
请参考图5,其为图4在客户端获取视频服务时的流程示意图;具体的流程为:1、客户端通过互联网连接到云中的接入服务器,提交视频服务请求(包括视频对象);2、接入服务器向监控服务器获取可为客户端提供服务的代理服务器列表;3、监控服务器搜索可为客户端提供服务的代理服务器,如代理云内无客户端请求的资源则向中心云的目录服务器查询资源,否则转步骤6;4、中心云的目录服务器查找并选择存有客户所需数据的一个内容服务器;5、内容服务器将所需资源传送给代理云中的代理服务器(例如可以是第一代理服务器);6、监控服务器根据掌握的代理服务器资源和运行状态信息,选择第一代理服务器为客户端服务,同时平衡各个代理服务器的资源占用率,并在完成选择后,将服务信息返回给接入服务器;7、接入服务器建立代理服务器与客户端的连接;8、代理服务器响应客户端的数据请求;9、客户端接收并缓冲一部分数据后开始播放,继续请求剩余数据。
不难发现,第三实施方式为与第一实施方式及第二实施方式相对应的系统实施方式,第三实施方式可与第一实施方式及第二实施方式互相配合实施。第一实施方式及第二实施方式中提到的相关技术细节在第三实施方式中依然有效,为了减少重复,这里不再赘述。相应地,第三实施方式中提到的相关技术细节也可应用在第一实施方式及第二实施方式中。
值得一提的是,第三实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本公开的创新部分,第三实施方式中并没有将与解决本公开所提出的技术问题关系不太密切的单元引入,但这并不表明第三实施方 式中不存在其它的单元。
本公开实施例的第四实施方式涉及一种电子设备,如图6所示,包括:至少一个处理器402;以及,与至少一个处理器402通信连接的存储器401;存储器401存储有可被至少一个处理器402执行的指令,指令被至少一个处理器402执行,以使至少一个处理器402能够执行上述的资源调度方法。
存储器401和处理器402采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器402和存储器401的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器402处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器402。
处理器402负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器401可以被用于存储处理器402在执行操作时所使用的数据。
本公开实施例第五实施方式涉及一种计算机可读存储介质,其上存储有计算机程序。计算机程序被处理器执行时实现本公开提供的任一个资源调度方法。
即,本领域技术人员可以理解,实现上述实施方式中的方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括至少一个指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施例是实现本公开 的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本公开的精神和范围。

Claims (11)

  1. 一种资源调度方法,包括:
    获取多个代理服务器的资源占用率,其中,所述多个代理服务器部署在虚拟机上;以及
    利用至少一个第一代理服务器分担至少一个第二代理服务器的资源的占用;其中,所述至少一个第一代理服务器中的每个第一代理服务器的资源占用率小于第一阈值,所述至少一个第二代理服务器中的每个第二代理服务器的资源占用率大于第二阈值,且所述第一阈值小于所述第二阈值。
  2. 根据权利要求1所述的资源调度方法,其中,
    在利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用之前,所述方法还包括:根据资源占用率从低到高的顺序,对所述至少一个第一代理服务器进行排序,得到第一排序结果;以及
    利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用,包括:
    确定所述第一排序结果中的前n个第一代理服务器,所述n为正整数;以及
    利用所述前n个第一代理服务器分担所述至少一个第二代理服务器的资源的占用。
  3. 根据权利要求2所述的资源调度方法,在利用所述前n个第一代理服务器分担所述至少一个第二代理服务器的资源的占用之后,还包括:
    响应于确定所述至少一个第一代理服务器的数量大于所述n,回收所述至少一个第一代理服务器中的除所述前n个第一代理服务器之外的其它第一代理服务器。
  4. 根据权利要求1所述的资源调度方法,其中,
    在利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用之前,所述方法还包括:
    预测所述至少一个第二代理服务器的资源占用需求;以及
    根据资源差值从大到小的顺序,对所述至少一个第二代理服务器进行排序,得到第二排序结果;其中,所述第二代理服务器的资源差值为所述第二代理服务器的资源占用需求最大值与所述第二代理服务器的资源占用需求平均值的差值;以及
    利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用,包括:
    确定所述第二排序结果中的前m个第二代理服务器,所述m为正整数;以及
    利用所述至少一个第一代理服务器分担所述前m个第二代理服务器的资源的占用。
  5. 根据权利要求1所述的资源调度方法,在利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用之后,还包括:
    响应于确定所述至少一个第二代理服务器的数量大于所述m,新建至少一个第三代理服务器;以及
    利用所述至少一个第三代理服务器分担所述至少一个第二代理服务器中的除所述前m个第二代理服务器之外的其它第二代理服务器的资源的占用。
  6. 根据权利要求1所述的资源调度方法,其中,
    在利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用之前,还包括:增加所述至少一个第二代理服务器的资源;以及
    利用所述至少一个第一代理服务器分担所述至少一个第二代理服务器的资源的占用,包括:
    响应于确定增加资源后的第二代理服务器的资源占用率仍大于 所述第二阈值,利用所述至少一个第一代理服务器分担所述增加资源后的第二代理服务器的资源的占用。
  7. 根据权利要求1至6中任一项所述的资源调度方法,其中,所述资源为带宽资源,以及所述多个代理服务器用于提供云视频服务。
  8. 根据权利要求1至6中任一项所述的资源调度方法,其中,所述资源为处理资源,且所述处理资源包括计算资源和存储资源。
  9. 一种资源调度系统,包括调度服务器和多个代理服务器,所述多个代理服务器部署在虚拟机上;其中,所述调度服务器被配置为:
    获取所述多个代理服务器的资源占用率;以及
    利用至少一个第一代理服务器分担至少一个第二代理服务器的资源的占用;其中,所述至少一个第一代理服务器中的每个第一代理服务器的资源占用率小于第一阈值,所述至少一个第二代理服务器中的每个第二代理服务器的资源占用率大于第二阈值,且所述第一阈值小于所述第二阈值。
  10. 一种电子设备,包括:
    至少一个处理器;以及
    与所述至少一个处理器通信连接的存储器;其中,
    所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据权利要求1至8任一项所述的资源调度方法。
  11. 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至8任一项所述的资源调度方法。
PCT/CN2021/118436 2020-09-22 2021-09-15 资源调度方法和系统、电子设备及计算机可读存储介质 WO2022062981A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020237013946A KR20230073315A (ko) 2020-09-22 2021-09-15 리소스 스케줄링 방법 및 시스템, 전자 디바이스, 그리고 컴퓨터 판독 가능 저장 매체
JP2023518479A JP2023543744A (ja) 2020-09-22 2021-09-15 リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体
US18/027,664 US20230379268A1 (en) 2020-09-22 2021-09-15 Resource scheduling method and system, electronic device, computer readable storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011001012.8A CN114253698A (zh) 2020-09-22 2020-09-22 资源调度方法、系统、电子设备及存储介质
CN202011001012.8 2020-09-22

Publications (1)

Publication Number Publication Date
WO2022062981A1 true WO2022062981A1 (zh) 2022-03-31

Family

ID=80789506

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/118436 WO2022062981A1 (zh) 2020-09-22 2021-09-15 资源调度方法和系统、电子设备及计算机可读存储介质

Country Status (5)

Country Link
US (1) US20230379268A1 (zh)
JP (1) JP2023543744A (zh)
KR (1) KR20230073315A (zh)
CN (1) CN114253698A (zh)
WO (1) WO2022062981A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009091A (zh) * 2023-10-07 2023-11-07 浪潮(山东)计算机科技有限公司 一种资源调整方法、装置、设备及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117519913B (zh) * 2024-01-08 2024-03-22 联通在线信息科技有限公司 一种容器内存资源弹性伸缩调度方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105553721A (zh) * 2015-12-15 2016-05-04 浪潮电子信息产业股份有限公司 一种云应用伸缩方法、应用管理端和系统
CN108924139A (zh) * 2018-07-05 2018-11-30 杭州安恒信息技术股份有限公司 基于云端提升文件检测效率的方法、装置及执行服务器
US20190220369A1 (en) * 2018-01-18 2019-07-18 EMC IP Holding Company LLC Method, device and computer program product for data backup
CN110597631A (zh) * 2019-09-06 2019-12-20 广州华多网络科技有限公司 资源管理方法、监控服务器、代理服务器以及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105553721A (zh) * 2015-12-15 2016-05-04 浪潮电子信息产业股份有限公司 一种云应用伸缩方法、应用管理端和系统
US20190220369A1 (en) * 2018-01-18 2019-07-18 EMC IP Holding Company LLC Method, device and computer program product for data backup
CN108924139A (zh) * 2018-07-05 2018-11-30 杭州安恒信息技术股份有限公司 基于云端提升文件检测效率的方法、装置及执行服务器
CN110597631A (zh) * 2019-09-06 2019-12-20 广州华多网络科技有限公司 资源管理方法、监控服务器、代理服务器以及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009091A (zh) * 2023-10-07 2023-11-07 浪潮(山东)计算机科技有限公司 一种资源调整方法、装置、设备及可读存储介质
CN117009091B (zh) * 2023-10-07 2023-12-19 浪潮(山东)计算机科技有限公司 一种资源调整方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN114253698A (zh) 2022-03-29
US20230379268A1 (en) 2023-11-23
JP2023543744A (ja) 2023-10-18
KR20230073315A (ko) 2023-05-25

Similar Documents

Publication Publication Date Title
US11429449B2 (en) Method for fast scheduling for balanced resource allocation in distributed and collaborative container platform environment
US10772115B2 (en) Resource scheduling method and server
US20190324819A1 (en) Distributed-system task assignment method and apparatus
US9442763B2 (en) Resource allocation method and resource management platform
CN110858161B (zh) 资源分配方法、装置、系统、设备和介质
EP2822236B1 (en) Network bandwidth distribution method and terminal
US20170126583A1 (en) Method and electronic device for bandwidth allocation based on online media services
WO2022062981A1 (zh) 资源调度方法和系统、电子设备及计算机可读存储介质
CN108897606B (zh) 多租户容器云平台虚拟网络资源自适应调度方法及系统
CN104243405A (zh) 一种请求处理方法、装置及系统
CN102970379A (zh) 在多个服务器之间实现负载均衡的方法
CN102981973B (zh) 在存储系统中执行请求的方法
CN112817728B (zh) 任务调度方法、网络设备和存储介质
WO2017075967A1 (zh) 在线媒体服务的带宽分配方法及系统
CN110493317B (zh) 处理云平台资源碎片的方法及相关设备
CN112600761A (zh) 一种资源分配的方法、装置及存储介质
AU2020308941A1 (en) Dynamic allocation of computing resources
CN101867580A (zh) 一种分配网络流量的方法及装置
US10691700B1 (en) Table replica allocation in a replicated storage system
CN113765969A (zh) 一种流量控制方法和装置
Guo et al. PARA: Performability‐aware resource allocation on the edges for cloud‐native services
CN117056064A (zh) 资源分配方法、装置、服务器、存储介质和程序产品
EP3038306B1 (en) Load balancing method and system
CN113626175A (zh) 数据处理的方法和装置
CN115361285B (zh) 实现离在线业务混合部署的方法、装置、设备及介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21871352

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2023518479

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20237013946

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 11.08.2023)

122 Ep: pct application non-entry in european phase

Ref document number: 21871352

Country of ref document: EP

Kind code of ref document: A1