JP2023543744A - リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体 - Google Patents
リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体 Download PDFInfo
- Publication number
- JP2023543744A JP2023543744A JP2023518479A JP2023518479A JP2023543744A JP 2023543744 A JP2023543744 A JP 2023543744A JP 2023518479 A JP2023518479 A JP 2023518479A JP 2023518479 A JP2023518479 A JP 2023518479A JP 2023543744 A JP2023543744 A JP 2023543744A
- Authority
- JP
- Japan
- Prior art keywords
- proxy server
- resource
- proxy
- server
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000004891 communication Methods 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/82—Miscellaneous aspects
- H04L47/822—Collecting or measuring resource availability data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/78—Architectures of resource allocation
- H04L47/781—Centralised allocation of resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/83—Admission control; Resource allocation based on usage prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5022—Workload threshold
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本願は通信技術分野に関するものであり、また、仮装マシンに配置された複数のプロキシサーバのリソース利用率を取得するステップと、少なくとも1つの第1プロキシサーバを用いて少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップと、を含み、少なくとも1つの第1プロキシサーバにおける各第1プロキシサーバのリソース利用率は第1閾値よりも小さく、少なくとも1つの第2プロキシサーバにおける各第2プロキシサーバのリソース利用率は第2閾値よりも大きく、且つ第1閾値は第2閾値よりも小さい、リソーススケジューリング方法を提供する。本願ではリソーススケジューリングシステム、電子デバイスおよびコンピュータ可読記憶媒体をさらに開示する。
【選択図】図1
【選択図】図1
Description
本願は、2020年9月22日に中国特許庁へ提出された、出願番号を202011001012.8とする中国特許出願の優先権を主張し、当該出願のすべての内容を参照により本願に援用する。
本願の実施例は通信技術分野に関するものである。
インターネットの普及とブロードバンドインフラの発展に伴い、ユーザのインターネット動画に対する需要も大きく伸びている。各インターネット動画サイトはすでに94%以上のインターネットユーザをカバーしており、情報、電子メール、インスタントメッセージング(Instant Messaging、IM)等とともにインターネットの基礎応用の1つとなっている。
本願実施例の一態様は、仮装マシンに配置された複数のプロキシサーバのリソース利用率を取得するステップと、少なくとも1つの第1プロキシサーバを用いて少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップと、を含み、少なくとも1つの第1プロキシサーバにおける各第1プロキシサーバのリソース利用率は第1閾値よりも小さく、少なくとも1つの第2プロキシサーバにおける各第2プロキシサーバのリソース利用率は第2閾値よりも大きく、且つ第1閾値は第2閾値よりも小さい、リソーススケジューリング方法を提供する。
本願実施例のもう1つの様態は、スケジューリングサーバと複数のプロキシサーバを含み、複数のプロキシサーバは仮装マシンに配置され、スケジューリングサーバは、複数のプロキシサーバのリソース利用率を取得し、少なくとも1つの第1プロキシサーバを用いて少なくとも1つの第2プロキシサーバのリソースの占用を分担するように配置され、少なくとも1つの第1プロキシサーバにおける各第1プロキシサーバのリソース利用率は第1閾値よりも小さく、少なくとも1つの第2プロキシサーバにおける各第2プロキシサーバのリソース利用率は第2閾値よりも大きく、且つ第1閾値は第2閾値よりも小さい、リソーススケジューリングシステムを提供する。
本願実施例のもう1つの様態は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信接続されたメモリと、を含み、メモリに、少なくとも1つのプロセッサによって実行可能な指令が記憶されており、指令が少なくとも1つのプロセッサにより実行されることで、少なくとも1つのプロセッサに本願実施例が提供するリソーススケジューリング方法を実行させることができる、電子デバイスを提供する。
本願実施例のもう1つの様態は、コンピュータプログラムが記憶されており、コンピュータプログラムがプロセッサによって実行される時に、本願実施例が提供するリソーススケジューリング方法を実現する、コンピュータ可読記憶媒体を提供する。
本願の実施例の目的、技術案、メリットをより明瞭にするために、以下では図面を組み合わせて本願の実施例について詳細に説明する。本願の実施例では、読者に本願をよりよく理解させるために多くの技術詳細を示しているが、これらの技術詳細と以下の各実施例に基づく種々の変化と修正がなくても、本願が請求する技術案を実現できると当業者は理解できる。以下の各実施例の区分は説明に便宜を図るためのものであり、本願の具体的な実現方式に対していかなる限定も構成せず、各実施例は矛盾しないことを前提として互いに組み合わせて、互いに引用することができる。
従来のネットワークビデオサイトのビデオサービスはいずれも物理マシンに基づいて配置され、フロントエンドプロキシサーバを介してロードスケジューリングを行うものである。しかし、各ネットワークビデオサイトのリソース(例えば帯域幅、中央プロセッサ(Central Processing Unit、CPU)、メモリ等)の使用状況は変動するものであり、ピーク時に一部の物理マシンのリソース占有が多くなりすぎる場合があるため、サイトのサービス品質が有効に保証できず、ユーザ体験に影響を与える可能性がある。
本願実施例の第1実施形態は、各プロキシサーバのリソース利用率を取得するリソーススケジューリング方法に関するものであり、プロキシサーバは仮装マシンに配置されるサーバであり、第1プロキシサーバを用いて第2プロキシサーバのリソースの占用を分担し、第1プロキシサーバはリソース利用率が第1閾値よりも小さいプロキシサーバであり、第2プロキシサーバはリソース利用率が第2閾値よりも大きいプロキシサーバであり、第1閾値は第2閾値よりも小さい。仮想化技術を通じてプロキシサーバのリソースを再度組み合わせ、リソース利用率の低いプロキシサーバを用いてリソース利用率の高いプロキシサーバの分担をし、リソースの柔軟な分配を実現することができ、さらには各プロキシサーバのリソース利用率を合理的な範囲内に維持することを保証し、サイトのサービス品質を効果的に保証し、ユーザ体験を向上させる。
なお、第1実施形態が提供するリソーススケジューリング方法の実行主体は、各プロキシサーバに接続されたサービスエンドであってもよく、サービスエンドは、独立したサーバまたは複数のサーバからなるサーバクラスタで実現されてもよい。任意で、サービスエンドはアクセスサーバに接続されてもよく、アクセスサーバはクライアントに接続され、クライアントが発したリクエストを処理するためのものである。
第1実施形態が提供するリソーススケジューリング方法の具体的なフローは図1に示す通りであり、具体的に以下のステップS101とステップS102を含む。
ステップS101では、各プロキシサーバのリソース利用率を取得し、プロキシサーバは仮想マシンに配置されたサーバである。
プロキシサーバは仮想マシンが仮想化技術を通じて物理サーバから仮想化したサーバであり、物理サーバはプロキシサーバのホストであり、1台の物理サーバは1台以上の仮想化されたプロキシサーバに対応することができる。
リソースは、プロキシサーバの帯域幅、計算(CPUまたはグラフィックスプロセッサ(Graphics Processing Unit、GPU)を含む)、メモリ(内部メモリを含む)リソース等を含んでもよく、リソース利用率は、リソースが占有される割合を指す。コンピューティングリソースとストレージリソースは処理リソースと総称してもよく、プロキシサーバの処理能力を表すものである。なお、第1実施形態において、プロキシサーバのリソースは、上記のリソースにおける少なくとも1つを指してもよい。
任意で、プロキシサーバのリソースは帯域幅リソースであり、プロキシサーバはクラウドビデオサービスを提供するためのサーバである。
ステップS102では、第1プロキシサーバを用いて第2プロキシサーバのリソースの占用を分担し、第1プロキシサーバはリソース利用率が第1閾値よりも小さいプロキシサーバであり、第2プロキシサーバはリソース利用率が第2閾値よりも大きいプロキシサーバであり、第1閾値は第2閾値よりも小さい。
第1閾値と第2閾値は実際の経験または実際の状況に応じて設置することができ、例えば、第1閾値は20%、30%または40%等、第2閾値は70%、80%または90%等であってもよい。
具体的な例では、第1プロキシサーバを用いて第2プロキシサーバのリソースの占有を分担した後、残りの第1プロキシサーバが存在する場合、残りの第1プロキシサーバを回収する。第1プロキシサーバはリソース利用率の低いプロキシサーバであるため、残りの第1プロキシサーバを回収することで、プロキシサーバの数を減らし、仮想リソースを節約することができる。任意で、残りの第1プロキシサーバを移行させて他のテナントに用いてもよい。
任意で、リソース利用率が第1閾値と第2閾値との間にあるプロキシサーバを処理しなくてもよく、第1プロキシサーバが第2プロキシサーバのリソースの占有を分担するのに十分でない場合、当該プロキシサーバの一部を用いて第2プロキシサーバのリソースを分担してもよい。任意で、第1プロキシサーバを用いて第2プロキシサーバのリソースの占有を分担した後も、一部の第2プロキシサーバのリソース占有が分担されていない場合は、少なくとも1つのプロキシサーバを新たに生成し、新たに生成したプロキシサーバを用いて当該第2プロキシサーバのリソース占有を一部分担する。プロキシサーバを新たに生成する時に、第2プロキシサーバの近傍位置で優先的に生成し、例えば、第2プロキシサーバと同一のホスト(物理サーバ)で優先的に生成するか、または第2プロキシサーバのホストに隣接する物理サーバで新たに生成することができる。
任意で、第1プロキシサーバを用いて第2プロキシサーバのリソースの占有を分担する前に、先に第2プロキシサーバのリソースを増やしてもよい。一方、第1プロキシサーバを用いて第2プロキシサーバのリソースの占有を分担すると、増加後の第2プロキシサーバのリソース利用率が依然として第2閾値よりも大きい場合に、第1プロキシサーバをさらに用いて、リソース増加後の第2プロキシサーバのリソースの占有を分担するということが含まれる。
具体的には、仮想化技術により、テナント割当の許容範囲内で第2プロキシサーバのリソースを先に増やすことができる。例えば、ある第2プロキシサーバの割当が20Mの帯域幅であるが、現在10Mしかない場合、まず当該第2プロキシサーバの帯域幅を20Mの帯域幅に設定し、リソースを増やした後の当該第2プロキシサーバのリソース利用率を取得し、リソースを増やした後のリソース利用率が第2閾値以下であれば、当該プロキシサーバを第2プロキシサーバのリストから除去する。リソースを増やした後もリソース利用率が依然として第2閾値よりも大きい場合、第1プロキシサーバを用いて当該第2プロキシサーバのリソース利用率を分担する。
任意で、第1プロキシサーバを用いて第2プロキシサーバのリソースの占用を分担する時には、第1プロキシサーバをランダムに選択して第2プロキシサーバのリソースの占用を分担することができる。
具体的な例において、ステップS102の前に、第1実施形態におけるリソーススケジューリング方法は、第1プロキシサーバのリソース利用率が低いものから高いものの順で、各第1プロキシサーバを配列するというステップをさらに含む。ステップS102において、第1プロキシサーバを用いて第2プロキシサーバのリソースの占用を分担するステップは、配列結果における前のn個の第1プロキシサーバを選択して第2プロキシサーバのリソース占用を分担するステップを含み、nは正の整数である。
例えば、第1プロキシサーバのリソース利用率を低いものから高いものへと1つのキューに並べ、キューの先頭(即ち、リソース利用率の低いもの)から第1プロキシサーバを選択して第2プロキシサーバのリソース占有を分担する。
なお、リソース利用率は随時変動するものであり、リソース利用率の低い第1プロキシサーバを選択して第2プロキシサーバのリソースの占有を分担することにより、プロキシサーバをより十分にリソースの占有に対応させ、サービスの品質を保証することができる。このほか、配列結果における前のn個の第1プロキシサーバの選択には、配列結果における前のn個の第1プロキシサーバを優先的に選択することを含んでよく、即ち、分担するための第1プロキシサーバを選択する時に、配列結果における前のn個の第1プロキシサーバを優先的に選択し、配列結果における前のn個の第1プロキシサーバが第2プロキシサーバのリソースの占有を分担するのに十分でない時に、配列結果における前のn個の第1プロキシサーバ以外の第1プロキシサーバを選択して分担してもよい。
同様に、第2プロキシサーバのリソース利用率の高いものから低いものの順で各第2プロキシサーバを配列し、第1プロキシサーバを用いてリソース利用率が高い第2プロキシサーバのリソースの占用を優先的に分担してもよい。
第1実施形態におけるリソーススケジューリング方法によれば、仮想マシン上のプロキシサーバのリソース利用率を取得し、リソース利用率の低いプロキシサーバを用いてリソース利用率の高いプロキシサーバの分担をし、仮想化技術によりプロキシサーバのリソースを再度組み合わせることにより、リソース全体の柔軟な割当を実現することができ、さらには各プロキシサーバのリソース利用率を合理的な範囲内に維持することを保証し、サーバ(Webサイト)のサービス品質を効果的に保証し、ユーザ体験を向上させる。
本願実施例の第2実施形態はリソーススケジューリング方法に関するものである。第2実施形態は第1実施形態とほぼ同一であり、主な相違点は、第2実施形態において、さらに第2プロキシサーバのリソース占有需要を予測し、リソース占有需要の状況に応じてプロキシサーバのリソース占有の分担を行うというものである。
第2実施形態が提供するリソーススケジューリング方法の具体的なフローは、図2に示す通りであり、具体的に以下のステップS201~ステップS204を含む。
ステップS201では、各プロキシサーバのリソース利用率を取得し、プロキシサーバは仮想マシンに配置されたサーバである。
ステップS201は、第1実施形態におけるステップS101と同一であり、具体的に第1実施形態における関連記載を参照することができ、ここでは改めて説明しない。
ステップS202では、各第2プロキシサーバのリソース占有需要を予測する。
リソース占有需要とは、プロキシサーバに発生する可能性のあるリソース利用率を指し、例えば、あるプロキシサーバのピーク時のリソース利用率が90%、オフピーク時のリソース利用率が20%である場合、当該プロキシサーバのリソース占有需要は20~90%である。
任意で、各第2プロキシサーバのリソース利用率の履歴データに基づいてリソース占有需要を予測してもよく、例えば1ヶ月以内のリソース利用率の履歴データを選択して予測することができ、具体的に選択する履歴データの時間範囲は実際の必要に応じて設定することができ、ここでは具体的な制限を行わない。
ステップS203では、第2プロキシサーバのリソース差分値の大きいものから小さいものの順で各第2プロキシサーバを配列し、リソース差分値はリソース占有需要の最大値とリソース占有需要の平均値との差分値である。
任意で、リソース占有需要の最大値は履歴データにおける最大値であってもよく、履歴データのピーク時の平均値であってもよく、また履歴データに基づいて一定の修正を行った後に得ることができる。リソース占有需要の平均値は履歴データの平均値でもよく、ピーク時の履歴データとオフピーク時の履歴データの加重平均であってもよく、具体的に実際の需要に応じて具体的に設定することができ、ここでは具体的な制限をしない。
ステップS204では、第1プロキシサーバを用いて配列結果における前のm個の第2プロキシサーバのリソースの占有を分担し、mは正の整数である。
なお、リソースの差分値が大きい時には、第2プロキシサーバが高いリソース利用率にある可能性があり、これらの第2プロキシサーバのリソース利用率が効果的に分担されることを保証する必要があるということを表す。第1プロキシサーバを用いて配列結果における前のm個の第2プロキシサーバのリソースの占有を分担する時には、第1プロキシサーバを用いて配列結果における前のm個の第2プロキシサーバのリソースの占有を優先的に分担してもよく、第1プロキシサーバが配列結果における前のm個の第2プロキシサーバのリソースの占有を分担するに足るものである時には、第1プロキシサーバを用いてその他の第2プロキシサーバのリソースの占有を分担することもできる。
具体的な例では、リソース占有需要の平均値が第2閾値より大きいプロキシサーバを第2プロキシサーバとすることで、第2プロキシサーバの区分をより安定させる。
任意で、リソース占有需要の最大値に基づいて第2プロキシサーバを配列し、第1プロキシサーバを用いてリソース占有需要の最大値が大きい第2プロキシサーバのリソースの占有を優先的に分担してもよい。
なお、リソースは複数種類であってもよいため、実際の応用ではリソースに基づいて分類し、分類後のプロキシサーバに基づいて第1実施形態および/または第2実施形態における方法を用いてリソースのスケジューリングを行うことができる。本願が提供するリソーススケジューリング方法をより明瞭に説明するために、以下ではプロキシサーバを6つの種類に分け、応用シーンがクラウドビデオサービス(即ち、帯域幅リソースに着目する)であることを例として説明する。
キュー1:プロキシサーバの帯域幅リソース利用率が低すぎ、処理リソース利用率が正常(帯域幅リソース利用率が20%未満、CPU、メモリ、ストレージの平均リソース利用率が20~80%)である場合、第1プロキシサーバとし、その他のプロキシサーバが分担するリソースプールとすることができる。
スケジューリング方法:プロキシサーバを帯域幅リソース利用率の昇順で並べ、帯域幅リソース利用率の低いプロキシサーバを優先的に選択して分担する。
キュー2:プロキシサーバの帯域幅リソース利用率は正常であり、処理リソース利用率は安定する(帯域幅リソース利用率は20%~80%、CPU、メモリ、ストレージの平均リソース利用率は20%~80%である)。
スケジューリング方法:このキューに対して処理しない。
キュー3:プロキシサーバの帯域幅リソース利用率が高すぎ、処理リソース利用率が正常(帯域幅リソース利用率が80%を超え、CPU、メモリ、ストレージの平均リソース利用率が20~80%)であり、第2プロキシサーバとすることができる。
スケジューリング方法:キュー1におけるプロキシサーバの分担をするように選択することができる。そうでない場合は、許容範囲にプロキシサーバの帯域幅リソースを増やすか、またはサービスエンドへ仮想マシンの移行実行を請求するか、あるいは、キュー3のプロキシサーバの近傍位置で新しいプロキシサーバの生成を試みて分担する。
キュー4:プロキシサーバのリソース利用率が高すぎ、処理リソース利用率が高すぎ(帯域幅リソース利用率が80%を超え、CPU、メモリ、ストレージの平均リソース利用率が80%を超える)、第2プロキシサーバとすることができる。
スケジューリング方法:割当許容範囲にプロキシサーバの帯域幅リソースを増やし、分配終了後のプロキシサーバのリソース利用率がキュー6のプロキシサーバに近づくようにする。帯域幅リソースが増加した後もプロキシサーバのリソース利用率が高すぎる場合、履歴データに基づいて各プロキシサーバの帯域幅、CPU、メモリ、ストアリソース占有需要を予測し、プロキシサーバを予測最大値(リソース占有需要最大値)と予測平均値(リソース占有需要平均値)の差分値を降順で並べ、その後キュー1からリソース利用率が最も低いプロキシサーバを選択して分担し、キュー6におけるプロキシサーバのリソース利用率に近づけることを目標とする。キュー1に適切なプロキシサーバがなければ、プロキシサーバの近傍位置に新しいプロキシサーバを生成して分担するようリクエストし、分担後の新しいプロキシサーバをキュー1に加え、もとのプロキシサーバをキュー6に加える。
キュー5:プロキシサーバのリソース利用率が低すぎ、処理リソース利用率が高すぎ(帯域幅リソース利用率が20%未満、CPU、メモリ、ストレージの平均リソース利用率が80%を超える)、第1プロキシサーバとすることができる。
スケジューリング方法:帯域幅予測需要の最大値が実際の占有値より高いプロキシサーバを降順で並べ、残りのプロキシサーバをキュー1に加え、キュー1の末尾から物理位置が近いプロキシサーバを選択してキュー1の先頭のプロキシサーバを分担する。例えば、キュー5にリソースが足りない場合は、キュー1からプロキシサーバを選択して分配する。
キュー6:プロキシサーバのリソース利用率は正常であり、処理リソース利用率が高すぎる(即ち、帯域幅リソース利用率は20%~80%であり、CPU、メモリ、ストレージの平均リソース利用率は80%を超える)。
スケジューリング方法:履歴データに基づいて各プロキシサーバの帯域幅占有需要を予測し、プロキシサーバを帯域幅リソース占有需要の最大値と帯域幅リソース占有需要の平均値の差分値に従って昇順で並べ、キュー1から帯域幅リソース利用率の低いプロキシサーバを順番に選出してこれらのプロキシサーバの分担をする。キュー1においてリソースが不足する場合は、キューの最後の少なくとも1つのプロキシサーバの近傍位置に新しいプロキシサーバの負荷分担を確立するようリクエストし、キュー1に加えて引き続き分配する。分配完了後、キュー1のプロキシサーバに残りのリソースが残っている場合は、残りのリソースとキュー4、6におけるプロキシサーバを関連付けて予備とすることができる。残りのプロキシサーバに対しては、配置により仮想リソースを減らすか、または残りのプロキシサーバに対して移行、シャットダウン等の操作を行うことができる。
第2実施形態におけるリソーススケジューリング方法によれば、第2プロキシサーバのリソース占有需要を予測し、第1プロキシサーバの配列結果におけるリソース差分値が大きい第2プロキシサーバのリソース占有を分担することにより、リソース占有に大きな変化が生じる可能性のある第2プロキシサーバのリソースを保証することができ、リソースのスケジューリングをさらに最適化し、プロキシサーバのサービス品質の安定性を向上させることができる。
このほか、上記の各種の方法のステップ区分は、明確に説明するためのものに過ぎず、実現時に1つのステップに統合するか、あるステップを複数のステップに分けることができ、同じ論理関係を含む限り、みな本願の請求範囲内にあり、アルゴリズムにおいてもプロセスにおいても、重要ではない修正を追加するか、重要でない設計を導入するが、アルゴリズムとプロセスの核心的な設計を変更しないものは全て本願の請求範囲内にあるということを当業者は理解できる。
本願実施例の第3実施形態はリソーススケジューリングシステム300に関するものであり、図3に示すように、スケジューリングサーバ301と複数のプロキシサーバ302とを含み、プロキシサーバ302は仮想マシンに配置されたサーバである。
スケジューリングサーバ301は、各プロキシサーバのリソース利用率を取得し、第1プロキシサーバを用いて第2プロキシサーバのリソースの占用を分担するように配置され、第1プロキシサーバはリソース利用率が第1閾値よりも小さいプロキシサーバであり、第2プロキシサーバはリソース利用率が第2閾値よりも大きいプロキシサーバであり、第1閾値は第2閾値よりも小さい。
さらに、スケジューリングサーバ301は、第1プロキシサーバのリソース利用率が低いものから高いものの順で各第1プロキシサーバを配列し、配列結果における前のn個の第1プロキシサーバが第2プロキシサーバのリソース占有を分担するために選択するようにさらに構成され、nは正の整数である。
さらに、スケジューリングサーバ301は、残りの第1プロキシサーバが存在する場合に、残りの第1プロキシサーバを回収するようにさらに構成される。
さらに、スケジューリングサーバ301は、各第2プロキシサーバのリソース占有需要を予測し、第2プロキシサーバのリソース差分値の大きいものから小さいものの順で、第2プロキシサーバを配列し、リソース差分値は、リソース占有需要の最大値とリソース占有需要の平均値との差分であり、第1プロキシサーバを用いて配列結果における前のm個の第2のプロキシサーバのリソースの占有を分担するようにさらに配置され、mは正の整数である。
さらに、スケジューリングサーバ301は、第2プロキシサーバのリソース占有が分担されていないことが存在する場合には、少なくとも1つのプロキシサーバを新たに生成し、新たに生成されたプロキシサーバを用いて第2プロキシサーバのリソース占有を分担するようにさらに構成される。
さらに、スケジューリングサーバ301は、第2プロキシサーバのリソースを増やし、増加後の第2プロキシサーバのリソース利用率が依然として第2閾値よりも大きい場合、第1プロキシサーバを用いてリソース増加後の第2プロキシサーバのリソースの占有を分担するようにさらに構成される。
さらに、リソースは帯域幅リソースであり、プロキシサーバはクラウドビデオサービスを提供するためのサーバである。
さらに、リソースは処理リソースであり、処理リソースはコンピューティングリソースとストレージリソースを含む。
図4を参照されたい。これは第3実施形態が提供するリソーススケジューリングシステムをクラウドビデオサービスに適用する例を示す図であり、スケジューリングサーバ301は図4の監視サーバである。具体的に図4では、リソーススケジューリングシステム300のスケジューリングサーバ301(監視サーバ)とプロキシサーバのほか、クライアント、アクセスサーバ、ディレクトリサーバ、コンテンツサーバ及びエンコード変換サーバを含む。物理サーバ群は仮想サーバ群のホストである。クライアントは、コンピュータ、テレビ、または携帯電話等のデジタル端末であってもよく、無線ネットワーク、有線テレビネットワーク、またはインターネットを介してアクセスサーバに接続され、クラウドネットワークのビデオサービスを取得するためのものである。センタークラウドはディレクトリサーバとコンテンツサーバにより構成され、ディレクトリサーバはプロキシクラウドにビデオオブジェクトの照会サービスを提供し、コンテンツサーバにはすべてのビデオオブジェクトの完全なバックアップが記憶されている。ニアクライアントプロキシクラウドはアクセスサーバ、監視サーバ、プロキシサーバ、エンコード変換サーバによって構成される。アクセスサーバはクライアントとしてプロキシクラウドにサービスのインタフェースをリクエストし、クライアントのサービスリクエストを受信し、監視サーバへ、サービスを提供できるプロキシサーバのリストとそれぞれの実行状態を取得し、適切なプロキシサーバを選択してクライアントと接続を確立してサービスを提供する。監視サーバは各プロキシサーバにおけるビデオリソースの分布情報を収集し、クライアントにビデオリソース照会サービスを提供するためのものであり、本願の第1実施形態と第2実施形態が提供するリソーススケジューリング方法を用いて、各プロキシサーバの運行状態情報を収集するとともに、各プロキシサーバを負荷のバランスが取れた状態にし、リソース分配をスケジューリングし、即ち、クライアントデータリクエストについて、サービスを提供するサーバと関連仮想リソースのスケジューリングを選択する。エンコード変換サーバは専用の物理サーバにより担当され、プロバイダやユーザがアップロードした異なる符号方式のビデオオブジェクトを、クラウドネットワークのビデオサービスプラットフォームの符号方式に適合するビデオオブジェクトに変換する。
図5を参照されたい。これは図4においてクライアントがビデオサービスを取得する時のフロー概略図であり、具体的なフローは以下の通りである。1、クライアントはインターネットを介してクラウドにおけるアクセスサーバに接続され、ビデオサービスリクエスト(ビデオオブジェクトを含む)を提出する。2、アクセスサーバは監視サーバから、クライアントにサービスを提供できるプロキシサーバのリストを取得する。3、監視サーバが、クライアントにサービスを提供できるプロキシサーバを検索し、例えばプロキシクラウド内にクライアントがリクエストするリソースがない場合、センタークラウドのディレクトリサーバへリソースを照会し、そうでなければ、ステップ6に移行する。4、センタークラウドのディレクトリサーバは、クライアントが必要とするデータが保存されているコンテンツサーバを探して選択する。5、コンテンツサーバは必要なリソースをプロキシクラウドにおけるプロキシサーバ(例えば、第1プロキシサーバであってもよい)に転送する。6、監視サーバは把握しているプロキシサーバのリソースと運行状態情報に基づいて、第1プロキシサーバをクライアントサービスとして選択するとともに、各プロキシサーバのリソース利用率のバランスを取り、選択完了後、サービス情報をアクセスサーバに戻す。7、アクセスサーバはプロキシサーバとクライアントの接続を確立する。8、プロキシサーバはクライアントのデータリクエストに応答する。9、クライアントはデータの一部を受信して再生を開始し、残りのデータを引き続きリクエストする。
第3実施形態は、第1実施形態及び第2実施形態に対応するシステム実施形態であり、第3実施形態は、第1実施形態及び第2実施形態と互いに組み合わせて実施することができると難なく見出せる。第1実施形態及び第2実施形態で言及した関連技術の詳細は、第3実施形態において依然として有効であり、重複を回避するために、ここでは改めて説明しない。これに応じて、第3実施形態で言及した関連技術の詳細も、第1実施形態および第2実施形態に適用することができる。
特筆すべきは、第3実施形態に係る各モジュールはすべて論理モジュールであり、実際の応用において、論理ユニットは物理ユニットであってもよく、物理ユニットの一部であってもよく、複数の物理ユニットの組み合わせで実現されてもよいという点である。このほか、本開示の革新的な部分を際立たせるために、第3実施形態では、本願が示す技術問題を解決する、関係があまり緊密でないユニットを導入していないが、これは、第3実施形態にその他のユニットが存在しないことを意味しない。
本願実施例の第4実施形態は電子デバイスに関するものであり、図6に示すように、少なくとも1つのプロセッサ402と、少なくとも1つのプロセッサ402と通信接続されたメモリ401とを含む。メモリ401には、少なくとも1つのプロセッサ402により実行可能な指令が記憶されており、指令が少なくとも1つのプロセッサ402により実行されることで、少なくとも1つのプロセッサ402に上記リソーススケジューリング方法を実行させることができる。
メモリ401とプロセッサ402はバス方式で接続され、バスは任意の数の相互接続のバスとブリッジを含んでよく、バスは1つまたは複数のプロセッサ402とメモリ401の各種回路に接続される。バスは例えば、周辺デバイス、電圧レギュレータ、電力管理回路等の各種のその他の回路を一緒に接続することができ、これらは本分野において公知の事項であるため、本文ではこれについてさらなる説明を行わない。バスインタフェースは、バスとトランシーバとの間にインタフェースを提供する。トランシーバは、1つの部材であってもよく、複数の部材、例えば複数の受信機や送信機であってもよく、送信媒体で各種の他の装置と通信するための手段を提供する。プロセッサ402によって処理されたデータは、アンテナを介して無線媒体で伝送され、さらに、アンテナはデータを受信してプロセッサ402に送信する。
プロセッサ402はバスの管理と通常の処理を担当し、タイミング、周辺インタフェース、電圧調整、電源管理、その他の制御機能を含む各種の機能を提供することもできる。メモリ401は、プロセッサ402が操作実行時に使用するデータを記憶することに用いてよい。
本願実施例の第5実施形態は、コンピュータプログラムが記憶されているコンピュータ可読記憶媒体に関するものである。コンピュータプログラムはプロセッサによって実行される時に、本願が提供するリソーススケジューリング方法のいずれかを実現する。
即ち、上記実施形態における方法のすべてまたは一部のステップの実現は、プログラムにより関連ハードウェアに命令することで完成することができ、当該プログラムは記憶媒体に記憶され、少なくとも1つの指令を含んでデバイス(シングルチップコンピュータ、チップ等であってもよい)またはプロセッサ(processor)に本願各実施例に記載の方法のすべてまたは一部のステップを実行させると当業者は理解できる。前述の記憶媒体は、Uディスク、リムーバブルハードディスク、読み取り専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスクまたは光ディスク等の、プログラムコードを記憶できる各種の媒体を含む。
上記各実施例は本開示を実現する具体的な実施例であり、本願の精神と範囲を逸脱しない限り、実際の応用において形式または詳細に対して各種の変更を加えることができる。
Claims (11)
- 仮装マシンに配置された複数のプロキシサーバのリソース利用率を取得するステップと、
少なくとも1つの第1プロキシサーバを用いて少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップと、を含み、
前記少なくとも1つの第1プロキシサーバにおける各第1プロキシサーバのリソース利用率は第1閾値よりも小さく、前記少なくとも1つの第2プロキシサーバにおける各第2プロキシサーバのリソース利用率は第2閾値よりも大きく、且つ前記第1閾値は前記第2閾値よりも小さい
リソーススケジューリング方法。 - 前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担する前に、前記方法は、
リソース利用率の低いものから高いものの順に、前記少なくとも1つの第1プロキシサーバを配列し、第1配列結果を得るステップをさらに含み、
前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップは、
前記第1配列結果における前のn個(前記nは正の整数である)の第1プロキシサーバを確定するステップと、
前記前のn個の第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップと、を含む
請求項1に記載のリソーススケジューリング方法。 - 前記前のn個の第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担した後に、
前記少なくとも1つの第1プロキシサーバの数が前記nより大きいと判断したことに応じて、前記少なくとも1つの第1プロキシサーバにおける前記前のn個の第1プロキシサーバを除いたその他の第1プロキシサーバを回収するステップをさらに含む
請求項2に記載のリソーススケジューリング方法。 - 前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担する前に、前記方法は、
前記少なくとも1つの第2プロキシサーバのリソース占有需要を予測するステップと、
リソース差分値の大きいものから小さいものの順で、前記少なくとも1つの第2プロキシサーバを配列して第2配列結果を得るステップと、を含み、
前記第2プロキシサーバのリソース差分値は、前記第2プロキシサーバのリソース占有需要の最大値と前記第2プロキシサーバのリソース占有需要の平均値との差分値であり、
前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップは、
前記第2配列結果における前のm個(前記mは正の整数である)の第2プロキシサーバを確定するステップと、
前記少なくとも1つの第1プロキシサーバを用いて前のm個の第2プロキシサーバのリソースの占用を分担するステップと、を含む
請求項1に記載のリソーススケジューリング方法。 - 前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担した後に、
前記少なくとも1つの第2プロキシサーバの数が前記mよりも大きいと判断したことに応じて、少なくとも1つの第3プロキシサーバを新たに生成するステップと、
前記少なくとも1つの第3プロキシサーバを用いて、前記少なくとも1つの第2プロキシサーバにおける前記前のm個の第2プロキシサーバを除いたその他の第2プロキシサーバのリソースの占用を分担するステップと、をさらに含む
請求項1に記載のリソーススケジューリング方法。 - 前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担する前に、前記少なくとも1つの第2プロキシサーバのリソースを増やすステップをさらに含み、
前記少なくとも1つの第1プロキシサーバを用いて前記少なくとも1つの第2プロキシサーバのリソースの占用を分担するステップは、
リソース増加後の第2プロキシサーバのリソース利用率が依然として前記第2閾値よりも大きいと判断したことに応じて、前記少なくとも1つの第1プロキシサーバを用いて前記リソース増加後の第2プロキシサーバのリソースの占用を分担するステップを含む
請求項1に記載のリソーススケジューリング方法。 - 前記リソースは帯域幅リソースであり、前記複数のプロキシサーバはクラウドビデオサービスを提供するためのものである
請求項1~6のいずれか1項に記載のリソーススケジューリング方法。 - 前記リソースは処理リソースであり、且つ前記処理リソースはコンピューティングリソースとストレージリソースを含む
請求項1~6のいずれか1項に記載のリソーススケジューリング方法。 - スケジューリングサーバと複数のプロキシサーバを含み、前記複数のプロキシサーバは仮装マシンに配置され、前記スケジューリングサーバは、
前記複数のプロキシサーバのリソース利用率を取得し、
少なくとも1つの第1プロキシサーバを用いて少なくとも1つの第2プロキシサーバのリソースの占用を分担するように配置され、
前記少なくとも1つの第1プロキシサーバにおける各第1プロキシサーバのリソース利用率は第1閾値よりも小さく、前記少なくとも1つの第2プロキシサーバにおける各第2プロキシサーバのリソース利用率は第2閾値よりも大きく、且つ前記第1閾値は前記第2閾値よりも小さい
リソーススケジューリングシステム。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに、前記少なくとも1つのプロセッサによって実行可能な指令が記憶されており、前記指令が前記少なくとも1つのプロセッサにより実行されることで、前記少なくとも1つのプロセッサに請求項1~8のいずれか1項に記載のリソーススケジューリング方法を実行させることができる
電子デバイス。 - コンピュータプログラムが記憶されており、前記コンピュータプログラムがプロセッサによって実行される時に、請求項1~8のいずれか1項に記載のリソーススケジューリング方法を実現する
コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011001012.8A CN114253698A (zh) | 2020-09-22 | 2020-09-22 | 资源调度方法、系统、电子设备及存储介质 |
CN202011001012.8 | 2020-09-22 | ||
PCT/CN2021/118436 WO2022062981A1 (zh) | 2020-09-22 | 2021-09-15 | 资源调度方法和系统、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023543744A true JP2023543744A (ja) | 2023-10-18 |
Family
ID=80789506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023518479A Pending JP2023543744A (ja) | 2020-09-22 | 2021-09-15 | リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230379268A1 (ja) |
JP (1) | JP2023543744A (ja) |
KR (1) | KR20230073315A (ja) |
CN (1) | CN114253698A (ja) |
WO (1) | WO2022062981A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117009091B (zh) * | 2023-10-07 | 2023-12-19 | 浪潮(山东)计算机科技有限公司 | 一种资源调整方法、装置、设备及可读存储介质 |
CN117519913B (zh) * | 2024-01-08 | 2024-03-22 | 联通在线信息科技有限公司 | 一种容器内存资源弹性伸缩调度方法和系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105553721A (zh) * | 2015-12-15 | 2016-05-04 | 浪潮电子信息产业股份有限公司 | 一种云应用伸缩方法、应用管理端和系统 |
CN110058966B (zh) * | 2018-01-18 | 2023-11-14 | 伊姆西Ip控股有限责任公司 | 用于数据备份的方法、设备和计算机程序产品 |
CN108924139B (zh) * | 2018-07-05 | 2021-02-26 | 杭州安恒信息技术股份有限公司 | 基于云端提升文件检测效率的方法、装置及执行服务器 |
CN110597631B (zh) * | 2019-09-06 | 2022-06-21 | 广州华多网络科技有限公司 | 资源管理方法、监控服务器、代理服务器以及存储介质 |
-
2020
- 2020-09-22 CN CN202011001012.8A patent/CN114253698A/zh active Pending
-
2021
- 2021-09-15 KR KR1020237013946A patent/KR20230073315A/ko unknown
- 2021-09-15 JP JP2023518479A patent/JP2023543744A/ja active Pending
- 2021-09-15 US US18/027,664 patent/US20230379268A1/en active Pending
- 2021-09-15 WO PCT/CN2021/118436 patent/WO2022062981A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022062981A1 (zh) | 2022-03-31 |
US20230379268A1 (en) | 2023-11-23 |
CN114253698A (zh) | 2022-03-29 |
KR20230073315A (ko) | 2023-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10772115B2 (en) | Resource scheduling method and server | |
US11429449B2 (en) | Method for fast scheduling for balanced resource allocation in distributed and collaborative container platform environment | |
US20190324819A1 (en) | Distributed-system task assignment method and apparatus | |
US9442763B2 (en) | Resource allocation method and resource management platform | |
CN110474966B (zh) | 处理云平台资源碎片的方法及相关设备 | |
US20150133214A1 (en) | Video encoding based on areas of interest | |
CN108965884B (zh) | 一种转码任务的分配方法及调度设备、转码设备 | |
JP2023543744A (ja) | リソーススケジューリング方法、システム、電子デバイスおよびコンピュータ可読記憶媒体 | |
CN108897606B (zh) | 多租户容器云平台虚拟网络资源自适应调度方法及系统 | |
CN115408100A (zh) | 容器集群调度的方法、装置、设备及存储介质 | |
CN112749002A (zh) | 一种集群资源动态管理的方法和装置 | |
CN110493317B (zh) | 处理云平台资源碎片的方法及相关设备 | |
CN113254179B (zh) | 基于高响应比的作业调度方法、系统、终端、存储介质 | |
CN114721818A (zh) | 一种基于Kubernetes集群的GPU分时共享方法和系统 | |
CN114116173A (zh) | 动态调整任务分配的方法、装置和系统 | |
CN117632509A (zh) | 算力管理方法及装置、算力调度设备、存储介质 | |
CN111190719A (zh) | 优化集群资源分配的方法、装置、介质及电子设备 | |
JP2020036105A (ja) | ネットワークサービス管理装置、ネットワークサービス管理方法およびネットワークサービス管理プログラム | |
KR20170014804A (ko) | 클라우드 서비스를 위한 가상 머신 프로비저닝 시스템 및 방법 | |
CN115361349B (zh) | 资源使用方法和装置 | |
CN113014408A (zh) | 分布式系统及其管理方法 | |
CN115378879A (zh) | 数据控制方法及相关装置 | |
KR20150070930A (ko) | 최적 비용을 고려한 마이그레이션 자원 할당 시스템 및 할당 방법 | |
Guo et al. | PARA: Performability‐aware resource allocation on the edges for cloud‐native services | |
CN111796932A (zh) | 一种gpu资源调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230322 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |