JP2022539291A - 計算資源の動的割り当て - Google Patents
計算資源の動的割り当て Download PDFInfo
- Publication number
- JP2022539291A JP2022539291A JP2021568246A JP2021568246A JP2022539291A JP 2022539291 A JP2022539291 A JP 2022539291A JP 2021568246 A JP2021568246 A JP 2021568246A JP 2021568246 A JP2021568246 A JP 2021568246A JP 2022539291 A JP2022539291 A JP 2022539291A
- Authority
- JP
- Japan
- Prior art keywords
- resource group
- resources
- free
- computing
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 30
- 230000004044 response Effects 0.000 claims description 25
- 238000000638 solvent extraction Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5011—Pool
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/502—Proximity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5021—Priority
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
Description
[0001] コンピュータ技術、とりわけ分散計算技術が発展するにつれ、クラウドコンピューティングが近年人気のある計算モデルになっている。クラウドコンピューティングは、構成可能な1組の計算資源(ウェブサーバ、記憶域、グラフィックス処理ユニット等を含む)にネットワーク上で便利に且つ要求に応じたやり方でアクセスするモデルである。1組の計算資源の管理者は資源を少ない管理オーバヘッドで素早く構成し、提供し、又はリリースすることができる。クラウドコンピューティングの焦点は計算資源の管理である。クラウドコンピューティングのための資源の動的割り当てが研究の焦点になっている。
[0002] 主題の一実装形態によれば、計算資源を動的管理する解決策が提供される。この解決策では、1組の計算資源内の目標数の計算資源を使用するための第1の要求が受信され、1組の計算資源のうちの少なくとも1つの空き計算資源が少なくとも1つの空き資源グループへと編成される。一致空き資源グループが第1の資源グループ内になく、冗長空き資源グループが少なくとも1つの空き資源グループ内にあると判定される場合、冗長空き資源グループを分割することによって第1の要求に目標数の計算資源が割り当てられ、冗長空き資源グループ内の資源数は目標数を上回る。従って計算資源の動的割り当てが使用可能にされる。
[0011] 次に、本明細書に記載する主題を幾つかの実装例に関して解説する。それらの実装形態は本明細書に記載する主題の範囲に対する如何なる制限も提案せず、当業者が主題をよりよく理解し、その結果本明細書に記載する主題を実装できるようにするために論じるに過ぎないことを理解すべきである。
[0020] 図2は、主題の一部の実装形態による計算資源の動的割り当てプロセス200の流れ図を示す。プロセス200は計算資源スケジューリング装置115によって実装され得る。
[0053] 図6は、主題の実施形態を実装可能な装置600を示すブロック図である。装置600は、図1の計算資源スケジューリング装置115を実装するために使用することができる。図6に示す装置600は例示に過ぎず、本明細書に記載の実装形態の機能及び範囲を限定するものとして解釈すべきでないことを理解すべきである。図1に示すように、装置600の構成要素は、これだけに限定されないが1つ又は複数のプロセッサ又は処理ユニット110、メモリ120、記憶装置130、1つ又は複数の通信ユニット140、1つ又は複数の入力装置150、及び1つ又は複数の出力装置160を含み得る。
[0060] 主題の一部の実装例を以下に記載する。
Claims (15)
- 計算資源を管理する方法であって、
1組の計算資源内の目標数の計算資源を使用するための第1の要求を受信することであって、前記1組の計算資源のうちの少なくとも1つの空き計算資源が少なくとも1つの空き資源グループへと編成される、受信することと、
前記目標数の計算資源を有する一致空き資源グループが前記少なくとも1つの空き資源グループ内にあるかどうかを判定することと、
前記一致空き資源グループが前記少なくとも1つの空き資源グループ内にないことに応答し、冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあるかどうかを判定することであって、前記冗長空き資源グループ内の資源数は前記目標数を上回る、判定することと、
前記冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあることに応答し、前記冗長空き資源グループを分割することによって前記第1の要求に前記目標数の計算資源を割り当てることと
を含む、方法。 - 各空き資源グループがマルチレベルトポロジ内の同じノードに関連する計算資源を含むように前記1組の計算資源に対応する前記マルチレベルトポロジに基づいて前記少なくとも1つの空き計算資源を前記少なくとも1つの空き資源グループへと編成することであって、前記マルチレベルトポロジ内のノードは前記1組の計算資源又は前記1組の計算資源内の複数の計算資源のための接続構成要素の1つに対応する、編成すること
を更に含む、請求項1に記載の方法。 - 前記計算資源がグラフィックス処理ユニットを含み、前記マルチレベルトポロジが、
個々のグラフィックス処理ユニットに対応するノードを含む第1のレベル、
複数のグラフィックス処理ユニットを接続するためのPCIeスイッチに対応するノードを含む第2のレベル、
複数のPCIeスイッチを接続するためのCPUソケットに対応するノードを含む第3のレベル、及び
複数のCPUソケットを接続するための計算装置に対応するノードを含む第4のレベル
のうちの少なくとも2つを含む、請求項2に記載の方法。 - 前記冗長空き資源グループを分割することによって前記第1の要求に前記目標数の計算資源を割り当てることが、
前記冗長空き資源グループを第1の資源グループ及び少なくとも1つの第2の資源グループに分割することであって、前記第1の資源グループは前記目標数の計算資源を含む、分割することと、
前記第1の要求に対して、前記第1の資源グループから計算資源を割り当てることと
を含む、請求項1に記載の方法。 - 前記第1の要求を完了することに応答し、前記第1の資源グループを空いているものとして印付けすることと、
前記少なくとも1つの第2の資源グループ内の計算資源の全てが空いていると判定することに応答し、前記第1の資源グループと前記少なくとも1つの第2の資源グループとを新たな空き資源グループへと併合することと
を更に含む、請求項4に記載の方法。 - 前記冗長空き資源グループが前記少なくとも1つの空き資源グループ内にないと判定することに応答し、前記第1の要求の優先度が優先度閾値を上回るかどうかを判定することと、
前記優先度が前記優先度閾値を上回ることに応答し、前記1組の計算資源のうちの少なくとも1つの利用可能計算資源を含む前記目標数の計算資源を前記第1の要求に割り当てることであって、前記利用可能計算資源は空き計算資源及び前記優先度閾値以下の優先度を有する第2の要求に割り当てられる候補計算資源を含む、割り当てることと
を更に含む、請求項1に記載の方法。 - 前記少なくとも1つの利用可能計算資源は少なくとも1つの利用可能資源グループへと編成され、前記1組の計算資源のうちの少なくとも1つの利用可能計算資源を含む前記目標数の計算資源を前記第1の要求に割り当てることが、
前記目標数の計算資源を有する利用可能一致資源グループが前記少なくとも1つの利用可能資源グループ内にあるかどうかを判定することと、
前記利用可能一致資源グループが前記少なくとも1つの利用可能資源グループ内にあることに応答し、前記利用可能一致資源グループ内で割り当てられている計算資源の返還を要求することと、
前記第1の要求に対して前記利用可能一致資源グループから計算資源を割り当てることと
を含む、請求項6に記載の方法。 - 前記1組の計算資源のうちの少なくとも1つの利用可能計算資源を含む前記目標数の計算資源を前記第1の要求に割り当てることが、
前記利用可能一致資源グループが前記少なくとも1つの利用可能資源グループ内にないことに応答し、利用可能冗長資源グループが前記少なくとも1つの利用可能資源グループ内にあるかどうかを判定することであって、前記利用可能冗長資源グループ内の資源数は前記目標数を上回る、判定することと、
前記利用可能冗長資源グループが前記少なくとも1つの利用可能資源グループ内にあると判定することに応答し、前記利用可能冗長資源グループを分割することによって前記第1の要求に前記目標数の計算資源を割り当てることと
を含む、請求項7に記載の方法。 - 前記第1の要求に関連する第1のテナントが使用した資源グループ内の第1の計算資源数を判定することと、
前記目標数と前記第1の数との和が前記第1のテナントに対応する計算資源数の上限を上回ると判定することに応答し、前記第1の要求の優先度を優先度閾値未満に設定することと
を更に含む、請求項1に記載の方法。 - 前記第1のテナントに対応する前記計算資源数の前記上限が、前記第1のテナントに関して予め割り当てられる第2の計算資源数と第2のテナントとの交換によって得られる第3の計算資源数との和に等しい、請求項9に記載の方法。
- 処理ユニットと、
前記処理ユニットに結合され、前記処理ユニットによって実行されるとき、
1組の計算資源内の目標数の計算資源を使用するための第1の要求を受信することであって、前記1組の計算資源のうちの少なくとも1つの空き計算資源が少なくとも1つの空き資源グループへと編成される、受信することと、
前記目標数の計算資源を有する一致空き資源グループが前記少なくとも1つの空き資源グループ内にあるかどうかを判定することと、
前記一致空き資源グループが前記少なくとも1つの空き資源グループ内にないことに応答し、冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあるかどうかを判定することであって、前記冗長空き資源グループ内の資源数は前記目標数を上回る、判定することと、
前記冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあることに応答し、前記冗長空き資源グループを分割することによって前記第1の要求に前記目標数の計算資源を割り当てることと
の動作を装置に実行させる記憶済み命令を含むメモリと
を含む、装置。 - 前記動作は、
各空き資源グループがマルチレベルトポロジ内の同じノードに関連する計算資源を含むように前記1組の計算資源に対応する前記マルチレベルトポロジに基づいて前記少なくとも1つの空き計算資源を前記少なくとも1つの空き資源グループへと編成することであって、前記マルチレベルトポロジ内のノードは前記1組の計算資源又は前記1組の計算資源内の複数の計算資源のための接続構成要素の1つに対応する、編成すること
を更に含む、請求項11に記載の装置。 - 前記計算資源がグラフィックス処理ユニットを含み、前記マルチレベルトポロジが、
個々のグラフィックス処理ユニットに対応するノードを含む第1のレベル、
複数のグラフィックス処理ユニットを接続するためのPCIeスイッチに対応するノードを含む第2のレベル、
複数のPCIeスイッチを接続するためのCPUソケットに対応するノードを含む第3のレベル、及び
複数のCPUソケットを接続するための計算装置に対応するノードを含む第4のレベル
のうちの少なくとも2つを含む、請求項12に記載の装置。 - 前記冗長空き資源グループを分割することによって前記第1の要求に前記目標数の計算資源を割り当てることが、
前記冗長空き資源グループを第1の資源グループ及び少なくとも1つの第2の資源グループに分割することであって、前記第1の資源グループは前記目標数の計算資源を含む、分割することと、
前記第1の要求に対して前記第1の資源グループから計算資源を割り当てること
を含む、請求項11に記載の装置。 - コンピュータ記憶媒体内に有形に記憶され、機械実行可能命令を含むコンピュータプログラム製品であって、前記機械実行可能命令は装置によって実行されるとき、
目標数の計算資源を有する一致空き資源グループが少なくとも1つの空き資源グループ内にあるかどうかを判定することと、
前記一致空き資源グループが前記少なくとも1つの空き資源グループ内にないことに応答し、冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあるかどうかを判定することであって、前記冗長空き資源グループ内の資源数は前記目標数を上回る、判定することと、
前記冗長空き資源グループが前記少なくとも1つの空き資源グループ内にあることに応答し、前記冗長空き資源グループを分割することによって第1の要求に前記目標数の計算資源を割り当てることと
を前記装置に実行させる、コンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910578411.1A CN112148467A (zh) | 2019-06-28 | 2019-06-28 | 计算资源的动态分配 |
CN201910578411.1 | 2019-06-28 | ||
PCT/US2020/031250 WO2020263414A1 (en) | 2019-06-28 | 2020-05-04 | Dynamic allocation of computing resources |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022539291A true JP2022539291A (ja) | 2022-09-08 |
Family
ID=70919001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021568246A Pending JP2022539291A (ja) | 2019-06-28 | 2020-05-04 | 計算資源の動的割り当て |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220229701A1 (ja) |
EP (1) | EP3991042A1 (ja) |
JP (1) | JP2022539291A (ja) |
KR (1) | KR20220025746A (ja) |
CN (1) | CN112148467A (ja) |
AU (1) | AU2020308941A1 (ja) |
BR (1) | BR112021021732A2 (ja) |
CA (1) | CA3139693A1 (ja) |
WO (1) | WO2020263414A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210089467A1 (en) * | 2020-10-01 | 2021-03-25 | Intel Corporation | Page allocation for contiguity-aware translation lookaside buffers |
CN114385370B (zh) * | 2022-01-18 | 2022-10-25 | 重庆紫光华山智安科技有限公司 | 内存分配方法、系统、设备及介质 |
CN116701001B (zh) * | 2023-08-08 | 2023-10-20 | 国网浙江省电力有限公司信息通信分公司 | 目标任务分配方法、装置、电子设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999056475A1 (en) * | 1998-04-29 | 1999-11-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Resource allocation |
US7580146B2 (en) * | 2005-03-22 | 2009-08-25 | Xerox Corporation | Hierarchical architecture for a distributed and scalable network printing system |
US8380959B2 (en) * | 2008-09-05 | 2013-02-19 | Apple Inc. | Memory management system and method |
US8468251B1 (en) * | 2011-12-29 | 2013-06-18 | Joyent, Inc. | Dynamic throttling of access to computing resources in multi-tenant systems |
CN103269282A (zh) * | 2013-04-25 | 2013-08-28 | 杭州华三通信技术有限公司 | 网络配置自动部署方法和装置 |
US11075979B2 (en) * | 2016-02-29 | 2021-07-27 | International Business Machines Corporation | Optimized resource provisioning |
CN106708622B (zh) * | 2016-07-18 | 2020-06-02 | 腾讯科技(深圳)有限公司 | 集群资源处理方法和系统、资源处理集群 |
CN108363623A (zh) * | 2018-02-27 | 2018-08-03 | 郑州云海信息技术有限公司 | Gpu资源调度方法、装置、设备及计算机可读存储介质 |
-
2019
- 2019-06-28 CN CN201910578411.1A patent/CN112148467A/zh active Pending
-
2020
- 2020-05-04 BR BR112021021732A patent/BR112021021732A2/pt unknown
- 2020-05-04 JP JP2021568246A patent/JP2022539291A/ja active Pending
- 2020-05-04 WO PCT/US2020/031250 patent/WO2020263414A1/en active Application Filing
- 2020-05-04 CA CA3139693A patent/CA3139693A1/en active Pending
- 2020-05-04 US US17/609,700 patent/US20220229701A1/en active Pending
- 2020-05-04 KR KR1020217042559A patent/KR20220025746A/ko active Search and Examination
- 2020-05-04 AU AU2020308941A patent/AU2020308941A1/en active Pending
- 2020-05-04 EP EP20729307.7A patent/EP3991042A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220229701A1 (en) | 2022-07-21 |
AU2020308941A1 (en) | 2021-12-23 |
CN112148467A (zh) | 2020-12-29 |
WO2020263414A1 (en) | 2020-12-30 |
KR20220025746A (ko) | 2022-03-03 |
EP3991042A1 (en) | 2022-05-04 |
CA3139693A1 (en) | 2020-12-30 |
BR112021021732A2 (pt) | 2022-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10649664B2 (en) | Method and device for scheduling virtual disk input and output ports | |
CN109684065B (zh) | 一种资源调度方法、装置及系统 | |
CN108701059B (zh) | 多租户资源分配方法和系统 | |
JP2022539291A (ja) | 計算資源の動的割り当て | |
BR112016002454B1 (pt) | Sistema e método para intercalação de canal de memória com energia seletiva ou otimização de desempenho | |
US10013264B2 (en) | Affinity of virtual processor dispatching | |
CN109976907B (zh) | 任务分配方法和系统、电子设备、计算机可读介质 | |
US9471391B1 (en) | Aggregating resource requests | |
CN112889038B (zh) | 用于分配缓存资源的方法和系统 | |
CN112905342A (zh) | 资源调度方法、装置、设备及计算机可读存储介质 | |
US11403026B2 (en) | Method, device and computer program product for managing storage system | |
US20190155657A1 (en) | Resource assignment method using cda protocol in distributed processing environment and distributed processing device applying the same | |
CN115705247A (zh) | 一种运行进程的方法及相关设备 | |
US11776087B2 (en) | Function-as-a-service (FAAS) model for specialized processing units | |
WO2022063273A1 (zh) | 一种基于numa属性的资源分配方法及装置 | |
CN108701062B (zh) | 通过分层性能平衡来减轻负载不平衡 | |
CN110879748A (zh) | 一种共享资源分配方法、装置和设备 | |
WO2017133421A1 (zh) | 一种多租户资源共享的方法及装置 | |
US11237745B2 (en) | Computer system and volume arrangement method in computer system to reduce resource imbalance | |
US9176910B2 (en) | Sending a next request to a resource before a completion interrupt for a previous request | |
CN108196786B (zh) | 用于存储系统分区的方法和管理设备 | |
JP6951962B2 (ja) | OpenCLカーネルを処理する方法、及びそれを遂行するコンピューティング装置 | |
CN110096355B (zh) | 一种共享资源分配方法、装置和设备 | |
CN117149440B (zh) | 一种任务调度方法、装置、电子设备及存储介质 | |
CN117311910B (zh) | 一种高性能虚拟密码机运行方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240205 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240520 |