JP2023511153A - リザベーションに基づいた高性能コンピューティングシステム及び方法 - Google Patents
リザベーションに基づいた高性能コンピューティングシステム及び方法 Download PDFInfo
- Publication number
- JP2023511153A JP2023511153A JP2022544250A JP2022544250A JP2023511153A JP 2023511153 A JP2023511153 A JP 2023511153A JP 2022544250 A JP2022544250 A JP 2022544250A JP 2022544250 A JP2022544250 A JP 2022544250A JP 2023511153 A JP2023511153 A JP 2023511153A
- Authority
- JP
- Japan
- Prior art keywords
- project
- computing resources
- shared
- computing
- core
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 73
- 230000008878 coupling Effects 0.000 claims abstract description 5
- 238000010168 coupling process Methods 0.000 claims abstract description 5
- 238000005859 coupling reaction Methods 0.000 claims abstract description 5
- 238000004891 communication Methods 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 description 36
- 230000006870 function Effects 0.000 description 21
- 230000006855 networking Effects 0.000 description 18
- 230000003287 optical effect Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 7
- 239000000835 fiber Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000011012 sanitization Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004224 protection Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
- Stored Programmes (AREA)
Abstract
Description
Claims (20)
- 第1プロジェクトに関連したコアコンピューティングリソースへ共有コンピューティングリソースを通信可能に結合することであり、前記第1プロジェクトに関連したコアコンピューティングリソースは、前記第1プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、ことと、
前記共有コンピューティングリソースの電源を切り、前記第1プロジェクトに関連したコアコンピューティングリソースから前記共有コンピューティングリソースを切り離し、第2プロジェクトに関連したコアコンピューティングリソースへ前記共有コンピューティングリソースを通信可能に結合し、前記共有コンピューティングリソースの電源を入れることによって、前記共有コンピューティングリソースを前記第2プロジェクトに再割り当てすることであり、前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、ことと
を有し、
前記共有コンピューティングリソースは、前記第1プロジェクト及び前記第2プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
前記共有コンピューティングリソース及び前記第1プロジェクトに関連したコアコンピューティングリソースは、集合的に、第1コンピューティングクラスタの少なくとも部分を形成し、
前記共有コンピューティングリソース及び前記第2プロジェクトに関連したコアコンピューティングリソースは、集合的に、第2コンピューティングクラスタの少なくとも部分を形成する、
方法。 - 前記共有コンピューティングリソースは、前記第1プロジェクト及び前記第2プロジェクトに関係がある前記データを記憶するために使用される揮発性メモリを有し、
前記共有コンピューティングリソースの電源を切ることは、前記不揮発性メモリをクリアし、前記第1プロジェクトに関連したデータが前記第2プロジェクトに関連したコアコンピューティングリソースによってアクセスされるのを防ぐ、
請求項1に記載の方法。 - 前記共有コンピューティングリソースは、ディスクレスコンピューティングノードを有し、
前記第2プロジェクトに関連したコアコンピューティングリソースは、ブート情報を前記ディスクレスコンピューティングノードへ供給する少なくとも1つの管理サーバを有する、
請求項1に記載の方法。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、情報を前記共有コンピューティングリソースへ供給することと、処理結果を前記共有コンピューティングリソースから受け取ることと、のうちの少なくとも1つを行う少なくとも1つのスクラッチサーバを有する、
請求項1に記載の方法。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2コンピューティングクラスタによって実行される処理ジョブをサブミットしモニタすることと、前記少なくとも1つのスクラッチサーバにある前記処理結果にアクセスすることと、をユーザに可能にする少なくとも1つのセッションサーバを更に有する、
請求項4に記載の方法。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2プロジェクトに関連したコアコンピューティングリソースによって使用されるプールに前記共有コンピューティングリソースを組み入れる少なくとも1つの管理サーバを有し、
前記少なくとも1つの管理サーバは、ジョブスケジューラ及びバッチキューイングシステムを有し、
前記ジョブスケジューラは、ユーザによってサブミットされた処理ジョブを受け取り、前記処理ジョブを前記バッチキューイングシステムへ供給し、
前記バッチキューイングシステムは、実行のために前記共有コンピューティングリソースを含む特定のコンピューティングリソースへ前記処理ジョブを割り当てる、
請求項1に記載の方法。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている少なくとも1つの専用コンピューティングノードを有する、
請求項1に記載の方法。 - 前記第2プロジェクトに関連したコアコンピューティングリソースにある不揮発性ストレージに前記共有コンピューティングリソースからの処理結果を記憶することを更に有する、
請求項1に記載の方法。 - 前記共有コンピューティングリソースは、共有コンピューティングリソースの第1セット内の複数の共有コンピューティングリソースのうちの1つを有し、
当該方法は、前記共有コンピューティングリソースの第1セット及び共有コンピューティングリソースの少なくとも1つの更なるセットを、前記第1プロジェクトに関連したコアコンピューティングリソースと、前記第2プロジェクトに関連したコアコンピューティングリソースとへ通信可能に結合することを更に有し、
共有コンピューティングリソースの異なるセットは、異なるタイプのコンピューティングノードを有する、
請求項1に記載の方法。 - 前記共有コンピューティングリソースは、1つ以上のサーバ及び1つ以上のグラフィクス処理ユニットのうちの少なくとも1つを有する、
請求項1に記載の方法。 - 共有コンピューティングリソースと、
第1プロジェクトに関連したコアコンピューティングリソースであり、前記第1プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、前記第1プロジェクトに関連したコアコンピューティングリソースと、
第2プロジェクトに関連したコアコンピューティングリソースであり、前記第2プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、前記第2プロジェクトに関連したコアコンピューティングリソースと
を有し、
前記共有コンピューティングリソースは、前記第1プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合され、電源を切られ、前記第1プロジェクトに関連したコアコンピューティングリソースから切り離され、そして、前記共有コンピューティングリソースを再割り当てするよう、前記第2プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合されて電源を入れられる、よう構成され、
前記共有コンピューティングリソースは、前記第1プロジェクト及び前記第2プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
前記共有コンピューティングリソース及び前記第1プロジェクトに関連したコアコンピューティングリソースは、集合的に、第1コンピューティングクラスタの少なくとも部分を形成し、
前記共有コンピューティングリソース及び前記第2プロジェクトに関連したコアコンピューティングリソースは、集合的に、第2コンピューティングクラスタの少なくとも部分を形成する、
システム。 - 前記共有コンピューティングリソースは、前記第1プロジェクト及び前記第2プロジェクトに関係がある前記データを記憶するために使用される揮発性メモリを有し、
前記共有コンピューティングリソースは、前記共有コンピューティングリソースの電源を切ることが、前記不揮発性メモリをクリアし、前記第1プロジェクトに関連したデータが前記第2プロジェクトに関連したコアコンピューティングリソースによってアクセスされるのを防ぐように、構成される、
請求項11に記載のシステム。 - 前記共有コンピューティングリソースは、ディスクレスコンピューティングノードを有し、
前記第2プロジェクトに関連したコアコンピューティングリソースは、ブート情報を前記ディスクレスコンピューティングノードへ供給する少なくとも1つの管理サーバを有する、
請求項11に記載のシステム。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、情報を前記共有コンピューティングリソースへ供給することと、処理結果を前記共有コンピューティングリソースから受け取ることと、のうちの少なくとも1つを行う少なくとも1つのスクラッチサーバを有する、
請求項11に記載のシステム。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2コンピューティングクラスタによって実行される処理ジョブをサブミットしモニタすることと、前記少なくとも1つのスクラッチサーバにある前記処理結果にアクセスすることと、をユーザに可能にするよう構成される少なくとも1つのセッションサーバを更に有する、
請求項14に記載のシステム。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2プロジェクトに関連したコアコンピューティングリソースによって使用されるプールに前記共有コンピューティングリソースを組み入れるよう構成される少なくとも1つの管理サーバを有し、
前記少なくとも1つの管理サーバは、ジョブスケジューラ及びバッチキューイングシステムを有し、
前記ジョブスケジューラは、ユーザによってサブミットされた処理ジョブを受け取り、前記処理ジョブを前記バッチキューイングシステムへ供給するよう構成され、
前記バッチキューイングシステムは、実行のために前記共有コンピューティングリソースを含む特定のコンピューティングリソースへ前記処理ジョブを割り当てるよう構成される、
請求項11に記載のシステム。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、前記第2プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている少なくとも1つの専用コンピューティングノードを有する、
請求項11に記載のシステム。 - 前記第2プロジェクトに関連したコアコンピューティングリソースは、記共有コンピューティングリソースからの処理結果を記憶するよう構成される不揮発性ストレージを有する、
請求項11に記載のシステム。 - 前記共有コンピューティングリソースは、1つ以上のサーバ及び1つ以上のグラフィクス処理ユニットのうちの少なくとも1つを有する、
請求項11に記載のシステム。 - 異なるプロジェクトに関連しかつ専用であるコアコンピューティングリソースの複数のセットであり、コアコンピューティングリソースの各セットが、関連するプロジェクトのためのデータ処理動作を実行するよう構成される、前記コアコンピューティングリソースの複数のセットと、
前記異なるプロジェクトのうちの1つへ選択的に割り当てられ、該割り当てられたプロジェクトのためのデータ処理動作を実行するよう夫々構成される複数の共有コンピューティングリソースと
を有し、
各共有コンピューティングリソースは、前記プロジェクトのうちの第1プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合され、電源を切られ、前記第1プロジェクトに関連したコアコンピューティングリソースのセットから切り離され、そして、当該共有コンピューティングリソースを再割り当てするよう、前記プロジェクトのうちの第2プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合されて電源を入れられる、よう構成され、
各共有コンピューティングリソースは、前記プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
コアコンピューティングリソースの各セット及びコアコンピューティングリソースの当該セットへ通信可能に結合されている前記共有コンピューティングリソースは、コンピューティングクラスタを形成し、各コンピューティングクラスタは、前記コアコンピューティングリソースの当該セットへ通信可能に結合されている前記共有コンピューティングリソースを変えることによって再設定可能である、
システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/773,262 | 2020-01-27 | ||
US16/773,262 US11593171B2 (en) | 2020-01-27 | 2020-01-27 | Reservation-based high-performance computing system and method |
PCT/US2020/023305 WO2021154316A1 (en) | 2020-01-27 | 2020-03-18 | Reservation-based high-performance computing system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023511153A true JP2023511153A (ja) | 2023-03-16 |
JP7463527B2 JP7463527B2 (ja) | 2024-04-08 |
Family
ID=70293066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022544250A Active JP7463527B2 (ja) | 2020-01-27 | 2020-03-18 | リザベーションに基づいた高性能コンピューティングシステム及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11593171B2 (ja) |
EP (1) | EP4097589A1 (ja) |
JP (1) | JP7463527B2 (ja) |
WO (1) | WO2021154316A1 (ja) |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4947477A (en) | 1988-03-04 | 1990-08-07 | Dallas Semiconductor Corporation | Partitionable embedded program and data memory for a central processing unit |
US5349643A (en) * | 1993-05-10 | 1994-09-20 | International Business Machines Corporation | System and method for secure initial program load for diskless workstations |
US6272637B1 (en) | 1997-04-14 | 2001-08-07 | Dallas Semiconductor Corporation | Systems and methods for protecting access to encrypted information |
US20040088414A1 (en) * | 2002-11-06 | 2004-05-06 | Flynn Thomas J. | Reallocation of computing resources |
US7073002B2 (en) | 2003-03-13 | 2006-07-04 | International Business Machines Corporation | Apparatus and method for controlling resource transfers using locks in a logically partitioned computer system |
US9178784B2 (en) | 2004-04-15 | 2015-11-03 | Raytheon Company | System and method for cluster management based on HPC architecture |
US8010542B2 (en) | 2004-09-10 | 2011-08-30 | B2I Technologies, Inc. | Apparatus and method for building conjoined computer systems |
JP4503413B2 (ja) | 2004-10-06 | 2010-07-14 | 株式会社日立製作所 | ネットワークシステムにおける外部端末からの記憶装置の利用 |
JP3967752B2 (ja) | 2005-03-25 | 2007-08-29 | 株式会社東芝 | 計算機ネットワーク構成制御システム及び方法 |
US20080189715A1 (en) * | 2006-03-14 | 2008-08-07 | International Business Machines Corporation | Controlling resource transfers in a logically partitioned computer system |
US7788477B1 (en) | 2007-01-31 | 2010-08-31 | Hewlett-Packard Development Company, L.P. | Methods, apparatus and articles of manufacture to control operating system images for diskless servers |
US7962737B2 (en) * | 2007-11-21 | 2011-06-14 | Dell Products L.P. | Methods, media and apparatus for booting diskless systems |
US9069610B2 (en) * | 2010-10-13 | 2015-06-30 | Microsoft Technology Licensing, Llc | Compute cluster with balanced resources |
US10705883B2 (en) * | 2018-06-19 | 2020-07-07 | Microsoft Technology Licensing, Llc | Dynamic hybrid computing environment |
-
2020
- 2020-01-27 US US16/773,262 patent/US11593171B2/en active Active
- 2020-03-18 JP JP2022544250A patent/JP7463527B2/ja active Active
- 2020-03-18 WO PCT/US2020/023305 patent/WO2021154316A1/en unknown
- 2020-03-18 EP EP20719812.8A patent/EP4097589A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021154316A1 (en) | 2021-08-05 |
US20210232432A1 (en) | 2021-07-29 |
EP4097589A1 (en) | 2022-12-07 |
US11593171B2 (en) | 2023-02-28 |
JP7463527B2 (ja) | 2024-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9189344B2 (en) | Storage management system and storage management method with backup policy | |
JP5615698B2 (ja) | 仮想マシン移行 | |
US11461034B2 (en) | Envoy for multi-tenant compute infrastructure | |
US20230185681A1 (en) | High reliability fault tolerant computer architecture | |
US8146091B2 (en) | Expansion and contraction of logical partitions on virtualized hardware | |
EP2053509B1 (en) | System for and method of migrating one or more virtual machines | |
US7930371B2 (en) | Deployment method and system | |
US8458697B2 (en) | Method and device for eliminating patch duplication | |
US20100274981A1 (en) | Method and system for migration between physical and virtual systems | |
US20100257326A1 (en) | Method and apparatus for logical volume management for virtual machine environment | |
US20140115579A1 (en) | Datacenter storage system | |
US9069640B2 (en) | Patch applying method for virtual machine, storage system adopting patch applying method, and computer system | |
CN102314378A (zh) | 使用共享存储来迁移虚拟机的技术 | |
JP2008152663A (ja) | ストレージネットワークの性能管理方法、並びに、その方法を用いた計算機システム及び管理計算機 | |
KR20210022121A (ko) | 구성 가능한 인프라스트럭처에서 스토리지 디바이스 고장 허용을 유지하기 위한 방법 및 시스템 | |
RU2665246C1 (ru) | Аппаратно-вычислительный комплекс виртуализации и управления ресурсами в среде облачных вычислений | |
US7506115B2 (en) | Incremental provisioning of software | |
JP7463527B2 (ja) | リザベーションに基づいた高性能コンピューティングシステム及び方法 | |
US8055867B2 (en) | Methods, apparatuses, and computer program products for protecting pre-staged provisioned data in a storage system | |
JP2011060306A (ja) | ブート構成変更方法 | |
WO2014041664A1 (ja) | 情報処理システム、情報処理装置、移行制御プログラム、及び移行制御方法 | |
Server | Microsoft | |
RU2665224C1 (ru) | Способ динамического контроля конфликтных ситуаций в сложных технических системах со средой облачных вычислений | |
WO2016056050A1 (ja) | 計算機システム及びそれの管理システム | |
GUIDE | Deploying Virtualized Hadoop® Systems with VMware vSphere® Big Data Extensions™ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7463527 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |