JP6556748B2 - コンピュータにおいて複数のスレッドをディスパッチするための方法、システム、およびコンピュータ・プログラム - Google Patents

コンピュータにおいて複数のスレッドをディスパッチするための方法、システム、およびコンピュータ・プログラム Download PDF

Info

Publication number
JP6556748B2
JP6556748B2 JP2016558045A JP2016558045A JP6556748B2 JP 6556748 B2 JP6556748 B2 JP 6556748B2 JP 2016558045 A JP2016558045 A JP 2016558045A JP 2016558045 A JP2016558045 A JP 2016558045A JP 6556748 B2 JP6556748 B2 JP 6556748B2
Authority
JP
Japan
Prior art keywords
guest
thread
core
threads
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016558045A
Other languages
English (en)
Other versions
JP2017515203A (ja
Inventor
ヘラー、リサ、クラントン
クバラ、ジェフリー、ポール
ブサバ、ファディ、ユスフ
ブラッドベリー、ジョナサン、デイヴィッド
ファレル、マーク
オシイェク、ダミアン、レオ
グレイナー、ダン
スリゲル、ティモシー
シュミット、ドナルド、ウィリアム
ゲイニー、チャールズ
ジャコビ、クリスチャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2017515203A publication Critical patent/JP2017515203A/ja
Application granted granted Critical
Publication of JP6556748B2 publication Critical patent/JP6556748B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30076Arrangements for executing specific machine instructions to perform miscellaneous control operations, e.g. NOP
    • G06F9/3009Thread control instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/3017Runtime instruction translation, e.g. macros
    • G06F9/30174Runtime instruction translation, e.g. macros for non-native instruction set, e.g. Javabyte, legacy code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45545Guest-host, i.e. hypervisor is an application program itself, e.g. VirtualBox
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5018Thread allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Executing Machine-Instructions (AREA)
  • Advance Control (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Stored Programmes (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、概して、マルチスレッディング(MT)に関し、より詳細には、コンピュータ内の複数のスレッドをディスパッチするための仮想実行開始命令に関する。
マルチスレッディング(MT)は、追加のコアを追加することなしに、単一の物理プロセッサコア内で並列に動作することができるプロセッサ・スレッドの数を増加させるための手段を提供する。理想的には、MTは、1つまたは複数のスレッドが同じコア上で実行されている他のスレッドによって現在使用されていないコア・ハードウェアの一部を使用することによって、この増加した容量を提供する。たとえば、1つのスレッドにおけるキャッシュミスまたは他の遅延によって生じるレイテンシの間、1つまたは複数の他のスレッドは、コア・リソースを利用することができ、したがってリソースの利用率を増加させる。実際には、この共有は、スレッド間のなんらかの干渉をもたらし、なんらかの追加のハードウェアを必要とするにもかかわらず、MTは、各スレッドがそれ自体の隔離されたコア・ハードウェア上で実行される場合に必要とされるよりも少ないハードウェアを使用して各スレッドの作業を実行する能力を依然として提供する。しばしば、スレッド間のハードウェア・リソースの共有が、メモリからのデータなどの情報を2つの固有のコアに提供するために、コンピュータ・システム上の全体的な負担も減少させるとき、追加の利点をMTから得ることができる。
典型的には、MTは、ハードウェアの節約を提供するが、別の作業スレッドの追加は、追加の別個のコアを使用して増加した容量を提供する場合に必要とされる調整コストと、ハイパーバイザ・レベルで同じだけ消費する。多くの場合、特定のスケーリング比が達成されると、作業スレッド間でリソースを調整するためのオーバヘッドは、単一のコアまたは共有されるコアのいずれにおいて実行されるのかにかかわらず大きく、独立した作業スレッドを実行させる能力によって見られる利点を減少させる可能性があり、またはオーバヘッドが利点を上回る可能性すらある。すなわち、一般的に、管理するものの数が増加するにつれて、管理オーバヘッドが大きくなる。
米国特許出願第14/226,895号 米国特許出願第14/226,947号
"z/Architecture Principles of Operation," IBMPublication No. SA22-7832-09, August 2012
シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを備える構成内の複数のスレッドをディスパッチするための方法、システム、及びコンピュータ・プログラムを提供することを目的とする。
本発明は、請求項1において特許請求されるコンピュータ実装方法と、対応するシステムおよびコンピュータ・プログラムとを提供する。上記コンピュータ実装方法は、シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを備える構成内で複数のスレッドをディスパッチするためのコンピュータ実装方法であって、前記コアが、複数の物理スレッドを含み、前記方法が、前記コア上で前記STモードで実行するホスト・プログラムによって、前記コア上で、ゲスト仮想マシン(VM)のすべてまたは一部を含むゲスト・エンティティをディスパッチするための仮想実行開始(start−VE)命令を発行することを備え、前記start−VE命令が、前記コアによって実行され、前記実行が、前記start−VE命令によって指定された位置から、ゲスト状態を有する第1の状態記述を得ることと、前記ゲスト状態に基づいて、前記ゲスト・エンティティが単一のゲスト・スレッドまたは複数のゲスト・スレッドのいずれを含むのかを決定することと、前記ゲスト状態と、前記ゲスト・エンティティが複数のゲスト・スレッドを含むと決定することとに基づいて、前記MTモードで前記コア上で、互いに独立して実行される前記ゲスト・スレッドを開始することと、及び前記ゲスト状態と、前記ゲスト・エンティティが単一のゲスト・スレッドを含むと決定することとに基づいて、前記STモードで前記コア上で前記ゲスト・スレッドを開始することとを含む。上記対応するシステムは、上記コンピュータ実装方法のすべてのステップを実行するように適合された手段を備える。上記コンピュータ・プログラムは、コンピュータ・システム上で実行されたとき、上記方法のすべてのステップを実行するための命令を備える。
実施形態とみなされる主題は、本明細書に添付の特許請求の範囲で特に指摘され、明確に特許請求されている。実施形態の上記および他の特徴、ならびに利点は、添付図面と併せて以下の詳細な説明から明らかである。
一実施形態に従って実装され得るコンピューティング環境を示す図である。 一実施形態に従って実装され得る物理プロセッサを示す図である。 一実施形態に従って実装され得るコンピューティング環境を示す図である。 一実施形態によるマルチスレッド(MT)論理スレッドの状態記述を示す図である。 一実施形態によるスレッド有効性マスク(TVM(thread-validity mask))のブロック図である。 一実施形態による固定オフセット状態記述グループを示す図である。 一実施形態による、アドレス・リストとして指定された状態記述グループを示す図である。 一実施形態による、リンク・リストとして指定された状態記述グループを示す図である。 一実施形態による、循環リストまたはリングとして指定された状態記述グループを示す図である。 一実施形態によるコア・ディスパッチ・プロセスを示す図である。 一実施形態による、仮想実行からの協調したエグジット(coordinated exit)を示す図である。 一実施形態による、システム制御エリアのブロック図である。 一実施形態による、マルチスレッド・コア間で調整するためのプロセス・フローを示す図である。 一実施形態によるコンピュータ可読媒体を示す図である。
本明細書に記載の実施形態は、マルチスレッディング(MT)環境でハイパーバイザ管理オーバヘッドを減少させるために使用され得る。本明細書に記載されているように、複数のスレッドの管理は、複数のスレッドを単一の論理コアとして管理するハイパーバイザと、複数のスレッドが物理コアのリソースにアクセスするとき複数のスレッド間の相互作用を管理するマシンとの間で分割され得る。これは、ハイパーバイザが論理コア単位でハイパーバイザのインフラストラクチャ・リソースの多くを管理することを可能にし、マシンがより微細なスレッド単位で他のリソースを管理することを可能にすることによって、マルチスレッディング(MT)オーバヘッド・コストの実質的な減少をもたらすことができる。一実施形態は、シングルスレッド(ST)上で実行されているハイパーバイザによって実行され得るコア・ディスパッチ命令を含む。本明細書では「MTを指定するstart−VE命令」と呼ばれるコア・ディスパッチ命令の実行は、ゲスト仮想マシン(VM)のすべてまたは一部を構成する複数のゲスト論理スレッドを、単一の物理コア上でディスパッチさせることができる。一実施形態では、ゲストをディスパッチするためにハイパーバイザによって使用される命令は、ディスパッチされるべきゲストが、シングルスレッド化されるのか、またはマルチスレッド化されるのかを指定する。
本明細書に記載の実施形態は、ゲスト論理コア内のどの論理スレッドが現在有効であるのかを示すためのスレッド有効性マスク、および、マルチスレッド論理コアのディスパッチを管理するための状態記述リングを含む状態記述グループなどの構造を含むことができる。加えて、プライマリおよびセカンダリ状態記述、ならびにフィールド・タイプ(たとえば、プライマリ、コア共通、スレッド固有)は、複数のスレッドを有する論理コアがディスパッチされるとき、コンピュータ・リソースの効率的な管理を可能にするように実装され得る。さらに、論理コア内のすべてのスレッドが同時に仮想実行からエグジットする協調したエグジットは、ハイパーバイザ機能と論理コア管理機能の両方を簡略化するために提供され得る。
実施形態は、本明細書ではコア指向システム制御エリア(COSCA(core oriented system control area))と呼ばれる、ハイパーバイザによって維持される制御構造を含むことができる。COSCAは、ゲスト構成内の複数の論理プロセッサに影響を与える可能性がある特定の機能を管理するために、ハイパーバイザとマシンの両方によって使用される。COSCAの一実施形態は、葉(leaves)が論理コア(logical cores)を表し、各葉がそのコアのスレッドに対応するリストを含むツリー構造として実装される。COSCA構造は、ハイパーバイザが特定のコアにおけるスレッドのすべてのための状態記述に容易にアクセスすることを可能にするフィールド(たとえば、状態記述アドレス)を含むことができる。
本明細書で使用される「スレッド」という用語は、単一の命令ストリームおよびその関連する状態を指す。すなわち、アーキテクチャ・レベルでは、各論理スレッドは、独立したCPUまたはプロセッサを表す。ハードウェア・レベルでは、物理スレッドは、そのスレッドがディスパッチされたとき、そのゲスト状態の維持と組み合わされた、論理スレッドに関連付けられた命令ストリームの実行である。ハイパーバイザ・レベルで必要とされる管理を減少させるのは、マシンによるスレッド状態の維持である。論理コアによって使用するために利用可能な論理スレッドの総数は、物理コアに利用可能な物理スレッドの総数によって制限される。
本明細書で使用される「物理コア」という用語は、1つまたは複数の独立した命令ストリームを実行するが、実行ユニットおよび低レベル・キャッシュなどの多くの基本リソースを共有するハードウェア処理ユニットを指す。この共有は、各スレッドが独立した時間に同じハードウェア・リソースを使用すること、または、リソースがスレッド識別子でタグ付けされた各物理エントリと論理的に共有されることを含むいくつかの方法で行われ得る。スレッド間、たとえば、リソースAをしばしば必要とするが、リソースBをめったに必要としない1つのスレッドと、典型的にはリソースBを使用するが、リソースAを使用しない別のスレッドとの間の適切な相乗効果は、この共有の効率を改善することができる。本明細書で使用される「マシン」という用語は、ミリコードと同様に物理コアに含まれるハードウェア、および物理コアのサポートで使用される他のハードウェアを指す。
本明細書で使用される「ゲストVM」および「ゲスト」という用語は、単一のCPU
または複数のCPUを含むことができる単一のゲスト構成を指すために互換的に使用される。本明細書で使用される「論理コア」という用語は、MTが指定されるstart−VE命令の一部として一緒にディスパッチされるように定義された論理ゲスト・スレッドまたはCPUのグループを指す。ゲストVMは、単一の論理コア(STもしくはMTのいずれか)または複数の論理コア(同様にその各々がSTもしくはMTであり得る)から作成され得る。
本明細書で使用される「ソフトウェア」という用語は、ハイパーバイザ・プログラム(たとえば、PR/SMもしくはzVM)、またはstart−VE命令の結果としてディスパッチされるゲスト・オペレーティング・システムもしくはアプリケーション・プログラムのいずれかを指す。
本明細書で使用される「ハイパーバイザ」および「ホスト」という用語は、物理ハードウェア上で実行するために、システム・リソースを管理し、ゲスト論理プロセッサをディスパッチするプログラムを指す。
ゲストをディスパッチするために使用されるstart−VE命令のオペランドは、そのゲスト・プロセッサまたはコアの状態を定義する状態記述または状態記述のグループを指す。状態記述自体は、状態記述の拡張とみなすことができ、そのゲスト・コアまたはプロセッサの状態をさらに定義する追加の情報を含むことができる「サテライト・ブロック」へのポインタを有する。本明細書で使用される「状態記述」という用語は、状態記述自体だけでなく、それらのサテライト・ブロックも指す。これらのサテライト・ブロックのうちの1つであるコア指向システム制御エリア(COSCA)は、図12に示されている。
ここで、図1を参照すると、例示的な実施形態によって実装され得るコンピューティング環境100が全体的に示されている。コンピューティング環境100は、たとえば、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるz/Architectureに基づくことができる。z/Architectureは、“z/Architecture Principles of Operation,” IBMPublication No. SA22-7832-09, August 2012と題するIBM(R)刊行物に記載されている。一例では、z/Architectureに基づくコンピューティング環境は、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるeServer zSeriesを含む。
一例として、コンピューティング環境100は、システム・コントローラ120に結合されたプロセッサ複合体102を含むことができる。プロセッサ複合体102は、たとえば、1つまたは複数のパーティション104(たとえば、論理パーティションLP1〜LPn)、1つまたは複数の物理コア106(たとえば、Core1〜Corem)、およびレベル0ハイパーバイザ108(たとえば、論理パーティション・マネージャ)を含むことができ、その各々は、以下に説明されている。
各論理パーティション104は、別個のシステムとして機能することが可能であり得る。すなわち、各論理パーティション104は、独立してリセットされ、所望の場合、オペレーティング・システム110を用いて最初にロードされ、異なるプログラムで動作することができる。論理パーティション104において実行されるオペレーティング・システム110またはアプリケーション・プログラムは、全面的かつ完全なシステムへのアクセス権を有するように見えることがあるが、現実には、その一部のみが利用可能である。ハードウェアおよびライセンス内部コード(一般にマイクロコードもしくはミリコードまたはファームウェアとも呼ばれる)の組合せは、ある論理パーティション104内のプログラムが異なる論理パーティション104内のプログラムと干渉するのを防止する。これは、いくつかの異なる論理パーティション104が、タイム・スライスされた方法で単一のまたは複数の物理コア106上で動作することを可能にする。一実施形態では、各物理コアは、1つまたは複数の中央プロセッサ(本明細書では「物理スレッド」とも呼ばれる)を含む。図1に示す例では、各論理パーティション104は、1つまたは複数の論理パーティション104ごとに異なってもよい常駐オペレーティング・システム110を有する。各論理パーティション104内で実行されるオペレーティング・システム110は、仮想マシンまたはゲスト構成の一例である。一実施形態では、オペレーティング・システム110は、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるz/OS(R)オペレーティング・システムである。
物理コア106は、論理パーティション104に割り当てられた物理プロセッサ・リソースを含む。論理パーティション104は、1つまたは複数の論理プロセッサを含むことができ、論理プロセッサの各々は、パーティション104に割り当てられた物理プロセッサ・リソースのすべてまたは一部を表す。物理コア106は、下にあるコア106の物理プロセッサ・リソースがそのパーティション104のために確保されるように、特定のパーティション104の論理コアに専用であってもよく、または、下にあるコア・リソースの物理プロセッサ・リソースが別のパーティション104に潜在的に利用可能であるように、別のパーティション104の論理コアと供給されてもよい。
図1に示す実施形態では、論理パーティション104は、物理コア106上で実行されるファームウェアによって実装されたレベル0ハイパーバイザ108によって管理される。論理パーティション104およびハイパーバイザ108は、各々、物理コア106に関連付けられた中央ストレージ(メモリ)のそれぞれの部分に存在する1つまたは複数のプログラムを備える。ハイパーバイザ108の一例は、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるProcessor Resource/Systems Manager(PR/SM(TM))である。
図1では中央プロセッサ複合体102に結合されているシステム・コントローラ120は、要求を発行する異なるプロセッサ間で調停することを担当する集中型ロジックを含むことができる。たとえば、システム・コントローラ120は、メモリ・アクセス要求を受信したとき、そのメモリ位置へのアクセスが許可されているかどうかを決定し、許可されている場合、その複合体内のプロセッサ間のメモリ整合性を維持しながら、そのメモリ位置の内容を中央プロセッサ複合体102に提供する。
ここで図2を参照すると、図1中の物理コア106などのマシンまたは物理コアを実装するための処理回路200のブロック図が、一実施形態に従って全体的に示されている。処理回路200は、多処理環境内の複数の物理コアのうちの1つの物理コアを含むことができる。図2に示す処理回路200は、処理回路200を他のコアおよび周辺デバイスに結合することができるシステム・コントローラ・インターフェース・ユニット202を含む。システム・コントローラ・インターフェース・ユニット202はまた、データ値を読み取り、記憶するDキャッシュ204、プログラム命令を読み取るIキャッシュ208、およびキャッシュ・インターフェース・ユニット206を、外部メモリ、プロセッサ、および他の周辺デバイスに接続することができる。
Iキャッシュ208は、命令をプリフェッチする命令フェッチ・ユニット(IFU)210と共に命令ストリームのローディングを提供することができ、投機的ローディングおよび分岐予測機能を含むことができる。フェッチされた命令は、命令処理データにデコードするための命令デコード・ユニット(IDU)212に提供され得る。
IDU212は、命令を発行ユニット214に提供することができ、発行ユニット214は、一般的な動作を実行するための1つまたは複数の固定小数点ユニット(FXU)216、および浮動小数点演算を実行するための1つまたは複数の浮動小数点ユニット(FPU)218などの様々な実行ユニットへの命令の発行を制御することができる。FPU218は、2進浮動小数点ユニット(BFU)220、10進浮動小数点ユニット(DFU)220、または任意の他の浮動小数点ユニットを含むことができる。発行ユニット214はまた、1つまたは複数LSUパイプラインを介して1つまたは複数のロード/記憶ユニット(LSU)228に結合され得る。複数のLSUパイプラインは、ロードおよび記憶と、分岐のためのアドレス生成とを実行するための実行ユニットとして扱われる。LSU228とIFU210の両方は、オペランドおよび命令アドレスのためのバッファリングされた変換を提供するために、変換索引バッファ(TLB)230を利用することができる。
FXU216およびFPU218は、汎用レジスタ(GPR)224および浮動小数点レジスタ(FPR)226などの様々なリソースに結合される。GPR224およびFPR226は、LSU228によってDキャッシュ204からロードされ、記憶されたデータ値のためのデータ値ストレージを提供する。
ここで図3を参照すると、一実施形態によって実装され得るコンピューティング環境300が全体的に示されている。図3に示すコンピューティング環境300は、LP2とラベル付けされた論理パーティション104内で実行するレベル1ハイパーバイザ302を追加した、図1に示すコンピューティング環境100と同様である。図3に示すように、レベル1ハイパーバイザ302は、複数のオペレーティング・システム(たとえば、仮想マシンVM1 304、VM2 306、およびVM3 308上で実行されるOS1 314、OS2 312、およびOS3 310)間のリソースのトランスペアレント・タイム・スライシング、および、LP2とラベル付けされた論理パーティション104内のこれらのオペレーティング・システムの互いからの分離などの、ハイパーバイザ108(本明細書では「レベル0ハイパーバイザ」とも呼ばれる)に関して先に説明したのと同じハイパーバイザ機能を提供することができる。図3に示す実施形態は、例として3つの仮想マシンを含み、他の実施形態は、アプリケーション要件に基づいて、より多い、またはより少ない仮想マシンを含んでもよい。
図3に示すように、LP1とラベル付けされた論理パーティション104は、常駐オペレーティング・システム110を有し、LP2とラベル付けされた論理パーティション104は、レベル1ハイパーバイザ302を実行し、レベル1ハイパーバイザ302は、その各々がそれ自体の常駐オペレーティング・システム314、312、310を実行する仮想マシン304、306、308を作成する。任意の数の論理パーティション104は、レベル1ハイパーバイザ302を実行してもよい。一実施形態では、レベル1ハイパーバイザ302は、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるz/VMハイパーバイザである。様々な論理パーティションで実行される常駐オペレーティング・システムは、異なってもよく、レベル1ハイパーバイザ302の下で実行されているとき、単一のパーティション104(たとえば、LP2)内の常駐オペレーティング・システム(たとえば、オペレーティング・システム314、312、310)も、異なってもよい。一実施形態では、LP1とラベル付けされた論理パーティション104内のオペレーティング・システム110は、ニューヨーク州、アーモンクのインターナショナル・ビジネス・マシーン社によって提供されるz/OSオペレーティング・システムである。一実施形態では、オペレーティング・システム310および312は、Linuxであり、オペレーティング・システム314は、z/OSである。
レベル1ハイパーバイザ302は、論理パーティション104内で実行されているとき、ハイパーバイザ108などのレベル0ハイパーバイザによって論理パーティション104に提供されるのと同じリソースの仮想化を、仮想マシン308、306、304内で実行されるオペレーティング・システム310、312、314に提供することができる。第1のレベルでのように、各仮想マシンは、複数の仮想プロセッサを含んでもよい。
物理コア106は、図1について説明したように、専用であってもよく、または論理パーティション104のLP1、LP2、LP3、およびLP4の間で共有されてもよい物理プロセッサ・リソースを含む。論理パーティションLP2が1つまたは複数の物理コア上でディスパッチされたとき、レベル1ハイパーバイザ302は、次いで、その仮想マシンVM1 304、VM2 306、およびVM3 308の間でこれらのリソースを透過的に共有することができる。一実施形態では、レベル0ハイパーバイザ108は、マルチスレッド・レベル1ハイパーバイザ302をディスパッチするために、MTを指定するstart−VE命令を使用し、マルチスレッド・レベル1ハイパーバイザ302は、次いで、シングルスレッド仮想マシンVM1 304、VM2 306、およびVM3 308をディスパッチするために、STを指定するstart−VE命令を使用する。別の実施形態では、レベル0ハイパーバイザ108は、シングルスレッド・レベル1ハイパーバイザ302をディスパッチするために、STを指定するstart−VE命令を使用し、シングルスレッド・レベル1ハイパーバイザ302は、次いで、マルチスレッド仮想マシンVM1 304、VM2 306、およびVM3 308をディスパッチするために、MTを指定するstart−VE命令を使用する。別の実施形態では、レベル1ハイパーバイザ302とそのゲストVM304、306、308の両方は、すべてシングルスレッドである。
ゲスト多処理(MP)環境では、ハイパーバイザは、ゲスト構成内の複数の論理プロセッサに影響を与えることができる特定の機能を管理するためにハイパーバイザとマシンの両方によって使用される、システム制御エリア(SCA)として知られる制御構造を維持することができる。同じSCA原点(SCAO)は、構成および仮想マシン内のすべてのゲスト・プロセッサのための状態記述において指定される。一実施形態では、このエリアは、共通エリア(一般に、ゲスト構成の広範な機能を調整するために使用される)と、別個のプロセッサ固有のエントリとを含むことができる。共通エリアは、たとえば、ゲスト構成内のどの仮想プロセッサが有効であるかについての情報を保持する。SCA内の別個のプロセッサ固有のエリアは、たとえば、プロセッサ間割込みなどのプロセッサ間ゲスト機能を解釈もしくはエミュレートするため、または、各論理プロセッサのそれぞれの状態記述に容易にアクセス可能なポインタを提供するために使用され得る。一実施形態では、STのために使用されるSCAは、各潜在的なゲスト・スレッドのための追加のスレッド固有エントリを追加することによって、MT使用のために拡張される。
コア・ディスパッチの一実施形態は、シングルスレッド上で実行されているハイパーバイザが、しばしば開始マルチスレッド仮想実行(start−MVE)と呼ばれるstart−VE命令のバリエーションを使用して、そのコア上でマルチスレッド・ゲストをディスパッチすることを可能にすることができる。マルチスレッド・ゲスト内の各スレッドは、ゲスト論理中央処理ユニット(CPU)、またはゲスト・スレッドを表すことができる。start−VE命令は、状態記述内の制御フィールドを介して、物理コア上のマルチスレッディング(MT)ゲスト実行を可能にすることができる。start−VE命令のオペランドは、コア・ディスパッチのために使用されたとき、すべてのゲスト・スレッドの状態を含む単一状態記述、または、その各々が、たとえば、単一のゲスト・スレッドの状態を表す状態記述のグループのいずれかを指定することができる。一実施形態では、論理コアは、状態記述のこのグループを含む。コア・ディスパッチは、論理コアおよびこれらのゲスト論理スレッドの各々の状態を物理コア・スレッドおよびそのスレッドにロードするために仮想実行エントリを必要とする。これらのスレッドは、互いに独立して動作する命令ストリームであり得る。様々な実施形態では、状態記述のグループは、互いからの固定オフセットとして、状態記述アドレスもしくは状態記述のリストとして、または、別個のゲスト・スレッドを表すそのグループにおける各状態記述でコアに適用する状態記述の循環リスト(リング)として、含む、いくつかの方法で指定され得る。そのような技術は、ハイパーバイザおよびマシンによる論理コア内の他のスレッドへの容易なアクセスを可能にし、論理コア全体に適合するフィールドが単一の場所で維持されることを可能にする。
ゲストOSは、単にゲストにおけるマルチスレッド化を可能にするMT設定命令を発行することによって、マルチスレッド化を使用することができる。これは、ゲストOSがこれらの新しいスレッドを追加の独立したCPUとして扱い、マルチスレッド化がない場合のようにそれらを管理することを可能にする。加えて、ゲストOSは、これらのスレッドがコアを共有するという事実を活用するようにこれらのスレッドを使用することができ、または、より相互依存的な方法でこれらのスレッドを動作させることができる。これは、ハイパーバイザおよびマシンにすべて透過的である。ハイパーバイザは、次いで、ハイパーバイザ自体がコアあたり単一のスレッド上で実行し続け、コア・ベースでゲストMT環境の多くを管理し続けながら、これらの追加のスレッドをゲストOSに提供する。マルチスレッド化のOSの実施可能要件は、「Thread Context Preservation in a Multithreading Computer System」と題する、米国特許出願第14/226,895号に詳細に記載されている。
コア・ディスパッチの一実施形態では、MTを指定するstart−VE命令のオペランドとして指定された状態記述は、「プライマリ」状態記述であり、関連するゲスト論理スレッドは、「プライマリ」スレッドである。グループ内の他の状態記述は、本明細書では「セカンダリ」状態記述と呼ばれ、適用可能である場合、セカンダリ論理スレッドに適合する。状態記述グループがリストまたはリングのいずれかとして実装されたとき、第1のセカンダリ状態記述を指すプライマリ状態記述内の次の状態記述(NSD)フィールドが存在することができ、第1のセカンダリ状態記述は、1)グループ内の次のセカンダリ状態記述を指すか、または、2)グループの最後を示す値を含む。リスト内の最後の状態記述内のNSD値は、プライマリ状態記述のアドレスであってもよく、その場合、リストは、状態記述のリングを形成する。
非MT実装では、ハイパーバイザは、一度に所与の物理コア上の1つのゲスト論理プロセッサ(本明細書では「論理スレッド」とも呼ばれる)をディスパッチする。特定の論理プロセッサが無効な状態、たとえば、停止状態または無効な待機にある場合、ハイパーバイザは、そのゲストをディスパッチしない。MT環境では、コア・ディスパッチは、ハイパーバイザが同時にコア上の複数のゲスト・スレッドをディスパッチすることを可能にする。その論理コアの状態記述グループにおける1つまたは複数のスレッドが無効である可能性に対応するために、一実施形態は、プライマリ状態記述内のスレッド有効性マスク(TVM)を利用し、TVMの各ビットは、グループ内の対応する状態記述内の論理スレッドの、ソフトウェアの観点からの有効性を示す。
別の実施形態では、有効なスレッドのみが状態記述グループに含まれ、有効性指示は、必要ない。状態記述グループ内の無効な論理スレッドを含む実施形態は、ハイパーバイザが、これらの無効なスレッドに関連付けられた状態を維持することを可能にし、これらのスレッドは、将来再び有効になる可能性がある。マシンは、単に有効な状態を有するこれらのスレッドを初期化し、実行することになる。ハイパーバイザは、グループ内の少なくとも1つのスレッドが有効である場合、単にゲスト論理コアをディスパッチすることになる。
ここで図4を参照すると、ゲストの設計(architected)状態の大部分を含む論理スレッドの状態記述が、一実施形態に従って全体的に示されている。この文脈では、「状態記述」という用語は、状態記述自体だけでなく、拡張として機能する、そのポインタが状態記述に存在するサテライト・ブロックも含む。図4に示すように、状態記述400は、ゲスト汎用レジスタ(GR)402と、アクセス・レジスタ(AR)404と、制御レジスタ(CR)406と、ゲスト・タイマ408(クロック比較器およびCPUタイマを含む)と、ゲスト・プレフィックス・レジスタ410と、仮想CPU番号(VCN)412と、プログラム状態ワード(PSW)と、命令アドレス(IA)414とを含むことができる。加えて、それは、特定の命令(たとえば、ロード・プログラム状態ワード(LPSW)および無効化ページ・テーブル・エントリ(IPTE))がホストに対する遮断を要求するかどうか、または、ゲスト変換索引バッファ(TLB)のパージが、ゲスト命令実行が開始され得る前に要求されたかどうかを示すために、遮断制御(IC)ビット420などの制御情報を含むことができる。状態記述はまた、図6〜図9に示すように状態記述リストおよびリングを定義するために使用される次の状態記述(NSD)422を含む。プライマリ状態記述はまた、図5に記載のTVM430と、論理パーティション番号(LPN)432とを含む。仮想CPU番号(VCN)412は、「Address Expansion and Contraction in a Multithreading ComputerSystem」と題する、米国特許出願第14/226,947号に詳細に記載されているように、CPU番号と等価であり、MTモードにあるスレッド番号を含むように潜在的に調整される。
コア内のスレッドは、バイナリ・スレッド情報(TID)によって識別され得る。以下の図面における簡潔さのために、スレッドxは、しばしば、TIDxという用語で呼ばれ、この場合、意味は、「TIDxを有するスレッド」である。
ここで図5を参照すると、スレッド有効性マスク(TVM)520のブロック図が、一実施形態に従って全体的に示されている。図5に示すように、TVM520のビット0 530は、状態記述グループ内の論理スレッド0の有効性を表し、ビット1 531は、スレッド1の有効性を表し、ビット2 532は、スレッド2の有効性を表し、ビット3 533は、スレッド3の有効性を表し、スレッドn、すなわち、このコアに関連付けられた状態記述グループ内の最後の可能な論理スレッドの有効性を表すビットn 537まで以下同様である。TVMは、グループのためのプライマリ状態記述に存在することができる。
ここで図6を参照すると、固定オフセット状態記述グループ構造が、一実施形態に従って全体的に示されている。図6に示すように、状態記述グループは、互いに固定オフセット(N)で指定される。この場合、start−VE命令602のオペランドは、論理スレッド0のためのプライマリ状態記述603を指す。論理スレッドx605のためのセカンダリ状態記述は、プライマリ状態記述の後にNバイトの固定オフセットで配置され、論理スレッドy607のためのセカンダリ状態記述は、スレッドxのためのセカンダリ状態記述の後のNバイトに配置される。これは、グループ内のすべてのスレッドについて続く。グループ内のスレッドの数は、プライマリ状態記述内のカウント、または、リスト内の最後の状態記述アドレスに続く終了マーカ、を含むいくつかの方法で決定され得る。
図6は、2つの場合、グループが、グループ内のすべての論理スレッドのための状態記述を、それらが有効であろうとなかろうと含む第1の場合と、有効な状態記述のみがグループに含まれる第2の場合とを表すことができる。第1の場合では、スレッドx605のための状態記述は、スレッド1の状態を表し、スレッドy607のための状態記述は、スレッド2の状態を表す。この第1の場合でのみ必要とされるTVM620は、これらの論理スレッドの各々の有効性を表す。第2の場合では、スレッドx605のための状態記述は、第1の有効な論理セカンダリ・スレッドの状態を表し、論理スレッドy607のための状態記述は、第2の有効なセカンダリ・スレッドの状態を表す。たとえば、スレッド1が有効ではなく、スレッド2および3が両方とも有効である場合、スレッドx605は、スレッド2を表すことになり、スレッドy607は、スレッド3を表すことになる。スレッド1は、無効であるので、スレッド1のためのグループに含まれる状態記述は、存在しないことになる。これらの同じ2つの場合はまた、以下の図7〜図9に示す実施形態に適合し得るが、場合1のみが説明され、描かれる。
ここで図7を参照すると、リストとして指定された状態記述グループが、一実施形態に従って全体的に示されている。この場合、start−VE命令702のオペランドは、リスト内の第1のエントリ704がスレッド0のためのプライマリ状態記述705を指し、リスト内の第2のエントリ706がスレッド1のためのセカンダリ状態記述707を指し、リスト内の第3のエントリ708がスレッド2のためのセカンダリ状態記述709を指すなど、グループ内のすべてのスレッドについて続く、状態記述アドレスのリストを表す。TVM720は、これらのスレッドの各々の有効性を表す。
ここで図8を参照すると、リンク・リストとして指定された状態記述グループ構造が、一実施形態に従って全体的に示されている。この場合、図6に示す場合のように、start−VE命令802のオペランドは、スレッド0のためのプライマリ状態記述803を指すが、スレッド1のためのセカンダリ状態記述805のためのポインタ804は、プライマリ状態記述内の次の状態記述(NSD)フィールド804として提供される。同様に、スレッド2のためのセカンダリ状態記述807のためのポインタ806は、スレッド1のためのセカンダリ状態記述内のNSD806として提供される。これは、最後のスレッドnのための状態記述809内のNSD810がリストの終わりを示すゼロまたはなにか他のユニークな値として指定されて、グループ内のすべてのスレッドについて継続する。プライマリ状態記述803に設けられたTVM820は、これらのスレッドの各々の有効性を表す。
ここで図9を参照すると、循環リストまたはリングとして指定された状態記述グループ構造が、一実施形態に従って全体的に示されている。この場合は、start−VE命令902のオペランドがスレッド0のためのプライマリ状態記述903を指し、プライマリ状態記述903がスレッド1のためのセカンダリ状態記述905のためのNSD904を含み、セカンダリ状態記述905がスレッド2のためのセカンダリ状態記述907のためのNSD906を含み、これが最後のスレッドnまですべてのスレッドについて継続する、図8に示す場合と同じである。しかしながら、図9に示す実施形態では、スレッドnのための状態記述909内のNSD910は、循環リストを形成し、プライマリ状態記述903に戻って指す。プライマリ状態記述903に設けられたTVM920は、これらのスレッドの各々の有効性を表す。
コア・ディスパッチは、ハイパーバイザがコア・レベルで論理スレッドの多くの側面を管理することを可能にする。コア・ディスパッチは、しばしば、コアの複数のスレッドの仮想実行の調整をマシンに押し込めることによってスレッド管理に必要なハイパーバイザ・コードを簡略化するだけでなく、構成内のより多くのプロセッサを管理するために必要なオーバヘッドを減少させることもできる。論理パーティション(またはゲスト)のための優先度管理は、論理コア・レベルで行われ続けることができ、このタイプの管理に対するスケーリング圧力を減少させる。ハイパーバイザ自体は、start−VE命令を再発行する前に、その必要性(命令遮断など)がすべて満たされていることを確認するために、論理コアに関連付けられたスレッドの集合を管理する必要が依然としてある。
ここで図10を参照すると、一実施形態によるコア・ディスパッチ・プロセスが、全体的に示されている。図10に示すように、ハイパーバイザは、物理コアN1010および物理スレッドA1020上でシングルスレッド化されて実行されている。ブロック1022では、ハイパーバイザは、マルチスレッド・ゲスト・コアをディスパッチするために、MTを指定するstart−VE命令を発行する。マシンは、ゲストがマルチスレッド化されていることを決定し、ブロック1024で、物理スレッドBおよびCを、ソフトウェアを実行するために利用可能にする。マシンは、スレッドの各々のための状態記述から対応する物理スレッドにゲスト状態をロードする。図10に示す実施形態では、マシンは、この機能を実行するために、複数の物理スレッドを使用し、すなわち、ブロック1026に示すように、物理スレッドA1020上で実行されているミリコードは、物理スレッドAにゲスト論理スレッドXの状態をロードする。同様に、ブロック1046および1066に示すように、物理スレッドB1040およびC1060上で実行されているミリコードは、物理スレッドBおよびCにゲスト論理スレッドYおよびZの状態をロードする。ゲスト状態がロードされたら、ゲスト論理スレッドX、Y、およびZ上で実行されているソフトウェアは、ブロック1028、1048、および1068に示すように、物理スレッドA、B、およびC上で実行される。
ここで図11を参照すると、仮想実行からの協調したエグジットが、一実施形態に従って全体的に示されている。図11に示すように、ゲスト論理スレッドX、Y、およびZは、ブロック1128、1148、および1168に示すように、物理スレッドA1120、B1140、およびC1160上でゲストソフトウェアを実行している。1つまたは複数のゲスト・スレッドは、仮想実行からのエグジットが必要とされることを決定する。図11を参照すると、物理スレッドB1140上で実行されているゲスト論理スレッドYは、ブロック1150に示すように、仮想実行から出なければならいことを決定し、マシンに、仮想実行からエグジットするように物理スレッドA1120およびC1160に合図させる。ブロック1136、1154、および1174では、物理スレッドの各々の上で実行されているミリコードは、仮想実行からのエグジットを調整し、次いで、ブロック1156および1176に示すように、物理スレッドB1140およびC1160を、ソフトウェアによる使用のために利用不可能にする。物理スレッドA1120上のミリコードは、ブロック1138に示すように、ホスト状態をハードウェアにリロードし、これは、ブロック1140に示すように、物理スレッドA上のハイパーバイザ・ソフトウェアの実行をもたらす。ハイパーバイザは、次いで、必要に応じて、任意の保留中のゲスト遮断およびホスト割込みを処理することになる。
図12は、一実施形態による、複数の論理コアを含む単一のゲスト構成のためのコア指向システム制御エリア(COSCA)のブロック図を示す。図12に示すCOSCAは、コア内の論理スレッド間、および異なるコア上の論理スレッド間の調整を提供するために使用され得る。COSCAは、コア記述エリアを分離するために、各論理コアに1つ、ポインタでゲスト構成全体を表す共通エリアを含むことができる。各コア記述は、コアと、そのコアのための一連の連続した別個のスレッド固有の領域またはスレッド記述とを含む。別の実施形態では、コア記述は、スレッド記述の位置を提供する。提供される位置は、暗示されてもよい(たとえば、それらは、コア記述に含まれるリストであり、または、コア記述に連続するメモリ・ブロックにあってもよい)。他の実施形態では、スレッド記述を含むメモリ位置へのポインタが提供されてもよい。本明細書で使用される「位置を示す」という用語は、(たとえば、COSCA内のスレッド記述または他の要素)項目の位置を決定するこれらのいずれか、または任意の追加の方法を指すために使用される。この構造は、いくつかの状況では、特にハイパーバイザ・レベルでは、物事がコア単位で管理されることを容易にし、または他の状況では、物事がスレッドもしくはプロセッサ単位で管理されることを容易にする、MTゲスト構成のツリー状表現を維持する。
同じCOSCA原点(COSCAO)は、ゲスト構成内のすべてのゲスト・スレッドのための状態記述内のSCA原点(SCAO)に設けられ得、同じコア記述領域アドレス(CDAA)は、所与のコア内のすべてのスレッドについて提供され得る。この実施形態の利点は、それが、いくつかのハイパーバイザが提供するのが困難な可能性がある多くの隣接する実ストレージを必要としないことである。別の実施形態は、追加のレベルの間接参照を追加し、各スレッド固有エリアのためのポインタのリストを含む各コア記述を有することができ、これらの領域を含む制御ブロックが連続したものである必要性を除去する。
ここで図12を参照すると、各コアに3つの論理スレッドを有する2つの論理コアを含む単一ゲスト構成のためのCOSCAの例示的な実施形態が、全体的に示されている。一実施形態では、COSCAは、(「COSCACA1260」として図12中に示す)COSCA共通エリア1260の内容と、コア記述エリア1270の内容と、コア記述エリア1280の内容とを含む。論理コア0に関連付けられた状態記述グループのためのプライマリ状態記述1203は、ゲスト・コア0をディスパッチするためにハイパーバイザによって使用されるstart−VE命令のオペランド1202として指定される。加えて、論理コア1に関連付けられた状態記述グループのためのプライマリ状態記述1233は、コア1をディスパッチするために使用されるstart−VE命令のオペランド1232として指定される。「コア0スレッド0」のためのプライマリ状態記述は、コア0スレッド1のためのセカンダリ状態記述1213を指すNSD01 1205を含み、セカンダリ状態記述1213は、グループ内のコア0スレッド2のための最後のセカンダリ状態記述1223を指すNSD02 1215を含む。同様に、論理コア1のための状態記述グループは、NSD11 1235を含むコア1スレッド0のためのプライマリ状態記述1233で開始し、NSD11 1235は、NSD12 1245を含むコア1スレッド1のためのセカンダリ状態1243を指し、NSD12 1245は、コア1スレッド2のための最後のセカンダリ状態記述1253を指す。このゲスト構成内の6つのスレッド1203、1213、1223、1233、1243、1253のすべてのための状態記述は、SCAO1204、SCAO1214、SCAO1224、COSCA1234、SCAO1244、SCAO1254に同じ値を含み、COSCA共通エリア1260を指す。
COSCA共通エリア1260は、図12に示すように、ゲスト構成の広範な機能を調整するために使用されるコア・レベル情報を含む。COSCA共通エリア1260は、SCAコア有効性マスク(SCVM)1261を含み、SCVM1261は、ゲスト構成内の各論理コアの有効性を示し、また、各コアのためのコア記述エリア・アドレス(CDAA)1262、1264を含む。SCVM内のビットと、コア記述アドレスのアレイの両方は、コア番号によってインデックス付けされてもよい。コア0のためのコア記述エリア(CDA)1270を指すCDAA0 1262は、COSCA共通エリア1260に含まれる。加えて、コア0内のすべてのスレッドのための状態記述内のCDAAフィールド1206、1216、1226はまた、コア0のためのCDA1270を指す。コア1のためのCDA1280を指すCDAA1 1264はまた、COSCA共通エリア1260に含まれ、同様に、コア1内のすべてのスレッドのための状態記述1236、1246、1256はまた、コア1のためのCDA1280を指す。コア0のためのコア記述エリア(CDA)1270は、コア0内の各論理スレッドの有効性を示すSCAスレッド有効性マスク(STVM0)1271を含む。それはまた、コア0スレッド0、スレッド1、およびスレッド2のためのスレッド記述エリア1272、1274、および1276を含む。コア1のためのCDA1280は、同様に、STVM1と、コア1スレッド0、スレッド1、およびスレッド2のためのスレッド記述エリア1282、1284、および1286とを含む。これらのスレッド記述エリア1272、1274、1276、1282、1284、1286の各々は、それぞれ、そのスレッド記述エリアに対応するスレッド、すなわちコア0スレッド0、コア0スレッド1、コア0スレッド2、コア1スレッド0、コア1スレッド1、およびコア1スレッド2のための状態記述アドレス(SDA)1273、1275、1277、1283、1285、1287を含む。STVM内のビットと、スレッド記述エリアのアレイの両方は、スレッド識別情報によってインデックス付けされてもよい。これらのSDAは、ハイパーバイザがコア内のスレッドを管理するのをより容易にし、マシンがゲスト・プロセッサ間割込みを提示するのをより容易にする。
図13は、図12に示すCOSCAを使用する一実施形態によるマルチスレッド・コアを管理するためのプロセス・フローを示す。図13に示す例では、ブロック1302で、第1の物理スレッド(たとえば、状態記述1213によって定義されるコア0スレッド1)上で実行されているゲストオペレーティング・システム(OS)は、それが第2の論理スレッドまたはターゲット・スレッド(たとえば、状態記述1253によって定義されるコア1スレッド2)に通知することを決定している。ブロック1304では、ゲストOSは、たとえば、プロセッサ間割込み命令を発行することによってこれを行う。マシンは、プロセッサ間割込み命令を実行することの一部として、ゲスト・プロセッサ間割込みをエミュレートするためにCOSCAを使用する。ターゲット論理スレッドを含む論理コアは、シグナリングが行われているのと同時にディスパッチされてもされなくてもよいので、プロセッサ間割込み命令は、マシンによってエミュレートされる。ブロック1306では、マシンは、ターゲット・コアの有効性を検証し、適切なCDAA(たとえば、ターゲット・スレッドがコア1上にあるので、CDAA1 1264)を取得するために、SCVM(たとえば、SCVM1261)にアクセスするように、(たとえば、プロセッサ間割込み命令が論理コア0スレッド1によって実行されたので、SCA0 1214を介して)ゲスト構成のための共通エリア(たとえば、COSCA共通エリア1260)の位置を突き止める。
次に、ブロック1308で、マシンは、ターゲット・コアのためのコア記述エリア(たとえば、CDA1280)の位置を(たとえば、CDA1 1264を介して)突き止める。マシンは、コア記述エリア内のSTVM(たとえば、CDA1280内のSTVM1 1281)にアクセスすることによって、ターゲット・スレッドが有効であることを確認する。ブロック1310では、マシンは、スレッド記述エリア(たとえば、ターゲット・スレッドがスレッド2であるので、スレッド2に対応するスレッド記述エリア1286)の位置を突き止める。ブロック1312では、割込みに関する情報は、ターゲット・スレッドのためのスレッド記述エリアに記録される(たとえば、送り側スレッドのIDを記述エリアに入れる)。ブロック1314では、マシンは、ターゲット・スレッドのための状態記述(たとえば、コア1のためのセカンダリ状態記述TID2 1253)の位置を(たとえば、スレッド記述エリア1286内のSDA12 1287を介して)突き止める。ブロック1316では、割込みは、ターゲット状態記述内で保留中にされる(たとえば、IPビット1257がコア1のための状態記述TID2 1253内で設定される)。結果として、ターゲット論理プロセッサ(たとえば、コア1スレッド2)が物理スレッド上でディスパッチされ、割込みのために有効にされたとき、マシンは、割込みを、可能な場合、ゲスト・オペレーティング・システムに提示することになる。ターゲット論理プロセッサが、割込みが保留中になった時点で既にディスパッチされている場合、有効になったら割込みを行う。
マシンがまた、論理コア内のスレッドが共通の属性を有するという事実を利用することができる実例が存在する。たとえば、コア・ディスパッチは、本来、同じLPARゾーンまたはパーティションに存在する論理コア上のすべてのゲスト・スレッドを有するのに適している。設計は、スレッドごとに一度の代わりにコアごとに一度、ゾーンに関連付けられた物事を実装すればよいようにすることによって、ハードウェアを最小化することができる。加えて、複雑な制御ロジック(たとえば、システムの広範な割込みの取り扱い)はまた、単一のコア値に対処すればよいので、単純化され得る。
一実施形態では、マルチスレッド・ゲストを表す状態記述のグループ内の各フィールド(またはフィールド内のビット)は、プライマリ、コア共通、またはスレッド固有として分類される。プライマリ・フィールドは、プライマリ状態記述にのみ存在し、論理コア内のすべてのプロセッサに適用され、コアの任意のスレッドに代わってプライマリ・フィールドになされる任意のアクセスは、関連するプライマリ状態記述からの値を使用しなければならない。この分類は、スレッド有効性マスクなどの、コアの全体的な状態を定義するフィールドのために使用される。コア共通フィールドは、論理コア内のすべてのプロセッサ間で共通であり、このフィールドは、グループ内のすべての状態記述において同じ値を有し、プロセッサの代わりにこれらのフィールドのうちの1つになされる任意のアクセスは、グループ内の任意の状態記述からの値を使用してもよい。この分類は、LP番号などの、コア全体にわたって適用されるフィールドのために使用される。ハイパーバイザは、すべての状態記述内のコア共通領域を維持するために必要とされるが、マシンは、最高のパフォーマンスを提供するものはどれでも、任意のスレッドの状態記述内のこのフィールドにアクセスすることが許可される。これらのフィールドは、しばしば、ハイパーバイザによって変更されないが、仮想実行内へのすべてのエントリにおいてマシンによってアクセスされるので、スレッド固有ではなくコア共通としてフィールドを定義することは、仮想実行エントリが、たとえば、プライマリ状態記述内の値を使用してプライマリ・スレッドからセカンダリ・スレッド機能をロードすることを可能にする。スレッド固有フィールドは、各論理スレッドに固有であり、任意の所与のスレッドの代わりにこれらのスレッドのうちの1つになされる任意のアクセスは、そのスレッドの状態記述からの値を使用しなければならない。この分類は、ゲスト・プレフィックスなどの、典型的にはスレッド間で一意的であるフィールドのために使用される。
一実施形態では、コア・ディスパッチの使用と、シングルスレッドを実行するハイパーバイザとをサポートするために、所与のコア内のすべてのゲスト・スレッドが同時にSTホストにエグジットする、仮想実行からの協調したエグジット(VEエグジット)が提供され得る。協調VEエグジットの文脈では、VEエグジットのタイプは、3つのカテゴリ、(1)ホスト動作に属するホスト割込み、(2)ゲスト動作に属するホスト割込み、および(3)ゲスト遮断に分割され得る。ホスト外部、I/O、およびなんらかのマシン・チェック割込みは、VEエグジット・カテゴリ(1)に入る。この場合、すべてのゲスト・スレッドは、ホストが割込みを処理することを可能にするために、仮想実行モードをエグジットする必要がある。この割込みは、おそらくホストに異なるゲストをディスパッチさせることになる。仮想実行モードで実行中に割込みが発生した場合、ホスト割込みは、すべての仮想実行モードをエグジットすることができるように、すべてのスレッド上で検出され得るか、または、単一のスレッド上で検出され得、単一のスレッドは、次いで、他のスレッドがエグジットすべきである場合に、他のスレッドに合図する。
VEエグジット・カテゴリ(2)、すなわちゲストに属するホスト割込みは、いくつかのマシン・チェック割込み(訂正不能なストレージ・エラーなど)を含むことができる。非マルチスレッド状況では、これらの条件は、ホスト割込みとして提示される。1つのホスト・スレッドのみが存在するコア・ディスパッチでは、これらの例外は、ゲスト動作に属するので、複数のゲスト・スレッドが、同じホスト割込みのための明白な異なる理由を検出することが可能である。これに対応するために、コア・ディスパッチのために、適用可能なとき、これらのホスト割込みは、ゲスト遮断の新しいタイプとして対応するゲスト状態記述に代わりに示され、以下に説明するカテゴリ(3)と同じに扱われる。一実施形態では、ゲスト・メモリ参照により生じるホスト・アドレス変換障害割込みも、カテゴリ(2)に入り、ゲスト遮断の別の新たなタイプとして提示され得る。
ゲスト・マルチスレッド環境であっても、VEエグジット・カテゴリ(2)および(3)(上記)の両方に関するゲスト遮断は、単一のゲスト・スレッドに属し、別のスレッドのゲスト実行から独立している。複数のゲスト・スレッドは、そのような条件を同時に認識することがさらに可能であり、それらのすべてを処理することをホストに要求する。典型的には、遮断が提示されたとき、ホストは、ゲストの代わりにいくらかの動作をシミュレートし、次いで、その同じゲストを再ディスパッチすることになる。これらの場合では、ホストは、シングルスレッド化されて実行されているので、すべてのゲスト・スレッドは、ホストが遮断を処理することができるようになる前に、仮想実行モードをエグジットしなければならない。これは、1つのスレッドがホストに戻るように遮断しなければならないことを決定しているとき、すべてのスレッドが自然にエグジットするのを待つことによって、または他のスレッドにエグジットするように合図することによって達成され得る。これは、「協調VEエグジット」と呼ばれる。
各スレッドが仮想実行モードをエグジットしなければならないことを決定すると、各スレッドは、VEエグジットに入り、すべての他の有効スレッドがエグジットする準備ができるまで、初期VEエグジット調整ループで待機する。実施態様が必要とする場合、この調整ループに入る前にエグジットするように他のスレッドに合図する。VEエグジット調整ループ内の間、最小限の割込みのみが処理される。ホスト割込みおよびゲスト遮断が適用されない場合に、ゲスト・スレッドが仮想実行モードからエグジットすることを要求される状況を可能にするために、「ノー・アクション」遮断は、遮断アクションがこのゲストに代わって必要とされないことをホストに示すために定義される。
すべてのスレッドが初期VEエグジット調整ループに入ったら、すべての有効状態記述へのゲスト・データの記憶は、完了することができる。すなわち、ハードウェアに存在する現在のゲスト状態は、対応する状態記述に保存されるので、この論理ゲスト・スレッドは、後で再ディスパッチされ得る。制御が(典型的には、プライマリ・スレッド上で実行されている)ハイパーバイザに返される前に、セカンダリ・スレッド状態記述に対するすべての更新が完了したことを保証するために、この記憶が完了した後に、最終VEエグジット調整点が必要とされる。VEエグジットが完了したら、ハイパーバイザは、遮断が提示されたかどうかを決定し、そうである場合、それを適切に処理するために、リング内の各スレッドを処理することができる。そうした後、次いで、この同じゲスト論理コア、または物理プロセッサ上の異なるもののいずれかを再ディスパッチすることができる。
技術的効果および利点は、マルチスレッディング(MT)環境において低減したハイパーバイザ管理オーバヘッドを提供することを含む。複数のスレッドの管理は、複数のスレッドを単一の論理コアとして管理するハイパーバイザと、複数のスレッドが物理コアのリソースにアクセスするときに複数のスレッド間の相互作用を管理するマシンとに分割され得、結果として、ハイパーバイザが論理コア単位でハイパーバイザのインフラストラクチャ・リソースの多くを管理することを可能にし、マシンがより微細なスレッド単位で他のリソースを管理することを可能にすることによって、実質的に低減したマルチスレッディング(MT)オーバヘッドコストをもたらす。
実施形態は、コンピュータにおいて複数のスレッドをディスパッチするための仮想実行開始命令を提供するためのシステム、方法、およびコンピュータ・プログラム製品を含む。一態様によれば、コンピュータ・システムは、シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを有する構成を含む。コアは、物理スレッドを含む。コンピュータ・システムはまた、コア上のゲスト・エンティティをディスパッチするための仮想実行開始(start−VE)命令を発行するようにコア上でSTモードで実行するように構成されたホスト・プログラムを含む。ゲスト・エンティティは、ゲスト仮想マシン(VM)のすべてまたは一部を含む。start−VE命令は、コアによって実行される。実行は、start−VE命令によって指定された位置から第1の状態記述を得ることを含む。第1の状態記述は、ゲスト状態を有する。実行はまた、ゲスト状態に基づいて、ゲスト・エンティティが単一のゲスト・スレッドまたは複数のゲスト・スレッドのいずれを含むのかを決定することを含む。ゲスト状態と、ゲスト・エンティティが複数のゲスト・スレッドを含むことを決定することとに基づいて、ゲスト・スレッドは、MTモードでコア上で開始される。ゲスト・スレッドは、互いに独立して実行される。ゲスト状態と、ゲスト・エンティティが単一のゲスト・スレッドを含むことを決定することとに基づいて、ゲスト・スレッドは、STモードでコア上で開始される。
別の態様によれば、構成内の複数のスレッドをディスパッチするためのコンピュータ実装方法が提供される。構成は、シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを含む。コアは、物理スレッドを含む。方法は、コア上でSTモードで実行するホスト・プログラムによって、コア上のゲスト・エンティティをディスパッチするための仮想実行開始(start−VE)命令を発行することを含む。ゲスト・エンティティは、ゲストVMのすべてまたは一部を含み、start−VE命令は、コアによって実行される、実行は、start−VE命令によって指定された位置から第1の状態記述を得ることを含む。第1の状態記述は、ゲスト状態を有する。実行はまた、ゲスト状態に基づいて、ゲスト・エンティティが単一のゲスト・スレッドまたは複数のゲスト・スレッドのいずれを含むのかを決定することを含む。ゲスト状態と、ゲスト・エンティティが複数のゲスト・スレッドを含むことを決定することとに基づいて、実行はまた、MTモードでコア上でゲスト・スレッドを開始することを含み、ゲスト・スレッドは、互いに独立して実行される。ゲスト状態と、ゲスト・エンティティが単一のゲスト・スレッドを含むことを決定することとに基づいて、実行は、STモードでコア上でゲスト・スレッドを開始することを含む。
さらなる態様は、構成内の複数のスレッドをディスパッチするためのコンピュータ・プログラム製品を含む。構成は、シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを含む。コアは、物理スレッドを含む。コンピュータ・プログラム製品は、それにより具現化されたプログラム命令を有するコンピュータ可読記憶媒体を含み、コンピュータ可読記憶媒体は、信号ではなく、プログラム命令は、処理回路に方法を実行させるために、処理回路によって可読である。方法は、コア上でSTモードで実行するホスト・プログラムによって、コア上のゲスト・エンティティをディスパッチするための仮想実行開始(start−VE)命令を発行することを含む。ゲスト・エンティティは、ゲストVMのすべてまたは一部を含み、start−VE命令は、コアによって実行される、実行は、start−VE命令によって指定された位置から第1の状態記述を得ることを含む。第1の状態記述は、ゲスト状態を有する。実行はまた、ゲスト状態に基づいて、ゲスト・エンティティが単一のゲスト・スレッドまたは複数のゲスト・スレッドのいずれを含むのかを決定することを含む。ゲスト状態と、ゲスト・エンティティが複数のゲスト・スレッドを含むことを決定することとに基づいて、実行は、MTモードでコア上でゲスト・スレッドを開始することを含み、ゲスト・スレッドは、互いに独立して実行される。ゲスト状態と、ゲスト・エンティティが単一のゲスト・スレッドを含むことを決定することとに基づいて、実行は、STモードでコア上でゲスト・スレッドを開始することを含む。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、コアが、コアがMTモードにあるとき、物理スレッド間で共有されるリソースの使用を制御するコンピュータ命令を含む場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、ホスト・プログラムが、コアがMTモードにあるとき、単一の論理コアとしてゲスト・エンティティの少なくとも一部を管理する場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、スレッド有効性マスクが、ゲスト・エンティティ内の1つまたは複数のゲスト・スレッドの有効性を示すためにホスト・プログラムによって利用される場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、ホスト・プログラムに制御を返す前に、ゲスト・エンティティ内の1つまたは複数のゲスト・スレッドのすべてをエグジットすることを含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、複数のゲスト・スレッドを含むゲスト・エンティティに基づいて、すべてのゲスト・スレッドに共通の状態データの少なくとも一部が単一の場所に記憶される場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、複数のゲスト・スレッドを含むゲスト・エンティティに基づいて、1つのスレッドのための状態データが第1の状態記述に含まれ、1つまたは複数の追加のスレッドの各々のための状態データが追加の状態記述に含まれる場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、第1の状態記述および追加の状態記述が、リングおよびリスト構造のうちの少なくとも1つに記憶される場合を含むことができる。
上記で説明した1つまたは複数の特徴に加えて、または代替として、さらなる実施形態は、別のゲスト・スレッドからの要求に基づいてゲスト・スレッドをエグジットすることを含む非アクション・エグジットを実行することを含むことができる。
本明細書で使用される用語は、特定の実施形態のみを説明する目的のためであり、本発明を限定することを意図するものではない。本明細書で使用される場合、単数形「a」、「an」、および「the」は、文脈が明確にそうでないことを示さない限り、同様に複数形を含むことを意図している。「備える」という用語または「備えている」という用語、あるいはその両方は、本明細書で使用されるとき、述べられた特徴、整数、ステップ、動作、要素、または構成要素、あるいはそれらの組合せの存在を指定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、またはそれらのグループ、あるいはそれらの組合せの存在または追加を排除しない。
以下の特許請求の範囲内のすべてのミーンズまたはステップ・プラス・ファンクション要素の対応する構造、材料、作用、および均等物は、特に特許請求された他の特許請求された要素との組合せで機能を実行するための任意の構造、材料、または作用を含むことを意図している。本発明の説明は、例示および説明の目的のために提示されているが、網羅的であること、または開示された形態の本発明に限定することを意図するものではない。多くの変更および変形は、本発明の範囲および要旨から逸脱することなく、当業者には明らかとなるであろう。実施形態は、本発明の原理および実用的な応用を最良に説明するため、ならびに、考えられる特定の用途に適しているような様々な変更を加えた様々な実施形態について、当業者が本発明を理解することを可能にするために、選択され、説明された。
本発明の様々な実施形態の説明は、例示の目的のために提示されているが、網羅的であること、または開示された実施形態に限定されることを意図するものではない。多くの変更および変形は、説明した実施形態の範囲および要旨から逸脱することなく、当業者には明らかとなるであろう。本明細書で使用される用語は、実施形態の原理、実用的な応用、もしくは市場で見られる技術を上回る技術的改善を最良に説明するため、または、本明細書に開示された実施形態を当業者が理解することを可能にするために選択された。
ここで図14を参照すると、一例では、コンピュータ・プログラム製品1400は、たとえば、本明細書に記載の実施形態の1つまたは複数の態様を提供し、容易にするために、その上にコンピュータ可読プログラム・コード手段またはロジック1404を記憶するために、1つまたは複数の記憶媒体1402を含み、媒体は、有形または非一時的、あるいはその両方であってもよい。
本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはそれらの組合せであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読記憶媒体(または媒体)を含んでもよい。
コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持し、記憶することができる有形デバイスであり得る。コンピュータ可読記憶媒体は、たとえば、限定はしないが、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、または上記のものの任意の適切な組合せであってもよい。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストは、以下の、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、消去可能プログラマブル読出し専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読出し専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリースティック(R)、フロッピー(R)ディスク、パンチ・カードまたはその上に記録された命令を有する溝内の隆起構造などの機械的にエンコードされたデバイス、および上記のものの任意の適切な組合せを含む。本明細書で使用するコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波路もしくは他の伝送媒体を通って伝播する電磁波(たとえば、光ファイバ・ケーブルを通過する光パルス)、またはワイヤを通って送信される電気信号などの、一時的な信号自体として解釈されるべきではない。
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から個々のコンピューティング/処理デバイスに、または、ネットワーク、たとえば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、あるいはそれらの組合せを介して、外部コンピュータもしくは外部記憶デバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはそれらの組合せを備えてもよい。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、個々のコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に記憶するためのコンピュータ可読プログラム命令を転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語と、「C」プログラミング言語もしくは同様のプログラミング言語などの従来の手続き型言語とを含む、1つもしくは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、スタンドアロン・ソフトウェア・パッケージとしてユーザのコンピュータ上で部分的に、ユーザのコンピュータ上で部分的におよびリモート・コンピュータ上で部分的に、またはリモート・コンピュータもしくはサーバ上で完全に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または、接続は、(たとえば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して形成されてもよい。いくつかの実施形態では、たとえば、プログラマブル論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル論理アレイ(PLA)を含む電子回路は、本発明の態様を実行するために、電子回路をパーソナライズするようにコンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行してもよい。
本発明の態様は、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図、あるいはその両方を参照して本明細書で説明される。フローチャート図またはブロック図、あるいはその両方の各ブロック、および、フローチャート図またはブロック図、あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実装され得ることが理解されるであろう。
これらのコンピュータ可読プログラム命令は、コンピュータのプロセッサまたは他のプログラマブル・データ処理装置を介して実行される命令が、フローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックで指定される機能/作用を実装するための手段を作成するように、汎用コンピュータ、専用コンピュータ、または他のプログラマブル・データ処理装置のプロセッサに提供されて、マシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令はまた、命令が記憶されたコンピュータ可読記憶媒体がフローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックで指定される機能/作用の態様を実装する命令を含む製造品を備えるように、コンピュータ可読記憶媒体に記憶され、コンピュータ、プログラマブル・データ処理装置、または他のデバイス、あるいはそれらの組合せに特定の方法で機能するよう指示することができるものであってもよい。
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブル装置、または他のデバイス上で実行される命令がフローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックで指定される機能/作用を実装するように、コンピュータ実装プロセスを生成するべく、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイス上にロードされ、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。
図中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施態様のアーキテクチャ、機能、および動作を例示する。この点で、フローチャートまたはブロック図中の各ブロックは、指定された論理機能を実装するための1つまたは複数の実行可能命令を備える、モジュール、セグメント、または命令の一部を表すことができる。いくつかの代替実施態様では、ブロックに記された機能は、図中に記された順序を外れて生じてもよい。たとえば、連続して示された2つのブロックは、実際には、実質的に同時に実行されてもよく、または、ブロックは、時には、関連する機能に応じて、逆の順序で実行されてもよい。また、ブロック図またはフローチャート図、あるいは両方の各ブロック、および、ブロック図またはフローチャート図、あるいは両方におけるブロックの組合せは、指定された機能もしくは作用を実行する、または専用ハードウェアおよびコンピュータ命令の組合せを実行させる専用ハードウェア・ベースのシステムによって実装され得ることに留意されたい。

Claims (11)

  1. シングルスレッド(ST)モードおよびマルチスレッディング(MT)モードで動作することが可能なコアを備える構成内で複数のスレッドをディスパッチするためのコンピュータ実装方法であって、前記コアが、複数の物理スレッドを含み、前記方法が、
    前記コア上で前記STモードで実行するホスト・プログラムによって、前記コア上で、ゲスト仮想マシン(VM)のすべてまたは一部を含むゲスト・エンティティをディスパッチするための仮想実行開始(start−VE)命令を発行することを備え、前記start−VE命令が、前記コアによって実行され、前記実行が、
    前記start−VE命令によって指定された位置から、ゲスト状態を有する第1の状態記述を得ることと、
    前記ゲスト状態に基づいて、前記ゲスト・エンティティが単一のゲスト・スレッドまたは複数のゲスト・スレッドのいずれを含むのかを決定することと、
    前記ゲスト状態と、前記ゲスト・エンティティが複数のゲスト・スレッドを含むと決定することとに基づいて、前記MTモードで前記コア上で、互いに独立して実行される前記ゲスト・スレッドを開始することと、及び
    前記ゲスト状態と、前記ゲスト・エンティティが単一のゲスト・スレッドを含むと決定することとに基づいて、前記STモードで前記コア上で前記ゲスト・スレッドを開始することと
    を含む、方法。
  2. 前記コアが、前記コアが前記MTモードにある場合に、前記複数の物理スレッド間で共有されるリソースの使用を制御するためのコンピュータ命令を含む、請求項1に記載の方法。
  3. 前記ホスト・プログラムが、前記コアが前記MTモードにある場合に、単一の論理コアとして前記ゲスト・エンティティを管理するためのものである、請求項1に記載の方法。
  4. スレッド有効性マスクが、前記ゲスト・エンティティ内の前記1以上のゲスト・スレッドの有効性を示すために前記ホスト・プログラムによって利用される、請求項1に記載の方法。
  5. 前記ホスト・プログラムに制御を返す前に、前記ゲスト・エンティティ内の前記1以上のゲスト・スレッドのすべてをエグジットすることをさらに含む、請求項1に記載の方法。
  6. 複数のゲスト・スレッドを含む前記ゲスト・エンティティに基づいて、1つのスレッドのための状態データが第1の状態記述に含まれ、1以上の追加のスレッドの各々のための状態データが追加の状態記述に含まれる、請求項1に記載の方法。
  7. 複数のゲスト・スレッドを含む前記ゲスト・エンティティに基づいて、すべての前記ゲスト・スレッドに共通の状態データの少なくとも一部が単一の場所に記憶される、請求項1に記載の方法。
  8. 前記第1の状態記述および前記追加の状態記述が、リングおよびリスト構造のうちの少なくとも1つに記憶される、請求項6に記載の方法。
  9. 非アクション・エグジットを実行することをさらに備え、前記非アクション・エグジットが、別のゲスト・スレッドからの要求に基づいてゲスト・スレッドをエグジットすることを含む、請求項1に記載の方法。
  10. 請求項1ないし9のいずれかに記載の方法のすべてのステップを実行するように適合された手段を備えるシステム。
  11. コンピュータ・プログラムがコンピュータ・システム上で実行されたとき、請求項1ないし9のいずれかに記載の方法のすべてのステップを実行するための命令を備えるコンピュータ・プログラム。
JP2016558045A 2014-03-27 2015-03-06 コンピュータにおいて複数のスレッドをディスパッチするための方法、システム、およびコンピュータ・プログラム Active JP6556748B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/227,003 2014-03-27
US14/227,003 US9223574B2 (en) 2014-03-27 2014-03-27 Start virtual execution instruction for dispatching multiple threads in a computer
PCT/EP2015/054731 WO2015144421A1 (en) 2014-03-27 2015-03-06 Start virtual execution instruction for dispatching multiple threads in a computer

Publications (2)

Publication Number Publication Date
JP2017515203A JP2017515203A (ja) 2017-06-08
JP6556748B2 true JP6556748B2 (ja) 2019-08-07

Family

ID=52633273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016558045A Active JP6556748B2 (ja) 2014-03-27 2015-03-06 コンピュータにおいて複数のスレッドをディスパッチするための方法、システム、およびコンピュータ・プログラム

Country Status (14)

Country Link
US (1) US9223574B2 (ja)
EP (1) EP3123325A1 (ja)
JP (1) JP6556748B2 (ja)
KR (1) KR101807450B1 (ja)
CN (1) CN106104465B (ja)
AU (1) AU2015238706B2 (ja)
BR (1) BR112016022436B1 (ja)
CA (1) CA2940891C (ja)
IL (1) IL247858B (ja)
MX (1) MX2016012532A (ja)
RU (1) RU2667791C2 (ja)
SG (1) SG11201606092XA (ja)
TW (1) TWI614680B (ja)
WO (1) WO2015144421A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8789034B1 (en) * 2011-12-31 2014-07-22 Parallels IP Holdings GmbH Method for updating operating system without memory reset
US9191435B2 (en) 2012-08-23 2015-11-17 TidalScale, Inc. Selective data migration or remapping of virtual processors to provide required data accessibility to processor cores
US9213569B2 (en) * 2014-03-27 2015-12-15 International Business Machines Corporation Exiting multiple threads in a computer
US9898348B2 (en) * 2014-10-22 2018-02-20 International Business Machines Corporation Resource mapping in multi-threaded central processor units
CN105871917A (zh) * 2016-06-08 2016-08-17 北京金山安全管理系统技术有限公司 传输控制协议tcp连接调度的方法及装置
US10353736B2 (en) * 2016-08-29 2019-07-16 TidalScale, Inc. Associating working sets and threads
US11023135B2 (en) 2017-06-27 2021-06-01 TidalScale, Inc. Handling frequently accessed pages
US10817347B2 (en) 2017-08-31 2020-10-27 TidalScale, Inc. Entanglement of pages and guest threads
CN109032792A (zh) * 2018-07-10 2018-12-18 矩阵元技术(深圳)有限公司 外包计算方法及系统
CN110032407B (zh) * 2019-03-08 2020-12-22 创新先进技术有限公司 提升cpu并行性能的方法及装置和电子设备
US11029991B2 (en) 2019-03-08 2021-06-08 International Business Machines Corporation Dispatch of a secure virtual machine
CN111552574A (zh) * 2019-09-25 2020-08-18 华为技术有限公司 一种多线程同步方法及电子设备
US11676013B2 (en) * 2019-12-30 2023-06-13 International Business Machines Corporation Job-launch time reduction by node pre-configuration
US12020059B2 (en) 2021-08-30 2024-06-25 International Business Machines Corporation Inaccessible prefix pages during virtual machine execution

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4456954A (en) * 1981-06-15 1984-06-26 International Business Machines Corporation Virtual machine system with guest architecture emulation using hardware TLB's for plural level address translations
WO1985000453A1 (en) 1983-07-11 1985-01-31 Prime Computer, Inc. Data processing system
US4779188A (en) 1983-12-14 1988-10-18 International Business Machines Corporation Selective guest system purge control
CA1213986A (en) 1983-12-14 1986-11-12 Thomas O. Curlee, Iii Selective guest system purge control
US4792895A (en) 1984-07-30 1988-12-20 International Business Machines Corp. Instruction processing in higher level virtual machines by a real machine
JPH0658650B2 (ja) 1986-03-14 1994-08-03 株式会社日立製作所 仮想計算機システム
US5317754A (en) 1990-10-23 1994-05-31 International Business Machines Corporation Method and apparatus for enabling an interpretive execution subset
US5437033A (en) * 1990-11-16 1995-07-25 Hitachi, Ltd. System for recovery from a virtual machine monitor failure with a continuous guest dispatched to a nonguest mode
AU3424293A (en) 1992-01-02 1993-07-28 Amdahl Corporation Computer system with two levels of guests
US5485626A (en) 1992-11-03 1996-01-16 International Business Machines Corporation Architectural enhancements for parallel computer systems utilizing encapsulation of queuing allowing small grain processing
US6453392B1 (en) 1998-11-10 2002-09-17 International Business Machines Corporation Method of and apparatus for sharing dedicated devices between virtual machine guests
US6349365B1 (en) 1999-10-08 2002-02-19 Advanced Micro Devices, Inc. User-prioritized cache replacement
US6854114B1 (en) 1999-10-21 2005-02-08 Oracle International Corp. Using a virtual machine instance as the basic unit of user execution in a server environment
US6357016B1 (en) * 1999-12-09 2002-03-12 Intel Corporation Method and apparatus for disabling a clock signal within a multithreaded processor
JP2004506262A (ja) 2000-08-04 2004-02-26 イントリンジック グラフィックス, インコーポレイテッド グラフィックハードウェアおよびソフトウェアの開発
EP1182567B1 (en) 2000-08-21 2012-03-07 Texas Instruments France Software controlled cache configuration
US6971084B2 (en) 2001-03-02 2005-11-29 National Instruments Corporation System and method for synchronizing execution of a batch of threads
US20040128448A1 (en) 2002-12-31 2004-07-01 Intel Corporation Apparatus for memory communication during runahead execution
US7155600B2 (en) 2003-04-24 2006-12-26 International Business Machines Corporation Method and logical apparatus for switching between single-threaded and multi-threaded execution states in a simultaneous multi-threaded (SMT) processor
US7530067B2 (en) 2003-05-12 2009-05-05 International Business Machines Corporation Filtering processor requests based on identifiers
US7130949B2 (en) * 2003-05-12 2006-10-31 International Business Machines Corporation Managing input/output interruptions in non-dedicated interruption hardware environments
US7610473B2 (en) 2003-08-28 2009-10-27 Mips Technologies, Inc. Apparatus, method, and instruction for initiation of concurrent instruction streams in a multithreading microprocessor
US7849297B2 (en) 2003-08-28 2010-12-07 Mips Technologies, Inc. Software emulation of directed exceptions in a multithreading processor
US7493621B2 (en) 2003-12-18 2009-02-17 International Business Machines Corporation Context switch data prefetching in multithreaded computer
US7526515B2 (en) * 2004-01-21 2009-04-28 International Business Machines Corporation Method and system for a grid-enabled virtual machine with movable objects
US7526421B2 (en) 2004-02-27 2009-04-28 International Business Machines Corporation System and method for modeling LPAR behaviors in a simulation tool
US9189230B2 (en) * 2004-03-31 2015-11-17 Intel Corporation Method and system to provide concurrent user-level, non-privileged shared resource thread creation and execution
US8271976B2 (en) 2004-06-30 2012-09-18 Microsoft Corporation Systems and methods for initializing multiple virtual processors within a single virtual machine
US7873776B2 (en) 2004-06-30 2011-01-18 Oracle America, Inc. Multiple-core processor with support for multiple virtual processors
US8356143B1 (en) 2004-10-22 2013-01-15 NVIDIA Corporatin Prefetch mechanism for bus master memory access
US20060242389A1 (en) 2005-04-21 2006-10-26 International Business Machines Corporation Job level control of simultaneous multi-threading functionality in a processor
US9785485B2 (en) * 2005-07-27 2017-10-10 Intel Corporation Virtualization event processing in a layered virtualization architecture
US7814486B2 (en) * 2006-06-20 2010-10-12 Google Inc. Multi-thread runtime system
US8607228B2 (en) * 2006-08-08 2013-12-10 Intel Corporation Virtualizing performance counters
US7698540B2 (en) 2006-10-31 2010-04-13 Hewlett-Packard Development Company, L.P. Dynamic hardware multithreading and partitioned hardware multithreading
US8621459B2 (en) * 2006-12-22 2013-12-31 Intel Corporation Method and apparatus for multithreaded guest operating system execution through a multithreaded host virtual machine monitor
US8286170B2 (en) 2007-01-31 2012-10-09 International Business Machines Corporation System and method for processor thread allocation using delay-costs
US7685409B2 (en) * 2007-02-21 2010-03-23 Qualcomm Incorporated On-demand multi-thread multimedia processor
JP5595633B2 (ja) 2007-02-26 2014-09-24 スパンション エルエルシー シミュレーション方法及びシミュレーション装置
EP2159687B1 (en) * 2007-06-20 2012-12-05 Fujitsu Limited Arithmetic unit
US9164784B2 (en) 2007-10-12 2015-10-20 International Business Machines Corporation Signalizing an external event using a dedicated virtual central processing unit
US7739434B2 (en) 2008-01-11 2010-06-15 International Business Machines Corporation Performing a configuration virtual topology change and instruction therefore
WO2009101563A1 (en) 2008-02-11 2009-08-20 Nxp B.V. Multiprocessing implementing a plurality of virtual processors
US8086811B2 (en) 2008-02-25 2011-12-27 International Business Machines Corporation Optimizations of a perform frame management function issued by pageable guests
US8676976B2 (en) * 2009-02-25 2014-03-18 International Business Machines Corporation Microprocessor with software control over allocation of shared resources among multiple virtual servers
US9250973B2 (en) 2009-03-12 2016-02-02 Polycore Software, Inc. Apparatus and associated methodology of generating a multi-core communications topology
US9535767B2 (en) * 2009-03-26 2017-01-03 Microsoft Technology Licensing, Llc Instantiating a virtual machine with a virtual non-uniform memory architecture
FR2950714B1 (fr) 2009-09-25 2011-11-18 Bull Sas Systeme et procede de gestion de l'execution entrelacee de fils d'instructions
US8650554B2 (en) 2010-04-27 2014-02-11 International Business Machines Corporation Single thread performance in an in-order multi-threaded processor
US8595469B2 (en) * 2010-06-24 2013-11-26 International Business Machines Corporation Diagnose instruction for serializing processing
US8589922B2 (en) 2010-10-08 2013-11-19 International Business Machines Corporation Performance monitor design for counting events generated by thread groups
CN102193779A (zh) 2011-05-16 2011-09-21 武汉科技大学 一种面向MPSoC的多线程调度方法
US8856452B2 (en) 2011-05-31 2014-10-07 Illinois Institute Of Technology Timing-aware data prefetching for microprocessors
US8990830B2 (en) 2011-07-19 2015-03-24 International Business Machines Corporation Thread management in parallel processes
US8752036B2 (en) 2011-10-31 2014-06-10 Oracle International Corporation Throughput-aware software pipelining for highly multi-threaded systems
US8850450B2 (en) 2012-01-18 2014-09-30 International Business Machines Corporation Warning track interruption facility
US9110878B2 (en) 2012-01-18 2015-08-18 International Business Machines Corporation Use of a warning track interruption facility by a program
US8930950B2 (en) 2012-01-19 2015-01-06 International Business Machines Corporation Management of migrating threads within a computing environment to transform multiple threading mode processors to single thread mode processors
US9032191B2 (en) 2012-01-23 2015-05-12 International Business Machines Corporation Virtualization support for branch prediction logic enable / disable at hypervisor and guest operating system levels
CN102866957B (zh) 2012-07-31 2014-07-30 中国人民解放军国防科学技术大学 面向多核多线程微处理器的虚拟活跃页缓冲方法及装置
JP6074955B2 (ja) 2012-08-31 2017-02-08 富士通株式会社 情報処理装置および制御方法
US10002031B2 (en) 2013-05-08 2018-06-19 Nvidia Corporation Low overhead thread synchronization using hardware-accelerated bounded circular queues
US9195493B2 (en) * 2014-03-27 2015-11-24 International Business Machines Corporation Dispatching multiple threads in a computer
US9772867B2 (en) * 2014-03-27 2017-09-26 International Business Machines Corporation Control area for managing multiple threads in a computer
US9213569B2 (en) * 2014-03-27 2015-12-15 International Business Machines Corporation Exiting multiple threads in a computer
US9804846B2 (en) * 2014-03-27 2017-10-31 International Business Machines Corporation Thread context preservation in a multithreading computer system
US9921848B2 (en) * 2014-03-27 2018-03-20 International Business Machines Corporation Address expansion and contraction in a multithreading computer system
US9218185B2 (en) * 2014-03-27 2015-12-22 International Business Machines Corporation Multithreading capability information retrieval
US9594660B2 (en) * 2014-03-27 2017-03-14 International Business Machines Corporation Multithreading computer system and program product for executing a query instruction for idle time accumulation among cores

Also Published As

Publication number Publication date
CA2940891A1 (en) 2015-10-01
RU2016127443A (ru) 2018-04-28
CN106104465B (zh) 2019-03-01
MX2016012532A (es) 2016-12-20
WO2015144421A1 (en) 2015-10-01
AU2015238706B2 (en) 2018-05-10
US20150277908A1 (en) 2015-10-01
TWI614680B (zh) 2018-02-11
EP3123325A1 (en) 2017-02-01
TW201610838A (zh) 2016-03-16
BR112016022436A2 (ja) 2017-08-15
US9223574B2 (en) 2015-12-29
CN106104465A (zh) 2016-11-09
AU2015238706A1 (en) 2016-08-04
KR20160104060A (ko) 2016-09-02
RU2667791C2 (ru) 2018-09-24
JP2017515203A (ja) 2017-06-08
SG11201606092XA (en) 2016-08-30
CA2940891C (en) 2023-09-26
KR101807450B1 (ko) 2018-01-18
IL247858B (en) 2019-03-31
RU2016127443A3 (ja) 2018-04-28
BR112016022436B1 (pt) 2023-10-03

Similar Documents

Publication Publication Date Title
JP6556748B2 (ja) コンピュータにおいて複数のスレッドをディスパッチするための方法、システム、およびコンピュータ・プログラム
JP6509248B2 (ja) コンピュータ内の複数のスレッドを管理する制御エリアを提供するためのシステム、方法、およびコンピュータ・プログラム製品
JP6501791B2 (ja) マルチスレッド・ゲスト仮想マシン(vm)をディスパッチするためのシステム、方法およびコンピュータ・プログラム製品
JP6556747B2 (ja) コンピュータ内の複数のスレッドをエグジットするための方法、システム、およびコンピュータ・プログラム
US9389897B1 (en) Exiting multiple threads of a simulation environment in a computer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190710

R150 Certificate of patent or registration of utility model

Ref document number: 6556748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150