JP6359069B2

JP6359069B2 - オペレーティングシステムと切り離される異種計算

Info

Publication number: JP6359069B2
Application number: JP2016204255A
Authority: JP
Inventors: アーシェイム，ジェレッド
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2011-06-08
Filing date: 2016-10-18
Publication date: 2018-07-18
Anticipated expiration: 2032-06-07
Also published as: TW201250599A; KR20140033393A; JP6029660B2; JP2017033592A; TWI536269B; AR086607A1; US8793686B2; EP2718813A4; US20140325511A1; WO2012170746A2; JP2014516192A; US20120317568A1; EP2718813A2; CN103597449B; CN103597449A; KR101907564B1; EP2718813B1; WO2012170746A3

Description

本発明は、オペレーティングシステムと切り離される異種計算に関する。

エネルギー効率は、携帯電話からデータセンタにいたるまで、ますます重要な差別化要因になっている。消費者は、より長く続くモバイルデバイス経験に高い値段を払おうとするだけでなく、これらの同じデバイスからより向上した性能が得られることを望む。他方において、データセンタは、計算力をスケールアップし続けるが、効率的に冷却することが可能な温度制限に直面する。加えて、公衆は、エネルギー利用およびエネルギー使用の環境への影響についてますます意識を高めている。エネルギーの使用を効率的にすることは、したがって、多くのタイプのコンピューティングシステムにおいてより優先度の高い設計目標である。

これらの技術的に相反する課題、すなわち、より良い性能を供給するが、より少ない電力しか使用しないことは、単一のシステムまたはシリコンチップ内において「大きな」計算コアを「小さな」計算コアに密接に結合する、という異種設計を産業的に試すことになった。これは、本明細書において、異種のコアまたは処理と呼ばれる。大きなコアは、より大きな電力エンベロープで高い性能を提供するように設計され、一方、小さなコアは、より小さな電力エンベロープで低い性能を提供するように設計される。従来の考え方としては、オペレーティングシステムのスケジューラが、次いで、作業量に応じて、スレッドを大きなコアまたは小さなコアに対して選択的にスケジュールすることとなる。１日の少なくとも一部の時間帯の間、オペレーティングシステムは、大きなコアを全体的にターンオフし、小さなコアを少しずつ消費する電源に頼ることが可能である。

大きなコアおよび小さなコアは、同じ命令セットまたは特徴を共有しても、共有しなくてもよい。例えば、小さなコアは、減少した命令セットまたは他の差異を含み、この他の差異は、オペレーティングシステムにより、互換性のあるコアに対する処理をスケジュールさせる、さらなる決定を行うことを含む。従来の例の１つは、中央処理ユニット（ＣＰＵ）およびグラフィックス処理ユニット（ＧＰＵ）を含み、ＧＰＵを、アイドル状態または十分に活用されていないときにタスクを計算するのに使用できるシステムである。

既存および現在の解決策は、オペレーティングシステムに、大きなコアおよび小さなコアの存在を「知らせる」ためにオペレーティングシステムのカーネルを修正することと、その個々のコアの性能および電力特性と、オペレーティングシステムが、どのコアに対して特定のスレッドをスケジュールするかを決定するためにモニタリングするシステム内の装置設備（例えば、ＣＰＵ性能カウンタ、キャッシュのミス／ヒットカウンタ、バスアクティビティカウンタなど）による。このアプローチは、いくつかの欠点を有する。すなわち、１）このアプローチは、サポートされるオペレーティングシステム全てについてカーネルを修正する必要があり、２）修正されたカーネルが、潜在的に異なるアーキテクチャ（例えば、Ｎ個の異なる実装をサポートすること）にわたって大きな／小さな設計における相違を理解することが必要であり、３）オペレーティングシステムカーネルのリリーススケジュールと、基礎となるコンピュータアーキテクチャを密に結合する。コンピュータアーキテクチャに対する変更は次いで、カーネルが新しいコアを商業的にサポートするまで、次にスケジュールされたオペレーティングシステムのリリース（すなわち、潜在的には数年またはそれ以上）を待つ必要がある（また、その逆もそうである）。

本明細書において、オペレーティングシステムの認識または関与を必要とせずに、エネルギー効率を向上させ、または他の処理目標に合致するため、オペレーティングシステムスレッドのスケジューリングを大きなコアおよび小さなコアにわたって自立的に制御するハイパーバイザーを提供する、異種処理システムを説明する。本システムは、仮想化された計算コアの有限のセットをオペレーティングシステムに提示し、本システムは、そのオペレーティングシステムに対して実行用のスレッドをスケジュールする。続いて、水面下で、ハイパーバイザーは、各スレッドを実行すべきコア、すなわち大きいコアまたは小さいコア、の物理的な割り当ておよび選択を賢く制御して、エネルギー使用または他の処理要件を管理する。ソフトウェアハイパーバイザーを使用して基礎となる大きなおよび小さなコンピュータアーキテクチャを抽象化することによって、コア間の性能および電力動作の相違は、オペレーティングシステムに対して不透明なままになる。また、固有の間接性は、新たな機能（能力）（capability）を有するハードウェアのリリースを、オペレーティングシステムのリリーススケジュールと切り離す。

この発明の概要は、以下の発明の詳細な説明においてさらに説明される概念の選択を、簡略化した形で紹介するために提供される。この発明の概要は、特許請求される主題の主要な特徴または本質的特徴を特定するようには意図されておらず、特許請求される主題の範囲を限定するのに用いられるようにも意図されていない。

一実施形態における異種処理システムのコンポーネントを示すブロック図である。一実施形態において、異種処理コアを有するコンピューティングデバイスを、異種処理コアとオペレーティングシステムとの間のハイパーバイザーを用いて初期化する、異種処理システムの処理を示すフロー図である。一実施形態において、異種処理コアを管理するハイパーバイザーを通じて１つまたは複数のオペレーティングシステムスレッドをスケジューリングする、異種処理システムの処理を示すフロー図である。一実施形態における異種処理システムの動作環境を示すブロック図である。

本明細書において、オペレーティングシステムの認識または関与を必要とせずに、エネルギー効率を向上させ、または他の処理目標に合致するため、オペレーティングシステムスレッドのスケジューリングを大きなコアおよび小さなコアにわたって自立的に制御するハイパーバイザーを提供する、異種処理システムを説明する。本システムは、仮想化された計算コアの有限のセットをオペレーティングシステムに提示し、本システムは、そのオペレーティングシステムに対して実行用のスレッドをスケジューリングする。続いて、水面下で、ハイパーバイザーは、各スレッドを実行すべきコア、すなわち大きいコアまたは小さいコア、の物理的な割り当ておよび選択を賢く制御して、エネルギー使用または他の処理要件を管理する。ソフトウェアハイパーバイザーを使用して基礎となる大きなおよび小さなコンピュータアーキテクチャを抽象化することによって、コア間の性能および電力動作の相違は、オペレーティングシステムに対して不透明なままとなる。また、固有の間接性は、新たな機能を有するハードウェアのリリースを、オペレーティングシステムのリリーススケジュールと切り離す。ハードウェアのベンダは、更新されたハイパーバイザーをリリースし、新たなハードウェアが、そのベンダにより選ばれた任意のオペレーティングシステムのバージョンで機能できるようにすることができる。

ハイパーバイザーの実装は、基礎となるコンピュータアーキテクチャと密に結合され、利用可能なシステムフィードバック（例えば、ＣＰＵ利用、バス／キャッシュアクティビティなど）を使用して、適切なコアを要求される作業量に自立的に割り当てる。このアプローチは、基礎となるコンピュータアーキテクチャが、ソフトウェアハイパーバイザーとの連携でしばしば変化し、この発展を、上記オペレーティングシステムから切り離すことを可能にする。異種処理システムは、オペレーティングシステムカーネル自体を変更することなく、簡単で粗粒な電力管理を提供する。したがって、異種処理システムは、より高速なハードウェア革新を可能にし、既存のデータセンタおよび他のインストールが今日、利用可能な異種処理ハードウェアからの利益を享受することを可能にする。

異種計算は、システムにおいて利用可能な異なるタイプの計算コア（例えば、ＣＰＵ，ＧＰＵ、アクセラレータなど）に基づいて作業量の実行を最適化する、という目標を有する産業の新興分野である。最適化は、性能、電力、待ち時間、または他の目標について可能である。異種処理システムは、これらのより一般的な場合に適用可能である一方で、一意の機能的等価性を有するが、異なる性能／電力動作特性を有するコアを用いるシステムも対象とすることができる。典型的に、これらのシステムは、１つまたは複数の大きなコアと、１つまたは複数の小さなコアを有する。大きなコアは典型的に、深いパイプライン、順序不順の実行ファイル、大きなキャッシュ、高いクロックスピードを有し、そして高い漏出処理量（例えば、４０Ｇ）を使用して操作される。小さなコアは典型的に、短いパイプライン、小さなキャッシュ、低クロックスピード、様々な電力レベルを有し、そして低い漏出処理量（例えば、４０ＬＰ）を使用して操作される。

一部の実施形態において、大きなコアおよび小さなコアは、アーキテクチャの等価物、マイクロアーキテクチャの等価物、グローバルインタラプトコントローラ、コヒーレンシー、および仮想化などを有する。アーキテクチャの等価物には、同じインストラクションセットアーキテクチャ（ＩＳＡ：Instruction Set Architecture）、単一命令複数データ（ＳＩＭＤ：Single Instruction Multiple Data）、浮動小数点（ＦＰ：Floating Point）、コプロセッサの利用可能性、およびＩＳＡ拡張などが含まれ得る。マイクロアーキテクチャの等価物は、性能における相違は有するが、同じ構成可能な特徴（例えば、キャッシュライン長）を含む。グローバルインタラプトコントローラは、全てのコアに対する中断を管理し、処理し、転送する能力を提供する。コヒーレンシーは、全てのコアが、必要に応じて転送して、他のコアからのデータにアクセス（キャッシュ）することができることを意味する。仮想化は、コアからの／コアへの作業量を切り替える／移行するためのものである。

一部の実施形態において、異種処理システムは、コア間のわずかな相違に対応することができる。例えば、ストリーミングＳＩＭＤ拡張命令（ＳＳＥ）（現在、４つの反復、ＳＳＥ１、ＳＳＥ２、ＳＳＥ３、ＳＳＥ４が存在する）をサポートしない小さなコアは、他のインテルのｘ８６ベースのソフトウェアコードを扱うことができる。ハイパーバイザーは、命令ストリーム内のサポートされていない命令を検出し、そのようなストリームを割り当てる適切なコアを起動することができる。他の命令ストリームは、任意のコアにおいて正確に動作する。少数のサポートされていない命令のみが使用される場合など、一部の場合において、ハイパーバイザーは、なんらかのレベルのエミュレーションを含み、利用可能な命令セットにおいてサポートされていない命令をエミュレートする。例えば、ベクトル計算などの操作はしばしば分解されて、標準の計算命令を用いる低効率で実装される。

ソフトウェアハイパーバイザーは、デバイスのブートプロセスの間にオペレーティングシステム（ＯＳ）の初期化に先行して、ソフトウェアハイパーバイザー自身をインストールする。指定されたハードウェア構成が完了した後（すなわち、メモリを構成し、仮想化装置設備を初期化するなど）、ハイパーバイザーは、次いでコンピューティングデバイス内にインストールされた大きな処理コアおよび小さな処理コアを、ポリシーにより構成することができる。例えば、デバイスがモバイルデバイスである場合、ポリシーは、ハイパーバイザーがオペレーティングシステムを、バッテリの需要のために利用可能かつ最適な最小限の性能で開始するように指示することができ、ハイパーバイザーは続いて、オペレーティングシステムスレッドを１つまたは複数の小さなコアに対してスケジュールする。あるいは、デバイスが、データセンタブレードである場合、ポリシーは、ハイパーバイザーがオペレーティングシステムを利用可能な最大限の性能で開始して、エネルギー効率を犠牲にするように指示することができ、ハイパーバイザーは続いて、オペレーティングシステムスレッドを利用可能な大きなコアに対してスケジュールし、さらに場合によっては、利用可能な熱量に応じて小さなコアに対してもスケジュールすることもできる。初期化が完了した後、ソフトウェアハイパーバイザーは、オペレーティングシステムブートマネージャをロードし、このオペレーティングシステムブートマネージャが次いでオペレーティングシステムをロードする。

ランタイムの間、異種処理システムは、仮想化されたコアのセットをオペレーティングシステムに提示する。コア間の動作特性および相違は、オペレーティングシステムに対して不透明であり、ソフトウェアハイパーバイザーにより、定義された動作ポリシーに基づいて非公開で管理される。動作ポリシーは、システムの初期化中に設定されるか、またはランタイム中に動的に設定され得る。

ハイパーバイザーは、動作ポリシーを、利用可能なシステム装置設備（例えば、ＣＰＵ性能カウンタ、キャッシュのミス／ヒットカウンタ、バスアクティビティカウンタなど）とともに使用し、どのコアをオペレーティングシステムスレッドにスケジュールすべきかを決定する。ハイパーバイザーは、この情報を使用して、ＣＰＵコアの利用、経時的な傾向、情報の局所性、および入出力（Ｉ／Ｏ）パターンを理解することができる。この情報から、ハイパーバイザーは、動的かつ投機的に、オペレーティングシステムスレッドを大きなコアおよび小さなコアにわたって適切に移行することができる。加えて、ハイパーバイザーは、ダイナミック周波数・電圧スケーリング（ＤＦＶＳ：dynamic frequency and voltage scaling）を、オペレーティングシステムの代わりにシステム実装に応じて制御することもできる。

ここに、ハイパーバイザーが制御することができる利用可能な動作ポリシーのサンプルを示す。最小電力（ＭｉＰｏ：Minimum Power）、最大性能（ＭａＰｅ：Maximum Performance）、最小電力・オンデマンド性能（ＭｉＰｏＤ：Minimal Power, Performance on Demand）、最大性能・アイドル状態電力低下（ＭａＰｅｌ：Maximum Performance, Power Down on Idle）。これらはそれぞれ、以下の段落において説明する。しかしながら、任意の特定の実装によって選択されるように、付加的な、より進化した動作ポリシーを実装することができる。

最大電力（ＭｉＰｏ）は、スレッドをコアの最小のセットに対してスケジュールする。これは、典型的に、ハイパーバイザーが、スレッドを小さいコアに対してスケジュールし、必要に応じてＤＶＦＳを使用して、コア用の電力および性能動作ポイントを制御することができることを意味する。必要に応じて、追加の小さなコアに電力を供給して、スケジュールすることもできる。

最大性能（ＭａＰｅ）は、スレッドをコアの最大のセットに対してスケジュールする。これは、典型的に、ハイパーバイザーが、スレッドを全ての利用可能なコア（大きなコアから開始する）に対してスケジュールして、必要に応じてＤＶＦＳを使用し、コア用の電力および性能動作ポイントを制御することを意味する。利用可能な熱量によって許容される程度に、小さなコアにも電力を供給してスケジュールする。

最小電力・オンデマンド性能（ＭｉＰｏＤ）は、通常、利用可能な最小の電力状態（例えば、１つまたは複数の小さなコアにおいて）で動作するが、処理負荷の要求により性能を高める。これは一般に、動作の「ターボ」または「ブースト」モードと呼ばれ、大きなコアを動的に割り当ててスケジュールすることにより可能になる。作業量が完了すると、システムは最小の電力状態（例えば、１つの小さなコア）に戻る。

最大性能・アイドル状態電力低下（ＭａＰｅｌ）は、通常、最大の利用可能な性能状態（例えば、１つまたは複数の大きなコア）で動作するが、アイドル閾値に達すると、低下した電力状態に従う。アイドル閾値はこの場合、典型的なほぼゼロのＣＰＵ利用ではないが、アイドル閾値は、何らかのドライストンＭＩＰＳ（ＤＭＩＰＳ）、またはポリシーによって定義されるＣＰＵ利用率において任意に定義することができる。アイドル状態になると、ハイパーバイザーは動的に、小さなコアを割り当ててスケジュールし、未使用の大きなコアをスタンバイ／保留状態に置く。ポリシーおよび／または将来の処理量は、システムが最大の利用可能な性能状態（例えば、大きなコア）に戻るときを決定する。

図１は、一実施形態における異種処理システムのコンポーネントを示すブロック図である。システム１００は、１つまたは複数の中央処理ユニット１１０、オペレーティングシステムインタフェースコンポーネント１２０、仮想コア管理コンポーネント１３０、ポリシーエンジンコンポーネント１４０、ポリシーデータストア１５０、スケジューリングコンポーネント１６０、機能管理コンポーネント１７０、およびハードウェアインタフェースコンポーネント１８０を含む。これらのコンポーネントの各々を、ここでさらに詳細に説明する。以下のコンポーネントを、コンピューティングデバイスのオペレーティングシステムとハードウェアリソースとの間に存在するソフトウェアハイパーバイザー内で実装することができる。

１つまたは複数の中央処理ユニット１１０は、異種処理機能および電力プロファイルを有する１つまたは複数の処理コアを含む。典型的に、各ＣＰＵ複合体は、単一のシリコン型上に配置され、ＣＰＵ複合体の各コアは、シリコン型を共有する。ハードウェアを、様々なタイプのデバイス用の様々なパッケージで実装することができる。例えば、新しいモバイルデバイスおよびつい最近のデスクトッププロセッサは、相互間の効率的な通信と、より低い電力利用のために、同じチップ上にＣＰＵとＧＰＵを含む。各ＣＰＵ複合体は１つまたは複数の大きなコアおよび小さなコアを含むことができる。あるいはまた、あるＣＰＵ複合体が大きなコア全てを含み、別のＣＰＵ複合体が小さなコアを全て含むこともある。ここで使用されるようなＣＰＵ複合体は、ＧＰＵ、およびソフトウェア命令を実行することができる他のハードウェアに当てはまる。

オペレーティングシステムインタフェースコンポーネント１２０は、ハイパーバイザーとオペレーティングシステムとの間を通信し、ハードウェアリソースに配信してハードウェアリソースからの出力を受け取るための命令を受信する。オペレーティングシステムは、スレッドをスケジュールし、命令ストリーム（例えば、プログラムカウンタ（ＰＣ：program counter））へのポインタを提供し、命令をハードウェアに渡すメモリ領域への書き込みを行うことができる。オペレーティングシステムは典型的に、コンピューティングデバイス上のハードウェアと直接対話する。しかしながら、ハイパーバイザーは、様々な目的で、オペレーティングシステムとハードウェアとの間に間接的なレイヤを挿入する。しばしば、ハイパーバイザーを使用して仮想化を提供し、その結果、複数のオペレーティングシステムを同時に同じハードウェア上で実行することができる。ハイパーバイザーを使用して、コンピューティングシステムにインストールされた実際のハードウェアとは異なる仮想ハードウェアを、オペレーティングシステムに提示することもできる。異種処理システム１００の場合、これは、大きなコアと小さなコアがオペレーティングシステムに対して同じに見えるようにすることを含み得る。システム１００は、デバイスに実際に存在するものとは異なる数のコアを、オペレーティングに提示することもできる。

仮想コア管理コンポーネント１３０は、ハイパーバイザーがオペレーティングシステムに提示する１つまたは複数の仮想コアを管理する。仮想コアは、オペレーティングシステムに対してＣＰＵコアのように見えるが、コンピューティングデバイスにおいて利用可能な物理的なハードウェアの特性とは異なるものとすることができる。例えば、仮想コアは、処理における相違または電力機能をオペレーティングシステムから隠すことができ、その結果、異種の大きなおよび小さなコアとともに機能するように設計されていないオペレーティングシステムが、そのように設計されたオペレーティングシステム用のやり方で動作することができる。このような場合、ハイパーバイザーは、異種計算環境を用いるのに必要な特別なプログラミングを提供することができ、したがってオペレーティングシステムを修正する必要がない。

ポリシーエンジンコンポーネント１４０は、オペレーティングシステムスレッドをスケジューリングし、利用可能な１つまたは複数の中央処理ユニットに基づいて仮想コアをオペレーティングシステムに提示するための、１つまたは複数のポリシーを管理する。ポリシーエンジンコンポーネント１４０は、特定のハイパーバイザーの実装に特有のハードコードされたポリシーを含むことができ、あるいは、特定のインストール目標に適合するように修正することができる管理者構成可能なポリシーを含むことができる。ポリシーは、どのコアを最初にスケジュールするか、電力利用と処理目標のトレードオフ、電力を抑えるためにコアをどのようにシャットオフおよび起動するか、仮想コアをどのようにオペレーティングシステムに提示するかなど、を決定することができる。

ポリシーデータストア１５０は、１つまたは複数のポリシーを、ブート時および実行時にハイパーバイザーに対してアクセス可能な記憶装置に格納する。ポリシーデータストア１５０は、１つまたは複数のファイル、ファイルシステム、ハードドライブ、データベース、またはシステム１００の実行セッションにわたってデータを保持するための他の記憶装置を含む。一部の実施形態において、管理者は、システム１００に、ハイパーバイザーによる使用のためのポリシーの初期のセットを格納する構成段階を行わせる、セットアップステップを実行する。

スケジューリングコンポーネント１６０は、オペレーティングシステムからスレッドとして受信される１つまたは複数の命令ストリームを、コンピューティングシステムにインストールされた中央処理ユニットの１つまたは複数に対してスケジュールする。スケジューリングコンポーネントは、仮想コア識別をオペレーティングシステムから受信する。仮想コア識別は、オペレーティングシステムがスレッドをスケジュールするよう要求する仮想コアを識別する。スケジューリングコンポーネント１６０は、スケジュール要求を検査し、実行すべきスレッドをスケジュールする物理的なコアを決定する。例えば、コンポーネント１６０は、電力または処理がスレッドにより関連するかどうかを決定し、それに応じて適切な小さいコアまたは大きなコアをスケジュールすることができる。一部の場合において、コンポーネント１６０は、スレッドをある特定のコアに対してスケジューリングすることを回避し、これらのコアがパワーダウンして電力を抑えることができるようにする。

機能管理コンポーネント１７０は、任意選択で、大きな処理コアと小さな処理コアとの間の１つまたは複数の相違を管理する。一部の場合において、システム１００は、大きなコアと小さなコアが同じ機能を共有し、かつ機能管理コンポーネント１７０が必要はされない、処理ユニット上においてのみ動作することがある。別の場合において、システム１００は、利用可能な処理コアの間の軽微な相違または主要な相違を扱う。例えば、システム１００は、一部のコアによってサポートされない命令を観察し、対応するスレッドを、これらの命令をサポートするコアにおいてスケジュールすることができる。より高度な実装において、コンポーネント１７０は、電力目標または他のプロファイル目標を満たすように、大きなコアの機能を小さなコアにおいて（あるはその反対）仮想化またはエミュレートすることができる。

ハードウェアインタフェースコンポーネント１８０は、ハイパーバイザーと中央処理ユニットとの間を通信し、利用可能な物理的コア上で実行するソフトウェア命令をスケジュールすることができる。ハードウェアインタフェースコンポーネント１８０は、実際のメモリアドレス、あるいは実際のハードウェアにアクセスするための他の装置を含む。これらの他の装置は、他のコンポーネントから、特にハイパーバイザーによって管理されるゲストオペレーティングシステムから隠される。

異種処理システムが実装されるコンピューティングデバイスは、中央処理ユニット、メモリ、入力デバイス（例えば、キーボードおよびポインティングデバイス）、出力デバイス（例えば、ディスプレイデバイス）、ならびに記憶デバイス（例えば、ディスクドライブ、または他の非揮発性記憶媒体）を含むことができる。メモリおよび記憶デバイスは、システムを実装または可能にするコンピュータ実行可能命令（例えば、ソフトウェア）によりエンコードされる、コンピュータ読取可能記憶媒体である。さらに、データ構造およびメッセージ構造を、通信リンク上の信号などのデータ伝送媒体を介して格納または伝送することができる。様々な通信リンク、例えばインターネット、ローカルエリアネットワーク、広域ネットワーク、ポイントツーポイントダイアルアップ接続、携帯電話ネットワークなどを使用することができる。

本システムの諸実施形態を様々なオペレーティング環境において実装することができる。このようなオペレーティング環境には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドもしくはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラム可能な家庭用電化製品、デジタルカメラ、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ、ならびに、上記システムまたはデバイス、セットトップボックス、およびシステムオンチップ（ＳＯＣ）のいずれかを含む分散コンピューティング環境などが含まれる。コンピュータシステムは、携帯電話、ＰＤＡ、スマートフォン、パーソナルコンピュータ、プログラム可能な家庭用電化製品、デジタルカメラなどとすることができる。

本システムを、１つまたは複数のコンピュータまたは他のデバイスによって実行されるプログラムモジュールなど、コンピュータ実行可能命令の一般的なコンテキストにおいて説明することができる。一般に、プログラムモジュールは、特定のタスクを実行し、特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。典型的に、プログラムモジュールの機能を、様々な実施形態の所望に応じて結合し、または分散することができる。

図２は、一実施形態において、異種処理コアを有するコンピューティングデバイスを、その異種処理コアとオペレーティングシステムとの間のハイパーバイザーを用いて初期化する、異種処理システムの処理を示すフロー図である。

ブロック２１０において開始し、システムは、起動要求を受信してコンピューティングデバイスを初期化する。例えば、基本入出力システム（ＢＩＯＳ）、拡張可能ファームウェアインタフェース（ＥＦＩ）、ブートローダ、または他の初期化デバイスソフトウェアは、異種コンピューティングシステムを実装するハイパーバイザーをロードして起動することができる。一部の場合において、管理者が、ハイパーバイザーをコンピューティングデバイスにインストールするインストール段階を以前に実行したことがある場合も、システムは、ネットワークブート、および、コンピューティングデバイスに共通して供給される他の非インストールのシナリオをサポートすることもできる。

ブロック２２０に続くと、システムは、コンピューティングデバイスの２つまたはそれ以上の物理的な処理コアを列挙する。一部の実施形態において、少なくとも２つのコアが、異なる性能および電力利用特性を提供する。しかしながら、非対称性が存在しないシステムを使用することもできる。例えば、電力管理にソフトウェアハイパーバイザーを使用することは、オンダイのＮ個の物理的なＣＰＵを有するが、Ｋ個のみを、気温、フォームファクタのエンクロージャ、利用可能な電力のコストなどの外部性に基づいて操作することができる、というシナリオにおいても適用可能である。ブートにおいて、ハイパーバイザーは、この「ポリシー」情報を使用して、Ｋ個のコアの仮想化されたセットをオペレーティングシステムに報告することができ、これは、各ブートサイクルにおいて異なる可能性がある。ハイパーバイザーは、このシナリオにおいて対称的なコアに対して同じタスクを実行しているであろう。システムは、ＢＩＯＳまたは他の基礎となるレイヤを起動して、どれくらいの、およびどの種類のプロセッサをコンピューティングデバイスがインストールしたかを決定し、そして、ＣＰＵＩＤまたは他の同様の命令を実行して、プロセッサの処理機能に関する情報を決定することができる。一部の実施形態において、システムは拡張性インタフェースを含むことができ、この拡張性インタフェースを通じて、ドライバまたは他のハイパーバイザー拡張を実装して、ハイパーバイザー製造者または第三者によって追加することができ、必ずしもハイパーバイザー自体を更新する必要なく、新たな処理ハードウェアのサポートをハイパーバイザーに追加することができる。

ブロック２３０に続くと、システムは、それぞれの列挙された処理コアの機能を決定する。この機能は、各コアによって提供される１つまたは複数の電力プロファイル、各コアによってサポートされる１つまたは複数の命令セット、各コアの性能特性などを含むことができる。システムは、コア自体の情報のインタフェース（以前に言及されたＣＰＵＩＤ命令など）、あるいはドライバまたは他の拡張によりハイパーバイザーに提供された情報を用いて、各コアの機能を決定することができる。システムは、決定された機能を使用して、コアと互換性のあるスレッドを各コアに割り当てて、受信したポリシーおよび処理目標と整合する方法でスケジューリングを実行する。

ブロック２４０に続くと、システムは、ハイパーバイザーが、列挙された物理的コアに関するアクセスおよびスケジューリングを管理することとなる、１つまたは複数のオペレーティングシステムを識別する。システムは、ハードドライブ、フラッシュドライブ、またはコンピューティングデバイスの他の記憶装置にアクセスして、ハイパーバイザーが初期化された後にどのオペレーティングシステムを起動すべきかを決定することができる。ハイパーバイザーは、様々なオペレーティングシステムに関する情報を用いて指定することができ、そして拡張性を含むことができるので、ハイパーバイザー自体を更新することなく、新たなオペレーティングシステムをサポートすることができる。各オペレーティングシステム、およびオペレーティングシステムバージョンは、異なるスケジューリングセマンティクスを有し、あるいはオペレーティングシステムが仮想化された処理リソース上で正しく実行できるようにハイパーバイザーが対処する他のニュアンスを有することがある。一部に場合において、ハイパーバイザーは、複数のオペレーティングシステムが、列挙された物理的な処理コアを共有できるようにするのに必要とされ、ポリシーは、そのような共有をどのように扱うかを指示することができる。

ブロック２５０に続くと、システムは、ハイパーバイザーポリシー情報にアクセスする。ハイパーバイザーポリシー情報は、列挙された物理的な処理コアにおいてオペレーティングシステムスレッドをスケジュールするめの１つまたは複数の目標を指定する。この目標には、性能目標、電力利用目標、またはどのコア（１つまたは複数）がオペレーティングシステムスレッドを実行すべきかを決定するための他の方針を含むことができる。ポリシーを、コンピューティングデバイスに関連付けられた記憶デバイスに格納するか、またはハイパーバイザーの実装にハードコードすることができる。ハイパーバイザーは、ポリシーに対する更新を、管理者によって提供される管理インタフェースを通じて受信することができる。

ブロック２６０に続くと、システムは、１つまたは複数の仮想コアを生成して、識別されたオペレーティングシステムに公開する。ここで、各仮想コアは、物理的な処理コア間における決定された機能の相違から、オペレーティングシステムを分離する。例えば、異種処理システムは、２つまたはそれ以上の大きなコアおよび小さなコアを、単一のタイプの統一仮想コアとしてオペレーティングシステムに提示することができる。仮想コアにおいてスレッドを実行するスケジューリング要求をオペレーティングシステムから受信すると、システムは、どの物理的コアをジョブ用に選択すべきかを、アクセスしたハイパーバイザーポリシーに基づいて決定する。ハイパーバイザーポリシーは、例えば、低電力供給コアを用いることが支持され、少なくとも１つの高電力供給コアをシームレスに電力低下させることを可能にすることを目標とするときなどに、ハイパーバイザーが物理的コアではなく異なる数の仮想コアを提示すべきことを指定する。あるいは、システムは、オペレーティングシステムが、そのコアを使用することを選択した場合、または低電力コアだけでは満たすことのできないコア品質を使用することを選択した場合、オペレーティングシステムが認識したコアの電力を低下させるが、これらのコアを起動させておく。

ブロック２７０に続くと、システムは、識別されたオペレーティングシステムを起動し、識別されたオペレーティングシステムを、列挙された物理的な処理コアから分離したまま、作成された仮想コアをオペレーティングシステムに提示する。オペレーティングシステムを起動することは、オペレーティングシステムローダを起動することと、ハイパーバイザーを通常のＢＩＯＳの代わりに、またはオペレーティングシステムを基礎とする他のレイヤの代わりに提示することとを含むことができる。オペレーティングシステムは、物理的なハードウェア上で直接稼動しているように動作するが、ハイパーバイザーは、オペレーティングシステムと、本明細書で説明されるオペレーティングシステムの知識を必要とせずにスケジューリングロジックを実行する、物理的なハードウェアとの間に存在する。ブロック２７０の後、これらのステップは終了する。

図３は、一実施形態において、１つまたは複数のオペレーティングシステムスレッドを、異種処理コアを管理するハイパーバイザーを通じてスケジュールする、異種処理システムの処理を示すフロー図である。

ブロック３１０において始まり、システムは、オペレーティングシステムからスレッドスケジューリング要求を受信して、ハイパーバイザーによって提示される、識別された仮想コアにおいてスレッドの命令を実行する。仮想コアは、コンピューティングデバイスに対してアクセス可能な２つまたはそれ以上の物理的な処理コアの間の１つまたは複数の機能上の相違から、オペレーティングシステムを分離する。オペレーティングシステムは、典型的に、各検出された処理コアに対するアイドルループを有し、オペレーティングシステムは、当該オペレーティングシステムがそのコアにおいて実行することを望む任意の命令をスケジュールし、配置することができる。オペレーティングシステムは、複数のアプリケーションスレッドを時間分割して、特定の処理コアにおいて実行することができる。オペレーティングシステムがスレッドの実行用に選択する特定の仮想コアに関わらず、ハイパーバイザーは、任意の特定の物理的な処理コアを選択して、１つまたは複数のハイパーバイザーポリシーに従ってスレッドを実行することができる。

ブロック３２０に続くと、システムは、受信したスケジューリング要求の処理ニーズを決定する。例えば、システムは、スケジュールされたスレッドによって使用される特定の命令セット（例えば、１つまたは複数の命令セットの拡張、コプロセッサ、または他の機能が要求されているかどうか）、スレッドの性能要求、追加の処理リソースが利用可能になるまでスレッドが遅滞し得るかどうかなどを決定することができる。システムは、特定のオペレーティングシステムに関する特有の知識、またはポリシーを通じて受信した命令を使用して、特定のスレッドの処理ニーズを決定することができる。例えば、システムは、オペレーティングシステムの内部動作に関するスレッド、アプリケーションスレッドなどを識別し、それぞれをポリシーに従って対処することができる。

ブロック３３０に続くと、システムは、デバイスを操作するための１つまたは複数の目標を指定するスケジューリングポリシーにアクセスする。例えば、ポリシーは、電力利用、性能、またはこれら２つの組み合わせの最適化を要求することがある。ポリシーは、デバイスに関連付けられたデータストアに格納されるか、ハイパーバイザーの特定の実装にハードコードされる。例えば、システムは、高性能のタスクを実行するスレッドがオペレーティングシステムによってスケジュールされるまで、小さな処理コアを支持する電力使用バージョンのハイパーバイザーを提示することできる。この時点で、システムは、高性能のタスクを大きなコアにおいてスケジュールし、次いで、タスクが完了した後は大きなコアをスリープに導くことができる。

ブロック３４０に続くと、システムは、受信したスケジューリング要求に関連付けられたスレッドを実行すべき物理的な処理コアを選択する。この選択は、アクセスされたスケジューリングポリシーに基づいて行うことができる。システムは、異なる機能、性能／電力特性の複数の利用可能なコアを有し、システムは、これらのコアに対してスレッドをスケジュールすることができる。システムのコアの選択に基づいて、コンピューティングデバイスは、より多くのまたはより少ない電力を使用して、より長いまたはより少ない時間でスレッドの実行を完了することとなる。ジョブまたはスケジューリングポリシーは、システムが、コンピューティングデバイスの性能、電力、または他の特性を管理するための１つまたは複数の目標を促進する手法で選択を行うのを可能にする。モバイルデバイスはより少ない電力使用を好むが、高性能なサーバは高性能を好む。一部の場合において、ポリシーは、時刻（例えば、電子的コストのピークと非ピーク）または他の考慮事項に基づいて異なるものとすることができ、その結果、ポリシーは、経時的に、または特定の条件に基づいて変化する。

ブロック３５０に続くと、システムは、任意選択で、スレッドと、選択された物理的処理コアとの間の全ての機能的相違に対処する。例えば、スレッドが、選択されたコアにおいて利用可能でない命令を含む場合、システムは、その命令をエミュレートし、またはその命令を、選択されたコアによってサポートされる１つまたは複数の等価な命令で置換することができる。機能的相違を管理することは、顕著な複雑性をシステムに与え、ハイパーバイザー実装者は、任意の特定の実装が、処理コア間の機能においてどのくらい多くまたは（必要に応じて）少ない相違をサポートするかを選択することができる。

ブロック３６０に続くと、システムは、選択された物理的な処理コアにおいて実行するスレッドをスケジュールすることができる。システムは、出力がオペレーティングシステムによりスレッドを割り当てられた仮想コアから来たように見えるように、出力を処理して、この出力をオペレーティングシステムに返す。したがって、オペレーティングシステムは、ハイパーバイザーによって管理されるコアのタイプおよび数を知らないままであり、オペレーティングシステムが通常通り、ハイパーバイザーおよび異種処理コアを用いないシステムに存在しているように、仮想コアのセットを使用することができる。ブロック３６０の後、これらのステップは終了する。

図４は、一実施形態における異種処理システムの動作環境を示すブロック図である。ゲストオペレーティングシステム４１０は、本明細書において説明される異種処理システムを実装するソフトウェアハイパーバイザー４３０によって提示される、１つまたは複数の仮想処理コア４２０を見る。ソフトウェアハイパーバイザー４３０は異種処理ハードウェア４４０を管理する。異種処理ハードウェア４４０は、グローバルインタラプトコントローラ４５０と、１つまたは複数の大きなコア４６０と、１つまたは複数の小さなコア４７０とを含む。例示の容易性のために、２つのコアタイプのみを示しているが（大きいものと、小さいもの）、システムは、任意の数の異なるコアで動作することができることに留意されたい。例えば、一部のプロセッサパッケージは、段々と電力利用および性能が減少する、いくつかの処理ストアを含むことができる。ソフトウェアハイパーバイザー４３０は、異種処理ハードウェア４４０を管理して、ゲストオペレーティングシステム４１０を、ハードウェア４４０を効果的に使用するのに必要ないずれの特別な知識または処理から分離することができる。したがって、ソフトウェアハイパーバイザー４３０は、ゲストオペレーティングシステム４１０などの未修正のレガシーオペレーティングシステムが、新たな異種処理ハードウェア４４０を利用できるようにする。オペレーティングシステム４１０が（より良い電力／性能特性は有するが）通常通りに動作し続けている間に、ハードウェア４４０の変更について行くようにハイパーバイザー４３０を修正することができる。

一部の実施形態において、異種処理システムは、スレッドが既に実行された後に、当該スレッドを、ある物理的処理コアから別のコアへ移行する。一部の場合において、ハイパーバイザーが、電力消費を低減する、性能を向上させる、あるいは他のポリシー目標を実行する、と決定すると、１つまたは複数のスレッドが既に実行中であることがある。コアがキャッシュストレージまたは他の装置設備を共有しているので、ハイパーバイザーは、スレッドのデータへのアクセスに影響を与えることなく、スレッドを別のコアに移行することができる。したがって、ハイパーバイザーは、スレッドの実行をインタラプトして、スレッドの命令ストリームを異なる物理的処理コアに移して、ターゲットコアにおいて実行を再開することができる。

一部の実施形態において、異種処理システムは、プロセッサ電圧および周波数修正を用いて、異なるコアを選択する前に、電力を低減させるか性能を閾値まで向上させる。例えば、システムは、大きなコアにおいて特定のスレッドの実行を開始し、次いで、大きなコアの電力使用を、当該コアの動作電圧を低減することによって元のスケールに戻し、最終的に、大きなコアの作業を小さなコアに移行することができる。これは、システムが電力使用を徐々に減らし、熱エンベロープを管理するか、またはポリシーによって指定された他の計算目標を満足することを可能にする。

一部の実施形態において、異種処理システムは、一部の処理タスクをクラウドコンピューティング装置設備に移行することを可能にする。システムは、クラウドコンピューティング装置設備を、単なる別の処理コアとして、スケジュールすべきタスクに提示する。適切なタスクのために、システムは、タスクをコンピューティングデバイスから全体的にオフロードし、後で、タスクの出力をゲストオペレーティングシステムに返すことができる。これは、システムが、コンピューティングデバイスにおいて低電力状態に入り、あるいは作業を、電力コストがピークのデータセンタから、電力コストのより低いデータセンタへ遷移するのを可能にする。

一部の実施形態において、異種処理システムは、競合状態に対処し、ソフトウェアロックパラダイムを用いてオペレーティングシステムの期待値を管理する。多くの場合において、オペレーティングシステムは、特定のスレッド間の相互依存性または依存性の欠如に基づいてスレッドをスケジュールする。ソフトウェアは、ロック、ミューテックス、セマフォ、または、スレッドを複数同時に実行する環境でソフトウェアコードが正しく動作できるようにオペレーティングシステムによって提供される、他の同期化プリミティブを用いることができる。異種コンピューティングシステムは、オペレーティングシステムのスレッドの安全性および他の同期化に関する保証事項が確実に満たされるようにし、また新たな競合条件または他の問題が導入されないことを保証するように追加のロックを導入するか、スレッドのスケジューリングを決定することができる。

一部の実施形態において、異種処理システムは、ハードウェアハイパーバイザーを含む。本明細書の諸実施例では、ソフトウェアハイパーバイザーを使用したが、コンピューティングタスクを実装するためのハードウェアまたはソフトウェアの選択はしばしば、性能または他の目標に合致するように切り替えることが可能な実装の詳細であることが当業者には認識されよう。したがって、本システムを、ハードウェアハイパーバイザーを用いて実装することができ、一部の処理ユニットは、処理ユニット自体に本システムを含むように生成されることもある。

以上のことから、本明細書では、例示の目的で、異種処理システムの特定の実施形態を説明してきたが、本発明の精神および範囲から逸脱することなく、様々な修正を行うことが可能であることが理解されよう。したがって、本発明は、添付の特許請求の範囲以外によって限定されることはない。

Claims

ハイパーバイザーを通じて異種計算を切り離したオペレーティングシステムを提供するためにコンピュータで実施される方法であって：
コンピューティングデバイスに対してアクセス可能な２つ以上の物理的な処理コアの機能を決定するステップと；
前記物理的な処理コアにおいてオペレーティングシステムスレッドをスケジュールするための１つ以上の目標を指定するスケジューリングポリシーにアクセスするステップであって、前記目標のうちの少なくとも１つが電力利用に基づくステップと；
１つ以上の仮想コアを生成してオペレーティングシステムに対して公開するステップであって、各仮想コアは、前記物理的な処理コアの間の前記機能の相違から前記オペレーティングシステムを分離する、ステップと；
前記オペレーティングシステムを前記物理的な処理コアから分離している間に、前記オペレーティングシステムを起動して、前記１つ以上の仮想コアを前記オペレーティングシステムに提示するステップと；
前記スケジューリングポリシーに基づいて、それぞれのオペレーティングシステムスレッドについて、スレッドを実行すべき物理的な処理コアを選択するステップと；
前記選択された物理的な処理コアにおいて実行すべき前記スレッドをスケジュールするステップと；
を具備する、方法。
前記ハイパーバイザーをアクティブ化するステップであって、前記ハイパーバイザーは、前記オペレーティングシステムと前記物理的な処理コアとの間をインタフェースする、ステップと；
前記ハイパーバイザーがアクセスを管理することになる少なくとも１つのオペレーティングシステムを識別し、前記物理的な処理コアをスケジュールするステップと；
を更に具備する、請求項１に記載の方法。
前記１つ以上の目標は、性能目標及び／又は電力利用目標のうちの１つ以上を含む、
請求項１に記載の方法。
前記スケジューリングポリシーは、最小電力、最大性能、最小電力・オンデマンド性能及び／又は最大性能・アイドル状態電力低下のうちの１つ以上を含む、
請求項１に記載の方法。
前記物理的な処理コアを選択するステップに先行して、識別された仮想コアにおいてスレッドを実行するためのスレッドスケジュール要求を、前記オペレーティングシステムから受け取るステップ；
を更に具備する、請求項１に記載の方法。
前記物理的な処理コアの選択は、利用可能なシステム装置設備に更に基づく、
請求項１に記載の方法。
コンピューティングデバイスにおいて、
少なくとも１つのプロセッサと、メモリとを具備し、
前記少なくとも１つのプロセッサは：
当該コンピューティングデバイスに対してアクセス可能な２つ以上の物理的な処理コアの機能を決定する動作と；
前記物理的な処理コアにおいてオペレーティングシステムスレッドをスケジュールするための１つ以上の目標を指定するスケジューリングポリシーにアクセスする動作であって、前記目標のうちの少なくとも１つが電力利用に基づく動作と；
１つ以上の仮想コアを生成して、オペレーティングシステムに対して公開する動作であって、各仮想コアが、前記物理的な処理コアの間の前記機能の相違から前記オペレーティングシステムを分離する、動作と；
前記オペレーティングシステムを前記物理的な処理コアから分離している間に、前記オペレーティングシステムを起動して、前記１つ以上の仮想コアを前記オペレーティングシステムに提示する動作と；
前記スケジューリングポリシーに基づいて、それぞれのオペレーティングシステムスレッドについて、スレッドを実行すべき物理的な処理コアを選択する動作と；
前記選択された物理的な処理コアにおいて実行すべき前記スレッドをスケジュールする動作と；
を実行するよう構成される、コンピューティングデバイス。
異種計算を切り離したオペレーティングシステムを提供するためのコンピュータシステムであって：
２つ以上の物理的な処理コアと；
メモリと；
を備え、前記メモリは、
オペレーティングシステムスレッドをスケジュールするための１つ以上の目標を指定するスケジューリングポリシーであって、少なくとも１つの目標が電力利用に基づく、スケジューリングポリシーと、
オペレーティングシステムと前記２つ以上の物理的な処理コアとの間をインタフェースするハイパーバイザーと、
を含み、前記ハイパーバイザーは、
前記２つ以上の物理的な処理コアの機能を決定する動作と；
１つ以上の仮想コアを生成してオペレーティングシステムに対して公開する動作であって、各仮想コアが、前記物理的な処理コアの間の前記機能の相違から前記オペレーティングシステムを分離する、動作と；
前記オペレーティングシステムを前記物理的な処理コアから分離している間に、前記オペレーティングシステムを起動して、前記１つ以上の仮想コアを前記オペレーティングシステムに提示する動作と；
前記スケジューリングポリシーに基づいて、それぞれのオペレーティングシステムスレッドについて、スレッドを実行すべき物理的な処理コアを選択する動作と；
前記選択された物理的な処理コアにおいて実行すべき前記スレッドをスケジュールする動作と；
を実行する、コンピュータシステム。
当該コンピュータシステムは更に、
前記物理的な処理コアを選択することに先行して、識別された仮想コアにおいてスレッドを実行するためのスレッドスケジュール要求を、前記オペレーティングシステムから受け取る；
ように構成される、請求項８に記載のコンピュータシステム。