JP2023144060A

JP2023144060A - レンダリング前にインターリーブスクリーン領域に対して事前テストを行うことによってジオメトリの効率的なマルチｇｐｕレンダリングを行うシステム及び方法

Info

Publication number: JP2023144060A
Application number: JP2023132609A
Authority: JP
Inventors: イー．サーニーマーク; E Cerny Mark; ストラウスフロリアン; Strauss Florian; バーグオフトビアス; Berghoff Tobias
Original assignee: Sony Interactive Entertainment LLC
Current assignee: Sony Interactive Entertainment LLC
Priority date: 2020-02-03
Filing date: 2023-08-16
Publication date: 2023-10-06
Also published as: CN115298686B; JP2023505607A; CN115298686A; EP4100922A1; WO2021158483A8; JP7334358B2; WO2021158483A1

Abstract

【課題】グラフィックス処理を行うための方法を提供する。【解決手段】複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングする。グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを、インターリーブされた複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。ＧＰＵには、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリ事前テストのために割り当てられる。ＧＰＵにおいてジオメトリ事前テストを行い、ジオメトリのピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成する。画像フレームをレンダリングするときに複数のＧＰＵのそれぞれにおいて情報を用いる。【選択図】図６Ｂ

Description

本開示は、グラフィックス処理に関し、より具体的には、アプリケーションに対する画像をレンダリングするときのマルチＧＰＵ連携に関する。

近年、クラウドゲーミングサーバと、ネットワークを通して接続されたクライアントとの間で、ストリーミングフォーマットでオンラインまたはクラウドゲーミングを行うことを可能にするオンラインサービスに対する継続的な取り組みがある。ストリーミングフォーマットはますます人気が出ている。なぜならば、オンデマンドでゲームタイトルが利用できること、より複雑なゲームが実行できること、マルチプレイヤーゲーミングの場合にプレーヤ間でネットワーク接続できること、プレーヤ間で資産を共有できること、プレーヤ及び／または観戦者の間で瞬時の経験を共有できること、友人がビデオゲームをプレイする様子を友人が観戦できること、友人の進行中のゲームプレイに友人が参加できることなどがあるからである。

クラウドゲーミングサーバは、１つ以上のクライアント及び／またはアプリケーションにリソースを提供するように構成される場合がある。すなわち、クラウドゲーミングサーバは、高スループットが可能なリソースとともに構成される場合がある。たとえば、個々のグラフィックス処理ユニット（ＧＰＵ）が達成できる性能には限界がある。さらに複雑なシーンをレンダリングするために、またはシーンを生成するときにさらに複雑なアルゴリズム（たとえば、材料、照明など）を用いるために、複数のＧＰＵを用いて単一画像をレンダリングすることが望ましい場合がある。しかし、これらのグラフィックス処理ユニットを均等に用いることは、実現が難しい。さらに、従来の技術を用いてアプリケーションに対する画像を処理するために複数のＧＰＵがある場合でも、スクリーンピクセル数及びジオメトリ密度の両方での対応する増加をサポートすることはできない（４個のＧＰＵにより、画像に対して４倍のピクセルを書き込むこと及び／または４倍の頂点またはプリミティブを処理することは不可能である）。

本開示の実施形態は、このような背景の下になされたものである。

本開示の実施形態は、複数のＧＰＵを連携して用いて単一画像をレンダリングすること、たとえば、レンダリング前にスクリーン領域（インターリーブされ得る）に対する事前テストを行うことによってアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことに関する。

本開示の実施形態では、グラフィックス処理を行うための方法を開示する。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。スクリーン領域はインターリーブされる。本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、ＧＰＵに、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリテストのために割り当てることを含む。本方法は、ＧＰＵにおいてジオメトリテストを行って、ジオメトリのピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、複数のＧＰＵのそれぞれにおいて情報を用いてジオメトリのピースをレンダリングすることを含み、情報を用いることは、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップすることを含むことができる。

別の実施形態では、方法を行うための非一時的コンピュータ可読媒体を開示する。コンピュータ可読媒体は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割するためのプログラム命令であって、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有し、複数のスクリーン領域におけるスクリーン領域はインターリーブされている、プログラム命令を含む。コンピュータ可読媒体は、ＧＰＵに、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリ事前テストのために割り当てるためのプログラム命令を含む。コンピュータ可読媒体は、ＧＰＵにおいてジオメトリ事前テストを行って、ジオメトリのピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成するためのプログラム命令を含む。コンピュータ可読媒体は、画像フレームをレンダリングするときに複数のＧＰＵのそれぞれにおいて情報を用いるためのプログラム命令を含む。

さらなる他の実施形態では、コンピュータシステムが開示される。コンピュータシステムは、プロセッサと、プロセッサに結合され、命令が記憶されたメモリであって、命令は、コンピュータシステムによって実行されると、コンピュータシステムに、グラフィックス処理を行うための方法を実行させる、メモリと、を含む。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有し、複数のスクリーン領域におけるスクリーン領域はインターリーブされる。本方法は、ＧＰＵに、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリ事前テストのために割り当てることを含む。本方法は、ＧＰＵにおいてジオメトリ事前テストを行って、ジオメトリのピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、画像フレームをレンダリングするときに複数のＧＰＵのそれぞれにおいて情報を用いることを含む。

本開示の実施形態では、グラフィックス処理を行うための方法を開示する。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する、分割することを含む。本方法は、アプリケーションによって生成された画像フレームのジオメトリの複数のピースに対するＧＰＵ事前テストにおいてジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングすることであって、情報を用いることは、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップすることを含む、レンダリングすることを含む。

別の実施形態では、方法を行うための非一時的コンピュータ可読媒体を開示する。コンピュータ可読媒体は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割するためのプログラム命令であって、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する、プログラム命令を含む。コンピュータ可読媒体は、アプリケーションによって生成された画像フレームのジオメトリの複数のピースに対するＧＰＵ事前テストにおいてジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成するためのプログラム命令を含む。コンピュータ可読媒体は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングするためのプログラム命令であって、情報を用いることは、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする、プログラミング命令を含む。

さらなる他の実施形態では、コンピュータシステムが開示される。コンピュータシステムは、プロセッサと、プロセッサに結合され、命令が記憶されたメモリであって、命令は、コンピュータシステムによって実行されると、コンピュータシステムに、グラフィックス処理を行うための方法を実行させる、メモリと、を含む。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、アプリケーションによって生成された画像フレームのジオメトリの複数のピースに対するＧＰＵ事前テストにおいてジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングし、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

本開示の実施形態では、グラフィックス処理を行うための方法を開示する。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する、分割することを含む。本方法は、アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングすることを含む。本方法は、以前の画像フレームのレンダリングに対する統計値を生成することを含む。本方法は、統計値に基づいて、アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、現在の画像フレームにおいてジオメトリの第２の複数のピースに対してジオメトリテストを行って、ジオメトリの第２の複数のピースの各ピースと、複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、ジオメトリテストは複数のＧＰＵのそれぞれにおいて割り当てに基づいて行われる。本方法は、ジオメトリの第２の複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの第２の複数のピースをレンダリングし、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする含む。

別の実施形態では、方法を行うための非一時的コンピュータ可読媒体を開示する。コンピュータ可読媒体は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割するためのプログラム命令であって、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する、プログラミング命令を含む。コンピュータ可読媒体は、アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、以前の画像フレームのレンダリングに対する統計値を生成するためのプログラム命令を含む。コンピュータ可読媒体は、統計値に基づいて、アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てるためのプログラム命令を含む。コンピュータ可読媒体は、現在の画像フレームにおいてジオメトリの第２の複数のピースに対してジオメトリテストを行って、ジオメトリの第２の複数のピースの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成するためのプログラミング命令を有し、ジオメトリテストは複数のＧＰＵのそれぞれにおいて割り当てに基づいて行われる。コンピュータ可読媒体は、ジオメトリの第２の複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの第２の複数のピースをレンダリングするためのプログラミング命令を有し、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップすることができる。

さらなる他の実施形態では、コンピュータシステムが開示される。コンピュータシステムは、プロセッサと、プロセッサに結合され、命令が記憶されたメモリであって、命令は、コンピュータシステムによって実行されると、コンピュータシステムに、グラフィックス処理を行うための方法を実行させる、メモリと、を含む。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングする。本方法は、以前の画像フレームのレンダリングに対する統計値を生成することを含む。本方法は、統計値に基づいて、アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、現在の画像フレームにおいてジオメトリの第２の複数のピースに対してジオメトリテストを行って、ジオメトリの第２の複数のピースの各ピースと、複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、ジオメトリテストは複数のＧＰＵのそれぞれにおいて割り当てに基づいて行われる。本方法は、ジオメトリの第２の複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの第２の複数のピースをレンダリングし、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップすることを含むことができる。

本開示の実施形態は、グラフィックス処理を行うための方法を開示する。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てる。本方法は、ジオメトリテストを実行するように１つ以上のシェーダーを構成する第１の状態を設定することを含む。本方法は、複数のＧＰＵにおいてジオメトリの複数のピースに対してジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、レンダリングを実行するように１つ以上のシェーダーを構成する第２の状態を設定することを含む。本方法は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングし、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

別の実施形態では、方法を行うための非一時的コンピュータ可読媒体が開示される。コンピュータ可読媒体は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割するためのプログラム命令を有し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。コンピュータ可読媒体は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てるためのプログラム命令を含む。コンピュータ可読媒体は、ジオメトリテストを実行するように１つ以上のシェーダーを構成する第１の状態を設定するためのプログラム命令を含む。コンピュータ可読媒体は、複数のＧＰＵにおいてジオメトリの複数のピースに対してジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成するためのプログラム命令を含む。コンピュータ可読媒体は、レンダリングを実行するように１つ以上のシェーダーを構成する第２の状態を設定するためのプログラム命令を含む。コンピュータ可読媒体は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングするためのプログラム命令を有し、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

さらなる他の実施形態では、コンピュータシステムが開示される。コンピュータシステムは、プロセッサと、プロセッサに結合され、命令が記憶されたメモリであって、命令は、コンピュータシステムによって実行されると、コンピュータシステムに、グラフィックス処理を行うための方法を実行させる、メモリと、を含む。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、ジオメトリテストを実行するように１つ以上のシェーダーを構成する第１の状態を設定することを含む。本方法は、複数のＧＰＵにおいてジオメトリの複数のピースに対してジオメトリテストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。本方法は、レンダリングを実行するように１つ以上のシェーダーを構成する第２の状態を設定することを含む。本方法は、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングし、情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

本開示の実施形態は、グラフィックス処理を行うための方法を開示する。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、ジオメトリの第１の組のピースに対してジオメトリテスト及びレンダリングを実行する第１の組のシェーダーと、ジオメトリの第２の組のピースに対してジオメトリテスト及びレンダリングを実行する第２の組のシェーダーとを、インターリーブすることを含む。ジオメトリテストは、第１の組または第２の組内のジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する対応する情報を生成する。対応する情報を複数のＧＰＵが用いて、第１の組または第２の組内のジオメトリの各ピースをレンダリングする。情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

別の実施形態では、方法を行うための非一時的コンピュータ可読媒体が開示される。コンピュータ可読媒体は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を含む。コンピュータ可読媒体は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割するためのプログラム命令を有し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。コンピュータ可読媒体は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てるためのプログラム命令を含む。コンピュータ可読媒体は、ジオメトリの第１の組のピースに対してジオメトリテスト及びレンダリングを実行する第１の組のシェーダーと、ジオメトリの第２の組のピースに対してジオメトリテスト及びレンダリングを実行する第２の組のシェーダーとをインターリーブするためのプログラミング命令を含む。ジオメトリテストは、第１の組または第２の組内のジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する対応する情報を生成する。対応する情報を複数のＧＰＵが用いて、第１の組または第２の組内のジオメトリの各ピースをレンダリングする。情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

さらなる他の実施形態では、コンピュータシステムが開示される。コンピュータシステムは、プロセッサと、プロセッサに結合され、命令が記憶されたメモリであって、命令は、コンピュータシステムによって実行されると、コンピュータシステムに、グラフィックス処理を行うための方法を実行させる、メモリと、を含む。本方法は、複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。本方法は、グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割し、各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。本方法は、ジオメトリの第１の組のピースに対してジオメトリテスト及びレンダリングを実行する第１の組のシェーダーと、ジオメトリの第２の組のピースに対してジオメトリテスト及びレンダリングを実行する第２の組のシェーダーとをインターリーブする。ジオメトリテストは、第１の組または第２の組内のジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する対応する情報を生成する。対応する情報を複数のＧＰＵが用いて、第１の組または第２の組内のジオメトリの各ピースをレンダリングする。情報を用いるときに、たとえば、ジオメトリのピースが、所与のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと判定された場合に、レンダリングを完全にスキップする。

本開示の他の態様は、以下の詳細な説明と併せて、一例として本開示の原理を例示する添付図面から明らかになる。

本開示は、以下の説明と併せて添付図面を参照することにより最良に理解され得る。

本開示の実施形態により、複数のＧＰＵ（グラフィックス処理ユニット）を連携で実行して単一画像をレンダリングするように構成された１つ以上のクラウドゲーミングサーバ間でネットワークを介してゲーミングを提供するためのシステムの図であって、スクリーン領域（インターリーブされ得る）に対してジオメトリの事前テストを行うことによって、アプリケーションに対するジオメトリのレンダリングを行うマルチＧＰＵを含む図である。本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするマルチＧＰＵアーキテクチャの図である。本開示の一実施形態により、スクリーン領域（インターリーブされ得る）に対してジオメトリの事前テストを行うことによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うように構成された複数のグラフィックス処理ユニットリソースの図である。本開示の一実施形態により、マルチＧＰＵ処理を行って複数のＧＰＵが連携して単一画像をレンダリングするように構成されたグラフィックスパイプラインを実装するレンダリングアーキテクチャの図である。本開示の一実施形態により、レンダリング前にインターリーブスクリーン領域に対する事前テストを行うことによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことを含むグラフィックス処理を行うための方法を例示するフロー図である。本開示の一実施形態により、マルチＧＰＵレンダリングを行うときに四分円に細分割されるスクリーンの図である。本開示の一実施形態により、マルチＧＰＵレンダリングを行うときに複数のインターリーブ領域に細分割されるスクリーンの図である。本開示の一実施形態により、連携して単一画像をレンダリングする複数のＧＰＵによって共有されるレンダリングコマンドバッファの図であり、ジオメトリの事前テスト部分及びレンダリング部分を含む図である。本開示の一実施形態により、複数のＧＰＵによってレンダリングされる４つのオブジェクトを含む画像を例示する図であり、画像のオブジェクトをレンダリングするときの各ＧＰＵに対するスクリーン領域レスポンシビリティを示す図である。本開示の一実施形態により、図７Ｂ－１の４つのオブジェクトをレンダリングするときに各ＧＰＵが行うレンダリングを例示する表である。本開示の一実施形態により、複数のＧＰＵの連携を通して画像フレームをレンダリングするときに（たとえば、図７Ｂ－１の画像）１つ以上のＧＰＵによって行われるジオメトリの事前テスト及びジオメトリのレンダリングを行うことを例示する図である。本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするときのスクリーン領域に対するオブジェクトテストを例示する図である。本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするときのスクリーン領域に対するオブジェクトの一部のテストを例示する図である。Ａ～Ｃは、本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするときにスクリーン領域を対応するＧＰＵに割り当てるための種々の方策を例示する図である。本開示の実施形態により、ジオメトリの複数のピースに対してジオメトリ事前テストを行うためのＧＰＵ割り当ての種々の分配を例示する図である。本開示の一実施形態により、複数のＧＰＵによる以前の画像フレームのジオメトリの事前テスト及びレンダリングと、レンダリング中に収集した統計値を用いて、現在の画像フレームのジオメトリの事前テストを現在の画像フレームにおける複数のＧＰＵに割り当てることに影響を与えることと、を例示する図である。本開示の一実施形態により、複数のＧＰＵによる以前の画像フレームのジオメトリの事前テスト及びレンダリングと、レンダリング中に収集した統計値を用いて、現在の画像フレームのジオメトリの事前テストを現在の画像フレームにおける複数のＧＰＵに割り当てることに影響を与えることと、を含むグラフィックス処理を行うための方法を例示するフロー図である。本開示の一実施形態により、コマンドバッファの一部を通る２回のパスにおいて画像フレームのジオメトリの事前テスト及びレンダリングの両方を実行するように構成されたシェーダーを用いることを例示する図である。本開示の一実施形態により、コマンドバッファの一部を通る２回のパスにおいて同じ組のシェーダーを用いて画像フレームのジオメトリの事前テスト及びレンダリングの両方を行うことを含むグラフィックス処理を行うための方法を例示するフロー図である。本開示の一実施形態により、ジオメトリテスト及びレンダリングの両方を実行するように構成されたシェーダーを用いることを例示する図であり、ジオメトリの異なる組のピースに対して行われるジオメトリテスト及びレンダリングが、対応するコマンドバッファの別個の部分を用いてインターリーブされる図である。本開示の一実施形態により、ジオメトリの異なる組のピースに対する画像フレームのジオメトリの事前テスト及びレンダリングを、対応するコマンドバッファの別個の部分を用いてインターリーブすることを含むグラフィックス処理を行うための方法を例示するフロー図である。本開示の種々の実施形態の態様を実行するために用いることができるデバイス例のコンポーネントを例示する図である。

以下の詳細な説明には、説明の目的上、多くの特定の詳細が含まれているが、当業者であれば分かるように、以下の詳細に対する多くの変形及び修正も本開示の範囲内である。したがって、以下に説明する本開示の態様は、この説明に続く特許請求の範囲に対する一般性を何ら失うことなく、また特許請求の範囲に限定を課すことなく、述べられている。

一般的に言って、個々のＧＰＵが達成できる性能には限界があり、これは、たとえばＧＰＵをどのくらい大きくできるかに対する限界から導かれる。本開示の実施形態では、さらに複雑なシーンをレンダリングするために、またはさらに複雑なアルゴリズム（たとえば、材料、照明など）を用いるために、複数のＧＰＵを用いて単一画像をレンダリングすることが望ましい。詳細には、本開示の種々の実施形態では、スクリーン領域（インターリーブされ得る）に対してジオメトリの事前テストを行うことによってアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うように構成された方法及びシステムについて説明する。複数のＧＰＵは連携して画像を生成する。レンダリングに対するレスポンシビリティ（responsibility）あるいは義務あるいは応答能力を、スクリーン領域に基づいて複数のＧＰＵ間で分割する。ジオメトリをレンダリングする前に、ＧＰＵは、ジオメトリとスクリーン領域に対するその関係とに関する情報を生成する。これにより、ＧＰＵは、ジオメトリをより効率的にレンダリングすることまたはレンダリングを完全に回避することができる。たとえば、これによって、複数のＧＰＵが、より複雑なシーン及び／または画像を同じ時間でレンダリングすることができるという利点がある。

種々の実施形態の前述した全般的な理解に基づき、次に実施形態の詳細例について、種々の図面を参照して説明する。

明細書の全体にわたって、「アプリケーション」または「ゲーム」または「ビデオゲーム」または「ゲーミングアプリケーション」に言及した場合、入力コマンドの実行を通して指示される任意のタイプの対話型アプリケーションを表すことが意図されている。例示のみを目的として、対話型アプリケーションには、ゲーミング、文書処理、ビデオ処理、ビデオゲーム処理などに対するアプリケーションが含まれる。さらに、前述で導入した用語は交換可能である。

明細書の全体にわたって、本開示の種々の実施形態は、４つのＧＰＵを有する典型的なアーキテクチャを用いてアプリケーションに対するジオメトリのマルチＧＰＵ処理またはレンダリングを行うことについて説明される。しかし、当然のことながら、アプリケーションに対するジオメトリをレンダリングするときに任意の数のＧＰＵ（たとえば、２つ以上のＧＰＵ）が連携してもよい。

図１は、本開示の一実施形態により、アプリケーションに対する画像（たとえば画像フレーム）をレンダリングするときにマルチＧＰＵ処理を行うためのシステムの図である。本開示の実施形態により、システムは、１つ以上のクラウドゲーミングサーバ間でネットワークを介してゲーミングを提供するように構成されており、より具体的には、複数のＧＰＵを連携してアプリケーションの単一画像をレンダリングするように構成されている。クラウドゲーミングには、サーバにおいてビデオゲームを実行して、ゲームレンダリングされたビデオフレームを生成することが含まれる。これは次に、クライアントに送られて表示される。詳細には、システム１００は、レンダリング前にスクリーン領域（インターリーブあるいは交互配置され得る）に対して事前テストを行うことによって、アプリケーションに対するジオメトリの効率的なマルチＧＰＵレンダリングを行うように構成されている。

図１では、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ間でのジオメトリのマルチＧＰＵレンダリングの実施態様を例示しているが、本開示の他の実施形態では、スタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むもの）内でレンダリング中に領域テストを行うことによってアプリケーションに対するジオメトリの効率的なマルチＧＰＵレンダリングを行うことが提供される。

また当然のことながら、ジオメトリのマルチＧＰＵレンダリングを、物理ＧＰＵ、または仮想ＧＰＵ、または両方の組み合わせを種々の実施形態で（たとえば、クラウドゲーミング環境においてまたはスタンドアロンシステム内で）用いて、行ってもよい。たとえば、仮想マシン（たとえば、インスタンス）を、ハードウェア層の１つ以上のコンポーネント（たとえば、複数のＣＰＵ、メモリモジュール、ＧＰＵ、ネットワークインターフェース、通信コンポーネントなど）を用いるホストハードウェア（たとえば、データセンタに配置される）のハイパーバイザを用いて、形成してもよい。これらの物理リソースを、ラック（たとえば、ＣＰＵのラック、ＧＰＵのラック、メモリのラックなど）内に配列してもよい。ラック内の物理リソースにはトップオブラックスイッチを用いてアクセスしてもよく、これにより、インスタンスに対して用いるコンポーネントの組み立て及びアクセスを行うための構造を容易にする（たとえば、インスタンスの仮想化コンポーネントを構築するときに）。一般的に、ハイパーバイザは、仮想リソースを用いて構成される複数のインスタンスの複数のゲストオペレーティングシステムを示すことができる。すなわち、オペレーティングシステムはそれぞれ、１つ以上のハードウェアリソース（たとえば、対応するデータセンタに配置される）によってサポートされる仮想化リソースの対応する組を用いて構成してもよい。たとえば、各オペレーティングシステムを、仮想ＣＰＵ、複数の仮想ＧＰＵ、仮想メモリ、仮想化通信コンポーネントなどによってサポートしてもよい。さらに、あるデータセンタから別のデータセンタへインスタンスの設定を転送し、レイテンシを短縮し得る。ユーザのゲーミングセッションを保存するときに、ユーザまたはゲームに対して規定されるＧＰＵ稼働率を用いることができる。ＧＰＵ稼働率は、ゲーミングセッションに対するビデオフレームの高速レンダリングを最適化するための本明細書で説明する任意の数の構成を含むことができる。一実施形態では、ゲームまたはユーザに対して規定されるＧＰＵ稼働率を、構成可能な設定としてデータセンタ間で移すことができる。異なるジオロケーションからゲームをプレイするためにユーザが接続する場合には、ＧＰＵ稼働率設定を移せることで、データセンタからデータセンタへゲームプレイを効率的に移行することができる。

本開示の一実施形態により、システム１００は、クラウドゲームネットワーク１９０を介してゲーミングを提供する。ゲームは、ゲームをプレイしている対応するユーザのクライアントデバイス１１０（たとえば、シンクライアント）から遠隔で実行されている。システム１００は、シングルプレイヤーモードまたはマルチプレイヤーモードのいずれかでネットワーク１５０を介してクラウドゲームネットワーク１９０を通して１つ以上のゲームをプレイしている１人以上のユーザに対するゲーミングコントロールを提供してもよい。いくつかの実施形態では、クラウドゲームネットワーク１９０は、ホストマシンのハイパーバイザ上で実行される複数の仮想マシン（ＶＭ）を含んでいてもよい。１つ以上の仮想マシンが、ホストのハイパーバイザにとって利用可能なハードウェアリソースを用いるゲームプロセッサモジュールを実行するように構成されている。ネットワーク１５０は１つ以上の通信技術を含んでいてもよい。いくつかの実施形態では、ネットワーク１５０は、高度な無線通信システムを有する第５世代（５Ｇ）ネットワーク技術を含んでいてもよい。

いくつかの実施形態では、無線技術を用いて通信を容易にしてもよい。このような技術には、たとえば、５Ｇ無線通信技術が含まれていてもよい。５Ｇは第５世代のセルラーネットワーク技術である。５Ｇネットワークはデジタルセルラーネットワークであり、ここでは、プロバイダがカバーするサービスエリアが、セルと言われる小さい地理的領域に分割される。音及び画像を表すアナログ信号は、電話機内でデジタル化され、アナログデジタル変換器によって変換されて、ビットのストリームとして送信される。セル内のすべての５Ｇ無線デバイスは、セル内のローカルアンテナアレイ及び低パワー自動化送受信装置（送信部及び受信部）を用いて電波によって通信し、この通信は、他のセル内で再使用される周波数のプールから送受信装置によって割り当てられた周波数チャネル上で行われる。ローカルアンテナは、高帯域幅光ファイバまたは無線バックホール接続によって電話ネットワーク及びインターネットと接続される。他のセルネットワークの場合と同様に、モバイルデバイスがあるセルから別のセルへ横断すると、新しいセルに自動的に移される。当然のことながら、５Ｇネットワークは単に通信ネットワークのタイプ例であり、本開示の実施形態では、前の世代の無線または有線通信、ならびに５Ｇの後に来る後の世代の有線または無線技術を用いてもよい。

図示したように、クラウドゲームネットワーク１９０には、複数のビデオゲームにアクセスを提供するゲームサーバ１６０が含まれる。ゲームサーバ１６０は、クラウド内で利用できる任意のタイプのサーバコンピューティングデバイスであってもよく、１つ以上のホスト上で実行される１つ以上の仮想マシンとして構成してもよい。たとえば、ゲームサーバ１６０は、ユーザに対するゲームのインスタンスをインスタンス化するゲームプロセッサをサポートする仮想マシンを管理してもよい。したがって、複数の仮想マシンに対応付けられるゲームサーバ１６０の複数のゲームプロセッサは、複数のユーザのゲームプレイに対応付けられる１つ以上のゲームの複数のインスタンスを実行するように構成されている。このように、バックエンドサーバサポートは、複数のゲーミングアプリケーションのゲームプレイの媒体（たとえば、ビデオ、オーディオなど）のストリーミングを、複数の対応するユーザに提供する。すなわち、ゲームサーバ１６０は、データ（たとえば、対応するゲームプレイのレンダリング画像及び／またはフレーム）を、対応するクライアントデバイス１１０にネットワーク１５０を通してストリーミングによって戻すように構成されている。このように、コンピュータ的に複雑なゲーミングアプリケーションを、クライアントデバイス１１０が受け取って転送するコントローラ入力に応じて、バックエンドサーバで実行してもよい。各サーバは画像及び／またはフレームをレンダリングすることができ、これらは次に、エンコード（たとえば圧縮）され、対応するクライアントデバイスにストリーミングされて表示される。

たとえば、複数のユーザは、ストリーミングメディアを受け取るように構成された対応するクライアントデバイス１１０を用いて、通信ネットワーク１５０を介してクラウドゲームネットワーク１９０にアクセスしてもよい。一実施形態では、クライアントデバイス１１０をシンクライアントとして構成して、計算機能（たとえば、ゲームタイトル処理エンジン１１１を含む）を提供するように構成されたバックエンドサーバ（たとえば、クラウドゲームネットワーク１９０）との相互連絡を提供してもよい。別の実施形態では、クライアントデバイス１１０を、ビデオゲームの少なくとも何らかのローカル処理を行うためのゲームタイトル処理エンジン及びゲームロジックを用いて構成してもよく、さらに、バックエンドサーバで実行されるビデオゲームが生成するストリーミングコンテンツを受け取るために、またはバックエンドサーバサポートが提供する他のコンテンツに対して用いてもよい。ローカル処理に対しては、ゲームタイトル処理エンジンには、ビデオゲームに対応付けられるビデオゲーム及びサービスを実行するための基本プロセッサベースの機能が含まれる。その場合、ゲームロジックを、ローカルクライアントデバイス１１０上に記憶して、ビデオゲームを実行するために用いてもよい。

クライアントデバイス１１０はそれぞれ、クラウドゲームネットワークから異なるゲームへのアクセスをリクエストしていてもよい。たとえば、クラウドゲームネットワーク１９０は、ゲームサーバ１６０のＣＰＵリソース１６３及びＧＰＵリソース３６５を用いて実行されるように、ゲームタイトル処理エンジン１１１上に構築される１つ以上のゲームロジックを実行していてもよい。たとえば、ゲームロジック１１５ａはゲームタイトル処理エンジン１１１と連携して、１つのクライアントに対してゲームサーバ１６０上で実行していてもよく、ゲームロジック１１５ｂはゲームタイトル処理エンジン１１１と連携して、２番目のクライアントに対してゲームサーバ１６０上で実行していてもよく、・・・またゲームロジック１１５ｎはゲームタイトル処理エンジン１１１と連携して、ｎ番目のクライアントに対してゲームサーバ１６０上で実行していてもよい。

詳細には、対応するユーザ（図示せず）のクライアントデバイス１１０は、通信ネットワーク１５０（たとえば、インターネット）を介してゲームへのアクセスをリクエストするように、またゲームサーバ１６０が実行するビデオゲームによって生成される表示画像（たとえば、画像フレーム）をレンダリングするように、構成されている。エンコード画像は、クライアントデバイス１１０に送出されて、対応するユーザに関連して表示される。たとえば、ユーザは、ゲームサーバ１６０のゲームプロセッサ上で実行されているビデオゲームのインスタンスと、クライアントデバイス１１０を通してやり取りしていてもよい。より詳細には、ビデオゲームのインスタンスはゲームタイトル処理エンジン１１１によって実行される。ビデオゲームを実施する対応するゲームロジック（たとえば、実行可能コード）１１５は、データストア（図示せず）を通して記憶されてアクセス可能であり、ビデオゲームを実行するために用いられる。ゲームタイトル処理エンジン１１１は、複数のゲームロジック（たとえば、ゲーミングアプリケーション）を用いて、複数のビデオゲームをサポートすることができ、各ゲームロジックは、ユーザによって選択可能である。

たとえば、クライアントデバイス１１０は、対応するユーザのゲームプレイに関連するゲームタイトル処理エンジン１１１と、たとえば、ゲームプレイを駆動するために用いる入力コマンドを通して、相互に作用するように構成されている。詳細には、クライアントデバイス１１０は、種々のタイプの入力デバイス、たとえば、ゲームコントローラ、タブレットコンピュータ、キーボード、ビデオカメラによって取り込まれたジェスチャ、マウス、タッチパッドなどから入力を受け取ってもよい。クライアントデバイス１１０は、ネットワーク１５０を介してゲームサーバ１６０に接続することができるメモリ及びプロセッサモジュールを少なくとも有する任意のタイプのコンピューティングデバイスとすることができる。バックエンドのゲームタイトル処理エンジン１１１は、レンダリング画像を生成するように構成されている。レンダリング画像は、ネットワーク１５０を介して送出されて、クライアントデバイス１１０に関連する対応するディスプレイにおいて表示される。たとえば、クラウドベースのサービスを通して、ゲームレンダリング画像を、ゲームサーバ１６０のゲーム実行エンジン１１１上で実行されている対応するゲーム（たとえば、ゲームロジック）のインスタンスが送出してもよい。すなわち、クライアントデバイス１１０は、エンコード画像（たとえば、ビデオゲームの実行を通して生成されるゲームレンダリング画像からエンコードされる）を受け取るように、またレンダリングされる画像をディスプレイ１１上に表示するように構成されている。一実施形態では、ディスプレイ１１は、ＨＭＤ（たとえば、ＶＲコンテンツを表示する）を含む。いくつかの実施形態では、レンダリング画像を、スマートフォンまたはタブレットに、無線または有線で、クラウドベースのサービスから直接にまたはクライアントデバイス１１０（たとえば、プレイステーション（登録商標）リモートプレイ）を介して、ストリーミングしてもよい。

一実施形態では、ゲームサーバ１６０及び／またはゲームタイトル処理エンジン１１１には、ゲーミングアプリケーションに対応付けられるゲーム及びサービスを実行するための基本プロセッサベースの機能が含まれる。たとえば、ゲームサーバ１６０には、プロセッサベースの機能（たとえば、２Ｄまたは３Ｄレンダリング、物理シミュレーション、スクリプティング、オーディオ、アニメーション、グラフィックス処理、照明、シェーディング、ラスタライゼーション、レイトレーシング、シャドーイング、カリング、変換、人工知能など）を行うように構成された中央処理ユニット（ＣＰＵ）リソース１６３及びグラフィックス処理ユニット（ＧＰＵ）リソース３６５が含まれる。加えて、ＣＰＵ及びＧＰＵグループは、ゲーミングアプリケーションに対するサービス（メモリ管理、マルチスレッド管理、サービスの質（ＱｏＳ）、バンド幅テスト、ソーシャルネットワーキング、ソーシャルフレンズの管理、フレンズのソーシャルネットワークとの通信、通信チャネル、テキスティング、インスタントメッセージ、チャットサポートなどを部分的に含む）を実行してもよい。一実施形態では、１つ以上のアプリケーションは特定のＧＰＵリソースを共有する。一実施形態では、複数のＧＰＵデバイスを結合して、対応するＣＰＵ上で実行されている単一アプリケーションに対するグラフィックス処理を実行してもよい。

一実施形態では、クラウドゲームネットワーク１９０は分散ゲームサーバシステム及び／またはアーキテクチャである。詳細には、ゲームロジックを実行する分散ゲームエンジンは、対応するゲームの対応するインスタンスとして構成される。一般的に、分散ゲームエンジンは、ゲームエンジンの機能のそれぞれを取って、それらの機能を多数の処理エンティティが実行するように分配する。個々の機能をさらに、１つ以上の処理エンティティにわたって分配することができる。処理エンティティを異なる構成（たとえば、物理ハードウェア）で、及び／または仮想コンポーネントまたは仮想マシンとして、及び／または仮想コンテナとして構成してもよい。コンテナは、仮想化オペレーティングシステム上で実行されるゲーミングアプリケーションのインスタンスを仮想化するため、仮想マシンとは異なる。処理エンティティは、クラウドゲームネットワーク１９０のサーバ及びその基礎をなすハードウェア（１つ以上のサーバ（計算ノード）上にある）を使用し及び／またはそれらに依拠してもよい。サーバは１つ以上のラックに配置してもよい。種々の処理エンティティに対するこれらの機能の実行の調整、割り当て、及び管理は、分散同期層が行う。このように、これらの機能の実行を分散同期層が制御して、プレーヤによるコントローラ入力に応じたゲーミングアプリケーションに対する媒体（たとえばビデオフレーム、オーディオなど）の生成を可能にする。分散同期層は、これらの機能を、分散させた処理エンティティにわたって効率的に実行して（たとえば、ロードバランシングを通して）、重要なゲームエンジンコンポーネント／機能を分散させて再組み立てして、より効率的な処理が行われるようにすることができる。

図２は、本開示の一実施形態により、複数のＧＰＵが連携して対応するアプリケーションの単一画像をレンダリングする典型的なマルチＧＰＵアーキテクチャ２００の図である。当然のことながら、本開示の種々の実施形態において、複数のＧＰＵが連携して単一画像をレンダリングする多くのアーキテクチャが可能であるが、明示的に説明することも図示することもしない。たとえば、レンダリング中に領域テストを行うことによるアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ間で実行してもよいし、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むものなど）内で実行してもよい。

マルチＧＰＵアーキテクチャ２００には、アプリケーションに対する単一画像及び／またはアプリケーションに対する画像列内の各画像のマルチＧＰＵレンダリングを行うように構成されたＣＰＵ１６３及び複数のＧＰＵが含まれている。詳細には、ＣＰＵ１６３及びＧＰＵリソース３６５は、プロセッサベースの機能（たとえば、前述したように、２Ｄまたは３Ｄレンダリング、物理シミュレーション、スクリプティング、オーディオ、アニメーション、グラフィックス処理、照明、シェーディング、ラスタライゼーション、レイトレーシング、シャドーイング、カリング、変換、人工知能など）を行うように構成されている。

たとえば、マルチＧＰＵアーキテクチャ２００のＧＰＵリソース３６５には４つのＧＰＵが示されているが、アプリケーションに対する画像をレンダリングするときには任意の数のＧＰＵを用いてもよい。各ＧＰＵは、対応する専用メモリ（たとえば、ランダムアクセスメモリ（ＲＡＭ））に高速バス２２０を介して接続されている。詳細には、ＧＰＵ－Ａはメモリ２１０Ａ（たとえば、ＲＡＭ）にバス２２０を介して接続され、ＧＰＵ－Ｂはメモリ２１０Ｂ（たとえば、ＲＡＭ）にバス２２０を介して接続され、ＧＰＵ－Ｃはメモリ２１０Ｃ（たとえば、ＲＡＭ）にバス２２０を介して接続され、ＧＰＵ－Ｄはメモリ２１０Ｄ（たとえば、ＲＡＭ）にバス２２０を介して接続されている。

さらに、各ＧＰＵは、バス２４０を介して互いに接続されている。バス２４０は、アーキテクチャに応じて、対応するＧＰＵとその対応するメモリとの間の通信に対して用いるバス２２０と速度がほぼ等しいかまたはそれよりも遅い場合がある。たとえば、ＧＰＵ－Ａは、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄのそれぞれと、バス２４０を介して接続されている。また、ＧＰＵ－Ｂは、ＧＰＵ－Ａ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄのそれぞれと、バス２４０を介して接続されている。加えて、ＧＰＵ－Ｃは、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、及びＧＰＵ－Ｄのそれぞれと、バス２４０を介して接続されている。さらに、ＧＰＵ－Ｄは、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、及びＧＰＵ－Ｃのそれぞれと、バス２４０を介して接続されている。

ＣＰＵ１６３は、ＧＰＵのそれぞれと、より低速度のバス２３０を介して接続されている（たとえば、バス２３０は、対応するＧＰＵとその対応するメモリとの間の通信に対して用いるバス２２０よりも遅い）。詳細には、ＣＰＵ１６３は、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄのそれぞれと接続されている。

図３は、本開示の一実施形態により、レンダリング前にスクリーン領域（インターリーブされ得る）に対して事前テストを行うことによって、アプリケーションよって生成された画像フレームに対するジオメトリのマルチＧＰＵレンダリングを行うように構成されたグラフィックス処理ユニットリソース３６５の図である。たとえば、ゲームサーバ１６０を、図１のクラウドゲームネットワーク１９０内のＧＰＵリソース３６５を含むように構成してもよい。図示するように、ＧＰＵリソース３６５は、複数のＧＰＵ（たとえば、ＧＰＵ３６５ａ、ＧＰＵ３６５ｂ・・・ＧＰＵ３６５ｎ）を含んでいる。前述したように、種々のアーキテクチャに、レンダリング中の領域テストを通してアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって、複数のＧＰＵが連携して単一画像をレンダリングすることが含まれていてもよい。たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ間でジオメトリのマルチＧＰＵレンダリングを実施すること、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むものなど）内でジオメトリのマルチＧＰＵレンダリングを実施することである。

詳細には、一実施形態では、ゲームサーバ１６０は、アプリケーションの単一画像をレンダリングするときにマルチＧＰＵ処理を実行するように構成されていて、複数のＧＰＵが連携して単一画像をレンダリングし、及び／またはアプリケーションを実行するときに画像列の１つ以上の各画像をレンダリングする。たとえば、一実施形態では、ゲームサーバ１６０は、アプリケーションの画像列内の１つ以上の各画像のマルチＧＰＵレンダリングを実行するように構成されたＣＰＵ及びＧＰＵグループを含んでいてもよい。ここで、１つのＣＰＵ及びＧＰＵグループが、グラフィックスを実行していることができ、及び／またはアプリケーションに対するパイプラインをレンダリングしていることができる。ＣＰＵ及びＧＰＵグループを、１つ以上の処理デバイスとして構成することができる。前述したように、ＧＰＵ及びＧＰＵグループは、ＣＰＵ１６３及びＧＰＵリソース３６５を含んでいてもよい。ＣＰＵ１６３及びＧＰＵリソース３６５は、プロセッサベースの機能（たとえば、２Ｄまたは３Ｄレンダリング、物理シミュレーション、スクリプティング、オーディオ、アニメーション、グラフィックス処理、照明、シェーディング、ラスタライゼーション、レイトレーシング、シャドーイング、カリング、変換、人工知能など）を行うように構成されている。

ＧＰＵリソース３６５は、オブジェクトのレンダリング（たとえば、オブジェクトのピクセルに対する色または法線ベクトル値を複数のレンダリングターゲット－ＭＲＴに書き込むこと）及び同期型計算カーネルの実行（たとえば、結果として生じるＭＲＴに対するフルスクリーン効果）にレスポンシビリティを有し及び／またはこれらを行うように構成されている。実行すべき同期型計算及びレンダリングすべきオブジェクトは、ＧＰＵが実行するレンダリングコマンドバッファ３２５に含まれるコマンドによって指定される。詳細には、ＧＰＵリソース３６５は、レンダリングコマンドバッファ３２５からのコマンドを実行するときに、オブジェクトをレンダリングして、（たとえば、同期型計算カーネルを実行する間に）同期型計算を行うように構成され、コマンド及び／または動作は、それらが順次行われるように、他の動作に依存し得る。

たとえば、ＧＰＵリソース３６５は、同期型計算を行うように、及び／または１つ以上のレンダリングコマンドバッファ３２５（たとえば、レンダリングコマンドバッファ３２５ａ、レンダリングバッファ３２５ｂ・・・レンダリングコマンドバッファ３２５ｎ）を用いてオブジェクトのレンダリングを行うように、構成されている。一実施形態では、ＧＰＵリソース３６５における各ＧＰＵはその独自のコマンドバッファを有していてもよい。代替的に、実質的に同じ組のオブジェクトが各ＧＰＵによってレンダリングされているとき（たとえば、領域のサイズが小さいために）、ＧＰＵリソース３６５におけるＧＰＵは、同じコマンドバッファまたは同じ組のコマンドバッファを用いてもよい。さらに、ＧＰＵリソース３６５におけるＧＰＵのそれぞれが、コマンドをあるＧＰＵによって実行できるが、別のコマンドでは実行できないことをサポートしてもよい。たとえば、レンダリングコマンドバッファ内の描画コマンドまたはプレディケーション（predication）上にフラッグがあると、単一のＧＰＵが、対応するコマンドバッファ内の１つ以上のコマンドを実行できるが、他のＧＰＵはコマンドを無視する。たとえば、レンダリングコマンドバッファ３２５ａはフラッグ３３０ａをサポートしてもよく、レンダリングコマンドバッファ３２５ｂはフラッグ３３０ｂをサポートしてもよく・・・レンダリングコマンドバッファ３２５ｎはフラッグ３３０ｎをサポートしてもよい。

同期型計算を行うこと（たとえば、同期型計算カーネルの実行）及びオブジェクトのレンダリングは、レンダリング全体の一部分である。たとえば、ビデオゲームが６０Ｈｚ（たとえば、６０フレーム／秒）で実行されている場合、画像フレームに対するすべてのオブジェクトレンダリング及び同期型計算カーネルの実行は通常、ほぼ１６．６７ｍｓ（たとえば、６０Ｈｚで１フレーム）内で完了しなければならない。前述したように、オブジェクトをレンダリングし及び／または同期型計算カーネルを実行するときに行う動作は順序付けされており、動作は他の動作に依存し得る（たとえば、レンダリングコマンドバッファ内のコマンドは、そのレンダリングコマンドバッファ内の他のコマンドが実行できる前に、実行を完了する必要があり得る）。

詳細には、レンダリングコマンドバッファ３２５はそれぞれ、種々のタイプのコマンドを含んでいる（たとえば、対応するＧＰＵ構成に影響するコマンド（たとえば、レンダリングターゲットの場所及びフォーマットを指定するコマンド）、ならびにオブジェクトをレンダリングし及び／または同期型計算カーネルを実行するコマンド）。説明の目的上、同期型計算カーネルを実行するときに行う同期型計算には、オブジェクトがすべて１つ以上の対応する複数のレンダリングターゲット（ＭＲＴ：Multiple Render Targets）にレンダリングされたときにフルスクリーン効果を行うことが含まれていてもよい。

加えて、ＧＰＵリソース３６５が画像フレームに対するオブジェクトをレンダリングするとき、及び／または画像フレームを生成するときに同期型計算カーネルを実行するときに、ＧＰＵリソース３６５は各ＧＰＵ３６５ａ、３６５ｂ・・・３６５ｎのレジスタを介して構成される。たとえば、ＧＰＵ３６５ａは、そのレジスタ３４０（たとえばレジスタ３４０ａ、レジスタ３４０ｂ・・・レジスタ３４０ｎ）を介して、そのレンダリングを行うかまたは特定の方法でカーネル実行を計算するように構成される。すなわち、レジスタ３４０に記憶される値は、画像フレームに対するオブジェクトをレンダリングし及び／または同期型計算カーネルを実行するために用いるレンダリングコマンドバッファ３２５内のコマンドを実行するときに、ＧＰＵ３６５ａに対するハードウェアコンテキスト（たとえば、ＧＰＵ構成またはＧＰＵ状態）を規定する。ＧＰＵリソース３６５におけるＧＰＵのそれぞれを同様に構成して、ＧＰＵ３６５ｂが、そのレジスタ３５０（たとえば、レジスタ３５０ａ、レジスタ３５０ｂ・・・レジスタ３５０ｎ）を介して、そのレンダリングを実行するかまたは特定の方法でカーネル実行を計算するように構成され、・・・ＧＰＵ３６５ｎが、そのレジスタ３７０（たとえば、レジスタ３７０ａ、レジスタ３７０ｂ・・・レジスタ３７０ｎ）を介して、そのレンダリングを実行するかまたは特定の方法でカーネル実行を計算するように構成されるようにしてもよい。

ＧＰＵ構成のいくつかの例としては、レンダリングターゲット（たとえば、ＭＲＴ）の場所及びフォーマットが挙げられる。また、ＧＰＵ構成の他の例としては、操作手順が挙げられる。たとえば、オブジェクトをレンダリングするとき、オブジェクトの各ピクセルのＺ値を、Ｚバッファと種々の方法で比較することができる。たとえば、オブジェクトピクセルを書き込むのは、オブジェクトＺ値がＺバッファ内の値とマッチする場合のみである。あるいは、オブジェクトピクセルを書き込むことができるのは、オブジェクトＺ値がＺバッファ内の値と同じかまたはそれを下回る場合のみである。行うテストのタイプはＧＰＵ構成内で規定される。

図４は、本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするようにマルチＧＰＵ処理用に構成されたグラフィックスパイプライン４００を実施するレンダリングアーキテクチャの略図である。グラフィックスパイプライン４００は、３Ｄ（３次元）ポリゴンレンダリングプロセスを用いて画像をレンダリングするための一般的なプロセスを例示する。レンダリング画像に対するグラフィックスパイプライン４００は、ディスプレイ内の各ピクセルに対する対応する色情報を出力する。色情報は、テクスチャ及びシェーディング（たとえば、色、シャドーイングなど）を表し得る。グラフィックスパイプライン４００は、図１及び３のクライアントデバイス１１０、ゲームサーバ１６０、ゲームタイトル処理エンジン１１１、及び／またはＧＰＵリソース３６５内で実施可能であり得る。すなわち、種々のアーキテクチャは、レンダリング中の領域テストを通してアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって複数のＧＰＵが連携して単一画像をレンダリングすることを含んでいてもよい。たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ間でジオメトリのマルチＧＰＵレンダリングを実施すること、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むものなど）内でジオメトリのマルチＧＰＵレンダリングを実施することである。

図示したように、グラフィックスパイプラインは入力ジオメトリ４０５を受け取る。たとえば、ジオメトリ処理ステージ４１０が入力ジオメトリ４０５を受け取る。たとえば、入力ジオメトリ４０５としては、３Ｄゲーミング世界内の頂点及び各頂点に対応する情報を挙げてもよい。ゲーミング世界内の所与のオブジェクトを、頂点によって規定されるポリゴン（たとえば、三角形）を用いて表すことができる。次に、対応するポリゴンの表面をグラフィックスパイプライン４００を通して処理して、最終的な効果（たとえば、色、テクスチャなど）を実現する。頂点属性としては、法線（たとえば、どの方向がジオメトリのその場所に垂直であるか）、色（たとえば、ＲＧＢ－赤色、緑色、及び青色の三色など）、及びテクスチャ座標／マッピング情報を挙げてもよい。

ジオメトリ処理ステージ４１０は、頂点処理（たとえば、頂点シェーダーを介して）及びプリミティブ処理の両方にレスポンシビリティを有する（またこれらを行うことができる）。詳細には、ジオメトリ処理ステージ４１０は、プリミティブを規定してそれをグラフィックスパイプライン４００の次のステージに送出する頂点の組、ならびにそれらの頂点に対する位置（正確には、同次座標）及び他の種々のパラメータを出力してもよい。位置は、後のシェーダーステージによるアクセスに備えて、位置キャッシュ４５０に配置される。他のパラメータは、やはり後のシェーダーステージによるアクセスに備えて、パラメータキャッシュ４６０に配置される。

種々の動作をジオメトリ処理ステージ４１０によって行ってもよい。たとえば、プリミティブ及び／またはポリゴンに対する照明及びシャドーイング計算を行うことである。一実施形態では、ジオメトリステージは、プリミティブを処理することができるため、バックフェースカリング及び／またはクリッピング（たとえば、視錐台に対するテスト）を実行することができ、その結果、下流ステージ（たとえば、ラスタライゼーションステージ４２０など）に対する負荷が減る。別の実施形態では、ジオメトリステージは、プリミティブを生成してもよい（たとえば、従来のジオメトリシェーダーと同等の機能により）。

ジオメトリ処理ステージ４１０によって出力されたプリミティブを、ラスタライゼーションステージ４２０内に供給し、そこでプリミティブを、ピクセルからなるラスター画像に変換する。詳細には、ラスタライゼーションステージ４２０は、シーン内のオブジェクトを、３Ｄゲーミング世界内の視認場所（たとえば、カメラ場所、ユーザ眼場所など）によって規定される２次元（２Ｄ）像平面に投影するように構成されている。単純化したレベルでは、ラスタライゼーションステージ４２０は、各プリミティブを見て、どのピクセルが対応するプリミティブの影響を受けるかを判定する。詳細には、ラスタライザ４２０はプリミティブをピクセルサイズのフラグメントに分割する。各フラグメントはディスプレイ内のピクセルに対応する。画像を表示するときに、１つ以上のフラグメントが、対応するピクセルの色に寄与し得ることに留意することは重要である。

前述したように、ラスタライゼーションステージ４２０によってさらなる動作を行ってもよい。たとえば、視認場所に対するクリッピング（視錐台の外側のフラグメントを特定して無視する）及びカリング（より近いオブジェクトによって隠されるフラグメントを無視する）である。クリッピングに関連して、ジオメトリ処理ステージ４１０及び／またはラスタライゼーションステージ４２０を、ゲーミング世界内の視認場所によって規定される視錐台の外側にあるプリミティブを特定して無視するように構成してもよい。

ピクセル処理ステージ４３０は、ジオメトリ処理ステージによって形成されるパラメータ（ならびに他のデータ）を用いて、ピクセルの結果として生じる色などの値を生成してもよい。詳細には、ピクセル処理ステージ４３０は根本的に、フラグメントに対してシェーディング動作を実行して、プリミティブの色及び輝度が、利用可能な照明によってどのように異なるかを判定する。たとえば、ピクセル処理ステージ４３０は、各フラグメントに対する深さ、色、法線、及びテクスチャ座標（たとえば、テクスチャ詳細）を決定してもよく、さらに、フラグメントに対する光、暗さ、及び色の適切なレベルを決定してもよい。詳細には、ピクセル処理ステージ４３０は各フラグメントの特徴を計算する。たとえば、色及び他の属性（たとえば、視認場所からの距離に対するｚ深度、及び透明性に対するアルファ値）である。加えて、ピクセル処理ステージ４３０は、対応するフラグメントに影響する利用可能な照明に基づいてフラグメントに照明効果を適用する。さらに、ピクセル処理ステージ４３０は、各フラグメントに対してシャドーイング効果を適用してもよい。

ピクセル処理ステージ４３０の出力は、処理されたフラグメント（たとえば、テクスチャ及びシェーディング情報）を含み、グラフィックスパイプライン４００の次のステージにある４４０出力マージャーステージに送出される。出力マージャーステージ４４０は、ピクセル処理ステージ４３０の出力、ならびに他のデータ（たとえば、すでにメモリ内にある値）を用いて、ピクセルに対する最終色を生成する。たとえば、出力マージャーステージ４４０は、ピクセル処理ステージ４３０から決定されたフラグメント及び／またはピクセルと、そのピクセルに対してＭＲＴにすでに書き込まれた値との間の値の任意的なブレンディングを実行してもよい。

ディスプレイ内の各ピクセルに対する色値を、フレームバッファ（図示せず）に記憶してもよい。これらの値を、対応するピクセルにスキャンすることを、シーンの対応する画像を表示するときに行う。詳細には、ディスプレイは、各ピクセルに対するフレームバッファから色値を、行ごとに、左から右へまたは右から左へ、上から下へまたは下から上へ、または任意の他のパターンで読み出し、画像を表示するときにこれらのピクセル値を用いるピクセルを照明する。

図１～３のクラウドゲームネットワーク１９０（たとえば、ゲームサーバ１６０内の）及びＧＰＵリソース３６５の詳細な説明により、図５のフロー図５００は、本開示の一実施形態により、レンダリング前にインターリーブスクリーン領域に対してジオメトリの事前テストを行うことによって、アプリケーションよって生成された画像フレームに対するジオメトリのマルチＧＰＵレンダリングを実施するときに、グラフィックス処理を行うための方法を例示する。このように、複数のＧＰＵリソースを用いて、アプリケーションを実行するときにオブジェクトのレンダリングを効率的に実行する。前述したように、種々のアーキテクチャには、レンダリング中の領域テストを通してアプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって複数のＧＰＵが連携して単一画像をレンダリングすることが含まれていてもよい。レンダリングは、たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ内において、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むもの）内において等、行われる。

５１０において、本方法は、画像を生成するために連携する複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。詳細には、マルチＧＰＵ処理は、単一画像フレーム及び／またはリアルタイムアプリケーションに対する画像フレーム列の１つ以上の各画像フレームをレンダリングするときに行う。

５２０において、本方法は、グラフィックスのジオメトリをレンダリングするレスポンシビリティを複数のスクリーン領域に基づいて複数のＧＰＵ間で分割することを含む。すなわち、各ＧＰＵは、すべてのＧＰＵに知られたレスポンシビリティの対応するディビジョンあるいは分割部（たとえば、対応するスクリーン領域）を有する。より具体的には、ＧＰＵはそれぞれ、複数のスクリーン領域のうちの対応する組のスクリーン領域内のジオメトリをレンダリングすることにレスポンシビリティを有している。対応する組のスクリーン領域は１つ以上のスクリーン領域を含んでいる。たとえば、第１のＧＰＵは、第１の組のスクリーン領域内のオブジェクトをレンダリングするためのレスポンシビリティの第１のディビジョンを有する。また、第２のＧＰＵは、第２の組のスクリーン領域内のオブジェクトをレンダリングするためのレスポンシビリティの第２のディビジョンを有する。このことは、残りのＧＰＵに対して繰り返し適用される。

５３０において、本方法は、ジオメトリテストのために、第１のＧＰＵに、アプリケーションの実行中に生成された画像フレームのジオメトリの第１のピース（piece）あるいは断片を割り当てることを含む。たとえば、画像フレームは１つ以上のオブジェクトを含んでいてもよい。各オブジェクトはジオメトリの１つ以上のピースによって規定され得る。すなわち、一実施形態では、ジオメトリ事前テスト及びレンダリングを、オブジェクト全体であるジオメトリのピースに対して行う。他の実施形態では、ジオメトリ事前テスト及びレンダリングを、オブジェクト全体の一部であるジオメトリのピースに対して行う。

たとえば、複数のＧＰＵをそれぞれ、画像フレームに対応付けられるジオメトリの対応部分に割り当てる。詳細には、ジオメトリ事前テストを目的として、ジオメトリのすべての部分を対応するＧＰＵに割り当てる。一実施形態では、ジオメトリを複数のＧＰＵ間で均一に割り当ててもよい。たとえば、複数に４つのＧＰＵがある場合、ＧＰＵはそれぞれ、画像フレーム内のジオメトリの４分の１を処理してもよい。他の実施形態では、ジオメトリを複数のＧＰＵ間で不均一に割り当ててもよい。たとえば、画像フレームのマルチＧＰＵレンダリングのために４つのＧＰＵを用いる例では、あるＧＰＵが処理する画像フレームのジオメトリが、別のＧＰＵより多くてもよい。

５４０において、本方法は、第１のＧＰＵにおいてジオメトリ事前テストを行って、ジオメトリのピースが複数のスクリーン領域にどのように関係するかに対する情報を生成することを含む。詳細には、第１のＧＰＵは、ジオメトリのピース及びそれが複数のスクリーン領域のそれぞれにどのように関係するかに対する情報を生成する。たとえば、第１のＧＰＵによるジオメトリ事前テストは、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた特定のスクリーン領域とオーバーラップするか否かを判定してもよい。ジオメトリの第１のピースは、他のＧＰＵがオブジェクトレンダリングを行うレスポンシビリティを有するスクリーン領域とオーバーラップしてもよく、及び／または第１のＧＰＵがオブジェクトレンダリングを行うレスポンシビリティを有するスクリーン領域とオーバーラップしてもよい。一実施形態では、複数のＧＰＵのうちのいずれかがジオメトリのレンダリングを行う前に、第１のＧＰＵが行う対応するコマンドバッファ内のシェーダーがジオメトリテストを行う。他の実施形態では、ジオメトリテストを、たとえばグラフィックスパイプライン４００のラスタライゼーションステージ４２０において、ハードウェアによって行う。

ジオメトリ事前テストは通常、実施形態において、複数のＧＰＵにより、対応する画像フレームのすべてのジオメトリに対して同時に行われる。すなわち、各ＧＰＵは、対応する画像フレームのジオメトリのその部分に対してジオメトリ事前テストを実行する。このように、ＧＰＵがジオメトリ事前テストを行うことで、各ＧＰＵは、ジオメトリのどのピースをレンダリングするか、ジオメトリのどのピースをスキップするかを知ることができる。詳細には、対応するＧＰＵがジオメトリ事前テストを行うときに、対応するＧＰＵは、ジオメトリのその部分を、画像フレームをレンダリングするために用いる複数の各ＧＰＵのスクリーン領域に対してテストする。たとえば、４つのＧＰＵがある場合、特にジオメトリテストを目的として、ジオメトリがＧＰＵに均一に割り当てられる場合、各ＧＰＵは、画像フレームのジオメトリの４分の１上でジオメトリテストを実行してもよい。したがって、各ＧＰＵが、対応する画像フレームのジオメトリのその部分に対してのみジオメトリ事前テストを行っていても、ジオメトリ事前テストは通常、実施形態において、複数のＧＰＵにわたって画像フレームのすべてのジオメトリに対して同時に行われるため、生成された情報は、画像フレーム内のすべてのジオメトリ（たとえば、ジオメトリのピース）がすべてのＧＰＵのスクリーン領域にどのように関係するかを示す。スクリーン領域はそれぞれ、オブジェクトレンダリングのために対応するＧＰＵに割り当てられ、及び／またはレンダリングは、ジオメトリのピース（たとえば、オブジェクト全体またはオブジェクトの一部）に対して行ってもよい。

５５０において、本方法は、ジオメトリのピースをレンダリングするときに、複数のＧＰＵのそれぞれにおいて情報を用いることを含む（たとえば、ジオメトリのピースを完全にレンダリングすることまたはそのジオメトリのピースのレンダリングをスキップすることを含むために）。すなわち、複数のＧＰＵのそれぞれにおいて情報を用いてジオメトリのピースをレンダリングする。ジオメトリのテスト結果（たとえば、情報）を他のＧＰＵに送って、情報が各ＧＰＵに知られるようにする。たとえば、画像フレーム内のジオメトリ（たとえば、ジオメトリのピース）は通常、実施形態において、複数のＧＰＵによって同時にレンダリングされる。詳細には、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップするとき、ＧＰＵは、情報に基づいて、そのジオメトリのピースをレンダリングする。他方では、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられたどのスクリーン領域ともオーバーラップしないとき、ＧＰＵは、情報に基づいて、ジオメトリのそのピースのレンダリングをスキップすることができる。したがって、情報によって、すべてのＧＰＵは、画像フレーム内のジオメトリをより効率的にレンダリングすること、及び／またはそのジオメトリのレンダリングを完全に回避することができる。たとえば、レンダリングを、複数のＧＰＵによって実行されるように、対応するコマンドバッファ内のシェーダーによって行ってもよい。図７Ａ、１２Ａ、及び１３Ａにおいて以下でより十分に説明するように、シェーダーを、対応するＧＰＵ構成に基づいて、ジオメトリテスト及び／またはレンダリングの一方または両方を実行するように構成してもよい。

本開示の一実施形態により、いくつかのアーキテクチャでは、対応するレンダリングＧＰＵが、対応する情報をそれを用いるのに間に合って受け取った場合、ＧＰＵはその情報を、対応する画像内でどのジオメトリをレンダリングすべきかを決定するときに用いる。すなわち、情報はヒントとして取られ得る。そうでない場合には、レンダリングＧＰＵはジオメトリのピースを、通常行うように処理する。ジオメトリが、レンダリングＧＰＵ（たとえば、第２のＧＰＵ）に割り当てられた任意のスクリーン領域とオーバーラップするか否かを情報が示し得る例を用いて、ジオメトリのオーバーラップはないと情報が示す場合、レンダリングＧＰＵはジオメトリのレンダリングを完全にスキップしてもよい。また、ジオメトリのピースのみがオーバーラップしない場合、第２のＧＰＵは、少なくとも、オブジェクトレンダリングのために第２のＧＰＵに割り当てられたスクリーン領域のいずれともオーバーラップしないジオメトリのピースのレンダリングをスキップしてもよい。他方で、ジオメトリに対するオーバーラップがあると情報が示すことがあり、この場合、第２のまたはレンダリングＧＰＵはジオメトリをレンダリングする。また、ジオメトリの特定のピースが、オブジェクトレンダリングのために第２のまたはレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップすると、情報は示す場合がある。その場合、第２のまたはレンダリングＧＰＵは、オーバーラップするジオメトリのピースのみをレンダリングする。さらなる他の実施形態では、情報がない場合、または情報の生成もしくは受け取りが間に合わない場合、第２のＧＰＵはレンダリングを通常どおりに実行する（たとえば、ジオメトリをレンダリングする）。したがって、ヒントとして提供された情報は、間に合って受け取られた場合には、グラフィックス処理システムの全体的効率を増加させ得る。情報が間に合って受け取られなかった場合、グラフィックス処理システムは、このような情報がない場合でもやはり適切に動作する。

一実施形態では、あるＧＰＵ（たとえば、事前テストＧＰＵ）は、ジオメトリ事前テストを行って情報を生成する専用である。すなわち、専用のＧＰＵは、対応する画像フレーム内のオブジェクト（たとえば、ジオメトリのピース）のレンダリングには用いない。具体的には、前述したように、アプリケーションに対するグラフィックスを複数のＧＰＵを用いてレンダリングする。グラフィックスのジオメトリのレンダリングに対するレスポンシビリティを、複数のスクリーン領域（インターリーブされ得る）に基づいて複数のＧＰＵ間で分割する。各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。ジオメトリテストを、事前テストＧＰＵにおいて、アプリケーションによって生成された画像フレームのジオメトリの複数のピースに対して行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成する。ジオメトリの複数のピースを、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてレンダリングする。すなわち、画像フレームをレンダリングするために用いるＧＰＵからの対応するレンダリングＧＰＵによってジオメトリの各ピースをレンダリングするときに、情報を用いる。

図６Ａ～６Ｂに、純粋に説明を目的として、領域及びサブ領域に細分割されたスクリーンに対するレンダリングを示す。当然のことながら、細分割する領域及びサブ領域の数は、画像及び／または画像列の１つ以上の各画像の効率的なマルチＧＰＵ処理に対して選択可能である。すなわち、スクリーンを２つ以上の領域に細分割してもよく、各領域をさらにサブ領域に分割してもよい。本開示の一実施形態では、図６Ａに示すように、スクリーンを４つの四分円に細分割する。本開示の別の実施形態では、図６Ｂに示すように、スクリーンをより大きい数のインターリーブ領域に細分割する。以下の図６Ａ～６Ｂの説明は、複数のＧＰＵに割り当てられた複数のスクリーン領域にマルチＧＰＵレンダリングを行うときに生じる非効率を例示することを意図している。図７Ａ～７Ｃ及び図８Ａ～８Ｂは、本発明のいくつかの実施形態による、より効率的なレンダリングを示している。

詳細には、図６Ａは、マルチＧＰＵレンダリングを行うときに四分円（たとえば、４つの領域）に細分割されるスクリーン６１０Ａの図である。図示したように、スクリーン６１０Ａは４つの四分円（たとえば、Ａ、Ｂ、Ｃ、及びＤ）に細分割される。各四分円は、４つのＧＰＵ［ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ］のうちの１つに、１対１の関係で割り当てられる。たとえば、ＧＰＵ－Ａは四分円Ａに割り当てられ、ＧＰＵ－Ｂは四分円Ｂに割り当てられ、ＧＰＵ－Ｃは四分円Ｃに割り当てられ、ＧＰＵ－Ｄは四分円Ｄに割り当てられる。

ジオメトリをカリングすることができる。たとえば、ＣＰＵ１６３は、各四分円の錐台に対して境界ボックスをチェックすることができ、各ＧＰＵに、その対応する錐台とオーバーラップするオブジェクトのみをレンダリングするようにリクエストすることができる。その結果、各ＧＰＵは、ジオメトリの一部のみをレンダリングすることにレスポンシビリティを有する。説明の目的上、スクリーン６１０はジオメトリのピースを示し、各ピースは対応するオブジェクトであり、スクリーン６１０はオブジェクト６１１～６１７（たとえば、ジオメトリのピース）を示している。四分円Ａとオーバーラップするオブジェクトはないため、ＧＰＵ－Ａはオブジェクトをレンダリングしない。ＧＰＵ－Ｂは、オブジェクト６１５及び６１６をレンダリングする（オブジェクト６１５の一部は四分円Ｂ内に存在するため、ＣＰＵのカリングテストは、ＧＰＵ－Ｂはそれをレンダリングしなければならないと正しく結論する）。ＧＰＵ－Ｃは、オブジェクト６１１及び６１２をレンダリングする。ＧＰＵ－Ｄは、オブジェクト６１２、６１３、６１４、６１５、及び６１７をレンダリングする。

図６Ａにおいて、スクリーン６１０Ａが四分円Ａ～Ｄに分割されると、各ＧＰＵが実行しなければならない作業量は非常に異なり得る。なぜならば、場合によっては、不釣り合いな数量のジオメトリが１つの四分円の中にあり得るからである。たとえば、四分円Ａには何らジオメトリのピースはないが、四分円Ｄにはジオメトリの５つのピースまたはジオメトリの少なくとも５つのピースの少なくとも一部がある。したがって、四分円Ａに割り当てられたＧＰＵ－Ａは使われないが、四分円Ｄに割り当てられたＧＰＵ－Ｄは、対応する画像内でオブジェクトをレンダリングするときに不釣り合いにビジーである。

図６Ｂに、スクリーンを領域に細分割するときの別の手法を例示する。詳細には、単一画像または画像列内の１つ以上の各画像のマルチＧＰＵレンダリングを行うときに、四分円に細分割するのではなくて、スクリーン６１０Ｂを複数のインターリーブ領域に細分割する。その場合、スクリーン６１０Ｂを、より大きい数のインターリーブ領域に細分割し（たとえば、４つの四分円よりも多い）、一方で、同じ数量のＧＰＵをレンダリングのために用いる（たとえば、４つ）。スクリーン６１０Ａに示したオブジェクト（６１１～６１７）を、スクリーン６１０Ｂの同じ対応する場所にも示す。

詳細には、４つのＧＰＵ（たとえば、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）を用いて、対応するアプリケーションに対する画像をレンダリングする。ＧＰＵはそれぞれ、対応する領域とオーバーラップするジオメトリをレンダリングすることにレスポンシビリティを有する。すなわち、各ＧＰＵは対応する組の領域に割り当てられる。たとえば、ＧＰＵ－Ａは、対応する組においてＡとラベル付けされた領域のそれぞれにレスポンシビリティを有し、ＧＰＵ－Ｂは、対応する組においてＢとラベル付けされた領域のそれぞれにレスポンシビリティを有し、ＧＰＵ－Ｃは、対応する組においてＣとラベル付けされた領域のそれぞれにレスポンシビリティを有し、ＧＰＵ－Ｄは、対応する組においてＤとラベル付けされた領域のそれぞれにレスポンシビリティを有している。

さらに、領域は特定のパターンでインターリーブされている。領域をインターリーブする（及び領域の数がより多い）ために、各ＧＰＵが実行しなければならない作業量は、はるかにバランスされ得る。たとえば、スクリーン６１０Ｂをインターリーブするパターンには、交互に変わる行（たとえば、領域Ａ－Ｂ－Ａ－Ｂなど、及び領域Ｃ－Ｄ－Ｃ－Ｄなど）が含まれる。本開示の実施形態では、領域をインターリーブする他のパターンもサポートされる。たとえば、パターンには、反復配列の領域、均一に分布する領域、不均一に分布する領域、反復可能な行の配列の領域、ランダム配列の領域、ランダム行の配列の領域などが含まれていてもよい。

領域の数を選ぶことは重要である。たとえば、領域の分配が細かすぎる（たとえば、領域の数が多すぎて最適ではない）場合、各ＧＰＵはやはりジオメトリの大部分または全部を処理しなければならない。たとえば、ＧＰＵがレスポンシビリティを有するすべての領域に対してオブジェクトの境界ボックスをチェックすることは難しい場合がある。また、境界ボックスを適時にチェックできるとしても、領域サイズが小さいために、結果として、各ＧＰＵはほとんどのジオメトリを処理しなければならない可能性がある。なぜならば、画像内のすべてのオブジェクトが、各ＧＰＵの少なくとも１つの領域とオーバーラップするからである（たとえば、ＧＰＵは、オブジェクトの一部のみが、そのＧＰＵに割り当てられた領域の組内の少なくとも１つの領域とオーバーラップしたとしても、オブジェクト全体を処理する）。

その結果、領域の数を選ぶこと、インターリーブのパターンなどが重要である。少なすぎるかもしくは多すぎる領域を選ぶ、またはインターリーブに対して少なすぎる領域もしくは多すぎる領域を選ぶ、またはインターリーブに対して非効率なパターン選ぶと、ＧＰＵ処理を行うときの非効率につながり得る（たとえば、各ＧＰＵがジオメトリの大部分または全部を処理する）。このような場合、画像のレンダリングのために複数のＧＰＵがある場合でも、ＧＰＵの非効率のために、スクリーンピクセル数及びジオメトリ密度の両方における対応する増加をサポートすることはできない（すなわち、４つのＧＰＵが、４倍のピクセルを書き込むこと及び４倍の頂点またはプリミティブを処理することはできない）。以下の実施形態では、とりわけ、カリング方策（図７Ａ～７Ｃ）及びカリングの粒度（図８Ａ～８Ｂ）における改善を対象にする。

図７Ａ～７Ｃは、本開示の実施形態において、複数のＧＰＵを用いて、単一画像及び／または画像列内の少なくとも１つ以上の各画像をレンダリングすることを例示する図である。４つのＧＰＵの選択は単に、アプリケーションを実行しながら画像をレンダリングするときのマルチＧＰＵレンダリングを簡単に例示するために行っており、当然のことながら、種々の実施形態におけるマルチＧＰＵレンダリングのために任意の数のＧＰＵを用いてもよい。

詳細には、図７Ａは、本開示の一実施形態により、連携して単一画像フレームをレンダリングする複数のＧＰＵによって共有されるレンダリングコマンドバッファ７００Ａの図である。すなわち、本実施例では、複数のＧＰＵはそれぞれ、同じレンダリングコマンドバッファ（たとえば、バッファ７００Ａ）を使用し、ＧＰＵはそれぞれ、レンダリングコマンドバッファ内ですべてのコマンドを実行する。複数のコマンド（完全セット）が、レンダリングコマンドバッファ７００Ａ内にロードされて、対応する画像フレームをレンダリングするために用いられる。当然のことながら、対応する画像フレームを生成するために１つ以上のレンダリングコマンドバッファを用いてもよい。一例では、ＣＰＵは、画像フレームに対して１つ以上のドローコールを生成する。ドローコールには、対応する画像のマルチＧＰＵレンダリングを行うときに図３のＧＰＵリソース３６５のうちの１つ以上のＧＰＵによって実行されるように１つ以上のレンダリングコマンドバッファ内に配置されるコマンドが含まれる。いくつかの実施態様では、ＣＰＵ１６３は１つ以上のＧＰＵに、対応する画像をレンダリングするために用いるドローコールの全部または一部を生成するように要求してもよい。さらに、図７Ａに、レンダリングコマンドバッファ７００Ａ内に含まれるコマンドの全セットを示している場合があるか、または図７Ａに、レンダリングコマンドバッファ７００Ａ内に含まれるコマンドの全セットの一部を示している場合がある。

ＧＰＵは通常、実施形態において、画像または画像列内の１つ以上の各画像のマルチＧＰＵレンダリングを行うときに同時にレンダリングする。画像のレンダリングは複数のフェーズに分解することができる。各フェーズにおいて、ＧＰＵは同期させる必要があり、より速いＧＰＵが、より遅いＧＰＵの完了まで待機しなければならない。レンダリングコマンドバッファ７００Ａに対して図７Ａに示すコマンドは１つのフェーズを示している。図７Ａでは、たった１つのフェーズに対するコマンドを示しているが、レンダリングコマンドバッファ７００Ａは、画像をレンダリングするときに１つ以上のフェーズに対するコマンドを含んでいてもよい。図７Ａでは、すべてのコマンドの一部のみを示して、他のフェーズに対するコマンドは示していない。１つのフェーズを例示する図７Ａに示すレンダリングコマンドバッファ７００Ａのピースにおいて、レンダリングすべき４つのオブジェクトがある（たとえば、オブジェクト０、オブジェクト１、オブジェクト２、及びオブジェクト３）。これを図７Ｂ－１に示す。

図示するように、図７Ａに示すレンダリングコマンドバッファ７００Ａのピースは、ジオメトリテスト、オブジェクト（たとえば、ジオメトリのピース）のレンダリングに対するコマンド、及びレンダリングコマンドバッファ７００Ａからのコマンドを実行している１つ以上のレンダリングＧＰＵの状態を構成するためのコマンドを含む。単に説明の目的上、図７Ａに示すレンダリングコマンドバッファ７００Ａのピースは、ジオメトリ事前テスト、オブジェクトのレンダリング、及び／または対応するアプリケーションに対する対応する画像をレンダリングするときの同期型計算カーネルの実行のために用いるコマンド（７１０～７２８）を含む。いくつかの実施態様では、ジオメトリ事前テスト、及びその画像に対するオブジェクトのレンダリング、及び／または同期型計算カーネルの実行は、フレーム周期内に行わなければならない。レンダリングコマンドバッファ７００Ａ内に２つの処理セクションを示す。詳細には、処理セクション１は事前テストまたはジオメトリテスト７０１を含み、セクション２はレンダリング７０２を含む。

セクション１は、画像フレーム内のオブジェクトのジオメトリテスト７０１を行うことを含む。各オブジェクトは、ジオメトリの１つ以上のピースによって規定され得る。事前テストまたはジオメトリテスト７０１は、１つ以上のシェーダーによって行われ得る。たとえば、対応する画像フレームのマルチＧＰＵレンダリングにおいて用いる各ＧＰＵに、画像フレームのジオメトリの一部を割り当てて、ジオメトリテストを実行する。一実施形態では、事前テストのためにすべての部分を割り当ててもよい。割り当てた部分には、ジオメトリの１つ以上のピースが含まれていてもよい。各ピースは、オブジェクト全体を含んでいてもよいし、またはオブジェクトの一部（たとえば、頂点、プリミティブなど）を含んでいてもよい。詳細には、ジオメトリテストをジオメトリのピースに対して行って、ジオメトリのそのピースが複数のスクリーン領域のそれぞれにどのように関係するかについての情報を生成する。たとえば、ジオメトリテストは、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた特定のスクリーン領域とオーバーラップするか否かを判定してもよい。

図７Ａに示すように、セクション１のジオメトリテスト７０１（たとえば、ジオメトリの事前テスト）は、レンダリングコマンドバッファ７００Ａからのコマンドを実行する１つ以上のＧＰＵの状態を構成するためのコマンド、及びジオメトリテストを行うためのコマンドを含む。詳細には、各ＧＰＵのＧＰＵ状態は、ＧＰＵが、対応するオブジェクトに対してジオメトリテストを実行する前に構成する。たとえば、コマンド７１０、７１３、及び７１５はそれぞれ、ジオメトリテストに対するコマンドを実行する目的で１つ以上のＧＰＵのＧＰＵ状態を構成するために用いられる。図示したように、コマンド７１０は、ジオメトリテストコマンド７１１～７１２が適切に行えるようにＧＰＵ状態を構成する。コマンド７１１はオブジェクト０に対してジオメトリテストを実行し、コマンド７１２はオブジェクト１に対してジオメトリテストを実行する。同様に、コマンド７１３は、ジオメトリテストコマンド７１４がオブジェクト２に対してジオメトリテストを実行できるようにＧＰＵ状態を構成する。また、コマンド７１５は、ジオメトリテストコマンド７１６がオブジェクト３に対してジオメトリテストを実行できるようにＧＰＵ状態を構成する。当然のことながら、ＧＰＵ状態を１つ以上のジオメトリテストコマンド（たとえば、テストコマンド７１１及び７１２）に対して構成してもよい。

前述したように、ジオメトリテスト及び／またはオブジェクトのレンダリング及び／または対応する画像に対する同期型計算カーネルの実行に対して用いるレンダリングコマンドバッファ７００Ａ内のコマンドを実行するときに、レジスタに記憶された値は、対応するＧＰＵに対するハードウェアコンテキスト（たとえば、ＧＰＵ構成）を規定する。図示したように、ＧＰＵ状態は、レンダリングコマンドバッファ７００Ａ内のコマンドの処理の全体にわたって変更してもよい。コマンドの以後の各セクションを、ＧＰＵ状態を構成するために用いてもよい。図７Ａに適用されるように、ならびに明細書の全体にわたって、ＧＰＵ状態の設定に言及するときに、ＧＰＵ状態は種々の方法で設定してもよい。たとえば、ＣＰＵまたはＧＰＵはランダムアクセスメモリ（ＲＡＭ）内の値を設定することができる。ＧＰＵはＲＡＭ内の値をチェックする。別の例では、状態はＧＰＵの内部である可能性があり、これは、たとえば、コマンドバッファをサブルーチンとして２回呼び出して、内部のＧＰＵ状態が２つのサブルーチン呼び出しの間で異なるときである。

セクション２には、画像フレーム内のオブジェクトのレンダリング７０２を行うことが含まれる。ジオメトリのピースがレンダリングされる）。レンダリング７０２は、コマンドバッファ７００Ａ内の１つ以上のシェーダーによって行われ得る。図７Ａに示すように、セクション２のレンダリング７０２は、レンダリングコマンドバッファ７００Ａからのコマンドを実行する１つ以上のＧＰＵの状態を構成するためのコマンドと、レンダリングを行うためのコマンドとを含む。詳細には、ＧＰＵが、対応するオブジェクト（たとえば、ジオメトリのピース）をレンダリングする前に、各ＧＰＵのＧＰＵ状態が構成される。たとえば、コマンド７２１、７２３、７２５、及び７２７がそれぞれ、レンダリングに対するコマンドを実行する目的で１つ以上のＧＰＵのＧＰＵ状態を構成するために用いられる。図示したように、コマンド７２１は、レンダリングコマンド７２２がオブジェクト０をレンダリングできるように、ＧＰＵ状態を構成する。コマンド７２３は、レンダリングコマンド７２４がオブジェクト１をレンダリングできるように、ＧＰＵ状態を構成する。コマンド７２５は、レンダリングコマンド７２６がオブジェクト２をレンダリングできるように、ＧＰＵ状態を構成する。またコマンド７２７は、レンダリングコマンド７２８がオブジェクト３をレンダリングできるように、ＧＰＵ状態を構成する。図７Ａでは、ＧＰＵ状態が各レンダリングコマンド（たとえば、オブジェクト０をレンダリングする等）に対して構成されていると示しているが、当然のことながら、ＧＰＵ状態を１つ以上のレンダリングコマンドに対して構成してもよい。

前述したように、対応する画像フレームのマルチＧＰＵレンダリングにおいて用いる各ＧＰＵは、ジオメトリ事前テストの間に生成された情報に基づいてジオメトリの対応するピースをレンダリングする。具体的には、各ＧＰＵに知られた情報は、オブジェクトとスクリーン領域との間の関係を提供する。ジオメトリの対応するピースをレンダリングするときに、ＧＰＵは、それらのジオメトリのピースを効率的にレンダリングする目的で、その情報を適時に受け取った場合に用い得る。具体的には、情報が示すように、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域または領域（複数）とオーバーラップするときに、ＧＰＵはジオメトリのそのピースに対するレンダリングを実行する。他方では、第１のＧＰＵはジオメトリのピースのレンダリングを完全にスキップしなければならないと、情報は示すことがある（たとえば、ジオメトリのピースが、オブジェクトレンダリングを行うレスポンシビリティが第１のＧＰＵに割り当てられたどのスクリーン領域ともオーバーラップしない）。このように、各ＧＰＵは、それがオブジェクトレンダリングを行うレスポンシビリティを有するスクリーン領域または領域（複数）とオーバーラップするジオメトリのピースのみをレンダリングする。したがって、情報は各ＧＰＵに対するヒントとして提供され、情報は、レンダリングが始まる前に受け取られた場合に、ジオメトリのピースのレンダリングを行っている各ＧＰＵによって考慮される。一実施形態では、情報が間に合って受け取られなかった場合にはレンダリングは正常に進む。たとえば、ジオメトリの対応するピースが、オブジェクトレンダリングのためにＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップするか否かとは関わりなく、ジオメトリのそのピースは、対応するＧＰＵによって完全にレンダリングされる。

単に説明の目的上、４つのＧＰＵが、対応するスクリーンをそれらの間の領域に分割している。前述したように、各ＧＰＵは、領域の対応する組におけるオブジェクトをレンダリングするレスポンシビリティを有する。対応する組には１つ以上の領域が含まれる。一実施形態では、レンダリングコマンドバッファ７００Ａは、連携して単一画像をレンダリングする複数のＧＰＵによって共有される。すなわち、単一画像または画像列内の１つ以上の各画像のマルチＧＰＵレンダリングのために用いられるＧＰＵは、共通のコマンドバッファを共有する。別の実施形態では、各ＧＰＵはそれ自身のコマンドバッファを有していてもよい。

代替的に、さらなる他の実施形態では、ＧＰＵはそれぞれ、ある程度異なるオブジェクト組をレンダリングしていてもよい。特定のＧＰＵが特定のオブジェクトをレンダリングする必要がなく、なぜならば、それが、たとえば対応する組においてその対応するスクリーン領域とオーバーラップしないからであると判定できるときには、これは成り立ち得る。前述したように、コマンドをあるＧＰＵによって実行できるが、別のコマンドでは実行できないことをコマンドバッファがサポートする限り、複数のＧＰＵはやはり同じコマンドバッファを用いる（たとえば、１つのコマンドバッファを共有する）ことができる。たとえば、共有のレンダリングコマンドバッファ７００Ａ内のコマンドの実行を、レンダリングＧＰＵの１つに限定してもよい。これは種々の方法で達成することができる。別の例では、フラッグを対応するコマンド上で用いて、どのＧＰＵがそれを実行するべきかを示してもよい。また、どのＧＰＵがどの条件下で何をするかを示すビットを用いて、レンダリングコマンドバッファ内でプレディケーションを実行してもよい。プレディケーションの例としては、「これがＧＰＵ－Ａならば、次のＸコマンドをスキップする」が挙げられる。

さらなる他の実施形態では、実質的に同じ組のオブジェクトが各ＧＰＵによってレンダリングされているので、複数のＧＰＵはやはり同じコマンドバッファを用い得る。たとえば、前述したように、領域が比較的小さいときには、各ＧＰＵはオブジェクトをすべてレンダリングしてもよい。

図７Ｂ－１にスクリーン７００Ｂを例示する。スクリーン７００Ｂは、本開示の一実施形態により、図７Ａのレンダリングコマンドバッファ７００Ａを用いて複数のＧＰＵによってレンダリングされる４つのオブジェクトを含む画像を示す。本開示の一実施形態により、ジオメトリのマルチＧＰＵレンダリングは、画像フレーム内のオブジェクトに対応するジオメトリのピースをレンダリングする前に、スクリーン領域（インターリーブされ得る）に対してジオメトリを事前テストすることによってアプリケーションに対して行われる。

詳細には、ジオメトリのレンダリングに対するレスポンシビリティは、複数のＧＰＵ間のスクリーン領域によって分割される。複数のスクリーン領域は、複数のＧＰＵ間のレンダリング時間のアンバランスを減らすように構成されている。たとえば、スクリーン７００Ｂに、画像のオブジェクトをレンダリングするときの各ＧＰＵに対するスクリーン領域レスポンシビリティを示す。４つのＧＰＵ（ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）を、スクリーン７００Ｂに示す画像内のオブジェクトをレンダリングするために用いる。ＧＰＵ間でのピクセル及び頂点ロードのバランスを取るために、スクリーン７００Ｂを図６Ａに示す四分円よりも細かく分割する。加えて、スクリーン７００Ｂを、インターリーブされ得る領域に分割する。たとえば、インターリーブには複数行の領域が含まれる。行７３１及び７３３はそれぞれ、領域Ａが領域Ｂと交互に現れている。行７３２及び７３４はそれぞれ、領域Ｃが領域Ｄと交互に現れている。より詳細には、パターン内で、領域ＡとＢを含む行は、領域ＣとＤを含む行と交互に現れている。

前述したように、ＧＰＵ処理効率を達成するために、スクリーンを領域に分割するときに種々の技術を用いてもよい。たとえば、領域の数を増加または減少させる（たとえば、正確な領域量を選ぶために）、領域をインターリーブする、領域及び／またはサブ領域をインターリーブするときに特定のパターンをインターリーブして選択するために領域の数を増加または減少させる等である。一実施形態では、複数のスクリーン領域はそれぞれ、均一サイズである。一実施形態では、複数のスクリーン領域はそれぞれ、サイズが均一でない。さらなる他の実施形態では、複数のスクリーン領域の数及びサイジングは動的に変化する。

ＧＰＵはそれぞれ、対応する組の領域内のオブジェクトのレンダリングにレスポンシビリティを有する。各組には１つ以上の領域が含まれていてもよい。したがって、ＧＰＵ－Ａは、対応する組における各Ａ領域内のオブジェクトのレンダリングにレスポンシビリティを有し、ＧＰＵ－Ｂは、対応する組における各Ｂ領域内のオブジェクトのレンダリングにレスポンシビリティを有し、ＧＰＵ－Ｃは、対応する組における各Ｃ領域内のオブジェクトのレンダリングにレスポンシビリティを有し、ＧＰＵ－Ｄは、対応する組における各Ｄ領域内のオブジェクトのレンダリングにレスポンシビリティを有する。他のレスポンシビリティを有するＧＰＵがあってもよく、それらはレンダリングを行わないでもよい（たとえば、複数のフレーム周期にわたって実行される非同期型計算カーネルを行う、レンダリングＧＰＵに対するカリングを行う等）。

行うべきレンダリングの量はＧＰＵごとに異なる。図７Ｂ－２に、本開示の一実施形態により、図７Ｂ－１の４つのオブジェクトをレンダリングするときに各ＧＰＵが行うレンダリングを示す表を例示する。表に示したように、ジオメトリ事前テストの後に、オブジェクト０がＧＰＵ－Ｂによってレンダリングされていること、オブジェクト１がＧＰＵ－Ｃ及びＧＰＵ－Ｄによってレンダリングされていること、オブジェクト２がＧＰＵ－Ａ、ＧＰＵ－Ｂ、及びＧＰＵ－Ｄによってレンダリングされていること、ならびにオブジェクト３がＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄによってレンダリングされていることを判定してもよい。ＧＰＵＡは、オブジェクト２のみをレンダリングする必要があり、ＧＰＵＤは、オブジェクト１、２、及び３をレンダリングする必要があるため、さらにいくつかのアンバランスなレンダリングが存在し得る。しかし、全体として、スクリーン領域のインターリーブにより、画像内のオブジェクトのレンダリングは、画像のマルチＧＰＵレンダリングまたは画像列内の１つ以上の各画像のレンダリングのために用いる複数のＧＰＵ間で合理的にバランスされる。

図７Ｃは、本開示の一実施形態により、複数のＧＰＵが連携して単一画像フレーム（たとえば、図７Ｂ－１に示す画像フレーム７００Ｂ）をレンダリングするときに、各ＧＰＵが行う各オブジェクトのレンダリングを例示する図である。詳細には、図７Ｃに、図７Ａの共有のレンダリングコマンドバッファ７００Ａを用いて４つのＧＰＵそれぞれ（たとえば、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）が行うオブジェクト０～３のレンダリングプロセスを示す。

詳細には、２つのレンダリングタイミング図を時間軸７４０に対して示す。レンダリングタイミング図７００Ｃ－１は、レンダリングの１つのフェーズにおける対応する画像のオブジェクト０～３のマルチＧＰＵレンダリングを示す。ＧＰＵはそれぞれ、オブジェクト０～３とスクリーン領域との間のオーバーラップに関する何らの情報もない場合には、レンダリングを行う。レンダリングタイミング図７００Ｃ－２は、レンダリングの同じフェーズにおける対応する画像のオブジェクト０～３のマルチＧＰＵレンダリングを示す。スクリーン領域のジオメトリテスト（たとえば、レンダリングの前に行われる）の間に生成された情報は、各ＧＰＵによって共有されて、対応するＧＰＵパイプラインを通してオブジェクト０～３をレンダリングするために用いられる。レンダリングタイミング図７００Ｃ－１及び７００Ｃ－２はそれぞれ、ジオメトリの各ピースを処理する（たとえば、ジオメトリテスト及びレンダリングを実行する）ために各ＧＰＵが要する時間を示す。一実施形態では、ジオメトリのピースはオブジェクト全体である。別の実施形態では、ジオメトリのピースはオブジェクトの一部であってもよい。説明の目的上、図７Ｃの例はジオメトリのピースのレンダリングを示す。ジオメトリの各ピースはオブジェクトに対応する（たとえば、その全体において）。レンダリングタイミング図７００Ｃ－１及び７００Ｃ－２のそれぞれにおいて、対応するＧＰＵの少なくとも１つのスクリーン領域（たとえば、対応する組の領域内で）とオーバーラップするジオメトリ（たとえば、オブジェクトのプリミティブ）がないオブジェクト（たとえば、ジオメトリのピース）を、破線で描いたボックスで表している。他方で、対応するＧＰＵの少なくとも１つのスクリーン領域（たとえば、対応する組の領域内で）とオーバーラップするジオメトリを有するオブジェクトを、実線で描いたボックスで表している。

レンダリングタイミング図７００Ｃ－１は、４つのＧＰＵ（たとえばＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）を用いたオブジェクト０～３のレンダリングを示す。レンダリングタイミング図７００Ｃ－１において、垂直線７５５ａはオブジェクトに対するレンダリングのフェーズの開始を示し、垂直線７５５ｂはオブジェクトに対するレンダリングのフェーズの終了を示している。図示したレンダリングのフェーズに対する時間軸７４０に沿った開始点と終了点は、同期点を表している。４つのＧＰＵはそれぞれ、対応するＧＰＵパイプラインを実行するときに同期されている。たとえば、レンダリングのフェーズの終了を示す垂直線７５５ｂにおいて、すべてのＧＰＵは、レンダリングの次のフェーズに移動する前に、最も遅いＧＰＵ（たとえば、ＧＰＵ－Ｂ）が、対応するグラフィックスパイプラインを通してオブジェクト０～３のレンダリングを終えるのを待たなければならない。

レンダリングタイミング図７００Ｃ－１において、ジオメトリ事前テストは行われていない。したがって、各ＧＰＵは、対応するグラフィックスパイプラインを通して各オブジェクトを処理しなければならない。オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意の領域（たとえば、対応する組内で）においてオブジェクトに対して描くべきピクセルがない場合、ＧＰＵはグラフィックスパイプラインを通してオブジェクトを完全にはレンダリングしない場合がある。たとえば、オブジェクトがオーバーラップしないとき、グラフィックスパイプラインのジオメトリ処理ステージのみが実行される。しかし、これはやはり処理に多少の時間がかかる。

詳細には、ＧＰＵ－Ａはオブジェクト０、１、及び３を完全にはレンダリングしない。なぜならば、それらが、オブジェクトレンダリングのためにＧＰＵ－Ａに割り当てられた任意のスクリーン領域（たとえば、対応する組における）のいずれともオーバーラップしないからである。これら３つのオブジェクトのレンダリングを、破線を伴うボックス内に示す。これは、少なくともジオメトリ処理ステージは行われているが、グラフィックスパイプラインは完全には行われていないことを示している。ＧＰＵ－Ａはオブジェクト２を完全にレンダリングする。なぜならば、そのオブジェクトは、レンダリングのためにＧＰＵ－Ａに割り当てられた少なくとも１つのスクリーン領域とオーバーラップするからである。オブジェクト２のレンダリングを、実線を伴うボックス内に示す。これは、対応するグラフィックスパイプラインのすべてのステージが行われることを示している。同様に、ＧＰＵ－Ｂはオブジェクト１（破線を伴うボックスで示す）を完全にはレンダリングしない（すなわち、少なくともジオメトリ処理ステージを行う）が、オブジェクト０、２、及び３（実線を伴うボックスで示す）を完全にレンダリングする。なぜならば、これらのオブジェクトは、レンダリングのためにＧＰＵ－Ｂに割り当てられた少なくとも１つのスクリーン領域（たとえば、対応する組における）とオーバーラップするからである。また、ＧＰＵ－Ｃはオブジェクト０及び２（破線を伴うボックスで示す）を完全にはレンダリングしない（すなわち、少なくともジオメトリ処理ステージを行う）が、オブジェクト（実線を伴うボックスで示す）を完全にレンダリングする。なぜならば、これらのオブジェクトは、レンダリングのためにＧＰＵ－Ｃに割り当てられた少なくとも１つのスクリーン領域（たとえば、対応する組における）とオーバーラップするからである。さらに、ＧＰＵ－Ｄはオブジェクト０（破線を伴うボックスで示す）を完全にはレンダリングしない（すなわち、少なくともジオメトリ処理ステージを行う）が、オブジェクト１、２、及び３（実線を伴うボックスで示す）を完全にレンダリングする。なぜならば、これらのオブジェクトは、レンダリングのためにＧＰＵ－Ｄに割り当てられた少なくとも１つのスクリーン領域（たとえば、対応する組における）とオーバーラップするからである。

レンダリングタイミング図７００Ｃ－２は、複数のＧＰＵを用いるオブジェクト０～３のジオメトリ事前テスト７０１’とレンダリング７０２’とを示す。レンダリングタイミング図７００Ｃ－２において、垂直線７５０ａは、オブジェクトに対するレンダリングのフェーズ（たとえば、ジオメトリ事前テスト及びレンダリングを含む）の開始を示し、垂直線７５０ｂは、オブジェクトに対するレンダリングのフェーズの終了を示す。タイミング図７００Ｃ－２に示すレンダリングのフェーズに対する時間軸７４０に沿った開始点及び終了点は、同期点を表す。前述したように、４つのＧＰＵはそれぞれ、対応するＧＰＵパイプラインを実行するときに同期される。たとえば、レンダリングのフェーズの終了を示す垂直線７５０ｂにおいて、すべてのＧＰＵは、次のレンダリングフェーズに移動する前に、対応するグラフィックスパイプラインを通してオブジェクト０～３のレンダリングを終了するために、最も遅いＧＰＵ（たとえば、ＧＰＵ－Ｂ）を待たなければならない。

最初に、ジオメトリ事前テスト７０１’をＧＰＵが行う。各ＧＰＵは、画像フレームのジオメトリのサブ組に対するジオメトリ事前テストを、すべてのスクリーン領域に対して実行する。各スクリーン領域は、オブジェクトレンダリングのために対応するＧＰＵに割り当てられている。前述したように、ＧＰＵはそれぞれ、画像フレームに対応付けられるジオメトリの対応部分に割り当てられている。ジオメトリ事前テストは、ジオメトリの特定のピースがスクリーン領域のそれぞれにどのように関係するか（たとえば、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするか否か）についての情報を生成する。この情報は、画像フレームをレンダリングするために用いる各ＧＰＵによって共有される。たとえば、図７Ｃに示す７０１’ジオメトリ事前テストには、ＧＰＵ－Ａにオブジェクト０に対するジオメトリ事前テストを実行させること、ＧＰＵ－Ｂにオブジェクト１に対するジオメトリ事前テストを実行させること、ＧＰＵ－Ｃにオブジェクト２に対するジオメトリ事前テストを実行させること、及びＧＰＵ－Ｄにオブジェクト３に対するジオメトリ事前テストを実行させることが含まれる。テストしているオブジェクトに応じて、ジオメトリ事前テストを行うための時間は変わり得る。たとえば、オブジェクト０のジオメトリ事前テストにかかる時間は、オブジェクト１に対してジオメトリ事前テストを実行する場合よりも短い。これは、オブジェクトサイジング、オーバーラップするスクリーン領域の数などに起因する場合がある。

ジオメトリ事前テストの後で、各ＧＰＵは、そのスクリーン領域と交差するジオメトリのすべてのオブジェクトまたはピースに対してレンダリングを実行する。一実施形態では、各ＧＰＵは、ジオメトリテストが終了したらすぐに、ジオメトリのそのピースのレンダリングを始める。すなわち、ジオメトリテストとレンダリングとの間に同期点はない。これは可能である。なぜならば、生成されているジオメトリテスト情報は、ハード依存ではなくてヒントとして処置されるからである。たとえば、ＧＰＵ－Ａがオブジェクト２のレンダリングを始めるのは、ＧＰＵ－Ｂがオブジェクト１のジオメトリ事前テストを終了する前、したがってＧＰＵ－Ｂがオブジェクト０、２、及び３のレンダリングを始める前である。

垂直線７５０ａは垂直線７５５ａと位置合わせされていて、レンダリングタイミング図７００Ｃ－１及び７００Ｃ－２がそれぞれ同時に始まって、オブジェクト０～１をレンダリングするようになっている。しかし、レンダリングタイミング図７００Ｃ－２に示すオブジェクト０～３のレンダリングは、レンダリングタイミング図７００Ｃ－１に示すレンダリングよりも短い時間で行われる。すなわち、下部のタイミング図７００Ｃ－２に対するレンダリングのフェーズの終了を示す垂直線７５０ｂは、垂直線７５５ｂによって示される上部のタイミング図７００Ｃ－１に対するレンダリングのフェーズの終了よりも早く現れる。具体的には、アプリケーションに対する画像のジオメトリのマルチＧＰＵレンダリング（レンダリング前のスクリーン領域に対するジオメトリの事前テストを含む）を行って、ジオメトリ事前テストの結果を情報（たとえば、ヒント）として提供するときに、オブジェクト０～３をレンダリングするときの速度増加７４５が実現される。図示したように、速度増加７４５は、タイミング図７００Ｃ－２の垂直線７５０ｂとタイミング図７００Ｃ－１の垂直線７５５ｂとの間の時間差である。

速度増加は、ジオメトリ事前テストの間に生成された情報の生成及び共有を通して実現される。たとえば、ジオメトリ事前テストの間に、ＧＰＵ－Ａは、オブジェクト０をＧＰＵ－Ｂでレンダリングするだけでよいことを示す情報を生成する。したがって、ＧＰＵ－Ｂにはオブジェクト０をレンダリングすべきであることが通知され、他のＧＰＵ（たとえばＧＰＵ－Ａ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）は、オブジェクト０のレンダリングを完全にスキップし得る。なぜならば、オブジェクト０は、オブジェクトレンダリングのためにこれらのＧＰＵに割り当てられたどの領域（たとえば、対応する組における）ともオーバーラップしないからである。たとえば、これらのＧＰＵはジオメトリ処理ステージを実行する必要はないが、一方で、タイミング図７００Ｃ－１に示すように、これらのＧＰＵがオブジェクト０を完全にはレンダリングしない場合でも、ジオメトリ事前テストなしでこの段階は処理された。また、ジオメトリ事前テストの間に、ＧＰＵ－Ｂは、オブジェクト１はＧＰＵ－Ｃ及びＧＰＵ－Ｄがレンダリングすべきであり、ＧＰＵ－Ａ及びＧＰＵ－Ｂはオブジェクト１のレンダリングを完全にスキップしてもよいことを示す情報を生成する。これは、なぜならば、オブジェクト１は、オブジェクトレンダリングのためにＧＰＵ－ＡまたはＧＰＵ－Ｂに割り当てられたどの領域（たとえば、個々の対応する組における）ともオーバーラップしないからである。また、ジオメトリ事前テストの間に、ＧＰＵ－Ｃは、オブジェクト２が、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、及びＧＰＵ－Ｄによってレンダリングされるべきであり、ＧＰＵ－Ｃはオブジェクト２のレンダリングを完全にスキップしてもよいことを示す情報を生成する。これは、なぜならば、オブジェクト２は、オブジェクトレンダリングのためにＧＰＵ－Ｃに割り当てられたどの領域（たとえば、対応する組における）ともオーバーラップしないからである。さらに、ジオメトリ事前テストの間に、ＧＰＵ－Ｄは、オブジェクト３が、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄによってレンダリングされるべきであり、ＧＰＵ－Ａはオブジェクト３のレンダリングを完全にスキップしてもよいことを示す情報を生成する。これは、なぜならば、オブジェクト３は、オブジェクトレンダリングのためにＧＰＵ－Ａに割り当てられたどの領域（たとえば、対応する組における）ともオーバーラップしないからである。

ジオメトリ事前テストから生成された情報はＧＰＵ間で共有されるため、各ＧＰＵは、どのオブジェクトをレンダリングするかを決定することができる。したがって、ジオメトリ事前テストを行って、テストからの結果がすべてのＧＰＵによって共有された後で、各ＧＰＵは、ジオメトリのどのオブジェクトまたはピースを、対応するＧＰＵがレンダリングする必要があるかに対する情報を有する。たとえば、ＧＰＵ－Ａはオブジェクト２をレンダリングし、ＧＰＵ－Ｂはオブジェクト０、２、及び３をレンダリングし、ＧＰＵ－Ｃはオブジェクト１及び３をレンダリングし、ならびにＧＰＵ－Ｄはオブジェクト１、２、及び３をレンダリングする。

詳細には、ＧＰＵＡはオブジェクト１に対するジオメトリ処理を実行して、オブジェクト１はＧＰＵ－Ｂがスキップできると判定する。なぜならば、オブジェクト１は、オブジェクトレンダリングのためにＧＰＵ－Ｂに割り当てられたどの領域（たとえば、対応する組における）ともオーバーラップしないからである。加えて、オブジェクト１は、ＧＰＵ－Ａによって完全にはレンダリングされない。なぜならば、オブジェクト１は、オブジェクトレンダリングのためにＧＰＵ－Ａに割り当てられたどの領域（たとえば、対応する組における）ともオーバーラップしないからである。オブジェクト１はＧＰＵ－Ｂに割り当てられたどの領域ともオーバーラップしないという判定は、ＧＰＵ－Ｂがオブジェクト１に対するジオメトリ処理を始める前になされるため、ＧＰＵ－Ｂはオブジェクト１のレンダリングをスキップする。

図８Ａ～８Ｂに、スクリーン領域８２０Ａ及び８２０Ｂに対するオブジェクトテストを示す。スクリーン領域はインターリーブされていてもよい（たとえば、スクリーン領域８２０Ａ及び８２０Ｂはディスプレイの一部を示す）。詳細には、オブジェクトのマルチＧＰＵレンダリングを単一画像フレームまたは画像フレーム列内の１つ以上の各画像フレームに対して、スクリーン内のオブジェクトをレンダリングする前にジオメトリテストを実行することによって行う。図示したように、ＧＰＵ－Ａには、スクリーン領域８２０Ａ内のオブジェクトをレンダリングするレスポンシビリティが割り当てられる。ＧＰＵ－Ｂには、スクリーン領域８２０Ｂ内のオブジェクトをレンダリングするレスポンシビリティが割り当てられる。「ジオメトリのピース」に対する情報が生成される。ジオメトリのピースは、オブジェクト全体またはオブジェクトの一部とすることができる。たとえば、ジオメトリのピースは、オブジェクト８１０またはオブジェクト８１０の一部とすることができる。

図８Ａは、本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするときのスクリーン領域に対するオブジェクトテストを例示する図である。前述したように、ジオメトリのピースはオブジェクトとすることができ、ピースは、対応するドローコールが使用または生成するジオメトリに対応する。ジオメトリ事前テストの間に、オブジェクト８１０は領域８２０Ａとオーバーラップすると判定され得る。すなわち、オブジェクト８１０の部分８１０Ａは領域８２０Ａとオーバーラップする。その場合、ＧＰＵ－Ａにはオブジェクト８１０をレンダリングすることが課される。また、ジオメトリ事前テストの間に、オブジェクト８１０は領域８２０Ｂとオーバーラップすると判定され得る。すなわち、オブジェクト８１０の部分８１０Ｂは領域８２０Ｂとオーバーラップする。その場合、ＧＰＵ－Ｂにもオブジェクト８１０をレンダリングすることが課される。

図８Ｂは、本開示の一実施形態により、複数のＧＰＵが連携して単一画像フレームをレンダリングするときのスクリーン領域及び／またはスクリーンサブ領域に対するオブジェクトの一部のテストを例示する図である。すなわち、ジオメトリのピースをオブジェクトの一部とすることができる。たとえば、オブジェクト８１０をピースに分割してもよく、ドローコールが使用または生成するジオメトリはジオメトリのより小さいピースに細分割される。一実施形態では、ジオメトリのピースはそれぞれ大まかに、位置キャッシュ及び／またはパラメータキャッシュが割り当てられるサイズである。その場合、ジオメトリテストに間にジオメトリのそれらのより小さいピースに対して、情報（たとえば、ヒントまたはヒント（複数））が生成される。前述したように、情報はレンダリングＧＰＵによって用いられる。

たとえば、オブジェクト８１０はより小さいオブジェクトに分割される。領域テストのために用いるジオメトリのピースは、これらのより小さいオブジェクトに対応する。図示したように、オブジェクト８１０は、ジオメトリのピース「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｅ」、及び「ｆ」に分割される。ジオメトリ事前テストの後に、ＧＰＵ－Ａは、ジオメトリのピース「ａ」、「ｂ」、「ｃ」、「ｄ」、及び「ｅ」のみをレンダリングする。すなわち、ＧＰＵ－Ａは、ジオメトリのピース「ｆ」のレンダリングをスキップすることができる。また、ジオメトリ事前テストの後に、ＧＰＵ－Ｂは、ジオメトリのピース「ｄ」、「ｅ」、及び「ｆ」のみをレンダリングする。すなわち、ＧＰＵ－Ｂは、ジオメトリのピース「ａ」、「ｂ」、及び「ｃ」のレンダリングをスキップすることができる。

一実施形態では、ジオメトリ処理ステージは頂点処理及びプリミティブ処理の両方を行うように構成されているため、ジオメトリ処理ステージにおいてシェーダーを用いてジオメトリのピースに対してジオメトリ事前テストを行うことができる。たとえば、ジオメトリ処理ステージは、ＧＰＵスクリーン領域に対してジオメトリに対する境界錐台をテストすること（ソフトウェアシェーダー動作によって行われ得る）などによって、情報（たとえば、ヒント）を生成する。一実施形態では、このテストは、ハードウェアを通して実施される専用命令または命令（複数）を用いることを通して加速され、その結果、ソフトウェア／ハードウェア解決策が実施される。すなわち、専用命令または命令（複数）を用いて、ジオメトリのピースとスクリーン領域に対するその関係とに関する情報の生成を加速する。たとえば、ジオメトリのピースのプリミティブの頂点の同次座標が、ジオメトリ処理ステージにおけるジオメトリ事前テストに対する命令への入力として提供される。テストによって、各ＧＰＵに対して、プリミティブが、オブジェクトレンダリングのためにそのＧＰＵに対して割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするか否かを示すブール戻り値を、生成してもよい。したがって、対応するジオメトリピースとスクリーン領域に対するその関係とに関してジオメトリ事前テストの間に生成される情報（たとえば、ヒント）が、ジオメトリ処理ステージにおけるシェーダーによって生成される。

別の実施形態では、ジオメトリのピースに対するジオメトリ事前テストを、ハードウェアラスタライゼーションステージにおいて行うことができる。たとえば、ハードウェアスキャンコンバータを、ジオメトリ事前テストを実行するように構成して、スキャンコンバータが、対応する画像フレームのオブジェクトレンダリングのために複数のＧＰＵに割り当てられたすべてのスクリーン領域に関する情報を生成するようにしてもよい。

さらなる他の実施形態では、ジオメトリのピースはプリミティブとすることができる。すなわち、ジオメトリ事前テストのために用いるオブジェクトの一部はプリミティブであってもよい。したがって、あるＧＰＵがジオメトリ事前テストの間に生成した情報（たとえばヒント）は、個々の三角形（たとえば、プリミティブを表す）を別のレンダリングＧＰＵがレンダリングする必要があるか否かを示す。

一実施形態では、ジオメトリ事前テストの間に生成され、レンダリングのために用いるＧＰＵによって共有される情報には、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするプリミティブの数（たとえば、残存しているプリミティブ数）が含まれる。また情報には、これらのプリミティブを構築または規定するために用いられる頂点の数が含まれていてもよい。すなわち、情報には残存している頂点数が含まれる。したがって、レンダリングするとき、対応するレンダリングＧＰＵは、供給された頂点数を用いて位置キャッシュ及びパラメータキャッシュにスペースを割り当ててもよい。たとえば、一実施形態では、必要でない頂点に割り当てられるスペースはないため、レンダリングの効率が増加し得る。

他の実施形態では、ジオメトリ事前テストの間に生成される情報（たとえばヒント）には、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップする特定のプリミティブ（たとえば、完全一致として残存しているプリミティブ）が含まれる。すなわち、レンダリングＧＰＵに対して生成される情報には、レンダリングのために特定の組のプリミティブが含まれる。また情報には、これらのプリミティブを構築または規定するために用いられる特定の頂点が含まれていてもよい。すなわち、レンダリングＧＰＵに対して生成される情報には、レンダリングのために特定の組の頂点が含まれる。この情報によって、たとえば、ジオメトリのピースをレンダリングするときのそのジオメトリ処理ステージ中に他のレンダリングＧＰＵ時間が節約され得る。

さらに他の実施形態では、ジオメトリテスト中の情報の生成に対応付けられる処理オーバーヘッド（ソフトウェアまたはハードウェアのいずれか）があり得る。その場合、ジオメトリの特定のピースに対しては情報の生成をスキップすることが有用であり得る。すなわち、ヒントとして提供される情報は、特定のオブジェクトに対しては生成されるが、他に対しては生成されない。たとえば、スカイボックスまたは大きな地形ピースを表すジオメトリのピース（たとえば、オブジェクトまたはオブジェクトのピース）には、大きな三角形が含まれていてもよい。その場合、画像フレームまたは画像フレーム列内の１つ以上の各画像フレームのマルチＧＰＵレンダリングのために用いる各ＧＰＵが、ジオメトリのこれらのピースをレンダリングする必要があるという可能性がある。すなわち、対応するジオメトリのピースの特性に応じて、情報を生成してもよいし生成しなくてもよい。

図９Ａ～９Ｃに、本開示の一実施形態により、複数のＧＰＵが連携して単一画像をレンダリングするときにスクリーン領域を対応するＧＰＵに割り当てるための種々の方策を例示する。ＧＰＵ処理効率を達成するために、スクリーンを領域に分割するときに種々の技術を用いてもよい。たとえば、領域の数を増加または減少させる（たとえば、正確な領域量を選択するために）、領域をインターリーブする、領域をインターリーブするときに特定のパターンをインターリーブして選択するために領域の数を増加または減少させる等である。たとえば、複数のＧＰＵは、アプリケーションよって生成された画像フレームに対するジオメトリのマルチＧＰＵレンダリングを、対応する画像内のオブジェクトをレンダリングする前にインターリーブされたスクリーン領域に対してジオメトリの事前テストを行うことによって実行するように構成されている。図９Ａ～９Ｃのスクリーン領域の構成は、複数のＧＰＵ間のレンダリング時間のわずかなアンバランスも減らすようにデザインされている。テストの複雑さ（たとえば、対応するスクリーン領域にオーバーラップする）は、スクリーン領域がＧＰＵにどのように割り当てられたかに応じて変化する。図９Ａ～９Ｃに示す図に示すように、太字のボックス９１０は、画像をレンダリングするときに用いる対応するスクリーンまたはディスプレイのアウトラインである。

一実施形態では、複数のスクリーン領域または複数の領域はそれぞれ、均一サイズである。一実施形態では、複数のスクリーン領域はそれぞれ、サイズが均一でない。さらなる他の実施形態では、複数のスクリーン領域におけるスクリーン領域の数及びサイジングは動的に変化する。

詳細には、図９Ａに、スクリーン９１０に対する簡単なパターン９００Ａを例示する。スクリーン領域はそれぞれ、均一サイズである。たとえば、各領域のサイズは、２ピクセルの累乗である寸法の矩形であってもよい。たとえば、各領域はサイズが２５６×２５６ピクセルであってもよい。図示するように、領域割り当てはチェックボードパターンであり、Ａ及びＢ領域のある行がＢ及びＣ領域の別の行と交互になっている。パターン９００Ａは、ジオメトリ事前テストの間に容易にテストされ得る。しかし、いくつかのレンダリング非効率さが存在し得る。たとえば、各ＧＰＵに割り当てられたスクリーン面積は実質的に異なっている（すなわち、スクリーン９１０内でスクリーン領域Ｃ及び領域Ｄに対するカバレージの方が小さい）。そのため、各ＧＰＵに対するレンダリング時間のアンバランスにつながり得る。

図９Ｂに、スクリーン９１０に対するスクリーン領域のパターン９００Ｂを例示する。スクリーンまたはサブ領域はそれぞれ、均一サイズである。スクリーン領域は、ＧＰＵ間のレンダリング時間のアンバランスを減らすように割り当てられて分配されている。たとえば、パターン９００ＢでＧＰＵをスクリーン領域に割り当てると、スクリーン９１０にわたって各ＧＰＵに割り当てられるスクリーンピクセルの数量がほぼ等しくなる。すなわち、スクリーン９１０内のスクリーン面積またはカバレージが等しくなるように、スクリーン領域はＧＰＵに割り当てられている。たとえば、各領域が２５６×２５６ピクセルのサイズであり得る場合、スクリーン９１０内での各領域のカバレージはほぼ同じである。詳細には、スクリーン領域Ａの組は、６×２５６×２５６ピクセルのサイズの面積をカバーし、スクリーン領域Ｂの組は、５．７５×２５６×２５６ピクセルのサイズの面積をカバーし、スクリーン領域Ｃの組は、５．５×２５６×２５６ピクセルのサイズの面積をカバーし、スクリーン領域Ｄの組は、５．５×２５６×２５６ピクセルのサイズの面積をカバーする。

図９Ｃに、スクリーン９１０に対するスクリーン領域のパターン９００Ｃを例示する。スクリーン領域はそれぞれ、サイズが均一でない。すなわち、ＧＰＵにオブジェクトをレンダリングするレスポンシビリティが割り当てられたスクリーン領域は、サイズが均一でない場合がある。詳細には、各ＧＰＵが同一数のピクセルに割り当てられるようにスクリーン９１０は分割されている。たとえば、４Ｋディスプレイ（３８４０×２１６０）を垂直方向に４つの領域に等しく分割した場合、各領域は高さが５２０ピクセルになる。しかし、通常、ＧＰＵは３２×３２ブロックのピクセルにおいて多くの動作を行い、５２０ピクセルは３２ピクセルの倍数ではない。したがって、一実施形態では、パターン９００Ｃには、高さが５１２ピクセル（３２の倍数）のブロックと、高さが５４４ピクセル（やはり３２の倍数）の他のブロックとが含まれていてもよい。他の実施形態では、異なるサイズのブロックを用いてもよい。パターン９００Ｃは、不均一のスクリーン領域を用いることによって等しい数量のスクリーンピクセルが各ＧＰＵに割り当てられている様子を示している。

さらなる他の実施形態では、画像のレンダリングを行うときのアプリケーションのニーズが時間とともに変化し、スクリーン領域が動的に選択される。たとえば、レンダリング時間のほとんどがスクリーンの下半分上で費やされることが分かっている場合、ディスプレイの下半分におけるほぼ等しい数量のスクリーンピクセルが、対応する画像をレンダリングするために用いる各ＧＰＵに割り当てられるように、領域を割り当てることが好都合である。すなわち、対応する画像をレンダリングするために用いる各ＧＰＵに割り当てる領域を動的に変えてもよい。たとえば、ゲームモード、異なるゲーム、スクリーンのサイズ、領域に対して選択されるパターンなどに基づいて、変更を適用してもよい。

図１０は、本開示の一実施形態により、ジオメトリ事前テストを行う目的で、ジオメトリのピースに対するＧＰＵの割り当ての種々の分配を例示する図である。すなわち、図１０は、複数のＧＰＵ間でジオメトリ事前テストを行う間に情報を生成するためのレスポンシビリティの分配を示す。前述したように、各ＧＰＵは、画像フレームのジオメトリの対応部分に割り当てられる。その部分はさらに、オブジェクト、オブジェクトの一部、ジオメトリ、ジオメトリのピースなどに分割され得る。ジオメトリ事前テストには、ジオメトリの特定のピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域またはスクリーン領域（複数）とオーバーラップするか否かを判定することが含まれる。ジオメトリ事前テストは通常、実施形態において、対応する画像フレームのすべてのジオメトリ（たとえば、ジオメトリのすべてのピース）に対して、ＧＰＵによって同時に行われる。このように、ジオメトリテストは、ＧＰＵによって連携的に行われ、これによって、前述したように、各ＧＰＵは、ジオメトリのどのピースをレンダリングするか、ジオメトリのどのピースのレンダリングをスキップするかを知ることができる。

図１０に示すように、ジオメトリの各ピースはオブジェクト、オブジェクトの一部などであり得る。たとえば、前述したように、ジオメトリのピースは、オブジェクトの一部（たとえば、大よそ、位置及び／またはパラメータキャッシュが割り当てられるサイズであるピース）であり得る。純粋に説明用に、オブジェクト０（たとえば、レンダリングコマンドバッファ７００Ａ内のコマンド７２２によってレンダリングされると指定されている）を、ピース「ａ」、「ｂ」、「ｃ」、「ｄ」、「ｅ」、及び「ｆ」（たとえば、図８Ｂにおけるオブジェクト８１０）に分割する。また、オブジェクト１（たとえばレンダリングコマンドバッファ７００Ａ内のコマンド７２４によってレンダリングされると指定されている）を、ピース「ｇ」、「ｈ」、及び「ｉ」に分割する。さらに、オブジェクト２（たとえばレンダリングコマンドバッファ７００Ａ内のコマンド７２４によってレンダリングされると指定されている）を、ピース「ｊ」、「ｋ」、「ｌ」、「ｍ」、「ｎ」、及び「ｏ」に分割する。ジオメトリテストに対するレスポンシビリティをＧＰＵに分配する目的で、ピースを順序付けしてもよい（たとえば、ａ～ｏ）。

分配１０１０（たとえば、ＡＢＣＤＡＢＣＤＡＢＣＤ．．．行）は、ジオメトリテストに対するレスポンシビリティの、複数のＧＰＵ間での均一分配を示す。詳細には、あるＧＰＵに、ジオメトリの第１の４分の１を取らせて（たとえば、ブロックにおいて、たとえばＧＰＵＡは、ジオメトリテストのために「ａ」、「ｂ」、「ｃ」、及び「ｄ」を含む全体でほぼ１６のピースのうちの第１の４つのピースを取る）、第２のＧＰＵに第２の４分の１を取らせる等ではなく、ＧＰＵに対する割り当てをインターリーブする。すなわち、ジオメトリの連続的なピースが、異なるＧＰＵに割り当てられる。たとえば、ピース「ａ」はＧＰＵ－Ａに割り当てられ、ピース「ｂ」はＧＰＵ－Ｂに割り当てられ、ピース「ｃ」はＧＰＵ－Ｃに割り当てられ、ピース「ｄ」はＧＰＵ－Ｄに割り当てられ、ピース「ｅ」はＧＰＵ－Ａに割り当てられ、ピース「ｆ」はＧＰＵ－Ｂに割り当てられ、ピース「ｇ」はＧＰＵ－Ｃに割り当てられる等である。その結果、ジオメトリテストの処理は、ＧＰＵ（たとえば、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）間で大まかにバランスされる。

分配１０２０（たとえば、ＡＢＢＣＤＡＢＢＣＤＡＢＢＣＤ．．．行）は、ジオメトリテストに対するレスポンシビリティの、複数のＧＰＵ間での非対称の分配を示す。非対称の分配は、対応する画像フレームをレンダリングするときに特定のＧＰＵがジオメトリテストを実行する時間が他のＧＰＵよりも長い場合に、好都合であり得る。たとえば、あるＧＰＵは、シーンの以前のフレームまたはフレーム（複数）に対するオブジェクトのレンダリングを、他のＧＰＵよりも早く終了していることがあり、したがって（このフレームもまた、より早く終了することが予想されるため）、そのＧＰＵに、ジオメトリテストを行うためのジオメトリのピースをより多く割り当てることができる。この場合もやはり、ＧＰＵに対する割り当てがインターリーブされる。図示したように、ＧＰＵ－Ｂに、ジオメトリ事前テストのためのジオメトリのピースを他のＧＰＵよりも多く割り当てる。説明するために、ピース「ａ」はＧＰＵ－Ａに割り当てられ、ピース「ｂ」はＧＰＵ－Ｂに割り当てられ、ピース「ｃ」もＧＰＵ－Ｂに割り当てられ、ピース「ｄ」はＧＰＵ－Ｃに割り当てられ、ピース「ｅ」はＧＰＵ－Ｄに割り当てられ、ピース「ｆ」はＧＰＵ－Ａに割り当てられ、ピース「ｇ」はＧＰＵ－Ｂに割り当てられ、ピース「ｈ」もＧＰＵ－Ｂに割り当てられ、ピース「ｉ」はＧＰＵ－Ｃに割り当てられる等である。ＧＰＵに対するジオメトリテストの割り当てはバランスされていない場合があるが、完全なフェーズの複合された処理（たとえば、ジオメトリ事前テスト及びジオメトリのレンダリング）は、大まかにバランスされていることが判明する場合がある（たとえば、各ＧＰＵが、ジオメトリ事前テスト及びジオメトリのレンダリングの実行にほぼ同じ時間を費やす）。

図１１Ａ～１１Ｂに、ジオメトリテストに対するレスポンシビリティを複数のＧＰＵ間で割り当てるときに、１つ以上の画像フレームに対する統計値を用いることを例示する。たとえば、統計値に基づいて、いくつかのＧＰＵは、ジオメトリテストの間にジオメトリのピースをより多くまたはより少なく処理して、レンダリングするときに有用な情報を生成してもよい。

詳細には、図１１Ａは、本開示の一実施形態により、複数のＧＰＵによる以前の画像フレームのジオメトリの事前テスト及びレンダリングと、レンダリング中に収集した統計値を用いて、現在の画像フレームのジオメトリの事前テストを現在の画像フレームにおける複数のＧＰＵに割り当てることに影響を与えることと、を例示する図である。純粋に説明用に、図１１Ａの第２のフレーム１１００Ｂにおいて、ＧＰＵ－Ｂは、他のＧＰＵ（たとえばＧＰＵ－Ａ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）の２倍の数のジオメトリのピースを処理する（たとえば、事前テストの間に）。ＧＰＵ－Ｂにジオメトリのピースをより多く分配して割り当て、現在の画像フレームにおいてジオメトリ事前テストを実行することは、以前の画像フレームまたは以前の画像フレーム（複数）のレンダリングの間に収集した統計値に基づく。

たとえば、タイミング図１１００Ａは、以前の画像フレームに対するジオメトリ事前テスト７０１Ａ及びレンダリング７０２Ａを示している。両プロセスに対して、４つのＧＰＵ（たとえば、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄ）を用いている。以前の画像フレームのジオメトリ（たとえば、ジオメトリのピース）の割り当ては、ＧＰＵ間で均一に分配されている。これは、各ＧＰＵによるジオメトリ事前テスト７０１Ａの大まかにバランスされた性能によって示される。

１つ以上の画像フレームから収集したレンダリング統計値を用いて、現在の画像フレームのジオメトリテスト及びレンダリングをどのように実行するかを決定してもよい。すなわち、統計値を、以後の画像フレーム（たとえば、現在の画像フレーム）のジオメトリテスト及びレンダリングを行うときに用いるための情報として提供してもよい。たとえば、以前の画像フレームのオブジェクト（たとえば、ジオメトリのピース）のレンダリング中に収集した統計値は、ＧＰＵ－Ｂが他のＧＰＵよりも早くレンダリングを終了したことを示す場合がある。詳細には、ＧＰＵ－Ｂは、オブジェクトレンダリングのためにＧＰＵ－Ｂに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするジオメトリのその一部をレンダリングした後にアイドルタイム１１３０Ａを有する。他のＧＰＵ－Ａ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄはそれぞれ、以前の画像フレームの対応するフレーム周期のほぼ終了７１０までレンダリングを実行する。

以前の画像フレーム及び現在の画像フレームは、アプリケーションを実行するときに特定のシーンに対して生成され得る。したがって、シーンからシーンへのオブジェクトは、数及び場所がほぼ同様であり得る。その場合、ジオメトリ事前テスト及びレンダリングを行うための時間は、画像フレーム列における複数の画像フレーム間でＧＰＵに対して同様である。すなわち、統計値に基づいて、ＧＰＵ－Ｂが現在の画像フレームにおいてジオメトリテスト及びレンダリングを行うときにもアイドルタイムを有すると推定することは妥当である。したがって、ＧＰＵ－Ｂに、現在フレームにおいてジオメトリ事前テストのためのジオメトリのピースをより多く割り当ててもよい。たとえば、ＧＰＵ－Ｂにジオメトリ事前テストの間にジオメトリのピースをより多く処理させる結果、ＧＰＵ－Ｂは、現在の画像フレームにおいてオブジェクトをレンダリングした後、他のＧＰＵとほぼ同じ時間に終了する。すなわち、ＧＰＵ－Ａ、ＧＰＵ－Ｂ、ＧＰＵ－Ｃ、及びＧＰＵ－Ｄはそれぞれ、現在の画像フレームの対応するフレーム周期のほぼ終了７１１までレンダリングを実行する。一実施形態では、現在の画像フレームをレンダリングする合計時間が短くなり、レンダリング統計値を用いたときに現在の画像フレームをレンダリングする時間がより短くなる。したがって、以前のフレーム及び／または以前のフレーム（複数）のレンダリングに対する統計値を用いて、ジオメトリ事前テスト（たとえば、現在の画像フレームにおいてＧＰＵ間でのジオメトリ（たとえば、ジオメトリのピース）の割り当ての分配）を調整してもよい。

図１１Ｂは、本開示の一実施形態により、グラフィックス処理を行うための方法を例示するフロー図１１００Ｂであり、複数のＧＰＵによる以前の画像フレームのジオメトリの事前テスト及びレンダリングと、レンダリング中に収集した統計値を用いて、現在の画像フレームのジオメトリの事前テストを現在の画像フレームにおける複数のＧＰＵに割り当てることに影響を与えることと、を含む。図１１Ａの図は、フロー図１１００Ｂの方法において統計値を用いて、画像フレームに対するＧＰＵ間でのジオメトリ（たとえば、ジオメトリのピース）の割り当ての分配を決定することを例示する。前述したように、種々のアーキテクチャには、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって複数のＧＰＵが連携して単一画像をレンダリングすることが含まれていてもよい。たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ内において、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むものなど）内においてである。

詳細には、１１１０において、本方法は、前述したように、複数のＧＰＵを用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。１１２０において、本方法は、グラフィックスのジオメトリをレンダリングするためのレスポンシビリティを、複数のスクリーン領域に基づいて複数のＧＰＵ間で分割することを含む。各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。より具体的には、前述したように、ＧＰＵはそれぞれ、複数のスクリーン領域のうちの対応する組のスクリーン領域内のジオメトリをレンダリングすることにレスポンシビリティを有している。対応する組のスクリーン領域には、１つ以上のスクリーン領域が含まれる。一実施形態では、スクリーン領域はインターリーブされる（たとえば、ディスプレイが、ジオメトリ事前テスト及びレンダリングのためにスクリーン領域の組に分割されるときに）。

１１３０において、本方法は、アプリケーションによって生成された以前の画像フレームの複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングすることを含む。たとえば、タイミング図１１００Ａは、以前の画像フレームにおけるジオメトリのピースのジオメトリテスト及びオブジェクト（たとえば、ジオメトリのピース）のレンダリングを行うタイミングを例示する。１１４０において、本方法は、以前の画像フレームのレンダリングに対する統計値を生成することを含む。すなわち、以前の画像フレームをレンダリングするときに統計値を収集してもよい。

１１５０において、本方法は、統計値に基づいて、アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。すなわち、これらの統計値を用いて、ジオメトリテストに対するジオメトリのピースを、次のまたは現在の画像フレームをレンダリングするときに特定のＧＰＵに、同じで、より少なく、またはより多く割り当ててもよい。ある場合には、ジオメトリテストを行うときに、ジオメトリの第２の複数のピース内のピースを複数のＧＰＵに均一に割り当てなければならないことを、統計値は示すことがある。

別の場合では、ジオメトリテストを行うときに、ジオメトリの第２の複数のピース内のピースを複数のＧＰＵに不均一に割り当てなければならないことを、統計値は示すことがある。たとえば、時間軸１１００Ａに示すように、以前の画像フレームにおいてＧＰＵ－Ｂが他のＧＰＵのいずれかよりも前にレンダリングを終了すると統計値は示すことがある。詳細には、第２のＧＰＵ（たとえば、ＧＰＵ－Ａ）がジオメトリの第１の複数のピース（たとえば、ジオメトリのピースのその一部）のレンダリングを終了する前に、第１のＧＰＵ（たとえば、ＧＰＵ－Ｂ）がジオメトリの第１の複数のピースのレンダリングを終了したと判定される場合があり得る。前述したように、第１のＧＰＵ（たとえば、ＧＰＵ－Ｂ）は、オブジェクトレンダリングのために第１のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップするジオメトリの第１の複数のピースのうちの１つ以上のピースをレンダリングし、第２のＧＰＵ（たとえば、ＧＰＵ－Ａ）は、オブジェクトレンダリングのために第２のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップするジオメトリの第１の複数のピースのうちの１つ以上のピースをレンダリングする。したがって、統計値に基づいて、第１のＧＰＵ（たとえば、ＧＰＵ－Ｂ）がジオメトリの第２の複数のピースのレンダリングのために必要とする時間は、第２のＧＰＵ（たとえば、ＧＰＵ－Ａ）よりも短いと予想されるため、現在の画像フレームをレンダリングするときにジオメトリ事前テストのために第１のＧＰＵにジオメトリのピースをより多く割り当ててもよい。たとえば、ジオメトリの第１の数の第２の複数のピースを、ジオメトリテストのために第１のＧＰＵ（たとえば、ＧＰＵ－Ｂ）に割り当ててもよく、ジオメトリの第２の数の第２の複数のピースを、ジオメトリテストのために第２のＧＰＵ（たとえば、ＧＰＵ－Ａ）に割り当ててもよい。第１の数は第２の数よりも大きい（時間アンバランスが十分に大きい場合には、ＧＰＵ－Ａにピースを全く割り当てなくてよい）。このように、ジオメトリテストの間にＧＰＵ－Ｂが処理するジオメトリのピースはＧＰＵ－Ａよりも多い。たとえば、タイミング図１１００Ｂは、ＧＰＵ－Ｂは、ジオメトリのピースがより多く割り当てられていて、ジオメトリテストの実行に他のＧＰＵよりも長い時間を費やすことを示している。

１１６０において、本方法は、現在の画像フレームにおいてジオメトリの第２の複数のピースに対してジオメトリ事前テストを行って、ジオメトリの第２の複数のピースの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。ジオメトリ事前テストを、割り当てに基づいて複数のＧＰＵのそれぞれにおいて行う。ジオメトリ事前テストを、事前テストＧＰにおいて、アプリケーションによって生成された画像フレームのジオメトリの複数のピースに対して行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成する。

１１７０において、本方法は、ジオメトリの第２の複数のピースのそれぞれに対して生成された情報を用いて、レンダリングフェーズの間にジオメトリの複数のピースをレンダリングすることを含む（たとえば、対応するＧＰＵにおいて、ジオメトリのピースを完全にレンダリングすること、またはジオメトリのそのピースのレンダリングをスキップすることを含む）。レンダリングは通常、実施形態において、各ＧＰＵにおいて同時に行われる。詳細には、現在の画像フレームのジオメトリの複数のピースは、ジオメトリの各ピースに対して生成された情報を用いて、複数のＧＰＵのそれぞれにおいてレンダリングされる。

他の実施形態では、情報を生成するためにＧＰＵにジオメトリのピースを分配することは、動的に調整される。すなわち、ジオメトリ事前テストを行うために現在の画像フレームに対してジオメトリのピースを割り当てることは、現在の画像フレームのレンダリングの間に動的に調整してもよい。たとえば、タイミング図１１００Ｂの例では、ＧＰＵ－Ａがジオメトリのその割り当てられたピースのジオメトリ事前テストを、予想よりも遅いレートで行っていたと判定され得る。したがって、ジオメトリ事前テストのためにＧＰＵ－Ａに割り当てられたジオメトリのピースをその場で再割り当てすることができ（たとえば、ジオメトリのピースをＧＰＵ－ＡからＧＰＵ－Ｂに再割り当てする）、ＧＰＵ－Ｂに今度は、現在の画像フレームをレンダリングするために用いるフレーム周期の間に、ジオメトリのそのピースに対してジオメトリ事前テストを実行することが課される。

図１２Ａ～１２Ｂに、レンダリングコマンドバッファを処理するための別の方策を例示する。以前に、図７Ａ～７Ｃに関連してある方策について説明した。ここでは、コマンドバッファが、オブジェクト（たとえば、ジオメトリのピース）に対してジオメトリ事前テストを行うためのコマンド、それに続いてオブジェクト（たとえば、ジオメトリのピース）をレンダリングするためのコマンドを収容する。図１２Ａ～１２Ｂに、ジオメトリ事前テスト及びレンダリング方策であって、ＧＰＵ構成に応じていずれかの動作を行うことができるシェーダーを用いる方策を示す。

詳細には、図１２Ａは、本開示の一実施形態により、コマンドバッファ１２００Ａの一部を通る２回のパスにおいて画像フレームのジオメトリの事前テスト及びレンダリングの両方を実行するように構成されたシェーダーを用いることを例示する図である。すなわち、コマンドバッファ１２００Ａ内のコマンドを実行するために用いるシェーダーを、適切に構成されたときにジオメトリ事前テストを実行するか、または適切に構成されたときにレンダリングを実行するように構成してもよい。

図示したように、図１２Ａに示すコマンドバッファ１２００Ａの一部を２回実行し、各実行から異なる動作が生じる。第１の実行はジオメトリ事前テストをもたらし、第２の実行はジオメトリのレンダリングをもたらす。これは種々の方法で達成することができる。たとえば、１２００Ａに示すコマンドバッファの一部を、サブルーチンとして２回、明示的に呼び出すことができる。各呼び出しの前に、異なる状態（たとえば、レジスタ設定またはＲＡＭ内の値）が、異なる値に明示的に設定されている。代替的に、１２００Ａに示すコマンドバッファの一部を暗黙的に２回実行することが、たとえば、特別なコマンドを用いて、その一部の開始及び終了をマークして２回実行し、またコマンドバッファのその一部の第１及び第２の実行に対して異なる構成（たとえば、レジスタ設定）を暗黙的に設定することによって、可能である。コマンドバッファ１２００Ａの一部におけるコマンド（たとえば、状態を設定するコマンドまたはシェーダーを実行するコマンド）が実行されたときに、ＧＰＵ状態に基づいて、コマンドの結果は異なる（たとえば、ジオメトリ事前テストを行うこと対レンダリングを行うことになる）。すなわち、コマンドバッファ１２００Ａ内のコマンドを、ジオメトリ事前テストまたはレンダリングのために構成してもよい。詳細には、コマンドバッファ１２００Ａの一部は、レンダリングコマンドバッファ１２００Ａからのコマンドを実行する１つ以上のＧＰＵの状態を構成するためのコマンドと、状態に応じてジオメトリ事前テストまたはレンダリングのいずれかを実行するシェーダーを実行するためのコマンドとを含む。たとえば、コマンド１２１０、１２１２、１２１４、及び１２１６はそれぞれ、状態に応じてジオメトリ事前テストまたはレンダリングのいずれかを実行するシェーダーを実行する目的で、１つ以上のＧＰＵの状態を構成するために用いられる。図示したように、コマンド１２１０は、シェーダー０がコマンド１２１１を介して実行されてジオメトリ事前テストまたはレンダリングのいずれかを実行し得るように、ＧＰＵ状態を構成する。またコマンド１２１２は、シェーダー１がコマンド１２１３を介して実行されてジオメトリ事前テストまたはレンダリングを実行し得るように、ＧＰＵ状態を構成する。加えて、コマンド１２１４は、シェーダー２がコマンド１２１５を介して実行されてジオメトリ事前テストまたはレンダリングのいずれかを実行し得るように、ＧＰＵ状態を構成する。最後に、コマンド１２１６は、シェーダー３がコマンド１２１７を介して実行されてジオメトリ事前テストまたはレンダリングのいずれかを実行し得るように、ＧＰＵ状態を構成する。

コマンドバッファ１２００Ａを通る第１の横断１２９１では、前述したように明示的または黙示的に設定されるＧＰＵ状態、ならびにコマンド１２１０、１２１２、１２１４、及び１２１６によって構成されるＧＰＵ状態に基づいて、対応するシェーダーがジオメトリ事前テストを実行する。たとえば、シェーダー０は、オブジェクト０（たとえば、ジオメトリのピース）（たとえば、図７Ｂ－１に示すオブジェクトに基づいて）に対してジオメトリ事前テストを実行するように構成され、シェーダー１は、オブジェクト１に対してジオメトリ事前テストを実行するように構成され、シェーダー２は、オブジェクト２に対してジオメトリ事前テストを実行するように構成され、またシェーダー３は、オブジェクト３に対してジオメトリ事前テストを実行するように構成されている。

一実施形態では、ＧＰＵ状態に基づいて、コマンドをスキップするかまたは異なって解釈してもよい。たとえば、状態を設定する特定のコマンド（１２１０、１２１２、１２１４、及び１２１６の部分）を、前述したように明示的または黙示的に設定されるＧＰＵ状態に基づいてスキップしてもよい。たとえば、コマンド１２１０を介して実行されるシェーダー０を構成するときに、ジオメトリ事前テストのために構成する必要があるＧＰＵ状態が、ジオメトリのレンダリングのために構成するときよりも少ない場合、ＧＰＵ状態の不要な部分の設定をスキップすることが有用であり得る。なぜならば、ＧＰＵ状態を設定するとオーバーヘッドを持ち得るからである。別の例を示すために、状態（１２１０、１２１２、１２１４、及び１２１６の一部）を設定する特定のコマンドを、前述したように明示的または黙示的に設定されるＧＰＵ状態に基づいて異なって解釈してもよい。たとえば、コマンド１２１０を介して実行されるシェーダー０が、ジオメトリのレンダリングのために構成される場合とは異なるＧＰＵ状態を、ジオメトリの事前テストのために構成する必要がある場合、またはコマンド１２１０を介して実行されるシェーダー０が、ジオメトリ事前テストとジオメトリのレンダリングとの場合で異なる入力を必要とする場合である。

一実施形態では、ジオメトリ事前テストのために構成されたシェーダーは、前述したように、位置及びパラメータキャッシュにスペースを割り当てない。別の実施形態では、単一のシェーダーを用いて事前テストまたはレンダリングのいずれかを実行する。これは種々の方法で行うことができる。たとえば、シェーダーがチェックすることができる外部のハードウェア状態を介して（たとえば、前述したように明示的または黙示的に設定されるように）、またはシェーダーに対する入力を介して（たとえば、コマンドバッファを通る第１及び第２のパスにおいて異なって解釈されるコマンドによって設定されるように）行うことができる。

コマンドバッファ１２００Ａを通る第２の横断１２９２では、前述したように明示的または黙示的に設定されるＧＰＵ状態、ならびにコマンド１２１０、１２１２、１２１４、及び１２１６によって構成されるＧＰＵ状態に基づいて、対応するシェーダーは、対応する画像フレームに対するジオメトリのピースのレンダリングを実行する。たとえば、シェーダー０は、オブジェクト０（たとえば、ジオメトリのピース）のレンダリングを実行するように構成されている（たとえば、図７Ｂ－１に示すオブジェクトに基づいて）。また、シェーダー１はオブジェクト１のレンダリングを実行するように構成されており、シェーダー２はオブジェクト２のレンダリングを実行するように構成されており、またシェーダー３はオブジェクト３のレンダリングを実行するように構成されている。

図１２Ｂは、本開示の一実施形態により、コマンドバッファの一部を通る２回のパスにおいて同じ組のシェーダーを用いて画像フレームのジオメトリの事前テスト及びレンダリングの両方を行うことを含むグラフィックス処理を行うための方法を例示するフロー図１２００Ｂである。前述したように、種々のアーキテクチャには、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって複数のＧＰＵが連携して単一画像をレンダリングすることが含まれていてもよい。たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ内において、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むもの）内において等である。

詳細には、１２１０において、本方法は、前述したように、複数のＧＰＵを用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。１２２０において、本方法は、グラフィックスのジオメトリをレンダリングするためのレスポンシビリティを、複数のスクリーン領域に基づいて複数のＧＰＵ間で分割することを含む。各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。より具体的には、前述したように、ＧＰＵはそれぞれ、複数のスクリーン領域のうちの対応する組のスクリーン領域内のジオメトリをレンダリングすることにレスポンシビリティを有している。対応する組のスクリーン領域には、１つ以上のスクリーン領域が含まれる。一実施形態では、スクリーン領域はインターリーブされる（たとえば、ディスプレイが、ジオメトリ事前テスト及びレンダリングのためにスクリーン領域の組に分割されるときに）。

１２３０において、本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。詳細には、複数のＧＰＵのそれぞれを、ジオメトリテストを行う目的で、画像フレームに対応付けられるジオメトリの対応部分に割り当てる。前述したように、ジオメトリのピースの割り当てを均一または不均一に分配してもよい。実施形態において、各部分には、ジオメトリの１つ以上のピースが含まれているか、または潜在的にジオメトリのピースが全く含まれていない。

１２４０において、本方法は、１つ以上のシェーダーをジオメトリ事前テストを実行するように構成する第１のＧＰＵ状態をロードすることを含む。たとえば、ＧＰＵ状態に応じて、対応するシェーダーを異なる動作を実行するように構成してもよい。したがって、第１のＧＰＵ状態は、対応するシェーダーをジオメトリ事前テストを実行するように構成する。図１２Ａの例では、これは種々の方法で設定することができる。たとえば、前述したように、１２００Ａに示したコマンドバッファの一部に外部から状態を明示的または黙示的に設定することによって行う。詳細には、ＧＰＵ状態を種々の方法で設定してもよい。たとえば、ＣＰＵまたはＧＰＵは、ランダムアクセスメモリ（ＲＡＭ）内に値を設定することができる。ＧＰＵはＲＡＭ内の値をチェックする。別の例では、状態はＧＰＵの内部である可能性がある。たとえば、コマンドバッファをサブルーチンとして２回呼び出して、内部のＧＰＵ状態が２つのサブルーチン呼び出しの間で異なるときである。代替的に、図１２Ａのコマンド１２１０を、前述したように、明示的または黙示的に設定される状態に基づいて、異なって解釈するかまたはスキップすることができる。この第１のＧＰＵ状態に基づいて、コマンド１２１１によって実行されるシェーダー０は、ジオメトリ事前テストを実行するように構成されている。

１２５０において、本方法は、複数のＧＰＵにおいてジオメトリの複数のピースに対してジオメトリ事前テストを行って、ジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成することを含む。前述したように、ジオメトリ事前テストは、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするか否かを判定してもよい。ジオメトリ事前テストは通常、実施形態において、ＧＰＵにより、対応する画像フレームのすべてのジオメトリに対して同時に行われるため、各ＧＰＵは、ジオメトリのどのピースをレンダリングするか、ジオメトリのどのピースをスキップするかを知ることができる。これにより、コマンドバッファを通る第１の横断が終了する。シェーダーを、ＧＰＵ状態に応じて、ジオメトリ事前テスト及び／またはレンダリングのそれぞれを実行するように構成してもよい。

１２６０において、本方法は、１つ以上のシェーダーをレンダリングを実行するように構成する第２のＧＰＵ状態をロードすることを含む。前述したように、ＧＰＵ状態に応じて、対応するシェーダーを異なる動作を実行するように構成してもよい。したがって、第２のＧＰＵ状態は、対応するシェーダー（ジオメトリ事前テストを実行するために以前に用いた同じシェーダー）を、レンダリングを実行するように構成する。図１２Ａの例では、この第２のＧＰＵ状態に基づいて、コマンド１２１１によって実行されるシェーダー０は、レンダリングを実行するように構成されている。

１２７０において、本方法は、複数のＧＰＵのそれぞれにおいて、ジオメトリの複数のピースをレンダリングするときに、ジオメトリの複数のピースのそれぞれに対して生成された情報を用いることを含む（たとえば、対応するＧＰＵにおいてジオメトリのピースを完全にレンダリングすることまたはジオメトリのそのピースのレンダリングをスキップすることを含むために）。前述したように、情報は、ジオメトリのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられた任意のスクリーン領域（たとえば、対応する組における）とオーバーラップするか否かを示すことがある。この情報を、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースのそれぞれをレンダリングするために用いてもよく、各ＧＰＵは、オブジェクトレンダリングのためにその対応するＧＰＵに割り当てられた少なくとも１つのスクリーン（たとえば、対応する組における）とオーバーラップするジオメトリのピースのみを、効率的にレンダリングすることができる。これにより、コマンドバッファを通る第２の横断が終了する。シェーダーを、ＧＰＵ状態に応じて、ジオメトリ事前テスト及び／またはレンダリングのそれぞれを実行するように構成してもよい。

図１３Ａ～１３Ｂに、レンダリングコマンドバッファを処理するための別の方策を例示する。以前に、図７Ａ～７Ｃに関連してある方策について説明した。ここでは、コマンドバッファが、オブジェクト（たとえば、ジオメトリのピース）のジオメトリ事前テストに対するコマンド、それに続いてオブジェクト（たとえば、ジオメトリのピース）をレンダリングするためのコマンドを収容する。また図１２Ａ～１２Ｂにおいて、ＧＰＵ構成に応じていずれかの動作を行うことができるシェーダーを用いる別の方策について説明した。図１３Ａ～１３Ｂに、ジオメトリ事前テストまたはレンダリングのいずれかを行うことができるシェーダーを用いるジオメトリテスト及びレンダリング方策を示す。ここでは、本開示の実施形態により、ジオメトリ事前テスト及びレンダリングのプロセスが、ジオメトリの異なる組のピースに対してインターリーブされる。

詳細には、図１３Ａは、ジオメトリ事前テスト及びレンダリングの両方を実行するように構成されたシェーダーを用いることを例示する図である。本開示の一実施形態により、ジオメトリの異なる組のピースに対して行われるジオメトリ事前テスト及びレンダリングは、対応するコマンドバッファ１３００Ａの別個の部分を用いてインターリーブされる。すなわち、コマンドバッファ１３００Ａの一部を開始から終了まで実行するのでなくて、ジオメトリ事前テスト及びレンダリングがジオメトリの異なる組のピースに対してインターリーブされるように、コマンドバッファ１３００Ａを動的に構成して実行する。たとえば、コマンドバッファにおいて、いくつかのシェーダー（たとえば、コマンド１３１１及び１３１３を介して実行される）は、ジオメトリの第１の組のピースに対してジオメトリ事前テストを行うように構成されている。ジオメトリテストを行った後で、これらの同じシェーダー（たとえば、コマンド１３１１及び１３１３によって実行される）は次に、レンダリングを行うように構成されている。ジオメトリの第１の組のピースに対してレンダリングを行った後で、コマンドバッファ内の他のシェーダー（たとえば、コマンド１３１５及び１３１７を介して実行される）は、ジオメトリの第２の組のピースに対してジオメトリ事前テストを行うように構成されている。ジオメトリ事前テストを行った後で、これらの同じシェーダー（たとえば、コマンド１３１５及び１３１７を介して実行される）は次に、レンダリングを行うように構成されており、レンダリングはジオメトリの第２の組のピースに対してこれらのコマンドを用いて行われる。この方策の利点は、ＧＰＵ間のアンバランスに動的に対処することが、たとえば、レンダリングの全体にわたってジオメトリテストの非対称のインターリーブを用いることによって可能となることである。ジオメトリテストの非対称のインターリーブの例は、以前に図１０の分配１０２において導入した。

ジオメトリ事前テスト及びレンダリングのインターリーブは動的に行われるため、ＧＰＵの構成（たとえば、レジスタ設定またはＲＡＭ内の値を介して）は暗黙的に行われる。つまり、ＧＰＵ構成の態様はコマンドバッファの外部で起こる。たとえば、ＧＰＵレジスタを、０（ジオメトリ事前テストを行うべきであることを示す）または１（レンダリングを行うべきであることを示す）に設定してもよい。コマンドバッファのインターリーブの横断及びこのレジスタの設定を、処理されるオブジェクトの数、処理されるプリミティブ、ＧＰＵ間のアンバランスなどに基づいて、ＧＰＵによって制御してもよい。代替的に、ＲＡＭ内の値を用いることができる。この外部構成（コマンドバッファに外部から設定することを意味する）の結果として、コマンドバッファ１３００Ａの一部におけるコマンド（たとえば、状態を設定するコマンドまたはシェーダーを実行するコマンド）が実行されたときに、ＧＰＵ状態に基づいて、コマンドの結果は異なる（たとえば、ジオメトリ事前テストを行うこと対レンダリングを行うことになる）。すなわち、コマンドバッファ１３００Ａ内のコマンドを、ジオメトリ事前テスト１３９１またはレンダリング１３９２に対して構成してもよい。詳細には、コマンドバッファ１３００Ａの一部は、レンダリングコマンドバッファ１３００Ａからのコマンドを実行する１つ以上のＧＰＵの状態を構成するためのコマンドと、状態に応じてジオメトリ事前テストまたはレンダリングのいずれかを実行するシェーダーを実行するためのコマンドとを含む。たとえば、コマンド１３１０、１３１２、１３１４、及び１３１６はそれぞれ、状態に応じてジオメトリ事前テストまたはレンダリングのいずれかを実行するシェーダーを実行する目的で、ＧＰＵの状態を構成するために用いられる。図示したように、コマンドバッファ１３１０は、シェーダー０がオブジェクト０のジオメトリ事前テストまたはレンダリングのいずれかを行うようにコマンド１３１１を介して実行され得るように、ＧＰＵ状態を構成する。また、コマンドバッファ１３１２は、シェーダー１がオブジェクト１のジオメトリ事前テストまたはレンダリングのいずれかを行うようにコマンド１３１３を介して実行され得るように、ＧＰＵ状態を構成する。また、コマンドバッファ１３１４は、シェーダー２がオブジェクト２のジオメトリ事前テストまたはレンダリングのいずれかを行うようにコマンド１３１５を介して実行され得るように、ＧＰＵ状態を構成する。さらに、コマンドバッファ１３１６は、シェーダー３がオブジェクト３のジオメトリ事前テストまたはレンダリングのいずれかを行うようにコマンド１３１７を介して実行され得るように、ＧＰＵ状態を構成する。

ジオメトリ事前テスト及びレンダリングを、ジオメトリの異なる組のピースに対してインターリーブしてもよい。例示のみを目的として、コマンドバッファ１３００Ａを、１番目にオブジェクト０及び１のジオメトリ事前テスト及びレンダリングを実行するように構成してもよく、次にコマンドバッファ１３００Ａは、２番目にオブジェクト２及び３のジオメトリ事前テスト及びレンダリングを実行するように構成されている。当然のことながら、ジオメトリの異なる数のピースを異なるセクションにおいてインターリーブしてもよい。たとえば、セクション１はコマンドバッファ１３００Ａを通る第１の横断を示す。前述したように暗黙的に設定されるＧＰＵ状態、ならびにコマンド１３１０及び１３１２によって構成されるＧＰＵ状態に基づいて、対応するシェーダーはジオメトリ事前テストを実行する。たとえば、シェーダー０は、オブジェクト０（たとえば、ジオメトリのピース）（たとえば、図７Ｂ－１に示すオブジェクトに基づいて）に対してジオメトリ事前テストを実行するように構成されており、シェーダー１は、オブジェクト１に対してジオメトリ事前テストを実行するように構成されている。セクション２は、コマンドバッファ１３００Ａを通る第２の横断を示す。前述したように暗黙的に設定されるＧＰＵ状態、ならびにコマンド１３１０及び１３１２によって構成されるＧＰＵ状態に基づいて、対応するシェーダーがレンダリングを実行する。たとえば、シェーダー０は次にオブジェクト０のレンダリングを実行するように構成され、シェーダー１は次にオブジェクト１のレンダリングを実行するように構成されている。

図１３Ａに、ジオメトリの異なる組のピースに対してジオメトリ事前テスト及びレンダリングの実行をインターリーブすることを示す。詳細には、セクション３は、コマンドバッファ１３００Ａを通る第３の部分的な横断を示す。前述したように暗黙的に設定されるＧＰＵ状態、ならびにコマンド１３１４及び１３１６によって構成されるＧＰＵ状態に基づいて、対応するシェーダーがジオメトリ事前テストを実行する。たとえば、シェーダー２（コマンド１３１５を介して実行される）は、オブジェクト２（たとえば、ジオメトリのピース）（たとえば図７Ｂ－１に示すオブジェクトに基づいて）に対してジオメトリテストを実行し、シェーダー３（コマンド１３１７を介して実行される）は、オブジェクト３に対してジオメトリテストを実行する。セクション４は、コマンドバッファ１３００Ａを通る第４の部分的な横断を示す。前述したように暗黙的に設定されるＧＰＵ状態、ならびにコマンド１３１４及び１３１６によって構成されるＧＰＵ状態に基づいて、対応するシェーダーがレンダリングを実行する。たとえば、シェーダー２（コマンド１３１５を介して実行される）はオブジェクト２のレンダリングを実行し、シェーダー３（コマンド１３１７を介して実行される）はオブジェクト３のレンダリングを実行する。

なお、ハードウェアコンテキストは保持されているか、または記録（あるいはセーブ）及び読み出し（あるいはリストア）がなされることに留意されたい。たとえば、セクション１の終わりにおけるジオメトリ事前テストＧＰＵコンテキストは、ジオメトリ事前テストを行うためにセクション３の始まりにおいて必要である。また、セクション２の終わりにおけるレンダリングＧＰＵコンテキストは、レンダリングを行うためにセクション４の始まりに対して必要である。

一実施形態では、ＧＰＵ状態に基づいて、コマンドをスキップするかまたは異なって解釈してもよい。たとえば、状態を設定する特定のコマンド（１３１０、１３１２、１３１４、及び１３１６の部分）を、前述したように暗黙的に設定されるＧＰＵ状態に基づいてスキップしてもよい。たとえば、コマンド１３１０を介して実行されるシェーダー０を構成するときに、ジオメトリテストのために構成する必要があるＧＰＵ状態が、ジオメトリのレンダリングのために構成するときよりも少ない場合、ＧＰＵ状態の不要な部分の設定をスキップすることが有用であり得る。なぜならば、ＧＰＵ状態を設定するとオーバーヘッドを持ち得るからである。別の例を示すために、状態を設定する特定のコマンド（１３１０、１３１２、１３１４、及び１３１６の部分）を、前述したように暗黙的に設定されるＧＰＵ状態に基づいて異なって解釈してもよい。たとえば、コマンド１３１０を介して実行されるシェーダー０が、ジオメトリのレンダリングのために構成される場合とは異なるＧＰＵ状態を、ジオメトリの事前テストのために構成する必要がある場合、またはコマンド１３１０を介して実行されるシェーダー０が、ジオメトリテストとジオメトリのレンダリングとの場合で異なる入力を必要とする場合である。

一実施形態では、ジオメトリ事前テストのために構成されたシェーダーは、前述したように、位置及びパラメータキャッシュにスペースを割り当てない。別の実施形態では、単一のシェーダーを用いて事前テストまたはレンダリングのいずれかを実行する。これは種々の方法で行うことができる。たとえば、シェーダーがチェックすることができる外部のハードウェア状態を介して（たとえば、前述したように暗黙的に設定されるように）、またはシェーダーに対する入力を介して（たとえば、コマンドバッファを通る第１及び第２のパスにおいて異なって解釈されるコマンドによって設定されるように）行うことができる。

図１３Ｂは、本開示の一実施形態により、ジオメトリの異なる組のピースに対する画像フレームのジオメトリの事前テスト及びレンダリングを、対応するコマンドバッファの別個の部分を用いてインターリーブすることを含むグラフィックス処理を行うための方法を例示するフロー図である。前述したように、種々のアーキテクチャには、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことによって複数のＧＰＵが連携して単一画像をレンダリングすることが含まれていてもよい。たとえば、クラウドゲーミングシステムの１つ以上のクラウドゲーミングサーバ内において、またはスタンドアロンシステム（たとえば、パーソナルコンピュータまたはゲーミングコンソールであって、複数のＧＰＵを有するハイエンドグラフィックスカードを含むもの）内において等である。

詳細には、１３１０において、本方法は、前述したように、複数のＧＰＵを用いてアプリケーションに対するグラフィックスをレンダリングすることを含む。１３２０において、本方法は、グラフィックスのジオメトリをレンダリングするためのレスポンシビリティを、複数のスクリーン領域に基づいて複数のＧＰＵに分割することを含む。各ＧＰＵは、複数のＧＰＵに知られたレスポンシビリティの対応するディビジョンを有する。より具体的には、前述したように、ＧＰＵはそれぞれ、複数のスクリーン領域のうちの対応する組のスクリーン領域内のジオメトリをレンダリングすることにレスポンシビリティを有している。対応する組のスクリーン領域には、１つ以上のスクリーン領域が含まれる。一実施形態では、スクリーン領域はインターリーブされる（たとえばディスプレイが、ジオメトリ事前テスト及びレンダリングのためにスクリーン領域の組に分割されるときに）。

１３３０において、本方法は、画像フレームのジオメトリの複数のピースを、ジオメトリテストのために複数のＧＰＵに割り当てることを含む。詳細には、複数のＧＰＵのそれぞれを、ジオメトリテストを行う目的で、画像フレームに対応付けられるジオメトリの対応部分に割り当てる。前述したように、ジオメトリのピースの割り当てを均一または不均一に分配してもよい。各部分には、ジオメトリの１つ以上のピースが含まれているか、または潜在的にジオメトリのピースが全く含まれていない。

１３４０において、本方法は、コマンドバッファ内の第１の組のシェーダーを第２の組のシェーダーとインターリーブすることを含む。シェーダーは、ジオメトリ事前テスト及びレンダリングの両方を実行するように構成されている。詳細には、第１の組のシェーダーは、ジオメトリの第１の組のピースに対してジオメトリ事前テスト及びレンダリングを実行するように構成されている。その後、第２の組のシェーダーは、ジオメトリの第２の組のピースに対してジオメトリ事前テスト及びレンダリングを実行するように構成されている。前述したように、ジオメトリ事前テストは、第１の組または第２の組内のジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する対応する情報を生成する。対応する情報を複数のＧＰＵが用いて、第１の組または第２の組内のジオメトリの各ピースをレンダリングする。前述したように、ＧＰＵ状態を、ジオメトリ事前テストまたはレンダリングのいずれかを実行するために種々の方法で設定してもよい。たとえば、ＣＰＵまたはＧＰＵはランダムアクセスメモリ（ＲＡＭ）内に値を設定することができる。ＧＰＵはＲＡＭ内の値をチェックする。別の例では、状態はＧＰＵの内部である可能性がある。たとえば、コマンドバッファをサブルーチンとして２回呼び出して、内部のＧＰＵ状態が２つのサブルーチン呼び出しの間で異なるときである。

インターリーブプロセスについてさらに説明する。詳細には、前述したように、コマンドバッファの第１の組のシェーダーは、ジオメトリの第１の組のピースに対してジオメトリ事前テストを実行するように構成されている。ジオメトリ事前テストを複数のＧＰＵにおいてジオメトリの第１の組のピースに対して行って、第１の組におけるジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する第１の情報を生成する。そして、前述したように、第１の組のシェーダーは、ジオメトリの第１の組のピースのレンダリングを実行するように構成されている。その後、第１の情報は、複数のＧＰＵのそれぞれにおいてジオメトリの複数のピースをレンダリングするときに用いる（たとえば、対応するＧＰＵにおいてジオメトリの第１の組のピースを完全にレンダリングすることまたはジオメトリの第１の組のピースのレンダリングをスキップすることを含むために）。前述したように、情報は、ジオメトリのどのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられたスクリーン領域とオーバーラップするかを示す。たとえば、情報を用いてＧＰＵにおけるジオメトリのピースのレンダリングをスキップすることを、ジオメトリのピースが、オブジェクトレンダリングのためにＧＰＵに割り当てられたどのスクリーン領域（たとえば、対応する組における）ともオーバーラップしないとその情報が示すときに行ってもよい。

そして、第２の組のシェーダーを、ジオメトリの第２の組のピースのジオメトリテスト及びレンダリングのために用いる。詳細には、前述したように、コマンドバッファの第２の組のシェーダーは、ジオメトリの第２の組のピースに対してジオメトリ事前テストを実行するように構成されている。そして、ジオメトリテストを複数のＧＰＵにおいてジオメトリの第２の組のピースに対して行って、第２の組におけるジオメトリの各ピースと複数のスクリーン領域のそれぞれに対するその関係とに関する第２の情報を生成する。そして、前述したように、第２の組のシェーダーはジオメトリの第２の組のピースのレンダリングを実行するように構成されている。その後、ジオメトリの第２の組のピースのレンダリングを複数のＧＰＵのそれぞれにおいて第２の情報を用いて行う。前述したように、情報は、ジオメトリのどのピースが、オブジェクトレンダリングのために対応するＧＰＵに割り当てられたスクリーン領域（たとえば、対応する組の）とオーバーラップするかを示す。

前述では、複数のＧＰＵがジオメトリをロックステップで処理する（すなわち、複数のＧＰＵがジオメトリ事前テストを実行し、そして複数のＧＰＵがレンダリングを実行する）と説明しているが、いくつかの実施形態では、ＧＰＵは互いに明示的に同期してはいない。たとえば、あるＧＰＵがジオメトリの第１の組のピースをレンダリングしている間に、第２のＧＰＵがジオメトリの第２の組のピースに対してジオメトリ事前テストを行っていてもよい。

図１４に、本開示の種々の実施形態の態様を実行するために使用できるデバイス例１４００のコンポーネントを例示する。たとえば、図１４では、本開示の実施形態により、画像フレームに対するオブジェクトをレンダリングする前に、スクリーン領域（インターリーブされ得る）に対してジオメトリの事前テストを行うことによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うのに適した典型的なハードウェアシステムを例示する。このブロック図で例示するデバイス１４００は、パーソナルコンピュータ、サーバコンピュータ、ゲーミングコンソール、モバイルデバイス、または他のデジタルデバイス（それぞれ、本発明の実施形態を実行するのに適している）を組み込むことができるかまたはそれらであることができる。デバイス１４００は、ソフトウェアアプリケーション及び随意的にオペレーティングシステムを実行するための中央処理ユニット（ＣＰＵ）１４０２を含んでいる。ＣＰＵ１４０２は、１つ以上の同種または異種の処理コアから構成され得る。

種々の実施形態により、ＣＰＵ１４０２は１つ以上の処理コアを有する１つ以上の汎用マイクロプロセッサである。さらなる実施形態を、ゲームの実行中にグラフィックス処理を行うように構成されたアプリケーションの高並列で計算集約型のアプリケーション（たとえば、媒体及びインタラクティブエンターテインメントアプリケーション）に具体的に適応されたマイクロプロセッサアーキテクチャを伴う１つ以上のＣＰＵを用いて実施することができる。

メモリ１４０４は、ＣＰＵ１４０２及びＧＰＵ１４１６が用いるアプリケーション及びデータを記憶する。記憶装置１４０６は、アプリケーション及びデータ用の不揮発性記憶装置及び他のコンピュータ可読媒体であり、固定ディスクドライブ、リムーバブルディスクドライブ、フラッシュメモリ装置、及びＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ブルーレイ、ＨＤ－ＤＶＤ、または他の光学記憶装置、ならびに信号伝送及び記憶媒体を含んでいてもよい。ユーザ入力デバイス１４０８は、１人以上のユーザからのユーザ入力をデバイス１４００に伝達する。その例としては、キーボード、マウス、ジョイスティック、タッチパッド、タッチスクリーン、スチールまたはビデオレコーダ／カメラ、及び／またはマイクロフォンを挙げてもよい。ネットワークインターフェース１４０９によって、デバイス１４００は、電子通信ネットワークを介して他のコンピュータシステムと通信することができる。ネットワークインターフェース１４０９としては、ローカルエリアネットワーク及びワイドエリアネットワーク（たとえば、インターネット）を介した有線または無線通信を挙げてもよい。オーディオプロセッサ１４１２は、ＣＰＵ１４０２、メモリ１４０４、及び／または記憶装置１４０６が提供する命令及び／またはデータからアナログまたはデジタルオーディオ出力を生成するように適応されている。デバイス１４００のコンポーネント（たとえば、ＣＰＵ１４０２、グラフィックスサブシステム、たとえば、ＧＰＵ１４１６、メモリ１４０４、データ記憶装置１４０６、ユーザ入力デバイス１４０８、ネットワークインターフェース１４０９、及びオーディオプロセッサ１４１２）は、１つ以上のデータバス１４２２を介して接続されている。

グラフィックスサブシステム１４１４がさらに、データバス１４２２及びデバイス１４００のコンポーネントと接続されている。グラフィックスサブシステム１４１４は、少なくとも１つのグラフィックス処理ユニット（ＧＰＵ）１４１６及びグラフィックスメモリ１４１８を含んでいる。グラフィックスメモリ１４１８は、出力画像の各ピクセルに対するピクセルデータを記憶するために用いるディスプレイメモリ（たとえば、フレームバッファ）を含んでいる。グラフィックスメモリ１４１８は、ＧＰＵ１４１６と同じデバイスに統合すること、個別のデバイスとしてＧＰＵ１４１６と接続すること、及び／またはメモリ１４０４内に実装することができる。ピクセルデータをＣＰＵ１４０２から直接グラフィックスメモリ１４１８に提供することができる。代替的に、ＣＰＵ１４０２は、ＧＰＵ１４１６に、所望の出力画像を規定するデータ及び／または命令を提供する。所望の出力画像から、ＧＰＵ１４１６が１つ以上の出力画像のピクセルデータを生成する。所望の出力画像を規定するデータ及び／または命令を、メモリ１４０４及び／またはグラフィックスメモリ１４１８に記憶することができる。一実施形態では、ＧＰＵ１４１６は、シーンに対するジオメトリ、照明、シェーディング、模様付け、動き、及び／またはカメラパラメータを規定する命令及びデータから、出力画像用のピクセルデータを生成するための３Ｄレンダリング能力を含む。ＧＰＵ１４１６はさらに、シェーダープログラムを実行することができる１つ以上のプログラマブル実行ユニットを含むことができる。

グラフィックスサブシステム１４１４は、グラフィックスメモリ１４１８から、ディスプレイデバイス１４１０に表示すべき、または投影システム（図示せず）によって投影すべき画像用のピクセルデータを定期的に出力する。ディスプレイデバイス１４１０は、デバイス１４００からの信号に応じて視覚情報を表示することができる任意のデバイスとすることができる。たとえば、ＣＲＴ、ＬＣＤ、プラズマ、及びＯＬＥＤディスプレイである。デバイス１４００は、ディスプレイデバイス１４１０に、たとえば、アナログまたはデジタル信号を提供することができる。

グラフィックスサブシステム１４１４を最適化するための他の実施形態には、画像フレームに対するオブジェクトをレンダリングする前にスクリーン領域（インターリーブされ得る）に対してジオメトリを事前テストすることによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うことを、含むことができる。グラフィックスサブシステム１４１４を、１つ以上の処理デバイスとして構成することができる。

たとえば、一実施形態では、グラフィックスサブシステム１４１４を、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを行うように構成してもよい。複数のグラフィックスサブシステムが、グラフィックスを実行していることができ、及び／または単一アプリケーションに対するパイプラインをレンダリングしていることができる。すなわち、グラフィックスサブシステム１４１４は、アプリケーションを実行するときに画像または画像列の１つ以上の各画像をレンダリングするために用いる複数のＧＰＵを含んでいる。

他の実施形態では、グラフィックスサブシステム１４１４は複数のＧＰＵデバイスを含んでいる。これらは、対応するＣＰＵ上で実行されている単一アプリケーションに対するグラフィックス処理を実行するために結合される。たとえば、複数のＧＰＵは、画像フレームに対するオブジェクトをレンダリングする前にスクリーン領域（インターリーブされ得る）に対してジオメトリを事前テストすることによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングを実行することができる。他の例では、複数のＧＰＵは交互形式のフレームレンダリングを実行することができる。ここでは、ＧＰＵ１が第１のフレームをレンダリングし、ＧＰＵ２が第２のフレームをレンダリングして、これを連続的なフレーム周期で行うことなどを、最後のＧＰＵに達するまで続ける。その上で、最初のＧＰＵが次のビデオフレームをレンダリングする（たとえば、２つのＧＰＵのみが存在する場合には、ＧＰＵ１が第３のフレームをレンダリングする）。すなわち、フレームをレンダリングするときにＧＰＵが回転する。レンダリング動作はオーバーラップすることができる。ＧＰＵ１が第１のフレームのレンダリングを終了する前に、ＧＰＵ２が第２のフレームのレンダリングを開始してもよい。別の実施態様では、複数のＧＰＵデバイスに、レンダリング及び／またはグラフィックスパイプラインにおいて異なるシェーダー動作を割り当てることができる。マスタＧＰＵが主なレンダリング及び合成を行っている。たとえば、３つのＧＰＵを含むグループでは、マスタＧＰＵ１が、スレーブＧＰＵ２及びスレーブＧＰＵ３からの出力の主なレンダリング（たとえば、第１のシェーダー動作）及び合成を実行することができる。スレーブＧＰＵ２は、第２のシェーダー（たとえば、河などの流体効果）動作を実行することができ、スレーブＧＰＵ３は、第３のシェーダー（たとえば、粒子煙）動作を実行することができる。マスタＧＰＵ１は、ＧＰＵ１、ＧＰＵ２、及びＧＰＵ３のそれぞれからの結果を合成する。このように、異なるシェーダー動作（たとえば、旗を振ること、風、発煙、火災など）を実行するために異なるＧＰＵを割り当てて、ビデオフレームをレンダリングすることができる。さらなる他の実施形態では、３つのＧＰＵをそれぞれ、ビデオフレームに対応するシーンの異なるオブジェクト及び／または一部分に割り当てることができる。前述の実施形態及び実施態様では、これらの動作を同じフレーム周期（同時に並列）でまたは異なるフレーム周期（順次に並列）で行うことができる。

したがって、本開示では、アプリケーションを実行するときに画像フレームまたは画像フレーム列における１つ以上の各画像フレームに対するオブジェクトのレンダリングを行う前にスクリーン領域（インターリーブされ得る）に対してジオメトリを事前テストすることによって、アプリケーションに対するジオメトリのマルチＧＰＵレンダリングするように構成された方法及びシステムについて説明している。

当然のことながら、本明細書で規定した種々の実施形態を、本明細書で開示した種々の特徴を用いて具体的な実施に結合するかまたは組み立ててもよい。したがって、提供した例は単にいくつかの可能な例であり、種々の要素を結合してさらに多くの実施態様を規定することによって可能な種々の実施態様に限定されない。いくつかの例では、開示した実施態様または同等な実施態様の趣旨から逸脱することなく、いくつかの実施態様にはさらに少ない要素が含まれていてもよい。

本開示の実施形態は、種々のコンピュータシステム構成（たとえば、ハンドヘルドデバイス、マイクロプロセッサシステム、マイクロプロセッサベースまたはプログラマブル民生用エレクトロニクス、ミニコンピュータ、メインフレームコンピュータなど）によって実行してもよい。また本開示の実施形態は、分散コンピューティング環境において実行することもできる。ここでは、タスクが、有線ベースまたは無線ネットワークを通してリンクされたリモート処理デバイスによって行われる。

前述の実施形態を念頭において、当然のことながら、本開示の実施形態は、コンピュータシステムに記憶されたデータを伴う種々のコンピュータ実装動作を用いることができる。これらの動作は、物理量の物理的な操作を必要とするものである。本開示の実施形態の一部分を構成する本明細書で説明した動作のいずれも、有用なマシン動作である。また本開示の実施形態は、これらの動作を行うためのデバイスまたは装置に関する。装置は必要な目的に対して特別に構成することもできるし、または装置を、コンピュータに記憶されたコンピュータプログラムによって選択的に作動または構成される汎用コンピュータとすることもできる。詳細には、種々の汎用マシンを本明細書の教示により書き込まれたコンピュータプログラムによって用いることもできるし、または必要な動作を実行するために、さらに特化された装置を構成することがより好都合であり得る。

また本開示を、コンピュータ可読媒体上のコンピュータ可読コードとして具体化することができる。コンピュータ可読媒体は、データを記憶することができる任意のデータ記憶装置とすることができる。データはその後にコンピュータシステムによって読み出すことができる。コンピュータ可読媒体の例としては、ハードドライブ、ネットワーク接続ストレージ（ＮＡＳ）、読み出し専用メモリ、ランダムアクセスメモリ、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、ＣＤ－ＲＷ、磁気テープ、ならびに他の光学及び非光学データ記憶装置が挙げられる。コンピュータ可読媒体としては、コンピュータ可読コードが分散的に記憶及び実行されるようにネットワーク結合コンピュータシステム上に分散されたコンピュータ可読有形的表現媒体を挙げることができる。

本方法の動作を特定の順序で説明したが、当然のことながら、動作の合間に他のハウスキーピング動作を行ってもよいし、または動作を調整してわずかに異なる時間に行われるようにしてもよいし、またはオーバーレイ動作の処理が所望の方法で行われる限り、処理動作を処理に対応付けられる種々の間隔で可能にするシステムにおいて分散させるようにしてもよい。

前述の開示内容は、理解を明瞭にするために少し詳しく説明しているが、添付の特許請求の範囲内で特定の変形及び変更を実施できることが明らかである。したがって、本実施形態は例示的であって限定的ではないと考えるべきであり、本開示の実施形態は、本明細書で示した詳細に限定してはならないが、添付の特許請求の範囲及び均等物内で変更してもよい。

Claims

グラフィックス処理を行うための方法であって、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、前記複数のスクリーン領域におけるスクリーン領域はインターリーブされ、
ＧＰＵに、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリ事前テストのために割り当て、
前記ＧＰＵにおいて前記ジオメトリ事前テストを行って、ジオメトリの前記ピースと、前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、
前記画像フレームをレンダリングするときに、前記複数のＧＰＵのそれぞれにおいて前記情報を用いる、方法。
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示すときに、前記レンダリングＧＰＵにおけるジオメトリの前記ピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項１に記載の方法。
さらに、レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記ピースのレンダリングが前記レンダリングＧＰＵにおいて始まる前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの第１のピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記ピースは前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項１に記載の方法。
さらに、前記画像フレームのジオメトリの複数のピースを、ジオメトリ事前テストのために前記複数のＧＰＵに割り当て、
ジオメトリの前記複数のピース内のジオメトリのピースを、前記複数のＧＰＵの全体にわたって均一または不均一に割り当てる、請求項１に記載の方法。
ジオメトリの前記複数のピースを、ジオメトリの連続的なピースが、異なるＧＰＵによって処理されるように割り当てる、請求項４に記載の方法。
第１のＧＰＵはジオメトリ事前テストを、第２のＧＰＵよりも多いジオメトリのピースに対して実行するか、または前記第１のＧＰＵはジオメトリ事前テストを、前記第２のＧＰＵがジオメトリ事前テストを全く実行しない間に実行する、請求項５に記載の方法。
前記複数のスクリーン領域は、前記複数のＧＰＵ間のレンダリング時間のアンバランスを減らすように構成されている、請求項１に記載の方法。
前記複数のスクリーン領域のそれぞれは、サイズが一様ではない、請求項１に記載の方法。
前記複数のスクリーン領域は動的に変化する、請求項１に記載の方法。
ジオメトリの前記ピースは、ドローコールが使用または生成するジオメトリに対応する、請求項１に記載の方法。
前記アプリケーションの、ドローコールが使用または生成するジオメトリを、前記ＧＰＵが情報を生成する、ジオメトリの前記ピースを含むジオメトリの複数のピースに細分割する、請求項１に記載の方法。
ジオメトリの前記ピースは個々のプリミティブである、請求項１に記載の方法。
ジオメトリの前記ピースに関する前記情報は、頂点数またはプリミティブ数を含む、請求項１に記載の方法。
ジオメトリの前記ピースに関する前記情報は、レンダリングに対する特定の組のプリミティブまたはレンダリングに対する特定の組の頂点を含む、請求項１に記載の方法。
さらに、前記複数のＧＰＵに対して共通のレンダリングコマンドバッファを用い、
前記共通のレンダリングコマンドバッファにおけるコマンドの実行を、前記複数のＧＰＵのうちの１つ以上に限定する、請求項１に記載の方法。
前記情報は、ジオメトリの前記ピースの特性に応じて、生成され得るか、または生成され得ないものである、請求項１に記載の方法。
さらに、ラスタライゼーションステージにおいてスキャンコンバータを用いて前記情報を生成する、請求項１に記載の方法。
さらに、ジオメトリ処理ステージにおいて１つ以上のシェーダーを用いて前記情報を生成する、請求項１に記載の方法。
前記１つ以上のシェーダーは、前記情報の前記生成を加速するために１つ以上の専用命令を用いる、請求項１８に記載の方法。
前記１つ以上のシェーダーは、位置キャッシュまたはパラメータキャッシュに対する割り当てを実行しない、請求項１８に記載の方法。
さらに、ジオメトリの複数のピースを、ジオメトリ事前テストのために前記複数のＧＰＵ間で分割し、
ジオメトリの連続的なピースが、異なるＧＰＵによって処理される、請求項１に記載の方法。
さらに、ジオメトリ事前テスト中に前記複数のＧＰＵのそれぞれの性能に基づいて、ジオメトリの前記複数のピースの前記ディビジョンを動的に調整する、請求項２１に記載の方法。
前記複数のＧＰＵのうちの１つ以上は、複数の仮想ＧＰＵとして構成される、より大きいＧＰＵの一部である、請求項１に記載の方法。
コンピュータシステムであって、
プロセッサを有し、
前記プロセッサに結合され、命令が記憶されたメモリを有し、前記命令は、前記コンピュータシステムによって実行されると、前記コンピュータシステムに、グラフィックスパイプラインを実行するための方法を実行させるものであり、
前記方法は、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、前記複数のスクリーン領域におけるスクリーン領域はインターリーブされ、
ＧＰＵに、アプリケーションによって生成された画像フレームのジオメトリのピースを、ジオメトリ事前テストのために割り当て、
前記ＧＰＵにおいて前記ジオメトリ事前テストを行って、ジオメトリの前記ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、
前記画像フレームをレンダリングするときに、前記複数のＧＰＵのそれぞれにおいて前記情報を用いる、コンピュータシステム。
前記コンピュータシステムは、さらに、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示すときに、前記レンダリングＧＰＵにおけるジオメトリの前記ピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項２４に記載のコンピュータシステム。
前記方法はさらに、
レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記ピースのレンダリングが前記レンダリングＧＰＵにおいて始まる前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの第１のピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記ピースは前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項２４に記載のコンピュータシステム。
グラフィックス処理を行うための方法であって、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有するものであり、
アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、前記複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングし、
前記以前の画像フレームの前記レンダリングに対する統計値を生成し、
前記統計値に基づいて、前記アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当て、
現在の画像フレームにおいてジオメトリの前記第２の複数のピースに対してジオメトリテストを行って、ジオメトリの前記第２の複数のピースの各ピースと、前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、前記ジオメトリテストは前記複数のＧＰＵのそれぞれにおいて前記割り当てに基づいて行われ、
ジオメトリの前記第２の複数のピースのそれぞれに対して生成された前記情報を、前記複数のＧＰＵにおいて前記ジオメトリをレンダリングするときに用いる、方法。
さらに、レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースは、前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項２７に記載の方法。
ジオメトリの前記第２の複数のピース内のジオメトリのピースを、前記複数のＧＰＵに均一または不均一に割り当てる、請求項２７に記載の方法。
さらに、第２のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了する前に、第１のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了したと判定し、前記第１のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第１のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングし、前記第２のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第２のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングし、
ジオメトリの第１の数の前記第２の複数のピースを、ジオメトリテストのために前記第１のＧＰＵに割り当て、
ジオメトリの第２の数の前記第２の複数のピースを、ジオメトリテストのために前記第２のＧＰＵに割り当て、
前記第１の数は前記第２の数よりも多い、請求項２７に記載の方法。
前記第２の数はゼロである、請求項３０に記載の方法。
前記情報を用いるときに、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示す場合に、前記レンダリングＧＰＵにおけるジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項２７に記載の方法。
ジオメトリの前記第２の複数のピースを、ジオメトリ事前テストのために前記複数のＧＰＵ間で分割し、
ジオメトリの連続的なピースが、異なるＧＰＵによって処理される、請求項２７に記載の方法。
ジオメトリ事前テスト中に前記複数のＧＰＵのそれぞれの性能に基づいて、ジオメトリの前記第２の複数のピースの前記ディビジョンを動的に調整する、請求項３３に記載の方法。
第１のＧＰＵは、ジオメトリ事前テスト中に第２のＧＰＵよりも多いジオメトリのピースを処理する、請求項３３に記載の方法。
ジオメトリの前記第２の複数のピース内のジオメトリのピースは、ドローコールが使用または生成するジオメトリに対応する、請求項２７に記載の方法。
前記複数のＧＰＵのうちの１つ以上は、複数の仮想ＧＰＵとして構成される、より大きいＧＰＵの一部である、請求項２７に記載の方法。
方法を実行するための非一時的コンピュータ可読媒体であって、
前記コンピュータ可読媒体は、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングするためのプログラム命令を有し、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割するためのプログラム命令を有し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、
アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、前記複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングするためのプログラム命令を有し、
前記以前の画像フレームの前記レンダリングに対する統計値を生成するためのプログラム命令を有し、
前記統計値に基づいて、前記アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当てるためのプログラム命令を有し、
現在の画像フレームにおいてジオメトリの前記第２の複数のピースに対してジオメトリテストを行って、ジオメトリの前記第２の複数のピースの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成するためのプログラム命令を有し、前記ジオメトリテストは前記複数のＧＰＵのそれぞれにおいて前記割り当てに基づいて行われ、
ジオメトリの前記第２の複数のピースのそれぞれに対して生成された前記情報を、前記複数のＧＰＵにおいて前記ジオメトリをレンダリングするときに用いるためのプログラム命令を有する、非一時的コンピュータ可読媒体。
レンダリングＧＰＵに前記情報をヒントとして提供するためのプログラム命令をさらに有し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースは、前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項３８に記載の非一時的コンピュータ可読媒体。
前記方法において、
ジオメトリの前記第２の複数のピース内のジオメトリのピースを、前記複数のＧＰＵに均一または不均一に割り当てる、請求項３８に記載の非一時的コンピュータ可読媒体。
さらに、第２のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了する前に、第１のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了したと判定するためのプログラミング命令を有し、前記第１のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第１のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングし、前記第２のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第２のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングするものでであり、
ジオメトリの第１の数の前記第２の複数のピースを、ジオメトリテストのために前記第１のＧＰＵに割り当てるためのプログラム命令を有し、
ジオメトリの第２の数の前記第２の複数のピースを、ジオメトリテストのために前記第２のＧＰＵに割り当てるためのプログラム命令を有し、
前記第１の数は前記第２の数よりも多い、請求項３８に記載の非一時的コンピュータ可読媒体。
前記情報を用いるための前記プログラム命令は、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示すときに、前記レンダリングＧＰＵにおけるジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングをスキップするためのプログラム命令を有し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項３８に記載の非一時的コンピュータ可読媒体。
ジオメトリの前記第２の複数のピースを、ジオメトリ事前テストのために前記複数のＧＰＵ間で分割するためのプログラム命令をさらに有し、
ジオメトリの連続的なピースが、異なるＧＰＵによって処理される、請求項３８に記載の非一時的コンピュータ可読媒体。
ジオメトリ事前テスト中に前記複数のＧＰＵのそれぞれの性能に基づいて、ジオメトリの前記第２の複数のピースの前記ディビジョンを動的に調整するためのプログラム命令をさらに含む、請求項４３に記載の非一時的コンピュータ可読媒体。
コンピュータシステムであって、
プロセッサを有し、
前記プロセッサに結合され、命令が記憶されたメモリを有し、前記命令は、前記コンピュータシステムによって実行されると、前記コンピュータシステムに、グラフィックス処理を行うための方法を実行させるものであり、前記方法は、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、
アプリケーションによって生成された以前の画像フレームのレンダリングフェーズの間に、前記複数のＧＰＵにおいてジオメトリの第１の複数のピースをレンダリングし、
前記以前の画像フレームの前記レンダリングに対する統計値を生成し、
前記統計値に基づいて、前記アプリケーションによって生成された現在の画像フレームのジオメトリの第２の複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当て、
現在の画像フレームにおいてジオメトリの前記第２の複数のピースに対してジオメトリテストを行って、ジオメトリの前記第２の複数のピースの各ピースと、前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、前記ジオメトリテストは前記複数のＧＰＵのそれぞれにおいて前記割り当てに基づいて行われ、
ジオメトリの前記第２の複数のピースのそれぞれに対して生成された前記情報を、前記複数のＧＰＵにおいて前記ジオメトリをレンダリングするときに用いる、コンピュータシステム。
前記方法はさらに、
レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記第２の複数のピース内のジオメトリの前記ピースは、前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項４５に記載のコンピュータシステム。
前記方法において、
ジオメトリの前記第２の複数のピース内のジオメトリのピースを、前記複数のＧＰＵに均一または不均一に割り当てる、請求項４５に記載のコンピュータシステム。
前記方法はさらに、
第２のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了する前に第１のＧＰＵがジオメトリの前記第１の複数のピースのレンダリングを終了したと判定し、前記第１のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第１のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングし、前記第２のＧＰＵは、ジオメトリの前記第１の複数のピースのうち、オブジェクトレンダリングのために前記第２のＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップする１つ以上のピースをレンダリングし、
ジオメトリの第１の数の前記第２の複数のピースを、ジオメトリテストのために前記第１のＧＰＵに割り当て、
ジオメトリの第２の数の前記第２の複数のピースを、ジオメトリテストのために前記第２のＧＰＵに割り当て、
前記第１の数は前記第２の数よりも多い、請求項４５に記載のコンピュータシステム。
前記方法において、前記情報を前記用いるときに、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示す場合に、前記レンダリングＧＰＵにおけるジオメトリの前記第２の複数のピース内のジオメトリのピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項４５に記載のコンピュータシステム。
前記方法はさらに、
ジオメトリの前記第２の複数のピースを、ジオメトリ事前テストのために前記複数のＧＰＵ間で分割し、
ジオメトリの連続的なピースが、異なるＧＰＵによって処理される、請求項４５に記載のコンピュータシステム。
前記方法はさらに、
ジオメトリ事前テスト中に前記複数のＧＰＵのそれぞれの性能に基づいて、ジオメトリの前記第２の複数のピースの前記ディビジョンを動的に調整する、請求項５０に記載のコンピュータシステム。
グラフィックス処理を行うための方法であって、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、
画像フレームのジオメトリの複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当て、
前記ジオメトリテストを実行するように１つ以上のシェーダーを構成する第１のＧＰＵ状態を設定し、
ジオメトリテストを前記複数のＧＰＵにおいてジオメトリの前記複数のピースに対して行って、ジオメトリの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、
レンダリングを実行するように前記１つ以上のシェーダーを構成する第２のＧＰＵ状態を設定し、
前記複数のＧＰＵにおいてジオメトリの前記複数のピースをレンダリングするときに、ジオメトリの前記複数のピースのそれぞれに対して生成された前記情報を用いる、方法。
前記情報を用いるときに、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示す場合に、前記レンダリングＧＰＵにおけるジオメトリのピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項５２に記載の方法。
さらに、レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの前記ピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記ピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記ピースは前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項５２に記載の方法。
ジオメトリの前記複数のピース内のジオメトリのピースを、前記複数のＧＰＵの全体にわたって均一または不均一に割り当て、
ジオメトリの前記複数のピースを、ジオメトリの連続的なピースが、異なるＧＰＵによって処理されるように割り当てる、請求項５２に記載の方法
第１のＧＰＵはジオメトリ事前テストを、第２のＧＰＵよりも多いジオメトリのピースに対して実行するか、または前記第１のＧＰＵはジオメトリ事前テストを、前記第２のＧＰＵがジオメトリ事前テストを全く実行しない間に実行する、請求項５２に記載の方法。
前記第１のＧＰＵ状態または前記第２のＧＰＵ状態に応じて、レンダリングコマンドバッファ内のコマンドを実行するときに、前記コマンドは、後で１つ以上のレンダリングステージで用いられるように、ジオメトリの前記ピースに関する前記情報の出力を生じさせるか、または頂点位置及びパラメータ情報の出力を生じさせる、請求項５２に記載の方法。
前記第１のＧＰＵ状態または前記第２のＧＰＵ状態に応じて、前記ＧＰＵ構成に影響する前記コマンドが複数の方法で解釈される、請求項５７に記載の方法。
コマンドバッファにおいて、
ジオメトリの第１のピースと前記複数のスクリーン領域に対するその関係とに対する第１の情報の生成及びジオメトリの前記第１のピースのレンダリングと、
ジオメトリの第２のピースと前記複数のスクリーン領域に対するその関係とに対する第２の情報の生成及びジオメトリの前記第２のピースのレンダリングとをインターリーブする、請求項５２に記載の方法。
ハードウェアコンテキストは保持されているか、または記録及び読み出しがなされる、請求項５２に記載の方法。
前記複数のＧＰＵのうちの１つ以上は、複数の仮想ＧＰＵとして構成される、より大きいＧＰＵの一部である、請求項５２に記載の方法。
グラフィックス処理を行うための方法であって、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、
画像フレームのジオメトリの複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当て、
ジオメトリの第１の組のピースに対してジオメトリテスト及びレンダリングを実行する第１の組のシェーダーと、ジオメトリの第２の組のピースに対してジオメトリテスト及びレンダリングを実行する第２の組のシェーダーとをインターリーブし、
前記ジオメトリテストは、前記第１の組または前記第２の組内のジオメトリの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する対応する情報を生成し、
前記複数のＧＰＵが前記ジオメトリをレンダリングするときに、前記対応する情報を前記複数のＧＰＵが用いる、方法。
前記第１の組内のジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示すときに、前記レンダリングＧＰＵにおいて前記第１の組内のジオメトリのピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記第２の組内のジオメトリの前記ピースが、オブジェクトレンダリングのために前記レンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示すときに、前記レンダリングＧＰＵにおいて前記第２の組内のジオメトリのピースのレンダリングをスキップする、請求項６２に記載の方法。
前記インターリーブでは、
コマンドバッファの前記第１の組のシェーダーを、ジオメトリの前記第１の組のピースに対してジオメトリテストを実行するように構成し、
前記複数のＧＰＵにおいて、前記第１の組のシェーダーを用いて、ジオメトリの前記第１の組のピースに対するジオメトリテストを実行し、前記第１の組内のジオメトリの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する第１の情報を生成し、
前記第１の組のシェーダーを、ジオメトリの前記第１の組のピースのレンダリングを実行するように構成し、
ジオメトリの前記第１のピースが、オブジェクトレンダリングのために前記第１のレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記第１の情報が示すときに、第１のレンダリングＧＰＵにおいてジオメトリの前記第１の組のピース内のジオメトリの第１のピースのレンダリングをスキップし、
コマンドバッファの前記第２の組のシェーダーを、ジオメトリの前記第２の組のピースに対してジオメトリテストを実行するように構成し、
前記複数のＧＰＵにおいて、前記第２の組のシェーダーを用いて、ジオメトリの前記第２の組のピースに対するジオメトリテストを実行して、前記第２の組内のジオメトリの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する第２の情報を生成し、
前記第２の組のシェーダーを、ジオメトリの前記第２の組のピースのレンダリングを実行するように構成し、
ジオメトリの前記第２のピースが、オブジェクトレンダリングのために前記第２のレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記第２の情報が示すときに、第２のレンダリングＧＰＵにおいてジオメトリの前記第２の組のピース内のジオメトリの第２のピースのレンダリングをスキップする、請求項６２に記載の方法。
さらに、レンダリングＧＰＵに前記対応する情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報は、ジオメトリの対応するピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記対応するピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記対応するピースは前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項６２に記載の方法。
ジオメトリの前記複数のピース内のジオメトリのピースを、前記複数のＧＰＵの全体にわたって均一または不均一に割り当て、
ジオメトリの前記複数のピースを、ジオメトリの連続的なピースが、異なるＧＰＵによって処理されるように割り当てる、請求項６２に記載の方法。
前記複数のＧＰＵのうちの１つ以上は、複数の仮想ＧＰＵとして構成される、より大きいＧＰＵの一部である、請求項６２に記載の方法。
コンピュータシステムであって、
プロセッサと、
前記プロセッサに結合され、命令が記憶されたメモリを有し、前記命令は、前記コンピュータシステムによって実行されると、前記コンピュータシステムに、グラフィックス処理を行うための方法を実行させるものであり、前記方法は、
複数のグラフィックス処理ユニット（ＧＰＵ）を用いてアプリケーションに対するグラフィックスをレンダリングし、
前記グラフィックスのジオメトリの前記レンダリングに対するレスポンシビリティを複数のスクリーン領域に基づいて前記複数のＧＰＵ間で分割し、各ＧＰＵは、前記複数のＧＰＵに知られた前記レスポンシビリティの対応するディビジョンを有し、
画像フレームのジオメトリの複数のピースを、ジオメトリテストのために前記複数のＧＰＵに割り当て、
前記ジオメトリテストを実行するように１つ以上のシェーダーを構成する第１のＧＰＵ状態を設定し、
ジオメトリテストを前記複数のＧＰＵにおいてジオメトリの前記複数のピースに対して行って、ジオメトリの各ピースと前記複数のスクリーン領域のそれぞれに対するその関係とに関する情報を生成し、
レンダリングを実行するように前記１つ以上のシェーダーを構成する第２のＧＰＵ状態を設定し、
前記複数のＧＰＵにおいてジオメトリの前記複数のピースをレンダリングするときに、ジオメトリの前記複数のピースのそれぞれに対して生成された前記情報を用いる、コンピュータシステム。
前記情報を用いるときに、
ジオメトリの前記ピースが、オブジェクトレンダリングのためにレンダリングＧＰＵに割り当てられた任意のスクリーン領域とオーバーラップしないと前記情報が示す場合に、レンダリングＧＰＵにおけるジオメトリのピースのレンダリングをスキップし、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つである、請求項６８に記載の方法。
レンダリングＧＰＵに前記情報をヒントとして提供し、前記レンダリングＧＰＵは前記複数のＧＰＵのうちの１つであり、
前記情報はジオメトリの前記ピースのレンダリングの前に受け取られた場合に、前記レンダリングＧＰＵによって考慮され、
ジオメトリの前記ピースのレンダリングが始まった後に前記情報が受け取られたときに、ジオメトリの前記ピースは前記レンダリングＧＰＵにおいて完全にレンダリングされる、請求項６８に記載の方法。
ジオメトリの前記複数のピース内のジオメトリのピースを、前記複数のＧＰＵの全体にわたって均一または不均一に割り当て、
ジオメトリの前記複数のピースを、ジオメトリの連続的なピースが、異なるＧＰＵによって処理されるように割り当てる、請求項６８に記載の方法。
第１のＧＰＵはジオメトリ事前テストを、第２のＧＰＵよりも多いジオメトリのピースに対して実行するか、または前記第１のＧＰＵはジオメトリ事前テストを、前記第２のＧＰＵがジオメトリ事前テストを全く実行しない間に実行する、請求項６８に記載の方法。
前記第１のＧＰＵ状態または前記第２のＧＰＵ状態に応じて、レンダリングコマンドバッファ内のコマンドを実行するときに、前記コマンドは、後で１つ以上のレンダリングステージが用いるように、ジオメトリの前記ピースに関する前記情報の出力を生じさせるか、または頂点位置及びパラメータ情報の出力を生じさせる、請求項６８に記載の方法。
前記第１のＧＰＵ状態または前記第２のＧＰＵ状態に応じて、前記ＧＰＵ構成に影響する前記コマンドは複数の方法で解釈される、請求項７３に記載の方法。
さらに、コマンドバッファにおいて、
ジオメトリの第１のピースと前記複数のスクリーン領域に対するその関係とに対する第１の情報の生成及びジオメトリの前記第１のピースのレンダリングと、
ジオメトリの第２のピースと前記複数のスクリーン領域に対するその関係とに対する第２の情報の生成及びジオメトリの前記第２のピースのレンダリングとを、インターリーブする、請求項６８に記載の方法。
ハードウェアコンテキストは保持されているか、または記録及び読み出しがなされる、請求項６８に記載の方法。
前記複数のＧＰＵのうちの１つ以上は、複数の仮想ＧＰＵとして構成される、より大きいＧＰＵの一部である、請求項６８に記載の方法。