JP7266021B2 - 可変レートシェーディング - Google Patents

可変レートシェーディング Download PDF

Info

Publication number
JP7266021B2
JP7266021B2 JP2020511305A JP2020511305A JP7266021B2 JP 7266021 B2 JP7266021 B2 JP 7266021B2 JP 2020511305 A JP2020511305 A JP 2020511305A JP 2020511305 A JP2020511305 A JP 2020511305A JP 7266021 B2 JP7266021 B2 JP 7266021B2
Authority
JP
Japan
Prior art keywords
quads
coarse
pixel
tile buffer
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020511305A
Other languages
English (en)
Other versions
JP2020532789A (ja
Inventor
ジョナソン サレハ スカイラー
ジェイ. ブレナン クリストファー
エス. ポミャノフスキ アンドリュー
ウ― ルイジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Micro Devices Inc
Original Assignee
Advanced Micro Devices Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Micro Devices Inc filed Critical Advanced Micro Devices Inc
Publication of JP2020532789A publication Critical patent/JP2020532789A/ja
Application granted granted Critical
Publication of JP7266021B2 publication Critical patent/JP7266021B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • G06T15/80Shading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/40Hidden part removal
    • G06T15/405Hidden part removal using Z-buffer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Generation (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

(関連出願の相互参照)
本願は、2017年8月25日に出願された米国特許出願第15/687,421号の利益を主張するものであり、その内容は、本明細書に完全に記載されているかのように、言及することによって本明細書に組み込まれる。
三次元(3D)グラフィックス処理パイプラインは、入力ジオメトリをスクリーン表示用の二次元(2D)画像に変換する一連のステップを実施する。いくつかのステップは、ラスタライズ及びピクセルシェーディングを含む。ラスタライズは、ラスタライザの前のパイプラインのステージで提供される三角形によってカバーされるピクセル(又は、サブピクセルのサンプル)を識別することを含む。ラスタライズの出力は、四角形(クワッド)(2×2ピクセルのブロック)と、何れのサンプルがクワッドのピクセルでカバーされているかを示すカバレッジデータと、を含む。ピクセルシェーダは、クワッドのピクセルをシェーディングし、クワッドのピクセルがフレームバッファに書き込まれる。ピクセルシェーディングは非常に多くのリソースを消費するため、ピクセルシェーディングの効率を向上させる技術が絶えず開発されている。
添付の図面と共に例として与えられる以下の説明から、より詳細な理解を得ることができるであろう。
本開示の1つ以上の特徴を実装し得る例示的なデバイスのブロック図である。 一例による、図1のデバイスの詳細を示す図である。 図2に示すグラフィックス処理パイプラインのさらなる詳細を示すブロック図である。 一例による、ピクセルシェーディングとは異なる解像度でラスタライズを実行するための技術を示す図である。 いくつかの例による、4分の1以外のシェーディングレートの粗いクワッドの生成を示す図である。 マルチサンプルレンダーターゲットへのレンダリングに関する詳細を含む、図4に示す技術のいくつかの詳細を示す図である。 図6の例示的な技術に対する代替技術を示す図であり、ピクセルシェーダによってキルされた、シェーディングされた粗いピクセルのいくつかのサンプルカバレッジを示す図である。
本明細書では、ラスタライズ及びピクセルシェーディングを独立した解像度で実行する技術を提供する。この技術は、通常のようにラスタライズを実行して、細かいラスタライズデータと、(細かい)クワッドのセットと、を生成することを含む。クワッドは、タイルバッファ内に蓄積され、粗いクワッドは、シェーディングレートに基づいてタイルバッファ内のクワッドから生成される。シェーディングレートは、細かいクワッドのピクセルをいくつ組み合わせて、粗いクワッドの粗いピクセルを生成するかを決定する。細かいピクセルの組み合わせは、組み合わせられる細かいピクセル毎に、単一の粗いピクセルを生成することを含む。粗いピクセルの各々は、対応する細かいピクセル(すなわち、粗いピクセルを形成するために組み合わされた細かいピクセル)のカバレッジに対応するカバレッジデータを有する。細かいピクセルからのサンプルカバレッジデータの組み合わせが、ピクセルのカバレッジに割り当てられたビット数を超える場合に、細かいピクセルからのカバレッジデータの一部が除去され、粗いピクセルのカバレッジデータの縮小されたセットが残る。粗いクワッドの粗いピクセルの位置は、対応する細かいピクセルの位置に基づいて設定される。一例では、粗いクワッドの各ピクセルの位置は、対応する細かいピクセルでカバーされるレンダーターゲットの領域の中心点に設定される。粗いクワッドは、通常のようにシェーディングされ、結果として得られるシェーディングされた粗いクワッドは、細かいラスタライズデータに基づいて変更され、シェーディングされた細かいクワッドを生成する。この変更は、粗いクワッドの各ピクセルをアップサンプリング(クローニング)して、各々が対応する粗いピクセルの色を有する複数のアップサンプリングされたクローンピクセルを生成し、次に、アップサンプリングされたクローンピクセルの各々に細かいラスタライズデータを適用することを含む。
図1は、本開示の1つ以上の特徴を実装し得る例示的なデバイス100のブロック図である。デバイス100は、例えば、コンピュータ、ゲームデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話、タブレットコンピュータ、又は、他のコンピューティングデバイスのうちの1つであってもよいが、これらに限定されない。デバイス100は、プロセッサ102と、メモリ104と、ストレージ106と、1つ以上の入力デバイス108と、1つ以上の出力デバイス110と、を含む。また、デバイス100は、1つ以上の入力ドライバ112と、1つ以上の出力ドライバ114と、を含む。任意の入力ドライバ112は、ハードウェア、ハードウェア及びソフトウェアの組み合わせ、又は、ソフトウェアとして実施され、入力デバイス108を制御する(例えば、動作の制御、入力ドライバ112からの入力の受信、及び、入力ドライバ112へのデータの提供)目的を果たす。同様に、任意の出力ドライバ114は、ハードウェア、ハードウェア及びソフトウェの組み合わせ、又は、ソフトウェアとして実施され、出力デバイス110を制御する(例えば、動作の制御、出力ドライバ114からの入力の受信、及び、出力ドライバ114へのデータの提供)目的を果たす。デバイス100は、図1に示していない追加のコンポーネントを含み得ることを理解されたい。
様々な代替例では、プロセッサ102は、中央処理装置(CPU)、グラフィックス処理装置(GPU)、同じダイ上に配置されたCPU及びGPU、又は、1つ以上のプロセッサコアを含み、各プロセッサコアは、CPU又はGPUであってもよい。様々な代替例では、メモリ104は、プロセッサ102と同じダイ上に配置されてもよいし、プロセッサ102から分離して配置される。メモリ104は、揮発性又は不揮発性メモリ(例えば、ランダムアクセスメモリ(RAM)、ダイナミックRAM、キャッシュ等)を含む。
ストレージ106は、固定又は着脱可能なストレージ(例えば、ハードディスクドライブ、ソリッドステートドライブ、光ディスク、フラッシュドライブ等であるが、これらに限定されない)を含む。入力デバイス108は、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、バイオメトリクススキャナ、又は、ネットワーク接続(例えば、無線IEEE802信号の送信及び/若しくは受信用の無線ローカルエリアネットワークカード)を含むが、これらに限定されない。出力デバイス110は、ディスプレイ、スピーカ、プリンタ、触覚フィードバックデバイス、1つ以上のライト、アンテナ、又は、ネットワーク接続(例えば、無線IEEE802信号の送信及び/若しくは受信用の無線ローカルエリアネットワークカード)を含むが、これらに限定されない。
入力ドライバ112及び出力ドライバ114は、入力デバイス108及び出力デバイス110の各々とインタフェースし、これらを駆動するように構成された1つ以上のハードウェア、ソフトウェア及び/又はファームウェアコンポーネントを含む。入力ドライバ112は、プロセッサ102及び入力デバイス108と通信し、プロセッサ102が入力デバイス108からの入力を受信するのを可能にする。出力ドライバ114は、プロセッサ102及び出力デバイス110と通信し、プロセッサ102が出力デバイス110に出力を送信するのを可能にする。出力ドライバ114は、ディスプレイデバイス118に接続されたアクセラレーテッド処理デバイス(Accelerated Processing Device:APD)116を含み、APD116は、いくつかの例では、物理ディスプレイデバイス、又は、出力を表示するためにリモートディスプレイプロトコルを使用するシミュレートデバイスである。APD116は、プロセッサ102から計算コマンド及びグラフィックスレンダリングコマンドを受け入れ、これらの計算コマンド及びグラフィックスレンダリングコマンドを処理して、ピクセル出力を、表示するためにディスプレイデバイス118に提供するように構成されている。以下により詳細に説明するように、APD116は、単一命令複数データ(single-instruction-multiple-data:SIMD)パラダイムに従って計算を実行するように構成された1つ以上の並列処理装置を含む。したがって、本明細書では、様々な機能がAPD116によって又はAPD116と共に実行されるものとして説明しているが、代替例では、APD116によって実行されるものとして説明している機能は、追加的又は代替的に、ホストプロセッサ(例えば、プロセッサ102)によって駆動されず、グラフィックス出力をディスプレイデバイス118に提供するように構成された、同様の機能を有する他のコンピューティングデバイスによって実行される。例えば、SIMDパラダイムに従って処理タスクを実行する任意の処理システムが、本明細書で説明する機能を実行するように構成されてもよいことが企図される。或いは、SIMDパラダイムに従って処理タスクを実行しないコンピューティングシステムが、本明細書で説明する機能を実行することが企図される。
図2は、一例による、デバイス100及びAPD116の詳細を示す図である。プロセッサ102(図1)は、オペレーティングシステム120と、ドライバ122と、アプリケーション126と、を実行し、他のソフトウェアを代替的又は追加的に実行してもよい。オペレーティングシステム120は、ハードウェアリソースの管理、サービス要求の処理、プロセス実行のスケジューリング及び制御、並びに、他の動作の実行等のデバイス100の様々な態様を制御する。APDドライバ122は、APD116の動作を制御し、グラフィックスレンダリングタスク又は他のワーク等のタスクを、処理のためにAPD116に送信する。また、APDドライバ122は、APD116の処理コンポーネント(例えば、以下により詳細に説明するSIMDユニット138等)による実行のためのプログラムをコンパイルするジャストインタイムコンパイラも含む。
APD116は、グラフィックス操作及び非グラフィックス操作等のように、並列処理に適している選択された機能のためのコマンド及びプログラムを実行する。APD116は、ピクセル演算、幾何学的計算等のグラフィックスパイプライン操作を実行し、プロセッサ102から受信したコマンドに基づいて画像をディスプレイデバイス118にレンダリングするのに使用することができる。また、APD116は、プロセッサ102から受信したコマンドに基づいて、ビデオ、物理シミュレーション、計算流体力学又は他のタスクに関連する操作等のように、グラフィックス操作に直接関連しない計算処理操作を実行する。
APD116は、SIMDパラダイムに従ってプロセッサ102(又は、別のユニット)の要求に応じて並列に操作を実行するように構成された1つ以上のSIMDユニット138を含む計算ユニット132を含む。SIMDパラダイムは、複数の処理要素が単一のプログラム制御フローユニット及びプログラムカウンタを共有することによって同じプログラムを実行するが、異なるデータを用いて当該プログラムを実行することができるパラダイムである。一例では、各SIMDユニット138は、16のレーンを含んでおり、各レーンは、SIMDユニット138内の他のレーンと同時に同じ命令を実行するが、異なるデータを用いて当該命令を実行することができる。全てのレーンが所定の命令を実行する必要がない場合、予測によってレーンをスイッチオフすることができる。また、予測を使用して、分岐した制御フローを有するプログラムを実行することもできる。具体的には、制御フローが、個々のレーンによって実行された計算に基づく条件付き分岐又は他の命令を有するプログラムの場合、現在実行されていない制御フローパスに対応するレーンの予測及び異なる制御フローパスの連続実行は、任意の制御フローを可能にする。
計算ユニット132における実行の基本単位は、ワークアイテムである。各ワークアイテムは、特定のレーンで並列に実行されるプログラムの単一のインスタンス化を表す。ワークアイテムは、単一のSIMD処理ユニット138上で「ウェーブフロント(wavefront)」として同時に(又は、部分的に同時であって部分的に順次に)実行することができる。1つ以上のウェーブフロントは、同じプログラムを実行するように指定されたワークアイテムの集合を含む「ワークグループ」に含まれる。ワークグループを構成するウェーブフロントの各々を実行することによって、ワークグループを実行することができる。代替として、ウェーブフロントは、単一のSIMDユニット138又は異なるSIMDユニット138上で実行される。ウェーブフロントは、単一のSIMDユニット138上で同時に(又は、疑似的に同時に)実行可能なワークアイテムの最大の集合と考えることができる。「疑似的に同時」な実行は、SIMDユニット138のレーン数よりも多いウェーブフロントの場合に発生する。このような状況では、ウェーブフロントは、複数のサイクルに亘って実行され、ワークアイテムの異なる集合が異なるサイクルで実行される。APDスケジューラ136は、計算ユニット132及びSIMDユニット138上で様々なワークグループ及びウェーブフロントのスケジューリングに関連する操作を実行するように構成されている。
計算ユニット132によってもたらされる並列性は、ピクセル値計算、頂点変換及び他のグラフィックス操作等のグラフィックス関連操作に適している。したがって、場合によっては、プロセッサ102からグラフィックス処理コマンドを受け入れるグラフィックス処理パイプライン134は、計算タスクを、並列実行のために計算ユニット132に提供する。
また、計算ユニット132は、グラフィックスに関連しないか、グラフィックス処理パイプライン134の「通常」の操作(例えば、グラフィックス処理パイプライン134の操作のために実行される処理を補足するのに実行されるカスタム操作)の一部として実行されない計算タスクを実行するために使用される。プロセッサ102上で実行されるアプリケーション126又は他のソフトウェアは、このような計算タスクを定義するプログラムを、実行のためにAPD116に送信する。
図3は、図2に示すグラフィックス処理パイプライン134のさらなる詳細を示すブロック図である。グラフィックス処理パイプライン134は、各々がグラフィックス処理パイプライン134の特定の機能を実行するステージを含む。各ステージは、プログラム可能な計算ユニット132で実行されるシェーダプログラムとして部分的若しくは完全に実装され、又は、計算ユニット132の外部の固定機能のプログラム不可能なハードウェアとして部分的若しくは完全に実装される。
入力アセンブラステージ302は、ユーザが充填したバッファ(例えば、プロセッサ102によって実行されるアプリケーション126等のソフトウェアの要求によって充填されたバッファ)からプリミティブデータを読み出し、当該データを、パイプラインの残りの部分によって使用されるプリミティブにアセンブルする。入力アセンブラステージ302は、ユーザが充填したバッファに含まれるプリミティブデータに基づいて、異なるタイプのプリミティブを生成することができる。入力アセンブラステージ302は、パイプラインの残りの部分で使用するために、アセンブルされたプリミティブをフォーマットする。
頂点シェーダステージ304は、入力アセンブラステージ302によってアセンブルされたプリミティブの頂点を処理する。頂点シェーダステージ304は、変換、スキニング、モーフィング及び頂点毎のライティング等の様々な頂点毎の操作を実行する。変換操作は、頂点の座標を変換するための様々な操作を含む。これらの操作は、頂点座標を変更するモデリング変換、ビュー変換、投影変換、パースペクティブ分割及びビューポート変換等のうち1つ以上と、座標以外の属性を変更する他の操作と、を含む。
頂点シェーダステージ304は、1つ以上の計算ユニット132で実行される頂点シェーダプログラムとして部分的又は完全に実装される。頂点シェーダプログラムは、プロセッサ102によって提供され、コンピュータプログラマによって事前に書き込まれたプログラムに基づいている。ドライバ122は、このようなコンピュータプログラムをコンパイルして、計算ユニット132での実行に適したフォーマットを有する頂点シェーダプログラムを生成する。
ハルシェーダステージ306、テッセレータステージ308及びドメインシェーダステージ310は、連携してテッセレーションを実行し、プリミティブを細分化することによって、単純なプリミティブをより複雑なプリミティブに変換する。ハルシェーダステージ306は、入力されたプリミティブに基づいて、テッセレーションに関するパッチを生成する。テッセレータステージ308は、パッチのサンプルセットを生成する。ドメインシェーダステージ310は、パッチのサンプルに対応する頂点の頂点位置を計算する。ハルシェーダステージ306及びドメインシェーダステージ310は、頂点シェーダステージ304と同様に、ドライバ122によってコンパイルされる計算ユニット132上で実行されるシェーダプログラムとして実装することができる。
ジオメトリシェーダステージ312は、プリミティブ毎に頂点操作を実行する。ジオメトリシェーダステージ312によって、例えば、ポイントスプライト展開、動的パーティクルシステム操作、ファーフィン(fur-fin)生成、シャドウボリューム生成、キューブマップへのシングルパスレンダリング、プリミティブ毎のマテリアルスワップ、プリミティブ毎のマテリアル設定等の操作を含む、様々な異なるタイプの操作を実行することができる。場合によっては、ドライバ122によってコンパイルされ、計算ユニット132上で実行されるジオメトリシェーダプログラムは、ジオメトリシェーダステージ312の操作を実行する。
ラスタライザステージ314は、ラスタライザステージ314の上流で生成された単純なプリミティブ(三角形)を受け入れてラスタライズする。ラスタライズは、何れのスクリーンピクセル(又は、サブピクセルのサンプル)が特定のプリミティブによってカバーされるかを決定することから構成されている。ラスタライズは、固定機能のハードウェアによって実行される。
ピクセルシェーダステージ316は、上流で生成されたプリミティブ及びラスタライズの結果に基づいて、スクリーンピクセルの出力値を計算する。ピクセルシェーダステージ316は、テクスチャメモリからテクスチャを適用してもよい。ピクセルシェーダステージ316の操作は、ドライバ122によってコンパイルされ、計算ユニット132で実行されるピクセルシェーダプログラムによって実行される。
出力マージャステージ318は、ピクセルシェーダステージ316からの出力を受け入れ、これらの出力をフレームバッファ内に結合(マージ)し、zテスト及びアルファブレンディング等の操作を実行することによって、スクリーンピクセルの最終色を決定する。
1つの動作モードでは、ラスタライザステージ314によって実行されるラスタライズは、ピクセルシェーダステージ316によって実行されるピクセルシェーディングと同じ解像度で実行される。上記の説明よりも詳細な背景として、ラスタライザステージ314は、前のステージから三角形を受け入れ、当該三角形に対してスキャン変換を実行してフラグメントを生成する。フラグメントは、レンダーターゲットの個々のピクセルのデータであり、位置、深度及びカバレッジデータ等の情報を含み、ピクセルシェーダステージの後に、色等のシェーディングデータを含む。レンダーターゲットは、レンダリングが実行される(すなわち、色又は他の値が書き込まれている)ターゲット画像である。
通常、フラグメントはクワッドにグループ化され、各クワッドは、4つの隣接するピクセル位置に対応するフラグメント(すなわち、2×2フラグメント)を含む。三角形のスキャン変換は、三角形によってカバーされているピクセル位置毎にフラグメントを生成することを含む。レンダーターゲットがマルチサンプル画像である場合、各ピクセルは、複数のサンプル位置を有し、その各々がカバレッジについてテストされる。フラグメントは、三角形によってカバーされているピクセル領域内のサンプルのカバレッジデータを記録する。ラスタライザステージ314によって生成されたフラグメントは、ピクセルシェーダステージ316に送信され、ピクセルシェーダステージ316は、これらのフラグメントの色値を決定し、同様に他の値を決定してもよい。
同じ解像度でラスタライズ及びピクセルシェーディングを実行することは、ラスタライザによって生成されたフラグメント毎に、ピクセルシェーダ316が当該フラグメントの色を決定するための計算を実行することを意味する。つまり、ピクセルが占めるスクリーンスペースの面積は、色を決定する精度と同じ面積である。一例では、計算ユニット132のSIMDベースのハードウェアでは、ラスタライザステージ314によって生成された各フラグメントは、異なるワークアイテムによってシェーディングされる。したがって、生成されたフラグメントと、これらのフラグメントをシェーディングするために生成されたワークアイテムとの間には、1対1の対応関係がある。ラスタライザステージ314は、通常、前にレンダリングされたフラグメントによって隠されたフラグメントをカリングする深度テスト(depth testing)を実行することに留意されたい。したがって、この深度カリングで残存したフラグメントと、残存したフラグメントを着色するために生成されたワークアイテムとの間には、1対1の対応関係がある。シェーディングと同じ解像度でラスタライズが実行される動作モードを理解する別の方法は、三角形のエッジを定義できる解像度が、当該三角形の色を定義できる解像度に等しいことである。
上記の動作モードに関する問題の1つは、固定色又は色の低周波数変化を有する三角形のピクセルシェーディングと同じ解像度でラスタライズが行われることである。このような三角形の場合、近くのフラグメントに対するピクセルシェーディング演算が同じ又は類似の色を生成し、事実上冗長である。したがって、ピクセルシェーダ演算の数を大幅に少なくして、同様の結果を得ることができる。したがって、ラスタライズ解像度をシェーディング解像度から独立させることが有利であり、以下に、ピクセルシェーディングとは異なる解像度でラスタライズを行うための技術を説明する。このような技術の利点は、実行されるピクセルシェーダ演算の数が減少し、これにより、処理負荷が低減され、パフォーマンスが向上することである。
図4は、一例による、ピクセルシェーディングとは異なる解像度でラスタライズを実行するための技術を示す図である。図4は、一連のステップを示し、異なるステップの例示的な図を提供し、グラフィックス処理パイプライン134の何れのステージが何れのステップに関連しているかを示している。
この技術は、ステップ402から始まり、ラスタライザステージ314は、グラフィックス処理パイプライン134の前のステージから受信した三角形をラスタライズする。このラスタライズは、レンダーターゲットの解像度で実行される。ラスタライズは、三角形でカバーされているレンダーターゲットのサンプルを決定する。また、ラスタライザステージ314は、ステップ402で深度テストを実行する。一例では、深度テストは、三角形でカバーされている各サンプルの深度値を調べ、これらの深度値を、既に処理された三角形の深度値を記憶する深度バッファと比較することを含む。特定のサンプルの深度値は、特定のサンプルと同じ位置の深度バッファに記憶された深度値と比較される。サンプルが隠されていることを深度バッファが示している場合には当該サンプルが破棄され、サンプルが隠されていないことを深度バッファが示している場合には当該サンプルが存続する。いくつかの深度テストモードでは、存続しているサンプルによって、当該サンプルの位置の深度バッファが更新される。深度テストは、深度バッファ内の深度値と問題のサンプルの深度値との間の様々なタイプの比較(例えば、小なり比較(less-than comparison)、大なり比較(greater-than comparison)、等値比較(equal-to comparison)又は他のタイプの比較)に対応するモード等の異なるモード、及び、深度バッファを更新するための様々な条件(例えば、存続しているサンプルが更新をトリガしてもよいし、他の条件が更新をトリガしてもよいし、更新がスイッチオフされてもよい)で実行されてもよい。何れのサンプル位置がカバーされており、何れのサンプル位置が隠されていないかを示すデータは、この説明の他の箇所で説明するように、後の処理のためにグラフィックス処理パイプライン134の他の部分に渡される。
カバレッジデータ(細かいラスタライズデータとも呼ばれる)を除き、ラスタライズの結果はクワッドである。具体的には、三角形によってカバーされた少なくとも1つのサンプルを有するピクセル毎に、ラスタライザステージ314がフラグメントを生成する。ラスタライザ314は、これらのフラグメントからクワッドを生成する。クワッドは、1つ以上のこのようなフラグメントが三角形によって完全にカバーされていない場合でも、2×2ピクセルの隣接する部分のフラグメントを含む。この場合、このようなフラグメントは「ヘルパーピクセル」と呼ばれる(ヘルパーピクセルは、ヘルパーピクセル以外のピクセルの色の生成を支援するためにピクセルシェーダによって使用されるが、ピクセルシェーダによって決定された色は、フレームバッファに書き込まれない)。
また、ステップ402において、ラスタライザステージ314は、三角形のサンプルの1つ以上のシェーディングレートを決定する。シェーディングレートは、ピクセルシェーダステージ316において共にシェーディングされるピクセルの数を定義する。具体的には、シェーディングレートは、ピクセルシェーダステージ316の単一のワークアイテムによって決定された色がレンダーターゲット内のいくつのピクセル位置に与えられるかを決定する。例えば、シェーディングレートが4分の1である場合、ピクセルシェーダステージ316のワークアイテムは、レンダーターゲットの4つのピクセル位置の色を決定する。いくつかのピクセルの色は、三角形の外側にあるか、深度テストに基づいて隠されていることに起因して破棄される場合があるので、色は、ピクセルではなくピクセル位置に対して決定されると言われることに留意されたい。例えば、シェーディングレートが4分の1であり、これにより、特定のワークアイテムがレンダーターゲットの4つのピクセル位置の色を決定し、これらのうち3つのピクセル位置が三角形の外側にあるか隠されている場合には、ワークアイテムは、実際には、1つのピクセルのみの色を決定する。但し、ワークアイテムが色を決定した全てのピクセル位置が三角形内にあり、隠されていない可能性がある。このような状況では、1つのワークアイテムが、4つの異なるピクセルの色を決定する。
シェーディングレートは、以下の技術のうち1つ以上に基づいて、レンダーターゲットに適用される。タイルベースのレート決定技術では、レンダーターゲットがシェーディングレートタイルのセットに分割され、各シェーディングレートタイルに特定のシェーディングレートが割り当てられる。三角形ベースのレート決定技術では、特定のシェーディングレートが各プリミティブに割り当てられる。状態ベースのレート決定技術では、シェーディングレートの状態変化がパイプラインを介して伝播され、ラスタライザステージ314において、次のシェーディングレートの状態変化がラスタライザステージ314によって処理されるまで、後続のピクセルのシェーディングレートを設定する。これらの技術を組み合わせて、異なる技術に異なる優先度を与えてもよい。一例では、状態ベースのレート決定技術は、三角形のサンプルのデフォルトのシェーディングレートを定義する。この例では、タイルベースのレート決定技術が状態ベースの値を上書きし、三角形ベースのシェーディングレートが状態ベースの値及びタイルベースの値を上書きする。他の優先度が代わりに存在してもよいし、異なる技術が独立して適用されてもよい。
ラスタライズ図420は、三角形でカバーされているピクセル(カバーされているピクセル502)と、カバーされていないピクセル(カバーされていないピクセル504)と、を含む三角形506を示している。ラスタライズ図420は、レンダーターゲット(図示省略)の一部のみをカバーしており、レンダーターゲットの他の部分については、図示していないラスタライズが行われていることを理解されたい。図示した部分は、4つの異なるタイル508に分割される。これらのタイル508は、以下に詳細に説明するように、ピクセルを「ダウンサンプリング」して、ラスタライズ解像度とピクセルシェーディング解像度との分離を可能にするメカニズムの一部である。タイル508は、上述したシェーディングレートタイルと異なることに留意されたい。
ステップ404において、ラスタライザステージ314は、ステップ402での細かいラスタライズの結果として生成されたクワッドを、タイルバッファ図422で示すように、タイルバッファ510内に蓄積する。タイルバッファ510は、タイル508のクワッドを記憶する小さなメモリである。図4では、タイルバッファ510は、4つの2×2の隣接する細かいピクセルクワッドのサイズであるが、他の例では、タイルバッファ510は、異なる数のクワッドを記憶してもよい。細かいピクセル514が示されているが、これらは、ダウンサンプリングされた解像度ではなく、レンダーターゲットの解像度のピクセルに対応している。深度カリングされた(すなわち、ステップ402の深度テストで存続したピクセルがない)クワッドの場合、タイルバッファ510の対応する部分は空のままである。ラスタライザステージ314は、スクリーン位置に対して、クワッドが生成される順序を知っており、これにより、クワッドがいつ「失われた」かを決定することができる。
ステップ406において、ラスタライザステージは、(粗いクワッドの図424に示すように)シェーディングレートに基づいて粗いクワッド515を生成する。タイルバッファは、複数の粗いピクセル領域512を含むと考えることができる。粗いピクセル領域512のサイズは、シェーディングレートに依存する。具体的には、粗いピクセル領域512の各々は、シェーディングレートの逆数に等しいピクセル数を含む。例えば、シェーディングレートが4分の1である場合、粗いピクセル領域512の各々は、4つの細かいピクセル514を含む。シェーディングレートが2分の1である場合、粗いピクセル領域512の各々は、2つの細かいピクセル514を含み、以下同様である。
タイルバッファ510のサイズ及びシェーディングレートに基づいて、1つ以上の粗いクワッド515が生成される。生成される粗いクワッド515の数は、細かいピクセル514のタイルバッファ510のサイズに等しく、4(クワッド内の4ピクセル)で除算され、シェーディングレートで乗算される。したがって、図4の例のように、タイルバッファ510が16個のピクセルであり、シェーディングレートが4分の1である場合、生成される粗いクワッド515の数は16/4×(1/4)=1に等しい。同様のタイルバッファ510及び2分の1シェーディングレートの場合、2つの粗いクワッド515が生成される。
粗いクワッド515の各々は、4つの粗いピクセル520を含む。任意の特定の粗いピクセル520に割り当てられたカバレッジは、その粗いピクセル520に「潰された(collapsed)」細かいピクセル514に割り当てられたカバレッジの融合である。状況によっては、このような融合は、粗いピクセル520が過剰なカバレッジデータを有することになる。具体的には、グラフィックス処理パイプライン134は、ピクセルのカバレッジデータを指定するのに使用可能なビット数に対する制限を有する場合がある。この状況では、細かいピクセル514からのカバレッジデータが粗いピクセル520のカバレッジデータに融合されると、そのデータは忠実度が低下する。残っているカバレッジデータは、個々の細かいピクセルのカバレッジを幾何学的に表す。この考え方は、図6に関してより詳細に説明される。カバレッジを有しない粗いクワッド515が生成される場合、このような粗いクワッド515は生成されない。タイルバッファ510がレンダーターゲットの特定のタイル508について如何なるクワッドも受信していない場合、ラスタライザステージ314は、そのタイル508をカバーする三角形が存在しないか、又は、そのタイル508について生成されたクワッドが他のジオメトリによって隠されていることを決定する。その場合、そのタイル508に対して粗いクワッド515が生成されない。
ステップ408において、ラスタライザステージ314は、(図426に示すように)ステップ406で生成された粗いクワッド515の粗いピクセル520の位置を設定する。この位置は、粗いピクセル520に潰された細かいピクセル514を含む粗いピクセル領域512を幾何学的に表す。一例では、粗いピクセル520の位置は、対応する粗いピクセル領域512の中心に設定される。粗いピクセル520の位置を設定するための他の技術的に実行可能な技術が可能である。
ステップ410において、ピクセルシェーダステージ316は、ピクセルシェーディングの図524に示すように、生成された粗いクワッド515をシェーディングして、シェーディングされた粗いピクセル524を生成する。このシェーディングは標準的な方法で行われ、例えば、粗いピクセル520の各々は、SIMDハードウェアで処理されるワークアイテムとして起動する。
ステップ412において、出力マージャステージ318は、ステップ412において決定された細かいカバレッジデータを、変調の図526に示すように、シェーディングされた粗いピクセル524に適用する。具体的には、シェーディングされた粗いピクセル524の各々は、シェーディングレートに基づいてクローニングされ、各クローンは、シェーディングされた粗いピクセル524の色を取得して、シェーディングされた細かいピクセル526を生成する。ラスタライザステージ314によって生成されたサンプルカバレッジ内のデータに基づいて、シェーディングされた細かいピクセル526の各々にカバレッジが適用される。サンプルがそのデータでカバーされていない場合、そのサンプルは、対応するクローニングされた細かいピクセルで無効になる。ラスタライザステージ314によって生成されたデータにカバレッジを有しないクローニングされたピクセルも同様に、ピクセルカバレッジを有しないように設定される。ステップ412に含まれる動作は、本明細書では「変調」と呼ばれることがある。例えば、シェーディングされた粗いピクセル524は、ラスタライザステージ314によって生成されたカバレッジデータによって変調され、シェーディングされた細かいピクセル526を生成すると言える。
ステップ414において、ラスタライザステージ314からのサンプルカバレッジによって変更されたカバレッジを有する、シェーディングされた細かいピクセル526が、レンダーターゲットに書き込まれる。例えば、遅延z演算(late z operations)、ブレンディング等の他の遅延ピクセル演算を適用することができる。
図5は、いくつかの例による、タイルバッファ510及びタイルバッファ510の内容から、4分の1以外のシェーディングレートの粗いクワッドの生成を示す図である。具体的には、2:1水平構成550(1)、2:1垂直構成550(2)、及び、1:1パススルー構成550(3)が示されている。
2:1水平構成550(1)は、水平方向に隣接する2つの細かいピクセル514が粗いピクセル520に組み合わされる2分の1シェーディングレートを有する。同様に、2:1垂直構成550(2)は、垂直方向に隣接する2つの細かいピクセル514が粗いピクセル520に組み合わされる2分の1シェーディングレートを有する。図示した2:1構成の両方について、4分の1シェーディングレートのように、4つの粗いピクセル520が粗いクワッド514内に含まれる。タイルバッファ510が8つの粗いピクセル520に対応するので、2つのクワッドが生成される。また、粗いピクセル520の各々には、粗いピクセル520に蓄積される細かいピクセル514のカバレッジが割り当てられ、粗いピクセル520が細かいピクセル514の全てのカバレッジデータを記憶するのに十分なビットを含まない場合、カバレッジの忠実度は低下する。ピクセル位置調整は、粗いピクセル520の各々の位置を、粗いピクセル領域512を幾何学的に表す位置に設定することを含む。一例では、この位置は、粗いピクセル領域512の中心である。粗いピクセル520の位置を設定するための他の技術的に実行可能な技術も可能である。1:1構成550(3)では、特別な動作が実行されない。粗いクワッドが存在せず、ラスタライズによって生成されたクワッド540は、変更なしに出力され、ピクセルシェーダステージ316によってシェーディングされる。
図6は、一例による、マルチサンプルレンダーターゲットへのレンダリングに関連するいくつかの詳細を含む、図4に示す技術の詳細を示す図である。図6は、図4のステップのいくつかを示しており、簡潔にするために他のステップを省略している。
細かいラスタライズデータ606は、マルチサンプルレンダーターゲットについて、ステップ402においてラスタライザステージ314によって生成されたラスタライズデータを含む。マルチサンプルレンダーターゲットは、各ピクセルが複数のカバレッジサンプルを有するレンダーターゲットである。図6では、簡潔にするために、単一の粗いピクセル領域512のみが示されている。さらに、このシェーディングレートは、一例としてのみ使用されているが、4分の1である。4分の1のシェーディングレートは、粗いピクセル領域512が4つの細かいピクセル514を含むことを意味する。
細かいラスタライズデータ606は、(三角形のエッジ602によって画定されるように)三角形の内側にあるいくつかのカバーされたサンプル608と、三角形の外側にあるいくつかのカバーされていないサンプル604と、を示している。「保守的なダウンサンプル(conservative downsample)」操作は、図4のステップ406に対応する。具体的には、保守的なダウンサンプル操作は、各ピクセルで使用可能なサンプルカバレッジデータの制限に起因するサンプルカバレッジデータの減少と共に、複数の細かいピクセル514が単一の粗いピクセル520に潰されたことを示している。上述したように、このように潰されることは、細かいピクセル514のより忠実度の高いサンプルカバレッジを幾何学的に表すサンプルカバレッジのセットを保持することを含む。図6では、各サンプルは、異なる細かいピクセル514に対応している。ダウンサンプルは、細かいピクセル514がカバーされている任意のサンプルを有する場合、その細かいピクセル514に対応する粗いピクセル520のサンプルがカバーされていると考えられるという点で保守的である。細かいピクセル514毎に粗いピクセル620内に1つのサンプルのみが存在する必要がないことに留意されたい。粗いピクセル520内の複数のサンプルは、単一の細かいピクセル514に対応してもよい。この場合、粗いピクセル520内の各サンプルは、細かいピクセル514の対応するサンプルを幾何学的に表すことになる。
左下には、ピクセルシェーダによる処理後の粗いピクセル520が、シェーディングされた粗いピクセル520として示されている。このシェーディングされた粗いピクセル524は、(PS-C)と略された「ピクセルシェーダが適用された色」とラベル付けされた色で着色されている。このシェーディングされた粗いピクセル524は、図4のステップ410の出力に対応する。この操作の後、シェーディングレートに基づいて、シェーディングされた粗いピクセル524がアップサンプリングされる。具体的には、シェーディングされた粗いピクセル524は、シェーディングレートの逆数(例えば、図6の4)に等しい複数の細かいピクセルにクローニングされる。細かいピクセルの各々には、シェーディングされた粗いピクセル524の色が割り当てられる。このような細かいピクセルの各々におけるサンプルの数は、粗いクワッドを生成する前の細かいピクセル514のサンプルの数に等しい。クローニングされた細かいピクセルの各々の全てのサンプルは、バイナリ形式で設定される。シェーディングされた粗いピクセル524内の対応するサンプルがカバーされている場合、対応する細かいピクセルの全てのサンプルがカバーされ、シェーディングされた粗いピクセル524内の対応するサンプルがカバーされていない場合、対応する細かいピクセル内の全てのサンプルがカバーされない。最後に、これらの細かいサンプルは、細かいラスタライズデータ606にマージされる。マージは、ファイナライズされていないカバレッジ525を有するシェーディングされた細かいピクセルのサンプルと、細かいラスタライズデータ606の対応するサンプルと、に「AND」を適用することから構成される。シェーディングされた細かいピクセルのサンプルは、ファイナライズされていないカバレッジ525を有するシェーディングされた細かいピクセル内の対応するサンプルと、細かいラスタライズデータ606内の対応するサンプルと、の両方がカバーされている場合に、カバレッジであるとみなされる。一方又は両方がカバーされていない場合、シェーディングされた細かいピクセル526内のサンプルはカバーされていない。
図7は、図6の代替例を示しており、シェーディングされた粗いピクセル524内のいくつかのサンプルカバレッジが、ピクセルシェーダによって削除されている。ピクセルシェーダステージ316では、シェーディングされるクワッドのカバレッジを変更又は設定することができる。ピクセルシェーダステージ316が粗いクワッドのサンプルを削除する(例えば、これらのサンプルをカバーしないように設定する)場合、細かいラスタライズデータ606の対応するサンプルがカバーされていると考えられるが、ステップ412から出力されるシェーディングされた細かいピクセル526の対応するサンプルはカバーされない。図7の例は、図6に示すのと同じ細かいラスタライズデータ606を使用する。したがって、図7では、ピクセルシェーダステージ316が、シェーディングされた粗いピクセル524の対応するサンプルを削除しているので、細かいラスタライズデータ606が、左の2つの細かいピクセル514のサンプルのいくつかがカバーされていることを示しても、左の2つの細かいピクセル516がカバーされているとみなされない。
本明細書の開示に基づいて多くの変形が可能であることを理解されたい。機能及び要素は、特定の組み合わせで上述したように説明されているが、各機能又は要素は、他の機能や要素なしに単独で使用されてもよいし、他の機能や要素を伴って若しくは伴わずに様々な組み合わせで使用されてもよい。
提供された方法は、汎用コンピュータ、プロセッサ又はプロセッサコアにおいて実施されてもよい。適切なプロセッサには、例として、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連する1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、及び/又は、ステートマシンが含まれる。このようなプロセッサは、処理されたハードウェア記述言語(HDL)命令、及び、ネットリストを含む他の中間データ(このような命令はコンピュータ可読媒体に記憶され得る)の結果を使用して製造プロセスを構成することによって製造されてもよい。このような処理の結果は、本実施形態の態様を実施するプロセッサを製造するために半導体製造プロセスにおいて使用されるマスクワークであってもよい。
本明細書で提供される方法又はフローチャートは、汎用コンピュータ若しくはプロセッサによる実行のために非一時的なコンピュータ可読記憶媒体に組み込まれたコンピュータプログラム、ソフトウェア、ファームウェアにおいて実装されてもよい。非一時的なコンピュータ可読記憶媒体の例には、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスク及びリムーバブルディスク等の磁気媒体、光磁気媒体、光学媒体(CD-ROMディスク等)、デジタル多用途ディスク(DVD)等が含まれる。

Claims (18)

  1. 三次元グラフィックスを、独立したラスタライズ及びピクセルシェーディング解像度で処理して、画像をレンダーターゲットにレンダリングする方法であって、
    ラスタライザが、三角形をラスタライズして、細かいラスタライズデータと1つ以上のクワッドのセットとを生成することと、
    前記ラスタライザによって出力された前記1つ以上のクワッドのセットのうち少なくとも1つを、タイルバッファサイズを有するタイルバッファに蓄積することと、
    前記タイルバッファ内のクワッドをダウンサンプリングして、粗いクワッドを生成することであって、前記ダウンサンプリングすることは、前記1つ以上のクワッドのセットのうち少なくとも1つに対して定義されたシェーディングレートに基づいており、前記シェーディングレートは、前記タイルバッファサイズに適合する第2の数のクワッドから生成する第1の数のクワッドを示す、ことと、
    前記粗いクワッドをシェーディングして、シェーディングされた粗いクワッドを生成することと、
    前記シェーディングされた粗いクワッドを前記細かいラスタライズデータで変調することと、を含む、
    方法。
  2. 前記タイルバッファは、前記1つ以上のクワッドのセットのうち2つ以上のクワッドのデータを記憶するのに十分な容量を有するメモリを含む、
    請求項1の方法。
  3. 前記細かいラスタライズデータに対して深度テストを実行して、前記1つ以上のクワッドから隠されたピクセルを除去することをさらに含む、
    請求項1の方法。
  4. 前記1つ以上のクワッドのセットのうち少なくとも1つをタイルバッファに蓄積することは、
    前記タイルバッファを、レンダーターゲットのタイルに対応する前記1つ以上のクワッドのセットのクワッドで充填することであって、三角形によってカバーされないクワッド又は深度カリングされたクワッドに対応する前記タイルバッファの部分はクワッドで充填されない、ことを含む、
    請求項1の方法。
  5. 前記シェーディングレートを決定することをさらに含む、
    請求項1の方法。
  6. 前記タイルバッファ内のクワッドをダウンサンプリングすることは、
    前記タイルバッファ内の前記クワッドのピクセルから生成された粗いピクセルをそれぞれ含む1つ以上の粗いクワッドのセットを、前記シェーディングレートに基づいて生成することを含む、
    請求項5の方法。
  7. 粗いピクセルの各々は、前記1つ以上のクワッドのセットのピクセルの数に対応する前記レンダーターゲットの領域に対応しており、前記数は、前記シェーディングレートに基づいている、
    請求項6の方法。
  8. 前記レンダーターゲットは、マルチサンプリングされたレンダーターゲットであり、
    粗いピクセルの各々は、前記1つ以上のクワッドのセットの前記対応するピクセルに関連するマルチサンプルカバレッジを含む、
    請求項6の方法。
  9. 次元グラフィックスを、独立したラスタライズ及びピクセルシェーディング解像度で処理して、画像をレンダーターゲットにレンダリングするアクセラレーテッド処理デバイス(APD)であって、
    ラスタライザステージと、
    ピクセルシェーダステージと、
    出力マージャステージと、を備え、
    前記ラスタライザステージは、
    三角形をラスタライズして、細かいラスタライズデータと1つ以上のクワッドのセットとを生成することと、
    ラスタライザによって出力された前記1つ以上のクワッドのセットのうち少なくとも1つを、タイルバッファサイズを有するタイルバッファに蓄積することと、
    前記タイルバッファ内のクワッドをダウンサンプリングして、粗いクワッドを生成することであって、前記ダウンサンプリングすることは、前記1つ以上のクワッドのセットのうち少なくとも1つに対して定義されたシェーディングレートに基づいており、前記シェーディングレートは、前記タイルバッファサイズに適合する第2の数のクワッドから生成する第1の数のクワッドを示す、ことと、を行うように構成されており、
    前記ピクセルシェーダステージは、
    前記粗いクワッドをシェーディングして、シェーディングされた粗いクワッドを生成するように構成されており、
    前記出力マージャステージは、
    前記シェーディングされた粗いクワッドを前記細かいラスタライズデータで変調するように構成されている、
    APD。
  10. 前記タイルバッファは、前記1つ以上のクワッドのセットのうち2つ以上のクワッドのデータを記憶するのに十分な容量を有するメモリを含む、
    請求項のAPD。
  11. 前記ラスタライザステージは、
    前記細かいラスタライズデータに対して深度テストを実行して、前記1つ以上のクワッドから隠されたピクセルを除去することを行うように構成されている、
    請求項のAPD。
  12. 前記ラスタライザステージは、
    前記タイルバッファを、レンダーターゲットのタイルに対応する前記1つ以上のクワッドのセットのクワッドで充填することであって、三角形によってカバーされないクワッド又は深度カリングされたクワッドに対応する前記タイルバッファの部分はクワッドで充填されない、ことによって、前記1つ以上のクワッドのセットのうち少なくとも1つをタイルバッファに蓄積することを行うように構成されている、
    請求項のAPD。
  13. 前記ラスタライザステージは、前記シェーディングレートを決定することをさらに行うように構成されている、
    請求項のAPD。
  14. 前記ラスタライザステージは、
    前記タイルバッファ内の前記クワッドのピクセルから生成された粗いピクセルをそれぞれ含む1つ以上の粗いクワッドのセットを、前記シェーディングレートに基づいて生成することによって、前記タイルバッファ内のクワッドをダウンサンプリングするように構成されている、
    請求項13のAPD。
  15. 粗いピクセルの各々は、前記1つ以上のクワッドのセットのピクセルの数に対応する前記レンダーターゲットの領域に対応しており、前記数は、前記シェーディングレートに基づいている、
    請求項14のAPD。
  16. 前記レンダーターゲットは、マルチサンプリングされたレンダーターゲットであり、
    粗いピクセルの各々は、前記1つ以上のクワッドのセットの前記対応するピクセルに関連するマルチサンプルカバレッジを含む、
    請求項13のAPD。
  17. デバイスであって、
    プロセッサと、
    前記プロセッサから受信したコマンドを、独立したラスタライズ及びピクセルシェーディング解像度で処理して、画像をレンダーターゲットにレンダリングするアクセラレーテッド処理デバイス(APD)と、を備え、
    前記APDは、
    ラスタライザステージと、
    ピクセルシェーダステージと、
    出力マージャステージと、を備え、
    前記ラスタライザステージは、
    三角形をラスタライズして、細かいラスタライズデータと1つ以上のクワッドのセットとを生成することと、
    前記1つ以上のクワッドのセットのうち少なくとも1つを、タイルバッファサイズを有するタイルバッファに蓄積することと、
    前記タイルバッファ内のクワッドをダウンサンプリングして、粗いクワッドを生成することであって、前記ダウンサンプリングすることは、前記1つ以上のクワッドのセットのうち少なくとも1つに対して定義されたシェーディングレートに基づいており、前記シェーディングレートは、前記タイルバッファサイズに適合する第2の数のクワッドから生成する第1の数のクワッドを示す、ことと、を行うように構成されており、
    前記ピクセルシェーダステージは、
    前記粗いクワッドをシェーディングして、シェーディングされた粗いクワッドを生成するように構成されており、
    前記出力マージャステージは、
    前記シェーディングされた粗いクワッドを前記細かいラスタライズデータで変調するように構成されている、
    デバイス。
  18. 前記タイルバッファは、前記1つ以上のクワッドのセットのうち2つ以上のクワッドのデータを記憶するのに十分な容量を有するメモリを含む、
    請求項17のデバイス。
JP2020511305A 2017-08-25 2018-08-21 可変レートシェーディング Active JP7266021B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/687,421 2017-08-25
US15/687,421 US10510185B2 (en) 2017-08-25 2017-08-25 Variable rate shading
PCT/US2018/047401 WO2019040541A1 (en) 2017-08-25 2018-08-21 VARIABLE RATE SURFACE

Publications (2)

Publication Number Publication Date
JP2020532789A JP2020532789A (ja) 2020-11-12
JP7266021B2 true JP7266021B2 (ja) 2023-04-27

Family

ID=65436111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020511305A Active JP7266021B2 (ja) 2017-08-25 2018-08-21 可変レートシェーディング

Country Status (6)

Country Link
US (1) US10510185B2 (ja)
EP (1) EP3673465A4 (ja)
JP (1) JP7266021B2 (ja)
KR (1) KR102192065B1 (ja)
CN (1) CN111066066B (ja)
WO (1) WO2019040541A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10460513B2 (en) 2016-09-22 2019-10-29 Advanced Micro Devices, Inc. Combined world-space pipeline shader stages
US10657699B1 (en) * 2018-12-08 2020-05-19 Arm Limited Performing texturing operations for sets of plural execution threads in graphics processing systems
US11276211B2 (en) * 2018-12-20 2022-03-15 Advanced Micro Devices, Inc. Integration of variable rate shading and super-sample shading
US11170533B1 (en) * 2020-07-27 2021-11-09 Weta Digital Limited Method for compressing image data having depth information
US11989918B2 (en) 2020-09-25 2024-05-21 Advanced Micro Devices, Inc. Swizzle mode detection
US20220414816A1 (en) * 2021-06-24 2022-12-29 Intel Corporation Dynamic dependency scoreboard for overlapping pixels of primitives
US12067649B2 (en) 2021-06-29 2024-08-20 Advanced Micro Devices, Inc. Per-pixel variable rate shading controls using stencil data
US11763521B2 (en) 2021-08-13 2023-09-19 Samsung Electronics Co., Ltd. Method and apparatus for the automation of variable rate shading in a GPU driver context
US11935175B2 (en) * 2022-04-07 2024-03-19 Huawei Technologies Co., Ltd. Apparatus, method, and computer-readable medium for image processing using variable-precision shading
CN116957900A (zh) * 2022-04-20 2023-10-27 象帝先计算技术(重庆)有限公司 图形处理器、系统、电子装置、设备及图形处理方法
GB2624205A (en) * 2022-11-10 2024-05-15 Imagination Tech Ltd Graphics processing system and method of rendering

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170243395A1 (en) 2013-12-12 2017-08-24 Intel Corporation Decoupled Shading Pipeline

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8044956B1 (en) 2007-08-03 2011-10-25 Nvidia Corporation Coverage adaptive multisampling
US8040357B1 (en) * 2007-08-15 2011-10-18 Nvidia Corporation Quotient remainder coverage system and method
US20090102843A1 (en) * 2007-10-17 2009-04-23 Microsoft Corporation Image-based proxy accumulation for realtime soft global illumination
US10096079B2 (en) * 2013-06-10 2018-10-09 Sony Interactive Entertainment Inc. Fragment shaders perform vertex shader computations
US10102603B2 (en) * 2013-06-10 2018-10-16 Sony Interactive Entertainment Inc. Scheme for compressing vertex shader output parameters
US9552667B2 (en) * 2013-12-13 2017-01-24 Nvidia Corporation Adaptive shading in a graphics processing pipeline
US9569886B2 (en) 2013-12-19 2017-02-14 Intel Corporation Variable shading
US9905046B2 (en) * 2014-04-03 2018-02-27 Intel Corporation Mapping multi-rate shading to monolithic programs
US10242493B2 (en) * 2014-06-30 2019-03-26 Intel Corporation Method and apparatus for filtered coarse pixel shading
US9934606B2 (en) * 2014-09-16 2018-04-03 Intel Corporation Deferred coarse pixel shading
GR20140100528A (el) * 2014-10-20 2016-06-01 Arm Limited Ενας βασισμενος σε πλακιδια επεξεργαστης γραφικων και μια μεθοδος επεξεργασιας γραφικων σε ενα βασισμενο σε πλακιδια επεξεργαστη
US10985078B2 (en) 2015-11-06 2021-04-20 Lam Research Corporation Sensor and adjuster for a consumable
US10262455B2 (en) 2015-12-04 2019-04-16 Intel Corporation Merging fragments for coarse pixel shading using a weighted average of the attributes of triangles
US10192280B2 (en) * 2016-04-08 2019-01-29 Qualcomm Incorporated Per-vertex variable rate shading
US10147227B2 (en) * 2017-02-17 2018-12-04 Microsoft Technology Licensing, Llc Variable rate shading

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170243395A1 (en) 2013-12-12 2017-08-24 Intel Corporation Decoupled Shading Pipeline

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
K. Vaidyanathan 他,Coarse Pixel Shading,High Performance Graphics 2014,EUROGRAPHICS DIGITAL LIBRARY,2014年,p9-18,https://diglib.eg.org

Also Published As

Publication number Publication date
EP3673465A4 (en) 2021-05-19
WO2019040541A1 (en) 2019-02-28
KR102192065B1 (ko) 2020-12-16
JP2020532789A (ja) 2020-11-12
CN111066066A (zh) 2020-04-24
CN111066066B (zh) 2022-07-05
EP3673465A1 (en) 2020-07-01
US20190066371A1 (en) 2019-02-28
KR20200035467A (ko) 2020-04-03
US10510185B2 (en) 2019-12-17

Similar Documents

Publication Publication Date Title
JP7266021B2 (ja) 可変レートシェーディング
US11158106B2 (en) VRS rate feedback
US11276211B2 (en) Integration of variable rate shading and super-sample shading
JP7122396B2 (ja) グラフィックスパイプラインにおけるメモリ使用削減のためのコンパイラ支援技法
JP2019537164A (ja) Zカリング後の重複フラグメントの除去又は識別
US20240257435A1 (en) Hybrid binning
US12067649B2 (en) Per-pixel variable rate shading controls using stencil data
US11030791B2 (en) Centroid selection for variable rate shading
US20220414939A1 (en) Render target compression scheme compatible with variable rate shading
US10832465B2 (en) Use of workgroups in pixel shader
US11900499B2 (en) Iterative indirect command buffers
US20220319091A1 (en) Post-depth visibility collection with two level binning
US20240104685A1 (en) Device and method of implementing subpass interleaving of tiled image rendering
JP2023532433A (ja) マルチサンプルアンチエイリアシングのためのロード命令

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220628

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230417

R150 Certificate of patent or registration of utility model

Ref document number: 7266021

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150