JP2011524562A - 拡大縮小可能で且つ統合化されたコンピュータシステム - Google Patents

拡大縮小可能で且つ統合化されたコンピュータシステム Download PDF

Info

Publication number
JP2011524562A
JP2011524562A JP2011511650A JP2011511650A JP2011524562A JP 2011524562 A JP2011524562 A JP 2011524562A JP 2011511650 A JP2011511650 A JP 2011511650A JP 2011511650 A JP2011511650 A JP 2011511650A JP 2011524562 A JP2011524562 A JP 2011524562A
Authority
JP
Japan
Prior art keywords
scalable
texture
texel data
integrated
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011511650A
Other languages
English (en)
Other versions
JP5491498B2 (ja
Inventor
ジェイ.メンター マイケル
ティー.ブレディ ジェフリー
シー.ファウラー マーク
ピー.ジニー マルコス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Micro Devices Inc
Original Assignee
Advanced Micro Devices Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Micro Devices Inc filed Critical Advanced Micro Devices Inc
Publication of JP2011524562A publication Critical patent/JP2011524562A/ja
Application granted granted Critical
Publication of JP5491498B2 publication Critical patent/JP5491498B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/12Frame memory handling
    • G09G2360/121Frame memory handling using a cache memory
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/12Frame memory handling
    • G09G2360/125Frame memory handling using unified memory architecture [UMA]
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/363Graphics controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)

Abstract

【解決手段】
拡大縮小可能で且つ統合化されたコンピュータシステムは、拡大縮小可能で修復可能な汎用のグラフィックスシェーディング動作、メモリロード/ストア動作及びテクスチャフィルタリングを実行する。拡大縮小可能で統合化されたコンピュータユニットモジュールはシェーダパイプアレイ、テクスチャマッピングユニット、及びレベル1テクスチャキャッシュシステムを備えている。拡大縮小可能で且つ統合化されたコンピュータユニットモジュールは、特定の一連のピクセル、頂点、プリミティブ、表面、又は一般的コンピュータ作業項目に対するALU命令、入力/出力命令、及びテクスチャ又はメモリ要求をシェーダプログラムから受け入れ、関連する動作を実行してプログラムされた出力データを算出する。テクスチャマッピングユニットは、フェッチし、フォーマットし、そして命令されたフィルタリング補間を実行するためにソースデータアドレス及び命令定数を受け入れ、レベル1テクスチャキャッシュシステム内に記憶される特定の対応するデータに基いて、フォーマットされた結果を生成する。テクスチャマッピングユニットは、アドレス生成システム、プリフォーマッタモジュール、補間器モジュール、積算器モジュール及びフォーマットモジュールから構成される。拡大縮小可能で且つ統合化されたコンピュータシステムのための方法もまた提示される。
【選択図】図1

Description

本発明は概してコンピュータシステムによって実行される計算処理に関し、より特定的にはコンピュータシステムによって実行されるグラフィックス処理タスクに関する。
グラフィックス処理ユニット(GPU)は、グラフィックス処理タスクを実行するために特別に構成された複合的な(complex)集積回路である。GPUは、例えば、ビデオゲームアプリケーション等のエンドユーザアプリケーションによって要求されるグラフィックス処理タスクを実行することができる。このようなアプリケーションに対しては、例えばエンドユーザアプリケーションとGPUの間にいくつものソフトウエアの階層が存在する。
エンドユーザアプリケーションはアプリケーションプログラミングインタフェース(API)と通信する。APIは、GPUに依存するフォーマットでよりはむしろ標準化されたフォーマットでエンドユーザアプリケーションがグラフィックスデータ及び命令を出力することを可能にする。マイクロソフトコープ(Microsoft Corp.)により開発されたDirectX(登録商標)及びシリコングラフィックスインク(Silicon Graphics, Inc.)により開発されたOpenGL(登録商標)を含め、何種類ものAPIが商業的に入手可能である。APIはドライバと通信する。ドライバはAPIから受け取った標準コードをGPUが理解する固有のフォーマットの命令に変換する。ドライバは典型的にはGPUの製造業者によって書かれる。GPUはそうしてドライバからの命令を実行する。
GPUは、描画(rendering)として知られる処理を実行することによって、画像要素のより高い階層記述に基いて、それらが共同して画像を形成することになる個々のピクセルを生成する。GPUは典型的には、ピクセル、テクスチャ、及び幾何データを処理するパイプラインを用いて連続的描画を実行する。これらのパイプラインはしばしば、固定機能特殊目的パイプラインの集合、例えばラスタライザ(rasterizers)、セットアップエンジン(setup engines)、カラーブレンダ(color blenders)、ヒエラチカルデプス(hieratical depth)、テクスチャマッピング(texture mapping)及びシェーダパイプ又はシェーダパイプラインで達成可能なプログラム可能な段階の集合の意味を持ち、「シェーダ」はコンピュータグラフィックスでの用語であり、主として結果を描画することを実行するためにグラフィックリソースによって用いられる一連のソフトウエア命令を参照する。またGPUは、より高いスループットを得るために並列処理設計にある多重化プログラム可能パイプラインを採用することもできる。シェーダパイプラインの多重化はシェーダパイプアレイと称されることもある。
シェーダパイプアレイがその継続的な描画処理を実行するに従って、パイプライン内の製造上の不完全性(製造欠陥)が知られ得るようになってきており、それによる障害がパイプライン内で発生する可能性がある。何らかの論理修復を伴わないシステム内の小さな欠陥又は障害は致命的であり、デバイスを不良品又は不完全なものにしてしまうことがある。
また、GPUはテクスチャマッピングをも支持する。テクスチャマッピングは、テクスチャの隣接ピクセル即ちテクセル(texels)の色の使用を通して、テクスチャマッピングされたピクセルに対してテクスチャ色を決定するために用いられる処理である。その処理はテクスチャ平滑化又はテクスチャ補間とも称される。しかし、高画像品質テクスチャマッピングは高度な計算上の複雑性を必要とする。
新しいソフトウエアアプリケーションのかつてない複雑性の高まりとAPIシェーダ言語の進歩に鑑み、高度な描画及び汎用計算、計算上の複雑性に対して高品質な描画、テクスチャマッピング及び汎用メモリアクセスをGPUが提供することに対する要求が更に高まっている。
更に、統合化されたシェーダを備えたGPUは、ピクセル、頂点、プリミティブ(primitive)、表面からの多くの種類のシェーダ処理を同時に支持もするので、汎用計算はより高性能な汎用メモリアクセス能力に対する要求を高めている。
従って、前述した欠点を軽減するシステム及び/又は方法が求められている。特に、全体のシステム性能に対する影響を最小限に抑えて、不完全な内部部分回路(internal subcircuit)による影響を克服する能力を有し、汎用のロード/ストア動作が可能な多目的テクスチャマッピングシステムを伴うシェーダパイプのための拡大縮小可能で且つ統合化されたシェーダ設計アプローチが要望されている。
この欄は本発明の幾つかの側面を概説することを目的としており、幾つかの望ましい実施形態を簡潔に紹介するためのものである。この欄の目的を曖昧にすることを避けるために単純化又は省略がなされているかもしれない。当該単純化又は省略が本発明の範囲を限定することは意図されていない。
ここに具象化され且つ広く記述される本発明の原理に従い、本発明は行ベースの(row based)拡大縮小可能で且つ統合化されたコンピュータユニットモジュールに関連する方法及び装置を含む。拡大縮小可能で且つ統合化されたコンピュータユニットモジュールはシェーダパイプアレイ及びテクスチャマッピングユニットをレベル1キャッシュシステムと共に含み、不完全なシェーダパイプに予定されていたシェーダパイプデータを処理する能力を有してテクスチャマッピング及び一般的なロード/ストアアクセスを実行する。拡大縮小可能で且つ統合化されたコンピュータシステムは、シーケンサと、レベル2テクスチャキャッシュシステム従って外部メモリシステムへのアクセスを有する拡大縮小可能で且つ統合化されたコンピュータユニットモジュールとを備えている。拡大縮小可能で且つ統合化されたコンピュータシステムは、入力、出力、ALU及びテクスチャを含むシェーダプログラム実行命令又はシェーダパイプからのアドレスデータを伴う一般的なメモリロード/ストア要求並びにプログラム定数を受け入れ、特定のピクセル又はスレッド(thread)に対するパイプラインされたアドレス及びフィルタリング動作を制御する状態データに基き返送テクセル又はメモリデータを生成するように構成される。テクスチャフィルタシステムはシェーダプログラム命令及び定数に基き構成され、シェーダパイプライン内に記憶されているアドレスに対してキャッシュシステム内に記憶されているテクセルデータに基きフォーマットされた補間を生成する。
本発明の実施形態では、行ベースシェーダパイプの拡大縮小可能で且つ統合化されたコンピュータシステムは、冗長シェーダパイプシステムを更に備えている。冗長シェーダパイプシステムはシェーダパイプアレイ内の不完全なシェーダパイプに予定されていたシェーダパイプデータを処理するように構成される。
他の実施形態では、行ベースの拡大縮小可能で且つ統合化されたコンピュータシステムはレベル2テクスチャキャッシュシステムを更に備えている。レベル2テクスチャキャッシュシステムは任意のレベル1・行ベーステクスチャキャッシュシステムによって読み出し及び書き込みが可能である。
他の実施形態では、拡大縮小可能で且つ統合化されたコンピュータユニットモジュールにおけるテクスチャマッピングユニット内のテクスチャフィルタは、プリフォーマッタモジュール、補間器モジュール、積算器モジュール、及びフォーマットモジュールを更に備えている。プリフォーマッタモジュールは、テクセルデータを受け取り、それを正規化された固定点フォーマットに変換するように構成される。補間器モジュールは、プリフォーマッタモジュールからの正規化された固定点テクセルデータに対する補間を行い、再正規化浮動小数点テクセルデータを生成するように構成される。積算器モジュールは、補間器モジュールからの浮動小数点テクセルデータを積算して、望ましいレベルの双線形、三重線形、及び異方性フィルタリングを達成するように構成される。フォーマットモジュールは、積算器モジュールからのテクセルデータを標準的な浮動小数点表現に変換するように構成される。
本発明の更なる特徴及び利点の他、本発明の種々の実施形態の構成及び動作は、添付の図面を参照して以下に詳細に記述されている。本発明がここに記述される特定の実施形態に限定されないことを特記しておく。当該実施形態は例示の目的のみのためにここに提示されている。追加的な実施形態はここに含まれる教示に基き関連分野を含めた当業者にとって明らかであろう。
添付の図面は、ここに組み込まれまた出願書類の一部をなし、本発明の実施形態を示しそして、上述の一般的な説明及び以下に示される実施形態の詳細な説明と共に本発明の原理を説明するのに役立つ。
図1は拡大縮小可能で且つ統合化されたコンピュータシステムの実装を示すシステム図である。
図2はシェーダパイプアレイの詳細を説明するための拡大縮小可能で且つ統合化されたコンピュータシステムの実装を示すシステム図である。
図3はテクスチャマッピングユニットの詳細を説明するための拡大縮小可能で且つ統合化されたコンピュータシステムの実装を示すシステム図である。
図4は拡大縮小可能で且つ統合化されたコンピュータシステムのための方法の実施を示すフローチャートである。
本発明の特徴及び利益は、図面と共に以下に記述される詳細な説明からより明らかになり、図面において同様の参照符号は全体を通して対応する要素を特定する。図面において、同様の参照数字は一般的に同一の、機能的に類似の、及び/又は構造的に類似の要素を示す。ある要素が最初に現れる図面は対応する参照番号の一番左の桁の1つ以上の数字によって示される。
本発明は、本発明の種々の「実施形態」の以下の説明からよりよく理解されるであろう。このように、特定の種々の「実施形態」は本発明の種々の見え方であり、しかしその見え方の各々は本発明全体ではない。1つの視点においては、本発明は拡大縮小可能で且つ統合化されたコンピュータシステムに関連し、シェーダパイプアレイは、入力ピクセル、頂点、及びプリミティブ、表面又はコンピュータ作業項目に対するシェーダプログラム命令を処理し、生成されたテクセルデータ又はメモリロード/ストア動作を用いて各項目に対する出力データを生成する。本発明の実施形態では、多重化レベルのキャッシュシステム内に記憶されているテクセルデータに対して、双線形テクスチャマッピング、三重線形テクスチャマッピング、及び異方性テクスチャマッピングが適用される。他の実施形態では、冗長シェーダシステムがシェーダパイプアレイ内の不完全なシェーダパイプに向けられたシェーダパイプデータを処理するように追加されそして構成されてよく、1つ以上のシェーダパイプ内の不完全な部分回路(subcircuit)を伴うデバイスを回復させることができる。
2以上の拡大縮小可能で且つ統合化されたコンピュータシステムを含む構成を有する本発明の実施形態においては、統合化されたコンピュータシステムの一部分(subset)それ自体が修復可能なユニットとして構成されてよい。そのようなシステムにおいては、不完全な統合化されたコンピュータユニットシステムに予定されていた作業負荷は、代わりに全てのALU、テクスチャ、及びメモリ動作を処理するための冗長な統合化されたコンピュータユニットシステムに送られてよい。これにより、テクスチャマッピングユニット及びL1キャッシュシステムを含むことに大きく起因する修復の対象となるデバイスの部分が増大し、従って当該デバイスの歩留まりが著しく改善される。
特定の構成、配置、及びステップが論じられるが、このことは例示的な目的のみのためのものであることが理解されるべきである。関連分野を含めた当業者であれば、本発明の精神及び範囲から逸脱することなしに他の構成、配置、及びステップが用いられ得ることを認識するであろう。この発明が種々の他の応用においても採用され得ることは、関連分野を含めた当業者にとって明らかであろう。
尚、「1つの実施形態」、「実施形態」、「例示的実施形態」等に対する明細書での言及は、説明される実施形態が特定の特徴、構造、又は特性を含んでいてよいが、全ての実施形態が必ずしも当該特定の特徴、構造、又は特性を含む必要はないことを示している。また、そのような表現は必ずしも同じ実施形態を参照していない。更に、特定の特徴、構造、又は特性が実施形態に関連して説明されている場合には、明白に説明されていようとなかろうと、他の実施形態に関連して当該特定の特徴、構造、又は特性を具現化することは当業者の知識の範囲内にあることと言える。
本発明は特定の応用のための例示的な実施形態を参照してここに説明されるが、本発明はそれらに限定されないことが理解されるべきである。当業者であれば、ここに提供される教示を利用して、当該範囲内での及び本発明が顕著に有用であろう追加的な分野での追加的な修正、応用、及び実施形態を認識するであろう。
図1は本発明の実施形態に従う拡大縮小可能で且つ統合化されたコンピュータシステム100を示す図である。システム100はシーケンサ110、拡大縮小可能で且つ統合化されたコンピュータユニットモジュール120、及びレベル2キャッシュシステム130を備えている。拡大縮小可能で且つ統合化されたコンピュータシステムユニットモジュール120はシェーダパイプアレイ122、随意的な冗長シェーダパイプアレイ124、テクスチャマッピングユニット126、及びレベル1キャッシュシステム128を備えている。
シェーダパイプアレイ122は入力データに対してALU動作を実行する。シーケンサ110は、含まれている作業付加及びシェーダパイプアレイ122を介したデータの流れに対するシェーダプログラム命令発行を制御する。また、冗長シェーダパイプアレイ124が存在する実施形態においては、シーケンサ110は、適切な冗長ユニットに対して命令をスケジューリングすることによって、シェーダパイプアレイ122内で生じる不完全なシェーダパイプに対処する。
シーケンサ110は、テクスチャのフェッチ又はロード/ストア動作を宣言(発行)することができ、これによりシェーダパイプアレイ122が起動されて、発行された命令と共にアドレスがテクスチャマッピングユニット126へ送られることになる。この場合テクスチャマッピングユニット126は、適切なアドレスを、そのアドレスに付随するテクセルデータ又はメモリデータを収容しているレベル1テクスチャキャッシュシステム128に対して生成する。レベル1キャッシュシステム128は、アドレスを受け取った後、当該テクセル又はメモリデータをテクスチャマッピングユニット126へ返すことになる。要求されているテクセル又はメモリデータがレベル1キャッシュシステム128内に存在しない場合には、その要求はレベル2キャッシュシステム130へ転送され、レベル2キャッシュシステム130がその要求されたテクセルデータを取得及び返送する。
図2は本発明の実施形態に従うシェーダパイプアレイ122の更に詳細な図解を含む拡大縮小可能で且つ統合化されたコンピュータユニットモジュール120を示す図である。この実施形態では、シェーダパイプアレイ122は、SP_0乃至SP_Mで表される1つ以上のシェーダパイプブロックを備えており、ここで「M」は1より大きい正の整数である。
冗長シェーダパイプアレイ124が存在する実施形態においては、例としてシェーダパイプブロックSP_1内に配置されるシェーダパイプが不完全であることをシーケンサ110が確認すると、不完全なパイプに対して予定されていたシェーダパイプデータは、入力モジュールによる入力ストリームを介して冗長シェーダパイプアレイ124へ送られてよく、そして冗長シェーダパイプアレイ124によって処理されてよい。全てのテクスチャマッピング要求は、シーケンサ110から水平制御パス211を介して命令されたときに冗長シェーダパイプアレイ124によって傍受されてよい。不完全なシェーダパイプに当初予定されていたシェーダパイプデータを冗長シェーダパイプアレイ124が処理した時点で、処理された冗長シェーダパイプアレイ124データは、冗長シェーダパイプアレイ124からシェーダパイプアレイ122の出力ストリームへ戻されてよく、そして出力ユニット(図示せず)内で再調整(realigned)されてよい。
ある実施形態では冗長シェーダパイプアレイ124は単一のブロックから構成され、従って単一の不完全なシェーダパイプに予定されていたシェーダパイプデータを一度に処理することができるだけである。他の実施形態では冗長シェーダパイプアレイ124は多重化された複数の冗長シェーダブロックを備えており、冗長シェーダパイプアレイ124は2つ以上の不完全なシェーダパイプに予定されていたシェーダパイプデータを同時に処理することができる。
図3は本発明の実施形態に従うテクスチャマッピングユニット126の更に詳細な図解を示している。この実施形態では、シェーダパイプアレイ122は、アドレス生成器システム318、プリフォーマッタモジュール310、補間器モジュール312、積算器モジュール314、及びフォーマットモジュール316を備えたテクスチャマッピングユニット126に対してテクスチャ又はメモリロード/ストア要求を生成する。テクスチャマッピングユニット126はシェーダアレイ122及び124並びにシーケンサ110からの要求をそれぞれ受け取り、アドレス生成器システム318内で命令を処理してサービスのための実際のアドレスを決定する。データがプリフォーマッタモジュール310、補間器モジュール312、積算器モジュール314、及びフォーマットモジュール316内で処理された後、結果としてのテクセルデータがレベル1テクスチャキャッシュシステム128から受け取られる。結果としてのテクセルデータはシェーダパイプアレイ122及び/又は冗長シェーダパイプアレイ124内の要求中のリソースへ送り返される。プリフォーマッタモジュール310は、テクセルデータを受け取りそしてブロック正規化を実行し、正規化された固定点テクセルデータを生成するように構成される。補間器モジュール312は、正規化された固定点テクセルデータをプリフォーマッタモジュール310から受け取り、積算器モジュール314内に蓄積しながら1つ以上の補間を行い、双線形(bilinear)、三重線形(trilinear)、及び異方性テクスチャマッピングの望ましいレベルを達成する。フォーマットモジュール316は、積算器モジュール314内に蓄積されたテクセルデータを、要求しているリソース、シェーダパイプアレイ122のための標準的な浮動小数点表現に変換する。一般的なロード/ストアデータに対しては、プリフォーマッタモジュール310、補間器モジュール312、積算器モジュール314、及びフォーマットモジュール316は、要求されたリターンデータを修正せずに通過させる。
図3に示される実施形態はまた、レベル2キャッシュシステム130の使用を説明している。レベル2キャッシュシステムは、レベル1キャッシュシステム128に対してデータを読み出し及び/又は書き込みすることが必要であり又は望ましい場合に、拡大縮小可能で且つ統合化されたコンピュータユニットモジュール120が利用可能な追加的なメモリである。
図4は拡大縮小可能で且つ統合化されたコンピュータシステムを用いるテクスチャマッピングのための方法400を示すフローチャートである。方法400はステップ402で始まる。ステップ404では、特定の一連のピクセル、頂点、プリミティブ(primitives)、表面、又はコンピュータ作業項目に対するシーケンサからの一連のテクスチャ要求をシェーダパイプが受け取る。ステップ406では、それら特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対するシェーダプログラム命令に基きシェーダパイプが一連のアドレスデータを生成する。ステップ408では、テクスチャマッピングユニットがレベル1及び/又はレベル2テクスチャキャッシュシステムに記憶されているテクセルデータを検索する。またステップ410では、テクスチャマッピングユニットが、検索されたテクセルデータ及び起点となるシェーダ命令に基づいて、フォーマットされ積算された補間を算出する。方法400はステップ412で終了する。
図1、2、3及び4で概説した機能、処理、システム及び方法は、ソフトウエア、ファームウエア若しくはハードウエア又はこれらの組み合わせを用いて実施又は実装され得る。プログラム可能な論理が使用される場合には、当該論理は商業的に入手可能な処理プラットフォーム又は特殊目的デバイス上で実行可能である。
関連分野を含めた当業者に明らかであろうように、ここでの説明に基いて、本発明の実施形態はハードウエア記述言語(HDL)、例えばVerilog又はVHDLを用いたソフトウエアにおいて設計することができる。HDL設計は電子システムの挙動をモデル化することができ、そこでは当該設計は合成されてよく、そして最終的にはハードウエアデバイスへと製造されてよい。また、HDL設計はコンピュータ製品内に記憶されてよく、ハードウエア製造に先立ちコンピュータシステム内に取り込まれてよい。
概要及び要約部ではなく、詳細な説明部が特許請求の範囲を解釈するために用いられるよう意図されていることが理解されるべきである。概要及び要約部は、発明者によって意図される本発明の1つ以上のしかし全部のではない例示的実施形態を示すことができ、従って本発明及び添付の特許請求の範囲を限定することを意図されるものでは決してない。
特定の機能の実装及びそれらの関係を示す機能構成ブロックを用いて本発明が以上のように説明されてきた。それらの機能構成ブロックの境界は説明の便宜のためここでは任意に画定されてきた。特定の機能及びそれらの関係が適切に実行される限りにおいて代替的な境界が画定されてよい。
特定の実施形態の前述した説明は、他者が、当該分野の技能の範囲内の知識を適用することによって、必要以上の実験を要せず、本発明の一般的概念から逸脱することなしに、当該特定の実施形態を容易に修正し及び/又は種々の応用に適合させることができる程度に、本発明の一般的性質を完全に明らかにするであろう。従って、そのような適合及び修正は、ここに提示される教示及び指針に基き、開示された実施形態と均等なものの意味及び範囲内にあることが意図されている。ここでの表現法及び用語は説明を目的としたものであり限定を目的としてないことが理解されるべきであり、本明細書の表現法及び用語は教示及び指針を考慮して当業者によって解釈されるべきである。
本発明の種々の実施形態が上に説明されてきたが、それらは例示のみを目的として提示されたものであり、限定を目的とはしていないことが理解されるべきである。本発明の精神及び範囲から逸脱することなしに、形態及び詳細における種々の変更がここになされ得ることが関連分野を含めた当業者には明らかであろう。従って、本発明の広さ及び範囲は上述したいかなる例示的実施形態によっても限定されるべきではなく、以下の請求項及びそれらと均等なものに従ってのみ画定されるべきである。

Claims (25)

  1. テクスチャ命令を受け入れテクスチャ出力データを生成するように構成されるシェーダパイプアレイと、
    前記テクスチャ出力データを記憶するように構成されるレベル1テクスチャキャッシュシステムと、
    前記レベル1テクスチャキャッシュシステムからテクスチャ出力データを受け取りフォーマットされた補間データを生成するように構成されるテクスチャマッピングユニットと、を備えた、拡大縮小可能で且つ統合化されたコンピュータモジュール。
  2. 前記シェーダパイプアレイがALU、ロード/ストア、及び出力の命令を受け入れるように構成される、請求項1の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  3. 前記シェーダパイプアレイの不完全なシェーダパイプに対して予定されていたシェーダパイプデータを処理するように構成される冗長シェーダパイプアレイを更に備えた、請求項1の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  4. 前記シェーダパイプアレイが1つ以上のシェーダパイプブロックを備えている、請求項1の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  5. シェーダパイプブロックが1つ以上のシェーダパイプを含むように構成されている、請求項4の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  6. 前記レベル1キャッシュシステムがレベル2キャッシュシステムに対して読み出し且つ書き込みするように構成されている、請求項1の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  7. 前記テクスチャマッピングユニットが、
    テクセルデータを受け入れ正規化された固定点テクセルデータを生成するように構成されるプリフォーマッタモジュールと、
    前記プリフォーマッタモジュールからの前記正規化された固定点テクセルデータに対する補間を行い、再正規化浮動小数点テクセルデータを生成するように構成される補間器モジュールと、
    前記補間器モジュールからの浮動小数点テクセルデータを積算するように構成される積算器モジュールと、
    前記積算器モジュールからのテクセルデータを標準的な浮動小数点表現に変換するように構成されるフォーマットモジュールと、を備えている、請求項1の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  8. 前記補間器モジュールが、
    双線形テクスチャフィルタリング、
    三重線形テクスチャフィルタリング、及び
    異方性テクスチャフィルタリングの少なくとも1つを達成するために1つ以上の補間を行うように構成されている、請求項7の拡大縮小可能で且つ統合化されたコンピュータモジュール。
  9. 特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対する一連のテクスチャ要求を受け取ることと、
    前記特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対するシェーダプログラム命令に基づいて一連のアドレスデータを生成することと、
    レベル1キャッシュシステムに記憶されているテクセルデータを検索することと、
    フォーマットされ積算された補間を前記検索されたテクセルデータ及び起点となるシェーダ命令に基づき算出することと、を備えた、拡大縮小可能で且つ統合化されたコンピューティングのための方法。
  10. 不完全なシェーダパイプに予定されていたシェーダパイプデータを処理することを更に備えた、請求項9の拡大縮小可能で且つ統合化されたコンピューティング方法。
  11. レベル2キャッシュシステムから読み出すことと前記レベル1テクスチャキャッシュシステムから前記レベル2キャッシュシステムへ書き込むこととを更に備えた、請求項9の拡大縮小可能で且つ統合化されたコンピューティング方法。
  12. 浮動小数点テクセルデータを受け取ることと、
    前記浮動小数点テクセルデータから正規化された固定点テクセルデータを生成することと、
    前記正規化された固定点テクセルデータに対して補間を行うことと、
    再正規化された浮動小数点テクセルデータを生成することと、
    再正規化されたテクセルデータを積算することと、
    前記積算された再正規化されたテクセルデータを標準的な浮動小数点表現にフォーマットすることと、を更に備えた、請求項9の拡大縮小可能で且つ統合化されたコンピューティング方法。
  13. 補間が、
    双線形テクスチャフィルタリング、
    三重線形テクスチャフィルタリング、及び
    異方性テクスチャフィルタリングを更に備えている、請求項12の拡大縮小可能で且つ統合化されたコンピューティング方法。
  14. ハードウエア記述言語命令を合成することによって実行される、請求項12の拡大縮小可能で且つ統合化されたコンピューティング方法。
  15. プロセッサ、及び前記プロセッサと通信するメモリを備えた拡大縮小可能で且つ統合化されたコンピュータシステムであって、
    前記メモリは、
    特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対する一連のテクスチャ要求を受け取ることと、
    前記特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対するシェーダプログラム命令に基づいて一連のアドレスデータを生成することと、
    レベル1キャッシュシステムに記憶されているテクセルデータを検索することと、
    フォーマットされ積算された補間を前記検索されたテクセルデータ及び起点となるシェーダ命令に基づき算出することとを前記コンピュータシステムに指示するための複数の処理命令を記憶するように構成されている、拡大縮小可能で且つ統合化されたコンピュータシステム。
  16. 不完全なシェーダパイプに予定されていたシェーダパイプデータを処理することを前記コンピュータシステムにさせるための命令を更に備えた、請求項15の拡大縮小可能で且つ統合化されたコンピュータシステム。
  17. 前記レベル1テクスチャキャッシュシステムからレベル2キャッシュシステムへの読み込み及び書き込みを前記コンピュータシステムにさせるための命令を更に備えた、請求項15の拡大縮小可能で且つ統合化されたコンピュータシステム。
  18. 浮動小数点テクセルデータを受け取ることと、
    前記浮動小数点テクセルデータから正規化された固定点テクセルデータを生成することと、
    前記正規化された固定点テクセルデータに対して補間を行うことと、
    再正規化された浮動小数点テクセルデータを生成することと、
    再正規化されたテクセルデータを積算することと、
    前記積算された再正規化されたテクセルデータを標準的な浮動小数点表現にフォーマットすることと、を前記コンピュータシステムにさせるための命令を更に備えた、請求項15の拡大縮小可能で且つ統合化されたコンピュータシステム。
  19. 双線形テクスチャフィルタでフィルタリングすることと、
    三重線形テクスチャフィルタでフィルタリングすることと、
    異方性テクスチャフィルタでフィルタリングすることと、を前記コンピュータシステムにさせるための命令を更に備えた請求項15の拡大縮小可能で且つ統合化されたコンピュータシステム。
  20. 特定のピクセルに対するリソースからテクスチャ要求を受け取るための手段と、
    前記特定のピクセルに対する描画計算に基き出力テクセルデータを生成するための手段と、
    レベル1キャッシュシステムからテクセルデータを検索するための手段と、
    フォーマットされた補間を前記テクセルデータに基きマッピングユニットを用いて算出するための手段と、を備えた拡大縮小可能で且つ統合化されたコンピュータシステム。
  21. 不完全なシェーダパイプに予定されていたシェーダパイプデータを処理するための手段を更に備えた、請求項20の拡大縮小可能で且つ統合化されたコンピュータシステム。
  22. レベル2キャッシュシステムから読み出し前記レベル1テクスチャキャッシュシステムから前記レベル2キャッシュシステムへ書き込むための手段を更に備えた、請求項20の拡大縮小可能で且つ統合化されたコンピュータシステム。
  23. 浮動小数点テクセルデータを受け取るための手段と、
    前記浮動小数点テクセルデータから正規化された固定点テクセルデータを生成するための手段と、
    前記正規化された固定点テクセルデータに対して補間を行うための手段と、
    再正規化された浮動小数点テクセルデータを生成するための手段と、
    再正規化されたテクセルデータを積算するための手段と、
    積算された再正規化されたテクセルデータを標準的な浮動小数点表現にフォーマットするための手段と、を更に備えた、請求項20の拡大縮小可能で且つ統合化されたコンピュータシステム。
  24. 双線形テクスチャフィルタを用いてフィルタリングするための手段と、
    三重線形テクスチャフィルタを用いてフィルタリングするための手段と、
    異方性テクスチャフィルタを用いてフィルタリングするための手段と、を更に備えた、請求項20の拡大縮小可能で且つ統合化されたコンピュータシステム。
  25. 1つ以上のプロセッサベースのコンピュータデバイスによって実行されるときに拡大縮小可能で且つ統合化されたコンピューティング方法を前記1つ以上のコンピュータデバイスに実行させる1つ以上の命令の1つ以上のシーケンスを伝えるコンピュータ可読媒体であって、前記方法は、
    特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対する一連のテクスチャ要求を受け取ることと、
    前記特定の一連のピクセル、頂点、プリミティブ、表面、又はコンピュータ作業項目に対するシェーダプログラム命令に基いて一連のアドレスデータを生成することと、
    レベル1キャッシュシステムに記憶されているテクセルデータを検索することと、
    フォーマットされ積算された補間を前記検索されたテクセルデータ及び起点となるシェーダ命令に基づき算出することと、を備えている、コンピュータ可読媒体。
JP2011511650A 2008-05-30 2009-06-01 拡大縮小可能で且つ統合化されたコンピュータシステム Active JP5491498B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US5748308P 2008-05-30 2008-05-30
US61/057,483 2008-05-30
PCT/US2009/003316 WO2009145918A1 (en) 2008-05-30 2009-06-01 Scalable and unified compute system

Publications (2)

Publication Number Publication Date
JP2011524562A true JP2011524562A (ja) 2011-09-01
JP5491498B2 JP5491498B2 (ja) 2014-05-14

Family

ID=41377445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011511650A Active JP5491498B2 (ja) 2008-05-30 2009-06-01 拡大縮小可能で且つ統合化されたコンピュータシステム

Country Status (5)

Country Link
EP (1) EP2297723A4 (ja)
JP (1) JP5491498B2 (ja)
KR (1) KR101427408B1 (ja)
CN (1) CN102047315B (ja)
WO (1) WO2009145918A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101926570B1 (ko) 2011-09-14 2018-12-10 삼성전자주식회사 포스트 프레그먼트 쉐이더를 사용하는 그래픽 처리 방법 및 장치
KR101862785B1 (ko) 2011-10-17 2018-07-06 삼성전자주식회사 타일 기반 렌더링을 위한 캐쉬 메모리 시스템 및 캐슁 방법
US10089708B2 (en) * 2016-04-28 2018-10-02 Qualcomm Incorporated Constant multiplication with texture unit of graphics processing unit
GB2566733B (en) * 2017-09-25 2020-02-26 Advanced Risc Mach Ltd Performimg convolution operations in graphics texture mapping units
CN109614086B (zh) * 2018-11-14 2022-04-05 西安翔腾微电子科技有限公司 基于SystemC和TLM模型的GPU纹理缓冲区数据存储硬件及存储装置
CN110930493A (zh) * 2019-11-21 2020-03-27 中国航空工业集团公司西安航空计算技术研究所 一种gpu纹素并行获取方法
CN112581575B (zh) * 2020-12-05 2024-05-03 西安翔腾微电子科技有限公司 一种外视频做纹理系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104415A (en) * 1998-03-26 2000-08-15 Silicon Graphics, Inc. Method for accelerating minified textured cache access
JP2002526842A (ja) * 1998-08-20 2002-08-20 アップル コンピュータ インコーポレイテッド ディファード・シェーディング(deferredshading)を伴うグラフィックス・プロセッサ(graphicsprocessor)
US20050066148A1 (en) * 2003-09-18 2005-03-24 International Business Machines Corporation Multiple parallel pipeline processor having self-repairing capability
JP2005228320A (ja) * 2004-02-10 2005-08-25 Samsung Electronics Co Ltd 深さ画像基盤の3次元グラフィックデータの高速視覚化方法、装置及びプログラムを記録したコンピュータ可読記録媒体
US20050231519A1 (en) * 1999-03-22 2005-10-20 Gopal Solanki Texture caching arrangement for a computer graphics accelerator
US20060053188A1 (en) * 2004-08-11 2006-03-09 Ati Technologies Inc. Apparatus with redundant circuitry and method therefor
JP2006244426A (ja) * 2005-03-07 2006-09-14 Sony Computer Entertainment Inc テクスチャ処理装置、描画処理装置、およびテクスチャ処理方法
JP2006293627A (ja) * 2005-04-08 2006-10-26 Toshiba Corp 描画方法及び描画装置
US7136068B1 (en) * 1998-04-07 2006-11-14 Nvidia Corporation Texture cache for a computer graphics accelerator
WO2007049610A1 (ja) * 2005-10-25 2007-05-03 Mitsubishi Electric Corporation 画像処理装置
JP2007533029A (ja) * 2004-04-12 2007-11-15 エヌヴィディア コーポレイション スケーラブルシェーダアーキテクチャ

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3645024B2 (ja) * 1996-02-06 2005-05-11 株式会社ソニー・コンピュータエンタテインメント 描画装置及び描画方法
US6229553B1 (en) * 1998-08-20 2001-05-08 Apple Computer, Inc. Deferred shading graphics pipeline processor
US6731303B1 (en) * 2000-06-15 2004-05-04 International Business Machines Corporation Hardware perspective correction of pixel coordinates and texture coordinates
CN1239023C (zh) * 2003-10-16 2006-01-25 上海交通大学 基于运动自适应和边缘保护的三维视频格式转换方法
US7218291B2 (en) * 2004-09-13 2007-05-15 Nvidia Corporation Increased scalability in the fragment shading pipeline
US20070211070A1 (en) * 2006-03-13 2007-09-13 Sony Computer Entertainment Inc. Texture unit for multi processor environment
US7965296B2 (en) * 2006-06-20 2011-06-21 Via Technologies, Inc. Systems and methods for storing texture map data

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104415A (en) * 1998-03-26 2000-08-15 Silicon Graphics, Inc. Method for accelerating minified textured cache access
US7136068B1 (en) * 1998-04-07 2006-11-14 Nvidia Corporation Texture cache for a computer graphics accelerator
JP2002526842A (ja) * 1998-08-20 2002-08-20 アップル コンピュータ インコーポレイテッド ディファード・シェーディング(deferredshading)を伴うグラフィックス・プロセッサ(graphicsprocessor)
US20050231519A1 (en) * 1999-03-22 2005-10-20 Gopal Solanki Texture caching arrangement for a computer graphics accelerator
US20050066148A1 (en) * 2003-09-18 2005-03-24 International Business Machines Corporation Multiple parallel pipeline processor having self-repairing capability
JP2005228320A (ja) * 2004-02-10 2005-08-25 Samsung Electronics Co Ltd 深さ画像基盤の3次元グラフィックデータの高速視覚化方法、装置及びプログラムを記録したコンピュータ可読記録媒体
JP2007533029A (ja) * 2004-04-12 2007-11-15 エヌヴィディア コーポレイション スケーラブルシェーダアーキテクチャ
US20060053188A1 (en) * 2004-08-11 2006-03-09 Ati Technologies Inc. Apparatus with redundant circuitry and method therefor
JP2006244426A (ja) * 2005-03-07 2006-09-14 Sony Computer Entertainment Inc テクスチャ処理装置、描画処理装置、およびテクスチャ処理方法
JP2006293627A (ja) * 2005-04-08 2006-10-26 Toshiba Corp 描画方法及び描画装置
WO2007049610A1 (ja) * 2005-10-25 2007-05-03 Mitsubishi Electric Corporation 画像処理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSND200401051001; 吉田たけお: '"C/C++言語ベースのシステム設計の重要性"' Interface 第29巻, 第9号, 20030901, p.44-58, CQ出版株式会社 *
JPN6013041557; 吉田たけお: '"C/C++言語ベースのシステム設計の重要性"' Interface 第29巻, 第9号, 20030901, p.44-58, CQ出版株式会社 *

Also Published As

Publication number Publication date
CN102047315B (zh) 2015-09-09
WO2009145918A1 (en) 2009-12-03
JP5491498B2 (ja) 2014-05-14
KR101427408B1 (ko) 2014-08-07
KR20110019764A (ko) 2011-02-28
EP2297723A1 (en) 2011-03-23
EP2297723A4 (en) 2015-08-19
CN102047315A (zh) 2011-05-04

Similar Documents

Publication Publication Date Title
US8558836B2 (en) Scalable and unified compute system
JP4799588B2 (ja) 常駐ミップマップデータを用いた非常駐ミップマップデータの外挿
US7999819B2 (en) Systems and methods for managing texture descriptors in a shared texture engine
US8542247B1 (en) Cull before vertex attribute fetch and vertex lighting
JP5491498B2 (ja) 拡大縮小可能で且つ統合化されたコンピュータシステム
US8760455B2 (en) Restart index that sets a topology
US8022958B2 (en) Indexes of graphics processing objects in graphics processing unit commands
US20100079454A1 (en) Single Pass Tessellation
US20130271465A1 (en) Sort-Based Tiled Deferred Shading Architecture for Decoupled Sampling
US20110243469A1 (en) Selecting and representing multiple compression methods
US8570324B2 (en) Method for watertight evaluation of an approximate catmull-clark surface
US8605085B1 (en) System and method for perspective corrected tessellation using parameter space warping
US9633458B2 (en) Method and system for reducing a polygon bounding box
US8564616B1 (en) Cull before vertex attribute fetch and vertex lighting
US7944453B1 (en) Extrapolation texture filtering for nonresident mipmaps
WO2021231328A1 (en) Method and apparatus of data compression
US9406101B2 (en) Technique for improving the performance of a tessellation pipeline
US9111360B2 (en) Technique for improving the performance of a tessellation pipeline
US20200410743A1 (en) Methods and apparatus to facilitate adaptive texture filtering
US10395424B2 (en) Method and apparatus of copying data to remote memory
US20210304488A1 (en) Sampling for partially resident textures
KR20110015034A (ko) 분산형 레벨 1 캐시 시스템 및 중앙집중형 레벨 2 캐시를 구비한 복합형 쉐이더
Wu et al. Improving the performance of spatial raster analysis in GIS using GPU

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130821

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131121

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140227

R150 Certificate of patent or registration of utility model

Ref document number: 5491498

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250