JP2000155845A - 記憶装置、デ―タフォ―マッタ、デ―タにアクセスする方法、デ―タの領域をクリアする方法、デ―タを圧縮する方法、デ―タをフォ―マット化する方法、グラフィックスシステムおよびグラフィックスシステムを動作させる方法 - Google Patents

記憶装置、デ―タフォ―マッタ、デ―タにアクセスする方法、デ―タの領域をクリアする方法、デ―タを圧縮する方法、デ―タをフォ―マット化する方法、グラフィックスシステムおよびグラフィックスシステムを動作させる方法

Info

Publication number
JP2000155845A
JP2000155845A JP14023899A JP14023899A JP2000155845A JP 2000155845 A JP2000155845 A JP 2000155845A JP 14023899 A JP14023899 A JP 14023899A JP 14023899 A JP14023899 A JP 14023899A JP 2000155845 A JP2000155845 A JP 2000155845A
Authority
JP
Japan
Prior art keywords
pixel
data
formatter
bit
coupled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP14023899A
Other languages
English (en)
Inventor
J Shurappu Elizabeth
エリザベス・ジェイ・シュラップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electronics America Inc
Original Assignee
Mitsubishi Electronics America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/086,554 external-priority patent/US6143434A/en
Priority claimed from US09/164,866 external-priority patent/US6504550B1/en
Priority claimed from US09/164,858 external-priority patent/US6535218B1/en
Priority claimed from US09/264,281 external-priority patent/US6559851B1/en
Priority claimed from US09/264,261 external-priority patent/US6661421B1/en
Application filed by Mitsubishi Electronics America Inc filed Critical Mitsubishi Electronics America Inc
Publication of JP2000155845A publication Critical patent/JP2000155845A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Digital Computer Display Output (AREA)
  • Image Generation (AREA)

Abstract

(57)【要約】 【課題】 コンピュータグラフィックスシステムにおい
て二次元および三次元イメージの増速されたレンダリン
グをもたらす半導体記憶装置を提供する。 【解決手段】 半導体記憶装置は、メモリアレイ(11
6)と、ピクセルバッファ(118)と、ピクセルバッ
ファに結合される複数のピクセル算術論理演算装置(1
20、121)と、入力データフォーマッタ(130)
と、出力データフォーマッタ(134)と、読出データ
フォーマッタ、書込データフォーマッタと、アドレスお
よび制御入力バス(146)とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の分野】開示される発明は一般的にコンピュータ
システムに関する。より特定的には、この発明はダイナ
ミックランダムアクセスメモリ(DRAM)フレームバッファ
装置と、その装置に基づく、増速された二次元および三
次元グラフィックスレンダリングオペレーションを実行
するためのアーキテクチャを提供するシステムとに関す
る。
【0002】
【背景】デュアルピクセル3DRAMチップおよびグラフィ
ックス処理システムは、高性能で高容量のフレームバッ
ファを実現するのに用いられる。開示されるデュアルピ
クセル3DRAMチップおよびデュアルピクセル3DRAMチッ
プに基づくグラフィックス処理システムのある局面は、
1996年8月6日にデーリング(Deering)他に発行さ
れた米国特許第5,544,306号に開示されてお
り、この特許はここに完全に提示されているかのごとく
にその全体においてこの開示に引用により援用される。
【0003】開示される発明は外部DRAMフレームバッフ
ァの使用に替るものを提示する。短期間の性能上の目的
を満たすためには、組込みDRAMをフレームバッファメモ
リに用いたくなる。なぜなら、かなりの量の論理を実現
するための表面積を残しつつ、ダイ上に4から8メガビ
ットを組込むことが可能だろうからである。しかしなが
ら、同じ時間フレームにおいて、グラフィックス指向の
計算機プロダクトはフレームバッファメモリの10から
80メガビットを要する。このため、グラフィックス処
理計算機システムの要件を満たすようなフレームバッフ
ァを実現するためには、2個から10個の組込みDRAM装
置が必要となるであろう。そのようなフレームバッファ
のフィル速度は非常に高速だろうが、計算機市場の大部
分にとってはそのコストは高すぎるであろう。
【0004】二次元および三次元グラフィックイメージ
を処理する上で、フィル速度と一致させるためテクスチ
ャマッピングを増速させなければならない。しかしなが
ら、上述の分散されたフレームバッファではこれを効率
よく行なうことが難しくなる。テクスチャデータを分配
する最も簡単なやり方は、各装置がすべてのものの複製
を持つことだが、この方法は非常に効率の悪い組込みDR
AMビットの用い方である。別のアプローチでは、データ
が複製されない態様でテクスチャデータをフレームバッ
ファを含む装置の間で分配する。この選択肢では、組込
みDRAMビットが有効に用いられるが、装置間での大量の
テクスチャデータのルーティングも必要となる。
【0005】組込みDRAMを用いて単一の装置上でテクス
チャキャッシュを実現する方がより実用的であるかもし
れない。テクスチャデータはシステムメモリからページ
インしなければならないが、これはテクスチャデータが
圧縮されている方がより効率よく働くであろう。
【0006】組込みDRAMは、セットアップユニットとラ
スタライザとの間の単純なFIFOを実現するのに用いるこ
ともできる。このFIFOにより、大きな三角形がレンダリ
ングされる間、ジオメトリおよびセットアップ処理を続
けることが可能となる。これはまた、システムメモリか
らのテクスチャデータのページングおよび伸長のレイテ
ンシを緩和するのに用いることもできる。
【0007】Talisman、Pixel FlowまたはOak's WARP5
などの領域ベースのレンダリングアーキテクチャでは、
レンダリングコントローラ上でフレームバッファの小さ
な部分をレンダリングし、次に最終の色値を外部DRAMに
転送する。コントローラはさらに次の領域をレンダリン
グし、さらにその次の領域へと、フレーム全体にわたっ
てレンダリングし続ける。
【0008】隠面消去およびアンチエイリアシングに用
いられる帯域幅のすべてがレンダリングコントローラに
完全に残るため、フィル速度は外部帯域幅により制限さ
れない。隠面消去およびアンチエイリアシングに用いら
れる記憶域のすべてはフレームバッファの小さい部分に
対してのみ実現されるだけでよく、したがってレンダリ
ングコントローラ上に置いておくことができる。
【0009】領域ベースのレンダリングの大きな欠点
は、レンダリングを開始できるようになるまでに、各フ
レームごとにすべてのジオメトリを領域に分類してどこ
かにストアする必要があることである。この要件のた
め、一般的にフレームごとにレンダリングできるジオメ
トリの量に上限が課せられる。この制限は数多くの応用
において許容できないものである。いくつかの領域ベー
スのレンダリングアーキテクチャは、大量のジオメトリ
を与えられた際にも外部DRAMから、および外部DRAMへ領
域のためのデプス値および色値を書込むことによりある
程度正確に機能できる。しかしながら、こうした実装で
は領域ベースのレンダリングの欠点のすべてが保たれた
まま利点のすべてが損われる。
【0010】機械設計CADおよび他のコンテンツ作成応
用ではジオメトリの複雑さに対する制限は許容できな
い。このような応用ではジオメトリの複雑さをフレーム
速度とスムーズにトレードオフする能力が必要となる。
このように、組込みDRAMのアプローチも領域ベースのレ
ンダリングのアプローチも、現在のグラフィックス処理
応用の性能の要求および実際のコスト制約を満たす十分
な解決策を提供するものではない。
【0011】フレームバッファ設計に関する別の懸念
は、シングルポートのフレームバッファメモリとデュア
ルポートのフレームバッファメモリとの性能トレードオ
フである。デュアルポートフレームバッファは専用ディ
スプレイポートを有しており、これによりレンダリング
ポートがより長い時間をレンダリングに費やすことがで
きる。典型的に、ビデオランダムアクセスメモリ(VRAM)
チップを含むデュアルポートフレームバッファは、その
ビデオバッファがかなり大きいため、そのフィル速度の
約1%から2%しかビデオ転送オペレーションのために
失わない。FBRAMチップ(3D-RAMTMチップとも称される)
を含むフレームバッファは、ビデオバッファがより小さ
いため、そのフィル速度の約5%から10%だけビデオ
転送オペレーションのため失う。
【0012】シングルポートメモリは、ポートが高速双
方向送受信をサポートするのでない限り、表示するため
にピクセルデータを読出している際にはレンダリングす
ることができない。双方のレンダリングポート帯域幅が
同じであるものとしてシングルポートメモリとデュアル
ポートメモリとを比較すると、デュアルポートメモリの
方がフィル速度がより速く、コストもより高い。シング
ルポートの帯域幅がデュアルポートの帯域幅の合計に等
しいものとしてシングルポートメモリとデュアルポート
メモリとを比較すると、シングルポートメモリの方がよ
り効率がよいため、おそらくシングルポートメモリのフ
ィル速度の方がデュアルポートメモリよりも高速であろ
う。すなわち、高帯域幅入力/出力(I/O)能力の出現に
より現在、帯域幅の制限が緩和されつつある限りにおい
て、シングルポートメモリアーキテクチャの方がより効
率のよいフレームバッファ性能を期待できる。
【0013】デュアルポートメモリではフレームバッフ
ァへのピクセルのフローがより滑らかである。シングル
ポートメモリはディスプレイデータのバーストを読出し
ている間は定期的にレンダリングに利用できなくなる。
レンダリングコントローラはシングルポートメモリとイ
ンターフェイスする際にはピクセルフローを滑らかにす
るのにより大きなピクセルFIFOを必要とする。より低コ
ストのシステムでは、そのようなディスプレイバースト
の間、レンダラーはアイドル状態となるかもしれない。
【0014】シングルポートメモリは、ダイ面積、ピ
ン、パッケージング、テストおよび電力消費が小さいた
め費用がより安い。シングルポートメモリは同じ大きさ
のデュアルポートメモリと比べて、ビット当りの記憶コ
ストがかなり低い。ビット当りのコストが低ければ、表
示できないデータをフレームバッファにストアしてもそ
れほど問題にならない。
【0015】デュアルポートメモリはディスプレイ帯域
幅が固定されている。必要となるディスプレイ帯域幅が
より低ければ帯域幅は無駄になる。必要とされるディス
プレイ帯域幅がより高ければ、そのメモリはそのディス
プレイ要件に適していないことになる。シングルポート
メモリには、レンダリング帯域幅とディスプレイ帯域幅
とをトレードオフする柔軟性がある。緊急時には、シン
グルポートメモリは実際に非常に高いディスプレイ帯域
幅を提供することができる。
【0016】デュアルポートメモリの専用ディスプレイ
ポートは水平および垂直帰線消去期間の間は用いられな
いが、このことはディスプレイポートが約20パーセン
トの間はアイドル状態であることを意味する。
【0017】デュアルポートメモリでは、スクリーンへ
のピクセルおよびブロックのマッピングを固定すること
が要求される。比較して、シングルポートメモリではか
なりの柔軟性を持ってピクセルおよびブロックをスクリ
ーンへマッピングできる。
【0018】デュアルポートフレームバッファメモリ
は、レンダリングポートおよびディスプレイポートが異
なるチップに接続されている場合にしか意味をなさな
い。両方のポートが同じチップに接続されている場合に
は、帯域幅の等しいシングルポートメモリの方が上に挙
げた理由からより有効であろう。
【0019】シングルポートメモリでは、フレームバッ
ファのビット当りの記憶コストがより安く、レンダリン
グチップとディスプレイチップとを単一の装置に合併さ
せることができるため、より低コストのシステムを製造
できる。
【0020】このように、シングルポートメモリではデ
ュアルポートメモリで設計できるものより低コストで低
価格帯のシステムを設計することが可能になる。ビット
当りの記憶コストはシングルポートメモリではかなり低
いので高解像度/高ピクセルデプス設計において材料コ
ストはかなり低くなる。シングルポートメモリはより柔
軟であるため、より広範囲のプロダクト能力を提供する
設計をもたらす。
【0021】
【発明の概要】この発明は、コンピュータグラフィック
スシステムにおいて二次元および三次元イメージの増速
されたレンダリングをもたらすシングルポートフレーム
バッファアクセスメモリ(デュアルピクセル3DRAM)チッ
プに向けられる。
【0022】デュアルピクセル3DRAMチップは、レンダ
リングバスを介してレンダリングコントローラによりア
クセスされるシングルポートの高速メモリを特徴とす
る。デュアルピクセル3DRAMチップは、DRAMアレイ、SR
AMピクセルバッファ、少なくとも1つのピクセル算術論
理演算装置(ALU)およびグローバルバスを含む。また、
デュアルピクセル3DRAMチップはいくつかのデータバス
およびデータフォーマッタを含み、これらはグラフィッ
クスデータがデュアルピクセル3DRAMチップ内で処理さ
れたり、更新されたり、そのチップから送信されたり、
そのチップ内にストアされたりする際にそのグラフィッ
クスデータを割振り、フォーマット化する。
【0023】この発明の第1の局面において、デュアル
ピクセル3DRAMチップは、8ビットピクセルから最大5
12ビットピクセルまでの範囲のさまざまなピクセルサ
イズおよびフォーマットを処理するよう設定可能であ
る。デュアルピクセル3DRAMチップはこれらの能力を実
現するため、新規のプロトコルおよびデータパッキング
方式を特徴とする。
【0024】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、チップ上での2サイクルおよび
3サイクルのピクセルALUオペレーションの両方を可能
にする、レンダリングバスを介する可変入力および出力
データレートをサポートする。
【0025】この発明の別の局面において、デュアルピ
クセル3DRAMチップは同時にオペレーションごとに2つ
の別個のピクセルまたはサンプルを処理する。
【0026】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、チップとレンダリングコントロ
ーラとの間でより高速のフィル速度およびスループット
を可能にするデータ圧縮能力を特徴とする。
【0027】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、アンチエイリアシングされたポ
リゴンをレンダリングするため新規のデルタZアルゴリ
ズムを用いるマルチサンプリング方式を用いる。
【0028】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、レンダリングコントローラとチ
ップとの間のアドレスおよび制御バス上の帯域幅要件を
最小にするためチップ上にDRAMバンクおよびコラムアド
レスを保持するための新規の方式を用いる。
【0029】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、帯域幅のバランスを取りチップ
のオペレーション効率を最適化するような、チップ内部
のデータバスの幅とデータ転送速度との関係を含む。
【0030】この発明の別の局面において、デュアルピ
クセル3DRAMチップは多倍精度ピクセルブレンドオペレ
ーションを行ない、どんなビット幅の入力もブレンドさ
れるようにする。
【0031】この発明の別の局面において、デュアルピ
クセル3DRAMチップはアドレスおよび制御情報を3つの
別個の組の信号に分割し、3つの別個の組の信号は同時
に送信されてチップ上でのDRAMバンクオペレーション、
グローバルバスオペレーションおよびピクセルALUオペ
レーションを制御する。
【0032】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、DRAMバンクコラムデコーダとセ
ンスアンプとの間の複数のバスに書込み、この結果フレ
ームバッファのクリア速度を4倍以上に増大させるFlas
h Line(フラッシュライン)オペレーションを特徴とす
る。
【0033】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、DRAMアレイとSRAMピクセルバッ
ファとの間の双方向グローバルバスにより、異なるレベ
ルのキャッシュ間でのデータの同時転送を可能にする、
新規のオペレーションであるChange Cache Line(キャッ
シュライン変更)を特徴とする。
【0034】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、ページプリチャージオペレーシ
ョンとページバンクアクセスオペレーションとを1つの
オペレーションに組合せた、Change Page bank(ページ
バンク変更)オペレーションを特徴とする。
【0035】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、ある特定のレジスタのデータま
たは内容がチップ上のある特定のバスを介してブロード
キャストされるピクセルALUオペレーションを特徴とす
る。
【0036】この発明の別の局面において、デュアルピ
クセル3DRAMチップは、SRAMピクセルバッファからシン
グルでも、デュアルピクセルフォーマットでも、ピクセ
ルデータを読出すための革新的な手段を特徴とする。
【0037】オペレーション、構造、部品の組立および
組合せのさまざまな新規の詳細を含むこの発明の上述お
よび他の特徴を以下に添付の図面に関連してより特定的
に説明する。この発明の特定の実施例はここに例示とし
てのみ開示されており、クレームされる発明に限定を課
するものではないことが理解されるであろう。この発明
の原理および特徴はこの発明の範囲から逸脱することな
く数多くのさまざまな実施例において用いられ得る。
【0038】
【詳細な説明】以下に、現在発明者により企図されるこ
の発明を実施するためのベストモードに基づいてこの発
明を詳細に説明する。以下、図面の簡単な説明において
説明される添付の図面を参照するが、図面すべてを通じ
て要素に一貫した番号を振っている。この開示を通じ
て、当業者には既知のVerilogハードウェア記述言語
(VHDL)構文法で表現されるデュアルピクセル3DR
AMチップのさまざまな機能的な側面を記述する。
【0039】目次 1.0 アーキテクチャ 1.1 ピクセルALU 1.1.1 ROP/ブレンドユニット 1.1.2 デプスユニット 1.1.3 ステンシルユニット 1.1.4 ウィンドウIDユニット 1.2 SRAMピクセルバッファ 1.3 メモリ構成 1.4 ピン構成 1.5 プロトコル 1.5.1 DRAMバンクオペレーション 1.5.2 グローバルバスオペレーション 1.5.3 ピクセルALUオペレーション 1.6 オペレーションタイミング 1.7 レジスタ 1.7.1 識別 1.7.2 FeatureEnable 1.7.3 PixelConfig 1.7.4 StencilDepthConfig 1.7.5 ColorOP[0] 1.7.6 ColorOP[1] 1.7.7 ConstantColor 1.7.8 Byte Mask[1:0] 1.7.9 Plane Mask[7:0] 1.7.10 ColorWIDLUT[3:0] 1.7.11 OverlayWIDLUT[3:0] 1.7.12 DisplayConfig 1.8 高速領域クリア 2.0 データルーティング 2.1 入力データフォーマッタ 2.1.1 ピクセル圧縮 2.1.2 入力データフォーマット 2.1.3 アキュムレータ 2.1.4 最終フォーマッティング 2.2 出力データフォーマッタ 2.2.1 RDAT、 RPIX (8ビット、16ビット、32
ビットピクセル)オペレーション 2.2.2 RPIX (64ビットピクセル)オペレーション 2.2.3 RPIX (96ビットピクセル)オペレーション 2.2.4 RPIX (128ビットピクセル)オペレーショ
ン 2.3 SRAMからピクセルALUへのルーティング 2.3.1 8ビット、16ビットおよび32ビットピク
セルのSRAM編成 2.3.2 64ビットピクセルのSRAM編成 2.3.3 96ビットピクセルのSRAM編成 2.3.4 128ビットピクセルのSRAM編成 2.3.5 UnpackColors 2.3.6 UnpackDepths 2.3.7 UnpackExtras 2.3.8 UnpackAlpha, UnpackRed, UnpackGreen, Unp
ackBlue 2.3.9 UnpackDepth 2.3.10 UnpackStencil 2.3.11 UnpackWid 2.3.12 SramToPaluData 2.4 ピクセルALUからSRAMへのデータルーティング 2.4.1 PackColor 2.4.2 PackDepth 2.4.3 PackExtra 2.4.4 PaluToSramData 2.5 ピクセルALUからSRAMへのマスク生成 2.5.1 WriteEnableMask 2.5.2 ピクセルアドレスマスク 2.5.3 MaskDepth 2.5.4 EnableMask 2.5.5 SelectPlaneMask 2.5.6 ピクセルALUからSRAMへのマスク 3.0 ピクセルフォーマット 3.1 8ビットピクセルフォーマット 3.2 16ビットピクセルフォーマット 3.3 32ビットピクセルフォーマット 3.4 64ビットピクセルフォーマット 3.5 96ビットピクセルフォーマット 3.6 128ビットピクセルフォーマット 3.7 マルチ・サンプル・ポリゴン・アンチエイリアシン
グ 3.7.1 累算バッファ 3.7.2 Aバッファ 3.7.3 マルチサンプル 3.7.3.1 サンプルあたり色のみ 3.7.3.2 サンプルあたり色およびデプス 3.7.4 サンプルあたり色およびデプスの速度改良 3.8 256ビットピクセルフォーマット(4×マルチサ
ンプル) 3.9 512ビットピクセルフォーマット(6×マルチサ
ンプル) 4.0 双方向I/O 1.0 アーキテクチャ 図1は、計算機システムにおいて動作するグラフィック
スサブシステム100を図示する。グラフィックスサブ
システム100は、ビデオディスプレイフレームバッフ
ァとも呼ばれる。グラフィックスサブシステム100
は、レンダリングコントローラ102、その中でグラフ
ィックスサブシステム100が動作する計算機システム
へのインタフェース104、ビデオ出力回路106、レ
ンダリングコントローラ102からビデオ出力回路10
6へ延びるビデオ出力チャネル108、ここに開示する
1つまたは2つ以上のデュアルピクセル3DRAMチップ1
10、1つまたは2つ以上のレンダリングバス112、
および1つまたは2つ以上のアドレスおよび制御バス1
14を含む。図1に示すように、ビデオ出力回路106
はレンダリングコントローラ102から物理的に分離さ
れているが、代替的実施例は、単一のチップまたは装置
の中にレンダリングコントローラ102およびビデオ出
力回路106の両方を含む。
【0040】図1に示すグラフィックスサブシステム1
00は、レンダリングバス112とアドレスおよび制御
バス114との2つの別個の対に接続される4つのデュ
アルピクセル3DRAMチップの組110a〜dおよび11
0e〜hの2組を含む。ここでの構成では、レンダリン
グバス112とアドレスおよび制御バス114との対に
接続できるデュアルピクセル3DRAMチップ110の最大
数は4つである。しかし、図1の省略記号(...)によ
って示されるように、グラフィックスサブシステムにお
いて使用されるレンダリングコントローラ102とデュ
アルピクセル3DRAMチップ110との間のレンダリング
バスと制御バスとの対の数に制限はない。グラフィック
スサブシステム100は、処理されるピクセルデータに
依存して、シングル・バッファまたはダブル・バッファ
のいずれかであり、色バッファAおよびBならびに単一
のZバッファを含む。グラフィックスサブシステム10
0は、8ビット/ピクセルから最大512ビット/ピクセ
ルまでの範囲のさまざまな異なったピクセルフォーマッ
トをサポートする能力を特徴とし、これによって、多数
のフレームバッファ100の寸法に対応する。
【0041】レンダリングコントローラ102は、アド
レスおよび制御バス114を通じてデュアルピクセル3
DRAMチップ110a〜hのための制御情報を転送する。
レンダリングコントローラ102は、レンダリングバス
112を通じてデュアルピクセル3DRAMチップ110へ
のおよびデュアルピクセル3DRAMチップ110からのピ
クセルデータアクセスを行なう。レンダリングコントロ
ーラ102は、ピクセルアクセスのシーケンスをレンダ
リングオペレーションのシーケンスへ変換する。レンダ
リングバス112は、近年グラフィックス処理分野に出
現したRDRAMTMおよびSLDRAMなどの高帯域通信アーキテ
クチャをサポートする。
【0042】レンダリングコントローラ102は、レン
ダリングバス112を通じてピクセルデータをデュアル
ピクセル3DRAMチップ110a〜hに書込み、デュアル
ピクセル3DRAMチップ110a〜hは、レンダリングバ
ス112を通じてレンダリングコントローラ102へ更
新されたピクセルデータを転送する。レンダリングコン
トローラ102は、別個のアドレスおよび制御バス11
4を通じてフレームバッファ制御信号およびフレームバ
ッファコマンドをデュアルピクセル3DRAMチップ110
a〜hへ転送する。フレームバッファコマンドおよびフ
レームバッファ制御信号は、デュアルピクセル3DRAMチ
ップ110a〜hの内部オペレーションを調整する。
【0043】デュアルピクセル3DRAMチップ110は、
ピンの数を最小限に留めつつ、レンダリングコントロー
ラ102とデュアルピクセル3DRAMチップ110a〜h
との間で、制御情報を受信し、グラフィックスデータを
送受信するため、高帯域入/出力(I/O)技術をサポート
する。一実施例については、レンダリングバス102
は、データおよび制御I/O用のRambus Direct RDRAMTM
様に準拠し、1.8ギガビット/秒でピクセルデータを
転送する18ビット双方向データバスと800メガビッ
ト/秒で情報を転送する単方向アドレスおよび制御バス
とを有する。他実施例については、レンダリングバス1
02は、公式にはSyncLinkとして知られるオープンIEEE
およびJEDEC規格、SLDRAMに準拠する。以下に挙げる刊
行物は、このような高帯域I/Oアーキテクチャを詳細に
説明しており、その全体としてここに引用により援用さ
れる。援用される文献は、ピーター・ギリンガム(Pete
rGillingham)による『SLDRAMのアーキテクチャおよび
機能の概要』(“SLDRAM Architectural and Functiona
l Overview”)、MOSAIDテクノロジーズ(MOSAID Techn
ologies, Inc.)、1997年8月29日;IEEEコンピ
ュータ学会マイクロプロセッサおよびマイクロコンピュ
ータ規格小委員会後援の『高速メモリインタフェース
(SyncLink)規格草案』(“Draft Standard For A Hig
h-Speed MemoryInterface(SyncLink)”)、草案(Dra
ft)0.99 IEEE p1596.7−199X、1996年;『400
Mb/s/ピンSLDRAM″4M×18SLDRAMパイプライン方
式8バンク2.5V動作』(“400Mb/s/pin SLDRAM″4M
×18 SLDRAM pipelined, eightbank, 2.5V operatI/O
n”)、Draft/Advance SLD4M18DR400 4 MEG×18 SLD
RAM、SLDRAM協会発行、1997年9月22日である。
もちろん、異なったI/Oアーキテクチャをサポートする
ためデュアルピクセル3DRAMチップ110の他実施例も
可能である。
【0044】図2は、一実施例のデュアルピクセル3DR
AMチップ110を示す。デュアルピクセル3DRAMチップ
110は、図1のデュアルピクセル3DRAMチップ110
a〜hの各々と実質的に同様である。デュアルピクセル
3DRAMチップ110は、DRAMアレイ116、SRAMピクセ
ルバッファ118、2つのピクセル算術論理演算装置
(ALU)120および121、ならびに図示される実施
例においては別個のグローバル書込バス123およびグ
ローバル読出バス125それぞれを含むグローバルバス
122を含む。デュアルピクセル3DRAMチップ110は
また、グラフィックスデータが処理されデュアルピクセ
ル3DRAMチップ110内にストアされるのに伴い、グラ
フィックスデータを割振りフォーマット化するデータフ
ォーマッタといくつかのデータバスとを含む。
【0045】グラフィックスデータは、レンダリングバ
ス112を通じてデュアルピクセル3DRAMチップ110
へ入りかつそこから出る。デュアルピクセル3DRAMチッ
プ110へ送信されるグラフィックスデータは、入/出
力バス(I/Oバス)124により受信される。入力グラ
フィックスデータは、入力データデマルチプレクサ12
6によりデマルチプレクスされ、入力データバス128
を通じて入力データフォーマッタ130へ転送され、そ
こでデータはフォーマット化され、次にフォーマット化
されたデータは、それぞれ処理のためにピクセルALU1
20および121へと入力データバス129および13
1を通じて送信される。
【0046】デュアルピクセル3DRAMチップ110から
レンダリングバス112へ送信されるグラフィックスデ
ータは、SRAM出力データバス132を通じてSRAMピクセ
ルバッファ118から送られる。レンダリングバス11
2上で受信されるまでに、グラフィックスデータは出力
データフォーマッタ134によりフォーマット化され、
出力データバス135を通じて送信され、出力データマ
ルチプレクサ136によりマルチプレクスされ、チップ
110からI/Oバス124を通じて転送される。
【0047】データは、2つの別個のデータバス138
および139を通じて、ピクセルALU120および12
1とSRAMピクセルバッファ118との間で割振られる。
ピクセルALU120および121からSRAMピクセルバッ
ファ118へと送信されるグラフィックスデータは、そ
の途上、ピクセルALUからSRAMへのフォーマッタ140
によりフォーマット化され、次にデータバス141を通
じてSRAMピクセルバッファ118へと割振られる。
【0048】SRAMピクセルバッファ118からピクセル
ALU120および121へと送信されるグラフィックス
データは、SRAM出力データバス132を通じてSRAMから
ピクセルALUへのフォーマッタ144へ割振られ、そし
てフォーマット化されたデータはSRAMピクセルバッファ
データバス142および143を通じてピクセルALU1
20および121へ送信される。
【0049】チップ110上で行なわれるオペレーショ
ンを方向づけるために使用されるアドレスおよび制御情
報は、アドレスおよび制御バス114を通じてデュアル
ピクセル3DRAMチップ110へ送信される。情報は、ア
ドレスおよび制御入力バス146で受信され、アドレス
および制御デマルチプレクサ148によりデマルチプレ
クスされ、アドレスおよび制御バス150に沿ってデコ
ーダ151へと送信される。デコーダ151は、デマル
チプレクスされたアドレスおよび制御情報を受信し、こ
れをデコードし、次にデコードされた情報はピクセルAL
Uオペレーションチャネル152を通じてピクセルALU1
20および121ならびにSRAMピクセルバッファ118
へ送信され、グローバルバスオペレーションチャネル1
54を通じて、SRAMピクセルバッファ118、パイプラ
インレジスタ127および137ならびにDRAMアレイ1
16へと送信され、そして、バンクオペレーションチャ
ネル156を通じてDRAMアレイ116へ送信される。
【0050】図3は、RAMBUSTMまたは(以前にはSyncLi
nkとして知られていた)SLDRAM入力/出力インタフェー
ス仕様のいずれかで動作するよう構成されるデュアルピ
クセル3DRAMチップ110の一実施例のダイサイズのフ
ロアプランを示す。図2の機能ブロック図とは異なり、
図3のデュアルピクセル3DRAMチップ110のレイアウ
トは、図2に示す機能的要素のいくつかがデュアルピク
セル3DRAMチップ110の特定の実施例においてどのよ
うに物理的に実現され得るのかを示す。
【0051】たとえば、デュアルピクセル3DRAMチップ
110のこの物理的実現例は、チップ110の4つの角
に位置する4つのセクション116a〜dへ物理的に分
離されたDRAMアレイ116を特徴とする。この物理的な
分離にもかかわらず、DRAMアレイ116は図2に示すよ
うに1つの機能的単位として動作する。図3のDRAMアレ
イ116は、図3の4つのセクション116a〜dの各
々の中のA〜Hとラベリングされる8つのインターリー
ブされたモジュラーDRAMバンク158を含む。DRAMアレ
イ116と同様、8つのDRAMバンク158A〜Hはチッ
プ110の4つの角に物理的に配置されるが、これら
は、(32個ではなく)8個の機能単位として動作す
る。
【0052】デュアルピクセル3DRAMチップ110の全
体としてのDRAM容量は、特定のチップ110の構成にお
いて使用されるモジュラーDRAMバンク158の数に依存
して幅がある。各DRAMバンク158は、センス増幅器1
60を含む1組のラインバッファを含む。図22および
図23を参照されたい。(「ラインバッファ」および
「センス増幅器」または「センスアンプ」という語は、
ここでは交換可能なものとして使用され、いずれも要素
160を指す。)各DRAMバンク158は、DRAMビットの
いくつかのライン164を含む複数のDRAMページ162
を含む。
【0053】デュアルピクセル3DRAMチップ110の一
実施例は、10個のインターリーブされたDRAMバンク1
58を含む全部で40メガビットのDRAMアレイ116を
有し、各バンク158は512個のページ162を含
み、各ページ162は8個の1024ビットライン16
4を含む。この実施例においては、各DRAMバンク158
の構造は一定して4メガビットDRAMである(1024ビ
ット/ライン*8ライン/ページ*512ページ/バンク=
4194304ビット/バンク≒4メガビット/バン
ク)。デュアルピクセル3DRAMチップ110内のインタ
ーリーブされたDRAMバンク158の数を変えることによ
って、チップの内部アーキテクチャを変更することなく
チップ110の総記憶容量を調整することができる。
【0054】ラインバッファ160はセンス増幅器を含
み、DRAMバンク158内にストアされたピクセルデータ
にアクセスするとき、キャッシュラインの第2のレベル
として働く。(キャッシュラインの第1のレベルは、SR
AMピクセルバッファ118内のメモリのラインであ
る。)ラインバッファ160はDRAMバンク158へと直
接マッピングされる。一実施例においては、各ラインバ
ッファ160が、対応するDRAMバンク158のページの
1つをマッピングする。一実施例においては、ラインバ
ッファのエントリは1024ビットのライン一つを含
む。
【0055】再び図2を参照し、ピクセルバッファ11
8は高速マルチポートスタティックRAM(SRAM)構成要
素である。データは、グローバルバス122を通じて、
SRAMピクセルバッファ118とDRAMアレイ116との間
を転送される。図示される実施例においては、グローバ
ルバス122は2つの単方向バス、グローバル書込バス
123とグローバル読出バス125とを含む。
【0056】SRAMピクセルバッファ118は、ピクセル
ALUデータバス138を通じてピクセルALUからSRAMへの
フォーマッタ140によりフォーマット化されたデータ
を、読出す。SRAMピクセルバッファ118は、SRAM出力
データバス132を通じて、出力データフォーマッタ1
34およびSRAMからピクセルALUへのフォーマッタ14
4の両方にデータを書込む。出力データフォーマッタ1
34は、SRAMピクセルバッファ118からデータフィー
ルドをアンパックし、レンダリングバス112を通じて
送信されるディスプレイ出力用にフィールドのいくつか
を再パックする。SRAMからピクセルALUへのフォーマッ
タ144はまた、ピクセルALU120および121が使
用するようデータフィールドをアンパックする。
【0057】一実施例においては、グローバル書込バス
123およびグローバル読出バス125は各々、SRAMピ
クセルバッファ118とDRAMアレイ116との間で10
24ビットを搬送し、一方、ピクセルALUデータバス1
38および139ならびにSRAM出力データバス132は
各々256ビット幅である。
【0058】一実施例においては、SRAMピクセルバッフ
ァ118は、8本のキャッシュラインを有し、各キャッ
シュラインはメモリ1024ビット(1キロビット)を
含む。8キロビットSRAMピクセルバッファ118は8つ
の1キロビットキャッシュラインに編成される。他実施
例においては、SRAMピクセルバッファ118は16本の
1キロビットキャッシュラインに編成される。
【0059】グローバルバス122は、SRAMピクセルバ
ッファ118とDRAMアレイ116のセンスアンプ160
との間での通信を可能にする。好ましい実施例において
は、グローバルバス122は1024ビット10ナノ秒
デュアルバス123および125を含む。グローバル読
出バス125は、読出パイプラインレジスタ127を通
じてセンスアンプ160からSRAMピクセルバッファ11
8へデータを転送し、グローバル書込バス123は、デ
ータ書込パイプラインレジスタ137を通じてSRAMピク
セルバッファ118からセンスアンプ160へピクセル
データおよびマスクデータを転送する。この実施例はま
た、DRAMアレイ116内のどのビットに上書きするかを
制御するため、マスク書込パイプラインレジスタ145
およびマスク書込バス147を用いる。他実施例におい
ては、グローバルバス122は、グローバル読出バス1
25およびグローバル書込バス123の両方を含むが、
パイプラインレジスタ127、137および145は用
いられない。さらに他の実施例においては、グローバル
バス122は、SRAMピクセルバッファ118からの読出
およびSRAMピクセルバッファ118への書込の両方のた
めに交互に使用される単一の双方向バスを含む。
【0060】ピクセルALU120および121とSRAMピ
クセルバッファ118との間のデータ転送は、グローバ
ルバス122を通じてのSRAMピクセルバッファ118と
DRAMアレイ116との間のデータ転送とは異なる。一実
施例においては、ピクセルALU120および121は、
256ビット5ナノ秒のデータバス138および139
を通じてデータを書込み、ピクセルALU120および1
21は256ビット5ナノ秒のバス142および143
を通じて送信されるデータを読出す。
【0061】1.1 ピクセルALU ピクセルALU120および121は、SRAMピクセルバッ
ファ118へのパイプライン方式でのリード・モディフ
ァイ・ライトオペレーションを可能にする。パイプライ
ン方式のリード・モディファイ・ライトオペレーション
は、Z−バッファ比較、RGBアルファラスタオペレーシ
ョン、およびブレンドオペレーションを含む。好ましい
実施例のSRAMピクセルバッファ118のマルチポート性
により、グローバルバス122を通じてのDRAMアレイ1
16のラインバッファ160とSRAMピクセルバッファ1
18との間での全キャッシュラインの並列転送が可能に
なる。
【0062】図2および図3に図示するように、デュア
ルピクセル3DRAMチップ110は、オフチップ帯域幅要
求を最小限にするための2つのオンチップピクセルALU
120および121を特徴とする。96ビットまたは1
28ビットのピクセルを更新するためには、40ビット
の色情報と32ビットのデプス情報の送信が必要であ
る。
【0063】デュアルピクセル3DRAMグラフィックスサ
ブシステム100は、チップ110上のピンの数を最小
限にしつつ、レンダリングコントローラ102とデュア
ルピクセル3DRAMチップ110との間でデータおよび制
御情報を送信するため、Direct RDRAMTMBY RAMBUSまた
は(従前にはSyncLinkとして知られていた)SLDRAMなど
の高帯域I/O技術を用いる。一実施例においては、デュ
アルピクセル3DRAMグラフィックスサブシステム100
は、1.8ギガビット/秒で遷移する(すなわち立上が
り端および立下がり端の両方におけるデータの遷移が4
00MHzクロックである)18ビット半二重双方向デー
タバス112、および、800メガビット/秒で遷移す
るレンダリングコントローラ102からデュアルピクセ
ル3DRAMチップ110a〜hへの8ビット単方向制御バ
ス114を使用する。この実施例においては、ピクセル
ALU120および121は、処理されるピクセルのフォ
ーマットに依存して、200MHzまたは133MHzのいず
れかで動作し、そのため、デュアルピクセル3DRAMチッ
プ110のピンにおいて受信される狭高周波数データス
トリームは、内部では4倍から6倍幅が広いデータスト
リームへとデマルチプレクスされる必要がある。同様
に、デュアルピクセル3DRAMチップ110において処理
されるデータは、レンダリングバス112を通じてレン
ダリングコントローラ102へ送られる前にマルチプレ
クスされねばならない。
【0064】図3を参照し、ピクセルALU120および
121は、デュアルピクセル3DRAMチップ110の中央
に位置づけられる。ピクセルALU120および121
は、処理要素の2つの完全な組を含み、したがって、多
くの状況下でピクセルALU120および121がオペレ
ーションごとに2つのピクセルを処理することを可能に
する。処理されるピクセルのフォーマットが、ピクセル
ALU120および121が2つのピクセルを個別に処理
できるか、または、一度に単一のピクセルを処理するよ
うそれらのリソースを組合せなければならないかどうか
を決定する。処理要素の完全な組ひとつは、4つのラス
タオペレーション(ROP)/ブレンドユニット166、デ
プスユニット168、ステンシルユニット170および
ウィンドウ識別(WID)ユニット172を含む。
【0065】図4は、処理要素を2組含むピクセルALU
120および121の一実施例を示す。処理要素の第1
の組は、第1のピクセルALU120に対応し、「0」と
ラベリングされている。処理要素の第2の組は、第2の
ピクセルALU121に対応し、「1」とラベリングされ
ている。ROP/ブレンドユニット166は、ユニット16
6を実現するため使用される回路のいくつかが共用され
ることを示すため図では重なり合うように示されてい
る。
【0066】図5はやはり処理要素の完全な組2つを含
むピクセルALU120および121の他実施例である。R
OP/ブレンドユニット166は、別個のROPユニット17
4とブレンドユニット176とに分割される。この実施
例では、ROP/ブレンドユニット166の間で共有される
回路はない。この実施例は、4つの8ビットブレンドユ
ニット178と4つの10ビットブレンドユニット18
0とを特徴とする。より大きなピクセルフォーマットに
対応するため、容量の異なるブレンドユニットが設けら
れる。好ましい実施例では、ROP/ブレンドユニットは各
々10ビットユニットである。
【0067】図6は、ピクセルALU120および121
のいずれか一方の中の処理ユニットの完全な組を示す。
チップ110上に組合される、ピクセルALU120およ
び121はこれらユニットの完全な組2つを有し、した
がって、デュアルピクセル3DRAMチップ110が多くの
状況下でオペレーションごとに2つのピクセルを処理す
ることができる。文字「S」は、レンダリングバス11
2を通じてピクセルALU120または121へ送信され
るソースデータを示す。文字「D」は、グローバルバス
122を通じてSRAMピクセルバッファ118からピクセ
ルALU120または121へ送信される行先データを示
す。文字「R」は、グローバルバス122を通じてSRAM
ピクセルバッファ118へ再び送信される結果データを
示す。文字「DT」、「ST」および「WT」は、それぞれデ
プスユニット168、ステンシルユニット170および
ウインドウIDユニット172により行なわれるテストの
結果である。処理ユニットの完全な組は、各ピクセルの
アルファ成分、赤成分、緑成分および青成分の処理のた
めの4つのROP/ブレンドユニット166を含む。デュア
ルピクセル3DRAMチップ110のこの実施例において
は、ROP/ブレンドユニット166へのソースデータ入力
ストリームおよび行先データ入力ストリームは各々11
ビット幅である。ROP/ブレンドユニット166から出力
される結果データストリームは、10ビット幅である。
デプスユニット168については、ソースデータストリ
ーム、行先データストリーム、および結果データストリ
ームは32ビット幅である。ステンシルユニット170
は、行先ストリームを受信して、結果ストリームを出力
し、その両方とも8ビット幅である。ウインドウIDユニ
ット172は8ビットの行先データストリームを受信す
る。
【0068】1.1.1 ROP/ブレンドユニット 図7は、一実施例における1つのROP/ブレンドユニット
166をブロック図の形で示す。この実施例において
は、8個の10ビットROP/ブレンドユニット166が2
つのピクセルALU120および121の中に位置する。
8個のROP/ブレンドユニット166の各々は、機能的に
同一であり、(ソース色(Sc)、ソース係数(Sf)、行
先色(Dc)および行先係数(Df)用の)4つの11ビッ
トデータ入力と結果用の10ビットデータ出力とを有す
る。各ROP/ブレンドユニット166は、(1)ROP(S
c、Pc、Dc)、(2)min(Sc、Dc)、(3)max(Sc、D
c)、(4)Sc*Sf+Dc*Df、(5)Sc*Sf−Dc*Df、
または(6)Dc*Df−Sc*Sfの6つのオペレーションの
うち1つを行なう。
【0069】ROPオペレーション、minオペレーション、
maxオペレーションまたは8ビットブレンドオペレーシ
ョンを行なうとき、8個のROP/ブレンドユニット166
は、すべて並列に作業できる。10ビットブレンドオペ
レーションを行なうときは、必要とされる処理を行なう
ためにブレンドユニット176の対を互いに組合せる必
要がある。したがってデュアルピクセル3DRAMチップ1
10により10ビットブレンドオペレーションが行なわ
れるときには、1度に1つのピクセルしか処理できな
い。他実施例は、8個の10ビットROP/ブレンドユニッ
ト166を有し、いかなる場合にも一度に2つのピクセ
ルを処理できる。
【0070】ソースブレンド係数「Sf」および行先ブレ
ンド係数「Df」は、次の表1に示すようにソース色、行
先色およびパターン色から導出される。
【0071】
【表1】
【0072】次に図8を参照し、ROP/ブレンドユニット
166のラスタオペレーション(ROP)部174が、2
56個のブール演算のうち1つをソースSc入力、行先Dc
入力およびパターンPc入力に対して行なう。アドレスお
よび制御バス114を通じて送信される情報によりセッ
トされるROPレジスタ182が、256個のブール演算
のうちどれを行なうかを決定する。3つの入力が必要と
される場合には、ラスタオペレーションが行なわれる前
に入力ひとつがパターンレジスタ184に書込まれる。
ROP部174の1ビットスライスは、次のブール方程式
によって実現できる。
【0073】
【数1】
【0074】図9から図14を参照し、ROP/ブレンドユ
ニット166のブレンド部176は、処理回路または要
素すなわち、1つのディザ計算装置186、2つの乗算
器188および190、加算器192、1つの切捨て装
置194および1つのクランプ装置196を含む。図9
に、8ビットブレンドユニット178を示す。オペレー
ションごとに2つのピクセル(またはアンチエイリアシ
ングを行なうときにはサンプル)をブレンドできるよう
にするためにはこれらのユニットが8つ必要である。
【0075】ソース色値S colorおよび行先色値D color
は、それらを表わすためにいくつのビットが使用されて
いるかにかかわらず、[0.0,1.0]の範囲内の値をとる。
各ビットエンコーディングはある範囲の値を表わす。た
とえば、8ビット入力で14は、[14/256,15/256)の範
囲を表わす。計算を行なうときは、範囲全体を表わすた
めの一つの値が選択される。もし範囲[14/256,15/256)
を表わすために値14/256が選択されたならば、計算のエ
ラーはその範囲の下端に向けて偏らされるであろう。も
し、その範囲の中間点が選択されたならば、すなわち1
4.5/256が選択されたならば、計算のエラーはその範囲
に対して偏りがないようにされ、最終的な結果はより正
確になるであろう。これは乗算器への入力の最下位ビッ
トに1を連結することによって達成できる。したがって
8ビットブレンドユニット178は、9ビット対9ビッ
トの乗算器188および190を必要とする。
【0076】図10は、ブレンドオペレーション計算の
間の中間値のフォーマットを示す。ディザ・オフセット
値が、ピクセルのXアドレスおよびYアドレスの2つの最
下位ビットに基づいて計算される。2つの積とディザオ
フセットとが加算される。最大で、積の値の一方の否定
がとられてもよい。次に和が切捨てられ、クランプされ
て結果となる。
【0077】一実施例においては、図11およびここに
その全体として引用により援用されるフォーリー(Fole
y)、ヴァンダム(vanDam)、フェイナー(Feiner)、
およびヒュー(Hughes)による『コンピュータグラフィ
ックスの原理および実際』(“Computer Graphics Prin
ciples and Practice”)、第2版pp.570〜57
1に反映されるように、4×4Bayerディザマトリクス
のドット分散型組織的ディザアルゴリズムが用いられ
る。(-0.5,0.5)の範囲のディザ値が切捨て前に結果値
をオフセットする。もちろん、当分野で公知の他のディ
ザアルゴリズムも使用できる。
【0078】図12は10ビットブレンドユニット18
0を示す。オペレーションごとに1つのピクセルをブレ
ンドできるようにするためこれらのユニット4つが必要
である。一実施例においては、10ビットブレンドユニ
ット180各々と8ビットブレンドユニット178の各
対との間で可能な限り多くの論理を再使用するような態
様で、10ビットブレンドユニット180が実現され
る。10ビットブレンドユニット180は、8ビットブ
レンドユニット178に関して上に説明したのと同じ理
由で2つの11ビット対11ビット乗算器188および
190を必要とする。
【0079】この実施例はまた、そこを通ってソース係
数Sfおよび行先係数DfのデータがROP/ブレンドユニット
166へ入力される2つの入力マルチプレクサ206お
よび208を特徴とする。図14は、入力マルチプレク
サ206および208の詳細な図である。
【0080】1.1.2 デプスユニット 図15はデプスユニット168のブロック図である。ピ
クセルALU120および121には2つのデプスユニッ
ト168がある。2つのデプスユニット168は、ソー
スデータ32ビットを行先データ32ビットと比較す
る。制御情報が16ビットマスクレジスタ210へ与え
られ、次に、比較オペレーションの前にソースデータお
よび行先データとビットごとに論理積を取られる。(1)
フェール、(2)src<dest、(3)src==dest、(4)src<=
dest、(5)src>dest、(6)src!=dest、(7)src>=des
t、および(8)パスの8つのテストのうち1つを指定す
る、ファンクション/オペレーションレジスタ212内
の3ビットレジスタフィールドにより、符号なし整数比
較オペレーションが指定される。正のIEEE単精度浮動小
数点数であれば、符号ビットをゼロでマスクすれば、正
しく比較されるであろう。
【0081】1.1.3 ステンシルユニット 図16および図17は、ステンシルユニット170のブ
ロック図である。ピクセルALU120および121には
2つのステンシルユニット170がある。2つの8ビッ
トステンシルユニット170は各々、行先ステンシル用
の8ビットデータ入力、1ビットデプステスト入力、8
ビットデータ出力および1ビット比較出力を有する。符
号のない整数比較オペレーションは、ファンクション/
オペレーションレジスタ214内の3ビットレジスタフ
ィールドにより指定され、(1)フェール、(2)ref<des
t、(3)ref==dest、(4)ref<=dest、(5)ref>dest、
(6)ref!=dest、(7)ref>=dest、および(8)パスの8
つのテストのうち1つを指定する。
【0082】図17を参照し、デプステストおよびステ
ンシルテストの状態に依存して、3つのステンシルオペ
レーションコードのうち1つが選択される。オペレーシ
ョンコードは、どのステンシルオペレーションが行なわ
れるかを決定する。可能なステンシルオペレーション
は、dest、0、ref、wrap(dest+1)、wrap(dest−1)、sa
turate(dest+1)、saturate(dest−1)、および~destで
ある。
【0083】1.1.4 ウインドウIDユニット 図18は、ウインドウ識別(ID)ユニット172のブロ
ック図である。ピクセルALU120および121には2
つのウインドウIDユニット172がある。2つの8ビッ
トウインドウID比較ユニット172は各々、行先WID用
の8ビットデータ入力と1ビット比較結果出力とを有す
る。ウインドウIDユニット172の挙動は、マスクレジ
スタ216内の8ビットフィールドと基準レジスタ21
8内の8ビットフィールドとファンクションレジスタ2
20内の3ビットフィールドとによって制御される。フ
ァンクションレジスタの2ビットフィールドは、(1)フ
ェール、(2)ref<dest、(3)ref==dest、(4)ref<=de
st、(5)ref>dest、(6)ref!=dest、(7)ref>=dest、
および(8)パスの8つのテストのうち1つを指定する。
ウインドウIDユニット172とステンシルテストユニッ
ト170とは機能的に同一である。
【0084】ウインドウIDユニット172、ステンシル
ユニット170およびデプスユニット168からのテス
ト結果は、デュアルピクセル3DRAMチップ110内のオ
ペレーションを制御するため使用される。表2は、3つ
のユニットの結果に基づいて行なわれるかまたは行なわ
れないアクションのリストである。
【0085】
【表2】
【0086】1.2 SRAMピクセルバッファ図19および
図20は、SRAMピクセルバッファ118を示す。一実施
例においては、SRAMピクセルバッファ118は、8ワー
ド×1024ビットのマルチポートSRAMで実現される。
グローバルバス122は、1024ビットパイプライン
レジスタ127を通じてDRAMアレイ116のセンスアン
プ160からSRAMピクセルバッファ118へデータを転
送する1024ビット10ナノ秒読出バス125を含
む。グローバルバス122はまた、1024ビットパイ
プラインレジスタ137を通じてSRAMピクセルバッファ
118からセンスアンプ160へデータを転送する10
24ビット10ナノ秒書込バス123を含む。この実施
例においては、グローバルバス122はまた、マスク書
込パイプラインレジスタ145およびマスク書込バス1
47を通じてSRAMピクセルバッファ118からセンスア
ンプ160へマスクデータ1024ビットを転送する。
【0087】SRAMピクセルバッファ118内のキャッシ
ュラインは各々、バンクアドレス5ビットおよびコラム
アドレス3ビットを含むタグ230と関連づけられる。
タグ230は、現在SRAMピクセルバッファ118内にス
トアされているデータがやってきた位置を追跡するため
に使用される。
【0088】グローバルバスの読出オペレーションは、
Read Cache Line(RL:キャッシュライン読出)オペレ
ーションまたはChange Cache Line(CL:キャッシュラ
イン変更)オペレーションのいずれかにより開始され
る。初めの10ナノ秒サイクルの間に、指定されたDRAM
バンク158およびコラムからデータ読出パイプライン
レジスタ127へとデータ1024ビットがコピーされ
る。次の10ナノ秒サイクルの間に、データ読出パイプ
ラインレジスタ127からSRAMピクセルバッファ118
内の指定されたラインへとデータ1024ビットがコピ
ーされ、そのデータが取出されたバンクおよびコラムの
アドレスがキャッシュラインのタグ230へ書込まれ
る。
【0089】グローバルバスの書込オペレーションは、
Write Cache Line(WL:キャッシュライン書込)オペレ
ーション、Masked Write Cache Line(ML:キャッシュ
ラインのマスク書込)オペレーションまたはChange Cac
he Line(CL)オペレーションにより開始される。初め
の10ナノ秒サイクルの間に、SRAMピクセルバッファ11
8内の指定されたラインからデータ書込パイプラインレ
ジスタ137へとデータ1024ビットがコピーされ、
プレーンマスクおよびバイトマスクレジスタからマスク
データ1024ビットが発生され、マスク書込パイプラ
インレジスタ147へコピーされる。もしオペレーショ
ンがWLまたはMLであれば、オペレーションのバンクおよ
びコラムアドレスは、バンクパイプラインレジスタ23
1およびコラムパイプラインレジスタ232へコピーさ
れる。もしオペレーションがCLであれば、バンクパイプ
ラインレジスタ231およびコラムパイプラインレジス
タ232は、指定されたキャッシュラインのバンクおよ
びコラムタグ230からコピーする。次の10ナノ秒サ
イクルの間に、データ書込パイプラインレジスタ137
の内容は、マスク書込パイプラインレジスタ145の制
御下で、バンクおよびコラムパイプラインレジスタ23
1および232により指定されるDRAMバンクおよびコラ
ムへコピーされる。
【0090】上に説明した手順に対するサンプル関数は
以下のとおりである。
【0091】
【数2】
【0092】ピクセルALU読出オペレーションは、Read
Data(RDAT:データ読出)オペレーション、Read Pixel
(RPIX:ピクセル読出)オペレーション、Single Pixel
(SPIX:シングル・ピクセル)オペレーションおよびDu
al Pixel(DPIX:デュアル・ピクセル)オペレーション
により開始される。ピクセルALUデータバス141は、
256ビット幅であり5ナノ秒の速度で動作し、SRAMピ
クセルバッファデータバス142もまた、256ビット
幅であり5ナノ秒の速度で動作する。SRAMピクセルバッ
ファ118は、512ビットのプレーンマスク222を
含む付加的なラインを有する。MLオペレーションの間
に、512ビットのプレーンマスクレジスタと128ビ
ットのバイトマスクレジスタとが組合されて、1024
ビットのマスク書込145の内容が発生され、これは同
時に書込データとしてラッチされる。
【0093】読出ポートおよび書込ポートは、128ビ
ットのバウンダリでアドレス指定される。256ビット
データチャネル138および142は200MHzで動作
し、一方1024ビットグローバルバスチャネル122
は100MHzで動作する。好ましい実施例においては、S
RAMピクセルバッファ118は、8つのキャッシュライ
ン224を有する。256ビットデータチャネル138
および142は、任意の128ビットバウンダリから始
めて、キャッシュライン224の連続した256ビット
にアクセスすることができねばならない。図3に示すよ
うに、一実施例においてこの要求は、SRAMピクセルバッ
ファ118を、64ビットのデータ読出チャネル138
a〜dおよびデータ書込チャネル132a〜dを備える4つ
の物理アレイ118a〜dに分けることによって満足され
る。この実施例においては、別個の読出アドレスおよび
書込アドレスが、4つの別個のアレイ各々に与えられ
る。他実施例においては、グローバルバス122が、SR
AMピクセルバッファ118とセンスアンプ160との間
での同時読出および書込オペレーションを可能にし、そ
れによってダーティタグの必要性をなくしている。
【0094】他実施例においては、データがDRAMアレイ
116から転送されてから、SRAMピクセルバッファキャ
ッシュライン224のどのビットがピクセルALU120
および121により更新されたかを示すため、SRAMピク
セルバッファ内でダーティタグ226が使用される。図
20を参照し、ダーティタグSRAM226は、16ワード
×256ビットのデュアルポートSRAMで実現される。グ
ローバルバス122は、256ビット10ナノ秒の読出
/書込ポートに接続される。ピクセルALU120および1
21は、256個のビットごとの書込イネーブル(WE)
を備えるマスクデータを256ビット5ナノ秒書込ポー
トに書込む。
【0095】Read Cache Line(RL)オペレーションの
間に、データのラインは、SRAMピクセルバッファ118
のデータ部に書込まれ、タグSRAM226内の対応するラ
インがクリアされる。
【0096】1.3 メモリ構成 図21、図22および図23は、一実施例のDRAMアレイ
116の構成を示す。DRAMアレイ116はモジュラーDR
AMバンク158を含む。メモリの基本単位は、1024
ビットを保持するライン164である。ページ162
は、8つのライン164、または8キロビットを含む。
一実施例においては、DRAMバンク158は512個のペ
ージ162、またはメモリ4メガビットを含む。他実施
例においては、DRAMバンク158は、1024個のペー
ジ162、またはメモリ8メガビットを含む。DRAMバン
ク158がメモリ8メガビットを保持する実施例におい
ては、それぞれ40メガビット、48メガビット、64
メガビット、80メガビット、96メガビット、128
メガビットおよび160メガビットのDRAMアレイ116
をサポートするため5、6、8、10、12、16およ
び20個の個別のDRAMバンク158が必要である。
【0097】次の表は、64/72メガビットDirect RDRAM
TMのデータシートおよび4メガビット×18SLDRAMデータ
シートの両方に対するDRAMアレイ116の構成に基づ
く。Direct RDRAMTMは、DRAMコアとI/Oセクションとの
間の128/144ビットインタフェースを有する。SLDRAM
は、64/72ビットインタフェースを有する。デュアルピ
クセル3DRAM110は、1024ビットインタフェース
を有する。
【0098】
【表3】
【0099】
【表4】
【0100】1.4 ピン構成 デュアルピクセル3DRAMチップ110は、Direct RDRAM
TMまたはSLDRAMとピン互換性がある。次の表はDirect R
DRAMTMと互換性のあるピン構成を示す。
【0101】
【表5】
【0102】1.5 プロトコル 制御およびアドレス情報を送信するため、Direct RDRAM
TMは8つのピンを備え、SLDRAMは10個のピンを備え
る。デュアルピクセル3DRAMプロトコルは、いずれのイ
ンタフェース技術においても使用できるよう8つのピン
を必要とする。各ポートは、1つから4つのデュアルピ
クセル3DRAMチップ110を制御する。
【0103】次に図24および図25を参照し、制御お
よびアドレス情報800メガバイト/秒が、3つのチャ
ネルに分割される。ピクセルALUオペレーションチャネ
ル152は、1秒あたり400メガバイトを扱い、ピク
セルALU120および121、SRAMピクセルバッファ1
18ならびにレンダリングバス112とのインタフェー
スを制御する。バンクオペレーションチャネル156
は、1秒あたり200メガバイトを扱い、DRAMバンク1
58およびページ162へのアクセスおよびプリチャー
ジを制御する。グローバルバスオペレーションチャネル
154は、1秒あたり200メガバイトを扱い、グロー
バルバス122を通じてのSRAMピクセルバッファ118
キャッシュライン224の読出および書込を制御する。各
チャネル152、154および156は、3つのチャネ
ルが同時に異なるデュアルピクセル3DRAMチップ110に
対して動作できるよう、それ自身のオペレーションのフ
レーム化を行ないそれ自身の装置識別情報を含む。
【0104】1.5.1 DRAMバンクオペレーション DRAMバンクオペレーションは、帯域幅200メガバイト
/秒の専用2ピン制御チャネル156を通じて送信され
る。DRAMバンクオペレーションは、任意のクロックの立
下がり端において送信を開始できる。次の表6に挙げる
バンクオペレーションが、一実施例において規定され
る。
【0105】
【表6】
【0106】図26を参照し、ビットD1:0が、共通バス
114を通じて接続される4つの可能なデュアルピクセ
ル3DRAM装置110のうち1つを選択する。ビットB4:0
が、単一のデュアルピクセル3DRAM装置110内の32
の可能なDRAMバンク158のうち1つを選択する。ビッ
トP9:0が、DRAMバンク158内の1024個の可能なペ
ージ162のうち1つを選択する。
【0107】IDLEオペレーションは、1サイクルの間何
もしない。図26および図27を参照し、Precharge Pa
ge(PP:ページプリチャージ)オペレーションは、装置
D1:0のバンクB4:0をプリチャージし、送信に3サイク
ル、実行に8サイクルかかる。
【0108】図26および図28を参照し、Access Pag
e(AP:ページアクセス)オペレーションは、装置D1:0
のバンクB4:0のページP9:0にアクセスし、送信に5サイ
クル、実行に8サイクルかかる。DRAMバンク158は、
前もってプリチャージされていなければならない。
【0109】図26および図29を参照し、Change Pag
e(CP:ページ変更)オペレーションは、Access Pageオ
ペレーションと、その後に続く同じ装置の同じバンクへ
のPrecharge Pageオペレーションとを組合せたものであ
る。
【0110】1.5.2 グローバルバスオペレーション グローバルバスオペレーションの転送は、帯域幅が20
0メガバイト/秒の専用2ピン制御チャネル154によ
り管理される。グローバルバスオペレーションは、任意
のクロックの立下がり端において送信を開始できる。グ
ローバルバス転送には4クロック必要なので、コマンド
送信にも4クロックかかり得る。
【0111】図30から図34を参照し、ビットD
1:0は、共通バス114に繋がっている4つの可能なデ
ュアルピクセル3DRAM装置110のうち1つを選択す
る。ビットB4: 0は、装置110内の32の可能なDRAMバ
ンク158のうち1つを選択する。ビットC2:0は、選択
されたDRAMバンク158内の8つの可能なキャッシュラ
インバッファ160のうち1つを選択する。ビットL3:0
は、SRAMピクセルバッファ118内の16の可能なキャ
ッシュライン224のうち1つを選択する。
【0112】次の表7は、一実施例において規定される
グローバルバスオペレーションのリストである。
【0113】
【表7】
【0114】図30を参照し、IDLEオペレーションは、
1サイクルの間何もしない。Read Cache Line(RL)、W
rite Cache Line(WL)、Masked Cache Line(ML)およ
びChange Cache Line(CL)のコマンドはすべて、図3
1に示すように制御(RQ)ピンにおいて同一のフォーマ
ットを有する。図32に、Fast Fill CacheLine(FL:
キャッシュラインの高速フィル)コマンドを示す。
【0115】図33を参照し、Read Cache Line(RL)
オペレーションは、装置D1:0にのみ与えられ、DRAMバン
ク158、B4:0からパイプラインレジスタ127へキャ
ッシュラインバッファ160、C2:0をコピーする。次
に、SRAMピクセルバッファ118のラインL3:0へパイプ
ラインレジスタ値を書込む。このオペレーションは、送
信に4サイクル、各データ転送を行なうのに4サイクル
かかる。SRAMピクセルバッファ118内の各ラインは、
そのラインがどこから来たかを示すバンクおよびコラム
タグ230を有する。バンクおよびコラムタグ230
は、SARMピクセルバッファ118への書込転送の間にRL
オペレーションによってセットされる。
【0116】図34を参照し、Write Cache Line(WL)
オペレーションは、装置D1:0にのみ与えられ、SRAMピク
セルバッファ118からパイプラインレジスタ137へ
キャッシュライン224、L3:0をコピーする。パイプラ
インレジスタデータは、次にDRAMバンク158、B3:0
コラムC2:0へコピーされる。バンクおよびコラムタグ2
30は無視される。このオペレーションは、送信に4サ
イクル、各データ転送を行なうのに4サイクルかかる。
【0117】図35を参照し、Masked Write Cache Lin
e(ML)オペレーションは、装置D1: 0にのみ与えられ、S
RAMピクセルバッファ118からパイプラインレジスタ
へキャッシュラインL2:0をコピーする。次に、パイプラ
インレジスタのデータは、バンクB3:0のコラムC2:0へコ
ピーされる。バンクおよびコラムタグは無視される。こ
のオペレーションは、送信に4サイクル、各データ転送
を行なうのに4サイクルかかる。プレーンマスクレジス
タおよびバイトマスクレジスタは両方とも、1024ビ
ットに拡張され、キャッシュラインがセンスアンプに書
込まれるときビットごとの書込イネーブルとして使用さ
れる。
【0118】図36を参照し、Flash Masked Write Cac
he Line(FL:キャッシュラインのフラッシュマスク書
込)オペレーションは、パイプラインデータおよびマス
クが1つのコラムにだけではなく4つのコラムに書込ま
れるという点を除いてはMLと同様である。このオペレー
ションは、装置D1:0にのみ与えられ、SRAMからパイプラ
インレジスタへキャッシュラインL2:0をコピーする。次
に、パイプラインレジスタのデータは、バンクB3:0のコ
ラム0〜3または4〜7のいずれかへコピーされる。バ
ンクおよびコラムタグは無視される。このオペレーショ
ンは、送信に4サイクル、各データ転送を行なうのに4
サイクルかかる。プレーンマスクレジスタおよびバイト
マスクレジスタは両方とも、1024ビットに拡張さ
れ、キャッシュラインがセンスアンプに書込まれるとき
ビットごとの書込イネーブルとして使用される。
【0119】図37を参照し、Change Cache Line(C
L)オペレーションが、装置D1:0にのみ与えられ、同時
にRead Cache Line(RL)オペレーションおよびWrite C
ache Line(WL)オペレーションを行なう。オペレーシ
ョンからのバンクおよびコラムフィールドが、RLコマン
ドを制御する。キャッシュライン224からのバンクお
よびコラムタグ230が、WLコマンドを制御する。この
オペレーションは、送信に4サイクル、各データ転送を
行なうのに4サイクルかかる。
【0120】1.5.3 ピクセルALUオペレーション ピクセルALUオペレーションは、帯域幅が400メガバ
イト/秒の専用4ピン制御チャネル152を通じて送信
される。ピクセルALUオペレーションは、任意のクロッ
クの立下がり端で送信を開始できる。IDLE以外のオペレ
ーションは、制御ピンを介する送信に2サイクル必要と
する。各ピクセルALUオペレーションは、データピン(D
QA[8:0]およびDQB[8:0])を介する2サイクルでのデー
タ72ビットの転送または3サイクルでのデータ108
ビットの転送を制御する。各オペレーションの~2/3ビッ
トはいくつのサイクルが必要であるかを示す。データ転
送に3サイクル必要とするピクセルALUオペレーション
は、その後にIDLEサイクルが続かねばならない。次の表
8に挙げるオペレーションは、一実施例について規定さ
れるピクセルALUオペレーションである。
【0121】
【表8】
【0122】ビットO3:0は、オペレーションのタイプを
指定する。ビットD1:0は、共通バス114に繋がってい
る4つのデュアルピクセル3DRAM装置110のうち1つ
を選択する。ブロードキャストオペレーションにおいて
は、D1:0は無視される。ビットL2:0は、SRAMピクセルバ
ッファ118内の8つのキャッシュライン224のうち
1つを選択する。ビットP3:0は、キャッシュライン22
4内の16個のピクセルのうち1つを選択する。P3:0
解釈は、オペレーションのタイプおよび現在のピクセル
のデプスに依存して幅がある。ビットR7:0は、レジスタ
のアドレスを指定するためレジスタオペレーションによ
り使用される。
【0123】図38を参照し、IDLEは、1サイクルの間
何もしない。図39を参照し、Read Data(RDAT:デー
タ読出)オペレーションは、指定された装置110のSR
AMピクセルバッファ118の指定されたライン224の
指定されたピクセルから生データ64ビットを読出す。
このオペレーションは、いかなるレジスタのセッティン
グによっても影響されない。
【0124】Write Data(WDAT:データ書込)オペレー
ションは、指定された装置110のSRAMピクセルバッフ
ァ118の指定されたライン224の指定されたピクセ
ルへ生データ64ビットを書込む。バイトごとの書込イ
ネーブルが、ピンDQA8およびDQB8を通じて送信される。
このオペレーションはいかなるレジスタのセッティング
によっても影響されない。
【0125】Broadcast Data(BDAT:データブロードキ
ャスト)オペレーションは、すべてのデュアルピクセル
3DRAM装置110のSRAMピクセルバッファ118の指定
されたライン224の指定されたピクセルへ生データ6
4ビットをブロードキャストする。バイトごとの書込イ
ネーブルが、ピンDQA8およびDQB8を通じて送信される。
このオペレーションはいかなるレジスタのセッティング
によっても影響されない。
【0126】図40を参照し、Read Register(RREG:
レジスタ読出)オペレーションは、指定された装置11
0からレジスタ値を読出す。
【0127】Write Register(WREG:レジスタ書込)オ
ペレーションは、レジスタ値を指定された装置110へ
書込む。バイトごとの書込イネーブルが、ピンDQA8およ
びDQB8を通じて送信される。
【0128】Broadcast Register(BREG:レジスタブロ
ードキャスト)オペレーションは、レジスタ値をすべて
の装置110へブロードキャストする。バイトごとの書
込イネーブルが、ピンDQA8およびDQB8を通じて送信され
る。
【0129】図41を参照し、Read Pixel(RPIX)オペ
レーションは、表示リフレッシュのためにパックされた
ピクセルを読出す。
【0130】Single Pixel(SPIX)オペレーションは、
単一のソースピクセルを既にSRAMピクセルバッファ11
8内にあるピクセルデータとマージする。
【0131】Dual Pixel(DPIX)オペレーションは、2
つの隣り合ったソースピクセルを既にSRAMピクセルバッ
ファ118内にあるピクセルデータとマージする。
【0132】デュアルピクセル3DRAMチップ110の一
実施例は、ダーティタグを使用する。この実施例におい
ては、Write Tag(WTAG:タグ書込)オペレーション
は、バイトマスクデータ64ビットを128ビットのマ
スクに拡張し、これは指定された装置のダーティタグ2
26の指定されたライン224の上位半分または下位半
分に書込まれる。ラインに対するダーティタグ226
は、グローバルバスを通じてDRAMアレイにラインを書込
むのにかかる時間の量と一致して、2サイクルで書込む
ことができる。
【0133】図42は、デュアルピクセル3DRAM装置1
10が各サイクルにおいてデータ36ビットを転送でき
る一実施例を示す。データの2クロックまたは3クロッ
クが、各ピクセルALUオペレーションに関連付けられ
る。
【0134】図43を参照し、Read Data(RDAT)オペ
レーションおよびRead Pixel(RPIX)オペレーション
は、SRAMピクセルバッファ118ならびにピクセルALU
120および121のいくつかを用いる。ピクセルALU
120および121が使用されず、SRAMピクセルバッフ
ァ118には何も書込まれない。図43は、3サイクル
RPIXが後に続く2サイクルRDATを示す。
【0135】図44に示すように、Write Data(WDAT)
オペレーション、Broadcast Data(BDAT)オペレーショ
ン、Write Register(WREG)オペレーションおよびBroa
dcast Register(BREG)オペレーションは、DQピン上で
データを受信し、ピクセルALU120および121を通
じてデータを送り、適当な段でデータをラッチする。上
述のオペレーションのいずれも3サイクル転送による利
益を受けない。
【0136】Single Pixel(SPIX)オペレーションおよ
びDual Pixel(DPIX)オペレーションは、SRAMピクセル
バッファ118ならびにピクセルALU120および12
1を十分に利用する。これらの2つのオペレーション
は、SRAMピクセルバッファ118からデータを読出しア
ンパックし、DQピンからデータを受信し、ピクセルALU
120および121内のデータの組を両方組合せ、再び
SRAMピクセルバッファ118へ結果を書込む。図45は
2サイクルでのSPIX転送を示し、図46は3サイクルで
のDPIX転送を示す。
【0137】1.6 オペレーションタイミング 上に説明したオペレーションの多くのタイミングの例を
図47から図53に示す。
【0138】図47は、複合2サイクル読出および2サ
イクル書込オペレーションの図である。
【0139】図48は、複合2サイクル読出および3サ
イクル書込オペレーションの図である。
【0140】図49は、複合3サイクル読出および2サ
イクル書込オペレーションの図である。
【0141】図50は、複合3サイクル読出および3サ
イクル書込オペレーションの図である。
【0142】図51は、4つの2サイクル読出オペレー
ションを行なうために必要とされるすべてのオペレーシ
ョンの図である。
【0143】図52および図53は、8つの2サイクル
Dual Pixel(DPIX)オペレーションを行なうため必要と
されるすべてのオペレーションを示す。DPIXオペレーシ
ョン4〜7は、DPIXオペレーション0〜3に対するバン
クとは異なるバンク158へのものである。
【0144】1.7 レジスタ RREGオペレーション、WREGオペレーションおよびBREGオ
ペレーションは、128ワード×64ビットレジスタア
ドレススペースに対応したものである。ピクセルALU1
20および121を再プログラムするため必要とされる
サイクルの数を最小限にするため、レジスタの幅を利用
して効率化が図られる。次の表9は、デュアルピクセル
3DRAMチップ110において用いられるレジスタを識別
するものである。図54は、表9に挙げられるいくつか
のレジスタのデータフォーマットを示す。影をつけた部
分はこれらのレジスタ用に予約されたフィールドを表わ
す。
【0145】
【表9】
【0146】1.7.1 識別 この読出専用レジスタは、チップのマスクステッピン
グ、バージョン、部品番号および製造者を識別する。
【0147】1.7.2 FeatureEnable このレジスタは、デュアルピクセル3DRAMの将来のバー
ジョンにおける新しい機能を可能または不能にする。デ
ュアルピクセル3DRAMの初期のバージョンにおいては、
これは、0x0000#0000#0000#0000にリセットされ、他の
いかなる値にもセットされるべきではない。
【0148】1.7.3 PixelConfig 図55は、PixelConfigレジスタのデータフィールドフ
ォーマットを示す。このレジスタは、ピクセルのデプス
およびピクセルの詳細なフォーマットを決定する。影つ
きで図示される予約されたフィールドは、将来の互換性
を確保するために、0にセットされなければならない。
表10は、レジスタのデータフィールドを説明する。
【0149】
【表10】
【0150】PixelSizeフィールドは、SPIXオペレーシ
ョンおよびDPIXオペレーションの間にピクセルサイズを
選択するため、ピクセルALUからSRAMへのフォーマッタ
140およびSRAMからピクセルALUへのフォーマッタ1
44により使用される。
【0151】
【表11】
【0152】ColorModeフィールドは、フォーマッタ1
40および144用の色データフォーマットを指定す
る。表12は色モードフォーマットを説明する。
【0153】
【表12】
【0154】BufferSelectフィールドは、ピクセルALU
120および121とSRAMピクセルバッファ118との
間でデータをフォーマット化するフォーマッタ140お
よび144のための色バッファを選択する。BufferSele
ct[0]は、32ビットワード内の色の下位16ビットと
上位16ビットとのいずれかを選択する。もし、色が3
2ビットまたは40ビットであれば、BufferSelect[0]
は無効である。BufferSelect[1]は、ピクセル内に色6
4ビットまたは80ビットがあるとき、色データの下位
もしくは上位32ビットまたは下位もしくは上位40ビ
ットを選択する。BufferSelect[1]は、もしPixelSizeが
64ビットであれば無効である。
【0155】InputModeは、入力データフォーマッタ1
30を制御する。ソース係数フィールドおよび行き先係
数フィールドは、表13に説明するようにエンコードさ
れる。
【0156】
【表13】
【0157】WIDFuncフィールド、DepthFuncフィールド
およびStencilFuncフィールドは、表14に説明するよ
うにエンコードされる。
【0158】
【表14】
【0159】1.7.4 StencilDepthConfig 図56は、StencilDepthConfigレジスタのデータフィー
ルドフォーマットを示す。このレジスタは、ステンシル
ユニット170およびデプスユニット168を制御す
る。16ビットのデプスマスクフィールド、3ビットの
デプス比較ファンクションフィールド、および1ビット
のDepthLoadフィールドが、デプスユニット170を制
御する。StencilMaskフィールドが、ステンシル比較オ
ペレーションにおいてどのビットが関係するかを決定す
る。行き先データがStencilRef値と比較される。Stenci
lFuncが、どのように行き先値と基準値とが比較される
かを指定する。「StencilOp」で始まるフィールドが、
新しいステンシルデータをどのように計算するかを決定
する。影つきで図示される予約されたフィールドは、将
来の互換性を確保するために、0にセットされなければ
ならない。
【0160】
【表15】
【0161】DepthFuncフィールドおよびStencilFuncフ
ィールドは、前掲の表14によりエンコードされる。
【0162】「StencilOp」で始まるフィールドは、次
の表16に説明するようにエンコードされる。
【0163】
【表16】
【0164】1.7.5 ColorOP[0] 図57は、ColorOP[0]レジスタフィールドを示す。Colo
rOP[0]レジスタは、アルファ、赤、緑および青ROPおよ
びブレンドユニット174および176の個々のための
制御フィールドを有する。影つきで図示される予約され
たフィールドは、将来の互換性を確保するため、0にセ
ットされなければならない。
【0165】
【表17】
【0166】論理オペレーションフィールドは、ソース
色、行き先色およびパターン色の256個のビットごと
のブール演算のうち1つを選択するため、Microsoft Wi
ndowsTM規約によってエンコードされる。パターンデー
タは、ConstantColorレジスタから来る。
【0167】ブレンドオペレーションフィールドは、表
18で説明するようにエンコードされる。
【0168】
【表18】
【0169】1.7.6 ColorOP[1] 図58は、ColorOP[1]レジスタのデータフィールドフォ
ーマットを示す。ColorOP[1]レジスタは、アルファ、
赤、緑および青ROPおよびブレンドユニット176個々
のための制御フィールドを有する。影つきで図示される
予約されたフィールドは、将来の互換性を確保するため
0にセットされねばならない。表19は、ColoROP[1]レ
ジスタのフィールドを説明する。
【0170】
【表19】
【0171】成分サイズファイルは表20に説明するよ
うにエンコードされる。
【0172】
【表20】
【0173】1.7.7 ConstantColor 図59は、ConstantColorレジスタのデータフィールド
フォーマットを示す。ConstantColorレジスタは、論理
オペレーション用のパターンデータまたはブレンドオペ
レーション用の定数データのいずれかとして使用され
る。影つきで図示される予約されたフィールドは、将来
の互換性を確保するためセットされねばならない。表2
1は、ConstantColorレジスタのフィールドを説明す
る。
【0174】
【表21】
【0175】1.7.8 Byte Mask[1:0] これら2つのレジスタは、128ビットのバイトマスク
への読出/書込アクセスを可能にする。バイトマスク
は、MLオペレーションおよびFLオペレーションに影響す
る。
【0176】1.7.9 Plane Mask[7:0] これら8つのレジスタは、512ビットのプレーンマス
クへの読出/書込アクセスを可能にする。プレーンマス
クは、MLオペレーション、FLオペレーション、SPIXオペ
レーションおよびDPIXオペレーションに影響する。
【0177】1.7.10 ColorWIDLUT[3:0] これら4つのレジスタは、Aバッファ(0)またはBバッフ
ァ(1)のαRGB色データを選択するためウィンドウIDルッ
クアップテーブルにロードする。表示リフレッシュの間
に、8ビットのWIDは、選択ビットを生成するための2
56エントリルックアップテーブル(LUT)へのインデ
ックスとなる。
【0178】1.7.11 OverlayWIDLUT[3:0] これら4つのレジスタは、Aバッファ(0)またはBバッフ
ァ(1)のオーバーレイデータを選択するためウィンドウI
Dルックアップテーブルにロードする。表示リフレッシ
ュの間、8ビットWIDは、選択ビットを生成するための
256エントリーLUTへのインデックスとなる。
【0179】1.7.12 DisplayConfig 図60は、DisplayConfigレジスタのデータフィールド
フォーマットを示す。このレジスタは、RPIX命令の間に
ピクセルデータの処理を制御するため、3ビットのピク
セルサイズフィールドを有する。影つきで図示される予
約されたフィールドは、将来の互換性を確保するため0
にセットされねばならない。PixelSizeフィールドは前
掲の表11によりエンコードされる。
【0180】1.8 高速領域クリア MLオペレーション、FLオペレーション、APオペレーショ
ン、PPオペレーション、WREGオペレーションおよびBREG
オペレーションは、領域を極めて迅速にクリアするた
め、あわせて使用することができる。ByteMask[1:0]レ
ジスタは、キャッシュライン内の個々のピクセルを書込
用に可能化または不能化するため使用できる。PlaneMas
k[7:0]レジスタは、書込用にピクセル成分を可能化また
は不能化するため使用できる。
【0181】もし、ByteMask[1:0]レジスタを使用して
個々のピクセルをマスクする必要があるのであれば、AP
オペレーション、PPオペレーション、WREGオペレーショ
ンおよびMLオペレーションを使用しなければならない。
いずれのピクセルもまだフィルされないうちに、102
4ビットキャッシュライン中のすべてのピクセルが所望
のクリア値にセットされ、512ビットPlaneMaskレジ
スタが、クリアされるべきピクセルのこれらのビットへ
の書込のみを可能化するようセットされる。次に、WREG
オペレーションまたはBREGオペレーション2つを使用し
て、128ビットByteMaskレジスタが書込みされる。次
に、MLオペレーションが、ByteMaskレジスタおよびPlan
eMaskレジスタを使用して、キャッシュラインをセンス
アンプに書込む。続くWREGおよびMLオペレーションシー
ケンスは、10ナノ秒ごとに128バイトまたは12.
8ギガバイト/秒のピークフィル速度をサポートするよ
う重ね合わせることができる。80メガビットの装置
は、819マイクロ秒でフィルされ得る。
【0182】もしページ内のすべてのピクセルをクリア
するのであれば、128ビットByteMaskレジスタはオー
ル1にセットでき、WREG、MLオペレーションシーケンス
の代わりにFLオペレーションシーケンスを使用できる。
1024ビットキャッシュラインおよび512ビットPl
aneMaskレジスタは前と同様セットされる。FLオペレー
ションごとにページの半分がクリアされ、したがって、
ページ全体は20ナノ秒でクリアされ得る。ピークフィ
ル速度は、20ナノ秒ごとに8×128バイトまたは5
1.2ギガバイト/秒である。80メガビットの装置
は、205マイクロ秒でフィルされ得る。表22は、す
べてのピクセルサイズについてのピークフィル速度を示
す。図61および図62は、上に説明した高速フィル
(Fast Fill)および非常に高速のフィル(Really Fast
Fill)のオペレーションシーケンスを示す。
【0183】
【表22】
【0184】2.0 データルーティング デュアルピクセル3DRAMチップ110の多数の新規な特
徴、および、そのチップを基礎とするグラフィクスシス
テムが、チップ110の4つのデータフォーマッタ13
0、134、140および144によって実装される。
本開示のこのセクションを通じて、SRAMピクセルバッフ
ァ118を2つの個別の機能ブロックとして説明する。
なぜなら、ここに開示する処理モードおよびルーティン
グモードの多くが2つのピクセルを同時に処理する動作
モードに関連しているためである。したがって、SRAMピ
クセルバッファ118は、機能的に2つの部分に分割し
て考えることができるものと理解されたい。
【0185】2.1 入力データフォーマッタ 図63を参照して、このセクションでは、I/Oバス12
4を介してピクセルALU120および121へと入来す
るデータのルーティングおよび処理について説明する。
ピクセルALU書込動作は、2クロック内でデータの72
ビットを、または、3クロック内でデータの108ビッ
トを、処理されるピクセルのフォーマットおよびサイズ
に応じて転送する。入来データはできるだけピンの近く
の入力データデマルチプレクサ126を通過して、72
ビットまたは108ビットのいずれかとして並行にピク
セルALUに与えられる。ピクセルALU120および121
は、ソースデータとして以下の入力を有する:Alpha0[1
0:0], Red0[10:0], Green0[10:0], Blue0[10:0], Depth
0[31:0], Alpha1[10:0], Red1[10:0], Green1[10:0],Bl
ue1[10:0], および Depth1[31:0]。ルーティングは、4
ビットレジスタフィールドによって制御される。
【0186】2.1.1 ピクセル圧縮 三次元ピクセルマージを行なう場合、レンダリングコン
トローラは、色およびデプス情報のみを送信すればよ
い。というのは、ステンシルおよびウィンドウID情報は
レジスタ内にストアすることができるためである。三角
形または表面パッチをレンダリングする場合、生成され
たピクセルは通常、高レベルのコヒーレンシーを示す。
このセクションでは、最小数のクロックサイクル内でデ
ータピンを通じてピクセルペアを送信する、新規な無損
失の圧縮方式について説明する。
【0187】この方式は、ピクセルペア間の差および、
最も最近処理された(古い)ピクセルペアと入ってくる
(新しい)ピクセルペアとの間の差を評価する。1対のピ
クセル間には、また、2対の連続して処理されるピクセ
ルペア間には、高レベルのコヒーレンシーが存在するこ
とがしばしばあるため、入来するピクセルデータは時と
して、非常に少ない数のビットで表わすことができる場
合がある。このような状況下では、送信すべきなのは古
いピクセルペアと新しいピクセルペアとの差のみであっ
て、この差は、新しいピクセルペアの最下位ビットで表
わされる。最良の場合、すなわち、ピクセルペア間に高
レベルのコヒーレンシーが見られる場合、2:1の圧縮
比を達成することが可能であり、レンダリングコントロ
ーラ102からデュアルピクセル3DRAMチップ110へ
の入力帯域幅を有効に2倍に増すことができる。中程度
のコヒーレンシーが見られる場合には、4:3の圧縮比
を達成することができる。コヒーレンシーがほとんど見
られない場合、圧縮を行なうことはできない。
【0188】デュアルピクセル3DRAM110は、最も新
しく送られてきたピクセルペアを、各デプス値につき3
2ビットおよび4つの色成分の各々につき10ビット
で、レジスタの組内にストアする。したがって、1ピク
セルあたりデータの72ビットがレンダリングバス11
2を介して送信される。ピクセルはデュアルピクセル3
DRAMチップ110ではしばしば対で処理されるため、1
対のピクセルのための完全なデータは144ビットで表
わされる。テクスチャマッピングは色値のコヒーレンシ
ーを低下させる傾向にあるため、色値を圧縮することに
よって帯域幅をセーブすることはできないであろう。し
かし、デプス値はほとんどの場合、高レベルのコヒーレ
ンシーを示す。したがって、ここに開示する圧縮方式
は、デプス値間の高度のコヒーレンシーを利用する。以
下に、ピクセルデータを圧縮および伸長するためのアル
ゴリズムを説明する。
【0189】レンダリングコントローラ102およびデ
ュアルピクセル3DRAMチップ110は両方とも、最も新
しく送られてきたピクセルペアをストアしている。以下
に列記するのは、「古い」ピクセル0および1を色(ア
ルファ、赤、緑および青)成分およびデプス成分に分解
したものである。
【0190】
【数3】
【0191】レンダリングコントローラ102はその通
常のレンダリング処理の一部として、新しいピクセルペ
アを算出する。多くの場合、古いピクセル成分と新しい
ピクセル成分とは同様の値を有し、新しいピクセルペア
もまた同様の値を有する。下に、「新しい」ピクセル0
および1を色(アルファ、赤、緑および青)成分および
デプス成分に分解したものを示す。
【0192】
【数4】
【0193】もしピクセル成分が同様の値を有する場
合、それらの差は小さく、成分自体よりも少ないビット
で表わすことができる。ピクセル成分の差は、レンダリ
ングコントローラ102によって以下の等式を使用して
計算される。式中、頭に付された「D」は、差(differe
nce)またはデルタ(delta)を表わす。
【0194】
【数5】
【0195】算出された差のみが、レンダリングコント
ローラ102からデュアルピクセル3DRAMチップ110
へと送信されるので、レンダリングバス112を介して
送信されるピクセルあたりのビット数が低減される。新
しいピクセル成分は、デュアルピクセル3DRAMチップ1
10上で入力データフォーマッタ130により、以下の
ように再生される。
【0196】
【数6】
【0197】図64を参照して、入力データフォーマッ
タ130は、その伸長方式を3層で実現する。第1の層
では、種々のフォーマットから10個の差成分を抽出し
て、必要であればそれらを符号拡張する。第2の層で
は、それらの差を先のピクセル成分に加えて、新しいピ
クセル成分を再生する。第3の層では、新しいピクセル
成分をフォーマット化する。色成分は、その最終幅にし
たがって左にシフトされ、デプス値の上位16ビットが
マスクされる。
【0198】2.1.2 入力データフォーマット 下の表23に記載するように、デュアルピクセル3DRAM
110は、以下のような入力データフォーマットを有す
る。もしオペレーションがWDATまたはBDATである場合、
入力フォーマットは、レジスタのプログラム方法にかか
わらず、強制的にモード0にされる。オペレーションが
SPIXである場合、入力フォーマットは強制的にモード7
にされる。オペレーションがDPIXの場合、入力フォーマ
ットは、InputModeレジスタフィールドに書込むことに
よって設定される。モード0および1は、奥行きが不要
な二次元のピクセル更新の場合に使用される。モード2
は、アンチエイリアシングオペレーション中に使用され
る。モード4および5は、三次元のピクセル更新に使用
される。図65は、レンダリングコントローラ102か
ら入力データフォーマッタ130へとレンダリングバス
112を介して送信されるデータについて、可能性のあ
るすべてのフォーマットを示す。
【0199】
【表23】
【0200】2.1.3 アキュムレータ 図66は、入力データフォーマッタのアキュムレータ層
の実現を図示する。同じ10ビット色アキュムレータ設
計が、アルファ、赤、緑および青データを処理するのに
使用される一方、同様に設計された32ビットアキュム
レータが、デプスデータを処理するのに使用される。WD
AT、BDAT、およびSPIXオペレーション中には、差分デー
タがアキュムレータ内に直接ロードされる。DPIXオペレ
ーション中には、差分データのローディングはレジスタ
ビットによって制御される。
【0201】2.1.4 最終フォーマッティング 図67は、入力データフォーマッタ130の最終フォー
マット層を図示する。色成分は、ROP/Blendユニット1
66によって使用されるであろうビット数にしたがって
左にシフトされる。もし成分がブレンドされる場合、1
が最下位ビットの右にアペンドされる。以下に示すの
は、入力データフォーマッタ130内で処理の最終層の
色およびデプスのフォーマッティングを行なう、2つの
verilog関数である。
【0202】
【数7】
【0203】デプス値の上位16ビットは、DepthMask
レジスタフィールドと、ビットごとに論理積をとられ
る。
【0204】
【数8】
【0205】2.2 出力データフォーマッタ オペレーションがRDATである場合、またはオペレーショ
ンがRPIXであってDisplayConfigレジスタのPixelSizeフ
ィールドが8、16、32ビットピクセルに設定されて
いる場合、フォーマッタはオペレーションのP[3:0]ビッ
トにしたがって、1024キャッシュラインからデータ
の64ビットを選択する。ColorWIDLUTおよびOverlayWI
DLUTレジスタはこの場合無視される。
【0206】オペレーションがRPIXであってDisplayCon
figレジスタのPixelSizeフィールドが64ビットピクセ
ルに設定されている場合、フォーマッタはオペレーショ
ンのP[3:1]ビットによってアドレシングされた64ビッ
トピクセルのペアから8ビットWIDフィールドを抽出す
る。抽出されたWIDフィールドは、ColorWIDLUTへのイン
デックスとなって、色A/Bバッファセレクトのペアが生
成される。抽出されたWIDフィールドは、OverlayWIDLUT
へのインデックスとなって、16/32ビットセレクト
のペアが生成される。
【0207】この16/32ビットセレクトは、DQピン
を介して色データの全32ビットを送信するか、DQピン
を介して色データの16ビットのみを送信するかを決定
する。後者の場合、A/Bバッファセレクトが、DQピンを
介して色データの上位16ビットか下位16ビットのど
ちらを送信するかを決定する。
【0208】オペレーションがRPIXであって、DisplayC
onfigレジスタのPixelSizeフィールドが128ビットピ
クセルに設定されている場合、フォーマッタはオペレー
ションのP[3:2]ビットによってアドレシングされる12
8ビットピクセルのペアから8ビットWIDフィールドを
抽出する。抽出されたWIDフィールドは、ColorWIDLUTへ
のインデックスとなって、色A/Bバッファセレクトのペ
アが生成される。抽出されたWIDフィールドはOverlayWI
DLUTへのインデックスとなって、オーバレイA/Bバッフ
ァセレクトのペアが生成される。
【0209】色A/Bバッファセレクトは、DQピンを介し
てA色バッファデータかB色バッファデータか、いずれを
送信するかを決定する。オーバレイA/Bバッファセレク
トは、DQピンを介してAまたはBのいずれのオーバレイデ
ータを送信するかを決定する。
【0210】図68を参照して、このセクションではSR
AMピクセルバッファ118からレンダリングコントロー
ラ102へと出ていくデータのルーティングおよび処理
について説明する。出ていくデータは、SRAM出力データ
バス132を介して出力データフォーマッタ134へと
送信される。この出力データフォーマッタ134は、デ
ュアルピクセル3DRAMチップ110から送信されるピク
セルフォーマットに応じて、種々のモードで動作する。
モードは、モードレジスタによって設定される。
【0211】この経路は、RDATおよびRPIXオペレーショ
ンによって使用される。ここで、データの256ビット
がSRAMピクセルバッファ118から読出され、その25
6ビットからデータの72ビットまたは108ビットが
抽出される。これらはその後、出力データマルチプレク
サ136に送られて、チップ110からレンダリングコ
ントローラ102へとレンダリングバス112を介して
送信される。RDATオペレーションは、2サイクル内でデ
ータの64ビットを読出すのに対し、RPIXオペレーショ
ンは2サイクルまたは3サイクル内で1ピクセルから8
ピクセルを読出す。
【0212】2.2.1 RDAT、RPIX(8ビット、16ビッ
ト、32ビットピクセル)オペレーション 図69は、8ビット、16ビット、および32ビットピ
クセルフォーマットのためのRDATおよびRPIXオペレーシ
ョンを図示する。このモードでは、1024ビットキャ
ッシュラインから64ビットが選択される。SRAMピクセ
ルバッファ118が256ビットを提供し、これがマル
チプレクスされて64ビットとなる。
【0213】このモードでは、連続する64ビットが1
024ビットキャッシュラインから選択されて、出力デ
ータマルチプレクサ136に与えられる。
【0214】2.2.2 RPIX(64ビットピクセル)オペ
レーション 図71から図74は、64ビットRPIXオペレーションの
種々のモードおよび局面を図示する。図71に示したモ
ードにおいては、連続する64ビットのピクセルが2
つ、P[0]は無視して、1024ビットキャッシュライン
から選択される。
【0215】図72に示したモードでは、P[0]は無視し
て、2つの連続64ビットピクセルが1024ビットキ
ャッシュラインから選択され、その後処理されて、出力
データマルチプレクサ136に提示される。
【0216】偶数の64ビットピクセルは、図73に示
すように処理されて、出力データマルチプレクサ136
に対して36ビットの出力が生成される。ウィンドウID
ビットは、色データを16ビットずつダブルバッファリ
ングするか、32ビットでシングルバッファリングする
かを決定し、ダブルバッファリングする場合には、Aバ
ッファかBバッファのどちらを選択するかを決定する。
ウィンドウIDの8ビットが、256ビットColorWIDLUT
レジスタおよび256ビットOverlayWIDLUTレジスタへ
のインデックスとなって、セレクトビットが生成され
る。
【0217】奇数の64ビットピクセルは、図74に示
すように処理されて、出力データマルチプレクサ136
に対して36ビットの出力が生成される。ウィンドウID
ビットが、色データを16ビットずつダブルバッファリ
ングするか、32ビットでシングルバッファリングする
かを決定し、ダブルバッファリングする場合には、Aバ
ッファかBバッファのどちらを選択するかを決定する。
【0218】2.2.3 RPIX(96ビットピクセル)オペ
レーション 図75から図78は、96ビットRPIXオペレーションの
種々のモードおよび局面を図示する。図75に示すよう
に、このモードでは、2つの連続96ビットのピクセル
が、P[0]を無視して、1024ビットキャッシュライン
から選択される。
【0219】2つの96ビットピクセルは図76に示す
ように並行に処理されて、出力データマルチプレクサ1
36に対して2つの48ビット出力が生成される。ウィ
ンドウIDビットは、AバッファかBバッファのどちらを選
択するかを決定する。図77および図78は、両ピクセ
ルについてのシングルバッファリングされるオーバレイ
およびウィンドウIDがどのように扱われるかを示す。図
78は、色データの下位3バイトのためのデータ経路を
示す。
【0220】2.2.4 RPIX(128ビットピクセル)オ
ペレーション 図79から図82は、128ビットピクセルのRPIXオペ
レーションの種々の局面を図示する。図79に示された
モードにおいて、2つの連続128ビットのピクセル
が、P[1:0]は無視して、1024ビットキャッシュライ
ンから選択される。
【0221】図80に示したモードにおいて、2つの連
続128ビットピクセルが、P[1:0]は無視して、102
4ビットキャッシュラインから選択され、処理されて、
出力データマルチプレクサ136に与えられる。
【0222】偶数の128ビットピクセルは、図81に
示すように処理されて、出力データマルチプレクサ13
6に対して48ビット出力が生成される。ウィンドウID
ビットは、AまたはBバッファ色、および、AまたはBバッ
ファオーバレイを選択する。
【0223】奇数の128ビットピクセルは、図82に
示されるように処理されて、出力データマルチプレクサ
136に対して48ビット出力が生成される。ウィンド
ウIDビットは、AまたはBバッファ色、および、AまたはB
バッファオーバレイを選択する。
【0224】2.3 SRAMからピクセルALUへのルーティン
グ SRAMからピクセルALUへと行先データを送る。SRAMから
データの256ビットを読出して、以下のピクセルALU
入力に適切なフィールドを送る。Alpha0[10:0],Red0[1
0:0], Green0[10:0], Blue0[10:0], Depth0[31:0], Ste
ncil0[7:0], WID0[7:0], Alpha1[10:0], Red1[10:0], G
reen1[10:0], Blue1[10:0], Depth1[31:0], Stencil1
[7:0],および WID1[7:0]。すべてのピクセルALU入力
は、レジスタ値によってマスクされる。
【0225】SRAM→DQおよびSRAM→PALUルーティングブ
ロックは、共通で保有される回路はどれでも共用できる
よう、決して同時に使用されることはない。
【0226】SRAM→PALUルーティングは、2段階で行な
うことができる。第1段階では、ピクセルのサイズ、ア
ドレス、およびA/B色バッファセレクトにしたがって、
各ピクセルの32ビット区分を選択する。第2段階で
は、A/Bセレクト、色モードおよび種々のマスクにした
がって、色、デプス、ステンシル、およびWIDフィール
ドをアンパックする。
【0227】2.3.1 8、16、および32ビットピクセ
ルのSRAM編成 これらのピクセルは、アルファ、赤、緑および青データ
のみを含む。各オペレーションは、SRAMの片方ずつ両方
に均等に分割された、64ビット分のピクセルを処理す
る。
【0228】2.3.2 64ビットピクセルのSRAM編成 各オペレーションは、SRAMの片方ずつ両方に存在する、
2つのピクセルを処理することができる。各ピクセルの
「ab」区分は色データを含み、「de」区分はデプス、ス
テンシル、オーバレイ、およびWIDデータを含む。
【0229】2.3.3 96ビットピクセルのSRAM編成 やはり、各オペレーションは2つのピクセルを処理する
ことができるが、これらの区分はいくぶん交錯してい
る。各ピクセルは、「a」および「b」の個別の色区分を
有する。
【0230】2.3.4 128ビットピクセルのSRAM編成 各オペレーションは、SRAMの片方ずつ両方に存在する2
つのピクセルを処理することができる。デプス値は対応
する「d」区分にストアされており、ステンシル、オー
バレイ、およびWIDは「e」区分にストアされている。
【0231】2.3.5 UnpackColors UnpackColorsは、PixelSize、PixelAddress、およびBuf
ferSelectに基づいて、SRAMから色データの64ビット
を選択する。
【0232】
【数9】
【0233】2.3.6 UnpackDepths UnpackDepthsは、PixelSizeおよびPixelAddressに基づ
いて、デプス、ステンシル、オーバレイ、およびWIDの
64ビットの値を選択する。
【0234】
【数10】
【0235】2.3.7 UnpackExtras UnpackExtrasは、PixelSizeおよびPixelAddressに基づ
いて、ステンシル、オーバレイ、およびWIDの64ビッ
トの値を選択する。UnpackDepthsおよびUnpackExtras
は、64ビットピクセルおよび96ビットピクセルに対
して同じデータを返す。
【0236】
【数11】
【0237】2.3.8 UnpackAlpha、UnpackRed、UnpackG
reen、UnpackBlue これらの関数は、32ビットの色区分からアルファ、
赤、緑、および青データをアンパックする。UnpackAlph
aはまた、32ビットのエクストラ区分を必要とする。C
olorModeおよびBufferSelectは、色のアンパック方法を
決定する。
【0238】
【数12】
【0239】
【数13】
【0240】
【数14】
【0241】2.3.9 UnpackDepth UnpackDepthは、DepthMaskを使用して、ステンシル、オ
ーバレイ、およびWIDデータをマスクアウトする。
【0242】
【数15】
【0243】2.3.10 UnpackStencil UnpackStencilは、StencilMaskを使用してデプスデータ
をマスクアウトする。
【0244】
【数16】
【0245】2.3.11 UnpackWid UnpackWidは、WidMaskを使用してオーバレイデータをマ
スクアウトする。
【0246】
【数17】
【0247】2.3.12 SramToPaluData SramToPaluDataは、SRAMデータの256ビットから2つ
のピクセルについて、32ビットの色、デプス、および
エクストラ区分を、ならびに、アルファ、赤、緑、青、
デプス、ステンシル、およびWIDフィールドを、アンパ
ックする。
【0248】
【数18】
【0249】
【数19】
【0250】2.4 ピクセルALUからSRAMへのデータルー
ティング 結果データをピクセルALUからSRAMへと送る。Alpha0[9:
0], Red0[9:0], Green0[9:0], blue0[9:0], Depth0[31:
0], Stencil0[7:0], DT0, ST0, WT0, Alpha1[9:0], Red
1[9:0], Green1[9:0], Blue1[9:0], Depth1[31:0], Ste
ncil1[7:0], DT1, ST1,および WT1。SRAMに書込まれる
データの各ビットは、対応の書込イネーブルを有する。
【0251】このデータ経路は、ほぼ2つの部分に分割
することができる。すなわち、データの32ビットは
「0」側の半分から「1」側の半分に送られなければな
らない。各半分は、ColorPackユニット、DepthPackユニ
ット、およびExtraPackユニットを有する。ColorPackユ
ニットは、ROP/blendユニットの結果を再フォーマット
する。DepthPackユニットは、Depth、StencilおよびAlp
ha ROP/Blendユニットの結果を再フォーマットする。Ex
traPackユニットは、AlphaおよびStencilユニットの結
果を再フォーマットする。
【0252】2.4.1 PackColor PackColorは色データの40ビットを入力として、それ
をColorModeにしたがって32ビットワードにパックす
る。この関数は、すべてのピクセルサイズで使用され
る。
【0253】
【数20】
【0254】2.4.2 PackDepth PackDepthは、デプス、ステンシル、およびアルファデ
ータを入力として、それをDepthMaskにしたがって32
ビットワードにパックする。
【0255】
【数21】
【0256】2.4.3 PackExtra PackExtraは、ステンシル、およびアルファデータを入
力として、それを32ビットワードにパックする。
【0257】
【数22】
【0258】2.4.4 PaluToSramData PaluToSramDataは、ピクセルALUの結果を入力として、
それをメモリに書込まれるべき256ビットのワードに
パックする。PixelSizeおよびPixelAddress入力は、ピ
クセルフォーマット全体を決定し、一方、ColorMode、A
lphaMaskおよびStencilMaskは、データの詳細なフォー
マッティングを決定する。
【0259】
【数23】
【0260】2.5 ピクセルALUからSRAMへのマスク生成 ピクセルALU→SRAMデータ経路のための256ビット書
込マスクを生成する。
【0261】2.5.1 WriteEnableMask WriteEnableMaskは、バイト書込イネーブルビットを2
56ビットワードに拡張する。バイト書込イネーブル
は、個々の8ビット、16ビット、および32ビットピ
クセルを選択するのに使用される。これらは8ビット、
16ビット、および32ビットピクセルについてのみ使
用されるものである。
【0262】
【数24】
【0263】2.5.2 ピクセルアドレスマスク 32ビットよりも大きいピクセルは、通常、32ビット
区分へと分割される。PixelAddressMaskは、DualPixe
l、PixelAddress、およびPixelSizeを使用して、256
ビットワードのどの32ビット区分に書込がなされるべ
きかを決定する。
【0264】
【数25】
【0265】
【数26】
【0266】2.5.3 MaskDepth MaskDepthは、DepthPackと相似であるが、データ入力が
書込イネーブルに置換されている。
【0267】
【数27】
【0268】2.5.4 EnableMask EnableMaskは、ピクセルの色、デプス、およびステンシ
ルフィールドを個別にイネーブル(またはディセーブ
ル)する。ピクセルALUによって行われるWID、ステンシ
ルおよびデプステストは、どのフィールドに書込がなさ
れるかを決定する。
【0269】
【数28】
【0270】2.5.5 SelectPlaneMask SelectPlaneMaskは、512ビットプレーンマスクレジ
スタから適切な128ビット区分を選択する。
【0271】
【数29】
【0272】2.5.6 ピクセルALUからSRAMへのマスク PaluToSramMaskは、WriteEnableMask、PixelAddressMas
k、EnableMask、およびSelectPlaneMaskの結果に対して
ビットごとに論理積をとって、最後のビットごと書込マ
スクを生成する。
【0273】
【数30】
【0274】3.0 ピクセルフォーマット デュアルピクセル3DRAMチップ110は、8ビットから
512ビットまでの多種多様のピクセルフォーマットを
サポートする。8ビットから32ビットまでのピクセル
サイズは、三次元グラフィックスレンダリングオペレー
ションはサポートしない。256ビットおよび512ビ
ットのピクセルサイズは、マルチサンプリングされたア
ンチエイリアシングオペレーションをサポートする。下
の表24は、種々のピクセル速度およびサイズについ
て、ピークピクセル速度を列挙する。
【0275】
【表24】
【0276】デュアルピクセル3DRAMデバイス110の
3つの実施例のピクセル容量を、下の表25に示す。こ
こで、1Kは1024ビットに等しく、1Mは1024K
または1,048,576ビットに等しい。
【0277】
【表25】
【0278】図98から図178は、表25に示した種
々のピクセルフォーマットがデュアルピクセル3DRAMチ
ップ110においてどのように処理されるかを示す。
【0279】3.1 8ビットピクセルフォーマット 図98から図102は、デュアルピクセル3DRAMチップ
110によって8ビットピクセルをどのように処理する
ことができるかを示す。8ビットピクセルでレンダリン
グされたグラフィックスについては、表示リフレッシュ
は1バイト/ピクセルを要し、二次元書込は1バイト/
ピクセルを要する。
【0280】図98は、8ビットピクセルからライン1
64へ、およびライン164からページ162への、考
えられるディスプレイマッピングを示す。
【0281】図99は、RPIX、SPIXまたはDPIXオペレー
ションのための、8ビットピクセルの考えられるキャッ
シュライン編成を示す。
【0282】図100は、RDATオペレーションを使用す
る場合に見られる、8ビットピクセルの考えられるキャ
ッシュライン編成を示す。
【0283】図101は、8ビットピクセルのための考
えられるフォーマットを示す。ここで、「I」は8ビッ
トインデックスカラーを表わし、これは、SRAMピクセル
バッファ118内の256ビットエントリをアドレシン
グするのに使用される。各エントリは、赤につき8ビッ
ト、緑につき8ビット、および青につき8ビットを有す
る。これによりプログラマは、ピクセルあたりわずか8
ビットで、可能な16,77,216(224)色からど
の256色でも選択することができる。
【0284】図102は、図101に特定されたフォー
マットの8ビットピクセルの表示リフレッシュオペレー
ションが8ピクセルを送信するのに2サイクルのRPIXオ
ペレーションを必要とする様子を示す。
【0285】3.2 16ビットピクセルフォーマット 図103から図111は、デュアルピクセル3DRAMチッ
プ110によって16ビットピクセルをどのように処理
することができるかを示す。二次元ラスタオペレーショ
ンは2バイト/ピクセルを要し、二次元ブレンドオペレ
ーションは4バイト/ピクセルを要する。
【0286】図103は、16ビットピクセルからライ
ン164へ、およびライン164からページ162へ
の、考えられるディスプレイマッピングを示す。
【0287】図104は、RPIX、SPIXまたはDPIXオペレ
ーションのための、16ビットピクセルの考えられるキ
ャッシュライン編成を示す。
【0288】図105は、RDATオペレーションを使用す
る場合に見られる、16ビットピクセルの考えられるキ
ャッシュライン編成を示す。
【0289】図106は、16ビットピクセルのための
以下のフォーマットを示す:アルファ:4、赤:4、
緑:4、青:4。アルファ、赤、緑および青の各成分
は、4ビットで表わされる。
【0290】図107は、図106に特定されたフォー
マットの4つの16ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0291】図108は、16ビットピクセルのための
以下の代替的なフォーマットを示す:赤:5、緑:6、
青:5。ここで、赤成分は5ビットで表わされ、緑成分
は6ビットで、青成分は5ビットで表わされる。このピ
クセルフォーマットではアルファ成分は使用されない。
【0292】図109は、図108に特定されたフォー
マットの4つの16ビットピクセルを送信するのに2サ
イクルのRPIXオペレーションを必要とする、表示リフレ
ッシュオペレーションを示す。
【0293】図110は、16ビットピクセルのための
以下の代替的なフォーマットを示す:アルファ:1、
赤:5、緑:5、青:5。アルファピクセル成分は1ビ
ットで表わされ、赤、緑および青のピクセル成分は各
々、5ビットで表わされる。
【0294】図111は、図110に特定されたフォー
マットの4つの16ビットピクセルを送信するのに2サ
イクルのRPIXオペレーションを必要とする、表示リフレ
ッシュオペレーションを示す。
【0295】3.3 32ビットピクセルフォーマット 図112から図118は、デュアルピクセル3DRAMチッ
プ110によって32ビットピクセルをどのように処理
することができるかを示す。表示リフレッシュは4バイ
ト/ピクセルを要し、二次元書込は4バイト/ピクセル
を要する。
【0296】図112は、32ビットピクセルからライ
ン164へ、およびライン164からページ162へ
の、考えられるディスプレイマッピングを示す。
【0297】図113は、RPIX、SPIX、またはDPIXオペ
レーションのための、32ビットピクセルの考えられる
キャッシュライン編成を示す。
【0298】図114は、RDATオペレーションを使用す
る場合に見られる、32ビットピクセルの考えられるキ
ャッシュライン編成を示す。
【0299】図115は、32ビットピクセルのための
以下のフォーマットを示す:アルファ:8、赤:8、
緑:8、青:8。アルファ、赤、緑および青のピクセル
成分は各々、8ビットで表わされる。
【0300】図116は、図115に特定されたフォー
マットの2つの32ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0301】図117は、32ビットピクセルの以下の
フォーマットを示す:赤:10、緑:10、青:10。
赤、緑および青のピクセル成分は各々、10ビットで表
わされる。アルファ成分は存在しない。
【0302】図118は、図117に特定されたフォー
マットの2つの32ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0303】3.4 64ビットピクセルフォーマット 図119から図137は、デュアルピクセル3DRAM11
0によって64ビットピクセルをどのように処理するこ
とができるかを示す。二次元フィルおよび表示リフレッ
シュオペレーションについては、2つのピクセルは2サ
イクル内でアクセスすることができる。
【0304】表示リフレッシュは4バイト/ピクセルを
要し、二次元レンダリングオペレーションは4バイト/
ピクセルを要する。三次元レンダリングオペレーション
は、6バイト/ピクセルを要する。
【0305】図119は、64ビットピクセルからライ
ン164へ、およびライン164からページ162へ
の、考えられるディスプレイマッピングを示す。
【0306】図120は、RPIX、SPIX、またはDPIXオペ
レーションのための、64ビットピクセルの考えられる
キャッシュライン編成を示す。
【0307】図121は、RDATを使用する場合に見られ
る、64ビットピクセルの考えられるキャッシュライン
編成を示す。
【0308】図122は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、アルファ:8、
赤:8、緑:8、青:8。アルファ、赤、緑および青の
ピクセル成分は各々、8ビットで表わされ、ウィンドウ
IDは4ビットで表わされる。このフォーマットは、三次
元のアプリケーションをサポートしない。
【0309】図123は、図122に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0310】図124は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、赤:10、緑:
10、青:10。アルファ、赤、緑および青のピクセル
成分は各々、10ビットで表わされる。このフォーマッ
トは、三次元のアプリケーションをサポートしない。
【0311】図125は、図124に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0312】図126は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(アルファ:4、赤:4、緑:4、
青:4)。このピクセルフォーマットは、各4ビットの
アルファ、赤、緑および青のピクセル成分を2組と、2
8ビットのデプス/ステンシルフィールドと、4ビット
のウィンドウIDフィールドとを含む。
【0313】図127は、図126に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、2
サイクルのRPIXオペレーションを必要とする、表示リフ
レッシュシーケンスを示す。
【0314】図128は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、2*(アルファ:4、
赤:4、緑:4、青:4)。このピクセルフォーマット
は、各々4ビットのアルファ、赤、緑および青のピクセ
ル成分を2組と、24ビットのデプス/ステンシルフィ
ールドと、4ビットのオーバレイフィールドと、4ビッ
トのウィンドウIDフィールドとを含む。
【0315】図129は、図128に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0316】図130は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(赤:5、緑:6、青:5)。このピ
クセルフォーマットは、5ビットの赤、6ビットの緑お
よび5ビットの青のピクセル成分を2組と、28ビット
のデプス/ステンシルフィールドと、4ビットのウィン
ドウIDフィールドとを含む。
【0317】図131は、図130に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュが2サイクルのRPIXオペレーションを必
要とする様子を示す。
【0318】図132は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、2*(赤:5、緑:
6、青:5)。このピクセルフォーマットは、5ビット
の赤、6ビットの緑および5ビットの青のピクセル成分
フィールドを2組と、24ビットのデプス/ステンシル
フィールドと、4ビットのオーバレイフィールドと、4
ビットのウィンドウIDフィールドとを含む。
【0319】図133は、図132に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュオペレーションが2サイクルのRPIXオペ
レーションを必要とする様子を示す。
【0320】図134は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(アルファ:1、赤:5、緑:5、
青:5)。このフォーマットは、赤、緑および青のピク
セル成分につき各々5ビットのフィールドを2組と、ア
ルファピクセル成分のための1ビットフィールドを2組
と、28ビットのデプス/ステンシルフィールドと、4
ビットのウィンドウIDフィールドとを含む。
【0321】図135は、図134に特定されたフォー
マットの2つの64ビットピクセルを送信するのに、表
示リフレッシュが2サイクルのRPIXオペレーションを必
要とする様子を示す。
【0322】図136は、64ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、2*(アルファ:1、
赤:5、緑:5、青:5)。このフォーマットは、赤、
緑および青の各ピクセル成分につき各々5ビットのフィ
ールドを2組と、アルファピクセル成分のための1ビッ
トフィールドを2組と、24ビットのデプス/ステンシ
ルフィールドと、4ビットのオーバレイフィールドと、
4ビットのウィンドウIDフィールドとを含む。
【0323】図137は、図136に特定されたフォー
マットを有する2つの64ビットピクセルを送信するの
に、表示リフレッシュが2サイクルのRPIXオペレーショ
ンを必要とする様子を示す。
【0324】3.5 96ビットピクセルフォーマット 図138から図152は、デュアルピクセル3DRAMチッ
プ110によって96ビットピクセルをどのように処理
することができるかを示す。このピクセルフォーマット
では、ピクセルあたりデータの56ビットが書込まれ、
ピクセルあたり40ビットが表示されて、5ピクセルを
8サイクル内にパッキングすることが可能である。表示
リフレッシュは6.4バイト/ピクセルを要し、二次元
のレンダリングオペレーションは4バイト/ピクセルを
要する。
【0325】図138は、96ビットピクセルからライ
ン164へ、およびライン164からページ162へ
の、考えられるディスプレイマッピングを示す。
【0326】図139は、RPIX、SPIX、またはDPIXオペ
レーションのための、96ビットピクセルの考えられる
キャッシュライン編成を示す。
【0327】図140は、RDATを使用する場合に見られ
る、96ビットピクセルの考えられるキャッシュライン
編成を示す。
【0328】図141は、96ビットピクセルのための
1つのフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(オーバレイ:8、赤:8、緑:8、
青:8)。このフォーマットは、オーバレイ、赤、緑お
よび青の各ピクセル成分につき各々8ビットのフィール
ドを2組と、28ビットのデプス/ステンシルフィール
ドと、4ビットのウィンドウIDフィールドとを含む。
【0329】図142は、表示リフレッシュが、図14
1に特定されたフォーマットを有する2つの96ビット
ピクセルを送信するのに3サイクルのRPIXオペレーショ
ンを、または、図141に特定されたフォーマットを有
する1つの96ビットピクセルを送信するのに2サイク
ルのRPIXオペレーションを、必要とする様子を示す。
【0330】図143は、96ビットピクセルのための
以下のフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(アルファ:8、赤:8、緑:8、
青:8)。このフォーマットは、アルファ、赤、緑およ
び青の各ピクセル成分につき各々8ビットのフィールド
を2組と、28ビットのデプス/ステンシルフィールド
と、4ビットのウィンドウIDフィールドとを含む。
【0331】図144は、図143に特定された96ビ
ットピクセルフォーマットの表示リフレッシュが、2つ
のピクセルを送信するのに3サイクルのRPIXオペレーシ
ョンを、または、1つのピクセルを送信するのに2サイ
クルのRPIXオペレーションを必要とする様子を示す。
【0332】図145は、96ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、2*(アルファ:8、
赤:8、緑:8、青:8)。このフォーマットは、アル
ファ、赤、緑および青の各ピクセル成分につき各々8ビ
ットのフィールドを2組と、4ビットのオーバレイフィ
ールドと、4ビットのウィンドウIDフィールドとを含
む。
【0333】図146は、図145に特定された96ビ
ットピクセルフォーマットの表示リフレッシュが、2つ
のピクセルを送信するのに3サイクルのRPIXオペレーシ
ョンを、または、1つのピクセルを送信するのに2サイ
クルのRPIXオペレーションを必要とする様子を示す。
【0334】図147は、96ビットピクセルのための
以下のフォーマットを示す:WID:4、デプス/ステン
シル:28、2*(赤:10、緑:10、青:10)。
このフォーマットは、赤、緑および青の各ピクセル成分
につき各々10ビットのフィールドを2組と、28ビッ
トのデプス/ステンシルフィールドと、4ビットのウィ
ンドウIDフィールドとを含む。
【0335】図148は、図147に特定された96ビ
ットピクセルフォーマットの表示リフレッシュが、2つ
のピクセルを送信するのに3サイクルのRPIXオペレーシ
ョンを、または、1つのピクセルを送信するのに2サイ
クルのRPIXオペレーションを必要とする様子を示す。
【0336】図149は、96ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、2*(赤:10、緑:
10、青:10)。このフォーマットは、赤、緑および
青の各ピクセル成分につき各々10ビットのフィールド
を2組と、24ビットのデプス/ステンシルフィールド
と、4ビットのオーバレイフィールドと、4ビットのウ
ィンドウIDフィールドとを含む。
【0337】図150は、図149に特定された96ビ
ットピクセルフォーマットの表示リフレッシュが、2つ
のピクセルを送信するのに3サイクルのRPIXオペレーシ
ョンを、または、1つのピクセルを送信するのに2サイ
クルのRPIXオペレーションを、必要とする様子を示す。
【0338】図151は、96ビットピクセルのための
以下のフォーマットを示す:WID:4、オーバレイ:
4、デプス/ステンシル:24、4*(アルファ:4、
赤:4、緑:4、青:4)。このフォーマットは、アル
ファ、赤、緑および青の各ピクセル成分につき各々4ビ
ットのフィールドを2組と、24ビットのデプス/ステ
ンシルフィールドと、4ビットのオーバレイフィールド
と、4ビットのウィンドウIDフィールドとを含む。
【0339】図152は、図151に特定された96ビ
ットピクセルフォーマットの表示リフレッシュが、2つ
のピクセルを送信するのに3サイクルのRPIXオペレーシ
ョンを、または、1つのピクセルを送信するのに2サイ
クルのRPIXオペレーションを必要とする様子を示す。
【0340】3.6 128ビットピクセルフォーマット 図153から図161は、デュアルピクセル3DRAMチッ
プ110によって128ビットピクセルをどのように処
理することができるかを示す。このデプスにおいては、
ピクセルあたり64ビットが書込まれ、ピクセルあたり
48ビットが表示されて、4ピクセルを3サイクル内に
パッキングすることが可能となる。二次元の性能を高め
るために、ピクセルをサイクルあたり2ピクセルの速度
で更新することもできる。表示リフレッシュは6バイト
/ピクセルを要し、二次元のレンダリングオペレーショ
ンは4バイト/ピクセルを要する。128ビットピクセ
ルフォーマットはすべて、一定位置の8ビットWIDフィ
ールドを有する。
【0341】図153は、128ビットピクセルからラ
イン164へ、およびライン164からページ162へ
の、考えられるディスプレイマッピングを示す。
【0342】図154は、RPIX、SPIX、またはDPIXオペ
レーションのための、128ビットピクセルの考えられ
るキャッシュライン編成を示す。
【0343】図155は、RDATオペレーションを使用す
る場合に見られる、128ビットピクセルの考えられる
キャッシュライン編成を示す。
【0344】図156は、128ビットピクセルのため
の以下のフォーマットを示す:WID:8、デプス:3
2、ステンシル:8、2*(オーバレイ:8、アルフ
ァ:8、赤:8、緑:8、青:8)。このフォーマット
は、オーバレイ、アルファ、赤、緑および青の各ピクセ
ル成分につき各々8ビットのフィールドを2組と、8ビ
ットのステンシルフィールドと、32ビットのデプスフ
ィールドと、8ビットのウィンドウIDフィールドとを含
む。
【0345】図157は、図156に特定された128
ビットピクセルフォーマットの表示リフレッシュが、2
つのピクセルを送信するのに3サイクルのRPIXオペレー
ションを必要とする様子を示す。
【0346】図158は、128ビットピクセルのため
の以下のフォーマットを示す:WID:8、デプス:3
2、ステンシル:8、2*(オーバレイ:8、赤:1
0、緑:10、青:10)。このフォーマットは、赤、
緑、および青の各ピクセル成分につき各々10ビットの
フィールドを2組と、オーバレイのための8ビットのフ
ィールドを2組と、8ビットのステンシルフィールド
と、32ビットのデプスフィールドと、8ビットのウィ
ンドウIDフィールドとを含む。
【0347】図159は、図158に特定されたフォー
マットを有する128ビットピクセルの表示リフレッシ
ュが、2つのピクセルを送信するのに3サイクルのRPIX
オペレーションを必要とする様子を示す。
【0348】図160は、128ビットピクセルのため
の以下のフォーマットを示す:WID:8、ステンシル:
8、デプス:32、2*(アルファ:10、赤:10、
緑:10、青:10)。このフォーマットは、アルフ
ァ、赤、緑および青の各ピクセル成分につき各々10ビ
ットのフィールドを2組と、32ビットのデプスフィー
ルドと、8ビットのステンシルフィールドと、8ビット
のウィンドウIDフィールドとを含む。
【0349】図161は、図160に特定されたフォー
マットを有する128ビットピクセルの表示リフレッシ
ュが、2つのピクセルを送信するのに3サイクルのRPIX
オペレーションを必要とする様子を示す。
【0350】3.7 マルチサンプル・ポリゴン・アンチエ
イリアシング 256ビットまたは512ビットのフォーマットを有す
るピクセルは、マルチサンプル・ポリゴン・アンチエイ
リアシング・レンダリングオペレーションをサポートす
る。いくつかのポリゴン・アンチエイリアシングのアル
ゴリズムを、それらに関連する利点に焦点を当てて、以
下に説明する。
【0351】3.7.1 累算バッファ このアルゴリズムは、複数のエイリアシングされたイメ
ージを累算して、最終のアンチエイリアシングされたイ
メージを生成する。エイリアシングされた各イメージ
は、XおよびY方向にオフセットされた異なるサブピクセ
ルでレンダリングされる。エイリアシングされた最終イ
メージは、累算バッファの現時点における内容に加算さ
れる。すべてのエイリアシングされたイメージがレンダ
リングされかつ累算されると、累算バッファ内のピクセ
ル成分を累算されたイメージの数で除して、最終的なア
ンチエイリアシングされたイメージが生成される。
【0352】累算バッファは、非常に柔軟な技術であっ
て、ポリゴン・アンチエイリアシングに加えて、モーシ
ョンブラー、フィールドの奥行き、ソフトシャドーに対
応することができる。
【0353】累算バッファは品質および柔軟性の面で非
常に優れているが、この技術はアンチエイリアシングさ
れた最終的なイメージを生成するのに時間がかかりすぎ
るため、高いフレームレートのアプリケーションには不
適切な場合がある。
【0354】この技術に関する詳細な説明は、以下の出
版物に記載されており、これをここに引用により援用す
る。ポール・ヘバーリ(Haeberli, Paul)、K.アクレー
(K.Akeley)による「累算バッファ:高品質レンダリン
グのためのハードウェアサポート("The Accumulation
Buffer: Hardware Support for High-Quality Renderin
g")」、Computer Graphics、Vol.24、No.4、19
90年8月、第309〜318頁。
【0355】3.7.2 Aバッファ このアルゴリズムは、各ピクセルについて、ポリゴンフ
ラグメントのソートされたリストを保持する。もし1つ
の三角形が1つのピクセルを完全にカバーし、かつ完全
に不透明である場合、その三角形の背後のフラグメント
はすべて捨ててもよい。そうでない場合には、フラグメ
ントはそのリストの適切な場所に挿入される。各フラグ
メントは、最小でも、色、デプス、ピクセルマスク、お
よび次のフラグメントへのポインタ、の成分を有する。
フレーム全体のレンダリングが終わった後に、すべての
ピクセルについて最終的な色へのフラグメントリストを
決めるのに、付加的な処理が必要である。
【0356】Aバッファのアルゴリズムは、透明な三角
形を正しくレンダリングするのに非常に優れており、そ
れらの三角形がデプスによってソートされていない場合
であっても問題はない。Aバッファのアルゴリズムは通
常、三角形が互いに交わる場合には、相当量の付加的な
情報が各フラグメントにストアされていない限り、うま
く処理することができない。Aバッファルゴリズムの主
要な欠点は、ピクセルあたり、無限量の記憶領域および
処理を要することである。必要とされるフレームバッフ
ァ記憶領域は、1フレーム内のポリゴンの数にほぼ比例
する。
【0357】この技術の詳細な説明は、以下の出版物に
記載されており、これをここに引用により援用する。ロ
ーレン・カーペンター(Carpenter、Loren)による「A
バッファ、アンチエイリアス隠面の方法("The A-buffe
r, an Anti-aliased HiddenSurface Method")」、Comp
uter Graphics、Vol.18、No. 3、1984年7月、
第103〜108頁。
【0358】3.7.3 マルチサンプル マルチサンプルアンチエイリアシングは、ピクセルあた
りいくつかのサンプルをストアする。各サンプルは、そ
のピクセル内またはそのピクセルの近辺の異なる場所に
位置決めされる。サンプルは、色情報をストアするか、
または、色、デプスおよびステンシルの情報をストアす
る。ピクセルをレンダリングするとき、三角形の内部に
存在するサンプルが算出されて、フレームバッファ内の
サンプルとマージされる。フレーム全体がレンダリング
された後に、サンプルのすべての色の重み付平均が、表
示装置に送られる。
【0359】図162は、2つのピクセルおよび、各ピ
クセル内の各サンプルの場所を示す。現時点の三角形の
内部のサンプルは中黒の丸で示し、その三角形の外部の
サンプルは中空の丸で示す。
【0360】マルチサンプルアンチエイリアシングは、
フレームあたりレンダリングされる三角形の数にかかわ
らず、ピクセルあたり一定量の記憶領域を必要とする。
この技術は、OpenGLまたはDirectXに対するAPIの変更を
ほとんど必要とせず、必要なのは、アンチエイリアシン
グ機能をイネーブルまたはディセーブルするための何ら
かの方法のみである。
【0361】この技術の詳細な説明は以下の出版物に記
載されており、これをここに引用により援用する。カー
ト・アクレー(Akeley、Kurt)による「リアリティエン
ジン・グラフィックス("RealityEngine Graphic
s")」、Computer Graphics、1993年8月、第10
9〜116頁。
【0362】3.7.3.1 サンプルあたり色のみ この場合、各ピクセルはWID、ステンシル、デプス、バ
ックカラー、フロントカラーのための記憶領域を有し、
各サンプルは色のための記憶領域を有する。レンダリン
グコントローラ102は、共通のピクセル色、共通のピ
クセルデプス、および、そのサンプルが三角形の内部に
あるか否かを示すサンプルあたり1ビットを送る。三角
形の辺は、正しくアンチエイリアシングされる。ただ
し、三角形の交点は、ピクセルがデプス値を1つしかス
トアしていないため、エイリアシングされるであろう。
これを下に、verilogコードで説明する。
【0363】
【数31】
【0364】3.7.3.2 サンプルあたり色およびデプス この場合、各ピクセルはWID、バックカラー、およびフ
ロントカラーのための記憶領域を有し、各サンプルは
色、デプス、およびステンシルのための記憶領域を有す
る。レンダリングコントローラ102は、共通のピクセ
ル色、サンプルあたり1つの異なるデプス値、および、
そのサンプルが三角形の内部にあるか否かを示すサンプ
ルあたり1ビットを送る。三角形の辺および交点の両方
が、正しくアンチエイリアシングされるであろう。これ
を下に、verilogコードで説明する。
【0365】
【数32】
【0366】3.7.4 サンプルあたり色およびデプスの速
度改良 デプス値は通常、次のように、XおよびYの1次関数とし
て計算される。
【0367】
【数33】
【0368】この等式は下のように書き換えることがで
きるが、この方がより有益である。
【0369】
【数34】
【0370】通常、ピクセル内のサンプル位置は、図1
63に示すように、ピクセル内の中央、隅部、またはあ
る固定された基準点から、XおよびY方向に同じだけオフ
セットされている。
【0371】もし、ピクセルの中央(または他の何らか
の基準点)におけるデプスがわかっていれば、サンプル
nのデプスは、次の式で計算することができる。
【0372】
【数35】
【0373】この計算は、2つのステップで行なうこと
ができる。
【0374】
【数36】
【0375】1つの三角形につき、各サンプルの (Dept
hn 項をすべて一度に計算して、それらをレジスタ書込
としてデュアルピクセル3DRAMのピクセルALUへと、そ
の三角形内の最初のピクセルをレンダリングする前に、
送信することが可能である。その後、その三角形内の各
ピクセルについて、ピクセルの中央(または何らかの他
の基準点)における色およびデプス値のみが送信され
る。各サンプルにおけるデプス値は、以下の式を用いて
計算される。
【0376】
【数37】
【0377】もし各サンプルがデュアルピクセル3DRAM
のピクセルALU内に専用のデプス加算器、デプス比較
器、および色ブレンドユニットを有する場合には、アン
チエイリアシングされたピクセル全体を1つのオペレー
ションでレンダリングすることが可能であろう。デュア
ルピクセル3DRAMチップ110は、このような能力を有
する。
【0378】3.8 256ビットピクセルフォーマット
(4×マルチサンプル) 図164から図169は、デュアルピクセル3DRAMチッ
プ110によって256ビットピクセルをどのように処
理することができるかを示す。128ビットピクセルに
加えて、チップ110は、ピクセルあたり4つのサブサ
ンプルをストアすることができる。ピクセルを書込むた
めに、チップ110は色およびデプス値、ならびに、4
ビットのサンプルマスクを送る。ピクセルALUがサイク
ルあたり2つのサンプルを処理することができる場合、
チップ110は2サイクルで各ピクセルを更新すること
が可能である。ピクセルが更新される間、4つのサンプ
ルのすべての色値が累算されて、AまたはB色バッファに
書込まれる。
【0379】マルチサンプルアンチエイリアシングは、
Aバッファをベースとするアンチエイリアシングよりも
実装が容易である。マルチサンプルは、ピクセルを更新
するのに、ピクセルあたり大量ではあるが有限量の記憶
領域と、一定量の時間とを要するが、フレームのレンダ
リングとそのフレームの表示との間に、フラグメント決
定処理ステージを必要としない。三角形の速度が1秒あ
たり数百万個であるとき、ほとんどのピクセルは部分的
にカバーされており、Aバッファのフィル速度は、フラ
グメントの記憶領域の要求が飛躍的に増大するのにつれ
て低速化するであろう。
【0380】表示リフレッシュは8バイト/ピクセルを
要し、二次元のレンダリングは4バイト/ピクセルを、
三次元のレンダリングは9バイト/ピクセルを要する。
【0381】256ビットピクセルフォーマットはすべ
て、一定位置の8ビットWIDフィールドを有する。すべ
てのレンダリングフォーマットは、2サイクルのSPIXオ
ペレーションまたは2サイクルのDPIXオペレーションを
要する。表示リフレッシュは、1つのピクセルを送信す
るのに、2サイクルのRPIXオペレーションを必要とす
る。
【0382】図164は、256ビットピクセルからラ
イン164へ、および、ライン164からページ162
への、考えられるディスプレイマッピングを示す。
【0383】図165は、RPIX、SPIX、およびDPIXオペ
レーションのための、256ビットピクセルの考えられ
るキャッシュライン編成を示す。
【0384】図166は、RDATオペレーションを使用す
る場合に見られる、256ビットピクセルの考えられる
キャッシュライン編成を示す。
【0385】図167は、256ビットピクセルのため
の以下のフォーマットを示す:WID:8、ステンシル:
8、デプス:32、2*(オーバレイ:8、アルファ:
8、赤:8、緑:8、青:8)、4*(アルファ:8、
赤:8、緑:8、青:8)。このフォーマットは、ウィ
ンドウIDおよびステンシルにつき各8ビットのフィール
ドと、デプスのための32ビットのフィールドと、オー
バレイ、アルファ、赤、緑および青の各ピクセル成分に
つき各々8ビットのフィールドを2組と、さらに、アル
ファ、赤、緑および青の各8ビットの成分を含む4つの
色サンプルとを含む。
【0386】図168は、図167に特定された256
ビットピクセルフォーマットの表示リフレッシュが、1
つのピクセルを送信するのに2サイクルのRPIXオペレー
ションを必要とする様子を示す。
【0387】図169は、256ビットピクセルフォー
マットのための、SRAM読出/書込フォーマットを示す。
【0388】3.9 512ビットピクセルフォーマット
(6×マルチサンプル) 図170から図178は、デュアルピクセル3DRAMチッ
プ110によって512ビットピクセルをどのように処
理することができるかを示す。このピクセルフォーマッ
トは、6×マルチサンプリングオペレーションをサポー
トする。このフォーマットにおいて、ピクセルあたり6
つのサブサンプルが、128ビットピクセルに加えてス
トアされる。ピクセルを書込むために、共通の色値が最
初に送信され、これに6つのデプス値が続く。もしピク
セルALUが1サイクルあたり2つのサンプルを処理する
ことができれば、各ピクセルは8サイクルで更新するこ
とが可能である。ピクセルが更新されている間に、6つ
のサンプルのすべての色値が累算されて、AまたはB色バ
ッファに書込まれる。
【0389】マルチサンプリングによるアンチエイリア
シングは、Aバッファをベースとするアンチエイリアシ
ングよりも実装が容易である。マルチサンプリングは、
ピクセルを更新するのに、ピクセルあたり大量ではある
が有限量の記憶領域、および、一定量の時間を必要とす
るが、フレームのレンダリングとそのフレームの表示と
の間に、フラグメント決定ステージを必要とはしない。
このマルチサンプリングの技術は、互いに貫通する面を
アンチエイリアシングする。Aバッファを強化して互い
に貫通する面をアンチエイリアシングするのは費用が高
くつく。三角形の速度が1秒あたり数百万個である場
合、ほとんどのピクセルは部分的にカバーされており、
Aバッファのフィル速度は、フラグメント記憶領域の要
件が大いに増大する一方で、低速化することになる。
【0390】表示リフレッシュは8バイト/ピクセルを
要し、二次元のレンダリングオペレーションは4バイト
/ピクセルを、三次元のレンダリングオペレーションは
32バイト/ピクセルを要する。
【0391】512ビットピクセルフォーマットはすべ
て、一定位置の8ビットWIDフィールドを有する。
【0392】図170は、512ビットピクセルからラ
イン164へ、および、ライン164からページ162
への、考えられるディスプレイマッピングを示す。
【0393】図171は、RPIX、SPIXまたはDPIXオペレ
ーションのための、512ビットピクセルの考えられる
キャッシュライン編成を示す。
【0394】図172は、RDATオペレーションを使用す
る場合に見られる、512ビットピクセルの考えられる
キャッシュライン編成を示す。
【0395】図173は、512ビットピクセルのため
の1つのフォーマットを示す:WID:8、2*(オーバレ
イ:8、アルファ:8、赤:8、緑:8、青:8)、6
*(アルファ:8、赤:8、緑:8、青:8、ステンシ
ル/デプス:32)。このフォーマットは、各サンプル
がアルファ、赤、緑および青の各ピクセル成分につき各
々8ビットのフィールドおよびデプス/ステンシルのた
めの32ビットのフィールドを有する6つのピクセルサ
ンプルと、オーバレイ、アルファ、赤、緑および青の各
ピクセル成分につき各々8ビットのフィールドを2組
と、8ビットのウィンドウIDとを含む。
【0396】図174は、図173に特定された512
ビットピクセルフォーマットの表示リフレッシュが、1
つのピクセルを送信するのに2サイクルのRPIXオペレー
ションを必要とする様子を示す。
【0397】図175は、図173に特定されたフォー
マットの512ビットピクセルのための、SRAMピクセル
バッファ118への読出フォーマットおよびSRAMピクセ
ルバッファ118からの書込フォーマットを示す。
【0398】図176は、512ビットピクセルのため
の以下のフォーマットを示す:WID:8、2*(オーバレ
イ:8、赤:10、緑:10、青:10)、6*(赤:
10、緑:10、青:10、ステンシル/デプス:3
2)。このフォーマットは、各サンプルが赤、緑および
青の各ピクセル成分につき各々10ビットのフィールド
およびデプス/ステンシルのための32ビットのフィー
ルドを有する6つのピクセルサンプルと、赤、緑および
青の各ピクセル成分につき各々10ビットのフィールド
を2組と、オーバレイのための8ビットのフィールドを
2組と、8ビットのウィンドウIDとを含む。
【0399】図177は、図176に特定された512
ビットピクセルフォーマットの表示リフレッシュが、1
つのピクセルを送信するのに2サイクルのRPIXオペレー
ションを必要とする様子を示す。
【0400】図178は、図176に特定されたフォー
マットの512ビットピクセルのための、SRAMピクセル
バッファ118への読出フォーマットおよびSRAMピクセ
ルバッファ118からの書込フォーマットを示す。
【0401】4.0 双方向I/O 高速かつ同時の双方向送受信の実行可能ないくつかの実
装例が、最近提示されてきている。この技術は、2つの
デバイスをギガビット速度で接続する単一の配線を介し
て、データを双方向で送信することを可能にする。この
セクションでは、このI/O技術を性能の向上またはコス
トの低減のためにデュアルピクセル3DRAMデバイスにど
のように適用することができるかを示す。開示される高
速かつ同時の双方向送受信の詳細な説明は、以下の出版
物に提示されており、これをここに引用により援用す
る。M.ヘイコック(Haycock,M.)、R.ムーニー(Moone
y,R.)による「2.5Gb/s双方向送受信技術("A 2.5
Gb/s Bidirectional Signaling Technology")」、Hot
Interconnects Symposium V、1997年8月、第14
9〜156頁。
【0402】図179は、データピンを時分割するのに
代えて、制御/アドレスピンを介して表示リフレッシュ
データを送ることによって、性能を向上させる方式を図
示する。この表示リフレッシュ経路は、表示リフレッシ
ュ情報をフェッチするために制御およびアドレス情報を
生成するのに、ステートマシンを必要とする。データピ
ン上のトラフィックは通常、単一方向である。
【0403】図180は、ピクセルALUをレンダリング
コントローラへと移動させることを可能にする方式を図
示する。これらデータピンは、ソースおよび結果ピクセ
ルデータの同時送信を可能にする。制御/アドレス情報
および表示リフレッシュデータは、ピンの同じ組を共有
する。
【図面の簡単な説明】
【図1】1組のデュアルピクセル3DRAMチップと、レン
ダリングコントローラと、レンダリングバスとアドレス
および制御バスとの対と、ビデオ出力回路とを含む、ビ
デオディスプレイフレームバッファとも称されるグラフ
ィックスサブシステムを示すブロック図である。
【図2】DRAMアレイ、SRAMピクセルバッファ、2つのピ
クセル算術論理演算装置(ALU)およびグローバルバス
を含むデュアルピクセル3DRAMチップの一実施例を示す
機能ブロック図である。
【図3】RAMBUSTMまたはSyncLink入力/出力インタフェ
ース仕様のいずれかで動作するよう構成される、図2に
示される要素を含むデュアルピクセル3DRAMチップの一
実施例のためのダイサイズフロアプランの図である。
【図4】いくつかの処理要素の回路のある部分が共有さ
れる、2組の処理要素を含むピクセルALUの一実施例の
ブロック図である。
【図5】2つの別個の組の処理要素を含むピクセルALU
の一実施例のブロック図である。
【図6】ピクセルALUの一実施例のための、4つのラス
タオペレーション(ROP)/ブレンドユニット(ピクセ
ルのアルファ、赤、緑および青成分の各々を処理するた
めに1つずつ)と、デプスユニットと、ステンシルユニ
ットと、ウインドウ識別(ID)ユニットとを含む処理要
素の完全な組と、これらの処理要素に入力され、これら
の処理要素から出力される情報の種類とを示す図であ
る。
【図7】1つのROP/ブレンドユニットの一実施例を示
すブロック図である。
【図8】1つのラスタオペレーション(ROP)ユニット
の一実施例を示すブロック図である。
【図9】1つの8ビットブレンドユニットの一実施例を
示すブロック図である。
【図10】1組の8ビットブレンドユニット計算を示す
図である。
【図11】ブレンドユニットにおいて用いられるドット
分散型組織的ディザアルゴリズムを示す図である。
【図12】10ビットブレンドユニットの一実施例を示
すブロック図である。
【図13】1組の10ビットブレンドユニット計算を示
す図である。
【図14】一実施例のためのROP/ブレンドユニットへ
の入力マルチプレクサの詳細を示す図である。
【図15】デプス比較ユニットの一実施例を示すブロッ
ク図である。
【図16】ステンシル比較ユニットの一実施例を示すブ
ロック図である。
【図17】ステンシルデータ経路の一実施例を示すブロ
ック図である。
【図18】ウインドウID比較ユニットの一実施例を示す
ブロック図である。
【図19】SRAMピクセルバッファの一実施例を示すブロ
ック図である。
【図20】SRAMピクセルバッファの第2の実施例を示す
ブロック図である。
【図21】高レベルでのデュアルピクセル3DRAMチップ
のメモリ構成を示す図である。
【図22】デュアルピクセル3DRAMチップのメモリ構成
を示すより詳細なブロック図である。
【図23】SRAMピクセルバッファに関連してDRAMバンク
メモリ構成の一実施例を示すブロック図である。
【図24】アドレスおよび制御ポートを示すブロック図
である。
【図25】アドレスおよび制御(RQ)ピンを介するデュ
アルピクセル3DRAMプロトコル構造を示す図である。
【図26】アドレスおよび制御ピンを介するバンクオペ
レーションプロトコルを示す図である。
【図27】ページプリチャージオペレーションを示すタ
イミングダイヤグラムの図である。
【図28】ページアクセスオペレーションを示すタイミ
ングダイヤグラムの図である。
【図29】ページ変更オペレーションを示すタイミング
ダイヤグラムの図である。
【図30】アドレスおよび制御(RQ)ピンを介するアイ
ドルコマンドを示す図である。
【図31】アドレスおよび制御(RQ)ピンを介するRead
Cache Line(RL)コマンド、Write Cache Line(WL)
コマンド、Masked Write Cache Line(ML)コマンドお
よびChange Cache Line(CL)コマンドを示す図であ
る。
【図32】アドレスおよび制御(RQ)ピンを介するFlas
h Masked Write Cache Lineコマンドを示す図である。
【図33】Read Cache Line(RL)オペレーションを示
すタイミングダイヤグラムの図である。
【図34】Write Cache Line(WL)オペレーションを示
すタイミングダイヤグラムの図である。
【図35】Masked Write Cache Line(ML)オペレーシ
ョンを示すタイミングダイヤグラムの図である。
【図36】Flash Masked Write Cache Line(FL)オペ
レーションを示すタイミングダイヤグラムの図である。
【図37】Change Cache Line(CL)オペレーションを
示すタイミングダイヤグラムの図である。
【図38】アドレスおよび制御(RQ)ピンを介するアイ
ドルコマンドを示す図である。
【図39】アドレスおよび制御(RQ)ピンを介するRead
Data(RDAT)コマンド、Write Data(WDAT)コマンド
およびBroadcast Data(BDAT)コマンドを示す図であ
る。
【図40】アドレスおよび制御ピンを介するRead Regis
ter(RREG)コマンド、Write Register(WREG)コマン
ドおよびBroadcast Register(BREG)コマンドを示す図
である。
【図41】アドレスおよび制御ピンを介するRead Pixel
(RPIX)コマンド、Single Pixel(SPIX)コマンドおよ
びDual Pixel(DPIX)コマンドを示す図である。
【図42】データ(DQ)ピンを介するグラフィックスデ
ータ転送を示す図である。
【図43】2サイクルRDATオペレーションとその後の3
サイクルRPIXオペレーションとを示すタイミングダイヤ
グラムの図である。
【図44】WDAT、BDAT、WREGおよびDREGオペレーション
のためのタイミングダイヤグラムの図である。
【図45】SPIXおよびDPIXオペレーションのためのタイ
ミングダイヤグラムの図である。
【図46】3サイクルDPIX転送オペレーションを示すタ
イミングダイヤグラムの図である。
【図47】複合2サイクル読出および2サイクル書込オ
ペレーションを示すタイミングダイヤグラムの図であ
る。
【図48】複合2サイクル読出および3サイクル書込オ
ペレーションを示すタイミングダイヤグラムの図であ
る。
【図49】複合3サイクル読出および2サイクル書込オ
ペレーションを示すタイミングダイヤグラムの図であ
る。
【図50】複合3サイクル読出および3サイクル書込オ
ペレーションを示すタイミングダイヤグラムの図であ
る。
【図51】4つの2サイクル読出オペレーションを示す
タイミングダイヤグラムの図である。
【図52】8つの2サイクルDPIXオペレーションを示す
タイミングダイヤグラムの図である。
【図53】図52の8つの2サイクルDPIXオペレーショ
ンを続けて示す図である。
【図54】いくつかのレジスタのためのデータフォーマ
ットを示す図である。
【図55】PixelConfigレジスタのためのデータフォー
マットを示す図である。
【図56】StencilDepthConfigレジスタのためのデータ
フォーマットを示す図である。
【図57】ColorOp[0]レジスタのためのデータフォーマ
ットを示す図である。
【図58】ColorOp[1]レジスタのためのデータフォーマ
ットを示す図である。
【図59】ConstantColorレジスタのためのデータフォ
ーマットを示す図である。
【図60】DisplayConfigレジスタのためのデータフォ
ーマットを示す図である。
【図61】WREGオペレーションからByteMaskおよびMLオ
ペレーションによりどのように高速フィルを行なうかを
示すタイミングダイヤグラムの図である。
【図62】FLオペレーションによってどのように非常に
高速のフィルを行なうかを示すタイミングダイヤグラム
の図である。
【図63】入力データフォーマッタを示すブロック図で
ある。
【図64】入力データフォーマッタの入力ルーティング
層を示す図である。
【図65】入力データフォーマットを示す図である。
【図66】色およびデプスアキュムレータを示すブロッ
ク図である。
【図67】ROP/ブレンドユニットのための色成分フォ
ーマッティングを示す図である。
【図68】出力データフォーマッタを示すブロック図で
ある。
【図69】RDAT、RPIXオペレーションの出力データルー
ティングを示す図である。
【図70】出力データルーティングを示す図である。
【図71】RPIXオペレーションの出力データルーティン
グを示す図である。
【図72】出力データルーティングを示す図である。
【図73】出力データルーティングを示す図である。
【図74】出力データルーティングを示す図である。
【図75】96ビット/ピクセルの出力データルーティ
ングを示す図である。
【図76】出力データルーティングを示す図である。
【図77】出力データルーティングを示す図である。
【図78】出力データルーティングを示す図である。
【図79】出力データルーティングを示す図である。
【図80】出力データルーティングを示す図である。
【図81】出力データルーティングを示す図である。
【図82】出力データルーティングを示す図である。
【図83】出力データルーティングを示す図である。
【図84】SRAM−ピクセルALUフォーマッタを示すブロ
ック図である。
【図85】8、16、32ビット/ピクセルのSRAMピク
セルバッファ編成を示す図である。
【図86】64ビット/ピクセルのSRAMピクセルバッフ
ァ編成を示す図である。
【図87】96ビット/ピクセルのSRAMピクセルバッフ
ァ編成を示す図である。
【図88】128ビット/ピクセルのSRAMピクセルバッ
ファ編成を示す図である。
【図89】アンパック関数を示す図である。
【図90】UnpackDepth関数を示す図である。
【図91】UnpackStencil関数を示す図である。
【図92】UnpackWid関数を示す図である。
【図93】ピクセルALU−SRAMフォーマッタを示すブロ
ック図である。
【図94】PackColor関数を示す図である。
【図95】PackDepth関数を示す図である。
【図96】PackExtra関数を示す図である。
【図97】ピクセルALU−SRAMマスク生成を示す図であ
る。
【図98】8ビット/ピクセルディスプレイマッピング
を示す図である。
【図99】RPIX、SPIXおよびDPIXオペレーションのため
の8ビット/ピクセルキャッシュライン編成を示す図で
ある。
【図100】RDATオペレーションを用いる8ビット/ピ
クセルキャッシュライン編成を示す図である。
【図101】8ビット/ピクセルフォーマットを示す図
である。
【図102】8ビット/ピクセル表示リフレッシュを示
す図である。
【図103】16ビット/ピクセルディスプレイマッピ
ングを示す図である。
【図104】RPIX、SPIXおよびDPIXオペレーションのた
めの16ビット/ピクセルキャッシュライン編成を示す
図である。
【図105】RDATオペレーションを用いる16ビット/
ピクセルキャッシュライン編成を示す図である。
【図106】4:4:4:4の16ビット/ピクセルフォーマ
ットを示す図である。
【図107】4:4:4:4の16ビット/ピクセル表示リフ
レッシュを示す図である。
【図108】5:6:5の16ビット/ピクセルフォーマッ
トを示す図である。
【図109】5:6:5の16ビット/ピクセル表示リフレ
ッシュを示す図である。
【図110】1:5:5:5の16ビット/ピクセルフォーマ
ットを示す図である。
【図111】1:5:5:5の16ビット/ピクセル表示リフ
レッシュを示す図である。
【図112】32ビット/ピクセルディスプレイマッピ
ングを示す図である。
【図113】RPIX、SPIXおよびDPIXオペレーションのた
めの32ビット/ピクセルキャッシュライン編成を示す
図である。
【図114】RDATオペレーションを用いる32ビット/
ピクセルキャッシュライン編成を示す図である。
【図115】8:8:8:8の32ビット/ピクセルフォーマ
ットを示す図である。
【図116】8:8:8:8の32ビット/ピクセル表示リフ
レッシュを示す図である。
【図117】10:10:10:10の32ビット/ピクセルフォ
ーマットを示す図である。
【図118】2:10:10:10の32ビット/ピクセル表示リ
フレッシュを示す図である。
【図119】64ビット/ピクセルディスプレイマッピ
ングを示す図である。
【図120】RPIX、SPIXおよびDPIXオペレーションのた
めの64ビット/ピクセルキャッシュライン編成を示す
図である。
【図121】RDATオペレーションを用いる64ビット/
ピクセルキャッシュライン編成を示す図である。
【図122】4:8:8:8:8の64ビット/ピクセルフォー
マットを示す図である。
【図123】4:8:8:8:8の64ビット/ピクセル表示リ
フレッシュを示す図である。
【図124】2:10:10:10の64ビット/ピクセルフォー
マットを示す図である。
【図125】4:10:10:10の64ビット/ピクセル表示リ
フレッシュを示す図である。
【図126】4:28:2*(4:4:4:4)の64ビット/ピクセ
ルフォーマットを示す図である。
【図127】4:28:2*(4:4:4:4)の64ビット/ピクセ
ル表示リフレッシュを示す図である。
【図128】4:4:24:2*(4:4:4:4)の64ビット/ピク
セルフォーマットを示す図である。
【図129】4:4:24:2*(4:4:4:4)の64ビット/ピク
セル表示リフレッシュを示す図である。
【図130】4:28:2*(5:6:5)の64ビット/ピクセル
フォーマットを示す図である。
【図131】4:28:2*(5:6:5)の64ビット/ピクセル
表示リフレッシュを示す図である。
【図132】4:4:24:2*(5:6:5)の64ビット/ピクセ
ルフォーマットを示す図である。
【図133】4:4:24:2*(5:6:5)の64ビット/ピクセ
ル表示リフレッシュを示す図である。
【図134】4:28:2*(1:5:5:5)の64ビット/ピクセ
ルフォーマットを示す図である。
【図135】4:28:2*(1:5:5:5)の64ビット/ピクセ
ル表示リフレッシュを示す図である。
【図136】4:4:24:2*(1:5:5:5)の64ビット/ピク
セルフォーマットを示す図である。
【図137】4:4:24:2*(1:5:5:5)の64ビット/ピク
セル表示リフレッシュを示す図である。
【図138】96ビット/ピクセルディスプレイマッピ
ングを示す図である。
【図139】RPIX、SPIXおよびDPIXオペレーションのた
めの96ビット/ピクセルキャッシュライン編成を示す
図である。
【図140】RDATオペレーションを用いる96ビット/
ピクセルキャッシュライン編成を示す図である。
【図141】4:28:2*(8:8:8:8)の96ビット/ピクセ
ルフォーマットを示す図である。
【図142】4:28:2*(8:8:8:8)の96ビット/ピクセ
ル表示リフレッシュを示す図である。
【図143】4:28:2*(8:8:8:8)の96ビット/ピクセ
ルフォーマットを示す図である。
【図144】4:28:2*(8:8:8:8)の96ビット/ピクセ
ル表示リフレッシュを示す図である。
【図145】4:4:24:2*(8:8:8:8)の96ビット/ピク
セルフォーマットを示す図である。
【図146】4:4:24:2*(8:8:8:8)の96ビット/ピク
セル表示リフレッシュを示す図である。
【図147】4:28:2*(2:10:10:10)の96ビット/ピ
クセルフォーマットを示す図である。
【図148】4:28:2*(2:10:10:10)の96ビット/ピ
クセル表示リフレッシュを示す図である。
【図149】4:4:24:2*(10:10:10)の96ビット/ピ
クセルフォーマットを示す図である。
【図150】4:4:24:2*(10:10:10)の96ビット/ピ
クセル表示リフレッシュを示す図である。
【図151】4:4:24:4*(4:4:4:4)の96ビット/ピク
セルフォーマットを示す図である。
【図152】4:4:24:4*(4:4:4:4)の96ビット/ピク
セル表示リフレッシュを示す図である。
【図153】128ビット/ピクセルディスプレイマッ
ピングを示す図である。
【図154】RPIX、SPIXおよびDPIXオペレーションのた
めの128ビット/ピクセルキャッシュライン編成を示
す図である。
【図155】RDATオペレーションを用いる128ビット
/ピクセルキャッシュライン編成を示す図である。
【図156】8:32:8:2*(8:8:8:8:8)の128ビット/
ピクセルフォーマットを示す図である。
【図157】8:32:8:2*(8:8:8:8:8)の128ビット/
ピクセル表示リフレッシュを示す図である。
【図158】8:32:8:2*(8:2:10:10:10)の128ビッ
ト/ピクセルフォーマットを示す図である。
【図159】8:32:8:2*(8:10:10:10)の128ビット
/ピクセル表示リフレッシュを示す図である。
【図160】8:8:32:2*(10:10:10:10)の128ビット
/ピクセルフォーマットを示す図である。
【図161】8:8:32:2*(10:10:10:10)の128ビット
/ピクセル表示リフレッシュを示す図である。
【図162】2つのピクセルと各ピクセル内の各サンプ
ルの位置を示す図である。
【図163】ピクセル内のサンプル間のオフセットを示
す図である。
【図164】256ビット/ピクセルディスプレイマッ
ピングを示す図である。
【図165】RPIX、SPIXおよびDPIXオペレーションのた
めの256ビット/ピクセルキャッシュライン編成を示
す図である。
【図166】RDATオペレーションを用いる256ビット
/ピクセルキャッシュライン編成を示す図である。
【図167】8:2*(8:8:8:8:8):6*(8:8:8:8:32)の2
56ビット/ピクセルフォーマットを示す図である。
【図168】8:2*(8:8:8:8:8):6*(8:8:8:8:32)の2
56ビット/ピクセル表示リフレッシュを示す図であ
る。
【図169】SRAMピクセルバッファ読出/書込フォーマ
ットを示す図である。
【図170】512ビット/ピクセルディスプレイマッ
ピングを示す図である。
【図171】RPIX、SPIXおよびDPIXオペレーションのた
めの512ビット/ピクセルキャッシュライン編成を示
す図である。
【図172】RDATオペレーションを用いる512ビット
/ピクセルキャッシュライン編成を示す図である。
【図173】8:2*(8:8:8:8:8):6*(8:8:8:8:32)の5
12ビット/ピクセルフォーマットを示す図である。
【図174】8:2*(8:8:8:8:8):6*(8:8:8:8:32)の5
12ビット/ピクセル表示リフレッシュを示す図であ
る。
【図175】SRAMピクセルバッファ読出/書込フォーマ
ットを示す図である。
【図176】8:2*(8:10:10:10):6*(10:10:10:32)の
512ビット/ピクセルフォーマットを示す図である。
【図177】8:2*(8:2:10:10:10):6*(2:10:10:10:3
2)の512ビット/ピクセル表示リフレッシュを示す
図である。
【図178】SRAMピクセルバッファ読出/書込フォーマ
ットを示す図である。
【図179】I/Oバスにわたっての高速同時双方向送受
信をサポートするデュアルピクセル3DRAMチップの代替
のアーキテクチャを示すブロック図である。
【図180】I/Oバスにわたっての高速同時双方向送受
信をサポートするデュアルピクセル3DRAMチップのため
の第2の代替のアーキテクチャを示すブロック図であ
る。
【符号の説明】
100 グラフィックスサブシステム、102 レンダ
リングコントローラ、104 インタフェース、106
ビデオ出力回路、108 ビデオ出力チャネル、11
0 デュアルピクセル3DRAMチップ、112 レンダリ
ングバス、114アドレスおよび制御バス、116 DR
AMアレイ、118 SRAMピクセルバッファ、120,1
21 ピクセル算術論理演算装置(ALU)、122 グ
ローバルバス、123 グローバル書込バス、124
I/Oバス、125 グローバル読出バス、126 デマ
ルチプレクサ、127 パイプラインレジスタ、128
入力データバス、129,131 入力データバス、1
30 入力データフォーマッタ、132 SRAM出力デー
タバス、134 出力データフォーマッタ、135 出
力データバス、136 出力データマルチプレクサ、1
37 パイプラインレジスタ、138,139 データ
バス、140 ピクセルALUからSRAMへのフォーマッ
タ、141 データバス、142,143 SRAMピクセ
ルバッファデータバス、145 書込マスクパイプライ
ンレジスタ、146 アドレスおよび制御入力バス、1
47 書込マスクバス、148 アドレスおよび制御デ
マルチプレクサ、150 アドレスおよび制御バス、1
51 デコーダ、152 ピクセルALUオペレーショ
ンチャネル、154 グローバルバスオペレーションチ
ャネル、156 バンクオペレーションチャネル、15
8 DRAMバンク、160センス増幅器、166 ROP/ブ
レンドユニット、168 デプスユニット、170 ス
テンシルユニット、172 ウィンドウIDユニット、1
74 ROPユニット、176 ブレンドユニット、17
8 8ビットブレンドユニット、18010ビットブレ
ンドユニット、182 ROPレジスタ、184 パター
ンレジスタ、186 ディザ計算装置、188,190
乗算器、192 加算器、194 切捨て装置、19
6 クランプ装置、210 16ビットマスクレジス
タ、216 マスクレジスタ、218 基準レジスタ、
220 ファンクションレジスタ、224 キャッシュ
ライン、226 ダーティ・タグSRAM、230 キャッ
シュラインのバンクおよびコラムタグ、231 バンク
パイプラインレジスタ、232 コラムパイプラインレ
ジスタ。
フロントページの続き (31)優先権主張番号 09/264261 (32)優先日 平成11年3月8日(1999.3.8) (33)優先権主張国 米国(US) (31)優先権主張番号 09/264281 (32)優先日 平成11年3月8日(1999.3.8) (33)優先権主張国 米国(US) (54)【発明の名称】 記憶装置、デ―タフォ―マッタ、デ―タにアクセスする方法、デ―タの領域をクリアする方法、 デ―タを圧縮する方法、デ―タをフォ―マット化する方法、グラフィックスシステムおよびグラ フィックスシステムを動作させる方法

Claims (53)

    【特許請求の範囲】
  1. 【請求項1】 メモリアレイと、 前記メモリアレイに結合されるバッファと、 前記バッファに結合される複数の算術論理演算装置とを
    含む記憶装置であって、さらに 前記複数の算術論理演算装置に結合され、かつ前記記憶
    装置の外部にあるレンダリングバスに結合される入力デ
    ータフォーマッタと、 前記バッファおよび外部レンダリングバスに結合される
    出力データフォーマッタと、 前記複数の算術論理演算装置および前記バッファに結合
    される書込データフォーマッタと、 前記バッファおよび前記複数の算術論理演算装置に結合
    される読出データフォーマッタと、 前記メモリアレイ、前記バッファ、前記複数の算術論理
    演算装置、前記入力データフォーマッタ、前記出力デー
    タフォーマッタ、前記書込データフォーマッタ 、前記読出データフォーマッタおよび、前記記憶装置の
    外部にあるアドレスおよび制御バスに結合されるアドレ
    スおよび制御入力バスとを含む記憶装置。
  2. 【請求項2】 コントローラに結合されるメモリのため
    のデータフォーマッタであって、 前記コントローラから前記データフォーマッタへ送信さ
    れる1つ以上の信号から1組のピクセル差成分を抽出す
    る第1のフォーマッタと、 抽出されたピクセル差成分と1組の前もってストアされ
    たピクセル成分とから新しい組のピクセル成分を計算す
    るアキュムレータとを含む、データフォーマッタ。
  3. 【請求項3】 前記新しい組のピクセル成分をフォーマ
    ット化する第2のフォーマッタを含む、請求項2に記載
    のデータフォーマッタ。
  4. 【請求項4】 レンダリングバスに結合される記憶装置
    のためのデータフォーマッタであって、 ピクセルデータから複数のピクセル成分を抽出する第1
    のフォーマッタを含み、各抽出されたピクセル成分はピ
    クセルに対するウインドウ識別データフィールドに対応
    しており、前記データフォーマッタはさらに 前記第1のフォーマッタに結合され、複数の選択可能な
    オペレーションのモードをストアするメモリユニット
    と、 前記メモリユニットに結合され、前記メモリユニットに
    ストアされる1つ以上の選択可能なオペレーションのモ
    ードに従って新しいピクセルデータをフォーマット化す
    る第2のフォーマッタとを含む、データフォーマッタ。
  5. 【請求項5】 ピクセルデータから複数のピクセル成分
    を抽出し、抽出されたピクセル成分を複数の群のピクセ
    ルデータに組合せる第1のフォーマッタと、 前記第1のフォーマッタに結合され、前記複数の群のピ
    クセルデータを組立てる第2のフォーマッタとを含む、
    記憶装置のためのデータフォーマッタ。
  6. 【請求項6】 ピクセルデータから前記ピクセルデータ
    の複数の群を抽出する第1のフォーマッタと、 前記第1のフォーマッタに結合され、前記ピクセルデー
    タの前記群から複数のピクセル成分を抽出する第2のフ
    ォーマッタとを含む、記憶装置のためのデータフォーマ
    ッタ。
  7. 【請求項7】 記憶装置であって データをストアするためのメモリアレイを含み、前記メ
    モリアレイは複数のメモリバンクを含み、各メモリバン
    クは複数のメモリセルと、前記複数のメモリセルにアク
    セスするように結合される複数のセンスアンプとを含ん
    でおり、前記記憶装置はさらに前記メモリアレイの前記
    センスアンプに結合されるバッファを含み、前記バッフ
    ァは複数のキャッシュラインを含んでおり、前記記憶装
    置はさらに前記バッファに結合される複数の算術論理演
    算装置と、 前記複数の算術論理演算装置に結合され、前記記憶装置
    の外部にあるレンダリングバスに結合される入力データ
    フォーマッタと、 前記バッファおよび外部レンダリングバスに結合される
    出力データフォーマッタと、 前記複数の算術論理演算装置および前記バッファに結合
    される書込データフォーマッタと、 前記バッファおよび前記複数の算術論理演算装置に結合
    される読出データフォーマッタと、 前記メモリアレイ、前記バッファ、前記複数の算術論理
    演算装置、前記入力データフォーマッタ、前記出力デー
    タフォーマッタ、前記書込データフォーマッタ、前記読
    出データフォーマッタおよび、前記記憶装置の外部にあ
    るアドレスおよび制御バスに結合されるアドレスおよび
    制御入力バスとを含む、記憶装置。
  8. 【請求項8】 前記入力データフォーマッタは、 前記レンダリングバスを介して前記入力データフォーマ
    ッタへ送信される1組のピクセル差成分を抽出する第1
    のフォーマッタと、 抽出されたピクセル差成分と1組の前もってストアされ
    たピクセル成分とから新しい組のピクセル成分を計算す
    るアキュムレータとを含む、請求項7に記載の記憶装
    置。
  9. 【請求項9】 前記新しい組のピクセル成分をフォーマ
    ット化する第2のフォーマッタを含む、請求項8に記載
    の記憶装置。
  10. 【請求項10】 メモリバンクオペレーションを特定す
    るメモリバンクコマンドを受信するステップと、 グローバルバスオペレーションを特定するグローバルバ
    スコマンドを受信するステップと、 算術論理演算装置オペレーションを特定するデータ処理
    コマンドを受信するステップと、 前記メモリバンクコマンドに従って特定されたメモリバ
    ンクオペレーションを実行し、前記グローバルバスコマ
    ンドに従って特定されたグローバルバスオペレーション
    を実行し、前記データ処理コマンドに従って特定された
    算術論理演算装置オペレーションを実行するステップと
    を含む、少なくとも1つの記憶装置内のデータにアクセ
    スする方法。
  11. 【請求項11】 メモリのキャッシュライン内にストア
    される複数のバイトのデータの各々に対応するデータを
    書込イネーブルするか、または書込ディスエーブルする
    かを制御するために少なくとも1つのバイトマスクレジ
    スタを設定するステップと、 メモリの前記キャッシュライン内にストアされる前記複
    数のバイトのデータの各々の成分に対応するデータを書
    込イネーブルするか、または書込ディスエーブルするか
    を制御するために少なくとも1つのプレーンマスクレジ
    スタを設定するステップと、 前記少なくとも1つのバイトマスクレジスタおよび前記
    少なくとも1つのプレーンマスクレジスタの書込イネー
    ブル設定により制御されるように、特定されたメモリバ
    ンクおよびコラムアドレスに結合される1組の前もって
    活性化されたセンスアンプにキャッシュラインメモリの
    内容を書込むステップとを含む、記憶装置内のデータの
    領域をクリアする方法。
  12. 【請求項12】 キャッシュラインメモリの内容を書込
    む前記ステップを、特定された数のメモリバンクおよび
    コラムアドレスに結合される特定された数の組の前もっ
    て活性化されたセンスアンプに対して、特定された回数
    だけ繰返すステップを含む、請求項11に記載の方法。
  13. 【請求項13】 前記少なくとも1つのバイトマスクレ
    ジスタおよび前記少なくとも1つのプレーンマスクレジ
    スタの前記書込イネーブル設定により制御されるよう
    に、前記キャッシュラインメモリの前記内容を書込む前
    記ステップは、特定されたメモリバンクおよびコラムア
    ドレスに結合される複数の組の前もって活性化されたセ
    ンスアンプに対して同時に実行される、請求項11に記
    載の方法。
  14. 【請求項14】 コントローラからメモリへ送信される
    データを圧縮する方法であって、 前記コントローラおよび前記メモリの両方に、複数の古
    いピクセルに対応する古いピクセルデータをストアする
    ステップを含み、前記古いピクセルデータは前記古いピ
    クセルデータにより表わされる古いピクセルの各々に対
    する1組の古いピクセル成分を含んでおり、前記方法は
    さらに前記コントローラにおいて、複数の新しいピクセ
    ルのための新しいピクセルデータを計算するステップを
    含み、前記新しいピクセルデータは前記新しいピクセル
    データにより表わされる新しいピクセルの各々に対する
    1組の新しいピクセル成分を含んでおり、前記方法はさ
    らに前記コントローラにおいて、前記新しいピクセルデ
    ータのある特定のピクセル成分と前記古いピクセルデー
    タのある特定のピクセル成分との差を計算するステップ
    と、 前記コントローラにおいて、前記新しいピクセルデータ
    のある特定のピクセル成分と前記古いピクセルデータの
    ある特定のピクセル成分との前もって計算された差の差
    を計算するステップと、 前記コントローラにおいて、計算された差と、差の計算
    された差とに基づいて圧縮フォーマットを決定するステ
    ップと、 前記コントローラにおいて前記計算された差と前記差の
    計算された差とを決定された圧縮フォーマットにフォー
    マット化することにより前記新しいピクセルデータを圧
    縮するステップと、 圧縮された新しいピクセルデータを前記コントローラか
    ら前記メモリへ送信するステップと、 前記圧縮された新しいピクセルデータを前記メモリ内で
    伸長するステップとを含む、方法。
  15. 【請求項15】 前記コントローラにおいて複数の新し
    いピクセルのための新しいピクセルデータを計算する前
    記ステップは、差の値を、これらが計算された元のピク
    セルデータの幅に符号拡張するステップを含み、前記新
    しいピクセルデータは前記新しいピクセルデータにより
    表わされる新しいピクセルの各々に対する1組の新しい
    ピクセル成分を含む、請求項14に記載の方法。
  16. 【請求項16】 前記圧縮された新しいピクセルデータ
    を前記メモリ内で伸長する前記ステップは、 複数のデータフォーマットから前記計算された差と前記
    差の計算された差とを抽出するステップと、 抽出された差および差の差を、対応する古いピクセル成
    分に対応するデータ幅に符号拡張するステップと、 符号拡張された差および差の差をストアされた古いピク
    セル成分に加算することによって新しいピクセル成分を
    再生するステップと、 前記新しいピクセルデータをフォーマット化するステッ
    プとを含む、請求項14に記載の方法。
  17. 【請求項17】 ピクセルデータを含むメモリのキャッ
    シュラインから複数のウインドウ識別ピクセル成分を抽
    出するステップと、 ウインドウ識別フィールドが抽出された各ピクセルに対
    して、色ピクセルデータのどの部分とオーバレイピクセ
    ルデータのどの部分とを前記コントローラに送信するか
    を決定するステップと、 抽出された複数のウインドウ識別ピクセル成分、色ピク
    セルデータの決定された部分およびオーバレイピクセル
    データの決定された部分を前記コントローラに送信する
    ステップとを含む、メモリからコントローラへ送信され
    るデータをフォーマット化する方法。
  18. 【請求項18】 少なくとも1つの算術論理演算装置か
    ら複数のピクセル成分を受信するステップと、 前記複数のピクセル成分をピクセルデータの群にパック
    するステップと、 前記ピクセルデータの群を1ブロックのデータに組立て
    るステップとを含む、記憶装置においてデータをフォー
    マット化する方法。
  19. 【請求項19】 少なくとも1つの算術論理演算装置か
    ら複数のピクセル成分を受ける前記ステップはピクセル
    色成分を受信するステップと、 ピクセルデプス成分を受信するステップと、 ピクセルステンシル成分を受信するステップとを含む、
    請求項18に記載の方法。
  20. 【請求項20】 バッファからピクセルデータのブロッ
    クを受信するステップと、 前記ピクセルデータのブロックから複数の群の選択され
    たピクセルデータを抽出するステップと、 前記複数の群の選択されたピクセルデータから複数の選
    択されたピクセル成分を抽出するステップとを含む、記
    憶装置においてデータをフォーマット化する方法。
  21. 【請求項21】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 レンダリングコントローラと、 前記レンダリングコントローラと、前記グラフィックス
    システムを動作させるのに用いられる前記コンピュータ
    とに結合されるインタフェースと、 記憶装置と、 前記レンダリングコントローラおよび前記記憶装置に結
    合されるレンダリングバスと、 前記レンダリングコントローラおよび前記記憶装置に結
    合されるアドレスおよび制御バスとを含む、グラフィッ
    クスシステム。
  22. 【請求項22】 ビデオ出力チャネルにより前記レンダ
    リングコントローラに結合されるビデオ出力回路を含
    む、請求項21に記載のグラフィックスシステム。
  23. 【請求項23】 前記記憶装置は、前記レンダリングバ
    スと前記アドレスおよび制御バスとに結合される複数の
    メモリチップを含む、請求項21に記載のグラフィック
    スシステム。
  24. 【請求項24】 レンダリングバスとアドレスおよび制
    御バスとの複数の対を含む、請求項23に記載のグラフ
    ィックスシステム。
  25. 【請求項25】 最大数のメモリチップが、レンダリン
    グバスとアドレスおよび制御バスとの各対に結合され
    る、請求項24に記載のグラフィックスシステム。
  26. 【請求項26】 レンダリングバスとアドレスおよび制
    御バスとの各対に結合されるメモリチップの前記最大数
    は4である、請求項25に記載のグラフィックスシステ
    ム。
  27. 【請求項27】 前記レンダリングバスは同時双方向送
    受信を含み、データを同時に前記レンダリングコントロ
    ーラから前記記憶装置に送信し前記記憶装置から前記レ
    ンダリングコントローラへ送信することを可能にする、
    請求項21に記載のグラフィックスシステム。
  28. 【請求項28】 前記記憶装置は データをストアするためのメモリアレイと、 前記メモリアレイに結合されるバッファと、 前記バッファに結合され、前記記憶装置の外部にあるレ
    ンダリングバスに結合される複数の算術論理演算装置
    と、 外部レンダリングバスおよび前記複数の算術論理演算装
    置に結合される入力データフォーマッタと、 前記バッファおよび前記外部レンダリングバスに結合さ
    れる出力データフォーマッタと、 前記複数の算術論理演算装置および前記バッファに結合
    される書込データフォーマッタと、 前記バッファおよび前記複数の算術論理演算装置に結合
    される読出データフォーマッタと、 前記メモリアレイ、前記バッファ、前記複数の算術論理
    演算装置、前記入力データフォーマッタ、前記出力デー
    タフォーマッタ、前記書込データフォーマッタ、前記読
    出データフォーマッタおよび、前記記憶装置の外部にあ
    るアドレスおよび制御バスに結合されるアドレスおよび
    制御入力バスとを含む、請求項21に記載のグラフィッ
    クスシステム。
  29. 【請求項29】 前記メモリアレイは複数のメモリバン
    クを含み、各メモリバンクは複数のメモリページを含
    み、各メモリページは複数のメモリラインを含み、各メ
    モリラインは複数のメモリセルを含み、各メモリセルは
    1ビットのデータをストアすることができる、請求項2
    8に記載のグラフィックスシステム。
  30. 【請求項30】 前記複数の算術論理演算装置は、複数
    のラスタオペレーションユニット、複数のブレンドユニ
    ット、複数のデプスユニット、複数のステンシルユニッ
    トおよび複数のウインドウ識別ユニットを含み、複数の
    ピクセルに対応するデータを同時に処理するようにす
    る、請求項28に記載のグラフィックスシステム。
  31. 【請求項31】 前記入力データフォーマッタは、第2
    のフォーマッタに結合されるアキュムレータに結合され
    る第1のフォーマッタを含む、請求項28に記載のグラ
    フィックスシステム。
  32. 【請求項32】 前記出力データフォーマッタは、複数
    のウインドウ識別データ抽出器と、複数のオーバレイデ
    ータセレクタと、複数の色データセレクタとに結合され
    るモードレジスタを含む、請求項28に記載のグラフィ
    ックスシステム。
  33. 【請求項33】 前記読出データフォーマッタはモード
    レジスタおよびマスクレジスタを含み、前記レジスタの
    各々は複数のデータ抽出器および複数のデータアンパッ
    カーに結合される、請求項28に記載のグラフィックス
    システム。
  34. 【請求項34】 前記書込データフォーマッタはモード
    レジスタおよびマスクレジスタを含み、前記レジスタの
    各々は複数の色パックユニットと、複数のデプスパック
    ユニットと、複数のエクストラパックユニットとに結合
    される、請求項28に記載のグラフィックスシステム。
  35. 【請求項35】 前記アドレスおよび制御入力バスは、
    複数のアドレスおよび制御チャネルに結合されるデコー
    ダを含む、請求項28に記載のグラフィックスシステ
    ム。
  36. 【請求項36】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 コントローラに結合される記憶装置のためのデータフォ
    ーマッタを含み、前記データフォーマッタは前記コント
    ローラから前記データフォーマッタへ送信される1つ以
    上の信号から1組のピクセル差成分を抽出する第1のフ
    ォーマッタと、 抽出されたピクセル差成分と1組の前もってストアされ
    たピクセル成分とから新しい組のピクセル成分を計算す
    るアキュムレータとを含む、グラフィックスシステム。
  37. 【請求項37】 前記新しい組のピクセル成分をフォー
    マット化する第2のフォーマッタを含む、請求項36に
    記載のグラフィックスシステム。
  38. 【請求項38】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 レンダリングバスに結合される記憶装置のためのデータ
    フォーマッタを含み、前記データフォーマッタはピクセ
    ルデータから複数のピクセル成分を抽出する第1のフォ
    ーマッタを含み、各抽出されたピクセル成分はピクセル
    に対するウインドウ識別データフィールドに対応してお
    り、前記データフォーマッタはさらに前記第1のフォー
    マッタに結合され、複数の選択可能なオペレーションの
    モードをストアするメモリユニットと、 前記メモリユニットに結合され、前記メモリユニットに
    ストアされる1つ以上の前記選択可能なオペレーション
    のモードに従って新しいピクセルデータをフォーマット
    化する第2のフォーマッタとを含む、グラフィックスシ
    ステム。
  39. 【請求項39】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 記憶装置のためのデータフォーマッタを含み、前記デー
    タフォーマッタはピクセルデータから複数のピクセル成
    分を抽出して、抽出されたピクセル成分を複数の群のピ
    クセルデータに組合せる第1のフォーマッタと、 前記第1のフォーマッタに結合され、前記複数の群のピ
    クセルデータを組立てる第2のフォーマッタとを含む、
    グラフィックスシステム。
  40. 【請求項40】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 記憶装置のためのデータフォーマッタを含み、前記デー
    タフォーマッタはピクセルデータから前記ピクセルデー
    タの複数の群を抽出する第1のフォーマッタと、 前記第1のフォーマッタに結合され、前記ピクセルデー
    タの前記群から複数のピクセル成分を抽出する第2のフ
    ォーマッタとを含む、グラフィックスシステム。
  41. 【請求項41】 コンピュータによる動作のためのグラ
    フィックスシステムであって、 データをストアするためのメモリアレイを含み、前記メ
    モリアレイは複数のメモリバンクを含み、各メモリバン
    クは複数のメモリセルと、前記複数のメモリセルにアク
    セスするよう結合される複数のセンスアンプとを含んで
    おり、前記グラフィックスシステムはさらに前記メモリ
    アレイの前記センスアンプに結合されるバッファを含
    み、前記バッファは複数のキャッシュラインを含み、前
    記グラフィックスシステムはさらにピクセルバッファに
    結合され、記憶装置の外部にあるレンダリングバスに結
    合される複数の算術論理演算装置と、 外部レンダリングバスおよび前記複数の算術論理演算装
    置に結合される入力データフォーマッタと、 前記バッファおよび前記外部レンダリングバスに結合さ
    れる出力データフォーマッタと、 前記複数の算術論理演算装置および前記バッファに結合
    される書込データフォーマッタと、 前記バッファおよび前記複数の算術論理演算装置に結合
    される読出データフォーマッタと、 前記メモリアレイ、前記バッファ、前記複数の算術論理
    演算装置、前記入力データフォーマッタ、前記出力デー
    タフォーマッタ、前記書込データフォーマッタ、前記読
    出データフォーマッタおよび、前記記憶装置の外部にあ
    るアドレスおよび制御バスに結合されるアドレスおよび
    制御入力バスとを含む、グラフィックスシステム。
  42. 【請求項42】 前記入力データフォーマッタは前記レ
    ンダリングバスを介して前記入力データフォーマッタへ
    送信される1組のピクセル差成分を抽出する第1のフォ
    ーマッタと、 抽出されたピクセル差成分と1組の前もってストアされ
    たピクセル成分とから新しい組のピクセル成分を計算す
    るアキュムレータとを含む、請求項41に記載のグラフ
    ィックスシステム。
  43. 【請求項43】 前記新しい組のピクセル成分をフォー
    マット化する第2のフォーマッタを含む、請求項42に
    記載のグラフィックスシステム。
  44. 【請求項44】 コンピュータに関連してグラフィック
    スシステムを動作させる方法であって、 レンダリングコントローラから記憶装置へレンダリング
    バスを介して入力データを送信するステップと、 前記レンダリングコントローラから前記記憶装置へアド
    レスおよび制御バスを介してアドレスおよび制御データ
    を送信するステップと、 前記入力データをフォーマット化するステップと、 フォーマット化された入力データを処理して処理された
    データを得るステップと、 前記処理されたデータをフォーマット化するステップ
    と、 フォーマット化された処理されたデータをメモリにスト
    アするステップと、 前記処理されたデータを前記メモリからアクセスするス
    テップと、 アクセスされた処理されたデータのいくつかをビデオ出
    力回路への送信のためにフォーマット化し、かつそのよ
    うにフォーマット化された処理されたデータを前記記憶
    装置から前記レンダリングバスを介して送信するステッ
    プと、 再処理すべき前記アクセスされた処理されたデータのい
    くつかをフォーマット化し、かつそのようにフォーマッ
    ト化された前記再処理すべき処理されたデータを送信す
    るステップとを含む、方法。
  45. 【請求項45】 前記レンダリングコントローラから前
    記記憶装置へアドレスおよび制御バスを介してアドレス
    および制御データを送信する前記ステップは、 メモリバンクオペレーションを特定するメモリバンクコ
    マンドを送信するステップと、 グローバルバスオペレーションを特定するグローバルバ
    スコマンドを送信するステップと、 ピクセル算術論理演算装置オペレーションを特定するデ
    ータ処理コマンドを送信するステップとを含み、 フォーマット化された入力データを処理して処理された
    データを得る前記ステップと、フォーマット化された処
    理されたデータをメモリにストアする前記ステップと、
    前記処理されたデータを前記メモリからアクセスする前
    記ステップとは前記メモリバンクコマンドに従って特定
    されたメモリバンクオペレーションを実行し、前記グロ
    ーバルバスコマンドに従って特定されたグローバルバス
    オペレーションを実行し、前記データ処理コマンドに従
    って特定されたピクセル算術論理演算装置オペレーショ
    ンを実行するステップを含む、請求項44に記載の方
    法。
  46. 【請求項46】 フォーマット化された処理されたデー
    タをメモリにストアする前記ステップはメモリのキャッ
    シュライン内にストアされる複数のバイトのデータの各
    々に対応するデータを書込イネーブルするか、または書
    込ディスエーブルするかを制御するために少なくとも1
    つのバイトマスクレジスタを設定するステップと、 メモリの前記キャッシュライン内にストアされる前記複
    数のバイトのデータの各々の成分に対応するデータを書
    込イネーブルするか、または書込ディスエーブルするか
    どうかを制御するために少なくとも1つのプレーンマス
    クレジスタを設定するステップと、 前記少なくとも1つのバイトマスクレジスタおよび前記
    少なくとも1つのプレーンマスクレジスタの書込イネー
    ブル設定により制御されるように、特定されたメモリバ
    ンクおよびコラムアドレスに結合される1組の前もって
    活性化されたセンスアンプにキャッシュラインメモリの
    内容を書込むステップとを含む、請求項44に記載の方
    法。
  47. 【請求項47】 キャッシュラインメモリの内容を書込
    む前記ステップを、特定された数のメモリバンクおよび
    コラムアドレスに結合される特定された数の組の前もっ
    て活性化されたセンスアンプに対して、特定された回数
    だけ繰返すステップを含む、請求項46に記載の方法。
  48. 【請求項48】 前記少なくとも1つのバイトマスクレ
    ジスタおよび前記少なくとも1つのプレーンマスクレジ
    スタの前記書込イネーブル設定により制御されるよう
    に、前記キャッシュラインメモリの前記内容を書込む前
    記ステップは、特定されたメモリバンクおよびコラムア
    ドレスに結合される複数の組の前もって活性化されたセ
    ンスアンプに対して同時に実行される、請求項46に記
    載の方法。
  49. 【請求項49】 レンダリングコントローラから記憶装
    置へレンダリングバスを介して入力データを送信する前
    記ステップと、前記入力データをフォーマット化する前
    記ステップとは、 前記レンダリングコントローラおよび前記メモリの両方
    に、複数の古いピクセルに対応する古いピクセルデータ
    をストアするステップを含み、前記古いピクセルデータ
    は前記古いピクセルデータにより表わされる古いピクセ
    ルの各々に対する1組の古いピクセル成分を含んでお
    り、前記ステップはさらに前記コントローラにおいて、
    複数の新しいピクセルのための新しいピクセルデータを
    計算するステップを含み、前記新しいピクセルデータは
    前記新しいピクセルデータにより表わされる新しいピク
    セルの各々に対する1組の新しいピクセル成分を含んで
    おり、前記ステップはさらに前記コントローラにおい
    て、前記新しいピクセルデータのある特定のピクセル成
    分と前記古いピクセルデータのある特定のピクセル成分
    との差を計算するステップと、 前記コントローラにおいて、前記新しいピクセルデータ
    のある特定のピクセル成分と前記古いピクセルデータの
    ある特定のピクセル成分との前もって計算された差の差
    を計算するステップと、 前記コントローラにおいて、計算された差と、差の計算
    された差とに基づいて圧縮フォーマットを決定するステ
    ップと、 前記コントローラにおいて前記計算された差と前記差の
    前記計算された差とを決定された圧縮フォーマットにフ
    ォーマット化することにより前記新しいピクセルデータ
    を圧縮するステップと、 圧縮された新しいピクセルデータを前記コントローラか
    ら前記メモリへ送信するステップと、 前記圧縮された新しいピクセルデータを前記メモリ内で
    伸長するステップとを含む、請求項44に記載の方法。
  50. 【請求項50】 前記コントローラにおいて複数の新し
    いピクセルのための新しいピクセルデータを計算する前
    記ステップは、差の値を、これらが計算された元のデー
    タの幅に符号拡張するステップを含み、前記新しいピク
    セルデータは前記新しいピクセルデータにより表わされ
    る新しいピクセルの各々に対する1組の新しいピクセル
    成分を含む、請求項49に記載の方法。
  51. 【請求項51】 前記圧縮された新しいピクセルデータ
    を前記メモリ内で伸長する前記ステップは、 複数のデータフォーマットから前記計算された差と前記
    差の計算された差とを抽出するステップと、 抽出された差および差の差を、対応する古いピクセル成
    分に対応するデータ幅に符号拡張するステップと、 符号拡張された差および差の差をストアされた古いピク
    セル成分に加算することによって新しいピクセル成分を
    再生するステップと、 前記新しいピクセルデータをフォーマット化するステッ
    プとを含む、請求項49に記載の方法。
  52. 【請求項52】 アクセスされたピクセルデータのいく
    つかをビデオ出力回路への送信のためにフォーマット化
    し、かつそのようにフォーマット化されたデータを前記
    レンダリングバスを介して送信する前記ステップは、 ピクセルデータを含むメモリのキャッシュラインから複
    数のウインドウ識別ピクセル成分を抽出するステップ
    と、 ウインドウ識別フィールドが抽出された各ピクセルに対
    して、色データのどの部分とオーバレイデータのどの部
    分とを前記コントローラに送信するかを決定するステッ
    プと、 抽出された複数のウインドウ識別ピクセル成分、色デー
    タの決定された部分およびオーバレイデータの決定され
    た部分を前記コントローラに送信するステップとを含
    む、請求項44に記載の方法。
  53. 【請求項53】 前記処理されたデータをフォーマット
    化する前記ステップは、 少なくとも1つの算術論理演算装置から複数のピクセル
    成分を受信するステップと、 前記複数のピクセル成分をピクセルデータの群にパック
    するステップと、 前記ピクセルデータの群を1ブロックのピクセルデータ
    に組立てるステップとを含む、請求項44に記載の方
    法。
JP14023899A 1998-05-29 1999-05-20 記憶装置、デ―タフォ―マッタ、デ―タにアクセスする方法、デ―タの領域をクリアする方法、デ―タを圧縮する方法、デ―タをフォ―マット化する方法、グラフィックスシステムおよびグラフィックスシステムを動作させる方法 Withdrawn JP2000155845A (ja)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US09/086,554 US6143434A (en) 1997-07-04 1998-05-29 Organic electroluminescent element material and organic electroluminescent element employing the same
US09/164,866 US6504550B1 (en) 1998-05-21 1998-10-01 System for graphics processing employing semiconductor device
US09/164,858 US6535218B1 (en) 1998-05-21 1998-10-01 Frame buffer memory for graphic processing
US09/164866 1999-03-08
US09/264281 1999-03-08
US09/264,281 US6559851B1 (en) 1998-05-21 1999-03-08 Methods for semiconductor systems for graphics processing
US60/086554 1999-03-08
US09/264261 1999-03-08
US09/264,261 US6661421B1 (en) 1998-05-21 1999-03-08 Methods for operation of semiconductor memory
US09/164858 1999-03-08

Publications (1)

Publication Number Publication Date
JP2000155845A true JP2000155845A (ja) 2000-06-06

Family

ID=27536448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14023899A Withdrawn JP2000155845A (ja) 1998-05-29 1999-05-20 記憶装置、デ―タフォ―マッタ、デ―タにアクセスする方法、デ―タの領域をクリアする方法、デ―タを圧縮する方法、デ―タをフォ―マット化する方法、グラフィックスシステムおよびグラフィックスシステムを動作させる方法

Country Status (1)

Country Link
JP (1) JP2000155845A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063590A (ja) * 2000-08-23 2002-02-28 Nintendo Co Ltd グラフィクスシステム用再循環シェードツリーブレンダ
US7453459B2 (en) 2001-02-26 2008-11-18 Adobe Systems Incorporated Composite rendering 3-D graphical objects
US7719544B2 (en) 2002-06-20 2010-05-18 Microsoft Corporation Systems and methods for providing controllable texture sampling
CN109191362A (zh) * 2018-07-30 2019-01-11 芯视图(常州)微电子有限公司 多个rop的并行调度以及rop的流水设计
CN112380148A (zh) * 2020-11-30 2021-02-19 海光信息技术股份有限公司 数据传输方法和数据传输装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063590A (ja) * 2000-08-23 2002-02-28 Nintendo Co Ltd グラフィクスシステム用再循環シェードツリーブレンダ
JP4731028B2 (ja) * 2000-08-23 2011-07-20 任天堂株式会社 グラフィクスシステム用再循環シェードツリーブレンダ
US7453459B2 (en) 2001-02-26 2008-11-18 Adobe Systems Incorporated Composite rendering 3-D graphical objects
US7719544B2 (en) 2002-06-20 2010-05-18 Microsoft Corporation Systems and methods for providing controllable texture sampling
CN109191362A (zh) * 2018-07-30 2019-01-11 芯视图(常州)微电子有限公司 多个rop的并行调度以及rop的流水设计
CN109191362B (zh) * 2018-07-30 2023-07-18 南京军微半导体科技有限公司 多个rop的并行调度方法
CN112380148A (zh) * 2020-11-30 2021-02-19 海光信息技术股份有限公司 数据传输方法和数据传输装置
CN112380148B (zh) * 2020-11-30 2022-10-25 海光信息技术股份有限公司 数据传输方法和数据传输装置

Similar Documents

Publication Publication Date Title
US5801711A (en) Polyline and triangle strip data management techniques for enhancing performance of computer graphics system
US20060098021A1 (en) Graphics system and memory device for three-dimensional graphics acceleration and method for three dimensional graphics processing
US7692659B1 (en) Color-compression using automatic reduction of multi-sampled pixels
US20030218614A1 (en) Dynamically adjusting sample density in a graphics system
US8233004B1 (en) Color-compression using automatic reduction of multi-sampled pixels
US6975322B2 (en) Dynamically adjusting a number of rendering passes in a graphics system
US8228328B1 (en) Early Z testing for multiple render targets
US6924808B2 (en) Area pattern processing of pixels
US6535218B1 (en) Frame buffer memory for graphic processing
US6353440B1 (en) Hardware assist for YUV data format conversion to software MPEG decoder
US6195106B1 (en) Graphics system with multiported pixel buffers for accelerated pixel processing
US6906720B2 (en) Multipurpose memory system for use in a graphics system
US5544306A (en) Flexible dram access in a frame buffer memory and system
US5909225A (en) Frame buffer cache for graphics applications
US5781200A (en) Tile memory mapping for increased throughput in a dual bank access DRAM
US20030169265A1 (en) Memory interleaving technique for texture mapping in a graphics system
JPH10116352A (ja) ジオメトリ圧縮解除能力を有する3次元グラフィック・アクセラレータ用のコマンド・プロセッサ
US5859646A (en) Graphic drawing processing device and graphic drawing processing system using thereof
US6661421B1 (en) Methods for operation of semiconductor memory
US5877780A (en) Semiconductor chip having multiple independent memory sections, at least one of which includes simultaneously accessible arrays
US6342883B1 (en) Image display method and image display apparatus
EP1987488A2 (en) Combined engine for video and graphics processing
US6532018B1 (en) Combined floating-point logic core and frame buffer
US5696944A (en) Computer graphics system having double buffered vertex ram with granularity
US6559851B1 (en) Methods for semiconductor systems for graphics processing

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801