JP3009732B2

JP3009732B2 - 画像発生アーキテクチャおよび装置

Info

Publication number: JP3009732B2
Application number: JP6512280A
Authority: JP
Inventors: ポウルトン，ジョン・ウッド; モルナー，スティーヴン・エドワード; アイルズ，ジョン・ゴードン
Original assignee: ザ・ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル
Priority date: 1992-11-13
Filing date: 1993-11-08
Publication date: 2000-02-14
Anticipated expiration: 2015-02-14
Also published as: EP0672275A4; US5388206A; EP0672275A1; CA2146335C; AU677027B2; US5481669A; JPH08503563A; CA2146335A1; AU5596894A; WO1994011807A1

Description

【発明の詳細な説明】発明の分野本発明は、一般に画像発生システムに関し、特に画像
合成技術を使用した画像発生システムに関する。更に、
本発明は、画像合成技術を使用した画像発生システムを
実施するメモリ構成およびハードウェア設計に関する。

発明の背景飛行および車両シミュレーション、コンピュータ・エ
イディッド・デザイン、科学的な映像化、バーチュアル
・リアリティのようなグラフィックアプリケーション
は、高品質レンダリング、高ポリゴン速度および高フレ
ーム速度を必要とする。既存の商用システムは、毎秒２
百万個のポリゴンに達するピーク速度でレンダリングす
る（例えば、シリコン・グラフィックス社のスカイライ
タおよびヒューレット−パッカード社のVRX（Silicon G
raphics'SkyWriter and Hewlett−Packard's VRX））。
しかしながら、アンチエイリアシング（antialiasing）
またはリアリスティック・シェーディング（realistic
shading）またはテクスチャリング（texturing）を必要
とする場合には、その性能は１桁低下する。

過酷なアプリケーションをサポートするために、未来
のグラフィックスシステムは、高フレーム速度（≧30H
z）で、かつ小さい待ち時間でフォン・シェーディング
（Phong shading）、アンチエイリアシング、およびテ
クスチャリングのようなリアリスティック・レンダリン
グ技術をもって何十万または何百万のプリミティブを含
むデータセットの高分解能の画像を発生することが必要
である。

高性能レベルを達成しよう試みると、２つの障害、す
なわち図形処理に対する不十分な浮動小数点性能および
フレームバッファへの不十分なメモリ帯域幅に遭遇す
る。例えば、30Hzで更新される100,000個のポリゴンを
有する場面をレンダリングするためには、図形処理は毎
秒約３億５千万個の浮動小数点演算を必要とし、ラスタ
処理（rasterization）は約７億５千万回の整数演算お
よび４億５千万回のフレーム−バッファ・アクセスを必
要とする。並列的な解決方法が必須である。

いくつかの現在のシステムは、ラスタ処理の画素並列
法を使用している。すなわち、フレーム−バッファ・メ
モリはいくつかのインターリーブ処理された区分に分割
され、その各々はそれ自身のラスタ処理プロセッサを有
している。これは、区分の数を掛けた分だけフレーム−
バッファの有効な帯域幅を増大するが、多くのプリミテ
ィブが多くの区分に関与しているので、各プロセッサが
処理しなければならないプリミティブの数は低減されな
い。この制限のためにおよび商用のVRAMの帯域幅の制限
のために、この方法では、毎秒数百万個のポリゴンとい
う現在の速度を越えてスケールすることはあまりない。

従って、本発明の目的は、高性能画像発生システムを
提供することにある。

本発明による画像発生システムの他の目的は、グロー
・シェーディッド・ポリゴン（Gouraund−shaded polyg
ons）からフォン・シェーディッド・ボリュームデータ
（Phong−shaded volume date）、直列レンダリングす
るコンストラクティブ・ソリッド・ジオメトリー（CS
G）オブジェクトまでの種々のレンダリングアリゴリズ
ムおよびプリミティブタイプをサポートすることにあ
る。

本発明の別の目的は、ラスタ処理／レンダリング、シ
ェーディング、テクスチャリング、および画像バッファ
リングを含む種々の画像発生機能に適したアーキテクチ
ャアを提供することにある。

本発明の更に他の目的は、任意の数のレンダラ（rend
er）を組み合わせることにより広範囲の種々の性能レベ
ルにわたってかつ任意の高いレベルに対してスケール可
能である画像発生システムを提供することにある。ま
た、本発明の目的は、プリミティブの再分配を必要とす
ることなく、簡略化されたプログラミングモデルを提供
することにある。本発明の他の目的は、アンチエイリア
シング・アルゴリズムとともに使用するのに適した高帯
域幅画像合成ネットワークを提供することにある。

発明の概要本発明の第１の態様は、プリミティブ・スクリーン・
データを発生するプリミティブ処理手段と、該プリミテ
ィブ処理手段に関連して、プリミティブ・スクリーン・
データから画素値を計算する複数のラスタ処理装置（ra
sterizer）を備えた画像発生システムを有する。ラスタ
処理装置は、スクリーン座標の選択された集合（セッ
ト）に対応する増強メモリ装置を有する。増強メモリ装
置（enhanced memory device）は、選択されたスクリー
ン座標の各組に対して、画素値を計算し、画素値を計算
する処理手段と、該処理手段の各々に関連し、データを
記憶する格納手段と、該処理手段の各々に関連し、画素
計算値を記憶する合成器バッファ（compositor buffe
r）とを有する。また、増強メモリ装置は、複数の図形
プロセッサ（geometry processor）の異なる１つに関連
する対応する増強メモリ装置から画素計算値を受け取る
入力手段と、前記記憶された画素計算値および前記入力
手段で受け取った画素値を合成して、合成画素値を決定
する合成器手段（compositor means）と、該合成器手段
に関連して作動し、画素合成値を出力する出力手段とを
有する。

図面の簡単な説明図１は、本発明の画像発生システムの一実施例を示す
ブロック図である。

図２は、シェーダボードを有する本発明の画像発生シ
ステムの第２の実施例を示すブロック図である。

図３は、本発明のレンダラの実施例を示すブロック図
である。

図4aは、本発明のレンダラの実施例を示すブロック図
である。

図4bは、本発明のシェーダの実施例を示すブロック図
である。

図4cは、本発明のフレームバッファの実施例を示すブ
ロック図である。

図５は、本発明の増強メモリ装置の実施例を示すブロ
ック図である。

図６は、ホストコンピュータがそれぞれの高速直列リ
ンクを介して各レンダラおよびシェーダに接続されてい
るシェーダボードを有する本発明の画像発生システムの
実施例を示す絵画図である。

図７は、ポリゴンをレンダリングするステップおよび
本発明の画像発生システムの実施例のために実行される
システム構成要素を示すブロック図である。

図８は、本発明の画像合成ネットワーク用の制御ロジ
ックの実施例を示すブロック図である。

図９は、転送サイクルの間の種々の段階におけるマス
タ・コントローラおよびスレーブ・コントローラを有す
るレディ（ready）およびゴー（go）を示す本発明の画
像合成ネットワークの制御フローの実施例を示すブロッ
ク図である。

図10は、本発明の図形プロセッサとラスタ処理装置と
の間の通信バッファリングを行うコマンド・キューの実
施例を示すブロック図である。

図11は、本発明のラスタ処理装置の実施例を示すブロ
ック図である。

図12は、本発明の画像発生コントローラの実施例を示
すブロック図である。

図13は、本発明のテクスチャASICと増強メモリ装置と
の間の接続の実施例を示すブロック図である。

図14は、本発明のテクスチャASICチップの実施例を示
すブロック図である。

図15は、本発明のシェーダボード・モジュールの実施
例を示すブロック図である。

図16は、本発明のビデオボード・ラスタ処理装置の１
モジュールの実施例を示すブロック図である。

好適実施例の詳細な説明本発明の画像発生システムは、リアルタイム3Dグラフ
ィックス・アルゴリズムおよびアプリケーションを得る
ために画像合成の利点を利用する。本発明の画像発生シ
ステムは、図１ないし図16を参照して説明されるが、こ
れらの図に示されている実施例に限定されるものではな
い。本発明は、まず一般的に説明し、それから特定の実
施例について例示的に説明する。

図１に示すように、最も高いレベルにおいて、本発明
の画像発生システムは、最終画像を発生するように並列
に動作する複数のレンダラ（renderer）10で構成されて
いる。これらのレンダラ10は、ホストコンピュータ20か
らホストインタフェース25を介してスクリーン画像のプ
リミティブを受け取る。それから、画素値がレンダラ10
で決定され、所与のレンダラで計算された特定の画素の
可視性が合成処理で決定され、ビデオディスプレイ40に
表示するためにフレームバッファ30に記憶される。レン
ダラが線形に配列されているので、最終画像は最終のレ
ンダラの出力から発生する。

レンダラで受け取られたプリミティブは幾何的形状で
あり、これらのプリミティブが組み合わされて画像を形
成する。プリミティブは、形状、深さ、色、シェーディ
ング、および本技術分野に専門知識を有する者に周知の
画像についてのその他の情報を有している。プリミティ
ブは、本技術分野に専門知識を有する者に周知の多くの
方法のうちのいずれかの方法で、複数のレンダラ10の全
体に渡って分配される。それから、最終画像は複数のレ
ンダラによって計算される画素値を結合することにより
形成される。画像合成技術は、複数のレンダラからの画
素値を再結合する手段として本画像発生システムに使用
するのに特に適している。

画像合成を使用する場合には、スクリーン全体または
スクリーンの一部のプリミティブが複数のプロセッサに
分配される。単一のレンダラにスクリーンの一部のすべ
てのプリミティブの画素値を計算させるよりも、むしろ
レンダラの各々がスクリーンのある領域のプリミティブ
の一部の画素値を計算する。スクリーンの領域とは、全
スクリーンまたはその一部を示す。従って、レンダラの
すべてはスクリーンの同一部分の画素値を計算し、それ
からレンダラの各々からのこれらの画素値が結合され、
スクリーンのその部分の最終画像を出力する。スクリー
ンの各領域が、最終画像が生成されるまで順次処理され
る。複数のレンダラからのスクリーンの領域の画素値の
結合を合成と称する。

図２に示すように、画像発生システムは、レンダラ10
による合成の後であって、フレームバッファ30への格納
の前に画像のテクスチャリングおよびシェーディングを
行うシェーダ（shader）15を更に有している。また、シ
ェーダを使用して、アンチエイリアシング（antialiasi
ng）を実施することもできる。シェーダは、ホストプロ
セッサ20からシェーディング命令を受け取るとともに、
線形配列されたレンダラ10の最終のレンダラから合成さ
れた画素値を受け取る。フォン（Phong）・シェーディ
ング、および手順テクスチャや画像ベース・テクスチャ
のような据置きシェーディングアルゴリズムは、フレー
ムバッファ30の直前に設けられている別のハードウェア
のシェーダ15で実施される。固有の色、表面法線および
テクスチャ座標のような属性を含む画素領域は、ラスタ
処理され、レンダラ10の画像合成ネットワーク35に沿っ
て合成され、画像合成ネットワーク35からシェーダ15に
ロードされる。画像合成ネットワーク35を、どのボード
も他のどのボードと通信し得るように、リングネットワ
ークとして構成することも任意に可能である。画像合成
ネットワークを構成する他の手段がこの機能を備えてい
るものであることは、本技術分野に専門知識を有する者
にとって明らかであろう。シェーダ15は、領域全体に対
して並列的に作動して、生の画素属性を最終RGB値に変
換し、アンチエイリアシング用に複数のサンプルを一緒
に混合し、最終色値を画像合成ネットワーク35を介して
フレームバッファ30に転送する。

図３は、本発明によるレンダラ10のブロック図であ
る。複数のレンダラの各々は同じであってよい。レンダ
ラ10はプリミティブを受け取り、該プリミティブをスク
リーン座標に変換し、プリミティブ・スクリーン・デー
タを供給する図形プロセッサ100を有する。そして、プ
リミティブ・スクリーン・データは、図形プロセッサに
関連しているラスタ処理装置120に転送され、このプリ
ミティブ・スクリーン・データから画素値が計算され
る。代わりとして、このプリミティブ・スクリーン・デ
ータを、ホストプロセッサ20または他のプリミティブ処
理手段によってラスタ処理装置10に供給することもでき
る。この場合、ラスタ処理装置は図形プロセッサを有し
ていない。

ラスタ処理装置120は、画像発生コントローラ110およ
び少なくとも１つの増強メモリ装置150を有している
が、メモリ装置は増強メモリ装置アレイ125を構成する
複数の増強メモリ装置であることが好ましい。画像発生
コントローラ110は、プリミティブ・スクリーン・デー
タを受け取り、該データを増強メモリ装置150に供給す
る。また、画像発生コントローラ110は、図形プロセッ
サ100から受け取った値を、アンチエイリアシングを使
用するために増強メモリ装置150に供給する前に、調整
することができる。これらの増強メモリ装置150の各々
は、生成されているスクリーンの領域中のいずれの画素
座標もが対応する増強メモリ装置を有するように、選択
されたスクリーン座標の集合に対応している。増強メモ
リ装置150の各々は、その特定の増強メモリ装置に関連
する座標の集合の各々に対して設けられ、画素値を計算
する画素プロセッサ151またはその他の処理手段を有す
る。増強メモリ装置は、画素プロセッサ151の各々に関
連し、これらの画素プロセッサによって使用されるデー
タを記憶する格納手段152を有する。更に、増強メモリ
装置150の各々は、前記画素プロセッサの各々に関連
し、各スクリーン座標用の画素計算値を記憶するための
合成器バッファ153または他の格納手段を有する。ま
た、増強メモリ装置は、他のレンダラおよび画素計算値
を出力するための合成器出力156または他の出力手段に
関連した対応する増強メモリ装置から画素計算値を受け
取るための合成器入力155またはその他の入力手段を有
する。また、増強メモリ装置は、合成器バッファ153に
記憶された画素計算値を合成し、合成された画素値を合
成器出力156に供給する合成器回路154を有する。

合成器入力155で受け取った値を増強メモリ装置150に
ロードする機能を加えることにより、レンダラ10はシェ
ーディング機能用に利用することができる。この場合
は、シェーダ15は図形プロセッサ100およびラスタ処理
装置120で使用するためにホストプロセッサからシェー
ディング情報を受け取るであろう。以下に説明するよう
に、テクスチャリングを考慮して基本のレンダラを更に
変更することができる。

本発明の画像発生システムの特別な利点となるのは、
レンダラ、シェーダ、およびフレームバッファの構造の
モジュール性である。すべての画素に対してシェーディ
ング計算を同時に行うことができるので、レンダラ10に
使用されている単一命令複数データ（SIMD）ラスタ処理
装置120は、遅延シェーディング用の理想的なプロセッ
サである。従って、シェーダ15は簡単には指定されたレ
ンダラであってよく、画像合成ネットワーク35と増強メ
モリ装置150との間に両方向データ転送を可能とするよ
うに増強メモリ装置に対して合成器回路154をわずかに
増強したものである。シェーダには、手順テクスチャに
加えて画像ベース・テクスチャを計算し得るようにハー
ドウェアを追加することができる。

図４に示すように、図4bに示すシェーダ15および図4c
に示すフレームバッファ30は、図4aに示すレンダラ10と
ほぼ同じである。図4bに示すように、ローカルポート16
0を増強メモリ装置150に加えることにより、上述したよ
うなテクスチャリングが可能である。ローカルバッファ
161は、画素プロセッサ151およびローカルポート160に
よるアクセスのためのデータを記憶する。ローカルポー
ト160は、テクスチャリング情報を記憶するために使用
することができるローカル外部メモリ165または他の外
部メモリ手段へのアクセスを行う。ローカルポート16
0、ローカルバッファ161およびローカル外部メモリ165
の追加により、レンダラ10はシェーダ15として利用する
ことができ、テクスチャリング・アルゴリズムを実行す
ることができる。

同様に、ローカルバッファ161、ローカルポート160お
よびローカル外部メモリ165の追加により、さらにビデ
オ回路170さえ含めれば、シェーダ15は、フレームバッ
ファ30として動作しうる。図4cに示すように、フレーム
バッファ30のように、ローカル外部メモリ165は、フレ
ームバッファメモリとして機能し、ビデオ回路170は、
メモリから画素画像データを読み出す。フレームバッフ
ァ30において、ローカルメモリ165は、一実施例では、
別個のダブルバッファVRAMフレームバッファである。

本発明の一実施例では、ホストプロセッサ20から受け
取ったプリミティブは、図形プロセッサによって、プリ
ミティブを表す数式ｆ（x,y）の係数として表されるプ
リミティブ・スクリーン・データに変換される。特に、
プリミティブは、ｆ（x,y）＝Ax＋By＋Ｃの形式の一連
の方程式に線形化されうる。ここにおいて、ｘおよびｙ
はスクリーン画素座標であり、A,BおよびＣは特定のプ
リミティブに含まれる平面を定義する係数である。プリ
ミティブをレンダリングする上述した形式の線形方程式
を使用することは、米国特許第4,590,465号の第４欄、
第47行ないし第６欄、第８行に記載されている。この特
許の開示は、引用することにより、ここに完全に記載し
たものとし、本明細書の一部をなすものとする。線形化
について説明したが、二次方程式のような他の数式また
はスクリーン座標の他の多項式を利用することもでき
る。

本発明の一実施例では、図形プロセッサ100は、画像
発生コントローラ110を介して増強メモリ装置150にA,B
およびＣ係数を供給する。画像発生コントローラ110
は、増強メモリ装置アレイ125を制御する。それは浮動
小数点形式のA,BおよびＣ係数をバイト直列固定小数点
形式に変換し、プリミティブデータ、制御、アドレス情
報のようなコマンド情報を増強メモリ装置アレイ125に
送出することにより増強メモリ装置の動作を順序づけ
し、増強メモリ装置150上の合成器ポート157を制御す
る。

また、画像発生コントローラ110は、スーパーサンプ
リングを使用することによりアンチエイリアシング用に
使用することができる。スーパーサンプリングは、ある
画素を取り囲んでいるサブ画素位置における画素値を計
算し、それからこれらのサブ画素値を組み合わせて所与
のスクリーン座標の実際の画素値を計算する。画像発生
コントローラ110は、サブ画素座標を反映するように係
数を変更し、それから図形プロセッサ100から別の係数
を得ることなく、これらの係数を増強メモリ装置150に
再送信することができる。画像発生コントローラ110
は、同じ組みのラスタ処理コマンドからスーパーサンプ
リング・フィルタカーネルの多数のサンプルを計算する
ことを可能にするサブ画素オフセットレジスタを有して
いる。これは、図形プロセッサへの負荷を増大すること
なく追加のサンプルをラスタ処理するので、スーパーサ
ンプリング時にシステムの性能を増大させることができ
る。

図５は、本発明の画像発生システムに利用されている
増強メモリ装置150の特定の実施例のブロック図であ
る。本発明の増強メモリ装置を、本技術分野に専門知識
を有する者にとって周知の製造技術を使用して単一集積
回路またはチップ上に形成することができることは、本
技術分野に専門知識を有する者に理解されることであろ
う。

図５に示すように、本実施例では、個々の画素プロセ
ッサ151は、ある線形式評価器200を共有している。この
線形式評価器200は、すべての画素プロセッサ151におけ
る特定のプリミティブの一部を表す面を画定するAx＋By
＋Ｃの双一次式として、プリミティブ・スクリーン・デ
ータの値を並列的に計算する。また、各画素プロセッサ
151は、その画素プロセッサに関連する格納手段152とし
て機能するローカルメモリ220の区分に対しておよび双
一次式のローカル値に対して算術および論理演算を行う
小さなローカルALU210を有する。画素プロセッサ151の
演算は、SIMD（single−instruction−multiple−dat
a）であり、すべてのプロセッサは同一アドレスのデー
タ項目に対して演算を行う。各画素プロセッサ151は、
メモリへの書き込みを制限するイネーブルレジスタを有
し、これらのプロセッサのサブセットは、ある演算（例
えば、スキャン変換されたポリゴンのペインティング）
に対して実行不能にされる。また、画素プロセッサ151
が使用するための情報を供給したり、ローカルポート16
0からの情報を受け取ったり、ローカルポート160に情報
を出力するローカルバッファ161が設けられている。合
成器バッファ153は、合成される画素値を記憶する。合
成器バッファ153は、合成および出力のために合成器回
路154にデータを供給する。合成器回路154は、合成器入
力155からデータを受け取り、合成器出力156にデータを
出力する。

図６に示すように、本発明の画像発生システムの一実
施例は、１つ以上のカードケージで構成され、その各々
は多数の回路ボードを有し、ホストプロセッサ20に接続
されている。各カードケージのボードは共通のバックプ
レーンに取り付けられ、各システムボードにまで延びて
いる画像合成ネットワーク35を有している。各ボードは
ホストプロセッサ20に接続されるようになっている。更
に、バックプレーンは、システムボードに電力およびク
ロックを分配する。多数のカードケージは、これらを並
設するとともに、特殊ブリッジボード（図示せず）およ
びコネクタでそれらのバックプレーンを互いに接続する
ことにより接続されている。

本発明の画像発生システムは、毎秒百万回以上のｚバッファされた三角形をレンダリ
ングすることができるワンボード・グラフィックス・コ
ンピュータであるレンダラ10と、画素のシェーディング・モデルを並列に計算し、テク
スチャリングすることができるワンボード・グラフィッ
クス・コンピュータであるシェーダ15と、合成された画素をバッファしディスプレイするフレー
ムバッファ30と、の３つの主ボードタイプを含む。

典型的なアプリケーションでは、ホストプロセッサ20
は、全体的なシステムマスタである。これは、コードお
よびデータを種々のシステムボードにロードし、ディス
プレィ・プリミティブをレンダラ10に送出する。

システムは、一度に、スクリーンの１領域をラスタ処
理する。これは、ラスタ処理が発生する前に、変換され
たプリミティブが各スクリーン領域毎のビン（bin）に
分類されなければならないことを意味する。これらのビ
ンは図形プロセッサのVRAMメモリ502に記憶される。

プリミティブが分類された後、それらは画像発生コン
トローラ命令に変換され、一度に１ビン（bin）ずつラ
スタ処理される。画像発生コントローラ110および増強
メモリ装置アレイ125は、各領域毎のプリミティブをラ
スタ処理する。もし、例えばスーパーサンプリング・ア
ンチエイリアシングで、いくつかのサンプルが各画素毎
に要求されると、その場面は各パス毎に僅かに異なるサ
ブ画素オフセットで、数回にわたってラスタ処理され
る。領域がラスタ処理されると、それは増強メモリ装置
の合成器バッファ153にコピーされ、画像合成ネットワ
ーク35の全体にわたって合成される。

シェーダ15は、使用される場合には、合成された画素
値の領域を切り取り、その両域内の各画素のシェーディ
ングモデルを計算する。画素当りいくつかのサンプルを
有するアンチエイリアシングの場合、各シェーダに送出
された連続した領域は連続したサンプルを含んでいる。
これらのサンプルは各シェーダに記憶された予め計算さ
れた混合係数を使用して互いに混合される。サンプルの
すべてが混合されると、アンチエイリアシングされシェ
ーディング処理を施された画素領域は、画像合成ネット
ワーク35を介してフレームバッファ30に転送される。

フレームバッファ30は、シェーディング処理されアン
チエイリアシングされた画素を受け取り、ローカル外部
メモリ165の適当な部分に記憶する。あるフレームの領
域のすべてが受け取られると、バッファをスイッチし、
この新しいフレームを表示する。

レンダリングは、128x128の１つの領域が一度にラス
タ処理／シェーディング処理されるという、離散形式で
行われることに注意されたい。システムの各ボードは、
合成するかどうか、シェーダにロードするか、アンロー
ドすべきか、処理せずに転送するかどうかといったよう
な、適切なやりかたを選択して処理できるように、各領
域のタイプと位置を理解していなければならない。これ
は、レンダリングが開始する前に、各ボードにレンダリ
ング処方を配布することにより行われる。レンダリング
処方は、画像合成ネットワークに転送される領域および
各領域に対して取られる動作のリストである。あるボー
ドでは、レンダリング処方は単純である。例えば、フレ
ームバッファのレンダリング処方は、領域が記憶される
べきかどうかについて、どこで、どの点でバッファをス
イッチすべきかについて簡単に記述している。シェーダ
に対するレンダリング処方は、更に複雑である。それ
は、領域をロードし、他の領域を混合し、処理すること
なくある領域を転送し、他の領域をアンロードしなけれ
ばならない。図７は、ポリゴンおよびそれらが実行され
るシステムコンポーネントをレンダリングするステップ
を図示している。

ホストプロセッサ（host processor）。ホストプロセ
ッサ20は、システムマスタとして機能するワークステー
ション、多重処理システムまたはその他の汎用コンピュ
ータである。ホストプロセッサはコードおよびデータを
種々のシステムボードにロードし、ユーザの入力をサン
プルし、アプリケーションを動作させ、プリミティブを
レンダラ10に送出し、シェーディングコマンドをシェー
ダ15に送出する。

画像合成ネットワーク（image−composition networ
k）。画像合成ネットワーク35は、隣接ボード間で画素
データを迅速に移動させる非常に幅の広い（256ビッ
ト）、高速で特殊な通信ネットワークである。画像合成
ネットワークは、システムの異なる部分の２つの機能を
実行する。すなわち、画像合成ネットワークは、画素デ
ータをレンダラ10の合成器154間で転送し、レンダリン
グ処理された画素をシェーダ15からフレームバッファ30
に転送する。画像合成ネットワーク35は、隣接するバッ
クプレーン・スロットを接続する256本のワイヤとして
実施される。各システムボードの合成器データを隣接す
るボードの合成器に送信する。

画像合成ネットワーク35は、全システムバックプレー
ン（または多重ラックシステムのバックプレーン）を横
切って延びる非常に大きな帯域幅のリング接続された一
方向データパスとして実施される。バックプレーンはボ
ード間の点と点を結ぶワイヤリングを構成するが、各ボ
ードには活性回路が設けられている。

画像合成ネットワークの生の帯域幅は、システムにお
ける最大スクリーン分解能、フレーム速度、画素当りの
サンプルの数、画素当りのビット数を決定する。これら
のパラメータは互いにトレードオフできるが、これらの
積は全体の帯域幅よりも小さくなければならない。

画像合成ネットワークは、２つのパート、すなわち画
素データをボードからボードに伝送するデータパス、お
よび、ネットワークを介して転送を同期し順序づける制
御パスから構成されている。画像合成ネットワーク制御
パスは、以下に説明するレディ／ゴー・コントローラま
たはデータの転送を同期する他の適当な画像合成ネット
ワーク制御手段によって支配される。これらの部分の一
実施例について更に詳細に説明する。

データパスは、システム内の各対の隣接するボードを
接続する256ビットの広いポイントツーポイント通信ネ
ットワークである。相互接続ワイヤは、システム・バッ
クプレーンの一部である。高密度コネクタにより、関連
する制御信号とともにデータパスワイヤが各ボードに取
り出される。データパス用のアクティブ回路のすべて
が、個々のレンダラ／シェーダおよびフレームバッファ
ボード上に設けられている。

ネットワーク内の個々の合成器154は、プログラム制
御により構成可能である。合成器は次の４つのモードの
１つで動作する：合成。合成器入力155における画素ストリームを有す
る増強メモリ装置150の合成器バッファ153からの画素ス
トリームを合成する。その結果を合成器出力156を介し
て送信する。

ロード。入力ストリームを増強メモリ装置にロードす
る。

転送。入力ストリームを変更することなく合成器出力
156に転送する。

アンロード。増強メモリ装置からのデータを合成器出
力156を介して送出する。合成器入力155に到着した画素
を無視する。

合成処理は、いくつかの方法で実施できる。一実施例
では、これは入力画素のｚ値を合成器バッファ画素のｚ
値と比較し、どの画素が見えるかを決定することにより
行われる。本技術分野に専門知識を有する者によって理
解されるように、他の合成方法も本発明で利用すること
ができる。例えば、可変長リストの断片により画素が表
されるＡバッファ合成を使用することができる。Ａバッ
ファ合成を使用するには、各レンダラ10は各画素のオー
ダリストの部分を計算し、合成器は入力画素の部分を合
成器バッファに記憶された画素の部分でインターリーブ
し、もはや見えない部分を削除する。

ｚバッファリングを使用する実施例では、合成モード
は、画素がｚ値を有し、各ビットは最上位ビット（MS
B）から最下位ビット（LSB）まで順序づけることを必要
とする。より近い画素が対応するビットを比較すること
により決定されると、合成器154などの画素が前方にあ
るかを記録し、優先順位の決定がこの画素に対して行わ
れたことを記録する状態ビットを設定する。これらの２
つの状態ビットは、どの画素が残りのｚビットおよび画
素内の他のデータビットのすべてに対して送信されるの
かを決定する。

合成モードは、レンダラ・ボードに必要とされる唯一
のモードである。しかしながら、シェーダ15は、合成さ
れた領域をその増強メモリ装置150にロードし、シェー
ディング処理された領域をアンロードし、他のシェーダ
に関係する領域を転送するために他のモードを必要とす
る。

画像合成ネットワーク35上の転送は、１領域の大きさ
を量子とする。画素のビットの数は可変である。しかし
ながら、一度転送が開始されると、どんな画素サイズで
あっても、その領域のすべての画素が発信元ボードから
送信され、宛先ボードで受信される。

領域転送は、一般に２つのタスクのうちの１つを実行
する。すなわち、レンダラからの画素の領域を合成し、
シェーダに入力するか、またはシェーディング処理され
た画素をフレームバッファに転送する。（領域を１つの
レンダラから他のレンダラに転送するような他の処理も
可能であるが、標準のポリゴンレンダリングでは必要で
ない。）各領域転送は、システム内の各ボードに対して
特定の意味を有し、画素データのフォーマットは、転送
の種類により異なる。各ボードはそれ自身を正しく構成
できるように転送の目的を知らなければならない。個々
のボードに対する転送のスケジュールは、レンダリング
処方と呼ばれている。各ボードのレンダリング処方は、
並列システム用の分散されたコントローラである。

転送処理は、画像合成ネットワーク35を最大に使用す
るために非常に正確にかつ低いオーバーヘッドで同期し
ていなければならない。転送が開始し、上流のレンダラ
が画素を送信開始すると、下流のレンダラはそれらを正
確なクロックサイクルで受信する用意をしなければなら
ない。また、画像合成ネットワークは、すべてのボード
が次の転送を開始しようとする時を決定しなければなら
ない。この決定は迅速に行わなければならない。遅延す
ると、画像合成ネットワークにわたって達成される正味
の帯域幅、従ってシステムの最大速度に影響を与えるか
らである。画像合成ネットワークの制御パスは、これら
の２つの機能を実行する。更に、画像合成ネットワーク
は、転送を各ボードの他の構成要素と同期させる。

レディ・チェーン（ready chain）およびゴー・チェ
ーン（go chain）は、画像合成ネットワーク35の全体に
わたって転送を同期させるハードウェア連動装置であ
る。レディ・トークン（ready token）は、ボードから
ボードへ上流へと伝播し、次の転送に対してボードの用
意ができている時を示す。ゴー・トークン（go token）
は、下流へと伝播し、転送の開始をトリガする。

図８に示すように、一実施例では、画像発生コントロ
ーラ110は、３つの入力および３つの出力をもってレデ
ィ／ゴー・コントローラ機能を実行する。転送レディ
（XferReady）入力は、ラスタ処理装置から供給され
る。それはラスタ処理装置が次の転送を開始しようとす
る時を示している。転送レディ（XferReady）、レディ
・イン（ReadyIn）、およびレディ・アウト（ReadyOu
t）は、レディ・チェーンを構成する。すなわち、レデ
ィ・トークンは、各ボード上のレディ・アウトの低から
高への変移によって符号化される。ゴー・イン（GoI
n）、ゴー・アウト（GoOut）、および転送ゴー（XferG
o）はゴー・チェーンを構成する。すなわち、ゴー・ト
ークンは、各ボード上のゴー・アウトの低から高への変
移によって符号化される。

動作に際して、フレームバッファ30は、次の転送を開
始する準備ができたとき、レディ・アウトを主張する。
各画像発生コントローラのレディ／ゴー・コントローラ
は、下流のコントローラからレディ・インを受け取り、
レディ・アウトを上流のコントローラに出力する。該コ
ントローラは、レディ・インおよび転送レディが両方と
も主張された後、レディ・アウトを主張する。転送は、
レディが上流のレンダラに到着したときに開始する。し
たがって、各ボードは、開始しようとするまで転送を遅
延することができる。

ゴーは、レディと反対方向に画像合成ネットワークを
伝播する。上流の画像発生コントローラは、転送ゴー
（XferGo）およびゴー・アウト（GoOut）を主張して、
転送を開始する。各画像発生コントローラがゴー・イン
（GoIn）を受け取ると、転送ゴー（XferGo）をボードに
主張し、ゴー・アウト（GoOut）を下流のコントローラ
に主張する。このボードは、レディを拒否することがで
きるのと同じ方法では、ゴーを拒否することはできな
い。すなわち、ボードは、転送レディ（XferReady）を
主張した時に、その特権を失ったのである。ゴーの到着
は、ｎクロックサイクル後に（ｎは出力シーケンス回路
の開始遅延によって決定される）、画素が合成ネットワ
ーク上を流れることを意味する。転送が完了すると、画
像発生コントローラは、転送ゴー（XferGo）およびゴー
・アウト（GoOut）を主張しなくなり、フレームバッフ
ァ30（用意できたとき）は、レディ・アウト（ReadyOu
t）を主張し、次の転送サイクルが開始する。

上流レンダラ上のレディ／ゴーは、僅かに異なる機能
を有する。レディを上流に通過させ、ゴーを下流に通過
させるよりもむしろ、レディ・イン（ReadyIn）および
転送レディ（XferReady）を受信した後、単にゴー・ア
ウト（GoOut）を主張する。このコントローラは、転送
を実際に開始する時を決定するので、マスタコントロー
ラと呼ばれる。各ボードのコントローラは、スレーブま
たはマスタとして機能することができる。図９は転送サ
イクルの間の種々のステージにおけるマスタ・コントロ
ーラおよびスレーブ・コントローラについてレディ（Re
ady）およびゴー（Go）を示している。

レディ・チェーンおよびゴー・チェーン（転送レディ
（XferReady）を除く）における信号のすべては、画像
合成ネットワークデータパスを維持し、オーバーヘッド
を低減するように画像合成クロック速度で動作すること
に注意されたい。それでも、レディおよびゴー・チェー
ンからのオーバーヘッドは、大きなシステムにおいては
顕著なものとなりうる。

制御パスからの転送ゴー（XferGo）は、転送の開始を
示している。この信号は、転送レディ（XferReady）が
主張された後に、どのクロックサイクルでも到着するこ
とができる。合成器シーケンサは、転送ゴー（XferGo）
が主張された後ｎクロックサイクル後に、画素を合成
し、ロードし、またはアンロードする準備ができるよう
に、合成器154および合成器ポート157を構成し順番付け
をする。

合成器シーケンサは、構成レジスタとタイマの２つの
部分を有する。構成レジスタは、合成器の動作モード
（合成、ロード//転送またはアンロード）および合成ポ
ートの転送モード（リードまたはライト）を決定する制
御ビットを記憶する。

タイマは、合成された画素の数を監視し、適当な時に
合成ポート157をイネーブルおよびディスエーブルす
る。タイマは、転送が画像発生コントローラ110によっ
て開始する前に、適当な画素長にプリセットされる。転
送ゴー（XferGo）が主張された後に、１つの領域の画素
のすべてを転送するのに必要な正確な時間長の間、増強
メモリ装置合成ポート157に転送イネーブル（XferEna
b）信号を主張する。

レンダラ／シェーダ（renderer/shader）。単一ボー
ドタイプを使用して、レンダラおよびシェーダの両機能
を実施することができる。レンダラ／シェーダ・ボード
は、毎秒百万回以上ｚバッファされた三角形をレンダリ
ングし、並列に128x128の画素をシェーディングするこ
とができる全ｚバッファレンダリング・エンジンを有す
ることができる。本発明の画像発生システムは、どのよ
うな数のレンダラ／シェーダでも構成することもでき
る。レンダラ10は、プリミティブを変換しラスタ処理
し、レンダリング処理された画素を他のレンダラからの
画素で合成する役割を果たす。シェーダ15は、画像合成
ネットワークからのレンダリング処理された画素を受け
取り、それらをバッファし、128x128の画素領域のすべ
ての画素に対してシェーディングモデルを並列に評価
し、画素をフレームバッファ30に転送する。レンダラ／
シェーダ・ボードは、図形プロセッサ100とラスタ処理
装置120の２つの主部分を有する。

図形プロセッサ（geometry processor）。図形プロセ
ッサは、高速浮動小数点プロセッサである処理手段504
を有する。図形プロセッサは、それ自身のローカルメモ
リを有し、ホストインタフェース130およびラスタ処理
装置120へのアクセスを有する。図形プロセッサ100は、
プリミティブをオブジェクト座標からスクリーン座標に
変換し、ラスタ処理装置に送出される命令を計算し、こ
れらを個々のスクリーン領域に対応するビン（bin）に
分類する責任がある。一実施例における図形プロセッサ
のメモリ502には、通常のDRAMよりもむしろビデオRAM
（VRAM）を使用する。VRAMのランダムポートは、メモリ
バスに接続されている。VRAMの直列ポートは、画像発生
コントローラの入力ポート440に接続されている。VRAM
は、DMAコントローラ510とともに画像発生コントローラ
110に対する入力インタフェースを形成する。

図10に示すように、コマンドキュー、好ましくはFIFO
500は、図形プロセッサとラスタ処理装置との間の通信
およびバッファリングを行う。FIFO500は、図形プロセ
ッサのVRAMメモリのデータのブロックに対するポインタ
および各ブロックの長さを記憶する。

DMAコントローラ510は、FIFO500からポインタを読み
出し、VRAM直列ポートからデータを取ってくる。すべて
のVRAMバンクの直列ポートは共通32ビットバスに一緒に
接続され、画像発生コントローラの入力ポートに接続さ
れている。DMAコントローラ510は、画像発生コトローラ
110とハンドシェークし、32ビットコマンドワードを66M
Hzクロックサイクル毎にロード可能にする。

ラスタ処理装置（rasterizer）。ラスタ処理装置120
は、各レンダラ／シェーダボードの中心部分である。ラ
スタ処理装置の中心部は、各ボードで同じであるが、シ
ェーダボード上のテクスチャメモリまたはビデオボード
上のビデオメモリのようなボード特有回路とともにラス
タ処理装置内に設けられている。ラスタ処理装置の中心
部は、図11に示すように、64個の増強メモリ装置150の
アレイ、32個のテクスチャASIC162のアレイ、および画
像発生コントローラ110を有している。

増強メモリ装置150は、単一命令／多重データ・スト
リーム（SIMD）方式で動作する128x128（16,384）バイ
ト直列画素処理素子のアレイ125を形成している。典型
的なシステム動作では、これらの処理素子は、スクリー
ン上の128x128画素領域上に画素当り１個の処理素子で
マップされ、Ｆ（x,y）のローカル値は、処理素子（x,
y）の画素アドレスに対応する。

テクスチャASIC162は、データパス・チップであり、
増強メモリ装置150をテクスチャまたは画像格納のため
にオプションの外部メモリ165および図形プロセッサに
接続する。

画像発生コントローラ110は、図形プロセッサからの
命令を解釈する。これは、増強メモリ装置150およびテ
クスチャASIC162用の高レベル命令を実行し、サイクル
毎の動作を制御する２つのシーケンサを有するマイクロ
コード化エンジンである。

ラスタ処理装置の中心部に加えて、シェーダ・ボード
はテクスチャを記憶するためのDRAMメモリを有してい
る。ビデオボードはフレーム・スキャン・インとスキャ
ン・アウトの間、画素を記憶するVRAMメモリを有する。
レンダラボードは、特別な回路を持ってないが、テクス
チャASICは、増強メモリ装置のメモリと図形プロセッサ
バスとの間のインタフェースの働きをする（この接続は
どのようなボードの種類でも存在する）。

画像発生コントローラ（image generation controlle
r）。一実施例では、画像発生コントローラ110は、図形
プロセッサ100からのコマンドを処理し、増強メモリ装
置150およびテクスチャASIC162を順番に配列し、ラスタ
処理装置を画像合成ネットワーク35と同期させる。画像
発生コントローラは、増強メモリ装置およびテクスチャ
ASICを制御するマイクロコード記憶部および別々のシー
ケンサを有するカスタムチップである。増強メモリ装置
のシーケンサは、浮動小数点入力係数を増強メモリ装置
によって要求される固定小数点バイト直列形式に変換す
る直列化装置を有する。図12は、画像発生コントローラ
のブロック図である。

画像発生コントローラ用のコマンドは、異なるフォー
マットを有する。これらは命令の目的によって次に示す
５つのアーギュメントのいくつかまたはすべてを有す
る。すなわち、Ｉワードは、必須のものであり、命令コードおよびマ
イクロルーチン用のいくつかのパラメータを有する。Ｉ
ワードはすべてのコマンドに存在し、コマンドの第１ワ
ードである。

Ｐワードは、オプションであり、マイクロコードルー
チン用の追加パラメータを有する。

A,BおよびＣ係数はオプションであり、線形式評価器
用のオペランドである。

ＩワードおよびＰワードは、各々32ビットである。A,
BおよびＣ係数は、32または64ビットの整数または浮動
小数点数である。画像発生コントローラは、256ビット
幅の入力コマンドレジスタを有し、これらのアーギュメ
ントからなる全コマンドを保持できる。画像発生コント
ローラへの物理的入力インタフェースは、32ビット幅で
ある。ストリームパーサ（parser）600は、入力ストリ
ームを解析し、各ワードをコマンドレジスタの適当な部
分にロードする。入力インタフェースの残りの部分は、
これらのフォーマットに関係なく単一ユニットとしてコ
マンドを処理する。

ラスタ処理装置のタスクは、２つの部分：（１）ラス
タ処理−画素値の計算、および（２）合成器のセットア
ップ−画素データを増強メモリ装置の画素メモリの合成
器バッファ部154にコピーし、合成器154を制御するとい
う２つの部分からなる。不幸にして、２つの部分は、非
同期処理として実施されなければならない。これは、画
素値の多数の領域が画素メモリにバッファされ、領域の
転送が予測できない時に（画像合成ネットワークが新し
い領域を転送しようとする時）発生するからである。

これらのタスクを非同期で実行することができるため
には、入ってくる画像発生コントローラコマンドは、２
つのコマンドキュー、好ましくはFIFOにバッファされな
ければならない。すなわち、RFIFO610は、レンダリング
コマンドをバッファし、TFIFO620は、転送コマンドをバ
ッファする。２つのFIFOの動作を同期させるのに仲裁ロ
ジックが必要である。

FIFOは、各エントリの全コマンドを保持するのに十分
な広い幅を有している。各コマンドのＩワード内のある
ビットにより、コマンドRFIFO610またはTFIFO620にロー
ドされるべきかどうかが決定される。RFIFO610は、64個
のコマンドまでを保持することができ、TFIFO620は1024
個のコマンドまでを保持することができる。ハードウェ
アはFIFOに記憶されたコマンドの数のトラックを維持
し、いずれかのFIFOがほぼ満杯である場合、状態レジス
タビットを主張する。図形プロセッサ100は、この状態
レジスタビットの主張するところを検出し、画像発生コ
ントローラFIFOのオーバーフローを防止する。

FIFOは、RTコントローラ630によって空にされる。こ
のRTコントローラは、画素メモリ内で有効な領域バッフ
ァの数のトラックおよび画像合成ネットワーク35の状態
を維持する。最初は、それはRFIFO610からコマンドを読
み出す。新しい画像合成ネットワークの転送が初期化さ
れる（またはされようとする）ことが必要である場合、
RFIFO610からのコマンドストリームは中断され、コマン
ドがTFIFO620から読み出される。これらのコマンドによ
り、格納手段152からのデータが合成器バッファ153にコ
ピーされ、転送が初期化される。新しい転送が初期化さ
れるや否や、コマンドストリームの処理はRFIFO610に戻
される。

RTコントローラ630は、内部４ビットカウンタを２
つ、すなわち、「FreeBuffs」および「FullBuffs」と呼
ぶカウンタを有する。これらは、それぞれ増強メモリ装
置150内の画素データの空きのバッファの数および満杯
のバッファの数を示している。画像発生コントローラ11
0がリセットされると、FreeBuffsおよびFullBuffsは、
各々０にセットされる。ソフトウェアにより、増強メモ
リ装置において利用できる空き画素バッファの数にFree
Buffsをセットしなければならない。これらのカウンタ
は、セマフォのように使用され、コマンドが入力FIFOの
各々から安全に実行されるかどうかを決定する。例え
ば、FreeBuffs＝０の場合には、ラスタ処理は停止され
なければならない。すなわち、さらなる結果を保持する
のに利用できるバッファーがない。また、転送は、Full
Buffs＞０の場合にのみ開始される。FreeBuffsおよびFu
llBuffsは、入力コマンドストリーム内に存在する特殊
な制御コマンドを使用してインクリメントおよびデクリ
メントされる。

一実施例では、画像発生コントローラ110は、２つの
シーケンサ、すなわちEMCシーケンサ640とTASシーケン
サ650を有している。EMCシーケンサ640は、画素プロセ
ッサ151用のマイクロ命令、画素メモリ220へのアドレ
ス、および線形式評価器（linear expression evaluato
r）200用のABC係数を発生する。EMCシーケンサ640への
コマンドを使用して、（レンダラボード上の）ポリゴン
をラスタ処理し、（シェーダボード上の）シェーディン
グ計算を実施する。TASシーケンサ650は、テクスチャAS
IC162および附属のメモリ165を制御する。TASシーケン
サ650へのコマンドを使用し、シェーダまたはビデオボ
ード上の附属メモリ165と増強メモリ装置150との間、ま
たは増強メモリ装置150上の画素メモリ220と図形プロセ
ッサバスとの間でデータを移動する。

EMCシーケンサ640およびTASシーケンサ650は、各々ロ
ーカルマイクロコードメモリを有する。各コマンドのＩ
ワード内のビットは、どのシーケンサがコマンドを実行
すべきかを指示する。また、Ｉワードは、コマンド用の
開始マイクロコードアドレスを特定する。各シーケンサ
は、（ループカウンタの値のような）内部条件および外
部条件（各シーケンサに対する２つの条件コード入力）
の両方に対して条件分岐を行うことができる。シーケン
サはスタックを持っていない。また、シーケンサは、ラ
スタ処理装置のボード上の種々雑多な制御機能を実施す
ることができるいくつかの外部制御出力を有する。

増強メモリ装置（enhanced memory device）。一実施
例では、64個の増強メモリ装置150のアレイ125は、スク
リーンの128x128の画素領域がカバーする２次元SIMDプ
ロセッサアレイである。この論理アレイは、ディスプレ
イスクリーンのどの128x128の画素領域でも処理するよ
うに「移動」させることができる。このような領域は、
通常128画素毎の境界に配列されるが、任意に位置決め
することができる。

各画素は、それ自身の８ビットALU210、線形式評価器
ツリー（LEE:linear−expression evaluator tree）200
の出力、ローカルメモリ152の2048ビット、256ビットの
合成器バッファ153、および256ビットのローカルデータ
バッファ161を備えている。図５は、増強メモリ装置の
論理図を示している。

各画素ALU210は、汎用８ビットプロセッサである。こ
れは画素のサブセットに対して操作を行うことができる
イネーブルレジスタを有している。画素ALUは、線形式
評価器の結果またはローカルメモリ220をオペランドと
して使用し、結果をローカルメモリに書き込むことがで
きる。また、これはメモリとローカルおよび合成器バッ
ファとの間でデータを転送することができる。

画像発生コントローラ110は、増強メモリ装置アレイ1
25の動作を制御する。画像発生コントローラの命令およ
び係数は直列化され、すべての増強メモリ装置に並列に
ブロードキャストされる。SIMD画素プロセッサは、ロッ
クステップでこれらの命令を実行する。各画素プロセッ
サのイネーブルレジスタを使用して、どのサブセットの
画素プロセッサが所与の時点でアクティブであるかを制
御する。

各画素は、256＋32＋32バイトのローカルメモリを備
えている。上述したように、メモリは３つの部分、すな
わち大抵の計算のために使用される256バイトの主区
分、および外部通信のために使用される２つの32バイト
の区分に分割されている。

通常、画素メモリの256＋32＋32バイトのすべてをア
クセスすることができる。しかしながら、通信ポート操
作が行われる場合には、それらのバッファのデータは一
時的に利用できない。例えば、合成されるべき画素デー
タが合成器バッファ内にコピーされた後、合成操作は初
期化され、合成器バッファ内のメモリは合成操作が完了
するまでALUによってアクセスすることはできない。同
様に、ローカルポート操作を行うためには、データはロ
ーカルバッファ内に移動され、ローカルポート操作が開
始される。この点において、ローカルバッファは操作が
完了するまでALUによってアクセスされてはならない。

画像合成ポートおよびローカルポートは、画素データ
を直列に増強メモリ装置に／から（合成処理のために）
他の増強メモリ装置に転送したり、またはテクスチャAS
ICに／から（テクスチャ・ルックアップを行うためにま
たはテクスチャまたはビデオメモリへの画素データの書
き込みを行うために）転送することを可能にする。各画
素からのデータは各ポートから直列に存在する。各画素
および通信バッファ内のそれらの位置に／から転送され
たバイトの数は、構成コマンドによって指示される。画
像合成ポートは合成器入力155および合成器出力156を有
する。この両者は132MHzで動作する４ビットポートであ
る。ローカルポートは66MHzで動作する４ビットポート
である。

各増強メモリ装置は、すべての画素のイネーブルレジ
スタのロジカル−オアを表す出力を有する。これらの出
力は互いにワイヤード・アンドされ、グローバル−イネ
ーブル信号（EOrH）、すなわち全SIMDアレイ用のイネー
ブルレジスタのロジカル−オアを形成する。EOrHは、EM
Cシーケンサの外部条件コード入力に供給される。EMCシ
ーケンサへのコマンドはEOrの状態をテストし、その結
果に基づいて条件付きで実行する。EOrの状態は、図形
プロセッサと通信することができる。

テクスチャASIC（texture ASIC）。32個のテクスチャ
ASICのアレイは、増強メモリ装置の画素メモリ、図形プ
ロセッサマイクロプロセッサのバス、およびオプション
のテクスチャまたはビデオメモリ間のデータ並列通信イ
ンタフェースからなる。32個のテクスチャASICは、８個
のモジュールに分割され、各モジュールは、８個の増強
メモリ装置および４個のテクスチャASICからなる。テク
スチャASICは、図13に示すように、ビットスライス方式
で増強メモリ装置の４ビットローカルポートに接続され
る。また、テクスチャASICは、８個の全てのモジュール
にかかっているビットスライスの32ビットバスに接続さ
れている。このTASICバスは、モジュール間をロジカル
接続し、画素データが必要により共有される。増強メモ
リ装置およびテクスチャASIC間の４ビットインタフェー
スおよびTASICバスは、66MHzで動作する。

図14は、テクスチャASICチップのブロック図である。
内部的に、このテクスチャASICチップは増強メモリ装置
のメモリ、いくつかの構成可能なデータパス、および外
部メモリに直接接続される両方向ポートへ／からのアド
レスおよびデータをバッファリングし、直列化／並列化
する二重ポートRAMから構成されている。テクスチャASI
Cアレイのクロック毎の動作は、画像発生コントローラ
にあるEMCシーケンサから独立した画像発生コントロー
ラ内のTASシーケンサによって制御される。しかし、TAS
シーケンサは、増強メモリ装置のローカルポートを制御
するが、それは、これらのローカルポートが直接テクス
チャASICとインタフェースしているからである。

テクスチャASICの外部メモリポートは、レンダラ・ポ
ート上で使用されない。これらはシェーダ・ボード上の
テクスチャメモリに接続され、またビデオボード上のビ
デオメモリに接続される。

レンダラ、シェーダ、ビデオボードの差異。レンダラ
ボード上のラスタ処理装置は、単にラスタ処理装置の中
心部分からなる。これはほとんどのラスタ処理計算に必
要な唯一の回路である。

シェーダボード上のラスタ処理装置は、TASICメモリ
ポートに取り付けられた128個の4Mbitx4のDRAM（16メガ
ビット）メモリチップのアレイを有する。この追加メモ
リは、画像ベース・テクスチャを記憶し、ルックアップ
し、画像ワーピング操作用の画素間通信を行い、または
メモリ集約的なレンダリング・アルゴリズム用のパッキ
ング記憶装置として機能するように使用される。

メモリは、増強メモリ装置およびテクスチャASICとと
もに、８個のモジュールに分割される。あるモジュール
内の16個のDRAMは、８バンクに配列され、各バンクは2K
x2Kバイトの大きさである。１モジュール当りの総記憶
容量は32メガバイトである。これらのバンクは全体的に
制御されるが（８個のすべては同時にメモリ動作を行
う）、アドレスは異なる。図15は、１つのシェーダ・ボ
ード・モジュールのブロック図である。

ビデオボード上のメモリの構成は、シェーダボード上
のものと全く同じである。メモリは、DRAMではなく、VR
AMである。ディスプレイは、VRAMのビデオポートからリ
フレッシュされる。画素はバイト直列に記憶されるの
で、コーナーターニング（corner−turning）機能は、V
RAM直列ポートと色ルックアップ・テーブルおよびDAC間
で実行されなければならない。これは１組のプログラマ
ブル・ロジック・ポートを使用して行われ、このポート
はまた必要な多重化を行う。ビデオメモリへ／からのデ
ータ転送は、テクスチャメモリへ／からのデータ転送と
同じである。増強メモリ装置は、記憶されるデータ項目
のアドレスを計算し、それからテクスチャASICは、ビデ
オメモリへ／からのアドレスおよびデータを転送する。

テクスチャASICは、ビデオ列負荷アドレスを発生する
ための内部アドレスカウンタを有している。これらのカ
ウンタは、画像発生コントローラによって初期化され、
ボードレベルのビデオリフレッシュ回路によって駆動さ
れる各テクスチャASIC上の特別な入力によって制御され
る。

図16は、ビデオボードラスタ処理装置の１モジュール
のブロック図である。シェーダ・ボード上におけるよう
に、増強メモリ装置は、メモリアクセス用のアドレスを
計算し、メモリは、高速ページモードおよびランダムア
クセスモードの両方をサポートするように構成されてい
る。通常、画素は、ランダムアクセスサイクルとそれに
続く高速ページモードサイクルを使用して、バイト直列
にメモリに書き込まれる。

上述の説明は、本発明を説明するためになされたもの
であり、本発明を限定するものとして解釈されてはなら
ない。本発明は、次に示す請求の範囲によって画定さ
れ、この請求の範囲に均等なものは、本請求の範囲内に
入ると解されるべきものである。

フロントページの続き (72)発明者モルナー，スティーヴン・エドワードアメリカ合衆国、27514 ノース・キャロライナ、チャペル・ヒル、ヒッコリー・ドライヴ 418 (72)発明者アイルズ，ジョン・ゴードンアメリカ合衆国、27516 ノース・キャロライナ、チャペル・ヒル、リトル・クリーク・ファーム・ロード 8605 (56)参考文献ＩＥＥＥＣｏｍｐｕｔｅｒＧｒａｐｈｉｃｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，Ｎｏｖｅｍｂｅｒ 1992，Ｐｏｕｌｔｏｎｅｔａｌ，”ＢｒｅａｋｉｎｇｔｈｅＦｒａｍｅ−ｂｕｆｆｅｒＢｏｔｔｌｅｎｅｃｋＷｉｔｈＬｏｇｉｃ−ＥｎｈａｎｃｅｄＭｅｍｏｒｉｅｓ”，Ｐ．65−74 ＣｏｍｐｕｔｅｒＧｒａｐｈｉｃｓＶｏｌ．26，Ｎｏ．２（Ｊｕｌｙ 1992），Ｍｏｌｎａｒｅｔａｌ，" ＰｉｘｅｌＦｌｏｗ：Ｈｉｇｈ−ＳｐｅｅｄＲｅｎｄｅｒｉｎｇＵｓｉｎｇＩｍａｇｅＣｏｍｐｏｓｉｔｉｏｎ”，Ｐ．231−240 ＤｉｓｓｅｒｔａｔｉｏｎｓｕｂｍｉｔｔｅｄｔｏＵｎｉｖｅｒｓｉｔｙｏｆＮｏｒｔｈＣａｒｏｌｉｎａａｔＣｈａｐｅｌＨｉｌｌ，ｏｃｔｏｂｅｒ 1991，Ｍｏｌｎａｒ，" Ｉｍａｇｅ−ＣｏｍｐｏｓｉｔｉｏｎＡｒｃｈｉｔｅｃｔｕｒｅｓｆｏｒＲｅａｌ−ＴｉｍｅＩｍａｇｅＧｅｎｅｒａｔｉｏｎ”，Ｐ．65−97 ＣｏｍｐｕｔｅｒＧｒａｐｈｉｃｓＶｏｌ．23，Ｎｏ．３（Ｊｕｌｙ 1989），Ｆｕｎｃｈｓｅｔａｌ，" ｐｉｘｅｌ−Ｐｌａｎｅｓ５：ＡＨｅｔｅｒｏｇｅｎｅｏｕｓＭｕｌｔｉｐｒｏｃｅｓｓｏｒＧｒａｐｈｉｃｓＳｙｓｔｅｍＵｓｉｎｇＰｒｏｃｅｓｓｏｒ−ｅｎｈａｎｃｅｄＭｅｍｏｒｙｓ”，Ｐ．79−88 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06T 1/20 G06T 15/00 - 17/50 ＪＩＣＳＴ（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】（ａ）プリミティブ・スクリーン・データ
を発生するプリミティブ処理手段と、（ｂ）前記プリミティブ処理手段に関連し、前記プリミ
ティブ・スクリーン・データから画素値を計算する複数
のラスタ処理装置であって、該ラスタ処理装置の各々が
選択されたスクリーン座標の集合に対応する増強メモリ
装置を有する前記複数のラスタ処理装置とを有する画像発生システムであって、（ｉ）前記補強メモリ装置が、前記選択されたスクリー
ン座標の各々に対して画素値を計算し、画素計算値を供
給する画素プロセッサ手段と、前記画素プロセッサ手段の各々に関連し、データを記憶
する格納手段と、前記画素プロセッサ手段の各々に関連し、前記画素計算
値を記憶する合成器バッファとを有し、（ii）前記増強メモリ装置が、更に、その増強メモリ装置を有しているラスタ処理装置とは異
なる１つのラスタ処理装置から画素値を受け取る合成器
入力手段と、前記記憶された画素計算値および前記入力手段によって
受け取られた画素値を合成し、合成画素値を決定する合
成器手段と、前記合成器手段に関連して作動し、前記合成画素値を出
力する出力手段とを有し、（ｃ）前記複数のラスタ処理装置の少なくとも１つが、
前記増強メモリ装置に関連して作動し、画像化情報を記
憶する外部メモリ手段と、該外部メモリ手段への二重ポ
ートアクセスを可能にするメモリインターフェース手段
とを更に有する、画像発生システム。
【請求項２】前記外部メモリ手段を有する前記複数のラ
スタ処理装置の前記少なくとも１つの前記増強メモリ装
置が、更に、前記画素プロセッサ手段に関連して作動し、前記画素プ
ロセッサ手段からのデータを記憶し、前記画素プロセッ
サ手段にデータを供給するローカルバッファ手段と、前記ローカルバッファ手段にデータを入力し、前記ロー
カルバッファ手段から前記外部メモリ手段にデータを出
力するポート手段とを有する、請求項１記載の画像発生システム。
【請求項３】前記ラスタ処理装置の１つにある前記合成
器手段が、更に、前記画素プロセッサ手段によって使用
されるように前記合成器入力手段から受け取った画素値
を前記補強メモリ装置に記憶するローディング手段を有
する、請求項１記載の画像発生システム。
【請求項４】前記ラスタ処理装置の前記１つが、前記外
部メモリ手段に関連して作動し、ビデオ信号を形成する
ビデオ発生手段を更に有する、請求項１記載の画像発生
システム。
【請求項５】前記プリミティブ・スクリーン・データが
スクリーン座標のプリミティブを画定する数式の係数を
有する、請求項１記載の画像発生システム。
【請求項６】前記ラスタ処理装置が、前記図形プロセッ
サから前記プリミティブ・スクリーン・データを受け取
ることにより前記プリミティブ・スクリーン・データを
アンチエイリアシング用にスーパーサンプリングし、受
け取った各プリミティブ・スクリーン・データ用の調整
されたスクリーン・データを前記増強メモリ装置に繰り
返し供給する画像発生制御手段を更に有する、請求項１
記載の画像発生システム。
【請求項７】前記増強メモリ装置が、形式ｆ（x,y）の
数式の係数を受け取る係数入力手段を更に有し、前記画像プロセッサ手段が、（ｉ）係数を受け取り、数式ｆ（x,y）を評価する結果
を出力する数式評価器と、（ii）前記選択されたスクリーン座標の各々に対応し、
前記数式評価器の結果を受け取り、前記結果に対して算
術演算およびロジカル演算を行う算術ロジックユニット
とを有する、請求項１記載の画像発生システム。
【請求項８】スクリーン内の選択された領域に対するプ
リミティブ・スクリーン・データを、前記複数のラスタ
処理装置間に分配するためのホストプロセッサとホスト
インターフェースをさらに有する、請求項１記載の画像
発生装置。
【請求項９】前記プリミティブ・スクリーン・データ
が、スクリーン内の選択された領域に対するプリミティ
ブ・スクリーン・データであり、更に、前記合成器手段
に関連して作動し、すべての画素値が前記選択された領
域用に前記ラスタ処理装置の各々によって計算された
後、データが前記出力手段によって出力されるように前
記合成器を同期させる画像合成ネットワーク制御手段を
有する請求項１記載のラスタ処理装置。
【請求項１０】前記プリミティブ処理手段が、プリミテ
ィブを受け取り、該プリミティブをスクリーン座標に変
換し、プリミティブ・スクリーン・データを供給する複
数の図形プロセッサを有する、請求項１記載の画像発生
システム。
【請求項１１】（ａ）スクリーン内の選択された領域に
対するプリミティブを受け取り、該プリミティブをスク
リーン座標に変換し、プリミティブ・スクリーン・デー
タとして供給するとともに、ラスタ処理装置のための画
像化情報を供給する複数の図形プロセッサと、（ｂ）前記図形プロセッサから供給される前記プリミテ
ィブ・スクリーン・データから画素値を計算するラスタ
処理装置とを有する画像発生システムであって、該ラスタ処理装置が、前記図形プロセッサから前記プリミティブ・スクリーン
・データを受け取り、該プリミティブ・スクリーン・デ
ータを増強メモリ用のコマンド情報に変換する画像発生
制御手段と、選択されたスクリーン座標の集合に対応している増強メ
モリ装置とを有し、（ｉ）前記増強メモリ装置が、前記選択されたスクリー
ン座標の各々に対して前記コマンド情報を受け取り、画
素値を計算し、画素計算値を供給する画素プロセッサ手
段と、前記画素プロセッサ手段の各々に関連し、データを記憶
する格納手段と、前記画素プロセッサ手段の各々に関連し、前記画素計算
値を記憶する合成器バッファとを有し、（ii）前記増強メモリ装置が、更に、前記ラスタ処理装置に関連している前記図形プロセッサ
とは異なる１つの図形プロセッサと関連しているラスタ
処理装置に含まれている前記増強メモリ装置から画素計
算値を受け取る入力手段と、前記記憶された画素計算値および前記入力手段によって
受け取られた画素値を合成し、合成画素値を決定する合
成手段と、前記合成器手段に関連して作動し、前記合成画素値を出
力する出力手段とを有し、（ｃ）前記ラスタ処理装置の少なくとも１つが、更に、前記増強メモリ装置に関連して作動し、画像化情報を記
憶する外部メモリ手段と、該外部メモリ手段への二重ポートアクセスを可能にする
メモリインターフェース手段と、前記図形プロセッサから前記ラスタ処理装置の１つに提
供される画像化情報を直接前記外部メモリ手段に転送す
る手段とを有する、画像発生システム。
【請求項１２】前記外部メモリ手段を有する前記複数の
ラスタ処理装置の前記１つに関連する前記増強メモリ装
置が、前記画素プロセッサ手段に関連して作動し、前記画素プ
ロセッサ手段からのデータを記憶し、前記画素プロセッ
サ手段にデータを供給するローカルバッファ手段と、前記ローカルバッファ手段にデータを入力し、前記ロー
カルバッファ手段から前記外部メモリ手段にデータを出
力するポート手段とを有する請求項11記載の画像発生システム。
【請求項１３】前記転送手段が、更に前記外部メモリお
よび前記増強メモリ装置からの画像化情報を前記ラスタ
処理装置の１つに関連する前記図形プロセッサに選択的
に転送する手段を有する、請求項11記載の画像発生シス
テム。
【請求項１４】前記画像発生制御手段が、更に前記図形
プロセッサから前記画像化情報を受け取り、該画像化情
報を前記外部メモリに転送する手段を有する、請求項11
記載の画像発生システム。
【請求項１５】前記ラスタ処理装置の前記１つが、更に
外部メモリ手段に関連して作動し、ビデオ信号を形成す
るビデオ発生手段を有する、請求項11記載の画像発生シ
ステム。