JP2552078B2

JP2552078B2 - 増減自在な複数の処理ノードを用いてグラフィックス・データ・ストリームを処理する方法及びシステム

Info

Publication number: JP2552078B2
Application number: JP5166914A
Authority: JP
Inventors: ポール・デービッド・ディニコラ; ジョセフ・シー・カンツ; オマー・マーモウド・ラヒム; デービッド・エイ・ライス; エドワード・マーク・ルディック
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1992-08-07
Filing date: 1993-07-06
Publication date: 1996-11-06
Anticipated expiration: 2011-11-06
Also published as: EP0584982A3; EP0584982A2; JPH06195309A; US5315701A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、広くは、改良したグラ
フィックス計算処理のための方法及びシステムに関し、
より詳しくは、グラフィックス計算処理を実行してデー
タ・ストリームに処理を施すための方法及びシステムに
関するものである。更に詳しくは、本発明は、グラフィ
ックス・データ・ストリームに対して効率的に処理を施
すためのグラフィックス計算処理の方法及びシステムに
関するものである。

【０００２】

【従来の技術及び発明が解決しようとする課題】例えば
パーソナル・コンピュータやワーク・ステーション等
の、データ処理システムにおいて、コンピュータ支援設
計（ＣＡＤ）アプリケーションや、コンピュータ支援生
産（ＣＡＭ）アプリケーション、それにコンピュータ支
援ソフトウェア設計（ＣＡＳＥ）ツール等のアプリケー
ションを走らせることは、ごく一般的に行なわれてい
る。この種のアプリケーションは、技師、科学者、技術
者等をはじめとする様々な職業の人々によって日常的に
使用されている。この種のアプリケーションは通常、複
雑な計算を取り扱うものであり、例えば、有限要素法解
析の計算を行なって構造体の応力モデルを作成するため
等に使用されている。また、この種のアプリケーション
のうちには、化学モデルや分子モデルを作成するために
使用するアプリケーションもある。これらのＣＡＤ／Ｃ
ＡＭ／ＣＡＳＥアプリケーションは一般的に、ユーザへ
情報を受け渡す部分のグラフィックス処理の仕事量が膨
大なものとなっている。また、これらアプリケーション
以外にも、データ処理システムで走らせるアプリケーシ
ョンであって、グラフィックス処理の仕事量が膨大なも
のがあり、例えばデスクトップ・パブリッシング・アプ
リケーション等がこれに該当する。一般的に、グラフィ
ックス処理の仕事量が膨大なアプリケーションを利用す
るユーザは、データ処理システムが、特に高速でグラフ
ィックス情報を提供する能力を備えていることを望むも
のである。

【０００３】グラフィックス・データ・ストリームに処
理を施してビデオ表示端末にグラフィックス・ディスプ
レイを行なう際に、そのグラフィックス・ディスプレイ
を、高速応答性を備えたものとするためには、極めて高
速のグラフィックス処理システムが必要とされる。ま
た、既存の技術を利用して、データ処理システムのマイ
クロコードに変更を加える必要なく、要求性能を提供で
きるようにすることが望まれる。グラフィックスに関係
したアプリケーションを利用しているユーザの要求性能
を満足するためには、これまでは、複数の浮動小数点プ
ロセッサを使用することによって、より高い性能を発揮
するために必要な計算処理能力を得るようにしていた。

【０００４】極めて高速のグラフィックス処理を実行す
るための現在利用可能な方式には、２つの基本方式があ
る。そのうちの一方は、シリーズ方式、または「パイプ
ライン方式」と呼ばれている方式である。パイプライン
方式では、複数のプロセッサを直列に結合して、グラフ
ィックス・データ・ストリームに処理を施すための、１
つの「パイプライン」を構成する。そして、このパイプ
ラインを構成している複数のプロセッサの間で作業負荷
を分担させるようにしている。しかしながらこの方式で
は、そのパイプラインの中の、あるプロセッサとその前
後のプロセッサとの間のインターフェースを、処理すべ
きデータ・ストリームの全体を伝達できるだけの能力を
備えたインターフェースにする必要がある。更に、その
パイプラインを構成するプロセッサの個数が３個以上に
なると、それらプロセッサどうしの間で仕事量をバラン
スさせることが難しくなる。実際に、複数のプロセッサ
に対してタスクが均一に分配されないために、それらプ
ロセッサのうちの１つないし幾つかがアイドル状態とな
ってしまうこともしばしばある。

【０００５】上述の２つの基本方式のうちの、他方の方
式は、並列処理アーキテクチャを利用する方式である。
並列処理アーキテクチャでは、複数のプロセッサの全て
が、同じ入力データ・ストリームにアクセスできるよう
にしておく必要があり、そのためこの方式のシステムで
は、入力バスがシステムのボトルネックになる。この方
式に付随するもう１つの問題は、複数のプロセッサを互
いに結合する際に、それらプロセッサが共用する共用メ
モリの、格納及び読出しの帯域幅を十分に取ることが難
しいということにある。更に加えて、入力データ・スト
リームは本質的にシリアルなストリームであるため、入
力データ・ストリームを分解して並列処理が可能なフォ
ーマットにする必要があるが、多階層形の並列処理シス
テムにおいては、この入力データ・ストリームの分解を
どのように行なうべきかということも問題になる。この
点について更に詳しく説明すると、１つのデータ・スト
リームを分解して複数の断片にする際には、どのように
同期を取るか、即ち、時間的順序を維持するかが問題に
なり、更には、必ずシリアルに処理しなければならない
グラフィックス属性の処理をどうするかということも問
題になる。

【０００６】以上の事情から、これまで利用可能であっ
た上記のいずれの方式のシステムにおいても、その処理
能力が必ずしも効率的に利用されないという事態が発生
するおそれがあった。従って、グラフィックス処理シス
テムにおける方法及びシステムを、グラフィックス・デ
ータ・ストリームに対して効率的に処理を施せるものと
することが望まれている。

【０００７】従って本発明の目的の１つは、改良したグ
ラフィックス計算処理のための方法及びシステムを提供
することにある。本発明の更なる１つの目的は、グラフ
ィックス計算処理を実行してデータ・ストリームに処理
を施すための方法及びシステムを提供することにある。
本発明の更なる１つの目的は、グラフィックス・データ
・ストリームに対して効率的に処理を施すためのグラフ
ィックス計算処理の方法及びシステムを提供することに
ある。

【０００８】本発明の他の目的は、必ず順序をなして処
理しなければならないグラフィックス属性デ−タの処理
を効率よく処理するためのグラフィックス・デ−タ・ス
トリ−ムの処理方法及びシステムを提供することにあ
る。

【課題を解決するための手段】以上の目的は、以下に説
明するようにして達成される。即ち、本発明は、デ−タ
処理システムにおける、グラフィックス・デ−タ・スト
リ−ムを処理するための方法及びシステムを提供するも
のである。このデ−タ処理システムは、複数の処理ノ−
ドとグラフィックス表示装置とを備えている。このデ−
タ処理システムでは、グラフィックス・デ−タ・ストリ
−ムを区分して、複数の処理ノ−ドに処理させるための
複数のデ−タ・セグメント即ち作業グル−プにする。続
いて、それら複数のデ−タ・セグメントを、それらを処
理させるために複数の処理ノ−ドへ分配する。また、あ
る１つのデ−タ・セグメントを、ある１つの処理ノ−ド
が受け取ったことに応答して、そのデ−タ・セグメント
を処理して処理済デ−タ・セグメントを生成する。更
に、複数の処理済デ−タ・セグメントを再組立して処理
済グラフィックス・デ−タ・ストリ−ムにする。この処
理済グラフィックス・デ−タ・ストリ−ムをグラフィス
表示装置に結合する。本発明は、更に、このようなグラ
フィックス処理システム及びグラフィックス・デ−タ・
ストリ−ムの処理方法において、複数の前記各処理ノ−
ドに結合したメモリにグラフィックス属性デ−タを各作
業グル−プ毎にコピ−しておき、かつ、この属性情報は
属性の処理毎に累積または更新されるようにしておき、
そして、各処理ノ−ドにおける１つの作業グル−プに対
する処理を、先行する作業グル−プに関して前記メモリ
内に格納されているグラフィックス属性デ−タを参照し
ながら実行する点に特徴がある。

【０００９】本発明の以上の目的と特徴と利点、並びに
その他の目的と特徴と利点は、以下の詳細な説明によっ
て明らかとなる。

【００１０】

【実施例】これより添付図面を参照しつつ順次説明をし
て行く。先ず図１について説明すると、同図に示したの
は、本発明の好適実施例をその中で実施することのでき
るコンピュータ・システムの一例の外観図である。図示
のコンピュータ・システム５０は、システム本体装置５
２と、ビデオ表示端末５４と、キーボード５６と、マウ
ス５８とを含んでいる。このコンピュータ・システム５
０は、適当なコンピュータを使用して構成することがで
き、具体的な例としては、例えば「ＩＢＭ・ＰＳ／２」
コンピュータや、「ＩＢＭ・ＲＩＳＣシステム／６００
０」コンピュータ等を利用することができる。これらは
いずれもＩＢＭ社の製品である。尚、「ＲＩＳＣシステ
ム／６０００」はＩＢＭ社の商標であり、「ＰＳ／２」
はＩＢＭ社の登録商標である。本発明の好適実施例は、
図示例以外のその他の種類のデータ処理システムの中で
実施することも可能であり、例えば、インテリジェント
・ワーク・ステーションや、ミニ・コンピュータ等にお
いて実施することも可能である。

【００１１】次に図２について説明する。同図に示した
のは、本発明の好適実施例をその中で実施することので
きるコンピュータ・システム５０の構成要素のうちの、
選択した幾つかの要素を示したブロック図である。シス
テム本体装置５２は、好ましくは、このシステム本体装
置５２の中の様々な構成要素を互いに接続してそれら構
成要素どうしの間の通信を行なうシステム・バス６０を
備えたものとするのが良い。システム・バス６０にはマ
イクロプロセッサ６２を接続してあり、また、システム
・バス６０には更に、数値演算用コプロセッサ６４を接
続しておいても良い。システム・バス６０には更に、Ｄ
ＭＡコントローラ６６を接続してあり、このＤＭＡコン
トローラ６６は、様々なデバイスが、大量の入出力転送
を行なう際に、マイクロプロセッサ６２からサイクルの
専用権を譲り受けられるようにするためのものである。

【００１２】マイクロプロセッサ６２のアドレス空間の
中の６４０Ｋバイトから１Ｍバイトまでの領域には、リ
ード・オンリ・メモリ（ＲＯＭ）６８を割り当ててあ
る。このＲＯＭ６８はシステム・バス６０に接続してあ
り、更にランダム・アクセス・メモリ（ＲＡＭ）７０も
システム・バス６０に接続してある。ＲＯＭ６８には、
電源投入時自己試験（ＰＯＳＴ）機構と、基本入出力シ
ステム（ＢＩＯＳ）とを書き込んであり、これら機構及
びシステムは、ディスク・ドライブやキーボード等に関
するハードウェアの動作を制御する。システム・バス６
０には更に、ＣＭＯＳ・ＲＡＭ７２を接続してあり、こ
のＣＭＯＳ・ＲＡＭ７２には、システムの構成情報を記
憶させておくようにしている。

【００１３】システム・バス６０には更に、メモリ・コ
ントローラ７４、バス・コントローラ７６、並びに割込
みコントローラ７８を接続してあり、これらのものは、
様々な周辺装置、アダプタ、ないしデバイスどうしの間
でシステム・バス６０を介して行なわれるデータ転送
の、そのデータの流れの制御に関与している。システム
本体装置５２は更に、様々な入出力（Ｉ／Ｏ）コントロ
ーラを含んでおり、それらＩ／Ｏコントローラには、例
えば、キーボード／マウス・コントローラ８０、ビデオ
・コントローラ８２、パラレル・コントローラ８４、シ
リアル・コントローラ８６、それにディスケット・コン
トローラ８８等がある。キーボード／マウス・コントロ
ーラ８０は、キーボード９０及びマウス９２のためのハ
ードウェア・インターフェースを提供している。ビデオ
・コントローラ８２は、ビデオ表示端末９４のためのハ
ードウェア・インターフェースを提供している。パラレ
ル・コントローラ８４は、プリンタ９６等のデバイスの
ためのハードウェア・インターフェースを提供してい
る。シリアル・コントローラ８６は、モデム９８等のデ
バイスのためのハードウェア・インターフェースを提供
している。ディスケット・コントローラ８８は、フロッ
ピーディスク装置１００のためのハードウェア・インタ
ーフェースを提供している。システム・バス６０には更
に、例えばディスク・コントローラ１０２等の拡張カー
ドを付加することができ、このディスク・コントローラ
１０２は、ハードウェアディスク装置１０４のためのハ
ードウェア・インターフェースを提供する。更に、幾つ
かの空きスロット１０６を用意してあり、これら空きス
ロット１０６を利用することによって、更にその他の周
辺装置、アダプタ、デバイス等を、システム本体装置５
２に付加することができる。本発明の好適実施例は、こ
の空きスロット１０６の中に装着するグラフィックス・
アダプタの形で、このシステム本体装置５２に付加でき
るようにしたものである。

【００１４】当業者には容易に理解されるように、図２
に例示したハードウェアは、実際の用途が具体的にどの
ようなものであるかに応じて、様々に異なった形態を取
り得るものである。例えば、その他の種類の周辺装置
（その幾つかの例を挙げるならば、光ディスク媒体、音
響アダプタ、ＰＡＬないしＥＰＲＯＭ等のチップ・プロ
グラミング・デバイス、等々がある）を、図２に例示し
たハードウェアに追加して使用したり、或いは、図２に
例示したハードウェアの代わりに使用したりすることも
可能である。

【００１５】本発明の好適実施例では、複数のプロセッ
サの配列を、パラレルな複数のパイプラインを構成する
ような配列とし、それによって複数の処理ノードを形成
するようにしている。そして、これら複数の処理ノード
に、データ処理システムが行なうべきグラフィックス計
算処理の全体のうちの、大部分を実行させるようにして
いる。複数のプロセッサは、入力通信経路からデータを
受け取り、必要な計算処理（例えば、変換、クリッピン
グ、高輝度表示処理、等々）を実行する。処理ノードの
中の各々プロセッサは、中間データを、その処理ノード
の中の後続のプロセッサへ受け渡して、その後続のプロ
セッサに、計算処理の続きを実行させることができるよ
うにしている。これにより、１つの処理ノードの中の複
数のプロセッサの間で計算処理を分担できるようにして
いる。本発明の好適実施例においては、各プロセッサ
は、そのプロセッサに専用のメモリを備えており、ま
た、通信経路は、プロセッサがコードやデータ・メモリ
にアクセスする能力に対して影響を及ぼすことなくデー
タの転送を行なえるように設計してある。

【００１６】次に図３について説明する。同図に示した
のは、本発明の好適実施例に従って構成したノード式プ
ロセッサ構成体３００のブロック図である。このノード
式プロセッサ構成体３００は、バス・インターフェース
３０２を介して１つないし複数のグラフィックス・デー
タ・ストリームを受け取る。バス・インターフェース３
０２はデータ処理システムのシステム・バスに接続して
あり、この接続は当業者には周知の既存の技術によって
行なっている。グラフィックス・データ・ストリーム
は、それを分割し、即ち区分することによって、複数の
作業要素（ＷＥ）に分けることができる。作業要素には
３通りの種類がある。その第１は「描画プリミティブ」
という作業要素であり、これは、線、多角形、三角形、
テキスト、等々を描画することを命じるコマンドであ
る。第２は「属性プリミティブ」であり、これは属性を
変更することを命じるコマンドであって、「属性変更」
ともいう。第３は「内容プリミティブ」であり、これ
は、あるディスプレイ領域即ちウィンドウに関する内容
情報である。

【００１７】グラフィックス・データ・ストリームは、
一旦、作業要素ＲＡＭ（ＷＥＲＡＭ）３０４の中に格
納できるようにしてある。本発明の好適実施例において
は、グラフィックス・データ・ストリームを分解、即ち
区分して複数のセグメントにする作業は、属性プロセッ
サ（ＡＰ）３０６に行なわせている。こうして得られた
セグメントは「作業グループ（ＷＧ）」と呼ばれ、１つ
の作業グループには、１つないし幾つかの作業要素が包
含される。１つの作業グループの中に包含される作業要
素の個数を定めるファクタには様々なものがあり、例え
ば、１つの作業グループを処理するのにかかる処理時間
と、複数の作業要素をグループ化して１つの作業グルー
プにまとめるためにかかる処理時間との比較というの
も、１つのファクタである。属性プロセッサ３０６はＲ
ＡＭ３０８に結合しており、このＲＡＭ３０８は、属性
プロセッサ３０６が使用する様々な命令やデータを格納
しておくためのメモリである。また、属性プロセッサ３
０６は、データの転送を、例えばＤＭＡコントローラや
プロセッサ等の、他のデバイスに行なわせることもで
き、或いは、属性プロセッサ３０６それ自体の中に備え
た内部構成要素によって行なうこともできるようにして
ある。属性プロセッサ３０６は更に、それ自体でグラフ
ィックス処理を実行した上で、複数の処理ノードへ、そ
れら処理ノードに処理させる作業と併せて現在属性デー
タを供給することもできる。

【００１８】ビデオＲＡＭ（ＶＲＡＭ）３１０は、本発
明の好適実施例においては、データ・ストリームから得
た属性情報を、フォント情報並びにその他の内容関連デ
ータと共に、処理済属性プリミティブの形で格納してお
くためのメモリである。グラフィックス・データ・スト
リームからＶＲＡＭ３１０の中へ属性データをコピーす
る作業は、属性プロセッサ３０６に行なわせている。共
用ＲＡＭ３１２は、フォント・データ並びに内容データ
を格納しておくためのメモリである。ＶＲＡＭ３１０と
共用ＲＡＭ３１２とはいずれも、例えばグラフィックス
内容情報、フォント、属性データ等の、大域的アクセス
が行なわれるデータを格納しておくための共用メモリ領
域である。このタイプのメモリは、全てのプロセッサか
らアクセスすることができるが、アクセス頻度は比較的
低頻度である。そのため、このタイプのメモリへのアク
セスのためのバスの競合は、たとえ発生したにしても、
性能には殆ど影響を及ぼさない程度のものでしかない。

【００１９】属性プロセッサ３０６は、複数の処理ノー
ドへ作業グループを分配する。分配先の処理ノードは、
第１ノード、第２ノード、... 、第Ｎノードであり、こ
の分配は通信経路３１３を介して行なわれる。本発明の
好適実施例では、プロセッサどうしの間でのデータ転送
は、この通信経路３１３を介して行なうようにしてい
る。この種の通信経路は、メモリ・ポートで構成するこ
ともでき、また、当業者には周知の、あるプロセッサか
ら他のプロセッサへのデータ経路を提供することのでき
る、任意の種類のハードウェアを用いて構成しても良
い。複数の処理ノードは、その各々が、ＲＡＭ３１６に
結合したプロセッサ３１４と、ＲＡＭ３２０に結合した
プロセッサ３１８とを含んでいる。また更に、それら２
つのプロセッサ３１４と３１８とをシリアル結合してあ
る。これらプロセッサ３１４及び３１８には、本発明の
好適実施例では、テキサス・インスツルメント社が製造
している「ＴＭＳ３２０Ｃ４０型プロセッサ」を使用し
ている。尚、この「ＴＭＳ３２０Ｃ４０型プロセッサ」
のプログラミングの仕方、並びにその使用法についての
情報は、テキサス・インスツルメント社が一般向けに発
行している「ＴＭＳ３２０Ｃ４ｘユーザーズ・ガイド」
という文献に掲載されている。ＲＡＭ３１６は、プロセ
ッサ３１４に関係した命令及びデータを格納しておくた
めのメモリ、またＲＡＭ３２０は、プロセッサ３１８に
関係した命令及びデータを格納しておくためのメモリで
ある。

【００２０】本発明の好適実施例においては、処理ノー
ドの総数は、様々な個数に設定することが可能である。
また、図示例では、１つの処理ノードに装備しているプ
ロセッサの個数は２個であるが、１つの処理ノードに装
備するプロセッサの個数をこれ以外の個数にすることも
可能である。更に、１つの処理ノードに２個以上のプロ
セッサを装備する場合に、同一の処理ノードの中の全て
のプロセッサを同じ形式ないし同じ作りのプロセッサに
揃えることは必ずしも必要ではない。

【００２１】属性プロセッサ３０６は通信経路を介して
処理ノードと結合することができ、この通信経路は、Ｆ
ＩＦＯであっても良く、共用メモリ領域であっても良
く、通信ポート（シリアルとパラレルのいずれでも良
い）であっても良く、更には、プロセッサからプロセッ
サへの通信経路として使用できるものであれば、当業界
において周知のいかなる種類の通信経路でも良い。加え
て、処理ノードの中の各々のプロセッサが、その処理ノ
ードの中でそのプロセッサよりも下流側に配置されてい
るプロセッサへの同様の通信経路を備えているようにし
ても良い。いずれの場合にも、プロセッサどうしの間の
結合は、当業界において周知の様々な技法によって実現
することができる。尚、図示例では、プロセッサどうし
を接続するために、「ＴＭＳ３２０Ｃ４０型プロセッ
サ」に装備されている標準通信経路を使用している。

【００２２】処理ノードの中のプロセッサどうしは、当
業界において周知の構成のバス・トランシーバ３２１
ａ、３２１ｂ、及び３２１ｃによって分離可能にしてあ
る。これらバス・トランシーバは、処理ノードの中のプ
ロセッサの、ＶＲＡＭ３１０ないし共用ＲＡＭ３１２へ
のアクセスを規制している。即ち、これらバス・トラン
シーバを閉成状態にすれば、連続した単一のバスを形成
することができ、一方、これらバス・トランシーバを開
放状態にすれば、互いに分離した２つのバスを形成する
ことができる。それらバス・トランシーバの全てが開放
状態にあるときには、第１ノード、第２ノード、... 第
Ｎノードのプロセッサ３１８は、共用ＲＡＭ３１２に対
してアクセス可能となっており、一方、第１ノード、第
２ノード、... 第Ｎノードのプロセッサ３１４は、ＶＲ
ＡＭ３１０に対してアクセス可能になっている。この状
態から全てのバス・トランシーバを閉成すると、それら
処理ノードの中の全てのプロセッサが、共用メモリ３１
２とＶＲＡＭ３１０との両方に対してアクセス可能にな
る。尚、図示例ではバス・トランシーバの個数を３個と
し、共用ＲＡＭの個数を１個とし、ＶＲＡＭの個数も１
個としてあるが、本発明の好適実施例では、バス・トラ
ンシーバの個数を、これ以外の個数にすることも、ＲＡ
Ｍの個数やタイプを様々なものとすることも可能であ
る。

【００２３】夫々の処理ノードの中で夫々の作業グルー
プの処理が完了するのにつれて、処理済作業グループ
が、それら処理ノードから、バス３２４を介して、リオ
ーダ装置３２２へ向けて送出されて行く。尚、この送出
に使用されるバス３２４は、プロセッサがＲＡＭ３２０
にアクセスする際にも使用される。図示例では、リオー
ダ装置３２２には、特定用途向け集積回路（applicatio
n specific integratedcircuit:ＡＳＩＣ）を使用して
いる。ただし、本発明の好適実施例においては、リオー
ダ装置３２２は、別に備えたプロセッサによって構成し
ても良く、また、複数の処理済作業グループを互いに結
合する再組立のための、当業界においては周知のある種
の専用構成のロジック回路としても良い。このリオーダ
装置３２２では、複数の処理済作業グループが結合さ
れ、即ち再組立されることによって、処理済グラフィッ
クス・データ・ストリームが生成され、このグラフィッ
クス・データ・ストリームは、ラスタ・サブシステム３
２６へ送られる。ラスタ・サブシステム３２６は、ビデ
オ表示端末上においてディスプレイを実行するための、
専用構成のＡＳＩＣないしプロセッサとすることができ
る。本発明の好適実施例では、処理済作業グループのリ
オーダ、即ち再組立を可能にするために、各々の作業グ
ループに同期化用タグないし順序番号を付与するように
している。各作業グループに同期化用タグを付与した場
合には、リオーダ装置３２２は、複数の作業グループを
然るべき順序に並べて結合して１つのデータ・ストリー
ムを生成する際に、それら作業グループの同期化用タグ
に基づいて、その順序を判定することができる。

【００２４】場合によっては、複数の作業グループが並
んでいる順序が非常に重要なこともあり、また場合によ
っては、作業グループの順序が重要でなく、どうでも良
いということもあり得る。そのため、本発明の好適実施
例では、グラフィックス・データ・ストリームを複数の
セグメントに分割する作業を行なわせている属性プロセ
ッサ３０６に、リオーダ装置３２２で行なわれるセグメ
ント（即ち、作業グループ）のリオーダ即ち再組立の作
業における、順序判定も行なわせることができるように
している。更に、本発明の好適実施例においては、この
属性プロセッサ３０６に、作業グループの順序が重要か
否かを判定させることや、場合によっては、各々の作業
グループに同期化用タグないし順序番号を付与する作業
も行なわせることができるようにしている。順序が重要
か否かの判定は様々なファクタに基づいて行なわれ、例
えば、処理しようとしているグラフィックス・データ・
ストリームのタイプ等も、そのファクタのうちの１つで
ある。また、本発明の好適実施例では、同期化用タグな
いし順序番号は、リオーダ装置３２２が、処理済のグラ
フィックス・データをラスタ・サブシステム３２６へ送
出する際に、その送出の順序を判定するためにも使用さ
れている。尚、時間的な順序はどうでもよいという作業
グループが複数ある場合に、それら作業グループの全て
に同一の同期化用タグないし順序番号を付与するように
しても良い。

【００２５】グラフィックス・データ・ストリームは、
多重化されたものであっても良い。換言すれば、ある１
つのグラフィックス・データ・ストリームが２種類以上
のグラフィックス・データ・フォーマットを包含してお
り、それらグラフィックス・データ・フォーマットの各
々が、個々にグラフィックス・データ・ストリームの形
を取っており、それら個々のグラフィックス・データ・
ストリームによって、多重化された１つのグラフィック
ス・データ・ストリームが形成されているという構成
の、グラフィックス・データ・ストリームであっても良
いということである。更には、この多重化された１つの
グラフィックス・データ・ストリームは、同一種類のグ
ラフィックス・データ・フォーマットを有するグラフィ
ックス・データ・ストリームを２つ以上包含しているも
のであっても良い。本発明の好適実施例では、リオーダ
装置並びに属性プロセッサを適宜プログラムして、処理
ノードの選択的なグループ化を行なわせるという方法
で、多重化された１つのグラフィックス・データ・スト
リームの中の種々のグラフィックス・データ・ストリー
ムに対して処理を施せるようにしている。この選択的な
グループ化という方法を用いるのは、例えば、内容の切
替えを行なうのにかかる時間、即ち、１つのグラフィッ
クス・データ・ストリームから別のグラフィックス・デ
ータ・ストリームへの切替えを行なうのにかかる時間
が、データ・ストリームを処理するための作業負荷とい
うファクタよりも、大きなファクタである場合等であ
る。更に、本発明の好適実施例では、オンライン診断の
結果、１つないし幾つかの処理ノードが故障しているこ
とが検出されたときにも、この選択的なグループ化とい
う方法を利用するようにしている。

【００２６】図３のプロセッサ構成体３００は更に制御
プロセッサ（ＣＰ）３２８を備えており、この制御プロ
セッサ３２８はＲＡＭ３３０に結合している。制御プロ
セッサ３２８は、このＲＡＭ３３０を、情報を格納し命
令を保存しておくために使用している。制御プロセッサ
３２８は更に、属性プロセッサ３０６、リオーダ装置３
２２、並びに、ラスタ・サブシステム３２６に結合して
いる。制御プロセッサ３２８は、ラスタ・サブシステム
３２６及びバス・インターフェース３０２の管理を行な
っている。制御プロセッサ３２８は更に、ある種の処
理、例えばビット・ブロック転送処理（BitBLT処理）等
の実行にも参加する。BitBLT処理とは、複数のビットか
ら成るビット・ブロックを、ある場所から他の場所へ
（例えば、スクリーンからスクリーンへ、スクリーンか
らシステムへ、或いは、システムからスクリーンへ）コ
ピーする処理である。このBitBLT処理が実行されるとき
には、制御プロセッサ３２８は、ラスタ・サブシステム
３２６、及びバス・インターフェース３０２の制御と、
そのBitBLT処理のためのＤＭＡ動作の設定とを担当す
る。

【００２７】属性プロセッサ３０６は、入力ＦＩＦＯ、
メモリ、或いはその他の入力経路から、作業を読み出
し、或いは読み取った上で、複数の作業グループを夫々
適当な処理ノードへ転送する。属性プロセッサ３０６は
更に、複数の作業グループが処理ノードで処理された後
に、それによって得られた複数の処理済作業グループを
リオーダすることができるように、それら作業グループ
に順序番号を包含させる等の処理も担当している。更に
加えて、属性プロセッサ３０６は、ある種のグラフィッ
クス・データ・ストリームに関しては、ディスプレイ・
リスト処理や、非描画処理も実行できるようにしてあ
る。

【００２８】このように、本発明の好適実施例において
は、処理ノードへ向けてデータを送出する作業をプロセ
ッサ（即ち、属性プロセッサ３０６）に行なわせるよう
にしているため、夫々の処理ノードの中の最上位のプロ
セッサどうしが、共用入力資源にアクセスしようとして
競合することが回避されている。そして、その結果、資
源の入手を待つ間プロセッサが動作を停止してしまう時
間を、短縮することが可能になっている。

【００２９】通常、グラフィックスの属性の処理（属性
処理）を幾つも行なう場合には、それら複数の属性処理
を順次方式で（即ちシリアルに）進めて行く必要があ
る。そこで、属性プロセッサを、プロセッサのアイドル
時間を短縮することができるものであることに加えて、
更に、複数の属性処理をシリアルに進めて行くことがで
きるものとしてある。ここで更に問題となるのは、ある
１つの作業要素を実行するためには、その特定の作業要
素に影響を及ぼす先行する属性の全てを、その作業要素
の実行より前に処理完了しておかねばならないというこ
とである。また、作業要素のうちには、後続の作業要素
に影響を及ぼす属性変更を含んでいるものもある。この
ような事情から、複数の作業要素をパラレルに処理する
ことは容易でなく、その原因はなによりも、パラレル・
アーキテクチャにおいて、あるプロセッサがある１つの
作業要素の処理を開始するためには、その作業要素より
以前の作業要素の属性をも含めた、先行する全ての属性
の処理を完了させてからでなければ、その作業要素の処
理を開始することができないことにある。この点に関し
て、本発明の好適実施例では、属性処理を属性プロセッ
サに実行させることによって、複数の作業要素を夫々の
処理ノードへさっさと送出してしまえるようにしてお
り、これは、属性プロセッサが行なう属性処理は迅速に
完了するため、処理ノードにおける作業要素の処理の完
了に先んじて属性処理が完了するということを利用した
ものである。これが可能であるのは、一般的に、作業要
素の処理にかかる時間よりも、属性処理にかかる時間の
方が短いからである。そのため、属性プロセッサが、多
くの場合に同時に並行して処理を実行している処理ノー
ドに先んじて、みずからが実行している属性処理を完了
することが通常可能だからである。

【００３０】本発明の更なる１つの利点は、本発明のア
ーキテクチャによれば、一般に知られている様々なグラ
フィックス・データ・フォーマット（例えば「ＧＬ」、
「ＰＨＩＧＳ」、「ＸＷｉｎｄｏｗｓ」、「５０８
０」等々）の処理を効率的に行なえることにある。本発
明が取り扱うことのできる多重化されたグラフィックス
・データ・ストリームは、２つ以上のグラフィックス・
データ・ストリームを包含しているものであっても良
く、しかも、それらグラフィックス・データ・ストリー
ムの各々が異なったグラフィックス・データ・フォーマ
ットを有するものであっても良い。例えば、ある１つの
グラフィックス・データ・ストリームが、１つのＧＬデ
ータ・ストリームと、１つのＰＨＩＧＳデータ・ストリ
ームとを包含していても良い。更に、ある１つのグラフ
ィックス・データ・ストリームが、例えば、２つのＧＬ
データ・ストリームを包含していても良い。

【００３１】次に、図４について説明する。同図に示し
たのは、本発明の好適実施例において、属性プロセッサ
が、複数の作業グループを、それらを処理させるために
夫々の処理ノードへ向けて送出する際の動作を示したブ
ロック図である。グラフィックス・データ・ストリーム
から得られたデータが、作業要素ＲＡＭ（ＷＥＲＡ
Ｍ）４００の中に格納されている。属性プロセッサ（Ａ
Ｐ）４０２は、グラフィックス・データ・ストリームを
区分して、複数の作業グループＷＧ１、ＷＧ２、ＷＧ
３、ＷＧ４、ＷＧ５、及び、ＷＧ６にする。本発明の好
適実施例では、これら作業グループは、最初に利用可能
になった処理ノードへ分配、即ち送出するようにしてい
る。ただし、これ以外の分配方式を採用することも可能
である。

【００３２】属性プロセッサ４０２は更に、各々の作業
グループごとに、属性プリミティブ（即ち、属性変更）
に該当する作業要素を捜し出すためのサーチを行ない、
属性プリミティブ（即ち、属性変更）の処理を行ない、
そして、処理済の属性情報をＶＲＡＭ４０４の中に格納
する。属性プリミティブに該当する作業要素を捜し出す
ためのサーチは、属性プロセッサ４０２がＶＲＡＭ４０
４の中から作業要素を１つずつ取り出す際に行なうよう
にすることもできる。図示例では、作業グループＷＧ１
〜ＷＧ６の夫々に包含されていた、属性プリミティブに
該当していた作業要素を処理したものを、 WG 1 Attri
b、 WG 2 Attrib、 WG 3 Attrib、 WG 4Attrib、 WG 5
Attrib、及び WG 6 Attribで表わしている。図示の如
く、これら属性プリミティブは、グラフィックス・デー
タ・ストリームが分解され、そこから取り出され、そし
て処理されたものであり、処理済の属性プリミティブは
ＶＲＡＭ４０４の中に格納され、この格納は、処理済の
属性プリミティブをＶＲＡＭ４０４の中へコピーするプ
ロセスである属性タスク・プロセス４０５をとおして行
なわれる。ＶＲＡＭ４０４の中に格納されている属性情
報のうちの第１番目のものは初期属性状態であり、属性
状態は、以後、属性プリミティブを包含している作業要
素が処理されてＶＲＡＭ４０４の中に格納される都度、
変化して行く。尚、初期属性状態の時点より後の、任意
の時点における属性状態を、累積属性状態と呼んでい
る。

【００３３】処理ノードへ送出される作業グループの各
々には、その作業グループに関係した未処理のままの属
性プリミティブが包含されている。また、それら作業グ
ループの各々には、ＶＲＡＭ４０４の中へコピーされて
いる累積属性状態を指し示すポインタを付随させてあ
る。これによって、いずれの処理ノードからでも、ＶＲ
ＡＭ４０４の中に格納されている全ての属性状態にアク
セスできるようにしてあり、更にそれによって、各々の
作業グループを、その作業グループより先行している全
ての属性プリミティブを考慮に入れて処理することがで
きるようにしている。もしかりに、先行する属性プリミ
ティブを考慮に入れて処理を行なうことが可能でなかっ
たならば、先行する属性プリミティブによって規定され
る現在属性状態を判定するために、ある処理ノードが別
の処理ノードの作業の完了を待たねばならないという事
態が生じるおそれがある。

【００３４】この点について、具体的な例を挙げて説明
するならば、例えば、第１の作業グループに包含されて
いる一連の作業要素が、３本の直線を描画し、カラーを
青に変更するというものであり、一方、第２の作業グル
ープに包含されている一連の作業要素が、３本の直線を
描画するというだけで、属性データを含んでいないもの
であったとする。この場合、第２の作業グループを処理
する処理ノードは、描画する３本の直線を、青で描画す
べきであるということを知らなければ、処理を行なうこ
とができない。それゆえ、ＶＲＡＭ４０４の中に格納さ
れている累積属性状態を指し示すポインタを付随させる
ことによって、各々の処理ノードが、その作業グループ
より前に、どのような属性変更が行なわれているかを判
定できるようにしているのである。

【００３５】属性プロセッサ４０２は、以上のようにし
て作業グループを形成することに加えて、処理ノードへ
の作業グループの転送の制御も行なっている。図示例で
は、属性プロセッサ４０２は、データ転送プロセス４０
８を実行することによって作業グループＷＧ１を処理ノ
ード４０６へ転送している。また、データ転送プロセス
４１２を実行することによって作業グループＷＧ２を処
理ノード４１０へ転送し、データ転送プロセス４１６を
実行することによって作業グループＷＧ３を処理ノード
４１４へ転送し、更に、データ転送プロセス４２０を実
行することによって作業グループＷＧ４を処理ノード４
１８へ転送している。各々の処理ノードは、送られてき
た作業グループに対して、ＶＲＡＭ４０４の中に格納さ
れている属性データを参照して処理を施す。ＶＲＡＭ４
０４は共用メモリであり、そのため、全ての処理ノード
が、このＶＲＡＭ４０４にアクセスして、各々の作業グ
ループを適切に処理するために必要な属性情報を入手す
ることができる。各々の作業グループが、夫々の処理ノ
ードにおいて処理完了したならば、処理済のそれら作業
グループが結合され、即ち再組立が行なわれて、処理済
グラフィックス・データ・ストリームが生成される。本
発明の好適実施例においては、この処理済グラフィック
ス・データ・ストリームを、ラスタ・サブシステムを介
してグラフィックス表示装置に結合することによって、
ユーザへのディスプレイを行なうようにしている。

【００３６】次に、図５について説明する。同図に示し
たのは、本発明の好適実施例における、複数の作業グル
ープを、それらを処理させるために処理ノードへ向けて
送出するための方法及びシステムの、ハイレベルのフロ
ーチャートである。この方法及びシステムは、本発明の
好適実施例では、処理ノードへの作業グループの送出を
制御するためのマイクロコードの形で構成することがで
きる。また、本発明の好適実施例では、処理対象のグラ
フィックス・データ・ストリームは、実際に、互いに異
なったタイプ、或いは互いに同一のタイプの、複数のグ
ラフィックス・データ・ストリームをを包含しているも
のであって構わない。更に、本発明の好適実施例では、
本発明の方法及びシステムが、多重化されたグラフィッ
クス・データ・ストリームを受け取って処理できるもの
となっている。

【００３７】図示のプロセスはブロック５００から開始
し、このブロック５００では、グラフィックス・データ
・ストリームの形を取っている複数の作業要素を受け取
る。受け取ったそれら作業要素は、作業要素ＲＡＭの中
に格納しておく。続いて処理の流れはブロック５０２へ
進み、このブロック５０２では、作業要素ＲＡＭの中に
格納されている作業要素のうちの、続く次の作業要素を
取り出す。続いて処理の流れはブロック５０４へ進み、
このブロック５０４では、その取り出した作業要素が属
性プリミティブ（即ち属性変更）であるか否かを判定す
る。その作業要素が属性変更であったならば、処理の流
れはブロック５０６へ進み、そこでは、その属性の処理
を行なった上で、ＲＡＭの中の現在属性の更新を行な
う。

【００３８】続いて処理の流れはブロック５０８へ進
み、このブロック５０８では、作業グループが、処理ノ
ードへ向けて送出しても良い十分な大きさとなった否か
を判定する。ここで説明をブロック５０４に戻し、ブロ
ック５０４での判定の結果、取り出した作業要素が属性
プリミティブ（即ち属性変更）ではないと判定された場
合には、処理の流れはブロック５０４から直接ブロック
５０８へ進む。ブロック５０８での判定の結果、その作
業グループが、処理ノードへ向けて送出しても良い十分
な大きさになっていると判定されたならば、処理の流れ
はブロック５１０へ進み、このブロック５１０では、現
在属性状態をＶＲＡＭの中へコピーする。続いて処理の
流れはブロック５１２へ進み、そこでは、ＶＲＡＭの中
の属性プリミティブのコピーを指し示すポインタをその
作業グループに付加する。続いて処理の流れはブロック
５１４へ進み、そこでは、その作業グループに同期化用
タグを付加する。

【００３９】続いてブロック５１６において、空いてい
る処理ノードが存在しているか否かを判定する。空いて
いる処理ノードが存在していなかったならば、処理の流
れはブロック５１８へ進み、このブロック５１８では、
その作業グループをリンク・リストへリンクする。この
リンク・リストは、未だ処理ノードによって処理されて
いない全ての作業グループを記入しておくためのリスト
である。このリンク・リストを参照して、ある処理ノー
ドが処理に使用できる状態になったときに、その処理ノ
ードへ作業グループを分配するようにしている。続いて
処理の流れはブロック５０２へリターンする。

【００４０】説明をブロック５０８へ戻し、このブロッ
ク５０８での判定の結果、その作業グループが、処理ノ
ードへ向けて送出しても良い十分な大きさにはなってい
ないと判定された場合には、処理の流れはそこからブロ
ック５２０へ進み、このブロック５０２では、その作業
グループに作業要素を追加し、この後、処理の流れはブ
ロック５０２へリターンして、更に次の作業要素の取り
出しを行なう。

【００４１】説明をブロック５１６へ戻し、このブロッ
ク５１６での判定の結果、空いている処理ノードが存在
していると判定されたならば、処理の流れはブロック５
２２へ進み、このブロック５２２では、その空き状態の
処理ノードへの作業グループの転送を開始する。続いて
処理の流れはブロック５０２へリターンし、更に次の作
業要素の取り出しを行なう。

【００４２】次に図６について説明する。同図に示した
のは、リンク・リストに記入されている作業グループを
処理ノードへ向けて送出するための方法及びシステム
の、ハイレベルのフローチャートである。図５のブロッ
ク５２２において、処理ノードへの作業グループの転送
を開始しようとするときに、この図６のプロセスが開始
する。図６に示したように、このプロセスはブロック６
００から開始し、このブロック６００では、処理ノード
への作業グループの転送が完了するのを待つ。そして、
その転送が完了したならば、処理の流れはブロック６０
２へ進み、このブロック６０２では、リンク・リストの
中に記入されている作業グループがあるか否かを判定す
る。リンク・リストの中に記入されている作業グループ
が１つでもあったならば、処理の流れはブロック６０４
へ進み、このブロック６０４では、リンク・リストに記
入されている作業グループのうちの１つをいずれかの処
理ノードへ転送する転送処理を開始する。本発明の好適
実施例では、リンク・リストに記入されている作業グル
ープを処理ノードへ転送する転送処理を、先入れ先出し
方式で行なうようにしている。続いて処理の流れはブロ
ック６００へリターンし、以上のサイクルの全体を再び
実行する。ここで説明をブロック６０２へ戻して、この
ブロック６０２での判定の結果、リンク・リストに作業
グループが１つも記入されていないことが判明した場合
には、処理の流れは、そこからブロック６００へリター
ンする。

【００４３】次に図７について説明する。同図に示した
のは、複数の処理済作業グループを結合して再組立する
ための方法及びシステムの、ハイレベルのフローチャー
トである。各々の処理ノードは夫々１つずつの先入れ先
出しバッファ（ＦＩＦＯ）に結合しており、各々の処理
ノードから送出された（処理済の）作業グループは、一
旦その処理ノードに結合しているＦＩＦＯの中に入れら
れ、その後に、夫々のＦＩＦＯの中の作業グループが結
合されて再組立され、処理済データ・ストリームが生成
される。即ち、リオーダ装置が、それらＦＩＦＯから一
度に１ワードずつ、データを読み出す。１ワードの大き
さは様々に設定することができ、例えば３２ビットを１
ワードとしても良い。この再組立のプロセスは、図７に
示したように、ブロック７００から開始し、このブロッ
ク７００では、現在順序番号cur seq num を初期化し、
即ち、所定の値（通常は「０」）にセットする。続いて
処理の流れはブロック７０２へ進み、そこでは、イネー
ブルされているＦＩＦＯのボトムをスキャンして行く
（即ち、次々と調べて行く）。尚、ＦＩＦＯは、そのＦ
ＩＦＯに結合している処理ノードが作業グループの処理
を完了したときにイネーブルされる。

【００４４】続いて処理の流れはブロック７０４へ進
み、そこでは、いずれかのＦＩＦＯのボトムにデータが
存在しているか否かを判定する。ここでいうデータに
は、順序番号や終了タグは含まれない。あるＦＩＦＯの
ボトムにデータが存在していたならば、処理の流れはブ
ロック７０６へ進み、そこでは、そのＦＩＦＯからリオ
ーダ装置の出力部へのデータ転送を行ない、このデータ
転送は新たな順序番号ないし終了タグに遭遇するまで続
行し、遭遇したならば停止する。続いて処理の流れはブ
ロック７０２へリターンする。

【００４５】説明をブロック７０４へ戻し、このブロッ
ク７０４での判定の結果、どのＦＩＦＯのボトムにもデ
ータが存在していないと判定された場合には、処理の流
れはブロック７０８へ進み、このブロック７０８では、
制御プロセッサのＦＩＦＯが空か否かを判定する。制御
プロセッサのＦＩＦＯが空でなかったならば、処理の流
れはブロック７１０へ進み、そこでは、制御プロセッサ
のＦＩＦＯからリオーダ装置の出力部へのデータ転送を
行ない、このデータの転送は終了タグに遭遇するまで続
行し、遭遇したならば停止する。続いて処理の流れはブ
ロック７０２へリターンする。

【００４６】説明をブロック７０８へ戻し、このブロッ
ク７０８での判定の結果、制御プロセッサのＦＩＦＯが
空であると判明した場合には、処理の流れはブロック７
１２へ進み、そこでは、夫々の処理ノードのＦＩＦＯの
夫々のボトムのワードの順序番号のうちから最小の順序
番号を選択する。続いて処理の流れはブロック７１４へ
進み、そこでは、その最小の順序番号と現在順序番号cu
r seq num とが一致しているか否かを判定する。その最
小の順序番号と現在順序番号cur seq num とが一致して
いたならば、その作業は所定の順序を必要とする種類の
作業ではないため、この場合には、処理の流れはブロッ
ク７１６へ進み、そこでは、その順序番号を廃棄する。
これによって、そのＦＩＦＯからリオーダ装置の出力部
へのデータ転送が開始される。続いて処理の流れはブロ
ック７０２へリターンする。

【００４７】説明をブロック７１４へ戻し、このブロッ
ク７１４での判定の結果、その最小の順序番号と現在順
序番号cur seq num とが一致していないと判明したなら
ば、その作業は所定の順序を必要とする種類の作業であ
るため、この場合には、処理の流れはブロック７１８へ
進み、そこでは、その最小の順序番号が、現在順序番号
cur seq num に「１」を加えた値に等しいか否かを判定
する。そして、その最小の順序番号が、現在順序番号cu
r seq num に「１」を加えた値に等しいことが判明した
ならば、処理の流れはブロック７２０へ進み、そこで
は、現在順序番号cur seq num を「１」だけインクリメ
ントする。続いて、処理の流れはブロック７１６へ進
み、そこでは、その順序番号を廃棄する。これによっ
て、そのＦＩＦＯからリオーダ装置の出力部へのデータ
転送が開始される。続いて処理の流れはブロック７０２
へリターンする。

【００４８】説明をブロック７１８へ戻し、このブロッ
ク７１８での判定の結果、その最小の順序番号が、現在
順序番号cur seq num に「１」を加えた値に等しくない
ことが判明した場合には、処理の流れはブロック７２２
へ進み、そこでは、空のＦＩＦＯが存在しているか否か
を判定する。もし、空のＦＩＦＯが１つも存在していな
かったならば、処理の流れはブロック７２４へ進み、そ
こでは、エラー状態の発生を告げるメッセージを送出す
る。続いてこのプロセスはブロック７２６において終了
する。この場合には、このプロセスを再初期化する必要
がある。

【００４９】一方、ブロック７２２での判定の結果、１
つないし幾つかのＦＩＦＯが空であることが判明したな
らば、処理の流れはブロック７０２へリターンする。

【００５０】

【発明の効果】本発明は、多数のプロセッサを結合して
高性能のグラフィックス計算システムを構成するための
改良した方式を提供しており、この方式では、複数の処
理ノードへ作業を送出する処理を、プロセッサに行なわ
せるようにしている。また、プロセッサからプロセッサ
へのデータ転送は、メモリをアクセスする経路とは別に
設けたデータ経路によって行なうようにしているため、
メモリ・バスの帯域幅に関する問題が発生しない。更
に、あるデータがデータ経路上を何度も転送されるとい
うことも回避されているため、インターフェースに要求
される帯域幅を小さな値に抑えることもできる。更に本
発明の好適実施例では、パイプラインを１つしか備えて
いないシリアル・プロセッサ形のシステムと比較して、
データ経路の帯域幅を、より小さな値に抑えることがで
き、これが可能であるのは、各々の処理ノードが、全体
のＮ分の１の量の（Ｎは処理ノードの個数である）デー
タ・ストリームを取り扱うだけで良いからである。加え
て、共用メモリ式のパラレル・プロセッサ形のシステム
で発生するメモリの競合という問題も、本発明では発生
することがなく、それは、本発明においては、データの
流れの本流が、共用メモリを介することなく流れるよう
にしてあるからである。

【００５１】本発明の更なる１つの利点は、データ処理
システムの中の処理ノードの個数を容易に増減し得るこ
とにある。即ち、本発明の好適実施例に従って構成した
グラフィックス処理システム製品では、単に処理ノード
を追加、或いは削減するだけで、ソフトウェアや回路構
成の変更をせずに、システムの規模を容易に拡大ないし
縮小することができる。

【００５２】本発明の更なる１つの利点は、各々が異な
ったグラフィックス・データ・フォーマットを有する複
数のグラフィックス・データ・ストリームを包含してい
る多重化されたグラフィックス・データ・ストリーム
を、複数の処理ノードのうちの別々の処理ノードにおい
て、同時並行的に処理できることにある。例えば、処理
ノードを４個備えたシステムでは、そのうちの３個の処
理ノードに「ＧＬ」のデータ・ストリームの処理を行な
わせ、残りの１個の処理ノードに「ＸＷｉｎｄｏｗ
ｓ」のデータ・ストリームの処理を行なわせるようにす
ることもでき、或いは、それら４個の処理ノードに、タ
イプはいずれも「ＧＬ」であるが夫々に別個のデータ・
ストリームの処理を行なわせることもできる。

【図面の簡単な説明】

【図１】本発明の好適実施例をその中で実施することの
できるコンピュータ・システムの一例の外観図である。

【図２】本発明の好適実施例をその中で実施することの
できるパーソナル・コンピュータの構成要素のうちの、
選択した幾つかの要素を示したブロック図である。

【図３】本発明の好適実施例に従って構成したノード式
プロセッサ構成体のブロック図である。

【図４】本発明の好適実施例における、属性プロセッサ
が複数の作業グループを、それらを処理させるために夫
々の処理ノードへ向けて送出する際の動作を示したブロ
ック図である。

【図５】本発明の好適実施例における、複数の作業グル
ープを、それらを処理させるために処理ノードへ向けて
送出するための方法及びシステムの、ハイレベルのフロ
ーチャートである。

【図６】リンク・リストに記入されている作業グループ
を処理ノードへ向けて送出するための方法及びシステム
の、ハイレベルのフローチャートである。

【図７】複数の処理済作業グループを結合して再組立す
るための方法及びシステムの、ハイレベルのフローチャ
ートである。

【符号の説明】

３００プロセッサ構成体３０２バス・インターフェース３０４作業要素ＲＡＭ（ＷＥＲＡＭ）３０６属性プロセッサ（ＡＰ）３１０ビデオＲＡＭ（ＶＲＡＭ）３１２共用ＲＡＭ３１３通信経路３１４、３１８プロセッサ３２２リオーダ装置３２４バス３２６ラスタ・サブシステム３２８制御プロセッサ（ＣＰ）４００作業要素ＲＡＭ（ＷＥＲＡＭ）４０２属性プロセッサ（ＡＰ）４０４ＶＲＡＭ４０６、４１０、４１４、４１８処理ノード４０８、４１２、４１６、４２０データ転送プロセスＷＧ１、ＷＧ２、ＷＧ３、ＷＧ４、ＷＧ５、ＷＧ６作
業グループ（ＷＧ）

フロントページの続き (72)発明者ジョセフ・シー・カンツアメリカ合衆国12477、ニューヨーク州サウジャーティーズ、オールド・ステージ・ロード 4169番地 (72)発明者オマー・マーモウド・ラヒムアメリカ合衆国12401、ニューヨーク州キングストン、ノース・マナー・アベニュー 202番地 (72)発明者デービッド・エイ・ライスアメリカ合衆国12561、ニューヨーク州ニュー・パルツ、ノース・パット・コーナーズ・ロード 144番地 (72)発明者エドワード・マーク・ルディックアメリカ合衆国12498、ニューヨーク州ウッドストック、ヴァン・デイル・ロード 66番地 (56)参考文献特開昭64−1073（ＪＰ，Ａ) 特開平２−253478（ＪＰ，Ａ) 特開平３−206576（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】

【請求項１】複数の処理ノ−ドで処理されたグラフィッ
クス・デ−タ・ストリ−ムを表示するグラフィックス表
示装置を備えたデ−タ処理システムにおけるグラフィッ
クス・デ−タ・ストリ−ムの処理方法であって、グラフィックス・デ−タ・ストリ−ムを、少なくとも１
個の作業要素を包含する処理のための作業グル−プに対
応する複数のデ−タ・セグメントに、区分するステップ
と、各作業グル−プ毎に属性プリミティブに該当する作業要
素をサ−チし、グラフィックス属性の処理を実行するス
テップと、処理済のグラフィックス属性情報を各作業グル−プ毎に
メモリにコピ−し、かつこの属性情報を、属性の各処理
毎に、累積または更新するステップと、各デ−タ・セグメントに、メモリ中のグラフィックス属
性のコピ−を指示するポインタを付加して複数の処理ノ
−ドへ分配するステップと、各処理ノ−ドにおいて前記ポインタにより指示されたメ
モリを参照しながら受信デ−タ・セグメントを処理し、
処理済デ−タ・セグメントを再組立てるステップと、より成るグラフィックス・デ−タ・ストリ−ムの処理方
法。
【請求項２】複数の処理ノ−ドで処理されたグラフィッ
クス・デ−タ・ストリ−ムを表示するグラフィックス表
示装置を備えたデ−タ処理システムにおけるグラフィッ
クス・デ−タ・ストリ−ムの処理方法であって、グラフィックス・デ−タ・ストリ−ムを、少なくとも１
個の作業要素を包含する処理のための作業グル−プに対
応する複数のデ−タ・セグメントに、区分するステップ
と、各作業グル−プ毎に属性プリミティブに該当する作業要
素をサ−チし、グラフィックス属性の処理を実行するス
テップと、処理済のグラフィックス属性情報を各作業グル−プ毎に
メモリにコピ−し、かつこの属性情報を、属性の各処理
毎に、累積または更新するステップと、各デ−タ・セグメントに、デ−タ・セグメント相互間の
時間的順序を示す同期化用タグを付加して空き状態の処
理ノ−ドへ分配するステップと、各処理ノ−ドにおいて受信デ−タ・セグメントを処理し
て処理済デ−タ・セグメントを生成するステップと、複数の処理済みデ−タ・セグメントを前記同期化用タグ
の制御の下に再組立てるステップとより成るグラフィッ
クス・デ−タ・ストリ−ムの処理方法。
【請求項３】グラフィックス・デ−タ・ストリ−ムが異
なるグラフィックス・デ−タ・フォ−マットを含んでい
る多重化されたグラフィックス・デ−タ・ストリ−ムで
あることを特徴とする請求項１又は２に記載の方法。
【請求項４】グラフィックス・デ−タ・ストリ−ムを処
理のための複数の作業グル−プに区分し、かつ、これら
の各作業グル−プを複数の処理ノ−ドに向けて分配する
ための制御手段と、該制御手段に結合され、複数の各処
理ノ−ドにおいて前記各作業グル−プを処理して複数の
処理済作業グル−プを生成する処理手段と、該処理ノ−
ドに結合され、複数の前記処理済作業グル−プを再組立
てて処理済グラフィックス・デ−タ・ストリ−ムを生成
する再組立て手段とを含むグラフィックス・デ−タ・ス
トリ−ムを効率的に処理するためのグラフィックス処理
システムにおいて、前記各処理ノ−ドに結合され、グラフィックス属性デ−
タを記憶するためのメモリと、前記制御手段に結合され、グラフィックス・デ−タ・ス
トリ−ムから前記メモリへ属性デ−タを各作業グル−プ
毎にコピ−する手段と、前記処理手段に結合され、前記各処理ノ−ドにおける１
つの作業グル−プに対する処理を、先行する作業グル−
プに関して前記メモリ内に記憶されているグラフィック
ス属性デ−タを参照しながら、実行する手段と、より成るグラフィックス処理システム。
【請求項５】制御手段及び処理手段が共用メモリ領域を
介して互に結合されていることを特徴とする請求項４に
記載のグラフィックス処理システム。
【請求項６】制御手段が、ある作業グル−プをある処理
ノ−ドへ分配する前にその作業グル−プに同期化用タグ
を付加する手段を更に含んでおり、前記同期化用タグは、処理手段による処理の後に前記複
数の作業グル−プを再組立するに際しての、ある作業グ
ル−プの、その他の作業グル−プに対する順序を表示し
たタグであることを特徴とする請求項４に記載のグラフ
ィックス処理システム。
【請求項７】制御手段が複数の各作業グル−プを複数の
処理ノ−ドのうちの空き状態の処理ノ−ドへ分配するこ
とを特徴とする請求項６に記載のグラフィックス処理シ
ステム。
【請求項８】複数の各処理ノ−ドが直列接続した複数の
プロセッサを含むことを特徴とする請求項４に記載のグ
ラフィックス処理システム。