JPH10240700A

JPH10240700A - グラフィックス並列処理装置

Info

Publication number: JPH10240700A
Application number: JP9045273A
Authority: JP
Inventors: Yumiko Sugita; 由美子杉田; Shinji Kimura; 信二木村; Masahiro Goto; 正宏後藤; Hideki Fujii; 秀樹藤井
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1997-02-28
Filing date: 1997-02-28
Publication date: 1998-09-11

Abstract

(57)【要約】【課題】本発明は、マルチプロセッサに３次元グラフィ
ックスのコマンド列を分配する制御において、専用ハー
ドウェアで行なう負荷分散制御の軽量化と、効率良い負
荷分散処理を実現するものである。【解決手段】３次元グラフィックス描画プログラムをマ
ルチプロセッサ構成の描画処理装置で処理する際の負荷
分散処理を、２段階に分けてホストコンピュータと描画
処理装置とで行なう。ホストコンピュータで分散方法情
報を選定し、描画処理装置に転送する描画コマンドに付
加する。描画処理装置では低価格なハードウェアを用い
て分配情報を元に最適なプロセッサを選択し分配を行な
う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、並列実行可能な複
数のプロセッサを備えた並列描画処理装置に係わり、特
に高品位なグラフィックスをリアルタイムに表示するグ
ラフィックスシステムに関する。

【０００２】

【従来の技術】コンピュータグラフィックスの応用分野
がビジュアルシミュレーションやバーチャルリアリテ
ィ、ゲームなどの分野に広がるにつれて、表示性能に対
する高速化の要求が高まってきている。特に３次元グラ
フィックスの分野にこの傾向が著しい。

【０００３】従来、このような高速化の要求に答える技
術としては、座標変換やクリッピングといった描画処理
を専用プロセッサで処理することで解決してきた。特に
高速性能が要求される分野では、特開平６−２７４６０
８「マルチプロセッサ描画処理装置」に記載されている
ように、描画処理のための専用ハードウェアを複数のプ
ロセッサで構成し、ＣＰＵから送られてきた3次元描画
コマンドは受け取ったコマンドプロセッサが描画演算プ
ロセッサのＦＩＦＯバッファに分配し、個々の描画演算
プロセッサで並列に処理する方式が知られている。ま
た、ＣｏｍｐｕｔｅｒＧｒａｐｈｉｃｓ（ＳＩＧＧＲ
ＡＰＨ‘９３ＣｏｎｆｅｒｅｎｃｅＰｒｏｃｅｅｄ
ｉｎｇｓ），Ｖｏｌ．２７，ｐｐ１０９〜１１６や日経
ＣＧ，Ｎｏ．７３，ｐｐ１４３〜１５３でも描画処理を
並列に行なうグラフィックスシステムが記載されてい
る。

【０００４】３次元グラフィックスには高品質化も要求
されており、その代表的な手法の1つになめらかで模様
の付いた物体の描画がある。この物体の描画に良く使わ
れる３次元グラフィックスの描画コマンドの１つとし
て、ＯｐｅｎＧＬＲｅｆｅｒｅｎｃｅＭａｎｕａ
ｌ、アジソン・ウェスレイ出版、Ｐ３０１に記載されて
いるような、頂点座標の配列へのポインタを引数で指定
するコマンドがある。前記コマンドは描く物体を構成す
る３次元面の頂点データ（３次元座標、法線ベクトル）
の配列を引数とした可変長であり、描く対象図形の表面
を滑らかに見せる場合には、細かい面に分割して多くの
頂点を引数として定義する。また、各頂点には色、法
線、テクスチャの情報が付けられ、高品質な表示を実現
できることも知られている。

【０００５】

【発明が解決しようとする課題】近年、３次元グラフィ
ックスシステムに要求されてきているものに低価格化が
ある。ＰＣの低価格化と高性能化に伴い、日経ＣＧ，Ｎ
ｏ．１１４，ｐｐ１２４〜１３７に紹介されているよう
に、すでにプロ指向の３次元グラフィックスアプリケー
ションがＰＣへと移行し始めている。この動きに伴い、
描画処理装置もＰＣ対応に低価格化が望まれている。

【０００６】３次元グラフィックスの１つのシーンは、
複数の描画属性指定コマンドと描画要求コマンドの複雑
な組み合わせで構成されている。極端にデータ長の違う
コマンドが混在し、描画順序の保証などの制限もある。
マルチプロセッサ構成の描画処理装置を備えた計算機に
おいて、描画処理装置の性能を十分に引き出しリアルタ
イム表示するためには、これら３次元グラフィックスプ
ログラムから発行されるコマンドを、コマンドの内容や
組み合わせを解析し、描画順序などの３次元グラフィッ
クスの特性を維持しながら、負荷を均一にして分配制御
することが必要となる。

【０００７】従来の方式の中にも専用ハードウェアを用
いて分配処理は行われているものがあるが、要求される
３次元グラフィックスが高品質になるほどコマンド解析
や分配制御は複数になり、その制御を実現するハードウ
ェアが高価になるという問題が生じている。さらにデー
タ量の多いコマンドの場合は、配送による通信オーバヘ
ッドや描画順序性を維持するために生じる待ち時間の問
題もある。描画順序を守るために、あるコマンドの演算
処理が終了しレンダリング処理に渡るまで、前記コマン
ドの後に発行されたコマンドは、他のプロセッサで演算
処理が終了していてもレンダリング処理ができない。

【０００８】低価格化の方法として、専用のハードウェ
アは用いず、マルチプロセッサのうちの１つに負荷分散
制御を行なわせる方法があるが、負荷分散制御を行なう
プロセッサは制御に時間を取られ、３次元描画処理があ
まり行なえず、プロセッサ数にあうスケーラブルな性能
は出ないという問題が生じる。

【０００９】本発明の目的は、マルチプロセッサに３次
元グラフィックスのコマンド列を分配する制御におい
て、専用ハードウェアで行なう負荷分散制御の軽量化し
ながら、効率良い負荷分散処理を実現する方法を提供す
ることである。

【００１０】

【課題を解決するための手段】前述の課題を解決する手
段として、ホストコンピュータからコマンドを描画処理
装置に転送し、描画処理装置の複数の描画プロセッサで
描画演算処理を行ないレンダリングハードウェアを介し
てディスプレイに表示する３次元グラフィックス処理装
置において、ホストコンピュータにおいて、３次元グラ
フィックス描画プログラムから３次元グラフィックスコ
マンドを受け取り、３次元グラフィックスコマンドの性
質を基にに適した分配方法を決定し、決定した分配方法
情報をコマンドに付加する手段と、分配方法情報を付加
したコマンドを描画処理装置にバスを介し転送を行なう
手段とを有し、描画処理装置の制御ハードウェアにおい
て、受信したコマンドの分配情報を識別し、プロセッサ
の稼動状況と指定分配方法から最適なプロセッサを選択
し、描画プロセッサの入力ＦＩＦＯに分配する手段を有
する。各描画演算プロセッサは入力ＦＩＦＯからコマン
ドを読み込んで演算処理を行なう。

【００１１】さらに、描画演算プロセッサの入力ＦＩＦ
Ｏが受信可能なコマンド数を取得する手段を有し、前述
のホストコンピュータで分配方法を決定する時に、数の
多い頂点データを引数に持つコマンドの頂点データを分
割し、複数のコマンドに分割生成し、前記描画演算プロ
セッサの入力ＦＩＦＯが受信可能なコマンド数と前記コ
マンドの分割方法とを基にコマンドの分配方法を決定
し、分配方法情報をコマンドに付加する手段を有する。

【００１２】

【発明の実施の形態】図１は本発明を適用した３次元グ
ラフィックス並列処理装置の構成図である。ホストコン
ピュータ１００は少なくとも入力装置１１０との接続部
１０１と、プログラムの実行や制御を行なうＣＰＵ１０
２、メモリ１０３、接続装置１１０とＣＰＵ１０２とを
つなぐバス１０６、ＣＰＵ１０２とメモリ１０３とをつ
なぐバス１０７、描画装置にコマンドを送るためのバス
１０８とバス接続部１０４がある。描画処理装置１２０
は少なくともホストコンピュータとのバス接続部１２
１、コマンド入力ＦＩＦＯ１３１とバスアービタ１３２
と負荷分散制御部１３３を持つ制御ハードウェア１３
０、入力ＦＩＦＯ１４１、１５１と出力ＦＩＦＯ１４
２、１５２をそれぞれ持つ描画演算インターフェース部
１４０、１５０、描画インタフェース部の入力ＦＩＦＯ
１４１とバスアービタ１３２とを接続するバス１２３、
１２４、分配制御プロセッサ１３０から描画インタフェ
ース部の入力ＦＩＦＯ１４１、１５１にコマンドを転送
するバス１２２、入力ＦＩＦＯ１４１、１５１からコマ
ンドを読み取り演算処理する描画演算プロセッサ１６
０、１７０、演算処理後のコマンドを次の処理であるレ
ンダリングハードウェア１８０に転送するための出力Ｆ
ＩＦＯ１４２、１５２、出力ＦＩＦＯ１４２、１５２か
らレンダリングハードウェア１８０にコマンドを転送す
るバス１２７、レンダリングハードウェアからディスプ
レイ１９０に画像を送るバス１２８がある。ホストコン
ピュータ１００と描画処理装置１２０とはバス１０５で
つながれている。本実施例では描画演算プロセッサを２
個で説明するが、本発明は２個以上の構成すべてに適応
可能である。

【００１３】図２は図１の装置で実行される処理の概要
図である。ホストコンピュータ１００では処理２００が
動作する。処理入力装置１１０から３次元グラフィック
ス描画プログラムの実行を受け付け、メモリ１０３にあ
る情報を元に３次元グラフィックス描画プログラム２１
０をＣＰＵ１０２で実行する。ＣＰＵ１０２では他にラ
イブラリ２２０、ＯＳ２３０、ＯＳの一部であり描画コ
マンドとのインタフェースを制御するドライバ２３１が
動作する。３次元グラフィックス描画プログラム２１０
から発行されるコマンドはライブラリ２２０に渡る。ラ
イブラリでは負荷分散処理Ｉ２２１を実行し、コマンド
構成の解析を行ない、コマンドの種類が属性であるか、
描画制御であるか、描画要求であるかを識別し、識別し
た種類に最適な描画装置のマルチプロセッサへの分配方
法を決定して、コマンドに情報として付加する。コマン
ドと前記決定した分配方法情報を用い１つのハードウェ
アコマンド２４０を生成し、ドライバ２３１を介して描
画処理装置１２０に転送する。コマンド解析時に、数の
多い頂点列データを引数に持つコマンドを検出した場合
には、描画演算プロセッサの入力ＦＩＦＯが受信可能な
コマンド数を取得するインタフェースを用いコマンド数
を取得して記憶し、頂点データを分割して複数のコマン
ドを生成する。前述手段で生成した分割コマンドに対
し、前記記憶したコマンド数を元に、タイミングにあわ
せて異なる分配方法を選択する。また、描画属性コマン
ドのうち頂点データに定義される描画属性についてはコ
マンド発行履歴の状態遷移を管理し、属性をキャッシュ
バッファに保存し、前記属性を用いる頂点データを引数
とした描画コマンドを識別した時に前記描画コマンドに
付加して転送する。ホストコンピュータでの処理２００
は、描画処理装置にコマンドを転送すると、転送したコ
マンドに対する処理結果を待たずに次のコマンド処理を
開始する。

【００１４】ホストコンピュータ１００のドライバ２３
１からバス１０５を介して転送したハードウェアコマン
ド２４０は、制御ハードウェア１３０のＦＩＦＯ１３１
で受信する。描画演算プロセッサへの負荷分散制御部２
６０の負荷分散処理ＩＩ２６１は、ＦＩＦＯ１３１から
コマンドを読み出して解析し、分配方法を識別する。ま
た、バスアービタ１３２を用いて管理している描画プロ
セッサの入力ＦＩＦＯ１４１、１５１の空き状態情報を
参照し、分配方法に合う空いているＦＩＦＯにコマンド
を転送する。両方のＦＩＦＯが空いていて、１つの描画
演算プロセッサにだけ送る分配制御であれば、ラウンド
ロビンアルゴリズムに従っていずれか一方の描画演算プ
ロセッサに転送する。また、両方のＦＩＦＯが空き余裕
状態にない場合には、いずれかが空き余裕状態になるの
を待って転送を行なう。コマンドが両方の入力ＦＩＦＯ
に同時に転送する必要がある場合には、両方のＦＩＦＯ
が空き余裕状態であることを確認して同時に転送する。
負荷分散処理ＩＩ２６１では、１つ前のコマンドを転送
した描画演算プロセッサ識別子情報２６２をレジスタに
格納し、次の分配先描画演算プロセッサを決定する際に
参照する。描画演算プロセッサは入力ＦＩＦＯ１４１、
１５１からコマンドを読み出し、描画演算処理２７０、
２７１において、座標変換処理、クリッピングなどのジ
オメトリ演算処理を行なう。描画演算処理２７０、２７
１の演算結果は描画コマンドとして対応する出力ＦＩＦ
Ｏ１４２、１５２からバス１２７を介して読み出し、次
の処理であるレンダリングハードウェア１８０のレンダ
リング処理部２７０に渡す。コマンドの描画順序は、描
画要求コマンドに順序情報を付加することで維持する。
レンダリング処理部２７０で生成された画像はディスプ
レイ１９０へバス１２８を介して転送し画面に表示す
る。

【００１５】本説明で触れた前期コマンドの処理におけ
るコマンドの種類と分配方法については、図３〜図６で
説明する。ハードウェアコマンド２４０の構成について
は、図７で説明する。数の多い頂点データ列を引数とし
た描画コマンドの分割方法については、図８で説明す
る。

【００１６】図３〜６はコマンドの種類と分配方法を示
した図である。図１に示した本実施例は描画演算プロセ
ッサは２個であるが、図３〜６では他の転送方法と区別
するため、４個の描画演算プロセッサでの例を示す。

【００１７】図３は描画属性コマンドの分配方法である
ブロードキャスト分配を示したものである。描画要求コ
マンドには３次元描画要求コマンド、2次元描画要求コ
マンド、イメージ描画要求コマンドなどがあり、一度定
義した描画属性は、何度も異なる描画要求コマンドに使
われることが多い。従っていずれの描画演算プロセッサ
でも描画要求コマンドを処理できる様に、描画属性はす
べての描画演算プロセッサにブロードキャスト分配す
る。ブロードキャスト分配を情報として付加したコマン
ド３０１は、描画処理装置の負荷分散制御部１３０の負
荷分散処理ＩＩ２６１により描画演算プロセッサ１６
０、１７０、３０２、３０３に転送する。

【００１８】図４は前のコマンドを転送した描画演算プ
ロセッサとは別の描画演算プロセッサにコマンドを分配
するための、コマンドスイッチ転送方法である。コマン
ドスイッチ分配を情報として付加したコマンド４００
は、前のコマンドが描画演算プロセッサ１６０で処理し
た場合、描画処理装置の負荷分散制御部１３０の負荷分
散処理ＩＩ２６１において、記憶している１つ前のコマ
ンドを転送した描画演算プロセッサ識別情報２６２を参
照し、前記識別子の描画演算プロセッサとは異なる描画
演算プロセッサのうちコマンドを受け取ることができる
描画演算プロセッサ、例えば描画演算プロセッサ１７０
に転送する。コマンドスイッチ分配は、主に数の少ない
データを引数に持つ2次元・3次元描画要求コマンドの分
配に使う。

【００１９】図５は前のコマンドを転送した描画演算プ
ロセッサと同じ描画演算プロセッサにコマンドを分配す
る、コマンドコンティニュ転送方法である。コマンドコ
ンティニュ分配を情報として付加したコマンド５００
は、前のコマンドが描画演算プロセッサ１６０で処理し
た場合、描画処理装置の負荷分散制御部１３０の負荷分
散処理ＩＩ２６１において、記憶している１つ前のコマ
ンドを転送した描画演算プロセッサ識別情報２６２を参
照し、前記識別子の描画演算プロセッサと同じ描画演算
プロセッサ１６０に転送する。コマンドコンティニュ分
配は主にイメージ処理コマンドの転送に使う。

【００２０】図６は２つの描画演算プロセッサに同じコ
マンドを分配する場合に使用するオーバラップ転送方法
である。オーバラップ分配を情報として付加したコマン
ド６００は前のコマンドが描画演算プロセッサ１６０で
処理した場合、描画処理装置の負荷分散制御部１３０の
負荷分散処理ＩＩ２６１において、記憶している１つ前
のコマンドを転送した描画演算プロセッサ識別情報２６
２を参照し、前記識別子の描画演算プロセッサと同じ描
画演算プロセッサ１６０と、描画演算プロセッサ１６０
以外でコマンドを受け取ることができる描画演算プロセ
ッサ、例えば描画演算プロセッサ１７０に転送する。オ
ーバラップ分配はコマンドスイッチ転送、コマンドコン
ティニュ転送とともに、数の多い頂点データ列を引数と
して持つコマンドを分割して転送する場合に、主に使用
する。詳細は図８で説明する。

【００２１】図７はホストコンピュータ１００から描画
処理装置１２０へ転送するハードウェアコマンドの構成
図である。ハードウェアコマンド７００は、本実施例で
は６４ビットで構成する。ハードウェアコマンド７００
が持つ情報には、本コマンドが描画コマンドであるか否
かを示す情報７１１、本コマンドがコマンドコンティニ
ュで分配されるか否かを示す情報７１２、本コマンドが
ブロードキャストで分配されるか否かを示す情報７１
３、本コマンドがオーバラップで分配されるか否かを示
す情報７１４、本コマンドがコマンドスイッチで分配さ
れるか否かを示す情報７１５、データ長を示す情報７２
０、処理順序を示す情報７３０、転送先描画演算プロセ
ッサの識別情報７３１、コマンド情報７４０、リザーブ
エリア７１６、７３２がある。負荷分散制御部１３０の
負荷分散処理ＩＩ２６１では、描画コマンドかを示す情
報７１１が１であれば、本コマンドを描画コマンドとし
て識別し処理を開始する。分配方法情報７１２〜７１５
は必ずいずれか１つが１であり、１である分配方法に従
って対象コマンドの分配処理を行なう。転送先描画演算
プロセッサ情報７３１は負荷分散処理ＩＩ２６１におい
て描画演算プロセッサの識別情報を格納する。オーバラ
ップ分配の時は１つ前のコマンドを転送した描画演算プ
ロセッサ識別子を、他の分配では対象コマンドを転送す
る描画演算プロセッサ識別子を設定する。処理順序情報
７３０は負荷分散処理ＩＩ２６１において設定されるシ
ーケンス情報である。リザーブエリア７１６、７３０は
将来の拡張として使用する。

【００２２】図８は数の多い頂点列データを引数に持つ
コマンドの分割転送の方法を示したものである。3次元
の球や曲面を描く場合には、描画要求コマンドに面を構
成する頂点データ列が引数として定義されている。頂点
データ列８００を複数のデータ列に分割する場合、例え
ば頂点データ８０１と頂点データ８０２で単純に分割す
ると面８１０、８１１を描くことができなくなる。面８
１０と面８１１を描くためにまず、任意数の頂点データ
列８２０を引数としたコマンド８３０を任意の１つの描
画演算プロセッサ１６０へ転送（コマンドスイッチ転
送）する。本実施例では１２頂点としている。負荷分散
分配制御部１３０では前のコマンドを送った描画演算プ
ロセッサの識別情報を記憶しておき、次の１２頂点デー
タ列８２１を引数としたコマンド８３１も同じ描画演算
プロセッサ１６０へ転送（コマンドコンティニュ転送）
する。同じ描画演算プロセッサへの連続転送は、描画演
算プロセッサの入力ＦＩＦＯが受け取ることができるコ
マンドの数を考慮した数だけ行なう。前記入力ＦＩＦＯ
の受信可能なコマンド数は問い合わせのインタフェース
を設け、前記インタフェースを用いて３次元描画処理実
行開始時に取得しメモリに記憶しておく。本実施例では
入力ＦＩＦＯが受け取ることができるコマンドの数より
１つ少ない数までのコマンド８３２を同じプロセッサ１
６０へ連続転送する。さらに頂点データが残っている場
合には、次の２頂点データ列８０１、８０２を重複する
頂点データ列とし、２頂点データ列８２３を引数とした
コマンド８３３を、１つ前のコマンド８３２を転送した
プロセッサ１６０と、もう１つの任意プロセッサ１７０
の２つのプロセッサへ転送（オーバラップ転送）する。
この時負荷分散処理ＩＩ２６１では、２つの描画演算プ
ロセッサに送るコマンドに1つ前のコマンドを転送した
描画演算プロセッサの識別子情報を格納する。受け取っ
た描画演算プロセッサは、前記識別子情報が同じ識別子
ならば連続した頂点列の描画が終了することを識別で
き、別の識別子ならば、以後連続した頂点列の描画が来
る事が識別できる。負荷分散制御部１３０では、コマン
ド８３３を転送した２つのプロセッサ１６０、１７０の
うち2つ前のコマンド８３２を転送していない描画演算
プロセッサ１７０を記憶しておき、次の１２頂点データ
列８２４を引数としたコマンド８３４は、記憶した描画
演算プロセッサ１７０へ転送（コマンドスイッチ転送）
する。前述のコマンドスイッチ転送、コマンドコンティ
ニュ転送、オーバラップ転送を繰り返し、数の多い頂点
データを引数に持つコマンドの分割転送を実現する。

【００２３】次に、コマンドの処理に沿って、負荷分散
処理について具体的に説明する。

【００２４】図９はホストコンピュータ側のライブラリ
での負荷分散処理の流れ図である。ライブラリでの負荷
分散処理は、３次元グラフィックス描画プログラムから
コマンド（９０１）を受け取り、種類を識別する（９０
２）。コマンドの種類が描画属性ならば、属性が頂点デ
ータに有効な属性かを判断する（９０３）。頂点データ
に有効な属性であれば、バッファに格納する（９０
４）。頂点データに関係ない属性であれば、分配方法と
してブロードキャストを選択し（９０５）、分配方法情
報とコマンド情報からハードウェアコマンドを作成し
（９０６）、ドライバに転送し（９０７）、次のコマン
ドの処理に移る。コマンドの種類が描画要求の場合は、
描画要求が有効であるかを識別する（９０８）。識別方
法として、後述する描画の開始／終了の制御の場合に設
定する描画要求フラグを参照する。描画要求フラグが１
でなければ次のコマンドの処理に移る。１であれば描画
内容を識別する（９０９）。３次元描画要求のうち頂点
指定のコマンドであれば、頂点分割の処理Ａ（９１０）
を行なう。この処理の説明は図１０を用いて後述する。
他の３次元描画と２次元描画の要求の場合は、分配方法
としてコマンドスイッチを選択し（９１１）、分配方法
情報とコマンド情報からハードウェアコマンドを作成し
（９１２）、ドライバに転送し（９１３）、次のコマン
ドの処理に移る。描画内容がイメージの場合には、最初
の転送では分配方法としてコマンドスイッチを選択し
（９１４）、任意バイト数（図では２４バイトと表記）
のデータを引数とするハードウェアコマンドを生成し
（９１５）、ドライバに転送する（９１６）。次の分配
方法はコマンドコンティニュを選択し（９１７）、全体
のデータ数から転送したデータ数を引いた値が２４バイ
トよりも大きい間、前の転送と同じく２４バイトのデー
タを引数とするハードウェアコマンドを生成し（９１
５）、ドライバに転送する（９１６）という一連の処理
を繰り返す。データ数の残りが２４バイトよりも小さい
時には、残りのデータを引数とするハードウェアコマン
ドを生成し（９１９）、ドライバに転送する（９２
０）。コマンドの種類が描画の開始／終了の制御の場合
（９２１）、描画開始ならば描画要求フラグを１にし描
画終了ならば０に設定し（９２２）、分配方法としてブ
ロードキャストを選択し（９２３）、分配方法情報とコ
マンド情報からハードウェアコマンドを作成し（９２
４）、ドライバに転送し（９２５）、次のコマンドの処
理に移る。この描画要求フラグは初期値は０である。前
述以外の処理の場合は対応する処理を行なう（９２
６）。

【００２５】図１０は、頂点指定の描画コマンドの場合
の頂点分割の処理の流れである。引数として持つ頂点デ
ータの数を識別し（１００１）、１２個以上であるなら
ば分割処理に用いる終了フラグ、カウンタ、スイッチフ
ラグ、頂点数、分配方法の情報の初期化を行なう（１０
０２）。頂点数は１２、分配方法は初回の転送に適した
コマンドスイッチとする。次に属性を格納しているバア
ッファに対象属性があるかを識別し（１００３）、あれ
ばコマンドに付加する（１００４）。初期値の分配方法
と頂点数分のデータを持つコマンドからハードウェアコ
マンドを生成し（１００５）、ドライバに転送する（１
００６）。次に終了フラグが１かを識別し（１００
７）、０であればカウンタをインクリメントする（１０
０８）。残りの頂点数が１２よりも大きいかを識別し
（１００９）、大きければ次に、転送先であるプロセッ
サの入力ＦＩＦＯが受信可能なコマンド数から１を引い
た値がカウンタの値よりも大きいかを識別する（１０１
０）。大きい場合には、スイッチフラグが１かを識別し
（１０１１）、０であれば分配方法としてコマンドコン
ティニュを選択し（１０１２）、転送する頂点数を１２
に設定して（１０１３）、ハードウェアコマンド生成と
転送の処理（１００３〜１００６）を行なう。転送先で
あるプロセッサの入力ＦＩＦＯが受信可能なコマンド数
から１を引いた値がカウンタの値よりも小さい場合に
は、分配方法としてオーバラップを選択する（１０１
４）。頂点数を２に設定し（１０１５）、カウンタを０
に、スイッチフラグを１に設定し（１０１６）、ハード
ウェアコマンド生成と転送の処理（１００３〜１００
６）を行なう。オーバラップを指定した直後はスイッチ
フラグは１なので、残りの頂点データが１２個以上あれ
ば、分配方法はコマンドスイッチを選択し、スイッチフ
ラグを０にする（１０１７）。頂点数が１２個以下の場
合も同様で、スイッチフラグが１か、すなわちオーバラ
ップの直後かを識別し（１０１８）、０ならば分配方法
はコマンドコンティニュを選択し（１０１９）、１なら
ば分配方法はコマンドスイッチを選択する（１０２
０）。頂点数に残りのデータ数を設定し（１０２１）、
終了フラグに１を設定し（１０２２）、ハードウェアコ
マンド生成と転送の処理（１００３〜１００６）を行な
う。その後、終了フラグの比較（１００７）により、処
理を終了する。頂点数が初めから１２個以下の場合に
も、前記残りのデータ数が１２個以下の場合と同じ処理
（１０１８〜１０２２、１００３〜１００７）を行なっ
て終了する。

【００２６】図１１は、制御ハードウェアでの負荷分散
処理の流れである。ホストコンピュータから転送したコ
マンドを入力ＦＩＦＯから読み込む（１１０１）。読み
込んだコマンドが描画コマンドかを識別し（１１０
２）、描画コマンドでなければ対応する処理を行なって
（１１０３）、再度コマンドを読みに行く。コマンドが
描画コマンドであれば、コマンドから分配情報を検出す
る（１１０４）。分配方法がブロードキャストかを識別
し（１１０５）、ブロードキャストであればすべての描
画演算プロセッサの入力ＦＩＦＯが空き状態になるまで
待って転送する（１１０６）。分配方法がブロードキャ
ストでない場合にはまず、１つ前のコマンドをコマンド
を転送した描画演算プロセッサの識別子情報を得る（１
１０７）。描画順序を維持するための情報をコマンドに
付加する（１１０８）。分配方法を判定し（１１０
９）、コマンドスイッチならば空き入力ＦＩＦＯを持つ
描画演算プロセッサを検出し（１１１０）、１つ前のコ
マンドを転送したものと異なる描画演算プロセッサを転
送先描画演算プロセッサとして選択し（１１１１）、転
送先描画演算プロセッサ識別子をコマンドに設定し（１
１１２）、コマンドを転送する（１１１３）。分配方法
がコマンドコンティニュならば、前のと同じ描画演算プ
ロセッサの入力ＦＩＦＯが空き状態になるのを待って
（１１１４）、転送先描画演算プロセッサ識別子をコマ
ンドに設定し（１１１２）、コマンドを転送する（１１
１３）。分配方法がオーバラップであるならば、空き入
力ＦＩＦＯを持つ描画演算プロセッサを検出し（１１１
５）、１つ前のコマンドを転送した描画演算プロセッサ
と、他にもう１つ描画演算プロセッサを転送先に選択し
（１１１６）、いずれの描画演算プロセッサに送るコマ
ンドにも転送先として１つ前のコマンドを転送したプロ
セッサの識別子を設定し（１１１７）、２つの描画演算
プロセッサに転送する（１１１８）。

【００２７】

【発明の効果】本発明である分散方法情報をコマンドに
付加する方式を用いれば、ホストコンピュータと描画処
理装置に分けた２段階の負荷分散が可能となり、負荷分
散の２段階化により、描画処理装置のハードウェアで行
なう分配制御の軽量化が図れ、低価格のハードウェアで
実現できる。

【００２８】さらに、２段階に分けた負荷分散処理を並
列に動作することにより、負荷分散制御のオーバヘッド
を削減できる。

【００２９】また数の多い頂点データ持つコマンドは、
本発明である分割とＦＩＦＯで受信可能なコマンド数を
考慮しタイミングに適した分配方法を採ることにより、
プロセッサの稼働率を向上することができる。

【図面の簡単な説明】

【図１】本特許を適用したシステム構成図

【図２】本特許を適用したシステムの処理概要図

【図３】ブロードキャスト分配方式

【図４】コマンドスィッチ分配方式

【図５】コマンドコンティニュ分配方式

【図６】オーバラップ分配方式

【図７】ハードウェアコマンド構成

【図８】コマンド分割方式

【図９】ライブラリでの負荷分散処理の流れ図１

【図10】ライブラリでの負荷分散処理の流れ図２

【図11】制御ハードウェアの負荷分散処理の流れ図

【符号の説明】

１００：ホストコンピュータ、１０２：ＣＰＵ，１０
５：接続バス、１１０：入力装置、１２０：描画処理装
置、１３０：制御ハードウェア、１４０，１５０：イン
タフェース部、１６０，１７０：描画演算プロセッサ、
１８０：レンダリングハードウェア、１９０：ディスプ
レイ、２２１：ホストコンピュータ側の負荷分散処理、
２６１：描画処理装置側の負荷分散処理、２４０：ハー
ドウェアコマンド

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ０９Ｇ 5/36 ５３０Ｇ０６Ｆ 15/72 ４５０Ａ (72)発明者藤井秀樹茨城県日立市大みか町五丁目２番１号株式会社日立製作所大みか工場内

Claims

【特許請求の範囲】

【請求項１】ホストコンピュータとホストコンピュータ
にバス接続したマルチプロセッサ構成の描画処理装置と
で構成し、グラフィックス描画処理を行なうグラフィッ
クス並列処理装置であって、ホストコンピュータ側に、
グラフィックスコマンドの性質に適した分配方法を選定
する手段と、前記選定した分配方法に対応する転送先プ
ロセッサの数と転送先プロセッサの切替えの有無の情報
を含む情報をコマンドに付加して描画処理装置側の制御
ハードウェアに転送する手段とを設け、描画処理装置の
制御ハードウェア側に、前記コマンドに付加した分配方
法情報に従って処理可能なプロセッサを選択し分配する
手段を設け、前述の２段階の負荷分散手段を並列実行す
ることを特徴とするグラフィックス並列処理装置。
【請求項２】ホストコンピュータとホストコンピュータ
にバス接続したマルチプロセッサ構成の描画処理装置と
で構成し、グラフィックス描画処理を行なう請求項１記
載のグラフィックス並列処理装置にあって、頂点列デー
タを引数に持つ描画コマンドを複数のコマンドに分割す
る手段と、各描画プロセッサが持つ入力用の先入れ先出
しバッファ（以後ＦＩＦＯと称する）が受信可能な最大
コマンド量を取得する手段とを有し、前記分割した複数
のコマンドの分配において、前記入力ＦＩＦＯの受信可
能なコマンド量を用いて、任意のプロセッサへの切替え
のタイミングをホストコンピュータ側からコマンドに付
加して指示することを特徴とするグラフィックス並列処
理装置。
【請求項３】ホストコンピュータとホストコンピュータ
にバス接続したマルチプロセッサ構成の描画処理装置と
で構成し、グラフィックス描画処理の負荷分散におい
て、各描画プロセッサが持つ入力ＦＩＦＯの受信可能な
コマンド量を用いて頂点列データを引数に持つ描画コマ
ンドの分割と分配の制御を行なう請求項２のグラフィッ
クス並列処理装置にあって、三角形の頂点列の組み合わ
せで面を描画するコマンドの場合、該コマンドに対して
請求項３の２つのプロセッサでの切替えを行なう際に、
分割した２つのプロセッサに共通な２頂点のデータを１
つのコマンドとして、前記２つのプロセッサへの分配を
指定してホストコンピュータ側から描画処理装置へ転送
することを特徴とするグラフィックス並列処理装置。
【請求項４】ホストコンピュータとホストコンピュータ
にバス接続したマルチプロセッサ構成の描画処理装置と
で構成し、グラフィックス描画処理を行なう請求項１記
載のグラフィックス並列処理装置にあって、描画処理装
置側の制御ハードウェアにおいて、コマンドに格納され
ている分配方法を識別する手段と、１つ前のコマンドを
転送したプロセッサ情報を格納する手段と、現在転送可
能なプロセッサ情報を識別する手段とを有し、前記識別
手段で識別した分配方法と前記記憶した１つ前の転送プ
ロセッサ情報と前記識別手段で識別した転送可能なプロ
セッサ情報とを用いて最適な転送先プロセッサを選択す
ることを特徴とするグラフィックス並列処理装置。