JP2002207711A

JP2002207711A - グラフィックス負荷分散処理装置

Info

Publication number: JP2002207711A
Application number: JP2001003143A
Authority: JP
Inventors: Zenichi Takeji; 善一武次
Original assignee: NEC Engineering Ltd
Current assignee: NEC Engineering Ltd
Priority date: 2001-01-11
Filing date: 2001-01-11
Publication date: 2002-07-26

Abstract

(57)【要約】【課題】装置全体のスループット性能を向上可能なグ
ラフィックス負荷分散処理装置を提供する。【解決手段】負荷分散処理部２はホストバス１００か
ら転送されてきた描画データをローカルバス２０１，２
０２を介して、並列処理実行部３の処理部３１−１〜３
１−ｍ，３２−１〜３２−ｎから適当な処理部を決定し
て転送する。負荷分散処理部２は描画データの転送先を
任意のタイミングで切換えるためのコマンドを発行す
る。並列処理実行部３は負荷分散処理部２から転送され
てきた描画データにしたがってジオメトリ処理を行う。
処理結果選択部４は並列処理実行部３でジオメトリ処理
された描画データをローカルバス３０１，３０２を介し
て受取り、ローカルバス３０１，３０２からきた描画デ
ータのいずれかをレンダリングハードウェア５へ送出す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はグラフィックス負荷
分散処理装置に関し、特に並列実行可能なマルチプロセ
ッサを備え、高品位なグラフィックスをリアルタイムに
表示するグラフィックス並列処理装置に関する。

【０００２】

【従来の技術】並列実行可能なマルチプロセッサを備え
たグラフィックス処理は、パーソナル・コンピュータ、
ワークステーション、ゲーム装置に用いられるコンピュ
ータ・グラフィックス・システムにおいて高速処理を実
現するために用いられている。

【０００３】特に、３次元グラフィックス・システムで
は、複雑な描画データの組み合わせで構成されており、
極端にデータ長の違う描画データが混在したり、描画順
序を保証しなければならないという制限を要求されてい
る。

【０００４】マルチプロセッサで効率的に並列処理する
ために描画データを上手く分割する方法については、特
開平１０−２４０７００号公報に、３次元グラフィック
ス描画プログラムをマルチプロセッサ構成の描画処理装
置で処理する際の負荷分散処理を、２段階に分けてホス
トコンピュータと描画処理装置とで行う方法が記載され
ている。

【０００５】上記の描画処理装置の一例を図１０に示
す。図１０において、描画処理装置６はホスト１に接続
されており、入力ＦＩＦＯ（ＦｉｒｓｔＩｎＦｉｒ
ｓｔＯｕｔ）６１，６４，６５と、負荷分散制御部６２
と、バスアービタ６３と、描画演算プロセッサ６６，６
７と、出力ＦＩＦＯ６８，６９と、レンダリングハード
ウェア７０とから構成されている。

【０００６】また、ホスト１はＣＰＵ（中央処理装置）
１１とメモリ１２とキーボード１３とを備えており、こ
れらホスト１と描画処理装置６とによって３次元グラフ
ィックス描画処理を行う際の負荷分散処理を２段階に分
けて行っている。

【０００７】

【発明が解決しようとする課題】上述した従来のグラフ
ィックス並列処理装置では、マルチプロセッサ構成で処
理を実行する際のプロセッサ決定時の負荷分散を、効率
よく分配することができなかった場合、マルチプロセッ
サ構成で処理を実行した後、処理部の中から１つの処理
部を選択する時に無駄な待ち時間が発生しているので、
その無駄な待ち時間が装置全体のスループット性能を悪
化させてしまうという問題がある。

【０００８】また、描画コマンドを上手く分割する技術
として、各プロセッサの前段に入力ＦＩＦＯを備え、描
画コマンドを送出する処理部を決定する時に入力ＦＩＦ
Ｏの空き状態を参照する方法で解決しているが、この方
法では描画データの数だけを判断し、描画データに設定
されているコマンド内容によって異なる処理時間を考慮
していないため、描画データの数と描画データの処理時
間とが異なるという問題がある。

【０００９】さらに、並列処理実行部と処理結果選択部
との間を一つのローカルバスで制御すると、各処理部で
処理結果選択部への描画データの転送準備ができても、
処理結果選択部へ描画データを転送できないという状態
が増加するため、各処理部での処理ができなくなってし
まい、ついには装置全体のスループット性能を低下させ
てしまうので、並列処理実行部内の処理部の数が増加す
ると、並列処理実行部と処理結果選択部との間のローカ
ルバスの負担が増加するという問題がある。

【００１０】そこで、本発明の目的は上記の問題点を解
消し、装置全体のスループット性能を向上させることが
できるグラフィックス負荷分散処理装置を提供すること
にある。

【００１１】

【課題を解決するための手段】本発明によるグラフィッ
クス負荷分散処理装置は、複数の処理手段からなりかつ
マルチプロセッサ構成の並列処理実行手段と、前記複数
の処理手段のいずれかを選択する負荷分散処理手段と、
前記並列処理実行手段内に描画データをどれだけ送出し
たかを予想する手段と、複数の入力用ＦＩＦＯ（Ｆｉｒ
ｓｔＩｎＦｉｒｓｔＯｕｔ）メモリを持ちかつ前
記複数の処理手段各々の処理結果のいずれかを選択する
処理結果選択手段と、前記処理結果選択手段の前記複数
の入力用ＦＩＦＯメモリが受信可能か否かの情報を取得
する手段とを備え、前記負荷分散処理手段で前記複数の
処理手段のうちの任意の処理手段への切換えのタイミン
グを示すコマンドを追加するよう構成している。

【００１２】すなわち、本発明のグラフィックス負荷分
散処理装置は、ホストコンピュータから描画データを負
荷分散処理部に転送し、負荷分散処理部で適切なマルチ
プロセッサ構成の並列処理実行部に転送し、並列処理実
行部内の各処理部でジオメトリ処理（座標変換、光源計
算、クリッピング等）を行い、処理結果選択部を介して
描画処理を行うレンダリングハードウェア部に転送する
３次元グラフィックス処理装置に関するものである。

【００１３】本発明のグラフィックス負荷分散処理装置
では、この３次元グラフィックス処理装置において、ホ
ストコンピュータで３次元グラフィックス描画プログラ
ムから３次元グラフィックスコマンドを受取って３次元
グラフィックスコマンドの性質によって変換した描画デ
ータを負荷分散処理部にバスを介して転送を行う手段
と、描画データを処理部内の描画演算プロセッサの稼動
状況を予測して最適な処理部へ分配して最適に分割する
手段と、描画データを処理部にバスを介して転送を行う
手段と、複数のバスを介してマルチプロセッサ構成の並
列処理実行部から転送されてくる複数の描画データの中
からいずれかを決定する手段と、負荷分散処理部と並列
処理実行部との間及び並列処理実行部と処理結果選択部
との間のバス状況によるデータ転送ロスを軽減するため
のＦＩＦＯと、負荷分散処理部で決定した処理部の情報
を蓄積する手段とを有している。

【００１４】本発明のグラフィックス負荷分散処理装置
では、上記のように構成し、マルチプロセッサ構成の処
理部の処理負荷を予測し、入力される描画データを送出
する並列処理実行部を決定し、各処理部の使用頻度を均
等にし、使用効率を最大にする（待機時間をなくす）よ
うに分配し、各処理部の中から１つの処理部を選択して
処理結果選択部へ描画データを送出させることによっ
て、グラフィックス並列処理装置全体のスループット性
能の向上が可能となる。

【００１５】つまり、マルチプロセッサ構成の並列処理
実行部で極端にデータ長の違う描画データの混在のため
に発生する処理部間での待機時間を削減することによっ
て、グラフィックス並列処理装置全体のスループット性
能を向上させることが可能となる。

【００１６】

【発明の実施の形態】次に、本発明の一実施例について
図面を参照して説明する。図１は本発明の一実施例によ
るグラフィックス並列処理装置の構成を示すブロック図
である。図１において、本発明の一実施例によるグラフ
ィックス並列処理装置はホストバス１００と、負荷分散
処理部２と、ローカルバス２０１，２０２，３０１，３
０２，４０１と、並列処理実行部３と、処理結果選択部
４とから構成され、このグラフィックス並列処理装置は
ホストバス１００を介してホスト１に接続されている。
尚、ホスト１はＣＰＵ（中央処理装置）１１とメモリ１
２とキーボード１３とを備えている。

【００１７】負荷分散処理部２は入力ＦＩＦＯ部２１
と、コマンド分割部２２と、出力ＦＩＦＯ部２３，２４
と、出力バス制御部２５，２６とから構成されている。
また、負荷分散処理部２はホストバス１００とローカル
バス２０１，２０２とを介して並列処理実行部３に、ロ
ーカルバス４０１を介して処理結果選択部４にそれぞれ
接続され、ホストバス１００から転送されてきた描画デ
ータをマルチプロセッサ構成の並列処理実行部３の中か
ら任意の処理部を決定し、その処理部に描画データを転
送する機能と、描画データを転送する処理部を任意のタ
イミングで切換えるためのコマンドを発行する機能と、
選択した処理部の決定情報を転送する機能とを有してい
る。

【００１８】並列処理実行部３は複数の処理部３１−１
〜３１−ｍ，３２−１〜３２−ｎとから構成され、処理
部３１−１〜３１−ｍ，３２−１〜３２−ｎ各々は入力
ＦＩＦＯ部３１１−１〜３１１−ｍ，３２１−１〜３２
１−ｎ（入力ＦＩＦＯ部３１１−２〜３１１−ｍ，３２
１−１〜３２１−ｎは図示せず）と、描画演算プロセッ
サ３１２−１〜３１２−ｍ，３２２−１〜３２２−ｎ
（描画演算プロセッサ３１２−２〜３１２−ｍ，３２２
−１〜３２２−ｎは図示せず）と、出力ＦＩＦＯ部３１
３−１〜３１３−ｍ，３２３−１〜３２３−ｎ（出力Ｆ
ＩＦＯ部３１３−２〜３１３−ｍ，３２３−１〜３２３
−ｎは図示せず）と、パイプ認識部３１４−１〜３１４
−ｍ，３２４−１〜３２４−ｎ（パイプ認識部３１４−
２〜３１４−ｍ，３２４−１〜３２４−ｎは図示せず）
と、出力バス制御部３１５−１〜３１５−ｍ，３２５−
１〜３２５−ｎ（出力バス制御部３１５−２〜３１５−
ｍ，３２５−１〜３２５−ｎは図示せず）とから構成さ
れている。

【００１９】また、並列処理実行部３はローカルバス３
０１，３０２を介して処理結果選択部３に接続され、負
荷分散処理部２から転送されてきた描画データにしたが
ってジオメトリ処理（座標変換、光源計算、クリッピン
グ等）を行う機能を有している。

【００２０】処理結果選択部４は入力ＦＩＦＯ部４１，
４２と、命令選択部４３とから構成されている。また、
処理結果選択部４はレンダリングハードウェア５と接続
され、並列処理実行部３でジオメトリ処理された描画デ
ータを受取り、ローカルバス３０１，３０２を介して転
送されてきた描画データの描画順序を維持して送出する
機能を有している。

【００２１】負荷分散処理部２の入力ＦＩＦＯ部２１は
ホストバス１００とコマンド分割部２２とに接続され、
ホストバス１００を制御し、ホストバス１００と負荷分
散処理部２との間での転送ロスを軽減し、転送されてく
る描画データを保持する機能を有している。

【００２２】コマンド分割部２２は出力ＦＩＦＯ部２
３，２４と処理結果選択部４内の命令選択部４３とに接
続され、転送されてくる描画データをマルチプロセッサ
構成の並列処理実行部３の負荷状況を予測し、効率よく
並列処理実行部３へ分配する機能を有している。

【００２３】出力ＦＩＦＯ部２３は出力バス制御部２５
に接続され、入力された描画データを負荷分散処理部２
内で並列処理実行部３とのデータ転送ロスをなくし、描
画データを保持する機能を有している。また、出力ＦＩ
ＦＯ部２４は出力バス制御部２６に接続され、入力され
た描画データを負荷分散処理部２内で並列処理実行部３
とのデータ転送ロスをなくし、描画データを保持する機
能を有している。

【００２４】出力バス制御部２５はローカルバス２０１
に接続され、出力ＦＩＦＯ部２３から送出された描画デ
ータをローカルバス２０１を介して並列処理実行部３内
の処理部３１−１〜３１−ｍに転送する機能を有してい
る。また、出力バス制御部２６はローカルバス２０２に
接続され、出力ＦＩＦＯ部２４から送出された描画デー
タをローカルバス２０２を介して並列処理実行部３内の
処理部３２−１〜３２−ｎに転送する機能を有してい
る。

【００２５】並列処理実行部３内の処理部３１−１〜３
１−ｍ，３２−１〜３２−ｎについては、以下、処理部
３１−１を用いて説明する。処理部３１−１の入力ＦＩ
ＦＯ部３１１−１はローカルバス２０１と描画演算プロ
セッサ３１２−１とに接続され、ローカルバス２０１を
制御し、ローカルバス２０１と処理部３１−１との間で
の転送ロスを軽減し、転送されてくる描画データを保持
する機能を有している。

【００２６】描画演算プロセッサ３１２−１は出力ＦＩ
ＦＯ部３１３−１に接続され、入力ＦＩＦＯ部３１１−
１から転送されてきた描画データ内の描画コマンドを識
別してジオメトリ処理を行い、その結果を出力ＦＩＦＯ
部３１３−１へ送出する機能を有している。

【００２７】出力ＦＩＦＯ部３１３−１はパイプ認識部
３１４−１に接続され、パイプ認識部３１４−１へ描画
データを送出できない場合、描画データを保持し、並列
処理実行部３と処理結果選択部４との間での転送ロスを
軽減し、転送されてくる描画データを保持する機能を有
している。

【００２８】パイプ認識部３１４−１は出力バス制御部
３１５−１に接続され、ローカルバス３０１のマスタ権
を持っているかを判断し、マスタ権を待っている場合に
出力バス制御部３１５−１に描画データを送出する機能
と、パイプ切換え命令がないかを識別し、切換え命令の
有無によって出力バス制御部３１５−１へ描画データを
転送する機能を有している。

【００２９】出力バス制御部３１５−１はローカルバス
３０１に接続され、パイプ認識部３１４−１からの描画
データをローカルバス３０１を介して処理結果選択部４
に転送する機能を有している。

【００３０】他の処理部３１−２〜３１−ｍ，３２−１
〜３２−ｎも同様な機能を有し、処理部３１−２〜３１
−ｍはローカルバス２０１，３０１に接続され、処理部
３２−１〜３２−ｎはローカルバス２０２，３０２に接
続されている。

【００３１】処理結果選択部４の入力ＦＩＦＯ部４１は
ローカルバス３０１と命令選択部４３とに接続され、ロ
ーカルバス３０１を制御し、ローカルバス３０１と命令
選択部４３との間での転送ロスを軽減し、転送されてく
る描画データを保持する機能を有している。

【００３２】入力ＦＩＦＯ部４２はローカルバス３０２
と命令選択部４３とに接続され、ローカルバス３０２を
制御し、ローカルバス３０２と命令選択部４３との間で
の転送ロスを軽減し、転送されてくる描画データを保持
する機能を有している。

【００３３】命令選択部４３はレンダリングハードウェ
ア５と接続され、負荷分散処理部２から処理部３１−１
〜３１−ｍ，３２−１〜３２−ｎの選択情報を入手し、
その情報に沿って、入力ＦＩＦＯ部４１，４２から転送
される描画データのどちらを後段に送出するかを選択す
る機能を有している。

【００３４】図２は図１のコマンド分割部２２の詳細な
構成を示すブロック図である。図２において、コマンド
分割部２２はコマンド識別部２２１，２２８と、選択部
２２２と、カウンタテーブル２２３と、処理決定カウン
タ２２４〜２２７とから構成されている。

【００３５】図３は図１の命令選択部４３の詳細な構成
を示すブロック図である。図３において、命令選択部４
３は出力選択部４３１と、結果選択判断部４３２と、入
力ＦＩＦＯ４３３と、コマンド識別部４３４とから構成
されている。

【００３６】図４は図２の選択部２２２での選択条件を
示す図である。図４において、初期状態としては処理部
（＃１０）３１−１に対して分配されたコマンドが転送
されるものとする。ローカルバス２０１，２０２に接続
される処理部の数には特に制限はない。実際に接続でき
る数はハードウェアの物理的な制限によって限定される
ことになるが、本実施例では４個の処理部（＃１０）３
１−１，（＃１ｍ）３１−ｍ，（＃２０）３２−１，
（＃２ｎ）３２−ｎが接続された場合について以下説明
する。

【００３７】この処理部ｎの“ｎ”を処理部のパイプ番
号と呼ぶこととし、装置立上げ時等に予め処理部毎に全
て異なる番号が設定されているものとする。カウンタテ
ーブル２２３内のコマンド種別毎のカウント値もより正
確な値を入れることが望ましい。実際のカウンタ値はハ
ードウェアの物理的な制限によって限定されることにな
る。

【００３８】これら図１〜図４を参照して本実施例の動
作について説明する。尚、以下の説明では処理部３１−
１及びローカルバス２０１，３０１について説明する
が、他の処理部３１−２〜３１−ｍ，３２−１〜３２−
ｎ及びローカルバス２０２，３０２についてもその動作
は処理部３１−１及びローカルバス２０１，３０１と同
様である。

【００３９】負荷分散処理部２はホストバス１００を介
して転送されてきた描画データをコマンド分配方法に基
づいて分割及び分配し、ローカルバス２０１を介して処
理部３１−１へ送出する。処理部３１−１は転送されて
きた描画データ内のコマンド種別を判断してジオメトリ
処理を行い、ローカルバス３０１でマスタ権を持った
時、ローカルバス３０１を介して転送されてきた描画デ
ータを処理結果選択部４へ送出する。処理結果選択部４
は転送されてきた描画データのいずれかを選択し、レン
ダリングハードウェア５へ描画データを送出する。

【００４０】負荷分散処理部２はホストバス１００を介
して転送されてきた描画データを受取ると、入力ＦＩＦ
Ｏ部２１へ描画データを送出し、コマンド分割部２２が
描画データを引き取れない場合にその描画データを蓄積
する。

【００４１】コマンド分割部２２は入力ＦＩＦＯ部２１
から転送されてきた描画データ内に設定されるコマンド
種別を判断し、指定される処理部３１−１が接続される
出力ＦＩＦＯ部２３へ描画コマンドを送出する。同時
に、コマンド分割部２２はパイプ切換えコマンドの有無
も識別し、パイプ切換え命令がある場合に処理結果選択
部４へパイプ番号を送出する。

【００４２】出力ＦＩＦＯ部２３はローカルバス２０１
のバス状態に応じてコマンド分割部２２から転送されて
くる描画コマンドを保持し、ローカルバス２０１が後段
に転送可能な時に出力バス制御部２５へ送出する。出力
バス制御部２５はローカルバス２０１を制御し、描画デ
ータを並列処理実行部３へ送出する。

【００４３】並列処理実行部３はローカルバス２０１を
介して転送されてきた描画データを受取ると、入力ＦＩ
ＦＯ部３１１−１へ描画データを送出し、描画演算プロ
セッサ３１２−１が描画データを引き取れない場合にそ
の描画データを蓄積する。

【００４４】描画演算プロセッサ３１２−１は入力ＦＩ
ＦＯ部３１１−１から転送されてきた描画データ内に設
定されるコマンド種別を判断してジオメトリ処理を行
い、処理結果の描画データを出力ＦＩＦＯ部３１３−１
へ送出する。

【００４５】出力ＦＩＦＯ部３１３−１はパイプ認識部
３１４−１が出力バス制御部３１５−１への描画データ
の送出を許可していればその描画データを送出する。出
力ＦＩＦＯ部３１３−１は許可されていなければその描
画データを蓄積していく。

【００４６】パイプ認識部３１４−１はローカルバス３
０１のマスタ権を持っているかを判断し、バスのマスタ
権を持っている時、出力バス制御部３１５−１へ描画デ
ータを送出する。出力バス制御部３１５−１はローカル
バス３０１を制御し、描画データを処理結果選択部４へ
送出する。

【００４７】処理結果選択部４はローカルバス３０１を
介して転送されてきた描画データを受取ると、入力ＦＩ
ＦＯ部４１へ描画データを送出し、命令選択部４３が描
画データを引き取れない場合にその描画データを蓄積す
る。

【００４８】命令選択部４３は描画データが転送されて
くると、描画データ内のコマンド種別を識別し、パイプ
切換え命令がある場合に、描画順序を維持するために、
入力ＦＩＦＯ部４１，４２のいずれかの描画データを選
択し、画面への表示を行うレンダリングハードウェア５
へ描画データを送出する。

【００４９】コマンド分割部２２において、入力ＦＩＦ
Ｏ部２１に転送されてきた描画データはコマンド識別部
２２１で、描画データ内のコマンドの種別から描画コマ
ンドの種類、パイプ切換え命令がないか等が識別され、
識別結果がカウンタテーブル２２３へ、描画データが選
択部２２２へそれぞれ送出される。

【００５０】コマンド識別部２２８は出力ＦＩＦＯ部２
３，２４からそれぞれの出力バス制御部２５，２６へ描
画データを転送した時に、その描画データ内のデータ種
別を識別し、その識別結果をカウンタテーブル２２３へ
送出する。

【００５１】カウンタテーブル２２３ではコマンド種別
によって処理がどれくらいかかるかを予め入力してお
き、コマンド識別部２２１，２２８から転送されてきた
描画コマンドに対応する値を処理決定カウンタ２２４〜
２２７に送出する。

【００５２】処理決定カウンタ２２４〜２２７はカウン
タテーブル２２３から転送されてきた値を基に加算及び
減算を行い、そのカウント結果を選択部２２２へ送出す
る。カウンタ値の加算及び減算はコマンド識別部２２１
で認識したコマンドに対応した値を加算し、コマンド識
別部２２８で認識したコマンドに対応した値を減算す
る。選択部２２２は処理決定カウンタ２２４〜２２７の
結果と処理結果選択部４の信号とから描画データを送出
する出力ＦＩＦＯ部２３，２４を決定する。

【００５３】次に、命令選択部４３において、入力ＦＩ
ＦＯ部４１，４２に転送されてきた描画データはコマン
ド識別部４３４でパイプ切換え命令の有無が判断され、
パイプ切換え命令が有った場合に、入力ＦＩＦＯ４３３
に蓄積された処理部の番号を基に入力ＦＩＦＯ部４１，
４２のいずれかの描画データが選択され、レンダリング
ハードウェア５に描画データが送出される。

【００５４】結果選択判断部４３２は入力ＦＩＦＯ部４
１，４２のそれぞれのＦＩＦＯ空き容量と入力ＦＩＦＯ
４３３の空き容量とから論理和をとり、その結果を処理
結果選択部４の転送可能かどうかを示すＦＩＦＯ空き容
量として、負荷分散処理部２へ送出する。

【００５５】続いて、コマンド分割部２２の選択部２２
２で行う処理部３１−１，３１−ｍ，３２−１，３２−
ｎのパイプを切換える動作について図１〜図４を参照し
て詳細に説明する。現在動作中の処理部を処理部（＃１
０）３１−１とし、これを処理部（＃２０）３２−１に
切換えるものとする。

【００５６】コマンド分割部２２は処理部を切換える必
要が生じた場合、今まで描画データを転送していた処理
部（＃１０）３１−１に対してパイプ切換えコマンドと
処理部（＃２０）３２−１に切換えるためのパイプ番号
を転送する。また、次に転送される処理部（＃２０）３
２−１にも開始情報を持ったパイプ切換えコマンドを転
送し、処理部（＃１０）３１−１の描画コマンドの転送
が終了すると、処理部（＃２０）３２−１の描画コマン
ドを引き取るという情報を処理結果選択部４で認識でき
るようにする。

【００５７】切換えタイミングの発行方法は、ホスト１
が規定の描画データ毎にプロセッサの切換えタイミング
を指示する方法と、負荷分散処理部２内部で数の多い頂
点列データを規定の頂点毎に切換えタイミングをコマン
ドに追加して指示する方法とがあるが、その切換えタイ
ミング毎にこの動作を行う。

【００５８】処理結果選択部４内の結果選択判断部４３
２でもつＦＩＦＯ空き容量信号と、処理決定カウンタ２
２４〜２２７の値とから、描画データを送出する処理部
３１−１，３１−ｍ，３２−１，３２−ｎを決定し、結
果を処理結果選択部４内の入力ＦＩＦＯ４３３に転送す
る処理部の情報を、決定した処理部が接続されている出
力ＦＩＦＯ部２３，２４に描画データを送出する。

【００５９】前回処理を行った処理部の状態値を保持し
ているレジスタが処理部（＃１０）３１−１を示してい
る場合に処理部の切換え命令が入った描画データが転送
されてきた場合、処理部（＃１０）３１−１の時の結果
選択判断部４３２から送出されるＦＩＦＯ空き容量と、
処理決定カウンタ２２４〜２２７の状態とを調べる。

【００６０】ＦＩＦＯ空き容量が既定値より少ない場合
や、処理決定カウンタ２２４〜２２７が既定値より少な
い場合を処理可能とし、両方の値が処理可能を示してい
る場合、転送されてきた描画データを対応する処理部へ
送出させる。

【００６１】まず、結果選択判断部４３２から送出され
るＦＩＦＯ空き容量がどのような状態かを調べ、空き容
量があるか判断し、“可能”な場合には処理決定カウン
タ２２４〜２２７の値を見る。

【００６２】ともに“不可”の場合には、次の描画デー
タからは処理部（＃２０）３２−１が接続される出力Ｆ
ＩＦＯ部２４へ描画データを送出し、処理部（＃２０）
３２−１へ転送したことを示す状態値を入力ＦＩＦＯ４
３３へ送出する。

【００６３】また、処理決定カウンタ２２６の状態が
“不可”を示している場合には、処理決定カウンタ２２
６の状態を調べる。可能な場合には処理部（＃２ｎ）３
２−ｎが接続される出力ＦＩＦＯ部２４へ描画データを
送出し、処理部（＃２ｎ）３２−ｎへ転送したことを示
す状態値を入力ＦＩＦＯ４３３へ送出する。

【００６４】複数の処理部に同時に描画データを書込む
場合には、複数のＦＩＦＯ空き容量、処理決定カウンタ
２２４〜２２７の値を参考にして、上記と同様な処理が
行われる。また、描画データの中にパイプ切換え情報が
コマンド種別に設定されている場合には上述した処理を
繰り返す。

【００６５】図５は転送される描画データのフォーマッ
トの一例を示す図である。図５（ａ）は描画コマンド
（図形処理を必要とするコマンド、パイプ切換えコマン
ド、転送データ容量等）の情報を持つコマンド群を示
し、図５（ｂ）はデータ設定（描画データ、パイプ切換
え先データ等）の情報を持つデータ群を示している。描
画データは描画コマンドとデータ設定とで構成され、デ
ータ設定の数は描画コマンド内の転送サイズで判断す
る。

【００６６】図６及び図７は図１のコマンド分割部２２
の処理動作を示すフローチャートであり、図８は図１の
命令選択部４３の処理動作を示すフローチャートであ
り、図９は図２の処理決定カウンタ２２４〜２２７の処
理動作を示すフローチャートである。これら図１〜図９
を参照してコマンド分割部２２と命令選択部４３と処理
決定カウンタ２２４〜２２７とについてそれぞれの動作
を説明する。

【００６７】負荷分散処理部２のコマンド分割部２２は
入力ＦＩＦＯ部２１に転送されてきた描画データをコマ
ンド識別部２２１で、描画データ内のコマンドの種別か
ら描画コマンドの種類、パイプ切換え命令がないか等を
識別し、その識別結果をカウンタテーブル２２３へ、描
画データを選択部２２２へそれぞれ送出する（図６ステ
ップＳ１）。

【００６８】コマンド識別部２２８は出力ＦＩＦＯ部２
３，２４からそれぞれの出力バス制御部２５，２６へ描
画データを転送した時に、その描画データ内のデータ種
別を識別し、その識別結果をカウンタテーブル２２３へ
送出するカウンタテーブル２２３ではコマンド種別によ
って処理がどれくらいかかるかを予め入力しておき、コ
マンド識別部２２１，２２８から転送されてきた描画コ
マンドに対応する値を処理決定カウンタ２２４〜２２７
に送出する（図６ステップＳ２）。

【００６９】選択部２２２は処理決定カウンタ（＃０〜
＃３）２２４〜２２７の結果と処理結果選択部４の信号
とから描画データを送出する出力ＦＩＦＯ部２３，２４
を決定する。つまり、選択部２２２は処理結果選択部４
からのＦＩＦＯ容量の空きはあるかを判断し（図６ステ
ップＳ３）、ＦＩＦＯ容量の空きがあれば、処理決定カ
ウンタ（＃０〜＃３）２２４〜２２７のカウンタ値が規
定値未満かを判断する（図６ステップＳ４）。

【００７０】選択部２２２は処理決定カウンタ（＃０〜
＃３）２２４〜２２７のカウンタ値が規定値未満であれ
ば、パイプ切換え命令があるかどうかを判断する（図６
ステップＳ５）。選択部２２２はパイプ切換え命令がな
ければ、描画コマンドをカレント（出力ＦＩＦＯ部２
３，２４のうちの現在使用中のＦＩＦＯ）に転送する
（図６ステップＳ６）。

【００７１】選択部２２２はパイプ切換え命令があれ
ば、入力ＦＩＦＯ部４１，４２のＦＩＦＯ容量が空いて
いるかどうかを判断する（図６ステップＳ７）。選択部
２２２は入力ＦＩＦＯ部４１のＦＩＦＯ容量が空いてい
ると判断すると、処理決定カウンタ（＃０，＃１）２２
４，２２５のうちの処理が可能な方を判断する（図６ス
テップＳ８）。

【００７２】選択部２２２は処理決定カウンタ（＃０）
２２４の処理が可能と判断すると、描画コマンドにパイ
プ切換え命令を追加し（図６ステップＳ９）、出力ＦＩ
ＦＯ部２３及び出力バス制御部２５を介して処理部（＃
１０）３１−１へ描画コマンドを転送する（図６ステッ
プＳ１０）。

【００７３】また、選択部２２２は処理決定カウンタ
（＃１）２２５の処理が可能と判断すると、描画コマン
ドにパイプ切換え命令を追加し（図６ステップＳ１
１）、出力ＦＩＦＯ部２３及び出力バス制御部２５を介
して処理部（＃１ｍ）３１−ｍへ描画コマンドを転送す
る（図６ステップＳ１２）。

【００７４】さらに、選択部２２２は処理決定カウンタ
（＃０，＃１）２２４，２２５がその他の状態であれ
ば、描画コマンドをカレント（出力ＦＩＦＯ部２３，２
４のうちの現在使用中のＦＩＦＯ）に転送する（図６ス
テップＳ６）。

【００７５】一方、選択部２２２は入力ＦＩＦＯ部４２
のＦＩＦＯ容量が空いていると判断すると、処理決定カ
ウンタ（＃２，＃３）２２６，２２７のうちの処理が可
能な方を判断する（図７ステップＳ１３）。

【００７６】選択部２２２は処理決定カウンタ（＃２）
２２６の処理が可能と判断すると、描画コマンドにパイ
プ切換え命令を追加し（図７ステップＳ１４）、出力Ｆ
ＩＦＯ部２４及び出力バス制御部２６を介して処理部
（＃２０）３２−１へ描画コマンドを転送する（図７ス
テップＳ１５）。

【００７７】また、選択部２２２は処理決定カウンタ
（＃３）２２７の処理が可能と判断すると、描画コマン
ドにパイプ切換え命令を追加し（図７ステップＳ１
６）、出力ＦＩＦＯ部２４及び出力バス制御部２６を介
して処理部（＃２ｎ）３２−ｎへ描画コマンドを転送す
る（図７ステップＳ１７）。

【００７８】さらに、選択部２２２は処理決定カウンタ
（＃２，＃３）２２６，２２７がその他の状態であれ
ば、描画コマンドをカレント（出力ＦＩＦＯ部２３，２
４のうちの現在使用中のＦＩＦＯ）に転送する（図６ス
テップＳ６）。

【００７９】処理結果選択部４の命令選択部４３は入力
ＦＩＦＯ部４１，４２に転送されてきた描画データをコ
マンド識別部４３４でコマンド種別を判別し（図８ステ
ップＳ２１）、パイプ切換え命令があるかどうかを判別
する（図８ステップＳ２２）。命令選択部４３はパイプ
切換え命令がなければ、同じ入力ＦＩＦＯ部４１，４２
の描画データを選択してレンダリングハードウェア５に
出力する（図８ステップＳ２３）。

【００８０】また、命令選択部４３はパイプ切換え命令
があれば、入力ＦＩＦＯ４３３が入力ＦＩＦＯ部４１を
選択していれば（図８ステップＳ２４）、入力ＦＩＦＯ
部４１の描画データを選択してレンダリングハードウェ
ア５に出力する（図８ステップＳ２５）。

【００８１】さらに、命令選択部４３は入力ＦＩＦＯ４
３３が入力ＦＩＦＯ部４２を選択していれば（図８ステ
ップＳ２４）、入力ＦＩＦＯ部４２の描画データを選択
してレンダリングハードウェア５に出力する（図８ステ
ップＳ２６）。

【００８２】負荷分散処理部２のコマンド分割部２２に
おいて、処理決定カウンタ２２４〜２２７はカウンタテ
ーブル２２３から転送されてきた値を基に加算及び減算
を行い、そのカウント結果を選択部２２２へ送出する。
カウンタ値の加算及び減算はコマンド識別部２２１で認
識したコマンドに対応した値を加算し、コマンド識別部
２２８で認識したコマンドに対応した値を減算する。

【００８３】これら処理決定カウンタ２２４〜２２７に
おいては入力ＦＩＦＯ部２１に転送されてきた描画デー
タのコマンド種別が判別されると（図９ステップＳ３
１）、カウンタテーブル２２３のカウンタ値を読込む
（図９ステップＳ３２）。

【００８４】処理決定カウンタ２２４〜２２７は加算の
カウンタ値がセットされ（図９ステップＳ３３）、減算
のカウンタ値がセットされていれば（図９ステップＳ３
４）、加算減算処理を行い（図９ステップＳ３５）、そ
のカウンタ結果を出力する（図９ステップＳ３７）。

【００８５】また、処理決定カウンタ２２４〜２２７は
減算のカウンタ値がセットされていなければ（図９ステ
ップＳ３４）、加算処理を行い（図９ステップＳ３
６）、そのカウンタ結果を出力する（図９ステップＳ３
７）。

【００８６】一方、処理決定カウンタ２２４〜２２７は
加算のカウンタ値がセットされず（図９ステップＳ３
３）、減算のカウンタ値がセットされていれば（図９ス
テップＳ３８）、処理決定カウンタで減算処理を行い
（図９ステップＳ３９）、そのカウンタ結果を出力する
（図９ステップＳ３７）。

【００８７】処理決定カウンタ２２４〜２２７は減算の
カウンタ値がセットされていなければ（図９ステップＳ
３８）、処理を行わずに（図９ステップＳ４０）、その
カウンタ結果を出力する（図９ステップＳ３７）。

【００８８】このように、負荷分散処理部２で負荷の見
積もりを行うことで、処理部３１−１〜３１−ｍ，３２
−１〜３２−ｎでの処理時間を予測することができ、並
列処理後の結果の情報（転送状況）をみることによっ
て、実際に負荷分散がうまくなされているかを判断する
ことができるので、グラフィックス並列処理装置全体の
スループット性能の向上を図ることができる。

【００８９】これら２つの処理を行うことによって、各
処理部３１−１〜３１−ｍ，３２−１〜３２−ｎの負荷
情報を正しく評価し、並列処理実行部３の複数ある処理
部３１−１〜３１−ｍ，３２−１〜３２−ｎの使用頻度
を均等にして仕様効率を最大にすることができ、並列処
理実行部３の処理部３１−１〜３１−ｍ，３２−１〜３
２−ｎ間の待機時間を減少させることができるため、グ
ラフィックス並列処理装置全体のスループット性能の向
上を図ることができる。

【００９０】また、複数のローカルバス２０１，２０
２，３０１，３０２を用いて処理することで、並列処理
実行部３と処理結果選択部４との間のローカルバス３０
１，３０２での転送ロス時間を減少させることができる
ため、グラフィックス並列処理装置全体のスループット
性能の向上を図ることができる。

【００９１】

【発明の効果】以上説明したように本発明によれば、複
数の処理手段からなりかつマルチプロセッサ構成の並列
処理実行手段と、複数の処理手段のいずれかを選択する
負荷分散処理手段と、並列処理実行手段内に描画データ
をどれだけ送出したかを予想する手段と、複数の入力用
ＦＩＦＯメモリを持ちかつ複数の処理手段各々の処理結
果のいずれかを選択する処理結果選択手段と、複数の入
力用ＦＩＦＯメモリが受信可能か否かの情報を取得する
手段とを配設し、負荷分散処理手段で複数の処理手段の
うちの任意の処理手段への切換えのタイミングを示すコ
マンドを追加することによって、装置全体のスループッ
ト性能を向上させることができるという効果がある。

【図面の簡単な説明】

【図１】本発明の一実施例によるグラフィックス並列処
理装置の構成を示すブロック図である。

【図２】図１のコマンド分割部の詳細な構成を示すブロ
ック図である。

【図３】図１の命令選択部の詳細な構成を示すブロック
図である。

【図４】図２の選択部での選択条件を示す図である。

【図５】（ａ）は描画コマンドの情報を持つコマンド群
を示す図、（ｂ）はデータ設定の情報を持つデータ群を
示す図である。

【図６】図１のコマンド分割部２２の処理動作を示すフ
ローチャートである。

【図７】図１のコマンド分割部の処理動作を示すフロー
チャートである。

【図８】図１の命令選択部の処理動作を示すフローチャ
ートである。

【図９】図２の処理決定カウンタの処理動作を示すフロ
ーチャートである。

【図１０】従来例によるグラフィックス並列処理装置の
構成を示すブロック図である。

【符号の説明】

１ホスト２負荷分散処理部３並列処理実行部４処理結果選択部５レンダリングハードウェア１１ＣＰＵ１２メモリ１３キーボード２１，４１，４２，３１１−１入力ＦＩＦＯ部２２コマンド分割部２３，２４，３１３−１出力ＦＩＦＯ部２５，２６，３１５−１出力バス制御部３１−１〜３１−ｍ，３２−１〜３２−ｎ処理部４３命令選択部１００ホストバス２０１，２０２，３０１，３０２，４０１ローカルバ
ス２２１，２２８，４３４コマンド識別部２２２選択部２２３カウンタテーブル２２４〜２２７処理決定カウンタ３１２−１描画演算プロセッサ３１４−１パイプ認識部４３１出力選択部４３２結果選択判断部４３３入力ＦＩＦＯ

Claims

【特許請求の範囲】

【請求項１】複数の処理手段からなりかつマルチプロ
セッサ構成の並列処理実行手段と、前記複数の処理手段
のいずれかを選択する負荷分散処理手段と、前記並列処
理実行手段内に描画データをどれだけ送出したかを予想
する手段と、複数の入力用ＦＩＦＯ（ＦｉｒｓｔＩｎ
ＦｉｒｓｔＯｕｔ）メモリを持ちかつ前記複数の処
理手段各々の処理結果のいずれかを選択する処理結果選
択手段と、前記処理結果選択手段の前記複数の入力用Ｆ
ＩＦＯメモリが受信可能か否かの情報を取得する手段と
を有し、前記負荷分散処理手段で前記複数の処理手段の
うちの任意の処理手段への切換えのタイミングを示すコ
マンドを追加するよう構成したことを特徴とするグラフ
ィックス負荷分散処理装置。
【請求項２】前記並列処理実行手段の前記複数の処理
手段各々を複数のローカルバスのいずれかに接続するよ
う構成したことを特徴とする請求項１記載のグラフィッ
クス負荷分散処理装置。
【請求項３】負荷分散の見積もり情報を生成する手段
を前記並列処理実行手段の前段及び後段に含み、前記負
荷分散処理手段で前記負荷分散の時間誤差を再確認する
よう構成したことを特徴とする請求項１または請求項２
記載のグラフィックス負荷分散処理装置。
【請求項４】前記負荷分散処理手段から前記複数のロ
ーカルバスを介して転送される描画データと前記並列処
理実行手段から前記複数のローカルバスを介して転送さ
れる描画データとを、前記並列処理実行手段内の処理時
間に関わらず、前記処理結果選択手段で前記描画データ
の順序通り転送させるようにしたことを特徴とする請求
項２または請求項３記載のグラフィックス負荷分散処理
装置。