JPH04139591A

JPH04139591A - 画像生成装置

Info

Publication number: JPH04139591A
Application number: JP26428690A
Authority: JP
Inventors: Akira Iwata; 彰岩田
Original assignee: Erumano Sumiwa Kk
Current assignee: Erumano Sumiwa Kk
Priority date: 1990-10-01
Filing date: 1990-10-01
Publication date: 1992-05-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、レイトレーシンク法を用いた３次元コンピュ
ータグラフィックスに係り、詳しくは視点と画面上の各
画素とを結ぶ視線と対象空間中の物体との交点を予め区
分されたポリゴン毎に探索する交点探索処理を、少ない
メモリで、且つ高速で処理することかできる画像生成装
置に関する。

（従来の技術）従来、３次元コンピュータグラフィックスの画像生成ア
ルゴリズムとして、レイトレーシンク法かある。この手
法は、光線追跡法とも呼ばれ、視点と画面上の各画素と
を結ぶ視線を１本１本追跡する手法であるため、他の手
法では表現か不可能な反射、屈折、影のある画像を生成
することか可能であり、簡単なアルゴリズムであるにも
かかわらず、高品質なコンピュータグラフィックスの画
像か得られるため、注目されている手法である。

しかしなから、少なくとも、得られる画像のピクセル（
画素）数の光線追跡をしなければならないことから多大
な計算時間を必要とするため、この計算時間の短縮が大
きな課題となっている。

レイトレーシング法は、モデリング処理と交点探索処理
とシェーディング処理から成っている。

モデリング処理は、物体形状を多数の微小三角形（ポリ
ゴン）で表現するだめのデータを生成する処理であり、
汎用のＣＡＤなどを用いて作成した物体データをコンバ
ータに通すことにより、生成するものである。更に、視
線や光源など、環境モデルの情報を生成する処理も含ま
れる。

また、レイトレーシング法特有の交点探索処理は、視点
と画面上の各画素とを結ぶ視線を考え、その視線と対象
空間中の物体との交点を、予め区分されたポリコン毎に
探索する処理であり、交点か存在しない場合、その画素
か背景であることを意味する。また、交点が多数存在す
る場合、実際には視点に最も近い点か見えることから、
視点との距離か最小の交点のみを有効にする。

更に、シェーディング処理は、前記交点か存在する場合
に、前記物体のデータから前記画面上の輝度を求めるも
のである。

尚、第１図は、以上のようなレイトレーシング法の原理
図であり、第２図はレイトレーシング法の計算アルコリ
ズムを示したフローチャートである。また、第３図は交
点探索処理を示すサブルーチンフローチャートである。

第１図を参照しなからレイトレーシング法を説明すると
、レイトレーシング法は、対象空間中にある物体１，２
の形状を表現するポリゴンデータや、視点３と画面４上
の各画素５とを結ぶ視線６のデータ、及び光源７などの
環境モデルデータを作成するモデリング処理と、前記視
線６と対象空間中の物体１．２との交点ＣＰを、予め区
分された多数のポリゴン８毎に探索する交点探索処理と
、前記交点ＣＰが存在する場合に前記物体１，２のデー
タに基づいて前記画面４上の輝度を求めるシェーディン
グ処理とを行うものであり、それぞれの処理を第２図、
第３図のフローチャートで示したアルゴリズムに従って
行うものである。

上記レイトレーシング法におけるモデリング処理と交点
探索処理とシェーディング処理の内、モデリング処理は
、表示するデータを予め作成する編集作業であるため、
レイトレーシング法における演算処理は交点探索処理と
シェーディング処理の二つの処理のみである。この内、
交点探索の処理時間はレイトレーシング法における演算
処理時間の大半を占める。−船釣には、単純な画像で全
体の処理時間の７５％、複雑な画像では９５％以上か交
点探索処理に費やされる。従ってレイトレーシング法に
おいて、処理時間を短縮させるためには、交点探索処理
を高速で行うことが必要であり、その高速化手法として
Ｍ　Ｉ　ＭＤ　（ＭｕｌｔｉｐｌｅＩ　ｎ５ｔｒｕｃｔ
ｉｏｎ　ｓｔｒｅａｍ　Ｍｕｌｔｉｐｌｅ　ｓｔｒｅａ
ｍ）型のマルチプロセッサシステムがある。このマルチ
プロセッサシステムは計算負荷を各要素プロセッサに分
散する方法であり、前記画面を幾つかの小領域に分散し
、それぞれの小領域における計算を各要素プロセッサに
割り振るものである。そして、各要素プロセッサは割り
振られた小領域について、それぞれ独自に交点探索処理
とシェーディング処理とを行う。この手法は、それぞれ
の小領域における計算を各要素プロセッサに割り振った
後は各要素プロセッサ間のハンドシェイクが必要ないた
め、要素プロセッサの数に比例して処理の高速化を図る
ことが可能である。

上記マルチプロセッサシステムのメモリ構成手段として
は、大きく分けて次の二つがある。

第１の構成手段としては密結合方式であり、共有メモリ
にデータを格納しておき、各要素プロセッサからは共有
データバスを介してアクセスする方法である。

また、第２の構成手段としては疎結合方式であり、各要
素プロセッサのローカルメモリに物体データを格納して
おき、直接アクセスする方法である。

（発明が解決しようとする課題）上記従来のマルチプロセッサシステムを用いたレイトレ
ーシング法の処理高速化手段において、マルチプロセッ
サシステムのメモリ構成手段のうち、密結合方式の場合
には、物体のデータ量だけの共有メモリ空間を確保すれ
ば良いという利点を有する反面、この方式の場合には、
複数の要素プロセッサが同しバスを介してメモリをアク
セスするため、二つ以上の要素プロセッサから同時にア
クセス要求が発生したときにはアクセス競合か生じる。

アクセス競合か発生したときには、先に発生したアクセ
スが終了するまで次のアクセスが待ち状態になるため、
アクセス遅延が起きることから処理時間が長くなるとい
う問題があった。

一方、マルチプロセッサシステムのメモリ構成手段のう
ち、疎結合方式の場合には、各要素プロセッサのローカ
ルメモリに全部の物体データを格納しておくため、メモ
リアクセスの競合か生じないことからアクセス遅延か起
きないという利点を有する反面、物体データを格納する
メモリが大量に必要である。即ち、各要素プロセッサの
ローカルメモリに物体データ全部を格納しておくため、
システム全体として、物体データ×要素プロセッサ骨の
ローカルメモリを必要とする。

実際には、各要素プロセッサにおいて高速に物体データ
を参照することができるように、第２のメモリ構成手段
としての疎結合方式を採用する場合が殆どである。その
ため、実際に複雑な物体を描こうとすると膨大なメモリ
か必要になり、実際の制作業務では３０Ｍバイト程のデ
ータを扱うことか多く、それ以上のメモリ容量を必要と
する場合もあることから、使用メモリ量を少なくするこ
とができないという問題があった。

そこで本発明では、レイトレーシング法において処理時
間の多くを占める交点探索処理を、少ないメモリで高速
に処理することにより、画像生成を安価に、且つ画像生
成のための処理時間を短縮することを解決すべき技術的
課題とするものである。

（課題を解決するための手段）上記課題解決のための技術的手段は、対象空間中にある
物体の形状を表現するポリゴンデータや、視点と画面上
の各画素とを結ぶ視線データ、及び光源などの環境モデ
ルデータを作成するモデリング処理と、前記視線と対象
空間中の物体との交点を予め区分されたポリゴン毎に探
索する交点探索処理と、前記交点が存在する場合に前記
ポリゴンデータから前記画面上の輝度を求めるシェーデ
ィング処理とを行うレイトレーシング法を用いた画像生
成装置を、それぞれが前記物体の形状を表現するポリゴ
ンデータを分割して格納したローカルメモリを有すると
ともにそれぞれがパイプライン状に直列接続され、前記
視線データを順次入力したとき各段のローカルメモリに
分割格納された前記ポリゴンデータに基づいて順次交点
探索演算をしたあと演算結果を次段に伝送することによ
り視点から最も近い交点データを最終段から順次出力さ
せる複数の要素プロセッサを備えた構成にすることであ
る。

（作用）上記構成の画像処理装置によれば、モデリング処理によ
り作成された視線データが、パイプライン状に直列に接
続された複数の要素プロセッサの最前段に次々に入力さ
れると、その最前段では、視線データが入力される毎に
、そのローカルメモリに分割格納されたポリゴンデータ
に基づいて交点探索演算を行い、その演算結果を順次、
次段に出力する。前段からの演算結果を順次入力した次
段では、ローカルメモリに分割格納されたポリゴンデー
タに基づいて交点探索演算を行い、その演算結果を順次
後段に出力するというようにして、順次各段において交
点探索演算を行い、それぞれの演算結果を次の段に伝送
することにより、視点から最も近い交点データを視線デ
ータ毎に最終段の要素プロセッサからホストコンピュー
タ等に出力する。

以上のように、最初に入力された視線データに関する最
も近い交点データを最終段の要素プロセッサから出力さ
せるまでは、ｎ個の要素プロセッサがパイプライン状に
直列接続されているとすれば、１個の要素プロセッサの
処理時間のｎ倍の時間を要するが、第２番目の視線デー
タからは、見掛は上、１個の要素プロセッサの処理時間
で交点データを出力させることかできる。

（実施例）次に、本発明の実施例を図面を参照しなからｇ明する。

本実施例は、第１図、第２図、第３図に示しテ原理図、
及び計算アルコリズムに従ったレイ）Ｌ−シンク法にお
いて、処理時間の多くを占める３点探索処理を少ないメ
モリで高速に処理するこ２により、画像生成のための処
理時間を短縮する戸、めのパイプライン型アーキテクチ
ャを採用してしる。

第４図は、基本的に同一構成の複数の要素プロセッサＰ
Ｅ１．ＰＥ２．ＰＥ３．−ＰＥｎ−１゜ＰＥｎを・ぐイ
ブライン型に接続したうえ、第１邸の要素プロセッサＰ
ＥＩと最終段の要素プロセッサＰＥｎとをホストコンピ
ュータＨＣの入出力インターフェースに接続したもので
ある。また第５図は、要素プロセッサＰＥＩ、ＰＥ２．
ＰＥ３゜・・ＰＥｎ−１，ＰＥｎそれぞれの構成を示し
た構成ブロック図である。

第５図に示すように、要素プロセッサＰＥ　１゜ＰＥ２
．ＰＥ３．−ＰＥｎ−１，ＰＥｎは、ＣＰＵと、そのＣ
ＰＵの入出力側それぞれに接続されたＤ　Ｐ　Ｍ　（Ｄ
ｕａｌ　Ｐｏｒｔｓ　Ｍｅｍｏｒｙ）と、ＣＰＵに接続
されたプロクラムメモリＰＭＥＭ、及びデータメモリＤ
ＭＥＭを備えている。

要素プロセッサＰＥＩ、ＰＥ２．ＰＥ３．・・・ＰＥｎ
−１，ＰＥｎそれぞれのデータメモリ（ロカルメモリ）
ＤＭＥＭには、各要素プロセッサＰＥ１．ＰＥ２．ＰＥ
３．＝４’Ｅｎ−１．ＰＥｎか計算するポリコンのデー
タ、即ち、第１図に示した物体１．２の表面を三角形の
組合せにより表現するだめの物体データか分割格納され
ている。従って、要素プロセッサＰＥＩ、ＰＥ２．ＰＥ
３゜・・・ＰＥｎ−１，ＰＥｎ全部を合わせたデータメ
モリ容量としては物体データ分の容量かあれはよい。

次に、ポリコン８について説明する。

予め与えられたポリゴンデータより、そのポリコンを含
む平面の方程式は以下の連立方程式により表される。

（ｘ＝ｘｏ−ｔｌ　い：１−　ＸＯ）　　十ｔ２　（ｘ
２　　ＸＯ）ハ　ｙ−＝ｙｏ−ｔｌ　　（ｙｌ−ｙＯ）
　　＋ｔ２　（ｙ２−ｙＯ）ｚ　＝ｚｏ＋ｔｌ　（ｚｌ
−ｚＯ）　＋ｔ２　（ｚ２−ｚＯ）また視線の方程式は
、（ｘ　＝ｘｓ＋ｔ　ｘａｘＨｙ＝ｙｓ＋ｔ　ｘむ・（ｚ　＝＝ｚｓ−１−ｔ　ｘａｚとなる。この２つの方程式から求めた交点の座標が、ポ
リゴン８内ならば交点が存在する。計算により実際に求
める値は、第６図に示す媒介変数１１、ｔ２．ｔである
。ここでｔｌと１２は、視線６と物体１．２との交点Ｃ
Ｐが存在する場合、その交点ＣＰかポリコン８内かどう
かを判定するために用いる。視線６の方程式に示したよ
うに、ｔは視線の方向ベクトルａをｔ倍して、視点３か
ら求める交点ＣＰへのベクトルを表す変数である。計算
結果としては、このｔのみか必要である。次にポリコン
８と視線６か交差するための媒介変数ｔｌ、　ｔ２．　
ｔの条件を以下に示す。

１）ｔ＞０ならば視線６とポリゴン８を含む平面は交点をもつ。

２）　　０　＜　ｔｌ、　１２．　ｔＩＴｔ２＜　１な
らばその交点ＣＰは、ポリコン８内に存在する。

ここで１）と２）の条件を満たすとき、視線６はポリゴ
ン８と交差することになる。

なお、第６図において、交点検索に用いる既知の値とし
て、（ＰＯ＝　（ｘＯ，ｙＯ，ｚＯ）三角ポリコン３頂点　Ｉ　Ｐｌ−（ｘＬｙｌ、ｚｌ）Ｐ
２＝　　（Ｘ２．ｙ２．ｚ２）視線の開始点　　　　　Ｐｓ＝　（ｘｓ、ｙｓ、ｚｓ）
視線方向ベクトル　　　ａ＝　（ａｘ、ａシ、　ａｚ）
を用い、更に三角ポリコンの２辺を表すベクトルとして
、Ｘ１＝　（ｘｉ−ＸＯ，ｙｌ−ｙＯ，ｚｌ−ｚ［１）Ｘ
２＝　（ｘ２−ＸＯ，ｙ２−ｙＯ，ｚ２−ｚｏ）を用い
る。また、媒介変数としてｔｌ、　ｔ２．　ｔを用いる
。

前記式（１）と式（２）から、変数ｘ、ｙ、ｚを消去す
ると次のようになる。

ｙｌＸＯ）・０ａｘ） □ ａｘ７：ａｚ’ ′　χ０−ｘｓ　　゛ｙＯ−＼′Ｓ ’　ｚＯ−ｚｓ　　′□ ］ｅｔＡｆ　（ｙＯ−ｙ２）ａｚ−（ｚｏ−ｚ２）ａｙｌ（ｚＯ
−ｚｌ）ａｙ−（ｙＯ−ｙｌ）ａｚ□璽ｙＯ−ｙｌ）（
ｚｏ−ｚ２）−（ｙＯ−ｙ２）（ｚｏｚｌ）（ｚＯ−ｚ２＞ａｘ−ｆｘ（１−ｘ２）ａｚ（ｘｏ−ｘ
ｌ）ａｚ−（ｚＯ−ｚｌ　）ａｘ（２０−２１＞（ＸＯ
−Ｘ２）−（２０−Ｚ２）（ＸＯ−ＸＩ）（ｘｏ−ｘ２
）ａｙ−（ｙＯ−ｙ２）ａｘ　　　　　）　（Ｘｏ−Ｘ
Ｓ　Ｔ（ｙＯ−ｙｌ）ａｘ−（ｘ。−ｘｉ）ａｙ　　　
　四１．。−９３：□ （ｘＯ−ｘｌ）（ｙＯ−ｙ２）−（ｙＯ−＞＋２）（ｙ
Ｏ−ｙｌ）　”　ｚｏ−ｚｓヲたたし、ｅｔＡ１　（ｙｏｙｌ）（ｚ。

ｚ２）（ｙ・０２Ｈｚ０ｚｌ）ａｘ− １（ｚＯ−ｚｌ）（ｘＯ−ｘ２）−（ｚＯ−ｚ２）（ｘ
Ｏ−ｘｌ）　ｌ　　ａｙ−１（ｘＯ−ｘｌ）（ｙＯ−ｙ
２）−（ｘＯ−ｘ２）（ｙＯ−ｙｌ）ｌ　　ａｚポリゴ
ンデータは予め与えられるため、視線データ（ａｘ、　
ａｙ、　ａｚ　）及び（ＸＳ、　ｙｓ、　ｚｓ）を含ま
ない項は前処理として計算可能である。

次に、要素プロセッサＰＥＩ〜ＰＥｎの特性について説
明する。

レイトレーシングの計算には、浮動少数点の演算か不可
欠であり、しかも高い計算精度が望まれる。従って、レ
イトレーシングを行うマルチプロセッサシステムでは、
浮動少数点の演算能力をもつ要素プロセッサか必要であ
る。

また、レイトレーシングの計算処理の中には積和演算か
頻繁に現れるため、要素プロセッサには積和演算か高速
に計算可能なものを使用することか望まれる。

さらに、今回採用するアーキテクチャはマルチプロセッ
サ構成であり、プロセッサ数か増加するにしたかって、
■プロセッサの計算時間に対するプロセッサ間通信のオ
ーバーヘッド比か大きくなる。従って、システム全体の
処理を高速にするための条件として、各プロセッサ間の
通信速度か高速であることか必要である。

次に、ポリゴンデータ（物体データ）に対するレイトレ
ーシングでの交点探索処理は、各ポ１ノコンごとに同一
の計算を行い、各計算結果を比較・更新するアルゴリズ
ムで、視点３からの距離か最小の交点ＣＰを求める。こ
のアルゴリズムの特徴を以下に記す。

１、交点計算はポリゴンごとに独立している。

２、交点計算のアルゴリズムは１種類である。

３、１ポリゴンあたりの計算ステップ数の最大は一定で
ある。

４、計算結果同士を比較し、最小値を求める。

以上の処理を単純なハードウェアで行うには、複数のプ
ロセッサを並列にではな（直列に動作させるようにした
本実施例のようなパイプライン手法か有利である。即ち
、各要素プロセッサは前段の要素プロセッサの結果を入
力として受取り、求めた結果とその値を比較し、更新を
行う。このような計算を要素プロセッサ数だけ繰り返す
と最後の要素プロセッサの圧力か、視点３から最も近い
ポリゴン８との交点ＣＰを示す値（１）となる。

以上のことから、交点探索処理をハードウェア化するに
は、第４図に示すようなパイプライン型のアーキテクチ
ャか適している。

また、各要素プロセッサは並列に動作し、要素プロセッ
サ数分の異なる視線６についての計算を同時に処理する
。従って理想的にはポリゴン８と同数の要素プロセッサ
を直列に結合すると、１つめの結果を求められるまでに
ポリコン８数だけの計算時間は要するか、その後は１ポ
リゴン８の計算時間ごとに結果か得られることになる。

しかし実際には、何方というオーダーのポリゴン８につ
いて計算しなければならないことか多いのに対し、結合
可能な要素プロセッサ数は数百程度か限界であるため、
ｌ要素プロセッサで数百側のポリゴン８についての計算
を行うことになる。

次に、第７図を参照しながら要素プロセッサＰＥ１−Ｐ
Ｅｎの作用を説明する。

本実施例のパイプライン型ハードウェアで交点探索計算
を行った場合、ホストコンピュータＨから出力される各
視線データ（ｒａｙ）は、全ての１素プロセツサを順に
巡回することになる。第７［はこの巡回する様子を示し
たものである。

視線データは始め、要素プロセッサＰＥＩにツカされ、
その後ＰＥ２．ＰＥ３へと結果ととも（順に転送される
。そしてＰＥｎでの計算が完了（た段階で最終的に交点
の値が出力される。その靭は、第７図のように次々と結
果か出力されるこ４になる。従って、ｒａｙｌに対する
出力には、ｌ要素プロセッサでの処理時間のｎ倍の時間
を要するが、その他のｒａｙは見かけ上１個の要素プ［
セッサの処理時間で出力することかできる。

このことから、視線データを間断なく入力でさるならば
、ｎ個の要素プロセッサが使用されてしる場合、Ｎ本の
視線の交点探索に要する時間Ｔ　Ｌ１次の式により与え
られる。

Ｔ＝ＰＥＴ・　（Ｎ十ｎ）　　　　　　　　　　（５た
だし、ＰＥＴは１要素プロセツサでの処理に要する時間
（データ転送時間含む）である。

ここで、レイトレーシング法における処理高速化アルコ
リズムの１つである空間分割法について説明する。

空間分割法では、物体か存在する空間を〜７０ＸＥＬと
呼ばれる部分空間に分割し、各ＶＯＸＥＬ内に存在する
物体（サーフェイス）のリストを予め作成する。そして
交点探索処理のときは、視線か視点からスクリーン方向
へ進行する際に、通過するＶＯＸＥＬ内に存在する物体
に対してのみ交点探索の計算を行う。もし、最初に通過
するＶＯＸＥＬ内に視線と交差する物体か存在しないと
きは、視線が次に通過するＶＯＸＥＬを調べる。このよ
うにして交点か求められるまで、交点探索を続ける。

前処理としての空間をＶＯＸＥＬと呼ばれる部分空間に
分割する方法は、幾つかの方法か提案されている。これ
らの分割方法は等分割方式とオクトリ一方式に大別でき
る。

等分割方式では物体か定義されている３次元空間を一定
の大きさのＶＯＸＥＬに等分割する。

この方式の利点は、空間分割か物体の分布に全く無関係
に行われるため、分割に要する時間が比較的短（て済む
という点である。

逆にこの方式の欠点は、各ＶＯＸＥＬ内に存在する物体
の数にばらつきがあるために、物体が密に存在するＶＯ
ＸＥＬに対して交点探索処理を行うときに、交差判定の
計算量が多くなってしまう点である。

一方、オクリ一方式では、第８図（ａ）、第８図（ｂ）
に示すように、始めに対象の空間を８等分に分割し、中
に含まれる物体の数か予め設定された最大値を越える場
合、ＶＯＸＥＬをさらに８等分する。この処理を繰り返
し行い、各ＶＯＸＥＬ内に存在する物体の数を最大値以
下になるように分割を行う。

この方式の利点は、各ＶＯＸＥＬ内に存在する物体の数
が最大値以下に抑えられているために、物体が密に存在
する空間に対して交点検索を行う際でも、交差判定の計
算量が一定化される点である。

この方式の欠点は、前処理である分割に時間を多く要す
るという点である。

従って、物体が均等に分布しているときには等分割方式
が有利であり、物体の存在する密度か不均一な場合はオ
クトリ一方式か有効な空間分割法である。

以上のような空間分割法を本実施例に適用すると相乗的
な効果が期待できる。

本実施例のアーキテクチャで空間分割法を行うには、普
通は物体データを各要素プロセッサに均等に分配するの
に対し、前処理でＶＯＸＥＬごとにクラス分けしたデー
タをそれぞれ各要素プロセッサに均等に分配する。そし
て交点探索計算のときは、ＶＯＸＥＬ番号の情報も同時
に転送しながら、そのＶＯＸＥＬのデータに対してのみ
計算を行えば良い。

このようにして本実施例のパイプライン型アーキテクチ
ャでは容易に空間分割法を適用することが可能である。

（実験の概要）次に、レイトレーシング法の交点探索処理の高速化を図
ることを目的とした本実施例のアーキテクチャを用いて
どの程度の処理速度か得られるか、定量的に評価するた
めの実験を行ったので、その実験について説明する。

本実験では、４個の汎用ＤＳＰ　（デインタルシグナル
プロセッサ）をリング結合したアーキテクチャのアクセ
ラレータボート「ニューロターボ」を用いて、速度評価
を行った。ホストコンピュータにはパーソナルコンピュ
ータ（ＮＥＣ製ＰＣ９８０１）を使用した。

また比較のために、ワークステーション（ＳＵｎ　４／
２６０）で同一アルコリズムによるレイトレーシング処
理を行い、各処理に要するＣＰＵ時間を測定した。

（実験方法）前記「ニューロターボ」は、本来ニューラルネットワー
クの演算を高速に行うことを目的に開発されたアクセラ
レータボードである。これは、ＰＣ−９８０１（以下Ｐ
Ｃ９８と略す）のスロットに挿入して、ＰＣをホストコ
ンピュータとして動作させる。

ニューロターボの構成は第９図に示すように、４個のＤ
ＳＰ　（ＤＳＰＯ〜ＤＳＰ３）がリング結合されている
。ＤＳＰ間のデータ転送はそれぞれの間にある２ポート
メモリを読み書きすることにより、ＤＳＰ内部のデータ
転送と同じ手順、速度で行うことが可能である。ホスト
コンピュータとはＤＳＰＯのみか結合されており、デー
タ転送はその間にある２ポートメモリを介して行う。ま
た、各ＤＳＰはデータを格納しておくためのローカルメ
モリをもっている。本実験に使用したニューロターボの
各ＤＳＰは、ローカルメモリとして６４にワードのワー
キングメモリを４つもっている。

実験に用いたデータは、まず市販の３Ｄ（ディメンショ
ン）　ＣＡ　Ｄ　（Ｄｉｇｉｔａｌ　ＣＲＡＦＴ）を使
用して、３次元のサーフェイスデータ（ポリゴン形式）
を作成する。そして、このデータをツールにより適当な
フォーマットに変換する。こうしてできたポリゴンデー
タをレイトレーシングの実験に使用した。

交点探索処理に必要なデータは、ポリゴンの形状データ
のみである。この形状データは、第１０図に示すように
ポリゴンデータ（１ポリゴン１２データ）を並べた列で
ある。

また交点探索計算のためのニューロターボへの入出力デ
ータを以下に記す。

入力データ　視線データ（６データ）出力データ：視線データ、交点座標パラメータ（２デー
タ）交差するポリゴン番号（２データ　）本実験は、ニューロターボに交点探索処理をインプリメ
ントして行った場合、後述の期待する処理速度の理論値
に対して、実際にどの程度の処理速度かを検証するため
に行った。実験で行ったレイトレーシングの処理の流れ
を第１１図に示す。

基本的には標準のレイトレーシング処理であるが、ホス
トコンピュータとニューロターボとのデータ入出力経路
が１つしかないため、視線データを与える処理と、計算
結果を取り出す処理を同時に行うことは不可能である。

そのため視線データを１本１本転送する方式では、オー
バーヘッドが大きくなる。このため今回はニューロター
ボのＤＳＰｌのワーキングメモリＷＭへ予め、まとまっ
た視線データ（６４００本）を転送して、それをもとに
交点探索計算を行い、結果をＤＳＰＯのワーキングメモ
リＷＭに格納した。ここでニューロターボによる交点探
索の処理時間を、視線データの転送が完了した時刻から
、交点探索計算がそれら全部について終了する時刻まで
の時間として測定した。この後のホストコンピュータに
よるシェーディング処理は、そのニューロターボでの結
果を１つずつ取出しながら、輝度計算を行い値をを出力
する。実際のレイトレーシングでは、ここで反射・屈折
及び影の処理を行うのであるが、今回は交点探索処理に
要する時間を測定することが目的のため、反射・屈折及
び影がない条件で測定した。

（プログラムステップ数から求めた計算所要時間の理論
値）交点探索処理をニューロターボで行うために、ＤＳＰ　
（富士通型ＭＢ８６２２０）専用のアセンブリ言語でプ
ログラムを作成し実験した。このＤＳＰの１サイクルは
７５ナノ秒であるため、各命令の実行時間は実行サイク
ル数より算出てきる。

よって作成したプログラムの実行所要時間も、プログラ
ムステップ数から割り出すことかできる。

本実験では、ニューロターボの４つのＤＳＰで、同じ交
点計算プログラムを走らせたため、この部分のステップ
数は等しい。しかし、データ入出力やハンドシェークの
プログラムは異なるため、二の部分に関してはステップ
数か異なる。従って、パイプラインの中間部（プロセッ
サ数か増えるとこの部分の処理時間か増加する）にあた
るＤＳＰのステップ数で近似し、処理時間の理論値とす
る。

以下に、視線１本に対する１、　Ｄ　Ｓ　Ｐのステップ
数の計算式を示す。

Ｓ　ｔ　ｅ　ｐ　＝　ＩＮＴＥＲ３ＥＣＴＩＯＮ二Ｉ　
／　０ただし、１ＮＴＥＲ３ＥｃＴＩＯＮ＝　１６３　
ｘ　ＰＮ＋６ｘ　（Ｐ＼／’２５６）ＰＮ・各ｆ）ＳＰ
のポリコン数１６３：Ｉポリゴンの交点計算６２重ループの設定２５６　　ループカウンタのＭ　Ａ　Ｘ値１　、／○＝
１３７ここでＩＮＴＥＲ３ＥｃＴＩＯＮは交点計算部分の、Ｉ
、’０は入出力処理のステップ数を表す。実際の交点計
算は計算していく途中で交差しないと判断した時には分
岐し、次のポ；ノコンの計算に移るか、この式は全ポリ
コンについて、交点計算途中分岐せずにすへての計算を
行うと仮定した場合の式である。

従って実際のステップ数とは異なり、理論値を求めると
きはこのことを考慮する必要がある。

また１ステツプの実行時間ＣＬ　Ｋは、ニューロターボ
の基本クロック周波数か４０ＭＨｚの時７５ｎｓｅｃで
あるか、実験に使用したのは３６ＭＨ２のものであり、
ＣＬ　Ｋ　＝　８３．３３ｎｓｅｃである。

これより、ＩＤ５Ｐの交点計算時間（式（５）のＰＥＴ
に相当）の理論値は５ｔｅｐ−ＣＬＫとなる。従って、ニューロターボでの並列処理を考慮し
た計算時間の理論値ＴＨは式（５）よりＴＨ−８ｔ　ｅ
ｐ　−ＣＬＫ・　（Ｎ＋ｎ）　　（７）ただし、Ｎ−視
線本数ｎ：ＰＥの数である。

（実験結果）まず、ニューロターボでの処理が、パイプライン状に並
列処理されているかを検証するために、式（６）より算
出した交点計算時間の理論値と実験による実測値を比較
する実験を行った。

この実験では、理論値がなるべく正確に求められるよう
に、前に述べた処理途中の分岐か発生しないようなポリ
ゴンデータを使用して行った。具体的には、同一の三角
ポリゴンのデータに対して繰り返し交点計算をさせて、
そのステップ数から理論値を求めた。

また実験では計測するホストコンピュータの最小時間単
位が秒であるために、同一の計算処理を１００回繰り返
し行うのに要する時間を測定し、その１００分の１を実
測値とした。従って実測値の測定精度は１／１００秒で
ある。

実験の理論値と実測値を以下に示す。

ｒ対象物体データ・同一の三角ポリコンを４００個実験条件′視線本数Ｎ　　・６４００本（ＰＥの数０　
　４個ＰＮ＝１００個Ｓ　ｔ　ｅ　ｐ　＝１６４３７　ステップＴ　Ｈ＝　１
６４３７　　・８３．３３Ｅ−９・６４０４８．７７１
９ｓｅｃ従って、交点探索計算に要する時間の理論値は、８．７
７２秒である。これに対し実測値は、８．８０秒であった。

またニューロターボのＰＥ１個で交点計算を行う場合、
パイプラインではないため、式（６）のＩｌｏのうちハ
ントシェークに関する処理を行う必要かなく、その分ス
テップ数が少ない。また式（７）はｎ＝０で計算する。

こうして所要時間の理論値を求めると次のようになる。

ＰＮ＝４００個Ｓ　ｔ　ｅ　ｐ　＝］、６３　　Ｘ４００　　±８１６
５２８１ステップＴ　Ｈ＝　６５２８１　　・８３．３３Ｅ−９・６４０
０＝　３４．８１６５ｓｅｃ従って要素プロセッサ１個での理論値は、３４゜８１７
秒である。なお第１２図は交点計算時間の実測値と理論
値とを秒数で示したものである。

（発明の効果）以上のように本発明によれば、対象空間中にある物体の
形状を表現するポリゴンデータや、視点と画面上の各画
素とを結ぶ視線データ、及び光源などの環境モデルデー
タを作成するモデリング処理と、前記視線と対象空間中
の物体との交点を予め区分された渋すゴン毎に探索する
交点探索処理と、前記交点か存在する場合に前記ポリゴ
ンデータに基づいて前記画面上の輝度を求めるシェーデ
ィング処理とを行うレイトレーシング法を用いた画像生
成装置において、複数の要素プロセッサをパイプライン
状に直列に接続し、前記物体の形状を表現するポリゴン
データを分割してそれぞれの要素プロセッサのローカル
メモリに格納したうえ、視線データを順次入力したとき
、各段の要素プロセッサのローカルメモリに分割格納さ
れた前記ポリゴンデータに基づいて順次交点探索演算を
したあと演算結果を次段に伝送することにより、視点か
ら最も近い交点データを最終段の要素プロセッサから順
次出力するように構成したため、レイトレーシング法に
おいて処理時間の多くを占める交点探索処理を、少ない
メモリで高速に行うことか可能になり、画像生成を安価
に、且つ画像生成のために要する時間を短縮することか
できるという効果かある。

【図面の簡単な説明】

第１図はレイトレーシング法の原理図、第２図はレイト
レーシング法の計算アルゴリズムを示したフローチャー
ト図、第３図は第２図のフローチャートのサブルーチン
フローチャート図、第４図は本発明の実施例の構成を示
した接続図、第５図は要素プロセッサの構成を示Ｌ７た
内部ブロック図、第６図はポリゴン説明図、第７図は実
施例の作用説明図、第８図（ａ）、第８図（ｂ）は空間
分割法の説明図、第９図は実験に用いた二二一ロターホ
の構成を示した接続図、第１０図はポリゴンデータの構
成を示したデータ説明図、第１１図は実験の手順を示し
たフローチャート図、第１２図は実験の結果を示した実
験結果説明図である。 ■、２．物体３：視点４、画面５：画素６：視線７：光源８：ポリゴンＣＰ：交点ＰＥ］−ＰＥｎ：要素プロセッサＨＣ：ホストコンピュータ出願人　　　エルマノスミヮ株式会社出願人　　　岩　　　１）　　　　彰代理人　　　弁理士　開田英彦（外３名）視点Ｊ第図第図第図第図第図第図第図第図（ａ）（ｂ）第図第１０図第図

Claims

【特許請求の範囲】

対象空間中にある物体の形状を表現するポリゴンデータ
や、視点と画面上の各画素とを結ぶ視線データ、及び光
源などの環境モデルデータを作成するモデリング処理と
、前記視線と対象空間中の物体との交点を予め区分され
たポリゴン毎に探索する交点探索処理と、前記交点が存
在する場合に前記ポリゴンデータに基づいて前記画面上
の輝度を求めるシェーディング処理とを行うレイトレー
シング法を用いた画像生成装置において、それぞれが前
記物体の形状を表現するポリゴンデータを分割して格納
したローカルメモリを有するとともにそれぞれがパイプ
ライン状に直列接続され、前記視線データを順次入力し
たとき各段のローカルメモリに分割格納された前記ポリ
ゴンデータに基づいて順次交点探索演算をしたあと演算
結果を次段に伝送することにより、視点から最も近い交
点データを最終段から順次出力させる複数の要素プロセ
ッサを備えたことを特徴とする画像生成装置。