JPH04139591A - 画像生成装置 - Google Patents

画像生成装置

Info

Publication number
JPH04139591A
JPH04139591A JP26428690A JP26428690A JPH04139591A JP H04139591 A JPH04139591 A JP H04139591A JP 26428690 A JP26428690 A JP 26428690A JP 26428690 A JP26428690 A JP 26428690A JP H04139591 A JPH04139591 A JP H04139591A
Authority
JP
Japan
Prior art keywords
data
intersection
stage
successively
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP26428690A
Other languages
English (en)
Inventor
Akira Iwata
彰 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Erumano Sumiwa Kk
Original Assignee
Erumano Sumiwa Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erumano Sumiwa Kk filed Critical Erumano Sumiwa Kk
Priority to JP26428690A priority Critical patent/JPH04139591A/ja
Publication of JPH04139591A publication Critical patent/JPH04139591A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、レイトレーシンク法を用いた3次元コンピュ
ータグラフィックスに係り、詳しくは視点と画面上の各
画素とを結ぶ視線と対象空間中の物体との交点を予め区
分されたポリゴン毎に探索する交点探索処理を、少ない
メモリで、且つ高速で処理することかできる画像生成装
置に関する。
(従来の技術) 従来、3次元コンピュータグラフィックスの画像生成ア
ルゴリズムとして、レイトレーシンク法かある。この手
法は、光線追跡法とも呼ばれ、視点と画面上の各画素と
を結ぶ視線を1本1本追跡する手法であるため、他の手
法では表現か不可能な反射、屈折、影のある画像を生成
することか可能であり、簡単なアルゴリズムであるにも
かかわらず、高品質なコンピュータグラフィックスの画
像か得られるため、注目されている手法である。
しかしなから、少なくとも、得られる画像のピクセル(
画素)数の光線追跡をしなければならないことから多大
な計算時間を必要とするため、この計算時間の短縮が大
きな課題となっている。
レイトレーシング法は、モデリング処理と交点探索処理
とシェーディング処理から成っている。
モデリング処理は、物体形状を多数の微小三角形(ポリ
ゴン)で表現するだめのデータを生成する処理であり、
汎用のCADなどを用いて作成した物体データをコンバ
ータに通すことにより、生成するものである。更に、視
線や光源など、環境モデルの情報を生成する処理も含ま
れる。
また、レイトレーシング法特有の交点探索処理は、視点
と画面上の各画素とを結ぶ視線を考え、その視線と対象
空間中の物体との交点を、予め区分されたポリコン毎に
探索する処理であり、交点か存在しない場合、その画素
か背景であることを意味する。また、交点が多数存在す
る場合、実際には視点に最も近い点か見えることから、
視点との距離か最小の交点のみを有効にする。
更に、シェーディング処理は、前記交点か存在する場合
に、前記物体のデータから前記画面上の輝度を求めるも
のである。
尚、第1図は、以上のようなレイトレーシング法の原理
図であり、第2図はレイトレーシング法の計算アルコリ
ズムを示したフローチャートである。また、第3図は交
点探索処理を示すサブルーチンフローチャートである。
第1図を参照しなからレイトレーシング法を説明すると
、レイトレーシング法は、対象空間中にある物体1,2
の形状を表現するポリゴンデータや、視点3と画面4上
の各画素5とを結ぶ視線6のデータ、及び光源7などの
環境モデルデータを作成するモデリング処理と、前記視
線6と対象空間中の物体1.2との交点CPを、予め区
分された多数のポリゴン8毎に探索する交点探索処理と
、前記交点CPが存在する場合に前記物体1,2のデー
タに基づいて前記画面4上の輝度を求めるシェーディン
グ処理とを行うものであり、それぞれの処理を第2図、
第3図のフローチャートで示したアルゴリズムに従って
行うものである。
上記レイトレーシング法におけるモデリング処理と交点
探索処理とシェーディング処理の内、モデリング処理は
、表示するデータを予め作成する編集作業であるため、
レイトレーシング法における演算処理は交点探索処理と
シェーディング処理の二つの処理のみである。この内、
交点探索の処理時間はレイトレーシング法における演算
処理時間の大半を占める。−船釣には、単純な画像で全
体の処理時間の75%、複雑な画像では95%以上か交
点探索処理に費やされる。従ってレイトレーシング法に
おいて、処理時間を短縮させるためには、交点探索処理
を高速で行うことが必要であり、その高速化手法として
M I MD (MultipleI n5truct
ion stream Multiple strea
m)型のマルチプロセッサシステムがある。このマルチ
プロセッサシステムは計算負荷を各要素プロセッサに分
散する方法であり、前記画面を幾つかの小領域に分散し
、それぞれの小領域における計算を各要素プロセッサに
割り振るものである。そして、各要素プロセッサは割り
振られた小領域について、それぞれ独自に交点探索処理
とシェーディング処理とを行う。この手法は、それぞれ
の小領域における計算を各要素プロセッサに割り振った
後は各要素プロセッサ間のハンドシェイクが必要ないた
め、要素プロセッサの数に比例して処理の高速化を図る
ことが可能である。
上記マルチプロセッサシステムのメモリ構成手段として
は、大きく分けて次の二つがある。
第1の構成手段としては密結合方式であり、共有メモリ
にデータを格納しておき、各要素プロセッサからは共有
データバスを介してアクセスする方法である。
また、第2の構成手段としては疎結合方式であり、各要
素プロセッサのローカルメモリに物体データを格納して
おき、直接アクセスする方法である。
(発明が解決しようとする課題) 上記従来のマルチプロセッサシステムを用いたレイトレ
ーシング法の処理高速化手段において、マルチプロセッ
サシステムのメモリ構成手段のうち、密結合方式の場合
には、物体のデータ量だけの共有メモリ空間を確保すれ
ば良いという利点を有する反面、この方式の場合には、
複数の要素プロセッサが同しバスを介してメモリをアク
セスするため、二つ以上の要素プロセッサから同時にア
クセス要求が発生したときにはアクセス競合か生じる。
アクセス競合か発生したときには、先に発生したアクセ
スが終了するまで次のアクセスが待ち状態になるため、
アクセス遅延が起きることから処理時間が長くなるとい
う問題があった。
一方、マルチプロセッサシステムのメモリ構成手段のう
ち、疎結合方式の場合には、各要素プロセッサのローカ
ルメモリに全部の物体データを格納しておくため、メモ
リアクセスの競合か生じないことからアクセス遅延か起
きないという利点を有する反面、物体データを格納する
メモリが大量に必要である。即ち、各要素プロセッサの
ローカルメモリに物体データ全部を格納しておくため、
システム全体として、物体データ×要素プロセッサ骨の
ローカルメモリを必要とする。
実際には、各要素プロセッサにおいて高速に物体データ
を参照することができるように、第2のメモリ構成手段
としての疎結合方式を採用する場合が殆どである。その
ため、実際に複雑な物体を描こうとすると膨大なメモリ
か必要になり、実際の制作業務では30Mバイト程のデ
ータを扱うことか多く、それ以上のメモリ容量を必要と
する場合もあることから、使用メモリ量を少なくするこ
とができないという問題があった。
そこで本発明では、レイトレーシング法において処理時
間の多くを占める交点探索処理を、少ないメモリで高速
に処理することにより、画像生成を安価に、且つ画像生
成のための処理時間を短縮することを解決すべき技術的
課題とするものである。
(課題を解決するための手段) 上記課題解決のための技術的手段は、対象空間中にある
物体の形状を表現するポリゴンデータや、視点と画面上
の各画素とを結ぶ視線データ、及び光源などの環境モデ
ルデータを作成するモデリング処理と、前記視線と対象
空間中の物体との交点を予め区分されたポリゴン毎に探
索する交点探索処理と、前記交点が存在する場合に前記
ポリゴンデータから前記画面上の輝度を求めるシェーデ
ィング処理とを行うレイトレーシング法を用いた画像生
成装置を、それぞれが前記物体の形状を表現するポリゴ
ンデータを分割して格納したローカルメモリを有すると
ともにそれぞれがパイプライン状に直列接続され、前記
視線データを順次入力したとき各段のローカルメモリに
分割格納された前記ポリゴンデータに基づいて順次交点
探索演算をしたあと演算結果を次段に伝送することによ
り視点から最も近い交点データを最終段から順次出力さ
せる複数の要素プロセッサを備えた構成にすることであ
る。
(作用) 上記構成の画像処理装置によれば、モデリング処理によ
り作成された視線データが、パイプライン状に直列に接
続された複数の要素プロセッサの最前段に次々に入力さ
れると、その最前段では、視線データが入力される毎に
、そのローカルメモリに分割格納されたポリゴンデータ
に基づいて交点探索演算を行い、その演算結果を順次、
次段に出力する。前段からの演算結果を順次入力した次
段では、ローカルメモリに分割格納されたポリゴンデー
タに基づいて交点探索演算を行い、その演算結果を順次
後段に出力するというようにして、順次各段において交
点探索演算を行い、それぞれの演算結果を次の段に伝送
することにより、視点から最も近い交点データを視線デ
ータ毎に最終段の要素プロセッサからホストコンピュー
タ等に出力する。
以上のように、最初に入力された視線データに関する最
も近い交点データを最終段の要素プロセッサから出力さ
せるまでは、n個の要素プロセッサがパイプライン状に
直列接続されているとすれば、1個の要素プロセッサの
処理時間のn倍の時間を要するが、第2番目の視線デー
タからは、見掛は上、1個の要素プロセッサの処理時間
で交点データを出力させることかできる。
(実施例) 次に、本発明の実施例を図面を参照しなからg明する。
本実施例は、第1図、第2図、第3図に示しテ原理図、
及び計算アルコリズムに従ったレイ)L−シンク法にお
いて、処理時間の多くを占める3点探索処理を少ないメ
モリで高速に処理するこ2により、画像生成のための処
理時間を短縮する戸、めのパイプライン型アーキテクチ
ャを採用してしる。
第4図は、基本的に同一構成の複数の要素プロセッサP
E1.PE2.PE3.−PEn−1゜PEnを・ぐイ
ブライン型に接続したうえ、第1邸の要素プロセッサP
EIと最終段の要素プロセッサPEnとをホストコンピ
ュータHCの入出力インターフェースに接続したもので
ある。また第5図は、要素プロセッサPEI、PE2.
PE3゜・・PEn−1,PEnそれぞれの構成を示し
た構成ブロック図である。
第5図に示すように、要素プロセッサPE 1゜PE2
.PE3.−PEn−1,PEnは、CPUと、そのC
PUの入出力側それぞれに接続されたD P M (D
ual Ports Memory)と、CPUに接続
されたプロクラムメモリPMEM、及びデータメモリD
MEMを備えている。
要素プロセッサPEI、PE2.PE3.・・・PEn
−1,PEnそれぞれのデータメモリ(ロカルメモリ)
DMEMには、各要素プロセッサPE1.PE2.PE
3.=4’En−1.PEnか計算するポリコンのデー
タ、即ち、第1図に示した物体1.2の表面を三角形の
組合せにより表現するだめの物体データか分割格納され
ている。従って、要素プロセッサPEI、PE2.PE
3゜・・・PEn−1,PEn全部を合わせたデータメ
モリ容量としては物体データ分の容量かあれはよい。
次に、ポリコン8について説明する。
予め与えられたポリゴンデータより、そのポリコンを含
む平面の方程式は以下の連立方程式により表される。
(x=xo−tl い:1− XO)  十t2 (x
2  XO)ハ y−=yo−tl  (yl−yO)
  +t2 (y2−yO)z =zo+tl (zl
−zO) +t2 (z2−zO)また視線の方程式は
、 (x =xs+t xax Hy=ys+t xむ・ (z ==zs−1−t xaz となる。この2つの方程式から求めた交点の座標が、ポ
リゴン8内ならば交点が存在する。計算により実際に求
める値は、第6図に示す媒介変数11、t2.tである
。ここでtlと12は、視線6と物体1.2との交点C
Pが存在する場合、その交点CPかポリコン8内かどう
かを判定するために用いる。視線6の方程式に示したよ
うに、tは視線の方向ベクトルaをt倍して、視点3か
ら求める交点CPへのベクトルを表す変数である。計算
結果としては、このtのみか必要である。次にポリコン
8と視線6か交差するための媒介変数tl、 t2. 
tの条件を以下に示す。
1)t>0ならば 視線6とポリゴン8を含む平面は交点をもつ。
2)  0 < tl、 12. tITt2< 1な
らばその交点CPは、ポリコン8内に存在する。
ここで1)と2)の条件を満たすとき、視線6はポリゴ
ン8と交差することになる。
なお、第6図において、交点検索に用いる既知の値とし
て、 (PO= (xO,yO,zO) 三角ポリコン3頂点 I Pl−(xLyl、zl)P
2=  (X2.y2.z2) 視線の開始点     Ps= (xs、ys、zs)
視線方向ベクトル   a= (ax、aシ、 az)
を用い、更に三角ポリコンの2辺を表すベクトルとして
、 X1= (xi−XO,yl−yO,zl−z[1)X
2= (x2−XO,y2−yO,z2−zo)を用い
る。また、媒介変数としてtl、 t2. tを用いる
前記式(1)と式(2)から、変数x、y、zを消去す
ると次のようになる。
yl XO )・0 ax) □ ax7: az’ ′ χ0−xs  ゛ yO−\′S ’ zO−zs  ′□ ] etA f (yO−y2)az−(zo−z2)ayl(zO
−zl)ay−(yO−yl)az□璽yO−yl)(
zo−z2)−(yO−y2)(zozl) (zO−z2>ax−fx(1−x2)az(xo−x
l)az−(zO−zl )ax(20−21>(XO
−X2)−(20−Z2)(XO−XI)(xo−x2
)ay−(yO−y2)ax     ) (Xo−X
S T(yO−yl)ax−(x。−xi)ay   
 四1.。−93:□ (xO−xl)(yO−y2)−(yO−>+2)(y
O−yl) ” zo−zsヲたたし、 etA 1 (yo yl)(z。
z2) (y・0 2Hz0 zl) ax− 1(zO−zl)(xO−x2)−(zO−z2)(x
O−xl) l  ay−1(xO−xl)(yO−y
2)−(xO−x2)(yO−yl)l  azポリゴ
ンデータは予め与えられるため、視線データ(ax、 
ay、 az )及び(XS、 ys、 zs)を含ま
ない項は前処理として計算可能である。
次に、要素プロセッサPEI〜PEnの特性について説
明する。
レイトレーシングの計算には、浮動少数点の演算か不可
欠であり、しかも高い計算精度が望まれる。従って、レ
イトレーシングを行うマルチプロセッサシステムでは、
浮動少数点の演算能力をもつ要素プロセッサか必要であ
る。
また、レイトレーシングの計算処理の中には積和演算か
頻繁に現れるため、要素プロセッサには積和演算か高速
に計算可能なものを使用することか望まれる。
さらに、今回採用するアーキテクチャはマルチプロセッ
サ構成であり、プロセッサ数か増加するにしたかって、
■プロセッサの計算時間に対するプロセッサ間通信のオ
ーバーヘッド比か大きくなる。従って、システム全体の
処理を高速にするための条件として、各プロセッサ間の
通信速度か高速であることか必要である。
次に、ポリゴンデータ(物体データ)に対するレイトレ
ーシングでの交点探索処理は、各ポ1ノコンごとに同一
の計算を行い、各計算結果を比較・更新するアルゴリズ
ムで、視点3からの距離か最小の交点CPを求める。こ
のアルゴリズムの特徴を以下に記す。
1、交点計算はポリゴンごとに独立している。
2、交点計算のアルゴリズムは1種類である。
3、1ポリゴンあたりの計算ステップ数の最大は一定で
ある。
4、計算結果同士を比較し、最小値を求める。
以上の処理を単純なハードウェアで行うには、複数のプ
ロセッサを並列にではな(直列に動作させるようにした
本実施例のようなパイプライン手法か有利である。即ち
、各要素プロセッサは前段の要素プロセッサの結果を入
力として受取り、求めた結果とその値を比較し、更新を
行う。このような計算を要素プロセッサ数だけ繰り返す
と最後の要素プロセッサの圧力か、視点3から最も近い
ポリゴン8との交点CPを示す値(1)となる。
以上のことから、交点探索処理をハードウェア化するに
は、第4図に示すようなパイプライン型のアーキテクチ
ャか適している。
また、各要素プロセッサは並列に動作し、要素プロセッ
サ数分の異なる視線6についての計算を同時に処理する
。従って理想的にはポリゴン8と同数の要素プロセッサ
を直列に結合すると、1つめの結果を求められるまでに
ポリコン8数だけの計算時間は要するか、その後は1ポ
リゴン8の計算時間ごとに結果か得られることになる。
しかし実際には、何方というオーダーのポリゴン8につ
いて計算しなければならないことか多いのに対し、結合
可能な要素プロセッサ数は数百程度か限界であるため、
l要素プロセッサで数百側のポリゴン8についての計算
を行うことになる。
次に、第7図を参照しながら要素プロセッサPE1−P
Enの作用を説明する。
本実施例のパイプライン型ハードウェアで交点探索計算
を行った場合、ホストコンピュータHから出力される各
視線データ(ray)は、全ての1素プロセツサを順に
巡回することになる。第7[はこの巡回する様子を示し
たものである。
視線データは始め、要素プロセッサPEIにツカされ、
その後PE2.PE3へと結果ととも(順に転送される
。そしてPEnでの計算が完了(た段階で最終的に交点
の値が出力される。その靭は、第7図のように次々と結
果か出力されるこ4になる。従って、raylに対する
出力には、l要素プロセッサでの処理時間のn倍の時間
を要するが、その他のrayは見かけ上1個の要素プ[
セッサの処理時間で出力することかできる。
このことから、視線データを間断なく入力でさるならば
、n個の要素プロセッサが使用されてしる場合、N本の
視線の交点探索に要する時間T L1次の式により与え
られる。
T=PET・ (N十n)          (5た
だし、PETは1要素プロセツサでの処理に要する時間
(データ転送時間含む)である。
ここで、レイトレーシング法における処理高速化アルコ
リズムの1つである空間分割法について説明する。
空間分割法では、物体か存在する空間を〜70XELと
呼ばれる部分空間に分割し、各VOXEL内に存在する
物体(サーフェイス)のリストを予め作成する。そして
交点探索処理のときは、視線か視点からスクリーン方向
へ進行する際に、通過するVOXEL内に存在する物体
に対してのみ交点探索の計算を行う。もし、最初に通過
するVOXEL内に視線と交差する物体か存在しないと
きは、視線が次に通過するVOXELを調べる。このよ
うにして交点か求められるまで、交点探索を続ける。
前処理としての空間をVOXELと呼ばれる部分空間に
分割する方法は、幾つかの方法か提案されている。これ
らの分割方法は等分割方式とオクトリ一方式に大別でき
る。
等分割方式では物体か定義されている3次元空間を一定
の大きさのVOXELに等分割する。
この方式の利点は、空間分割か物体の分布に全く無関係
に行われるため、分割に要する時間が比較的短(て済む
という点である。
逆にこの方式の欠点は、各VOXEL内に存在する物体
の数にばらつきがあるために、物体が密に存在するVO
XELに対して交点探索処理を行うときに、交差判定の
計算量が多くなってしまう点である。
一方、オクリ一方式では、第8図(a)、第8図(b)
に示すように、始めに対象の空間を8等分に分割し、中
に含まれる物体の数か予め設定された最大値を越える場
合、VOXELをさらに8等分する。この処理を繰り返
し行い、各VOXEL内に存在する物体の数を最大値以
下になるように分割を行う。
この方式の利点は、各VOXEL内に存在する物体の数
が最大値以下に抑えられているために、物体が密に存在
する空間に対して交点検索を行う際でも、交差判定の計
算量が一定化される点である。
この方式の欠点は、前処理である分割に時間を多く要す
るという点である。
従って、物体が均等に分布しているときには等分割方式
が有利であり、物体の存在する密度か不均一な場合はオ
クトリ一方式か有効な空間分割法である。
以上のような空間分割法を本実施例に適用すると相乗的
な効果が期待できる。
本実施例のアーキテクチャで空間分割法を行うには、普
通は物体データを各要素プロセッサに均等に分配するの
に対し、前処理でVOXELごとにクラス分けしたデー
タをそれぞれ各要素プロセッサに均等に分配する。そし
て交点探索計算のときは、VOXEL番号の情報も同時
に転送しながら、そのVOXELのデータに対してのみ
計算を行えば良い。
このようにして本実施例のパイプライン型アーキテクチ
ャでは容易に空間分割法を適用することが可能である。
(実験の概要) 次に、レイトレーシング法の交点探索処理の高速化を図
ることを目的とした本実施例のアーキテクチャを用いて
どの程度の処理速度か得られるか、定量的に評価するた
めの実験を行ったので、その実験について説明する。
本実験では、4個の汎用DSP (デインタルシグナル
プロセッサ)をリング結合したアーキテクチャのアクセ
ラレータボート「ニューロターボ」を用いて、速度評価
を行った。ホストコンピュータにはパーソナルコンピュ
ータ(NEC製PC9801)を使用した。
また比較のために、ワークステーション(SUn 4/
260)で同一アルコリズムによるレイトレーシング処
理を行い、各処理に要するCPU時間を測定した。
(実験方法) 前記「ニューロターボ」は、本来ニューラルネットワー
クの演算を高速に行うことを目的に開発されたアクセラ
レータボードである。これは、PC−9801(以下P
C98と略す)のスロットに挿入して、PCをホストコ
ンピュータとして動作させる。
ニューロターボの構成は第9図に示すように、4個のD
SP (DSPO〜DSP3)がリング結合されている
。DSP間のデータ転送はそれぞれの間にある2ポート
メモリを読み書きすることにより、DSP内部のデータ
転送と同じ手順、速度で行うことが可能である。ホスト
コンピュータとはDSPOのみか結合されており、デー
タ転送はその間にある2ポートメモリを介して行う。ま
た、各DSPはデータを格納しておくためのローカルメ
モリをもっている。本実験に使用したニューロターボの
各DSPは、ローカルメモリとして64にワードのワー
キングメモリを4つもっている。
実験に用いたデータは、まず市販の3D(ディメンショ
ン) CA D (Digital CRAFT)を使
用して、3次元のサーフェイスデータ(ポリゴン形式)
を作成する。そして、このデータをツールにより適当な
フォーマットに変換する。こうしてできたポリゴンデー
タをレイトレーシングの実験に使用した。
交点探索処理に必要なデータは、ポリゴンの形状データ
のみである。この形状データは、第10図に示すように
ポリゴンデータ(1ポリゴン12データ)を並べた列で
ある。
また交点探索計算のためのニューロターボへの入出力デ
ータを以下に記す。
入力データ 視線データ(6データ) 出力データ:視線データ、交点座標パラメータ(2デー
タ)交差するポリゴン番号(2データ ) 本実験は、ニューロターボに交点探索処理をインプリメ
ントして行った場合、後述の期待する処理速度の理論値
に対して、実際にどの程度の処理速度かを検証するため
に行った。実験で行ったレイトレーシングの処理の流れ
を第11図に示す。
基本的には標準のレイトレーシング処理であるが、ホス
トコンピュータとニューロターボとのデータ入出力経路
が1つしかないため、視線データを与える処理と、計算
結果を取り出す処理を同時に行うことは不可能である。
そのため視線データを1本1本転送する方式では、オー
バーヘッドが大きくなる。このため今回はニューロター
ボのDSPlのワーキングメモリWMへ予め、まとまっ
た視線データ(6400本)を転送して、それをもとに
交点探索計算を行い、結果をDSPOのワーキングメモ
リWMに格納した。ここでニューロターボによる交点探
索の処理時間を、視線データの転送が完了した時刻から
、交点探索計算がそれら全部について終了する時刻まで
の時間として測定した。この後のホストコンピュータに
よるシェーディング処理は、そのニューロターボでの結
果を1つずつ取出しながら、輝度計算を行い値をを出力
する。実際のレイトレーシングでは、ここで反射・屈折
及び影の処理を行うのであるが、今回は交点探索処理に
要する時間を測定することが目的のため、反射・屈折及
び影がない条件で測定した。
(プログラムステップ数から求めた計算所要時間の理論
値) 交点探索処理をニューロターボで行うために、DSP 
(富士通型MB86220)専用のアセンブリ言語でプ
ログラムを作成し実験した。このDSPの1サイクルは
75ナノ秒であるため、各命令の実行時間は実行サイク
ル数より算出てきる。
よって作成したプログラムの実行所要時間も、プログラ
ムステップ数から割り出すことかできる。
本実験では、ニューロターボの4つのDSPで、同じ交
点計算プログラムを走らせたため、この部分のステップ
数は等しい。しかし、データ入出力やハンドシェークの
プログラムは異なるため、二の部分に関してはステップ
数か異なる。従って、パイプラインの中間部(プロセッ
サ数か増えるとこの部分の処理時間か増加する)にあた
るDSPのステップ数で近似し、処理時間の理論値とす
る。
以下に、視線1本に対する1、 D S Pのステップ
数の計算式を示す。
S t e p = INTER3ECTION二I 
/ 0ただし、1NTER3EcTION= 163 
x PN+6x (P\/’256)PN・各f)SP
のポリコン数 163:Iポリゴンの交点計算 62重ループの設定 256  ループカウンタのM A X値1 、/○=
137 ここでINTER3EcTIONは交点計算部分の、I
、’0は入出力処理のステップ数を表す。実際の交点計
算は計算していく途中で交差しないと判断した時には分
岐し、次のポ;ノコンの計算に移るか、この式は全ポリ
コンについて、交点計算途中分岐せずにすへての計算を
行うと仮定した場合の式である。
従って実際のステップ数とは異なり、理論値を求めると
きはこのことを考慮する必要がある。
また1ステツプの実行時間CL Kは、ニューロターボ
の基本クロック周波数か40MHzの時75nsecで
あるか、実験に使用したのは36MH2のものであり、
CL K = 83.33nsecである。
これより、ID5Pの交点計算時間(式(5)のPET
に相当)の理論値は 5tep−CLK となる。従って、ニューロターボでの並列処理を考慮し
た計算時間の理論値THは式(5)よりTH−8t e
p −CLK・ (N+n)  (7)ただし、N−視
線本数 n:PEの数 である。
(実験結果) まず、ニューロターボでの処理が、パイプライン状に並
列処理されているかを検証するために、式(6)より算
出した交点計算時間の理論値と実験による実測値を比較
する実験を行った。
この実験では、理論値がなるべく正確に求められるよう
に、前に述べた処理途中の分岐か発生しないようなポリ
ゴンデータを使用して行った。具体的には、同一の三角
ポリゴンのデータに対して繰り返し交点計算をさせて、
そのステップ数から理論値を求めた。
また実験では計測するホストコンピュータの最小時間単
位が秒であるために、同一の計算処理を100回繰り返
し行うのに要する時間を測定し、その100分の1を実
測値とした。従って実測値の測定精度は1/100秒で
ある。
実験の理論値と実測値を以下に示す。
r対象物体データ・同一の三角ポリコンを400個 実験条件′視線本数N  ・6400本(PEの数0 
 4個 PN=100個 S t e p =16437 ステップT H= 1
6437  ・83.33E−9・64048.771
9sec 従って、交点探索計算に要する時間の理論値は、8.7
72秒 である。これに対し実測値は、 8.80秒 であった。
またニューロターボのPE1個で交点計算を行う場合、
パイプラインではないため、式(6)のIloのうちハ
ントシェークに関する処理を行う必要かなく、その分ス
テップ数が少ない。また式(7)はn=0で計算する。
こうして所要時間の理論値を求めると次のようになる。
PN=400個 S t e p =]、63  X400  ±816
5281ステップ T H= 65281  ・83.33E−9・640
0= 34.8165sec 従って要素プロセッサ1個での理論値は、34゜817
秒である。なお第12図は交点計算時間の実測値と理論
値とを秒数で示したものである。
(発明の効果) 以上のように本発明によれば、対象空間中にある物体の
形状を表現するポリゴンデータや、視点と画面上の各画
素とを結ぶ視線データ、及び光源などの環境モデルデー
タを作成するモデリング処理と、前記視線と対象空間中
の物体との交点を予め区分された渋すゴン毎に探索する
交点探索処理と、前記交点か存在する場合に前記ポリゴ
ンデータに基づいて前記画面上の輝度を求めるシェーデ
ィング処理とを行うレイトレーシング法を用いた画像生
成装置において、複数の要素プロセッサをパイプライン
状に直列に接続し、前記物体の形状を表現するポリゴン
データを分割してそれぞれの要素プロセッサのローカル
メモリに格納したうえ、視線データを順次入力したとき
、各段の要素プロセッサのローカルメモリに分割格納さ
れた前記ポリゴンデータに基づいて順次交点探索演算を
したあと演算結果を次段に伝送することにより、視点か
ら最も近い交点データを最終段の要素プロセッサから順
次出力するように構成したため、レイトレーシング法に
おいて処理時間の多くを占める交点探索処理を、少ない
メモリで高速に行うことか可能になり、画像生成を安価
に、且つ画像生成のために要する時間を短縮することか
できるという効果かある。
【図面の簡単な説明】
第1図はレイトレーシング法の原理図、第2図はレイト
レーシング法の計算アルゴリズムを示したフローチャー
ト図、第3図は第2図のフローチャートのサブルーチン
フローチャート図、第4図は本発明の実施例の構成を示
した接続図、第5図は要素プロセッサの構成を示L7た
内部ブロック図、第6図はポリゴン説明図、第7図は実
施例の作用説明図、第8図(a)、第8図(b)は空間
分割法の説明図、第9図は実験に用いた二二一ロターホ
の構成を示した接続図、第10図はポリゴンデータの構
成を示したデータ説明図、第11図は実験の手順を示し
たフローチャート図、第12図は実験の結果を示した実
験結果説明図である。 ■、2.物体 3:視点 4、画面 5:画素 6:視線 7:光源 8:ポリゴン CP:交点 PE]−PEn:要素プロセッサ HC:ホストコンピュータ 出願人   エルマノスミヮ株式会社 出願人   岩   1)    彰 代理人   弁理士 開田英彦(外3名)視点J 第 図 第 図 第 図 第 図 第 図 第 図 第 図 第 図 (a) (b) 第 図 第 10図 第 図

Claims (1)

    【特許請求の範囲】
  1. 対象空間中にある物体の形状を表現するポリゴンデータ
    や、視点と画面上の各画素とを結ぶ視線データ、及び光
    源などの環境モデルデータを作成するモデリング処理と
    、前記視線と対象空間中の物体との交点を予め区分され
    たポリゴン毎に探索する交点探索処理と、前記交点が存
    在する場合に前記ポリゴンデータに基づいて前記画面上
    の輝度を求めるシェーディング処理とを行うレイトレー
    シング法を用いた画像生成装置において、それぞれが前
    記物体の形状を表現するポリゴンデータを分割して格納
    したローカルメモリを有するとともにそれぞれがパイプ
    ライン状に直列接続され、前記視線データを順次入力し
    たとき各段のローカルメモリに分割格納された前記ポリ
    ゴンデータに基づいて順次交点探索演算をしたあと演算
    結果を次段に伝送することにより、視点から最も近い交
    点データを最終段から順次出力させる複数の要素プロセ
    ッサを備えたことを特徴とする画像生成装置。
JP26428690A 1990-10-01 1990-10-01 画像生成装置 Pending JPH04139591A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26428690A JPH04139591A (ja) 1990-10-01 1990-10-01 画像生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26428690A JPH04139591A (ja) 1990-10-01 1990-10-01 画像生成装置

Publications (1)

Publication Number Publication Date
JPH04139591A true JPH04139591A (ja) 1992-05-13

Family

ID=17401056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26428690A Pending JPH04139591A (ja) 1990-10-01 1990-10-01 画像生成装置

Country Status (1)

Country Link
JP (1) JPH04139591A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010505164A (ja) * 2006-09-27 2010-02-18 インターナショナル・ビジネス・マシーンズ・コーポレーション レイ・トレーシング画像処理システムにおけるピクセル色の決定方法および画像処理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63118991A (ja) * 1986-11-07 1988-05-23 Matsushita Electric Ind Co Ltd 隠れ面処理装置
JPS63157283A (ja) * 1986-12-22 1988-06-30 Nec Corp 物体画像合成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63118991A (ja) * 1986-11-07 1988-05-23 Matsushita Electric Ind Co Ltd 隠れ面処理装置
JPS63157283A (ja) * 1986-12-22 1988-06-30 Nec Corp 物体画像合成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010505164A (ja) * 2006-09-27 2010-02-18 インターナショナル・ビジネス・マシーンズ・コーポレーション レイ・トレーシング画像処理システムにおけるピクセル色の決定方法および画像処理システム

Similar Documents

Publication Publication Date Title
US11715251B2 (en) Neural network model trained using generated synthetic images
KR100319768B1 (ko) 영상화및그래픽처리시스템내에서의다차원주소발생방법
CN113853608A (zh) 利用稀疏三维(3d)分组卷积的通用模块化稀疏3d卷积设计
DE102018119225A1 (de) System und Verfahren für einen optimierten Winograd-Faltungsbeschleuniger
CN104050706B (zh) 用于低功率图形渲染的像素着色器旁路
JPH087792B2 (ja) グラフィックス・システムにおける拡張可能な複数のイメージ・バッファ
US9922442B2 (en) Graphics processing unit and method for performing tessellation operations
CN103886547A (zh) 用于存储共享顶点的技术
CN112446815A (zh) 稀疏矩阵乘法加速机制
US20130207983A1 (en) Central processing unit, gpu simulation method thereof, and computing system including the same
EP3678037A1 (en) Neural network generator
CN112783554A (zh) 用于程序间数据交换的持久便签内存
US20080313434A1 (en) Rendering Processing Apparatus, Parallel Processing Apparatus, and Exclusive Control Method
CN110807827A (zh) 系统生成稳定的重心坐标和直接平面方程访问
US20180137676A1 (en) Identifying primitives in input index stream
Saidovich et al. Analysis And Using of the Features Graphics Processors for Medical Problems
CN103679786A (zh) 图形处理单元可编程着色器的纹元数据结构和其操作方法
CN113822975A (zh) 用于对图像进行有效采样的技术
Fussell et al. A vlsi-oriented architecture for real-time raster display of shaded polygons
US7724254B1 (en) ISO-surface tesselation of a volumetric description
JPH04139591A (ja) 画像生成装置
Saidovich et al. Analysis Database Systems and Solve Medical Problems
Day Parallel implementation of 3D convex-hull algorithm
Krogh et al. Parallel sphere rendering
Yang et al. Photomosaic generation by rearranging subimages, with GPU acceleration