JP2001236342A

JP2001236342A - 多体問題解析装置に用いるアドレス装置

Info

Publication number: JP2001236342A
Application number: JP2000045606A
Authority: JP
Inventors: Akira Takada; 亮高田; Naoki Soneta; 直樹曽根田
Original assignee: GAZO GIKEN KK; Central Research Institute of Electric Power Industry
Current assignee: GAZO GIKEN KK; Central Research Institute of Electric Power Industry
Priority date: 2000-02-23
Filing date: 2000-02-23
Publication date: 2001-08-31

Abstract

(57)【要約】【課題】並列パイプラインで多体問題を解くハードウ
ェア演算装置において、粒子座標演算を節減して効率よ
く対象粒子の近傍に存在する粒子を選択し座標を与え
て、演算全体の速度を向上させるアドレス装置を提供す
る。【解決手段】粒子座標メモリ２４とインデックスメモ
リ２３を備え、粒子座標メモリ２４は粒子の座標を記憶
し、インデックスメモリ２３は対象空間を座標に基づい
て複数の直方体に分割して形成する各サブセルに属する
粒子の座標を記憶する。粒子座標が入力されると粒子座
標メモリ２４に格納すると共に粒子座標に基づいて各サ
ブセルに割り振ってインデックスメモリ２３中の該当す
るサブセルに対応する位置に粒子番号を記憶させ、演算
するときはサブセル同士の近接関係に基づいてサブセル
を指定し該当するサブセルに属する粒子の番号をインデ
ックスメモリ２３を参照して粒子座標メモリ２４に格納
された粒子座標を読み出して近接粒子座標として供給す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、並列パイプライン
で多体問題を解く多体問題解析装置に用いて対象粒子の
近傍に存在する粒子を選択し座標を与えるアドレス装置
に関する。

【０００２】

【従来の技術】分子動力学法を含む多体問題とは、系を
構成する個々の粒子の特徴とそれら粒子間に働く力を基
にして対象となる系を把握することにより、その系が持
っている様々な性質を説明したり変化を予測することを
可能にしようとするものである。このような方法は、今
日の科学において対象となる系の属性によらず一つの普
遍的なアプローチとして重要性を増しつつある。

【０００３】しかしながら、このような要求に応えるた
め、例えば１万個のオーダーの粒子からなる多体問題を
解く必要があるとすれば、それらの粒子間に働く力を計
算するには粒子数の２乗すなわち１億回の演算を行うこ
とが要求される。さらに演算が静定するまでには、この
計算を数万回から数百万回というオーダーで繰り返す必
要がある。

【０００４】従来、このような多体問題の計算はスーパ
ーコンピュータを利用して行われてきたが、スーパーコ
ンピュータはコストの関係で個々の研究者が占有して自
由に使用することができなかった。また、特に性能の高
い並列型スーパーコンピュータではその性能を十分引き
出すためにプログラムの解析と変更が必要で、コンピュ
ータの専門家でない研究者にとっては大きな負担となり
研究の効率に影響があった。

【０００５】そのため、スーパーコンピュータの代わり
に高速なワークステーションを利用して研究者個人がマ
シンを占有して計算を行うことが多くなった。しかし、
この場合は性能が十分でないため結果が得られるまでの
時間が長く研究を進める上で大きな支障となっていた。
また、様々な近似手法を用いて計算時間を短縮する試み
も行われているが、得られる結果の妥当性が損なわれて
しまうことも多く問題があった。このように、スーパー
コンピュータやワークステーションなどを用いても、コ
ストとパーフォーマンスのいずれにおいても不満があっ
た。

【０００６】このような不満を解消する方法として、多
体問題の計算で計算量が最も多くなる粒子間の相互作用
を計算する部分をハードウェア化して計算速度を上げる
ことにより対応する方法がある。粒子間相互作用の計算
は単純な計算手順の繰り返しであり並列処理が可能であ
るため、ハードウェア化が容易であってその効果も大き
い。しかも、並列パイプラインで高速処理するハードウ
ェアで大量単純演算部分の粒子間力を計算させることに
より、ホストに安価な汎用のコンピュータを利用して、
全体として最高級のスーパーコンピュータに匹敵する実
効速度を持つ演算装置を実現することができる。

【０００７】特に、ハードウェア化する部分を力の計算
に限りかつ任意の関数の高精度近似ができるようにした
ものを組み込んだ演算装置は、専用化された計算機であ
りながら、幅広い分野の計算に適用することができる。
ハードウェアの高速演算機能を利用するためには、従来
のソフトウェアで力やポテンシャルの計算を行っている
部分をハードウェアのインターフェースライブラリを呼
び出すように変更するだけでよく、並列プログラムなど
の専門的な知識はいらない。このような組合せを利用し
た手近な演算装置により、２つの粒子間に働く力を「任
意の形の距離の関数」として扱えるようにして、重力、
クーロン力、ファン・デル・ワールス力を始めとする多
様な力を計算するようにしたので、例えば薬学、材料工
学、流体工学など、多様な分野に応用することが可能と
なった。

【０００８】多体系問題では、系内の粒子について他の
粒子から受ける力を計算し、その結果に基づいて粒子の
新しい位置と速度を算出することにより、系の物理量を
求める。多体系問題の計算は、まず初期設定として粒子
の位置と速度を設定し、粒子を指定してそれが他の粒子
から受ける力を計算して粒子を新しい位置に移動する計
算を粒子数に応じた回数繰り返して系の物理量を求め、
さらに、この物理量算出計算を新しい分布状態について
必要な回数繰り返すことにより、系の運動などを求める
という手順により行われる。上記演算装置では、個々の
粒子が他の粒子から受ける力の計算をハードウェアの高
速演算機能を用いて行い、粒子の動き等の計算をホスト
コンピュータで行っている。

【０００９】これらの計算は粒子の数が増えるのに伴っ
て急激に計算回数が増加するが、計算式は単純なもので
あるので、ハードウェアに取り込んで高速演算すること
が可能である。粒子の移動量はハードウェアで求めた力
に基づいてホストコンピュータで計算する。対象とする
粒子全体について目的の回数だけ計算を繰り返して目的
の物理量を求める。新しい粒子位置と速度をハードウェ
アに入力して力の計算をさせ、その結果を用いて再び新
しい粒子位置を求める。必要な回数繰り返すことにより
最終的な目的物理量を得ることができる。

【００１０】上記演算装置を分子動力学法に応用してシ
ミュレーションを行う場合について説明する。分子動力
学法とは、対象とする物質系の構成粒子の微視的な運動
を追跡してその物質系の性質を調べる方法で、多体問題
の１つのバリエーションである。例として、第ｉ番目の
イオンと第Ｊ番目のイオンからなる剛体イオンモデルの
２体力ポテンシャルを求める場合を考える。剛体イオン
のポテンシャルは次式（１）で表される。 F（ｒ）＝Ｚ_iＺ_jｅ²／ｒ＋F_ij ^R＋F_ij ^D （１）ここで、ｒは粒子間距離、Ｚはイオンの電荷数、ｅは電
子の電荷である。

【００１１】また、F^Rは原子の電荷分布の重なりによる
近接反発力で、例えば下の（２）式で表される場合があ
る。 F^R＝e（s／ｒ）ⁿ （２）近接力は極く近くに存在する極く少数の粒子間で働くの
で、ホストコンピュータで計算するようにしてもよい。

【００１２】F^Dは分散ポテンシャルと呼ばれるファン・
デル・ワールス力で、異なる分子に属する荷電粒子間の
静電気力によりその分子の電荷分布が瞬間的に非対称に
なることにより生じ、下の（３）式で表される。 F^D＝−ｃ²／ｒ⁶ （３）ファン・デル・ワールス力は、多くの粒子が関係するの
でハードウェアで構成した演算器により計算することが
好ましいが、粒子間距離が近い場合に影響が大きく遠距
離になるにしたがって影響は急激に減少するため、所定
の範囲内にある近接粒子を抽出して計算すればよい。し
たがって、近接粒子を効率よく選択して無駄のない計算
を行うようにすることが好ましい。

【００１３】（１）式の右辺第１項はクーロンポテンシ
ャルで、遠距離の粒子の影響も無視できないので多数の
粒子を対象とした多数回の計算が必要となる。対象とす
る粒子の数がＮ個のとき、計算数はＮ²回になり、たと
えば１万個の粒子からなる系については１億回の計算を
することになる。なお、対象とする系が無限の広がりを
有する場合にも、周期的境界条件を用いることにより比
較的簡便な計算が可能である。この項の計算はハードウ
ェアにより行うことによる成果が大きい。

【００１４】これら粒子間の力の計算を一般的に表現す
ると、下の（４）式で表すことができる。Ｆ_i＝ΣＡ_ijｆ(Ｂ_ij|ｒ_ij|²)ｒ_ij （４）ここで、Ｆ_i、ｒ_ijはベクトル、ΣはＮ個の粒子全体に
関する総和である。また、Ａ_ij、Ｂ_ijは、たとえばファ
ン・デル・ワールス力などにおける粒子種に依存した係
数、クーロン力での電荷などを表す。

【００１５】したがって、ハードウェア演算部による演
算は以下の手順で行うことができる。まず、対象となる
粒子ｉがハードウェア演算部のレジスタにセットされる
と、粒子相互作用する粒子ｊの座標がメモリから順次供
給される。これら粒子の座標ｒ_jと対象粒子の座標ｒ_iと
の相対距離ベクトルｒ_ijから相対距離|ｒ_ij|を求める。
相対距離は自乗されて関数評価器に送られる。関数評価
器はメモリから送られた係数Ａ_ijとＢ_ijを使用してこれ
らの粒子間に働く２体力を求める。求められた２体力は
相対距離ベクトルｒ_ijと掛け合わされて、２つの粒子間
に働く力が得られる。これらの力を積算器で積算するこ
とにより注目している粒子に働く力の全てが求められ
る。

【００１６】このように、ある粒子が他の全ての粒子か
ら受ける力はハードウェア的に加算して求め、複雑だが
計算量の比較的少ない粒子の動きの計算などは既製のワ
ークステーションなどのホストコンピュータで行う。ハ
ードウェア演算装置とホストコンピュータの間の通信量
はＮ個のオーダであり通信の負担が過大になることはな
い。

【００１７】図６は、従来のハードウェア演算器の構成
例を示すブロック図である。ハードウェア演算器はバス
インターフェイスとメモリと演算チップとからなる。バ
スインターフェイスは外部バスを制御してホストコンピ
ュータとデータを交換する。メモリには粒子座標メモリ
と粒子種メモリと係数メモリと近接粒子リストメモリが
あり、アドレス発生部と係数メモリアドレス選択部を付
属する。演算チップは演算を実行するパイプライン演算
回路を備えている。

【００１８】以下に、ハードウェア演算器の動作を説明
する。対象となる粒子ｉを決めると、アドレス発生部が
対象粒子ｉと相互作用する粒子ｊの番号を出力する。ア
ドレス発生部は相互作用する全ての粒子の番号をシーケ
ンシャルに出力する。出力された粒子番号は粒子座標メ
モリに供給され、指定された粒子の座標が読み出されて
演算チップに供給される。

【００１９】また、係数メモリからは粒子番号に対応し
た係数のセットが出力されるが、例えば原子間に働く２
体力計算のように粒子種によって作用が異なる場合には
粒子種に基づく粒子種間接アドレッシングにより係数の
セットが選択される。間接アドレッシングモードでは、
まず粒子番号ｊに基づいて粒子種メモリから粒子種が読
み出され、対象粒子ｉの粒子種と対照することにより使
用すべき係数セットが選択されて演算チップに供給され
る。予め粒子種に対応した係数セットを記憶させておい
て利用する粒子種間接アドレッシングモードを準備する
のは計算対象の粒子を変更したときにメモリへのデータ
転送量を少なくして総合的な計算時間を短くするためで
ある。

【００２０】演算チップは粒子座標と係数を取り込んで
パイプラインで力の計算を行い結果を内部のレジスタに
蓄積する。また、演算課程で算出される粒子間距離が所
定の値以下である場合はこれを近接粒子リストメモリに
記憶させる。近接粒子リストは、その後にファン・デル
・ワールス力など粒子間距離が大きくなるにしたがって
影響は急激に減少するような力の計算を行う場合に、所
定の範囲内にある近接粒子のみを抽出する近接粒子間接
アドレッシングに利用して、無駄のない計算を行うこと
ができる。

【００２１】ハードウェア演算器は、ホストコンピュー
タから必要なパラメータや条件を入力し単純な高速演算
を大量に実行して結果をホストコンピュータに返す。ホ
ストコンピュータとは汎用のバスを介して結合するので
スーパーコンピュータやワークステーションなど任意の
形式のコンピュータを利用することができる。

【００２２】しかし、近接粒子リストは、対象粒子ｉを
切り替えるたびに他の全ての粒子との相対距離を計算し
た上で所定の近傍範囲にあるか否かを判定区分して作成
しなければならない。粒子番号は通常、入力順に決めら
れており、座標にしたがって決められているわけではな
く、また力を受けて運動することにより粒子座標も変化
する。このため、力算出の演算において、粒子の近接粒
子を抽出するために行う演算の割合は無視できない程大
きい。

【００２３】

【発明が解決しようとする課題】そこで、本発明が解決
しようとする課題は、並列パイプラインで多体問題を解
くハードウェア演算装置において、粒子座標演算を節減
して効率よく対象粒子の近傍に存在する粒子を選択し座
標を与えるアドレス装置を提供して、演算全体の速度を
向上させるところにある。

【００２４】

【課題を解決するための手段】上記課題を解決するた
め、本発明の多体問題解析装置に用いるアドレス装置
は、粒子の座標を記憶する粒子座標メモリと、対象空間
を座標に基づいて複数のセルに分割し番号を付し各セル
に属する粒子の座標が記憶されている粒子座標メモリの
アドレスを記憶するインデックスメモリを備え、粒子座
標が入力されると粒子座標メモリに格納すると共に粒子
座標に基づいて各セルに割り振ってインデックスメモリ
中の該当するセルに対応する位置に粒子番号を記憶さ
せ、演算するときはセル同士の近接関係に基づいてセル
を指定し該当するセルに属する粒子の番号をインデック
スメモリを参照して粒子座標メモリに格納された粒子座
標を読み出して近接粒子座標として供給するようにした
ことを特徴とする。

【００２５】なお、本発明のアドレス装置は、さらに演
算に使用する係数セットを記憶する係数メモリと、粒子
の種類を記憶するタイプメモリを備えてもよい。また、
３次元座標系における直方体空間を対象とするときは、
これを直方体セルに等分に分割して、座標値の小さい順
に通し番号を付すようにすることが好ましい。

【００２６】インデックスメモリは、先頭リスト領域と
リンク作成領域からなり、先頭リスト領域には各セルに
対応してセルの数だけリストユニットが準備され、リン
ク作成領域には各セルに２個以上の粒子が属する場合に
粒子に対応してリストユニットが生成されるようにし
て、単方向に鎖状に連結されたリストを形成することが
好ましい。

【００２７】ここで、リストユニットはセルインデック
スと粒子インデックスからなる。セルインデックスは帰
属するセルに関する情報を格納するもので、同じセルに
属する別のリストユニットが格納されたメモリのアドレ
スを表示する部分と、セルに属する最後のリストユニッ
トであるときに立てられる終了フラッグの部分を備え
る。また、およびセルインデックスが有効であることを
示す有効フラグの部分を備えてもよい。有効フラグを用
いると、パイプライン計算を行う場合に、空セルの遭遇
するとＦＩＦＯへの書き込みを抑制してダミーデータを
送り込むことにより、パイプライン計算を中断せずに続
行させることができる。一方、粒子インデックスは粒子
座標メモリにおいて指定された粒子の座標値が記憶され
ているアドレスを格納する。

【００２８】なお、先頭リスト領域には初めに自身のア
ドレスを記録しておいて、粒子情報を入力するたびに先
頭リスト領域に記録されていたアドレスを入力した粒子
のリストユニットに記入した上で、その粒子のリストユ
ニットのアドレスで先頭リスト領域に記録するアドレス
を書き換えるように構成してもよい。すると、最後には
セルに属する最後に入力した粒子のリストユニットのア
ドレスが先頭リスト領域に格納されるようになる。この
ような構成では、先頭リスト領域に記録されたアドレス
を見て最後に入力された粒子を知るところから始まって
最初に入力された粒子まで順次遡り、最後には先頭リス
ト領域に戻るようにしてセル内の粒子全体をソートする
ことができるので、終了フラグを必要としない。また、
先頭リスト領域に記録されたアドレスが先頭リスト領域
のアドレスと同じときにはセルに属する粒子が存在しな
いことになるので、有効フラグを用いないでも簡単に空
セルであることが分かる。

【００２９】なお、多体問題解析装置がパイプライン式
演算器により各対象粒子について順次に近接粒子との演
算を行い、最後に結果を統合することにより多体問題を
解くようにしたものである場合に、ホストコンピュータ
から対象とするセルを指定すると、本発明のアドレス装
置が指定されたセル毎に属する粒子を抽出して粒子座標
を読み出し、パイプライン演算器に対象粒子座標として
供給するようにすることもできる。このような構成によ
れば、同じセル内の粒子について同時にパイプライン演
算器で演算するため近接粒子が共通するので、パイプラ
イン演算器には同じ近接粒子座標データを供給すれば足
りる。

【００３０】

【発明の実施の形態】以下、図面を参照して本発明の詳
細を実施例に基づいて説明する。図１は本発明の実施例
のアドレス装置を利用したハードウェア演算装置の構成
を示すブロック図である。本実施例のハードウェア演算
装置１はホストコンピュータ２の補助機器として使用さ
れる。ハードウェア演算装置１はバス部分１０とメモリ
部分２０と演算部分３０からなる。

【００３１】バス部分１０はホストコンピュータ２とハ
ードウェア演算装置１のデータ交換を行う部分である。
両者間におけるデータ類の交換は外部バス１１を介して
バスインターフェース１２の制御の下で行われる。バス
インターフェース１２は入力するデータ類をそれぞれの
装置に適合した形式に変換して出力する。ハードウェア
演算装置１内部の各回路と外部バス１１とのデータ交換
は原則として内部バス１４を介して行われ、内部バス制
御回路１３が制御する。内部バス制御回路１３は、バス
インターフェース１２から粒子のアドレスやデータを入
力してメモリ制御回路２１、ＦＩＦＯスタック２６、演
算回路３１へ粒子のアドレスやデータを出力する。ま
た、入力したデータ類を適合した型に変換する。なお、
ホストコンピュータ２からハードウェア演算装置内への
アクセスも内部バス制御回路１３を介して行う。

【００３２】メモリ部分２０が本発明に係るアドレッシ
ング機能を果たす主要部分で、粒子種メモリ２２、イン
デックスメモリ２３、粒子座標メモリ２４、係数メモリ
２５およびＦＩＦＯスタック２６と、メモリ制御回路２
１が備えられている。メモリ制御回路２１はこれらメモ
リの読み書きに関する動作を行う。力計算の準備として
の粒子データなどの書き込み、計算時に必要となるデー
タの読み出しなどメモリへのアクセスは全てメモリ制御
回路２１を介して行われる。メモリ制御回路２１は必要
なタイミング信号を生成する機能も備えている。

【００３３】粒子種メモリ２２は粒子の種類に関する情
報を格納するメモリで、実装上は粒子座標メモリ２４の
空きを利用して装備することができる。インデックスメ
モリ２３は粒子に対応してリストユニットを格納するメ
モリである。粒子座標メモリ２４は粒子の座標値を順に
記憶している。係数メモリ２５は演算の種類にしたがっ
て対応する係数を記録しているメモリである。

【００３４】ＦＩＦＯスタック２６は、粒子座標メモリ
２４や係数メモリ２５と演算部分３０とホストコンピュ
ータ２との間のデータパスである。ＦＩＦＯスタック２
６は、先入れ先出し方式スタックメモリからなり、内部
バス制御回路１３から受け取ったデータ類を受け取った
順に粒子座標メモリ２４や係数メモリ２５に書き込み、
またこれらメモリから受け取ったデータ類を受け取った
順に演算部分３０に供給するときのタイミング調整を主
な機能とする。

【００３５】演算部分３０は、演算回路３１と近接粒子
リストメモリ制御回路３２と近接粒子リストメモリ３３
を備えている。演算回路３１は並列パイプライン方式に
より演算を実行するＬＳＩチップからなり、１個のチッ
プが実行できるパイプライン数が例えば６列などと決ま
っているので、必要に応じてチップ数を選択して演算の
高速化を図ることができる。また、演算回路３１のユニ
ットを並列に複数設けることにより使えるチップ数を増
やしてさらに演算高速化を図ることもできる。演算結果
は演算回路３１中のレジスタに蓄積され、ホストコンピ
ュータ２の要求に応じて内部バス１４を通り内部バス制
御回路１３を介し外部バス１１を通ってホストコンピュ
ータ２に供給される。

【００３６】なお、全領域について演算をした後で近接
粒子演算する場合には、従来と同様、近接粒子リストを
作成して近接粒子リストメモリ３３に格納して利用する
ことができる。近接粒子リストメモリ３３は先入れ先出
し方式のスタックメモリで、演算の必要にしたがって演
算回路３１から入力された順に近接粒子のインデックス
あるいは相対距離を出力する。近接粒子リストメモリ制
御回路３２は近接リストメモリ３３の読み書きを制御す
る。

【００３７】次に、本発明の中心であるメモリ部分２０
と内部バス制御回路１３を中心にして、さらに詳しい回
路と動作を説明する。図２は、内部バス制御回路とメモ
リ部分におけるアドレッシングに関連する機能部分に関
するブロック図である。図は、内部バス制御回路１３、
メモリ制御器２１、インデックスメモリ２３、粒子座標
メモリ２４、係数メモリ２５、ＦＩＦＯスタック２６お
よび演算回路３１の間の情報の流れを表すものである。

【００３８】図中、矢印形の素子は先入れ先出しスタッ
クメモリ（ＦＩＦＯ）であって情報は矢尻側から入力し
て矢先から出力される。また台形をした素子は状況によ
り情報の流れを切り替える機能を持つ切換器であり、底
辺側から上辺側に情報が流れる。なお、図中信号線の矢
印は情報の伝達方向を示し、矢印のない信号線は情報が
両方向に流れることを示すが、ＦＩＦＯと切換器に接続
された信号線は１方向にしか信号を流さないことが明ら
かなので矢印を付していない。

【００３９】内部バス制御回路１３は外部バス１１と内
部バス１４の間に設置されるもので、データ型変換器１
１１と結果メモリ１１２とアドレス生成制御器１１３と
アドレス変換器１１４を備えている。演算結果を読み出
すときや粒子の座標値等を自動的に供給するときは、ア
ドレス生成制御器１１３が、ホストコンピュータ２から
の要求により起動され演算回路３１の演算結果が格納さ
れているレジスタのアドレスを連続的に自動生成して演
算回路３１に送り出す。この時演算回路３１への制御信
号も生成される。また、アドレス変換器１１４は、ホス
トコンピュータ２で生成したアドレスを使用する場合に
アドレスをデコードして実行できる制御信号やローカル
アドレスを生成して供給する回路である。

【００４０】結果メモリ１１２は、演算回路３１の計算
結果をホストコンピュータ２に受け渡すための回路であ
る。結果メモリ１１２は演算回路３１から読み出された
データを受入れて設定に応じて加工した上で内部に備え
た先入れ先出しスタックメモリ（ＦＩＦＯ）に順次格納
する。ホストコンピュータ２は演算結果を結果メモリ１
１２から読み出すことができる。また、粒子の座標値と
それに対応する係数セットを演算回路３１に自動的に供
給するときには、上記アドレス生成制御器１１３から与
えられるアドレスにしたがってＦＩＦＯスタック２６に
格納されていたデータが演算回路３１に送り込まれる。
データ型変換器１１１は、ホストコンピュータ２から供
給されるデータを、例えば倍精度浮動小数から４０bit
整数など、適当な型に変換してメモリ部分２０と演算部
分３０に供給する。

【００４１】メモリ制御回路２１は、セルインデックス
書き込みシーケンサ１２１、セルインデックス読み出し
シーケンサ１２２、粒子インデックス先入れ先出しスタ
ック１２３、座標値アドレス発生器１２４、および係数
アドレス発生器１２５を備えている。また、ＦＩＦＯス
タック２６は、粒子座標値を扱う座標値読み出しスタッ
ク１３１と座標値書き込みスタック１３２、および係数
を扱う係数読み出しスタック１３３と係数書き込みスタ
ック１３４の４個の先入れ先出し方式スタックメモリか
らなる。

【００４２】メモリ制御回路２１は、力演算に必要な粒
子の座標値や係数を蓄積しておいて、パイプライン演算
を実行する演算回路３１に効率よく供給するものであ
る。ここでは、粒子座標値を効率よく供給するため、演
算の対象とする粒子が存在する領域を予め小さなセルに
分割し、粒子はこれらのセルに割り当てておく。対象と
する粒子と近接関係にある粒子は、対象粒子が属するセ
ルと近接関係にあるセルに属する粒子であるから、近接
セルを指定してその中に含まれる粒子の情報を取り出し
て演算に利用する。

【００４３】なお、セルは座標値に基づいて一定の順に
番号付けされているので、セル同士の近接関係は簡単な
演算により容易に求めることができる。このように、粒
子同士の近接関係をセル同士の近接関係に置き換えるこ
とにより、始めに粒子座標をセルに割り当てておけば、
対象粒子毎に全ての粒子について近接関係を確認する必
要はなく、対象粒子自身が属するセルと近接関係にある
セルを指定してその中に含まれる粒子を抽出して使用す
ればよいので、演算負荷も演算時間も大幅に節減でき
る。

【００４４】そこで、粒子の座標値等を供給するための
準備として、まず、図３のセル分割模式図に表すよう
に、演算の対象とする粒子が存在する直方体領域を直交
座標系におき、ΔＸ、ΔＹ、ΔＺの稜長を有する小さな
直方体の区画に分けてセルとする。セルにはＸ、Ｙ、Ｚ
の順に座標が小さい方から番号が付けられる。ある粒子
座標Ｐi（Ｘi，Ｙi，Ｚi）が与えられたときに、その粒
子が属するセルの番号Ｎは、floor（Ｘi／ΔＸ）＋floo
r（Ｙi／ΔＹ）×Ｘ方向のセル個数＋floor（Ｚi／Δ
Ｚ）×Ｘ方向のセル個数×Ｙ方向のセル個数、により求
められる。ここで、floor（Ｘ）はＸを超えない最大の
整数を意味する。

【００４５】セルインデックス書き込みシーケンサ１２
１は、データ型変換器１１１から転送されてくる粒子座
標値に基づいて指定する粒子が属するセルを決定し、座
標値アドレス発生器１２４が決める粒子座標の格納アド
レスと合わせてセルリストを生成してインデックスメモ
リ２３に格納する。なお、粒子座標値は一旦ＦＩＦＯス
タック２６に蓄積され、メモリ制御回路２１からの制御
信号を受けて粒子座標メモリ２４内の対応する番地に格
納される。

【００４６】セルリストは、セルに属する粒子の数によ
らず、かつ入力順に格納できるように特殊な構造を有す
る。図４は、１個のセルに対応するセルリストを概念的
に表した図面である。セルリストは予めセルの数だけ準
備され、粒子１個ずつに対して生成されるリストユニッ
トを指定のセルに属する粒子について単方向に鎖状に連
結したものである。リストユニットは、それぞれ粒子イ
ンデックスとセルインデックスからなる。

【００４７】粒子インデックスは、指定された粒子の座
標値が収納されている粒子座標メモリ２４内の位置のア
ドレスを指示するインデックスである。またセルインデ
ックスは、粒子が属するセルに関する情報を格納するイ
ンデックスで、同じセルに属する次のリストユニットが
格納されたインデックスメモリのアドレスを表示するポ
インタ部分とセルに属する最後の粒子のリストユニット
であるときに立てられる終了フラッグの部分を備える。

【００４８】セルに対応するセルリストの先頭のリスト
ユニットには最後に書き込まれた粒子の粒子インデック
スのアドレスが書かれており、最後に書き込まれた粒子
のリストユニットにはその前に書き込まれた粒子の粒子
インデックスのアドレスが書き込まれているので、次々
に遡って辿っていくことによりそのセルの属する全ての
粒子の座標値を知ることができる。なお、先頭の次に書
き込まれた粒子のリストユニットに立てた終了フラッグ
により、セルに属する最後の粒子であることが分かるよ
うにしてある。

【００４９】上記のようなセルリストの構成を用いると
きは、セルに属する粒子情報が入力されたときに、イン
デックスメモリ２３の中の空いているアドレスにリスト
ユニットを生成する。次いで、リストユニットの粒子イ
ンデックスに粒子座標メモリ２４の座標値を格納するア
ドレスを記入し、セルインデックスに先頭のリストユニ
ットに記録されていたアドレスを記入する。そして、先
頭リストユニットのセルインデックスに新たに生成され
たセルユニットのアドレスを記入することにより、セル
リストが完成する。

【００５０】この方法は、新しい粒子を追加する場合に
も、新しく生成されるリストユニットと先頭リストユニ
ットのみ手を加えれば済み、その他の既存のリストユニ
ットをいじる必要がない点が優れている。なお、セルイ
ンデックスにはそのセルインデックスが有効であるとき
に立てる有効フラグの部分が備えられている。有効フラ
グはセルリストを生成したときに立てるもので、インデ
ックスメモリ２３が初期化されて０になった状態とアド
レス値が０の状態を区別するために使用される。

【００５１】図５はインデックスメモリ２３内における
セルリストの配置状態を示す図面である。セルリストは
セルの数だけ作られるが、先頭のリストユニットは全て
のセルの分が予め先頭リスト領域に確保されていて、１
個のセル内で２番目以下の粒子に関するリストユニット
は、先頭リスト領域以降にあるリンク作成領域に生成さ
れる。

【００５２】本方式によると、リストの先頭インデック
スの格納場所が最初から一定の位置に決められているの
で、対象セルの番号と先頭インデックスのアドレスが１
体１に対応付けられ、探索を始めるときの処理が簡単に
なる利点がある。また、粒子はセルリスト内のセルイン
デックスによりリンクされているため、リンク作成領域
におけるセルリストの位置は全く自由であり、粒子座標
値の入力順に詰めていってメモリを効率的に利用するこ
とができる。

【００５３】あるセルが指定されると、そのセルに対応
するセルリストの先頭のリストユニットの粒子インデッ
クスを参照して粒子座標メモリ２４から粒子座標を読み
取ることができる。次にそのリストユニットのセルイン
デックスを参照すると、そこには最後に書き込まれた粒
子の粒子インデックスのアドレスが書かれているので、
これに基づいて座標値を得ることができる。また、最後
に書き込まれた粒子のリストユニットにはその前に書き
込まれた粒子の粒子インデックスのアドレスが書き込ま
れている。こうして次々に粒子インデックスから座標値
を得ながら芋づる式に遡っていって、先頭の次に書き込
まれた粒子のリストユニットに至ると、そのセルインデ
ックスに終了フラッグが立っているので最後の粒子であ
ることが分かる。

【００５４】なお、最初からセルリストの先頭となるリ
ストユニットの場所が確保されているため、粒子が１個
も存在しないセルについてはからの先頭リストが存在す
ることになる。このようなセルを空セルと呼び、これに
当たったときは次のセルに探索対象を写す。パイプライ
ン演算時には演算中にデータ入力を途切れさせることは
できないので、空セルから読み出したダミーのアドレス
から得られたデータはＦＩＦＯスタック２６で計算上影
響のないダミーデータに置き換えて演算回路３１に送る
ようにする。

【００５５】セルリスト構成の別法として、先頭リスト
領域に格納される先頭セルユニットだけを別の形式とし
て、セルインデックスに最後に入力されたリストユニッ
トのアドレスを入れることは同じであるが、粒子インデ
ックスを備えず、最初に入力した粒子から全てリンク作
成領域に格納するようにしてもよい。この場合は、粒子
情報を入力するたびにリストユニットを生成し、そのセ
ルインデックスに先頭リストユニットのセルインデック
スに格納されていたアドレスを転写して、先頭リストユ
ニットには新しく生成されたリストユニットのアドレス
を記入する。

【００５６】この別法のように構成されたものでは、粒
子情報がセルにとって最初のものから最後のものまで全
く同じ操作でセルリストを生成することができる。ま
た、あるセルが指定されると先頭インデックスを参照し
てそのセルの最後に入力された粒子から遡りながら座標
値を取得していき最後に最初に入力した粒子に行き着く
と先頭セルリストのアドレスを示すので、セルインデッ
クスに終了フラグを準備しておかなくても最後の粒子で
あることが分かる。また、セルに１個の粒子も属しない
場合には、先頭セルリストを参照したときに他のアドレ
スが記録されていないことから直ちに判定することがで
きる。

【００５７】次に、図２を用いて具体的な粒子座標値の
書き込み操作を説明する。ホストコンピュータ２が６４
bit倍精度浮動小数点で表された粒子座標を書き込む
と、データ型変換器１１１がこの情報を４０bitの整数
に変換してメモリ制御回路２１とＦＩＦＯスタック２６
に送る。ＦＩＦＯスタック２６は、受け取った粒子座標
データを座標値読み出しスタック１３１に蓄積する。

【００５８】一方、メモリ制御回路２１は、粒子座標デ
ータを受け取ると、まず座標値アドレス発生器１２４内
のレジスタに記憶された粒子座標メモリ２４のアドレス
をインクリメントし書き込みアドレスを生成する。書き
込みタイミング信号と書き込みアドレスを粒子座標メモ
リ２４に送ると共に、ＦＩＦＯスタック２６に出力指令
を送ると、座標値読み出しスタック１３１からデータが
粒子座標メモリ２４に出力されて格納される。

【００５９】また、セルインデックス書き込みシーケン
サ１２１は受け取った粒子座標データからその粒子が属
するセルを算定して、所属セルに対応するセルリストを
呼び出し、インデックスメモリ２３内に新たなリストユ
ニットを生成する。リストユニットには座標値アドレス
発生器１２４で生成した粒子座標メモリ２４への書き込
みアドレスと先頭リストユニットに記憶されている前回
入力された粒子のリストユニットのアドレスを記入す
る。また先頭リストユニットのセルインデックスには新
しく発生させたリストユニットのアドレスを書き込む。

【００６０】こうして、全ての粒子についてリストユニ
ットを生成すると、対象空間全体についてのセルリスト
が完成する。なお、係数データは通常、係数アドレス発
生器１２５が係数データが入ってくるタイミングを見て
インクリメントする係数メモリ２５のアドレスに基づい
て、内部バス制御回路１３から直接に係数メモリ２５に
入力されるが、バースト時は一旦係数書き込みスタック
１３４に蓄積された後に速度差を吸収しながら入力され
た順に格納される。

【００６１】次に、セルインデックス読み出し操作につ
いて説明する。セルインデックス読み出し操作は、イン
デックスメモリ２３内に構築されたセルリストをたどっ
て、セル内の粒子インデックスを出力する操作である。
セルインデックス読み出しシーケンサ１２２は、ホスト
コンピュータ２により探索の対象となる領域を設定され
てから起動する。探索対象となるセルが与えられると、
該当するセルリストの先頭アドレスを計算し、インデッ
クスメモリ２３に出力して、粒子インデックスとセルイ
ンデックスを読み取る。

【００６２】粒子インデックスは座標値アドレス発生器
１２４で粒子座標メモリ２４のアドレスに変換され、こ
れに対応する粒子座標データが粒子座標メモリ２４から
ＦＩＦＯスタック２６の座標値読み出しスタック１３１
に送出される。また、係数アドレス発生器１２５は、粒
子座標メモリ２４のアドレスを対応する係数メモリ２５
のアドレスに変換し、これに基づいて係数データを読み
出してＦＩＦＯスタック２６の係数読み出しスタック１
３３に送出される。

【００６３】セルインデックスは、セルインデックス読
み出しシーケンサ１２２内で次のリストユニットを読み
出すアドレスに変換され、インデックスメモリ２３に送
られて、次のリストユニットが読み出される。このよう
な工程を繰り返すことにより、指定のセル内に存在する
全ての粒子が検索される。セルインデックスを読み出し
た結果、無効インデックスであったり終了フラッグが立
っていた場合は、次の探索対象セルを算出してセルリス
トを指定し同じように先頭リストユニットから検索を行
う。検索対象とする全てのセルについてセルリストを探
索し終えると、セルインデックス読み出し操作は終了す
る。

【００６４】セルインデックス読み出し操作によりパイ
プライン演算を行うときは、インデックスメモリ２３に
送られた粒子座標データと係数データは、送られてきた
順に演算回路３１に送られて利用される。セルインデッ
クス読み出し操作は終了するまでに、探索対象となるセ
ル中に存在する全ての粒子の情報が演算回路３１に送り
込まれて、演算を完成することができる。

【００６５】なお、対象粒子について適宜の順にパイプ
ライン演算を行うようにすると同時に実行される演算に
用いられる粒子座標データが対象粒子毎に異なることに
なる。そこで、パイプライン演算器で同時に演算する対
象粒子を同じセルから選択するようにして演算の効率を
高めることができる。このため用いられるのが自動座標
書き込み操作である。

【００６６】通常のパイプライン演算による方法では、
対象粒子の粒子座標データが演算回路３１の演算パイプ
ラインに適宜に送られ、各パイプラインで演算される粒
子毎にこれと関係を有するセルが指定されて、そのセル
内に存在する他の粒子との関係が算出される。これに対
し、自動座標書き込み操作を用いれば、ホストコンピュ
ータ２が計算対象となるセルを順次指定し、指定された
特定のセルに属する粒子の粒子座標を自動的に抽出して
演算回路３１のレジスタに転送してパイプライン演算す
ることになり、パイプライン演算器で同時に演算される
対象粒子が同じセルに属するので、演算する関係粒子が
共通し、粒子座標データ等の準備や取り込みが簡単にな
る。

【００６７】以下、自動座標書き込み操作の流れについ
て説明する。ホストコンピュータ２によりセルインデッ
クス読み出しシーケンサ１２２が起動される。この時、
探索するセルが指示される。セルインデックス読み出し
シーケンサ１２２は、指定されたセルについてセルリス
トを探索してセルに属する粒子の粒子インデックスを座
標値アドレス発生器１２４に順次出力する。座標値アド
レス発生器１２４は粒子インデックスを対応する粒子座
標メモリ２４のアドレスに変換し、対象となる粒子の座
標データを読み出してＦＩＦＯスタック２６の座標値読
み出しスタック１３１へ順次送出する。

【００６８】座標値読み出しスタック１３１に蓄積され
た粒子座標データは演算の前に予め演算回路３１のレジ
スタに転送される。転送先となるレジスタのアドレスは
内部バス制御回路１３内のアドレス生成制御器１１３に
より生成される。パイプライン演算器では同じセル内の
対象粒子に関して演算するため、演算対象粒子に影響を
及ぼす粒子は共通するので、パイプライン演算器には同
じ粒子座標データを供給すればよく、演算の効率が向上
する。

【００６９】パイプライン演算実行時には対象粒子の数
は事実上無制限であるが、自動座標書き込み操作では抽
出した粒子数が例えば２４個など演算回路３１内のレジ
スタ数に達したとき、または探索対象になっているセル
内の粒子が尽きたときに操作を終了する。なお、対象と
するセルが残っているときには余ったレジスタで演算さ
せるため次の対象セルから抽出した粒子を追加すること
ができる。転送された粒子インデックスはメモリ制御回
路２１の粒子インデックス先入れ先出しスタック１２３
に記録され、自動座標書き込み操作が終了した後でどの
粒子が演算されたかを知ることができる。なお、セルリ
スト探索時に空セルを読み出したときには、ＦＩＦＯス
タック２６で空セルの粒子座標データが破棄されると共
に、空セルにあったダミー粒子は探索した粒子として数
えないようにする処理が行われる。

【００７０】本実施例のアドレス装置を適用した演算装
置では、近接粒子間の作用力を計算する場合に、対象粒
子が属するセルに対して所定の距離以内にあるセルを算
定し、これに従って指定したセルのみについて内に属す
る粒子の情報を読み出して、先入れ先出しスタックを介
して演算回路に供給することにより、効率よく高速な演
算が可能となる。セルは同形の直方体であって直方体に
堆積されＸ，Ｙ，Ｚ座標の順に番号付けられているか
ら、所定の距離関係を有するセルはセル番号を利用して
容易に求められる。なお、セルを適当に微細化して近接
領域に含まれるセルの集合が球に近いようにすると、セ
ル数が増えてアドレス装置における負担は増加するが、
演算回路における計算量をより少なくすることができ
る。

【００７１】

【発明の効果】以上説明した通り、ハードウェア演算装
置に本発明のアドレス装置を用いれば、並列パイプライ
ンで近接粒子同士の作用力に関する多体問題を解く場合
に、所定の距離内にあるセルを指定しその中に配分され
ている粒子を近接粒子として使用することができるの
で、粒子それぞれについて距離を確認するのと比較し
て、極めて効率よく近傍粒子の座標を与えて高速演算を
実行することができるようになる。

【図面の簡単な説明】

【図１】本発明の実施例のアドレス装置を利用したハー
ドウェア演算装置の構成を示すブロック図である。

【図２】本実施例のアドレッシングに関連する機能部分
に関するブロック図である。

【図３】本実施例におけるセル分割方法の模式図であ
る。

【図４】本実施例におけるセルリストの概念図である。

【図５】本実施例におけるセルリストの配置図である。

【図６】従来のハードウェア演算器の構成例を示すブロ
ック図である。

【符号の説明】

１ハードウェア演算装置２ホストコンピュータ１０バス部分１１外部バス１２バスインターフェース１３内部バス制御回路１４内部バス２０メモリ部分２１メモリ制御回路２２粒子種メモリ２３インデックスメモリ２４粒子座標メモリ２５係数メモリ２６ＦＩＦＯスタック３０演算部分３１演算回路３２近接粒子リストメモリ制御回路３３近接粒子リストメモリ１１１データ型変換器１１２結果メモリ１１３アドレス生成制御器１１４アドレス変換器１２１セルインデックス書き込みシーケンサ１２２セルインデックス読み出しシーケンサ１２３粒子インデックス先入れ先出しスタック１２４座標値アドレス発生器１２５係数アドレス発生器１３１座標値読み出しスタック１３２座標値書き込みスタック１３３係数読み出しスタック１３４係数書き込みスタック

───────────────────────────────────────────────────── フロントページの続き (72)発明者曽根田直樹東京都狛江市岩戸北２丁目11番１号財団法人電力中央研究所内Ｆターム(参考） 5B045 AA07 GG17 KK04 5B049 EE03 EE04 EE05 EE41 FF07 GG04 GG07 5B056 AA04 BB51 FF16

Claims

【特許請求の範囲】

【請求項１】粒子の座標を記憶する粒子座標メモリ
と、対象空間を座標に基づいて複数に分割して形成した
各セルに属する粒子の座標が記憶されている粒子座標メ
モリのアドレスを記憶するインデックスメモリを備え、
粒子座標が入力されると前記粒子座標メモリに格納する
と共に該粒子座標に基づいて各セルに割り振って前記イ
ンデックスメモリ中の該当するセルに対応する位置に該
粒子座標を記憶した前記粒子座標メモリのアドレスを記
憶させ、演算するときはセル同士の近接関係に基づいて
セルを指定し該セルに属する粒子について前記インデッ
クスメモリに記録されたアドレスを参照して粒子座標メ
モリに格納された粒子座標を読み出して近接粒子座標と
して供給するようにしたことを特徴とする多体問題解析
装置に用いるアドレス装置。
【請求項２】さらに演算に使用する係数セットを記憶
する係数メモリと、粒子の種類を記憶するタイプメモリ
を備えて、対象とする粒子により係数を選択できるよう
にしたことを特徴とする請求項１記載の多体問題解析装
置に用いるアドレス装置。
【請求項３】３次元座標系における直方体空間を対象
として、直方体セルに等分に分割して、座標値の小さい
順に番号を付すことを特徴とする請求項１または２に記
載のアドレス装置。
【請求項４】前記インデックスメモリは、先頭リスト
領域とリンク作成領域からなり、該先頭リスト領域には
各セルに対応してセルの数だけリストユニットが準備さ
れ、前記リンク作成領域には各セルに２個以上の粒子が
属する場合に粒子に対応してリストユニットが生成され
るようにして、単方向に鎖状に連結されたリストを形成
して、セルの基づく検索を先頭リスト領域から始めるこ
とを特徴とする請求項１から３のいずれかに記載のアド
レス装置。
【請求項５】前記リストユニットはセルインデックス
と粒子インデックスからなり、該セルインデックスは帰
属するセルに関する情報を格納するもので同じセルに属
する別のリストユニットが格納された前記インデックス
メモリのアドレスを表示する部分とセルに属する最後の
粒子のリストユニットであるときに立てられる終了フラ
ッグの部分を備え、前記粒子インデックスは粒子座標メ
モリにおいて指定された粒子の座標値が記憶されている
アドレスを格納することを特徴とする請求項４記載のア
ドレス装置。
【請求項６】前記セルインデックスはさらにセルイン
デックスが有効であることを示す有効フラグの部分を備
えて、有効フラグが立っていないときは所定のダミーデ
ータを供給することを特徴とする請求項５記載のアドレ
ス装置。
【請求項７】前記多体問題解析装置がパイプライン式
演算器により各対象粒子について順次に前記近接粒子と
の演算を行って多体問題を解くようにしたものであっ
て、前記アドレス装置がさらにセルが指定されると該指
定されたセル毎に属する粒子を抽出し、前記インデック
スメモリに記録されたアドレスを参照して粒子座標メモ
リに格納された粒子座標を読み出して前記対象粒子の粒
子座標として供給することを特徴とする請求項１から６
のいずれかに記載の多体問題解析装置。