JP2001236342A - 多体問題解析装置に用いるアドレス装置 - Google Patents

多体問題解析装置に用いるアドレス装置

Info

Publication number
JP2001236342A
JP2001236342A JP2000045606A JP2000045606A JP2001236342A JP 2001236342 A JP2001236342 A JP 2001236342A JP 2000045606 A JP2000045606 A JP 2000045606A JP 2000045606 A JP2000045606 A JP 2000045606A JP 2001236342 A JP2001236342 A JP 2001236342A
Authority
JP
Japan
Prior art keywords
particle
cell
memory
particles
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000045606A
Other languages
English (en)
Inventor
Akira Takada
亮 高田
Naoki Soneta
直樹 曽根田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GAZO GIKEN KK
Central Research Institute of Electric Power Industry
Original Assignee
GAZO GIKEN KK
Central Research Institute of Electric Power Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GAZO GIKEN KK, Central Research Institute of Electric Power Industry filed Critical GAZO GIKEN KK
Priority to JP2000045606A priority Critical patent/JP2001236342A/ja
Publication of JP2001236342A publication Critical patent/JP2001236342A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 並列パイプラインで多体問題を解くハードウ
ェア演算装置において、粒子座標演算を節減して効率よ
く対象粒子の近傍に存在する粒子を選択し座標を与え
て、演算全体の速度を向上させるアドレス装置を提供す
る。 【解決手段】 粒子座標メモリ24とインデックスメモ
リ23を備え、粒子座標メモリ24は粒子の座標を記憶
し、インデックスメモリ23は対象空間を座標に基づい
て複数の直方体に分割して形成する各サブセルに属する
粒子の座標を記憶する。粒子座標が入力されると粒子座
標メモリ24に格納すると共に粒子座標に基づいて各サ
ブセルに割り振ってインデックスメモリ23中の該当す
るサブセルに対応する位置に粒子番号を記憶させ、演算
するときはサブセル同士の近接関係に基づいてサブセル
を指定し該当するサブセルに属する粒子の番号をインデ
ックスメモリ23を参照して粒子座標メモリ24に格納
された粒子座標を読み出して近接粒子座標として供給す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、並列パイプライン
で多体問題を解く多体問題解析装置に用いて対象粒子の
近傍に存在する粒子を選択し座標を与えるアドレス装置
に関する。
【0002】
【従来の技術】分子動力学法を含む多体問題とは、系を
構成する個々の粒子の特徴とそれら粒子間に働く力を基
にして対象となる系を把握することにより、その系が持
っている様々な性質を説明したり変化を予測することを
可能にしようとするものである。このような方法は、今
日の科学において対象となる系の属性によらず一つの普
遍的なアプローチとして重要性を増しつつある。
【0003】しかしながら、このような要求に応えるた
め、例えば1万個のオーダーの粒子からなる多体問題を
解く必要があるとすれば、それらの粒子間に働く力を計
算するには粒子数の2乗すなわち1億回の演算を行うこ
とが要求される。さらに演算が静定するまでには、この
計算を数万回から数百万回というオーダーで繰り返す必
要がある。
【0004】従来、このような多体問題の計算はスーパ
ーコンピュータを利用して行われてきたが、スーパーコ
ンピュータはコストの関係で個々の研究者が占有して自
由に使用することができなかった。また、特に性能の高
い並列型スーパーコンピュータではその性能を十分引き
出すためにプログラムの解析と変更が必要で、コンピュ
ータの専門家でない研究者にとっては大きな負担となり
研究の効率に影響があった。
【0005】そのため、スーパーコンピュータの代わり
に高速なワークステーションを利用して研究者個人がマ
シンを占有して計算を行うことが多くなった。しかし、
この場合は性能が十分でないため結果が得られるまでの
時間が長く研究を進める上で大きな支障となっていた。
また、様々な近似手法を用いて計算時間を短縮する試み
も行われているが、得られる結果の妥当性が損なわれて
しまうことも多く問題があった。このように、スーパー
コンピュータやワークステーションなどを用いても、コ
ストとパーフォーマンスのいずれにおいても不満があっ
た。
【0006】このような不満を解消する方法として、多
体問題の計算で計算量が最も多くなる粒子間の相互作用
を計算する部分をハードウェア化して計算速度を上げる
ことにより対応する方法がある。粒子間相互作用の計算
は単純な計算手順の繰り返しであり並列処理が可能であ
るため、ハードウェア化が容易であってその効果も大き
い。しかも、並列パイプラインで高速処理するハードウ
ェアで大量単純演算部分の粒子間力を計算させることに
より、ホストに安価な汎用のコンピュータを利用して、
全体として最高級のスーパーコンピュータに匹敵する実
効速度を持つ演算装置を実現することができる。
【0007】特に、ハードウェア化する部分を力の計算
に限りかつ任意の関数の高精度近似ができるようにした
ものを組み込んだ演算装置は、専用化された計算機であ
りながら、幅広い分野の計算に適用することができる。
ハードウェアの高速演算機能を利用するためには、従来
のソフトウェアで力やポテンシャルの計算を行っている
部分をハードウェアのインターフェースライブラリを呼
び出すように変更するだけでよく、並列プログラムなど
の専門的な知識はいらない。このような組合せを利用し
た手近な演算装置により、2つの粒子間に働く力を「任
意の形の距離の関数」として扱えるようにして、重力、
クーロン力、ファン・デル・ワールス力を始めとする多
様な力を計算するようにしたので、例えば薬学、材料工
学、流体工学など、多様な分野に応用することが可能と
なった。
【0008】多体系問題では、系内の粒子について他の
粒子から受ける力を計算し、その結果に基づいて粒子の
新しい位置と速度を算出することにより、系の物理量を
求める。多体系問題の計算は、まず初期設定として粒子
の位置と速度を設定し、粒子を指定してそれが他の粒子
から受ける力を計算して粒子を新しい位置に移動する計
算を粒子数に応じた回数繰り返して系の物理量を求め、
さらに、この物理量算出計算を新しい分布状態について
必要な回数繰り返すことにより、系の運動などを求める
という手順により行われる。上記演算装置では、個々の
粒子が他の粒子から受ける力の計算をハードウェアの高
速演算機能を用いて行い、粒子の動き等の計算をホスト
コンピュータで行っている。
【0009】これらの計算は粒子の数が増えるのに伴っ
て急激に計算回数が増加するが、計算式は単純なもので
あるので、ハードウェアに取り込んで高速演算すること
が可能である。粒子の移動量はハードウェアで求めた力
に基づいてホストコンピュータで計算する。対象とする
粒子全体について目的の回数だけ計算を繰り返して目的
の物理量を求める。新しい粒子位置と速度をハードウェ
アに入力して力の計算をさせ、その結果を用いて再び新
しい粒子位置を求める。必要な回数繰り返すことにより
最終的な目的物理量を得ることができる。
【0010】上記演算装置を分子動力学法に応用してシ
ミュレーションを行う場合について説明する。分子動力
学法とは、対象とする物質系の構成粒子の微視的な運動
を追跡してその物質系の性質を調べる方法で、多体問題
の1つのバリエーションである。例として、第i番目の
イオンと第J番目のイオンからなる剛体イオンモデルの
2体力ポテンシャルを求める場合を考える。剛体イオン
のポテンシャルは次式(1)で表される。 F(r)=Zij2/r+Fij R+Fij D (1) ここで、rは粒子間距離、Zはイオンの電荷数、eは電
子の電荷である。
【0011】また、FRは原子の電荷分布の重なりによる
近接反発力で、例えば下の(2)式で表される場合があ
る。 FR=e(s/r)n (2) 近接力は極く近くに存在する極く少数の粒子間で働くの
で、ホストコンピュータで計算するようにしてもよい。
【0012】FDは分散ポテンシャルと呼ばれるファン・
デル・ワールス力で、異なる分子に属する荷電粒子間の
静電気力によりその分子の電荷分布が瞬間的に非対称に
なることにより生じ、下の(3)式で表される。 FD=−c2/r6 (3) ファン・デル・ワールス力は、多くの粒子が関係するの
でハードウェアで構成した演算器により計算することが
好ましいが、粒子間距離が近い場合に影響が大きく遠距
離になるにしたがって影響は急激に減少するため、所定
の範囲内にある近接粒子を抽出して計算すればよい。し
たがって、近接粒子を効率よく選択して無駄のない計算
を行うようにすることが好ましい。
【0013】(1)式の右辺第1項はクーロンポテンシ
ャルで、遠距離の粒子の影響も無視できないので多数の
粒子を対象とした多数回の計算が必要となる。対象とす
る粒子の数がN個のとき、計算数はN2回になり、たと
えば1万個の粒子からなる系については1億回の計算を
することになる。なお、対象とする系が無限の広がりを
有する場合にも、周期的境界条件を用いることにより比
較的簡便な計算が可能である。この項の計算はハードウ
ェアにより行うことによる成果が大きい。
【0014】これら粒子間の力の計算を一般的に表現す
ると、下の(4)式で表すことができる。 Fi=ΣAijf(Bij|rij|2)rij (4) ここで、Fi、rijはベクトル、ΣはN個の粒子全体に
関する総和である。また、Aij、Bijは、たとえばファ
ン・デル・ワールス力などにおける粒子種に依存した係
数、クーロン力での電荷などを表す。
【0015】したがって、ハードウェア演算部による演
算は以下の手順で行うことができる。まず、対象となる
粒子iがハードウェア演算部のレジスタにセットされる
と、粒子相互作用する粒子jの座標がメモリから順次供
給される。これら粒子の座標rjと対象粒子の座標ri
の相対距離ベクトルrijから相対距離|rij|を求める。
相対距離は自乗されて関数評価器に送られる。関数評価
器はメモリから送られた係数AijとBijを使用してこれ
らの粒子間に働く2体力を求める。求められた2体力は
相対距離ベクトルrijと掛け合わされて、2つの粒子間
に働く力が得られる。これらの力を積算器で積算するこ
とにより注目している粒子に働く力の全てが求められ
る。
【0016】このように、ある粒子が他の全ての粒子か
ら受ける力はハードウェア的に加算して求め、複雑だが
計算量の比較的少ない粒子の動きの計算などは既製のワ
ークステーションなどのホストコンピュータで行う。ハ
ードウェア演算装置とホストコンピュータの間の通信量
はN個のオーダであり通信の負担が過大になることはな
い。
【0017】図6は、従来のハードウェア演算器の構成
例を示すブロック図である。ハードウェア演算器はバス
インターフェイスとメモリと演算チップとからなる。バ
スインターフェイスは外部バスを制御してホストコンピ
ュータとデータを交換する。メモリには粒子座標メモリ
と粒子種メモリと係数メモリと近接粒子リストメモリが
あり、アドレス発生部と係数メモリアドレス選択部を付
属する。演算チップは演算を実行するパイプライン演算
回路を備えている。
【0018】以下に、ハードウェア演算器の動作を説明
する。対象となる粒子iを決めると、アドレス発生部が
対象粒子iと相互作用する粒子jの番号を出力する。ア
ドレス発生部は相互作用する全ての粒子の番号をシーケ
ンシャルに出力する。出力された粒子番号は粒子座標メ
モリに供給され、指定された粒子の座標が読み出されて
演算チップに供給される。
【0019】また、係数メモリからは粒子番号に対応し
た係数のセットが出力されるが、例えば原子間に働く2
体力計算のように粒子種によって作用が異なる場合には
粒子種に基づく粒子種間接アドレッシングにより係数の
セットが選択される。間接アドレッシングモードでは、
まず粒子番号jに基づいて粒子種メモリから粒子種が読
み出され、対象粒子iの粒子種と対照することにより使
用すべき係数セットが選択されて演算チップに供給され
る。予め粒子種に対応した係数セットを記憶させておい
て利用する粒子種間接アドレッシングモードを準備する
のは計算対象の粒子を変更したときにメモリへのデータ
転送量を少なくして総合的な計算時間を短くするためで
ある。
【0020】演算チップは粒子座標と係数を取り込んで
パイプラインで力の計算を行い結果を内部のレジスタに
蓄積する。また、演算課程で算出される粒子間距離が所
定の値以下である場合はこれを近接粒子リストメモリに
記憶させる。近接粒子リストは、その後にファン・デル
・ワールス力など粒子間距離が大きくなるにしたがって
影響は急激に減少するような力の計算を行う場合に、所
定の範囲内にある近接粒子のみを抽出する近接粒子間接
アドレッシングに利用して、無駄のない計算を行うこと
ができる。
【0021】ハードウェア演算器は、ホストコンピュー
タから必要なパラメータや条件を入力し単純な高速演算
を大量に実行して結果をホストコンピュータに返す。ホ
ストコンピュータとは汎用のバスを介して結合するので
スーパーコンピュータやワークステーションなど任意の
形式のコンピュータを利用することができる。
【0022】しかし、近接粒子リストは、対象粒子iを
切り替えるたびに他の全ての粒子との相対距離を計算し
た上で所定の近傍範囲にあるか否かを判定区分して作成
しなければならない。粒子番号は通常、入力順に決めら
れており、座標にしたがって決められているわけではな
く、また力を受けて運動することにより粒子座標も変化
する。このため、力算出の演算において、粒子の近接粒
子を抽出するために行う演算の割合は無視できない程大
きい。
【0023】
【発明が解決しようとする課題】そこで、本発明が解決
しようとする課題は、並列パイプラインで多体問題を解
くハードウェア演算装置において、粒子座標演算を節減
して効率よく対象粒子の近傍に存在する粒子を選択し座
標を与えるアドレス装置を提供して、演算全体の速度を
向上させるところにある。
【0024】
【課題を解決するための手段】上記課題を解決するた
め、本発明の多体問題解析装置に用いるアドレス装置
は、粒子の座標を記憶する粒子座標メモリと、対象空間
を座標に基づいて複数のセルに分割し番号を付し各セル
に属する粒子の座標が記憶されている粒子座標メモリの
アドレスを記憶するインデックスメモリを備え、粒子座
標が入力されると粒子座標メモリに格納すると共に粒子
座標に基づいて各セルに割り振ってインデックスメモリ
中の該当するセルに対応する位置に粒子番号を記憶さ
せ、演算するときはセル同士の近接関係に基づいてセル
を指定し該当するセルに属する粒子の番号をインデック
スメモリを参照して粒子座標メモリに格納された粒子座
標を読み出して近接粒子座標として供給するようにした
ことを特徴とする。
【0025】なお、本発明のアドレス装置は、さらに演
算に使用する係数セットを記憶する係数メモリと、粒子
の種類を記憶するタイプメモリを備えてもよい。また、
3次元座標系における直方体空間を対象とするときは、
これを直方体セルに等分に分割して、座標値の小さい順
に通し番号を付すようにすることが好ましい。
【0026】インデックスメモリは、先頭リスト領域と
リンク作成領域からなり、先頭リスト領域には各セルに
対応してセルの数だけリストユニットが準備され、リン
ク作成領域には各セルに2個以上の粒子が属する場合に
粒子に対応してリストユニットが生成されるようにし
て、単方向に鎖状に連結されたリストを形成することが
好ましい。
【0027】ここで、リストユニットはセルインデック
スと粒子インデックスからなる。セルインデックスは帰
属するセルに関する情報を格納するもので、同じセルに
属する別のリストユニットが格納されたメモリのアドレ
スを表示する部分と、セルに属する最後のリストユニッ
トであるときに立てられる終了フラッグの部分を備え
る。また、およびセルインデックスが有効であることを
示す有効フラグの部分を備えてもよい。有効フラグを用
いると、パイプライン計算を行う場合に、空セルの遭遇
するとFIFOへの書き込みを抑制してダミーデータを
送り込むことにより、パイプライン計算を中断せずに続
行させることができる。一方、粒子インデックスは粒子
座標メモリにおいて指定された粒子の座標値が記憶され
ているアドレスを格納する。
【0028】なお、先頭リスト領域には初めに自身のア
ドレスを記録しておいて、粒子情報を入力するたびに先
頭リスト領域に記録されていたアドレスを入力した粒子
のリストユニットに記入した上で、その粒子のリストユ
ニットのアドレスで先頭リスト領域に記録するアドレス
を書き換えるように構成してもよい。すると、最後には
セルに属する最後に入力した粒子のリストユニットのア
ドレスが先頭リスト領域に格納されるようになる。この
ような構成では、先頭リスト領域に記録されたアドレス
を見て最後に入力された粒子を知るところから始まって
最初に入力された粒子まで順次遡り、最後には先頭リス
ト領域に戻るようにしてセル内の粒子全体をソートする
ことができるので、終了フラグを必要としない。また、
先頭リスト領域に記録されたアドレスが先頭リスト領域
のアドレスと同じときにはセルに属する粒子が存在しな
いことになるので、有効フラグを用いないでも簡単に空
セルであることが分かる。
【0029】なお、多体問題解析装置がパイプライン式
演算器により各対象粒子について順次に近接粒子との演
算を行い、最後に結果を統合することにより多体問題を
解くようにしたものである場合に、ホストコンピュータ
から対象とするセルを指定すると、本発明のアドレス装
置が指定されたセル毎に属する粒子を抽出して粒子座標
を読み出し、パイプライン演算器に対象粒子座標として
供給するようにすることもできる。このような構成によ
れば、同じセル内の粒子について同時にパイプライン演
算器で演算するため近接粒子が共通するので、パイプラ
イン演算器には同じ近接粒子座標データを供給すれば足
りる。
【0030】
【発明の実施の形態】以下、図面を参照して本発明の詳
細を実施例に基づいて説明する。図1は本発明の実施例
のアドレス装置を利用したハードウェア演算装置の構成
を示すブロック図である。本実施例のハードウェア演算
装置1はホストコンピュータ2の補助機器として使用さ
れる。ハードウェア演算装置1はバス部分10とメモリ
部分20と演算部分30からなる。
【0031】バス部分10はホストコンピュータ2とハ
ードウェア演算装置1のデータ交換を行う部分である。
両者間におけるデータ類の交換は外部バス11を介して
バスインターフェース12の制御の下で行われる。バス
インターフェース12は入力するデータ類をそれぞれの
装置に適合した形式に変換して出力する。ハードウェア
演算装置1内部の各回路と外部バス11とのデータ交換
は原則として内部バス14を介して行われ、内部バス制
御回路13が制御する。内部バス制御回路13は、バス
インターフェース12から粒子のアドレスやデータを入
力してメモリ制御回路21、FIFOスタック26、演
算回路31へ粒子のアドレスやデータを出力する。ま
た、入力したデータ類を適合した型に変換する。なお、
ホストコンピュータ2からハードウェア演算装置内への
アクセスも内部バス制御回路13を介して行う。
【0032】メモリ部分20が本発明に係るアドレッシ
ング機能を果たす主要部分で、粒子種メモリ22、イン
デックスメモリ23、粒子座標メモリ24、係数メモリ
25およびFIFOスタック26と、メモリ制御回路2
1が備えられている。メモリ制御回路21はこれらメモ
リの読み書きに関する動作を行う。力計算の準備として
の粒子データなどの書き込み、計算時に必要となるデー
タの読み出しなどメモリへのアクセスは全てメモリ制御
回路21を介して行われる。メモリ制御回路21は必要
なタイミング信号を生成する機能も備えている。
【0033】粒子種メモリ22は粒子の種類に関する情
報を格納するメモリで、実装上は粒子座標メモリ24の
空きを利用して装備することができる。インデックスメ
モリ23は粒子に対応してリストユニットを格納するメ
モリである。粒子座標メモリ24は粒子の座標値を順に
記憶している。係数メモリ25は演算の種類にしたがっ
て対応する係数を記録しているメモリである。
【0034】FIFOスタック26は、粒子座標メモリ
24や係数メモリ25と演算部分30とホストコンピュ
ータ2との間のデータパスである。FIFOスタック2
6は、先入れ先出し方式スタックメモリからなり、内部
バス制御回路13から受け取ったデータ類を受け取った
順に粒子座標メモリ24や係数メモリ25に書き込み、
またこれらメモリから受け取ったデータ類を受け取った
順に演算部分30に供給するときのタイミング調整を主
な機能とする。
【0035】演算部分30は、演算回路31と近接粒子
リストメモリ制御回路32と近接粒子リストメモリ33
を備えている。演算回路31は並列パイプライン方式に
より演算を実行するLSIチップからなり、1個のチッ
プが実行できるパイプライン数が例えば6列などと決ま
っているので、必要に応じてチップ数を選択して演算の
高速化を図ることができる。また、演算回路31のユニ
ットを並列に複数設けることにより使えるチップ数を増
やしてさらに演算高速化を図ることもできる。演算結果
は演算回路31中のレジスタに蓄積され、ホストコンピ
ュータ2の要求に応じて内部バス14を通り内部バス制
御回路13を介し外部バス11を通ってホストコンピュ
ータ2に供給される。
【0036】なお、全領域について演算をした後で近接
粒子演算する場合には、従来と同様、近接粒子リストを
作成して近接粒子リストメモリ33に格納して利用する
ことができる。近接粒子リストメモリ33は先入れ先出
し方式のスタックメモリで、演算の必要にしたがって演
算回路31から入力された順に近接粒子のインデックス
あるいは相対距離を出力する。近接粒子リストメモリ制
御回路32は近接リストメモリ33の読み書きを制御す
る。
【0037】次に、本発明の中心であるメモリ部分20
と内部バス制御回路13を中心にして、さらに詳しい回
路と動作を説明する。図2は、内部バス制御回路とメモ
リ部分におけるアドレッシングに関連する機能部分に関
するブロック図である。図は、内部バス制御回路13、
メモリ制御器21、インデックスメモリ23、粒子座標
メモリ24、係数メモリ25、FIFOスタック26お
よび演算回路31の間の情報の流れを表すものである。
【0038】図中、矢印形の素子は先入れ先出しスタッ
クメモリ(FIFO)であって情報は矢尻側から入力し
て矢先から出力される。また台形をした素子は状況によ
り情報の流れを切り替える機能を持つ切換器であり、底
辺側から上辺側に情報が流れる。なお、図中信号線の矢
印は情報の伝達方向を示し、矢印のない信号線は情報が
両方向に流れることを示すが、FIFOと切換器に接続
された信号線は1方向にしか信号を流さないことが明ら
かなので矢印を付していない。
【0039】内部バス制御回路13は外部バス11と内
部バス14の間に設置されるもので、データ型変換器1
11と結果メモリ112とアドレス生成制御器113と
アドレス変換器114を備えている。演算結果を読み出
すときや粒子の座標値等を自動的に供給するときは、ア
ドレス生成制御器113が、ホストコンピュータ2から
の要求により起動され演算回路31の演算結果が格納さ
れているレジスタのアドレスを連続的に自動生成して演
算回路31に送り出す。この時演算回路31への制御信
号も生成される。また、アドレス変換器114は、ホス
トコンピュータ2で生成したアドレスを使用する場合に
アドレスをデコードして実行できる制御信号やローカル
アドレスを生成して供給する回路である。
【0040】結果メモリ112は、演算回路31の計算
結果をホストコンピュータ2に受け渡すための回路であ
る。結果メモリ112は演算回路31から読み出された
データを受入れて設定に応じて加工した上で内部に備え
た先入れ先出しスタックメモリ(FIFO)に順次格納
する。ホストコンピュータ2は演算結果を結果メモリ1
12から読み出すことができる。また、粒子の座標値と
それに対応する係数セットを演算回路31に自動的に供
給するときには、上記アドレス生成制御器113から与
えられるアドレスにしたがってFIFOスタック26に
格納されていたデータが演算回路31に送り込まれる。
データ型変換器111は、ホストコンピュータ2から供
給されるデータを、例えば倍精度浮動小数から40bit
整数など、適当な型に変換してメモリ部分20と演算部
分30に供給する。
【0041】メモリ制御回路21は、セルインデックス
書き込みシーケンサ121、セルインデックス読み出し
シーケンサ122、粒子インデックス先入れ先出しスタ
ック123、座標値アドレス発生器124、および係数
アドレス発生器125を備えている。また、FIFOス
タック26は、粒子座標値を扱う座標値読み出しスタッ
ク131と座標値書き込みスタック132、および係数
を扱う係数読み出しスタック133と係数書き込みスタ
ック134の4個の先入れ先出し方式スタックメモリか
らなる。
【0042】メモリ制御回路21は、力演算に必要な粒
子の座標値や係数を蓄積しておいて、パイプライン演算
を実行する演算回路31に効率よく供給するものであ
る。ここでは、粒子座標値を効率よく供給するため、演
算の対象とする粒子が存在する領域を予め小さなセルに
分割し、粒子はこれらのセルに割り当てておく。対象と
する粒子と近接関係にある粒子は、対象粒子が属するセ
ルと近接関係にあるセルに属する粒子であるから、近接
セルを指定してその中に含まれる粒子の情報を取り出し
て演算に利用する。
【0043】なお、セルは座標値に基づいて一定の順に
番号付けされているので、セル同士の近接関係は簡単な
演算により容易に求めることができる。このように、粒
子同士の近接関係をセル同士の近接関係に置き換えるこ
とにより、始めに粒子座標をセルに割り当てておけば、
対象粒子毎に全ての粒子について近接関係を確認する必
要はなく、対象粒子自身が属するセルと近接関係にある
セルを指定してその中に含まれる粒子を抽出して使用す
ればよいので、演算負荷も演算時間も大幅に節減でき
る。
【0044】そこで、粒子の座標値等を供給するための
準備として、まず、図3のセル分割模式図に表すよう
に、演算の対象とする粒子が存在する直方体領域を直交
座標系におき、ΔX、ΔY、ΔZの稜長を有する小さな
直方体の区画に分けてセルとする。セルにはX、Y、Z
の順に座標が小さい方から番号が付けられる。ある粒子
座標Pi(Xi,Yi,Zi)が与えられたときに、その粒
子が属するセルの番号Nは、floor(Xi/ΔX)+floo
r(Yi/ΔY)×X方向のセル個数+floor(Zi/Δ
Z)×X方向のセル個数×Y方向のセル個数、により求
められる。ここで、floor(X)はXを超えない最大の
整数を意味する。
【0045】セルインデックス書き込みシーケンサ12
1は、データ型変換器111から転送されてくる粒子座
標値に基づいて指定する粒子が属するセルを決定し、座
標値アドレス発生器124が決める粒子座標の格納アド
レスと合わせてセルリストを生成してインデックスメモ
リ23に格納する。なお、粒子座標値は一旦FIFOス
タック26に蓄積され、メモリ制御回路21からの制御
信号を受けて粒子座標メモリ24内の対応する番地に格
納される。
【0046】セルリストは、セルに属する粒子の数によ
らず、かつ入力順に格納できるように特殊な構造を有す
る。図4は、1個のセルに対応するセルリストを概念的
に表した図面である。セルリストは予めセルの数だけ準
備され、粒子1個ずつに対して生成されるリストユニッ
トを指定のセルに属する粒子について単方向に鎖状に連
結したものである。リストユニットは、それぞれ粒子イ
ンデックスとセルインデックスからなる。
【0047】粒子インデックスは、指定された粒子の座
標値が収納されている粒子座標メモリ24内の位置のア
ドレスを指示するインデックスである。またセルインデ
ックスは、粒子が属するセルに関する情報を格納するイ
ンデックスで、同じセルに属する次のリストユニットが
格納されたインデックスメモリのアドレスを表示するポ
インタ部分とセルに属する最後の粒子のリストユニット
であるときに立てられる終了フラッグの部分を備える。
【0048】セルに対応するセルリストの先頭のリスト
ユニットには最後に書き込まれた粒子の粒子インデック
スのアドレスが書かれており、最後に書き込まれた粒子
のリストユニットにはその前に書き込まれた粒子の粒子
インデックスのアドレスが書き込まれているので、次々
に遡って辿っていくことによりそのセルの属する全ての
粒子の座標値を知ることができる。なお、先頭の次に書
き込まれた粒子のリストユニットに立てた終了フラッグ
により、セルに属する最後の粒子であることが分かるよ
うにしてある。
【0049】上記のようなセルリストの構成を用いると
きは、セルに属する粒子情報が入力されたときに、イン
デックスメモリ23の中の空いているアドレスにリスト
ユニットを生成する。次いで、リストユニットの粒子イ
ンデックスに粒子座標メモリ24の座標値を格納するア
ドレスを記入し、セルインデックスに先頭のリストユニ
ットに記録されていたアドレスを記入する。そして、先
頭リストユニットのセルインデックスに新たに生成され
たセルユニットのアドレスを記入することにより、セル
リストが完成する。
【0050】この方法は、新しい粒子を追加する場合に
も、新しく生成されるリストユニットと先頭リストユニ
ットのみ手を加えれば済み、その他の既存のリストユニ
ットをいじる必要がない点が優れている。なお、セルイ
ンデックスにはそのセルインデックスが有効であるとき
に立てる有効フラグの部分が備えられている。有効フラ
グはセルリストを生成したときに立てるもので、インデ
ックスメモリ23が初期化されて0になった状態とアド
レス値が0の状態を区別するために使用される。
【0051】図5はインデックスメモリ23内における
セルリストの配置状態を示す図面である。セルリストは
セルの数だけ作られるが、先頭のリストユニットは全て
のセルの分が予め先頭リスト領域に確保されていて、1
個のセル内で2番目以下の粒子に関するリストユニット
は、先頭リスト領域以降にあるリンク作成領域に生成さ
れる。
【0052】本方式によると、リストの先頭インデック
スの格納場所が最初から一定の位置に決められているの
で、対象セルの番号と先頭インデックスのアドレスが1
体1に対応付けられ、探索を始めるときの処理が簡単に
なる利点がある。また、粒子はセルリスト内のセルイン
デックスによりリンクされているため、リンク作成領域
におけるセルリストの位置は全く自由であり、粒子座標
値の入力順に詰めていってメモリを効率的に利用するこ
とができる。
【0053】あるセルが指定されると、そのセルに対応
するセルリストの先頭のリストユニットの粒子インデッ
クスを参照して粒子座標メモリ24から粒子座標を読み
取ることができる。次にそのリストユニットのセルイン
デックスを参照すると、そこには最後に書き込まれた粒
子の粒子インデックスのアドレスが書かれているので、
これに基づいて座標値を得ることができる。また、最後
に書き込まれた粒子のリストユニットにはその前に書き
込まれた粒子の粒子インデックスのアドレスが書き込ま
れている。こうして次々に粒子インデックスから座標値
を得ながら芋づる式に遡っていって、先頭の次に書き込
まれた粒子のリストユニットに至ると、そのセルインデ
ックスに終了フラッグが立っているので最後の粒子であ
ることが分かる。
【0054】なお、最初からセルリストの先頭となるリ
ストユニットの場所が確保されているため、粒子が1個
も存在しないセルについてはからの先頭リストが存在す
ることになる。このようなセルを空セルと呼び、これに
当たったときは次のセルに探索対象を写す。パイプライ
ン演算時には演算中にデータ入力を途切れさせることは
できないので、空セルから読み出したダミーのアドレス
から得られたデータはFIFOスタック26で計算上影
響のないダミーデータに置き換えて演算回路31に送る
ようにする。
【0055】セルリスト構成の別法として、先頭リスト
領域に格納される先頭セルユニットだけを別の形式とし
て、セルインデックスに最後に入力されたリストユニッ
トのアドレスを入れることは同じであるが、粒子インデ
ックスを備えず、最初に入力した粒子から全てリンク作
成領域に格納するようにしてもよい。この場合は、粒子
情報を入力するたびにリストユニットを生成し、そのセ
ルインデックスに先頭リストユニットのセルインデック
スに格納されていたアドレスを転写して、先頭リストユ
ニットには新しく生成されたリストユニットのアドレス
を記入する。
【0056】この別法のように構成されたものでは、粒
子情報がセルにとって最初のものから最後のものまで全
く同じ操作でセルリストを生成することができる。ま
た、あるセルが指定されると先頭インデックスを参照し
てそのセルの最後に入力された粒子から遡りながら座標
値を取得していき最後に最初に入力した粒子に行き着く
と先頭セルリストのアドレスを示すので、セルインデッ
クスに終了フラグを準備しておかなくても最後の粒子で
あることが分かる。また、セルに1個の粒子も属しない
場合には、先頭セルリストを参照したときに他のアドレ
スが記録されていないことから直ちに判定することがで
きる。
【0057】次に、図2を用いて具体的な粒子座標値の
書き込み操作を説明する。ホストコンピュータ2が64
bit倍精度浮動小数点で表された粒子座標を書き込む
と、データ型変換器111がこの情報を40bitの整数
に変換してメモリ制御回路21とFIFOスタック26
に送る。FIFOスタック26は、受け取った粒子座標
データを座標値読み出しスタック131に蓄積する。
【0058】一方、メモリ制御回路21は、粒子座標デ
ータを受け取ると、まず座標値アドレス発生器124内
のレジスタに記憶された粒子座標メモリ24のアドレス
をインクリメントし書き込みアドレスを生成する。書き
込みタイミング信号と書き込みアドレスを粒子座標メモ
リ24に送ると共に、FIFOスタック26に出力指令
を送ると、座標値読み出しスタック131からデータが
粒子座標メモリ24に出力されて格納される。
【0059】また、セルインデックス書き込みシーケン
サ121は受け取った粒子座標データからその粒子が属
するセルを算定して、所属セルに対応するセルリストを
呼び出し、インデックスメモリ23内に新たなリストユ
ニットを生成する。リストユニットには座標値アドレス
発生器124で生成した粒子座標メモリ24への書き込
みアドレスと先頭リストユニットに記憶されている前回
入力された粒子のリストユニットのアドレスを記入す
る。また先頭リストユニットのセルインデックスには新
しく発生させたリストユニットのアドレスを書き込む。
【0060】こうして、全ての粒子についてリストユニ
ットを生成すると、対象空間全体についてのセルリスト
が完成する。なお、係数データは通常、係数アドレス発
生器125が係数データが入ってくるタイミングを見て
インクリメントする係数メモリ25のアドレスに基づい
て、内部バス制御回路13から直接に係数メモリ25に
入力されるが、バースト時は一旦係数書き込みスタック
134に蓄積された後に速度差を吸収しながら入力され
た順に格納される。
【0061】次に、セルインデックス読み出し操作につ
いて説明する。セルインデックス読み出し操作は、イン
デックスメモリ23内に構築されたセルリストをたどっ
て、セル内の粒子インデックスを出力する操作である。
セルインデックス読み出しシーケンサ122は、ホスト
コンピュータ2により探索の対象となる領域を設定され
てから起動する。探索対象となるセルが与えられると、
該当するセルリストの先頭アドレスを計算し、インデッ
クスメモリ23に出力して、粒子インデックスとセルイ
ンデックスを読み取る。
【0062】粒子インデックスは座標値アドレス発生器
124で粒子座標メモリ24のアドレスに変換され、こ
れに対応する粒子座標データが粒子座標メモリ24から
FIFOスタック26の座標値読み出しスタック131
に送出される。また、係数アドレス発生器125は、粒
子座標メモリ24のアドレスを対応する係数メモリ25
のアドレスに変換し、これに基づいて係数データを読み
出してFIFOスタック26の係数読み出しスタック1
33に送出される。
【0063】セルインデックスは、セルインデックス読
み出しシーケンサ122内で次のリストユニットを読み
出すアドレスに変換され、インデックスメモリ23に送
られて、次のリストユニットが読み出される。このよう
な工程を繰り返すことにより、指定のセル内に存在する
全ての粒子が検索される。セルインデックスを読み出し
た結果、無効インデックスであったり終了フラッグが立
っていた場合は、次の探索対象セルを算出してセルリス
トを指定し同じように先頭リストユニットから検索を行
う。検索対象とする全てのセルについてセルリストを探
索し終えると、セルインデックス読み出し操作は終了す
る。
【0064】セルインデックス読み出し操作によりパイ
プライン演算を行うときは、インデックスメモリ23に
送られた粒子座標データと係数データは、送られてきた
順に演算回路31に送られて利用される。セルインデッ
クス読み出し操作は終了するまでに、探索対象となるセ
ル中に存在する全ての粒子の情報が演算回路31に送り
込まれて、演算を完成することができる。
【0065】なお、対象粒子について適宜の順にパイプ
ライン演算を行うようにすると同時に実行される演算に
用いられる粒子座標データが対象粒子毎に異なることに
なる。そこで、パイプライン演算器で同時に演算する対
象粒子を同じセルから選択するようにして演算の効率を
高めることができる。このため用いられるのが自動座標
書き込み操作である。
【0066】通常のパイプライン演算による方法では、
対象粒子の粒子座標データが演算回路31の演算パイプ
ラインに適宜に送られ、各パイプラインで演算される粒
子毎にこれと関係を有するセルが指定されて、そのセル
内に存在する他の粒子との関係が算出される。これに対
し、自動座標書き込み操作を用いれば、ホストコンピュ
ータ2が計算対象となるセルを順次指定し、指定された
特定のセルに属する粒子の粒子座標を自動的に抽出して
演算回路31のレジスタに転送してパイプライン演算す
ることになり、パイプライン演算器で同時に演算される
対象粒子が同じセルに属するので、演算する関係粒子が
共通し、粒子座標データ等の準備や取り込みが簡単にな
る。
【0067】以下、自動座標書き込み操作の流れについ
て説明する。ホストコンピュータ2によりセルインデッ
クス読み出しシーケンサ122が起動される。この時、
探索するセルが指示される。セルインデックス読み出し
シーケンサ122は、指定されたセルについてセルリス
トを探索してセルに属する粒子の粒子インデックスを座
標値アドレス発生器124に順次出力する。座標値アド
レス発生器124は粒子インデックスを対応する粒子座
標メモリ24のアドレスに変換し、対象となる粒子の座
標データを読み出してFIFOスタック26の座標値読
み出しスタック131へ順次送出する。
【0068】座標値読み出しスタック131に蓄積され
た粒子座標データは演算の前に予め演算回路31のレジ
スタに転送される。転送先となるレジスタのアドレスは
内部バス制御回路13内のアドレス生成制御器113に
より生成される。パイプライン演算器では同じセル内の
対象粒子に関して演算するため、演算対象粒子に影響を
及ぼす粒子は共通するので、パイプライン演算器には同
じ粒子座標データを供給すればよく、演算の効率が向上
する。
【0069】パイプライン演算実行時には対象粒子の数
は事実上無制限であるが、自動座標書き込み操作では抽
出した粒子数が例えば24個など演算回路31内のレジ
スタ数に達したとき、または探索対象になっているセル
内の粒子が尽きたときに操作を終了する。なお、対象と
するセルが残っているときには余ったレジスタで演算さ
せるため次の対象セルから抽出した粒子を追加すること
ができる。転送された粒子インデックスはメモリ制御回
路21の粒子インデックス先入れ先出しスタック123
に記録され、自動座標書き込み操作が終了した後でどの
粒子が演算されたかを知ることができる。なお、セルリ
スト探索時に空セルを読み出したときには、FIFOス
タック26で空セルの粒子座標データが破棄されると共
に、空セルにあったダミー粒子は探索した粒子として数
えないようにする処理が行われる。
【0070】本実施例のアドレス装置を適用した演算装
置では、近接粒子間の作用力を計算する場合に、対象粒
子が属するセルに対して所定の距離以内にあるセルを算
定し、これに従って指定したセルのみについて内に属す
る粒子の情報を読み出して、先入れ先出しスタックを介
して演算回路に供給することにより、効率よく高速な演
算が可能となる。セルは同形の直方体であって直方体に
堆積されX,Y,Z座標の順に番号付けられているか
ら、所定の距離関係を有するセルはセル番号を利用して
容易に求められる。なお、セルを適当に微細化して近接
領域に含まれるセルの集合が球に近いようにすると、セ
ル数が増えてアドレス装置における負担は増加するが、
演算回路における計算量をより少なくすることができ
る。
【0071】
【発明の効果】以上説明した通り、ハードウェア演算装
置に本発明のアドレス装置を用いれば、並列パイプライ
ンで近接粒子同士の作用力に関する多体問題を解く場合
に、所定の距離内にあるセルを指定しその中に配分され
ている粒子を近接粒子として使用することができるの
で、粒子それぞれについて距離を確認するのと比較し
て、極めて効率よく近傍粒子の座標を与えて高速演算を
実行することができるようになる。
【図面の簡単な説明】
【図1】本発明の実施例のアドレス装置を利用したハー
ドウェア演算装置の構成を示すブロック図である。
【図2】本実施例のアドレッシングに関連する機能部分
に関するブロック図である。
【図3】本実施例におけるセル分割方法の模式図であ
る。
【図4】本実施例におけるセルリストの概念図である。
【図5】本実施例におけるセルリストの配置図である。
【図6】従来のハードウェア演算器の構成例を示すブロ
ック図である。
【符号の説明】
1 ハードウェア演算装置 2 ホストコンピュータ 10 バス部分 11 外部バス 12 バスインターフェース 13 内部バス制御回路 14 内部バス 20 メモリ部分 21 メモリ制御回路 22 粒子種メモリ 23 インデックスメモリ 24 粒子座標メモリ 25 係数メモリ 26 FIFOスタック 30 演算部分 31 演算回路 32 近接粒子リストメモリ制御回路 33 近接粒子リストメモリ 111 データ型変換器 112 結果メモリ 113 アドレス生成制御器 114 アドレス変換器 121 セルインデックス書き込みシーケンサ 122 セルインデックス読み出しシーケンサ 123 粒子インデックス先入れ先出しスタック 124 座標値アドレス発生器 125 係数アドレス発生器 131 座標値読み出しスタック 132 座標値書き込みスタック 133 係数読み出しスタック 134 係数書き込みスタック
───────────────────────────────────────────────────── フロントページの続き (72)発明者 曽根田 直樹 東京都狛江市岩戸北2丁目11番1号 財団 法人電力中央研究所内 Fターム(参考) 5B045 AA07 GG17 KK04 5B049 EE03 EE04 EE05 EE41 FF07 GG04 GG07 5B056 AA04 BB51 FF16

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 粒子の座標を記憶する粒子座標メモリ
    と、対象空間を座標に基づいて複数に分割して形成した
    各セルに属する粒子の座標が記憶されている粒子座標メ
    モリのアドレスを記憶するインデックスメモリを備え、
    粒子座標が入力されると前記粒子座標メモリに格納する
    と共に該粒子座標に基づいて各セルに割り振って前記イ
    ンデックスメモリ中の該当するセルに対応する位置に該
    粒子座標を記憶した前記粒子座標メモリのアドレスを記
    憶させ、演算するときはセル同士の近接関係に基づいて
    セルを指定し該セルに属する粒子について前記インデッ
    クスメモリに記録されたアドレスを参照して粒子座標メ
    モリに格納された粒子座標を読み出して近接粒子座標と
    して供給するようにしたことを特徴とする多体問題解析
    装置に用いるアドレス装置。
  2. 【請求項2】 さらに演算に使用する係数セットを記憶
    する係数メモリと、粒子の種類を記憶するタイプメモリ
    を備えて、対象とする粒子により係数を選択できるよう
    にしたことを特徴とする請求項1記載の多体問題解析装
    置に用いるアドレス装置。
  3. 【請求項3】 3次元座標系における直方体空間を対象
    として、直方体セルに等分に分割して、座標値の小さい
    順に番号を付すことを特徴とする請求項1または2に記
    載のアドレス装置。
  4. 【請求項4】 前記インデックスメモリは、先頭リスト
    領域とリンク作成領域からなり、該先頭リスト領域には
    各セルに対応してセルの数だけリストユニットが準備さ
    れ、前記リンク作成領域には各セルに2個以上の粒子が
    属する場合に粒子に対応してリストユニットが生成され
    るようにして、単方向に鎖状に連結されたリストを形成
    して、セルの基づく検索を先頭リスト領域から始めるこ
    とを特徴とする請求項1から3のいずれかに記載のアド
    レス装置。
  5. 【請求項5】 前記リストユニットはセルインデックス
    と粒子インデックスからなり、該セルインデックスは帰
    属するセルに関する情報を格納するもので同じセルに属
    する別のリストユニットが格納された前記インデックス
    メモリのアドレスを表示する部分とセルに属する最後の
    粒子のリストユニットであるときに立てられる終了フラ
    ッグの部分を備え、前記粒子インデックスは粒子座標メ
    モリにおいて指定された粒子の座標値が記憶されている
    アドレスを格納することを特徴とする請求項4記載のア
    ドレス装置。
  6. 【請求項6】 前記セルインデックスはさらにセルイン
    デックスが有効であることを示す有効フラグの部分を備
    えて、有効フラグが立っていないときは所定のダミーデ
    ータを供給することを特徴とする請求項5記載のアドレ
    ス装置。
  7. 【請求項7】 前記多体問題解析装置がパイプライン式
    演算器により各対象粒子について順次に前記近接粒子と
    の演算を行って多体問題を解くようにしたものであっ
    て、前記アドレス装置がさらにセルが指定されると該指
    定されたセル毎に属する粒子を抽出し、前記インデック
    スメモリに記録されたアドレスを参照して粒子座標メモ
    リに格納された粒子座標を読み出して前記対象粒子の粒
    子座標として供給することを特徴とする請求項1から6
    のいずれかに記載の多体問題解析装置。
JP2000045606A 2000-02-23 2000-02-23 多体問題解析装置に用いるアドレス装置 Pending JP2001236342A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000045606A JP2001236342A (ja) 2000-02-23 2000-02-23 多体問題解析装置に用いるアドレス装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000045606A JP2001236342A (ja) 2000-02-23 2000-02-23 多体問題解析装置に用いるアドレス装置

Publications (1)

Publication Number Publication Date
JP2001236342A true JP2001236342A (ja) 2001-08-31

Family

ID=18568159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000045606A Pending JP2001236342A (ja) 2000-02-23 2000-02-23 多体問題解析装置に用いるアドレス装置

Country Status (1)

Country Link
JP (1) JP2001236342A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236256A (ja) * 2005-02-28 2006-09-07 Institute Of Physical & Chemical Research 数値計算処理装置
JP2009069930A (ja) * 2007-09-11 2009-04-02 Prometech Software Inc 粒子法シミュレーションのためのスライスデータ構造、およびスライスデータ構造を利用した粒子法シミュレーションのgpuへの実装方法
JP2009199511A (ja) * 2008-02-25 2009-09-03 Nec Corp 多体問題用計算装置、及び、多体問題用計算方法
US7653498B2 (en) 2005-10-31 2010-01-26 Nec Corporation Apparatus for and method of calculating many-body problem
JP2020064560A (ja) * 2018-10-19 2020-04-23 国立研究開発法人理化学研究所 処理装置、処理システム、処理方法、プログラム、及び、記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236256A (ja) * 2005-02-28 2006-09-07 Institute Of Physical & Chemical Research 数値計算処理装置
WO2006093121A1 (ja) * 2005-02-28 2006-09-08 Riken 数値計算処理装置
JP4740610B2 (ja) * 2005-02-28 2011-08-03 独立行政法人理化学研究所 数値計算処理装置
US7653498B2 (en) 2005-10-31 2010-01-26 Nec Corporation Apparatus for and method of calculating many-body problem
JP2009069930A (ja) * 2007-09-11 2009-04-02 Prometech Software Inc 粒子法シミュレーションのためのスライスデータ構造、およびスライスデータ構造を利用した粒子法シミュレーションのgpuへの実装方法
JP2009199511A (ja) * 2008-02-25 2009-09-03 Nec Corp 多体問題用計算装置、及び、多体問題用計算方法
JP2020064560A (ja) * 2018-10-19 2020-04-23 国立研究開発法人理化学研究所 処理装置、処理システム、処理方法、プログラム、及び、記録媒体
JP7133843B2 (ja) 2018-10-19 2022-09-09 国立研究開発法人理化学研究所 処理装置、処理システム、処理方法、プログラム、及び、記録媒体

Similar Documents

Publication Publication Date Title
KR0169161B1 (ko) 정보처리 시스템과 정보처리 시스템에서의 계산방법
Pohl et al. Performance evaluation of parallel large-scale lattice Boltzmann applications on three supercomputing architectures
KR101467932B1 (ko) 상호접속부에서 멀티-쓰레드 오더링된 큐들에 대한 공유 저장기
JP4316574B2 (ja) グラフィック処理を用いた粒子操作方法及び装置
Kumar et al. A framework for hardware/software codesign
DE102012213643A1 (de) Multitthread-Physik-Engine mit Impulsweiterleitung
CN103309786A (zh) 用于在非可抢占式图形处理单元上交互调试的方法和装置
CN114490011B (zh) N体模拟在异构架构的并行加速实现方法
CN110096838A (zh) 一种基于n-s方程的直升机流场数值并行隐式求解方法
US11934825B2 (en) Event-driven design simulation
US20190384598A1 (en) Event-driven design simulation
JPH11502958A (ja) 物理プロセスシミュレーションの衝突演算
CN101526915A (zh) 并行模拟中支持踪迹文件并行输入输出的方法
TWI782403B (zh) 具有平行載入儲存之共享高速暫存記憶體
CN114341805A (zh) 纯函数语言神经网络加速器系统及结构
JP2001236342A (ja) 多体問題解析装置に用いるアドレス装置
CN112149269A (zh) 优化设备、优化设备的控制方法和记录介质
US10210136B2 (en) Parallel computer and FFT operation method
Mel’čuk et al. Molecular dynamics simulation of liquids on the connection machine
Prugger et al. Evaluation of the partitioned global address space (PGAS) model for an inviscid Euler solver
Boutros et al. A Whole New World: How to Architect Beyond-FPGA Reconfigurable Acceleration Devices?
CN116107640B (zh) 针对dsmc算法缓存以及simd向量化的系统性优化系统
US20240037063A1 (en) Routing Method Based On A Sorted Operation Unit Graph For An Iterative Placement And Routing On A Reconfigurable Processor
Fobel et al. GPU-accelerated wire-length estimation for FPGA placement
Donath et al. Optimizing performance of the lattice Boltzmann method for complex structures on cache-based architectures

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060404