JPH0950428A - 分子軌道解析用計算システム - Google Patents

分子軌道解析用計算システム

Info

Publication number
JPH0950428A
JPH0950428A JP20423495A JP20423495A JPH0950428A JP H0950428 A JPH0950428 A JP H0950428A JP 20423495 A JP20423495 A JP 20423495A JP 20423495 A JP20423495 A JP 20423495A JP H0950428 A JPH0950428 A JP H0950428A
Authority
JP
Japan
Prior art keywords
computer
molecular orbital
calculation
vector
electron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20423495A
Other languages
English (en)
Inventor
Takuya Maruizumi
琢也 丸泉
Jiro Ushio
二郎 牛尾
Yoshiaki Takemura
佳昭 竹村
Shiyurutei Yurugen
ユルゲン・シュルティ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP20423495A priority Critical patent/JPH0950428A/ja
Publication of JPH0950428A publication Critical patent/JPH0950428A/ja
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、化学工業や製薬工業で扱わ
れる分子に対して、現実的な時間と計算機資源によるア
ブイニシオ分子軌道計算を実行可能とし、これら材料の
材料物性予測や薬理作用予測を可能とすることである。 【構成】 複数の相互接続された計算機よりなる計算機
クラスタ1により所与の材料に対する1電子積分、2電
子積分、ならびに該1電子積分、該2電子積分より構成
されるフォック行列因子を生成し、計算機クラスタ、ベ
クトル計算機接続用伝送線31を介して該電子積分デ−
タ並びにフォック行列因子をベクトル計算機2に伝送、
該ベクトル計算機上で該フォック行列の固有値、固有ベ
クトルを求解、所与材料の分子軌道エネルギと波動関数
を出力するよう構成する。 【効果】 アブイニシオ分子軌道計算の計算時間短縮が
可能となり、化学工業や製薬工業で扱われる分子に対し
て、材料物性予測や薬理作用予測が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、化学工業、製薬工業に
おいて材料物性予測、薬理作用予測などに頻繁に利用さ
れる分子軌道解析を処理、実行する分子軌道解析用計算
システムに係わり、特に所与材料の1電子積分、2電子
積分、ならびにフォック行列因子の生成を複数の計算機
からなる計算機クラスタにより分散的に実行し、生成デ
−タをパイプライン機能を有するベクトル計算機に転
送、ベクトル計算機上でフォック行列の固有値と固有ベ
クトルを求解し、所与材料の分子軌道エネルギと波動関
数を高速に解法できる分子軌道解析用計算システムに関
する。
【0002】
【従来の技術】材料物性予測に利用される分子軌道解析
では一般的に図1に示される計算処理フロ−で分子軌道
と付随する物性値が計算される。これらの具体的な計算
方法は例えば、アブイニシオモレキュラ−オ−ビタルセ
オリ(HEHRE et al , AB INITIO MOLECULAR ORBITAL TH
EORY; Wiley-Interscience、1986年発行)を始めとする
量子化学教科書に詳しく説明されているが、本発明に関
連する部分について簡単に説明する。分子軌道計算は先
ず、分子形状、具体的には分子内の原子種と原子座標の
入力で始まる。これに応じて分子全体の波動関数|Y>は
各原子軌道|Xj>の線形和として(1)式の通り展開され
る。これは図1で’基底関数指定’と記したステップに
相当する。
【0003】 |Y>= ΣCj |Xj> (1) この展開係数 Cjを自己無憧着的に求める手順がアブイ
ニシオ分子軌道計算の本質である。
【0004】この際必要となる処理は、図1に示した流
れ図の通り、電子積分計算ステップ、初期ベクトル計算
ステップ、SCF方程式計算ステップよりなる。最後の
ステップで化学結合、電荷分布をはじめとする物性値を
計算し分子軌道計算は終了する。 従来の分子軌道計算
では図1に示した一連のステップを単一計算機上で処理
するのが通例である。電子積分計算ステップとして1電
子積分計算、2電子積分計算の双方が計算され、高速メ
モリに記録、保存される。先ず、1電子積分は(2)、
(3)式で示されるコア積分Huvと重なり積分Suvの2種
である。
【0005】 Huv = <Xu | Hcore | Xv > (2) Suv = <Xu | Xv> (3) ただし Hcoreは電子が他電子の影響を全く受けずに分子
内を運動するときのハミルトニアンを示す。またブラケ
ット表示<| > は量子力学計算で通常利用されるもの
と同様である。
【0006】次に2電子積分は(4) 式で示される2
電子反発積分(uv|ds)である。
【0007】 (uv|ds)=<Xu(1)Xd(2)| 1/ R12 | Xv(1)Xs(2)> (4) ただしR12は電子1と電子2との距離を示す。
【0008】(2)、(3)式で示した1電子積分の個
数は原子軌道総数の自乗個程度であるのに反し、(4)
式の2電子反発積分の個数は原子軌道総数の4乗に比例
して増加する。たとえば原子軌道総数を61に設定した
SiH2C2H4分子では2電子積分の個数は1,800,000程度と
なり、倍精度積分計算で結果を高速メモリに保存するに
は15MB程度の容量が必要となる。また積分計算に必要
となるCPU時間は一般的なメインフレ−ム計算機、た
とえば日立M880計算機を利用するとき、10秒程度
のCPU時間が必要となる。一般に化学工業、製薬工業
において扱われる分子はSiH2C2H4の様に簡単な分子では
なく、この数倍から数十倍の大きさを持つ。たとえば1
0倍とすれば、150GBもの大容量が必要となり、半導
体メモリでは勿論のこと、磁気デイスクメモリを利用し
て保存することも不可能となる。また積分計算に必要と
なるCPU時間もまた原子軌道総数の4乗に比例して増
加するため、約30時間ものCPU時間が必要となり、
積分計算値の入出力に要するI/O時間まで考慮すると
この10倍以上もの処理時間がかかり、単一の分子軌道
計算で10日間もの時間を要することとなる。以上の説
明から容易に理解される通り、単一計算機を用い、積分
計算値を高速メモリ上に保存、演算する従来の分子軌道
計算では化学工業、製薬工業で日常用いられる分子の分
子軌道解析が不可能となると言う問題があった。
【0009】さて、実際の分子軌道解析では電子積分計
算のあと、引き続きSCF(Self Consistent Field)方程式
を解き、(1)式で示した展開係数Cj を求め分子軌道
を決定する計算処理が必要である。このステップは以下
の通り行われる。
【0010】まず、電子積分計算のステップで計算、保
存されている1電子積分、2電子積分の値を用い(5)
式でしめされるフォック行列要素Fuvを計算する。
【0011】 Fuv = Huv + ΣΣPds [ (uv|ds) - 0.25(ud|vs) - 0.25(us|vd) ] (5) ただし、Pdsは原子軌道総数の次元をもつ正方行列Pの
要素を示し、各原子軌道の密度に対応することからPは
密度行列と呼ばれる。具体的には(6)式の通り与えら
れる。
【0012】 Pds = 2 ΣCdi * Csi i=1,2,---, N (6) ただし、総和は占有分子軌道Nまでの総和をとる。
【0013】計算の初期では分子軌道、即ちCdi 等が
定まっていないため、Pds を(6)式で計算することは
できず、適当な初期値を仮定して(5)式によりフォッ
ク行列を求めることとなる。初期値としてはヒュッケル
分子軌道などの展開係数がよく用いられる。図1で初期
ベクトル計算と示したステップがこれに相当する。
【0014】次にこのフォック行列Fと先に求めた重な
り積分Sよりなる行列方程式(7)を解く。
【0015】 Σv(Fuv −eiSuv)Cvi=0 u=1,2,3,-----N (7) これより分子軌道|Yi>の軌道エネルギと展開係数の
候補としてeiとCviが得られる。
【0016】この展開係数を用い再度(6)、(7)式
により密度行列、ならびに軌道エネルギを繰り返し計算
し変化がある規定値より小さくなった時点で収束したと
みなし計算を終了する。
【0017】このステップが図1でSCF方程式計算と
示したステップに相当する。
【0018】軌道エネルギeiに対応する分子軌道|Yi
>は(8)式の通りとなり、この分子軌道を用いて材料
の結合性、電荷分布、そのほかの材料物性を求めて分子
軌道計算は完了する。
【0019】このステップが |Yi>=Σ|Xj>Cji (8) 以上、述べたフォック行列より分子軌道を求めるステッ
プでは(7)式で書かれる線形方程式を密度行列が収束
するまで多数回繰り返し解く必要がある。通常の分子軌
道計算では数十回から数百回この計算を繰り返さなけれ
ば密度行列は収束しない。線形方程式を解く時間は原子
軌道総数の3乗に凡そ比例して増加するため、化学工業
や製薬工業で扱われる分子に対しては先に述べた電子積
分計算時間の増加に加え、さらに線形方程式解法に要す
る時間も増加すると言う問題がある。
【0020】
【発明が解決しようとする課題】以上述べたように、化
学工業や製薬工業で扱われる分子に対して、アブイニシ
オ分子軌道計算を実行するには、現在一般的に利用され
ているメインフレ−ムと呼ばれる大型計算機をもってし
ても記憶容量、計算時間の点から過大な負荷となり、こ
れらの材料物性予測、薬理作用予測が容易には出来ない
と言う課題があった。
【0021】本発明の目的は化学工業や製薬工業で扱わ
れる分子に対して、現実的な時間と計算機資源によりア
ブイニシオ分子軌道計算を実行し、これら材料の材料物
性予測や薬理作用予測を可能とする分子軌道解析用計算
システムを提供することにある。
【0022】
【課題を解決するための手段】上記目的は、所与の材料
に対する1電子積分、2電子積分、ならびに該1電子積
分、該2電子積分より構成されるフォック行列因子の生
成機能を有する相互に接続された複数の計算機からなる
計算機クラスタ、該計算機クラスタが生成する該1電子
積分の一部、ならびにフォック行列因子をパイプライン
処理機能を有するベクトル計算機に伝送する通信手段、
該通信手段を介し伝送された該1電子積分の一部、なら
びにフォック行列因子よりフォック行列を生成し、該フ
ォック行列の固有値と固有ベクトルを求解、所与材料の
分子軌道エネルギと波動関数を出力するベクトル計算機
から構成される分子軌道解析用計算システムを用いるこ
とにより達成される。
【0023】また、上記目的は、計算機クラスタ生成デ
−タをベクトル計算機に伝送する通信手段が、該ベクト
ル計算機の主記憶装置に直結する入出力チャネル装置で
あるよう構成することにより、より効果的に達成され
る。
【0024】また、上記目的は、該計算機クラスタをパ
−ソナルコンピュ−タとワ−クステ−ションの任意の組
み合わせで構成することによりより効果的に達成され
る。
【0025】
【作用】本発明によれば、分子軌道計算の際、必要とな
る所与の材料に対する1電子積分、2電子積分、ならび
に該1電子積分、該2電子積分より構成されるフォック
行列因子の生成を相互に接続された複数の計算機からな
る計算機クラスタにより分散実行させ、生成電子積分、
ならびにフォック行列要素をベクトル計算機に転送、フ
ォック行列の固有値と固有ベクトルの求解に必要となる
線形計算をベクトル計算機上で実行することにより化学
工業や製薬工業で扱われる分子に対して、現実的な時間
と計算機資源によるアブイニシオ分子軌道計算実行を可
能とし、ひいてはこれら材料の材料物性予測や薬理作用
予測が可能となる。
【0026】
【実施例】以下、本発明の実施例について図面を用いて
説明する。
【0027】図2は本発明による分子軌道解析用計算シ
ステムの一実施例の全体構成図である。
【0028】計算機11、12、13、14、15、1
6より構成される計算機クラスタ1が計算機クラスタ、
ベクトル計算機接続用伝送線31を介してベクトル計算
機2に接続される構成となっている。計算機クラスタ1
は6台の計算機11、12、13、14、15、16に
より構成され、相互に計算機クラスタ内接続線30によ
り相互接続されている。本実施例では、計算機11、1
2、13、14、15、16に486DXプロセッサを
クロック周波数100MHzで動作させたパ−ソナルコ
ンピュ−タを用いた。パ−ソナルコンピュ−タのOSに
はUNIXを設定した。またベクトル計算機2には日立
S810モデル20を用いた。同計算機は143MFL
OPSのパイプライン演算機を4並列したベクトル計算
機である。 次に計算機クラスタ内接続線30並びにベ
クトル計算機接続用伝送線31には現在LAN用通信線
とし頻繁に利用されているイ−サネットを利用し通信プ
ロトコルとしてTCP/IPを用いパ−ソナルコンピュ
−タ間、並びに計算機クラスタ、ベクトル計算機間のデ
−タ通信を行った。本実施例では6台の計算機により計
算機クラスタ1を構成したが、計算機間の通信にパケッ
ト衝突などの問題が発生しない限り、特に台数に関する
制約は無い。
【0029】さて、次に本実施例による具体的な分子軌
道計算について述べる。
【0030】分子軌道計算にはGAMESS、Gaus
sianを初めとす流通ソフトウエアを利用する(これ
らの詳細は例えば、アブイニシオモレキュラ−オ−ビタ
ルセオリ(HEHRE et al , AB INITIO MOLECULAR ORBITA
L THEORY; Wiley-Interscience、1986年発行)などの量
子化学の教科書で解説されている)。計算機クラスタ1
を構成する各計算機、並びにベクトル計算機2にはあら
かじめこれらプログラムを実行可能な形態でインスト−
ルしておく。
【0031】分子軌道計算の具体的な手順は図1に示し
た通りであるため、本発明に関連する部分についていく
ぶん詳しく述べる。
【0032】まず所与の材料の構造、たとえば分子の場
合にはその分子ジオメトリの入力、分子対称性、基底関
数などを入力する。多くの場合、利用する分子軌道計算
プログラムに固有な入力フォ−マットで関連デ−タを入
力することとなるが、これには計算機クラスタ1を構成
するパ−ソナルコンピュ−タのいずれか1つにViなど
のエデイタを用いて入力すればよい。分子軌道計算シス
テムに入力された基底関数は所与材料を構成する各原子
上に中心を持つ原子軌道関数である。この原子軌道関数
に対して、(2)、(3)、(4)式で示した1電子積
分、2電子反発積分の計算が必要となるが、このうち計
算量の最も多いものは2電子反発積分(uv|ds)であ
る。本分子軌道解析用計算システムではこの積分計算が
計算機クラスタを構成する各パーソナルコンピュ−タ上
で分散処理される。分散は各パーソナルコンピュ−タへ
の負荷が均等になるように調節される。具体的には、所
与材料の全原子軌道に対する2電子積分インデックス
(ijkl)が各パーソナルコンピュ−タに均等分配さ
れ、対応する2電子積分(ij|kl)が各パーソナルコン
ピュ−タ上で別個に計算処理される。もちろん(ij|k
l)と全く同じ値を持つ(kl|ij) などは当然一回のみ
計算されるよう重複が避けられる。本分散処理は計算機
クラスタを構成するいずれか一つの計算機がマスタとな
り2電子積分インデックス(ijkl)分配を行えば容
易に達成できる。このように生成された2電子積分は伝
送線31を介してベクトル計算機2に転送され(5)式
で表わされるフォック行列要素Fuvが計算される。次に
(7)式で表わされる線形固有値方程式の解法がベクト
ル計算機上で反復され、分子軌道と軌道エネルギが求め
られる。この処理は先に述べた電子積分計算と異なり、
前段階の密度行列を入力として固有ベクトルと固有値を
順次求めて行くため、複数計算機に分散処理させていて
は通信ラグなどより、非常に効率のわるいものとなり、
単独計算機上での処理となる。このフォック行列の固有
値問題を解く処理は勿論計算機クラスタを構成するパー
ソナルコンピュ−タ上で行う事も可能であるが、一般に
パーソナルコンピュ−タでは逐次処理による数値演算し
か行えず、いわゆる行列演算に関するパイプライン処理
ができないため、解法に多大の時間が必要となってしま
う。一方、ベクトル計算機2によれば行列固有値をパイ
プライン処理演算により高速に求めることができ分子軌
道とエネルギを効率的に求めることが可能となる。ベク
トル計算機による高速演算にていては例えば”ス−パコ
ンピュ−タ(日本物理学会編、培風館発行、198
5)”などの数値計算法を解説した教科書に詳しく述べ
られているのでここでは改めて説明しない。
【0033】次に、本実施例に示した分子軌道解析用計
算システムを用いて行った計算結果について述べる。プ
ログラムにはダイレクトSCFが行なえるGAMESS
を利用した。基底関数を大きくとり、より具体的には6
−31G*と呼ばれる基底関数(例えば、前掲のアブイ
ニシオモレキュラ−オ−ビタルセオリ参照)を用い行な
ったSiH2C2H4分子の計算(基底関数総数は61基底であ
る)では以下の結果が得られた。全CPU時間は53
秒、このうち2電子積分を初めとする積分計算に要した
CPU時間は50秒、固有ベクトルと固有値を求める反
復処理に要したCPU時間は3秒であった。一方、固有
ベクトルと固有値を求める反復処理をベクトル計算機2
を用いず、計算機クラスタ1を構成するパーソナルコン
ピュ−タの一つを用いて行なったところ、反復処理に4
9秒のCPU時間を要した。また、2電子積分を初めと
する積分計算を計算機クラスタ1を用いず、ベクトル計
算機2のみを用いて行なったところ、これに要したCP
U時間は96秒であった。これらの結果から、本実施例
に示した分子軌道解析用計算システムを用いた場合、電
子積分計算ならびに固有値問題解法の双方に於いて計算
時間の短縮が大きくはかれる事がわかった。本実施例で
はSiH2C2H4分子という比較的小さな分子についての結果
を示したが、化学工業や製薬工業などで利用される大分
子の場合、計算時間の短縮効果はより著しいものとな
る。
【0034】次に、本発明による分子軌道解析用計算シ
ステムのまた別の実施例を図3を用いて説明する。本実
施例では先の実施例と異なり、計算機クラスタ1、ベク
トル計算機2接続用伝送線をイ−サネットに代わり、ベ
クトル計算機主記憶22に直接デ−タを転送できるチャ
ネル入出力装置21接続用のチャネル入出力装置接続用
伝送線32を用いた構成になっている。本構成では主記
憶22に直接、積分デ−タやフォック行列要素を転送で
きるため、伝送にともなうTAT(turn aroundtime)時
間の増加を抑える事ができる。本実施例を用いた分子軌
道計算結果について述べる。対象は先の実施例で計算し
たSiH2C2H4分子について行った。図2に示した構成では
全CPU時間53秒、TAT時間195秒であったの
が、本実施例に示した構成によれば全CPU時間は53
秒と変わらず、TAT時間は80秒と約3分の一に低減
することができた。
【0035】以上二つの実施例で述べたとおり、本発明
によれば従来の単一計算機を用いる分子軌道計算に比
べ、CPU時間、TAT時間双方の短縮が可能となる。
【0036】
【発明の効果】本発明によれば化学工業や製薬工業で扱
われる分子に対して、現実的な時間と計算機資源による
アブイニシオ分子軌道計算実行が可能となり、ひいては
これら材料の材料物性予測や薬理作用予測が可能とな
る。
【0037】
【図面の簡単な説明】
【図1】アブイニシオ分子軌道計算の概略ステップを示
す図。
【図2】本発明による分子軌道解析用計算システムの一
実施例の構成を示す概略図。
【図3】本発明による分子軌道解析用計算システムのま
た別の一実施例の構成を示す概略図。
【符号の説明】
1……計算機クラスタ、2……ベクトル計算機、11、
12、13、14、15、16……計算機クラスタを構
成する相互接続された計算機群、21……チャネル入出
力装置、22……主記憶装置、23……ベクトルレジス
タ、24……ベクトル演算プロセッサ、25……スカラ
レジスタ、26……スカラ演算プロセッサ、30……計
算機クラスタ内接続線、31……計算機クラスタ、ベク
トル計算機接続用伝送線、32……チャネル入出力装置
接続用伝送線。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ユルゲン・シュルティ 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】所与の材料に対する1電子積分、2電子積
    分、ならびに該1電子積分、該2電子積分より構成され
    るフォック行列因子の生成機能を有する相互に接続され
    た複数の計算機からなる計算機クラスタ、該計算機クラ
    スタが生成する該1電子積分の一部、ならびにフォック
    行列因子をパイプライン処理機能を有するベクトル計算
    機に伝送する通信手段、該通信手段を介し伝送された該
    1電子積分の一部、ならびにフォック行列因子よりフォ
    ック行列を生成し、該フォック行列の固有値と固有ベク
    トルを求解、所与材料の分子軌道エネルギと波動関数を
    出力するベクトル計算機から構成される分子軌道解析用
    計算システム。
  2. 【請求項2】計算機クラスタ生成デ−タをベクトル計算
    機に伝送する通信手段が、該ベクトル計算機の主記憶装
    置に直結する入出力チャネル装置であることを特徴とす
    る請求項1記載の分子軌道解析用計算システム。
  3. 【請求項3】該計算機クラスタを構成する個々の計算機
    がパ−ソナルコンピュ−タとワ−クステ−ションの任意
    の組み合わせより成ることを特徴とする請求項1、2記
    載の分子軌道解析用計算システム。
JP20423495A 1995-08-10 1995-08-10 分子軌道解析用計算システム Pending JPH0950428A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20423495A JPH0950428A (ja) 1995-08-10 1995-08-10 分子軌道解析用計算システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20423495A JPH0950428A (ja) 1995-08-10 1995-08-10 分子軌道解析用計算システム

Publications (1)

Publication Number Publication Date
JPH0950428A true JPH0950428A (ja) 1997-02-18

Family

ID=16487075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20423495A Pending JPH0950428A (ja) 1995-08-10 1995-08-10 分子軌道解析用計算システム

Country Status (1)

Country Link
JP (1) JPH0950428A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6631391B1 (en) 1999-04-09 2003-10-07 Fuji Xerox Co., Ltd. Parallel computer system and parallel computing method
US6799151B1 (en) 1999-04-13 2004-09-28 Taisho Pharmaceutical Co., Ltd Method and apparatus for parallel processing
US7885796B2 (en) 2003-09-22 2011-02-08 Nec Soft, Ltd. Parallel calculation method and device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6631391B1 (en) 1999-04-09 2003-10-07 Fuji Xerox Co., Ltd. Parallel computer system and parallel computing method
US6799151B1 (en) 1999-04-13 2004-09-28 Taisho Pharmaceutical Co., Ltd Method and apparatus for parallel processing
US7885796B2 (en) 2003-09-22 2011-02-08 Nec Soft, Ltd. Parallel calculation method and device

Similar Documents

Publication Publication Date Title
Lu et al. 86 PFLOPS deep potential molecular dynamics simulation of 100 million atoms with ab initio accuracy
He et al. GPU-accelerated parallel sparse LU factorization method for fast circuit analysis
Chen et al. On-the-fly parallel data shuffling for graph processing on OpenCL-based FPGAs
Gottlieb et al. Networks and algorithms for very-large-scale parallel computation
Lie Cerebras architecture deep dive: First look inside the hardware/software co-design for deep learning
Lin et al. Accelerating large sparse neural network inference using GPU task graph parallelism
CN111656339A (zh) 存储器装置及其控制方法
Fialko Parallel direct solver for solving systems of linear equations resulting from finite element method on multi-core desktops and workstations
D’Amore et al. Mathematical approach to the performance evaluation of matrix multiply algorithm
Um et al. An optimal allocation of carry-save-adders in arithmetic circuits
Noor New computing systems and future high-performance computing environment and their impact on structural analysis and design
Kang et al. HPMaX: heterogeneous parallel matrix multiplication using CPUs and GPUs
Leiserson Systolic and semisystolic design
Shamoto et al. GPU-accelerated large-scale distributed sorting coping with device memory capacity
CN113158599A (zh) 基于量子信息学的芯片和芯片化eda装置
Liang et al. $2^{1296} $ Exponentially Complex Quantum Many-Body Simulation via Scalable Deep Learning Method
JPH0950428A (ja) 分子軌道解析用計算システム
Mastronardi et al. Computing the smallest eigenpair of a symmetric positive definite Toeplitz matrix
Cardamone et al. Field‐programmable gate arrays and quantum Monte Carlo: Power efficient coprocessing for scalable high‐performance computing
Tadonki et al. An efficient CELL library for lattice quantum chromodynamics
Xu Asynchronous parallel primal–dual block coordinate update methods for affinely constrained convex programs
Wu et al. Two-stage column block parallel LU factorization algorithm
Yamazaki et al. Analyzing performance of bicgstab with hierarchical matrix on gpu clusters
Waidyasooriya et al. OpenCL-based implementation of an FPGA accelerator for molecular dynamics simulation
Zhang et al. SFO: A scalable approach to fanout-bounded logic synthesis for emerging technologies