JP2001202346A - 計算機の分散処理システム - Google Patents

計算機の分散処理システム

Info

Publication number
JP2001202346A
JP2001202346A JP2000009802A JP2000009802A JP2001202346A JP 2001202346 A JP2001202346 A JP 2001202346A JP 2000009802 A JP2000009802 A JP 2000009802A JP 2000009802 A JP2000009802 A JP 2000009802A JP 2001202346 A JP2001202346 A JP 2001202346A
Authority
JP
Japan
Prior art keywords
computer
arithmetic
processing system
parallel processing
distributed processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000009802A
Other languages
English (en)
Inventor
Atsushi Sakuma
淳 佐久間
Yukitaka Aritoshi
志貴 有年
Tatsuma Ando
竜馬 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaguchi Technology Licensing Organization Ltd
Original Assignee
Yamaguchi Technology Licensing Organization Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaguchi Technology Licensing Organization Ltd filed Critical Yamaguchi Technology Licensing Organization Ltd
Priority to JP2000009802A priority Critical patent/JP2001202346A/ja
Publication of JP2001202346A publication Critical patent/JP2001202346A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 構造解析などを計算機で分散処理する場合、
演算能力の低い装置に影響されて全体の効率が低下した
り、個々の演算装置に生じた障害が全体の障害になるの
を防ぐための計算機の分散処理システムを提供すること
を目的とする。 【解決手段】 並列処理時間と割り当てた部分領域との
関係から、演算装置の並列処理時間が均一となるよう
に、演算装置に割り当てる各部分領域を再配分する。ま
た、演算装置に障害が発生したとき、他の演算装置に計
算させて欠落した部分領域情報を補い、障害状態にない
演算装置に解析対象領域を分割再配分する。

Description

【発明の詳細な説明】
【発明の属する技術分野】本発明は、計算機の分散処理
システムに係わり、特に、解析対象を複数の領域に分割
し各部分領域を各演算装置に割り当てて並列処理をさせ
る計算機の分散処理システムに関する。
【従来の技術】大規模構造解析などの計算では、解析対
象を複数の領域に分割し各部分領域を各演算装置に割り
当てて並列処理をさせる計算機の分散処理システムが用
いられ、従来の技術では、各演算装置に均一の演算負荷
を割り当てるシステム、各演算装置が独立に計算を開始
し全体の同期をとらないシステム、例えば特開平9−1
46899号「並列化構造解析システム」などがある。
【発明が解決しようとする課題】上記の従来技術では、
演算装置の種類の差異や新旧によって演算能力に差異が
有る場合、演算能力の低い装置に影響されて全体の処理
の効率が低下するという問題があった。また、個々の演
算装置に生じた障害が全体の障害になるという問題もあ
った。本発明は、演算装置の種類の差異や新旧によって
演算能力に差異がある場合でも、全体の処理能力を高効
率に維持できる計算機の分散処理システムを提供するこ
とを目的にする。また、本発明は、個々の演算装置に生
じた障害が全体の障害に至らない強健性(ロバスト性)
を有する計算機の分散処理システムを提供することを目
的とする。さらに、本発明は、安価で効率の良い計算機
の分散処理システムを提供することを目的とする。
【課題を解決するための手段】本発明による計算機の分
散処理システムは、上記の課題を解決するために、各部
分領域を各演算装置に割り当てる動的割当手段を有す
る。動的割当手段は、演算装置が障害状態にあるか否か
を監視する手段を有し、さらに、並列処理過程で障害が
発生した演算装置に割り当てた部分領域の計算を障害状
態にない他の演算装置に計算させる手段を有する。ま
た、本発明は、計算機をネットワークで接続して構成し
た計算機の分散処理システムで、オブジェクト指向言
語、例えばJAVAで作成したプログラムを使用する。
【発明の実施の形態】本発明の動的割当手段は、各演算
装置の並列処理時間と各演算装置に割り当てた部分領域
との関係から、各演算装置の並列処理時間が均一となる
ように、各演算装置に割り当てる各部分領域の大きさを
再配分する。動的割当手段は、演算装置が障害状態にあ
るか否かを監視する手段で障害状態にない演算装置を検
出し、障害状態にない演算装置に解析対象領域を分割再
配分する。さらに、動的割当手段は、並列処理過程で演
算装置に障害が発生したとき、障害が発生した演算装置
に割り当てた部分領域の計算を障害状態にない他の演算
装置に計算させ、欠落した部分領域を補う。また、オブ
ジェクト指向言語、例えばJAVAで作成したプログラ
ムを使用することにより、各演算装置の並列処理時間を
均一化させる機能とあいまって、機種の相違や新旧の相
違に拘らず容易にシステムを構成でき、拡張も容易とな
り、システム構成の自由度が向上する。
【実施例】本発明の一実施例を図1〜図3によって説明
する。図1は本発明に基づく計算機の分散処理システム
のブロック図である。図1においては、1は動的割当手
段を含むマスター計算機、2は演算装置を含む複数のス
レーブ計算機であり、マスター計算機1とスレーブ計算
機2はLAN回線3を介してネットワーク接続されてい
る。図1では、スレーブ計算機2が4基(2−1〜2−
4)で構成されているが、何基でも良く、本発明を限定
するものではない。図2はマスター計算機1の機能構成
例を示すブロック図である。マスター計算機1は、動的
割当手段10を含み、LAN回線3との入力手段11、
出力手段12を含む。動的割当手段10は障害状態監視
手段13、障害領域再割当手段14、演算終了判定手段
15、均一計算時間判定手段16、部分領域割当手段1
7を含む。図3はスレーブ計算機2−1の機能構成例を
示すブロック図であり、演算装置20を含み、LAN回
線3との入力手段21、出力手段22を含む。各スレー
ブ計算機の部分領域計算結果、並列処理時間、異常情報
などはLAN回線3を介し、マスター計算機1の入力手
段11で取り込まれる。障害状態監視手段13は、各ス
レーブ計算機からの事故による停止等の異常情報、並列
処理時間の急激な増大などの条件により、各スレーブ計
算機が障害状態か正常状態か判断し監視する。障害状態
監視手段13は、何れかのスレーブ計算機で並列処理中
に障害が発生した場合、障害領域再割当手段14に通知
し、障害領域再割当手段14は、障害が生じていなく且
つ当該の並列処理を完了した何れかのスレーブ計算機
に、障害が生じたスレーブ計算機に割り当てた部分領域
の計算をさせ、欠落した部分領域情報を補う。全領域の
計算が終了後、演算終了判定手段15が、データの変化
が許容値以下かなどの条件で、演算終了可否を判定す
る。演算続行が必要な場合、均一計算時間判定手段16
が、各スレーブ計算機の並列処理が時間が均一になって
いるかどうかを、平均並列処理時間と各スレーブ計算機
の並列処理時間との偏差が許容値以下かなどで判定す
る。前回の並列処理過程で新たに障害状態となったスレ
ーブ計算機が無く、且つ並列処理時間が均一と判定され
た場合は、前回と同じ部分領域割り当てで各スレーブ計
算機に次回の並列処理をさせる。前回の並列処理過程で
新たに障害状態となったスレーブ計算機がある場合、又
は並列処理時間が均一でない場合は、部分領域割当手段
17が、部分領域の再配分をし、スレーブ計算機に次回
の並列処理をさせる。構造解析を例にすると、番号Iで
表されるスレーブ計算機の並列処理時間をt I 、このス
レーブ計算機に割り当てた節点数をNI とすると、定数
n、総節点数Nを用いて、並列処理時間を均一にするた
めに当該スレーブ計算機に割り当てるべき節点数
【数1】 が次式で与えられる。なお、nは、節点数とその計算時
間との関係を表現するための指数で、本構造解析ではn
=3となり、これは、節点数が2倍になれば計算時間が
8倍になることを意味する。
【数2】 上記の実施例では、動的割当手段を含むマスター計算機
と演算装置を含むスレーブ計算機複数基をLANでネッ
トワーク接続してシステム構成しているが、動的割当手
段と複数の演算装置を一つの計算機内に設けた、1計算
機での分散処理システムとしてもよい。また、動的割当
手段と一つの演算装置を一つの計算機内に設け、演算装
置を含む計算機を複数設け、これらをLANで接続した
ネットワークを構成した計算機の分散処理システムとし
てもよい。複数の計算機を使用する場合、プログラムを
オブジェクト指向言語、例えばJAVAで作成すること
は、機種の相違や新旧の相違に係わらず容易にシステム
を構成でき、拡張も容易となり、システム構成の自由度
を向上させるうえで効果的である。
【発明の効果】本発明によれば、各演算装置の並列処理
時間が均一となるように、各演算装置に割り当てる各部
分領域の大きさを再配分するため、演算装置の種類の差
異や新旧によって演算能力に差異がある場合でも、全体
の処理能力を高効率に維持できる。また、本発明は、並
列処理過程で演算装置に障害が発生したとき、障害が発
生した演算装置に割り当てた部分領域の計算を障害状態
にない他の演算装置に計算させて欠落した部分領域情報
を補うとともに、各演算装置が障害状態にあるか否かを
監視し、障害状態にない演算装置に解析対象領域を分割
再配分するため、個々の演算装置に生じた障害が全体の
障害に至らない強健性(ロバスト性)を有する。さら
に、本発明は、複数の計算機を使用する場合、オブジェ
クト指向言語、例えばJAVAで作成したプログラムを
使用することにより、各演算装置の並列処理時間を均一
化させる機能とあいまって、機種の相違や新旧の相違に
拘らず容易にシステムを構成でき、拡張も容易となり、
システム構成の自由度が向上するため、安価で効率の良
い計算機の分散処理システムとすることができる。
【図面の簡単な説明】
【図1】本発明による計算機の分散処理システムのブロ
ック図である。
【図2】本発明のマスター計算機の機能構成例を示すブ
ロック図である。
【図3】本発明のスレーブ計算機の機能構成例を示すブ
ロック図である。
【符号の説明】
1…動的割当手段を含むマスター計算機 2…演算装置を含む複数のスレーブ計算機 3…LAN回線 10…動的割当手段 11…入力手段 12…出力手段 13…障害状態監視手段 14…障害領域再割当手段 15…演算終了判定手段 16…均一計算時間判定手段 17…部分領域割当手段 20…演算装置 21…入力手段 22…出力手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 安藤 竜馬 山口県宇部市常盤台2丁目16番1号 山口 大学工学部内 Fターム(参考) 5B045 BB12 BB28 BB47 GG02 JJ13 JJ44

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数の演算装置を備え、解析対象を複数
    の領域に分割し各部分領域を各演算装置に割り当てて並
    列処理をさせる計算機の分散処理システムにおいて、各
    演算装置の並列処理時間(当該演算装置が並列処理過程
    に稼働した計算時間)と各演算装置に割り当てた該部分
    領域との関係から、各演算装置の並列処理時間が均一と
    なるように、各演算装置に割り当てる各部分領域の大き
    さを再配分する動的割当手段を有することを特徴とする
    計算機の分散処理システム。
  2. 【請求項2】 該動的割当手段は、該複数の演算装置が
    障害状態にあるか否かを監視する手段をさらに有し、障
    害状態にない演算装置を検出し、障害状態にない演算装
    置に該解析対象領域を分割再配分することを特徴とする
    請求項1記載の計算機の分散処理システム。
  3. 【請求項3】 該動的割当手段は、並列処理過程で該複
    数の演算装置に障害が発生したとき、該障害が発生した
    演算装置に割り当てた部分領域の計算を障害状態にない
    他の演算装置に計算させる手段を有することを特徴とす
    る請求項1または2記載の計算機の分散処理システム。
  4. 【請求項4】 演算装置を含む計算機複数基と、動的割
    当手段を含む計算機と、これら計算機を接続するネット
    ワークで構成したことを特徴とする請求項1、2または
    3記載の計算機処理システム。
  5. 【請求項5】 異なる機種又は/及び演算能力が異なる
    計算機を含むことを特徴とする請求項4記載の計算機の
    分散処理システム。
  6. 【請求項6】 オブジェクト指向言語で作成したプログ
    ラムを使用したことを特徴とする請求項4または5記載
    の計算機の分散処理システム。
JP2000009802A 2000-01-19 2000-01-19 計算機の分散処理システム Pending JP2001202346A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000009802A JP2001202346A (ja) 2000-01-19 2000-01-19 計算機の分散処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000009802A JP2001202346A (ja) 2000-01-19 2000-01-19 計算機の分散処理システム

Publications (1)

Publication Number Publication Date
JP2001202346A true JP2001202346A (ja) 2001-07-27

Family

ID=18537905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000009802A Pending JP2001202346A (ja) 2000-01-19 2000-01-19 計算機の分散処理システム

Country Status (1)

Country Link
JP (1) JP2001202346A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295738A (ja) * 2003-03-28 2004-10-21 Nec Corp 耐障害計算機システム、プログラム並列実行方法およびプログラム
JP2007133665A (ja) * 2005-11-10 2007-05-31 Hitachi Ltd 計算機システム、分散処理方法、計算機及び分散処理プログラム
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
JP2012053777A (ja) * 2010-09-02 2012-03-15 Fujitsu Ltd データ割振り装置、データ割振り方法及びデータ割振りプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295738A (ja) * 2003-03-28 2004-10-21 Nec Corp 耐障害計算機システム、プログラム並列実行方法およびプログラム
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
JP2007133665A (ja) * 2005-11-10 2007-05-31 Hitachi Ltd 計算機システム、分散処理方法、計算機及び分散処理プログラム
JP2012053777A (ja) * 2010-09-02 2012-03-15 Fujitsu Ltd データ割振り装置、データ割振り方法及びデータ割振りプログラム

Similar Documents

Publication Publication Date Title
JP4313336B2 (ja) 監視システムおよび監視方法
WO2012144647A1 (ja) 仮想マシン管理装置、仮想マシン管理方法、及び、プログラム
US9535752B2 (en) Systems and methods of host-aware resource management involving cluster-based resource pools
JP5532150B2 (ja) 運用管理装置、運用管理方法、及びプログラム
CN111049705A (zh) 一种监控分布式存储系统的方法及装置
US20160266832A1 (en) Optimization of in-memory data grid placement
US8898422B2 (en) Workload-aware distributed data processing apparatus and method for processing large data based on hardware acceleration
CN105045832A (zh) 一种数据采集方法及装置
WO2017118080A1 (zh) 一种中央处理器cpu热移除、热添加方法及装置
CN109828960B (zh) 日志库扩容方法、系统、计算机装置及可读存储介质
CN106484528A (zh) 分布式框架中用于实现集群动态伸缩的方法及装置
WO2005015346A2 (en) Dynamically configurable fault tolerance in autonomic computing with multiple service points
CN104899071A (zh) 集群中虚拟机的恢复方法和系统
CN111625592A (zh) 分布式数据库的负载均衡方法和装置
CN107070645A (zh) 比较数据表的数据的方法和系统
CN114168071B (zh) 一种分布式集群扩容方法、分布式集群扩容装置及介质
CN111352726B (zh) 一种基于容器化微服务的流数据处理方法及装置
CN115167992A (zh) 任务处理方法、系统、装置、服务器、介质及程序产品
JP2001202346A (ja) 計算機の分散処理システム
CN104281636A (zh) 海量报表数据并发分布式处理方法
JP6040894B2 (ja) ログ生成装置、及びログ生成方法
CN110990059B (zh) 一种用于倾斜数据的流式计算引擎运行方法及系统
CN107710698A (zh) 一种业务恢复方法和控制器
CN113760469A (zh) 分布式计算的方法和装置
JP2021157339A (ja) 情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603