JP2000315199A - 分散処理方式 - Google Patents

分散処理方式

Info

Publication number
JP2000315199A
JP2000315199A JP11125572A JP12557299A JP2000315199A JP 2000315199 A JP2000315199 A JP 2000315199A JP 11125572 A JP11125572 A JP 11125572A JP 12557299 A JP12557299 A JP 12557299A JP 2000315199 A JP2000315199 A JP 2000315199A
Authority
JP
Japan
Prior art keywords
job
processor
execution
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11125572A
Other languages
English (en)
Inventor
Chikatoshi Noro
慎豪 野呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11125572A priority Critical patent/JP2000315199A/ja
Publication of JP2000315199A publication Critical patent/JP2000315199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】パラメータサーベイのような複数のジョブを並
列計算機システムで処理する場合において、複数のプロ
セッサを効率よく稼動させ、ジョブの処理時間の短縮を
図る。 【解決手段】ユーザ入出力計算機3より送られてきた情
報をジョブ管理・制御手段11が受け取り、その情報を
もとにジョブ割当て手段12でジョブ実行プロセッサを
決定し、各ジョブ毎の入力データをデータファイル自動
生成手段13で作成する。決定した実行プロセッサの情
報やジョブ毎の情報をジョブ管理・制御手段11からジ
ョブ実行手段21に受け渡し、その情報から実行モジュ
ール22を決定し、ジョブを実行する。この一連の流れ
を未処理のジョブが存在しなくなるまで、逐次行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク上に
接続された並列計算機システムや独立して動作するプロ
セッサを有する計算機システムにおいて、複数のプロセ
ッサに処理対象ジョブを設定する管理・制御および割当
て方式と、それを利用した計算機システムの分散処理方
式に関するもの。
【0002】
【従来の技術】ネットワーク上により接続された独立し
て動作可能な複数のプロセッサを利用して分散処理を行
う際のプロセッサ割当て方法としては、特開平3−85664
号公報,特開平4−223547 号公報などに示されているよ
うに、計算機システムが与えられたジョブについて最適
だと思われるプロセッサを判断して、そのプロセッサに
ジョブを割当てるという方法が既に知られている。この
従来技術の計算機システムによる最適プロセッサの判断
は、各プロセッサにおける処理性能や負荷状態などのプ
ロセッサ情報、各ジョブ実行時における実行内容や処理
量などのジョブ情報などをもとに、推定されるジョブ処
理時間が最も短いものを最適なものとしている。
【0003】また、独立に動作可能な複数プロセッサに
おいて、複数のジョブを分散処理する方法としては、特
開平1−259446 号公報がある。この従来技術は、複数ジ
ョブを並列処理して実行するために、すべてのジョブに
対して、実行可能な入力データの事前準備や並列処理を
施す作業などを行なっておく必要がある。
【0004】容易に分散処理を行えるように、アイコン
などのグラフィクイメージを用いて選択した処理装置に
任意のプログラムを指定する方法は、特開平5−290007
号公報により、知られている。この従来技術では、ジョ
ブではなくプログラムを表すアイコンをマウス指定し、
選択した処理装置を表すアイコン上に移動することによ
り、該当プログラムを選択した該当の処理装置で実行す
るように定義するものである。
【0005】また、実行プロセッサを直接指定して、実
行することを可能にした、NFS((米)Sun Microsys
tems社の登録商標)と呼ばれるユティリティの「on」
コマンドがある。ただし、計算機システムによってはこ
のコマンドがない場合が有り、また、計算機システムの
環境によっては、コマンド形式でジョブの実行指示を発
生できないものがあり、この場合にも「on」コマンド
を利用できない。
【0006】
【発明が解決しようとする課題】従来技術にあるような
動作可能なプロセッサが複数ある場合の選択方式は、そ
れぞれのジョブに対して最適なプロセッサを判断する手
段として計算機システム側の処理を行うことにしてい
る。この判断処理は、各プロセッサにおける処理性能や
負荷状態などの情報、ジョブ実行時のおける実行内容や
処理量などのジョブ情報からすべてのプロセッサについ
て、ジョブの実行処理に要する時間を推定し、最も処理
時間の短いものを最適なプロセッサとしてジョブの割当
てを行うものである。このとき、各プロセッサの負荷状
態の情報入手には、各プロセッサ負荷状態をチェックし
た後、得られた情報をジョブの割当てを行うプロセッサ
に送信するという処理が必要となり、時間がかかる。
【0007】また、最適なプロセッサを選択するために
は、ジョブの処理量の高精度な予測が必要となるが、ジ
ョブの種類や入力データにより処理量が変化することが
多く、高精度な予測には時間が費やされる。また、複数
のジョブを実行するためには、あらかじめ各ジョブに対
する入力データファイルを準備しておかなければならな
いが、これらはすべてユーザ側で行なうため、実行開始
までの準備に時間が費やされるという問題が生じる。
【0008】さらに、一般的には、計算プログラムや実
行モジュールなどはCPUの種類やオペレーティングシ
ステム(OS),コンパイラなどの異なる計算機環境下
では正常に動作することが保証されない。上記従来技術
では、1つの計算プログラムや実行モジュールで異なる
環境下でのプロセッサを用いて分散処理を行なった場
合、実行ができなくなることがほとんどである。
【0009】
【課題を解決するための手段】本発明は、複数のプロセ
ッサを有する計算機(ここでは、並列計算機という)
と、それにネットワーク上で接続されているユーザ側で
入出力を行なう計算機で構成された計算機システムで、
並列計算機での1つのプロセッサを管理・制御の手段に
用い、その他のプロセッサを実行プロセッサに用いて、
そのプロセッサに複数のジョブを逐次割当てる方式を提
案する。
【0010】さらに、本発明は、ネットワーク上にある
制御可能なプロセッサ群をサーバ計算機として、それを
管理・制御するプロセッサ、それらプロセッサ群に接続
されたユーザ側で入出力を行なうための計算機上におい
て実行ジョブをサーバ計算機としてのプロセッサに割当
てる方式を提案する。
【0011】さらに、従来技術を含むプロセッサ割当て
方式、およびプロセッサの直接方式を備え、かつ、それ
ぞれのジョブを独立したプロセスとして逐次実行させる
ことのできる分散処理方式を提供する。また、ジョブ実
行の準備に要するユーザ側の準備時間の短縮を図るため
には、複数のジョブのうちで同じ実行モジュールを使用
するジョブに対し入力データ形式は同一であるため、そ
のジョブの変更箇所のみを記述することで入力データフ
ァイルを生成する手段を提供する。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て、添付の図面を参照しながら詳細に説明する。まず、
図1には、本発明の分散処理方式を利用する計算機シス
テムが示されており、クライアントプロセッサ1と複数
のサーバプロセッサ2およびユーザ入出力計算機3がネ
ットワーク4で接続された計算機システムを構成してい
る。なお、これら複数のプロセッサ1,2は、キーボー
ドやマウスなどの入力装置や、ディスプレイなどを備え
なくてもよく、また、CPUの種類やオペレーティング
システム(OS)、あるいは、コンパイラなどが異なる
ものであってもよい。
【0013】次に、図2には、本発明の分散処理方式を
利用する並列計算機5での実施した例を示す。並列計算
機5が備えている複数のプロセッサの1つをクライアン
トサーバ1とし、その他のプロセッサをサーバプロセッ
サ2とすることとし、ユーザ入出力計算機3とネットワ
ーク4を介し、並列計算機内の入出力ユニット32、3
次元・クロスバ・ネットワーク31を接続されている。
なお、並列計算機5を利用することにより、図1に示し
た効果のほかに、CPUの種類やオペレーティングシス
テム(OS)、あるいは、コンパイラなどに違いがなく
なり、制御の面において単純になるという効果がある。
【0014】次に、図3を参照しながら本発明による分
散処理方法の詳細を示す。図からも明らかなようにクラ
イアントプロセッサにはジョブ管理・制御手段11,ジ
ョブ割当て手段12、および、データファイル自動生成
手段13を、サーバプロセッサ2には、ジョブ実行手段
21とジョブ実行22に必要な各種モジュールを備えて
いる。まず、ユーザがジョブ実行指示情報14をおく
り、クライアントサーバのジョブ管理・制御手段11が
受け取る。上記ジョブ実行指示情報14,ジョブ・プロ
セッサ管理情報15をもとにジョブ割当て手段12と、
データファイル自動生成手段13を動作させる。上記ジ
ョブ割当て手段12はジョブ実行を行なうサーバプロセ
ッサ2を決定するもので、データファイル自動生成13
は基本データ51,変更指示データ52によりジョブ実
行の際に必要な入力データを自動生成するものである。
サーバプロセッサ2にあるジョブ実行手段21は、ジョ
ブ管理・制御手段11から送られる情報からジョブ実行
に必要な実行モジュール22を決定するものである。
【0015】次に、ジョブ割当て方式の流れについて、
図5を参照しながら示す。未処理ジョブ有無を検出し、
ない場合には終了し、ある場合には、次の工程に進む
(501)。つづいて、実行可能なプロセッサの有無を検出
し、ない場合には実行可能なプロセッサが検出されるま
でこの工程を続け、ある場合にはつぎの工程に進む(5
02)。検出された実行可能なプロセッサ情報と未処理
ジョブの情報をジョブ管理・制御部にもどす(50
3)。
【0016】次に、データファイル自動生成方式の流れ
について、図6を参照しながら示す。まず、未処理ジョ
ブjに対する実行モジュール用の基本となるデータを読
込み(601)、その基本データのどの箇所をどのよう
に変更するかというデータを読込む(602)。読込ん
だ基本となるデータを別名でコピーし、そのコピーした
データをもとに指示された変更箇所に変更データを上書
きする(603)。そして、未処理ジョブ(ここでは、
ジョブ実行を行なっていないものをいう)の有無を検出
して、ありの場合には基本データ読込み(601)部分
にもどり、ない場合には終了する。
【0017】ここで、本発明におけるジョブ管理・制御
手段11とジョブ実行手段21の詳細について、図4,
図6を参照しながら示す。ジョブ管理・制御手段はジョ
ブ実行し辞情報解析部111,ジョブ/プロセッサ管理
情報アクセス部112,ジョブ管理・制御部113,入
力データ送信部114,出力データ受信部115,制御
情報受信部116,ジョブ完了情報受信部117,ジョ
ブ実行完了情報解析部118,ジョブ/プロセッサ管理
情報ストア部119から、ジョブ実行手段21は入力デ
ータ受信部211,出力データ送信部212,制御情報
受信部213,制御情報解析部214,ジョブ完了情報
送信部215,ジョブ実行部216から構成されてい
る。
【0018】まず、ジョブ実行指示情報14からジョブ
実行情報解析部111が受け取り、ジョブ/プロセッサ
管理情報アクセス部112を通してジョブ/プロセッサ
管理情報15を生成する。ジョブ管理・制御部113は
ジョブ実行指示情報14およびジョブ/プロセッサ管理
情報15から得られた使用するプロセッサ数分のジョブ
の実行の制御情報を送信する。この制御情報は制御情報
送信部116を介して制御情報受信部213が受け取
り、制御情報解析部214がそれを読み取り、どのよう
な処理を施すか、また、どのような実行モジュールを用
いるかを識別する。制御情報解析部214での識別情報
を参照してジョブ実行部216が実行モジュール22を
起動させる。なお、入力データはジョブ管理・制御11
3から入力データ送信部114に、そして入力データ受
信部を介して、実行モジュールに受け渡される。実行モ
ジュールの処理が終了した後、その実行完了情報がジョ
ブ実行部216に受け渡され、ジョブ完了情報送信部2
15からジョブ完了受信部へ、そしてジョブ完了情報解
析部118に読込まれる。ジョブ完了情報解析部 118で
は、ジョブ実行の処理の評価(正常に終了したか、異常
終了したかなど)を行い、ジョブ/プロセッサ管理情報
ストア部によりジョブ/プロセッサ管理情報15が更新
される。つづいて、実行可能なプロセッサを識別し、そ
のプロセッサに逐次ジョブ実行の制御情報を上記に示し
た制御方法で送信する。
【0019】以上の制御方式により、各プロセッサがそ
れぞれのジョブを実行した様子を図7に示す。この実施
例ではジョブの総数nが使用するプロセッサの総数mよ
り、過分に大きいときのものである。まず、プロセッサ
m分でジョブを同時に実行し、ジョブの完了したプロセ
ッサで逐次未処理のジョブを実行することにより、効率
的にプロセッサを使用することができ、数多くのジョブ
を実行できる。
【0020】
【発明の効果】本発明では、パラメータサーベイのよう
な複数のジョブを処理する場合において、各プロセッサ
に逐次ジョブを割当てることにより、1台のプロセッサ
を使用したときに比べて非常に短い時間ですべてのジョ
ブを処理できる。
【図面の簡単な説明】
【図1】本発明による分散処理方式のブロック図。
【図2】本発明による並列計算機における分散処理方式
のブロック図。
【図3】本発明による分散処理方式の処理内容の関係を
示すブロック図。
【図4】本発明の実施例よるデータファイル自動生成方
法の詳細を示すフローチャート図。
【図5】本発明の実施例によるジョブ割当て方法の詳細
を示すフローチャート図。
【図6】本発明の実施例によるジョブの管理・制御およ
び実行の詳細を示すブロック図。
【図7】本発明の実施例によるジョブ実行過程を示す説
明図。
【符号の説明】
1…クライアントプロセッサ、2…サーバプロセッサ、
3…ユーザ入出力計算機、4…ネットワーク、11…ジ
ョブ管理・制御手段、12…ジョブ割当て手段、13…
データファイル自動生成手段、21…ジョブ実行手段、
22…実行モジュール。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】複数のジョブを実行させるために、ユーザ
    入出力計算機とネットワーク上で接続されている複数の
    プロセッサを有する並列計算を用い、各ジョブの実行状
    況を管理・制御を行うジョブ管理・制御手段と、それぞ
    れのプロセッサに各ジョブの割当てを行うジョブ割当て
    手段、および、各ジョブに対する入力データを生成する
    データファイル自動生成手段と、前記のジョブ管理・制
    御手段からの情報から目的の処理を実行するジョブ実行
    手段とそれに付随する実行モジュールにより、複数のジ
    ョブを複数のプロセッサを有する並列計算機で逐次実行
    することを特徴とする分散処理方式。
  2. 【請求項2】前記請求項1に記載のジョブ割当て手段
    は、各プロセッサの処理状態を随時管理し、処理可能な
    プロセッサが検出されたら、未処理のジョブを逐次処理
    可能なプロセッサに割当てる手段であることを特徴とす
    る分散処理方式。
  3. 【請求項3】前記請求項1に記載のデータファイル自動
    生成手段は、ジョブの実行に際して必須である入力デー
    タのもととなる基本データと、その基本データをどのよ
    うに変更するかを指定するパラメータサーベイ用変更指
    示データとから、各ジョブ毎の入力データを自動的に生
    成するデータファイル自動生成の手段を有することを特
    徴とする分散処理方式。
JP11125572A 1999-05-06 1999-05-06 分散処理方式 Pending JP2000315199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11125572A JP2000315199A (ja) 1999-05-06 1999-05-06 分散処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11125572A JP2000315199A (ja) 1999-05-06 1999-05-06 分散処理方式

Publications (1)

Publication Number Publication Date
JP2000315199A true JP2000315199A (ja) 2000-11-14

Family

ID=14913516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11125572A Pending JP2000315199A (ja) 1999-05-06 1999-05-06 分散処理方式

Country Status (1)

Country Link
JP (1) JP2000315199A (ja)

Similar Documents

Publication Publication Date Title
CA2121154C (en) System for emulating multi-tasking pipelines in a single tasking environment
JP3617851B2 (ja) パイプライン化データ処理方法
US5881283A (en) Job scheduling analysis method and system using historical job execution data
JP5015665B2 (ja) カーネル間でカーネル・サービスを共用するための方法、装置、およびコンピュータ・プログラム
US6625638B1 (en) Management of a logical partition that supports different types of processors
US7730166B2 (en) Dynamic definition for concurrent computing environments
US20050114854A1 (en) System and method for dynamic cooperative distributed execution of computer tasks without a centralized controller
US8056079B1 (en) Adding tasks to queued or running dynamic jobs
US6470346B2 (en) Remote computation framework
EP0644486A2 (en) Management of data accesses in computer systems
KR20020079849A (ko) 네트워크 상에 분포된 데이터 처리 작업의 신속한 종료를위한 시스템 및 방법
JP2590045B2 (ja) 分散処理制御方法及び分散処理システム
US7454749B2 (en) Scalable parallel processing on shared memory computers
Harichane et al. KubeSC‐RTP: Smart scheduler for Kubernetes platform on CPU‐GPU heterogeneous systems
JP2820189B2 (ja) 数値制御装置の制御ソフトウェア実行システム
US11561843B2 (en) Automated performance tuning using workload profiling in a distributed computing environment
JPH06243112A (ja) マルチプロセッサ装置
US5613133A (en) Microcode loading with continued program execution
US20020174173A1 (en) Self-downloading network client
US8561077B1 (en) Binder for a multi-threaded process to access an un-shareable resource
JP2000315199A (ja) 分散処理方式
JPH0793262A (ja) アプリケーションツール実行管理システム
JP2001265726A (ja) コンピュータ作業負荷の高速リカバリおよび再配置を可能にする自動化アプリケーションおよび手順
US20050223378A1 (en) Method and apparatus for enhancing computer application performance
JP3884239B2 (ja) サーバ計算機