JP2008226177A - 分散処理プログラム、システムおよび方法 - Google Patents

分散処理プログラム、システムおよび方法 Download PDF

Info

Publication number
JP2008226177A
JP2008226177A JP2007067426A JP2007067426A JP2008226177A JP 2008226177 A JP2008226177 A JP 2008226177A JP 2007067426 A JP2007067426 A JP 2007067426A JP 2007067426 A JP2007067426 A JP 2007067426A JP 2008226177 A JP2008226177 A JP 2008226177A
Authority
JP
Japan
Prior art keywords
processing
computer
job
management computer
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007067426A
Other languages
English (en)
Other versions
JP5061671B2 (ja
Inventor
Taketoshi Yoshida
武俊 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007067426A priority Critical patent/JP5061671B2/ja
Priority to US12/041,156 priority patent/US8677363B2/en
Publication of JP2008226177A publication Critical patent/JP2008226177A/ja
Application granted granted Critical
Publication of JP5061671B2 publication Critical patent/JP5061671B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5033Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering data affinity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5017Task decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】分散処理の処理対象を記憶する管理コンピュータの負荷を低減し、かつ、管理コンピュータの障害時の復旧に要する処理を低減させた分散処理システムの提供を目的とする。
【解決手段】分散処理の管理をする管理コンピュータから送信された演算の対象を処理コンピュータが演算して、管理コンピュータに演算の結果を送信する分散処理を実行させる分散処理であって、処理コンピュータが、管理コンピュータからの処理の対象を受信し、処理の対象の内、再現可能な処理の結果を選択的に記憶し、処理の結果を管理コンピュータに送信する。
【選択図】図1

Description

本発明は分散処理システムのデータの管理方法に関する。
分散処理は、複数のコンピュータを通信によって接続し、互いのコンピュータ間で通信をしながら処理を実行する。分散処理のシステムでは、管理コンピュータは、利用者端末から与えられた一連の処理を処理コンピュータに分散させる処理の最小単位(以下、ジョブという)に分割し、各ジョブに応じた処理を実行する処理コンピュータに分散して処理させる。管理コンピュータは、障害発生に対する対策として、ジョブの管理情報を管理コンピュータ自身が有する記憶装置に格納する。分散処理の従来技術として、下記文献がある。
しかし、管理コンピュータはジョブに関する情報をジョブ毎に磁気ディスク装置等の記憶装置へ格納するため、格納するための時間を要する。この結果、分散処理システムでは管理コンピュータがジョブ情報を記憶装置に格納する時間が処理の遅延の要因となっている。一方、管理コンピュータがジョブ情報を記憶しない構成の場合、一連の処理の途中で管理コンピュータに異常が発生した場合、処理に関する情報が失われる場合もある。
別の方法として、管理コンピュータを冗長構成とする方式あるいは管理コンピュータの記憶装置を冗長構成とする方式もある。しかし冗長構成とするとシステムの構成に多額の費用がかかる問題があった。更に冗長構成での管理コンピュータ間の制御が必要となり、分散処理システムの処理が複雑になる結果、分散処理システムの動作が不安定になる問題があった。また、処理の経過を記憶する必要があるため、管理コンピュータの負荷は改善しない問題があった。
特開平08−110895号公報
本発明は、分散処理の処理対象を記憶する処理による管理コンピュータの負荷を低減し、かつ、管理コンピュータの障害時の復旧に要する処理を低減させた分散処理システムの提供を目的とする。
本発明は、分散処理の管理をする管理コンピュータから送信された演算の対象を処理コンピュータが演算して、処理コンピュータが管理コンピュータに演算の結果を送信する分散処理を実行させる分散処理システムに関する。本発明の第一の手段では、処理コンピュータが、管理コンピュータからの演算の対象を受信し、該演算の対象が再度演算した場合に同一の結果となる演算の対象の結果を選択的に記憶する。
また、本発明の第二の手段は第一の手段に加えて、管理コンピュータの異常の発生を検出したときに、再度演算した場合に同一の結果となる演算の対象の結果を送信可能である情報を管理コンピュータに送信する。
また、本発明の第三の手段は第一の手段に加えて、管理コンピュータから再度演算した場合に同一の結果となる演算の対象の結果を削除してもよい旨の情報を受信したときに、再度演算した場合に同一の結果となる演算の対象の結果を削除する。
また、本発明の第四の手段では、管理コンピュータが、分割した演算の対象毎に識別子を付加した演算の対象を処理コンピュータに送信し、分散処理の途中で管理コンピュータの分散処理に関する情報が失われた場合に、該演算の対象が再度演算した場合に同一の結果となる演算の対象の結果を処理コンピュータから受信する。
本発明は、処理コンピュータ及び利用者端末が分散処理に必要な情報を格納する。
したがって、管理コンピュータの分散処理に関する情報を記憶装置に記憶するための処理が不要となり、管理コンピュータの負荷が軽減する。また、処理コンピュータは再度演算した場合に同一の結果となる演算の対象の結果を選択的に格納するため、再度演算した場合に同一の結果となる演算の対象の結果については復旧に要する処理が低減する。
以下、本発明の実施の形態を説明する。
図1は、本実施例の分散処理システム1のシステム構成図である。本実施例での分散処理システム1は、管理コンピュータ(management computer)10、複数の処理コンピュータ(JOB computer)20、および複数の利用者端末(User terminal)30とから構成されており、それらがネットワーク40を介して接続された構成となる。
管理コンピュータ10は、ネットワーク40を介して接続された複数の処理コンピュータ20に実行させる処理群を管理する。利用者から登録された一つのまとまった処理要求を利用者端末30が受け取り、利用者端末では受け取った処理要求を個々の処理コンピュータ20が実行する処理毎に分割する。個々の処理コンピュータ20が実行するために分割された処理はジョブ(JOB)と呼ばれる。管理コンピュータ10は、処理要求および分割された個々の処理を管理する。
処理コンピュータ20は、それぞれ個別の処理能力を有する。処理能力は、処理コンピュータ20が有するCPUの性能、メモリの容量、記憶容量の大きさ等のハードウェアの構造、OS、およびジョブを実行する際に割り当てる処理能力の割合から決定される。分散処理システム1上の個々の処理コンピュータ20毎に異なる処理能力を有する場合がある。処理コンピュータ20は、ジョブの演算を実行した結果を管理コンピュータ10に送信する。
利用者端末30は、利用者からの処理要求が入力される端末である。利用者端末30は管理コンピュータ10にネットワーク40を介して処理要求を送信する。
次に、管理コンピュータ10、複数の処理コンピュータ20、および複数の利用者端末30のハードウェア構成について説明する。図2は、本実施例の管理コンピュータ10のハードウェア構成図である。管理コンピュータ10は、制御部11、メモリ12、記憶部13、入力部14、出力部15、ネットワークインターフェース部16を有し、それぞれがバス17に接続された構成である。
制御部11は管理コンピュータ10の全体を制御する。例えば、Central Processing Unit(CPU)である。また、制御部11はメモリ12に展開された管理プログラム18を実行する。管理プログラム18は制御部11を利用者端末30からのジョブプログラムや処理コンピュータ20からのジョブの処理結果などを受付けるとともに処理コンピュータ20へのジョブ処理依頼や利用者端末30への処理要求に対する処理結果などを出力するジョブ管理モジュール111、管理コンピュータの異常時にジョブデータを復旧する管理復旧モジュール112、として機能させる。
メモリ12は、記憶部13に格納された管理プログラム18が展開される記憶領域である。また、メモリ12は制御部11が管理プログラム18を実行する際に生成される種々の演算結果が格納される記憶領域である。メモリ12は例えばRandom Access Memory(RAM)である。
入力部14は管理者からの命令情報を受付ける。例えば、管理コンピュータ10の異常状態からの復旧時の制御命令等である。入力部14は、例えば、キーボード、マウス、タッチパネル等である。出力部15は、例えば処理結果や管理コンピュータ10の異常情報を出力する。出力部15は、例えば、ディスプレイ(表示装置)等である。管理プログラム18は記憶部13に格納される。記憶部13は例えばハードディスク装置である。
ネットワークインターフェース部16は、インターネットあるいはLocal Area Network(LAN)等のネットワーク40に接続して、ネットワーク40経由で処理要求あるいはジョブ等の送受信を行う。また、管理コンピュータ10は管理プログラム18を記録した記録媒体又はプログラムのダウンロードも可能である。
図3は、本実施例の処理コンピュータ20のハードウェア構成図である。処理コンピュータ20は、制御部21、メモリ22、記憶部23、入力部24、出力部25、ネットワークインターフェース部26を有し、それぞれがバス27に接続された構成である。
制御部21は処理コンピュータ20の全体を制御する。例えば、Central Processing Unit(CPU)である。また、制御部21はメモリ22に展開された処理プログラム28を実行する。処理プログラム28は制御部21を、ジョブを受付け、ジョブの演算処理を実行し、ジョブの演算処理結果を出力するジョブ処理モジュール211、管理コンピュータ10の異常時に処理結果を送信し、管理コンピュータ10の障害の迅速な復旧をする障害復旧モジュール212として機能させる。
メモリ22は、記憶部23に格納された処理プログラム28が展開される記憶領域である。また、メモリ22は制御部21が処理プログラム28を実行する際に生成される種々の演算結果が格納される記憶領域である。メモリ22は例えばRandom Access Memory(RAM)である。
入力部24は処理コンピュータの管理者からの制御命令等を受付ける。入力部24は、例えば、キーボード、マウス、タッチパネル等である。出力部25は、処理結果等を出力する。出力部25は、例えば、ディスプレイ(表示装置)等である。処理プログラム28は記憶部23に格納される。記憶部23は例えばハードディスク装置である。
ネットワークインターフェース部26は、インターネットあるいはLocal Area Network(LAN)等のネットワーク40に接続して、ネットワーク40経由で処理要求あるいはジョブ等の送受信を行う。また、処理コンピュータ20は処理プログラム28を記録した記録媒体又はプログラムのダウンロードも可能である。
図4は、本実施例の利用者端末30のハードウェア構成図である。利用者端末30は、制御部31、メモリ32、記憶部33、入力部34、出力部35、ネットワークインターフェース部36を有し、それぞれがバス37に接続された構成である。
制御部31は利用者端末30の全体を制御する。例えば、Central Processing Unit(CPU)である。また、制御部31はメモリ32に展開された利用者プログラム38を実行する。利用者プログラム38は制御部31を、利用者から受付けた処理要求を個別のジョブプログラムに分割するジョブ分割モジュール311、各ジョブプログラムの再現性の可否を判定する再現性可否モジュール312、処理要求およびジョブプログラムを管理する端末管理モジュール313、管理コンピュータ10の復旧の補助の処理を実行する障害復旧モジュール314として機能させる。
メモリ32は、記憶部33に格納された利用者プログラム38が展開される記憶領域である。また、メモリ32は制御部31が利用者プログラム38を実行する際に生成される種々の演算結果が格納される記憶領域である。メモリ32は例えばRandom Access Memory(RAM)である。
入力部34は利用者からの処理要求情報を受付ける。入力部34は、例えば、キーボード、マウス、タッチパネル等である。出力部35は、処理要求に対する処理の結果情報を出力する。出力部35は、例えば、ディスプレイ(表示装置)等である。利用者プログラム38は記憶部33に格納される。記憶部33は例えばハードディスク装置である。
ネットワークインターフェース部36は、インターネットあるいはLocal Area Network(LAN)等のネットワーク40に接続して、ネットワーク40経由で処理要求あるいはジョブ等の送受信を行う。また、利用者端末30は利用者プログラム38を記録した記録媒体又はプログラムのダウンロードも可能である。
次に、管理コンピュータ10、複数の処理コンピュータ20、および複数の利用者端末30の機能構成について説明する。図5は、管理コンピュータ10の機能構成図である。
管理コンピュータ10は、ジョブ管理モジュール111および管理復旧モジュール112の機能を有する。また、管理コンピュータ10は、ジョブプログラムID管理テーブル130およびジョブ情報テーブル140を有する。
ジョブプログラムID管理テーブル130およびジョブ情報テーブル140は本実施例では管理コンピュータ10のメモリ12上に展開される。
ジョブ管理モジュール111はジョブを管理する。ジョブ管理モジュール111は、利用者端末30から送信されたジョブプログラム情報を取得する処理、各ジョブプログラムに識別番号を付与する処理、各ジョブプログラムに関する情報をジョブプログラムID管理テーブル130に格納する処理、利用者端末30にジョブプログラムに関する情報を送信する処理、ジョブプログラムにジョブ識別番号を付加して管理する処理、処理コンピュータ20にジョブの演算処理の依頼情報を送信する処理、処理コンピュータ20からジョブの演算処理の結果の情報を取得する処理、および処理コンピュータ20に対するジョブの処理状況に関する情報をジョブ情報テーブル140に格納する処理などを実行する。
障害管理モジュールは、管理コンピュータ10の障害を検知すると管理コンピュータ10の再起動の処理および処理要求から作成された一連のジョブプログラムを復旧する処理を実行する。
次にジョブプログラムID管理テーブル130の構成について説明する。図6は本実施例のジョブプログラムID管理テーブル130の構成である。
ジョブプログラムID管理テーブル130は利用者端末30に入力された処理要求に対応する一連のジョブプログラムの情報を記憶するテーブルである。ジョブプログラムは、個々の処理コンピュータ20に演算させる処理の単位である。ジョブプログラムID管理テーブル130は、管理コンピュータ10にある。各利用者端末30はそれぞれ端末ジョブプログラム管理テーブル160を有する。なお、本実施例では、利用者端末30の端末ジョブプログラム管理テーブル160は、利用者端末30に入力された処理要求に関する情報のみを格納する。一方、管理コンピュータ10のジョブプログラムID管理テーブル130は、各利用者端末30から受信した処理要求に関する情報を格納される。
管理コンピュータ10にジョブプログラムID管理テーブル130が格納され、利用者端末30に端末ジョブプログラム管理テーブル160が格納されることにより、一方のテーブルが失われても他方のテーブルによって復旧することが可能となる。例えば、利用者端末30のジョブプログラムID管理テーブル130は管理コンピュータ10の復旧の処理時に使用する。一方、管理コンピュータ10のジョブプログラムID管理テーブル130は利用者端末30の復旧の処理時に使用する。
ジョブプログラムID管理テーブル130は、ジョブプログラム名情報131、ジョブプログラムID情報132、ジョブプログラム保存場所情報133、ジョブの演算処理の結果に関する再現性の可否情報134、および管理コンピュータ10の識別番号情報135を有する。
ジョブプログラム名情報131はジョブプログラムを識別するための名前情報である。ジョブプログラムID情報132はジョブプログラムを実行するときにジョブ毎に付される識別番号である。ジョブプログラムの保存場所情報133は、ジョブプログラムが格納されている利用者端末30の場所を到底するための情報である。ジョブプログラムは管理コンピュータ10のメモリ12上および利用者端末30の記憶部33に格納される。
再現性の可否情報134は、処理コンピュータ20がジョブプログラムの演算処理をした時に処理結果の再現の可否を示す情報である。再現性の可否の基準は、処理コンピュータ20が同じジョブプログラムを実行した場合、ジョブプログラムの処理結果が同じ結果となるときに再現性が有るとし、ジョブプログラムの処理結果が同じ結果となるとは限らないときに再現性が無いとする。ジョブプログラムには種々の種類がある。例えば、与えられたパラメータと演算プログラムから演算結果を算出するジョブ、乱数を使用するジョブ、複数のジョブの処理結果をまとめるジョブ、ジョブの結果から複数の新たなジョブを生成するジョブ等がある。したがって、演算結果が同一になるジョブと演算結果が同一となるとは限らないジョブとがある。
管理コンピュータ10の識別子情報は、管理コンピュータ10が複数ある場合に管理コンピュータ10を特定するための識別番号である。管理コンピュータ10の識別子情報は予め管理コンピュータ10に付されている。管理コンピュータ10の識別子情報は、管理コンピュータ10に異常があった場合、管理コンピュータ10の復旧のために使用する。
次に、ジョブ情報テーブル140の構成について説明する。図7は本実施例のジョブ情報テーブル140の構成例である。管理コンピュータ10がジョブ情報テーブル140を有する。ジョブ情報テーブル140は個々のジョブプログラムの状態を記憶するテーブルである。
ジョブ情報テーブル140は、ジョブID情報141、ジョブの処理内容情報142、処理コンピュータ情報143、ジョブの処理状況情報144、ジョブのリンク情報145、ジョブの優先度情報146、ジョブの処理結果情報147を有する。
ジョブID情報141は、利用者端末30で分割されたジョブプログラム毎に付加される識別番号である。管理コンピュータ10がジョブを処理コンピュータ20に実行させる時に付加する。
ジョブの処理内容情報142は、ジョブプログラムを実行するときに読出すモジュールに関する情報である。例えば、ジョブの演算処理に使用するライブラリ関数などの情報が格納される。
処理コンピュータ情報143は、ジョブプログラムを処理する処理コンピュータ20の情報である。管理コンピュータは予め各処理コンピュータ20の処理性能を把握する。ジョブの演算を処理コンピュータ20に依頼するときは、各処理コンピュータ20の処理性能に応じて分配する。例えば、管理コンピュータ10はジョブの演算の依頼を送信するときに分散処理システム1内でジョブの処理結果を得る間での時間が最も短いと予測される処理コンピュータ20に対してジョブの演算依頼を送信する。
ジョブの処理状況情報144は、管理コンピュータ10が把握する最新のジョブの処理の状況である。例えば、処理状況情報144はジョブの依頼日時情報、ジョブの演算の依頼を送信してからの経過時間情報、ジョブの演算結果の取得日時情報が格納される。ジョブのリンク情報145は、他のジョブプログラムとの間の関係が格納される。例えば、ジョブのリンク情報145は前後のジョブのジョブIDが格納される。ジョブの優先度情報146は、ジョブ処理の優先度情報が格納される。優先度情報は、先に演算すべきジョブか否かによって分類される。例えば、利用者端末に処理要求を入力したときに、利用者が各ジョブプログラムの優先度情報も登録する。優先度が高いジョブは、例えば、ジョブの処理結果を他のジョブが使用するようなジョブである。
ジョブの処理結果情報147は、ジョブの演算処理の結果のデータである。処理コンピュータ20はジョブの演算処理の結果を管理コンピュータ10に送信する。管理コンピュータは該当するジョブ情報テーブル140のレコードに処理結果を格納する。
次に、処理コンピュータ20の機能構成について説明する。図8は、本実施例の処理コンピュータ20の機能ブロック図である。
処理コンピュータ20は、ジョブ処理モジュール211および障害復旧モジュール212の機能を有する。
また、処理コンピュータ20は、処理結果テーブル150を有する。処理結果テーブル150は本実施例では処理コンピュータ20の記憶部23上に格納される。
ジョブ処理モジュール211はジョブを処理する。ジョブ処理モジュール111は、管理コンピュータ10から送信されたジョブの処理依頼情報を演算する処理、ジョブの演算処理の結果情報を管理コンピュータ10に送信する処理、処理結果をジョブの処理依頼情報と関連付けて処理結果テーブル150に格納する処理等を実行する。
障害復旧モジュール212は、管理コンピュータ10の障害を検知すると、指示に応じて処理結果テーブル150の内容を管理コンピュータ10に送信する機能を有する。
ここで処理結果テーブル150について説明する。図9は処理結果テーブル150の構成例である。処理結果テーブル150は、個々の処理コンピュータ20が受信して演算したジョブに関する情報を格納するテーブルである。処理結果テーブル150は、処理コンピュータ20にある。処理結果テーブル150は、ジョブプログラムID情報151、ジョブID情報152、管理コンピュータ識別子情報153、ジョブ開始/終了時間情報154および処理結果情報155を格納する。
ジョブプログラムID情報151はジョブプログラム毎に付される識別番号である。ジョブプログラムID管理テーブル130のジョブプログラムID情報132と同じ情報である。ジョブID情報152はジョブプログラムを実行するときにジョブ毎に付される識別番号である。ジョブプログラムID管理テーブル130のジョブプログラムID情報132と同じ情報である。管理コンピュータ識別子情報153は、管理コンピュータ10が複数ある場合に管理コンピュータ10を特定するための識別番号である。ジョブプログラムID管理テーブル130の管理コンピュータ識別子情報135と同じ情報である。
ジョブ開始/終了時間情報154は、処理コンピュータ20がジョブ情報を受信した日時情報、及び処理コンピュータ20がジョブの演算処理を実行した結果を管理コンピュータ10に送信した日時情報が格納される。処理結果情報155は、ジョブの演算処理の結果の情報が格納される。
次に、利用者端末30の機能構成について説明する。図10は利用者端末30の構成例である。
利用者端末30は、ジョブ分割モジュール311、再現性可否モジュール312、端末管理モジュール313、および障害復旧モジュール314の機能を有する。
ジョブ分割モジュール311は、利用者が入力した処理要求をジョブプログラムに分割する。再現性可否モジュール312は、分割した個々のジョブプログラムの演算処理の再現性の可否を判定する。端末管理モジュール313は、利用者端末30と管理コンピュータ10との間のデータの整合性を確保する機能を有する。例えば端末ジョブプログラム管理テーブル160に格納されたレコードとジョブプログラムID管理テーブル13のレコードとの間のデータの整合性を確保する。
障害復旧モジュール314は、管理コンピュータ10が異常となり、管理コンピュータ10の状態を復旧するときに管理コンピュータ10の復旧の補助のための処理を実行する。例えば、端末ジョブプログラム管理テーブル160に格納されたレコードを管理コンピュータ10に送信する。
また、利用者端末30は、端末ジョブプログラム管理テーブル160を有する。
端末ジョブプログラム管理テーブル160は本実施例では利用者端末30の記憶部33に格納される。
端末ジョブプログラム管理テーブル160は、自己の利用者端末30の処理要求に関するレコードが格納される。なお、端末ジョブプログラム管理テーブル160に格納されるレコードの列項目は、ジョブプログラムID管理テーブル130のレコードのデータ項目列と同じであるため説明を省略する。
次に分散処理システム1における通常時の処理の流れについて説明する。図11は、ジョブ情報登録時の処理のフローチャートである。利用者は分散処理システム1に演算させるための処理要求プログラムを利用者端末30に登録する。本実施例では適当なジョブプログラムに予め分割されている処理要求プログラムが設定されることとする。利用者端末30は処理要求プログラムを取得する(S01)。次に、利用者端末30は処理要求プログラムの個々のジョブプログラムについて、再現性の有無の判定をする(S02)。
ここで、図11のS02において利用者端末30が実行する再現性の判定処理について説明する。図12は再現性の有無の判別処理のフローチャートである。利用者端末30の制御部31は、個々のジョブプログラム毎に再現性の可否を判定する。
まず、利用者端末30の制御部31は、ジョブプログラム内に乱数を使用しているか否かを判別する(S11)。乱数が使用されている場合(S11:Yes)、制御部31は、ジョブプログラムの再現性は無いと判定する。一方、乱数が使用されていない場合(S11:No)、制御部31は、ジョブパラメータに乱数が使用されているか否かを判定する(S12)。ジョブパラメータはジョブに設定する入力値である。
ジョブパラメータに乱数が使用されている場合(S12:Yes)、制御部31は、ジョブプログラムの再現性は無いと判定する。一方、ジョブパラメータに乱数が使用されていない場合(S12:No)、制御部31は、ジョブの処理中に外部データを参照しているか否かを判定する(S13)。外部データは、例えば、他のジョブの演算処理の結果の値である。
制御部31が外部データを参照していないと判定した場合(S13:No)、制御部31は、ジョブの処理結果には再現性があると判定する。一方、外部データを参照していると判定した場合(S13:Yes)、制御部31は外部データが確定された値か否かを判別する。外部データが確定的か否かは、例えば、外部データを出力するジョブの再現性があると判定された場合に外部データが確定されると判定する。
制御部31はジョブの構成の樹形図を利用することにより、外部データを出力するジョブの再現性の情報を取得して判定することが可能である。なお、外部データが確定的か否かについて不明確である場合は、その旨とジョブプログラムとを併せて利用者端末30の出力部35に表示する構成としてもよい。この場合、出力部25に表示されたジョブプログラムが参照する外部データが確定的か否かを利用者が判断して、入力部34に判断結果を入力する。利用者端末30の制御部31は取得した判断結果を登録する。
外部データが確定された値である場合(S14:Yes)、制御部31はジョブの演算処理結果の再現は可能であると判定する。一方、外部データが確定された値でない場合(S14:No)、制御部31はジョブの演算処理結果の再現は不可能であると判定する。制御部31は、再現が可能と判断されたジョブプログラムに再現性有の情報を関連付け(S15)、再現が不明と判断されたジョブプログラムに再現性無の情報を関連付ける(S16)。制御部31は端末ジョブプログラム管理テーブル160の再現可否情報164にS15またはS16で関連付けられた情報を格納する(S17)。
以上によって、利用者端末30の制御部31は、ジョブプログラム毎の再現性の可否情報を取得する。図11のフローチャートの説明に戻る。次に、管理コンピュータ10のジョブプログラムID管理テーブル130と利用者端末30の端末ジョブプログラム管理テーブル160へのデータの登録について説明する。利用者端末30は、ジョブプログラム名情報、再現性の有無の情報、およびジョブプログラム保存場所情報を管理コンピュータ10に送信する(S03)。
管理コンピュータ10は、利用者端末30が送信したジョブプログラム名情報、再現性の有無の情報、およびジョブプログラム保存場所情報を受信する(S04)。管理コンピュータ10は、ジョブプログラム名情報毎にジョブプログラムIDを生成する(S05)。管理コンピュータ10は、ジョブプログラム名情報131、ジョブプログラムID情報132、ジョブプログラム保存場所情報133、再現性の有無の情報134、および管理コンピュータ識別子情報135を管理コンピュータ10のジョブプログラムID管理テーブル130に格納する(S06)。管理コンピュータ10は、S05で付加したジョブプログラムID情報および管理コンピュータ識別子情報を利用者端末30に送信する(S07)。
利用者端末30は、S07で管理コンピュータ10から送信されたジョブプログラムID情報および管理コンピュータ識別子情報等を受信すると(S08)、利用者端末30は、ジョブプログラム名情報161、ジョブプログラムID情報162、ジョブプログラム保存場所情報163、再現性の有無の情報164、および管理コンピュータ識別子情報165を利用者端末30の端末ジョブプログラム管理テーブル160に格納する(S09)。
以上によって、利用者が利用者端末30に入力した処理要求について、管理コンピュータ10のジョブプログラムID管理テーブル130と利用者端末30の端末ジョブプログラム管理テーブル160との間で整合性が保たれる。
次に、管理コンピュータ10と処理コンピュータ20との間で行う分散処理について説明する。図13は、管理コンピュータ10が処理コンピュータ20にジョブを実行させる処理のフローチャートである。管理コンピュータ10はジョブプログラムから処理コンピュータ20に実行させるジョブを生成する(S21)。本実施例でのジョブは、ジョブプログラムに対応する実際に演算を行う対象である。管理コンピュータ10は、生成したジョブ毎にジョブを識別する識別子(ジョブID)を付加する(S22)。また、管理コンピュータ10は、ジョブ情報テーブル140のレコードのジョブID情報141にS21で生成したジョブIDを格納し、リンク情報145にジョブのリンクを格納し、優先度情報146にジョブの優先度を格納する。
管理コンピュータ10は、ジョブの実体情報、ジョブプログラム名、ジョブID、管理コンピュータ識別子、および再現性可否情報を処理コンピュータ20に送信する(S23)。S23で管理コンピュータ10は、ジョブの処理を送信する先の処理コンピュータ20を特定する。管理コンピュータ10は、例えば、以下の手順で処理コンピュータ20を特定する。管理コンピュータ10は予め処理コンピュータ20の処理性能を把握する。管理コンピュータ10は、例えば、処理コンピュータ20の処理能力とジョブプログラムの処理量とを比較して、適当な処理コンピュータ20を特定する。または、管理コンピュータ10は、最も演算時間が短い処理コンピュータ20を検索して特定する。また、管理コンピュータ10はS21で生成したジョブIDの処理を依頼する処理コンピュータを処理コンピュータ情報143に格納する。また管理コンピュータ10は処理を依頼する処理コンピュータ20に応じたジョブの処理内容をジョブの処理内容情報142に格納する。また管理コンピュータ10は、ジョブの処理状況情報144を依頼中としてジョブ情報テーブル140に格納する。
処理コンピュータ20は、管理コンピュータ10が送信したジョブの実体情報、ジョブプログラムID、ジョブID、管理コンピュータ10識別子、および再現性可否情報を受信する(S24)。
処理コンピュータ20は、受信したジョブの演算処理を実行する(S25)。
処理コンピュータ20は、受信した再現性可否情報について判定する(S26)。本実施例では、ジョブの演算処理の結果が再現可能な場合にのみ登録する。本構成により、処理コンピュータ20の記憶部には再現可能なジョブの処理結果のみが格納される。この結果処理コンピュータの記憶部23のジョブの処理結果を記憶する領域は、全てのジョブの処理の結果を記憶する場合に比べて少ない領域で足りる。一方、再現性不可能なジョブの処理結果は、後述の管理コンピュータ10の復旧時に使用しないため、記憶する必要はない。
再現性可否情報が再現性有の場合(S26:Yes)、処理コンピュータ20はジョブの演算処理の結果を処理結果テーブル150に登録する(S27)。具体的には、処理コンピュータ20はS24で受信したジョブプログラム名情報151、S24で受信したジョブID情報152、S24で受信した管理コンピュータ識別子情報153、S25のジョブの演算処理の開始時刻/終了時刻情報154、およびS25のジョブの演算処理の結果情報155をジョブ情報テーブル140に格納する。処理コンピュータ20は、演算処理の結果を管理コンピュータ10に送信する(S28)。
管理コンピュータ10は、処理コンピュータ20からジョブの演算結果を受信すると、ジョブ情報テーブル140のジョブID情報141が合致するレコードにジョブの処理結果情報147を格納する(S29)。また、ジョブ情報テーブル140の管理コンピュータ10は処理状況144を処理完了とする。
管理コンピュータ10は処理要求に対応する全てのジョブプログラムの処理が完了するまで(S30:No)、処理コンピュータ20にジョブの演算処理を行わせる。一方、全てのジョブが完了すると(S30:Yes)、管理コンピュータ10は、各処理コンピュータ20に対してジョブの演算結果の削除依頼をプルグラムIDと共に送信する(S31)。管理コンピュータ10からの削除指示を受けた処理コンピュータ20は、処理結果テーブル150内のプログラムIDが合致するレコードを削除する(S32)。
以上によって、管理コンピュータ10は複数の処理コンピュータ20に対してジョブを実行させ、処理要求に対する処理結果を得ることができる。
次に管理コンピュータ10で障害が発生した場合の分散処理システム1の処理について説明する。管理コンピュータ10で障害が発生すると、メモリ12上のデータが失われる場合がある。図14は、管理コンピュータ10のメモリ12上の処理要求に関するデータを復旧する処理のフローチャートである。
管理コンピュータ10の制御部11は、管理復旧モジュール112を実行する(S41)。
次に管理コンピュータ10の制御部11は管理コンピュータ10の処理に必要な機能を復旧する(S42)。管理コンピュータ10の処理に必要な機能は、例えば、管理コンピュータ10のOSの起動、管理コンピュータ10のネットワーク40識別子の設定などである。次に管理コンピュータ10は、処理要求の復旧を以下の処理によって行う。
本実施例の処理コンピュータ20、利用者端末30、および管理コンピュータ10は予め定めた時間毎に相手の動作を確認する構成であるとする。例えばインターネットで標準的なプロトコルであるTransmission Control Protocol / Internet Protocol(TCP/IPプロトコル)では、指定したIPアドレスがネットワークに接続されているか否かを確認できるPacket INternet Groper(pingコマンド)のような処理を所定時間毎に実行する。処理コンピュータ20あるいは利用者端末30は、管理コンピュータ10がS42の処理によって復旧する間は、管理コンピュータ10をネットワーク40上で検出できない。処理コンピュータ20あるいは利用者端末30は管理コンピュータ10をネットワーク40上に検出できない場合に、管理コンピュータ10に異常が発生したと判定する(S43、S44)。
利用者端末30は管理コンピュータ10に対して、端末ジョブプログラム管理テーブル160に格納された情報を管理コンピュータ10に送信することが可能である旨の情報を所定時間毎に送信する(S45)。なお、S45で情報を管理コンピュータ10に送信する利用者端末30の端末ジョブプログラムテーブル160の管理コンピュータ識別子165の列には、異常が発生した管理コンピュータ10の識別子がある。
処理コンピュータ20は管理コンピュータ10に対して、処理結果テーブル150の処理結果情報を管理コンピュータ10に送信することが可能である旨の情報を所定時間毎に送信する(S46)。なお、S46で情報を管理コンピュータ10に送信する処理コンピュータ20の処理結果テーブル150の管理コンピュータ識別子153の列には、異常が発生した管理コンピュータ10の識別子がある。
管理コンピュータ10は、処理コンピュータ20からの処理結果テーブル150の処理結果情報を管理コンピュータ10に送信することが可能である旨の情報、および利用者端末30からの端末ジョブプログラム管理テーブル160に格納された情報を管理コンピュータ10に送信することが可能である旨の情報を所定の時間受付ける。所定の時間以上の時間が経過した場合、利用者端末30あるいは処理コンピュータ20はネットワーク40上に存在しない可能性が高いためである。所定の時間は、例えば、利用者端末30および処理コンピュータ10がpingコマンドを発行する所定の時間間隔に対応させて設定すれば良い。
管理コンピュータ10は、利用者端末30の管理テーブルに格納された情報を取得可能である旨の情報を各利用者端末30に送信する(S47)。利用者端末30は、利用者端末30の端末ジョブプログラム管理テーブル160に格納された情報を取得可能である旨の情報を管理コンピュータ10から受信すると、利用者端末30の端末ジョブプログラム管理テーブル160に格納された情報を管理コンピュータ10に送信する(S48)。
また、管理コンピュータ10は、処理コンピュータ20の処理結果テーブル150の処理結果情報を取得可能である旨の情報を処理コンピュータ20に送信する(S47)。処理コンピュータ20は、処理コンピュータ20の処理結果テーブル150処理結果情報を取得可能である旨の情報を管理コンピュータ10から受信すると、処理結果情報を管理コンピュータ10に送信する(S49)。
管理コンピュータは、利用者端末30から受信した端末ジョブプログラム管理テーブル160によって、メモリ12上にジョブプログラムID管理テーブル130を構成する(S50)。また、管理コンピュータ10は、処理コンピュータ20から送信された処理結果テーブル150のジョブプログラムID情報151から、ジョブプログラムID管理テーブル130の該当レコードを特定する。
続いて、ジョブの復旧処理について説明する。図15は、管理コンピュータ10のメモリ12上の処理要求に関するデータを復旧する処理のフローチャートの続きである。管理コンピュータ10は、ジョブの先頭から再度処理を実行する。ジョブの先頭から実行するため、通常の処理時と障害発生時との間で分散処理システム1の構成が異なっている場合でも復旧が可能となる。
管理コンピュータ10はジョブプログラムから処理コンピュータ20に実行させるジョブを生成する(S61)。本実施例でのジョブは、ジョブプログラムに対応する実際に演算を行う対象である。管理コンピュータ10は、生成したジョブ毎にジョブIDを付加する(S62)。
次に、管理コンピュータ10は、S62で採番したジョブIDとS49で処理コンピュータ20から受信したジョブIDとを比較する(S63)。管理コンピュータ10は、生成したジョブIDと処理コンピュータ20から取得したジョブIDとが合致するか否かを判定する(S64)。
合致する場合(S64:Yes)、管理コンピュータ10はS49で処理コンピュータ20から取得したジョブIDに対応する処理結果をジョブ情報テーブル140に格納する(S66)。一方、合致しない場合(S64:No)は、管理コンピュータ10は処理コンピュータ20にジョブの処理依頼を送信する(S65)。
処理コンピュータ20は、管理コンピュータ10が送信したジョブの実体情報、ジョブプログラムID、ジョブID、管理コンピュータ10識別子、および再現性可否情報を受信する(S67)。処理コンピュータ20は、受信したジョブの演算処理を実行する(S68)。処理コンピュータ20は、受信した再現性可否情報について判定する(S69)。再現性可否情報が再現性有の場合(S69:Yes)、処理コンピュータ20はジョブの演算処理の結果を処理結果テーブル150に登録する(S70)。処理コンピュータ20は、演算処理の結果を管理コンピュータ10に送信する(S71)。
管理コンピュータ10は、処理コンピュータ20からジョブの演算結果を受信すると、ジョブ情報テーブル140のジョブID情報141が合致するレコードにジョブの処理結果情報147を格納する(S72)。また、ジョブ情報テーブル140の管理コンピュータ10は処理状況144を処理完了とする。
管理コンピュータ10は処理要求に対応する全てのジョブプログラムの処理が完了するまで(S73:No)、処理コンピュータ20にジョブの演算処理を行わせる。一方、全てのジョブが完了すると(S73:Yes)、管理コンピュータ10は、各処理コンピュータ20に対してジョブの演算結果の削除依頼をプルグラムIDと共に送信する(S74)。管理コンピュータ10からの削除指示を受けた処理コンピュータ20は、処理結果テーブル150内のプログラムIDが合致するレコードを削除する(S75)。
以上の処理によって、管理コンピュータ10は、ジョブ処理状態の復旧を行うことが可能となる。
本実施例の分散処理システム1は、ジョブ処理に関する情報を処理コンピュータ20および利用者端末30に保存しておく。管理コンピュータ10の障害の復旧処理時に各処理コンピュータ20にある処理結果テーブルの内容を管理コンピュータ10に転送する。処理コンピュータ20から転送された処理結果があれば、管理コンピュータ10はジョブの処理要求を処理コンピュータ20に出さず、処理コンピュータ20から転送された処理結果を利用する事により、復旧時のジョブ処理を低減する事ができる。その結果、分散処理システム1は効率よくジョブ処理の復旧を行うことが可能となると共に、管理コンピュータ10を冗長構成とすることなく復旧ができる。したがって、分散処理システム1の管理コンピュータ10に要する導入コストおよび運用コストを低減できる。
本実施例の分散処理システム1システム構成図である。 本実施例の管理コンピュータ10のハードウェア構成図である。 本実施例の処理コンピュータ20のハードウェア構成図である。 本実施例の利用者端末30のハードウェア構成図である。 本実施例の管理コンピュータ10の機能構成図である。 本実施例のジョブプログラムID管理テーブル130の構成である。 本実施例のジョブ情報テーブル140の構成例である。 本実施例の処理コンピュータ20の機能ブロック図である。 本実施例の処理結果テーブル150の構成例である。 本実施例の利用者端末30の構成例である。 本実施例のジョブ情報登録時の処理のフローチャートである。 本実施例の再現性の有無の判別処理のフローチャートである。 本実施例の管理コンピュータ10が処理コンピュータ20にジョブを実行させる処理のフローチャートである。 本実施例の管理コンピュータ10のメモリ12上の処理要求に関するデータを復旧する処理のフローチャートである。 本実施例の管理コンピュータ10のメモリ12上の処理要求に関するデータを復旧する処理のフローチャートの続きである。
符号の説明
1 分散処理システム
10 管理コンピュータ
11 制御部
12 メモリ
13 記憶部
14 入力部
15 出力部
16 ネットワークインターフェース部
17 バス
18 管理プログラム
20 処理コンピュータ
21 制御部
22 メモリ
23 記憶部
24 入力部
25 出力部
26 ネットワークインターフェース部
27 バス
28 処理プログラム
30 利用者端末
31 制御部
32 メモリ
33 記憶部
34 入力部
35 出力部
36 ネットワークインターフェース部
37 バス
38 利用者プログラム
40 ネットワーク

Claims (8)

  1. 分散処理の管理をする管理コンピュータから送信された演算の対象を処理コンピュータが演算して、該処理コンピュータが該管理コンピュータに該演算の結果を送信する分散処理を実行させる分散処理プログラムであって、
    該処理コンピュータに、
    該管理コンピュータからの演算の対象を受信するステップ、
    該演算の対象が再度演算した場合に同一の結果となる、該演算の対象の結果を、選択的に記憶するステップ、
    を実行させる分散処理プログラム。
  2. 該管理コンピュータの異常の発生を検出したときに、
    該再度演算した場合に同一の結果となる、該演算の対象の結果を、送信可能である情報を該管理コンピュータに送信するステップ、
    を更に実行させる請求項1に記載の分散処理プログラム。
  3. 該管理コンピュータから該再度演算した場合に同一の結果となる該演算の対象の結果を削除してもよい旨の情報を受信したときに、該再度演算した場合に同一の結果となる、該演算の対象の結果を、削除するステップ、
    を更に実行させる請求項1に記載の分散処理プログラム。
  4. 利用者端末から処理を受信し、該処理を複数の演算の対象に分割し、該演算の対象を処理コンピュータに送信し、該処理コンピュータから該演算の結果を受信する分散処理を管理コンピュータに実行させる分散処理プログラムであって、
    該管理コンピュータに、
    該分割した演算の対象毎に識別子を付加した該演算の対象を該処理コンピュータに送信するステップ、
    分散処理の途中で該管理コンピュータの該分散処理に関する情報が失われた場合に、該演算の対象が再度演算した場合に同一の結果となる、該演算の対象の結果を、該処理コンピュータから受信するステップ、
    を実行させる分散処理プログラム。
  5. 該処理対象の内、再度演算した場合に同一の結果となることが不明な該演算の対象を該処理コンピュータに送信するステップ、
    を更に実行させる請求項4に記載の分散処理プログラム。
  6. 分散処理の分割された演算対象の管理をする管理コンピュータと、該演算対象の処理依頼を受信し、該処理対象を演算し、および演算結果を該管理コンピュータに送信する処理コンピュータとからなる分散処理システムであって、
    該管理コンピュータは、該分割した演算の対象毎に識別子を付加した該演算の対象を該処理コンピュータに送信し、
    該処理コンピュータは、受信した該処理対象の内、再度演算した場合に同一の結果となる、該演算の対象の結果を、選択的に記憶するとともに該処理対象の結果情報を該管理コンピュータに送信し、
    分散処理の途中で該管理コンピュータの該分散処理に関する情報が失われた場合に、該演算の対象が再度演算した場合に同一の結果となる、該演算の対象の結果を、該処理コンピュータから受信することを特徴とする分散処理システム。
  7. 分散処理の管理をする管理コンピュータから送信された演算の対象を処理コンピュータが演算して、該処理コンピュータが該管理コンピュータに該演算の結果を送信する分散処理を実行させる分散処理システムの分散処理方法であって、
    該処理コンピュータが、
    該管理コンピュータからの演算の対象を受信し、
    該演算の対象が再度演算した場合に同一の結果となる、該演算の対象の結果を、選択的に記憶する
    ことを特徴とする分散処理方法。
  8. 該管理コンピュータが該分割した演算の対象毎に識別子を付加した該演算の対象を該処理コンピュータに送信し、
    該処理コンピュータは受信した該処理対象の内、再度演算した場合に同一の結果となる該演算の対象の結果を、選択的に記憶するとともに、該処理対象の結果情報を該管理コンピュータに送信し、
    分散処理の途中で該管理コンピュータの該分散処理に関する情報が失われた場合に、該演算の対象が再度演算した場合に同一の結果となる、該演算の対象の結果を、該処理コンピュータから受信する
    ことを特徴とする請求項7に記載の分散処理方法。
JP2007067426A 2007-03-15 2007-03-15 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法 Expired - Fee Related JP5061671B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007067426A JP5061671B2 (ja) 2007-03-15 2007-03-15 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法
US12/041,156 US8677363B2 (en) 2007-03-15 2008-03-03 Method for managing, tracking and distributing job programs for processing to a plurality of execution computers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007067426A JP5061671B2 (ja) 2007-03-15 2007-03-15 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法

Publications (2)

Publication Number Publication Date
JP2008226177A true JP2008226177A (ja) 2008-09-25
JP5061671B2 JP5061671B2 (ja) 2012-10-31

Family

ID=39763983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007067426A Expired - Fee Related JP5061671B2 (ja) 2007-03-15 2007-03-15 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法

Country Status (2)

Country Link
US (1) US8677363B2 (ja)
JP (1) JP5061671B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028739A (ja) * 2016-08-15 2018-02-22 富士通株式会社 情報処理装置、情報処理システム、情報処理方法、およびプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4939588B2 (ja) * 2009-10-30 2012-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション クラウド・コンピューティングにおいて、コンピューティング・サービスを法的監査要件が満たされるように個々のジョブに分割し、個々のジョブの分散実行計画をユーザに提示するための方法、コンピュータ・プログラム及び装置
US10996865B2 (en) * 2016-04-06 2021-05-04 Nvidia Corporation Application-specific memory scaling in multi-device systems
US11036541B2 (en) * 2017-09-19 2021-06-15 Microsoft Technology Licensing, Llc Interrupt management for a hypervisor

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110895A (ja) * 1994-08-19 1996-04-30 Fujitsu Ltd 分散システムに使用されるノード装置及び記憶装置並びに分散システムにおける資源管理用サーバの復旧方法
JP2004127309A (ja) * 2003-11-04 2004-04-22 Hitachi Ltd 計算機システムの運用管理方法
JP2005004676A (ja) * 2003-06-16 2005-01-06 Fujitsu Ltd 適応型分散処理システム
JP2006085428A (ja) * 2004-09-16 2006-03-30 Nec Corp 並列処理システム、インタコネクションネットワーク、ノード及びネットワーク制御プログラム
JP2007018407A (ja) * 2005-07-11 2007-01-25 Hitachi Ltd データ複製システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69231054T2 (de) * 1991-11-21 2001-01-18 Sony Corp Bildverarbeitungssystem
JPH11134235A (ja) * 1997-10-31 1999-05-21 Hitachi Ltd 外部記憶装置故障時の回復支援方法
WO2001080028A1 (en) * 2000-04-18 2001-10-25 Web Wombat Pty Ltd Retrieving and processing stored information using a distributed network of remote computers
JP4475614B2 (ja) * 2000-04-28 2010-06-09 大正製薬株式会社 並列処理方法におけるジョブの割り当て方法および並列処理方法
KR100484144B1 (ko) * 2002-06-20 2005-04-18 삼성전자주식회사 원격 관리 서버 및 원격 관리 방법
JP2004046658A (ja) * 2002-07-15 2004-02-12 Hitachi Ltd データ転送方法
WO2004086246A1 (ja) * 2003-03-24 2004-10-07 Fujitsu Limited 分散処理制御装置、分散処理制御方法および分散処理制御プログラム
CN100440153C (zh) * 2004-09-17 2008-12-03 松下电器产业株式会社 处理器
US7881957B1 (en) * 2004-11-16 2011-02-01 Amazon Technologies, Inc. Identifying tasks for task performers based on task subscriptions
JP3942617B2 (ja) * 2005-02-10 2007-07-11 株式会社日立製作所 分散処理システムの計算機資源管理方法
US7707451B2 (en) * 2005-06-28 2010-04-27 Alcatel-Lucent Usa Inc. Methods and devices for recovering from initialization failures
US7398361B2 (en) * 2005-08-30 2008-07-08 P.A. Semi, Inc. Combined buffer for snoop, store merging, load miss, and writeback operations
JP4711824B2 (ja) * 2005-12-26 2011-06-29 富士通株式会社 業務管理者端末、環境管理局端末、ネットワーク事業者端末、業務遂行者端末、業務管理者端末の制御方法、環境管理局端末の制御方法、ネットワーク事業者端末の制御方法および業務遂行者プログラム
JP4611922B2 (ja) * 2006-03-28 2011-01-12 富士通株式会社 制御プログラム、制御方法および制御装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110895A (ja) * 1994-08-19 1996-04-30 Fujitsu Ltd 分散システムに使用されるノード装置及び記憶装置並びに分散システムにおける資源管理用サーバの復旧方法
JP2005004676A (ja) * 2003-06-16 2005-01-06 Fujitsu Ltd 適応型分散処理システム
JP2004127309A (ja) * 2003-11-04 2004-04-22 Hitachi Ltd 計算機システムの運用管理方法
JP2006085428A (ja) * 2004-09-16 2006-03-30 Nec Corp 並列処理システム、インタコネクションネットワーク、ノード及びネットワーク制御プログラム
JP2007018407A (ja) * 2005-07-11 2007-01-25 Hitachi Ltd データ複製システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028739A (ja) * 2016-08-15 2018-02-22 富士通株式会社 情報処理装置、情報処理システム、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP5061671B2 (ja) 2012-10-31
US20080229315A1 (en) 2008-09-18
US8677363B2 (en) 2014-03-18

Similar Documents

Publication Publication Date Title
CN106528224B (zh) 一种Docker容器的内容更新方法、服务器及系统
JP4354233B2 (ja) バックアップシステム及び方法
WO2015140927A1 (ja) データ転送監視システム、データ転送監視方法、および拠点システム
JP2009288836A (ja) 仮想サーバのシステム障害回復方法及びそのシステム
CN106790131B (zh) 一种参数修改方法、装置及分布式平台
JP6870466B2 (ja) 制御プログラム、制御方法、制御装置、及びデータベースサーバ
JP4141875B2 (ja) リカバリ処理方法及びその実施システム並びにその処理プログラム
WO2018109825A1 (ja) バージョン管理システムおよびバージョン管理方法
CN110633168A (zh) 一种分布式存储系统的数据备份方法和系统
JP2017129935A (ja) サーバシステム、サーバシステムを制御する方法およびプログラム。
JP2007241803A (ja) セキュリティ管理プログラム、セキュリティ管理装置、およびセキュリティ管理方法
JP5061671B2 (ja) 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法
JP3857259B2 (ja) オブジェクト状態転送方法,オブジェクト状態転送装置およびオブジェクト状態転送プログラム並びにそのプログラムの記録媒体
JP2003248607A (ja) バックアップシステム、バックアップ用プログラムおよびバックアップ方法
CN110619022A (zh) 基于区块链网络的节点检测方法、装置、设备及存储介质
JP2009080705A (ja) 仮想計算機システム及び同システムにおける仮想計算機復元方法
US6966014B2 (en) Method for system obstacle correspondence support
CN111880969B (zh) 存储节点恢复方法、装置、设备和存储介质
CN111226200B (zh) 为分布式应用创建一致性快照的方法、装置和分布式系统
JP4600324B2 (ja) ポリシー管理システム、ポリシーマネージャ、ポリシーエージェント、ルール生成方法及びプログラム
JP6816511B2 (ja) セッション管理プログラム、セッション管理方法、情報処理装置、及び情報処理システム
JP5353891B2 (ja) 分散処理システム、分散処理方法およびプログラム
CN113127261A (zh) 文件处理方法、装置、设备及存储介质
JP6812732B2 (ja) 情報処理システム、情報処理装置およびプログラム
JP7367400B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120723

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees