JP3857409B2

JP3857409B2 - 分散処理システム、分散処理方法及び分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number: JP3857409B2
Application number: JP06654998A
Authority: JP
Inventors: 康秀石原; 洋司谷中
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1998-03-17
Filing date: 1998-03-17
Publication date: 2006-12-13
Anticipated expiration: 2018-03-17
Also published as: US6560631B1; JPH11265359A

Description

【０００１】
【発明の属する技術分野】
本発明は分散処理システム、分散処理方法及び分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体に関し、特にデータを複数の計算機で分散して解析する分散処理システム、分散処理方法及び分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【０００２】
【従来の技術】
科学技術分野などでは、大量のデータに対し、様々な較正処理及び解析処理を行い、研究を推進している。多くの研究機関では、計算機センター内に多くの計算機を有し、高速なネットワークで接続された分散システム環境を構築している。
【０００３】
このような研究機関の研究者は、解析処理を実行する場合、解析処理の手順を決め、入力するデータ名、出力データ名、処理エンジン（処理プログラム）名を指示する。従来、このデータ名、処理エンジン名、解析処理手順名は、ファイルシステム上のフルパス等により指定し、処理を実行していた。
【０００４】
【発明が解決しようとする課題】
しかし、この場合、各計算機のシステム構成が同じであるとは限らないため、計算機毎にデータ名等の指定を変更する必要があった。そのため、分散システム環境内の可搬性が保証されていなかった。すなわち、ある計算機で行った解析処理手順データを用いて、他の計算機で解析処理を実行しようにも、入力すべきデータの指定等を変更しなければ解析処理を実行できなかった。
【０００５】
分散システム環境内の可搬性が保証されていないと、処理エンジンが存在しない場合や磁気ディスク装置のデータ領域が不足した場合に、利用可能な計算機にデータ及び解析処理の手順を転送し、継続して実行することが困難となる。
【０００６】
また、各研究者が個別にデータ管理を行っていため、分散システム環境内で同じデータを一意に認識することができず、不要なデータ転送が発生していた。その結果、１台の計算機内に同一のデータ複製が複数存在し、計算機リソースを無駄にしていた。
【０００７】
更に、研究者は入力する画像データ、処理途中の中間データ、解析結果データ及び解析処理の手順などを個人の環境若しくは計算機の一時領域に配置して、利用及び管理を行っている。そのため、研究者の各種情報は、システム内に分散してしまい、管理が困難となる場合がある。また、同じような情報が存在することにより、混乱が発生し、不要な中間データなどを消すことができず、計算機リソースを無駄に消費する場合が多かった。
【０００８】
本発明はこのような点に鑑みてなされたものであり、複数の計算機に格納された情報を、システム内で統一して管理できる分散処理システムを提供することを目的とする。
【０００９】
また、本発明の別の目的は、複数の計算機に格納された情報をシステム内で統一して管理するための分散処理方法を提供することである。
また、本発明の他の目的は、複数の計算機に格納された情報を、コンピュータシステム内で統一して管理させるための分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することである。
【００１０】
【課題を解決するための手段】
図１は、本発明の原理構成図である。本発明では上記課題を解決するために、データを複数の計算機で分散して解析する分散処理システムであって、解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、前記管理簿テーブルに登録された各データまたは処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータまたは処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータまたは処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルと、解析処理実行のために計算機に転送され一時的に保持されているデータまたは処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルと、前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記管理簿テーブルと前記キャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの実際の格納先である計算機を元に前記倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる解析処理実行手段と、を備えることを特徴とする分散処理システムが提供される。
【００１１】
このような分散処理システムによれば、解析処理手順データに従った解析処理の解析処理要求が入力されると、必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択され、選択された解析処理実行計算機に解析処理を実行するための作業領域とするディレクトリが新たに生成され、データおよび処理プログラムへのアクセスを可能とするリンク情報が作業領域内に登録され、解析処理手順データで示される解析処理手順に従った解析処理が実行され、作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データが、システム内で一意に識別するための情報名を付けて出力されると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機が新たに選択され、以後の処理が新たに選択された計算機で実行される。
【００１２】
また、上記課題を解決するために、データを複数の計算機で分散して解析する分散処理方法であって、コンピュータが、解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、解析処理実行のために計算機に転送され一時的に保持されているデータおよび処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの格納先である計算機を元に、前記管理簿テーブルに登録された各データおよび処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータおよび処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる解析処理実行ステップ、を実行することを特徴とする分散処理方法が提供される。
このような分散処理方法によれば、解析処理手順データに従った解析処理の解析処理要求が入力されると、必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択され、選択された解析処理実行計算機に解析処理を実行するための作業領域とするディレクトリが新たに生成され、データおよび処理プログラムへのアクセスを可能とするリンク情報が作業領域内に登録され、解析処理手順データで示される解析処理手順に従った解析処理が実行され、作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データが、システム内で一意に識別するための情報名を付けて出力されると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機が新たに選択され、以後の処理が新たに選択された計算機で実行される。
【００１３】
また、本発明は上記課題を解決するために、データを複数の計算機で分散して解析する分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体であって、コンピュータに、解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、解析処理実行のために計算機に転送され一時的に保持されているデータおよび処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの格納先である計算機を元に、前記管理簿テーブルに登録された各データおよび処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータおよび処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる処理、を実行させる分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体が提供される。
この記録媒体に格納された分散処理プログラムをコンピュータに実行させれば、上記本発明の分散処理システムの機能がコンピュータ上に構築される。
【００１４】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
図１は、本発明の原理構成図である。データを解析処理するための複数の計算機１が設けられている。各計算機１には、複数の処理プログラム１ａと複数のデータ１ｂとが格納されている。
【００１５】
管理簿保持手段２は、管理簿２ａを保持している。管理簿２ａには、解析処理に必要となる情報（データ、解析処理手順データ、及び処理プログラム）をシステム内で一意に識別するための情報名と、各情報の実際の格納先（格納計算機名）との対応関係が登録されている。
【００１６】
解析処理実行手段３は、情報名によって必要な情報を特定した解析処理要求を受け取ると、まず作業領域４を生成する。そして、管理簿保持手段２内の管理簿２ａにより必要な情報の実際の格納先を認識し、実際の情報へのアクセスを可能とするリンク情報４ａ，４ｂを作業領域４内に登録する。このリンク情報４ａ，４ｂは、虚像であり実際の情報の内容は作業領域内には存在していない。そして、作業領域４内のリンク情報を介して実際の情報にアクセスすることで、解析処理を実行する。この際、解析処理の途中で生成される中間データ４ｃは、作業領域４内に保存する。
【００１７】
このような分散処理システムによれば、各情報に対して、システム内で一意に識別可能な情報名が付与されているため、その情報名を指定した解析処理要求を入力すれば、解析処理実行手段３が目的の解析処理を実行する。そのため、利用者は、実際の情報がどの計算機に格納されているのかを意識する必要がない。従って、どの計算機で解析処理を実行する場合にも、解析処理要求の内容は同じである。
【００１８】
しかも、解析処理実行手段３は、解析処理を実行するための作業領域４を生成し、解析処理に関係する情報の管理を作業領域４内だけで行うため、実行した解析処理に関する情報と他の情報とが混じり合うことがない。そのため、実行した解析処理の情報が不要になれば、作業領域ごと削除すればよい。
【００１９】
以下に、本発明を天体観測システムに適用した場合を例にとり、本発明の実施の形態を説明する。
図２は、天体観測システムを示す図である。この例では、天体望遠鏡１１が山頂に設置されている。この天体望遠鏡１１は、ＣＣＤ(Charge Coupled Device) により星などの天体の画像データを取得する。天体望遠鏡１１は、ふもとのコンピュータシステム１００に接続されている。そして、天体望遠鏡が観測した天体の画像データは、コンピュータシステム１００に送られる。
【００２０】
天体望遠鏡１１から送られた画像データ１１０は、コンピュータシステム１００内に格納される。画像データ１１０は、処理の対象となる観測データとなったり、標準較正データ作成のための生較正データであったりする。
【００２１】
解析処理手順エディタ１２０は、端末装置（図示せず）からの指令に基づいて解析処理指令を実行コントローラ１７４に出力するとともに、解析処理手順データ１４０を生成する。解析処理手順データ１４０には、解析処理を実行した順番やその解析処理に用いた処理エンジン（処理プログラム）１３０、解析に用いた画像データ１１０、中間データ１５０、及び解析結果データ１６０に関する情報が登録されている。
【００２２】
処理エンジン１３０は、処理内容毎に設けられた処理プログラムである。
実行コントローラ１７４は、解析処理手順エディタ１２０からの指示により、必要な入力データと解析処理手順が指定されると、指定された処理エンジン１３０と画像データ１１０を取得し、指定された内容の解析処理を実行する。処理の結果、中間データ１５０や解析結果データ１６０が生成される。
【００２３】
図３は、コンピュータシステムの構成を示す図である。コンピュータシステム１００は、複数の計算機１０１で構成されている。計算機１０１には、ベクタープロセッサやスカラープロセッサなどがある。この計算機１０１には、高速のネットワーク１０３を介して複数の端末装置１０２が接続されている。端末装置１０２は、ワークステーションやパーソナルコンピュータである。ユーザは、端末装置１０２を操作することにより、天体望遠鏡１１の動作を指令したり、観測データの解析処理の指示を出すことができる。
【００２４】
天体観測システムのような超高速処理を必要とするシステムでは、数十台のコンピュータで構成されることがほとんどである。そのため、画像データ１１０、中間データ１５０、処理エンジン１３０などが個別の計算機に分散される。
【００２５】
以下に、解析処理の手順、及びその手順の内容をデータ化した解析処理手順データの内容について説明する。なお、以下の説明中の観測データと生較正データが、前述の画像データ１１０に相当し、何らかの処理（較正処理や、標準較正データ作成処理）を行った後の処理済データが前述の中間データ１５０に相当する。
【００２６】
図４は、解析処理手順の概念図である。ここでは、観測データ１１１に「較正処理Ａ」、「較正処理Ｂ」、「較正処理Ｃ」の計３回の較正処理を施すことにより、解析結果データ１６１が得られるものとする。
【００２７】
観測データ１１１に較正処理Ａを施すには、較正処理Ａ用標準較正データ１５１が用いられる。較正処理Ａの結果、較正処理Ａ済データ１５２が得られる。更に、較正処理Ｂ用標準較正データ１５３を用いて、較正処理Ａ済データ１５２に較正処理Ｂを施す。その結果、較正処理ＡＢ済データ１５４が得られる。同様に、較正処理Ｃ用標準較正データ１５５を用いて、較正処理ＡＢ済データ１５４に較正処理Ｃを施す。その結果、解析結果データ１６１が得られる。
【００２８】
一方、各較正処理用の標準較正データを得るためにも、所定の解析処理が必要である。較正処理Ａ用標準較正データ１５１を得るには、複数の生較正データ１１２に対して較正処理Ａ用標準較正データ作成処理を施す。較正処理Ｂ用標準較正データ１５３を得るには、複数のＡ済較正データ１５６に対して較正処理Ｂ用標準較正データ作成処理を施す。較正処理Ｃ用標準較正データ１５５を得るには、複数のＡＢ済較正データ１５７に対して較正処理Ｃ用標準較正データ作成処理を施す。
【００２９】
なお、Ａ済較正データ１５６とＡＢ済較正データ１５７との作成にも、同様の解析処理が必要である。そのため、一連の解析処理は、３次元空間を用いて表現する事ができる。
【００３０】
図５は、３次元構造テーブルで表現された解析処理手順を示す図である。この例では、ｘ−ｙ−ｚの３次元構造テーブルになっており、ｘ軸に同一種別内のデータ順を、ｙ軸にデータ種別を、ｚ軸に処理レベル（段）を取っている。ここで処理レベルとは、較正処理や、標準較正データ作成処理などの解析処置が行われた回数である。データ種別では、観測データが１つの種別であり、また、各較正処理（較正処理Ａや較正処理Ｂなど）を行うために用いられるデータ群（生較正データや標準較正データなど）が１つの種別である。同一種別内のデータ順は、各処理レベルにおける各データ種別ごとのデータを一列に並べた場合の各データの順番である。
【００３１】
このような多次元構造テーブル上に全てのデータを配置させることにより、解析処理手順データ内で、各種データの関係が把握される。ところが、解析処理に必要なデータや処理エンジンが、複数の計算機に分散して格納されていると、従来技術で説明したような問題が生じる。
【００３２】
ここで、情報が分散されることによる従来技術の問題点を考察する。従来は、各計算機に格納されたデータは、それぞれの計算機のノード名、ファイルパス、及びファイル名により特定されていた。そのため、同じファイルパス、及びファイル名のデータが複数の計算機に個別に存在することが許されていた。また、データを保存する際に、ファイルパスやファイル名などを研究者が個別に考えていたため、統一されたデータ管理が難しくなっていた。
【００３３】
従って、データを格納している計算機の情報を含まない情報でアクセスできるようにすることで、従来技術の問題点を解決をできる。ただし、分散システム環境で一意に認識できるデータ名称と、その名称と実体との対応付けを行う枠組みが必要となる。
【００３４】
そこで、分散システム環境で一意に認識できるデータ名称として、処理に関連する情報の命名定義を定める。本実施の形態では、各データ及び処理エンジンが分散システム内でユニークとなるように、以下のような命名規則を定義する。
【００３５】
解析処理結果データ（解析処理手順の頂点）は、「******.usr.grp」で表す。ここで、「******」は、利用者が自由に設定可能な名称である。これは、利用者毎にユニークであればよい（以下同様）。「usr 」は、そのデータを作成した利用者のユーザ名を表し、「grp 」は、そのデータを作成した利用者の属するグループ名を表す（以下、同様）。
【００３６】
解析処理手順名は、「******.usr.grp.cube 」で表す。中間データ（解析処理手順内の中間データ）は、「******.usr.grp.x-y-z」で表す。ここで、「x-y-z 」は、解析処理手順を３次元空間で表現した際の中間データの座標である。
【００３７】
処理エンジン名は、「******.usr.grp.engine.version 」。ここで、「engine」は、エンジン名を示し、「version 」は、そのプログラムの版数を示す。
画像データ名は、「フレームＩＤ.usr.grp」で表す。「フレームＩＤ」は、天体望遠鏡１１で観測された各画像に付けられた識別子である。
【００３８】
「キャッシュデータ名」は、キャッシュ元のデータ名と同じ名前を使用する。なお、キャッシュデータは、作業領域を作成した計算機上でデータが存在しない場合に、処理を実行する計算機へ転送されたデータである。このキャッシュデータは、一定の期間保持され、その後削除される。このキャッシュデータは、実行制御部で管理され、各利用者が利用できる。このように、キャッシュデータを共用可能とすることにより、ネットワーク上のデータ転送が少なくなる。
【００３９】
以上のような命名規則を設けることで、複数の計算機にデータが分散していても、それらのデータを一意に識別することができる。なお、解析処理手順エディタ１２０（図２に示す）により作成される解析処理手順データの内容も、上記命名規則に従った名前で各種データが特定される。
【００４０】
以下に、解析処理手順データの内容について説明する。
図６、図７は、解析処理手順データの例を示す図である。解析処理手順データには、まず解析処理手順データ自身の情報が登録されている。
【００４１】
「name」は、解析処理手順データの名称を指名している。この名称は、分散システムで一意に識別可能な名称である。
「status」は、解析処理手順の状態を示している。「DSave 」は保存されていることを示し、「DEdit 」は更新若しくは新規作成の状態を示し、「DExec 」は解析処理を実行中であることを示している。
【００４２】
「owner 」は、解析処理手順データの所有者名を示している。
「group 」は、解析処理手順データの所有者が属するグループ名を示している。
【００４３】
「create＿date」は、作成日時を示している。
「permission」は、所有者、グループのメンバ、全ユーザのそれぞれに対する操作の権限を示している。権限は「−」、「ｒ」、「ｗ」、「ｘ」の４文字のいずれかの文字を９文字並べることで指定している。９つの文字は、左から順番に以下のような意味を有している。
【００４４】
１番目の文字は、所有者に対する参照権限の有無を示しており、ここが「ｒ」であれば参照権限が有り、「−」であれば参照権限がない。
２番目の文字は、所有者に対する書き込み権限の有無を示しており、ここが「ｗ」であれば書き込み権限が有り、「−」であれば書き込み権限がない。
【００４５】
３番目の文字は、所有者に対する実行権限の有無を示しており、ここが「ｘ」であれば実行権限が有り、「−」であれば実行権限がない。
４番目の文字は、グループのメンバに対する参照権限の有無を示しており、ここが「ｒ」であれば参照権限が有り、「−」であれば参照権限がない。
【００４６】
５番目の文字は、グループのメンバに対する書き込み権限の有無を示しており、ここが「ｗ」であれば書き込み権限が有り、「−」であれば書き込み権限がない。
【００４７】
６番目の文字は、グループのメンバに対する実行権限の有無を示しており、ここが「ｘ」であれば実行権限が有り、「−」であれば実行権限がない。
７番目の文字は、全ユーザに対する参照権限の有無を示しており、ここが「ｒ」であれば参照権限が有り、「−」であれば参照権限がない。
【００４８】
８番目の文字は、全ユーザに対する書き込み権限の有無を示しており、ここが「ｗ」であれば書き込み権限が有り、「−」であれば書き込み権限がない。
９番目の文字は、全ユーザに対する実行権限の有無を示しており、ここが「ｘ」であれば実行権限が有り、「−」であれば実行権限がない。
【００４９】
図の例では、解析処理手順データの所有者である「ｄａｓｈ１」に対しては、参照、書き込み、及び実行の権限が与えられているが、その以外の者に対しては如何なる権限も与えられていない。
【００５０】
「abstract」は、解析処理の概要を示している。
「obe 」は、観測装置名を示している。
「filter」は、観測にあたって使用したフィルタ名を示している。
【００５１】
「frame 」は、解析処理後に作成されるデータの種別を示している。
「current ＿step」は、現在の解析処理の段を示している。解析処理の段は、解析処理に必要なデータを管理する３次元テーブルの高さ方向の単位である。なにも処理していないデータの段を「０」として、１つめの処理エンジンで処理された結果として得られるデータの段を１と数える。また、現在の段数は、その解析処理手順の処理が済んだ段が示されている。
【００５２】
「row ＿num 」は、解析処理で使用するデータの種別数を示している。
「irow＿ind 」は、データの種別のインデックス番号を示している。
「step＿num 」は、解析処理手順の段数を示している。
【００５３】
「engine＿num 」は、解析処理の処理プログラム数を示している。
「imagedata＿name」は、解析処理の結果作成されるデータ名を示している。
「engine＿name0 」は、１つめの処理エンジン名とその引数を示している。
【００５４】
「engine＿attr0 」は、１つめの処理エンジンの種別とその入力ファイル数、出力ファイル数を示している。プログラムの種別には、「Create」と「Apply 」とがある。「Create」は、複数（１以上の自然数）の入力データから複数（１以上の自然数）のデータを作成するものである。「Apply 」は、１つのデータに対し複数（１以上の自然数）のデータを作用させ、１つのデータを作成するものである。
【００５５】
入出力データ数は次の定義に従う。入力データ数は１以上の自然数であるが、Ｎとした場合には、入力データ数は不定となる。同様に、出力データ数は１以上の自然数であるが、Ｎとした場合には、入力データ数は不定となる。
【００５６】
「engine＿name1 」は、２つめの処理エンジン名とその引数を示している。
「engine＿attr1 」は、２つめの処理エンジンの種別とその入力ファイル数、出力ファイル数を示している。
【００５７】
「engine＿name2 」は、３つめの処理エンジン名とその引数を示している。
「engine＿attr2 」は、３つめの処理エンジンの種別とその入力ファイル数、出力ファイル数を示している。
【００５８】
「engine＿name3 」は、４つめの処理エンジン名とその引数を示している。
「engine＿attr3 」は、４つめの処理エンジンの種別とその入力ファイル数、出力ファイル数を示している。
【００５９】
以下同様に、処理エンジンに関する情報が登録されている。
「data flag 」以降は、処理エンジンの入出力を指示するためのフラグである。このフラグは、各々のデータの該当する処理プログラムの入力を制御するフラグであり、「０」、「１」、「２」の数字が設定される。各数字の意味は次の通りである。「０」は、入力でないことを意味する。「１」は、入力データであることを示す。「２」は、「 Apply 」の場合に、同時に入力される他の「１」のフラグのついたデータに対して作用させるデータである。
【００６０】
「data name 」以降は、本処理で使用されるデータの名前を示している。これらのファイル名で指定されるファイルとフラグにより処理プログラムの実行の際の入出力ファイルが決定する。なお、ここで指定しているデータの名前は、分散システムにおいて一意に識別可能な名前である。
【００６１】
「cube log」以降は、処理エンジンのロギング情報を示している。
このような解析処理手順データを用いて解析処理を実行するための分散処理システムについて、以下に具体的に説明する。
【００６２】
図８は、分散処理システムの機能を示すブロック図である。ＧＵＩ(graphical User Interface)コントローラ１７１は、各端末装置１０２（図３に示す）に設けられており、利用者に対する各種操作画面の表示と、利用者からの入力の受付とを行うための機能を有している。利用者は、この機能を用いて解析処理手順エディタ１２０を起動し、解析処理手順データを作成するとともに、その実行依頼を実行コントローラ１７４へ送る。
【００６３】
管理簿サーバ１７２は、解析処理に必要なデータがどの倉庫サーバ１８１〜１８３に格納されているのかを管理簿テーブル１７２ａにより管理している。管理簿テーブル１７２ａは、解析処理手順データを管理する解析処理手順管理テーブル、処理エンジンを管理する処理エンジンテーブル、及び入力データ（画像データ、中間データ）を管理する入力データテーブルからなる。
【００６４】
図９は、解析処理手順管理テーブルの例を示す図である。解析処理手順管理テーブル１７２ａａには、以下の項目が設けられ、倉庫サーバ１８１〜１８３に登録されている全ての解析処理手順データに関する情報が登録されている。
【００６５】
「name」、「abstract」、「owner 」、「group 」、「create＿date」、「imagedata ＿name」、「obe 」、「frame 」、及び「permission」は、解析処理手順データの説明に示した通りである。
【００６６】
「warehousename 」は、その解析処理手順データが実際に格納されている倉庫サーバ名を示している。
「datatype」は、そのデータの種別を示しており、このテーブル内では、全て解析処理手順データであることを示す名称「PROCEDURE 」が登録されている。
【００６７】
図１０は、処理エンジン管理テーブルの例を示す図である。処理エンジン管理テーブル１７２ａｂには、以下の項目が設けられ、倉庫サーバ１８１〜１８３に格納されている全ての処理エンジンに関する情報が登録されている。
【００６８】
「name」「abstract」、「owner 」、「group 」、「create＿date」、「permission」、「warehousename 」、及び「datatype」については、解析処理手順管理テーブル１７２ａａと同じ内容である。ただし、「datatype」には、処理エンジンであることを示す名称「ＥＮＧＩＮＥ」が登録されている。
【００６９】
「arg 」は、処理エンジンを実行する際に指定する引数を示している。図１１は、入力データ管理テーブルの例を示す図である。入力データ管理テーブル１７２ａｃには、以下の項目が設けられ、倉庫サーバ１８１〜１８３に格納されている全ての入力データに関する情報が登録されている。
【００７０】
「name」、「abstract」、「frame 」、「owner 」、「group 」、「create＿date」、「permission」、「warehousename 」、及び「datatype」については、解析処理手順管理テーブル１７２ａａと同じ内容である。ただし、「datatype」には、入力データであることを示す名称「ＩＭＡＧＥＤＡＴＡ」が登録されている。「procube ＿name」は、そのデータの解析に用いられた解析処理手順データ名を示している。
【００７１】
以上のような管理簿テーブル１７２ａを用いることで、「name」と「warehousename 」との対応付けにより、管理簿サーバ１７２は、実行コントローラ１７４から解析処理手順データの所在確認要求を受けた際に、該当するデータを格納している倉庫サーバ名を応答することができる。
【００７２】
図８に戻り、キャッシュ管理簿サーバ１７３は、キャッシュデータがどの倉庫サーバ１８１〜１８３に格納されているのかをキャッシュ管理簿テーブル１７３ａで管理している。
【００７３】
図１２は、キャッシュ管理簿テーブルの例を示す図である。キャッシュ管理簿テーブル１７３ａには、「name」、「Create＿date」、及び「Warehousename 」の項目が設けられており、各倉庫サーバ１８１〜１８３がキャッシュデータとして保持しているデータの情報が登録されている。
【００７４】
「name」は、キャッシュされたデータの名前である。この名前は、元のデータの名前（分散システムで一意に識別する名前）と同じである。
「Create＿date」は、キャッシュデータが生成された日付である。
【００７５】
「Warehousename 」は、キャッシュデータを保持している倉庫サーバの名称である。
図８に戻り、実行コントローラ１７４は、解析処理の実行要求とともに解析処理手順データ名が入力されると、その解析処理の実行環境を構築する。実行コントローラ１７４が行う処理としては、実行を行うべき倉庫サーバの選択と、選択した倉庫サーバへの処理の依頼等がある。
【００７６】
倉庫サーバ１８１〜１８３は、解析処理に必要な各種データを格納している。倉庫サーバ１８１〜１８３が格納するデータとしては、登録済データ１８１ａ，１８２ａ，１８３ａとキャッシュデータ１８１ｂ，１８２ｂ，１８３ｂとがある。登録済データ１８１ａ，１８２ａ，１８３ａは、解析処理手順データ、画像データ、中間データ、解析結果データ、及び処理エンジンなどである。キャッシュデータ１８１ｂ，１８２ｂ，１８３ｂは、他の倉庫サーバ１８１〜１８３から取得したデータである。
【００７７】
また、倉庫サーバ１８１〜１８３には、倉庫内データ管理テーブル１８１ｃ，１８２ｃ，１８３ｃと倉庫状態テーブル１８１ｄ，１８２ｄ，１８３ｄとが設けられている。
【００７８】
図１３は、倉庫内データ管理テーブルの例を示す図である。倉庫内データ管理テーブル１８１ｃには、「status」、「name」、「abstract」、「owner 」、「group 」、「permission」、「create＿date」、「last＿access＿time」、「caching＿time」、「path」、「arg 」、「obe 」、及び「frame 」の項目が設けられており、登録済データ１８１ａとキャッシュデータ１８１ｂとに関する情報が登録されている。
【００７９】
「name」、「abstract」、「owner 」、「group 」、「permission」、「create＿date」、「arg 」、「obe 」、及び「frame 」については前述の通りである。
【００８０】
「status」は、そのデータの種別を示している。処理エンジンであれば「engine」と設定され、画像データであれば「image 」と設定され、解析処理手順データであれば「procedure 」と設定される。
【００８１】
「last＿access＿time」は、そのデータに最後にアクセスがあった時刻である。「caching＿time」は、キャッシュデータに関して設定され、そのデータがキャッシングされた時刻を示している。
【００８２】
「path」は、そのデータの計算機内での位置がフルパス（ルートディレクトリからのパス）で示されている。
図１４は、倉庫状態テーブルの例を示す図である。倉庫状態テーブル１８１ｄは、「時刻」、「作業領域容量」、「使用状況」、「CPU 負荷」、及び「ネットワーク負荷」の項目が設けられており、その倉庫サーバ１８１の稼働状態に関する情報が登録されている。「時刻」は、その情報を取得した時刻である。「作業領域容量」は、作業領域として使用可能なハードディスク装置の空き容量である。「使用状況」は、作業領域内の使用中の容量を、全体の容量に対する割合で示している。「ＣＰＵ負荷」は、その倉庫サーバ１８１が設けられている計算機の負荷を示している。「ネットワーク負荷」は、その倉庫サーバ１８１が設けられている計算機が他の計算機とデータ通信を行うときの伝送性能に対する負荷を示している。
【００８３】
図８に示した各要素は、ＣＯＲＢＡ(Common Object Request Broker Architecture) のような分散システム環境における共通仕様で互いに情報交換を行っている。また、実行コントローラ１７４から作業領域作成要求を受け取った倉庫サーバは、自己の管理する領域内に作業領域を構築し、作業領域サーバ１８３ｅを起動する。
【００８４】
以下、分散処理システムにおける解析処理の手順を説明する。なお、フローチャートを用いた説明においては、ステップ番号に沿って説明する。
図１５は、解析処理に必要な機能の構築処理を示すフローチャートである。これは、利用者が、ＧＵＩコントローラ１７１を用いて実行コントローラ１７４に対して命令を出すことで、実行コントローラ１７４が実行する処理である。
［Ｓ１］各計算機に設けられている倉庫サーバ１８１〜１８３を起動し、各種データを登録する。以後、倉庫サーバ１８１〜１８３は、登録されたデータを管理する。
［Ｓ２］管理簿サーバ１７２を起動し、全ての倉庫サーバ１８１〜１８３に格納されている情報を登録する。
［Ｓ３］キャッシュ管理簿サーバ１７３を起動する。起動時には、キャッシュデータを０件とする。そして、キャッシュ管理簿サーバ１７３は、全倉庫サーバ１８１〜１８３にキャッシュデータとして格納されているデータの情報を登録し、管理する。
【００８５】
このようにして、解析処理の準備ができたら、利用者は解析処理を実行する。図１６は、解析処理の動作イメージを示す図である。この図を参照しながら、以下のフローチャートを説明する。
【００８６】
図１７は、解析処理の手順を示すフローチャートである。
［Ｓ１１］利用者は、解析処理手順エディタを起動し、解析処理手順を作成する。作成した解析処理手順は、解析処理手順データとしていずれかの倉庫サーバに格納する。
［Ｓ１２］ＧＵＩコントローラ１７１から実行コントローラ１７４に、解析処理手順名を指定して、実行を指示する（図１６のＳ１０１）。
［Ｓ１３］実行コントローラ１７４は、まず、管理簿サーバ１７２に対して指定された解析処理手順がどの倉庫サーバに格納されているのかを問い合わせる。そして、該当する倉庫サーバから解析処理手順を取得する。次に、取得した解析処理手順の内容を解析し、その解析処理に必要な入力データと処理エンジンとの所在を管理簿サーバ１７２に問い合わせる（図１６のＳ１０２）。
【００８７】
管理簿サーバ１７２は、入力データと処理エンジンとが格納されている倉庫サーバを特定するとともに、キャッシュ管理簿サーバ１７３へ、入力データと処理エンジンとの所在を問い合わせる（図１６のＳ１０３）。キャッシュ管理簿サーバ１７３は、該当するデータがいずれかの倉庫サーバにキャッシュされていれば、データがどの倉庫サーバにキャッシングされているのかの情報を応答する。このとき、複数の倉庫サーバにキャッシュされていれば、複数の倉庫サーバの情報を応答することになる。
【００８８】
管理簿サーバ１７２は、キャッシュ管理簿サーバ１７３からの応答を、自身が特定した倉庫サーバの情報に追加し、実行コントローラ１７４に返す。
［Ｓ１４］実行コントローラ１７４は、実行先倉庫を決定する。この処理の詳細は後述する。ここでは、処理に必要な解析処理手順データ１４１、処理エンジン１３１，及び画像データ１１１０が格納されている倉庫サーバ１８３に決定したものとする。
［Ｓ１５］実行コントローラ１７４は、ステップＳ１４において決定した倉庫サーバ１８３に、解析処理手順を実行するための作業領域の作成を依頼する（図１６のＳ１０４）。このとき、各入力データの所在情報も同時に送付する。
［Ｓ１６］作業領域作成依頼を受け取った倉庫サーバは、作業領域を作成可能か否かを判断する。作業領域を作成可能であればステップＳ１７に進み、作業領域を作成できなければステップＳ１４に進む。
［Ｓ１７］倉庫サーバ１８３は、解析処理手順に対応する作業領域として、ディレクトリを作成する。以後、倉庫サーバ１８３が、そのディレクトリの名称とパス名を管理する。また、作成したディレクトリを利用して処理を実行する作業領域サーバ１８３ｅを、倉庫サーバ１８３と同じ計算機内で起動し、初期化する（図１６のＳ１０５）。
［Ｓ１８］倉庫サーバ１８３は、作業領域を準備する。具体的には、まず、倉庫サーバ１８３自身が管理していない入力データ、処理エンジンを、他の倉庫サーバ１８１，１８２へ要求する（図１６のＳ１０６）。必要であれば解析処理手順データも取り寄せる。倉庫サーバ１８１，１８２は、要求に応じてデータを返す（図１６のＳ１０７）。
【００８９】
次に、取り寄せた入力データを、倉庫サーバ１８３内でキャッシュデータ１１２０として保存・管理する（図１６のＳ１０８）。また、キャッシュしたデータの情報をキャッシュ管理簿サーバ１７３に渡す（図１６のＳ１０９）。キャッシュ管理簿サーバ１７３は、倉庫サーバ１８３でキャッシュされたデータ名と倉庫名とを、キャッシュ管理簿に登録する。
【００９０】
更に、倉庫サーバ１８３は、解析処理に必要な入力データや処理エンジンを、ＵＮＩＸのリンクコマンドにより作業領域にリンクする（図１６のＳ１１０）。リンクするときの名称は、分散システム内で一意に識別可能な名称である。リンクされたことにより、作業領域には、処理に必要なデータを指し示すリンク情報１１１ａ，１１２ａ，１１３ａ，１１４ａが存在することになる。
【００９１】
作業領域が準備できたら、実行コントローラ１７４からの作業領域作成依頼の回答として、作業領域サーバの情報を返す（図１６のＳ１１１）。
［Ｓ１９］実行コントローラ１７４は、倉庫サーバ１８３から応答された作業領域サーバ１８３ｃに対して解析処理を依頼する（図１６のＳ１１２）。
［Ｓ２０］作業領域サーバは、作業領域ディレクトリ内の解析処理手順データ１４１ａを読み込み、そのディレクトリ配下の画像データ１１１ａ，１１２ａを使用し、処理エンジン１３１ａにより解析処理を行い中間データ１５１を作成する。更に中間データ１５１を読み込み、処理エンジンにより解析処理を継続する。すべての中間データは、作業領域ディレクトリに解析処理手順で指定された名前で作成され、その名称で利用・参照できる。
【００９２】
図１８は、実行先倉庫決定処理のフローチャートである。この処理は、全て実行コントローラ１７４が行う。
［Ｓ３１］解析処理手順データ１４１を読み込む。
［Ｓ３２］管理簿サーバ１７２の管理簿テーブル１７２ａと、キャッシュ管理簿サーバ１７３のキャッシュ管理簿テーブル１７３ａとを参照し、入力データ及び処理エンジンが存在する倉庫サーバを検索する。
［Ｓ３３］実行可能な倉庫サーバ１８１〜１８３での入力データ保存数を求める。
［Ｓ３４］実行可能な倉庫サーバ１８１〜１８３での処理エンジンの保持数を求める。
［Ｓ３５］以下の条件で実行先倉庫サーバの候補の優先順位を決定する。
・入力データ数が最も多い。
・開始段（処理レベルが０のデータに対して処理を行う）の処理エンジンがある。
・処理エンジンの連続実行の長さが長い。
これらの条件を満たした倉庫サーバを優先的に選択する。
［Ｓ３６］各倉庫サーバの倉庫状態テーブル１８１ｄ、１８２ｄ、１８３ｄを参照し、実行先倉庫の優先順位の高い順に以下の内容を評価し、適合した倉庫サーバを実行先として特定する。
・作業ディスク領域の空き容量が十分にあること。
・ＣＰＵ(Central Processing Unit) の負荷状態を評価し、処理能力に余裕があること。
・ネットワークの負荷状態を評価し、伝送能力に余裕があること。
【００９３】
次に、実行結果の管理処理について説明する。
図１９は、実行結果の管理処理のフローチャートである。
［Ｓ４１］処理を実行した後の解析結果データ若しくは、中間データを参照する。それには、解析処理手順エディタ１２０に解析処理手順データ１４１を取り込み、解析処理手順エディタ１２０から中間データ１５１を指定し、作業領域ディレクトリにある中間データ１５１を参照する。
［Ｓ４２］必要な中間データを登録する。具体的には、中間データをポイントし、処理済みデータとして倉庫サーバ内の別領域に移動し、登録する。
［Ｓ４３］作業領域を削除する。具体的には、倉庫サーバ１８３に作業領域の削除を指示して、作業領域ディレクトリを削除することで、処理の失敗及び登録して不要となった中間データを全て削除する。
【００９４】
以上のように、実体名を意識しない「作業領域」を１台の計算機上に作成し、作業領域のなかに、入力データ、処理エンジン、及び解析処理手順データをＵＮＩＸコマンド「ｌｉｎｋ」により、作業領域内の名称でシンボリックリンクした。そのため、作業領域内において、解析処理手順データ内の名前によりすべての処理が実行可能となる。
【００９５】
また、作成された中間データは、「作業領域」内のみに存在し、解析処理手順データで指定した名称で作成されるため、その解析処理内容全体が不要になった場合には、その「作業領域」を削除することで、すべてのテンポラリなデータを削除することができる。このとき、入力データ、処理エンジン、及び解析処理手順データは、リンクのみの削除であり実体は削除されない。
【００９６】
更に、作業領域は、基本的に解析処理手順データと１対１に対応して作成される。そのため、ある解析処理手順内で不要になったデータは、対応する作業領域を削除することで、全て削除できる。
【００９７】
なお、分散システム内で一意に識別可能な名称を用いて、各データを検索することもできる。このデータ検索機能は、解析処理手順エディタの機能に含まれている。
【００９８】
以下に、解析処理手順エディタの操作手順について説明する。
図２０は、解析処理手順エディタの検索画面を示す図である。検索画面２００の上部にはツールバー２１０が設けられており、各種命令を入力することができる。ツールバー２１０の下には、複数のボタン２２１〜２２５が設けられている。「Ｎｅｗ」と表記されたボタン２２１が押されると、検索画面２００が初期化される。「Ｑｕｉｔ」と表記されたボタン２２２が押されると、検索画面２００が閉じる。「Ｓｔａｒｔ」と表記されたボタン２２３が押されると、検索処理が開始される。「Ｒｅｌｏａｄ」と表記されたボタン２２４が押されると、検索結果表示部２４０で指定されているデータが読み込まれ、その内容が表示される。「Ｈｅｌｐ」と表記されたボタン２２５が押されると、検索機能の操作方法の説明書きが表示される。
【００９９】
検索キー入力部２３０には、情報の種類別にキーワードを入力することができる。例えば、「name」、「abstract」などに対して、個別にキーワードを指定することができる。複数の種類の情報に対してキーワードが入力された場合には、それらの全ての条件を満たしたデータ（論理積）が検索される。
【０１００】
検索結果表示部２４０には、検索条件に適合したデータに関する情報がリストアップされる。この検索結果表示部２４０に表示されたデータから必要なデータを選択することで、そのデータの情報を検索処理手順エディタの編集画面へ取り込むことができる。
【０１０１】
図２１は、解析処理手順エディタの編集画面を示す図である。編集画面３００の上部にはツールバー３１０が設けられており、各種命令を入力することができる。このツールバー３１０内の「Execute 」のコマンドを指定すると、編集画面３００で編集されている処理手順に従った処理の実行要求が、実行コントローラ１７４に出力される。
【０１０２】
ツールバー３１０の下には、複数のボタン３２１〜３２８が設けられている。「Ｎｅｗ」と表記されたボタン３２１が押されると、編集画面３００が初期化される。「Ｑｕｉｔ」と表記されたボタン３２２が押されると、編集画面３００が閉じる。「Ｌｏａｄ」と表記されたボタン３２３が押されると、解析処理手順データ解析処理手順データの内容が、解析処理手順エディタがアクセス可能なメモリ内にロードされ、所定のデータが編集画面３００内の各種表示部に表示される。「Ｓａｖｅ」と表記されたボタン３２４が押されると、解析処理手順エディタで編集中のデータがハードディスク装置などの媒体に保存される。「（，）」と表記されたボタン３２５が押されると、その時選択されているデータが、処理プログラムに入力されないデータとして設定される。「（−）」と表記されたボタン３２６が押されると、その時選択されているデータは処理プログラムに入力すべきデータとして設定される。「（＊）」と表記されているボタン３２７が押されると、その時選択されているデータが、他の入力データに作用させるデータ（例えば、標準較正データ）として設定される。「Ｈｅｌｐ」と表記されたボタン３２８が押されると、編集画面における操作方法の説明書きが表示される。
【０１０３】
「Ｌｅｖｅｌ」と表記されている段指定部３３１は、データ表示部３３４に表示すべき段（図５に示す処理レベル）を指定するための領域である。
「Ｅｎｇｉｎｅ」と表記された処理プログラム入力部３３２は、現在表示されている段のデータから次の段のデータを生成するための処理プログラム名を入力するための領域である。
【０１０４】
データ種別表示部３３３には、データ表示部３３４の各列のデータの種別が表示されている。例えば、バイアス補正を行うためのデータであれば「Ｂｉａｓ」と表示される。
【０１０５】
データ表示部３３４には、入力データが、解析処理手順を図５に示したような３次元構造テーブル上の座標値で表示されている。
データ名表示部３３５は、データ表示部３３４で指定されたデータの名称が表示される。
【０１０６】
利用者は、このような編集画面３００で解析処理手順を作成し、ツールバー３１０の「Execute 」を指定することで実行内容指定画面が表示される。
図２２は、実行内容指定画面を示す図である。実行内容指定画面４００には、開始ステップ指定部４１０と終了ステップ指定部４２０とがあり、任意のステップの処理のみを実行させることができる。また、モード指定部４３０で実行モードを指定することで、解析処理の精度などを変更することができる。
【０１０７】
実行内容指定画面４００の下部には、２つのボタン４４０，４５０が設けられている。「Execute 」と表記されたボタン４４０を押すと、解析処理が開始され、「Cancel」と表記されたボタン４５０を押すと、実行中の解析処理が中止される。
【０１０８】
これにより、分散システムの利用者は、データが複数の計算機に分散して格納されていることを意識せずに解析処理手順の作成、及び作成した解析処理手順による解析処理の実行を容易に行うことができる。
【０１０９】
また、解析処理に必要な情報が分散処理システム内で一意に識別可能であるため、中断した処理を他の計算機に引き継がせることもできる。この場合、中断した処理の作業領域内の情報を他の計算機に移動し、移動先の計算機で解析処理を再開させればよい。このような制御を実行コントローラが自動的に行う。これにより、解析処理を中断している間に、その計算機の負荷が増大してしまった場合には、他の計算機に処理を引き継がせることができる。しかも、利用者は、中断前に解析を実行していた計算機と、その解析処理を引き継いだ計算機とが異なることを意識する必要はない。
【０１１０】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、上記分散システムの各機能の処理内容は、コンピュータで読み取り可能な記録媒体に記録されたプログラムに記述されており、このプログラムをコンピュータで実行することにより、上記処理がコンピュータで実現される。コンピュータで読み取り可能な記録媒体としては、磁気記録装置や半導体メモリ等がある。市場を流通させる場合には、ＣＤ−ＲＯＭ(Compact Disk Read Only Memory) やフロッピーディスク等の可搬型記録媒体にプログラムを格納して流通させたり、ネットワークを介して接続されたコンピュータの記憶装置に格納しておき、ネットワークを通じて他のコンピュータに転送することもできる。コンピュータで実行する際には、コンピュータ内のハードディスク装置等にプログラムを格納しておき、メインメモリにロードして実行する。
【０１１１】
【発明の効果】
以上説明したように本発明の分散処理システム及び分散処理方法では、管理簿テーブルにより、情報をシステム内で一意に識別するための情報名と実際の格納先との対応関係を管理し、管理簿テーブルにより必要な情報の実際の格納先を認識し、新たに生成した作業領域内にリンク情報を登録するとともに、作業領域内に出力データを出力するようにしたため、作業領域内において全ての処理が可能となる。
【０１１２】
また、本発明の分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体では、各情報をシステム内で一意に識別するための情報名と実際の格納先との対応関係を管理簿で管理し、その管理簿テーブルにより必要な情報の実際の格納先を認識し、新たに生成した作業領域内にリンク情報を登録するとともに、作業領域内に出力データを出力するような処理内容が記述された分散処理プログラムが格納されているため、作業領域内において全ての処理が可能となる。
【図面の簡単な説明】
【図１】本発明の原理構成図である。
【図２】天体観測システムを示す図である。
【図３】コンピュータシステムの構成を示す図である。
【図４】解析処理手順の概念図である。
【図５】３次元構造テーブルで表現された解析処理手順を示す図である。
【図６】解析処理手順データの例を示す図である。
【図７】解析処理手順データの例を示す図である。
【図８】分散処理システムの機能を示すブロック図である。
【図９】解析処理手順管理テーブルの例を示す図である
【図１０】処理エンジン管理テーブルの例を示す図である。
【図１１】入力データ管理テーブルの例を示す図である。
【図１２】キャッシュ管理簿テーブルの例を示す図である。
【図１３】倉庫内データ管理テーブルの例を示す図である。
【図１４】倉庫状態テーブルの例を示す図である。
【図１５】解析処理に必要な機能の構築処理を示すフローチャートである。
【図１６】解析処理の動作イメージを示す図である。
【図１７】解析処理の手順を示すフローチャートである。
【図１８】実行先倉庫決定処理のフローチャートである。
【図１９】実行結果の管理処理のフローチャートである。
【図２０】解析処理手順エディタの検索画面を示す図である。
【図２１】解析処理手順エディタの編集画面を示す図である。
【図２２】実行内容指定画面を示す図である。
【符号の説明】
１計算機
１ａ処理プログラム
１ｂ観測データ
２管理簿保持手段
２ａ管理簿
３解析処理実行手段
４作業領域
４ａ処理プログラム
４ｂ観測データ
４ｃ中間データ

Claims

データを複数の計算機で分散して解析する分散処理システムであって、
解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、
前記管理簿テーブルに登録された各データまたは処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータまたは処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータまたは処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルと、
解析処理実行のために計算機に転送され一時的に保持されているデータまたは処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルと、
前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記管理簿テーブルと前記キャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの実際の格納先である計算機を元に前記倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる解析処理実行手段と、
を備えることを特徴とする分散処理システム。
データを複数の計算機で分散して解析する分散処理方法であって、
コンピュータが、
解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、解析処理実行のために計算機に転送され一時的に保持されているデータおよび処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの格納先である計算機を元に、前記管理簿テーブルに登録された各データおよび処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータおよび処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる解析処理実行ステップ、
を実行することを特徴とする分散処理方法。
データを複数の計算機で分散して解析する分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
コンピュータに、
解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名によって必要なデータおよび処理プログラムを特定し、特定したデータおよび処理プログラムを用いた段階的な解析処理手順が定義された解析処理手順データに従った解析処理の解析処理要求を受け取ると、当該情報名を元に前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と各データおよび処理プログラムの実際の格納先である計算機との対応関係が登録された管理簿テーブルと、解析処理実行のために計算機に転送され一時的に保持されているデータおよび処理プログラムの情報名と当該データまたは処理プログラムを保持している計算機との対応関係が登録されたキャッシュ管理簿テーブルとにより必要なデータおよび処理プログラムの格納先である計算機を認識して必要なデータおよび処理プログラムが多く格納されている計算機を解析処理実行計算機として選択し、当該選択した解析処理実行計算機に当該解析処理を実行するための作業領域とするディレクトリを新たに生成し、当該情報名と当該データおよび処理プログラムの格納先である計算機を元に、前記管理簿テーブルに登録された各データおよび処理プログラムの実際の格納先である計算機毎に、前記解析処理に必要となるデータおよび処理プログラムをシステム内で一意に識別するための情報名と、当該情報名で識別されるデータおよび処理プログラムの格納パスとの対応関係が登録された倉庫内データ管理テーブルから当該情報名で識別されるデータおよび処理プログラムの格納パスを認識して当該データおよび処理プログラムへのアクセスを可能とするリンク情報を当該作業領域内に登録し、前記解析処理手順データで示される解析処理手順に従った解析処理を実行し、当該作業領域内に各段階での処理プログラムによる解析処理の中間データおよび解析結果データを、システム内で一意に識別するための情報名を付けて出力すると共に、解析途中で解析処理を実行する計算機の変更の必要が生じた場合には他の計算機を新たに選択して前記作業領域を新たに選択した計算機内に移動することで以後の処理を新たに選択した計算機に実行させる処理、
を実行させる分散処理プログラムを記録したコンピュータ読み取り可能な記録媒体。