JP2012242972A - 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム - Google Patents

集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム Download PDF

Info

Publication number
JP2012242972A
JP2012242972A JP2011110843A JP2011110843A JP2012242972A JP 2012242972 A JP2012242972 A JP 2012242972A JP 2011110843 A JP2011110843 A JP 2011110843A JP 2011110843 A JP2011110843 A JP 2011110843A JP 2012242972 A JP2012242972 A JP 2012242972A
Authority
JP
Japan
Prior art keywords
calculation
node
calculation result
task
resource management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011110843A
Other languages
English (en)
Inventor
Tsuyoshi Ozawa
健史 小沢
Kazutaka Morita
和孝 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011110843A priority Critical patent/JP2012242972A/ja
Publication of JP2012242972A publication Critical patent/JP2012242972A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ジョブ内に複数回実行される集約処理が含まれている場合、ジョブを高速に処理し、過去に行ったことがある集約処理を効率的に実行する。
【解決手段】 本発明は、資源管理ノードで集約処理を検出し、該集約処理を行うタスクを抽出し、タスクの入力データを有する計算ノードから取得したハッシュ値と実行ファイルを検索キーとして過去の計算結果を検索し、該当する計算結果がある場合は、該計算結果を保持する計算ノードで処理が終了したと見做して計算処理をスキップし、該当する計算結果がない場合は、タスクを実行する計算ノードを決定し、タスクを実行させる。計算ノードでは、資源管理ノードから割り当てられたタスクを実行し、該タスクの計算結果を一時記憶手段に格納する。ジョブが終了すると、検索キーに基づいて検索し、計算結果を保持している計算ノードから計算結果を取得して、該計算ノードと関連付けて該計算結果記憶手段に格納する。
【選択図】 図6

Description

本発明は、集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラムに係り、特に、過去に行ったジョブ中の集約処理がある場合に、当該集約処理をスキップするための集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラムに関する。
分散処理フレームワークにおいて、PCクラスタ上にファイルを分割して保存する分散記憶装置を前提としたデータ解析基盤ソフトウェアがある。これは、図1に示すように、有向グラフの形式で動作フローを記述することで、互いに依存関係のない入力データに対して並列計算を行うプログラムを実行基盤とするものである。図1において、辺がデータの流れであり、頂点が行う処理内容を意味する。頂点上で実行される処理をタスクという。実行時は、分散ファイルシステムにアクセスし、入力ファイルを処理単位に分割する初期化処理を行い、分割したファイルが保存されているデータノードに近い計算ノードに、処理内容が記述されたプログラムを配置し、計算が完了したら結果を分散ファイルシステムに書き込むものである。なお、「計算ノード」とは、実際にタスクを実行する計算機を指す。
このような環境において、1つ前の頂点の処理結果を分割し、入力データとして処理する方法として、MapReduceを拡張し、ループ処理に特化させたシステムがある(例えば、非特許文献1、2参照)、Map処理、Reduceで記述されたプログラムを分散並列処理するシステム(例えば、特許文献1参照 )や、非循環有向グラフ処理で記述されたプログラムを分散並列処理するシステム(例えば、特許文献2参照)がある。
また、各計算ノード間の通信量を測定し、ネットワーク全体に流れる通信量を削減し、計算機負荷及びネットワーク負荷を均等化するシステム(例えば、特許文献3参照)がある。
以下に従来の技術における分散並列処理キャッシュ処理を説明する。
図2は、従来技術の概略フローチャートである。
資源管理ノードがキャッシュを考慮しながら計算ノードにタスクを割り当て(ステップ210)、計算ノードが割り当てられたタスクを実行する(ステップ220)。タスクの実行結果を計算ノードに一時ファイルとして保存し(ステップ230)、ジョブが終了していない場合はステップ210に戻る。ジョブが終了したら計算ノードの一時ファイルを削除する。なお、ここで、「ジョブ」とは、動作フローを記述したプログラムが行う一連の処理を指し、各頂点で実行される処理と、データの流れを表現するデータフローで構成される。
上記の計算ノードにタスクを割り当てるステップ210の処理を図3に示す。
特許文献1の技術に基づいて資源管理ノードが次に実行すべきタスクを決定する(ステップ410)。次に、資源管理ノードが次に実行ジョブ中における再利用するデータの宣言を確認する(ステップ420)。ステップ410で選択したタスクの入力は再利用可能かを判定し、再利用可能であり、1回目の実行である場合は、計算結果を保持するノードで処理が終了したと見做し、計算をスキップし(ステップ440)、ステップ410の処理に戻る。一方、再利用ができない、または、2回目以降の実行である場合は、特許文献1の技術に基づいて実行する計算ノードを決定する(ステップ460)。
上記のステップ230では、図4に示すように、完了したタスクの計算結果を計算ノードの外部記憶装置(ローカルディスク)に保存する(ステップ610)。
最後に、ステップ240では、図5に示すように、完了したタスクの計算結果を計算ノードの外部記憶装置(ローカルディスク)に保存する(ステップ610)。
United States Patent 7,650,331, System and method for efficient large-scale data processing (Map Reduce) Google, January 19, 2010. USPTO Applicaton #20080082644, Distributed Parallel Computing(Dryad), Microsoft Corporation,September 29, 2006. 特開2000-242609号公報.
HaLoop: Efficient Iterative Data Processing on Large Clusters, Yingyi Bu, Bill Howe, Magdalena Balazinska, Michael D. Ernst. In VLDB'10: The 36the International Conference on Very Large Data Bases, Singapore, 24-30, September, 2010. Twister: A Runtime for Iterative MapReduce Jaliya Ekanayake, Hui Li, Bingjing Zhang, Thilina Gunarathne, Seung-Hee Bae, Judy Qiu, Geoffrey Fox, Twister: A Runtime for Iterative MapReduce. The first International Workshop on MapReduce and its Applications (MAPREDUCE'10) - HPDC2010.
しかしながら、上記特許文献1,2,3、非特許文献1,2のシステムのよい箇所を組み合わせたシステムを構築した場合でも、以下のような問題がある。
過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合であっても、複数の計算ノードから入力を受け取り、計算を行うような処理の実行時間は以前の実行時間と同程度である。その原因としては、入力データが過去と一致している場合であっても、入力データを計算ノードに再転送し、再計算を行う必要があるためである。
また、ネットワークの入出力、ディスクの入出力が特定の計算ノードに集中し、輻輳が発生しうるという問題がある。
本発明は、上記の点に鑑みなされたもので、ジョブ内に複数回実行される集約処理が含まれている場合、ジョブを高速に処理すると共に、過去に行ったことがある集約処理を効率的に実行することが可能な分散並列処理における集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラムを提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、分散並列処理において、複数の計算ノードと、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、該複数の計算ノードから実行結果を入力して受け取り計算を行う資源管理ノードを有する集約処理システムであって、
前記資源管理ノードは、
ジョブの実行ファイルから集約処理を検出し、該集約処理を行うタスクを抽出する集約処理検出手段と、
前記タスクの入力データを有する計算ノードに対して該入力データのハッシュ値の計算を要求し、実行ファイルと共に取得するハッシュ値取得手段と、
前記ハッシュ値と実行ファイルを検索キーとして過去の計算結果が格納されている計算結果記憶手段を検索し、該当する計算結果がある場合は、該計算結果を保持する計算ノードで処理が終了したと見做して計算処理をスキップし、該当する計算結果がない場合は、タスクを実行する計算ノードを決定し、タスクを実行させるタスク管理手段と、
ジョブが終了すると、前記検索キーに基づいて前記計算結果記憶手段を検索し、計算結果を保持している計算ノードを特定し、該計算ノードから取得した計算結果を取得して、該計算ノードと関連付けて該計算結果記憶手段に格納する計算結果格納手段と、
を有し、
前記計算ノードは、
前記資源管理ノードからの要求により、前記入力データのハッシュ値を求めるハッシュ値計算手段と、
前記資源管理ノードから割り当てられた前記タスクを実行し、該タスクの計算結果を実行ファイル、入力データを関連付けて一時記憶手段に格納するタスク実行手段と、
前記ジョブが終了した時点で、前記資源管理ノードから要求があると、前記一時記憶手段から計算結果を読み出して該資源管理ノードに転送するデータ転送手段と、
を有することを特徴とする。
また、本発明(請求項2)は、前記計算ノードにおいて、
前記資源管理ノードから集約処理の入力要求があると、当該計算ノードと同じ物理計算機内のデータノードから計算結果を取得し、集約処理の計算結果があることを該資源管理ノードに通知する手段を含み、
前記資源管理ノードにおいて、
前記計算ノードから計算結果があることが通知されると、集約処理が終了したものと判断する手段を含む。
また、本発明(請求項3)は、前記資源管理ノードにおいて、
前記タスクを実行した計算ノード以外の計算ノードの計算結果を前記データノードに転送するデータ格納手段を有し、
前記計算ノードと同じ物理計算機内のデータノードは、
データを格納するデータ記憶手段と、
前記資源管理ノードから転送された計算結果を前記データ記憶手段に格納する手段と、を有する。
上記のように、過去に行ったジョブの入力一部を変更し、再度同じジョブを行う場合に、複数の計算ノードから実行結果を入力として受け取り計算を行うような集約処理を効率的に実行することができる。これにより、1つのジョブの中に集約処理が複数存在する場合において、ある集約処理の入力ファイルのキー{入力ファイルのハッシュ値+バイナリ}による検索結果が集約処理の入力ファイル全てに対してヒットした場合は計算をスキップすることができる。また、集約処理を行う計算ノードにおけるネットワークの入出力回数及びディスクの入出力回数を削減することができる。
有向グラフ形式の動作フローである。 従来技術の概略フローチャートである。 図2のS210を詳細化したフローチャートである。 図2のS230を詳細化したフローチャートである。 図2のS240を詳細化したフローチャートである。 本発明の一実施の形態におけるシステム構成図である。 本発明の一実施の形態における概略フローチャートである。 本発明の一実施の形態における図7のS310の詳細化フローチャートである。 本発明の一実施の形態における図7のS320の詳細化フローチャートである。 本発明の一実施の形態における図9のS640no詳細化フローチャートである。 本発明の一実施の形態における図10のS710の詳細化フローチャートである。 本発明の一実施の形態における図7のS350の詳細化フローチャートである。 本発明の一実施の形態における全体動作のシーケンスチャートである。
以下図面と共に、本発明の実施の形態を説明する。
図6は、本発明の一実施の形態におけるシステム構成を示す。
同図に示すシステムは、資源管理ノード10と複数の物理計算機20から構成される。
資源管理ノード10は、集約処理検出部11、タスク管理部12、検索部13、ノード管理DB14から構成され、タスク管理部12、検索部13には計算結果記憶部1が接続されている。計算結果記憶部1は、計算ノードに対応する計算結果、タスク実行に必要な入力データのハッシュ値、実行ファイルの組が格納され、ローカルディスクまたはメモリとして保持される。本実施の形態では、計算結果記憶部1はローカルディスク(外部記憶装置)として説明する。また、ノード管理DB14には、物理計算機毎に計算ノードの識別情報及び当該計算ノードが有するタスクの入力データの識別情報、及び、データノードの識別情報を格納している。
物理計算機20は、実際にタスクを実行する計算ノード21、データを保存するデータノード22を有する。計算ノード21は、資源管理ノード10からの要求によりハッシュ値を計算するハッシュ計算部211を有し、計算結果一時記憶部2と接続されている。当該計算結果一時記憶部2は、ローカルディスクまたはメモリとして保持される。本実施の形態ではローカルディスク(外部記憶装置)として説明する。データノードは、データ記憶部221を有する。計算ノード21では、集約処理を行う。集約処理とは、他の計算ノードから転送された複数の入力ファイルを取得し、全部揃ったら計算を行い、計算結果を計算結果一時記憶部2に格納する。
図7は、本発明の一実施の形態における概略フローチャートである。
ステップ310) 資源管理ノード10の集約処理検出部11は、入力されたジョブから集約処理を検出する。当該処理の詳細は、図8にて後述する。
ステップ320) 資源管理ノード10のタスク管理部12は、タスクを計算ノード21に割り当てる。当該処理の詳細は、図9にて後述する。
ステップ330) 計算ノード21は、割り当てられたタスクを実行する。
ステップ340) 計算ノード221は、その計算結果を、実行ファイル、入力データと関連付けて計算結果一時記憶部2に格納すると共に、資源管理ノード10に送出する。ジョブが終了した場合にはステップ350に移行し、終了していない場合はステップ320に移行する。
ステップ350) 資源管理ノード10は、ジョブが終了すると、中間結果を再利用できるように、計算結果記憶部1のデータを永続化する。詳細な処理については図12にて後述する。
次に、上記のステップ310の集約処理の検出処理について説明する。
図8は、本発明の一実施の形態における図7のS310の詳細化フローチャートである。
ステップ410) 資源管理ノード10の集約処理検出部11は、特許文献2の手法により、ジョブの実行ファイルから集約処理を検出する。当該特許文献2の手法では、プログラマによって記述された動作フローがプログラムに含まれており、動作フローの記述のうち、複数の入力をとる記述は限られているため、どのタスクが集約処理であるのかを判定することができる。
ステップ420) 集約処理検出部11は、集約処理を行うタスクをマークし、メモリ(図示せず)に格納する。なお、本実施の形態では、当該マークが付与されたタスクはメモリに保存するものとして説明するが、ローカルディスクに保存してもよい。なお、当該マークは、資源管理ノード10がタスクを計算ノード21に割り当てる際に、そのタスクが集約処理であるかどうかの判断に用いられる。
次に、上記のステップ320のタスク割当処理について説明する。
図9は、本発明の一実施の形態における図7のS320の詳細化のフローチャートである。
ステップ610) 資源管理ノード10のタスク管理部12は、非特許文献2の手法を用いて次に実行すべきタスクを決定する。
ステップ620) タスク管理部12は、ステップ610で選択したタスクに基づいて、ノード管理DB14から当該タスクの入力データを保持している計算ノードを検索し、当該計算ノード21に対して、入力データのハッシュ値を計算するように要求する。これにより、当該計算ノード21は、ハッシュ計算部211において、入力データのハッシュ値を計算し、資源管理ノード10に返却する。
ステップ630) 資源管理ノード10の検索部13は、ステップ620で計算ノード21から取得した入力データのハッシュ値と実行ファイルをキーとして、計算結果記憶部1から過去の計算結果の有無と場所を検索する。当該キーに該当する計算結果が計算結果記憶部1に存在するかを判定し、存在する場合は、ステップ640に移行し、存在しない場合はステップ650に移行する。
ステップ640) タスク管理部12は、計算結果が計算結果記憶部1に存在する場合は、計算結果を保持する計算ノード21で処理が終了したものと見做し、計算処理をスキップし、ステップ610の処理に戻る。詳細は図10にて後述する。
ステップ650) 計算結果が計算結果記憶部1に存在しない場合は、非特許文献2に基づいてタスクを実行する計算ノードを決定し、処理を終了する。
次に、上記の図9のステップ640の計算処理をスキップする場合の処理について説明する。
図10は、本発明の一実施の形態における図9のS640の詳細化のフローチャートである。
ステップ710) タスク管理部12は、計算ノード21に対して、今から実行するタスクの入力、実行ファイルから集約処理の入力(集約処理の入力ファイルの集合)を求める。集約処理の入力になるような計算結果が見つかった場合はステップ720に移行し、見つからない場合はステップ740に移行する。詳細な処理については図11で後述する。
ステップ720) 計算ノード21は、ステップ710で求めた計算結果を、計算結果を保持しているデータノード22に要求する。これにより、データノード22は、計算結果をデータ記憶部221から集約処理を実行する計算ノード21へのコピーを開始する。但し、既に転送中の計算結果は転送しない。計算ノード21は、複数の計算ノードから実行結果を入力として受け取り、集約処理に必要な入力が計算結果一時記憶部2にキャッシュされている計算結果にヒットしたかを判定し、ヒットした場合には、ステップ730に移行し、ヒットしない場合は当該処理を終了する。
ステップ730) 計算ノード21は、ヒットした場合には、ヒットしたことをタスク管理部12に通知し、タスク管理部12は、ステップ720で開始したコピーを停止し、計算結果を保持している計算ノード21で集約処理が終了したと見做し処理を終了する。
ステップ740) タスク管理部12は、ステップ710の処理において、集約処理の入力になるような計算結果が見つからない場合は、非特許文献2の手法に基づいて、タスクを実行する計算ノードを決定する。
上記のステップ710の処理について説明する。
図11は、本発明の一実施の形態における図10のS710の詳細化のフローチャートである。
ステップ810) タスク管理部12は、資源管理ノード10が実行するタスクの入力データを保持するデータノード22に対して入力データのハッシュ値を問い合わせる。
ステップ820) データノード22は、ハッシュ計算部222においてハッシュ値を計算し、タスク管理部12に返却する。
ステップ830) 資源管理ノード10の検索部13は、入力データのハッシュ値、タスクに対する実行ファイルをキーとして計算結果記憶部1を検索し、対応する計算結果を取得する。キーに対応する計算結果が存在する場合、または、キーに対応する計算結果が存在せず、次の処理が集約処理である場合はステップ840に移行する。なお、集約処理であるか否かは、ステップ420で付与したマークがあるか否かで判定する。キーに対応する計算結果が存在せず、次の処理が存在しない場合、または、キーに対応する計算結果が存在し、かつ、次の処理が集約処理ではなく、次の処理が存在しない場合はステップ850に移行する。
ステップ840) タスク管理部12は、ステップ830で取得した計算結果が見つかったと見做し、処理を終了する。
ステップ850) タスク管理部12は、検索結果が見つからなかったと見做し、処理を終了する。
次に、図7のステップ350の処理について説明する。
図12は、本発明の一実施の形態における図7のS350の詳細化のフローチャートである。
ステップ1010) 資源管理ノード10の検索部13は、計算結果記憶部1に保存した検索キー(入力データのハッシュ値と実行ファイル)に基づいて、ノード管理DB14を検索し、当該検索キーに対応する計算結果を保持している計算ノードを求める。
ステップ1020) タスク管理部12は、集約処理を行ったノードの入力データのキー(入力データ群のハッシュ値と実行ファイル)と実行結果を保持している計算ノード21とを関連付け、計算結果記憶部1に保存する。
ステップ1030) 集約処理以外の処理を行った計算ノードにある計算結果を、当該計算ノードと同じ物理計算機上で動作しているデータノードのデータ記憶部221に保存する。
図13本発明の一実施の形態における全体動作のシーケンスチャートである。同図におけるステップ番号は前述のフローチャートのステップ番号に対応する。
上記のような処理を行うことにより、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、複数の計算ノードから実行結果を入力して受け取り計算を行うような処理(集約処理)を効率よく実行することができる。これにより、入力データが時系列に従って増えていくような処理を含む計算を高速に行うことができ、
(1)検索エンジンの更新が高速に行えるようになる;
(2)ユーザへのレコメンデーションが高速に更新できるようになる;
(3)ログ解析を高速に行うことができる。
なお、上記の資源管理ノード及び計算ノードの動作をプログラムとして構築し、資源管理ノード、計算ノードとして利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
1 計算結果記憶部
2 計算結果一時記憶部
10 資源管理ノード
11 集約処理検出部
12 タスク管理部
13 検索部
14 ノード管理DB
20 物理計算機
21 計算ノード
22 データノード
211 ハッシュ計算部
221 データ記憶部
222 ハッシュ計算部

Claims (10)

  1. 分散並列処理において、複数の計算ノードと、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、該複数の計算ノードから実行結果を入力して受け取り計算を行う資源管理ノードを有する集約処理システムであって、
    前記資源管理ノードは、
    ジョブの実行ファイルから集約処理を検出し、該集約処理を行うタスクを抽出する集約処理検出手段と、
    前記タスクの入力データを有する計算ノードに対して該入力データのハッシュ値の計算を要求し、実行ファイルと共に取得するハッシュ値取得手段と、
    前記ハッシュ値と実行ファイルを検索キーとして過去の計算結果が格納されている計算結果記憶手段を検索し、該当する計算結果がある場合は、該計算結果を保持する計算ノードで処理が終了したと見做して計算処理をスキップし、該当する計算結果がない場合は、タスクを実行する計算ノードを決定し、タスクを実行させるタスク管理手段と、
    ジョブが終了すると、前記検索キーに基づいて前記計算結果記憶手段を検索し、計算結果を保持している計算ノードを特定し、該計算ノードから取得した計算結果を取得して、該計算ノードと関連付けて該計算結果記憶手段に格納する計算結果格納手段と、
    を有し、
    前記計算ノードは、
    前記資源管理ノードからの要求により、前記入力データのハッシュ値を求めるハッシュ値計算手段と、
    前記資源管理ノードから割り当てられた前記タスクを実行し、該タスクの計算結果を実行ファイル、入力データを関連付けて一時記憶手段に格納するタスク実行手段と、
    前記ジョブが終了した時点で、前記資源管理ノードから要求があると、前記一時記憶手段から計算結果を読み出して該資源管理ノードに転送するデータ転送手段と、
    を有することを特徴とする集約処理システム。
  2. 前記計算ノードは、
    前記資源管理ノードから集約処理の入力要求があると、当該計算ノードと同じ物理計算機内のデータノードから計算結果を取得し、集約処理の計算結果があることを該資源管理ノードに通知する手段を含み、
    前記資源管理ノードは、
    前記計算ノードから計算結果があることが通知されると、集約処理が終了したものと判断する手段を含む
    請求項1記載の集約処理システム。
  3. 前記資源管理ノードは、
    前記タスクを実行した計算ノード以外の計算ノードの計算結果を前記データノードに転送するデータ格納手段を有し、
    前記計算ノードと同じ物理計算機内のデータノードは、
    データを格納するデータ記憶手段と、
    前記資源管理ノードから転送された計算結果を前記データ記憶手段に格納する手段と、
    を有する請求項1記載の集約処理システム。
  4. 分散並列処理において、複数の計算ノードと、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、該複数の計算ノードから実行結果を入力して受け取り計算を行う資源管理ノードを有するシステムにおける集約処理方法であって、
    前記資源管理ノードの集約処理検出手段が、ジョブの実行ファイルから集約処理を検出し、該集約処理を行うタスクを抽出する集約処理検出ステップと、
    前記資源管理ノードのハッシュ値取得手段が、前記タスクの入力データを有する計算ノードに対して該入力データのハッシュ値の計算を要求するハッシュ値要求ステップと、
    前記計算ノードのハッシュ値計算手段が、前記入力データのハッシュ値を求めるハッシュ値計算ステップと、
    前記資源管理ノードの前記ハッシュ値取得手段が、前記計算ノードから取得したハッシュ値を実行ファイルと共に取得するハッシュ値取得ステップと、
    前記資源管理ノードのタスク管理手段が、前記ハッシュ値と実行ファイルを検索キーとして過去の計算結果が格納されている計算結果記憶手段を検索し、該当する計算結果がある場合は、該計算結果を保持する計算ノードで処理が終了したと見做して計算処理をスキップし、該当する計算結果がない場合は、タスクを実行する計算ノードを決定し、タスクを実行させるタスク管理ステップと、
    前記計算ノードのタスク実行手段が、前記資源管理ノードから割り当てられた前記タスクを実行し、該タスクの計算結果を実行ファイル、入力データを関連付けて一時記憶手段に格納するタスク実行ステップと、
    前記資源管理ノードの計算結果格納手段が、ジョブが終了すると、前記検索キーに基づいて前記計算結果記憶手段を検索し、計算結果を保持している計算ノードを特定し、該計算ノードに計算結果を要求する計算結果要求ステップと、
    前記計算ノードのデータ転送手段が、前記一時記憶手段から計算結果を読み出して前記資源管理ノードに転送するデータ転送ステップと、
    前記資源管理ノードの計算結果格納手段が、前記計算ノードから取得した計算結果を取得して、該計算ノードと関連付けて該計算結果記憶手段に格納する計算結果格納ステップと、
    を行うことを特徴とする集約処理方法。
  5. 前記計算ノードにおいて、
    前記資源管理ノードから集約処理の入力要求があると、当該計算ノードと同じ物理計算機内のデータノードから計算結果を取得し、集約処理の計算結果があることを該資源管理ノードに通知し、
    前記資源管理ノードにおいて、
    前記計算ノードから計算結果があることが通知されると、集約処理が終了したものと判断する
    請求項4記載の集約処理方法。
  6. 前記資源管理ノードにおいて、
    前記タスクを実行した計算ノード以外の計算ノードの計算結果を前記データノードに転送し、
    前記計算ノードと同じ物理計算機内のデータノードにおいて、
    前記資源管理ノードから転送された計算結果をデータ記憶手段に格納する
    請求項4記載の集約処理方法。
  7. 分散並列処理において、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、複数の計算ノードから実行結果を入力して受け取り計算を行う資源管理ノードであって、
    ジョブの実行ファイルから集約処理を検出し、該集約処理を行うタスクを抽出する集約処理検出手段と、
    前記タスクの入力データを有する計算ノードに対して該入力データのハッシュ値の計算を要求し、実行ファイルと共に取得するハッシュ値取得手段と、
    前記ハッシュ値と実行ファイルを検索キーとして過去の計算結果が格納されている計算結果記憶手段を検索し、該当する計算結果がある場合は、該計算結果を保持する計算ノードで処理が終了したと見做して計算処理をスキップし、該当する計算結果がない場合は、タスクを実行する計算ノードを決定し、タスクを実行させるタスク管理手段と、
    ジョブが終了すると、前記検索キーに基づいて前記計算結果記憶手段を検索し、計算結果を保持している計算ノードを特定し、該計算ノードから取得した計算結果を取得して、該計算ノードと関連付けて該計算結果記憶手段に格納する計算結果格納手段と、
    前記タスクを実行した計算ノード以外の計算ノードの計算結果を前記データノードに転送するデータ格納手段と、
    を有することを特徴とする資源管理ノード。
  8. 分散並列処理において、過去に行ったジョブの入力の一部を変更し、再度同じジョブを行う場合に、資源管理ノードからのタスク割り当てによりタスクを実行する計算ノードであって、
    前記資源管理ノードからの要求により、前記入力データのハッシュ値を求めるハッシュ値計算手段と、
    前記資源管理ノードから割り当てられた前記タスクを実行し、該タスクの計算結果を実行ファイル、入力データを関連付けて一時記憶手段に格納するタスク実行手段と、
    前記ジョブが終了した時点で、前記資源管理ノードから要求があると、前記一時記憶手段から計算結果を読み出して該資源管理ノードに転送するデータ転送手段と、
    を有することを特徴とする計算ノード。
  9. コンピュータを、
    請求項7記載の資源管理ノードの各手段として機能させるための集約処理プログラム。
  10. コンピュータを、
    請求項8記載の計算ノードの各手段として機能させるための集約処理プログラム。
JP2011110843A 2011-05-17 2011-05-17 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム Pending JP2012242972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011110843A JP2012242972A (ja) 2011-05-17 2011-05-17 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011110843A JP2012242972A (ja) 2011-05-17 2011-05-17 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム

Publications (1)

Publication Number Publication Date
JP2012242972A true JP2012242972A (ja) 2012-12-10

Family

ID=47464647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011110843A Pending JP2012242972A (ja) 2011-05-17 2011-05-17 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム

Country Status (1)

Country Link
JP (1) JP2012242972A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105420A (ja) * 1996-09-25 1998-04-24 Hitachi Ltd リモートプロシジャコール処理方式
JP2004062608A (ja) * 2002-07-30 2004-02-26 Dainippon Printing Co Ltd 並列処理システム、サーバ、並列処理方法、プログラム、及び、記録媒体
JP2009087190A (ja) * 2007-10-02 2009-04-23 Nec Corp ストリームデータ解析高速化装置、方法およびプログラム
JP2010505201A (ja) * 2006-09-29 2010-02-18 マイクロソフト コーポレーション セキュア・ピアツーピア・キャッシュ共有
JP2010092222A (ja) * 2008-10-07 2010-04-22 Internatl Business Mach Corp <Ibm> 更新頻度に基づくキャッシュ機構

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105420A (ja) * 1996-09-25 1998-04-24 Hitachi Ltd リモートプロシジャコール処理方式
JP2004062608A (ja) * 2002-07-30 2004-02-26 Dainippon Printing Co Ltd 並列処理システム、サーバ、並列処理方法、プログラム、及び、記録媒体
JP2010505201A (ja) * 2006-09-29 2010-02-18 マイクロソフト コーポレーション セキュア・ピアツーピア・キャッシュ共有
JP2009087190A (ja) * 2007-10-02 2009-04-23 Nec Corp ストリームデータ解析高速化装置、方法およびプログラム
JP2010092222A (ja) * 2008-10-07 2010-04-22 Internatl Business Mach Corp <Ibm> 更新頻度に基づくキャッシュ機構

Similar Documents

Publication Publication Date Title
US9996394B2 (en) Scheduling accelerator tasks on accelerators using graphs
US9747086B2 (en) Transmission point pattern extraction from executable code in message passing environments
US10503905B1 (en) Data lineage management
US8510751B2 (en) Optimizing workflow engines
US9575813B2 (en) Pattern matching process scheduler with upstream optimization
JP6427592B2 (ja) データ型に関連するデータプロファイリング操作の管理
JP2012160013A (ja) データ分析及び機械学習処理装置及び方法及びプログラム
US20240232722A1 (en) Handling system-characteristics drift in machine learning applications
JP2012242975A (ja) 分散並列処理キャッシュ装置及び方法及び資源管理ノード及びプログラム
Thomas et al. Survey on MapReduce scheduling algorithms
US10599472B2 (en) Information processing apparatus, stage-out processing method and recording medium recording job management program
Kim et al. Optimal Model Partitioning with Low-Overhead Profiling on the PIM-based Platform for Deep Learning Inference
JP2012242972A (ja) 集約システム及び方法及び資源管理ノード及び計算ノード及び集約処理プログラム
JP2011186853A (ja) データ処理装置及びシステム及び方法及びプログラム
Yang et al. Demonstration on unblocking checkpoint for fault-tolerance in pregel-like systems
US20120284315A1 (en) Optimization of non-deterministic computational paths
WO2024156113A1 (en) Runtime error attribution for database queries specified using a declarative database query language
US20240256550A1 (en) Dictionary Filtering and Evaluation in Columnar Databases
JP5501288B2 (ja) 投機的実行装置及び方法及びプログラム
US20240256549A1 (en) Evaluating Expressions Over Dictionary Data
JP2014507734A (ja) 分散計算方法及び分散計算システム
Mestre Leveraging the entity matching performance through adaptive indexing and efficient parallelization
Saxena et al. Enhancing Redundant Content Elimination Algorithm Using Processing Power of Multi-Core Architecture
JP2020003945A (ja) 計算機システム及びデータ管理方法
JP5554731B2 (ja) 情報更新装置及び情報更新方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130806

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140701