JP2016081494A

JP2016081494A - 分散コンピューティング環境におけるグラフデータの振り分け方法及び装置

Info

Publication number: JP2016081494A
Application number: JP2014254498A
Authority: JP
Inventors: ジョンホオム; Jung Ho Um; テホンキム; Tae Heon Kim; チャンホチョン; Chang Hoo Jeong; スンウイ; Seungwoo Lee; ハンミンジョン; Hanmin Jung; ウォンキョンソン; Won-Kyeong Song
Original assignee: Korea Institute of Science and Technology KIST; Korea Institute of Science and Technology Information KISTI
Current assignee: Korea Institute of Science and Technology KIST; Korea Institute of Science and Technology Information KISTI
Priority date: 2014-10-20
Filing date: 2014-12-16
Publication date: 2016-05-16
Also published as: US20160110474A1; US9934325B2

Abstract

【課題】分散コンピューティング環境におけるグラフデータの振り分け方法及び装置を提供すること。
【解決手段】（ａ）グラフデータから共通部分グラフを探索するステップと、（ｂ）前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にはグラフデータを整列してパーティションを生成するステップと、（ｃ）前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるステップと、を含むことを特徴とする分散コンピューティング環境におけるグラフデータの振り分け方法。
【選択図】図２

Description

本発明は、分散コンピューティング環境におけるグラフデータの振り分け方法及び装置に係り、さらに詳しくは、グラフデータにおける共通部分グラフ（ＣｏｍｍｏｎＳｕｂ−Ｇｒａｐｈ）の存否に応じて共通部分グラフまたは頂点を基準としてパーティションを生成し、各頂点別に処理費用が最小となるパーティションに当該グラフデータを振り分ける分散コンピューティング環境におけるグラフデータの振り分け方法及び装置に関する。

最近のインターネットの発展には目を見張るものがあり、これに伴い、ネチズンにより一日につき数多くのデータが生成されて流通されており、最近、多くの企業、特に、検索エンジン会社とウェブポータルとの間で、このような膨大な量のデータをできる限り多く収集及び蓄積し、収集されたデータのうちできる限り早く意味のある情報を抽出することが企業の競争力になっている。

この理由から、多くの企業は、安価に大規模のクラスターを構築して、大容量の分散管理及び作業分散並列処理技術に取り組んでいる。

すなわち、既存のシングルマシンシステムにおいて処理し難い大容量データの価値に目が向けられ、これを処理するための代案として、分散並列基盤のシステムが様々な分野に取り込まれて活用されている。

一方、大容量のグラフデータを分散コンピューティング環境において処理するためにハッシング方法を利用している。

しかしながら、ハッシング方法は、グラフ構造を考慮せずにデータを振り分け、且つ、異なるサーバーに分散されているデータを検索するためのネットワーク費用が発生するため、グラフデータの分散コンピューティング性能に限界を示している。

大韓民国登録特許第１２６９４２８号（データの振り分けシステム及び方法）

本発明の目的は、分散コンピューティング環境において大容量のグラフデータを各サーバーに均等に振り分けることのできる分散コンピューティング環境におけるグラフデータの振り分け方法及び装置を提供するところにある。

本発明の他の目的は、グラフデータの処理費用を予測し、その予測された処理費用に基づいてグラフデータを振り分ける分散コンピューティング環境におけるグラフデータの振り分け方法及び装置を提供するところにある。

上述した目的を達成するために、本発明の一側面によれば、（ａ）グラフデータから共通部分グラフを探索するステップと、（ｂ）前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にはグラフデータを整列してパーティションを生成するステップと、（ｃ）前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるステップと、を含むことを特徴とする分散コンピューティング環境におけるグラフデータの振り分け方法が提供される。

好ましくは、前記グラフデータは、頂点で表わされるノードと他のノードとが方向性を有するように、または、方向性を有さないように結ぶ幹線であるエッジからなるデータである。

また、好ましくは、前記ステップ（ａ）は、前記グラフデータの各ノード別の隣接ノードの数及びＩＤに基づいて共通部分グラフを探索する。

さらに、好ましくは、前記ステップ（ｂ）は、共通部分グラフが存在する場合にその部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合に各ノードを隣接ノード数が多い順に整列し、前記整列されたノードのうち上位ランキングに相当するノードを頂点として選択し、前記選択された頂点を基準としてパーティションを生成する。

さらに、好ましくは、前記ステップ（ｃ）は、各頂点別に、共通部分グラフまたは頂点までの最小ホップの数（Ｈ）、頂点の計算関数時間複雑度（Ｔ）及び同一ではないパーティションに格納された頂点の隣の隣接頂点の数（Ｍ）を計算するステップと、前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用して前記グラフデータの処理費用を計算するステップと、前記計算された処理費用が最小となるパーティションを探索するステップと、前記探索されたパーティションに当該グラフデータを割り当てるステップと、を含む。

さらに、好ましくは、各頂点の隣の隣接頂点が既に割り当てられた頂点である場合、前記計算された処理費用に連結長さ（Ｐ）を適用して処理費用を再計算する。

上述した目的を達成するために、本発明の他の側面によれば、（ａ）グラフデータから共通部分グラフを探索するステップと、（ｂ）前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にグラフデータを整列してパーティションを生成するステップと、（ｃ）前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるステップと、を含むことを特徴とする分散コンピューティング環境におけるグラフデータの振り分け方法を実行するためのプログラムが書き込まれたコンピュータにて読み取り可能な記録媒体が提供される。

上述した目的を達成するために、本発明のさらに他の側面によれば、グラフデータから共通部分グラフを探索する共通部分グラフ探索部と、前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にグラフデータを整列してパーティションを生成するパーティション生成部と、前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるデータ振り分け部と、を備えることを特徴とする分散コンピューティング環境におけるグラフデータの振り分け装置が提供される。

好ましくは、前記共通部分グラフ探索部は、前記グラフデータの各ノード別の隣接ノードの数及びＩＤに基づいて共通部分グラフを探索する。

また、好ましくは、前記パーティション生成部は、共通部分グラフが存在する場合にその部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合に各ノードを隣接ノード数が多い順に整列し、前記整列されたノードのうち上位ランキングに相当するノードを頂点として選択し、前記選択された頂点を基準としてパーティションを生成する。

さらに、好ましくは、前記データ振り分け部は、各頂点別に、共通部分グラフまたは頂点までの最小ホップの数（Ｈ）、頂点の計算関数時間複雑度（Ｔ）、同一ではないパーティションに格納された頂点の隣の隣接頂点の数（Ｍ）を計算し、前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用して前記グラフデータの処理費用を計算し、前記計算された処理費用が最小となるパーティションを探索し、前記探索されたパーティションに当該グラフデータを割り当てる。

さらに、好ましくは、前記データ振り分け部は、各頂点の隣の隣接頂点が既に割り当てられた頂点である場合、前記計算された処理費用に連結長さ（Ｐ）を適用して処理費用を再計算する。

本発明によれば、グラフデータの処理費用を予測し、その予測された処理費用に基づいてグラフデータを振り分けることにより、グラフデータの処理費用を削減することができ、分散グラフデータの処理性能を高度化させることができる他、ビックデータ分析システムの要素技術として活用することができる。

また、共通部分グラフまたは位相の高い基準頂点を中心として連結性を考慮してグラフデータを振り分けるので、地域的な計算量を低減することができ、しかも、データの処理性能を高度化させることができる。

本発明の実施形態による分散コンピューティング環境におけるグラフデータの振り分け装置を概略的に示すブロック図である。本発明の実施形態による分散コンピューティング環境におけるグラフデータの振り分け方法を示す図である。本発明の実施形態によるグラフデータの例示図である。図３に示すグラフデータを振り分けた例示図である。

発明を実施するための最良の態様

以下、添付図面に基づき、本発明に係る「分散コンピューティング環境におけるグラフデータの振り分け方法及び装置」について詳細に説明する。ここで説明する実施形態は、本発明の技術的思想を当業者に容易に理解させるために提供されるものであり、これらにより本発明が限定されることはない。なお、添付図面に示す事項は、本発明の実施形態を容易に説明するために図式化したものであり、実際に実現される形態とは異なる場合がある。

一方、後述する各構成要素は、本発明を実現するための例に過ぎない。このため、本発明の他の実現に際しては、本発明の思想及び範囲を逸脱しない範囲内において他の構成要素が使用可能である。また、各構成要素は、単にハードウェアまたはソフトウェアの構成のみにより実現されてもよいが、同じ機能を行う様々なハードウェア及びソフトウェアの構成の組み合わせにより実現されてもよい。なお、一つのハードウェアまたはソフトウェアにより２以上の構成要素が一緒に実現されてもよい。

これらに加えて、ある構成要素を「備える」という表現は、「開放型」の表現であり、単に当該構成要素が存在することを示すだけであり、さらなる構成要素を排除するものと理解されてはならない。

本発明におけるグラフデータとは、頂点で表わされるノードと他のノードとが方向性を有するように、または、方向性を有さないように結ぶ幹線であるエッジからなるデータのことを言う。

図１は、本発明の実施形態による分散コンピューティング環境におけるグラフデータの振り分け装置を概略的に示すブロック図である。

図１を参照すると、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、共通部分グラフ探索部１１０と、パーティション生成部１２０と、データ振り分け部１３０とを備える。

共通部分グラフ探索部１１０は、グラフデータから共通部分グラフを探索する。すなわち、共通部分グラフ探索部１１０は、グラフデータのノードごとに有している隣接ノードの数及びＩＤを把握して、グラフデータの振り分けの基準となる共通部分グラフを探索する。例えば、共通部分グラフ探索部１１０は、グラフデータから隣接ノードの数が同じサブグラフを共通部分グラフとして探索する。共通部分グラフは、全体のグラフデータからグラフの構造が同じサブグラフを探索してこれらを併合したものであり、このためには、対象となるサブグラフの各頂点における隣接ノードの数が同じである必要があるため、共通部分グラフ探索部１１０は、隣接ノードの数が同じサブグラフを共通部分グラフとして探索する。そして、共通部分グラフ探索部１１０は、データがパーティションに割り当てられるとき、パーティションに格納されるノードを判別するために、または、併合された共通部分グラフの隣の隣接頂点であるかを把握するために、ノードＩＤを把握する。ここで、共通部分グラフは、再活用可能なグラフである。

パーティション生成部１２０は、共通部分グラフの存否に応じて共通部分グラフまたは頂点を基準としてパーティションを生成する。

パーティション生成部１２０は、共通部分グラフが存在する場合にその共通部分グラフを併合して一つのパーティションを生成する。もし、共通部分グラフが存在しなければ、パーティション生成部１２０は各ノードを隣接ノード数が多い順に整列し、整列されたノードのうち上位ランキングに相当するノードの頂点を基準頂点として選択し、前記選択された基準頂点を基準としてパーティションを生成する。このとき、基準頂点を基準としてパーティションを生成する理由は、データ振り分け部１３０においてデータを振り分けようとするとき、基準頂点と隣り合う頂点が振り分けられると、これを同じパーティションに格納するためである。

データ振り分け部１３０は、グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てる。このとき、データ振り分け部１３０は、各頂点別に処理費用が最小となるパーティションに当該グラフデータを振り分ける。

以下、データ振り分け部１３０がパーティションを割り当てる方法についてより詳細に説明する。

データ振り分け部１３０は、各頂点別に、共通部分グラフまたは頂点までの最小ホップの数（Ｈ）、頂点の計算関数時間複雑度（Ｔ）及び同一ではないパーティションに格納された頂点の隣の隣接頂点の数（Ｍ）を計算し、前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用してグラフデータの処理費用を計算する。

このとき、データ振り分け部１３０は、下記の数式１を用いて、計算関数時間複雑度を計算する。

ここで、Ｏ（ｖ）は、各頂点の計算費用であり、データの長さに応じて予め定められた値である。Ｏ（ｐ_ｉ）は、サーバーに割り当てられたデータの計算費用であり、所定の値である。

データ振り分け部１３０は、下記の数式２を用いて、隣の隣接頂点の数Ｍを計算する。

ここで、ｇはネットワーク通信の遅延時間を示し、Ｃ_ａｄｊは現在の頂点の隣の隣接頂点のうち他のパーティションに格納される頂点の数を示し、Ｃ_ｐｉはｐｉパーティションにこれまで格納された頂点の隣の隣接頂点のうち他のパーティションに格納される頂点の総数を示す。

データ振り分け部１３０は、最小ホップの数、計算関数時間複雑度及び隣接頂点の数が求められると、下記の数式３を用いて、当該グラフデータの処理費用を計算する。

ここで、ｗ_１、ｗ_２、ｗ_３は、重み付け値である。

上記の数式３を用いて処理費用を計算した後には、データ振り分け部１３０は、計算された処理費用が最小となるパーティションを探索する。このとき、頂点の隣の隣接頂点が既に割り当てられた頂点である場合、データ振り分け部１３０は、計算された処理費用に連結長さＰを適用して処理費用を再計算する。ここで、連結長さＰは、現在パーティションに格納する頂点Ｎ_ｉがグラフデータ上において他の頂点を経て再び出発の頂点Ｎ_ｉに戻るまでに経由した頂点の数を意味する。このため、自分に戻る経路がある場合（すなわち、連結長さＰが存在する場合）、各サーバー間のネットワーク通信費用がかかり、これによりグラフデータの処理費用が高くなるため、データ振り分け部１３０は、既に計算された処理費用に連結長さＰを適用して処理費用を再計算する。

次いで、データ振り分け部１３０は、処理費用が最小となるパーティションに当該グラフデータを振り分ける。

一方、共通部分グラフ探索部１１０、パーティション生成部１２０及びデータ振り分け部１３０のそれぞれは、コンピューティング装置上においてプログラムを起動するために必要とされるプロセッサーなどによりそれぞれ実現される。このように、共通部分グラフ探索部１１０、パーティション生成部１２０及びデータ振り分け部１３０は、物理的に独立したそれぞれの構成要素により実現され、一つのプロセッサー内において機能的に区別できるように実現される。

分散コンピューティング環境におけるグラフデータの振り分け装置１００が備えるこれらの構成要素は、ハードウェア、ソフトウェアまたはこれらの組み合わせにより実現され、一つのハードウェアまたはソフトウェアにより２以上の構成要素が同時に実現される。

このような分散コンピューティング環境におけるグラフデータの振り分け装置１００は、様々な通信規格を用いて他の電子装置と通信を行い、且つ、様々なデータ処理演算を行う電子装置により実現される。例えば、分散コンピューティング環境におけるグラフデータの振り分け装置１００はサーバー装置として実現され、このようなサーバー装置に加えて、様々な電子装置として実現される。なお、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、単一の電子装置として実現されてもよく、２以上の電子装置が組み合わせられた装置として実現されてもよい。

図２は、本発明の実施形態による分散コンピューティング環境におけるグラフデータの振り分け方法を示す図であり、図３は、本発明の実施形態によるグラフデータの例示図であり、図４は、図３に示すグラフデータを振り分けた例示図である。

図２を参照すると、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、グラフデータから共通部分グラフを探索し（ステップＳ２０２）、共通部分グラフが存在するか否かを判断する（ステップＳ２０４）。すなわち、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、グラフデータのノードごとに有している隣接ノードの数及びＩＤを把握して、グラフデータの振り分けの基準となる共通部分グラフを探索する。

ステップＳ２０４における判断の結果、共通部分グラフが存在すれば、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、その共通部分グラフを併合する（ステップＳ２０６）。

もし、ステップＳ２０４における判断の結果、共通部分グラフが存在しなければ、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、ノードの位相を基準としてノードを整列して頂点を選択する（ステップＳ２０８）。すなわち、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、各ノードの隣接ノード数が多い順にノードを整列し、隣接ノード数が最も多い頂点を選択する。

次いで、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、共通部分グラフまたは前記選択された頂点別にグループ化してパーティションを生成する（ステップＳ２１０）。

次いで、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、各頂点別に共通部分グラフまたは頂点までの最小ホップの数Ｈ、頂点の計算関数時間複雑度Ｔ及び同一ではないパーティションに格納された頂点の隣の隣接頂点の数Ｍを計算し（ステップＳ２１２）、前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用して処理費用が最小となるパーティションを探索する（ステップＳ２１４）。

分散コンピューティング環境におけるグラフデータの振り分け装置１００は、探索されたパーティションに当該グラフデータを振り分ける（ステップＳ２１６）。分散コンピューティング環境におけるグラフデータの振り分け装置１００がグラフデータを振り分ける方法について、図３及び図４に基づいて説明する。

図３に示すグラフデータの場合、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、グラフデータを検索してＡのような共通部分グラフを検索する。分散コンピューティング環境におけるグラフデータの振り分け装置１００は、Ａの共通部分グラフを併合して図４に示すように一つのパーティションＰ_１を生成する。

共通部分グラフではないノードの場合、分散コンピューティング環境におけるグラフデータの振り分け装置１００は、各ノードの隣接ノード数が多い順にノードを整列し、隣接ノード数が最も多い頂点を選択し、その選択された頂点をグループ化してパーティションＰ_２を生成する。

一方、上述した本発明に係る分散コンピューティング環境におけるグラフデータの振り分け方法は、これを起動するためのプログラム、アプリケーション、システムファイルにより実現され、本発明は、このようなプログラムなどが書き込まれたコンピュータにて読み取り可能な記録媒体として実現される。

このような分散コンピューティング環境におけるグラフデータの振り分け方法はプログラムとして作成可能であり、プログラムを構成するコード及びコードセグメントは当該分野におけるプログラマーにより容易に推論可能である。なお、分散コンピューティング環境におけるグラフデータの振り分け方法に関するプログラムは電子装置にて読み取り可能な情報記録媒体に格納され、電子装置により読み取られて起動される。

このように、本発明が属する技術分野における当業者は、本発明がその技術的思想や必須的特徴を変更することなく他の具体的な形態として実施可能であるということが理解できる筈である。よって、上述した実施形態はあらゆる面において例示的なものであり、限定的なものではないと理解されるべきである。本発明の範囲は前記詳細な説明よりは後述する特許請求の範囲によって開示され、特許請求の範囲の意味及び範囲並びにその等価概念から導き出されるあらゆる変更または変形された形態が本発明の範囲に含まれるものと解釈されるべきである。

１１０：共通部分グラフ探索部
１２０：パーティション生成部
１３０：データ振り分け部

Claims

（ａ）グラフデータから共通部分グラフを探索するステップと、
（ｂ）前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にはグラフデータを整列してパーティションを生成するステップと、
（ｃ）前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるステップと、
を含むことを特徴とする分散コンピューティング環境におけるグラフデータの振り分け方法。
前記グラフデータは、頂点で表わされるノードと他のノードとが方向性を有するように、または、方向性を有さないように結ぶ幹線であるエッジからなるデータであることを特徴とする請求項１に記載の分散コンピューティング環境におけるグラフデータの振り分け方法。
前記ステップ（ａ）は、
前記グラフデータの各ノード別の隣接ノードの数及びＩＤに基づいて共通部分グラフを探索することを特徴とする請求項１に記載の分散コンピューティング環境におけるグラフデータの振り分け方法。
前記ステップ（ｂ）は、
共通部分グラフが存在する場合にその部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合に各ノードを隣接ノード数が多い順に整列し、前記整列されたノードのうち上位ランキングに相当するノードを頂点として選択し、前記選択された頂点を基準としてパーティションを生成することを特徴とする請求項１に記載の分散コンピューティング環境におけるグラフデータの振り分け方法。
前記ステップ（ｃ）は、
各頂点別に、共通部分グラフまたは頂点までの最小ホップの数（Ｈ）、頂点の計算関数時間複雑度（Ｔ）及び同一ではないパーティションに格納された頂点の隣の隣接頂点の数（Ｍ）を計算するステップと、
前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用して前記グラフデータの処理費用を計算するステップと、
前記計算された処理費用が最小となるパーティションを探索するステップと、
前記探索されたパーティションに当該グラフデータを割り当てるステップと、
を含むことを特徴とする請求項１に記載の分散コンピューティング環境におけるグラフデータの振り分け方法。
各頂点の隣の隣接頂点が既に割り当てられた頂点である場合、前記計算された処理費用に連結長さ（Ｐ）を適用して処理費用を再計算することを特徴とする分散コンピューティング環境における請求項５に記載のグラフデータの振り分け方法。
（ａ）グラフデータから共通部分グラフを探索するステップと、
（ｂ）前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にグラフデータを整列してパーティションを生成するステップと、
（ｃ）前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるステップと、
を含むことを特徴とする分散コンピューティング環境におけるグラフデータの振り分け方法を実行するためのプログラムが書き込まれたコンピュータにて読み取り可能な記録媒体。
グラフデータから共通部分グラフを探索する共通部分グラフ探索部と、
前記探索の結果、共通部分グラフが存在する場合に部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合にグラフデータを整列してパーティションを生成するパーティション生成部と、
前記グラフデータの処理費用を計算し、前記処理費用が最小となるパーティションに前記グラフデータを割り当てるデータ振り分け部と、
を備えることを特徴とする分散コンピューティング環境におけるグラフデータの振り分け装置。
前記共通部分グラフ探索部は、前記グラフデータの各ノード別の隣接ノードの数及びＩＤに基づいて共通部分グラフを探索することを特徴とする請求項８に記載の分散コンピューティング環境におけるグラフデータの振り分け装置。
前記パーティション生成部は、共通部分グラフが存在する場合にその部分グラフを併合してパーティションを生成し、共通部分グラフが存在しない場合に各ノードを隣接ノード数が多い順に整列し、前記整列されたノードのうち上位ランキングに相当するノードを頂点として選択し、前記選択された頂点を基準としてパーティションを生成することを特徴とする請求項８に記載の分散コンピューティング環境におけるグラフデータの振り分け装置。
前記データ振り分け部は、各頂点別に、共通部分グラフまたは頂点までの最小ホップの数（Ｈ）、頂点の計算関数時間複雑度（Ｔ）、同一ではないパーティションに格納された頂点の隣の隣接頂点の数（Ｍ）を計算し、前記計算された最小ホップの数、計算関数時間複雑度及び隣接頂点の数のそれぞれに重み付け値を適用して前記グラフデータの処理費用を計算し、前記計算された処理費用が最小となるパーティションを探索し、前記探索されたパーティションに当該グラフデータを割り当てることを特徴とする請求項８に記載の分散コンピューティング環境におけるグラフデータの振り分け装置。
前記データ振り分け部は、各頂点の隣の隣接頂点が既に割り当てられた頂点である場合、前記計算された処理費用に連結長さ（Ｐ）を適用して処理費用を再計算することを特徴とする請求項１１に記載の分散コンピューティング環境におけるグラフデータの振り分け装置。