JP2018508887A

JP2018508887A - データ処理システム、計算ノードおよびデータ処理方法

Info

Publication number: JP2018508887A
Application number: JP2017541356A
Authority: JP
Inventors: 国位黄; 友▲亮▼ ▲顔▼; 望斌朱
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2015-02-06
Filing date: 2015-02-06
Publication date: 2018-03-29
Anticipated expiration: 2035-02-06
Also published as: CN106062732B; WO2016123808A1; EP3239853A4; EP3239853A1; JP6508661B2; CN106062732A; US20170331886A1; KR20170103949A; KR101999639B1; US10567494B2

Abstract

本発明は、データ処理システム、計算ノードおよびデータ処理方法を開示する。データ処理システムは管理ノードと第1のクラスの計算ノードとを含む。管理ノードは、第1の処理タスクを、第1のクラスの計算ノードに割り当てるように構成され、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、計算ノードは、データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果を取得し、管理ノードは、第1のクラスの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得する。本発明の実施形態によって提供されるデータ処理システムによると、データブロックに対して結合操作および削減操作が実行されているとき、削減操作が実行される前に、全ての結合操作を実行する必要はなく、代わりに、結合操作と削減操作は交替に実行され、その結果、計算によって占有されるメモリ空間は低減されることができ、且つ、計算時間は低減されることができる。

Description

本発明はコンピュータ技術の分野に関し、詳細には、図形演算の分野におけるデータ処理システム、計算ノードおよびデータ処理方法に関する。

情報通信技術（Information Communication Technology, ICT）がますます発展するにつれて、インターネットで生成されるデータは爆発的に増加した。データに対してデータマイニングおよび機械学習を行うことによって、大量の貴重な情報が取得されることができる。データマイニングおよび機械学習の研究対象は、通常、対象の集合および対象間の関係（例えば、ソーシャルネットワーク）である。全ての前述の研究対象は、数学的なグラフ（Graph）として表現されることができる。グラフは、対象間の関係を説明するために使用される。直感的に、グラフはいくつかの小さな点および点をつなぐ線を含んでよい。点は、グラフの頂点（Vertex）と呼ばれる。点をつなぐ線は、辺（Edge）と呼ばれる。

従って、データマイニングおよび機械学習のアルゴリズムは、グラフに対する操作、すなわち、グラフ計算に転換されることができる。グラフが操作されることができることを保証するために、グラフを表すためにデータ構造が選択される必要がある。現在、主に、隣接テーブルと隣接行列の2つのグラフ表現がある。隣接テーブルでは、頂点を表すために対象が使用され、辺を表すためにポインタまたは参照が使用される。このデータ構造は、グラフに対する同時処理に不利である。隣接行列は、本明細書では行列と略して書かれ、頂点間の隣接関係を記憶する2次元行列である。グラフは、このデータ構造を使用することによって、良好に同時に処理されることができる。加えて、データを記憶するために行列が使用されるとき、記憶されるデータ量は比較的小さい。

グラフ計算における行列計算は、理論的に、行列-ベクトル乗算操作および行列-行列乗算操作を含んでよい。既存の行列-ベクトル累乗操作、例えば、一般化された反復行列-ベクトル乗算（Generalized Iterated Matrix-Vector multiplication, GIMV）は、行列の行の要素およびベクトルの要素に対して対結合操作を行い、行の要素およびベクトルの要素に対する全ての対結合操作が完了した後、対結合操作の結果に対して全結合操作を実行することである。結果として、行列のサイズを持つ中間メモリ空間が、計算プロセスにおいて占有される必要があり、システムハードウェアデバイスに対する要件がより高くなる。加えて、行列-ベクトル乗算が分散環境において使用されるとき、システムは大量のデータを伝送する必要があり、結果として、計算のために多くの時間が費やされる。

本発明の実施形態は、データ処理システム、計算ノードおよびデータ処理方法を提供し、これらは、データ処理中により小さいメモリ空間が占有されることを保証することができ、且つ、計算時間を低減することができる。

第1の態様によると、本発明の実施形態はデータ処理システムを提供し、ここで、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、ここで、
管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、
データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

を有し、ここで、iは変数であり、iの値は1からmの範囲であり、

であり、

は

に従って取得され、m_i,jは、データブロックM_x内の要素であり、v_jは、データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲であり、
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

第1の態様を参照すると、第1の態様の第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、管理ノードは、
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルであり、
管理ノードは、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

第2の態様によると、本発明の実施形態は別のデータ処理システムを提供し、ここで、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、ここで、
管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、
データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

を有し、ここで、iおよびjは変数であり、iの値は1からmの範囲であり、jの値は1からpの範囲であり、

であり、

は

に従って取得され、m_1[i,k]は、データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲であり、
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

第2の態様を参照すると、第2の態様の第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、管理ノードは、
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列であり、
管理ノードは、
第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

第3の態様によると、本発明の実施形態は計算ノードを提供し、計算ノードは、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成される取得モジュールであって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成される処理モジュールであって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

に従って取得され、m_i,jは、データブロックM_x内の要素であり、v_jは、データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲である、処理モジュールとを含む。

第3の態様を参照すると、第3の態様の第1の可能な実施方式では、計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUである。

第4の態様によると、本発明の実施形態は別の計算ノードを提供し、別の計算ノードは、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成される取得モジュールであって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成される処理モジュールであって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

に従って取得され、m_1[i,k]は、データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である、処理モジュールとを含む。

第5の態様によると、本発明の実施形態はデータ処理方法を提供し、ここで、方法はデータ処理システムに適用され、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、方法は、
管理ノードによって、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFC_xによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するステップであって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
計算ノードFC_xによって、データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するステップであって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

に従って取得され、m_i,jは、データブロックM_x内の要素であり、v_jは、データブロックV_1x内の要素であり、j は変数であり、jの値は1からnの範囲である、ステップと、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。

第5の態様を参照すると、第5の態様の第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードのうちの少なくとも1つをさらに含み、方法は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するステップであって、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

第5の態様の第1の可能な実施方式を参照すると、第2の可能な実施方式では、データセットは、データブロックV_2xをさらに含み、データブロックV_2xは、m次元データを含むベクトルであり、方法は、
管理ノードによって、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSC_yによって、第3の処理タスクに従って、データセット内のデータブロックV_2xを取得するステップと、
計算ノードSC_yによって、SC_yによって取得された第2の中間結果V’’_yおよびデータブロックV_2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

第6の態様によると、本発明の実施形態は別のデータ処理方法を提供し、ここで、方法はデータ処理システムに適用され、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、方法は、
管理ノードによって、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFC_xによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するステップであって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
計算ノードFC_xによって、データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するステップであって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

に従って取得され、m_1[i,k]は、データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である、ステップと、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。

第6の態様を参照すると、第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、方法は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するステップであって、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

第6の態様の第1の可能な実施方式を参照すると、第2の可能な実施方式では、データセットは、データブロックM_3xをさらに含み、データブロックM_3xは、m行p列のデータを含む行列であり、方法は、
管理ノードによって、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSC_yによって、第3の処理タスクに従って、データセット内のデータブロックM_3xを取得するステップと、
計算ノードSC_yによって、SC_yによって取得された第2の中間結果M’’_yおよびデータブロックM_3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

前述の技術的解決手段に基づくと、本発明の実施形態によって提供されるデータ処理システム、計算ノードおよびデータ処理方法によって、データブロックに対して結合操作および削減操作が実行されているとき、削減操作が実行される前に、全ての結合操作を実行する必要はなく、代わりに、結合操作と削減操作は交替に実行され、その結果、計算によって占有されるメモリ空間は低減されることができ、且つ、計算時間は低減されることができる。

本発明の実施形態における技術的解決手段をより明確に説明するために、以下では、実施形態または従来技術を説明するために必要とされる添付図面を簡潔に導入する。明らかに、以下の説明における添付図面は、単に本発明のいくつかの実施形態を示す。

図1は、本発明の実施形態に係る、“グラフ”の概略図である。図2は、本発明の実施形態に係る、“グラフ”の別の概略図である。図3Aは、対象間の関係を表す“有向グラフ”の概略図である。図3Bは、図3Aにおける“有向グラフ”に対応する隣接行列を示す。図4は、行列-ベクトル乗算操作の概略図である。図5は、行列-行列乗算操作の概略図である。図6Aは、対象間の関係を表す“重み付き有向グラフ”の概略図である。図6Bは、図6Aにおける“重み付き有向グラフ” に対応する隣接行列を示す。図7は、別の行列-ベクトル乗算操作の概略図である。図8は、本発明の実施形態に係る、データ処理システムの概略ブロック図である。図9は、本発明の実施形態に係る、データ処理システムによってデータ処理を実行する概略フローチャートである。図10は、本発明の実施形態に係る、シングルソース最短経路（Single Source Shortest Path, SSSP）アルゴリズムの概略図である。図11は、本発明の実施形態に係る、別のデータ処理システムの概略ブロック図である。図12は、本発明の実施形態に係る、別のデータ処理システムによってデータ処理を実行する概略フローチャートである。図13は、本発明の実施形態に係る、別のデータ処理システムによって確率伝播アルゴリズムを実行する概略図である。図14は、本発明の実施形態に係る、計算ノードの概略ブロック図である。図15は、本発明の実施形態に係る、別の計算ノードの概略ブロック図である。図16は、本発明の実施形態に係る、別の計算ノードの概略ブロック図である。図17は、本発明の実施形態に係る、別の計算ノードの概略ブロック図である。図18は、本発明の実施形態に係る、データ処理方法の概略フローチャートである。図19は、本発明の実施形態に係る、別のデータ処理方法の概略フローチャートである。

以下では、本発明の実施形態における添付図面を参照して、本発明の実施形態における技術的解決手段を明確且つ完全に説明する。明らかに、説明される実施形態は、本発明の実施形態の全てではなく一部である。

理解を容易にするために、本明細書に関係するコンセプトおよび関連技術が、最初に簡潔に説明される。

グラフ：

グラフは、対象間の関係を説明するために使用される。直感的に、グラフはいくつかの小さな点および点をつなぐ線を含む。点は、グラフの頂点と呼ばれる。点をつなぐ線は、辺と呼ばれる。辺は図1に示される無向辺と、図2に示される有向辺とに分類されてよい。図1は、6個の対象1から6を含み、6個の対象間の関係は、6個の対象間の無向辺によって表される。図2は7個の対象0から6を含み、7個の対象間の一方向関係は、7個の対象間の有向辺によって表される。対象間の関係が有向辺によって表されるとき、グラフは有向グラフと呼ばれることができる。

乗算

本明細書では、乗算は、一般化された乗算を表してよく、または、2つの数の乗算を表してよい。例えば、行列-ベクトル乗算における乗算は、一般化された乗算を指す。すなわち、行列内の要素とベクトルに対応する要素の乗算は、従来の数の乗算ではなく、加算、減算、乗算、除算、総和、掛算、最大化または最小化等の他の処理であり、これは、本発明の実施形態では限定されない。

隣接行列：

隣接行列は、本明細書では行列と略して書かれ、グラフの頂点間の隣接関係を記憶する2次元行列である。図3Aおよび図3Bに示されるように、図3Aは有向グラフであり、6個の頂点V₁からV₆を含み、ここで、有向辺は6個の頂点間の相互関係を表し、図3Bは、対応する隣接行列の表現形態を示す。グラフを表すために隣接行列が使用され、これは、グラフに対する同時処理を容易にすることができる。行列は、密行列と疎行列とに分類されてよい。密行列は一般に、ベクトルまたは二重ベクトル（ベクトルのベクトル）を使用することによって表され、行優先順序の行列と列優先順序の行列とに分類される。疎行列（非ゼロ要素が記憶される）は一般に、COO、CSRおよびCSCの3つの記憶形式を有する。行列表現におけるゼロ要素（または、例えば、SSSPアルゴリズムの無限要素）は、記憶中に記憶される必要はなく、従って、記憶されるデータ量は、行列を使用してグラフを表すことによって、低減されることができる。隣接行列表現では、グラフに対するたいていの操作は、行列-ベクトル乗算（すなわち、行列とベクトルの乗算）操作、または、行列-行列乗算（すなわち、行列と行列の乗算）操作に転換されてよい。

行列-ベクトル乗算操作

行列-ベクトル乗算操作は、行列とベクトルとの間の一連の操作を指す。行列-ベクトル乗算操作を使用することによるグラフ計算を表現する例では、図3Aにおける有向グラフ内のV₂の全てのフレンドは、図4に示される行列-ベクトル乗算の方式で検索されることができる。初めに、クエリベクトルが構成される。V₂のアウトネイバー（OutNeighbors）が検索されるため、ベクトル内の第2の要素は1に設定され、他の要素は0に設定される。次に、outneighborsが検索されるため、隣接行列は転置される必要がある。最後に、転置の後に取得された隣接行列と構成されたベクトルが乗算され（図4に示される）、結果ベクトルを取得する。図に示される結果ベクトルの第6のビットは1であり、V₂はフレンドV₆のみを有すると示す。この結果は図3Aで検証されることができる。

行列-行列乗算操作

行列-行列乗算操作は行列間の一連の操作を指す。行列-行列乗算操作を使用することによるグラフ計算を表す例では、図3Aにおける2つの頂点毎の相互フレンド（アウトネイバー）の数は、行列-行列乗算操作を使用することによって計算されることができる。初めに、隣接行列が構成される。図3Bの行列によって示されるように、ここでは、行列はAを使用することによって表される。次いで、B=(b_ij)=A*A^T（図5に示される）を実行することによって行列B内の要素b_ijの値が取得され、第i頂点と第j頂点の相互アウトネイバーの数を表す。例えば、行3列1の値は1であり、頂点3および頂点1が1つの相互フレンドを有すると示す。

分散行列

計算のために使用される複数の計算ユニットがクラスタ環境に含まれる。行列-ベクトル乗算操作および行列-行列乗算操作は、両方とも、行列分割に基づいて実行される。分割された後、行列は、分散行列と呼ばれてよい。複数の計算ユニットを使用することによって、分散行列への同時処理が実行されてよい。

次いで、従来技術の行列-ベクトル乗算モデルについて簡潔な説明が提供される。

従来の行列操作は、数値に対してのみであり、特定の操作に対して制限が課される。例えば、従来の行列-ベクトル乗算が公式1に示され、M_ijとV_jとの間の操作は乗算以外有り得ず、一行の行列とベクトルの積間の操作は（各積はx_j= M_ijV_jとして記録される）、加算以外有り得ない。結果として、行列操作によって表されることができるアルゴリズムは非常に制限される。例えば、SSSPアルゴリズムは、従来の行列-ベクトル乗算によって表されることはできない。

ここで、Mはm行n列を持つ行列であり、M_ijはMが分割された後に取得される行列ブロックであり、Vはn次元列ベクトルであり、V_jはVが分割された後のベクトルブロックであり、V’はm次元列ベクトルである。

従来技術の行列-ベクトル乗算モデルに対する制限のために、行列-ベクトル操作に基づくビッグデータ処理システムPEGASUSはGIMVモデルを提案する。GIMVモデルは、従来の行列-ベクトル乗算を拡張する。

1. M_ijおよびV_jに対する処理は、結合操作combine2に拡張され、ここで、combine2は、行列要素とベクトル要素に対して実行される結合操作であり、行列要素とベクトル要素のタイプは異なってよく、combine2操作は、加算、減算、乗算、除算、最大化、最小化等であってよく、これは、本発明の実施形態では限定されず、combine2の後、中間値x_jが返される。

2. 行列の行に対するcombine2結果x₁, …,およびx_nに対して結合操作combineAllが実行され、ここで、combineAllは、複数の数値または記録集合に対して実行される結合操作であり、且つ、一般に、関数（例えば、累積操作であってよい）であり、combineAllの後、中間値

が返される。

3. 計算を介して現在取得された

と初期ベクトルVの要素V_iに対して割り当て操作assignが実行されて、現在計算された結果ベクトルにおける要素の値

を取得する。

GIMVモデルによると、行列MとベクトルVが入力され、3つの操作の後にベクトルV’が出力される。操作のために、主に3つの演算子がある：

ここで、
1. combine2(M_ij,V_j): M_ijとV_jに対して結合操作が実行されて、中間結果x_jを取得する；
2. combineAll(x₁,..., x_n): 行列の行のための中間結果x₁, …,およびx_nに対して結合操作が実行されて、中間結果

を取得する；
3.

: 初期ベクトルの要素V_iおよび対応する中間結果

に対して割り当て操作が実行されて、結果ベクトル内の要素の値

を取得する。

GIMVモデルはより多くのアルゴリズムを表すことができる。例えば、SSSPアルゴリズムは、combine2操作は“加算”操作であり、すなわち、combine2(M_ij,V_j)= M_ij+V_jであり、combineAll操作は“最小化”操作であり、すなわち、combineAll(x₁,..., x_n)=min(x₁,..., x_n)であり、assign操作もまた、“最小化”操作であり、すなわち、

であることに対応してよい。

図6Aは重み付き有向グラフを示し、図6Bは対応する隣接行列Mを示す。行列M内の値は、2つの点の距離の重みであり、頂点からその頂点自身までの距離は0であり、到達できないことは無限によって表される。頂点0から全ての他の頂点までの最短距離を求めるために、反復行列-ベクトル乗算が使用されてよい。各反復は、ホップカウントに1追加することによって得られる最短距離を表す（例えば、頂点1から頂点2まで1つのホップがあり、頂点2を通って、頂点1から頂点3まで2つのホップがある）。

アルゴリズムでは、初期ベクトルVが最初に構成され、頂点0から開始し、従って、図7におけるVによって示されるように、初期ベクトルVの位置0（第1行の要素）における値は0である。計算の間、図6Bにおける隣接行列Mが転置された後に得られる結果は、初期ベクトルVによって乗算され、次いで、SSSPアルゴリズムにおける3つの演算子：combine2(M_ij,V_j)= M_ij+V_j、combineAll(x₁,..., x_n)=min(x₁,..., x_n)および

を使用することによって操作が実行される。最初の乗算を介して得られた結果ベクトルV’は、1つのホップの後に到達されることができる頂点0から他の頂点までの最短距離を表す。SSSPアルゴリズムにおける反復停止条件は、反復を介して得られた結果ベクトルV’が反復の初期ベクトルVと比較して変化していない場合に、アルゴリズムが終了することである。停止条件が満たされない場合、アルゴリズムにおいて反復は実行され続ける。すなわち、現在の反復の結果ベクトルV’は、次の反復を実行するために次の反復の初期ベクトルVとして使用され、アルゴリズムに従って得られた最後の結果ベクトルV’は、頂点0から他の頂点までの最短距離である。

GIMVモデルの実行手順は、全てのcombine2操作が完了した後にのみ、行列の行のための全てのcombine2結果に対してcombineAll操作が実行されることができることである。従って、計算プロセスでは、combineAll操作は、行列のサイズを持つ中間メモリ空間を占有する必要がある。加えて、分散環境では、システムは大量のデータを伝送する必要がある。assign操作は、初期ベクトルVとcombineAllを使用することによって得られた中間ベクトル

に対して実行される操作である。従って、2つのベクトルの次元は等しい必要がある。別の観点から、行列Mは正方行列である必要がある。さらに、assign操作におけるベクトルは初期ベクトルV以外には有り得ず、これはまた、GIMVモデルの表現範囲を制限する。

本発明では、データ処理のための行列-ベクトル乗算操作プロセスにおいて、中間メモリ占有および伝送されるデータ量を低減するために、前述の解決手段における欠点のためにデータ処理方法が改善される。加えて、本発明における行列-ベクトル乗算操作の原理と同様の原理に基づいて、行列-行列乗算操作モデルが提案され、その結果、より多くのアルゴリズムが表現されることができる。

図8は、本発明の実施形態に係る、データ処理システム100の概略ブロック図である。図8に示されるように、データ処理システム100は、管理ノード110と第1のクラスの計算ノード120とを含む。

管理ノード110は、第1の処理タスクを、FC_x 121を含み、第1のクラスの計算ノード120内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_x 121は少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数である。

第1のクラスの計算ノード120内の少なくとも2つの計算ノードは、管理ノード110によって割り当てられた第1の処理タスクを同時に処理する。

計算ノードFC_x 121は、管理ノード110によって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、
データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

に従って取得され、m_i,jは、データブロックM_x内の要素であり、v_jは、データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲である。

管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

従って、本発明の本実施形態によって提供されるデータ処理システムによると、データブロックに対して結合操作および削減操作が実行されているとき、削減操作が実行される前に、全ての結合操作を実行する必要はなく、代わりに、結合操作と削減操作は交替に実行され、その結果、計算によって占有されるメモリ空間は低減されることができ、且つ、計算時間は低減されることができる。

具体的には、本発明の本実施形態によって提供されるデータ処理システム100は、ビッグデータ処理に適用されてよい。ビッグデータ処理のためのデータ量は比較的大きいため、計算効率を改善するために、データは通常分割され、異なるデータブロックは、同時計算のために異なる計算ノードに分配される。データ処理システム100は、管理ノード110と第1のクラスの計算ノード120とを含む。管理ノード110は、データ処理タスクを受信し、データ処理タスクを複数の処理タスクに分割し、処理タスクを計算ノードに配送するように構成される。管理ノード110は、データ処理プロセスを管理するために、計算ノードによって計算ノードの処理タスクを実行する状態を受信するようにさらに構成される。計算ノードは、対応する処理タスクを実行するために、管理ノード110によって配送された処理タスクを受信し、処理タスクに従って、データブロックを取得するように構成される。計算ノードは、計算ノードに記憶されたデータブロックを取得して、処理タスクを実行してよく、または、別の計算ノードに記憶されたデータブロックを取得して、処理タスクを実行してよい。処理タスクのクラスは異なるため、計算ノードは、計算ノードの処理タスクのクラスに従って分類されてよい。例えば、第1のクラスのノードは第1の処理タスクを処理し、第2のクラスのノードは第2の処理タスクを処理する。

本発明の本実施形態では、管理ノード110は、第1の処理タスクを、FC_x 121を含み、第1のクラスの計算ノード120内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_x 121は少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数である。第1のクラスの計算ノード120内の少なくとも2つの計算ノードは、管理ノード110によって割り当てられた第1の処理タスクを同時に処理する。

管理ノード110によって割り当てられた第1の処理タスクを受信した後、計算ノードFC_x 121は、第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である。データブロックM_xおよびデータブロックV_1xに対する処理は、行列-ベクトル乗算操作とみなされてよい。

計算ノードFC_x 121は、データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得し、ここで、第1の中間結果V’_xは、m次元データを含むベクトルである。第1の中間結果V’_xは、要素

であり、

は

具体的には、データブロックM_xの第i行第j列の要素およびデータブロックV_1xの第j行の要素に対して結合操作が実行されて、データブロックM_xの第i行第j列の要素およびデータブロックV_1xの第j行の要素に対応する中間結果x_jを取得する。ここでの結合操作は、上述のcombine2処理であってよく、且つ、中間結果を表現するための公式：x_j= combine2(m_i,j, v_j)において使用されてよい。

次いで、データブロックM_xの第i行に対応する中間結果x_jに対してreduce2操作が実行されて、データブロックM_xの第i行に対応する要素

を取得し、ここで、iの値は1からmの範囲であり、この場合、第1の中間結果V’_xが取得されることができる。combine2操作およびreduce2操作は、初めに、x₁およびx₂を計算して、x₁およびx₂に対してreduce2操作を実行し；次いで、x₃を計算して、x₃とx₁およびx₂に対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行し；…,データブロックM_xの第i行に対応する中間結果x_jの各要素がreduce2操作を受けるまで繰り返されることであってよい。reduce2操作は、全てのcombine2操作が完了した後に実行されないが、combine2操作とreduce2操作は交替で実行される。このようにして、計算プロセスにおいてreduce2操作を受けた中間結果x_jは削除されることができ、且つ、メモリ内に全てのcombine2操作の結果を記憶する必要はなく、従ってメモリ空間は低減されることができる。

前述のプロセスは本質的に更新プロセスであると理解されるべきである。すなわち、reduce2操作が2つのx_jに対して実行された後に得られる中間結果を取得するために、reduce2操作が初めに実行され、次いで、中間結果を連続的に更新するために、中間結果を取得するために、取得された中間結果と別のx_jまたは別の中間結果に対してreduce2操作が実行される。

ここでの削減reduce2操作は、加算、減算、乗算、除算、最大化、最小化等であってよく、これは、本発明の本実施形態で限定されない。ここでは、reduce2操作を使用することによって、行列の行の要素に対応する中間結果（例えば、x₁,…,x_n）に対する処理のために、reduce2処理は、x₁,…,x_nの全てが計算された後に実行される代わりに、中間結果x_jを計算するプロセスにおいて１ステップずつ実行される。

reduce2操作の利点は、reduce2操作が実行される要素の順序は、計算プロセスにおいて考慮される必要がなく、すなわち、reduce2操作が実行される要素の順序に関わらず結果のみが得られることであることは理解されるべきである。例えば、Scala言語では、配列はit=Array(0,1,2,3,4,5)であり、配列内の要素は合計され、これはit.reduce(_+_)と表現されてよい。計算の底層では、左から右へデータを加えることによって得られた値は、データに対して対reduce2操作を実行することによって得られる最終値と同じである。x₃とx₁およびx₂に対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行する前述の説明は、1つの実施方式にすぎない。reduce2操作の実行順序は、x₁,..., x_nの順序に限定されない。シーケンシャルな実行の後に得られた結果と同じ結果が、x₁,..., x_nのうちの任意の2つに対してreduce2操作を実行し、次いで、取得された結果および別のx_jに対してreduce2操作を実行することによって得られることができる。本発明の本実施形態におけるreduce2操作の順序に対して限定は課されない。

管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。第1の処理タスクを完了した後、第1のクラスの計算ノード120は管理ノード110に通知する。管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するか、別の処理タスクのための基礎データとして第1の中間結果を使用することによって、対応する計算ノードに、第1の中間結果を使用することによって計算されるべき処理タスクを配送する。

任意で、実施形態では、データ処理システム100は第2のクラスの計算ノードをさらに含み、且つ、管理ノード110は、
第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。

計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである。

管理ノード110は、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

具体的には、前述の処理が完了した後、第1のクラスの計算ノード120によって取得された第1の中間結果に対して他の処理がさらに実行されてよい。例えば、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって処理されるデータブロックM_xは、処理されるべきデータセット内の1行のデータブロックであり、管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得される第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当ててよく、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。

計算ノードSC_yは、第2の処理タスクに従って、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である。第2の処理タスクは、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得することであり、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである。SC_yによって取得された第1の中間結果に対して実行されたreduce2操作は上述のreduce2操作と同様である。すなわち、reduce2操作は、初めに、処理されるべきデータセット内の1行のデータブロックを使用することによって取得された2つの第1の中間結果に対して実行され、次いで、reduce2操作は、前述のreduce2操作の結果および別の第1の中間結果に対して実行される。

管理ノード110は、具体的には、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。

任意で、実施形態では、データセットはデータブロックV_2xをさらに含み、データブロックV_2xは、m次元データを含むベクトルである。管理ノード110は、具体的には、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成される。

計算ノードSC_yは、第3の処理タスクに従って、データセット内のデータブロックV_2xを取得し、
SC_yによって取得された第2の中間結果V’’_yおよびデータブロックV_2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

具体的には、処理されるべきデータセット内の1行のデータブロックを使用することによって取得された第1の中間結果に対してreduce2操作が実行された後、処理されるべきデータセットのための処理結果を取得するために、取得された第2の中間結果に対してassign操作がさらに実行されてよい。第2の中間結果V’’_yおよびデータブロックV_2xの両方は、m次元データを含むベクトルである。結果ベクトルは、対応する要素に対してassign操作を実行することによって取得されてよく、ここで、結果ベクトルはm次元列ベクトルである。ここでの割り当て処理は、上述のassign処理であってよく、且つ、結果ベクトル内の要素V_3,i=assign(V’’_i,V_2,i)を表現するための公式において使用されてよく、ここで、m個のV_3,iは結果ベクトルV_3xを形成する。

前述は、行列-ベクトル乗算操作プロセスである。結論として、本発明の本実施形態における行列-ベクトル乗算操作は、以下の公式3：

として表されてよい。

既存のGIMVモデルと比較すると、本発明の本実施形態におけるassign処理ではベクトルV₂が追加され、従って、結果ベクトルV₃は、
V₃=α*M*V₁+β*V₂ (公式4)
として表現されてよく、ここで、αおよびβは数値であり、公式4は、既存のGIMVモデルと比較して、本発明の本実施形態におけるデータ処理システム100によって取得される結果ベクトルV₃に重みV₂が導入されることを示し、その結果、assign処理はもはや乗算のために使用されるベクトルに限定されず、非正方行列に対する行列乗算操作がサポートされることができ、行列-ベクトル乗算操作の表現範囲を拡張する。

以下では、行列-ベクトル乗算操作に重みV₂を導入する関数を説明するための具体的な例を使用する。例えば、性能テストのために使用されるページランクpagerankアルゴリズムでは、“加算のために使用されるベクトル”（前述のベクトルV₂に対応する）はしばしば操作のために(1-d)/Nに設定される。ベクトル(1-d)/Nは対応するグラフにおける頂点のpagerank値を調整するために使用されてよく、その結果、頂点のpagerank値は真実性をより良く満たす。pagerank値はRとして表現されてよく、具体的には、公式5として表現される：

例えば、いくつかの公式ウェブサイトについては、公式ウェブサイトに対応する頂点の値はベクトル内で比較的大きく設定されてよく、この場合、取得される結果pagerank値は一般に比較的大きい。

任意で、実施形態では、m=nであり、データブロックV_1xおよびデータブロックV_2xは同じデータブロックである。すなわち、それと共にデータブロックM_xに対して操作が実行されるデータブロックV_1xとassign操作を実行するために使用されるデータブロックV_2xは同じデータブロックである。

任意で、実施形態では、第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、第2のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第2の処理タスクを同時に処理する。処理されるべきデータセットが行と列両方によって分割されるとき、第2のクラスの計算ノードのうちの少なくとも2つが、第2の処理タスクを処理するために必要とされる。処理されるべきデータセットが列によってのみ分割されるとき、第2のクラスの計算ノードのうちの1つが必要とされる。処理されるべきデータセットが行によってのみ分割されるとき、第2のクラスの計算ノードは必要とされず、すなわち、第2の処理タスクは処理される必要がない。

任意で、実施形態では、管理ノード、第1のクラスの計算ノードおよび第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUであってよく、これは、本発明の本実施形態では限定されない。

以下では、具体的な例を参照して、本発明の本実施形態を詳細に説明する。

図9は、本発明の実施形態に係る、データ処理システム100によってデータ処理を実行する概略フローチャートである。図9に示されるように、データ処理システム100によって実行されるデータ処理は、以下のステップを含む：

S201：前処理を実行して、データブロックM’、データブロックV₁’およびデータブロックV₂’を取得し、ここで、データブロックM’は行列であり、データブロックV₁’およびデータブロックV₂’はベクトルである。

S202：行列分配を実行し、行列M’を分割し、行列M’のブロックをクラスタの少なくとも2つの計算ノードに分配し、ここで、データブロックM_xは計算ノードFC_xに分配される。

S203：データブロックV₂’を分配し、データブロックV₂’を分割し、分割されたデータブロックV₂’をブロードキャストする。

S204：データブロックV₁’を分配し、データブロックV₁’を分割し、分割されたデータブロックV₁’をブロードキャストする。S202からS204で分割された行列およびベクトルは、対応して、少なくとも2つの計算ノードに分配され、ここで、計算ノードは分散されている。

S205：各計算ノードは部分combine2処理および部分reduce2処理を実行する。データブロックM_xおよびデータブロックV_1xに対してcombine2処理が実行され、データブロックM_xおよびデータブロックV_1xに対応する全ての中間結果が取得される前に、中間結果に対してreduce2処理が実行されて、第1の中間結果を取得する。次いで、第1の中間結果および新たに取得された中間結果に対してreduce2処理が実行されて、新しい第1の中間結果を取得する。最後の第1の中間結果は、データブロックM_xおよびデータブロックV_1xに対応する全ての中間結果に対してreduce2処理が実行した後に取得される結果である。

S206：各計算ノードは、S205で取得された第1の中間結果に対して全データ伝送を実行し、その結果、第1の中間結果は1つの計算ノード内に集められる。本発明の本実施形態における方法によると、全データ伝送は、削減処理の後に取得されたデータに対して実行される。従って、既存の行列-ベクトル乗算操作と比較して、伝送されたデータ量は大幅に削減される。

S207：行列M’内の1つの水平位置における少なくとも2つの行列ブロックに対応する第1の中間結果の要素に対してreduce2処理を実行して、第2の中間結果の要素を取得する。すなわち、1つの水平位置における複数の行列ブロックの各行内の第1の中間結果の要素に対してreduce2処理が実行されて、第2の中間結果の要素を取得する。第2の中間結果の複数の要素は第2の中間結果V’’_yを形成する。

S208：第2の中間結果V’’_yの要素およびデータブロックV_2x内の対応する要素に対してassign処理を実行して、結果ベクトル内の要素を取得して、結果ベクトルをさらに取得する。

S209：終了条件が満たされるかどうかを判定し、終了条件が満たされる場合、プロセスは終了し、または、終了条件が満たされない場合、次の反復のためのデータブロックV₁’として結果ベクトルを使用することによって、S204からS209 を実行する。

以下では、上述のSSSPアルゴリズムを使用することによって、頂点0から他の頂点までの最短距離を決定することに関する課題を解決する例を使用することによって、本発明の本実施形態を説明する。SSSPアルゴリズムにおける行列は、図6Bにおける隣接行列Mに対して転置が実行された後に取得される行列であり、且つ、ベクトルV₁とベクトルV₂の両方は図7におけるVである。図10に示されるように、図6Bにおける隣接行列Mに対して転置が実行された後に取得される行列および初期ベクトルVが最初に分割される。次いで、行列のブロックとVの対応するブロックに対してcombine2処理およびreduce2処理が実行される。ここでは、行列のブロックとVの対応するブロックに対するcombine2処理を介して全ての第1の中間結果が取得される前に、reduce2処理が実行され、すなわち、combine2処理とreduce2処理は交替で実行される。ブロックに対してcombine2処理およびreduce2処理が実行された後、各行列ブロックに対応する第1の中間結果が取得されることができる。1行の行列ブロックに対応する第1の中間結果に対するreduce2処理を実行することによって中間ベクトル

が取得されることができる。中間ベクトル

とVに対してassign処理が実行されて、結果ベクトルを取得する。combine2処理は“加算”処理であり、且つ、combine2(M_ij,V_j)=M_ij+V_jであり；reduce2処理は“最小化”処理であり、且つ、reduce2(x₁,x₂)=min(x₁,x₂)であり；assign処理は“最小化”処理であり、且つ、

である。

従って、本発明の本実施形態によって提供されるデータ処理方法によると、データブロックに対して結合操作および削減操作が実行されているとき、削減操作が実行される前に、全ての結合操作を実行する必要はなく、代わりに、結合操作と削減操作は交替に実行され、その結果、計算によって占有されるメモリ空間は低減されることができ、且つ、計算時間は低減されることができる。

図11は、本発明の別の実施形態に係る、データ処理システム300の概略ブロック図である。図11に示されるように、データ処理システム300は、管理ノード310および第1のクラスの計算ノード320を含む。

管理ノード310は、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード320内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数である。
第1のクラスの計算ノード320内の少なくとも2つの計算ノードは、管理ノード310によって割り当てられた第1の処理タスクを同時に処理する。

計算ノードFC_xは、管理ノード310によって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、
データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

に従って取得され、m_1[i,k]は、データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である。

管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

具体的には、本発明の本実施形態によって提供されるデータ処理システム300は、ビッグデータ処理に適用されてよい。ビッグデータ処理のためのデータ量は比較的大きいため、計算効率を改善するために、データは通常分割され、異なるデータブロックは、同時計算のために異なる計算ノードに分配される。データ処理システム300は、管理ノード310と第1のクラスの計算ノード320とを含む。管理ノード310は、データ処理タスクを受信し、データ処理タスクを複数の処理タスクに分割し、処理タスクを計算ノードに配送するように構成される。管理ノード310は、データ処理プロセスを管理するために、計算ノードによって計算ノードの処理タスクを実行する状態を受信するようにさらに構成される。計算ノードは、対応する処理タスクを実行するために、管理ノード310によって配送された処理タスクを受信し、処理タスクに従って、データブロックを取得するように構成される。計算ノードは、計算ノードに記憶されたデータブロックを取得して、処理タスクを実行してよく、または、別の計算ノードに記憶されたデータブロックを取得して、処理タスクを実行してよい。処理タスクのクラスは異なるため、計算ノードは、計算ノードの処理タスクのクラスに従って分類されてよい。例えば、第1のクラスのノードは第1の処理タスクを処理し、第2のクラスのノードは第2の処理タスクを処理する。

本発明の本実施形態では、管理ノード310は、第1の処理タスクを、FC_x 321を含み、第1のクラスの計算ノード320内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_x 321は少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数である。第1のクラスの計算ノード320内の少なくとも2つの計算ノードは、管理ノード310によって割り当てられた第1の処理タスクを同時に処理する。

管理ノード310によって割り当てられた第1の処理タスクを受信した後、計算ノードFC_x 321は、第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である。データブロックM_1xおよびデータブロックM_2xに対する処理は、行列-行列乗算操作とみなされてよい。

計算ノードFC_x 321は、データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得し、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列である。第1の中間結果M’_xは、要素

であり、

は

具体的には、データブロックM_1xの第i行第z列の要素およびデータブロックM_2xの第k行第j列の要素に対して結合操作が実行されて、データブロックM_1xの第i行第k列の要素およびデータブロックM_2xの第k行第j列の要素に対応する中間結果x_ikjを取得する。ここでの結合操作は、上述のcombine2操作であってよく、且つ、中間結果を表現するための公式：x_ikj= combine2(m_1[i,k], m_2[k,j])において使用されてよい。

次いで、データブロックM_1xの第i行およびデータブロックM_2xの第j列に対応する中間結果x_ikjに対してreduce2操作が実行されて、データブロックM_xの第i行およびデータブロックM_2xの第j列に対応する要素

を取得し、ここで、iの値は1からmの範囲であり、jの値は1からpの範囲であり、この場合、第1の中間結果M’_xが取得されることができる。combine2操作およびreduce2操作は、初めに、x_i1jおよびx_i2jを計算して、x_i1jおよびx_i2jに対してreduce2操作を実行し；次いで、x_i3jを計算して、x_i3jとx_i1jおよびx_i2jに対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行し；…,データブロックM_xの第i行およびデータブロックM_2xの第j列に対応する中間結果x_ikjの各要素がreduce2操作を受けるまで繰り返されることであってよい。reduce2操作は、全てのcombine2操作が完了した後に実行されないが、combine2操作とreduce2操作は交替で実行される。このようにして、計算プロセスにおいてreduce2操作を受けた中間結果x_jは削除されることができ、且つ、メモリ内に全てのcombine2操作の結果を記憶する必要はなく、従ってメモリ空間は低減されることができる。

前述のプロセスは本質的に更新プロセスであると理解されるべきである。すなわち、reduce2操作が2つのx_ikjに対して実行された後に得られる中間結果を取得するために、reduce2操作が初めに実行され、次いで、中間結果を連続的に更新するために、中間結果を取得するために、取得された中間結果と別のx_ikjまたは別の中間結果に対してreduce2操作が実行される。

ここでの削減reduce2操作は、加算、減算、乗算、除算、最大化、最小化等であってよく、これは、本発明の本実施形態で限定されない。ここでは、reduce2操作を使用することによって、行列の行の要素に対応する中間結果（例えば、x_i1j,…, x_inj）に対する処理のために、reduce2処理は、x₁,…,x_nの全てが計算された後に実行される代わりに、中間結果x_ikjを計算するプロセスにおいて１ステップずつ実行される。

reduce2操作の利点は、reduce2操作が実行される要素の順序は、計算プロセスにおいて考慮される必要がなく、すなわち、reduce2操作が実行される要素の順序に関わらず結果のみが得られることであることは理解されるべきである。例えば、Scala言語では、配列はit=Array(0,1,2,3,4,5)であり、配列内の要素は合計され、これはit.reduce(_+_)と表現されてよい。計算の底層では、左から右へデータを加えることによって得られた値は、データに対して対reduce2操作を実行することによって得られる最終値と同じである。x_i3jとx_i1jおよびx_i2jに対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行する前述の説明は、1つの実施方式にすぎない。reduce2操作の実行順序は、x_i1j,..., x_injの順序に限定されない。シーケンシャルな実行の後に得られた結果と同じ結果が、x_i1j,..., x_injのうちの任意の2つに対してreduce2操作を実行し、次いで、取得された結果および別のx_jに対してreduce2操作を実行することによって得られることができる。本発明の本実施形態におけるreduce2操作の順序に対して限定は課されない。

管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。第1の処理タスクを完了した後、第1のクラスの計算ノード320は管理ノード310に通知する。管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するか、別の処理タスクのための基礎データとして第1の中間結果を使用することによって、対応する計算ノードに、第1の中間結果を使用することによって計算されるべき処理タスクを配送する。

任意で、実施形態では、データ処理システム300は第2のクラスの計算ノードをさらに含み、管理ノード310は、
第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。

計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である。

管理ノード310は、具体的には、
第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。

具体的には、前述の処理が完了した後、第1のクラスの計算ノード320によって取得された第1の中間結果に対して他の処理がさらに実行されてよい。例えば、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって処理されたデータブロックM_1xが、処理されるべきデータセット内の1行のデータブロックであり、且つ、データブロックM_2xが処理されるべきデータセット内の1列のデータブロックであるとき、管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当ててよく、ここで、SC_yは、少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。

計算ノードSC_yは、第2の処理タスクに従って、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、データブロックM_1xおよびデータブロックM_2xに従って取得された第1の中間結果であり、ここで、データブロックM_1xは、処理されるべきデータセット内の1行のデータブロックであり、データブロックM_2xは、処理されるべきデータセット内の1列のデータブロックである。第2の処理タスクは、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得することであり、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である。SC_yによって取得された第1の中間結果に対して実行されたreduce2操作は上述のreduce2操作と同様である。すなわち、reduce2操作は、初めに、データブロックM_1xおよびデータブロックM_2xを使用することによって取得された2つの第1の中間結果に対して実行され、次いで、reduce2操作は、前述のreduce2操作の結果および別の第1の中間結果に対して実行され、ここで、データブロックM_1xは、処理されるべきデータセット内の1行のデータブロックであり、データブロックM_2xは、処理されるべきデータセット内の1列のデータブロックである。

任意で、実施形態では、データセットは、データブロックM_3xをさらに含み、データブロックM_3xは、m行p列のデータを含む行列である。管理ノード310は、
SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成される。

計算ノードSC_yは、
第3の処理タスクに従って、データセット内のデータブロックM_3xを取得し、
SC_yによって取得された第2の中間結果M’’_yおよびデータブロックM_3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

具体的には、処理されるべきデータセット内にあるM_1xの1行のデータブロックおよびM_2xの1列のデータブロックを使用することによって取得された第1の中間結果に対してreduce2操作が実行された後、処理されるべきデータセットのための処理結果を取得するために、取得された第2の中間結果に対してassign操作がさらに実行されてよい。第2の中間結果M’’_yおよびデータブロックM_3xの両方は、m行p列のデータを含む行列である。結果ベクトルは、対応する要素に対してassign操作を実行することによって取得されてよく、ここで、結果ベクトルはm行p列のデータを含む行列である。ここでの割り当て処理は、上述のassign処理であってよい。

前述は、行列-行列乗算操作プロセスである。結論として、本発明の本実施形態における行列-行列乗算操作は、以下の公式6として表現されてよい：

任意で、実施形態では、データ処理システム300内の第2のクラスの計算ノードは、処理されるべきデータセットのために処理結果の第r行に対して行処理を実行するようにさらに構成され、ここで、行処理は、第r行の要素に対する処理である。

具体的には、結果行列Dがさらに処理されてよい。例えば、結果行列Dの第r行の要素に対して削減処理が実行されてよく、これは、公式reduceRow(D_i1,…,D_in)を使用することによって表現されてよく、ここで、reduceRow処理は、最大化、最小化、Q個の最大値の選択、Q個の最小値の選択、行内のデータの和等であってよく、これは、本発明の本実施形態では限定されない。reduceRow処理後に取得される結果は、依然として対応する行列形態で記憶されてよい。例えば、結果行列Dの第i行が最大化され、最大値はD_i1であり、この場合、数値D_i1は記憶された行列の第i行第1列に記憶され、且つ、数値0は他の列に記憶される（または0は記憶されない）。reduceRow処理後に取得された結果が記憶されるとき、処理後に取得された数値のみが記憶されてよい。例えば、結果行列Dの第i行に対して加算処理が実行され、且つ、加算の結果はYであり、この場合、数値Yが記憶される。本発明の本実施形態における記憶方式に対して限定は課されない。

同様に、実施形態では、データ処理システム300内の第2のクラスの計算ノードは、処理されるべきデータセットのための処理結果の第c列に対して列処理を実行するようにさらに構成され、ここで、列処理は、第c列の要素に対する処理である。繰返しを回避するために、本明細書では詳細はさらに繰り返されない。

任意で、実施形態では、n=pであり、データブロックM_1xとデータブロックM_3xは同じデータブロックである。例えば、データブロックM_1xは3行4列を持つ行列であり、データブロックM_2xは4行4列を持つ行列であり、データブロックM_1xおよびデータブロックM_2xに対して結合処理が実行されて、3行4列を持つ行列を取得し、3行4列を持つ行列とデータブロックM_3xに対して割り当て処理が実行されて、結果行列を取得し、従って、データブロックM_1xおよびデータブロックM_3xは同じデータブロックであってよいことは理解されるべきである。

任意で、実施形態では、n=mであり、データブロックM_2xとデータブロックM_3xは同じデータブロックである。本発明の本実施形態では、計算要件を満たすために、計算に使用される、データブロックM_1x、データブロックM_2xまたはデータブロックM_3xのうちの少なくとも1つに対して転置等の操作が実行されてよいことは理解されるべきである。従って、データブロックM_2xとデータブロックM_3xは同じデータブロックである。

任意で、実施形態では、第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、第2のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第2の処理タスクを同時に処理する。

任意で、実施形態では、管理ノード、第1のクラスの計算ノードおよび第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含んでよい。

図12は、本発明の実施形態に係る、データ処理システム300によってデータ処理を実行するための方法400の概略フローチャートである。図12に示されるように、方法400は以下のステップを含む：

S401：前処理を実行して、データブロックM₁、データブロックM₂およびデータブロックM₃を取得し、ここで、データブロックM₁、データブロックM₂およびデータブロックM₃の全ては行列である。

S402：行列分割を実行して、データブロックM₁およびデータブロックM₂を分割し、ここで、データブロックM₁は複数のデータブロックM_1xに分割され、データブロックM_1xはm行n列のデータを含む行列であり、データブロックM₂は複数のデータブロックM_2xに分割され、データブロックM_2x はn行p列のデータを含む行列である。

S403：行列分配を実行して、データブロックM_1xを行ごとに少なくとも1つの計算ノードに分配し、対応して、データブロックM_2xを列ごとに少なくとも1つの計算ノードに分配する。

S404：第1のクラスの計算ノードの各々は、部分combine2処理および部分reduce2処理を実行する。combine2処理はデータブロックM_1xおよびデータブロックM_2xに対して実行され、データブロックM_1xの行およびデータブロックM_2xの対応する列に対応する全ての中間結果が取得される前に、中間結果に対してreduce2処理が実行されて、第1の中間結果を取得する。次いで、第1の中間結果および新たに取得された中間結果に対してreduce2処理が実行されて、新しい第1の中間結果を取得する。最後の第1の中間結果は、データブロックM_1xの行およびデータブロックM_2xの対応する列に対応する全ての中間結果に対してreduce2処理が実行された後に取得される結果である。さらに、類推によって、データブロックM_1xの行およびデータブロックM_2xの列の全ての組合せに対応する第1の中間結果が取得され、ここで、第1の中間結果は行列を形成することができる。

S405：第1のクラスの計算ノードの各々は、S404で取得された第1の中間結果に対して全データ伝送を実行し、その結果、第1の中間結果は第2のクラスの計算ノードのうちの1つ内に集められる。本発明の本実施形態における方法によると、全データ伝送は、削減処理の後に取得されたデータに対して実行される。従って、伝送されたデータ量は比較的小さい。

S406：データブロックM₁の行およびデータブロックM₂の列に対応する少なくとも2つのデータブロックに対応する第1の中間結果に対してreduce2処理を実行して、第2の中間結果を取得する。複数の第2の中間結果は中間行列Xを形成し、中間行列Xは分割されて、少なくとも1つの計算ノードに分配される。

S407：データブロックM₃を分割および分配し、データブロックM₃のデータブロックM_3xを中間行列Xの行列ブロックが配置される計算ノードに分配し、ここで、データブロックM_3xはm行p列のデータを含む行列である。

S408：中間行列Xの行列ブロック内の要素およびデータブロックM_3x内の対応する要素に対してassign処理を実行して、結果行列Dの行列ブロック内の要素を取得して、結果行列Dの行列ブロックをさらに取得する。

S409：結果行列Dの各行列ブロックに対して、ブロックごとにreduceRow処理を実行する。

S410：データ伝送を実行して、S409において取得される各結果を伝送し、次いで、1行の行列ブロックに対応する結果に対してreduceRow処理を実行して、行列Yを取得する。

S411：行列Yの各行列ブロックに対して、列ごとにreduceCol処理を実行する。

S412：データ伝送を実行して、S411において取得された各結果を伝送し、次いで、1列の行列ブロックに対応する結果に対してreduceCol処理を実行して、行列Zを取得する。

確率伝播は推奨されるアルゴリズムの1つである。“ユーザプロジェクト”相互記録データベースは、各ユーザに対して、ユーザが興味を持ち得るいくつかのプロジェクトを推奨する必要がある。確率伝播はグローバルデータに基づき、且つ、ユーザによって潜在的に興味を持たれている全てのプロジェクトを一度に計算するために使用されることができる。アルゴリズムは、堅実な理論的基礎を有する。確率伝播は、物理学における“エネルギー保存の法則”から発展している。行列の操作は、異なる物質間のエネルギー伝播に類似しており、且つ、最終的に取得される興味度行列および元の行列については、対応する行の合計は絶対的に等しく、且つ、対応する列の合計もまた絶対的に等しく、このことはエネルギーの保存を明らかにする。

確率伝播アルゴリズムは、行列に対する操作を使用することによって実施されてよい。行列を使用する既存の確率伝播アルゴリズムの実施において、“映画によるユーザへの魅力度の行列”および“ユーザ間の興味の類似度の行列”が取得されることができ、次いで、“映画によるユーザへの新しい魅力度の行列”を取得するために行列-行列乗算操作が実行され、次に、ユーザによって視聴された映画がふるいにかけられ、最終的に、視聴されていないtop kの映画のみが各ユーザに対して推奨される。確率伝播アルゴリズムによると、各ユーザに対していくつかの映画のみが提供され、比較的疎な結果行列（比較的多くのゼロ要素がある）が取得され、一般的に、データ量は比較的小さい（このようなシナリオでは、ゼロ要素は記憶される必要がない）。しかしながら、既存の解決手段では、“映画によるユーザへの新しい魅力度”の非常に密な行列は、通常、計算プロセスで取得され、データ量は非常に大きい。これは、大量の占有された中間メモリおよびシステムによって伝送された大量のデータという結果をもたらす。

本発明の実施形態における行列-行列乗算操作を使用することによって実施された確率伝播アルゴリズムでは、元のデータセットにはm個の映画とn人のユーザがあり、top kの映画が各ユーザに対して推奨される。第1の行列Aはm行n列を持つ“映画によるユーザへの魅力度”の行列であり、第2の行列Bはn行n列を持つ“ユーザ間の興味の類似度”の行列であり、assign処理で使用される第3の行列Cおよび第1の行列Aは同じ行列である。この場合、各ユーザに対して、視聴されていないtop kの映画を推奨するための公式は

である。

具体的な計算プロセスは、最初に、第1の行列A内の要素および第2の行列B内の要素に対してcombine2処理およびreduce2処理を実行することである。ここで、reduce2処理は、第1の行列A内の要素および第2の行列B内の要素に対するcombine2処理を介して、全ての中間結果が取得される前に実行され、すなわち、combine2処理とreduce2処理は交替で実行される。第1の行列A内の要素および第2の行列B内の要素に対してcombine2処理およびreduce2処理が実行された後、第1の行列Aおよび第2の行列Bに対応する第1の中間結果が取得されることができる。assign処理で使用される第1の中間結果と第3の行列Cに対してassign処理が実行されて、結果行列Dを取得する。最後に、結果行列Dの列に対してreduceCol処理が実行される。

combine2処理は“乗算”処理であり、且つ、combine2(A_ij,B_jk)=A_ij*B_jkである。reduce2処理は“加算”処理であり、且つ、x_ik=reduce2(x_i1k,x_i2k)=x_i1k+x_i2kである。assign処理は“スクリーニング”処理であり、且つ、

である。すなわち、assign処理が実行される第3の行列C内の対応する位置における要素が非ゼロである場合、要素は、ふるいにかけられる（要素は0に設定される）。換言すると、ユーザが映画を視聴しない場合、データは予約され、または、ユーザが映画を視聴した場合、reduceCol処理を実行するために、データはふるいにかけられる（要素は0に設定される）。reduceCol処理は、“top kの評価”処理であり、reduceCol(D_1j,…,D_mj)=(D_1j,…,D_mj).topkであり、すなわち、第j列のk個の最大値が評価され、ここで、この例におけるkは1である。

図13は、本発明の実施形態における行列-行列乗算操作を使用することによって実施される確率伝播アルゴリズムの主なフローチャートである。最初に、第1の行列Aの1行および第2の行列Bの1列に対してcombine2処理およびreduce2処理が実行されて、値

を取得する。次いで、assign処理で使用される第3の行列C内の対応する位置における値は1であるため、assign処理が実行されて、結果行列D内の対応する要素の値が0であることを取得する（システムがゼロ要素を記憶しない場合、対応するcombine2処理およびreduce2処理は、計算のために実行されなくてよい）。最後に、1つの列内の取得された要素に対してtop k評価処理が実行されて、その魅力度がtop kであり、且つ、ユーザによって視聴されていない映画を取得する。

本発明の実施形態における行列-行列乗算操作によると、確率伝播アルゴリズムを使用することによって、“ユーザに対する映画の新しい魅力度”の行列を計算するプロセスでは、視聴された映画はふるいにかけられることができ（ふるいにかけられる必要がある記録に対するさらなる計算は直接省略されることができる）、且つ、ユーザからのスコアに従って、top kをランク付けした映画が推奨され、その結果、中間メモリの占有およびシステムによって伝送されたデータ量は低減される。

本発明の実施形態における行列-ベクトル乗算操作および行列-行列乗算操作のプロセスでは、行に対して計算が実行される必要があるかどうかを判定するためにisCompute演算子が導入されることができることは理解されるべきである。計算が必要とされない場合、行はスキップされ、次の行が続いて計算される。計算が必要とされる場合、combine2操作およびreduce2操作がアルゴリズムに従って実行される。通常、行列-ベクトル乗算操作におけるisCompute演算子は、その要素の数がデータブロックM_xの行数と等しい列ベクトルであってよく、行列-行列乗算操作におけるisCompute演算子は行列であってよく、これは、本発明の実施形態では限定されない。

以下では、本発明の実施形態における行列-ベクトル乗算操作の性能および行列-行列乗算操作の性能を説明する。

一般的な同時計算フレームワークsparkでは、従来技術における拡張GIMVモデルの性能が、本発明の実施形態における行列-ベクトル乗算操作の性能と比較される。テスト環境は、3つのマシン（3つのRH2285、12コア、24スレッド、192gメモリ、100g設定）を含むクラスタである。wiki_talkデータセットにおけるデータがテストされ、テスト結果は、本発明の実施形態における行列-ベクトル乗算操作は340sを必要とする一方で、従来技術における拡張GIMVモデルのための計算時間は3600sを超過すると示す。

同様に、sparkでは、本発明の実施形態における行列-行列乗算操作の性能は、従来技術における“推奨された映画を探すこと”を実施する操作の性能と比較される。表1は、テストされたデータセットのサイズおよびテスト結果を示す。相互インターネットプロトコルテレビジョン（IPTV）データセットおよびNETFLIX (Nasdaq NFLX, NETFLIX)データセット内のデータがテストされる。テスト結果から、本発明の実施形態によると、中間メモリの占有は有効に低減されることができ、且つ、計算時間は短縮されることができ、従って、より大きいデータセットが処理されることができることがわかる。

図1乃至図13を参照すると、前述では、本発明の実施形態に係るデータ処理システムを詳細に説明する。図14および図15を参照すると、以下では、本発明の実施形態に係るデータ処理システムにおける計算ノードを詳細に説明する。

図14は、本発明の実施形態に係る計算ノード500を示す。計算ノード500はデータ処理システムに属する。データ処理システムは管理ノードをさらに含む。計算ノード500は、
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール501と、
管理ノードによって割り当てられ、受信モジュール501によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成される取得モジュール502であって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュール502と、
データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成される処理モジュール503であって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

に従って取得され、m_i,jは、データブロックM_x内の要素であり、v_jは、データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲である、処理モジュール503とを含む。

任意で、実施形態では、計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUであり、これは、本発明の本実施形態では限定されない。

従って、本発明の本実施形態によって提供される計算ノードによると、データブロックに対して結合操作および削減操作が実行されているとき、削減操作が実行される前に、全ての結合操作を実行する必要はなく、代わりに、結合操作と削減操作は交替に実行され、その結果、計算によって占有されるメモリ空間は低減されることができ、且つ、計算時間は低減されることができる。

図15は、本発明の実施形態に係る計算ノード600を示す。計算ノード600はデータ処理システムに属する。データ処理システムは管理ノードをさらに含む。計算ノードは、
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール601と、
管理ノードによって割り当てられ、受信モジュール601によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成される取得モジュール602であって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュール602と、
データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成される処理モジュール603であって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

に従って取得され、m_1[i,k]は、データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である、処理モジュール603とを含む。

図16に示されるように、本発明の実施形態は計算ノード700をさらに提供する。計算ノード700は、プロセッサ701、メモリ702、バスシステム703およびトランシーバ704を含む。プロセッサ701、メモリ702およびトランシーバ704は、バスシステム703を使用することによって接続される。メモリ702は命令を記憶するように構成される。プロセッサ701は、メモリ702によって記憶された命令を実行するように構成される。トランシーバ704は、
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成され、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である。

プロセッサ701は、
データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

本発明の本実施形態では、プロセッサ701は中央処理装置（Central Processing Unit, CPU）であってよいことは理解されるべきである。プロセッサ701は、あるいは、別の汎用プロセッサ、デジタル信号プロセッサ（Digital Signal Processor, DSP）、特定用途向け集積回路（Application-Specific Integrated Circuit, ASIC）、フィールドプログラマブルゲートアレイ（Field-Programmable Gate Array, FPGA）または別のプログラマブル論理デバイス、離散ゲートまたはトランジスタ論理デバイス、離散ハードウェアコンポーネント等であってよい。汎用プロセッサはマイクロプロセッサであってよく、または、プロセッサは、任意の従来のプロセッサ等であってよい。

メモリ702は、読出し専用メモリおよびランダムアクセスメモリを含み、且つ、プロセッサ701のための命令およびデータを提供してよい。メモリ702の一部は、不揮発性ランダムアクセスメモリをさらに含んでよい。例えば、メモリ702は、デバイスタイプに関する情報をさらに記憶してよい。

データバスを含むことに加えて、バスシステム703は、電源バス、制御バス、ステータス信号バス等をさらに含んでよい。しかしながら、明確な説明のために、全ての種類のバスは、図内でバスシステム703としてマークされる。

実施プロセスでは、前述の方法の全てのステップは、プロセッサ701におけるハードウェアの集積論理回路を使用することによって完了してよく、または、ソフトウェア形態で命令を使用することによって完了してよい。本発明の本実施形態を参照して開示される方法のステップは、ハードウェアプロセッサによって実行および完了されてよく、または、プロセッサにおけるハードウェアおよびソフトウェアモジュールの組合せを使用することによって実行および完了されてよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読出し専用メモリ、プログラマブル読出し専用メモリ、電気的に消去可能なプログラマブルメモリまたはレジスタ等の当該技術で成熟した記憶媒体内に配置されてよい。記憶媒体はメモリ702内に配置される。プロセッサ701は、メモリ702内の情報を読み出し、プロセッサ701のハードウェアを参照して、前述の方法のステップを完了する。繰返しを回避するために、詳細はここではさらに繰り返されない。

任意で、実施形態では、計算ノード700は、物理マシン、仮想マシンまたは中央処理装置CPUである。

本発明の本実施形態における計算ノード700は、本発明の前述の実施形態における方法を実行するためのエンティティに対応してよく、または、本発明の前述の実施形態における計算ノード500に対応してよいことは理解されるべきである。加えて、計算ノード700のモジュールの前述のまたは他の操作および/または機能は、データ処理方法の対応する手順を実施するものである。簡潔さのために、詳細はここではさらに繰り返されない。

図17に示されるように、本発明の実施形態は計算ノード800をさらに提供する。計算ノード800は、プロセッサ801、メモリ802、バスシステム803およびトランシーバ804を含む。プロセッサ801、メモリ802およびトランシーバ804は、バスシステム803を使用することによって接続される。メモリ802は命令を記憶するように構成される。プロセッサ801は、メモリ802によって記憶された命令を実行するように構成される。トランシーバ804は、
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成され、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である。

プロセッサ801は、
データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

本発明の本実施形態では、プロセッサ801は中央処理装置（Central Processing Unit, CPU）であってよいことは理解されるべきである。プロセッサ801は、あるいは、別の汎用プロセッサ、デジタル信号プロセッサ（Digital Signal Processor, DSP）、特定用途向け集積回路（Application-Specific Integrated Circuit, ASIC）、フィールドプログラマブルゲートアレイ（Field-Programmable Gate Array, FPGA）または別のプログラマブル論理デバイス、離散ゲートまたはトランジスタ論理デバイス、離散ハードウェアコンポーネント等であってよい。汎用プロセッサはマイクロプロセッサであってよく、または、プロセッサは、任意の従来のプロセッサ等であってよい。

メモリ802は、読出し専用メモリおよびランダムアクセスメモリを含み、且つ、プロセッサ801のための命令およびデータを提供してよい。メモリ802の一部は、不揮発性ランダムアクセスメモリをさらに含んでよい。例えば、メモリ802は、デバイスタイプに関する情報をさらに記憶してよい。

データバスを含むことに加えて、バスシステム803は、電源バス、制御バス、ステータス信号バス等をさらに含んでよい。しかしながら、明確な説明のために、全ての種類のバスは、図内でバスシステム803としてマークされる。

実施プロセスでは、前述の方法の全てのステップは、プロセッサ801におけるハードウェアの集積論理回路を使用することによって完了してよく、または、ソフトウェア形態で命令を使用することによって完了してよい。本発明の本実施形態を参照して開示される方法のステップは、ハードウェアプロセッサによって実行および完了されてよく、または、プロセッサにおけるハードウェアおよびソフトウェアモジュールの組合せを使用することによって実行および完了されてよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読出し専用メモリ、プログラマブル読出し専用メモリ、電気的に消去可能なプログラマブルメモリまたはレジスタ等の当該技術で成熟した記憶媒体内に配置されてよい。記憶媒体はメモリ802内に配置される。プロセッサ801は、メモリ802内の情報を読み出し、プロセッサ801のハードウェアを参照して、前述の方法のステップを完了する。繰返しを回避するために、詳細はここではさらに繰り返されない。

任意で、実施形態では、計算ノード800は、物理マシン、仮想マシンまたは中央処理装置CPUである。

本発明の本実施形態における計算ノード800は、本発明の前述の実施形態における方法を実行するためのエンティティに対応してよく、または、本発明の前述の実施形態における計算ノード600に対応してよいことは理解されるべきである。加えて、計算ノード800のモジュールの前述のまたは他の操作および/または機能は、データ処理方法の対応する手順を実施するものである。簡潔さのために、詳細はここではさらに繰り返されない。

図1乃至図17を参照して、前述では、本発明の実施形態に係る、データ処理システムおよび計算ノードを詳細に説明する。図18および図19を参照して、以下では、本発明の実施形態に係るデータ処理方法を詳細に説明する。

図18は、本発明の実施形態に係るデータ処理方法900を示す。方法900はデータ処理システムに適用される。データ処理システムは、管理ノードと第1のクラスの計算ノードとを含む。方法900は以下を含む：

S901：管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当て、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する。

S902：計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である。

S903：計算ノードFC_xは、データブロックM_xおよびデータブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得し、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

S904：管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得する。

任意で、実施形態では、データ処理システムは、第2のクラスの計算ノードのうちの少なくとも1つをさらに含む。方法900は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するステップであって、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

任意で、実施形態では、データセットは、データブロックV_2xをさらに含み、データブロックV_2xは、m次元データを含むベクトルである。方法900は、
管理ノードによって、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSC_yによって、第3の処理タスクに従って、データセット内のデータブロックV_2xを取得するステップと、
計算ノードSC_yによって、SC_yによって取得された第2の中間結果V’’_yおよびデータブロックV_2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

任意で、実施形態では、m=nであり、データブロックV_1xとデータブロックV_2xは同じデータブロックである。

任意で、実施形態では、管理ノード、第1のクラスの計算ノードおよび第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUであってよい。

図19は、本発明の実施形態に係るデータ処理方法1000を示す。方法1000はデータ処理システムに適用される。データ処理システムは、管理ノードと第1のクラスの計算ノードとを含む。方法1000は以下を含む：

S1001：管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当て、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する。

S1002：計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である。

S1003：計算ノードFC_xは、データブロックM_1xおよびデータブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得し、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

S1004：管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得する。

任意で、実施形態では、データ処理システムは、第2のクラスの計算ノードのうちの少なくとも1つをさらに含む。方法1000は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するステップであって、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

任意で、実施形態では、データセットは、データブロックM_3xをさらに含み、データブロックM_3xは、m行p列のデータを含む行列である。方法1000は、
管理ノードによって、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSC_yによって、第3の処理タスクに従って、データセット内のデータブロックM_3xを取得するステップと、
計算ノードSC_yによって、SC_yによって取得された第2の中間結果M’’_yおよびデータブロックM_3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

任意で、実施形態では、n=mであり、データブロックM_2xとデータブロックM_3xは同じデータブロックである。

任意で、実施形態では、n=pであり、データブロックM_1xとデータブロックM_3xは同じデータブロックである。

当業者は、本明細書で開示された実施形態で説明された例と組み合わせて、ユニットおよびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェアまたはそれらの組合せによって実施されてよいことを認識することができる。ハードウェアとソフトウェアとの間の互換性を明確に説明するために、前述では、機能に基づく各例の構成およびステップを一般的に説明した。機能がハードウェアによって実行されるかソフトウェアによって実行されるかは、技術的解決手段の特定の適用および設計制約条件に依存する。当業者は、各特定の適用のために説明された機能を実施するために異なる方法を使用してよいが、実施は、本発明の範囲を超えると考えられるべきではない。

便利且つ簡潔な説明を目的として、前述のシステム、装置およびユニットの詳細な動作プロセスのために、前述の方法の実施形態における対応するプロセスに対して参照が行われてよいことは当業者によって明確に理解されることができ、詳細はここでは再び説明されない。

本発明の実施形態における技術は、必要な汎用ハードウェアプラットフォームに加えてソフトウェアによって実施されてよいことは、当業者は明確に理解することができる。このような理解に基づいて、本発明の技術的解決手段は本質的に、または、従来技術に貢献する部分は、または、技術的解決手段の全てまたは一部は、ソフトウェア製品の形態で実施されてよい。ソフトウェア製品は記憶媒体に記憶され、コンピュータデバイス（パーソナルコンピュータ、サーバまたはネットワークデバイスであってよい）に本発明の実施形態で説明された方法のステップの全てまたは一部を実行するように命令するためのいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、磁気ディスク、光ディスク、ランダムアクセスメモリ（Random-Access Memory, RAM）、ソリッドステートディスク（Solid State Disk, SSD）または不揮発性メモリ（non-volatile memory）等のプログラムコードを記憶することができる任意の非一時的（non-transitory）機械可読媒体を含んでよい。前述の説明は、単に、本発明の具体的な実施形態であるが、本発明の保護範囲を限定するように意図されない。

100 データ処理システム
110 管理ノード
120 第1のクラスの計算ノード
121 計算ノード
300 データ処理システム
310 管理ノード
320 第1のクラスの計算ノード
321 計算ノード
500 計算ノード
501 受信モジュール
502 取得モジュール
503 処理モジュール
600 計算ノード
601 受信モジュール
602 取得モジュール
603 処理モジュール
700 計算ノード
701 プロセッサ
702 メモリ
703 バスシステム
704 トランシーバ
800 計算ノード
801 プロセッサ
802 メモリ
803 バスシステム
804 トランシーバ

情報通信技術（Information and Communication Technology, ICT）がますます発展するにつれて、インターネットで生成されるデータは爆発的に増加した。データに対してデータマイニングおよび機械学習を行うことによって、大量の貴重な情報が取得されることができる。データマイニングおよび機械学習の研究対象は、通常、対象の集合および対象間の関係（例えば、ソーシャルネットワーク）である。全ての前述の研究対象は、数学的なグラフ（Graph）として表現されることができる。グラフは、対象間の関係を説明するために使用される。直感的に、グラフはいくつかの小さな点および点をつなぐ線を含んでよい。点は、グラフの頂点（Vertex）と呼ばれる。点をつなぐ線は、辺（Edge）と呼ばれる。

第1の態様によると、本発明の実施形態はデータ処理システムを提供し、ここで、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、ここで、
管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、
データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

第2の態様によると、本発明の実施形態は別のデータ処理システムを提供し、ここで、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、ここで、
管理ノードは、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFC_xは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、
データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

第2の態様を参照すると、第2の態様の第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、管理ノードは、
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列であり、
管理ノードは、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。

第3の態様によると、本発明の実施形態は計算ノードを提供し、計算ノードは、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成される取得モジュールであって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するように構成される処理モジュールであって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

第4の態様によると、本発明の実施形態は別の計算ノードを提供し、別の計算ノードは、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成される取得モジュールであって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するように構成される処理モジュールであって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

第5の態様によると、本発明の実施形態はデータ処理方法を提供し、ここで、方法はデータ処理システムに適用され、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、方法は、
管理ノードによって、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFC_xによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するステップであって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
計算ノードFC_xによって、データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するステップであって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

第5の態様を参照すると、第5の態様の第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、方法は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するステップであって、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

第6の態様によると、本発明の実施形態は別のデータ処理方法を提供し、ここで、方法はデータ処理システムに適用され、データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、方法は、
管理ノードによって、第1の処理タスクを、FC_xを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FC_xは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFC_xによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するステップであって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
計算ノードFC_xによって、データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するステップであって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

第6の態様を参照すると、第1の可能な実施方式では、データ処理システムは、第2のクラスの計算ノードをさらに含み、方法は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するステップであって、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

グラフ：

乗算

本明細書では、乗算は、一般化された乗算を表してよく、または、2つの数の乗算を表してよい。例えば、行列-ベクトル乗算における乗算は、一般化された乗算を指す。すなわち、行列内の要素とベクトルに対応する要素の乗算は、従来の数の乗算ではなく、加算、減算、乗算、除算、最大化または最小化等の他の処理であり、これは、本発明の実施形態では限定されない。

隣接行列：

行列-ベクトル乗算操作

行列-行列乗算操作

行列-行列乗算操作は行列間の一連の操作を指す。行列-行列乗算操作を使用することによるグラフ計算を表す例では、図3Aにおける2つの頂点毎の相互フレンド（例えば、アウトネイバー）の数は、行列-行列乗算操作を使用することによって計算されることができる。初めに、隣接行列が構成される。図3Bの行列によって示されるように、ここでは、行列はAを使用することによって表される。次いで、B=(b_ij)=A*A^T（図5に示される）を実行することによって行列B内の要素b_ijの値が取得され、第i頂点と第j頂点の相互アウトネイバーの数を表す。例えば、行3列1の値は1であり、頂点3および頂点1が1つの相互フレンドを有すると示す。

分散行列

従来技術の行列-ベクトル乗算モデルに対する制限のために、行列-ベクトル乗算操作に基づくビッグデータ処理システムPEGASUSはGIMVモデルを提案する。GIMVモデルは、従来の行列-ベクトル乗算を拡張する。

2. 行列の行に対するcombine2結果x₁, …,およびx_nに対して結合操作combineAllが実行され、ここで、combineAllは、複数の数値または記録集合に対して実行される結合操作であり、且つ、一般に、関数（例えば、累積関数であってよい）であり、combineAllの後、中間値

が返される。

3. 計算を介して現在取得された

を取得する。

を取得する；
3.

: 初期ベクトルの要素V_iおよび対応する中間結果

を取得する。

であることに対応してよい。

を使用することによって操作が実行される。最初の乗算を介して得られた結果ベクトルV’は、1つのホップの後に到達されることができる頂点0から他の頂点までの最短距離を表す。SSSPアルゴリズムにおける反復終了条件は、反復を介して得られた結果ベクトルV’が反復の初期ベクトルVと比較して変化していない場合に、アルゴリズムが終了することである。終了条件が満たされない場合、アルゴリズムにおいて反復は実行され続ける。すなわち、現在の反復の結果ベクトルV’は、次の反復を実行するために次の反復の初期ベクトルVとして使用され、アルゴリズムに従って得られた最後の結果ベクトルV’は、頂点0から他の頂点までの最短距離である。

計算ノードFC_x 121は、管理ノード110によって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、
データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

計算ノードFC_x 121は、データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得し、ここで、第1の中間結果V’_xは、m次元データを含むベクトルである。第1の中間結果V’_xは、要素

であり、

は

ここでの削減2（reduce2）操作は、加算、減算、乗算、除算、最大化、最小化等であってよく、これは、本発明の本実施形態で限定されない。ここでは、reduce2操作を使用することによって、行列の行の要素に対応する中間結果（例えば、x₁,…,x_n）に対する処理のために、reduce2処理は、x₁,…,x_nの全てが計算された後に実行される代わりに、中間結果x_jを計算するプロセスにおいて１ステップずつ実行される。

reduce2操作の利点は、reduce2操作が実行される要素の順序は、計算プロセスにおいて考慮される必要がなく、すなわち、reduce2操作が実行される要素の順序に関わらず結果のみが得られることであることは理解されるべきである。例えば、Scala言語では、配列はit=Array(0,1,2,3,4,5)であり、配列内の要素は合計され、これはit.reduce(_+_)と表現されてよい。計算の具体的な実施中は、左から右へデータを加えることによって得られた値は、データに対して対reduce2操作を実行することによって得られる最終値と同じである。x₃とx₁およびx₂に対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行する前述の説明は、1つの実施方式にすぎない。reduce2操作の実行順序は、x₁,..., x_nの順序に限定されない。シーケンシャルな実行の後に得られた結果と同じ結果が、x₁,..., x_nのうちの任意の2つに対してreduce2操作を実行し、次いで、取得された結果および別のx_jに対してreduce2操作を実行することによって得られることができる。本発明の本実施形態におけるreduce2操作の順序に対して限定は課されない。

管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。第1の処理タスクを完了した後、第1のクラスの計算ノード120は管理ノード110に通知する。管理ノード110は、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するか、別の処理タスクのための基礎データとして第1の中間結果を使用することによって、対応する計算ノードに、第1の中間結果を使用することによって計算されるべき別の処理タスクを配送する。

として表されてよい。

既存のGIMVモデルと比較すると、本発明の本実施形態におけるassign処理ではベクトルV₂が追加され、従って、結果ベクトルV₃は、
V₃=α*M*V₁+β*V₂ (公式4)
として表現されてよく、ここで、αおよびβは数値であり、公式4は、既存のGIMVモデルと比較して、本発明の本実施形態におけるデータ処理システム100によって取得される結果ベクトルV₃に重みV₂が導入されることを示し、その結果、assign処理はもはや乗算のために使用されるベクトルに限定されず、非正方行列に対する行列-ベクトル乗算操作がサポートされることができ、行列-ベクトル乗算操作の表現範囲を拡張する。

以下では、行列-ベクトル乗算操作に重みV₂を導入する関数を説明するための具体的な例を使用する。例えば、性能テストのために使用されるページランク（PageRank）アルゴリズムでは、“加算のために使用されるベクトル”（前述のベクトルV₂に対応する）はしばしば操作のために(1-d)/Nに設定される。ベクトル(1-d)/Nは対応するグラフにおける頂点のPageRank値を調整するために使用されてよく、その結果、頂点のPageRank値は真実性をより良く満たす。PageRank値はRとして表現されてよく、具体的には、公式5として表現される：

S206：各計算ノードは、S205で取得された最後の第1の中間結果に対して全データ伝送を実行し、その結果、最後の第1の中間結果は1つの計算ノード内に集められる。本発明の本実施形態における方法によると、全データ伝送は、削減処理の後に取得されたデータに対して実行される。従って、既存の行列-ベクトル乗算操作と比較して、伝送されたデータ量は大幅に削減される。

が取得されることができる。中間ベクトル

である。

計算ノードFC_xは、管理ノード310によって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、
データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

計算ノードFC_x 321は、データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得し、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列である。第1の中間結果M’_xは、要素

であり、

は

具体的には、データブロックM_1xの第i行第k列の要素およびデータブロックM_2xの第k行第j列の要素に対して結合操作が実行されて、データブロックM_1xの第i行第k列の要素およびデータブロックM_2xの第k行第j列の要素に対応する中間結果x_ikjを取得する。ここでの結合操作は、上述のcombine2操作であってよく、且つ、中間結果を表現するための公式：x_ikj= combine2(m_1[i,k], m_2[k,j])において使用されてよい。

ここでの削減2（reduce2）操作は、加算、減算、乗算、除算、最大化、最小化等であってよく、これは、本発明の本実施形態で限定されない。ここでは、reduce2操作を使用することによって、行列の行の要素に対応する中間結果（例えば、x_i1j,…, x_inj）に対する処理のために、reduce2処理は、x₁,…,x_nの全てが計算された後に実行される代わりに、中間結果x_ikjを計算するプロセスにおいて１ステップずつ実行される。

reduce2操作の利点は、reduce2操作が実行される要素の順序は、計算プロセスにおいて考慮される必要がなく、すなわち、reduce2操作が実行される要素の順序に関わらず結果のみが得られることであることは理解されるべきである。例えば、Scala言語では、配列はit=Array(0,1,2,3,4,5)であり、配列内の要素は合計され、これはit.reduce(_+_)と表現されてよい。計算の具体的な実施中は、左から右へデータを加えることによって得られた値は、データに対して対reduce2操作を実行することによって得られる最終値と同じである。x_i3jとx_i1jおよびx_i2jに対してreduce2操作が実行された後に得られた結果とに対してreduce2操作を実行する前述の説明は、1つの実施方式にすぎない。reduce2操作の実行順序は、x_i1j,..., x_injの順序に限定されない。シーケンシャルな実行の後に得られた結果と同じ結果が、x_i1j,..., x_injのうちの任意の2つに対してreduce2操作を実行し、次いで、取得された結果および別のx_ikjに対してreduce2操作を実行することによって得られることができる。本発明の本実施形態におけるreduce2操作の順序に対して限定は課されない。

管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。第1の処理タスクを完了した後、第1のクラスの計算ノード320は管理ノード310に通知する。管理ノード310は、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するか、別の処理タスクのための基礎データとして第1の中間結果を使用することによって、対応する計算ノードに、第1の中間結果を使用することによって計算されるべき別の処理タスクを配送する。

計算ノードSC_yは、
第2の処理タスクに従って、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するように構成され、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である。

管理ノード310は、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。

管理ノード310は、具体的には、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。

具体的には、処理されるべきデータセット内にあるM_1xの1行のデータブロックおよびM_2xの1列のデータブロックを使用することによって取得された第1の中間結果に対してreduce2操作が実行された後、処理されるべきデータセットのための処理結果を取得するために、取得された第2の中間結果に対してassign操作がさらに実行されてよい。第2の中間結果M’’_yおよびデータブロックM_3xの両方は、m行p列のデータを含む行列である。結果行列は、対応する要素に対してassign操作を実行することによって取得されてよく、ここで、結果行列はm行p列のデータを含む行列である。ここでの割り当て処理は、上述のassign処理であってよい。

S404：第1のクラスの計算ノードの各々は、部分combine2処理および部分reduce2処理を実行する。combine2処理はデータブロックM_1xおよびデータブロックM_2xに対して実行され、データブロックM_1xの行およびデータブロックM_2xの対応する列に対応する全ての中間結果が取得される前に、中間結果に対してreduce2処理が実行されて、第1の中間結果を取得する。次いで、第1の中間結果および新たに取得された中間結果に対してreduce2処理が実行されて、新しい第1の中間結果を取得する。最後の第1の中間結果は、データブロックM_1xの行およびデータブロックM_2xの対応する列に対応する全ての中間結果に対してreduce2処理が実行された後に取得される結果である。さらに、類推によって、データブロックM_1xの行およびデータブロックM_2xの列の全ての組合せに対応する最後の第1の中間結果が取得され、ここで、最後の第1の中間結果は行列を形成することができる。

S405：第1のクラスの計算ノードの各々は、S404で取得された最後の第1の中間結果に対して全データ伝送を実行し、その結果、最後の第1の中間結果は第2のクラスの計算ノードのうちの1つ内に集められる。本発明の本実施形態における方法によると、全データ伝送は、削減処理の後に取得されたデータに対して実行される。従って、伝送されたデータ量は比較的小さい。

S409：結果行列Dの各行列ブロックに対して、行ごとにreduceRow処理を実行する。

確率伝播は推奨されるアルゴリズムの1つである。“ユーザプロジェクト”相互記録データベースは、各ユーザに対して、ユーザが興味を持ち得るいくつかのプロジェクトを推奨する必要がある。確率伝播はグローバルデータに基づき、且つ、ユーザによって潜在的に興味を持たれている全てのプロジェクトを一度に計算するために使用されることができる。アルゴリズムは、堅実な理論的基礎を有する。確率伝播は、物理学における“エネルギー保存の法則”から発展している。行列の操作は、異なる物質間のエネルギー伝播に類似しており、且つ、最終的に取得される興味度行列および元の行列については、対応する行内の要素の合計は絶対的に等しく、且つ、対応する列内の要素の合計もまた絶対的に等しく、このことはエネルギーの保存を明らかにする。

確率伝播アルゴリズムは、行列に対する操作を使用することによって実施されてよい。行列を使用する既存の確率伝播アルゴリズムの実施において、“映画によるユーザへの魅力度”の行列および“ユーザ間の興味の類似度”の行列が取得されることができ、次いで、“映画によるユーザへの新しい魅力度”の行列を取得するために行列-行列乗算操作が実行され、次に、ユーザによって視聴された映画がふるいにかけられ、最終的に、視聴されていないtop kの映画のみが各ユーザに対して推奨される。確率伝播アルゴリズムによると、各ユーザに対していくつかの映画のみが提供され、比較的疎な結果行列（比較的多くのゼロ要素がある）が取得され、一般的に、データ量は比較的小さい（このようなシナリオでは、ゼロ要素は記憶される必要がない）。しかしながら、既存の解決手段では、“映画によるユーザへの新しい魅力度”の非常に密な行列は、通常、計算プロセスで取得され、データ量は非常に大きい。これは、大量の占有された中間メモリおよびシステムによって伝送された大量のデータという結果をもたらす。

である。

同様に、sparkでは、本発明の実施形態における行列-行列乗算操作の性能は、従来技術における“推奨された映画を探すこと”を実施する操作の性能と比較される。表1は、テストされたデータセットのサイズおよびテスト結果を示す。相互インターネットプロトコルテレビジョン（interactive internet protocol television, IPTV）データセットおよびNETFLIX (Nasdaq NFLX, NETFLIX)データセット内のデータがテストされる。テスト結果から、本発明の実施形態によると、中間メモリの占有は有効に低減されることができ、且つ、計算時間は短縮されることができ、従って、より大きいデータセットが処理されることができることがわかる。

図1乃至図13を参照すると、前述では、本発明の実施形態に係るデータ処理システムを詳細に説明する。図14および図17を参照すると、以下では、本発明の実施形態に係るデータ処理システムにおける計算ノードを詳細に説明する。

図14は、本発明の実施形態に係る計算ノード500を示す。計算ノード500はデータ処理システムに属する。データ処理システムは管理ノードをさらに含む。計算ノード500は、
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール501と、
管理ノードによって割り当てられ、受信モジュール501によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成される取得モジュール502であって、ここで、データブロックM_xは、m行n列のデータを含む行列であり、データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュール502と、
データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するように構成される処理モジュール503であって、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

図15は、本発明の実施形態に係る計算ノード600を示す。計算ノード600はデータ処理システムに属する。データ処理システムは管理ノードをさらに含む。計算ノードは、
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール601と、
管理ノードによって割り当てられ、受信モジュール601によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成される取得モジュール602であって、ここで、データブロックM_1xは、m行n列のデータを含む行列であり、データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュール602と、
データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するように構成される処理モジュール603であって、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

プロセッサ701は、
データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得するように構成され、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

プロセッサ801は、
データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得するように構成され、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

S903：計算ノードFC_xは、データブロックM_xおよびデータブロックV_1xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果V’_xを取得し、ここで、第1の中間結果V’_xは、m次元データを含むベクトルであり、第1の中間結果V’_xは、要素

であり、

は

任意で、実施形態では、データ処理システムは、第2のクラスの計算ノードをさらに含む。方法900は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するステップであって、ここで、第2の中間結果V’’_yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

S1003：計算ノードFC_xは、データブロックM_1xおよびデータブロックM_2xに対して結合2（combine2）操作および削減2（reduce2）操作を実行して、第1の中間結果M’_xを取得し、ここで、第1の中間結果M’_xは、m行p列のデータを含む行列であり、第1の中間結果M’_xは、要素

であり、

は

任意で、実施形態では、データ処理システムは、第2のクラスの計算ノードをさらに含む。方法1000は、
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SC_yを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SC_yは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSC_yによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SC_yによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果である、ステップと、
計算ノードSC_yによって、SC_yによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するステップであって、ここで、第2の中間結果M’’_yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。

Claims

管理ノードと第1のクラスの計算ノードとを含むデータ処理システムであって、
前記管理ノードは、第1の処理タスクを、FC_xを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、前記FC_xは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理し、
前記計算ノードFC_xは、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得し、
前記データブロックM_xおよび前記データブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成され、前記データブロックM_xは、m行n列のデータを含む行列であり、前記データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、前記第1の中間結果V’_xは、m次元データを含むベクトルであり、前記第1の中間結果V’_xは、要素
を有し、iは変数であり、iの値は1からmの範囲であり、
であり、
は
に従って取得され、m_i,jは、前記データブロックM_x内の要素であり、v_jは、前記データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲であり、
前記管理ノードは、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、データ処理システム。
前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記管理ノードは、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SC_yを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、前記SC_yは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
前記計算ノードSC_yは、
前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得し、
前記SC_yによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するように構成され、前記SC_yによって取得された前記第1の中間結果は、前記処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、前記第2の中間結果V’’_yは、m次元データを含むベクトルであり、
前記管理ノードは、
前記第2のクラスの計算ノード内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項1に記載のデータ処理システム。
前記データセットは、データブロックV_2xをさらに含み、前記データブロックV_2xは、m次元データを含むベクトルであり、前記管理ノードは、
前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるようにさらに構成され、
前記計算ノードSC_yは、
前記第3の処理タスクに従って、前記データセット内の前記データブロックV_2xを取得し、
前記SC_yによって取得された前記第2の中間結果V’’_yおよび前記データブロックV_2xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項2に記載のデータ処理システム。
m=nであり、前記データブロックV_1xと前記データブロックV_2xは同じデータブロックである、請求項3に記載のデータ処理システム。
前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項2乃至4のいずれか1項に記載のデータ処理システム。
前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項2乃至5のいずれか1項に記載のデータ処理システム。
管理ノードと第1のクラスの計算ノードとを含むデータ処理システムであって、
前記管理ノードは、第1の処理タスクを、FC_xを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、前記FC_xは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理し、
前記計算ノードFC_xは、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得し、
前記データブロックM_1xおよび前記データブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成され、前記データブロックM_1xは、m行n列のデータを含む行列であり、前記データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、前記第1の中間結果M’_xは、m行p列のデータを含む行列であり、前記第1の中間結果M’_xは、要素
を有し、iおよびjは変数であり、iの値は1からmの範囲であり、jの値は1からpの範囲であり、
であり、
は
に従って取得され、m_1[i,k]は、前記データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、前記データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲であり、
前記管理ノードは、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、データ処理システム。
前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記管理ノードは、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SC_yを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、前記SC_yは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
前記計算ノードSC_yは、
前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得し、
前記SC_yによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するように構成され、前記SC_yによって取得された前記第1の中間結果は、前記処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果であり、前記第2の中間結果M’’_yは、m行p列のデータを含む行列であり、
前記管理ノードは、
前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項7に記載のデータ処理システム。
前記データセットは、データブロックM_3xをさらに含み、前記データブロックM_3xは、m行p列のデータを含む行列であり、前記管理ノードは、
前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるようにさらに構成され、
前記計算ノードSC_yは、
前記第3の処理タスクに従って、前記データセット内の前記データブロックM_3xを取得し、
前記SC_yによって取得された前記第2の中間結果M’’_yおよび前記データブロックM_3xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項8に記載のデータ処理システム。
n=mであり、前記データブロックM_2xと前記データブロックM_3xは同じデータブロックである、請求項9に記載のデータ処理システム。
n=pであり、前記データブロックM_1xと前記データブロックM_3xは同じデータブロックである、請求項9に記載のデータ処理システム。
前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項8乃至11のいずれか1項に記載のデータ処理システム。
前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項7乃至12のいずれか1項に記載のデータ処理システム。
計算ノードであって、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールと、
前記管理ノードによって割り当てられ、前記受信モジュールによって受信された前記第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するように構成される取得モジュールであって、前記データブロックM_xは、m行n列のデータを含む行列であり、前記データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
前記データブロックM_xおよび前記データブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するように構成される処理モジュールであって、前記第1の中間結果V’_xは、m次元データを含むベクトルであり、前記第1の中間結果V’_xは、要素
を有し、iは変数であり、iの値は1からmの範囲であり、
であり、
は
に従って取得され、m_i,jは、前記データブロックM_x内の要素であり、v_jは、前記データブロックV_1x内の要素であり、jは変数であり、jの値は1からnの範囲である、処理モジュールとを含む計算ノード。
前記計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUである、請求項14に記載の計算ノード。
計算ノードであって、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、前記データ処理システムは、前記計算ノードおよび前記管理ノードを含む、受信モジュールと、
前記管理ノードによって割り当てられ、前記受信モジュールによって受信された前記第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するように構成される取得モジュールであって、前記データブロックM_1xは、m行n列のデータを含む行列であり、前記データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
前記データブロックM_1xおよび前記データブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するように構成される処理モジュールであって、前記第1の中間結果M’_xは、m行p列のデータを含む行列であり、前記第1の中間結果M’_xは、要素
を有し、iおよびjは変数であり、iの値は1からmの範囲であり、jの値は1からpの範囲であり、
であり、
は
に従って取得され、m_1[i,k]は、前記データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、前記データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である、処理モジュールとを含む計算ノード。
前記計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUである、請求項14に記載の計算ノード。
データ処理方法であって、前記方法はデータ処理システムに適用され、前記データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、前記方法は、
前記管理ノードによって、第1の処理タスクを、FC_xを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、前記FC_xは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理する、ステップと、
前記計算ノードFC_xによって、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_xおよびデータブロックV_1xを取得するステップであって、前記データブロックM_xは、m行n列のデータを含む行列であり、前記データブロックV_1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
前記計算ノードFC_xによって、前記データブロックM_xおよび前記データブロックV_1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’_xを取得するステップであって、前記第1の中間結果V’_xは、m次元データを含むベクトルであり、前記第1の中間結果V’_xは、要素
を有し、iは変数であり、iの値は1からmの範囲であり、
であり、
は
に従って取得され、m_i,jは、前記データブロックM_x内の要素であり、v_jは、前記データブロックV_1x内の要素であり、j は変数であり、jの値は1からnの範囲である、ステップと、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとを含む方法。
前記データ処理システムは、第2のクラスの計算ノードのうちの少なくとも1つをさらに含み、前記方法は、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SC_yを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、前記SC_yは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
前記計算ノードSC_yによって、前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得するステップであって、前記SC_yによって取得された前記第1の中間結果は、前記処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
前記計算ノードSC_yによって、前記SC_yによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’_yを取得するステップであって、前記第2の中間結果V’’_yは、m次元データを含むベクトルである、ステップと、
前記管理ノードによって、前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項18に記載の方法。
前記データセットは、データブロックV_2xをさらに含み、前記データブロックV_2xは、m次元データを含むベクトルであり、前記方法は、
前記管理ノードによって、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるステップと、
前記計算ノードSC_yによって、前記第3の処理タスクに従って、前記データセット内の前記データブロックV_2xを取得するステップと、
前記計算ノードSC_yによって、前記SC_yによって取得された前記第2の中間結果V’’_yおよび前記データブロックV_2xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項19に記載の方法。
m=nであり、前記データブロックV_1xと前記データブロックV_2xは同じデータブロックである、請求項20に記載の方法。
前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項19乃至21のいずれか1項に記載の方法。
前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項18乃至22のいずれか1項に記載の方法。
データ処理方法であって、前記方法はデータ処理システムに適用され、前記データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、前記方法は、
前記管理ノードによって、第1の処理タスクを、FC_xを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、前記FC_xは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理する、ステップと、
前記計算ノードFC_xによって、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM_1xおよびデータブロックM_2xを取得するステップであって、前記データブロックM_1xは、m行n列のデータを含む行列であり、前記データブロックM_2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
前記計算ノードFC_xによって、前記データブロックM_1xおよび前記データブロックM_2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’_xを取得するステップであって、前記第1の中間結果M’_xは、m行p列のデータを含む行列であり、前記第1の中間結果M’_xは、要素
を有し、iおよびjは変数であり、iの値は1からmの範囲であり、jの値は1からpの範囲であり、
であり、
は
に従って取得され、m_1[i,k]は、前記データブロックM_1xの第i行第k列の要素であり、m_2[k,j]は、前記データブロックM_2xの第k行第j列の要素であり、kは変数であり、kの値は1からnの範囲である、ステップと、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとを含む方法。
前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記方法は、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SC_yを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、前記SC_yは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
前記計算ノードSC_yによって、前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得するステップであって、前記SC_yによって取得された前記第1の中間結果は、前記処理されるべきデータセット内にある1行のデータブロックM_1xおよび1列のデータブロックM_2xに従って取得された第1の中間結果である、ステップと、
前記計算ノードSC_yによって、前記SC_yによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’_yを取得するステップであって、前記第2の中間結果M’’_yは、m行p列のデータを含む行列である、ステップと、
前記管理ノードによって、前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項24に記載の方法。
前記データセットは、データブロックM_3xをさらに含み、前記データブロックM_3xは、m行p列のデータを含む行列であり、前記方法は、
前記管理ノードによって、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SC_yを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるステップと、
前記計算ノードSC_yによって、前記第3の処理タスクに従って、前記データセット内の前記データブロックM_3xを取得するステップと、
前記計算ノードSC_yによって、前記SC_yによって取得された前記第2の中間結果M’’_yおよび前記データブロックM_3xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項25に記載の方法。
n=mであり、前記データブロックM_2xと前記データブロックM_3xは同じデータブロックである、請求項26に記載の方法。
n=pであり、前記データブロックM_1xと前記データブロックM_3xは同じデータブロックである、請求項26に記載の方法。
前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項25乃至28のいずれか1項に記載の方法。
前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項24乃至29のいずれか1項に記載の方法。