JP2021118004A

JP2021118004A - グラフ計算の処理方法、装置、電子機器及び記憶媒体

Info

Publication number: JP2021118004A
Application number: JP2021008619A
Authority: JP
Inventors: ヤンワン，; Yang Wang; シュンチャオソン，; Xunchao Song; ペンチャンユアン，; Pengcheng Yuan; イーフェイワン，; Yifei Wang; ハイピンヂャン，; Haiping Zhang
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-01-22
Filing date: 2021-01-22
Publication date: 2021-08-10
Anticipated expiration: 2041-01-22
Also published as: US11941055B2; KR20210095083A; US20210224139A1; JP7316305B2; CN111292223B; CN111292223A; EP3855314A1

Abstract

【課題】固定した計算資源を利用してグラフ計算の並列処理を実現し、グラフ計算効率を向上させるグラフ計算の処理方法、装置、コンピュータ機器及び記憶媒体を提供する。【解決手段】ＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置し、ＧＰＵで実行される、グラフ計算におけるパラメータ処理又はフィードバックを行うためのインターフェース関数を配置し、グラフ計算を実行する時に、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、ＧＰＵが複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンが実行結果に基づき、グラフ計算を完成させる。【選択図】図２

Description

本出願の実施例は、コンピュータ技術分野に関し、特に、グラフデータベース分野に関する。

オンライン分析処理（ＯｎｌｉｎｅＡｎａｌｙｔｉｃａｌＰｒｏｃｅｓｓｉｎｇ、ＯＬＡＰ）は、データベース分析技術の１つである。グラフデータベースに対して全グラフ分析を行う場合は、ＯＬＡＰ技術を利用することができる。

従来のグラフデータベースシステムの計算資源は固定したものであり、グラフデータベースシステムを利用してオンライン分析処理を実現する場合に、大規模のデータベースに対しては、数百のサービスノードを計算資源として配置する必要があるため、この配置方式はコストが高い。しかし、コストを低減するようにグラフデータベースの計算資源を制限すると、グラフデータベースの計算速度は大幅に低下することになる。固定した計算資源をいかに利用して効率的なグラフ計算効率を行うかは、早急に解決すべき問題となっている。

本出願は、固定した計算資源を利用してグラフ計算の並列処理を実現し、グラフ計算効率を向上させることを実現するように、グラフ計算の処理方法、装置、コンピュータ機器及び記憶媒体を提供する。

第1の態様において、本出願の実施例は、グラフ計算の処理方法を提供し、前記グラフ計算の処理方法は、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置するステップと、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置するステップと、グラフ計算を実行する時に、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出すステップと、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行するステップであって、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックするステップと、実行エンジンが実行結果に基づき、グラフ計算を完成させるステップと、を含む。

上記出願の実施例は、セントラルプロセッシングユニットＣＰＵに実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵに実行エンジンにより利用可能なインターフェース関数を配置し、グラフ計算を実行する時に、セントラルプロセッシングユニットＣＰＵにおける実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンがインターフェース関数によってフィードバックされた実行結果に基づき、グラフ計算を完成させることができる。従来では、グラフ処理を行うにはセントラルプロセッシングユニットＣＰＵしか使えないため、計算資源が固定化され、並列処理効率が低下するということに対して、本出願の実施例は、グラフィックスプロセッシングユニットＧＰＵによる高い同時並行性を利用し、セントラルプロセッシングユニットＣＰＵにおける実行エンジンによりグラフ計算フローをリードすることができ、グラフ計算フローにおいて実行エンジンは、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出し、全グラフ処理を行う時に、グラフに含まれる複数のノードはグラフィックスプロセッシングユニットＧＰＵで並列処理を行うことができ、さらに固定した計算資源において、高い同時並行性のノード並列処理を実現し、グラフ計算効率を向上させる。

上記出願の一実施例において、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出すステップが、実行エンジンが収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得し、実行エンジンが入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得て、実行エンジンがデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新する、という方式によって実施することができる。

上記出願の実施例では、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出すことにより、複数のノードに対して同時並行的かつ迅速な処理を同時に行うことを実現し、処理効率を向上させることができる。

上記出願の一実施例において、実行エンジンがデータ変更アプリケーションインターフェース関数を呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新した後、実行エンジンが発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出すことにより、ノードの出辺パラメータを取得するステップと、実行エンジンが発散インターフェース関数ｓｃａｔｔｅｒを呼び出すことにより、更新データを出辺の相手側ノードに更新するステップと、をさらに含む。

上記出願の実施例では、ＰａｇｅＲａｎｋシーン、ＬＰＡシーンなどのような、収束した後に発散することが必要なシーンに対して、ノードターゲットノードのプリセットパラメータの更新後に、ノードターゲットノードのプリセットパラメータをその出辺の相手側ノードに送信することにより、グラフにおけるノード情報を対称的なものとし、グラフ中の情報の正確性を向上させることができる。

上記出願の一実施例において、実行エンジンが入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得るステップが、実行エンジンがデータベースにアクセスすることにより、ノードターゲットノードの入辺隣接インデックスを取得するステップと、実行エンジンが入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得るステップと、を含む。

上記出願の実施例では、ＣＰＵがデータベースにアクセスすることにより隣接リストを取得し、データベースインターフェースを用いてデータベースからデータを迅速に取得し、データクエリ効率を向上させることができる。

上記出願の一実施例において、実行エンジンが入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得るステップが、実行エンジンが入辺隣接インデックスによって各入辺を取得するステップと、実行エンジンが集合インターフェース関数ｇａｔｈｅｒを呼び出すことにより、各入辺の相手側ノードのプリセットパラメータを取得するステップと、実行エンジンがグラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出して入辺の相手側ノードのプリセットパラメータを累積し、ノードターゲットノードの更新データを得るステップと、を含む。

上記出願の実施例では、グラフィックスプロセッシングユニットＧＰＵで累積ｓｕｍ計算を行うことができる。グラフィックスプロセッシングユニットＧＰＵがｓｕｍ計算を行うことにより、同時並行的な複数のノードのプリセットパラメータの計算を実現し、処理効率を大幅に向上させることができる。また、セントラルプロセッシングユニットＣＰＵの負荷を低減し、累積ｓｕｍ計算が容易であり、ＧＰＵの負荷への影響が小さい。

上記出願の一実施例において、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出すステップが、実行エンジンがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズによって処理対象のグラフデータをブロック化し、それぞれがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズにマッチングする複数のノードブロックを取得するステップと、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、複数のノードブロックに対してグラフ計算を順次行うステップと、を含む。

上記出願の実施例では、セントラルプロセッシングユニットＣＰＵのメモリとグラフィックスプロセッシングユニットＧＰＵのメモリはサイズがマッチングしないことで、グラフィックスプロセッシングユニットＧＰＵはメモリが小さいために全てのグラフデータを処理することができない、という問題を解決することができる。セントラルプロセッシングユニットＣＰＵにおける実行エンジンは、ブロック化後のノードブロックがＧＰＵのメモリのサイズにマッチングするように、グラフィックスプロセッシングユニットＧＰＵのメモリのサイズによって処理対象のデータをブロック化し、グラフィックスプロセッシングユニットＧＰＵは、ブロック化後のノードブロックを一括して処理し、全ての処理対象のデータのグラフ計算を実行して、信頼性を向上させることができる。

第２の態様において、本出願の実施例は、グラフ計算の処理装置をさらに提供し、前記グラフ計算の処理装置は、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置するための配置モジュールと、グラフ計算を実行する時に、グラフ計算インターフェースを介してインターフェース関数を呼び出すための実行エンジンモジュールと、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行するためのインターフェース呼び出しモジュールであって、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックするインターフェース呼び出しモジュールと、を備え、実行エンジンモジュールが、さらに、実行結果に基づき、グラフ計算を完成させるために用いられる。

第３の態様において、本出願の実施例は、コンピュータ機器をさらに提供し、前記コンピュータ機器は、メモリと、セントラルプロセッシングユニットＣＰＵと、グラフィックスプロセッシングユニットＧＰＵと、メモリに記憶され、プロセッシングユニット及びグラフィックスプロセッシングユニットで実行可能なコンピュータプログラムとを含み、プロセッシングユニットはプログラムを実行する時に、第１の態様に示すようなグラフ計算の処理方法を実現する。

第４の態様において、本出願の実施例は、コンピュータ実行可能な命令を含む記憶媒体をさらに提供し、コンピュータ実行可能な命令は、コンピュータプロセッサにより実行される時に、第１の態様に示すようなグラフ計算の処理方法を実行するために用いられる。

上記の選択的な態様が有する他の効果については、以下、具体的な実施例に合わせて説明する。

図面は、本解決手段をよりよく理解するために使用され、本出願を限定するものではない。
本出願の第１の実施例によるアーキテクチャ模式図である。本出願の第２の実施例によるフローチャートである。本出願の第３の実施例によるフローチャートである。本出願の第４の実施例によるフローチャートである。本出願の第４の実施例による構造模式図である。本出願の実施例におけるグラフ計算の処理方法を実現するための電子機器のブロック図である。

以下、図面に合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細が含まれており、それらは単なる例示的なものと見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができると理解すべきである。同様に、明確かつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

［実施例１］
図１は、本出願の第１の実施例により提供されるグラフ計算の処理アーキテクチャであり、当該処理アーキテクチャは、電子機器でセントラルプロセッシングユニットＣＰＵとグラフィックスプロセッシングユニットＧＰＵとの共同処理により、高い同時並行性のグラフ計算を実現し、グラフ計算の処理効率を向上させるために用いられ、具体的には、ユーザプログラミングインターフェース０１０と、実行エンジン０２０と、グラフデータベースクエリインターフェース０３０と、グラフインデックス０４０とを備える。

ここで、実行エンジン０２０はセントラルプロセッシングユニットＣＰＵで実行され、実行エンジン０２０は、グラフ計算の処理ステップを実行し、ユーザプログラミングインターフェース０１０を介してインターフェース関数を呼び出し、インターフェース関数はグラフィックスプロセッシングユニットＧＰＵで実行され、実行エンジン０２０は、グラフにおけるノードデータを取得する必要がある場合に、グラフデータベースクエリインターフェース０３０を介して、データベース及びデータベースによって提供されるグラフインデックス０４０にアクセスする。

電子機器にセントラルプロセッシングユニットＣＰＵとグラフィックスプロセッシングユニットＧＰＵが備えられ、ここで、セントラルプロセッシングユニットにはグラフ計算の操作を行い、グラフ計算の処理プロセスをリードするための実行エンジン０２０が実行される。実行エンジン０２０はグラフ計算の処理プロセスにおいて、ユーザプログラミングインターフェース０１０を介してインターフェース関数を呼び出すことができる。

インターフェース関数は、ユーザが編集して得られたインターフェース関数であり、あるノード処理機能の実現に用いられ、インターフェース関数の機能は固定したものであり、ユーザ（例えば、プログラマーやデータベース管理者）は、自分のプログラミング習慣によってプログラミングしてインターフェース関数を得ることができ、インターフェース関数の機能は、インターフェース関数の予め定義された機能に合致すればよい。

インターフェース関数は、ユーザプログラミングインターフェース０１０を介して実行エンジン０２０の呼び出しを受ける。実行エンジン０２０は、グラフ計算のプロセスを実行する時に、パラメータの代入または呼び出しによりユーザプログラミングインターフェース０１０を利用することができる。インターフェース関数は呼び出されると、ＧＰＵで並列して実行され、複数のノードのグラフ計算を同時に処理する。インターフェース関数の所定の機能を完了すると、インターフェース関数は、ユーザプログラミングインターフェース０１０を介して結果データを実行エンジン０２０にフィードバックする。

グラフ計算プロセスにおいて、ノードターゲットノードのグラフインデックス０４０の取得に関わることがあるが、当該グラフインデックス０４０は、データベースに記憶されている場合が多い。上記処理アーキテクチャにおいて、実行エンジン０２０は、データベースクエリインターフェースを介してデータベースへのグラフインデックス０４０のクエリを開始し、ネイティブグラフデータベースのクエリエンジンによりグラフインデックス０４０を取得する。データベースは、それに記憶されているグラフインデックス０４０に基づき、ノードターゲットノードのインデックス情報を、データベースクエリインターフェースを介して実行エンジン０２０にフィードバックする。

本出願の実施例により提供されるグラフ計算の処理アーキテクチャでは、セントラルプロセッシングユニットＣＰＵにより実行される実行エンジン０２０は、ユーザプログラミングインターフェース０１０を呼び出すことができ、ユーザプログラミングインターフェース０１０に対応するインターフェース関数は、グラフィックスプロセッシングユニットＧＰＵで実行され、ノードターゲットノードの隣接インデックスなどのデータを取得する必要がある場合に、実行エンジン０２０は、データベースクエリインターフェースを介してデータベースにアクセスし、グラフデータベースにより提供されたグラフインデックス０４０へのアクセスにより、ノードターゲットノードの隣接ノードを取得することで、グラフ計算を完了する。上記処理アーキテクチャは、セントラルプロセッシングユニットＣＰＵとグラフィックスプロセッシングユニットＧＰＵとの間でデータサービスを効率的に提供しかつ高い同時並行性のデータ処理を実行するシステム枠組みを提供し、固定したコンピュータ資源において、グラフィックスプロセッシングユニットＧＰＵにより高い同時並行性のノード処理を実現し、実行エンジン０２０によってグラフ計算フローをリードすることで、グラフ計算の処理効率を向上させ、同時並行的な処理能力を提供することを実現することができる。

［実施例２］
図２は、本出願の第２の実施例により提供されるグラフ計算の処理方法の模式図であり、当該方法は、グラフ計算の処理プロセス、特に、セントラルプロセッシングユニットＣＰＵとグラフィックスプロセッシングユニットＧＰＵを用いて共同でグラフ処理を行うプロセスに適用され、当該方法は、グラフ計算を実行する電子機器により実行可能であり、電子機器は、パソコン、サーバ、スマートフォン、タブレット型パソコンなどであってもよく、当該方法は、下記のステップ１０１〜ステップ１０５を含む。

ステップ１０１において、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置する。

セントラルプロセッシングユニットにおいて、実行エンジンに利用されるためのプロセッサ資源を要求することができ、実行エンジンは、グラフ計算の計算フローをロードする。

ステップ１０２において、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置する。

グラフィックスプロセッシングユニットにおいて、インターフェース関数は、実行エンジンの呼び出しを受けることができる。実行エンジがインターフェース関数を呼び出して実行させる時に、グラフィックスプロセッシングユニットＧＰＵは、インターフェース関数を実行するように、資源を配分する。

ステップ１０１とステップ１０２の実行順番は、前後を問わないが、同時に実行してもよい。

ステップ１０３において、グラフ計算を実行する時に、実行エンジンはグラフ計算インターフェースを介してインターフェース関数を呼び出す。

グラフ計算は、様々なシーン、特に、Ｐａｇｅｒａｎｋ、Ｌｐａ、接続性などのようなオンライン分析処理ＯＬＡＰにおける全グラフ計算シーンに適用される。ユーザグラフ計算（ｐａｇｅｒａｎｋ、ｌｐａなど）全体は、実行エンジンにより駆動される。ただし、Ｐａｇｅｒａｎｋは、ウェーブページ重み分析とも呼ばれ、ウェーブページライブラリ全体における全てのウェーブページに対して重み分析を行うために用いられる。Ｌｐａは、コミュニティ発見とも呼ばれ、例えば、金融取引ライブラリにおいて詐欺容疑と認められた幾つかのアカウントを標識し、可能な詐欺グループを推算するなどに用いられる。説明を容易にするために、後続きの実施例は、ＰＡｇｅｒａｎｋの実行プロセスの実現を例として説明する。

グラフ計算を実行する時に、実行エンジンは、ユーザのグラフデータベース操作に応答することによって、対応するグラフ計算を行う。実行エンジンがグラフ計算を実行する時に、グラフ計算プロセスに用いられるパラメータを入力パラメータとして、インターフェース関数を呼び出す。インターフェース関数は、グラフィックスプロセッシングユニットＧＰＵで実行される。

ステップ１０４において、グラフィックスプロセッシングユニットＧＰＵは複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数は並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドはインターフェース関数の実行結果を実行エンジンにフィードバックする。

グラフィックスプロセッシングユニットＧＰＵにおける記憶空間が、全グラフ計算に含まれる計算対象の全てを収容することができる場合に、グラフィックスプロセッシングユニットは、並列スレッドにより各々のノードをそれぞれ処理する。各々のスレッドは、それぞれ処理するノードに対して同じインターフェース関数を実行し、対応するノードのフィードバックデータをフィードバックし、ＧＰＵにおける、並列したマルチスレッドによるグラフ計算の並列処理を実現する。ただし、グラフィックスプロセッシングユニットにおいて、各々のスレッドは、ストリームプロセッサにより実行される。ＧＰＵにおいて、ストリームプロセッサは、大規模で同時並行して実行することができる。

例示的に、例えば、全グラフは１００段階を含み、ＧＰＵにおける記憶空間は１００個のノードデータを記憶することができるとともに、ＧＰＵには、１００個の並列スレッドをそれぞれ実行し、１００個のノードを並列処理する１００個のストリームプロセッサを配置することができ、各々のスレッドは、いずれも収集方向事前判断を実行し、各ノードの入辺パラメータをフィードバックする。

本出願の実施例では、グラフィックスプロセッシングユニットＧＰＵは、一般に、機械学習及びグラフィック計算に適用される。データベース処理に適用されることが少ない。グラフィックスプロセッシングユニットＧＰＵには、大量のストリームプロセッサが備えられ、それぞれのストリームプロセッサは、１つの減弱したセントラルプロセッシングユニットＣＰＵに相当する。これらのストリームプロセッサは、大規模（数百万個）で同時並行して実行することができる。ＧＰＵにおけるマルチスレッドの並列のコストは、通常のセントラルプロセッシングユニットＣＰＵの並列のコストよりも遥かに低い。ステップ１０５において、実行エンジンは実行結果に基づき、グラフ計算を完成させる。

上記出願の実施例により提供されるグラフ計算の処理方法は、セントラルプロセッシングユニットＣＰＵに実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵに実行エンジンにより利用可能なインターフェース関数を配置し、グラフ計算を実行する時に、セントラルプロセッシングユニットＣＰＵにおける実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンがインターフェース関数によってフィードバックされた実行結果に基づき、グラフ計算を完成させるようにすることができる。従来は、セントラルプロセッシングユニットＣＰＵしか使えずグラフ処理を行うことで、計算資源が固定化され、並列処理効率が低下することに対して、本出願の実施例は、グラフィックスプロセッシングユニットＧＰＵによる高い同時並行性を利用し、セントラルプロセッシングユニットＣＰＵにおける実行エンジンによりグラフ計算フローをリードすることができ、グラフ計算フローにおいて実行エンジンは、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出し、全グラフ処理を行う時に、グラフに含まれる複数のノードはグラフィックスプロセッシングユニットＧＰＵで並列処理を行うことができ、さらに固定した計算資源において、高い同時並行性のノード並列処理を実現し、グラフ計算効率を向上させる。

さらに、セントラルプロセッシングユニットＣＰＵのメモリ空間は大きくて、大量のグラフデータを読み取ることができる。グラフィックスプロセッシングユニットＧＰＵのメモリ空間は、セントラルプロセッシングユニットＣＰＵのメモリ空間よりも小さいので、セントラルプロセッシングユニットＣＰＵにより1回読み取られて処理されたデータを一括してグラフィックスプロセッシングユニットに伝送して処理することができないことが発生し、直接伝送すれば誤りが生じやすく、データの紛失などのミスを引き起こすことになる。これに基づき、ステップ１０３において、実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出すステップは、実行エンジンがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズによって処理対象のグラフデータをブロック化し、それぞれがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズにマッチングする複数のノードブロックを取得し、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、複数のノードブロックに対してグラフ計算を順次行うという方式により実施することができる。

セントラルプロセッシングユニットＣＰＵは、グラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズを予め取得する。現在処理可能なグラフデータのデータ量がグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズよりも大きいと、グラフィックスプロセッシングユニットのメモリ空間のサイズによってグラフデータをブロック化し、それぞれのデータ量がグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズと同じである複数のノードブロックを取得する。

例示的に、ブロック化（ｂｌｏｃｋｂｙｂｌｏｃｋ）技術によりグラフデータを分割し、実行エンジンによりサイズを予測し、ノード（ｖｅｒｔｅｘ）によってブロック化することができる。

本出願の実施例により提供されるグラフ計算の処理方法は、セントラルプロセッシングユニットＣＰＵのメモリとグラフィックスプロセッシングユニットＧＰＵのメモリはサイズがマッチングしないことで、グラフィックスプロセッシングユニットＧＰＵはメモリが小さいために全てのグラフデータを処理できない、という問題を解決することができる。セントラルプロセッシングユニットＣＰＵにおける実行エンジンは、ブロック化後のノードブロックがＧＰＵのメモリのサイズにマッチングするように、グラフィックスプロセッシングユニットＧＰＵのメモリのサイズによって処理対象のデータをブロック化し、グラフィックスプロセッシングユニットＧＰＵは、ブロック化後のノードブロックを一括して処理し、全ての処理対象のデータのグラフ計算を実行して、信頼性を向上させることができる。

［実施例３］
図３は、本出願の第３の実施例により提供されるグラフ計算の処理方法の模式図であり、上記実施例についての更なる説明としては、下記のステップ２０１〜ステップ２０７を含む。

ステップ２０１において、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置する。

ステップ２０２において、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置する。

ステップ２０１とステップ２０２の実行順番は、前後を問わない。

ステップ２０３において、グラフ計算を実行する時に、実行エンジンは収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得する。

全グラフ処理を行う時に、本出願の実施例は、収束−適用−発散（ＧＡＳと略称する）という処理構想を提供し、このような計算は、１つのほぼ汎用の計算フローを抽象化し、グラフ計算全体を、各々の点に同時に（同時並行して）作用させる３つのステップに分ける。ここで、収集（ｃｏｌｌｅｃｔ／ｇａｔｈｅｒ）は、現在ノードの周辺のノードの情報を集め、対応するアルゴリズムの計算を行うことを含む。適用は、更新（ｕｐｄａｔｅ／ａｐｐｌｙ）とも呼ばれ、第１のステップの計算結果を現在ノードに作用させることを含む。発散は、ブロードキャスト（ｓｉｇｎａｌ）とも呼ばれ、周りのノードへ自分のデータをブロードキャストすることを含む。

収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅの入力パラメータは、ノード（Ｖｅｒｔｅｘ）データであり、ノードデータは、グラフ中のあるノードを標識するために用いられる。実行エンジンは、ノード（Ｖｅｒｔｅｘ）データをグラフィックスプロセッシングユニットＧＰＵにコピーし、パラメータとしてＧＰＵで実行されるｇａｔｈｅｒ＿ｅｄｇｅに伝送する。

例示的に、実行エンジンは、収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅがノードＡによってフィードバックしたパラメータを受信するように、現在処理されているノードＡをパラメータとして収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出す。

ＰａｇｅＲａｎｋシーンでは、入辺によって隣接ノード重みを計算する必要があるので、収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅは、入辺パラメータ（ＩＮ）を返す。

ステップ２０４において、実行エンジンは入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得る。

実行エンジンは、ノードターゲットノードの入辺の相手側ノードを取得し、相手側ノードのプリセットパラメータによって累積などの処理を行い、ノードターゲットノードの更新データを得る。ＰａｇｅＲａｎｋシーンでは、プリセットパラメータは、ノードの重みであってもよい。

ステップ２０５において、実行エンジンはデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新する。

ステップ２０４でノードターゲットノードの更新データを得た後、実行エンジンは、データ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、ノードターゲットノードのプリセットパラメータの更新を実現する。この場合、更新データをパラメータとしてデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出す。

さらに、更新データと元データ（ノードターゲットノードの更新前のプリセットパラメータ値）の変動幅を検出することができる。かつ、この変動を保存しておく。後でこの幅に基づいて更なる分析などの操作を行うことができる。

ステップ２０６において、グラフィックスプロセッシングユニットＧＰＵは複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数は並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドはインターフェース関数の実行結果を実行エンジンにフィードバックする。

なお、上記のステップでインターフェース関数を呼び出す時に、グラフィックスプロセッシングユニットＧＰＵで複数のストリームプロセッサによりグラフデータにおける複数のノードに対して並列処理を行う。例えば、収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅ、データ変更アプリケーションインターフェース関数ａｐｐｌｙなどを呼び出すステップは、いずれもグラフィックスプロセッシングユニットＧＰＵで並列方式によりインターフェース関数を実行することができる。

ステップ２０７において、実行エンジンは実行結果に基づき、グラフ計算を完成させる。

本発明の実施例により提供されるグラフ計算の処理方法は、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出すことにより、複数のノードに対して同時並行的かつ迅速な処理を同時に行うことを実現し、処理効率を向上させることができる。ノードに対する収束と適用の並列処理が実現される。

さらに、幾つかの適用シーンでは、ノードに対する収束と適用の他に、更新後の更新データをノードターゲットノードの出辺の相手側に知らせ、発散を完成させることも必要である。これに基づき、ステップ２０５において、実行エンジンがデータ変更アプリケーションインターフェース関数を呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新した後、さらに下記のステップ２０８とステップ２０９を含む。

ステップ２０８において、実行エンジンは発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出すことにより、ノードの出辺パラメータを取得する。

発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅの入力パラメータは、ノード（Ｖｅｒｔｅｘ）データであり、ノードデータは、グラフ中のあるノードを標識するために用いられる。実行エンジンは、ノード（Ｖｅｒｔｅｘ）データをグラフィックスプロセッシングユニットＧＰＵにコピーし、パラメータとしてＧＰＵで実行される発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅに伝送する。

例示的に、実行エンジンは、発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅがノードＡによってフィードバックしたパラメータ（ＯＵＴ）を受信するように、現在処理されているノードＡをパラメータとして発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出す。

ステップ２０５においてデータ変更アプリケーションインターフェース関数ａｐｐｌｙを利用してノードターゲットノードの更新データを更新した後に、データ変更アプリケーションインターフェース関数ａｐｐｌｙの保存している変動値を取得する。変動値が収束すると、ＮＯＮＥを返し、そうでないと、ＯＵＴを返す。ＰａｇｅＲａｎｋシーンでは、ノードターゲットノードの更新データを更新した後、ノードターゲットノードの出辺の相手側ノード（ｏｕｔｎｅｉｇｈｂｏｒ）にノードターゲットノードの更新データを知らせる。

ステップ２０９、実行エンジンが発散インターフェース関数ｓｃａｔｔｅｒを呼び出すことにより、更新データを出辺の相手側ノードに更新する。

発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅが発散パラメータＯＵＴを返すと、実行エンジンは、ノードターゲットノードの更新データをその出辺の相手側ノードに更新するように、発散インターフェース関数ｓｃａｔｔｅｒを呼び出す。

本発明の実施例により提供されるグラフ計算の処理方法は、ＰａｇｅＲａｎｋシーン、ＬＰＡシーンなどのような、収束した後に発散することが必要なシーンに対して、ノードターゲットノードのプリセットパラメータの更新後に、ノードターゲットノードのプリセットパラメータをその出辺の相手側ノードに送信することができ、グラフにおけるノード情報を対称的なものとし、グラフ中の情報の正確性を向上させる。

［実施例４］
図４は、本出願の第４の実施例により提供されるグラフ計算の処理方法の模式図であり、上記実施例についての更なる説明としては、下記のステップ３０１〜ステップ３０８を含む。

ステップ３０１において、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置する。

ステップ３０２において、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置する。

ステップ３０１とステップ３０２の実行順番は、前後を問わない。

ステップ３０３において、グラフ計算を実行する時に、実行エンジンは収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得する。

ステップ３０４において、実行エンジンはデータベースにアクセスすることにより、ノードターゲットノードの入辺隣接インデックスを取得する。

実行エンジンは、収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことによりフィードバックされた入辺パラメータを受信した時に、データベースアクセスインターフェースを介してデータベースにアクセスし、データベースから現在ノードの入辺隣接インデックスを呼び出す。

ステップ３０５において、実行エンジンは入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得る。

現在ノードが複数の入辺を有する場合に、現在ノードの入辺の相手側ノードのプリセットパラメータをそれぞれ取得する。プリセットパラメータは、例えば、重みパラメータである。全ての入辺の相手側ノードのプリセットパラメータを累計してノードターゲットノードのプリセットパラメータの収束を完成させる。

選択的に、ステップ３０５は、下記の１）〜３）により実施することができる。

１）実行エンジンは、入辺隣接インデックスによって各入辺を取得する。

２）実行エンジンは、集合インターフェース関数ｇａｔｈｅｒを呼び出すことにより、各入辺の相手側ノードのプリセットパラメータを取得する。

集合インターフェース関数ｇａｔｈｅｒは、実行エンジンに入辺の相手側ノードのプリセットパラメータをフィードバックするために用いられる。ノードターゲットノードが複数の入辺を有する場合に、集合インターフェース関数ｇａｔｈｅｒを数回呼び出すことにより、各入辺の相手側ノードのプリセットパラメータを順次取得する。プリセットパラメータは、重みパラメータであってもよい。

３）実行エンジンは、グラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出して入辺の相手側ノードのプリセットパラメータを累積し、ノードターゲットノードの更新データを得る。

並列処理プロセスにおいて、ＧＰＵに複数の並列したストリームプロセッサがあるが、この場合、ＧＰＵでストリームプロセッサによりそれに処理される現在ノードのプリセットパラメータを累積することができる。この場合、実行エンジンは、グラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出すことにより、並列して複数のノードのプリセットパラメータを累積することを実現し、各々のノードターゲットノードの更新データをそれぞれ得る。

ステップ３０６において、実行エンジンはデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新する。

ステップ３０７において、グラフィックスプロセッシングユニットＧＰＵは複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数は並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドはインターフェース関数の実行結果を実行エンジンにフィードバックする。

ステップ３０８において、実行エンジンは実行結果に基づき、グラフ計算を完成させる。

［実施例５］
図５は、本出願の第５の実施例により提供されるグラフ計算の処理装置４００の構造模式図であり、当該装置は、グラフ計算の処理プロセス、特に、セントラルプロセッシングユニットＣＰＵとグラフィックスプロセッシングユニットＧＰＵを用いて共同でグラフ処理を行うプロセスに適用され、当該装置は、グラフ計算を実行する電子機器により実行可能であり、電子機器は、パソコン、サーバ、スマートフォン、タブレット型パソコンなどであってもよく、当該装置は、配置モジュール４０１と、実行エンジンモジュール４０２と、インターフェース呼び出しモジュール４０３と、を備え、配置モジュール４０１は、セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置するために用いられ、実行エンジンモジュール４０２は、グラフ計算を実行する時に、グラフ計算インターフェースを介してインターフェース関数を呼び出すために用いられ、インターフェース呼び出しモジュール４０３は、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行することに用いられ、複数の並列したインターフェース関数は並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドはインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンモジュール４０２は、さらに、実行結果に基づき、グラフ計算を完成させるために用いられる。

本出願の実施例により提供されるグラフ計算の処理装置は、配置モジュール４０１がセントラルプロセッシングユニットＣＰＵに実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵに実行エンジンにより利用可能なインターフェース関数を配置することができ、グラフ計算を実行する時に、実行エンジンモジュール４０２がグラフ計算インターフェースを介してインターフェース関数を呼び出し、インターフェース呼び出しモジュール４０３がグラフィックスプロセッシングユニットＧＰＵで複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンがインターフェース関数によってフィードバックされた実行結果に基づき、グラフ計算を完成させるようにすることができる。従来は、セントラルプロセッシングユニットＣＰＵしか使えずグラフ処理を行うことで、計算資源が固定化され、並列処理効率が低下することに対して、本出願の実施例は、グラフィックスプロセッシングユニットＧＰＵによる高い同時並行性を利用し、セントラルプロセッシングユニットＣＰＵにおける実行エンジンによりグラフ計算フローをリードすることができ、グラフ計算フローにおいて実行エンジンは、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出し、全グラフ処理を行う時に、グラフに含まれる複数のノードはグラフィックスプロセッシングユニットＧＰＵで並列処理を行うことができ、さらに固定した計算資源において、高い同時並行性のノード並列処理を実現し、グラフ計算効率を向上させる。

上記実施例の一実現形態では、実行エンジンモジュール４０２は、実行エンジンが収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得し、実行エンジンが入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得て、実行エンジンがデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、ノードターゲットノードのプリセットパラメータを更新するために用いられる。

上記実施例の一実現形態では、実行エンジンモジュール４０２は、実行エンジンが発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出すことにより、ノードの出辺パラメータを取得し、実行エンジンが発散インターフェース関数ｓｃａｔｔｅｒを呼び出すことにより、更新データを出辺の相手側ノードに更新するために用いられる。

上記実施例の一実現形態では、実行エンジンモジュール４０２は、実行エンジンがデータベースにアクセスすることにより、ノードターゲットノードの入辺隣接インデックスを取得し、実行エンジンが入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、ノードターゲットノードの更新データを得るために用いられる。

上記実施例の一実現形態では、実行エンジンモジュール４０２は、実行エンジンが入辺隣接インデックスによって各入辺を取得し、実行エンジンが集合インターフェース関数ｇａｔｈｅｒを呼び出すことにより、各入辺の相手側ノードのプリセットパラメータを取得し、実行エンジンがグラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出して入辺の相手側ノードのプリセットパラメータを累積し、ノードターゲットノードの更新データを得るために用いられる。

上記実施例の一実現形態では、実行エンジンモジュール４０２は、実行エンジンがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズによって処理対象のグラフデータをブロック化し、それぞれがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズにマッチングする複数のノードブロックを取得し、実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、複数のノードブロックに対してグラフ計算を順次行うために用いられる。

本出願の実施例によれば、本出願は、さらに、電子機器及び読み取り可能な記憶媒体を提供する。

図６に示すように、本出願の実施例によるグラフ計算の処理方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなど、様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティングデバイスなど、様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書で説明及び／または要求される本出願の実施を制限することを意図したものではない。

電子機器は、少なくとも１つのセントラルプロセッシングユニットＣＰＵ及びグラフィックスプロセッシングユニットＧＰＵと、少なくとも１つのセントラルプロセッシングユニットＣＰＵまたはグラフィックスプロセッシングユニットＧＰＵと通信可能に接続されるメモリとを備え、ここで、メモリは、少なくとも１つのセントラルプロセッシングユニットＣＰＵまたはグラフィックスプロセッシングユニットＧＰＵにより実行可能な命令を記憶しており、命令は、少なくとも１つのプロセッサにより実行される。

図６に示すように、当該電子機器は、１つまたは複数のセントラルプロセッシングユニットＣＰＵ５０１及びグラフィックスプロセッシングユニットＧＰＵ５０２と、メモリ５０３と、各コンポーネントを接続するためのインターフェースであって高速インターフェース及び低速インターフェースを含むものとを備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けるか、または必要に応じて他の方式で取り付けることができる。プロセッサは、電子機器内で実行される命令を処理することができ、当該命令は、外部入力／出力装置（例えば、インターフェースに結合されたディスプレイデバイスなど）にＧＵＩのグラフィックス情報をディスプレイするためにメモリ内またはメモリ上に記憶されている命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び／または複数のバスを、複数のメモリと一緒に使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、一部の必要な操作（例えば、サーバアレイ、ブレードサーバ群、またはマルチプロセッサシステムとする）を提供することができる。図６には、１つのセントラルプロセッシングユニットＣＰＵ５０１及び１つのグラフィックスプロセッシングユニットＧＰＵ５０２を例とする。

メモリ５０３は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ただし、メモリには、少なくとも１つのプロセッサが本出願により提供されるグラフ計算の処理方法を実行するように、少なくとも１つのプロセッサにより実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータに本出願により提供されるグラフ計算の処理方法を実行させるためのコンピュータ命令を記憶する。

メモリ５０３は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例におけるグラフ計算の処理方法に対応するプログラム命令／モジュール（例えば、図６に示す配置モジュール４０１、実行エンジンモジュール４０２、及びインターフェース呼び出しモジュール４０３）のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために用いることができる。セントラルプロセッシングユニットＣＰＵ５０１またはグラフィックスプロセッシングユニットＧＰＵ５０２は、メモリ５０３に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記の方法の実施例におけるグラフ計算の処理方法を実現する。

メモリ５０３は、プログラムストレージエリアとデータストレージエリアとを備えてもよく、ここで、プログラムストレージエリアは、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができ、データストレージエリアは、グラフ計算の処理の電子機器の使用によって作成されたデータなどを記憶することができる。さらに、メモリ５０３は、高速ランダムアクセスメモリを備えてもよいし、少なくとも１つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、または他の非一時的なソリッドステートストレージデバイスのような、非一時的なメモリを備えてもよい。いくつかの実施例では、メモリ５０３は、セントラルプロセッシングユニットプロセッサ５０１またはグラフィックスプロセッシングユニット５０２に対して遠隔に設置されたメモリを選択的に備え、これらの遠隔メモリは、ネットワークを介してグラフ計算の処理の電子機器に接続することができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワーク及びその組み合わせを含むが、これらに限定されない。

グラフ計算の処理方法の電子機器は、入力装置５０４と、出力装置５０５とをさらに備えてもよい。セントラルプロセッシングユニット５０１、グラフィックスプロセッシングユニット５０２、メモリ５０３、入力装置５０４、及び出力装置５０５は、バスまたは他の方式により接続することができ、図６では、バスを介して接続することを例とする。

入力装置５０４は、入力された数字または文字情報を受信し、グラフ計算の処理の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、１つまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置が挙げられる。出力装置５０５は、ディスプレイデバイス、補助照明装置（例えば、ＬＥＤ）、及び触覚フィードバックデバイス（例えば、振動モータ）などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態で、ディスプレイデバイスは、タッチスクリーンであってもよい。

ここで説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／またはそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つまたは複数のコンピュータプログラムで実施されることを含んでもよく、当該１つまたは複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／または解釈することができ、当該プログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる）は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び／または対象指向プログラミング言語、及び／またはアセンブリ／機械言語でこれらのコンピューティングプログラムを実施することができる。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び／またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び／または装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び／またはデータをプログラマブルプロセッサに提供するための任意の信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウスまたはトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、任意の形態（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、またはミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、またはフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェースまたはウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースまたは当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションを行うことができる）、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態または媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、を含む。

コンピュータシステムは、クライアント側とサーバとを備えることができる。クライアント側とサーバは、一般に、互いに離れており、通常、通信ネットワークを介してインタラクションを行う。対応するコンピュータ上で実行され、かつ互いにクライアント側−サーバの関係を有するコンピュータプログラムによって、クライアント側とサーバとの関係を生成する。

本出願の実施例の技術案によれば、セントラルプロセッシングユニットＣＰＵに実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵに実行エンジンにより利用可能なインターフェース関数を配置し、グラフ計算を実行する時に、セントラルプロセッシングユニットＣＰＵにおける実行エンジンがグラフ計算インターフェースを介してインターフェース関数を呼び出し、グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによってインターフェース関数を実行し、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、複数の並列スレッドがインターフェース関数の実行結果を実行エンジンにフィードバックし、実行エンジンがインターフェース関数によってフィードバックされた実行結果に基づき、グラフ計算を完成させるようにすることができる。従来は、セントラルプロセッシングユニットＣＰＵしか使えずグラフ処理を行うことで、計算資源が固定化され、並列処理効率が低下することに対して、本出願の実施例は、グラフィックスプロセッシングユニットＧＰＵによる高い同時並行性を利用し、セントラルプロセッシングユニットＣＰＵにおける実行エンジンによりグラフ計算フローをリードすることができ、グラフ計算フローにおいて実行エンジンは、グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出し、全グラフ処理を行う時に、グラフに含まれる複数のノードはグラフィックスプロセッシングユニットＧＰＵで並列処理を行うことができ、さらに固定した計算資源において、高い同時並行性のノード並列処理を実現し、グラフ計算効率を向上させる。

グラフィックスプロセッシングユニットＧＰＵで実行されるインターフェース関数を呼び出すことにより、複数のノードに対して同時並行的かつ迅速な処理を同時に行うことを実現し、処理効率を向上させることができる。ＰａｇｅＲａｎｋシーン、ＬＰＡシーンなどのような、収束した後に発散することが必要なシーンに対して、ノードターゲットノードのプリセットパラメータの更新後に、ノードターゲットノードのプリセットパラメータをその出辺の相手側ノードに送信することにより、グラフにおけるノード情報を対称的なものとし、グラフ中の情報の正確性を向上させることができる。

ＣＰＵがデータベースにアクセスすることにより隣接リストを取得し、データベースインターフェースを用いてデータベースからデータを迅速に取得し、データクエリ効率を向上させることができる。また、グラフィックスプロセッシングユニットＧＰＵで累積ｓｕｍ計算を行うことができる。グラフィックスプロセッシングユニットＧＰＵがｓｕｍ計算を行うことにより、同時並行的な複数のノードのプリセットパラメータの計算を実現し、処理効率を大幅に向上させることができる。また、セントラルプロセッシングユニットＣＰＵの負荷を低減し、累積ｓｕｍ計算が容易であり、ＧＰＵの負荷への影響が小さい。

また、セントラルプロセッシングユニットＣＰＵのメモリとグラフィックスプロセッシングユニットＧＰＵのメモリはサイズがマッチングしないことで、グラフィックスプロセッシングユニットＧＰＵはメモリが小さいために全てのグラフデータを処理することができない、という問題を解決することができる。セントラルプロセッシングユニットＣＰＵにおける実行エンジンは、ブロック化後のノードブロックがＧＰＵのメモリのサイズにマッチングするように、グラフィックスプロセッシングユニットＧＰＵのメモリのサイズによって処理対象のデータをブロック化し、グラフィックスプロセッシングユニットＧＰＵは、ブロック化後のノードブロックを一括して処理し、全ての処理対象のデータのグラフ計算を実行して、信頼性を向上させることができる。

上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、または削除することができると理解すべきである。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案の所望の結果を実現することができれば、本明細書では限定しない。

上記の具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができると理解すべきである。本出願の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims

セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置するステップと、
グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置するステップと、
グラフ計算を実行する時に、前記実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出すステップと、
前記グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによって前記インターフェース関数を実行するステップであって、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、前記複数の並列スレッドが前記インターフェース関数の実行結果を前記実行エンジンにフィードバックするステップと、
前記実行エンジンが前記実行結果に基づき、グラフ計算を完成させるステップと、
を含むグラフ計算の処理方法。
前記実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出すステップが、
実行エンジンが収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得するステップと、
実行エンジンが前記入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得るステップと、
実行エンジンがデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、前記ノードターゲットノードのプリセットパラメータを更新するステップと、
を含む請求項１に記載のグラフ計算の処理方法。
実行エンジンがデータ変更アプリケーションインターフェース関数を呼び出すことにより、前記ノードターゲットノードのプリセットパラメータを更新した後、
実行エンジンが発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出すことにより、ノードの出辺パラメータを取得するステップと、
実行エンジンが発散インターフェース関数ｓｃａｔｔｅｒを呼び出すことにより、前記更新データを出辺の相手側ノードに更新するステップと、
を含む請求項２に記載のグラフ計算の処理方法。
実行エンジンが前記入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得るステップが、
実行エンジンがデータベースにアクセスすることにより、ノードターゲットノードの入辺隣接インデックスを取得するステップと、
実行エンジンが前記入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得るステップと、
を含む請求項２に記載のグラフ計算の処理方法。
実行エンジンが前記入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得るステップが、
実行エンジンが前記入辺隣接インデックスによって各入辺を取得するステップと、
実行エンジンが集合インターフェース関数ｇａｔｈｅｒを呼び出すことにより、前記各入辺の相手側ノードのプリセットパラメータを取得するステップと、
実行エンジンがグラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出して前記入辺の相手側ノードのプリセットパラメータを累積し、前記ノードターゲットノードの更新データを得るステップと、
を含む請求項４に記載のグラフ計算の処理方法。
前記実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出すステップが、
前記実行エンジンがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズによって処理対象のグラフデータをブロック化し、それぞれがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズにマッチングする複数のノードブロックを取得するステップと、
前記実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出し、前記複数のノードブロックに対してグラフ計算を順次行うステップと、
を含む請求項１に記載のグラフ計算の処理方法。
セントラルプロセッシングユニットＣＰＵに、グラフ計算の実行をリードするための実行エンジンを配置し、グラフィックスプロセッシングユニットＧＰＵで実行される、グラフ計算におけるパラメータ処理またはフィードバックを行うためのインターフェース関数を配置するための配置モジュールと、
グラフ計算を実行する時に、前記グラフ計算インターフェースを介してインターフェース関数を呼び出すための実行エンジンモジュールと、
前記グラフィックスプロセッシングユニットＧＰＵが複数の並列スレッドによって前記インターフェース関数を実行するためのインターフェース呼び出しモジュールであって、複数の並列したインターフェース関数が並列して複数のグラフノードを処理するために用いられ、前記複数の並列スレッドが前記インターフェース関数の実行結果を前記実行エンジンにフィードバックするインターフェース呼び出しモジュールと、
を備え、
前記実行エンジンモジュールが、前記実行結果に基づき、グラフ計算を完成させるために用いられるグラフ計算の処理装置。
前記実行エンジンモジュールが、
実行エンジンが収集方向事前判断インターフェース関数ｇａｔｈｅｒ＿ｅｄｇｅを呼び出すことにより、入辺パラメータを取得し、
実行エンジンが前記入辺パラメータに基づいてノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得て、
実行エンジンがデータ変更アプリケーションインターフェース関数ａｐｐｌｙを呼び出すことにより、前記ノードターゲットノードのプリセットパラメータを更新するために用いられる請求項７に記載のグラフ計算の処理装置。
前記実行エンジンモジュールが、
実行エンジンが発散方向事前判断インターフェース関数ｓｃａｔｔｅｒ＿ｅｄｇｅを呼び出すことにより、ノードの出辺パラメータを取得し、
実行エンジンが発散インターフェース関数ｓｃａｔｔｅｒを呼び出すことにより、前記更新データを出辺の相手側ノードに更新するために用いられる請求項８に記載のグラフ計算の処理装置。
前記実行エンジンモジュールが、
実行エンジンがデータベースにアクセスすることにより、ノードターゲットノードの入辺隣接インデックスを取得し、
実行エンジンが前記入辺隣接インデックスによってノードターゲットノードのプリセットパラメータの収束を行い、前記ノードターゲットノードの更新データを得るために用いられる請求項８に記載のグラフ計算の処理装置。
前記実行エンジンモジュールが、
実行エンジンが前記入辺隣接インデックスによって各入辺を取得し、
実行エンジンが集合インターフェース関数ｇａｔｈｅｒを呼び出すことにより、前記各入辺の相手側ノードのプリセットパラメータを取得し、
実行エンジンがグラフィックスプロセッシングユニットＧＰＵにおける累積インターフェース関数ｓｕｍを呼び出して前記入辺の相手側ノードのプリセットパラメータを累積し、前記ノードターゲットノードの更新データを得るために用いられる請求項１０に記載のグラフ計算の処理装置。
前記実行エンジンモジュールが、
前記実行エンジンがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズによって処理対象のグラフデータをブロック化し、それぞれがグラフィックスプロセッシングユニットＧＰＵのメモリ空間のサイズにマッチングする複数のノードブロックを取得し、
前記実行エンジンが前記グラフ計算インターフェースを介してインターフェース関数を呼び出し、前記複数のノードブロックに対してグラフ計算を順次行うために用いられる請求項７に記載のグラフ計算の処理装置。
少なくとも１つのセントラルプロセッシングユニットＣＰＵ及びグラフィックスプロセッシングユニットＧＰＵと、
前記少なくとも１つのセントラルプロセッシングユニットＣＰＵまたはグラフィックスプロセッシングユニットＧＰＵと通信可能に接続されるメモリと、
を備え、
前記メモリが、前記少なくとも１つのセントラルプロセッシングユニットＣＰＵまたはグラフィックスプロセッシングユニットＧＰＵにより実行可能な命令を記憶しており、前記命令が、前記少なくとも１つのプロセッサにより実行される場合、前記少なくとも１つのセントラルプロセッシングユニットＣＰＵまたはグラフィックスプロセッシングユニットＧＰＵが請求項１から６のいずれか一項に記載の方法を実行可能な電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令が、コンピュータに請求項１から６のいずれか一項に記載の方法を実行させるために用いられる非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータ上で動作しているときに、請求項１から６のいずれか一項に記載の方法を前記コンピュータに実行させるコンピュータプログラム。