JP2015064636A - 情報処理システム、分散処理方法、及び、プログラム - Google Patents

情報処理システム、分散処理方法、及び、プログラム Download PDF

Info

Publication number
JP2015064636A
JP2015064636A JP2013196635A JP2013196635A JP2015064636A JP 2015064636 A JP2015064636 A JP 2015064636A JP 2013196635 A JP2013196635 A JP 2013196635A JP 2013196635 A JP2013196635 A JP 2013196635A JP 2015064636 A JP2015064636 A JP 2015064636A
Authority
JP
Japan
Prior art keywords
data
processing
divided data
node
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013196635A
Other languages
English (en)
Other versions
JP6364727B2 (ja
Inventor
純一 安田
Junichi Yasuda
純一 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013196635A priority Critical patent/JP6364727B2/ja
Priority to US14/490,227 priority patent/US20150088958A1/en
Publication of JP2015064636A publication Critical patent/JP2015064636A/ja
Application granted granted Critical
Publication of JP6364727B2 publication Critical patent/JP6364727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/303Terminal profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数データを複数のノードで分散処理するシステムにおいて、システムの処理負荷を低減する。
【解決手段】分散処理システム1のノード200は、分割データ送信部220と処理部230とを含む。分割データ送信部220は、複数の分割データ510の内の処理対象の分割データ510を関連データとして用いる可能性がある他のノード200へ、当該分割データ510を送信する。処理部230は、分割データ510と、他のノード200から受信した、当該分割データ510の関連データと、を用いて、当該分割データ510に対する所定の処理を行う。
【選択図】図1

Description

本発明は、情報処理システム、分散処理方法、及び、プログラムに関し、特に、分割データを複数のノードで分散処理する情報処理システム、分散処理方法、及び、プログラムに関する。
コンピュータのハードウェア、ソフトウェア、及び、ネットワークの高性能化に伴い、複数のコンピュータをネットワークで接続して、分散処理を行うことにより、高い処理性能を得る技術が開発されている。
特に、近年では、分散処理技術の発展に伴い、大量データの高速分析が可能な分散並列処理基盤が提供され、大量データに対する傾向や知見の導出に適用されている。例えば、分散並列処理基盤としてよく知られているHadoopは、顧客情報や行動履歴のマイニング、大量ログ情報からの傾向分析などに適用されている。
分散並列処理基盤に大量データをインポートする技術が、例えば、非特許文献1に開示されている。非特許文献1のような技術において、大量データのインポートを高速に行う方法として、分散ストレージへの書き込みを複数のノードで並行に行う方法がある。図16は、分散並列処理基盤への大量データのインポートの方法の例を示す図である。図16の例では、データサーバが、大量データを含む元データから各データを抽出し、分散並列処理基盤上の複数のノードへ送信する。ここで、データサーバは、例えば、非特許文献2のような技術を用いて、元データにおけるレコード等のデリミタを検出し、各データを抽出する。各ノードは、各データに対する加工(例えば、型チェック、型変換等)や、分散ストレージへの書き込み等の処理を、並列して実行する。
"Apache Sqoop"、The Apache Software Foundation、[online]、[平成25年8月13日検索]、インターネット〈URL:http://sqoop.apache.org/〉 "RFC4180 Common Format and MIME Type for Comma-Separated Values (CSV) Files"、Y. Shafranovich、[online]、[平成25年8月13日検索]、インターネット〈URL:http://tools.ietf.org/html/rfc4180〉
上述の図16のような分散並列処理基盤へのインポートにおいて、データ間に関連性がある場合、各ノードがデータを処理するときに、他ノードの処理対象のデータ(関連データ)を必要とすることがある。この場合、ノードは、関連データを保持する他ノードを検索し、当該他ノードから関連データを取得する必要がある。特に、データやノードの数が多い場合、他ノードの検索や関連データの複製、転送に伴う、システムの負荷が増大する。
本発明の目的は、上述の課題を解決し、複数データを複数のノードで分散処理するシステムにおいて、システムの処理負荷を低減する情報処理システム、分散処理方法、及び、プログラムを提供することである。
本発明の情報処理システムは、複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信する、送信手段と、前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う、処理手段と、を含む処理装置を備える。
本発明の分散処理方法は、処理装置において、複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信し、前記処理装置において、前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う。
本発明のプログラムは、処理装置用のコンピュータを、複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信する、送信手段と、前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う、処理手段と、して機能させる。
本発明の効果は、複数データを複数のノードで分散処理するシステムにおいて、システムの処理負荷を低減できることである。
本発明の第1の実施の形態の特徴的な構成を示すブロック図である。 本発明の第1の実施の形態における、分散処理システム1の構成を示すブロック図である。 本発明の実施の形態において、データサーバ100、及び、ノード200がコンピュータにより実現される場合の、分散処理システム1の構成を示すブロック図である。 本発明の第1の実施の形態における、元データ500のインポート処理を示すフローチャートである。 本発明の第1の実施の形態における、分散並列処理基盤への元データ500のインポートを示す図である。 本発明の第1の実施の形態における、元データ500、分割データ510、及び、メタデータ520の例を示す図である。 本発明の第1の実施の形態における、サーバ設定情報161の例を示す図である。 本発明の第1の実施の形態における、転送計画131の例を示す図である。 本発明の第1の実施の形態における、ノード設定情報251の例を示す図である。 本発明の第1の実施の形態における、対象情報の抽出、及び、加工の例を示す図である。 本発明の第2の実施の形態における、分散並列処理基盤への元データ500のインポートを示す図である。 本発明の第2の実施の形態における、対象情報の抽出、及び、加工の例を示す図である。 本発明の第3の実施の形態における、分散処理システム1の構成を示すブロック図である。 本発明の第3の実施の形態における、引継ぎ処理を示すフローチャートである。 本発明の第3の実施の形態における、引継ぎ処理における対象情報の抽出、及び、加工の例を示す図である。 分散並列処理基盤への大量データのインポートの方法の例を示す図である。
(第1の実施の形態)
本発明の第1の実施の形態について説明する。
はじめに、本発明の第1の実施の形態における、分散並列処理基盤への元データ500のインポートについて説明する。
図5は、本発明の第1の実施の形態における、分散並列処理基盤への元データ500のインポートを示す図である。
本発明の第1の実施の形態においては、データサーバ100に保存されている元データ500は、例えば、データベースや、ログファイルであり、複数の対象情報を含む。ここで、対象情報は、データベースにおけるレコードや、ログにおけるログレコード等、マイニングや分析が行われる処理単位である。
データサーバ100は、元データ500を所定長の分割データ(または、単に、データ)510に分割し、複数のノード200に送信する。そして、各ノード200は、データサーバ100から受信した分割データ510(処理対象の分割データ510)に対して、対象情報の抽出、型チェック、変換、及び、複数のノード200上に構築される分散ストレージへの書き込み等の所定の処理を行う。
各ノード200は、処理対象の分割データ510に、抽出しようとする対象情報の一部しか含まれていない場合、当該処理対象の分割データ510に隣接する分割データ510(隣接分割データ)のレプリカ(複製)を用いて対象情報を抽出する。本発明の第1の実施の形態においては、分割データ510の隣接分割データのレプリカを、分割データ510の関連データと呼ぶ。各ノード200は、データサーバ100から分割データ510を受信したときに、当該分割データ510を関連データとして用いる(当該分割データ510の隣接分割データを処理対象とする)他のノード200に、当該分割データ510のレプリカを生成する。
次に、本発明の第1の実施の形態における、分散処理システム1の構成を説明する。
図2は、本発明の第1の実施の形態における、分散処理システム1の構成を示すブロック図である。図2を参照すると、本発明の第1の実施の形態における分散処理システム1は、データサーバ(または、制御装置)100、及び、分散並列処理基盤上の複数のノード(または、処理装置)200を含む。
分散処理システム1は、本発明の情報処理システムの一実施形態である。
データサーバ100、及び、複数のノード200は、ネットワーク等により、互いに通信可能に接続される。図2の例では、データサーバ100、及び、ノード200「N1」、「N2」、…が接続されている。ここで、「」内は、ノード200の識別子を示す。以下、後述する他の識別子についても、同様の表現を用いる。
データサーバ100は、データ記憶部110、データ取得部120、転送計画部130、分割部140、分割データ送信部150、及び、サーバ設定記憶部160を含む。
データ記憶部110は、元データ500を記憶する。
図6は、本発明の第1の実施の形態における、元データ500、分割データ510、及び、メタデータ520の例を示す図である。
本発明の第1の実施の形態では、図6に示すように、元データ500のデータ形式は、XML(eXtensible Markup Language)形式である。また、元データ500は、対象情報として、イベント識別子(イベントID)で識別されるイベント情報を含む。各対象情報は、<event></event>を開始ポイント/終了ポイントとするデリミタにより抽出される。
データ取得部120は、データ記憶部110から元データ500を取得する。
サーバ設定記憶部160は、データサーバ100の処理に係る情報である、サーバ設定情報161を記憶する。サーバ設定情報161は、例えば、管理者等により、予め設定される。
図7は、本発明の第1の実施の形態における、サーバ設定情報161の例を示す図である。図7の例では、サーバ設定情報161は、送信先ノード群、送信先決定方法、送信並列度、及び、分割データサイズを含む。
ここで、送信先ノード群は、分割データ510の送信先の候補であるノード200の識別子を示す。送信先決定方法は、送信先ノード群に含まれるノード200の中から、分割データ510の送信先を決定する方法を示す。送信並列度は、送達確認を待たずに、並列に送信可能な分割データ510の数を示す。分割データサイズは、分割データ510の大きさを示す。
転送計画部130は、サーバ設定情報161に従って、分割データ510のノード200への送信に係る情報である、転送計画131を生成する。
図8は、本発明の第1の実施の形態における、転送計画131の例を示す図である。図8の例では、転送計画131は、分割データIDごとに、送信先ノードID、及び、メタデータ(または、関連装置情報)520を含む。
ここで、分割データIDは、分割データ510の識別子を示す。送信先ノードIDは、分割データ510の送信先であるノード200の識別子を示す。
メタデータ520は、分割データ510とともにノード200に送信される情報である。メタデータ520は、分割データID、レプリカ生成先ノードID(前、または、後)、及び、関連データID(前、または、後)を含む。レプリカ生成先ノードID(前、または、後)は、分割データ510のレプリカの生成先(送信先)であるノード200の識別子を示す。レプリカ生成先ノードID(前)は、分割データ510の前方の隣接分割データを処理対象とするノード200の識別子である。レプリカ生成先ノードID(後)は、分割データ510の後方の隣接分割データを処理対象とするノード200の識別子である。関連データID(前)は、分割データ510の前方の隣接分割データの識別子を示す。関連データID(後)は、分割データ510の後方の隣接分割データの識別子を示す。
分割部140は、転送計画131に従って、元データ500を分割データ510に分割する。
分割データ送信部150は、転送計画131に従って、分割データ510とメタデータ520とをノード200に送信する。分割データ送信部150は、分割データ510に対するACKをノード200から受信することにより、ノード200との間で分割データ510の送達確認を行ってもよい。
ノード200は、分割データ受信部210、分割データ送信部(または、単に送信部)220、処理部230、分割データ記憶部240、及び、ノード設定記憶部250を含む。
分割データ受信部210は、データサーバ100から分割データ510とメタデータ520とを受信する。なお、分割データ受信部210は、分割データ510に対するACKをデータサーバ100へ返信することより、データサーバ100との間で分割データ510の送達確認を行ってもよい。この場合、分割データ受信部210は、分割データ510のレプリカが他のノード200に生成されたときに、データサーバ100へACKを返信する。
分割データ送信部220は、データサーバ100から分割データ510を受信した場合に、メタデータ520に従って、他のノード200に分割データ510のレプリカを生成する。本発明の第1の実施の形態では、ノード200の分割データ記憶部240が、他のノード200からも書き込み可能であると仮定する。分割データ送信部220は、メタデータ520のレプリカ生成先ノードID(前、及び、後)で示されるノード200の分割データ記憶部240に、分割データ510を書き込むことにより、レプリカを生成する。
なお、分割データ送信部220は、レプリカ生成先ノードID(前、及び、後)で示されるノード200の関連データ受信部(図示せず)に分割データ510を送信し、関連データ受信部が分割データ記憶部240に当該分割データ510を書き込むことにより、レプリカを生成してもよい。
ノード設定記憶部250は、ノード200の処理に係る情報である、ノード設定情報251を記憶する。ノード設定情報251は、例えば、管理者等により、予め設定される。
図9は、本発明の第1の実施の形態における、ノード設定情報251の例を示す図である。ノード設定情報251は、処理定義を含む。
ここで、処理定義は、抽出された対象情報に対して行うべき、加工処理(型チェック、型変換等)の処理内容を示す。図9の例では、処理定義において、XML形式からCSV形式への変換が定義されている。
分割データ記憶部240は、分割データ受信部210がデータサーバ100から受信した分割データ510とメタデータ520、及び、他のノード200により生成された分割データ510のレプリカを記憶する。
処理部230は、メタデータ520、及び、ノード設定情報251に従って、分割データ510に対する所定の処理(対象情報の抽出、加工、及び、分散ストレージへの書き込み)を行う。処理部230は、分割データ510に、抽出しようとする対象情報の一部しか含まれていない場合、分割データ510、及び、当該分割データ510の隣接分割データのレプリカから、対象情報を抽出する。
なお、データサーバ100、及び、ノード200は、それぞれ、CPU(Central Processing Unit)とプログラムを記憶した記憶媒体を含み、プログラムに基づく制御によって動作するコンピュータであってもよい。また、データサーバ100における、データ記憶部110、及び、サーバ設定記憶部160は、それぞれ個別の記憶媒体(例えば、メモリ、ハードディスク等)でも、1つの記憶媒体によって構成されてもよい。同様に、ノード200における、分割データ記憶部240、及び、ノード設定記憶部250は、それぞれ個別の記憶媒体(例えば、メモリ、ハードディスク等)でも、1つの記憶媒体によって構成されてもよい。
図3は、本発明の実施の形態において、データサーバ100、及び、ノード200がコンピュータにより実現される場合の、分散処理システム1の構成を示すブロック図である。
図3を参照すると、データサーバ100は、CPU101、記憶媒体102、及び、通信部103を含む。CPU101は、データ取得部120、転送計画部130、分割部140、及び、分割データ送信部150の機能を実現するためのコンピュータプログラムを実行する。記憶媒体102は、データ記憶部110、及び、サーバ設定記憶部160のデータを記憶する。通信部103は、ノード200に分割データ510を送信する。
ノード200は、CPU201、記憶媒体202、及び、通信部203を含む。CPU201は、分割データ受信部210、分割データ送信部220、及び、処理部230の機能を実現するためのコンピュータプログラムを実行する。記憶媒体202は、分割データ記憶部240、及び、ノード設定記憶部250のデータを記憶する。通信部203は、データサーバ100から分割データ510を受信する。また、通信部203は、他のノード200から隣接分割データのレプリカを受信、他のノード200へ分割データ510のレプリカを送信してもよい。
次に、本発明の第1の実施の形態の動作について説明する。
ここでは、図7のサーバ設定情報161、図9のノード設定情報251が、それぞれ、サーバ設定記憶部160、ノード設定記憶部250に記憶されていると仮定する。
図4は、本発明の第1の実施の形態における、元データ500のインポート処理を示すフローチャートである。
はじめに、データサーバ100のデータ取得部120は、データ記憶部110から元データ500を取得する(ステップS101)。
例えば、データ取得部120は、図6の元データ500を取得する。
次に、転送計画部130は、転送計画131を生成する(ステップS102)。ここで、転送計画部130は、元データ500をサーバ設定情報161の分割データサイズで分割し、各分割データ510に対して、分割データIDを付与する。そして、転送計画部130は、サーバ設定情報161の送信先決定方法に従って、送信先ノード群に含まれるノード200の中から各分割データ510の送信先を決定する。さらに、転送計画部130は、各分割データ510のメタデータ520におけるレプリカ生成先ノードID(前)に、当該分割データ510のレプリカを関連データ(後)として用いる(当該分割データ510の前方の隣接分割データを処理対象とする)他のノード200の識別子を設定する。また、転送計画部130は、各分割データ510のメタデータ520におけるレプリカ生成先ノードID(後)に、当該分割データ510のレプリカを関連データ(前)として用いる(当該分割データ510の後方の隣接分割データを処理対象とする)他のノード200の識別子を設定する。
例えば、転送計画部130は、図6の元データ500を、図7のサーバ設定情報161における分割データサイズに従って分割した場合の各分割データ510に対して、図8に示すように、分割データID「D1」、「D2」、…を付与する。転送計画部130は、図8に示すように、図7のサーバ設定情報161の送信先決定方法(ラウンドロビン)に従って、分割データ510「D1」、「D2」、…の送信先を、それぞれ、ノード200「N1」、「N2」、…に決定する。また、転送計画部130は、図8に示すように、分割データ510「D1」のメタデータ520におけるレプリカ生成先ノードID(後)に、分割データ510「D1」のレプリカを使用する(隣接分割データ「D2」を処理対象とする)ノード200「N2」を、また、関連データID(後)に後方の隣接分割データ「D2」を設定する。また、転送計画部130は、分割データ510「D2」のメタデータ520におけるレプリカ生成先ノードID(前)に、分割データ510「D2」のレプリカを使用する(隣接分割データ「D1」を処理対象とする)ノード200「N1」を、レプリカ生成先ノードID(後)に、分割データ510「D2」のレプリカを使用する(隣接分割データ「D3」を処理対象とする)ノード200「N3」を、さらに、関連データID(前)に前方の隣接分割データ「D1」を、関連データID(後)に後方の隣接分割データ「D3」を、それぞれ設定する。
分割部140は、転送計画131に含まれる分割データIDの先頭から順番に、分割データIDを1つ選択する(ステップS103)。
分割部140は、元データ500から、選択した分割データIDに対応する分割データ510を生成する(ステップS104)。
分割データ送信部150は、生成した分割データ510と、転送計画131に含まれる当該分割データ510に対応するメタデータ520とを、転送計画131における当該分割データ510に対応する送信先ノードIDのノード200に送信する(ステップS105)。分割データ送信部150は、ノード200から送信した分割データ510に対するACKを受信した場合、当該分割データ510を送信済みにする。
分割部140、分割データ送信部150は、転送計画131に含まれる全ての分割データIDについて、ステップS103〜S105を繰り返す(ステップS106)。
なお、分割部140、分割データ送信部150は、サーバ設定情報161における送信並列度に応じて、ステップS103〜S105を、複数の分割データ510に対して、送達確認を待たずに並列に実施してもよい。
例えば、図7のサーバ設定情報161の送信並列度は3であるため、分割部140は、図8の転送計画131をもとに、図6に示すように、元データ500から分割データ510「D1」、「D2」、「D3」を生成する。そして、分割データ送信部150は、図6に示すように、分割データ510「D1」、「D2」、「D3」に、図8の転送計画131における対応するメタデータ520を付与し、それぞれ、ノード200「N1」、「N2」、「N3」に送信する。
次に、ノード200の分割データ受信部210は、データサーバ100から分割データ510とメタデータ520とを受信する(ステップS201)。分割データ受信部210は、受信した分割データ510とメタデータ520とを、分割データ記憶部240に保存する。
例えば、ノード200「N1」、「N2」、「N3」の分割データ受信部210は、それぞれ、図6に示すような分割データ510「D1」、「D2」、「D3」とメタデータ520とを受信する。
分割データ送信部220は、メタデータ520のレプリカ生成先ノードID(前、及び、後)で示されるノード200の分割データ記憶部240に、分割データ510のレプリカを生成する(ステップS202)。分割データ受信部210は、分割データ510のレプリカが他のノード200に生成された時点で、データサーバ100へ当該分割データ510に対するACKを返信する。
例えば、ノード200「N1」の分割データ送信部220は、図6における分割データ510「D1」のメタデータ520に従って、図5に示すように、分割データ510「D1」のレプリカをノード200「N2」に生成する。同様に、ノード200「N2」の分割データ送信部220は、分割データ510「D2」のレプリカを、ノード200「N1」、「N3」に生成する。
次に、処理部230は、分割データ記憶部240から分割データ510を取得し、当該分割データ510から対象情報が抽出可能かどうか判定する(ステップS203)。ここで、処理部230は、対象情報の開始ポイント/終了ポイントのデリミタを検出することにより、対象情報が抽出可能かどうか判定する。処理部230は、分割データ510に、開始ポイントのデリミタと当該開始ポイントに対応する終了ポイントのデリミタとが含まれている場合、対象情報を抽出可能と判断する。また、処理部230は、分割データ510に、開始ポイントのデリミタが含まれているが、当該開始ポイントに対応する終了ポイントのデリミタが含まれていない場合、対象情報を抽出不可と判断する。
ステップS204で、対象情報の抽出可能の場合(ステップS203/Y)、処理部230は、分割データ510から対象情報を抽出する(ステップS205)。
ステップS204で、対象情報の抽出不可の場合(ステップS203/N)、処理部230は、分割データ記憶部240から、メタデータ520の関連データID(後)で示される、分割データ510の後方の隣接分割データのレプリカを取得する。
処理部230は、分割データ510と隣接分割データのレプリカとから対象情報が抽出可能かどうか判定する(ステップS204)。ここで、処理部230は、隣接分割データのレプリカに、分割データ510に含まれる開始ポイントに対応する終了ポイントのデリミタが含まれている場合、対象情報を抽出可能と判断する。
ステップS204で、対象情報の抽出可能の場合(ステップS204/Y)、処理部230は、分割データ510と隣接分割データのレプリカとから対象情報を抽出する(ステップS206)。
図10は、本発明の第1の実施の形態における、対象情報の抽出、及び、加工の例を示す図である。
例えば、図10に示すように、ノード200「N1」において、分割データ510「D1」には、イベント情報「E1」の開始ポイントのデリミタ<event>は含まれるが、終了ポイントのデリミタ</event>は含まれない。また、隣接分割データ「D2」のレプリカに、終了ポイントのデリミタ</event>が含まれる。従って、ノード200「N1」の処理部230は、図10に示すように、分割データ510「D1」と隣接分割データ「D2」のレプリカとから、イベント情報「E1」を抽出する。
同様に、図10に示すように、ノード200「N2」において、分割データ510「D2」には、イベント情報「E2」の開始ポイントのデリミタ<event>は含まれるが、終了ポイントのデリミタ</event>は含まれない。また、隣接分割データ「D3」のレプリカに、終了ポイントのデリミタ</event>が含まれる。従って、ノード200「N2」の処理部230は、図10に示すように、分割データ510「D2」と隣接分割データ「D3」のレプリカとから、イベント情報「E2」を抽出する。
処理部230は、抽出された対象情報に対して、ノード設定情報251の処理定義で示される加工処理を実行する(ステップS207)。
例えば、ノード200「N1」、「N2」の処理部230は、図9のノード設定情報251における処理定義に従って、それぞれ、図10に示すように、イベント情報「E1」、「E2」をXML形式からCSV形式に変換する。
処理部230は、加工処理された対象情報を、分散ストレージへ書き込む(ステップS208)。
例えば、ノード200「N1」、「N2」の処理部230は、それぞれ、図10に示す、CSV形式のイベント情報「E1」、「E2」を、分散ストレージへ書き込む。
以上により、本発明の第1の実施の形態の動作が完了する。
なお、本発明の第1の実施の形態では、処理部230は、分割データ510に開始ポイントのデリミタが含まれている対象情報を抽出している。しかしながら、処理部230は、分割データ510に終了ポイントのデリミタが含まれている対象情報を抽出してもよい。この場合、分割データ510に終了ポイントに対応する開始ポイントのデリミタが含まれていなければ、処理部230は、当該分割データ510と前方の隣接分割データのレプリカとを用いて、対象情報を抽出する。
また、各ノード200の処理部230は、例えば、複数のノード200における、全ての分割データ510に対する所定の処理が完了した時点で、分割データ記憶部240に記憶されている分割データ510や隣接分割データを削除してもよい。
また、本発明の第1の実施の形態では、元データ500のデータ形式として、XML形式を用いたが、データ形式は、CSV(comma-separated values)形式やJSON(Java(登録商標)Script Object Notation)形式、ログファイル等、XML形式以外の形式であってもよい。データ形式が、JSON形式の場合は、XML形式の場合と同様に、対象情報を囲むタグを対象情報の開始ポイント/終了ポイントを表すデリミタとして用いることができる。また、データ形式がCSV形式の場合は改行コード、ログファイルの場合は日時を、対象情報の開始ポイント/終了ポイントを表すデリミタとして用いることができる。
また、本発明の第1の実施の形態では、各ノード200が分割データ510に対する所定の処理として、対象情報の抽出、加工、及び、分散ストレージへの書き込みを行っているが、分散ストレージへの書き込みは行わなくてもよい。また、所定の処理は、これらの処理とは異なる他の処理でもよい。
また、データサーバ100は、分割データ510の圧縮や暗号化を行って、各ノード200に送信してもよい。この場合、各ノード200は、圧縮された分割データ510のレプリカを、他のノード200に生成してもよい。これにより、レプリカの生成に係るノード200間の通信量や、メモリ使用量を低減できる。
また、データサーバ100は、分割データサイズを動的に変更してもよい。この場合、データサーバ100は、例えば、各ノード200で抽出された対象情報の平均サイズ等をもとに、分割データサイズを決定する。また、この場合、エラー時のログレコード等、異常な大きさの対象情報を除外して、分割データサイズを決定してもよい。
また、本発明の第1の実施の形態では、各ノード200は、分割データ510の関連データとして、分割データ510の前または後に隣接する、1つの分割データ510のレプリカを用いているが、分割データ510の前または後に隣接する、連続する2つ以上の分割データ510のレプリカを用いてもよい。これにより、対象情報が大きい場合でも、各ノード200で対象情報を抽出できる。
また、分割データ510の関連データは、例えば、分割データ510にリンクにより関連づけられた他の分割データ510等、分割データ510に対する所定の処理において利用される他の分割データ510あれば、元データ500上で隣接する分割データ510以外の分割データ510でもよい。
また、本発明の第1の実施の形態では、各ノード200は、メタデータ520におけるレプリカ送信先ノードIDに従って、分割データ510のレプリカを他のノード200に生成したが、例えば、データサーバ100からノード200への分割データ510の送信がラウンドロビンに行われる場合等、ノード200が、処理対象の分割データ510を関連データとして用いる他のノード200が認識できる場合は、メタデータ520を用いることなく、当該他のノード200に分割データ510のレプリカを生成してもよい。
次に、本発明の第1の実施の形態の特徴的な構成を説明する。図1は、本明の第1の実施の形態の特徴的な構成を示すブロック図である。
分散処理システム(情報処理システム)1は、ノード(処理装置)200を含む。ノード200は、分割データ送信部(送信部)220と処理部230とを含む。分割データ送信部220は、複数の分割データ(データ)510の内の処理対象の分割データ510を関連データとして用いる可能性がある他のノード200へ、当該分割データ510を送信する。処理部230は、分割データ510と、他のノード200から受信した、当該分割データ510の関連データと、を用いて、当該分割データ510に対する所定の処理を行う。
次に、本発明の第1の実施の形態の効果を説明する。
本発明の第1の実施の形態によれば、複数データを複数のノード200で分散処理するシステムにおいて、システムの処理負荷を低減できる。その理由は、各ノード200の分割データ送信部220が、複数の分割データ510の内の処理対象の分割データ510を関連データとして用いる可能性がある他のノード200へ、当該分割データ510を送信し、処理部230が、処理対象の分割データ510と、他のノード200から受信した、当該分割データ510の関連データと、を用いて、当該分割データ510に対する所定の処理を行うためである。これにより、各ノード200は、分割データ510の関連データを保持するノード200を検索する必要はなく、ノード200における処理負荷が低減される。
また、本発明の第1の実施の形態によれば、データサーバ100の処理負荷も低減できる。その理由は、データサーバ100が、元データ500を所定の大きさで分割し、ノード200が、処理対象の分割データ510と関連データとから、対象情報を抽出するためである。これにより、データサーバ100は、元データ500からデリミタを検出して対象情報を抽出する必要はなく、データサーバ100における処理負荷が低減される。また、これにより、各ノード200で対象情報の抽出が、分散して、並列に行われるため、システムの処理速度が向上する。
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
本発明の第2の実施の形態においては、分割データ510の全部のレプリカを生成する代わりに、分割データ510の一部のレプリカを生成する点において、本発明の第1の実施の形態と異なる。
次に、本発明の第2の実施の形態における、分散並列処理基盤への元データ500のインポートについて説明する。
図11は、本発明の第2の実施の形態における、分散並列処理基盤への元データ500のインポートを示す図である。
各ノード200は、データサーバ100から受信した分割データ510(処理対象の分割データ510)に、抽出しようとする対象情報の一部しか含まれていない場合、受信した分割データ510の隣接分割データの一部(前半分、または、後半分)のレプリカを用いて対象情報を抽出する。本発明の第2の実施の形態においては、分割データ510の隣接分割データの一部のレプリカを、関連データと呼ぶ。各ノード200は、データサーバ100から分割データ510を受信したときに、当該分割データ510の一部(前半分、または、後半分)を関連データとして用いる(当該分割データ510の隣接分割データを処理対象とする)他のノード200に、当該分割データ510の一部(前半分、または、後半分)のレプリカを生成する。
次に、本発明の第2の実施の形態における、分散処理システム1の構成を説明する。
本発明の第2の実施の形態における分散処理システム1の構成は、本発明の第1の実施の形態(図2)と同様となる。
ノード200の分割データ送信部220は、データサーバ100から分割データ510を受信した場合に、メタデータ520に従って、他のノード200に分割データ510の一部(前半分、または、後半分)のレプリカを生成する。
処理部230は、分割データ510に、抽出しようとする対象情報の一部しか含まれていない場合、分割データ510、及び、当該分割データ510に係る隣接分割データの一部のレプリカから、対象情報を抽出する。
次に、本発明の第2の実施の形態の動作について説明する。
本発明の第2の実施の形態における、データサーバ100、及び、ノード200の処理を示すフローチャートは、本発明の第1の実施の形態(図4)と同様となる。
図4のステップS202において、分割データ送信部220は、メタデータ520のレプリカ生成先ノードID(前)で示されるノード200の分割データ記憶部240に、分割データ510の前半分のレプリカを生成する。同様に、分割データ送信部220は、メタデータ520のレプリカ生成先ノードID(後)で示されるノード200の分割データ記憶部240に、分割データ510の後半分のレプリカを生成する。
例えば、ノード200「N1」の分割データ送信部220は、図6における分割データ510「D1」のメタデータ520に従って、図11に示すように、分割データ510「D1」の後半分のレプリカをノード200「N2」に生成する。同様に、ノード200「N2」の分割データ送信部220は、分割データ510「D2」の前半分のレプリカをノード200「N1」に、後半分のレプリカをノード200「N3」に、それぞれ生成する。
図4のステップS206において、処理部230は、分割データ510と隣接分割データの一部のレプリカとから対象情報を抽出する。
図12は、本発明の第2の実施の形態における、対象情報の抽出、及び、加工の例を示す図である。
例えば、ノード200「N1」の処理部230は、図12に示すように、分割データ510「D1」と隣接分割データ「D2」の前半分のレプリカとから、イベント情報「E1」を抽出する。同様に、ノード200「N2」の処理部230は、図12に示すように、分割データ510「D2」と隣接分割データ「D3」の前半分のレプリカとから、イベント情報「E2」を抽出する。
以上により、本発明の第2の実施の形態の動作が完了する。
なお、本発明の第2の実施の形態では、各ノード200は、他のノード200に、分割データ510の前半分または後半分のレプリカを生成しているが、他のノード200の処理対象である分割データ510に隣接する部分を含めば、レプリカの大きさは、半分より大きくても、小さくてもよい。
次に、本発明の第2の実施の形態の効果を説明する。
本発明の第2の実施の形態によれば、本発明の第1の実施の形態に比べて、分割データ510のレプリカの生成に係るコストを低減し、システムの処理速度をより高速化できる。その理由は、各ノード200が、他のノード200に、当該分割データ510の一部のレプリカを生成するためである。特に、分割データサイズと対象情報の大きさが近い場合は、分割データ510から対象情報の全てが含まれていない場合でも、隣接分割データの一部があれば、分割データ510と隣接分割データとから、対象情報を抽出できる可能性が高いため、上述の効果を得られる。
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。
本発明の第3の実施の形態においては、ノード200において障害が発生した場合に、他のノード200が所定の処理を引き継ぐ点において、本発明の第1の実施の形態と異なる。
次に、本発明の第3の実施の形態における、分散処理システム1の構成を説明する。
図13は、本発明の第3の実施の形態における、分散処理システム1の構成を示すブロック図である。
図13を参照すると、本発明の第3の実施の形態における分散処理システム1のデータサーバ100は、本発明の第3の実施の形態のデータサーバ100の構成に加えて、障害監視部170、及び、引継制御部180を含む。
障害監視部170は、ノード200における障害を検出する。
引継制御部180は、ノード200における障害が検出された場合に、当該ノード200の所定の処理を引き継ぐべきノード200(引き継ぎ先ノード200)を決定し、引き継ぎ指示を送信する。
ノード200の処理部230は、データサーバ100から受信した分割データ510(処理対象の分割データ510)の隣接分割データのレプリカと、当該処理対象の分割データ510とを用いて、当該隣接分割データに対する所定の処理を行う(障害が検出されたノード200が実行すべき所定の処理を引き継ぐ)。
次に、本発明の第3の実施の形態の動作について説明する。
本発明の第3の実施の形態における元データ500のインポート処理は、本発明の第1の実施の形態と同様となる。
図14は、本発明の第3の実施の形態における、引き継ぎ処理を示すフローチャートである。
ここでは、既に、インポート処理において、データサーバ100からノード200への分割データ510の送信、及び、ノード200間での分割データ510のレプリカの生成が行われており、各ノード200が所定の処理(対象情報の抽出、加工、及び、分散ストレージへの書き込み)を実行中であると仮定する。
はじめに、データサーバ100の障害監視部170は、ノード200の障害を検出する(ステップS301)。ここで、障害監視部170は、例えば、各ノード200との間で、死活確認のメッセージを送受信することにより、障害を検出する。
例えば、障害監視部170は、図5におけるノード200「N1」の障害を検出する。
引継制御部180は、引き継ぎ先ノード200を決定する(ステップS302)。ここで、引継制御部180は、転送計画131のメタデータ520を参照し、障害が検出されたノード200の処理対象の分割データ510に対するレプリカ送信先ノードID(後)で示されるノード200を、引き継ぎ先ノード200に決定する。
例えば、引継制御部180は、図8の転送計画131のメタデータ520を参照し、ノード200「N1」の処理対象の分割データ510「D1」のレプリカ送信先であるノード200「N2」を、引き継ぎ先ノード200に決定する。
引継制御部180は、引き継ぎ先ノード200に、引き継ぎ指示を送信する(ステップS303)。ここで、引き継ぎ指示は、引継ぐべき分割データ510の分割データID、及び、当該分割データ510に対する関連データID(後)を含む。
例えば、引継制御部180は、分割データID「D1」、関連データID(後)「D2」を含む引き継ぎ指示をノード200「N2」に送信する。
ノード200の処理部230は、引き継ぎ指示を受信する(ステップS401)。
次に、処理部230は、分割データ記憶部240から、引き継ぎ指示の分割データIDで示される分割データ510のレプリカ、すなわち、処理対象の分割データ510の前方の隣接分割データのレプリカを取得する。処理部230は、当該隣接分割データのレプリカから対象情報が抽出可能かどうか判定する(ステップS402)。ここで、処理部230は、隣接分割データのレプリカに、開始ポイントのデリミタと当該開始ポイントに対応する終了ポイントのデリミタとが含まれている場合、対象情報を抽出可能と判断する。また、処理部230は、隣接分割データのレプリカに、開始ポイントのデリミタが含まれているが、当該開始ポイントに対応する終了ポイントのデリミタが含まれていない場合、対象情報を抽出不可と判断する。
ステップS402で、対象情報の抽出可能の場合(ステップS402/Y)、処理部230は、当該隣接分割データのレプリカから対象情報を抽出する(ステップS404)。
ステップS402で、対象情報の抽出不可の場合(ステップS402/N)、処理部230は、分割データ記憶部240から、引き継ぎ指示の関連データID(後)で示される分割データ510、すなわち、処理対象の分割データ510を取得する。
処理部230は、隣接分割データのレプリカと処理対象の分割データ510とから対象情報が抽出可能かどうか判定する(ステップS403)。ここで、処理部230は、処理対象の分割データ510に、隣接分割データのレプリカに含まれる開始ポイントに対応する終了ポイントのデリミタが含まれている場合、対象情報を抽出可能と判断する。
ステップS403で、対象情報の抽出可能の場合(ステップS403/Y)、処理部230は、隣接分割データのレプリカと処理対象の分割データ510とから対象情報を抽出する(ステップS405)。
図15は、本発明の第3の実施の形態における、引き継ぎ処理における対象情報の抽出、及び、加工の例を示す図である。
例えば、ノード200「N2」の処理部230は、図10に示すように、隣接分割データ「D1」のレプリカと分割データ510「D2」とから、イベント情報「E1」を抽出する。
以降、処理部230は、ステップS207、S208と同様に、抽出された対象情報に対して加工処理を実行し、分散ストレージへ書き込む(ステップS406、S407)。
以上により、本発明の第3の実施の形態の動作が完了する。
なお、本発明の第3の実施の形態では、データサーバ100の障害監視部170が、ノード200の障害を検出し、引継制御部180が、引き継ぎ先ノード200に引き継ぎ指示を送信しているが、各ノード200が、引き継ぎ対象のノード200の障害を検出し、当該ノード200の所定の処理を引き継いでもよい。この場合、各ノード200は、例えば、メタデータ520のレプリカ生成先ノードID(前)で示されたノード200の障害を検出した場合に、関連データID(前)で示される、処理対象の分割データ510の前方の隣接分割データのレプリカと当該処理対象の分割データ510とから、隣接分割データに対する所定の処理を実行する。
また、データサーバ100が、ノード200の障害に代わって、ノード200における処理対象の分割データ510のロスト(紛失)を検出し、引き継ぎ先ノード200が、分割データ510をロストしたノード200の所定の処理を引き継いでもよい。
次に、本発明の第3の実施の形態の効果を説明する。
本発明の第3の実施の形態によれば、複数のノード200の内のいずれかに障害や分割データ510のロストが発生した場合でも、所定の処理を継続できる。その理由は、ノード200において障害や分割データ510のロストが発生した場合に、他のノード200が、障害や分割データ510のロストが発生したノード200から受信した、処理対象の分割データ510の隣接分割データのレプリカと、当該処理対象の分割データ510とを用いて、当該隣接分割データに対する所定の処理を引き継ぐためである。これにより、ノード200において障害や分割データ510のロストが発生した場合に、データサーバ100が引き継ぎ先ノードに対して、分割データ510の再送を行うことなく、引き継ぎ処理が実行でき、データサーバ100の負荷を低減できるとともに、引き継ぎ処理が高速化される。また、メタデータ520に、分割データ510のレプリカ送信先や、分割データ510の隣接分割データに係る情報が含まれているため、データサーバ100は、メタデータ520を参照することにより、引き継ぎ先ノードの決定や、引き継ぎ指示を容易に行うことができる。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
1 分散処理システム
100 データサーバ
101 CPU
102 記憶媒体
103 通信部
110 データ記憶部
120 データ取得部
130 転送計画部
131 転送計画
140 分割部
150 分割データ送信部
160 サーバ設定記憶部
161 サーバ設定情報
200 ノード
201 CPU
202 記憶媒体
203 通信部
210 分割データ受信部
220 分割データ送信部
230 処理部
240 分割データ記憶部
250 ノード設定記憶部
251 ノード設定情報
500 元データ
510 分割データ
520 メタデータ

Claims (19)

  1. 複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信する、送信手段と、
    前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う、処理手段と、
    を含む処理装置を備えた情報処理システム。
  2. 前記データの関連データは、前記複数のデータにおいて、当該データに隣接するデータであり、
    前記送信手段は、前記データに隣接するデータを処理対象とする他の処理装置へ、当該データを送信する、
    請求項1に記載の情報処理システム。
  3. 前記データの関連データは、前記複数のデータにおいて、当該データに隣接するデータ内の当該データに隣接する一部分であり、
    前記送信手段は、前記データに隣接するデータを処理対象とする他の処理装置へ、当該データの内の、当該他の処理装置の処理対象のデータに隣接する一部分を送信する、
    請求項1に記載の情報処理システム。
  4. 前記所定の処理は、前記データに少なくとも一部分が含まれる対象情報を、当該データと、当該対象情報の残りの部分を含む関連データと、から抽出することを含む、
    請求項1乃至3のいずれかに記載の情報処理システム。
  5. 前記処理手段は、前記他の処理装置における障害が検出された場合に、当該他の処理装置から受信した前記関連データと、前記データと、を用いて、当該関連データに対する前記所定の処理を行う、
    請求項1乃至4のいずれかに記載の情報処理システム。
  6. さらに、元データを前記複数のデータに分割し、それぞれ、前記処理対象のデータとして、前記複数の前記処理装置へ送信する制御装置を備えた、
    請求項1乃至5のいずれかに記載の情報処理システム。
  7. 前記制御装置は、前記元データを所定の大きさで分割する、
    請求項6に記載の情報処理システム。
  8. 前記所定の大きさは、前記対象情報の大きさをもとに決定される、
    請求項7に記載の情報処理システム。
  9. 前記制御装置は、前記処理装置の前記処理対象のデータを関連データとして用いる可能性がある他の処理装置の識別子を示す関連装置情報を、当該処理装置へ送信し、
    前記処理装置の前記送信手段は、前記関連装置情報により示される他の処理装置へ、前記データを送信する、
    請求項6乃至8のいずれかに記載の情報処理システム。
  10. 処理装置において、複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信し、
    前記処理装置において、前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う、
    分散処理方法。
  11. 前記データの関連データは、前記複数のデータにおいて、当該データに隣接するデータであり、
    前記データを送信する場合、前記データに隣接するデータを処理対象とする他の処理装置へ、当該データを送信する、
    請求項10に記載の分散処理方法。
  12. 前記データの関連データは、前記複数のデータにおいて、当該データに隣接するデータ内の当該データに隣接する一部分であり、
    前記データを送信する場合、前記データに隣接するデータを処理対象とする他の処理装置へ、当該データの内の、当該他の処理装置の処理対象のデータに隣接する一部分を送信する、
    請求項10に記載の分散処理方法。
  13. 前記所定の処理は、前記データに少なくとも一部分が含まれる対象情報を、当該データと、当該対象情報の残りの部分を含む関連データと、から抽出することを含む、
    請求項10乃至12のいずれかに記載の分散処理方法。
  14. さらに、前記他の処理装置における障害が検出された場合に、前記処理装置において、当該他の処理装置から受信した前記関連データと、前記データと、を用いて、当該関連データに対する前記所定の処理を行う、
    請求項10乃至13のいずれかに記載の分散処理方法。
  15. さらに、制御装置において、元データを前記複数のデータに分割し、それぞれ、前記処理対象のデータとして、前記複数の前記処理装置へ送信する、
    請求項10乃至14のいずれかに記載の分散処理方法。
  16. 前記制御装置において、前記元データを分割する場合、前記元データを所定の大きさで分割する、
    請求項15に記載の分散処理方法。
  17. 前記所定の大きさは、前記対象情報の大きさをもとに決定される、
    請求項16に記載の分散処理方法。
  18. さらに、前記制御装置において、前記処理装置の前記処理対象のデータを関連データとして用いる可能性がある他の処理装置の識別子を示す関連装置情報を、当該処理装置へ送信し、
    前記処理装置において、前記データを送信する場合、前記関連装置情報により示される他の処理装置へ、前記データを送信する、
    請求項15乃至17のいずれかに記載の分散処理方法。
  19. 処理装置用のコンピュータを、
    複数のデータの内の処理対象のデータを関連データとして用いる可能性がある他の処理装置へ、当該データを送信する、送信手段と、
    前記データと、他の処理装置から受信した、当該データの関連データと、を用いて、当該データに対する所定の処理を行う、処理手段と、
    して機能させるプログラム。
JP2013196635A 2013-09-24 2013-09-24 情報処理システム、分散処理方法、及び、プログラム Active JP6364727B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013196635A JP6364727B2 (ja) 2013-09-24 2013-09-24 情報処理システム、分散処理方法、及び、プログラム
US14/490,227 US20150088958A1 (en) 2013-09-24 2014-09-18 Information Processing System and Distributed Processing Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013196635A JP6364727B2 (ja) 2013-09-24 2013-09-24 情報処理システム、分散処理方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2015064636A true JP2015064636A (ja) 2015-04-09
JP6364727B2 JP6364727B2 (ja) 2018-08-01

Family

ID=52691968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013196635A Active JP6364727B2 (ja) 2013-09-24 2013-09-24 情報処理システム、分散処理方法、及び、プログラム

Country Status (2)

Country Link
US (1) US20150088958A1 (ja)
JP (1) JP6364727B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016174739A1 (ja) * 2015-04-28 2016-11-03 株式会社日立製作所 複合計算機システム、管理計算機、およびデータ連携管理方法
JP2021114168A (ja) * 2020-01-20 2021-08-05 富士通株式会社 情報処理プログラム、情報処理方法および情報処理装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850394B (zh) * 2015-04-17 2018-04-17 北京大学 分布式应用程序的管理方法和分布式系统
US11082493B2 (en) * 2018-11-16 2021-08-03 Arm Limited Distributed memory system, device and process

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261436A (ja) * 1996-03-22 1997-10-03 Fuji Xerox Co Ltd 画像伝送方法及び装置
JP2006005524A (ja) * 2004-06-16 2006-01-05 Ricoh Co Ltd 画像処理装置及び表示装置
JP2006303952A (ja) * 2005-04-21 2006-11-02 Canon Inc 画像処理装置、画像処理方法及び記憶媒体
JP2011198122A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 処理割当装置、処理割当方法及びコンピュータプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266683A (ja) * 1993-03-12 1994-09-22 Toshiba Corp 並列処理装置
US7002975B2 (en) * 2000-08-11 2006-02-21 Texas Instruments Incorporated Multiprocessor network node failure detection and recovery
US7412111B2 (en) * 2004-11-19 2008-08-12 General Electric Company Enhanced image processing method for the presentation of digitally-combined medical images
US8824080B2 (en) * 2009-02-10 2014-09-02 International Business Machines Corporation Data recording and reading device and method
US8442835B2 (en) * 2010-06-17 2013-05-14 At&T Intellectual Property I, L.P. Methods, systems, and products for measuring health
US8910022B2 (en) * 2011-03-02 2014-12-09 Cleversafe, Inc. Retrieval of encoded data slices and encoded instruction slices by a computing device
KR20130049111A (ko) * 2011-11-03 2013-05-13 한국전자통신연구원 분산 처리를 이용한 포렌식 인덱스 방법 및 장치
US20130212584A1 (en) * 2012-02-09 2013-08-15 Robert Bosch Gmbh Method for distributed caching and scheduling for shared nothing computer frameworks
US9237014B2 (en) * 2013-05-28 2016-01-12 Hong Kong Applied Science & Technology Research Institute Company, Limited Partial CipherText updates using variable-length segments delineated by pattern matching and encrypted by fixed-length blocks
CN105308579B (zh) * 2013-07-01 2018-06-08 株式会社日立制作所 系列数据并行分析基础设施及其并行分散处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261436A (ja) * 1996-03-22 1997-10-03 Fuji Xerox Co Ltd 画像伝送方法及び装置
JP2006005524A (ja) * 2004-06-16 2006-01-05 Ricoh Co Ltd 画像処理装置及び表示装置
JP2006303952A (ja) * 2005-04-21 2006-11-02 Canon Inc 画像処理装置、画像処理方法及び記憶媒体
JP2011198122A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 処理割当装置、処理割当方法及びコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016174739A1 (ja) * 2015-04-28 2016-11-03 株式会社日立製作所 複合計算機システム、管理計算機、およびデータ連携管理方法
JP2021114168A (ja) * 2020-01-20 2021-08-05 富士通株式会社 情報処理プログラム、情報処理方法および情報処理装置

Also Published As

Publication number Publication date
US20150088958A1 (en) 2015-03-26
JP6364727B2 (ja) 2018-08-01

Similar Documents

Publication Publication Date Title
US20190034465A1 (en) Blockchain logging of data from multiple systems
CN106815254B (zh) 一种数据处理方法和装置
US8990176B2 (en) Managing a search index
CN103248645B (zh) Bt离线数据下载系统及方法
JP2021518933A5 (ja)
CN107633016B (zh) 数据处理方法及装置和电子设备
US20160092493A1 (en) Executing map-reduce jobs with named data
US8898520B1 (en) Method of assessing restart approach to minimize recovery time
CN113067883B (zh) 数据传输方法、装置、计算机设备及存储介质
CN106021315B (zh) 一种应用程序的日志管理方法及系统
CN111309550A (zh) 应用程序的数据采集方法、系统、设备和存储介质
CN110928851B (zh) 处理日志信息的方法、装置、设备及存储介质
CN108289034A (zh) 一种故障发现方法和装置
CN112636992B (zh) 一种动态路由方法、装置、设备及存储介质
CN103297485B (zh) 分布式缓存自动管理系统和分布式缓存自动管理方法
JP6364727B2 (ja) 情報処理システム、分散処理方法、及び、プログラム
CN111338893A (zh) 进程日志处理方法、装置、计算机设备以及存储介质
CN111226206A (zh) 拍摄区块链数据的快照
CN104023061A (zh) 一种lustre的oss高可用集群方案
CN111338834B (zh) 数据存储方法和装置
US20170359400A1 (en) Extending Representational State Transfer Application Program Interface (REST API) Functionality
CN110460668B (zh) 一种文件上传方法、装置、计算机设备和存储介质
CN104852955A (zh) 一种数据处理方法及系统
CN111316256A (zh) 拍摄区块链数据的快照
CN113067860B (zh) 用于同步信息的方法、装置、设备、介质和产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180322

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180618

R150 Certificate of patent or registration of utility model

Ref document number: 6364727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150