JP2012164166A - 情報処理システム - Google Patents

情報処理システム Download PDF

Info

Publication number
JP2012164166A
JP2012164166A JP2011024489A JP2011024489A JP2012164166A JP 2012164166 A JP2012164166 A JP 2012164166A JP 2011024489 A JP2011024489 A JP 2011024489A JP 2011024489 A JP2011024489 A JP 2011024489A JP 2012164166 A JP2012164166 A JP 2012164166A
Authority
JP
Japan
Prior art keywords
data
storage device
user terminal
calculation server
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011024489A
Other languages
English (en)
Inventor
Kazuhiro Kusano
和寛 草野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011024489A priority Critical patent/JP2012164166A/ja
Publication of JP2012164166A publication Critical patent/JP2012164166A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データ転送にかかる時間やコスト、利用者による作業の手間を抑制すること。
【解決手段】本発明の情報処理システムは、記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置110,210をそれぞれ有する利用者端末100と計算サーバ200とをネットワークNを介して接続して備え、利用者端末100は、計算サーバ200による所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末100側の記憶装置110に対して記憶すると共に、当該利用者端末100側の記憶装置110内のデータを計算サーバ200側の記憶装置210にレプリケーションする機能を備える。
【選択図】図8

Description

本発明は、情報処理システムにかかり、特に、利用者端末と、当該利用者端末に入力されたデータに基づいて所定の計算処理を行ってその計算結果を利用者端末に出力する計算サーバと、がネットワークを介して接続された情報処理システムに関する。
計算機の性能向上に伴い、コンピュータシミュレーションなども計算精度の向上や大規模化が進んでおり、その計算に必要な入力データや出力データも非常に大きなものになってきている。そして、近年では、実際の計算処理はネットワーク上の計算機で行うクラウド技術が注目されており、大規模な計算センタも増えてきている。このため、外部の大規模な計算センタを利用して大規模な計算処理を実行する機会も今後はさらに増えていくと考えられる。なお、上述したクラウド技術に関連する技術として、ネットワーク上にデータを記憶するサービスを提供するネットワークストレージシステムが特許文献1に開示されている。
特開2003−296179号公報
上述したようにネットワーク上の計算サーバが提供するような外部のサービスを利用して計算処理を実行する場合には、計算を実行する計算サーバに入力データを転送して実行した後、実行結果の出力データを再び転送する必要がある。すると、このような入出力データの転送には、転送するデータサイズに比例した時間とコストの増加や、利用者の転送作業による手間が必要となる、という問題が生じる。
このため、本発明の目的は、上述した課題である、ネットワーク上の計算機にて計算処理を行う場合における、データ転送にかかる時間やコストの増加、及び、利用者による作業の手間、を抑制することにある。
本発明の一形態である情報処理システムは、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置をそれぞれ有する利用者端末と計算サーバとをネットワークを介して接続して備え、
前記利用者端末は、前記計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶すると共に、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする機能を備えた、
という構成を取る。
また、本発明の他の形態である利用者端末は、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた利用者端末側記憶装置を有し、
ネットワークを介して接続された計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側記憶装置に対して記憶すると共に、当該利用者端末側記憶装置内のデータを前記計算サーバが有する計算サーバ側記憶装置にレプリケーションする機能を備えた、
利用者端末。
という構成を取る。
また、本発明の他の形態であるプログラムは、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた利用者端末側記憶装置を有する利用者端末に、
ネットワークを介して接続された計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側記憶装置に対して記憶すると共に、当該利用者端末側記憶装置内のデータを前記計算サーバが有する計算サーバ側記憶装置にレプリケーションする機能を実現させる、
という構成を取る。
また、本発明の他の形態である計算サーバは、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する重複排除機能を備えた利用者端末側記憶装置を有する利用者端末にネットワークを介して接続され、
前記重複排除機能を備えた計算サーバ側記憶装置を有する計算サーバであって、
前記利用者端末に入力されることにより前記利用者端末側記憶装置に記憶され、当該利用者端末側記憶装置から前記計算サーバ側記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行い、当該計算処理の結果を表す出力データを計算サーバ側記憶装置に記憶すると共に、当該計算サーバ側記憶装置内のデータを前記利用者端末側記憶装置にレプリケーションする機能を備えた、
という構成を取る。
また、本発明の他の形態であるプログラムは、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する重複排除機能を備えた利用者端末側記憶装置を有する利用者端末にネットワークを介して接続され、
前記重複排除機能を備えた計算サーバ側記憶装置を有する計算サーバに、
前記利用者端末に入力されることにより前記利用者端末側記憶装置に記憶され、当該利用者端末側記憶装置から前記計算サーバ側記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行い、当該計算処理の結果を表す出力データを計算サーバ側記憶装置に記憶すると共に、当該計算サーバ側記憶装置内のデータを前記利用者端末側記憶装置にレプリケーションする機能を実現させる、
という構成を取る。
また、本発明の他の形態である情報処理方法は、
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置をそれぞれ有する利用者端末と計算サーバとがネットワークを介して接続された情報処理システムにて、
前記利用者端末が、前記計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶すると共に、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする、
という構成を取る。
本発明は、ネットワーク上の計算機にて計算処理を行う場合における、データ転送にかかる時間やコスト、及び、利用者による作業の手間、を抑制することができる。
本発明の実施形態1における情報処理システムの構成を示すブロック図である。 図1に開示した重複排除システムによるデータ記憶時の様子を示す図である。 図1に開示した重複排除システムによるデータ記憶時の様子を示す図である。 図1に開示した重複排除システムによるデータ記憶時の様子を示す図である。 図1に開示したユーザ情報管理部に登録されているデータの一例を示す図である。 図1に開示した情報処理システムの動作を示すシーケンス図である。 本発明の情報処理システムの他の構成を示すブロック図である。 本発明の付記1における情報処理システムの構成を示す図である。
<実施形態1>
本発明の第1の実施形態を、図1乃至図7を参照して説明する。図1は、情報処理システムの構成を示すブロック図である。図2乃至図4は、重複排除システムにおけるデータ記録時の様子を説明するための図である。図5は、ユーザ情報管理部に記憶されているデータの一例を示す図である。図6は、情報処理システムの動作を示すシーケンス図である。図7は、情報処理システムの他の構成を示す図である。
[動作]
本実施形態における情報処理システムは、計算機資源を利用者に提供するサービスに利用されるシステムであり、ネットワークNを介して、計算サービス利用クライアント1と、計算サーバ2及び計算サービス管理装置3と、が接続されて構成されている。
上記計算サービス利用クライアント1(以下、「クライアント1」とも呼ぶ。)は、サービスを利用する利用者が操作する情報処理端末である。また、上記計算サーバ2は、計算機自体の処理能力をサービスとして提供する情報処理装置であり、具体的には、上記クライアント1からの入力データに応じて所定の計算処理を実行し、計算処理結果をクライアント1に返す、というサービスを提供する。また、上記計算サービス管理装置3は、計算サーバ2とクライアント1との間に配置された情報処理装置であり、計算サーバ2にて提供されるサービスを利用するクライアント1を管理する機能を有する。以下、各装置1,2,3について詳述する。
上記計算サービス利用クライアント1(利用者端末)は、装備された演算装置にプログラムが組み込まれることで構築された、ファイル管理部11と、実行管理クライアント部12と、ユーザ認証部13と、を備えている。また、計算サービス利用クライアント1は、データを記憶する記憶装置と、同一のデータ内容のデータを重複して記憶することを排除する処理を行う演算装置に構築された処理部と、による重複排除システム10を備えている。この重複排除システム10は、記憶対象となるデータと同一のデータ内容の他のデータが既に記憶装置に記憶されている場合には、記憶対象となるデータを重複して記憶せず、既に記憶されている他のデータを記憶対象となるデータとして参照する、という機能を有する。
ここで、重複排除システム10による記憶するデータの重複排除の様子を、図2乃至図4を参照して説明する。なお、図2では、重複排除システム10が、複数台の記憶装置を装備している場合を説明するが、記憶装置を1台のみ装備していてもよい。
重複排除システム10は、まず、記憶対象となるデータAの入力を受けると(図3の矢印Y1参照)、図2及び図3の矢印Y2に示すように、当該データAを、所定容量(例えば、64KB)のブロックデータDに分割する。そして、このブロックデータDのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値Hを算出する(図3の矢印Y3)。例えば、ハッシュ値Hは、予め設定されたハッシュ関数を用いて、ブロックデータDのデータ内容から算出する。
続いて、重複排除システム10は、ブロックデータDのハッシュ値Hを用いて、当該ブロックデータDが既に重複排除システム10内に格納されているか否かを調べる。具体的には、まず、既に格納されているブロックデータDは、後述するように、そのハッシュ値Hが含まれた格納位置を表すコンテンツアドレスCAが、コンテンツアドレス管理テーブルMFIに登録されている。従って、格納前に算出したブロックデータDのハッシュ値Hがコンテンツアドレス管理テーブルMFI内に存在していない場合には、まだ同一内容のブロックデータDが記憶されていないと判断できる。一方で、ハッシュ値Hがコンテンツアドレス管理テーブルMFI内に存在している場合には、既に同一内容のブロックデータDが記憶されていると判断できる(図3の矢印Y4)。
続いて、重複排除システム10は、まだ同一のブロックデータDが記憶されていないと判断されたブロックデータDを、予め設定された圧縮ルールに従って圧縮し、図3の矢印Y5に示すように、複数の所定の容量のフラグメントデータに分割する。例えば、図2の符号D1〜D9に示すように、9つのフラグメントデータ(分割データ41)に分割する。さらに、データ格納処理部11は、分割したフラグメントデータのうちいくつかが欠けた場合であっても、元となるブロックデータを復元可能なよう冗長データを生成し、上記分割したフラグメントデータ41に追加する。例えば、図2の符号D10〜D12に示すように、3つのフラグメントデータ(冗長データ42)を追加する。これにより、9つの分割データ41と、3つの冗長データ42とにより構成される12個のフラグメントデータからなるデータセット40を生成する。
続いて、重複排除システム10は、生成されたデータセットを構成する各フラグメントデータを、記憶装置に形成された各記憶領域に、それぞれ分散して格納する。例えば、図2に示すように、12個のフラグメントデータD1〜D12を生成した場合には、12個の各記憶領域内にそれぞれ形成したデータ格納ファイルに、各フラグメントデータD1〜D12を1つずつそれぞれ格納する(図3の矢印Y6参照)。
また、重複排除システム10は、上述したように記憶装置に格納したフラグメントデータD1〜D12の格納位置、つまり、当該フラグメントデータD1〜D12にて復元されるブロックデータDの格納位置を表す、コンテンツアドレスCAを生成して管理する。具体的には、格納したブロックデータDの内容に基づいて算出したハッシュ値Hの一部(ショートハッシュ)(例えば、ハッシュ値Hの先頭8B(バイト))と、論理格納位置を表す情報と、を組み合わせて、コンテンツアドレスCAを生成する(図3の矢印Y7)。そして、重複排除システム10は、記憶対象データのファイル名などの識別情報と、コンテンツアドレスCAとを関連付けてファイルシステムで管理すると共に、コンテンツアドレス管理テーブルMFIに、生成したコンテンツアドレスCAの新規エントリを追加する。
上記のようにして、重複排除システム10内に格納された各ブロックデータD(data)の様子を図4に示す。この図に示すように、ブロックデータ(data)は、符号M1−M3に示すメタデータとして記憶された各コンテンツアドレスCAにて参照されており、さらに各コンテンツアドレスCA自体が格納されているメタデータM1−M3も他のコンテンツアドレスCA(メタデータM4−M5)にて参照され、ツリー構造にて格納されている。これにより、図4に示す上位階層のコンテンツアドレスCAの参照先をたどっていくことで、目的のブロックデータDつまりファイルを読み出すことができる。
また、重複排除システム10は、記憶対象データのブロックデータDのハッシュ値Hが既にコンテンツアドレス管理テーブルMFIに存在している場合、つまり、既に同一内容のブロックデータDが格納されている場合には、格納前のブロックデータDのハッシュ値Hと一致したハッシュ値が含まれるコンテンツアドレスCAを、コンテンツアドレス管理テーブルMFIから取得する。そして、このコンテンツアドレスCAを、記憶対象データのブロックデータDの格納先を表すコンテンツアドレスCAとする。これにより、コンテンツアドレスCAにて参照される既に格納されているデータが、記憶要求されたブロックデータDとして参照されることとなり、当該記憶要求にかかるブロックデータD自体を重複して記憶する必要がなくなる。例えば、図4の符号M4に示すメタデータ内の一方のコンテンツアドレスCAの参照先と、符号M5のメタデータ内のコンテンツアドレスCAの参照先とは、それぞれが異なるファイルのブロックデータのはずであるが、データ内容が同一であるため、参照先(符号M3)が同一となり、重複記憶が排除されている。
以上のように、重複排除システム10は、記憶対象となるデータを小さなブロックサイズに分割し、そのブロックを既に保存されているブロックと比較して、他と重複しないユニークなブロックだけを圧縮して保存している。そして、既に同じ内容のブロックが存在すると判定された場合には、そのブロックが保存されている位置を表す情報(コンテンツアドレスCA)を記録することで、データの重複記録を排除でき、実際に保存するデータ量を削減することができる。つまり、重複排除システム10は、利用者から計算サーバ2による計算に必要な入力データが入力されると、当該入力データの重複排除を行いつつ、当該入力データを圧縮して記憶する。
そして、重複排除システム10は、上述したように入力データの重複排除を行いつつ記憶すると、当該重複排除システム10に記憶されたデータを、計算サーバ2が装備する重複排除システム20にレプリケーションする機能を有する。このとき、重複排除システム10は、入力データの記憶により更新された差分データを計算サーバ2の重複排除システム20に送信してレプリケーションする。つまり、入力データ自体が記憶された場合には、当該入力データ自体とこれを参照するコンテンツアドレス等の差分データを計算サーバ2の重複排除システム20に送信し、入力データが重複排除された場合には当該入力データとして既に記憶されているデータを参照するコンテンツアドレス等の差分データを計算サーバ2の重複排除システム20に送信する。なお、上記レプリケーションは、例えば、重複排除システム10内に記憶されるデータが更新された直後に実行されるとよいが、そのタイミングは任意に設定可能である。
さらに、計算サービス利用クライアント1の重複排除システム10は、後述するように、計算サーバ2の重複排除システム20の内容がレプリケーションされるが、かかるレプリケーションにて送信された差分データをクライアント1の重複排除システム10に反映する。これにより、クライアント1は、レプリケーションされた重複排除システム20内から更新された差分データを参照して、計算サーバ2による計算結果である出力データを特定し、当該出力データを圧縮状態から復元することで、利用することができる。
また、上記計算サービス利用クライアント1の上記ファイル管理部11は、計算サーバ2が提供するサービスを利用する上で計算に必要な入力データなどを管理する。また、実行管理クライアント部12は、計算サーバ2での実行方法を指定し、実行状態の監視機能などを提供する。また、上記ユーザ認証部13は、計算サーバ2を利用する際に計算サービス管理装置3に対して利用者の認証を行う。
次に、上記計算サーバ2について説明する。計算サーバ2は、図1に示すように、サービス提供にかかる計算処理を行うプロセッサエレメント22と、計算時に利用する記憶領域である共有作業領域21と、利用者からの入力データあるいは利用者に対する出力データを保持する重複排除機能を備えたファイルシステムである重複排除システム20と、を備えている。
そして、計算サーバ2が備える重複排除システム20は、上述した計算サービス利用クライアント1が有する重複排除システム10と同様の機能を有している。つまり、重複排除システム20は、データを記憶する記憶装置と、同一のデータ内容のデータを重複して記憶することを排除する処理を行う演算装置に構築された処理部と、により構成されており、記憶対象となるデータと同一のデータ内容の他のデータが既に記憶装置に記憶されている場合には、さらに記憶対象となるデータを重複して記憶せず、既に記憶されている他のデータを記憶対象となるデータとして参照する、という機能を有する。つまり、重複排除システム20は、計算サーバ2にて計算された出力データの重複排除を行いつつ、当該出力データを圧縮して記憶する。
また、重複排除システム20は、上記計算サービス利用クライアント1が有する重複排除システム10と相互にレプリケーションすることにより、当該クライアント1側の重複排除システム10と同一のデータが格納される。例えば、計算サーバ2側の重複排除システム20は、クライアント1側の重複排除システム10とレプリケーションすることにより、当該クライアント1に入力された入力データが記憶されることとなる。そして、重複排除システム20内の入力データを圧縮状態から復元することで、当該入力データを利用してサービス提供にかかる計算を行うことができる。また、同様に、重複排除システム20は、計算結果である出力データを重複排除システム10内に重複排除して記憶した直後に、クライアント1側の重複排除システム10とレプリケーションを行うことで、上記出力データを圧縮状態でクライアント1側の重複解除システム10に送信することができる。
次に、上記計算サービス管理装置3について説明する。計算サービス管理装置3は、上述した計算サーバ1で利用者が計算を実行できるようにするための機能を提供する。具体的に、計算サービス管理装置3は、装備された演算装置にプログラムが組み込まれることで構築された、利用者のデータとその転送を管理するユーザファイル管理部31と、利用者に関する情報を管理するユーザ情報管理部32と、計算サーバ1での実行を管理する実行管理部33と、サービスに対する利用者の課金情報を管理する課金システム部34と、利用者の認証を行うユーザ認証部35と、を備えている。
なお、図5は、ユーザ情報管理部32に登録される情報の一例を示す。図5の例では、利用者のユーザIDとパスワード、利用者毎に対応した計算サーバ2側の重複排除システム20の情報(ファイル)と当該利用者が操作するクライアント1側の重複排除システム10の情報(リモートサイト)、それに利用者の計算処理の実行状況、がエントリとして存在している。この他に、計算サーバ2で提供するサービスによって課金情報や過去の利用情報などを保持することも考えられる。上述したように登録された利用者情報を用いることで、ユーザ認証部35にて計算サーバ2を利用する利用者の認証を行うことが可能となる。
[動作]
次に、上述した情報処理システムの動作を、図6のシーケンス図を参照して説明する。まず、利用者が計算サーバ1を利用する場合、最初に利用者情報の登録を行う。まず、上述した図5に示すように、利用者の情報を計算サーバ2のユーザ情報管理部32に登録し、その利用者に重複排除システム20を割り当て、さらにユーザ情報管理部32に登録する。なお、計算サーバ2側の重複排除システム20は、運用方針により複数用意して利用者単位に割り当てを行ってもよい。以上のように利用者情報を登録することで、ユーザ認証部13,35で利用者の認証を行うことが可能となり、利用者が計算サーバ2を利用する準備が完了する。
そして、利用者が実際に計算サーバ2を利用してサービス提供を受ける際には、利用者は計算サービス利用クライアント1を操作して計算サービス管理装置3にアクセスし、ユーザ認証部13を用いてユーザ認証を行う。すると、計算サービス管理装置3は、ユーザ認証や課金処理を行い、利用者に対してサービスを利用可能とする。
続いて、利用者が計算サービス利用クライアント1を用いて計算サーバ2を利用した計算を依頼すると、計算サービス管理装置3が利用者に対する適切な資源の割り当てやファイルシステムの設定などの管理を行う。
そして、利用者は、計算サービス利用クライアント1に対して、計算サーバ2側で実行される計算に必要な入力データを入力する(ステップS1)。すると、入力データは、重複排除システム10内に重複排除されつつ圧縮されて保存される(ステップS2)。そして、利用者が実行方法の詳細などを指定した後、実行準備ができたことを実行管理クライアント12で通知する。これをうけて、重複排除システム10に保存されたデータが、計算サーバ2の重複排除システム20へコピーするレプリケーション機能が動き始める(ステップS3)。この実行はファイル管理部11が管理する。なお、ファイル管理部11は、計算サーバ2による計算処理の実行の監視やファイルの管理を行う。
以上のようにして、計算で利用する入力データは、利用者側の重複排除システム10に保存された後、レプリケーションにより、対応した重複排除システム20に同一内容のデータが格納される(ステップS4)。これにより、計算サーバ2は、重複排除システム20内のデータに対して、通常のファイルと同様にアクセスが可能となっている。つまり、計算サーバ2は、計算に必要な入力データを重複排除システム10,20間のレプリケーションにより行うことで、差分転送といった効率的なデータ転送を用いて、要求された計算に必要な利用者からの入力データを受け付けることができる。従って、通常のデータ転送を行う場合と比較して転送データ量を削減することができる。さらに、重複排除システム10にはデータが圧縮して格納されているため、より転送データ量を削減することができる。また、利用者による入力データの転送操作が不要となり、利用者にとってサービスの利用が容易となる。
続いて、計算サーバ2は、レプリケーションにより重複排除システム20に格納された利用者からの入力データを読み出し、圧縮状態を解除して計算に利用する。なお、重複排除システム20に保存してある入力データは、当該重複排除システム20が元のファイルへの復元を行うので、入力データをアクセスするために特別な前処理は不要である。
そして、計算サーバ2は、プロセッサエレメント22にて共有作業領域21を利用して、入力データに基づく計算処理を実行する(ステップS5)。計算サーバ2は、計算処理終了後に利用者が指定した計算結果である出力データを、重複排除システム20に保存する。すると、出力データは、計算サーバ2の重複排除システム20内に重複排除されつつ圧縮されて保存される(ステップS6)。
上記出力データの保存を契機に、計算サーバ2では、重複排除システム20に保存されたデータをクライアント1の重複排除システム10へコピーするレプリケーション機能が動き始める(ステップS7)。すると、計算サーバ2にて計算された出力データは、計算サーバ2側の重複排除システム20に保存された後、レプリケーションにより、かかる計算を依頼した利用者が操作するクライアント1の重複排除システム10に、同一内容のデータが格納される(ステップS8)。
そして、クライアント1は、重複排除システム10内のデータに対して、通常のファイルと同様にアクセスが可能となっている。つまり、クライアント1は、計算結果である出力データを、重複排除システム10,20間のレプリケーションにより行うことで、差分転送といった効率的なデータ転送を用いて受け付けることができる。従って、通常のデータ転送を行う場合と比較して転送データ量を削減することができる。さらに、重複排除システム20にはデータが圧縮して格納されているため、より転送データ量を削減することができる。また、計算サーバ2側でも出力データの特別な転送操作や処理が不要となり、構成の簡略化を図ることができる。
その後、利用者は、レプリケーションにより重複排除システム10に格納された計算サーバ2からの出力データを読み出し、圧縮状態を解除して計算結果を利用する。なお、重複排除システム10に保存されているデータは、同様に重複排除されて圧縮されているので、ユーザ認証部13による認証を行い、ファイル管理部11の機能を利用して参照する必要がある。これにより、第三者が自由に出力データをアクセスすることができないことになるので、データの安全性も高い。
以上のように、本実施形態における情報処理システムによると、利用者側と計算サーバ側とにそれぞれ装備された重複排除システム10,20間でレプリケーションすることで、当該重複排除システム10,20の内容をコピーし、入力データや出力データの受け渡しを行うことができる。その結果、利用者が計算サーバ2のファイルシステムに入力データなどを転送する作業は不要になる。さらに、大規模な計算を行う場合、入力データや出力データも大きなサイズになることが多く、そのようなデータを転送する場合、データ量に比例した時間が必要であり、また、転送量を削減するためにデータの圧縮を行う場合には、転送前の圧縮処理と転送後に元に戻す処理を行う必要があるが、重複排除機能を利用するとデータの圧縮や転送の作業は不要となる。
さらに、重複排除システム10,20に保存した転送データは重複排除され、圧縮して保存されているため、元の入力データや出力データより転送サイズが小さくなる。転送サイズが小さくなることは、転送にかかる時間など転送コストが削減されることになる。そして、利用者が計算サーバ2を利用して計算を何度も実行する場合には、利用者は重複排除システム10と計算サーバ2の重複排除システム20に保存された過去の入力データと出力データをベースに、次の実行の入力データに対して重複排除を適用するため、重複排除される可能性が高くなり、結果としてデータ転送が必要なデータ量がさらに小さくなる。
[変形例]
本実施形態における情報処理システムの変形例を、図7を参照して説明する。利用者が計算サーバ2を利用する際に、利用者が通常利用しているファイルシステムからデータを転送する必要があるシステム構成の場合が考えられる。
この場合に、利用者と計算サーバ2を接続するネットワークNは内部ネットワークとなる。そして、図7の計算サーバ2は、プロセッサエレメント22と共有作業領域21、重複排除システム20を備えており、利用者の依頼した計算を実行する。この実行を制御する計算サービス管理装置3は、ユーザファイル管理部31と実行管理部33からなり、特に、利用者の認証や課金などの処理は行わない。利用者側は、重複排除システム10とファイル管理部11から構成される計算サービス利用クライアント1を利用する。
この場合も、利用者側の重複排除システム10と計算サーバ2側の重複排除システム20とで、その内容をコピーするためにレプリケーションを実行する設定を行うことで、効率的なデータ転送が可能となる。また、転送量を削減するためにデータの圧縮を行った場合に必要な計算サーバ側で元に戻す処理が不要になる。
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理システムの構成の概略を、図8を参照して説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置110,210をそれぞれ有する利用者端末100と計算サーバ200とをネットワークNを介して接続して備え、
前記利用者端末100は、前記計算サーバ200による所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末100側の記憶装置110に対して記憶すると共に、当該利用者端末100側の記憶装置110内のデータを前記計算サーバ200側の記憶装置210にレプリケーションする機能101を備えた、
情報処理システム。
(付記2)
付記1に記載の情報処理システムであって、
前記利用者端末は、前記入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶したときに、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする、
情報処理システム。
(付記3)
付記1又は2に記載の情報処理システムであって、
前記計算サーバは、当該計算サーバ側の記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行って当該計算処理の結果を表す出力データを計算サーバ側の記憶装置に記憶すると共に、当該計算サーバ側の記憶装置内のデータを前記利用者端末側の記憶装置にレプリケーションする機能を備えた、
情報処理システム。
(付記4)
付記3に記載の情報処理システムであって、
前記計算サーバは、前記出力データを計算サーバ側の記憶装置に記憶したときに、当該計算サーバ側の記憶装置内のデータを前記利用者端末側の記憶装置にレプリケーションする、
情報処理システム。
(付記5)
付記1乃至4のいずれかに記載の情報処理システムであって、
前記各記憶装置は、所定のデータを分割した分割データを前記記憶対象となるデータとして記憶する、
情報処理システム。
(付記6)
付記1乃至5のいずれかに記載の情報処理システムであって、
前記各記憶装置は、前記記憶対象となるデータを予め設定されたルールに従って圧縮して記憶し、当該圧縮状態のままレプリケーションし、記憶された前記記憶対象データの読み出し時に圧縮状態から復元する機能を有する、
情報処理システム。
(付記7)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた利用者端末側記憶装置を有し、
ネットワークを介して接続された計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側記憶装置に対して記憶すると共に、当該利用者端末側記憶装置内のデータを前記計算サーバが有する計算サーバ側記憶装置にレプリケーションする機能を備えた、
利用者端末。
(付記8)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた利用者端末側記憶装置を有する利用者端末に、
ネットワークを介して接続された計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側記憶装置に対して記憶すると共に、当該利用者端末側記憶装置内のデータを前記計算サーバが有する計算サーバ側記憶装置にレプリケーションする機能を実現させるためのプログラム。
(付記9)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する重複排除機能を備えた利用者端末側記憶装置を有する利用者端末にネットワークを介して接続され、
前記重複排除機能を備えた計算サーバ側記憶装置を有する計算サーバであって、
前記利用者端末に入力されることにより前記利用者端末側記憶装置に記憶され、当該利用者端末側記憶装置から前記計算サーバ側記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行い、当該計算処理の結果を表す出力データを計算サーバ側記憶装置に記憶すると共に、当該計算サーバ側記憶装置内のデータを前記利用者端末側記憶装置にレプリケーションする機能を備えた、
計算サーバ。
(付記10)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する重複排除機能を備えた利用者端末側記憶装置を有する利用者端末にネットワークを介して接続され、
前記重複排除機能を備えた計算サーバ側記憶装置を有する計算サーバに、
前記利用者端末に入力されることにより前記利用者端末側記憶装置に記憶され、当該利用者端末側記憶装置から前記計算サーバ側記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行い、当該計算処理の結果を表す出力データを計算サーバ側記憶装置に記憶すると共に、当該計算サーバ側記憶装置内のデータを前記利用者端末側記憶装置にレプリケーションする機能を実現させるためのプログラム。
(付記11)
記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置をそれぞれ有する利用者端末と計算サーバとがネットワークを介して接続された情報処理システムにて、
前記利用者端末が、前記計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶すると共に、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする、
情報処理方法。
(付記12)
付記11に記載の情報処理方法であって、
前記計算サーバが、当該計算サーバ側の記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行って当該計算処理の結果を表す出力データを計算サーバ側の記憶装置に記憶すると共に、当該計算サーバ側の記憶装置内のデータを前記利用者端末側の記憶装置にレプリケーションする、
情報処理方法。
1 計算サービス利用クライアント
10 重複排除システム
11 ファイル管理部
12 実行管理クライアント部
13 ユーザ認証部
2 計算サーバ
20 重複排除システム
21 共有作業領域
22 プロセッサエレメント
3 計算サービス管理装置
31 ユーザファイル管理部
32 ユーザ情報管理部
33 実行管理部
34 課金システム部
35 ユーザ認証部
100 利用者端末
101 レプリケーション機能
110 記憶装置
200 計算サーバ
210 記憶装置

Claims (9)

  1. 記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置をそれぞれ有する利用者端末と計算サーバとをネットワークを介して接続して備え、
    前記利用者端末は、前記計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶すると共に、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする機能を備えた、
    情報処理システム。
  2. 請求項1に記載の情報処理システムであって、
    前記利用者端末は、前記入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶したときに、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする、
    情報処理システム。
  3. 請求項1又は2に記載の情報処理システムであって、
    前記計算サーバは、当該計算サーバ側の記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行って当該計算処理の結果を表す出力データを計算サーバ側の記憶装置に記憶すると共に、当該計算サーバ側の記憶装置内のデータを前記利用者端末側の記憶装置にレプリケーションする機能を備えた、
    情報処理システム。
  4. 請求項3に記載の情報処理システムであって、
    前記計算サーバは、前記出力データを計算サーバ側の記憶装置に記憶したときに、当該計算サーバ側の記憶装置内のデータを前記利用者端末側の記憶装置にレプリケーションする、
    情報処理システム。
  5. 請求項1乃至4のいずれかに記載の情報処理システムであって、
    前記各記憶装置は、所定のデータを分割した分割データを前記記憶対象となるデータとして記憶する、
    情報処理システム。
  6. 請求項1乃至5のいずれかに記載の情報処理システムであって、
    前記各記憶装置は、前記記憶対象となるデータを予め設定されたルールに従って圧縮して記憶し、当該圧縮状態のままレプリケーションし、記憶された前記記憶対象データの読み出し時に圧縮状態から復元する機能を有する、
    情報処理システム。
  7. 記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた利用者端末側記憶装置を有し、
    ネットワークを介して接続された計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側記憶装置に対して記憶すると共に、当該利用者端末側記憶装置内のデータを前記計算サーバが有する計算サーバ側記憶装置にレプリケーションする機能を備えた、
    利用者端末。
  8. 記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する重複排除機能を備えた利用者端末側記憶装置を有する利用者端末にネットワークを介して接続され、
    前記重複排除機能を備えた計算サーバ側記憶装置を有する計算サーバであって、
    前記利用者端末に入力されることにより前記利用者端末側記憶装置に記憶され、当該利用者端末側記憶装置から前記計算サーバ側記憶装置にレプリケーションされた前記入力データに基づいて予め設定された計算処理を行い、当該計算処理の結果を表す出力データを計算サーバ側記憶装置に記憶すると共に、当該計算サーバ側記憶装置内のデータを前記利用者端末側記憶装置にレプリケーションする機能を備えた、
    計算サーバ。
  9. 記憶対象となるデータと同一のデータ内容である既に記憶されている他のデータを、前記記憶対象となるデータとして参照することにより重複記憶を排除する機能を備えた記憶装置をそれぞれ有する利用者端末と計算サーバとがネットワークを介して接続された情報処理システムにて、
    前記利用者端末が、前記計算サーバによる所定の計算処理に必要な情報である入力データの入力を受け付けて当該入力データを利用者端末側の記憶装置に対して記憶すると共に、当該利用者端末側の記憶装置内のデータを前記計算サーバ側の記憶装置にレプリケーションする、
    情報処理方法。
JP2011024489A 2011-02-08 2011-02-08 情報処理システム Withdrawn JP2012164166A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011024489A JP2012164166A (ja) 2011-02-08 2011-02-08 情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011024489A JP2012164166A (ja) 2011-02-08 2011-02-08 情報処理システム

Publications (1)

Publication Number Publication Date
JP2012164166A true JP2012164166A (ja) 2012-08-30

Family

ID=46843492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011024489A Withdrawn JP2012164166A (ja) 2011-02-08 2011-02-08 情報処理システム

Country Status (1)

Country Link
JP (1) JP2012164166A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164634A (ja) * 2013-02-27 2014-09-08 Nec Corp レプリケーションシステム
JP2017130016A (ja) * 2016-01-20 2017-07-27 日本電気株式会社 ストレージシステム、アクセス装置、クライアント装置、方法およびプログラム
JP2021131665A (ja) * 2020-02-19 2021-09-09 Necソリューションイノベータ株式会社 レプリケーション方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164634A (ja) * 2013-02-27 2014-09-08 Nec Corp レプリケーションシステム
JP2017130016A (ja) * 2016-01-20 2017-07-27 日本電気株式会社 ストレージシステム、アクセス装置、クライアント装置、方法およびプログラム
JP2021131665A (ja) * 2020-02-19 2021-09-09 Necソリューションイノベータ株式会社 レプリケーション方法
JP7477140B2 (ja) 2020-02-19 2024-05-01 Necソリューションイノベータ株式会社 レプリケーション方法

Similar Documents

Publication Publication Date Title
US10664493B2 (en) Replication of data objects from a source server to a target server
US9575848B2 (en) Remote data protection in a networked storage computing environment
CN106170777B (zh) 降低基于块的存储的数据卷耐久性状态的方法
US9110603B2 (en) Identifying modified chunks in a data set for storage
EP2883132B1 (en) Archival data identification
JP2022529967A (ja) ブロックチェーン・ネットワークからのデータの抽出
GB2601049A (en) Blockchain implemented data migration audit trail
EP3769230B1 (en) Taking snapshots of blockchain data
EP3977390B1 (en) Blockchain transaction processing systems and methods
US10467424B2 (en) File system content based security
EP4207688A1 (en) Asynchronous bookkeeping method and apparatus for blockchain, medium, and electronic device
US10795777B1 (en) Continuous verified backups
US11442752B2 (en) Central storage management interface supporting native user interface versions
US11816069B2 (en) Data deduplication in blockchain platforms
US11531712B2 (en) Unified metadata search
US11943360B2 (en) Generative cryptogram for blockchain data management
EP3769219B1 (en) Taking snapshots of blockchain data
US20220382637A1 (en) Snapshotting hardware security modules and disk metadata stores
JP2012164166A (ja) 情報処理システム
JP6315899B2 (ja) 情報処理装置、システム、プログラム及び制御方法
Bedi et al. MWC: an efficient and secure multi-cloud storage approach to leverage augmentation of multi-cloud storage services on mobile devices using fog computing
WO2022121387A1 (zh) 数据存储方法、装置、服务器及介质
EP3970009B1 (en) Blockchain transaction processing systems and methods
US10015248B1 (en) Syncronizing changes to stored data among multiple client devices
JP2023078577A (ja) 情報処理システム、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120719

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513