JP2022074807A

JP2022074807A - ファイルストレージ及びコンピュータシステム

Info

Publication number: JP2022074807A
Application number: JP2020185166A
Authority: JP
Inventors: 友貴清水; Tomoki Shimizu
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2022-05-18
Also published as: US20220137878A1; US11709628B2

Abstract

【課題】ファイルのデータに対して符号化を行うことができるとともに、ファイルストレージとデータストレージとの間のデータ通信を効率化することができる。【解決手段】ファイルストレージ２０において、ＣＰＵを、ファイルを複数のチャンクに分割して、チャンクの中の少なくとも１つに対して符号化処理を実行して符号化チャンクとし、符号化チャンクを含むファイルの複数のチャンクをクラウドストレージ３０に格納させ、クラウドストレージ３０に格納させたファイルの一部のデータを対象とするリード命令を受け付けた場合に、リード命令の対象となるデータを含むリード対象チャンクをクラウドストレージ３０から取得し、リード対象チャンクの中に符号化チャンクが含まれている場合に、符号化チャンクに対して逆符号化処理を実行し、逆符号化処理されたチャンクを含むリード対象チャンクからリード対象のデータを特定してリード命令の命令元に渡すようにする。【選択図】図１

Description

本発明は、ファイルを管理するファイルストレージ等に関し、管理するファイルをデータストレージに格納させて利用する技術に関する。

ファイルストレージにおいて管理されているファイルのデータを、遠隔バックアップ、マイグレーション、ファイル仮想化、データの集約等の用途により、ネットワークを介して接続されたクラウドストレージ（データストレージの一例）に格納させることが行われている。この場合、例えば、ファイルストレージは、ファイルを単位として、クラウドストレージにデータを格納させる。

クラウドストレージにデータを格納させて利用する場合には、ファイルストレージとクラウドストレージとの間の通信コストや、通信の所要時間を抑えることが要請されている。したがって、ファイルストレージとクラウドストレージ間での転送するデータ量を削減することが重要である。特に、クラウドストレージとファイルストレージとの間に使用されるネットワークは、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）であり、一般的には、通信の帯域幅が狭くなっているので、データ量の削減は重要である。

これに対して、ファイルを複数のパートに分割して、ファイルが更新された場合に更新された部分を含むパートをクラウドストレージに転送するようにして、ファイル更新時のデータ量を削減することが行われている。

例えば、特許文献１には、ファイルをパート分割して転送する場合において、転送済みのパートが更新された場合に、効率よくデータを再送することができる技術が開示されている。

また、転送するデータ量を削減する技術としては、ファイルのデータを圧縮することによりデータ量を削減する技術が知られている。

また、クラウドストレージからデータが漏洩してしまうことを防止するために、ファイルのデータを暗号化させて、クラウドストレージに格納する技術が知られている。

国際公開第２０１８／１５４６９８号

例えば、圧縮したり、暗号化したり等の符号化されたファイルをクラウドストレージに格納している場合において、ファイルストレージ側でファイルの一部のデータが必要となった場合においては、例えば、ファイル全体をファイルストレージ側に読み出して逆符号化（伸長及び／又は復号）を行って必要なデータを取得するか、或いは、クラウドストレージ側でファイルに対して逆符号化を行って、逆符号化後のファイルから必要なデータを取得してファイルストレージに送信する必要がある。例えば、前者であれば、ファイル全体を転送する必要があるので、通信のデータ量が大きいという問題がある。一方、クラウドストレージ側で逆符号化を行うようにする場合には、クラウドストレージ側で逆符号化の機能を備えておかなければならず、また、逆符号化の処理の負荷や時間等が掛かるという問題がある。さらに、クラウドストレージ側で暗号化したファイルを管理している場合においては、クラウドストレージ側で復号処理できるようにすると、クラウドストレージ側からのデータの漏洩の危険性が高くなるという問題がある。

これに対して、符号化されたファイルに対しては、特許文献１の技術をそのまま用いることができない。例えば、ファイルの一部に更新があった場合には、符号化されたファイルに対しては、パートが特定できなかったり、ファイルに対して逆符号化をしなければならなかったりするので特許文献１の技術をそのまま利用できない。

本発明は、上記事情に鑑みなされたものであり、その目的は、ファイルのデータに対して符号化を行うことができるとともに、ファイルストレージとデータストレージとの間のデータ通信を効率化することのできる技術を提供することにある。

上記目的を達成するため、一観点に係るファイルストレージは、データを格納するデータストレージに接続され、ファイルを管理するファイルストレージであって、前記ファイルストレージはプロセッサを有し、前記プロセッサは、前記ファイルを複数のチャンクに分割して、前記チャンクの中の少なくとも１つに対して符号化処理を実行して符号化チャンクとし、前記符号化チャンクを含む前記ファイルの複数のチャンクを前記データストレージに格納させ、前記データストレージに格納させたファイルの一部のデータを対象とするリード命令を受け付けた場合に、前記リード命令の対象となるデータを含むリード対象チャンクを前記データストレージから取得し、前記リード対象チャンクの中に符号化チャンクが含まれている場合に、前記符号化チャンクに対して逆符号化処理を実行し、逆符号化処理されたチャンクを含むリード対象チャンクからリード対象のデータを特定して前記リード命令の命令元に渡す。

本発明によれば、ファイルのデータに対して符号化を行うことができるとともに、ファイルストレージとデータストレージとの間のデータ通信を効率化することができる。上記した以外の課題、構成及び効果は、以下の発明を実施するための形態の説明により明らかにされる。

図１は、一実施形態に係るコンピュータシステムの全体構成図である。図２は、一実施形態に係るファイルストレージの構成図である。図３は、一実施形態に係るクラウドストレージの第１の構成図である。図４は、一実施形態に係るクラウドストレージの第２の構成図である。図５は、一実施形態に係るチャンク個別保存用のチャンクマップの構成図である。図６は、一実施形態に係るチャンク結合保存用のチャンクマップの構成図である。図７は、一実施形態に係るチャンクマップマップの構成図である。図８は、一実施形態に係るチャンク個別保存設定時のファイル初回保存処理のシーケンス図である。図９は、一実施形態に係るチャンク個別保存設定時の部分リード処理のシーケンス図である。図１０は、一実施形態に係るチャンク個別保存設定時の部分更新処理のシーケンス図である。図１１は、一実施形態に係るチャンク結合保存設定時のファイル初回保存処理のシーケンス図である。図１２は、一実施形態に係るチャンク結合保存設定時の部分リード処理のシーケンス図である。図１３は、一実施形態に係るチャンク結合保存設定時の部分更新処理のシーケンス図である。図１４は、一実施形態に係るチャンクの状態遷移を説明する図である。図１５は、一実施形態に係るファイル初回保存処理のフローチャートである。図１６は、一実施形態に係る部分リード処理のフローチャートである。図１７は、一実施形態に係る部分更新処理の第１のフローチャートである。図１８は、一実施形態に係る部分更新処理の第２のフローチャートである。

実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

以下の説明では、「ＡＡＡテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ＡＡＡテーブル」を「ＡＡＡ情報」と呼ぶことができる。

また、以下の説明では、「プログラム」を動作主体として処理を説明する場合があるが、プログラムは、プロセッサによって実行されることで、定められた処理を、適宜に記憶部及びインターフェース部のうちの少なくとも１つを用いながら行うため、処理の主語が、プロセッサ（或いは、プロセッサを有するコンピュータ又はコンピュータシステム）とされてもよい。プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又はコンピュータが読み取り可能な記憶メディア（例えば可搬型の記憶メディア）であってもよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。また、プログラムが実行されることによって実現される処理のうちの少なくとも一部が、ハードウェア回路（例えば、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）又はＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ））によって実現されてもよい。

図１は、一実施形態に係るコンピュータシステムの全体構成図である。

コンピュータシステム１は、１以上のコンピュータ１０と、１以上のファイルストレージ２０と、データストレージの一例としてのクラウドストレージ３０とを備える。

コンピュータ１０と、ファイルストレージ２０とは、例えば、クライアント側となる拠点（拠点Ａ、拠点Ｂ等）に設けられており、拠点のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）４０を介して接続されている。

コンピュータ１０は、ファイルストレージ２０が管理するファイルを使用してユーザが各種処理を実行する装置である。ファイルストレージ２０は、コンピュータ１０により使用されるファイルを管理するファイルシステムを有する。

クラウドストレージ３０は、例えば、サーバ側となるデータセンタに設けられ、ネットワーク５０に接続されている。ネットワーク５０は、例えば、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）であり、各拠点のＬＡＮ４０と接続されている。

クラウドストレージ３０は、データストレージの一例であり、ファイルストレージ２０で管理される複数のファイルの少なくとも一部のデータを格納する。

次に、ファイルストレージ２０の構成について詳細に説明する。

図２は、一実施形態に係るファイルストレージの構成図である。

ファイルストレージ２０は、例えば、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）や、メインフレーム、サーバ等で構成され、処理装置２１と周辺装置２２とを有する。処理装置２１は、主記憶装置（メインメモリ）２３と、プロセッサの一例としての中央演算処理装置（ＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２４とを有する。

ＣＰＵ２４は、主記憶装置２３に格納されているプログラムに従って各種処理を実行する。

主記憶装置２３は、例えば、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）であり、ＣＰＵ２４で実行されるプログラムや、必要な情報を記憶する。主記憶装置２３は、ファイルシステム管理プログラム２３１と、ファイル操作プログラム２３２と、ファイル操作監視プログラム２３３と、ファイル分割／結合プログラム２３４と、伸長／圧縮プログラム２３５と、復号／暗号化プログラム２３６と、データ通信・ファイル転送プログラム２３７と、ファイル共有プログラム２３８と、クラウドストレージ操作プログラム２３９と、ハッシュ値生成／比較プログラム２４０と、差分検出プログラム２４１と、ファイルマップ管理プログラム２４２と、チャンクマップマップ管理／操作プログラム２４３と、ファイル識別子生成／管理プログラム２４４と、チャンクマップ管理／操作プログラム２４５と、スタブファイルリード処理プログラム２４６と、排他制御プログラム２４７と、を含む。

ファイルシステム管理プログラム２３１は、ファイルを管理するファイルシステムを管理する。ファイル操作プログラム２３２は、ファイルに対する操作（作成、リード、更新、消去等）を実行する。ファイル操作監視プログラム２３３は、ファイルに対する操作を監視する。ファイル分割／結合プログラム２３４は、ファイルをチャンクに分割したり、チャンクを結合したりする。伸長／圧縮プログラム２３５は、データに対する伸長処理と、圧縮処理とを実行する。復号／暗号化プログラム２３６は、暗号化データの復号処理と、データの暗号化処理とを実行する。データ通信・ファイル転送プログラム２３７は、ネットワーク５０を介してのデータ通信や、ファイルの転送処理を実行する。ファイル共有プログラム２３８は、複数の拠点のファイルストレージ２０との間でのファイル共有に関する処理を行う。クラウドストレージ操作プログラム２３９は、クラウドストレージ３０を操作する処理、例えば、クラウドストレージ３０に対して各種命令を行う処理を実行する。ハッシュ値生成／比較プログラム２４０は、データに対するハッシュ値の生成処理や、ハッシュ値の比較処理を行う。差分検出プログラム２４１は、データ間の差分を検出する。ファイルマップ管理プログラム２４２は、ファイルストレージ２０におけるローカルファイルと、クラウドストレージ３０のデータ（オブジェクト又はファイル）との対応関係を管理する。チャンクマップマップ管理プログラム２４３は、後述するチャンクマップマップ２５５を管理する処理を行う。ファイル識別子生成／管理プログラム２４４は、クラウトストレージ３０で識別するためのファイル識別子を生成して管理する処理を行う。チャンクマップ操作プログラム２４５は、後述するチャンクマップ２５７（２５７Ａ、２５７Ｂ）に対する操作（作成、リード、更新、消去等）を行う。スタブファイルリードプログラム２４６は、スタブ化されたファイル（スタブファイル）の本体をクラウドストレージ３０から読み出す処理を実行する。排他制御プログラム２４７は、ファイルにアクセスする際の排他制御を行う。

周辺機器２２は、記憶部の一例としての補助記憶装置２５と、ネットワークカード（ＮＩＣ：ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ）２６とを有する。主記憶装置２３と、ＣＰＵ２４と、補助記憶装置２５と、ネットワークカード２６とは、バス２７を介して接続されている。

補助記憶装置２５は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やフラッシュメモリ、ブロックストレージ等の不揮発性の記憶装置であり、ＣＰＵ２４で実行されるプログラムや、ＣＰＵ２４に利用される各種データを格納する。本実施形態では、補助記憶装置２５は、ファイルシステム２５１を構成する情報を格納する。

ファイルシステム２５１は、ルートディレクトリ２５２と、１以上のディレクトリ２５３と、ファイルマップ２５４と、チャンクマップマップ２５５と、ファイル２５６と、符号化処理情報の一例としてのチャンクマップ２５７とを格納する。

ルートディレクトリ２５２は、ファイルシステムのルートとなるディレクトリの情報であり、ルートディレクトリに含まれるディレクトリやファイルの情報を格納する。ディレクトリ２５３は、自身に含まれるディレクトリやファイルの情報を格納する。

ファイルマップ２５４は、ファイルストレージ２０が管理しているローカルファイルの識別情報（ディレクトリ情報）と、ファイルをクラウドストレージ３０で特定可能な識別情報（ファイル識別子：厳密には、例えば、クラウドストレージ３０がオブジェクトストレージであればオブジェクト識別子であり、クラウドストレージ３０がファイルストレージであればファイル識別子である。）との対応関係を記憶する。

チャンクマップマップ２５５は、ファイルのクラウドストレージ３０でのファイル識別子と、このファイルのチャンクマップ２５７のファイル（チャンクマップファイル）の識別子との対応関係を管理するテーブルである。なお、チャンクマップマップ２５５については、図７を参照して後述する。ファイル２５６は、ファイルシステム２５１で管理するファイルである。チャンクマップ２５７は、ファイルを分割したチャンクのオフセット（ファイル内での位置情報）等を管理するテーブルである。チャンクマップ２５７としては、チャンクを個別に(独立して)クラウドサーバ３０で保存する場合に使用するチャンク個別保存用のチャンクマップ２５７Ａと、チャンクを結合してクラウドサーバ３０で保存する場合に使用するチャンク結合保存用のチャンクマップ２５７Ｂとがある。なお、チャンクマップ２５７（２５７Ａ、２５７Ｂ）については、図５、図６を参照して後述する。

次に、クラウドストレージ３０の構成について詳細に説明する。

図３は、一実施形態に係るクラウドストレージの第１の構成図である。図３に示すクラウドストレージ３０は、データをオブジェクトとして管理するオブジェクトストレージとした場合の構成図である。

クラウドストレージ３０は、例えば、ＰＣや、メインフレーム、サーバ等で構成され、処理装置３１と周辺装置３２とを有する。処理装置３１は、主記憶装置（メインメモリ）３３と、プロセッサの一例としてのＣＰＵ３４とを有する。

ＣＰＵ３４は、主記憶装置３３に格納されているプログラムに従って各種処理を実行する。

主記憶装置３３は、例えば、ＲＡＭであり、ＣＰＵ３４で実行されるプログラムや、必要な情報を記憶する。主記憶装置３３は、オブジェクトシステム管理プログラム３３１と、オブジェクト操作プログラム３３２と、ファイル操作プログラム３３３と、ファイル分割／結合プログラム３３４と、データ通信・ファイル転送プログラム３３５と、を含む。

オブジェクトシステム管理プログラム３３１は、オブジェクトを管理するオブジェクトシステムを管理する。オブジェクト操作プログラム３３２は、オブジェクトに対する操作（ライト、リード、消去等）を実行する。ファイル操作プログラム３３３は、オブジェクトに含まれるファイルに対する操作（ライト、リード、消去等）を実行する。ファイル分割／結合プログラム３３４は、ファイルをチャンクに分割したり、チャンクを結合したりする。データ通信・ファイル転送プログラム３３５は、ネットワーク５０を介してのデータ通信や、ファイルの転送処理を実行する。

周辺機器３２は、補助記憶装置３５と、ネットワークカード（ＮＩＣ）３６とを備える。主記憶装置３３と、ＣＰＵ３４と、補助記憶装置３５と、ネットワークカード３６とは、バス３７を介して接続されている。

補助記憶装置３５は、例えば、ＨＤＤやフラッシュメモリ、ブロックストレージ等の不揮発性の記憶装置であり、ＣＰＵ３４で実行されるプログラムや、ＣＰＵ３４に利用される各種データや、オブジェクトシステム３５１を構成する情報（オブジェクトも含む）を格納する。

オブジェクトシステム３５１は、バケット３５２を格納する。バケット３５２は、１以上のオブジェクト３５３を格納する。オブジェクト３５３は、ユーザデータファイル３５４や、メタデータファイル３５５を含む。ユーザデータファイル３５４は、ファイルストレージ２０で管理されているファイル又はそのファイルのチャンクのファイルである。メタデータファイル３５５は、ユーザデータファイル３５４に関するオブジェクトシステム３５１におけるメタデータである。

図４は、一実施形態に係るクラウドストレージの第２の構成図である。図４に示すクラウドストレージ３０は、データをファイルとして管理するファイルストレージとした場合の構成図である。なお、図３に示す構成と同様な部分については同一の符号を付して重複する説明を省略する場合がある。

主記憶装置３３は、ファイルシステム管理プログラム３４１と、ファイル操作プログラム３３３と、ファイル分割／結合プログラム３３４と、データ通信・ファイル転送プログラム３３５と、ファイル共有プログラム３４２とを含む。

ファイルシステム管理プログラム３４１は、ファイルを管理するファイルシステムを管理する。ファイル共有プログラム３４２は、複数の拠点のファイルストレージ２０との間でのファイル共有に関する処理を行う。

次に、チャンク個別保存用のチャンクマップ２５７Ａについて説明する。

図５は、一実施形態に係るチャンク個別保存用のチャンクマップの構成図である。

チャンク個別保存用のチャンクマップ２５７Ａは、クラウドストレージ３０においてチャンクを個別にファイル（クラウドストレージ３０がオブジェクトストレージであればオブジェクト）として格納する場合のチャンクマップである。チャンクマップ２５７Ａは、ファイルストレージ２０における各ファイル毎に対応して設けられる。チャンクマップ２５７Ａは、このチャンクマップ２５７Ａに対応するファイルのチャンク毎のエントリを有する。チャンクマップ２５７Ａのエントリは、無処理開始オフセット２５７１と、無処理終了オフセット（無処理チャンクサイズ）２５７２と、チャンクファイル識別子２５７３と、チャンクファイルサイズ２５７４と、処理内容２５７５と、チャンクハッシュ値２５７６と、のフィールドを含む。なお、無処理終了オフセット（無処理チャンクサイズ）２５７２と、チャンクファイルサイズ２５７４と、チャンクハッシュ値２５７６とは、動作上、必須のフィールドではない。

無処理開始オフセット２５７１には、エントリに対応するチャンクの無処理ファイルの先頭からのチャンクの開始位置（開始オフセット）が格納される。ここで、無処理とは、圧縮や暗号化等の符号化が行われていない状態のことをいい、無処理ファイルとは、無処理のファイル、すなわち、非圧縮且つ平文のファイルのことをいう。無処理終了オフセット（無処理チャンクサイズ）２５７２には、エントリに対応するチャンクの無処理ファイルの先頭からの終了位置（終了オフセット）が格納されるとともに、無処理のチャンクのサイズ（チャンクサイズ）が格納される。なお、無処理終了オフセット（無処理チャンクサイズ）２５７２に、終了オフセット又はチャンクサイズのいずれか一方のみを格納してもよい。チャンクファイル識別子２５７３には、エントリに対応するチャンクをクラウドストレージ３０で識別するための識別子（本例では、ファイル識別子）が格納される。チャンクファイルサイズ２５７４は、クラウドストレージ３０に格納されるチャンクのファイルサイズ、すなわち、チャンクに対応する所定の処理後のチャンクのチャンクサイズが格納される。処理内容２５７５には、エントリに対応するチャンクに対して実行される処理の内容が格納される。処理の内容としては、符号化処理（圧縮処理及び／又は暗号化処理等）の内容又は無処理であることであり、例えば、圧縮処理を実行する場合には、その圧縮処理を示す名称であり、暗号化処理を実行する場合には、その暗号化処理を示す名称であり、処理を行わない場合には、「無処理」である。チャンクハッシュ値２５７６には、エントリに対応するチャンクのハッシュ値が格納される。

次に、チャンク結合保存用のチャンクマップ２５７Ｂについて説明する。

図６は、一実施形態に係るチャンク結合保存用のチャンクマップの構成図である。

チャンク結合保存用のチャンクマップ２５７Ｂは、クラウドストレージ３０においてチャンクを結合して１つのファイル（クラウドストレージ３０がオブジェクトストレージであればオブジェクト）として格納する場合のチャンクマップである。チャンクマップ２５７Ｂは、ファイルストレージ２０の各ファイル毎に対応して設けられる。チャンクマップ２５７Ｂは、このチャンクマップ２５７Ｂに対応するファイルのチャンク毎のエントリを有する。チャンクマップ２５７Ｂのエントリは、無処理開始オフセット２５７１と、無処理終了オフセット（無処理チャンクサイズ）２５７２と、処理後開始オフセット２５９１と、処理後終了オフセット（処理後チャンクサイズ）２５９２と、処理内容２５７５と、チャンクハッシュ値２５７６と、のフィールドを含む。なお、チャンクマップ２５７Ａと同じフィールドには、同一の符号を付して重複する説明を省略する。無処理終了オフセット（無処理チャンクサイズ）２５７２と、処理後終了オフセット（処理後チャンクサイズ）２５９２と、チャンクハッシュ値２５７６とは、動作上、必須のフィールドではない。

処理後開始オフセット２５９１には、エントリに対応するチャンクの処理後、すなわち、圧縮や暗号化等の符号化が行われて結合された状態におけるファイルの先頭からのチャンクの開始位置（開始オフセット）が格納される。処理後終了オフセット（処理後チャンクサイズ）２５９２には、エントリに対応するチャンクの処理後におけるファイルの先頭からの終了位置（終了オフセット）が格納されるとともに、処理後のチャンクのサイズ（処理後チャンクサイズ）が格納される。なお、処理後終了オフセット（処理後チャンクサイズ）２５９２に、終了オフセット又は処理後チャンクサイズのいずれか一方のみを格納してもよい。

次に、チャンクマップマップ２５５について説明する。

図７は、一実施形態に係るチャンクマップマップの構成図である。

チャンクマップマップ２５５は、ユーザが使用するファイル（ユーザファイル）に対応するチャンクマップ２５７のファイル（チャンクマップファイル）の識別子を管理する。チャンクマップマップ２５５は、ユーザファイル毎のエントリを格納する。なお、チャンクマップマップ２５５の対象となるファイルは、チャンクに対して保存する際の処理が設定されて利用される方法（本方法）の対象となるファイルである。チャンクマップマップ２５５のエントリは、ファイル識別子２５５１と、チャンクマップのファイル識別子２５５２と、保存状態２５５３とのフィールドを含む。

ファイル識別子２５５１には、エントリに対応するファイルのクラウドストレージ３０でのファイル識別子が格納される。チャンクマップのファイル識別子２５５２には、エントリに対応するファイルのチャンクマップ２５７のファイルのファイル識別子が格納される。保存状態２５５３には、エントリに対応するファイルについてのクラウドストレージ３０への保存状態（格納状態）が格納される。保存状態は、例えば、チャンクをそれぞれ個別に格納する場合には、分割であり、チャンクを結合して格納する場合には、結合である。

なお、チャンクマップマップ２５５は、動作上、必須ではない。例えば、チャンクマップファイルの識別子を例えば、「ファイルパス／ｍａｐ」として名付けるようにしておくことで、ファイルパスから、チャンクマップのファイル識別子を特定することができる。この場合において、ファイルについてのクラウドストレージ３０への保存状態（分割／結合）は、チャンクマップのテーブル形式等から判断するようにすればよい。また、ファイルパスから特定したチャンクマップのファイル識別子によってチャンクマップにアクセスできない場合は、既存のリード／ライトを実行すればよい。また、本実施形態では、チャンクマップマップ２５５の対象となるファイルは、チャンクに対して保存する際の処理が設定されて利用される方法（本方法）の対象となるファイルとしていたが、これに限られず、本方法の対象となるファイル以外のファイルも対象としてもよく、本方法の対象となるファイル以外のファイルについては、対応するエントリのチャンクマップのファイル識別子２５５２に、値を設定しなくてもよい。

次に、本実施形態に係るコンピュータシステム１における処理動作について説明する。

まず、クラウドストレージ３０にチャンクを個別に保存する設定がされている場合（チャンク個別保存設定時）におけるファイル初回保存処理について説明する。

図８は、一実施形態に係るチャンク個別保存設定時のファイル初回保存処理のシーケンス図である。

ファイルストレージ２０において、ＣＰＵ２４は、例えば、コンピュータ１０からのユーザによるファイル作成の指示に従って、ファイルの作成を行う。ここで作成されたファイルは、符号化処理（圧縮処理、暗号化処理等）がされていない無処理のファイル（無処理ファイル）である（図８（１））。なお、ファイル作成の指示は、コンピュータ１０からのユーザによる指示以外に、ファイルストレージ２０内での処理に基づく指示がある。

次いで、ＣＰＵ２４は、作成されたファイルを複数のチャンクに分割する処理を行う（図８（２））。ここで、チャンクは、予め決められた範囲のサイズであればよく、一定のサイズであっても、任意のサイズであってもよい。図８（２）の例では、無処理ファイルをオフセットが０－１００ＫＢまでのチャンクＡと、オフセットが１００ＫＢ－３００ＫＢまでのチャンクＢと、オフセットが３００ＫＢ－６００ＫＢまでのチャンクＣとに分割している。ここで、０－１００ＫＢの表記は、０以上１００ＫＢ未満の範囲、すなわち、０～９９９９９Ｂｙｔｅ（９９ＫＢ）までの範囲を示している。他のオフセットの範囲の表記も同様である。

次いで、ＣＰＵ２４は、チャンクのそれぞれをファイル（チャンクファイル）として作成する（図８（３））。なお、この状態のチャンクファイルを無処理チャンクファイルという。

次いで、ＣＰＵ２４は、チャンクファイル毎に、チャンクに対して設定された処理内容に対応する処理を行う（図８（４））。ここで、チャンクに対する処理内容は、予めファイルの全てのチャンクに対して同一の処理内容が設定されていてもよく、ユーザの指示によってチャンク毎に処理内容が設定されてもよい。なお、チャンクが所定サイズ以上であれば圧縮するように決定してもよい。処理内容としては、符号化処理（圧縮処理、暗号化処理等）がある。図８（４）の例では、全てのチャンクに対して圧縮処理を行うものとして説明する。なお、処理内容として無処理である場合には、何もしない。ここで、符号化処理が行われたチャンクが、符号化チャンクに対応する。

次いで、ＣＰＵ２４は、作成するファイル名としてコンピュータ１０から受け取ったファイル識別子から、チャンクファイルのファイル識別子と、チャンクマップ２５７Ａのファイル識別子とを生成する（図８（５））。図８（５）の例では、ＣＰＵ２４は、「／ｆｉｌｅ」とのファイル識別子に基づいて、チャンクファイルのファイル識別子として、「／ｆｉｌｅ／ａ」，「／ｆｉｌｅ／ｂ」，「／ｆｉｌｅ／ｃ」を生成し、チャンクマップ２５７Ａのファイル識別子として、「／ｆｉｌｅ／ｍａｐ」を生成する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａを作成する（図８（６））。なお、このチャンクマップ２５７Ａのファイルは、符号化処理がされていない状態（無処理）となっている。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａを、そのまま（無処理）とするか、符号化処理（圧縮処理、暗号化処理等）するのかを決定し、決定した処理を実行する（図８（７））。なお、チャンクマップ２５７Ａをそのままか、符号化処理するかについては、デフォルトの設定に従ってもよいし、ユーザの設定や指示に従ってもよく、チャンクマップ２５７Ａが所定サイズ以上であれば圧縮するように決定してもよい。本例では、チャンクマップ２５７Ａを圧縮すると決定されたものとし、チャンクマップ２５７Ａを圧縮する。

次いで、ＣＰＵ２４は、チャンクファイルとチャンクマップとの保存要求を送信し、チャンクファイルとチャンクマップのデータをクラウドストレージ３０に送信する（図８（８））。

本例では、チャンクマップ２５７Ａには、無処理開始オフセットが０Ｂｙｔｅであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ａ」であるエントリと、無処理開始オフセットが１００ＫＢであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ｂ」であるエントリと、無処理開始オフセットが３００ＫＢであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ｃ」であるエントリと、が含まれている。

クラウドストレージ３０では、ＣＰＵ３４が、ファイルストレージ２０から送信された各チャンクファイルと、チャンクマップとをそれぞれ別に補助記憶装置３５に格納する（図８（９））。ここで、クラウドストレージ３０がオブジェクトストレージであれば、各チャンクファイルとチャンクマップとをそれぞれ別のオブジェクトとして格納する。一方、ファイルストレージであれば、各チャンクファイルとチャンクマップとをそれぞれファイルとして格納する。なお、クラウドストレージ３０では、チャンクファイルやチャンクマップに対しては符号化することなく格納する。このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次に、チャンク個別保存設定時におけるファイルの一部分をリードする処理（部分リード処理）について説明する。

図９は、一実施形態に係るチャンク個別保存設定時の部分リード処理のシーケンス図である。

部分リード処理は、ファイルストレージ２０が、例えば、コンピュータ１０からファイルの一部のデータを対象とするリード命令を受信した場合に実行される。ここで、リード命令には、リード対象のファイルのファイル識別子と、無処理ファイルにおけるリード対象となる部分（リード部分）のオフセットとが含まれている。本例では、ファイル識別子が「／ｆｉｌｅ」であり、オフセットが２００ＫＢ－４００ＫＢであるとして説明する。なお、リード命令は、コンピュータ１０からのユーザによる指示に基づく命令以外に、ファイルストレージ２０内での処理に基づく命令がある。

ファイルストレージ２０のＣＰＵ２４は、リード命令からファイル識別子と、オフセットを受け付ける（図９（１０））。

次いで、ＣＰＵ２４は、リード対象のファイルのファイル識別子から、チャンクマップ２５７Ａのファイル識別子を特定する。本例では、ＣＰＵ２４は、ファイル識別子「／ｆｉｌｅ」からチャンクマップ２５７Ａのファイル識別子「／ｆｉｌｅ／ｍａｐ」を特定する（図９（１１））。なお、チャンクマップ２５７Ａのファイル識別子の特定としては、チャンクマップ２５７のファイル識別子の作成方法に基づいて特定してもよく、チャンクマップマップ２５５を参照して特定してもよい。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａのファイル識別子を指定したチャンクマップの取得要求をクラウドストレージ３０に送信する（図９（１２））。

クラウドストレージ３０のＣＰＵ３４は、チャンクマップの取得要求に応答して、取得要求に対応するチャンクマップ２５７Ａを補助記憶装置３５から取得して、ファイルストレージ２０に送信する（図９（１３））。なお、チャンクマップ２５７Ａをクラウドストレージ３０から取得するのは、同一のファイルを他のファイルストレージ２０と共用している場合において、最新のチャンクマップ２５７Ａを取得するためである。

ファイルストレージ２０のＣＰＵ２４は、クラウドストレージ３０から送信されたチャンクマップ２５７Ａを取得する（図９（１４））。ここで、本例においては、取得したチャンクマップは、図８（９）で格納されている圧縮されたチャンクマップ２５７Ａである。なお、チャンクマップ２５７Ａをクラウドストレージ３０から取得するのは、同一のファイルを他のファイルストレージ２０と共用している場合において、最新のチャンクマップ２５７Ａを取得するためである。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａに対して逆符号化処理（符号化処理の逆変換処理、本例では、伸長処理）を実行する。これにより、無処理のチャンクマップ２５７Ａを取得することができる（図９（１５））。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａを参照して、リード部分を含む１以上のチャンクファイルのファイル識別子を特定する（図９（１６））。本例では、オフセットが２００ＫＢ－４００ＫＢであるので、この範囲を含むチャンクファイルのファイル識別子「／ｆｉｌｅ／ｂ」と、「／ｆｉｌｅ／ｃ」とが特定される。

次いで、ＣＰＵ２４は、特定したチャンクファイルのファイル識別子を指定したチャンクファイルの取得要求をクラウドストレージ３０に送信する（図９（１７））。

クラウドストレージ３０のＣＰＵ３４は、チャンクファイルの取得要求に応答して、取得要求に対応するチャンクファイルを補助記憶装置３５から取得して、ファイルストレージ２０に送信する（図９（１８））。ここで、チャンクファイルＢ，Ｃの中のチャンクファイルＢの中の部分ａと、チャンクファイルＣの中の部分ｂとを合わせた部分がリード部分である。

次いで、ファイルストレージ２０のＣＰＵ２４は、クラウドストレージ３０から送信されたチャンクファイルを取得する（図９（１９））。

次いで、ＣＰＵ２４は、各チャンクファイルを無処理チャンクファイルとする。具体的には、ＣＰＵ２４は、各チャンクファイル毎に、符号化処理をしたファイルであれば、逆符号化処理を行う。本例では、各チャンクファイルが圧縮されているので、チャンクファイル毎に伸長処理を実行する（図９（２０））。ここで、本実施形態では、チャンクファイルを単位として符号化処理をしているので、チャンクファイル毎に逆符号化処理を行って、各チャンクファイルを無処理チャンクファイルとすることができる。

次いで、ＣＰＵ２４は、無処理チャンクファイルとされた各チャンクファイルを結合し（図９（２１））、結合したチャンクファイルからリード命令のオフセットに対応するリード部分を特定して抽出し、抽出したリード部分のデータをリード命令の命令元（例えば、コンピュータ１０）に送信する（図９（２２））。

上記した部分リード処理によると、ファイルの中のリード部分を含むチャンクファイルのみをクラウドストレージ３０から読み出せばよいので、クラウドストレージ３０とファイルストレージ２０との間の通信のデータ量を削減することができる。また、チャンクファイル毎に逆符号化処理を行うことにより、無処理チャンクファイルを得ることができ、その無処理チャンクファイルから、無処理状態のリード部分のデータを抽出することができる。

次に、チャンク個別保存設定時におけるファイルの一部分を更新する処理（部分更新処理）について説明する。

図１０は、一実施形態に係るチャンク個別保存設定時の部分更新処理のシーケンス図である。

部分更新処理は、リード命令に基づいて、リード部分を、例えば、コンピュータ１０にファイルストレージ２０から送信した後、コンピュータ１０からリード部分のデータに対する更新を受け取ったときに実行される処理である。本例では、図９に示す部分リード処理が行われた後に、リード部分に対して更新がされる場合の処理について説明する。

ＣＰＵ２４は、コンピュータ１０からのユーザによるリード部分に対するデータの更新を受け取ると、リード部分に対する更新を行う（図１０（２３））。本例では、オフセットが２００ＫＢ－３００ＫＢの１００ＫＢのデータが２００ＫＢのデータに更新されたものとする。ここで、この更新された部分のデータを更新差分という。

ＣＰＵ２４は、リード部分を含んでいたチャンクに更新差分を反映する（図１０（２４））。本例では、ＣＰＵ２４は、チャンクＢのリード部分以外の部分と、更新差分を含むリード部分と、チャンクＣのリード部分以外の部分とを結合したファイルを作成する。

次いで、ＣＰＵ２４は、差分のあるチャンクを検出する（図１０（２５））。本例では、チャンクＢと、チャンクＣとが検出されることとなる。

次いで、ＣＰＵ２４は、差分を含むチャンクを分割して新たなチャンク（更新チャンク）を作成する（図１０（２６））。なお、チャンクを分割するか否かについては、デフォルトの設定に従ってもよいし、ユーザの設定や指示に従ってもよく、チャンクが所定サイズ以上であれば分割するように決定してもよい。本例では、ＣＰＵ２４は、各チャンクが所定範囲のサイズに収まるように分割を行う。本例では、この処理により、チャンクＢ’、Ｄ、Ｃ’が作成される。チャンクＢ’の無処理ファイルにおけるオフセットは、１００ＫＢ－３００ＫＢとなり、チャンクＤの無処理ファイルにおけるオフセットは、３００ＫＢ－４００ＫＢとなり、チャンクＤ’の無処理ファイルにおけるオフセットは、４００ＫＢ－７００ＫＢとなる。なお、差分を含むチャンクを新たなチャンクに分割しなくてもよい。

次いで、ＣＰＵ２４は、作成した各チャンク毎のファイル（チャンクファイル）を作成する（図１０（２７））。

次いで、ＣＰＵ２４は、作成した各チャンクファイル毎に、チャンクに対して設定された処理内容に対応する処理を行う（図１０（２８））。ここで、本例では、各チャンクに対しては、圧縮が設定されているので、ＣＰＵ２４は、各チャンクファイルに対して圧縮処理を行う。なお、チャンクが所定サイズ以上であれば圧縮するように決定してもよい。

次いで、ＣＰＵ２４は、リード部分を含むファイルのファイル識別子から、チャンクファイルのファイル識別子と、チャンクマップ２５７Ａのファイル識別子とを生成する（図１０（２９））。本例では、ＣＰＵ２４は、「／ｆｉｌｅ」とのファイル識別子に基づいて、チャンクファイルのファイル識別子として、「／ｆｉｌｅ／ｂ」，「／ｆｉｌｅ／ｄ」，「／ｆｉｌｅ／ｃ」を生成し、チャンクマップ２５７Ａのファイル識別子として、「／ｆｉｌｅ／ｍａｐ」を生成する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａを新たなチャンクファイルの内容に更新する（図１０（３０））。本例では、チャンクマップ２５７Ａには、無処理開始オフセットが０Ｂｙｔｅであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ａ」であるエントリと、無処理開始オフセットが１００ＫＢであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ｂ」であるエントリと、無処理開始オフセットが３００ＫＢであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ｄ」であるエントリと、無処理開始オフセットが４００ＫＢであり、チャンクファイルのファイル識別子が「／ｆｉｌｅ／ｃ」であるエントリと、が含まれている。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ａを、そのままとするか、符号化（圧縮又は暗号化）するのかを決定し、決定した処理を実行する（図１０（３１））。なお、チャンクマップ２５７Ａをそのままか、符号化処理するかについては、デフォルトの設定又はユーザの指定や設定に従ってもよく、チャンクマップ２５７Ａが所定サイズ以上であれば圧縮するように決定してもよい。本例では、チャンクマップ２５７Ａを圧縮すると決定されたものとし、チャンクマップ２５７Ａを圧縮する。

次いで、ＣＰＵ２４は、チャンクファイルとチャンクマップとの保存要求を送信し、チャンクファイルとチャンクマップのデータをクラウドストレージ３０に送信する（図１０（３２））。

クラウドストレージ３０では、ＣＰＵ３４が、ファイルストレージ２０から送信された各チャンクファイルと、チャンクマップとをそれぞれ別に補助記憶装置３５に格納する（図１０（３３））。この処理により、チャンクファイルＢが更新後のチャンクファイルＢ’に更新され、チャンクファイルＣが更新後のチャンクファイルＣ’に更新され、新たにチャンクファイルＤが格納される。

以上説明したように、本実施形態に係る部分更新処理によると、チャンクを符号化している場合であっても、更新差分を含むチャンクのみをクラウドストレージ３０に送信すれば、クラウドストレージ３０においては、更新差分を含むチャンクを更新等して、更新後のファイルのデータが格納されることとなる。

次に、クラウドストレージ３０にチャンクを結合して保存する設定がされている場合（チャンク結合保存設定時）におけるファイル初回保存処理について説明する。

図１１は、一実施形態に係るチャンク結合保存設定時のファイル初回保存処理のシーケンス図である。

ファイルストレージ２０において、ＣＰＵ２４は、例えば、コンピュータ１０からのユーザによる指示に従って、ファイルの作成を行う。ここで作成されたファイルは、圧縮処理や、暗号化処理がされていない無処理ファイルである（図１１（１））。なお、ファイル作成の指示は、コンピュータ１０からのユーザによる指示以外に、ファイルストレージ２０内での処理に基づく指示がある。

次いで、ＣＰＵ２４は、作成された無処理ファイルを複数のチャンクに分割する処理を行う（図１１（２））。ここで、チャンクは、予め決められた範囲のサイズであればよく、一定のサイズであっても、任意のサイズであってもよい。本例では、ファイルをオフセットが０－１００ＫＢまでのチャンクＡと、オフセットが１００ＫＢ－３００ＫＢまでのチャンクＢと、オフセットが３００ＫＢ－６００ＫＢまでのチャンクＣとに分割している。

次いで、ＣＰＵ２４は、チャンクのそれぞれをファイル（チャンクファイル）として作成する（図１１（３））。なお、この状態のチャンクファイルを無処理チャンクファイルという。

次いで、ＣＰＵ２４は、チャンクファイル毎に、チャンクに対して設定された処理内容に対応する処理を行う（図１１（４））。ここで、チャンクに対する処理内容は、予め全体として同一の処理内容が設定されていてもよく、ユーザの指示によってチャンク毎に処理内容が設定されてもよい。本例では、全てのチャンクに対して圧縮処理を行うものとして説明する。

次いで、ＣＰＵ２４は、設定された処理内容に対応する処理が行われたチャンクファイルを結合して１つのファイルとする（図１１（５））。ここで、本例では、処理後においては、各チャンクのサイズが変わり、処理後のチャンクＡのオフセットは、０－８０ＫＢであり、チャンクＢのオフセットは、８０ＫＢ－２４０ＫＢであり、チャンクＣのオフセットは、２４０ＫＢ－４８０ＫＢとなる。

次いで、ＣＰＵ２４は、作成するファイルのファイル名としてコンピュータ１０から受け取ったファイル識別子から、チャンクマップ２５７Ｂのファイル識別子を生成する（図１１（６））。本例では、ＣＰＵ２４は、「／ｆｉｌｅ」とのファイル識別子に基づいて、チャンクマップ２５７Ｂのファイル識別子として、「／ｆｉｌｅ／ｍａｐ」を生成する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを生成する（図１１（７））。なお、このチャンクマップ２５７Ｂのファイルは、符号化処理がされていないファイルである。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを、そのままとするか、符号化（圧縮又は暗号化）するのかを決定し、決定した処理を実行する（図１１（８））。なお、チャンクマップ２５７Ｂをそのままか、符号化処理するかについては、デフォルトの設定に従ってもよいし、ユーザの設定や指定に従ってもよく、チャンクマップ２５７Ｂが所定サイズ以上であれば圧縮するように決定してもよい。本例では、チャンクマップ２５７Ｂを圧縮すると決定されたものとし、チャンクマップ２５７Ｂを圧縮する。

次いで、ＣＰＵ２４は、ファイルとチャンクマップとの保存要求を送信し、ファイルとチャンクマップのデータをクラウドストレージ３０に送信する（図１１（９））。

本例では、チャンクマップ２５７Ｂには、無処理開始オフセットが０Ｂｙｔｅであり、処理後オフセットが０ＫＢであるチャンクＡのエントリと、無処理開始オフセットが１００ＫＢであり、処理後オフセットが８０ＫＢであるチャンクＢのエントリと、無処理開始オフセットが３００ＫＢであり、処理後オフセットが２４０ＫＢであるチャンクＣのエントリが含まれている。

クラウドストレージ３０では、ＣＰＵ３４が、ファイルストレージ２０から送信されたファイルと、チャンクマップとをそれぞれ別に補助記憶装置３５に格納する（図１１（１０））。ここで、クラウドストレージ３０がオブジェクトストレージであれば、ファイルとチャンクマップとをそれぞれ別のオブジェクトとして格納する。一方、ファイルストレージであれば、ファイルとチャンクマップとをそれぞれファイルとして格納する。なお、クラウドストレージ３０では、チャンクファイルやチャンクマップに対しては符号化することなく格納する。

次に、チャンク結合保存設定時におけるファイルの一部分をリードする処理（部分リード処理）について説明する。

図１２は、一実施形態に係るチャンク結合保存設定時の部分リード処理のシーケンス図である。

部分リード処理は、ファイルストレージ２０が、例えば、コンピュータ１０からのユーザによるリード命令を受信した場合に実行される。ここで、リード命令には、リード対象のファイルのファイル識別子と、無処理ファイルにおけるリード部分のオフセットとが含まれている。本例では、ファイル識別子が「／ｆｉｌｅ」であり、オフセットが２００ＫＢ－４００ＫＢであるとして説明する。なお、リード命令は、コンピュータ１０からのユーザによる指示に基づく命令以外に、ファイルストレージ２０内での処理に基づく命令がある。

ファイルストレージ２０のＣＰＵ２４は、リード命令からファイル識別子と、オフセットを受け付ける（図１２（１１））。

次いで、ＣＰＵ２４は、リード対象のファイルのファイル識別子から、チャンクマップ２５７Ｂのファイル識別子を特定する。本例では、ＣＰＵ２４は、ファイル識別子「／ｆｉｌｅ」からチャンクマップ２５７Ｂのファイル識別子「／ｆｉｌｅ／ｍａｐ」を特定する（図１２（１２））。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂのファイル識別子を指定したチャンクマップの取得要求をクラウドストレージ３０に送信する（図１２（１３））。

クラウドストレージ３０のＣＰＵ３４は、チャンクマップ２５７Ｂの取得要求に応答して、対応するチャンクマップ２５７Ｂを補助記憶装置３５から取得して、ファイルストレージ２０に送信する（図１２（１４））。

ファイルストレージ２０のＣＰＵ２４は、クラウドストレージ３０から送信されたチャンクマップ２５７Ｂを取得する（図１２（１５））。ここで、本例においては、取得したチャンクマップは、図１１（１０）で格納されている圧縮されたチャンクマップ２５７Ｂである。なお、チャンクマップ２５７Ｂをクラウドストレージ３０から取得するのは、同一のファイルを他のファイルストレージ２０と共用している場合において、最新のチャンクマップ２５７Ｂを取得するためである。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂに対して逆符号化処理（本例では、伸長処理）を実行する。これにより、無処理のチャンクマップ２５７Ｂを取得することができる（図１２（１６））。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを参照して、リード部分を含む１以上のチャンクファイルの無処理ファイルにおけるオフセット（無処理開始終了オフセット）から、チャンクファイルの処理後における開始及び終了のオフセット（処理後開始終了オフセット）を特定する（図１２（１７））。本例では、リード部分の無処理オフセットである２００ＫＢ－４００ＫＢを含むチャンクの処理後開始終了オフセットとして、８０ＫＢ－２４０ＫＢと特定される。

次いで、ＣＰＵ２４は、リード対象のファイルのファイル識別子と、処理後開始終了オフセットとを指定したチャンクファイルの取得要求をクラウドストレージ３０に送信する（図１２（１８））。

クラウドストレージ３０のＣＰＵ３４は、チャンクファイルの取得要求に応答して、処理後開始終了オフセットに対応するチャンクＢ，Ｃを補助記憶装置３５から取得して、チャンクファイルとしてファイルストレージ２０に送信する（図１２（１９））。ここで、取得したチャンクファイル中のチャンクＢの中の一部分と、チャンクＣの中の一部分とを合わせた部分がリード部分である。

次いで、ファイルストレージ２０のＣＰＵ２４は、クラウドストレージ３０から送信されたチャンクファイルを取得する（図１２（２０））。

次いで、ＣＰＵ２４は、取得したチャンクファイルの中の各チャンクを無処理チャンクファイルとする。具体的には、各チャンク毎に、符号化処理をしたチャンクであれば、逆符号化処理を行う。本例では、チャンク単位に符号化した場合であっても、複数のチャンクを一括して逆符号化できる符号化処理をしているので、取得したチャンクファイル単位で一括して逆符号化処理をする（図１２（２１））。
なお、チャンクを単位として符号化処理をし、各チャンクをそれぞれ逆符号化処理しなければならない場合には、処理後開始オフセット及び処理後終了オフセットから各チャンクを特定し、各チャンクをそれぞれファイルとして作成し、チャンクファイル毎に逆符号化処理を実行し、逆符号化処理を行った各チャンクファイルを結合して１つの無処理チャンクファイルとすればよい。

次いで、ＣＰＵ２４は、無処理チャンクファイルからリード命令のオフセットに対応するリード部分を特定して抽出し、抽出したリード部分のデータをリード命令の命令元（例えば、コンピュータ１０）に送信する（図１２（２２））。

上記した部分リード処理によると、ファイルの中のリード部分を含むチャンク部分のみをクラウドストレージ３０から読み出せばよいので、クラウドストレージ３０とファイルストレージ２０との間のデータ通信量を削減することができる。また、チャンク毎に逆符号化処理を行うことにより、無処理チャンクファイルを得ることができ、その無処理チャンクファイルから、無処理状態のリード部分のデータを抽出することができる。

次に、チャンク結合保存設定時におけるファイルの一部分を更新する処理（部分更新処理）について説明する。

図１３は、一実施形態に係るチャンク結合保存設定時の部分更新処理のシーケンス図である。

部分更新処理は、リード命令に基づいて、リード部分を、例えば、コンピュータ１０にファイルストレージ２０から送信した後、コンピュータ１０からリード部分のデータに対する更新を受け取ったときに実行される処理である。本例では、図１２に示す部分リード処理が行われた後に、リード部分に対して更新がされる場合の処理について説明する。

ＣＰＵ２４は、コンピュータ１０からのユーザによるリード部分に対するデータの更新を受け取ると、リード部分に対する更新を行う（図１３（２３））。本例では、オフセット２００ＫＢ－３００ＫＢの１００ＫＢのデータが２００ＫＢのデータに更新されたのとする。ここで、この更新された部分を更新差分という。

ＣＰＵ２４は、リード部分を含んでいたチャンクに更新差分を反映する（図１３（２４））。本例では、ＣＰＵ２４は、チャンクＢのリード部分以外の部分と、更新差分を含むリード部分と、チャンクＣのリード部分以外の部分とが結合されているファイルを作成する。

次いで、ＣＰＵ２４は、差分のあるチャンク(更新チャンク)を検出する（図１３（２５））。本例では、チャンクＢと、チャンクＣとが検出されることとなる。

次いで、ＣＰＵ２４は、差分を含むチャンクを分割して新たなチャンク（更新チャンク）を作成する（図１３（２６））。なお、チャンクを分割するか否かについては、デフォルトの設定に従ってもよいし、ユーザの設定や指示に従ってもよく、チャンクが所定サイズ以上であれば分割するように決定してもよい。本例では、ＣＰＵ２４は、各チャンクが所定範囲のサイズに収まるように分割を行う。なお、差分を含むチャンクを新たなチャンクに分割しなくてもよい。本例では、この処理により、チャンクＢ’、Ｄ、Ｃ’が作成される。チャンクＢ’の無処理ファイルにおけるオフセットは、１００ＫＢ－３００ＫＢとなり、チャンクＤの無処理ファイルにおけるオフセットは、３００ＫＢ－４００ＫＢとなり、チャンクＣ’の無処理ファイルにおけるオフセットは、４００ＫＢ－７００ＫＢとなる。

次いで、ＣＰＵ２４は、作成した各チャンク毎のファイル（チャンクファイル）を作成する（図１３（２７））。

次いで、ＣＰＵ２４は、作成した各チャンクファイル毎に、チャンクに対して設定された処理内容に対応する処理を行う（図１３（２８））。ここで、本例では、各チャンクに対しては、圧縮が設定されているので、ＣＰＵ２４は、各チャンクファイルに対して圧縮処理を行う。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを参照し、更新されていない１以上のチャンク（非更新チャンク）の無処理ファイルにおけるオフセット（無処理開始終了オフセット）から、チャンクファイルの処理後開始終了オフセットを特定し（図１３（２９））、ファイルのファイル識別子と、非更新チャンクの処理後開始終了オフセットとを指定した、クラウドストレージ３０に非更新チャンクをコピーさせる非更新チャンクコピー要求を送信する（図１３（３０））。

非更新チャンクコピー要求を受信したクラウドストレージ３０では、ＣＰＵ３４が非更新チャンクコピー要求により指定されている非更新チャンクを特定し、非更新チャンクファイルを例えば主記憶装置３３にコピーする（図１３（３１））。なお、非更新チャンクファイルを補助記憶装置３５にコピーしてもよい。

一方、ファイルストレージ２０のＣＰＵ２４は、図１３（２８）で得た各チャンクファイルを結合し（図１３（３２））、結合したファイル（更新チャンクファイル）をクラウドストレージ３０に送信する（図１３（３３））。これに対して、クラウドストレージ３０のＣＰＵ３４は、更新チャンクファイルを受信すると、更新チャンクファイルを例えば補助記憶装置３５に格納する。なお、更新チャンクファイルを主記憶装置３３に格納してもよい。

また、ファイルストレージ２０のＣＰＵ２４は、非更新チャンクファイルについては、チャンクマップ２５７Ｂを参照して処理後開始終了オフセットを確認し、更新チャンクファイルについては、更新処理で変更され、設定された処理内容の処理後の処理後開始終了オフセットを確認し、これらの処理後開始終了オフセットに従う順番となるようにクラウドストレージ３０で結合させるための結合要求（チャンクファイル結合要求）を作成し（図１３（３４））、チャンクファイル結合要求をクラウドストレージ３０に送信する（図１３（３５））。

クラウドストレージ３０のＣＰＵ３４は、チャンクファイル結合要求を受信すると、チャンクファイル結合要求に含まれている順番で、例えば、主記憶装置３３の非更新チャンクファイル及び更新チャンクファイルを結合する（図１３（３６））。

また、ファイルストレージ２０のＣＰＵ２４は、ファイルのファイル識別子を指定した、結合させたファイルを保存させるファイル保存要求をクラウドストレージ３０に送信する（図１３（３７））。

クラウドストレージ３０のＣＰＵ３４は、ファイル保存要求を受信するとファイル保存要求で指定されているファイル識別子として、結合したファイルを補助記憶装置３５に格納する（図１３（３８））。この処理により、チャンクＢ，ＣがチャンクＢ’，Ｄ，Ｃ’に更新された更新後のファイルがクラウドストレージ３０の補助記憶装置３５に格納されることとなる。

更に、ファイルストレージ２０のＣＰＵ２４は、更新後のチャンクマップ２５７Ｂのファイル識別子を生成する（図１３（３９））。本例では、ＣＰＵ２４は、「／ｆｉｌｅ」とのファイル識別子に基づいて、チャンクマップ２５７Ｂのファイル識別子として、「／ｆｉｌｅ／ｍａｐ」を生成する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを新たなファイルの内容に更新する（図１３（４０））。本例では、チャンクマップ２５７Ｂには、無処理開始オフセットが０Ｂｙｔｅであり、処理後開始オフセットが０Ｂｙｔｅであるエントリと、無処理開始オフセットが１００ＫＢであり、処理後開始オフセットが８０ＫＢであるエントリと、無処理開始オフセットが３００ＫＢであり、処理後開始オフセットが２４０ＫＢであるエントリと、無処理開始オフセットが４００ＫＢであり、処理後開始オフセットが３２０ＫＢであるエントリと、が含まれている。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを、そのままとするか、符号化（圧縮又は暗号化）するのかを決定し、決定した処理を実行する（図１３（４１））。なお、チャンクマップ２５７Ｂをそのままか、符号化処理するかについては、デフォルトの設定に従ってもよいし、ユーザに設定や指示に従ってもよく、チャンクマップ２５７Ｂが所定サイズ以上であれば圧縮するように決定してもよい。本例では、チャンクマップ２５７Ｂを圧縮すると決定されたものとし、チャンクマップ２５７Ｂを圧縮する。

次いで、ＣＰＵ２４は、更新したチャンクマップ２５７Ｂとの保存要求を送信し、チャンクマップ２５７Ｂのデータをクラウドストレージ３０に送信する（図１３（４２））。

クラウドストレージ３０では、ＣＰＵ３４が、ファイルストレージ２０から送信されたチャンクマップ２５７Ｂを格納する（図１３（４３））。

次に、コンピュータシステム１における各処理によるチャンクの状態遷移を説明する。

図１４は、一実施形態に係るチャンクの状態遷移を説明する図である。図１４（Ａ）は、ファイルの初回保存時のファイルの状態を示し、図１４（Ｂ）は、部分リード時のファイルの状態を示し、図１４（Ｃ）は、部分更新時のファイルの状態を示し、図１４（Ｄ）は、更新保存時のファイルの状態を示す。図１４において、「保存対象」は、クラウドストレージ３０に保存する対象であることを示し、「保存済み」は、クラウドストレージ３０に保存済みであることを示している。

本実施形態によりファイルの初回保存を行った場合には、図１４（Ａ）に示すように、ファイルの全てのチャンクが保存対象であるので、クラウドストレージ３０の補助記憶装置３５には、ファイルを構成する各チャンクが処理内容で設定された状態（無処理又は符号化処理された状態）で保存される。なお、本実施形態では、各チャンクはそれぞれ別々のファイル（又はオブジェクト）として管理される場合と、結合されて１つのファイル（又はオブジェクト）として管理される場合がある。

全てのチャンクが保存済みであるファイルを部分リードする場合においては、図１４（Ｂ）に示すように、リード対象となるリード部分を含むチャンク（図では、チャンクＢ，Ｃ）がクラウドストレージ３０からファイルストレージ２０に読み出される。

図１４（Ｃ）の上側のファイルに示すように部分更新がされると、下側のファイルに示すような状態となる。例えば、チャンクＢとチャンクＣに跨る部分に更新差分がある場合には、下側のファイルのように、チャンクＢとチャンクＣとが保存対象となり更新される。また、チャンクＥに示すように、１つのチャンクに更新差分がある場合には、そのチャンクのみが保存対象となり更新される。また、チャンクＦに示すように一部が削除される場合には、そのチャンクが保存対象となり、そのチャンクに対して削除部分を除く更新がされる。

図１４（Ｃ）の下側のファイルに示すように部分更新がされた後に、クラウドストレージ３０の補助記憶装置３５に更新保存する場合には、例えば、図１４（Ｄ）の上側のファイルに示すように、部分更新がされたチャンクＢとチャンクＣとが一時チャンクとして結合され、この一時チャンクが、例えば、下側のファイルに示すように、複数のチャンク（図では、チャンクＢ’，Ｃ’，Ｈ）に分割されて、保存される。また、例えば、図１４（Ｃ）の下側のファイルに示すように、連続するチャンクＥと、チャンクＦとがそれぞれ更新された場合には、図１４（Ｄ）の上側のファイルに示すように、これらチャンクＥ，Ｆとが一時チャンクとして結合され、この一時チャンクが、例えば、下側のファイルに示すように、複数のチャンク（図では、チャンクＥ’，Ｆ’）に分割されて、保存される。

次に、ファイルストレージ２０における各種処理動作について説明する。

まず、ファイル初回保存処理の処理動作について説明する。

図１５は、一実施形態に係るファイル初回保存処理のフローチャートである。

ファイルストレージ２０のＣＰＵ２４は、保存対象のファイルに対するクラウドストレージ３０でのファイル識別子の指定をコンピュータ１０から受け付ける（ステップＳ１）。なお、ファイル識別子の指定は、コンピュータ１０からのユーザによる指定以外に、ファイルストレージ２０内での処理に基づく指定がある。

次いで、ＣＰＵ２４は、保存対象のファイルに対応するチャンクマップ２５７を作成する（ステップＳ２）。なお、チャンクマップ２５７は、保存対象のファイルのクラウドサーバ３０での保存設定に応じてチャンクマップ２５７Ａ又は２５７Ｂのいずれかとなる。

次いで、ＣＰＵ２４は、ファイルの先頭からのデータを順に対象としてループＡの処理（ステップＳ３，Ｓ４）を繰り返し実行する。

ループＡの処理では、ＣＰＵ２４は、ファイルのデータについて、所定のチャンクサイズで分割してチャンクファイルを作成し（ステップＳ３）、このチャンクファイルのファイルにおける開始オフセットをチャンクマップ２５７に書き込む（ステップＳ４）。

保存対象のファイルのデータに未処理の部分がある場合には、ＣＰＵ２４は、未処理の部分の先頭からのデータを対象にループＡの処理を実行する。一方、保存対象のファイルの全てのデータに対してループＡの処理を実行した場合には、ＣＰＵ２４は、各チャンクのそれぞれを対象としてループＢの処理（ステップＳ５～Ｓ７）を実行する。

ループＢの処理では、ＣＰＵ２４は、処理対象のチャンクファイルに対して、符号化を実行するか否かを判定する（ステップＳ５）。ここで、チャンクファイルに対して符号化を実行するか否かは、デフォルトの設定に従ってもよいし、ユーザの設定や指定に従ってもよく、チャンクファイルが所定サイズ以上であれば符号化するように決定してもよい。処理対象のチャンクファイルを符号化すると判定した場合（ステップＳ５：ＹＥＳ）には、ＣＰＵ２４は、処理対象のチャンクファイルに対して符号化処理を実行する（ステップＳ６）。一方、符号化しないと判定した場合（ステップＳ５：ＮＯ）には、チャンクファイルに対して何もしない（ステップＳ７）。

次いで、ＣＰＵ２４は、ループＢの処理をそれぞれのチャンクファイルを対象に実行し、全てのチャンクファイルを対象にループＢの処理を実行した場合には、処理をステップＳ８に進める。

ステップＳ８では、ＣＰＵ２４は、クラウドストレージ３０において、ファイルを構成するチャンクのチャンクファイルを結合して保存する設定（チャンク結合保存設定）がされているか否かを判定する。この結果、チャンク結合保存設定がされていない場合（ステップＳ８：ＮＯ）には、ＣＰＵ２４は、ステップＳ９～Ｓ１５のチャンクを個別のファイル(又はオブジェクト)に保存するチャンク個別保存設定時処理を実行する。一方、チャンクを１つのファイル(又はオブジェクト)に結合して保存する設定がされている場合（ステップＳ８：ＹＥＳ）には、ステップＳ１６～Ｓ２２のチャンク結合保存設定時処理を実行する。

チャンク個別保存設定時処理においては、ＣＰＵ２４は、全てのチャンクファイルのそれぞれを対象にループＣの処理（ステップＳ９，Ｓ１０）を実行する。

ループＣの処理では、ＣＰＵ２４は、処理対象のチャンクファイルに対するクラウドストレージ３０におけるファイル識別子を生成し（ステップＳ９）、チャンクマップ２５７Ａのチャンクファイルに対応するエントリに生成したファイル識別子を書き込む（ステップＳ１０）。具体的には、ファイル識別子を、チャンクファイル識別子２５７３に格納する。

ＣＰＵ２４は、ループＣの処理を、各チャンクファイルを対象に実行し、全てのチャンクファイルに対してループＣの処理を実行した場合には、処理をステップＳ１１に進める。

ステップＳ１１では、ＣＰＵ２４は、チャンクマップ２５７Ａを符号化して格納する設定か否かを判定する。この結果、チャンクマップ２５７Ａを符号化して保存する設定であると判定した場合（ステップＳ１１：ＹＥＳ）には、ＣＰＵ２４は、チャンクマップ２５７Ａに対して符号化処理を実行し(ステップＳ１２)、処理をステップＳ１４に進める。一方、チャンクマップ２５７Ａを符号化して保存する設定ではないと判定した場合（ステップＳ１１：ＮＯ）には、ＣＰＵ２４は、何もしないで（ステップＳ１３）、処理をステップＳ１４に進める。

ステップＳ１４では、ＣＰＵ２４は、受け付けたファイル識別子に基づいて、チャンクマップ２５７Ａのファイルのファイル識別子を生成する。

次いで、ＣＰＵ２４は、保存対象のファイルの全てのチャンクファイルと、チャンクマップ２５７Ａについての保存要求をクラウドストレージ３０に送信し、全てのチャンクファイルとチャンクマップ２５７Ａとを送信し（ステップＳ１５）、処理を終了する。これにより、クラウドストレージ３０は、ファイルストレージ２０から送信された全てのチャンクファイルと、チャンクマップとをそれぞれ別々に補助記憶装置３５に格納する。このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

一方、チャンク結合保存設定時処理においては、ＣＰＵ２４は、保存対象のファイルを構成する全てのチャンクファイルを結合する（ステップＳ１６）。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂに、結合時の各チャンクファイルのオフセットを書き込む（ステップＳ１７）。具体的には、ファイルを構成する各チャンクファイルのファイルにおける開始オフセットを、チャンクファイルに対応する各エントリの処理後開始オフセット２５９１に格納し、各チャンクファイルのファイルにおける終了オフセット及び／又は処理後のチャンクサイズを、各チャンクファイルに対応するエントリの処理後終了オフセット（処理後チャンクサイズ）２５９２に格納する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを符号化して格納する設定か否かを判定する（ステップＳ１８）。この結果、チャンクマップ２５７Ｂを符号化して格納する設定であると判定した場合（ステップＳ１８：ＹＥＳ）には、ＣＰＵ２４は、チャンクマップ２５７Ｂに対して符号化処理を実行し、処理をステップＳ２１に進める。一方、チャンクマップ２５７Ｂを符号化して格納する設定ではないと判定した場合（ステップＳ１８：ＮＯ）には、ＣＰＵ２４は、何もしないで（ステップＳ２０）、処理をステップＳ２１に進める。

ステップＳ２１では、ＣＰＵ２４は、受け付けたファイル識別子に基づいて、チャンクマップ２５７Ｂのファイル識別子を生成する。

次いで、ＣＰＵ２４は、保存対象のファイルと、チャンクマップ２５７Ｂについての保存要求をクラウドストレージ３０に送信し、ファイルとチャンクマップ２５７Ｂを送信し（ステップＳ２２）、処理を終了する。これにより、クラウドストレージ３０は、ファイルストレージ２０から送信されたファイルと、チャンクマップとを補助記憶装置３５に格納する。このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次に、部分リード処理について説明する。

図１６は、一実施形態に係る部分リード処理のフローチャートである。

ファイルストレージ２０のＣＰＵ２４は、ユーザからのファイルの一部に対するリード命令をコンピュータ１０から受け付ける（ステップＳ３１）。ここで、リード対象のファイルのファイル識別子と、無処理ファイルにおけるリード部分のオフセット（無処理開始終了オフセット）とが含まれている。

次いで、ＣＰＵ２４は、リード対象のファイルのファイル識別子から、チャンクマップ２５７（２５７Ａ又は２５７Ｂ）のクラウドストレージ３０におけるファイル識別子を特定する（ステップＳ３２）。チャンクマップ２５７のファイル識別子を特定する方法としては、チャンクマップ２５７のファイル識別子の作成方法に基づいて特定してもよく、チャンクマップマップ２５５を参照して特定してもよい。

次いで、ＣＰＵ２４は、チャンクマップ２５７のファイル識別子を指定したチャンクマップの取得要求をクラウドストレージ３０に送信し、クラウドストレージ３０からチャンクマップ２５７を受信する（ステップＳ３３）。なお、この際のクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次いで、ファイルストレージ２０のＣＰＵ２４は、受信したチャンクマップ２５７が符号化されているか否かを判定し（ステップＳ３４）、符号化されている場合（ステップＳ３４：ＹＥＳ）には、受信したチャンクマップに対して逆符号化処理を実行する（ステップＳ３５）。一方、符号化されていない場合（ステップＳ３４：ＮＯ）には、チャンクマップに対して何もしない（ステップＳ３６）。これにより、無処理のチャンクマップ２５７を取得することができる。

次いで、ＣＰＵ２４は、リード対象のファイルを構成するチャンクのチャンクファイルが結合保存されているか否かを判定し（ステップＳ３７）、チャンクファイルが結合保存されていない場合（ステップＳ３７：ＮＯ）には、ステップＳ３８～Ｓ４４のチャンクを個別に保存するチャンク個別保存設定時処理を実行する。一方、チャンクが結合保存されている場合（ステップＳ３７：ＹＥＳ）には、ステップＳ４５～Ｓ４９、及びＳ４４のチャンク結合保存設定時処理を実行する。ここで、チャンクマップファイルが結合保存されているか否かを判定する方法としては、チャンクマップ２５７のエントリの構成に基づいて、チャンクマップ２５７がチャンクマップ２５７Ａ又はチャンクファイル２５７Ｂのいずれかを特定することにより判定してもよく、チャンクマップマップ２５５を参照して特定してもよい。

チャンク個別保存設定時処理においては、ＣＰＵ２４は、チャンクマップ２５７Ａからリード対象のリード部分のオフセットに含まれる無処理開始終了オフセットとなっているチャンクファイルのファイル識別子を特定する（ステップＳ３８）。

次いで、ＣＰＵ２４は、特定した全てのファイル識別子に対応するチャンクファイルのそれぞれを対象にループＤの処理（ステップＳ３９）を実行する。

ループＤでは、ＣＰＵ２４は、処理対象のチャンクファイルに対するファイル識別子を指定して、クラウドストレージ３０にチャンクファイルの取得を要求し、このチャンクファイルを受信する（ステップＳ３９）。なお、このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次いで、ＣＰＵ２４は、処理対象としていないチャンクファイルがある場合には、このチャンクファイルを処理対象として、ループＤの処理を実行し、特定した全てのチャンクファイルに対してループＤの処理を実行した場合には、処理を、取得した各チャンクファイルを対象にループＥの処理（ステップＳ４０～Ｓ４２）に進める。

ループＥでは、ＣＰＵ２４は、受信したチャンクファイルが符号化されているか否かを判定し（ステップＳ４０）、符号化されていると判定した場合（ステップＳ４０：ＹＥＳ）には、受信したチャンクファイルに対して逆符号化処理を実行する（ステップＳ４１）。一方、符号化されていないと判定した場合（ステップＳ４０：ＮＯ）には、チャンクファイルに対して何もしない（ステップＳ４２）。ここで、受信したチャンクファイルが符号化されているか否かについては、チャンクファイルの形式により判定してもよいし、チャンクマップ２５７の処理内容により判定してもよい。

次いで、ＣＰＵ２４は、取得した全てのチャンクファイルを対象としてループＥの処理をしていない場合には、ループＥの処理をしていないチャンクファイルを対象にループＥの処理を実行し、取得した全てのチャンクファイルを対象としてループＥの処理をした場合には、ループＥの処理を行った後の全てのチャンクファイルを結合し（ステップＳ４３）、結合した無処理チャンクファイルからリード部分を特定して抽出し、リード命令元のコンピュータ１０に対してリード部分のデータを送信し（ステップＳ４４）、処理を終了する。このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

一方、チャンク結合保存設定時処理においては、ＣＰＵ２４は、チャンクマップ２５７Ｂからリード対象のリード部分のオフセットに含まれる無処理開始終了オフセットとなっている１以上（又は全ての）のチャンクについてのファイル中における処理後開始終了オフセットを特定する（ステップＳ４５）。

次いで、ＣＰＵ２４は、リード対象のファイルのファイル識別子と、リード部分のチャンクの処理後開始終了オフセットとを指定して、チャンクファイルの送信要求をクラウドストレージ３０に送信し、対応するチャンクファイルを受信する（ステップＳ４６）。なお、この際のクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次いで、ＣＰＵ２４は、受信したチャンクファイルが符号化されているか否かを判定し（ステップＳ４７）、符号化されている場合（ステップＳ４７：ＹＥＳ）には、受信したチャンクファイルに対して逆符号化処理を実行する（ステップＳ４８）。一方、符号化されていない場合（ステップＳ４７：ＮＯ）には、チャンクファイルに対して何もしない（ステップＳ４９）。これにより、無処理のチャンクファイルを取得することができる。ここで、受信したチャンクファイルが符号化されているか否かについては、チャンクファイルの形式により判定してもよいし、チャンクマップ２５７の処理内容により判定してもよい。なお、受信したチャンクファイルが複数のチャンクファイルを結合した形式であって、各チャンクファイルの処理内容が異なる場合や、同一の処理内容（例えば、同一の符号化処理）であっても結合した状態で逆符号化処理ができない場合には、受信したチャンクファイル中のそれぞれのチャンクを処理後開始終了オフセットに基づいて特定し、それぞれのチャンクをチャンクファイルとして作成し、それぞれのチャンクファイルに対して、ステップＳ４７～Ｓ４９の処理を行い、処理後のチャンクファイルを結合する。

次いで、ＣＰＵ２４は、チャンクファイルからリード部分を特定してリード部分のデータを抽出し、リード命令元のコンピュータ１０に対してリード部分のデータを送信し（ステップＳ４４）、処理を終了する。

次に、部分更新処理の処理動作について説明する。

図１７は、一実施形態に係る部分更新処理の第１のフローチャートである。図１８は、一実施形態に係る部分更新処理の第２のフローチャートである。

部分更新処理は、ファイルストレージ２０が、リード命令に基づいて、リード部分をコンピュータ１０に送信した後、コンピュータ１０からリード部分のデータに対する更新を受け取ったときに実行される処理である。本例では、図１６に示す部分リード処理が行われた後に、リード部分に対して更新がされる場合の処理について説明する。

ＣＰＵ２４は、ユーザからの更新するファイルのファイル識別子をコンピュータ１０から受け付ける（ステップＳ５０）。

次いで、ＣＰＵ２４は、更新差分を部分リードで読み出したチャンクファイルに反映させる（ステップＳ５１）。具体的には、ＣＰＵ２４は、更新差分を含むリード部分に対して、読み出したチャンクファイルのリード部分以外の部分を結合する。

次いで、ＣＰＵ２４は、結合したファイルの中で差分のあるチャンクを検出する（ステップＳ５２）。

次いで、ＣＰＵ２４は、全ての差分のあるチャンク（差分チャンク）のそれぞれを対象に、ループＦの処理（ステップＳ５３～Ｓ５５）を実行する。

ループＦの処理では、ＣＰＵ２４は、対象とする差分チャンクが、他の差分チャンクと連続しているか否かを判定する（ステップＳ５３）。この結果、他の差分チャンクと連続している場合（ステップＳ５３：ＹＥＳ）には、対象とする差分チャンクと連続している他の差分チャンクとを結合して一時チャンクを作成する（ステップＳ５４）。一方、他の差分チャンクと連続していない場合（ステップＳ５３：ＮＯ）には、対象の差分チャンクを一時チャンクとする（ステップＳ５５）。

次いで、ＣＰＵ２４は、全ての差分チャンクを対象としてループＦの処理をしていない場合には、このループＦの処理をしていない差分チャンクを対象にループＦの処理を実行する。一方、全ての差分チャンクを対象としてループＦの処理をした場合には、ＣＰＵ２４は、処理を、全ての一時チャンクを対象にループＧの処理（ステップＳ５６～Ｓ６０）に進める。

ループＧの処理では、ＣＰＵ２４は、一時チャンクを分割するか否かを判定する（ステップＳ５６）。
なお、一時チャンクを分割するか否かについては、デフォルトの設定に従ってもよいし、ユーザの設定や指示に従ってもよく、一時チャンクが所定サイズ以上であれば分割するように決定してもよい。

次いで、ＣＰＵ２４は、一時チャンクを分割すると判定した場合（ステップＳ５６：ＹＥＳ）には、一時チャンクの先頭からのデータに対して、ループＨの処理（ステップＳ５７，Ｓ５８）を実行する。

ループＨの処理では、ＣＰＵ２４は、一時チャンクについて未処理の先頭から所定のサイズのデータを分割してチャンク（更新チャンク）として作成し（ステップＳ５７）、チャンクマップ２５７に作成した更新チャンクのオフセットを書き込む（ステップＳ５８）。

ＣＰＵ２４は、一時チャンクの全体のデータに対してループＨの処理を実行していない場合には、ループＨの処理を実行し、一時チャンクの全体に対してループＨの処理を実行した場合には、ループＨの処理を抜ける。

一方、一時チャンクを分割すると判定しなかった場合（ステップＳ５６：ＮＯ）には、ＣＰＵ２４は、何もせずに、一時チャンクを更新チャンクとし（ステップＳ５９）、チャンクマップ２５７に更新チャンクのオフセットを書き込む（ステップＳ６０）。

ループＨの処理を抜けた場合、又はステップＳ６０を実行した場合には、ＣＰＵ２４は、未処理の一時チャンクがあれば、ループＧの処理（ステップＳ５６～Ｓ６０）を実行し、全ての一時チャンクに対してループＧの処理を行った場合には、更新チャンク毎にループＩの処理（ステップＳ６１～Ｓ６４）を実行する。

ループＩの処理では、ＣＰＵ２４は、更新チャンクのファイル（更新チャンクファイル）を作成し（ステップＳ６１）、処理対象の更新チャンクファイルに対して、符号化を実行するか否かを判定する（ステップＳ６２）。この結果、処理対象の更新チャンクファイルに対して、符号化を実行すると判定した場合（ステップＳ６２：ＹＥＳ）には、ＣＰＵ２４は、処理対象の更新チャンクファイルに対して符号化処理を実行する（ステップＳ６３）。一方、符号化を実行しないと判定した場合（ステップＳ６２：ＮＯ）には、更新チャンクファイルに対して何もしない（ステップＳ６４）。

ＣＰＵ２４は、ループＩの処理をそれぞれの更新チャンクのチャンクファイルを対象にループＩの処理を実行し、全ての更新チャンクのチャンクファイルを対象にループＩの処理を実行した場合には、処理を図１８のステップＳ６５に進める。

ステップＳ６５では、ＣＰＵ２４は、クラウドストレージ３０において、ファイルを構成するチャンクのチャンクファイルを結合して保存するチャンク結合保存設定がされているか否かを判定する。この結果、チャンク結合保存設定がされていない場合（ステップＳ６５：ＮＯ）には、ＣＰＵ２４は、ステップＳ６６～Ｓ７２のチャンクを個別に保存するチャンク個別保存設定時処理を実行する。一方、チャンクを結合して保存する設定がされている場合（ステップＳ６５：ＹＥＳ）には、ステップＳ７３～Ｓ８４のチャンク結合保存設定時処理を実行する。

チャンク個別保存設定時処理においては、ＣＰＵ２４は、全ての更新チャンクファイルを対象にループＪの処理（ステップＳ６６，Ｓ６７）を実行する。

ループＪの処理では、ＣＰＵ２４は、処理対象の更新チャンクファイルに対するファイル識別子を生成し（ステップＳ６６）、チャンクマップ２５７Ａの更新チャンクファイルに対応するエントリに生成したファイル識別子を書き込む（ステップＳ６７）。

ＣＰＵ２４は、ループＪの処理を、各更新チャンクファイルを対象に実行し、全ての更新チャンクファイルに対してループＪの処理を行った場合には、処理をステップＳ６８に進める。

ステップＳ６８では、ＣＰＵ２４は、チャンクマップ２５７Ａを符号化して格納する設定か否かを判定する。この結果、チャンクマップ２５７Ａを符号化して格納する設定であると判定した場合（ステップＳ６８：ＹＥＳ）には、ＣＰＵ２４は、チャンクマップ２５７Ａを符号化する符号化処理を実行し（ステップＳ６９）、処理をステップＳ７１に進める。一方、チャンクマップ２５７Ａを符号化して格納する設定ではないと判定した場合（ステップＳ６８：ＮＯ）には、ＣＰＵ２４は、何もしないで（ステップＳ７０）、処理をステップＳ７１に進める。

ステップＳ７１では、ＣＰＵ２４は、受け付けたファイル識別子に基づいて、チャンクマップ２５７Ａのファイル識別子を生成する。

次いで、ＣＰＵ２４は、全ての更新チャンクファイルと、チャンクマップ２５７Ａについての保存要求をクラウドストレージ３０に送信し、全ての更新チャンクファイルとチャンクマップ２５７Ａを送信し（ステップＳ７２）、処理を終了する。これにより、クラウドストレージ３０は、ファイルストレージ２０から送信された全ての更新チャンクファイルと、チャンクマップとをそれぞれ別々に補助記憶装置３５に格納する。なお、この際のクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

一方、チャンク結合保存設定時処理においては、ＣＰＵ２４は、全ての非更新チャンクのそれぞれを対象にループＫの処理（ステップＳ７３，Ｓ７４）を実行する。ここで、非更新チャンクとは、ファイルを構成するチャンクの中で更新されている部分を含まないチャンクのことをいう。

ループＫの処理では、ＣＰＵ２４は、チャンクマップ２５７Ｂから非更新チャンクの処理後開始終了オフセットを特定する（ステップＳ７３）。

次いで、ＣＰＵ２４は、更新ファイルのファイル識別子と、処理後開始終了オフセットとを指定して、非更新チャンクのコピー要求を行う（ステップＳ７４）。

ＣＰＵ２４は、ループＫの処理を行っていない非更新チャンクを対象に、ループＫの処理を実行し、全ての非更新チャンクに対してループＫの処理を実行した場合には、処理をステップＳ７５に進める。

ステップＳ７５では、ＣＰＵ２４は、連続した更新チャンクのファイルを結合する。なお、連続した更新チャンクファイルを結合しなくてもよい。

次いで、ＣＰＵ２４は、全ての更新チャンクファイルについての保存要求をクラウドストレージ３０に送信し、全ての更新チャンクファイルを送信する（ステップＳ７６）。これにより、クラウドストレージ３０では、更新チャンクファイルが保存される。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂに基づいて、ファイルを構成する非更新チャンクファイル及び更新チャンクファイルの結合順を特定し（ステップＳ７７）、チャンクファイル（更新チャンク、非更新チャンク）のファイル識別子とそれらチャンクファイルの結合順（例えばオフセット）とを指定して、ファイルを構成する全てのチャンクファイルの結合要求をクラウドストレージ３０に送信する（ステップＳ７８）。なお、ファイルを構成する非更新チャンクファイルがない場合には、ステップＳ７７及びステップＳ７８では、非更新チャンクファイルを除いた更新チャンクファイルを対象に処理をする。これにより、クラウドストレージ３０は、更新後のチャンクファイルが結合されたファイルを補助記憶装置３５に格納する。このクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂに各チャンクファイルのファイルにおける処理後開始終了オフセットを書き込む（ステップＳ７９）。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂを符号化して格納する設定か否かを判定する（ステップＳ８０）。この結果、チャンクマップ２５７Ｂを符号化して格納する設定であると判定した場合（ステップＳ８０：ＹＥＳ）には、ＣＰＵ２４は、チャンクマップ２５７Ｂに対して符号化処理を実行し（ステップＳ８１）、処理をステップＳ８３に進める。一方、チャンクマップ２５７Ｂを符号化して格納する設定ではないと判定した場合（ステップＳ８０：ＮＯ）には、ＣＰＵ２４は、何もしないで（ステップＳ８２）、処理をステップＳ８３に進める。

ステップＳ８３では、ＣＰＵ２４は、受け付けたファイル識別子に基づいて、チャンクマップ２５７Ｂのファイル識別子を生成する。

次いで、ＣＰＵ２４は、チャンクマップ２５７Ｂについての保存要求をクラウドストレージ３０に送信し、チャンクマップ２５７Ｂを送信し（ステップＳ８４）、処理を終了する。これにより、クラウドストレージ３０は、ファイルストレージ２０から送信された更新後のファイルについてのチャンクマップ２５７Ｂを補助記憶装置３５に格納する。なお、この際のクラウドストレージ３０側における処理の機能は、一般的なクラウドストレージが備えている基本的な機能で実現できる。

以上説明したように、上記した実施形態に係るコンピュータシステム１によると、ファイルの分割したチャンク毎に、符号化させて、或いは、符号化させないでクラウドストレージ３０に保存させるようにすることができる。また、ファイルの一部分をリードする場合においては、ファイルのチャンクの少なくとも１つが符号化されている場合であっても、クラウドストレージ３０からは、リード部分を含むチャンクのみを読み出せば、必要なデータを得ることができ、クラウドストレージ３０とファイルストレージ２０との間での通信のデータ量を削減することができる。また、クラウドストレージ３０においては、符号化処理や、逆符号化処理を行わずに済むのでこれら機能を備えていなくてもよい。また、ファイルストレージ２０からの要求に必要なクラウドストレージ３０の機能は、一般的なクラウドストレージが有する基本的な機能で実現でき、クラウドストレージの仕様による制約を受けないので、クラウドストレージ３０としては、種々のクラウドストレージを利用することができる。

なお、本発明は、上記実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。

例えば、上記実施形態では、ファイルストレージ２０は、クラウドストレージ３０において、ファイルを構成するチャンクを結合して格納するか否かを設定に応じて替えることができる構成としていたが、本発明はこれに限られず、ファイルストレージ２０を、ファイルを構成するチャンクを結合して格納するか、結合しないで格納するかのいずれかに固定された構成としてもよい。

また、上記実施形態における図１０及び図１３に示す部分更新処理は、リード命令に基づいて、クラウドストレージ３０からデータを読み出して、リード部分を、例えば、コンピュータ１０にファイルストレージ２０から送信した後、コンピュータ１０からリード部分のデータに対する更新を受け取ったときに実行される処理としていたが、本発明はこれに限られず、例えば、ファイルストレージ２０にリード命令に対応するファイルの複数のチャンク（少なくともリード部分を含むチャンク）が格納されている場合に、ファイルストレージ２０からリード部分を含むチャンクを読み出し、そのチャンクからリード部分を特定してコンピュータ１０に送信し、コンピュータ１０から送信したリード部分のデータに対する更新を受け取ったときに実行される処理としてもよい。

また、上記実施形態では、符号化処理として、主に圧縮処理及び／又は暗号化処理を例に説明していたが、これに限定されず、他の符号化処理を含んでもよく、例えば、データに対して、誤り検出訂正符号（ＥＣＣ：ＥｒｒｏｒＣｏｒｒｅｃｔｉｏｎＣｏｄｅ）を算出してデータに付加する処理や、消失訂正符号を算出して付加する処理であってもよい。

また、上記実施形態におけるファイルストレージ２０の機能を、ユーザが使用するコンピュータ１０に組み込んでもよい。このように、コンピュータ１０がファイルストレージ２０の機能が組み込まれている場合には、このコンピュータ１０は、特許請求の範囲のファイルストレージに相当する。例えば、ファイルストレージ２０の機能を、ユーザが使用するコンピュータ１０に組み込んだ場合においては、コンピュータシステム１に、ファイルストレージ２０を備えていなくてもよい。

また、上記実施形態において、ＣＰＵが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な記憶メディア（例えば可搬型の記憶メディア）であってもよい。

１…コンピュータシステム、１０…コンピュータ、２０…ファイルストレージ、２１…処理装置、２２…周辺装置、２３…主記憶装置、２４…ＣＰＵ、２５…補助記憶装置、２６…ネットワークカード、２７…バス、３０…クラウドストレージ、４０…ＬＡＮ、５０…ネットワーク

Claims

データを格納するデータストレージに接続され、ファイルを管理するファイルストレージであって、
前記ファイルストレージはプロセッサを有し、
前記プロセッサは、
前記ファイルを複数のチャンクに分割して、前記チャンクの中の少なくとも１つに対して符号化処理を実行して符号化チャンクとし、前記符号化チャンクを含む前記ファイルの複数のチャンクを前記データストレージに格納させ、
前記データストレージに格納させたファイルの一部のデータを対象とするリード命令を受け付けた場合に、前記リード命令の対象となるデータを含むリード対象チャンクを前記データストレージから取得し、
前記リード対象チャンクの中に符号化チャンクが含まれている場合に、前記符号化チャンクに対して逆符号化処理を実行し、逆符号化処理されたチャンクを含むリード対象チャンクからリード対象のデータを特定して前記リード命令の命令元に渡す
ファイルストレージ。
前記プロセッサは、
前記リード対象のデータが更新された場合に、前記リード対象チャンクのリード対象のデータに対して更新後のデータを反映させて更新後チャンクを作成し、
前記更新後チャンクを前記ファイルのリード対象チャンクに代わるチャンクとして、前記データストレージに格納させる
請求項１に記載のファイルストレージ。
前記チャンク毎の前記データストレージに対して格納する際の符号化処理の有無に関する符号化処理情報を記憶する記憶部をさらに備え、
前記プロセッサは、
前記チャンクに対して前記符号化処理情報に基づいて、前記データストレージに格納させる前記チャンクに対する前記符号化処理の実行を決定する
請求項１に記載のファイルストレージ。
前記プロセッサは、
前記ファイルを複数のチャンクに分割し、
前記分割した各チャンクのファイルにおける位置を特定する位置情報を示すチャンクマップを記憶部に格納し、
前記リード命令を受け付けた場合に、前記チャンクマップに基づいてリード対象チャンクを特定し、前記データストレージから取得する
請求項１に記載のファイルストレージ。
前記プロセッサは、
前記ファイルを各チャンクのサイズが所定の範囲となるように分割する
請求項１に記載のファイルストレージ。
前記プロセッサは、
前記リード対象チャンクのリード対象のデータに対して更新後のデータを反映させて更新後チャンクを作成し、
前記更新後チャンクを複数のチャンクに分割し、分割したチャンクを前記ファイルのリード対象チャンクに代わるチャンクとして、前記データストレージに格納させる
請求項２に記載のファイルストレージ。
前記プロセッサは、
前記ファイルを構成する前記チャンク毎に独立して前記データストレージに格納させる
請求項１に記載のファイルストレージ。
前記プロセッサは、
前記ファイルを構成する全ての前記チャンクを結合させて前記データストレージに格納させる
請求項１に記載のファイルストレージ。
前記プロセッサは、
前記ファイルを構成する全ての前記チャンクの前記符号化処理後の位置情報を特定し、前記チャンク毎の前記符号化処理後の位置情報を含むチャンクマップを記憶部に格納し、
前記チャンクマップに基づいて、結合されたチャンクの中から前記リード対象チャンクを特定する
請求項８に記載のファイルストレージ。
前記符号化処理は、
データを圧縮する圧縮処理、データを暗号化する暗号化処理、誤り検出訂正符号を算出して付加する処理、又は消失訂正符号を算出して付加する処理の少なくともいずれか１つである
請求項１に記載のファイルストレージ。
データを格納するデータストレージに接続され、ファイルを管理するファイルストレージであって、
前記データストレージには、前記ファイルを構成する複数のチャンクが格納され、複数の前記チャンクの中の少なくとも１つは、符号化処理が実行された符号化チャンクを含み、
前記ファイルストレージは、前記ファイルを構成する複数のチャンクを格納し、
前記ファイルストレージはプロセッサを有し、
前記プロセッサは、
前記データストレージに格納されたファイルの一部のデータを対象とするリード命令を受け付けた場合に、前記リード命令の対象となるデータを含むリード対象チャンクが前記ファイルストレージに格納されていれば、前記ファイルストレージから前記リード対象チャンクを読み出し、前記リード対象チャンクからリード対象のデータを特定して前記リード命令の命令元に渡し、
前記リード対象のデータが更新された場合に、前記リード対象チャンクのリード対象のデータに対して更新後のデータを反映させて更新後チャンクを作成し、
前記更新後チャンクを前記ファイルのリード対象チャンクに代わるチャンクとして、前記データストレージに格納させる
ファイルストレージ。
データを格納するデータストレージと、ファイルを管理するファイルストレージとを備えるコンピュータシステムであって、
前記ファイルストレージはプロセッサを有し、
前記ファイルストレージのプロセッサは、
前記ファイルを複数のチャンクに分割して、前記チャンクの中の少なくとも１つに対して符号化処理を実行して符号化チャンクとし、前記符号化チャンクを含む前記ファイルの複数のチャンクを前記データストレージに格納させ、
前記データストレージに格納させたファイルの一部のデータを対象とするリード命令を受け付けた場合に、前記リード命令の対象となるデータを含むリード対象チャンクを前記データストレージから取得し、
前記リード対象チャンクの中に符号化チャンクが含まれている場合に、前記符号化チャンクに対して逆符号化処理を実行し、逆符号化処理されたチャンクを含むリード対象チャンクからリード対象のデータを特定して前記リード命令の命令元に渡す
コンピュータシステム。
前記ファイルストレージのプロセッサは、
前記リード対象のデータが更新された場合に、前記リード対象チャンクのリード対象のデータに対して更新後のデータを反映させて更新後チャンクを作成し、
前記更新後チャンクを前記ファイルのリード対象チャンクに代わるチャンクとして、前記データストレージに格納させる
請求項１２に記載のコンピュータシステム。