JP2010250760A - ファイル格納システム、サーバ装置及びプログラム - Google Patents

ファイル格納システム、サーバ装置及びプログラム Download PDF

Info

Publication number
JP2010250760A
JP2010250760A JP2009102239A JP2009102239A JP2010250760A JP 2010250760 A JP2010250760 A JP 2010250760A JP 2009102239 A JP2009102239 A JP 2009102239A JP 2009102239 A JP2009102239 A JP 2009102239A JP 2010250760 A JP2010250760 A JP 2010250760A
Authority
JP
Japan
Prior art keywords
file
summary information
information
terminal device
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009102239A
Other languages
English (en)
Other versions
JP4386459B1 (ja
Inventor
Makoto Goto
誠 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2009102239A priority Critical patent/JP4386459B1/ja
Application granted granted Critical
Publication of JP4386459B1 publication Critical patent/JP4386459B1/ja
Publication of JP2010250760A publication Critical patent/JP2010250760A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザがファイルの要約情報の送信によりファイルの送信と同じ効果を得る場合、要約情報の送信時にサーバにファイルが格納されていなくても、ユーザにアクセス権を付与できるファイル格納システムを提供すること。
【解決手段】第1端末装置21からファイルの重複排除型アップロードを試行する際、要約情報が要約情報送信手段12で送信され、サーバ装置3の要約情報格納手段32に格納される。第2端末装置22からファイルの通常アップロードを行う際、ファイルが送信手段25で送信され、サーバ装置3のファイル格納手段34に格納される。ファイル格納手段34のファイルから要約参照情報生成手段35で要約参照情報が生成され、この要約参照情報と要約情報格納手段32の要約情報との同一性が同一性判定手段36で判定される。判定結果が肯定的であると、アクセス権付与手段37でユーザにファイルのアクセス権が付与される。
【選択図】図2

Description

本発明は、例えばオンラインストレージサービスに用いられるファイル格納システムに関する。
不特定多数のユーザを対象に、インターネットなどの公衆回線を介してファイルを格納するためのディスクスペースを貸し出すオンラインストレージサービスが提供されている。オンラインストレージサービスは、公衆回線へ接続可能な環境があれば利用できるため、自宅や職場等の任意の場所からファイルの保存及び読み出しを行う用途や、異なるユーザ間でファイルの受け渡しを行う用途等に活用されている。
しかしながら、現在のオンラインストレージサービスでは、ファイルの格納コストや通信コスト、および、通信時間の問題があるため、ユーザがディスクスペースに格納できるファイルの数は比較的少なく、また、ファイルサイズは数百メガバイト程度に制限される。
ところで、イントラネット等のように閉じたネットワーク内で用いられるファイルバックアップシステムでは、巨大なファイルをディスクスペースに保管する際の格納コストを低減するため、重複排除技術が採用されている。すなわち、端末装置において、ファイルやファイル断片(以下、ファイルはファイル断片を含むものとする)をハッシュ値などの要約情報と一体化して管理し、ファイルをアップロードしようとする前に、要約情報をサーバに送信する。サーバが、要約情報に対応するファイルが既にファイル格納装置に格納されていると判断すると、既に格納されたファイルにリンクを張る。これにより、端末装置からサーバへのファイルのアップロードを行うことなく、端末装置がファイルのアップロードを行ったのと同じ効果を奏するようにしている。サーバが、要約情報に対応するファイルがファイル格納装置に未格納であると判断したときにのみ、ファイルのアップロードを開始する。こうして、同一ファイルのアップロードの重複を防ぐことにより、バックアップにかかる時間や、通信資源の消費や、格納資源の消費を節約している。その結果、巨大なファイルをディスクスペースに保管可能としても、通信資源や格納資源を節約することができる。
このような重複排除技術を、公衆回線を介したオンラインストレージサービスに利用することにより、ファイルの格納コストや通信コストを低減し、通信時間を短縮して、巨大なファイルの大量保管が可能となり得る。
オンラインストレージサービスに重複排除技術を適用した従来技術としては、以下の特許文献に記載されたものがある。
特表2004−514968号公報
オンラインストレージサービスが、不特定多数のユーザを対象として公衆回線を介して提供される場合、組織内ネットワーク内で提供される場合とは異なり、通信条件はユーザごとに相違するのが一般的である。通信速度の遅い回線を用いるユーザが、数百メガバイトから数ギガバイトの大きさを有する巨大ファイルをアップロードする場合、サーバに同一のファイルが未格納であると、多大な手間を被る場合がある。すなわち、このユーザは、巨大ファイルのアップロードを試みたとき、該当ファイルと同じファイルがサーバに未格納の場合には、ファイルのアップロードは行わず、後に、リンクの取得を再試行する可能性がある。しかしながら、このユーザは、アップロードしようとするファイルと同じファイルが、サーバにいつ格納されるのかを知ることができないので、ファイルが格納されるまでリンクの取得の再試行を繰り返すこととなり、手間と時間がかかる問題がある。また、この場合、オンラインストレージサービスの提供者は、サーバへのアクセス数の増大により、システムへの負荷が増大する問題がある。
そこで、本発明の課題は、ユーザがファイルの要約情報の送信によりファイルの送信と同じ効果を得る場合、要約情報の送信時にサーバにファイルが格納されていなくても、ユーザにアクセス権を付与してダウンロードが可能な状態にできるファイル格納システムを提供することにある。
本明細書において、一般的なファイル格納システムが行うように、ファイルをユーザの端末装置からサーバ装置が受信して格納し、格納した上記ファイルのアクセス権をユーザに付与することを「通常アップロード」と呼ぶ。これに対して、ユーザの端末装置からファイルの要約情報を受信し、ファイルを受信することなく、サーバ装置に格納されているファイルのアクセス権をユーザに付与することを「重複排除型アップロード」と呼ぶ。また、ユーザの端末装置からサーバが受信した要約情報がサーバ装置に格納されているが、ファイルのアクセス権がユーザに付与されていない状態を、重複排除型アップロードが「保留」された状態と呼ぶ。保留された重複排除型アップロードは、他のユーザによって上記ファイルと同じファイルが通常アップロードされた後に、再開されて完了される。
上記課題を達成するため、本発明の第1の側面によるファイル格納システムは、ネットワークを介して互いに接続される第1端末装置と第2端末装置とサーバ装置を含むファイル格納システムであって、
上記第1端末装置は、
ファイルを要約して要約情報を生成する要約情報生成手段と、
上記要約情報生成手段によって生成された要約情報を送信する要約情報送信手段とを有し、
上記第2端末装置は、
ファイルを送信するファイル送信手段を有し、
上記サーバ装置は、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有し、
上記同一性判定手段は、上記ファイル受信手段によるファイルの受信を契機として、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定することを特徴としている。
また、本発明の第2の側面によるファイル格納システムは、
ネットワークを介して互いに接続される第1端末装置と第2端末装置とサーバ装置を含むファイル格納システムであって、
上記第1端末装置は、
ファイルを要約して要約情報を生成する要約情報生成手段と、
上記要約情報生成手段によって生成された要約情報を送信する要約情報送信手段とを有し、
上記第2端末装置は、
ファイルを送信するファイル送信手段を有し、
上記サーバ装置は、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有し、
上記同一性判定手段は、同一性を判定するバッチ処理を断続的に実行し、各バッチ処理において、前回のバッチ処理が実行されたとき以降に上記ファイル受信手段によって受信されたファイルについて、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定することを特徴としている。
上記構成によれば、第1端末装置で要約情報生成手段によってファイルが要約された要約情報が生成され、この要約情報が要約情報送信手段によってサーバ装置に送信される。要約情報の送信により、第1端末装置の重複排除型アップロードが試行される。サーバ装置では、要約情報受信手段が第1端末装置から受信した要約情報が、要約情報の送信元を識別する送信元識別情報と関連付けられて要約情報格納手段に格納される。このとき、第1端末装置からの重複排除型アップロードが保留された状態となる。この後、サーバ装置は、第1端末装置を操作するユーザと異なるユーザが操作する第2端末装置から、上記の第1端末装置のファイルと実質的に同じファイルを受信すると、すなわち、第2端末装置からサーバ装置へ、上記ファイルの通常アップロードが行われると、サーバ装置は、第2端末装置から受信したファイルをファイル格納手段に格納する。また、上記第2端末装置から受信したファイルから要約参照情報生成手段によって要約参照情報を生成する。この要約参照情報と、要約情報格納手段に格納された要約情報とが同一であるかどうかを、同一性判定手段によって判定する。同一性判定手段により、要約参照情報と要約情報とが同一であると判定されて判定結果が肯定的であるとき、保留されていた第1端末装置の重複排除型アップロードが再開され、ファイル格納手段に格納されたファイルへのアクセス権が、上記要約情報に関連付けられて要約情報格納手段に格納されている送信元識別情報に対応するユーザに付与される。こうして、第1端末装置の重複排除型アップロードが完了する。
このように、本発明の第1及び第2の側面によるファイル格納システムによれば、サーバ装置が第1端末装置から要約情報を受信した時点でファイルがファイル格納手段に格納されていなくても、後に上記ファイルと実質的に同じファイルがファイル格納手段に格納された後に、要約情報の送信元である第1端末装置のユーザにアクセス権を付与することができる。したがって、第1端末装置のユーザは、最初の重複排除型アップロードの試行の際に直ぐに重複排除型アップロードが完了しなくても、その後にユーザが操作をすることなく、ファイルのアクセス権を得ることができる。したがって、第2端末装置によってファイルが通常アップロードされるまで第1端末装置が重複排除型アップロードの試行を繰り返す必要が無いので、第1端末装置のユーザの手間を効果的に削除できる。また、サーバ装置は、第1端末装置から要約情報を受信して送信元識別情報と関連付けて要約情報格納手段に格納することにより、第1端末装置からの最初の重複排除型アップロードの試行を受け付けておけば、第1端末装置からアクセスを受けることなく第1端末装置のユーザに事後的にアクセス権を付与できる。したがって、サーバ装置へのアクセス数の増大を防止できるので、ファイル格納システムの負荷の増大を効果的に防止できる。
ここで、上記要約情報とは、ファイルよりも小さいデータサイズを有する情報であって、ファイルの全体を要約する情報である。すなわち、例えば、2つのファイルの間でファイルの実体の任意の1ビットが異なれば、要約情報が異なることが望ましい。さもなければ、正常ファイルに対して1ビットのみが反転した破損ファイルを、正常ファイルと同一視してしまう恐れが生じる。ファイルの全体を対象として、公知の一方向ハッシュ関数を適用すれば、ファイルの全体を要約する要約情報となる。
ここで、上記送信元識別情報とは、要約情報の送信元の第1端末装置を操作するユーザを識別する情報である。送信元識別情報としては、オンラインストレージサービスを提供する上で各ユーザにユニークに付与するユーザIDを使うことができる。或いは、送信元識別情報は、ユーザによって独占的に使用される第1端末装置のIPアドレスや、第1端末装置のユーザに独占的に割り当てられたサーバ装置上のファイルシステムにおける専用領域名等、第1端末装置のユーザを一意に特定できる情報が含まれた情報であればよい。
また、上記要約情報格納手段に格納される要約情報と送信元識別情報は、例えば次のようにして関連付けることができる。
(1)送信元識別情報と要約情報の組からなるリストを作成して保存する。
(2)個々の送信元識別情報に対して、各送信元識別情報に関連付けられる要約情報を収集したリストを保存する。
(3)個々の要約情報に対して、各要約情報に関連付けられる送信元識別情報を収集したリストを作成して保存する。
また、上記同一性判定手段は、第1端末装置から受信されて要約情報格納手段に保存されている要約情報と、ファイルが要約参照情報生成手段で要約されて生成された要約参照情報とが同一であるかを判断することにより、第1端末装置に存在するファイルとファイル格納手段に格納されたファイルとの同一性を判定する。
例えば、第1端末装置で、要約情報生成手段としてのMD5等の公知の一方向ハッシュ関数によってファイルから要約情報を生成する。また、サーバ装置で、要約参照情報生成手段として、第1端末装置で用いたアルゴリズムと同一のアルゴリズムをもつ一方向ハッシュ関数により、ファイルから要約参照情報を生成する。この場合、上記要約情報と要約参照情報が同一であるならば、第1端末装置に存在したファイルとサーバ装置のファイル格納手段に存在するファイルとが同一であると判定される。
上記同一性判定手段は、同一性の判定をする対象である要約情報と要約参照情報のどちらか、または、両方が複数である場合には、必ずしも全ての要約情報と要約参照情報の組について比較を繰り返す必要はなく、それと同等の結果をもたらすアルゴリズムを用いてもよい。例えば、単一の要約参照情報と複数の要約情報を比較する場合には、リレーショナルデータベースで実装された要約情報格納手段から、その要約参照情報と同一の要約情報と関連付けられて格納されている送信元識別情報を検索し、検索にヒットした送信元識別情報をアクセス権の付与対象としてもよい。
また、上記同一性判定手段が要約参照情報と要約情報との同一性を判定するタイミングは、種々の時点に設定できる。例えば、毎日定時に判定してもよい。また、ユーザがログインするタイミングで、このユーザが以前に要約情報格納手段に格納した複数の要約情報に関して同一性を判定してもよい。
また、上記同一性判定手段は、要約情報受信手段が要約情報を受信したときに、ファイル格納手段に格納されている全てのファイルの要約参照情報との同一性を判定し、判定結果が否定的な場合にのみ、要約情報を要約情報格納手段に残すことが望ましい。この場合、要約情報を受信したときに、この要約情報と同一の要約参照情報を有するファイルが既にファイル格納手段に格納されているときには、要約情報を送信したユーザは直ぐにこのファイルのアクセス権を得ることができる。すなわち、重複排除型アップロードが保留状態となるのは、ファイル格納手段に、ユーザが重複排除型アップロードを行おうとするファイルと実質的に同一のファイルが未格納のときのみである。
また、上記同一性判定手段は、ファイル受信手段がファイルを受信したときに、このファイルの要約参照情報を生成し、上記要約情報格納手段に格納されている全ての要約情報との同一性を判定することが好ましい。この場合、例えば、上記要約情報格納手段に、個々の要約情報に対して、各要約情報に関連付けられる送信元識別情報を収集したリストを作成して保存しておき、上記同一性判定手段は、ファイル受信手段が受信したファイルの要約参照情報と同一の要約情報に関連付けられた送信元識別情報のリストを取得する。取得されたリストに含まれる送信元識別情報に対応するユーザに対して、迅速に重複排除型アップロードの保留状態を解除して重複排除型アップロードを再開させることができる。
一実施形態のファイル格納システムは、上記第1端末装置は、
上記要約情報生成手段が、検証因子に基づいてファイルを要約し、
上記サーバ装置は、
上記要約情報格納手段が、要約情報に関連付けて検証因子を格納し、
上記要約参照情報生成手段が、上記要約情報格納手段に格納された検証因子に基づいてファイルを要約する。
上記実施形態によれば、第1端末装置で、要約情報生成手段によって検証因子に基づいてファイルが要約されて要約情報が生成され、この要約情報が要約情報送信手段によって送信される。サーバ装置で、要約情報受信手段によって要約情報が受信され、この要約情報に関連付けて検証因子が要約情報格納手段に格納される。要約参照情報生成手段により、上記要約情報格納手段に格納された検証因子に基づいて、第2端末装置から受信されたファイルが要約されて、要約参照情報が生成される。こうして検証因子に基づいて生成された要約情報と、検証因子に基づいて生成された要約参照情報との同一性が同一性判定手段で判定され、判定結果が肯定的であるときに、第1端末装置のユーザにファイルのアクセス権が付与される。上記要約情報は、第1端末装置にファイルが存在しなければ生成されないから、サーバ装置で同一性判定手段の判定結果が肯定的であれば、第1端末装置にファイルが存在したことを確認できる。すなわち、ユーザは第1端末装置でファイルにアクセスが可能であったことを確認できる。したがって、要約情報のみを有してファイルを有しないユーザが、要約情報をサーバ装置に送信してアクセス権を不正に取得する不都合を防止できる。
ここで、上記検証因子とは、ファイルを要約するときに与えられるパラメータであり、以下の2つの条件を満たす必要がある。
(1)第1端末装置とサーバ装置で共有可能な情報である。
(2)第1端末装置で自由に設定できない情報である。例えば、ユーザが自由に設定できる状態のログインパスワードなどは、この条件を満たさない。第1端末装置で自由に設定できない検証因子の例としては、セッション開始日時、ユーザID及び第1端末装置のIPアドレスのいずれか、あるいは、これらのうちの2つ以上の組み合わせがある。なお、一つのセッションで複数のファイルをアップロードする場合、全てのファイルに対して同じ検証因子を使用してもよく、複数のファイルのうちの一部のファイルに異なる検証因子を使用してもよい。また、アップロードしようとするファイル毎にすべて検証因子を切り替えてもよい。
上記検証因子としては、サーバ装置に設けた乱数生成手段で生成された乱数を用いることができる。この検証因子としての乱数を、第1端末装置に送信することにより、サーバ装置と第1端末装置とで共有することができる。
また、上記要約情報格納手段に格納される送信元識別情報が、検証因子の一部または全部を兼ねてもよい。
また、上記要約情報格納手段には、検証因子に替えて、検証因子を一意に復元できる別の情報を格納してもよい。例えば、検証因子をビット反転させた情報を格納してもよい。
また、上記要約情報は、ファイルと検証因子に基づいて生成された検証用部分と、ファイルのみに基づいて生成された検索用部分とを有するのが好ましい。これと共に、上記要約参照情報が、ファイルのみに基づいて生成された検索用部分と、ファイルと検証因子とに基づいて生成された検証用部分とを有するのが好ましい。なぜならば、予め検索用部分の比較により絞り込み検索をすることによって、検証因子毎に生成しなければならない要約参照情報検証用部分の生成回数を抑えることができるからである。
なお、検証用部分、検索用部分のそれぞれは、必ずしもファイルの全体を要約する必要はないが、要約情報の全体としては、ファイルの全体を要約しなければならない。例えば、検索用部分がファイルの前半を要約し、検証用部分がファイルの後半を要約してもよい。検索用部分がファイルの全体を要約する場合は、検証用部分はファイルを要約しなくてもよい。この場合、例えば、検証用部分は検証因子に基づいて抽出されたファイルの部分であってもよい。一方、検証用部分がファイルの全体を要約する場合は、検索用部分はファイルを要約しなくてもよい。この場合、例えば、サービスを利用するユーザに対してファイルの入手後にファイル名を変更しないように通知した上で、ファイル名を検索用部分として用いることもできる。
第1端末装置のユーザが重複排除型アップロードを試行するとき、第1端末装置からサーバ装置へ送信された要約情報の検索用部分に基づいて、同一性判定手段による処理の第1段階として、ファイル格納手段に格納されたファイルが検索される。検索結果が肯定的である場合、検索されたファイルと検証因子とに基づいて、要約参照情報生成手段により、要約参照情報の検証用部分が生成される。同一性判定手段による処理の第2段階により、要約情報の検証用部分と、要約参照情報の検証用部分との同一性が判定される。同一性判定手段による第1段階と第2段階の処理が双方とも肯定的なときには、要約情報の全体と要約参照情報の全体が同一であると判定されたため、同一性判定手段の全体的な判定結果が肯定的となる。同一性判定手段による判定結果が肯定的である場合、アクセス権付与手段により、要約情報格納手段に格納された送信元識別情報に対応するユーザに、アクセス権が付与される。
一方、同一性判定手段の第1段階の処理において要約情報の検索用部分に基づくファイルの検索結果が否定的であった場合や、同一性判定手段の第2段階の処理において要約情報の検証用部分と、要約参照情報の検証用部分との同一性の判定結果が否定的であった場合、第1端末装置のユーザによる重複排除型アップロードが保留される。重複排除型アップロードが保留された後、第2端末装置からファイルが通常アップロードされると、要約参照情報生成手段により、ファイルのみに基づいてファイルが要約されて、要約参照情報の検索用部分が生成される。この要約参照情報の検索用部分に基づいて、要約情報格納手段に格納された要約情報の検索用部分が検索される。検索結果が肯定的である場合、検索された要約情報に対応する検証因子と、ファイルとに基づいて、要約参照情報生成手段により、要約参照情報の検証用部分が生成される。同一性判定手段により、要約情報の検証用部分と、要約参照情報の検証用部分との同一性が判定され、判定結果が肯定的である場合、アクセス権付与手段により、要約情報格納手段に格納された送信元識別情報に対応するユーザに、アクセス権が付与される。
このように、要約情報が、検索用部分と検証用部分とを有し、また、要約参照情報が、検索用部分と検証用部分とを有することにより、サーバ装置のファイル格納手段に格納されたファイルを迅速に検索でき、また、要約情報格納手段に格納された要約情報を迅速に検索でき、しかも、第1端末装置にファイルが存在したことを確認できる。
本発明の第3の側面によるサーバ装置は、ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置であって、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有し、
上記同一性判定手段は、上記ファイル受信手段によるファイルの受信を契機として、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定することを特徴としている。
また、本発明の第4の側面によるサーバ装置は、
ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置であって、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有し、
上記同一性判定手段は、同一性を判定するバッチ処理を断続的に実行し、各バッチ処理において、前回のバッチ処理が実行されたとき以降に上記ファイル受信手段によって受信されたファイルについて、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定することを特徴としている。
本発明の第3の側面の構成によれば、本発明の第1の側面によるファイル格納システムを構成するサーバ装置を提供することができる。また、本発明の第4の側面の構成によれば、本発明の第2の側面によるファイル格納システムを構成するサーバ装置を提供することができる。すなわち、これらのサーバ装置は、第1端末装置から要約情報を受信した時点でファイルがファイル格納手段に格納されていなくても、後に上記ファイルと実質的に同じファイルがファイル格納手段に格納された後に、要約情報の送信元である第1端末装置のユーザにアクセス権を付与することができる。したがって、第1端末装置のユーザの手間を効果的に削除でき、また、第1端末装置からのアクセス数の増大を防止できるので、このサーバ装置を用いて構成するファイル格納システムの負荷の増大を効果的に防止できる。
本発明の第5の側面によるプログラムは、コンピュータを、ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置として機能させるためのプログラムであって、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段として上記コンピュータを機能させると共に、
上記同一性判定手段は、上記ファイル受信手段によるファイルの受信を契機として、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定するように上記コンピュータを機能させることを特徴としている。
また、本発明の第6の側面によるプログラムは、コンピュータを、ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置として機能させるためのプログラムであって、
上記第1端末装置から要約情報を受信する要約情報受信手段と、
上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
上記第2端末装置からファイルを受信するファイル受信手段と、
上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段として上記コンピュータを機能させると共に、
上記同一性判定手段は、同一性を判定するバッチ処理を断続的に実行し、各バッチ処理において、前回のバッチ処理が実行されたとき以降に上記ファイル受信手段によって受信されたファイルについて、上記要約参照情報生成手段によってこのファイルが要約されて生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定するように上記コンピュータを機能させることを特徴としている。
本発明の第5の側面の構成によれば、上記プログラムをコンピュータに実行させることにより、このコンピュータを上記各手段として機能させて、例えば汎用のコンピュータを用いて本発明の第3の側面のサーバ装置を構成し、本発明の第1の側面のファイル格納システムを実現できる。また、本発明の第6の側面の構成によれば、上記プログラムをコンピュータに実行させることにより、このコンピュータを上記各手段として機能させて、例えば汎用のコンピュータを用いて本発明の第4の側面のサーバ装置を構成し、本発明の第2の側面のファイル格納システムを実現できる。
本発明によれば、重複排除型アップロードを試行した第1端末装置のユーザが、サーバ装置にファイルが格納されていないことに起因して重複排除型アップロードが完了しなくても、重複排除型アップロードが保留になり、他のユーザによってファイルの通常アップロードが行われれば重複排除型アップロードが再開されて完了されるので、重複排除型アップロードの再試行のためにサーバ装置にアクセスを繰り返す必要がなくて、ユーザの手間を削減でき、また、ファイル格納システムの負荷の増大を防止できる。
第1実施形態のファイル格納システムを示す概念図である。 第1実施形態のファイル格納システムを示すブロック図である。 第1実施形態のサーバ装置で実行する処理を説明する図である。 第2実施形態のファイル格納システムを示すブロック図である。 要約情報の構成と、要約情報を生成する処理を説明する図である。
以下、本発明の実施形態を、図面を参照しながら詳細に説明する。
(第1実施形態)
図1は、本発明の第1実施形態のファイル格納システムを示す概念図である。本実施形態のファイル格納システム1は、ネットワークを介してユーザにオンラインストレージサービスを提供するために用いられており、複数のユーザによって操作される複数の端末装置21,22,23,・・・が、インターネット等のネットワーク4を介してサーバ装置3に接続されて構成される。
端末装置21,22,23,・・・は、CPU(Central Processing
Unit)やキャッシュメモリ等の情報処理資源を備え、ネットワークに接続する機能を有するコンピュータ装置であり、例えばパーソナルコンピュータ、ワークステーション、メインフレーム、携帯情報端末、ゲーム機及びカーナビゲーション装置等により構成される。端末装置21,22,23,・・・は、更に、主記憶装置、補助記憶装置、入出力装置、通信インターフェース及びメモリインターフェース等を備える。端末装置21,22,23,・・・は、補助記憶装置から主記憶装置に読み出されたシステム情報や各種制御プログラムを、CPUが必要に応じて実行することにより、また、必要に応じて各装置及びインターフェースと協働することにより、後述の各手段として機能する。
サーバ装置3は、CPUやキャッシュメモリ等の情報処理資源を備え、ネットワークに接続する機能を有するコンピュータ装置であり、例えばパーソナルコンピュータ、ワークステーション及びメインフレーム等により構成される。サーバ装置3は、更に、主記憶装置、補助記憶装置、入出力装置、通信インターフェース及びメモリインターフェース等のほか、端末装置21,22,23,・・・からアップロードされたファイルを格納するハードディスクドライブ等の大容量記憶装置を備える。サーバ装置3は、補助記憶装置から主記憶装置に読み出されたシステム情報や各種制御プログラムを、CPUが必要に応じて実行することにより、また、必要に応じて各装置及びインターフェースと協働することにより、後述の各手段として機能する。なお、サーバ装置3は、大容量記憶装置が本体と分離していてもよい。
端末装置21,22,23,・・・とサーバ装置3との間の通信は、端末装置21,22,23,・・・とサーバ装置3の通信インターフェースを介してTCP/IP(Transmission Control Protocol/Internet Protocol)プロトコルに従って行われる。
端末装置21,22,23,・・・のユーザは、オンラインストレージサービスの利用に先立ってサービス提供者に利用申し込みを行い、サービス提供者がサービスの利用を許可すると、ユーザのID及びパスワード等の認証情報を登録する。ユーザは、所定の端末装置21でサーバ装置3に接続し、ID及びパスワードをサーバ装置3に送信する。サーバ装置3は、受信したID及びパスワードを、登録された認証情報と照合して認証を行い、認証が成功すると、端末装置2との間でファイルのアップロード及びダウンロードを行う。なお、パスワードの代わりに生体認証など他の認証方法を用いてユーザを認証してもよい。また、オンラインストレージサービスは、サービスの提供に伴ってユーザが登録手続きを行うことなく、端末装置2とサーバ装置3との間のファイルのアップロード及びダウンロードが可能な形態であってもよい。例えば、端末装置21,22,23,・・・がネットワーク4に接続する際に設定されるIPアドレスにより、端末装置21,22,23,・・・を操作するユーザを区別してもよい。オンラインストレージサービスによりサーバ装置3に格納されるファイルは、文書、画像、音楽及びプログラム等の任意のファイルが対象となる。
図2は、第1実施形態のファイル格納システム1のうち、第1端末装置21と第2端末装置22とサーバ装置3を示すブロック図である。図2に示すように、第1端末装置21は、要約情報生成手段11と要約情報送信手段12を有する。第2端末装置はファイル送信手段25を有する。サーバ装置3は、要約情報受信手段31と、要約情報格納手段32と、ファイル受信手段33と、ファイル格納手段34と、要約参照情報生成手段35と、同一性判定手段36と、アクセス権付与手段37を有する。
サーバ装置3は、図2に記載の各手段の1つまたは複数の手段を実現する複数の装置が、ネットワークを介して接続されたシステムにより実現されていてもよい。例えば、サーバ装置3を第1サーバ装置と第2サーバ装置で構成し、第1サーバ装置が、要約情報受信手段31と、要約情報格納手段32と、同一性判定手段36と、アクセス権付与手段37とを有し、第2サーバ装置が、ファイル受信手段33と、ファイル格納手段34と、要約参照情報生成手段35とを有し、第2サーバ装置から第1サーバ装置へ要約参照情報がネットワークを介して送信されるように構成してもよい。
本実施形態のファイル格納システム1は、以下のように動作する。まず、ユーザが第1端末装置21の補助記憶装置に記憶された所定のファイルの重複排除型アップロードを行う場合、要約情報生成手段11により、上記ファイルに基づいてハッシュ関数のMD5によって128ビットの値を生成して、要約情報を生成する。この要約情報が、要約情報送信手段12により、ネットワーク4を通じてサーバ装置3に送信される。
サーバ装置3は、要約情報受信手段31によって要約情報を受信すると、受信した要約情報を、要約情報の送信元識別情報と関連づけて、要約情報格納手段32に格納する。
一方、他のユーザが第2端末装置22の補助記憶装置に記憶された所定のファイルを通常アップロードする場合、このファイルが、ファイル送信手段25により、ネットワーク4を通じてサーバ装置3に送信される。サーバ装置3は、ファイル受信手段33によってファイルを受信すると、受信したファイルをファイル格納手段34に格納すると共に、第2端末装置22のユーザにファイルのアクセス権を設定する。
ファイル格納手段34に格納されたファイルのうち、第1端末装置のユーザにアクセス権を与えるファイルの候補となるファイルに基づいて、要約参照情報生成手段35が、ハッシュ関数のMD5によりハッシュ値を生成し、要約参照情報を生成する。この要約参照情報と、要約情報格納手段32に保存された要約情報とを、同一性判定手段36により、両者が同じバイト列からなるファイルから生成されたMD5のハッシュ値であるかどうかを調べる。これにより、第1端末装置21に存在したファイルと、ファイル格納手段34に格納されているファイルとが同一であるか否かを調べる。同一性判定手段36の判定結果が肯定的であった場合、ファイル格納手段34に格納されているファイルへのアクセス権を、要約情報格納手段32に要約情報と関連付けられて保存されている送信元識別情報に対応するユーザへ付与する。
一方、同一性判定手段36の判定結果が否定的であった場合、候補となったファイルは、要約情報の生成元のファイルと同一ではないので、要約情報格納手段32に要約情報と関連付けられて保存されている送信元識別情報に対応するユーザへアクセス権は付与されない。
ユーザへのファイルのアクセス権の付与は、ファイル格納手段34に設けられたユーザ専用領域の中に、ファイルへのリンク(ファイルの所在場所を示す情報であって、ファイルにアクセスする際に参照されるショートカット)を格納することにより行う。あるいは、アクセス権の付与されたファイルを、ユーザ専用領域の中にコピーしてもよい。これにより、ユーザの第1端末装置21は重複排除型アップロードが完了し、ファイル格納手段34に格納されたファイルの読み出しが可能となる。すなわち、ユーザは、ファイルのアップロードを行うことなく、サーバ装置2のユーザ専用領域の中へファイルをアップロードした場合と同じ効果が得られる。
或いは、ユーザへのファイルのアクセス権の付与は、ファイル格納手段34に格納された全てのファイルに、そのファイルのアクセス権を持つユーザのユーザ識別情報のリストを関連付けて保存するようにしておき、そのリストに、新たにアクセス権を付与するユーザのユーザ識別情報を追加することにより行ってもよい。ユーザが第1端末装置21を通じてファイルの一覧表示をするときには、そのユーザがアクセス権を持っているファイルのみを第1端末装置21に表示させることにより、あたかもサーバ装置2のユーザの専用領域にユーザがアクセス権を持つファイルを保存しているように感じさせることができる。
或いは、ユーザへのファイルのアクセス権の付与は、ファイル格納手段34に格納されたファイルを直接ダウンロードさせるために設定したURLを、上記ユーザにEメールで通知して行ってもよい。
図3は、第1実施形態のファイル格納システムのサーバ装置3で実行される具体的な処理を表す模式図である。サーバ装置3の同一性判定手段36は、日次のバッチ処理として、端末装置21,22,23,・・・からサーバ装置3へのアクセスの少ない早朝等の時間帯に、以下の処理を行う。なお、この日次バッチ処理を行う時間帯以外の時間には、サーバの負荷を抑えるため、サーバ装置3で受信されるファイルや要約情報をユーザ専用領域に格納することのみを行い、同一性判定やその結果に基づくアクセス権の付与は一切行わない。
(1)ユーザ別保留リストの維持及び管理
要約情報格納手段32に、前日の日次処理までに同一性判定手段36による判定の対象となったもののアクセス権の設定に至らず、削除されずに残った要約情報と、前日の日次処理以降に受信した要約情報を、登録された全ユーザについて、ユーザ別リスト51,52,53,・・・を各々のユーザ専用領域内に維持及び管理しておく。
(2)保留ユーザリストの作成
日次処理が開始されると、まず、ユーザ別リスト51,52,53,・・・を再構成し、要約情報毎に、送信元識別情報を参照可能な保留ユーザリスト54を作成する。
(3)格納ファイル一覧リストの作成
前日までにファイル格納手段34に格納されていたファイルと、当日中に新たにファイル格納手段34に格納されたファイルについて、要約参照情報(MD5ハッシュ値)の一覧リスト55を作成する。
(4)マッチング処理。
上記(2)で作成した保留ユーザリスト54と、上記(3)で作成した格納ファイル一覧リスト55のマッチングを行う。
上記(4)のマッチング処理は、保留ユーザリスト54を要約情報の昇順にソートし、ソートした保留ユーザリスト54の要約情報と、格納ファイル一覧リスト55の要約参照情報を、各々昇順に対応させてマッチングするのが効率的である。また、前日までに格納されていた要約情報と、前日までに格納されていたファイルに基づく要約参照情報とのマッチングは、前日までに既に1度は行われたものであるから、スキップしてもよい。
保留ユーザリスト54の要約情報と、格納ファイル一覧リスト55の要約参照情報のマッチングを順に行い、格納ファイル一覧リスト55の要約参照情報と、保留ユーザリスト54の要約情報とが同一である場合、この同一の要約情報に対応する保留ユーザリスト54の送信元識別情報に対応するユーザに、同一の要約参照情報に対応するファイルの読み出しアクセス権を付与する。こうして、保留ユーザリスト54の送信元識別情報に対応するユーザは、保留状態であった重複排除型アップロードが再開されて完了する。アクセス権の付与は、アクセス権付与手段37により、ファイル格納手段34のユーザ専用領域の中にファイルへのリンクが格納されて実行される。図3では、ファイル1のアクセス権をユーザ1に付与し、ファイル2のアクセス権をユーザ1、ユーザ2及びユーザ3に付与し、ファイル3のアクセス権をユーザ2に付与し、ファイル5のアクセス権をユーザ3に付与する。なお、アクセス権を付与された要約情報は、ユーザ別リスト51,52,53,・・・から登録を削除し、アクセス権を付与されなかった要約情報は、ユーザ別リスト51,52,53,・・・に残す。
以上のように、本実施形態のファイル格納システム1によれば、サーバ装置3が第1端末装置21から要約情報を受信した時点でファイルがファイル格納手段34に格納されていなくても、後に上記ファイルと実質的に同じファイルがファイル格納手段34に格納された後に、要約情報の送信元である第1端末装置21のユーザにアクセス権を付与することができる。したがって、第1端末装置21のユーザは、重複排除型アップロードの最初の試行時に重複排除型アップロードが完了しなくても、その後に重複排除型アップロードを再試行することなく、重複排除型アップロードを完了させることができる。したがって、第2端末装置22によってファイルが通常アップロードされるまで第1端末装置21が重複排除型アップロードを繰り返す必要が無いので、第1端末装置21のユーザの手間を効果的に削除できる。また、サーバ装置3は、第1端末装置21から要約情報を受信して送信元識別情報と関連付けて要約情報格納手段32に格納することにより、第1端末装置21からの最初の重複排除型アップロードの試行を受け付けておけば、第1端末装置21からアクセスを受けることなく第1端末装置21のユーザに事後的にアクセス権を付与できる。したがって、サーバ装置3へのアクセス数の増大を防止できるので、ファイル格納システム1の負荷の増大を効果的に防止できる。
なお、上記実施形態において、説明の便宜上、端末装置21を第1端末装置とし、端末装置22を第2端末装置としたが、端末装置21は他のファイルを通常アップロードする場合は第2端末装置となり、端末装置22は他のファイルの重複排除型アップロードを行う場合は第1端末装置となる。すなわち、サーバ装置3に接続する端末装置21,22,23,・・・は、ファイルの重複排除型アップロードを行う場合は第1端末装置に相当し、ファイルの通常アップロードを行う場合は第2端末装置に相当し、第1端末装置であるか、第2端末装置であるかは、ファイルのアップロードの形態に応じて決定される。
(第2実施形態)
図4は、本発明の第2実施形態のファイル格納システムのうち、第1端末装置121と第2端末装置22とサーバ装置103を示すブロック図である。本実施形態のファイル格納システム101は、第1実施形態のファイル格納システム1と同様のハードウェアにより構成され、第1端末装置121及びサーバ装置103で実行される制御プログラムが異なる。第2実施形態において、第1実施形態の構成部分と同様の構成部分には、第1実施形態における参照番号と同じ参照番号を引用して詳細な説明を省略する。
第2実施形態のファイル格納システム101は、第1端末装置121がファイルと検証因子とに基づいて要約情報を生成する一方、サーバ装置103が、送信元識別情報と共に検証因子を要約情報に関連付けて格納しておき、この検証因子とファイルとに基づいて要約参照情報を生成するものである。
図4に示すように、第2実施形態のファイル格納システム101は、第1端末装置121が、サーバ装置103から検証因子を受信する検証因子受信手段13と、ファイルと検証因子とに基づいて要約情報を生成する要約情報生成手段111を有する。サーバ装置103は、検証因子を生成する検証因子生成手段38と、検証因子を送信する検証因子送信手段39と、ファイル格納手段34に格納されたファイルと検証因子とに基づいて要約参照情報を生成する要約参照情報生成手段135を有する。また、サーバ装置103の同一性判定手段136は、要約情報検索用部分を検索キーとしてファイル格納手段34の検索を行うと共に、要約参照情報検索用部分を検索キーとして要約情報格納手段132の検索を行うようになっている。
本実施形態のファイル格納システム101は、以下のように動作する。まず、ユーザが第1端末装置121の補助記憶装置に記憶された所定のファイルの重複排除型アップロードを行う場合、重複排除型アップロード要求を第1端末装置121からサーバ装置103に送信する。サーバ装置103は、第1端末装置121から重複排除型アップロード要求を受信すると、検証因子生成手段38が検証因子としての乱数を生成し、この検証因子を検証因子送信手段39が第1端末装置121に送付する。
第1端末装置121では、検証因子受信手段13がサーバ装置103から検証因子を受信し、この検証因子に基づいて、要約情報生成手段111が要約情報を生成する。具体的には、要約情報生成手段111は、図5に示すように、ファイルのみに基づいてハッシュ関数であるSHA−1により生成した値である要約情報検索用部分S1と、ファイルの前に検証因子を結合させた情報に基づいてハッシュ関数であるSHA−1により生成した値である要約情報検証用部分S2とを連結したバイト列を生成して、要約情報S0とする。ハッシュ関数のSHA−1は160ビットの値を生成するので、要約情報S0は、要約情報検索用部分S1と要約情報検証用部分S2との合計で320ビットの値となる。
第1端末装置121は、要約情報生成手段111が生成した要約情報を、要約情報送信手段12により、ネットワーク4を通じてサーバ装置103に送信する。
サーバ装置103は、要約情報受信手段31によって要約情報を受信すると、要約情報と、送信元識別情報と、検証因子生成手段38が生成して検証因子送信手段39が端末に送付した検証因子とを関連付けて、要約情報格納手段132に格納する。
サーバ装置103のファイル格納手段34には、ファイルをハッシュ関数のSHA−1で要約した値を検索キーとして、ファイルが検索可能な状態で格納されている。サーバ装置103は、要約情報格納手段132に格納された要約情報から要約情報検索用部分を抽出し、この要約情報検索用部分を検索キーとして、同一性判定手段136がファイル格納手段34のファイルを検索する第1段階の処理を行う。
検索結果が肯定的であった場合は、検索されたファイルの前に、ユーザの送信元識別情報に関連付けられて要約情報格納手段132に格納された検証因子を付加してなる情報に基づき、要約参照情報生成手段135が、要約参照情報の検証用部分として、ハッシュ関数のSHA−1の値を生成する。続いて、同一性判定手段136が、上記要約参照情報生成手段135が生成した要約参照情報の検証用部分と、要約情報格納手段132に格納された要約情報の検証用部分とを比較する第2段階の処理を行う。これらが同一であれば、同一性判定手段136は、第1端末装置121から受信して要約情報格納手段132に格納された要約情報と、ファイル格納手段103から検索されたファイルの要約参照情報とが同一であると判定する。同一性判定手段136が、要約情報と要約参照情報とが同一であると判定すると、アクセス権付与手段37が、要約情報格納手段132に要約情報と関連付けられて格納された送信元識別情報に対応するユーザに、このファイルのアクセス権を付与する。すなわち、アクセス権付与手段37が、ファイル格納手段34のユーザ専用領域に、上記ファイルへのリンクを格納する。要約情報格納手段132に格納された上記要約情報は、ユーザにアクセス権が設定されると、削除される。
一方、同一性判定手段136の第1段階の処理において要約情報検索用部分を検索キーとしたファイル格納手段34の検索結果が否定的であった場合、または、同一性判定手段136の第2段階の処理において要約情報検証用部分と、検索されたファイルと検証因子とに基づいて要約参照情報生成手段135で生成された要約参照情報検証用部分とが同一でなかった場合は、ファイル格納手段34には重複排除型アップロードに係るファイルが未格納であると判断され、第1端末装置121による重複排除型アップロードは保留され、要約情報は要約情報格納手段132に格納されて保持される。
第1端末装置121による重複排除型アップロードが保留状態のとき、他のユーザが、第2端末装置22によってファイルを通常アップロードを行うと、第2端末装置22のファイルがネットワーク4を介してサーバ装置103に送信される。
サーバ装置103は、ファイル受信手段33がファイルを受信すると、要約参照情報生成手段135が、ファイルのみに基づいてハッシュ関数のSHA−1の値を生成する。この値が、要約参照情報検索用部分となる。この要約参照情報検索用部分を検索キーとして、同一性判定手段136により、要約情報格納手段132の要約情報検索用部分を対象に検索を行って第1段階の処理を行う。要約情報格納手段132から検索された要約情報検索用部分について、関連付けられた検証因子と、要約情報検証用部分を抽出する。抽出された検証因子を、ファイル受信手段33が受信したファイルの前に結合させ、この情報に基づいて、要約参照情報生成手段135によって要約参照情報の検証用部分となるSHA−1の値を生成する。この後、同一性判定手段136が、要約情報格納手段132から検索された要約情報検索用部分に関連付けられた要約情報検証用部分と、上記要約参照情報生成手段135が生成した要約参照情報検証用部分とを比較して第2段階の処理を行う。これらが同一であると同一性判定手段136が判断すると、アクセス権付与手段37が、要約情報格納手段132に要約情報と関連付けられて格納された送信元識別情報に対応するユーザに、このファイルのアクセス権を付与する。これにより、第1端末装置121の重複排除型アップロードが完了し、第1端末装置121を操作していたユーザは、ファイル格納手段34に格納された上記ファイルのダウンロードが可能となる。こうして、第1端末装置121のユーザは、ファイルの実態のアップロードを行うことなく、サーバ装置103へファイルをアップロードした場合と同じ効果が得られる。
第2実施形態のファイル格納システム101によれば、第1端末装置121で生成されてサーバ装置103の要約情報格納手段132に格納される要約情報が、検索用部分と検証用部分とを有するので、同一性判定手段136により、ファイル格納手段34に格納されたファイルを検索用部分で迅速に検索でき、しかも、ファイルが第1端末装置121に存在したことを検証用部分で確認できる。また、要約参照情報生成手段135で生成される要約参照情報が、検索用部分と検証用部分とを有するので、同一性判定手段136により、要約情報格納手段132に格納された要約情報を検索用部分で迅速に検索でき、しかも、検索された要約情報に対応するファイルが第1端末装置121に存在したことを検証部分で確認できる。ファイルが第1端末装置121に存在したことを確認することにより、第1端末装置121のユーザが、第1端末装置121でファイルにアクセスが可能であったことを確認できる。したがって、要約情報のみを有してファイルを有しないユーザが、要約情報をサーバ装置103に送信してアクセス権を不正に取得する不都合を防止できる。
なお、上記実施形態において、同一性判定手段136によって要約情報と要約参照情報とが同一であると判断されたとき、送信元識別情報に対応するユーザにアクセス権を付与する前に、ユーザに確認を行ってもよい。例えば、同一性判定手段136による判定結果が肯定的であると、第1端末装置121に、サーバ装置103にファイルが通常アップロードされた旨の通知を送信し、重複排除型アップロードを継続するか否かの入力を要求する。第1端末装置121のユーザから重複排除型アップロードの継続の入力を受けると、アクセス権の付与処理を行うように構成することができる。
上記第1及び第2実施形態において、第1端末装置21,121と第2端末装置22は、互いに異なる端末装置であったが、異なるユーザが異なるタイミングで操作する同一の端末であってもよい。すなわち、端末装置は、異なるユーザが、各々を特定するパスワード等の識別情報を用いてサーバ装置に接続し、異なるタイミングで重複排除型アップロード又は通常アップロードを行う際に用いるのであれば、同一の端末装置を用いることも可能である。
1 ファイル格納システム
3 サーバ装置
4 ネットワーク
11 要約情報生成手段
12 要約情報送信手段
21,22,23 端末装置
25 ファイル送信手段
31 要約情報受信手段
32 要約情報格納手段
33 ファイル受信手段
34 ファイル格納手段
35 要約参照情報生成手段
36 同一性判定手段
37 アクセス権付与手段

Claims (4)

  1. ネットワークを介して互いに接続される第1端末装置と第2端末装置とサーバ装置を含むファイル格納システムであって、
    上記第1端末装置は、
    ファイルを要約して要約情報を生成する要約情報生成手段と、
    上記要約情報生成手段によって生成された要約情報を送信する要約情報送信手段とを有し、
    上記第2端末装置は、
    ファイルを送信するファイル送信手段を有し、
    上記サーバ装置は、
    上記第1端末装置から要約情報を受信する要約情報受信手段と、
    上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
    上記第2端末装置からファイルを受信するファイル受信手段と、
    上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
    上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
    上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
    上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有することを特徴とするファイル格納システム。
  2. 請求項1に記載のファイル格納システムにおいて、
    上記第1端末装置は、
    上記要約情報生成手段が、検証因子に基づいてファイルを要約し、
    上記サーバ装置は、
    上記要約情報格納手段が、要約情報に関連付けて検証因子を格納し、
    上記要約参照情報生成手段が、上記要約情報格納手段に格納された検証因子に基づいてファイルを要約することを特徴とするファイル格納システム。
  3. ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置であって、
    上記第1端末装置から要約情報を受信する要約情報受信手段と、
    上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
    上記第2端末装置からファイルを受信するファイル受信手段と、
    上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
    上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
    上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
    上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段とを有することを特徴とするサーバ装置。
  4. コンピュータを、ネットワークを介して第1端末装置と第2端末装置に接続されるサーバ装置として機能させるためのプログラムであって、
    上記第1端末装置から要約情報を受信する要約情報受信手段と、
    上記要約情報受信手段によって受信された要約情報と、この要約情報の送信元を識別する送信元識別情報とを関連づけて格納する要約情報格納手段と、
    上記第2端末装置からファイルを受信するファイル受信手段と、
    上記ファイル受信手段によって受信されたファイルを格納するファイル格納手段と、
    上記ファイル受信手段によって受信されたファイルを要約して要約参照情報を生成する要約参照情報生成手段と、
    上記要約参照情報生成手段によって生成された要約参照情報と、上記要約情報格納手段に格納された要約情報との同一性を判定する同一性判定手段と、
    上記同一性判定手段の判定結果が肯定的であるときに、上記要約情報と関連付けられて上記要約情報格納手段に格納された送信元識別情報に対応するユーザに、上記第2端末装置から受信されて上記ファイル格納手段に格納されたファイルのアクセス権を付与するアクセス権付与手段として上記コンピュータを機能させるためのプログラム。
JP2009102239A 2009-04-20 2009-04-20 ファイル格納システム、サーバ装置及びプログラム Expired - Fee Related JP4386459B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009102239A JP4386459B1 (ja) 2009-04-20 2009-04-20 ファイル格納システム、サーバ装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009102239A JP4386459B1 (ja) 2009-04-20 2009-04-20 ファイル格納システム、サーバ装置及びプログラム

Publications (2)

Publication Number Publication Date
JP4386459B1 JP4386459B1 (ja) 2009-12-16
JP2010250760A true JP2010250760A (ja) 2010-11-04

Family

ID=41549811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009102239A Expired - Fee Related JP4386459B1 (ja) 2009-04-20 2009-04-20 ファイル格納システム、サーバ装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4386459B1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234530A (ja) * 2011-04-28 2012-11-29 Thomson Licensing オンライン・ストレージ・システムにおいてファイルをアップロードする方法、及び対応するオンライン・ストレージ・システム
JP2014511129A (ja) * 2010-12-29 2014-05-08 アマゾン・テクノロジーズ・インコーポレーテッド データシステムにおける受信器側データの重複排除
JP2014178827A (ja) * 2013-03-14 2014-09-25 Nec Corp レプリケーションシステム
US8943023B2 (en) 2010-12-29 2015-01-27 Amazon Technologies, Inc. Receiver-side data deduplication in data systems
US9116909B2 (en) 2010-12-29 2015-08-25 Amazon Technologies, Inc. Reduced bandwidth data uploading in data systems
US9298723B1 (en) 2012-09-19 2016-03-29 Amazon Technologies, Inc. Deduplication architecture

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4892072B2 (ja) * 2010-03-24 2012-03-07 株式会社東芝 ホスト装置と連携して重複データを排除するストレージ装置、同ストレージ装置を備えたストレージシステム、及び同システムにおける重複排除方法
KR101035302B1 (ko) * 2010-10-11 2011-05-19 (주)이스트소프트 클라우드 시스템 및 클라우드 시스템에서 파일 압축 및 전송 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014511129A (ja) * 2010-12-29 2014-05-08 アマゾン・テクノロジーズ・インコーポレーテッド データシステムにおける受信器側データの重複排除
US8943023B2 (en) 2010-12-29 2015-01-27 Amazon Technologies, Inc. Receiver-side data deduplication in data systems
US9116909B2 (en) 2010-12-29 2015-08-25 Amazon Technologies, Inc. Reduced bandwidth data uploading in data systems
US9794191B2 (en) 2010-12-29 2017-10-17 Amazon Technologies, Inc. Reduced bandwidth data uploading in data systems
US10180953B2 (en) 2010-12-29 2019-01-15 Amazon Technologies Inc. Receiver-side data deduplication in data systems
JP2012234530A (ja) * 2011-04-28 2012-11-29 Thomson Licensing オンライン・ストレージ・システムにおいてファイルをアップロードする方法、及び対応するオンライン・ストレージ・システム
US9298723B1 (en) 2012-09-19 2016-03-29 Amazon Technologies, Inc. Deduplication architecture
JP2014178827A (ja) * 2013-03-14 2014-09-25 Nec Corp レプリケーションシステム

Also Published As

Publication number Publication date
JP4386459B1 (ja) 2009-12-16

Similar Documents

Publication Publication Date Title
JP4386459B1 (ja) ファイル格納システム、サーバ装置及びプログラム
JP5576569B2 (ja) プライベートメタデータの処理方法
Mulazzani et al. Dark clouds on the horizon: Using cloud storage as attack vector and online slack space
JP5396051B2 (ja) 承認済みファイルと信頼されたドメインのデータベースを作成及び更新する方法及びシステム
JP5870193B2 (ja) ファイル同期方法及び装置
US20070038681A1 (en) System and method of remote storage of data through connection from a server to a client
US9262644B2 (en) Server, recording medium, and image display system
US20020152261A1 (en) Method and system for preventing the infringement of intellectual property rights
US8078726B2 (en) System and method for cacheing web files
JP2002501255A (ja) コンテンツアドレス可能な情報のカプセル化、表現、および転送
US20100241619A1 (en) Backup apparatus with higher security and lower network bandwidth consumption
US20180234234A1 (en) System for describing and tracking the creation and evolution of digital files
EP3716580A1 (en) Cloud file transfers using cloud file descriptors
JP2011203964A (ja) 文書管理システム及び方法
US8719218B2 (en) Server apparatus and method of aquiring contents
JP4592115B1 (ja) ファイル格納システム、サーバ装置及びプログラム
JP4376960B1 (ja) ファイル格納システム及びサーバ装置
JP2013037567A (ja) データ管理システムおよびデータ管理方法
JP2006085565A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2005032109A (ja) 文書データ管理装置,文書データアクセス用プログラム,文書データ管理プログラム
JP4601016B2 (ja) ファイル格納システム、サーバ装置及びプログラム、並びに検証情報格納装置及びプログラム、並びにファイル格納装置及びプログラム
JP2005339171A (ja) P2pファイル共有方法及びシステム
TW201118556A (en) Data backup management platform and method thereof
JP5714087B2 (ja) データ管理システムおよびデータ管理方法
TW202304171A (zh) 用於以區塊鏈實施之資料應用程式中簽章驗證的改良方法與系統

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090928

R150 Certificate of patent or registration of utility model

Ref document number: 4386459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees