JP2015176393A - Storage device, storage system, control method for storage system, and control program - Google Patents

Storage device, storage system, control method for storage system, and control program Download PDF

Info

Publication number
JP2015176393A
JP2015176393A JP2014052881A JP2014052881A JP2015176393A JP 2015176393 A JP2015176393 A JP 2015176393A JP 2014052881 A JP2014052881 A JP 2014052881A JP 2014052881 A JP2014052881 A JP 2014052881A JP 2015176393 A JP2015176393 A JP 2015176393A
Authority
JP
Japan
Prior art keywords
data
external
storage
user data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014052881A
Other languages
Japanese (ja)
Other versions
JP6435616B2 (en
Inventor
浩明 長野
Hiroaki Nagano
浩明 長野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014052881A priority Critical patent/JP6435616B2/en
Publication of JP2015176393A publication Critical patent/JP2015176393A/en
Application granted granted Critical
Publication of JP6435616B2 publication Critical patent/JP6435616B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a storage system capable of increasing the efficiency of data synchronization between a storage device and terminal equipment.SOLUTION: A storage system includes: a data verification means for acquiring the meta data of user data from terminal equipment, and for searching external data having the features of the acquired meta data of the user data, and for comparing the featured values of the searched external data with the featured values of the user data to determine consistency/inconsistency between the user data and the external data, and for acquiring the substantial data of the user data or the external data on the basis of the determination result of the consistency/inconsistency between the user data and the external data; and a data storage means for storing the substantial data of the user data or the external data acquired by the data verification means.

Description

本発明は、ストレージ装置、ストレージシステム、ストレージシステムの制御方法および制御プログラムに関する。特に、クラウドストレージサービスのようなオンラインストレージサービスに適用することが可能なストレージ装置、ストレージシステム、ストレージシステムの制御方法および制御プログラムに関する。   The present invention relates to a storage apparatus, a storage system, a storage system control method, and a control program. In particular, the present invention relates to a storage apparatus, a storage system, a storage system control method, and a control program that can be applied to an online storage service such as a cloud storage service.

個人のデバイスに格納されているデータをクラウド上のストレージサービスに転送・同期し、バックアップやデータの公開、グループ間共用などの用途に用いるサービスの一つにクラウドストレージサービスがある。クラウドストレージサービスは、概ねデバイス内にあるファイルとクラウド上のファイルとの差分を検出し、検出された差分を転送することによって実現されている。しかしながら、クラウドストレージサービスは、個人が所有するデバイスに設けられた通信手段を介して行われ、高速大容量ではない通信手段を経由することになるケースが多い。特に、携帯デバイスの場合には、高速大容量ではない通信手段を経由する傾向が著しい。   There is a cloud storage service as one of services used for transferring and synchronizing data stored in personal devices to a storage service on the cloud, and for backup, data disclosure, and sharing between groups. The cloud storage service is realized by detecting a difference between a file in the device and a file on the cloud and transferring the detected difference. However, in many cases, the cloud storage service is performed via a communication means provided in a device owned by an individual and via a communication means that is not high-speed and large-capacity. In particular, in the case of portable devices, the tendency to go through communication means that is not high-speed and large-capacity is remarkable.

また、クラウドストレージに格納されるデータには、個人が撮影した画像などの固有データに加えて、ウェブ等の公開された情報源から入手されたデータが少なくない。公開された情報源から入手された情報データは、一旦個人によって収集された後に、クラウドのストレージサービスに転送されることになる。そのため、既にネットワーク上に存在するデータがクラウドストレージに重複されて格納されることになる。   Further, the data stored in the cloud storage includes not only unique data such as images taken by individuals but also data obtained from public information sources such as the web. Information data obtained from a publicly available information source is once collected by an individual and then transferred to a cloud storage service. Therefore, data already existing on the network is duplicated and stored in the cloud storage.

クラウドストレージへの重複データの効率化として、データ実体ではなく統一資源位置指定子(以下、URL)等の位置指定子をブックマーク等の形式で保存する方法がある(URL:Uniform Resource Locators)。   In order to improve the efficiency of duplicate data in the cloud storage, there is a method of storing a position specifier such as a unified resource position specifier (hereinafter referred to as URL) in a format such as a bookmark instead of a data entity (URL: Uniform Resource Locators).

特許文献1には、上述の重複データの効率化に関して、ユーザデータの同期処理とユーザデータの更新処理とを行う際に、無線リソースを効率よく利用することができるバックアップサーバについて開示されている。   Patent Document 1 discloses a backup server that can efficiently use radio resources when performing synchronization processing of user data and update processing of user data with regard to the above-described efficiency of duplicate data.

特許文献1のバックアップサーバにおいては、予め記憶されている取得関連情報に基づいてユーザデータを上書き更新する更新ユーザデータを取得し、記憶されているユーザデータを更新ユーザデータで更新処理を行う。一方、移動機に記憶されているユーザデータと予め記憶されているユーザデータとの整合性を取るように同期処理を行う。そして、同期処理は、更新処理されたユーザデータを用いて行うように構成されている。   In the backup server of Patent Document 1, update user data that overwrites and updates user data is acquired based on acquisition-related information stored in advance, and the stored user data is updated with the update user data. On the other hand, synchronization processing is performed so as to ensure consistency between user data stored in the mobile device and user data stored in advance. The synchronization process is configured to be performed using the updated user data.

特許文献1のバックアップサーバが記憶する取得関連情報としては、更新ユーザデータの保存先を示す取得先情報とすることが好ましく、例えばURLなどのリンク先情報を取得先情報とすることができると開示されている。   The acquisition related information stored in the backup server of Patent Document 1 is preferably acquisition destination information indicating a storage destination of updated user data. For example, it is disclosed that link destination information such as a URL can be used as acquisition destination information. Has been.

また、広く拡散された公開情報がクラウドストレージに格納されるという状況では、短期間に多くのユーザが同じ情報を格納するという状況が発生する。このような状況は、重複排除ストレージを用いる重複排除技術などによって解決されうる。重複排除技術は、企業ネットワーク内などのように閉ざされた環境では既に実用されている。   Further, in a situation where widely spread public information is stored in the cloud storage, a situation occurs in which many users store the same information in a short time. Such a situation can be solved by a deduplication technique using deduplication storage. Deduplication technology has already been put to practical use in a closed environment such as in a corporate network.

しかしながら、現在のストレージサービスでは、ストレージサービス業者が個人データの中身を参照することを許さない傾向が強まってきている。クラウドのような第三者がデータを預かるような環境では、個人データを暗号化する必要性があるため、重複排除技術との両立が難しく、重複排除手段を有効に機能させることは困難になりつつあるという問題点があった。   However, with current storage services, there is an increasing tendency that storage service providers are not allowed to refer to the contents of personal data. In an environment where data is stored by a third party such as the cloud, it is necessary to encrypt personal data, making it difficult to achieve compatibility with deduplication technology, making it difficult to make deduplication means function effectively. There was a problem that it was going.

特許文献2には、上述の重複排除技術に関し、不特定多数を対象とするオンラインストレージサーバに利用でき、巨大なファイルの迅速なアップロードが可能でありながら、成りすましや不正アクセスを防止できるファイル格納システムについて開示されている。   Patent Document 2 discloses a file storage system that can be used for an online storage server that targets an unspecified number of people and can prevent impersonation and unauthorized access while being able to upload a huge file quickly. Is disclosed.

特許文献2のファイル格納システムのサーバ装置は、端末装置から受け取った検索キーで検索したファイルについて、ユーザが端末装置でファイルにアクセス権を有していることを検証する。そして、検証結果が肯定的である場合に、サーバ装置のアクセス権を端末装置のユーザに対して与える。   The server device of the file storage system of Patent Literature 2 verifies that the user has access rights to the file at the terminal device for the file searched with the search key received from the terminal device. When the verification result is affirmative, the access right of the server device is given to the user of the terminal device.

また、複数のストレージサービスに対して同じデータを重ねて格納することができる分散ストレージサービスが増えている。   In addition, distributed storage services that can store the same data in a plurality of storage services are increasing.

特開2009−129195号公報JP 2009-129195 A 特許第4376960号公報Japanese Patent No. 4376960

一般に、端末装置が格納するユーザデータをバックアップするストレージ装置では、端末装置からユーザデータを取得する際に、端末装置に設けられた通信手段を経由することになる。一般的な端末装置の通信手段の容量は、端末装置からストレージ装置に送信するデータ容量に対して十分に高速大容量であるわけではない。そのため、端末装置の通信手段の容量によって、端末装置とストレージ装置との間のデータ同期の効率が律速されてしまうという問題点があった。   Generally, in a storage device that backs up user data stored in a terminal device, the user data is acquired from the terminal device via a communication means provided in the terminal device. The capacity of communication means of a general terminal device is not sufficiently high speed and large capacity with respect to the data capacity transmitted from the terminal device to the storage device. Therefore, there is a problem that the efficiency of data synchronization between the terminal device and the storage device is limited by the capacity of the communication means of the terminal device.

特許文献1のバックアップサーバにおいては、指定したURLに含まれる情報が何らかの理由で見えなくなると、バックアップサーバに格納されたユーザデータを更新することができなくなるという問題点があった。それに対し、URLに含まれる情報が見えなくなる場合を想定し、URLに含まれる情報をデータ実体ごと保存するためにWebサイトのクリッピング機能などを使う技術もある。しかしながら、クリッピング機能を使う場合、ブラウザ等にクリッピングを行うためのプラグインが必要となるという問題点や、ウェブブラウザ以外の方法で入手可能な個々のファイル単位での保存を効率化することが難しいという問題点があった。   In the backup server of Patent Document 1, there is a problem that if the information included in the specified URL becomes invisible for some reason, the user data stored in the backup server cannot be updated. On the other hand, assuming that the information contained in the URL becomes invisible, there is also a technique that uses a clipping function of a Web site in order to save the information contained in the URL for each data entity. However, when using the clipping function, there is a problem that a plug-in is required for clipping in the browser, etc., and it is difficult to make efficient saving in units of individual files that can be obtained by methods other than the web browser There was a problem.

特許文献2のファイル格納システムによれば、ファイル実体をアップロードする代わりにファイルの検索キーを送付する技術を利用する場合においても、成りすましや不正アクセスを防止することができる。すなわち、特許文献2のファイル格納システムによれば、サーバ装置に格納されたファイルに対するアクセスに関してセキュリティを向上することはできる。しかしながら、特許文献2のファイル格納システムでは、端末装置の個人ファイルをクラウドと同期させてバックアップする場合においては、やはりサーバ装置と端末装置との間で通信する必要があることに変わりはない。   According to the file storage system of Patent Document 2, impersonation and unauthorized access can be prevented even when using a technique for sending a file search key instead of uploading a file entity. In other words, according to the file storage system of Patent Document 2, it is possible to improve security with respect to access to the file stored in the server device. However, in the file storage system of Patent Document 2, when backing up the personal file of the terminal device in synchronization with the cloud, it is still necessary to communicate between the server device and the terminal device.

また、複数のストレージサービスを並行して利用できる分散ストレージサービスにおいては、複数のストレージサービスは互いに独立している。そのため、複数のストレージサービス間において特別にデータ転送サービスが用意されているようなケースを除いては、クライアント主導の転送を効率化することは難しいという問題点がある。   In a distributed storage service that can use a plurality of storage services in parallel, the plurality of storage services are independent of each other. Therefore, there is a problem that it is difficult to improve the efficiency of client-initiated transfer except in the case where a data transfer service is specially prepared between a plurality of storage services.

本発明は、上述した課題を解決するため、ストレージ装置と端末装置との間のデータ同期の効率を高めたストレージシステムを提供することを目的とする。   In order to solve the above-described problems, an object of the present invention is to provide a storage system that improves the efficiency of data synchronization between a storage device and a terminal device.

本発明のストレージ装置は、端末装置からユーザデータのメタデータを取得し、取得したユーザデータのメタデータの特徴をもつ外部データを検索し、検索された外部データおよびユーザデータの特徴量を比較することによってユーザデータと外部データとの一致・不一致を判別し、ユーザデータと外部データとの一致・不一致の判別結果に基づいてユーザデータの実体データまたは外部データを取得するデータ検証手段と、データ検証手段によって取得されたユーザデータの実体データまたは外部データを格納するデータ格納手段とを備える。   The storage device of the present invention acquires user data metadata from a terminal device, searches for external data having the characteristics of the acquired user data metadata, and compares the searched external data and the feature amount of the user data. Data verification means for determining whether the user data and external data match or not, and obtaining the user data entity data or external data based on the determination result of the match or mismatch between the user data and external data, and data verification Data storage means for storing actual data of user data acquired by the means or external data.

本発明のストレージシステムは、ユーザデータを格納する端末装置と、端末装置からユーザデータのメタデータを取得し、取得したユーザデータのメタデータの特徴をもつ外部データを検索し、検索された外部データおよびユーザデータの特徴量を比較することによってユーザデータと外部データとの一致・不一致を判別し、ユーザデータと外部データとの一致・不一致の判別結果に基づいてユーザデータの実体データまたは外部データを取得するデータ検証手段と、データ検証手段によって取得されたユーザデータの実体データまたは外部データを格納するデータ格納手段とを備えるストレージ装置とを備える。   The storage system of the present invention acquires terminal data storing user data, user data metadata from the terminal apparatus, searches external data having the characteristics of the acquired user data metadata, and searches the external data The user data and the external data are compared to determine whether the user data and external data match, and based on the determination result of the user data and external data match / mismatch, the user data entity data or external data is determined. A storage device comprising: a data verification unit to acquire; and a data storage unit to store actual data of user data or external data acquired by the data verification unit.

本発明のストレージシステムの制御方法は、端末装置からユーザデータのメタデータを取得し、取得したユーザデータのメタデータの特徴をもつ外部データを検索し、検索された外部データおよびユーザデータの特徴量を比較することによってユーザデータと外部データとの一致・不一致を判別し、ユーザデータと外部データとの一致・不一致の判別結果に基づいてユーザデータの実体データまたは外部データを取得し、ユーザデータの実体データまたは外部データをストレージ装置に格納する。   The storage system control method of the present invention acquires user data metadata from a terminal device, searches external data having the characteristics of the acquired user data metadata, and searches the external data and the feature amount of the user data. The user data and the external data are compared to determine whether the user data and the external data match, and based on the determination result of the user data and the external data match or mismatch, the user data entity data or the external data is obtained. Entity data or external data is stored in the storage device.

本発明のストレージシステムの制御プログラムは、端末装置からユーザデータのメタデータを取得する処理と、取得したユーザデータのメタデータの特徴をもつ外部データを検索する処理と、検索された外部データおよびユーザデータの特徴量を比較することによってユーザデータと外部データとの一致・不一致を判別する処理と、ユーザデータと外部データとの一致・不一致の判別結果に基づいてユーザデータの実体データまたは外部データを取得する処理と、ユーザデータの実体データまたは外部データをストレージ装置に格納する処理とをコンピュータに実行させる。   The storage system control program of the present invention includes a process for acquiring user data metadata from a terminal device, a process for searching external data having the characteristics of the acquired user data metadata, and the searched external data and user The process of determining the match / mismatch between the user data and the external data by comparing the feature quantity of the data, and the actual data or the external data of the user data based on the match / mismatch determination result between the user data and the external data The computer is caused to execute the process of acquiring and the process of storing the actual data of user data or external data in the storage device.

本発明によれば、端末装置に設けられた通信手段の代わりに、ストレージサーバが備える高速・広帯域の通信手段を使うことを可能とし、ストレージ装置と端末装置との間のデータ同期の効率を高めたストレージシステムを提供することが可能になる。   According to the present invention, instead of the communication means provided in the terminal device, it is possible to use the high-speed / broadband communication means provided in the storage server, thereby improving the efficiency of data synchronization between the storage device and the terminal device. Storage system can be provided.

本発明の実施形態の概要に係るストレージシステムの構成を示すブロック図である。1 is a block diagram showing a configuration of a storage system according to an outline of an embodiment of the present invention. 本発明の実施形態の概要に係るストレージサーバを実現するハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions which implement | achieve the storage server which concerns on the outline | summary of embodiment of this invention. 本発明の第1の実施形態に係るストレージシステムの構成を示すブロック図である。1 is a block diagram showing a configuration of a storage system according to a first embodiment of the present invention. 本発明の第1の実施形態に係るストレージシステムのクライアントの動作を説明するためのフローチャートである。4 is a flowchart for explaining an operation of a client of the storage system according to the first embodiment of the present invention. 本発明の第1の実施形態に係るストレージシステムのストレージサーバの動作を説明するためのフローチャートである。3 is a flowchart for explaining the operation of the storage server of the storage system according to the first embodiment of the present invention. 本発明の第2の実施形態に係るストレージシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the storage system which concerns on the 2nd Embodiment of this invention. 本発明の第3の実施形態に係るストレージシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the storage system which concerns on the 3rd Embodiment of this invention. 本発明の第4の実施形態に係るストレージシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the storage system which concerns on the 4th Embodiment of this invention.

以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。なお、以下の説明において、同一・同様の構成要素・部分には同一の符号を付して、重複する説明を省略する場合がある。   EMBODIMENT OF THE INVENTION Below, the form for implementing this invention is demonstrated using drawing. However, the preferred embodiments described below are technically preferable for carrying out the present invention, but the scope of the invention is not limited to the following. In the following description, the same or similar components / parts may be denoted by the same reference numerals, and redundant description may be omitted.

(概要)
まず、本発明の実施形態の概要に係るストレージシステム100について説明する。なお、図1のストレージシステム100は、本発明の実施形態の概要を示すものである。具体的に本発明を実現するための構成・動作等については、後述する第1〜第4の実施形態において説明する。
(Overview)
First, the storage system 100 according to the outline of the embodiment of the present invention will be described. Note that the storage system 100 in FIG. 1 shows an outline of an embodiment of the present invention. Specific configurations, operations, and the like for realizing the present invention will be described in first to fourth embodiments to be described later.

図1は、本発明の実施形態の概要に係るストレージシステム100の機能構成を示すブロック図である。ストレージシステム100は、ユーザによって所有される端末装置10と、端末装置10とデータ授受することができるストレージ装置30とを備える。   FIG. 1 is a block diagram showing a functional configuration of a storage system 100 according to the outline of the embodiment of the present invention. The storage system 100 includes a terminal device 10 owned by a user and a storage device 30 that can exchange data with the terminal device 10.

まず、図1に示すように、ストレージ装置30は、データ検証手段400とデータ格納手段408とを有する。   First, as illustrated in FIG. 1, the storage apparatus 30 includes a data verification unit 400 and a data storage unit 408.

データ検証手段400は、ユーザデータのメタデータを取得し、取得したメタデータの特徴を持つ外部データを検索し、検索した外部データとユーザデータとを比較し、外部データとユーザデータとの一致・不一致を判別する。そして、データ検証手段400は、メタデータと外部データの特徴量との一致・不一致の判別結果に基づいて、ユーザデータの実体データまたは外部データを取得する。なお、データ検証手段400によって取得されるユーザデータの実体データまたは外部データが同期データに相当する。   The data verification unit 400 acquires the metadata of the user data, searches the external data having the characteristics of the acquired metadata, compares the searched external data with the user data, and matches the external data with the user data. Determine discrepancies. Then, the data verification unit 400 acquires the actual data of the user data or the external data based on the determination result of the match / mismatch between the metadata and the feature amount of the external data. Note that the actual data or external data of the user data acquired by the data verification unit 400 corresponds to the synchronization data.

データ検証手段400は、上述の機能を実現するため、同期データ判別手段401、データ検索手段402、データ比較手段406、実体データ要求手段407を有する。   The data verification unit 400 includes a synchronous data determination unit 401, a data search unit 402, a data comparison unit 406, and an entity data request unit 407 in order to realize the above-described functions.

同期データ判別手段401は、端末装置10から同期対象ファイルのメタデータを取得し、取得したメタデータが自身でアクセス可能な外部データの特徴を持っているか否かを判定する。同期データ判別手段401は、受け取ったメタデータが自身でアクセス可能な外部データの特徴を持っていると判断した場合、データ検索手段402に外部データ参照の指示を出す。   The synchronization data determination unit 401 acquires the metadata of the synchronization target file from the terminal device 10 and determines whether the acquired metadata has characteristics of external data accessible by itself. When the synchronization data determination unit 401 determines that the received metadata has the characteristics of external data accessible by itself, the synchronization data determination unit 401 instructs the data search unit 402 to refer to the external data.

データ検索手段402は、同期データ判別手段401から外部データ参照を指示されると、例えば、ネットワークを通じて参照できる外部ウェブサイト等の情報源50(以下、データソース)から該当データを取り込む。なお、データ検索手段402は、外部のデータソースからデータを取得する際には、業者向けの大容量回線のように、端末装置からストレージ装置への回線よりも容量の大きな回線を経由させることが好ましい。   When the external data reference is instructed from the synchronous data determination unit 401, the data search unit 402 takes in the corresponding data from an information source 50 (hereinafter referred to as a data source) such as an external website that can be referred to via a network, for example. Note that the data search unit 402 may use a line having a larger capacity than the line from the terminal device to the storage device, such as a large-capacity line for traders, when acquiring data from an external data source. preferable.

データ比較手段406は、データ検索手段402が取り込んだ外部データと、端末装置10のファイル格納手段208に格納されたユーザデータ(ファイル)とを比較する。データ比較手段406は、ユーザデータと外部データとの比較結果に基づいて、外部データとユーザデータとの一致・不一致を判定する。なお、データ比較手段406による比較においては、データのハッシュ値などの特徴量を用いて行う。すなわち、この時点においては、端末装置10からの実体データの転送を行われていない。   The data comparison unit 406 compares the external data captured by the data search unit 402 with the user data (file) stored in the file storage unit 208 of the terminal device 10. The data comparison unit 406 determines whether the external data matches the user data based on the comparison result between the user data and the external data. Note that the comparison by the data comparison unit 406 is performed using a feature amount such as a hash value of data. That is, at this time point, the actual data from the terminal device 10 is not transferred.

実体データ要求手段407は、データ検索手段402が取り込んだ外部データと端末装置10に格納されたユーザデータとが一致しないとデータ比較手段406によって判断された場合、端末装置10に実体データを転送するように要求する。また、実体データ要求手段407は、データ検索手段402によって外部データが取得不能であった場合、端末装置10に実体データを転送するように要求する。   The entity data request unit 407 transfers the entity data to the terminal device 10 when the data comparison unit 406 determines that the external data captured by the data search unit 402 does not match the user data stored in the terminal device 10. To request. The entity data requesting unit 407 requests the terminal device 10 to transfer the entity data when external data cannot be acquired by the data search unit 402.

データ格納手段408は、データ比較手段406によってユーザデータと外部データとが一致していると判断された場合、データ検索手段402によって取得された外部データを格納する。また、データ格納手段408は、データ検索手段402によって外部データが取得不能であった場合、実体データ要求手段407によって端末装置10から転送されたユーザデータ(実体データ)を格納する。   The data storage unit 408 stores the external data acquired by the data search unit 402 when the data comparison unit 406 determines that the user data matches the external data. The data storage unit 408 stores user data (entity data) transferred from the terminal device 10 by the entity data request unit 407 when external data cannot be acquired by the data search unit 402.

また、端末装置10は、同期制御手段201、メタデータ送信手段202、実体データ送信手段203、閲覧手段207、ファイル格納手段208を有する。   In addition, the terminal device 10 includes a synchronization control unit 201, a metadata transmission unit 202, an entity data transmission unit 203, a browsing unit 207, and a file storage unit 208.

同期制御手段201は、ファイル格納手段208に格納されたファイルなどの同期対象に対して、順次ストレージ装置30との同期を行う。   The synchronization control unit 201 sequentially synchronizes with the storage apparatus 30 with respect to a synchronization target such as a file stored in the file storage unit 208.

メタデータ送信手段202は、同期制御手段201から同期対象ファイルを取得し、取得した同期対象ファイルのメタデータをストレージ装置30に転送する。   The metadata transmission unit 202 acquires the synchronization target file from the synchronization control unit 201 and transfers the acquired metadata of the synchronization target file to the storage device 30.

実体データ送信手段203は、ストレージサーバ30からファイルの実体データの要求があった場合、ファイル格納手段408に格納された実体データを送信する。   The entity data transmission unit 203 transmits the entity data stored in the file storage unit 408 when there is a request for the entity data of the file from the storage server 30.

閲覧手段207は、例えばデータに紐付けられた統一資源位置指定子などの位置指定子を含むブラウザ等によって実現され、ネットワーク等の外部からデータを取り込むために使用される手段となる。なお、これ以降、統一資源位置指定子をURLと表記する(URL:URL:Uniform Resource Locators)。閲覧手段207は、ネットワーク等から取り込んだデータと該データの入手元をファイル属性として付加したファイルをファイル格納手段208に格納する。   The browsing means 207 is realized by, for example, a browser including a position specifier such as a unified resource position specifier associated with data, and is a means used for capturing data from the outside such as a network. Hereinafter, the unified resource location specifier is referred to as URL (URL: URL: Uniform Resource Locators). The browsing means 207 stores in the file storage means 208 a file with the data acquired from the network or the like and the data acquisition source added as file attributes.

ファイル格納手段208は、閲覧手段207によって取り込まれたデータと該データの入手元をファイル属性として付加したファイルを格納する。   The file storage unit 208 stores a file in which the data acquired by the browsing unit 207 and the acquisition source of the data are added as file attributes.

以上が、本発明の実施形態の概要に係るストレージシステム1についての概略的な説明である。   The above is a schematic description of the storage system 1 according to the outline of the embodiment of the present invention.

本実施形態の概要に係る手法は、ユーザが入手した個人ファイルをクラウドと同期してバックアップするシステムに適用することができる。本実施形態の概要に係るストレージシステム10では、個人ファイルの入手元が公開のウェブサーバであった場合、端末装置10とストレージ装置30との間ではなく、ウェブサーバとストレージ装置30との間で実体データをやり取りする。すなわち、本実施形態においては、実体データを端末装置10とストレージ装置30との間の細い伝送路ではなく、ストレージサーバ30とウェブサーバとの間の比較的太い伝送路を用いて転送を行う。そのため、ストレージ装置30と端末装置10との間のデータ同期の効率を高めることができる。なお、本実施形態の手法は、ストレージ装置20から接続可能な別のストレージ装置に格納されたファイルを同期対象とする場合や、端末装置10に格納されたファイルが他のストレージサービスからのデータコピーであると認識される場合にも適用できる。   The method according to the outline of the present embodiment can be applied to a system that backs up a personal file obtained by a user in synchronization with the cloud. In the storage system 10 according to the outline of the present embodiment, when the source of the personal file is a public web server, not between the terminal device 10 and the storage device 30 but between the web server and the storage device 30. Exchange entity data. That is, in the present embodiment, the entity data is transferred using a relatively thick transmission path between the storage server 30 and the web server instead of a thin transmission path between the terminal device 10 and the storage apparatus 30. Therefore, the efficiency of data synchronization between the storage device 30 and the terminal device 10 can be increased. Note that the method of the present embodiment can be applied to a case where a file stored in another storage device that can be connected from the storage device 20 is a synchronization target, or a file stored in the terminal device 10 is a data copy from another storage service It can also be applied to cases where it is recognized.

図2は、本発明の実施形態に係る概要に係るストレージサーバ30を実現するハードウェア構成の一例を示すブロック図である。ストレージサーバ30は、中央処理装置301、RAM302(Random Access Memory)、ROM303(Read Only Memory)、入力装置304、出力装置305、通信モジュール306および補助記憶装置307を備える。各ハードウェアは、バス308によって互いに接続される。   FIG. 2 is a block diagram showing an example of a hardware configuration for realizing the storage server 30 according to the outline of the embodiment of the present invention. The storage server 30 includes a central processing unit 301, a RAM 302 (Random Access Memory), a ROM 303 (Read Only Memory), an input device 304, an output device 305, a communication module 306, and an auxiliary storage device 307. Each hardware is connected to each other by a bus 308.

中央処理装置301は、ストレージサーバ30の演算・制御等を実行するCPU(Central Processing Unit)である。RAM302およびROM303は、主記憶装置を構成する。入力装置304はキーボードやマウスなどの入力デバイスであり、出力装置305はディスプレイなどの出力デバイスである。通信モジュール306は、ネットワークカードなどのデータ送受信デバイスである。補助記憶装置307は、ハードディスクなどの記憶デバイスである。   The central processing unit 301 is a CPU (Central Processing Unit) that executes calculation and control of the storage server 30. The RAM 302 and the ROM 303 constitute a main storage device. The input device 304 is an input device such as a keyboard or a mouse, and the output device 305 is an output device such as a display. The communication module 306 is a data transmission / reception device such as a network card. The auxiliary storage device 307 is a storage device such as a hard disk.

図1に示す各機能を実現させるためには、まず、図2の中央処理装置301やRAM302などのハードウェア上にソフトウェアを読み込ませる。そして、CPU301の制御の下で、入力装置304、出力装置305および通信モジュール306を動作させるとともに、RAM302や補助記憶装置307におけるデータの読み出し・書き込みを実行する。なお、図1に示す機能は、図2に示すハードウェアのみならず、ハードウェア上に読み込まれたソフトウェアを用いて実現されてもよい。   In order to realize each function shown in FIG. 1, first, software is read on hardware such as the central processing unit 301 and the RAM 302 shown in FIG. Under the control of the CPU 301, the input device 304, the output device 305, and the communication module 306 are operated, and data reading / writing in the RAM 302 and the auxiliary storage device 307 is executed. Note that the function shown in FIG. 1 may be realized not only by the hardware shown in FIG. 2 but also by using software loaded on the hardware.

以上、本発明の実施形態の概要について説明した。なお、本実施形態に係る手法は、クラウドストレージサービスに限らず、任意の端末装置と接続されるストレージ装置を用いたストレージサービスに適用することができる。   The outline of the embodiment of the present invention has been described above. Note that the method according to the present embodiment can be applied not only to the cloud storage service but also to a storage service using a storage device connected to an arbitrary terminal device.

これ以降、本実施形態に係るストレージシステムについて、具体的な実施形態を示して詳細に説明する。   Hereinafter, the storage system according to this embodiment will be described in detail by showing a specific embodiment.

(第1の実施形態)
(構成)
次に、図3を参照しながら、本発明の第1の実施形態に係るストレージシステム1について説明する。
(First embodiment)
(Constitution)
Next, the storage system 1 according to the first embodiment of the present invention will be described with reference to FIG.

本実施形態に係るストレージシステム1は、ユーザ個人が所有する端末装置であるクライアント11と、クライアント11の中のファイルを転送してコピーを格納するストレージサービスを提供するためのストレージ装置であるストレージサーバ31とを備える。   A storage system 1 according to this embodiment includes a client 11 that is a terminal device owned by an individual user, and a storage server that is a storage device for providing a storage service for transferring a file in the client 11 and storing a copy. 31.

(クライアント)
図3に示すように、クライアント11は、同期制御手段21、メタデータ送信手段22、実体データ送信手段23、ブラウザ27およびファイル28を含む。
(client)
As shown in FIG. 3, the client 11 includes a synchronization control unit 21, a metadata transmission unit 22, an entity data transmission unit 23, a browser 27, and a file 28.

同期制御手段21は、ファイル28などの同期対象に対して、順次ストレージサーバ31との同期を行う。   The synchronization control unit 21 sequentially synchronizes with the storage server 31 for the synchronization target such as the file 28.

メタデータ送信手段22は、同期制御手段21から同期対象ファイルを取得し、取得したメタデータをストレージサーバ31に転送する。   The metadata transmission unit 22 acquires the synchronization target file from the synchronization control unit 21 and transfers the acquired metadata to the storage server 31.

実体データ送信手段23は、ストレージサーバ31からファイルの実体データの要求があった場合、実体データを送信する。   When there is a request for file entity data from the storage server 31, the entity data transmission unit 23 transmits the entity data.

ブラウザ27は、ネットワーク等から取り込んだデータとデータの入手元をファイル属性として付加したファイル28として格納する。   The browser 27 stores the data acquired from the network or the like and the data acquisition source as a file 28 added as file attributes.

クライアント11は、例えば、デスクトップPCやノートPC、タブレットPCなどのパーソナルコンピュータ、スマートフォンや携帯電話などの端末装置として実現できる(PC:Personal Computer)。   The client 11 can be realized as, for example, a personal computer such as a desktop PC, a notebook PC, or a tablet PC, or a terminal device such as a smartphone or a mobile phone (PC: Personal Computer).

(ストレージサーバ)
ストレージサーバ31は、同期データ判別手段41、外部データ取得手段42、データ比較手段46、実体データ要求手段47およびデータ格納領域48を備える。
(Storage server)
The storage server 31 includes synchronous data determination means 41, external data acquisition means 42, data comparison means 46, actual data request means 47, and data storage area 48.

同期データ判別手段41は、クライアント11からの同期対象ファイルのメタデータを取得し、取得したメタデータが自身でアクセス可能な外部データの特徴(特徴量とも呼ぶ)を持っているか否かを判定する。同期データ判別手段41は、同期対象のデータを外部から入手可能であると判断した場合、外部データ取得手段42に対してURL等の拡張属性情報を伝え、外部ウェブサイト51からのデータ取得を指示する。   The synchronization data determination unit 41 acquires the metadata of the synchronization target file from the client 11 and determines whether or not the acquired metadata has a feature (also referred to as a feature amount) of external data accessible by itself. . When the synchronization data determination unit 41 determines that the data to be synchronized can be obtained from the outside, the synchronization data determination unit 41 transmits the extended attribute information such as the URL to the external data acquisition unit 42 and instructs to acquire the data from the external website 51. To do.

外部データ取得手段42は、同期データ判別手段41から外部データ参照を指示されると、指示された外部データをデータソースから取り込む。外部データのデータソースは、例えば、ネットワークを通じて参照できる外部ウェブサイト51である。なお、外部データ取得手段42は、本実施形態の概要に係るストレージシステム30のデータ検索手段402の一形態である。   When the external data acquisition unit 42 is instructed to reference the external data from the synchronous data determination unit 41, the external data acquisition unit 42 takes in the instructed external data from the data source. The data source of the external data is, for example, an external website 51 that can be referred to through a network. The external data acquisition unit 42 is a form of the data search unit 402 of the storage system 30 according to the outline of the present embodiment.

データ比較手段46は、外部データ取得手段42が取り込んだ外部データと、クライアント11に格納されたユーザデータ(ファイル28)とを比較することによって、データの一致・不一致を判定する。なお、データ比較手段46は、外部データおよびユーザデータの特徴量を比較することによって、外部データとユーザデータとを比較する。   The data comparison unit 46 compares the external data acquired by the external data acquisition unit 42 with the user data (file 28) stored in the client 11 to determine whether the data matches or does not match. The data comparing means 46 compares the external data and the user data by comparing the feature amounts of the external data and the user data.

実体データ要求手段47は、外部データ取得手段42が取り込んだ外部データとクライアント11に格納されたユーザデータとが一致しないとデータ比較手段46によって判断された場合、クライアント11に実体データの転送を要求する。また、実体データ要求手段47は、外部データ取得手段42によってデータが取得不能であった場合は、クライアント11に実体データの転送を要求する。   The entity data request unit 47 requests the client 11 to transfer the entity data when the data comparison unit 46 determines that the external data captured by the external data acquisition unit 42 and the user data stored in the client 11 do not match. To do. The entity data request unit 47 requests the client 11 to transfer the entity data when the external data acquisition unit 42 cannot acquire the data.

データ格納領域48は、データ比較手段46によって外部データとユーザデータとが一致していると判断された場合、外部データ取得手段42によって取得された外部データを格納する。また、データ格納領域48は、データ比較手段46によって外部データとユーザデータとが一致していないと判断された場合、実体データ要求手段47によってクライアント11から転送されたユーザデータを格納する。また、データ格納領域48は、外部データ取得手段42によってデータが取得不能であった場合、実体データ要求手段47によってクライアント11から転送されたユーザデータを格納する。   The data storage area 48 stores the external data acquired by the external data acquisition unit 42 when the data comparison unit 46 determines that the external data matches the user data. The data storage area 48 stores user data transferred from the client 11 by the entity data request unit 47 when the data comparison unit 46 determines that the external data and the user data do not match. The data storage area 48 stores user data transferred from the client 11 by the entity data requesting unit 47 when data cannot be acquired by the external data acquiring unit 42.

(動作)
次に、図4および図5を参照しながら、本発明の第1の実施形態に係るストレージシステム1の動作について説明する。なお、ストレージシステム1の構成は図3の通りである
(クライアント)
まず、クライアント11の動作について図4を用いて説明する。
(Operation)
Next, the operation of the storage system 1 according to the first embodiment of the present invention will be described with reference to FIG. 4 and FIG. The configuration of the storage system 1 is as shown in FIG. 3 (client)
First, the operation of the client 11 will be described with reference to FIG.

図4において、クライアント11のブラウザ27は、ネットワークからのファイルのダウンロードの際に用いたURL等の情報をファイル28の拡張属性としてファイル28に付加する(ステップS11)。なお、ステップS11の技術は、既にファイルの入手元によるファイルの信頼性の判定等に用いられている。   In FIG. 4, the browser 27 of the client 11 adds information such as the URL used when downloading the file from the network to the file 28 as an extended attribute of the file 28 (step S11). Note that the technique of step S11 is already used for determining the reliability of a file by the file source.

同期制御手段21は、ストレージサービス2とのファイルの同期を開始すると、同期対象ファイル群から一つのファイル28を特定し、特定したファイル28の同期処理をメタデータ送信手段22に指示する(ステップS12)。   When synchronization of the file with the storage service 2 is started, the synchronization control unit 21 identifies one file 28 from the synchronization target file group, and instructs the metadata transmission unit 22 to perform synchronization processing of the identified file 28 (step S12). ).

メタデータ送信手段22は、ファイル28に格納されているデータのハッシュ値などの特徴量やファイル属性として格納されている入手元URLなどの拡張属性を含むメタデータをストレージサーバ31に送信する(ステップS13)。   The metadata transmission means 22 transmits metadata including a feature quantity such as a hash value of data stored in the file 28 and an extended attribute such as an acquisition source URL stored as a file attribute to the storage server 31 (step). S13).

ここで、クライアント11側は、ストレージサーバ31側の処理を待つ(ステップS14)。このとき、ステップS14の段階で、他のファイル28に関してステップS11〜S13の同期処理を順次実行してもよい。   Here, the client 11 side waits for processing on the storage server 31 side (step S14). At this time, the synchronization processing of steps S11 to S13 may be sequentially executed with respect to the other file 28 in the stage of step S14.

ストレージサーバ31から実体データの要求があると(ステップS14でYes)、送信手段13は、ストレージサーバ31からの実体データ要求に応じ、実体データをストレージサーバ31に送信する(ステップS15)。   When there is a request for entity data from the storage server 31 (Yes in step S14), the transmission means 13 transmits the entity data to the storage server 31 in response to the entity data request from the storage server 31 (step S15).

ストレージサーバ31からの実体データ要求が無い場合(ステップS14でNo)、図4のフローを終了する。なお、ストレージサーバ31からの実体データ要求が無い場合とは、ストレージサーバ31がファイル28のデータを外部から取得する場合である。ストレージサーバ31からの実体データ要求が無いことの判断は、外部データを取得した旨をストレージサーバ31からクライアント11に伝えたり、ステップS13の後に特定の時間経過したら実体データ要求がないとみなしたり、任意の基準で判断できる。   If there is no actual data request from the storage server 31 (No in step S14), the flow of FIG. The case where there is no actual data request from the storage server 31 is a case where the storage server 31 acquires the data of the file 28 from the outside. The determination that there is no entity data request from the storage server 31 is made by telling the storage server 31 that the external data has been acquired from the storage server 31 to the client 11, or assuming that there is no entity data request after a specific time has elapsed after step S13. Judgment can be made based on arbitrary criteria.

以上が、本実施形態に係るストレージシステム1のクライアント11の動作に関する説明である。   This completes the description of the operation of the client 11 of the storage system 1 according to this embodiment.

(ストレージサーバ)
次に、ストレージサーバ31の動作について図5のフローチャートを用いて説明する。図5のフローチャートは、図4のステップS13の動作を受けて始まる。
(Storage server)
Next, the operation of the storage server 31 will be described using the flowchart of FIG. The flowchart in FIG. 5 starts in response to the operation in step S13 in FIG.

図5において、ストレージサーバ31の同期データ判別手段41は、メタデータ送信手段22によって送信されたメタデータを受信すると、受信したメタデータの特徴を持つデータを外部から入手可能であるか否かを判定する(ステップS21)。   In FIG. 5, when the synchronization data determination unit 41 of the storage server 31 receives the metadata transmitted by the metadata transmission unit 22, it determines whether or not the data having the characteristics of the received metadata can be obtained from the outside. Determination is made (step S21).

同期データ判別手段41は、メタデータの特徴を持つデータを外部から入手可能であると判断した場合(ステップS21でYes)、外部データ取得手段42にURL等の拡張属性情報を伝え、外部ウェブサイト51からのデータ取得を指示する(ステップS22)。
なお、指示されたデータが取得不能であった場合(ステップS21でNo)、ステップS26に進む。
When the synchronization data determination unit 41 determines that data having metadata characteristics can be obtained from the outside (Yes in step S21), the synchronization data determination unit 41 notifies the external data acquisition unit 42 of extended attribute information such as a URL, and the external website Data acquisition from 51 is instructed (step S22).
If the instructed data cannot be acquired (No in step S21), the process proceeds to step S26.

外部データ取得手段42は、同期データ判別手段41の指示に応じて外部データを取得し、取得した外部データをデータ比較手段46に送信する(ステップS23)。   The external data acquisition unit 42 acquires external data in accordance with an instruction from the synchronous data determination unit 41, and transmits the acquired external data to the data comparison unit 46 (step S23).

データ比較手段46は、同期データ判別手段41から伝えられたユーザデータの特徴量などを用いて、外部データ取得手段42によって得られた外部データが同期対象のファイル28と一致しているか否かを判別する(ステップS24)。   The data comparison unit 46 uses the feature amount of the user data transmitted from the synchronization data determination unit 41 to determine whether or not the external data obtained by the external data acquisition unit 42 matches the file 28 to be synchronized. A determination is made (step S24).

外部データ取得手段42によって得られたデータと同期対象のファイル28とが一致している場合(ステップS24でYes)、データ比較手段46は、データ格納領域48に外部データを格納する(ステップS25)。この際、データ格納領域48に格納されるデータに所定の暗号化などを加えるようにしてもよい。外部データ取得手段42によって得られたデータと同期対象のファイル28とが一致している場合、図4のフローはステップS25で終了となる。なお、外部から得たデータをデータ格納領域48に格納した段階、または得られたデータが同期対象のファイル28と一致していると判定された段階で、同期対象データが一致している旨をクライアント11に通知してもよい。   If the data obtained by the external data acquisition means 42 and the synchronization target file 28 match (Yes in step S24), the data comparison means 46 stores the external data in the data storage area 48 (step S25). . At this time, predetermined encryption or the like may be added to the data stored in the data storage area 48. If the data obtained by the external data acquisition unit 42 matches the file 28 to be synchronized, the flow in FIG. 4 ends in step S25. It should be noted that the synchronization target data matches at the stage where data obtained from the outside is stored in the data storage area 48 or when the obtained data is determined to match the synchronization target file 28. The client 11 may be notified.

外部データ取得手段42によって得られた外部データと同期対象のファイル28とが一致しなかった場合(ステップS24でNo)、データ比較手段46は、クライアント11からのデータ転送指示を実体データ要求手段47に伝える(ステップS26)。なお、外部からのデータが取得不能であることを外部データ取得手段42によって伝えられた場合も、データ比較手段46は、クライアント11に対するデータ転送指示を実体データ要求手段47に伝える。   If the external data obtained by the external data acquisition unit 42 does not match the file 28 to be synchronized (No in step S24), the data comparison unit 46 sends a data transfer instruction from the client 11 to the substantial data request unit 47. (Step S26). Even when the external data acquisition unit 42 is notified that external data cannot be acquired, the data comparison unit 46 transmits a data transfer instruction for the client 11 to the entity data request unit 47.

実体データ要求手段47は、クライアント11に対して同期対象となるファイル28の実体データの転送要求をする(ステップS27)。   The entity data request unit 47 requests the client 11 to transfer the entity data of the file 28 to be synchronized (step S27).

ここで、ストレージサーバ31側は、クライアント11側の処理を待つことになる(ステップS28)。すなわち、ストレージサーバ31は、クライアント11の実体データを受信しない限り(ステップS28でNo)、ステップS28で待機する。   Here, the storage server 31 side waits for processing on the client 11 side (step S28). That is, the storage server 31 waits in step S28 unless it receives the entity data of the client 11 (No in step S28).

ストレージサーバ31の実体データ要求手段47は、クライアント11の実体データ送信手段23から送信された実体データを受け取る(ステップS28でYes)と、受け取った実体データをデータ格納領域48に格納する(ステップS29)。なお、ステップS22において、実体データは、実体データ送信手段23による送信時点で暗号化されていてもよいし、実体データ要求手段47によるデータ格納領域48への格納時点で暗号化されるとしてもよい。   When the entity data request unit 47 of the storage server 31 receives the entity data transmitted from the entity data transmission unit 23 of the client 11 (Yes in step S28), the received entity data is stored in the data storage area 48 (step S29). ). In step S22, the entity data may be encrypted at the time of transmission by the entity data transmission unit 23, or may be encrypted at the time of storage in the data storage area 48 by the entity data request unit 47. .

以上が、本実施形態に係るストレージシステム1のストレージサーバ31の動作に関する説明である。   The above is the description regarding the operation of the storage server 31 of the storage system 1 according to the present embodiment.

以上の本実施形態によれば、データソースとなるURLを通じて同一のデータをストレージサーバ31からも参照可能であり、かつ参照されたデータとファイル28とが同一である場合、クライアント11からストレージサーバ31への実体データ転送は起こらない。すなわち、本実施形態の手法によって、クライアント11からストレージサーバ31への実体データ転送を低減すれば、上り方向帯域が小さい個人用の通信手段においてデータ同期の効率化を得ることができる。また、本実施形態によれば、携帯デバイスのように、不安定でさして帯域が大きくなくて実用上の転送量制限がある環境においても、データ同期の効率化において大きな効果が得られる。   According to the present embodiment described above, the same data can be referred from the storage server 31 through the URL serving as the data source, and if the referenced data and the file 28 are the same, the client 11 sends the storage server 31 to the same data. No entity data transfer to That is, if the actual data transfer from the client 11 to the storage server 31 is reduced by the method of the present embodiment, the efficiency of data synchronization can be obtained in personal communication means having a small upstream bandwidth. In addition, according to the present embodiment, even in an environment that is unstable and does not have a large bandwidth and has a practical transfer amount restriction, such as a portable device, a great effect can be obtained in the efficiency of data synchronization.

なお、本実施形態に係るストレージシステム1の構成は、ストレージサーバ31がいわゆるストレージサービス業者が設置している大規模なものではなく、個人宅に設置されているようなサーバに関しても効果がある。一般に、個人用の通信手段は、下り方向の帯域は広く設定されているのに対し、上り方向の帯域は狭く設定されていることが多い。この状況で、携帯デバイスと個人宅設置のサーバを同期させようとした場合、データ転送に携帯デバイスからの上りの通信手段を使わず、ストレージサーバ31にとって下りの通信手段のみを使う方が効率は高い。   Note that the configuration of the storage system 1 according to the present embodiment is effective not only for a large-scale storage server 31 installed by a so-called storage service provider but also for a server installed in a private house. In general, in the personal communication means, the downstream band is often set narrow, while the upstream band is often set narrow. In this situation, if it is attempted to synchronize the portable device and the server installed in the private home, it is more efficient for the storage server 31 to use only the downstream communication means for the data transfer without using the upstream communication means from the portable device. high.

(効果)
本発明の第1の実施形態によれば、クライアントとストレージサーバ間のデータ同期の効率を高めることができるという効果が得られる。その理由は、ストレージサーバが備える高速・広帯域の通信手段をクライアントが使う個人用通信手段の上り方向通信手段の代わりに使うことによって、データ転送効率を高めているためである。
(effect)
According to the first embodiment of the present invention, there is an effect that the efficiency of data synchronization between the client and the storage server can be increased. The reason is that the data transfer efficiency is improved by using the high-speed and broadband communication means provided in the storage server instead of the upstream communication means of the personal communication means used by the client.

(第2の実施形態)
次に、図6を参照しながら、本発明の第2の実施形態に係るストレージシステム2について説明する。なお、第2の実施形態に係るクライアント12の構成は、第1の実施形態に係るクライアント11の構成と同じであるため、詳細な説明は省略する。また、ストレージサーバ32の内部構成についても、同様の構成要素については説明を省略する。
(Second Embodiment)
Next, the storage system 2 according to the second embodiment of the present invention will be described with reference to FIG. The configuration of the client 12 according to the second embodiment is the same as the configuration of the client 11 according to the first embodiment, and thus detailed description thereof is omitted. Further, the description of the same components in the internal configuration of the storage server 32 is also omitted.

まず、第2の実施形態に係るストレージシステム2と第1の実施形態に係るストレージシステム1との差異について説明する。   First, differences between the storage system 2 according to the second embodiment and the storage system 1 according to the first embodiment will be described.

第1の実施形態に係るストレージシステム1では、外部ウェブサイトを情報源とする構成としていた。それに対し、第2の実施形態に係るストレージシステム2は、複数のストレージサーバ52間で共有され、最近転送されたデータとそのハッシュ値などの特徴量を格納する重複検出用共用キャッシュ領域60を備える構成とする。   In the storage system 1 according to the first embodiment, an external website is used as an information source. On the other hand, the storage system 2 according to the second embodiment includes a duplication detection shared cache area 60 that is shared among a plurality of storage servers 52 and stores recently transferred data and feature values such as hash values thereof. The configuration.

また、第1の実施形態に係るストレージシステム1のストレージサーバ31は、外部データ取得手段21を備えていた。それに対し、第2の実施形態に係るストレージシステム2は、同期データ判別手段41から得たファイルのハッシュ値などから重複するファイルが重複検出用共用キャッシュ領域に存在するか否かを判断する重複検出候補探索手段43を備える。なお、重複検出候補探索手段43は、本実施形態の概要に係るストレージシステム30のデータ検索手段402の一形態である。   In addition, the storage server 31 of the storage system 1 according to the first embodiment includes the external data acquisition unit 21. On the other hand, the storage system 2 according to the second embodiment determines whether or not a duplicate file exists in the duplicate detection shared cache area from the hash value of the file obtained from the synchronous data determination unit 41. Candidate search means 43 is provided. The duplicate detection candidate search unit 43 is one form of the data search unit 402 of the storage system 30 according to the outline of the present embodiment.

また、第2の実施形態に係るストレージサーバ32の実体データ要求手段47には、転送を行った実体データを重複検出用共用キャッシュ領域60に転送する機能が付加されている。   In addition, a function of transferring the transferred entity data to the duplication detection shared cache area 60 is added to the entity data request unit 47 of the storage server 32 according to the second embodiment.

ここで、第2の実施形態に係るストレージシステム2の運用上の特徴を説明する。   Here, the operational characteristics of the storage system 2 according to the second embodiment will be described.

第1の実施形態の方式では、データの入手元がURLとして公開されている場合に、その入手元URLからデータを転送することによる効率化を対象としている。しかしながら、ネットワーク上では同一のデータがいつも同じ入手元から得られているとは限らない。   In the system of the first embodiment, when the data acquisition source is disclosed as a URL, efficiency is improved by transferring data from the acquisition source URL. However, on the network, the same data is not always obtained from the same source.

多くの場合、ネットワーク上のデータは複製され、データの入手元がいくつも存在する。そのため、データの入手元がいくつも存在する場合の同期やバックアップなどを効率化するためには、入手元の同一性ではなく、データ本体のハッシュ値などの特徴量に基づく重複検出の技術が用いられている。ストレージシステム2がクローズドな構成である場合や、ストレージサーバの運用者が信頼できる場合などには、重複検出技術は効果を発揮する。また、重複検出の対象箇所には、ストレージサーバ上やクライアント上などのように多様なバリエーションが存在する。   In many cases, the data on the network is replicated and there are many sources of data. Therefore, in order to make synchronization and backup more efficient when there are multiple sources of data, duplicate detection technology based on features such as the hash value of the data body is used instead of the identity of the sources. It has been. The duplicate detection technique is effective when the storage system 2 has a closed configuration or when the storage server operator can be trusted. In addition, there are various variations such as on the storage server and the client in the duplication detection target portion.

しかし、クラウドストレージサービスのようにオープンなストレージサービスでは、一般にユーザごとのデータの暗号化が要求される。そのため、通常の重複排除技法のように既に格納済みのデータと一致するか否かを判定する技法は、暗号化に阻まれて十分に機能しない。   However, an open storage service such as a cloud storage service generally requires data encryption for each user. For this reason, a technique for determining whether or not the data matches the already stored data, such as a normal deduplication technique, is not sufficiently functioned by encryption.

また、ストレージサービスの運用上の特徴を考慮すると、短期間にネットワーク上に拡散したデータがユーザに保存され、複数のユーザによってストレージサービスに同期されるという状況がよく起こる。つまり、比較的短時間に複数のユーザによって同一のデータがストレージサーバに書き込まれる状況がよく起こる。   In consideration of the operational characteristics of the storage service, a situation in which data spread over the network in a short period of time is stored in the user and is synchronized with the storage service by a plurality of users. That is, a situation in which the same data is written to the storage server by a plurality of users in a relatively short time often occurs.

ここで、同一データに対して入手元が多様なバリエーションを持つという状況と、比較的短時間に複数のユーザによって同一のデータがストレージサーバに書き込まれる状況とを考え合わせる。確かに、格納データ全体に対して行う重複検出を行うことは暗号化に阻まれる。しかしながら、一定期間内に格納要求があったデータの特徴量と暗号化前のデータとを保持していれば、その間に起きた各々の格納要求について、同一データについてはストレージサーバからの転送要求を行わずに一度入手すれば済む。このとき、同一データの入手元URLは異なっていてもよい。また、入手元URLの情報がないデータについても、前述の方式は特徴量のみで機能する。   Here, the situation in which the acquisition source has various variations for the same data and the situation in which the same data is written to the storage server by a plurality of users in a relatively short time are considered. Certainly, the duplication detection performed on the entire stored data is hindered by encryption. However, if the feature amount of data requested to be stored within a certain period and the pre-encrypted data are retained, for each storage request that occurred during that period, a transfer request for the same data is sent from the storage server. You only need to get it once. At this time, the URL for obtaining the same data may be different. Further, the above-described method functions only with the feature amount even for data without the information of the source URL.

このような観点から、第2の実施形態に係るストレージシステム2には、一定期間機能するキャッシュ領域である重複検出用共用キャッシュ領域60を付加した構成とする(図6)。   From this point of view, the storage system 2 according to the second embodiment has a configuration in which a duplication detection shared cache area 60, which is a cache area that functions for a certain period, is added (FIG. 6).

重複検出用共用キャッシュ領域60は、一般には複数のストレージサーバから共用されている。これは、複数のユーザに対応する複数の論理的サーバが存在するという意味としてもよい。   The duplicate detection shared cache area 60 is generally shared by a plurality of storage servers. This may mean that there are a plurality of logical servers corresponding to a plurality of users.

同期データ判別手段41は、データの特徴量を使用して重複検出候補探索手段43に重複検出用共用キャッシュ領域60中に同一の特徴量を持つデータがあるか否かを調べさせる。   The synchronous data discriminating means 41 causes the duplication detection candidate search means 43 to check whether there is data having the same characteristic quantity in the duplication detection shared cache area 60 using the data feature quantity.

重複検出用共用キャッシュ領域60中に同一の特徴量を持つデータが見つかった場合、データ比較手段46はデータの同一性を確認する。データ比較手段46は、データの同一性が確認すると、重複検出用共用キャッシュ領域60から得たデータをデータ格納領域48に格納する。   When data having the same feature amount is found in the duplicate detection shared cache area 60, the data comparison means 46 confirms the identity of the data. When the data comparison unit 46 confirms the identity of the data, the data comparison unit 46 stores the data obtained from the duplication detection shared cache area 60 in the data storage area 48.

重複検出用共用キャッシュ領域60中に同一の特徴量を持つデータが見つかった場合、第1の実施形態と同様の経緯によって、実体データ要求手段47はクライアント12から実体データを得る。このとき、第2の実施形態においては、実体データ要求手段47はクライアント12から転送された実体データを重複検出用キャッシュ領域60に特徴量とともに格納する。   When data having the same feature amount is found in the duplicate detection shared cache area 60, the entity data requesting unit 47 obtains the entity data from the client 12 in the same manner as in the first embodiment. At this time, in the second embodiment, the entity data request unit 47 stores the entity data transferred from the client 12 together with the feature amount in the duplication detection cache area 60.

なお、重複検出用共用キャッシュ領域60は、時限式または容量制約などによる参照状況なども考慮して、格納するデータの内容が新しいものに置き換わる。この技法には、既存の技術を適用できる。   Note that the duplicate detection shared cache area 60 is replaced with a new content of data to be stored in consideration of a reference situation due to a timed expression or a capacity constraint. Existing techniques can be applied to this technique.

なお、図6には図示していないが、メタデータに入手元URLが含まれている場合には、重複検出が成されなかったときに、第1の実施形態に係るストレージシステム31の外部データ取得手段42相当の手段が起動するとしてよい。この場合も、外部データ取得手段42によって取得されたデータは、重複検出用共用キャッシュ領域60に特徴量とともに格納されるものとする。   Although not illustrated in FIG. 6, when the acquisition source URL is included in the metadata, the external data of the storage system 31 according to the first embodiment when duplicate detection is not performed. A means corresponding to the acquisition means 42 may be activated. Also in this case, it is assumed that the data acquired by the external data acquisition unit 42 is stored in the duplication detection shared cache area 60 together with the feature amount.

第2の実施形態によれば、複数のユーザによって一定期間内に同一のデータの格納があった場合にデータ転送効率を高められるという効果を得ることができる。その理由は、ストレージサーバには短時間に同一のデータがアップロードされやすいという特徴を利用し、通常暗号化を求められるストレージサーバには適用しにくい重複検出をキャッシュによって実行してデータ転送量を削減するためである。   According to the second embodiment, when the same data is stored within a certain period by a plurality of users, an effect that the data transfer efficiency can be improved can be obtained. The reason for this is that the same data is easily uploaded to the storage server in a short time, and the duplicate detection that is difficult to apply to the storage server that normally requires encryption is executed by the cache to reduce the data transfer amount. It is to do.

(第3の実施形態)
次に、図7を参照しながら、本発明の第3の実施形態に係るストレージシステム3について説明する。なお、第3の実施形態に係るストレージサーバ23の構成は、第2の実施形態に係るストレージサーバ22の構成と同じであるため、説明は省略する。また、ストレージサーバ23の内部構成についても、同様の構成要素については説明を省略する。
(Third embodiment)
Next, the storage system 3 according to the third embodiment of the present invention will be described with reference to FIG. Note that the configuration of the storage server 23 according to the third embodiment is the same as the configuration of the storage server 22 according to the second embodiment, and a description thereof will be omitted. In addition, regarding the internal configuration of the storage server 23, description of similar components is omitted.

まず、第3の実施形態に係るストレージシステム3と第2の実施形態に係るストレージシステム2との差異について説明する。   First, differences between the storage system 3 according to the third embodiment and the storage system 2 according to the second embodiment will be described.

第3の実施形態に係るストレージシステム3のクライアント13は、第2の実施形態に係るストレージシステム32のクライアント12に、パブリックデータ非暗号化承諾手段24を付加した構成をもつ。パブリックデータ非暗号化承諾手段24は、ファイル28のファイル属性が示すデータソースが公開のものであることを示している場合にのみ、重複検出用共用キャッシュ領域60にデータを暗号化せずに格納することを承諾する。すなわち、第3の実施形態では、ファイル28のファイル属性が示すデータソースが公開のものであることを示している場合にしか重複検出用共用キャッシュ領域60への非暗号化データの転送を行わない。   The client 13 of the storage system 3 according to the third embodiment has a configuration in which a public data non-encryption consent unit 24 is added to the client 12 of the storage system 32 according to the second embodiment. The public data non-encryption acceptance means 24 stores the data in the duplicate detection shared cache area 60 without encryption only when the data source indicated by the file attribute of the file 28 indicates that it is public. I agree to do. That is, in the third embodiment, transfer of non-encrypted data to the duplication detection shared cache area 60 is performed only when the data source indicated by the file attribute of the file 28 is public. .

また、第3の実施形態に係るストレージシステム3において、実体データ要求手段47は、非暗号化状態で受け取った公開データのみを重複検出用共用キャッシュ領域60に格納する。それに対し、第2の実施形態に係るストレージシステム2では、データが一時的にでも非暗号化状態でストレージサーバ32のデータ格納領域48に置かれる。非暗号化状態のデータがストレージサーバ32に格納されることを嫌うユーザは、ストレージサーバ32に公開されていないデータを非暗号化状態で格納することを望まないと推量される。そのため、第3の実施形態では、公開データのみをストレージサーバ32に非暗号化状態で格納する制御を付加している。   In the storage system 3 according to the third embodiment, the entity data request unit 47 stores only the public data received in the non-encrypted state in the duplication detection shared cache area 60. On the other hand, in the storage system 2 according to the second embodiment, data is temporarily stored in the data storage area 48 of the storage server 32 in an unencrypted state. A user who dislikes storing unencrypted data in the storage server 32 is presumed not to store data not disclosed to the storage server 32 in an unencrypted state. Therefore, in the third embodiment, control for storing only public data in the storage server 32 in an unencrypted state is added.

パブリックデータ非暗号化承諾手段24で承諾が得られている場合、同期制御手段21は、ファイル28の属性に入手元URLが公開であると推定される属性がついている場合のみに第2の実施形態で説明した効率化手法を用いる。それに対し、パブリックデータ非暗号化承諾手段24で承諾が得られていない場合は、通常の格納方法を用いる。なお、通常の格納方法は、クライアントから出力される時点で既に暗号化されている方式、データ格納領域48に格納される前に暗号化される方式のいずれであっても整合性をもって採用できる。   When the consent is obtained by the public data non-encryption consent means 24, the synchronization control means 21 performs the second implementation only when the attribute of the file 28 has an attribute presumed that the source URL is public. The efficiency improvement method described in the embodiment is used. On the other hand, if the consent is not obtained by the public data non-encryption consent means 24, a normal storage method is used. It should be noted that the normal storage method can be adopted consistently with either a method that has already been encrypted at the time of output from the client or a method that has been encrypted before being stored in the data storage area 48.

入手元URLが公開であるか否かの判定は、通常の個人用途ではプライベートな領域の除外方式を採ることができ、企業等のイントラネットがあるような状況ではホワイトリスト方式などを採ることができる。   Whether or not the source URL is public can be determined by using a private area exclusion method for normal personal use, or by using a white list method in situations where there is an intranet such as a company. .

第3の実施形態によれば、データの暗号化を行うレベルにファイルの入手元が公開であるか否かという情報に基づいて制御できるという効果がある。その理由は、ファイルに付加されている入手元のデータを使って、公開データには効率化手法を用い、公開ではないデータについては効率化のための情報を与えずにストレージサーバには暗号化されたデータのみが渡るという構成とするためである。   According to the third embodiment, there is an effect that control can be performed on the basis of information on whether or not a file acquisition source is open to a level at which data encryption is performed. The reason is that the source data attached to the file is used, the efficiency is applied to the public data, and the non-public data is encrypted to the storage server without giving information for efficiency. This is because only the processed data passes.

(第4の実施形態)
次に、図8を参照しながら、第4の実施形態に係るストレージシステム4について説明する。なお、第4の実施形態に係るストレージサーバ14の構成は、第1の実施形態に係るストレージサーバ33の構成と同じであるため、説明は省略する。また、ストレージシステム33の内部構成についても、同様の構成要素については説明を省略する。
(Fourth embodiment)
Next, the storage system 4 according to the fourth embodiment will be described with reference to FIG. Note that the configuration of the storage server 14 according to the fourth embodiment is the same as the configuration of the storage server 33 according to the first embodiment, and a description thereof will be omitted. Also, the description of the same components as the internal configuration of the storage system 33 is omitted.

まず、第4の実施形態に係るストレージシステム4と第1の実施形態に係るストレージシステム1との差異について説明する。   First, differences between the storage system 4 according to the fourth embodiment and the storage system 1 according to the first embodiment will be described.

第1の実施形態に係るストレージシステム1は、外部ウェブサイト51の公開のデータソースを用いる。それに対し、第4の実施形態に係るストレージシステム4は、ストレージサーバ34とは異なるストレージサーバ70(転送元ストレージ装置とも呼ぶ)をデータソースとする。   The storage system 1 according to the first embodiment uses a public data source of the external website 51. In contrast, the storage system 4 according to the fourth embodiment uses a storage server 70 (also referred to as a transfer source storage device) different from the storage server 34 as a data source.

第4の実施形態に係るストレージシステム4のクライアント14には、ストレージサーバ70に対してストレージサーバ34からのアクセス要求を出力するアクセス権一時設定手段26が付加されている。   An access right temporary setting unit 26 that outputs an access request from the storage server 34 to the storage server 70 is added to the client 14 of the storage system 4 according to the fourth embodiment.

ストレージサーバ70は、アクセス権一時設定手段26からのアクセス要求に応じて前記ストレージシステム34にアクセス権を設定するアクセス権設定手段71、データを格納するデータ格納領域72(格納手段とも呼ぶ)を有する。   The storage server 70 includes an access right setting unit 71 that sets an access right to the storage system 34 in response to an access request from the temporary access right setting unit 26, and a data storage area 72 (also referred to as a storage unit) that stores data. .

ストレージサーバ34には、第1の実施形態に係るストレージシステム31の外部データ取得手段42に替えて、同期データ判別手段41から指示されたストレージサーバ70上のデータにアクセスするデータ転送手段44を備える。なお、データ転送手段44は、本実施形態の概要に係るストレージシステム30のデータ検索手段402の一形態である。   The storage server 34 includes data transfer means 44 for accessing the data on the storage server 70 instructed by the synchronous data determination means 41 instead of the external data acquisition means 42 of the storage system 31 according to the first embodiment. . The data transfer unit 44 is one form of the data search unit 402 of the storage system 30 according to the outline of the present embodiment.

第4の実施形態に係るストレージシステム4は、データの入手元が公開ではなく、他のストレージサーバ70であるような場合の応用例である。   The storage system 4 according to the fourth embodiment is an application example in the case where the data acquisition source is not the public but the other storage server 70.

第4の実施形態に係るストレージシステム4の構成では、ファイル28の属性として、他のストレージサーバ70と同期しているデータであるという同期情報が付加されている。   In the configuration of the storage system 4 according to the fourth embodiment, synchronization information indicating that the data is synchronized with the other storage server 70 is added as an attribute of the file 28.

あるストレージサーバ70に既に格納されているデータを他のストレージサーバ70にも複製しようとしたときに、通常はクライアントを経由することになる。しかしながら、一般に、クライアントを経由するよりも、ストレージサーバ業者間のネットワークの方が高速であると期待できる。   When data already stored in a certain storage server 70 is to be copied to another storage server 70, it usually goes through a client. However, in general, it can be expected that the network between storage server vendors is faster than via a client.

そのため、他のストレージサーバ70からデータを転送する場合、クライアント14のアクセス権一時設定手段26は、データ転送元であるストレージサーバ70に対してストレージサーバ34からのアクセスが可能になるように設定する。なお、このような権限委譲に関する技術は、既存技術によって実現可能である。   Therefore, when transferring data from another storage server 70, the access right temporary setting means 26 of the client 14 sets the storage server 70 that is the data transfer source so that the storage server 34 can access it. . Note that such a technique related to delegation of authority can be realized by an existing technique.

次に、メタデータ送信手段22は、ストレージサーバ70上のデータにアクセスする手段をメタデータとして同期データ判別手段41に与える。   Next, the metadata transmission means 22 gives the means for accessing the data on the storage server 70 to the synchronous data determination means 41 as metadata.

次に、同期データ判別手段41は、データ転送手段44にデータ転送を指示する。   Next, the synchronous data determination unit 41 instructs the data transfer unit 44 to transfer data.

データ転送手段44は、第1の実施形態に係る外部データ取得手段42とほぼ同一の構成をもつ。なお、一般的なストレージサービスのデータ転送手段は標準化されつつあるので、データ転送手段44には特別な機能は設けない。すなわち、第1の実施形態のストレージサーバ21を応用した構成のストレージサーバ34および70間には、お互いを意識した特別な事前の機能提供等は必要ではない。   The data transfer unit 44 has substantially the same configuration as the external data acquisition unit 42 according to the first embodiment. Since data transfer means for general storage services are being standardized, the data transfer means 44 is not provided with a special function. That is, it is not necessary to provide a special advance function or the like that is conscious of each other between the storage servers 34 and 70 configured to apply the storage server 21 of the first embodiment.

なお、データ転送が完了した後の動作は、第1の実施形態に係るストレージシステム1の動作と同等であるので、説明は省略する。   Since the operation after the data transfer is completed is the same as the operation of the storage system 1 according to the first embodiment, the description is omitted.

最後に、ストレージサーバ34へのデータ格納が終了した時点で、アクセス権一時設定手段26はストレージサーバ34からのアクセス権をストレージサーバ70から削除する。   Finally, the access right temporary setting unit 26 deletes the access right from the storage server 34 from the storage server 70 when the data storage in the storage server 34 is completed.

ここで、一般的なストレージサービスと本実施形態に係る手法を用いたストレージサービスとの違いについて改めて説明する。   Here, the difference between a general storage service and a storage service using the method according to the present embodiment will be described again.

一般的なストレージサービスでは、クライアントからのデータ転送のみをデータソースとしていた。ところで、一般に、ストレージサービスを行う事業者が運営するストレージシステムは高速なネットワークに接続されている。そのため、ユーザの所有するデバイスからデータを転送するよりも、事業者によって運営されるストレージシステムが接続されたネットワークの能力を使い、データ元から直接ストレージシステムにデータを転送した方が効率的なケースが多い。   In general storage services, only data transfer from clients is used as a data source. By the way, in general, a storage system operated by an operator that provides storage services is connected to a high-speed network. Therefore, it is more efficient to transfer data directly from the data source to the storage system using the capacity of the network to which the storage system operated by the operator is connected rather than transferring data from the device owned by the user. There are many.

本発明の実施形態に係るストレージシステムでは、データの入手元の情報をクライアント上のファイルに付加する。また、本実施形態に係るストレージシステムでは、データの入手元の情報がない場合であっても、ファイル全体のハッシュ値情報などを基に最近格納された別データとの一致を推定する。そして、本実施形態に係るストレージシステムでは、クライアントからの実体データではなく、実体データのデータソースや最近格納された同一のデータからデータの転送を行う。その結果、本実施形態に係るストレージシステムによれば、クライアントとストレージサーバと間のデータ同期を効率化することが可能となる(第1・第2の実施形態:図3、図6)。   In the storage system according to the embodiment of the present invention, data acquisition source information is added to a file on the client. In addition, in the storage system according to the present embodiment, even when there is no information on the data acquisition source, the match with other recently stored data is estimated based on the hash value information of the entire file. In the storage system according to the present embodiment, data is transferred not from the entity data from the client but from the data source of the entity data or the recently stored identical data. As a result, according to the storage system of this embodiment, it is possible to improve the efficiency of data synchronization between the client and the storage server (first and second embodiments: FIGS. 3 and 6).

また、本実施形態に係るストレージシステムでは、ユーザデータが暗号化されない状態でストレージサーバに届くことを嫌うユーザに対しては、公開データのみに本実施形態に係る手法を適用する機能を、整合性を保ちつつ付加できる(第3の実施形態:図7)。   In addition, in the storage system according to the present embodiment, for users who do not want to reach the storage server in a state where user data is not encrypted, the function of applying the method according to the present embodiment only to public data is provided with consistency. (Third embodiment: FIG. 7).

また、本実施形態に係るストレージシステムでは、データソースが公開のものではなく、ストレージサーバ間のデータコピーなどである場合、データの転送元となるストレージサーバに対して、転送先となるストレージサーバからのアクセス権を一時的に付与する。その結果、本実施形態に係るストレージシステムによれば、ストレージサーバ間における直接転送を可能とする(第4の実施形態:図8)。   Further, in the storage system according to the present embodiment, when the data source is not a public one and is a data copy between storage servers, the storage server that is the transfer source is connected to the storage server that is the transfer destination. Is temporarily granted access rights. As a result, the storage system according to this embodiment enables direct transfer between storage servers (fourth embodiment: FIG. 8).

以上の本発明の実施形態に係るストレージ装置は、全てハードウェアで実現してもよいし、全てソフトウェアで実現してもよいし、ハードウェアとソフトウェアとを組み合わせて実現してもよい。また、本実施形態に係る手法を用いてストレージ装置を制御するストレージ制御方法も本発明に含まれる。さらに、本発明の実施形態に係るストレージ制御方法をコンピュータやサーバ、ストレージ装置などの情報処理装置に実行させるストレージ制御プログラムも本発明の範囲に含まれる。そして、本発明の実施形態に係るストレージ制御プログラムを格納した電子的、磁気的、光学的および電磁的な性質を応用した記憶媒体や半導体記憶媒体などのプログラム記憶媒体も本発明の範囲に含まれる。なお、本発明の実施形態に係るストレージ制御プログラムは、ネットワークを通じて取得されるものも含む。また、本実施形態に係るストレージ制御プログラムを格納するサーバシステムやストレージシステムなども本実施形態に係るプログラム記憶媒体範囲に含まれる。   The storage apparatus according to the embodiment of the present invention described above may be realized entirely by hardware, may be realized entirely by software, or may be realized by combining hardware and software. A storage control method for controlling a storage apparatus using the method according to the present embodiment is also included in the present invention. Furthermore, a storage control program that causes an information processing apparatus such as a computer, a server, or a storage apparatus to execute the storage control method according to the embodiment of the present invention is also included in the scope of the present invention. A program storage medium such as a storage medium or a semiconductor storage medium applying an electronic, magnetic, optical, or electromagnetic property storing the storage control program according to the embodiment of the present invention is also included in the scope of the present invention. . The storage control program according to the embodiment of the present invention includes a program acquired through a network. In addition, a server system and a storage system that store the storage control program according to the present embodiment are also included in the program storage medium range according to the present embodiment.

以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。   Although the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

1、2、3、4 ストレージシステム
10 端末装置
11、12、13、14 クライアント
21 同期制御手段
22 メタデータ送信手段
23 実体データ送信手段
24 パブリックデータ非暗号化承諾手段
26 アクセス権一時設定手段
27 ブラウザ
28 ファイル
30 ストレージ装置
31、32、33、34 ストレージサーバ
41 同期データ判別手段
42 外部データ取得手段
43 重複検出候補探索手段
44 データ転送手段
46 データ比較手段
47 実体データ要求手段
48 データ格納領域
50 情報源
51 外部ウェブサイト
52 ストレージサーバ
60 重複検出用共用キャッシュ領域
70 ストレージサーバ
71 アクセス権設定手段
72 データ格納領域
100 ストレージシステム
201 同期制御手段
202 メタデータ送信手段
203 実体データ送信手段
207 閲覧手段
208 ファイル格納手段
301 中央処理装置
302 RAM
303 ROM
304 入力装置
305 出力装置
306 通信モジュール
307 補助記憶装置
400 データ検証手段
401 同期データ判別手段
402 データ検索手段
406 データ比較手段
407 実体データ要求手段
408 データ格納手段
1, 2, 3, 4 Storage system 10 Terminal device 11, 12, 13, 14 Client 21 Synchronization control means 22 Metadata transmission means 23 Substantive data transmission means 24 Public data non-encryption acceptance means 26 Access right temporary setting means 27 Browser 28 File 30 Storage device 31, 32, 33, 34 Storage server 41 Synchronous data determination means 42 External data acquisition means 43 Duplicate detection candidate search means 44 Data transfer means 46 Data comparison means 47 Entity data request means 48 Data storage area 50 Information source 51 External Website 52 Storage Server 60 Duplicate Detection Shared Cache Area 70 Storage Server 71 Access Right Setting Unit 72 Data Storage Area 100 Storage System 201 Synchronization Control Unit 202 Metadata Transmission Stage 203 the entity data transmission unit 207 reading unit 208 file storage unit 301 central processing unit 302 RAM
303 ROM
304 Input Device 305 Output Device 306 Communication Module 307 Auxiliary Storage Device 400 Data Verification Unit 401 Synchronous Data Determination Unit 402 Data Search Unit 406 Data Comparison Unit 407 Entity Data Request Unit 408 Data Storage Unit

Claims (10)

端末装置からユーザデータのメタデータを取得し、取得した前記ユーザデータのメタデータの特徴をもつ外部データを検索し、検索された前記外部データおよび前記ユーザデータの特徴量を比較することによって前記ユーザデータと前記外部データとの一致・不一致を判別し、前記ユーザデータと前記外部データとの一致・不一致の判別結果に基づいて前記ユーザデータの実体データまたは前記外部データを取得するデータ検証手段と、
前記データ検証手段によって取得された前記ユーザデータの実体データまたは前記外部データを格納するデータ格納手段とを備えるストレージ装置。
Obtaining user data metadata from a terminal device, searching for external data having the characteristics of the acquired user data metadata, and comparing the searched external data and the feature amount of the user data Data verification means for determining whether the data and the external data match or not, and acquiring the user data entity data or the external data based on the match / mismatch determination result between the user data and the external data;
A storage apparatus comprising: data storage means for storing the actual data of the user data acquired by the data verification means or the external data.
前記データ検証手段は、
前記端末装置から前記ユーザデータのメタデータを取得し、取得した前記ユーザデータのメタデータの特徴をもつ前記外部データの有無を判定する同期データ判別手段と、
前記同期データ判別手段によって前記外部データが存在すると判定された場合に、前記端末装置から前記ストレージ装置への回線よりも容量の大きい回線を経由させて、外部の情報源から前記外部データを取得するデータ検索手段と、
前記ユーザデータと前記外部データとを比較し、前記ユーザデータと前記外部データとの一致・不一致を判定するデータ比較手段と、
前記データ比較手段によって前記ユーザデータと前記外部データとが一致しないと判定された場合または前記データ検索手段によって外部データが取得不能であった場合に、前記端末装置に対して前記ユーザデータの実体データを転送するように要求する実体データ要求手段とを有し、
前記データ格納手段は、
前記データ比較手段によって前記ユーザデータと前記外部データとが一致していると判断された場合には前記外部データを格納し、前記データ比較手段によって前記ユーザデータと前記外部データとが一致していないと判断された場合または前記データ検索手段によって前記外部データが取得不能であった場合には前記ユーザデータの実体データを前記端末装置から取得して格納する請求項1に記載のストレージ装置。
The data verification means includes
Synchronous data determination means for acquiring metadata of the user data from the terminal device, and determining presence or absence of the external data having the characteristics of the acquired metadata of the user data;
When the external data is determined by the synchronous data determination means, the external data is acquired from an external information source via a line having a capacity larger than the line from the terminal device to the storage device. Data retrieval means;
Data comparing means for comparing the user data and the external data, and determining whether the user data and the external data match or not;
If it is determined by the data comparison means that the user data and the external data do not match, or if the external data cannot be obtained by the data search means, the actual data of the user data to the terminal device Entity data requesting means for requesting to transfer,
The data storage means includes
If the data comparison means determines that the user data and the external data match, the external data is stored, and the user data and the external data do not match by the data comparison means The storage apparatus according to claim 1, wherein when it is determined that the external data cannot be acquired by the data search unit, the actual data of the user data is acquired from the terminal device and stored.
ユーザデータを格納する端末装置と、
前記端末装置から前記ユーザデータのメタデータを取得し、取得した前記ユーザデータのメタデータの特徴をもつ外部データを検索し、検索された前記外部データおよび前記ユーザデータの特徴量を比較することによって前記ユーザデータと前記外部データとの一致・不一致を判別し、前記ユーザデータと前記外部データとの一致・不一致の判別結果に基づいて前記ユーザデータの実体データまたは前記外部データを取得するデータ検証手段と、前記データ検証手段によって取得された前記ユーザデータの実体データまたは前記外部データを格納するデータ格納手段とを備えるストレージ装置とを備えるストレージシステム。
A terminal device for storing user data;
By acquiring metadata of the user data from the terminal device, searching for external data having the characteristics of the acquired metadata of the user data, and comparing feature values of the searched external data and the user data Data verification means for determining whether the user data and the external data match or not, and obtaining the user data entity data or the external data based on the match / mismatch determination result between the user data and the external data And a storage apparatus comprising: data storage means for storing the actual data of the user data acquired by the data verification means or the external data.
前記端末装置は、
前記ユーザデータを格納するファイル格納手段と、
外部からデータを取り込むために使用される閲覧手段と、
同期対象の前記ユーザデータに対して前記ストレージ装置と順次同期を行う同期制御手段と、
前記同期制御手段から前記ユーザデータのメタデータを取得し、取得したメタデータを前記ストレージ装置に送信するメタデータ送信手段と、
前記ストレージ装置から前記ユーザデータの実体データの転送要求があった場合に、前記ユーザデータの実体データを前記ストレージ装置に送信する実体データ送信手段とを有し、
前記データ検証手段は、
前記端末装置から前記ユーザデータのメタデータを取得し、取得した前記ユーザデータのメタデータの特徴をもつ前記外部データの有無を判定する同期データ判別手段と、
前記同期データ判別手段によって前記外部データが存在すると判定された場合に、前記端末装置から前記ストレージ装置への回線よりも容量の大きい回線を経由させて、外部の情報源から前記外部データを取得するデータ検索手段と、
前記ユーザデータと前記外部データとを比較し、前記ユーザデータと前記外部データとの一致・不一致を判定するデータ比較手段と、
前記データ比較手段によって前記ユーザデータと前記外部データとが一致しないと判定された場合または前記データ検索手段によって外部データが取得不能であった場合に、前記端末装置に対して前記ユーザデータの実体データを転送するように要求する実体データ要求手段とを有し、
前記データ格納手段は、
前記データ比較手段によって前記ユーザデータと前記外部データとが一致していると判断された場合には前記外部データを格納し、前記データ比較手段によって前記ユーザデータと前記外部データとが一致していないと判断された場合または前記データ検索手段によって前記外部データが取得不能であった場合には前記ユーザデータの実体データを格納する請求項3に記載のストレージシステム。
The terminal device
File storage means for storing the user data;
Browsing means used to capture data from outside,
Synchronization control means for sequentially synchronizing the user data to be synchronized with the storage device;
Metadata transmission means for acquiring metadata of the user data from the synchronization control means, and transmitting the acquired metadata to the storage device;
Entity data transmission means for transmitting the user data entity data to the storage device when there is a transfer request of the user data entity data from the storage device;
The data verification means includes
Synchronous data determination means for acquiring metadata of the user data from the terminal device, and determining presence or absence of the external data having the characteristics of the acquired metadata of the user data;
When the external data is determined by the synchronous data determination means, the external data is acquired from an external information source via a line having a capacity larger than the line from the terminal device to the storage device. Data retrieval means;
Data comparing means for comparing the user data and the external data, and determining whether the user data and the external data match or not;
If it is determined by the data comparison means that the user data and the external data do not match, or if the external data cannot be obtained by the data search means, the actual data of the user data to the terminal device Entity data requesting means for requesting to transfer,
The data storage means includes
If the data comparison means determines that the user data and the external data match, the external data is stored, and the user data and the external data do not match by the data comparison means 4. The storage system according to claim 3, wherein when the external data cannot be acquired by the data search means, the actual data of the user data is stored.
前記閲覧手段は、
データに紐付けられた統一資源位置指定子を含むブラウザとして実現され、
前記データ検索手段は、
前記統一資源位置指定子を介して接続されるウェブサイトから前記外部データを取得する請求項4に記載のストレージシステム。
The browsing means is:
Realized as a browser with a unified resource location specifier associated with the data,
The data search means includes
The storage system according to claim 4, wherein the external data is acquired from a website connected via the unified resource location specifier.
複数のストレージ装置によって共有され、最近転送されたデータと該データのハッシュ値を含む特徴量を格納する重複検出用共用キャッシュ領域を有し、
前記データ検索手段は、
前記重複検出用共用キャッシュ領域に格納された前記データの特徴量を使用して前記ユーザデータのメタデータと同じ特徴を持つデータの有無を検索し、前記ユーザデータと同じ特徴を持つデータが検索されれば前記重複検出用共用キャッシュ領域から該当する前記データを取得し、
前記実体データ要求手段は、
前記ユーザデータの実体データを前記データ格納手段に格納する際に、前記重複検出用共用キャッシュ領域にも前記ユーザデータの実体データを格納する請求項4に記載のストレージシステム。
A shared cache area for duplicate detection that stores a feature amount including a recently transferred data and a hash value of the data shared by a plurality of storage devices;
The data search means includes
Using the feature amount of the data stored in the duplicate detection shared cache area, the presence or absence of data having the same feature as the metadata of the user data is searched, and data having the same feature as the user data is searched. If so, the corresponding data is acquired from the duplicate detection shared cache area,
The entity data request means includes
5. The storage system according to claim 4, wherein when the user data entity data is stored in the data storage means, the user data entity data is also stored in the duplication detection shared cache area.
前記端末装置は、
前記ユーザデータが公開データである場合のみ、前記重複検出用キャッシュ領域に前記ユーザデータを暗号化せずに格納することを承諾するパブリックデータ非暗号化承諾手段を有する請求項6に記載のストレージシステム。
The terminal device
7. The storage system according to claim 6, further comprising public data non-encryption consent means that consents to store the user data without encryption in the duplication detection cache area only when the user data is public data. .
前記ストレージ装置に対してデータの転送元となる転送元ストレージ装置を備え、
前記端末装置は、
前記ストレージ装置から前記転送元ストレージ装置へのアクセス権を設定するアクセス権一時設定手段を有し、
前記転送元ストレージ装置は、
前記アクセス権一時設定手段からのアクセス要求に応じて転送先となる前記ストレージ装置にアクセス権を設定するアクセス権設定手段と、
データを格納する格納手段とを有し、
前記データ検索手段は、
前記同期データ判別手段の指示に応じて前記転送元ストレージ装置の格納手段に格納された前記データを取得する請求項4に記載のストレージシステム。
A transfer source storage device serving as a data transfer source for the storage device;
The terminal device
Access right temporary setting means for setting access rights from the storage device to the transfer source storage device;
The transfer source storage device is
An access right setting unit that sets an access right to the storage device as a transfer destination in response to an access request from the access right temporary setting unit;
Storage means for storing data,
The data search means includes
5. The storage system according to claim 4, wherein the data stored in the storage unit of the transfer source storage apparatus is acquired according to an instruction from the synchronous data determination unit.
端末装置からユーザデータのメタデータを取得し、
取得した前記ユーザデータのメタデータの特徴をもつ外部データを検索し、
検索された前記外部データおよび前記ユーザデータの特徴量を比較することによって前記ユーザデータと前記外部データとの一致・不一致を判別し、
前記ユーザデータと前記外部データとの一致・不一致の判別結果に基づいて前記ユーザデータの実体データまたは前記外部データを取得し、
前記ユーザデータの実体データまたは前記外部データをストレージ装置に格納するストレージシステムの制御方法。
Get user data metadata from the terminal device,
Search external data having the characteristics of the metadata of the acquired user data,
By comparing feature values of the searched external data and the user data to determine whether the user data and the external data match,
Based on the determination result of coincidence / mismatch between the user data and the external data, obtain the actual data of the user data or the external data,
A storage system control method for storing actual data of the user data or the external data in a storage device.
端末装置からユーザデータのメタデータを取得する処理と、
取得した前記ユーザデータのメタデータの特徴をもつ外部データを検索する処理と、
検索された前記外部データおよび前記ユーザデータの特徴量を比較することによって前記ユーザデータと前記外部データとの一致・不一致を判別する処理と、
前記ユーザデータと前記外部データとの一致・不一致の判別結果に基づいて前記ユーザデータの実体データまたは前記外部データを取得する処理と、
前記ユーザデータの実体データまたは前記外部データをストレージ装置に格納する処理とをコンピュータに実行させるストレージシステムの制御プログラム。
Processing to obtain user data metadata from the terminal device;
A process of searching for external data having metadata characteristics of the acquired user data;
A process of determining whether the user data and the external data match or not by comparing feature values of the searched external data and the user data;
A process of acquiring entity data of the user data or the external data based on a determination result of coincidence / mismatch between the user data and the external data;
A storage system control program for causing a computer to execute processing for storing the actual data of the user data or the external data in a storage device.
JP2014052881A 2014-03-17 2014-03-17 Storage device, storage system, storage system control method and control program Active JP6435616B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014052881A JP6435616B2 (en) 2014-03-17 2014-03-17 Storage device, storage system, storage system control method and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014052881A JP6435616B2 (en) 2014-03-17 2014-03-17 Storage device, storage system, storage system control method and control program

Publications (2)

Publication Number Publication Date
JP2015176393A true JP2015176393A (en) 2015-10-05
JP6435616B2 JP6435616B2 (en) 2018-12-12

Family

ID=54255522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014052881A Active JP6435616B2 (en) 2014-03-17 2014-03-17 Storage device, storage system, storage system control method and control program

Country Status (1)

Country Link
JP (1) JP6435616B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723153A (en) * 2020-06-18 2020-09-29 苏州琨山智能科技有限公司 Data synchronous processing method, device, equipment and storage medium

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234909A (en) * 2004-02-19 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> Upload type information distribution system, its method, user device, and program for the same
JP2005326915A (en) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> Network storage system, user management server, storage management server, caching device, program for user management server and program for storage management server
JP2009116839A (en) * 2007-10-19 2009-05-28 Hitachi Ltd Content transfer system, content transfer method and home server
WO2012001763A1 (en) * 2010-06-28 2012-01-05 株式会社日立製作所 Method of managing computer system and client computer
US20120297450A1 (en) * 2011-05-18 2012-11-22 International Business Machines Corporation Resource Upload
WO2012166442A1 (en) * 2011-06-03 2012-12-06 Apple Inc. Methods and apparatus for power state based backup
JP2013081158A (en) * 2011-08-18 2013-05-02 Apple Inc Management of downloads from network-based digital data repository based on network performance
US20130346537A1 (en) * 2012-06-18 2013-12-26 Critical Path, Inc. Storage optimization technology
JP2014010770A (en) * 2012-07-02 2014-01-20 Fuji Xerox Co Ltd Relay device
JP2014032610A (en) * 2012-08-06 2014-02-20 Asrise Co Ltd Online storage system, management server program, and file control program

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234909A (en) * 2004-02-19 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> Upload type information distribution system, its method, user device, and program for the same
JP2005326915A (en) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> Network storage system, user management server, storage management server, caching device, program for user management server and program for storage management server
JP2009116839A (en) * 2007-10-19 2009-05-28 Hitachi Ltd Content transfer system, content transfer method and home server
WO2012001763A1 (en) * 2010-06-28 2012-01-05 株式会社日立製作所 Method of managing computer system and client computer
JPWO2012001763A1 (en) * 2010-06-28 2013-08-22 株式会社日立製作所 Computer system management method and client computer
US20120297450A1 (en) * 2011-05-18 2012-11-22 International Business Machines Corporation Resource Upload
WO2012166442A1 (en) * 2011-06-03 2012-12-06 Apple Inc. Methods and apparatus for power state based backup
JP2013081158A (en) * 2011-08-18 2013-05-02 Apple Inc Management of downloads from network-based digital data repository based on network performance
US20130346537A1 (en) * 2012-06-18 2013-12-26 Critical Path, Inc. Storage optimization technology
JP2014010770A (en) * 2012-07-02 2014-01-20 Fuji Xerox Co Ltd Relay device
JP2014032610A (en) * 2012-08-06 2014-02-20 Asrise Co Ltd Online storage system, management server program, and file control program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723153A (en) * 2020-06-18 2020-09-29 苏州琨山智能科技有限公司 Data synchronous processing method, device, equipment and storage medium

Also Published As

Publication number Publication date
JP6435616B2 (en) 2018-12-12

Similar Documents

Publication Publication Date Title
US20230362165A1 (en) Identifying accounts having shared credentials
US9961053B2 (en) Detecting compromised credentials
US10277673B2 (en) Local server for synced online content management system
US11372990B2 (en) Restricting access to content
JP6810172B2 (en) Distributed data system with document management and access control
US10534927B2 (en) Identifying and blocking prohibited content items in a content management system
US9516107B2 (en) Secure local server for synchronized online content management system
US9930063B2 (en) Random identifier generation for offline database
US20140304384A1 (en) Uploading large content items
EP3716580B1 (en) Cloud file transfers using cloud file descriptors
US20240106902A1 (en) Communication protocols for an online content management system
US20160147900A1 (en) Automatic device upload configuration
JP6435616B2 (en) Storage device, storage system, storage system control method and control program
Elijorde et al. Ubiquitous Workspace Synchronization in a Cloud-based Framework
Dhoble et al. DE-DUPLICATION OF ENCRYPTED DATA ON CLOUD

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180516

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180914

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181029

R150 Certificate of patent or registration of utility model

Ref document number: 6435616

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150