JP2018190227A - ネットワーク分散型重複排除ファイルストレージシステム - Google Patents

ネットワーク分散型重複排除ファイルストレージシステム Download PDF

Info

Publication number
JP2018190227A
JP2018190227A JP2017093060A JP2017093060A JP2018190227A JP 2018190227 A JP2018190227 A JP 2018190227A JP 2017093060 A JP2017093060 A JP 2017093060A JP 2017093060 A JP2017093060 A JP 2017093060A JP 2018190227 A JP2018190227 A JP 2018190227A
Authority
JP
Japan
Prior art keywords
data
information processing
storage
file
file data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017093060A
Other languages
English (en)
Inventor
佳廣 西川
Yoshihiro Nishikawa
佳廣 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2017093060A priority Critical patent/JP2018190227A/ja
Publication of JP2018190227A publication Critical patent/JP2018190227A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】高い冗長性及び機密性を備え、低コストに運用可能なネットワーク型仮想ストレージを提供する。【解決手段】ストレージ及び制御アプリケーションソフトウエアを有しかつPeer to Peer方式で接続されたコンピュータネットワークを構築する複数台の情報処理装置を含むネットワーク分散型重複排除ファイルストレージにおいて、情報処理装置それぞれが、ファイルデータを複数に分割し、制御アプリケーションソフトウエア及びコンピュータネットワークを介して、他の情報処理装置が具備する各ストレージに分散して保存し、更に分割して保存したファイルデータを他の情報処理装置が具備する各ストレージから読み出して再構築可能とし、ファイルデータの保存時に、当該ファイルデータを構成する情報の一部又は全部を他の情報処理装置が有する場合、非重複データのみを保存し、ファイルデータの保存及び読み出し時のメタデータを、分散型台帳技術を用いて全ての情報処理装置で共有する。【選択図】図1

Description

本発明は、高い冗長性及び安全性を備え、低コストに運用可能なネットワーク分散型重複排除ファイルストレージシステムに関する。
現在、PCはビジネス及びパーソナル用途を主として様々な分野で必要不可欠なコンピュータとなっており、特に2000年以降、インターネットが普及した影響から一人が複数台のPCを操作する時代となっている。また、2016年度の国内におけるスマートフォンの出荷台数は、約2942万台であり、国内外メーカの大半がインターネットの利用を主軸に置いたスマートフォン市場に参入していることに加え、通信事業者はスマートフォンを主力商品と位置付けていることから、今後より広い分野でインターネットが活用されると予測できる。
さらに、2011年に発生した東日本大震災の影響で、企業が事業継続性や災害対策についての戦略を見直し、社員が様々な場所から社内ネットワーク等に接続して業務を行えるビジネスモビリティが重視されるようになった。
一方、個人向けクラウドサービスは、Google(登録商標)、Windows Live(登録商標)、Evernote(登録商標)、Dropbox(登録商標)が高い利用シェアを占めている。これらは、インターネットを用いたクライアントサーバ方式のコンピュータネットワークにより提供されるサービスであって、特に中央サーバのストレージをユーザで共有し、仮想的な外部ストレージとして利用されるクラウドストレージサービスは利用者数が多い。
特開2011−210151号公報 特開2015−172946号公報
しかしながら、上記クラウドストレージサービスは仮想ストレージに保存されたデータが第三者に渡る等のデータ流出を防止するため、種々のセキュリティー対策が施されているが、上述のとおりクライアントサーバ方式によるコンピュータネットワークを用いているため、中央サーバ及び該サーバに接続されたストレージにデータが格納される。よって従来のクラウドストレージサービスでは、当然サービス管理者が中央サーバにアクセス可能であるため、システム上のセキュリティーで第三者の干渉を防げたとしても、完全な機密性を構築することはできなかった。
ここで、従来のクラウドストレージサービスの構成に着目すると、上述の通りクライアントサーバ方式によって構築されたコンピュータネットワークであり、中央サーバ及び該中央サーバを主としたコンピュータネットワーク全体の管理者が必要となる。このため、中央サーバには所定の所有者が存在し、ユーザは該所有者のストレージ内に間借りしてプライベートデータを保存しており、機密性を備えていないことは明らかである。

そこで、本発明は、Peer to Peer方式でコンピュータネットワークを構築し、高い冗長性及び機密性を備え、低コストに運用可能なネットワーク型仮想ストレージシステムを提供することを目的とする。
上記の課題を解決すべく、本発明は、
ストレージ及び制御アプリケーションソフトウエアを有するN台(Nは2以上の整数、好ましくは16台以上、更に好ましくは64台以上)情報処理装置を含むネットワーク分散型重複排除ファイルストレージであって、
N台の前記情報処理装置が、Peer to Peer方式で接続されたコンピュータネットワークを構築しており、
N台の前記情報処理装置それぞれが、ファイルデータを複数に分割し、前記制御アプリケーションソフトウエア及び前記コンピュータネットワークを介して、(N−1)台の前記情報処理装置が具備する各前記ストレージに分散して保存し、更に分割して保存した前記ファイルデータを(N−1)台の前記情報処理装置が具備する各ストレージから読み出して再構築可能であり、
前記ファイルデータの保存時に、当該ファイルデータを構成する情報の一部又は全部を(N−1)台の前記情報処理装置が有する場合、当該(N−1)台の前記情報処理装置が有する重複データと紐付けて非重複データのみを保存し、
前記ファイルデータの保存及び読み出し時のメタデータを、分散型台帳技術を用いて全ての前記情報処理装置で共有すること、
を特徴とするネットワーク分散型重複排除ファイルストレージを提供する。
このような構成を有する本発明のネットワーク分散型重複排除ファイルストレージでは、データを管理する中央サーバを待たず、コンピュータネットワークを構築する複数台の情報処理装置が備えた全てのストレージを用いてデータ管理を行う。このため、特定装置へのアクセス集中が発生せず、スムーズな情報通信を行うことができる。
また、ファイルデータを分割し、それぞれを複数台の情報処理装置に分散して保存するため、個々の情報処理装置にはファイルデータの断片しか保存されない。よって当該保存方法は暗号化と併用することで保存したファイルデータの流出等好適に防止することができる。
本発明のネットワーク分散型重複排除ファイルストレージは、ファイルデータの保存に対し、上記ファイルデータ自身の保存と、当該ファイルデータの保存に関するメタデータの保存と、を行うことにより達成する。メタデータは分散型台帳技術を用いて全ての前記情報処理装置で共有するため、第三者によるメタデータの改竄や抜き取り等を防止することができる。また、中央サーバが存在しなくとも、メタデータがコンピュータネットワーク上に存在できるため、中央サーバの管理者等における特定の人物にメタデータ及び保存したファイルデータが流出することがない。
また、上記の本発明のネットワーク分散型重複排除ファイルストレージにおいては、前記メタデータが、少なくとも前記ファイルデータのハッシュ値と、前記ファイルデータの保存場所情報と、を有することが望ましい。
このような構成を有する本発明のネットワーク分散型重複排除ファイルストレージでは、メタデータがファイルデータから生成したハッシュ値と、当該ファイルデータの保存時に分割して生成した各断片等の保存場所情報と、を有するため、読み込み時において、分散保存された各断片に対し、スムーズにアクセスして再構築を行うことができる。
また、上記の本発明のネットワーク分散型重複排除ファイルストレージにおいては、前記制御アプリケーションソフトウエアがソフトウエア方式のRAIDコントローラ機能を備え、
前記コンピュータネットワークに接続された前記情報処理装置複数台のストレージを略RAID化することが望ましい。
このような構成を有する本発明のネットワーク分散型重複排除ファイルストレージでは、全ての情報処理装置を仮想ストレージとして使用することができ、例えば「RAIDZ」と略同様の構成にすることで保存したデータの冗長性を向上することができる。更に、情報処理装置の総数を増加することにより、「RAID6+1」や、「RAID6+6」等と同様に多階層化することで、障害耐性及び堅牢性が向上し、多数の情報処理端末に障害が発生してもファイルデータを復元することができる。よって、本ネットワーク分散型重複排除ファイルストレージは、コンピュータネットワークを構築する複数台の情報処理装置全てがアクティブである必要がなく、情報処理装置の総数に応じた所定の割合における台数がアクティブであれば、常時システムを問題なく稼働することができる。
また、上記の本発明のネットワーク分散型重複排除ファイルストレージにおいては、更に、前記ファイルデータの保存時にキー情報を設定し、前記キー情報を認証することにより読み出しを可能とすることが望ましい。
このような構成を有する本発明のネットワーク分散型重複排除ファイルストレージでは、ファイルデータの再構築を許可するためのキー情報を生成するため、仮に当該ファイル情報の断片を第三者が取得しても、ファイルデータの再構築は不可能となる。キー情報を有するユーザのみが保存したファイルデータの再構築が可能となるため、上記保存方法と併せて更にセキュリティーを向上することができる。
高い冗長性及び機密性を備え、低コストに運用可能なネットワーク型仮想ストレージを提供することができる。
本実施形態のネットワーク分散型重複排除ファイルストレージの概要を示すネットワーク概念図である。 クライアントサーバ方式のコンピュータネットワークと、Peer to Peer方式のコンピュータネットワークと、を比較した模式図である。 本実施形態のネットワーク分散型重複排除ファイルストレージを用いたファイルデータの保存概念を示す模式図である。 メタデータから構成されるブロック47の構成を示す模式図であって、図5は本実施形態のネットワーク分散型重複排除ファイルストレージを用いたブロック47の保存概念を示す模式図である。 本実施形態のネットワーク分散型重複排除ファイルストレージを用いたブロック47の保存概念を示す模式図である。 本実施形態におけるネットワーク分散型重複排除ファイルストレージの重複データの排除方法の概念を説明する模式図である。
以下、図1〜図6を参照しながら、本発明に係るネットワーク分散型重複排除ファイルストレージの代表的な実施形態を詳細に説明する。但し、本発明は図示されるものに限られるものではなく、各図面は本発明を概念的に説明するためのものであるから、理解容易のために必要に応じて比や数を誇張又は簡略化して表している場合もある。更に、以下の説明では、同一又は相当部分には同一符号を付し、重複する説明は省略することもある。
1.ネットワーク分散型重複排除ファイルストレージの概要
図1を用いて、本実施形態のネットワーク分散型重複排除ファイルストレージの概要について説明する。図1は、本実施形態のネットワーク分散型重複排除ファイルストレージの概要を示すネットワーク概念図である。
図1に示すとおり、本実施形態のネットワーク分散型重複排除ファイルストレージは、概ねハードウエアとなる複数台(N台:Nは2以上の整数)の情報処理装置1から構成され、当該複数台の情報処理装置1それぞれを接続して構築した分散型台帳技術(以下、本実施形態では「ブロックチェーン」とも称する)を備えるコンピュータネットワークを用いた仮想ストレージである。
個々の情報処理装置1は、コンピュータネットワークに接続されたその他の情報処理装置1を仮想ストレージとして使用することができ、更に保存したデータの冗長化及び暗号化によって、データ保護の信頼性と、第三者によるデータの抜き取りや改竄等を阻止する高いセキュリティーと、を備えている。
また、データの保存は、コンピュータネットワークに接続されたその他の情報処理装置1が有するその他のデータと比較され、双方の一部又は全部が合致した際は当該合致部分を除く非重複データのみを保存することにより、効率的なストレージ運用も可能とするものである。
2.ネットワーク分散型重複排除ファイルストレージの詳細
<情報処理装置1及びコンピュータネットワーク>
上記コンピュータネットワークを構築するN台の情報処理装置1は、それぞれ、少なくともCPU(中央演算処理装置)と、HDD(Hard Disk Drive)やSSD(Solid State Drive)等から構成されるストレージと、情報通信手段と、後述する制御アプリケーションソフトウエア13と、を備えたパーソナルコンピュータ(以下、本実施形態では「PC」とも称する)や携帯機器用OSを備えたスマートフォン、又はタブレット端末であって、これらN台の情報処理装置1がインターネットを介して接続することによりコンピュータネットワークを構築している。
なお、当該コンピュータネットワークは、インターネットに限らず、例えばLAN(Local Area Network)、CAN(Campus Area Network)、MAN(Metropolitan Area Network)、WAN(Wide Area Network)等を用いて限られた範囲内で構築してもよい。
当該コンピュータネットワークは、特定の役割を集中的に担当するサーバを配設したクライアントサーバ方式ではなく、接続した情報処理装置1個々を直接接続するPeer to Peer方式を用いている。即ち、本実施形態のネットワーク分散型重複排除ファイルストレージは、データを管理する中央サーバを待たず、コンピュータネットワークを構築する複数台の情報処理装置1が備えた全てのストレージを用いてデータ管理を行う。
クライアントサーバ方式では、コンピュータネットワークに接続した情報処理装置1の台数が一定以上多くなるとサーバ及び該サーバに接続する回線に負荷が集中するのに対し、Peer to Peer方式では情報処理装置1の台数が膨大になっても特定装置へのアクセス集中が発生せず、スムーズな情報通信を行える。
<制御アプリケーションソフトウエア13>
制御アプリケーションソフトウエア13は、複数台の情報処理装置1それぞれを上記Peer to Peer方式で接続し、ファイルデータ5の保存、変更、読み出しに係る処理を行うソフトウエアであって、各情報処理装置1にインストールされ、ストレージ内に格納される。また、本実施形態のネットワーク分散型重複排除ファイルストレージの各種情報と、操作に用いるインターフェイス等を可視化し、情報処理装置1が備えるディスプレイに表示する。
更に、当該制御アプリケーションソフトウエア13は、コンピュータネットワークに接続された複数台の情報処理装置1が備えるそれぞれのストレージを、仮想的な1台の記憶装置として管理する機能が備わっている。これは、RAID(Redundant Array of Independent Disks)と略同様にデータ管理の冗長性を向上させるものであって、制御アプリケーションソフトウエア13は、複数台の情報処理装置1で構築したコンピュータネットワークで略RAIDを実現するソフトウエア方式のRAIDコントローラとなる。
なお、本実施形態では、上記RAIDをソフトウエア方式としているが、コンピュータネットワークに接続された情報処理装置1全てに物理的なRAIDコントローラ(例えばSerialATAのRAIDコントローラカード等)を実装させることができればハードウエア方式のRAIDとすることも可能である。
本実施形態のネットワーク分散型重複排除ファイルストレージは、上記複数台の情報処理装置1で構築したコンピュータネットワークを略RAID化し、更に後述するブロックチェーンの概念を加えて構成したものである。
<ブロックチェーンの概要>
ブロックチェーンは、コンピュータネットワーク内において「ブロック」と呼ばれるデータの単位を一定時間ごとに生成し、当該「ブロック」を「チェーン」の様に連結していくことにより、データの保管及び管理を行う分散型データベース技術であり、現在は主にビットコイン(Peer to Peer型の暗号通過)の取引監視に用いられている。
図2に示すとおり、従来の一般的なクライアントサーバ方式で構築されたコンピュータネットワークでは、該ネットワークに接続された情報処理装置1間の通信履歴等を中央サーバのみが一括して管理していたのに対し、ブロックチェーンを用いたコンピュータネットワークは、全ての情報処理装置1がPeer to Peerで接続されているため、全ての情報処理装置1で共有管理することが可能である。
ブロックチェーンについて、より具体的には、「ブロック」と称するデータは、概ね直前に連結した他の「ブロック」のハッシュ値と、トランザクション情報(ビットコインではユーザ間の取引記録)と、該作業が実行された時間と、から構成され、PoW(Proof of Work)等のコンセンサス・アルゴリズムを用いて、例えば新規作業の処理に使用したCPU(中央演算装置)の演算量が最も多い情報処理装置が当該新規作業の履歴を有した最新「ブロック」を生成する。
この「ブロック」は、生成された順に連結されてブロックチェーンデータを構成し、Peer to Peer方式で接続された(N−1)台全ての情報処理装置とも共有する。即ち、例えば1台の情報処理装置で生成された「ブロック」を(N−1)台の情報処理装置と共有し、結果として、全体としてN台の情報処理装置で共有することになる。よって全ての情報処理装置が全く同様のブロックチェーンデータを有することになり、コンピュータネットワーク内で行われた全ての実行された作業履歴を共有することができる。
ブロックチェーンの技術を用いることにより、例えばコンピュータネットワークに接続された1台の情報処理装置が有するブロックチェーンデータに第三者が不正アクセスし、あるブロックのデータ改竄を試みても、当該ブロック以降のブロック全てを破棄しない限り実行は不可能である。更に、1台の情報処理装置が有するブロックチェーンデータを改竄したとしても、他の情報処理装置が共有するブロックチェーンデータと比較され、一定のルールに基づく多数決によって正統なデータを決定し、確実な同期を確保することができる。
3.ネットワーク分散型重複排除ファイルストレージを用いたデータの保存等
以下、上述したソフトウエア方式による略RAIDとブロックチェーンとの組合せによる具体的なファイルデータ5の保存、変更及び読み出しについて詳細に説明する。本実施形態のネットワーク分散型重複排除ファイルストレージは、ファイルデータ5保存を行うため、ファイルデータ5自身の保存と、当該ファイルデータ5の保存に関するメタデータの保存と、を行うことにより達成する。
当該説明では、理解容易とするために、第一情報処理装置23、第二情報処理装置25、第三情報処理装置27、第四情報処理装置29、第五情報処理装置31、の合計5台から構築されるコンピュータネットワークとし、第一保存データ17、第二保存データ19、第三保存データ21、の合計3つのファイルデータを保存するケースを代表して説明する。
<ファイルデータの保存>
図3を用いて、本実施形態のネットワーク分散型重複排除ファイルストレージを用いたファイルデータの保存について詳細に説明する。図3は、本実施形態のネットワーク分散型重複排除ファイルストレージを用いたファイルデータの保存概念を示す模式図である。
なお、本実施形態では、RAIDZ(可変ストライプ幅及びパリティ分散記録)の概念を基本としてファイルデータの保存を行っている。
図3に示すとおり、具体的なファイルデータの保存の流れは、まず、制御アプリケーションソフトウエア13が、第一保存データ17と、第二保存データ19と、第三保存データ21と、をそれぞれ3つに分割し、第一保存データ17の分割データをa断片17A、b断片17B、c断片17C、第二保存データ19の分割データをd断片19A、e断片19B、f断片19C、第三保存データ21の分割データをg断片21A、h断片21B、i断片21C、を生成する。
なお、当該分割工程時には、それぞれの断片を結合した際に元の保存データを再構成するためのキー情報が付与され、当該キー情報は例えば複数の文字列から構成されるパスワードとしてユーザに通知する、又は制御アプリケーションソフトウエア13が独自に管理する。当該キー情報はユーザの保存データを第三者が展開できない様にするためのものであって、同様のセキュリティーを得られるものであれば上記以外の手法を用いてもよい。
次に、同じく制御アプリケーションソフトウエア13が、a断片17A〜c断片17Cと、d断片19A〜f断片19Cと、g断片21A〜i断片21Cと、におけるそれぞれの第一パリティとして、P−abc33、P−def35、P−def37、を生成し、更に当該第一パリティとは異なる算出方法で生成した第二パリティとして、CP−abc39、CP−def41、CP−ghi43、を生成する。
なお、上記工程と同時に、各保存データから所定の計算手順を用いて規則性を有さない固定長の個別値を算出し、ハッシュ値45を生成する。なお、当該ハッシュ値45は、後述するメタデータの一部として使用される。
次に、上記までの手順により生成したa断片17A、b断片17B、c断片17C、d断片19A、e断片19B、f断片19C、g断片21A、h断片21B、i断片21C、と、P−abc33、P−def35、P−ghi37、CP−abc39、CP−def41、CP−ghi43、と、を、第一情報処理装置23、第二情報処理装置25、第三情報処理装置27、第四情報処理装置29、第五情報処理装置31、に保存する。
本実施形態では、各情報処理装置に対して図3の配置で各断片を振り分けて保存し、各パリティは各情報処理装置を跨いで保存している。また、上述のとおりRAIDZの概念を基にデータの保存を行うため、図3には表現していないが、各情報処理装置のストライプ幅49(図3では各情報処理装置の分割サイズ)は、保存する断片及びパリティのデータ容量に応じて可変とし、稼働速度及び耐障害性を向上している。
上記までの工程に従って、第一保存データ17、第二保存データ19、第三保存データ21、を、第一情報処理装置23、第二情報処理装置25、第三情報処理装置27、第四情報処理装置29、第五情報処理装置31、に保存することにより、例えば第一情報処理装置23に障害が生じた場合、該第一情報処理装置23に保存されたa断片17Aと、d断片19Aと、g断片21Aと、にアクセス不可能な状態となって、当該3つの断片を構成要素に持つ第一保存データ17と、第二保存データ19と、第三保存データ21と、の再構築は通常不可能となるが、a断片17Aの復元を可能とするP−abc33が第四情報処理装置29に存在し、またCP−abc39が第五情報処理装置31に存在するため、第一情報処理装置23に代替してa断片17Aをコンピュータネットワーク上に存在させることができる。
同様にd断片19Aは、第三情報処理装置27のP−def35又は第四情報処理装置29のCP−def41により、g断片21Aは、第二情報処理装置25のP−ghi37又は第三情報処理装置27のCP−ghi43により、復元可能である。
また、第一情報処理装置23と同様に、第二〜第五情報処理装置31に障害が発生した場合においても、それぞれの断片に対応したパリティが他の正常な情報処理装置に存在している限り、復元することできる。
更に、上記構成によると、2台の情報処理装置に障害が発生しても、いずれかの断片が完全に消失することはない。具体的には、例えば第四情報処理装置29と、第五情報処理装置31と、に障害発生した場合、第四情報処理装置29に保存されたh断片21Bは、第二情報処理装置25に保存されたP−ghi37、又は第三情報処理装置27に保存されたCP−ghi43から復元可能であり、第五情報処理装置31に保存されたf断片19Cは、第三情報処理装置27に保存されたP−def35、又は第四情報処理装置29に保存されたCP−def41から復元可能であり、更にi断片21Cは、第二情報処理装置25に保存されたP−ghi37、又は第三情報処理装置27に保存されたCP−ghi43から復元することが可能である。
よって、当該構成では5台の情報処理装置の内、3台の情報処理装置が正常であれば第一保存データ17〜第三保存データ21全ての復元が可能であり、仮想的なストレージとして稼働を継続することができる。
なお、図3の構成では、5台の情報処理装置を用いて構成されているが、更に多数の情報処理装置を用いた構成にすることで、例えば「RAID6+1」や、「RAID6+6」等と同様に障害耐性及び堅牢性が向上し、より多数の情報処理端末に障害が発生しても全てのファイルデータ5を復元することができる。理論的には、上記のとおり数千台(N:N≧数千)以上の情報処理装置を含み、その1/3台(1/3N)以上がアクティブに稼働しているのが好ましい。よって、本実施形態のネットワーク分散型重複排除ファイルストレージは、コンピュータネットワークを構築する複数台の情報処理装置全てがアクティブである必要がなく、情報処理装置の総数に応じた所定の割合における台数がアクティブであれば、常時システムを問題なく稼働することができる。
<メタデータの保存>
次に、図4及び図5を用いて、本実施形態のネットワーク分散型重複排除ファイルストレージを用いたメタデータの保存について詳細に説明する。図4は、メタデータから構成されるブロック47の構成を示す模式図であって、図5は本実施形態のネットワーク分散型重複排除ファイルストレージを用いたブロック47の保存概念を示す模式図である。
本実施形態のネットワーク分散型重複排除ファイルストレージは、ブロックチェーンの技術を用いてファイルデータの保存に関するメタデータを保存している。メタデータとは、概ねファイルデータ5から生成したハッシュ値45と、当該ファイルデータ5の保存時に分割して生成した各断片及びパリティの保存場所情報51と、当該ファイルデータ5の保存時間情報53と、から構成されたものである。
図4に示すとおり、メタデータをブロックチェーンの技術を用いて保存するため、ファイルデータ5の保存時に制御アプリケーションソフトウエア13が、ハッシュ値45と、保存場所情報51と、保存時間情報53と、前ブロックのハッシュ値55と、を含むブロック47を生成する。当該ブロック47は、上記ブロックチェーンの概要で詳述したブロックと同様に、生成された順番に複数個が連結され、ブロックチェーンデータ11を形成するものであり、隣合うブロックは前ブロックのハッシュ値55により位置関係が固定されている。
また、図5に示すとおり、例えば複数台の情報処理装置により構築されたコンピュータネットワークで、ある情報処理装置101が新しいブロック47を生成した場合、当該ブロック47は他の情報処理装置103全てに送信される。また、ブロック47を生成した情報処理装置1を含める全ての情報処理装置は、新しいブロック47を自身が保有しているブロックチェーンデータ11と結合し、該ブロックチェーンデータ11を更新する。
なお、上記では代表して情報処理装置1が新しいブロック47を生成したが、他の情報処理装置が新しいブロック47を生成した場合も同様にブロックチェーンデータ11の更新が行われる。
これにより、常時最新のブロックチェーンデータ11がコンピュータネットワークを構築する全ての情報処理装置で共有され、第三者によるメタデータの改竄や抜き取り等を好適に防止することができる。また、中央サーバが存在しなくとも、メタデータがコンピュータネットワーク上に存在できるため、中央サーバの管理者等における特定の人物にメタデータ及び保存したファイルデータ5の情報を取得されることがない。
<ファイルデータの読み出し及び変更>
次に、本実施形態のネットワーク分散型重複排除ファイルストレージに保存したファイルデータ5の読み出しについて説明する。
まず、制御アプリケーションソフトウエア13が保存したファイルデータ5のキー情報を受け付け、当該キー情報の照合を行った後、指定されたファイルデータ5のメタデータをブロックチェーンデータ11から参照する。
続いて、参照したメタデータからファイルデータ5を構成する断片及びパリティの保存場所を特定し、当該保存場所となる複数台の情報処理装置にアクセスした後、断片を読み込んで暗号化の解除及び結合し、ファイルデータ5を再構築する。なお、保存場所となる情報処理装置がパッシブ又は障害等を発生していた場合は、パリティから該当する断片を復元し、これを代用することでファイルデータ5を再構築する。
次に、本実施形態のネットワーク分散型重複排除ファイルストレージに保存したファイルデータ5の変更について説明する。
4.重複データの排除
次に、図6を用いて重複データを排除する保存方法について詳細に説明する。図6は、本実施形態におけるネットワーク分散型重複排除ファイルストレージの重複データの排除方法の概念を説明する模式図である。上述のとおり、本実施形態のネットワーク分散型重複排除ファイルストレージは、複数台の情報処理装置から構成される仮想ストレージを効率的に運用するため、ファイルデータ5を保存する際に、当該ファイルデータ5と、コンピュータネットワークを構築する全ての情報処理装置に保存された他のデータと、を比較して重複部を排除し、非重複部のみを保存対象とする。
当該説明では、理解容易のため、保存するファイルデータ5を第一データ57、比較するデータを第二データ59として具体的に説明する。まず、ユーザが制御アプリケーションソフトウエア13を用いて保存する第一データ57を指定し、制御アプリケーションソフトウエア13が当該第一データ57を認識する。続いて、制御アプリケーションソフトウエア13は、第一データ57を所定の間隔で区切ってa部5A、b部5B、c部5C、d部5D、e部5E、f部5F、g部5G、h部5H、とし、それぞれのデータ内容及び構成等を確認する。
次に、制御アプリケーションソフトウエア13は、コンピュータネットワークを構築する全ての情報処理装置に保存された他のデータを参照し、第一データ57を構成する上記a部5A〜h部5Hに類似する部位を有する第二データ59を選択する。なお、参照対象となる上記他のデータにおいても、自身が保存される際に、重複データの排除工程を経ているため、第一データ57と同様に所定の間隔で区切り、それぞれの内容及び構成等が確認されている。よって、当該情報のハッシュ値をメタデータに含めていれば、重複データ排除を実行する制御アプリケーションソフトウエア13は、自身がインストールされた情報処理装置が有するブロックチェーンデータ11を参照することで迅速かつ容易に完結することができる。
ここでは、選択されたデータが第二データ59のみとして説明するが、当該工程で選択されるデータ数は、参照結果によって変動してもよい。
続いて、第一データ57を構成するa部5A、b部5B、c部5C、d部5D、e部5E、f部5F、g部5G、h部5H、と、第二データ59を構成するi部59Aと、j部59Bと、k部59Cと、l部59Dと、m部59Eと、n部59Fと、o部59Gと、p部59Hと、を更に詳細に比較し、同一データとなる部位を特定する。
より具体的には、第一データ57のb部5Bは、第二データ59のj部59Bと同一データであり、第一データ57のc部57Cは、第二データ59のn部59Fと同一データであり、第一データ57のg部57Gは、第二データ59のl部59Dと同一データであることを特定する。
次に、重複データとなるb部57Bと、c部57Cと、g部57Gと、を保存対象から排除し、非重複データであるa部57Aと、d部57Dと、e部57Eと、f部57Fと、h部57Hと、から構成される圧縮第一データ157を保存する。
a部5Aからh部5Hまでの全てを保存対象とすると、重複データを含めて複数台の情報処理装置から構成される仮想ストレージに保存してしまうが、上記重複データの排除を行うことにより、当該仮想ストレージの総容量の圧迫と、保存時の作業の長時間化と、を抑制し、仮想ストレージを効率的に運用することが可能となる。
上記重複データの排除は、例えば分割した部位数、重複データの内容、重複データと同データを有する第二データ59の情報及び保存場所情報等をメタデータに追加することで、読み出し及び変更時に保存した第一データ57を用意に再構築することができる。
また、後に重複データを有する第二データ59に対して変更や削除等が行わる場合は、第一データ57と共有する重複部位のみが複製保管されるため、第二データ59が仮想ストレージから完全に削除されても第一データ57は問題なく再構築することができる。
本実施形態のネットワーク分散型重複排除ファイルストレージは、ネットワークを構成する情報処理装置の台数や、保存されるデータの種類にも依存するが、上記重複データの排除により、理論値として70%〜85%の圧縮率を達成することができる。
本実施形態のネットワーク分散型重複排除ファイルストレージは、上述の内容により構築されているため、一般的なクラウドを用いたオンラインストレージ提供サービスとは異なり、オンラインストレージの運営者等に対しても保存したデータが流出することがない。また、データセンタの配設が不要となるため、該データセンタのシステム維持、エンジニアの人件費を含め、その他稼働に必要な種々のコストを大幅に削減することが可能である。
また、本ネットワーク分散型重複排除ファイルストレージは、コンピュータネットワークを構築する情報処理装置の台数により仮想ストレージの総容量(各情報処理装置が備えたストレージの容量の和)が決定するものであるが、インターネットに接続可能なPCやスマートフォン等であれば、当該機器の所有者が任意に接続することができるため、ユーザ数が増加することにより、仮想ストレージの総容量も同様に増加する。
本ネットワーク分散型重複排除ファイルストレージを構成するコンピュータネットワークに接続した情報処理装置は、必ずしも具備したストレージの全容量を仮想ストレージに提供する必要はなく、情報処理装置の所有者が任意に提供する容量を決定することができるため、接続後も情報処理装置を通常とおり使用することが可能である。このため、PCやスマートフォンの所有者は、容易に本ネットワーク分散型重複排除ファイルストレージに参加することができ、例えば仮想ストレージに提供した容量と同容量分の仮想ストレージを無料で使用可能等にすることで、ユーザ数の増加と、それに伴う仮想ストレージの総容量の増加と、を期待することができる。
更に、本ネットワーク分散型重複排除ファイルストレージに保存されたデータは、第三者機関等を介することなくユーザ間で送受信することができる。当該送受信は、キー情報の共有又は相手側ユーザの指定等を行うことにより実行できるため、仮想通過を用いたデジタル資産(画像、映像、音楽等)の売買に用いることも可能となる。売買対象となるデジタル資産及び仮想通貨のやり取りがブロックチェーンで管理されるため、安全に取引を行いつつ、著作権の保護にも大きく寄与することが可能である。
以上、本発明の実施形態について図面を参照しつつ説明してきたが、本発明は、これらの実施形態に限定されるものではなく、特許請求の範囲の記載の精神及び教示を逸脱しない範囲でその他の改良例や変形例が存在する。そして、かかる改良例や変形例は全て本発明の技術的範囲に含まれることは、当業者にとっては容易に理解されるところである。
例えば、本実施形態のネットワーク分散型重複排除ファイルストレージに対するデータの保存、編集、削除等の操作を、情報処理装置1に物理的に接続されたストレージドライブ(USBフラッシュメモリ等)の操作と同様に行えるように、操作性及びインターフェイスを向上させるアプリケーションソフトウエア(デバイスドライバを含む)を追加してもよい。
本発明により提供されるネットワーク分散型重複排除ファイルストレージシステムは、高い冗長性及び機密性を備え、低コストに運用可能なネットワーク型仮想ストレージシステムである。
1 情報処理装置
11 ブロックチェーンデータ
13 制御アプリケーションソフトウエア
15 中央サーバ
17 第一保存データ
17A a断片
17B b断片
17C c断片
19 第二保存データ
19A d断片
19B e断片
19C f断片
21 第三保存データ
21A g断片
21B h断片
21C i断片
23 第一情報処理装置
25 第二情報処理装置
27 第三情報処理装置
29 第四情報処理装置
31 第五情報処理装置
33 P−abc
35 P−def
37 P−ghi
39 CP−abc
41 CP−def
43 CP−ghi
45 ハッシュ値
47 ブロック
49 ストライプ幅
51 保存場所情報
53 保存時間情報
55 前ブロックのハッシュ値
57 第一データ
57A a部
57B b部
57C c部
57D d部
57E e部
57F f部
57G g部
57H h部
59 第二データ
59A i部
59B j部
59C k部
59D l部
59E m部
59F n部
59G o部
59H p部
101 情報処理装置
103 他の情報処理装置
157 圧縮第一データ

Claims (4)

  1. ストレージ及び制御アプリケーションソフトウエアを有するN台(Nは2以上の整数)の情報処理装置を含むネットワーク分散型重複排除ファイルストレージであって、
    N台の前記情報処理装置が、Peer to Peer方式で接続されたコンピュータネットワークを構築しており、
    N台の前記情報処理装置それぞれが、ファイルデータを複数に分割し、前記制御アプリケーションソフトウエア及び前記コンピュータネットワークを介して、(N−1)台の前記情報処理装置が具備する各前記ストレージに分散して保存し、更に分割して保存した前記ファイルデータを(N−1)台の前記情報処理装置が具備する各ストレージから読み出して再構築可能であり、
    前記ファイルデータの保存時に、当該ファイルデータを構成する情報の一部又は全部を(N−1)台の前記情報処理装置が有する場合、当該(N−1)台の前記情報処理装置が有する重複データと紐付けて非重複データのみを保存し、
    前記ファイルデータの保存及び読み出し時のメタデータを、分散型台帳技術を用いて全ての前記情報処理装置で共有すること、
    を特徴とするネットワーク分散型重複排除ファイルストレージ。
  2. 前記メタデータが、少なくとも前記ファイルデータのハッシュ値と、前記ファイルデータの保存場所情報と、を有すること、
    を特徴とする請求項1に記載のネットワーク分散型重複排除ファイルストレージ。
  3. 前記制御アプリケーションソフトウエアがソフトウエア方式のRAIDコントローラ機能を備え、
    前記コンピュータネットワークに接続された前記情報処理装置複数台のストレージを略RAID化すること、
    を特徴とする請求項1又は2に記載のネットワーク分散型重複排除ファイルストレージ。
  4. 前記ファイルデータの保存時にキー情報を設定し、前記キー情報を認証することにより読み出しを可能とすること、
    を特徴とする請求項1〜3のいずれかに記載のネットワーク分散型重複排除ファイルストレージ。
JP2017093060A 2017-05-09 2017-05-09 ネットワーク分散型重複排除ファイルストレージシステム Pending JP2018190227A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017093060A JP2018190227A (ja) 2017-05-09 2017-05-09 ネットワーク分散型重複排除ファイルストレージシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017093060A JP2018190227A (ja) 2017-05-09 2017-05-09 ネットワーク分散型重複排除ファイルストレージシステム

Publications (1)

Publication Number Publication Date
JP2018190227A true JP2018190227A (ja) 2018-11-29

Family

ID=64478701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017093060A Pending JP2018190227A (ja) 2017-05-09 2017-05-09 ネットワーク分散型重複排除ファイルストレージシステム

Country Status (1)

Country Link
JP (1) JP2018190227A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636389A (zh) * 2018-12-13 2019-04-16 东软集团股份有限公司 区块链出块时间的确定方法、装置、设备及存储介质
JP2020511808A (ja) * 2018-12-19 2020-04-16 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 共有秘密ベースのブロックチェーン記憶
JP2020091565A (ja) * 2018-12-04 2020-06-11 株式会社Sound−FinTech 仮想通貨の運営基盤システム
JP2021043770A (ja) * 2019-09-12 2021-03-18 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2021093016A (ja) * 2019-12-11 2021-06-17 株式会社ブルーキャッスル ブロックチェーン技術と分散ストレージ技術とにより実現した分散型ストレージプラットフォームおよびアプリケーションプログラム
KR20210082481A (ko) 2019-01-23 2021-07-05 가부시끼가이샤 히다치 세이사꾸쇼 데이터베이스 관리 서비스 제공 시스템
JPWO2021172589A1 (ja) * 2020-02-28 2021-09-02
JP7462922B2 (ja) 2019-12-11 2024-04-08 株式会社ブルーキャッスル ブロックチェーン技術と分散ストレージ技術とにより実現した分散型ストレージプラットフォームおよびアプリケーションプログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020091565A (ja) * 2018-12-04 2020-06-11 株式会社Sound−FinTech 仮想通貨の運営基盤システム
CN109636389A (zh) * 2018-12-13 2019-04-16 东软集团股份有限公司 区块链出块时间的确定方法、装置、设备及存储介质
CN109636389B (zh) * 2018-12-13 2020-09-22 东软集团股份有限公司 区块链出块时间的确定方法、装置、设备及存储介质
JP2020511808A (ja) * 2018-12-19 2020-04-16 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 共有秘密ベースのブロックチェーン記憶
JP7005639B2 (ja) 2018-12-19 2022-01-21 アドバンスド ニュー テクノロジーズ カンパニー リミテッド 共有秘密ベースのブロックチェーン記憶
KR20210082481A (ko) 2019-01-23 2021-07-05 가부시끼가이샤 히다치 세이사꾸쇼 데이터베이스 관리 서비스 제공 시스템
US11797556B2 (en) 2019-01-23 2023-10-24 Hitachi, Ltd. Database management service provision system
JP2021043770A (ja) * 2019-09-12 2021-03-18 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP7234870B2 (ja) 2019-09-12 2023-03-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP2021093016A (ja) * 2019-12-11 2021-06-17 株式会社ブルーキャッスル ブロックチェーン技術と分散ストレージ技術とにより実現した分散型ストレージプラットフォームおよびアプリケーションプログラム
JP7462922B2 (ja) 2019-12-11 2024-04-08 株式会社ブルーキャッスル ブロックチェーン技術と分散ストレージ技術とにより実現した分散型ストレージプラットフォームおよびアプリケーションプログラム
JPWO2021172589A1 (ja) * 2020-02-28 2021-09-02
JP7158690B2 (ja) 2020-02-28 2022-10-24 長瀬産業株式会社 情報処理システム、及びプログラム

Similar Documents

Publication Publication Date Title
US11157366B1 (en) Securing data in a dispersed storage network
JP2018190227A (ja) ネットワーク分散型重複排除ファイルストレージシステム
US10824495B2 (en) Cryptographic key storage in a dispersed storage network
US10133631B2 (en) Multi option rebuilding in a dispersed storage network
US10693640B2 (en) Use of key metadata during write and read operations in a dispersed storage network memory
US10437678B2 (en) Updating an encoded data slice
US10042577B2 (en) Storing and retrieving mutable objects
US20190004727A1 (en) Using a namespace to augment de-duplication
US20190005261A1 (en) Secure shared vault with encrypted private indices
US10650160B2 (en) Enhancing security for multiple storage configurations
US20230350918A1 (en) Storage Network for Rebuilding Encoded Data Slices and Processing System for Use Therewith
US10225271B2 (en) Distributed storage network with enhanced security monitoring
US10331519B2 (en) Application of secret sharing schemes at multiple levels of a dispersed storage network
US20180336099A1 (en) Tracking data access in a dispersed storage network
US10120574B2 (en) Reversible data modifications within DS units
US10853171B2 (en) Encoding data in a dispersed storage network
US11153384B2 (en) Rebuilding derived content
US20190007380A1 (en) De-duplication of data streams
US10360391B2 (en) Verifiable keyed all-or-nothing transform
US11782789B2 (en) Encoding data and associated metadata in a storage network
US10353772B2 (en) Selecting data for storage in a dispersed storage network
US20170322734A1 (en) Using locks to prevent multiple rebuilds of the same source