JP4951331B2 - ストレージシステム - Google Patents

ストレージシステム Download PDF

Info

Publication number
JP4951331B2
JP4951331B2 JP2006350236A JP2006350236A JP4951331B2 JP 4951331 B2 JP4951331 B2 JP 4951331B2 JP 2006350236 A JP2006350236 A JP 2006350236A JP 2006350236 A JP2006350236 A JP 2006350236A JP 4951331 B2 JP4951331 B2 JP 4951331B2
Authority
JP
Japan
Prior art keywords
file
information
duplicate
full
text search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006350236A
Other languages
English (en)
Other versions
JP2008158993A (ja
Inventor
孝好 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006350236A priority Critical patent/JP4951331B2/ja
Priority to US11/682,359 priority patent/US7984026B2/en
Publication of JP2008158993A publication Critical patent/JP2008158993A/ja
Priority to US13/158,497 priority patent/US8244690B2/en
Application granted granted Critical
Publication of JP4951331B2 publication Critical patent/JP4951331B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、RAID制御機能等を備えるストレージ装置(ディスクアレイ装置)及びストレージシステム、並びに全文検索機能を備える情報処理システムに関し、特に、ストレージ装置に格納されるデータファイルの全文検索処理に関する。
近年、ストレージ容量節約などのために、デ・デュプリケート(De-duplicate)機能を備えるストレージシステムが注目されており、普及しつつある。例えば、NAS(Network Attached Storage)やストレージ装置にデ・デュプリケート機能を備える。デ・デュプリケート機能では、ストレージ装置の記憶領域に格納しようとしている、あるいは格納されている、ファイル(データファイル)について、その中身(メタデータ等を除くデータ本体)が同一のもの、例えば複製ファイル等、を検出し、デ・デュプリケートする。即ち、デ・デュプリケート機能は、デ・デュプリケートの制御として、検出した複数の中身同一ファイルについて、記憶領域への格納を1回に抑える、あるいは1つのファイル(代表ファイル)に共通化して保持する。これにより、記憶領域に対する入出力及びストレージ容量を節約する。デ・デュプリケートと同様の概念・用語としては、シングルインスタンス化(Single Instance Store)、共通化などがある。
また、全文検索機能を備えるストレージシステムにおいて、全文検索機能(全文検索サーバ等)は、ストレージ装置から検索処理対象ファイル群を読み出し、全文検索のためのインデックス(索引)情報を作成する処理を行う。ホスト装置からの検索指示・要求に対し、全文検索機能は、インデックス情報を検索し、その検索結果を応答する。
米国特許第5813008号(特許文献1)には、上記デ・デュプリケートの技術について記載されている。なお、この技術では、検索のインデックス情報についてはデ・デュプリケート(共通化)の対象外としている。
米国特許第6389433号(特許文献2)には、デ・デュプリケート機能を備えるファイルサーバについて記載されている。
米国特許第5813008号 米国特許第6389433号
前記従来のデ・デュプリケート機能及び全文検索機能を備えるストレージシステムにおいて、前記全文検索に用いるインデックス情報は、デ・デュプリケート機能の対象外である。即ち、複数の中身同一ファイルについても、別々に、重複して同様のインデックス情報が作成及び保持されている。これにより、インデックス情報の保持量の増大を招いているという問題がある。
本発明は以上のような問題に鑑みてなされたものであり、その目的は、デ・デュプリケート機能及び全文検索機能を備えるストレージシステム等に係わり、主に、全文検索のインデックス情報の量を削減して記憶資源を節約できる技術を提供することにある。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。前記目的を達成するために、本発明は、ストレージ装置を含んで構成されるストレージシステムまたは情報処理システム等であって、以下に示す技術的手段及び構成を備えることを特徴とする。
本発明のシステムでは、ネットワーク等を通じて接続される、ホスト装置、1つ以上のストレージ装置及びサーバ装置等を有する。本システムは、デ・デュプリケート機能(デ・デュプリケート処理部)、及び、全文検索機能(全文検索処理部)を備え、さらに、デ・デュプリケート処理部のデ・デュプリケート処理に対応して、インデックス情報をデ・デュプリケート処理する手段を備える。本システムは、その手段として、全文検索機能をデ・デュプリケート機能に対応したものにするデ・デュプリケート対応機能(デ・デュプリケート対応処理部)を備える。換言すれば、全文検索処理部は、インデックス情報をデ・デュプリケートする処理を含む処理を行うデ・デュプリケート対応処理部を備える。
本システムは、例えば、NAS等の第1のストレージ装置(ファイルサーバ装置)、ファイルを格納する第2のストレージ装置、及び全文検索処理部を備える全文検索サーバ装置を有する。そして、例えば、NASにデ・デュプリケート処理部を備え、全文検索サーバ装置にデ・デュプリケート対応処理部を備える構成である。あるいは、全文検索サーバ装置にデ・デュプリケート処理部及びデ・デュプリケート対応処理部を備える構成などである。ホスト装置は、NASに対してファイルの入出力の要求を行い、NASは、ストレージ装置の記憶領域(ボリューム)へファイルを入出力して応答する。また、ホスト装置は、全文検索サーバ装置に対してファイルの全文検索の指示・要求を行い、全文検索サーバ装置は、全文検索の結果を応答する。
本システムは、例えば以下(1)〜(4)のような処理を行う。
(1)デ・デュプリケート処理部は、ホスト装置からの書き込み等によりストレージ装置の記憶領域に格納されるファイル群についてデ・デュプリケートする処理を行う。それと共に、デ・デュプリケート処理部等は、そのデ・デュプリケートの状況(状態)を示す第1の情報(デ・デュプリケート情報:C1)を、外部(全文検索処理部)に対して提供する。
(2)全文検索処理部は、全文検索処理(インデックス情報作成処理)の対象ファイル群を読み出して、キーワード抽出処理を含むインデックス情報作成処理を行う。デ・デュプリケート対応処理部は、第1の情報(C1)の取得により、対象ファイルのデ・デュプリケート状況を認識し、第1の情報(C1)をもとに、全文検索処理のために、対象ファイルのデ・デュプリケート関係(デ・デュプリケートグループ)等を示す第2の情報(デ・デュプリケートグループ情報:C2)を作成し管理する。例えば、インデックス情報内に、第2の情報(C2)を関連付けて追加・保持する。
(3)デ・デュプリケート対応処理部は、第1の情報(C1)、第2の情報(C2)をもとに、対象ファイル群について、代表ファイルを除く中身が同一のファイルが存在すること等を検出・判定する。また、そのことを検出した場合、デ・デュプリケート対応処理部は、複数の中身同一ファイルに対して、代表ファイルを除き、インデックス情報作成処理におけるキーワード抽出処理自体を抑止する。即ち、全文検索処理部は、ある対象ファイルについて、それと中身が同一のファイルのインデックス情報が既に作成及び保持済みである場合、当該対象ファイルについて、キーワード抽出処理を行わないようにする。これによって、インデックス情報の量(保持量)を最大限に削減する。
(4)全文検索処理部(デ・デュプリケート対応処理部)は、ホスト装置からの検索要求・指示(キーワード情報含む)に応じた検索処理、即ちインデックス情報のキーワード検索及び検索結果情報出力を含む処理において、以下の処理を行う。全文検索処理部は、第1の検索結果に含まれるファイル情報(即ち代表ファイル情報)について、第2の情報(C2)をもとに、その代表ファイルと中味が同一のファイル(同一デ・デュプリケートグループに属する他のファイル)の情報を、検索結果情報内に追加して、ホスト装置へ応答する。これにより、キーワード抽出処理を抑止しない場合(従来)と同じ検索結果を得る。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。本発明によれば、デ・デュプリケート機能及び全文検索機能を備えるストレージシステム等に係わり、主に、全文検索のインデックス情報の量を削減して記憶資源を節約できる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。
<従来技術>
図24〜図25等を用いて、本発明の実施の形態を従来技術と比較してわかりやすく説明するために、本発明の実施の形態に対する従来技術(前提技術)について簡単に説明する。
図24において、従来のデ・デュプリケート機能及び全文検索機能を備えるストレージシステム(情報処理システム)を示している。従来のシステムにおいて、ネットワーク等を介して、ホスト装置400とストレージ装置100が接続され、ストレージ装置100と全文検索サーバ200が接続され、ホスト装置400と全文検索サーバ200が接続されている。
ホスト装置400からストレージ装置100の記憶領域(ストレージボリューム等)にファイル(例:F1,F2,F3)を入出力(読み書き)している。ストレージ装置100は、データを格納(記憶)するハードディスクドライブ(HDD)等の記憶装置群と、記憶装置群による記憶領域に対するデータの格納を制御(RAID制御等)する制御装置(コントローラ)とを備える。
ストレージ装置100は、デ・デュプリケート処理部(機能)501を備える。全文検索サーバ200は、全文検索処理部(機能)を備え、インデックス情報作成処理等を行う。デ・デュプリケート処理部501では、複数の中身が同一のファイル(例:F1,F2)について、記憶領域への格納を1回に抑える、あるいは1つのファイル(代表ファイル、例:F1)に共通化して保持する。これにより、ストレージ装置100の記憶領域に対する入出力及びストレージ容量を節約する。
また、本システムで全文検索処理として以下のような処理を行っている。ホスト装置400は、デ・デュプリケート機能付きのストレージ装置100内の記憶領域へ、ファイルを例えば書き込みする。ストレージ装置100と接続される全文検索サーバ200は、ストレージ装置100から検索対象ファイル群(例:F1,F2)を読み出し、全文検索のためのインデックス情報300(例:I1,I2)を作成する処理を行う。ホスト装置100からの検索指示・要求(検索のためのキーワード情報の指定を含む)に対し、全文検索サーバ200は、インデックス情報300をキーワード情報で検索し、その検索結果(検索結果情報)を応答する。
全文検索サーバ200によるインデックス情報300の作成処理では、1つのファイルに対して複数の情報(キーワード出現場所情報など)が分散して生成される。そのため、インデックス情報300の共通化(デ・デュプリケート)が難しい。全文検索サーバ200は、デ・デュプリケート機能付きのストレージ装置100から読み出したファイルが、デ・デュプリケートされているかどうか(デ・デュプリケート状況)等を感知できない。そのため、全文検索サーバ200は、複数の中身同一ファイル(例:F1,F2)に対しても、別々にキーワードを抽出してインデックス情報300(例:I1,I2)を作成・追加している。一般に、デ・デュプリケート機能付きのストレージ装置100の全ファイル格納量に対する全インデックス情報300の量の割合は、比較的大きく、そのため記憶資源を浪費している。特に、デ・デュプリケート機能付きのストレージ装置100の記憶領域に対し中身同一ファイルが多数書き込まれた場合、そのファイル群の全ファイル格納量に比べて、インデックス情報300の量が非常に大きくなってしまう。
図25において、従来のインデックス情報300の例を示している。従来のインデックス情報300は、ファイル(例:file1(F1),file2(F2),file3(F3))のメタデータ301と、それに関連付けられるキーワード出現場所情報302とを有する。メタデータ301は、一般的なファイル管理情報・属性情報等である。キーワード出現場所情報302は、あるキーワード(語)が、どのファイルのどの位置(アドレス)に出現するかを示す情報である。図25では、例えば、キーワード“apple”が、F1及びF2内の10文字目と24文字目の位置に、また、F3内の8文字目の位置に、それぞれ含まれており、キーワード“orange”が、F3内の18文字目の位置に含まれている場合を示している。一般に、インデックス情報300において、キーワード出現場所情報302の量が大半を占めている。
本例では、説明を簡単にするために、対象ファイルとして、小さなサイズのファイルの例を示しているが、一般には、ファイルの大きさは10KB以上と大きい。よって、キーワード出現場所情報302の量が大きくなり、これがインデックス情報300の量の大部分を占める。従来、通常、ファイルに対するインデックス情報の量の比率は、30%程度と見積もられる。
<概要>
次に、図1において、本発明の実施の形態のストレージシステム(情報処理システム)についての構成の概要を示している。本システムは、ホスト装置(クライアント装置)400、デ・デュプリケート機能を備えるストレージ装置100、全文検索機能を備える全文検索サーバ200を有する。ストレージ装置100は、デ・デュプリケート処理部(機能)501を備え、デ・デュプリケート処理部501によるデ・デュプリケート処理に伴い、デ・デュプリケート情報(C2)を作成・管理し、外部(全文検索サーバ200)に提供する。全文検索サーバ200では、全文検索機能(処理部)に、デ・デュプリケート対応処理部502を備える。デ・デュプリケート対応処理部502は、デ・デュプリケート処理部501のデ・デュプリケート処理に対応した全文検索処理(インデックス情報のデ・デュプリケート)を実現する部位である。全文検索サーバ200(全文検索処理部)では、インデックス情報作成処理(キーワード抽出処理を含む)、デ・デュプリケートグループ情報(C2)602の作成・管理、中身同一ファイルについてのキーワード抽出処理の抑止、及びデ・デュプリケートされたインデックス情報に対応した検索結果情報出力などを行う(後述)。なお、インデックス情報300の格納先の記憶手段は、いずれとしてもよい。
本システムにおいて、以下(1)〜(4)のような処理を行う。説明を簡単にするために、全文検索サーバ200は、全文検索処理の対象ファイル群(検索対象ファイル群)を最初に抽出して、インデックス情報300内にファイルのメタデータを作成済みであると仮定する。
(1)ホスト装置100からストレージ装置300に対し、ファイル(例:F1,F2,F3)が書き込みされる。ストレージ装置100は、自身の記憶領域に保持している各ファイル(例:F1,F2)に対して、デ・デュプリケート処理部501によるデ・デュプリケートの処理を適宜実行する(例:F1とF2のデ・デュプリケートによりF1が代表ファイルとなる)。それと共に、そのデ・デュプリケート状況を示す制御情報であるデ・デュプリケート情報(C1)を更新し、外部の全文検索サーバ200に対して読み出し可能な状態にして提供する。デ・デュプリケート情報(C1)は、中身同一ファイル(デ・デュプリケートファイル)の有無、代表ファイルのメタデータ等の情報を含む。
(2)全文検索サーバ200は、検索対象ファイル(例:F1,F2,F3)についての処理(インデックス情報作成処理)に際し、ストレージ装置100からデ・デュプリケート情報(C1)を読み出して取得し、それをもとに、インデックス情報300内に、デ・デュプリケートグループ情報(C2)をとして追加する。デ・デュプリケートグループ情報(C2)は、複数のファイルにおけるデ・デュプリケート関係(中身同一ファイルのグループ、代表ファイル、ファイル間リンク等)を示す、全文検索サーバ200側で扱う制御情報である。
(3)全文検索サーバ200は、デ・デュプリケート情報(C1)、デ・デュプリケートグループ情報(C2)の参照・判別から、処理対象のファイル(例:F2)について、それと中身が同一のファイル(例:F1)が存在すること、及びそれ自身が代表ファイルではないこと等を検出・判定する。全文検索サーバ200は、そのことを検出した場合、当該ファイル(例:F2)について、インデックス情報作成処理におけるキーワード抽出処理を抑止する。これにより、インデックス情報300のデ・デュプリケート、即ち複数の中身同一ファイルについてインデックス情報300を重複して作成及び保持しないこと、が実現される。代表ファイル(例:F1)についてのインデックス情報(例:I1)のみが保持される。
(4)全文検索サーバ200は、ホスト装置400からの検索指示・要求に応じた検索処理に際しては、インデックス情報300の検索結果(第1の検索結果)に含まれる代表ファイル情報(例:F1)について、デ・デュプリケートグループ情報(C2)の参照をもとに、その代表ファイルが属するデ・デュプリケートグループ中の他の中身同一のファイル(例:F2)の情報を、最終的な検索結果情報内に加え(第2の検索結果)、ホスト装置400へ応答する。
以上の処理により、全文検索サーバ200でのインデックス情報300の量の削減が実現される。また、中身同一ファイルに対しては、ファイルの読み出しが不要となり、入出力処理を削減できる。
図2において、本システムにおいてデ・デュプリケートされたインデックス情報300の例を示している。前記図25と同じファイル(F1,F2,F3)の場合について示している。インデックス情報300は、ファイルのメタデータ301、キーワード出現場所情報302に加え、デ・デュプリケートグループ情報(C2)303(前記602と対応)を含んでいる。デ・デュプリケートグループ情報(C2)303は、中身同一ファイル(デ・デュプリケートファイル)のメタデータでの代表ファイルを示すマーク/フラグ(代表ファイルフラグ)や、中身同一ファイルのメタデータ間のリンク(デ・デュプリケートファイル間リンク)等の情報を含む。例えば、F2がF1と中身同一であった場合、F2については、キーワード出現場所情報302を保持せず、代表ファイルであるF1へのリンクを持たせる。
キーワード出現場所情報302は、ファイルの大きさにほぼ比例する。よって、本システムの特徴であるデ・デュプリケートによるインデックス情報210の量の削減率は、デ・デュプリケート機能付きのストレージ装置100でのファイル容量削減率とほぼ同じになる。また、従来のデ・デュプリケート機能付きストレージ装置では、通常、デ・デュプリケート機能によりファイル格納量を1/2〜1/20程度に削減できると見積もられる。よって、本システムの特徴であるデ・デュプリケートによるインデックス情報の削減でも、同様に、1/2〜1/20程度に削減できると見積もられる。
(実施の形態1)
次に、図3〜図12を用いて、本発明の実施の形態1のストレージシステムを説明する。実施の形態1は、前記概要構成に従って、デ・デュプリケート機能を備えるNAS及びストレージ装置及び全文検索サーバを備えるストレージシステム構成において、全文検索サーバを、デ・デュプリケート機能に対応した機能(デ・デュプリケート対応処理部)を備える構成にしたものである。また、ファイル他の各種情報をストレージ装置内にまとめて格納する場合である。
<システム(1)>
図3は、実施の形態1のストレージシステムの構成を示している。本システムの全体は、ホスト装置400群に対して、ネットワーク901を介して、デ・デュプリケート機能及び全文検索機能を備えるストレージシステムが接続される構成である。ストレージシステムは、NAS(ファイルサーバ)101、全文検索サーバ102、及びストレージ装置103を有し、これらが、ネットワーク902を介して相互接続される構成である。
ホスト装置400は、業務サーバやユーザPC等である。ホスト装置400と、NAS101及び全文検索サーバ102との間は、IP−LAN等のネットワーク901で接続される。また、ネットワーク902は、ファイバチャネルプロトコルによるSAN(ストレージエリアネットワーク)等である。
NAS101は、ホスト装置400に対してファイルサーバとして機能し、ホスト装置400からの入出力ファイルを、ストレージ装置103内の記憶領域(ボリューム)に格納する。NAS101は、デ・デュプリケート処理部501を備える。デ・デュプリケート処理部501は、デ・デュプリケートの処理として、ストレージ装置103内の記憶領域に対する中身同一ファイルの格納を1回にする。
ストレージ装置103は、例えば、図6に示すようなRAID制御機能を備えるストレージ装置である。ストレージ装置103内の記憶領域には、検索対象ファイル群700、デ・デュプリケート情報(C1)601、シグネチャハッシュ603、インデックス情報300(デ・デュプリケートグループ情報(C2)602を含む)等が格納される。検索対象ファイル群700は、ホスト装置400から入出力される、複数のファイル(データ本体)及びそのメタデータであり、全文検索サーバ102による全文検索処理対象となる。シグネチャハッシュ603情報は、代表ファイルについてのみ保持される。
<処理の流れ>
図3において、処理の流れは以下である。例えば、ホスト装置400からNAS101に対してファイルを書き込む(FW:ファイル書き込み、FR:ファイル読み出し)。NAS101は、ホスト装置400からのアクセスに基づき、ファイル(データ本体)とそのメタデータを、ストレージ装置103の記憶領域(検索対象ファイル群700)に格納する。
デ・デュプリケート処理部501(図16に詳細処理を示す)では、ストレージ装置103内に格納されたファイルのうち、中身が同一のファイルを、デ・デュプリケートする。即ち、格納するファイル(データ本体)としては1つのみを代表ファイルとして残し、中身同一の他のファイル(データ本体)については削除する。また、その中身同一の他のファイル(データ本体)については、残した代表ファイル(データ本体)で代用する。このようなデ・デュプリケート処理は、公知技術である。
また、デ・デュプリケート処理部501は、上記デ・デュプリケート処理に際して、残した代表ファイルのハッシュ値であるシグネチャハッシュ602(図10に構成例を示す)を作成及び格納する処理と、デ・デュプリケートの状況を示すデ・デュプリケート情報601(図9に構成例を示す)を作成及び格納し、外部に提供する処理を行う。
全文検索サーバ102は、NAS101が格納した検索対象ファイル群700に含まれるファイルに対して、インデックス情報300(図7に本システムでの構成例を示す)を作成する。そのために、全文検索サーバ102は、NAS101を通じて、インデックス情報300の作成処理の対象のファイル(データ本体)及びメタデータを読み出す。これに際し、全文検索サーバ102は、NAS101から、対象のファイル及びメタデータに加え、デ・デュプリケート情報(C1)601を取得する。全文検索サーバ102のデ・デュプリケート対応処理部502(図4に詳細構成を示す)は、取得したデ・デュプリケート情報(C1)601を使用して、デ・デュプリケート処理部501の処理に対応した全文検索処理(インデックス情報作成処理を含む)を行う。これにより、インデックス情報300の量を削減しながら、既存の全文検索結果と同じ結果を得る。また、デ・デュプリケートグループ情報(C2)602(図7に構成例を示す)は、全文検索サーバ102において、デ・デュプリケート情報(C1)601をインデックス情報300に取り込んで表現したものであり、デ・デュプリケート対応処理部502により作成・読み出しを行う。
全文検索サーバ102は、ホスト装置400からの検索指示に応じて検索処理(インデックス情報300のキーワード検索処理を含む)を行い、その検索結果情報を、ホスト装置400に応答して表示させる(図12に検索結果表示例を示す)。この際、全文検索サーバ102は、検索結果情報には、代表ファイルの情報に加え、それと同一のデ・デュプリケートグループに属する中身同一ファイルの情報を追加する。ホスト装置400のユーザは、画面に表示された検索結果情報におけるファイル名リンクをクリックすること等により、NAS101を通じてストレージ装置103から該当ファイルを読み出して表示することができる。
<全文検索サーバ及びデ・デュプリケート対応機能>
図4において、全文検索サーバ102及びデ・デュプリケート対応処理部502の詳細構成を示している。全文検索サーバ102は、検索対象ファイル抽出処理11、デ・デュプリケート対応処理部502によるデ・デュプリケートグループ情報追加・作成処理13、デ・デュプリケート対応キーワード抽出処理(キーワード抽出抑止処理)14、及びデ・デュプリケート対応検索処理15等の処理を行う。
検索対象ファイル抽出処理11(図18に詳細を示す)は、従来同様の処理である。デ・デュプリケートグループ情報追加・作成処理13(図19に詳細を示す)は、本システムでの特徴的な処理である。デ・デュプリケート対応キーワード抽出処理14(図20に詳細を示す)及びデ・デュプリケート対応検索処理15(図21に詳細を示す)は、従来同様の処理を本システムでデ・デュプリケート対応に修正したものである。
また、インデックス情報作成処理時に、検索対象ファイル抽出処理11、デ・デュプリケートグループ情報追加・作成処理13、及びデ・デュプリケート対応キーワード抽出処理14が実施される。また、デ・デュプリケート対応検索処理15は、ホスト装置400のユーザからの指示に対応した検索処理時に行われ、検索結果情報900を作成して、これをホスト装置400に送出して表示させる。
<ホスト装置、NAS、全文検索サーバ>
図5において、ホスト装置400、NAS101、全文検索サーバ200のハードウェア構成を示している。ホスト装置400は、制御部(CPU)801、メモリ802、ポート(通信処理部)803、キーボードやマウス等の入力装置804、ディスプレイ等の出力装置805などを備える。制御部801によりメモリ802上のプログラム(業務アプリケーションプログラム(AP)806、ストレージ管理・利用プログラム等)を実行することにより、ホスト装置400としての機能を実現する。ホスト装置400は、ポート803により、NAS101及び全文検索サーバ200と通信接続する。ホスト装置400は、ポート803により、NAS101及び全文検索サーバ200と通信接続する。
NAS101は、制御部811、メモリ812、ポート813、データキャッシュメモリ814等を備える。制御部811がメモリ812上のプログラム(デ・デュプリケート処理プログラム(P)801等)を実行することにより、デ・デュプリケート処理部501等の機能が実現される。データキャッシュメモリ814には、ホスト装置400とストレージ装置103との間での入出力データ等をキャッシュする。NAS101は、ポート813により、ホスト装置400、ストレージ装置103、及び全文検索サーバ200と通信接続する。
全文検索サーバ200は、制御部821、メモリ822、ポート823等を備える。制御部821がメモリ822上のプログラム(全文検索処理プログラム(P)824、デ・デュプリケート対応処理プログラム(P)825等)を実行することにより、全文検索処理部及びデ・デュプリケート対応処理部502等の機能が実現される。全文検索サーバ200は、ポート823により、ホスト装置400、NAS101、ストレージ装置103と通信接続する。
<ストレージ装置>
図6において、ストレージ装置100(特にストレージ装置103)の詳細構成例を示している。ストレージ装置100は、制御(記憶制御)機能を担うDKC(ディスクコントローラ)110と、記憶機能を担うDKU(ディスクユニット)130を備え、また、保守管理機能を備えるSVP(サービスプロセッサ)190等が接続または内蔵されている。
DKC110は、処理部として、本例では、CHA(チャネルアダプタ)11、DKA(ディスクアダプタ)12、CM(キャッシュメモリ)13、SM(シェアドメモリ)14、SW(クロスバースイッチ)15を有する。各部は、SW15でのデータ転送制御及びパス切り替えを介して相互に通信やデータ転送が可能に接続される。また、各部は、内部のLAN180を通じて、SVP190と接続されている。CHA11やDKA12等では、所定の処理に対応したプログラム120が実行される。CHA11群は、ホストI/F(インタフェース)部に対応し、DKA12群は、ディスクI/F部に対応する。
CHA11は、外部装置に対するチャネルI/F制御(ホストI/F制御)を行う部位である。DKA12は、HDD131に対するディスクI/F制御を行う部位である。CHA11やDKA12は、通信ポートを有し、対応するI/F(例えばFC−I/F)のプロトコル通信処理を行う。
CM13やSM14は、DKC110内で各部に共用され、その上のデータ・情報は自動的にバックアップされる。CM13は、ボリュームに対する入出力データ等のキャッシュのために使用される。SM14は、構成情報、状態情報等を含む各種の制御情報の格納に使用される。
DKU130は、HDD131等の記憶装置群により構成される。DKA12に対して接続網を介してDKU130内の各HDD131が通信接続される。HDD131は、DKA12側からの要求に応じてそのディスク領域にデータを読み書きする動作を行う。
DKU130内に、記憶領域として、記憶ボリューム(ストレージボリューム)が設定される。記憶ボリュームとしては、HDD131等による物理的な記憶領域(物理ボリューム)と、1つ以上の物理ボリューム上に論理的に設定される記憶領域(論理ボリューム)とを有する。データ入出力対象となる論理ボリュームは、例えばLU(論理ユニット)133と対応付けられる。LU133は、LDEV(論理デバイス)132のセットと対応付けられる。LDEV132は、物理ボリュームのグループ(RAIDグループ)上に設定され、RAID制御の単位となる。
ストレージ装置100において、通常時における、外部(ホスト装置やNAS等)からのデータ入出力(書き込み/読み出し)要求に応じた、内部のボリュームに対するデータ入出力処理の手順は例えば以下である。DKC110では、CHA11とDKA12の間で、SW15を介して、SM14に処理指示等を格納し、CM13に対象データをキャッシュしながら、データ転送処理が行われる。書き込み処理の場合は以下である。あるCHA11が外部からデータ書き込み要求を受信した場合、当該CHA11は、当該書き込み要求をSM14に書き込むと共に、外部から受信した書き込みデータをCM13に書き込む。一方、DKA12は、SM14を監視しており、SM14に書き込み要求が書き込まれたことを検出すると、当該書き込み要求に従ってCM13から書き込みデータを読み出し、対象のHDD131上の領域に書き込む。読み出し処理の場合は以下である。あるCHA11が外部からデータ読み出し要求を受信した場合、当該CHA11は、読み出し対象のデータがCM13に存在するかどうかを調べる。存在する場合、当該CHA11は、そのデータを読み出して外部に送信(応答)する。一方、存在しない場合、当該CHA11は、読み出し要求をSM14に書き込むと共に、SM14を監視する。当該読み出し要求がSM14に書き込まれたことを、DKA12が検出する。当該DKA12は、対象のHDD131の領域から対象のデータを読み出して、CM13に書き込むと共に、その旨をSM14に書き込む。そして、前記CHA11は、前記読み出し対象のデータがCM13に書き込まれたことを検出すると、そのデータを読み出して、外部へ送信(応答)する。
なお、DKC110は、他の構成として、CPUを中心にCHA11等の各部を制御する構成、CHA11とDKA12の間で直接的に処理指示やデータ転送を行う構成、CHA11とDKA12の機能を1つにまとめた構成、なども可能である。
<インデックス情報>
図7(a)〜(c)において、本実施の形態1におけるインデックス情報(デ・デュプリケートグループ情報(C2)を含む)300のテーブル形式の構成例を示している(図7(d)は従来構成例)。これは図2の例と対応している。図7(a)のファイルのメタデータ310は、ファイルID311、ファイル名(パス等を含む)312、デ・デュプリケートグループ情報(C2)602を有する。従来のメタデータ(簡単のため、ファイルID311とファイル名312のみ示す)に対し、デ・デュプリケートグループ情報(C2)602が追加された構成である。デ・デュプリケートグループ情報(C2)602は、代表ファイルフラグ51、次ファイルID52(RN_FID)を有する。代表ファイルフラグ51は、代表ファイルであるかどうかを示すフラグである。次ファイルID52は、同一デ・デュプリケートグループ内のリング構成(前記デ・デュプリケートファイル間リンクと対応している)における次のファイルを示すファイルIDである。図7(b)のキーワード情報320は、従来と同様構成であり、キーワード321、出現場所情報ID(LIDと略す)322を有する。図7(c)の出現場所情報330は、従来と同様構成であり、出現場所情報ID(LID)331、次LID(次の出現場所のLID)332、ファイルID(出現場所のファイルID)333、出現位置情報334を有する。出現位置情報334は、該当ファイル内のキーワードの出現位置である。図7(d)で、従来構成では、例えば、ファイルIDがFID1であるファイル(F1)に関する出現場所情報330のレコードに加えて、それと中身が同一のファイルIDがFID2であるファイル(F2)に関する出現場所情報330のレコード(例えば「IDX12,IDX13,FID2,10,24」)が保持されていたが、本実施の形態の構成(図7(c))では、デ・デュプリケートにより、当該レコードは保持されない。
<検索対象ファイル群の例>
図8において、検索(解析)対象ファイル群700の例を示している。簡単のため、3つのファイルF1(file1),F2(file2),F3(file3)において(各ファイルIDは、FID1,FID2,FID3)、F1とF2は、中身が同一であり、キーワード“apple”を含み、F3は、独立したファイルであり、キーワード“apple”及び“orange”を含む、という例である。
<デ・デュプリケート情報(C1)>
図9において、デ・デュプリケート情報(C1)601の構成例を示している。デ・デュプリケート情報(C1)601は、ファイル名81、代表ファイルのファイル名82を有する。中身が同一のファイル(例えばF2)は、代表ファイル(例えばF1)に対応付けられる。また、独立した1つのファイル(例えばF3)は、それ自身が代表ファイルとなる。尚ここで、ファイル名81には、自装置(NAS101)自体の名称を含んでいない(含んでも構わない)。
<シグネチャハッシュ>
図10において、シグネチャハッシュ603情報の構成例を示している。シグネチャハッシュ603は、シグネチャ61と、同一シグネチャ61を持つファイル名のリスト62とを有する。本システムでは、ファイル群の中身が同一かどうかの判定に際して、公知技術であるシグネチャハッシュの処理を、比較対象を絞り込みするために用いている。これにより、当該処理を高速化することができる。尚ここで、シグネチャハッシュ603の情報では、代表ファイル(例:F1,F3)についてのみ登録する。即ち、各ファイルの処理において、同じシグネチャ61を持ち、中身が同一のファイル(例:F1)が既に登録されている場合は、処理中のファイル(例:F2)を登録しない。また、再解析等でシグネチャハッシュ603の情報を再利用するためには、ファイルの更新日付が更新されていないことの検出や、WORM(Write Once Read Many:書き換え不可能)ファイルであることの検出などの処理が必要であるが、これらの拡張的な処理は自明なので説明省略する。
<検索結果>
図11において、インデックス情報300がデ・デュプリケートされている状態における、検索処理の結果の構成例を示している。この例は、ホスト装置400から、キーワードとして“apple”は含むが“orange”は含まない条件を指定して、検索対象ファイル群700を全文検索(即ちインデックス情報300をキーワード検索)した結果である。図11(a)では、通常の、デ・デュプリケート対応処理部502を備えない構成の場合における、検索処理の結果(検索結果情報900)を示している。図11(b)では、本デ・デュプリケート対応処理部502を備える構成における、デ・デュプリケート対応検索処理15による検索処理の結果(検索結果情報900)、即ちファイル群の実態を反映した望ましい検索結果、を示している。図11(a)では、直接インデックス情報300が保持されているFID1のファイルF1(代表ファイル)に関する情報(出現場所情報330のレコード)のみが出力され、それと中身が同一である、FID2のファイルF2の情報が出力されないことになる。検索結果情報900における出現場所情報330のレコードは、LID91、次LID92、ファイルID93、出現位置情報94を有する。一方、図11(b)では、FID1のファイルF1(代表ファイル)に関する情報に加え、それと中身が同一である、同一デ・デュプリケートグループに属するFID2のファイルF2の情報が追加される。
<検索結果の表示例>
図12において、ホスト装置400側における前述の検索結果の表示例を示している。本システムでの検索結果情報900に基づき、前述の検索結果(図11(b))を、例えばWebページ等の形式で、ホスト装置400の画面に表示した例である。図12(a)は、中身同一ファイル(例:F1,F2)を、別々の情報単位として表示した例、図12(b)は、中身同一ファイルのファイル名を、一覧で纏めて1つの情報単位として表示した例である。太字は、ファイル中で見つかったキーワードである。アンダーライン付きのファイル名部分は、ファイル本体へのリンクになっており、この部分をホスト装置400のユーザがクリックすることにより、NAS101(なおNAS101のサーバ名が“nas1”とする)から該当ファイルを読み出して表示することができる。
<他の構成例>
実施の形態1の他の構成例として以下が可能である。本例では、NAS101とストレージ装置103とを別個の装置として設けているが、NAS101またはデ・デュプリケート処理部501は、ストレージ装置103内に内蔵して1つの装置としてもよい。また、全文検索サーバ102の機能は、NAS101内やストレージ装置103内に設けること等により1つの装置としてもよい。また、インデックス情報300は、全文検索サーバ102内に格納されても構わないし、別の外部ストレージ装置等に格納されても構わない。
また、本例では、簡単のため、全文検索処理(インデックス作成処理)時に検索対象ファイル群700の状態が更新されない場合を説明している。検索対象ファイル群700に後からファイルが追加された場合や、格納済みファイルの内容が書き換え更新された場合などには、従来の全文検索処理等にならって同様に処理する。あるいは、適用対象ファイルを限定して本システムの特徴的な処理(デ・デュプリケートによるインデックス情報の削減)を行う構成としてもよい。
また、本例では、全文検索サーバ102からNAS101にアクセスしてデ・デュプリケート情報(C1)601を取得する。これに限らず、NAS101が、外部(ホスト装置400)からファイルが書き込まれたタイミング等で、その旨や該当ファイルやデ・デュプリケート情報(C1)601等を能動的に全文検索サーバ102に報告または送信等し、それに応じて全文検索サーバ102が処理を行う構成などとしてもよい。
(実施の形態2)
次に、図13〜図15等を用いて、本発明の実施の形態2のストレージシステムを説明する。実施の形態2は、前記概要構成に従って、デ・デュプリケート機能を備えないNAS及びストレージ装置を有する構成において、全文検索サーバを、デ・デュプリケート機能及びデ・デュプリケート対応処理部を備える構成にしたものである。
<システム(2)>
図13において、実施の形態2のストレージシステムの構成を示している。本ストレージシステムは、NAS(ファイルサーバ)101B、全文検索サーバ102B、及びストレージ装置103を有する。図14は、全文検索サーバ102B及びデ・デュプリケート対応処理部502Bの詳細を示す。図15は、シグネチャハッシュ603Bの詳細を示す。
全文検索サーバ102Bは、全文検索処理だけでなくデ・デュプリケート処理部501Bによるデ・デュプリケート処理も行う。また、それに対応して、デ・デュプリケート対応処理部502Bによるデ・デュプリケート対応の検索処理を行う。また、デ・デュプリケート処理のために、全文検索サーバ102Bは、デ・デュプリケート情報(C1)601、及びシグネチャハッシュ603Bを管理する。
<全文検索サーバ及びデ・デュプリケート対応機能(2)>
図14において、全文検索サーバ102B及びデ・デュプリケート対応処理部502Bの詳細を示している。デ・デュプリケートグループ情報追加・作成処理13B(図22に詳細を示す)は、デ・デュプリケート処理部501Bにより行われる、新規の処理である。各部の処理内容は、実施の形態1と同様である。
<シグネチャハッシュ(2)>
図15において、シグネチャハッシュ603Bを示している。シグネチャハッシュ603Bは、シグネチャ61B、同一シグネチャを持つファイルのファイルIDのリスト62Bを有する。シグネチャハッシュ603Bの情報には、代表ファイルについてのみ登録する。即ち、各ファイルの処理において、同じシグネチャ61Bを持ち、中身が同一のファイル(例:F1)が既に登録されている場合は、処理中のファイル(例:F2)を登録しない。その場合、デ・デュプリケートグループ情報(C2)602における処理中ファイルに対する代表ファイルフラグをFALSE(偽)とし、既に登録されている代表ファイルの同一デ・デュプリケートグループ内リングに、処理中ファイルを追加する。具体的には、代表ファイルの「同一デ・デュプリケートグループ内リングの次のファイルID」を、P.next、処理中の「同一デ・デュプリケートグループ内リングの次のファイルID」のファイルを、C.next、としたとき、以下のような処理、「tmp(一時変数)=P.next; P.next=「処理中ファイルのファイルID」; C.next=tmp」、を実行する。また、中身同一ファイルが登録されていない場合、デ・デュプリケートグループ情報(C2)602の処理中ファイルに対する代表ファイルフラグをTRUE(真)とし、既に登録されている代表ファイルの同一デ・デュプリケートグループ内リングの次ファイルIDを、処理中ファイル自身のファイルIDとする。
<処理フロー>
次に、図16〜図23を用いて、前記各実施の形態における各部の処理のフローを説明する。
<デ・デュプリケート処理>
図16において、デ・デュプリケート処理部501によるデ・デュプリケート処理のフローを示している(Sは処理ステップを示す)。デ・デュプリケート処理の開始後、検索対象ファイル群700中の最初のファイルの名前をFNとする(S7204)。次に、FNが空かどうか判断し(S7206)、空の場合(Y)、終了する。空でない場合(N)、次に、ファイル名がFNのファイルと中身が同一のファイルが、シグネチャハッシュ603情報に登録済みであるかを調べる(S7210)。この処理(中身同一ファイル判定)の詳細は、図17に示される。この処理により、登録済みファイルのファイル名がGNとして返される。
次に、GNが空かどうかを判断し(S7250)、空の場合(Y)、GNにFNを設定する(S7254)。空でない場合(N)、ファイル名がFNのファイルの本体を削除し、ファイル名がFNのファイルの本体については、ファイル名がGNのファイルの本体を指し示すように、設定する(S7252)。次に、FNとGNの組を、デ・デュプリケート情報(C1)601に登録する。次に、検索対象ファイル群700中のFの次のファイルの名前をFとする(S7258)。そして、S7206に戻る。
<中身同一ファイル判定(1)>
図17において、前記S7210の処理のフローを示している。まず、ファイル名がFNのファイルに対するシグネチャSGNNを計算する(S7214)。次に、シグネチャSGNNは、シグネチャハッシュ603情報に登録済みであるか判断する(S7216)。登録済みでない場合(N)、シグネチャがSGNNであるハッシュエントリHENを作成し、HENのファイル名リストに、FNを登録する(S7218)。そして、GNを空にし(S7220)、終了する。また、前記登録済みである場合(Y)、シグネチャがSGNNであるハッシュエントリをHEとする(S7230)。次に、HEに登録されたファイル名リストでの最初のファイル名をFNXとする(S7232)。次に、FNXが空かどうか判断し(S7234)、空の場合(Y)、HEのファイル名リストにFNを登録する(S7242)。そして、GNを空にし(S7220)、終了する。また、前記空でない場合(N)、ファイルFNとファイルFNXの中身が完全に同一かどうか、比較する(S7236)。比較により、中身が同一である場合(S7238−Y)、GNにGNXを設定し(S7244)、終了する。また、中身が同一でない場合(S7238−N)、HEに登録されたファイル名リストでのFNXの次のファイル名をFNXとし(S7240)、S7234に戻る。
<検索対象ファイル抽出処理>
図18において、全文検索サーバ102による検索対象ファイル抽出処理11を示している。まず、検索対象ファイル群700中の最初のファイルをFとする(S1104)。次に、Fは空であるかを判断する(S1106)。空の場合(Y)、終了する。空でない場合(N)、ファイルのメタデータに新しい行(レコード)Rを追加する(S1108)。次に、新規作成した一意のIDを、RのファイルIDに設定する(S1110)。次に、Fのファイル名を、Rのファイル名に、設定する(S1112)。次に、検索対象ファイル群700中のFの次のファイルをFとし(S1114)、S1106に戻る。
<デ・デュプリケートグループ情報作成処理(1)>
図19において、デ・デュプリケートグループ情報追加・作成処理13(実施の形態1に対応する例)を示している。まず、ファイルのメタデータ中の最初の行をNとする(S1304)。次に、Nは空かどうかを判断し(S1306)、空の場合(Y)、終了する。空でない場合(N)、次に、NのファイルIDの値をFIDN、ファイル名をFNNとする(S1308)。次に、ファイル名がFNNのファイルに対するデ・デュプリケート情報(C1)601を、NAS101から取得し、代表ファイルのファイル名FNPを求める(S1310)。次に、ファイルのメタデータから、ファイル名がFNPのファイルのID(FIDP)を求める(S1312)。次に、FIDPがFIDNと同じかを判断し(S1320)、同じ場合(Y)、Nの代表ファイルフラグをTRUEにし(S1322)、NのRN_FIDに、IDNを設定する(S1324)。そして、ファイルのメタデータ中のNの次の行をNとし(S1326)、S1306に戻る。また、前記S1320で、同じではない場合(N)、Nの代表ファイルフラグをFALSEにする(S1330)。次に、ファイルのメタデータ中のファイルIDがFIDPの行を、Pとし(S1332)、PのRN_FIDの値を、Tとし(S1334)、PのRN_FIDに、FIDNを設定し(S1336)、PのRN_FIDに、Tを設定する(S1338)。そして、ファイルのメタデータ中のNの次の行をNとし(S1326)、S1306に戻る。
<デ・デュプリケート対応キーワード抽出処理>
図20において、デ・デュプリケート対応キーワード抽出処理14を示している。まず、ファイルのメタデータ中の最初の行をNとする(S1404)。Nが空かどうかを判断し(S1406)、空の場合(Y)、終了する。空でない場合(N)、Nの代表ファイルフラグがTRUEかを判断し(S1408)、TRUEでない場合(N)、NのファイルIDとファイル名を使用して、キーワード抽出処理を行う(S1410)。そして、ファイルのメタデータ中のNの次の行をNとし(S1412)、S1406に戻る。また、前記TRUEである場合(Y)、S1412の処理後、S1406に戻る。
<デ・デュプリケート対応検索処理>
図21において、デ・デュプリケート対応検索処理15を示している。まず、通常の検索処理(図11(a))を行い、検索結果情報900を作成する(S1504)。次に、検索結果情報900の最初の行をRとする(S1510)。次に、Rは空かどうかを判断し(S1512)、空の場合(Y)、終了する。空でない場合(N)、Rの出現場所ファイルIDを、FIDRとする(S1514)。次に、ファイルのメタデータでファイルIDがFIDRの行をPとする(S1516)。次に、Pの代表ファイルフラグがTRUEかを判断し(S1518)、TRUEの場合(Y)、検索結果情報900のRの次の行をRとし(S1520)、S1512に戻る。また、TRUEでない場合(N)、Rの次FIDの値をSとする(S1530)。次に、S=Pかどうかを判断し(S1532)、S=Pではない場合(N)、S1520の処理後、S1512へ戻る。S=Pの場合(Y)、検索結果情報900に新しい行Nを追加し、Rの値をコピーした後、出現ファイルIDにSを設定する(S1534)。次に、Tに、Rの次LID(NEXT_LID)を代入し、Rの次LID(NEXT_LID)に、Nを代入し、Nの次LID(NEXT_LID)に、Tを代入する(S1536)。次に、Sの次FID(NEXT_FID)の値をSとし(S1538)、S1532へ戻る。
<デ・デュプリケートグループ情報作成処理(2)>
次に、図22において、デ・デュプリケートグループ情報追加・作成処理13(実施の形態2に対応する例)を示している。まず、ファイルのメタデータ中の最初の行をNとする(S1204)。次に、Nは空かどうかを判断し(S1206)、空の場合(Y)、終了する。空でない場合(N)、次に、NのファイルIDの値をFIDNとする(S1208)。次に、ファイルIDがFIDNのファイルと中身が同一のファイルが、シグネチャ情報に登録済みであるかを調べる処理を行う(S1210)。登録済みのファイルのIDはFIDPとして返される。次に、FIDPが空かを判断し(S1250)、空でない場合(N)、Nの代表ファイルフラグをFALSEにし(S1252)、ファイルのメタデータ中のファイルIDがFIDPの行をPとする(S1254)。次に、PのRN_FIDの値を、Tとし(S1256)、PのRN_FIDに、FIDNを設定し(S1258)、PのRN_FIDに、Tを設定する(S1260)。そして、ファイルのメタデータ中のNの次の行をNとし(S1270)、S1206に戻る。また、前記S1250で、空の場合(Y)、Nの代表ファイルフラグをTRUEにする(S1262)。次に、NのRN_FIDに、FIDNを設定する(S1264)。そして、ファイルのメタデータ中のNの次の行をNとし(S1270)、S1206に戻る。
<中身同一ファイル判定(2)>
図23において、前記S1210の処理のフローを示している。まず、ファイルのメタデータを参照し、ファイルIDがFIDNのファイルのファイル名FNNを得て、検索対象ファイル群でのファイル名がFNNのファイルに対するシグネチャSGNNを計算する(S1214)。次に、シグネチャSGNNは、シグネチャハッシュ603情報に登録済みであるか判断する(S1216)。登録済みでない場合(N)、シグネチャがSGNNであるハッシュエントリHENを作成し、HENのファイルIDリストに、FIDNを登録する(S1218)。そして、FIDPを空にし(S1220)、終了する。また、前記登録済みである場合(Y)、シグネチャがSGNNであるハッシュエントリをHEとする(S1230)。次に、HEに登録されたファイルIDリストでの最初のファイルIDをFIDXとする(S1232)。次に、FIDXが空かどうか判断し(S1234)、空の場合(Y)、HEのファイルIDリストにFIDNを登録する(S1242)。そして、FIDPを空にし(S1220)、終了する。また、前記空でない場合(N)、ファイルのメタデータを参照し、ファイルIDがFIDXのファイルのファイル名FNXを得て、検索対象ファイル群に含まれるファイルFNNとファイルFNXの中身が完全に同一か、比較する(S1236)。比較により、中身が同一である場合(S1238−Y)、FIDPにFIDXを設定し(S1244)、終了する。また、中身が同一でない場合(S1238−N)、HEに登録されたファイルIDリストでのFIDXの次のファイルIDをFIDXとし(S1240)、S1234に戻る。
以上説明したように、各実施の形態により、特に、(1)全文検索サーバ200が管理・保持するインデックス情報300の量が削減できる。(2)また、中身同一ファイルに対しては、ファイルの読み出しが不要となり、入出力処理を削減できる。(3)また、全文検索サーバ200でのインデックス情報300の作成時間を削減できる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
本発明は、ストレージシステムや全文検索システムなどの情報処理システムに利用可能である。
本発明の実施の形態におけるストレージシステムの構成の概要を示す図である。 本発明の実施の形態のストレージシステムの概要において、デ・デュプリケートされたインデックス情報の構成例を示す図である。 本発明の実施の形態1におけるストレージシステムの構成を示す図である。 本発明の実施の形態1のストレージシステムにおいて、全文検索サーバ及びデ・デュプリケート対応処理部の詳細構成を示す図である。 本発明の実施の形態1のストレージシステムにおいて、ホスト装置、NAS、全文検索サーバのハードウェア構成を示す図である。 本発明の実施の形態1のストレージシステムにおいて、ストレージ装置の詳細構成例を示す図である。 本発明の実施の形態1のストレージシステムにおいて、インデックス情報のテーブル形式の構成例を示す図であり、(a)はファイルのメタデータ、(b)はキーワード情報、(c)は出現場所情報、(d)の従来構成の出現場所情報を示す。 本発明の実施の形態1のストレージシステムにおいて、検索対象ファイル群の例を示す図である。 本発明の実施の形態1のストレージシステムにおいて、デ・デュプリケート情報(C1)の構成例を示す図である。 本発明の実施の形態1のストレージシステムにおいて、シグネチャハッシュの構成例を示す図である。 本発明の実施の形態1のストレージシステムにおいて、検索結果の例を示す図であり、(a)は通常(デ・デュプリケート対応ではない場合)の第1の検索結果、(b)は本デ・デュプリケート対応の第2の検索結果を示す。 (a),(b)は、本発明の実施の形態1のストレージシステムにおいて、検索結果の表示例を示す図である。 本発明の実施の形態2におけるストレージシステムの構成を示す図である。 本発明の実施の形態2のストレージシステムにおいて、全文検索サーバ及びデ・デュプリケート対応処理部の詳細構成を示す図である。 本発明の実施の形態2のストレージシステムにおいて、シグネチャハッシュの構成例を示す図である。 本発明の実施の形態1,2のストレージシステムにおいて、デ・デュプリケート処理部のデ・デュプリケート処理のフローを示す図である。 本発明の実施の形態1,2のストレージシステムにおいて、デ・デュプリケート処理における中身同一ファイル判定(S7210)のフローを示す図である。 本発明の実施の形態1,2のストレージシステムにおいて、検索対象ファイル抽出処理のフローを示す図である。 本発明の実施の形態1のストレージシステムにおいて、デ・デュプリケートグループ情報作成処理のフローを示す図である。 本発明の実施の形態1,2のストレージシステムにおいて、デ・デュプリケート対応キーワード抽出処理のフローを示す図である。 本発明の実施の形態1,2のストレージシステムにおいて、デ・デュプリケート対応検索処理のフローを示す図である。 本発明の実施の形態2のストレージシステムにおいて、デ・デュプリケートグループ情報作成処理のフローを示す図である。 本発明の実施の形態2のストレージシステムにおいて、デ・デュプリケートグループ情報作成処理における中身同一ファイル判定(S1210)のフローを示す図である。 従来技術における、デ・デュプリケート機能及び全文検索機能を備えるストレージシステムの構成の概要を示す図である。 従来技術における、全文検索におけるインデックス情報の構成例を示す図である。
符号の説明
11…検索対象ファイル抽出処理、13…デ・デュプリケートグループ情報追加・作成処理、14…デ・デュプリケート対応キーワード抽出処理、15…デ・デュプリケート対応検索処理、51…代表ファイルフラグ、52…次ファイルID、61,61B…シグネチャ、62…同一シグネチャを持つファイル名のリスト、62B…同一シグネチャを持つファイルIDのリスト、81…ファイル名、82…代表ファイルのファイル名、91…LID、92…次LID、93…ファイルID、94…出現位置情報、100…ストレージ装置、101,101B…NAS、102,102B…全文検索サーバ、103…ストレージ装置、110…DKC(ディスクコントローラ)、111…CHA、112…DKA、113…CM、114…SM、115…SW、120…プログラム、130…DKU(ディスクユニット)、131…HDD、132…LDEV、133…LU、180…LAN、190…SVP、200…全文検索サーバ、300…インデックス情報、301…ファイルのメタデータ、302…キーワード出現場所情報、303…デ・デュプリケートグループ情報、310…ファイルのメタデータ、311,333…ファイルID、312…ファイル名、320…キーワード情報、321…キーワード、322,331…出現場所情報ID(LID)、330…出現場所情報、332…次LID、334…出現位置情報、400…ホスト装置、501,501B…デ・デュプリケート処理部、502,502B…デ・デュプリケート対応処理部、601…デ・デュプリケート情報(C1)、602…デ・デュプリケートグループ情報(C2)、603,603B…シグネチャハッシュ、700…検索対象ファイル群、801,811,821…制御部、802,812,822…メモリ、803,813,823…ポート、804…入力装置、805…出力装置、814…データキャッシュメモリ、815…デ・デュプリケート処理プログラム、824…全文検索処理プログラム、825…デ・デュプリケート対応処理プログラム、900…検索結果情報、901,902…ネットワーク。

Claims (4)

  1. ホスト装置から入出力されるデータのファイルを記憶領域に格納するストレージシステムであって、
    前記ホスト装置にネットワークを介して接続され前記ホスト装置からの前記ファイルの入出力を受け付けるファイルサーバ装置と、
    前記ファイルサーバ装置に接続され前記ファイルサーバ装置からのアクセスにより前記ファイルを自装置内の記憶領域に格納するストレージ装置と、
    前記ストレージ装置の記憶領域に格納されるファイル群に対するインデックス情報の作成処理、及び前記ホスト装置からの指示に応じて前記インデックス情報をキーワード検索して検索結果情報を応答する検索処理、を含む全文検索処理を行う全文検索サーバ装置とを有し、
    前記ファイルサーバ装置は、前記ストレージ装置の記憶領域に格納されるファイル群について中身が同一の複数のファイルをデ・デュプリケート(de-duplicate)する処理を行い、当該ファイル群のデ・デュプリケートの状況を示す第1の情報を作成する、デ・デュプリケート処理部を備え、
    前記全文検索サーバ装置は、前記デ・デュプリケート処理部による前記第1の情報による前記ファイル群のデ・デュプリケートの状況に応じて、前記インデックス情報をデ・デュプリケートする処理を行い、当該インデックス情報のデ・デュプリケートの関係を示す第2の情報を作成して前記検索処理で用いる、デ・デュプリケート対応処理部を備え、
    前記第1の情報は、ファイル名を含むメタデータと、当該ファイルを含む中身が同一の複数のファイルのグループにおける代表ファイルのファイル名と、を含み、
    前記第2の情報は、中身が同一の複数のファイルのグループにおける代表ファイルのフラグと、当該グループの複数のファイルの間のリンク情報と、を含み、
    前記全文検索サーバ装置の前記デ・デュプリケート対応処理部は、前記ストレージ装置の記憶領域から読み出した全文検索処理対象のファイル群について、前記第1の情報に応じて、中身が同一の複数のファイルについては、代表ファイルを除いて、前記インデックス情報作成処理を抑止することにより、
    前記インデックス情報を重複して作成及び保持しないようにすることを特徴とするストレージシステム。
  2. 請求項1記載のストレージシステムにおいて、
    前記インデックス情報の作成処理は、前記ファイルからのキーワード抽出処理を含み、
    前記インデックス情報は、前記ファイルのメタデータと、前記ファイルのデータ本体中のキーワード出現場所情報と、前記デ・デュプリケート対応処理部による前記第2の情報と、を含み、
    前記全文検索サーバ装置は、前記全文検索処理対象のファイル群についての前記インデックス情報の作成処理の際、前記第1の情報を用いて、前記中身が同一の複数のファイル及び代表ファイルかどうかを判定及び検出し、前記代表ファイルと中身が同一のファイルについては、前記キーワード抽出処理を抑止して、前記インデックス情報内にキーワード出現場所情報を保持しないようにし、
    前記全文検索サーバ装置は、前記ホスト装置からのキーワード情報の指定を含む検索指示に応じた検索処理に際して、前記インデックス情報をキーワード情報で検索して、当該キーワードを含む代表ファイルに関する検索結果情報を取得し、前記第2の情報を用いて、当該代表ファイルと中味が同一の他のファイルに関する検索結果情報を追加した、全文検索結果情報を作成し、前記ホスト装置へ応答することを特徴とするストレージシステム。
  3. 請求項2記載のストレージシステムにおいて、
    前記ファイルサーバ装置は、前記第1の情報を前記ストレージ装置の記憶領域に格納し、
    前記全文検索サーバ装置は、前記第2の情報を含む前記インデックス情報を前記ストレージ装置の記憶領域に格納することを特徴とするストレージシステム。
  4. 請求項記載のストレージシステムにおいて、
    前記デ・デュプリケート処理部は、前記代表ファイルについてのシグネチャハッシュ情報を作成及び管理し、前記シグネチャハッシュ情報を用いて、前記中身が同一のファイルを判定及び検出することを特徴とするストレージシステム。
JP2006350236A 2006-12-26 2006-12-26 ストレージシステム Expired - Fee Related JP4951331B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006350236A JP4951331B2 (ja) 2006-12-26 2006-12-26 ストレージシステム
US11/682,359 US7984026B2 (en) 2006-12-26 2007-03-06 Storage system with improved de-duplication arrangement
US13/158,497 US8244690B2 (en) 2006-12-26 2011-06-13 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006350236A JP4951331B2 (ja) 2006-12-26 2006-12-26 ストレージシステム

Publications (2)

Publication Number Publication Date
JP2008158993A JP2008158993A (ja) 2008-07-10
JP4951331B2 true JP4951331B2 (ja) 2012-06-13

Family

ID=39544591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006350236A Expired - Fee Related JP4951331B2 (ja) 2006-12-26 2006-12-26 ストレージシステム

Country Status (2)

Country Link
US (2) US7984026B2 (ja)
JP (1) JP4951331B2 (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US9678967B2 (en) * 2003-05-22 2017-06-13 Callahan Cellular L.L.C. Information source agent systems and methods for distributed data storage and management using content signatures
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US20080189273A1 (en) * 2006-06-07 2008-08-07 Digital Mandate, Llc System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant content data
JP5046863B2 (ja) * 2007-11-01 2012-10-10 株式会社日立製作所 情報処理システム及びデータ管理方法
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
JP4989516B2 (ja) * 2008-02-27 2012-08-01 キヤノン株式会社 表示制御装置、撮像装置及び表示制御方法、プログラム並びに記憶媒体
GB2458309A (en) * 2008-03-13 2009-09-16 Business Partners Ltd Search engine
US8176269B2 (en) * 2008-06-30 2012-05-08 International Business Machines Corporation Managing metadata for data blocks used in a deduplication system
US7913114B2 (en) * 2008-07-31 2011-03-22 Quantum Corporation Repair of a corrupt data segment used by a de-duplication engine
US8788466B2 (en) * 2008-08-05 2014-07-22 International Business Machines Corporation Efficient transfer of deduplicated data
US8392791B2 (en) * 2008-08-08 2013-03-05 George Saliba Unified data protection and data de-duplication in a storage system
US20100153375A1 (en) * 2008-12-16 2010-06-17 Foundation For Research And Technology - Hellas (Institute Of Computer Science --Forth-Ics) System and method for classifying and storing related forms of data
US8712974B2 (en) 2008-12-22 2014-04-29 Google Inc. Asynchronous distributed de-duplication for replicated content addressable storage clusters
US9176978B2 (en) * 2009-02-05 2015-11-03 Roderick B. Wideman Classifying data for deduplication and storage
US8650545B2 (en) * 2009-02-11 2014-02-11 International Business Machines Corporation File creation utility for deduplication testing
US8339680B2 (en) * 2009-04-02 2012-12-25 Xerox Corporation Printer image log system for document gathering and retention
JP4592115B1 (ja) * 2009-05-29 2010-12-01 誠 後藤 ファイル格納システム、サーバ装置及びプログラム
JP5463746B2 (ja) * 2009-06-15 2014-04-09 日本電気株式会社 アーカイブストレージ装置、ストレージシステム、データ格納方法、およびデータ格納プログラム
US8051050B2 (en) * 2009-07-16 2011-11-01 Lsi Corporation Block-level data de-duplication using thinly provisioned data storage volumes
US8204867B2 (en) * 2009-07-29 2012-06-19 International Business Machines Corporation Apparatus, system, and method for enhanced block-level deduplication
US8180740B1 (en) * 2009-08-12 2012-05-15 Netapp, Inc. System and method for eliminating duplicate data by generating data fingerprints using adaptive fixed-length windows
WO2011018852A1 (ja) * 2009-08-13 2011-02-17 株式会社日立ソリューションズ 重複排除機能付きデータ格納装置及び当該データ格納装置の検索インデックスを作成する制御装置
JP4838878B2 (ja) 2009-12-04 2011-12-14 富士通株式会社 データ管理プログラム、データ管理装置、およびデータ管理方法
US8738668B2 (en) 2009-12-16 2014-05-27 Renew Data Corp. System and method for creating a de-duplicated data set
US8401185B1 (en) * 2010-02-01 2013-03-19 Symantec Corporation Systems and methods for securely deduplicating data owned by multiple entities
US20110218973A1 (en) * 2010-03-02 2011-09-08 Renew Data Corp. System and method for creating a de-duplicated data set and preserving metadata for processing the de-duplicated data set
US8453031B2 (en) 2010-03-24 2013-05-28 International Business Machines Corporation Data deduplication using CRC-seed differentiation between data and stubs
JP2011215835A (ja) 2010-03-31 2011-10-27 Toshiba Corp 全文検索機能を備えるストレージ装置
JP5316711B2 (ja) * 2010-06-10 2013-10-16 日本電気株式会社 ファイル記憶装置、ファイル記憶方法およびプログラム
JP2012008854A (ja) * 2010-06-25 2012-01-12 Hitachi Ltd ストレージ仮想化装置
US8862876B2 (en) 2010-11-09 2014-10-14 International Business Machines Corporation Method and system for deleting data
US10394757B2 (en) 2010-11-18 2019-08-27 Microsoft Technology Licensing, Llc Scalable chunk store for data deduplication
US10216759B2 (en) 2010-11-22 2019-02-26 Microsoft Technology Licensing, Llc Heterogeneous file optimization
US8438139B2 (en) 2010-12-01 2013-05-07 International Business Machines Corporation Dynamic rewrite of files within deduplication system
CN102033924B (zh) * 2010-12-08 2012-10-31 浪潮(北京)电子信息产业有限公司 一种数据存储方法和系统
US8271462B2 (en) * 2010-12-10 2012-09-18 Inventec Corporation Method for creating a index of the data blocks
US9280550B1 (en) 2010-12-31 2016-03-08 Emc Corporation Efficient storage tiering
US8886901B1 (en) 2010-12-31 2014-11-11 Emc Corporation Policy based storage tiering
US8266115B1 (en) * 2011-01-14 2012-09-11 Google Inc. Identifying duplicate electronic content based on metadata
US8458145B2 (en) * 2011-01-20 2013-06-04 Infinidat Ltd. System and method of storage optimization
US9886446B1 (en) * 2011-03-15 2018-02-06 Veritas Technologies Llc Inverted index for text searching within deduplication backup system
US8521705B2 (en) * 2011-07-11 2013-08-27 Dell Products L.P. Accelerated deduplication
US8990171B2 (en) 2011-09-01 2015-03-24 Microsoft Corporation Optimization of a partially deduplicated file
WO2013095381A1 (en) * 2011-12-20 2013-06-27 Intel Corporation Method and system for data de-duplication
WO2013121456A1 (en) * 2012-02-13 2013-08-22 Hitachi, Ltd. Management apparatus and management method for hierarchical storage system
WO2013187901A2 (en) * 2012-06-14 2013-12-19 Empire Technology Development Llc Data deduplication management
US8914668B2 (en) 2012-09-06 2014-12-16 International Business Machines Corporation Asynchronous raid stripe writes to enable response to media errors
US8843784B2 (en) 2012-09-06 2014-09-23 International Business Machines Corporation Remapping disk drive I/O in response to media errors
JP2013030189A (ja) * 2012-10-10 2013-02-07 Toshiba Corp 全文検索機能を備えるストレージ装置
US8898118B2 (en) 2012-11-30 2014-11-25 International Business Machines Corporation Efficiency of compression of data pages
US10545918B2 (en) 2013-11-22 2020-01-28 Orbis Technologies, Inc. Systems and computer implemented methods for semantic data compression
KR102187127B1 (ko) * 2013-12-03 2020-12-04 삼성전자주식회사 데이터 연관정보를 이용한 중복제거 방법 및 시스템
US9430490B1 (en) * 2014-03-28 2016-08-30 Formation Data Systems, Inc. Multi-tenant secure data deduplication using data association tables
US10635645B1 (en) 2014-05-04 2020-04-28 Veritas Technologies Llc Systems and methods for maintaining aggregate tables in databases
US10025804B2 (en) * 2014-05-04 2018-07-17 Veritas Technologies Llc Systems and methods for aggregating information-asset metadata from multiple disparate data-management systems
US9732593B2 (en) 2014-11-05 2017-08-15 Saudi Arabian Oil Company Systems, methods, and computer medium to optimize storage for hydrocarbon reservoir simulation
US9659047B2 (en) * 2014-12-03 2017-05-23 Netapp, Inc. Data deduplication utilizing extent ID database
US20180276206A1 (en) * 2017-03-23 2018-09-27 Hcl Technologies Limited System and method for updating a knowledge repository
GB201708762D0 (en) 2017-06-01 2017-07-19 Microsoft Technology Licensing Llc Managing electronic slide decks
CN107330077B (zh) * 2017-07-01 2020-07-14 广东电网有限责任公司信息中心 一种数字档案馆档案的检索方法
JP7298248B2 (ja) * 2019-04-05 2023-06-27 富士フイルムビジネスイノベーション株式会社 文書処理装置及びプログラム
CN113626462B (zh) * 2021-07-15 2022-11-15 北京百度网讯科技有限公司 即时通讯对象的搜索方法、装置、电子设备和存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342075A (ja) * 1992-06-05 1993-12-24 Omron Corp ファイル管理システム
JPH07146880A (ja) * 1993-11-22 1995-06-06 Nippon Steel Corp 文書検索装置及び方法
US5813008A (en) * 1996-07-12 1998-09-22 Microsoft Corporation Single instance storage of information
US6547829B1 (en) * 1999-06-30 2003-04-15 Microsoft Corporation Method and system for detecting duplicate documents in web crawls
US6389433B1 (en) * 1999-07-16 2002-05-14 Microsoft Corporation Method and system for automatically merging files into a single instance store
JP3772606B2 (ja) * 1999-10-19 2006-05-10 株式会社日立製作所 電子文書管理方法及びシステム並びに記録媒体
US7730113B1 (en) * 2000-03-07 2010-06-01 Applied Discovery, Inc. Network-based system and method for accessing and processing emails and other electronic legal documents that may include duplicate information
JP2005157768A (ja) * 2003-11-26 2005-06-16 Hitachi Ltd 電子ファイル保存方法及び実施装置並びに処理プログラム
US8131726B2 (en) * 2005-01-12 2012-03-06 International Business Machines Corporation Generic architecture for indexing document groups in an inverted text index
US8635194B2 (en) * 2006-10-19 2014-01-21 Oracle International Corporation System and method for data compression

Also Published As

Publication number Publication date
US7984026B2 (en) 2011-07-19
US20080155192A1 (en) 2008-06-26
US8244690B2 (en) 2012-08-14
US20110246431A1 (en) 2011-10-06
JP2008158993A (ja) 2008-07-10

Similar Documents

Publication Publication Date Title
JP4951331B2 (ja) ストレージシステム
JP4824085B2 (ja) ネットワークファイルシステムをキャッシュするシステム、及び方法
US7680844B2 (en) Method for preserving virtual filesystem information across high availability takeover
US8290994B2 (en) Obtaining file system view in block-level data storage systems
US20070220029A1 (en) System and method for hierarchical storage management using shadow volumes
US7870105B2 (en) Methods and apparatus for deduplication in storage system
US8554808B2 (en) File management sub-system and file migration control method in hierarchical file system
JP5881859B2 (ja) ストレージ装置
JP5320557B2 (ja) ストレージシステム
US20020087672A1 (en) Self-defining data units
JP2009289252A (ja) 階層ストレージシステムでのリモート複製
JP2010049488A (ja) ストレージシステム及びデータ管理方法
JP2005301590A (ja) ストレージシステム及びデータ複製方法
JP2007072813A (ja) ストレージシステム、ファイル移動方法、及びコンピュータプログラム
JP2007226347A (ja) 計算機システム、計算機システムの管理装置、及びデータのリカバリー管理方法
US9569311B2 (en) Computer system for backing up data
JP2008305288A (ja) 情報システム、および、情報システムの情報保存方法
JP2015510174A (ja) ロケーション非依存のファイル
JP2014505910A (ja) 計算機及び計算機によるデータ管理方法
JP2016066285A (ja) 記憶システム、記憶システム制御方法及び仮想テープ装置制御プログラム
JP2008262561A (ja) 履歴上のファイル名およびロケーションをインデックス付きにすることによりファイル・サーチおよびファイル操作を支援するためのシステムおよび方法
US9727588B1 (en) Applying XAM processes
US9678972B2 (en) Packing deduplicated data in a self-contained deduplicated repository
JP2005234860A (ja) バージョン管理システム、バージョン管理サーバ装置、及び記憶デバイス制御装置
CN104281486B (zh) 一种虚拟机处理方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120312

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees