JP5371656B2 - ファイル検索システム - Google Patents

ファイル検索システム Download PDF

Info

Publication number
JP5371656B2
JP5371656B2 JP2009218572A JP2009218572A JP5371656B2 JP 5371656 B2 JP5371656 B2 JP 5371656B2 JP 2009218572 A JP2009218572 A JP 2009218572A JP 2009218572 A JP2009218572 A JP 2009218572A JP 5371656 B2 JP5371656 B2 JP 5371656B2
Authority
JP
Japan
Prior art keywords
search
file
index data
server
servers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009218572A
Other languages
English (en)
Other versions
JP2011070257A (ja
Inventor
浩二 石原
敬 今井
俊和 高木
武志 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2009218572A priority Critical patent/JP5371656B2/ja
Publication of JP2011070257A publication Critical patent/JP2011070257A/ja
Application granted granted Critical
Publication of JP5371656B2 publication Critical patent/JP5371656B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の検索サーバを用いて、大規模なファイル群の中から必要なファイルを検索するファイル検索システムに関する。
今日、企業その他の組織では、日常業務で作成される各種の書類をデジタルデータの形式で様々なファイルサーバやストレージ等に蓄積する。情報のデジタル化の進展に伴い、企業その他の組織では多数の電子文書が扱われており、組織内に蓄積される電子文書のデータ量は爆発的に増大し続けている。組織内で蓄積された情報資産を効果的に活用するために注目を集めているのが、電子文書の高速な検索機能を提供するファイル検索システムである。
一般的なファイル検索システムは、ファイルサーバやストレージをクローリング(巡回)してファイルのインデックスデータ(索引データ)を作成し、高速な検索機能を実現する。これらインデックスデータのデータ量は、一般に元ファイルのデータ量に比例して増大する。このため、作成されたインデックスデータを複数の検索サーバに分散的に格納する仕組みが求められている。特許文献1には、入力データが発生した期間毎にインデックスデータを格納するデータベース(検索サーバ)を排他的に決定することにより、インデックスデータの分散を実現する方法が開示されている。
特開平7−325839号公報
ところが、各期間に対するデータベース(検索サーバ)の割り当てを分散するだけでは、データベース(検索サーバ)間でインデックスデータの使用領域に大きな偏りが発生するのを避け得ない。これは、各期間に属するインデックスデータのデータ量が均等でないことに一因がある。なお、検索インデックスの使用領域の偏りが検索サーバ間で大きいと、特定の検索サーバに負荷が集中し、システム全体の検索効率を低下させてしまう。また、ファイル検索システムを構成する検索サーバの台数に変更が生じた場合にも、同様の状況が発生する。
そこで、発明者らは、インデックスデータを格納する検索サーバと期間情報の割り当てを適応的に設定できる仕組みを提供する。
この目的のため、1つの発明では、期間情報と検索サーバの割り当てを新たに登録する際には、割り当て可能な検索サーバのうちで検索インデックスの使用領域が小さいものに新規の期間情報を割り当てる手法を提供する。
また、1つの発明では、検索インデックスの使用領域が最も大きい検索サーバと最も小さい検索サーバ間で使用領域の差が閾値以上の場合になった場合には、使用領域が最も大きい検索サーバに割り当てられている期間情報の一部を、使用領域が最も小さい検索サーバへの割り当てに変更する手法を提供する。
本発明によれば、ファイル検索システムを構成する複数の検索サーバ間におけるインデックスデータの使用領域を均一化でき、システム全体としての検索効率を高めることができる。
ファイル検索システムの実施形態例を示す図。 ディスパッチテーブルのデータ構造例を示す図。 インデックスデータの作成処理例を示すフローチャート。 検索サーバ間のデータ均一化処理例を示すフローチャート。 ディスパッチテーブルのデータ更新例を説明する図。 検索サーバの追加処理例を説明するフローチャート。
以下、図面に基づいて、本発明の実施の形態を説明する。なお、後述する装置構成や処理動作の内容は発明を説明するための一例であり、本発明は、後述する装置構成や処理動作に既知の技術を組み合わせた発明や後述する装置構成や処理動作の一部を既知の技術と置換した発明も包含する。
(システム構成)
図1は、実施の形態に係るファイル検索システムの概念構成例を示す。図1に示すファイル検索システムは、ファイルシステム群11、ホストシステム12、検索サーバ13a、13b、13n、検索要求装置14で構成されている。
ファイルシステム群11は、例えば企業内の電子情報(ファイル)を保持するファイルサーバやストレージである。ホストシステム12は、ファイルシステム群11から電子情報を収集し、割り当て単位としての期間情報(例えば更新日)と検索サーバ13a、13b、13nの割り当てを管理するコンピュータシステムである。検索サーバ13a、13b、13nは、割り当てに従って送信された電子情報(ファイル)のインデックスデータの作成と、検索要求装置14からの検索要求に応じた検索処理を実行するサーバである。検索要求装置14は、例えば企業内の端末装置である。ファイルシステム群11とホストシステム12、ホストシステム12と検索サーバ13a、13b、13n、検索サーバ13a、13b、13nと検索要求装置14はそれぞれネットワーク経由で接続されている。
ホストシステム12は、ファイル収集部121と、ディスパッチテーブル122と、ファイル送信部123と、テーブル管理部124とで構成される。これらの処理機能は、入出力装置、記憶装置、演算装置その他で構成されるコンピュータ上で実行されるコンピュータプログラム及びデータ構造を通じて実現される。もっとも、これら構成の全部又は一部をハードウェアで構成することもできる。
ファイル収集部121は、ファイルシステム群11に保持されている各電子情報(ファイル)の文書名、容量、コンテンツの内容、更新日等のファイル情報等を収集する機能を実現する。ディスパッチテーブル122は、電子情報(ファイル)が属する期間と検索サーバ13a、13b、13nとの割り当てを格納する。ファイル送信部123は、ファイル情報をディスパッチテーブル122に従って対応する検索サーバ13a、13b、13nに送信する機能を実現する。テーブル管理部124は、検索サーバ13a、13b、13n間でインデックスデータの使用領域に偏りが生じないようにディスパッチテーブル122を適応的に更新する機能を実現する。具体的な処理動作の内容は後述する。
検索サーバ13a、13b、13nは、検索要求応答部131a、131b、131nと、インデックス作成部132a、132b、132nと、インデックスデータ133a、133b、133nとで構成される。検索要求応答部131a、131b、131nは、いずれも検索要求装置14から受信した検索要求に基づいてインデックスデータ133a、133b、133nを検索し、該当する情報を検索要求装置14に応答する機能を実現する。インデックス作成部132a、132b、132nは、定期的にクローリングされた入力ファイルの情報に基づいてインデックスデータ133a、133b、133nを作成する機能を実現する。さらに、インデックス作成部132a、132b、132nは、定期的にクローリングされた入力ファイルに対して更新を検知した場合には、インデックスデータ133a、133b、133nを再作成する機能を実行する。なお、インデックス作成部132a、132b、132nは、既知のインデックスデータ133a、133b、133nが存在しないことを検出した場合、該当するインデックスデータ133a、133b、133nを記憶領域から削除する機能も有している。これらの機能により、検索結果は、常に最新の状態に保持される。なお、新しく入力されたファイルのうちインデックスデータとして使用される情報には、文書名、容量、コンテンツ、更新日など様々な情報が含まれる。
図2に、ディスパッチテーブル122のデータ構造の一例を示す。この実施の形態の場合、ディスパッチテーブル122は、更新日21と検索サーバ名22で構成される。すなわち、この実施の形態では、割り当て単位としての期間に「更新日」を使用し、各更新日に属するファイルを割り当てる検索サーバ13a、13b、13nに対応する情報を一組として格納する。図2に示すように、更新日に属するファイルの割り当ては、複数存在する検索サーバ13a、13b、13nのいずれか一つに排他的に割り当てられる。このディスパッチテーブル122により、複数の検索サーバ13a、13b、13nへのインデックスデータの分散が実現される。
更新日21には、各ファイルが有している最終更新日属性に対応付けられる更新日が格納される。検索サーバ名22には、同じ更新日を有するファイルを格納する検索サーバを一意に特定するための情報、例えばホスト名やIPアドレスといった情報が登録される。ホストシステム12のファイル送信部123は、このディスパッチテーブル122を参照してファイル情報を送信する検索サーバを決定する。
例えば図2の場合、ディスパッチテーブル122には、更新日「2009/08/01」に対応するサーバ名として「サーバA」が登録されている。従って、2009年8月1日に更新された全てのファイルは、ホストシステム12を通じてサーバAに送信される。また、2009年8月1日に更新された全てのファイルのインデックスデータが、検索サーバAにおいて作成される。
このディスパッチテーブル122に対する新規レコードの登録は、テーブル管理部124が、各検索サーバ間でインデックスデータの使用領域(データ容量)が均一になるように決定される。図2は、この規則に従って、新規に登録される更新日「2009/08/05」がサーバAに割り当てられる様子を表している。
(ファイル検索システムで実行される動作)
以下、ファイル検索システムで実行される処理動作の内容を説明する。
(1) 均一化動作1
図3に、インデックスデータ133a、133b、133nを作成されるまでの処理動作を示す。まず、ホストシステム12のファイル収集部121が、ファイルシステム群11をクローリングし、入力ファイルの情報を収集する(ステップ31)。ファイル収集部121は、入力ファイルの文書名、容量、コンテンツ、更新日等のファイル情報のうち更新日属性を取得し、ディスパッチテーブル122に登録されている更新日21と照合する。
既存のディスパッチテーブル122の更新日21のレコードに、取得された更新日が存在する場合(ステップ32)、ファイル収集部121は同一レコードから検索サーバ名22を取得する。取得された検索サーバ名22は、ファイル収集部121からファイル送信部123に与えられる。ファイル送信部123は、ディスパッチテーブル122から取得された検索サーバ(例えばサーバA)に、入力ファイルの情報を送信する(ステップ35)。この入力ファイルを受信した検索サーバ(例えばサーバA)のインデックス作成部は、受信した入力ファイルの情報に基づいてインデックスデータを作成する(ステップ36)。
一方、既存のディスパッチテーブル122の更新日21のレコードに、取得された更新日が存在しない場合(ステップ33)、テーブル管理部124は、検索サーバ13a、13b、13nのそれぞれから使用領域のデータ量を測定し、使用領域が最も少ない検索サーバ名を取得する。この割り当ては、一般に、インデックスデータの使用領域が最大の検索サーバとインデックスデータの使用領域が最小の検索サーバの差を縮める方向に作用する。さらに、テーブル管理部124は、ディスパッチテーブル122にステップ31で取得した入力ファイルの更新日とステップ33で取得した検索サーバ名を新しいレコードに登録する(ステップ34)。ディスパッチテーブル122に新しいレコードが登録されると、登録された検索サーバ名22が、テーブル管理部124からファイル送信部123に与えられる。ファイル送信部123は、通知された検索サーバ(例えばサーバB)に、入力ファイルの情報を送信する(ステップ35)。この入力ファイルを受信した検索サーバ(例えばサーバB)のインデックス作成部は、受信した入力ファイルの情報に基づいてインデックスデータを作成する(ステップ36)。
ホストシステム12は、ファイルシステム群11に存在する全てのファイルに対してこれら一連の処理を実行する。この結果、検索サーバ13a、13b、13nには、ファイルシステム群11のファイルにアクセスするためのインデックスデータが分散的に配置されることになる。
なお、ホストシステム12は、定期的にファイルシステム群11をクローリングして図3に示す一連の処理動作を実施することにより、各検索サーバ内のインデックスデータを常に最新の状態に維持する。
(2) 均一化動作2
図4に、更新日と検索サーバの割り当て関係を事後的に変更することにより、検索サーバ間でインデックスデータの使用領域の均一化を実現する処理動作を説明する。なお、図4に示す処理動作は、図3に示す処理動作の実行前に定期的に実施される。
まず、ホストシステム12のテーブル管理部124は、各検索サーバ13a、13b、13nからインデックスデータ133a、133b、133nの使用領域を取得する(ステップ41)。次に、テーブル管理部124は、取得した検索サーバ13a、13b、13nのインデックスデータ133a、133b、133nのうち使用領域が最大の検索サーバと使用領域が最小の検索サーバを取得する(ステップ42)。
続いて、テーブル管理部124は、インデックスデータの使用領域が最大の検索サーバとインデックスデータの使用領域が最小の検索サーバのそれぞれの使用領域を比較する。このとき、テーブル管理部124は、2つの使用領域の差が予め指定した閾値よりも大きいか否かを判定する(ステップ43)。
インデックスデータの使用領域の差が閾値よりも大きい場合、テーブル管理部124は、ディスパッチテーブル122に登録された複数のレコードの中からインデックスデータの使用領域が最大であると判定された検索サーバの検索サーバ名22を含むレコードを一つ選択する。例えば該当レコードの各更新日に対応するインデックスデータのうちデータ量が最大であるレコードを一つ選択する。任意に一つのレコードを選択することも可能である。
テーブル管理部124は、このとき選択したレコードの検索サーバ名を、インデックスデータの使用領域が最小であった検索サーバ名に更新する(ステップ44)。図5に、検索サーバ名の更新イメージを示す。図5の場合、更新日「2009/08/01」に属する入力ファイルの割り当てが「サーバA」から「サーバC」に変更されている。従って、図5の場合、サーバAがインデックスデータの使用領域が最大の検索サーバであり、サーバCがインデックスデータの使用領域が最小の検索サーバである。
この後、テーブル管理部124はファイル収集部121を通じてファイルシステム群11のクローリングを実施する。この後、各検索サーバには、更新後のディスパッチテーブル122の設定に従って入力ファイルが送信される。
各検索サーバ13a、13b、13nは、新たな割り当て規則に従って送信された入力ファイルに基づいてインデックスデータを更新する(ステップ45)。この検索サーバ13a、13b、13nにおけるインデックスデータの作成動作は、一般的なルーチン動作として実行される。
このインデックスデータの更新時、更新前の時点でインデックスデータの使用領域が最大であった検索サーバ(図5の場合は、サーバA)には、割り当て関係が変更された更新日21に対応するファイルの入力が無い。このため、当該検索サーバ(図5の場合は、サーバA)では、入力が確認されなかった既知のファイルが存在しないものとして処理し、インデックスデータの作成対象から除外する。
一方、更新前の時点でインデックスデータの使用領域が最小であった検索サーバ(図5の場合は、サーバC)には、新しく指定された更新日を有するファイルが入力される。従って、当該検索サーバは、新しく入力のあったファイルも含めてインデックスデータを作成する。
図4に示す処理動作の実行により、更新前の時点でインデックスデータの使用領域が最大であった検索サーバについては使用領域が減少され、反対に更新前の時点でインデックスデータの使用領域が最小であった検索サーバについては使用領域が増加される。すなわち、インデックスデータの使用領域の最大値と最小値の差が縮小される。結果的に、各検索サーバ間でインデックスデータの使用領域が均一化される。
図4に示す処理動作の実行は、定期的に実行されるクローリング処理(図3)の実行に先行させることで、インデックスデータの使用領域の均一化効果を高めることができる。しかも、この図4に示す処理動作で必要とされる動作は、インデックスデータの使用領域が最大の検索サーバと最小の検索サーバ間での割り当てファイルの入れ替えだけであり、その他の検索サーバについては割り当てられるファイルの構成に変更が無い限り、インデックスデータの変更が不要である。このように、図4に示す処理動作は、検索サーバ13a、13b、13nの間でインデックスデータ全体の再構成を必要としない。このことは、インデックスデータの更新に伴うシステム全体の処理負荷が小さく済むことを意味する。この負荷の削減効果は、ファイル検索システムを構成する検索サーバの台数が多いほど大きくなる。
また、ファイル検索システムを構成する各検索サーバにインデックスデータをバランス良く分散することができるので、検索負荷も複数の検索サーバに均一に分散することができる。結果的に、ファイル検索システム全体として効率的かつ高速な検索処理が可能となる。
(3) 均一化動作3
図6に、ファイル検索システムに新たな検索サーバを追加する際の処理動作を示す。この場合、ホストシステム12に、新しい検索サーバの検索サーバ名22と接続情報が登録される(ステップ51)。この登録により、ファイルシステム群11の次回クローリング時(図3の場合だけでなく、図4に示す場合も含む。)、新たに追加された検索サーバが更新日に対する割り当て候補に追加される(ステップ52)。追加直後は、この新たに追加された検索サーバにおけるインデックスデータの使用領域が一般に最小となる。従って、図3に示す処理動作の実行時にも図4に示す処理動作の実行時にも、新たな更新日に対する割り当て先も検索サーバ間における更新日の割り当て変更時にも、優先的に新たに追加された検索サーバにシステム内のインデックスデータが割り当てられる。
この結果、検索サーバが追加された場合でも、インデックスデータ全体の再構成を行うことなく、各検索サーバ間の使用領域を平均化することが可能になる。
(まとめ)
前述したように、実施の形態に係るファイル検索システムは、複数の検索サーバ13a、13b、13nを使用して、ファイルシステム群11に格納された全ファイルのインデックスデータを分散的に管理する。このインデックデータの分散を実現する仕組みとして、ホストシステム12内に、更新日と検索サーバとの対応関係を一意に特定するデータベース(ディスパッチテーブル122)を用意する。
また、ホストシステム12に、新たな更新日の登録時に、ファイル検索システムを構成する各検索サーバ13a、13b、13nのインデックスデータの使用領域を取得し、使用領域が最も少ない検索サーバを対応付ける仕組みを採用する。これにより、検索サーバ間におけるインデックスデータの使用領域のばらつき範囲を縮小する。すなわち、複数の検索サーバ間でインデックスデータの使用領域の均一化を実現する。
また、ホストシステム12に、検索サーバ間におけるインデックスデータの使用領域の最大値と最小値の差を監視する機能を採用する。そして、差が閾値を越える場合には、インデックスデータの使用領域が最大の検索サーバに割り当てられている更新日の一部(一つに限らず、同時に複数でも良い。)の割り当てをインデックスデータの使用領域が最小の検索サーバに変更する。この仕組みの採用により、ファイル検索システムを構成する検索サーバ間におけるインデックスデータの使用領域のばらつき範囲を一定範囲内に収束させることができる。すなわち、複数の検索サーバ間でインデックスデータの使用領域の均一化を実現する。
これらの仕組みの採用により、検索サーバの台数が変更しない場合だけでなく、検索サーバの台数が増減する場合でも、ファイル検索システム全体としてインデックスデータの配置の分散化又は均一化を実現できる。また、分散化又は均一化は、ファイルシ検索システムを構成する一部の検索サーバのインデックスデータの更新だけで実現でき、システム全体でインデックスデータを再構成する必要がない。すなわち、ファイル検索システムを構成する検索サーバ間でインデックスデータの使用領域を均一化できるだけでなく、均一化に要する処理負荷も削減することができる。結果的に、インデックスデータの更新負荷が小さく、システム全体としての検索効率も高いファイル検索システムを実現できる。
11…ファイルシステム群、12…ホストシステム、121…ファイル収集部、122…ディスパッチテーブル、123…ファイル送信部、124…テーブル管理部、13a、13b、13n…検索サーバ、131a、131b、132n…検索要求応答部、132a、132b、132n…インデックス作成部、133a、133b、133n…インデックスデータ、14…検索要求装置、21…更新日、22…検索サーバ名。

Claims (3)

  1. 複数の検索サーバを使用してファイルのインデックスデータを管理するファイル検索システムにおいて、
    ファイルに付属する期間情報とインデックスデータを作成する検索サーバとの対応関係を一意に特定するテーブルと、
    データベースに新たな対応関係を登録する場合、前記複数の検索サーバのそれぞれからインデックスデータの使用領域を取得する処理と、取得された使用領域が最も小さい検索サーバを検出する処理と、検出された検索サーバを新たに登録する期間情報に割り付ける処理とを実行するテーブル管理部と
    を有することを特徴とするファイル検索システム。
  2. 請求項1に記載のファイル検索システムにおいて、
    前記テーブル管理部は、
    前記複数の検索サーバのそれぞれから取得したインデックスデータの使用領域について最大値と最小値を検出する処理と、検出された最大値と最小値の差が閾値を越えるか否かを判定する処理と、前記差が閾値を越える場合、前記最大値に対応する検索サーバに割り付けられた期間情報の一部を、前記最小値に対応する検索サーバへの割付に変更する処理と
    を更に有することを特徴とするファイル検索システム。
  3. 請求項2に記載のファイル検索システムにおいて、
    割り付けを変更する一部の前記期間情報は、期間情報に対応するインデックスデータの
    使用領域が大きいものが優先的に選択される
    ことを特徴とするファイル検索システム。
JP2009218572A 2009-09-24 2009-09-24 ファイル検索システム Expired - Fee Related JP5371656B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009218572A JP5371656B2 (ja) 2009-09-24 2009-09-24 ファイル検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009218572A JP5371656B2 (ja) 2009-09-24 2009-09-24 ファイル検索システム

Publications (2)

Publication Number Publication Date
JP2011070257A JP2011070257A (ja) 2011-04-07
JP5371656B2 true JP5371656B2 (ja) 2013-12-18

Family

ID=44015511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009218572A Expired - Fee Related JP5371656B2 (ja) 2009-09-24 2009-09-24 ファイル検索システム

Country Status (1)

Country Link
JP (1) JP5371656B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5798503B2 (ja) * 2012-01-31 2015-10-21 株式会社日立ソリューションズ ファイルリスト生成方法及びシステム、ファイルリスト生成装置並びにプログラム
JP5759915B2 (ja) * 2012-02-15 2015-08-05 株式会社日立ソリューションズ ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置
US8949244B2 (en) 2012-05-30 2015-02-03 SkyChron Inc. Using chronology as the primary system interface for files, their related meta-data, and their related files
KR101744892B1 (ko) * 2016-03-17 2017-06-09 주식회사 젠시스템즈 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법
KR102089348B1 (ko) * 2019-01-28 2020-03-16 주식회사 와이즈넛 분산 데이터 저장 장치 기반 검색 엔진 시스템 및 검색 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3266351B2 (ja) * 1993-01-20 2002-03-18 株式会社日立製作所 データベース管理システムおよび問合せの処理方法
JP2003006007A (ja) * 2001-06-20 2003-01-10 Nec Soft Ltd 時系列データ自動管理方式
JP2003091515A (ja) * 2001-09-19 2003-03-28 Hitachi Software Eng Co Ltd 帳票データの負荷分散型処理システム
JP5105894B2 (ja) * 2006-03-14 2012-12-26 キヤノン株式会社 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体
JP5046873B2 (ja) * 2007-11-14 2012-10-10 エヌ・ティ・ティ レゾナント株式会社 情報検索装置およびその方法
JP2009211403A (ja) * 2008-03-04 2009-09-17 Hitachi Software Eng Co Ltd ファイル検索プログラム

Also Published As

Publication number Publication date
JP2011070257A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
JP6962971B2 (ja) データ記憶サービスを実装するシステム及び方法
US10581957B2 (en) Multi-level data staging for low latency data access
AU2014212780B2 (en) Data stream splitting for low-latency data access
US8543596B1 (en) Assigning blocks of a file of a distributed file system to processing units of a parallel database management system
EP3069274B1 (en) Managed service for acquisition, storage and consumption of large-scale data streams
US8918372B1 (en) Content-aware distributed deduplicating storage system based on consistent hashing
US8965941B2 (en) File list generation method, system, and program, and file list generation device
US8738625B2 (en) Log management system and program
US20170344546A1 (en) Code dispersion hash table-based map-reduce system and method
AU2014346366A1 (en) Partition-based data stream processing framework
JP6281225B2 (ja) 情報処理装置
KR20080014800A (ko) 시간 제한적 메시지들의 효율적인 처리 방법
US9015414B2 (en) Load balancing based upon data usage
JP5371656B2 (ja) ファイル検索システム
CN102104617A (zh) 一种网站运营系统存储海量图片数据的方法
US11308066B1 (en) Optimized database partitioning
KR101744892B1 (ko) 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법
US20130046798A1 (en) Method and apparatus for visualization of infrastructure using a non-relational graph data store
JP2017220112A (ja) データ管理システム、制御方法、およびプログラム
US20060161591A1 (en) System and method for intelligent deletion of crawled documents from an index
CN107203623B (zh) 网络爬虫系统的负载均衡调节方法
US20180260463A1 (en) Computer system and method of assigning processing
US10862922B2 (en) Server selection for optimized malware scan on NAS
US20220342888A1 (en) Object tagging
CN101483668A (zh) 热点数据的网络存储和访问方法、设备及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130917

R150 Certificate of patent or registration of utility model

Ref document number: 5371656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees