JP2011070257A - ファイル検索システム - Google Patents
ファイル検索システム Download PDFInfo
- Publication number
- JP2011070257A JP2011070257A JP2009218572A JP2009218572A JP2011070257A JP 2011070257 A JP2011070257 A JP 2011070257A JP 2009218572 A JP2009218572 A JP 2009218572A JP 2009218572 A JP2009218572 A JP 2009218572A JP 2011070257 A JP2011070257 A JP 2011070257A
- Authority
- JP
- Japan
- Prior art keywords
- search
- index data
- file
- server
- servers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】複数の検索サーバを使用してファイルのインデックスデータを管理するファイル検索システムにおいて、期間情報と検索サーバの割り当てを新たに決定する際、割り当て可能な検索サーバのうちでインデックスデータの使用領域が小さいものに新規の期間情報に割り当てる。これにより、ファイル検索システム全体としてのインデックスデータの均一化を実現し、検索効率を向上させる。
【選択図】図1
Description
図1は、実施の形態に係るファイル検索システムの概念構成例を示す。図1に示すファイル検索システムは、ファイルシステム群11、ホストシステム12、検索サーバ13a、13b、13n、検索要求装置14で構成されている。
以下、ファイル検索システムで実行される処理動作の内容を説明する。
図3に、インデックスデータ133a、133b、133nを作成されるまでの処理動作を示す。まず、ホストシステム12のファイル収集部121が、ファイルシステム群11をクローリングし、入力ファイルの情報を収集する(ステップ31)。ファイル収集部121は、入力ファイルの文書名、容量、コンテンツ、更新日等のファイル情報のうち更新日属性を取得し、ディスパッチテーブル122に登録されている更新日21と照合する。
図4に、更新日と検索サーバの割り当て関係を事後的に変更することにより、検索サーバ間でインデックスデータの使用領域の均一化を実現する処理動作を説明する。なお、図4に示す処理動作は、図3に示す処理動作の実行前に定期的に実施される。
図6に、ファイル検索システムに新たな検索サーバを追加する際の処理動作を示す。この場合、ホストシステム12に、新しい検索サーバの検索サーバ名22と接続情報が登録される(ステップ51)。この登録により、ファイルシステム群11の次回クローリング時(図3の場合だけでなく、図4に示す場合も含む。)、新たに追加された検索サーバが更新日に対する割り当て候補に追加される(ステップ52)。追加直後は、この新たに追加された検索サーバにおけるインデックスデータの使用領域が一般に最小となる。従って、図3に示す処理動作の実行時にも図4に示す処理動作の実行時にも、新たな更新日に対する割り当て先も検索サーバ間における更新日の割り当て変更時にも、優先的に新たに追加された検索サーバにシステム内のインデックスデータが割り当てられる。
前述したように、実施の形態に係るファイル検索システムは、複数の検索サーバ13a、13b、13nを使用して、ファイルシステム群11に格納された全ファイルのインデックスデータを分散的に管理する。このインデックデータの分散を実現する仕組みとして、ホストシステム12内に、更新日と検索サーバとの対応関係を一意に特定するデータベース(ディスパッチテーブル122)を用意する。
Claims (3)
- 複数の検索サーバを使用してファイルのインデックスデータを管理するファイル検索システムにおいて、
ファイルに付属する期間情報とインデックスデータを作成する検索サーバとの対応関係を一意に特定するテーブルと、
前記データベースに新たな対応関係を登録する場合、前記複数の検索サーバのそれぞれからインデックスデータの使用領域を取得する処理と、取得された使用領域が最も小さい検索サーバを検出する処理と、検出された検索サーバを新たに登録する期間情報に割り付ける処理とを実行するテーブル管理部と
を有することを特徴とするファイル検索システム。 - 請求項1に記載のファイル検索システムにおいて、
前記テーブル管理部は、
前記複数の検索サーバのそれぞれから取得したインデックスデータの使用領域について最大値と最小値を検出する処理と、検出された最大値と最小値の差が閾値を越えるか否かを判定する処理と、前記差が閾値を越える場合、前記最大値に対応する検索サーバに割り付けられた期間情報の一部を、前記最小値に対応する検索サーバへの割付に変更する処理と
を更に有することを特徴とするファイル検索システム。 - 請求項2に記載のファイル検索システムにおいて、
割り付けを変更する一部の前記期間情報は、期間情報に対応するインデックスデータの使用領域が大きいものが優先的に選択される
ことを特徴とするファイル検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218572A JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218572A JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011070257A true JP2011070257A (ja) | 2011-04-07 |
JP5371656B2 JP5371656B2 (ja) | 2013-12-18 |
Family
ID=44015511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009218572A Expired - Fee Related JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5371656B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013156881A (ja) * | 2012-01-31 | 2013-08-15 | Hitachi Solutions Ltd | ファイルリスト生成方法及びシステム、ファイルリスト生成装置並びにプログラム |
JP2013167990A (ja) * | 2012-02-15 | 2013-08-29 | Hitachi Solutions Ltd | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
WO2013181160A1 (en) * | 2012-05-30 | 2013-12-05 | Skychron, Inc. | Using chronology as the primary system interface for files, their related meta-data, and their related files |
KR101744892B1 (ko) * | 2016-03-17 | 2017-06-09 | 주식회사 젠시스템즈 | 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법 |
KR102089348B1 (ko) * | 2019-01-28 | 2020-03-16 | 주식회사 와이즈넛 | 분산 데이터 저장 장치 기반 검색 엔진 시스템 및 검색 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214843A (ja) * | 1993-01-20 | 1994-08-05 | Hitachi Ltd | データベース管理システムおよび問合せの処理方法 |
JP2003006007A (ja) * | 2001-06-20 | 2003-01-10 | Nec Soft Ltd | 時系列データ自動管理方式 |
JP2003091515A (ja) * | 2001-09-19 | 2003-03-28 | Hitachi Software Eng Co Ltd | 帳票データの負荷分散型処理システム |
JP2007280361A (ja) * | 2006-03-14 | 2007-10-25 | Canon Inc | 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体 |
JP2009122930A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | 情報検索装置およびその方法 |
JP2009211403A (ja) * | 2008-03-04 | 2009-09-17 | Hitachi Software Eng Co Ltd | ファイル検索プログラム |
-
2009
- 2009-09-24 JP JP2009218572A patent/JP5371656B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214843A (ja) * | 1993-01-20 | 1994-08-05 | Hitachi Ltd | データベース管理システムおよび問合せの処理方法 |
JP2003006007A (ja) * | 2001-06-20 | 2003-01-10 | Nec Soft Ltd | 時系列データ自動管理方式 |
JP2003091515A (ja) * | 2001-09-19 | 2003-03-28 | Hitachi Software Eng Co Ltd | 帳票データの負荷分散型処理システム |
JP2007280361A (ja) * | 2006-03-14 | 2007-10-25 | Canon Inc | 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体 |
JP2009122930A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | 情報検索装置およびその方法 |
JP2009211403A (ja) * | 2008-03-04 | 2009-09-17 | Hitachi Software Eng Co Ltd | ファイル検索プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013156881A (ja) * | 2012-01-31 | 2013-08-15 | Hitachi Solutions Ltd | ファイルリスト生成方法及びシステム、ファイルリスト生成装置並びにプログラム |
JP2013167990A (ja) * | 2012-02-15 | 2013-08-29 | Hitachi Solutions Ltd | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
WO2013181160A1 (en) * | 2012-05-30 | 2013-12-05 | Skychron, Inc. | Using chronology as the primary system interface for files, their related meta-data, and their related files |
US8949244B2 (en) | 2012-05-30 | 2015-02-03 | SkyChron Inc. | Using chronology as the primary system interface for files, their related meta-data, and their related files |
KR101744892B1 (ko) * | 2016-03-17 | 2017-06-09 | 주식회사 젠시스템즈 | 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법 |
KR102089348B1 (ko) * | 2019-01-28 | 2020-03-16 | 주식회사 와이즈넛 | 분산 데이터 저장 장치 기반 검색 엔진 시스템 및 검색 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP5371656B2 (ja) | 2013-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6962971B2 (ja) | データ記憶サービスを実装するシステム及び方法 | |
US10581957B2 (en) | Multi-level data staging for low latency data access | |
AU2014212780B2 (en) | Data stream splitting for low-latency data access | |
CA2929777C (en) | Managed service for acquisition, storage and consumption of large-scale data streams | |
EP3069228B1 (en) | Partition-based data stream processing framework | |
US8543596B1 (en) | Assigning blocks of a file of a distributed file system to processing units of a parallel database management system | |
AU2018202230A1 (en) | Client-configurable security options for data streams | |
US10394782B2 (en) | Chord distributed hash table-based map-reduce system and method | |
US8918372B1 (en) | Content-aware distributed deduplicating storage system based on consistent hashing | |
JP6281225B2 (ja) | 情報処理装置 | |
KR20080014800A (ko) | 시간 제한적 메시지들의 효율적인 처리 방법 | |
US20130325913A1 (en) | Log management system and program | |
JP5371656B2 (ja) | ファイル検索システム | |
US20130046798A1 (en) | Method and apparatus for visualization of infrastructure using a non-relational graph data store | |
JP2017220112A (ja) | データ管理システム、制御方法、およびプログラム | |
JPWO2011071104A1 (ja) | 分散ファイルシステム、そのデータ選択方法およびプログラム | |
CN107203623B (zh) | 网络爬虫系统的负载均衡调节方法 | |
JP6951846B2 (ja) | 計算機システム及びタスクの割当方法 | |
US10862922B2 (en) | Server selection for optimized malware scan on NAS | |
US20220342888A1 (en) | Object tagging | |
CN101483668A (zh) | 热点数据的网络存储和访问方法、设备及系统 | |
JP6672190B2 (ja) | データベースシステムおよびデータ処理方法 | |
EP2765517B1 (en) | Data stream splitting for low-latency data access | |
US10614055B2 (en) | Method and system for tree management of trees under multi-version concurrency control | |
CN113835613B (zh) | 一种文件读取方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5371656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |