JP2005122702A5 - - Google Patents

Download PDF

Info

Publication number
JP2005122702A5
JP2005122702A5 JP2004241794A JP2004241794A JP2005122702A5 JP 2005122702 A5 JP2005122702 A5 JP 2005122702A5 JP 2004241794 A JP2004241794 A JP 2004241794A JP 2004241794 A JP2004241794 A JP 2004241794A JP 2005122702 A5 JP2005122702 A5 JP 2005122702A5
Authority
JP
Japan
Prior art keywords
file
index
information
updated
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004241794A
Other languages
English (en)
Other versions
JP4559158B2 (ja
JP2005122702A (ja
Filing date
Publication date
Priority claimed from US10/688,287 external-priority patent/US20050086192A1/en
Application filed filed Critical
Publication of JP2005122702A publication Critical patent/JP2005122702A/ja
Publication of JP2005122702A5 publication Critical patent/JP2005122702A5/ja
Application granted granted Critical
Publication of JP4559158B2 publication Critical patent/JP4559158B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (20)

  1. ファイルサーバ内に複数のファイルを保存する第1のステップと、
    前記ファイルサーバ内の各前記ファイルをそれぞれ解析することにより得られた該ファイルごとのインデックス情報からなり、与えられた検索要求を満たすファイルを特定するために第1のコンピュータが用いるインデックスを生成すると共に、前記ファイルサーバ内の前記ファイルへの操作をモニタし、前記ファイルサーバ内の前記ファイルが更新されたときには、該ファイルを所定の更新済ファイルリストに登録する第2のステップと、
    前記更新済ファイルリストに登録された前記ファイルを解析することにより得られるインデックス情報に基づいて前記インデックスを更新する第3のステップと
    を備えることを特徴とするデータにアクセスするための方法。
  2. 前記第3のステップにおいて、
    前記ファイルサーバは、
    前記更新済ファイルリストに登録された前記ファイルに関する第1の情報を前記第1のコンピュータに送信し、
    前記第1のコンピュータは、
    前記第1の情報に基づいて、該ファイルの解析を行なう
    ことを特徴とする請求項1に記載の方法。
  3. 前記第1の情報は、
    前記対応するファイルへのパス情報であり、
    前記第1のコンピュータは、
    前記第1の情報に基づいて該ファイルにアクセスし、該ファイルを解析する
    ことを特徴とする請求項2に記載の方法。
  4. 前記第1の情報は、該ファイル自体である
    ことを特徴とする請求項2に記載の方法。
  5. 前記第1の情報は、前記更新済ファイルリストのコピーである
    ことを特徴とする請求項2に記載の方法。
  6. 前記インデックスを更新した後、前記更新済ファイルリストをクリアする第4のステップを更に備える
    ことを特徴とする請求項1に記載の方法。
  7. 前記第4のステップでは、
    前記更新済ファイルリストの内容を削除する
    ことを特徴とする請求項6に記載の方法。
  8. 前記インデックスは前記第1のコンピュータ内に保存される
    ことを特徴とする請求項1に記載の方法。
  9. 前記第1のコンピュータは、
    与えられた検索要求を満たすファイルを前記インデックスに基づいて検索する検索エンジンが搭載された検索エンジンサーバである
    ことを特徴とする請求項1に記載の方法。
  10. 複数のファイルを保存するストレージと、
    前記ストレージに保存された前記複数のファイルのうちの内容が更新された前記ファイルが登録される更新済ファイルリストと、
    第1のファイルに対する書き込み操作の要求を受信したときに、当該第1のファイルを前記更新済ファイルリストに登録し、第1のコンピュータからの要求に応じて、前記更新済ファイルリストに登録した前記第1のファイルを解析するための第1の情報を該第1のコンピュータに送信すると共に、前記第1の情報を前記第1のコンピュータに送信した後に前記第1のファイルを前記更新済ファイルリストから削除するファイルサーバ制御部と
    を備えることを特徴とするファイルサーバ。
  11. 前記第1のコンピュータは、
    与えられた検索要求を満たすファイルを前記インデックスに基づいて検索する検索エンジンが搭載された検索エンジンサーバである
    ことを特徴とする請求項10に記載のファイルサーバ。
  12. 検索要求を受信し、該検索要求に応答して、第1のファイルサーバ内に保存されている各ファイルをそれぞれ精査することにより得られた各インデックス情報からなるインデックスに基づいて該検索要求を満たすファイルを特定し、検索結果を送信する第1のステップと、
    第1のファイルサーバ内に保存された前記ファイルのうち、所定の第1の時点以降に更新されたファイルに関する第1の情報を該第1のファイルサーバから受信し、当該第1の情報に基づいて、前記第1の時点以降に更新されたファイルにアクセスし、当該ファイルを精査して当該ファイルの前記インデックス情報を生成し、生成した前記インデックス情報に基づいて前記インデックスを更新する第2のステップと
    を備えることを特徴とするファイルサーバに保存されたファイルにアクセスする方法。
  13. 前記第1の時点は、最後に前記インデックスが更新された時点である
    ことを特徴とする請求項12に記載の方法。
  14. 前記第1の時点は、前記インデックスの生成後の時点である
    ことを特徴とする請求項12に記載の方法。
  15. 前記第1のステップでは、
    前記第1のファイルサーバから複数の第1のファイルにアクセスし、
    前記第2のステップでは、
    各前記第1のファイルをそれぞれ精査して前記第1のファイルごとの前記インデックス情報をそれぞれ生成すると共に、前記インデックス内に各前記インデックス情報を追加することにより、各前記第1のファイルをインデックス付し、
    前記第1の時点は、
    全ての前記第1のファイルにインデックス付けを完了した後の時点である
    ことを特徴とする請求項12に記載の方法。
  16. 前記第2のステップでは、
    前記複数の第1のファイルに対するインデックス付けに際して、第1の要求を前記第1のファイルサーバに送信し、
    前記第1の時点は、
    該ファイルサーバが該第1の要求を受信した時点に基づいて決められる
    ことを特徴とする請求項12に記載の方法。
  17. 前記第1のステップは、
    第2のファイルサーバから複数の第2のファイルにアクセスし、
    前記第2のステップでは、
    各前記第2のファイルをそれぞれ精査して前記第2のファイルごとの前記インデックス情報をそれぞれ生成し、前記インデックス内に各前記インデックス情報を追加することにより、各前記第2のファイルをインデックス付する処理を全ての前記第2のファイルについて実行する
    ことを特徴とする請求項12に記載の方法。
  18. 第2のステップでは、
    前記インデックスの更新が複数の前記第1のファイルサーバに対して実行され、各前記第1のファイルサーバは、それぞれ固有の前記第1の時点を有する
    ことを特徴とする請求項12に記載の方法。
  19. 前記第1の時点は、
    前記第1のファイルサーバの前記インデックスを生成した後の時点である
    ことを特徴とする請求項18に記載の方法。
  20. 前記第1の時点は、
    前回の前記インデックスの更新後の時点である
    ことを特徴とする請求項18に記載の方法。
JP2004241794A 2003-10-16 2004-08-23 データにアクセスするための方法及びシステム Expired - Fee Related JP4559158B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/688,287 US20050086192A1 (en) 2003-10-16 2003-10-16 Method and apparatus for improving the integration between a search engine and one or more file servers

Publications (3)

Publication Number Publication Date
JP2005122702A JP2005122702A (ja) 2005-05-12
JP2005122702A5 true JP2005122702A5 (ja) 2007-08-09
JP4559158B2 JP4559158B2 (ja) 2010-10-06

Family

ID=34521135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004241794A Expired - Fee Related JP4559158B2 (ja) 2003-10-16 2004-08-23 データにアクセスするための方法及びシステム

Country Status (2)

Country Link
US (2) US20050086192A1 (ja)
JP (1) JP4559158B2 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6883135B1 (en) * 2000-01-28 2005-04-19 Microsoft Corporation Proxy server using a statistical model
US7844646B1 (en) * 2004-03-12 2010-11-30 Netapp, Inc. Method and apparatus for representing file system metadata within a database for efficient queries
US7539702B2 (en) * 2004-03-12 2009-05-26 Netapp, Inc. Pre-summarization and analysis of results generated by an agent
US7630994B1 (en) 2004-03-12 2009-12-08 Netapp, Inc. On the fly summarization of file walk data
US7293039B1 (en) 2004-03-12 2007-11-06 Network Appliance, Inc. Storage resource management across multiple paths
US7584221B2 (en) * 2004-03-18 2009-09-01 Microsoft Corporation Field weighting in text searching
US7487138B2 (en) * 2004-08-25 2009-02-03 Symantec Operating Corporation System and method for chunk-based indexing of file system content
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7739277B2 (en) * 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
US7761448B2 (en) 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7827181B2 (en) * 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US7716198B2 (en) * 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7792833B2 (en) * 2005-03-03 2010-09-07 Microsoft Corporation Ranking search results using language types
US20060200460A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation System and method for ranking search results using file types
US7599917B2 (en) * 2005-08-15 2009-10-06 Microsoft Corporation Ranking search results using biased click distance
US8095565B2 (en) * 2005-12-05 2012-01-10 Microsoft Corporation Metadata driven user interface
JP4877921B2 (ja) * 2006-01-25 2012-02-15 株式会社日立製作所 ストレージシステム、記憶制御装置及び記憶制御装置のリカバリポイント検出方法
US7917963B2 (en) * 2006-08-09 2011-03-29 Antenna Vaultus, Inc. System for providing mobile data security
US9141627B2 (en) * 2006-09-26 2015-09-22 Sony Corporation Providing a user access to data files distributed in a plurality of different types of user devices
US7840569B2 (en) * 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
JP5028218B2 (ja) * 2007-10-30 2012-09-19 株式会社日立製作所 記憶制御装置、ストレージシステム及び記憶制御装置の制御方法
JP5046863B2 (ja) 2007-11-01 2012-10-10 株式会社日立製作所 情報処理システム及びデータ管理方法
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8935789B2 (en) * 2008-07-21 2015-01-13 Jayant Shukla Fixing computer files infected by virus and other malware
US20100070526A1 (en) * 2008-09-15 2010-03-18 Disney Enterprises, Inc. Method and system for producing a web snapshot
US8037113B2 (en) * 2009-01-20 2011-10-11 Novell, Inc. Techniques for file system searching
JP5709377B2 (ja) 2009-12-22 2015-04-30 キヤノン株式会社 画像形成装置、画像形成装置の制御方法及びプログラム
JP5728167B2 (ja) * 2010-05-12 2015-06-03 キヤノン株式会社 情報処理装置およびその制御方法、コンピュータプログラム
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8793706B2 (en) 2010-12-16 2014-07-29 Microsoft Corporation Metadata-based eventing supporting operations on data
US8595238B2 (en) 2011-06-22 2013-11-26 International Business Machines Corporation Smart index creation and reconciliation in an interconnected network of systems
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
CN103902632B (zh) * 2012-12-31 2018-01-02 华为技术有限公司 键值存储系统中构建文件系统的方法、装置及电子设备
CN105718569A (zh) * 2016-01-20 2016-06-29 广州视睿电子科技有限公司 复合文档的上传方法、装置及系统
CN106487935A (zh) * 2016-12-21 2017-03-08 深圳市青葡萄科技有限公司 一种私有云内部服务器远程维护方法和系统
CN111143284B (zh) * 2018-11-02 2023-06-20 浙江宇视科技有限公司 文件系统动态索引方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US215601A (en) * 1879-05-20 Improvement in child s chair and carriage
US4747043A (en) * 1984-02-10 1988-05-24 Prime Computer, Inc. Multiprocessor cache coherence system
JPH09204442A (ja) * 1996-01-24 1997-08-05 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
US5845273A (en) * 1996-06-27 1998-12-01 Microsoft Corporation Method and apparatus for integrating multiple indexed files
JPH1063686A (ja) * 1996-08-20 1998-03-06 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
US6067541A (en) * 1997-09-17 2000-05-23 Microsoft Corporation Monitoring document changes in a file system of documents with the document change information stored in a persistent log
US6269362B1 (en) * 1997-12-19 2001-07-31 Alta Vista Company System and method for monitoring web pages by comparing generated abstracts
JP2000066945A (ja) * 1998-08-20 2000-03-03 Nec Corp ドキュメント収集システム、装置及び方法、並びに記録媒体
US6289362B1 (en) * 1998-09-01 2001-09-11 Aidministrator Nederland B.V. System and method for generating, transferring and using an annotated universal address
US6356863B1 (en) * 1998-09-08 2002-03-12 Metaphorics Llc Virtual network file server
US6418453B1 (en) * 1999-11-03 2002-07-09 International Business Machines Corporation Network repository service for efficient web crawling
JP2001184355A (ja) * 1999-12-22 2001-07-06 Fujitsu Ltd 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体
JP4271827B2 (ja) * 2000-05-09 2009-06-03 富士通株式会社 情報提供システムおよび仲介装置
US7020658B1 (en) * 2000-06-02 2006-03-28 Charles E. Hill & Associates Data file management system and method for browsers
JP2002169805A (ja) * 2000-11-30 2002-06-14 Matsushita Electric Ind Co Ltd クライアント・サーバ型文書検索装置
US6636854B2 (en) * 2000-12-07 2003-10-21 International Business Machines Corporation Method and system for augmenting web-indexed search engine results with peer-to-peer search results
US7231382B2 (en) * 2001-06-01 2007-06-12 Orbitz Llc System and method for receiving and loading fare and schedule data
US6714953B2 (en) * 2001-06-21 2004-03-30 International Business Machines Corporation System and method for managing file export information
US20040215601A1 (en) * 2003-04-23 2004-10-28 Win-Harn Liu Method of file management using a computer

Similar Documents

Publication Publication Date Title
JP2005122702A5 (ja)
JP6006267B2 (ja) 索引キーを使用して検索を絞込むシステムおよび方法
EP3103025B1 (en) Content based organization of file systems
US9836514B2 (en) Cache based key-value store mapping and replication
JP5492187B2 (ja) 編集距離および文書情報を使用する検索結果順位付け
US8397080B2 (en) Scalable segment-based data de-duplication system and method for incremental backups
KR20200053512A (ko) Kvs 트리 데이터베이스
JP2005267600A5 (ja)
JP5886447B2 (ja) ロケーション非依存のファイル
CN103870588B (zh) 一种在数据库中使用的方法及装置
CN104657672B (zh) 用于对表的预定义部分存档的方法和系统
CN110888837B (zh) 对象存储小文件归并方法及装置
US20110252018A1 (en) System and method for creating search index on cloud database
CN104424219B (zh) 一种数据文件的管理方法及装置
CN103353901B (zh) 基于Hadoop分布式文件系统的表数据的有序管理方法以及系统
US20150261783A1 (en) Method and apparatus for storing and reading files
US11681691B2 (en) Presenting updated data using persisting views
CN107209707A (zh) 基于云的分级系统保存
JP4825719B2 (ja) 高速ファイル属性検索
CN110352410A (zh) 跟踪索引节点的访问模式以及预提取索引节点
CN106874329A (zh) 数据库表索引的实现方法和装置
CN111782589B (zh) 一种用于操作历史重现的数据模型的构建方法及系统
CN111045994B (zh) 一种基于kv数据库的文件分类检索方法及系统
US11797528B2 (en) Systems and methods for targeted data discovery
JP5655764B2 (ja) サンプリング装置、サンプリングプログラム、およびその方法