JP2013522798A5 - - Google Patents

Download PDF

Info

Publication number
JP2013522798A5
JP2013522798A5 JP2013501314A JP2013501314A JP2013522798A5 JP 2013522798 A5 JP2013522798 A5 JP 2013522798A5 JP 2013501314 A JP2013501314 A JP 2013501314A JP 2013501314 A JP2013501314 A JP 2013501314A JP 2013522798 A5 JP2013522798 A5 JP 2013522798A5
Authority
JP
Japan
Prior art keywords
document
virtual
embedded
documents
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013501314A
Other languages
English (en)
Other versions
JP2013522798A (ja
JP5856139B2 (ja
Filing date
Publication date
Priority claimed from US12/727,739 external-priority patent/US8560519B2/en
Application filed filed Critical
Publication of JP2013522798A publication Critical patent/JP2013522798A/ja
Publication of JP2013522798A5 publication Critical patent/JP2013522798A5/ja
Application granted granted Critical
Publication of JP5856139B2 publication Critical patent/JP5856139B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (20)

  1. 仮想ドキュメントを用いた検索を実施する、コンピューティング装置内の少なくとも一部で実行される方法であって、
    検索要求を、該検索要求において提供された基準にマッチする1つ以上のドキュメントを取り出すために、ユーザから受信するステップと、
    クロール時に、前記基準にマッチする前記1つ以上のドキュメントを特定するステップと、
    前記基準とマッチする前記1つ以上のドキュメント内に含まれた関連する第1のドキュメントを特定するステップと、
    前記関連する第1のドキュメント内に埋め込まれた第2のドキュメントと、前記関連する第1のドキュメント内に含まれた前記第2のドキュメントへのリンクと、前記第2のドキュメント内に含まれた第3のドキュメントへのリンクとを特定するステップと、
    前記関連する第1のドキュメントと前記第2のドキュメントとの間、および前記第2のドキュメントと前記第3のドキュメントとの間の関係を判定するステップと、
    前記第2のドキュメントおよび前記第3のドキュメントを表す仮想ドキュメントを生成するステップと、
    前記仮想ドキュメントにインデックスを付与するため、および複数のサイクルではなく1つのサイクルで前記仮想ドキュメントをクロールするために前記仮想ドキュメントを一意に特定するステップと、
    前記関連する第1のドキュメントおよび前記仮想ドキュメントを含む検索結果のインデックスを作成するステップであって、前記仮想ドキュメントは、前記第2のドキュメントおよび前記第3のドキュメントを表す、ステップと、
    所定のアルゴリズムにしたがって前記インデックスにおける前記検索結果を順位付けるステップと、
    前記関連する第1のドキュメントと前記仮想ドキュメントとを含む前記検索結果をレンダリングするステップと
    含む方法。
  2. 前記関連する第1のドキュメントと前記第2のドキュメントとの間の関係は、前記第2のドキュメントが前記関連する第1のドキュメントからリンクされているということ、および、前記第2のドキュメントが前記関連する第1のドキュメントに埋め込まれているということのうちの1つを含み、さらに前記関係は、前記第3のドキュメントが前記第2のドキュメントからリンクされていることと、前記第3のドキュメントが前記第2のドキュメントに埋め込まれていることのうちの1つを含む、請求項1に記載の方法。
  3. 前記関連する第1のドキュメントにリンクされた外部データ・ソースを表す別の仮想ドキュメントを生成するステップと、
    前記検索結果へのインデックス付与において、前記別の仮想ドキュメントを含めるステップと
    をさらに含む、請求項2に記載の方法。
  4. 前記関連する第1のドキュメントと前記第2のドキュメント、前記仮想ドキュメントと前記別の仮想ドキュメントとを用いる前記第3のドキュメントと前記関連する第1のドキュメント、のうちの1つの間の関係をレンダリングするステップ
    をさらに含む、請求項3記載の方法。
  5. 前記関連する第1のドキュメントと、前記第2のドキュメントおよび前記ソース第3のドキュメントのうちの少なくとも1つとの間の関係を、前記検索結果に関連付けられたメタデータ、前記仮想ドキュメントの識別子、および前記他の仮想ドキュメントのうちの1つを介して保存するステップ
    をさらに含む、請求項3に記載の方法。
  6. 前記仮想ドキュメントの識別子は、
    前記関連する第1のドキュメントと前記第2のドキュメントがリンクされている場合には、前記関連する第1のドキュメントの識別子と前記第2のドキュメントの識別子との組合せを、
    前記第2のドキュメントが前記関連する第1のドキュメントに埋め込まれている場合には、前記関連する第1のドキュメントの識別子と前記第2のドキュメントの名前との組合せを
    む、請求項に記載の方法。
  7. 前記別の仮想ドキュメントの前記識別子は、サーバ名と外部データ・ソース識別子との組み合わせを含む、請求項5に記載の方法。
  8. 前記関連する第1のドキュメントは複数のドキュメントに関係し、前記方法はさらに、それぞれが前記複数のドキュメントの1つを表す複数の仮想ドキュメントを生成するステップを含む、請求項1に記載の方法。
  9. 前記検索は、デスクトップ環境およびネットワーク環境のうちの1つにおいて実行される、請求項1に記載の方法。
  10. 前記関連する第1のドキュメントのコンテンツは、テキスト・データおよびグラフィカル・データのうちの少なくとも1つを含む、請求項1に記載の方法。
  11. 仮想ドキュメントを用いた検索を促進するネットワーク・コンピューティング装置であって、前記コンピューティング装置は、
    命令を格納したメモリと、
    格納した前記命令に基づいて検索アプリケーションを実行する、前記メモリに接続されたプロセッサであって、前記検索アプリケーションが、
    検索要求を受信し、
    クロール時に、前記検索要求において提供された前記基準にマッチする1つ以上のドキュメントを特定し、
    関連するドキュメントにリンクされたドキュメント、前記関連するドキュメントに埋め込まれたドキュメント、前記関連するドキュメントにリンクされた前記ドキュメントに埋め込まれた別のドキュメント、および前記関連するドキュメントにデータを提供するデータ・ソース判定し、
    前記リンクされたドキュメント、前記埋め込まれたドキュメント、前記別の埋め込まれたドキュメントおよび前記データ・ソースの各々を表す仮想ドキュメントを生成し、
    前記関連するドキュメントおよび前記仮想ドキュメントを含む検索結果にインデックスを作成し、前記仮想ドキュメントは、前記リンクされたドキュメント、前記埋め込まれたドキュメント、前記別の埋め込まれたドキュメントおよび前記データ・ソースのうちの1つを表し、
    所定のアルゴリズムにしたがって前記インデックスにおける前記検索結果を順位付け、
    前記検索結果を、レンダリングするために、クライアント・アプリケーションに提供して、前記検索結果を前記関連するドキュメントと前記仮想ドキュメントとの間の関係を考慮して順位付け、
    複数のフォーマットでマッピングするドキュメントとして前記関係をレンダリングする
    ように構成されたプロセッサと
    含むコンピューティング装置。
  12. 前記検索アプリケーションはさらに、前記関連するドキュメントと前記仮想ドキュメントとの間の関係に関連付けられた情報を、前記クライアント・アプリケーションに提供して、前記クライアント・アプリケーションが前記関係を前記検索結果とともに表示できるようにするように構成された請求項11に記載のコンピューティング装置。
  13. グラフィカル方式およびテキスト形式のうちの少なくとも1つを用いて前記関係を表示する請求項12に記載のコンピューティング装置。
  14. 前記関係は、チェーンされた形式での複数のリンクされたドキュメント、複数の埋め込まれたドキュメント、複数のリンクされたデータ・ソース、のうちの1つを含み、前記仮想ドキュメントの識別子は、前記チェーンされた関係を反映するようい構成された、請求項11記載のコンピューティング装置。
  15. 前記関連するドキュメントにリンクされたドキュメントを表す仮想ドキュメントのURL(Uniform Resource Locator)は、前記関連するドキュメントのURLと前記リンクされたドキュメントのURLとの組合せを含み、前記関連するドキュメントに埋め込まれたドキュメントを表す仮想ドキュメントのURLは、前記関連するドキュメントのURLと前記埋め込まれたドキュメントの名前との組合せを含み、前記関連するドキュメントにリンクされたデータ・ソースを表す仮想ドキュメントのURLは、前記データ・ソースに関連付けられたサーバ名とデータ・ソース識別子との組合せを含む請求項14に記載のコンピューティング装置。
  16. 前記検索は、データベース・ソース、分析サービス、ポータル、別のサーバ、およびデスクトップの集合からの少なくとも1つにおいて実行される、請求項11に記載のコンピューティング装置。
  17. 前記コンピューティング装置は、企業ベースのネットワーク、クラウド・ベースのネットワーク、および企業ベースのネットワークとクラウド・ベースのネットワークとの組合せのうちの1つに接続されることを特徴とする請求項11に記載のコンピューティング装置。
  18. 仮想ドキュメントを用いて検索を容易にするためのコンピューティング装置であって、該コンピューティング装置が、
    格納された命令に基づいて検索アプリケーションを実行するように構成されたプロセッサと、
    前記プロセッサに結合されたメモリであって、前記命令を格納するように構成されたメモリと、
    を含み、前記命令は、
    検索要求を検索アプリケーションが受るステップと、
    クロール時に、前記検索要求において提供された基準にマッチする1つ以上のドキュメントを特定するステップと、
    関連するドキュメントにリンクされたドキュメント、前記関連するドキュメントに埋め込まれたドキュメント、前記関連するドキュメントに埋め込まれた前記ドキュメントに埋め込まれた別のドキュメント、および前記関連するドキュメントにデータを提供するデータ・ソースをクロール時に判定して、前記関連するドキュメント、関係のあるドキュメント、およびデータ・ソースを1つの検索でインデックス付与するようにするステップと、
    前記リンクされたドキュメント、前記埋め込まれたドキュメント、前記別の埋め込まれたドキュメント、および前記データ・ソースの各々を表す仮想ドキュメントを生成して、前記リンクされたドキュメント、前記埋め込まれたドキュメント、前記別の埋め込まれたドキュメント、前記データ・ソースが検索可能にかつナビゲーション可能にレンダリングされるようにするステップと、
    前記仮想ドキュメントにインデックスを付与するため、および複数のサイクルではなく1つのサイクルで前記仮想ドキュメントをクロールするために前記仮想ドキュメントを一意に特定するステップと、
    前記関連するドキュメントおよび前記仮想ドキュメントを含む検索結果のインデックスを作成するステップであって、前記仮想ドキュメントは、前記リンクされたドキュメント、前記埋め込まれたドキュメント、前記別の埋め込まれたドキュメント、および前記データ・ソースのうちの1つを表す、ステップと、
    所定のアルゴリズムにしたがって前記インデックスにおける前記検索結果を順位付けるステップと、
    前記検索結果、および前記関連するドキュメントと前記仮想ドキュメントとの間の関係を提示するために、前記検索結果をクライアント・アプリケーションに提供するステップであって、前記検索結果は、前記関連するドキュメントと前記仮想ドキュメントとの間の関係を考慮して順位付けられる、提供するステップと、
    複数のフォーマットでマッピングするドキュメントとして前記関係をレンダリングするステップと
    含む、コンピューティング装置
  19. 前記データ・ソースを表す前記仮想ドキュメントにより、前記検索アプリケーションが、前記関連するドキュメントと、同一のデータ・ソースを共有する複数のドキュメントとの間の関係を推論できるようにすることを特徴とする請求項18に記載のコンピューティング装置
  20. 前記関連するドキュメントに埋め込まれた前記ドキュメントの種類は、前記埋め込まれたドキュメントを表す前記仮想ドキュメントのプロパティとして格納されることを特徴とする請求項18に記載のコンピューティング装置
JP2013501314A 2010-03-19 2011-03-16 仮想ドキュメントを用いたインデックス付与と検索 Active JP5856139B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/727,739 US8560519B2 (en) 2010-03-19 2010-03-19 Indexing and searching employing virtual documents
US12/727,739 2010-03-19
PCT/US2011/028651 WO2011116082A2 (en) 2010-03-19 2011-03-16 Indexing and searching employing virtual documents

Publications (3)

Publication Number Publication Date
JP2013522798A JP2013522798A (ja) 2013-06-13
JP2013522798A5 true JP2013522798A5 (ja) 2014-05-08
JP5856139B2 JP5856139B2 (ja) 2016-02-09

Family

ID=44648035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013501314A Active JP5856139B2 (ja) 2010-03-19 2011-03-16 仮想ドキュメントを用いたインデックス付与と検索

Country Status (8)

Country Link
US (1) US8560519B2 (ja)
EP (1) EP2548140A4 (ja)
JP (1) JP5856139B2 (ja)
CN (1) CN102822820B (ja)
AU (1) AU2011227327B2 (ja)
BR (1) BR112012023714A2 (ja)
CA (1) CA2790421C (ja)
WO (1) WO2011116082A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140278B2 (en) * 2012-03-26 2018-11-27 Adobe Systems Incorporated Computer-implemented methods and systems for associating files with cells of a collaborative spreadsheet
US9239846B2 (en) 2012-04-23 2016-01-19 Google Inc. Sharing and synchronizing electronically stored files
US8949179B2 (en) 2012-04-23 2015-02-03 Google, Inc. Sharing and synchronizing electronically stored files
EP2842050A4 (en) * 2012-04-23 2016-01-13 Google Inc SHARING AND SYNCHRONIZING ELECTRONICALLY STORED FILES
US9529818B2 (en) 2012-04-23 2016-12-27 Google Inc. Sharing and synchronizing electronically stored files
US9244934B2 (en) 2012-04-23 2016-01-26 Google Inc. Sharing and synchronizing electronically stored files
US8965880B2 (en) 2012-10-05 2015-02-24 Google Inc. Transcoding and serving resources
US9727652B2 (en) * 2013-07-22 2017-08-08 International Business Machines Corporation Utilizing dependency among internet search results
US20140297430A1 (en) * 2013-10-31 2014-10-02 Reach Labs, Inc. System and method for facilitating the distribution of electronically published promotions in a linked and embedded database
US8924850B1 (en) 2013-11-21 2014-12-30 Google Inc. Speeding up document loading
CN110851436B (zh) * 2018-08-03 2023-10-27 Emc Ip控股有限公司 具有虚拟编索引的分布式搜索框架
CN111367778B (zh) * 2020-03-13 2023-07-07 百度在线网络技术(北京)有限公司 评估搜索策略的数据分析方法和装置
US20220230106A1 (en) * 2021-01-20 2022-07-21 Saudi Arabian Oil Company Systems and methods for asset integrity management and monitoring of safety critical elements
CN113204579A (zh) * 2021-04-29 2021-08-03 北京金山数字娱乐科技有限公司 内容关联方法、系统、装置、电子设备及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
JP3108015B2 (ja) * 1996-05-22 2000-11-13 松下電器産業株式会社 ハイパーテキスト検索装置
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6397231B1 (en) * 1998-08-31 2002-05-28 Xerox Corporation Virtual documents generated via combined documents or portions of documents retrieved from data repositories
US7461334B1 (en) * 1999-03-19 2008-12-02 Network Solutions, Llc Apparatus and method for web forwarding
JP3974292B2 (ja) * 1999-08-20 2007-09-12 富士通株式会社 文書閲覧システム及びそのシステムで用いられるデータ読み込み装置及び文書表示装置
US7191392B1 (en) * 2000-03-23 2007-03-13 Virpack.Com System and method for the creation of virtual information packages
US20020078014A1 (en) 2000-05-31 2002-06-20 David Pallmann Network crawling with lateral link handling
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US7203673B2 (en) * 2000-12-27 2007-04-10 Fujitsu Limited Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents
JP3895955B2 (ja) * 2001-08-24 2007-03-22 株式会社東芝 情報検索方法および情報検索システム
US7165024B2 (en) 2002-02-22 2007-01-16 Nec Laboratories America, Inc. Inferring hierarchical descriptions of a set of documents
US20030225722A1 (en) * 2002-05-30 2003-12-04 International Business Machines Corporation Method and apparatus for providing multiple views of virtual documents
JP4438392B2 (ja) * 2003-11-27 2010-03-24 富士ゼロックス株式会社 木構造データ作成装置及びプログラム
US20050149499A1 (en) * 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US7424467B2 (en) * 2004-01-26 2008-09-09 International Business Machines Corporation Architecture for an indexer with fixed width sort and variable width sort
US8805781B2 (en) 2005-06-15 2014-08-12 Geronimo Development Document quotation indexing system and method
KR100816934B1 (ko) * 2006-04-13 2008-03-26 엘지전자 주식회사 문서검색 결과를 이용한 군집화 시스템 및 그 방법
US20080114753A1 (en) * 2006-11-15 2008-05-15 Apmath Ltd. Method and a device for ranking linked documents
US8090722B2 (en) 2007-03-21 2012-01-03 Oracle International Corporation Searching related documents

Similar Documents

Publication Publication Date Title
JP2013522798A5 (ja)
JP5856139B2 (ja) 仮想ドキュメントを用いたインデックス付与と検索
US20230139464A1 (en) Platform for authoring, storing, and searching workflows
Yue et al. Geoprocessing in cloud computing platforms–a comparative analysis
JP6356273B2 (ja) バッチ最適化レンダリング及びフェッチアーキテクチャ
US9146994B2 (en) Pivot facets for text mining and search
KR101775883B1 (ko) 정보 스트림의 정보를 처리하는 방법 및 시스템
US9229979B2 (en) Optimizing parallel queries using interesting distributions
US9135307B1 (en) Selectively generating alternative queries
CN103678511B (zh) 根据可视化模板进行网页内容抽取的方法及装置
JP6695952B2 (ja) 組込可能なメディアコンテンツサーチウィジェット
JP2014527228A5 (ja)
US20140280133A1 (en) Structured Data to Aggregate Analytics
JP2007535028A5 (ja)
KR20170092707A (ko) 최적화된 브라우저 렌더링 프로세스
CN112136123A (zh) 表征文件以进行相似性搜索
US10901811B2 (en) Creating alerts associated with a data storage system based on natural language requests
CN109074378B (zh) 模块化电子数据分析计算系统
JP2018518764A5 (ja)
US8996512B2 (en) Search engine optimization using a find operation
Rosati et al. Facilitating data discovery by connecting related resources
US9384251B2 (en) Synchronization of off-line reports and off-line mobile content packages
US10409871B2 (en) Apparatus and method for searching information
US8934662B1 (en) Tracking image origins
Zhang How structured data (Linked Data) help in Big Data Analysis-Expand Patent Data with Linked Data Cloud