JP2005182803A - 情報ダイジェストを生成する方法、システム、及びプログラム - Google Patents

情報ダイジェストを生成する方法、システム、及びプログラム Download PDF

Info

Publication number
JP2005182803A
JP2005182803A JP2004362223A JP2004362223A JP2005182803A JP 2005182803 A JP2005182803 A JP 2005182803A JP 2004362223 A JP2004362223 A JP 2004362223A JP 2004362223 A JP2004362223 A JP 2004362223A JP 2005182803 A JP2005182803 A JP 2005182803A
Authority
JP
Japan
Prior art keywords
information
digest
generating
document
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004362223A
Other languages
English (en)
Other versions
JP2005182803A5 (ja
Inventor
Daniel-Alexander Billsus
ビルサス ダニエル−アレキサンダー
David M Hilbert
エム.ヒルバート デイビッド
Jonathan J Trevor
ジェイ.トレヴァー ジョナサン
Christopher D Culy
ディー.カリー クリストファー
Laurent Denoue
ドゥヌ ローラン
Gene Golovchinsky
ゴロブチンスキー ジーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2005182803A publication Critical patent/JP2005182803A/ja
Publication of JP2005182803A5 publication Critical patent/JP2005182803A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】 情報ダイジェストを生成する方法、システム及びプログラムを提供する。
【解決手段】 本発明の情報ダイジェストを生成する方法は、ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する。
【選択図】 図6

Description

本発明は既にアクセスした情報を処理することに関する。詳細には、本発明は情報ダイジェストを生成する方法、システム、及びプログラムに関する。
例えば、ウェブ・ページ、eメール・メッセージまたはドキュメントなどの既にアクセスした情報を検出することは、コンピュータを使用して行われている最も頻繁なアクションの一つである。例えば、最近の研究では、5回のウェブ・ページ閲覧の内、4回が既にアクセスした、例えば、既に見たウェブ・ページに対してであることが示唆されている。
特に、再閲覧サポートのために設計された数多くのツールがある。例えば、最近アクセスしたファイルの履歴をよく維持しているオペレーティング・システム及びコンピュータ・アプリケーションがある。別の例では、ウェブ・ブラウザ及びいくつかのファイル・マネージャは、ブックマークを生成、編成するための機能だけではなく、「戻る」ボタン、最近アクセスしたファイル、及びURLの履歴も介して再閲覧をサポートしている。さらに、ウェブ・ページにまつわる別の例は、検索ツールが再閲覧ツールとして頻繁に使用されることである。
多くの場合、既に見たコンテンツを検出することは難しく、時間がかかる。コンテンツを再閲覧することがこのように広く行われている一般的な活動であるという事実にも関わらず、既存の検索ツールは、既にアクセスした情報を再閲覧することではなく情報の検出に重点を置いている。
多くの場合、既に見たコンテンツに戻る理由は新しいドキュメントを生成するためである。例えば、最も関連性のあるリソースと数日間分の価値があるウェブに基づいた調査の主な発見事項を収集し、要約するダイジェストの生成が、他者と該発見事項を共有すること、レポートを生成すること、あるいはさらに後で参照するために密接に関連したリソースの集合を保存することなどの複数の理由から実行される場合がある。
一般的に使用される再閲覧手法には多くの欠点がある。例えば、ウェブ・ブラウザとファイル・マネージャで使用される戻るボタンは短期間のドキュメント・レビューをサポートするだけである。ナビゲーションは通常純粋に逐次的である。つまり、都合良く到達するのは最近閲覧したページとドキュメントだけである。加えて、あるページに戻り、別のパスを辿ると、通常、最初のパスから閲覧したページが削除され、戻るボタンを介して最近閲覧したすべてのページに達するのは不可能になる。
ファイル・アクセス及びURL履歴機能は戻るボタンより多くの柔軟性を与えるが、アクセスしたファイルとURLの長いリストをスキミングすることは効率的でも、便利でもない。さらに、ユーザはページ・タイトル、URLまたはファイル名を探している情報と関連付けることができなければならず、これは、ユーザが既に見た情報の出所を知らない場合、あるいはページ・タイトルが参考にならない場合には特に困難である。加えて、ファイル・アクセスまたはURL履歴は、通常アプリケーション単位で維持されている。例えば、ウェブ・ページにアクセスし、eメールを読み、ドキュメントを開くと、通常3つの別々の履歴が生じる。
ブックマークを使用することの主要な欠点は、ユーザはページに含まれている情報に将来ニーズが出てくる可能性があるかどうかを前もって評価しなければならないという点である。非常に多くのページをブックマークすることは、ブックマークの数と、それらを効率的に活用するために必要とされる編成と、がこのような大規模では難しくなるという理由からよい解決策ではない場合が多い。一般的にはブックマークの活用は、ユーザがそれらを生成、維持する際に費やす作業量に直接的に関係している。
多くの場合URL、ファイル名及びディレクトリを記憶することが困難であるために、既に見たコンテンツに戻るためには頻繁に検索ツールが再利用される。しかしながら、通常、検索ツール使用時に使用可能な特定の再閲覧サポートはない。例えば、既にアクセスしたウェブ・ページをリトリーブすることは、多くの場合、所望されるリンクが発見されるまで複数回照会を繰り返すことを必要とする。さらに、既にアクセスしたウェブ・ページがまだ存在しているという保証はない。
閲覧したコンテンツを活用し、自動的にダイジェスト、ブログまたは要約を生成することは今日入手可能なツールによって十分にサポートされていない。関連するリソースを収集し、ダイジェストまたはレポートを生成するプロセスは、将来のアクセスのために関連性のあるコンテンツをマーキングすること、ページを再閲覧すること、最も関連性のあるセクションを検出すこと、及び/又は最重要点を要約すること、次にすべての検出した情報を一箇所に収集するドキュメントをアセンブルすることから構成される大部分は手作業による活動である。これは非常に煩わしいプロセスである。既存のシステムまたはツールで既にアクセスしたコンテンツに基づいたものはない。それらは主に新しい情報を検出することに力を注いでいる。
例えば、非特許文献1〜3は、本願発明に関連する技術について記載している。
バレットら(Barrett et al.)、「ウェブ・パーソナル化法(How to Personalize the Web)」、計算機学会(ACM)、シカゴ、1997年、頁75〜82 バドジグら(Budzig et al.)、「コンテクストにおける情報アクセス( Information Access In Context)」、知識ベース・システム(Knowledge Based Systems)、 エルセヴィア・サイエンス(Elsevier Science)、2001年、14 (1-2)、頁37〜53 コックバーンら(Cockburn et al.)、「ウェブ・ページ再閲覧に関する改良:分析、設計、及び、評価(Improving WEB Page Revisitation : Analysis, Design and Evaluation)」、IT&ソサエティ(IT & Society)、2003年、3(1)、頁159〜183
本発明の課題は、コンテンツの再閲覧を容易にする情報ダイジェストを生成する方法、システム、及びプログラムを提供することである。
本発明は、ユーザが既にアクセスしたコンテンツを再閲覧するのを補助するために自動コンテンツ・インデックス生成技法及び自動コンテンツ・リトリーブ技法を使用する方法及びシステムを提供する。
本発明は、先行型照会生成機能と推奨機能に自動化されたコンテンツ・インデックス生成を統合し、既に見たコンテンツへの自動コンテクスト・アクセスを可能にする方法及びシステムを別に提供する。
本発明は、既にアクセスしたコンテンツに基づいて焦点(ポイントを絞った)ダイジェスト・ドキュメントを生成するために自動インデックス生成技法とリトリーブ技法を使用する方法及びシステムを別に提供する。
本発明は、既にアクセスしたコンテンツに基づいてダイジェストの中にドキュメントのコンテクストに特殊な要約を生成するために自動インデックス生成技法とリトリーブ技法を使用する方法及びシステムを別に提供する。
本発明は既に見た、あるいはアクセスしたリソースの完全に自動化されたリトリーブ及び要約に対処し、コンテクストに合焦したダイジェストの自動生成を可能にする方法及びシステムを別に提供する。
本発明は、例えば、ウェブ・ブラウザ、eメール・クライアントまたはワープロなどの一般的なアプリケーションを一般的に使用している間に、ユーザがインタラクトするすべてのコンテンツの全文インデックスを自動的に生成する方法及びシステムを別に提供する。
テキスト・ドキュメントに関する多様な例示的な実施形態においては、本発明によるシステム及び方法は現在表示されているテキストを、送信されてきたテキストを全文インデックスに追加するサーバに先行して送信する。テキスト・ドキュメントに関する多様な例示的な実施形態においては、本発明にかかるシステム及び方法が、例えば、現在表示されているウェブ・ページ、受信及び/又は表示、編集等されているeメール・メッセージなどの、ユーザの現在のコンテクストに密接に関係する、既にアクセスしたコンテンツを先行して決定する、または検出するために、生成されたインデックスを使用する。
本発明は、リトリーブされたドキュメントの集まりがコンテンツ再閲覧とダイジェスト生成の両方のために使用される方法及びシステムを別に提供する。
本発明の第1の態様の情報ダイジェストを生成する方法は、ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する。
本発明の第2の態様は、第1の態様の情報ダイジェストを生成する方法であって、前記コンテンツ情報の焦点要約を生成する、ことをさらに含む。
本発明の第3の態様は、第1の態様の情報ダイジェストを生成する方法であって、生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、ことをさらに含む。
本発明の第4の態様は、第1の態様の情報ダイジェストを生成する方法であって、前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む。
本発明の第5の態様は、第1の態様の情報ダイジェストを生成する方法であって、既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む。
本発明の第6の態様は、第5の態様の情報ダイジェストを生成する方法であって、情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む。
本発明の第7の態様は、第6の態様の情報ダイジェストを生成する方法であって、情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む。
本発明の第8の態様は、第7の態様の情報ダイジェストを生成する方法であって、媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む。
本発明の第9の態様は、第7の態様の情報ダイジェストを生成する方法であって、前記情報はテキスト情報であり、該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む。
本発明の第10の態様は、第9の態様の情報ダイジェストを生成する方法であって、情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む。
本発明の第11の態様は、第10の態様の情報ダイジェストを生成する方法であって、情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む。
本発明の第12の態様は、第11の態様の情報ダイジェストを生成する方法であって、さらに判断することは、逆インデックス技法を使用して実行される。
本発明の第13の態様は、第12の態様の情報ダイジェストを生成する方法であって、さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む。
本発明の第14の態様は、第12の態様の情報ダイジェストを生成する方法であって、情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む。
本発明の第15の態様は、第11の態様の情報ダイジェストを生成する方法であって、情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む。
本発明の第16の態様は、第1の態様の情報ダイジェストを生成する方法であって、関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である。
本発明の第17の態様は、第1の態様の情報ダイジェストを生成する方法であって、関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される。
本発明の第18の態様は、第1の態様の情報ダイジェストを生成する方法であって、関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される。
本発明の第19の態様は情報ダイジェストを生成するプログラムであって、ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する、ことを、プロセッサにより実行された場合に、該プロセッサに実施させる、情報ダイジェストを生成するプログラムである。
本発明の第20の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、前記コンテンツ情報の焦点要約を生成する、ことをさらに含む。
本発明の第21の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、ことをさらに含む。
本発明の第22の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む。
本発明の第23の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む。
本発明の第24の態様は、第23の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む。
本発明の第25の態様は、第24の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む。
本発明の第26の態様は、第25の態様の情報ダイジェストを生成するプログラムであって、媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む。
本発明の第27の態様は、第25の態様の情報ダイジェストを生成するプログラムであって、前記情報はテキスト情報であり、該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む。
本発明の第28の態様は、第27の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む。
本発明の第29の態様は、第28の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む。
本発明の第30の態様は、第29の態様の情報ダイジェストを生成するプログラムであって、さらに判断することは、逆インデックス技法を使用して実行される。
本発明の第31の態様は、第30の態様の情報ダイジェストを生成するプログラムであって、さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む。
本発明の第32の態様は、第30の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む。
本発明の第33の態様は、第29の態様の情報ダイジェストを生成するプログラムであって、情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む。
本発明の第34の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である。
本発明の第35の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される。
本発明の第36の態様は、第19の態様の情報ダイジェストを生成するプログラムであって、関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される。
本発明の第37の態様の情報ダイジェストを生成するシステムは、メモリと、制御装置と、を備え、前記制御装置は、ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する。
本発明の第38の態様は、第37の態様の情報ダイジェストを生成するシステムであって、前記コンテンツ情報の焦点要約を生成する、ことをさらに含む。
本発明の第38の態様は、第37の態様の情報ダイジェストを生成するシステムであって、生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、ことをさらに含む。
本発明の第39の態様は、第37の態様の情報ダイジェストを生成するシステムであって、前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む。
本発明の第40の態様は、第37の態様の情報ダイジェストを生成するシステムであって、既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む。
本発明の第42の態様は、第41の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む。
本発明の第43の態様は、第42の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む。
本発明の第44の態様は、第43の態様の情報ダイジェストを生成するシステムであって、媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む。
本発明の第45の態様は、第43の態様の情報ダイジェストを生成するシステムであって、前記情報はテキスト情報であり、該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む。
本発明の第46の態様は、第45の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む。
本発明の第47の態様は、第46の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む。
本発明の第48の態様は、第47の態様の情報ダイジェストを生成するシステムであって、さらに判断することは、逆インデックス技法を使用して実行される。
本発明の第49の態様は、第48の態様の情報ダイジェストを生成するシステムであって、さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む。
本発明の第50の態様は、第48の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む。
本発明の第51の態様は、第47の態様の情報ダイジェストを生成するシステムであって、情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む。
本発明の第52の態様は、第37の態様の情報ダイジェストを生成するシステムであって、関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である。
本発明の第53の態様は、第37の態様の情報ダイジェストを生成するシステムであって、関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される。
本発明の第54の態様は、第37の態様の情報ダイジェストを生成するシステムであって、関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される。
本発明の情報ダイジェストを生成する方法は、ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成するようにしているので、コンテンツの再閲覧を容易にすることができる。
本発明のシステム及び方法の多様な例示的な実施形態は、図を参照して以下に詳細に説明される。
図1は、本発明に従って既にアクセスしたコンテンツを再閲覧し、既にアクセスしたコンテンツに基づき焦点ダイジェスト・ドキュメントを生成するための方法及びシステムの実現の一つの例示的な実施形態のハイ・レベル概略表現である。
本発明によるシステム及び方法の多様な例示的な実施形態においては、コンテンツはテキスト、数字、記号、マーキング、メタ・データ等を含む。さらに本発明によるシステム及び方法の多様な例示的な実施形態においては、コンテンツは例えば、コンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、ウェブ・ページ等のドキュメントの一部である。さらに本発明によるシステム及び方法の多様な例示的な実施形態においては、コンテンツは、頁全体、一頁の中に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁ドキュメント、単一頁ドキュメントの集合体、複数頁ドキュメントの集合体等の中に含まれるか、あるいはそれ自体が頁全体、一頁の中に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁ドキュメント、単一頁ドキュメントの集合体、複数頁ドキュメントの集合体等である。
本発明によるシステム及び方法の多様な例示的な実施形態においては、システム10は、一人または複数人のユーザが既にアクセスしたコンテンツを再閲覧するのを補助するためにインデックス生成技法とリトリーブ技法を利用する。システム10はさらに既にアクセスしたコンテンツに基づいて焦点ダイジェスト・ドキュメントを生成するためにもインデックス生成技法とリトリーブ技法を利用する。本発明によるシステム及び方法の多様な例示的な実施形態においては、これらの機能は自動的に実行される。
図1に図示されるように、多様な例示的な実施形態においては、システム10は少なくとも2つのシステム・モジュールを利用する。これらの例示的な実施形態においては、第1のシステム・モジュールはクライアント・モジュール20である。クライアント・モジュール20は再閲覧及びダイジェスト生成のためのユーザ・インタフェースを提供する。第2のシステム・モジュールは、コンテンツ情報及び/又はコンテンツ・ドキュメントを記憶し、インデックス生成し、インデックス60に対して、及びインデックス60からリトリーブするサーバ・モジュール30である。多様な例示的な実施形態においては、インデックス60は全文インデックスである。
多様な例示的な実施形態においては、クライアント20は、例えば、ウェブ・ブラウザ、eメール・クライアント、プレゼンテーション・ソフトウェア、またはワープロ等のあらゆる一般的に使用されているアプリケーション50の中に埋め込まれている。例えば、図1に示されるように、多様な例示的な実施形態においては、グラフィック・ユーザ・インタフェース(GUI)環境において、クライアント・モジュール20は、ホスト・アプリケーション50のユーザ・インタフェース内に組み込まれるツールバー40として実現されている。代替の例示的な実施形態においては、クライアント・モジュール20は他の既知の、あるいは今後開発される方法または技法を使用して実現される。
多様な例示的な実施形態においては、クライアント・モジュール20及びサーバ・モジュール30は、スタンドアロン単一ユーザ・セットアップが所望されるときなど、例えば、単一デスクトップ・コンピュータなどの同じホスト情報処理装置にインストールされる。代わりに、多様な例示的な実施形態においては、クライアント・モジュール20とサーバ・モジュール30は、例えば、システム10が同じサーバ・システムから複数のユーザをサポートすることになる場合など別々のホスト情報処理装置にインストールされる。
多様な例示的な実施形態においては、複数のユーザが、ネットワーク環境を使用して、例えば、モバイル機器、複数のデスクトップ、パーソナル・デジタル・アシスタント・デバイス、移動計算装置及び通信装置などの複数の異なるシステムからサーバ・モジュール30に接続する。複数のユーザが複数の装置を介して同じサーバ・モジュール30にアクセスできるようにすることは、それによりユーザは使用される処理装置、アプリケーション及び/又は通信リンクの種類に関係なく同じコンテンツ履歴にアクセスできるため好適である。
多様な例示的な実施形態においては、クライアント・モジュール20は、一般的に使用されている生産性アプリケーション50を使用して生成された一つまたは複数のドキュメント52からテキスト21を抽出すること、該抽出したテキストをサーバ・モジュール30に先行して送信すること22、検出された密接に関連する既にアクセスしたコンテンツの存在をユーザに先行して通知すること23、検出された密接に関連する既にアクセスしたコンテンツに電子接続を提供すること24、検出され、アクセス及び/又はリトリーブされたユーザのコンテンツの明示的履歴25を提供すること、サーバ・モジュール30により生成されるダイジェストを特定するために使用されるダイジェスト生成構成要素を含むメニュー26を提供すること、及び類似する機能を含むが、それらに限られない、リストから選択される多様な機能を実行する。
多様な例示的な実施形態においては、サーバ・モジュール30はインデックス60に現在表示されているテキストを記憶し、インデックスを生成する。多様な例示的な実施形態においては、サーバ・モジュール30は、ユーザの現在のコンテクストに密接に関係する既にアクセスしたコンテンツを決定するためにインデックス60のリトリーブ、例えば、照会32を実行する。多様な例示的な実施形態においては、サーバ・モジュール30はユーザの特定に従ってドキュメント70のダイジェスト33を生成する。
図2は、本発明によるシステム及び方法に関連して使用するためのネットワーク環境200の一つの例示的な実施形態を概略して示す。図2に示されているように、コンテンツ再閲覧及びダイジェスト生成システムは、複数のユーザ5を有する環境で使用されるように構成されている。マルチ・ユーザ環境の多様な例示的な実施形態においては、ネットワーク環境200は、それぞれの単独のユーザ5がクライアント・モジュール20を含む情報処理装置210を有するように配置される。多様な例示的な実施形態においては、サーバ・モジュール30はサーバ・デバイスなどのスタンドアロン・情報処理装置220に含まれる。多様な代替の例示的な実施形態(不図示)においては、サーバ・モジュール30はユーザ5の情報処理装置210の一つに常駐する。多様な例示的な実施形態においては、ユーザ5のそれぞれは、一つまたは複数の通信リンク230を使用してネットワーク205上でコンテンツ再閲覧及びダイジェスト生成システムのサーバ・モジュール30に接続される。
多様な例示的な実施形態においては、ネットワーク205は、例えば、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、ストレージ・エリア・ネットワーク、イントラネット、エクストラネット、インターネット、または他の種類の分散型ネットワークを含むが、それらに限定されない。多様な例示的な実施形態においては、ネットワーク205は有線部分及び/又は無線部分を含む。多様な例示的な実施形態においては、リンク230は、公衆電話交換網上の接続、直接ケーブル接続、ワイド・エリア・ネットワーク、ローカル・エリア・ネットワークまたはストレージ・エリア・ネットワーク上の接続、イントラネットまたはエクストラネット上の接続、インターネット上の接続、あるいは他の分散処理ネットワークまたはシステム上の接続を含む、ネットワーク205に対して、例えば、クライアント・モジュール20とサーバ・モジュール30などのコンテンツ再閲覧及びダイジェスト生成システムの多様な構成要素を接続するための既知のあるいは今後開発される装置またはシステムである。一般的に、リンク230は例えば、クライアント・モジュール20及びサーバ・モジュール30などのコンテンツ再閲覧及びダイジェスト生成システムの多様な構成要素をネットワーク205に接続するために使用できる既知のまたは今後開発される接続システムまたは構造である場合がある。
図3は、本発明に従って既にアクセスしたコンテンツを再閲覧し、焦点ダイジェスト・ドキュメントを生成するためのシステム300の一つの例示的な実施形態の機能ブロック図である。システム300は外部データ接続370を含む。多様な例示的な実施形態では、データ接続370は、例えば、公衆電話交換網上の接続、直接ケーブル接続、ワイド・エリア・ネットワーク、ローカル・エリア・ネットワークまたはストレージ・エリア・ネットワーク上の接続、イントラネットまたはエクストラネット上の接続、インターネット上の接続、あるいは他の分散処理ネットワークまたはシステムを含む、ネットワーク250などの外部にシステム300を接続するための既知のまたは今後開発される装置またはシステムである。一般的には、データ接続370は、例えば、ネットワーク205などの外部に対してシステム300を接続するために使用できる既知のまたは今後開発される接続システムまたは構造である。
図3に示されるように、システム300はユーザに対して情報を表示するために使用可能な一または複数の表示装置340、及び一人または複数のユーザがシステム300にデータを入力できるようにするために使用できる一または複数のユーザ入力装置350を含む。該一または複数の表示装置340及び該一または複数の入力装置350は、それぞれ一または複数の通信リンク341及び351を介して、入出力インタフェース330を通じてシステム300に接続される。該一または複数の通信リンク341及び351は、通常、前記データ接続370と同様である。
多様な例示的な実施形態では、システム300は、制御装置320、メモリ310、テキスト抽出回路またはルーチン305、テキスト先行伝送回路またはルーチン315、既閲覧コンテンツ・アクセス回路またはルーチン325、明示履歴アクセス回路またはルーチン335、ダイジェスト特定回路またはルーチン345、コンテンツ持続及びインデックス生成回路またはルーチン355、照会生成回路またはルーチン365、再閲覧コンテンツ推奨回路またはルーチン375、並びにダイジェスト生成回路またはルーチン385の一つまたは複数を含み、そのすべては一つまたは複数のデータバス及び/又は制御バス及び/又はアプリケーション・プログラミング・インタフェース360上で相互接続されている。
多様な例示的な実施形態においては、制御装置320はシステム300の他の構成要素の動作を制御する。多様な例示的な実施形態においては、制御装置320は、必要に応じてシステム300の多様な構成要素間でのデータの流れも制御する。多様な例示的な実施形態においては、メモリ310はシステム300に入る、またはシステム300から出る情報を記憶する。多様な例示的な実施形態では、メモリ310は、システム300の機能を実現するあらゆる必要なプログラム及び/又はデータを記憶し、及び/又は多様な処理の段階で既にアクセスしたドキュメント・コンテンツ情報のインデックスなどのデータを記憶する。
様々な例示的な実施形態において、メモリ310は、可変な揮発性又は不揮発性メモリ、若しくは、不変、すなわち、固定メモリの任意な適切な組合せであってよい。様々な例示的な実施形態において、揮発性又は不揮発性の可変なメモリは、一又は複数のスタティック若しくはダイナミックRAM、フロッピィ・ディスク、及びフロッピィ・ディスク・ドライブ、書込可能若しくは書替可能光ディスク及び光ディスク・ドライブ、ハード・ディスク・ドライブ、フラッシュ・メモリなどであってよい。同様に、様々な実施形態において、不変、すなわち、固定メモリは、一又は複数のROM、PROM、EPROM、EEPROM、CD−ROM若しくはDVD−ROMディスクなどの光ROM、及び、光ROMのディスク・ドライブなどであってよい。
多様な例示的な実施形態においては、クライアント・モジュールは、一つまたは複数のアクセスしたドキュメントからテキストを抽出すること、該抽出したテキストをサーバ・モジュールに先行して送信すること、検出された密接に関係する既にアクセスしたコンテンツの存在をユーザに先行して通知すること、検出された密接に関連する既にアクセスしたコンテンツに電子接続を提供すること、検出され、アクセス及び/又はリトリーブされたユーザのコンテンツの明示的な履歴を提供すること、サーバ・モジュールによって生成されるダイジェストを特定するために使用されるダイジェスト生成構成要素を提供すること、及び他の類似した機能を含むが、それらに限定されない、リストから選択される多様な機能を実行する。
多様な例示的な実施形態においては、ユーザがドキュメントを開くなどのユーザ・アクションに応じて関連付けられた既にアクセスしたコンテンツ情報を判断するとき、クライアント・モジュール内のテキスト抽出回路またはルーチン305が、表示されているテキストを自動的に抽出する。多様な例示的な実施形態においては、クライアント・モジュールはホスト・アプリケーション内で実行する。これらの例示的な実施形態においては、クライアント・モジュールは現在表示されているドキュメントにアクセスできるため、追加の処理のために表示されているテキストを容易に抽出する。
多様な例示的な実施形態においては、テキスト抽出ステップに続き、クライアント・モジュール内のテキスト先行伝送回路またはルーチン315が、抽出されたテキストをサーバ・モジュールに、すなわち、サーバに先行して送信する。多様な例示的な実施形態においては、この伝送は、ユーザが、例えば、新しいドキュメントを開く、既存のドキュメントを開く、eメール・メッセージを見る、新しいURLにナビゲーションする等のドキュメントに対するアクションを実行すると必ず発生する。多様な追加の例示的な実施形態においては、ユーザが新しいドキュメントまたはeメール・メッセージを生成している間に、抽出されたテキストの周期的な伝送が発生する。追加の例示的な実施形態においては、抽出されたテキストの周期的な伝送は、ユーザが既存のドキュメント、eメール・メッセージまたは他のアプリケーション・ドキュメントを編集している間に発生する。
多様な例示的な実施形態においては、テキスト伝送の目的は二重である。第1に、それによりサーバ・モジュールは現在表示されているテキストにインデックスを付けることができる。第2に、それによりサーバ・モジュールは、ユーザの現在のコンテクストに密接に関係している既にアクセスしたコンテンツをリトリーブできる。多様な例示的な実施形態においては、コンテクストは、現在表示されているページ、前のn枚の表示頁、または例えば、時間、ロケーション、カレンダから抽出された約束等の他のコンテクスト情報により定義される。
多様な例示的な実施形態においては、サーバ・モジュールへのコンテンツ伝送の後、サーバ・モジュールは、サーバが、ユーザの現在のコンテクストに密接に関係している既にアクセスしたコンテンツを含むかどうかを判断する。このようなコンテンツが存在する場合は、サーバ・モジュールは、情報処理装置生成クライアントに、密接に関係する既にアクセスしたコンテンツについての情報を送り返す。多様な例示的な実施形態においては、送信された情報は、一致するテキスト・セグメントだけではなく、一致するリソースのファイル名またはURL、頁またはドキュメントのタイトル、アクセス日付も含む。サーバはすべての伝送の全文を記憶しているため、コンテンツの元のロケーションが変更したとしてもサーバが既にアクセスしたコンテンツをリトリーブできることが理解されなければならない。多様な例示的な実施形態において、任意の種類の密接に関係する既にアクセスしたコンテンツは処理され、クライアント・モジュールに、従ってユーザ情報処理装置に送り返される。
多様な例示的な実施形態においては、既に見たコンテンツに対するアクセスまたは既に見たコンテンツの表示は、既閲覧コンテンツ・アクセス回路またはルーチン325のアクセス/表示により提供される。多様な例示的な実施形態においては、クライアント・モジュールがユーザに検出された関係するコンテンツの存在を知らせるか、または通知する。多様な例示的な実施形態においては、ユーザは次に受信された情報を見ることを要求する。多様な例示的な実施形態においては、ユーザは一致するドキュメント、eメール・メッセージまたはウェブ・ページを開く。
多様な例示的な実施形態においては、既に見たコンテンツに対するアクセスは、クライアント・ツールバーの「履歴」ボタンを使用して実現される。多様な例示的な実施形態においては、履歴ボタンは、クライアント・モジュール(すなわち、ユーザ情報処理装置)が一致するリソースについての情報を受け取るとその外観を変更する。これらの例示的な実施形態においては、ユーザが履歴ボタンをクリックすると、一致するリソースに対するアクセスを提供するメニューが表示される。
多様な例示的な実施形態においては、ユーザは、サーバ・モジュールが例えば、密接に関連する既に見たコンテンツなどの一致するリソースをリトリーブするために実行する自動サーチを修正する。例えば、多様な例示的な実施形態においては、ユーザは特定の日付範囲を特定するか、あるいは遠隔的に関係する結果を含むために類似性閾値を変更する。
多様な例示的な実施形態においては、クライアント・モジュールによって実行される別の機能は、明示履歴アクセス回路またはルーチン335を通してユーザのコンテンツ履歴に対する明示的なアクセスのためのインタフェースを提供することである。多様な例示的な実施形態においては、ユーザは既にアクセスしたコンテンツの履歴を獲得するためにシステムの先行照会機能を使用する。代わりに、多様な例示的な実施形態においては、ユーザは既にアクセスしたコンテンツをリトリーブするためにマニュアル照会を利用する。他の多様な例示的な実施形態においては、クライアント・モジュールが、例えば、ウェブ・ページ、eメール、ドキュメント等などの最近アクセスしたリソースのリストに明示的なアクセスを提供する。
既にアクセスしたコンテンツを再閲覧することに加え、多様な例示的な実施形態においては、クライアント・モジュールは、サーバ・モジュールによって生成されるダイジェストを特定するために使用されるダイジェスト特定回路またはルーチン345を含む。ユーザは多くの異なる活動及びトピックに関係するコンテンツにアクセスする傾向があるため、多様な例示的な実施形態においては、このプロセスの一つの態様はダイジェストのトピックまたは焦点を特定することである。
多様な例示的な実施形態においては、再閲覧アプローチと同様に、トピックまたは焦点は、例えば、現在表示されているウェブ・ページ、調査報告またはeメール・メッセージなどの、ユーザの現在のコンテクストにより提供される。代わりに、多様な例示的な実施形態においては、ユーザは代表的なテキストを含むURLまたはファイルのリストを特定するか、あるいはダイジェストに焦点を合わせるためにテキスト照会を入力する。加えて、多様な例示的な実施形態においては、要約の所望される長さ、含まれるドキュメントの最大数、及び/又はドキュメントの日付範囲もしくはファイル・タイプについての情報が、トピックまたは焦点に含まれる。
多様な例示的な実施形態においては、特定がサーバ・モジュールに送信されると、サーバ・モジュールは、ダイジェストを生成するために、収集、要約及びドキュメントの構築を開始する。多様な例示的な実施形態においては、次に、サーバ・モジュールは、新規に生成されたドキュメントが表示される準備ができるとクライアント・モジュールに通知する。
自動コンテクスト関連のコンテンツ・リトリーブ及び/又は情報ダイジェスト生成に対処する他の機能は本発明の範囲内にある。当業者にとって周知であるこれらの機能は、多様な例示的な実施形態でクライアント・モジュールを使用して実現される。
多様な例示的な実施形態においては、サーバ・モジュールは、クライアント・モジュールから受け取る要求に基づいて、コンテンツを持続し(persist)、インデックスを付け、リトリーブする。加えて、多様な例示的な実施形態においては、サーバ・モジュールはユーザの特定に従ってダイジェスト・ドキュメントを生成する。
多様な例示的な実施形態においては、サーバ・モジュールは既に送信したドキュメントの全文を含むデータベースを維持するために、コンテンツ持続及びインデックス生成回路、またはルーチン355を使用する。多様な例示的な実施形態においては、これはさらに、例えば、パス及びURL情報、ファイル・タイプ、アクセス日付、アクセス頻度等などのメタ・データの一つまたは複数、などの情報を含む。加えて、多様な例示的な実施形態においては、サーバ・モジュールはすべての受け取られたコンテンツの全文インデックスを付加的に構築する。多様な例示的な実施形態においては、既にインデックスを付けたコンテンツをいつ削除するのかの基準が特定される。
多様な例示的な実施形態においては、照会生成回路またはルーチン365は、サーバ・モジュールが任意の長さのテキスト・フラグメントを一つの加重照会に変換できるようにするアルゴリズムを使用する。多様な例示的な実施形態においては、サーバ・モジュールは該加重照会を使用して、再閲覧サポートまたはダイジェスト生成のために関係するコンテンツをリトリーブする。
多様な例示的な実施形態においては、サーバ・モジュールは再閲覧サポートとダイジェスト生成サポートの両方のために既にインデックスを付けたリソースをリトリーブする。多様な例示的な実施形態においては、コンテンツがクライアントから送信されるとき、サーバ・モジュールは照会を生成し、それを全文テキストに対して実行し、関連性スコアをn個の最良の一致に割り当てる。多様な例示的な実施形態においては、特定された閾値tを上回る関連性スコアが付いた一致が、サーバ・モジュール内の再閲覧のためのコンテンツ推奨回路またはルーチン375によって処理される。次に、多様な例示的な実施形態においては、特定された閾値tを上回る関連性スコアの付いた一致は、ユーザに提示されるためにクライアント・モジュールに送り返される。
多様な例示的な実施形態においては、サーバ・モジュール内のダイジェスト生成回路またはルーチン385がダイジェスト生成要求を受け取ると、ダイジェスト生成回路またはルーチン385はユーザによって特定されるダイジェスト焦点に関係するドキュメントをリトリーブする。多様な例示的な実施形態においては、ユーザが、要約が含まれることを要求すると、システムは一致ドキュメントを要約する。ダイジェスト特定に応じて、多様な例示的な実施形態においては、システムは、例えば、URL、タイトル、アクセス日付等などの、例えば、一致するドキュメントを説明する情報を含むウェブ・ページなどのドキュメントを生成する。さらに、多様な例示的な実施形態においては、システムは、オプションの要約、及び例えば、一致するドキュメントからのすべての画像を含む、ユーザが要求した他の情報も提供する。一致するドキュメントからの画像が、ユーザのタスクによってはテキストよりさらに有効である場合があることが理解されなければならない。
多様な例示的な実施形態においては、コンテンツ情報は、例えば、テキスト、数字、記号、マーキング、メタ・データ等を含む。さらに、多様な例示的な実施形態においては、コンテンツは、例えば、コンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、ウェブ・ページ等のドキュメントの一部である。さらに、多様な例示的な実施形態においては、本発明のシステム及び方法が適用されるコンテンツは、例えば、頁全体、一頁に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁ドキュメント、単一頁ドキュメントの集合体、複数頁ドキュメントの集合体等の中に含まれるか、あるいはそれら全体である。
図4は、本発明に従って既にアクセスしたコンテンツ情報を再閲覧するための方法の一つの例示的な実施形態を概略するフローチャートである。図4に示されるように、本方法はステップS400で開始し、既にアクセスした関連コンテンツ情報が、情報を含むドキュメントに対して実行されるアクションに応えて判断されるステップS410に続行する。多様な例示的な実施形態においては、該アクションは、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及びドキュメントをブックマークするアクションの一つまたは複数を含む。多様な例示的な実施形態においては、例えば、ドキュメントにアクセスする、ドキュメントをレビューする、及び/又はドキュメントを編集するときに、ユーザがドキュメントに対して実行する他のドキュメント・アクションは、現在既知であるものと今後開発されるものを含み、本発明の範囲内にある。
多様な例示的な実施形態において、既にアクセスした関連コンテンツ情報は、アクセスされているドキュメントに含まれる情報に基づいて決定される。多様な例示的な実施形態においては、これは自動的に実行される。通常、決定された関連コンテンツ情報が、媒体記憶装置デバイスに記憶されている、既にアクセスしたコンテンツ情報ドキュメントのグループのサブ・パーツであることが理解される必要がある。しかしながら、必ずしもこれが当てはまらないことも理解される必要がある。
次にステップS420では、ユーザは判断された既にアクセスした任意の関連コンテンツ情報を通知される。多様な例示的な実施形態においては、通知は、ユーザに対して、判断された関連コンテンツ情報の可用性(アクセス可能か否か)を示す通知特性を少なくとも活性化する(オン状態にする)ことを含む。多様な例示的な実施形態においては、これは自動的に実行される。次に、動作は、本方法の動作が停止するステップS430に続行する。
図5は、ステップS410の一つの例示的な実施形態をさらに詳細に概略するフローチャートである。多様な例示的な実施形態においては、これはアクセスされているドキュメント内に含まれる情報のコンテクストに基づいて関連コンテンツ情報を決定するために使用される。図5に示されるように、ステップS410は、例えば、現在表示されているテキストまたはアクセスされているドキュメントのようなコンテンツがさらなる処理のために抽出されるサブ・ステップS4110で始まる。次に、ステップS4120で、抽出されたコンテンツがさらなる処理のためにサーバ・モジュールに送信される。
ステップS4130では、送信された抽出コンテンツが処理されるか、あるいはコンテンツ表現方式に変換される。テキストに関する多様な例示的な実施形態においては、サブ・ステップS4130が、テキスト・ドキュメントの類似性を評価するだけではなく、個々のワードの加重をサポートするテキスト表現に基づいた多様なアルゴリズムまたは技法を使用することによっても実行される。テキストに関する他の例示的な実施形態は、ステップS4130で他のアルゴリズムまたは技法を使用する。テキストに関する多様な例示的な実施形態においては、ベクトル空間モデルがテキスト表現方式として利用される。ベクトル空間モデルは情報リトリーブ・システムにおいて一般的に使用されるテキスト表現パラダイムである。しかしながら、多様な例示的な実施形態においては、現在既知であるか、今後開発される他のモデルがこの機能を実行するために使用される。多様な例示的な実施形態では、コンテンツはテキスト以外のコンテンツである。
ベクトル空間モデルにおいては、ドキュメントは、各ベクトル寸法がシステムの全体的な語彙の一つの用語に一致する用語重みのベクトルとして表現され、各用語は用語とドキュメントとの間の関連を定量化する。用語−重みは、頻繁にtf−idf用語加重方式、つまり用語−頻度/逆ドキュメント頻度に基づいている。この方式では、用語重みは用語がドキュメントの中に現れる回数(tf)、及びドキュメント集合体全体を通して該用語が現れる回数(df)に基づいて求められる。
多様な例示的な実施形態においては、df値を求めるために、本方法はすべての既にインデックスが付けられたコンテンツを使用する。代わりに、多様な例示的な実施形態においては、本方法は、ユーザドキュメントの集合をすべてのユーザと対比してユーザによってアクセスされるドキュメントに制限する。多様な他の例示的な実施形態においては、方法はリトリーブ日付範囲に基づいてドキュメントを制限する。
テキスト・ドキュメントを用語ベクトルに変換するために、多様な例示的な実施形態においては、本発明によるシステム及び方法は、例えば、htmlタグなどのすべてのフォーマット情報を削除し、次に結果として生じるテキストを個々の用語に分割する。
サブ・ステップS4140では、多様な例示的な実施形態において、既に見たコンテンツを再閲覧提案の集合の中に含めるのか、あるいはダイジェストの中に含めるのかを判断するために、本発明によるシステムがドキュメントの類似性を定量化する。多様な例示的な実施形態においては、ドキュメントが用語ベクトルに変換されると、別の用語ベクトルに対するその類似性はベクトルを正規化してから、点乗積を取ることによって決定される。結果として生じる類似性スコアは、一般的にはコサイン類似性基準として知られている。多様な例示的な実施形態においては、コサイン類似性基準が使用される。
コンピュータ処理の効率の理由から、例えば、現在表示されているドキュメントなどの一つのドキュメントと、サーバ内に常駐する他の既に見たすべてのドキュメントとの類似性を計算することは望ましくない場合がある。このようにして、多様な例示的な実施形態においては、すべての類似性値が使用されるわけではない。類似性評価の目標は、n個の最も類似したドキュメントを検出することであり、その結果それらは再閲覧提案として使用できるか、あるいはダイジェストに含むことができる。このようにして、多様な例示的な実施形態においては、n個の最も類似したドキュメントの集合が逆インデックスを使用して効率的に近似される。この近似は、オリジナルのドキュメントを、次にすべての既に見たドキュメントの逆インデックスに対して実行される短い照会に変換することによって達成される。これらの多様な例示的な実施形態においては、戻されたドキュメントは最終結果集合として処理されるか、あるいはさらに正確な結果のために正確な類似性を決定すべくオリジナル・ドキュメントと比較される。多様な例示的な実施形態においては、照会は、オリジナルのドキュメントをそのtf−idfベクトル表現に変換し、すべての用語をそれらのそれぞれの用語重みにより並べ替えてから、照会を上位n個の用語に制限することによって自動的に生成される。多様な例示的な実施形態においては、基調を成す検索エンジンが加重照会をサポートする場合、用語重みは個々の照会用語の重みとして使用される。
サブ・ステップS4150では、サーバにより受け取られるドキュメントが逆インデックスに追加される。これは、既に見たドキュメントの効率的なリトリーブを容易にし、リアル・タイム再閲覧提案を実現するために好適である。次に動作は、照会がアクセスされたドキュメントの特性に基づき生成されるサブ・ステップS4160に続行する。次に動作は、本方法の動作が図4のステップS420に戻るステップS4170に続行する。
図6は、本発明に従って既にアクセスしたコンテンツに基づき焦点ダイジェスト・ドキュメントを生成するための方法の一つの例示的な実施形態を概略するフローチャートである。図6に示されるように、本方法はステップS600で始まり、ユーザが情報を含むドキュメントに対してアクションを実行するステップS610に続行する。多様な例示的な実施形態においては、該アクションは、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及びドキュメントをブックマークするアクションの一つまたは複数を含む。多様な例示的な実施形態においては、例えば、ドキュメントにアクセスする、ドキュメントをレビューする、及び/又はドキュメントを編集するときにユーザがドキュメントで実行する他のドキュメント・アクションは、現在既知であるものと今後開発されるものを含み、本発明の範囲内にある。
次にステップS620では、既にアクセスした関連コンテンツのダイジェスト・ドキュメントが生成される。多様な例示的な実施形態においては、これは現在表示されているテキスト特性に基づく。多様な例示的な実施形態においては、ダイジェスト・ドキュメント生成は、ステップS410に関連して前述された、既にアクセスしたコンテンツ情報を再閲覧するために利用される技法に類似した技法を使用して実行される。多様な例示的な実施形態においては、例えば、ウェブ・ページ、eメール・メッセージまたは別の種類のドキュメントなどの、ユーザのコンテクストに類似しているすべての既に見たコンテンツが、例えば、サブ・ステップS4160及びその過去のサブ・ステップに関連して前述された手法を使用してリトリーブされる。次に、多様な例示的な実施形態においては、ウェブ・ページなどの新しいドキュメントは、ドキュメント・タイトル、オリジナル・ドキュメントまたはキャッシュに入れたテキストに対する参照、オプションの要約、及び、例えば、アクセス日付と画像などのダイジェストに含まれるようにユーザによって特定される他の情報を含んでコンパイルされる。
多様な例示的な実施形態においては、ステップS610は省略されてよく、本方法は、ステップS600から直接、既にアクセスした関連コンテンツのダイジェスト・ドキュメントが、ユーザによって定義されるダイジェスト特定に合わせて生成されるステップS620に続行してよい。
ステップS630では、ユーザは特定のリソースの包含または除外をインタラクティブに誘導するか、あるいは要約・パラメータを修正することにより生成されるドキュメントを繰り返して改善する。多様な例示的な実施形態においては、ステップS630が除外される。
多様な例示的な実施形態においては、ダイジェストのためのトピックまたは焦点の特定は、自動的に提供される。多様な例示的な実施形態においては、ダイジェストのためのトピックまたは焦点は、現在表示されているウェブ・ページ、調査報告またはeメール・メッセージなどの、ユーザの現在のコンテクストにより提供される。代わりに、多様な例示的な実施形態においては、ユーザは代表的なテキストを含むURLまたはファイルのリストを特定するか、ダイジェストに焦点を当てるためにテキスト照会を入力する。さらに、多様な例示的な実施形態においては、要約の所望の長さ、含むドキュメントの最大数、及び/又はドキュメントの日付範囲もしくはファイル・タイプについての情報が含まれる。
多様な例示的な実施形態においては、ダイジェスト生成構成要素は、現在既知の、または今後開発される技法によるドキュメントの自動的な要約にも対処する。
テキスト・コンテンツに関する多様な例示的な実施形態においては、自動要約は、それらの文の特性に基づき一つまたは複数のドキュメントから文を選択することにより開始する。多様な例示的な実施形態においては、文は直接的に要約に含まれる、及び/又は分析される、及び/又は再公式化される。多様な例示的な実施形態においては、要約は、その長さを調整することによって、または文の特性により多くのまたはより少ない重みを与えることによって様々な目的に合わせられる。また、多様な例示的な実施形態においては、一般的であるよりも、ある特定の主題または照会に向けられる要約も生成される。
ステップS640では、要約を含む生成されたダイジェストが次にユーザに提供される。次に動作は、本方法の動作が停止するステップS650に続行する。
本発明は、前記に概略された例示的な実施形態に関連して記載されている。多様な代替例、修正例、変形例及び/又は改良例は、既知であるのか、あるいは現在は予見されないかに関係なく本発明の精神及び範囲内にある。したがって、前記に述べられるような本発明の例示的な実施形態は、限定的ではなく例示的であることが意図される。多様な変更は、本発明の精神及び範囲から逸脱することなく加えられてよい。したがって、本発明はすべての既知の、または今後開発される代替例、修正例、変形例及び/又は改良例を包含することが意図される。
本発明に従って既にアクセスしたコンテンツを再閲覧し、焦点ダイジェスト・ドキュメントを生成する方法及びシステムの一つの例示的な実施形態のハイ・レベル概略表現である。 本発明による方法及びシステムと関連して使用するためのネットワーク環境の一つの例示的な実施形態を示す。 本発明に従って既にアクセスしたコンテンツを再閲覧し、焦点ダイジェスト・ドキュメントを生成するためのシステムの一つの例示的な実施形態の機能ブロック図である。 本発明に従って既にアクセスしたコンテンツ情報を再閲覧するための方法の一つの例示的な実施形態を概略するフローチャートである。 本発明による方法及びシステムと関連して使用するためのステップS410の一つの例示的な実施形態をさらに詳細に概略するフローチャートである。 本発明に従って既にアクセスしたコンテンツに基づき焦点ダイジェスト・ドキュメントを生成するための方法の一つの例示的な実施形態を概略するフローチャートである。
符号の説明
20 クライアント・モジュール
30 サーバ・モジュール
300 コンテンツ再閲覧及びダイジェスト生成システム
310 メモリ
320 制御装置

Claims (54)

  1. ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、
    関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する、
    情報ダイジェストを生成する方法。
  2. 前記コンテンツ情報の焦点要約を生成する、ことをさらに含む、請求項1に記載の情報ダイジェストを生成する方法。
  3. 生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、
    前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、
    ことをさらに含む、請求項1に記載の情報ダイジェストを生成する方法。
  4. 前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、
    前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む、
    請求項1に記載の情報ダイジェストを生成する方法。
  5. 既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む、請求項1に記載の情報ダイジェストを生成する方法。
  6. 情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む、請求項5に記載の情報ダイジェストを生成する方法。
  7. 情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む、請求項6に記載の情報ダイジェストを生成する方法。
  8. 媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む、請求項7に記載の情報ダイジェストを生成する方法。
  9. 前記情報はテキスト情報であり、
    該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む、
    請求項7に記載の情報ダイジェストを生成する方法。
  10. 情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む、請求項9に記載の情報ダイジェストを生成する方法。
  11. 情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む、請求項10に記載の情報ダイジェストを生成する方法。
  12. さらに判断することは、逆インデックス技法を使用して実行される、請求項11に記載の情報ダイジェストを生成する方法。
  13. さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む、請求項12に記載の情報ダイジェストを生成する方法。
  14. 情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む、請求項12に記載の情報ダイジェストを生成する方法。
  15. 情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む、請求項11に記載の情報ダイジェストを生成する方法。
  16. 関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である、請求項1に記載の情報ダイジェストを生成する方法。
  17. 関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される、請求項1に記載の情報ダイジェストを生成する方法。
  18. 関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される、請求項1に記載の情報ダイジェストを生成する方法。
  19. ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、
    関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する、
    ことを、プロセッサにより実行された場合に、該プロセッサに実施させる、情報ダイジェストを生成するプログラム。
  20. 前記コンテンツ情報の焦点要約を生成する、ことをさらに含む、請求項19に記載の情報ダイジェストを生成するプログラム。
  21. 生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、
    前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、
    ことをさらに含む、請求項19に記載の情報ダイジェストを生成するプログラム。
  22. 前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、
    前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む、
    請求項19に記載の情報ダイジェストを生成するプログラム。
  23. 既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む、請求項19に記載の情報ダイジェストを生成するプログラム。
  24. 情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む、請求項23に記載の情報ダイジェストを生成するプログラム。
  25. 情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む、請求項24に記載の情報ダイジェストを生成するプログラム。
  26. 媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む、請求項25に記載の情報ダイジェストを生成するプログラム。
  27. 前記情報はテキスト情報であり、
    該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む、
    請求項25に記載の情報ダイジェストを生成するプログラム。
  28. 情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む、請求項27に記載の情報ダイジェストを生成するプログラム。
  29. 情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む、請求項28に記載の情報ダイジェストを生成するプログラム。
  30. さらに判断することは、逆インデックス技法を使用して実行される、請求項29に記載の情報ダイジェストを生成するプログラム。
  31. さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む、請求項30に記載の情報ダイジェストを生成するプログラム。
  32. 情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む、請求項30に記載の情報ダイジェストを生成するプログラム。
  33. 情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む、請求項29に記載の情報ダイジェストを生成するプログラム。
  34. 関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である、請求項19に記載の情報ダイジェストを生成するプログラム。
  35. 関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される、請求項19に記載の情報ダイジェストを生成するプログラム。
  36. 関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される、請求項19に記載の情報ダイジェストを生成するプログラム。
  37. メモリと、
    制御装置と、
    を備え、
    前記制御装置は、
    ユーザによって定義されるダイジェストの特定に応じて、関連する既アクセスのコンテンツ情報を判断し、
    関連する前記既アクセスのコンテンツ情報のダイジェスト・ドキュメントを生成する、
    情報ダイジェストを生成するシステム。
  38. 前記コンテンツ情報の焦点要約を生成する、ことをさらに含む、請求項37に記載の情報ダイジェストを生成するシステム。
  39. 生成された前記ダイジェスト・ドキュメントに基づいて、新しいダイジェスト特定を繰り返し定義するための機能をユーザに提供し、
    前記新しいダイジェスト特定に基づいて、別のダイジェスト・ドキュメントを再生成する、
    ことをさらに含む、請求項37に記載の情報ダイジェストを生成するシステム。
  40. 前記ユーザによって定義されるダイジェストの特定は、コンテンツ情報を含むドキュメントになされるアクションを少なくとも含み、
    前記アクションは、少なくとも、ドキュメントをリトリーブするアクション、ドキュメントを開くアクション、ドキュメントを保存するアクション、ドキュメントをファイルするアクション、ドキュメントを編集するアクション、ドキュメントを削除するアクション、ドキュメントを転送するアクション、及び、ドキュメントをブックマークするアクション、の一以上を含む、
    請求項37に記載の情報ダイジェストを生成するシステム。
  41. 既アクセスのコンテンツ情報のグループに含まれるように、前記コンテンツ情報を処理する、ことをさらに含む、請求項37に記載の情報ダイジェストを生成するシステム。
  42. 情報を処理することは、前記ドキュメントから前記情報を抽出する、ことを含む、請求項41に記載の情報ダイジェストを生成するシステム。
  43. 情報を処理することは、抽出した前記情報を媒体記憶装置に出力する、ことをさらに含む、請求項42に記載の情報ダイジェストを生成するシステム。
  44. 媒体記憶装置に抽出した情報を出力することは、媒体記憶装置に抽出した情報を周期的に出力することを含む、請求項43に記載の情報ダイジェストを生成するシステム。
  45. 前記情報はテキスト情報であり、
    該情報を処理することは、抽出した情報をテキスト表現方式に変換する、ことをさらに含む、
    請求項43に記載の情報ダイジェストを生成するシステム。
  46. 情報を処理することは、変換した情報と既アクセス・コンテンツとの類似性を定量化する類似性スコアを少なくとも判断する、ことをさらに含む、請求項45に記載の情報ダイジェストを生成するシステム。
  47. 情報を処理することは、既アクセスのコンテンツ情報及び変換した情報のグループから、類似性閾値を上回る類似性スコアを有するコンテンツ情報の集合をさらに判断する、ことをさらに含む、請求項46に記載の情報ダイジェストを生成するシステム。
  48. さらに判断することは、逆インデックス技法を使用して実行される、請求項47に記載の情報ダイジェストを生成するシステム。
  49. さらに判断することは、変換した情報に基づいて、照会を作成する、ことを含む、請求項48に記載の情報ダイジェストを生成するシステム。
  50. 情報を処理することは、既アクセスのコンテンツ情報を含むグループ若しくは逆インデックスに、変換した情報を追加する、ことをさらに含む、請求項48に記載の情報ダイジェストを生成するシステム。
  51. 情報を処理することは、少なくとも類似性スコアに基づいて、コンテンツ情報の順位を判断する、ことをさらに含む、請求項47に記載の情報ダイジェストを生成するシステム。
  52. 関連するコンテンツ情報は、少なくともコンピュータ・アプリケーション・ドキュメント、テキスト・メッセージ、eメール・メッセージ、カレンダ・エントリ、または、ウェブ・ページの一部である、請求項37に記載の情報ダイジェストを生成するシステム。
  53. 関連するコンテンツ情報は、少なくとも頁全体、一頁内に含まれる個々のテキスト文字、ワード、句、テキスト行、文、段落、テキストの段、テキストのブロック、テキスト記事、複数頁文書、単一頁文書の集合、及び、複数頁文書の集合、を含むリストから選択される、請求項37に記載の情報ダイジェストを生成するシステム。
  54. 関連する既アクセス・コンテンツは、既アクセス・コンテンツのグループにコンテンツを含ませるコンピュータ・アプリケーションのタイプに関係なく判断される、請求項37に記載の情報ダイジェストを生成するシステム。
JP2004362223A 2003-12-19 2004-12-15 情報ダイジェストを生成する方法、システム、及びプログラム Pending JP2005182803A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/739,180 US20050138067A1 (en) 2003-12-19 2003-12-19 Indexing for contexual revisitation and digest generation

Publications (2)

Publication Number Publication Date
JP2005182803A true JP2005182803A (ja) 2005-07-07
JP2005182803A5 JP2005182803A5 (ja) 2007-12-27

Family

ID=34677533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004362223A Pending JP2005182803A (ja) 2003-12-19 2004-12-15 情報ダイジェストを生成する方法、システム、及びプログラム

Country Status (2)

Country Link
US (1) US20050138067A1 (ja)
JP (1) JP2005182803A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206697A (ja) * 2006-02-01 2007-08-16 Ricoh Co Ltd 画像を表示する方法
US8037403B2 (en) 2006-01-13 2011-10-11 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for extracting structured document
KR20160064040A (ko) * 2014-10-31 2016-06-07 시아오미 아이엔씨. 정보를 선택하는 방법 및 디바이스

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7389265B2 (en) * 2001-01-30 2008-06-17 Goldman Sachs & Co. Systems and methods for automated political risk management
US20040143446A1 (en) * 2001-03-20 2004-07-22 David Lawrence Long term care risk management clearinghouse
US8121937B2 (en) 2001-03-20 2012-02-21 Goldman Sachs & Co. Gaming industry risk management clearinghouse
US7958027B2 (en) * 2001-03-20 2011-06-07 Goldman, Sachs & Co. Systems and methods for managing risk associated with a geo-political area
US20040255301A1 (en) * 2003-06-13 2004-12-16 Andrzej Turski Context association schema for computer system architecture
US20050028168A1 (en) * 2003-06-26 2005-02-03 Cezary Marcjan Sharing computer objects with associations
US8510300B2 (en) * 2004-07-02 2013-08-13 Goldman, Sachs & Co. Systems and methods for managing information associated with legal, compliance and regulatory risk
US8762191B2 (en) 2004-07-02 2014-06-24 Goldman, Sachs & Co. Systems, methods, apparatus, and schema for storing, managing and retrieving information
US8996481B2 (en) 2004-07-02 2015-03-31 Goldman, Sach & Co. Method, system, apparatus, program code and means for identifying and extracting information
US8442953B2 (en) * 2004-07-02 2013-05-14 Goldman, Sachs & Co. Method, system, apparatus, program code and means for determining a redundancy of information
US7421421B2 (en) * 2004-08-04 2008-09-02 International Business Machines Corporation Method for providing multi-variable dynamic search results visualizations
US7493303B2 (en) * 2004-08-04 2009-02-17 International Business Machines Corporation Method for remotely searching a local user index
US7831601B2 (en) * 2004-08-04 2010-11-09 International Business Machines Corporation Method for automatically searching for documents related to calendar and email entries
US7395260B2 (en) * 2004-08-04 2008-07-01 International Business Machines Corporation Method for providing graphical representations of search results in multiple related histograms
US7634461B2 (en) * 2004-08-04 2009-12-15 International Business Machines Corporation System and method for enhancing keyword relevance by user's interest on the search result documents
US20060031199A1 (en) * 2004-08-04 2006-02-09 Newbold David L System and method for providing a result set visualizations of chronological document usage
US8261196B2 (en) * 2004-08-04 2012-09-04 International Business Machines Corporation Method for displaying usage metrics as part of search results
US7496563B2 (en) * 2004-08-04 2009-02-24 International Business Machines Corporation Method for locating documents a user has previously accessed
US20060136391A1 (en) * 2004-12-21 2006-06-22 Morris Robert P System and method for generating a search index and executing a context-sensitive search
US7725485B1 (en) * 2005-08-01 2010-05-25 Google Inc. Generating query suggestions using contextual information
US7814116B2 (en) * 2006-03-16 2010-10-12 Hauser Eduardo A Method and system for creating customized news digests
US7822752B2 (en) * 2007-05-18 2010-10-26 Microsoft Corporation Efficient retrieval algorithm by query term discrimination
EP2120167A1 (en) * 2008-05-12 2009-11-18 Research In Motion Limited System and method for automatically drafting a blog entry
US8775945B2 (en) 2009-09-04 2014-07-08 Yahoo! Inc. Synchronization of advertisment display updates with user revisitation rates
US10642912B2 (en) * 2016-08-17 2020-05-05 Adobe Inc. Control of document similarity determinations by respective nodes of a plurality of computing devices

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011458A (ja) * 1996-06-25 1998-01-16 Hitachi Ltd 情報検索装置
JP2003271657A (ja) * 2002-03-15 2003-09-26 Fuji Photo Film Co Ltd 画像データベース装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3597697B2 (ja) * 1998-03-20 2004-12-08 富士通株式会社 文書要約装置およびその方法
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US7458014B1 (en) * 1999-12-07 2008-11-25 Microsoft Corporation Computer user interface architecture wherein both content and user interface are composed of documents with links
US7062475B1 (en) * 2000-05-30 2006-06-13 Alberti Anemometer Llc Personalized multi-service computer environment
US7813915B2 (en) * 2000-09-25 2010-10-12 Fujitsu Limited Apparatus for reading a plurality of documents and a method thereof
US20050138049A1 (en) * 2003-12-22 2005-06-23 Greg Linden Method for personalized news

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011458A (ja) * 1996-06-25 1998-01-16 Hitachi Ltd 情報検索装置
JP2003271657A (ja) * 2002-03-15 2003-09-26 Fuji Photo Film Co Ltd 画像データベース装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8037403B2 (en) 2006-01-13 2011-10-11 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for extracting structured document
JP2007206697A (ja) * 2006-02-01 2007-08-16 Ricoh Co Ltd 画像を表示する方法
KR20160064040A (ko) * 2014-10-31 2016-06-07 시아오미 아이엔씨. 정보를 선택하는 방법 및 디바이스
KR101709427B1 (ko) * 2014-10-31 2017-02-22 시아오미 아이엔씨. 정보를 선택하는 방법 및 디바이스

Also Published As

Publication number Publication date
US20050138067A1 (en) 2005-06-23

Similar Documents

Publication Publication Date Title
JP2005182804A (ja) コンテンツ情報を処理する方法、システム、及びプログラム
JP2005182803A (ja) 情報ダイジェストを生成する方法、システム、及びプログラム
US8086604B2 (en) Universal interface for retrieval of information in a computer system
US7783644B1 (en) Query-independent entity importance in books
US8812945B2 (en) Method of dynamically creating real time presentations responsive to search expression
US20010020238A1 (en) Document searching apparatus, method thereof, and record medium thereof
US20100262610A1 (en) Identifying Subject Matter Experts
US11222053B2 (en) Searching multilingual documents based on document structure extraction
US20130041885A1 (en) Multi-step image search system with selected search text augmentation
US20080071739A1 (en) Using anchor text to provide context
US20100191740A1 (en) System and method for ranking web searches with quantified semantic features
EP1962208A2 (en) System and method for searching annotated document collections
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
JP4283466B2 (ja) リンク関係に基づく文書整理方法
JP2003067419A (ja) 情報検索方法および情報検索システム
US20210073303A1 (en) Systems and methods to facilitate text content search
CN1127031C (zh) 以电子方式创建个性化文档的系统和方法
US20080208803A1 (en) System and method for characterising a web page
JP2003271609A (ja) 情報監視装置及び情報監視方法
Kerremans et al. Using data-mining to identify and study patterns in lexical innovation on the web: The NeoCrawler
JP4610543B2 (ja) 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体
US20100211562A1 (en) Multi-part record searches
EP1962202A2 (en) System and method for annotating documents
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2021064143A (ja) 文作成装置、文作成方法および文作成プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100813

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102