JP2007157132A - 文書ベースの情報およびユニフォーム・リソース・ロケータ(url)の管理方法およびプログラム - Google Patents

文書ベースの情報およびユニフォーム・リソース・ロケータ(url)の管理方法およびプログラム Download PDF

Info

Publication number
JP2007157132A
JP2007157132A JP2006312273A JP2006312273A JP2007157132A JP 2007157132 A JP2007157132 A JP 2007157132A JP 2006312273 A JP2006312273 A JP 2006312273A JP 2006312273 A JP2006312273 A JP 2006312273A JP 2007157132 A JP2007157132 A JP 2007157132A
Authority
JP
Japan
Prior art keywords
document
link
source document
entry
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006312273A
Other languages
English (en)
Other versions
JP5186099B2 (ja
Inventor
Brian P Wallenfelt
ブライアン・ポール・ウォレンフェルト
Zachary Adam Garbow
ザチャリー・アダム・ガルボウ
Richard M Theis
リチャード・マイケル・ティーズ
Pressler Clark Timothy
ティモシー・プレスラー・クラーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007157132A publication Critical patent/JP2007157132A/ja
Application granted granted Critical
Publication of JP5186099B2 publication Critical patent/JP5186099B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】1つ以上のリンクを有する文書内の履歴データをユーザが動的に管理できるようにし、リンクによって規定された関係を保持できるようにする。
【解決手段】ソース文書から宛先文書だけでなく、宛先文書からソース文書へ戻るリンクも追跡し、リンクの内容/名前付けに基づいて、階層的にリンクを編成し、リンク情報をユーザに対してリアルタイムかつ有意味なやり方で表示する。
【選択図】図1

Description

本発明は、一般的に、文書管理に関し、より具体的には、履歴文書間のリンクを追跡および編成することに関する。
1948年のエドバック(EDVAC)の開発は、コンピュータ時代の幕開けとしてしばしば引用される。そのとき以来、コンピュータ・システムは、非常に高性能な装置へと発展し、コンピュータ・システムは、数多くの互いに異なる設定がなされることがある。コンピュータ・システムは、典型的には、半導体および回路基板などのハードウェアと、コンピュータ・プログラムとしても知られるソフトウェアとの組み合わせを含む。
日々、コンピュータ・ユーザは、多数の電子メール・メッセージ、個人のパーソナル・コンピュータおよびサーバ上の数千のファイル、および数十億のウェブページからの情報を管理および検索するという面倒な作業に直面している。多数のソースからのこの無数の情報を管理することは、困難かつ時間のかかる作業である。
今日の我々の仕事は互いに係わり合いがあるという性質があるので、これらの情報ソースの多くは、互いに関連しており、かつリンクを介して他の参照物にも関連している。そのようなリンクの主要な例の一つは、ユニフォーム・リソース・ロケータ(URL)である。URLは、文書のグローバル・アドレスおよびワールド・ワイド・ウェブの他のリソースを提供する。アドレスの最初の部分は、どのプロトコルを使用するかを示し、第2の部分は、リソースがあるIPアドレスまたはドメイン名を指定する。よって、URLは、ソース文書と宛先文書との間の重要な関係を示す。
現在、これらの関係を管理する唯一の方法は、グーグル(登録商標)社のデスクトップ・サーチ(Desktop Search)またはグーグル社のページランク(Pagerank)などの検索アルゴリズム/製品を介することである。しかしながら、そのような解決策には、1つ以上のキーワードを入力後にファイルをつきとめる助けとなるだけであるという点で、重大な欠陥がある。そのようなツールから結果を受信する場合、どの文書がどのリンク(URL)を含むのかを追跡するのが困難なままである。加えて、どこが各リンク(URL)を参照したのかを覚えておくこと、および、その関連文書を探すことは難しい。すべてのリンク(URL)を適切な提示形式で手動で編成および保存するのは、現在ほとんど不可能である。
ユーザが1つ以上のリンクを持つ文書内および文書間で履歴データを動的に管理し、リンクによって規定される関係を保持する助けとなる、よりよい手法に対する必要性がある。その手法は、単にソース文書から宛先文書へのリンクだけでなく、宛先文書からソース文書へ戻るリンクをも追跡し、リンクの内容/名前付けに基づいて階層的にリンクを編成し、リンク情報をユーザに対してリアルタイムかつ有意義なやり方で表示する必要がある。
本発明は、1つ以上のリンクを持つ文書内および文書間の履歴データを管理し、リンクによって規定される関係を保持するための方法、装置、およびプログラムを提供する。本発明は、単にソース文書から宛先文書へのこの情報だけでなく、宛先文書からソース文書へ戻る情報も追跡する。
より具体的には、本発明は、複数の文書内のリンクを管理するための方法を提供する。本方法は、複数の文書から選ばれたソース文書を開くことによって開始し、ソース文書をスキャンして文書リンクを見つけ、見つかった各文書リンクについて、ソース文書の名前と文書リンクとを示すリンク・データベースにエントリを加える。一実施形態において、本方法は、その後、いずれかの妥当なキーワードを見つけるために文書リンクによってポイントされた文書をスキャンし、いずれかのものが見つかると、妥当なキーワードをキーワード・エントリを介してリンク・データベースに含める。キーワード・エントリは、キーワード自体と、ソース文書名と、妥当なキーワードを含む文書の文書リンクとを含む。一実施形態において、本発明は、その後、妥当なキーワードについてソース文書を解析し、ソース文書から解析された妥当なキーワードがリンク・データベース内のキーワード・エントリに存在しているか検索して、ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストを作成する。ユーザには、その後、ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストが(例えば、一時ブックマーク・フォルダまたは分割画面を介して)提示される。
他の実施形態において、本発明は、現在のソース文書がリンク・データベース内の文書リンク・エントリに存在しているか検索し、その後、見つかった各エントリ毎に逆方向参照のリンクを作成し、その後、当該リンクは、(例えば、一時ブックマーク・フォルダまたは分割画面を介して)ユーザに提示される。
本発明によって使用されるソース文書は、数多くの形式を取ってもよく、当該形式には、ワード・プロセッサ文書、ポータブル・デスクトップ・フォーマット(PDF)ファイル、電子メール、ウェブサイト、インスタント・メッセージ、および電子メモが含まれるが、これらに限定されるものではない。
本発明は、また、ソース文書の構造に基づいて、階層的にソース文書内の文書リンクを編成してもよい。一実施形態において、本発明は、ベース・ブックマーク・フォルダを作成することによってこれを達成し、文書リンクの論理的なグループ化を決定するためにソース文書の構造を分析し、文書リンクの論理的なグループ化に基づいてリンク・サブカテゴリを作成し、ソース文書およびリンク内容とを解析して妥当なキーワードを見つけ、リンク・サブカテゴリに基づいてベース・ブックマーク・フォルダに対するブックマーク・サブフォルダを作成し、各ブックマーク・サブフォルダの名前は、妥当なキーワードに基づいている。
本発明の様々な実施形態を添付の図面と共に以下に説明する。
しかしながら、添付の図面は、本発明の一実施形態例を示すに過ぎず、従って、本発明の範囲を限定するとはみなされない。なぜならば、本発明は、同様に効果的な他の実施形態を許容してもよいからである。
各図面を通じて、同様の番号は同様の部分を示す。図面を参照して、図1は、本発明に係る、ネットワーク130を介してクライアント132に接続されたコンピュータ・システム100の高レベルのブロック図を示す。コンピュータ・システム100の主要な構成要素には、1つ以上のプロセッサ101と、メイン・メモリ102と、端末インターフェース111と、記憶装置インターフェース112と、I/O(入力/出力)装置インターフェース113と、通信/ネットワーク・インターフェース114とが含まれ、これらすべては、構成要素間通信のために、メモリ・バス103と、I/Oバス104と、I/Oバス・インターフェース105とを介して結合されている。
コンピュータ・システム100は、1つ以上のプログラム可能な中央処理装置(CPU)101A,101B,101C,および101Dとを含み、これらはプロセッサ101と総称される。一実施形態において、コンピュータ・システム100は、比較的大きなシステムに典型的な複数のプロセッサを含むが、他の実施形態においては、代わりに、コンピュータ・システム100は、単一のCPUシステムであってもよい。各プロセッサ101は、メイン・メモリ102に記憶された命令を実行し、1つ以上のレベルのオン・チップ・キャッシュを含んでもよい。
メイン・メモリ102は、データおよびプログラムを記憶するためのメモリである。メイン・メモリ102は、概念上は単一のモノリシックなエンティティであるが、他の実施形態においては、メイン・メモリ102は、キャッシュおよび他のメモリ装置の階層などの、より複雑な仕組みである。例えば、メモリは、複数のレベルのキャッシュ内に存在してもよく、これらのキャッシュは、機能によってさらに分割されてもよく、あるキャッシュは、命令を保持し、他のキャッシュは、単一または複数のプロセッサによって使用される、命令でないデータを保持するようにしてもよい。メモリは、非一様メモリ・アクセス(NUMA)コンピュータ・アーキテクチャと称されるさまざまなもののうちの任意のものにおいて知られるように、互いに異なるCPUまたはCPUのセットにさらに分散および関連付けられてもよい。
メモリ102は、リンク・マネージャ150と、リンク・データベース152と、ユーザ・インターフェース・ページ154とを含む。リンク・マネージャ150、リンク・データベース152、およびユーザ・インターフェース・ページ154は、コンピュータ・システム100におけるメモリ102内に含まれているように図示されているが、それらのうちのいくつかまたはすべてが、互いに異なるコンピュータ・システム(例えば、クライアント132)上にあってもよく、例えばネットワーク130を介してリモートにアクセスされてもよい。コンピュータ・システム100は、コンピュータ・システム100のプログラムが、複数のより小さな記憶装置エンティティに対するアクセスに代えて、大きな単一の記憶装置エンティティに対してアクセスできるのみであるように振舞うことができるようにする、仮想アドレス指定機構を使用してもよい。よって、リンク・マネージャ150、リンク・データベース152、およびユーザ・インターフェース・ページ154は、メイン・メモリ102内に含まれているように図示されているが、これらの要素は、必ずしも同一の記憶装置に同時にすべてが完全に含まれるわけではない。
一実施形態において、リンク・マネージャ150は、プロセッサ101に対して実行できる命令、またはプロセッサ101に対して実行されて、図2から8までを参照して以下にさらに説明するような機能を実行するためにプロセッサ101に対して実行する命令によって解釈されることが可能なステートメントを含む。他の実施形態において、リンク・マネージャ150は、マイクロコードで実施されてもよい。他の実施形態において、リンク・マネージャ150は、ハードウェアにおいて、論理ゲートまたは他の適切なハードウェア手法を介して実施されてもよい。
メモリ・バス103は、プロセッサ101と、メイン・メモリ102と、I/Oバス・インターフェース105との間でデータを転送するためのデータ通信路を提供する。I/Oバス・インターフェース105は、様々なI/Oユニットから、およびそれらへデータを転送するために、システムI/Oバス104にさらに接続される。I/Oバス・インターフェース105は、システムI/Oバス104を介して、I/Oプロセッサ(IOP)またはI/Oアダプタ(IOA)としても知られる複数のI/Oインターフェース111,112,113,および114と通信を行う。システムI/Oバス104は、例えば、業界標準のPCIバス、または任意の他の適切なバス技術であってもよい。
I/Oインターフェースは、様々な記憶装置およびI/O装置との通信をサポートする。例えば、端末インターフェース111は、1つ以上のユーザ端末121,122,123,および124の装着をサポートする。記憶装置インターフェース112は、1つ以上の直接アクセス記憶装置(DASD)125,126,および127(典型的には、磁気ディスク・ドライブ記憶装置であるが、ホストに対して単一の大記憶装置のように見えるように構成されるディスク・ドライブのアレイをはじめとする他の装置であってもよい)の装着をサポートする。メイン・メモリ102の内容は、直接アクセス記憶装置125,126,および127へ記憶、およびそれらから取り出されてもよい。
I/Oおよび他の装置インターフェース113は、様々な他の入力/出力装置または他の種類の装置のいずれかとのインターフェースを提供する。2つのそのような装置であるプリンタ128およびファックス機129が図1の実施形態例では示されているが、他の実施形態においては、数多くの他のそのような装置が存在してよく、それらは互いに種類が異なっていてもよい。ネットワーク・インターフェース114は、コンピュータ・システム100から他のデジタル装置およびコンピュータ・システムへの1つ以上の通信路を提供し、そのような経路には、例えば、1つ以上のネットワーク130が含まれてもよい。
メモリ・バス103は、プロセッサ101と、メイン・メモリ102と、I/Oバス・インターフェース105との間の直接通信路を提供する比較的単純で単一のバス構造として図1に示されているが、実際には、メモリ・バス103は、複数の互いに異なるバスまたは通信路を備えてもよく、これらは、階層的、星型、またはウェブ構造の2地点間リンク、複数の階層バス、並列冗長路などのような、任意の様々な形式で配列されてもよい。さらに、I/Oバス・インターフェース105およびI/Oバス104は、単一の個々のユニットとして示されているが、コンピュータ・システム100は、実際は、複数のI/Oバス・インターフェース105または複数のI/Oバス104あるいはその両方を含んでもよい。様々なI/O装置へ向かう様々な通信路からシステムI/Oバス104を分離する複数のI/Oインターフェースが示されているが、他の実施形態においては、I/O装置のうちのいくつかまたはすべてが、1つ以上のシステムI/Oバスに直接接続されている。
図1に示すコンピュータ・システム100は、装着された複数の端末121,122,123,および124を有し、マルチユーザの「メインフレーム」コンピュータ・システムの典型のようであってもよい。典型的には、そのような場合、装着された装置の実際の数は、図1に示すよりも大きいが、本発明は、任意の特定のサイズのシステムに限定されない。代わりに、コンピュータ・システム100は、典型的には単一ユーザ・ディスプレイおよびキーボード入力のみを含む単一ユーザのシステムであってもよく、直接のユーザ・インターフェースはほとんどまたは全くないが他のコンピュータ・システム(クライアント)からの要求は受信するサーバまたは同様の装置であってもよい。他の実施形態において、コンピュータ・システム100は、パーソナル・コンピュータ、ポータブル・コンピュータ、ラップトップまたはノート型コンピュータ、PDA(携帯情報端末)、テーブル・コンピュータ、ポケット・コンピュータ、電話、ページャ、自動車、通信会議システム、アプライアンス、または任意の他の適切な種類の電子機器として実施されてもよい。
ネットワーク130は、任意の適切なネットワークまたはネットワークの組み合わせであってもよく、コンピュータ・システム100へ、またはそこからのデータまたはコードあるいはその両方の通信に適した任意の適切なプロトコルをサポートしてもよい。様々な実施形態において、ネットワーク130は、コンピュータ・システム100に直接または間接接続される記憶装置または記憶装置の組み合わせを表わしてもよい。一実施形態において、ネットワーク130は、インフィニバンドをサポートしてもよい。他の実施形態において、ネットワーク130は、無線通信をサポートしてもよい。他の実施形態において、ネットワーク130は、電話線またはケーブルのような配線通信をサポートしてもよい。他の実施形態において、ネットワーク130は、イーサネットIEEE(米国電子電気学会)802.3x仕様をサポートしてもよい。他の実施形態において、ネットワーク130は、インターネットであってもよく、IP(インターネット・プロトコル)をサポートしてもよい。他の実施形態において、ネットワーク130は、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)であってもよい。他の実施形態において、ネットワーク130は、ホットスポット・サービス・プロバイダ・ネットワークであってもよい。他の実施形態において、ネットワーク130は、イントラネットであってもよい。他の実施形態において、ネットワーク130は、GPRS(汎用パケット無線システム)ネットワークであってもよい。他の実施形態において、ネットワーク130は、FRS(家族の無線サービス)ネットワークであってもよい。他の実施形態において、ネットワーク130は、任意の適切なセルラー・データ・ネットワークまたはセル・ベースの無線ネットワーク技術であってもよい。他の実施形態において、ネットワーク130は、IEEE802.11B無線ネットワークであってもよい。さらに他の実施形態において、ネットワーク130は、任意の適切なネットワークまたはネットワークの組み合わせであってもよい。1つのネットワーク130が示されているが、他の実施形態においては、任意の数(0を含む)の(同一または互いに異なる種類の)ネットワークがあってもよい。
クライアント132は、ブラウザ134を含む。ブラウザ134は、ユーザ・インターフェース・ページ154をダウンロードし、ユーザ・インターフェース・ページ154内の制御タグおよびを解釈し、ユーザ・インターフェース・ページ154内にあるスクリプト156を実行または解釈する。ブラウザ134およびスクリプト156は、図2〜8を参照して以下にさらに説明するような機能を実行するために、プロセッサ101に類似の図示しないプロセッサ上で実行されるか、またはクライアント132における図示しないプロセッサ上で実行される命令によって解釈されることができる命令またはステートメントを含む。一実施形態において、スクリプト156は、ジャバスクリプト(JavaScript)を介して実施されるが、他の実施形態においては、スクリプト156は、アプレット、XML(拡張可能なマークアップ言語)文書、または任意の他の適切な言語またはプロトコルを介して実施されてもよい。ユーザ・インターフェース・ページ154は、HTMP(ハイパーテキスト・マーク付け言語)、XML、または他の任意のマーク付け言語を介して実施されてもよい。また、クライアント132は、コンピュータ・システム100について上述したハードウェアまたはソフトウェアあるいはその両方の要素農地の任意のものまたはすべてを含んでもよい。
ブラウザ134、リンク・マネージャ150、リンク・データベース152、ユーザ・インターフェース・ページ154、およびスクリプト156は別個の要素として図示されているが、他の実施形態においては、ブラウザ134、ユーザ・インターフェース・ページ154、およびスクリプト156は存在しないか、または使用されず、それらの機能は、リンク・マネージャ150によって行われる。また、リンク・マネージャ150は、ブラウザ134、またはブラウザによって使用されるファイル(例えば、ブックマーク・ファイル、またはユーザが規定したメニュー・エンティティの他の種類)と直接やり取りしてもよい。
図1は、コンピュータ・システム100、ネットワーク130、およびクライアント132という主要構成要素を高レベルで代表したものを示すためのものであり、個々の構成要素は、図1に表されたものよりはるかに複雑であってもよく、図1に示すもの以外またはそれらに加える構成要素があってもよく、そのような構成要素の数、種類、および構成は様々であることが理解されるべきである。
図1に示す本発明の様々な実施形態を実施する様々なソフトウェア構成要素は、数多くの方法で実施されてもよく、その方法には、様々なコンピュータ・ソフトウェア・アプリケーション、ルーチン、構成要素、プログラム、オブジェクト、モジュール、データ構造などを使用することが含まれ、以後「コンピュータ・プログラム」または単に「プログラム」と称する。コンピュータ・プログラムは、典型的には、コンピュータ・システム100におけるさまざまなメモリおよび記憶装置において様々な時に存在し、コンピュータ・システム100またはクライアント132あるいはその両方における1つ以上のプロセッサ101によって読み出されて実行されると、コンピュータ・システム100またはクライアント132あるいはその両方に対して、本発明の一実施形態のさまざまな局面を備えるステップまたは要素を実行するのに必要なステップを行わせる、1つ以上の命令を備える。
さらに、本発明の実施形態は、完全に機能するコンピュータ・システムの場合で説明してきたし、かつ今後も説明していくが、本発明の様々な実施形態は、プログラムとして様々な形式で配布されることができ、本発明は、配布を実際に実行するために使用される信号搬送媒体の特定の種類に関わらず、等しく適用される。本実施形態の機能を規定するプログラムは、様々な信号搬送媒体を介して、コンピュータ・システム100またはクライアント132あるいはその両方へ配布されてもよく、当該プログラムには以下のものが含まれるが、これらに限定されるものではない。
(1)例えば、CD‐ROM,DVD‐R,またはDVD+Rなどの、コンピュータ・システムに装着またはその内部の読み出し専用メモリ装置などの書き込み不可能な記憶媒体上に恒久的に記憶された情報;
(2)ハード・ディスク・ドライブ(例えば、DASD125,126,および127)、CD‐RW,DVD‐RW,DVD+RW,DVD‐RAM,またはディスケットなどの書き込み可能な記憶媒体上に記憶された可変情報;または、
(3)例えば、無線通信を含むネットワーク130などのコンピュータまたは電話ネットワークを通じるなどして、通信媒体によって搬送される情報。
そのような信号搬送媒体は、本発明の機能を導く機械読み取り可能な命令を有する場合には、本発明の実施形態を表す。
加えて、以後説明する様々なプログラムは、本発明の特定の実施形態において実施されるためのアプリケーションに基づいて識別されてもよい。しかしながら、これに続く特定のプログラムの用語は、便宜上使用されるに過ぎず、よって、本発明の実施形態は、そのような用語によって識別または意図あるいはその両方が行われる任意の特定のアプリケーションにおいてのみ使用されると限定されるべきではない。
図1に示す環境例は、本発明を限定するものではない。実際、本発明の範囲から逸脱せずに、他の代替ハードウェアまたはソフトウェア環境あるいはその両方を使用してもよい。
図2は、本発明に係る、履歴文書間のリンクを作成および維持するための方法のフロー図を示す。以下の方法は、ソース文書を開く(例えば、ブラウザを介してウェブページへ移動する)ことで自動的に実行されることが意図されている。しかしながら、本方法は、代替実施形態においては、ユーザ制御オプションを介してユーザによって手動で開始されてもよい。本方法は、ブロック200で開始する。ブロック202において、ソース文書を開く。次に、ブロック204において、ソース文書をスキャンして、文書リンクを見つける。ブロック206において、ソース文書において見つかった各文書リンクについて、ソース文書名と文書リンクとを示すリンク・データベース152にエントリを追加する。同一のソース文書が以前に開かれている場合には、ブロック207に示すように、既存のリンク・データベース・エントリを更新して、ソース文書が最後に開かれてからのリンク構造および編成の変更を反映させる。
ブロック208において、妥当なキーワードの検索を、文書リンクによってポイントされた文書に対して行うべきかどうかを判断する。一実施形態において、これは、ウェブ・ブラウザ内のユーザが選択可能なオプションである。行うべきでなければ、制御はブロック214へ進む。行うべきであれば、制御はブロック210へ進み、妥当なキーワードが文書リンクによってポイントされた文書(すなわち、宛先文書)内で突きとめられる。その後、ブロック212に示すように、各妥当なキーワード・エントリについて、エントリをリンク・データベース152に追加する。そのエントリは、キーワードと、ソース文書名と、妥当なキーワードを含む宛先文書の文書リンクとを備える。同一の宛先文書が以前に開かれている場合には、ブロック213に示すように、既存のリンク・データベース・エントリを更新して、文書が最後に開かれてからの変更を反映させる。本方法は、ブロック214において終了する。
図3は、本発明に係る、有用な情報をリンク・データベース152から抽出するためのフロー図を示す。以下の方法は、ソース文書を開く(例えば、ブラウザを介してウェブページへ移動する)ことで自動的に実行されることが意図されている。しかしながら、本方法は、代替実施形態においては、ユーザ制御オプションを介してユーザによって手動で開始されてもよい。本方法は、ブロック300で開始する。ブロック302において、本方法は、リンク・データベース内の文書リンク・エントリを検索して、現在のソース文書が存在しているかどうかを見つける。ブロック304において、現在のソース文書からのリンクが文書リンク・エントリ内に見つかるかどうかを判断する。見つからない場合は、制御はブロック310へ進む。1つ以上のリンクが見つかる場合は、ブロック306に示すように、見つかった各エントリを含む逆方向参照のリストを作成する。ブロック308において、ユーザは、典型的には一時ブックマーク・フォルダを介して、または分割画面を介して、逆方向参照のリストが提示される。逆方向参照のリストをユーザに提示する他の方法もあり、これも本発明の範囲および精神内に収まる。
ブロック310において、ユーザがソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストを作成したいかどうかを判断する。一実施形態において、これは、ウェブ・ブラウザ内のユーザが選択可能なオプションである。作成したくない場合は、制御はブロック320へ進む。作成したい場合は、ブロック312に示すように、現在のソース文書を解析して、妥当なキーワードを決定する。ブロック314において、リンク・データベース152のキーワード・エントリを検索して、ソース文書から解析された妥当なキーワードが存在しているかどうかを見つける。ブロック316において、ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストが作成される。ブロック316において、ユーザは、典型的には一時ブックマーク・フォルダを介して、または分割画面を介して、ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストが提示される。ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストをユーザに提示する他の方法もあり、これも本発明の範囲および精神内に収まる。本方法は、ブロック320において終了する。
図3の方法は、図2の方法と完全に互換可能であり、2つの方法を並行的または非並行的に実施することもできる。例えば、ユーザは新規のソース文書へ移動し、図2の方法は、任意の文書リンクをリンク・データベースに追加するために、当該文書を分析する。図3の方法は、ソース文書上の文書リンクを分析して、逆方向参照リストまたはソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストあるいはその両方を構築してユーザに表示すべきかどうかを判断する。
図4は、本発明が動作するソース文書の一例を示し、概略的に400に示す。本発明の場合の文書は、以下のものを含むが、これに限定されるものではない。すなわち、ワード・プロセッサ文書、ポータブル・デスクトップ・フォーマット(PDF)ファイル、電子メール、ウェブサイト、インスタント・メッセージ、および電子メモである。文書例400は、ブラウザ134内に表示された、ボストン・レッド・ソックスというメジャー・リーグ・ベースボール・チームのウェブサイトである。この文書400は、いくつかの見出し402A〜402Dによって構成されており、各見出しは、他のウェブサイト(すなわち、宛先文書)に対する1つ以上のユニフォーム・リソース・ロケータ(URL)リンク404A〜404Hを含んでいる。見出し402は、ソース文書400を、ファンが興味を有する様々な分野(例えば、順位表、日程、記事、登録名簿など)に分けて構成している。
本発明の一実施形態において、ソース文書400がブラウザ134によって開けられると、ソース文書は、まず、リンク・マネージャ150によって適切な文書リンクを見つけるためにスキャンされる。この場合に、ソース文書400内には、いくつかの文書リンク(URL)404A〜404Hがある。ソース文書400において見つかった各文書リンク(URL)404A〜404Hについて、リンク・マネージャ150は、ソース文書名(例えば、現在のソース文書についてのURL)と宛先文書のURLとを示すリンク・データベース152にエントリを追加する。リンク・データベース152は、図5においてより詳細に説明する。一代替実施形態において、スキャン動作は、リンク・マネージャ150によって自動的に開始されるのではなく、ユーザによって手動で開始されてもよい。
本発明の一実施形態において、文書リンク(URL)によってポイントされた宛先文書を、妥当なキーワードを見つけるためにスキャンしてもよい。宛先文書内の妥当なキーワードを自動的に決定するやり方の候補の1つとしては、繰り返し使用された言葉や用語について宛先文書を検査することが挙げられる。言葉または句が宛先文書内で繰り返し使用されている場合には、妥当なキーワードとして識別できる。妥当なキーワードを決定する他の手法としては、宛先文書内のテキストのフォント・サイズまたは太字化あるいはその両方を検査することが挙げられる。比較的大きな書体またはフォント・サイズで現れる言葉、または太字のテキスト内に存在する言葉も、妥当なキーワードとして識別できる。宛先文書内の妥当なキーワードのセットの識別のためのいくつかの他の方法を実施することができ、これらも本発明の精神および範囲内である。いったん妥当なキーワードが決定されると、当該キーワードと、宛先文書と、関連ソース文書とを含むエントリが、リンク・データベース152に追加される。これは、より完全には図5において説明する。
図5は、本発明に係る、リンク・データベース152の一実施形態を示す。リンク・データベース内の各エントリ500(例えば、エントリ500A,500Bなど)は、ソース文書識別子502と、宛先文書識別子504と、オプションとして、キーワード識別子506とを含む。図2で先に説明したように、ソース文書がリンク・マネージャ150によって解析されると、エントリ500は、リンク・データベース152に書き込まれる。既に解析されたソース文書に関して、エントリが既にリンク・データベース152内にある場合には、リンク・マネージャ150は、ソース文書に対して後続のアクセスがあると、エントリ500を更新する。
一例として、図4に戻って、ソース文書からのURL404A(例えば、ボストン・レッド・ソックスのウェブサイトであるwww.redsox.com)は、ニューヨーク・ヤンキースについての記事を含む他のウェブサイトであるwww.yankees.comをポイントしている。リンク・マネージャ150がボストン・レッド・ソックスのウェブサイト(すなわち、ソース文書)を解析すると、図3に示すように、エントリ500Aをリンク・データベース152に追加することになり、www.redsox.comをソース文書識別子502、www.yankees.comを宛先文書識別子504としてリストにする。
また、リンク・マネージャ150は、上述のように、宛先文書を解析して、リンク・データベース152に含むべき妥当なキーワードを見つける。図6は、ソース文書(例えば、図4に先に示したボストン・レッド・ソックスのウェブサイト)のURL404Eによってポイントされた「ニューヨーク・ヤンキース、レッド・ソックスとのトレードでスミスを獲得」という表題の宛先文書602を示す。上述のように、文書内の妥当なキーワードを識別する1つの方法として、宛先文書内の言葉の存在頻度を判断することが挙げられる。図示の例において、リンク・マネージャ150は、「ヤンキース」という言葉が宛先文書602(太字のテキストによって示される)内で繰り返し存在していると判断する。よって、エントリ500Bは、図5に示すように、リンク・データベース152に追加され、www.redsox.comをソース文書識別子502として、www.yankees.comを宛先文書識別子504として、および「ヤンキース」をキーワード識別子506としてリストにする。
いったんリンク・データベース152にエントリが入り、新規のソース文書が開かれると、リンク・マネージャ150は、リンク・データベース152内の宛先文書識別子504フィールドを検索して、現在のソース文書があるかどうかを見つける。これは、現在開いているソース文書を参照する文書があるかどうかを見つけるために行われる。言い換えれば、ユーザが以前に訪れたことのある文書だけを含む、現在の文書への逆方向参照が識別される(すなわち、ソース文書識別子502フィールド)。リンク・マネージャ150は、そのような逆方向参照のリストを作成し、逆方向参照のこのリストをユーザに対して提示する。逆方向参照のリストをユーザに提示するために、様々な機構を使用してもよく、これには、ブラウザ134内の一時ブックマーク・フォルダの使用に限らず、ユーザが起動した分割画面を使用することが含まれる。
一例として、図4に先に示すボストン・レッド・ソックスのウェブサイトをユーザが訪れたことがあるとし、図5に示すように、いくつかのエントリ500が、ウェブサイトからリンク・データベース152に作成されていると仮定する。ユーザは、www.yankees.comというウェブサイトを約1週間後に訪問したと仮定する。ユーザがwww.yankees.comというウェブサイトへ移動する場合、リンク・マネージャ150は、リンク・データベース152内の宛先文書識別子504フィールドを検索して、www.yankees.com(すなわち、現在のソース文書)があるかどうかをみつける。この場合、エントリ500Aは、宛先文書識別子504フィールド内にwww.yankees.comを有しているので、ソース文書識別子502フィールドの値(すなわち、www.redsox.com)が逆方向文書のリストに追加され、これがユーザに提示される。
本発明の一実施形態において、リンク・データベース152がキーワード・エントリを有している場合、新規のソース文書が開かれると、リンク・マネージャ150は、現在のソース文書を解析して、(宛先文書内のキーワード検索について先に説明した方法を使用して)妥当なキーワードを見つける。その後、リンク・マネージャ150は、リンク・データベース152内の宛先文書キーワード506フィールドを検索して、現在のソース文書から解析された妥当なキーワードが存在しているかどうかを見つける。そのようなキーワードが見つかる場合、ソース文書から解析された妥当なキーワードに合致するキーワードを含む文書のリストが作成される。この文書のリストは、リンク・データベースのソース文書識別子502から収集される。その後、この文書のリストは、ユーザに提示される。逆方向参照のリストをユーザに提示するために、様々な機構を使用してもよく、これには、ブラウザ134内の一時ブックマーク・フォルダの使用に限らず、ユーザが起動した分割画面を使用することが含まれる。
図6における模式例に示すsports.comのwww.sports.comというウェブサイトをユーザが訪れると仮定する。www.sports.comというウェブサイトのホーム・ウェブページを解析して、妥当なキーワードを見つける。「ヤンキース」という言葉が現在のウェブページ上での妥当なキーワードと判断される。なぜならば、存在頻度が比較的高いからである。その後、リンク・マネージャ150は、リンク・データベース152内の宛先文書キーワード506フィールドにおける「ヤンキース」という妥当なキーワードを検索して、「ヤンキース」というキーワードが存在しているかどうかを見つける。エントリ500Bは、「ヤンキース」というキーワードを宛先文書キーワード506フィールドに有しているので、対応するソース文書識別子502フィールドの値(すなわち、www.redsox.com)が、合致キーワード参照のリストに追加され、その後、これがユーザに提示される。
本発明の他の局面において、様々なウェブサイトへの複数のリンク(URL)を含むソース文書が開かれると、ソース文書内のこれらのリンクは、図7に示す方法例によって、階層的に編成およびブックマークされる。本方法は、ブロック702で開始する。
ブロック704において、ユーザは、様々なウェブサイトへの複数のリンク(URL)を含む文書を開く。この処理は、ユーザによって(例えば、ブロック706に示すように「階層ブックマークにURLを保存」のようなプロンプトに答えることによって)明示的に、または代わりに、システムによって自動的に(図示せず)開始することができる。ユーザがリンク(URL)を階層ブックマークとして保存しないことを選択する場合には、処理はブロック720において終了する。そうでない場合には、ブロック708において、ベース・ブックマーク・フォルダが作成されて、当該フォルダの名前付けは、元の文書名に基づくか、または代わりに、文書からの最も妥当なキーワードから取られる。
次に、ブロック710において、ソース文書内にあるリンク(URL)をサブカテゴリに分ける論理グループ化を決定するために、文書の構造が分析される。この分析は、ソース文書の様々な構造面を見ることができ、これらには以下のものが含まれるが、以下のものに限定されるものではない。すなわち、リンク(URL)をグループ化するための見出し、目次、リスト、節、段落、または参照あるいはそれらすべてである。リンク(URL)の編成およびグループ化を強化するために(または、論理グループ化をページ構造に基づいては見つけることができなかった場合には)、ブロック712に示すように、リンクの内容およびその周囲のコンテキストが分析されて、各リソースに関連した主なキーワードを解析し、同様のキーワードに基づいてリンクを編成する。その後、複数のサブカテゴリ化の手法(すなわち、グループ化)がユーザにオプションとして提示されてもよく、それによって、ユーザは、その必要性に最も見合うサブカテゴリ化を選択することができる。リンクのグループ化の周辺の文書コンテキストおよびリンク自体内部のコンテキストからのキーワードが解析されて、各論理グループ化毎にフォルダ名を決定する。
ブロック714において、ブロック712からのキーワードに基づいてサブフォルダが作成されて、適切なリンクが、各サブフォルダ内に配置される。本発明の一実施形態において、ブロック716に示すように、リンク周辺のコンテキスト(およびリンク自体の内容)が更新されるにつれてリンクの編成およびグループ化が変更するかどうかをユーザが指定することができるオプションが存在する。ユーザが動的更新を望まない場合には、本方法はブロック720において終了する。ユーザが積極的に動的更新オプションを選択する場合には、ブロック718に示すように、リンク編成は定期的に更新される。一実施形態において、変更されたリンクは、ブックマーク・フォルダ内で「ゴースト・リンク」を介して、または代わりに、リンクがかつて存在した場所であって、当該リンクの新たな場所へとユーザを導く色あせた場所のマークによって、ユーザに対して表示することができる。
図8は、ソース文書内のリンクが階層的に編成およびブックマークされる、図4のソース文書を示し、概略的に800に示す。図示の例において、ユーザは、「ボストン・レッド・ソックス」のウェブサイトへウェブ・ブラウザを介して移動する。図示のウェブサイトは、様々な他のウェブサイトをポイントする数多くのリンク(URL)404A〜404Hを含む。その後、ユーザは、当該ページからのURLを階層ブックマークとして保存させたいかどうかを促される。代わりに、ブックマークは、ブラウザ制御オプションを介して、自動的に保存されるか、または保存されなくてもよい。
現在の文書からのURLを履歴ブックマークとしてユーザが保存したい場合、現在の文書についてベース・ブックマーク・フォルダが作成される。現在の文書についてのベース・ブックマーク・フォルダの名前は、数多くのやり方で導出できる。図示の実施形態において、ベース・ブックマーク・フォルダは、元の文書名「redsox.com」に基づいて名前付けされる。一代替実施形態において、ベース・ブックマーク・フォルダについての名前は、文書内の妥当なキーワードから導出することもできる。
次に、現在の文書内にあるリンク(URL)についての論理グループ化を決定するために、現在の文書(例えば、ボストン・レッド・ソックスのウェブページ)の構造を分析する。図示の実施形態において、ウェブサイトは、いくつかの見出し(例えば、「順位表」402A、「日程」402B、「記事」402C、および「登録名簿」402D)に分割される。これらの見出しは、ページ内のリンク(URL)をカテゴリー化する優れたやり方を提供する。ウェブページについてのハイパーテキスト・マーク付け言語(HTML)を分析することによって、URLとその関連する見出しとの間の関係が決定されてもよい。例えば、URLであるwww.yankees.com404A、www.redsox.com404B、www.orioles.com404C、およびwww.bluejays.com404Dが、「順位表」という見出しの下にグループ化される。ボストン・レッド・ソックスのウェブページ上の記事をポイントするURL、すなわち、www.sports.com404Eおよびwww.bostonglobe.com404Fが、「記事」という見出しの下にグループ化される。最後に、「登録名簿」という見出しの下の選手のウェブサイトをポイントするURL、すなわち、www.curtshilling.com404Gおよびwww.davidortiz.com404Hが、「登録名簿」という見出しの下にグループ化される。
本発明の他の実施形態において、文書内のURLをグループ化するために、ソース文書の他の構造面(例えば、見出し、目次、リスト、節、段落)を分析してもよい。そのような一実施形態において、ユーザは、様々な種類の構造上のグループ化に基づくキーワードについての複数のグループ化手法の候補が提示され、ユーザは、その要求を最も反映する手法を選択してもよい。
次に、各見出しについて、ベース・ブックマーク・フォルダの下にサブフォルダが作成され、各見出しに対応するリンクが、対応するサブフォルダに移動され、その後、802に示すように、ブラウザのオプションとしてユーザに表示される。このように、この文書(例えば、ウェブページ)内に存在するURLが階層的に編成されて、今後の参照に使用可能である。図示の例において、ソース文書内の見出しに対応して、1つのレベルのサブフォルダのみが作成されている。サブフォルダのさらなる階層レベルを作成することもでき、これも本発明の範囲および精神内にあることに注意されたい。例えば、「順位表」という見出しの下に、「アメリカン・リーグ」および「ナショナル・リーグ」という副見出しがあってもよい。これらの副見出しを使用して、「順位表」というサブフォルダの下に対応するサブフォルダを作成してもよい。
本発明の実施形態例の以上の詳細な説明において、添付の図面を参照した(同様の数字は同様の要素を表す)。添付の図面は、本明細書の一部を構成し、添付の図面において示されているのは、本発明が実施されるであろう特定の実施形態例である。これらの実施形態は、当業者が本発明の実施できるのに充分に詳細に説明されているが、他の実施形態を使用してもよく、論理的、機械的、電気的、または他の変更が、本発明の範囲を逸脱することなく行われてもよい。本明細書内で使用されているような「実施形態」という言葉の別の事例は、必ずしも同一の実施形態を指すものではないが、そういう場合もある。従って、上述の詳細な説明は、限定的な意味で受け取られるものではなく、本発明の範囲は、添付の請求項によってのみ規定される。
上述の説明において、本発明の完全な理解を提供するために、数多くの具体的な詳細を述べた。しかしながら、本発明は、これらの具体的な詳細なしで実施されてもよい。他の事例における、周知の回路、構造、および手法は、本発明を不明瞭にしないために詳細に説明しなかった。
本発明の一実施形態を実施するためのシステム例の高レベルのブロック図を示す。 本発明に係る、履歴文書間のリンクを作成および維持するための方法のフロー図を示す。 本発明に係る、有用な情報をリンク・データベースからユーザへ抽出および提示するためのフロー図を示す。 本発明が動作する文書の一例を示す。 本発明に係る、リンク・データベースの一実施形態を示す。 本発明が動作するウェブサイトの一例を示す。 本発明に係る所定の文書内の様々なウェブサイトに対する複数のリンク(URL)を編成および階層的にブックマークするための方法のフロー図である。 本発明に係る、ソース文書内のリンクが階層的に編成およびブックマークされる、図4のソース文書を示す。
符号の説明
100 コンピュータ・システム
101 プロセッサ
101A〜101D CPU
102 メモリ
103 メモリ・バス
104 I/Oバス
105 I/Oバス・インターフェース
111 端末インターフェース
112 記憶装置インターフェース
113 I/Oインターフェース
114 ネットワーク・インターフェース
121〜124 ユーザ端末
125〜127 DASD
128 プリンタ
129 ファックス機
130 ネットワーク
132 クライアント
134 ブラウザ
150 リンク・マネージャ
152 リンク・データベース
154 ユーザ・インターフェース・ページ
156 スクリプト

Claims (15)

  1. 複数の文書内のリンクを管理するための方法であって、
    前記複数の文書から選択されたソース文書を開くステップと、
    前記ソース文書をスキャンして、文書リンクを見つけるステップと、
    前記ソース文書内で見つかった各文書リンクについて、前記ソース文書の名前と前記文書リンクとを示すリンク・データベースにエントリを追加するステップと、
    前記文書リンクによってポイントされた宛先文書をスキャンして妥当なキーワードを見つけるステップと、
    前記妥当なキーワードをキーワード・エントリを介して前記リンク・データベースに含めるステップであって、前記キーワード・エントリは、前記キーワードと、ソース文書名と、前記妥当なキーワードを含む前記宛先文書の前記文書リンクとを含む、ステップと
    を含む、方法。
  2. 複数の文書内のリンクを管理するための方法であって、
    前記複数の文書から選択されたソース文書を開くステップと、
    前記ソース文書をスキャンして、文書リンクを見つけるステップと、
    前記ソース文書内で見つかった各文書リンクについて、前記ソース文書の名前と前記文書リンクとを示すリンク・データベースにエントリを追加するステップと、
    前記リンク・データベース内の文書リンク・エントリを検索して、現在のソース文書が存在しているかどうかを見つけるステップと、
    見つかった各エントリについて、逆方向参照のリストを作成するステップと
    を含む、方法。
  3. ユーザに逆方向参照の前記リストを提示するステップをさらに含む、請求項2に記載の方法。
  4. 逆方向参照の前記リストは、一時ブックマーク・フォルダを介して前記ユーザに提示される、請求項3に記載の方法。
  5. 逆方向参照の前記リストは、分割画面を介して前記ユーザに提示される、請求項3に記載の方法。
  6. 前記ソース文書を解析して妥当なキーワードを見つけるステップと、
    前記リンク・データベース内の前記キーワード・エントリを検索して、前記ソース文書から解析された前記妥当なキーワードが存在しているかどうかを見つけるステップと、
    前記ソース文書から解析された前記妥当なキーワードに合致するキーワードを含む宛先文書のリストを作成するステップと
    をさらに含む、請求項1に記載の方法。
  7. 前記ソース文書から解析された前記妥当なキーワードに合致するキーワードを含む宛先文書のリストをユーザに提示するステップをさらに含む、請求項6に記載の方法。
  8. 前記文書のリストは、一時ブックマーク・フォルダを介して前記ユーザに提示される、請求項7に記載の方法。
  9. 前記文書のリストは、分割画面を介して前記ユーザに提示される、請求項7に記載の方法。
  10. 前記ソース文書は、ワード・プロセッサ文書、ポータブル・デスクトップ・フォーマット(PDF)ファイル、電子メール、ウェブサイト、および電子メモからなる群から選ばれる、請求項1に記載の方法。
  11. 前記文書リンクは、ユニフォーム・リソース・ロケータ(URL)である、請求項1に記載の方法。
  12. 前記ソース文書の構造に基づいて、階層的に前記文書リンクを編成するステップをさらに含む、請求項1に記載の方法。
  13. 前記ソース文書の前記構造に基づいて、階層的に前記文書リンクを編成するステップは、
    ベース・ブックマーク・フォルダを作成するステップと、
    前記文書リンクの論理グループ化を決定するために、前記ソース文書の前記構造を分析するステップと、
    前記文書リンクの前記論理グループ化に基づいて、複数のリンク・サブカテゴリを作成するステップと、
    ソース文書の内容とリンク内容とを解析して妥当なキーワードを見つけるステップと、
    前記複数のリンク・サブカテゴリに基づいてベース・ブックマーク・フォルダに対するブックマーク・サブフォルダを作成するステップであって、各ブックマーク・サブフォルダの名前は、前記妥当なキーワードに基づく、ステップと
    をさらに含む、請求項12に記載の方法。
  14. 複数の文書内のリンクを管理するための方法であって、
    前記複数の文書から選択されたソース文書を開くステップと、
    前記ソース文書をスキャンして、文書リンクを見つけるステップと、
    前記ソース文書内で見つかった各文書リンクについて、前記ソース文書の名前と前記文書リンクとを示すリンク・データベースにエントリを追加するステップと、
    前記文書リンクによってポイントされた宛先文書をスキャンして妥当なキーワードを見つけるステップと、
    前記妥当なキーワードをキーワード・エントリを介して前記リンク・データベースに含めるステップであって、前記キーワード・エントリは、前記キーワードと、ソース文書名と、前記妥当なキーワードを含む前記宛先文書の前記文書リンクとを含む、ステップと、
    前記リンク・データベース内の文書リンク・エントリを検索して、現在のソース文書が存在しているかどうかを見つけるステップと、
    前記リンク・データベース内で見つかった前記現在のソース文書の各エントリについて、関連する文書のリスト内にエントリを作成するステップと、
    前記ソース文書を解析して妥当なキーワードを見つけるステップと、
    前記リンク・データベース内の前記キーワード・エントリを検索して、前記ソース文書から解析された前記妥当なキーワードが存在しているかどうかを見つけるステップと、
    前記ソース文書から解析されたキーワードを含む前記リンク・データベース内の各文書について、前記関連する文書のリスト内にエントリを作成するステップと、
    前記関連する文書のリストをユーザに提示するステップと
    を含む、方法。
  15. 複数の文書内のリンクを管理するための方法を提供するコンピュータ読み出し可能なプログラムであって、
    前記複数の文書から選択されたソース文書を開くステップと、
    前記ソース文書をスキャンして、文書リンクを見つけるステップと、
    前記ソース文書内で見つかった各文書リンクについて、前記ソース文書の名前と前記文書リンクとを示すリンク・データベースにエントリを追加するステップと、
    前記文書リンクによってポイントされた宛先文書をスキャンして妥当なキーワードを見つけるステップと、
    前記妥当なキーワードをキーワード・エントリを介して前記リンク・データベースに含めるステップであって、前記キーワード・エントリは、前記キーワードと、ソース文書名と、前記妥当なキーワードを含む前記宛先文書の前記文書リンクとを含む、ステップと、
    前記リンク・データベース内の文書リンク・エントリを検索して、現在のソース文書が存在しているかどうかを見つけるステップと、
    前記リンク・データベース内で見つかった前記現在のソース文書の各エントリについて、関連する文書のリスト内にエントリを作成するステップと、
    前記ソース文書を解析して妥当なキーワードを見つけるステップと、
    前記リンク・データベース内の前記キーワード・エントリを検索して、前記ソース文書から解析された前記妥当なキーワードが存在しているかどうかを見つけるステップと、
    前記ソース文書から解析されたキーワードを含む前記リンク・データベース内の各文書について、前記関連する文書のリスト内にエントリを作成するステップと、
    前記関連する文書のリストをユーザに提示するステップと
    を含む、コンピュータ読み出し可能なプログラム。
JP2006312273A 2005-12-08 2006-11-17 文書ベースの情報およびユニフォーム・リソース・ロケータ(url)の管理方法およびプログラム Expired - Fee Related JP5186099B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/297310 2005-12-08
US11/297,310 US8307275B2 (en) 2005-12-08 2005-12-08 Document-based information and uniform resource locator (URL) management

Publications (2)

Publication Number Publication Date
JP2007157132A true JP2007157132A (ja) 2007-06-21
JP5186099B2 JP5186099B2 (ja) 2013-04-17

Family

ID=38130652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006312273A Expired - Fee Related JP5186099B2 (ja) 2005-12-08 2006-11-17 文書ベースの情報およびユニフォーム・リソース・ロケータ(url)の管理方法およびプログラム

Country Status (4)

Country Link
US (1) US8307275B2 (ja)
JP (1) JP5186099B2 (ja)
CN (1) CN100462972C (ja)
TW (1) TW200805092A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170185A (ja) * 2009-01-20 2010-08-05 Nec Corp 端末装置およびWebページデータ取得方法
JP2013186758A (ja) * 2012-03-08 2013-09-19 Fujitsu Ltd 情報管理装置、情報管理方法、および情報管理用プログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504554B2 (en) 1999-08-16 2013-08-06 Raichur Revocable Trust, Arvind A. and Becky D. Raichur Dynamic index and search engine server
US9195756B1 (en) 1999-08-16 2015-11-24 Dise Technologies, Llc Building a master topical index of information
US9977831B1 (en) 1999-08-16 2018-05-22 Dise Technologies, Llc Targeting users' interests with a dynamic index and search engine server
FR2906382B1 (fr) * 2006-09-25 2008-11-14 Canon Kk Procedes et dispositifs pour optimiser le traitement xml
US8086608B2 (en) * 2007-10-12 2011-12-27 International Business Machines Corporation Management of resource identifiers
US8095975B2 (en) * 2008-03-18 2012-01-10 International Business Machines Corporation Dynamic document merging method and system
JP4879930B2 (ja) 2008-03-27 2012-02-22 ブラザー工業株式会社 コンテンツ管理装置、コンテンツ管理システム及びコンテンツ管理方法
US8438472B2 (en) 2009-01-02 2013-05-07 Apple Inc. Efficient data structures for parsing and analyzing a document
CN102129428B (zh) * 2010-01-20 2015-11-25 腾讯科技(深圳)有限公司 一种实现从网页中订阅信息的方法及装置
KR20120035041A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 하이퍼링크의 주소를 북마크에 등록하는 방법 및 그 장치
US8380753B2 (en) 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US20120215757A1 (en) * 2011-02-22 2012-08-23 International Business Machines Corporation Web crawling using static analysis
JP5760564B2 (ja) * 2011-03-22 2015-08-12 カシオ計算機株式会社 情報表示装置およびプログラム
KR101344910B1 (ko) * 2011-07-04 2013-12-26 네이버 주식회사 클라우드를 기반으로 서비스 간의 문서를 연결하는 시스템 및 방법
US8875009B1 (en) * 2012-03-23 2014-10-28 Amazon Technologies, Inc. Analyzing links for NCX navigation
US8606783B2 (en) * 2012-04-03 2013-12-10 Python4Fun, Inc. Identifying video files of a video file storage system having relevance to a first file
US9626340B2 (en) * 2012-08-28 2017-04-18 Dropbox, Inc. Bookmarking shared file and folder links
US8656265B1 (en) * 2012-09-11 2014-02-18 Google Inc. Low-latency transition into embedded web view
CN105808076A (zh) * 2012-12-14 2016-07-27 中兴通讯股份有限公司 一种浏览器书签的设置方法、装置及终端
US9390177B2 (en) 2014-03-27 2016-07-12 International Business Machines Corporation Optimizing web crawling through web page pruning
US10289730B2 (en) * 2015-02-16 2019-05-14 Microsoft Technology Licensing, Llc Cross-system data aggregation
US10832000B2 (en) * 2016-11-14 2020-11-10 International Business Machines Corporation Identification of textual similarity with references
US10970252B2 (en) * 2017-10-06 2021-04-06 Sahadevan Balachandran Method and apparatus for generating customized digital files with variable data
US11372894B2 (en) * 2018-12-21 2022-06-28 Atlassian Pty Ltd. Associating product with document using document linkage data
US11403315B2 (en) * 2019-11-21 2022-08-02 Bank Of America Corporation Reporting and knowledge discovery for databases
CN112104734B (zh) * 2020-09-15 2022-09-02 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质
KR102378161B1 (ko) * 2021-07-16 2022-03-28 주식회사 비즈니스캔버스 백링크 버튼을 이용하여 문서와 연계된 리소스 정보를 제공하는 문서 편집 인터페이스 제공 방법 및 장치

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561758A (ja) * 1991-08-30 1993-03-12 Nippon Telegr & Teleph Corp <Ntt> 情報リンク装置
JPH09146962A (ja) * 1995-11-16 1997-06-06 Nippon Telegr & Teleph Corp <Ntt> 情報空間アクセス支援方法および装置
WO1999014690A1 (fr) * 1997-09-17 1999-03-25 Hitachi, Ltd. Procede d'addition d'un mot cle au moyen d'informations de liaison
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
JP2002117073A (ja) * 2000-10-04 2002-04-19 Sharp Corp 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ
WO2002044946A1 (fr) * 2000-11-29 2002-06-06 Kabushiki Kaisha Toshiba Moteur de recherche
JP2002245089A (ja) * 2001-02-19 2002-08-30 Hitachi Eng Co Ltd ウェブページ検索システム、二次情報収集装置、インターフェース装置
JP2003016082A (ja) * 2001-06-29 2003-01-17 Just Syst Corp リンク集作成装置、リンク集作成方法、及びリンク集作成プログラム
JP2003288342A (ja) * 2002-03-28 2003-10-10 Ricoh Co Ltd 情報処理装置
JP2005157965A (ja) * 2003-11-28 2005-06-16 Fuji Xerox Co Ltd 文書リンク構造情報作成装置及び方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO525497A0 (en) * 1997-02-21 1997-03-20 Mills, Dudley John Network-based classified information systems
US5973692A (en) * 1997-03-10 1999-10-26 Knowlton; Kenneth Charles System for the capture and indexing of graphical representations of files, information sources and the like
US6049799A (en) * 1997-05-12 2000-04-11 Novell, Inc. Document link management using directory services
US6037934A (en) * 1997-11-21 2000-03-14 International Business Machines Corporation Named bookmark sets
US6122647A (en) * 1998-05-19 2000-09-19 Perspecta, Inc. Dynamic generation of contextual links in hypertext documents
US6772139B1 (en) * 1998-10-05 2004-08-03 Smith, Iii Julius O. Method and apparatus for facilitating use of hypertext links on the world wide web
US7275206B1 (en) * 1999-04-15 2007-09-25 International Business Machines Corporation Method and computer program product for identifying hypertext links in document printouts
US7213198B1 (en) * 1999-08-12 2007-05-01 Google Inc. Link based clustering of hyperlinked documents
AUPQ475799A0 (en) * 1999-12-20 2000-01-20 Youramigo Pty Ltd An internet indexing system and method
US7225181B2 (en) * 2000-02-04 2007-05-29 Fujitsu Limited Document searching apparatus, method thereof, and record medium thereof
US6819339B1 (en) * 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US20050021862A1 (en) * 2000-03-31 2005-01-27 Dickens Coal Llc Automatic selection of content-delivery provider using link mapping database
US6883001B2 (en) * 2000-05-26 2005-04-19 Fujitsu Limited Document information search apparatus and method and recording medium storing document information search program therein
US20010049700A1 (en) * 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
US7155489B1 (en) * 2000-06-28 2006-12-26 Microsoft Corporation Acquiring web page information without commitment to downloading the web page
US7356530B2 (en) * 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US6981210B2 (en) * 2001-02-16 2005-12-27 International Business Machines Corporation Self-maintaining web browser bookmarks
US6925594B2 (en) * 2001-02-28 2005-08-02 International Business Machines Corporation Saving selected hyperlinks for retrieval of the hyperlinked documents upon selection of a finished reading button in a web browser
JP2002259450A (ja) * 2001-03-01 2002-09-13 Ricoh Co Ltd キーワードをフォルダ名とした関連文書の書き出し方法および同方法の手順を記録した記録媒体
JP4399127B2 (ja) * 2001-05-14 2010-01-13 株式会社日立製作所 文書管理方法及び装置並びにその処理プログラム及びそれを格納した記憶媒体
CA2353682A1 (en) * 2001-07-23 2003-01-23 Ibm Canada Limited-Ibm Canada Limitee Link management of document structures
US20040205496A1 (en) * 2001-10-11 2004-10-14 International Business Machines Corporation Displaying subheadings and hyperlinks in a scrollable long document
US20030101183A1 (en) * 2001-11-26 2003-05-29 Navin Kabra Information retrieval index allowing updating while in use
US7406659B2 (en) * 2001-11-26 2008-07-29 Microsoft Corporation Smart links
US7133860B2 (en) * 2002-01-23 2006-11-07 Matsushita Electric Industrial Co., Ltd. Device and method for automatically classifying documents using vector analysis
US20040205569A1 (en) * 2002-02-06 2004-10-14 Mccarty Jon S. Method and system to manage outdated web page links in a computing system
WO2004008348A1 (en) * 2002-07-16 2004-01-22 Horn Bruce L Computer system for automatic organization, indexing and viewing of information from multiple sources
US20040034635A1 (en) * 2002-08-15 2004-02-19 Czarnecki David Anthony Method and system for identifying and matching companies to business event information
US7194469B1 (en) * 2002-09-24 2007-03-20 Adobe Systems Incorporated Managing links in a collection of documents
JP4093012B2 (ja) * 2002-10-17 2008-05-28 日本電気株式会社 ハイパーテキスト検査装置および方法並びにプログラム
JP2004280203A (ja) * 2003-03-12 2004-10-07 Sony Corp Web対応電子機器装置、ページ閲覧表示方法およびプログラム
US7523403B2 (en) * 2003-03-31 2009-04-21 Microsoft Corporation Placeholder control object for creating and viewing content in connection with a content management server system
CN1536483A (zh) * 2003-04-04 2004-10-13 陈文中 网络信息抽取及处理的方法及系统
US7188308B2 (en) * 2003-04-08 2007-03-06 Thomas Weise Interface and method for exploring a collection of data
US7308643B1 (en) * 2003-07-03 2007-12-11 Google Inc. Anchor tag indexing in a web crawler system
KR100565289B1 (ko) * 2003-08-30 2006-03-30 엘지전자 주식회사 이동 통신 단말기의 하이퍼링크를 이용한 정보 관리 방법
US7552109B2 (en) * 2003-10-15 2009-06-23 International Business Machines Corporation System, method, and service for collaborative focused crawling of documents on a network
US20050114756A1 (en) * 2003-11-26 2005-05-26 Nokia Corporation Dynamic Internet linking system and method
US20050198567A1 (en) * 2004-01-29 2005-09-08 Vermeulen Bert M. Web navigation method and system
US7487190B2 (en) * 2004-08-27 2009-02-03 Microsoft Corporation Automated identification and marking of new and changed content in a structured document
US20070022098A1 (en) * 2005-07-25 2007-01-25 Dale Malik Systems and methods for automatically updating annotations and marked content of an information search
US8849821B2 (en) * 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561758A (ja) * 1991-08-30 1993-03-12 Nippon Telegr & Teleph Corp <Ntt> 情報リンク装置
JPH09146962A (ja) * 1995-11-16 1997-06-06 Nippon Telegr & Teleph Corp <Ntt> 情報空間アクセス支援方法および装置
WO1999014690A1 (fr) * 1997-09-17 1999-03-25 Hitachi, Ltd. Procede d'addition d'un mot cle au moyen d'informations de liaison
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
JP2002117073A (ja) * 2000-10-04 2002-04-19 Sharp Corp 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ
WO2002044946A1 (fr) * 2000-11-29 2002-06-06 Kabushiki Kaisha Toshiba Moteur de recherche
JP2002245089A (ja) * 2001-02-19 2002-08-30 Hitachi Eng Co Ltd ウェブページ検索システム、二次情報収集装置、インターフェース装置
JP2003016082A (ja) * 2001-06-29 2003-01-17 Just Syst Corp リンク集作成装置、リンク集作成方法、及びリンク集作成プログラム
JP2003288342A (ja) * 2002-03-28 2003-10-10 Ricoh Co Ltd 情報処理装置
JP2005157965A (ja) * 2003-11-28 2005-06-16 Fuji Xerox Co Ltd 文書リンク構造情報作成装置及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7011004194; David A. Nation: 'WebTOC: A Tool to Visualize and Quantify Web Sites using a hierarchical Table of Contents Browser' Proceedings of CHI 98 conference summary on Human factors in computing systems , 19980418, p. 185〜186, ACM *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170185A (ja) * 2009-01-20 2010-08-05 Nec Corp 端末装置およびWebページデータ取得方法
JP2013186758A (ja) * 2012-03-08 2013-09-19 Fujitsu Ltd 情報管理装置、情報管理方法、および情報管理用プログラム

Also Published As

Publication number Publication date
US8307275B2 (en) 2012-11-06
CN100462972C (zh) 2009-02-18
JP5186099B2 (ja) 2013-04-17
CN1979484A (zh) 2007-06-13
TW200805092A (en) 2008-01-16
US20070136318A1 (en) 2007-06-14

Similar Documents

Publication Publication Date Title
JP5186099B2 (ja) 文書ベースの情報およびユニフォーム・リソース・ロケータ(url)の管理方法およびプログラム
US6832350B1 (en) Organizing and categorizing hypertext document bookmarks by mutual affinity based on predetermined affinity criteria
US6256623B1 (en) Network search access construct for accessing web-based search services
US7167901B1 (en) Method and apparatus for improved bookmark and histories entry creation and access
US8055993B2 (en) Selecting and displaying descendant pages
US7856413B2 (en) Dynamic search criteria on a search graph
US7788253B2 (en) Global anchor text processing
US7499913B2 (en) Method for handling anchor text
US8090740B2 (en) Search-centric hierarchichal browser history
US6804704B1 (en) System for collecting and storing email addresses with associated descriptors in a bookmark list in association with network addresses of electronic documents using a browser program
US7853592B2 (en) System and method of searching for previously visited website information
US20070038665A1 (en) Local computer search system and method of using the same
US20090157381A1 (en) Web translation provider
JP2007122732A (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法)
US9280522B2 (en) Highlighting of document elements
US8584001B2 (en) Managing bookmarks in applications
US20100017392A1 (en) Intent match search engine
US8645352B2 (en) Focused search using network addresses
US20120191687A1 (en) Using historical information to improve search across heterogeneous indices
US7568150B2 (en) Apparatus and method of highlighting categorized web pages on a web server
US7472115B2 (en) Contextual flyout for search results
US8612431B2 (en) Multi-part record searches
JP2008191982A (ja) 検索結果出力装置
US6928616B2 (en) Method and apparatus for allowing one bookmark to replace another
KR20060115488A (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120117

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120117

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120814

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20120814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121119

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees