JP5891759B2 - ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム - Google Patents

ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP5891759B2
JP5891759B2 JP2011268026A JP2011268026A JP5891759B2 JP 5891759 B2 JP5891759 B2 JP 5891759B2 JP 2011268026 A JP2011268026 A JP 2011268026A JP 2011268026 A JP2011268026 A JP 2011268026A JP 5891759 B2 JP5891759 B2 JP 5891759B2
Authority
JP
Japan
Prior art keywords
bookmark
keyword
content
website
bookmarks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011268026A
Other languages
English (en)
Other versions
JP2012141963A (ja
Inventor
祥子 今井
祥子 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011268026A priority Critical patent/JP5891759B2/ja
Publication of JP2012141963A publication Critical patent/JP2012141963A/ja
Application granted granted Critical
Publication of JP5891759B2 publication Critical patent/JP5891759B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、ウェブサイトの閲覧技術に関する。特に、本発明は、ウェブサイトの閲覧に際して、登録された複数のブックマークの中から最適なブックマークをユーザに提示する、ウェブサイトの閲覧技術に関する。
ブラウザ(閲覧ソフトウェア)を利用したインターネットのウェブサイト(以下、「Webサイト」、或いは「Webページ」と称する場合がある)の閲覧が広く普及している。一般的なブラウザは、所謂、ブックマーク機能を備える。ブックマーク機能によれば、ユーザ所望のWebページのURL(Uniform Resource Locator)を、ユーザ所望のタイトルと関連付けてブラウザに保存しておくことにより、当該所望のWebページへのユーザによる次回以降の容易なアクセスを実現することができる。但し、一般には、ブラウザの利用期間が長期化した場合等、そのブラウザに登録されるブックマークの件数が増加する傾向がある。このような状況を想定して、ブックマーク機能には、ユーザ所望の名称を付したフォルダに、ユーザ自身がWebページを分類(整理)する機能も知られている。
しかしながら、ブラウザの実際の利用シーンにおいて、ユーザは、予め登録したブックマークが多くなるほど、所望のWebページに対応するブックマークに直ちにアクセスすることが困難になるという問題がある。この傾向は、フォルダに分類した場合であっても同様である。この結果として、ブラウザに多数のブックマークが登録されたとしても、その大部分のブックマークは有効に活用されないという状況が生じる。
また、登録した複数のブックマークの中から、目的とするブックマークを検索する機能を有するブラウザも知られている。しかしながら、係る検索機能を使いこなすため、ユーザは、目的とするブックマークを以前に登録したことを覚えている必要があり、更には、目的とするブックマークのタイトル等を、検索キーワードとして使用すべく覚えていなければならない。このため、係る検索機能は、ユーザにとって使いこなすのが容易ではなく利便性を欠く。
そこで、このような一般的なブラウザ機能及びそのブックマーク機能の利便性を改善すべく、ユーザの状況に応じて、そのユーザがアクセスしたいであろうブックマークを、ブラウザ画面上のアクセス(操作)容易な場所に表示する技術が提案されている。係る技術の一例として、特許文献1は、大量に登録されたブックマークの有効活用を促すために、ユーザの知りたいことに関連したブックマークを、現在閲覧中のWebページのURLを基に抽出して、ユーザに提示する技術を開示する。
即ち、特許文献1は、現在閲覧中のWebページに関連するブックマークを、URLと、そのURLのコンテンツに関係するブックマークとが関連付けされた管理データベースから取得する技術を開示する。即ち、特許文献1において、係る管理データベースは、ユーザとは異なる第三者によって予め用意される。ユーザは、現在閲覧しているWebページのURLを係る管理データベースに問い合わせるのに応じて、関連するURL群を取得する。そして特許文献1では、取得したURL群に該当するブックマークが当該ユーザが利用するブラウザのブックマークに登録されていれば、そのブックマークの一覧がユーザに提示される。
また、特許文献2は、ユーザに有益なWebページのコンテンツを最適なタイミングで提供することを目的として、登録されているブックマークの中から、時間やユーザの位置等に応じて最適なブックマークを提示する技術を開示する。
特開2007−299170号公報 特開2004−070441号公報
しかしながら、特許文献1に開示された技術においては、上述した管理データベースへのデータの登録が予め行われるため、登録された情報はユーザのアクセスタイミングより常に古い情報であり、ブックマークや関連URLのコンテンツの変化に即時対応できない。また、Webページのコンテンツのみに基づくブックマークの自動抽出は、ユーザの知りたいことがそのWebページのごく一部にのみ記載されている場合等、ユーザの希望とは異なるブックマークが抽出される可能性がある。
また、特許文献1に開示された技術においては、URLに対する利用分類による関連付けが行われる。このため、利用分類の設定によっては、Webページのコンテンツに対応していない分類分けが行われる虞もある。
また、特許文献2に開示された技術において、ユーザに提示されるブックマークは、そのユーザが現在閲覧しているWebページの内容が考慮されない。
そこで、本発明は、現在閲覧されているウェブサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示するブックマーク抽出装置等の提供を主たる目的とする。
上記の目的を達成すべく、本発明に係るブックマーク抽出装置は、以下の構成を備えることを特徴とする。
即ち、本発明の一観点として、ブックマーク抽出装置は、
ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出するキーワード抽出手段と、
登録されている複数のブックマークの中から、前記抽出手段によって抽出されたキーワードに基づいて、該キーワードに関連するブックマークを提示する提示手段とを備える
ことを特徴とする。
また、上記の場合、例えば前記キーワード抽出手段は、
前記閲覧履歴情報のうち、現在閲覧されているウェブサイトに関する情報に基づいて、そのウェブサイトのコンテンツを取得し、そのコンテンツの中から、前記キーワードを抽出してもよい。
或いは、本発明の他の観点として、上記ブックマーク抽出装置において、前記キーワード抽出手段は、
前記閲覧履歴情報を解析することにより、検索サイトから現在閲覧されているウェブサイトに遷移したと判断した際、該ウェブサイトに遷移するまでに使用した検索キーワードを、前記キーワードとして抽出し、
前記提示手段は、
前記複数のブックマークの中から、前記検索キーワードに基づいて、該検索キーワードに関連するブックマークを提示してもよい。
そして上記何れの構成においても、例えば前記提示手段は、
前記複数のブックマークに関する情報に含まれる個々のブックマークの属性情報の中に、前記キーワードが含まれる程度に応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する関連性判断手段を含んでもよい。
尚、同目的は、上記の各構成のブックマーク抽出装置に対応するブックマーク抽出方法によっても達成される。
また、同目的は、上記の各構成を有するブックマーク抽出装置、並びに対応する方法を、コンピュータによって実現するコンピュータ・プログラム、及びそのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記憶媒体によっても達成される。
上記の本発明によれば、現在閲覧されているウェブサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示するブックマーク抽出装置等の提供が実現する。
本発明の模範的な第1の実施形態に係るブックマーク抽出装置の構成を示すブロック図である。 本発明の模範的な第2の実施形態に係るブックマーク抽出システムを含む通信環境を例示する構成図である。 本発明の模範的な第2の実施形態に係るブックマーク抽出システム100によるブックマーク抽出処理を示すフローチャートである。 第2の実施形態に係るブックマーク抽出処理のうち、図3に示すステップS102,ステップS104,ステップS105,ステップS110における処理の詳細を示すフローチャートである。 第2の実施形態に係る履歴一件に対する検索サイトか否かの判断処理と、検索ワードの抽出処理とを示すフローチャートである。 本発明の模範的な第2の実施形態における関連性判断処理を示すフローチャートである。 検索サイト情報記憶部106に保持されている検索サイト情報を概念的に例示する図である。 本発明の模範的な第2の実施形態の実施例における、ユーザによるWeb閲覧に際しての画面遷移を例示的に説明する図である。 図8に例示する画面遷移の場合におけるブックマーク抽出システムの動作を概念的に説明する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク1のデータ構成を概念的に例示する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク2のデータ構成を概念的に例示する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク3のデータ構成を概念的に例示する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク4のデータ構成を概念的に例示する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク5のデータ構成を概念的に例示する図である。 ブラウザ200のブックマーク記憶部206に登録された複数のブックマークに関するブックマーク情報のうち、ブックマーク6のデータ構成を概念的に例示する図である。 本発明の模範的な第2の実施形態における関連ブックマークの一覧画面の表示態様を例示する図である。 本発明の模範的な第3の実施形態に係るブックマーク抽出システムを含む通信環境を例示する構成図である。 本発明の模範的な第3の実施形態に係るブックマーク抽出システム100Aによるブックマーク抽出処理を示すフローチャートである。 本発明の模範的な第3の実施形態における関連性判断処理を示すフローチャートである。 本発明の模範的な第4の実施形態における関連性判断処理を示すフローチャートである。 本発明の模範的な第4の実施形態における関連ブックマークの一覧画面の表示態様を例示する図である。 本発明の模範的な第1乃至第4の実施形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示的に説明する図である。
次に、本発明を実施する形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本発明の模範的な第1の実施形態に係るブックマーク抽出装置の構成を示すブロック図である。図1に示すブックマーク抽出装置1は、キーワード抽出部3と、関連ブックマーク提示部5とを有する。
即ち、キーワード抽出部3は、Webサイト(Webページ)の現在までの閲覧履歴情報2に基づいて、キーワードを抽出する。ここで、閲覧履歴情報2は、現在閲覧されているWebサイトに関する情報を含む。
関連ブックマーク提示部5は、登録されている複数のブックマークに関する情報(ブックマーク情報)4の中から、キーワード抽出部3によって抽出されたキーワードに基づいて、そのキーワードに関連するブックマークを選択し、選択したブックマークをユーザに提示する。ここで、閲覧履歴情報2やブックマーク情報4は、例えば、図1には不図示のWebブラウザ(Web閲覧装置)から入手してもよい。また、当該選択したブックマークの提示は、例えば、ディスプレイ(不図示)への表示が想定されるが表示には限定されない。
以上説明した第1の実施形態によれば、現在閲覧されているWebサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示することができる。即ち、本実施形態に係るブックマーク抽出装置1のキーワード抽出部3は、現在閲覧中のWebサイトを含むところの、現在までのWebサイトの閲覧履歴情報2に基づいて、キーワードを抽出する。そして、係るブックマーク抽出装置1は、抽出したキーワードを参照することにより、そのキーワードに関連するブックマークを選択し、選択したブックマークをユーザに提示する。これにより、登録されているブックマークが多数有ることに起因してユーザが個々のブックマークを覚えていない場合、或いは、カテゴリ別に分類して登録したためにどのカテゴリに登録したか忘れてしまった場合であっても、ブックマーク抽出装置1は、現在閲覧されているWebサイトに関連する最適なブックマークをユーザに提示できる。
<第2の実施形態>
次に、上述した第1の実施形態を基本とする第2の実施形態について、図面を参照して詳細に説明する。図2は、本発明の模範的な第2の実施形態に係るブックマーク抽出システムを含む通信環境を例示する構成図である。図2に示す通信環境は、大別して、ブックマーク抽出システム100、ブラウザ200、ネットワーク300、及びWebサイト400によって構成されている。
ブックマーク抽出システム100と、Webサイト400とは、インターネット等の通信ネットワーク(以下、単に「ネットワーク」と称する)300を介して通信可能である。本実施形態において、Webサイト400は、ブラウザ200に予め登録されているブックマークのリンク先であるとする。図2において、ブックマーク抽出システム100とブラウザ200とは、例えば図17に示す1台の情報処理装置(コンピュータ)において実行されるソフトウェア・プログラムの構成と捉えることができる(詳細は図17を参照して後述する)。但し、ブックマーク抽出システム100とブラウザ200とは、相互に通信可能な、物理的、或いは仮想的に別体の情報処理装置において個別に実現されてもよい。
(ブックマーク抽出システム100)
ブックマーク抽出システム100は、閲覧履歴取得部102、閲覧履歴解析部104、検索サイト情報記憶部106、閲覧コンテンツ取得部108、閲覧コンテンツ解析部110、ブックマーク情報取得部112、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、ブックマークコンテンツ関連性判断部118、及び関連ブックマーク表示部120を有する。ブックマーク抽出システム100は、上述した第1の実施形態におけるブックマーク抽出装置1に対応する。
即ち、ブックマーク抽出システム100において、閲覧履歴取得部102は、Webサイトの閲覧履歴(第1の実施形態におけるWebサイトの閲覧履歴情報2に相当)をブラウザ200から取得する。検索サイト情報記憶部106は、図7に例示する検索サイト情報50の如く、検索サイトのURLと、その検索サイトにおける検索ワードの抽出方法とを保持する。閲覧履歴解析部104は、閲覧履歴取得部102から入手した閲覧履歴を、検索サイト情報記憶部106から入手した検索サイト情報に基づいて解析することにより、検索に際して利用されたキーワードを抽出する。閲覧コンテンツ取得部108は、ブラウザ200にて閲覧されているWebサイトのコンテンツをブラウザ200から取得する。閲覧コンテンツ解析部110は、閲覧コンテンツ取得部108を介してブラウザ200から入手した当該Webサイトのコンテンツを解析することにより、当該Webサイトに関するキーワードを抽出する。ブックマーク情報取得部112は、ブラウザ200に登録されているブックマーク情報をブラウザ200から取得する。
また、ブックマーク抽出システム100において、ブックマーク属性関連性判断部114は、ブックマーク情報取得部112を介して取得したブックマークの属性ATと、閲覧履歴解析部104または閲覧コンテンツ解析部110によって抽出されたキーワードとの関連性を判断する。ここで、「ブックマークの属性AT」とは、ブックマークとして登録されているWebサイトのタイトルやURL、フォルダのパス等の、当該ブックマークに関する文字列等を含む詳細情報である(以下、同様)。ブックマークコンテンツ取得部116は、ブックマーク情報取得部112を介して取得したブックマークが表すWebサイト400(リンク先URL)のコンテンツを、ネットワーク300を介して、そのWebサイト400から取得する。ブックマークコンテンツ関連性判断部118は、ブックマークコンテンツ取得部116を介して取得したコンテンツを対象として、閲覧履歴解析部104または閲覧コンテンツ解析部110によって抽出されたキーワードとの関連性を判断する。そして、関連ブックマーク表示部120は、ブックマーク属性関連性判断部114及びブックマークコンテンツ関連性判断部118によって関連性があると判断されたブックマーク(関連ブックマーク)を、例えばブラウザ200が表示された画面内において一覧表示することにより、ユーザに提示する。
(ブラウザ200)
ブラウザ200は、Webサイト400を含む各種Webサイトのコンテンツを、ユーザが閲覧可能に表示する機能を有する。このブラウザ200は、閲覧履歴記憶部202、閲覧コンテンツ記憶部204、及びブックマーク記憶部206を有する。
即ち、閲覧履歴記憶部202は、ユーザが閲覧したWebサイトに関して、そのWebサイトのURL等の閲覧履歴(閲覧履歴情報)を保持する。閲覧コンテンツ記憶部204は、ユーザが現在閲覧しているWebサイトのコンテンツを保持する。ブックマーク記憶部206は、ユーザが登録した所望のWebサイトのブックマークに関する情報(ブックマーク情報:第1の実施形態におけるブックマーク情報4に相当)を保持する(図10A〜図10F参照)。そして、ブックマーク記憶部206は、ブックマーク情報として、登録されているブックマークを表す名称(タイトル)と、そのブックマークに対応するWebサイトのURLと、属性情報とを保持する。尚、ブックマーク記憶部206は、更に、登録されているブックマークに関するタグやキーワード等の付加情報を保持してもよい。
(動作の説明)
次に、上述した構成を備える本実施形態の動作について詳細に説明する。
図3は、本発明の模範的な第2の実施形態に係るブックマーク抽出システム100によるブックマーク抽出処理を示すフローチャートである。本実施形態に係るブックマーク抽出システム100は、ユーザがブラウザ200を利用して所望のWebページにアクセスするのに応じて動作を開始する。即ち、本実施形態に係るブックマーク抽出処理は、ブラウザ200におけるWebページへのアクセスが検出されるのに応じて開始される。
Webページへのアクセスが検出されると、閲覧履歴取得部102は、ブラウザ200の閲覧履歴記憶部202から、閲覧履歴を取得する(ステップS102)。次に、閲覧履歴解析部104は、ステップS102にて取得した閲覧履歴を解析する(ステップS104)。そして閲覧履歴解析部104は、解析結果に基づいて、ブラウザ200にて現在閲覧されているWebページが、検索サイトにて表示された検索結果を示すページから直接移動(遷移、到達)したページであるか否かを判断する(ステップS105)。
ステップS105における判断の結果、現在閲覧されている当該Webページが検索サイトからの移動ではない場合、閲覧コンテンツ取得部108は、当該Webページのコンテンツに基づくキーワードの抽出処理(第1の検索処理)を行う(ステップS106)。即ち、閲覧コンテンツ取得部108は、ステップS106において、ブラウザ200の閲覧コンテンツ記憶部204から、ユーザが現在閲覧している当該Webページのコンテンツを取得する。そして、閲覧コンテンツ解析部110は、ステップS106にて取得したコンテンツを解析することにより、当該Webページのコンテンツに含まれる重要単語を、キーワードとして抽出する(ステップS108)。重要単語の抽出処理において、ある単語が重要単語であるか否かは、例えば、当該Webページにおける当該単語の出現頻度(使用回数)に基づいて行ってもよい(尚、その他の方法であっても良い。以下同様)。
一方、当該Webページが検索サイトからの移動である場合、閲覧履歴解析部104は、閲覧履歴に基づくキーワードの抽出処理(第2の検索処理)を行う(ステップS110)。
尚、閲覧履歴解析部104による閲覧履歴の解析処理(ステップS102,ステップS104,ステップS105)及び閲覧履歴に基づくキーワードの抽出処理(ステップS110)については、図4を参照して後述する。
そして、上記何れかのキーワード抽出処理によって得られたキーワードを用いて、ステップS112及びステップS114において、そのキーワードに関連するブックマークを抽出する。即ち、ブックマーク情報取得部112は、ブラウザ200のブックマーク記憶部206から、同ブラウザに登録されているブックマークに関する情報(ブックマーク情報)を取得する(ステップS112)。次に、ステップS114において、当該キーワードと、ブックマーク情報との関連性の判断処理が行われる。この判断処理は、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、及びブックマークコンテンツ関連性判断部118によって実現される(詳細は図5を参照して後述する)。
ステップS114にて関連性の判断が完了した後、関連ブックマーク表示部120は、関連するブックマークの一覧を、例えば図11に示す表示態様によりユーザに提示する(ステップS116)。
図11は、本発明の模範的な第2の実施形態における関連ブックマークの一覧画面の表示態様を例示する図である。図11に示す例は、ブラウザ200の機能によって現在表示されているWebページの左側フレーム内に、そのWebページに関連するブックマークの一覧が表示された状態を示している。
ここで、閲覧履歴解析部104の動作について図4を参照して説明する。図4は、第2の実施形態に係るブックマーク抽出処理のうち、図3に示すステップS102,ステップS104,ステップS105,ステップS110における処理の詳細を示すフローチャートである。
閲覧履歴解析部104は、まず、ブラウザ200の閲覧履歴記憶部202に記憶されている閲覧履歴情報の中から、ユーザが現在閲覧しているWebページに辿り着くまでの履歴(当該Webページに対応する履歴)を表す履歴情報を取得する(ステップS202)。
次に、閲覧履歴解析部104は、ステップS202にて取得した履歴情報を参照することにより、現在閲覧されているWebページが検索サイトであるか否かを判断する(ステップS204)。ここで、ステップS204における検索サイトであるか否かの判断は、例えば、予め記憶している検索サイトのURLとのパターンマッチング等の処理等、現在では一般的な手順を採用することができる。係る手順の具体例については、図5を参照して後述する。
閲覧履歴解析部104は、現在閲覧されているWebページが検索サイトであると判断した場合、その検索サイトにユーザが入力した検索ワードを抽出する(ステップS210)。一方、閲覧履歴解析部104は、現在閲覧されているWebページが検索サイトではないと判断した場合、ステップS202にて取得した閲覧情報の中から、現在閲覧中のWebページの一つ前に閲覧されたWebページに関する履歴情報を取得する(ステップS206)。そして、閲覧履歴解析部104は、ステップS206にて取得した履歴情報を参照することにより、当該一つ前に閲覧されたWebページが検索サイトであるか否かを判断する(ステップS208)。ステップS208における判断処理においても、上述したステップS204と同様な一般的な処理手順を採用することができる。
図5は、第2の実施形態に係る履歴一件に対する検索サイトか否かの判断処理と、検索ワードの抽出処理とを示すフローチャートであり、上述した図4に示す一連の処理のうち一部(ステップS204〜ステップS210)をより詳細に示す。
閲覧履歴解析部104は、図4に示すステップS202にて取得した履歴情報に含まれるURLを取得する(ステップS212)。次に、閲覧履歴解析部104は、検索サイト情報記憶部106から、検索サイト情報を一件取得する(ステップS214)。
閲覧履歴解析部104は、現在閲覧されているWebページの一つ前に閲覧されたWebページを対象として、URLの先頭がステップS214にて取得した検索サイト情報が表す検索サイトのURLと一致するか判断する(ステップS216)。
ステップS216の判断にて検索サイトに一致すると判断した場合、閲覧履歴解析部104は、該当する検索サイトの検索ワード取得方法に従って検索ワードを取得する(ステップS220)。一方、検索サイトに一致しないと判断した場合、閲覧履歴解析部104は、検索サイト情報記憶部106に記憶されている検索サイト情報の中に、未検証の検索サイトがまだ残っているかを判断する(ステップS218)。この判断で未検証の検索サイトがある場合、処理はステップS214に戻される。一方、未検証の検索サイトがないと判断された場合、閲覧履歴解析部104は、本処理を終了する。
尚、検索サイト情報記憶部106に保持する検索サイトの情報は、検索サイトの実装に依存するため、定期的な更新が必要である。係る更新は、本システム配布者の定期的な情報配信による自動修正や、検索サイト情報の共有化、ユーザの手による手動修正などが考えられる。
次に、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、ブックマークコンテンツ関連性判断部118を組み合わせた関連性判断処理の詳細について、図6を参照して説明する。
図6は、本発明の模範的な第2の実施形態における関連性判断処理を示すフローチャートであり、上述した図3に示すステップS114の詳細を示す。
まず、ブックマーク属性関連性判断部114は、ステップS112(図3)にてブックマーク情報取得部112によって取得されたブックマーク情報を参照することにより、ブックマークの属性AT内に含まれる文字列を対象とするキーワードの検索を行う(ステップS302)。ここで、本ステップにて検索されるキーワードは、前述したWebページのコンテンツに基づくキーワードの抽出処理(第1の検索処理:図3のステップS106)、或いは、閲覧履歴に基づくキーワードの抽出処理(第2の検索処理:図3のステップS110、図4、図5)にて抽出されたキーワードである。
ステップS302における検索の結果、全てのキーワードがブックマークの属性AT内に存在した場合、ブックマークコンテンツ取得部116は、該当するブックマークのリンク先である特定のWebサイト400にアクセスする(ステップS308)。これにより、ブックマークコンテンツ取得部116は、特定のWebサイト400のコンテンツを、ネットワーク300を介して取得する。
ステップS308にてコンテンツが取得できた場合、ブックマークコンテンツ関連性判断部118は、当該ブックマークがユーザによって登録されたときからのコンテンツの変化を鑑みて、ブックマークコンテンツ取得部116が取得したコンテンツの文字列において当該キーワードを検索する(ステップS309)。
ステップS309における検索の結果、当該キーワードが一つ以上含まれる場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が有ると判断する(ステップS312)。これに対して、当該キーワードが一切含まれない場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400と、現在閲覧されているWebサイトとの関連性は無いと判断する(ステップS310)。尚、当該ブックマークに対応する特定のWebサイト400がリンク切れの場合、処理はステップS310に進められる。この場合も、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400と、現在閲覧されているWebサイトとの関連性は無いと判断する。
一方、ステップS302における検索の結果、当該キーワードの一部もしくは全てがブックマークの属性AT内に存在しない場合も、ステップS308と同様に、ブックマークコンテンツ取得部116は、ネットワーク300を介して、当該ブックマークのリンク先であるWebサイト400にアクセスすることによってコンテンツを取得する(ステップS304)。そして、ブックマークコンテンツ関連性判断部118は、取得したコンテンツに含まれる文字列において、ブックマークの属性AT内に含まれなかったキーワードを検索する(ステップS306)。尚、このときの処理の負荷を軽くするために、コンテンツの取得からキーワードの検索までの処理は、ネットワーク300経由で検索サイトを利用して実施することも可能である。
ステップS306における検索の結果、ステップS304にて取得したコンテンツ内に、ブックマークの属性AT内に含まれなかった全てのキーワードを含むと判断した場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が有ると判断する(ステップS312)。
一方、当該取得したコンテンツ内に、ブックマークの属性AT内に含まれなかったキーワードのうち一部もしくは全てを含まない場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400と、現在閲覧されているWebサイトとの関連性は無いと判断する(ステップS310)。
(実施例)
次に、具体的な実施例を用いて、上述した一連の処理の全体像を説明する。はじめに、本説明における前提条件を述べる。
図8は、本発明の模範的な第2の実施形態の実施例における、ユーザによるWeb閲覧に際しての画面遷移を例示的に説明する図である。また、図9は、図8に例示する画面遷移の場合におけるブックマーク抽出システムの動作を概念的に説明する図である。
即ち、図8(a)に例示するパターン1は、例えば自分のブログにて所望のWebサイトのURLを直接入力することにより、現在閲覧中のWebサイトに到達した場合を示している。一方、図8(b)に例示するパターン2は、検索サイトにて所望のキーワードを入力することによって当該キーワードに関する検索結果を得て、更に検索結果の中から所望のWebサイトに遷移したことにより、当該所望のWebサイトを現在閲覧している場合を示している。
尚、図8及び図9において、「Internet Explorer」、「Media Player」、「Office」、「Windows」は、登録商標である(以下同様)。
検索サイト情報記憶部106から入手する検索サイト情報は、図7に概念的に例示する情報を参照することとする。そして、ユーザは、図10A乃至図10Fに概念的に例示するブックマーク(ブックマーク1乃至6)を以前登録していた。但しこのユーザは、その他にも大量のブックマークを登録したことによって、これらブックマーク1乃至6を見つけることができなくなっているとする。或いは、これらのブックマークを登録したこと自体忘れてしまったため、ユーザ単独の操作によっては、これらのブックマークに容易には到達できなくなっているとする。
図10A乃至図10Fに例示するブックマーク情報の例において、フォルダのパスを参照すると、ユーザは、殆どのブックマークに関して、MicroSoft(登録商標)フォルダ内に、ソフトウェアごとに関連するブックマークを整理している。但し、ブックマーク6(図10F)だけは、この整理手順に従っていない。この理由としては、例えば、ブックマークの整理法を、ブックマーク6の登録のときに変更した場合、或いは一時的に登録する場所を変更した場合等が想定される。
上記のような前提条件において、一般的な技術の場合、ユーザがブックマーク6に到達するためには、まず、ブックマーク6を登録したことを当該ユーザ自身が覚えていることが必須である。更に、ユーザは、ブックマークに関する以前の整理法を覚えていており、その整理法に基づいてブックマーク6を探すか、検索によって調査するしかない。但し、一般的なブックマークの検索機能を利用する場合、使用するキーワードが、パターン1(図8(a))やパターン2(図8(b))に例示するページ遷移の過程において、ユーザが知りたいことに関連する「Office」や「Windows」なる単語(但し、Office、Windowsは登録商標)である場合、ブックマーク6に到達することができない。
このような一般的な技術に対して、本実施形態において上述した技術によれば、係る前提条件の如く多数のブックマークの中に埋もれてしまったブックマークの有効活用をユーザに促すことができる。
以下、図8(a)及び(b)に例示する画面遷移に対応するブックマーク抽出システム100の動作について、図9(a)及び(b)を参照して説明する。
はじめに、図9(a)に例示するパターン1における実施例を説明する。パターン1は、「閲覧中のWebページ」に、検索サイトを経由せずに、例えば「自分のブログ」ページから到達した場合を示す。このパターン1の例では、ユーザが現在閲覧しているWebページが、情報技術関係のコラムが記載されたWebページであるとする。このWebページをユーザが以前に閲覧した時点において、当該Webページには、OS(Operation System)の比較特集が掲載されていたとする。そして、今回閲覧した現時点において、当該Webページには、ショートカットキーに関する特集が掲載されているとする。
この場合、ブックマーク抽出システム100において、閲覧履歴取得部102は、閲覧履歴記憶部202から閲覧履歴を取得する(図3のステップS102)。次に、閲覧履歴解析部104は、取得した閲覧履歴を解析することにより、現在閲覧中のWebサイトが、検索サイトにおける検索結果のページから直接遷移(到達)したページかどうかを判断する(図3のステップS104)。係るパターン1において、現在閲覧中のWebサイトへの遷移は、検索サイトを経由していない。このため、閲覧コンテンツ取得部108は、キーワードの抽出処理として、ブラウザ200の閲覧コンテンツ記憶部204から、閲覧中のコンテンツを取得する(図3のステップS106)。
次に、閲覧コンテンツ解析部110は、取得したコンテンツを解析することによって、当該「閲覧中のWebページ」における重要単語を、キーワードとして抽出する(図3のステップS108)。図9(a)に示すパターン1の場合、このキーワードとして「Windows」及び「ショートカットキー」が得られるとする。
そして、ブックマーク情報取得部112は、既に登録されている複数のブックマークの中から当該キーワードに関連するブックマークを抽出するため、ブラウザ200のブックマーク記憶部206から、ブックマーク情報を取得する(図3のステップS112)。この場合は、図10A乃至図10Fに例示するブックマーク1乃至6が得られる。更に、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、及びブックマークコンテンツ関連性判断部118を組み合わせて利用することによって、これらブックマークと、当該キーワードとの関連性が判断される(図3のステップS114、図6)。これにより、本実施例では、当該キーワードに関連するブックマーク(関連ブックマーク)として、ブックマーク1乃至6の中から、ブックマーク1、3、5、6が選択される。関連ブックマーク表示部120は、係る関連ブックマークの一覧を、例えば図11に示す表示態様でユーザに提示する(図3のステップS116)。
ここで、係るパターン1の場合における閲覧履歴の解析処理と、関連性の判断処理とについて具体的な処理の流れについて以下に説明する。
まず、閲覧履歴の解析処理について説明する。パターン1(図9(a))では、上述した通り、閲覧中のWebページのコンテンツに基づいて、キーワードとしての重要単語が抽出される。この過程について説明を加える。
閲覧履歴解析部104は、ステップS102(図3)にて取得された閲覧履歴の中から、現在閲覧中のWebページに到達するまでの履歴を、当該閲覧中のWebページへのアクセス情報として取得する(図4のステップS202)。次に、閲覧履歴解析部104は、当該閲覧中のWebページが検索サイトかどうかを検証する(図4のステップS204)。本実施例の場合、当該閲覧中のWebページは検索サイトではない。このため、閲覧履歴解析部104は、当該閲覧履歴の中から、現在閲覧中のWebページの一つ前に閲覧されたWebページの履歴を取得する(図4のステップS206)。この場合、図9(a)に示す通り、「自身のブログ」へのアクセス情報が得られる。このアクセス情報から、当該一つ前に閲覧されたWebページは検索サイトではないと判断されるので(図4のステップS208にてNO)、閲覧履歴解析部104は、ユーザが現在閲覧中のWebページは、検索サイトを経由して到達したのではないと判断する。
次に、関連性判断処理について説明する。まず、ブックマーク属性関連性判断部114は、ブックマークの属性ATに含まる文字列の中から、係るパターン1にて上記の如く抽出された当該キーワード「Windows」及び「ショートカットキー」を検索する(図6のステップS302)。係るパターン1では、全てのキーワードをブックマークの属性AT内に含むブックマークとして、当該ブックマーク1乃至6の中から、ブックマーク1、2が選ばれる。また、キーワードを一部もしくは全て含まないブックマークとして、当該ブックマーク1乃至6の中から、ブックマーク3、4、5、6が選ばれる。
ブックマーク1、2について、ブックマークコンテンツ取得部116は、ネットワーク300を介してリンク先のWebサイト400にアクセスすることにより、そのWebサイトのコンテンツを取得する(図6のステップS308)。このときコンテンツを取得できなかったブックマーク2(図10B)は、リンク切れである。このため、ブックマークコンテンツ関連性判断部118は、現在閲覧されているWebサイトと、ブックマーク2とは関連性無と判断する(図6のステップS310)。
一方、コンテンツを取得できたブックマーク1について、ブックマークコンテンツ関連性判断部118は、取得したコンテンツに含まれる文字列を対象として、当該キーワード(「Windows ショートカットキー」)を検索する(図6のステップS309)。ブックマーク1は、当該キーワードを含むため、ブックマークコンテンツ関連性判断部118は、現在閲覧されているWebサイトと、ブックマーク1(図10A)とは、関連性有りと判断する(図6のステップS312)。
また、ブックマーク3、4、5、6について、ブックマークコンテンツ取得部116は、ネットワーク300を介してリンク先のWebサイト400にアクセスすることにより、そのWebサイトのコンテンツを取得する(図6のステップS304)。更に、ブックマークコンテンツ関連性判断部118は、取得したコンテンツの文字列を対象として、ブックマークの属性AT内には含まれなかったキーワードを検索する(図6のステップS306)。その結果、ブックマークコンテンツ関連性判断部118は、全てのキーワードを当該コンテンツ内に含むブックマーク3、5、6(図10C,E,F)を関連性有と判断する(図6のステップS312)。一方、ブックマークコンテンツ関連性判断部118は、当該全てのキーワードのうち一部のキーワードしか含まないブックマーク4(図10D)を、関連性無しと判断する(図6のステップS310)。
ここで、あるWebサイトの初回閲覧に際して、ユーザは、そのWebサイトのURLについて利用分類の登録操作を行う傾向がある。一般的な技術の場合、利用分類として重要単語が利用されると仮定すると、「OS 比較」等が利用分類として設定されると考えられる。一方で、本実施例(パターン1)における前提条件として、上述した通り、ユーザが現在閲覧しているWebページは、情報技術関係のコラムが記載されたWebページである。このWebページは、コラムサイトであるため、掲載されるコンテンツが例えば定期的に更新される可能性が高い。従って、パターン1の場合、このWebサイトが初めて閲覧されたときのコンテンツとは異なり、図9(a)に例示する如く、Windowsのショートカットキーについて特集している。あるWebサイトが初めて閲覧されたときのコンテンツ等の情報を基に関連付けが行われる場合、一般的な技術では、上述した通り、例えば「OS 比較」なるキーワードが利用分類として登録される。このため、一般的な技術では、現在のコンテンツに合致したキーワード「Windows ショートカットキー」に関連するブックマークが存在しない。これに対して、本実施例において、ブックマーク抽出システム100は、Webページが閲覧されたときの情報を用いて、そのWebページと登録済みのブックマークとの関連付けが行われる。このため、本実施例によれば、現在閲覧されているWebページのコンテンツに合致したキーワード「Windows ショートカットキー」を用いて、関連ブックマーク1、3、5、6を抽出することができる。即ち、現在閲覧されているウェブサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示することができる。
次に、図9(b)に例示するパターン2における実施例を説明する。パターン2は、検索サイトを経由して「閲覧中のWebページ」に到達した例である。
パターン2の場合も、上述したパターン1と同様に、閲覧履歴の解析が行われ、現在閲覧されているWebページへの移動(遷移)方法が判断される(図3のステップS102〜ステップS105)。但し、パターン2は検索サイトを経由する例であるため、閲覧履歴解析部104は、キーワード抽出処理として、閲覧履歴を基に検索ワード(当該検索サイトにて検索のためにユーザが入力したキーワード)を抽出する(図3のステップS110)。このときパターン2では、キーワードとして「MicroSoft Office ショートカットキー」が得られる。
次に、パターン1の場合と同様に、ブックマーク記憶部206からブックマーク情報が取得され(図3のステップS112)、この場合も、図10A乃至図10Fに例示するブックマーク1乃至6が得られる。更に、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、及びブックマークコンテンツ関連性判断部118を組み合わせて利用することにより、ブックマークとキーワードの関連性が判断される(図3のステップS114)。これにより、当該キーワードに関する関連ブックマークとして、ブックマーク1乃至6の中から、ブックマーク3、4、6(図10C,D,F)が選択される。関連ブックマーク表示部120は、係る関連ブックマークの一覧を、例えば図11に示す表示態様でユーザに提示する(図3のステップS116)。
ここで、係るパターン2(図9(b))の場合における閲覧履歴の解析処理と、関連性の判断処理とについて、ブックマーク抽出システム100が行う具体的な処理の流れについて以下に説明する。
まず閲覧履歴解析部104の処理(図4)について説明する。パターン2(図9(b))では、上述した通り、検索サイトにおける検索ワードがキーワードとして抽出される。パターン2の場合、閲覧履歴の解析処理において、閲覧履歴解析部104は、現在閲覧中のWebページが検索サイトではないとステップS204にて判断した後、閲覧履歴の中から、当該閲覧中のWebページの一つ前に閲覧されたWebページに関する履歴情報を取得する(ステップS206)。図9(b)に示す例の場合、ステップS206では、検索サイトの「検索結果」画面に関するアクセス情報が取得される。パターン2では、ステップS208において、ステップS206にて取得されたアクセス情報と、予め記憶している検索サイトとが一致する(ここでは、図7に示す検索サイト情報における検索サイトID1に該当すると仮定する)。このため、ステップS210では、検索ワードが行われる。検索ワードの抽出は、例えば、図7に示す検索サイト情報に含まれる「検索ワード抽出方法」に基づいて行われる。この場合、閲覧履歴解析部104は、履歴情報の中から「検索結果」に対応するURLを取得し、そのURLのクエリ文字列から、検索ワードとして値qを取得する。図7に示す「検索ワード抽出方法」において、検索ワードとして複数のワードが入っている場合は「+」なる記号によって連結される。この「+」なる記号は、検索ワードが繋がっている状態、つまり、「key1+key2」という文字列があれば、文字列を分割して「key1」と「key2」とを得ることを表す。即ち、ステップS210では、値qを用いて文字列を分割することにより、求めるべき検索ワード群(複数の検索ワード)を得る。図9(b)に示す例の場合は、検索ワードとして、「MicroSoft Office ショートカットキー」が得られる。求められた検索ワードは、ブックマークのコンテンツ検索(図6のステップS306,ステップS309)に際してキーワードとして利用される。このように、本実施例によれば、ユーザが知りたい事項により合致したキーワードを抽出することができる。これに対して、一般的な技術の場合、検索サイトを経由して現在閲覧中のWebサイトに辿り着いた場合(図7(b)に示すパターン2)は、当該閲覧中のWebサイトのコンテンツの中から、重要(使用頻度が高い)な単語である「Windows ショートカットキー」がキーワードとして抽出されることが予想される。このため、一般的な技術の場合は、ユーザが知りたい事項と関連が無いブックマークが抽出される可能性があるため、利便性を欠く。
次に、図9(b)に示すパターン2を例に関連性判断処理について説明する。まず、ブックマーク属性関連性判断部114は、ブックマークの属性AT内に含まれる文字列を対象として、当該キーワード「MicroSoft Office ショートカットキー」を検索する(図6のステップS302)。この場合、当該全てのキーワードを、ブックマークの属性AT内に含むブックマークとして、ブックマーク4が選択される。また、当該キーワードを一部もしくは全て含まないブックマークとして、ブックマーク1、2、3、5、6が選択される。
ブックマークコンテンツ取得部116は、ブックマーク4(図10D)について、リンク先である特定のWebサイト400にネットワーク300を介してアクセスすることにより、その特定のWebサイトのコンテンツを取得する(図6のステップS308)。そして、コンテンツを取得できた場合、ブックマークコンテンツ関連性判断部118は、そのコンテンツ内の文字列を対象として、当該キーワードを検索する(図6のステップS309)。この場合、ブックマーク4は、当該キーワードを含むため、ブックマークコンテンツ関連性判断部118は、ブックマーク4と閲覧中のWebサイトとが関連性有りと判断する(図6のステップS312)。
また、ブックマークコンテンツ取得部116は、ブックマーク1、2、3、5、6について、リンク先である特定のWebサイト400にネットワーク300を介してアクセスすることにより、その特定のWebサイトのコンテンツを取得する(図6のステップS304)。更に、ブックマークコンテンツ関連性判断部118は、取得したコンテンツ内の文字列を対象として、ブックマークの属性AT内には含まれていなかったキーワードを検索する(図6のステップS306)。そしてこの場合、ブックマーク3(図10C)は、当該全てのキーワードをコンテンツ内に含むため、ブックマークコンテンツ関連性判断部118は、ブックマーク3及び6と、閲覧中のWebサイトとが関連性有りと判断する(図6のステップS312)。一方、ブックマーク1、2、5(図10A,B,E)は、当該全てのキーワードのうち一部または全てをコンテンツ内に含まない。従ってブックマークコンテンツ関連性判断部118は、ブックマーク1、2、5と、閲覧中のWebサイトとが関連性が無いと判断する(図6のステップS310)。
先に説明した閲覧履歴解析部104の処理の場合と同様に、一般的な技術では、パターン2の場合、現在閲覧中のWebサイトに基づいて、キーワードとして「Windows」及び「ショートカットキー」が抽出され、それに基づきブックマーク1、3、5、6が抽出されてしまうことが予想される。この場合、閲覧中のWebサイトにおいてユーザが本来知りたかった事項、即ち、「MicroSoft Office ショートカットキー」に関連があるブックマークが欠落してしまう。これに対して、本実施例によれば、ユーザが知りたい事項により合致したブックマークとして、「MicroSoft Office ショートカットキー」に関連するブックマーク3、4、6(図10C,D,F)をユーザに提示することができる。
このように、上述した第2の実施形態及びその実施例において、ブックマーク抽出システム100は、ユーザがブラウザ200を利用して現在閲覧しているWebサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示することができる。
即ち、一般に、以前検索等により発見してブックマークとして登録したものの、大量のブックマークを登録してしまったために結果として、所望のブックマークを見つけることができなくなってしまうことがある。或いは、ユーザは、あるブックマークを登録したこと自体忘れてしまったことにより、活用できなくなってしまうことがある。このような状況に対して、上述した第2の実施形態及びその実施例によれば、上述したパターン1、パターン2共に、あるWebページを閲覧したときに、そのWebページに関連するブックマークをユーザに提示することができる。よって、ユーザは、知りたい事項が掲載されたWebページにより早く到達することができる。その理由は、ブックマーク属性関連性判断部114やブックマークコンテンツ関連性判断部118等の機能により、ユーザが現在閲覧しているWebページに関連するブックマークを的確に抽出できるからである。
また、上述した第2の実施形態及びその実施例によれば、閲覧中のWebサイトを参照したユーザの意図をより正確に反映したブックマークを抽出できる。具体的に述べると、パターン2(図8(b))の場合、一般的な技術では、閲覧中のWebサイトのコンテンツを使用頻度等により解析した場合、「Windows ショートカットキー」がキーワードとして得られると思われる。但し、パターン2の場合、ユーザは、「Office ショートカットキー」を検索した結果、当該閲覧中のWebサイトに辿り着いている。従ってこの場合、ユーザは、検索サイトに入力した検索ワードに関連する情報を欲していると考えられる。上述した第2の実施形態及びその実施例(図9(b))によれば、この検索ワードを利用してブックマークの抽出を行うことができるので、よりユーザの希望に合ったブックマークを抽出することができる。また、ユーザが以前登録したブックマークを忘れてしまい、再度検索サイトにて同様の目的で検索をした場合に、その以前登録したブックマークをユーザに提示することができる。その理由は、閲覧履歴解析部104において、閲覧中のWebサイトをユーザがどういう方法で参照したのかどうか閲覧履歴を解析するからである。
また、上述した第2の実施形態及びその実施例によれば、ユーザが閲覧中のWebページにアクセスした時点における当該Webページのコンテンツに関連したブックマークを抽出することができる。これにより、当該Webページにユーザが前回アクセスときからのコンテンツの変化に対応し、より現状に即したブックマークを抽出することができる。その理由は、登録されているブックマークにリンクされているWebページに関して、現在閲覧されているWebページの閲覧時点におけるコンテンツが閲覧コンテンツ解析部110によって解析されることにより、関連性の検証が行われるからである。
また、上述した第2の実施形態及びその実施例によれば、閲覧中のWebページにアクセスした時点におけるブックマークのコンテンツに即してブックマークを抽出することができる。これにより、ブックマークの属性ATに含まれる情報だけによっては発見できない関連ブックマークの抽出、或いはリンク切れを起こしているブックマークを、関連ブックマークから除外することができる。その理由は、関連性判断処理において、ブックマークコンテンツ関連性判断部118により、属性情報のみではなく、ブックマークのリンク先のコンテンツと、キーワードとの関連性をも組み合わせて判断できるからである。
<第3の実施形態>
次に、上述した第1及び第2の実施形態を基本とする第3の実施形態について説明する。以下の説明においては、本実施形態に係る特徴的な部分を中心に説明する。その際、上述した実施形態と同様な構成については、同一の参照番号を付すことにより、重複する説明は省略する。
図12は、本発明の模範的な第3の実施形態に係るブックマーク抽出システムを含む通信環境を例示する構成図である。図12に示す通信環境は、大別して、ブックマーク抽出システム100A、ブラウザ200、ネットワーク300、及びWebサイト400によって構成されている。ブックマーク抽出システム100Aは、図2に示した第2の実施形態におけるブックマーク抽出システム100の構成に加えて、関連ブックマークキャッシュ操作部122、関連ブックマークキャッシュ記憶部124、及び共通キーワード関連性判断部126を更に備える。ブックマーク抽出システム100Aは、上述した第1の実施形態におけるブックマーク抽出装置1に対応する。
本実施形態において、関連ブックマークキャッシュ記憶部124と関連ブックマークキャッシュ操作部122とは、主に、関連ブックマークを抽出する際の負荷を軽減するために設けられている。即ち、関連ブックマークキャッシュ記憶部124と関連ブックマークキャッシュ操作部122とは、本実施形態において、各種データのキャッシュ機能を実現する。
関連ブックマークキャッシュ記憶部124は、ユーザがブラウザ200を利用して現在までに閲覧したWebページ(即ち、閲覧中のWebページをを含む)に関して、データキャッシュ(キャッシュ)を保持する。このキャッシュは、例えば以下の複数項目のデータを含み、これらが関連付けた対応情報である。
・ユーザがブラウザ200を利用して現在までに閲覧したWebページ(即ち、閲覧中のWebページを含む)のURL、
・当該Webページから抽出されたキーワード、
・当該Webページに関する関連ブックマークの識別情報(ID)、
・当該各Webページへの最終アクセス時刻。
ここで、当該抽出されたキーワードとは、上述した第2の実施形態における第1または第2の検索処理によって抽出されたキーワードである。また、関連ブックマークとは、第2の実施形態においてブックマーク属性関連性判断部114およびブックマークコンテンツ関連性判断部118によって関連性があると判断されたブックマークである。
係るキャッシュ機能により保持される情報のライフタイムは、例えば、ブラウザ200の動作が完了するまで(ブラウザ機能の利用が終了するまで)、或いは、本システムの電源オフのときまでとする。これは、Webページやブックマークのコンテンツの変化に対応するためである。共通キーワード関連性判断部126は、抽出された共通キーワードの関連性を判断する。
(動作の説明)
次に、上述した構成を備える本実施形態の動作について詳細に説明する。
図13は、本発明の模範的な第3の実施形態に係るブックマーク抽出システム100Aによるブックマーク抽出処理を示すフローチャートである。ブックマーク抽出システム100Aは、第2の実施形態と同様に、ユーザがブラウザ200を利用して所望のWebページにアクセスするのに応じて動作を開始する。
まず、関連ブックマークキャッシュ操作部122は、関連ブックマークキャッシュ記憶部124を参照することにより、最終アクセス時刻(日時)が最も現在に近い数件のキャッシュを取得する(ステップS402)。次に、共通キーワード関連性判断部126は、ステップS402にて取得したキャッシュを対象として、そのキャッシュの中に共通して出現するキーワードを、当該数件のキャッシュに関する共通キーワードとして抽出する(ステップS406)。そして、関連ブックマークキャッシュ操作部122は、関連ブックマークキャッシュ記憶部124を参照することにより、ユーザが現在閲覧しているWebページのURLに対応するキャッシュを取得する(ステップS408)。
関連ブックマークキャッシュ操作部122は、ステップS408にてキャッシュの取得を試みた結果、閲覧中のWebページに対応するキャッシュが存在したか否かを判断する(ステップS410)。ここで、キャッシュが存在する場合とは、関連ブックマークキャッシュ記憶部124に格納されている過去に閲覧したWebページのURLの中に、現在閲覧しているWebページのURLと一致するURLが有るか否かを探索し、一致するURLが検出できた場合を表す。
キャッシュが存在すると判断された場合(ステップS410にてYES)、共通キーワード関連性判断部126は、関連ブックマークキャッシュ記憶部124から取得した全ての関連ブックマークの識別情報をキーとして、ブックマーク情報取得部112から、当該全ての関連ブックマークに関する属性情報(AT)を取得する。また、共通キーワード関連性判断部126は、ブックマークコンテンツ取得部116を介して、当該全ての関連ブックマークのリンク先であるWebページから、当該Webページのコンテンツを取得する。そして、共通キーワード関連性判断部126は、取得した関連ブックマークの属性AT及びコンテンツを対象として、共通キーワードの出現回数を計測し、計測した値を保持し(ステップS428)、処理をステップS430に進める。ここで、ステップS428にて関連ブックマークキャッシュ記憶部124から取得した全てのブックマークとは、現在時刻に近い数件のWebページ(URL)に関連して取得した関連ブックマークの全てを表す。
一方、キャッシュが存在しないと判断された場合(ステップS410にてNO)、ステップS412からステップS426において、第2の実施形態にて上述したステップS102からステップS114(図3)までの処理と略同様な処理が行われる。但し、ステップS426における処理は、図14を参照して後述するようにステップS114と一部異なる。
そして、関連ブックマーク表示部120は、ステップS426にて関連性が有ると判断されたブックマーク、或いはステップS428にて計測対象とした全ブックマークを対象として、共通キーワードの出現回数順に一覧表示する(ステップS430)。例えば、図10A乃至図10Fに示す表示態様の場合に当てはめて説明すると、出現回数の高いブックマークから低いブックマークの順で、ブックマーク1,3,5が表示されていることが判る。
ここで、ステップS426にて行われる関連性判断処理について、図14を参照して説明する。図14は、本発明の模範的な第3の実施形態における関連性判断処理を示すフローチャートであり、上述した図13に示すステップS426の詳細を示す。このフローチャートは、第2の実施形態にて上述した関連性判断処理(図6)と同様な処理構成に加え、ステップS312の後に、更に、ステップS501を有する。即ち、ステップS501において、共通キーワード関連性判断部126は、ステップS312にて関連性有りと判断された全てのブックマークを対象として、ブックマークの属性AT及びコンテンツにおける共通キーワードの出現回数を計測し、計測した値を保持し、処理をステップS430に進める。
上述した第3の実施形態によれば、上述した第2の実施形態と同様に、現在閲覧しているWebサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示することができる。更に、本実施形態によれば、関連ブックマークキャッシュ操作部122と関連ブックマークキャッシュ記憶部124によるキャッシュ機能により、上述した対応情報をキャッシュすることができる。これにより、閲覧履歴や閲覧コンテンツ、ブックマークコンテンツを解析する際の負荷を軽減することができる。
また、上述した第3の実施形態によれば、係るキャッシュ機能により、ブラウザナビゲーションによる「戻る・進む」等の操作に対応することができる。
<第4の実施形態>
次に、上述した第1及び第2の実施形態を基本とする第4の実施形態について説明する。以下の説明においては、本実施形態に係る特徴的な部分を中心に説明する。その際、上述した実施形態と同様な構成については、同一の参照番号を付すことにより、重複する説明は省略する。
本実施形態では、ユーザが現在閲覧しているWebサイトに関連するブックマークをユーザに提示する際に、そのWebサイトへの関連性の高さに応じて、登録済みのブックマークを、ランク分けした表示態様で提示する場合について説明する。
以下の説明において、関連性のランクは、一例として、以下の通り、ランク1(関連性:高)からランク6(関連性:低)までの6つのランクとする。即ち、
・ランク1:ブックマーク属性AT及びコンテンツ共に、全てのキーワードを含む場合、
・ランク2:ブックマーク属性ATが一部の当該キーワードを含み、コンテンツが当該全てのキーワードを含む場合、
・ランク3:ブックマーク属性ATには当該全てのキーワードが含まれず、コンテンツが当該全てのキーワードを含む場合、
・ランク4:ブックマーク属性ATが当該全てのキーワードを含み、コンテンツが一部の当該キーワードを含む場合
・ランク5:ブックマーク属性ATが当該全てのキーワードのうち一部を含み、コンテンツが残りのキーワードを全て含む場合、
・ランク6:ブックマーク属性ATが当該全てのキーワードを含み、コンテンツには何れのキーワードも含まれない場合。
本実施形態におけるシステム構成並びに全体の処理構成は、上述した第2の実施形態と略同様である。但し、以下に説明するように、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、及びブックマークコンテンツ関連性判断部118の組み合わせによって実現される関連性判断処理の構成が異なる。
図15は、本発明の模範的な第4の実施形態における関連性判断処理を示すフローチャートであり、上述した図3に示すステップS114の詳細を示す。
まず、ブックマーク属性関連性判断部114は、第2の実施形態におけるステップS302(図6)と同様に、ステップS112(図3)にてブックマーク情報取得部112によって取得されたブックマーク情報を参照することにより、ブックマークの属性AT内に含まれる文字列を対象とするキーワードの検索を行う(ステップS602)。
ブックマークコンテンツ取得部116は、ステップS602の判断結果に応じて、ステップS604,ステップS612,或いはステップS616の何れかの処理に分岐する。即ち、ステップS604は、ブックマークの属性AT内に一部のキーワードが含まれる場合に実行される。ステップS612は、ブックマーク属性ATに当該全てのキーワードが含まれない場合に実行される。そしてステップS616は、ブックマーク属性ATが当該全てのキーワードが含まれる場合に実行される。
ステップS604,ステップS612,及びステップS616において、ブックマークコンテンツ取得部116は、第2の実施形態におけるステップS304及びステップS308(図6)と同様に、該当するブックマークのリンク先である特定のWebサイト400にアクセスする。これにより、ブックマークコンテンツ取得部116は、特定のWebサイト400のコンテンツを、ネットワーク300を介して取得する。
ステップS616にてコンテンツの取得を試みたがコンテンツを得られない場合、当該特定のWebサイト400はリンク切れであると判断できる。このため、ブックマークコンテンツ関連性判断部118は、当該Webサイトに対応するブックマークは、現在閲覧されているWebサイトには関連性が無いと判断する(ステップS628)。このとき、ブックマークコンテンツ関連性判断部118は、ユーザに対して、リンク切れが発生していることを表示などによって報知してもよい。
一方、ステップS616における処理に応じてコンテンツを得られた場合、ブックマークコンテンツ取得部116は、第2の実施形態におけるステップS309(図6)と同様に、当該ブックマークがユーザによって登録されたときからのコンテンツの変化を鑑みて、取得したコンテンツの文字列において当該キーワードを検索する(ステップS618)。
そして、ブックマークコンテンツ関連性判断部118は、ステップS618の検索結果に応じて、ステップS620,ステップS622,或いはステップS624に分岐する。即ち、ブックマークコンテンツ関連性判断部118は、ステップS616にて取得したコンテンツには何れのキーワードも含まれない場合、ランク6を付与する(ステップS620)。また、ブックマークコンテンツ関連性判断部118は、ステップS616にて取得したコンテンツに一部のキーワードが含まれる場合、ランク4を付与する(ステップS622)。そして、ブックマークコンテンツ関連性判断部118は、ステップS616にて取得したコンテンツに当該全てのキーワードが含まれる場合、ランク1を付与する(ステップS624)。更にこれら3つの場合、ブックマークコンテンツ関連性判断部118は、第2の実施形態におけるステップS312(図6)と同様に、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が有ると判断する(ステップS630)。
また、ステップS604,ステップS612にてコンテンツを取得した後、ブックマークコンテンツ関連性判断部118は、第2の実施形態におけるステップS306(図6)と同様に、取得したコンテンツに含まれる文字列において、ブックマークの属性AT内に含まれなかったキーワードを検索する(ステップS306,ステップS614)。
そして、ステップS614における検索の結果、当該取得したコンテンツが当該全てのキーワードを含む場合、ブックマークコンテンツ関連性判断部118は、ランク3を付与する(ステップS626)。そしてこの場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が有ると判断する(ステップS630)。これに対して、当該取得したコンテンツが当該全てのキーワードを含まない場合、或いは一部のキーワードしか含まない場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が無いと判断する(ステップS628)。
更に、ステップS606における検索の結果、ステップS604にて取得したコンテンツの中に、ブックマーク属性ATに含まれていなかったキーワードの一部しか含まれない場合、或いは全く含まれていない場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が無いと判断する(ステップS628)。
これに対して、ステップS606における検索の結果、ステップS604にて取得したコンテンツの中に、ブックマーク属性ATに含まれていなかった残りのキーワードを全て含む場合、ブックマークコンテンツ関連性判断部118は、ランク5を付与する(ステップS608)。また、ステップS604にて取得したコンテンツの中に、当該全てのキーワードが含まれる場合、ブックマークコンテンツ関連性判断部118は、ランク2を付与する(ステップS610)。そしてこれらの場合、ブックマークコンテンツ関連性判断部118は、当該リンク先である特定のWebサイト400が、現在閲覧されているWebサイトと関連性が有ると判断する(ステップS630)。
図16は、本発明の模範的な第4の実施形態における関連ブックマークの一覧画面の表示態様を例示する図である。図16に示す例は、ブラウザ200の機能によって現在表示されているWebページの左側フレーム内に、そのWebページに関連するブックマークの一覧が表示された状態を示している。この場合、関連するブックマークとして、ランク1からランク3の順で、ブックマーク1,5,3が表示されている。またこの例では、ブックマークが登録されたときのコンテンツから変更されている可能性があるブックマークとして、ブックマーク3が表示されている。そしてこの例では、リンク切れの可能性があるブックマークとして、ブックマーク2が表示されている。
上述した第4の実施形態によれば、第1及び第2の実施形態と同様に、現在閲覧されているウェブサイトに関連する最適なブックマークを、予め登録されているブックマークの中から的確に選択してユーザに提示することができる。更に本実施形態では、関連性判断処理においてランク付けを行うので、閲覧中のWebページにより合致した関連性のあるブックマークを、関連性の程度に従って的確に選択して、ユーザに対して識別容易に提示することができる。
また、上述した第4の実施形態によれば、リンク切れの発生や、ブックマークを登録したときからのコンテンツの変化を、ユーザに識別容易に報知することができる。
<第1乃至第4の実施形態に共通の実施例>
次に、上述した第1乃至第4の実施形態に共通する実施例について、図17を参照して説明する。上述した第1乃至第4の実施形態に係るブックマーク抽出システム100,100A、及びブラウザ200は、コンピュータ(情報処理装置)を利用して実現する場合について説明する。即ち、第1乃至第4の実施形態に係る装置は、専用のハードウェアを利用して実現しても良いが、本実施例の如くコンピュータを利用して実現しても良い。
図17は、本発明の模範的な第1乃至第4の実施形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示的に説明する図である。図17に示したコンピュータ1000のハードウェアは、CPU11(Central Processing Unit)、ディスプレイ12、通信インタフェース(I/F)13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、及びハードディスクドライブ(HD)16を備え、これらがバス17を介して接続された構成を有する。通信インタフェース13は、上述した各実施形態において、図2及び図12に示したWebサイト400との間において、ネットワーク300を介して通信を実現する一般的な通信手段である。係るハードウェア構成において、CPU11は、少なくともブックマーク抽出システム100(100A)としてのコンピュータ1000の全体の動作を司る。
そして、上述した第1乃至第4の実施形態を例に説明した本発明は、その説明において参照したフローチャート(図3乃至図6、図13乃至図15)の機能を実現可能なコンピュータ・プログラムを、図17に示すコンピュータ1000に対して供給した後、そのコンピュータ・プログラムを、コンピュータ1000のCPU11に読み出して実行することによって達成される。また、コンピュータ1000内に供給されたコンピュータ・プログラムは、読み書き可能な一時記憶メモリ(15)またはハードディスク装置(16)等の記憶デバイス(記憶媒体)に格納すれば良い。
ここで、上記各フローチャートに係るコンピュータ・プログラムは、上述した各実施形態の場合、閲覧履歴取得部102、閲覧履歴解析部104、閲覧コンテンツ取得部108、閲覧コンテンツ解析部110、ブックマーク情報取得部112、ブックマーク属性関連性判断部114、ブックマークコンテンツ取得部116、ブックマークコンテンツ関連性判断部118、関連ブックマーク表示部120、関連ブックマークキャッシュ操作部122、共通キーワード関連性判断部126の各機能を表す。そして係るコンピュータ・プログラムは、例えば、ハードディスクドライブ16に格納したプログラム群21に対応する。この場合、ブラウザ200における閲覧履歴記憶部202、閲覧コンテンツ記憶部204、及びブックマーク記憶部206である。また、各種の記憶情報22は、ブックマーク抽出システム100,100Aにおける検索サイト情報記憶部106、及び関連ブックマークキャッシュ記憶部124は、例えば、ハードディスクドライブ16に各種の記憶情報22として格納してもよい。
また、前記の場合において、当該装置内へのコンピュータ・プログラムの供給方法は、CD−ROM等の各種記録媒体を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等のように、現在では一般的な手順を採用することができる。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコード(プログラム群21)或いは係るコードが格納された記憶媒体によって構成される。
尚、上述した実施形態及びその変形例の一部又は全部は、以下の付記のようにも記載されうる。しかしながら、上述した実施形態及びその変形例により例示的に説明した本発明は、以下には限られない。即ち、
(付記1)
ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出するキーワード抽出手段と、
登録されている複数のブックマークの中から、前記抽出手段によって抽出されたキーワードに基づいて、該キーワードに関連するブックマークを提示する提示手段とを備える
ことを特徴とするブックマーク抽出装置。
(付記2)
前記キーワード抽出手段は、
前記閲覧履歴情報のうち、現在閲覧されているウェブサイトに関する情報に基づいて、そのウェブサイトのコンテンツを取得し、そのコンテンツの中から、前記キーワードを抽出する
ことを特徴とする付記1記載のブックマーク抽出装置。
(付記3)
前記キーワード抽出手段は、
前記現在閲覧されているウェブサイトから取得したコンテンツに含まれる重要キーワードを、前記キーワードとして抽出する重要キーワード抽出手段を含み、
前記提示手段は、
前記複数のブックマークの中から、前記重要キーワードに基づいて、該重要キーワードに関連するブックマークを提示する
ことを特徴とする付記2記載のブックマーク抽出装置。
(付記4)
前記重要キーワード抽出手段は、
前記コンテンツ中に出現する頻度に従って、前記重要キーワードを決定する
ことを特徴とする付記3記載のブックマーク抽出装置。
(付記5)
前記キーワード抽出手段は、
前記閲覧履歴情報を解析することにより、検索サイトから現在閲覧されているウェブサイトに遷移したと判断した際、該ウェブサイトに遷移するまでに使用した検索キーワードを、前記キーワードとして抽出し、
前記提示手段は、
前記複数のブックマークの中から、前記検索キーワードに基づいて、該検索キーワードに関連するブックマークを提示する
ことを特徴とする付記1記載のブックマーク抽出装置。
(付記6)
前記キーワード抽出手段は、
前記現在閲覧されているウェブサイトに遷移する1つ前に閲覧されたウェブサイトが検索サイトである場合に、その検索サイトにて使用した検索キーワードを、前記キーワードとして抽出する
ことを特徴とする付記5記載のブックマーク抽出装置。
(付記7)
前記提示手段は、
前記複数のブックマークに関する情報に含まれる個々のブックマークの属性情報の中に、前記キーワードが含まれる程度に応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する関連性判断手段を含む
ことを特徴とする付記1乃至付記6の何れかに記載のブックマーク抽出装置。
(付記8)
前記提示部は、
前記ブックマークにリンクしているウェブサイトのコンテンツの中に、前記キーワードが含まれる程度に応じて、前記キーワードと、前記複数のブックマークに関する情報に含まれる個々のブックマークとの関連性の有無を判断する関連性判断部を含む
ことを特徴とする付記1乃至付記6の何れかに記載のブックマーク抽出装置。
(付記9)
前記提示手段は、
前記複数のブックマークに関する情報に含まれる個々のブックマークの属性情報の中に、前記キーワードが含まれる程度と、前記ブックマークにリンクしているウェブサイトのコンテンツの中に、前記キーワードが含まれる程度との組み合わせに応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する関連性判断手段を含む
ことを特徴とする付記1乃至付記6の何れかに記載のブックマーク抽出装置。
(付記10)
前記提示手段は、
前記関連性判断手段によって関連性があると判断された複数のブックマークをランク分けして提示する
ことを特徴とする付記7乃至付記9の何れかに記載のブックマーク抽出装置。
(付記11)
前記提示手段は、
前記関連性判断手段による判断結果に基づいて、前記ブックマークに対応するウェブサイトのコンテンツが該ブックマークが登録されたときから変化している可能性があること、或いは、該ウェブサイトへのリンクが切れていることを、ユーザに提示する
ことを特徴とする付記7乃至付記9の何れかに記載のブックマーク抽出装置。
(付記12)
ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出し、
予め登録した複数のブックマークの中から、前記抽出したキーワードに基づいて、該キーワードに関連するブックマークを提示する
ことを特徴とするブックマーク抽出方法。
(付記13)
前記キーワードを抽出するに際して、
前記閲覧履歴情報のうち、現在閲覧されているウェブサイトに関する情報に基づいて、そのウェブサイトのコンテンツを取得し、そのコンテンツの中から、前記キーワードを抽出する
ことを特徴とする付記12記載のブックマーク抽出方法。
(付記14)
前記キーワードを抽出するに際して、
前記閲覧履歴情報を解析することにより、検索サイトから現在閲覧されているウェブサイトに遷移したと判断した際、該ウェブサイトに遷移するまでに使用した検索キーワードを、前記キーワードとして抽出し、
前記複数のブックマークの中から、前記検索キーワードに基づいて、該検索キーワードに関連するブックマークを提示する
ことを特徴とする付記11記載のブックマーク抽出方法。
(付記15)
前記キーワードを抽出するに際して、
前記現在閲覧されているウェブサイトに遷移する1つ前に閲覧されたウェブサイトが検索サイトである場合に、その検索サイトにて使用した検索キーワードを、前記キーワードとして抽出する
ことを特徴とする付記14記載のブックマーク抽出方法。
(付記16)
ブックマーク抽出装置の動作制御のためのコンピュータ・プログラムであって、そのコンピュータ・プログラムにより、
ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出するキーワード抽出機能と、
登録されている複数のブックマークの中から、前記抽出手段によって抽出されたキーワードに基づいて、該キーワードに関連するブックマークを提示する提示機能とをコンピュータに実現させる
ことを特徴とするコンピュータ・プログラム。
(付記17)
前記キーワード抽出機能は、
前記閲覧履歴情報のうち、現在閲覧されているウェブサイトに関する情報に基づいて、そのウェブサイトのコンテンツを取得し、そのコンテンツの中から、前記キーワードを抽出する
ことを特徴とする付記16記載のコンピュータ・プログラム。
(付記18)
前記キーワード抽出機能は、
前記閲覧履歴情報を解析することにより、検索サイトから現在閲覧されているウェブサイトに遷移したと判断した際、該ウェブサイトに遷移するまでに使用した検索キーワードを、前記キーワードとして抽出し、
前記提示機能は、
前記複数のブックマークの中から、前記検索キーワードに基づいて、該検索キーワードに関連するブックマークを提示する
ことを特徴とする付記16記載のコンピュータ・プログラム。
(付記19)
前記キーワード抽出機能は、
前記現在閲覧されているウェブサイトに遷移する1つ前に閲覧されたウェブサイトが検索サイトである場合に、その検索サイトにて使用した検索キーワードを、前記キーワードとして抽出する
ことを特徴とする付記18記載のコンピュータ・プログラム。
1 ブックマーク抽出装置
2 Webサイトの閲覧履歴情報
3 キーワード抽出部
4 ブックマーク情報
5 関連ブックマーク提示部
11 CPU
12 ディスプレイ
13 通信インタフェース(I/F)
14 ROM
15 RAM
16 ハードディスクドライブ(HD)
17 バス
21 プログラム群
22 各種の記憶情報
50 検索サイト情報
100,100A ブックマーク抽出システム
102 閲覧履歴取得部
104 閲覧履歴解析部
106 検索サイト情報記憶部
108 閲覧コンテンツ取得部
110 閲覧コンテンツ解析部
112 ブックマーク情報取得部
114 ブックマーク属性関連性判断部
116 ブックマークコンテンツ取得部
118 ブックマークコンテンツ関連性判断部
120 関連ブックマーク表示部
122 関連ブックマークキャッシュ操作部
124 関連ブックマークキャッシュ記憶部
126 共通キーワード関連性判断部
200 ブラウザ
202 閲覧履歴記憶部
204 閲覧コンテンツ記憶部
206 ブックマーク記憶部
300 通信ネットワーク(ネットワーク)
400 Webサイト(Webページ)
1000 情報処理装置(コンピュータ)

Claims (10)

  1. ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出するキーワード抽出手段と、
    登録されている複数のブックマークの中から、前記キーワード抽出手段によって抽出されたキーワードに基づいて、該キーワードに関連するブックマークを提示する提示手段とを備え、
    前記提示手段は、
    ブックマークされた後に、個々の前記ブックマークにリンクしているウェブサイトのコンテンツを取得し、該取得したコンテンツ内の文字列に前記キーワードが含まれる程度に応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する関連性判断手段を含む
    ことを特徴とするブックマーク抽出装置。
  2. 前記キーワード抽出手段は、前記閲覧履歴情報のうち、現在閲覧されているウェブサイトに関する情報に基づいて、そのウェブサイトのコンテンツを取得し、そのコンテンツの中から、前記キーワードを抽出する
    ことを特徴とする請求項1記載のブックマーク抽出装置。
  3. 前記キーワード抽出手段は、前記閲覧履歴情報を解析することにより、検索サイトから現在閲覧されているウェブサイトに遷移したと判断した際、該ウェブサイトに遷移するまでに使用した検索キーワードを、前記キーワードとして抽出し、
    前記提示手段は、前記複数のブックマークの中から、前記検索キーワードに基づいて、該検索キーワードに関連するブックマークを提示する
    ことを特徴とする請求項1記載のブックマーク抽出装置。
  4. 前記キーワード抽出手段は、前記現在閲覧されているウェブサイトに遷移する1つ前に閲覧されたウェブサイトが検索サイトである場合に、その検索サイトにて使用した検索キーワードを、前記キーワードとして抽出する
    ことを特徴とする請求項3記載のブックマーク抽出装置。
  5. 前記関連性判断手段は、
    前記複数のブックマークに関する情報に含まれる個々のブックマークの属性情報の中に、前記キーワードが含まれる程度と、前記個々のブックマークにリンクしているウェブサイトのコンテンツ内の文字列に前記キーワードが含まれる程度との組み合わせに応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する
    ことを特徴とする請求項1乃至請求項4の何れかに記載のブックマーク抽出装置。
  6. 前記関連性判断手段は、
    前記ブックマークに関する情報に含まれる前記ブックマークの前記属性情報の中に、すべての前記キーワードが含まれ、かつ前記ブックマークにリンクしているウェブサイトのコンテンツ内の文字列に少なくとも1の前記キーワードが含まれる場合、前記キーワードと前記ブックマークは関連性有と判断する
    請求項5記載のブックマーク抽出装置。
  7. 前記関連性判断手段は、
    前記ブックマークに関する情報に含まれる前記ブックマークの前記属性情報の中に、一部もしくはすべての前記キーワードが含まれず、かつ前記ブックマークにリンクしているウェブサイトのコンテンツ内の文字列に前記ブックマークの属性情報に含まれない全ての前記キーワードが含まれる場合、前記キーワードと前記ブックマークは関連性有と判断する
    請求項5記載のブックマーク抽出装置。
  8. 前記提示手段は、前記関連性判断手段による判断結果に基づいて、前記ブックマークに対応するウェブサイトのコンテンツが該ブックマークが登録されたときから変化している可能性があること、或いは、該ウェブサイトへのリンクが切れていることを、ユーザに提示する
    ことを特徴とする請求項1乃至請求項7の何れかに記載のブックマーク抽出装置。
  9. ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出し、
    予め登録した複数のブックマークにリンクしているウェブサイトのコンテンツを、ブックマークされた後に取得し、該取得したコンテンツ内の文字列に前記抽出したキーワードが含まれる程度に応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断し、
    前記複数のブックマークの中から、前記キーワードと関連性有と判断された前記ブックマークを提示する
    ことを特徴とするブックマーク抽出方法。
  10. ブックマーク抽出装置の動作制御のためのコンピュータ・プログラムであって、そのコンピュータ・プログラムにより、
    ウェブサイトの現在までの閲覧履歴情報に基づいてキーワードを抽出するキーワード抽出機能と、
    登録されている複数のブックマークにリンクしているウェブサイトのコンテンツを、ブックマークされた後に取得し、該取得したコンテンツ内の文字列に前記抽出したキーワードが含まれる程度に応じて、前記キーワードと、前記個々のブックマークとの関連性の有無を判断する機能と、
    前記複数のブックマークの中から、前記キーワードと関連性有と判断された前記ブックマークを提示する機能と
    をコンピュータに実現させることを特徴とするコンピュータ・プログラム。
JP2011268026A 2010-12-14 2011-12-07 ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム Expired - Fee Related JP5891759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011268026A JP5891759B2 (ja) 2010-12-14 2011-12-07 ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010278012 2010-12-14
JP2010278012 2010-12-14
JP2011268026A JP5891759B2 (ja) 2010-12-14 2011-12-07 ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2012141963A JP2012141963A (ja) 2012-07-26
JP5891759B2 true JP5891759B2 (ja) 2016-03-23

Family

ID=46200417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011268026A Expired - Fee Related JP5891759B2 (ja) 2010-12-14 2011-12-07 ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム

Country Status (3)

Country Link
US (1) US8645315B2 (ja)
JP (1) JP5891759B2 (ja)
CN (1) CN102662940B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5828085B2 (ja) * 2011-12-26 2015-12-02 パナソニックIpマネジメント株式会社 ウェブブラウザ制御装置、ウェブブラウザ制御方法及びテレビジョン受像機
CN102663135B (zh) * 2012-05-03 2014-06-11 中兴通讯股份有限公司 用于嵌入式浏览器的图形化书签实现方法、装置及终端
US20140108901A1 (en) * 2012-10-17 2014-04-17 International Business Machines Corporation Web Browser Bookmark Reconciliation
EP2998885A4 (en) 2014-04-10 2016-08-17 Huawei Device Co Ltd METHOD AND DEVICE FOR SEARCHING INFORMATION
US20180097137A1 (en) * 2016-10-05 2018-04-05 International Business Machines Corporation High voltage photovoltaics
KR102120749B1 (ko) * 2018-05-17 2020-06-17 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 키워드 기반 북마크 검색 서비스 제공을 위하여 북마크 정보를 저장하는 방법 및 컴퓨터 판독가능 기록 매체
KR102214990B1 (ko) * 2018-11-26 2021-02-15 김준 북마크관리 및 정보검색 서비스 제공시스템 및 이를 이용한 북마크관리 및 정보검색 서비스 제공방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
CN1418344A (zh) * 2000-12-06 2003-05-14 索尼公司 信息处理装置
US7568150B2 (en) * 2001-11-29 2009-07-28 International Business Machines Corporation Apparatus and method of highlighting categorized web pages on a web server
JP2004070441A (ja) 2002-08-01 2004-03-04 Fujitsu Ltd ブックマーク設定方法及び装置
US20050216823A1 (en) * 2003-12-30 2005-09-29 Microsoft Corporation Assigning textual ads based on article history
JP2007226501A (ja) * 2006-02-23 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> Webページ関連履歴の提示方法および装置
JP4624956B2 (ja) 2006-04-28 2011-02-02 日本電信電話株式会社 情報提供方法およびシステム、プログラム
US20090063265A1 (en) * 2007-09-04 2009-03-05 Yahoo! Inc. Information network for text ads
WO2009144698A1 (en) * 2008-05-26 2009-12-03 Kenshoo Ltd. A system for finding website invitation cueing keywords and for attribute-based generation of invitation-cueing instructions
US8738623B2 (en) * 2010-05-21 2014-05-27 Benjamin Henry Woodard Global reverse lookup public opinion directory

Also Published As

Publication number Publication date
US8645315B2 (en) 2014-02-04
CN102662940A (zh) 2012-09-12
CN102662940B (zh) 2016-03-09
US20120150857A1 (en) 2012-06-14
JP2012141963A (ja) 2012-07-26

Similar Documents

Publication Publication Date Title
JP5891759B2 (ja) ブックマーク抽出装置及び方法、並びにコンピュータ・プログラム
US10678858B2 (en) Method and system for generating search shortcuts and inline auto-complete entries
US7933917B2 (en) Personalized search method and system for enabling the method
JP5808384B2 (ja) ユーザ注釈を一体化したサーチシステム及び方法
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
US9652558B2 (en) Lexicon based systems and methods for intelligent media search
US8577868B1 (en) Bookmarks
EP3364317A1 (en) Methods and systems for personalized network searching
US20010047353A1 (en) Methods and systems for enabling efficient search and retrieval of records from a collection of biological data
US20090006338A1 (en) User created mobile content
US20100161592A1 (en) Query Intent Determination Using Social Tagging
JP4962945B2 (ja) ブックマーク・タグ設定装置
JP2008547119A (ja) サーチ結果を提供するためのシステムおよび方法
JP2012501499A (ja) バーティカル提案により検索要求を支援するためのシステム及び方法
WO2012012396A2 (en) Predictive query suggestion caching
JP2002544595A (ja) リンクされる文書の階層構成の中の文書を表現するデータファイルの修正
US20120030190A1 (en) Method of recording and searching for a web page and method of recording a browsed web page
JP2010506255A (ja) ブックマークおよびランク付け
US20140129580A1 (en) Method and a device for prompting webpage address
US20150339387A1 (en) Method of and system for furnishing a user of a client device with a network resource
WO2007139290A1 (en) Method and apparatus for using tab corresponding to query to provide additional information
JP5416023B2 (ja) 閲覧端末及び方法
JP5813560B2 (ja) 検索条件提示装置、方法、及びプログラム
JP2011039743A (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP2014041557A (ja) コンテンツ推薦システム、端末装置、サーバ、コンテンツ推薦方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160208

R150 Certificate of patent or registration of utility model

Ref document number: 5891759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees