JP2012243021A - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP2012243021A
JP2012243021A JP2011111468A JP2011111468A JP2012243021A JP 2012243021 A JP2012243021 A JP 2012243021A JP 2011111468 A JP2011111468 A JP 2011111468A JP 2011111468 A JP2011111468 A JP 2011111468A JP 2012243021 A JP2012243021 A JP 2012243021A
Authority
JP
Japan
Prior art keywords
keyword
keywords
information processing
category
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011111468A
Other languages
English (en)
Other versions
JP5248655B2 (ja
Inventor
Sumi Omura
寿美 大村
Kentaro Nagahama
健太郎 永濱
Kensuke Horiuchi
健介 堀内
Takayuki Iida
貴之 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011111468A priority Critical patent/JP5248655B2/ja
Priority to US13/429,772 priority patent/US20120296911A1/en
Publication of JP2012243021A publication Critical patent/JP2012243021A/ja
Application granted granted Critical
Publication of JP5248655B2 publication Critical patent/JP5248655B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】Webページを閲覧中のユーザに対して推奨キーワードを効果的に提示することを実現する情報処理装置を提供する。
【解決手段】実施形態によれば、情報処理装置は、2以上のキーワードを表示するキーワード表示手段と、前記キーワード表示手段により表示された2以上のキーワードの中からいずれかのキーワードを選択する選択手段と、前記選択手段により選択されたキーワードを用いて情報検索を行う情報検索手段と、を具備する。前記キーワード表示手段は、前記2以上のキーワードの中の少なくとも1つとして予め定められたカテゴリに属するキーワードを表示する。
【選択図】図2

Description

本発明の実施形態は、例えば、ブラウザでWebページを閲覧する機能を有する情報処理装置に好適な情報処理技術に関する。
近時、インターネット上に様々なWebサイトが存在し、これらWebサイトによって膨大な数のWebページが公開されている。エンドユーザ(以下、ユーザという)は、ブラウザで検索サイト(検索サービスを提供するポータルサイトを含む)のホームページ等を自分のパーソナルコンピュータ(PC)上に表示させ、当該ホームページ上でキーワードを入力することにより、目的のWebページを検索することが一般的である。
また、最近では、例えばユーザがブラウザで閲覧中のWebページに関連する情報をインターネット上から検索して提示するといったユーザ支援のための仕組みも提案され始めている。
特開2010−39743号公報
ところで、ユーザがブラウザで閲覧中のWebページを基にインターネット上から検索される情報は、同一のカテゴリに属する情報に偏りがちとならざるを得ない。また、ユーザによって閲覧されるWebページは、そのユーザの嗜好に沿って選ばれるので、当該ユーザに提示される情報が、同一カテゴリに属する比較的狭い範囲内の情報に終始してしまうことも少なくない。従って、例えば思いがけない情報に辿り着くためのキーワードを提示するといった、Webページの検索を効率的・効果的に行うためのユーザ支援が行われるとは必ずしも言えなかった。
このようなことから、Webページを閲覧中のユーザに対して推奨キーワードを効果的に提示する仕組みが求められている。
本発明は、Webページを閲覧中のユーザに対して推奨キーワードを効果的に提示することを実現する情報処理装置を提供することを目的とする。
実施形態によれば、情報処理装置は、2以上のキーワードを表示するキーワード表示手段と、前記キーワード表示手段により表示された2以上のキーワードの中からいずれかのキーワードを選択する選択手段と、前記選択手段により選択されたキーワードを用いて情報検索を行う情報検索手段と、を具備する。前記キーワード表示手段は、前記2以上のキーワードの中の少なくとも1つとして予め定められたカテゴリに属するキーワードを表示する。
実施形態の情報処理装置の外観を示す図。 実施形態の情報処理装置のWebページ閲覧に関するソフトウェア構成を示すブロック図。 実施形態の情報処理装置のWebページ閲覧時における表示画面の一例を示す図。 実施形態の情報処理装置で実行されるスポットコンテンツの表示処理の基本的な流れを示す図。 実施形態の情報処理装置上で動作するガジェットアプリケーションの表示画面例を示す図。 実施形態の情報処理装置上で動作する情報検索支援ユーティリティにより抽出されたキーワードのリストの一例を示す図。 実施形態の情報処理装置上で動作するガジェットアプリケーションが表示するキーワードリスト上の所定の位置に優先して配置すべきキーワードが属するカテゴリの一設定例を示す図。 実施形態の情報処理装置上で動作するガジェットアプリケーションによるキーワードリストの一表示例を示す図。
以下、実施の形態について図面を参照して説明する。
図1は、本実施形態の情報処理装置の外観を示す図である。本情報処理装置は、例えばバッテリ駆動可能なノートブッックタイプのパーソナルコンピュータ10として実現されている。
図1は、このコンピュータ10のディスプレイユニット3を開いた状態における斜視図である。コンピュータ10は、コンピュータ本体2と、ディスプレイユニット3とから構成される。ディスプレイユニット3には、LCD(Liquid crystal display)6が組み込まれており、LCD6の表示面は、ディスプレイユニット3のほぼ中央に位置されている。
ディスプレイユニット3は、コンピュータ本体2の上面が露出される開放位置とコンピュータ本体2の上面がディスプレイユニット3によって覆われる閉塞位置との間を回動自在にコンピュータ本体2に取り付けられている。コンピュータ本体2は、薄い箱形の筐体を有するベースユニットであり、その上面にはキーボード4、ポインティングデバイス5などが配置されている。
また、コンピュータ本体2の内部には、例えばIEEE 802.3規格に準拠した有線通信を実行するLAN(Local area network)コントローラと、例えばIEEE802.11n規格に準拠した無線通信を実行する無線LANコントローラとが設けられている。つまり、コンピュータ10は、屋内・屋外を問わずに、インターネット上のWebサイトにアクセスする機能を有している。
この図1に示したキーボード4およびポインティングデバイス5は、コンピュータ10が提供するユーザインタフェースのインプット側を司るデバイスであり、一方、LCD6は、コンピュータ10が提供するユーザインタフェースのアウトプット側を司るデバイスである。より具体的には、コンピュータ10は、例えばHDD(hard disk drive)からメインメモリにロードされてCPU(Central processing unit)によって実行される各種プログラムが、ユーザの指示をキーボード4またはポインティングデバイス5を介して受け付け、この指示に基づいて実行した処理の結果をLCD6を介してユーザに提示する。各種プログラムの中には、コンピュータ10のリソース管理を実行するOS(Operating system)や、ハードウェア制御のためのBIOS(Basic input/output system)の他、OSの制御下で動作する、Webページを閲覧するためのブラウザを含むアプリケーションプログラムおよびユーティリティプログラム等が存在する。
図2は、コンピュータ10のWebページ閲覧に関するソフトウェア構成を示すブロック図である。
図2に示すように、Webページ閲覧に関するソフトウェア(プログラム)として、コンピュータ10は、ブラウザ100、ガジェットアプリケーション200および情報検索支援ユーティリティ300を有している。
ブラウザ100は、インターネット上でWebサイトが公開するWebページを閲覧するためのプログラムである。ブラウザ100は、例えばキーボード4によって入力されたURL(Uniform resource locator)に従って、インターネット上のWebサイトからWebページを取得する。WebページはHTML(Hypertext markup language)によって記載されたHTMLファイルとして構成されており、ブラウザ100は、このHTMLを解釈して取得したWebページのレイアウトを再現し、そのWebページ用の画面を例えばLCD6に表示する。WebページにはURLを埋め込むことができ、ユーザは、キーボード4でURLを入力する他、表示中のWebページに埋め込まれたURLを例えばポインティングデバイス5で選択することによっても、URLをブラウザ100に与えることができる。つまり、ユーザは、あるWebページから別のWebページへとリンクを辿るようにWebページを継続的に閲覧していくことができる。
なお、ここでは、インターネット上のWebサイトの1つとして、お薦めコンテンツ紹介サーバ11が存在するものとする。お薦めコンテンツ紹介サーバ11は、検索サービスを提供するポータルサイト、つまり検索サイトとしても機能する。お薦めコンテンツ紹介サーバ11は、ブラウザ100からキーワードと当該キーワードの属性情報とを受け取ってコンテンツ提供サーバ12が公開するWebページを検索し、その検索結果をブラウザ100に返却する。キーワードの属性情報とは、キーワードが例えば地名なのか人名なのか等を示すカテゴリ(分類)情報である。コンテンツ提供サーバ12も、インターネット上のWebサイトの1つである。
ガジェットアプリケーション200は、コンピュータ10のユーザに対して各種情報を提示するためのプログラムである。情報検索支援ユーティリティ300は、コンピュータ10のユーザ向けの情報をガジェットアプリケーション200に提示させるためのプログラムである。本実施形態のコンピュータ10は、このガジェットアプリケーション200と情報検索支援ユーティリティ300とが協働することにより、Webページを閲覧中のユーザに対して推奨キーワードを効果的に提示することを実現したものであり、以下、この点について詳述する。
図2に示すように、情報検索支援ユーティリティ300は、HTMLファイル抽出部301、キーワード抽出部302、キーワード処理部303およびHTMLファイル作成部304を有している。
HTMLファイル抽出部301は、ブラウザ100が表示中のWebページ、即ちHTMLファイルを抽出するモジュールである。HTMLファイル351は、このHTMLファイル抽出部301によって抽出されたHTMLファイルである。
キーワード抽出部302は、HTMLファイル351に対して構文解析、形態素解析、スコアリング等の処理を施して、当該HTMLファイル351に含まれるキーワードを抽出するモジュールである。キーワード辞書352およびNGワード辞書353は、このキーワード抽出部302によるキーワード抽出に用いられる辞書である。キーワード辞書352は、文章中から単語を抽出するための辞書であり、NGワード辞書353は、抽出結果から除外すべき単語を記録する辞書である。また、抽出キーワード354は、このキーワード抽出部302によってHTMLファイル351から抽出され、優先度順に並べられたキーワードリストである。
キーワード処理部303は、キーワード抽出部302によって抽出された抽出キーワード354を用いて、ユーザに提示するキーワードリストを作成するモジュールである。キーワード処理部303は、抽出キーワード蓄積DB(Database)355に抽出キーワード354を格納する機能を有している。よって、キーワード処理部303は、ブラウザ100が表示中のWebページに対応する最新のキーワードリストを作成する他、一定期間内(例えば1日、1週間等)に閲覧されたWebページから抽出されたキーワードを集計して、当該一定期間単位のキーワードリストを作成することができる。
HTMLファイル作成部304は、キーワード処理部303が作成したキーワードリストを含む各種情報をガジェットアプリケーション200に表示させるためのHTMLファイルを作成するモジュールである。HTMLファイル作成部304は、ローテーションコンテンツ用HTML356とスポットコンテンツ用HTML357との2種類のHTMLファイルを作成する。キーワード処理部303が作成したキーワードリストをガジェットアプリケーション200に表示させるためのHTMLファイルは、スポットコンテンツ用HTML357として作成される。
ローテーションコンテンツ用HTML356は、例えばお薦めの映画、新刊本、新作ソフトウェア、サービス等を紹介するための画面をガジェットアプリケーション200に表示させるためのHTMLファイルである。HTMLファイル作成部304は、ガジェットアプリケーション200を介してお薦めコンテンツ紹介サーバ11からお薦めコンテンツ用HTML201を取得し、お薦めコンテンツ用HTML201に含まれる情報からローテーションコンテンツ用HTML356を作成する。ローテーションコンテンツ用HTML356は、ユーザに提示する情報が周期的に切り替わるように構成される。
また、お薦めコンテンツ紹介サーバ11は、不特定多数のブラウザ100から受け取った検索キーワードを検索履歴DB203に記録しており、一定期間単位で集計した検索キーワードの集計結果をお薦めコンテンツ用HTML201に格納する。HTMLファイル作成部304は、この集計結果が推奨キーワードリストとしてユーザに提示されるようにローテーションコンテンツ用HTML356を作成する。
つまり、情報検索支援ユーティリティ300は、スポットコンテンツ用HTML357によって(1)ブラウザ100が表示中のWebページから抽出された最新のキーワードリストおよび(2)ユーザが一定期間内に閲覧したWebページから抽出されたキーワードリスト、ローテーションコンテンツ用HTML356によって(3)不特定多数のユーザによって一定期間内に検索キーワードとした用いられたキーワードリスト、の3種類のキーワードリストをユーザに提示することができる。なお、(3)の不特定多数のユーザによって一定期間内に検索キーワードとした用いられたキーワードリストも、スポットコンテンツ用HTML357によってユーザに提示することも可能である。
また、HTMLファイル作成部304は、ガジェットアプリケーション200を介して環境設定用XML(Extended markup language)202をお薦めコンテンツ紹介サーバ11から取得する。HTMLファイル作成部304は、この環境設定用XML202に含まれる情報に基づいて、例えばローテーションコンテンツ用HTML356およびスポットコンテンツ用HTML357のそれぞれをどのようなタイミングでガジェットアプリケーション200に表示させるかといった環境設定を実行する。
ガジェットアプリケーション200は、例えばスポットコンテンツ用HTML357の表示中、キーワードリスト内のいずれかのキーワードが例えばポインティングデバイス5によって選択されると、そのキーワードと当該キーワードの属性情報とを、これらの転送先を示すお薦めコンテンツ紹介サーバ11のアドレス情報とともにブラウザ100に供給する。これらの情報を受けたブラウザ100は、お薦めコンテンツ紹介サーバ11に対してキーワードおよび属性情報を転送し、お薦めコンテンツ紹介サーバ11から返送される検索結果を表示する。
図3は、コンピュータ10のWebページ閲覧時における表示画面の一例を示す図である。
図中、a1は、ブラウザ100が確保するウィンドウであり、このウィンドウ内にインターネット上のWebサイトが公開するWebページが表示される。一方、a2は、ガジェットアプリケーション200が確保するウィンドウであり、このウィンドウ内にスポットコンテンツ(a21)またはローテーションコンテンツ(a22)が表示される。スポットコンテンツは、スポットコンテンツ用HTML357を基に表示される画面であり、ローテーションコンテンツは、ローテーションコンテンツ用HTML356を基に表示される画面である。
図3に示すように、ユーザがブラウザ100によっていずれかのWebページを閲覧すると、例えばブラウザ100が表示中のWebページから抽出されたキーワードが推奨キーワードリストとしてガジェットアプリケーション200により表示されるので、客観的な視点を取り入れた、より効率的・効果的なWebページ検索を支援できる。また、情報検索支援ユーティリティ300は、ガジェットアプリケーション200に推奨キーワードリストとして表示させるキーワードの選定およびキーワードの配置を制御する仕組みを備えており、この点については後述する。
なお、ブラウザ100が表示中のWebページがセキュリティに関して予め定められた属性を有する場合、情報検索支援ユーティリティ300は、このWebページからのキーワードの抽出およびキーワードリストの提示を行わない。例えばURLが”https://”で開始されるWebページの場合、認証や暗号化を伴う高セキュリティ通信によって送受信される、個人情報などを含み得るWebページであるので、このようなWebページについてはキーワードの抽出およびキーワードリストの提示の対象から除外する。
また、情報検索支援ユーティリティ300は、ブラウザ100が表示中のWebページがHTMLサーバからではなくファイルサーバから取得されたものであった場合も、このWebページからのキーワードの抽出およびキーワードリストの提示を行わない。この判定は、例えばURLが”fts://”で開始されているか否かを調べることによって行うことができる。
さらに、ブラウザ100は、インターネット等のネットワークを介して取得したWebページだけでなく、コンピュータ10内の例えばHDDに格納されたHTMLファイルを表示することもできる。そこで、情報検索支援ユーティリティ300は、このようなコンピュータ10内のHTMLファイルがブラウザ100によって表示されている場合も、キーワードの抽出およびキーワードリストの提示を行わない。
また、前述したように、情報検索支援ユーティリティ300は、お薦めコンテンツ紹介サーバ11から環境設定用XML202を取得し、この環境設定用XML202に含まれる情報に基づいて、ガジェットアプリケーション200による表示に関する環境設定を実行する。そこで、この環境設定用XML202を使って、キーワードの抽出およびキーワードリストの提示の除外対象とすべきURLを、お薦めコンテンツ紹介サーバ11からコンピュータ10の情報検索支援ユーティリティ300に通知することも可能である。その他、キーワードの抽出およびキーワードリストの提示の除外対象とすべきURLをユーザが入力するためのユーザインタフェースをガジェットアプリケーション200または情報検索支援ユーティリティ300に設けるようにしてもよい。
次に、図4を参照して、コンピュータ10で実行されるスポットコンテンツの表示処理の基本的な流れについて説明する。
ここでは、ガジェットアプリケーション200および情報検索支援ユーティリティ300は、常駐プログラムとしてコンピュータ10に組み込まれているものと想定する。よって、コンピュータ10が起動されると(図4のb1)、ガジェットアプリケーション200のウィンドウが表示される。一方、ブラウザ100は、常駐プログラムとしてコンピュータ10に組み込まれてはおらず、ユーザが必要に応じて起動する。そこで、情報検索支援ユーティリティ300は、起動されると、まず、ローテーションコンテンツをガジェットアプリケーション200に表示させる(図4のb2)。
その後、ブラウザ100が起動されて、ユーザによるWebページの閲覧が開始されると(図4のb3)、情報検索支援ユーティリティ300は、これを契機として、スポットコンテンツの表示を開始する(図4のb4)。なお、ガジェットアプリケーション200によるスポットコンテンツの表示は、ローテーションコンテンツに重畳させる形で実行される。即ち、ローテーションコンテンツの画面遷移は、(表示されないものの)スポットコンテンツの表示中も継続されている。
情報検索支援ユーティリティ300は、ブラウザ100によって新たなWebページが表示される毎に、スポットコンテンツ(スポットコンテンツ用HTML357)を更新する。よって、ユーザは、常に、表示中のWebページから抽出された最新のキーワードリストを見ることができる。このキーワードリスト上で気になるキーワードを発見した場合には、(当該キーワードに関するWebページのURLが埋め込まれておらず)ブラウザ100に表示中のWebページから当該キーワードに関するWebページを辿ることができなくとも、ユーザは、ガジェットアプリケーション200のウィンドウ上で当該キーワードを選択する操作を行うだけで、目的の検索を行うことが可能となる。
また、情報検索支援ユーティリティ300は、このスポットコンテンツの表示を、お薦めコンテンツ紹介サーバ11によって指定された期間、つまり、環境設定用XML200に含まれる情報で示される期間だけ実施する。ここでは、例えば15分が指定されているものと想定する。スポットコンテンツの表示開始後、この15分が経過すると、情報検索支援ユーティリティ300は、スポットコンテンツの表示を終了する(図4のb5)。これにより、ガジェットアプリケーション200のウィンドウ上には、再びローテーションコンテンツが現れることとなる(図4のb6)。
一般に、ユーザが、Webページの閲覧を開始して、閲覧中のWebページに関するキーワードリストが提示されてから、このキーワードリストに興味を持ち続ける時間(集中力が持続する時間)には限りがあるので、当該キーワードリストへの興味が薄れたと推定されるタイミングでスポットコンテンツからローテーションコンテンツへの切り替えを行うことで、より有益な情報提示を行うことが実現される。
なお、以上では、スポットコンテンツの表示からローテーションコンテンツの表示への切り替えは、スポットコンテンツの表示開始後、お薦めコンテンツ紹介サーバ11から取得した環境設定用XML202で指定された期間(例えば15分)が経過した時に自動的に行われる例を説明した。これに限らず、例えば、ユーザがスポットコンテンツからローテーションコンテンツへの切り替えを指示するためのユーザインタフェースをガジェットアプリケーション200に設け、ユーザの指示に応じて、スポットコンテンツの表示からローテーションコンテンツの表示への切り替えを行うようにしてもよい。
図5は、図3に示したガジェットアプリケーション200用のウィンドウa2に表示されるガジェットアプリケーション200の表示画面例を示す図である。
図中、(A)は、スポットコンテンツ(a21)を表示中のガジェットアプリケーション200の表示画面の一例を示している。例えばスポットコンテンツの表示エリアの上部にユーザの指示を受け付けるためのオブジェクト(c1)を配置し、これらが操作された場合、ローテーションコンテンツの表示へと切り替える(スポットコンテンツの表示を終了する)。図5の(B)は、ローテーションコンテンツ(a22)を表示中のガジェットアプリケーション200の表示画面の一例を示している。逆に、例えばスポットコンテンツの表示が自動的に終了した後、このオブジェクトを操作することによって、スポットコンテンツの表示を再開させるようにすることも可能である。
オブジェクトの操作は、OSからガジェットアプリケーション200に通知され、この通知を受けたガジェットアプリケーション200は、その旨を情報検索支援ユーティリティ300に通知する。この通知を受けた情報検索支援ユーティリティ300は、必要に応じてスポットコンテンツ用HTML357の作成などを行い、スポットコンテンツ(スポットコンテンツ用HTML357)およびローテーションコンテンツ(ローテーションコンテンツ用HTML356)間の切り替えをガジェットアプリケーション200に指示する。
次に、以上のような流れで表示されるスポットコンテンツに関するキーワードの選定およびキーワードの配置の制御の基本原理について説明する。
前述したように、情報検索支援ユーティリティ300は、ブラウザ100が表示中のWebページ(HTMLファイル)をHTMLファイル抽出部301によって抽出し、キーワード抽出部302が、このWebページに対して構文解析、形態素解析、スコアリング等の処理を施して、当該Webページに含まれるキーワードを抽出する。図6は、キーワード抽出部302によって抽出されたキーワードのリスト(図2の抽出キーワード354に相当)の一例を示している。図6に示すように、ここでは、「サッカー」、「チャリティ」、「日本代表」、「Jリーグ」、「ドイツ」、「A選手」、…、の順(優先度順)にキーワードが並べられているものと想定する。各キーワードには、キーワード抽出部302によるWebページの解析で判定された、各々が属するカテゴリを示すカテゴリ情報が属性情報として付加される。
また、前述したように、情報検索支援ユーティリティ300は、ガジェットアプリケーション200を介してお薦めコンテンツ紹介サーバ11から環境設定用XML202を取得する。この環境設定用XML202には、スポットコンテンツとして表示する推奨キーワードリスト上の所定の位置に優先して配置すべきキーワードのカテゴリを設定するための情報が含まれている。図7は、環境設定用XML202によるカテゴリの一設定例を示す図である。図7に示すように、どのカテゴリに属するキーワードを推奨キーワードリスト上の所定の位置に優先して配置すべきかが、フラグによって設定される。ここでは、カテゴリ「人名」が、キーワードを推奨キーワードリスト上の所定の位置に優先して配置すべきカテゴリとして設定されている。
いま、スポットコンテンツとして表示する推奨キーワードリスト上には5つのキーワードが配置されるものと想定する。この場合、キーワード処理部303は、キーワード抽出部302によって抽出されたキーワードの中から優先度順に5つのキーワードを取り出してユーザに提示するキーワードリストを作成することになるので、本来であれば、「サッカー」、「チャリティ」、「日本代表」、「Jリーグ」および「ドイツ」の5つのキーワードが選択されることになる。
しかしながら、ここでは、スポットコンテンツとして表示する推奨キーワードリスト上の所定の位置に優先して配置すべきキーワードのカテゴリが設定されるので、キーワード処理部303は、この設定に基づいたキーワードの選定を実行する。なお、ここでは、推奨キーワードリスト上に配置する5つのキーワードのうち、5番目に配置するキーワードを、設定されたカテゴリに属するキーワードとすべく定められているものと想定する。
この場合、キーワード処理部303は、まず、キーワード抽出部302によって抽出されたキーワードの中から優先度順に4つのキーワードを取り出し、キーワードリスト上に配置する。続いて、キーワード処理部303は、残りのキーワードの中から最も優先度の高いキーワードを選択することになるが、この際、キーワード処理部303は、そのカテゴリが設定されたカテゴリと一致するか否かを調べる。
図6に示した例によれば、5番目に選ばれるキーワードは「ドイツ」であり、そのカテゴリは「地名」であるが、図7に示した例によれば、設定されたカテゴリは「人名」であるので、この「ドイツ」は対象外となる。次のキーワードは「A選手」であり、そのカテゴリは「人名」であるので、設定されたカテゴリと一致する。よって、(「ドイツ」に代わって)この「人名」が選ばれる。その結果、図8に示すように、「サッカー」、「チャリティ」、「日本代表」、「Jリーグ」および「A選手」の各キーワードが配置されたキーワードリストがスポットコンテンツとして表示されることになる。
なお、環境設定用XML202によって設定されたカテゴリに属するキーワードの選択数やキーワードリスト上での配置も、環境設定用XML202によって設定するようにしてもよい。また、もし、キーワード抽出部302によって抽出されたキーワードの中から優先度順に取り出した4つのキーワードの中に、環境設定用XML202によって設定されたカテゴリに属するキーワードが既に存在する場合には、キーワードリスト上の5番目に配置するキーワードを、カテゴリに関わらずに、そのまま5番目の優先度を持つキーワードとしてもよい。
このように、お薦めコンテンツ紹介サーバ11が提供する環境設定用XML202によって、スポットコンテンツとして表示する推奨キーワードリストのキーワード選定およびキーワードの配置を制御することができるので、ガジェットアプリケーション200および情報検索支援ユーティリティ300は、ユーザが閲覧中のWebページから抽出したキーワードを提示するにあたって、ユーザに提示したいカテゴリに属するキーワードを優先的に提示するといった効果的な検索キーワード提示を実現する。
即ち、コンピュータ10は、Webページを閲覧中のユーザに対して推奨キーワードを効果的に提示することを実現する。
なお、本実施形態の動作制御処理は、ソフトウェア(プログラム)によって実現することができるので、このソフトウェアを格納したコンピュータ読み取り可能な記憶媒体を通じてこのソフトウェアを通常のコンピュータにインストールして実行することにより、本実施形態と同様の効果を容易に実現することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
2…コンピュータ本体、3…ディスプレイユニット、4…キーボード、5…ポインティングデバイス、6…LCD、10…パーソナルコンピュータ(PC)、11…お薦めコンテンツ紹介サーバ、12…コンテンツ提供サーバ、100…ブラウザ、200…ガジェットアプリケーション、200…環境設定用XML、201…お薦めコンテンツ用HTML、202…環境設定用XML、203…検索履歴DB、300…情報検索支援ユーティリティ、301…HTMLファイル抽出部、302…キーワード抽出部、303…キーワード処理部、304…HTMLファイル作成部、351…HTMLファイル、352…キーワード辞書、353…NGワード辞書、354…抽出キーワード、355…抽出キーワード蓄積DB、356…ローテーションコンテンツ用HTML、357…スポットコンテンツ用HTML。
実施形態によれば、情報処理装置は、表示手段と、選択手段と、検索手段と、を具備する。前記表示手段は、ネットワークを介して取得可能なWebページと、前記Webページから自動的に抽出される2以上のキーワードを表示する。前記選択手段は、前記表示手段により表示される2以上のキーワードの中からいずれかのキーワードを選択する。前記検索手段は、前記選択手段により選択されたキーワードを用いて情報検索を行う。前記表示手段は、予め定められるカテゴリに属するキーワードが前記Webページに含まれる場合には、前記予め定められるカテゴリに属するキーワードを少なくとも1つ表示する。

Claims (14)

  1. 2以上のキーワードを表示するキーワード表示手段と、
    前記キーワード表示手段により表示された2以上のキーワードの中からいずれかのキーワードを選択する選択手段と、
    前記選択手段により選択されたキーワードを用いて情報検索を行う情報検索手段と、
    を具備し、
    前記キーワード表示手段は、前記2以上のキーワードの中の少なくとも1つとして予め定められたカテゴリに属するキーワードを表示する
    情報処理装置。
  2. 前記カテゴリを設定する設定手段をさらに具備する請求項1に記載の情報処理装置。
  3. データ通信手段をさらに具備し、
    前記設定手段は、前記カテゴリの設定を前記データ通信手段を介して外部装置から受け付ける請求項2に記載の情報処理装置。
  4. 前記キーワード表示手段により表示される2以上のキーワードのうち、前記カテゴリに属するキーワードの配置を設定する設定手段をさらに具備する請求項1に記載の情報処理装置。
  5. データ通信手段をさらに具備し、
    前記設定手段は、前記カテゴリに属するキーワードの配置の設定を前記データ通信手段を介して外部装置から受け付ける請求項4に記載の情報処理装置。
  6. テキストデータを含むファイルの中からキーワードを抽出するキーワード抽出手段をさらに具備し、
    前記キーワード表示手段は、前記キーワード抽出手段により抽出されたキーワードを表示する請求項1に記載の情報処理装置。
  7. 前記キーワード抽出手段は、ブラウザが表示中のHTML(Hypertext markup language)ファイルからキーワードを抽出する請求項6に記載の情報処理装置。
  8. 表示した2以上のキーワードの中から選択されたキーワードを用いて情報検索を行う情報処理装置の情報処理方法であって、
    前記2以上のキーワードの中の少なくとも1つとして予め定められたカテゴリに属するキーワードを表示する
    情報処理方法。
  9. 前記カテゴリを設定する請求項8に記載の情報処理方法。
  10. 前記カテゴリの設定をデータ通信手段を介して外部装置から受け付ける請求項9に記載の情報処理方法。
  11. 前記表示する2以上のキーワードのうち、前記カテゴリに属するキーワードの配置を設定する請求項8に記載の情報処理方法。
  12. 前記カテゴリに属するキーワードの配置の設定をデータ通信手段を介して外部装置からの受け付ける請求項11に記載の情報処理方法。
  13. テキストデータを含むファイルの中からキーワードを抽出し、
    前記キーワードを表示することは、前記抽出したキーワードを表示する請求項8に記載の情報処理方法。
  14. 前記キーワードを抽出することは、ブラウザが表示中のHTMLファイルからキーワードを抽出する請求項13に記載の情報処理方法。
JP2011111468A 2011-05-18 2011-05-18 情報処理装置およびプログラム Expired - Fee Related JP5248655B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011111468A JP5248655B2 (ja) 2011-05-18 2011-05-18 情報処理装置およびプログラム
US13/429,772 US20120296911A1 (en) 2011-05-18 2012-03-26 Information processing apparatus and method of processing data for an information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011111468A JP5248655B2 (ja) 2011-05-18 2011-05-18 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012243021A true JP2012243021A (ja) 2012-12-10
JP5248655B2 JP5248655B2 (ja) 2013-07-31

Family

ID=47175724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011111468A Expired - Fee Related JP5248655B2 (ja) 2011-05-18 2011-05-18 情報処理装置およびプログラム

Country Status (2)

Country Link
US (1) US20120296911A1 (ja)
JP (1) JP5248655B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016001407A (ja) * 2014-06-11 2016-01-07 ヤフー株式会社 検索装置、検索方法及び検索プログラム
JP2016177842A (ja) * 2016-06-09 2016-10-06 ヤフー株式会社 検索装置、検索方法及び検索プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160098416A1 (en) * 2014-10-03 2016-04-07 Yahoo! Inc. Auto complete search box based on the user's context to reduce user's input
US10614108B2 (en) 2015-11-10 2020-04-07 International Business Machines Corporation User interface for streaming spoken query
US10706107B2 (en) * 2017-05-30 2020-07-07 Open Text Sa Ulc Search systems and methods utilizing search based user clustering

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2002183194A (ja) * 2000-12-15 2002-06-28 Ricoh Co Ltd 検索式生成装置およびその方法
JP2003216620A (ja) * 2002-01-17 2003-07-31 Matsushita Electric Ind Co Ltd コンテンツ管理システム、コンテンツ管理方法、媒体、およびプログラム
JP2008129749A (ja) * 2006-11-20 2008-06-05 Oki Data Corp 画像処理装置、及び画像処理システム
JP2008217333A (ja) * 2007-03-02 2008-09-18 Toshiba Corp 検索支援装置、プログラム及び検索支援システム
JP2008242623A (ja) * 2007-03-26 2008-10-09 Fujitsu Ltd 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
WO2011036755A1 (ja) * 2009-09-24 2011-03-31 株式会社 東芝 キーワード抽出装置、およびプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7284008B2 (en) * 2000-08-30 2007-10-16 Kontera Technologies, Inc. Dynamic document context mark-up technique implemented over a computer network
US7478089B2 (en) * 2003-10-29 2009-01-13 Kontera Technologies, Inc. System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content
WO2005055090A1 (en) * 2003-12-01 2005-06-16 Metanav Corporation Dynamic keyword processing system and method for user oriented internet navigation
US20060218146A1 (en) * 2005-03-28 2006-09-28 Elan Bitan Interactive user-controlled relevance ranking of retrieved information in an information search system
US7444328B2 (en) * 2005-06-06 2008-10-28 Microsoft Corporation Keyword-driven assistance
US8380721B2 (en) * 2006-01-18 2013-02-19 Netseer, Inc. System and method for context-based knowledge search, tagging, collaboration, management, and advertisement
US20070214123A1 (en) * 2006-03-07 2007-09-13 Samsung Electronics Co., Ltd. Method and system for providing a user interface application and presenting information thereon
US8209320B2 (en) * 2006-06-09 2012-06-26 Ebay Inc. System and method for keyword extraction
US7664740B2 (en) * 2006-06-26 2010-02-16 Microsoft Corporation Automatically displaying keywords and other supplemental information
US7792967B2 (en) * 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
US8176068B2 (en) * 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US20100131563A1 (en) * 2008-11-25 2010-05-27 Hongfeng Yin System and methods for automatic clustering of ranked and categorized search objects
MX2011006340A (es) * 2008-12-12 2011-10-28 Atigeo Llc Suministro de recomendaciones utilizando la informacion determinada para dominios de interés.
US8135739B2 (en) * 2008-12-29 2012-03-13 Microsoft Corporation Online relevance engine
JP5381659B2 (ja) * 2009-11-30 2014-01-08 富士通モバイルコミュニケーションズ株式会社 情報処理装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2002183194A (ja) * 2000-12-15 2002-06-28 Ricoh Co Ltd 検索式生成装置およびその方法
JP2003216620A (ja) * 2002-01-17 2003-07-31 Matsushita Electric Ind Co Ltd コンテンツ管理システム、コンテンツ管理方法、媒体、およびプログラム
JP2008129749A (ja) * 2006-11-20 2008-06-05 Oki Data Corp 画像処理装置、及び画像処理システム
JP2008217333A (ja) * 2007-03-02 2008-09-18 Toshiba Corp 検索支援装置、プログラム及び検索支援システム
JP2008242623A (ja) * 2007-03-26 2008-10-09 Fujitsu Ltd 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
WO2011036755A1 (ja) * 2009-09-24 2011-03-31 株式会社 東芝 キーワード抽出装置、およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016001407A (ja) * 2014-06-11 2016-01-07 ヤフー株式会社 検索装置、検索方法及び検索プログラム
JP2016177842A (ja) * 2016-06-09 2016-10-06 ヤフー株式会社 検索装置、検索方法及び検索プログラム

Also Published As

Publication number Publication date
US20120296911A1 (en) 2012-11-22
JP5248655B2 (ja) 2013-07-31

Similar Documents

Publication Publication Date Title
US9996620B2 (en) Continuous content refinement of topics of user interest
KR102006396B1 (ko) 브라우징 액티비티에 기초하여 정합 애플리케이션을 식별하는 기법
JP5264892B2 (ja) 多言語情報検索
US20090006338A1 (en) User created mobile content
US20130205232A1 (en) Identification of electronic content significant to a user
US20120284293A1 (en) Presenting related searches on a toolbar
US9519703B2 (en) Refining search results for a compound search query
US10496717B2 (en) Storing predicted search results on a user device based on software application use
JP2012212397A (ja) 情報処理装置及び情報処理方法
JP5092038B1 (ja) 情報処理装置の情報処理方法、情報処理装置およびプログラム。
JP5248655B2 (ja) 情報処理装置およびプログラム
US20130066902A1 (en) Information processing apparatus, information processing method, and computer-readable storage medium
WO2015028897A1 (en) A system and method for completing a user query and for providing a query response
US9805406B2 (en) Embeddable media content search widget
US9607105B1 (en) Content searching techniques
JP5044707B1 (ja) 情報処理システム、情報処理装置およびプログラム
US20140156626A1 (en) Embedded externally hosted content in search result page
US10567845B2 (en) Embeddable media content search widget
JP5416023B2 (ja) 閲覧端末及び方法
Shereff Electronic books for biomedical information
JP2007025753A (ja) ウェブログサーバ及びウェブログサービス提供システム
JP2012243327A (ja) プログラム、情報処理装置および情報処理装置の情報処理方法
JP5414829B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2012216239A (ja) 情報処理装置、プログラムおよび情報検索方法
KR101372580B1 (ko) 브라우저 ui를 제공하기 위한 방법, 단말 장치, 서버 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees