JP2006235875A - 情報ナビゲーション方法及び装置及びプログラム - Google Patents

情報ナビゲーション方法及び装置及びプログラム Download PDF

Info

Publication number
JP2006235875A
JP2006235875A JP2005047864A JP2005047864A JP2006235875A JP 2006235875 A JP2006235875 A JP 2006235875A JP 2005047864 A JP2005047864 A JP 2005047864A JP 2005047864 A JP2005047864 A JP 2005047864A JP 2006235875 A JP2006235875 A JP 2006235875A
Authority
JP
Japan
Prior art keywords
page
web
web page
information
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005047864A
Other languages
English (en)
Inventor
Hisanori Oda
寿則 小田
Megumi Ishii
恵 石井
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005047864A priority Critical patent/JP2006235875A/ja
Publication of JP2006235875A publication Critical patent/JP2006235875A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザが現在閲覧中のWebページの状況に適したWebページを提示する。【解決手段】 本発明は、サーバにおいて、ページDBから特徴的表現を読み出してページタイプを分類し、ページDBに格納しておき、ユーザ端末から送信されたURL情報に基づいて、ページDB及び索引語DBを検索し、その結果をユーザ端末に送信し、ユーザ端末は、サーバから送信された結果に基づいて、現在ユーザが閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与してWebブラウザのページ表示の周辺に表示する。
【選択図】 図1

Description

本発明は、情報ナビゲーション方法及び装置及びプログラムに係り、特に、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類して提示し、ブラウジングを支援するための情報ナビゲーション方法及び装置及びプログラムに関する。
(1) クラスタリング情報提示表示:
代表されるクラスタリング情報提示装置として、ユーザに検索結果をよりわかりやすく提示するために、検索結果に含まれる主要な単語によるクラスタリングを行い、その語を追加した絞込検索により検索意図の詳細化を支援し、効率のよい再検索を行う装置がある。この装置は、検索結果に含まれる特徴的な語を抽出して、さらに、その特徴語のTF・IDF値などから提示するラベル語を決めている(例えば、非特許文献1参照)。
(2) 周辺情報提示によるナビゲーション支援:
閲覧中のページと文書類似性の高いページ意味的周辺情報、ハイパーリンクで関連付けたページを構造的周辺情報と捉え、閲覧中のWebページの次に閲覧するWebページの候補として、常に周辺情報を提示することにより、ユーザにWeb空間中の現在位置の把握と、周辺情報の気付きを狙った情報ナビゲーション装置がある。この閲覧中Webページの周辺情報提示によるナビゲーション支援では、閲覧中のWebページに含まれる語のベクトル類似度が高い順に、次の閲覧Webページ候補として提示する(例えば、非特許文献2参照)。
早川和宏、大久保雅且、田中一男「WWW検索サービスにおける検索結果絞込み用インターフェースの開発」、情報処理学会研究報告、Vol.98,No.9, 1998年1月29日 池田新平、是津耕司、小山聡、田中克己「Webコンテンツの周辺情報提示によるナビゲーション支援」電子情報通信学会、第14回データ工学ワークショップ(DEW2003)
上記従来の(1)に代表されるクラスタリング閲覧候補提示を行う装置では、検索結果に含まれる特徴的な語を抽出して、さらに、その特徴語のTF・IDF値などから提示するラベル語を決めている。このため、ユーザは、所望のWebページを選択する前に、提示されたラベル語からどのようなWebページや、一覧が提示されるか推測することによりブラウジングが成立していた。これらの推測は、ユーザの経験によって養われるものであり、熟練していないユーザにとっては、語から提示結果を推測することは困難であり、また、推測が外れると、必要の無いWebページが提示されることがある。これらの問題を解決するには、ユーザが推測の必要がない、すなわち、ラベル語と次に閲覧したいWebページの目的との間に高い関連性を持った語である“閲覧する目的”を直接ラベルとして使用する必要がある。
上記従来の(2)に代表される閲覧中Webページの周辺情報提示によるナビゲーション支援では、閲覧中のWebページに含まれる語のベクトル類似度が高い順に、次の閲覧Webページ候補として提示していた。類似するページには、現在、閲覧中のWebページの内容に含まれる情報が多く含まれることから、ユーザにとって既知の情報であることが多かったが、ユーザが次に閲覧したいWebページは、現在閲覧しているWebページに含まれない情報が含まれたWebページであることが多く、結果としてユーザがWebページを閲覧することによって、次に閲覧したいWebページが近くに提示されないという欠点がある。
次に閲覧したいWebページの傾向は、閲覧中のWebページのジャンル(政治、経済、社会、芸能、科学など)別ではなく、タイプ(インデックス、ニュース、ブログ、カタログ、論文など)別の方が、明確な目的の異なりが存在する。例えば、商品に関するカタログタイプのWebページであれば、その商品の詳細な情報、その商品に関する評判情報、商品を購入する場合の店舗に関する情報などであり、様々な情報へのハイパーリンクが含まれるインデックスといった要求が顕著で、それぞれ他のタイプとは異なっていた。しかしながら、閲覧中のWebページによって、次に閲覧したいWebページの候補を動的に提示するWebナビゲーション装置において、このページタイプと次の閲覧目的の関連を利用するナビゲーション手法は存在しない。
また、閲覧目的は特定のWebページのページタイプと関係が深い。例えば、評判を知るという目的によく利用されるページタイプは、ブログ、掲示板、日記であり、不明点を知る目的であれば、Q&A、掲示板であり、その他のページタイプがこれらの目的で閲覧されることは稀である。この事は、閲覧候補を目的指向に提示する場合に、特定の目的には特定のページタイプのWebページを提示すればよいことを表しているが、従来のWebナビゲーション手法では、この性質は利用されていない。
本発明は、上記の点に鑑みなされたもので、ユーザが現在閲覧中のWebページの状況に適したWebページを提示することが可能な情報ナビゲーション方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、ユーザ端末とサーバを有するシステム上で、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するための情報ナビゲーション方法において、
サーバは、
提示対象とするWebページをインターネットを介して収集し、ページデータベース(DB)に格納するWebクローリングステップ(ステップ1)と、
ページDBのWebページから索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、ページDBに格納する固有表現抽出ステップ(ステップ2)と、
索引語DB上に転置インデックスを作成するインデックス作成ステップ(ステップ3)と、
ページDBから特徴的表現を読み出してページタイプを分類し、ページDBに格納するページタイプ分類ステップ(ステップ4)と、を行い、
ユーザ端末は、
ユーザが閲覧していたWebページのURL情報を取得し、サーバに対して送信することにより、Webページに関する情報を要求する要求ステップ(ステップ5)を行い、
サーバは、
ユーザ端末からのURL情報に基づいて、ページDB及び索引語DBを検索し(ステップ6)、その結果をユーザ端末に送信する検索結果送信ステップ(ステップ7)を行い、
ユーザ端末は、
サーバから送信された結果に基づいて、現在ユーザが閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与してWebブラウザのページ表示の周辺に表示するナビゲーション提示・選択ステップ(ステップ8)を行う。
また、本発明(請求項2)は、ナビゲーション提示・選択ステップ(ステップ8)において、
ユーザが現在閲覧しているWebページのタイプに関して、次に閲覧したい割合が統計的に高い順に目的ラベルを分類してWebブラウザのページ表示の周辺に提示し、そのラベル配下に関連するWebページを、目的と統計的に関連性が高い特徴的表現の属するクラスの順にWebページに含まれる特徴的表現ラベルを提示する。
また、本発明(請求項3)は、ページタイプ分類ステップ(ステップ4)において、
Webページのページタイプを判定する際に、該Webページの特徴的表現を抽出し、事前に各ページタイプで最適に設定された特徴的表現の属するクラスの重みにより、重み付けを行った特徴的表現を用いて、該Webページが各ページタイプに属する確率を算出する。
また、本発明(請求項4)は、検索結果送信ステップ(ステップ6)において、
ページDBから取得したページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報をユーザ端末に送信し、
周辺Webページについては、ユーザ端末から受け取ったURL情報で指定される閲覧中のWebページに含まれる特徴的表現と同じ特徴的表現が含まれるWebページを索引語DBから取得する。
図2は、本発明の原理構成図である。
本発明(請求項5)は、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類して提示するためのサーバ100及びユーザ端末200を有する情報ナビゲーションシステムであって、
サーバ100は、
Webページに関する情報を保持するページDB170と、
転置インデックスを保持する索引語DB160と、
索引語DB160上に転置インデックスを作成するインデックス作成手段140と、
提示対象とするWebページをインターネットを介して収集し、ページDB170に格納するWebクローリング手段120と、
ページDB170のWebページから索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、ページDB170に格納する固有表現抽出手段130と、
ページDB170から特徴的表現を読み出してページタイプを分類し、ページDB170に格納するページタイプ分類手段150と、
ユーザ端末200から送信されたURL情報に基づいて、ページDB170及び索引語DB160を検索し、その結果をユーザ端末200に送信するナビゲーション情報提供手段180と、を有し、
ユーザ端末200は、
Webページを表示するためのWebブラウザ210と、
ユーザが閲覧していたWebページのURL情報を取得し、サーバ100に対して送信することにより、Webページに関する情報を要求するWebページ要求手段230と、
サーバ100から送信された結果に基づいて、現在閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与してWebブラウザ210に表示するナビゲーション提示・選択手段220と、を有する。
また、本発明(請求項6)は、ナビゲーション提示・選択手段220において、
現在閲覧しているWebページのタイプに関して、次に閲覧したい割合が統計的に高い順に目的ラベルを分類してWebブラウザ210のページ表示の周辺に提示し、そのラベル配下に関連するWebページを、目的と統計的に関連性が高い特徴的表現の属するクラスの順に、Webページに含まれる特徴的表現ラベルを提示する手段を含む。
また、本発明(請求項7)は、ページタイプ分類手段150において、
Webページのタイプを判定する際に、該Webページの特徴的表現を抽出し、事前に各ページタイプで最適に設定された特徴的表現の属するクラスの重みにより、重み付けを行った特徴的表現を用いて、該Webページが各ページタイプに属する確率を算出する手段を含む。
また、本発明(請求項8)は、ナビゲーション情報提供手段180において、
ページDBからページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報を取得し、ユーザ端末に送信する手段を含み、
周辺Webページについては、ユーザ端末200から受け取ったURL情報で指定される閲覧中のWebページに含まれる特徴的表現と同じ特徴的表現が含まれるWebページを索引語DB160から取得する。
本発明(請求項9)は、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するシステムにおけるサーバに実行させるための情報ナビゲーションプログラムであって、
提示対象とするWebページをインターネットを介して収集し、ページデータベース(DB)に格納するWebクローリングステップと、
索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、ページDBに格納する固有表現抽出ステップと、
索引語DB上に転置インデックスを作成するインデックス作成ステップと、
ページDBから特徴的表現を読み出してページタイプを分類し、該ページDBに格納するページタイプ分類ステップと、
ユーザ端末から受信した、閲覧中のWebページのURL情報に基づいて、ページDB及び索引語DBを検索した結果得られた、ページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報をユーザ端末に送信する検索結果送信ステップと、をコンピュータに実行させるプログラムである。
本発明(請求項10)は、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するシステムにおけるユーザ端末に実行させるための情報ナビゲーションプログラムであって、
ユーザが閲覧していたWebページのURL情報を、サーバに対して送信することにより、Webページに関する情報を要求する要求ステップと、
サーバから送信されたページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報に基づいて、現在閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与してWebブラウザのページ表示の周辺に表示するナビゲーション提示・選択ステップと、をコンピュータに実行させるプログラムである。
上記のように本発明によれば、ユーザがWebページを閲覧するといった行為が行われると、その閲覧しているWebページに対して、次に閲覧したいWebページを、そのコンテンツを閲覧する場合の目的(全体を知る、詳細を知る、時間の流れを知る、販売を知る、不明点を知るなど)とされる語を、直接メニューのラベルとしたクラスに分類して提示する。その結果、現在閲覧中にWebページの状況に適したWebページの提示が可能となる。
さらに、ユーザに提示したWebページ中から選択されたWebページの状況に適したWebページが提示され、この操作を繰り返していくことにより、連続的、かつ、明確な目的に沿ったWebナビゲーションが実現される。
以下、図面と共に本発明の実施の形態を説明する。
本発明の情報ナビゲーションシステムは、閲覧中のWebページタイプに応じて次に閲覧したいWebページを目的ラベルに分類してユーザに提示するシステムである。
図3は、本発明の一実施の形態における情報ナビゲーションシステムの構成を示す。
情報ナビゲーションシステムは、サーバ100とユーザ端末200及び、Webページを保持する情報サーバ装置300及びネットワーク(インターネット)400から構成される。
サーバ100は、コンテンツローラ110、Webクローリング部120、固有表現抽出部130、語インデクサ140、ページタイプ分類部150、索引語DB160、ページDB170、ナビゲーション情報提供部180から構成される。
ページDB170は、図4に示すように、ページテーブル171と特徴的表現出現確率テーブル172から構成される。ページテーブル171には、URL(キー)、テキスト、特徴的表現群、ページタイプが設定される。特徴的表現出現確率テーブル172には、ID(キー)、特徴的表現、ページタイプ、出現確率が設定される。
コントローラ110は、Webクローリング部120、固有表現抽出部130、語インデクサ140、ページタイプ分類部150の起動を、それぞれ設定された間隔で定期的に行う。
Webクローリング部120は、コントローラ110により起動されると提示対象とするWebページをインターネット400を介して情報サーバ300から収集し、ページDB170のページテーブル171に追加格納する。このときページテーブル171に設定される情報は、Webページを取得したURLとWebページのテキスト内容である。収集したWebページが既にページDB170に存在する場合は、取得したWebページのテキストで当該ページテーブル171を更新する。
固有表現抽出部120は、クラス(人名、場所名、製品名、企業名、評判、金額、時間等)付きの特徴的表現を、ページDB170のページテーブル171を検索することにより、Webページのテキストに含まれる特徴的表現を求めるインデックスを抽出し、ページDB170のページテーブル171に追加格納する。
語インデクサ130は、コントローラ110から起動されるとページDB170中の追加/更新されたページついて、特徴的表現を含むWebページを求める転置ファイルによるインデックスを、索引DB160上に作成する。
ページタイプ分類部150は、図5に示すように、重み付け部151、分類部152、特徴的表現クラス・タイプ関連度DB153から構成され、重み付け部151と分類部152は、ページDB170と接続されている。
ページタイプ分類部150の重み付け部151は、ページDB170のページテーブル171の特徴的表現群に基づいて特徴的表現出現確率テーブル172を検索し、出現確率を検索する。
分類部152は、重み付け部151で取得した出現確率を用いてWebページを特定のページタイプに分類し、ページDB170のページテーブル171へその情報を追加格納する。
図6に特徴的表現クラス・タイプ関連度DB153の構成例を示す。同図に示すDB153は、特徴的表現クラスとページタイプからなる複合キーと関連度からなる。つまり、重み付け部151は、ページDB170のページテーブル171の特徴的表現とページタイプとをキーにして特徴的表現クラス・タイプ関連度DB153を検索し、関連度を取得し、当該関連度に基づいて特徴的表現出現確率を求める。
ナビゲーション情報提供部180は、URL情報をユーザ端末200から受け取ると、当該URLに対応するWebページの、ページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報をページDB170に問い合わせて、結果をユーザ端末200に返す。周辺Webページは、URLを受け取った閲覧中ページに含まれる特徴的表現と同じ特徴的表現が含まれるWebページを対象とし、索引語DB160を検索して取得する。
次に、ユーザ端末200の構成について説明する。
ユーザ端末200は、Webブラウザ210とナビゲーション提示・選択部220から構成される。
ナビゲーション提示・選択部220は、図7に示すように、情報送受信部221、目的関連度付加部222、閲覧候補表示・選択部223、表示完了抽出部224、タイプ・クラス閲覧目的関連度DB225、タイプ・次の閲覧目的関連度DB226構成される。閲覧候補表示・選択部223と表示完了抽出部224は、Webブラウザ210に接続され、情報送受信部221は、サーバ100のナビゲーション情報提供部180に接続される。
タイプ・クラス閲覧目的関連度DB225は、図8に示すように、クラス・閲覧目的関連度テーブル225−Aとタイプ・閲覧目的テーブル225−Bから構成される。クラス・閲覧目的関連度テーブル225−Aは、特徴的表現クラスと閲覧目的からなる複合キーと関連度から構成される。また、タイプ・閲覧目的テーブル225−Bは、ページタイプと閲覧目的からなる複合キーと関連度から構成される。
情報送受信部221は、サーバ100のナビゲーション情報提供部180との間で情報を送受信する。
目的関連度付加部222は、サーバ100から受信した情報に基づいてタイプ・クラス・閲覧目的関連度DB225のタイプ・閲覧目的テーブル225−Bを検索し、受信した情報のページタイプに関連する場合の目的との関連度を取得して、情報に付加し、さらに、特徴的表現のクラスにも閲覧する場合の目的との関連度をクラス・閲覧目的関連度テーブル225−Aから検索して付加し、閲覧候補提示・選択部223に送る。
閲覧候補提示・選択部223は、閲覧目的階層メニュー配下にWebページを見やすく提示するために、Webページに含まれる特徴的表現のクラスと閲覧目的との関連度の高い順に、Webページにリンクする特徴的表現を目的ラベルとして、Webブラウザ210のページ表示の周辺に提示する。提示数が多すぎる場合は、関連度が所定の閾値より低いクラスに含まれる特徴的表現は提示しない。図9に、タイプ・次の目的関連度DB226の構成を示す。タイプ・次の目的関連度DB226は、ページタイプと次の閲覧目的からなる複合キーと関連度からなる。ここで、関連する目的レベルの提示は、ページタイプと次の閲覧目的をキーとして、タイプ・次の目的関連度DB226から関連度を読み出し、その関連度の高い順序で提示する。
次に、上記の構成における動作を説明する。
図10は、本発明の一実施の形態におけるサーバにおける動作のフローチャートである。
以下では、Webクローリング部120においてWebページが収集され、ページDB170のページテーブル171に格納されているものとする。
ステップ101) 固有表現抽出部120は、ページDB170のページテーブル171からページに含まれる特徴的表現(語、クラス)を取得する。
ステップ102) ページタイプ分類部150の重み付け部151は、ページDB170のページテーブル171から取得した特徴的表現の出現確率(クラス付き語の出現確率)を取得し、分類部152に転送する。
ステップ103) 次に、重み付け部151は、ページDB170のページテーブル171の特徴的表現とページタイプをキーにして特徴的表現クラス・タイプ関連度DB153を検索し、ページタイプ(ブログ・掲示板・日記等)毎のクラス重み(関連度)を取得し、分類部152に転送する。
ステップ104) 分類部152は、ステップ102で取得した特徴的表現(語)の出現確率にステップ103で取得したクラス重み(関連度)を乗算する。
ステップ105) 分類部152は、ステップ104で求められた確率を用いて、Webページを特定のページタイプに分類する。
ステップ106) 分類部152は、分類されたページタイプをページDB170のページテーブル171に格納する。
次に、ユーザ端末200の動作について説明する。
図11は、本発明の一実施の形態におけるユーザ端末の動作のフローチャートである。
ステップ201) ユーザ端末200のナビゲーション提示・選択部220の情報送受信部221が、サーバ100のナビゲーション情報提供部180から情報の受信を試みる。
ステップ202) 情報を受信した場合にはステップ203に移行し、受信していない場合には、ステップ201に移行する。
ステップ203) 目的関連度付加部222は、ナビゲーション情報提供部180から取得した情報の特徴的表現と、閲覧目的をキーにして、タイプ・クラス・閲覧目的関連度DB225のタイプ・閲覧目的関連度テーブル225−Bを検索し、情報送受信部221から受け取った情報のページタイプに閲覧する場合の目的との関連度を抽出して付与する。
ステップ204) 更に、目的関連度付加部222は、ナビゲーション情報提供部180から取得した情報のページタイプと、閲覧目的をキーとして、タイプ・クラス・閲覧目的関連度DB225のクラス・閲覧目的関連度テーブル225−Aを検索し、特徴的表現のクラスに関する目的との関連度を抽出して付与する。
ステップ205) 次に、閲覧候補表示・選択部223では、ページタイプと次の閲覧目的をキーとして、タイプ・次の閲覧目的関連度DB226から、ページタイプに関する次の目的との関連度を取得する。
ステップ206) 閲覧候補表示・選択部223は、ページタイプと高い関連度の次の目的順にラベル(目的ラベル)を提示し、その下に関連度の高い順に特徴表現の目的ラベルを提示する。
例えば、上の階層の次の目的ラベルは、
・全体を知る;
・時間の流れを知る;
・概要を知る;
・評判を知る;
・類似する他を知る;
・他と比較する;
・不明点を知る;
・販売先を知る;
等である。
また、下に提示される特徴的表現のラベルとしては、
・店名(○×電気店、△マーケット);
・評価表現(すばらしい、いまいち、など);
・商品名(○○、××)
等である。
ステップ207) 提示したことによりユーザによってラベルが選択されたらWebブラウザ210に表示すべきURLを送信する。Webブラウザ210は、URLを受け取ると、図12、図13に示すように、インターネット上のWebページを表示する。図12は、商品カタログタイプのページを閲覧中に、そのページのタイプと関連性の高い次の閲覧目的順に、周辺Webページを提示した例を示し、図13は、ニュースタイプのナビゲーションの例を示す。
表示が完了すると、以下の処理に移行する。
次に、ユーザ端末200における閲覧候補提示・選択部223における表示完了の動作について説明する。
図14は、本発明の一実施の形態における表示完了処理の動作のフローチャートである。
ステップ301) 表示完了抽出部224は、Webブラウザ210からの表示完了イベントの取得を試みる。
ステップ302) 表示完了イベントが取得できた場合にはステップ303に移行し、取得できない場合にはステップ301に移行する。
ステップ303) Webブラウザ210からURLを取得する。
ステップ304) 表示完了抽出部224は、取得したURL情報を情報送受信部221サーバ100のナビゲーション情報提供部180に送信する。
上記の動作により、現在閲覧中のWebページに関連し、次に閲覧したいWebページを、ページのタイプ(インデックス、ニュース、ブログ、商品カタログなどの分類)と関連度の高い目的ラベルを提示し、目的ラベル以下にWebページを、含まれる特徴的表現で代表したラベルとしてWebブラウザ210のページ表示周辺に提示することにより、ユーザには、次に閲覧したいWebページの閲覧する目的(現在見ている情報の詳細な情報が知りたい、現在見ている商品カタログ情報の販売店を知りたい、現在見ているニュースの時間的な流れを知りたいなど)が明確に示され、その提示された目的ラベルを辿って次のWebページを閲覧し続けることにより、次に見たいWebページが提示され続け、連続的なナビゲーションが実現される。
なお、上記のサーバ及びユーザ端末の動作をプログラムとして構築し、サーバ、ユーザ端末として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることも可能である。
また、構築されたプログラムを、コンピュータに接続されるハードディスク、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、インストールして実行させることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、インターネットを介したWebページの閲覧支援技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態における情報ナビゲーションシステムの構成図である。 本発明の一実施の形態におけるページDBの構成例である。 本発明の一実施の形態におけるページタイプ分類部の構成図である。 本発明の一実施の形態における特徴的表現クラス・タイプ関連度DBの構成例である。 本発明の一実施の形態におけるユーザ端末のナビゲーション提示・選択部の構成図である。 本発明の一実施の形態におけるタイプ・クラス・閲覧目的関連度DBの構成例である。 本発明の一実施の形態におけるタイプ・次の閲覧目的DBの構成例である。 本発明の一実施の形態におけるサーバの動作のフローチャートである。 本発明の一実施の形態におけるユーザ端末の動作のフローチャートである。 本発明の一実施の形態における商品カタログタイプのナビゲーションの例である。 本発明の一実施の形態におけるニュースタイプのナビゲーションの例である。 本発明の一実施の形態における表示完了処理のフローチャートである。
符号の説明
100 サーバ
110 コントローラ
120 Webクローリング手段、Webクローリング部
130 固有表現抽出手段、固有表現抽出部
151 重み付け部
152 分類部
153 特徴的表現クラス・タイプ関連度DB
140 インデックス作成手段、語インデクサ
150 ページタイプ分類手段、ページタイプ分類部
160 索引語DB
170 ページDB
171 ページテーブル
172 特徴的表現出現確率テーブル
180 ナビゲーション情報提供手段、ナビゲーション情報提供部
200 ユーザ端末
210 Webブラウザ
220 ナビゲーション提示・選択手段、ナビゲーション提示・選択部
221 情報送受信部
222 目的関連度付加部
223 閲覧候補表示・選択部
224 表示完了抽出部
225 タイプ・クラス閲覧目的関連度DB
225−A クラス・閲覧目的関連度テーブル
225−B タイプ・閲覧目的テーブル
226 タイプ・次の閲覧目的関連度DB
230 ページ要求手段
300 情報サーバ
400 インターネット

Claims (10)

  1. ユーザ端末とサーバを有するシステム上で、ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するための情報ナビゲーション方法において、
    前記サーバは、
    提示対象とするWebページをインターネットを介して収集し、ページデータベース(DB)に格納するWebクローリングステップと、
    前記ページDBのWebページから索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、前記ページDBに格納する固有表現抽出ステップと、
    索引語DB上に転置インデックスを作成するインデックス作成ステップと、
    前記ページDBから前記特徴的表現を読み出してページタイプを分類し、前記ページDBに格納するページタイプ分類ステップと、を行い、
    前記ユーザ端末は、
    ユーザが閲覧していたWebページのURL情報を取得し、前記サーバに対して送信することにより、Webページに関する情報を要求する要求ステップを行い、
    前記サーバは、
    前記ユーザ端末からの前記URL情報に基づいて、前記ページDB及び前記索引語DBを検索し、その結果を前記ユーザ端末に送信する検索結果送信ステップを行い、
    前記ユーザ端末は、
    前記サーバから送信された結果に基づいて、現在ユーザが閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与して前記Webブラウザのページ表示の周辺に表示するナビゲーション提示・選択ステップを行う、
    ことを特徴とする情報ナビゲーション方法。
  2. 前記ナビゲーション提示・選択ステップにおいて、
    前記ユーザが現在閲覧しているWebページのタイプに関して、次に閲覧したい割合が統計的に高い順に目的ラベルを分類して前記Webブラウザのページ表示の周辺に提示し、そのラベル配下に関連するWebページを、目的と統計的に関連性が高い特徴的表現の属するクラスの順に、Webページに含まれる特徴的表現ラベルを提示する請求項1記載の情報ナビゲーション方法。
  3. 前記ページタイプ分類ステップにおいて、
    前記Webページのページタイプを判定する際に、該Webページの特徴的表現を抽出し、事前に各ページタイプで最適に設定された特徴的表現の属するクラスの重みにより、重み付けを行った特徴的表現を用いて、該Webページが各ページタイプに属する確率を算出する請求項1記載の情報ナビゲーション方法。
  4. 前記検索結果送信ステップにおいて、
    前記ページDBから取得したページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報を前記ユーザ端末に送信し、
    前記周辺Webページについては、前記ユーザ端末から受け取った前記URL情報で指定される閲覧中のWebページに含まれる特徴的表現と同じ特徴的表現が含まれるWebページを前記索引語DBから取得する請求項1記載の情報ナビゲーション方法。
  5. ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類して提示するためのサーバ及びユーザ端末を有する情報ナビゲーションシステムであって、
    前記サーバは、
    Webページに関する情報を保持するページDBと、
    転置インデクスを保持する索引語DBと、
    前記索引語DB上に転置インデックスを作成するインデックス作成手段と、
    提示対象とするWebページをインターネットを介して収集し、前記ページDBに格納するWebクローリング手段と、
    前記ページDBのWebページから索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、該ページDBに格納する固有表現抽出手段と、
    前記ページDBから前記特徴的表現を読み出してページタイプを分類し、前記ページDBに格納するページタイプ分類手段と、
    ユーザ端末から送信されたURL情報に基づいて、前記ページDB及び前記索引語DBを検索し、その結果を前記ユーザ端末に送信するナビゲーション情報提供手段と、を有し、
    前記ユーザ端末は、
    Webページを表示するためのWebブラウザと、
    ユーザが閲覧していたWebページのURL情報を取得し、前記サーバに対して送信することにより、Webページに関する情報を要求するWebページ要求手段と、
    前記サーバから送信された結果に基づいて、現在閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与して前記Webブラウザのページ表示の周辺に表示するナビゲーション提示・選択手段と、を有する
    ことを特徴とする情報ナビゲーションシステム。
  6. 前記ナビゲーション提示・選択手段は、
    前記現在閲覧しているWebページのタイプに関して、次に閲覧したい割合が統計的に高い順に目的ラベルを分類して前記Webブラウザのページ表示の周辺に提示し、そのラベル配下に関連するWebページを、目的と統計的に関連性が高い特徴的表現の属するクラスの順に、Webページに含まれる特徴的表現ラベルを提示する手段を含む請求項5記載の情報ナビゲーションシステム。
  7. 前記ページタイプ分類手段は、
    前記Webページのタイプを判定する際に、該Webページの特徴的表現を抽出し、事前に各ページタイプで最適に設定された特徴的表現の属するクラスの重みにより、重み付けを行った特徴的表現を用いて、該Webページが各ページタイプに属する確率を算出する手段を含む請求項5記載の情報ナビゲーションシステム。
  8. 前記ナビゲーション情報提供手段は、
    前記ページDBからページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報を取得し、前記ユーザ端末に送信する手段を含み、
    前記周辺Webページについては、前記ユーザ端末から受け取った前記URL情報で指定される閲覧中のWebページに含まれる特徴的表現と同じ特徴的表現が含まれるWebページを前記索引語DBから取得する請求項5記載の情報ナビゲーションシステム。
  9. ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するシステムにおけるサーバに実行させるための情報ナビゲーションプログラムであって、
    提示対象とするWebページをインターネットを介して収集し、ページデータベース(DB)に格納するWebクローリングステップと、
    前記ページDBのWebページから索引語、Webページのページタイプ分類のための特徴、候補として提示するための特徴的表現として固有表現を抽出し、該ページDBに格納する固有表現抽出ステップと、
    索引語DB上に転置インデックスを作成するインデックス作成ステップと、
    前記ページDBから前記特徴的表現を読み出してページタイプを分類し、該ページDBに格納するページタイプ分類ステップと、
    ユーザ端末から受信した、閲覧中のWebページのURL情報に基づいて、前記ページDB及び前記索引語DBを検索した結果得られた、ページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報を前記ユーザ端末に送信する検索結果送信ステップと、をコンピュータに実行させることを特徴とする情報ナビゲーションプログラム。
  10. ユーザがWebページを閲覧し、そのWebページの次に閲覧したい他のページをわかりやすく分類してWebブラウザのページ表示の周辺に提示するシステムにおけるユーザ端末に実行させるための情報ナビゲーションプログラムであって、
    ユーザが閲覧していたWebページのURL情報を、サーバに対して送信することにより、Webページに関する情報を要求する要求ステップと、
    前記サーバから送信されたページタイプ、周辺Webページのタイトル、URL,ページタイプ、特徴的表現の情報に基づいて、現在閲覧しているWebページの次に閲覧したいWebページを目的指向に応じて分類し、目的ラベルを付与して前記Webブラウザのページ表示の周辺に表示するナビゲーション提示・選択ステップと、をコンピュータに実行させることを特徴とする情報ナビゲーションプログラム。
JP2005047864A 2005-02-23 2005-02-23 情報ナビゲーション方法及び装置及びプログラム Pending JP2006235875A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005047864A JP2006235875A (ja) 2005-02-23 2005-02-23 情報ナビゲーション方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005047864A JP2006235875A (ja) 2005-02-23 2005-02-23 情報ナビゲーション方法及び装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2006235875A true JP2006235875A (ja) 2006-09-07

Family

ID=37043469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005047864A Pending JP2006235875A (ja) 2005-02-23 2005-02-23 情報ナビゲーション方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2006235875A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法
JP2010086343A (ja) * 2008-09-30 2010-04-15 Toshiba Corp ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
JP2011043908A (ja) * 2009-08-19 2011-03-03 Nippon Hoso Kyokai <Nhk> 番組検索装置および番組検索プログラム
JP2011253415A (ja) * 2010-06-03 2011-12-15 Yahoo Japan Corp フレーズに基づくクエリサジェスチョン装置及び方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法
JP2010086343A (ja) * 2008-09-30 2010-04-15 Toshiba Corp ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
US9189562B2 (en) 2008-09-30 2015-11-17 Kabushiki Kaisha Toshiba Apparatus, method and program product for classifying web browsing purposes
JP2011043908A (ja) * 2009-08-19 2011-03-03 Nippon Hoso Kyokai <Nhk> 番組検索装置および番組検索プログラム
JP2011253415A (ja) * 2010-06-03 2011-12-15 Yahoo Japan Corp フレーズに基づくクエリサジェスチョン装置及び方法

Similar Documents

Publication Publication Date Title
JP4591217B2 (ja) 推薦情報提供システム
US7644101B2 (en) System for generating and managing context information
CN1648902B (zh) 统一和混合搜索的系统和方法
US8005832B2 (en) Search document generation and use to provide recommendations
US7783622B1 (en) Identification of electronic content significant to a user
US10607235B2 (en) Systems and methods for curating content
US9396485B2 (en) Systems and methods for presenting content
US8849818B1 (en) Searching via user-specified ratings
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
US20150186540A1 (en) Method for inputting and processing feature word of file content
US20110252016A1 (en) Providing Relevance-Ordered Categories of Information
US20100095194A1 (en) Image based annotation and metadata generation system with experience based learning
CN103339623A (zh) 涉及因特网搜索的方法和设备
JP2011227922A (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
EP2122495A2 (en) Presentation of location related and category related search results
JP2008547119A (ja) サーチ結果を提供するためのシステムおよび方法
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
JP2009026249A (ja) 閲覧履歴編集端末及びプログラムおよびその方法
US20140082550A1 (en) Systems and methods for integrated query and navigation of an information resource
TWI507902B (zh) A retrieval system, a retrieval condition setting device, a control method of a search condition setting device, a computer program product, and an information memory medium
CN101681370A (zh) 组合的个人及社区列表
JP2006235875A (ja) 情報ナビゲーション方法及び装置及びプログラム
JP5200699B2 (ja) 情報処理装置、情報処理方法およびプログラム
KR20140056635A (ko) 컨텐츠 추천 서비스 제공 시스템 및 방법