JP2005346609A - Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2005346609A
JP2005346609A JP2004168259A JP2004168259A JP2005346609A JP 2005346609 A JP2005346609 A JP 2005346609A JP 2004168259 A JP2004168259 A JP 2004168259A JP 2004168259 A JP2004168259 A JP 2004168259A JP 2005346609 A JP2005346609 A JP 2005346609A
Authority
JP
Japan
Prior art keywords
web page
information
page
user
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004168259A
Other languages
English (en)
Other versions
JP4431744B2 (ja
Inventor
Yukiko Kawai
由起子 河合
Katsumi Tanaka
克己 田中
Daisuke Kanjo
大輔 官上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2004168259A priority Critical patent/JP4431744B2/ja
Publication of JP2005346609A publication Critical patent/JP2005346609A/ja
Application granted granted Critical
Publication of JP4431744B2 publication Critical patent/JP4431744B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】複数のWebサイトから収集されたWebページ情報をユーザ個人の興味を基に分類して融合し、融合した情報をユーザの好みのページのレイアウトを通して表示することを可能とする。
【解決手段】Webページ取得手段12がユーザ端末2から入力されたポータルページのURLに対応するWebページを取得し、Webページ解析手段13が前記Webページを解析して置換される内容を検出し、興味語・興味木作成手段17が興味語の抽出、興味木の作成を行い、置換情報選出手段18が興味語、興味木とWebページテーブル150とに基づいて、前記Webページの置換される内容を置換する情報を選出し、融合情報作成手段19が前記置換される内容を前記選出された置換情報に置換して融合情報を作成し、融合情報送信手段20が融合情報をユーザ端末2に送信する。
【選択図】図2

Description

本発明は、Webページ情報融合表示技術に関し、複数のWebサイトから自動的にWebページを収集し、特に、ユーザの好みのWebサイトのポータルページのレイアウトを通して、ユーザの興味に基づいて分類し融合したWebページ情報を表示するWebページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
近年、膨大なWebページから、より信頼度の高い情報をより効率的にユーザへ提供するため、複数のWebサイトにまたがって存在している同じテーマのコンテンツを、まとめて閲覧できるWebブラウザが求められている。
従来から、複数のWebサイトから大量のWebページを収集し、収集したWebページをカテゴリに基づいて分類して融合することで、カテゴリごとのまとまった情報を提供するWeb情報融合システムは存在する。これによりユーザは、各Webサイトにアクセスすることなく、融合されたページを提供している特定のサイトにアクセスするだけで、カテゴリごとにまとめられた複数のページの情報を閲覧することができる。
上記従来のWeb情報融合システムの具体的な例として、例えば、下記の非特許文献1に記載された技術がある。
Kathleen R. McKeown, Regina Barzilay, David Evans, Vasileios Hatzivassiloglou, Judith L. Klavans, Ani Nenkova, carl Sable, Barry Schiffman, and Sergey Sigelman. Tracking and Summarizing News on a Daily Basis with Columbia's Newsblaster. In Proceedings of the Human Language Technology Conference, 2002,San Diego, USA, 2002. ACM.
しかし、従来のWeb情報融合システムでは、収集した情報をシステムの仕様に基づき分類し融合して表示するため、ユーザはそのシステムの分類体系やページのレイアウトにすぐに順応できず、欲しい情報を速やかに獲得することが困難である。
すなわち、カテゴリの設定は融合サービスを提供している管理者によって決められているため、ユーザは融合されたページを閲覧する際、あらかじめ設定されているカテゴリを予想する必要がある。また、自身の知りたい情報がどのカテゴリに分類されているかを推測する必要もある。
例えば、従来のWeb情報融合システムでは、複数のニュースサイトの情報を融合した場合、「政治」、「スポーツ」、「国際」などの複数のカテゴリを管理者が設定しており、ユーザは設定されているカテゴリの種類を把握し、欲しい記事がどのカテゴリに含まれているかを判別しなければならない。さらに、融合されたページのレイアウトも融合サービスを提供している管理者によって決められているため、欲しい記事を迅速に見つけるためにも、融合されたページのレイアウトを使い慣れる必要がある。
本発明は、上記従来技術の問題点を解決し、複数のWebサイトから収集されたWebページ情報をユーザ個人の興味を基に取捨選択して自動分類して融合し、かつ、融合した情報をユーザの好みのページのレイアウトを通して表示するWebページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体の提供を目的とする。
上記課題を解決するため、本発明は以下に示す構成を採る。図1は、本発明の原理を説明する図である。ここでは、複数のニュースサイトの情報をユーザの興味に基づき取捨選択して自動分類し融合して、ユーザの指定したニュースサイトのポータルページ(例えば、CNNサイトのポータルページ)のレイアウトを通じて、融合された情報をユーザ端末に表示する場合を例にとって説明する。
ここで、ポータルページとは、インターネットを通じて様々な情報源にアクセスできるWebページの総称であり、本発明におけるポータルページは、上記CNNサイトのポータルページに限られない。
図1において、1はWebページ情報融合表示装置、100は、ユーザ端末の表示画面、110はニュースを分類しているカテゴリ毎のキーワードの表示領域、111は画像付きトップ記事の表示領域、112はカテゴリ毎に分類されるニュース記事のタイトル集の表示領域である。この110〜112が、収集されたWebページ情報の内容と置換された部分の領域である。
ユーザは、ユーザ端末の表示画面100において、自身の使い慣れているニュースサイトのポータルページのURLを指定して入力する(P1)。例えば、ユーザがCNNサイトのポータルページのURLを入力すると、入力されたURLとユーザのWebページ閲覧履歴情報がWebページ情報融合表示装置1に送信される(P2)。ここで、Webページ情報融合表示装置1では、予めNewsweekやUSATODAY等複数のニュースサイトから複 数のWebページを収集している(P0)。
Webページ情報融合表示装置1は、入力されたURLに対応するCNNサイトのポータルページのレイアウトを解析して、置換される内容を検出する。さらに、予め収集された複数のニュースサイトのWebページのメタデータと、ユーザのWebページ閲覧履歴情報とに基づいて構築されたユーザの興味の分類体系とに基づいて、オリジナルのCNNサイトのポータルページの内容を置換する情報を選出し、上記オリジナルのCNNサイトのポータルページの置換される内容を、選出された置換情報に置換する。
この置換処理によって、融合されたWebページが作成される。Webページ情報融合表示装置1は、融合されたWebページをユーザ端末に送信する(P3)。その結果、ユーザ端末上には、融合されたWebページが表示される(P4)。
本発明では、上記のようにして、例えば複数のニュースサイトの融合された情報が、CNNのレイアウトを通して表示される。
オリジナルのCNNサイトのポータルページでは、カテゴリ毎のキーワードは、例えば、"World"、"U.S"、"Weather"、"Business"などであるが、融合されたWebページ情報が表示されているユーザ端末の表示画面100においては、カテゴリ毎のキーワードの表示領域110に示すように、"Iraq"、"Matsui"、"Koizumi" 、"Matrix"といったキーワードに置換されている。
また、この新たなキーワードに対応するトップ記事が、オリジナルのトップ記事と置換されて、画像付きトップ記事の表示領域111に表示される。図1中では、置換後の"Iraq"というキーワードに対応するトップ記事の内容とその画像が画像付きトップ記事の表示領域111に表示されている。
さらに、収集された大量のWebページは、上記新たなキーワードに対応する新たなカテゴリに基づき分類され選別されて、カテゴリ毎に分類されるニュース記事のタイトル集の表示領域112に新たなニュース記事のタイトル集として表示される。
ユーザはカテゴリ毎に分類されるニュース記事のタイトル集の表示領域112に表示された記事のタイトルを選択しクリックすると、選択した記事の内容を閲覧できる。例えば、キーワード"Matsui"に対応するカテゴリに基づくニュース記事のタイトルの1つを選択すると、そのタイトルとリンクしているニュースサイト(例えばNewsweekサイト)のオリジナルの記事がユーザ端末上に表示される(P5、P6)。
さらに、ユーザが記事を閲覧することにより、Webページ閲覧履歴情報が更新されることから、閲覧後、上記CNNサイトのポータルページへ再度アクセスすると、カテゴリ毎のキーワードの表示領域110、画像付きトップニュースの表示領域111、カテゴリ毎に分類されるニュース記事のタイトル集の表示領域112における表示内容が変更される。よって、ユーザは記事を閲覧する度に、新たに融合されたWebページ情報を獲得できる。
すなわち、本発明は、複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示装置であって、ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信手段と、予め収集された複数のWebページを蓄積するWebページ蓄積手段と、前記受信したポータルページの表示要求に基づいて、前記Webページ蓄積手段に蓄積された複数のWebページから前記ポータルページを取得するWebページ取得手段と、前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析手段と、前記Webページ蓄積手段に蓄積された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成手段と、ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成手段と、前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析手段による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出手段と、前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成手段と、前記融合されたWebページ情報をユーザ端末に送信する融合情報送信手段とを備えることを特徴とするWebページ情報融合表示装置である。
また、本発明は、複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示方法であって、ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信ステップと、前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得ステップと、前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析ステップと、前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成ステップと、ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成ステップと、前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析ステップによる解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出ステップと、前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成ステップと、前記融合されたWebページ情報をユーザ端末に送信する融合情報送信ステップとを有することを特徴とするWebページ情報融合表示方法である。
また、本発明は、複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムであって、ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、コンピュータに実行させるためのWebページ情報融合表示プログラムである。
また、本発明は、複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムを記録した記録媒体であって、ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、コンピュータに実行させるためのWebページ情報融合表示プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明は、Webページ融合の際に必要なカテゴリの分類体系を、ユーザが容易に把握できるWebページ情報融合表示技術を提案する。本発明は、以下の特徴を有する。一つは、ユーザの使い慣れているWebサイトのポータルページを融合ページのインタフェースとして代用する。
これにより、ユーザに潜在する好みの分類体系を可視化した一つの「使い慣れているページのレイアウト」を通して、融合したWebページ情報を提示できるという特徴をもつ。もう一つの特徴は、ユーザのWebページ閲覧履歴情報に基づき興味の分類体系を動的に構築することで、収集されたWebページ情報をユーザの興味に基づき自律的に分類して融合し、提供することである。
すなわち、本発明によれば、ユーザの使い慣れているWebサイトのポータルページを利用することで、ユーザに潜在する好みのレイアウトを通して、融合したWebページ情報を提示することができる。
また、本発明によれば、ユーザのWebページ閲覧履歴情報に基づき興味の分類体系(興味木)を動的に構築し、自律的にWebページ情報を分類し融合して、融合したWebページ情報を提示することが可能となる。
以下に、図を用いて、本発明の実施の形態を説明する。図2は、本発明のWebページ情報融合表示装置1の構成の一例を示す図である。図2中、1はWebページ情報融合表示装置、2はユーザ端末である。
Webページ情報融合表示装置1において、11はWebページ表示要求受信手段、12はWebページ取得手段、13はWebページ解析手段、14はWebページ蓄積手段、15はWebページテーブル作成手段、16はWebページ閲覧履歴情報蓄積手段、17は興味語・興味木作成手段、18は置換情報選出手段、19は融合情報作成手段、20は融合情報送信手段、150はWebページテーブルである。
Webページ表示要求受信手段11は、ユーザ端末2から送信されたWebページ表示要求を受信する。具体的には、ユーザの使い慣れているWebサイトのポータルページの表示要求を受信する。
Webページ取得手段12は、受信されたWebページ表示要求に基づいて、ユーザの使い慣れているWebサイトのポータルページをWebページ蓄積手段14に蓄積されたWebページから取得する。Webページ解析手段13は、取得されたポータルページを解析して、後に置換情報選出手段18により選出された置換情報と置換される内容を検出する。
Webページ蓄積手段14には、収集された複数のサイトの大量のWebページが蓄積されている。Webページテーブル作成手段15は、Webページ蓄積手段14に蓄積されたWebページのメタデータの日付と概要から、単語とその重みに関するテーブルであるWebページテーブル150を作成する。
Webページ閲覧履歴情報蓄積手段16には、ユーザ端末2から送信された、ユーザのWebページ閲覧履歴情報が蓄積される。興味語・興味木作成手段17は、後述するように、Webページ閲覧履歴情報とWebページテーブル150とに基づいて、ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する。
置換情報選出手段18は、抽出された興味語、作成された興味木とWebページテーブル150とに基づいて、Webページ解析手段13による解析の結果検出されたWebサイトのポータルページの置換される内容を置換する置換情報を選出する。
融合情報作成手段19は、検出されたWebサイトのポータルページの置換される内容を置換情報選出手段18により選出された置換情報に置換して、融合されたWebページ情報を作成する。融合情報送信手段20は、融合されたWebページ情報をユーザ端末2に送信する。
図3〜図13を用いて、Webページ情報融合表示処理について具体的に説明する。図3は、Webページ情報融合表示処理フローの一例を示す図である。まず、ユーザ端末2からポータルページのURLとWebページ閲覧履歴情報を受信する(ステップS1)。
次に、受信したURLに対応するWebページであるポータルページを取得する(ステップS2)。取得したポータルページを解析し、置換される内容を検出する(ステップS3)。Webページ閲覧履歴情報とWebページテーブル150とに基づいて、ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する(ステップS4)。
抽出された興味語、作成された興味木とWebページテーブル150とに基づいて、検出されたポータルページの置換される内容を置換する置換情報を選出し(ステップS5)、Webサイトのポータルページの置換される内容を置換情報選出手段18により選出された置換情報に置換して、融合されたWebページ情報を作成する(ステップS6)。そして、融合されたWebページ情報をユーザ端末2に送信する(ステップS7)。
以下に、ステップS3における、ポータルページの置換される内容の検出処理を、具体例を挙げて説明する。例えば、5つのニュースサイトのポータルページを分析したところ、ニュースサイトのポータルページは、主に以下の5つの内容に基づく領域で構成されていることが明らかとなった。
(1)ニュースサイトのロゴの画像
(2)カテゴリ毎のキーワード
(3)画像とタイトルで構成されるトップ記事(画像付きトップ記事)
(4)カテゴリ毎に分類されるニュース記事のタイトル集
(5)広告
本発明では、ユーザの興味に基づきページを分類して融合するため、例えばオリジナルのニュースサイトのポータルページの内容のうち、(2)と(4)の内容を、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。また、例えば、(3)の画像付きトップ記事の内容も、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。以上より、本発明では、例えば、(1)、(5)の内容はオリジナルのままとし、(2)〜(4)までの3項目の内容を置換情報と置換する。以下に、ポータルページの置換される内容の検出手法について説明する。
本発明のWebページ情報融合表示装置1内のWebページ解析手段13は、例えばユーザがURLで指定したニュースサイトのポータルページのレイアウトを解析し、置換されるべき上記(2)〜(4)までの3項目の内容を検出する。
図4は、ポータルページのレイアウトを形成しているHTMLのTABLE構造の例を示す図である。一般に、HTMLでは、TABLE構造から、データ、テキスト、画像等を行と列のセルに配列できる。
そこで、Webページ解析手段13は、例えば図4のHTMLのTABLE構造をxy座標に変換して、セルの座標を算出し、セルの座標値とセル内の特徴を利用して、置換される内容を検出する。
(座標変換によるセルの抽出)
多くのポータルページのレイアウトの形成には、HTMLのTABLE構造が利用されている。そこで、このTABLE構造を解析して、セルの座標を算出する。HTMLのTABLE構造は、1つ以上の行で構成され、各行は1つ以上のセルで構成されており、行と列に配列した多次元のデータの表を構成できる。
一般に、TABLEの行全体はTRで、セルの指定はTDやTHで行われる。TABLEの幅はwidth属性により指定され、rowspan属性により行の連結、colspan属性により列の連結が各々指定される。以上の定義より、widthで全体の幅を決定し、TD、THの出現回数とcolspanの値により各行のセルの幅を算出し、x座標へ変換する。
y座標は、TRの出現回数により全体の高さを決定し、rowspanの値によりセルの高さを算出し、y座標へ変換する。以上の手順により、例えば図4に示す簡素化されたHTMLのTABLE構造をxy座標値へ変換し、例えば図5に示すようなセルが抽出される。
(置換される内容の検出)
算出した各セルのxy座標値と、置換される3項目(上述した(2)〜(4))の情報の各々の特徴を基に、オリジナルのポータルページから、置換される上記3項目の内容を検出する。検出する3項目の情報の特徴の例を以下に示す。
(A)カテゴリ毎のキーワードの特徴
・キーワードに基づいてセル内の構造がパターン化されている。
(B)画像とタイトルで構成されるトップ記事の特徴
・「カテゴリ毎のキーワード」のx座標値より大きい。
・画像1枚とタイトル1つが同一ニュース記事をリンクしている。
(C)カテゴリ毎に分類されるニュース記事のタイトル集の特徴
・「画像とタイトルのトップ記事」のy座標値より小さい。
・「カテゴリ毎のキーワード」と同じキーワードが存在する。
・カテゴリ毎に1つ以上のリンク付きタイトルが存在する。
本発明の実施の形態では、例えば、上記(A)〜(C)を条件とし、オリジナルのポータルページの置換される上記3項目の内容を検出する。
次に、ステップS4における、興味語の抽出処理および興味木の作成処理について説明する。
(Webページテーブルの作成)
Webページテーブル作成手段15は、Webページ蓄積手段14に蓄積されているWebページのメタデータの日付と概要から、単語とその重みに関するWebページテーブル150を作成する。Webページテーブル150の一例を図6に示す。
Webページテーブル150には、例えば、WebページのページID、メタデータの日付、各ページ毎の単語とその単語の重みといったデータ項目が格納される。図6の例では、ページPi の単語Aの重みはwiA、単語Bの重みはwiB、単語Cの重みはwiCである。
各ページの単語の抽出は、概要を形態素解析し、固有名詞、一般名詞、動詞の各単語を抽出する。ページPi の単語jの重みwijは、出現頻度(Term-Frequency)であるtfと、品詞の種類に対応した重みWc (c=1...3)を用いて、図7に示す(式1)より算出する。
(興味語の抽出処理)
興味語は、オリジナルのポータルページのカテゴリのキーワードを置換する単語であり、新たなキーワードとなるものである。興味語は、閲覧したページに出現する単語のうち、重みの総和値Ij が閾値以上の単語とする。閲覧したページをPi (i=1,...,n)、ページPi に出現する単語をj、単語jの重みをwij とすると、
Figure 2005346609
となる。
このIj 値が閾値以上の場合に興味語として抽出される。そして、抽出された興味語が、Ij 値の大きい順に、新たなキーワードとして、オリジナルのポータルページのカテゴリ毎のキーワードを置換する。本発明の実施の形態においては、例えば、オリジナルのポータルページの先頭のキーワードから順に置換される。
図8にオリジナルのポータルページのカテゴリ毎のキーワードの置換の流れの一例を示す。図8(A)はオリジナルのポータルぺージに表示されているカテゴリ毎のキーワードの例であり、図8(B)および図8(C)は、キーワードの置換後にポータルページ上に表示されるキーワードを示す。
図8(B)に示すように、Ij 値が閾値以上の興味語の数が、図8(A)のオリジナルのポータルページに表示されているカテゴリのキーワードの数m(図8(A)ではm=6)より少ない場合、置換されなかったカテゴリのキーワードが残る。
例えば、Ij 値の閾値を1.0とし、図8(B)に示すように、IA =2.3の単語AとIB =1.5の単語Bという2個の単語が新たなキーワード(興味語)として選択されるとすると、図8(A)に示すキーワード中、「World 」が「A」に、「Business」が「B」に置換される。
また、興味語の数が図8(A)に示すキーワード数6より少ないため、図8(B)においては、置換されなかったカテゴリのキーワードである「Money 」、「Weather 」、「Arts」が残る。
例えば、置換されたカテゴリのキーワードはまとめられて、m個目のキーワードに「Others」として表示される。ユーザ端末2上では、例えば「Others」にマウスを近付けると、まとめられたキーワードがプルダウン式で表示されるようにすることができる。
逆に、図8(C)に示すように、興味語がオリジナルのポータルページのキーワードの数mより多くなった場合、Ij 値がm番目以下の興味語はまとめられて、図8(A)に示すm個目のカテゴリのキーワードを「Others」として置換する。
例えば、図8(C)において、Ij 値が閾値以上の7個の単語A〜Gが興味語として選択されたとすると、Ij 値が6番目以下の興味語である単語Fと単語Gは、図8(C)に示すように、「Others」としてキーワード「Arts」を置換する。
なお、本発明においては、カテゴリ毎のキーワードの置換の態様は図8に示したものに限定されない。例えば、オリジナルのポータルページの末尾のキーワードから順に置換するようにしてもよい。
(興味木の作成処理)
興味木は、抽出された興味語ごとに作成される。各興味語をルートノードとし、同じページに出現するルートノード以外の単語を子ノードとする。ルートノードと子ノードとのリンクは、以下に示すように、閲覧された全てのページから単語間の共起度を算出し、さらに単語の閲覧時刻の情報をユーザのWebページ閲覧履歴情報に基づいて抽出し、それらの情報を基にノード間の重要度を決定し、形成される。
図9に、ユーザがページPi を閲覧した後に、Aが興味語として抽出された場合の、Aに対する興味木を示す。まず、ユーザがページPi を閲覧すると、例えば、図9(A)に示すように、Aをルートノードとし、その他の単語B、Cが子ノードとしてリンクが形成される。各ノードとのリンクには、例えば興味語AとA以外の単語jとの共起度がリンクの重みcwijとして付加される。
例えば、図9(A)には、単語AとB、AとCの共起度がリンクの重みcwiB、cwiCとして付加される。図9中、リンクの線の太さは、ルートノードと子ノードとのリンクの重み(cw)に比例するものとする。
次に、ユーザがページPi+1 を閲覧した場合、Aをルートノードとする興味木が再構築される。再構築は、Aと共起している単語を子ノードとして追加する。共起語が、既に興味木に存在している場合は、そのリンクの重みが更新される。興味木に存在していない場合は、新たに子ノードとして追加され、重みとともにリンクが形成される。
例えば、閲覧されたページPi+1 に、図6のWebページテーブル150に示されるように、単語Aと共起して単語Bと単語Fが出現しているとすると、図9(B)に示すように、新たに単語Fがリンクの重みcw(i+1)Fとともに子ノードとして追加されるとともに、単語AとBとのリンクの重みがcw(i+1)Bとして更新される。
また、単語Aと共起して出現した共起語のノード(例えば、子ノードB、C,F)が再閲覧されない時間がT以上経過した場合、図9(C)に示すように、リンクの重みがαTの割合で削減される。このように、リンクの重みの算出に時間情報を用いることで、ユーザの最近の興味を反映できる。
次に、ステップS5における、Webサイトのポータルページの置換される内容を置換する置換情報の選出処理、ステップS6における融合されたWebページ情報の作成処理について以下に説明する。
Webページ情報融合表示装置1は、Webページ蓄積手段14に蓄積されたWebページから、興味語、興味木に基づいて、特定のWebページの選出を行う。そして、選出されたWebページの内容をオリジナルのポータルページの内容と置換して、融合されたWebページ情報を作成し、ユーザ端末2に送信する。
図10に、置換情報選出手段18によるWebページ選出の流れを示す。例えば、各興味語の出現するWebページをWebページ蓄積手段14に蓄積された図10(A)に示すページ集から図10(B)に示すように選出する。図10(B)には、興味語Aを含むWebページと興味語Bを含むWebページがそれぞれ示されている。
次に、選出した興味語毎のページ集から、興味木を基にさらに選別する。興味木を用いたページの選別過程においては、図10(C)に示すように、興味木との相関が高いページが選別される。
具体的には、興味木のリンクの重み情報から導かれる行列と、Webページテーブル150に格納された各ページの単語の重み情報から導かれる行列の内積値を下記のようにして算出し、内積値が閾値以上の記事をユーザの興味を反映したページとして選別する。
例えば、図11(A)に示すような、興味語「松井」をルートノードとする興味木が生成されているとする。例えば、ルートノード「松井」と子ノード「ホームラン」とのリンクの重みは0.5、子ノード「2割9分8厘」とのリンクの重みは0.3、子ノード「ヒット」とのリンクの重みは0.2、子ノード「三振」とのリンクの重みは0.1であるものとする。
一方、興味語が「松井」であるページ集に属するあるページにおいて、図11(B)に示すように、興味語「松井」と共起して出現する単語が「ホームラン」および「三振」であって、単語の重みがそれぞれ0.5、0.4であるものとする。
図11(A)中の子ノードと、図11(B)に示す興味語「松井」と共起して出現する単語をベクトル要素とする行列H=(ホームラン,2割9分8厘,ヒット,三振)を想定する。図11(A)に示す興味木中のルートノードと各子ノード(ホームラン,2割9分8厘,ヒット,三振)とのリンクの重みは、それぞれ0.5、0.3、0.2、0.1であるため、リンクの重み情報から導かれる行列Hは、図11(C)に示すように、(0.5,0.3,0.2,0.1)となる。
また、図11(B)に示す単語(ホームラン、三振)の単語の重みは、それぞれ0.5、0.4であるため、単語の重み情報から導かれる行列H’は、図11(C)に示すように、(0.5,0,0,0.4)となる。行列H’の「2割9分8厘」、「ヒット」という要素は、図11(B)に興味御と共起して出現する単語として挙げられていないため、これらの行列要素の値は0とする。
よって、興味木のリンクの重み情報から導かれる行列Hと、上記ページの単語の重み情報から導かれる行列H’との内積値は、例えば、0.5×0.5+0.3×0+0.2×0+0.1×0.4=0.29となる。
本発明の実施の形態においては、上記の手法によって算出される内積値が閾値以上のページをユーザの興味を反映したページとして図10(C)に示すように選別する。
また、図10(B)に示す興味語毎に選択されたページのうち、上記内積値が最大のページの記事とその記事内容を示す画像を、その興味語に対応するトップ記事とその記事内容を示す画像として選出する。そして、例えば、上述した重みの総和値Ij が最も高い興味語に対応するトップ記事および画像を、オリジナルのポータルページのトップ記事および画像を置換する記事および画像として選出する。
もちろん、本発明において、オリジナルのポータルページのトップ記事および画像を置換する記事および画像の選出方法は、上記の方法に限るものではない。
図10(C)のように選別されたページは、類似する内容の記事がある場合はさらに選別される。類似するページの判別は、例えば、一定時間(プロトタイプでは24時間)内に作成されたページで、各ページ間での単語の重み情報から導かれる行列の内積値を算出し、内積値が閾値以上のページ同士を類似ページとする(図10(D)参照)。
この類似するページのうちランダムに選択した一つを、類似するページ集の代表のページとし、代表のページのタイトルを抽出する(図10(E)参照)。この処理によって、興味語毎に代表のページのタイトル集が抽出される。
融合情報作成手段19は、オリジナルのポータルページの内容を置換して、融合されたWebページ情報を作成する。例えば、興味語・興味木作成手段17によって抽出された興味語を新たなキーワードとして、オリジナルのポータルページのカテゴリ毎のキーワードと置換する。
また、例えば、置換情報選出手段18が選出したトップ記事および画像のうち、重みの総和値Ij が最も高い興味語に対応するトップ記事および画像を、オリジナルのポータルページのトップ記事および画像と置換する。
また、例えば、上記興味語毎に抽出された代表のページのタイトル集を、オリジナルのポータルページのカテゴリ毎に分類されるニュース記事のタイトル集と置換する。なお、ランダムに選択されたページ(代表ページ)以外のページのタイトルは、例えばプルダウン式により表示する。この表示は、例えば、提示されている代表のタイトルにマウスを合わせると、類似する他の記事のタイトルが出現するという方法とする。
また、例えば、類似するページのタイトル間で重複する単語がある場合、それらの単語を薄く表示する。これにより、タイトルの内容の違いを強調して提示できる。
図12〜図13は、ユーザ端末上の画面表示の具体例を示す図である。まず、図12(A)に示すユーザ端末2の表示画面100において、ユーザが例えばCNNサイトのポータルページのURLを入力すると、入力されたCNNサイトのURLとユーザのWebページ閲覧履歴情報がWebページ情報融合表示装置1に送信される。
図12(B)は、オリジナルのCNNサイトのポータルページを示す図である。カテゴリ毎のキーワードの表示領域110には、元々、例えば"World"、"U.S"、"Weather"、"Business"、"Sports" 、"Politics"といったキーワードが表示されるはずであり、画像付きトップ記事の表示領域111には、元々、例えば図12(B)に示すように、アメリカ大統領選挙についての記事とその画像が表示されるはずである。
また、カテゴリ毎に分類されるニュース記事のタイトル集の表示領域112には、上記キーワード毎に分類されるニュース記事のタイトル集が表示されるはずである。
Webページ情報融合表示装置1は、例えば、図12(B)のように表示されるはずのオリジナルのCNNサイトのポータルページのレイアウトを解析して、収集されたWebページから選出された置換情報に置換される部分を検出する。例えば、上述した、カテゴリ毎のキーワードの表示領域110、画像付きトップ記事の表示領域111、カテゴリ毎に分類されるニュース記事のタイトル集の表示領域112の内容を置換される部分として検出する。
さらに、Webページ情報融合表示装置1は、上述したように、興味語、興味木と、Webページテーブル150とに基づいて、置換する情報を選出し、上記検出した置換される部分の情報を、選出された置換情報に置換して、融合情報を生成する。
例えば、興味語・興味木作成手段17によって、"Iraq"、"Matsui"、"Koizumi" 、"Matrix"、"N.Y" 、"Hawaii"という興味語が抽出されたとすると、融合情報作成手段19は、上記興味語を新たなキーワードとして、オリジナルのCNNサイトのポータルページにおける"World"、"U.S"、"Weather"、"Business"、"Sports" 、"Politics"というキーワードとそれぞれ置換する。
また、例えば、置換情報選出手段18によって、新たなキーワード"Iraq"に対応するトップ記事とその画像が置換情報として選出されたとすると、融合情報作成手段19は、"Iraq"に対応するトップ記事とその画像を、オリジナルのCNNサイトのポータルページにおけるトップ記事とその画像(アメリカ大統領選挙についての記事とその画像)と置換する。
また、例えば、置換情報選出手段18によって、新たなキーワード毎に、類似するページの代表のページのタイトル集が選出されたとすると、これらをオリジナルのCNNサイトのポータルページにおけるカテゴリ毎に分類されるニュース記事のタイトル集と置換する。
上記置換処理の結果、作成された融合情報がユーザ端末2に送信されることによって、ユーザ端末2の表示画面100には、図13(A)に示すような融合されたWebページが表示される。
そして、前述したように、ユーザが、ニュース記事のタイトル集の表示領域112に表示された記事のタイトルを選択しクリックすると、例えば、図13(B)に示すように、このタイトルとリンクするNewsweekサイトのオリジナルの記事の内容がユーザ端末2の表示画面100に表示される。
本発明の原理を説明する図である。 Webページ情報融合表示装置の構成の一例を示す図である。 Webページ情報融合表示処理フローの一例を示す図である。 HTMLのTABLE構造の例を示す図である。 抽出されたセルの例を示す図である。 Webページテーブルの一例を示す図である。 (式1)を示す図である。 オリジナルのポータルぺージのカテゴリのキーワードの置換の流れの一例を示す図である。 興味木の一例を示す図である。 置換情報選出手段によるWebページ選出の流れを示す図である。 興味木との相関が高いページの選別を説明する図である。 ユーザ端末上の画面表示の具体例を示す図である。 ユーザ端末上の画面表示の具体例を示す図である。
符号の説明
1 Webページ情報融合表示装置
2 ユーザ端末
11 Webページ表示要求受信手段
12 Webページ取得手段
13 Webページ解析手段
14 Webページ蓄積手段
15 Webページテーブル作成手段
16 Webページ閲覧履歴情報蓄積手段
17 興味語・興味木作成手段
18 置換情報選出手段
19 融合情報作成手段
20 融合情報送信手段
100 ユーザ端末の表示画面
110 カテゴリ毎のキーワードの表示領域
111 画像付きトップ記事の表示領域
112 カテゴリ毎に分類されるニュース記事のタイトル集の表示領域
150 Webページテーブル

Claims (4)

  1. 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示装置であって、
    ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信手段と、
    予め収集された複数のWebページを蓄積するWebページ蓄積手段と、
    前記受信したポータルページの表示要求に基づいて、前記Webページ蓄積手段に蓄積された複数のWebページから前記ポータルページを取得するWebページ取得手段と、
    前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析手段と、
    前記Webページ蓄積手段に蓄積された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成手段と、
    ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成手段と、
    前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析手段による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出手段と、
    前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成手段と、
    前記融合されたWebページ情報をユーザ端末に送信する融合情報送信手段とを備える
    ことを特徴とするWebページ情報融合表示装置。
  2. 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示方法であって、
    ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信ステップと、
    前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得ステップと、
    前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析ステップと、
    前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成ステップと、
    ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成ステップと、
    前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析ステップによる解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出ステップと、
    前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成ステップと、
    前記融合されたWebページ情報をユーザ端末に送信する融合情報送信ステップとを有する
    ことを特徴とするWebページ情報融合表示方法。
  3. 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムであって、
    ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
    前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
    前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
    前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
    ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
    前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
    前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
    前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
    コンピュータに実行させるためのWebページ情報融合表示プログラム。
  4. 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムを記録した記録媒体であって、
    ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
    前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
    前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
    前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
    ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
    前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
    前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
    前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
    コンピュータに実行させるためのWebページ情報融合表示プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004168259A 2004-06-07 2004-06-07 Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4431744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004168259A JP4431744B2 (ja) 2004-06-07 2004-06-07 Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004168259A JP4431744B2 (ja) 2004-06-07 2004-06-07 Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2005346609A true JP2005346609A (ja) 2005-12-15
JP4431744B2 JP4431744B2 (ja) 2010-03-17

Family

ID=35498897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004168259A Expired - Fee Related JP4431744B2 (ja) 2004-06-07 2004-06-07 Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4431744B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211156A (ja) * 2008-02-29 2009-09-17 Saitama Univ メタ情報付与システム、メタ情報表示システム、およびこれらのプログラム、および、当該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010049598A (ja) * 2008-08-25 2010-03-04 Naninani.Tv:Kk ウェブサイト作成支援装置及びウェブサイト作成支援プログラム
JP2010244126A (ja) * 2009-04-01 2010-10-28 Kddi Corp 小型情報端末向け注目語推定方式および検索方式
JP2011233017A (ja) * 2010-04-28 2011-11-17 Ricoh Co Ltd 情報処理装置、画像処理装置、画像処理システム、画面カスタマイズ方法、画面カスタマイズプログラム、及びそのプログラムを記録した記録媒体
JP2015079397A (ja) * 2013-10-17 2015-04-23 Necパーソナルコンピュータ株式会社 情報処理装置及び方法
JP2021128553A (ja) * 2020-02-13 2021-09-02 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2022074815A1 (ja) * 2020-10-09 2022-04-14 マクセル株式会社 携帯端末とヘッドマウントディスプレイ及びその連携表示システム
JP7351469B1 (ja) * 2023-05-11 2023-09-27 アルファサード株式会社 ウェブページ提供システム、ウェブページ提供方法、およびコンピュータプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955529B (zh) * 2014-05-12 2018-05-01 中国科学院计算机网络信息中心 一种互联网信息搜索聚合呈现方法
CN110162356B (zh) * 2018-05-14 2021-09-28 腾讯科技(深圳)有限公司 页面的融合方法、装置、存储介质及电子装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211156A (ja) * 2008-02-29 2009-09-17 Saitama Univ メタ情報付与システム、メタ情報表示システム、およびこれらのプログラム、および、当該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010049598A (ja) * 2008-08-25 2010-03-04 Naninani.Tv:Kk ウェブサイト作成支援装置及びウェブサイト作成支援プログラム
JP2010244126A (ja) * 2009-04-01 2010-10-28 Kddi Corp 小型情報端末向け注目語推定方式および検索方式
JP2011233017A (ja) * 2010-04-28 2011-11-17 Ricoh Co Ltd 情報処理装置、画像処理装置、画像処理システム、画面カスタマイズ方法、画面カスタマイズプログラム、及びそのプログラムを記録した記録媒体
JP2015079397A (ja) * 2013-10-17 2015-04-23 Necパーソナルコンピュータ株式会社 情報処理装置及び方法
JP2021128553A (ja) * 2020-02-13 2021-09-02 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7145901B2 (ja) 2020-02-13 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2022074815A1 (ja) * 2020-10-09 2022-04-14 マクセル株式会社 携帯端末とヘッドマウントディスプレイ及びその連携表示システム
US12056417B2 (en) 2020-10-09 2024-08-06 Maxell, Ltd. Portable terminal, head mounted display, and cooperative display system that connects the portable terminal and the head mounted display to display information by cooperation between the portable terminal and the head mounted display
JP7351469B1 (ja) * 2023-05-11 2023-09-27 アルファサード株式会社 ウェブページ提供システム、ウェブページ提供方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
JP4431744B2 (ja) 2010-03-17

Similar Documents

Publication Publication Date Title
US9256667B2 (en) Method and system for information discovery and text analysis
Di Giacomo et al. Graph visualization techniques for web clustering engines
Crescenzi et al. Clustering web pages based on their structure
JP5238437B2 (ja) ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
US9183281B2 (en) Context-based document unit recommendation for sensemaking tasks
US20150120717A1 (en) Systems and methods for determining influencers in a social data network and ranking data objects based on influencers
US7331517B2 (en) Article reader program, article management method and article reader
KR101527259B1 (ko) 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템
CN105518661B (zh) 经由挖掘的超链接文本的片段来浏览图像
US20090083257A1 (en) Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system
US20110173528A1 (en) Determining Semantically Distinct Regions of a Document
US20090265631A1 (en) System and method for a user interface to navigate a collection of tags labeling content
CN102812475A (zh) 确定在文档中所表达的情绪的系统和方法
JP2006309515A (ja) 情報配信方法および情報配信サーバ
US20030182258A1 (en) Search server and method for providing search results
CN103838862B (zh) 一种视频搜索的方法、装置及终端
JP4431744B2 (ja) Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005063432A (ja) マルチメディアオブジェクト検索装置およびマルチメディアオブジェクト検索方法
JP4820147B2 (ja) 属性評価プログラム、属性評価システムおよび属性評価方法
JP2011154739A (ja) 文書探索サービス提供方法及びシステム
JP5084796B2 (ja) 関連性判定装置、関連性判定方法およびプログラム
Papadakos et al. On exploiting static and dynamically mined metadata for exploratory web searching
Zaïane et al. Mining research communities in bibliographical data
Chiarandini et al. Leveraging browsing patterns for topic discovery and photostream recommendation
Negm et al. A survey of web information extraction tools

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070518

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090423

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091126

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees