JP2005346609A - Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2005346609A JP2005346609A JP2004168259A JP2004168259A JP2005346609A JP 2005346609 A JP2005346609 A JP 2005346609A JP 2004168259 A JP2004168259 A JP 2004168259A JP 2004168259 A JP2004168259 A JP 2004168259A JP 2005346609 A JP2005346609 A JP 2005346609A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- information
- page
- user
- web
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】Webページ取得手段12がユーザ端末2から入力されたポータルページのURLに対応するWebページを取得し、Webページ解析手段13が前記Webページを解析して置換される内容を検出し、興味語・興味木作成手段17が興味語の抽出、興味木の作成を行い、置換情報選出手段18が興味語、興味木とWebページテーブル150とに基づいて、前記Webページの置換される内容を置換する情報を選出し、融合情報作成手段19が前記置換される内容を前記選出された置換情報に置換して融合情報を作成し、融合情報送信手段20が融合情報をユーザ端末2に送信する。
【選択図】図2
Description
Kathleen R. McKeown, Regina Barzilay, David Evans, Vasileios Hatzivassiloglou, Judith L. Klavans, Ani Nenkova, carl Sable, Barry Schiffman, and Sergey Sigelman. Tracking and Summarizing News on a Daily Basis with Columbia's Newsblaster. In Proceedings of the Human Language Technology Conference, 2002,San Diego, USA, 2002. ACM.
(1)ニュースサイトのロゴの画像
(2)カテゴリ毎のキーワード
(3)画像とタイトルで構成されるトップ記事(画像付きトップ記事)
(4)カテゴリ毎に分類されるニュース記事のタイトル集
(5)広告
本発明では、ユーザの興味に基づきページを分類して融合するため、例えばオリジナルのニュースサイトのポータルページの内容のうち、(2)と(4)の内容を、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。また、例えば、(3)の画像付きトップ記事の内容も、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。以上より、本発明では、例えば、(1)、(5)の内容はオリジナルのままとし、(2)〜(4)までの3項目の内容を置換情報と置換する。以下に、ポータルページの置換される内容の検出手法について説明する。
(座標変換によるセルの抽出)
多くのポータルページのレイアウトの形成には、HTMLのTABLE構造が利用されている。そこで、このTABLE構造を解析して、セルの座標を算出する。HTMLのTABLE構造は、1つ以上の行で構成され、各行は1つ以上のセルで構成されており、行と列に配列した多次元のデータの表を構成できる。
(置換される内容の検出)
算出した各セルのxy座標値と、置換される3項目(上述した(2)〜(4))の情報の各々の特徴を基に、オリジナルのポータルページから、置換される上記3項目の内容を検出する。検出する3項目の情報の特徴の例を以下に示す。
(A)カテゴリ毎のキーワードの特徴
・キーワードに基づいてセル内の構造がパターン化されている。
(B)画像とタイトルで構成されるトップ記事の特徴
・「カテゴリ毎のキーワード」のx座標値より大きい。
(C)カテゴリ毎に分類されるニュース記事のタイトル集の特徴
・「画像とタイトルのトップ記事」のy座標値より小さい。
本発明の実施の形態では、例えば、上記(A)〜(C)を条件とし、オリジナルのポータルページの置換される上記3項目の内容を検出する。
(Webページテーブルの作成)
Webページテーブル作成手段15は、Webページ蓄積手段14に蓄積されているWebページのメタデータの日付と概要から、単語とその重みに関するWebページテーブル150を作成する。Webページテーブル150の一例を図6に示す。
(興味語の抽出処理)
興味語は、オリジナルのポータルページのカテゴリのキーワードを置換する単語であり、新たなキーワードとなるものである。興味語は、閲覧したページに出現する単語のうち、重みの総和値Ij が閾値以上の単語とする。閲覧したページをPi (i=1,...,n)、ページPi に出現する単語をj、単語jの重みをwij とすると、
(興味木の作成処理)
興味木は、抽出された興味語ごとに作成される。各興味語をルートノードとし、同じページに出現するルートノード以外の単語を子ノードとする。ルートノードと子ノードとのリンクは、以下に示すように、閲覧された全てのページから単語間の共起度を算出し、さらに単語の閲覧時刻の情報をユーザのWebページ閲覧履歴情報に基づいて抽出し、それらの情報を基にノード間の重要度を決定し、形成される。
2 ユーザ端末
11 Webページ表示要求受信手段
12 Webページ取得手段
13 Webページ解析手段
14 Webページ蓄積手段
15 Webページテーブル作成手段
16 Webページ閲覧履歴情報蓄積手段
17 興味語・興味木作成手段
18 置換情報選出手段
19 融合情報作成手段
20 融合情報送信手段
100 ユーザ端末の表示画面
110 カテゴリ毎のキーワードの表示領域
111 画像付きトップ記事の表示領域
112 カテゴリ毎に分類されるニュース記事のタイトル集の表示領域
150 Webページテーブル
Claims (4)
- 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示装置であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信手段と、
予め収集された複数のWebページを蓄積するWebページ蓄積手段と、
前記受信したポータルページの表示要求に基づいて、前記Webページ蓄積手段に蓄積された複数のWebページから前記ポータルページを取得するWebページ取得手段と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析手段と、
前記Webページ蓄積手段に蓄積された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成手段と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成手段と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析手段による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出手段と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成手段と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信手段とを備える
ことを特徴とするWebページ情報融合表示装置。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示方法であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信ステップと、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得ステップと、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析ステップと、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成ステップと、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成ステップと、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析ステップによる解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出ステップと、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成ステップと、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信ステップとを有する
ことを特徴とするWebページ情報融合表示方法。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムであって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
コンピュータに実行させるためのWebページ情報融合表示プログラム。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムを記録した記録媒体であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
コンピュータに実行させるためのWebページ情報融合表示プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168259A JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168259A JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005346609A true JP2005346609A (ja) | 2005-12-15 |
JP4431744B2 JP4431744B2 (ja) | 2010-03-17 |
Family
ID=35498897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004168259A Expired - Fee Related JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4431744B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211156A (ja) * | 2008-02-29 | 2009-09-17 | Saitama Univ | メタ情報付与システム、メタ情報表示システム、およびこれらのプログラム、および、当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010049598A (ja) * | 2008-08-25 | 2010-03-04 | Naninani.Tv:Kk | ウェブサイト作成支援装置及びウェブサイト作成支援プログラム |
JP2010244126A (ja) * | 2009-04-01 | 2010-10-28 | Kddi Corp | 小型情報端末向け注目語推定方式および検索方式 |
JP2011233017A (ja) * | 2010-04-28 | 2011-11-17 | Ricoh Co Ltd | 情報処理装置、画像処理装置、画像処理システム、画面カスタマイズ方法、画面カスタマイズプログラム、及びそのプログラムを記録した記録媒体 |
JP2015079397A (ja) * | 2013-10-17 | 2015-04-23 | Necパーソナルコンピュータ株式会社 | 情報処理装置及び方法 |
JP2021128553A (ja) * | 2020-02-13 | 2021-09-02 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
WO2022074815A1 (ja) * | 2020-10-09 | 2022-04-14 | マクセル株式会社 | 携帯端末とヘッドマウントディスプレイ及びその連携表示システム |
JP7351469B1 (ja) * | 2023-05-11 | 2023-09-27 | アルファサード株式会社 | ウェブページ提供システム、ウェブページ提供方法、およびコンピュータプログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955529B (zh) * | 2014-05-12 | 2018-05-01 | 中国科学院计算机网络信息中心 | 一种互联网信息搜索聚合呈现方法 |
CN110162356B (zh) * | 2018-05-14 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 页面的融合方法、装置、存储介质及电子装置 |
-
2004
- 2004-06-07 JP JP2004168259A patent/JP4431744B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211156A (ja) * | 2008-02-29 | 2009-09-17 | Saitama Univ | メタ情報付与システム、メタ情報表示システム、およびこれらのプログラム、および、当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010049598A (ja) * | 2008-08-25 | 2010-03-04 | Naninani.Tv:Kk | ウェブサイト作成支援装置及びウェブサイト作成支援プログラム |
JP2010244126A (ja) * | 2009-04-01 | 2010-10-28 | Kddi Corp | 小型情報端末向け注目語推定方式および検索方式 |
JP2011233017A (ja) * | 2010-04-28 | 2011-11-17 | Ricoh Co Ltd | 情報処理装置、画像処理装置、画像処理システム、画面カスタマイズ方法、画面カスタマイズプログラム、及びそのプログラムを記録した記録媒体 |
JP2015079397A (ja) * | 2013-10-17 | 2015-04-23 | Necパーソナルコンピュータ株式会社 | 情報処理装置及び方法 |
JP2021128553A (ja) * | 2020-02-13 | 2021-09-02 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP7145901B2 (ja) | 2020-02-13 | 2022-10-03 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
WO2022074815A1 (ja) * | 2020-10-09 | 2022-04-14 | マクセル株式会社 | 携帯端末とヘッドマウントディスプレイ及びその連携表示システム |
US12056417B2 (en) | 2020-10-09 | 2024-08-06 | Maxell, Ltd. | Portable terminal, head mounted display, and cooperative display system that connects the portable terminal and the head mounted display to display information by cooperation between the portable terminal and the head mounted display |
JP7351469B1 (ja) * | 2023-05-11 | 2023-09-27 | アルファサード株式会社 | ウェブページ提供システム、ウェブページ提供方法、およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4431744B2 (ja) | 2010-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9256667B2 (en) | Method and system for information discovery and text analysis | |
Di Giacomo et al. | Graph visualization techniques for web clustering engines | |
Crescenzi et al. | Clustering web pages based on their structure | |
JP5238437B2 (ja) | ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム | |
US9183281B2 (en) | Context-based document unit recommendation for sensemaking tasks | |
US20150120717A1 (en) | Systems and methods for determining influencers in a social data network and ranking data objects based on influencers | |
US7331517B2 (en) | Article reader program, article management method and article reader | |
KR101527259B1 (ko) | 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템 | |
CN105518661B (zh) | 经由挖掘的超链接文本的片段来浏览图像 | |
US20090083257A1 (en) | Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system | |
US20110173528A1 (en) | Determining Semantically Distinct Regions of a Document | |
US20090265631A1 (en) | System and method for a user interface to navigate a collection of tags labeling content | |
CN102812475A (zh) | 确定在文档中所表达的情绪的系统和方法 | |
JP2006309515A (ja) | 情報配信方法および情報配信サーバ | |
US20030182258A1 (en) | Search server and method for providing search results | |
CN103838862B (zh) | 一种视频搜索的方法、装置及终端 | |
JP4431744B2 (ja) | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2005063432A (ja) | マルチメディアオブジェクト検索装置およびマルチメディアオブジェクト検索方法 | |
JP4820147B2 (ja) | 属性評価プログラム、属性評価システムおよび属性評価方法 | |
JP2011154739A (ja) | 文書探索サービス提供方法及びシステム | |
JP5084796B2 (ja) | 関連性判定装置、関連性判定方法およびプログラム | |
Papadakos et al. | On exploiting static and dynamically mined metadata for exploratory web searching | |
Zaïane et al. | Mining research communities in bibliographical data | |
Chiarandini et al. | Leveraging browsing patterns for topic discovery and photostream recommendation | |
Negm et al. | A survey of web information extraction tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070518 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090423 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091126 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |