JP4431744B2 - Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP4431744B2 JP4431744B2 JP2004168259A JP2004168259A JP4431744B2 JP 4431744 B2 JP4431744 B2 JP 4431744B2 JP 2004168259 A JP2004168259 A JP 2004168259A JP 2004168259 A JP2004168259 A JP 2004168259A JP 4431744 B2 JP4431744 B2 JP 4431744B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- information
- page
- web
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
Kathleen R. McKeown, Regina Barzilay, David Evans, Vasileios Hatzivassiloglou, Judith L. Klavans, Ani Nenkova, carl Sable, Barry Schiffman, and Sergey Sigelman. Tracking and Summarizing News on a Daily Basis with Columbia's Newsblaster. In Proceedings of the Human Language Technology Conference, 2002,San Diego, USA, 2002. ACM.
(1)ニュースサイトのロゴの画像
(2)カテゴリ毎のキーワード
(3)画像とタイトルで構成されるトップ記事(画像付きトップ記事)
(4)カテゴリ毎に分類されるニュース記事のタイトル集
(5)広告
本発明では、ユーザの興味に基づきページを分類して融合するため、例えばオリジナルのニュースサイトのポータルページの内容のうち、(2)と(4)の内容を、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。また、例えば、(3)の画像付きトップ記事の内容も、各ユーザの興味の分類体系に基づいて選出された置換情報と置換する。以上より、本発明では、例えば、(1)、(5)の内容はオリジナルのままとし、(2)〜(4)までの3項目の内容を置換情報と置換する。以下に、ポータルページの置換される内容の検出手法について説明する。
(座標変換によるセルの抽出)
多くのポータルページのレイアウトの形成には、HTMLのTABLE構造が利用されている。そこで、このTABLE構造を解析して、セルの座標を算出する。HTMLのTABLE構造は、1つ以上の行で構成され、各行は1つ以上のセルで構成されており、行と列に配列した多次元のデータの表を構成できる。
(置換される内容の検出)
算出した各セルのxy座標値と、置換される3項目(上述した(2)〜(4))の情報の各々の特徴を基に、オリジナルのポータルページから、置換される上記3項目の内容を検出する。検出する3項目の情報の特徴の例を以下に示す。
(A)カテゴリ毎のキーワードの特徴
・キーワードに基づいてセル内の構造がパターン化されている。
(B)画像とタイトルで構成されるトップ記事の特徴
・「カテゴリ毎のキーワード」のx座標値より大きい。
(C)カテゴリ毎に分類されるニュース記事のタイトル集の特徴
・「画像とタイトルのトップ記事」のy座標値より小さい。
本発明の実施の形態では、例えば、上記(A)〜(C)を条件とし、オリジナルのポータルページの置換される上記3項目の内容を検出する。
(Webページテーブルの作成)
Webページテーブル作成手段15は、Webページ蓄積手段14に蓄積されているWebページのメタデータの日付と概要から、単語とその重みに関するWebページテーブル150を作成する。Webページテーブル150の一例を図6に示す。
(興味語の抽出処理)
興味語は、オリジナルのポータルページのカテゴリのキーワードを置換する単語であり、新たなキーワードとなるものである。興味語は、閲覧したページに出現する単語のうち、重みの総和値Ij が閾値以上の単語とする。閲覧したページをPi (i=1,...,n)、ページPi に出現する単語をj、単語jの重みをwij とすると、
(興味木の作成処理)
興味木は、抽出された興味語ごとに作成される。各興味語をルートノードとし、同じページに出現するルートノード以外の単語を子ノードとする。ルートノードと子ノードとのリンクは、以下に示すように、閲覧された全てのページから単語間の共起度を算出し、さらに単語の閲覧時刻の情報をユーザのWebページ閲覧履歴情報に基づいて抽出し、それらの情報を基にノード間の重要度を決定し、形成される。
2 ユーザ端末
11 Webページ表示要求受信手段
12 Webページ取得手段
13 Webページ解析手段
14 Webページ蓄積手段
15 Webページテーブル作成手段
16 Webページ閲覧履歴情報蓄積手段
17 興味語・興味木作成手段
18 置換情報選出手段
19 融合情報作成手段
20 融合情報送信手段
100 ユーザ端末の表示画面
110 カテゴリ毎のキーワードの表示領域
111 画像付きトップ記事の表示領域
112 カテゴリ毎に分類されるニュース記事のタイトル集の表示領域
150 Webページテーブル
Claims (4)
- 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示装置であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信手段と、
予め収集された複数のWebページを蓄積するWebページ蓄積手段と、
前記受信したポータルページの表示要求に基づいて、前記Webページ蓄積手段に蓄積された複数のWebページから前記ポータルページを取得するWebページ取得手段と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析手段と、
前記Webページ蓄積手段に蓄積された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成手段と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成手段と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析手段による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出手段と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成手段と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信手段とを備える
ことを特徴とするWebページ情報融合表示装置。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示方法であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信ステップと、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得ステップと、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析ステップと、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成ステップと、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成ステップと、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析ステップによる解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出ステップと、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成ステップと、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信ステップとを有する
ことを特徴とするWebページ情報融合表示方法。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムであって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
コンピュータに実行させるためのWebページ情報融合表示プログラム。 - 複数のWebサイトから収集したWebページ情報を融合し、ユーザの好みのWebサイトのポータルページのレイアウトを通して表示するWebページ情報融合表示プログラムを記録した記録媒体であって、
ユーザ端末から送信された前記ユーザの好みのWebサイトのポータルページの表示要求を受信するWebページ表示要求受信処理と、
前記受信したポータルページの表示要求に基づいて、予め収集された複数のWebページから前記ポータルページを取得するWebページ取得処理と、
前記取得されたポータルページを解析し、前記ポータルページの置換される内容を検出するWebページ解析処理と、
前記予め収集された複数のWebページに含まれる単語と各単語の重み情報が格納されたWebページテーブルを作成するWebページテーブル作成処理と、
ユーザのWebページ閲覧履歴情報と前記Webページテーブル内の情報とに基づいて、前記ユーザが興味を持っている単語である興味語を抽出するとともに、ユーザの興味の分類体系である興味木を作成する興味語・興味木作成処理と、
前記抽出された興味語、前記作成された興味木とWebページテーブル内の情報とに基づいて、前記Webページ解析処理による解析の結果検出された前記ポータルページの置換される内容を置換する置換情報を選出する置換情報選出処理と、
前記ポータルページの置換される内容を前記置換情報に置換して、融合されたWebページ情報を作成する融合情報作成処理と、
前記融合されたWebページ情報をユーザ端末に送信する融合情報送信処理とを、
コンピュータに実行させるためのWebページ情報融合表示プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168259A JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168259A JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005346609A JP2005346609A (ja) | 2005-12-15 |
JP4431744B2 true JP4431744B2 (ja) | 2010-03-17 |
Family
ID=35498897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004168259A Expired - Fee Related JP4431744B2 (ja) | 2004-06-07 | 2004-06-07 | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4431744B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955529A (zh) * | 2014-05-12 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种互联网信息搜索聚合呈现方法 |
CN110162356A (zh) * | 2018-05-14 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 页面的融合方法、装置、存储介质及电子装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5186630B2 (ja) * | 2008-02-29 | 2013-04-17 | 洋 川崎 | メタ情報付与システム、メタ情報表示システム、およびこれらのプログラム、および、当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010049598A (ja) * | 2008-08-25 | 2010-03-04 | Naninani.Tv:Kk | ウェブサイト作成支援装置及びウェブサイト作成支援プログラム |
JP2010244126A (ja) * | 2009-04-01 | 2010-10-28 | Kddi Corp | 小型情報端末向け注目語推定方式および検索方式 |
JP5482407B2 (ja) * | 2010-04-28 | 2014-05-07 | 株式会社リコー | 情報処理装置、画像処理装置、画像処理システム、画面カスタマイズ方法、画面カスタマイズプログラム、及びそのプログラムを記録した記録媒体 |
JP2015079397A (ja) * | 2013-10-17 | 2015-04-23 | Necパーソナルコンピュータ株式会社 | 情報処理装置及び方法 |
JP7145901B2 (ja) * | 2020-02-13 | 2022-10-03 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
US20230367536A1 (en) * | 2020-10-09 | 2023-11-16 | Maxell, Ltd. | Portable terminal, head mounted display, and cooperative display system thereof |
JP7351469B1 (ja) | 2023-05-11 | 2023-09-27 | アルファサード株式会社 | ウェブページ提供システム、ウェブページ提供方法、およびコンピュータプログラム |
-
2004
- 2004-06-07 JP JP2004168259A patent/JP4431744B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955529A (zh) * | 2014-05-12 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种互联网信息搜索聚合呈现方法 |
CN110162356A (zh) * | 2018-05-14 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 页面的融合方法、装置、存储介质及电子装置 |
CN110162356B (zh) * | 2018-05-14 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 页面的融合方法、装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005346609A (ja) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Di Giacomo et al. | Graph visualization techniques for web clustering engines | |
JP5238437B2 (ja) | ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム | |
Xue et al. | Optimizing web search using web click-through data | |
US20090319518A1 (en) | Method and system for information discovery and text analysis | |
US6256648B1 (en) | System and method for selecting and displaying hyperlinked information resources | |
US6704729B1 (en) | Retrieval of relevant information categories | |
US7779001B2 (en) | Web page ranking with hierarchical considerations | |
US8161050B2 (en) | Visualizing hyperlinks in a search results list | |
JP4721740B2 (ja) | 記事又は話題を管理するためのプログラム | |
US20150120717A1 (en) | Systems and methods for determining influencers in a social data network and ranking data objects based on influencers | |
US20110282879A1 (en) | Method and subsystem for information acquisition and aggregation to facilitate ontology and language model generation within a content-search-service system | |
CN105518661B (zh) | 经由挖掘的超链接文本的片段来浏览图像 | |
US7124127B2 (en) | Search server and method for providing search results | |
KR100859918B1 (ko) | 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치 | |
JP2007519086A (ja) | 階層データの好ましいビューを構築するための方法 | |
CN102812475A (zh) | 确定在文档中所表达的情绪的系统和方法 | |
Zaiane et al. | Dbconnect: mining research community on dblp data | |
JP2011154467A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
JP4431744B2 (ja) | Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR100987330B1 (ko) | 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법 | |
JP5084796B2 (ja) | 関連性判定装置、関連性判定方法およびプログラム | |
Zaïane et al. | Mining research communities in bibliographical data | |
JP2007317105A (ja) | オンデマンド型リンク作成システム | |
Chiarandini et al. | Leveraging browsing patterns for topic discovery and photostream recommendation | |
JP2006227925A (ja) | 情報提供方法および情報提供装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070518 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090423 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091126 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |