JP4750628B2 - 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents
情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP4750628B2 JP4750628B2 JP2006164983A JP2006164983A JP4750628B2 JP 4750628 B2 JP4750628 B2 JP 4750628B2 JP 2006164983 A JP2006164983 A JP 2006164983A JP 2006164983 A JP2006164983 A JP 2006164983A JP 4750628 B2 JP4750628 B2 JP 4750628B2
- Authority
- JP
- Japan
- Prior art keywords
- blog
- keyword
- site
- information
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・分野と関連性の高いブログサイトから参照されるキーワードは重要;
・重要なキーワードを参照するブログサイトは分野と関連性が高い;
というアイディアを元に、ブログサイト及びキーワードのランキングを自動的に獲得することが可能な情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。
検索手段が、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する文書検索ステップ(ステップ1)と、
関係抽出手段が、
該キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出ステップ(ステップ2)と、
関連集計手段が、
関係抽出ステップで抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計ステップ(ステップ3)と、
スコア算出手段が、
関連集計ステップで集計された結果に基づいて、行列Rとその転置行列R T の乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出ステップ(ステップ4)と、
情報出力手段が、
スコア算出ステップで算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力ステップ(ステップ5)と、を行う。
関連集計ステップにおける集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化ステップを更に行う。
ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段40と、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、前記ブログ記事記憶手段40を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する検索手段30と、
キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出手段20と、
関係抽出手段20で抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計手段50と、
関連集計手段50で集計された結果に基づいて、前記行列Rとその転置行列R T の乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出手段60と、
スコア算出手段60で算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力手段70と、を有する。
本実施の形態では、特定の地域に関係する観光スポットの名称の集合をキーワードとして与えられた場合に、ブログサイトを特定の地域との関連性の順に、また、観光スポットを重要性の順にランキングする手法について説明する。
−重要なキーワードを参照するブログサイトは分野と関連性が高い;
このスコアの算出例としては以下の計算法があげられる。
w→=RTg→
ここで、各スコアの均衡点は、以下のいずれかの式の固有ベクトルを求めることで与えられる。
RTRw→=λw→
上記のステップ105・106の処理は、同じキーワードを言及しているブロガ(Blogger)と、他のブロガの関係を示す行列の固有ベクトルを計算する手順である。
本実施の形態では、特定の地域に関係する観光スポットの名称の集合をキーワードとして与えられた場合に、ブログサイトの特定の地域との関連性の順に、また、観光スポットを重要性の順にランキングする手法について示す。
本実施の形態によってランキングされたキーワードの例を図12に示す。
20 関係抽出手段、関係抽出部
30 検索手段、検索部
35 収集部
40 ブログ記事記憶手段、ブログ記事記憶部
45 キーワード記憶部
50 関連集計手段、関連集計部
60 スコア算出手段、スコア算出部
70 情報出力手段、情報出力部
80 集計結果正規化部
Claims (6)
- ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング方法であって、
検索手段が、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する文書検索ステップと、
関係抽出手段が、
前記キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出ステップと、
関連集計手段が、
前記関係抽出ステップで抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計ステップと、
スコア算出手段が、
前記関連集計ステップで集計された結果に基づいて、前記行列Rとその転置行列RTの乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出ステップと、
情報出力手段が、
前記スコア算出ステップで算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力ステップと、
を行うことを特徴とする情報ランキング方法。 - 集計結果正規化手段において、
前記関連集計ステップにおける集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化ステップを更に行う
請求項1記載の情報ランキング方法。 - ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング装置であって、
ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段と、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、前記ブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する検索手段と、
前記キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出手段と、
前記関係抽出手段で抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計手段と、
前記関連集計手段で集計された結果に基づいて、前記行列Rとその転置行列RTの乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出手段と、
前記スコア算出手段で算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力手段と、
を有することを特徴とする情報ランキング装置。 - 前記関連集計手段における集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化手段を更に有する
請求項3記載の情報ランキング装置。 - コンピュータに、
請求項3または4記載の情報ランキング装置の各手段を実行させることを特徴とする情報ランキングプログラム。 - コンピュータに、
請求項3または4記載の情報ランキング装置の各手段を実行させる情報ランキングプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006164983A JP4750628B2 (ja) | 2006-06-14 | 2006-06-14 | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006164983A JP4750628B2 (ja) | 2006-06-14 | 2006-06-14 | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007334590A JP2007334590A (ja) | 2007-12-27 |
JP4750628B2 true JP4750628B2 (ja) | 2011-08-17 |
Family
ID=38934022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006164983A Expired - Fee Related JP4750628B2 (ja) | 2006-06-14 | 2006-06-14 | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4750628B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5504595B2 (ja) * | 2008-08-05 | 2014-05-28 | 株式会社リコー | 情報処理装置、情報検索システム、情報処理方法およびプログラム |
JP5200750B2 (ja) * | 2008-08-08 | 2013-06-05 | 株式会社リコー | 情報検索装置、情報検索方法、プログラム、および記録媒体 |
JP5262434B2 (ja) * | 2008-08-26 | 2013-08-14 | 株式会社リコー | 情報検索システム、情報検索方法、プログラムおよび記録媒体 |
JP2011022624A (ja) * | 2009-07-13 | 2011-02-03 | Nec Corp | ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム |
US8560530B2 (en) | 2010-05-17 | 2013-10-15 | Buzzmetrics, Ltd. | Methods, apparatus, and articles of manufacture to rank web site influence |
KR101796161B1 (ko) * | 2010-06-03 | 2017-11-10 | 신철호 | 사용자 별 매체를 이용한 블로깅 방법 및 시스템 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3578651B2 (ja) * | 1998-12-04 | 2004-10-20 | 株式会社リコー | 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005346598A (ja) * | 2004-06-07 | 2005-12-15 | Sangaku Renkei Kiko Kyushu:Kk | ウェブ情報収集装置とウェブクローラープログラム、及びウェブ情報収集方法 |
-
2006
- 2006-06-14 JP JP2006164983A patent/JP4750628B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007334590A (ja) | 2007-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5116775B2 (ja) | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP5340751B2 (ja) | 文書処理装置および文書処理方法 | |
US7849104B2 (en) | Searching heterogeneous interrelated entities | |
Crescenzi et al. | Clustering web pages based on their structure | |
US9031935B2 (en) | Search system, search method, and program | |
US20110173197A1 (en) | Methods and apparatuses for clustering electronic documents based on structural features and static content features | |
CN103874994A (zh) | 用于自动概括电子文档的内容的方法和装置 | |
JP2004213675A (ja) | 構造化ドキュメントの検索 | |
JPWO2007119567A1 (ja) | 文書処理装置および文書処理方法 | |
Wolfram | The symbiotic relationship between information retrieval and informetrics | |
JP4750628B2 (ja) | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
Faba‐Pérez et al. | Comparative analysis of webometric measurements in thematic environments | |
Bharamagoudar et al. | Literature survey on web mining | |
JP6727097B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN105808761A (zh) | 一种基于大数据Solr网页排序优化方法 | |
Jain et al. | Organizing query completions for web search | |
Zhang et al. | A latent usage approach for clustering web transaction and building user profile | |
KR20120020558A (ko) | 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP5286007B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5589009B2 (ja) | 推薦クエリ抽出装置及び方法及びプログラム | |
JP2010282403A (ja) | 文書検索方法 | |
JP4567581B2 (ja) | 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体 | |
Wu et al. | Automatic topics discovery from hyperlinked documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110322 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110517 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110519 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4750628 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140527 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |