JP4750628B2 - 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents

情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4750628B2
JP4750628B2 JP2006164983A JP2006164983A JP4750628B2 JP 4750628 B2 JP4750628 B2 JP 4750628B2 JP 2006164983 A JP2006164983 A JP 2006164983A JP 2006164983 A JP2006164983 A JP 2006164983A JP 4750628 B2 JP4750628 B2 JP 4750628B2
Authority
JP
Japan
Prior art keywords
blog
keyword
site
information
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006164983A
Other languages
English (en)
Other versions
JP2007334590A (ja
Inventor
浩之 戸田
考 藤村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006164983A priority Critical patent/JP4750628B2/ja
Publication of JP2007334590A publication Critical patent/JP2007334590A/ja
Application granted granted Critical
Publication of JP4750628B2 publication Critical patent/JP4750628B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、インターネットに代表されるコンピュータネットワークにおいて、ユーザが要求する情報をランキングするための情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体に関する。
ブログの普及により、多くの口コミ情報がWeb上で閲覧可能となっている。ブログの利用法の一つとして、アニメ、映画等特定の分野や特定の地域に高い関連性のあるブログサイトを抽出したいという要求がある。この要求が従来の要求と異なるのは、一つ目として、特定の分野や地域に関連する個々の文書(ブログ記事)のランキングを行うのではなく、文書の集合(ブログ記事)からなるブログサイトをランキングしたいという要求があること、二つ目として、一つ以上の複数のキーワードを元にサイトのランキングを図ることである。
これを実現する最も単純な手法は、通常のキーワード検索システムを利用した手法である。予め収集した分野に関連するキーワードを元にし、いずれかのキーワードを含むブログ記事を収集し、該当記事の数や、該当記事のブログサイト内の記事の総数に対する割合などを関連性と定義する。また、この手法でキーワードの重要性は、上記で関連性が高いとされたブログサイトで多く利用されているキーワードが重要であるというような指標で定義されることが考えられる(例えば、特許文献1参照)。
また、別の実現方法として、Webページの重要性を図る手段として有益性が明らかとなっているリンク解析を利用する手法がある(例えば、非特許文献1参照)。前述の手法と同様に、予め収集した分野に関連するキーワードを元にし、記事中にいずれかのキーワードを含むブログ記事を収集する。その上で、このブログ記事間のハイパーリンクを解析し、リンクによって構成されるグラフ構造中の中心性を元にブログ記事及びブログサイトをランキングしようとするものである。例えば、HITSでは、次の仮説によりWebページのランキングをしている。
・良質のHUBページから参照されるページは、良質のAUTHORITYページである。
・良質のAUTHORITYページを参照するページは良質のHUBページである。
また、この仮説をブログに対して適用すると以下の様に考えられる。
・良質のHUBブログサイトから参照されるブログサイトは良質のAUTORITYブログサイトである。
・良質のAUTHORITYブログサイトを参照するブログサイトは良質のHUBブログサイトである。
この場合、キーワードの重要性は、AUTHORITY度とHUB度から算出されるランキングで良質とされるブログサイトから多く引用されているキーワードが重要というような指標で定義されることが求められる。
特開2002-132769号公報 Kleinberg. J. M. et al. : "Authoritative Sources in a Hyperlinked Environment." Journal of the ACM, 1999
しかしながら、上記従来技術には以下の問題点がある。
単純なキーワード検索を利用した手法では、分野に関連するキーワードを元に記事の重要性を算出するが、ここで、全てのキーワードの重要性は均一なものと仮定し、記事のスコアリングを行っている。しかし、実際には、分野を表現するキーワードの中でも、高い関連性があるブログサイトで出現するキーワードがある一方、ほとんど関連性のないブログでしか出現しないキーワードが存在するなど、キーワードの重要性を考慮してブログサイトの関連度をスコアリングすることが必要となる。
また、リンク解析を利用する手段では、記事数に対してある一定以上のリンクが存在する必要があるが、ブログサイト集合中のリンクは一般のWebサイトと比較してリンクが少なく、さらに、キーワードを元に集合を限定したような場合、その集合内にリンク元とリンク先の両方が存在するリンクはほとんど存在しない。つまり、分野の関連性を算出するのは情報が足りないという問題がある。
本発明は、上記の点に鑑みなされたもので、ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング方法において、前述の非特許文献1におけるHITSの仮説をキーワードとブログサイトの関係に置き換えた
・分野と関連性の高いブログサイトから参照されるキーワードは重要;
・重要なキーワードを参照するブログサイトは分野と関連性が高い;
というアイディアを元に、ブログサイト及びキーワードのランキングを自動的に獲得することが可能な情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、 ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング方法であって、
検索手段が、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する文書検索ステップ(ステップ1)と、
関係抽出手段が、
該キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出ステップ(ステップ2)と、
関連集計手段が、
関係抽出ステップで抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計ステップ(ステップ3)と、
スコア算出手段が、
関連集計ステップで集計された結果に基づいて、行列Rとその転置行列R T の乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出ステップ(ステップ4)と、
情報出力手段が、
スコア算出ステップで算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力ステップ(ステップ5)と、を行う。
また、本発明(請求項2)は、集計結果正規化手段において、
連集計ステップにおける集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化ステップを更に行う。
図2は、本発明の原理構成図である。
本発明(請求項3)は、ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング装置であって、
ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段40と、
特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、前記ブログ記事記憶手段40を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する検索手段30と、
キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出手段20と、
関係抽出手段20で抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計手段50と、
関連集計手段50で集計された結果に基づいて、前記行列Rとその転置行列R T の乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出手段60と、
スコア算出手段60で算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力手段70と、を有する。

本発明(請求項4)は、関連集計手段50における集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化手段を更に有する。

本発明(請求項5)は、コンピュータに、請求項3または4記載の情報ランキング装置の各手段を実行させる情報ランキングプログラムである。
本発明(請求項6)は、コンピュータに、請求項3または4記載の情報ランキング装置の各手段を実行させる情報ランキングプログラムを格納したコンピュータ読み取り可能な記録媒体である。
上記のように本発明によれば、分野を表現するキーワード集合の入力を受け付け、それぞれのキーワードとそれぞれのブログサイトの関係の強さを抽出し、その関係を元にキーワードもしくはブログサイトをノードとするグラフ構造を構成し、そのグラフ構造の中心性を算出することでこの中心性を元にブログサイト及びキーワードのランキングを得る事が可能となる。
また、本発明によれば、キーワードとブログサイトの関係を、様々な手法で正規化することにより、マイナーな情報に強いブログサイトなどランキングにバリエーションが加えられる。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
本実施の形態では、特定の地域に関係する観光スポットの名称の集合をキーワードとして与えられた場合に、ブログサイトを特定の地域との関連性の順に、また、観光スポットを重要性の順にランキングする手法について説明する。
図3は、本発明の第1の実施の形態におけるランキング装置の構成図である。
同図に示すランキング装置は、キーワード記憶部45、キーワード入力部10、関係抽出部20、検索部30、収集部35、ブログ記事記憶部40、関連集計部50、スコア算出部60、情報出力部70から構成される。
上記のキーワード記憶部45は、例えば、図5に示すような分野を示すキーワードが格納されており、キーワード入力部10により読み出される。
収集部35は、予め与えられたブログの更新を通知するRSS(Rich Site Summary)の情報に基づき、更新された記事を抽出し、その内容をブログ記事記憶部40に格納する。当該収集部35は、メインの情報ランキングプロセスとは非同期で動作する。
ブログ記事記憶部40は、ブログ記事を格納するデータ管理機能である。個々のブログ記事にはその記事がどこのブログサイトに属しているかの情報を有しているデータベースである。ブログ記事記憶部40のデータ形式を図6に示す。同図に示す例では、ブログ記事記憶部40は、ブログ記事URL、ブログサイトURL、記事内容から構成されている。
図4は、本発明の第1の実施の形態における動作のフローチャートである。なお、図4に記載されている「ブロガ」とは、同じブログサイトに掲載されるブログの執筆者を意味する。なお、以下の処理の前に予め、収集部35よりブログ記事が収集され、ブログ記事記憶部40に格納されているものとする。
ステップ101) キーワード入力部10は、キーワード記憶部45からユーザから分野を示すキーワードの集合、特に、分野が地域の話題であれば、特定の地域のランドマークや店舗名称などのキーワードの集合を受け付ける。
ステップ102) 検索部30は、入力されたキーワードに基づいて、ブログ記事記憶部40を検索し、当該キーワードを含むブログ記事及びその記事が属するブログサイトの情報を取得し、出力する。
ステップ103) 関係抽出部20は、ステップ101で入力されたキーワードのそれぞれについて、ステップ102において検索部30を通じて取得した関係するブログサイトを抽出し、キーワードとブログサイトの関係(キーワード毎に言及しているブログサイト(ブロガ)を抽出)を取得し、リスト化する。リストデータの例を図7に示す。同図の例では、当該リストは語彙とブログサイトから構成される。
ステップ104) 関連集計部50は、関係抽出部20が生成したキーワードとブログサイトの関係のリストを取得し、キーワードとブログサイトの関係を集計する。集計した結果を図8に示す。ここでは、同図に示す集計データは、語彙(キーワード)一覧とブログサイト一覧から構成され、それぞれのブログサイト中で、それぞれのキーワードを含むブログ記事の数を示している。
ステップ105・106) スコア算出部60は、関係集計部50で集計した結果を元に、ブログサイト及びキーワードのスコアを算出する。
スコアの計算は、以下の仮説に基づいて算出される。
−分野と関係性の高いブログサイトから参照されるキーワードは重要;
−重要なキーワードを参照するブログサイトは分野と関連性が高い;
このスコアの算出例としては以下の計算法があげられる。
まず、あるブログサイトが記事中であるキーワードを参照したことを示す行列をRとする。これは、関連集計部50の結果を行列の形で表現したものである。
また、キーワードのスコアを示すベクトルをw→、ブログサイトのスコアを示すベクトルをg→(→はベクトを示す)とおくと、以下の仮説はそれぞれ以下の式で表現することができる。
g→=Rw→
w→=Rg→
ここで、各スコアの均衡点は、以下のいずれかの式の固有ベクトルを求めることで与えられる。
RRg→=λg→
Rw→=λw→
上記のステップ105・106の処理は、同じキーワードを言及しているブロガ(Blogger)と、他のブロガの関係を示す行列の固有ベクトルを計算する手順である。
行列Rと、その転換行列Rの積(RR)は、ある分野について注目した場合の全てのブロガ相互の類似関係を示している。
RRの第1固有ベクトルを算出することによって、ある分野に注目した場合に、他のブロガと最も類似しているブロガを探し出すことが可能になるとの効果を奏することとなる。すなわち、ブロガの重要度を算出することができる。
一方、転置行列Rと、その転置前の行列Rの積(RR)は、世の中の全ての分野について注目した場合の全てのブロガ相互の関係を示している。
Rの第1固有ベクトルを算出することによって、世の中の全ての分野について、他のキーワードと最も類似しているキーワードを探し出すことが可能となるとの効果を奏することとなる。すなわち、キーワードの重要度を算出することができる。
ステップ107・108) 情報出力部70は、スコア算出部60によって算出されたスコアに基づき、ブログサイト及びキーワードをランキングし、一方、もしくは両方をスコアと共に出力する。本実施の形態においてランキングされたキーワードの例を図9に示す。
上記のランキングされたリストを参照することによりある分野に詳しいブロガ(blogger)を探し出すことが可能となり、更に、キーワード列の中で専門家度(Authority度)の高いbloggerが言及している度合いが高いキーワードを特定することができる。
[第2の実施の形態]
本実施の形態では、特定の地域に関係する観光スポットの名称の集合をキーワードとして与えられた場合に、ブログサイトの特定の地域との関連性の順に、また、観光スポットを重要性の順にランキングする手法について示す。
図10は、本発明の第2の実施の形態におけるランキング装置の構成を示す。同図において、図3の構成と同一部分については同一符号を付し、その説明を省略する。
図10に示す構成は、図3に示す構成に集計結果正規化部80を加えた構成である。
図11は、本発明の第2の実施の形態における動作のフローチャートである。同図において、図4の動作と同一動作については同一のステップ番号を付し、その説明を省略する。
本実施の形態では、第1の実施の形態のステップ104の後段に、ステップ201の動作を行う。
ステップ201) 集計結果正規化部80は、関連集計部50が集計した結果を、各ブログサイトもしくは、各キーワード単位で関係の頻度を示す値が等しくなるように関係を正規化する。
正規化の例を以下に示す。
行列RTは、ブログサイト行、キーワード列の行列である。これに対して、DをRTの各行の要素の和を対角成分に並べた行列とする。
Figure 0004750628
さらに、正規化されたRをR とする。その場合以下のような正規化を行う。
=R−1
本実施の形態によってランキングされたキーワードの例を図12に示す。
従来のリンク解析を利用する技術(非特許文献1)のHITSでは、ハイパーリンクを前提としているが、本発明における適用対象であるブログでは、ハイパーリンクは存在しない。
本発明は、上記の第1の実施の形態における図3、第2の実施の形態における図10の構成をプログラムとして構築し、情報ランキング装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、情報ランキング装置として利用されるコンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、ある特定の個人や組織によって情報が提供されている記事の集合であるブログサイトを興味分野においてランキングするための技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の第1の実施の形態におけるランキング装置の構成図である。 本発明の第1の実施の形態における動作のフローチャートである。 本発明の第1の実施の形態における入力データの例である。 本発明の第1の実施の形態におけるブログ記事記憶部のデータ構成例である。 本発明の第1の実施の形態における関係抽出部で生成されるリストの例である。 本発明の第1の実施の形態における語彙とブログサイトの関係の集計データの例である。 本発明の第1の実施の形態における語彙ランキングの出力結果の例である。 本発明の第2の実施の形態におけるランキング装置の構成図である。 本発明の第2の実施の形態における動作のフローチャートである。 本発明の第2の実施の形態における語彙ランキングの出力結果の例である。
符号の説明
10 語彙入力部
20 関係抽出手段、関係抽出部
30 検索手段、検索部
35 収集部
40 ブログ記事記憶手段、ブログ記事記憶部
45 キーワード記憶部
50 関連集計手段、関連集計部
60 スコア算出手段、スコア算出部
70 情報出力手段、情報出力部
80 集計結果正規化部

Claims (6)

  1. ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング方法であって、
    検索手段が、
    特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する文書検索ステップと、
    関係抽出手段が、
    前記キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出ステップと、
    関連集計手段が、
    前記関係抽出ステップで抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計ステップと、
    スコア算出手段が、
    前記関連集計ステップで集計された結果に基づいて、前記行列Rとその転置行列RTの乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出ステップと、
    情報出力手段が、
    前記スコア算出ステップで算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力ステップと、
    を行うことを特徴とする情報ランキング方法。
  2. 集計結果正規化手段において、
    前記関連集計ステップにおける集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化ステップを更に行う
    請求項1記載の情報ランキング方法。
  3. ある特定の個人や組織によって情報提供がなされている記事の集合であるブログサイトを、特定の興味分野に対する関連度でランキングする情報ランキング装置であって、
    ブログ記事、及び、該ブログ記事がどのブログサイトに属するかの情報を格納したブログ記事記憶手段と、
    特定の興味分野を示すキーワードの集合が入力されると、該キーワードに基づいて、前記ブログ記事記憶手段を検索し、ブログ記事及びそのブログ記事が属するブログサイトの情報を取得する検索手段と、
    前記キーワード毎に言及しているブログサイトを取得し、キーワードとブログサイトの関係をリスト化する関係抽出手段と、
    前記関係抽出手段で抽出したキーワードとブログサイトの関係を取得して、それぞれのブログサイト中でそれぞれのキーワードを含むブログ記事数を集計し、集計した記事数を要素とする行列Rを得る関連集計手段と、
    前記関連集計手段で集計された結果に基づいて、前記行列Rとその転置行列RTの乗算によって得られる行列の固有ベクトルからブログサイトのスコアを算出するスコア算出手段と、
    前記スコア算出手段で算出された前記スコアに基づいて、ブログサイトをランキングし、出力する情報出力手段と、
    を有することを特徴とする情報ランキング装置。
  4. 前記関連集計手段における集計の結果を、各ブログサイトもしくは各キーワードの単位で関係の頻度を示す値が等しくなるように関係を正規化する集計結果正規化手段を更に有する
    請求項3記載の情報ランキング装置。
  5. コンピュータに、
    請求項3または4記載の情報ランキング装置の各手段を実行させることを特徴とする情報ランキングプログラム。
  6. コンピュータに、
    請求項3または4記載の情報ランキング装置の各手段を実行させる情報ランキングプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2006164983A 2006-06-14 2006-06-14 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4750628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006164983A JP4750628B2 (ja) 2006-06-14 2006-06-14 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006164983A JP4750628B2 (ja) 2006-06-14 2006-06-14 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2007334590A JP2007334590A (ja) 2007-12-27
JP4750628B2 true JP4750628B2 (ja) 2011-08-17

Family

ID=38934022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006164983A Expired - Fee Related JP4750628B2 (ja) 2006-06-14 2006-06-14 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4750628B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5504595B2 (ja) * 2008-08-05 2014-05-28 株式会社リコー 情報処理装置、情報検索システム、情報処理方法およびプログラム
JP5200750B2 (ja) * 2008-08-08 2013-06-05 株式会社リコー 情報検索装置、情報検索方法、プログラム、および記録媒体
JP5262434B2 (ja) * 2008-08-26 2013-08-14 株式会社リコー 情報検索システム、情報検索方法、プログラムおよび記録媒体
JP2011022624A (ja) * 2009-07-13 2011-02-03 Nec Corp ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム
US8560530B2 (en) 2010-05-17 2013-10-15 Buzzmetrics, Ltd. Methods, apparatus, and articles of manufacture to rank web site influence
KR101796161B1 (ko) * 2010-06-03 2017-11-10 신철호 사용자 별 매체를 이용한 블로깅 방법 및 시스템

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3578651B2 (ja) * 1998-12-04 2004-10-20 株式会社リコー 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005346598A (ja) * 2004-06-07 2005-12-15 Sangaku Renkei Kiko Kyushu:Kk ウェブ情報収集装置とウェブクローラープログラム、及びウェブ情報収集方法

Also Published As

Publication number Publication date
JP2007334590A (ja) 2007-12-27

Similar Documents

Publication Publication Date Title
JP5116775B2 (ja) 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体
JP5340751B2 (ja) 文書処理装置および文書処理方法
US7849104B2 (en) Searching heterogeneous interrelated entities
Crescenzi et al. Clustering web pages based on their structure
US9031935B2 (en) Search system, search method, and program
US20110173197A1 (en) Methods and apparatuses for clustering electronic documents based on structural features and static content features
CN103874994A (zh) 用于自动概括电子文档的内容的方法和装置
JP2004213675A (ja) 構造化ドキュメントの検索
JPWO2007119567A1 (ja) 文書処理装置および文書処理方法
Wolfram The symbiotic relationship between information retrieval and informetrics
JP4750628B2 (ja) 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
Faba‐Pérez et al. Comparative analysis of webometric measurements in thematic environments
Bharamagoudar et al. Literature survey on web mining
JP6727097B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN105808761A (zh) 一种基于大数据Solr网页排序优化方法
Jain et al. Organizing query completions for web search
Zhang et al. A latent usage approach for clustering web transaction and building user profile
KR20120020558A (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5589009B2 (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP2010282403A (ja) 文書検索方法
JP4567581B2 (ja) 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体
Wu et al. Automatic topics discovery from hyperlinked documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4750628

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees