JP4894580B2 - Shundo analysis system, Shundo analysis method, and Shundo analysis program - Google Patents

Shundo analysis system, Shundo analysis method, and Shundo analysis program Download PDF

Info

Publication number
JP4894580B2
JP4894580B2 JP2007073388A JP2007073388A JP4894580B2 JP 4894580 B2 JP4894580 B2 JP 4894580B2 JP 2007073388 A JP2007073388 A JP 2007073388A JP 2007073388 A JP2007073388 A JP 2007073388A JP 4894580 B2 JP4894580 B2 JP 4894580B2
Authority
JP
Japan
Prior art keywords
shundo
article
cluster
articles
trackback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007073388A
Other languages
Japanese (ja)
Other versions
JP2008234338A (en
Inventor
貴稔 北野
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2007073388A priority Critical patent/JP4894580B2/en
Publication of JP2008234338A publication Critical patent/JP2008234338A/en
Application granted granted Critical
Publication of JP4894580B2 publication Critical patent/JP4894580B2/en
Application status is Expired - Fee Related legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、インターネット上に掲載される記事の旬度を解析する旬度解析システム、旬度解析方法、及び旬度解析プログラムに関する。 The present invention Shundo analysis system for analyzing the season of the articles to be published on the Internet, Shundo analysis method, and a Shundo analysis program.

インターネット上には膨大な数の記事が存在している。 It is on the Internet and there are a huge number of articles. 一日に何度も更新される性質の記事(例えばブログ)の場合、全ての記事を閲覧して最新の情報を把握しようとすると膨大な時間が掛かってしまう。 In the case of articles of nature that many times is also updated in one day (eg blog), it takes an enormous amount of time when you try to grasp the latest information browse all articles. 従って、今現在どのようなテーマがあり、そのテーマがどれだけ盛り上がっているのか分かりにくい。 Therefore, now there is what kind of theme the current, difficult to understand how the theme has raised much. 更には、インターネット上に掲載される多数の記事のジャンル(スポーツ、経済等)は多様である。 Furthermore, the genre of a number of articles to be published on the Internet (sport, economy, etc.) are diverse. 同一のジャンルでありながらも、様々な観点から書かれた記事が数多く掲載されている。 Yet the same genre have also been published a number of articles written from various points of view. 従って、インターネット上に掲載される多数の記事の中から、必要な記事だけを選択して閲覧することは難しい。 Therefore, from among a large number of articles to be published on the Internet, it is difficult to view by selecting only the necessary articles.

従って、インターネット上にどのようなテーマがあり、そのテーマがどれだけ旬であるか、を知ることのできる技術が望まれる。 Therefore, there is what the theme on the Internet, techniques that can be known that whether the theme is how season, a is desired. また、このような技術に対しては、精度よくインターネット上のテーマと旬度を把握できることが要求される。 Further, for such technology, it is required to accurately grasp the theme and Shundo on the Internet. 尚、旬とは、スパムなどによる突発的な盛り上がりや長期的なトレンドではなく、記事の人気による短期的な盛り上がりのことを指す。 It should be noted that the season, rather than a sudden upsurge and long-term trends such as by spam, refers to the short-term upsurge due to the popularity of articles.

上記と関連して、語句の出現頻度によって、どのようなテーマがあるのかを把握しようとする技術が特許文献1〜3に記載されている。 In connection with the above, the frequency of occurrence of words, what the theme is to figure out whether the technique is described in Patent Documents 1 to 3. 特許文献1は、複数のニュースサイトの記事を収集して単語を取りだし、出現頻度の高い単語を抽出して重要語とし、重要語と関連性の有る単語を関連語とし、重要語に対する関連語の関連度を計算してこれらを表示することが記載されている。 Patent Document 1, take out the word to collect articles of multiple news sites, and important words to extract the high frequency of appearance word, a related word a word having the important words and relevance, related words for the important words it is described that display these the degree of association calculated. 特許文献2には、記事の作成時刻に基いて、記事の作成時刻が新しいほど、その記事内で出現する語句に重みを与え、カテゴリ別に新出の語句のランキングを行うことが記載されている。 Patent Document 2, on the basis of the creation time of the article, as the creation time of the article is new, gives a weight to words that appear in the article, it is described that performs a ranking phrase Shinde by category . 特許文献3には、更新通知のあったブログ中において、キーワードの出現頻度をカウントし、出現頻度の数を利用して近未来のトレンドキーワードを予測することが記載されている。 Patent Document 3, in a made the update notification blog, counts the occurrence frequency of the keyword, using a number of frequency have been described to predict the trend keywords in the near future.

また、旬度に関連して、記事に対する人気や重要度を評価する技術が、特許文献4〜6に記載されている。 In connection with Shundo, techniques for evaluating the popularity or importance for articles is described in Patent Document 4-6. 特許文献4には、他のウェブページ(記事)から該当ウェブページに向かうリンク数を用いて、該当ウェブページの人気度を計算することが記載されている。 Patent Document 4, with a number of links toward the corresponding web page from other web pages (articles), it is described that computes the popularity of a corresponding web page. 特許文献5には、ホームページのアクセス数を人気とみなすことが記載されている。 Patent Document 5 discloses that regarded as popular the number of accesses website. 特許文献6には、ページ重要性ランキングを計算するにあたって、ウェブページデータ中のウェブページのリンクを、あるレベルで集約し、集約されたリンクを使用することが記載されている。 Patent Document 6, in calculating a page importance ranking the links of the web page in the web page data, aggregated at a certain level, it is described that the use of aggregated links.

また、特許文献7には、複数の記事を、記事内容に従って分類する文書分類装置についての記載がある。 Further, Patent Document 7, there is a description about the document classification device a plurality of articles, classified according to article content. この特許文献7には、文書データ毎に単語出現回数を計数して文書特徴ベクトルを生成し、文書特徴ベクトルに統計的手法を適用することで文書分類を行うことが記載されている。 The patent document 7, to generate a document feature vector by counting the word occurrence count for each document data, it is described that performs document classification by applying the statistical method to the document feature vector.

特開2002−108937号 公報 JP 2002-108937 JP 特開2005−135311号 公報 JP 2005-135311 JP 特開2006−227965号 公報 JP 2006-227965 JP 特許第3802813号 公報 Patent No. 3802813 Publication 特開2002−132976号 公報 JP 2002-132976 JP 特開2006−127529号 公報 JP 2006-127529 JP 特開2001−101227号 公報 JP 2001-101227 JP

本発明の目的は、インターネット上にどのようなテーマがあるかを、精度よく知ることのできる技術を提供することにある。 An object of the present invention, if there is any theme on the Internet is to provide a technique capable of knowing precisely.

本発明の他の目的は、インターネット上の記事にあるテーマの旬度を、精度よく把握することのできる技術を提供することに有る。 Another object of the present invention is to provide a technique for the Shundo theme in the article on the Internet, it can be grasped accurately.

以下に、[発明を実施するための最良の形態]で使用される番号・符号を用いて、[課題を解決するための手段]を説明する。 Hereinafter, with reference to numerals and symbols used in the best mode for carrying out the invention, it will be described the means for solving the problems. これらの番号・符号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]との対応関係を明らかにするために括弧付きで付加されたものである。 These numerals and symbols are those which are added in parentheses to clarify the correspondence between the [BEST MODE FOR CARRYING OUT THE INVENTION] described as in the claims. ただし、それらの番号・符号を、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。 However, their numbers and symbols should not be used to interpret the technical scope of the invention described in the claims.

本発明の旬度解析システムは、インターネット上に掲載される複数の記事のうち、複数の起点記事と、その複数の起点記事の各々からリンクで辿ることのできる記事群とについて記事内容を収集し、記事を特定する記事情報と対応付けて記事記録部(2)に記録する記事収集部(1)と、記事収集部(1)で収集される起点記事毎に、その起点記事とその起点記事からリンクで辿ることのできる記事群とを含む集合をクラスタとし、その記事情報と対応付けてクラスタ情報を生成し、そのクラスタ情報をクラスタ記録部(4)に記録するクラスタ生成部(3)と、記事記録部(2)及びクラスタ記録部(4)を参照して、そのクラスタに含まれる記事の記事内容に基いて、異なるクラスタ間の類似度をを計算し、計算結果に基いて類似するク Shun degree analysis system of the present invention, among the plurality of articles to be published on the Internet, collect a plurality of origins article, the article content for the articles group which can be traced by the link from each of the plurality of origins articles articles collecting unit recorded in association with the article information for identifying the article to the article recording unit (2) and (1), for each starting point article to be collected in the article collection unit (1), its origin article and its origin articles and cluster collections containing and article group which can be traced by link, generates cluster information in association with the article information, the cluster generating unit to record the cluster information in the cluster recording unit (4) and (3) , see article recording unit (2) and cluster recording unit (4), on the basis of the article contents of the articles contained in the cluster, to calculate the similarity between different clusters, similar based on the calculation result click スタ同士をマージしてマージ後クラスタ情報を生成するクラスタ再構成部(5)と、そのマージ後クラスタ情報と記事記録部(2)とを参照し、クラスタ毎に旬度を測定する旬度測定部(7)と、旬度測定部(7)で測定された結果を出力装置に出力させる出力部(8)と、を具備する。 Cluster reconfiguration unit for generating a merge after cluster information by merging the static each other and (5), with reference to its merge after cluster information and article recording unit (2), Shundo measurement for measuring the Shundo per cluster part (7) comprises Shundo measuring unit and an output unit for outputting to an output device results measured by (7) (8), the.

この発明によれば、クラスタ再構成部(5)によって、記事内容の類似するクラスタ同士がまとめられるようにクラスタが再構成されるので、インターネット上の多数の記事をテーマ別に分類させることができる。 According to the present invention, the cluster by the reconstruction unit (5), since the cluster to cluster together are grouped to similar articles content is reconstructed, it is possible to classify a large number of articles on the Internet by theme. これにより、インターネット上にどのようなテーマがあるかを、精度よく把握することができる。 As a result, whether or not there is any theme on the Internet, it can be grasped with high accuracy. また、旬度測定部(7)が、テーマ別にマージされたクラスタ毎に旬度を測定するので、テーマに対する旬度を把握することができる。 Further, Shundo measuring unit (7), so measuring the Shundo each merged clusters by theme, it is possible to grasp the Shundo for theme.

上記の旬度解析システムにおいて、クラスタ再構成部(5)は、記事記録部(2)に記録された記事の内容を解析して、単語と出現頻度とを対応付けた出現頻度データを生成し、出現頻度記録部(10)に記録する記事解析部(9)と、クラスタ記録部(4)及び出現頻度記録部(10)とを参照し、クラスタ毎に単語と出現頻度とを対応付けたクラスタ特徴ベクトルを生成し、特徴ベクトル記録部(12)に記録する特徴ベクトル生成部(11)と、そのクラスタ特徴ベクトルに基いて、異なるクラスタ間の類似度を計算し、計算結果に基いて類似するクラスタ同士をマージしてマージ後クラスタ情報を生成する類似度判定部(13)と、を備えることが好ましい。 In the above steepness analysis system, cluster reconfiguration unit (5) analyzes the content of the articles stored in the article recording unit (2) to generate frequency data that associates words with frequency articles analyzer for recording the appearance frequency recording unit (10) and (9), cluster recording unit (4) and the appearance frequency recording unit (10) with reference to the, associating the word with frequency for each cluster generates a cluster feature vectors, the feature vector recording unit and the feature vector generating unit for recording (12) (11), based on the cluster feature vectors, it calculates the similarity between different clusters, based on the calculation result similar similarity determination unit for generating a merge after cluster information by merging clusters together to (13), preferably comprises a.

まあ、この際に、記事解析部(2)は、シソーラス辞書を参照して、出現頻度データ中の類似単語がマージされるように、出現頻度データを生成することが好ましい。 Well, when the articles analyzer (2) refers to the thesaurus, as similar words in frequency data is merged, it is preferred to generate the frequency data.

上記の旬度解析システムにおいて、類似度判定部(14)は、異なるクラスタ間で類似度を計算するにあたり、下記式1により類似度を計算することが好ましい。 In the above steepness analysis system, the similarity determination unit (14), when the degree of similarity is calculated between different clusters, it is preferable to calculate the similarity by the following equation 1.
(但し、→viはクラスタiの特徴ベクトルを示し、→vjはクラスタjの特徴ベクトルを示す) (However, → vi represents the feature vector of the cluster i, → vj represents the feature vector of the cluster j)

上記の旬度解析システムにおいて、記事収集部(1)は、記事内容を収集して記録するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報と、トラックバックの張られた時刻とを収集して、記事情報と対応付けて記録することが好ましい。 In the above steepness analysis system, article collecting unit (1) is, upon recording collects articles contents, further, the trackback information for specifying the original article trackback spanned against articles to be collected, the trackback collect and tensioned time, it is preferable to record in association with article information. ここで、旬度測定部(7)は、クラスタ毎に新鮮度を計算して新鮮度記録部(16)に記録する新鮮度計算部(15)と、新鮮度の結果に基いて、旬度を算出する旬度計算部(21)とを備える。 Here, Shundo measuring unit (7), freshness calculation unit that records the freshness recording unit calculates the freshness for each cluster (16) and (15), based on the freshness of the result, Shundo comprising Shundo calculating unit (21) for calculating a. また、新鮮度計算部(16)は、クラスタ中に含まれるトラックバックの数と、トラックバックの張られた時刻とに基いて、新鮮度を計算する。 Further, freshness calculation unit (16) includes a number of trackback contained in the cluster, based on the time spanned a trackback to calculate the freshness. また、新鮮度計算部(15)は、下記式2により、新鮮度F(t)を計算することが更に好ましい。 Further, freshness calculation unit (15), the following equation 2, more preferably to calculate the freshness F (t).
(但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)

上記の旬度解析システムにおいて、記事収集部(1)は、記事内容を収集して記録するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報を収集して、記事情報と対応付けて記録することが好ましい。 In the above steepness analysis system, article collecting unit (1) is, upon recording collects articles content, further collects trackback information identifying the original article trackback spanned against articles to be collected , it is preferably recorded in association with article information. ここで、旬度測定部(7)は、クラスタ毎に波及度を計算して波及度記録部(20)に記録する波及度計算部(19)と、波及度の結果に基いて旬度を算出する旬度計算部(21)とを備る。 Here, Shundo measuring unit (7) is spread calculation unit for recording the calculated spillover level for each cluster spread of the recording unit (20) and (19), the Shundo based on spread of the results calculated for Shundo calculating unit (21) 備Ru. 波及度計算部(19)は、トラックバック情報に基いて、トラックバックの起点記事からの深さを算出し、クラスタ中に含まれるトラックバックの数と、トラックバックの起点記事からの深さとに基いて、波及度を計算する。 Spread calculation portion (19), based on the trackback information, calculates the depth from the origin article trackback, the number of trackback contained in the cluster, based on the depth from the origin article trackback, spillover degree is calculated. このとき、波及度計算部(19)は、下記式3により、波及度I(d)を計算することが更に好ましい。 At this time, it spreads calculation portion (19), the following equation 3, more preferably to calculate the spread of I (d).
(但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)

上記の旬度解析システムにおいて、記事収集部(1)は、記事内容を収集して記録するにあたり、更に、収集される記事に対する読み手の評価を示す評価情報を収集して、記事情報と対応付けて記録することが好ましい。 In the above steepness analysis system, article collecting unit (1) is, upon recording collects articles content, further collects the evaluation information indicating the evaluation of the reader with respect to articles to be collected, the association and article information it is preferable to record Te. ここで、旬度測定部(7)は、クラスタ毎に人気度を計算して人気度記録部(18)に記録する人気度計算部(17)と、人気度の結果に基いて旬度を算出する旬度計算部(21)とを備える。 Here, Shundo measuring unit (7), the popularity calculation section for recording the popularity recording unit (18) calculates the popularity for each cluster (17), the Shundo based on the result of the popularity It comprises calculating for Shundo calculating section (21). 人気度計算部(21)は、クラスタ中に含まれる記事の数と、記事の評価情報とに基いて、人気度を計算する。 The popularity calculation section (21), and the number of articles contained in the cluster, on the basis of the evaluation information of the article, to calculate the popularity. この際、評価情報は、収集される記事に対するソーシャルブックマーク数又はアクセス数であることがより好ましい。 At this time, the evaluation information is preferably a social bookmark number or number of accesses to the articles to be collected.

上記の旬度解析システムにおいて、記事収集部(1)は、記事を収集して記録するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報と、前記トラックバックの張られた時刻と、収集される記事に対する読み手の評価を示す評価情報と、を収集して、前記記事情報と対応付けて記録することが好ましい。 In the above steepness analysis system, article collecting unit (1) is, upon recording by collecting articles, further, the trackback information for specifying the original article trackback spanned against articles to be collected, the trackback and tensioned time, the evaluation information indicating an evaluation of the reader with respect to articles to be collected, to collect, is preferably recorded in association with the article information. ここで、旬度測定部(7)は、クラスタ毎に、クラスタ中に含まれる記事の数と、記事の前記評価情報とに基いて人気度を計算し、人気度記録部(18)に記録する人気度計算部(17)と、クラスタ毎に、トラックバック情報に基いて、トラックバックの起点記事からの深さを算出し、クラスタ中に含まれるトラックバックの数と、トラックバックの起点記事からの深さとに基いて波及度を計算して波及度記録部(20)に記録する波及度計算部(19)と、クラスタ毎に、クラスタ中に含まれるトラックバックの数と、トラックバックの張られた時刻とに基いて、新鮮度を計算して新鮮度記録部(16)に記録する新鮮度計算部(15)と、人気度、前記波及度、及び前記新鮮度の結果に基いて、旬度を算出する旬度計算部(7)とを備 Here, Shundo measuring unit (7), for each cluster, the number of articles contained in the cluster, based on said evaluation information articles calculates the popularity recorded in popularity recording unit (18) and the popularity calculation section (17) that, for each cluster, based on the trackback information, calculates the depth from the starting point article of trackbacks, and the number of trackbacks to be included in the cluster, and the depth from the origin article Trackback a spread calculation unit for recording (19) the calculated and spread of the recording unit (20) a spreading degree based on, for each cluster, the number of trackback contained in the cluster, to the time spanned a trackback based in a freshness calculation unit that records the freshness recording unit calculates the freshness (16) (15), popularity, the spreading degree, and the based on the freshness of the result, calculates the Shundo Bei Shundo calculation unit (7) る。 That. この時、新鮮度計算部(15)は、下記式4により、新鮮度F(t)を計算し、 At this time, fresh calculation unit (15), the following equation 4, to calculate the freshness F (t),
(但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)
波及度計算部(19)は、下記式5により、波及度I(d)を計算し、 Spread calculation portion (19), the following equation 5 to calculate the spread of I (d),
(但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)
前記人気度計算部(17)は、収集される記事に対するソーシャルブックマーク数又はアクセス数を評価情報として、クラスタ毎の総ソーシャルブックマーク数又は総アクセス数を、人気度P(n)として計算し、 Said the popularity calculation section (17), as the evaluation information social bookmark number or number of accesses to the article to be collected, the total social bookmark number or the total number of accesses for each cluster, calculated as the popularity P (n),
旬度計算部(21)は、下記式6により、旬度を計算することが更に好ましい。 Shundo calculation unit (21), the following equation 6, it is more preferable to calculate the Shundo.
(但し、Ii(d)はトラックバックiの波及度を示し、Fi(t)はトラックバックiの新鮮度を示し、Pj(n)は、記事jの人気度を示す) (However, Ii (d) shows the spread of the trackback i, Fi (t) indicates the freshness of trackback i, Pj (n) indicates the popularity of the article j)

本発明によれば、インターネット上にどのようなテーマがあるかを、精度よく知ることのできる技術が提供される。 According to the present invention, whether there is any theme on the Internet, a technique that can be known accurately provided.

本発明によれば、更に、インターネット上の記事にあるテーマの旬度を、精度よく把握することのできる技術が提供される。 According to the present invention, further, the Shundo article in Subjects on the Internet, a technique that can be grasped accurately provided.

(第1の実施形態) (First Embodiment)
以下、図面を参照しつつ、第1の実施形態について説明する。 Hereinafter, with reference to the drawings, a first embodiment will be described. 本実施形態の旬度解析システムは、インターネット上の膨大な記事のなかから、旬度の高い記事を自動的に抽出して、その記事を特定する情報を表示するものである。 Shun degree analysis system of the present embodiment, from among the vast articles on the internet, and automatically selects high season of articles, and displays the information identifying the article. 尚、解析の対象となる記事としては、ブログやWIKIなどの、リンク支援システム付のユーザー参加型ウェブシステム群に含まれる記事が挙げられる。 It should be noted that, as the article to be analyzed, such as blogs and WIKI, include the article that is included in the user participation type web system group with link support system.

図1は、本実施形態に係る旬度解析システムの構成を示す概略ブロック図である。 Figure 1 is a schematic block diagram showing a configuration of a season of analysis system according to the present embodiment. 旬度解析システムは、ROM(Read only memoly)等に格納され、CPUにより実行される旬度解析プログラムと、その旬度解析プログラムの処理内容、結果を記録する記憶装置(RAM、ハードディスク等)から構成される。 Shundo analysis system is stored in ROM (Read only memoly), etc., and Shundo analysis program executed by the CPU, the processing content of the Shundo analysis program from the storage device for recording the results (RAM, hard disk, etc.) constructed. 具体的には、図1に示されるように、記事収集部1、記事記録部2、クラスタ生成部3、クラスタ記録部4、クラスタ再構成部5、マージ後クラスタ記録部6、旬度測定部7、及び表示部8を備えている。 Specifically, as shown in FIG. 1, article collecting unit 1, articles recording unit 2, the cluster generating unit 3, cluster recording unit 4, cluster reconfiguration unit 5, a merge after cluster recording unit 6, Shundo measuring unit 7, and a display unit 8.

記事収集部1は、インターネット上から定期的に記事を取得して記事データを生成し、記事記録部2に格納する機能を実現する。 Articles collecting unit 1 generates article data regularly obtain articles from the Internet, to realize the function of storing the articles recording unit 2. ここで記事収集部1は、更新された情報や新しい情報のみを記事記録部2に格納する。 Here article collection unit 1 stores only the updated information and new information on articles recording unit 2.

クラスタ生成部3は、記事収集部1が収集する少なくとも一の記事に対してクラスタを設定し、クラスタ情報としてクラスタ記録部4に格納するものである。 Cluster generating unit 3 sets the cluster to at least one article article collecting unit 1 collects, and stores the cluster recording unit 4 as a cluster information.

クラスタ再構成部5は、記事記録部2とクラスタ記録部4とを参照して、クラスタ間の類似度を判定し、類似クラスタ同士をマージしたマージ後クラスタ情報を生成してマージ後クラスタ情報記録部6に格納するものである。 Cluster reconfiguration unit 5 refers to the article recording unit 2 and the cluster recording unit 4 determines the degree of similarity between clusters, generate and merge after cluster information recording cluster information merged merging similar clusters together is intended to be stored in the unit (6). クラスタ再構成部5は、記事解析部9、出現頻度記録部10、特徴ベクトル生成部11、特徴ベクトル記録部12、類似度判定部11、及び類似度記録部14を備えている。 Cluster reconfiguration unit 5, article analysis unit 9, frequency recording unit 10, feature vector generation unit 11, a feature vector recording unit 12, a similarity determination unit 11, and the similarity recording unit 14.

旬度測定部7は、記事記録部2とマージ後クラスタ記録部6とを参照して、マージ後のクラスタ毎に旬度を測定するものである。 Shundo measuring unit 7, with reference to the article recording unit 2 and merge after cluster recording unit 6, which measures the Shundo for each of the merged cluster. 旬度測定部7は、新鮮度計算部15、新鮮度記録部16、人気度計算部17、人気度記録部18、波及度計算部19、波及度記録部20、旬度計算部21、及び旬度記録部22を備えている。 Shundo measuring unit 7, freshness calculation unit 15, freshness recording unit 16, the popularity calculation unit 17, popularity recording unit 18, spread calculation unit 19, spread of the recording unit 20, Shundo calculation unit 21 and, and a Shundo recording unit 22.

表示部8は、旬度測定部7の測定結果を表示画面上に表示するものである。 Display unit 8 is for displaying on the display screen the measurement results of Shundo measuring unit 7.

この旬度解析システムは、以下に述べるように動作してその機能を実現する。 The Shundo analysis system realizes its function operates as described below. 図2は、本実施形態に係る旬度解析方法を示すフローチャートである。 Figure 2 is a flow chart illustrating the steepness analysis method according to the present embodiment. この旬度解析方法は、記事を収集するステップ(S001)、クラスタリングを行うステップ(S002)、類似度を判定してクラスタを再構成するステップ(S003)、旬度を測定するステップ(S004)、及び表示するステップ(S0005)を備えている。 The Shundo analysis method comprises the steps of collecting articles (S001), performing a clustering (S002), the step of reconstructing the cluster to determine the degree of similarity (S003), the step of measuring the Shundo (S004), and a step (S0005) of displaying. 各ステップにおける動作について、以下に詳述する。 The operation in each step will be described in detail below.

((ステップS001;記事の収集)) ((Step S001; collection of articles))
図3は、記事収集部1がインターネット上に掲載される記事を収集する際の動作を示すフローチャートである。 Figure 3 is a flowchart illustrating an operation when collecting articles article collecting unit 1 is posted on the Internet. 本ステップの説明にあたっては、図4に示されるように、インターネット上に、複数の記事(A〜H)が掲載されている場合を例として説明する。 In the description of this step, as shown in FIG. 4, on the Internet, it will be described a case where a plurality of articles (A to H) are listed as examples. 図4中、矢印はトラックバックによるリンクを示しており、例えば記事Aは記事Bからトラックバックされ、記事Aから記事Bにリンクが張られていることを示している。 In Figure 4, arrows indicate that shows the link by trackback, for example articles A is trackback from the article B, the link from the article A to article B is stretched.

ステップS101 Step S101
まず、記事収集部1は、起点となる記事(以下、起点記事)を選択する。 First, articles collecting unit 1, article as a starting point (hereinafter, origin articles) selects. ここでは、記事Aが起点記事として選ばれたとする。 Here, it is assumed that the article A has been chosen as a starting point article. 起点記事は、例えば、ソーシャルブックマークの登録数が多い記事や、アクセス数が多い記事、ユーザによって指定された記事などが選ばれる様にすればよい。 Starting point article, for example, registration number and many articles of social bookmarking, the number of access there are many articles, it is sufficient As such articles that have been specified by the user is selected. 記事収集部1は、選択した起点記事Aにアクセスして、記事Aに関するデータ(記事データ)を収集し、記事記録部2に格納する。 Articles collecting unit 1 accesses the origin article A selected, to collect data relating to articles A (article data) is stored in the article recording unit 2.

図5は、記事記録部2に記録されるデータを示す概念図である。 Figure 5 is a conceptual diagram showing the data recorded in the articles recording unit 2. 記事収集部2は、この図に示される項目のうち、記事内容(タイトル及び本文)、URL(記事内容)、記事Aの作成時刻、記事Aに対するトラックバック元のURL、トラックバックのリンクが張られた時刻、及び評価情報(本実施形態ではソーシャルブックマーク数)を収集する。 Article collection unit 2, among the items shown in this figure, the article content (title and text), URL (article content), creation time of the article A, track back the source of the URL for the article A, link trackback has been stretched time, and the evaluation information (in this embodiment social bookmarking number) to collect. そして、これらを記事を特定するための記事ID(記事情報;A)と対応付けて、記事記録部2に記録する。 The article ID for these to identify an article (article information; A) in association with, and records the article recording unit 2. この時、図5に示される「訪問済み」の項目はNOにしておく。 In this case, the item of "visited", as shown in FIG. 5 is keep to NO. そして、次のステップ(S102)へと進む。 Then, the process proceeds to the next step (S102). 尚、図5では、記事B、C、Dに関する項目も埋められており、「訪問済み」の項目もYESとなっているが、この図5は、最終的な状態の例を示したものであり、本ステップでの処理後の状態をそのまま示したものではない。 In FIG. 5, article B, C, and item also filled about D, item "visited" also becomes YES, this FIG. 5 shows an example of a final state There, a state after processing in the step does not show it.

ステップS102 Step S102
次に、記事収集部2は、記事記録部を参照して未訪問の記事が存在するかを判断する。 Next, the article collection unit 2, to determine whether unvisited article is present with reference to the article recording unit. 存在する場合には、次のステップS103に進み、存在しない場合には記事収集に係る処理を終える。 When present, the process proceeds to the next step S103, if there is not end the process according to the article collection. この段階では、起点記事Aの訪問が未訪問となっているので、次のステップS103に進む。 At this stage, since the visit of the origin article A has become a unvisited, proceed to the next step S103.

ステップS103、S104 Step S103, S104
次に、記事収集部1は、未訪問の記事の中から記事IDの最も若い記事を選択する。 Next, the article collection unit 1, to select the most young article of the article ID from among the unvisited article. ここでは、起点記事Aが選択される(S103)。 Here, the starting point article A is selected (S103). そして、選択した記事にトラックバックが張られているかどうかを確認し、張られている場合にはステップS105へ進み、張られていない場合にはS106に進む。 Then, to check whether the track back is stretched to the selected article, in the case that has been stretched proceeds to step S105, in case it is not stretched, the process proceeds to S106. ここでは、選択された起点記事Aに対して、記事Bと記事Cからのトラックバックが張られているので、S105に進む(S104)。 Here, for the selected starting point article A, because trackback from article B and article C is stretched, the process proceeds to S105 (S104).

ステップS105 Step S105
次に、記事収集部1は、S103で選択した記事のトラックバック元の記事にアクセスし、S101の処理と同様に、記事に関するデータを収集して記事記録部2に格納する。 Then, articles collecting unit 1 accesses the trackback Originally Published articles selected in S103, similarly to the processing in S101, collects and stores data regarding articles to the article recording unit 2. ここでは、記事Bと記事Cとにアクセスして収集する。 Here collects to access and the articles C articles B. この際、記事Bと記事Cは、未訪問にしておく。 In this case, the article B and article C is, keep the unvisited. その後、次のステップS106に進む。 Thereafter, the flow advances to Step S106.

ステップS106 Step S106
次に、記事収集部1は、S103で選択した記事(記事A)を訪問済みであることを記事記録部2に記録して、S102の処理に戻る。 Then, articles collecting unit 1, records that the visited the selected article (article A) at S103 to the article recording unit 2, the process returns to S102. S102では、記事B、記事Cが未訪問であるので、S103へと進み、記事IDの若い記事Bが選択される。 In S102, article B, article C is because it is unvisited, the process proceeds to S103, young articles B of article ID is selected. S104において、記事Bにはトラックバック元が無いので、S106へと進んで、記事Bが訪問済みであることが記事記録部2に記録される。 In S104, since there is no track back source to article B, it proceeds to S106, articles B that is recorded in the articles recording unit 2 is visited. このような処理を繰り返し、起点記事Aからリンクを辿ってアクセスすることのできる記事群全てについて、記事に関するデータが収集され、記事記録部2に記録される。 Repeat this process for all articles groups that can be accessed by following links from the starting point article A, data is collected regarding articles, it is recorded in the articles recording unit 2. 同様の処理を、他の起点記事(D及びG)についても繰り返して、記事に関するデータを収集して記録する。 The same process, also repeated for the other origins articles (D and G), and records the collected data about articles.

尚、以上の一連の処理の説明では、起点記事からリンクで辿る事のできる全ての記事について記事内容を収集する場合について説明したが、例えば2回目以降の処理のなどで記事記録部2に既に記事内容などが記憶されている場合には、更新された記事及び新しい記事についてのみ、収集すればよい。 Incidentally, the above description of a series of processes have been described for the case of collecting articles content for all articles that can be traced by the link from the origin articles, for example, already articles recording unit 2 in such a second or subsequent treatment If you like article content is stored, for updated articles and new articles only, may be collected.

((ステップS002));クラスタリング処理 続いて、クラスタ生成部3が、記事記録部21が収集した複数の記事に対して、起点記事及び起点記事からトラックバックによるリンクを辿ることのできる記事群の集合をクラスタとして設定する。 ((Step S002)); Following clustering process, a cluster generating unit 3 is, for a plurality of articles Article recording unit 21 has collected, the articles group possible from the origin article and origin articles of following links by trackback set It is set as the cluster. クラスタ生成部3は、設定したクラスタに一意なID(以下、クラスタID)を割り振り、そのクラスタ中の記事IDを関連付けてクラスタ情報を生成し、クラスタ記録部4に記録する。 Cluster generating unit 3, a unique ID (hereinafter, the cluster ID) to the cluster set allocate, generates cluster information in association with article ID in the cluster is recorded in the cluster recording unit 4.

図6、7は、クラスタ記録部4に記録されるクラスタ情報の一例を示す概念図であり、図4で挙げた例に対応している。 6 and 7 is a conceptual diagram showing an example of cluster information recorded in the cluster recording unit 4, and corresponds to the example given in FIG. この例では、起点記事A及び起点記事Aからリンクを辿ることのできる記事B、Cからなる集合がクラスタC1として設定されている。 In this example, article B that can follow links from the starting point article A and origin articles A, the set consisting of C is set as the cluster C1. 同様に、クラスタC2として、起点記事D、記事E、Fからなる集合が設定され、クラスタC3として、起点記事G及び記事Hからなる集合が設定されている。 Similarly, as the cluster C2, the origin article D, article E, set consisting of F is set, as the cluster C3, are set set consisting origin article G and articles H. 尚、図6中では、説明を分かり易くするために、記事名A、B、を記載しているが、実際には、記事ID(B1、B2・・)とクラスタを示すクラスタIDとが対応付けられている。 Incidentally, in FIG. 6, for ease of description, article name A, B, has been described, and in fact, article ID (B1, B2 · ·) and a corresponding and cluster ID indicating the cluster It is attached. また、以下の説明でも、記事ID(B1、B2・・・)の代わりに、記事名(A、B、C・・・)を記載することがある。 Also in the following description, instead of the article ID (B1, B2 ···), article name (A, B, C ···) may be described a.

尚、トラックバックによるリンクを辿ることのできる記事群の集合は、たとえば、記事記録部2に記録されたトラックバック元のURLを参照することで把握することができる。 Incidentally, the set of articles groups that can follow the link by trackback, for example, can be grasped by referring to the trackback original URL recorded in the articles recording unit 2.

((ステップS003));類似度の判定、クラスタ再構成 続いて、図8は、本ステップにおける動作を示すフローチャートである。 ((Step S003)); the determination of similarity, following cluster reconfiguration, FIG. 8 is a flowchart showing the operation of this step. 本動作は、クラスタ再構成部5の動作により実現される。 This operation is realized by the operation of the cluster reconfiguration unit 5.

ステップS201、202;記事の選択 まず、記事解析部9が、記事記録部2に記録された全ての記事内容を取得する(S201)。 Step S201 and S202; Select article First, articles analyzer 9 obtains all articles content recorded in the articles recording unit 2 (S201). そして、取得した記事に対して、形態素解析を行う。 Then, the acquired article, perform a morphological analysis. それにより、記事内容を単語に分解し、その中から名詞を抽出する(S202)。 Thereby decomposing article contents into words and extracts the noun from its (S202). 本処理では、記事のテーマ(テーマ)の類似性を判定することが目的であり、テーマを表現するのに適さない品詞は必要がない。 In this process, it is the purpose is to determine the similarity of articles Theme (theme), parts of speech need not be unsuitable to represent a theme. 従って、形態素解析処理の結果から句読点・動詞・形容詞などを除き、名詞だけを抽出する。 Thus, except for the punctuation, verbs, adjectives from the results of morphological analysis, and extracts only nouns. 記事解析部9は、記事中に出現した名詞の出現回数をカウントし、名詞毎に一意なID(W1、W2・・・)を与えて、図9に例示される出現頻度データを生成し、出現頻度記録部10に記録する。 Articles analyzing unit 9 counts the number of occurrences of nouns that appeared in the article, giving a unique ID for each noun (W1, W2 · · ·), generates frequency data illustrated in FIG. 9, It is recorded in the frequency recording unit 10.

ステップS203;特徴ベクトルの生成 続いて、特徴ベクトル生成部11が、出現頻度データとクラスタ情報とを参照して、各クラスタ毎に、各単語の出現回数を集計する。 Step S203; Following generation of the feature vector, the feature vector generation unit 11, with reference to the frequency data and the cluster information, each cluster counts the number of occurrences of each word. そして、図10に示されるように、クラスタ毎に、単語ID(W1、W2、・・)と出現回数とを対応付けた特徴ベクトルを生成し、特徴ベクトル記録部12に記録する。 Then, as shown in FIG. 10, for each cluster, a word ID (W1, W2, ··) and generates a feature vector that associates and number of occurrences is recorded in the feature vector recording unit 12. この際に、全クラスタ中(全クラスタ中で正しいでしょうか?)で、出現頻度が高い順に上位の単語(例えば上位10単語)を選んで特徴ベクトルを生成する。 At this time, in all clusters (or it would be correct in all cluster?), To generate a feature vector to choose the top word of the frequency of occurrence in descending order (for example, the top 10 words). 尚、図10の例は、説明の便宜上、図8で示した例とは対応させていない。 The example of FIG. 10, for convenience of explanation, not to correspond to the example shown in FIG.

ステップS204、205;類似度の計算、比較 続いて、類似度判定部13が、特徴ベクトル記録部12から、異なる2つのクラスタの特徴ベクトルを取得する。 Step S204,205; similarity calculation, following comparison, the similarity determination unit 13, a feature vector recording unit 12 obtains the feature vector of two different clusters. そして、取得した2つの特徴ベクトルの為す角で類似度を計算する。 Then, the degree of similarity is calculated with angle formed of two feature vectors obtained. 本実施形態では、下記式7で示される様に、2つのクラスタ(iとj)の特徴ベクトルのなす角の余弦(コサイン)を類似度で定義するものとする。 In the present embodiment, as represented by the following formula 7, of the angle between the feature vectors of the two clusters (i and j) trigonometric cosine shall be defined by the degree of similarity.
(但し、→viはクラスタiの特徴ベクトルを示し、→vjはクラスタjの特徴ベクトルを示す) (However, → vi represents the feature vector of the cluster i, → vj represents the feature vector of the cluster j)

図10の場合を具体例にして、類似度の算出方法をより具体的に説明する。 And in the case of FIG. 10 embodiment, a method of calculating the similarity in more detail. ここでは、クラスタ1とクラスタ2間の類似度を算出するとする。 Here, the degree of similarity is calculated between clusters 1 and cluster 2. 上式7により、クラスタ1と2の類似度を算出すると、以下の様に計算され、類似度=0.01という結果を得る。 The above equation 7, cluster 1 and calculating the second similarity is calculated as follows, to obtain the result that the similarity = 0.01.
類似度=(3×2+0×2+9×0+7×0)/{√(3 +0 +0 +9 +7 )×√(2 +3 +2 +0 +0 )=0.01 Similarity = (3 × 2 + 0 × 2 + 9 × 0 + 7 × 0) / {√ (3 2 +0 2 +0 2 +9 2 +7 2) × √ (2 2 +3 2 +2 2 +0 2 +0 2) = 0.01

類似度判定部13は、計算した類似度から、2つのクラスタ同士が類似しているかどうかを判定する。 Similarity determination unit 13 determines from the calculated similarity, whether between two clusters are similar. 異なる2つのクラスタの特徴ベクトルに共通して出現する単語が多い程、また出現回数が近い単語が多いほど、特徴ベクトル同士のなす角度が1に近づき、類似度が高くなる。 More words appearing in common to the feature vectors of the two different clusters is large, and as the word is often close occurrence count, the angle between the feature vectors close to 1, the degree of similarity is high. 従って、予め類似度の閾値を設定しておき、特徴ベクトルの角度が閾値よりも近い(類似度が閾値よりも1に近い)クラスタ同士は類似している判定し、同一テーマを扱っているものと判定する。 Therefore, those previously similarity threshold may be set, (closer to 1 than the similarity threshold) closer than the angle threshold feature vector clusters each other determines similar, dealing with the same theme It determines that. 上述した例では、仮に閾値を0.07に設定していたとすると、類似度=0.01であり、閾値よりも1に近くないので、類似していないと判定する。 Determining in the above example, when to have been set if the threshold 0.07, a degree of similarity = 0.01, since not close to 1 than the threshold, and not similar. (ステップS205)。 (Step S205). 類似していた場合には、次のステップS206の動作を行い、類似していなかった場合には、S207の動作を行う。 If you were similar, it performs an operation the next step S206, if no similar performs operation S207.

尚、上述の処理(S204、205)で計算された類似度は、図11に示されるように、類似度記録部14に格納される。 Incidentally, the calculated similarity of above process (S204,205), as shown in FIG. 11 and stored in the similarity recording unit 14.

ステップS206;類似クラスタのマージ S205の処理で、2つのクラスタ同士が類似していた場合、類似判定部13はクラスタ情報を参照して各単語の出現回数を足し合わせ、類似クラスタ同士をマージする。 Step S206; processing of merging S205 similar clusters, if between two clusters were similar, the similarity determination unit 13 adding the number of occurrences of each word by referring to the cluster information, merging similar clusters together. これにより、新しい特徴ベクトルが生成される。 Thus, a new feature vector is generated. また、類似度判定部は、クラスタ情報を参照して、類似クラスタ同士がマージされたクラスタを付加したマージ後クラスタ情報を生成し、マージ後クラスタ記録部に格納する。 Further, the similarity determination unit, by referring to the cluster information, generates cluster information merged with the addition clusters similar clusters each other are merged and stored in the merge after cluster recording unit. 図12は、マージ後クラスタ情報の一例を示す概念図である。 Figure 12 is a conceptual diagram showing an example of merging after cluster information. 図12の例では、クラスタC1とクラスタC2とが類似しており、クラスタ1と2を併せたクラスタC4が追加された例を示している。 In the example of FIG. 12, the cluster C1 and cluster C2 are similar, the cluster C4 in conjunction with cluster 1 and 2 indicates the added example. なお、説明の便宜上、既述の図とは対応していない。 For convenience of explanation, the diagram described above do not correspond. マージ済みの特徴ベクトル内のクラスタ間同士は、類似度比較の対象とならないように設定し、次のステップS207の処理を行う。 Intercluster each other merged feature in vector sets so not subject to the similarity comparison, to process the next step S207.

ステップS207;終了判定 以上の処理一連の処理を、全てのクラスタ同士の組み合わせについて繰り返し、全ての組み合わせについて類似性の判定が終わると、処理を終了する。 Step S207; end determination above processing sequence of processes repeated for the combination between all clusters, the similarity determination for all combinations ends, the process ends. このようにして再構成されたマージ後クラスタ情報は、記事内容に基いて複数の記事がまとめられた物であるので、テーマ別に記事がまとめられたものであるととらえることができる。 Such merge after cluster information reconstructed by the, so those gathered plurality of articles based on the article content, can be considered as one in which articles by theme is summarized. すなわち、異なるクラスタ内の記事同士はテーマの異なる記事同士であり、同じクラスタ内の記事同士は、同じテーマの記事同士であるととらえることができる。 In other words, the article with each other in different clusters are different articles to each other of the theme, article to each other in the same cluster, can be regarded as an article to each other of the same theme. また、S206においてマージされたクラスタの特徴ベクトルは、クラスタ内で頻繁に使われているキーワードを示しているといえる。 The feature vectors of the merged cluster in S206 can be said to show the keywords that are frequently used in the cluster. 従って、クラスタ毎にキーワードを表示する様にすれば、ユーザはどのようなテーマが存在しているかを把握することができる。 Therefore, if as to display the keyword in each cluster, the user is able to grasp what kind of themes are present.

((ステップS004));旬度の測定 続いて、旬度測定部7が、旬度の測定を行う。 ((Step S004)); Shundo measurements followed by, Shundo measurement unit 7, the measurement of Shundo. 図13は、旬度の測定に係る動作を示すフローチャートである。 Figure 13 is a flow chart showing operation related to the measurement of Shundo. 旬度測定部7は、新鮮度の計算(S301)、人気度の計算(S302)、及び波及度の計算(S303)を行い、これらの値からクラスタ毎に旬度を計算する(S304)。 Shundo measuring unit 7, fresh calculation (S301), the popularity of calculation (S302), and performs a spreading of the calculation (S303), calculates the Shundo per cluster from these values ​​(S304). 新鮮度、人気度、及び波及度の計算はどの順に行われてもよい。 Freshness, popularity, and spread of the calculation may be performed in any order. また、複数クラスタのマージされたクラスタ(マージクラスタ)が存在する場合には、旬度計算時に、マージクラスタの構成要素クラスタ毎に人気度、新鮮度、及び波及度が計算され、構成要素クラスタの値を合算してマージクラスタの評価値とする。 In the case of multiple clusters merged clusters (merging clusters) are present, at the time Shundo calculation popularity for each component of the merged cluster cluster, freshness, and spreading degree is calculated, the components cluster the evaluation value of the merged cluster by adding up the value. 以下に、各ステップにおける動作の詳細について説明する。 The following describes details of the operation in each step.

ステップS301;新鮮度の計算 新鮮時計算部15は、記事記録部15を参照して、記事IDと、トラックバック元の記事の情報(トラックバック元のURL)と、そのトラックバックの張られた時刻の情報と、を取得する。 Step S301; calculating fresh when calculating portion 15 of the freshness refers to articles recording section 15, article ID and the information of the trackback original article and (trackback source URL), information of the time spanned thereof trackback and, to get. また、図示しないタイマー機能部から、現在時刻を取得する。 Further, the timer function unit (not shown), obtains the current time. 一のトラックバックに対して、そのトラックバックが張られてからの経過時間(現在時刻からのトラックバックの張られた時刻の差分)を算出し、トラックバック元の記事、トラックバック先の記事を特定する情報(記事ID)と対応付けて保持する(図14)。 For one of the trackback, information (articles to which the trackback time elapsed since stretched to calculate the (difference of track back of spanned the time from the current time), to identify track back the source of the article, the track back destination of the article ID) and association with hold (Figure 14). 尚、図14では、説明を分かり易くするため、記事IDの代わりに、記事名(A、B、・・・)を記載してある。 In FIG. 14, for clarity of description, instead of article ID, article name (A, B, · · ·) are described a. この経過時間の算出を、記事記録部15中に記録される全てのトラックバックに対して行う。 The calculation of the elapsed time is performed for all the trackback recorded in the article recording unit 15. そして、各トラックバックに対して、経過時間に基いて新鮮度を計算する。 Then, for each track back, to calculate the freshness based on the elapsed time.

本実施形態では、トラックバックの新鮮度は、トラックバックが張られてからの時間の経過に対して、図15に示されるように指数関数的に減少していくものと設定し、下記式8で新鮮度F(t)を求める場合を例として説明する。 In the present embodiment, the freshness of trackback, against time elapsed since the trackback is stretched, and settings that decreases exponentially as shown in FIG. 15, fresh by the following formula 8 the case of obtaining degrees F (t) is described as an example.
(但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)
尚、式中、tは経過時間を示し、t>=0である。 Incidentally, wherein, t represents an elapsed time, t> = 0. αは、新鮮度の減少量の幅に関する定数である。 α is a constant related to the width of the reduced amount of freshness. βは、新鮮度の傾きを示す。 β shows the inclination of the freshness. γは、新鮮度の初期値を示す値である。 γ is a value indicating the initial value of the freshness.

新しいトラックバックが多ければ多いほど、そのトラックバック先の記事は注目が高まっていると考えられる。 The greater the new trackback is larger, the track back destination of the article is considered to be increasing attention. 逆に、古いトラックバックしかなければ低くなる。 Conversely, the lower If there is only old trackback. 但し、一定時間が経過しても、一定の価値は残る。 However, even after the lapse of a certain period of time, it remains a constant value. 従って、上式8で示したように、時間経過とともに減少する指数関数を用いることが好ましい。 Accordingly, as indicated by the above equation 8, it is preferable to use an exponential function which decreases with time.

具体例として、ここではα=10、β=10、γ=0として設定し、各トラックバックの経過時間が図14のように計算されたとする。 As a specific example, where α = 10, β = 10, set as gamma = 0, and the elapsed time of each track back is calculated as shown in FIG. 14. このとき、新鮮度計算部15は、式9に従い計算し、A−B間のトラックバックの新鮮度=1.4、C−A間のトラックバックの新鮮度=3.7、D−B間のトラックバックの新鮮度=6.1という計算結果を得る(ただし、本例では小数点第3桁は四捨五入した)。 At this time, fresh calculator 15 calculates in accordance with Equation 9, freshness of trackback between A-B = 1.4, freshness of trackback between C-A = 3.7, trackback between D-B obtaining a calculation result of freshness = 6.1 (where the rounding off the second decimal digit in this example).

新鮮度計算部15は、算出したトラックバックの新鮮度を、トラックバックを特定する情報と対応付けて、新鮮度記録部16に記録する(図16参照;但し、一例を示したものであり、既述の図の内容とは対応していない)。 Freshness calculation unit 15, the freshness of the calculated trackback, in association with information identifying the track back is recorded in the freshness recording unit 16 (see FIG. 16; however, there is shown an example, above the contents of the Figure does not support).

以上で、新鮮度の計算に係る処理を終了する。 This is the end of the process according to the calculation of freshness.

なお、ある記事Bの書き手が、現在時刻に近い時間に別の記事Aを評価してブログを評価してトラックバックを張れば、そのトラックバック先の記事Aの新鮮度の評価値が高くなると考えられるので、上記で計算したトラックバックの新鮮度は、トラックバック先の記事の新鮮度と捉える事もできる。 It should be noted that the writer of an article B is, if Halle trackback to evaluate the blog to evaluate another article A to the time close to the current time, it is considered as an evaluation value of the freshness of the track back destination of article A is higher because, freshness of trackback calculated above can also be regarded as the freshness of the track back destination of the article. 従って、新鮮度は、記事の盛り上がりのパラメータとしても用いることができる。 Thus, freshness can also be used as a parameter of the protrusion of the article. また、クラスタの新鮮度は、トラックバックの新鮮度の総和に比例するものとして捉えた場合、クラスタ内のトラックバックの新鮮度を合算すれば、クラスタの新鮮度を得る事ができる。 Further, freshness of clusters, when taken as being proportional to the sum of the freshness of trackback, if combined freshness trackback in the cluster can be obtained the freshness of the cluster. 従って、新鮮度計算部8がこれらを必要に応じて計算し、表示部8によって表示画面上に表示する様に構成することも有用である。 Therefore, it is also useful to fresh calculation unit 8 calculates as needed these, constructed as to be displayed on the display screen by the display unit 8.

ステップS302;人気度の計算 人気度計算部17は、記事記録部2を参照して、記事の評価情報(本実施形態ではソーシャルブックマーク数)に基いて、その記事の人気度を算出する。 Step S302; popularity of computing popularity calculating unit 17, with reference to the article recording unit 2, based on (social bookmark number in this embodiment) evaluation information articles, calculates the popularity of the article. 図17に示されるように、記事Aのソーシャルブックマーク数が10、記事Bが5、記事Cが3、記事Dが2であったとすると、記事Aの人気度は10、記事Bの人気度は5、記事Cの人気度は3、記事Dの人気度は2となる。 As shown in FIG. 17, a social bookmark number 10 article A, articles B is 5, article C is 3, the article D is assumed to be 2, popularity of article A is 10, the popularity of articles B 5, the popularity of article C is 3, the popularity of article D is 2. このようにして算出した人気度は、人気度記録部114に記録する。 Popularity calculated in this way is recorded in popularity recording unit 114. 図 19は、本発明の第一の実施形態における人気度のデータの例である。 Figure 19 is an example of a popularity of the data in the first embodiment of the present invention. 人気度計算部17は、人気度を記事IDと対応付けて、人気度記録部118に記録する(図18参照)。 Popularity calculating unit 17, in association with the article ID popularity, it is recorded in popularity recording unit 118 (see FIG. 18). 尚、評価情報としては、その記事の読み手側の評価を示す情報であれば、ソーシャルブックマーク数に限られず、アクセス数などの他のデータを用いてもよい。 As the evaluation information, if the information indicating the evaluation of the reader side of the article is not limited to social bookmarking number may use other data such as access number.

尚、クラスタ内の記事の人気度を合計して、そのクラスタの人気度としてもよい。 It should be noted that the sum of the popularity of the article in the cluster, may be used as the popularity of the cluster.

ステップS303;波及度の計算 波及度計算部19は、記事記録部2を参照して、トラックバックの起点記事からのパス長(深さ)に基いて、波及度を計算する。 Step S303; spillover of the calculated ripple calculating section 19 refers to the article recording unit 2, based on the path length from the origin article trackback (depth), to calculate the spread of. ここで、パス長は、起点記事とトラックバック先の記事との間に存在するリンク(トラックバック)数であるものとする。 Here, the path length is assumed to be a number of links (trackback) that exists between the starting point articles and track back destination of the article. 起点記事から離れている(パス長が長い)記事が有るほど、リンク(トラックバック)が多いほど、そのクラスタではテーマが盛り上がっていると考えられる。 As there is (is the path length is long) article away from the starting point article, the more links (trackback) is large, in the cluster is considered to be the theme is raised. 従って、パス長が長ければ長いほど、波及度を高くする。 Therefore, the longer the path length, to increase the spread of. 具体的に説明するために、図19に示されるように、起点記事Aに対して、記事B及びCからトラックバックが張られており、記事Bに対して記事Dからトラックバックが張られているものとする。 To illustrate, as shown in FIG. 19, which relative to the origin for articles A, and track back is stretched from the article B and C, trackback is stretched from the article D with respect to articles B to. このとき、人気度計算部17は、記事BからAに対するトラックバック、及び記事CからAに対するトラックバックのパス長を1であると計算する。 At this time, the popularity calculation unit 17 calculates trackback for A from the article B, and from the article C to be 1 pathlength trackback for A. また、記事DからBに対するトラックバックのパス長は2であると計算する。 Further, calculating from the article D path length trackback to B is 2.

また、波及度に関しては、記事の信頼性などを考慮して、重み付けを行って計算してもよい。 In addition, with regard to the spread of, in consideration of the reliability of the article, it may be calculated by weighting. このように、記事の信頼性を考慮した場合の一例として、波及度I(d)を下記式9のように定義することができる。 Thus, as an example in the case of considering the reliability of the article can be defined spread of I (d) is as the following equation 9.
尚、上式中において、dはパス長である。 Note that in the above formula, d is the path length. αは、リンクのパス長への重みである。 α is the weight of the path length of the link. この重みは、信頼性の高い記事(例示;アクセス数の多い記事)から直接リンクされている場合などには大きくし、信頼性の低い記事から直接リンクされている場合などは値を小さくする様にすればよい。 This weight is higher articles reliability; increased with each other when linked directly (for example the number of high-traffic articles), such as when linked directly from an unreliable article as to reduce the value it may be set to.

波及度計算部19は、以上の様にして算出した波及度を、トラックバック元記事ID、トラックバック先記事IDと対応付けて、波及度記録部20に記録する(図20参照)。 Spread calculation unit 19, a ripple degree calculated in the manner described above, trackback original article ID, in association with the track back destination article ID, and records the spread of the recording unit 20 (see FIG. 20). 尚、新鮮度の段で説明したのと同様に、トラックバックの波及度は、トラックバック先の記事の波及度と捉えてもよい。 It should be noted that, in a manner similar to that described in the freshness of the stage, spread of the trackback, may be regarded as the spread of the track back destination of the article.

ステップS304;旬度の測定 旬度算出部21は、S301〜303の処理で算出された波及度、新鮮度、及び人気度に基いて、旬度を算出する。 Step S304; measurement of Shundo Shundo calculating unit 21, spread of calculated in the processing of S301~303, based on freshness, and popularity, calculates the Shundo. この際に、マージ後クラスタ情報に基いて、クラスタ毎に旬度を算出する。 At this time, based on the merge after the cluster information, and calculates the Shundo for each cluster.

下記式10は、旬度計算の一例を示す式である。 Formula 10 is formulas showing an example of Shundo calculations.
(但し、Ii(d)はトラックバックiの波及度を示し、Fi(t)はトラックバックiの新鮮度を示し、Pj(n)は、記事jの人気度を示す) (However, Ii (d) shows the spread of the trackback i, Fi (t) indicates the freshness of trackback i, Pj (n) indicates the popularity of the article j)

より具体的に例を挙げると、クラスタC1内に含まれる記事が図19で示される様にトラックバックによりリンクされていたとする。 And more specific example, articles in the cluster C1 in is assumed to have been linked by track back as shown in Figure 19. そして、新鮮度として図16に示される結果が、波及度として図20に示される結果が、人気度として図18に示される結果が、それぞれ得られていたものとする。 The results shown in Figure 16 as freshness is, the results shown in Figure 20 as a spreading degree, the results shown in Figure 18 as popularity is assumed to have been obtained, respectively. この場合、クラスタC1のテーマの旬度は、 In this case, Shundo theme of cluster C1 is,
ブログクラスタC1のテーマの旬度 =(A−B間)のトラックバックの波及度×(A−B)間のトラックバックの新鮮度+(A−C)間のトラックバックの波及度×(A−C)のトラックバックの新鮮度+(B−D)のトラックバックの波及度×B−Dのトラックバックの新鮮度+ブログ記事A〜Dの人気度の総和 =1×1.4+1×3.7+2×6.1+(10+5+3+2) Trackback spread of × of the theme of the blog cluster C1 Shundo = (between the A-B) (A-B) of the trackback between freshness + (A-C) between the trackback spread degree × (A-C) Trackback of freshness + (B-D) of track back of spillover degree × B-D of the trackback of freshness + blog post A~D of the popularity of the sum = 1 × 1.4 + 1 × 3.7 + 2 × 6.1 + (10 + 5 + 3 + 2)
=37.3 = 37.3
となる。 To become.

旬度計算部21は、このようにして算出したテーマの旬度を、クラスタIDと対応付けて、旬度記録部22に記録する(図21参照;但し、クラスタC2、C3に関しては、既述の例と対応していない)。 Shundo calculation unit 21, a Shundo theme calculated in this manner, in association with the cluster ID, and records the Shundo recording unit 22 (see FIG. 21; however, with respect to the cluster C2, C3 is above of examples and does not support).

尚、既述のように、トラックバックの波及度をトラックバック先の記事の波及度、トラックバックの新鮮度をトラックバック先記事の新鮮度と捉えれば、各記事についても旬度を計算することができる。 It should be noted that, as described above, spread the degree of the spread of the trackback trackback destination of the article, if grasped trackback of the freshness and the freshness of the track back destination article, it is possible to calculate the seasonal degree of each article. 具体的には、「記事の旬度」=波及度×新鮮度+人気度として求めればよい。 More specifically, it may be determined as a = spread degree × freshness + popularity "Shundo of the article".

((ステップS005;表示)) ((Step S005; display))
表示部12は、記事記録部2、マージ後クラスタ情報を参照して、クラスタ毎に起点記事のタイトル取得する。 Display section 12, article recording unit 2, referring to the merge after the cluster information, to get the starting point article title in each cluster. また、旬度記録部22を参照して旬度の高い順にクラスタを並び替え、図22に示されるように、起点記事のタイトルと対応する旬度を表示画面に表示する。 In addition, sort the cluster in descending order of Shun degree referring to the Shundo recording unit 22, as shown in FIG. 22, displays the corresponding Shundo the origin article title on the display screen. またこの際に、クラスタの特徴ベクトル(図10参照)を参照して、クラスタのキーワードを表示する。 Also during this, by referring to the cluster feature vectors (see FIG. 10), and displays the keywords of the cluster. また、マージクラスタを表示する場合には、階層的に表示する様にしてもよい。 In addition, in the case of displaying the merged cluster may be the way to hierarchical view. また、起点記事以外の記事を関連記事として表示してもよい。 It is also possible to view the article other than the starting point article as a related article. この際、各記事の旬度を求めていれば、各記事の旬度を併せて表示してもよい。 In this case, if in search of season of each article, it may be displayed in conjunction with the season of each article.

以上説明したように、本実施形態によれば、インターネット上の複数の記事が、記事内容に基いてクラスタリングされ、旬度が高い順に起点記事のタイトルや、キーワードなどが表示されるので、ユーザは全ての記事を閲覧する事無く、最近の旬なテーマとしてどのようなテーマが存在するのかを知る事ができる。 As described above, according to this embodiment, a plurality of articles on the Internet, are clustered on the basis of the article content, and the origin articles high season decreasing order titles, since such keywords are displayed, the user without having to browse all of the article, it is possible to know what kind of theme of exists as a recent seasonal theme. また、そのテーマの盛り上がり具合も把握することができる。 In addition, it is possible to grasp upsurge degree of that theme.

また、旬度を算出するにあたり波及度を用いているので、テーマがどれほど多面的に、どれほど広く注目を集めているかという点を、旬であるかどうかの評価に反映させることができる。 Moreover, because of the use of spreading degree in calculating the Shundo, themes in how multifaceted, the question of whether have attracted much wide attention, can be reflected on the evaluation of whether it is seasonal.

また、旬度を算出するにあたり新鮮度を用いているので、昔の評価と最近の評価とが等価に扱われず、最近の評価ほど重みを増して旬度に反映させる事ができる。 In addition, because of the use of freshness in calculating the Shundo, not the old days of evaluation and a recent evaluation is treated as equivalent, it can be reflected in the season of gaining weight as the recent evaluation.

(第2の実施形態) (Second Embodiment)
本発明の第2の実施形態について説明する。 A description of a second embodiment of the present invention. 図23は、本実施形態の旬度解析システムの構成を概略的に示すブロック図であり、図24は動作方法を示すフローチャートである。 23, the configuration of the season of the analysis system of the present embodiment is a block diagram schematically showing a flow chart diagram 24 showing the operation method. 本実施形態の旬度解析システムは、第1の実施形態に対して、記事解析部9にシソーラス解析部23が追加されており(図23)、動作方法としては、単語のシソーラス解析を行うステップ(S202A)が追加されている。 Shun degree analysis system of the present embodiment is different from the first embodiment are added thesaurus analysis unit 23 is the article analysis unit 9 (FIG. 23), as the operation method, the step of performing thesaurus analysis of words (S202A) has been added. その他の構成、動作に関しては、同じ番号を付して省略を説明する。 Other configurations, with respect to the operation, for explaining the omission denoted by the same reference numerals.

記事解析部9が出現頻度データを生成すると(S202)、シソーラス解析部23は、シソーラス辞書(図示せず)を参照して、生成した出現頻度データに対してシソーラス解析を行う(S202A)。 When articles analyzing unit 9 generates frequency data (S202), thesaurus analysis unit 23 refers to the thesaurus (not shown), it performs thesaurus analysis on the generated frequency data (S202A). すなわち、抽出した単語のうち、シソーラスである(類似している)単語同士がないかどうかを判定し、シソーラスと判定された単語同士の出現頻度をマージし、一つの単語として扱う。 That is, of the extracted words, a thesaurus to determine if there are any (similar to that) between words, merging the appearance frequency of each other word is determined to thesaurus, treated as a single word. シソーラス解析部9は、この様にして類似単語のマージされた出現頻度データを、マージ後出現頻度データとして、出現頻度記録部10に記録する(図 24のAS201)。 Thesaurus analyzing unit 9, the appearance frequency data merging similar word in this way, as the merge after the appearance frequency data and records the occurrence frequency recording unit 10 (AS201 in Figure 24). 以降のステップS203以降の処理では、第1の実施形態における出現頻度データに代えて、マージ後出現頻度データが用いられる。 In step S203 and subsequent processes after, instead of the frequency data in the first embodiment, the merge after the appearance frequency data are used.

本実施形態によれば、単語の出現頻度のみをだけでなく、単語のシソーラスの解析を行い、類似単語を一つにまとめる事により、記事の単語のばらつきを抑えることができ、クラスタの類似度判定の際の精度を向上させることができる。 According to the present embodiment, not only the frequency of occurrence of the word only, analyzes the word of the thesaurus, by summarizing a similar word to one, it is possible to suppress the variation of the words of the article, a cluster of similarity it is possible to improve the accuracy of the determination.

尚、シソーラス解析部23がシソーラス解析を行うにあたっては、シソーラス解析部23がシソーラス辞書を電子データとして記憶しておく事でシソーラス解析を行ってもよいし、インターネット上のシソーラス辞書を利用してシソーラス解析を行うようにしてもよい。 In carrying out thesaurus analysis unit 23 performs the thesaurus analysis and thesaurus analysis unit 23 may perform thesaurus analysis by storing the thesaurus as electronic data, using a thesaurus on the Internet Thesaurus it may be carried out analysis.

第1の実施形態に係る旬度解析システムの概略ブロック図である。 It is a schematic block diagram of a season of analysis system according to the first embodiment. 第1の実施形態に係る旬度解析方法を示すフローチャートである。 Is a flowchart illustrating the steepness analysis method according to the first embodiment. 記事収集部の動作を示すフローチャートである。 Is a flowchart showing the operation of the article collecting portion. 記事のトラックバックの結びつきの例を示す説明図である。 Is an explanatory view showing an example of a trackback ties of the article. 記事記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in the articles recording unit. クラスタ記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in the cluster recording unit. クラスタ生成部の動作を説明するための説明図である。 It is an explanatory diagram for explaining the operation of the cluster generating unit. クラスタ再構成部の動作を示すフローチャートである。 Is a flowchart showing the operation of the cluster reconfiguration unit. 出現頻度データを示す概念図である。 It is a conceptual diagram showing the frequency of occurrence data. クラスタ特徴ベクトルを示す概念図である。 It is a conceptual diagram showing a cluster feature vectors. 類似度記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in the similarity recording unit. マージ後クラスタ情報を説明するための説明図である。 It is an explanatory diagram for explaining a merge after cluster information. 旬度測定部の動作を示すフローチャートである。 Is a flowchart showing the operation of Shundo measuring unit. トラックバックとトラックバック時刻との関係を示す概念図である。 It is a conceptual diagram showing the relationship between the track back and trackback time. 新鮮度と経過時間との関係を説明するための説明図である。 It is an explanatory view for explaining the relationship between the elapsed time and freshness. 新鮮度記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in the freshness recording unit. 記事と評価情報との関係を説明するための説明図である。 It is an explanatory view for explaining the relationship between the articles and the evaluation information. 人気度記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in popularity recording unit. トラックバックとパス長との関係を説明するための説明図である。 It is an explanatory view for explaining the relationship between the track back and path length. 波及度記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data contents recorded in the spread of the recording unit. 旬度記録部に記録されるデータ内容を表す概念図である。 It is a conceptual diagram showing the data content recorded Shundo recording unit. 表示画面上に表示される内容を表す例図である。 Is an example diagram illustrating a content displayed on the display screen. 第2の実施形態の旬度解析システムの構成を示す概略ブロック図である。 It is a schematic block diagram showing a configuration of a season of analysis system of the second embodiment. 第2の実施形態の旬度解析方法の、クラスタ再構成部の動作を示す示すフローチャートである。 Shun degree analysis method of the second embodiment, a flow chart showing illustrating the operation of a cluster reconfiguration unit.

符号の説明 DESCRIPTION OF SYMBOLS

1 記事収集部 2 記事記録部 3 クラスタ生成部 4 クラスタ記録部 5 クラスタ再構成部 6 マージ後クラスタ記録部 7 旬度測定部 8 表示部 9 記事解析部 10 出現頻度記録部 11 特徴ベクトル生成部 12 特徴ベクトル記録部 13 類似度判定部 14 類似度記録部 15 新鮮度計算部 16 新鮮度記録部 17 人気度計算部 18 人気度記録部 19 波及度計算部 20 波及度記録部 21 旬度計算部 22 旬度記録部 23 シソーラス解析部 1 Article collector 2 articles recording unit 3 cluster generating unit 4 cluster recording unit 5 cluster reconfiguration unit after six merged cluster recording unit 7 Shundo measuring unit 8 display unit 9 articles analyzing unit 10 frequency recording unit 11 the feature vector generating unit 12 feature vector recording unit 13 similarity determination unit 14 similarity recording unit 15 freshness calculating unit 16 freshness recording unit 17 popularity calculating unit 18 popularity recording unit 19 spread calculation unit 20 spread of the recording unit 21 Shundo calculation unit 22 Shundo recording unit 23 thesaurus analysis unit

Claims (25)

  1. インターネット上に掲載される複数の記事のうちから複数の起点記事を選択し、前記複数の起点記事の各々及び前記各起点記事からリンクで辿ることのできる記事群について記事内容を収集し、記事を特定する記事情報と対応付けた記事データを生成する記事収集部と、 Select multiple origins articles from a plurality of articles to be published on the Internet, to gather and each article contents for articles group can the be traced by the link from the origin article of the plurality of origins articles, the articles and article collecting unit that generates article data associated with article information specifying,
    前記起点記事毎に、前記起点記事及び前記起点記事からリンクで辿ることのできる記事群からなる集合をクラスタとして設定し、前記クラスタと前記記事情報とを対応付けたクラスタ情報を生成するクラスタ生成部と、 For each of the starting point article, the origin articles and the set the set consisting article group that can be traced from the origin article links as a cluster, a cluster generator for generating a cluster information that associates with the said cluster article information When,
    前記記事データ及び前記クラスタ情報に基いて、前記クラスタに含まれる記事の記事内容に基いて異なるクラスタ間の類似度を判定し、判定結果に基いて類似する前記クラスタ同士をマージしてマージ後クラスタ情報を生成するクラスタ再構成部と、 Said article data and on the basis of the cluster information, and determines the similarity between different clusters based on the article contents of the articles contained in the cluster, determining the merged by merging clusters together clusters similar based on the results and the cluster reconstruction unit which generates the information,
    前記マージ後クラスタ情報と前記記事データとを参照し、クラスタ毎に旬度を測定する旬度測定部と、 And Shundo measuring section for referring to said article data and said merge after cluster information, measures the Shundo per cluster,
    前記旬度測定部で測定された結果を出力装置に出力させる出力部と、 An output unit for outputting to an output device results measured by the Shundo measuring unit,
    を具備する旬度解析システム。 Shundo analysis system comprising a.
  2. 請求項1に記載された旬度解析システムであって、 A Shundo analysis system according to claim 1,
    前記クラスタ再構成部は、 The cluster reconfiguration unit,
    前記記事データに基いて記事の記事内容を解析し、単語と出現頻度とを対応付けた出現頻度データを生成する記事解析部と、 And Articles analyzer which the article data on the basis of analyzes the article contents of the article, to produce a frequency data that associates words with frequency,
    前記クラスタ情報及び前記出現頻度データに基いて、前記クラスタ毎に、単語と出現頻度を対応付けたクラスタ特徴ベクトルを生成する特徴ベクトル生成部と、 Wherein based on the cluster information and the frequency of occurrence data, for each of the clusters, a feature vector generator for generating a cluster feature vectors that associates frequency and word,
    前記クラスタ特徴ベクトルに基いて、異なるクラスタ間の類似度を計算し、判定結果に基いて類似するクラスタ同士をマージして、前記マージ後クラスタ情報を生成する類似度判定部と、を備える旬度解析システム。 Based on the cluster feature vectors, different similarity calculated between clusters, by merging the clusters together similar based on the determination result, and a similarity determination unit for generating the merge after cluster information Shundo analysis system.
  3. 請求項2に記載された旬度解析システムであって、 A Shundo analysis system according to claim 2,
    更に、 In addition,
    前記記事解析部によって生成された出現頻度データをシソーラス解析し、類似単語をマージしたマージ後出現頻度データを生成するシソーラス解析部を具備し、 The frequency data generated by the article analyzer and thesaurus analysis, provided with a thesaurus analysis unit for generating frequency data merged of merging similar words,
    特徴ベクトル生成部は、前記マージ後出現頻度データを参照して前記クラスタ特徴ベクトルを生成する旬度解析システム。 Feature vector generation unit, Shundo analysis system generates the cluster feature vectors with reference to the appearance frequency data after the merge.
  4. 請求項1乃至3のいずれかに記載された旬度解析システムであって、 A Shundo analysis system according to any of claims 1 to 3,
    前記類似度判定部は、下記式1により、クラスタiとクラスタj間の類似度を計算する The similarity determination unit, the following equation 1 to calculate the similarity between the cluster i and the cluster j
    (但し、→viはクラスタiの特徴ベクトルを示し、→vjはクラスタjの特徴ベクトルを示す) (However, → vi represents the feature vector of the cluster i, → vj represents the feature vector of the cluster j)
    旬度解析システム。 Shundo analysis system.
  5. 請求項1に記載された旬度解析システムであって、 A Shundo analysis system according to claim 1,
    前記記事収集部は、前記記事データを生成するにあたり、更に、収集する記事に対して参照側によって参照側記事へ張られたリンクの元記事を特定するトラックバック情報と、前記トラックバックの張られた時刻とを収集して、前記記事情報と対応付けて前記記事データとし、 Time the article collection unit, in generating said article data, further, the trackback information for specifying the original article link stretched to a reference side articles by reference side against articles to be collected, that is stretched with the trackback collect the door, and the article data in association with the article information,
    前記旬度測定部は、 The Shundo measuring unit,
    新鮮度を計算する新鮮度計算部と、 And fresh calculator to calculate the freshness,
    前記新鮮度の結果に基いて、クラスタ毎に旬度を算出する旬度計算部とを備え、 Wherein based on the freshness of the result, and a Shundo calculation unit for calculating a Shundo per cluster,
    前記新鮮度計算部は、前記トラックバック情報と、前記トラックバックの張られた時刻に基いて、前記トラックバックの新鮮度を計算する旬度解析システム。 The freshness calculation unit, and the trackback information, based on the time spanned of said track back, Shundo analysis system to calculate the freshness of the trackback.
  6. 請求項5に記載された旬度解析システムであって、 A Shundo analysis system according to claim 5,
    前記新鮮度計算部は、前記クラスタ毎に新鮮度を計算するにあたり、下記式2により、新鮮度F(t)を計算する The freshness calculation unit In calculating freshness for each of the clusters, the following equation 2 to calculate the freshness F (t)
    (但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)
    旬度解析システム Shundo analysis system
  7. 請求項1に記載された旬度解析システムであって、 A Shundo analysis system according to claim 1,
    前記記事収集部は、前記記事データを生成するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報を収集して、前記記事情報と対応付け、 The article collection unit, the in generating the article data, further collects trackback information identifying the original article trackback spanned against articles to be collected, the association with the article information,
    前記旬度測定部は、 The Shundo measuring unit,
    前記クラスタ毎に波及度を計算する波及度計算部と、 A spread calculation unit for calculating a spreading degree for each of the clusters,
    前記波及度の結果に基いて、旬度を算出する旬度計算部とを備え、 Based on the spread of the results, and a Shundo calculation unit for calculating a Shundo,
    前記波及度計算部は、前記トラックバック情報に基いて、前記トラックバックの前記起点記事からの深さを算出し、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの前記起点記事からの深さとに基いて、前記波及度を計算する旬度解析システム。 The spread calculation portion, based on the trackback information, calculates the depth from the origin articles of the trackback, the number of the track back included in the cluster, and depth from the origin articles of the trackback Shundo analysis system which calculates the spillover level based on.
  8. 請求項7に記載された旬度解析システムであって、 A Shundo analysis system according to claim 7,
    前記波及度計算部は、下記式3により、波及度I(d)を計算する The spread calculation unit, by the following equation 3 to calculate the spread of I (d)
    (但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)
    旬度解析システム。 Shundo analysis system.
  9. 請求項1に記載された旬度解析システムであって、 A Shundo analysis system according to claim 1,
    前記記事収集部は、前記記事データを生成するにあたり、更に、収集される記事に対する読み手の評価を示す評価情報を収集して、前記記事情報と対応付け、 The article collection unit, the in generating the article data, further collects the evaluation information indicating the evaluation of the reader with respect to articles to be collected, the association with the article information,
    前記旬度測定部は、 The Shundo measuring unit,
    前記クラスタ毎に人気度を計算する人気度計算部と、 And the popularity calculation unit for calculating the degree of popularity for each of the cluster,
    前記人気度の結果に基いて、旬度を算出する旬度計算部とを備え、 Based on the popularity of the result, and a Shundo calculation unit for calculating a Shundo,
    前記人気度計算部は、前記クラスタ中に含まれる記事の数と、記事の前記評価情報とに基いて、前記人気度を計算する旬度解析システム。 The popularity calculating unit includes a number of articles contained in the cluster, based on said evaluation information articles, Shundo analysis system to calculate the popularity.
  10. 請求項9に記載された旬度解析システムであって、 A Shundo analysis system according to claim 9,
    前記評価情報は、収集される記事に対するソーシャルブックマーク数又はアクセス数である旬度解析システム。 The evaluation information, Shundo analysis system, a social bookmark number or number of accesses to the articles to be collected.
  11. 請求項1に記載された旬度解析システムであって、 A Shundo analysis system according to claim 1,
    前記記事収集部は、前記記事データを生成するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報と、前記トラックバックの張られた時刻と、収集される記事に対する読み手の評価を示す評価情報と、を収集して、前記記事情報と対応付け、 The article collection unit, in generating said article data, further, the trackback information for specifying the original article trackback spanned against articles to be collected, and the time spanned of said trackback, for articles to be collected to collect and evaluate information that indicates the reader's evaluation, the, the association with the article information,
    前記旬度測定部は、 The Shundo measuring unit,
    前記クラスタ毎に、前記クラスタ中に含まれる記事の数と、記事の前記評価情報とに基いて前記人気度を計算する人気度計算部と、 For each of the clusters, and the number of articles contained in the cluster, and the popularity calculation section that calculates the popularity based on said evaluation information articles,
    前記クラスタ毎に、前記トラックバック情報に基いて、前記トラックバックの前記起点記事からの深さを算出し、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの前記起点記事からの深さとに基いて波及度を計算する波及度計算部と、 For each of the clusters, based on the trackback information, calculates the depth from the origin articles of the trackback, the number of the track back included in the cluster, depth and on the basis of the said origin articles of the trackback and spread calculator to calculate the spread of you are,
    前記クラスタ毎に、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの張られた時刻とに基いて、新鮮度を計算する新鮮度計算部と、 For each of the clusters, and the number of the track back included in the cluster, based on the time spanned of said track back, and fresh calculation unit for calculating a freshness,
    前記人気度、前記波及度、及び前記新鮮度の結果に基いて、旬度を算出する旬度計算部とを備える旬度解析システム。 The popularity the spillover level, and the based on the freshness of the results, season of the analysis system comprising a Shundo calculation unit for calculating a Shundo.
  12. 請求項11に記載された旬度解析システムであって、 A Shundo analysis system according to claim 11,
    前記新鮮度計算部は、前記クラスタ毎に新鮮度を計算するにあたり、下記式4により、新鮮度F(t)を計算し、 The freshness calculation unit In calculating freshness for each of the clusters, the following equation 4, to calculate the freshness F (t),
    (但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)
    前記波及度計算部は、下記式5により、波及度I(d)を計算し、 The spread calculation unit, by the following equation 5 to calculate the spread of I (d),
    (但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)
    前記人気度計算部は、収集される記事に対するソーシャルブックマーク数又はアクセス数でを前記評価情報として、前記クラスタ毎の総ソーシャルブックマーク数又は総アクセス数を、前記人気度P(n)として計算し、 Said the popularity calculation section, as the evaluation information with social bookmark number or the number of accesses to the article to be collected, the total social bookmark number or the total number of accesses for each of the cluster, calculated as the popularity P (n),
    前記旬度計算部は、下記式6により、旬度を計算する The seasonal calculation unit, by the following equation 6 to calculate the Shundo
    (但し、Ii(d)はトラックバックiの波及度を示し、Fi(t)はトラックバックiの新鮮度を示し、Pj(n)は、記事jの人気度を示す) (However, Ii (d) shows the spread of the trackback i, Fi (t) indicates the freshness of trackback i, Pj (n) indicates the popularity of the article j)
    旬度解析システム。 Shundo analysis system.
  13. ウェブ上に掲載される複数の記事のうち、複数の起点記事と、前記複数の起点記事の各々からリンクで辿ることのできる記事群とについて、記事内容を収集して記事を特定する記事情報と対応付けて記事データを生成する記事収集ステップと、 Among a plurality of articles to be published on the web, and a plurality of origins articles for the article group can be traced by the link from each of said plurality of origins article, the article information for identifying the article to collect articles content and article collection step of generating the article data in association with,
    前記記事収集ステップで収集される前記起点記事毎に、前記起点記事と前記起点記事からリンクで辿ることのできる記事群とを含む集合をクラスタとし、前記クラスタと前記記事情報との対応関係を示すクラスタ情報を生成するクラスタ生成ステップと、 For each of the origins articles collected in the article collecting step, the aforementioned origin articles from the origin Articles and cluster collections containing and article group which can be traced in the link shows a relationship between the cluster and the article information and the cluster generation step of generating a cluster information,
    前記記事データと前記前記クラスタ情報とに基いて、異なるクラスタ間の記事内容に関する類似度をを計算し、計算結果に基いて類似する前記クラスタ同士をマージして、マージ後クラスタ情報を生成するクラスタ再構成ステップと、 Clusters on the basis of the said cluster information and the article data, calculates a similarity regarding article contents between different clusters, and merging the clusters each other similar based on the calculation results, generates a merge after cluster information and the reconstruction step,
    前記マージ後クラスタ情報と、前記記事収集ステップで収集された記事の内容とに基いて、前記クラスタ毎に旬度を測定する旬度測定ステップと、 It said merge after cluster information, based on the content of the collected article collecting step article and Shundo measuring step of measuring the Shundo for each of the clusters,
    前記旬度測定ステップの測定結果を出力装置によって出力させる出力ステップと、 An output step of outputting by the output device a measurement result of the Shundo measuring step,
    を具備する旬度解析方法。 Shundo analysis method comprising a.
  14. 請求項13に記載された旬度解析方法であって、 A Shundo analysis method according to claim 13,
    前記クラスタ再構成ステップは、 The cluster reconfiguration step,
    前記記事収集ステップで収集された記事内容を解析して、単語と出現頻度とを対応付けた出現頻度データを生成する出現頻度データ生成ステップと、 Analyzes the article contents collected in the article collecting step, the occurrence frequency data generation step of generating frequency data that associates words with frequency,
    前記クラスタ情報と前記出現頻度データとに基いて、前記クラスタ毎に、単語と出現頻度を対応付けたクラスタ特徴ベクトルを生成するクラスタ特徴ベクトル生成ステップと、 Wherein based on the cluster information and the frequency of occurrence data, for each of the clusters, and the cluster feature vector generation step of generating a cluster feature vectors that associates frequency and word,
    前記クラスタ特徴ベクトルに基いて、異なるクラスタ間の類似度を計算し、判定結果に基いて類似するクラスタ同士をまとめ、てマージ後クラスタ情報を生成する類似度判定ステップと、を備える旬度解析方法。 Based on the cluster feature vectors, different similarity between clusters is calculated, the judgment result summarized cluster together similar based on, Shun degree analysis method comprising: a similarity determination step, the generating the merge after cluster information Te .
  15. 請求項14に記載された旬度解析方法であって、 A Shundo analysis method according to claim 14,
    前記出現頻度データ生成ステップにおいて、シソーラス辞書を参照し、類似単語がマージされるように、前記出現頻度データを生成する旬度解析方法。 In the appearance frequency data generation step, with reference to the thesaurus, as similar words are merged, Shundo analyzing method for generating the appearance frequency data.
  16. 請求項13乃至15のいずれかに記載された旬度解析方法であって、 A Shundo analysis method according to any one of claims 13 to 15,
    前記類似度判定ステップにおいて、異なる前記クラスタ間で類似度を計算するにあたり、 In the similarity determination step, when calculating the similarity between different pieces of cluster,
    下記式7により類似度を計算する The degree of similarity is calculated by the following equation 7
    (但し、→viはクラスタiの特徴ベクトルを示し、→vjはクラスタjの特徴ベクトルを示す) (However, → vi represents the feature vector of the cluster i, → vj represents the feature vector of the cluster j)
    旬度解析方法。 Shundo analysis method.
  17. 請求項13に記載された旬度解析方法であって、 A Shundo analysis method according to claim 13,
    前記記事収集ステップにおいて、前記記事データを生成するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報と、前記トラックバックの張られた時刻とを収集し、前記記事情報と対応付けて前記記事−データとし、 In the article collecting step, in generating said article data, further, the trackback information for specifying the original article trackback spanned against articles to be collected, and a time stretched with the trackback collected, the articles and data, - said articles in correspondence with the information
    前記旬度測定ステップは、 The Shundo measuring step,
    前記クラスタ毎に新鮮度を計算する新鮮度計算ステップと、 And fresh calculation step of calculating a freshness for each of the clusters,
    前記新鮮度の結果に基いて、旬度を算出する旬度計算ステップとを備え、 Wherein based on the freshness of the result, and a Shundo calculating step of calculating a Shundo,
    前記新鮮度計算ステップにおいて、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの張られた時刻とに基いて、前記新鮮度を計算する旬度解析方法。 Wherein the freshness calculation step, the number of the track back included in the cluster, based on the time spanned of said track back, Shundo analysis method for computing the freshness.
  18. 請求項17に記載された旬度解析システムであって、 A Shundo analysis system according to claim 17,
    前記新鮮度計算ステップは、前記クラスタ毎に新鮮度を計算するにあたり、下記式8により、新鮮度F(t)を計算する The freshness calculating step, In calculating freshness for each of the clusters, the following equation 8 to calculate the freshness F (t)
    (但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)
    旬度解析方法。 Shundo analysis method.
  19. 請求項13に記載された旬度解析方法であって、 A Shundo analysis method according to claim 13,
    前記記事収集ステップにおいて、前記記事データを生成するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報を収集して、前記記事データとし、 In the article collecting step, in generating said article data, further collects trackback information identifying the original article trackback spanned against articles to be collected, and the article data,
    前記旬度測定ステップは、 The Shundo measuring step,
    前記クラスタ毎に波及度を計算する波及度計算ステップと、 A spread calculation step of calculating a ripple level for each of the clusters,
    前記波及度の結果に基いて、旬度を算出する旬度計算ステップと、備え、 Based on the spread of the results, and Shundo calculating step of calculating a Shundo, comprising,
    前記波及度計算ステップにおいて、前記トラックバック情報に基いて、前記トラックバックの前記起点記事からの深さを算出し、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの前記起点記事からの深さとに基いて、前記波及度を計算する旬度解析方法。 In the spread calculation step, based on the trackback information, calculates the depth from the origin articles of the trackback, the number of the track back included in the cluster, and depth from the origin articles of the trackback Shundo analysis method, the calculating the spread of based on.
  20. 請求項19に記載された旬度解析方法であって、 A Shundo analysis method according to claim 19,
    前記波及度計算ステップにおいて、下記式9により、波及度I(d)を計算する In the spread calculation step, the following equation 9, calculates a ripple of I (d)
    (但し、αはトラックバック元の記事の重みを示し、dはトラックバックの前記起点記事からの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth from the origin articles trackback)
    旬度解析方法。 Shundo analysis method.
  21. 請求項13に記載された旬度解析方法であって、 A Shundo analysis method according to claim 13,
    前記記事収集ステップにおいて、前記記事データを生成するにあたり、更に、収集される記事に対する読み手の評価を示す評価情報を収集して、前記記事情報と対応付けて前記記事データとし、 In the article collecting step, in generating said article data, further collects the evaluation information indicating the evaluation of the reader with respect to articles to be collected, and the article data in association with the article information,
    前記旬度測定ステップは、 The Shundo measuring step,
    前記クラスタ毎に人気度を計算する人気度計算ステップと、 And the popularity calculation step of calculating the degree of popularity for each of the cluster,
    前記人気度の結果に基いて、旬度を算出する旬度計算ステップと、を備え、 Wherein based on the popularity of the results, with a Shundo calculating step of calculating a Shundo, a,
    前記人気度計算ステップにおいて、前記クラスタ中に含まれる記事の数と、記事の前記評価情報とに基いて、前記人気度を計算する旬度解析方法。 Wherein in the popularity calculation step, the number of articles contained in the cluster, based on said evaluation information articles, Shundo analyzing method for calculating the popularity.
  22. 請求項21に記載された旬度解析方法であって、 A Shundo analysis method according to claim 21,
    前記評価情報は、収集される記事に対するソーシャルブックマーク数又はアクセス数である旬度解析方法。 The evaluation information, Shundo analysis method, a social bookmark number or number of accesses to the articles to be collected.
  23. 請求項13に記載された旬度解析方法であって、 A Shundo analysis method according to claim 13,
    前記記事収集ステップにおいて、前記記事データを生成するにあたり、更に、収集される記事に対して張られるトラックバックの元記事を特定するトラックバック情報と、前記トラックバックの張られた時刻と、収集される記事に対する読み手の評価を示す評価情報とを収集して、前記記事データとし、 In the article collecting step, in generating said article data, further, the trackback information for specifying the original article trackback spanned against articles to be collected, and the time spanned of said trackback, for articles to be collected to collect and evaluate information that indicates the reader's evaluation, and the article data,
    前記旬度測定ステップは、 The Shundo measuring step,
    前記クラスタ毎に、前記クラスタ中に含まれる記事の数と、記事の前記評価情報とに基いて前記人気度を計算する人気度計算ステップと、 For each of the clusters, and the number of articles contained in the cluster, and the popularity calculation step of calculating the popularity based on said evaluation information articles,
    前記クラスタ毎に、前記トラックバック情報に基いて、前記トラックバックの前記起点記事からの深さを算出し、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの前記起点記事からの深さとに基いて波及度を計算する波及度計算ステップと、 For each of the clusters, based on the trackback information, calculates the depth from the origin articles of the trackback, the number of the track back included in the cluster, depth and on the basis of the said origin articles of the trackback and spread calculation step of calculating the spread of stomach,
    前記クラスタ毎に、前記クラスタ中に含まれる前記トラックバックの数と、前記トラックバックの張られた時刻とに基いて、新鮮度を計算する新鮮度計算ステップと、 For each of the clusters, and the number of the track back included in the cluster, based on the time spanned of said track back, and fresh calculation step of calculating a freshness,
    前記人気度、前記波及度、及び前記新鮮度の結果に基いて、旬度を算出する旬度計算ステップと、備える旬度解析方法。 The popularity the spillover level, and the based on the freshness of the result, and Shundo calculating step of calculating a Shundo comprises steepness analysis method.
  24. 請求項23に記載された旬度解析方法であって、 A Shundo analysis method according to claim 23,
    前記新鮮度計算ステップにおいて、下記式10により、新鮮度F(t)を計算し、 In the freshness calculation step, the following equation 10, calculate the freshness F (t),
    (但し、α、β、γは定数、tはトラックバックの張られてからの経過時間を示す) (However, α, β, γ is a constant, t indicates the time elapsed since stretched the trackback)
    前記波及度計算ステップにおいて、下記式11により、波及度I(d)を計算し、 In the spread calculation step, the following equation 11 to calculate the spread of I (d),
    (但し、αはトラックバック元の記事の重みを示し、dは前記起点記事からのトラックバックの深さを示す) (However, alpha represents the weight of the trackback original article, d denotes the depth of the trackback from the origin articles)
    前記人気度計算部は、収集される記事に対するソーシャルブックマーク数又はアクセス数でを前記評価情報として、前記クラスタ毎の総ソーシャルブックマーク数又は総アクセス数を、前記人気度P(n)として計算し、 Said the popularity calculation section, as the evaluation information with social bookmark number or the number of accesses to the article to be collected, the total social bookmark number or the total number of accesses for each of the cluster, calculated as the popularity P (n),
    前記旬度計算部は、下記式12により、旬度を計算する The seasonal calculation unit, by the following equation 12 to calculate the Shundo
    (但し、Ii(d)はトラックバックiの波及度を示し、Fi(t)はトラックバックiの新鮮度を示し、Pj(n)は、記事jの人気度を示す) (However, Ii (d) shows the spread of the trackback i, Fi (t) indicates the freshness of trackback i, Pj (n) indicates the popularity of the article j)
    旬度解析方法。 Shundo analysis method.
  25. 請求項13乃至24のいずれかに記載された旬度解析方法をコンピュータによって実行させるための旬度解析プログラム。 Shundo analysis program to be executed by the claims 13 to computer Shundo analysis method described in any one of 24.
JP2007073388A 2007-03-20 2007-03-20 Shundo analysis system, Shundo analysis method, and Shundo analysis program Expired - Fee Related JP4894580B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007073388A JP4894580B2 (en) 2007-03-20 2007-03-20 Shundo analysis system, Shundo analysis method, and Shundo analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007073388A JP4894580B2 (en) 2007-03-20 2007-03-20 Shundo analysis system, Shundo analysis method, and Shundo analysis program

Publications (2)

Publication Number Publication Date
JP2008234338A JP2008234338A (en) 2008-10-02
JP4894580B2 true JP4894580B2 (en) 2012-03-14

Family

ID=39907033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007073388A Expired - Fee Related JP4894580B2 (en) 2007-03-20 2007-03-20 Shundo analysis system, Shundo analysis method, and Shundo analysis program

Country Status (1)

Country Link
JP (1) JP4894580B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5132511B2 (en) * 2008-10-08 2013-01-30 ヤフー株式会社 Search method using the knowledge db
JP5155130B2 (en) * 2008-12-15 2013-02-27 ヤフー株式会社 Category presentation device
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
JP6297835B2 (en) * 2013-12-26 2018-03-20 Kddi株式会社 Mining analyzer, method, and program
US9589061B2 (en) * 2014-04-04 2017-03-07 Fujitsu Limited Collecting learning materials for informal learning
JP6429383B2 (en) * 2015-01-13 2018-11-28 日本放送協会 Subordinate expression extraction apparatus and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115832A (en) * 1997-06-25 1999-01-22 Fujitsu Ltd Cluster generation device and recording medium
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data

Also Published As

Publication number Publication date
JP2008234338A (en) 2008-10-02

Similar Documents

Publication Publication Date Title
Zhou et al. Exploring social annotations for information retrieval
Terwee et al. Development of a methodological PubMed search filter for finding studies on measurement properties of measurement instruments
Bian et al. Learning to recognize reliable users and content in social media with coupled mutual reinforcement
Gerrish et al. A Language-based Approach to Measuring Scholarly Impact.
Radlinski et al. How does clickthrough data reflect retrieval quality?
Atzmueller Subgroup discovery
US8612435B2 (en) Activity based users' interests modeling for determining content relevance
Van Eck et al. Visualizing bibliometric networks
Symeonidis et al. A unified framework for providing recommendations in social tagging systems based on ternary semantic analysis
White et al. Predicting short-term interests using activity-based search context
JP5423030B2 (en) Determination of word related to the word set
Tartir et al. Ontology evaluation and ranking using OntoQA
Kolda et al. Higher-order web link analysis using multilinear algebra
US20120278321A1 (en) Visualization of concepts within a collection of information
EP1304627B1 (en) Methods, systems, and articles of manufacture for soft hierarchical clustering of co-occurring objects
Halpin et al. The Dynamics and Semantics of Collaborative Tagging.
CN100495392C (en) Intelligent search method
CN101408886B (en) Selecting tags for a document by analyzing paragraphs of the document
US9171078B2 (en) Automatic recommendation of vertical search engines
Bar-Ilan et al. Beyond citations: Scholars' visibility on the social Web
Radicchi et al. Diffusion of scientific credits and the ranking of scientists
Mingers et al. A review of theory and practice in scientometrics
CN101408885B (en) Modeling topics using statistical distributions
US20110320470A1 (en) Generating and presenting a suggested search query
US9002857B2 (en) Methods for searching with semantic similarity scores in one or more ontologies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091027

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111121

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees