JP5092252B2 - Trend analysis server and trend analysis method - Google Patents
Trend analysis server and trend analysis method Download PDFInfo
- Publication number
- JP5092252B2 JP5092252B2 JP2006050634A JP2006050634A JP5092252B2 JP 5092252 B2 JP5092252 B2 JP 5092252B2 JP 2006050634 A JP2006050634 A JP 2006050634A JP 2006050634 A JP2006050634 A JP 2006050634A JP 5092252 B2 JP5092252 B2 JP 5092252B2
- Authority
- JP
- Japan
- Prior art keywords
- blog
- information
- keyword
- trend analysis
- web page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 140
- 238000000034 method Methods 0.000 claims description 75
- 230000007704 transition Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、インターネットで公開されている情報を解析し、トレンドに関連する情報を提供するサーバおよび方法に関する。 The present invention relates to a server and a method for analyzing information published on the Internet and providing information related to a trend.
インターネット上では、大勢の人が、ホームページ(Home Page)やブログ(blog)などで様々な情報を公開し、現在、インターネットは必要な情報をリアルタイムで入手できる有用な情報源になっている。近年、この消費者とも言える個人が発信している情報源を活用してトレンドを解析する試みがなされている。 On the Internet, a large number of people publish various information on homepages and blogs, and the Internet is now a useful source of information that can be obtained in real time. In recent years, attempts have been made to analyze trends using information sources transmitted by individuals who can be called consumers.
インターネットの情報源を活用してトレンドを解析する一つの手法として、探索エンジンなどに入力される探索キーワードから現在のトレンドを解析する手法がある。この手法は、探索キーワードをある一定期間(例えば、1週間)ごとに集計し、この集計結果(例えば、探索キーワードのランキング)から、現在のトレンドに関する情報を提供する。 One technique for analyzing trends using Internet information sources is to analyze current trends from search keywords input to a search engine or the like. This method totals search keywords every certain period (for example, one week), and provides information on the current trend from the total results (for example, ranking of search keywords).
特許文献1で開示されている装置は、探索キーワードを利用してトレンドを解析する装置で、探索キーワードのランキング上位に含まれる検索キーワード同士の関連度を調査し、ユーザがこのランキングの中から一つの探索キーワードを選択すると、この探索キーワードと関連度の高い他の探索キーワードと関連情報(例えば、ニュース記事など)などの情報を、ユーザに送信する装置である。
The device disclosed in
しかしながら、探索キーワードを利用する手法では、ユーザが明示的に検索指定したキーワードのみに基づいてトレンド解析を実行するため、Webページ上に存在しているけれども検索指定されないキーワードが対象外となってしまい、トレンド解析としての網羅性に欠けるという問題がある。 However, in the method using search keywords, trend analysis is performed based only on keywords that are explicitly specified by the user, so keywords that exist on the Web page but are not specified for search are excluded. , There is a problem of lack of completeness as a trend analysis.
また、インターネットの情報源を活用してトレンドを解析する他の手法として、クローリング(crawling)によって、インターネット上で公開されている情報を収集し、収集した情報からトレンドを解析する手法がある。 In addition, as another method of analyzing a trend by using an information source on the Internet, there is a method of collecting information published on the Internet by crawling and analyzing the trend from the collected information.
特許文献2で開示されている装置は、この手法を応用した装置で、インターネット上の複数のホームページから文書を自動的に収集し、収集した文書に含まれる単語を解析することで、今世間で話題になっていること(=トレンド)が一目で分かるようにする表示する装置で、好ましくは、収集する文書をニュースとすることで、ニュースに含まれる重要語の出現頻度や、この重要語の関連語などを一目で分かるようにする装置である。
しかし、上述した技術は現在のトレンドを示す単語(トレンドキーワード)を提供する技術であって、このトレンドキーワードが頻繁に利用されている理由やトレンドキーワードを発信している情報発信者に関する情報を把握することは困難であった。 However, the technology described above is a technology that provides a word (trend keyword) that indicates the current trend, and understands why the trend keyword is frequently used and information about the information sender that sends the trend keyword. It was difficult to do.
例えば、トレンドキーワードが小説の題名であった場合、小説そのものが注目されているのか、小説のドラマが注目されているのか知り得ることは難しかった。更には、どのような人がこの小説に興味をもっているのか知り得ることも難しかった。 For example, when the trend keyword was the title of a novel, it was difficult to know whether the novel itself was drawing attention or whether the novel drama was drawing attention. Furthermore, it was difficult to know who was interested in this novel.
そこで、本発明は、時間の経過と共に変遷するトレンドキーワードをユーザに提供すると共に、トレンドキーワードが利用されている理由やトレンドキーワードを利用している人に関する情報をも提供することのできるトレンド解析サーバおよびトレンド解析方法を提供することを目的とする。 Therefore, the present invention provides a trend keyword that changes with the passage of time to the user, and a trend analysis server that can also provide information on the reason why the trend keyword is used and the person who uses the trend keyword. And it aims at providing a trend analysis method.
上述した課題を解決する第1の発明は、インターネット上の複数のブログサイトで公開している情報を解析し、インターネットに接続された端末装置に解析結果を提供するトレンド解析サーバであって、前記トレンド解析サーバは、前記ブログサイトで公開しているブログ記事ごとに、前記ブログ記事が公開されている前記ブログサイトの情報並びに前記ブログ記事のタイトル、内容および公開日をブログ記事情報として取得する記事情報収集手段と、キーワードを抽出するときに参照する前記ブログ記事情報を定める条件(対象記事条件)に適合するすべての前記ブログ記事情報を解析し、所定の基準に従って1つ以上の単語をキーワードとして抽出するキーワード抽出手段と、前記キーワード抽出手段により抽出されたキーワードを少なくとも表示するWebページを生成するWebページ生成手段とを備え、前記Webページ生成手段は、第1の期間内に公開された前記ブログ記事の前記ブログ記事情報を前記対象記事条件として抽出したキーワードをトレンドキーワードとして表示する第1のWebページと、前記第1のWebページで表示された前記トレンドキーワードの中から一つの前記トレンドキーワードが選択されたときに、選択された前記トレンドキーワードが記述された前記ブログ記事情報の中で、最新の所定件数の前記ブログ記事情報を前記対象記事条件として抽出したキーワード(関連キーワード)、および、前記関連キーワードを抽出したときに参照した前記ブログ記事情報を、当該ブログ記事情報に含まれる前記ブログサイトの名称を記述してリスト化し、表示する第2のWebページと、表示されている前記ブログサイトの名称が選択されたときに、選択された前記ブログサイトから得られた前記ブログ記事情報の中で、最新の所定件数の前記ブログ記事情報を前記対象記事条件とし、前記キーワード抽出手段を用いて抽出したキーワード(ブログサイトキーワード)と、前記ブログサイトキーワードを抽出したときに参照した前記ブログ記事情報のリストとを表示する第3のWebページを生成することを特徴とする。 A first invention that solves the above-described problem is a trend analysis server that analyzes information published on a plurality of blog sites on the Internet and provides an analysis result to a terminal device connected to the Internet, The trend analysis server obtains, for each blog article published on the blog site, information on the blog site on which the blog article is published and the title, content, and publication date of the blog article as blog article information. Analyzing all the blog article information that meets information collection means and conditions (target article conditions) that define the blog article information to be referred to when extracting keywords, and using one or more words as keywords according to a predetermined criterion Keyword extracting means for extracting, and keywords extracted by the keyword extracting means Web page generating means for generating a Web page to be displayed, wherein the Web page generating means includes a keyword obtained by extracting the blog article information of the blog article published within a first period as the target article condition. The selected trend keyword is described when one trend keyword is selected from the first Web page to be displayed as the trend keyword and the trend keyword displayed on the first Web page. Among the blog article information, a keyword (related keyword) extracted from the latest predetermined number of the blog article information as the target article condition, and the blog article information referred to when the related keyword is extracted , list describes the name of the blog site that is included in the blog post information And, a second Web page that displays, when the name of the blog sites that are displayed has been selected, in the blog post information obtained from the selected the blog site, the latest of a predetermined number The blog article information is used as the target article condition, and a keyword (blog site keyword) extracted using the keyword extracting unit and a list of the blog article information referred to when the blog site keyword is extracted are displayed. A third Web page is generated.
更に、第2の発明は、第1の発明に記載のトレンド解析サーバであって、前記ブログ記事情報収集手段が収集した前記ブログ記事情報を記憶する情報記憶手段を備え、前記キーワード抽出手段は、前記情報記憶手段に記憶された前記ブログ記事情報を用いてキーワードを抽出する手段であることを特徴とする。 Further, the second invention is the trend analysis server according to the first invention, comprising an information storage means for storing the blog article information collected by the blog article information collecting means, and the keyword extracting means, It is a means for extracting a keyword using the blog article information stored in the information storage means.
更に、第3の発明は、第1の発明または第2の発明に記載のトレンド解析サーバであって、前記Webページ生成手段が生成するWebページには、前記キーワード抽出手段が抽出したキーワードのキーワードクラウドが表示されることを特徴とする。 Further, a third invention is the trend analysis server according to the first invention or the second invention, wherein the keyword of the keyword extracted by the keyword extracting unit is included in the Web page generated by the Web page generating unit. The cloud is displayed.
更に、第4の発明は、第1の発明から第3の発明のいずれかに記載のトレンド解析サーバであって、前記トレンド解析サーバが複数の前記ブログサイトから取得する前記ブログ記事情報は、前記ブログサイトで公開されているメタ情報の全て或いは一部であることを特徴とする。 Further, a fourth invention is the trend analysis server according to any one of the first to third inventions, wherein the blog article information that the trend analysis server acquires from a plurality of the blog sites is the It is characterized by being all or part of the meta information published on the blog site.
更に、第5の発明は、第1の発明から第4の発明のいずれかに記載のトレンド解析サーバであって、前記キーワードを抽出したときに参照した前記ブログ記事情報をリスト化するときに、前記ブログサイトの名称に加えて、前記ブログ記事情報に含まれる前記ブログ記事のタイトル、および、前記ブログ記事情報から得られる前記ブログ記事の要約文を記述することを特徴とする。 Further, a fifth invention is the trend analysis server according to any one of the first invention to the fourth invention, wherein when listing the blog article information referred to when the keyword is extracted, said in addition to the name of the blog site, the blog said blog post that is included in the article information title, it called, is characterized in that to write a summary statement of the blog post obtained from the blog post information.
更に、第6の発明は、第1の発明から第5の発明のいずれかに記載のトレンド解析サーバであって、前記キーワードを抽出したときに参照した前記ブログ記事情報をリスト化して表示する項目として、前記ブログ記事情報を取得した前記ブログサイトを定められた指標で評価した結果を示す指標情報を含ませることを特徴とする。 Further, a sixth invention is the trend analysis server according to any one of the first to fifth inventions, wherein the blog article information referred to when the keyword is extracted is listed and displayed. As described above, index information indicating a result of evaluating the blog site from which the blog article information has been acquired with a predetermined index is included.
更に、第7の発明は、第6の発明に記載のトレンド解析サーバであって、前記ブログサイトを評価する前記指標として、前記ブログサイトの被リンク数、前記ブログサイトの更新頻度、および、前記トレンド解析サーバを介して前記ブログサイトにアクセスのあった回数のすべて或いは一部を利用することを特徴とする。 Further, a seventh invention is the trend analysis server according to the sixth invention, wherein as the index for evaluating the blog site, the number of linked links of the blog site, the update frequency of the blog site, and the All or part of the number of accesses to the blog site via a trend analysis server is used.
更に、第8の発明は、第1の発明から第7の発明のいずれかに記載のトレンド解析サーバであって、請求項1から請求項7のいずれかに記載のトレンド解析サーバであって、前記Webページ生成手段は、前記トレンドキーワードの出現頻度と前記ランキング情報の変遷とを示したグラフを前記第2のWebページに含ませることを特徴とする。Further, an eighth invention is the trend analysis server according to any one of the first invention to the seventh invention, wherein the trend analysis server is any one of
更に、第9の発明は、第1の発明から第8の発明のいずれかに記載のトレンド解析サーバであって、前記Webページ生成手段が生成する前記第3のWebページには、前記第3のWebページで表示される前記ブログ記事情報のリストには前記サイトの前記指標情報を含ませずに、前記ブログ記事情報のリストとは別に、前記ブログサイトの前記指標情報が表示されることを特徴とする。 Furthermore, a ninth invention is the trend analysis server according to any one of the first to eighth inventions , wherein the third Web page generated by the Web page generating means includes the third Web page. The blog article information list displayed on the Web page does not include the index information of the site, and the index information of the blog site is displayed separately from the blog article information list. Features.
更に、第10の発明は、第1の発明から第9の発明のいずれかに記載のトレンド解析サーバであって、前記Webページ生成手段は、前記第3のWebページを生成するときに、前記第3のWebページで表示する前記ブログサイトキーワードのすべてが記述された前記ブログ記事情報を抽出し、前記第3のWebページには、抽出した前記ブログ記事情報の最新の所定件数をリスト化して表示することを特徴とする。 Further, a tenth invention is the trend analysis server according to any one of the first invention to the ninth invention, wherein the web page generation means generates the third web page when the third web page is generated. The blog article information in which all of the blog site keywords to be displayed on the third Web page are described is extracted, and the latest predetermined number of the extracted blog article information is listed on the third Web page. It is characterized by displaying.
更に、第11の発明は、第5の発明から第7の発明のいずれかに記載のトレンド解析サーバであって、前記Webページ生成手段は、前記ブログ記事情報のリストで表示されている前記ブログ記事のタイトルが選択されたときに、前記ブログ記事のタイトルが選択された前記ブログ記事情報を前記対象記事条件とし、前記キーワード抽出手段を用いて抽出したキーワード(エントリキーワード)と、前記エントリキーワードを抽出したときに参照した前記ブログ記事情報のみをリスト化して表示する第4のWebページを生成することを特徴とする。 Further, an eleventh invention is the trend analysis server according to any one of the fifth to seventh inventions, wherein the web page generation means is the blog displayed in the blog article information list. When an article title is selected, the blog article information from which the blog article title is selected is used as the target article condition, and a keyword (entry keyword) extracted using the keyword extracting unit, and the entry keyword A fourth Web page that generates a list and displays only the blog article information referred to when extracted is generated.
更に、第12の発明は、第1の発明から第11の発明のいずれかに記載のトレンド解析サーバであって、前記Webページ生成手段は、前記第1の期間よりも短い前記第2の期間内に公開された前記ブログ記事の前記ブログ記事情報を前記対象記事条件とし、前記キーワード抽出手段を用いて抽出したキーワード(新着キーワード)と、前記新着キーワードを抽出したときに参照した前記ブログ記事情報のリストとを表示する第5のWebページを生成することを特徴とする。 Furthermore, a twelfth invention is the trend analysis server according to any one of the first invention to the eleventh invention, wherein the Web page generation means is the second period shorter than the first period. The blog article information of the blog article published within is set as the target article condition, the keyword (new keyword) extracted using the keyword extracting means, and the blog article information referred to when the new keyword is extracted And generating a fifth Web page that displays the list.
更に、第13の発明は、インターネット上の複数のブログサイトで公開されている情報を解析し、インターネットに接続された端末装置に解析結果を提供するトレンド解析方法であって、前記トレンド解析方法は、前記ブログサイトで公開しているブログ記事ごとに、前記ブログ記事が公開されている前記ブログサイトの情報、前記ブログ記事の内容および前記ブログ記事の公開日をブログ記事情報として収集するブログ記事情報収集工程と、キーワードを抽出するときに参照する前記ブログ記事情報を定める条件(対象記事条件)に適合するすべての前記ブログ記事情報を解析し、所定の基準に従って1つ以上の単語をキーワードとして抽出し、抽出したキーワードを少なくとも表示するWebページを生成するWebページ生成工程を備え、前記Webページ生成工程では、第1の期間内に公開された前記ブログ記事の前記ブログ記事情報を前記対象記事条件として抽出したキーワードをトレンドキーワードとして表示する第1のWebページと、前記第1のWebページで表示された前記トレンドキーワードの中から一つのトレンドキーワードが選択されたときに、選択された前記トレンドキーワードが記述された前記ブログ記事情報の中で、最新の所定件数の前記ブログ記事情報を前記対象記事条件として抽出したキーワード(関連キーワード)と、前記関連キーワードを抽出したときに参照した前記ブログ記事情報を、当該ブログ記事情報に含まれる前記ブログサイトの名称を含ませてリスト化し、表示する第2のWebページと、表示されている前記ブログサイトの名称が選択されたときに、選択された前記ブログサイトから得られた前記ブログ記事情報の中で、最新の所定件数の前記ブログ記事情報を前記対象記事条件として抽出したキーワード(ブログサイトキーワード)と、前記ブログサイトキーワードを抽出したときに参照した前記ブログ記事情報のリストとを表示する第3のWebページが生成されることを特徴とする。 Furthermore, a thirteenth invention is a trend analysis method for analyzing information published on a plurality of blog sites on the Internet and providing an analysis result to a terminal device connected to the Internet, wherein the trend analysis method includes: For each blog article published on the blog site, blog article information that collects information on the blog site on which the blog article is published, the content of the blog article, and the publication date of the blog article as blog article information Analyzing all the blog article information that meets the conditions (target article conditions) that define the blog article information to be referred to when collecting keywords and extracting keywords, and extracting one or more words as keywords according to predetermined criteria And a Web page generation process for generating a Web page that displays at least the extracted keywords. In the Web page generation step, a first Web page that displays a keyword obtained by extracting the blog article information of the blog article published within a first period as the target article condition as a trend keyword, and the first When one trend keyword is selected from among the trend keywords displayed on the Web page, the latest predetermined number of the blog articles in the blog article information in which the selected trend keyword is described The keywords (related keywords) extracted from the information as the target article condition and the blog article information referred to when the related keywords are extracted are listed by including the name of the blog site included in the blog article information. , and the second of the Web page that displays the name of the blog sites that are displayed When the is selected, among the blog article information obtained from the selected blog site, a keyword (blog site keyword) that extracted the latest predetermined number of the blog article information as the target article condition, A third Web page displaying the list of blog article information referred to when the blog site keyword is extracted is generated.
更に、第14の発明は、第13の発明に記載のトレンド解析方法であって、前記ブログ記事情報収集工程は収集した前記ブログ記事情報を情報記憶装置に記憶する工程であって、前記Webページ生成工程では、前記ブログ記事情報収集工程で前記情報記憶装置に記憶された前記ブログ記事情報を用いてキーワードが抽出されることを特徴とする。 Furthermore, the fourteenth invention is the trend analysis method according to the thirteenth invention, wherein the blog article information collecting step is a step of storing the collected blog article information in an information storage device, and the web page In the generating step, keywords are extracted using the blog article information stored in the information storage device in the blog article information collecting step.
更に、第15の発明は、第13の発明または第14の発明に記載のトレンド解析方法であって、前記Webページ生成工程で生成されるWebページには、抽出されたキーワードのキーワードクラウドが表示されることを特徴とする。 The fifteenth invention is the trend analysis method according to the thirteenth or fourteenth invention, wherein a keyword cloud of the extracted keywords is displayed on the web page generated in the web page generation step. It is characterized by being.
更に、第16の発明は、第13の発明から第15の発明のいずれかに記載のトレンド解析方法であって、前記トレンド解析サーバが複数の前記ブログサイトから取得する前記ブログ記事情報は、前記ブログサイトで公開されているメタ情報の全て或いは一部であることを特徴とする。 Furthermore, the sixteenth invention is the trend analysis method according to any one of the thirteenth to fifteenth inventions, wherein the trend analysis server acquires the blog article information acquired from a plurality of the blog sites, It is characterized by being all or part of the meta information published on the blog site.
更に、第17の発明は、第13の発明から第16の発明のいずれかに記載のトレンド解析方法であって、前記キーワードを抽出したときに参照した前記ブログ記事情報をリスト化して表示する項目に、前記ブログサイトの名称に加えて、前記ブログ記事情報に含まれる前記ブログ記事のタイトル、および、前記ブログ記事から得られる要約文を含ませることを特徴とする。 The seventeenth invention is the trend analysis method according to any one of the thirteenth to sixteenth inventions, wherein the blog article information referred to when the keyword is extracted is displayed in a list. to the addition to the name of the blog site, the blog post information the posts included in the title, your and characterized by the inclusion of summary derived from the posts.
更に、第18の発明は、第13の発明から第17の発明のいずれかに記載のトレンド解析方法であって、前記キーワードを抽出したときに参照した前記ブログ記事情報をリスト化して表示する項目として、前記ブログ記事情報を取得した前記ブログサイトを定められた指標で評価した結果を示す指標情報を含ませることを特徴とする。 Furthermore, an eighteenth invention is the trend analysis method according to any one of the thirteenth to seventeenth inventions, wherein the blog article information referred to when the keyword is extracted is listed and displayed. As described above, index information indicating a result of evaluating the blog site from which the blog article information has been acquired with a predetermined index is included.
更に、第19の発明は、第18の発明に記載のトレンド解析方法であって、前記ブログサイトを評価する前記指標として、前記ブログサイトの被リンク数、前記ブログサイトの更新頻度、および、前記トレンド解析サーバを介して前記ブログサイトにアクセスのあった回数のすべて或いは一部を利用することを特徴とする。 Further, a nineteenth invention is the trend analysis method according to the eighteenth invention, wherein the number of linked links of the blog site, the update frequency of the blog site, and the index as the index for evaluating the blog site, All or part of the number of accesses to the blog site via a trend analysis server is used.
更に、第20の発明は、第13の発明から第19の発明のいずれかに記載のトレンド解析方法であって、前記Webページ生成工程は、前記トレンドキーワードの出現頻度と前記ランキング情報の変遷とを示したグラフを前記第2のWebページに含ませることを特徴とする。Furthermore, a twentieth invention is the trend analysis method according to any one of the thirteenth to nineteenth inventions, wherein the Web page generation step includes the appearance frequency of the trend keyword and the transition of the ranking information. Is included in the second Web page.
更に、第21の発明は、第13の発明から第20の発明のいずれかに記載のトレンド解析方法であって、前記Webページ生成工程で生成される前記第3のWebページには、前記第3のWebページで表示される前記ブログ記事情報のリストに前記サイトの前記指標情報を含ませずに、前記ブログ記事情報のリストとは別に、前記ブログサイトの前記指標情報が表示されることを特徴とする。
Further, the invention of twenty-first, from the thirteenth aspect a trend analysis method according to any one of the twentieth invention, in the third Web pages generated by the Web page generation step, the first The index information of the blog site is displayed separately from the list of blog article information without including the index information of the site in the list of blog article information displayed on the
更に、第22の発明は、第13の発明から第21の発明のいずれかに記載のトレンド解析方法であって、前記Webページ生成工程では、前記第3のWebページを生成するときに、前記第3のWebページで表示するブログサイトキーワードのすべてが記述されている前記ブログ記事情報を抽出し、前記第3のWebページには、抽出した前記ブログ記事情報の最新の所定件数をリスト化して表示することを特徴とする。 Further, a twenty-second invention is the trend analysis method according to any one of the thirteenth to twenty-first inventions, wherein, in the Web page generation step, when the third Web page is generated, The blog article information in which all of the blog site keywords to be displayed on the third Web page are described is extracted, and the latest predetermined number of the extracted blog article information is listed on the third Web page. It is characterized by displaying.
更に、第23の発明は、第17の発明から第19の発明のいずれかに記載のトレンド解析方法であって、前記Webページ生成工程では、前記ブログ記事情報のリストで表示されている前記ブログ記事のタイトルが選択されたときに、前記ブログ記事のタイトルが選択された前記ブログ記事情報を前記対象記事条件として抽出したキーワード(エントリキーワード)と、前記エントリキーワードを抽出したときに参照した前記ブログ記事情報のみをリスト化して表示する第4のWebページを生成することを特徴とする。 Furthermore, a twenty- third invention is the trend analysis method according to any one of the seventeenth to nineteenth inventions, wherein in the Web page generation step, the blog displayed as a list of the blog article information When an article title is selected, a keyword (entry keyword) extracted from the blog article information from which the blog article title is selected as the target article condition, and the blog referred to when the entry keyword is extracted A fourth Web page that lists and displays only article information is generated.
更に、第24の発明は、第13の発明から第23の発明のいずれかに記載のトレンド解析方法であって、前記Webページ生成工程では、前記第1の期間よりも短い前記第2の期間内で公開された前記ブログ記事の前記ブログ記事情報を前記対象記事条件として抽出したキーワード(新着キーワード)と、前記新着キーワードを抽出したときに参照した前記ブログ記事情報のリストとを表示する第5のWebページを生成することを特徴とする。 Furthermore, a twenty-fourth invention is the trend analysis method according to any one of the thirteenth to twenty-third inventions, wherein, in the Web page generation step, the second period shorter than the first period. A keyword (new keyword) extracted as the target article condition for the blog article information of the blog article published in the list, and a list of the blog article information referred to when the new keyword is extracted is displayed. A Web page is generated.
上述した本発明によれば、インターネット上のブログサイトで公開されているブログ記事のブログ記事情報を解析して前記トレンドキーワードを抽出し、トレンドキーワードが記述されているブログ記事情報から得られた関連キーワードをユーザに提示することで、ユーザは、トレンドキーワードが頻繁に利用されている理由を関連キーワードから推測できる。また、ブログサイトキーワードを表示する第3のWebページを生成することで、ユーザは、ブログサイトで主に記述されているジャンルなどを知り得る。 According to the present invention described above, the blog article information of the blog article published on the blog site on the Internet is analyzed to extract the trend keyword, and the relation obtained from the blog article information in which the trend keyword is described. By presenting the keyword to the user, the user can infer from the related keyword the reason why the trend keyword is frequently used. Also, by generating the third Web page that displays the blog site keyword, the user can know the genre mainly described in the blog site.
更に、キーワードをキーワードクラウドで表示することで、ユーザは一目で重要なキーワードを識別できる。また、予めブログ記事情報を収集しておくことで、キーワードの抽出処理の効率を高めることができ、前記ブログ記事情報をメタ情報とすることで、キーワードの抽出処理の効率は更に高まる。 Furthermore, by displaying keywords in the keyword cloud, the user can identify important keywords at a glance. Further, by collecting blog article information in advance, it is possible to increase the efficiency of the keyword extraction process, and by using the blog article information as meta information, the efficiency of the keyword extraction process is further increased.
更に、ブログ記事のサイトを定められた指標で評価した結果を示す指標情報をWebページに表示させることで、ユーザはブログサイトの人気度などの情報を知り得る。また、トレンドキーワードの出現頻度やランキング情報の変遷を示したグラフを表示することで、ユーザはトレンドキーワードが頻繁に利用され始めた時期を知り得る。 Furthermore, by displaying index information indicating the result of evaluating the site of the blog article with a predetermined index on the Web page, the user can know information such as the popularity of the blog site. Further, by displaying a graph showing the trend frequency of the trend keyword and the transition of the ranking information, the user can know when the trend keyword has started to be used frequently.
更に、前記第3のWebページで表示するすべてのブログサイトキーワードが記述されている前記ブログ記事情報を抽出し、抽出された前記ブログ記事情報のリストを表示することで、ユーザは第3のWebページで紹介されたブログサイトと類似した記事を記載しているブログサイトを知り得る。 In addition, before Symbol to extract the third the blog post information that all of the blog site keywords are described to be displayed on the Web page of, it has been extracted said by displaying a list of the blog post information, the user of the third You can find blog sites that contain articles similar to the blog sites introduced on the Web page.
更に、エントリキーワードを表示する第4のWebページを生成することで、ユーザは記事本体を読まなくとも、ブログ記事情報に対応する記事の内容を推測することができる。 Furthermore, by generating the fourth Web page that displays the entry keyword, the user can guess the content of the article corresponding to the blog article information without reading the article body.
更に、新着キーワードを表示する第5のWebページを生成することで、ユーザは、トレンド解析サーバにアクセスした時点で頻繁に利用され始めているキーワードを知り得る。 Furthermore, by generating a fifth Web page that displays new keywords, the user can know the keywords that are frequently used when accessing the trend analysis server.
〔トレンド解析サーバ〕
ここから、本発明に係る装置であるトレンド解析サーバについて、図を参照しながら詳細に説明する。図1は、トレンド解析サーバを配置したネットワークシステムの一例を示した図である。
[Trend analysis server]
From here, the trend analysis server which is an apparatus according to the present invention will be described in detail with reference to the drawings. FIG. 1 is a diagram showing an example of a network system in which a trend analysis server is arranged.
図1に示したネットワークシステムでは、ブログサービスを提供し、複数のブログサイトを有するブログ運営サーバ2と、ブログサイトが更新されたことを示す更新通知ping情報が送信される更新通知pingサーバ3と、ブログサイトからブログ記事情報を収集し、収集したブログ記事情報の解析結果をPC4に提供するトレンド解析サーバ1と、トレンド解析サーバ1を利用するユーザが所持するパーソナルコンピュータ4(以下、PC: Personal Computer)とがインターネット5に接続されている。
In the network system shown in FIG. 1, a blog management server 2 that provides a blog service and has a plurality of blog sites, an update
図1において、ブログ運営サーバ2と更新通知pingサーバ3を1台としているのは、本発明の内容を分かり易く説明するためである。当然のことながら、実際には複数台のブログ運営サーバ2および更新通知pingサーバ3がインターネット5に接続されている。更に、トレンド解析サーバ1は1台のサーバで構成されているように図示しているが、実際には複数台のサーバから構成されている。
In FIG. 1, the blog management server 2 and the update
トレンド解析サーバ1は、ブログ運営サーバ2が有する複数のブログサイトからブログ記事情報を収集し、ユーザからの要求があると、収集したブログ記事情報の解析結果をユーザに提供するアプリケーションサーバである。トレンド解析サーバ1は、ブログサイトからブログ記事情報を収集するために、定められた間隔で更新通知pingサーバ3にアクセスし、複数の更新通信ping情報が集約されたブログ更新情報を取得する。
The
そして、ブログ更新情報で示されるブログサイトから、更新された記事の要約文などが記述されたメタ情報と、更新された記事がリンクしているWebページに関する情報(例えば、URL)を、更新された記事のブログ記事情報として収集し、収集したブログ記事情報を記憶する。 Then, from the blog site indicated by the blog update information, the meta information describing the summary sentence of the updated article and the information (for example, URL) related to the Web page to which the updated article is linked are updated. Collected as blog article information, and the collected blog article information is stored.
PC4からトレンド解析サーバ1にアクセスがあると、トレンド解析サーバ1は収集したブログ記事情報の中で、キーワードを抽出するときに利用するブログ記事情報を定める条件(対象記事条件)に適合するブログ記事情報からキーワードを抽出し、抽出したキーワードのキーワードクラウドを表示するWebページを生成しPC4に配信する。
When the
キーワードを抽出するときに利用する対象記事条件を生成するWebページごとに変更することで、キーワードを抽出するときに参照するブログ記事情報の群は異なり、抽出されるキーワードはWebページごとに異なる意味合いを持つ。 By changing the target article condition to be used when extracting keywords for each Web page, the group of blog article information referred to when extracting keywords is different, and the extracted keywords have different meanings for each Web page have.
例えば、様々なブログサイトが頻繁に利用する単語をトレンドキーワードとして抽出し、ある特定のトレンドキーワードが記述されているブログ記事情報を対象記事条件とすれば、このトレンドキーワードが記述されているブログ記事情報で頻繁に利用する単語がキーワードとして抽出され、このキーワードからトレンドキーワードが頻繁に使用されている理由を推測することができる。 For example, if words that are frequently used by various blog sites are extracted as trend keywords, and the blog article information in which a particular trend keyword is described is the target article condition, the blog article in which the trend keyword is described Words frequently used in information are extracted as keywords, and the reason why trend keywords are frequently used can be estimated from the keywords.
また、ある特定のブログサイトから収集したブログ記事情報を対象記事条件とすれば、ブログサイトが頻繁に用いる単語がキーワードとして抽出され、このキーワードからブログサイトで主に記述されているジャンルを推測できる。 Also, if the blog article information collected from a specific blog site is used as the target article condition, the words frequently used by the blog site are extracted as keywords, and the genre mainly described in the blog site can be inferred from this keyword .
ここで、キーワードクラウドとは、キーワードの一覧を表示するための一つの手法で、このキーワードクラウドにおいては、出現頻度や重要度に応じて、文字の大きさや太さ、配色等を用いて、他のキーワードよりも目立つように表示される。ユーザは、キーワードクラウドを参照することで、重要なキーワードを一目で認識することができる。 Here, the keyword cloud is a method for displaying a list of keywords. In this keyword cloud, the size, thickness, color scheme, etc. of characters are used according to the appearance frequency and importance. It is displayed more prominently than the keyword. The user can recognize important keywords at a glance by referring to the keyword cloud.
図2は、図1で示したネットワークシステムのブロック図である。ブログ運営サーバ2では、ブログ運営サーバ2が提供しているブログサービスを利用して、大勢の人がブログサイト20を運営し、一つのブログサイト20には、日々の出来事などが記述されている複数のブログ記事21と、ブログ記事21の要約文などが記述された情報である一つのメタ情報22とが公開されている。
FIG. 2 is a block diagram of the network system shown in FIG. In the blog management server 2, a large number of people operate the
図3は、ブログサイト20で公開されているメタ情報22の一例を説明する図である。メタ情報22には、メタ情報22が記述される構造化言語のバージョンなどを示すヘッダ要素、一つのChannel要素220および複数のItem要素221とから、少なくとも構成される。なお、メタ情報22を記述するフォーマットには、RSS、ATOMなど様々なフォーマットがあるが、図3ではRSSを例にとっている。
FIG. 3 is a diagram for explaining an example of the
メタ情報22のChannel要素220とは、ブログサイト20を紹介する情報であって、ブログサイト20のタイトル、ブログサイト20が公開されているURL、ブログサイト20を公開しているブログサイト20の名称、ブログサイト20のテーマなどの情報、ブログ記事21の一覧リストなどが記述されている。
The
Item要素221は、ブログサイト20のブログ記事21ごとにメタ情報22に記述され、ブログ記事21の要約などが記述される情報であって、Item要素221には、ブログ記事21のタイトル、ブログ記事21が公開されているURL、ブログ記事21を公開した日時、そして、ブログ記事21の要約文などが記述されている。
The
ブログ作成者がブログサイト20を更新、すなわち、ブログサイト20に新しいブログ記事21を追加すると、追加したブログ記事21のItem要素221を追加するなどしてメタ情報22も更新される。また、ブログ作成者によってブログサイト20を更新したことを示し、追加したブログ記事21のURLを示す更新通知ping情報が更新通知pingサーバ3に送信される。
When the blog creator updates the
更新通知pingサーバ3には、様々なブログサイト20から送信された更新通知ping情報が記憶され、送信された更新通知ping情報を集約したブログ更新情報30を配信している。トレンド解析サーバ1は、一定時間ごとに更新通知pingサーバ3にアクセスすることで、一定時間内に更新されたブログサイト20のブログ更新情報30を取得することができる。
The update
トレンド解析サーバ1には、更新通知pingサーバ3から得られるブログ更新情報30を利用し、ブログ記事情報を収集するブログ記事情報収集手段12と、ブログ記事情報収集手段12が収集したブログ記事情報を記憶する情報記憶手段13と、情報記憶手段13で記憶しているブログ記事情報を解析してキーワードを抽出するキーワード抽出手段10と、PC4からの要求に従い、キーワード抽出手段10を利用して様々なキーワードを抽出し、抽出したキーワードを表示するためのWebページを動的に生成しPC4に配信するWebページ生成手段11とを備えている。
The
本実施の形態では、トレンド解析サーバ1のブログ記事情報収集手段12は、一定時間ごとに更新通知pingサーバ3にアクセスし、更新通知pingサーバ3で公開しているブログ更新情報を取得する。
In the present embodiment, the blog article information collection means 12 of the
トレンド解析サーバ1のブログ記事情報収集手段12は、ブログ更新情報30を取得すると、ブログ更新情報30で示されるURLにアクセスし、追加されたブログ記事21のブログ記事情報として、メタ情報22に含まれるChannel要素220および追加されたブログ記事21のItem要素221と、更に、追加されたブログ記事21がリンクしているリンク先に関する情報(以下、リンク情報)とを収集し、収集した情報をブログ記事情報として情報記憶手段13に記憶する。
When the blog post
ブログ記事情報はデータベース構造で情報記憶手段13に記憶され、このデータベースは様々なデータテーブルを有する。例えば、時系列でブログ記事情報を記憶するデータテーブルや、ブログサイト20ごとに生成されるデータテーブルである。ブログ記事情報収集手段12はブログ記事情報を収集すると、収集したブログ記事情報に基づいてこれらのデータテーブルの内容を更新する。
Blog article information is stored in the information storage means 13 in a database structure, and this database has various data tables. For example, a data table for storing blog article information in time series or a data table generated for each
本実施の形態では、追加されたブログ記事21の内容が記述された情報として、追加されたブログ記事21の要約が記述されているメタ情報22のItem要素221を収集するが、トレンド解析サーバ1は、メタ情報22のItem要素221の代わりに、ブログ記事21の本体を収集してもよい。ブログ記事21の本体を収集したとしても、解析対象がメタ情報22のItem要素221からブログ記事21の本体に代わるだけ、本発明の技術的思想が代わるものではない。
In the present embodiment, the
トレンド解析サーバ1のキーワード抽出手段10は、キーワードを抽出するときに利用するブログ記事情報を定める条件(対象記事条件)を複数記憶し、指定された対象記事条件に適合するブログ記事情報から指定された数だけの単語をキーワードとして抽出する手段である。
The keyword extraction means 10 of the
キーワードを抽出するキーワード抽出手段10が、キーワードを抽出するときに利用するブログ記事情報は情報記憶手段13に記憶され、生成するWebページによって、キーワードを抽出するときの対象記事条件は異なる。異なる対象記事条件に適合するブログ記事情報からキーワードをそれぞれ抽出することで、上述しているように、抽出されるキーワードは対象記事条件ごとに異なる意味合いを持つ。
The blog article information used when the
キーワード抽出手段10がキーワードを抽出するときは、ブログ記事情報(例えば、メタ情報のItem要素)の個々の文を、公知の技術である日本語形態素解析によって品詞毎に分解し、名詞と固有名詞とを切出す。切出された単語(名詞、固有名詞)は、単語ごとに出現頻度が演算され、出現頻度の高い順にソートされる。そして、ソート結果の上位のいくつかの単語(例えば5個)がキーワードとして抽出される。 When the keyword extraction means 10 extracts keywords, individual sentences of blog article information (for example, Item elements of meta information) are decomposed into parts of speech by Japanese morphological analysis, which is a well-known technique, and nouns and proper nouns are obtained. And cut out. For the extracted words (nouns, proper nouns), the appearance frequency is calculated for each word and sorted in descending order of appearance frequency. Then, some words (for example, 5 words) at the top of the sorting result are extracted as keywords.
なお、一般的に出現頻度の高い語句はカッコの記号で括られることが多いため、形態素解析でなく、カッコで括られている単語を抽出して、キーワードを抽出することもできる。更に、キーワード抽出手段10は複数のキーワード抽出方法を備え、抽出するキーワードによって抽出方法を変更してもよい。例えば、トレンドキーワードを抽出するときはカッコで括られている単語を抽出し、他のキーワードは自然言語解析を利用して抽出してもよい。 In general, frequently occurring phrases are often enclosed in parenthesis symbols. Therefore, keywords can be extracted by extracting words enclosed in parentheses instead of morphological analysis. Furthermore, the keyword extraction means 10 may include a plurality of keyword extraction methods, and the extraction method may be changed depending on the keywords to be extracted. For example, when extracting trend keywords, words enclosed in parentheses may be extracted, and other keywords may be extracted using natural language analysis.
トレンド解析サーバ1のWebページ生成手段11は、情報記憶手段13に記憶されているブログ記事情報を利用して動的にWebページを生成し、生成したWebページをPC4に配信する手段である。ブログ運営サーバ2で公開されているブログサイト20の内容は、時事刻々と更新されるため、トレンド解析サーバ1のWebページ生成手段11が生成するこれらのWebページの内容も、ユーザがアクセスした日時によって変化する。
The web
図4は、Webページ生成手段11が生成するWebページを説明するための図である。本実施の形態において、抽出したキーワードを表示するWebページとして、図4に示したように、複数のトレンドキーワードが表示されるトレンドキーワードページ100と、選択した一つのトレンドキーワードが記述されているブログ記事21を紹介する関連記事紹介ページ110と、関連記事紹介ページ100に掲載されたブログサイト20を紹介するブログサイト紹介ページ120と、関連記事紹介ページ120に掲載された一つのブログ記事21のエントリ情報を表示するエントリページ130と、新着のブログ記事に関する情報を表示する新着ブログページ140の、少なくとも5つのWebページを生成する。
FIG. 4 is a diagram for explaining a Web page generated by the Web
まず、ブログ解析サイトのトップページであるトレンドキーワードページ100について説明する。図5はトレンドキーワードページ100を説明するための図である。
First, the
トレンドキーワードページ100には、トレンド解析サーバ1へのアクセス日に更新されたブログ記事21のブログ記事情報を対象記事条件とし、キーワード抽出手段10を利用して抽出したキーワードがトレンドキーワードとして表示され、トレンドキーワードのトップ5と、トレンドキーワードのキーワードクラウド101が表示される。
On the
図5では、キーワードクラウド101に7件のトレンドキーワードのみが記述されているが、キーワードクラウド101に表示するトレンドキーワードの数は任意でよい。ユーザは、トレンドキーワードページ100に表示されるトレンドキーワードのキーワードクラウド101を参照することで、アクセス日の近辺でどのような単語が頻繁に利用されているか知ることができる。
In FIG. 5, only seven trend keywords are described in the
更に、トレンドキーワードページ100には、トレンド解析サーバ1へのアクセス日の先週に更新されたブログ記事21のブログ記事情報(Item要素)を対象記事条件とし、キーワード抽出手段10を利用して抽出した先週のトレンドキーワードのトップ5も参考情報として表示している。
Further, the
トレンドキーワードページ100に表示されたトレンドキーワードのいずれか一つが選択されると、選択されたトレンドキーワード用の関連記事紹介ページ110をWebページ生成手段11は生成する。図6は関連記事紹介ページ110を説明する図である。
When any one of the trend keywords displayed on the
関連記事紹介ページ110には、選択されたトレンドキーワードが記述されているブログ記事情報のリストである関連記事紹介リスト115に加え、関連記事紹介リスト115に含ませたブログ記事情報から抽出したキーワードである関連キーワードのキーワードクラウド111が表示される。
The related
ユーザは、関連キーワードのキーワードクラウド111を参照することで、トレンドキーワードが使用されているブログ記事21の中で出現頻度が高い単語を知ることでき、どのような理由でトレンドキーワードが注目されているか理解できる。
By referring to the
図6は、図5のトレンドキーワードページ100で「日曜日」が選択されたときのブログ紹介リストで、関連キーワードのキーワードクラウド111では「映画」と「TV」が強調されて表示されている。すなわち、「日曜日」は、日曜日にTVで放映された映画で注目されていると推測できる。
FIG. 6 is a blog introduction list when “Sunday” is selected on the
なお、図6の関連記事紹介ページ110では、選択されたトレンドキーワードが記述されている最新の5件のブログ記事情報を関連記事紹介リスト115に含め、関連キーワードを抽出するときの対象記事条件を関連記事紹介リスト115に含めるブログ記事情報(Item要素)としている。
In the related
更に、図6の関連記事紹介ページ110の関連記事紹介リスト115に含めるブログ記事情報の件数(図6では5件)は変更できることが望ましい。例えば、本実施の形態では、図6の「MORE」と記載された箇所をクリックすることで、関連記事紹介リスト115に含めるブログ記事21の件数を30件までに増やすことができる。なお、ブログ記事情報の件数を増やしたときは、表示したブログ記事情報(Item要素)すべてが関連キーワードを抽出するときの対象記事条件となる。
Furthermore, it is desirable that the number of blog article information items included in the related
また、図6の関連記事紹介ページで表示される関連記事紹介リスト115では、ブログ記事情報ごとに、ブログ記事情報(Item要素)から得られるブログ記事21のタイトルとブログサイト20の名称、ブログ記事21の要約文と、ブログ記事情報を取得したブログサイト20を評価した結果を示す指標情報114を表示し、更に、関連記事紹介リスト115とは別に、選択されたトレンドキーワードのランキング順位の変遷グラフ112を表示している。なお、関連記事紹介リスト115のブログ記事21のタイトルには、エントリページ130へのリンクが貼られ、また、ブログサイト20の名称には、ブログサイト紹介ページ120へのリンクが貼られている。
Further, in the related
ブログサイト20の指標情報114を表示するのは、ブログ記事21を参照するときのブログサイト20の参考情報をユーザに与えるためである。図7はブログサイト20の指標情報114を説明する図で、本実施の形態において、ブログサイト20の指標情報114として、ブログサイト20で公開しているブログ記事21にリンクを貼っているブログ記事21の数を示す被リンク数情報と、ブログサイト20が更新される頻度を示す更新頻度情報と、ブログサイト20にトレンド解析サーバ1を介してアクセスした回数を示すアクセス回数情報とを表示する。
The reason why the
図7では、被リンク数情報に関しては、被リンク数情報に5段階のレベルを設定し、星型の図形を用いてこのレベルを表示している。更新頻度情報に関しても、更新頻度情報に5段階のレベルを設定し、四角形を用いてこのレベルを表示している。また、アクセス回数情報に関しては、アクセス回数情報はアクセス回数そのものを数字で表示している。 In FIG. 7, regarding the number of linked information, five levels are set in the number of linked information, and this level is displayed using a star-shaped figure. Regarding the update frequency information, five levels are set in the update frequency information, and this level is displayed using a square. Regarding the access count information, the access count information displays the access count itself as a number.
被リンク数情報は、ブログ記事情報を収集したときに同時に収集したリンク情報を解析し、ブログサイト20にリンクしている数をカウントすることで得られる。更新頻度情報は、ブログサイト20から収集したブログ記事情報のItem要素を解析することで、ブログサイト20の更新間隔の平均値を演算することで得られる。更に、アクセス回数情報は、トレンド解析サーバ1を介してブログサイト20にアクセスした回数をブログ解析サーバが記憶することで得られる。
The number of linked information is obtained by analyzing the link information collected at the same time when the blog article information is collected, and counting the number of links to the
上述したブログサイト20の指標情報114をユーザが参照することで、ブログサイト20の人気度などを把握することができ、ブログ記事21を閲覧するときの参考情報とすることができる。
By referring to the
図8は、関連記事紹介ページ110に表示されるトレンドキーワードのランキング順位の変遷グラフ112を説明する図である。変遷グラフ112の縦軸は、トレンドキーワードの出現回数およびトレンドキーワードのランキング順位で、横軸は時間軸である。トレンド解析サーバ1は、単語の出現回数を高い順にソートしてトレンドキーワードを抽出したときに、出現回数とソート結果のランキング順位をトレンドキーワードごとに記憶し、この変遷グラフ112を生成する。
FIG. 8 is a diagram for explaining the trend keyword
選択されたトレンドキーワードのランキング順位の変遷グラフ112を表示するのは、選択されたトレンドキーワードのランキング順位に関する時間的な情報をユーザに提供するためである。変遷グラフ112をユーザが参照することで、いつ頃からこのトレンドキーワードが注目され始めたのかを把握することができる。
The reason why the
関連記事紹介ページ110で表示される関連記事紹介リスト115で表示されるブログサイト20の名称の一つを選択すると、選択されたブログサイト20を紹介するブログサイト紹介ページが表示される。図9は、ブログサイト紹介ページ120を説明するための図である。
When one of the names of the
ブログサイト紹介ページ120には、選択されたブログサイト20を紹介するブログサイト紹介情報122と、ブログサイト20から収集されたブログ記事情報のリストであるサイト記事紹介リスト124と、サイト記事紹介リスト124に含まれるブログ記事情報から抽出したキーワード(以下、ブログサイトキーワード)のキーワードクラウド121と、キーワードクラウド121に含まれるすべてのブログサイトキーワードが記述されているブログ記事情報を紹介するサイト関連リスト125が表示される。
The blog
ブログサイト20を紹介するブログサイト紹介情報122には、紹介するブログサイト20から得られるブログ記事情報のChannel要素220の内容と、上述しているブログサイト20の指標情報114が含まれる。ユーザはこのブログサイト紹介情報122を参照することで、ブログサイト20のテーマや、ブログサイト20の人気度などを知ることができる。
The blog
図9においては、公開日時が新しい順に最大10件のブログ記事情報をサイト記事紹介リスト124に含ませ、ブログ記事情報から抽出したブログ記事21のタイトル、ブログ記事21の公開日時、ブログ記事21の要約を表示している。なお、サイト記事紹介リスト124には、ブログサイト20から取得したブログ記事情報すべてを含ませてもよい。
In FIG. 9, the site
本実施の形態において、ブログサイトキーワードを抽出するとき対象記事条件は、サイト記事紹介リスト124に含ませたブログ記事情報(Item要素221およびChannel要素220)である。
In this embodiment, when extracting a blog site keyword, the target article condition is blog article information (
ユーザは、ブログサイト紹介ページ120のキーワードクラウド121を参照することで、ブログサイト20で記述されている主に記述されているジャンルなどを知ることができる。例えば、図9において、ブログサイトキーワードのキーワードクラウド121では「SFX」と「アニメーション」が強調されて表示されている。すなわち、このブログサイト20では「SFX」や「アニメーション」い関する記事が記述されていると推測できる。
By referring to the
ブログサイト紹介ページ120で表示されるサイト関連リスト125では、上述しているように、キーワードクラウド121に含まれるすべてのブログサイトキーワードが記述されているブログ記事情報が抽出され、抽出されたブログ記事情報の最新の5件のリストが、関連記事紹介ページ110の関連記事紹介リスト115と同じ手法で表示される。
In the site related
ユーザは、このサイト関連リスト125を参照することで、ブログサイト紹介ページ120で紹介したブログサイトのブログ記事21と類似しているブログ記事21を公開している他のブログサイトに関する情報を得ることができる。
The user obtains information on other blog sites that publish the
なお、サイト関連リスト125のリストで表示されているブログサイト20の名称にはブログサイト紹介ページ120へのリンクが貼れ、このリンクを選択することで、サイト関連リスト125のリストで表示されているブログサイト20を紹介するブログサイト紹介ページ120が表示される。
Note that a link to the blog
また、関連記事紹介ページ110で表示される関連記事紹介リスト115、ブログサイト紹介ページ120で表示されるサイト記事紹介リスト124、または、サイト関連リスト125で表示されるブログ記事21のタイトルの一つを選択すると、選択されたブログ記事情報の内容を表示するエントリページ130が表示される。図10は、エントリページ130を説明するための図である。
One of the titles of the related
エントリページ130を設けているのは、関連記事紹介リスト115などで表示されるブログ記事情報の詳細情報をユーザに提供するためである。ブログ記事情報の詳細情報として、エントリページ130には、ブログ記事21の要約文、上述したブログサイト紹介情報122に加え、このブログ記事情報のみを対象記事条件として抽出したキーワード(以下、エントリキーワード)のキーワードクラウド131を表示している。ユーザは、エントリキーワード130のキーワードクラウド131を参照することで、ブログ記事情報で示されるブログ記事21の本文を読まずとも、ブログ記事21の概要を把握することができる。
The
更に、本実施の形態のトレンド解析サーバ1には、アクセス時点の直近で収集したブログ記事情報を提供するために、新着ブログページ140を設けている。ユーザはこの新着ブログページ140を参照することで、アクセスした時点で発生したトピックスに関する情報などを入手することができる。図9の新着ブログボタン123または図10の新着ブログボタン132を選択することで、新着ブログページ140が表示される。
Furthermore, the
図11は、新着ブログページ140を説明するための図である。新着ブログページ140には、アクセスした時点の近々で収集したブログ記事情報(最大30件)のリストである新着記事リスト142と、新着記事リスト142に含ませたブログ記事情報から抽出したキーワード(以下、新着キーワード)のキーワードクラウド141が表示される。
FIG. 11 is a diagram for explaining the
新着キーワードを抽出するとき対象記事条件は、新着記事リスト142に含ませたブログ記事情報(Item要素)で、新着キーワードのキーワードクラウド141には最大10個の新着キーワードを含ませている。新着キーワードのキーワードクラウド141を参照することで、ユーザはアクセスした時点の近々で発生したトピックスに関連する単語などを知ることができる。
When extracting new keywords, the target article condition is blog article information (Item element) included in the new article list 142, and the
なお、新着ブログページ140の新着記事リスト142の表示方法は、関連記事紹介ページ110の関連記事紹介リスト115と同じである。
The display method of the new article list 142 of the
〔トレンド情報解析方法〕
ここから、本発明に係るトレンド情報解析方法について説明する。本発明に係るトレンド情報解析方法は、それぞれ独立して実行する2つの工程を含み、その一つはインターネットからブログ記事情報を収集する工程であるブログ記事情報収集工程であり、他の一つは情報収集工程で収集したブログ記事情報を解析し、解析結果をユーザに提供するためのWebページを生成するWebページ生成工程である。
[Trend information analysis method]
From here, the trend information analysis method according to the present invention will be described. The trend information analysis method according to the present invention includes two steps executed independently of each other, one of which is a blog article information collecting step which is a step of collecting blog article information from the Internet, and the other is This is a web page generation step of analyzing the blog article information collected in the information collection step and generating a web page for providing the analysis result to the user.
図1のネットワークシステムにおいて、ブログ記事情報収集工程およびWebページ生成工程を実行するのは、トレンド解析サーバ1である。ここから、上述しているトレンド解析サーバ1の動作を説明しながら、本発明に係るトレンド情報解析方法に含まれる各工程について説明する。
In the network system of FIG. 1, the
まず、ブログ記事情報を収集するプロセスであるブログ記事情報収集工程について説明する。図12は、ブログ記事情報収集工程の手順を示したフロー図である。 First, the blog article information collection process, which is a process of collecting blog article information, will be described. FIG. 12 is a flowchart showing the procedure of the blog article information collection process.
なお、図12で示した手順はトリガーが成立するごとに繰り返し実行される手順で、トリガーとなる条件は、更新通知pingサーバ3がPULL型で情報提供している場合は、時間条件(ある一定時間ごと)なり、PUSH型で情報提供している場合は、更新通知pingサーバ3からブログ更新情報の更新を通知されたときになる。
The procedure shown in FIG. 12 is a procedure that is repeatedly executed every time a trigger is established. The trigger condition is a time condition (a certain constant when the update
この手順の最初のステップS1は、更新通知pingサーバ3で公開しているブログ更新情報30を取得するステップである。トレンド解析サーバ1のブログ記事情報収集手段12は、トリガーが成立するごとに更新通知pingサーバ3へアクセスする。
The first step S1 of this procedure is a step of obtaining the
次のステップS2は、ブログ更新情報30を取得するステップである。トレンド解析サーバ1のブログ記事情報収集手段12は、トリガーが成立するごとに更新通知pingサーバ3へアクセスし、更新されたブログ更新情報30を更新通知pingサーバ3から取得する。このブログ更新情報30には、一定期間内に公開されたブログ記事21のURLなどが記述されている。
The next step S2 is a step of acquiring the
次のステップS3は、ブログサイト20からブログ記事情報を収集するステップである。このステップでは、トレンド解析サーバ1のブログ記事情報収集手段2は、ステップS2で取得したブログ更新情報30で示されるブログサイト20にアクセスし、ブログサイト20で公開しているメタ情報22とブログ記事21のリンク情報とをブログ記事情報として収集し、収集したブログ記事情報を情報記憶手段13に記憶する。このステップをもって、情報収集工程の手順は終了する。
The next step S3 is a step of collecting blog article information from the
次に、情報収集工程で収集しブログ記事情報を解析し、解析結果をユーザに提供するためのWebページを生成するWebページ生成工程について説明する。図13は、Webページ生成工程をモデル化した図である。 Next, a Web page generation process for generating a Web page for analyzing the blog article information collected in the information collection process and providing the analysis result to the user will be described. FIG. 13 is a diagram modeling the Web page generation process.
図13に示すようにWebページ生成工程には、トレンドキーワード処理S10、関連記事紹介処理S11、ブログサイト紹介処理S12、エントリ処理S13および新着ブログ処理S14を含み、それぞれの処理では処理結果を表示するためのWebページが生成され、このWebページは、図4で示したWebページにそれぞれ対応する。 As shown in FIG. 13, the Web page generation process includes a trend keyword process S10, a related article introduction process S11, a blog site introduction process S12, an entry process S13, and a new blog process S14. In each process, a process result is displayed. Web pages are generated, and the Web pages respectively correspond to the Web pages shown in FIG.
すなわち、トレンドキーワード処理S10で生成されるWebページは、トレンドキーワードを表示するトレンドキーワードページ100で、関連記事紹介処理S11で生成されるWebページは、選択されたトレンドキーワードの関連記事紹介ページ110である。
That is, the Web page generated in the trend keyword process S10 is the
そして、ブログサイト紹介処理S12で生成されるWebページは、ブログサイトを紹介するブログサイト紹介ページ120で、エントリ処理S13で生成されるWebページは、一つのブログ記事21を紹介するエントリページ130で、そして、新着ブログ処理S14で生成されるWebページは、アクセス時点の直近で収集したブログ記事情報に関する情報を提供する新着ブログページ140である。
The web page generated in the blog site introduction process S12 is the blog
Webページ生成工程で最初に実行される処理はトレンドキーワード処理S10で、その次に実行される処理は関連記事紹介処理S11である。関連記事紹介処理S11以降は、ユーザの選択によって決定され、ブログサイト紹介処理S12、エントリ処理S13および新着ブログ処理S14が実行される。 The first process executed in the Web page generation process is the trend keyword process S10, and the next process executed is the related article introduction process S11. The related article introduction process S11 and subsequent steps are determined by the user's selection, and the blog site introduction process S12, the entry process S13, and the new blog process S14 are executed.
なお、各処理に移行する条件は、他のWebページへのリンクが埋め込まれたテキストが選択されたときである。例えば、ブログサイト20の名称が記述されたテキストにはブログサイト紹介ページ120へのリンクが埋め込まれ、このテキストが選択されると、ブログサイト紹介処理S12が実行されブログサイト紹介ページ120が生成される。
The condition for shifting to each process is when a text in which a link to another Web page is embedded is selected. For example, the text describing the name of the
Webページ生成工程に含まれる各処理で生成されるWebページには、上述しているように、異なる対象記事条件で抽出されたキーワードのキーワードクラウドが表示される。 As described above, a keyword cloud of keywords extracted under different target article conditions is displayed on the Web page generated by each process included in the Web page generation process.
図14は、キーワードを抽出する処理の概略手順を説明する図である。Webページ生成工程の各処理で生成されるWebページに含まれるキーワードは図14の手順で抽出される。 FIG. 14 is a diagram for explaining a schematic procedure of processing for extracting a keyword. Keywords included in the Web page generated in each process of the Web page generation process are extracted by the procedure shown in FIG.
この手順の最初のステップS20は、キーワードを抽出するときに利用されるブログ記事情報を定める対象記事条件が指定されるステップである。このステップで指定される対象記事条件は処理ごとによって異なり、異なる対象記事条件に適合したブログ記事情報からキーワードを抽出することで、各処理で異なる情報をユーザに伝達することができる。 The first step S20 of this procedure is a step in which target article conditions that define blog article information used when extracting keywords are specified. The target article condition specified in this step varies depending on the process, and by extracting a keyword from the blog article information adapted to different target article conditions, different information can be transmitted to the user in each process.
図15は、キーワードの対象記事条件の一例を示した図である。例えば、図15の関連記事紹介処理S11では、選択されたトレンドキーワードを含む最新の最大5件のブログ記事情報が対象記事条件になるため、抽出されたキーワードのキーワードクラウドを参照することで、選択されたトレンドキーワードが注目されている理由を得ることができる。 FIG. 15 is a diagram showing an example of target article conditions for keywords. For example, in the related article introduction process S11 of FIG. 15, since the latest five blog article information including the selected trend keyword becomes the target article condition, the selection is made by referring to the keyword cloud of the extracted keyword. The reason why the trend keyword that has been selected is attracting attention can be obtained.
また、ブログサイト紹介処理S12では、選択されたブログサイトの最新の最大30件のブログ記事情報が対象記事条件になるため、抽出されたキーワードのキーワードクラウドを参照することで、選択されたブログサイトの興味分野など知ることができる。 In the blog site introduction process S12, since the latest 30 blog article information of the selected blog site is the target article condition, the selected blog site is referred to by referring to the keyword cloud of the extracted keywords. You can know the areas of interest.
次のステップS21は、ステップS20で指定された対象記事条件に基づき、キーワードクラウドに含ませるキーワード抽出されるステップである。上述しているように、各処理で対象記事条件は異なるため、このステップで抽出されるキーワードは処理ごとに異なる。 The next step S21 is a step of extracting keywords to be included in the keyword cloud based on the target article condition specified in step S20. As described above, since the target article condition is different in each process, the keyword extracted in this step is different for each process.
次のステップS22は、ステップS21で抽出したキーワードとブログ記事21のリストを表示するWebページを生成するステップである。ステップS21で抽出されたキーワードは、出現頻度の高いキーワードの文字サイズを大きくするなどしたキーワードクラウドで表示される。このステップをもって、キーワードを抽出する処理の概略手順は終了する。
The next step S22 is a step of generating a Web page that displays the keyword extracted in step S21 and the list of
なお、関連記事紹介処理S11、ブログサイト紹介処理S12および新着ブログ処理S14で生成されるWebページに、ブログサイトを評価した結果である指標情報114を含ませることで、ブログサイトの人気度などの情報をユーザに与えることができる。
In addition, by including the
更に、関連記事紹介処理S11で、選択されたトレンドキーワードのランキングの変遷を示し、図8に図示したような変遷グラフ112を表示することで、いつ頃からこのトレンドキーワードが注目を浴びているかユーザは把握することができる。
Further, in the related article introduction process S11, the transition of the ranking of the selected trend keyword is shown, and the
1 トレンド解析サーバ
10 キーワード抽出手段
11 Webページ生成手段
12 ブログ記事情報収集手段
13 情報記憶手段
2 ブログ運営サーバ
20 ブログサイト
21 ブログ記事
22 メタ情報
3 更新通知pingサーバ
30 ブログ更新情報
4 パーソナルコンピュータ
100 トレンドキーワードページ
110 関連記事紹介ページ
120 ブログサイト紹介ページ
130 エントリページ
140 新着ブログページ
DESCRIPTION OF
Claims (24)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006050634A JP5092252B2 (en) | 2006-02-27 | 2006-02-27 | Trend analysis server and trend analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006050634A JP5092252B2 (en) | 2006-02-27 | 2006-02-27 | Trend analysis server and trend analysis method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007233438A JP2007233438A (en) | 2007-09-13 |
JP5092252B2 true JP5092252B2 (en) | 2012-12-05 |
Family
ID=38554014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006050634A Expired - Fee Related JP5092252B2 (en) | 2006-02-27 | 2006-02-27 | Trend analysis server and trend analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5092252B2 (en) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146031A (en) * | 2007-10-19 | 2010-07-01 | Nec Corp | Information analysis device, information analysis method and information analyzing program |
US8572112B2 (en) * | 2007-11-02 | 2013-10-29 | Microsoft Corporation | Syndicating search queries using web advertising |
JP2009122337A (en) * | 2007-11-14 | 2009-06-04 | Dainippon Printing Co Ltd | Quiz creating device |
GB2459476A (en) * | 2008-04-23 | 2009-10-28 | British Telecomm | Classification of posts for prioritizing or grouping comments. |
GB2463515A (en) | 2008-04-23 | 2010-03-24 | British Telecomm | Classification of online posts using keyword clusters derived from existing posts |
EP2136301A1 (en) * | 2008-06-20 | 2009-12-23 | NTT DoCoMo, Inc. | Method and apparatus for visualising a tag cloud |
JP5068728B2 (en) * | 2008-11-06 | 2012-11-07 | ヤフー株式会社 | Related blog presentation device, method and program |
JP2010191864A (en) * | 2009-02-20 | 2010-09-02 | Nec Corp | Automatic task generation system, and method and program for the same |
US10282373B2 (en) * | 2009-04-17 | 2019-05-07 | Excalibur Ip, Llc | Subject-based vitality |
US9177346B2 (en) * | 2010-07-01 | 2015-11-03 | Facebook, Inc. | Facilitating interaction among users of a social network |
CN102402563A (en) * | 2010-09-19 | 2012-04-04 | 腾讯科技(深圳)有限公司 | Network information screening method and device |
JP6173990B2 (en) | 2014-09-16 | 2017-08-02 | 株式会社東芝 | Search support apparatus, method and program |
JP5818391B2 (en) * | 2014-10-29 | 2015-11-18 | シャープ株式会社 | Information processing system and electronic device |
JP2016091487A (en) * | 2014-11-11 | 2016-05-23 | セイコーエプソン株式会社 | Display device and display control method |
JP6324326B2 (en) * | 2015-01-23 | 2018-05-16 | ヤフー株式会社 | Information processing apparatus, information processing method, and information processing program |
US10459914B2 (en) * | 2015-09-18 | 2019-10-29 | Facebook, Inc. | Detecting key topics on online social networks |
JP6855834B2 (en) * | 2017-02-23 | 2021-04-07 | カシオ計算機株式会社 | Advertisement creation device, advertisement creation support method and program |
JP7451917B2 (en) * | 2019-09-26 | 2024-03-19 | 株式会社Jvcケンウッド | Information provision device, information provision method and program |
JP7034459B1 (en) | 2021-06-14 | 2022-03-14 | 株式会社Insight science | Information processing equipment, information processing systems, and programs |
CN113592225B (en) * | 2021-06-24 | 2023-12-01 | 浙江清朗科技有限公司 | Dynamic acquisition method for basic staff thinking |
WO2023163201A1 (en) * | 2022-02-28 | 2023-08-31 | ククレブ・アドバイザーズ株式会社 | Information analysis device, storage medium, and information analysis program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004348554A (en) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | Retrieval keyword information providing device, method, and program for same |
JP2005202895A (en) * | 2004-01-19 | 2005-07-28 | Hatena:Kk | Information display method, central processing unit, and computer program |
US7596571B2 (en) * | 2004-06-30 | 2009-09-29 | Technorati, Inc. | Ecosystem method of aggregation and search and related techniques |
-
2006
- 2006-02-27 JP JP2006050634A patent/JP5092252B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007233438A (en) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5092252B2 (en) | Trend analysis server and trend analysis method | |
US20220164401A1 (en) | Systems and methods for dynamically creating hyperlinks associated with relevant multimedia content | |
Bernstein et al. | Eddi: interactive topic-based browsing of social status streams | |
JP4185059B2 (en) | Trend prediction apparatus and trend prediction method | |
JP4587236B2 (en) | Information search apparatus, information search method, and program | |
JP4940399B2 (en) | Advertisement distribution apparatus and program | |
US8965869B2 (en) | Systems and methods for generating a web page based on search term popularity data | |
US8812505B2 (en) | Method for recommending best information in real time by appropriately obtaining gist of web page and user's preference | |
US20070255754A1 (en) | Recording, generation, storage and visual presentation of user activity metadata for web page documents | |
WO2007090064A2 (en) | Displaying facts on a linear graph | |
US20200050678A1 (en) | Detecting topical similarities in knowledge databases | |
Strzelecki et al. | Direct answers in Google search results | |
JP2006099341A (en) | Update history generation device and program | |
JP5952756B2 (en) | Prediction server, program and method for predicting future number of comments in prediction target content | |
JP5964149B2 (en) | Apparatus and program for identifying co-occurrence words | |
JP4640554B2 (en) | Server apparatus, information processing method, and program | |
GB2592884A (en) | System and method for enabling a search platform to users | |
JP2009015589A (en) | System and program for presenting related document | |
US20150193444A1 (en) | System and method to determine social relevance of Internet content | |
JP2008117134A (en) | Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program | |
JP4853915B2 (en) | Search system | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
JP4417497B2 (en) | Information retrieval apparatus and storage medium storing program | |
JP2011018152A (en) | Information presentation device, information presentation method, and program | |
US20100287136A1 (en) | Method and system for the recognition and tracking of entities as they become famous |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120821 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120903 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5092252 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |