JP5022946B2 - Propagation structure extraction device and method, program, and computer-readable recording medium - Google Patents

Propagation structure extraction device and method, program, and computer-readable recording medium Download PDF

Info

Publication number
JP5022946B2
JP5022946B2 JP2008052152A JP2008052152A JP5022946B2 JP 5022946 B2 JP5022946 B2 JP 5022946B2 JP 2008052152 A JP2008052152 A JP 2008052152A JP 2008052152 A JP2008052152 A JP 2008052152A JP 5022946 B2 JP5022946 B2 JP 5022946B2
Authority
JP
Japan
Prior art keywords
article
blog
comment
link information
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008052152A
Other languages
Japanese (ja)
Other versions
JP2009211281A (en
Inventor
晴美 川島
章裕 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008052152A priority Critical patent/JP5022946B2/en
Publication of JP2009211281A publication Critical patent/JP2009211281A/en
Application granted granted Critical
Publication of JP5022946B2 publication Critical patent/JP5022946B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に係り、特に、インターネット上のブログやソーシャルネットワーキングサービス(SNS)において、個人が発信する記事がどのように閲覧者に影響を与えたか、あるいはどのように影響を受けて発信されたのか、伝播構造を提示することにより把握可能とする伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体関する。   The present invention relates to a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium. In particular, in a blog or social networking service (SNS) on the Internet, how an article sent by an individual affects a viewer. The present invention relates to a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium that can be grasped by presenting a propagation structure.

詳しくは、特定のキーワードを含む記事が読み手に影響を与えた伝播構造を、記事と該記事が含まれるブログサイトの他記事に送信されたコメント及びトラックバックを分析することにより抽出する伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体に関する。   Specifically, a propagation structure extraction device that extracts a propagation structure that an article including a specific keyword has influenced readers by analyzing an article and comments and trackbacks transmitted to other articles in the blog site that includes the article. And a method, a program, and a computer-readable recording medium.

ブログサービスやSNSの普及により、誰でも容易に情報発信を行えるようになってきている。発信される記事には、日々の日常生活ついての記載も多く、製品やサービスを利用した体験・評価なども含まれている。発信された記事に対して閲覧者がコメントを付与することで、記事に対する感想を発信者に知らせることができる。また、ブログサービスにおいては、ある記事を参考にして記事を書いた場合にトラックバック機能により参考にした記事へ通知をすることができる。そこで、製品やサービスについてのクチコミ情報が記載された記事に付与されたコメントやトラックバックを分析することにより、クチコミが閲覧者に与えた影響の伝播経路や範囲などを抽出することが可能となる。   With the widespread use of blog services and SNSs, anyone can easily send information. The published articles often contain descriptions of daily life and include experiences and evaluations using products and services. By giving a comment to the sent article, the viewer can be notified of the impression of the article. In the blog service, when an article is written with reference to an article, the trackback function can notify the article referred to. Therefore, by analyzing comments and trackbacks given to articles in which word-of-mouth information about products and services is described, it is possible to extract the propagation path and range of the influence of word-of-mouth on viewers.

従来技術として、ブログコミュニティを対象に、コメント、トラックバックの情報からコミュニティに関する情報を収集する技術がある(例えば、特許文献1参照)。
特開2007−80103号公報
As a conventional technique, there is a technique for collecting information on a community from comments and trackback information for a blog community (see, for example, Patent Document 1).
JP 2007-80103 A

しかしながら、上記の従来の技術は、コメント送信元のブログに属する記事の収集、トラックバック送信元の記事の収集を順次実施するものであり、収集したデータから、記事からの伝播やブログ間の繋がりを抽出し、可視化する手法について考慮されていない。そのため、ユーザが指定した記事の影響について、記事を順に辿りながら伝播構造を抽出する必要があり、伝播構造を表示するまでに時間が掛かるという問題がある。   However, the above conventional technology sequentially collects articles belonging to the blog of the comment sender and collects articles of the trackback sender, and from the collected data, it propagates from the article and links between the blogs. It does not consider the method of extracting and visualizing. Therefore, it is necessary to extract the propagation structure while sequentially tracing the articles with respect to the influence of the article specified by the user, and there is a problem that it takes time to display the propagation structure.

また、普段から親しくコミュニケーションをしているユーザ間においては、影響を受けた記事に必ずしもコメント送信やトラックバック送信を行わない場合がある。例えば、ユーザAが「○○を購入してみたけれど、とっても使い心地がよくってお勧め!」といった○○という商品についての記事を掲載し、それを閲覧したユーザBが後日自分のブログに「先日、友人が紹介していた○○を買っちゃいました。」といった記事を書いた場合が考えられる。この場合、ユーザAの○○商品についての記事にユーザBからのコメント・トラックバックがなくても、別の記事に対してコメントやトラックバックを送信していれば、ユーザAとユーザBがコミュニケーションしていることを発見することができ、さらに、特定のキーワード○○が両者の記事に含まれていることが分かると、どちらかの記事から影響を受けた可能性を発見することができる。   In addition, among users who are in close communication with each other, comments and trackbacks may not always be sent to affected articles. For example, user A posted an article about a product called XX such as “I bought XX, but it ’s very comfortable and recommended!” And user B who viewed it posted it on his blog at a later date. You may have written an article such as “I bought a XX that my friend introduced the other day”. In this case, even if there is no comment / trackback from the user B in the article about the user A's XX product, the user A and the user B communicate with each other as long as a comment or trackback is transmitted to another article. In addition, if it is found that a specific keyword XX is included in both articles, the possibility of being influenced by either article can be discovered.

図16の(A)にブログサイト、記事、コメント、トラックバックの関係の例を示している。コメントは記事に対して送信される情報で、コメント送信者はブログサイトを持っている場合(ユーザBからユーザAの記事cへのコメント)と、ブログサイトを持っていない場合、あるいは、ブログサイトのURLを明記しないでコメントする場合(ユーザDからユーザAの記事dへのコメント)がある。トラックバックは記事から記事に対して送信される情報であり、ユーザCの記事aからユーザAの記事dへ送信された例が示されている。コメントはブログサイトをもっていなくとも送信できるが、トラックバックはブログサイトを持っているユーザ間でのみ発生する。   FIG. 16A shows an example of the relationship between a blog site, an article, a comment, and a trackback. A comment is information transmitted to an article, and a comment sender has a blog site (a comment from user B to user A's article c), a blog site, or a blog site There is a case of commenting without clearly specifying the URL (comment from user D to article d of user A). The trackback is information transmitted from the article to the article, and an example is shown in which the trackback is transmitted from the article C of the user C to the article d of the user A. Comments can be sent without a blog site, but trackbacks occur only between users who have blog sites.

図16(A)のような関係があった場合に、ユーザAの記事dから伝播構造を図示した例を図16(B)に示している。コメント送信を実線の矢印、トラックバック送信を点線の矢印で、キーワード○○を含む場合は梨地で示している。ここで、記事aのノードとユーザCのブログサイトのノードが別々に描かれている点に着目する。実際には記事aは、ユーザCのブログサイトに含まれる記事であるから、1つのノードとして表示されるのが望ましい。しかし、ユーザCのブログサイトとしてのみ表示すると、トラックバックを送信した記事Cの存在が隠れてしまう。トラックバックは記事間の繋がりとして大変重要な情報であるから、トラックバックを送信した記事をノードとして表示し、コメント送信を付加情報として追加する方が望ましい。コメントとトラックバックの送信者が同一であるかを調べるためには、コメント情報とトラックバック情報にブログサイトのURL等を保存し、その値が同一であるかを調べる必要がある。   FIG. 16B shows an example illustrating the propagation structure from the article d of the user A when there is a relationship as shown in FIG. Comment transmission is indicated by a solid line arrow, trackback transmission is indicated by a dotted line arrow, and keywords XX are indicated by satin. Here, attention is paid to the point that the node of the article a and the node of the blog site of the user C are drawn separately. Actually, since the article a is an article included in the blog site of the user C, it is desirable to display it as one node. However, if it is displayed only as the blog site of the user C, the existence of the article C that transmitted the trackback is hidden. Since trackback is very important information as a link between articles, it is desirable to display the article that transmitted the trackback as a node and add comment transmission as additional information. In order to check whether the comment and the trackback sender are the same, it is necessary to store the URL of the blog site in the comment information and the trackback information and check whether the values are the same.

また、コメント送信者のURLが不明でコメント送信者の名前が分かっている場合、同じブログサイト内においては、コメント送信者名が同じであれば同一人物として考えてよく、この点についても考慮してグラフを作成する必要がある。   Also, if the URL of the comment sender is unknown and the name of the comment sender is known, it may be considered as the same person within the same blog site as long as the comment sender name is the same. It is necessary to create a graph.

さらに、ユーザBは普段からユーザAとコミュニケーションがあり、記事fにおいて、キーワード○○について記載していても、記事dに対してコメントやトラックバック送信を行っていないため、繋がりを見ることができないという問題がある。   Furthermore, the user B usually communicates with the user A, and even if the keyword f is described in the article f, the connection cannot be seen because the comment or the trackback transmission is not performed on the article d. There's a problem.

本発明は、上記の点に鑑みなされたもので、ユーザから指定されたキーワードが含まれている記事の表示と含まれていない記事の表示を区別でき、また、記事からだけのつながりでは見つけることのできないユーザ間の繋がりを表示することが可能な伝播構造抽出装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体を提供することを目的とする。   The present invention has been made in view of the above points, and can distinguish between the display of an article that includes a keyword specified by the user and the display of an article that is not included, and can be found only by connection from an article. It is an object of the present invention to provide a propagation structure extraction apparatus and method, a program, and a computer-readable recording medium capable of displaying a connection between users who cannot perform the operation.

図1は、本発明の原理構成図である。   FIG. 1 is a principle configuration diagram of the present invention.

本発明(請求項1)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段11に格納し
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段12に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段12に格納する記事解析手段30と、
記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段40と、
記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段13−1と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納するブログリンク情報抽出手段13−2と、
ある一つの記事を起点とした伝播構造をリンク情報記憶手段14から取得して表示する記事伝播表示手段15−1と、
ブログサイトを基点とした伝播構造をリンク情報記憶手段14から取得して表示するブログ伝播表示手段15−2と、
記事伝播表示手段15−1からブログ伝播表示手段15−2に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段15−3と、
を有し、
記事リンク情報抽出手段13−1は、
コメント・トラックバック記憶手段12に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
生成した全ての記事リンク情報をリンク情報記憶手段14に格納する手段と、
を有する
The present invention (Claim 1) is a propagation structure extraction device that analyzes the influence of a blog on the Internet or an article of a social networking service on a viewer,
Analyzing the collected articles and assigning an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article and storing it in the article information storage means 11 ;
When a comment is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, at least one of a comment sender name or a comment sender URL, If there is a comment sender URL, it is checked whether it is the URL of the blog site. If it is the URL of the blog site, a blog identifier uniquely identifying the blog site is stored in the comment / trackback storage means 12 as comment information. ,
When a trackback is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, an article identifier of a trackback transmission source, a blog identifier, an article URL, a blog Article analysis means 30 for storing at least one piece of information that can be acquired in a URL or blog title in the comment / trackback storage means 12 as trackback information ;
A recursive collection unit that identifies a blog site as a transmission source when a comment is transmitted to an article, collects articles belonging to the blog site, and collects an article as a trackback source when a trackback is transmitted 40,
Article link information extracting means 13-1 for storing a comment from an article or a link by link back (link information) in a link information storage means;
A blog link information extracting unit 13-2 that collects articles belonging to the same blog site and extracts a link (link information) by a comment or a trackback from the blog site and stores the link information in the link information storage unit 14;
Article propagation display means 15-1 for obtaining and displaying a propagation structure starting from a certain article from the link information storage means 14,
Blog propagation display means 15-2 for obtaining and displaying the propagation structure based on the blog site from the link information storage means 14,
When switching from the article propagation display means 15-1 to the blog propagation display means 15-2, a switching display means 15-3 starting from a blog site including an article starting from the article propagation display means;
Have
The article link information extracting means 13-1
Based on the trackback information stored in the comment / trackback storage means 12, article link information is generated with the trackback received article as the reference article, the trackback transmission article as the connected article, and the comment information set transmitted to the reference article If the blog identifier of the comment sender is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information. If not included, the article consists of the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name and / or the URL of the comment sender, and the number of comments. Means for generating link information;
If the blog URL is unknown, the comment information is determined to be the same if the comment sender name is the same, and the number of comments is added to the existing article link information. Means for generating;
Means for storing all the generated article link information in the link information storage means 14;
Have

また、本発明(請求項)は、記事伝播表示手段15−1において、
起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
Further, the present invention (Claim 2 ) is the article propagation display means 15-1,
When the starting article and the number of steps to follow the comment or trackback are input, the article link information in the link information storage means is referenced, and the article link information is sequentially searched until the input number of stages is reached, and all the searched items are searched. The article link information includes means for generating a graph representing propagation from the article and displaying the case where the node includes a specific keyword and the case where the node does not include the specific keyword.

本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段11に格納し
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段12に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段12に格納する記事解析手段30と、
記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段40と、
記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段13−1と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段14に格納するブログリンク情報抽出手段13−2と、
ある一つの記事を起点とした伝播構造をリンク情報記憶手段14から取得して表示する記事伝播表示手段15−1と、
ブログサイトを基点とした伝播構造をリンク情報記憶手段14から取得して表示するブログ伝播表示手段15−2と、
記事伝播表示手段15−1からブログ伝播表示手段15−2に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段15−3と、
を有し、
ブログリンク情報抽出手段13−2は、
コメント・トラックバック記憶手段12に格納されたコメント情報とトラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
生成した全てのブログリンク情報をリンク情報記憶手段14に格納する手段と
を有する
The present invention (Claim 3 ) is a propagation structure extraction device for analyzing the influence of a blog on the Internet or an article of a social networking service on a viewer,
Analyzing the collected articles and assigning an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article and storing it in the article information storage means 11 ;
When a comment is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, at least one of a comment sender name or a comment sender URL, If there is a comment sender URL, it is checked whether it is the URL of the blog site. If it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored in the comment / trackback storage means 12 as comment information. ,
When a trackback is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, an article identifier of a trackback transmission source, a blog identifier, an article URL, a blog Article analysis means 30 for storing at least one piece of information that can be acquired in a URL or blog title in the comment / trackback storage means 12 as trackback information ;
A recursive collection unit that identifies a blog site as a transmission source when a comment is transmitted to an article, collects articles belonging to the blog site, and collects an article as a trackback source when a trackback is transmitted 40,
Article link information extracting means 13-1 for storing a comment from an article or a link by link back (link information) in a link information storage means;
A blog link information extracting unit 13-2 that collects articles belonging to the same blog site and extracts a link (link information) by a comment or a trackback from the blog site and stores the link information in the link information storage unit 14;
Article propagation display means 15-1 for obtaining and displaying a propagation structure starting from a certain article from the link information storage means 14,
Blog propagation display means 15-2 for obtaining and displaying the propagation structure based on the blog site from the link information storage means 14,
When switching from the article propagation display means 15-1 to the blog propagation display means 15-2, a switching display means 15-3 starting from a blog site including an article starting from the article propagation display means;
Have
The blog link information extracting means 13-2
Based on the comment information stored in the comment / trackback storage means 12 and the blog identifier of the trackback information, two blog identifiers having at least one connection between the comment and the trackback, the number of comments transmitted and received, the number of tracksback transmitted and received The number of comments is generated as blog link information, and the comment sender's blog identifier is unknown. If there is blog link information with the same blog identifier that received the comment and the same comment sender name, the existing blog link information A means of adding comments and generating new blog link information if it does not exist,
Means for storing all the generated blog link information in the link information storage means 14 ;
Have

また、本発明(請求項)は、ブログ伝播表示手段15−2において、
起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、リンク情報記憶手段14のブログリンク情報を参照し、入力された段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む。
Further, the present invention (Claim 4 ) is provided in the blog propagation display means 15-2.
When the starting blog and the number of steps to follow the comment or trackback are input, the blog link information in the link information storage means 14 is referred to, and the blog link information is sequentially searched until the input number of steps is reached. The blog link information includes means for generating a graph in which the blog is a node and the connection between the blogs is an edge, and displaying the case where the node includes a specific keyword and the case where the node does not include the specific keyword.

図2は、本発明の原理を説明するための図である。   FIG. 2 is a diagram for explaining the principle of the present invention.

本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し(ステップ1)
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップ(ステップ2)と、
再帰収集手段が、記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップ(ステップ3)と、
記事リンク情報抽出手段が、記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップ(ステップ4)と
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段に格納するブログリンク情報抽出ステップ(ステップ)と、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造をリンク情報記憶手段から取得して表示する記事伝播表示ステップ(ステップ6)と、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造をリンク情報記憶手段から取得して表示するブログ伝播表示ステップ(ステップ7)と、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップ(ステップ8)と、
を行い、
記事リンク情報抽出ステップ(ステップ4)において、
コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成するステップと、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成するステップと、
生成した全ての記事リンク情報をリンク情報記憶手段に格納するステップと、
を行う
本発明(請求項)は、インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し(ステップ1)
記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップ(ステップ2)と、
再帰収集手段が、記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップ(ステップ3)と、
記事リンク情報抽出手段が、記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップ(ステップ4)と
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、リンク情報記憶手段に格納するブログリンク情報抽出ステップ(ステップ)と、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造をリンク情報記憶手段から取得して表示する記事伝播表示ステップ(ステップ6)と、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造をリンク情報記憶手段から取得して表示するブログ伝播表示ステップ(ステップ7)と、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップ(ステップ8)と、
を行い、
ブログリンク情報抽出ステップ(ステップ5)において、
コメント・トラックバック記憶手段に格納されたコメント情報とトラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成するステップと、
生成した全てのブログリンク情報をリンク情報記憶手段に格納するステップと、
を行う
The present invention (Claim 5 ) is a propagation structure extraction method for analyzing the influence of a blog on the Internet or an article of a social networking service on a viewer,
The article analysis means analyzes the collected articles and assigns an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article, and stores the article identifier in the article information storage means. (step 1),
When a comment is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, at least one of a comment sender name or a comment sender URL, If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means,
When a trackback is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, an article identifier of a trackback transmission source, a blog identifier, an article URL, a blog Article analysis step (step 2) of storing one or more pieces of information that can be acquired in a URL or blog title as trackback information in the comment / trackback storage means;
When a comment is transmitted to an article, the recursive collection means identifies a blog site as a transmission source, collects articles belonging to the blog site, and when a trackback is transmitted, selects the article as the trackback source. A recursive collection step (step 3) to collect;
Article link information extraction means stores an article link information extraction step (step 4) in which a link from the article or a link by link back (link information) is stored in the link information storage means ;
The blogs link information extraction means, summarizes the articles belonging to the same blog site to extract the connection (link information) by the comment or trackback from the blog site, blog link information extraction step to be stored in the link information storage means (step 5 )When,
An article propagation display step (step 6) in which the article propagation display means acquires and displays the propagation structure starting from a certain article from the link information storage means;
A blog propagation display step (step 7) in which the blog propagation display means acquires and displays the propagation structure based on the blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step (step 8) starting from the blog site including the article starting from the article propagation displaying step;
And
In the article link information extraction step (step 4),
Based on the trackback information stored in the comment / trackback storage means, the article link information is generated with the trackback received article as the reference article, the trackback transmission article as the connected article, and the comment information set transmitted to the reference article. If the comment sender's blog identifier is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information and included in the article link information. If not, an article link comprising the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name or the URL of the comment sender, or both, and the number of comments. Generating information;
If the blog URL is unknown, the comment information is determined to be the same if the comment sender name is the same, and the number of comments is added to the existing article link information. Generating step;
Storing all the generated article link information in the link information storage means;
Do.
The present invention (Claim 6 ) is a propagation structure extraction method for analyzing the influence of a blog on the Internet or an article of a social networking service on a viewer,
The article analysis means analyzes the collected articles and assigns an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article, and stores the article identifier in the article information storage means. (step 1),
When a comment is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, at least one of a comment sender name or a comment sender URL, If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means,
When a trackback is transmitted to an article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies a blog site to which the article belongs, an article identifier of a trackback transmission source, a blog identifier, an article URL, a blog Article analysis step (step 2) of storing one or more pieces of information that can be acquired in a URL or blog title as trackback information in the comment / trackback storage means;
When a comment is transmitted to an article, the recursive collection means identifies a blog site as a transmission source, collects articles belonging to the blog site, and when a trackback is transmitted, selects the article as the trackback source. A recursive collection step (step 3) to collect;
Article link information extraction means stores an article link information extraction step (step 4) in which a link from the article or a link by link back (link information) is stored in the link information storage means ;
The blogs link information extraction means, summarizes the articles belonging to the same blog site to extract the connection (link information) by the comment or trackback from the blog site, blog link information extraction step to be stored in the link information storage means (step 5 )When,
An article propagation display step (step 6) in which the article propagation display means acquires and displays the propagation structure starting from a certain article from the link information storage means;
A blog propagation display step (step 7) in which the blog propagation display means acquires and displays the propagation structure based on the blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step (step 8) starting from the blog site including the article starting from the article propagation displaying step;
And
In the blog link information extraction step (step 5),
Based on the comment information stored in the comment / trackback storage means and the blog identifier of the trackback information, two blog identifiers having at least one connection between the comment and the trackback, the number of comments transmitted and received, the number of tracksback transmitted and received Is generated as blog link information, and comment information whose blog identifier of the comment sender is unknown will be commented on existing blog link information if there is blog link information with the same blog identifier that received the comment and the same comment sender name Adding a number and generating new blog link information if it does not exist,
Storing all the generated blog link information in the link information storage means;
Do.

本発明(請求項)は、請求項1乃至のいずれか1項に記載の伝播構造抽出装置を構成する各手段としてコンピュータを機能させるための伝播構造抽出プログラムである。 The present invention (Claim 7 ) is a propagation structure extraction program for causing a computer to function as each means constituting the propagation structure extraction apparatus according to any one of Claims 1 to 4 .

本発明(請求項)は、請求項記載の伝播構造抽出プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体である。 The present invention (Claim 8 ) is a computer-readable recording medium in which the propagation structure extraction program according to Claim 7 is stored.

上述のように、本発明では、予め記事に対して送信されたコメント・トラックバック情報から記事リンク情報を抽出し、ブログ間のコメント・トラックバック情報を纏めたブログリンク情報を抽出し、ユーザから特定のキーワードを含む記事が指定された際に、該記事と直接的繋がり(該記事にトラックバックを送信している記事や、コメントを送信している送信者との繋がり)を一覧するグラフを素早く表示することが可能となる。   As described above, in the present invention, the article link information is extracted from the comment / trackback information transmitted in advance with respect to the article, the blog link information that summarizes the comments / trackback information between the blogs is extracted, and the user specifies the specific information. When an article that includes a keyword is specified, a graph that lists direct links to the article (articles that send trackbacks to the article and connections to senders who send comments) is quickly displayed. It becomes possible.

また、記事に直接コメントやトラックバックをしていない場合でも、ブログ間のリンク情報とキーワードの有無を同時に表示することにより、伝播の概観を掴むことができ、記事からの伝播では発見できない繋がりを見つけることが可能となる。   Even if you don't comment or track back directly on an article, you can get an overview of propagation by displaying the link information between blogs and the presence of keywords at the same time, and find connections that can't be found by propagation from articles It becomes possible.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図3は、本発明の一実施の形態における伝播構造抽出装置の構成を示す。   FIG. 3 shows the configuration of the propagation structure extraction apparatus according to an embodiment of the present invention.

伝播構造抽出装置は、記事情報蓄積部11、コメント・トラックバック蓄積部12、リンク情報抽出部13、リンク情報蓄積部14、伝播表示部15、検索部16、記事収集部20、記事解析部30、再帰収集指示部40、インタフェース部50から構成される。   The propagation structure extraction device includes an article information storage unit 11, a comment / trackback storage unit 12, a link information extraction unit 13, a link information storage unit 14, a propagation display unit 15, a search unit 16, an article collection unit 20, an article analysis unit 30, A recursive collection instruction unit 40 and an interface unit 50 are included.

以下、図4のシーケンスチャートに沿って、伝播構造抽出装置の各構成要素の動作を説明する。   Hereinafter, the operation of each component of the propagation structure extracting apparatus will be described with reference to the sequence chart of FIG.

記事収集部20は、収集するための記事URLのリストを入力とし、記事URLリストに記載された記事URLを順次収集し(ステップ101)、収集したHTMLテキストを出力する(ステップ102)。   The article collection unit 20 receives a list of article URLs to be collected, sequentially collects article URLs described in the article URL list (step 101), and outputs the collected HTML text (step 102).

記事解析部30は、記事収集部20から受け取ったHTMLテキストを解析し、記事を一意に識別する記事識別子と記事を含むブログサイトを一意に識別するブログ識別子を該記事に付与して、記事情報蓄積部11に格納する(ステップ103)。また、コメントが送信されている場合には、コメント情報をコメント・トラックバック蓄積部12に蓄積し、トラックバックが送信されている場合には、トラックバック情報をコメント・トラックバック蓄積部12に蓄積する(ステップ104)。解析した結果のコメント送信元のURL及びトラックバック元の記事URLを再帰収集指示部40に送る(ステップ105)。   The article analysis unit 30 analyzes the HTML text received from the article collection unit 20, and assigns an article identifier that uniquely identifies the article and a blog identifier that uniquely identifies the blog site that includes the article to the article. Store in the storage unit 11 (step 103). If a comment is transmitted, the comment information is stored in the comment / trackback storage unit 12. If a trackback is transmitted, the trackback information is stored in the comment / trackback storage unit 12 (step 104). ). The URL of the comment transmission source and the article URL of the trackback source as a result of analysis are sent to the recursive collection instruction unit 40 (step 105).

再帰収集指示部40は、コメント送信元のURLを受け取ると、コメント送信元ブログの更新RSSファイルを取得し(ステップ106)、更新RSSに記載されている記事URLリストを記事収集部20へ送る(ステップ107)。更新RSSファイルは、ブログサイトに特有のURLを持ち、常に最新の記事N件のURLとその概要を記載しているファイルである。また、トラックバック送信元の記事URLを受け取ると、その記事URLを記事収集部20に送る(ステップ108)。   When the recursive collection instruction unit 40 receives the URL of the comment transmission source, the recursive collection instruction unit 40 acquires an updated RSS file of the comment transmission source blog (step 106), and sends the article URL list described in the update RSS to the article collection unit 20 ( Step 107). The updated RSS file has a URL unique to the blog site, and is a file that always describes the URL of the latest N articles and an outline thereof. When the article URL of the trackback transmission source is received, the article URL is sent to the article collection unit 20 (step 108).

記事収集部20、記事解析部30、再帰収集指示部40では、ユーザから入力された記事URLリストの記事を再帰回数0回とし、予め設定した回数(K回)まで再帰収集を行うよう制御する。すなわち、記事収集部20では、ユーザから入力された記事URLに対して再帰回数を0回に設定し、収集したHTMLテキストと共に記事解析部30に渡す。記事解析部30は、HTMLテキストを解析し、コメント・トラックバック情報を格納した後、再帰回数がK回未満であれば、コメント送信元URLあるいはトラックバック元の記事URLに解析したHTMLテキストの再帰回数に1を加算した回数を付与して再帰収集指示部40に送る。再帰回数がK回の場合は、これ以上再帰収集を行わないように、コメント送信元URLやトラックバック元の記事URLを再帰収集指示部40に送らない。再帰収集指示部40は、コメント送信元ブログのRSSから取得した全てのURLに受け取った再帰回数を付与し、記事収集部20に送る。トラックバック元の記事URLも同様に受け取った再帰回数を付与して記事収集部20に送る。記事収集部20は、再帰収集指示部40から受け取ったURLリストに対しても記事URLの収集S101を実行する。   The article collection unit 20, the article analysis unit 30, and the recursive collection instruction unit 40 control the articles in the article URL list input by the user to have a recursion count of 0 and perform recursive collection up to a preset number (K times). . That is, the article collection unit 20 sets the recursion count to 0 for the article URL input by the user, and passes it to the article analysis unit 30 together with the collected HTML text. After analyzing the HTML text and storing the comment / trackback information, if the number of recursion is less than K times, the article analysis unit 30 sets the recursion number of the HTML text analyzed to the comment transmission source URL or the trackback source article URL. The number of times obtained by adding 1 is given and sent to the recursive collection instruction unit 40. When the recursion count is K, the comment transmission source URL and the trackback source article URL are not sent to the recursive collection instructing unit 40 so that recursive collection is not performed any more. The recursive collection instructing unit 40 assigns the received recursion count to all URLs acquired from the RSS of the comment transmission source blog, and sends it to the article collecting unit 20. Similarly, the trackback source article URL is sent to the article collection unit 20 with the received recursion count. The article collection unit 20 also performs article URL collection S101 for the URL list received from the recursive collection instruction unit 40.

また、記事解析部30は、定期的に新たに解析が終了した記事識別子のリストを生成し、リンク情報抽出部13に送る(ステップ109)
リンク情報抽出部13は、記事解析部30から解析した記事リストを定期的に受け取り、記事からの繋がりを示す記事リンク情報と、ブログ間の繋がりを示すブログリンク情報とを生成し、リンク情報蓄積部14に格納する(ステップ110)。
Also, the article analysis unit 30 generates a list of article identifiers that have been newly analyzed periodically and sends the list to the link information extraction unit 13 (step 109).
The link information extraction unit 13 periodically receives the analyzed article list from the article analysis unit 30, generates article link information indicating connection from articles and blog link information indicating connection between blogs, and stores link information. Store in the unit 14 (step 110).

インタフェース部50は、ユーザからキーワードの入力を受け(ステップ111)、キーワードを検索部16に渡す(ステップ112)。検索部16は、受け取ったキーワードに基づき、記事情報蓄積部11を検索し(ステップ113)、本文あるいはタイトルにキーワードを含む記事情報を取得し、インタフェース部50へ返送する(ステップ114)。インタフェース部50は、受け取った記事情報をユーザに提示し(ステップ115)、ユーザから記事の指定を受け付ける(ステップ116)。受け取った記事の記事識別子とキーワードを含むかどうかの情報を伝播表示部15に送る(ステップ117)。ユーザから与えられるキーワードは複数でもよく、また、システムがユーザから入力されたキーワードを元に同義語等を拡張して検索を実行してもよい。また、キーワード検索(キーワードを含む情報を検索する)に限定せず、概念検索(キーワードと概念が似ている情報を検索する)などを用いて検索してもよい。この場合、概念的に似ているか似ていないかの情報を伝播表示部15に送る。   The interface unit 50 receives a keyword input from the user (step 111), and passes the keyword to the search unit 16 (step 112). The search unit 16 searches the article information storage unit 11 based on the received keyword (step 113), acquires article information including the keyword in the text or title, and returns it to the interface unit 50 (step 114). The interface unit 50 presents the received article information to the user (step 115), and accepts article designation from the user (step 116). Information about whether the received article identifier and keyword are included is sent to the propagation display unit 15 (step 117). There may be a plurality of keywords given by the user, or the system may perform a search by expanding synonyms and the like based on the keywords inputted by the user. Further, the search is not limited to keyword search (search for information including a keyword), but may be performed using concept search (search for information similar in concept to the keyword) or the like. In this case, information indicating whether the concept is similar or not is transmitted to the propagation display unit 15.

伝播表示部15は、記事識別子を受け取り、当該記事識別子とつながりのあるノードをリンク情報蓄積部14から検索し、N段まで順次ノードを検索してグラフを生成する(ステップ118)。また、各ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する(ステップ119)。さらに表示された伝播構造から新たに起点となる記事をユーザに選択させ、伝播構造を表示する(ステップ120)。表示する段数は、予めシステムに設定しておいてもよいし、ユーザに指定させるように構成してもよい。   The propagation display unit 15 receives the article identifier, searches the link information storage unit 14 for nodes connected to the article identifier, and sequentially searches for nodes up to N stages to generate a graph (step 118). Also, the case where each node includes a specific keyword and the case where it does not include a specific keyword are displayed separately (step 119). Further, the user is made to select an article as a new starting point from the displayed propagation structure, and the propagation structure is displayed (step 120). The number of steps to be displayed may be set in the system in advance, or may be configured to be specified by the user.

また、表示された記事の伝播構造から、ブログ間の繋がりを表示する指示をユーザから受け取り、現在起点となっている記事を含むブログを起点として、N段のブログリンク情報を表示する。この際も、キーワードを含むブログと含まないブログとを区別して表示することにより、伝播の可能性を発見可能とする。   Also, an instruction to display the connection between the blogs is received from the user from the propagation structure of the displayed article, and the N-stage blog link information is displayed starting from the blog including the article that is currently the starting point. Also in this case, the possibility of propagation can be found by displaying the blog including the keyword and the blog not including the keyword separately.

ここで、本発明の処理対象である記事ページについて説明する。図5は、本発明が対象とする記事ページの構成例である。ここでは、コメント集合202とトラックバック集合203がテキストとして記事ページ200に記載されている場合を示しているが、別に保存されハイパーリンクで関連付けられていてもよい。   Here, the article page which is the processing target of the present invention will be described. FIG. 5 is a configuration example of an article page targeted by the present invention. Here, a case is shown in which the comment set 202 and the trackback set 203 are described in the article page 200 as text, but they may be stored separately and associated with each other by a hyperlink.

記事ページ200は、記事本文201と、記事本文に対して送信されたコメント集合202とトラックバック集合203とから構成される。コメント集合202の各コメントは、コメントタイトル、コメント送信者のURL、コメント送信者名、コメント送信日時、コメント本文などから構成される。コメントタイトル、コメント送信者のURL、コメント送信者名などが送信時に入力されていない場合があり、その場合「Unknown」などシステムの設定値が記載されている場合が多い。   The article page 200 includes an article body 201, a comment set 202 transmitted to the article body, and a trackback set 203. Each comment in the comment set 202 includes a comment title, a comment sender URL, a comment sender name, a comment transmission date, a comment text, and the like. The comment title, the URL of the comment sender, the name of the comment sender, etc. may not be input at the time of transmission. In this case, the system setting value such as “Unknown” is often described.

そこで、リンク情報抽出部13においては、コメント送信者のURLが同一であれば1つのノード、コメント送信者のURLが入力されていない場合、コメント送信者名が同一であれば1つのノードとする。また、記事リンク情報の抽出においては、トラックバック送信があった場合に、トラックバック送信元の記事が属するブログURLとコメント送信者のURLとが同じであれば1つのノードとする。   Therefore, in the link information extraction unit 13, if the URL of the comment sender is the same, the node is one node. If the URL of the comment sender is not input, the node is the same if the comment sender name is the same. . Further, in the extraction of article link information, when trackback transmission is performed, if the blog URL to which the article of the trackback transmission source belongs and the URL of the comment sender are the same, one node is assumed.

図6は、本発明の一実施の形態における記事情報蓄積部の記事情報の格納例であり、図7は、本発明の一実施の形態における記事情報蓄積部のブログ情報の格納例を示す。   FIG. 6 shows an example of storing article information in the article information storage unit in one embodiment of the present invention, and FIG. 7 shows an example of storing blog information in the article information storage unit in one embodiment of the present invention.

記事情報蓄積部11に格納される記事情報としては、記事識別子41、ブログ識別子42、記事URL43、記事投稿日時44、記事タイトル45、記事本文46、コメント受信数47、トラックバック受信数48などが蓄積される。記事情報蓄積部11に格納されるブログ情報としては、ブログ識別子51、ブログサイトのURL52,ブログサイトの更新RSSのURL53、ブログサイト名54、ブログオーナーのアカウント55などが蓄積される。   As article information stored in the article information storage unit 11, an article identifier 41, a blog identifier 42, an article URL 43, an article posting date 44, an article title 45, an article body 46, a comment reception count 47, a trackback reception count 48, and the like are stored. Is done. As the blog information stored in the article information storage unit 11, a blog identifier 51, a blog site URL 52, a blog site update RSS URL 53, a blog site name 54, a blog owner account 55, and the like are stored.

記事解析部30は、解析された記事のURLが既に記事情報蓄積部11の記事情報に存在する場合は、既存の情報を更新し、存在しない場合は新しい記事識別子を付与して記事情報を記事情報蓄積部11に蓄積する。また、記事URLからブログURLをルールに基づいて求め、ブログURLがブログ情報に存在する場合は、ブログ識別子を取得し、存在しない場合は新しいブログ識別子を付与してブログ情報を記事情報蓄積部11に蓄積する。   The article analysis unit 30 updates the existing information when the URL of the analyzed article already exists in the article information of the article information storage unit 11, and adds the new article identifier to the article information when it does not exist. The information is stored in the information storage unit 11. Further, the blog URL is obtained from the article URL based on the rule, and if the blog URL exists in the blog information, the blog identifier is acquired, and if it does not exist, a new blog identifier is assigned to add the blog information to the article information storage unit 11. To accumulate.

図8は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のトラックバック情報の格納例を示す。トラックバック情報は、トラックバックを受信した記事識別子61とブログ識別子62、またトラックバック送信元の記事識別子63、ブログ識別子64、記事タイトル65、記事URL66、ブログタイトル67、ブログURL68,そして送信日時69などから構成される。   FIG. 8 shows an example of storage of trackback information in the comment / trackback storage unit according to the embodiment of the present invention. The trackback information includes an article identifier 61 and a blog identifier 62 that have received the trackback, an article identifier 63 of the trackback transmission source, a blog identifier 64, an article title 65, an article URL 66, a blog title 67, a blog URL 68, a transmission date and time 69, and the like. Is done.

図9は、本発明の一実施の形態におけるコメント・トラックバック蓄積部のコメント情報の格納例である。   FIG. 9 is a storage example of comment information in the comment / trackback accumulating unit in the embodiment of the present invention.

コメント・トラックバック蓄積部12のコメント情報は、コメントを受信した記事の記事識別子71とブログ識別子72、また、コメント送信者のブログ識別子73、送信者名74、送信者のURL75,そしてコメント自体の情報としてコメントタイトル76、コメント本文77、コメント送信日時78などから構成される。コメント送信者のブログ識別子73は、コメント送信者のURLがブログサイトのURLだとして、ブログ情報を検索することで求める。ブログ情報に存在しない場合は、ブログ識別子をなしとして蓄積する。 The comment information of the comment / trackback storage unit 12 includes the article identifier 71 and the blog identifier 72 of the article that received the comment, the blog identifier 73 of the comment sender, the sender name 74, the URL 75 of the sender, and the information of the comment itself. As a comment title 76, a comment body 77, a comment transmission date and time 78, and the like. The comment sender 's blog identifier 73 is obtained by searching the blog information on the assumption that the URL of the comment sender is the URL of the blog site. If the blog information does not exist, the blog identifier is stored as none.

また、コメント送信者のURLが記載されていないコメントの場合、ブログ識別子を検索することができないため、ブログ識別子なし、コメント送信者のURLなしのコメント情報を蓄積する。送信者名74には「Unknown」も含めて蓄積する。   Further, in the case of a comment in which the URL of the comment sender is not described, the blog identifier cannot be searched, so that the comment information without the blog identifier and without the URL of the comment sender is accumulated. The sender name 74 includes “Unknown”.

コメント情報、トラックバック情報ともに、コメントを受信した記事の記事識別子、トラックバックを受信した記事の記事識別子は、解析対象の記事であることから必ず格納される。   Both the comment information and the trackback information are always stored because the article identifier of the article that received the comment and the article identifier of the article that received the trackback are articles to be analyzed.

以下、リンク情報抽出部13の動作について詳細に説明する。   Hereinafter, the operation of the link information extraction unit 13 will be described in detail.

図10は、本発明の一実施の形態におけるリンク情報抽出部の記事リンク抽出処理のフローチャートである。図11は、本発明の一実施の形態におけるリンク情報蓄積部の記事リンク情報の格納例であり、リンク情報蓄積部14の記事リンク情報は、基準記事識別子801、基準記事が属するブログ識別子802、基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)803、基準記事と繋がりを持つノードのブログ識別子804、基準記事のURL805、基準記事がノードから受信したトラックバック数806、基準記事がノードに送信したトラックバック数807、基準記事がノードから受信したコメント数808、基準記事を含むブログがノードに送信したコメント数809、ノード所有者名810、ノードの記事URL811、ノードのブログURL812、ノードの記事タイトル(ノードが記事の場合)813、ノードが属するブログのタイトル814からなる。   FIG. 10 is a flowchart of the article link extraction process of the link information extraction unit in the embodiment of the present invention. FIG. 11 is a storage example of article link information of the link information storage unit according to the embodiment of the present invention. The article link information of the link information storage unit 14 includes a reference article identifier 801, a blog identifier 802 to which the reference article belongs, The article identifier of the node connected to the reference article (when the node is an article) 803, the blog identifier 804 of the node connected to the reference article, the URL 805 of the reference article, the trackback number 806 received from the node by the reference article, and the reference article Number of trackbacks 807 transmitted to the node, number of comments 808 received by the reference article from the node, number of comments 809 transmitted by the blog including the reference article to the node, node owner name 810, article URL 811 of the node, node blog URL 812, node Article title (if node is an article) 813, node is Consisting of the blog title 814.

リンク情報生成部13は、記事解析部30から受け取った記事識別リストから、未処理の記事を選択する(ステップ201,202)。未処理の記事がある場合、コメント・トラックバック蓄積部12から選択した記事が受信したトラックバック情報を検索する。トラックバック情報が存在する場合は選択した記事を基準記事とし、トラックバック送信元の記事をつながりのあるノードとして記事リンク情報を生成する(ステップ203)。   The link information generation unit 13 selects an unprocessed article from the article identification list received from the article analysis unit 30 (steps 201 and 202). If there is an unprocessed article, the trackback information received by the article selected from the comment / trackback storage unit 12 is searched. If trackback information exists, article link information is generated using the selected article as a reference article and the article of the trackback transmission source as a connected node (step 203).

次に、基準記事が受信したコメント情報を検索し、コメント情報集合を取得する(ステップ204)。未処理のコメント情報がある場合は(ステップ205、Yes)、まず、コメント送信者のブログ識別子が処理中の記事を基準とした記事リンク情報(図11:ノードのブログ識別子804)に含まれているか調べる。既存の記事リンク情報に含まれている場合には(ステップ206、Yes)、新たな記事リンク情報は生成せず既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。既存の記事リンク情報に含まれていない場合には(ステップ206、No)、コメント送信者名が処理中の記事を基準とした記事リンク情報(図11:ノードの所有者名810)に含まれているか調べる(ステップ208)。コメント送信者名が既存の記事リンク情報にある場合は(ステップ208、Yes)、既存の記事リンク情報のコメント受信数を1加算する(ステップ207)。コメント送信者名が同じ既存の記事リンク情報がない場合、基準の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは、両方と、コメント数とからなる新たな記事リンク情報を生成する(ステップ209)。   Next, the comment information received by the reference article is searched to obtain a comment information set (step 204). If there is unprocessed comment information (step 205, Yes), the comment sender's blog identifier is first included in the article link information (FIG. 11: node blog identifier 804) based on the article being processed. Find out. If it is included in the existing article link information (step 206, Yes), new article link information is not generated, and the number of received comments of the existing article link information is incremented by 1 (step 207). If it is not included in the existing article link information (step 206, No), the comment sender name is included in the article link information (FIG. 11: node owner name 810) based on the article being processed. (Step 208). When the comment sender name is in the existing article link information (step 208, Yes), 1 is added to the number of comments received in the existing article link information (step 207). If there is no existing article link information with the same comment sender name, the standard article identifier, the blog identifier, the blog identifier of the comment sender, the comment sender name or the URL of the comment sender, or both, and the comment New article link information consisting of a number is generated (step 209).

生成した全ての記事リンク情報を図11に示す形態でリンク情報蓄積部14に格納する。さらに、生成した記事リンク情報の内でノードの記事識別子が存在する(すなわち、基準記事がノードからトラックバックを受信している)場合、記事リンク情報それぞれに対して、基準記事aとノードの記事識別子b(ノードが属するブログ識別子をBとする)とを入れ替えた記事リンク情報(基準記事がb、ノードの記事識別子がaの記事リンク情報)が存在するか検索し、存在する場合は検索結果の記事リンク情報のトラックバック送信数として生成した記事リンク情報のトラックバック受信数を格納する。また、基準記事が属するブログ識別子がB、ノードの記事識別子がaである記事リンク情報が存在するか検索し、存在する場合は検索結果の記事リンク情報のコメント送信数として生成した記事リンク情報のコメント受信数を格納する(ステップ210)。   All the generated article link information is stored in the link information storage unit 14 in the form shown in FIG. Further, when the article identifier of the node exists in the generated article link information (that is, the reference article receives the trackback from the node), the reference article a and the article identifier of the node for each of the article link information Search for the presence of article link information (article link information with reference article b and node identifier a) that replaces b (the blog identifier to which the node belongs is B). Stores the number of article link information trackback receptions generated as the number of article link information trackback transmissions. Also, it is searched whether there is article link information with the blog identifier to which the reference article belongs and the article identifier of the node is a. If there is, the article link information generated as the number of comment transmissions of the article link information of the search result is found. The number of received comments is stored (step 210).

次に、ブログ間の繋がりを示すブログリンク情報の生成処理について、図12を用いて説明する。   Next, generation processing of blog link information indicating the connection between blogs will be described with reference to FIG.

図12は、本発明の一実施の形態におけるリンク情報抽出部のブログリンク情報抽出処理のフローチャートである。図13は、本発明の一実施の形態におけるリンク情報蓄積部のブログリンク情報の格納例であり、リンク情報蓄積部14のブログリンク情報は、基準ブログ識別子901、基準ブログと繋がりを持つノードのブログ識別子902、基準ブログがノードから受信したトラックバック数903、基準ブログがノードに送信したトラックバック数904、基準ブログがノードから受信したコメント数905、基準ブログがノードに送信したコメント数906、ノード所有者名(コメント送信者名)907、ノードの記事URL908、ノードのブログのURL909、ノードの記事タイトル(ノードが記事の場合)910、ノードのブログタイトル911からなる。   FIG. 12 is a flowchart of the blog link information extraction process of the link information extraction unit in the embodiment of the present invention. FIG. 13 is a storage example of blog link information of the link information storage unit according to the embodiment of the present invention. The blog link information of the link information storage unit 14 includes a reference blog identifier 901 and a node connected to the reference blog. Blog identifier 902, trackback number 903 received by the reference blog from the node, trackback number 904 sent by the reference blog to the node, number 905 comments received by the reference blog from the node, number 906 comments sent by the reference blog to the node, node ownership It consists of a person name (comment sender name) 907, a node article URL 908, a node blog URL 909, a node article title (if the node is an article) 910, and a node blog title 911.

リンク情報生成部13は、記事解析部30から受け取った記事識別子のリストから、ブログ識別子のリストを生成して処理を開始する。   The link information generation unit 13 generates a list of blog identifiers from the list of article identifiers received from the article analysis unit 30 and starts processing.

まず、未処理のブログ識別子を選択する(ステップ301,302)。未処理のブログがある場合、選択したブログに属する記事が受信したトラックバック情報をコメント・トラックバック蓄積部12から検索する。トラックバック情報が存在する場合は選択したブログを基準とし、トラックバック送信元のブログ識別子をつながりのあるノードとしてブログリンク情報を生成する(ステップ303)。この際、基準ブログに属する複数記事がノードのブログに属する複数の記事から受信した全てのトラックバック数を集計し、リンク情報蓄積部14のブログリンク情報に格納する。   First, an unprocessed blog identifier is selected (steps 301 and 302). When there is an unprocessed blog, the trackback information received by the article belonging to the selected blog is searched from the comment / trackback storage unit 12. If trackback information exists, blog link information is generated using the selected blog as a reference and using the blog identifier of the trackback transmission source as a connected node (step 303). At this time, the total number of trackbacks received from the plurality of articles belonging to the blog of the node by the plurality of articles belonging to the reference blog is totaled and stored in the blog link information of the link information storage unit 14.

次に、基準ブログに属する複数の記事が受信したコメント情報をコメント・トラックバック蓄積部12から検索し、コメント情報集合を取得する(ステップ304)。未処理のコメント情報がある場合は(ステップ305、Yes)、まず、コメント送信者のブログ識別子が処理中のブログを基準としたブログリンク情報(図13:ノードのブログ識別子902)に含まれているか調べる。   Next, comment information received by a plurality of articles belonging to the reference blog is searched from the comment / trackback storage unit 12 to obtain a comment information set (step 304). If there is unprocessed comment information (step 305, Yes), the comment sender's blog identifier is first included in the blog link information (FIG. 13: node blog identifier 902) based on the blog being processed. Find out.

既存のブログリンク情報に含まれている場合には(ステップ306、Yes)、新たなブログリンク情報は生成せず、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。既存のブログリンク情報に含まれていない場合には(ステップ306、No)、コメント送信者名が処理中のブログを基準としたブログリンク情報(図13:ノードの所有者名907)に含まれているか調べる(ステップ308)。コメント送信者名が同じ既存のブログリンク情報がある場合は(ステップ308、Yes)、既存のブログリンク情報のコメント受信数を1加算する(ステップ307)。コメント送信者名が同じ既存のブログリンク情報がない場合、基準のブログ識別子とコメント送信者のブログ識別子と、コメント送信者名がコメント送信者のURLの一方、あるいは、両方と、コメント数とから新たな記事リンク情報を生成する(ステップ309)。 When it is included in the existing blog link information (step 306, Yes), new blog link information is not generated, and the number of received comments of the existing blog link information is incremented by 1 (step 307). If it is not included in the existing blog link information (step 306, No), the comment sender name is included in the blog link information (FIG. 13: node owner name 907) based on the blog being processed. (Step 308). When there is existing blog link information having the same comment sender name (step 308, Yes), the number of received comments of the existing blog link information is incremented by 1 (step 307). If there is no existing blog link information with the same comment sender name, the reference blog identifier, the blog identifier of the comment sender, the comment sender name is one or both of the URLs of the comment sender, and the number of comments New article link information is generated (step 309).

生成した全てのブログリンク情報を図13に示す形態でリンク情報蓄積部14に格納すると共に、生成したブログリンク情報の中でノードのブログ識別子が存在するブログリンク情報それぞれに対して、基準ブログとノードとを入れ替えたブログリンク情報が存在するか検索し、存在する場合は検索結果のブログリンク情報のトラックバック送信数として生成したブログリンク情報のトラックバック受信数を格納し、検索結果のブログリンク情報のコメント送信数として生成したブログリンク情報のコメント受信数を格納する(ステップ310)。   All the generated blog link information is stored in the link information storage unit 14 in the form shown in FIG. 13, and for each blog link information in which the blog identifier of the node exists in the generated blog link information, Searches for the existence of blog link information that replaces the node, and if so, stores the number of trackback receptions of the generated blog link information as the number of trackback transmissions of the blog link information of the search results, and stores the blog link information of the search results The number of received comments of the blog link information generated as the number of comment transmission is stored (step 310).

図11、図13に示したリンク情報には、ノードの記事タイトル813、910、ノードの属するブログタイトル814、ノードのブログタイトル911が含まれているが、これらは伝播構造を示すために必須ではなく、記事タイトルやブログタイトルを表示することでノードの識別を容易にすることができる項目である。   The link information shown in FIG. 11 and FIG. 13 includes the article titles 813 and 910 of the node, the blog title 814 to which the node belongs, and the blog title 911 of the node, which are indispensable for indicating the propagation structure. The item can be easily identified by displaying the article title and the blog title.

以下、図11、図13を用いて伝播表示部15の処理を詳細に説明する。   Hereinafter, the processing of the propagation display unit 15 will be described in detail with reference to FIGS. 11 and 13.

伝播表示部15はインタフェース部50からキーワードを含むかどうかの情報が付与された記事識別子を受け取り、該記事識別子を基準とする記事リンク情報をリンク情報蓄積部14から検索する。次に、基準記事と繋がりのあるノードの記事識別子が存在する場合、ノードを基準記事とする記事リンク情報を検索する。この処理をN段に達するまで順次実施し、記事識別子が同じ記事は1つのノードとし、記事識別子がないノードはコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。この際、エッジの表示形態としては、コメント送信/受信とトラックバック送信/受信の各繋がりを纏めて1つのエッジとする方法、4本のエッジとする方法、送信と受信で2本とする方法などがある。また、キーワードを含むノードと含まないノードの色を変える、形を変えるなどしてキーワードを含むノードを区別して表示する。これにより、キーワードを含む記事の影響がどのように伝播したかを発見することが可能となる。   The propagation display unit 15 receives an article identifier to which information indicating whether or not a keyword is included from the interface unit 50, and searches the link information storage unit 14 for article link information based on the article identifier. Next, when there is an article identifier of a node connected to the reference article, article link information using the node as the reference article is searched. This process is performed sequentially until N stages are reached. Articles with the same article identifier are set as one node, nodes without an article identifier are set as one node when the comment sender name is the same, and the connection of each node is an edge. Generate a graph. At this time, as the display form of the edge, the connection of comment transmission / reception and trackback transmission / reception is combined into one edge, the method of using four edges, the method of combining transmission and reception with two, etc. There is. In addition, the node including the keyword is distinguished and displayed by changing the color or the shape of the node including the keyword and the node not including the keyword. Thereby, it is possible to discover how the influence of the article including the keyword has been propagated.

図14は、本発明の一実施の形態における記事からの繋がり構造の表示例であり、伝播表示部15により表示される。同図において、記事識別子の存在するノードは○、記事識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している例である。また、起点となるノードaは輪郭が二重に表示し、起点であることが分かるように表示し、段数は2段までとした例である。記事からの繋がりにおいては記事識別子が存在するノードはトラックバックの送受信関係がある場合であり、ノードaにノードbとノードcからトラックバックが送信されていることを示している。また、ノードaからノードbへの矢印は、ノードaからノードbへのトラックバックか、ノードaのブログ所有者がノードbへコメントを送信したことを示している。このように1つのエッジでコメント送受信、トラックバック送受信を表示する場合には、コメントのみ、あるいはトラックバックのみといった指定をして表示するエッジを切り替える機能を用意するようにしてもよい。   FIG. 14 is a display example of a connection structure from articles in the embodiment of the present invention, and is displayed by the propagation display unit 15. In the figure, the node where the article identifier exists is displayed as ◯, the node where the article identifier does not exist is displayed as □, and the node including the keyword is displayed with the color changed to black. In addition, the node a which is the starting point is an example in which the contour is displayed double, so that it can be seen that it is the starting point, and the number of steps is up to two. In connection with an article, a node in which an article identifier exists has a trackback transmission / reception relationship, and indicates that a trackback is transmitted from the node b and the node c to the node a. The arrow from node a to node b indicates that the track back from node a to node b or that the blog owner of node a has sent a comment to node b. In this way, when comment transmission / reception and trackback transmission / reception are displayed with one edge, a function of switching the edge to be displayed by designating only the comment or only the trackback may be prepared.

このように記事からの伝播構造が表示された状態において、ユーザが特定の記事を指定して該記事からの伝播を見る指示をした場合、上記と同様に指定された該記事を起点としてN段に達するまで記事リンク情報を検索し、グラフを生成する。   In the state where the propagation structure from the article is displayed in this way, when the user designates a specific article and gives an instruction to view the propagation from the article, the N stages starting from the designated article as described above are used. Search for article link information until it reaches, and generate a graph.

また、直接記事に対して繋がりがない場合であっても記事の影響を発見する方法として、ブログ間の繋がりを表示する。ユーザによりブログ間の繋がり表示へ切り替える指示がなされると、起点となっている記事を含むブログを基準とするブログリンク情報を検索する。基準ブログとつながりのあるノードが存在する場合、ノードを基準ブログとするブログリンク情報を検索する。この処理をN段に達するまで順次実施し、ブログ識別子が同じであれば1つのノードとし、ブログ識別子がない場合はコメント送信者名が同じであれば1つのノードとし、各ノードの繋がりをエッジとするグラフを生成する。   Even if there is no direct connection to the article, the connection between the blogs is displayed as a method of discovering the influence of the article. When the user gives an instruction to switch to connection display between blogs, blog link information based on the blog including the starting article is searched. When there is a node connected to the reference blog, blog link information using the node as the reference blog is searched. This process is performed in sequence until the Nth stage is reached. If the blog identifier is the same, the node is one node. If there is no blog identifier, the comment sender name is the same node. To generate a graph.

図15は、本発明の一実施の形態におけるブログ間の繋がり構造の表示例である。同図は図14で記事からの伝播構造が表示されている際に、ブログ間の伝播構造への表示切替が指示された例を示す。図14と同様、ブログ識別子の存在するノードは○、ブログ識別子が存在しないノードは□で表示され、キーワードを含むノードは色を黒く変えて表示している。また、起点となるノードaは輪郭を二重に表示し、起点であることが分かるように表示している。記事のノードとブログのノードとは別の表示形態で示されるのが望ましいが、ここでは説明を容易にするため同じ表示形態としている。図14において記事を示していたa〜d、のノードは、図15においてはブログを示している。   FIG. 15 is a display example of a connection structure between blogs according to an embodiment of the present invention. This figure shows an example in which display switching to the propagation structure between blogs is instructed when the propagation structure from the article is displayed in FIG. As in FIG. 14, a node having a blog identifier is displayed as ◯, a node having no blog identifier is displayed as □, and a node including a keyword is displayed with a color changed to black. In addition, the node “a” that is the starting point displays a double outline so that it can be seen that it is the starting point. It is desirable that the article node and the blog node are displayed in different display forms, but here the same display form is used for ease of explanation. The nodes a to d showing articles in FIG. 14 show blogs in FIG.

ノードaがブログになったことにより、ノードgが増え、また、ノードcもブログになったことにより、ノードh、i,jが増え、より多くのつながりのあるノードを見ることが可能となる。また、ノードb、jのブログに含まれる記事中にキーワードが含まれているものは黒く表示されている。また、ノードb、gに送信されたコメントやトラックバックが表示されるようになり、より広い範囲の伝播構造を見ることが可能となる。   When node a becomes a blog, node g increases, and when node c becomes a blog, nodes h, i, and j increase, and it becomes possible to see more connected nodes. . Also, articles containing keywords in the blogs of nodes b and j are displayed in black. In addition, comments and trackbacks transmitted to the nodes b and g are displayed, and a wider range of propagation structures can be viewed.

なお、上記の図3の伝播構造抽出装置の構成要素の動作をプログラムとして構築し、伝播構造抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   The operation of the components of the propagation structure extraction apparatus shown in FIG. 3 can be constructed as a program, installed in a computer used as the propagation structure extraction apparatus, executed, or distributed via a network. is there.

また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。   Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、インターネット上のブログサービスやSNSにおける記事の解析に適用可能である。   The present invention can be applied to blog services on the Internet and analysis of articles in SNS.

本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の一実施の形態における伝播構造抽出装置の構成図である。It is a block diagram of the propagation structure extraction apparatus in one embodiment of this invention. 本発明の一実施の形態における伝播構造抽出装置の動作のシーケンスチャートである。It is a sequence chart of operation | movement of the propagation structure extraction apparatus in one embodiment of this invention. 本発明が対象とする記事ページの構成例である。It is a structural example of the article page which this invention makes object. 本発明の一実施の形態における記事情報蓄積部の記事情報の格納例である。It is a storage example of the article information of the article information accumulation | storage part in one embodiment of this invention. 本発明の一実施の形態における記事情報蓄積部のブログ情報の格納例である。It is a storage example of the blog information of the article information storage part in one embodiment of the present invention. 本発明の一実施の形態におけるコメント・トラックバック蓄積部のトラックバック情報の格納例である。It is a storage example of the trackback information of the comment / trackback storage unit in the embodiment of the present invention. 本発明の一実施の形態におけるコメント・トラックバック蓄積部のコメント情報の格納例である。It is a storage example of the comment information of the comment / trackback accumulating unit in the embodiment of the present invention. 本発明の一実施の形態におけるリンク情報抽出部の記事リンク情報抽出処理のフローチャートである。It is a flowchart of the article link information extraction process of the link information extraction part in one embodiment of the present invention. 本発明の一実施の形態におけるリンク情報蓄積部の記事リンク情報の格納例である。It is a storage example of the article link information of the link information storage part in one embodiment of this invention. 本発明の一実施の形態におけるリンク情報抽出部のブログリク情報抽出処理のフローチャートである。It is a flowchart of the blog search information extraction process of the link information extraction part in one embodiment of the present invention. 本発明の一実施の形態におけるリンク情報蓄積部のブログリンク情報の格納例である。It is a storage example of the blog link information of the link information storage part in one embodiment of this invention. 本発明の一実施の形態における記事からの繋がり構造の表示例である。It is an example of a display of the connection structure from the article in one embodiment of the present invention. 本発明の一実施の形態におけるブログ間の繋がり構造の表示例である。It is a display example of the connection structure between blogs in one embodiment of the present invention. 本発明が対象とするブログサービスの構造について説明する図である。It is a figure explaining the structure of the blog service which this invention makes object.

符号の説明Explanation of symbols

11 記事情報記憶手段
12 コメント・トラックバック記憶手段
13 リンク情報抽出部
13−1 記事リンク情報抽出手段
13−2 ブログリンク情報抽出手段
14 リンク情報記憶手段
15 伝播表示部
15−1 記事伝播表示手段
15−2 ブログ伝播表示手段
15−3 切り替え表示手段
16 検索部
20 記事収集部
30 記事解析手段、記事解析部
40 再帰収集手段、再帰収集指示部
41 記事識別子
42 ブログ識別子
43 記事URL
44 記事登録日時
45 記事タイトル
46 記事本文
47 コメント受信数
48 トラックバック受信数
50 インタフェース部
51 ブログ識別子
52 ブログサイトのURL
53 ブログサイトの更新RSSのURL
54 ブログサイト名
55 ブログオーナーのアカウント
61 トラックバックを受信した記事識別子
62 トラックバックを受信したブログ識別子
63 トラックバック送信元の記事識別子
64 トラックバック送信元の記事が属するブログ識別子
65 トラックバック送信元の記事タイトル
66 トラックバック送信元の記事URL
67 トラックバック送信元のブログタイトル
68 トラックバック送信元ブログURL
69 トラックバック送信日時
71 コメントを受信した記事識別子
72 コメントを受信したブログ識別子
73 コメント送信者のブログ識別子
74 コメント送信者名
75 コメント送信者のURL
76 コメントタイトル
77 コメント本文
78 コメント送信日時
200 記事ページ
201 記事本文
202 コメント
203 トラックバック
801 基準記事識別子
802 基準記事が属するブログ識別子
803 基準記事と繋がりを持つノードの記事識別子(ノードが記事の場合)
804 基準記事と繋がりを持つノードのブログ識別子
805 基準記事のURL
806 基準記事がノードから受信したトラックバック数
807 基準記事がノードに送信したトラックバック数
808 基準記事がノードから受信したコメント数
809 基準記事を含むブログがノードに送信したコメント数
810 ノード所有者名
811 ノードの記事URL
812 ノードのブログURL
813 ノードの記事タイトル(ノードが記事の場合)
814 ノードが属するブログのタイトル
901 基準ブログ識別子
902 基準ブログと繋がりを持つノードのブログ識別子
903 基準ブログがノードから受信したトラックバック数
904 基準ブログがノードに送信したトラックバック数
905 基準ブログがノードから受信したコメント数
906 基準ブログがノードに送信したコメント数
907 ノードの所有者(コメント送信者名)
908 ノードの記事URL
909 ノードのブログのURL
910 ノードの記事タイトル(ノードが記事の場合)
911 ノードのブログタイトル
11 article information storage means 12 comment / trackback storage means 13 link information extraction section 13-1 article link information extraction means 13-2 blog link information extraction means 14 link information storage means 15 propagation display section 15-1 article propagation display means 15- 2 Blog propagation display means 15-3 Switching display means 16 Search section 20 Article collection section 30 Article analysis means, article analysis section 40 Recursive collection means, recursive collection instruction section 41 Article identifier 42 Blog identifier 43 Article URL
44 Article registration date 45 Article title 46 Article body 47 Number of received comments 48 Number of received trackbacks 50 Interface section 51 Blog identifier 52 URL of blog site
53 Blog site update RSS URL
54 Blog Site Name 55 Blog Owner Account 61 Article Identifier that Received Trackback 62 Blog Identifier that Received Trackback 63 Article Identifier of Trackback Source 64 Blog Identifier to Which Article of Trackback Source belongs 65 Trackback Source Article Title 66 Trackback Transmission Original article URL
67 Trackback sender blog title 68 Trackback sender blog URL
69 Trackback transmission date and time 71 Article identifier that received the comment 72 Blog identifier that received the comment 73 Blog identifier of the comment sender 74 Comment sender name 75 Comment sender URL
76 Comment title 77 Comment body 78 Comment transmission date and time 200 Article page 201 Article body 202 Comment 203 Trackback 801 Standard article identifier 802 Blog identifier to which the standard article belongs 803 Article identifier of the node connected to the standard article (when the node is an article)
804 Blog identifier 805 of the node connected to the reference article 805 URL of the reference article
806 Number of trackbacks received by reference article from node 807 Number of trackbacks sent by reference article to node 808 Number of comments received by reference article from node 809 Number of comments sent by blog including reference article to node 810 Node owner name 811 Node Article URL
812 Node Blog URL
813 Node article title (if node is an article)
814 Title of the blog to which the node belongs 901 Reference blog identifier 902 Blog identifier of the node connected to the reference blog 903 Trackback number 904 received from the node by the reference blog Trackback number 905 sent from the node to the node Reference blog received from the node Number of comments 906 Number of comments sent to the node by the reference blog 907 Owner of the node (comment sender name)
908 Article URL of the node
URL of the 909 node blog
910 Node article title (if the node is an article)
911 Node Blog Title

Claims (8)

インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析手段と、
前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段と、
前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出手段と、
ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示手段と、
ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示手段と、
前記記事伝播表示手段から前記ブログ伝播表示手段に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段と、
を有し、
前記記事リンク情報抽出手段は、
前記コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成する手段と、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成する手段と、
生成した全ての記事リンク情報を前記リンク情報記憶手段に格納する手段と、
を有することを特徴とする伝播構造抽出装置。
Propagation structure extraction device that analyzes the impact of Internet blogs and social networking service articles on viewers,
Analyzing the collected articles and assigning an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article and storing it in the article information storage means ,
When a comment is transmitted to the article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies the blog site to which the article belongs, and at least one of a comment sender name and a comment sender URL If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means. ,
When the trackback is transmitted to the article, the article identifier that uniquely identifies the article, the blog identifier that uniquely identifies the blog site to which the article belongs, the article identifier of the trackback transmission source, the blog identifier, the article URL, Article analysis means for storing one or more pieces of information that can be acquired in the blog URL and blog title as trackback information in the comment / trackback storage means;
A recursive collection that identifies a blog site as a transmission source when a comment is transmitted to the article, collects articles belonging to the blog site, and collects an article as the trackback source when a trackback is transmitted Means,
Article link information extracting means for storing the link from the article or the link by the trackback (link information) in the link information storage means;
A blog link information extracting unit that collects articles belonging to the same blog site, extracts a link from the blog site or a link by linkback (link information), and stores the link information in the link information storage unit;
Article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means;
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When switching from the article propagation display means to the blog propagation display means, a switching display means starting from a blog site that includes an article starting from the article propagation display means;
Have
The article link information extracting means includes:
Based on the trackback information stored in the comment / trackback storage means, the link information is generated as the link back received article as the reference article, the track back transmission article as the article having connection, and the comment information set transmitted to the reference article If the blog identifier of the comment sender is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information. If not included, the article consists of the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name and / or the URL of the comment sender, and the number of comments. Means for generating link information;
If the blog URL is unknown, the comment information is determined to be the same if the comment sender name is the same, and the number of comments is added to the existing article link information. Means for generating;
Means for storing all the generated article link information in the link information storage means;
Propagation structure extraction apparatus characterized by having a.
前記記事伝播表示手段は、
起点となる記事とコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段の記事リンク情報を参照し、入力された該段数に達するまで順次記事リンク情報を検索し、検索された全ての記事リンク情報において、記事からの伝播を表すグラフを生成し、ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
請求項1記載の伝播構造抽出装置。
The article propagation display means is:
When the article to be the starting point and the number of steps to follow the comment or trackback are input, the article link information in the link information storage means is referenced, and the article link information is sequentially searched until the input number of stages is reached. of the article the link information, and generates a graph representing the propagation from the article, the node according to claim 1 Symbol mounting propagation structure extraction device includes means for displaying to distinguish between may not include a specific keyword.
インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出装置であって、
収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析手段と、
前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集手段と、
前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出手段と、
同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出手段と、
ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示手段と、
ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示手段と、
前記記事伝播表示手段から前記ブログ伝播表示手段に切り替える際に、該記事伝播表示手段で起点とした記事を含むブログサイトを起点とする切り替え表示手段と、
を有し、
前記ブログリンク情報抽出手段は、
前記コメント・トラックバック記憶手段に格納された前記コメント情報と前記トラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成する手段と、
生成した全ての前記ブログリンク情報を前記リンク情報記憶手段に格納する手段と、
を有することを特徴とする伝播構造抽出装置。
Propagation structure extraction device that analyzes the impact of Internet blogs and social networking service articles on viewers,
Analyzing the collected articles and assigning an article identifier for uniquely identifying the article and a blog identifier for uniquely identifying the blog site to which the article belongs to the article and storing it in the article information storage means ,
When a comment is transmitted to the article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies the blog site to which the article belongs, and at least one of a comment sender name and a comment sender URL If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means. ,
When the trackback is transmitted to the article, the article identifier that uniquely identifies the article, the blog identifier that uniquely identifies the blog site to which the article belongs, the article identifier of the trackback transmission source, the blog identifier, the article URL, Article analysis means for storing one or more pieces of information that can be acquired in the blog URL and blog title as trackback information in the comment / trackback storage means;
A recursive collection that identifies a blog site as a transmission source when a comment is transmitted to the article, collects articles belonging to the blog site, and collects an article as the trackback source when a trackback is transmitted Means,
Article link information extracting means for storing the link from the article or the link by the trackback (link information) in the link information storage means;
A blog link information extracting unit that collects articles belonging to the same blog site, extracts a link from the blog site or a link by linkback (link information), and stores the link information in the link information storage unit;
Article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means;
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When switching from the article propagation display means to the blog propagation display means, a switching display means starting from a blog site that includes an article starting from the article propagation display means;
Have
The blog link information extracting means includes
Based on the comment information stored in the comment / trackback storage means and the blog identifier of the trackback information, two blog identifiers having at least one connection of a comment or trackback, the number of comments transmitted and received, the number of trackback transmissions If the blog identifier of the comment sender is unknown and the blog identifier of the comment sender is the same and the comment sender name is the same, the existing blog link is generated. A means to add the number of comments to the information and to generate new blog link information if it does not exist,
Means for storing all the generated blog link information in the link information storage means;
Propagation structure extraction apparatus characterized by having a.
前記ブログ伝播表示手段は、
起点となるブログとコメントまたはトラックバックを辿る段数が入力されると、前記リンク情報記憶手段のブログリンク情報を参照し、入力された前記段数に達するまで順次ブログリンク情報を検索し、検索された全てのブログリンク情報において、ブログをノード、ブログ間のつながりをエッジとするグラフを生成し、該ノードが特定のキーワードを含む場合と含まない場合とを区別して表示する手段を含む
請求項3記載の伝播構造抽出装置。
The blog propagation display means
When the starting blog and the number of steps following the comment or trackback are input, the blog link information in the link information storage means is referenced, and the blog link information is sequentially searched until the input number of steps is reached. in the blog link information, node a blog, generating a graph with edge connections between blogs, claim 3 Symbol mounting includes means for displaying to distinguish the case of not including the case where the node contains a specific keyword Propagation structure extraction device.
インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップと、
再帰収集手段が、前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップと、
記事リンク情報抽出手段が、前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップと
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出ステップと、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示ステップと、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示ステップと、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップと、
を行い、
前記記事リンク情報抽出ステップにおいて、
前記コメント・トラックバック記憶手段に格納されたトラックバック情報を基に、トラックバック受信記事を基準記事、トラックバック送信記事を、繋がりを持つ記事として記事リンク情報を生成し、該基準記事へ送信されたコメント情報集合の内でコメント送信者のブログ識別子が生成した記事リンク情報に含まれている場合には、新たな記事リンク情報は生成せずコメント受信数を既存の記事リンク情報に追加し、記事リンク情報に含まれていない場合には、コメントを受信した記事の記事識別子とブログ識別子とコメント送信者のブログ識別子と、コメント送信者名かコメント送信者のURLの一方、あるいは両方と、コメント数からなる記事リンク情報を生成するステップと、
ブログURLが不明のコメント情報は、コメント送信者名が同じであれば同一と判定し、既存の記事リンク情報にコメント数を追加し、同一と判定されなかった場合は、新たな記事リンク情報を生成するステップと、
生成した全ての記事リンク情報を前記リンク情報記憶手段に格納するステップと、
を行うことを特徴とする伝播構造抽出方法。
Propagation structure extraction method that analyzes the impact of blogs and social networking service articles on the Internet on viewers.
Article analysis means analyzes the collected articles and assigns an article identifier that uniquely identifies the article and a blog identifier that uniquely identifies the blog site to which the article belongs to the article and stores it in the article information storage means and,
When a comment is transmitted to the article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies the blog site to which the article belongs, and at least one of a comment sender name and a comment sender URL If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means. ,
When the trackback is transmitted to the article, the article identifier that uniquely identifies the article, the blog identifier that uniquely identifies the blog site to which the article belongs, the article identifier of the trackback transmission source, the blog identifier, the article URL, An article analysis step of storing one or more pieces of information that can be acquired in the blog URL and blog title as trackback information in the comment / trackback storage means;
When the comment is transmitted to the article, the recursive collection means identifies the blog site of the transmission source, collects the articles belonging to the blog site, and when the trackback is transmitted, the article of the trackback source A recursive collection step to collect
Article link information extracting means stores an article link information extracting step for storing a link or link by link back (link information) from the article in the link information storage means ;
The blogs link information extraction means, and blog link information extraction step, which summarizes the articles belonging to the same blog site to extract the connection (link information) by the comment or trackback from the blog site, be stored in the link information storage means,
An article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means; and
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step starting from the blog site including the article starting from the article propagation displaying step;
And
In the article link information extraction step,
Based on the trackback information stored in the comment / trackback storage means, the link information is generated as the link back received article as the reference article, the track back transmission article as the article having connection, and the comment information set transmitted to the reference article If the blog identifier of the comment sender is included in the generated article link information, the new article link information is not generated and the number of received comments is added to the existing article link information. If not included, the article consists of the article identifier of the article that received the comment, the blog identifier, the blog identifier of the comment sender, the comment sender name and / or the URL of the comment sender, and the number of comments. Generating link information;
If the blog URL is unknown, the comment information is determined to be the same if the comment sender name is the same, and the number of comments is added to the existing article link information. Generating step;
Storing all the generated article link information in the link information storage means;
A method for extracting a propagation structure characterized by
インターネット上のブログやソーシャルネットワーキングサービスの記事が閲覧者に与えた影響を解析する伝播構造抽出方法であって、
記事解析手段が、収集された前記記事を解析して該記事を一意に識別する記事識別子及び該記事が属するブログサイトを一意に識別するブログ識別子を該記事に付与して記事情報記憶手段に格納し
前記記事にコメントが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、コメント送信者名かコメント送信者URLの少なくとも一方と、コメント送信者URLが存在する場合は、ブログサイトのURLかどうか調べ、ブログサイトのURLである場合はブログサイトを一意に識別するブログ識別子とを、コメント情報としてコメント・トラックバック記憶手段に格納し、
前記記事にトラックバックが送信されている場合には、該記事を一意に識別する記事識別子と記事が属するブログサイトを一意に識別するブログ識別子と、トラックバック送信元の記事識別子、ブログ識別子、記事URL、ブログURL、ブログタイトル中で取得可能な1つ以上の情報をトラックバック情報としてコメント・トラックバック記憶手段に格納する記事解析ステップと、
再帰収集手段が、前記記事にコメントが送信された場合には、送信元のブログサイトを特定し、該ブログサイトに属する記事を収集し、トラックバックが送信された場合には、該トラックバック元の記事を収集する再帰収集ステップと、
記事リンク情報抽出手段が、前記記事からのコメントまたはトラックバックによる繋がり(リンク情報)をリンク情報記憶手段に格納する記事リンク情報抽出ステップと
ログリンク情報抽出手段が、同一のブログサイトに属する記事を纏めてブログサイトからのコメントまたはトラックバックによる繋がり(リンク情報)を抽出し、前記リンク情報記憶手段に格納するブログリンク情報抽出ステップと、
記事伝播表示手段が、ある一つの記事を起点とした伝播構造を前記リンク情報記憶手段から取得して表示する記事伝播表示ステップと、
ブログ伝播表示手段が、ブログサイトを基点とした伝播構造を前記リンク情報記憶手段から取得して表示するブログ伝播表示ステップと、
切り替え表示手段が、記事伝播表示からブログ伝播表示に切り替える際に、該記事伝播表示ステップで起点とした記事を含むブログサイトを起点とする切り替え表示ステップと、
を行い、
前記ブログリンク情報抽出ステップにおいて、
前記コメント・トラックバック記憶手段に格納された前記コメント情報と前記トラックバック情報のブログ識別子を基に、コメントかトラックバックの少なくとも1つの繋がりがある2つのブログ識別子と、コメント送信数及び受信数、トラックバック送信数及び受信数をブログリンク情報として生成し、コメント送信者のブログ識別子が不明なコメント情報は、コメントを受信したブログ識別子が同じでコメント送信者名が同じブログリンク情報が存在すれば既存のブログリンク情報にコメント数を追加し、存在しなければ新たなブログリンク情報を生成するステップと、
生成した全ての前記ブログリンク情報を前記リンク情報記憶手段に格納するステップと、
を行うことを特徴とする伝播構造抽出方法。
Propagation structure extraction method that analyzes the impact of blogs and social networking service articles on the Internet on viewers.
Article analysis means analyzes the collected articles and assigns an article identifier that uniquely identifies the article and a blog identifier that uniquely identifies the blog site to which the article belongs to the article and stores it in the article information storage means and,
When a comment is transmitted to the article, an article identifier that uniquely identifies the article, a blog identifier that uniquely identifies the blog site to which the article belongs, and at least one of a comment sender name and a comment sender URL If there is a comment sender URL, the URL of the blog site is checked, and if it is the URL of the blog site, a blog identifier that uniquely identifies the blog site is stored as comment information in the comment / trackback storage means. ,
When the trackback is transmitted to the article, the article identifier that uniquely identifies the article, the blog identifier that uniquely identifies the blog site to which the article belongs, the article identifier of the trackback transmission source, the blog identifier, the article URL, An article analysis step of storing one or more pieces of information that can be acquired in the blog URL and blog title as trackback information in the comment / trackback storage means;
When the comment is transmitted to the article, the recursive collection means identifies the blog site of the transmission source, collects the articles belonging to the blog site, and when the trackback is transmitted, the article of the trackback source A recursive collection step to collect
Article link information extracting means stores an article link information extracting step for storing a link or link by link back (link information) from the article in the link information storage means ;
The blogs link information extraction means, and blog link information extraction step, which summarizes the articles belonging to the same blog site to extract the connection (link information) by the comment or trackback from the blog site, be stored in the link information storage means,
An article propagation display means for acquiring and displaying a propagation structure starting from a certain article from the link information storage means; and
A blog propagation display means for acquiring and displaying a propagation structure based on a blog site from the link information storage means;
When the switching display means switches from the article propagation display to the blog propagation display, a switching display step starting from the blog site including the article starting from the article propagation displaying step;
And
In the blog link information extraction step,
Based on the comment information stored in the comment / trackback storage means and the blog identifier of the trackback information, two blog identifiers having at least one connection of a comment or trackback, the number of comments transmitted and received, the number of trackback transmissions If the blog identifier of the comment sender is unknown and the blog identifier of the comment sender is the same and the comment sender name is the same, the existing blog link is generated. Adding the number of comments to the information and generating new blog link information if it does not exist,
Storing all the generated blog link information in the link information storage means;
A method for extracting a propagation structure characterized by
請求項1乃至のいずれか1項に記載の伝播構造抽出装置を構成する各手段としてコンピュータを機能させるための伝播構造抽出プログラム。 The propagation structure extraction program for functioning a computer as each means which comprises the propagation structure extraction apparatus of any one of Claims 1 thru | or 4 . 請求項記載の伝播構造抽出プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium storing the propagation structure extraction program according to claim 7 .
JP2008052152A 2008-03-03 2008-03-03 Propagation structure extraction device and method, program, and computer-readable recording medium Expired - Fee Related JP5022946B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008052152A JP5022946B2 (en) 2008-03-03 2008-03-03 Propagation structure extraction device and method, program, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008052152A JP5022946B2 (en) 2008-03-03 2008-03-03 Propagation structure extraction device and method, program, and computer-readable recording medium

Publications (2)

Publication Number Publication Date
JP2009211281A JP2009211281A (en) 2009-09-17
JP5022946B2 true JP5022946B2 (en) 2012-09-12

Family

ID=41184368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008052152A Expired - Fee Related JP5022946B2 (en) 2008-03-03 2008-03-03 Propagation structure extraction device and method, program, and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP5022946B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4550939B1 (en) * 2009-09-17 2010-09-22 株式会社野村総合研究所 Information propagation path identification device, information propagation path identification method, information propagation path identification program
JP5866922B2 (en) * 2011-09-22 2016-02-24 富士ゼロックス株式会社 Search device and program
KR101193648B1 (en) * 2012-02-03 2012-12-24 주식회사 크레아랩 Method of display for concerning degree of internet posts
WO2016208623A1 (en) * 2015-06-23 2016-12-29 国立研究開発法人 産業技術総合研究所 Experimental data management system, method, and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4348357B2 (en) * 1997-09-08 2009-10-21 富士通株式会社 Related document display device
JP2006164086A (en) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> Online knowledge search support system and online knowledge search support method
JP2007080103A (en) * 2005-09-15 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> Information collection method and program
JP2007193380A (en) * 2006-01-16 2007-08-02 So-Net Entertainment Corp Information processor, information processing method and computer program
JP2009528639A (en) * 2006-02-28 2009-08-06 バズロジック, インコーポレイテッド Social analysis system and method for analyzing conversations in social media

Also Published As

Publication number Publication date
JP2009211281A (en) 2009-09-17

Similar Documents

Publication Publication Date Title
US9721029B1 (en) Distributing web applications across a pre-existing web
CN101124576B (en) Search system and methods with integration of user annotations from a trust network
JP5069730B2 (en) Event notification function providing device, event notification function providing method, and event notification function providing program
US20070143300A1 (en) System and method for monitoring evolution over time of temporal content
US20170329779A1 (en) System and method for relevance-based electronic message presentation
KR101174213B1 (en) System and method for providing search result based on personal network
JP5493845B2 (en) Search support program, search support device, and search support method
JP2004362043A (en) Project managing system
JP5022946B2 (en) Propagation structure extraction device and method, program, and computer-readable recording medium
KR20080078930A (en) Information providing method and system of extracting a personalized issue
JP2012150652A (en) Influencer extraction device, influencer extraction method, and program
JP5525470B2 (en) Influence calculation device, influence calculation method, and program
JP5881396B2 (en) Identification information management support system, identification information management support method, and program
JP2010134651A (en) Merchandise id server device, and method for controlling the same
US9531581B1 (en) Method and system for identifying and automatically registering domain names
KR101331453B1 (en) A method of extend keyword advertisement based on associative word
JP6739379B2 (en) Information processing apparatus, information processing method, program, and advertisement information processing system
JP5861545B2 (en) Information processing apparatus, history control method, and history control program
JP2006277061A (en) Knowledge retrieval system, method and program
JP5588292B2 (en) Influencer extraction apparatus, influencer extraction method and program
JP6688018B2 (en) Information sharing server and program
JP5193977B2 (en) Event notification function providing system
CN101743543A (en) Method of operating an information retrieval system
JP5775508B2 (en) Spam account extraction apparatus and spam account extraction method
JP2010224941A (en) Device, method, and program for searching relevant information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees